WO2020093789A1

WO2020093789A1 - 用于改善活性蛋白或多肽性能的人工重组蛋白及其应用

Info

Publication number: WO2020093789A1
Application number: PCT/CN2019/106092
Authority: WO
Inventors: 黄岩山
Original assignee: 浙江道尔生物科技有限公司
Priority date: 2018-11-07
Filing date: 2019-09-17
Publication date: 2020-05-14
Also published as: US20220119448A1; CN111153965A; CN116102621A

Abstract

提供了一种对于延长蛋白或多肽的生物活性、半衰期或改善蛋白或多肽体内外性质的多肽单元(U)或多肽复合单元(PU)，所述的多肽单元(U)主要由脯氨酸(P)、丙氨酸(A)和谷氨酸(E)组成，所述PU含有多个所述U。还提供了具有生物活性的融合蛋白，其包括所述的多肽单元(U)或多肽复合单元(PU)以及与之连接的活性蛋白或多肽。

Description

用于改善活性蛋白或多肽性能的人工重组蛋白及其应用

技术领域

本发明涉及生物技术领域，更具体地，本发明涉及一种用于改善生物活性蛋白或多肽性能的人工重组蛋白及其应用。

背景技术

众所周知，分子量小于70kDa的蛋白质或多肽容易通过肾过滤而被体内清除(Jevsevar S等，5:113–28，2010)。因此，一般采用融合或交联分子量较大的载体蛋白、聚乙二醇(PEG)、脂肪酸等来增加其表观分子量和流体动力学半径，从而降低其肾小球滤过率(Kontermann RE，BioDrugs，23:93-109；2009；Kang JS等，Expert Opin Emerg Drugs.，14:363–80，2009)，并最终达到延长蛋白或多肽体内半衰期的目的。

用作交联使用的载体一般是PEG或脂肪酸等，而人血清白蛋白、免疫球蛋白Fc片段、转铁蛋白等则普遍用于重组融合，并且大都有对应的成功上市药物。近年来，新型的重组融合载体蛋白不断涌现(WR Strohl，Biodrugs，2015，29(4):215-39)，如URP(中国专利ZL200780015899.2)、XTEN(中国专利申请CN201080011467.6；Volker Schellenberger等，Nature Biotechnology 27(12):1186，2009)、类弹性蛋白ELP(MacEwan SR等，J Control Release.2014；190:314-30.)、PAS(专利号ZL200880019017，M Schlapschy等，Protein Engineering Design&Selection Peds.2013，26(8):489-501)和GLK(中国专利号200980103870.9)等。其中XTEN和ELP融合制备的蛋白药物已经用于临床试验中(Yuen KC等，J Clin Endocrinol Metab.,98(6):2595-603.2013；Christiansen M等，Weekly Subcutaneous Doses of Glymera(PB1023)a Novel GLP-1Analogue Reduce Glucose Exposure Dose Dependently，http://phasebio.com/)。这些人工设计的非天然蛋白质，在跟某些活性蛋白或多肽通过重组表达或者交联后形成的融合蛋白或产物，相比于单独的活性蛋白和多肽，显著地提高了血清稳定性并延长了其体内半衰期，最终改善了治疗效果。

专利号为ZL200780015899.2的中国专利公开了一种非结构化重组聚合物(URP)，其基本不能非特异性结合血清蛋白，其特征在于：(a)含有至少100个毗连氨基酸；(b)所述URP中所含的甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基之和占所述URP中全部氨基酸的约80％以上；(c)经Chou-Fasman算法测定，所述URP序列的至少50％氨基酸不形成二级结构；(d)所述URP的T表位评分小于-4。

申请号为CN201080011467.6的中国专利申请公开了一种分离的延伸重组多肽(XTEN)，包含超过大约400至大约3000个氨基酸残基，其中该XTEN的特征在于：(a)甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基的总和占XTEN的总氨基酸序列的超过大约80％；(b)该XTEN序列基本是非重复的；(c)当通过TEPITOPE算法分析时，该XTEN序列缺乏预测的T细胞表位，其中对XTEN序列内表位的 TEPITOPE算法预测是基于-9或更高的得分；(d)通过GOR算法确定，该XTEN序列具有超过90％的无规卷曲形成；和(e)通过Chou-Fasman算法确定，该XTEN序列具有少于2％的α螺旋和少于2％的β-折叠。此公开中并未强调氨基酸的种类数，然而在文献报道中，XTEN的氨基酸含量包括：8％A，12％E，18％G，17％P，28％S和17％T(Volker Schellenberger等，Nature Biotechnology.，27(12):1186，2009)，这是因为在构建无结构化的序列时发现2-5个氨基酸的组成会代来强免疫原性和低水溶性，而且对于半衰期的延长效果有限。

专利号为ZL200880019017的中国专利公开了包含至少两个结构域的生物学活性蛋白，其中：(a)所述至少两个结构域的第一结构域包含具有和/或介导所述生物学活性的氨基酸序列；以及(b)所述至少两个结构域的第二结构域包含形成无规卷曲构象的由至少10个氨基酸残基组成的氨基酸序列，其中所述第二结构域由丙氨酸、丝氨酸和脯氨酸残基组成，其中所述无规卷曲构象介导所述生物学活性蛋白体内和/或体外稳定性的增加。

类弹性蛋白ELP是由(VPGXG)n组成，其中X可以是除脯氨酸(Pro)之外的任意氨基酸。n的数目不固定，ELP有在特定温度(跨度为2-3℃)下状态会发生急剧转变的特性：低于这一温度，ELP呈可溶状态；高于这一温度，ELP会发生快速聚集成微米级肉眼可见的颗粒物；再次降低温度，ELP又会重新溶解；这一温度称之为反向转换温度，简称相变温度(Tt)。ELP属于弹性蛋白，具有生物降解性和非免疫原性，因此适用于作为延长药物半衰期的融合蛋白使用。

专利号为ZL200980103870.9的中国专利公开了一种用于延长蛋白体内半衰期的重组明胶样单元(GLK)，其特征在于，所述的明胶样单元是结构如下的多肽：(Gly-X-Y)n；式中，Gly为甘氨酸残基；X和Y分别为20种天然氨基酸除了Cys之外的任意氨基酸残基，以及Hyp；n为20-300；并且，所述的明胶样单元具有以下特征：(a)所述明胶样单元中以下亲水性氨基酸Asn，Asp，Gln，Glu，Lys，Pro，Ser，Hyp，Arg的氨基酸百分比含量总和为40％至2/3；(b)所述明胶样单元中，Pro和Hyp的数量之和与n的比值≥0.6；(c)Gly的数量之和与n的比值≤1.15；且，根据ProtParam公式计算，代表亲水性的GRAVY值小于-1.5；附加条件是，所述的明胶样单元不是天然的明胶蛋白。

上述的几种新型载体蛋白与传统的白蛋白和免疫球蛋白IgG FC片段的不同之处在于，其大部分序列中氨基酸种类较少。在类弹性蛋白ELP的VPGXG组成单元里，对于X位的氨基酸电荷及亲水性并无严格限定。而URP和XTEN的设计强调采用亲水性氨基酸，并加入了带负电荷的天冬氨酸和/或谷氨酸进一步延长半衰期，这是“由于人或动物的大多数组织和表面具有净负电荷，XTEN序列可以设计为具有净负电荷以使含有XTEN的组合物与各种表面如血管、健康组织或各种受体之间的非特异性相互作用最小化”(申请号CN201080011467.6)；相反，PAS则着重于模仿聚乙二醇(PEG)，采用不带电的三种氨基酸：脯氨酸、丙氨酸和丝氨酸组成。另一方面，XTEN序列强调“基本上非重复”这一特征：“重复氨基酸序列具有聚集形成更高级结构的倾向，其例子为天然重复序列如胶原蛋白和亮氨酸拉链，或者形成接触，导致晶体或拟晶体结构。相反，非重复序列聚集的低倾向使得能够设计具有相对较低频率的带电荷氨基酸的长序列XTEN，如果序列重复它可能聚集”。XTEN技术对于“基本上非重复”的解释为“指在肽或多肽序列中缺乏或有限程度的内部同源性。例如，在该序列的四个连续氨基酸中极少或者没有一个是相同的氨基酸类型，或者该多肽具有10或更低的亚序列得分，或者在从N端到C端的顺序中没有构成该多肽序列的基序的模式”。但是，XTEN和PAS、URP由于富含S和T，在真核系统中表达时糖基化程度会特别高。

尽管活性蛋白或多肽与这些载体蛋白融合或交联后可能会显著减弱其生物学活性，例如Gething NC等报道，胰高血糖素-XTEN融合蛋白仅表现出未修饰的胰高血糖素多肽的15％生物活性(Gething NC等，PLoS One，2010，5(4):e10175)，然而融合或交联后带来的稳定性和溶解性等理化性质的提高却可弥补这方面的缺陷。

综上，本领域还需要进一步开发其它的能够改善多肽稳定性、延长多肽半衰期的物质或方法，以期进一步提高活性多肽的体内活性。

发明内容

本发明的目的在于提供一种改善活性蛋白或多肽性能的人工重组蛋白及其应用。

在本发明的第一方面，提供一种多肽单元(U)，其具有以下特征：(1)由脯氨酸(P)、丙氨酸(A)及谷氨酸(E)组成；(2)存在50％以上的α-螺旋二级结构；和(3)长度≥15个氨基酸。

在一个优选例中，根据Chou-Fasman公式计算，所述的多肽单元存在60％以上，较佳地70％以上，更佳地80％以上，进一步更佳地90％以上的α-螺旋二级结构。

在另一优选例中，所述的α-螺旋二级结构的比例按照Chou-Fasman算法计算；和/或长度≥20个氨基酸。

在另一优选例中，所述的多肽单元的长度为15～100aa，较佳地16～60aa；具体的，如18aa，19aa，20aa，22aa，25aa，30aa，40aa，50aa，60aa，70aa，80aa或90aa。

在另一优选例中，所述多肽单元包括选自下组的多肽单元：SEQ ID NO:19～47所示氨基酸序列的多肽单元。

在本发明的另一方面，提供一种多肽复合单元(PU)，其核心结构选自：

U ₁-U ₂或U ₁-U ₂-…U _n；

U ₁，U ₂，…，U _n各自代表一个所述的多肽单元，n为＞2的正整数；且，两个或多个所述多肽单元的氨基酸序列相同或不同。

在另一优选例中，n为3～100的正整数，例如为4～90的正整数，5～80的正整数；更具体地，n例如为6，7，8，9，10，15，20，25，30，40，50，60，70。

在另一优选例中，所述核心结构的氨基酸残基数占所述多肽复合单元总氨基酸残基数的70％以上，较佳地80％以上，更佳地85％，进一步更佳地90％以上，95％以上， 99％以上或100％。

在另一优选例中，所述多肽复合单元选自：(a)SEQ ID NO:48～105任一所示的氨基酸序列的蛋白或SEQ ID NO:48～76对应多肽单元的重复拼接蛋白；或(b)(a)限定的任一多肽经过一个或多个(如1-20个；较佳地1-10个；更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的，且具有(a)多肽功能的由(a)衍生的多肽；或(c)氨基酸序列与(a)限定的多肽的氨基酸序列有80％以上(较佳地85％以上；更佳地90％以上；进一步更佳地95％以上，如98％，99％以上)序列相似性百分比且具有(a)多肽功能的多肽。所述多肽单元或多肽复合单元本身并无生物学功能，其性质与PEG类似，仅仅起到“载体”的功能。

在本发明的另一方面，提供一种具有生物活性的融合蛋白，其包括：所述的多肽单元或所述的多肽复合单元以及活性蛋白或多肽。

在另一优选例中，所述的融合蛋白包括选自下组任一或组合的结构：

(D ₁-PU ₁)；

(D ₁-PU ₁)-(D ₂-PU ₂)；或

(D ₁-PU ₁)-(D ₂-PU ₂)-…(D _m-PU _m)；

其中，PU ₁，PU ₂，…，PU _m选自所述的多肽复合单元；D ₁，D ₂，…，D _m为所述活性多肽，m为＞2的正整数；

且，(D ₁-PU ₁)包括(PU ₁-D ₁)，(D ₂-PU ₂)包括(PU ₂-D ₂)，(PU _m-D _m)包括(D _m-PU _m)。

在另一优选例中，D ₁，D ₂，…，D _m各自代表一条或多条(包括2条)相互连接的活性蛋白或多肽，所述的多条活性蛋白或多肽之间功能相同或不同。

在另一优选例中，m为3～50的正整数，例如为4～40的正整数，5～35的正整数；更具体地，m例如为6，7，8，9，10，15，20，25，30。

在另一优选例中，所述的融合蛋白的长度≥50个氨基酸，较佳地≥80个氨基酸，更佳地≥100个氨基酸；如为50～5000aa，较佳地如80～4000aa，更佳地如100～2000aa；更具体地，例如150aa，200aa，300aa，50aa，60aa，700aa，800aa，1000aa。

在另一优选例中，所述的融合蛋白中的氨基酸序列中，所述的多肽单元或所述的多肽复合单元所占氨基酸序列占比为10％以上，较佳地20％以上。

在另一优选例中，所述活性蛋白或多肽包括(但不限于)：GLP-2类似物，AR _VEGF，hGH，Arginase 1，G-CSF，Exendin-4，GLP-1类似物，GDF15，glucacon，IL-2，IL-15，FGF19，EPO，IL-6，M-CSF，FGF21。

在另一优选例中，所述的融合蛋白包括(但不限于)选自下组的融合蛋白：(a)SEQ ID NO:106～131任一所示的氨基酸序列的蛋白；或(b)(a)限定的任一多肽经过一个或多个(如1-20个；较佳地1-10个；更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的，且具有(a)多肽活性的由(a)衍生的蛋白；或(c)氨基酸序列与(a)限定的多肽的氨基酸序列有80％以上(较佳地85％以上；更佳地90％以上；进一步更佳地95％以上，如98％，99％以上)序列相似性百分比且具有(a)多肽活性的蛋白。

在另一优选例中，所述的融合蛋白在体内的半衰期或稳定性在统计学上高于未融合的活性多肽(例如，高50％以上，较佳地高100％以上，更佳地高200％以上，更具体地如高500％，1000％，2000％，5000％，10000％或更高)。

在本发明的另一方面，提供一种核酸分子，所述的核酸分子编码前面所述的多肽单元，多肽复合单元或融合蛋白。

在本发明的另一方面，提供一种重组表达载体，它含有所述的核酸分子。

在本发明的另一方面，提供一种遗传工程化的细胞，所述的细胞含有所述的重组表达载体；或所述的细胞基因组中整合有所述的核酸分子。

在本发明的另一方面，提供一种偶联物，其包括：(a)所述的多肽单元或所述的多肽复合单元；以及，(b)活性蛋白或多肽；其中，(b)与(a)以偶联或吸附的方式连接。

在本发明的另一方面，提供所述的多肽单元或所述的多肽复合单元的用途，用于提高活性多肽的稳定性，较佳地包括热稳定性、耐酶稳定性和血清稳定性；延长活性多肽的半衰期，即延长活性多肽的作用时间；和/或提高活性多肽的溶解度。

在本发明的另一方面，提供一种组合物，其包括：所述的融合蛋白或所述的偶联物；和药学上或食品学上可接受的载体。

本发明的其它方面由于本文的公开内容，对本领域的技术人员而言是显而易见的。

附图说明

图1.PU-hArg1融合蛋白的SEC-HPLC分析结果图。其中，P1为PUMix17-hArg1-PUMix49、P2为PUMix35-hArg1-PUMix76、P3为PUMix109-hArg1-PUMix163、P4为PU98x5-hArg1-PU106x5、P5为PU12x5-hArg1-PU12x5、P6为PU98x10-hArg1、P7为PU12x10-hArg1、P8为mURP-hArg1-mURP、P9为mXTEN-hArg1-mXTEN、P10为mPAS-hArg1-mPAS。其中箭头所指之处为甲状腺球蛋白(Thyroglobulin，669kDa)。

图2.PU98x5-hArg1-PU106x5的DLS分析结果图。

图3.不同PU-hArg1融合蛋白在SD大鼠体内的免疫原性结果(血清1：500稀释)。

图4.PU-hArg1融合蛋白药代结果。

图5.PU-GH融合蛋白的热稳定性(铜染)。M为蛋白分子量MARKER：200、116、97.2、66.4、44.3KD。泳道1：PU27x28-GH-PU27x5在4℃放置20小时；泳道2：PU27x28-GH-PU27x5在37℃放置20小时；泳道3：PU27x28-GH-PU27x5在60℃放置20小时；泳道4：PU98x28-GH-PU98x4在4℃放置20小时；泳道5：PU98x28-GH-PU98x4在37℃放置20小时；泳道6：PU98x28-GH-PU98x4在60℃放置20小时；泳道7：PU130x28-GH-PU130x5在4℃放置20小时；泳道8：PU130x28-GH-PU130x5在37℃放置20小时；泳道9：PU130x28-GH-PU130x5在60℃放置20小时；泳道10：PU98x28-GH-PU98x4在80℃放置5小时；泳道11：PU130x28-GH-PU130x5在80℃放置5小时。

图6.实施例11中的PU-GH融合蛋白的热稳定性。

图7.PU-GH融合蛋白的体外细胞学活性。

图8.PU-GDF15融合蛋白对DIO小鼠的体重减轻效果图。

图9.PU与GDF15融合蛋白对DIO小鼠的食欲抑制效果图。

图10.GLP-2G与PU融合蛋白的体外细胞活性检测结果图。

图11.PU与AR _VEGF融合蛋白的体外细胞活性结果图。

图12.在大鼠血清中温育第7天的PU-GH融合蛋白。1-2分别为0天和第7天的PU27x28-GH-PU27x5样品、3-4分别为0天和第7天的PU98x28-GH-PU98x4样品、5-6分别为0天和第7天的PU130x28-GH-PU130x5样品。

图13.PU-GH融合蛋白及hGH在胰酶中的稳定性结果图。A.泳道1-4分别为hGH在0、0.02％、0.1％、0.5％的胰酶中孵育40min的结果；M为低分子量MARKER:97.2KD、66.4KD、44KD、29KD、21KD及14KD。B.泳道1和2：PU27x28-GH-PU27x5；泳道3和4：PU98x28-GH-PU98x4；泳道5和6：PU130x28-GH-PU130x5。M为高分子量MARKER:220KD、135KD、90KD、66KD、45KD及35KD。

具体实施方式

本发明人经过深入的研究，提供对于延长蛋白/多肽体内半衰期或改善蛋白/多肽体内外理化性质非常有效的多肽单元(U)或多肽复合单元(PU)，所述的多肽单元(U)由脯氨酸(P)、丙氨酸(A)和谷氨酸(E)组成。

一、单或重复的多肽单元(U)

本发明首先提供一种人工设计的多肽单元(U)，并具有以下特征：(1)由脯氨酸(P)、丙氨酸(A)及谷氨酸(E)组成；(2)根据Chou-Fasman公式计算，至少50％以上为α-螺旋二级结构；和(3)长度≥15个，较佳地≥20个氨基酸。

作为本发明的优选方式，根据Chou-Fasman公式计算，所述的多肽单元(U)至少60％以上为α-螺旋二级结构；优选地，所述的多肽单元(U)至少70％以上为α-螺旋二级结构；优选地，所述的多肽单元(U)至少80％以上为α-螺旋二级结构；更优选地，所述的多肽单元(U)至少90％以上为α-螺旋二级结构。

可以利用远紫外圆二色谱(CD)光谱来检测蛋白或多肽的二级结构。α-螺旋、β-折叠和无规卷曲结构各自形成CD谱的特征峰和宽度。作为本发明的优选实施方式，通过Chou-Fasman算法(Chou，P.Y.等，Biochemistry，1974,13,222-45)预测PU的二级结构。

根据Chou-Fasman公式计算，并非所有由P、A和E组成的多肽单元(U)都含有超过50％的α-螺旋结构(如SEQ ID NO:17和SEQ ID NO:18)，而且SEQ ID NO:17和SEQ ID NO:18由于脯氨酸含量太高，在本发明的制备过程中发现由SEQ ID NO:17和SEQ ID NO:18组合而成的多肽复合单元(PU)极难获得表达产物。脯氨酸具有典型的破坏二级结构的功能，例如脯氨酸(P)以高度重复的形式出现，则α-螺旋结构会极低，而当丙氨酸(A)或谷氨酸(E)高度重复出现，则α-螺旋结构含量显著提高。

一些示例性的多肽单元(U)如SEQ ID NO:19～47所示。应理解，序列不同于SEQ ID NO:19～47的其它由P、A、E排布而成的序列也可被涵盖在本发明中，只要其满足至少50％以上的α-螺旋二级结构以及长度≥15个，较佳地≥20个氨基酸的特征。

进一步地，本发明提供一种包括所述多肽单元(U)的多肽复合单元(PU)，其中包含2个或多个(包括2个)所述多肽单元(U)。当所述多肽单元(U)为多个时，各个多肽单元(U)之间可以是相同的序列排布或不同的序列排布。

作为本发明的优选方式，所述的多肽复合单元(PU)具有100-2000个氨基酸，示例性的优选方式包括：具有至少100个氨基酸，至少200个氨基酸，至少300个氨基酸，至少400个氨基酸，至少500个氨基酸，至少600个氨基酸，至少700个氨基酸，至少800个氨基酸，至少900个氨基酸，至少1000个氨基酸或至少1200个氨基酸。

作为本发明的优选方式，所述的多肽复合单元(PU)的80％以上由脯氨酸(P)、丙氨酸(A)及谷氨酸(E)组成；更优选地，85％以上由脯氨酸(P)、丙氨酸(A)及谷氨酸(E)组成；更优选地，90％以上由脯氨酸(P)、丙氨酸(A)及谷氨酸(E)组成；更优选地，95％以上由脯氨酸(P)、丙氨酸(A)及谷氨酸(E)组成；最优选地，100％由脯氨酸(P)、丙氨酸(A)及谷氨酸(E)组成。在一个优选的实施方案中，所述多肽复合单元(PU)由相同序列的多肽单元(U)通过重复拼接而成，或由不同的多肽单元(U)拼接而成。

XTEN为一种由6种氨基酸(A，E，G，P，S，T)组成的多肽，其中8％A，12％E，18％G，17％P，28％S和17％T(Volker Schellenberger等，A recombinant polypeptide extends the in vivo half-life of peptides and proteins in a tunable manner，Nature Biotechnology.，27(12):1186，2009)，富含S和T。PAS由脯氨酸(P)、丙氨酸(A)和丝氨酸(S)组成，也富含S。然而，在本发明的研究过程中发现，S和T的加入会导致在真核表达系统中带来严重的糖基化现象。对于某些不适合于原核表达系统内重组表达、又不适合化学合成的大分子蛋白而言，富含S和T的载体蛋白组成很难解决糖基化的问题。众所周知，糖基化一般有两种主要类型：O-连接的寡糖糖基化，连接位点在丝氨酸或苏氨酸残基上；N-连接的寡糖糖基化，连接位点在Asn-X-Ser/Thr序列的天冬酰胺酸残基位点上，在此，X可以是除了脯氨酸以外的任意氨基酸。尤其是在酵母中，酵母的糖基化系统与人类的不同，高度糖基化尤其是O-糖基化容易产生强免疫原性，而且生产过程批次不均一性问题很难控制。理论上，XTEN、PAS、GLK或者URP等包含大量S或T的序列在原核以外的表达系统中表达时，糖基化严重且产物不均一是极其严峻的问题。

另外，有些蛋白或多肽N端的结构与活性密切相关，比如Exendin-4或GLP-1的N端暴露对于其活性至关重要。然而外源蛋白在原核系统(如大肠杆菌E.coli)表达时往往N端带有额外的甲硫氨酸，很难直接获得活性产物。因此一般需要在Exendin-4的N端前面加入融合表达标签，如CBD标签(Volker Schellenberger等，A recombinant polypeptide extends the in vivo half-life of peptides and proteins in a tunable manner，Nature Biotechnology.，27(12):1186，2009)，表达完成后再用蛋白酶进行切割；或者在GLP-1序列前加上其他氨基酸，如两个连续的丙氨酸以提高切割效率(M.Amiram等，A depot-forming glucagon-like peptide-1fusion protein reduces blood glucose for five days with a single injection，J Control Release.，172(1):144-51，2013)，只有这样才能获得具有天然生物学活性的GLP-1融合蛋白。而直接用酵母或者哺乳动物细胞表达GLP-1融合蛋白则不需要额外的蛋白酶切就可以直接获得具有天然N端序列的GLP-1活性融合蛋白。

本发明的所述的多肽单元(U)或多肽复合单元(PU)则主要由P、A和E组成，无论在原核还是真核表达系统中制备，都不会出现糖基化的问题。

另外，本发明提供的所述多肽单元(U)或多肽复合单元(PU)相比现有技术，Asn(N)及Gln(Q)脱酰胺化造成的不均一现象以及由于氨基酸种类较多导致的潜在蛋白酶位点增多而引起的降解等问题的可能性都极小。在本发明的一个实施例中，所述的多肽单元(U)或多肽复合单元(PU)相比现有技术的载体蛋白具有更优越的血清稳定性和耐酶稳定性。

二、具有治疗活性的融合蛋白

融合蛋白

本发明还提供了具有治疗活性的融合蛋白，其包括一个或若干个相同或不同的活性蛋白药物(D)和所述的多肽单元(U)或多肽复合单元(PU)相连接(如串联)的结构，示例性的此类融合包括，但不限于如下结构：

D-PU

PU-D

D ₁- PU-D ₂

PU ₁-D-PU ₂

PU ₁-D ₁-PU ₂-D ₂-PU ₃-D ₃

PU ₁-D ₁-D ₂-PU ₂-D ₃

PU ₁-D ₁-PU ₂-D ₂-D ₃

PU ₁-D ₁-PU ₂-D ₂-D ₃-PU ₃

D ₁-PU ₁-D ₂-PU ₂-D ₃

PU ₁-D ₁-PU ₂-D ₂-PU ₃-D ₃-PU ₄-D ₄

D ₁-PU ₁-D ₂-PU ₂-D ₃-PU ₃-D ₄-PU ₄

本发明中，所述D ₁、D ₂、D ₃、D ₄…为具有治疗活性的活性蛋白或多肽，且D ₁、D ₂、D ₃、D ₄…之间可以相同或不相同；PU ₁、PU ₂、PU ₃、PU ₄…各自代表一个所述的多肽复合单元，PU ₁、PU ₂、PU ₃、PU ₄…之间可以相同或不相同。

本发明的多肽单元(U)或多肽复合单元(PU)适用于与多种多样的活性蛋白或多肽进行融合，提高活性蛋白或多肽的稳定性、半衰期等性能。所述活性蛋白或多肽(D)可以选自激动剂、受体、配体、拮抗剂、酶或激素等。所述的活性蛋白或多肽可以是已经或将被应用于治疗多种疾病的具有药效的蛋白或多肽，所述疾病包括但不限于：代谢相关疾病、心血管疾病、凝血/出血疾病、生长障碍或病症、肿瘤、血管障碍疾病、炎症、自身免疫病症等所述疾病包括代谢相关疾病、心血管疾病、凝血/出血疾病、生长障碍或病症、肿瘤、血管障碍疾病、炎症、自身免疫病症等；或具体地包括1型糖尿病，2型糖尿病、妊娠糖尿病、高胆固醇血症、肥胖症、高血糖症、超高胰岛素血症、胰岛素产生减少、胰岛素抗性、代谢紊乱、多囊卵巢综合征、血脂异常、进食障碍、高血压、肺性高血压、视网膜神经变性、代谢紊乱、胰高血糖素瘤、溃疡性结肠炎、肾衰竭、充血性心力衰竭、肾病综合征、肾病、腹泻、术后倾倒综合征、肠易激综合征、危重病性多神经病、全身炎症反应综合征、血脂异常、中风、冠心病、血友病、成人和儿童的GH缺乏、Turner综合征、慢性肾衰竭、宫内发育迟缓、特发性身材矮小、AIDS消耗、肥胖症、多发性硬化、衰老、纤维肌痛、克罗恩病、溃疡性结肠炎、肌营养不良症、低骨密度等。

例如，所述D ₁、D ₂、D ₃、D ₄…可选自但不限于表1中所列的活性蛋白或多肽或其类似物。

表1

在融合了所述的多肽单元(U)或多肽复合单元(PU)后，活性蛋白(D)的理化性质显著改善，表现为水溶性的提高、耐酶及耐热稳定性的提高，水动力学半径的增大等，这些理想的性质使得活性蛋白药物(D)的体内半衰期显著延长。在本发明的一个实施例中，融合了所述的多肽单元(U)或多肽复合单元(PU)后，活性蛋白药物(D)的生物学活性下降，然而由于该融合蛋白的半衰期发生极为显著的提高，这种活性的下降仍然是可以接受的。

三、化学偶联物

抗体-药物偶联物(ADC)是抗体与毒性化合物或放射性核素通过赖氨酸、半胱氨酸、非天然氨基酸及工程构建的标签等制备获得的治疗药物。作为ADC药物的一个突出缺点是，由于高疏水性毒性化合物或放射性核素的交联导致整个ADC分子容易聚集甚至产生不可溶的沉淀，尤其是当药物/抗体比率(DAR)较高的情况下。为了解决这个问题，可以通过将化学合成的高亲水聚乙二醇(PEG)或者可生物降解的短链分子作为连接链(Linker)，如PHF(或称

)。这些手段能有效地改善ADC分子的亲水性并增加其稳定性。

同样地，当具有治疗活性的蛋白分子量极小或者为不适合重组表达的多肽时，优选地可采用化学交联的方式。在本发明中，具有治疗活性的蛋白可由若干不同的活性蛋白或多肽(D)和所述的多肽单元(U)或多肽复合单元(PU)通过化学交联的方式制备而成。化学交联可以在大部分氨基酸残基上进行，然而赖氨酸上亲核型的伯胺基团和半胱氨酸上的活性巯基是最常用的交联位点。此外，酪氨酸和硒代半胱氨酸也会被用于化学交联。

本发明的多肽单元(U)或多肽复合单元(PU)适用于与多种多样的活性蛋白或多肽进行化学偶联，所述活性蛋白或多肽(D)选自激动剂、受体、配体、拮抗剂、酶或激素等，包括但不限于表1中所列的活性蛋白、多肽或其类似物。所述的活性蛋白或多肽可以是已经或将被应用于治疗多种疾病的具有药效的蛋白或多肽，所述疾病包括但不限于：代谢相关疾病、心血管疾病、凝血/出血疾病、生长障碍或病症、肿瘤、血管障碍疾病、炎症、自身免疫病症等；或具体地包括1型糖尿病，2型糖尿病、妊娠糖尿病、高胆固醇血症、肥胖症、高血糖症、超高胰岛素血症、胰岛素产生减少、胰岛素抗性、代谢紊乱、多囊卵巢综合征、血脂异常、进食障碍、高血压、肺性高血压、视网膜神经变性、代谢紊乱、胰高血糖素瘤、溃疡性结肠炎、肾衰竭、充血性心力衰竭、肾病综合征、肾病、腹泻、术后倾倒综合征、肠易激综合征、危重病性多神经病、全身炎症反应综合征、血脂异常、中风、冠心病、血友病、成人和儿童的GH缺乏、Turner综合征、慢性肾衰竭、宫内发育迟缓、特发性身材矮小、AIDS消耗、肥胖症、多发性硬化、衰老、纤维肌痛、克罗恩病、溃疡性结肠炎、肌营养不良症、低骨密度等。

四、多肽单元(U)、多肽复合单元(PU)或融合蛋白的制备及组合物

本发明还提供了分离的多核苷酸，编码所述的多肽单元(U)或多肽复合单元(PU)，或编码所述的融合蛋白。所述的多核苷酸可以是DNA形式或RNA形式。编码蛋白或多肽的多核苷酸可以是包括编码此蛋白或多肽的多核苷酸，也可以是还包括附加编码和/或非编码序列的多核苷酸。编码蛋白或多肽的多核苷酸可以用PCR扩增法、重组法或人工合成的方法获得。

本发明还提供了重组表达载体，包含所述多核苷酸。以及提供了宿主细胞，所述细胞含有所述表达载体或基因组中整合有外源的所述的多核苷酸，从而可表达所述的蛋白或多肽单元(U)、多肽复合单元(PU)或融合蛋白。

本发明还提供了所述的多肽单元(U)或多肽复合单元(PU)或融合蛋白的制备方法，包括如下步骤：1)培养所述宿主细胞，使之表达所述多肽单元(U)、多肽复合单元(PU)或融合蛋白；2)收集含有所述多肽单元(U)、多肽复合单元(PU)或融合蛋白的培养物；3)从步骤2所得培养物中分离出所述多肽单元(U)、多肽复合单元(PU)或融合蛋白。

本发明还提供了一种组合物，含有所述多肽单元(U)或多肽复合单元(PU)、融合蛋白或所述宿主细胞培养物，以及药学上或食品学上可接受的载体。“药学上或食品学上可接受的”的成分是适用于人和/或动物而无过度不良副反应(如毒性、刺激和变态反应)的，即有合理的效益/风险比的物质；如本领域常用的药物载体或赋形剂。所述多肽单元(U)、多肽复合单元(PU)、融合蛋白或所述宿主细胞培养物通常是“有效量”的，“有效量”是指可对人和/或动物产生功能或活性的且可被人和/或动物所接受的量。

五、融合蛋白的性能

蛋白粘度：蛋白药物一般都高浓度下储存，给药时通过注射给药。因此蛋白药物的粘度越低，储存及给药时的蛋白浓度可以越高。尤其是对于眼部给药的药物而言，蛋白药物粘度下降可以减少给药体积，提高患者的依从性，具有极高的临床意义。包含本发明的多肽单元(U)或多肽复合单元(PU)的融合蛋白，具有极低的蛋白粘度和极高的溶解度。

免疫原性：作为一种载体蛋白，体内免疫原性是最重要的因素。免疫原性产生的因素包括氨基酸序列、聚体的产生、杂质的存在、患者的免疫状态及遗传背景、剂量和给药途径等。本发明提供的多肽复合单元(PU)由多个多肽单元(U)重复拼接组成，如果单个多肽单元(U)具有免疫原性，例如具有T细胞表位，则极有可能会引起强烈的体液免疫反应。除了潜在的细胞表位，蛋白聚集也会增加B细胞受体的大幅交联，导致B细胞快速活化，并增强抗原摄取、加工和递呈。在本发明的一个实施例中，多肽单元(U)用基于QAM方法的预测工具TEPITOPE(Sturniolo T等，Nat.Biotechnol.17:555-561.)计算DRB1*01:01，DRB1*01:02，DRB1*03:01，DRB1*03:02，DRB1*04:01，DRB1*04:02，DRB1*07:01和DRB1*15:01等位基因的得分，结果其得分均低于或等于-8，而蜥蜴来源的Exendin-4(SEQ ID NO:11)则具有更高的得分，意味着更高的免疫原性风险。而在另一个实施例中，所述的多肽单元(U)或多肽复合单元(PU)与具有高度聚集倾向的人生长激素融合后，在高温下完全没有产生聚集的倾向，说明其具有良好的体外稳定性性质，同时也预示着免疫原性的潜在风险较低。在本发明的另一个实施例中，融合蛋白在大鼠体内多次给药后并未检测到针对所述的多肽单元(U)或多肽复合单元(PU)部分的抗药抗体。

药代动力学性质：本发明所述的多肽单元(U)或多肽复合单元(PU)能够增强生物活性蛋白的药代动力学性质，融合所述的多肽单元(U)或多肽复合单元(PU)的活性蛋白或多肽半衰期可以延长2倍以上，其中药物代谢动力学性质通过测定施用于受试者的生物活性蛋白的终末半衰期与施用了相当剂量的融合了所述的多肽单元(U)或多肽复合单元(PU)的生物活性蛋白相比较来确定。

融合所述的多肽单元(U)或多肽复合单元(PU)的活性蛋白流体力学半径显著增大，从而降低该活性蛋白的肾脏清除率。可利用超速离心、大小排阻色谱或光散射检测所得融合蛋白的流体力学半径。流体力学半径增加会引起组织渗透性减少，可利用这点将药学活性蛋白的副作用降至最小。已有记载，由于增强的渗透性和滞留效应(EPR)，亲水性聚合物趋于选择性蓄积于肿瘤组织中。EPR效应的潜在原因是肿瘤血管的渗漏属性(McDonald，D.M.等，Cancer Res，2002,62,5381-5)，以及肿瘤组织中缺少淋巴流出。因此，通过加入亲水性聚合物可增强用于肿瘤组织的药学活性蛋白的选择性。同样，融合多肽单元(U)或多肽复合单元(PU)可提高给定药学活性蛋白的治疗指数。

理化性质：融合了所述的多肽单元(U)或多肽复合单元(PU)的生物活性蛋白具有显著提升的溶解度和稳定性，比如热稳定性、耐酶稳定性和血清稳定性。在本发明的一个实施例中，融合了所述的多肽单元(U)或多肽复合单元(PU)的hGH融合蛋白在高温下的热稳定性明显高于未融合的hGH，而且hGH容易在制备过程中产生聚集，但是融合了所述的多肽单元(U)或多肽复合单元(PU)后，在SEC-HPLC上并无观察到显著的聚集现象。另外，在其中一个实施例中，通过测定生物活性蛋白暴露于37℃及大鼠血清中至少7天后保持的完整性，来判断其血清稳定性。在另一个实施例中，加入了胰酶的hGH融合蛋白比未融合的hGH显示出更高的耐酶稳定性。

六、术语解释

“生物活性蛋白/多肽”指的是蛋白质、抗体、多肽及其片段和变异体，具有一种或者多种药理学和/或生物学活性，或靶向引导，多聚化等功能。它们可以是天然就存在的，也可以是人工构建的。“生物活性蛋白/多肽”包括酶，酶抑制剂，抗原，抗体，激素，凝血因子，干扰素，细胞因子，生长因子，分化因子，骨组织生长有关的因子，与骨质因子吸收相关的因子，趋化因子(chemotactic factors)，细胞运动因子(cell motility factors)，移动因子(migration factors)，静止因子(cytostatic factors)，杀(细)菌因子，抗真菌因子，血浆黏附分子，间质黏附分子和细胞外基质，受体配基及其片段等。

在某些实施方案中，本发明所涉及的生物学活性蛋白/多肽为表现出“治疗活性”的蛋白/多肽，这种蛋白/多肽拥有一种或者多种已知的生物和/或治疗活性。这些活性与一种或多种本文描述的或者其他已知的治疗蛋白相关。作为一个非限制性例子，“治疗蛋白”(在本文中可与“治疗性蛋白”或“活性蛋白药物”互换)是指一种对于治疗、预防或者改善疾病、症状或者机能紊乱有用的蛋白。作为一个非限制性例子，“治疗蛋白”可以是一种特异性地结合到特定细胞类型(例如淋巴细胞或者癌细胞)并且定位于该细胞表面(或随后内吞至胞内)的蛋白。在另外的非限制性例子中，“治疗蛋白”是指有生物活性的蛋白，特别是一种对于治疗、预防或改善疾病有用的生物活性蛋白。非限制性的治疗蛋白包括拥有如增加血管新生、抑制血管新生、调节造血功能、促进神经发育、提高免疫反应、抑制免疫反应等生物活性的蛋白。

正如上述提及中的一样，“治疗活性”或者“活性”可以指在人类、非人哺乳动物或其他种属生物体中得到与理想的治疗结果一致的效果的活性。治疗活性可以在体内或者体外测量。

本发明所述的“治疗蛋白”可包括但并不限于：VEGF受体或其片段，TNF受体，HER-2/神经膜受体，人ErbB3受体分泌形态异构体，转化生长因子bⅢ型受体胞外区，转化生长因子bⅡ型受体胞外区，IL-1受体，IL-4受体，尿激酶，β-葡糖脑苷脂酶，精氨酸脱亚胺酶，Arginase，herstatin，表皮生长因子，FGF-1，FGF-19，FGF-21，纤维原细胞生长因子-2，普通纤维细胞生长因子，神经生长因子，血小板来源生长因子，VEGF-1，IL-1，IL-2，IL-3，IL-4，IL-6，IL-8，IL-10，IL-11，IL-12，IL-15，IL-18，IL-21，IL-24，IL-1RA，RANKL，RANK，OPG，LEPTIN，干扰素α，干扰素β，干扰素γ，干扰素Ω，TGFβ，TGFβ-1，TGFβ-3，TNFα，心房钠尿肽，B型钠尿肽，促性腺激素，人黄体生成素，促卵泡激素，人生长激素，EPO，G-CSF，GM-CSF，TPO，M-CSF，SCF，VEGF，EPO模拟肽，TPO模拟肽，FLT3配体，Apo2配体，骨细胞抑止因子，BMP-2，BMP-7，GLP-1及其类似物，GLP-2及其类似物，Exendin-3，Exendin-4及其类似物，胰岛素及其类似物，GIP及其类似物，胰高血糖素及其类似物，内皮抑制素(endostatin)，plasminogen kringle 1domain，plasminogen kringle 5domain和血管抑素等。治疗性蛋白也还可以是抗体及其片段，尤其是抗原结合片段，包括单链抗体scFv等。这些蛋白以及编码这些蛋白的核酸序列都是大家熟知的，并且在如Chemical Abstracts Services Databases(例如CAS Registry)、GenBank和GenSeq这样的公共数据库中可以找到。对于本领域技术人员来说，根据本发明的精神，容易理解的是现有已经发现的绝大部分生物活性蛋白都适用于本发明。当然，同样应理解的是，在本发明以后新发现的具有生物学活性的蛋白/多肽也同样适用于本发明。

本文中，序列同源性(sequence homology)用来描述物种亲缘关系的远近。如果两条序列有一个共同的进化祖先，那么它们是同源的。对序列同源性进行分析时，一般是将待研究序列加入到一组来自不同物种的多序列中以确定该序列与其他序列的同源关系。常用的分析工具是CLUSTAL等。

本文中，序列同一性(sequence identity)指参与对比的序列中相同残基的百分比。可采用本领域周知的计算软件计算两条或多条目的序列的序列同一性，这些软件可获自如NCBI。

本文中，序列相似性(sequence similarity)指若干条DNA、RNA或蛋白序列之间的相似程度，理解为参与对比的序列中相同残基的百分比(同一性百分比，identity％)或具有相似物理化学性质的残基百分比(相似性百分比，similarity％)。例如，2条不同蛋白质序列的序列相似性可以理解为此2条序列中存在的相同氨基酸残基的百分比(同一性百分比，identity％)或者此2条蛋白质序列中存在的具有相似物理化学性质的氨基酸残基的百分比(相似性百分比，similarity％)。

重复序列：在本发明中，多肽单元(U)主要由或仅由P、A、E三种氨基酸组成，在每个单元内部(≥20个氨基酸)，连续出现相同氨基酸的几率极高，除非这种氨基酸排列影响了其重组表达。

蛋白或多肽链的二级结构：指蛋白或多肽链中有规则重复的构象，主要有α-螺旋、β-折叠、β-转角及无规则卷曲。以下术语解释皆与经典分子生物学中的定义一致。

α-螺旋：常见的一种二级结构，肽链主链绕假想的中心轴盘绕成螺旋状，一般都是右手螺旋结构，螺旋是靠链内氢键维持的。每个氨基酸残基(第n个)的羰基氧与多肽链C端方向的第4个残基(第n+4个)的酰胺氮形成氢键。在典型的右手α-螺旋结构中，螺距为0.54nm，每一圈含有3.6个氨基酸残基，每个残基沿着螺旋的长轴上升0.15nm。

β-折叠：蛋白质中常见的二级结构，是由伸展的多肽链组成的。折叠片的构象是通过一个肽键的羰基氧和位于同一个肽链或相邻肽链的另一个酰胺氢之间形成的氢键维持的。氢键基本上垂直于肽链的螺旋长轴，这些肽链可以是平行排列；或者是反平行排列。

β-转角：连接蛋白质分子中的α-螺旋和β-折叠，使肽链走向改变的一种非重复多肽区，一般含有2～16个氨基酸残基。含有5个氨基酸残基以上的转角又常称之为环(loops)。常见的转角含有4个氨基酸残基，有两种类型。转角I的特点是：第1个氨基酸残基与第4个残基之间形成氢键；转角II的第3个残基往往是甘氨酸。这两种转角中的第2个残基大都是脯氨酸。

无规卷曲：此种结构为多肽链中除以上几种比较规则的构象外，其余没有确定规律性的那部分肽链的二级结构构象。

二级结构预测：目前，蛋白或多肽的二级结构预测方法有：Chou-Fasman算法、PHD算法、多序列列线预测、基于神经网络的序列预测、基于已有知识的预测方法(knowledge based method)及混合方法(hybrid system method)，这些方法为本领域技术人员所熟知的方法。本发明采用的是根据Chou-Fasman算法的结果(http://www.biogem.org/tool/chou-fasman/index.php)。

亲水性氨基酸：例子为精氨酸、赖氨酸、苏氨酸、天冬酰胺、谷胺酰胺、脯氨酸和谷氨酸。

疏水性氨基酸；例子为色氨酸、酪氨酸、苯丙氨酸、甲硫氨酸、亮氨酸、异亮氨酸和缬氨酸、丙氨酸。

本文中，“PEG”和/或“PEG化”指将聚乙二醇(PEG)聚合物链共价连接至目的生物活性蛋白或多肽上。一般认为将PEG共价连接至生物活性蛋白或多肽能够掩蔽所述蛋白或多肽免于宿主的免疫系统攻击，并增加目的生物活性蛋白或多肽的水动力学半径，从而通过降低肾清除率来延长其体内循环时间。

下述具体的实施方式，如无特别说明，均为本领域技术人员熟知的常规方法。如本发明的实施例使用免疫学、生物化学、微生物学、细胞生物学、遗传学和重组DNA常规技术，例如可以参照如《分子克隆实验指南》第三版(Sambrook J，Russell DW，Molecular cloning：A laboratory manual.3rd edition，New York：Cold Spring Harkbor Laboratory Press，2001)或商业公司提供的操作说明书中的技术方案。

实施例1、多肽单元(U)的获得

多肽单元(U)由P、A和E三种氨基酸组成，优选的示例性序列及其对应的TEPITOPE得分见如表2。

表2

利用Chou-Fasman算法计算α-螺旋含量，示例性的多肽单元(U)的α-螺旋含量如表3。

表3

SEQ ID NO:	序列	α-螺旋含量(％)
17	PPPPPPPPPPPPPPPAEAE	10.5
18	PPPAEPPPAPPPEPPPPPP	0
19	APPAEEPAEAPAEPPAAPEA	95
20	AEPAPPEEAAPAAPAAPEPE	80
21	APEEPAPEAPAAPAEAPPAP	90
22	AAPAEEAEAPEAPPAPAPEP	55
23	AEPAPPAAEPAPPAAEAAEP	75
24	APAAEAAPPAEAAEPEPEAP	90
25	APAPPEAEEPPEAAPAPAPA	75
26	AAEAEAAEAEPPAPPAPEPA	60
27	APPEAPEAPEAAPAAPEPAE	80
28	APPEAEPPEAPEAAEAAPAP	90
29	APAEAPAAAEEAPPAEPAPE	95
30	AAEAPAAPPAPEPEAEPEPA	80
31	AAEAPAPEPAAEPEPAPEAP	90
32	AEAEPAAPAPAEPAEPEAPA	95
33	AEPAAPAPAEPAAPAPEAPA	95
34	APAPEAPAAEPAAPAPAEPA	95
35	AAPPAPAPAAAEEAPAEAPA	75
36	AEPAAPAAPEPEPAAPAEAA	95
37	APPEPPAEAAPAAAEAPAEA	80
38	AAPAAAEPPAAEAEAPAPPA	80
39	APAAPPEEAAAEPPAAEAAP	80

40	AAEAAPAAPAAPEPAEEAAP	90
41	APEAAPAAAEPAPAPAAPEP	90
42	APAEAAEAAPEAPEPAAPAA	95
43	AEAAAPAEAAPAPAPEAPAP	90
44	AAEAAEAAPAEPEPPAPPAP	65
45	AEAAEAPAPAAPPAAPAPEP	90
46	APEAPAEEAEPAAAPPAEAP	90
47	APAPPAEAEAEAPPAAPEPA	85

实施例2、高表达低分子量多肽复合单元( PU)的获得

所述的多肽复合单元( PU)由多肽单元(U)拼接而成，可通过如下步骤之其一实现：

a.先设计一段由不同或相同多肽单元(U)组成的所述多肽复合单元( PU)序列；再将该所述多肽复合单元( PU)的蛋白序列转为DNA序列，并通过基因合成法获得全长DNA。

b.或者，如Martin Schlapschy等人报道(Martin Schlapschy等，Protein Engineering，Design&Selection，20：273-284，2007)，将多肽单元(U)通过互补粘端的方式在T4DNA连接酶作用下拼接，再进行琼脂糖凝胶电泳，回收适当大小的DNA片段。同样地，这些参与拼接的多肽单元(U)可以是序列相同的，也可以是不同的。为了纯化方便，在所述多肽复合单元( PU)的N末端或C末端加入6×His亲和纯化标签。

根据方法b，合成多肽单元(U)的对应核苷酸(DNA)片段：例如在AEPAAPAPAEPAAPAPEAPA(SEQ ID NO:33)对应的DNA片段两端引入BglI与SfiI酶切位点，其碱基序列经大肠杆菌密码子优化，将该序列通过EcoRV平末端插入pUC57，质粒命名为pUC57-U ₁。pUC57-U ₁经Bgl I酶切获得的片段与经SfiI酶切及去磷酸化的载体连接以获得二聚体，菌落PCR并酶切验证挑选二聚体克隆。同样操作，直至拼接挑选到理想的长度为止。可以通过此方法拼接，形成由不同序列的多肽单元(U)构成的多肽复合单元(PU)，如将表3中20个氨基酸长度的多肽单元(U)混合拼接组成的PUMix17(包括了U35、U34、U46等)、PUMix357(包括了U79、U27、U12等)等的多肽复合单元(PU)；也可以将相同序列的多肽单元(U)通过不断重复拼接，获得如PU12x5(U12重复拼接5次)、PU23x10(U23重复拼接10次)等的所述多肽复合单元(PU)。示例性的多肽复合单元(PU)序列见表4所示。值得注意的是，多肽复合单元(PU)在常规的考马斯亮蓝染色条件下染色效率较低，需要用铜染的方式(Chris Lee等，Analytical Biochemistry 166：308-312，1987)。具体步骤如下：1.配制0.3M CuCl ₂水溶液；2.将电泳胶拆下后，用双蒸水漂洗2-3min；3.将胶侵入0.3M CuCl ₂溶液中，染色2-5min；4.取出胶后，用成像仪拍照。

表4、示例性的多肽复合单元(PU)序列

实施例3、PU-hArg1融合蛋白的制备

将实施例2中经拼接后的PU片段与hArg1(中文名：人精氨酸酶；其序列见SEQ ID NO:7)的编码序列融合(如表5所示)，C端与His-6标签相连，构建到pET41a载体中。将该质粒转化到大肠杆菌感受态BL21(DE3)Gold中，挑取单克隆至LB卡那霉素抗性液体培养基，37℃、250RPM培养，长至OD 0.4-0.6(大约3h)，取200μL诱导前培养物，作为阴性对照。之后在剩余培养物中加IPTG至终浓度为1mM，在37℃诱导2.5h后取200μL。将诱导前和诱导后样品5000rpm、4min离心后，弃上清，加2％SDS 40μL重悬，加10μL 5*Loading Buffer混匀，100℃加热8-10min。

表5、示例性的PU-hArg1融合蛋白序列

SEQ ID NO:	代号
106	PU12x10-hArg1
107	PU12x5-hArg1-PU12x5
108	PU98x10-hArg1
109	PU98x5-hArg1-PU106x5
110	PUMix17-hArg1-PUMix49
111	PUMix35-hArg1-PUMix76
112	PUMix109-hArg1-PUMix163
113	mPAS-hArg1-mPAS
114	mXTEN-hArg1-mXTEN
115	mURP-hArg1-mURP

其中，mPAS，mXTEN，mURP是现有技术中的3种载体蛋白。

实施例4、PU-hArg1类似蛋白的分离纯化

蛋白纯化的方法根据不同的表达系统有所差异，现有技术早已有大量的知识提供蛋白纯化的指导，如GE Healthcare公司的经典纯化指南手册《Antibody Purification Handbook》，或者Elsevier出版社出版的《METHODS IN ENZYMOLOGY，Guide to Protein Purification，2nd Edition》等，亲和层析、分子排阻层析、离子交换层析及疏水层析等，已是本领域技术人员所熟知的技术。如下纯化过程为示例性的表明在表达宿主为大肠杆菌及发酵条件特定情况下的纯化方式。当发酵条件不同时，纯化条件亦应当相应稍作调整，在此不再赘述。

PU-hArg1融合蛋白纯化步骤依次包括硫酸铵沉淀，金属离子加热沉淀，阳离子交换，阴离子交换，疏水层析。融合较长多肽复合单元(PU)序列后表观分子量过大需要使用更大孔径的填料纯化才可获得较高的载量。不同结构的纯化稍有差别，例如随着所融合的多肽复合单元(PU)序列中谷氨酸百分比的增大，阳离子交换柱的结合越弱相应需要更低的pH去结合，并且较低的盐浓度就可洗下，相反阴离子交换柱的结合越强，只需要较低的pH就可以结合，并且需要较高的盐浓度才可洗脱。随着融合的多肽复合单元(PU)长度的延长，离子交换柱的结合洗脱性质也会发生与前述谷氨酸百分比增大时类似的现象。当融合在蛋白一端的一定长度的多肽复合单元(PU)序列分散到蛋白的两端时，阳离子交换柱的结合能力减弱，阴离子交换柱的结合能力增强。

将50g菌体与300ml 20mM PB，pH 7.0缓冲液混合后，用Ф15超声探头破碎2h，超3s停3s，破菌液8000rpm离心30min取上清，再用1μm滤膜过滤。破菌上清液调pH至5.0，上样到用0.2M NaCl，20mM NaAc-HAc，pH 5.0平衡后的25ml MMC(Bestarose Diamond MMC)层析柱上。先用2M NaCl，20mM NaAc-HAc，pH 5.0洗脱杂蛋白，再用洗脱液(2M NaCl，20mM Tris-HCl，pH8.0)洗脱目的蛋白。洗脱液调pH至6.0后加50mM CoCl ₂于60℃活化10min，加入(NH ₄) ₂SO ₄调电导至140ms/cm上样至5ml Phenyl(Phenyl Bestarose HP，博格隆(上海)生物技术有限公司)层析柱，50％洗脱液洗脱目的蛋白，100％洗脱杂质及聚体。上样缓冲液：1M(NH ₄) ₂SO ₄，20mM NaAc-HAc，pH6.0，洗脱冲液：20mM NaAc-HAc，pH6.0。洗脱样品用10mM Tris-HCl，pH 8.0于G25(Sephadex G-25，Coarse)层析柱上脱盐，之后上样到用20mM Tris-HCl，pH 8.0平衡后的20mL SuperQ(SuperQ-650M，TOSOH)层析柱，收集流出液，目的蛋白在流出液中。2M NaCl 20mM Tris-HCl，pH8.0洗脱，弃洗脱液。

实施例5、SEC-HPLC分析PU-hArg1表观分子量

将1mg/mL样品和分子量标准混合溶液，使用SEC-HPLC-UV分析。以相对分子量(Mr)为横坐标，实际测得的洗脱体积(V _e)为纵坐标，线性回归：V _e＝K ₁-K ₂logM _r。K ₁与K ₂为常数，M _r为相对分子质量。检测方法如下：检测波长：214nm；色谱柱：柱温25℃，Sepax SRT-1000SEC 5μm(300×7.8mm)，流动相：50mM PB，150mM NaCl，pH7.2；运行时间：20分钟。

从结果来看，各个PU-hArg1的表观分子量大于669KDa，如图1。

实施例6、DLS分析PU-hArg1水化半径

将1mg/ml样品吸取1.5ml置于比色皿中。马尔文Zetasizer Nano ZS中重复测定三次。

检测方法如下：检测器：173度光散射检测器；检测温度：25℃；示例性的粒径如图2所示，PU98x5-hArg1-PU106x5的水溶液中粒径达到17nm。

实施例7、PU-hArg1体外水解精氨酸活性检测

将待测活样品稀释到1μM，将45μl稀释后的样品与5μl 500mM CoCl ₂混合后60℃活化10min。50μl活化后的样品，加450μl 500mM L-精氨酸(pH7.4)，混匀后37℃水解15min，取样20μL，加至2mL尿素氮试剂混合液中(南京建成生物工程研究所)，立刻置沸水中准确水浴15分钟，冰水冷却5min，之后520nm处测定OD值。根据标准曲线计算尿素氮含量。Kcat(s ^-1)是指每摩尔酶每秒催化底物分解生成产物的摩尔数，Kcat(s ^-1)＝尿素氮浓度(mmol/mL)/[反应时间(s)×(样品浓度/稀释倍数/分子量)(mmol/mL)]。酶的比活是指每毫克质量的蛋白质中所含的某种酶的催化活力，比活＝(1/MW)×Kcat×60×1000。实验结果如下表6所示，由于融合所述的多肽单元(U)或多肽复合单元(PU)后每个样品分子量不同，因此单位质量(mg)内的IU(比活)有差异，然而通过Kcat值可以明显看出PU-hArg1融合蛋白水解精氨酸的活性并不降低，反而相对于hArg1而言略微上升。

表6、PU-hArg1融合蛋白的精氨酸水解活性

样品名	比活(IU/mg)	Kcat(s ^-1)
hArg1	252.6	147.9
PU12x10-hArg1	185.1	165.2
PU12x5-hArg1-PU12x5	184.1	164.3
PU98x10-hArg1	192.5	168.1
PU98x5-hArg1-PU106x5	193.9	169.3
PUMix17-hArg1-PUMix49	100.4	155.3
PUMix35-hArg1-PUMix76	100.1	157.9
PUMix109-hArg1-PUMix163	101.6	160.2
mPAS-hArg1-mPAS	120.0	152.5
mXTEN-hArg1-mXTEN	150.5	153.7
mURP-hArg1-mURP	120.4	155.1

实施例8、不同PU-hArg1类似蛋白的免疫原性试验

SD大鼠随机均分组，每组10只，分别用不同的PU-hArg1及未融合的hArg1蛋白(R&D Systems,Cat:5868-AR)免疫，3mg/kg，皮下注射，每周注射一次，连续注射4周，同时一组注射PBS作为阴性对照。最后一次免疫后两周，处死后取血，分离获得血清。用ELISA实验检测血清中PU抗体生成情况。具体地，用相应免疫大鼠的不同PU-hArg1融合蛋白、SEQ ID NO:113-115对照蛋白及未融合的hArg1蛋白包被ELISA板，PU-hArg1融合蛋白给药组血清的免疫动物血清分别稀释100倍、500倍及1000倍后加入过量hArg1蛋白拮抗结合hArg1的抗体，在37℃孵育2h，最后用HRP标记的羊抗大鼠二抗(EarthOX，E030140-01)检测，读取OD450值。给药后OD450为给药前2倍以上为阳性，反之为阴性。图3为血清稀释500倍后的检测结果。Arg1给药组抗药抗体较高，但是PU-hArg1融合蛋白组在拮抗掉针对Arg1的抗药抗体后，基本为阴性，而对照组超出阴性值2倍以上，即为弱阳性。

实施例9、不同PU-hArg1类似蛋白的药代检测试验

6只大鼠随机均分组，每组10只，分别注射不同的PU-hArg1蛋白和SEQ ID NO:113-115对照蛋白，2mg/kg，皮下注射，注射前和注射后3h，8h，12h，24h，36h，48h，72h，96h，120h，144h，168h取血，分离获得血清。

用夹心ELISA法检测融合蛋白在大鼠体内的药代情况。100ng/孔的hArg1兔多抗(杭州华安生物技术有限公司)包被过夜，PBST洗涤3次。5％脱脂奶粉封闭后，PBST洗涤3次，各时间点的血清稀释至指定的倍数，按100μl/孔加入到ELISA酶标板中，在37℃孵育2h后，PBST洗涤3次，加入生物素标记的hArg1兔多抗(杭州华安生物技术有限公司)，37℃孵育2小时，PBST洗涤3次，最后HRP标记的链霉亲和素稀释5万倍后加入到ELISA板中，37℃孵育1小时后PBST洗涤5次，用常规TMB法检测，读取OD450值。结果如图4所示，PU-hArg1融合蛋白的半衰期比对照蛋白有明显的改善。

实施例10、PU-GH融合蛋白的制备

将实施例2中经拼接后的所述的多肽单元(U)或多肽复合单元(PU)与hGH(人类生长素)片段(SEQ ID NO:5)连接(如表7所示)，N端与His6相连，构建到pET41a载体中。将该质粒转化到大肠杆菌感受态BL21(DE3)Gold，挑取单克隆至LB卡那抗性液体培养基，37℃、250RPM培养，长至OD 0.4-0.6(大约3h)，取200μL诱导前培养物，作为阴性对照。之后在剩余培养物中加IPTG至终浓度为1mM，在37℃诱导2.5h后取200μL。将诱导前和诱导后样品5000rpm、4min离心后，弃上清，加2％SDS 40μL重悬，加10μL5*Loading Buffer混匀，100℃加热8-10min。经SDS-PAGE电泳筛选表达菌株。

将30g菌体与300ml 20mM PB缓冲液(pH 7.0)混合后，用Ф15超声探头破碎2h，超3s停3s，破菌液8000rpm离心30min取上清，再用1μm滤膜过滤。向破菌上清中加入硫酸铵至电导180mS/cm，8000rpm、15min、10℃离心收集蛋白沉淀。沉淀用20mM PB(pH 7.0)溶液溶解，之后再用硫酸铵在180mS/cm的电导下沉淀。取沉淀用20mM NaAc(pH5.0)溶液溶解，并用水稀释至电导4mS/cm以下。用Super Q-650M(TOSOH)层析柱进行纯化(Buffer A：20mM NaAc pH5；Buffer B:0.5M NaCl 20mM NaAc pH5)，按20％B、70％B、100％B一次洗脱。取70％B洗脱样品，调pH至6.0，并用硫酸铵调电导至140mS/cm。用Phenyl HP(博格隆(上海)生物技术有限公司)层析柱进行纯化，直接用50mM PB，pH6洗脱。洗脱样品80℃水浴30min灭活蛋白酶。待样品温度恢复至室温后，调pH到4.0，并稀释溶液至电导4mS/cm以下。

最后用Diamond SP Mustang层析柱(博格隆(上海)生物技术有限公司)进行纯化(缓冲液A：20mM NaAc，pH4.0；缓冲液B1:20mM NaAc，pH5.0；缓冲液B2:20mM PB，pH7.0)，用B1和B2先后洗脱，收集B2洗脱样品。

当样品SDS-PAGE纯度低于95％时，进行如下步骤：洗脱液上样到用平衡缓冲液(0.5M NaCl，20mM咪唑，20mM Tris-HCl，pH 7.5)平衡后的50ml Chelating Sepharose Fast Flow层析柱(GE Healthcare)，再平衡后用10％、50％、100％洗脱缓冲液(0.15M NaCl，0.5M咪唑，20mM Tris-HCl，pH 8.0)洗脱。

表7、PU-GH融合蛋白

SEQ ID NO:

代号

116	PU27x28-GH
117	PU27x28-GH-PU27x5
118	PU98x28-GH
119	PU98x28-GH-PU98x4
120	PU130x28-GH
121	PU130x28-GH-PU130x5

实施例11、PU-GH融合蛋白的热稳定性

将经纯化的PU-GH融合蛋白样品调节成同样浓度(1mg/ml)，在无菌条件下过滤除菌，吸取相同体积到无菌的1.5ml离心管中，分别置于4℃、37℃及60℃中处理20小时或者在80℃放置5小时，SDS-PAGE电泳观察纯度。hGH由于在高温下出现聚集沉淀，不作电泳分析。结果如图5，可见所述融合蛋白具有良好的热稳定性。

实施例12、SEC-HPLC分析PU-GH样品的聚集

将实施例11中经加热处理的样品(PU27x28-GH-PU27x5在60℃放置20小时、PU98x28-GH-PU98x4在60℃放置20小时、PU130x28-GH-PU130x5在60℃放置20小时、PU98x28-GH-PU98x4在80℃放置5小时及PU130x28-GH-PU130x5在80℃放置5小时)用SEC-HPLC-UV分析。以相对分子量(Mr)为横坐标，实际测得的洗脱体积(V _e)为纵坐标，线性回归：V _e＝K ₁-K ₂logM _r。K ₁与K ₂为常数，M _r为相对分子质量。检测方法如下：检测波长：214nm；色谱柱：柱温25℃，Sepax SRT-1000SEC 5μm(300×7.8mm)，流动相：50mM PB，150mM NaCl，pH7.2；运行时间：20分钟。热稳定性测定结果如图6，可见各融合蛋白具有良好的热稳定性。hGH由于高温处理出现聚集沉淀，不进行液相分析。

实施例13、PU-GH样品的体外细胞活性检测

Ba/f3-GHR细胞用无IL-3的RPMI 1640培养基(含5％FBS和1mg/mL G418)饥饿处理4-6h后，转移至离心管中，1000RPM离心5min。用上述培养基重悬后计数，调整至2 x 10 ⁵/mL，铺96孔板，每孔100μL，即2万个细胞/孔。各待检蛋白用上述培养基稀释至合适的浓度，每孔加入10μL，刺激48h后，用MTT法检测。如表8和图7。

表8.PU-GH融合蛋白的体外细胞学活性

代号	EC50(nM)
PU27x28-GH	3.12
PU27x28-GH-PU27x5	6.45
PU98x28-GH	2.33
PU98x28-GH-PU98x4	5.13

PU130x28-GH	2.11
PU130x28-GH-PU130x5	6.23
hGH	0.54

由上表可见，融合蛋白的细胞学活性发生一定的减弱，但是在可被接受的范围内。

实施例14、不同PU-GH类似蛋白的药代检测试验

SD大鼠随机均分组，每组10只，分别皮下注射不同的PU-GH融合蛋白或hGH重组蛋白(Sino Biological,Cat:16122-H07E)，2mg/kg，注射前和注射后3h、8h、12h、24h、36h、48h、72h、96h、120h、144h、168h取血，分离获得血清。用夹心ELISA方法检测PU-GH蛋白在大鼠体内的药代情况。hGH抗体(Sino Biological,Cat:16122-R101)按100ng/孔加至ELISA酶标板，4℃包被过夜，PBST洗涤3次并5％奶粉封闭2小时，再次PBST洗涤3次，将各时间点的血清稀释至指定的倍数并加入到ELISA酶标板中，在37℃孵育2h后，PBST洗涤3次，加入生物素标记的hGH多克隆抗体(Sino Biological,Cat:16122-T24，生物素标记自制)，37℃孵育2h，PBST洗涤5次，最后HRP标记的链霉亲和素稀释5万倍后加入到ELISA板中，37℃孵育1h后常规TMB法检测，读取OD450值。PU-GH融合蛋白的半衰期结果如表9。

表9

融合蛋白代号	半衰期(t _1/2，小时)
PU27x28-GH	10.1
PU27x28-GH-PU27x5	16.7
PU98x28-GH	10.4
PU98x28-GH-PU98x4	17.6
PU130x28-GH	11.5
PU130x28-GH-PU130x5	16.5
hGH	0.17

由上表可见，融合蛋白的半衰期发生了极为显著的延长，与融合前hGH相比延长幅度高于50倍，甚至高于100倍。

实施例15、PU与GDF 15融合蛋白的制备

将实施例2中经拼接后的PU片段与GDF 15(生长分化因子，SEQ ID NO:15)融合表达(如表10所示)，N端与His6相连，核苷酸片段亚克隆至质粒pPIC9(Life Technologies)，构建成表达载体，以甲醇酵母Pichia pastor GS115(His ^-)为表达宿主菌，通过电转化将线性化的表达质粒转化到GS115中。30℃培养3天，至单菌落出现。将上述转化的重组酵母单菌落接种至10ml BMGY液体培养基中，30℃，250rpm培养24小时后，静置过夜，弃上清，加入10ml含1％甲醇的BMMY液体培养基，30℃，250rpm诱导表达。培养液离心取上清后加 5*加样缓冲液混匀，100℃加热8-10min。经SDS-PAGE电泳筛选表达菌株。

表10

氨基酸序列(SEQ ID NO:)	融合蛋白代号
122	PUMix76-GDF15
123	PUMix257-GDF15
124	PU58x5-GDF15
125	PU98x10-GDF15
126	PU184x10-GDF15

发酵液离心上清先用40％硫酸铵沉淀，用去离子水复溶后，上样到用平衡缓冲液(0.5M NaCl,20mM咪唑,20mM Tris-HCl,pH 7.5)平衡后的50ml Chelating Sepharose Fast Flow层析柱(GE Healthcare)，再平衡后用10％，50％，100％洗脱缓冲液(0.15M NaCl,0.5M咪唑,20mM Tris-HCl,pH 8.0)洗脱。洗脱液混合后，加入30-50％饱和度的硫酸铵沉淀，8000rpm离心20min收集沉淀，用去离子水复溶。复溶样品用10mM Tris-HCl，pH 8.0于G25(Sephadex G-25，Coarse)层析柱上脱盐。

实施例16、PU与GDF15融合蛋白在DIO小鼠中的药效研究

7周龄雄性C57BL/6J雄性小鼠给予高脂饲料(60％kcal from fat)继续饲养16周(共23周)，到体重约为55g时进行试验。饲养条件：12h光照/12h黑暗，自由采食，单笼饲养，给药前一天根据体重和体重生长曲线对小鼠进行分组(8只/组)，第二天皮下给药处理。按照30nmol/千克体重的剂量给药，对照组注射等体积生理盐水(PBS)；融合蛋白4天一次，连续给药28天，每天测量小鼠体重及进食量。最后一次给药后的第5天处死。计算每组动物给药前及处死时的平均体重变化。

结果如图8和图9所示，融合蛋白可以使得肥胖的动物体重显著地减少，说明融合蛋白保留了GDF15本身的生物学活性。

实施例17、PU与GLP-2类似物融合蛋白的制备

将实施例2中经拼接后的PU片段与胰高血糖素样肽2类似物GLP-2G融合(SEQ ID NO:1)，C端与His-6标签相连，核苷酸片段亚克隆至质粒pPIC9(Life Technologies)，构建成表达载体，以甲醇酵母Pichia pastor GS115(His ^-)为表达宿主菌，通过电转化将线性化的表达质粒转化到GS115中。30℃培养3天，至单菌落出现。将上述转化的重组酵母单菌落接种至10ml BMGY液体培养基中，30℃，250rpm培养24小时后，静置过夜，弃上清，加入10ml含1％甲醇的BMMY液体培养基，30℃，250rpm诱导表达。培养液离心取上清后加5*加样缓冲液混匀，100℃加热8-10min。经SDS-PAGE电泳筛选表达菌株。

表11

氨基酸序列(SEQ ID NO:)

融合蛋白代号

127	GLP2G-PU69x45
128	GLP2G-PU98x43
129	GLP2G-PU141x47

实施例18、PU与GLP-2G融合蛋白的活性测定

GLP-2G融合蛋白体外细胞学活性检测采用荧光素酶报告基因检测法。将GLP-2R(GLP-2受体)基因克隆至哺乳动物细胞表达质粒pCDNA3.1中，构建成重组表达质粒pCDNA3.1-GLP-2R，同时荧光素酶(luciferase)全长基因克隆至pCRE-EGFP质粒上，替换EGFP基因，得到pCRE-Luc重组质粒。pCDNA3.1-GLP-2R和pCRE-Luc质粒按摩尔比1:10的比例转染CHO细胞，筛选稳转表达株，获得重组GLP-2R/Luc-CHO稳转细胞株。

在10-cm细胞培养皿中用含10％FBS和300μg/ml G418的DMEM/F12培养基培养细胞，等汇合度至90％左右时，弃去培养上清，加入2ml胰酶消化2min后，吸掉上清，加入2ml含10％FBS和300μg/ml G418的DMEM/F12培养基中和，转移至15ml离心管中，800rpm离心5min后，弃去上清，加入2ml含10％FBS和300μg/ml G418的DMEM/F12培养基重悬，计数。用含10％FBS的DMEM/F12培养基稀释细胞至3*10 ⁵/mL，96孔板中每孔铺100μl，即每孔3万细胞，贴壁后换成含0.1％FBS的DMEM/F12培养基培养过夜。

铺在96孔板的细胞弃去上清后，将纯化的重组蛋白或GLP-2(杭州中肽生化有限公司，货号GLUC-002A)用含0.1％FBS的DMEM/F12培养基稀释至一系列指定浓度，加入到细胞培养孔中，100μl/孔，刺激6h后检测。根据lucifersae reporter kit(Ray Biotech，Cat:68-LuciR-S200)说明书进行检测。结果如表12及图10所示。

表12

融合蛋白代号	EC50(nM)
GLP2G-PU69x45	278.9
GLP2G-PU98x43	311.1
GLP2G-PU141x47	298.6
GLP-2	5.2

由表12可见，融合蛋白的细胞学活性发生一定的减弱，但是在可被接受的范围内。

实施例19、PU与GLP-2G融合蛋白的药代检测试验

SD大鼠随机均分组，每组10只，分别注射不同的融合蛋白，2mg/kg，皮下注射，注射前和注射后3h、8h、12h、24h、36h、48h、72h、96h、120h、144h、168h取血，分离获得血清。用夹心ELISA法检测融合蛋白在大鼠体内的药代情况。GLP-2抗体(Abcam，货号ab14183)按100ng/孔加至ELISA酶标板，4℃包被过夜，PBST洗涤3次并5％奶粉封闭2小时，再次PBST洗涤3次，将各时间点的血清稀释至指定的倍数并加入到ELISA酶标板中，在37℃孵育2h后，PBST洗涤3次，加入生物素标记的GLP-2多抗(Abcam，货号ab48292)，37℃孵育2h，PBST洗涤5次，最后HRP标记的链霉亲和素稀释5万倍后加入到ELISA板中，37℃孵育1h后常规TMB法检测，读取OD450值。

表13

融合蛋白代号	半衰期(t _1/2，小时)
GLP2G-PU69x45	42.7
GLP2G-PU98x43	40.5
GLP2G-PU141x47	41.2

由表13可见，GLP-2在体内半衰期仅有数分钟，而融合蛋白的半衰期发生了极为显著的延长。

实施例20、PU与AR _VEGF融合蛋白的制备

将实施例2中经拼接后的PU与结合VEGF的锚定重复蛋白(Ankyrin repeat proteins(AR _VEGF)，SEQ ID NO:3)融合(表14)，C端与6His标签相连，构建到pET41a载体中。将该质粒转化到大肠杆菌感受态BL21(DE3)gold，挑取单克隆至LB卡那抗性液体培养基，37℃、250RPM培养，长至OD 0.4-0.6(大约3h)，取200μL诱导前培养物，作为阴性对照。之后在剩余培养物中加IPTG至终浓度为1mM，在37℃诱导2.5h后取200μL。将诱导前和诱导后样品5000rpm、4min离心后，弃上清，加2％SDS 40μL重悬，加10μL 5*loading Buffer混匀，100℃加热8-10min。经SDS-PAGE电泳筛选表达菌株。

将40g菌体与300ml 20mM PB，pH 7.0缓冲液混合后，用Ф15超声探头破碎2h，超3s停3s，破菌液8000rpm离心30min取上清，再用1μm滤膜过滤。破菌上清先在80℃加热处理20分钟，离心沉淀杂蛋白。用40％硫酸铵沉淀，用去离子水复溶后，上样到用平衡缓冲液(0.5M NaCl，20mM咪唑，20mM Tris-HCl，pH 7.5)平衡后的50ml Chelating Sepharose Fast Flow层析柱(GE Healthcare)，再平衡后用0-100％洗脱缓冲液(0.15M NaCl，0.5M咪唑，20mM Tris-HCl，pH 8.0)线性洗脱。洗脱液加入45％饱和度的硫酸铵沉淀，8000rpm离心20min收集沉淀，用去离子水复溶。复溶样品用10mM Tris-HCl，pH 8.0于G25(Sephadex G-25，Coarse)层析柱上脱盐。

表14

氨基酸序列(SEQ ID NO:)	代号
130	PU73x49-AR _VEGF
131	PU98x43-AR _VEGF

实施例21、PU与AR _VEGF融合蛋白的亲和力测定

采用BLI(Bio-layer inteferometry，ForteBio)对融合蛋白的结合亲和力进行测定。首先，将生物素Biotin(Thermo，Prod#21338，Sulfo-NHS)和VEGF按摩尔比2:1混合，进行标记，通过透析除去未参与标记的生物素；然后，根据Octet-QK的使用说明，选择高灵敏度实验程序，在亲和素探针SA(forteBIO，Part#18-5019)上加载生物素标记的VEGF；实验中所用的缓冲液是PBS(含0.1％Tween-20)，将梯度稀释的融合蛋白和对照抗体，根据程序的设置，加入96孔黑色板(Greiner，655209)的预定位置中。根据程序设置，结合融合蛋白，然后在PBST溶液中解离，获得实验曲线；根据Octet-QK的结果分析软件，实验结果用local full拟合曲线，计算kon、kdis、Kd。表15概括了融合蛋白与对照药物Bevacizumab(Medchemexpress，Cat.No.:HY-P9906)的Kd，从表中可以看出融合PU前后，AR _VEGF对VEGF的平均亲和力无明显差异，与Bevacizumab相比在同一个数量级。

表15、PU-AR _VEGF融合蛋白的解离平衡常数(Kd)

实施例22、PU与AR _VEGF融合蛋白的体外活性研究

用VEGF受体竞争抑制法测定PU-AR _VEGF的活性。准备两块96孔板，分别为ELISA板和细胞板。两块板分别进行如下处理：

ELISA板中加入5μg/mL的VEGF Receptor 2(KDR)(Abcam，ab155628)，每孔50μL，在37℃中放置2h。用1％BSA/TBS封闭，37℃放置1h；细胞板中加入1％BSA/TBS，每孔200μL，在37℃中放置2h。

将PU-AR _VEGF和对照品Bevacizumab分别用PBS稀释成100μg/mL的母液，再将母液进行3倍稀释，共稀释11个浓度，将稀释好的样品80uL与等体积的1μg/mLVEGF混合，37℃放置1h。将包被KDR的ELISA板洗板两次，拍干后，将混合液依次转移至ELISA板中，37℃放置1h，然后洗板6次。向ELISA板中各孔加入1∶1000稀释的鼠抗人VEGF单克隆抗体(sigma，V4758-.5mg)，每孔50μL，37℃放置1h，然后洗板6次。再加入1∶1000稀释的羊抗鼠二抗(Pierce，31432，QA1969921)，每孔50μL，37℃放置1h，然后洗板6次。反应完后加入显色液，37℃显色15min，加入终止液终止显色反应，在酶标仪上读取OD450的数值，结果如表16和图11所示，可见，融合后的蛋白的生物学活性与融合前的蛋白相当。

表16、PU与AR _VEGF融合蛋白的IC50

蛋白样品	IC50(nM)
PU73x49-AR _VEGF	0.55
PU98x43-AR _VEGF	0.51
AR _VEGF	0.65
Bevacizumab	0.56

实施例23、血清稳定性

融合蛋白样品(PU27x28-GH-PU27x5、PU98x28-GH-PU98x4、PU130x28-GH-PU130x5)用40mM PB，pH7.4配制成2.0-3.0mg/ml，除菌过滤(0.22μm，Millipore)后，用大鼠血清稀释10倍，混匀，分装到无菌离心管中；置于37℃培养箱，取0天、及第7天样品进行Western分析，采用HRP标记的Anti-6X His

抗体(Abcam，ab1187)作为检测抗体。结果如图12所示，可见融合蛋白在血清中稳定性非常好。

实施例24、耐酶稳定性

称取适量胰蛋白酶(生工生物工程上海(股份)有限公司，货号A620627-0250)，用经高温灭菌的20mM PB(含0.15M NaCl，pH7.5)缓冲液溶解为质量浓度10％的溶液。将PU-GH融合蛋白(5mg/ml)和hGH(Sino Biological,Cat:16122-H07E，配制成1mg/ml)，分别加入质量终浓度0、0.02％、0.1％、0.5％的胰酶溶液混匀，用20mM PB(含0.15M NaCl，pH7.5)补齐体积。然后放37℃孵育40min；取出后加入电泳缓冲液煮沸10min终止反应。hGH样品的0、0.02％、0.1％、0.5％胰酶处理组分别上样于12％进行SDS-PAGE，PU-GH融合蛋白取0％及0.5％胰酶处理组分别上样于8％SDS-PAGE。结果如图13所示，hGH在0.02％胰酶处理下已经几乎无完整蛋白，而PU-GH融合蛋白则几乎没有任何降解，表明融合蛋白的耐酶稳定性优异。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

Claims

一种多肽单元，其具有以下特征：

(1)由脯氨酸、丙氨酸及谷氨酸组成；

(2)存在50％以上的α-螺旋二级结构；和

(3)长度≥15个氨基酸。
如权利要求1的多肽单元，其特征在于，根据Chou-Fasman公式计算，所述的多肽单元存在60％以上，较佳地70％以上，更佳地80％以上，进一步更佳地90％以上的α-螺旋二级结构。
如权利要求1的多肽单元，其特征在于，所述的α-螺旋二级结构的比例按照Chou-Fasman算法计算；和/或长度≥20个氨基酸。
如权利要求1的多肽单元，其特征在于，其包括选自下组的多肽单元：SEQ ID NO:19～47所示氨基酸序列的多肽单元。
一种多肽复合单元，其核心结构选自：

U ₁-U ₂或U ₁-U ₂-…U _n；

U ₁，U ₂，…，U _n各自代表一个权利要求1的多肽单元，n为＞2的正整数；且，两个或多个所述多肽单元的氨基酸序列相同或不同。
如权利要求5所述的多肽复合单元，其特征在于，所述多肽复合单元选自：

(a)SEQ ID NO:48～105任一所示的氨基酸序列的蛋白或SEQ ID NO:48～76对应多肽单元的重复拼接蛋白；或

(b)(a)限定的任一多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的，且具有(a)多肽活性的由(a)衍生的多肽；或

(c)氨基酸序列与(a)限定的多肽的氨基酸序列有80％以上相同性且具有(a)多肽活性的多肽。
一种具有生物活性的融合蛋白，其包括：权利要求1所述的多肽单元或权利要求5所述的多肽复合单元以及活性蛋白或多肽。
如权利要求7所述的融合蛋白，其特征在于，其包括选自下组任一或组合的结构：

(D ₁-PU ₁)；

(D ₁-PU ₁)-(D ₂-PU ₂)；或

(D ₁-PU ₁)-(D ₂-PU ₂)-…(D _m-PU _m)；

其中，PU ₁，PU ₂，…，PU _m选自权利要求1所述的多肽单元或权利要求5所述的多肽复合单元；D ₁，D ₂，…，D _m为所述活性多肽，m为＞2的正整数；

且，(D ₁-PU ₁)包括(PU ₁-D ₁)，(D ₂-PU ₂)包括(PU ₂-D ₂)，(PU _m-D _m)包括(D _m-PU _m)。
如权利要求8所述的融合蛋白，其特征在于，D ₁，D ₂，…，D _m各自代表一条或多条相互连接的活性蛋白或多肽，所述的多条活性蛋白或多肽之间功能相同或不同。
如权利要求7所述的融合蛋白，其特征在于，所述活性蛋白或多肽包括：GLP-2类似物，AR _VEGF，hGH，Arginase 1，G-CSF，Exendin-4，GLP-1类似物，GDF15，glucagon，IL-2，IL-15，FGF19，EPO，IL-6，M-CSF，FGF21。
如权利要求7所述的融合蛋白，其特征在于，其包括选自下组的融合蛋白：

(a)SEQ ID NO:106～131任一所示的氨基酸序列的蛋白；或

(b)(a)限定的任一多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的，且具有(a)多肽活性的由(a)衍生的蛋白；或

(c)氨基酸序列与(a)限定的多肽的氨基酸序列有80％以上相同性且具有(a)多肽活性的蛋白。
如权利要求7～11任一所述的融合蛋白，其特征在于，所述的融合蛋白在体内的半衰期或稳定性在统计学上高于未融合的活性多肽。
一种核酸分子，其特征在于，所述的核酸分子编码：

权利要求1～4任一所述的多肽单元；或

权利要求5～6任一所述的多肽复合单元；或

权利要求7～12任一所述的融合蛋白。
一种重组表达载体，其特征在于，它含有权利要求13所述的核酸分子。
一种遗传工程化的细胞，其特征在于，

所述的细胞含有权利要求14所述的重组表达载体；或

所述的细胞基因组中整合有权利要求13所述的核酸分子。
一种偶联物，其特征在于，包括：(a)权利要求1所述的多肽单元或权利要求5 所述的多肽复合单元；以及，(b)活性蛋白或多肽；其中，(b)与(a)以偶联或吸附的方式连接。
权利要求1～4任一所述的多肽单元或权利要求5或6所述的多肽复合单元的用途，用于：

提高活性多肽的稳定性，较佳地包括热稳定性、耐酶稳定性和血清稳定性；

提高活性多肽的半衰期；

延长活性多肽的作用时间；和/或

提高活性多肽的溶解度。
一种组合物，其包括：

权利要求7～12任一所述的融合蛋白或权利要求16所述的偶联物；和

药学上或食品学上可接受的载体。