CN102481331B

CN102481331B - 葡萄糖调节多肽及其制备和使用方法

Info

Publication number: CN102481331B
Application number: CN201080035271.0A
Authority: CN
Inventors: V·谢尔恩伯杰; J·西尔弗曼; W·P·施泰姆尔; 王家威; N·吉西格; J·L·克莱兰; B·斯平克
Original assignee: Amunix Inc
Current assignee: Amunix Inc
Priority date: 2009-06-08
Filing date: 2010-06-08
Publication date: 2017-09-22
Anticipated expiration: 2030-06-08
Also published as: EP2440228A4; WO2010144508A1; PT2440228T; US10000543B2; US20170158748A1; US20150274800A1; NZ596778A; EP2440228B8; EP2440228A1; EP2440228B1; AU2010258898B2; CA2764108A1; CN102481331A; ES2705249T3; DK2440228T3; ZA201200122B; JP5839597B2; AU2010258898A1; US9540430B2; JP2012529297A

Abstract

本发明涉及包含与延伸的重组多肽(XTEN)连接的葡萄糖调节肽的组合物、编码所述组合物的分离的核酸和含有所述分离的核酸的载体和宿主细胞，以及制备所述组合物的方法和使用所述组合物治疗葡萄糖调节肽相关疾病、疾患和病症的方法。

Description

葡萄糖调节多肽及其制备和使用方法

关于联邦资助研究的声明

本发明在由美国国立卫生研究院授予的SBIR基金2R44GM079873-02的政府支持下完成。政府具有本发明的某些权利。

相关申请的交叉引用

本申请要求2009年6月8日提交的美国临时申请No.61/268,193；2009年8月25日提交的美国临时申请No.61/236,836；和2009年11月10日提交的美国临时申请No.61/280,955，以及2010年2月3日提交的美国申请No.12/699,761和PCT申请No.PCT/US10/23106的优先权权益，这些申请都是待决的，其全部内容在此以引用的方式并入本文。

序列表

本申请包含通过EFS-Web提交的序列表，在此通过引用将该序列表整体并入。所述ASCII拷贝创建于2010年7月28日，命名为32887122.txt，大小为3,692,063字节。

发明背景

葡萄糖调节肽是人代谢的关键调节成分。已描述多种肽具有引起血糖水平增加或降低的生物效应。甚至当它们具有相反的生物功能时，这些肽相互之间趋于高度同源。尤其当在水溶液中配制时，许多葡萄糖调节肽(包括用作治疗剂的那些)通常为显示短贮藏期的不稳定分子。另外，许多葡萄糖调节肽具有有限的溶解度，或在重组制备过程中变的聚合，因此需要复杂的增溶和重折叠程序。可将多种化学聚合物与这类肽和蛋白质连接以修改它们的性质。特别感兴趣的是具有灵活构象且在水溶液中良好地与水化合的亲水性聚合物。经常使用的聚合物是聚乙二醇(PEG)。相对于其分子量，这些聚合物常常具有大的流体动力学半径(Kubetzko,S.等(2005)Mol Pharmacol,68:1439-54)，并且可引起增强的药代动力学性质。然而，聚合物与蛋白质的化学偶联需要复杂的多步过程；通常，在化学偶联步骤之前需要制备和纯化蛋白质组分并且偶联步骤可导致需要分离的不均一产物混合物的形成，导致明显的产物损失。可选地，这类混合物可用作最终的药剂产品，但难以标准化。一些实例是当前销售的用作混合物的聚乙二醇化干扰素-α产品(Wang,B.L.等.(1998)JSubmicrosc Cytol Pathol,30:503-9;Dhalluin,C.等.(2005)Bioconjug Chem,16:504-17)。这类混合物难以可再生地制造并且以其包含具有降低的治疗活性或没有治疗活性的同分异构体为特征。

白蛋白和免疫球蛋白片段(诸如Fc区)已用于偶联其它的生物活性蛋白，关于半衰期或免疫原性增加具有出乎意料的结果。不幸的是，Fc结构域未能在重组表达过程中有效折叠，并易于形成被称为包涵体的不溶性沉淀。这些包涵体必须被溶解并且功能性蛋白质必须被复性。这是需要另外的制造步骤和通常复杂的纯化程序的耗时、低效且昂贵的过程。

因此，存在对可提高葡萄糖调节肽的生物性质、药理学性质、安全性和/或药学性质的组合物和方法的显著需要。

发明概述

本公开内容涉及可用于或治疗通过施用葡萄糖调节肽而改善、缓解或抑制的任何疾病、疾患或病症的组合物和方法。具体说，本发明提供了融合蛋白组合物，所述融合蛋白组合物包含与葡萄糖调节肽(GP)连接的具有非重复序列和/或非结构化构象的一个或多个延伸的重组多肽(XTEN)。部分地，本公开内容涉及包含所述融合蛋白的药物组合物及其治疗葡萄糖调节肽相关疾病、疾患或病症的用途。

在一个实施方案中，本发明提供了分离的融合蛋白，其包含与选自表1的氨基酸序列具有至少约90%、或约95%、或约96%、或约97%、或约98%、或约99%的同一性的葡萄糖调节肽，其中所述葡萄糖调节肽与至少约100、或至少约200、或至少约400、或至少约800、或至少约900、或至少约1000、或至少约2000、多至约3000个氨基酸残基的延伸的重组多肽(XTEN)连接，其中所述XTEN特征在于：(a)所述XTEN包含显示与类似长度的选自表5所示序列的氨基酸序列具有至少约90%、或约95%、或约96%、或约97%、或约98%、或约99%同一性的至少约200个连续氨基酸；(b)当通过TEPITOPE算法分析时，所述XTEN序列缺少预测的T细胞表位，其中所述对所述XTEN序列中表位的TEPITOPE算法预测基于-5、或-6、或-7、或-8、或-9或更高的评分；(c)所述XTEN具有小于10、或小于9、或小于8、或小于7、或小于6、或小于5、或甚至更小的子序列评分；和(d)甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基的总和构成所述XTEN的总氨基酸残基的超过约90%、或约95%、或约96%、或约97%、或约98%、或约99%。在一个实施方案中，分离的融合蛋白的葡萄糖调节肽是人葡萄糖调节肽。在另一实施方案中，所述分离的融合蛋白包含至少第二XTEN，其中所述融合蛋白具有表5所示的多XTEN构型或其变体。

在另一实施方案中，GPXTEN融合蛋白的XTEN序列特征在于：通过GOR算法确定，它具有大于90%的无规卷曲形成、或约95%、或约96%、或约97%、或约98%、或约99%的无规卷曲形成；并且通过Chou-Fasman算法确定，所述XTEN序列具有小于2%的α螺旋和2%的β折叠。

在另一实施方案中，本发明提供了GPXTEN融合蛋白，其中所述XTEN特征在于：天冬酰胺和谷氨酰胺残基总和小于所述XTEN总氨基酸序列的10%，甲硫氨酸和色氨酸残基总和是所述XTEN总氨基酸序列的小于2%，所述XTEN序列具有小于5%的带正电荷的氨基酸残基，通过GOR算法确定所述XTEN序列具有大于90%的无规卷曲形成、或约95%、或约96%、或约97%、或约98%、或约99%的无规卷曲形成；并且通过Chou-Fasman算法确定所述XTEN序列具有小于2%的α螺旋和2%的β折叠。

在另一实施方案中，本发明提供了GPXTEN融合蛋白，其中所述XTEN特征在于：XTEN序列的至少约80%、或至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约96%、或至少约97%、或至少约98%、或至少约99%由非重叠序列基序组成，其中每个序列基序具有约9至约14个氨基酸残基，并且其中任何两个连续氨基酸残基的序列在每个序列基序中出现不超过两次，所述序列基序由选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的4至6个类型的氨基酸组成。

在一些实施方案中，没有一个类型的氨基酸构成GPXTEN的XTEN序列的超过30%。在其它实施方案中，XTEN具有其中没有三个连续氨基酸是相同的序列，除非所述氨基酸是丝氨酸，在这种情况下，不超过三个连续氨基酸是丝氨酸残基。在其它实施方案中，XTEN序列的至少约80%、或约90%、或约95%、或约96%、或约97%、或约98%、或约99%、或100%由非重叠序列基序组成，其中每个序列基序具有12个氨基酸残基。在一个实施方案中，XTEN序列由非重叠序列基序组成，其中所述序列基序来自表2的一个或多个序列。

在一些实施方案中，GPXTEN融合蛋白与未连接XTEN的GP相比表现出增强的药代动力学性质，其中增强的性质包括但不限于更长的终末半衰期、更大的曲线下面积、血药浓度在治疗窗内维持时间的增加、连续剂量之间时间的增加和随时间的摩尔剂量的降低。在一些实施方案中，施用给受试者的GPXTEN融合蛋白的终末半衰期增加至以类似剂量施用给受试者的未连接XTEN的GP的终末半衰期的至少约2倍、或至少约3倍、或至少约4倍、或至少约5倍、或至少约6倍、或至少约8倍、或至少约10倍、或至少约20倍、或至少约40倍、或至少约60倍、或至少约100倍。在其它实施方案中，增强的药代动力学性质由以下事实反映：GPXTEN融合蛋白在给定时段在治疗窗内维持的血药浓度是以类似剂量施用给受试者的未连接XTEN的GP的至少约2倍、或至少约3倍、或至少约4倍、或至少约5倍、或至少约6倍、或至少约8倍、或至少约10倍、或至少约20倍、或至少约40倍、或至少约60倍、或至少约100倍或甚至更高。与未连接XTEN的相应GP相比，半衰期和治疗窗内维持时间的增加允许较低频率的给药和施用给受试者的融合蛋白量(以摩尔当量表示)的减少。在一个实施方案中，治疗有效剂量方案导致融合蛋白的血药水平的至少两个连续C_max峰和/或C_min谷之间的时间增加至使用类似剂量方案施用给受试者的未与融合蛋白连接的相应GP的至少2倍、或至少3倍、或至少4倍、或至少5倍、或至少6倍、或至少8倍、或至少10倍、或至少约20倍、或至少约40倍、或至少约60倍、或至少约100倍。

在一些实施方案中，与连接了生物活性蛋白的XTEN相比，XTEN与生物活性蛋白连接时增强了生物活性蛋白的热稳定性，其中热稳定性通过在暴露于约37℃的温度下至少约7天之后测量生物活性的保留来确定。在前述一个实施方案中，与未连接XTEN的GP相比，包含XTEN的GP的生物活性保留时间增加至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约100%、或约150%、至少约200%、至少约300%或约500%。

在一些实施方案中，具有至少第一XTEN的分离的融合蛋白包含GP，其中GP是人葡萄糖调节肽。在一些实施方案中，分离的融合蛋白还包含第二XTEN，其可以与第一XTEN相同或不同，并且其中融合蛋白具有表7所示的多XTEN构型。在前述的一个实施方案中，第一和第二XTEN可以各自是选自表5的序列，或者可以显示与选自表5的序列至少约80%、或至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约96%、或至少约97%、或至少约98%、或至少约99%或100%序列同一性。在另一实施方案中，包含第二XTEN序列的分离的融合蛋白具有表7所示的多XTEN构型。

在一个实施方案中，分离的融合蛋白与未连接XTEN的GP相比具有较低的免疫原性，其中免疫原性通过例如在给受试者施用类似剂量之后测量选择性结合生物活性蛋白的IgG抗体的生成来确定。

在一些实施方案中，融合蛋白的葡萄糖调节肽和XTEN通过间隔区连接，其中所述间隔区序列包含约1至约50个氨基酸残基，任选地包含裂解序列。在一个实施方案中，裂解序列易受蛋白酶裂解。这种蛋白酶的非限制性实例包括FXIa、FXIIa、激肽释放酶、FVIIa、FIXa、FXa、凝血酶、弹性蛋白酶-2、粒酶B、MMP-12、MMP-13、MMP-17或MMP-20、TEV、肠激酶、鼻病毒3C蛋白酶和分选酶A(sortase A)。

在一些实施方案中，构造分离的融合蛋白使之与未与融合蛋白连接的相应GP相比具有降低的对相应GP的靶受体的结合亲和力。在一个实施方案中，GPXTEN融合蛋白对GP的靶受体表现出如下范围的结合亲和力：缺少XTEN的相应GP的结合亲和力的约0.01%-30%、或约0.1%至约20%、或约1%至约15%、或约2%至约10%。在另一实施方案中，GPXTEN融合蛋白对GP的靶受体的结合亲和力降低至未连接XTEN的GP的最多约1/3、或最多约1/5、或最多约1/6、或最多约1/7、或最多约1/8、或最多约1/9、或最多约1/10、或最多约1/12、或最多约1/15、或最多约1/17、或最多约1/20、或最多约1/30、或最多约1/50、或最多约1/100。在相关的实施方案中，亲和力降低的融合蛋白可以具有降低的受体介导的清除和相应的半衰期增加，半衰期是未连接融合蛋白的相应GP的至少约3倍、或至少约5倍、或至少约6倍、或至少约7倍、或至少约8倍、或至少约9倍、或至少约10倍、或至少约12倍、或至少约15倍、或至少约17倍、或至少约20倍、或至少约30倍、或至少约50倍、或至少约100倍。

在一个实施方案中，本发明提供了分离的GPXTEN融合蛋白，其包含与选自表35、表36和表37的序列具有至少约80%、或至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约96%、或至少约97%、或至少约98%、或至少约99%、或100%序列同一性的氨基酸序列。

在一些实施方案中，本发明提供了GPXTEN融合蛋白，其中GPXTEN在生理条件下表现出溶解度增加至未连接融合蛋白的GP的溶解度的至少3倍、或至少约4倍、或至少约5倍、或至少约6倍、或至少约7倍、或至少约8倍、或至少约9倍、或至少约10倍、或至少约15倍、或至少20倍、或至少40倍、或至少60倍。

在一些实施方案中，通过尺寸排阻色谱测定，GPXTEN融合蛋白表现出与实际分子量相比增加的表观分子量，其中表观分子量是至少约100kD、或至少约150kD、或至少约200kD、或至少约300kD、或至少约400kD、或至少约500kD、或至少约600kD、或至少约700kD，而融合蛋白的每个GP组分的实际分子量小于约25kD。因此，GPXTEN融合蛋白的表观分子量可以是融合蛋白的实际分子量的约4倍、或约5倍、或约6倍、或约7倍、或约8倍。在一些情况下，前述实施方案的分离的GPXTEN融合蛋白在生理条件下表现出大于约4、或约5、或约6、或约7、或约8的表观分子量因子。

本发明涵盖GPXTEN融合蛋白组合物，其包含但不限于选自表1的GP(或其片段或序列变体)、选自表5的XTEN(或其序列变体)，GP和XTEN具有选自表5的构型。一般而言，得到的GPXTEN将保留未连接XTEN的相应GP的至少一部分生物活性。在其它情况下，GP组分在其通过加入GPXTEN的间隔区序列内的任选裂解序列的裂解而从XTEN释放时具有生物活性或活性增加。

在GPXTEN组合物的一个实施方案中，本发明提供了式I的融合蛋白：

(XTEN)_x-GP-(XTEN)_y I

其中每次出现时独立地，GP是葡萄糖调节肽；x是0或1且y是0或1，其中x+y≥1；并且XTEN是延伸的重组多肽。

在一些实施方案中，XTEN在葡萄糖调节肽的N端或C端与葡萄糖调节肽融合。在一些实施方案中，分离的融合蛋白包含人葡萄糖调节肽和选自AE912、AM923、AE144和AE288的第一XTEN和第二XTEN。

在GPXTEN组合物的另一个实施方案中，本发明提供了式II的融合蛋白：

(XTEN)_x-(GP)-(S)_y-(XTEN)_y II

其中每次出现时独立地，GP是葡萄糖调节肽；S是具有1至约50个氨基酸残基的间隔区序列，其可任选地包含裂解序列；x是0或1且y是0或1，其中x+y≥1；并且XTEN是延伸的重组多肽。

在另一实施方案中，本发明提供了分离的融合蛋白,其中所述融合蛋白具有式III：

(GP)-(S)_x-(XTEN)-(S)_y-(GP)-(S)_z-(XTEN)_z III

其中每次出现时独立地，GP是葡萄糖调节肽；S是具有1至约50个氨基酸残基的间隔区序列，其可任选地包含裂解序列；x是0或1；y是0或1；z是0或1；并且XTEN是延伸的重组多肽。

在另一实施方案中，本发明提供了分离的融合蛋白，其中融合蛋白具有式IV：

(XTEN)_x-(S)_y-(GP)-(S)_z-(XTEN)-(GP) IV

在另一实施方案中，本发明提供了分离的融合葡萄糖调节肽，其中融合蛋白具有式V：

(GP)_x-(S)_x-(GP)-(S)_y-(XTEN) V

其中每次出现时独立地，GP是葡萄糖调节肽；S是具有1至约50个氨基酸残基的间隔区序列，其可任选地包含裂解序列；x是0或1；y是0或1；并且XTEN是延伸的重组多肽。

在另一实施方案中，本发明提供了分离的融合蛋白,其中融合蛋白具有式VI：

(XTEN)-(S)_x-(GP)-(S)_y-(GP) VI

在另一实施方案中，本发明提供了分离的融合蛋白，其中融合蛋白具有式VII：

(XTEN)-(S)_x-(GP)-(S)_y-(GP)-(XTEN) VII

在另一实施方案中，本发明提供了分离的融合蛋白，其中融合蛋白具有式VIII：

((S)_m-(GP)_x-(S)_n-(XTEN)_y-(S)_o)_t VIII

其中t是大于0的整数(1、2、3等)；m、n、o、x和y各自独立为整数(1、2、3等)，GP是葡萄糖调节肽；S是间隔区，任选地包含裂解位点；并且XTEN是延伸的重组多肽，条件是：(1)x+y>1，(2)当t=1时，x>0且y>0，(3)当存在不止一个GP、S或XTEN时，每个GP、XTEN或S是相同的或独立不同的；并且(4)当t>1时，每个亚单位中的m、n、o、x或y是相同的或独立不同的。

在一些实施方案中，治疗有效剂量的式I-VIII的实施方案的融合蛋白施用给有相应需要的受试者可以导致在融合蛋白治疗窗内维持的时间增加至以类似剂量施用给受试者的未连接XTEN的相应GP的至少2倍、或至少3倍、或至少4倍、或至少5倍或更多。在其它情况下，治疗有效剂量的式I-VIII的实施方案的融合蛋白施用给有相应需要的受试者可以导致与以类似剂量施用的未连接XTEN的GP相比，维持治疗有效剂量方案所必需的连续剂量之间时间增加至少48h、或至少72h、或至少约96h、或至少约120h、或至少约7天、或至少约14天、或至少约21天。

融合蛋白可以被设计为具有不同构型，GP的N端至C端、XTEN和任选的间隔区序列，包括但不限于XTEN-GP、GP-XTEN、XTEN-S-GP、GP-S-XTEN、XTEN-GP-XTEN、GP-GP-XTEN、XTEN-GP-GP、GP-S-GP-XTEN、XTEN-GP-S-GP及其多聚体，或如表7中所示的构型。如本文所公开的，构型的选择可以赋予特定的药代动力学性质、理化性质或药理性质。

在一些实施方案中，分离的融合蛋白特征在于：(i)与缺少XTEN的相应葡萄糖调节肽相比，它具有更长的半衰期；(ii)与以另外等同的剂量方案施用给受试者的缺少XTEN的相应葡萄糖调节肽相比，当较小摩尔量的所述融合蛋白施用给受试者时，所述融合蛋白达到与缺少XTEN的相应葡萄糖调节肽类似的曲线下面积(AUC)；(iii)与以另外等同的剂量方案施用给受试者的缺少XTEN的相应葡萄糖调节肽相比，当较小摩尔量的所述融合蛋白施用给受试者时，所述融合蛋白达到与缺少XTEN的相应葡萄糖调节肽类似的治疗效果；(iv)与使用另外等同的摩尔量施用给受试者的缺少XTEN的相应葡萄糖调节肽相比，当所述融合蛋白以较低频率施用给受试者时，所述融合蛋白达到与缺少XTEN的相应葡萄糖调节肽类似的曲线下面积(AUC)；(v)与使用另外等同的摩尔量施用给受试者的缺少XTEN的相应葡萄糖调节肽相比，当所述融合蛋白以较低频率施用给受试者时，所述融合蛋白达到与缺少XTEN的相应葡萄糖调节肽类似的治疗效果；(vi)与以另外等同的剂量期施用给受试者的缺少XTEN的相应葡萄糖调节肽相比，当累积较小摩尔量的所述融合蛋白施用给受试者时，所述融合蛋白达到与缺少XTEN的相应葡萄糖调节肽类似的曲线下面积(AUC)；或(vii)与以另外等同的剂量期施用给受试者的缺少XTEN的相应葡萄糖调节肽相比，当累积较小摩尔量的所述融合蛋白施用给受试者时，所述融合蛋白达到与缺少XTEN的相应葡萄糖调节肽类似的治疗效果。

在一个实施方案中，上文描述的式I-VIII的GPXTEN融合蛋白表现出生物活性是未连接融合蛋白的GP的生物活性的至少约0.1%、或至少约0.1%、或至少约1%、或至少约2%、或至少约3%、或至少约4%、或至少约5%、或至少约10%、或至少约20%、或至少约30%、或至少40%、或至少约50%、或至少约60%、或至少约70%、或至少约80%、或至少约90%、或至少约95%。在另一实施方案中，式I-VIII的GPXTEN融合蛋白与未与融合蛋白共价连接的相应亲本GP结合相同的受体。

本发明提供了制备融合蛋白的方法，所述融合蛋白包含与一个或多个延伸的重组多肽(XTEN)融合的葡萄糖调节肽，该方法包括：(a)提供包含编码所述融合蛋白的重组多核苷酸分子的宿主细胞；(b)在允许所述融合蛋白表达的条件下培养所述宿主细胞；和(c)回收所述融合蛋白。在该方法的一个实施方案中，融合蛋白的葡萄糖调节肽与人葡萄糖调节肽或选自表1的序列具有至少90%序列同一性。在该方法的另一个实施方案中，所表达的融合蛋白的一个或多个XTEN与选自表5的序列具有至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%至约100%序列同一性。在该方法的另一个实施方案中，为了所述融合蛋白在宿主细胞中增强的表达而对编码XTEN的多核苷酸进行密码子优化。在该方法的另一个实施方案中，宿主细胞是原核细胞。在该方法的另一个实施方案中，宿主细胞是大肠杆菌。在该方法的另一个实施方案中，分离的融合蛋白以基本上可溶的形式从宿主细胞的细胞质中回收。

本发明提供了包含选自以下的多核苷酸序列的分离的核酸：(a)编码前述实施方案任一个的融合蛋白的多核苷酸，或(b)(a)的多核苷酸的互补体。在一个实施方案中，本发明提供了分离的核酸，其包含与以下具有至少80%序列同一性、或约85%、或至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%至约100%序列同一性的多核苷酸序列：(a)选自表35、表36和表37的类似长度的多核苷酸序列；或(b)(a)的多核苷酸的互补体。本发明提供了包含与本段所述的上述实施方案任何一个的核酸的表达载体。在一个实施方案中，前述表达载体还包含与多核苷酸序列可操作连接的重组调控序列。在另一实施方案中，前述表达载体的多核苷酸序列与编码分泌信号序列的多核苷酸在框内融合，所述分泌信号序列可以是原核信号序列。在一个实施方案中，所述分泌信号序列选自OmpA、DsbA和PhoA信号序列。

本发明提供了可包含之前段落中公开的表达载体的宿主细胞。在一个实施方案中，宿主细胞是原核细胞。在另一实施方案中，宿主细胞是大肠杆菌。在另一实施方案中，宿主细胞是真核细胞。

在一个实施方案中，本发明提供了包含前述实施方案的任何一个的融合蛋白和药学上可接受的载体的药物组合物。在另一实施方案中，本发明提供了试剂盒，其包括：包装材料和包含前述实施方案的药物组合物的至少第一容器以及标识所述药物组合物以及存储和处理条件的标签，以及关于所述药物组合的重建和/或施用给受试者的一张说明。

本发明提供了治疗受试者的葡萄糖调节肽相关病症的方法，该方法包括对所述受试者施用治疗有效量的前述实施方案任一个的融合蛋白。在该方法的一个实施方案中，葡萄糖调节肽相关病症选自但不限于青少年糖尿病、I型糖尿病、II型糖尿病、肥胖、急性低血糖、急性高血糖、夜间低血糖、慢性高血糖、胰高血糖素瘤、气道的分泌疾患、关节炎、骨质疏松症、中枢神经系统疾病、再狭窄、神经退行性疾病、肾衰竭、充血性心力衰竭、肾病综合症、肝硬化、肺水肿、高血压和其中需要减少食物摄取的疾患、中风、肠道易激综合症、心肌梗塞(例如，降低发病率和/或与其相关的发病率)、中风、急性冠状动脉综合征(例如，以Q波的缺乏为特征)心肌梗塞、术后代谢变化、冬眠心肌或糖尿病心肌病、尿钠排泄不足、尿钾浓度过高、与有毒高血容量有关的病症或疾患(例如，肾衰竭、充血性心力衰竭、肾病综合症、肝硬化、肺水肿和高血压)、多囊卵巢综合症、呼吸窘迫、肾病、左心室收缩功能障碍(例如，具有异常的左心室射血分数)、肠胃疾患诸如腹泻、术后倾倒综合症和肠道易激综合症(即，经由抑制胃窦十二指肠移行性)、危重病多发性神经病(CIPN)、血脂异常、局部缺血后血流再灌注引起的器官组织损伤，和冠心病危险因素(CHDRF)综合症，和任何其它使用非修饰的葡萄糖调节肽(例如exendin-4、GLP-1或胰高血糖素)的适应症，或任何其它可使用GP的适应症(但是受试者的内源性葡萄糖调节肽水平未必不足)。

在一些实施方案中，组合物可以皮下、肌肉内或静脉内施用。在一个实施方案中，组合物以治疗有效量施用。在一个实施方案中，所述治疗有效量导致与以类似剂量施用给受试者的未连接融合蛋白的融合蛋白相应GP相比，在融合蛋白治疗窗内维持的时间增加。在治疗窗内维持的时间增加至未连接融合蛋白的GP的至少3倍，或者可选地是未连接融合蛋白的相应GP的至少4倍、或5倍、或6倍、或7倍、或8倍、或9倍、或至少10倍、或至少20倍、或至少约30倍、或至少约50倍、或至少约100倍。在治疗方法的一些实施方案中，(i)与以另外相同的剂量方案施用的缺少XTEN的相应葡萄糖调节肽相比，施用较小摩尔量(例如，约1/2、或约1/3、或约1/4、或约1/5、或约1/6、或约1/8、或约1/100或更少)的所述融合蛋白，并且所述融合蛋白达到与缺少XTEN的相应葡萄糖调节肽类似的曲线下面积和/或类似的治疗效果；(ii)与使用另外相同的剂量的缺少XTEN的相应葡萄糖调节肽相比，所述融合蛋白以较低频率(例如，每2天一次、约每7天一次、约每14天一次、约每21天一次、或约每月一次)施用，并且所述融合蛋白达到与缺少XTEN的相应葡萄糖调节肽类似的曲线下面积和/或类似的治疗效果；或(iii)与以另外相同的剂量方案的缺少XTEN的相应葡萄糖调节肽相比，施用累积较低摩尔量的所述融合蛋白(例如，约5%、或约10%、或约20%、或约40%、或约50%、或约60%、或约70%、或约80%、或约90%)，所述融合蛋白达到与缺少XTEN的相应葡萄糖调节肽类似的曲线下面积和/或类似的治疗效果。所述累积更低的摩尔量是针对至少约一周、或约14天、或约21天、或约一个月的时段的测量。在该方法的一些实施方案中，治疗效果是选自以下的测量参数：HbA1c浓度、胰岛素浓度、受激的C肽、空腹血糖(FPG)、血清细胞因子水平、CRP水平、胰岛素分泌和得自口服葡萄糖耐受试验(OGTT)的胰岛素敏感指数、体重和食物消耗。

在另一实施方案中，本发明提供了治疗疾病、疾患或病症的方法，包括利用使用治疗有效剂量方案施用的多次连续剂量的药物组合物给受试者施用上述药物组合物。在前述的一个实施方案中，所述治疗有效剂量方案可以导致所述融合蛋白的血药水平的至少两个连续C_max峰和/或C_min谷之间的时间增加至以类似剂量方案施用给受试者的未连接所述融合蛋白的所述融合蛋白的相应GP的至少3倍、或可选地至少4倍、或5倍、或6倍、或7倍、或8倍、或9倍、或至少 10倍、或至少20倍、或至少约30倍、或至少约50倍、或至少约100倍。在前述另一实施方案中，与使用治疗有效方案施用给受试者的未连接融合蛋白的相应生物活性蛋白组分相比，使用药物组合物的融合蛋白的较低频率给药或较低总剂量(以摩尔计)施用融合蛋白导致葡萄糖调节肽相关疾病的至少一个测量参数的改善。

本发明还提供了包含前述实施方案任何一个的融合蛋白的组合物在制备用于治疗有相应需要的受试者的疾病、疾患或病症的药剂中的用途。在前述一个实施方案中，所述疾病、疾患或病症选自但不限于青少年糖尿病、I型糖尿病、II型糖尿病、肥胖、急性低血糖、急性高血糖、夜间低血糖、慢性高血糖、胰高血糖素瘤、气道的分泌疾患、关节炎、骨质疏松症、中枢神经系统疾病、再狭窄、神经退行性疾病、肾衰竭、充血性心力衰竭、肾病综合症、肝硬化、肺水肿、高血压和其中需要减少食物摄取的疾患、中风、肠道易激综合症、心肌梗塞(例如，降低发病率和/或与其相关的发病率)、中风、急性冠状动脉综合征(例如，以Q波的缺乏为特征)心肌梗塞、术后代谢变化、冬眠心肌或糖尿病心肌病、尿钠排泄不足、尿钾浓度过高、与有毒高血容量有关的病症或疾患(例如，肾衰竭、充血性心力衰竭、肾病综合症、肝硬化、肺水肿和高血压)、多囊卵巢综合症、呼吸窘迫、肾病、左心室收缩功能障碍(例如，具有异常的左心室射血分数)、肠胃疾患诸如腹泻、术后倾倒综合症和肠道易激综合症(即，经由抑制胃窦十二指肠移行性)、危重病多发性神经病(CIPN)、血脂异常、局部缺血后血流再灌注引起的器官组织损伤，和冠心病危险因素(CHDRF)综合症，和任何其它使用非修饰的葡萄糖调节肽(例如exendin-4、GLP-1或胰高血糖素)的适应症，或任何其它可使用GP的适应症(但是受试者的内源性葡萄糖调节肽水平未必不足)。所公开的实施方案的任何一个可以根据感兴趣的应用而单独实施或者组合实施。

通过引用并入

在本说明书中提及的所有出版物、专利和专利申请在此通过引用的方式并入，其程度如同每个单独的出版物、专利或专利申请明确且单独地被指明而通过引用的方式并入。

附图简述

在所附权利要求中特别陈述了本发明的新颖特征。通过参考以下提出说明性实施方案的详细说明更好地理解本发明的特征和优势，其中利用了本发明的原理，并且其中附图为：

图1示出了全部以N端至C端方向描绘的示例性GPXTEN融合蛋白(图1A-H)的示意图。图1A示出GPXTEN融合蛋白(100)的两种不同构型，每种构型包含单个GP和XTEN，第一种构型具有与GP(103)的C端连接的XTEN分子(102)，并且第二种构型具有与GP(103)的N端连接的XTEN分子。图1B示出GPXTEN融合蛋白(100)的两种不同构型，每种构型包括单个GP、间隔区序列和XTEN，第一种构型具有与间隔区序列(104)的C端连接的XTEN分子(102)和与GP(103)的C端连接的间隔区序列，并且第二种构型具有与间隔区序列(104)的N端连接的XTEN分子和与GP(103)的N端连接的间隔区序列(104)。图1C示出GPXTEN融合蛋白(101)的两种不同构型，每种构型包含两个分子的单个GP和一个分子的XTEN，第一种构型具有与第一GP的C端连接的XTEN并且第一GP与第二GP的C端连接，且第二种构型处于相反方向，其中XTEN与第一GP的N端连接并且第一GP与第二GP的N端连接。图1D示出GPXTEN融合蛋白(101)的两种不同构型，每种构型包含两个分子的单个GP、间隔区序列和一个分子的XTEN，第一种构型具有与间隔区序列的C端连接的XTEN和与第一GP的C端连接的间隔区序列并且第一GP与第二GP的C端连接，且第二种构型处于相反方向，其中XTEN与间隔区序列的N端连接并且间隔区序列与第一GP的N端连接并且第一GP与第二GP的N端连接。图1E示出GPXTEN融合蛋白(101)的两种不同构型，每种构型包括两个分子的单个GP、间隔区序列和一个分子的XTEN，第一种构型具有与第一GP的C端连接的XTEN和与间隔区序列的C端连接的第一GP并且间隔区序列与第二GP分子的C端连接，且第二种构型处于相反构型，NTEN与第一GP的N端连接，第一GP与间隔区序列的N端连接，而间隔区序列与第二GP分子的N端连接。图1F示出GPXTEN融合蛋白(105)的构型，每种构型包含一个分子的GP和与该GP的N端和C端连接的两个分子的XTEN。图1G示出与两个XTEN连接的单个GP的构型(106)，其中第二XTEN通过间隔区序列与GP分开。图1H是与两个XTEN连接的两个GP的构型(106)，其中第二XTEN与第一GP的C端和第二GP的N端连接，第二GP在GPXTEN的C端。

图2是编码图1的相应GPXTEN多肽的GPXTEN基因的示例性多核苷酸构建体(图2A-H)的示意图；全部以5'至3'的方向描述。在这些说明性实例中，所述基因编码GPXTEN融合蛋白，该GPXTEN融合蛋白具有一个GP和XTEN(200)；或一个GP、一个间隔区序列和一个XTEN(200)；两个GP和一个XTEN(201)；或两个GP、间隔区序列和一个XTEN(201)；一个GP和两个XTEN(205)；或两个GP和两个XTEN(206)。在这些描绘中，多核苷酸编码以下组分：XTEN(202)、GP(203)和可以包含裂解序列(204)的间隔区氨基酸，所有序列在框内连接。

图3是两个示例性单体GPXTEN和该单体融合蛋白结合细胞表面靶受体的能力以及随后细胞信号转导的示意图。图3A示出由GP(103)和XTEN(102)组成的GPXTEN融合蛋白(100)和由与两个XTEN(105)连接的GP组成的第二GPXTEN融合蛋白(105)。图3B示出C末端具有GP的GPXTEN(100)和C末端具有XTEN的GPXTEN(105)与细胞表面(107)上GP的靶受体(108)的相互作用。在该情况下，当GP具有游离C端时表现出与受体的高亲和力结合，而具有C端XTEN的GPXTEN没有与受体紧密结合，并且解离，如图3C所示。图3D示出以高结合亲和力结合的GPXTEN(100)保持与受体(106)结合并且已经内化到细胞中的内体(110)，说明结合的GP的受体介导的清除并且引发细胞信号转导(109)，描绘为斑点状的细胞质。

图4是XTEN的组装、产生和评估中代表性步骤的示意流程图。

图5是编码融合蛋白的GP-XTEN多核苷酸构建体组装中代表性步骤的示意流程图。单个寡核苷酸501被退火成序列基序502，例如12氨基酸基序(“12-mer”)，其随后与含有BbsI和KpnI限制位点的寡聚体503连接。来自文库的其它序列基序与该12-mer退火，直到获得期望长度的XTEN基因504。将XTEN基因克隆到填充载体(stuffer vector)。该载体编码标志(Flag)序列506，随后是两侧具有BsaI、BbsI和KpnI位点的终止序列507和exendin-4(Ex4)基因508，得到编码XTEN-GP融合蛋白的基因500。

图6是在编码包含生物活性蛋白(GP)和XTEN的融合蛋白的基因的组装、其表达和作为融合蛋白回收、及其作为候选GPXTEN产物的评估中代表性步骤的示意流程图。

图7是使用不同的加工策略设计Ex4XTEN表达载体的示意图。图7A示出编码与生物活性蛋白Ex4编码序列的3'端融合的XTEN的示例性表达载体。注意，该载体中不需要额外的前导序列。图7B描绘了编码与Ex4编码序列的5'端融合的XTEN的表达载体，其具有CBD前导序列和TEV蛋白酶位点。图7C描绘了图7B中CBD和TEV加工位点被优化的N端前导序列(NTS)所替代的表达载体。图7D描绘了编码NTS序列、XTEN、Ex4编码序列和第二个XTEN编码序列的表达载体。

图8是包含与exendin-4(Ex4)编码序列连接的N端XTEN编码序列的GPXTEN基因的逐步构建，以及与XTEN的C端连接的144或288XTEN编码序列随后连接的示意图，如实施例18所描述。

图9示出包含GFP和XTEN序列的所示构建体的表达分析结果。使用荧光板读数器(激发395nm，发射510nm)分析表达培养物以测定GFP报告分子的存在量。结果以图表表示为框须图，指示虽然中值表达水平是“基准”CBD N端辅助结构域(helper domain)表达水平的大约一半，但来自文库的最佳克隆非常接近基准，表明围绕这些序列进一步优化是有保证的。结果还显示，从氨基酸MA起始的文库比从ME开始的那些具有更好的表达水平(参见实施例14)。

图10示出用于来自LCW546、LCW547和LCW552的克隆的N端序列中第三和第四密码子的三个随机文库，如实施例15所示。将文库设计为第三和第四残基被修饰而使得允许的XTEN密码子的所有组合存在于这些位置。为了使每个文库包含所有这些允许的XTEN密码子，设计具有第三和第四残基密码子多样性的编码12个氨基酸的9对寡核苷酸、使其退火并连接到NdeI/BsaI限制酶消化的填充载体pCW0551(填充片段-XTEN_AM875-GFP)，并转化入大肠杆菌BL21Gold(DE3)感受态细胞以获得三个文库LCW0569(DNA和蛋白质序列分别作为SEQ ID NO1338和1339公开)、LCW0570(DNA和蛋白质序列分别作为SEQ ID NO1340和1341公开)和LCW0571(DNA和蛋白质序列分别作为SEQ ID NO1342和1343公开)的菌落。

图11示出如实施例15所述优化步骤之后针对前75个克隆的GFP荧光信号的再测试的直方图，相对于基准CBD_AM875构建体。结果指示几个克隆目前优于基准克隆。

图12是为联合N端48个氨基酸的两个区域的密码子优化偏好而进行的重组方法的示意图，如实施例16所述。该方法在XTEN蛋白的N端产生新的48mer，用于评估表达优化，所述表达优化得到可能是XTEN蛋白表达的解决方案的前导序列，其中XTEN在GP的N端。

图13示出证实获自XTEN N端密码子优化实验的优选密码子表达的SDS-PAGE凝胶，与在构建体序列的N端包含CBD前导序列的基准XTEN克隆相比较。

图14示出来自与GFP的N端融合的融合蛋白XTEN_AE864的稳定性研究的样本的SDS-PAGE凝胶(参见实施例24)。使GFP-XTEN 在食蟹猴血浆和大鼠肾裂解物中于37℃下孵育达7天。此外，还评估了施用给食蟹猴的GFP-XTEN。在第0、1和7天提取样本并通过SDSPAGE分析，随后使用Western分析检测并使用抗GFP抗体检测。

图15示出证实与不同长度的XTEN(即Y288、Y144、Y72和Y36)融合的胰高血糖素的表达的SDS-PAGE凝胶，与分子量标准比较。

图16示出根据已知分子量的蛋白质标准品测量的胰高血糖素-XTEN构建体样本的尺寸排阻色谱分析的结果，其中图形输出为吸光度对保留体积，如实施例22所述。胰高血糖素-XTEN构建体是1)胰高血糖素-Y288；2)胰高血糖素Y-144；3)胰高血糖素-Y72；和4)胰高血糖素-Y36。结果指示表观分子量随着XTEN部分长度的增加而增加。

图17示出通过皮下和静脉内途径对食蟹猴施用的GPXTEN Ex4-AE864的药代动力学结果(实验详情参见实施例27)。

图18示出预测人响应于Ex4-XTEN_AE864的异速增长尺度律(allometricscaling)结果，基于四个动物物种(即，小鼠、大鼠、食蟹猴和犬)的测量结果，如实施例28所述。图18A示出测量的终末半衰期对体重，其中在人中预测的T1/2为139h。图18B示出测量的药物清除对体重，其中在人中预测的清除率值为30ml/h。图18C示出测量的分布体积对体重，在人中预测的值为5970ml。

图19示出Gcg-XTEN的生物物理表征和稳定性研究的结果(实验详情参见实施例21)。图19A是纯化蛋白质产物(泳道2)的SDS-PAGE分析。在泳道1示出分子量标准，在左侧标出相关大小的分子量标准。需注意，该分子的真实分子量是16305道尔顿(通过质谱分析法证实；未示出)。由于主要氨基酸构成的差异，在SDS-PAGE中相对于球蛋白标准品迁移慢是XTEN融合蛋白的特点。图19B示出胰高血糖素受体(GcgR)Ca2+-流量分析的结果，比较了Gcg-XTEN与未修饰胰高血糖素的功效。示出对于每个曲线拟合的计算的EC50。图19C示出反相C18HPLC分析的结果。图19D示出制备时纯化Gcg-XTEN构建体的尺寸排阻色谱法HPLC分析的结果。图19E示出反相C18HPLC分析的结果。图19F示出在-80℃、2-8℃或25℃存储6个月后Gcg-XTEN的尺寸排阻色谱法HPLC分析的结果，三条曲线都基本上重叠。

图20示出用胰高血糖素或Gcg-XTEN给药的犬中药效学研究的结果(实验详情参见实施例29)。分别以14或12nmol/kg将胰高血糖素(图20A)或Gcg-XTEN(图20B)注射到空腹比格犬中(每组n=4)，并且与安慰剂注射相比监测血糖水平，如图20C所示。示出相对于注射前基线的注射安慰剂、Gcg-XTEN或胰高血糖素(Gcg)后第一小时的血糖曲线下面积的差异(每组n=4-8只动物)。指示每组的剂量水平。

图21示出服用胰高血糖素或Gcg-XTEN并用胰岛素激发的犬中的药效学研究的结果以测试在犬中Gcg-XTEN是否赋予对胰岛素诱导的低血糖的暂时受控抗性(实验详情参见实施例30)。在实验开始前3小时使比格犬进食，并其后之后对其禁食。在时间=0时，使动物接受剂量为0.6nmol/kg的Gcg-XTEN或安慰剂(空心箭头)。在6小时(图21A)(以实心箭头指示)或初始剂量后12小时(图21B)(以实心箭头指示)，使动物(每组n=4)接受0.05U/kg胰岛素激发以诱导低血糖。图21C表示随着进食-睡眠-苏醒周期的对于人施用的假设时间线，意图使进食-睡眠-苏醒周期与剂量施用和该实验的实验设计相符合。

图22示出服用胰高血糖素或Gcg-XTEN_Y288(构建体1)的药效学实验的结果以测试禁食结束后在食蟹猴中该化合物抑制血糖增加的能力(实验详情参见实施例31)。图22A-C示出对三只个体食蟹猴施用安慰剂或Gcg-XTEN288后血糖曲线的重叠绘图。实心箭头标记对动物送回食物的时间(t=6小时)。

图23示出来自使用两种GPXTEN融合蛋白(即，胰高血糖素于Y288(Gcg-XTEN)连接和exendin-4与AE864(Ex4-XTEN)连接)的组合的药效学和代谢研究的体重结果以评估小鼠中饮食诱导的肥胖模型中该组合的功效。该图显示在28天持续药物施用的过程中饮食诱导的肥胖小鼠中体重的变化。所示出的值为每组10只动物的平均值+/-SEM(安慰剂组20只动物)。

图24示出来自小鼠中饮食诱导的肥胖模型中使用单独和两种GPXTEN融合蛋白(即，胰高血糖素与Y288(Gcg-XTEN)连接和exendin-4与AE864(Ex4-XTEN)连接)的组合的药效学和代谢研究的空腹血糖水平的变化(实验详情参见实施例26)。分组如下：第1组Tris媒介物；第2组Ex4-AE576，10mg/kg；第3组Ex4-AE576，20mg/kg；第4组媒介物，50%DMSO；第5组艾塞那肽(Exenatide),30μg/kg/天；第6组艾塞那肽，30uL/kg/天+Gcg-Y28820μg/kg；第7组Gcg-Y288，20μg/kg；第8组Gcg-Y288,40μg/kg；第9组Ex4-AE57610mg/kg+Gcg-Y28820μg/kg；第10组Gcg-Y28840μg/kg+Ex4-AE57620mg/kg。该图显示在28天持续药物施用的过程中饮食诱导的肥胖小鼠中空腹血糖水平的变化。所示出的值为每组10只动物的平均值+/-SEM(安慰剂组20只动物)。

图25示出28天持续的Gcg-XTEN和exendin-4单独或组合的药物施用后饮食诱导的肥胖小鼠中甘油三酯和胆固醇水平(实验详情参见实施例26)。所示出的值为每组10只动物的平均值+/-SEM。

图26示出食蟹猴中药代动力学研究的结果，测试了皮下或静脉内施用其中不同GFP组合物与XTEN连接的XTEN长度的作用，如实施例23所述。所述组合物是GFP-L288、GFP-L576、GFP-AF576、GFP-Y576和AD836-GFP。将结果提供为给药后血浆浓度对时间(h)。

图27示出如实施例34所述进行的Ex4-XTEN_AE864的近UV圆二色谱。

图28示出施用给食蟹猴的胰高血糖素-XTEN融合蛋白随时间的血药水平的结果，如实施例32所述。所述施用的GPXTEN是胰高血糖素-Y288、胰高血糖素-Y144和胰高血糖素-Y72。来自胰高血糖素-Y144给药的结果显示0-6小时内血药水平<3倍的变化，其中在10-12小时时血药水平从C_max降低到10x阈值以下。

图29示出体外细胞测定GLP-1活性的结果，比较了来自两个商业来源的exendin-4(闭合三角形)和与Y288连接的exendin-4(闭合正方形)，其中未处理的细胞(闭合菱形)用作阴性对照(实验详情参见实施例35)。用虚线表示EC50。

发明详述

在描述本发明实施方案之前，要理解，这些实施方案仅作为例子而提供，并且可以采用本文描述的本发明实施方案的各种替代方案来实施本发明。本领技术人员现在将可以想到不背离本发明的许多改变、变化和替代。

除非另外定义，本文使用的所有技术和科学术语具有与本发明所属领域普通技术人员所通常理解的相同的含义。尽管与本文描述的那些类似或等同的方法和材料可用于实施或测试本发明，但下面描述了合适的方法和材料。冲突时，以包括定义在内的本专利说明书为准。此外，材料、方法和实例仅是示例说明性的而不旨在限制。本领技术人员现在会想到不背离本发明的许多改变、变化和替代。

定义

除非另外规定，如本文使用的以下术语具有归属于它们的含义。

除非上下文另外清楚地指明，说明书和权利要求中使用的单数形式“一个”、“一种”和“该”包括复数指代物。例如，术语“一种细胞”包括多个细胞，包括其混合物。

术语“多肽”、“肽”和“蛋白质”在本文可互换使用，是指任何长度的氨基酸的聚合物。该聚合物可以是线性或分支的，其可以包含修饰的氨基酸，并且其间可以插入非氨基酸。这些术语还包括例如通过二硫键形成、糖基化、酯化、乙酰化、磷酸化或任何其它操作(例如与标记组分偶联)而被修饰的氨基酸聚合物。

本文使用的术语“氨基酸”指天然和/或非天然或合成的氨基酸，包括但不限于甘氨酸和D或L旋光异构体，以及氨基酸类似物和肽模拟物。使用标准的单字母或三字母密码指定氨基酸。

术语“天然L-氨基酸”表示以下氨基酸的L旋光异构体形式：甘氨酸(G)、脯氨酸(P)、丙氨酸(A)、缬氨酸(V)、亮氨酸(L)、异亮氨酸(I)、甲硫氨酸(M)、半胱氨酸(C)、苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)、组氨酸(H)、赖氨酸(K)、精氨酸(R)、谷氨酰胺(Q)、天冬酰胺(N)、谷氨酸(E)、天冬氨酸(D)、丝氨酸(S)和苏氨酸(T)。

应用于序列并在本文使用的术语“非天然存在的”指没有哺乳动物中发现的野生型或天然存在的序列的对应物、与哺乳动物中发现的野生型或天然存在的序列不互补、或与哺乳动物中发现的野生型或天然存在的序列不具有高度同源性的多肽或多核苷酸序列。例如，适当比对时，非天然存在的多肽可以与天然序列共享不超过99%、98%、95%、90%、80%、70%、60%、50%或甚至更低的氨基酸序列同一性。

术语“亲水性”和“疏水性”指物质具有的与水的亲和力程度。亲水性物质对水具有强亲和力，易于溶解于水、与水混合或被水润湿，而疏水性物质基本缺乏对水的亲和力，易于排斥水并不吸收水并且不易于溶解于水或与水混合或被水润湿。氨基酸可以根据其疏水性来表征。已经发展了许多量表。一个实例是由Levitt,M,等,J Mol Biol(1976)104:59发展的量表，其列于Hopp,TP,等,Proc Natl Acad Sci U S A(1981)78:3824。“亲水性氨基酸”的实例是精氨酸、赖氨酸、苏氨酸、丙氨酸、天冬酰胺和谷氨酰胺。特别关注的亲水性氨基酸是天冬氨酸、谷氨酸和丝氨酸和甘氨酸。“疏水性氨基酸”的实例是色氨酸、酪氨酸、苯丙氨酸、甲硫氨酸、亮氨酸、异亮氨酸和缬氨酸。

“片段”是保留至少一部分治疗活性和/或生物活性的天然生物活性蛋白的截短形式。“变体”是与天然生物活性蛋白具有序列同源性的蛋白质，保留了生物活性蛋白的至少一部分治疗活性和/或生物活性。例如，变体蛋白可以与参考生物活性蛋白共享至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的氨基酸序列同一性。本文使用的术语“生物活性蛋白部分”包括例如通过定点诱变、插入而有意修饰或通过突变而意外修饰的蛋白质。

“宿主细胞”包括可以是或已经是主题载体的受体的个体细胞或细胞培养物。宿主细胞包括单个宿主细胞的后代。由于天然、意外或有意的突变，后代不一定与原始亲代细胞完全相同(形态方面或者总DNA互补体的基因组方面)。宿主细胞包括用本发明的载体在体内转染的细胞。

当用于描述本文公开的各种多肽时，“分离的”指已经从其天然环境的组分鉴定和分离和/或回收的多肽。其天然环境的污染组分是通常会干扰所述多肽的诊断或治疗用途的材料，并且可以包括酶、激素和其它蛋白或非蛋白溶质。对于本领域技术人员明显的是，非天然存在的多核苷酸、肽、多肽、蛋白质、抗体或其片段不需要“分离”以使之与其天然存在的对应物相区分。此外，“浓缩的”、“分离的”或“稀释的”多核苷酸、肽、多肽、蛋白质、抗体或其片段可与其天然存在对应物相区分，因为浓度或每体积的分子数目一般大于其天然存在的对应物。一般而言，通过重组方式制备并在宿主细胞中表达的多肽被认为是“分离的”。

“分离的”多核苷酸或多肽编码核酸或其它多肽编码核酸是从所述多肽编码核酸的天然来源中正常伴随的至少一种污染核酸分子鉴定和分离的核酸分子。分离的多肽编码核酸不同于其天然存在的形式或环境。因此，分离的多肽编码核酸分子可与天然细胞中存在的特定多肽编码核酸分子相区分。然而，分离的多肽编码核酸分子包括正常表达所述多肽的细胞中含有的多肽编码核酸分子，此时，例如，核酸分子处于不同于天然细胞核酸分子的染色体内或者染色体外位置。

“嵌合”蛋白含有至少一个融合多肽，包含与天然存在不同的序列位置的区域。所述区域可以正常存在于不同的蛋白质中并且在融合多肽中汇集在一起；或者它们可以正常存在于相同的蛋白质中但在融合多肽中处于新的排列。嵌合蛋白可以通过例如化学合成或者通过产生并翻译其中肽区域以期望关系编码的多核苷酸来产生。

“偶联的”、“连接的”、“融合的”和“融合”在本文可互换使用。这些术语指通过包括化学偶联或重组方式在内的任何方式使两个或多个化学元素或组分结合在一起。例如，如果启动子或增强子影响编码序列的转录，则所述启动子或增强子与所述序列是可操作连接的。一般而言，“可操作连接”表示被连接的DNA序列是连续的，并且在阅读相内或框内。“框内融合”指两个或多个开放阅读框(ORF)以保持原始ORF正确阅读框的方式结合形成连续更长的ORF。因此，得到的重组融合蛋白是含有对应于由原始ORF编码的多肽的两个或多个片段的单个蛋白质(所述片段通常本质上不会如此结合)。

多肽上下文中，“线性序列”或“序列”是多肽中以氨基端至羧基端方向的氨基酸顺序，序列中彼此邻接的残基在多肽一级结构中是连续的。“部分序列”是已知在一个或两个方向包含额外残基的多肽的一部分的线性序列。

“异源的”指衍生自与进行比较的实体其余部分基因型不同的实体。例如，从其天然编码序列取出并可操作地与不同于天然序列的编码序列连接的富含甘氨酸序列是异源的富含甘氨酸序列。术语“异源的”应用于多核苷酸、多肽时指所述多核苷酸或多肽衍生自与进行比较的实体其余部分基因型不同的实体。

术语“多核苷酸”、“核酸”、“核苷酸”和“寡核苷酸”可互换使用。它们指任何长度的核苷酸的聚合体形式，所述核苷酸是脱氧核糖核苷酸或核糖核苷酸或其类似物。多核苷酸可以具有任何三维结构，并且可以发挥已知或未知的任何功能。以下是多核苷酸的非限制性实例：基因或基因片段的编码区或非编码区、通过连锁分析确定的基因座(基因座)、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。多核苷酸可以包括修饰的核苷酸，例如甲基化的核苷酸和核苷酸类似物。如果存在，对核苷酸结构的修饰可以在聚合物组装之前或之后进行。核苷酸序列中可以插入非核苷酸组分。多核苷酸可以在聚合之后进一步修饰，例如通过与标记组分的偶联。

术语“多核苷酸的互补体”表示与参考序列相比具有互补碱基序列和反方向的多核苷酸分子，使得互补体可以与具有完全保真性的参考序列杂交。

“重组的”应用至多核苷酸时指该多核苷酸是体外克隆、限制酶消化和/或连接步骤以及产生可能在宿主细胞中表达的构建体的其它程序的各种组合的产物。

术语“基因”或“基因片段”在本文可互换使用。它们指含有能够在被转录和翻译之后编码特定蛋白质的至少一个开放阅读框的多核苷酸。基因或基因片段可以是基因组或cDNA，只要该多核苷酸含有至少一个开放阅读框，该开放阅读框可以涵盖整体编码区或其片段。“融合基因”是由至少两个连接在一起的异源多核苷酸构成的基因。

“同源性”或“同源的”指两个或多个多核苷酸序列或两个或多个多肽序列之间的序列相似性或可互换性。当使用例如BestFit等程序来测定两个不同氨基酸序列之间的序列同一性、相似性或同源性时，可以使用缺省设置，或者可以选择适当的评分矩阵例如blosum45或blosum80来优化同一性、相似性或同源性评分。优选地，同源的多核苷酸是在本文定义的严格条件下杂交的那些序列并且与那些序列具有至少70%、或至少80%、或至少90%、或95%、或97%、或98%或99%序列同一性。

“连接”指在两个核酸片段或基因之间形成磷酸二酯键而使它们连接在一起的过程。为了使DNA片段或基因连接在一起，DNA末端必须彼此相容。在一些情况下，末端在核酸内切酶消化之后即是相容的。然而，可能必须首先将通常由核酸内切酶消化后产生的交错末端转化成平末端以使它们适合连接。

术语“严格的条件”或“严格的杂交条件”包括提及多核苷酸将以比其它序列可检测地更大程度(例如，超过背景至少2倍)与其靶序列杂交的条件。一般而言，杂交的严格性部分地参考进行洗涤步骤的温度和盐浓度来表示。通常，严格条件是如下条件：其中pH7.0至8.3下的盐浓度小于约1.5M Na离子、通常约0.01至1.0M Na离子浓度(或其它盐)，并且温度对于短的多核苷酸(例如，10至50个核苷酸)是至少约30℃并且对于长的多核苷酸(例如，大于50个核苷酸)是至少约60℃—例如，“严格的条件”可以包括在37℃下50%甲酰胺、1MNaCl、1%SDS中杂交，以及在0.1×SSC/1%SDS中于60至65℃下三次洗涤，每次15分钟。可选地，可以使用约65℃、60℃、55℃或42℃的温度。SSC浓度可以从约0.1至2×SSC变化，其中SDS以约0.1%存在。这种洗涤温度通常被选择为比确定离子强度和pH下特定序列的热力学熔点低约5℃至20℃。Tm是50%的靶序列与完美匹配的探针杂交时的温度(在确定的离子强度和pH下)。计算Tm的方程和核酸杂交条件是熟知的并且可以参见Sambrook,J.等(1989)Molecular Cloning:A Laboratory Manual,第2版,第1-3卷,Cold Spring Harbor Press,Plainview N.Y.；特别参见第2卷第9章。通常，使用阻断试剂来阻断非特异性杂交。这种阻断试剂包括例如约100-200μg/ml的经剪切和变性的鲑鱼精子DNA。在特定情况下，例如对于RNA:DNA杂交，还可以使用有机溶剂，例如浓度约35-50%v/v的甲酰胺。对这些洗涤条件的有用改变对于本领域普通技术人员而言是明显的。

术语“百分比同一性”和“%同一性”应用于多核苷酸序列时指使用标准化算法比对的至少两个多核苷酸序列之间的残基匹配百分比。这种算法可以标准化且可重复的方式在被比较的序列中插入空位以优化两个序列之间的比对，并因此实现两个序列的更有意义的比较。可以对整体确定的多核苷酸序列长度(例如，如由特定的SEQ ID号所确定)测量百分比同一性，或者可以对较短长度例如对获自较大的确定的多核苷酸序列的片段长度测量百分比同一性，所述片段例如是至少45、至少60、至少90、至少120、至少150、至少210或至少450个连续残基的片段。这些长度仅是示例性的，并且要理解，本文、表格、附图或序列表中示出的序列所支持的任何片段长度可以被用来描述可被测量百分比同一性的长度。

有关本文鉴定的多肽序列的“百分比(%)氨基酸序列同一性”被定义为：比对序列并引入空位(如果必要)以实现最大百分比序列同一性并且不将任何保守取代视为序列同一性的一部分，询问序列中与另一个参考多肽序列或其部分的氨基酸残基相同的氨基酸残基百分比。旨在测定百分比氨基酸序列同一性的比对可以本领域技术中的各种方式实现，例如使用公开可获得的计算机软件，例如BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)软件。本领域技术人员可以确定用于测量比对的适当参数，包括对被比较的序列的全长实现最大比对所需的任何算法。可以对整体确定的多肽序列长度(例如，如由特定的SEQ ID号所确定)测量百分比同一性，或者可以对较短长度例如对获自较大的确定的多肽序列的片段长度测量百分比同一性，所述片段例如至少15、至少20、至少30、至少40、至少50、至少70或至少150个连续残基的片段。这些长度仅是示例性的，并且要理解，本文、表格、附图或序列表中显示的序列所支持的任何片段长度可以被用来描述可被测量百分比同一性的长度。

本文多肽上下文中使用的术语“非重复性”指在肽或多肽序列中缺乏或有限程度的内部同源性。例如，术语“基本上非重复的”可以指例如序列中很少或没有四个连续氨基酸是相同的氨基酸类型，或者多肽具有10或更小的子序列评分(下文定义)，或者没有构成多肽序列的序列基序从N端至C端顺序的模式。本文多肽上下文中使用的术语“重复性”指肽或多肽序列中内部同源性程度。相反，“重复的”序列可以含有短氨基酸序列的多个相同拷贝。例如，目标多肽序列可以被分成n-mer序列，并且相同序列的数目可以被计数。高度重复的序列含有大比例的相同序列，而非重复的序列含有很少的相同序列。在多肽上下文中，序列可以含有确定或可变长度的较短序列或基序的多个拷贝，其中基序本身具有非重复序列，使全长多肽是基本上非重复的。其中测量非重复性的多肽长度可以是3个氨基酸至约200个氨基酸、约6至约50个氨基酸、或约9至约14个氨基酸。多核苷酸序列的上下文中使用的“重复性”指序列内部同源性程度，例如，给定长度的相同核苷酸序列的频率。重复性可以例如通过分析相同序列的频率来测量。

“载体”是优选在适当宿主中自我复制的核酸分子，其将插入的核酸分子转到宿主细胞中和/或在宿主细胞之间。该术语包括主要功能是将DNA或RNA插入细胞的载体，主要功能是复制DNA或RNA的复制载体，以及功能是转录和/或翻译DNA或RNA的表达载体。还包括提供不止一种上述功能的载体。“表达载体”是被引入适当宿主细胞时可以被转录并翻译成多肽的多核苷酸。“表达系统”通常表示包含可以用于产生期望的表达产物的表达载体的适合的宿主细胞。

“血清降解抗性”应用于多肽时指多肽在血液或其组分中抵抗降解的能力，血清或血浆中通常包括蛋白酶。血清降解抗性可以通过使蛋白质与人(或视情况为小鼠、大鼠、猴)血清或血浆通常在约37℃混合通常一定天数(例如0.25、0.5、1、2、4、8、16天)来测量。可对这些时间点的样本进行蛋白质印迹分析，并使用抗体检测蛋白质。抗体可以针对蛋白中的标签。如果蛋白质在印迹(western)上显示单条带，其中蛋白质大小与注射蛋白质大小相同，则没有发生降解。在该示例性方法中，通过蛋白质印迹或等效技术判断50%蛋白被降解的时间点是蛋白质的血清降解半衰期或“血清半衰期”。

本文使用的术语“t_1/2”指终末半衰期，计算为ln(2)/K_el。K_el是通过log浓度对时间曲线的终末线性部分的线性回归而计算的终末消除速率常数。半衰期通常指活生物体中储存的施用物质的半数被正常生物过程代谢或消除所需的时间。术语“t_1/2”、“终末半衰期”、“消除半衰期”和“循环半衰期”在本文可互换使用。

“表观分子量因子”或“表观分子量”是相关术语，指特定氨基酸序列表现出的表观分子量的相对增加或降低的量度。表观分子量使用尺寸排阻色谱(SEC)和类似方法与球状蛋白标准品相比较来测定，并且以“表观kD”单位来度量。表观分子量因子是表观分子量和实际分子量之间的比率；后者通过基于氨基酸组成而加合组成中每种氨基酸的计算分子量来预测。

“流体动力学半径”或“Stokes半径”是分子在溶液中的有效半径(R_h，以nm计)，通过假设它是穿过溶液并受溶液粘性抵抗的主体来测量。在本发明的实施方案中，XTEN融合蛋白的流体动力学半径测量与‘表观分子量因子’相关联，表观分子量因子是更直观的量度。蛋白质的“流体动力学半径”影响其在水溶液中的扩散速率以及其在大分子凝胶中迁移的能力。蛋白质的流体动力学半径由其分子量以及其结构(包括形状和致密度)决定。测定流体动力学半径的方法是本领域熟知的，例如通过使用尺寸排阻色谱(SEC)，如美国专利No.6,406,632和No.7,294,513所述。大多数蛋白质具有球形结构，这是蛋白质在最小流体动力学半径下可以具有的最致密的三维结构。一些蛋白质具有随机和开放的非结构化或‘线性’构象，因此与类似分子量的典型球形蛋白质相比具有大得多的流体动力学半径。

“生理条件”指活宿主中的一组条件以及模拟活受试者那些条件的体外条件，包括温度、盐浓度、pH。已经确立了用于体外分析的许多生理相关条件。一般而言，生理缓冲液包含生理浓度的盐并且被调节至中性pH，范围从约6.5至约7.8，并且优选约7.0至约7.5。许多生理缓冲液列于Sambrook等(1989)。生理相关温度范围从约25 ℃至约38℃并且优选约35℃至约37℃。

“反应基”是可以与另一反应基偶联的化学结构。反应基的实例是氨基、羧基、巯基、羟基、醛基、叠氮基。一些反应基可以被活化以促进与另一反应基的偶联。活化的实例是羧基与碳二亚胺反应，羧基转化为活化的酯，或者羧基转化为叠氮化物官能。

“控释剂”、“缓释剂”、“贮库制剂”或“持续释放剂”可互换使用，指与多肽在缺乏这些物质而施用时的释放持续时间相比能够延长本发明多肽释放持续时间的物质。本发明的不同实施方案可以具有不同的释放速率，导致不同的治疗量。

术语“抗原”、“靶抗原”或“免疫原”在本文可互换使用，指抗体片段或基于抗体片段的治疗剂与之结合或对之具有特异性的结构或结合决定簇。

本文使用的术语“有效负载”指具有生物活性或治疗活性的蛋白质或肽序列；小分子药效团的对应物。有效负载的实例包括但不限于细胞因子、酶、激素和血液和生长因子。有效负载还可以包含基因融合或化学偶联的部分，例如化疗剂、抗病毒化合物、毒素或造影剂。这些偶联部分可以通过连接子与多肽其余部分连接，所述连接子可以是可裂解的或不可裂解的。

本文使用的术语“拮抗剂”包括部分或完全阻断、抑制或中和本文公开的天然多肽的生物活性的任何分子。用于鉴定多肽拮抗剂的方法可以包括使天然多肽与候选拮抗剂分子接触并测量通常与天然多肽相关的一种或多种生物活性的可检测的变化。在本发明上下文中，拮抗剂可以包括蛋白质、核酸、糖类、抗体或降低生物活性蛋白效应的任何其它分子。

术语“激动剂”以最广泛的含义使用并且包括模拟本文公开的天然多肽的生物活性的任何分子。适合的激动剂分子具体包括激动剂抗体或抗体片段、天然多肽的片段或氨基酸序列变体、肽、小有机分子等。用于鉴定天然多肽的激动剂的方法可以包括使天然多肽与候选激动剂分子接触并测量通常与天然多肽相关的一种或多种生物活性的可检测的变化。

“活性”出于本文目的指融合蛋白组分与相应的天然生物活性蛋白一致的作用或效应，其中“生物活性”指体外或体内生物功能或效应，包括但不限于受体结合、拮抗剂活性、激动剂活性或细胞或生理反应。

本文使用的“治疗(treatment)”或“治疗(treating)”或“减轻(palliating)”或“缓解(ameliorating)”在本文可互换使用。这些术语指获得包括但不限于治疗益处和/或预防益处的有益或期望结果的方法。所谓治疗益处是指被治疗的潜在疾患的消除或缓解。而且，随着与潜在疾患相关的一种或多种生理症状的消除或缓解使得在受试者中观察到改善而实现治疗益处，尽管受试者可能依然受累于所述潜在疾患。为了预防益处，组合物可以被施用给处于发展特定疾病风险的受试者或者报告了疾病的一种或多种生理症状的受试者，尽管可能还未做出该疾病的诊断。

本文使用的“治疗效果”指生理效应，包括但不限于人或其它动物中疾病的治愈、缓和、缓解或预防，或者指除此以外增强人或动物的生理或精神状态，这是由本发明融合多肽而非诱导生成针对生物活性蛋白具有的抗原表位的抗体的能力引起的。治疗有效量的确定在本领域技术人员能力范围内，特别是根据本文提供的详细公开内容。

本文使用的术语“治疗有效量”和“治疗有效剂量”指单独或作为融合蛋白组合物的一部分的生物活性蛋白的量，所述生物活性蛋白一次或重复剂量施用给受试者时能够对疾病状态或病症的任何症状、方面、测量参数或特征具有任何可检测的有益效应。这种效应不一定绝对是有益的。

本文使用的术语“治疗有效剂量方案”指单独或作为融合蛋白组合物的一部分的生物活性蛋白的连续施用剂的计划表，其中所述剂以治疗有效量给予以对疾病状态或病症的任何症状、方面、测量参数或特征产生持续有益的效应。

I)一般技术

除非另外指出，本发明实践采用本领域技术范围内的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术。参见Sambrook,J.等,“Molecular Cloning:A Laboratory Manual,”第3版,Cold Spring Harbor LaboratoryPress,2001；“Current protocols in molecular biology”,F.M.Ausubel,等编辑,1987；系列“Methods in Enzymology,”Academic Press,San Diego,CA.；“PCR2:a practicalapproach”,M.J.MacPherson,B.D.Hames和G.R.Taylor编辑,Oxford University Press,1995；“Antibodies,a laboratory manual”Harlow,E.和Lane,D.编辑,Cold SpringHarbor Laboratory,1988；“Goodman&Gilman’s The Pharmacological Basis ofTherapeutics,”第11版,McGraw-Hill,2005；和Freshney,R.I.,“Culture of AnimalCells:A Manual of Basic Technique,”第4版,John Wiley&Sons,Somerset,NJ,2000，这些参考文献的全部内容通过引用的方式并入本文。

II)葡萄糖调节肽

本发明部分涉及包含葡萄糖调节肽(GP)的融合蛋白组合物。这类组合物可用于治疗或预防与葡萄糖稳态、肥胖、胰岛素抗性、血脂异常、高血压等相关的某些疾病、疾患或病症。

在大多数发达国家，内分泌和肥胖相关疾病或疾患已经达到显著的比例，并且在大多数发达国家代表大量且增加的保健负担，这些疾病或疾患包括影响身体器官、组织和循环系统的多种病症。特别关注的是内分泌和肥胖相关疾病和疾患。这些疾病中主要的是糖尿病，它是在美国死亡的主导原因之一。将糖尿病分为两个主要子类-I型，也称为青少年糖尿病或胰岛素依赖性糖尿病(IDDM)，和II型，也称为成年发病型糖尿病或非胰岛素依赖性糖尿病(NIDDM)。I型糖尿病是自身免疫疾病的一种形式，其完全或部分破坏这类受试者中胰腺的胰岛素产生细胞，并且在他们生命期中需要使用外源性胰岛素。甚至在控制良好的受试者中也可发生复发性并发症，其中一些是危及生命的。

在II型糖尿病中，进食后升高的血糖水平不能适当地刺激由胰腺产生胰岛素。另外，周围组织一般对胰岛素的作用有抗性，并且这类受试者通常具有比正常更高的血浆胰岛素水平(高胰岛素血症)，因为身体试图克服其胰岛素抗性。在晚期疾病状态中，胰岛素分泌也受损。

胰岛素抗性和高胰岛素血症还与两种造成相当的健康风险其它的代谢失调相关：葡萄糖耐受不良和代谢性肥胖。葡萄糖耐受不良以进食前葡萄糖水平正常，而进食后趋于升高的水平(高血糖)为特征。这些个体被认为处于糖尿病和冠状动脉疾病的较高风险。肥胖也是称为胰岛素抗性综合症或“X综合症”(和高血压一样)的病症组群、冠状动脉疾病(动脉硬化)和乳酸酸中毒以及相关病况的风险因素。认为肥胖的致病原因是多因素的，但是一个潜在的问题是在肥胖中直到有过量的脂肪组织才使营养物可用性和能量消耗平衡。其它相关的疾病或疾患包括但不限于妊娠糖尿病、青少年糖尿病、肥胖、食欲过盛、饱腹感不足、代谢失调、胰高血糖素瘤、视网膜神经变性过程和I型糖尿病的“蜜月期”。

血脂异常经常发生于糖尿病中，通常以血液中升高的血浆甘油三酯、低HDL(高密度脂蛋白)胆固醇、正常至升高水平的LDL(低密度脂蛋白)胆固醇和增加水平的低密度LDL微粒为特征。血脂异常是糖尿病受试者中冠状动脉疾病和死亡的发生率增加的主要贡献者。

葡萄糖稳态和胰岛素响应中的大多数代谢过程受多种肽和激素的调节，并且许多这类肽和激素以及其类似物已经用于治疗代谢疾病和疾患。甚至当它们具有相反的生物功能时，这些肽中的许多仍相互之间趋于同源。葡萄糖增加肽通过肽激素胰高血糖素来例证，而葡萄糖降低肽包括exendin-4、胰高血糖素样肽1和胰岛淀粉样肽(amylin)。然而，使用治疗肽和/或激素(甚至当通过使用小分子药物增强时)在治疗这类疾病、疾患和病症方面取得有限的成功。特别是，剂量优化对于用于治疗代谢疾病的药物和生物制剂(尤其是具有窄治疗窗的那些)是重要的。参与葡萄糖稳态的激素(一般)和肽通常具有窄治疗窗。窄治疗窗连同这类激素和肽通常具有短半衰期(这使得需要频繁给药以达到临床益处)的事实导致治疗这类患者的困难。虽然对治疗蛋白的化学修饰(诸如聚乙二醇化)可改变其体内清除率和随后的血清半衰期，但这需要另外的制造步骤并产生不均一的最终产物。另外，已经报道了由长期施用引起的不可接受的副作用。任选地，通过将Fc结构域与治疗蛋白或肽融合的基因修饰增加了治疗蛋白的尺寸(这降低经由肾脏的清除率)，并促进通过FcRn受体从溶酶体的循环。不幸的是，Fc结构域未能在重组体表达期间有效折叠且易于形成称为包涵体的不溶性沉淀。这些包涵体必须被溶解且功能蛋白必须被复性；这是耗时、低效且昂贵的过程。

因此，本发明的一方面是将参与葡萄糖稳态、胰岛素抗性和肥胖的肽(统称为“葡萄糖调节肽”)并入GPXTEN融合蛋白以产生可用于治疗葡萄糖、胰岛素和肥胖疾患、疾病和相关病症(本文称作“葡萄糖调节肽相关疾病、疾患或病症”)的组合物。葡萄糖调节肽可包括具有生物、治疗或预防益处或功能的任何蛋白质，所述蛋白质用于预防、治疗、调节或改善葡萄糖稳态或胰岛素抗性或肥胖疾病、疾患或病症。可与XTEN连接以产生GPXTEN的合适的葡萄糖调节肽包括所有生物活性多肽，所述生物活性多肽增加通过胰腺β细胞的葡萄糖依赖性胰岛素分泌或增强胰岛素的作用或在葡萄糖稳态中发挥作用。葡萄糖调节肽还可包括在胰腺β细胞中刺激胰岛素原基因转录的所有生物活性多肽。而且，葡萄糖调节肽还可包括减缓胃排空和减少食物摄取的所述生物活性多肽。葡萄糖调节肽还可包括抑制胰高血糖素从胰岛α细胞的释放的所有生物活性多肽。表1提供了由本发明的GPXTEN融合蛋白所包含的葡萄糖调节肽的序列的非限制性列表。本发明GPXTEN组合物的葡萄糖调节肽可以是显示与选自表1的蛋白质序列具有至少约80%序列同一性，或任选地81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的肽。

表1:来自动物物种的葡萄糖调节肽

“胰岛淀粉样肽”是指如美国专利No.5,234,906所述称作胰岛淀粉样肽、普兰林肽(pramlintide)和其种类变体的人肽激素，具有天然胰岛淀粉样肽的至少一部分生物活性。胰岛淀粉样肽是由胰腺β细胞响应于营养物摄取与胰岛素共分泌的37个氨基酸的多肽激素(Koda等，Lancet339:1179-1180.1992)，并已报道介导碳水化合物代谢的多个关键途径，包括将葡萄糖并入糖原。本发明的含有胰岛淀粉样肽的融合蛋白可在糖尿病和肥胖中特别用于调节胃排空、抑制胰高血糖素分泌和食物摄取，从而影响循环中的葡萄糖的出现率。因此，融合蛋白可补充胰岛素的作用，胰岛素调节葡萄糖从循环中的消失率和其被周围组织的摄取。如美国专利No.5,686,411和No.7,271,238所述，已克隆了胰岛淀粉样肽类似物。可产生保留生物活性的胰岛淀粉样肽模拟物。例如，普兰林肽的序列为KCNTATCATNRLANFLVHSSNNFGPILPPTNVGSNTY(SEQ ID NO:12)，其中将来自大鼠胰岛淀粉样肽序列的氨基酸取代为人胰岛淀粉样肽序列中的氨基酸。在一个实施方案中，本发明涵盖包含序列为KCNTATCATX₁RLANFLVHSSNNFGX₂ILX₂X₂TNVGSNTY(SEQ ID NO:13)的胰岛淀粉样肽模拟物的融合蛋白，其中X₁独立地为N或Q，且X₂独立地为S、P或G。在一个实施方案中，并入GPXTEN的胰岛淀粉样肽模拟物的序列为KCNTATCATNRLANFLVHSSNNFGGILGGTNVGSNTY(SEQID NO:14)。在另一个实施方案中，其中在GPXTEN的C端使用胰岛淀粉样肽模拟物，所述模拟物的序列为KCNTATCATNRLANFLVHSSNNFGGILGGTNVGSNTY(NH2)(SEQ ID NO:15)

“Exendin-3”是指从墨西哥毒蜥(Heloderma horridum)分离的葡萄糖调节肽和具有天然exendin-3的至少一部分生物活性的其序列变体。exendin-3酰胺是特殊的exendin受体拮抗物由其介导胰腺cAMP增加和胰岛素和胰岛淀粉样肽的释放。本发明的含有exendin-3的融合蛋白可特别用于治疗糖尿病和胰岛素抗性疾患。在美国专利5,4242,86中描述了用于其测定的序列和方法。

“Exendin-4”是指在希拉毒蜥(Gila-monster Heloderma suspectum)的唾液中发现的葡萄糖调节肽，以及其种类和序列变体，并且包括天然的39个氨基酸序列 His-Gly-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Leu-Ser-Lys-Gln-Met-Glu-Glu-G lu-Ala-Val-Arg-Leu-Phe-Ile-Glu-Trp-Leu-Lys-Asn-Gly-Gly-Pro-Ser-Ser-Gly-Ala-Pro-Pro-Pro-Ser(SEQID NO:16)和其同源序列和肽模拟物和变体；天然序列(如来自灵长类)和具有天然exendin-4的至少一部分生物活性的非天然序列。exendin-4是降低血糖、促进胰岛素分泌、减缓胃排空和提高饱腹感的肠促胰岛素多肽激素，它提供餐后高血糖的显著改善。exendin与胰高血糖素样肽家族的成员具有一定的序列相似性，其中最高的同一性是与GLP-1(Goke等,J.Biol.Chem.,268:19650-55(1993))。多种同源序列可在功能上与天然exendin-4和GLP-1相当。来自不同物种的GLP-1序列的保守提供在Regulatory Peptides200198卷第1-12页。表2示出来自多个物种的序列，而表3示出合成GLP-1类似物的列表，所有这些预期用作本文所述GPXTEN中的葡萄糖调节肽。exendin-4在胰岛素分泌βTC1细胞上结合GLP-1受体，并且还刺激生长激素抑制素释放和抑制隔离的胃中胃泌素释放(Goke等，J.Biol.Chem.268:19650-55,1993)。作为GLP-1的模拟物，exendin-4显示类似的宽范围的生物活性，但具有比GLP-1更长的半衰期，其中平均终末半衰期为2.4h。艾塞那肽是exendin-4的合成形式，以Byetta销售。然而，由于其短的半衰期，艾塞那肽当前以每天两次给药，因此限制了其效用。本发明的含有exendin-4的融合蛋白可特别用于治疗糖尿病和胰岛素抗性疾患。

“胰高血糖素”是指人胰高血糖素葡萄糖调节肽或其种类或序列变体，包括天然29个氨基酸的序列和同源序列；天然序列(诸如来自灵长类)和具有天然胰高血糖素的至少一部分生物活性的非天然序列变体。如本文所用的术语“胰高血糖素”还包括胰高血糖素的肽模拟物。天然胰高血糖素由胰腺产生，当血糖水平开始下降太低时释放，导致肝脏将储存的糖原转化成葡萄糖并将其释放到血流中。胰高血糖素的作用与胰岛素的作用相反，这引起身体细胞从血液中吸收葡萄糖，而胰高血糖素还刺激胰岛素的释放，因此血流中新近可用的葡萄糖可被吸收并被胰岛素依赖性组织所利用。本发明的含有胰高血糖素的融合蛋白可特别用于增加具有显著肝糖原存储的个体的血糖水平和维持糖尿病中的葡萄糖稳态。如美国专利No.4,826,763所述，已经克隆了胰高血糖素。

“GLP-1”是指人胰高血糖样肽1和具有天然GLP-1的至少一部分生物活性的其序列变体。术语“GLP-1”包括人GLP-1(1-37)、GLP-1(7-37)和GLP-1(7-36)酰胺。GLP-1刺激胰岛素分泌，但仅在高血糖期间。经由这一性质和经由所分泌的胰岛素的量与高血糖的量级成比例的观察增强GLP-1相比于胰岛素的安全性。GLP-1(7-37)OH的生物半衰期仅为3至5分钟(美国专利No.5,118,666)。本发明的含有GLP-1的融合蛋白可特别用在糖尿病和胰岛素抗性疾患的治疗中用于葡萄糖调节。如美国专利No.5,118,666所述，已经克隆了GLP-1并制备了衍生物。表2示出来自多个物种的GLP-1序列的非限制性实例，而表3示出多个合成GLP-1类似物的序列，所有这些预期用作本文所述GPXTEN组合物中的葡萄糖调节肽。

表2:天然GLP-1同系物

可通过若干以下提供的序列基序来描述GLP天然序列。括号中的字母表示在每个序列位置处可接受的氨基酸：[HVY][AGISTV][DEHQ][AG][ILMPSTV][FLY][DINST][ADEKNST][ADENSTV][LMVY][ANRSTY][EHIKNQRST][AHILMQVY][LMRT][ADEGKQS][ADEGKNQSY][AEIKLMQR][AKQRSVY][AILMQSTV][GKQR][DEKLQR][FHLVWY][ILV][ADEGPIKNQRST][ADEGNRSTW][GILVW][AIKLMQSV][ADGIKNQRST][GKRSY]。另外，GLP-1的合成类似物和普兰林肽可用作XTEN的融合配偶体以产生生物活性用于治疗葡萄糖相关疾患的GPXTEN。在表3中可发现合成GLP-1和普兰林肽序列的非限制性实例。另外，可通过标准的同源性检索技术发现与GLP-1、普兰林肽同源的其它序列，以及与exendin-4、胰岛淀粉样肽或胰高血糖素同源的序列。

表3：GLP-1和普兰林肽合成类似物

“GLP-2”是指人胰高血糖素样肽2和具有天然GLP-2的至少一部分生物活性的其序列变体。更具体地，GLP-2是33个氨基酸的肽，与GLP-1一起从小肠和大肠中的肠内分泌细胞共分泌。

III)葡萄糖调节肽融合蛋白组合物

本发明部分涉及包含葡萄糖调节肽(GP)的融合蛋白组合物。一方面，本发明提供了GP的分离的单体融合蛋白，包含与延伸的重组多肽(“XTEN”或“XTEN”)共价连接的GP的全长序列或序列变体。如下文更全面描述，融合蛋白任选地包含间隔区序列，所述间隔区序列还包含裂解序列以在蛋白酶作用时从融合蛋白释放GP，使GP从XTEN序列释放。

在一些情况下，本发明提供了分离的融合蛋白，包含与一个或多个延伸的重组多肽(“XTEN”)共价连接的至少第一生物活性葡萄糖调节肽，得到葡萄糖调节肽-XTEN融合蛋白组合物(下文“GPXTEN”)。在其它情况中，与一个或多个XTEN连接的葡萄糖调节肽是非活性的或具有降低的活性，其可任选地包含间隔区序列，所述间隔区序列还包括裂解序列以在受更具活性的蛋白酶作用时从融合蛋白释放GP。

本文使用的术语“GPXTEN”意在涵盖包含一个或多个有效负载区和至少一个其它区的融合多肽，每个有效负载区包括介导与葡萄糖调节肽相关的一种或多种生物活性或治疗活性的生物活性GP，所述其它区包含用作载体的至少第一XTEN多肽。

主题组合物的GP，特别是表1中公开的那些，以及其相应的核酸和氨基酸序列是本领域熟知的，并且描述和序列可获自公开数据库例如Chemical Abstracts ServicesDatabases(例如，CAS登记)、GenBank、The Universal Protein Resource(UniProt)和订购数据库例如GenSeq(例如,Derwent)。多核苷酸序列可以是编码给定GP的野生型多核苷酸序列(例如，全长或成熟的)，或者在一些情况下，序列可以是野生型多核苷酸序列的变体(例如，编码野生型生物活性蛋白的多核苷酸，其中多核苷酸的DNA序列已经例如为在特定物种中表达而被优化；或者编码野生型蛋白变体的多核苷酸，例如定点突变体或等位基因变体。技术人员完全有能力使用本领域公知的方法和/或结合本文提供以及在实施例中更全面描述的指导和方法利用GP的野生型或共有的cDNA序列或密码子优化变体来产生本发明涵盖的GPXTEN构建体。

纳入本发明GPXTEN的GP包括具有生物、治疗、预防或诊断益处或功能或者用于调节或预防或缓解与葡萄糖调节肽缺乏或受试者对一种或多种GP的敏感性缺陷相关的疾病、疾患或病症的任何葡萄糖调节肽或序列变体。特别关注的是GPXTEN融合蛋白组合物，寻求其与天然GP相比提高的药代动力学参数、增加的溶解度、增加的稳定性或一些其它增强的药学性质，或者增加终末半衰期将提高效力、安全性或导致减少给药频率和/或改善患者依从性。因此，考虑各种目的而制备GPXTEN融合蛋白组合物，包括通过以下方式提高生物活性GP的治疗效力：例如与未连接XTEN的GP相比，在施用给受试者时，增加体内暴露或GPXTEN在治疗窗内维持的时长。

在一个实施方案中，加入主题组合物的GP可以是具有对应于天然存在蛋白质的序列的重组多肽。在另一实施方案中，GP可以是天然序列的序列变体、片段、同源物或模拟物，其保留了天然GP的至少一部分生物活性。在一些情况中，用于并入本发明的GPXTEN的GP可以是显示与选自表1、表2和表3的序列的蛋白质序列具有至少约80%序列同一性、或可选地81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或至少约99%或100%序列同一性的序列。在一个实施方案中，GPXTEN融合蛋白可包含与XTEN连接的单个GP分子(如下文更全面描述)。在另一实施方案中，GPXTEN可包含第一个GP和相同GP的第二个分子，得到包含与一个或多个XTEN连接的两个GP(例如，或两个分子的GLP-1)的融合蛋白。在另一实施方案中，GPXTEN融合蛋白可包含与第一和第二XTEN连接的单个GP分子，具有XTEN-GP-XTEN的N端至C端构型，其中GP可以是显示与选自表1、表2和表3的序列的蛋白质序列具有至少约80%序列同一性、或可选地81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或至少约99%或100%序列同一性的序列，并且第一和/或第二XTEN可以是显示与选自表5的序列的序列具有至少约80%序列同一性、或可选地81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或至少约99%或100%序列同一性的序列。

一般而言，当体内使用或者当用于体外分析时，GPXTEN的GP融合配偶体组分将表现出对给定靶标的结合特异性或者另一期望的生物特征。例如，GPXTEN可以是激动剂，具有结合葡萄糖调节肽的细胞受体的能力。在一个实施方案中，与未连接XTEN的相应天然葡萄糖调节肽相比，GPXTEN与其受体的结合可导致细胞间信号转导途径的至少部分活化。在一个实施方案中，与未连接XTEN的天然葡萄糖调节肽相比，与葡萄糖调节肽的细胞受体结合的GPXTEN可表现出细胞间信号转导途径的至少约1%、或约5%、或约10%、或约15%、或约20%、或约25%、或约30%、或约40%、或约50%、或约60%、或约70%、或约80%、或约90%、或至少约95%的活化。

本发明主题GPXTEN可表现出一个或多个药代动力学参数的增强，其任选地通过间隔区序列裂解引起的GP从融合蛋白释放来增强生物效应。具有增强的药代动力学参数的GPXTEN将允许较低频率的给药或增强的药理效应，例如但不限于使生物活性GPXTEN维持在最低有效剂量或血药浓度(C_min)与最大耐受剂量或血药浓度(C_max)之间的治疗窗内。在这种情况下，GP与包含选定XTEN序列的融合蛋白的连接可以导致这些性质的改善，使得它们作为治疗剂或预防剂与未连接XTEN的GP相比更有效。

IV)延伸的重组多肽

一方面，本发明提供了可用作GP与之连接的融合蛋白配偶体的XTEN多肽组合物，得到GPXTEN融合蛋白。XTEN一般是长度延伸的多肽，具有主要由小的亲水性氨基酸构成的非天然存在的、基本上非重复的序列，该序列在生理条件下具有低程度的二级或三级结构或者没有二级或三级结构。

XTEN可用作融合蛋白配偶体，因为它们可用作“载体”，当与GP蛋白连接产生融合蛋白时赋予某些期望的药代动力学、物理化学和药学性质。这种期望的性质包括但不限于组合物的增强的药代动力学参数和溶解度特征以及以下描述的其它性质。如本文所述，这种融合蛋白组合物可用于治疗某些葡萄糖调节肽相关疾病、疾患或病症。本文使用的“XTEN”明确排除抗体或抗体片段，例如单链抗体、或轻链或重链的Fc片段。

在一些实施方案中，当作为载体使用或者累积不止一个XTEN单元用于单个融合蛋白时，XTEN是具有大于约100至约3000个氨基酸残基、优选大于400至约3000个残基的长多肽。在其它情况下，当用作融合蛋白组分之间的连接子时，或者在不需要增加融合蛋白半衰期但希望增加GP融合配偶体组分的溶解度或其它理化性质时，短于100个氨基酸残基，例如约96、或约84、或约72、或约60、或约48或约36个氨基酸残基的XTEN序列可被加入具有GP的融合蛋白组合物以影响所述性质。

要与用于产生本发明融合蛋白组合物的生物活性蛋白连接的XTEN的选择标准一般涉及XTEN的理化性质和构象结构属性，这些属性转而可用于赋予融合蛋白组合物增强的药学和药代动力学性质。本发明的XTEN可表现出以下优势性质的一种或多种：构象灵活性、增强的水溶解度、高度蛋白酶抗性、低免疫原性、与哺乳动物受体的低结合和增加的流体动力学(或Stokes)半径；可使它们特别用作融合蛋白配偶体的性质。包含GP的融合蛋白可被XTEN增强的性质的非限制性实例包括与通过类似途径施用的未连接XTEN的GP相比，总溶解度和/或代谢稳定性增加、降低的对蛋白质水解的敏感性、降低的免疫原性、皮下或肌肉内施用时降低的吸收速率和增强的药代动力学性质例如较长的终末半衰期和增加的曲线下面积(AUC)、皮下或肌肉内注射后较慢的吸收，使得C_max较低，这转而可导致GP副作用降低，这与增加的半衰期和/或AUC共同可导致施用给受试者的GPXTEN组合物的融合蛋白保持治疗活性的时段增加。

用于测定蛋白质理化性质的许多方法和分析是本领域已知的，所述蛋白质例如包含本发明XTEN的组合物，所述性质例如溶解度、二级或三级结构、溶解度、蛋白聚集、熔解性质、污染和水含量。此类方法包括分析离心、EPR、离子交换HPLC、尺寸排阻HPLC、反相HPLC、光散射、毛细管电泳、圆二色性、差示扫描量热法、荧光、离子交换HPLC、尺寸排阻HPLC、IR、NMR、拉曼光谱、折射法和UV/可见光谱法。其它方法公开于Arnau等,Prot Expr and Purif(2006)48,1-13。这些方法应用于本发明将在本领域技术人员能力范围内。

通常，XTEN被设计为在生理条件下的行为类似变性的肽序列，不管聚合物延伸的长度。“变性的”描述肽在溶液中的状态，特征为肽骨架的大的构象自由度。大多数肽和蛋白质在高浓度变性剂存在下或者在升高的温度下具有变性的构象。变性构象的肽具有例如特征的圆二色(CD)谱，并且通过NMR测定特征为缺少远程相互作用。“变性的构象”和“非结构化构象”在本文同义使用。在一些情况下，本发明提供了在生理条件下可类似大体没有二级结构的变性序列的XTEN序列。在其它情况下，XTEN序列在生理条件下可基本没有二级结构。该上下文中使用的“大体没有”指，通过本文描述的方法测量或确定，XTEN序列的少于50%的XTEN氨基酸残基对二级结构有贡献。该上下文中使用的“基本没有”指，通过本文描述的方法测量或确定，XTEN的至少约60%、或约70%、或约80%、或约90%、或约95%、或至少约99%的XTEN氨基酸残基对二级结构没有贡献。

本领域已经确立了许多方法来辨别给定多肽中二级结构和三级结构的存在或不存在。具体说，二级结构可以分光光度法测量，例如通过“远UV”光谱区(190-250nm)的圆二色谱法。二级结构元件，例如α螺旋和β折叠，各自给出特征形状和CD光谱大小。还可以通过以下来预测多肽序列的二级结构：某些计算机程序或算法，例如熟知的Chou-Fasman算法(Chou,P.Y.,等(1974)Biochemistry,13:222-45)和Garnier-Osguthorpe-Robson(“GOR”)算法(Garnier J,Gibrat JF,Robson B.(1996)，GOR method for predicting proteinsecondary structure from amino acid sequence,Methods Enzymol266:540-553)，描述于美国专利申请公开No.20030228309A1。对于给定序列，所述算法可以预测是存在一定的二级结构还是根本不存在二级结构，表示为形成例如α螺旋或β折叠的序列残基总数和/或百分比或者被预测导致无规卷曲形成的序列残基百分比(其缺乏二级结构)。

在一些情况下，通过Chou-Fasman算法测定，用于本发明融合蛋白组合物的XTEN序列可以具有范围从0%至小于约5%的α螺旋百分比。在其它情况下，通过Chou-Fasman算法测定，融合蛋白组合物的XTEN序列可具有范围从0%至小于约5%的β折叠百分比。在一些情况下，通过Chou-Fasman算法测定，融合蛋白组合物的XTEN序列可具有范围从0%至小于约5%的α螺旋百分比和范围从0%至小于约5%的β折叠百分比。在优选的实施方案中，融合蛋白组合物的XTEN序列将具有小于约2%的α螺旋百分比和小于约2%的β折叠百分比。在其它情况下，通过GOR算法测定，融合蛋白组合物的XTEN序列可具有高度无规卷曲百分比。在一些实施方案中，通过GOR算法测定，XTEN序列可具有至少约80%、或至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约96%、或至少约97%、或至少约98%和最优选至少约99%的无规卷曲。

1.非重复序列

主题组合物的XTEN序列可以是基本上非重复的。一般而言，重复的氨基酸序列具有聚集或形成高级结构的倾向，例如天然重复序列例如胶原蛋白和亮氨酸拉链所示例，或者形成接触而导致结晶或假结晶结构。相反，非重复序列较低的聚集倾向允许设计具有相对低的带电氨基酸频率的长序列XTEN，否则如果序列是重复的则带电氨基酸可能会聚集。通常，GPXTEN融合蛋白包含大于约100至约3000个氨基酸残基、优选大于400至约3000个累积残基的XTEN序列，其中所述序列是基本上非重复的。在一个实施方案中，XTEN序列可具有大于约100至约3000个氨基酸残基，其中序列中没有三个连续氨基酸是相同的氨基酸类型，除非所述氨基酸是丝氨酸，在这种情况下，不超过三个连续氨基酸是丝氨酸残基。在前述实施方案中，XTEN序列将是基本上非重复的。

多肽或基因的重复程度可通过计算机程序或算法或通过本领域已知的其它方式来测量。多肽序列的重复性可以例如通过测定给定长度的较短序列在多肽中出现的次数来评估。例如，200个氨基酸残基的多肽具有192个重叠的9-氨基酸序列(或9-mer“框”)和198个3-mer框，但是独特的9-mer或3-mer序列的数目将取决于序列内的重复量。可产生反映整体多肽序列中子序列重复程度的评分(下文“子序列评分”)。在本发明上下文中，“子序列评分”指每个独特的3-mer框在多肽的200连续氨基酸序列中出现的总和除以200氨基酸序列中独特3-mer子序列的绝对数。从重复和非重复多肽的前200个氨基酸得到的这种子序列评分的实例提供于实施例40。在一些实施方案中，本发明提供了GPXTEN，当源自200个连续氨基酸残基的片段时，每一个包含一个或多个XTEN，其中XTEN可具有小于12、更优选小于10、更优选小于9、更优选小于8、更优选小于7、更优选小于6和最优选小于5的子序列评分。在该段落描述的上述实施方案中，子序列评分小于约10(即，9、8、7、等)的XTEN将是“基本上非重复的”。

与具有重复序列的多肽相比，XTEN的非重复特征可赋予具有GP的融合蛋白更大的溶解度和较低的聚集倾向。这些性质可有利于配制含有在某些情况下超过100mg/ml的极高药物浓度的含XTEN的药物制剂。

而且，实施方案的XTEN多肽序列被设计为具有低程度的内部重复性以减少或基本上消除施用给哺乳动物时的免疫原性。由主要限于三个氨基酸(例如甘氨酸、丝氨酸和谷氨酸)的短重复基序构成的多肽序列可导致当施用给哺乳动物时相对高的抗体滴度，尽管这些序列中缺乏预测的T细胞表位。这可能是由多肽的重复性质引起的，因为已经显示具有重复表位的免疫原(包括蛋白质聚集物、交联免疫原和重复糖类)是高度免疫原性的，并且可以例如导致B细胞受体的交联而引起B细胞活化。(Johansson,J.,等(2007)Vaccine,25:1676-82；Yankai,Z.,等(2006)Biochem Biophys Res Commun,345:1365-71；Hsu,C.T.,等(2000)Cancer Res,60:3701-5)；Bachmann MF,等Eur J Immunol.(1995)25(12):3445-3451).

2.示例性序列基序

本发明涵盖可包含多个单元的较短序列或基序的XTEN，其中所述基序的氨基酸序列是非重复的。在设计XTEN序列时发现，尽管利用了使用多聚体化产生XTEN序列的序列基序文库的“结构单元(building block)”方法，可以满足非重复标准。因此，虽然XTEN序列可以由少至四个不同类型的序列基序的多个单元组成，但因为基序本身一般由非重复氨基酸序列组成，所以使得整体XTEN序列是基本上是非重复的。

在一个实施方案中，XTEN可具有约100至约3000个氨基酸残基、或大于400至约3000个残基的非重复序列，其中XTEN序列的至少约80%、或至少约85%、或至少约90%、或至少约95%、或至少约97%或约100%由非重叠序列基序组成，其中每个基序具有约9至36个氨基酸残基。在其它实施方案中，XTEN序列的至少约80%、或至少约85%、或至少约90%、或至少约95%、或至少约97%或约100%由非重叠序列基序组成，其中每个基序具有约9至14个氨基酸残基。在其它实施方案中，XTEN序列的至少约80%、或至少约85%、或至少约90%、或至少约95%、或至少约97%或约100%由非重叠序列基序组成，其中每个基序具有12个氨基酸残基。在这些实施方案中，优选的是序列基序主要由小亲水性氨基酸组成，使得整体序列具有非结构化、灵活的特征。可包含在XTEN中的氨基酸的实例是例如精氨酸、赖氨酸、苏氨酸、丙氨酸、天冬酰胺、谷氨酰胺、天冬氨酸、谷氨酸、丝氨酸和甘氨酸。作为测试变量(诸如密码子优化、组装编码序列基序的多核苷酸、蛋白质表达、电荷分布和表达蛋白质的溶解度以及二级和三级结构)的结果，发现具有增强的特征的XTEN组合物主要包含甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基，其中序列被设计为是基本上非重复的。在一优选的实施方案中，XTEN序列主要具有选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)或脯氨酸(P)的4至6个类型的氨基酸，其以基本上非重复的顺序排列，长度大于约100至约3000个氨基酸残基，或大于400至约3000个残基。在一些实施方案中，XTEN可具有大于约100至约3000个氨基酸残基、优选大于400至约3000个残基的序列，其中序列的至少约80%由非重叠序列基序组成，其中每个基序具有9至36个氨基酸残基，其中每个基序由选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的4至6个类型的氨基酸组成，并且其中全长XTEN中任何一种氨基酸类型的含量不超过30%。在其它实施方案中，XTEN序列的至少约90%由非重叠序列基序组成，其中每个基序具有9至36个氨基酸残基，其中每个基序由选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的4至6个类型的氨基酸组成，并且其中全长XTEN中任何一种氨基酸类型的含量不超过30%。在其它实施方案中，XTEN序列的至少约90%由非重叠序列基序组成，其中每个基序具有由选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的4至6个类型的氨基酸组成的12个氨基酸残基，并且其中全长XTEN中任何一种氨基酸类型的含量不超过30%。在其它实施方案中，XTEN序列的至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%至约100%由非重叠序列基序组成，其中每个基序具有由甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)组成的12个氨基酸残基，并且其中全长XTEN中任何一种氨基酸类型的含量不超过30%。

在其它实施方案中，XTEN包含大于约100至约3000个氨基酸残基、或大于400至约3000个氨基酸残基的非重复序列，其中序列的至少约80%、或至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%或约99%由9至14个氨基酸残基的非重叠序列基序组成，其中基序由选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的4至6个类型的氨基酸组成，并且其中任何一个基序中任何两个连续氨基酸残基的序列在序列基序中不重复超过两次。在其它实施方案中，XTEN序列的至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%由12个氨基酸残基的非重叠序列基序组成，其中基序由选自甘氨酸 (G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的4至6个类型的氨基酸组成，并且其中任何一个序列基序中任何两个连续氨基酸残基的序列在序列基序中不重复超过两次。在其它实施方案中，XTEN序列的至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%或约99%由12个氨基酸残基的非重叠序列基序组成，其中基序由甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)组成，并且其中任何一个序列基序中任何两个连续氨基酸残基的序列在序列基序中不重复超过两次。在其它实施方案中，XTEN由12个氨基酸序列基序组成，其中氨基酸选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)，并且其中任何一个序列基序中任何两个连续氨基酸残基的序列在序列基序中不重复超过两次，并且其中全长XTEN中任何一种氨基酸类型的含量不超过30%。在本段描述的上述实施方案中，XTEN序列是基本上非重复的。

在一些情况下，本发明提供了包含大于约100至约3000个氨基酸残基或累积大于400至约3000个残基的非重复XTEN序列的组合物，其中序列的至少约80%、或至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%至约100%由选自表4的氨基酸序列的两个或多个非重叠序列基序的多个单元组成。在一些情况下，XTEN包括非重叠序列基序，其中序列的约80%、或至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%至约100%由选自表4的单基序家族的两个或多个非重叠序列组成，得到其中整体序列保持基本上非重复的“家族”序列。因此，在这些实施方案中，XTEN序列可包含表4序列的AD基序家族、或AE基序家族、或AF基序家族、或AG基序家族、或AM基序家族、或AQ基序家族、或BC家族、或BD家族的非重叠序列基序的多个单元。在其它情况下，XTEN包含来自表4的基序家族的两个或多个基序序列。

表4:12个氨基酸的XTEN序列基序和基序家族

基序家族*	基序序列	SEQ ID NO:
			AD	GESPGGSSGSES	157
AD	GSEGSSGPGESS	158
			AD	GSSESGSSEGGP	159
AD	GSGGEPSESGSS	160
			AE,AM	GSPAGSPTSTEE	161
AE,AM,AQ	GSEPATSGSETP	162
			AE,AM,AQ	GTSESATPESGP	163
AE,AM,AQ	GTSTEPSEGSAP	164
			AF,AM	GSTSESPSGTAP	165
AF,AM	GTSTPESGSASP	166
			AF,AM	GTSPSGESSTAP	167
AF,AM	GSTSSTAESPGP	168
			AG,AM	GTPGSGTASSSP	169
AG,AM	GSSTPSGATGSP	170
			AG,AM	GSSPSASTGTGP	171
AG,AM	GASPGTSSTGSP	172
			AQ	GEPAGSPTSTSE	173
AQ	GTGEPSSTPASE	174
			AQ	GSGPSTESAPTE	175
AQ	GSETPSGPSETA	176
			AQ	GPSETSTSEPGA	177
AQ	GSPSEPTEGTSA	178
			BC	GSGASEPTSTEP	179
BC	GSEPATSGTEPS	180
			BC	GTSEPSTSEPGA	181
BC	GTSTEPSEPGSA	182
			BD	GSTAGSETSTEA	183
BD	GSETATSGSETA	184
			BD	GTSESATSESGA	185
BD	GTSTEASEGSAS	186

*表示当以各种排列变化在一起使用时得到“家族序列”的个体基序序列

在其它情况下，GPXTEN组合物可包含大于约100至约3000个氨基酸残基或累积大于400至约3000个残基的一个或多个非重复XTEN序列，其中序列的至少约80%、或至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%至约100%由选自表10-13的多肽序列的一个或多个的非重叠36个氨基酸序列基序组成。

在其中GPXTEN融合蛋白的XTEN组分的小于100%的氨基酸由选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的4至6个氨基酸组成，或者小于100%的序列由表4的序列基序组成，或者与表5的XTEN具有小于100%序列同一性的那些实施方案中，其它氨基酸残基可选自14个天然L-氨基酸的任何其它氨基酸，但优先选自亲水性氨基酸，使得XTEN序列含有至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约96%、或至少约97%、或至少约98%或至少约99%的亲水性氨基酸。非甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的XTEN氨基酸散布于整个XTEN序列，位于序列基序内或序列基序间，或者集中于一个或多个短的XTEN序列段。在其中GPXTEN的XTEN组分包含甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)以外的氨基酸的此类情况下，优选的是，氨基酸不是疏水性残基并且不会实质上赋予XTEN组分的二级结构。在XTEN构建中较不常用的疏水性残基包括色氨酸、苯丙氨酸、酪氨酸、亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸。此外，可以设计XTEN序列为含有少数(例如小于5%)或没有以下的氨基酸：半胱氨酸(为避免二硫化物形成和氧化)、甲硫氨酸(为避免氧化)、天冬酰胺和谷氨酰胺(为避免脱酰胺作用)。因此，在前述优选的实施方案中，包含除甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)以外的其它氨基酸的GPXTEN融合蛋白的XTEN组分通过Chou-Fasman算法测量具有小于5%的有助于α-螺旋和β-折叠的残基的序列，并且通过GOR算法测量将具有至少90%、或至少约95%或更多的无规卷曲形成。

3.序列长度

在本发明的另一方面，本发明涵盖GPXTEN组合物，包含具有延伸长度序列的XTEN多肽的载体。本发明利用如下发现：增加非重复非结构化多肽的长度增强了XTEN的非结构化性质，并相应增强了包含XTEN载体的融合蛋白的生物性质和药代动力学性质。如实施例中更全面描述的，通过GOR算法测定，即使通过固定重复顺序的单一家族序列基序(例如，表4的四个AE基序)产生的XTEN长度的成比例增加导致与较短XTEN长度相比具有较高百分比的无规卷曲形成的序列。一般而言，如实施例所述，增加非结构化多肽融合配偶体的长度可导致与具有较短序列长度的非结构化多肽配偶体的融合蛋白相比终末半衰期不成比例增加的融合蛋白。

考虑纳入本发明GPXTEN的XTEN的非限制性实例提供于表5。在一个实施方案中，本发明提供了GPXTEN组合物，其中融合蛋白的XTEN序列长度大于约100至约3000个氨基酸残基并且在一些情况下大于400至约3000个氨基酸残基，其中XTEN赋予GPXTEN比未连接XTEN的GP相比增强的药代动力学性质。在一些情况下，本发明的GPXTEN组合物的XTEN序列长度可以是约100、或约144、或约288、或约401、或约500、或约600、或约700、或约800、或约900、或约1000、或约1500、或约2000、或约2500或最多约3000个氨基酸残基。在其它情况下，XTEN序列长度可以是约100至150、约150至250、约250至400、401至约500、约500至900、约900至1500、约1500至2000、或约2000至约3000个氨基酸残基。在一个实施方案中，GPXTEN可以包含XTEN序列，其中该序列与选自表5的XTEN具有至少约80%序列同一性、或可选地81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在一些情况下，通过在编码融合蛋白的基因的XTEN部分纳入优化N端前导序列(NTS)的编码核苷酸，XTEN序列为优化表达而被设计为GPXTEN的N端组分。在一个前述实施方案中，表达的GPXTEN的N端XTEN序列与AE48或AM48、AE624、或AE912或AM923的序列具有至少90%序列同一性。在另一前述实施方案中，XTEN具有实施例14-17中描述的N端残基。

在其它情况下，GPXTEN融合蛋白可包含第一和第二XTEN序列，其中XTEN序列中的累积总残基大于约400至约3000个氨基酸残基。在前述实施方案中，GPXTEN融合蛋白可包含第一和第二XTEN序列，其中每个序列与选自表5的至少第一XTEN或另外第二XTEN具有至少约80%序列同一性、或可选地81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。

如下文更全面描述的，本发明提供了其中通过选择XTEN的长度而设计GPXTEN以赋予施用给受试者的融合蛋白目标半衰期的方法。一般而言，加入GPXTEN组合物的长度大于约累积400残基的XTEN导致与较短的累积长度(例如，短于约280个残基)相比更长的半衰期。然而，在另一实施方案中，GPXTEN融合蛋白可被设计为包含具有更长序列长度的XTEN，选择该序列长度以另外赋予皮下或肌肉内施用给受试者之后较慢的全身吸收速率。在此类情况下，与类似剂量的未连接XTEN的GP相比，C_max被降低，从而有助于保持GPXTEN在组合物的治疗窗内的能力。因此，除了本文描述的其它理化性质以外，XTEN还赋予施用的GPXTEN存储性质。

表5:XTEN多肽

4.XTEN片段

在一个实施方案中，本发明提供了分离的GPXTEN融合蛋白，其中XTEN组分的累积长度大于约100至约3000个氨基酸残基，含有选自表5、10、11、12和13的至少一个多肽序列片段，并且其中XTEN序列其余部分的至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约96%、或至少约97%或至少约98%或更多由亲水性氨基酸组成，并且XTEN的其余部分的小于约2%总的来说含有疏水性、芳香族或半胱氨酸氨基酸。在前述实施方案中，XTEN可含有多个片段，其中所述片段是相同或不同的。在另一实施方案中，本发明提供了分离的GPXTEN融合蛋白，其中XTEN组分的累积长度大于约100至约3000个氨基酸残基并且包含至少约100至约923、或至少约100至约875、或至少约100至约576、或至少约100至约288、或至少约100至约144个氨基酸残基的至少一个序列片段，其中所述序列片段由至少三种不同类型的氨基酸组成，并且所述序列片段中甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基的总和构成序列片段总氨基酸序列的至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约96%、或至少约97%、或至少约98%或至少约99%，并且XTEN序列其余部分的至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约96%、或至少约97%、或至少约98%由亲水性氨基酸组成，并且XTEN的其余部分的小于约2%由疏水性、芳香族或半胱氨酸氨基酸组成。在另一实施方案中，本发明提供了分离的GPXTEN融合蛋白，其中XTEN组分的累积长度大于约100至约3000个氨基酸残基并且包含至少约200至约923、或至少约200至约875、或至少约200至约576、或至少约200至约288个氨基酸残基的至少一个序列片段，在所述序列片段中，甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基在序列片段中的总和构成序列片段总氨基酸序列的至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约96%、或至少约97%、或至少约98%、或至少约99%，并且其中片段的子序列评分小于12、更优选小于10、更优选小于9、更优选小于8、更优选小于7、更优选小于6和最优选小于5，并且XTEN序列其余部分的至少约90%、或至少约91%,、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约96%、或至少约97%或至少约98%由亲水性氨基酸组成，并且XTEN序列的其余部分的小于约2%由疏水性或芳香族氨基酸或半胱氨酸氨基酸组成。

5.N端XTEN表达增强序列

在一些实施方案中，本发明提供了作为GPXTEN融合蛋白的N端部分的短长度XTEN序列。在用包含加入编码结合融合蛋白的多核苷酸的优化N端前导多核苷酸序列(其编码N端XTEN)的适合表达载体转化的宿主细胞中，融合蛋白的表达被增强。已经发现，如实施例14-17所述，用这种在结合融合蛋白基因中包含优化的N-端前导序列(NTS)的表达载体转化的宿主细胞导致与相应融合蛋白从不包含NTS的多核苷酸表达相比融合蛋白表达极大增强，并且可不需要加入用于增强表达的非XTEN前导序列。在一个实施方案中，本发明提供了包含NTS的GPXTEN融合蛋白，其中结合融合蛋白在宿主细胞中从编码基因的表达与不包含N端XTEN序列的GPXTEN融合蛋白(其中编码基因缺乏NTS)的表达相比被增强约50%、或约75%、或约100%、或约150%、或约200%或约400%。

在一个实施方案中，GPXTEN的N端XTEN多肽包含显示与AE48或AM48的氨基酸序列具有至少约80%、或至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约96%、或至少约97%、或至少约98%、或至少99%或表现100%序列同一性的序列，AE48或AM48各自的氨基酸序列如下：

AE48:MAEPAGSPTSTEEGTPGSGTASSSPGSSTPSGATGSPGASPGTSSTGS(SEQ ID NO:208)

AM48:MAEPAGSPTSTEEGASPGTSSTGSPGSSTPSGATGSPGSSTPSGATGS(SEQ ID NO:209)

在另一实施方案中，短长度N端XTEN可与较长长度XTEN连接以形成GPXTEN融合蛋白的N端区，其中编码所述短长度N端XTEN的多核苷酸序列赋予在宿主细胞中增强表达的性质，并且其中表达的XTEN的长长度促进XTEN载体在融合蛋白中增强的性质，如上所述。在上文中，短长度XTEN可与本文公开的XTEN的任何一个(例如，表5的XTEN)连接，并且得到的XTEN转而作为融合蛋白的组分与本文公开的GP的任何一个(例如，表1-3的GP)的N端连接。可选地，编码短长度XTEN的多核苷酸(或其互补体)与编码本文公开的任何一个XTEN的多核苷酸(或其互补体)连接，得到的编码N端XTEN的基因转而与编码本文公开的任何一个GP的多核苷酸的5'端(或其互补体的3'端)连接。在一些实施方案中，具有长长度的N端XTEN多肽与选自由序列AE624、AE912和AM923组成的组的氨基酸序列具有至少约80%、或至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约 96%、或至少约97%、或至少约98%、或至少99%或100%序列同一性。

在上文公开的前述N端XTEN实施方案的任何一个中，N端XTEN可以具有优选选自GESTPA的约1至约6个另外的氨基酸残基，以容纳用来将编码N端XTEN的核苷酸与编码融合蛋白的靶向部分的基因的限制内切核酸酶限制位点连接。用于产生N端序列并加入本发明融合蛋白的方法在实施例中更全面描述。

6.净电荷

在其它实施方案中，XTEN多肽具有通过加入具有净电荷的氨基酸残基和/或减少XTEN序列中疏水性氨基酸的比例而赋予的非结构化特征。总的净电荷和净电荷密度通过改变XTEN序列中带电氨基酸含量来控制。在一些实施方案中，组合物的XTEN的净电荷密度可以高于+0.1或低于-0.1电荷/残基。在其它实施方案中，XTEN的净电荷可以是约0%、约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、或约20%或更多。

因为人或动物中大多数组织和表面具有净负电荷，在一些实施方案中，XTEN序列被设计为具有净负电荷以最大程度减小包含XTEN的组合物与各种表面(诸如血管、健康组织或各种受体)之间的非特异性相互作用。不受特定理论束缚，由于单独携带净负电荷和分布于XTEN多肽序列的XTEN多肽的个体氨基酸之间的静电排斥，XTEN可以具有开放的构象。净负电荷在XTEN的延伸的序列长度中的这种分布可以造成非结构化构型，这转而可以导致流体动力学半径的有效增加。在优选的实施方案中，通过加入谷氨酸残基而带来负电荷。因此，在一个实施方案中，本发明提供了其中XTEN序列含有约8、10、15、20、25或甚至约30%谷氨酸的XTEN。一般而言，谷氨酸残基将均匀分布于整个XTEN序列。在一些情况下，每个20kD的 XTEN可以含有约10-80、或约15-60或约20-50个谷氨酸残基，这可以导致具有非常类似的pKa的带电残基的XTEN，这可以增加产物的电荷均一性并锐化其等电点，增强得到的GPXTEN融合蛋白的理化性质，例如简化纯化程序。

本发明的组合物的XTEN一般没有或具有低含量的带正电荷氨基酸。在一些实施方案中，XTEN可以具有小于约10%的带正电荷的氨基酸残基、或小于约7%、或小于约5%、或小于约2%、或小于约1%的带正电荷的氨基酸残基。然而，本发明涵盖这样的构建体，其中有限数目的带正电荷的氨基酸例如赖氨酸被加入XTEN以允许赖氨酸的ε胺与肽上的反应基、连接子桥或待偶联至XTEN骨架的药物或小分子上的反应基之间偶联。在前述一个实施方案中，XTEN具有约1至约100个赖氨酸残基、或约1至约70个赖氨酸残基、或约1至约50个赖氨酸残基、或约1至约30个赖氨酸残基、或约1至约20个赖氨酸残基、或约1至约10个赖氨酸残基、或约1至约5个赖氨酸残基或可选地仅单个赖氨酸残基。使用前述含有赖氨酸的XTEN，构建了包含XTEN、葡萄糖调节肽以及用于治疗葡萄糖疾病或疾患的化疗剂的融合蛋白，其中加入XTEN组分的物质的最大分子数目由加入XTEN的赖氨酸或具有反应性侧链的其它氨基酸(例如，半胱氨酸)的数目确定。

在一些实施方案中，XTEN序列包含由其它残基(例如丝氨酸或甘酸)分隔的带电残基，导致更好的表达或纯化行为。基于净电荷，一些XTEN具有1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0或甚至6.5的等电点(pI)。在优选的实施方案中，XTEN具有1.5至4.5的等电点。在这些实施方案中，加入本发明的GPXTEN融合蛋白组合物的XTEN在促进非结构化构型和XTEN组分与哺乳动物蛋白质和组织结合降低的生理条件下携带负电荷。

因为疏水性氨基酸赋予多肽以结构，本发明提供了XTEN中疏水性氨基酸含量通常将小于5%、或小于2%、或小于1%疏水性氨基酸含量。在一个实施方案中，GPXTEN融合蛋白的XTEN组分中甲硫氨酸和色氨酸的氨基酸含量通常小于5%或小于2%，并且最优选小于1%。在另一实施方案中，XTEN将具有含有小于10%的带正电荷的氨基酸残基、或小于约7%、或小于约5%或小于约2%的带正电荷的氨基酸残基的序列，甲硫氨酸和色氨酸残基的总和将小于2%，并且天冬酰胺和谷氨酰胺残基的总和将是总XTEN序列的小于10%。

7.低免疫原性

在另一方面，本发明提供了其中XTEN序列具有低程度免疫原性或者基本上无免疫原性的组合物。几种因素可以促成XTEN的低免疫原性，例如非重复序列、非结构化构型、高度溶解度、低度或缺乏自聚集、序列内低度或缺乏蛋白水解位点和XTEN序列中低度或缺乏表位。

构象表位由蛋白抗原的多个不连续氨基酸序列构成的蛋白质表面区域形成。蛋白质的精确折叠使这些序列成为明确稳定的空间构型或表位，可以被宿主体液免疫系统识别为“外来的”，导致产生针对该蛋白质的抗体或活化细胞介导的免疫应答。在后一情况下，个体中对蛋白质的免疫应答主要受T细胞表位识别影响，T细胞表位识别是该个体HLA-DR同种异型的肽结合特异性的功能。T细胞表面上同源T细胞受体对II类MHC肽复合物的结合，连同某些其它共同受体(例如CD4分子)的交叉结合，可以诱导T细胞内的活化状态。活化导致细胞因子释放，进一步活化其它淋巴细胞例如B细胞以产生抗体，或者活化T杀伤细胞作为完全的细胞免疫应答。

肽结合给定II类MHC分子以呈递在APC(抗原呈递细胞)表面上的能力取决于许多因素；最主要的是其一级序列。在一个实施方案中，通过设计在抗原呈递细胞中抵抗抗原加工的XTEN序列和/或选择不良好结合MHC受体的序列来达到低度的免疫原性。本发明提供了具有基本上非重复XTEN多肽的GPXTEN融合蛋白，设计该非重复 XTEN多肽以减少与II类MHC受体的结合并避免形成T细胞受体表位或抗体结合，导致低度的免疫原性。避免免疫原性部分地是XTEN序列构象灵活性的直接结果；即，由于氨基酸残基的选择和顺序而缺乏二级结构。例如，特别关注的是在水溶液中或可能导致构象表位的生理条件下具有适应致密折叠构象的低倾向的序列。使用常规治疗实践和给药来施用包含XTEN的融合蛋白一般不会导致形成针对XTEN序列的中和抗体，而且还减少了GPXTEN组合物中GP融合配偶体的免疫原性。

在一个实施方案中，主题融合蛋白中使用的XTEN序列可以基本上不含由人T细胞识别的表位。之前已经公开了这种表位的消除以产生较低免疫原性蛋白；参见例如WO98/52976、WO02/079232和WO00/3317，其在此通过引用并入。已经描述了对人T细胞表位的分析(Stickler,M.,等(2003)J Immunol Methods,281:95-108)。特别关注的是可以被寡聚体化而不产生T细胞表位或非人序列的肽序列。这通过测试这些序列的同向重复中T细胞表位的存在和6至15-mer和特别是9-mer的非人序列的出现，然后改变XTEN序列的设计以消除或破坏表位序列来实现。在一些实施方案中，通过限制预测结合MHC受体的XTEN表位数目，XTEN序列是基本上非免疫原性的。随着能够结合MHC受体的表位数目的减少，伴随T细胞活化潜力以及T细胞辅助功能下降、减少的B细胞活化或上调以及减少的抗体生成。预测的T细胞表位的低程度可以通过表位预测算法例如TEPITOPE(Sturniolo,T.,等(1999)NatBiotechnol,17:555-61)来测定，显示于实施例45。蛋白质内给定的肽框的TEPITOPE评分是该肽框与多个最常见的人MHC等位基因结合的K_d(解离常数、亲和力、解离速率)的对数，公开于Sturniolo,T.等(1999)Nature Biotechnology17:555)。该评分范围至少20log，从约10至约-10(对应于10e¹⁰K_d至10e^-10K_d的结合常数)，并且可以通过避免在肽展示于MHC上的期间用作锚定残基的疏水性氨基酸例如M、I、L、V、F来减少。在一些实施方案中，加入GPXTEN的XTEN组分不具有TEPITOPE评分为约-5或更大、或-6或更大、或-7或更大、或-8或更大或者TEPITOPE评分为-9或更大的预测的T细胞表位。本文使用的“-9或更大”的评分将涵盖10至-9(包含性)的TEPITOPE评分，但是不涵盖-10的评分，因为-10小于-9。

在另一实施方案中，通过限制XTEN序列的已知蛋白水解位点，减少XTEN加工成可以结合II类MHC受体的小肽，使本发明的XTEN序列(包括加入主题GPXTEN融合蛋白的那些)基本上无免疫原性。在另一个实施方案中，通过利用基本上没有二级结构的序列而使XTEN序列基本上无免疫原性，由于结构的高熵而赋予对许多蛋白酶的抗性。因此，降低的TEPITOPE评分和从XTEN消除已知的蛋白水解位点使得XTEN组合物(包括GPXTEN融合蛋白组合物的XTEN)基本上不能被哺乳动物受体(包括免疫系统的那些)结合。在一个实施方案中，GPXTEN融合蛋白的XTEN可以对哺乳动物受体具有>100nM K_d的结合，或者对哺乳动物细胞表面或循环多肽受体具有大于500nM K_d或大于1μM K_d的结合。

此外，非重复序列和相应的XTEN表位缺乏限制了B细胞结合XTEN或被XTEN活化的能力。重复序列被识别并且可以与甚至少数B细胞形成多价接触，并且由于多个T细胞独立受体的交联，可以刺激B细胞增殖和抗体生成。相反，虽然XTEN可以与许多不同B细胞在其延伸序列上接触，但由于缺乏序列重复性，每个个体B细胞仅可以使一个或少数与个体XTEN接触。不受任何理论束缚，XTEN通常具有小得多的刺激B细胞增殖和由此免疫应答的倾向。在一个实施方案中，GPXTEN与未融合的相应GP相比可具有降低的免疫原性。在一个实施方案中，最多三个胃肠外剂量的GPXTEN施用给哺乳动物，导致以1:100血清稀释而非1:1000稀释时可检测的抗GPXTEN IgG。在另一实施方案中，最多三个胃肠外剂量的GPXTEN施用给哺乳动物，导致以1:100血清稀释而非1:1000稀释时可检测的抗GP IgG。在另一实施方案中，最多三个胃肠外剂量的GPXTEN施用给哺乳动物，导致以1:100血清稀释而非1:1000稀释时可检测的抗 GP IgG。在另一实施方案中，最多三个胃肠外剂量的GPXTEN施用给哺乳动物，导致以1:100血清稀释而非1:1000稀释时可检测的抗XTEN IgG。在前述实施方案中，哺乳动物可以是小鼠、大鼠、兔或食蟹猴。

具有非重复序列的XTEN相对于具有高度重复性的序列的其它特征是非重复XTEN与抗体形成较弱接触。抗体是多价分子。例如，IgG具有两个相同的结合位点，并且IgM含有10个相同的结合位点。因此，针对重复序列的抗体可以与这种具有高亲合性的重复序列形成多价接触，这可以影响这种重复序列的效价和/或消除。相反，针对非重复XTEN的抗体可以产生单价相互作用，导致较小的免疫清除可能性，使得GPXTEN组合物可以在循环中保持增加的时段。

8.增加的流体动力学半径

在另一方面，本发明提供了其中XTEN多肽具有高流体动力学半径的XTEN，高流体动力学半径赋予包含XTEN的GPXTEN融合蛋白相应增加的表观分子量。如实施例22详细描述的，XTEN与GP序列的连接可产生GPXTEN组合物，其与未连接XTEN的GP相比可具有增加的流体动力学半径、增加的表观分子量和增加的表观分子量因子。例如，在其中期望延长半衰期的治疗应用中，其中具有高流体动力学半径的XTEN被加入包含一个或多个GP的融合蛋白的组合物可以有效增大组合物的流体动力学半径而超过大约3-5nm的肾小球孔径(对应于约70kDA的表观分子量)(Caliceti.2003.Pharmacokinetic and biodistributionproperties of poly(ethylene glycol)-protein conjugates.Adv Drug Deliv Rev55:1261-1277)，导致循环蛋白肾清除减少。蛋白质的流体动力学半径由其分子量及其结构确定，包括形状和致密度。不受特定理论束缚，由于肽个体电荷之间的静电排斥或缺少赋予二级结构潜力的序列中特定氨基酸赋予的固有灵活性，XTEN可以具有开放的构象。与具有二级结构和/或三级结构的类似序列长度和/或分子量的多肽(例如典型的球形蛋白)相比，XTEN多肽的开放、延伸和非结构化构象可以具有成比例更大的流体动力学半径。用于测定流体动力学半径的方法是本领域公知的，例如通过使用尺寸排阻色谱(SEC)，如美国专利No.6,406,632和No.7,294,513所述。实施例22的结果说明，增加长度的XTEN的添加导致流体动力学半径、表观分子量和表观分子量因子的参数成比例增加，允许修饰GPXTEN至期望的特征截留表观分子量或流体动力学半径。因此，在某些实施方案中，GPXTEN融合蛋白可以用XTEN构造，使得融合蛋白可以具有至少约5nm、或至少约8nm、或至少约10nm、或12nm或至少约15nm的流体动力学半径。在前述实施方案中，GPXTEN融合蛋白中XTEN赋予的大流体动力学半径可以导致所得融合蛋白的肾清除降低，导致相应的终末半衰期增加、平均保留时间增加和/或肾清除率降低。

在另一实施方案中，选定长度和序列的XTEN可以被选择性加入GPXTEN以产生在生理条件下具有至少约150kDa、或至少约300kDa、或至少约400kDa、或至少约500kDA、或至少约600kDa、或至少约700kDA、或至少约800kDa、或至少约900kDa、或至少约1000kDa、或至少约1200kDa、或至少约1500kDa、或至少约1800kDa、或至少约2000kDa、或至少约2300kDa或更大的表观分子量的融合蛋白。在另一实施方案中，选定长度和序列的XTEN可以选择性与GP连接以产生在生理条件下具有至少3、可选地至少4、可选地至少5、可选地至少6、可选地至少8、可选地至少10、可选地至少15的表观分子量因子，或至少20或更大的表观分子量因子的GPXTEN融合蛋白。在另一实施方案中，GPXTEN融合蛋白在生理条件下具有相对于融合蛋白的实际分子量约4至约20、或约6至约15、或约8至约12或约9至约10的表观分子量因子。

V)GPXTEN结构构型和性质

主题组合物的GP不限于天然的全长多肽，还包括其重组形式以及生物和/或药理活性的变体或片段。例如，要理解，可以在GP中进行各种氨基酸缺失、插入和取代以产生在GP的生物活性或药理性质方面不背离本发明精神的变体。多肽序列中氨基酸保守取代的实例示于表6。然而，在其中GP与本文公开的特定序列相比序列同一性小于100%的GPXTEN实施方案中，本发明涵盖其它19种天然L-氨基酸的任何一个取代给定GP的给定氨基酸残基，所述给定氨基酸残基可以在GP序列内的任何位置，包括相邻的氨基酸残基。如果任何一个取代导致不期望的生物活性变化，则可以采用可选氨基酸之一并通过本文描述的方法或使用例如美国专利No.5,364,934(其全部内容通过引用并入)中提出的关于保守和非保守突变的任何技术和指导或使用本领域公知的方法来评估构建体。此外，变体可以包括例如其中在GP的全长天然氨基酸序列的N端或C端添加或缺失一个或多个氨基酸残基并且保留天然肽的一定的(如果不是全部)生物活性的多肽。

表6:示例性保守氨基酸取代

原始残基	示例性取代
		Ala(A)	val;leu;ile
Arg(R)	lys;gin;asn
		Asn(N)	gin;his;Iys;arg
Asp(D)	Glu
		Cys(C)	Ser
Gln(Q)	Asn
		Glu(E)	Asp
Gly(G)	Pro
		His(H)	asn:gin:Iys:arg
xIle(I)	leu;val;met;ala;phe:正亮氨酸
		Leu(L)	正亮氨酸:ile:val;met;ala:phe
Lys(K)	arg:gin:asn
		Met(M)	leu;phe;ile
Phe(F)	leu:val:ile;ala
		Pro(P)	Gly
Ser(S)	Thr
		Thr(T)	Ser
Trp(W)	Tyr
		Tyr(Y)	trp:phe:thr:ser
Val(V)	ile;leu;met;phe;ala;正亮氨酸

a.GPXTEN融合蛋白构型

本发明提供了具有以特定的N端至C端构型连接的GP和XTEN组分的GPXTEN融合蛋白组合物。在一些实施方案中，在使用或不使用间隔区的情况下，一个或多个GP在N端或C端与一个或多个XTEN连接，以形成嵌段共聚物，并且GPXTEN融合蛋白中GP和XTEN的顺序排列与嵌段共聚物化学中已知的构型一样。当存在不止一个GP、XTEN或间隔区时，GP、XTEN或间隔区的每一个具有相同或不同的序列，并且GP和/或XTEN连续或交替(规则或不规则)连接。因此，在本文提供的所有式中，当存在不止一个GP、XTEN或间隔区时，GP、XTEN或间隔区的每一个相同或不同。在一些实施方案中，GPXTEN是单聚体融合蛋白，具有与一个XTEN多肽连接的GP。在其它情况下，GPXTEN是单聚体融合蛋白，具有与两个或多个XTEN多肽连接的GP。在其它实施方案中，GPXTEN是单聚体融合蛋白，具有与一个XTEN多肽连接的两个或多个GP。在其它实施方案中，GPXTEN是单聚体融合蛋白，具有与两个或多个XTEN多肽连接的两个或多个GP。表7提供了本发明GPXTEN融合蛋白所涵盖的构型的非限制性实例；许多其它变化对于普通技术人员是明显的，包括本文公开或本领域已知的间隔区和裂解序列的加入。

表7:GPXTEN构型

*特征为对于1种组分为单个或对于2种或多种该组分为多个

**反映生长因子和XTEN组分的N端至C端构型

本发明涵盖GPXTEN融合蛋白组合物，包含但不限于以表7所示构型的选自表1-3的序列的GP(或其片段或序列变体)、选自表5的XTEN(或其序列变体)。一般而言，得到的GPXTEN将保留未连接XTEN的相应GP的生物活性的至少一部分。在其它实施方案中，GP组分在其通过加入GPXTEN的间隔区序列内的任选裂解序列的裂解而从XTEN释放时变得具有生物活性或活性增加，如下文更全面描述。

(XTEN)_x-GP-(XTEN)_y I

(XTEN)_x-(GP)-(S)_y-(XTEN)_y II

其中每次出现时独立地，GP是葡萄糖调节肽；S是具有1至约50个氨基酸残基的间隔区序列，其可任选地包含裂解序列；x是0或 1且y是0或1，其中x+y≥1；并且XTEN是延伸的重组多肽。

在另一实施方案中，本发明提供了分离的融合蛋白，其中所述融合蛋白具有式III：

(GP)-(S)_x-(XTEN)-(S)_y-(GP)-(S)_z-(XTEN)_z III

(XTEN)_x-(S)_y-(GP)-(S)_z-(XTEN)-(GP) IV

((S)_m-(GP)_x-(S)_n-(XTEN)_y-(S)_o)_t VIII

其中t是大于0的整数(1、2、3、4等)；m、n、o、x和y各自独立地为整数(1、2、3、4等)，GP是葡萄糖调节肽；S是间隔区，任选地包含裂解位点；并且XTEN是延伸的重组多肽，条件是：(1)x+y>1，(2)当t=1时，x>0且y>0，(3)当存在不止一个GP、S或XTEN时，每个GP、XTEN或S是相同的或独立不同的；并且(4)当t>1时，每个亚单位中的m、n、o、x或y是相同的或独立不同的。

在一些情况下，治疗有效剂量的式I-VIII的实施方案的融合蛋白施用给有相应需要的受试者可导致在融合蛋白治疗窗内维持的时间增加至以类似剂量施用给受试者的未连接XTEN的相应GP的至少2倍、或至少3倍、或至少4倍、或至少5倍或更多。在其它情况中，治疗有效剂量的式I-VIII的实施方案的融合蛋白施用给有相应需要的受试者可以导致与以类似剂量施用的未连接XTEN的GP相比，维持治疗有效剂量方案所必需的连续剂量之间时间的增加至连续剂量之间至少48h、或至少72h、或至少约96h、或至少约120h、或至少约7天、或至少约14天、或至少约21天。

任何间隔区序列基团在本发明涵盖的融合蛋白中是任选的。可提供间隔区以增强融合蛋白从宿主细胞的表达或降低空间位阻，使得GP组分可以采取其期望的三级结构和/或适当地与其靶受体相互作用。关于间隔区和鉴定期望间隔区的方法参见例如George,等(2003)Protein Engineering15:871–879，明确地通过引用的方式并入。在一个实施方案中，间隔区包含长度为1-50个氨基酸残基或者长度为约1-25个残基或约1-10个残基的一个或多个肽序列。除去裂解位点，间隔区序列可以包含20种天然L氨基酸的任何一个，并且将优选地包含无空间位阻的亲水性氨基酸，所述亲水性氨基酸可以包括但不限于甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)。在一些情况下，间隔区可以是多聚甘氨酸或多聚丙氨酸，或者主要是甘氨酸和丙氨酸残基组合的混合物。除去裂解序列，间隔区多肽大部分基本上没有二级结构；例如通过Chou-Fasman和/或GOR算法测定小于约10%或小于约5%。在一个实施方案中，GPXTEN融合蛋白组合物中一个或两个间隔区序列各自还可包含可以是相同或不同的裂解序列，其中所述裂解序列可以受蛋白酶作用以从融合蛋白释放GP。

在一些情况下，设计裂解序列加入GPXTEN以允许在从XTEN释放时变得有活性或活性更强的GP的释放。裂解序列位于与GP序列足够近，一般在GP序列末端的18、或12、或6、或2个氨基酸之内，使得与GP连接的任何其余残基在裂解之后不明显干扰GP的活性(例如，诸如结合至受体)，而提供对蛋白酶的足够接近以能够实现裂解序列的裂解。在一些实施方案中，裂解位点是可通过哺乳动物受试者内源性蛋白酶裂解的序列，使得GPXTEN可以在施用给受试者之后被裂解。在此类情况下，GPXTEN可以用作GP的前药或循环贮剂。本发明涵盖的裂解位点的实例包括但不限于可被哺乳动物内源性蛋白酶或被非哺乳动物蛋白酶裂解的多肽序列，所述哺乳动物内源性蛋白酶选自FXIa、FXIIa、激肽释放酶、FVIIa、FIXa、FXa、FIIa(凝血酶)、弹性蛋白酶-2、粒酶B、MMP-12、MMP-13、MMP-17或MMP-20，所述非哺乳动物蛋白酶例如TEV、肠激酶、PreScission^TM蛋白酶(鼻病毒3C蛋白酶)和分选酶A。已知被前述蛋白酶和其它蛋白酶裂解的序列是本领域已知的。示例性的裂解序列和序列内切割位点及序列变体提供于表8。例如，凝血酶(活化的凝血因子II)作用于序列LTPRSLLV(SEQ ID NO:210)[Rawlings N.D.,等(2008)核酸Res.,36:D320]，其可以在序列中位置4的精氨酸之后被切割。活性FIIa通过FXa在磷脂和钙存在下裂解FII而产生并且在凝结途径中因子IX的下游。一旦被活化，其在凝结中的天然作用是裂解纤维蛋白原，然后转而开始血块形成。FIIa活性被严格控制并且仅在凝结是适当止血所必要的时候发生。然而，因为凝结在哺乳动物中是持续的过程，通过将LTPRSLLV(SEQ ID NO:211)序列加入GP与XTEN之间的GPXTEN，当生理上需要凝结时，XTEN结构域将从结合的GP去除，同时活化外在或内在的凝结途径，从而随时间释放GP。类似地，将由内源性蛋白酶作用的其它序列加入GPXTEN将提供GP的持续释放，这在某些实施方案中可提供来自GPXTEN的“前药”形式的GP的更高程度的活性。

在一些情况下，切割位点两侧仅两个或三个氨基酸(共计4至6个氨基酸)将被加入裂解序列。在其它情况下，已知的裂解序列可具有针对已知序列中任何一个或两个或三个氨基酸的一个或多个缺失或插入或一个或两个或三个氨基酸取代，其中所述缺失、插入或取代导致对蛋白酶减少或增加的易感性而非易感性缺乏，导致修改的GP从XTEN释放的速率的能力。示例性取代示于表8。

表8:蛋白酶裂解序列

↓指示裂解位点 NA:不适用

*斜杠之前、之间或之后的多个氨基酸的列表指示在该位置可以被取代的可选氨基酸；“-”指示任何氨基酸可以取代中间列中指示的相应氨基酸。

在一个实施方案中，被加入GPXTEN融合蛋白的GP的序列与表1-3的序列具有至少约80%序列同一性，可选地与表1-3的序列相比具有至少约81%、或约82%、或约83%、或约84%、或约85%、或约86%、或约87%、或约88%、或约89%、或约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%、或约100%序列同一性。前述实施方案的GP可以使用本文描述的分析或测量或测定参数来评价活性，并且与相应的天然GP序列相比保留至少约40%、或约50%、或约55%、或约60%、或约70%、或约80%、或约90%、或约95%或更多活性的那些序列将被认为适合加入主题GPXTEN。发现保留适当水平活性的GP可以与上文描述的一个或多个XTEN多肽连接。在一个实施方案中，发现保留适当水平活性的GP可以与和表5序列具有至少约80%序列同一性、可选地与表5序列相比具有至少约81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或约100%序列同一性的一个或多个XTEN多肽连接，得到嵌合的融合蛋白。

含有与单个XTEN连接的单个GP的融合蛋白序列的非限制性实例提供于表36，并且含有与两个XTEN连接的单个GP的融合蛋白序列提供于表37。在一个实施方案中，GPXTEN组合物将包含与表36-37的GPXTEN具有至少约80%序列同一性、可选地与表36-37的GPXTEN相比具有至少约81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或约100%序列同一性的融合蛋白。但是，本发明还涵盖用与一个或两个XTEN连接的显示与选自表1-3的序列具有至少约90%序列同一性的序列取代其它GP，所述XTEN可以相同或不同，与选自表5的序列至少约90%序列同一性。在该段上文描述的前述融合蛋白中，GPXTEN融合蛋白还可以包含表8的裂解序列；所述裂解序列位于GP和XTEN之间或者相邻GP之间(如果GPXTEN包含不止一个GP)。在一些情况下，包含裂解序列的GPXTEN还在GP和裂解序列之间或XTEN和裂解序列之间具有一个或多个间隔区序列氨基酸，以促进蛋白酶的接近；间隔区氨基酸包括任何天然氨基酸，包括作为优选氨基酸的甘氨酸和丙氨酸。包含GP、XTEN、裂解序列和间隔区氨基酸的GPXTEN的非限制性实例提供于表38。然而，本发明还涵盖用表1-3的任何一个GP序列取代表36-38的GP序列、用表5的任何XTEN序列取代表36-38的XTEN序列和用表8的任何裂解序列取代表38的裂解序列。

b.GPXTEN的药代动力学性质

本发明提供了与未连接XTEN的GP相比具有增强的药代动力学的GPXTEN融合蛋白，当通过本文描述的方法以针对组合物确定的剂量使用时，可以实现导致药理效应的循环浓度，而与类似剂量的未连接XTEN的GP相比保持在组合物生物活性组分的安全范围内延长的时段。在此类情况下，GPXTEN在融合蛋白组合物的治疗窗内保持延长的时段。本文使用的“类似剂量”指以类似方式施用给受试者的活性GP药效团的相等摩尔/kg的剂量。在本领域应理解，“类似剂量”的GPXTEN融合蛋白将代表更大重量的物质，但在融合蛋白剂量中具有基本上相同的摩尔当量的GP，和/或相对于GP具有相同的近似摩尔浓度。

可以通过将给定的XTEN与GP连接来增强的GP的药代动力学性质包括终末半衰期、曲线下面积(AUC)、C_max分布体积和提供在治疗葡萄糖调节肽相关疾患、疾病和相关病症中增强的效用的生物利用率。表现增强的PK性质的GPXTEN组合物的GP可以是显示与选自表1-3的蛋白质序列具有至少约80%序列同一性、或可选地81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的序列，与显示与选自表5的蛋白质序列具有少约80%序列同一性、或可选地81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的一个或多个XTEN连接，并且可以处于选自表7的构型的构型。

如实施例中对包含XTEN的融合蛋白的药代动力学特征更全面描述的，出人意外地发现，增加XTEN序列的长度可带来包含XTEN的融合蛋白终末半衰期不成比例的增加。因此，本发明提供了包含XTEN的GPXTEN融合蛋白，其中XTEN可被选择为施用给受试者的GPXTEN组合物提供目标半衰期。在一些实施方案中，本发明提供了包含XTEN的单聚体融合蛋白，其中选择XTEN为施用给受试者的GPXTEN带来与以类似剂量施用的未连接融合蛋白的相应GP相比终末半衰期的增加，增加至未连接融合蛋白的GP的终末半衰期的至少约2倍、或至少约3倍、或至少约4倍、或至少约5倍、或至少约6倍、或至少约7倍、或至少约8倍、或至少约9倍、或至少约10倍、或至少约15倍、或至少20倍、或至少40倍、或至少80倍、或至少100倍或更高。已经报道外源施用的exendin-4在人中具有2.4h的终末半衰期并且胰高血糖素具有小于20分钟的半衰期，而如实施例所述，实验施用给各个动物物种的本文公开的各种GPXTEN组合物已导致数小时的终末半衰期值。类似地，与以类似剂量施用给受试者的未连接融合蛋白的相应GP相比，GPXTEN融合蛋白可以具有至少约50％的AUC增加、或者至少约60％、或至少约70％、或至少约80％、或至少约90％、或至少约100％、或至少约150％、或至少约200％、或至少约300％、或至少约500％、或至少约1000％、或至少约2000％的AUC增加。GPXTEN的药代动力学参数可以通过标准方法测定，包括给药、以时间间隔取血样和使用ELISA、HPLC、放射性分析或本领域已知或本文描述的其它方法分析蛋白，随后标准计算数据以推导半衰期和其它PK参数。

本发明还提供了包含任选地被间隔区序列间隔或被第二XTEN序列间隔的第一和第二GP分子的GPXTEN，所述间隔区序列还可以包含裂解序列。在一个实施方案中，与融合蛋白连接的GP与未连接融合蛋白的相应GP相比具有较低活性。在此类情况下，GPXTEN可被设计为在施用给受试者后，GP组分通过裂解序列的裂解而逐渐释放，由此它重新获得活性或与其靶受体或配体结合的能力。因此，前述的GPXTEN用作前药或循环贮剂，导致与未连接融合蛋白的GP相比更长的终末半衰期。

c.GPXTEN的药理学和药学性质

本发明提供了包含与XTEN共价连接的GP的GPXTEN组合物，与未连接XTEN的GP相比，XTEN可具有增强的性质，还提供了增强该组合物的两个GP组分各自的治疗活性和/或生物活性或效应的方法。此外，本发明提供了与含有免疫球蛋白多肽配偶体、较短长度的多肽和/或具有重复序列的多肽配偶体的那些本领域已知融合蛋白相比具有增强的性质的GPXTEN组合物。此外，GPXTEN融合蛋白提供了超越化学偶联物例如聚乙二醇化构建体的显著优势，值得注意的事实是，重组GPXTEN融合蛋白可以在细菌细胞表达系统中制备，这可以减少产物的研发和生产阶段的时间和花费，并且得到与聚乙二醇化的偶联物相比更均一确定的产物，该产物和GPXTEN代谢物具有更低的毒性。

作为治疗剂，GPXTEN可具有优于不包含XTEN的治疗剂的许多优势，包括以下非限制性示例性增强性质的一个或多个：增加的溶解度、增加的热稳定性、减少的免疫原性、增加的表观分子量、减少的肾清除、减少的蛋白水解、减少的代谢、增强的治疗效力、较低的有效治疗剂量、增加的生物利用率、增加的能够维持血药水平在GP治疗窗内的剂量间的时间、“修改的”吸收率、增强的冻干稳定性、增强的血清/血浆稳定性、增加的终末半衰期、增加的血流溶解度、降低的中和抗体的结合、降低的受体介导的清除、减少的副作用、受体/配体结合亲和力或受体/配体活化的保留、降解稳定性、冻融稳定性、对蛋白酶的稳定性、对遍在蛋白化的稳定性、容易施用、与其它药物赋形剂或载体的相容性、在受试者中的持久性、增加的存储稳定性(例如，增加的半衰期)、生物体或环境中减少的毒性等。增强的性质的净效应在于GPXTEN在施用给患有葡萄糖调节肽相关疾病或疾患的受试者时可导致增强的治疗效果和/或生物效应或改善的患者依从性。

在其它情况下，当期望增强GP的药学或物理化学性质(例如水溶解度或稳定性的程度)时，第一和第二融合蛋白的第一和第二XTEN序列的长度和/或基序家族组成可以各自被选择为赋予各自融合蛋白不同的溶解度和/或稳定性程度，使得GPXTEN组合物的整体药学性质被增强。GPXTEN融合蛋白可以使用本文所述的方法构建并分析以确认物理化学性质，并且按需要调整XTEN以得到期望的性质。在一个实施方案中，选择GPXTEN的XTEN序列为使融合蛋白的水溶解度比未连接融合蛋白的GP大至少约25%，或者比未连接融合蛋白的相应GP大至少约30%、或至少约40%、或至少约50%、或至少约75%、或至少约100%、或至少约200%、或至少约300%、或至少约400%、或至少约500%、或至少约1000%。在该段落描述的上述事实方案中，融合蛋白的XTEN可与选自表5的XTEN具有至少约80%序列同一性，或约90%、或约91%、或约92%或约93%或约94%或约95%或约96%或约97%或约98%或约99%至约100%序列同一性。

在一个实施方案中，本发明提供了GPXTEN组合物，该GPXTEN组合物与相似剂量的未连接XTEN的相应GP相比可以使GP组分在治疗窗中维持更长的时段。在本领域应理解，“类似剂量”的GPXTEN融合蛋白代表更大重量的物质，但在融合蛋白剂量中具有近似相同的摩尔当量的GP，和/或相对于GP具有相同的近似摩尔浓度。

本发明还提供选择适合偶联的XTEN的方法以提供期望的药代动力学性质，当与剂量的选自配合时，所述药代动力学性质通过使GP循环浓度在治疗窗内维持延长的时段而实现施用组合物提高的效力。本文使用的“治疗窗”表示作为血液或血浆浓度范围的药物或生物制剂的量，其提供针对疾病或病症的随时间的效力或期望的药理效应而无不可接受的毒性；实现任何积极治疗效果的最小量与导致即将对受试者产生毒性(以更高剂量或浓度)的应答的最大量之间的循环血药浓度范围。此外，治疗窗一般涵盖时间方面；导致期望的随时间的药理效应的最大浓度和最小浓度，不导致不可接受的毒性或不良事件。保留在受试者治疗窗内的剂量组合物还可以被称为在“安全范围内”。

本发明GPXTEN组合物的特征(包括功能特征或生物和药理活性以及所得到的参数)通过本领域已知用于测量期望特征的任何适合的筛选测定来确定。本发明提供了测定不同组成或构型的GPXTEN融合蛋白的方法以提供具有期望程度的生物和/或治疗活性以及安全性特征的GPXTEN。可使用特定的体内和离体生物测定来评估每种构型的GPXTEN和/或待加入GPXTEN的GP组分的活性，包括但不限于实施例的测定、表35的那些测定、以及以下测定或本领域已知用于测定GP性质和效应的其它此类测定。可以进行测定以允许确定GPXTEN对GP受体或配体的结合特征，包括结合常数(K_d)、EC₅₀值以及其配体-受体复合物解离半衰期(T_1/2)。结合亲和力可以例如通过竞争型结合测定来测量，竞争型结合测定检测特异性结合受体的能力变化(参见例如，实施例)。此外，诸如流式细胞术或表面等离子体共振的技术可用于检测结合事件。所述测定可以包括可溶性受体分子，或者可以测定与细胞表达受体的结合。此类测定可以包括基于细胞的测定，包括对钙通量、信号转导和细胞增殖的测定。其它可能的测定可以测定表达多肽的受体结合，其中所述测定可以包括可溶性受体分子，或者可以测定与细胞表达受体的结合。GPXTEN对相应GP的靶受体或配体的结合亲和力可以使用结合或竞争性结合测定来测定，例如美国专利5,534,617中描述的使用芯片结合受体或结合蛋白的Biacore测定或ELISA测定、本文实施例中描述的测定、放射性受体测定、或本领域已知的其它测定。此外，可以使用竞争性ELISA结合测定来比较GP序列变体(作为单个组分或作为GPXTEN融合蛋白来测定)与天然GP，以确定它们是否具有与天然GP或其某些部分相同的结合特异性和亲和力，使得它们适合纳入GPXTEN。功能性测定可以包括由于暴露于GPXTEN而引起的胰岛素聚集和/或在靶细胞内的产生，和/或β细胞的刺激效应、葡萄糖吸收和/或稳态、HbA1c浓度、胰岛素浓度、受激的C肽、空腹血糖(FPG)、血清细胞因子水平、CRP水平、胰岛素分泌和得自口服葡萄糖耐受试验(OGTT)的胰岛素敏感指数以及体重、食物消耗，并且其它本领域已知的已接受的糖尿病标志将是评估纳入GPXTEN融合蛋白的GP或所得GPXTEN的活性的合适参数。

剂量优化对于所有药物是重要的，特别是对于具有窄治疗窗的那些药物。例如，标准化的单剂量GP对于具有多样症状或异常临床参数的所有患者不总是有效的。这些因素的考虑完全在普通技术人员能力范围内，目的是确定GPXTEN的治疗或药理学有效量以及会导致不可接受的毒性和安全范围以外的量或者不足效价而无法实现临床改善的量。

在许多情况下，GP在不同年龄或疾病程度的受试者中的治疗窗已经被确立并可获自公开的文献或陈述于含有GP的批准产品的药物标签上。在其它情况下，可确立治疗窗。为给定组合物确立治疗窗的方法是本领域技术人员已知的(参见例如,Goodman&Gilman'sThe Pharmacological Basis of Therapeutics,第11版,McGraw-Hill(2005))。例如，通过在具有目标疾病或疾患的受试者中使用剂量放大研究来确定效力或期望的药理效应、不良事件的出现并测定循环血药水平，可以针对给定受试者或受试者群测定给定药物或生物制剂、或生物制剂或药物的组合的治疗窗。剂量放大研究可以通过在受试者或受试者群中监测生理或生化参数的代谢研究来评估GPXTEN的活性，如本领域已知或本文描述的有关以下的参数：与代谢疾病或疾患有关的一个或多个参数，或与特定适应症的有益结果有关的临床参数，以及确定无效剂量、不良事件、最大耐受剂量等的观察和/或测量参数，以及确立测定或推导的循环血药水平的药代动力学参数的测量。然后可以将结果与符合前述测定参数或效应水平的治疗剂的施用剂量和血药浓度相关联。通过这些方法，一系列剂量和血药浓度可以与发生期望效应和即将发生毒性的最小有效剂量及最大剂量和血药浓度相关联，从而确立给药治疗剂的治疗窗。高于最大值的融合蛋白(或通过GP组分测量)的血药浓度将被认为在治疗窗或安全范围以外。因此，通过前述方法，将确立C_min血药水平和C_max血药水平，低于C_min血药水平时，GPXTEN融合蛋白将不具有期望的药理效应，而C_max血药水平将代表达到下述浓度之前的最高循环浓度：将引发不可接受的副作用、毒性或不良事件，使之处于GPXTEN的安全范围以外。随着此类浓度的确立，给药频率和剂量可以通过测量C_max和C_min来进一步确定，以提供适合的剂量和给药频率以保持融合蛋白在治疗窗内。通过本文描述的方式或通过本领域已知的其它方法，本领域技术人员可以确认施用的GPXTEN在治疗窗内维持期望的间隔时间或者需要调整剂量或XTEN的长度或序列。而且，确定保持GPXTEN在治疗窗内的适当剂量和给药频率确立了治疗有效剂量方案；使用治疗有效剂量的融合蛋白对给有相应需要的受试者施用多个连续剂量的计划表导致连续的C_max峰和/或C_min谷，其保持在治疗窗内并且导致与目标疾病、疾患或病症相关的至少一个测量参数的改善。在一些情况下，以适当剂量施用给受试者的GPXTEN可导致GPXTEN融合蛋白的血药浓度在治疗窗内维持的时段是以类似剂量施用的未连接XTEN的相应GP的至少约2倍；可选地是以类似剂量施用的未连接XTEN的相应GP的至少约3倍；可选地为至少约4倍；可选地为至少约5倍；可选地为至少约6倍；可选地为至少约7倍；可选地为至少约8倍；可选地为至少约9倍或为至少约10倍或更长。本文使用的“适当剂量”指当药物或生物制剂施用给受试者时会导致期望的治疗或药理效应以及在治疗窗内血药浓度的剂量。

在一个实施方案中，以治疗有效剂量方案施用的GPXTEN导致融合蛋白的血药水平的至少两个连续C_max峰和/或C_min谷之间的时间增加至使用类似剂量方案施用给受试者的未与融合蛋白连接的融合蛋白的相应生物活性蛋白的至少约3倍；可选地至少约4倍；可选地至少约5倍；可选地至少约6倍；可选地至少约7倍；可选地至少约8倍；可选地至少约9倍或至少约10倍。在另一实施方案中，以治疗有效剂量方案施用的GPXTEN导致与使用GP的治疗有效剂量方案施用给受试者的未与融合蛋白连接的相应生物活性蛋白相比，在使用药物组合物的融合蛋白的较低频率给药或较低总剂量(以摩尔计)时实现一个或两个或三个或更多测量参数的类似改善。所述测量参数可包括本文公开的临床、生化或生理参数、或者本领域已知用于评估患有葡萄糖或胰岛素相关疾患的受试者的其它参数。

本发明GPXTEN组合物的活性(包括功能特征或生物和药理活性以及所得到的参数)可通过本领域已知用于测量期望特征的任何适合的筛选测定来确定。使用选自表35的一种或多种测定、实施例的测定或本领域已知确定溶解度、结构和生物活性保留的方法，通过测量本文所述的参数，可评估包含GP组分的GPXTEN多肽的活性和结构。可以进行测定以允许确定GPXTEN对GP受体或配体的结合特征，包括结合常数(K_d)、EC₅₀值以及其配体-受体复合物解离半衰期(T_1/2)。结合亲和力可以例如通过竞争型结合测定来测量，竞争型结合测定检测特异性结合受体的能力变化(参见例如，实施例)。此外，诸如流式细胞术或表面等离子体共振等的技术可用于检测结合事件。所述测定可以包括可溶性受体分子，或者可以测定与细胞表达受体的结合。此类测定可以包括基于细胞的测定，包括对增值、细胞死亡、凋亡和细胞迁移的测定。其它可能的测定可以测定表达多肽的受体结合，其中所述测定可以包括可溶性受体分子，或者可以测定与细胞表达受体的结合。GPXTEN对相应GP的靶受体或配体的结合亲和力可以使用结合或竞争性结合测定来测定，例如美国专利5,534,617中描述的使用芯片结合受体或结合蛋白的Biacore测定或ELISA测定、本文实施例中描述的测定、放射性受体测定或本领域已知的其它测定。此外，可以使用竞争性ELISA结合测定来比较GP序列变体(作为单个组分或作为GPXTEN融合蛋白来测定)与天然GP，以确定它们是否具有与天然GP或其某些部分相同的结合特异性和亲和力，使得它们适合纳入GPXTEN。

本发明提供了分离的GPXTEN，其中GPXTEN对GP靶受体或配体的结合亲和力可以是未连接XTEN的天然GP对靶受体或配体结合亲和力的至少约10%、或至少约20%、或至少约30%、或至少约40%、或至少约50%、或至少约60%、或至少约70%、或至少约80%、或至少约90%、或至少约95%、或至少约99%、或至少约100%。在一些情况下，主题GPXTEN与GPXTEN的天然受体或配体之间的结合亲和力K_d是GPXTEN与天然受体或配体之间亲和力的至少约10^-4M、可选地至少约10^-5M、可选地至少约10^-6M、或至少约10^-7M、或至少约10^-8M、或至少约10^-9M。

在其它情况下，本发明提供了特别设计为对GP受体具有降低的结合亲和力的分离的GPXTEN融合蛋白。在一个实施方案中，诸如包含XTEN的融合蛋白与GP组分的C端融合。在一些情况下，可将GPXTEN构造为具有降低的结合亲和力，其中所述结合亲和力通过体外细胞受体结合测定来评估，其中与天然GP相比使结合降低约10%、或约20%、或约40%、或约60%、或约80%或约90%。在其它情况下，可将GPXTEN构造为具有降低的结合亲和力，其中所述结合亲和力通过信号转导来评估，其中与天然GP配体引起的信号转导途径活化相比，GPXTEN融合蛋白引起具有结合GPXTEN的细胞的信号转导途径的小于约80%、或小于约60%、或小于约40%、或小于约20%、或小于10%或小于约5%的活化。在前述情况下，结合亲和力被“本质上降低”。具有降低的结合亲和力的这类GPXTEN的特异性构建体的非限制性实例包括以下的融合蛋白：与选自AE912-GP-AE144、AE912-GP-AF144、AE912-GP-AE288、AM923-GP-AE144、AM923-GP-AF144、AM923-GP-AE288的GP融合蛋白具有至少约80%序列同一性、或至少约85%序列同一性、或至少约90%序列同一性、或至少约95%序列同一性、或至少约97%序列同一性或至少约99%序列同一性。

在一些情况下，就已知的体外生物活性或药理效应或与在治疗和预防代谢病症和疾患中使用天然GP相关的体外生物活性或药理效应而言，本发明GPXTEN融合蛋白保留了未连接融合蛋白的相应GP的生物活性的至少约10%、或约20%、30%、40%、50%、60%、70%、80%、90%、95%、98%或99%。可以被测定以评估GPXTEN融合蛋白的保留活性的活性或药理效应的非限制性实例包括测定响应于受体结合的钙通量和/或信号转导、由于暴露于GPXTEN而引起的胰岛素聚集和/或在靶细胞内的产生，和/或引起的β细胞的刺激效应、葡萄糖吸收和/或稳态、HbA1c浓度、胰岛素浓度、受激的C肽、空腹血糖(FPG)、血清细胞因子水平、CRP水平、胰岛素分泌和得自口服葡萄糖耐受试验(OGTT)的胰岛素敏感指数以及体重、食物消耗，并且其它本领域已知的已接受的糖尿病标志将是评估纳入GPXTEN融合蛋白的GP或所得GPXTEN的活性的合适参数。

在前述实施方案的一些情况下，GP组分的活性可通过完整的GPXTEN融合蛋白显现，而在其它情况下，GP组分的活性将主要在GP从融合蛋白裂解和释放时显现，所述裂解和释放是通过作用于加入GPXTEN融合蛋白的裂解序列的蛋白酶的作用。在前述中，GPXTEN可被设计为GP组分在与XTEN连接时对受体或配体的结合亲和力降低，但是通过裂解加入GPXTEN序列的裂解序列而从XTEN释放时恢复或增加亲和力，如上文更全面描述。

在其它情况下，GPXTEN可以被设计为降低GP组分与GP受体的结合亲和力以通过降低受体介导的清除而增加施用给受试者的GPXTEN的终末半衰期；例如通过向融合蛋白的GP组分的C端添加XTEN。在其它情况下，GPXTEN被设计为降低GP组分与GP受体的结合亲和力以降低由施用的组合物带来的毒性或副作用。

因此，本发明提供了通过制备包含至少第一GP和第一及第二XTEN的单链融合蛋白构建体来增加GPXTEN终末半衰期的方法，所述构建体的组分具有特定的N端至C端构型，其中GP和XTEN组分为第一N端至C端构型的融合蛋白与具有第二N端至C端构型的GPXTEN相比具有降低的受体介导的清除(RMC)和相应终末半衰期的增加。在前述一个实施方案中，GPXTEN构造为N端至C端XTEN-GP-XTEN，其与N端至C端XTEN-GP构型的GPXTEN相比具有降低的受体结合。在前述另一实施方案中，GPXTEN构造为GP-XTEN。在前述实施方案中，两个XTEN分子可以相同，或者它们可以具有不同的序列组成或长度。具有与单个GP连接的两个XTEN的前述实施方案的非限制性实例包括构建体AE912-GP-AE144、AE912-GP-AE288、AE864-GP-AE144、AM923-GP-AE144和AM923-GP-AE288。本发明涵盖其它此类构建体，其中将表1-3的GP和表5的XTEN取代为前述实例的各自组分，并且可例如以表7的构型产生，使得构建体与各自组分的可选构型相比具有降低的受体介导的清除。在一些情况下，增加终末半衰期的前述方法提供了构造的GPXTEN，其可以导致与其中受体结合未降低的第二种构型的GPXTEN的半衰期相比至少约50%、或约75%、或约100%、或约150%、或约200%、或约300%、或约400%或更多的血清半衰期增加。本发明利用如下事实：其中由于降低的结合速率或增加的解离速率而引起对受体结合亲和力降低的某些配体可以通过阻碍N端或C端和使用该端作为与组合物中另一肽的连接来实现，而不管GP、XTEN或间隔区序列的另一分子是否导致降低的结合亲和力。GPXTEN融合蛋白特定构型的选择可降低对受体结合亲和力的程度，从而可实现降低的受体介导的清除率。一般而言，受体的活化与RMC偶联，使得多肽与其未活化受体的结合不导致RMC，而受体的活化导致RMC。然而，在一些情况下，特别是当配体具有增加的解离速率时，配体仍然能够足够结合以引发细胞信号转导而不促发受体介导的清除，净结果是GPXTEN保持可生物利用的。在此类情况下，该构造的GPXTEN与导致更高程度RMC的那些构型相比具有增加的半衰期。

在其中期望降低对葡萄糖调节肽受体的结合亲和力以降低受体介导的清除但期望保留至少一部分生物活性的情况下，清楚的是足以获得期望的受体活化的结合亲和力必须仍然例如通过引发信号转导来保持。因此，在一个实施方案中，本发明提供了GPXTEN，其构造为使得GPXTEN对靶受体的结合亲和力是其中结合亲和力未降低的构型的相应GPXTEN的结合亲和力的约0.01%-40%、或约0.1%-30%或约1%-20%范围内。因此优选地，该构造的BXTEN的结合亲和力与其中在类似条件下测定的GP组分对靶受体结合亲和力未降低的构型的相应GPXTEN的结合亲和力相比或者与未连接融合蛋白的GP相比降低至少约60%、或至少约70%、或至少约80%、或至少约90%、或至少约95%、或至少约99%、或至少约99.99%。差异表达时，该构造的GPXTEN的GP组分的结合亲和力可以是其中GP组分的结合亲和力未降低的构型的GPXTEN的相应GP组分的结合亲和力的约0.01%、或至少约0.1%、或至少约1%、或至少约2%、或至少约3%、或至少约4%、或至少约5%、或至少约10%、或至少约20%、或至少约30%、或至少40%。在本段描述的上文前述实施方案中，该构造的GPXTEN对靶受体的结合亲和力与相应的天然GP或其中相应GP组分的结合亲和力未降低的构型的GPXTEN相比是“基本上降低的”。因此，本发明提供了具有降低的RMC的组合物和通过构造在上文提供实例的GPXTEN而产生这种组合物的方法，以能够结合并活化足够数目的受体以获得期望的体内生物应答，但避免活化比获得这种应答所需受体更多的受体的活化。在本段描述的上文前述实施方案中，与未连接XTEN的GP相比或与其中GP组分保留足够生物活性或药理活性的GPXTEN构型相比，增加的半衰期可允许更高的剂量和降低的给药频率，以得到尽管在降低的给药频率下仍维持临床效力的组合物。

VI)本发明组合物的用途

另一方面，本发明提供了用于实现在GP介导的疾病、疾患或病症中的有益效应的方法。本发明解决了具有相对短的终末半衰期和/或最小有效剂量和最大耐受剂量之间的窄治疗窗的GP的缺点和/或限制。

葡萄糖稳态中涉及的大多数过程受多种肽和激素的调节，并且此类肽和激素及其类似物已经用于治疗葡萄糖调节肽相关的疾病、疾患和病症。然而，可商购获得的葡萄糖调节肽的使用在管理罹患此类疾病、疾患和病症的受试者中未达到最佳成功。具体说，剂量优化和给药频率对于用于治疗葡萄糖调节肽相关疾病和疾患的肽和激素生物制剂是重要的。许多葡萄糖调节肽具有短半衰期的事实需要频繁给药以实现临床益处，这导致在此类患者管理中的困难。

在一个实施方案中，本发明提供了在患有葡萄糖调节肽相关的疾病、疾患和病症的受试者中实现有益效应的方法，该方法包括对所述受试者施用治疗或预防有效量的GPXTEN的步骤，其中所述施用导致与葡萄糖调节肽相关的疾病、疾患和病症相关的一个或多个生化或生理参数或临床终点的改善。所述有效量在帮助治疗(例如，治愈或降低严重程度)或预防(例如，减少发作或严重程度的可能性)葡萄糖调节肽相关的疾病、疾患和病症方面可产生有益效应。在一些情况下，用于实现有益效应的方法可包括施用治疗有效量的GPXTEN融合蛋白组合物以治疗患有葡萄糖调节肽相关的疾病、疾患或病症的受试者，葡萄糖调节肽相关的疾病、疾患或病症包括但不限于青少年糖尿病、I型糖尿病、II型糖尿病、肥胖、急性低血糖、急性高血糖、夜间低血糖、慢性高血糖、胰高血糖素瘤、气道的分泌疾患、关节炎、骨质疏松症、中枢神经系统疾病、再狭窄、神经退行性疾病、肾衰竭、充血性心力衰竭、肾病综合症、肝硬化、肺水肿、高血压和其中需要减少食物摄取的疾患、中风、肠道易激综合症、心肌梗塞(例如，降低发病率和/或与其相关的发病率)、中风、急性冠状动脉综合征(例如，以Q波的缺乏为特征)心肌梗塞、术后代谢变化、冬眠心肌或糖尿病心肌病、尿钠排泄不足、尿钾浓度过高、与有毒高血容量有关的病症或疾患(例如，肾衰竭、充血性心力衰竭、肾病综合症、肝硬化、肺水肿和高血压)、多囊卵巢综合症、呼吸窘迫、肾病、左心室收缩功能障碍(例如，具有异常的左心室射血分数)、肠胃疾患诸如腹泻、术后倾倒综合症和肠道易激综合症(即，经由抑制胃窦十二指肠移行性)、危重病多发性神经病(CIPN)、血脂异常、局部缺血后血流再灌注引起的器官组织损伤，和冠心病危险因素(CHDRF)综合症，和任何其它使用非修饰的葡萄糖调节肽(例如exendin-4、GLP-1或胰高血糖素)的适应症，或任何其它可使用GP的适应症(但是受试者的内源性葡萄糖调节肽水平未必不足)。

在另一实施方案中，本发明提供了刺激患有葡萄糖调节肽相关疾病、疾患或缺陷的的受试者中胰岛素分泌的方法。该方法包括对受试者施用治疗有效量的GPXTEN的步骤，导致与接受以类似剂量施用的未连接XTEN的GP的受试者相比，增加的胰岛素血药水平和/或增加的胰岛素血药水平持续时间。在一些情况下，与接受以类似剂量施用的未连接XTEN的GP的受试者相比，胰岛素分泌和/或曲线下面积的增加是至少约20%、或至少约30%、或至少约40%、或至少约50%、或至少约75%、或至少约100%、或至少约200%、或至少约300%。

由于本文描述的GPXTEN增强的PK参数，可使用与未连接XTEN的相应GP相比更长的剂量之间的间隔施用GP，以预防、治疗、减轻、逆转或缓解葡萄糖调节肽相关疾病、疾患和病症的症状或临床异常或延长受治疗的受试者的存活。

本发明方法可包括施用连续剂量的治疗有效量的GPXTEN，持续足以实现和/或维持期望参数或临床效应的时段，并且这种连续剂量的治疗有效量确立了GPXTEN的治疗有效剂量方案；即，融合蛋白组合物的连续施用剂量的计划表，其中剂量以治疗有效量给予以导致对包括但不限于本文描述的那些代谢疾病状态或病症的任何临床体征或症状、方面、测量参数或特征的持续有益效应。在一个实施方案中，所述方法包括对有相应需要的受试者施用治疗有效量的药物组合物，该药物组合物包括含有与XTEN序列连接的GP的GPXTEN融合蛋白组合物和至少一种药学可接受的载体，导致与通过施用包含以类似剂量施用的未连接XTEN的GP的药物组合物介导的效应相比，由GP组分介导的至少一个参数、生理状况或临床结果(非限制性实例如上所述)的更大改善。在一个实施方案中，所述药物组合物以治疗有效剂量施用。在另一实施方案中，所述药物组合物使用利用治疗有效剂量方案(如上所述)的多个连续剂量施用给药期的时段。

GPXTEN的治疗有效量可根据诸如个体的疾病状态、年龄、性别和体重等因素以及抗体或抗体部分在所述个体中引发期望反应的能力而变化。治疗有效量也是其中GPXTEN的治疗有益效应超过任何毒性或有害效应的量。预防有效量指实现期望预防结果所需的时段所需的GPXTEN的量。

对于本发明方法，更长起效的GPXTEN组合物是优选的，以改善患者依从性，以增加剂量之间的间隔并减少实现持续效应所需的药量。在一个实施方案中，治疗方法包括对有相应需要的受试者施用治疗有效剂量的GPXTEN，导致与以类似剂量施用给受试者的未连接融合蛋白的相应GP组分相比，为组合物的融合蛋白确立的治疗窗内维持时间增加。在一些情况下，治疗窗内维持时间的增加是以类似剂量施用给受试者的未连接融合蛋白的相应GP组分的至少约3倍、或至少约4倍、或至少约5倍、或至少约6倍、或至少约8倍、或至少约10倍、或至少约20倍、或至少约40倍。该方法还提供使用治疗有效剂量方案对有相应需要的受试者施用多次连续剂量的GPXTEN的施用可导致与使用针对GP确立的剂量方案施用的未连接融合蛋白的相应GP相比，融合蛋白的血药水平的连续C_max峰和/或C_min谷之间时间的增加。在前述实施方案中，连续C_max峰和/或C_min谷之间时间的增加可以是使用针对GP确立的剂量方案施用的未连接融合蛋白的相应GP组分的至少约3倍、或至少约4倍、或至少约5倍、或至少约6倍、或至少约8倍、或至少约10倍、或至少约20倍、或至少约40倍。在本段描述的上述实施方案中，与以类似单位剂量或剂量方案施用给受试者的未连接融合蛋白的相应GP组分相比，使用较低单位剂量(以摩尔计)融合蛋白施用融合蛋白可导致至少一个参数(本文公开用于评估受试者疾病、病症或疾患)的改善。

治疗方法包括使用治疗有效剂量方案施用GPXTEN以实现与葡萄糖调节肽疾病、疾患或病症相关的一个或多个参数的改善。在一些情况下，对受试者施用GPXTEN可导致生化、生理或临床参数的一个或多个的改善，改善幅度大于使用相同的试验所测定或基于测量的临床参数的未连接XTEN的相应GP组分导致的改善幅度。在其它情况下，对受试者施用GPXTEN可导致生化、生理或临床参数的一个或多个的活性的持续时间比使用相同的试验所测定或基于测量的临床参数的未连接XTEN的单个GP组分之一的活性持续更长。在前述一个实施方案中，对受试者施用GPXTEN可导致与以类似剂量施用给受试者的未连接XTEN的GP相比，受试者中血液GP水平的峰浓度和曲线下面积提高至少约10%、或约20%、或约30%、或约40%、或约50%或更多。在前述另一实施方案中，给受试者施用GPXTEN导致选自但不限于以下的一个或多个参数的增加：HbA1c浓度、胰岛素浓度、受激的C肽、空腹血糖(FPG)、血清细胞因子水平、CRP水平、胰岛素分泌和得自口服葡萄糖耐受试验(OGTT)的胰岛素敏感指数、体重和食物消耗。

本发明还涵盖根据本文提供的方法使用的GPXTEN可与其它治疗方法和药物组合物组合施用，所述其它治疗方法和药物组合物用于治疗葡萄糖调节肽相关疾病、疾患和病症、或葡萄糖调节肽是其联合疗法的病症(例如，胰岛素抵抗和差的血糖控制)。此类组合物可包括例如DPP-IV抑制剂、胰岛素、胰岛素类似物、PPARγ激动剂、双效PPAR激动剂、GLP-1激动剂或类似物、PTP1B抑制剂、SGLT抑制剂、胰岛素分泌促进剂、RXR激动剂、糖原合酶激酶-3抑制剂、胰岛素增敏剂、免疫调节剂、β-3肾上腺素能受体激动剂、Pan-PPAR激动剂、11β-HSD1抑制剂、双胍类、α-葡糖苷酶抑制剂、氯茴苯酸类、噻唑烷二酮类、磺脲类和本领域已知的其它糖尿病药物、或抗高血压药物、钙通道阻断剂和相关产品。在一些情况下，GPXTEN的施用可允许使用较低剂量的共施用药物组合物以实现针对受试者疾病、疾患或病症的类似的临床效应或测量参数。

另一方面，本发明提供了设计具有期望的药理或药学性质的GPXTEN组合物的方法。考虑到各种目的(与未连接融合蛋白的GP组分相比)来设计和制备GPXTEN融合蛋白，包括提高用于治疗葡萄糖调节肽相关疾病、疾患和病症的治疗效力，与GP相比增强融合蛋白的药代动力学特征，降低实现药理效应所需的剂量或给药频率，增强药学性质，和增强GP组分在治疗窗内维持延长时段的能力。

一般而言，如图4-6所示，设计和制备融合蛋白和本发明组合物的步骤可包括：(1)选择GP(例如，天然蛋白质、具有活性的类似物或衍生物)以治疗特定疾病、疾患或病症的；(2)选择将对得到的GPXTEN赋予期望的PK和理化特征的XTEN(例如，将组合物施用给受试者导致融合蛋白与未连接XTEN的GP相比在治疗窗内维持更长时段)；(3)确立GPXTEN的期望的N端至C端构型，以达到期望的效力或PK参数；(4)确立编码所构造的GPXTEN的表达载体的设计；(5)用该表达载体转化适合的宿主；和(6)表达和回收得到的融合蛋白。对于期望半衰期增加(大于24h)或治疗窗内维持时段增加的那些GPXTEN，当将单个XTEN加入GPXTEN时，所选择用于加入的XTEN将一般具有至少约500、或约576、或约864、或约875、或约912、或约923个氨基酸残基。在另一实施方案中，GPXTEN可包含前述长度的第一XTEN和约144、或约288、或约576、或约864、或约875、或约912、或约923个氨基酸残基的第二XTEN。

在其它情况下，当不需要半衰期增加但期望药学性质(例如，溶解度)改善时，GPXTEN可被设计为包含较短长度的XTEN。在前述一些实施方案中，GPXTEN可包含与具有至少约24、或约36、或约48、或约60、或约72、或约84、或约96个氨基酸残基的XTEN连接的GP，其中融合蛋白在生理条件下的溶解度是未连接XTEN的相应GP的至少3倍，或可选地是未连接XTEN的GP的至少4倍、或5倍、或6倍、或7倍、或8倍、或9倍、或至少10倍、或至少20倍、或至少30倍、或至少50倍、或至少60倍或更多。在前述一个实施方案中，GP是胰高血糖素。

另一方面，本发明提供了制备GPXTEN组合物以与天然GP相比改善生产容易度、导致增加的稳定性、增加的水溶解度和/或配制容易度的方法。在一个实施方案中，本发明包括增加GP的水溶解度的方法，包括使GP与一个或多个XTEN连接的步骤，使得可以实现与未融合状态的GP相比得到的GPXTEN的可溶形式在生理条件下更高的浓度。XTEN在加入融合蛋白时赋予GP增加的水溶解度的性质的促进因素包括XTEN融合配偶体的高溶解度和溶液中XTEN分子之间较低程度的自聚集。在一些实施方案中，所述方法产生 GPXTEN融合蛋白，其中在生理条件下的水溶解度比未融合的GP大至少约20%、或至少约30%、或至少约50%、或至少约75%、或至少约90%、或至少约100%、或至少约150%、或至少约200%、或至少约400%、或至少约600%、或至少约800%、或至少约1000%、或至少约2000%、或至少约4000%、或至少约6000%。

在另一实施方案中，本发明包括增加GP存储期的方法，包括使GP与选定的一个或多个XTEN连接的步骤，使得与未融合状态的GP相比，得到的GPXTEN的存储期限延长。本文使用的存储期限指溶液或某种其它存储制剂中GP或GPXTEN的功能活性保持稳定而无过度活性损失的时段。本文使用的“功能活性”指本领域已知的药理效应或生物活性，例如结合受体或配体的能力、或酶促活性、或表现与GP相关的一种或多种已知功能活性。降解或聚集的GP一般与保持在溶液中的GP相比具有降低的功能活性或降低的生物利用率。本方法延长GP加入融合蛋白时的存储期限的能力的促进因素包括XTEN融合配偶体的增加的水溶解度、溶液中降低的自聚集和增加的热稳定性。具体说，XTEN的低聚集倾向有利于配制含有较高药物浓度的GP的药物制剂的方法，并且XTEN的热稳定性促进GPXTEN融合蛋白在延长的时段维持可溶和功能活性的性质。在一个实施方案中，所述方法产生具有“延长的”或“延伸的”存储期限的GPXTEN融合蛋白，其相对于经历相同存储和处理条件的标准品而言表现出更高的活性。所述标准品可以是未融合的全长GP。在一个实施方案中，所述方法包括用一种或多种药学上可接受的赋形剂配制分离的GPXTEN的步骤，所述赋形剂增强了XTEN维持其非结构化构象以及GPXTEN在制剂中比相应未融合GP维持更长时间的可溶性的能力。在一个实施方案中，所述方法包括使GP与一个或多个XTEN连接以产生GPXTEN融合蛋白，得到的溶液当经历与标准品相同的存储和处理条件并在给定时间点比较时，保留标准品功能活性的大于约100%、或标准品功能活性的大于约105%、110%、120%、130%、150%或200%，从而增加了其存储期。

存储期还可以根据存储后保留的功能活性来评估，标准化为存储开始时的功能活性。具有由延长或延伸的功能活性表现的延长或延伸的存储期限的本发明GPXTEN融合蛋白与经受相同条件下相同时段的未连接XTEN的等同GP相比可保留约50%更多的功能活性、或约60%、70%、80%、或90%更多的功能活性。例如，包含与一个或多个XTEN序列融合的exendin-4的本发明GPXTEN融合蛋白在各种温度条件下在溶液中可保留其原始活性约80%或更多，持续多达2周、或4周、或6周或更长的时段。在一些实施方案中，当在80℃加热10分钟时，GPXTEN在溶液中保留其原始活性的至少约50%、或约60%、或至少约70%、或至少约80%、和最优选至少约90%或更多。在其它实施方案中，当在37℃加热或维持约7天时，GPXTEN在溶液中保留其原始活性的至少约50%、优选至少约60%、或至少约70%、或至少约80%、或可选地至少约90%或更多。在另一实施方案中，GPXTEN融合蛋白在约1小时至约18小时的时段暴露于约30℃至约70℃的温度后保留其功能活性的至少约80%或更多。在本段描述的上述实施方案中，在给定时间点，GPXTEN的保留活性将是未连接融合蛋白的相应GP的至少约2倍、或至少约3倍、或至少约4倍、或至少约5倍、或至少约6倍。

VII)本发明的核酸序列

本发明提供了编码GPXTEN嵌合融合蛋白的分离的多核酸以及与编码GPXTEN嵌合融合蛋白的多核酸互补的序列，包括其同源变体。另一方面，本发明涵盖产生编码GPXTEN嵌合融合蛋白的多核酸以及与编码GPXTEN嵌合融合蛋白的多核酸互补的序列(包括其同源变体)的方法。一般而言，如图4-6所示，产生编码GPXTEN融合蛋白的多核苷酸序列并表达得到的基因产物的方法包括组装编码GP和XTEN的核苷酸，框内连接这些组分，将编码基因加入适合宿主细胞并可被宿主细胞识别的表达载体，用该表达载体转化适合的宿主细胞，并在引起或允许融合蛋白在转化的宿主细胞中表达的条件下培养宿主细胞，从而产生生物活性的GPXTEN多肽，其可作为分离的融合蛋白通过本领域已知的标准蛋白质纯化方法回收。分子生物学中标准的重组技术可用来制备本发明的多核苷酸和表达载体，并可应用在产生编码本文所公开GPXTEN的多核苷酸、基因和表达载体的方法中。

根据本发明，可使用编码GPXTEN的核酸序列(或其互补体)来产生指导GPXTEN融合蛋白在适当的宿主细胞中表达的重组DNA分子。预想多种克隆策略适合进行本发明，其中许多可用来产生包含本发明的GPXTEN组合物的融合蛋白的编码基因或其互补体的构建体。在一些情况下，所述克隆策略将用来产生编码包含至少第一GP和至少第一XTEN多肽的单聚体GPXTEN的基因或其互补体。在前述一个实施方案中，所述基因将包含编码GP的序列或序列变体。在其它情况下，所述克隆策略将用于产生编码单聚体GPXTEN的基因，该基因包含编码至少第一分子的GP的核苷酸或其互补体和编码第一和至少另一个XTEN的核苷酸或其互补体，该基因将用于转化宿主细胞以表达GPXTEN组合物的融合蛋白。在该段描述的上述实施方案中，基因还可以包含编码间隔区序列的核苷酸，其也可编码裂解序列。

在设计期望的XTEN序列时发现，尽管在产生XTEN编码序列时使用“结构单元”分子方法，仍可实现本发明组合物的XTEN的非重复性质。这通过使用编码上述肽序列基序的多核苷酸文库来实现，所述多核苷酸然后被连接和/或多聚化以产生编码XTEN序列的基因(参见图4和5和实施例)。因此，虽然表达的融合蛋白的XTEN可以由少达四个不同序列基序的多个单元组成，但是因为基序本身由非重复氨基酸序列组成，所以使得整体XTEN序列是非重复的。因此，在一个实施方案中，XTEN编码多核苷酸包括框内可操作连接的编码非重复序列或基序的多个多核苷酸，并且其中得到的表达的XTEN氨基酸序列是非重复的。

在一个方法中，首先制备含有对应于GPXTEN融合蛋白的DNA 序列的构建体。编码组合物的GP的DNA可获自cDNA文库，该cDNA文库使用标准方法从被认为加工GP mRNA并以可检测的水平表达它的组织或分离细胞制备。使用常规分子生物学技术，可用含有例如约20至100个碱基的探针筛选文库，所述探针被设计为通过杂交鉴定目标GP基因。探针的最佳候选物是代表与给定的葡萄糖调节肽高度同源的序列的那些，并且应该足够长并足够明确以使假阳性最小化，但是可以在一个或多个位置是简并性的。如果必要，编码序列可以使用描述于Sambrook,等,同上的常规引物延伸方法获得，以检测可能未反向转录为cDNA的mRNA的前体和加工中间体。然后可以利用聚合酶链式反应(PCR)方法来扩增靶DNA或RNA编码序列以获得足以制备含有GP基因的GPXTEN构建体的材料。然后可以进行试验以证实杂交全长基因是期望的GP基因。通过这些常规方法，DNA可以常规获自从这些来源制备的cDNA文库。GP编码基因也可获自基因组文库或通过本领域已知的标准合成方法(例如，自动核酸合成，使用例如Engels等(Agnew.Chem.Int.Ed.Engl.,28:716-7341989)描述的方法之一)产生，利用从公开可获得的数据库、专利或参考文献获得的DNA序列。此类方法是本领域熟知的并且详细描述于科学文献和专利文献中。例如，序列可以获自Chemical Abstracts Services(CAS)登记号(由American Chemical Society公开)和/或可通过ncbi.nlm.nih.gov万维网可用的National Center for Biotechnology Information(NCBI)网页获得的GenBank登记号(例如，Locus ID,NP_XXXXX和XP_XXXXX)Model Protein标识符，对应于含有目标蛋白质或蛋白质片段或变体的氨基酸序列的CAS Registry或GenBank数据库中的条目。对于本文提供的此类序列标识符，与这些CAS和GenBank和GenSeq登记号的每一个相关的提要页以及引用的杂志出版物(例如，PubMed ID号(PMID))各自的全部内容通过引用的方式并入，特别是关于其中描述的氨基酸序列。在一个实施方案中，GP编码基因编码表1-3任何一个的蛋白质或其片段或变体。

在将包含单个GP的表达的融合蛋白的情况下，编码主题 GPXTEN蛋白质的GP部分的基因或多核苷酸则可被克隆入构建体，所述构建体可以是质粒或其它载体，受控于为了在生物系统中高水平蛋白质表达的适当转录和翻译序列。在后一步骤中，通过与编码GP的基因邻近和框内克隆到构建体，编码XTEN的第二基因或多核苷酸基因与编码GP基因的N端和/或C端融合的核苷酸。该第二步骤可通过连接或多聚化步骤发生。在该段描述的上述实施方案中，要理解，产生的基因构建体可以可选地是编码各个融合蛋白的各个基因的互补体。

可以一步或多步制备编码XTEN的基因，通过完全合成或者通过与酶促过程组合的合成，所述酶促过程例如限制酶介导的克隆、PCR和重叠延伸，包括在实施例中更全面描述的方法。可以使用本文公开的方法来例如将编码XTEN的多核苷酸短序列连接成具有期望长度和序列的更长的XTEN基因。在一个实施方案中，该方法连接编码约9至14个氨基酸、或约12至20个氨基酸、或约18至36个氨基酸、或约48至约144个氨基酸、或约144至约288或更长、或前述基序或片段长度范围的任意组合的XTEN基序或片段序列的两个或多个密码子优化的寡核苷酸。

可选地，使用公开的方法使XTEN编码序列多聚化成具有期望长度的更长序列；例如，编码36个氨基酸的XTEN的基因可以被二聚化成编码72个氨基酸的基因，然后144，然后288等。即使使用多聚化，通过设计为使用的最短单元的基序所选择的密码子，XTEN多肽可以被构建为使得XTEN编码基因具有低或实际上无重复性，这可以降低编码基因在转化宿主中的重组并增加稳定性。使用标准的基因合成技术，可从寡核苷酸组装编码具有非重复序列的XTEN的基因。可以使用优化密码子使用和氨基酸组成的算法进行基因设计。在本发明的一个方法中，如图4和5所示，产生然后组装相对短的XTEN编码多核苷酸构建体的文库。这可以是纯密码子文库，使得每个文库成员具有相同的氨基酸序列，但是许多不同的编码序列是可能的。此类文库可以从部分随机化的寡核苷酸组装并用于产生包含序列基序的XTEN片段的大文库。可以优化随机化方案来控制每个位置的氨基酸选择以及密码子使用。实现上述的示例性方法公开于实施例。

a.多核苷酸文库

另一方面，本发明提供了编码XTEN序列的多核苷酸的文库，其可用于组装编码期望长度和序列的XTEN的基因。

在某些实施方案中，XTEN编码文库构建体包含编码固定长度的多肽片段的多核苷酸。作为初始步骤，可以组装编码9-14个氨基酸残基的基序的寡核苷酸文库。在一个优选实施方案中，组装编码12个氨基酸的基序的寡核苷酸文库。

可以使XTEN编码序列片段二聚化或多聚化成更长的编码序列。二聚化或多聚化可以通过连接、重叠延伸、PCR组装或本领域已知的类似克隆技术来进行。该过程可以重复多次，直至得到的XTEN编码序列达到序列组织和期望长度，从而提供XTEN编码基因。将理解，可以使编码例如12个氨基酸的基序的多核苷酸的文库二聚化和/或连接成编码36个氨基酸的多核苷酸文库。本发明涵盖编码不同长度基序的文库；例如9-14个氨基酸的基序，产生编码27至42个氨基酸的文库。反过来，编码27至42个氨基酸和优选36个氨基酸(如实施例所述)的文库可以顺序二聚化成含有依次更长的多核苷酸的文库，所述多核苷酸编码期望长度的XTEN序列，用于加入编码入本文公开的GPXTEN融合蛋白的基因。在一些实施方案中，文库可由编码限于特定序列XTEN家族的氨基酸的多核苷酸组装；所述家族例如表1的AD、AE、AF、AG、AM或AQ序列。在其它实施方案中，文库可包含编码表1的基序家族序列的两个或多个的序列。编码36mer的文库的代表性非限制性多核苷酸序列的名称和序列提供于表10-13，并且用于产生它们的方法在实施例中更全面描述。在其它情况下，编码XTEN的文库可从以随机顺序连接的编码氨基酸的多核苷酸密码子片段构建，其中所述密码子的至少约80%、或至少约90%、或至少约91%、或至少约92%、或至少约93%、或至少约94%、或至少约95%、或至少约97%、或至少约98%、或至少约99%选自由甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)氨基酸的密码子组成的组。文库可转而用于顺序二聚体化或连接以实现编码48、72、144、288、576、864、912、923、1318个氨基酸、或多至约3000个氨基酸的总长度以及中间长度的XTEN序列的多核苷酸序列文库，其中编码的XTEN作为GPXTEN融合蛋白的组分表达时可以具有本文公开的性质的一种或多种。在一些情况下，多核苷酸文库序列还可以包含用作“测序岛”的其它碱基，如下文更全面描述。

图5是本发明实施方案中XTEN多核苷酸构建体和GPXTEN多核苷酸构建体组装中的代表性非限制性步骤的示意性流程图。可将个体寡核苷酸501退火成序列基序502，例如12氨基酸基序("12-mer")，其随后与含有BbsI和KpnI限制位点的寡聚体503连接。来自文库的其它序列基序与12-mer退火，直到获得期望长度的XTEN基因504。将XTEN基因克隆到填充载体。该载体可任选地编码标志序列506，随后是两侧具有BsaI、BbsI和KpnI位点的填充序列507和在这种情况下单个GP基因(该实例中编码Ex4)508，得到编码包含单个GP的GPXTEN的基因500。编码XTEN和前体序列的多核苷酸的XTEN名称的非详尽性列表提供于表9。

表9：XTEN和前体序列的DNA核苷酸序列

可以将XTEN编码基因的文库克隆到本领域已知的一个或多个表达载体。为了有利于鉴定良好表达的文库成员，可以构建与报告蛋白融合的文库。适合的报告基因的非限制性实例是绿色荧光蛋白、荧光素酶(luciferace)、碱性磷酸酶和β-半乳糖苷酶。通过筛选，可以鉴定可在选择的宿主生物体中高浓度表达的短XTEN序列。随后，可以产生随机XTEN二聚体的文库并且重复针对高水平表达的筛选。随后，可以针对许多性质例如表达水平、蛋白酶稳定性或结合至抗血清来筛选得到的构建体。

本发明一个方面提供了编码融合蛋白的组分的多核苷酸序列，其中该序列的产生经历了密码子优化。特别关注的是目标为提高多肽组合物表达和改善编码基因在生产宿主中遗传稳定性的密码子优化。例如，密码子优化对于富含甘氨酸或者具有高度重复的氨基酸序列的XTEN序列是特别重要的。密码子优化可使用计算机程序进行(Gustafsson,C.,等(2004)Trends Biotechnol,22:346-53)，一些计算机程序最大程度减少核糖体中止(CodaGenomics Inc.)。在一个实施方案中，可以通过构建密码子文库进行密码子优化，其中文库的所有成员编码相同的氨基酸序列但是其中密码子使用不同。可以针对高度表达和遗传稳定的成员来筛选此类文库，所述成员特别适合大规模产生含有XTEN的产物。当设计XTEN序列时，可以考虑许多性质。可以使编码DNA序列中的重复性最小化。此外，可以避免或最大程度减少生产宿主很少使用的密码子的使用(例如，在大肠杆菌中的AGG和AGA精氨酸密码子和一个亮氨酸密码子)。在大肠杆菌的情况下，两个甘氨酸密码子GGA和GGG很少在高表达蛋白质中使用。因此，编码XTEN序列的基因的密码子优化可能是非常期望的。具有高水平甘氨酸的DNA序列倾向于具有可导致不稳定性或低表达水平的高GC含量。因此，可能时，优选选择密码子以使XTEN编码序列的GC含量适合用于产生XTEN的生产生物体。

任选地，编码全长XTEN的基因可包含一个或多个测序岛。在该上下文中，测序岛是短延伸序列，其不同于XTEN文库构建体序列并且包含全长XTEN编码基因中不存在或期望存在的限制位点。在一个实施方案中，测序岛是如下序列

5'-AGGTGCAAGCGCAAGCGGCGCGCCAAGCACGGGAGGT-3'(SEQ ID NO:251)。在另一实施方案中，测序岛是序列

5'-AGGTCCAGAACCAACGGGGCCGGCCCCAAGCGGAGGT-3'(SEQ ID NO:252)。

作为替代，可以构建密码子文库，其中文库的所有成员编码相同的氨基酸序列，但是其中序列中各个氨基酸的密码子使用是不同的。可以针对高度表达和遗传稳定的成员来筛选此类文库，所述成员特别适合大规模产生含有XTEN的产物。

任选地，可以对文库中的克隆测序以消除含有某些不期望的序列的分离物。短XTEN序列的初始文库可允许氨基酸序列的某种改变。例如，可以使一些密码子随机化以使许多亲水性氨基酸可以出现在特定位置。在反复多聚化的过程中，除了针对高水平表达筛选以外，可以针对其它特征例如溶解度或蛋白酶抗性来筛选得到的文库成员。

一旦选择编码期望长度和性质的XTEN的基因，所述方法提供通过将它与编码GP的基因邻近和框内克隆入构建体或任选地邻近间隔区序列，使它与编码GP基因的N端和/或C端的核苷酸基因融合。根据待编码的GPXTEN，本发明提供了前述的各种排列。例如，编码例如上述式VI所示的包含GP和两个XTEN的GPXTEN融合蛋白的基因，该基因将具有编码GP、编码两个XTEN的多核苷酸，所述两个XTEN在组成和序列长度上可以相同或不同。在前述的一个非限制性实施方案中，GP多核苷酸将编码exendin-4，编码N端XTEN的多核苷酸将编码AE912，并且编码C端XTEN的多核苷酸将编码AE144。将GP基因克隆到XTEN构建体的步骤可以通过连接或多聚化步骤而发生。如图2所示，可将编码GPXTEN融合蛋白的构建体设计为组分XTEN202、GP203和间隔区序列204的不同构型。在一个实施方案中，如图2A所示，构建体包含编码以下顺序(5'至3')：GP203和XTEN202或相反顺序的组分的单聚体多肽的多核苷酸序列或与其互补的多核苷酸序列。在另一实施方案中，如图2B所示，构建体包含编码以下顺序(5'至3')：GP203、间隔区序列204和XTEN202或相反顺序的组分的单聚体多肽的多核苷酸序列或与其互补的多核苷酸序列。在另一实施方案中，如图2C所示，构建体201编码单聚体GPXTEN，包含编码以下顺序(5'至3')：两分子GP203和XTEN202或相反顺序的组分的多核苷酸序列或与其互补的多核苷酸序列。在另一实施方案中，如图2D所示，构建体包含编码以下顺序(5'至3')：两分子GP203、间隔区序列204和XTEN202或相反顺序的组分的单聚体多肽的多核苷酸序列或与其互补的多核苷酸序列。在另一实施方案中，如图2E所示，构建体包含编码以下顺序(5'至3')：GP203、间隔区序列204、第二个GP203分子和XTEN202或相反顺序的组分的单聚体多肽的多核苷酸序列或与其互补的多核苷酸序列。在另一实施方案中，如图2F所示，构建体包含编码以下顺序(5'至3')：GP203、XTEN202、GP203和第二XTEN202或相反顺序的组分的单聚体多肽的多核苷酸序列或与其互补的多核苷酸序列。间隔区多核苷酸可以任选地包含编码裂解序列的序列。对于本领域技术人员明显的是，前述的其它排列也是可能的。

本发明还涵盖包含XTEN编码多核苷酸变体的多核苷酸，其与以下具有高百分比的序列同一性：(a)表9的多核苷酸序列，或(b)与(a)的多核苷酸互补的序列。具有高百分比的序列同一性的多核苷酸是与前述(a)或(b)具有至少约80%核酸序列同一性、可选地至少约81%、可选地至少约82%、可选地至少约83%、可选地至少约84%、可选地至少约85%、可选地至少约86%、可选地至少约87%、可选地至少约88%、可选地至少约89%、可选地至少约90%、可选地至少约91%、可选地至少约92%、可选地至少约93%、可选地至少约94%、可选地至少约95%、可选地至少约96%、可选地至少约97%、可选地至少约98%和可选地至少约99%核酸序列同一性或者可以在严格条件下与靶多核苷酸或其互补体杂交的多核苷酸。

核苷酸或氨基酸序列的同源性、序列类似性或序列同一性还可以通过使用已知软件或计算机程序例如BestFit或Gap成对比较程序(GCG Wisconsin Package,GeneticsComputer Group,575Science Drive,Madison,Wis.53711)来常规测定。BestFit利用Smith和Waterman的局部同源性算法(Advances in Applied Mathematics.1981.2:482-489)来发现两个序列之间同一性或类似性的最佳片段。Gap进行总体比对：所有的一个序列与所有的另一个类似序列，利用Needleman和Wunsch的方法(Journal of MolecularBiology.1970.48:443-453)。当使用序列比对程序例如BestFit来测定序列同源性、类似性或同一性的程度时，可以使用缺省设置，或者可以选择适当的评分矩阵来优化同一性、类似性或同源性评分。

“互补的”核酸序列是能够根据标准的Watson-Crick互补规则碱基配对的那些。如本文使用的术语“互补序列”指基本上互补的核酸序列，可以通过上文列出的相同核苷酸比较来评估，或者定义为能够在严格条件(例如本文描述的那些严格条件)下与编码GPXTEN序列的多核苷酸杂交。

然后可以将得到的编码GPXTEN嵌合融合蛋白的多核苷酸单独克隆到表达载体。可将核酸序列通过多种方法插入载体。一般而言，使用本领域已知的技术将DNA插入适当的限制内切酶位点。载体组分一般包含但不限于一个或多个信号序列、复制起点、一个或多个标记基因、增强子元件、启动子和转录终止序列。含有这些组分的一个或多个的适合载体的构建采用技术人员已知的标准连接技术。此类技术是本领域熟知的并且详细描述于科学文献和专利文献中。

各种载体是公开可获得的。载体可以例如是质粒、黏粒、病毒粒子或噬菌体的形式。本发明提供了含有复制和控制序列的质粒载体的使用，所述复制和控制序列与宿主细胞相容并被宿主细胞识别，并且与GPXTEN基因可操作连接以用于GPXTEN融合蛋白的控制表达。载体通常带有复制位点以及编码能够在转化细胞中提供表型选择的蛋白质的序列。例如，可使用pBR322(一种源自大肠杆菌物种的质粒)对大肠杆菌进行转化(Mandel等，JMol.Biol.,53:154(1970))。质粒pBR322含有对氨苄青霉素和四环素具有抗性的基因，并因此提供容易的选择方法。对于许多细菌、酵母和病毒，此类载体序列是熟知的。可以使用的有用的表达载体包括例如染色体、非染色体和合成DNA序列的片段。“表达载体”指DNA构建体，其包含与适合的控制序列可操作连接的DNA序列，所述控制序列能够影响编码融合蛋白的DNA在适合的宿主中的表达。此类控制序列包括影响转录的启动子、控制此类转录的任选操纵子序列、编码适合的mRNA核糖体结合位点的序列和控制转录和翻译终止的序列。其它适合的载体包括但不限于SV40和pcDNA的衍生物以及已知的细菌质粒例如col EI、pCRl、pBR322、pMal-C2、pET、pGEX(描述于Smith,等,Gene57:31-40(1988))、pMB9及其衍生物、质粒例如RP4、噬菌体DNA例如噬菌体I的许多衍生物例如NM989，以及其它噬菌体DNA例如M13和丝状单链噬菌体DNA；酵母噬菌体例如2μm质粒或2μm质粒的衍生物，以及着丝粒和整合型酵母穿梭载体；用于真核细胞的载体，例如用于昆虫和哺乳动物细胞的载体；由质粒和噬菌体DNA组合产生的载体，例如被修饰具有噬菌体DNA或表达控制序列的质粒；等等。要求是这些载体在选择的宿主细胞中可复制并可存活。可以根据需要使用低拷贝数或高拷贝数的载体。

适合用于原核宿主表达载体的启动子包括β-内酰胺酶和乳糖启动子系统[Chang等,Nature,275:615(1978)；Goeddel等,Nature,281:544(1979)]，碱性磷酸酶、色氨酸(trp)启动子系统[Goeddel,Nucleic Acid Res.,8:4057(1980)；EP36,776]，和杂合启动子，例如tac启动子[deBoer等,Proc.Natl.Acad.Sci.USA,80:21-25(1983)]，都将与编码GPXTEN多肽的DNA可操作连接。用于细菌系统的启动子还可以含有与编码GPXTEN多肽的DNA可操作连接的Shine-Dalgarno(S.D.)序列。

本发明涵盖使用其它表达系统，包括例如杆状病毒表达系统，可以使用非融合转移载体和融合转移载体，所述非融合转移载体例如但不限于pVL941(BamHI克隆位点可从Summers,等,Virology84:390-402(1978)获得)、pVL1393(BamHI、Smal、Xbal、EcoRI、IVotl,Xmalll、BgIII和Pstl克隆位点；Invitrogen)、pVL1392(BgIII、Pstl、NotI、XmaIII、EcoRI、Xball、Smal和BamHI克隆位点；Summers,等,Virology84:390-402(1978)和Invitrogen)和pBlueBacIII(BamHI、BgIII、Pstl、Ncol和Hindi II克隆位点，使用蓝白斑重组筛选；Invitrogen)，所述融合转移载体例如但不限于pAc700(BamHI和Kpnl克隆位点，其中BamHI识别位点以起始密码子开始；Summers,等,Virology84:390-402(1978))、pAc701和pAc70-2(等同于pAc700，具有不同的阅读框)、pAc360(BamHI克隆位点多角体蛋白起始密码子下游的36个碱基对Invitrogen(1995))和pBlueBacHisA,B,C(具有BamH I、BgI II、Pstl、Nco l和Hind III克隆位点的三个不同的阅读框，用ProBond纯化的N端肽和蓝白斑重组筛选，Invitrogen(220))。

哺乳动物表达载体可以包含复制起点、适合的启动子和增强子，并且还包含任何必要的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列和5'侧翼非转录序列。源自SV40剪接的 DNA序列和聚腺苷酸化位点可用于提供所需的非转录基因元件。考虑用于本发明的哺乳动物表达载体包括具有诱导型启动子例如二氢叶酸还原酶启动子的载体、具有DHRF表达盒的任何表达载体或DHFR/氨甲喋呤共扩增载体例如pED(Pstl、Sail、Sbal、Smal和EcoRI克隆位点，其中载体表达克隆基因和DHFR；Randal J.Kaufman,1991,Randal J.Kaufman,Current Protocols in Molecular Biology,16,12(1991))。可选地，谷氨酰胺合成酶/甲硫氨酸亚砜亚胺共扩增载体，例如pEE14(Hindlll、Xball、Smal、Sbal、EcoRI和Sell克隆位点，其中载体表达谷氨酰胺合成酶和克隆基因；Celltech)。可以使用指导在Epstein Barr病毒(EBV)或核抗原(EBNA)控制下的附加体表达的载体，例如pREP4(Kpnl、Pvul、Nhel、Hindlll、NotI、Xhol,、Sfil、BamHI克隆位点，可诱导的金属硫蛋白(methallothionein)H基因启动子，潮霉素选择标记)、pREP8(BamHI、Xhol、NotI、Hindlll、Nhel和Kpnl克隆位点，RSV-LTR启动子，组氨醇选择标记；Invitrogen)、pREP9(Kpnl、Nhel、Hind lll、NotI、Xho l、Sfi l、BamH I克隆位点，RSV-LTR启动子，G418选择标记；Invitrogen)和pEBVHis(RSV-LTR启动子，潮霉素选择标记，可经由ProBond树脂纯化和通过肠激酶裂解的N端肽；Invitrogen)。

用于本发明的可选择的哺乳动物表达载体包括但不限于pRc/CMV(Hind lll、BstXI、NotI、Sbal和Apal克隆位点，G418选择；Invitrogen)、pRc/RSV(Hind II、Spel、BstXI、NotI、Xbal克隆位点，G418选择；Invitrogen)等。可用于本发明的牛痘病毒哺乳动物表达载体(参见例如，Randall J.Kaufman,Current Protocols in MolecularBiology16.12(Frederick M.Ausubel,等编著.Wiley1991)包括但不限于pSC11(Smal克隆位点，TK和β半乳糖苷酶选择)、pMJ601(Sal l、Sma l、A flI、Narl、BspMlI、BamHI、Apal、Nhel、SacII、Kpnl和Hindlll克隆位点；TK和半乳糖苷酶选择)、pTKgptFlS(EcoRI、Pstl、SaIII、Accl、HindII、Sbal、BamHI和Hpa克隆位点TK或XPRT选择)等。

也可用于本发明的酵母表达系统包括但不限于非融合pYES2载体(XJbal、Sphl、Shol、NotI、GstXI、EcoRI、BstXI、BamHI、Sad、Kpnl和Hindlll克隆位点；Invitrogen)、融合pYESHisA,B,C(Xball、Sphl、Shol、NotI、BstXI、EcoRI、BamHI、Sad、Kpnl和Hindi II克隆位点，用ProBond树脂纯化和用肠激酶裂解的N端肽；Invitrogen)、pRS载体等。

此外，含有嵌合GPXTEN融合蛋白编码多核苷酸分子的表达载体可以包含药物选择标记。此类标记帮助含有嵌合DNA分子的载体的克隆和选择或鉴定。例如，赋予对新霉素、嘌呤霉素、潮霉素、二氢叶酸还原酶(DHFR)抑制剂、鸟嘌呤磷酸核糖转移酶(GPT)、博来霉素和组氨醇抗性的基因是有用的选择标记。可选地，可以使用酶，例如单纯疱疹病毒胸苷激酶(tk)或氯霉素乙酰转移酶(CAT)。还可以使用免疫标记。可以使用任何已知的选择标记，只要它能够与编码基因产物的核酸同时表达。选择标记的其它实例是本领域技术人员熟知的，并且包括报告分子，例如增强的绿色荧光蛋白(EGFP)、β-半乳糖苷酶(β-gal)或氯霉素乙酰转移酶(CAT)。

在一个实施方案中，编码GPXTEN融合蛋白组合物的多核苷酸可在C端与适合表达宿主系统的N端信号序列融合。信号序列通常在易位和分泌过程中通过蛋白水解的方式地从蛋白质去除，产生确定的N端。已经描述了用于大多数表达系统的多种信号序列，所述表达系统包括细菌、酵母、昆虫和哺乳动物系统。每种表达系统的优选实例的非限制性列表在本文随后给出。对于大肠杆菌表达的优选信号序列是OmpA、PhoA和DsbA。对于酵母表达的优选信号肽是ppL-α、DEX4、转化酶信号肽、酸性磷酸酶信号肽、CPY或INU1。对于昆虫细胞表达的优选信号序列是sexta脂动激素前体、CP1、CP2、CP3、CP4、TPA、PAP或gp67。对于哺乳动物表达的优选信号序列是IL2L、SV40、IgGκ和IgGλ。

在另一实施方案中，可能包含良好表达的独立蛋白质结构域的前导序列可以与GPXTEN序列的N端融合，由蛋白酶裂解位点分开。虽然可以使用不抑制设计的蛋白水解位点处裂解的任何前导肽序列，但是优选实施方案的序列将包括稳定的良好表达的序列，使得整个组合物的表达和折叠不受显著不利地影响，并且优选地，表达、溶解度和/或折叠效率显著地提高。文献中已经描述了许多适合的前导序列。适合序列的非限制性列表包括麦芽糖结合蛋白、纤维素结合结构域、谷胱甘肽S转移酶、6xHis标签(SEQ ID NO:253)、FLAG标签、血球凝集素标签和绿色荧光蛋白。前导序列还可以通过特别是在ATC起始密码子之后的第二个密码子位置的密码子优化、通过文献中详细描述和上述方法来进一步改善。

用于在特定位点裂解蛋白质的各种体外酶促方法是已知的。此类方法包括使用肠激酶(DDDK(SEQ ID NO:254))、因子Xa(IDGR(SEQ ID NO:255))、凝血酶(LVPRGS(SEQ IDNO:256))、PreScission^TM(LEVLFQGP(SEQ ID NO:257))、TEV蛋白酶(EQLYFQG(SEQ ID NO:258))、3C蛋白酶(ETLFQGP(SEQ ID NO:259))、分选酶A(LPETG(SEQ ID NO:260))、粒酶B(D/X、N/X、M/N或S/X)、内含肽(intein)、SUMO、DAP酶(TAGZyme^TM)、气单胞菌氨肽酶、氨肽酶M、和羧肽酶A和B。其它方法公开于Arnau,等,Protein Expression and Purification48:1-13(2006)。

在其它情况下，本发明提供了包含优化多核苷酸序列的多核苷酸构建体和制备所述构建体的方法，所述多核苷酸序列编码具有XTEN特征的至少约20至约60个氨基酸，其可以纳入XTEN编码序列的N端以促进翻译起始，以允许蛋白质N端的XTEN融合物在不存在辅助结构域的情况下表达。前述一个优势是，序列不需要随后裂解，从而减少了产生含有XTEN组合物的步骤的数目。如在实施例中更详细描述的，优化的N端序列具有非结构化蛋白质的属性，但是可以包含编码为其促进翻译起始和增强表达的能力而选择的氨基酸的核苷酸碱基。在前述一个实施方案中，优化的多核苷酸编码与AE912具有至少约90%序列同一性的XTEN序列。在前述另一个实施方案中，优化的多核苷酸编码与AM923具有至少约90%序列同一性的XTEN序列。在前述另一实施方案中，优化的多核苷酸编码与AE624具有至少约90%序列同一性的XTEN序列。在前述另一实施方案中，优化的多核苷酸编码与AE48具有至少约90%序列同一性的XTEN序列。在前述另一实施方案中，优化的多核苷酸编码与AM48具有至少约90%序列同一性的XTEN序列。在一个实施方案中，优化的多核苷酸NTS包括与选自以下的序列或其互补体具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的序列：

AE

48:5'-ATGGCTGAACCTGCTGGCTCTCCAACCTCCACTGAGGAAGGTACCCCGGGTAGCGGTACTGCTTCTTCCTCTCCAGGTAGCTCTACCCCTTCTGGTGCAACCGGCTCTCCAGGTGCTTCTCCGGGCACCAGCTCTACCGGTTCTCCA-3'(SEQ ID NO:261)

和

AM

48:5'-ATGGCTGAACCTGCTGGCTCTCCAACCTCCACTGAGGAAGGTGCATCCCCGGGCACCAGCTCTACCGGTTCTCCAGGTAGCTCTACCCCGTCTGGTGCTACCGGCTCTCCAGGTAGCTCTACCCCGTCTGGTGCTACTGGCTCTCCA-3'(SEQ ID NO:262)

在另一实施方案中，前导序列构建体的蛋白酶位点选择为使其被体内蛋白酶识别。在该实施方案中，从表达系统纯化蛋白质，同时通过避免与适当蛋白酶接触而保留前导序列。然后将全长构建体注射入患者。注射后，使构建体与对裂解位点具特异性的蛋白酶接触并被该蛋白酶裂解。在未裂解蛋白活性基本上小于裂解形式的情况下，该方法具有允许更高的初始剂量而同时避免毒性的有益效应，因为活性形式在体内缓慢产生。用于该应用的体内蛋白酶的一些非限制性实例包括组织激肽释放酶、血浆激肽释放酶、胰蛋白酶、胃蛋白酶、胰凝乳蛋白酶、凝血酶和基质金属蛋白酶或表8的蛋白酶。

以这种方式，在构建体内产生编码单聚体GPXTEN融合蛋白的嵌合DNA分子。任选地，可将该嵌合DNA分子转移或克隆到另一构建体，该构建体是更适合的表达载体。此时，可以用该嵌合DNA分子转化能够表达嵌合DNA分子的宿主细胞。根据细胞宿主的类型，可以通过熟知的方法将含有目标DNA片段的载体转移到宿主细胞。例如，氯化钙转染常用于原核细胞，而磷酸钙处理、脂质转染或电穿孔可用于其它细胞宿主。用于转化哺乳动物细胞的其它方法包括使用凝聚胺、原生质体融合、脂质体、电穿孔和显微注射。一般参见Sambrook,等,同上。

转化可以使用或不使用载体例如表达载体而发生。然后，转化的宿主细胞在适合表达编码GPXTEN的嵌合DNA分子的条件下培养。

本发明还提供了用于表达本文公开的单聚体融合蛋白组合物的宿主细胞。适合的真核宿主细胞的实例包括但不限于哺乳动物细胞，例如VERO细胞、HELA细胞例如ATCCNo.CCL2、CHO细胞系、COS细胞、WI38细胞、BHK细胞、HepG2细胞、3T3细胞、A549细胞、PC12细胞、K562细胞、293细胞、Sf9细胞和CvI细胞。适合的非哺乳动物真核细胞的实例包括真核微生物(例如丝状真菌或酵母)是适合编码载体的克隆或表达宿主。酿酒酵母(Saccharomycescerevisiae)是常用的低等真核宿主微生物。其它包括栗酒裂殖酵母(Schizosaccharomyces pombe)(Beach和Nurse,Nature,290:140[1981]；1985年5月2日公布的EP139,383)；克鲁维酵母(Kluyveromyces)宿主(美国专利No.4,943,529；Fleer等,Bio/Technology,9:968-975(1991))，例如乳酸克鲁维酵母(K.lactis)(MW98-8C,CBS683,CBS4574；Louvencourt等,J.Bacteriol.,737[1983])、脆壁克鲁维酵母(K.fragilis)(ATCC12,424)、保加利亚克鲁维酵母(K.bulgaricus)(ATCC16,045)、维克汉姆克鲁维酵母(K.wickeramii)(ATCC24,178)、克鲁雄酵母(K.waltii)(ATCC56,500)、果蝇克鲁维酵母(K.drosophilarum)(ATCC36,906；Van den Berg等,Bio/Technology,8:135(1990))、耐热克鲁维酵母(K.thermotolerans)和马克思克鲁维酵母(K.marxianus)；耶氏酵母(yarrowia)(EP402,226)；毕赤酵母(Pichia pastoris)(EP183,070；Sreekrishna等,J.Basic Microbiol.,28:265-278[1988])；念珠菌(Candida)；Trichoderma reesia(EP244,234)；粗糙链孢霉(Neurospora crassa)(Case等,Proc.Natl.Acad.Sci.USA,76:5259-5263[1979])；许旺酵母(Schwanniomyces)例如西方许旺酵母(Schwanniomycesoccidentalis)(1900年8月31日公布的EP394,538)；和丝状真菌，例如脉孢菌(Neurospora)、青霉菌(Penicillium)、弯颈酶(Tolypocladium)(1991年1月10日公布的WO91/00357)和曲霉菌(Aspergillus)宿主，例如构巢曲霉(A.nidulans)(Ballance等,Biochem.Biophys.Res.Commun.,112:284-289[1983]；Tilburn等,Gene,26:205-221[1983]；Yelton等,Proc.Natl.Acad.Sci.USA,81:1470-1474[1984])和黑曲霉(A.niger)(Kelly和Hynes,EMBO J.,4:475-479[1985])。甲基营养型酵母在本文是适合的，并且包括但不限于能够在甲醇上生长的酵母，选自由以下组成的属：汉森酵母属(Hansenula)、念珠菌属(Candida)、克勒克酵母属(Kloeckera)、毕赤酵母属(Pichia)、酿酒酵母属(Saccharomyces)、球拟酵母菌属(Torulopsis)和红酵母属(Rhodotorula)。该类酵母的示例的特定物种列表可参见C.Anthony,The Biochemistry of Methylotrophs,269(1982)。

可用于本发明的其它适合的细胞包括但不限于原核宿主细胞菌株，例如大肠杆菌(例如，菌株DH5-α)、枯草芽孢杆菌(Bacillus subtilis)、鼠伤寒沙门氏菌(Salmonellatyphimurium)，或者假单胞杆菌属(Pseudomonas)、链霉菌属(Streptomyces)和葡萄球菌属(Streptomyces)的菌株。适合的原核生物的非限制性示例包括以下属的那些：游动放线菌属(Actinoplanes)；古生物球菌属(Archaeoglobus)；蛭弧菌属(Bdellovibrio)；包柔氏螺旋体属(Borrelia)；绿屈挠菌属(Chloroflexus)；肠球菌属(Enterococcus)；埃希氏菌属(Escherichia)；乳酸杆菌属 (Lactobacillus)；李斯特菌属(Listeria)；海洋杆菌属(Oceanobacillus)；副球菌属(Paracoccus)；假单胞杆菌属(Pseudomonas)；葡萄球菌属(Staphylococcus)；链球菌属(Streptococcus)；链霉菌属(Streptomyces)；热原体属(Thermoplasma)；和弧菌属(Vibrio)。具体菌株的非限制性示例包括：闪烁古生球菌(Archaeoglobus fulgidus)；食菌蛭弧菌(Bdellovibrio bacteriovorus)；博氏疏螺旋体(Borrelia burgdorferi)；博氏疏螺旋体菌(Chloroflexus aurantiacus)；粪肠球菌(Enterococcus faecalis)；屎肠球菌(Enterococcus faecium)；约汉逊氏乳杆菌(Lactobacillus johnsonii)；植物乳杆菌(Lactobacillus plantarum)；乳酸乳球菌(Lactococcus lactis)；无害李斯特菌(Listeria innocua)；单核细胞增生杆菌(Listeriamonocytogenes)；Oceanobacillus iheyensis；Paracoccus zeaxanthinifaciens；Pseudomonas mevalonii；金黄色葡萄球菌(Staphylococcus aureus)；表皮葡萄球菌(Staphylococcus epidermidis)；溶血性葡萄球菌(Staphylococcus haemolyticus)；无乳链球菌(Streptococcus agalactiae)；Streptomyces griseolosporeus；变形链球菌(Streptococcus mutans)；肺炎链球菌(Streptococcus pneumoniae)；酿脓链球菌(Streptococcus pyogenes)；嗜酸热原体(Thermoplasma acidophilum)；火山热原体(Thermoplasma volcanium)；霍乱弧菌(Vibrio cholerae)；副溶血性弧菌(Vibrioparahaemolyticus)；和创伤弧菌(Vibrio vulnificus)。

含有目标多核苷酸的宿主细胞可以在常规营养培养基(例如，Ham营养混合物)中培养，所述培养基为活化启动子、选择转化株或扩增基因而适当改良。例如温度、pH等培养条件是之前用于为表达而选择的宿主细胞的那些，并且对于普通技术人员将是明显的。细胞通常通过离心收集，通过物理或化学方法破碎，并且得到的粗提取物被保留用于进一步纯化。对于宿主细胞分泌的组合物来说，分离并保留离心上清液用于进一步纯化。用于表达蛋白质的微生物细胞可以通过任何常规方法破碎，包括冻融循环、超声、机械破碎或使用细胞溶解剂，所有这些是本领域技术人员熟知的。涉及细胞溶解的实施方案可能需要使用含有蛋白酶抑制剂的缓冲液，所述蛋白酶抑制剂限制嵌合DNA分子表达之后的降解。适合的蛋白酶抑制剂包括但不限于亮抑酶肽、抑胃酶肽或抑蛋白酶肽。然后，上清液可以在连续增加浓度的饱和硫酸铵中沉淀。

基因表达可以在样本中直接测量，例如通过常规的Southern印迹、Northern印迹，以定量mRNA的转录[Thomas,Proc.Natl.Acad.Sci.USA,77:5201-5205(1980)]、斑点印迹(DNA分析)、或使用适当标记的探针原位杂交，基于本文提供的序列。可选地，可以使用可以识别特异双链体的抗体，所述双链体包括DNA双链体、RNA双链体和DNA-RNA杂交双链体或DNA-蛋白质双链体。所述抗体转而可以被标记并且可以进行测定，其中双链体结合至表面，使得双链体在表面形成时，可以检测结合至双链体的抗体的存在。

可选地，基因表达可以通过荧光方法的免疫学来测量，例如细胞或组织切片的免疫组织化学染色和细胞培养物或体液的测定或选择标记的检测，以直接定量基因产物的表达。用于免疫组织化学染色和/或样本流体测定的抗体可以是单克隆或多克隆的，并且可以在任何哺乳动物中制备。适当地，抗体可以针对天然序列GP多肽或针对基于本文提供的DNA序列的合成肽或针对与GP融合并编码特异抗体表位的外源序列来制备。选择标记的实例是本领域技术人员熟知的并且包括报告分子，例如增强的绿色荧光蛋白(EGFP)、β-半乳糖苷酶(β-gal)或氯霉素乙酰转移酶(CAT)。

表达的GPXTEN多肽产物可以通过本领域已知的方法或通过本文公开的方法纯化。可以使用诸如过滤、亲和纯化、盐分级分离、离子交换色谱、尺寸排阻色谱、羟基磷灰石吸附色谱、疏水性相互作用色谱和凝胶电泳等程序；每一种被修改以回收和纯化由各自的宿主细胞产生的融合蛋白。一些表达的GPXTEN可能需要在分离和纯化期间重折叠。纯化方法描述于Robert K.Scopes,Protein Purification:Principles and Practice,CharlesR.Castor(编著),Springer-Verlag1994, 和Sambrook,等,同上。多步纯化分离还描述于Baron,等,Crit.Rev.Biotechnol.10:179-90(1990)and Below,等,J.Chromatogr.A.679:67-83(1994)。

VIII)药物组合物

本发明提供了包含GPXTEN的药物组合物。在一个实施方案中，药物组合物包含GPXTEN融合蛋白和至少一种药学上可接受的载体。本发明的GPXTEN多肽可以根据已知方法配制，以制备药学上有用的组合物，由此多肽与药学上可接受的载体媒介物(例如水溶液或缓冲液、药学可接受的悬液和乳液)混合。非水溶剂的实例包括丙基乙二醇、聚乙二醇和植物油。通过将具有期望纯度的活性成分与任选的Remington's Pharmaceutical Sciences第16版,Osol,A.Ed.(1980)中描述的生理上可接受的载体、赋形剂或稳定剂混合来制备以冻干制剂或水溶液形式存储的治疗性制剂。

药物组合物可以通过口服、鼻内、胃肠外或通过吸入疗法来施用，并且可以采取片剂、锭剂、颗粒、胶囊、丸剂、安瓿剂、栓剂或气溶胶形式的形式。它们还可以采取活性成分在水或非水稀释剂中的悬液、溶液和乳液、糖浆、颗粒或粉末的形式。此外，药物组合物还可以含有其它药物活性化合物或多种本发明化合物。

更具体说，本发明药物组合物可以通过任何适合途径施用以用于治疗，所述途径包括口服、直肠、鼻、局部(包括经皮、气溶胶、口腔和舌下)、阴道、胃肠外(包括皮下、通过输注泵的皮下、肌肉内、静脉内和皮内)、玻璃体内和肺。还要理解，优选的途径将根据接受者的情况和年龄以及待治疗的疾病而变化。

在一个实施方案中，药物组合物经皮下施用。在该实施方案中，组合物可以作为冻干粉末提供，在施用前重建。组合物还可以液体形式提供，其可以直接施用给患者。在一个实施方案中，组合物作为在预填充注射器中的液体提供，使得患者可以容易地自我施用该组合物。

用于本发明的延长释放制剂可以是口服制剂，包含基质和包衣组合物。适合的基质材料可以包括蜡(例如，棕榈蜡(camauba)、蜂蜡、石蜡、地蜡、紫胶蜡、脂肪酸和脂肪醇)、油、硬化油或脂肪(例如，硬化菜籽油、蓖麻油、牛脂、棕榈油和大豆油)和聚合物(例如，羟丙基纤维素、聚乙烯吡咯烷酮、羟丙基甲基纤维素和聚乙二醇)。其它适合的基质制片材料是微晶纤维素、粉末纤维素、羟丙基纤维素、乙基纤维素以及其它载体和填充剂。片剂还可以含有颗粒、包衣粉剂或小丸。片剂还可以是多层的。当活性成分具有显著不同的药代动力学特征时，多层片剂是特别优选的。任选地，成品片剂可以是包衣或未包衣的。

包衣组合物可以包含不溶性基质聚合物和/或水溶性材料。水溶性材料可以是聚合物，例如聚乙二醇、羟丙基纤维素、羟丙基甲基纤维素、聚乙烯吡咯烷酮、聚乙烯醇或单聚体材料例如糖(例如，乳糖、蔗糖、果糖、甘露糖醇等)、盐(例如，氯化钠、氯化钾等)、有机酸(例如，富马酸、琥珀酸、乳酸和酒石酸)及其混合物。任选地，可将肠溶聚合物加入包衣组合物。适合的肠溶聚合物包括羟丙基甲基纤维素、乙酸琥珀酸酯、羟丙基甲基纤维素、酞酸酯、聚醋酸乙烯酞酸酯、醋酸纤维素酞酸酯、偏苯三甲酸酯、紫胶、玉米醇溶蛋白和含有羧基的聚甲基丙烯酸酯。包衣组合物可以通过添加适合的增塑剂来增塑，所述增塑剂例如邻苯二甲酸二乙酯、柠檬酸酯、聚乙二醇、甘油、乙酰化甘油酯、乙酰化柠檬酸酯、二丁基癸二酸酯和蓖麻油。包衣组合物还可以包含填充剂，其可以是不溶性材料，例如二氧化硅、二氧化钛、滑石、高岭土、氧化铝、淀粉、粉末纤维素、MCC或聚克立林钾。包衣组合物可以作为在有机溶剂或水溶剂或其混合物中的溶液或胶乳来应用。可以使用溶剂，诸如水、低级醇、氯化低级烃、酮或其混合物。

本发明组合物可以使用多种赋形剂配制。适合的赋形剂包括微晶纤维素(例如，Avicel PH102、Avicel PH101)、聚甲基丙烯酸酯、聚(丙烯酸乙酯、甲基丙烯酸甲酯、甲基丙烯酰氧乙基三甲基氯化铵)(例如Eudragit RS-30D)、羟丙基甲基纤维素(Methocel K100M,Premium CR Methocel K100M,Methocel E5,硬脂酸镁、滑石、柠檬酸三乙酯、乙基纤维素水分散液和硫酸鱼精蛋白。缓释剂还可以包括载体，其可以包括例如溶剂、分散介质、包衣剂、抗细菌剂和抗真菌剂、等渗和吸收延迟剂。药学上可接受的盐也可以用于这些缓释剂，例如矿物盐，例如盐酸盐、氢溴酸盐、磷酸盐或硫酸盐，以及有机酸的盐，例如乙酸盐、丙酸盐、丙二酸盐或苯甲酸盐。组合物还可以含有液体，例如水、盐水、甘油和乙醇，以及诸如润湿剂、乳化剂或pH缓冲剂等物质。脂质体也可用作载体。

在另一实施方案中，本发明组合物包封于脂质体中，已经表明脂质体在以受控方式经延长时段递送有益活性剂的效用。脂质体是含有内陷水容积的闭合双层膜。脂质体还可以是具有单个膜双层的单层小囊泡或具有多个膜双层的多层小囊泡，每个膜双层与下一个膜双层由水层隔开。得到的膜双层的结构使得脂质的疏水性(非极性)尾部朝向双层中心，而亲水性(极性)头部朝向水相。在一个实施方案中，脂质体可以用柔性的水溶性聚合物包被，该聚合物避免被单核吞噬细胞系统的器官(主要是肝和脾)摄取。用于包裹脂质体的适合的亲水性聚合物包括但不限于PEG、聚乙烯吡咯烷酮、聚乙烯甲醚、聚甲基噁唑啉、聚乙基噁唑啉、聚羟基丙基甲基丙烯酰胺、聚甲基丙烯酰胺、聚二甲基丙烯酰胺、聚羟基丙基甲基丙烯酸酯、聚羟基丙烯酸酯、羟基甲基纤维素、羟基乙基纤维素、聚乙二醇、聚天冬酰胺和亲水性肽序列，如美国专利No.6,316,024；No.6,126,966；No.6,056,973；No.6,043,094中描述的，这些专利的全部内容通过引用的方式并入。

脂质体可以由本领域已知的任何脂质或脂质组合构成。例如，如美国专利No.6,056,973和No.5,874,104所公开，形成小囊泡的脂质可以是天然存在的或合成的脂质，包括磷脂，例如磷脂酰胆碱、磷脂酰乙醇胺、磷脂酸、磷脂酰丝氨酸、磷脂酰甘油、磷脂酰肌醇和鞘磷脂。还如美国专利No.6,056,973所公开，形成小囊泡的脂质还可以是糖脂、脑苷脂或阳离子脂质，例如1,2-二油烯基氧基-3-(三甲基氨基)丙烷(DOTAP)；N-[1-(2,3,-双十四烷基氧基)丙基]-N,N-二甲基-N-羟乙基溴化铵(DMRIE)；N-[1[(2,3,-二油烯基氧基)丙基]-N,N-二甲基-N-羟乙基溴化铵(DORIE)；N-[1-(2,3-二油烯基氧基)丙基]-N,N,N-三甲基氯化铵(DOTMA)；3[N-(N',N'-二甲基氨基乙烷)氨基甲酰]胆固醇(DC-Chol)；或二甲基双十八烷基铵(DDAB)。如美国专利No.5,916,588和No.5,874,104所公开，胆固醇可以适当范围存在以赋予小囊泡稳定性。

其它脂质体技术描述于美国专利No.6,759,057；No.6,406,713；No.6,352,716；No.6,316,024；No.6,294,191；No.6,126,966；No.6,056,973；No.6,043,094；No.5,965,156；No.5,916,588；No.5,874,104；No.5,215,680；和No.4,684,479，其内容通过引用的方式并入本文。这些描述脂质体和脂质包衣的微泡及其生产方法。因此，本领域技术人员考虑本发明公开内容和这些其它专利的公开内容，能够生产用于本发明多肽延长释放的脂质体。

对于液体制剂，期望的性质是制剂可以如下形式提供：可以穿过25、28、30、31、32号针头以静脉内、肌肉内、关节内或皮下施用。

透皮制剂的施用可以使用本领域已知的方法进行，包括大体上例如在美国专利No.5,186,938和No.6,183,770、No.4,861,800、No.6,743,211、No.6,945,952、No.4,284,444和WO89/09051中描述的那些，这些专利的全部内容以引用的方式并入本文。透皮贴剂对于具有吸收问题的多肽是特别有用的实施方案。贴剂可以被制备为控制可穿透皮肤的活性成分经12小时、24小时、3天和7天的时段释放。在一个实例中，将2倍每日过量的本发明多肽放入非挥发性流体。本发明组合物以粘稠非挥发性液体的形式提供。特定制剂经皮肤的穿透可以通过本领域标准方法来测量(例如，Franz等,J.Invest.Derm.64:194-195(1975))。适合的贴剂的实例是被动转移皮肤贴剂、离子电渗皮肤贴剂或具有微针的贴剂例如Nicoderm。

在其它实施方案中，组合物可以经由鼻内、口腔或舌下途径递送至脑，以实现活性剂通过嗅觉通道转移到CNS并减少全身施用。常用于该施用途径的装置包括于美国专利No.6,715,485。通过该途径递送的组合物可以实现增加的CNS给药或降低的全身负荷量，这减少了与某些药物相关的系统性毒性风险。以皮肤下可植入装置递送的药物组合物的制备可以使用本领域已知方法进行，例如美国专利No.3,992,518；No.5,660,848；和No.5,756,115中描述的那些。

渗透泵可以在片剂、丸剂、胶囊或可植入装置中用作缓释剂。渗透泵是本领域熟知的，并且对于本领域技术人员可容易地从在提供用于延长释放药物递送的渗透泵方面有经验的公司获得。实例有ALZA的DUROS^TM；ALZA的OROS^TM；Osmotica Pharmaceutical的Osmodex^TM系统；Shire Laboratories的EnSoTrol^TM系统；和Alzet^TM。描述渗透泵技术的专利是美国专利No.6,890,918；No.6,838,093；No.6,814,979；No.6,713,086；No.6,534,090；No.6,514,532；No.6,361,796；No.6,352,721；No.6,294,201；No.6,284,276；No.6,110,498；No.5,573,776；No.4,200,0984；和No.4,088,864，这些专利的内容以引用的方式并入本文。本领域技术人员考虑本发明的公开内容和这些其它专利的公开内容，能够生产用于本发明多肽的延长释放的渗透泵。

注射器泵也可用作缓释剂。此类装置描述于美国专利No.4,976,696；No.4,933,185；No.5,017,378；No.6,309,370；No.6,254,573；No.4,435,173；No.4,398,908；No.6,572,585；No.5,298,022；No.5,176,502；No.5,492,534；No.5,318,540；和No.4,988,337，这些专利的内容以引用的方式并入本文。本领域技术人员考虑本发明的公开内容和这些其它专利的公开内容，能够生产用于本发明组合物的延长释放的注射器泵。

IX)药物试剂盒

另一方面，本发明提供了有利于GPXTEN多肽使用的试剂盒。该试剂盒包括本文提供的药物组合物、标识该药物组合物的标签和关于所述药物组合的存储、重建和/或施用给受试者的说明。在一些实施方案中，试剂盒优选地包括：(a)在施用给有相应需要的受试者时足以治疗疾病、病症或疾患的量的GPXTEN融合蛋白组合物；和(b)一定量的药学上可接受的载体；一起形成即时注射或用无菌水、缓冲液或葡萄糖重建的制剂；还有标识GPXTEN药物和存储和操作条件的标签，以及认可的该药物的适应症的插页，关于用于预防和/或治疗认可的适应症的GPXTEN药物的重建和/或施用的说明，适当剂量和安全性信息，以及标识该药物批号和有效期的信息。前述另一实施方案中，试剂盒可以包括可以携带GPXTEN组合物的适合稀释剂的第二容器，这将为使用者提供适当浓度的待递送给受试者的GPXTEN。

实施例

实施例1:XTEN_AD36基序片段的构建

以下实施例描述了编码36个氨基酸的基序序列的密码子优化基因的集合的构建。作为第一步，基于pET载体构建填充载体pCW0359，其包含T7启动子。pCW0359编码纤维素结合结构域(CBD)和TEV蛋白酶识别位点，随后是两侧具有BsaI、BbsI和KpnI位点的填充序列。插入BsaI和BbsI位点，使得它们在消化之后产生相容的突出端。填充序列之后是截短形式的GFP基因和His标签。填充序列含有终止密码子，因此携带填充质粒pCW0359的大肠杆菌细胞形成非荧光的菌落。用BbsI和KpnI消化填充载体pCW0359以除去填充片段，并且得到的载体片段通过琼脂糖凝胶纯化来分离。该序列被称为XTEN_AD36，反映了基序的AD家族。其片段具有氨基酸序列[X]₃，其中X是具有以下序列的12mer肽：GESPGGSSGSES(SEQ ID NO:263)、GSEGSSGPGESS(SEQ ID NO:264)、GSSESGSSEGGP (SEQ ID NO:265)或GSGGEPSESGSS(SEQ ID NO:266)。通过将以下对的磷酸化的合成寡核苷酸对退火来获得插入序列：

AD1正向：AGGTGAATCTCCDGGTGGYTCYAGCGGTTCYGARTC(SEQ ID NO:267)

AD1反向：ACCTGAYTCRGAACCGCTRGARCCACCHGGAGATTC(SEQ ID NO:268)

AD2正向：AGGTAGCGAAGGTTCTTCYGGTCCDGGYGARTCYTC(SEQ ID NO:269)

AD2反向：ACCTGARGAYTCRCCHGGACCRGAAGAACCTTCGCT(SEQ ID NO:270)

AD3正向：AGGTTCYTCYGAAAGCGGTTCTTCYGARGGYGGTCC(SEQ ID NO:271)

AD3反向：ACCTGGACCRCCYTCRGAAGAACCGCTTTCRGARGA(SEQ ID NO:272)

AD4正向：AGGTTCYGGTGGYGAACCDTCYGARTCTGGTAGCTC(SEQ ID NO:273)

我们还退火磷酸化的寡核苷酸3KpnIstopper正向：AGGTTCGTCTTCACTCGAGGGTAC(SEQ ID NO:274)和非磷酸化的寡核苷酸pr_3KpnIstopper反向：CCTCGAGTGAAGACGA(SEQID NO:275)。将退火的寡核苷酸对连接，得到具有不同长度的产物的混合物，所述不同长度代表与一个BbsI/KpnI片段连接的12mer重复序列的不同数目。将对应于长度为36个氨基酸的产物通过制备型琼脂糖凝胶电泳从混合物分离并连接到BsaI/KpnI消化的填充载体pCW0359。得到的称为LCW0401的文库中大多数克隆在诱导后显示绿色荧光，这表明XTEN_AD36序列已经与GFP基因在框内连接，并且大多数XTEN_AD36序列具有良好的表达水平。

我们通过将它们压印在含IPTG的琼脂平板上，针对高水平荧光从文库LCW0401筛选了96个独立克隆。通过PCR评估相同的独立克隆，并鉴定了含有具有36个氨基酸的片段以及强荧光的48个独立克隆。对这些独立克隆进行测序并鉴定了含有正确XTEN_AD36片段的39个克隆。这些片段的核苷酸和氨基酸构建体的文件名列于表10。

表10:36-mer基序的DNA和氨基酸序列

实施例2:XTEN_AE36片段的构建

构建了编码长度为36个氨基酸的XTEN序列的密码子文库。XTEN序列被称为XTEN_AE36。其片段具有氨基酸序列[X]₃，其中X是具有以下序列的12mer肽：GSPAGSPTSTEE(SEQID NO:352)、GSEPATSGSE TP(SEQ ID NO:353)、GTSESA TPESGP(SEQ ID NO:354)或GTSTEPSEGSAP(SEQ ID NO:355)。通过将以下对的磷酸化合成寡核苷酸对退火来获得插入序列：

AE1正向：AGGTAGCCCDGCWGGYTCTCCDACYTCYACYGARGA(SEQ ID NO:356)

AE1反向：ACCTTCYTCRGTRGARGTHGGAGARCCWGCHGGGCT(SEQ ID NO:357)

AE2正向：AGGTAGCGAACCKGCWACYTCYGGYTCTGARACYCC(SEQ ID NO:358)

AE2反向：ACCTGGRGTYTCAGARCCRGARGTWGCMGGTTCGCT(SEQ ID NO:359)

AE3正向：AGGTACYTCTGAAAGCGCWACYCCKGARTCYGGYCC(SEQ ID NO:360)

AE3反向：ACCTGGRCCRGAYTCMGGRGTWGCGCTTTCAGARGT(SEQ ID NO:361)

AE4正向：AGGTACYTCTACYGAACCKTCYGARGGYAGCGCWCC(SEQ ID NO:362)

AE4反向：ACCTGGWGCGCTRCCYTCRGAMGGTTCRGTAGARGT(SEQ ID NO:363)

我们还退火磷酸化寡核苷酸3KpnIstopper正向：AGGTTCGTCTTCACTCGAGGGTAC(SEQID NO:364)和非磷酸化寡核苷酸pr_3KpnIstopper反向：CCTCGAGTGAAGACGA(SEQ ID NO:365)。将退火的寡核苷酸对连接，得到具有不同长度的产物的混合物，所述不同长度代表与一个BbsI/KpnI片段连接的12mer重复序列的不同数目。将对应于长度为36个氨基酸的产物通过制备型琼脂糖凝胶电泳从混合物分离并连接到BsaI/KpnI消化的填充载体 pCW0359。得到的称为LCW0402的文库中大多数克隆在诱导后显示绿色荧光，这表明XTEN_AE36序列已经与GFP基因在框内连接，并且大多数XTEN_AE36序列显示良好表达。

我们通过将它们压印在含IPTG的琼脂平板上，针对高水平荧光从文库LCW0402筛选了96个独立克隆。通过PCR评估相同的独立克隆，并鉴定了含有具有36个氨基酸的片段以及强荧光的48个独立克隆。对这些独立克隆进行测序并鉴定了含有正确XTEN_AE36片段的37个克隆。这些片段的核苷酸和氨基酸构建体的文件名列于表11。

表11:36-mer基序的DNA和氨基酸序列

实施例3:XTEN_AF36片段的构建

构建了编码长度为36个氨基酸的序列的密码子文库。所述序列被称为XTEN_AF36。其片段具有氨基酸序列[X]₃，其中X是具有以下序列的12mer肽：GSTSESPSGTAP(SEQ ID NO:440)、GTSTPESGSASP(SEQ ID NO:441)、GTSPSGESSTAP(SEQ ID NO:442)或GSTSSTAESPGP(SEQ ID NO:443)。通过将以下对的磷酸化合成寡核苷酸对退火来获得插入序列：

AF1正向：AGGTTCTACYAGCGAATCYCCKTCTGGYACYGCWCC(SEQ ID NO:444)

AF1反向：ACCTGGWGCRGTRCCAGAMGGRGATTCGCTRGTAGA(SEQ ID NO:445)

AF2正向：AGGTACYTCTACYCCKGAAAGCGGYTCYGCWTCTCC(SEQ ID NO:446)

AF2反向：ACCTGGAGAWGCRGARCCGCTTTCMGGRGTAGARGT(SEQ ID NO:447)

AF3正向：AGGTACYTCYCCKAGCGGYGAATCTTCTACYGCWCC(SEQ ID NO:448)

AF3反向：ACCTGGWGCRGTAGAAGATTCRCCGCTMGGRGARGT(SEQ ID NO:449)

AF4正向：AGGTTCYACYAGCTCTACYGCWGAATCTCCKGGYCC(SEQ ID NO:450)

AF4反向：ACCTGGRCCMGGAGATTCWGCRGTAGAGCTRGTRGA (SEQ ID NO:451)

我们还退火磷酸化寡核苷酸3KpnIstopper正向：AGGTTCGTCTTCACTCGAGGGTAC(SEQID NO:452)和非磷酸化寡核苷酸pr_3KpnIstopper反向：CCTCGAGTGAAGACGA(SEQ ID NO:453)。将退火的寡核苷酸对连接，得到具有不同长度的产物的混合物，所述不同长度代表与一个BbsI/KpnI片段连接的12mer重复序列的不同数目。将对应于长度为36个氨基酸的产物通过制备型琼脂糖凝胶电泳从混合物分离并连接到BsaI/KpnI消化的填充载体pCW0359。得到的称为LCW0403的文库中大多数克隆在诱导后显示绿色荧光，这表明XTEN_AF36序列已经与GFP基因在框内连接，并且大多数XTEN_AF36序列显示良好的表达。

我们通过将它们压印在含IPTG的琼脂平板上，针对高水平荧光从文库LCW0403筛选了96个独立克隆。通过PCR评估相同的独立克隆，并鉴定了含有具有36个氨基酸的片段以及强荧光的48个独立克隆。对这些独立克隆进行测序并鉴定了含有正确XTEN_AF36片段的44个克隆。这些片段的核苷酸和氨基酸构建体的文件名列于表12。

表12:36-mer基序的DNA和氨基酸序列

实施例4:XTEN_AG36片段的构建

构建了编码长度为36个氨基酸的序列的密码子文库。所述序列被称为XTEN_AG36。其片段具有氨基酸序列[X]₃，其中X是具有以下序列的12mer肽：GTPGSGTASSSP(SEQ ID NO:542)、GSSTPSGATGSP(SEQ ID NO:543)、GSSPSASTGTGP(SEQ ID NO:544)或GASPGTSSTGSP(SEQ ID NO:545)。通过将以下对的磷酸化合成寡核苷酸对退火来获得插入序列：

AG1正向：AGGTACYCCKGGYAGCGGTACYGCWTCTTCYTCTCC(SEQ ID NO:546)

AG1反向：ACCTGGAGARGAAGAWGCRGTACCGCTRCCMGGRGT(SEQ ID NO:547)

AG2正向：AGGTAGCTCTACYCCKTCTGGTGCWACYGGYTCYCC(SEQ ID NO:548)

AG2反向：ACCTGGRGARCCRGTWGCACCAGAMGGRGTAGAGCT(SEQ ID NO:549)

AG3正向：AGGTTCTAGCCCKTCTGCWTCYACYGGTACYGGYCC(SEQ ID NO:550)

AG3反向：ACCTGGRCCRGTACCRGTRGAWGCAGAMGGGCTAGA(SEQ ID NO:551)

AG4正向：AGGTGCWTCYCCKGGYACYAGCTCTACYGGTTCTCC(SEQ ID NO:552)

AG4反向：ACCTGGAGAACCRGTAGAGCTRGTRCCMGGRGAWGC(SEQ ID NO:553)

我们还退火磷酸化寡核苷酸3KpnIstopper正向：AGGTTCGTCTTCACTCGAGGGTAC(SEQID NO:554)和非磷酸化寡核苷酸pr_3KpnIstopper反向：CCTCGAGTGAAGACGA(SEQ ID NO:555)。将退火的寡核苷酸对连接，得到具有不同长度的产物的混合物，所述不同长度代表与一个BbsI/KpnI片段连接的12mer重复序列的不同数目。将对应于长度为36个氨基酸的产物通过制备型琼脂糖凝胶电泳从混合物分离并连接到BsaI/KpnI消化的填充载体pCW0359。得到的称为LCW0404的文库中大多数克隆在诱导后显示绿色荧光，这表明XTEN_AG36序列已经与GFP基因在框内连接，并且大多数XTEN_AG36序列显示良好表达。

我们通过将它们压印在含IPTG的琼脂平板上，针对高水平荧光从文库LCW0404筛选了96个独立克隆。通过PCR评估相同的独立克隆，并鉴定了含有具有36个氨基酸的片段以及强荧光的48个独立克隆。对这些独立克隆进行测序并鉴定了含有正确XTEN_AG36片段的44个克隆。这些片段的核苷酸和氨基酸构建体的文件名列于表13。

表13:36-mer基序的DNA和氨基酸序列

实施例5:XTEN_AE864的构建

由XTEN_AE36的连续二聚化成AE72、144、288、576和864来构建XTEN_AE864。从37个不同的XTEN_AE36片段构建XTEN_AE72片段的集合。将携带所有37个不同的36-氨基酸片段的大肠杆菌的培养物混合并分离质粒。用BsaI/NcoI消化该质粒库以产生小片段作为插入序列。用BbsI/NcoI消化相同的质粒库以产生大片段作为载体。将插入序列和载体片段连接，导致长度倍增，并且将连接混合物转化到BL21Gold(DE3)细胞以获得XTEN_AE72的菌落。

将XTEN_AE72片段的该文库称为LCW0406。对来自LCW0406的所有克隆进行组合并使用如上述相同的方法再次二聚化，得到XTEN_AE144的文库LCW0410。对来自LCW0410的所有克隆进行组合并使用如上述相同的方法再次二聚化，得到XTEN_AE288的文库LCW0414。从文库随机选取两个独立克隆LCW0414.001和LCW0414.002并进行测序以证实同一性。对来自LCW0414的所有克隆进行组合并使用如上述相同的方法再次二聚化，得到XTEN_AE576的文库LCW0418。我们针对高水平的GFP荧光从文库LCW0418筛选了96个独立克隆。对通过PCR具有正确大小的插入序列和强荧光的8个独立克隆进行测序，并且基于测序和表达数据选择2个独立克隆(LCW0418.018和LCW0418.052)将来使用。

使用如上所述相同的二聚化过程，通过组合XTEN_AE576的LCW0418.018和XTEN_AE288的LCW0414.002构建XTEN_AE864的特定克隆pCW0432。

实施例6:XTEN_AM144的构建

从37个不同的XTEN_AE36片段、44个XTEN_AF36片段和44 个XTEN_AG36片段开始构建XTEN_AM144片段的集合。

将携带所有125个不同的36-氨基酸片段的大肠杆菌培养物混合并分离质粒。用BsaI/NcoI消化该质粒库以产生小片段作为插入序列。用BbsI/NcoI消化相同的质粒库以产生大片段作为载体。将插入序列和载体片段连接，导致长度倍增，并且将连接混合物转化到BL21Gold(DE3)细胞以获得XTEN_AM72的菌落。

将XTEN_AM72片段的该文库称为LCW0461。对来自LCW0461的所有克隆进行组合并使用如上述相同的方法再次二聚化，得到文库LCW0462。针对蛋白质表达筛选来自文库LCW0462的1512个独立克隆。将个体菌落转移至96孔板并培养过夜作为起始培养物。将这些起始培养物稀释到新鲜自动诱导培养基并培养20-30h。使用在395nm激发和在510nm发射的荧光分析仪测量表达。192个独立克隆显示了高水平表达，并且进行DNA测序。文库LCW0462中大多数克隆显示了良好表达和类似的理化性质，表明大多数XTEN_AM36片段的组合产生有用的XTEN序列。选择来自LCW0462的30个独立克隆作为XTEN_AM144片段的优选集合，用于构建含有多个XTEN片段的多功能蛋白质。这些片段的核苷酸和氨基酸构建体的文件名列于表14。

表14:AM144片段的DNA和氨基酸序列

实施例7:XTEN_AM288的构建

将整个文库LCW0462如实施例6所述二聚化，得到被称为LCW0463的XTEN_AM288克隆文库。使用实施例6中描述的方案筛选来自文库LCW0463的1512个独立克隆。对176个高表达的克隆进行测序，并且选择40个优选的XTEN_AM288片段来构建含有具有288个氨基酸残基的多个XTEN片段的多功能蛋白质。

实施例8:XTEN_AM432的构建

通过重组来自XTEN_AM144片段文库LCW0462的片段和来自XTEN_AM288片段文库LCW0463的片段，产生了XTEN_AM432片段的文库。该新的XTEN_AM432片段文库被称为LCW0464。从分别携带LCW0462和LCW0463的大肠杆菌的培养物分离质粒。使用实施例6描述的方案筛选来自文库LCW0463的1512个独立克隆。对176个高表达克隆进行测序，并且选择39个优选的XTEN_AM432片段来构建更长的XTEN并构建含有具有432个氨基酸残基的多个XTEN片段的多功能蛋白质。

同时，我们使用XTEN_AM144和XTEN_AM288的优选片段构建了XTEN_AM432片段的文库LMS0100。筛选该文库产生了选择用于进一步构建的4个独立克隆。

实施例9:XTEN_AM875的构建

用BsaI和KpnI消化填充载体pCW0359以去除填充片段，并且得到的载体片段通过琼脂糖凝胶纯化来分离。

我们退火磷酸化寡核苷酸BsaI-AscI-KpnI正向引物:AGGTGCAAGCGCAAGCGGCGCGCCAAGCACGGGAGGTTCGTCTTCACTCGAGGGTAC(SEQ ID NO:710)和非磷酸化寡核苷酸BsaI-AscI-KpnI反向：CCTCGAGTGAAGACGAACCTCCCGTGCTTGGCGCGCCGCTTGCGCTTGC(SEQ ID NO:711)，以引入编码氨基酸GASASGAPSTG(SEQ ID NO:712)并且内部具有限制酶AscI识别核苷酸序列GGCGCGCC的测序岛A(SI-A)。将退火的寡核苷酸对与上述制备的BsaI和KpnI消化的填充载体pCW0359连接，以产生含有SI-A的pCW0466。然后，我们使用实施例5描述的相同二聚化方法通过在C端重组来自实施例8的43个优选的XTEN_AM432片段和来自pCW0466的SI-A片段而产生XTEN_AM443片段文库。将该新的XTEN_AM443片段文库称为LCW0479。

我们使用实施例5描述的相同的二聚化方法，通过重组来自XTEN_AM443片段的文库LCW0479的片段和来自实施例8的43个优选的XTEN_AM432片段而产生XTEN_AM875片段文库。将该新的XTEN_AM875片段文库称为LCW0481。

实施例10:XTEN_AM1318的构建

我们退火磷酸化寡核苷酸BsaI-FseI-KpnI正向引物:AGGTCCAGAACCAACGGGGCCGGCCCCAAGCGGAGGTTCGTCTTCACTCGAGGGTAC(SEQ ID NO:713)和非磷酸化寡核苷酸BsaI-FseI-KpnI反向：CCTCGAGTGAAGACGAACCTCCGCTTGGGGCCGGCCCCGTTGGTTCTGG(SEQ ID NO:714)，以引入编码氨基酸GPEPTGPAPSG(SEQ ID NO:715)并且内部具有限制酶FseI识别核苷酸序列GGCCGGCC的测序岛A(SI-B)。将退火的寡核苷酸对与如实施例9使用的BsaI和KpnI消化的填充载体pCW0359连接，以产生含有SI-B的pCW0467。然后，我们使用实施例5描述的相同二聚化方法，通过在C端重组来自实施例8的43个优选的XTEN_AM432片段和来自pCW0467的SI-B片段而产生XTEN_AM443片段文库。将该新的XTEN_AM443片段文库称为LCW0480。

我们使用实施例5描述的相同的二聚化方法，通过重组来自XTEN_AM443片段文库LCW0480的片段和来自XTEN_AM875片段文库LCW0481的片段而产生XTEN_AM1318片段文库。将该新的XTEN_AM1318片段文库称为LCW0487。

实施例11:XTEN_AD864的构建

使用几轮连续的二聚化，我们从实施例1所列XTEN_AD36片段开始组装XTEN_AD864序列的集合。将这些序列如实施例5所述来组装。评估了来自XTEN_AD864的几个独立克隆并发现在生理条件下显示良好的表达和优良的溶解度。对XTEN_AD576的一个中间构建体进行测序。在PK实验中对该克隆在食蟹猴中评估并测量半衰期为约20h。

实施例12:XTEN_AF864的构建

使用几轮连续的二聚化，我们从实施例3所列XTEN_AF36片段开始组装XTEN_AF864序列的集合。将这些序列如实施例5所述来组装。评估了来自XTEN_AF864的几个独立克隆并发现在生理条件下显示良好的表达和优良的溶解度。对XTEN_AF540的一个中间构建体进行测序。在PK实验中对该克隆在食蟹猴中评估并测量半衰期为约20h。XTEN_AF864的全长克隆具有优良溶解度，并且显示在食蟹猴中超过60h的半衰期。将第二组XTEN_AF序列组装为包括实施例9所述的测序岛。

实施例13:XTEN_AG864的构建

使用几轮连续的二聚化，我们从实施例1所列XTEN_AD36片段开始组装XTEN_AG864序列的集合。将这些序列如实施例5所述来组装。评估了来自XTEN_AG864的几个独立克隆并发现在生理条件下显示良好的表达和优良的溶解度。XTEN_AG864的全长克隆具有优良的溶解度，并且显示在食蟹猴中超过60h的半衰期。

实施例14：XTEN-构建的N端延伸的构建和12mer附加文库的筛选

本实施例详细描述了在XTEN蛋白的N端优化中促进转录起始的步骤以允许XTEN融合物在无辅助结构域存在下在融合蛋白N端表达。历史上，在N端具有XTEN的蛋白质的表达差，产生在GFP荧光测定中基本不可检测的值(<具有N端CBD辅助结构域的表达的25%)。为了产生密码子水平上的多样性，选择七个氨基酸序列并用多种密码子制备。设计具有密码子多样性的编码12个氨基酸的七对寡核苷酸、退火并连接到NdeI/BsaI限制酶消化的填充载体pCW0551(填充片段-XTEN_AM875-GFP)，并转化到大肠杆菌BL21Gold(DE3)感受态细胞以获得七个文库的菌落。得到的克隆具有与XTEN_AM875-GFP在框内融合的N端XTEN12mer，以允许使用GFP荧光筛选表达。挑取来自七个产生的文库的个体菌落并过夜生长至在96深孔板中500μl超级肉汤培养基中饱和。挑取的菌落数范围是文库理论多样性的大约一半至三分之一(参见表15)。

表15:12mer附加文库的理论多样性和取样数目。具有随机化密码子的氨基酸残基加下划线。

文库	基序家族	氨基酸序列	SEQ ID NO:	理论多样性	筛选数目
						LCW546	AE12	MASPAGSPTSTEE	716	572	2个板(168)
LCW547	AE12	MATSESATPESGP	717	1536	5个板(420)
						LCW548	AF12	MATSPSGESSTAP	718	192	2个板(168)
LCW549	AF12	MESTSSTAESPGP	719	384	2个板(168)
						LCW552	AG12	MASSTPSGATGSP	720	384	2个板(168)
LCW553	AG12	MEASPGTSSTGSP	721	384	2个板(168)
						LCW554	(CBD-样)	MASTPESGSSG	722	32	1个板(84)

饱和的过夜培养物用于将新鲜500μl培养物接种于在其中于26℃下生长过夜的自诱导培养基中。然后使用荧光酶标仪(激发395nm，发射510nm)测定这些表达培养物，以测定存在的GFP报告分子的量(表达测定的结果参见图9)。描绘为箱线图的结果表明，虽然中值表达水平是"基准"CBD N端辅助结构域表达水平的大约一半，但来自文库的最佳克隆非常接近于基准，表明围绕那些序列的进一步优化是有保证的。这与之前的<CBD N端基准表达水平的25%的XTEN形式不同。结果还显示，从氨基酸MA开始的文库具有比ME开始的文库更好的表达水平。这在考察最佳克隆时是最明显的，最佳克隆更接近基准，因为它们大部分开始于MA。在CBD-AM875基准的33%内的176个克隆中，87%开始于MA，其中因为文库中仅75%的序列开始于MA，明显超过最高表达水平的开始于MA的克隆的代表。对96个最佳克隆进行测序以确认同一性，选择12个序列(参见表16)进一步优化，4个来自LCW546，4个来自LCW547，并且4个来自LCW552。

表16:提出的12mer DNA核苷酸序列

实施例15:XTEN-构建的N端延伸的构建和优化密码子3和4的文库的筛选

本实施例详细描述了在XTEN蛋白的N端优化中促进转录起始的步骤以允许XTEN融合物在无辅助结构域存在下在蛋白质的N端表达。对已确立的前两个密码子的偏好(参见以上实施例)，对第三和第四密码子进行随机化以确定偏好。基于来自LCW546、LCW547和LCW552的最佳克隆，设计了第三和第四残基被修饰的三个文库，使得可允许的XTEN密码子的所有组合存在于这些位置(参见图10)。为了使每个文库包括所有可允许的XTEN密码子，设计第三核第四残基具有密码子多样性的编码12个氨基酸的九对寡核苷酸、退火并连接到NdeI/BsaI限制酶消化的填充载体pCW0551(填充片段-XTEN_AM875-GFP)，并转化到大肠杆菌BL21Gold(DE3)感受态细胞以获得三个文库LCW0569-571的菌落。对于24个XTEN密码子，每个文库的理论多样性是576个独特克隆。挑取来自三个产生的文库的总计504个单独菌落并过夜生长至在96深孔板中500μl超级肉汤培养基中饱和。这提供了足够的覆盖以理解相对文库性能和序列偏好。饱和的过夜培养物用于将新鲜500μl培养物接种在其中于26℃下生长过夜的自诱导培养基中。然后使用荧光酶标仪(激发395nm，发射510nm)测定这些表达培养物，以测定存在的GFP报告分子的量。对来自筛选的前75个克隆进行测序并测试GFP报告分子表达，与基准样本相比(参见图11)。52个克隆产生了可用的测序数据，并用于随后分析。结果通过文库分解，并且表明LCW546是优良的文库。结果提供于表17。出人意外的是，最佳克隆的基线荧光读数是～900AU，而CBD N端基准仅为～600AU。这表明，该文库已经确立了相对于来自之前文库的最佳克隆大约33%的提高，之前文库的最佳克隆的表达大约等于CBD N端基准(实施例14)。

表17:第三和第四密码子优化文库比较

	LCW569	LCW570	LCW571
				N	21	15	16
平均荧光(AU)	628	491	537
				SD	173	71	232
CV	28%	15%	43%

数据中发现其它趋势，显示对第三和第四位置特定密码子的偏好。在LCW569文库内，第三位置的谷氨酸密码子GAA和苏氨酸密码子ACT与较高的表达相关，如表18所见。

表18:LCW569中优选的第三和第四密码子

	3=GAA	其它	4=ACT	其它
					N	8	13	4	17
平均荧光(AU)	749	554	744	601
					SD	234	47	197	162
CV	31%	9%	26%	27%

此外，前75个克隆的再测试表明这几个目前优于基准克隆。

实施例16:XTEN-构建的N端延伸的构建和组合12mer和36mer文库的筛选

本实施例详细描述了在XTEN蛋白的N端优化中促进转录起始的步骤以允许XTEN融合物在无辅助结构域存在下在蛋白质N端的的表达。对已确立的前两个密码子的偏好(参见以上实施例)，通过以组合方式组合在最N端的12个选定的12mer序列(参见以上实施例) 和随后125个之前构建的36mer片段(参见以上实施例)，以更宽范围检验N端。这在XTEN蛋白的N端产生新的48mer，并使能够评估N端更长范围相互作用对更长序列表达的影响(图12)。类似于用于组装36mer的二聚化程序(参见以上实施例)，用限制酶BbsI/NcoI消化含有125个选定36mer片段的质粒，并凝胶纯化适合的片段。也用BsaI/NcoI消化来自克隆AC94的质粒(CBD-XTEN_AM875-GFP)并凝胶纯化适合的片段。将这些片段连接在一起并转化入大肠杆菌BL21Gold(DE3)感受态细胞以获得文库LCW0579的菌落，其还可以用作载体以在最N端克隆12个选定的12mer。用NdeI/EcoRI/BsaI消化LCW0579的质粒并凝胶纯化适当的片段。设计编码12个选定的12mer序列的12对寡核苷酸、退火并与NdeI/EcoRI/BsaI消化的LCW0579载体连接，并转化到大肠杆菌BL21Gold(DE3)感受态细胞以获得文库LCW0580的菌落。根据1500个独特克隆的理论多样性，挑取总共1512个来自产生文库的个体菌落并过夜生长至在96深孔板中500μl超级肉汤培养基中饱和。这提供了足够的覆盖以理解相对文库性能和序列偏好。饱和的过夜培养物用于将新鲜500μl培养物接种于在其中于26℃下生长过夜的自诱导培养基中。然后使用荧光酶标仪(激发395nm，发射510nm)测定这些表达培养物，以测定存在的GFP报告分子的量。对前90个克隆进行测序并再测试GFP报告分子表达。83个克隆产生了可用的测序数据，并用于随后分析。测序数据用于确定每个克隆中存在的前导12mer，并且评估每个12mer对表达的影响。克隆LCW546_06和LCW546_09突显作为优良的N端(参见表19)。

表19:以LCW546_06和LCW459_09开始的克隆的相对性能

	LCW546_06	所有其它	LCW546_09	所有其它
					N	11	72	9	74
平均荧光(AU)	1100	752	988	775
					SD	275	154	179	202
CV	25%	20%	18%	26%

测序和再测试也揭示了产生类似结果的数据中相同序列的独立复制子的几种情况，由此增加测定的置信度。此外，具有6个独特序列的10个克隆优于基准克隆。它们提供于表20。应注意，这些是这些序列的唯一出现，并且绝不是这些序列出现之一，并且未能击败基准克隆。提出这六个序列用于进一步优化。

表20:优于基准克隆的组合的12mer和36mer克隆

实施例17:XTEN-构建的N端延伸的构建和XTEN-AM875和XTEN-AE864组合12mer和36mer文库的筛选

本实施例详细描述了在XTEN蛋白的N端优化中促进转录起始的步骤以允许XTEN融合物在无辅助结构域存在下在蛋白质N端的表达。根据已确定的对前四个密码子(参见以上实施例)及N端12mer和36mer最佳配对(参见以上实施例)的偏好，进行组合的方法以检验这些偏好的联合。这在XTEN蛋白的N端产生新的48mer，并使能够检测之前结论的影响。此外，通过将该新的48mer置于XTEN-AE864和XTEN-AM875两者之前，来评估这些前导序列成为所有XTEN蛋白的通用解决方案的能力。用NdeI/EcoRI/BsaI消化来自组合文库中具有最佳GFP表达的36mer片段的6个选定克隆的质粒并将合适的片段凝胶纯化，而不是使用36mer片段的所有125个克隆。用NdeI/EcoRI/BsaI消化来自克隆AC94(CBD-XTEN_AM875-GFP)和AC104(CBD-XTEN_AE864-GFP)的质粒并将合适的片段凝胶纯化。将这些片段连接在一起，并且转化到大肠杆菌BL21Gold(DE3)感受态细胞中以获得文库LCW0585(-XTEN_AM875-GFP)和LCW0586(-XTEN_AE864-GFP)的菌落，其还可用作用于进一步克隆在最N端的8个选定12mer的载体。用NdeI/EcoRI/BsaI消化质粒 LCW0585和LCW0586并将合适的片段凝胶纯化。在之前(第二代)的筛选中，设计编码具有最佳GFP表达的8个选定12mer序列的8对寡核苷酸、退火，再与用NdeI/EcoRI/BsaI消化过的LCW0585和LCW0586载体连接，并转化到大肠杆菌BL21Gold(DE3)感受态细胞以获得最终文库LCW0587(XTEN_AM923-GFP)和LCW0588(XTEN_AE912-GFP)的菌落。根据48个独特克隆的理论多样性，在96深孔板中，挑取总共252个来自构建的文库的个体菌落并使其过夜生长至在96深孔板中500μl超级肉汤培养基中饱和。这提供了足够的覆盖范围以理解相对文库性能和序列偏好。饱和的过夜培养物用于将新鲜500μl培养物接种于在其中于26℃下生长过夜的自诱导培养基中。然后使用荧光酶标仪(激发395nm，发射510nm)测定这些表达培养物，以测定存在的GFP报告分子的量。对前36个克隆进行测序并再测试GFP报告分子的表达。36个克隆产生了可用的测序数据，并且这36个用于随后分析。测序数据确定了克隆中存在的12mer、第三个密码子、第四个密码子和36mer，并且揭示许多克隆是相同序列的独立复制子。此外，这些克隆的再测试结果在数值上相近的，说明该筛选方法是强大的。发现了在N端的某种组合的偏好，并且一致地产生比基准对照高约50%的较高荧光值(参见表21和表22)。这些数据支持了这样一个结论：在融合蛋白基因纳入编码已优化的N端XTEN的序列使融合蛋白表达显著增强。

表21:XTEN-AM875的优选N端组合

表22:XTEN-AE864的优选N端组合

很明显，XTEN-AM875的优选N端组合与XTEN-AE864的优选组合是不同的(表21和表22)，说明从起始位点超过150个碱基的更加复杂的相互作用影响表达水平。表23中列出优选的核苷酸序列，并且通过SDS-PAGE分析优选的克隆以独立确认表达(参见图13)。挑选出XTEN_AM923和XTEN_AE912的完整序列以作进一步分析。

表23:N端XTEN-AM875和XTEN-AE864的前48个氨基酸残基的优选DNA核苷酸序列

实施例18:产生和评估GPXTEN的方法；XTEN-Ex4作实例

用于产生和评估GPXTEN组合物的一般方案示于图6，并且构成本实施例的一般描述的基础。使用已公开的方法和本领域普通技术人员已知的方法，结合示例性实施例中提供的指导，技术人员可以构建并且评估包含XTEN、GP和本领域已知的GP变体的一系列GPXTEN融合蛋白。因此，本实施例将被解释为仅仅是示例性的，而不是以任何方式限制所述方法；许多变化对于普通技术人员是明显的。在本实施例中，将构建与基序AE家族的XTEN连接的exendin-4的GPXTEN。

图4和图5提供了用于产生编码XTEN的多核苷酸的一般方案。图5是在本发明一个实施方案中XTEN多核苷酸构建体的组装的代表性步骤的示意流程图。将个体寡核苷酸501退火为序列基序502，如12氨基酸基序(“12-mer”)，它随后与含有BbsI和KpnI限制性位点503的寡核苷酸连接。基序文库可限制为特定的序列XTEN家族；例如表1中的AD、AE、AF、AG、AM或AQ序列。在这种情况下，AE家族的基序将作为基序文库使用，其退火为12mer以构建“结构单元”长度；例如，编码36个氨基酸的片段。可以通过“结构单元”的连接和多聚化来组装编码XTEN序列的基因，直至达到XTEN基因504的期望长度。如图5所示，该例中XTEN的长度是48个氨基酸残基，但通过该方法可以达到更长的长度。例如，多聚化可以借助连接、重叠延伸、PCR组装或本领域已知的类似克隆技术来进行。可将XTEN基因克隆到填充载体。在如图5中显示的实施例中，载体可以编码flag序列506，其后为两侧带有BsaI、BbsI和KpnI位点507的填充序列和GP基因(如，exendin-4)508，得到编码GPXTEN500的基因，其在该例中编码构型为N到C端XTEN-Ex4的融合蛋白。

编码Ex4(或另一候选GP)的DNA序列可以方便地通过本领域中已知标准程序从适合细胞来源制备的cDNA文库得到，从基因组文库得到，或可以使用可公开获得的数据库、专利或参考文献中得到的DNA序列以合成的方式来构建(如，自动化核酸合成)。然后，将编码蛋白质的Ex4部分的基因或多核苷酸能够克隆到构建体，例如本文描述的那些构建体，它们可以是质粒，或者是在生物系统中为高水平蛋白质表达而受控于合适的转录和翻译序列的其它载体。通过连接或多聚化步骤，可将编码XTEN部分(图5实例中示例为带有48个氨基酸残基的AE)的第二基因或多核苷酸与编码Ex4基因的N端(或其互补体)的核苷酸进行基因融合，方式是将其与编码Ex4的基因相邻且在框内克隆到构建体。可将编码较长XTEN的其它核苷酸与XTEN-Ex4基因连接以达到XTEN组分的期望长度。另外，可将编码XTEN的多核苷酸相邻或在框内与编码Ex4序列的C端(或其互补体)的核苷酸连接，得到编码GPXTEN(其中XTEN与exendin-4葡萄糖调节肽的N端和C端连接)的基因，包括优化的N端序列(NTS)，如图8所示例。以这种方式，一种编码(或互补于)XTEN-Ex4GPXTEN融合蛋白的嵌合DNA分子将在构建体中产生。此构建体可被设计成不同构型，以编码作为单体多肽的融合配偶体的多种排列变化。例如，此基因能够被构建成编码具有以下顺序(N到C端)的融合蛋白：Ex4-XTEN；XTEN-Ex4；Ex4-XTEN-Ex4；XTEN-Ex4-XTEN；以及前述的多聚体。任选地，这种嵌合DNA分子可以被转移或克隆到作为更加适合的表达载体的另一构建体。在这一点上，能够表达嵌合DNA分子的宿主细胞会被嵌合DNA分子转化。如上所述，可将含有目标DNA片段的载体根据细胞宿主的类型通过已知的方法转移到合适的宿主细胞。

将在酌情改进用于激活启动子的常规营养培养基中培养含有XTEN-Ex4表达载体的宿主细胞。培养条件，比如温度、pH等，是之前用于所选择用于表达的宿主细胞并对于普通技术人员是显然的那些条件。此融合蛋白表达之后，将通过离心收集细胞，用物理或化学方法破裂，保留得到的粗提取物用于纯化融合蛋白，如下所述。对于宿主细胞分泌的GPXTEN组合物，分离由离心得到的上清液，并保留用于进一步的纯化。

可在样本中直接测定基因表达，例如，通过常规的Southern印迹、定量mRNA的转录的Northern印迹[Thomas,Proc.Natl.Acad.Sci.USA,77:5201-5205(1980)]、斑点印迹(DNA分析)或原位杂交，根据在本文提供的序列使用适当标记探针。或者，通过免疫荧光的方法，比如细胞免疫组织化学染色以直接定量基因产物的表达，来测量基因表达。用于免疫组织化学染色和/或样本液体测定的抗体可以是单克隆的或多克隆的，而且可以在任何哺乳动物中制备。方便的是，可以利用基于本文提供的序列的合成肽制备针对Ex4序列多肽的抗体，或者是针对与Ex4融合并编码特定抗体表位的外源序列的抗体。选择性标记的实例是本领域技术人员熟知的，并且包括报告分子如增强的绿色荧光蛋白(EGFP)、β-半乳糖苷酶(β-gal)或氯霉素乙酰基转移酶(CAT)。

经本领域已知的方法纯化XTEN-Ex4多肽产物。程序，如凝胶过滤、亲和纯化、盐分级分离、离子交换色谱、尺寸排阻色谱、羟磷灰石吸附色谱、疏水作用色谱或凝胶电泳，都是可在纯化中使用的技术。在Robert K.Scopes,Protein Purification:Principles andPractice,Charles R.Castor编著,Springer-Verlag1994,和Sambrook,等(同上)中描述了具体的纯化方法。在Baron,等,Crit.Rev.Biotechnol.10:179-90(1990)和Below,等,J.Chromatogr.A.679:67-83(1994)中也描述了多步纯化分离。

如图6所示，分离的XTEN-Ex4融合蛋白然后根据它们的化学与活性性质来表征。使用该领域已知的标准方法对于例如序列、纯度、表观分子量、溶解度和稳定性对分离的融合蛋白进行表征。然后评估符合预期标准的融合蛋白的活性，这可以通过使用一种或多种本文公开的测定，例如实施例或表35的测定在体外或体内进行测量。

此外，将XTEN-Ex4融合蛋白施用给一种或多种动物种以确定标准药代动力学参数，如实施例25中所述。

通过生产、表达和回收XTEN-Ex4构建体的反复过程，随后使用本文公开的方法或本领域已知的其它方法对其表征，包含Ex4和XTEN的GPXTEN组合物可以由本领域普通技术人员制备和评估以确认预期特性，如增强的溶解度、增强的稳定性、改进的药代动力学和降低的免疫原性，导致与相应的未融合Ex4相比总体增强的治疗活性。对于不具有期望特性的那些融合蛋白，可通过这些方法构建、表达、分离和评估不同的序列以获得具有这些特性的组合物。

实施例19:Exendin-4_XTEN基因和载体的构建

用exendin-4编码序列组装纤维素结合域(CBD)并将其与XTEN的N端的编码序列基因融合。CBD后紧接烟草蚀刻病毒(TEV)蛋白酶裂解位点(ENLYFQ(SEQ ID NO:749))用于加工exendin-4的天然N端。通过使用3’寡核苷酸扩增CBD基因来组装CBD-Exendin-4片段，所述3’寡核苷酸使exendin-4序列在TEV裂解位点之后融合，导致exendin-4与CBD基因的C端的框内融合。然后通过聚合酶链式反应(PCR)扩增全长CBD-exendin-4，这引入NdeI和BbsI限制性位点，它们与XTEN目标载体中的填充片段的两侧的NdeI和BsaI位点相容(图7A)。prXTEN质粒是来自Novagen的pET30衍生物，其中已在T7启动子的控制下插入填充片段-XTEN序列，其中取决于所使用的具体质粒，填充片段可以是编码绿色荧光蛋白(GFP)或CBD的序列。还取决于所使用的具体质粒，XTEN可以是36至864个氨基酸或更多的任何长度。通过用CBD-exendin-4编码片段替代prXTEN中的填充序列而产生构建体(图7B)。prXTEN的特征是填充序列上游的T7启动子，和后在填充序列下游框内融合的XTEN序列。在该具体实施方案中使用的XTEN序列编码具有864个氨基酸的AE864。通过使用NdeI和BsaI内切酶限制性消化来去除填充片段。使用T4DNA连接酶将经限制性消化的CBD-exendin-4片段连接到切割后的pCBD-XTEN载体，并电穿孔进入BL21(DE3)Gold(Stratagene)。用DNA小量制备物筛选转化子，并通过DNA测序证实期望的构建体。在T7启动子的控制下，最终载体产生CBD_exendin-4_XTEN基因。

实施例20:胰高血糖素-XTEN基因和载体的构建

用胰高血糖素编码序列组装纤维素结合域(CBD)并将其与XTEN的编码序列基因融合。CBD后紧接烟草蚀刻病毒(TEV)蛋白酶裂解位点(ENLYFQ(SEQ ID NO:750))用于加工胰高血糖素的天然N端。通过使用3’寡核苷酸扩增CBD基因来组装CBD-胰高血糖素片段，所述3’寡核苷酸使胰高血糖素序列在TEV裂解位点之后融合，导致胰高血糖素与CBD基因的C端的框内融合。然后通过聚合酶链式反应(PCR)扩增全长CBD-胰高血糖素，这引入NdeI和BbsI限制性位点，它们与XTEN目标载体中的填充片段的两侧的NdeI和BsaI位点相容(pXTEN)。pXTEN质粒是来自Novagen的pET30衍生物，其中已在T7启动子的控制下插入填充片段-XTEN序列，其中取决于所使用的具体质粒，填充片段可以是编码绿色荧光蛋白(GFP)或CBD的序列。还取决于所使用的具体质粒，XTEN可以是36至875个氨基酸或更多的任何长度。通过用CBD-胰高血糖素编码片段替代prXTEN中的填充序列而产生构建体。pXTEN的特征是填充序列上游的T7启动子和在填充序列下游框内融合的XTEN序列。在该具体实施例中使用的XTEN序列属于XTEN的Y家族并且编码包含36、72、144、288和576个氨基酸的长度。通过使用NdeI和BsaI内切酶限制性消化来去除填充片段。使用T4DNA连接酶将经限制性消化的CBD-胰高血糖素片段连接到切割后的prXTEN载体，并且电穿孔进入BL21(DE3)Gold(Stratagene)。用DNA小量制备物筛选转化子，并通过DNA测序证实期望的构建体。在T7启动子的控制下，最终载体产生CBD_胰高血糖素_XTEN基因。所得到的DNA序列可编码与分别为36、72、144、288和576个氨基酸的XTEN长度连接的胰高血糖素。

实施例21：Gcg-XTEN的纯化和表征

通过重组方式在大肠杆菌中产生与XTEN连接的胰高血糖素的GPXTEN并使用三个并列的步骤纯化至均质。最终构建体包含在T7启动子控制下的编码来自热纤梭菌(C.thermocellum)(登记号ABN54273)的纤维体锚定蛋白粘着区纤维素结合域(CBD)的基因、烟草蚀刻病毒(TEV)蛋白酶识别位点(ENLYFQ(SEQ ID NO:750))、胰高血糖素序列和适当的XTEN序列。简言之，通过将1mM IPTG添加至携带表达质粒的BL21-Gold(DE3)大肠杆菌的对数期培养物中来诱导蛋白质表达。将TEV蛋白酶添加至含有Gcg-XTEN的热处理细胞裂解液中以除去CBD序列并产生胰高血糖素的天然N端。然后在DE52、MacroCap Q和ButylSepharose FF柱上纯化裂解后的蛋白质。在20mM Tris(pH7.5)、135mM NaCl中配制最终物质并使用0.22微米过滤器进行无菌过滤。测定表达为大约每克湿细胞重7mg蛋白质(最终OD～4时为～100mg/L)并且总纯化产率为大约60%。

使用与设有自动进样器和UV/VIS检测器(Shimadzu)的HPLC系统连接的TSK-Gel,G3000SWXL,7.8x300mm HPLC柱(Tosoh Bioscience)进行尺寸排阻色谱分析(SEC)。在环境温度下以流速为0.7mL/min于磷酸盐缓冲盐水(PBS)中使系统平衡。对于柱校准，使用凝胶过滤标准品(BioRad,cat#151-1901)。对于样本分析，注入20μl的1mg/ml Gcg-XTEN，并使用OD214nm监测吸光度20min。

使用与设有自动进样器和UV/VIS检测器(Shimadzu)的HPLC系统连接的Phenomenex Gemini5μm C18-110A,4.6x100mm柱(Phenomenex))进行反相C18色谱分析(RPC18)。缓冲液A是水中的0.1%TFA且缓冲液B是100%乙腈中的0.1%TFA。在组合流速1ml/min下使系统运行。在35℃下于5%缓冲液B中使柱平衡。在15分钟内通过5%至95%B的线形梯度实现Gcg-XTEN的色谱分离。对于样本分析，注入10μl的1mg/ml Gcg-XTEN并使用OD214nm监测吸光度。使用转染的GcgR细胞系(Cat#HTS112C)通过Millipore’s service进行样本分析。在添加系列稀释的Gcg-XTEN或合成胰高血糖素后通过FLIPR分析实时监测钙通量。图19示出表征和稳定性测定的结果。数据显示Gcg-XTEN是均质的、明确的化学实体。另外，相比于未修饰的胰高血糖素，最终蛋白质的溶解度和稳定性显著改善(数据未显示)。

实施例22:具有不同有效负载的XTEN融合蛋白的分析型尺寸排阻色谱

对包含各种治疗蛋白和增加长度的非结构化重组蛋白的融合蛋白进行尺寸排阻色谱分析。示例性的测定使用TSKGel-G4000SWXL(7.8mm×3cm)柱，其中在20mM磷酸盐(pH6.8)、114mM NaCl中以0.6ml/min的流速分离浓度为1mg/ml的40μg的纯化胰高血糖素融合蛋白。用OD214nm和OD280nm监测色谱曲线。使用BioRad的尺寸排阻校准标准来进行所有分析的柱校准；分子量标准包括甲状腺球蛋白(670kDa)，牛γ-球蛋白(158kDa)，鸡卵清蛋白(44kDa)，马肌红蛋白(17kDa)和维生素B12(1.35kDa)。胰高血糖素-Y288、胰高血糖素-Y144、胰高血糖素-Y72、胰高血糖素-Y36的代表性色谱曲线在图16中重叠显示。数据显示每种化合物的表观分子量是和连接的XTEN序列的长度成比例。然而，数据也显示了每种构建体的表观分子量显著大于对球状蛋白质所预期的表观分子量(如通过与在相同测定中运行的标准蛋白质相比较和通过与图15的SDS凝胶中所显示的分子量标准所显示)。根据包括GPXTEN组合物在内的被评价的所有构建体的SEC分析，表观分子量、表观分子量因子(用表观分子量与计算分子量的比值表示)和流体动力学半径(R_H，以nm计)示出在表24中。结果表明，576个氨基酸或更大的不同XTEN的加入赋予融合蛋白以约339kDa至760的表观分子量，并且864个氨基酸或更大的XTEN赋予融合蛋白以大于约800kDA的表观分子量。表观分子量与实际分子量成比例增加的结果符合用来自几个不同基序家族(即，AD、AE、AF、AG和AM)的XTEN构建的融合蛋白增加至少4倍，比例高达约17倍。此外，具有576个氨基酸或更多的XTEN融合配偶体加入具有各种有效负载的融合蛋白(在与Y288融合的胰高血糖素的情况下为288个残基)，导致7nm或者更大的流体动力学半径；远远超出了大约3-5nm的肾小球孔径。因此，结论为相对于相应的未融合生物有效负载蛋白，包含葡萄糖调节肽和XTEN的融合蛋白具有降低的肾脏清除率，有助于增加终末半衰期和提高治疗或生物效应。

表24:各种多肽的SEC分析

实施例23:与GFP融合的延伸多肽在食蟹猴中的药代动力学

在食蟹猴中测试GFP-L288、GFP-L576、GFP-XTEN_AF576、GFP-XTEN_Y576和XTEN_AD836-GFP的药代动力学以确定非结构化多肽的组成和长度对PK参数的影响。在注射后的各个时间分析血样，并且使用用于捕获的针对GFP的多克隆抗体和用于检测的相同多克隆抗体的生物素化制品，通过ELISA测量血浆中的GFP浓度。结果总结于图26。结果显示半衰期随XTEN序列的增长而出人意外的增加。例如，测定GFP-XTEN_L288(在XTEN中具有288个氨基酸残基)的半衰期为10小时。使非结构化的多肽融合配偶体的长度加倍至576个氨基酸，使多种融合蛋白构建体(即，GFP-XTEN_L576、GFP-XTEN_AF576、GFP-XTEN_Y576)的半衰期增加至20-22h。进一步增加非结构化的多肽融合配偶体长度至836个残基，导致XTEN_AD836-GFP的半衰期为72-75h。因此，使聚合物长度从288个残基增加288个残基到576个残基，使体内半衰期增加约10h。然而，使多肽长度从576个残基增加260个残基到836个残基，使半衰期增加多于50h。这些结果显示非结构化的多肽长度存在一个令人惊奇的阈值，这导致体内半衰期超比例增加。因此，与较短长度的多肽相比，包含延伸的非结构化多肽的融合蛋白预期具有增强的药代动力学的性质。

实施例24:XTEN的血清稳定性

使含有与GFP的N端融合的XTEN_AE864的融合蛋白在食蟹猴血浆和大鼠肾脏裂解物中在37℃下孵育7天。在时间0，第1天和第7天取样并通过SDS PAGE分析，随后用Western分析检测并用针对GFP的抗体检测，如图14所示。XTEN_AE864的序列在血浆中经7天显示可忽略的降解迹象。然而，XTEN_AE864在大鼠肾脏裂解物中经3天迅速降解。在血浆样本中检测融合蛋白的体内稳定性，其中如上所描述对GF-AE864进行免疫沉淀并通过SDS PAGE分析。注射后长达7天所取的样本显示了非常少的降解迹象。结果证明了GPXTEN对血清蛋白酶引起的降解的抗性；这是GPXTEN融合蛋白药代动力学性质增强的一个因素。

实施例25：包含exendin-4和XTEN的融合蛋白的PK分析

在食蟹猴中评估GPXTEN融合蛋白Ex4_AE864以测定单个皮下给药后融合蛋白的体内药代动力学参数。

方法：在20mM Tris(pH7.5)、135mM NaCl中以两个不同的浓度(8mg/mL和40mg/mL)配制GPXTEN融合蛋白。在每只动物背部上肩胛区域的皮肤和组织下层之间通过弹丸注射(bolus injection)以1mg/kg(第1组,0.125mL/kg)、1mg/kg(第2组,0.025mL/kg)或5mg/kg(第3组,0.125mL/kg)对每组四只猴(2只雄性和2只雌性，2-6kg)的三个组给药。使用座椅限制(chair restraint)在十四天内用注射器从先前驯化的动物的股骨静脉或动脉无知觉抽取系列血液样本(1ml±0.5ml)。若需要，使用座椅限制最长30分钟。在给药前对所有动物禁食过夜并且贯穿血液样本采集的最初4个小时(在适当的情况下，以4小时采集间隔采集最后一次血液样本后30分钟内送回食物)。将每个血液样本采集在肝素血浆分离器中并在冰上(2℃至8℃)保持大约5分钟以待离心。使血液样本离心(8,000x g，5min)并将血浆转移到聚丙烯管中。将血浆样本速冻，并在大约-70℃下存储直到测定。使用夹心ELISA形式进行分析。

结果：计算猴的药代动力学参数并将结果制表列于表25中。使用所有动物的简单集合pooling)和使用标准两级分析来分析药代动力学参数。如Tmax、Cmax、AUC和分布体积(Vz)值所证明，结果显示根据在第1组对第2组中施用的剂量体积，融合蛋白吸收的差异。然而，所计算的三组的半衰期值相似，并且大大超过所报道的艾塞那肽的终末半衰期2.4h。

表25:对施用的GPXTEN由组平均值计算的药代动力学参数。

参数	第1组平均值	第2组平均值	第3组平均值
				Tmax	96	24	48
Cmax	4,860	3,879	18,713
				λ_z_下	96	96	96

λ_z_上	336	336	336
				t1/2_λ_z	83.8	76.8	74.0
AUC所有	739,850	524,615	2,445,751
				Vz(观察)/F	579	871	986
Cl(观察)/F	4.8	7.9	9.2
				Vz(观察)/F	148	199	207

结论：如在灵长类模型中所证实，使exendin-4与XTEN连接产生GPXTEN融合蛋白引起所有三种制剂的药代动力学参数的显著增加，其中半衰期增加至少30倍。

实施例26：饮食诱导的肥胖小鼠模型中GPXTEN的用途

在饮食诱导的肥胖小鼠模型中评估与XTEN连接的葡萄糖调节肽的组合治疗的效果以证实作为单个GPXTEN组合物的单体融合蛋白的固定组合的效用。

方法：在10周龄大的雄性C57BL/6J饮食诱导的肥胖(DIO)小鼠中测试与Y-288-XTEN连接的胰高血糖素(“Gcg-XTEN”)和与AE576-XTEN连接的艾塞那肽(“Ex4-XTEN”)的组合治疗或单独艾塞那肽的效果。将以60%高脂肪饮食饲养的小鼠随机分成以下治疗组(每组n=10)：Ex4-XTEN864(10mg/kg IP Q2D)、Ex4-XTEN864(20mg/kg IP Q4D)、Ex4-XTEN864(10mg/kg IP Q2D)加Gcg-XTEN288(20μg/kg IP BID)和Ex4-XTEN864(20mg/kg IP Q4D)加Gcg-XTEN288(40μg/kg IP Q1D)。同时测试用20mM Tris(pH7.5)、135mM NaCl IP Q1D治疗的安慰剂组(n=10)。对所有组连续给药28天。在整个研究中以规律的间隔监测体重并且在治疗期之前和之后测量空腹血糖。对组连续给药28天的治疗期。在整个研究中连续监测体重并且在治疗期之前和之后测量空腹血糖，而且在治疗期后测定脂质水平。

结果：结果示出在图23-25中。数据表明在研究过程中，相对于安慰剂，在用单独Gcg-XTEN和单独Ex4-XTEN治疗的动物中，连续给药一个月引起体重增加的显著降低。另外，与单独施用的Gcg-XTEN相比并与安慰剂相比，用Ex4-XTEN给药或用Gcg-XTEN和Ex4-XTEN同时给药的动物显示统计上显著较大的体重减轻。有充分的证据证明胰高血糖素施用的毒性作用。最近已报道了大鼠和比格犬中胰高血糖素的最大无作用剂量为1mg/kg/天被视为两个物种中明显的无毒性作用水平(Eistrup C,Glucagon produced by recombinant DNAtechnology:repeated dose toxicity studies,intravenous administration to CDrats and beagle dogs for four weeks.Pharmacol Toxicol.1993Aug;73(2):103-108)。

数据还显示与相对于安慰剂，对于用单独Ex4-XTEN治疗的动物，连续给药一个月引起空腹血糖的显著降低，而对于用单独Gcg-XTEN治疗的动物并非如此。然而，与单独施用任何葡萄糖调节肽相比，用Gcg-XTEN和艾塞那肽同时给药的动物显示统计上显著较大的空腹血糖水平降低。值得注意的是，与Ex4-XTEN组合引起有益效果的Gcg-XTEN组合物的剂量为20和40μg/kg(完整融合蛋白组合物重量)；是对啮齿类物种中单独的胰高血糖素所报道的无作用剂量的至多1/25。另外，与安慰剂相比，接受GP的小鼠的甘油三酯和胆固醇水平降低。

结论：数据支持这样的结论：用两种葡萄糖调节肽(诸如exendin-4和胰高血糖素，每一个与XTEN连接)的两种融合蛋白的组合治疗可产生协同的有益效果，其优于用单独的葡萄糖调节肽所观察到的有益效果，因此可调整组合的组合物的施用以相比于单一生物制剂的施用减少给药频率或剂量从而减少毒性或不能接受的副作用的威胁。

实施例27：食蟹猴中Ex4-XTEN GPXTEN的PK分析

在1分钟时段内以0.5mg/kg通过皮下或静脉内注射GPXTEN来施用GPXTEN的食蟹猴(每组三只)中测定Ex4-AE864GPXTEN的药代动力学。注射后在长达14天的各个时间点采集血浆样本并通过ELISA分析以测定测试物质血清浓度和免疫原性。施用后在任一动物中未观察到对于Ex4-AE864的抗测试物质抗体反应。通过将100ng捕获抗体(兔抗艾塞那肽Peninsula Laboratories,San Carlos,CA)固定到聚苯乙烯微量滴定板(Costar3690,Corning Inc,Corning,N.Y.)的每个孔中>12h，之后用3%牛血清白蛋白(BSA)阻断来进行夹心ELISA。用PBS洗涤3次后，将血浆样本连续滴定在含有1%BSA和0.5%Tween20的PBS中的板上。孵育2小时并洗涤后，通过向每个孔添加生物素化IgG(室内生物素化的兔抗艾塞那肽，Peninsula Laboratories,San Carlos,CA)对样本进行探测。孵育并洗涤后，通过与辣根过氧化物酶偶联链霉亲和素(Thermo Fisher Scientific,Rockford,IL)一起孵育然后和四甲基联苯胺底物(Neogen Corporation,Lexington,KY)一起孵育来对板进行显色，然后用0.2N H₂SO₄淬灭并在450nm读数。使用WinNonLin program(2.1版)(PharsightCorporation,Mt.View,CA)计算非房室药代动力学参数。

将结果描述在图17中。该构建体的这种制剂的终末半衰期是60小时，其中由皮下注射得到80%的生物利用度。这与对 (exendin-4的商业形式)所报道的半衰期2.4小时比较。重要的是，在皮下注射后注意到缓慢的吸收期，这似乎是XTEN融合蛋白的特征。吸收期产生注射后介于24-48小时的Cmax和达到线性消除期之前～100小时的基本上平坦的血清浓度曲线。

结论：从结果得出结论为，和未与XTEN连接的肽相比，将XTEN添加到葡萄糖调节肽(诸如exendin-4)可大大增加终末半衰期，并且也增强其它药代动力学参数。

实施例28:Ex4-XTEN GPXTEN在多个物种中的PK分析和预测的人半衰期

为了测定与XTEN融合的治疗蛋白在人体中预测的药代动力学特征，使用与AE864XTEN融合的exendin-4作为单独融合多肽进行研究。将Ex4-XTEN构建体以0.5-1.0mg/kg皮下和静脉施用给四个不同的动物物种。施用后以一定的间隔收集血清样本，用标准的方法测定血清浓度。测定每个物种的半衰期，并列于表26。使用基于平均体重的终末半衰期、分布体积和清除率的异速生长尺度律(allometric scaling)，该结果用于预测人的半衰期。图18A显示了动物物种中测量的终末半衰期与体重的曲线，其中与而报道的艾塞那肽(exenatide)半衰期为2.4小时(Bond,A.Proc(Bayl Univ Med Cent)19(3):281-284.(2006))相比，75kg的人的预测T1/2为140小时。图18B示出测量的药物清除与体重，其中75kg的人中预测清除率值为30ml/h。图18C示出测量的分布体积与体重，在75kg的人中预测值为5970ml。

结论：从这些结果可以得出结论为，与未连接XTEN的肽相比，将XTEN添加到葡萄糖调节肽(例如exendin-4)能够大大增加终末半衰期，并且具有相似半衰期的GPXTEN制剂将允许以比葡萄糖调节肽的商业产品当前所采用的给药频率相当更低的频率给药，其中以每周、没隔一周或甚至可能以每月间隔给药。

表26:Ex4-XTEN的半衰期

物种	半衰期(小时)
		小鼠	13.5
大鼠	31.7
		猴	60.7
犬	72.8
		人	140*

*基于异速生长尺度律的预测值

实施例29:犬中Gcg-XTEN的药代动力学

对比格犬(每组4只)通过皮下注射指定剂量的合成胰高血糖素(AmericanPeptide,Sunnyvale,CA)、Gcg-XTEN或安慰剂。给药前对动物禁食12小时并在给药后禁食6小时。使用手持血糖仪(Walgreens TRUEresult^TM)在给药之前和之后的指定时间测试血糖。通过在整个于诊断实验室(Antech Diagnostics)平行测量的线性范围(40-250mg/dL)内与参考样本比较来校正人和犬齿类血液之间原始数据的系统性偏差。

图20示出注射后的血糖曲线。数据显示相对于未修饰的胰高血糖素，Gcg-XTEN升高血糖延长的时段。施用后10-12小时，Gcg-XTEN施用后的血糖水平返回到基线水平，这与之前在食蟹猴中测定的PK曲线一致(数据未显示)。

结论：与天然蛋白质相比，将XTEN添加到葡萄糖调节肽胰高血糖素显著增强了药代动力学特性，包括终末半衰期。另外，设计选定长度的含有GPXTEN的胰高血糖素产生允许以一定间隔返回基线水平的半衰期，使得其可用于控制夜间低血糖。

实施例30：犬中Gcg-XTEN赋予对胰岛素诱导的低血糖的暂时受控抗性

在两个阶段使比格犬(每组4只，一共8只)经受低血糖激发，所述两个阶段以四天的清洗期分隔。在每个阶段，在注射前3小时使动物进食，然后在研究的其余时间对其禁食。在每个阶段，在时间为0时，对各组通过皮下注射0.6nmol/kg的Gcg-XTEN或安慰剂。在第一阶段，通过施用0.05U/kg胰岛素(Novolin-R,Novo Nordisk Pharmaceuticals,Inc.)在测试物质注射后6小时开始低血糖激发。在第二阶段以同样的方式开始低血糖激发，例外的是在测试物质注射后12小时。使用上述手持血糖仪在指定的时间测试血糖水平。在所有动物中于给药前和胰岛素激发后1小时取血液样本。通过临床化学测试样本以确认所述手持血糖仪读数的准确性。另外，临床化学证实在所有组中低血糖激发后显著升高的胰岛素水平。虽然相对于安慰剂组，Gcg-XTEN组稍微较低((～30%，数据未显示)，但是各组之间的差异在统计上并不显著。

图21中示出连续葡萄糖测定的结果。数据显示给药后6小时时，接受Gcg-XTEN的动物对胰岛素诱导的低血糖有抗性(图21A)，但给药后12小时时并非如此(图21B)。根据假设的人时间线，假设21:00时进行Gcg-XTEN给药，给药后6小时对应03:00(睡眠中)(此时预期保护使免受低血糖)，并且给药后12小时对应09:00(此时药效应已结束允许早餐)。

结论：将XTEN添加到葡萄糖调节肽胰高血糖素和关于XTEN长度的GPXTEN融合蛋白的特殊设计产生药效为1)保护使免受胰岛素诱导的低血糖；和2)是与夜间低血糖符合并且然后在将与早餐一致的时间减弱的时长。这种药代动力学曲线非常适合于糖尿病患者中低血糖中的临床应用。

实施例31：食蟹猴中Gcg-XTEN288抑制禁食结束后血糖的增加

在正常食蟹猴中测试长寿命Gcg-XTEN_Y288对食欲抑制的影响。给药前12小时和给药后6小时对动物禁食。在时间0时，动物接受随机剂量的7nmol/kg Gcg-XTEN_Y288(构建体1)或安慰剂。在整个研究中于指定的时间通过手持血糖仪测量血糖。在第二阶段，根据相同的方案，用替代的测试物质治疗相同的动物。图22示出对每只个体动物施用安慰剂或Gcg-XTEN_Y288后血糖曲线的重叠绘图。实心箭头标记对动物送回食物的时间(t=6小时)。

在每只动物中，当用安慰剂给药时，观察到在18小时禁食期之后允许进食后血糖立即有向上的尖峰。这与当食物随意提供时动物进食相一致。相比较而言，当对动物用Gcg-XTEN288给药时，送回食物前的6小时，没有观察到血糖尖峰。该观察表明Gcg-XTEN288施用抑制了这些动物禁食期之后的食欲。

实施例32：食蟹猴中胰高血糖素-XTEN组合物的PK分析

评估不同长度的与XTEN连接的胰高血糖素的GPXTEN组合物以测定食蟹猴中的药代动力学参数。评估具有不同长度的与胰高血糖素融合的XTEN的三种不同构建体对PK参数的影响。以剂量0.2mg/kg将构建体胰高血糖素-Y288、胰高血糖素Y-144和胰高血糖素-Y72通过皮下施用给食蟹猴。在施用后的各时间点采集血清样本并使用夹心ELISA形式分析构建体的血清浓度。将兔多克隆抗XTEN_Y抗体涂布在ELISA板的孔上。然后使血清样本以不同的稀释度在孔中孵育以使所涂布的抗体捕获化合物。充分洗涤孔，并且使用多克隆抗XTEN_Y抗体的生物素化制品和链霉亲和素HRP检测结合的蛋白质。通过使各个血清稀释度的比色反应与标准曲线比较来计算各个时间点的血清蛋白质浓度。使用WinNonLin软件包计算药代动力学参数。图28示出胰高血糖素-XTEN融合蛋白1)胰高血糖素-Y288;2)胰高血糖素Y-144和3)胰高血糖素-Y72随时间的血药水平的结果。来自胰高血糖素-Y144给药的结果显示0-6小时内血药水平<3倍的变化，其中在10-12小时时血药水平从Cmax降低到10x阈值以下，表明使GPXTEN维持在病症(诸如夜间低血糖)的治疗窗内的有利PK曲线。

结论：结果表明与具有较短长度的构建体相比，具有较长XTEN长度的胰高血糖素在血液中在延长的时段是可检测的。

实施例33:通过与XTEN连接增加溶解度和稳定性

为了评估XTEN增强溶解度和稳定性的物理/化学性质的能力，制备和评估胰高血糖素加较短长度XTEN的融合蛋白。在pH为中性的Tris缓冲盐水中制备测试物质，并通过反相HPLC和尺寸排阻色谱法表征Gcg-XTEN溶液以确定蛋白质在溶液中是均质和非聚集的。数据提供于表27。为了比较的目的，测量了在相同的缓冲液中60 μM(0.2mg/mL)的未修饰胰高血糖素的溶解极限，并且结果证明对于添加的所有长度的XTEN，实现了溶解度的明显增加。重要的是，在大多数情况下，制备胰高血糖素-XTEN融合蛋白来达到目标浓度，但没有评估以确定给定构建体的最大溶解极限。然而，在胰高血糖素连接到AF-144XTEN的情况下，测定了溶解极限，其中结果实现了溶解度增加至未连接XTEN的胰高血糖素的60倍。另外，评估了胰高血糖素-AF144GPXTEN的稳定性，发现液体制剂在冷冻条件下稳定至少六个月，而37℃下稳定大约一个月(数据未显示)。

结论：该数据支持的结论是：使较短长度的XTEN多肽与生物活性蛋白例如胰高血糖素连接，能够通过得到的融合蛋白而显著地增强蛋白质的溶解度，也赋予了较高蛋白质浓度下的稳定性。

表27:胰高血糖素-XTEN构建体的溶解度

测试物质	溶解度
		胰高血糖素	60μM
胰高血糖素-Y36	>370μM
		胰高血糖素-Y72	>293μM
胰高血糖素-AF108	>145μM
		胰高血糖素-AF120	>160μM
胰高血糖素-Y144	>497μM
		胰高血糖素-AE144	>467μM
胰高血糖素-AF144	>3600μM
		胰高血糖素-Y288	>163μM

实施例34:GPXTEN二级结构的表征

通过圆二色谱评估GPXTEN Ex4-AE864的二级结构水平。在装配有Jasco Peltier温控仪(TPC-348WI)的Jasco J-715(Jasco Corpration,Tokyo,Japan)分光偏振计上进行CD谱。在20mM磷酸钠(pH7.0)、50mM NaCl中将蛋白质浓度调整到0.2mg/mL。使用光学路径长度为0.1cm的HELLMA石英池进行实验。在5°、25°、45°和65℃获取CD谱，并使用在Windows系统下使用的J-700版本1.08.01(Build1)Jasco软件处理。进行CD测量之前，在每个温度下平衡样本5min。使用1nm频带宽度和2秒钟时间常数，在100nm/min的扫描速度下，一式两份记录从300nm到185nm的所有谱。示于图27的CD谱显示无稳定二级结构的证据，并且与非结构化多肽一致。

实施例35:胰高血糖素和Ex4GPXTEN构建体的生物活性

使用体外细胞测定来测定纯化的胰高血糖素和exendin-3(每个与Y288连接为GPXTEN融合蛋白)的生物活性。简言之，对胰高血糖素和胰高血糖素-XTEN构建体使用ChemiScreen稳定钙优化的胰高血糖素受体细胞系(ChemiScreen Stable CalciumOptimized glucagon receptor cell line)进行实时钙流测定，同时对exendin-4和Ex4构建体使用表达天然GLP-1受体的优化的exendin-4受体细胞系。在该体系中，细胞表达天然受体，并且该受体的活化产生可使用FLIPR装置检测的细胞内的钙通量。如图29所示，天然胰高血糖素引起信号以剂量依赖的方式增加。发现该体系中天然胰高血糖素的EC50为4.1nM。胰高血糖素-Y288构建体的滴定产生类似的响应曲线，其中EC50为72nM。如图29所示，来自两个不同商业来源(Anaspec和Tocris)的天然exendin-4引起信号以剂量依赖的方式增加，其中EC50(以虚线表示)分别是75pM和110pM。exendin-4-Y576构建体的滴定产生类似的响应曲线，其中EC50为98pM，表明附属蛋白质的融合保留了全部生物活性。

结论：结果表明葡萄糖调节肽exenidine-4和胰高血糖素与XTEN的融合产生保留生物活性的组合物。

实施例36：可通过弹性蛋白酶-2释放的C端XTEN

可用置于GP和XTEN组分之间的XTEN释放位点裂解序列产生由与GP(诸如exendin-4(Ex4))的C端融合的XTEN蛋白组成的GPXTEN融合蛋白。示例性的序列提供在表38中。在这种情况下，释放位点含有被弹性蛋白酶-2蛋白酶(EC3.4.21.37,Uniprot P08246)识别并裂解的氨基酸序列。具体地，所述序列LGPV↓SGVP(SEQ ID NO:751)[Rawlings N.D.等(2008)Nucleic Acids Res.,36:D320]将在序列中的位置4后被切割。弹性蛋白酶由嗜中性粒细胞结构性表达并在循环中始终存在。其活性由丝氨酸蛋白酶抑制蛋白(serpin)严密控制并因此在大多数时间具有最低的活性。因此，当长寿命的Ex4-XTEN循环时，其一部分将被裂解，产生一组较短寿命的exendin-4以用于葡萄糖稳态。在本发明组合物的期望特征中，这产生持续释放一定量的游离的、完全活性的exendin-4的循环前药贮藏物。

实施例37：可通过MMP-12释放的C端XTEN

可用置于胰岛淀粉样肽和XTEN组分之间的XTEN释放位点裂解序列产生由与胰岛淀粉样肽的C端融合的XTEN蛋白组成的胰岛淀粉样肽-XTEN融合蛋白。示例性的序列提供在表38中。在这种情况下，GPXTEN释放位点含有被MMP-12蛋白酶(EC3.4.24.65,UniprotP39900)识别并裂解的氨基酸序列。具体地，所述序列GPAG↓LGGA(SEQ ID NO:752)[Rawlings N.D.等(2008)Nucleic Acids Res.,36:D320]将在序列的位置4后被切割。MMP-12在全血中结构性表达。因此，当长寿命的胰岛淀粉样肽-XTEN循环时，其一部分将被裂解，产生一组较短寿命的胰岛淀粉样肽以用于葡萄糖稳态。在本发明组合物的期望特征中，这产生持续释放一定量的游离的、完全活性的胰岛淀粉样肽的循环前药贮藏物。

实施例38：评估GPXTEN的人临床试验设计

可设计临床试验以便可在人中检验GPXTEN组合物相对于单一生物制剂的功效和优势。例如，如上述实施例所述，包含胰高血糖素和艾塞那肽的GPXTEN融合构建体可用在临床试验中以表征该组合物的功效。试验可对通过施用胰高血糖素和艾塞那肽而改善、缓解或抑制的一种或多种代谢疾病、疾患或病症来进行。在成年患者中的这种研究包括3个阶段。首先，在成年患者中进行阶段I的安全性和药代动力学研究以确定人(正常受试者或患有代谢疾病或病症的患者) 的最大耐受剂量和药代动力学及药效学，同时确定在将来研究中有待跟踪的潜在毒性和不良事件。在进行这项研究时，施用单个升高剂量的与胰高血糖素和艾塞那肽连接的XTEN融合蛋白的组合物，并且测量生物化学、PK和临床参数。这允许最大耐受量的确定，并确立剂量的阈值和最大浓度以及构成各自组分治疗窗的循环药物。此后，将在患有所述疾病、疾患或病症的患者中进行临床试验

糖尿病中的临床试验

在糖尿病患者中进行阶段II给药研究，其中测量适用于糖尿病、胰岛素抗性和肥胖病症的血清葡萄糖药效学和其它生理、PK、安全性和临床参数(例如以下所列)作为包含与胰高血糖素和艾塞那肽连接的XTEN的融合蛋白的给药函数，除了收集与不良事件相关的安全性数据以外，还产生了有关适合阶段III试验的剂量的剂量范围信息。使PK参数与生理、临床、安全性参数数据相关联以确立GPXTEN组合物的每种组分的治疗窗，允许临床医生确立每种包含一种葡萄糖调节肽的两组分融合蛋白的适当比例，或确定包含两种葡萄糖调节肽的单体GPXTEN的单个剂量。最后，进行阶段III功效研究，其中将每天、两周一次或每周(或考虑到GPXTEN组合物的药代动力学和药效学性质被认为适当的其它给药时间表)对糖尿病患者施用GPXTEN组合物、阳性对照或安慰剂延长的时段。功效的主要结果测量可包括HbA1c浓度，而次要结果测量包括研究期间的胰岛素需求、受激的C肽和胰岛素浓度、空腹血糖(FPG)、血清细胞因子水平、CRP水平、胰岛素分泌和得自用胰岛素和葡萄糖测量值的OGTT的胰岛素敏感指数，以及体重、食物消耗和相对于安慰剂或阳性对照组而被跟踪的其它公认的糖尿病标志。使用标准统计方法确定功效结果。在此研究中，还跟踪毒性和不良事件标志以证实化合物当以描述方式使用时是安全的。

实施例39：通过预测算法分析序列的二级结构

通过某些计算机程序或算法，例如熟知的Chou-Fasman算法(Chou,P.Y.,等(1974)Biochemistry，13:222-45)和Garnier-Osguthorpe-Robson或“GOR”方法(Garnier J,Gibrat JF,Robson B.(1996)，GOR method for predicting protein secondarystructure from amino acid sequence.Methods Enzymol.Methods Enzymol266:540-553)评估氨基酸序列的二级结构。对于给定的序列，此算法可以预测是存在一些二级结构还是根本不存在二级结构，表示为形成例如α-螺旋或β-折叠的序列残基的总数和/或百分比，或表示为被预测导致无规卷曲形成的序列的残基的百分比。

已经使用两种算法工具Chou-Fasman和GOR方法评估了来自XTEN“家族”的几种代表性的序列以评估这些序列中的二级结构水平。Chou-Fasman工具由William R.Pearson和弗吉尼亚大学提供在2009年6月19日存在的，“Biosupport”互联网网站，万维网上定位URL在.fasta.bioch.virginia.edu/fasta_www2/fasta_www.cgi?rm=misc1。GOR工具由PoleInformatique Lyonnai提供在2008年6月19日存在的网络蛋白序列分析互联网站，万维网上定位URL在.npsa-pbil.ibcp.fr/cgi-bin/secpred_gor4.pl。

在分析的第一步，用这两种算法分析单个XTEN序列。AE864组合物是由氨基酸G、S、T、E、P和A组成的四种12个氨基酸序列基序的多个拷贝构建的具有864个氨基酸残基的XTEN。序列基序特征在于以下事实：基序中和整个序列中存在有限的重复，因为任何两个连续氨基酸的序列在任意一个12个氨基酸基序中重复不超过2次，而且全长的XTEN中没有3个连续氨基酸是相同的。通过Chou-Fasman和GOR算法(后者需要17个氨基酸的最小长度)分析AF864序列从N端开始逐渐增长的部分。通过将FASTA格式序列输入预测工具并运行分析来分析序列。分析的结果提供于表28。

结果显示，经Chou-Fasman计算，AE家族的4种基序(表4)不具有α-螺旋或β-折叠。多达288个残基的序列都被类似地发现不具有α- 螺旋或β-折叠。预测432个残基的序列具有少量二级结构，其中仅2个氨基酸有助于形成α-螺旋，总百分比为0.5%。全长AF864多肽具有相同的有助于形成α-螺旋的2个氨基酸，总百分比为0.2%。对无规卷曲形成的计算揭示，随着长度增加，无规卷曲形成的百分比增加。此序列中前24个氨基酸具有91%的无规卷曲形成，其随长度增加而增加，全长序列的值达到99.77%。

还分析了来自其它基序家族的500个氨基酸或更长的许多XTEN序列，并揭示大多数存在超过95%的无规卷曲形成。例外的是具有一处或多处三个连续丝氨酸残基的那些序列，这导致预测的β-折叠形成。然而，即使这些序列仍存在近99%的无规卷曲形成。

相反，限于A、S和P氨基酸的84个残基的多肽序列用Chou-Fasman算法评估，其预测了高水平的预测α-螺旋。具有多个重复的“AA”和“AAA”序列的序列的α-螺旋结构的总体预测百分比为69%。GOR算法预测了78.57%的无规卷曲形成；远低于在本实施例中分析的由氨基酸G、S、T、E、P组成的12个氨基酸序列基序组成的任意序列。

结论：此分析支持了以下结论：1)由具有有限重复的连续氨基酸的G、G、S、T、E、P和A的多个序列基序构建的XTEN被预测存在极低量的α-螺旋和β-折叠；2)增加XTEN的长度不明显增加α-螺旋或β-折叠形成的概率；和3)通过增加由氨基酸G、S、T、E、P和A组成的非重复12-mer来逐渐增加XTEN序列的长度，导致无规卷曲形成百分比的增加。相反，具有较高程度内部重复的由限于A、S和P的氨基酸构建的多肽被预测具有高百分比的α-螺旋(如通过Chou-Fasman算法所确定)以及无规卷曲形成。基于由这些方法评估的众多序列，得到的结论是从具有有限重复(定义为在任意一个基序中不超过2个相同的连续氨基酸)的G、S、T、E、P和A的序列基序构建的长度大于约400个氨基酸残基的XTEN被预测具有非常有限的二级结构。除了含有三个连续丝氨酸的基序之外，相信表4的序列基序的任意顺序或组合可被用来构建长度大于约400个残基的XTEN多肽，这导致XTEN序列基本没有二级结构。预期这种序列具有在本文公开的本发明的GPXTEN实施方案中所述的特征。

表28:二级结构的CHOU-FASMAN和GOR预测计算

*H:α-螺旋E:β-折叠

实施例40:多肽序列重复性分析

通过定量较短序列在整个多肽中出现的次数来评估多肽氨基酸序列的重复性。例如，200个氨基酸残基的多肽有192个重叠的9-氨基酸子序列(或9-mer“框”)，但是独特的9-mer子序列的数量将取决于在此序列内重复的数量。在本分析中，通过加合每个3-氨基酸框的全部独特3-mer子序列在聚合物部分的前200个氨基酸中的出现，除以所述200个氨基酸序列内的独特3-mer子序列的绝对数目，来评估不同序列的重复性。得到的子序列评分是多肽内的重复程度的反映。

示于表29的结果表明，由2或3个氨基酸类型组成的非结构化多肽具有高子序列评分，而具低水平的内部重复性的由6个氨基酸G、S、T、E、P和A的12氨基酸基序组成的多肽的子序列评分小于10，并且在一些情况下小于5。例如，L288序列具有两个氨基酸类型，并具有短的高重复序列，致使子序列评分为50.0。多肽J288具有3个氨基酸类型，但也有短的重复序列，致使子序列评分为33.3。Y576也有3个氨基酸类型，但不是由内部重复序列组成，反映在前200个氨基酸的子序列评分为15.7。W576由4个类型的氨基酸组成，但具有较高的内部重复水平，例如，“GGSG(SEQ ID NO:778)”，致使子序列评分为23.4。AD576由四个类型的12个氨基酸基序组成，每个基序由4个类型的氨基酸组成。由于个体基序的低内部重复水平，前200个氨基酸的总体子序列评分是13.6。相反，由4个基序组成的XTEN含有6个类型的氨基酸，每个基序都具有低内部重复水平，因此具有较低的子序列评分；即，AE864(6.1)、AF864(7.5)和AM875(4.5)。

结论：结果表明每个由基本上非重复的4至6个氨基酸类型组成的12个氨基酸子序列基序组合成较长的XTEN多肽，得到非重复的整体序列。即使在此序列中每个子序列基序都可能被多次使用，情况也一样。相反，由较少数目的氨基酸类型构建的聚合物导致较高子序列评分，尽管可修改实际序列以降低重复水平而得到较低的子序列评分。

表29:多肽序列的子序列评分计算

实施例41:TEPITOPE评分的计算

9mer肽序列的TEPITOPE评分可以通过如Sturniolo[Sturniolo,T.,等(1999)NatBiotechnol,17:555]所描述的增加口袋潜能来计算。在本实施例中，为个体HLA等位基因计算单独的TEPITOPE评分。作为实例，表30显示在高加索人群中高频率出现的HLA*0101B的口袋潜能。为了计算具有序列P1-P2-P3-P4-P5-P6-P7-P8-P9的肽的TEPITOPE评分，添加了表30中相应的个体口袋潜能。具有序列FDKLPRTSG(SEQ ID NO:796)的9mer肽的HLA*0101B评分可以是0、-1.3、0、0.9、0、-1.8、0.09、0、0的总和。

为了评估长肽的TEPITOPE评分，可以对序列的所有9mer子序列重复该过程。此过程可对其它HLA等位基因编码的蛋白质进行重复。表31-34给出了在高加索人群中高频率出现的HLA等位基因的蛋白质产物的口袋潜能。

通过该方法计算的TEPITOPE评分范围从大约-10至+10。然而，在P1位置缺乏疏水性氨基酸的9mer肽(FKLMVWY(SEQ ID NO:797))具有从-1009到-989范围内的计算的TEPITOPE评分。此数值在生物学上是无意义的，并且反映如下事实：疏水性氨基酸作为HLA结合的锚定残基，而且认为在P1缺乏疏水性残基的肽不结合HLA。因为大多数XTEN序列缺乏疏水性残基，9mer子序列的所有组合都将具有-1009至-989范围内的TEPITOPE。此方法证实XTEN多肽可能具有很少或没有预测的T细胞表位。

表30:HLA*0101B等位基因的口袋潜能

氨基酸	P1	P2	P3	P4	P5	P6	P7	P8	P9
										A	-999	0	0	0	-	0	0	-	0
C	-999	0	0	0	-	0	0	-	0
										D	-999	-1.3	-1.3	-2.4	-	-2.7	-2	-	-1.9
E	-999	0.1	-1.2	-0.4	-	-2.4	-0.6	-	-1.9
										F	0	0.8	0.8	0.08	-	-2.1	0.3	-	-0.4
G	-999	0.5	0.2	-0.7	-	-0.3	-1.1	-	-0.8
										H	-999	0.8	0.2	-0.7	-	-2.2	0.1	-	-1.1
I	-1	1.1	1.5	0.5	-	-1.9	0.6	-	0.7
										K	-999	1.1	0	-2.1	-	-2	-0.2	-	-1.7
L	-1	1	1	0.9	-	-2	0.3	-	0.5
										M	-1	1.1	1.4	0.8	-	-1.8	0.09	-	0.08
N	-999	0.8	0.5	0.04	-	-1.1	0.1	-	-1.2
										P	-999	-0.5	0.3	-1.9	-	-0.2	0.07	-	-1.1
Q	-999	1.2	0	0.1	-	-1.8	0.2	-	-1.6
										R	-999	2.2	0.7	-2.1	-	-1.8	0.09	-	-1
S	-999	-0.3	0.2	-0.7	-	-0.6	-0.2	-	-0.3
										T	-999	0	0	-1	-	-1.2	0.09	-	-0.2
V	-1	2.1	0.5	-0.1	-	-1.1	0.7	-	0.3
										W	0	-0.1	0	-1.8	-	-2.4	-0.1	-	-1.4
Y	0	0.9	0.8	-1.1	-	-2	0.5	-	-0.9

表31:HLA*0301B等位基因的口袋潜能

氨基酸	P1	P2	P3	P4	P5	P6	P7	P8	P9
										A	-999	0	0	0	-	0	0	-	0
C	-999	0	0	0	-	0	0	-	0
										D	-999	-1.3	-1.3	2.3	-	-2.4	-0.6	-	-0.6
E	-999	0.1	-1.2	-1	-	-1.4	-0.2	-	-0.3
										F	-1	0.8	0.8	-1	-	-1.4	0.5	-	0.9
G	-999	0.5	0.2	0.5	-	-0.7	0.1	-	0.4
										H	-999	0.8	0.2	0	-	-0.1	-0.8	-	-0.5
I	0	1.1	1.5	0.5	-	0.7	0.4	-	0.6
										K	-999	1.1	0	-1	-	1.3	-0.9	-	-0.2
L	0	1	1	0	-	0.2	0.2	-	-0
										M	0	1.1	1.4	0	-	-0.9	1.1	-	1.1
N	-999	0.8	0.5	0.2	-	-0.6	-0.1	-	-0.6
										P	-999	-0.5	0.3	-1	-	0.5	0.7	-	-0.3
Q	-999	1.2	0	0	-	-0.3	-0.1	-	-0.2
										R	-999	2.2	0.7	-1	-	1	-0.9	-	0.5
S	-999	-0.3	0.2	0.7	-	-0.1	0.07	-	1.1
										T	-999	0	0	-1	-	0.8	-0.1	-	-0.5
V	0	2.1	0.5	0	-	1.2	0.2	-	0.3
										W	-1	-0.1	0	-1	-	-1.4	-0.6	-	-1
Y	-1	0.9	0.8	-1	-	-1.4	-0.1	-	0.3

表32:HLA*0401B等位基因的口袋潜能

氨基酸	P1	P2	P3	P4	P5	P6	P7	P8	P9
										A	-999	0	0	0	-	0	0	-	0
C	-999	0	0	0	-	0	0	-	0
										D	-999	-1.3	-1.3	1.4	-	-1.1	-0.3	-	-1.7
E	-999	0.1	-1.2	1.5	-	-2.4	0.2	-	-1.7
										F	0	0.8	0.8	-0.9	-	-1.1	-1	-	-1
G	-999	0.5	0.2	-1.6	-	-1.5	-1.3	-	-1
										H	-999	0.8	0.2	1.1	-	-1.4	0	-	0.08
I	-1	1.1	1.5	0.8	-	-0.1	0.08	-	-0.3
										K	-999	1.1	0	-1.7	-	-2.4	-0.3	-	-0.3
L	-1	1	1	0.8	-	-1.1	0.7	-	-1
										M	-1	1.1	1.4	0.9	-	-1.1	0.8	-	-0.4
N	-999	0.8	0.5	0.9	-	1.3	0.6	-	-1.4
										P	-999	-0.5	0.3	-1.6	-	0	-0.7	-	-1.3
Q	-999	1.2	0	0.8	-	-1.5	0	-	0.5
										R	-999	2.2	0.7	-1.9	-	-2.4	-1.2	-	-1
S	-999	-0.3	0.2	0.8	-	1	-0.2	-	0.7
										T	-999	0	0	0.7	-	1.9	-0.1	-	-1.2

氨基酸	P1	P2	P3	P4	P5	P6	P7	P8	P9
										V	-1	2.1	0.5	-0.9	-	0.9	0.08	-	-0.7
W	0	-0.1	0	-1.2	-	-1	-1.4	-	-1
										Y	0	0.9	0.8	-1.6	-	-1.5	-1.2	-	-1

表33:HLA*0701B等位基因的口袋潜能

氨基酸	P1	P2	P3	P4	P5	P6	P7	P8	P9
										A	-999	0	0	0	-	0	0	-	0
C	-999	0	0	0	-	0	0	-	0
										D	-999	-1.3	-1.3	-1.6	-	-2.5	-1.3	-	-1.2
E	-999	0.1	-1.2	-1.4	-	-2.5	0.9	-	-0.3
										F	0	0.8	0.8	0.2	-	-0.8	2.1	-	2.1
G	-999	0.5	0.2	-1.1	-	-0.6	0	-	-0.6
										H	-999	0.8	0.2	0.1	-	-0.8	0.9	-	-0.2
I	-1	1.1	1.5	1.1	-	-0.5	2.4	-	3.4
										K	-999	1.1	0	-1.3	-	-1.1	0.5	-	-1.1
L	-1	1	1	-0.8	-	-0.9	2.2	-	3.4
										M	-1	1.1	1.4	-0.4	-	-0.8	1.8	-	2
N	-999	0.8	0.5	-1.1	-	-0.6	1.4	-	-0.5
										P	-999	-0.5	0.3	-1.2	-	-0.5	-0.2	-	-0.6
Q	-999	1.2	0	-1.5	-	-1.1	1.1	-	-0.9
										R	-999	2.2	0.7	-1.1	-	-1.1	0.7	-	-0.8
S	-999	-0.3	0.2	1.5	-	0.6	0.4	-	-0.3
										T	-999	0	0	1.4	-	-0.1	0.9	-	0.4
V	-1	2.1	0.5	0.9	-	0.1	1.6	-	2
										W	0	-0.1	0	-1.1	-	-0.9	1.4	-	0.8
Y	0	0.9	0.8	-0.9	-	-1	1.7	-	1.1

表34:HLA*1501B等位基因的口袋潜能

氨基酸	P1	P2	P3	P4	P5	P6	P7	P8	P9
										A	-999	0	0	0	-	0	0	-	0
C	-999	0	0	0	-	0	0	-	0
										D	-999	-1.3	-1.3	-0.4	-	-0.4	-0.7	-	-1.9
E	-999	0.1	-1.2	-0.6	-	-1	-0.7	-	-1.9
										F	-1	0.8	0.8	2.4	-	-0.3	1.4	-	-0.4
G	-999	0.5	0.2	0	-	0.5	0	-	-0.8
										H	-999	0.8	0.2	1.1	-	-0.5	0.6	-	-1.1
I	0	1.1	1.5	0.6	-	0.05	1.5	-	0.7
										K	-999	1.1	0	-0.7	-	-0.3	-0.3	-	-1.7
L	0	1	1	0.5	-	0.2	1.9	-	0.5

氨基酸	P1	P2	P3	P4	P5	P6	P7	P8	P9
										M	0	1.1	1.4	1	-	0.1	1.7	-	0.08
N	-999	0.8	0.5	-0.2	-	0.7	0.7	-	-1.2
										P	-999	-0.5	0.3	-0.3	-	-0.2	0.3	-	-1.1
Q	-999	1.2	0	-0.8	-	-0.8	-0.3	-	-1.6
										R	-999	2.2	0.7	0.2	-	1	-0.5	-	-1
S	-999	-0.3	0.2	-0.3	-	0.6	0.3	-	-0.3
										T	-999	0	0	-0.3	-	-0	0.2	-	-0.2
V	0	2.1	0.5	0.2	-	-0.3	0.3	-	0.3
										W	-1	-0.1	0	0.4	-	-0.4	0.6	-	-1.4
Y	-1	0.9	0.8	2.5	-	0.4	0.7	-	-0.9

表35:示例性生物活性、示例性测定和GP的优选适应症

表36:包含葡萄糖调节肽和单个XTEN序列的示例性GPXTEN

*序列名称反映生长因子和XTEN组分从N端至C端的构型

表37:包含葡萄糖调节肽和两个XTEN序列的示例性GPXTEN

*序列名称反映生长因子和XTEN组分从N端至C端的构型

表38:包含葡萄糖调节肽、XTEN和裂解序列的示例性GPXTEN

*序列名称反映生长因子、裂解序列和XTEN组分从N端至C端的构型

Claims

1.一种分离的核酸，其编码融合蛋白，所述融合蛋白展现出葡萄糖调节肽的至少一部分生物活性，其中所述融合蛋白包含葡萄糖调节肽，所述葡萄糖调节肽在其N端和/或C端与延伸重组多肽连接，所述葡萄糖调节肽与选自SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的氨基酸序列至少90％相同，且其中所述延伸的重组多肽的特征在于：

(a)所述延伸的重组多肽序列与SEQ ID NO:199具有至少90％序列同一性；

(b)当通过TEPITOPE算法分析时，所述延伸的重组多肽序列缺少预测的T细胞表位，其中对所述延伸的重组多肽序列中表位的所述TEPITOPE算法预测基于-9或更高的评分；

(c)所述延伸的重组多肽具有小于10的子序列评分；和

(d)甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基的总和构成所述延伸的重组多肽的总氨基酸残基的超过90％。

2.根据权利要求1所述的分离的核酸，其中所述葡萄糖调节肽与SEQ ID NO：4的氨基酸序列具有至少95％同一性。

3.根据权利要求1或2所述的分离的核酸，其中所述融合蛋白在施用给有相应需要的受试者时，获得与以等同摩尔量施用给受试者的缺少所述延伸的重组多肽的相应葡萄糖调节肽相当的治疗效果，甚至在所述融合蛋白以与缺少所述延伸的重组多肽的相应葡萄糖调节肽相比更低的频率施用给受试者时。

4.根据权利要求1或2所述的分离的核酸，其中所述融合蛋白包含SEQ ID NO：896的多肽序列。

5.根据权利要求1所述的分离的核酸，其中所述融合蛋白与未连接所述延伸重组多肽的相应葡萄糖调节肽相比具有至少3倍的终末半衰期。

6.根据权利要求1所述的分离的核酸，其中所述核酸序列包含SEQ ID NO：897。

7.一种表达载体，其包含根据权利要求1-6中任一项所述的核酸的多核苷酸序列。

8.治疗有效量的融合蛋白在制备用于治疗受试者的葡萄糖调节肽相关病症的药物中的用途，所述融合蛋白与未连接所述延伸重组多肽的相应葡萄糖调节肽相比具有至少3倍的终末半衰期，其中所述融合蛋白包含葡萄糖调节肽，所述葡萄糖调节肽在其N端和/或C端与延伸重组多肽连接，其中所述葡萄糖调节肽与选自SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8或SEQ ID NO:10的氨基酸序列具有至少90％同一性，且其中所述延伸的重组多肽的特征在于：

(c)所述延伸的重组多肽具有小于10的子序列评分；和

9.根据权利要求8所述的用途，其中所述融合蛋白获得与缺少所述延伸的重组多肽的相应葡萄糖调节肽相当的治疗效果，甚至在所述融合蛋白以与缺少所述延伸的重组多肽的相应葡萄糖调节肽相比更低的频率施用给受试者时。

10.根据权利要求8或9所述的用途，其中所述葡萄糖调节肽相关病症选自青少年糖尿病、I型糖尿病、II型糖尿病、肥胖、急性低血糖、急性高血糖、夜间低血糖、慢性高血糖、胰高血糖素瘤、气道的分泌疾患、关节炎、骨质疏松症、中枢神经系统疾病、再狭窄、神经退行性疾病、肾衰竭、充血性心力衰竭、肾病综合症、肝硬化、肺水肿、高血压、中风、肠道易激综合症、心肌梗塞、急性冠状动脉综合征、术后代谢变化、冬眠心肌、糖尿病心肌病、尿钠排泄不足、尿钾浓度过高、多囊卵巢综合症、呼吸窘迫、肾病、左心室收缩功能障碍、腹泻、术后倾倒综合症、危重病多发性神经病(CIPN)、血脂异常、局部缺血后血流再灌注引起的器官组织损伤和冠心病危险因素(CHDRF)综合症。

11.根据权利要求8所述的用途，其中所述葡萄糖调节肽是序列为SEQ ID NO：4的exendin-4、序列为SEQ ID NO:6的GLP-1、序列为SEQ ID NO:8的GLP-1或序列为SEQ ID NO:10的GLP-2。

12.一种药物组合物，包含治疗有效量的融合蛋白和药学上可接受的载体，所述融合蛋白包含与延伸的重组多肽连接的葡萄糖调节肽，其中所述葡萄糖调节肽与选自SEQ ID NO：4、SEQ ID NO:6、SEQID NO:8或SEQ ID NO:10的氨基酸序列具有至少90％同一性，且其中所述延伸的重组多肽的特征在于：

(c)所述延伸的重组多肽具有小于10的子序列评分；和

(d)甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基的总和构成所述延伸的重组多肽的总氨基酸残基的超过90％，其中所述药物组合物与缺少所述延伸的重组多肽的相应的葡萄糖调节肽相比免疫原性较低，其中免疫原性通过在给受试者施用类似剂量之后测量选择性结合生物活性蛋白的IgG抗体的生成来确定。

13.一种制备融合蛋白的方法，所述融合蛋白包含葡萄糖调节肽，其中所述葡萄糖调节肽与一个或多个延伸的重组多肽连接，所述方法包括：

(a)提供包含权利要求1的编码所述融合蛋白的核酸的宿主细胞；

(b)在允许所述融合蛋白表达的条件下培养所述宿主细胞；和

(c)回收所述融合蛋白。

14.根据权利要求13所述的方法，其中所述葡萄糖调节肽具有SEQ ID NO：4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的序列。

15.根据权利要求13所述的方法，其中所述宿主细胞是原核细胞或真核细胞。

16.根据权利要求13所述的方法，其中所述分离的融合蛋白以可溶的形式从宿主细胞的细胞质中回收。

17.一种分离的宿主细胞，其包含根据权利要求1-6中任一项所述的核酸，其中所述宿主细胞是原核或真核宿主细胞。

18.权利要求17所述的分离的宿主细胞，其中所述宿主细胞是大肠杆菌或毕赤酵母。