CN104254541A

CN104254541A - 改造的构象稳定蛋白质

Info

Publication number: CN104254541A
Application number: CN201280071486.7A
Authority: CN
Inventors: J·E·科恩; Y·张; A·H·菲利普斯
Original assignee: F Hoffmann La Roche AG
Current assignee: F Hoffmann La Roche AG
Priority date: 2012-03-16
Filing date: 2012-06-19
Publication date: 2014-12-31
Also published as: JP2015520730A; RU2014141617A; JP6198807B2; EP2825549B1; EP2825549A1; CA2866835A1; WO2013137920A1; KR20140142293A; HK1205524A1; MX2014010943A; EP2825549A4

Abstract

本文提供构象稳定的遍在蛋白；及用该构象稳定的遍在蛋白来鉴定结合稳定的遍在蛋白的物质，或结合与稳定形式的遍在蛋白相互作用的蛋白质的物质，或加工稳定形式的遍在蛋白的蛋白质的物质的方法。本文还提供用于筛选构象稳定的蛋白质的方法，与野生型形式的蛋白质和结合配偶体的结合亲和力相比，该构象稳定的蛋白质具有提高的和结合配偶体的结合亲和力。

Description

改造的构象稳定蛋白质

相关申请的交叉参考

本申请要求2012年3月16日提交的美国临时专利申请号61/612,228的优先权，其公开内容在此完整引入作为参考。

技术领域

本文提供用于筛选和使用构象动态蛋白质的构象稳定形式，如构象稳定的遍在蛋白(ubiquitin protein)的方法，以及包含此构象动态蛋白质的构象稳定形式的组合物。

背景技术

蛋白质是非常动态的大分子，构象运动在多种过程中发挥作用，如产生机械能、进行酶促反应和介导信号转导。由于分子的多种状态可以执行不同的功能，对产生特异性识别离散构象状态的试剂的能力存在相当大的兴趣。^1,2

遍在蛋白(ubiquitin)是见于真核生物的几乎所有组织中(遍在地)的小调节蛋白。蛋白质遍在蛋白化介导许多细胞过程，如细胞周期控制、凋亡、表观遗传学和转录调节。⁴但是，遍在蛋白最广为人知的可能是它在标记将要通过细胞的蛋白水解机器破坏和回收的蛋白质中发挥的作用。在遍在蛋白共价“标记”蛋白质时，遍在蛋白分子将蛋白质定向至蛋白酶体，蛋白酶体是细胞中降解和回收标记待破坏的蛋白质的大的多成分蛋白复合物。遍在蛋白本身由76个氨基酸组成，分子量约为8.5kDa。主要特征包括其C端尾和7个赖氨酸残基。⁶遍在蛋白的氨基酸序列在真核物种间保守，人和酵母遍在蛋白具有约96％序列同一性。在哺乳动物中，遍在蛋白由4个分开的基因编码。基因UBA52和RPS27A分别编码与核糖体蛋白L40和S27a融合的单拷贝遍在蛋白，而UBB和UBC基因编码多聚遍在蛋白前体蛋白。

遍在蛋白化是酶促的翻译后修饰过程，其中来自活化的遍在蛋白形式的遍在蛋白C端二甘氨酸基序的末端甘氨酸与修饰蛋白质中赖氨酸残基的ε胺形成酰胺键。遍在蛋白由E1遍在蛋白活化酶在需要ATP作为能量来源的过程中以两步反应活化。这涉及产生遍在蛋白-腺甘酸中间体，然后将遍在蛋白转移至E1活性部位半胱氨酸残基，在遍在蛋白C端羧基和E1半胱氨酸巯基之间产生硫酯键。然后，通过转(硫)酯反应将遍在蛋白从E1酶转移至E2遍在蛋白缀合酶的活性部位半胱氨酸。遍在蛋白化酶级联最后的步骤在靶蛋白中的赖氨酸和遍在蛋白的C端甘氨酸之间产生异肽键。通常，此步骤需要数百种已知的E3遍在蛋白-蛋白连接酶(常简称为“遍在蛋白连接酶”)之一的活性。⁵E3酶作为该系统的底物识别模块发挥作用，且能够与E2和修饰的蛋白底物二者相互作用。

单个遍在蛋白加至蛋白质(单遍在蛋白化)之后，可以在它的7个赖氨酸残基中的一个或多个上将其他遍在蛋白加至该第一遍在蛋白分子，产生多聚遍在蛋白链。此外，一些底物是通过在称为多遍在蛋白化的过程中将遍在蛋白分子加至多个赖氨酸残基来修饰。研究最多的多聚遍在蛋白链是用于蛋白酶体中的蛋白酶解的赖氨酸48连接的靶蛋白。为了能被细胞的蛋白水解机器识别，将要降解的蛋白质必须通过至少四个遍在蛋白分子修饰。遍在蛋白分子在破坏(destruction)前由隶属于遍在蛋白C末端水解酶(UCH)家族脱遍在蛋白酶(deubiquitinase)的酶从蛋白质切下并回收用于其他用途。

脱遍在蛋白酶(DUB)是一类通过去组装遍在蛋白链或从底物去除单遍在蛋白化来调节遍在蛋白介导的信号发放的特化蛋白。⁷DUB还常称为脱遍在蛋白肽酶、脱遍在蛋白异肽酶、脱遍在蛋白酶、遍在蛋白蛋白酶、遍在蛋白水解酶、遍在蛋白异肽酶或Dub。人基因组在五个基因家族中编码近100种对遍在蛋白具有特异性的DUB。DUB可以作为遍在蛋白系统的负调节物和正调节物。除遍在蛋白回收外，它们还涉及遍在蛋白前体的最初加工、蛋白质遍在蛋白化的校正及抑制性遍在蛋白链的去组装。此外，诸如遍在蛋白特异性蛋白酶(USP)家族DUB的DUB逆转靶蛋白的遍在蛋白化或遍在蛋白样修饰，而诸如UCH家族DUB的成员的DUB负责从未锚定的多聚遍在蛋白(即通过缀合机从头合成或通过其他DUB从靶蛋白释放的游离多聚遍在蛋白)再生单遍在蛋白。

大多数DUB尚未得到充分表征。一个例外是USP7(HAUSP)，其在肿瘤发生中具有已经确定的作用。USP7的关键功能是通过脱遍在蛋白化和稳定癌蛋白质Mdm2从而下调p⁵³肿瘤抑制物来调节细胞存活。^8,9由于USP7直接去稳定化p⁵³并调节其他肿瘤抑制物(包括FOXO4和PTEN)，抑制USP7是有吸引力的治疗策略。^8,9另一实例是USP14，认为其在降解涉及淀粉状蛋白生成性神经变性的蛋白质中发挥作用。³²

本文引用的所有专利、专利申请、出版物、文件、核苷酸及蛋白质序列数据库检索号、其所指的序列和文章在此全都以其整体引入作为参考。

发明概述

本文提供的发明尤其公开了包含构象稳定的遍在蛋白的组合物和用该组合物来抑制与这些蛋白质的稳定形式结合的一种或多种酶的作用的方法，以及用于鉴定与这些稳定蛋白质结合的物质的方法。本文还提供用于筛选蛋白质的构象稳定形式的方法。

在一方面，本申请提供相对于野生型遍在蛋白具有一个或多个氨基酸取代的构象稳定的遍在蛋白。在一些实施方案中，该一个或多个氨基酸取代稳定该构象稳定的遍在蛋白的β1/β2环，使该β1/β2环限制于蛋白质数据库(Protein Data Bank)编号3NHE链B的约均方根偏差内的区域。在一些实施方案中，如通过NMR R₂分散(dispersion)所测量，与野生型遍在蛋白相比，该构象稳定的遍在蛋白的β1/β2环区显示更慢的构象动态。在上述实施方案中任一个的一些实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环附近区域中的微秒R_ex值高至多40倍。在上述实施方案中任一个的一些实施方案中，该构象稳定的遍在蛋白在选自A7、A8、A13、A34、A36、A69和A71的位置处包含一个或多个氨基酸取代，其中该位置是相对于A1-A76(SEQ IDNO:1)。在一些实施方案中，该构象稳定的遍在蛋白包含(a)取代A7(C)或取代A8(C)；和(b)取代A69(C)。在一些实施方案中，该构象稳定的遍在蛋白进一步包含选自A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M或P)、A34(I、F、L、V、S、M或T)、A36(Y、F、L、H、A、V、W、I、M或N)和A71(R、K、A、Q、W、G、H、I、R或G)的一个或多个取代。在一些实施方案中，该构象稳定的遍在蛋白包含选自A7(D、F、R或S)、A8(Y、A、G、Q、R或Y)、A13(R、Y、E或P)、A34(I、L或T)、A36(L、Y、A或N)、A69(A、G、W、K、Y或I)和A71(A、R、Q、R或G)的一个或多个取代。在上述实施方案中任一个的一些实施方案中，该构象稳定的遍在蛋白进一步包含定位在A42、A46、A49、A62、A65、A68或A70处的一个或多个氨基酸取代，其中该氨基酸残基位置对应于SEQ ID NO:1中的位置。在上述实施方案中任一个的一些实施方案中，该构象稳定的遍在蛋白进一步包含定位在A40、A42、A46、A47、A49、A62、A65、A68、A70、A71、A72、A73、A74、A75或A76处的一个或多个氨基酸取代，其中该氨基酸残基位置对应于SEQ ID NO:1中的位置。在上述实施方案中任一个的一些实施方案中，与野生型遍在蛋白相比，该构象稳定的遍在蛋白显示与遍在蛋白特异性蛋白酶(USP)家族的脱遍在蛋白酶的结合增加。在上述实施方案中任一个的一些实施方案中，该构象稳定的遍在蛋白以纳摩尔范围内Kd与该脱遍在蛋白酶结合。在上述实施方案中任一个的一些实施方案中，该构象稳定的遍在蛋白以比野生型蛋白质的亲和力高至少1000倍的亲和力与该脱遍在蛋白酶结合。在上述实施方案中任一个的一些实施方案中，该构象稳定的遍在蛋白抑制该脱遍在蛋白酶的活性。在上述实施方案中任一个的一些实施方案中，与野生型遍在蛋白相比，该构象稳定的遍在蛋白显示与遍在蛋白C末端水解酶(UCH)家族的脱遍在蛋白酶无结合或减少的结合。

在一方面，提供编码上述实施方案中任一个的构象稳定的遍在蛋白的核酸。

在一方面，提供包含上述实施方案中任一个的核酸的载体。在一些实施方案中，该载体是表达载体。

在一方面，提供包含上述实施方案中任一个的核酸或载体的细胞。在一些实施方案中，该细胞选自动物细胞、细菌细胞、昆虫细胞、线虫细胞和酵母细胞。在一些实施方案中，该动物细胞是人细胞或非人细胞。

在一方面，提供包含上述实施方案中任一个的构象稳定的遍在蛋白和USP家族的成员的脱遍在蛋白酶的蛋白复合物。在一些实施方案中，该脱遍在蛋白酶是USP7、USP5或USP14。在一些实施方案中，该脱遍在蛋白酶是USP7。

在一方面，提供与上述实施方案中任一个的构象稳定的遍在蛋白中的一个或多个共价连接的蛋白质。

在一方面，提供包含固定在其上的上述实施方案中任一个的构象稳定的遍在蛋白的固体支持物。在一些实施方案中，该固体支持物是适合用于表面等离振子共振的表面。在一些实施方案中，该固体支持物是纳米颗粒、球珠(bead)或玻璃。

在一方面，提供包含在其表面表达上述实施方案中任一个的构象稳定的遍在蛋白的细胞的群体。

在一方面，提供抑制USP家族的脱遍在蛋白酶的方法，其包括使该脱遍在蛋白酶与上述实施方案中任一个的构象稳定的遍在蛋白接触。在一些实施方案中，该抑制是体内抑制或体外抑制。

在一方面，提供鉴定与遍在蛋白的构象形式结合的物质的方法，该构象形式有利于与USP家族的脱遍在蛋白酶结合，其包括：a)使该物质与上述实施方案中任一个的构象稳定的遍在蛋白接触；和b)测定该物质是否与该构象稳定的遍在蛋白结合。在一些实施方案中，该物质是小分子化合物、抗体、蛋白质、抑制性核酸或其任意组合。

在一方面，提供鉴定与包含USP家族的脱遍在蛋白酶和遍在蛋白的蛋白复合物结合的物质的方法，该方法包括：a)使该物质与21-23项中任一项的蛋白复合物接触；和b)测定该物质是否能够与该蛋白复合物结合。在一些实施方案中，该物质是小分子化合物、抗体、蛋白质、抑制性核酸或其任意组合。在一些实施方案中，该物质破坏脱遍在蛋白酶和遍在蛋白之间的相互作用。

在一个实施方案中，提供通过上述实施方案中任一个的方法鉴定的物质。

在一方面，提供筛选蛋白质的构象稳定形式的方法，其中该构象稳定形式与野生型蛋白质相比具有增加的与结合配偶体的结合亲和力，或具有增加的调节该结合配偶体的活性的能力，该方法包括：a)使该结合配偶体与该蛋白质的突变体形式的文库接触，其中该突变体形式的文库是通过在一个或多个预先选择的位置处用另一氨基酸残基取代构象动态蛋白质中的氨基酸残基而产生，其中该预先选择的位置定位在该蛋白质的内部；和b)根据与该结合配偶体的结合或与野生型蛋白质相比增加的调节该结合配偶体的活性的能力来鉴定该构象稳定形式。在一些实施方案中，根据每个位置处的氨基酸残基对该蛋白质内或该蛋白质的区域内的构象动态的贡献来选择该预先选择的位置。在上述实施方案中任一个的一些实施方案中，该文库是编码该蛋白质的突变体形式的核酸的文库。在一些实施方案中，该文库是噬菌体展示文库。在一些实施方案中，用于该噬菌体展示文库的载体选自M13噬菌体、f1噬菌体、fd噬菌体、Ike噬菌体、N1噬菌体、肠细菌噬菌体T4、噬菌体T7和肠细菌噬菌体λ。在上述实施方案中任一个的一些实施方案中，该方法进一步包括用其他氨基酸残基取代一个或多个表面氨基酸残基来在所鉴定出的构象稳定蛋白质的表面上突变一个或多个氨基酸残基，并筛选与不含一个或多个取代的表面氨基酸残基的构象稳定蛋白质相比具有增加的结合亲和力或调节能力的蛋白质。在上述实施方案中任一个的一些实施方案中，该蛋白质选自G蛋白偶联受体(GPCR)、核激素受体、酪氨酸激酶受体和配体门控型离子通道。在一些实施方案中，该蛋白质是遍在蛋白。在一些实施方案中，该结合配偶体选自脱遍在蛋白酶、E1遍在蛋白活化酶、E2遍在蛋白缀合酶、E3遍在蛋白-蛋白连接酶及细胞蛋白酶体复合物的一个或多个成员。在一些实施方案中，该结合配偶体是脱遍在蛋白酶。在一些实施方案中，该脱遍在蛋白酶是遍在蛋白特异性蛋白酶(USP)家族脱遍在蛋白酶的成员。在一些实施方案中，该脱遍在蛋白酶选自USP7、USP5和USP14。在一些实施方案中，该脱遍在蛋白酶是USP7。

附图简述

图1显示通过构象展示鉴定对USP7(U7Ub)具有高亲和力的两类遍在蛋白变体。A)构象展示筛选使构象平衡崩解为单状态的核心突变。在遍在蛋白的情况下，已有的构象平衡介导几种蛋白质相互作用，预测单构象的选择既降低结合的熵成本又提供特异性。B)上部：大多数U7Ub包含位置7或8和位置69之间的二硫键，突出显示可以如何通过共价分子内交联介导构象稳定化。下部：少数U7Ub不含二硫键，通过非共价重包装达到相同的终点。C)通过噬菌体斑点ELISA显示基于二硫键(例如克隆7)和不基于二硫键(例如克隆25)的U7Ub25变体都特异性结合USP7。D)非二硫键U7Ub25变体以193±17.3nM的亲和力结合USP7的催化核心(ΔH＝-16.67±0.1562kcal/mol，ΔS＝-7.48kcal/mol，N＝0.92±0.0062)。

图2显示蛋白复合物内的遍在蛋白的β1-β2区的聚类均方根偏差(RMSD)分析，其揭示了影响DUB结合的两种不同构象。A)配对比对球状核心(残基1-5和11-70)的其余部分后，遍在蛋白复合物的所有高分辨率结构中遍在蛋白的β1-β2区(残基6-10)的RMSD的聚类热图。B)在不检查聚类RMSD的情况下，β1-β2区所采用的构象作为可能的构象体的弥散出现。C)“上”和“下”β1-β2构象体的比较。D)UCH型DUB与β1-β2的“上”构象结合(UCHL3-Ub复合物PDB编号1xd3)，而USP型DUB结合“下”状态(USP14-Ub复合物PDB编号2ayo)。遍在蛋白显示为红色，DUB显示为蓝色。包装β1-β2从而限制其构象的DUB残基(UCHL3-Leu220，USP14-Phe168)显示为球体。E)在与UCH(淡紫色，PDB编号1cmx、1xd3和3ifw)和USP(粉红色，PDB编号2ayo、2hd5和2ibi)的复合物中解析的三种遍在蛋白结构的叠加。显示允许在噬菌体文库中突变的残基的侧链。

图3用可变表面化学显示接触遍在蛋白(橙色)的β1-β2环区的USP型脱遍在蛋白酶(蓝色)。与遍在蛋白接触的脱遍在蛋白酶残基和允许在构象展示期间改变的遍在蛋白残基显示为棍。所显示的脱遍在蛋白酶是USP7(PDB编号1NBF)、USP14(PDB编号2AYO)、USP2(PDB编号2IBI)和USP21(PDB编号3I3T)。

图4显示A)通过生物层干涉量度法筛选U7Ub变体。将等量的USP7催化结构域活性部位突变体(USP7catC223A)偶联至各传感器尖端，并浸没在恒定浓度的各U7Ub中。根据稳态反应及表观结合速率和解离速率来选择变体。B)U7Ub7变体对USP7catC223A的滴定显示约200nM的解离常数。

图5显示非二硫键U7Ub表面的亲和力成熟进一步改善对USP7的亲和力。A)基于U7Ub25支架的亲和力成熟的克隆的序列包含少量表面突变。B)亲和力成熟的克隆U7Ub25.2540是蛋白质ELISA测定中最有效的USP7催化结构域结合剂。C)生物层干涉量度法显示U7Ub25以90nM的解离常数结合USP7的催化结构域，而亲和力成熟的U7Ub25.2540具有增强3倍的亲和力。

图6显示A)U7Ub7和B)U7Ub25.2540的按1ζ描绘的2Fo-Fc电子密度。显示最终的细化模型用于参考。

图7显示U7Ub的晶体结构，揭示改变的主链构象或核心包装。A)显示野生型遍在蛋白的结构用于参考，最初选择的变体中突变的位置显示为棍，并标记β1-β2区。B)U7Ub7的结构揭示了位置8和69之间形成的二硫键，其扭曲了β1-β2环的构象。C)U7Ub25.2540变体的主链构象与野生型遍在蛋白的主链构象几乎相同，但在β1-β2区周围具有改变的包装。亲和力成熟的表面突变显示为黄色。

图8显示U7Ub变体的结构分析。A)类似于USP7结合的遍在蛋白且不同于apo遍在蛋白，U7Ub7的β1-β2环向下扭曲。B)包装及U7Ub7的C端和蛋白质的其余部分之间的氢键相互作用。C)U7Ub25.2540的β1-β2环的构象类似于apo遍在蛋白的构象。

图9显示异核{¹H}-¹⁵N NOE数据，显示Ub7.7的C端在溶液中可移动，但相对于野生型受限。

图10显示核心重包装和溶剂暴露突变都为U7Ub25达到高亲和力所必需。虽然在U7Ub25核心(U7Ub25_L71和U7Ub25.2540_L71)的背景中将Leu71Arg突变回复为其野生型同一性强烈降低亲和力，但将Arg71引入野生型遍在蛋白(Ubwt_R71)对紧密结合而言是不够的。类似地，具有表面突变的所有组合的野生型遍在蛋白核心具有受损的与USP7的结合(Ubwt_R71，Ubwt.2540_L71，Ubwt.2540_R71)。将重包装的核心与野生型遍在蛋白表面(U7Ub25_L71)组合对紧密结合而言也是不够的。因此，新选择的核心和重新排列的表面都为高亲和力结合所需(U7Ub25_R71，U7Ub25.2540_R71)。

图11显示U7Ub25具有类似于野生型遍在蛋白的微秒运动。U7Ub25在毫秒时间尺度上没有可检测到的运动，因为针对U7Ub25测定的R₂值显示对CPMG重聚焦脉冲的频率没有依赖性(数据未显示)。

图12显示，酶促测定揭示U7Ub25和U7Ub25.250是全长USP7的有效抑制剂。A)U7Ub25和U7Ub25.2540都强烈抑制全长USP7(IC₅₀分别为172nM和104nM)。C端二甘氨酸基序的缺失(U7Ub25dGG)对抑制潜能无影响。B)U7Ub不抑制高活性的USP2催化结构域。C)细胞功能与USP7的细胞功能完全相反的USP10不受U7Ub抑制。D)虽然USP47是与USP7最密切相关的脱遍在蛋白酶，但U7Ub是比USP7有效性更低的此DUB的抑制剂(IC₅₀～10μM)。E)上部：U7Ub以373nM(U7Ub25)和253nM(U7Ub25.2540)的IC₅₀抑制全长USP5。但是，C端二甘氨酸的缺失(U7Ub25dGG)废除了USP5的抑制。下部：USP5由野生型遍在蛋白而不由U7Ub强烈激活。除对初始延迟期后测量的最大速率归一化的“USP5(最大速率)”外，所有活性均对零浓度遍在蛋白下的初始速率归一化。

图13显示抗-USP7变体未通过E1和E2酶有效掺入Lys48-或Lys63-连接的链。U7Ub3和U7Ub7都未在利用E1UBE1和E2Cdc34(其促进K48多遍在蛋白化)或Uev1a/UbcH13(其促进K63多遍在蛋白化)的生化连接测定中有效掺入K48-或K63-连接的链；单体遍在蛋白库的排除支持变体部分占用所评价的E1和/或E2酶。相反，用U7Ub25未达到可检测到的多聚化。

图14显示U7Ub25.2540变体是细胞环境中的内源性USP7的选择性抑制剂。A)U7Ub25.2540在细胞中微弱地掺入多聚遍在蛋白链；U7Ub25.2540ΔGG废除了链掺入。图15中显示特异性遍在蛋白链连接的研究。用所示表达构建体转染HCT116细胞，裂解物按所示印迹或用所以抗体免疫沉淀；同种型对照(C)抗体是细胞培养级赫赛汀(Herceptin)。B)相对于其他细胞DUB，U7Ub25.2540ΔGG选择性结合内源性USP7。用抗所示蛋白质的抗体印迹抗-HA抗体或同种型抗体对照(抗-c-myc)免疫沉淀或细胞裂解物。用HCT116USP7-/-细胞系作为USP7结合的附加对照。C)U7Ub25.2540ΔGG在细胞中的表达促进MDM2多遍在蛋白化(内源性USP7抑制的指示)。用所示构建体转染U2OS细胞，用对照(曲妥珠单抗(Trastuzumab))或K48谱系选择性抗体免疫沉淀细胞裂解物并印迹，以揭示MDM2遍在蛋白化。D)U7Ub25.2540ΔGG在细胞中的表达增加了MDM2翻转(内源性USP7抑制的反映)。用所示构建体转染U2OS细胞，用100μM环己酰亚胺处理，在所示时间点收集，并用所示抗体印迹裂解物。E)U7Ub25.2540ΔGG在细胞中的表达稳定化p53，随后上调p53响应基因p21。用所示表达构建体转染U2OS或SiHa细胞，并用所示抗体印迹裂解物。

图15显示微弱地掺入细胞中的多聚遍在蛋白链的U7Ub25.2540；U7Ub25.2540ΔGG废除了链掺入。用所示表达构建体转染HCT116细胞，并用所示抗体免疫沉淀裂解物；同种型对照(C)抗体是曲妥珠单抗。

图16显示，相对于其他细胞DUB，U7Ub25.2540与内源性USP7和USP5结合。按所示转染HCT116细胞，并用抗所示蛋白质的抗体印迹抗-HA免疫沉淀或细胞裂解物。

图17显示U7Ub25.2540ΔGG富集细胞裂解物中的内源性USP7。通过质谱法分析了对应于图14B的抗-HA免疫沉淀。显示了针对所示DUB检测到的肽总数，独特肽的数目显示在括号中。

图18显示A)针对USP14的5轮噬菌体淘选后分离的23个噬菌体克隆的序列偏好。B)蛋白质ELISA证明U14Ub对USP14具有增加的亲和力，对UCHL3和UCHL1的亲和力具有相应的降低。野生型遍在蛋白曲线以蓝色显示，多种U14Ub以黑色显示。C)用U14Ub2和U14Ub14生物层干涉量度法滴定USP14。两阶段结合速率的慢成分显示对U14Ub的浓度的依赖性，指示诱导契合结合机制。⁴⁰通过稳态和动力学拟合测定的解离常数相符。

图19显示U14Ub apo动态相对于野生型减慢。A)U14Ub对野生型的¹H-¹⁵N HSQC光谱中酰胺共振的强度的比值。将该比值对显示无交换的共振归一化。插图显示将这些比值标示在野生型遍在蛋白的结构(PDB编号1ubi)上；最显著的改变发生在β1-β2区中。B)针对U14Ub14、U14Ub2和野生型遍在蛋白通过R_ex测量定量的毫秒(蓝色)和微秒(红色)运动。U14Ub14和U14Ub2图中的插图分别显示ms和μs R_ex测量的原始数据的实例。由于交换扩大或光谱重叠而缺乏数据的共振用X表示。野生型遍在蛋白显示在这些条件下无ms R_ex。

图20显示遍在蛋白能量景貌的扰动影响USP14结合的机制，并产生不能支持体内生长的遍在蛋白变体。A)遍在蛋白结合可以通过构象选择或诱导契合而发生。野生型遍在蛋白的构象子态之间的相互转换很快，因此分开子态的能障是适度的。B)U14Ub的运动比野生型慢得多，通过该途径的构象选择臂减少流出，并导致结合机制由诱导契合主导。C)尽管它们具有连入Lys48连接链的能力，但与人遍在蛋白不一样，U14Ub不能取代酵母中的内源性遍在蛋白。

图21显示PDB中的所有Ub-配偶体结构的β1-β2RMSD的聚类热图。按结果和方法中所述比对并聚类结构。沿每个轴列出的复合物为<PDB编号><遍在蛋白链字母>-<配偶体链字母>的形式。例如，2ibiB-A表示在PDB编号2ibi中与USP2(链A)结合的来自遍在蛋白(链B)的β1-β2环。

图22显示来自U14Ub改造实验的设计结果。A)单状态设计和B)多状态设计的共有序列偏好。

图23显示5种U14Ub和野生型遍在蛋白的分配的¹H-¹⁵N HSQC光谱。突出显示所选择的β1-β2区周围显示显著交换扩大的残基。U14Ub14显示最严重的交换扩大，与它具有最大的ms R_ex值一致。

图24显示全部5种U14Ub的CS-Rosetta模型。全部5种U14Ub的CS-Rosetta模型(带状)与野生型遍在蛋白的CS-Rosetta模型(卡通)重叠。显示各变体的两个最低能量模型。按图19中的方案给U14Ub涂色：1为紫色，2为蓝色，14为红色，22为橙色，24为绿色。各变体的折叠与野生型遍在蛋白不可区分。

图25显示所有变体的微秒和毫秒R_ex值。在18.8T和297K测量R_ex值。通过50和950Hz的CPMG场的R_2obs之间的差异来估计各残基的毫秒R_ex。

图26显示两种场下的R₂分散数据的组拟合。对于U14Ub1、U14Ub2和U14Ub14，将显示并未太过杂乱而不可拟合的R₂分散的残基显示为定位至野生型遍在蛋白的晶体结构上的橙色球体。显示显著的ms R_ex值的残基在结构中聚在一起。对于U14Ub1和U14Ub2，针对突出显示的所有残基整体获得Carver Richards方程的拟合。针对U14Ub14突出显示残基的三个聚类既由于其空间分开而作为独立的组拟合，也整体拟合，产生相似的k_ex值。此处显示的U14Ub14的拟合是对于残基4、14和15的聚类。

图27显示用微分静态光散射进行的U14Ub和野生型遍在蛋白的热稳定性测量，其显示没有一种突变体相对于野生型显著去稳定化。为了清楚而显示激酶的转换。在至多81℃(设备的高温极限)也未观察到野生型遍在蛋白和U14Ub的转换。将数据对低温基线的强度归一化。

图28显示生物层干涉量度法滴定拟合至两阶段结合模型。通过生物层干涉量度法检测的U14Ub对USP14的滴定(黑色)良好地拟合至两阶段结合模型(红色)。用于测定的U14Ub的浓度为0.068、0.206、0.618、1.85、5.17、16.7和50μM。

图29显示来自稳态响应和用诱导契合模型拟合的k_slow对U14Ub的浓度的作图的平衡K_D。结合的慢速阶段良好地拟合至Hammes等,Proc.Natl.Acad.Sci.U.S.A.106,13737-13741(2009)所述的诱导契合模型。

图30显示交叉停靠，表明遍在蛋白状态可以区分USP-和UCH-型脱遍在蛋白酶。A)各遍在蛋白-脱遍在蛋白酶组合的得分对Cα作图，各模型的PDB编号在各图上方列出。先列出遍在蛋白部分(<PDB编号>B)，随后是脱遍在蛋白酶(<PDB编号>A)。例如，2ibiB_2ayoA是来自2ibi(USP2结合的Ub)的遍在蛋白停靠至来自2ayo(USP14)的脱遍在蛋白酶上，而1xd3B_2ayoA是来自1xd3(UCHL3结合的Ub)的遍在蛋白,停靠至来自2ayo(USP14)的脱遍在蛋白酶上。按方法中所述制备和停靠结构，排除遍在蛋白的C末端尾，以避免晶体学偏差。B)图A中交叉停靠结果的总结。将来自各交叉停靠实验的最低的5个RMSD平均，并呈现为聚类热图。注意，来自USP结合的遍在蛋白的所有遍在蛋白都更易于停靠至USP-型DUB上(较低的RMSD)，UCH结合的遍在蛋白更易于停靠至UCH-型DUB上，但交叉家族停靠通常不成功。

图31显示U14Ub2的晶体结构。A)U14Ub2(蓝色)与野生型遍在蛋白(小麦，PDB编号：1UBI)的叠加。U14Ub2的总体折叠与野生型一样，β1-β2区中的偏差可能是由晶体包装引起。B)色氨酸71包装入不对称单元中邻近分子的疏水核，扭曲β1-β2的构象。U14Ub2的结构以与图A中相同的取向显示为表面表示。不对称单元中的邻近分子以浅橙色显示。

图32显示掺入K48连接的链。显示通过UBE1and cdc34以类似于野生型的程度掺入K48连接的链的U14Ub变体的SDS-Page。U14Ub和野生型遍在蛋白之间的重链差异是由于6xHis标记的存在，其尚未从突变体切割。

图33显示衍生自第二代亲和力成熟的U7Ub25的高亲和力克隆。术语“s/n比”指信号:噪音比，其中“信号”是针对通过包被在384孔Maxisorp板上的NeutrAvidin捕获的生物素化USP7catC223A检测到的斑点噬菌体ELISA信号；“噪音”是针对NeutrAvidin单独的ELISA信号。显示遍在蛋白中的位置编号。

图34显示通过ELISA测定的U7Ub25亲和力成熟变体的亲和力排序。

图35显示生物层干涉量度法滴定(黑色)未拟合至单阶段解离模型(红色)。用于测定的U14Ub的浓度为0.068、0.206、0.618、1.85、5.17、16.7和50μM。

图36显示生物层干涉量度法滴定(黑色)拟合至单阶段解离模型(红色)。用于测定的U14Ub的浓度为0.068、0.206、0.618、1.85、5.17、16.7和50μM。

发明详述

本发明提供可以用来鉴定和/或筛选能够以高亲和力结合一种或多种结合配偶体的构象稳定蛋白质的方法(称为“构象展示”(CD))。与传统噬菌体展示(其通常突变表面氨基酸位置来发现新的焓接触)不同，CD提供了改变埋藏在蛋白质的三级结构内的氨基酸残基来鉴定产生最佳结合构象的新包装排列的方法。本申请的方法与之前已在本领域中实施的方法的不同在于，本文公开的方法提供了调节蛋白质构象动态的能量学的能力，从而代表了通过调节界面动态来调节蛋白质-蛋白质相互作用的亲和力和选择性二者而不是仅调节焓接触的手段。

用CD来鉴定具有定位在遍在蛋白内部的氨基酸取代的构象稳定的遍在蛋白，从而相对于野生型蛋白质的主要构象状态将遍在蛋白的β1-β2环区改变为“下”构象。与野生型遍在蛋白相比，遍在蛋白的这些构象稳定形式能够以高得多的亲和力结合遍在蛋白特异性蛋白酶(USP)家族脱遍在蛋白酶的脱遍在蛋白酶。此外，通过CD产生的构象稳定的遍在蛋白可以用作新的工具来鉴定和筛选一种或多种物质，该物质：1)能够结合遍在蛋白的特定构象形式；2)与优选结合遍在蛋白的特定构象形式的遍在蛋白加工酶结合；或3)能够破坏USP-脱遍在蛋白酶/遍在蛋白复合物。

I.一般技术

除非另有说明，本发明的实施将利用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术，其在本领域的技术范围之内。这类技术充分阐述于文献中，如“Molecular Cloning:ALaboratory Manual”,第2版(Sambrook等,1989)；“OligonucleotideSynthesis”(M.J.Gait编辑,1984)；“Animal Cell Culture”(R.I.Freshney编辑,1987)；“Methods in Enzymology”(Academic Press,Inc.)；“CurrentProtocols in Molecular Biology”(F.M.Ausubel等编辑,1987,及定期更新)；“PCR:The Polymerase Chain Reaction”,(Mullis等编辑,1994)；“APractical Guide to Molecular Cloning”(Perbal Bernard V.,1988)。

本发明中利用或描述的寡核苷酸、多核苷酸、肽、多肽和小分子可以用本领域已知的标准技术产生。

II.定义

在提到分子时，“分离的”指已鉴定并从其天然环境的成分分开和/或回收的分子。其天然环境的污染成分是干扰诊断或治疗用途的物质。

本文所用的术语“多肽”包括蛋白质、多肽的片段和融合蛋白质。

“活性”多肽或其片段保留了该活性多肽的天然或天然存在的对应物的生物活性。生物活性指由该活性多肽的天然或天然存在的对应物介导的功能。例如，结合或蛋白质-蛋白质相互作用构成生物活性。

“亲和力”指分子(例如遍在蛋白，如遍在蛋白的构象稳定形式)的单个结合部位与它的结合配偶体之间非共价相互作用的总和的强度。除非另有说明，本文所用的“结合亲和力”指内在的结合亲和力，其反映结合对的成员之间的1:1相互作用。分子X对它的配偶体Y的亲和力一般可通过解离常数(Kd)来表示。亲和力可以通过本领域公知的方法来测量，包括本文中描述的那些。测量结合亲和力的具体的说明性和示例性实施方案在下文中描述。

术语“抗体”在本文中以最广泛的含义使用并涵盖多种抗体结构，包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如双特异性抗体)和抗体片段，只要它们显示希望的抗原结合活性。在一些实施方案中，抗体可以是嵌合抗体、人抗体、人源化抗体和/或亲和力成熟抗体。

“抗体片段”指除完整抗体以外的包含完整抗体的部分的分子，其结合该完整抗体所结合的抗原。抗体片段的实例包括但不限于Fv、Fab、Fab'、Fab’-SH、F(ab')₂；双抗体；线性抗体；单链抗体分子(例如scFv)；及从抗体片段形成的多特异性抗体。

与参考抗体“结合相同表位的抗体”指在竞争测定中将参考抗体与其抗原的结合阻断50％或更多的抗体，相反，参考抗体在竞争测定中将该抗体与其抗原的结合阻断50％或更多。本文提供示例性竞争测定。

术语“嵌合”抗体指其中部分重链和/或轻链衍生自特定来源或物种，而重链和/或轻链的其余部分衍生自不同的来源或物种的抗体。

抗体的“种类”指其重链所具有的恒定结构域或恒定区的类型。存在五个主要种类的抗体：IgA、IgD、IgE、IgG和IgM，这些种类中的几种可以进一步划分为亚类(同种型)，例如IgG₁、IgG₂、IgG₃、IgG₄、IgA₁和IgA₂。对应于不同种类免疫球蛋白的重链恒定区分别称为α、δ、ε、γ和μ。

根据其恒定结构域的氨基酸序列，可将来自任意脊椎动物物种的抗体的轻链分配至称为κ和λ的两个明显不同的类型之一。

本文所用的术语“单克隆抗体”指获自基本上同质的抗体群体的抗体，即除例如包含天然存在的突变或在产生单克隆抗体制剂的过程中出现的可能的变体抗体(这类变体通常以较小的量存在)外，包含该群体的单种抗体相同和/或结合相同表位。与通常包含抗不同决定簇(表位)的不同抗体的多克隆抗体制剂不同，单克隆抗体制剂中的每种单克隆抗体抗抗原上的单个决定簇。因此，修饰词“单克隆”表示抗体获自基本上同质的抗体群体的特性，而不解释为需要通过任意特定方法产生抗体。例如，待用于本发明的单克隆抗体可以通过多种技术制备，包括但不限于杂交瘤法、重组DNA法、噬菌体展示法及利用含有全部或部分人免疫球蛋白基因座的转基因动物的方法，本文描述用于制备单克隆抗体的这类方法和其他示例性方法。

术语“嵌合”抗体指其中部分重链和/或轻链衍生自特定来源或物种，而重链和/或轻链的其余部分衍生自不同来源或物种的抗体。

“人源化”抗体指包含来自非人高变区(HVR)的氨基酸残基和来自人构架区(FR)的氨基酸残基的嵌合抗体。在某些实施方案中，人源化抗体将包含至少一个(通常两个)可变结构域的基本上全部，其中全部或基本上全部HVR(例如CDR)对应于非人抗体，而全部或基本上全部FR对应于人抗体的那些。人源化抗体可选地包含至少部分衍生自人抗体的抗体恒定区。抗体(例如非人抗体)的“人源化形式”指已经历人源化的抗体。

“人抗体”是这样的抗体，其具有对应于由人或人细胞产生的抗体的序列或衍生自利用人抗体库或其他人抗体编码序列的氨基酸序列。人抗体的此定义明确排除了包含非人抗原结合残基的人源化抗体。

“亲和力成熟的”抗体指在一个或多个HVR中具有一个或多个改变的抗体，与不具有这类改变的亲本抗体相比，这类改变导致抗体对抗原的亲和力的改善。

“表位标记的”多肽指与“标记多肽”融合的嵌合抗体。这类标记提供可以针对其制备抗体或可获得针对其的抗体的表位，但基本上不干扰多肽活性。为了减少抗-标记抗体与内源表位的反应性，标记多肽通常是独特的。适宜的标记多肽通常具有至少6个氨基酸残基，通常在约8个和50个氨基酸残基之间，优选在8个和20个氨基酸残基之间。附加表位序列的实例包括来自流感病毒A的HA、GD和c-myc、poly-His和FLAG。

本文中可互换使用的“多核苷酸”或“核酸”指任意长度的核苷酸聚合物，且包括DNA和RNA。核苷酸可以是脱氧核糖核苷酸、核糖核苷酸、修饰的核苷酸或碱基、和/或其类似物，或可以通过DNA或RNA聚合酶或通过合成反应掺入聚合物中的任意底物。如果存在，对核苷酸结构的修饰可以在组装聚合物之前或之后进行。核苷酸的序列可以由非核苷酸成分中断。多核苷酸可以在合成后进一步修饰，如通过与标记缀合。其他类型的修饰包括例如“帽”，用类似物取代一个或多个天然存在的核苷酸，核苷酸间修饰，例如具有不带电荷的连接(例如磷酸甲酯、磷酸三酯、磷酰胺、氨基甲酸酯等)和具有带电荷的连接(例如硫代磷酸酯、二硫代磷酸酯等)的那些，包含悬垂部分(例如蛋白质(例如核酸酶、毒素、抗体、信号肽、聚-L-赖氨酸等))的那些，具有嵌入剂(例如吖啶、补骨脂素等)的那些，包含螯合剂(例如金属、放射性金属、硼、氧化性金属等)的那些，包含烷化剂的那些，具有修饰连接的那些(例如α异头核酸等)，以及未修饰形式的多核苷酸。另外，通常存在于糖中的任意羟基可以例如通过膦酸基团、磷酸基团取代，通过标准保护基团保护，或活化以制备与附加核苷酸的附加连接，或可以缀合至固体或半固体支持物。5’和3’端OH可以磷酸化或用1至20个碳原子的胺或有机帽化基团部分取代。其他羟基也可以衍生至标准保护基团。多核苷酸还可以包含本领域公知的核糖或脱氧核糖的类似物形式，包括例如2'-O-甲基-、2'-O-烯丙基、2'-氟-或2'-叠氮基-核糖，碳环糖类似物，α-异头糖，差向异构糖如阿拉伯糖、木糖或来苏糖，吡喃糖，呋喃糖，景天庚酮糖，无环类似物和无碱基核苷类似物如甲基核苷。可以用备选的连接基团取代一个或多个磷酸二酯键。这些备选的连接基团包括但不限于其中用P(O)S(“硫代”)、P(S)S(“二硫代”)、(O)NR₂(“酰胺”)、P(O)R、P(O)OR'、CO或CH₂(“formacetal”)取代磷酸的实施方案，其中每个R或R'独立地是H或可选地包含醚(-O-)键的取代或未取代的烷基(1-20C)、芳基、链烯基、环烷基、环烯基或araldyl。多核苷酸中的所有键无需相同。前面的描述适用于本文提到的所有多核苷酸，包括RNA和DNA。

本文所用的“寡核苷酸”泛指短的、通常为单链、通常为合成的多核苷酸，其长度通常但并非必然小于约200个核苷酸。术语“寡核苷酸”和“多核苷酸”并非相互排斥。上文针对多核苷酸的描述同等地和完全地适用于寡核苷酸。

本文在蛋白质或蛋白质区域的背景中所用的“运动”或“动态”指蛋白质或蛋白质区域的结构中的构象变化。

本文所用的“构象动态蛋白质”指能够进行一种或几种运动的蛋白质或蛋白质区域。

在本文中使用时，“构象稳定的”指且包括任意蛋白质或蛋白质区域，其就野生型蛋白质而言发生改变，使得它与野生型蛋白质或蛋白质区域相比经历较少的运动。例如，可以通过R₂分散实验(对毫秒时间尺度上的运动敏感)和/或H_ZN_Z R₁R_ex测量(对微秒时间尺度上的运动敏感)来测量蛋白质主链的构象稳定性程度。

在本文中使用时，“构象稳定的遍在蛋白”指且包括任意遍在蛋白，就β1-β2环区的运动而言，与野生型遍在蛋白中此区域的运动相比，其以一种或多种构象状态存在。

术语“野生型遍在蛋白”在本文中指天然序列遍在蛋白多肽。本文所述的遍在蛋白多肽可以是从多种来源(如从人组织类型或从另一来源)分离或通过重组或合成方法制备的遍在蛋白多肽。“天然序列遍在蛋白多肽”包含具有与对应的衍生自自然界的遍在蛋白多肽相同的氨基酸序列的多肽。

本文所用的定位在蛋白质“内部”的氨基酸残基意指不处于蛋白质表面的氨基酸残基。可以通过例如溶剂可及性研究、X射线晶体学结构、NMR结构或基于一级氨基酸序列的预测来确定氨基酸残基是否定位在蛋白质表面。

“突变”包括确定的一级氨基酸序列中至少一个氨基酸的氨基酸缺失、氨基酸插入和氨基酸取代。在一些方面，一级氨基酸序列中一个或多个氨基酸的突变可以导致由该氨基酸序列编码的蛋白质在细胞内具有改变的活性或表达水平。在其他方面，一级氨基酸序列中一个或多个氨基酸的突变(如保守性突变)可以不导致由该氨基酸序列编码的蛋白质在细胞内具有活性或表达水平的实质性改变。

氨基酸“取代”意指用另一氨基酸取代确定的一级氨基酸序列的至少一个氨基酸成分。本文所用的“包含A_n(x、y或z)的取代的蛋白质”意指就确定的氨基酸序列而言包含定位在位置n的氨基酸残基取代的蛋白质，用x、y或z取代野生型氨基酸残基。

“小分子”指具有例如小于约5kD、小于约4kD和小于0.6kD的分子量的组合物。

术语“肽”通常指通过肽键连接的氨基酸的连续和相对短的序列。通常，但并非必然，肽具有约2至约50个氨基酸、约4-40个氨基酸或约10-30个氨基酸的长度。虽然术语“多肽”通常指更长形式的肽，但两个术语在本文中在某种程度可互换使用。

术语“氨基酸”和“残基”在本文中可互换使用。

多肽的“区域”是2个或多个氨基酸的连续序列。在一些实施方案中，区域至少约为3、5、10、15个连续氨基酸中的任一个。“C端区域”或其变体指包含最靠近多肽的C端定位的1-5个残基的多肽区域。“N端区域”或其变体指包含最靠近多肽的N端定位的1-5个残基的多肽区域。多肽的“内部”区域指既不定位在多肽的N端也不定位在多肽的C端的多肽区域。

就参考多肽序列而言的“百分比(％)氨基酸序列同一性”定义为在比对序列并在必要时引入缺口来达到最大百分比序列同一性，而不将任意保守取代视为序列同一性的部分之后，候选序列中与参考多肽序列中的氨基酸残基相同的氨基酸残基的百分比。可以以本领域技术之内的多种方式来达到以测定百分比氨基酸序列同一性为目的的比对，例如，使用公开可得的计算机软件，如BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)软件。本领域技术人员可以确定用于比对序列的适当参数，包括在所比较的序列的全长内达到最大比对所需的任意算法。但是，为了本文的目的，用序列比较计算机程序ALIGN-2来产生％氨基酸序列同一性值。ALIGN-2序列比较计算机程序由Genentech,Inc.编写，源代码已随用户文件提交美国版权办公室,Washington D.C.,20559，它在美国版权办公室注册在美国版权注册号TXU510087之下。ALIGN-2程序从Genentech,Inc.,South SanFrancisco,California公开可得，或者可以从源代码编译。ALIGN-2程序应编译用在UNIX操作系统上，包括数字UNIX V4.0D。所有序列比较参数由ALIGN-2程序设定且不变动。

在利用ALIGN-2来进行氨基酸序列比较的情况下，按以下计算给定氨基酸序列A与给定氨基酸序列B的％氨基酸序列同一性(其可以备选地叙述为，具有或包含与给定氨基酸序列B的某％氨基酸序列同一性的给定氨基酸序列A)：

100乘以分数X/Y

其中X是在该程序的A和B的比对中通过序列比对程序ALIGN-2评分为相同的匹配的氨基酸残基的数目，且其中Y是B中的氨基酸残基的总数。应理解，在氨基酸序列A的长度不等于氨基酸序列B的长度时，A与B的％氨基酸序列同一性将不等于B与A的％氨基酸序列同一性。除非明确地另有说明，本文中使用的所有％氨基酸序列同一性值都是用ALIGN-2计算机程序按前一段落中所述获得。

“融合蛋白质”指具有共价连接在一起的两个部分的多肽，其中每个部分衍生自不同的蛋白质。两个部分可以通过单个肽键直接连接或通过包含一个或多个氨基酸残基的肽接头连接。通常，两个部分和接头将相互符合读框，并用重组技术产生。

“障碍”或“病理性病症”是将从本发明的物质/分子或方法的治疗受益的任意病症。这包括慢性和急性障碍或疾病，包括使哺乳动物易患所讨论的障碍的那些病理性病症。本文中的待治疗的障碍的非限制性实例包括恶性和良性肿瘤；淋巴恶性肿瘤；神经元、胶质细胞、星形细胞、下丘脑和其他腺体、巨噬细胞、上皮、基质和囊胚腔障碍；炎性、免疫性和其他血管发生相关障碍。

本文所用的“治疗”(及其语法变形)指改变所治疗的个体的自然过程的尝试中的临床干预，且可以为了预防而进行或在临床病理的过程中进行。希望得到的治疗作用包括但不限于防止疾病的发生或复发、减轻症状、减少疾病的任意直接或间接的病理结果、防止转移、降低疾病进展的速率、改善或缓和疾病状态及消退或改善的预后。

术语“抗癌疗法”指用于治疗癌症的疗法。抗癌治疗剂的实例包括但不限于例如化疗剂、生长抑制剂、细胞毒剂、用于放射疗法的药剂、抗血管发生剂、凋亡剂、抗微管蛋白剂，及治疗癌症的其他药剂、抗-CD20抗体、血小板衍生生长因子抑制剂(例如Gleevec^TM(甲磺酸伊马替尼(ImatinibMesylate)))、COX-2抑制剂(例如塞来昔布(celecoxib))、干扰素、细胞因子、结合一种或多种以下靶标PDGFR-β、BlyS、APRIL、BCMA受体、TRAIL/Apo2的拮抗剂(例如中和抗体)及其他生物活性剂和有机化学剂等。本发明还包括其组合。

本文所用的术语“细胞毒剂”指抑制或阻止细胞的功能和/或引起细胞的破坏的物质。该术语旨在包括放射性同位素(例如At²¹¹、I¹³¹、I¹²⁵、Y⁹⁰、Re¹⁸⁶、Re¹⁸⁸、Sm¹⁵³、Bi²¹²、P³²和Lu的放射性同位素)，化疗剂，例如氨甲喋呤、阿霉素、长春花生物碱(长春花新碱(vincristine)、长春灭瘟碱(vinblastine)、依托泊苷(etoposide))、多柔比星(doxorubicin)、苯丙氨酸氮芥(melphalan)、丝裂霉素C、苯丁酸氮芥(chlorambucil)、柔红霉素(daunorubicin)或其他嵌入剂，酶及其片段，如核溶解酶，抗生素，及毒素，如细菌、真菌、植物或动物来源的小分子毒素或酶活性毒素，包括其片段和/或变体，及下文公开的多种抗肿瘤或抗癌剂。下文描述其他细胞毒剂。杀肿瘤剂引起肿瘤细胞的破坏。

“化疗剂”指用于治疗癌症的化合物。化疗剂的实例包括：烷化剂，如噻替派(thiotepa)和环磷酰胺烷基磺酸盐，如白消安(busulfan)、英丙舒凡(improsulfan)和哌酰硫烷(piposulfan)；氮丙啶，如benzodopa、卡波醌(carboquone)、meturedopa和uredopa；氮丙啶和methylamelamine，包括六甲蜜胺(altretamine)、三亚胺嗪(triethylenemelamine)、三亚乙基磷酰胺、三亚乙基硫代磷酰胺和trimethylolomelamine；多聚乙酰(acetogenin)(尤其是番荔枝内酯(bullatacin)和布拉它辛酮(bullatacinone))；δ-9-四氢大麻酚(屈大麻酚(dronabinol)，)；β-拉帕醌(beta-lapachone)；拉帕醇(lapachol)；秋水仙碱；桦木酸；喜树碱(包括合成类似物拓扑替康(topotecan)CPT-11(伊立替康(irinotecan)，)、乙酰喜树碱、莨菪亭(scopolectin)和9-氨基喜树碱)；苔藓抑素(bryostatin)；callystatin；CC-1065(包括其阿多来新(adozelesin)、卡折来新(carzelesin)和比折来新(bizelesin)合成类似物)；鬼臼毒素；鬼臼酸；替尼泊苷(teniposide)；cryptophycin(尤其是cryptophycin 1和cryptophycin 8)；多拉司他汀(dolastatin)；duocarmycin(包括合成类似物KW-2189和CB1-TM1)；eleutherobin；pancratistatin；sarcodictyin；spongistatin；氮芥，如苯丁酸氮芥、萘氮芥(chlornaphazine)、氯磷酰胺(chlorophosphamide)、磷雌氮芥(estramustine)、异环磷酰胺(ifosfamide)、氮芥(mechlorethamine)、盐酸氧氮芥(mechlorethamine oxidehydrochloride)、苯丙氨酸氮芥、新氮芥(novembichin)、胆固醇对苯乙酸氮芥(phenesterine)、松龙苯芥(prednimustine)、氯乙环磷酰胺(trofosfamide)、尿嘧啶氮芥(uracil mustard)；亚硝脲(nitrosourea)，如卡莫司汀(carmustine)、氯脲菌素(chlorozotocin)、福莫司汀(fotemustine)、洛莫司汀(lomustine)、尼莫司汀(nimustine)和雷莫司汀(ranimnustine)；抗生素，如enediyne antibiotics(例如棘孢霉素，尤其是棘孢霉素γ1I和棘孢霉素ΩI1(见例如Nicolaou等,Angew.Chem Intl.Ed.Engl.,33:183-186(1994))；CDP323，口服α-4整联蛋白抑制剂；蒽环类抗生素(dynemicin)，包括蒽环类抗生素A；esperamicin；以及新制癌菌素色基和相关色蛋白enediyne抗生素色基)、阿克拉霉素(aclacinomycin)、放线菌素、authramycin、重氮丝氨酸(azaserine)、博来霉素、放线菌素C、carabicin、洋红霉素、嗜癌素(carzinophilin)、色霉素(chromomycin)、更生霉素(dactinomycin)、柔红霉素、地托比星(detorubicin)、6-重氮-5-氧代-L-正亮氨酸、多柔比星(包括吗啉基-多柔比星、氰基吗啉基-多柔比星、2-吡咯啉基-多柔比星、盐酸多柔比星脂质体注射液脂质体多柔比星TLC D-9聚乙二醇化脂质体多柔比星和脱氧多柔比星)、表柔比星(epirubicin)、依索比星(esorubicin)、伊达比星(idarubicin)、麻西罗霉素(marcellomycin)、丝裂霉素(如丝裂霉素C)、霉酚酸、诺加霉素(nogalamycin)、橄榄霉素(olivomycin)、派来霉素(peplomycin)、泊非霉素(porfiromycin)、嘌呤霉素(puromycin)、三铁阿霉素(quelamycin)、罗多比星(rodorubicin)、链黑菌素(streptonigrin)、链唑霉素(streptozocin)、杀结核菌素(tubercidin)、乌苯美司(ubenimex)、新制癌菌素(zinostatin)、佐柔比星(zorubicin)；抗代谢剂，如氨甲喋呤、吉西他滨(gemcitabine)替加氟(tegafur)卡培他滨(capecitabine)埃坡霉素(epothilone)和5-氟尿嘧啶(5-FU)；叶酸类似物，如二甲叶酸(denopterin)、氨甲喋呤、蝶酰三谷氨酸(pteropterin)、三甲曲沙(trimetrexate)；嘌呤类似物，如氟达拉滨(fludarabine)、6-巯基嘌呤、硫咪嘌呤(thiamiprine)、硫鸟嘌呤(thioguanine)；嘧啶类似物，如盐酸环胞苷(ancitabine)、氮杂胞苷(azacitidine)、6-氮尿苷(6-azauridine)、卡莫氟(carmofur)、阿糖胞苷(cytarabine)、双脱氧尿苷(dideoxyuridine)、去氧氟脲苷(doxifluridine)、依诺他宾(enocitabine)、去氧氟脲苷(floxuridine)；雄激素，如卡普睾酮(calusterone)、丙酸甲雄烷酮(dromostanolone propionate)、环硫雄醇(epitiostanol)、美雄烷(mepitiostane)、睾内酯(testolactone)；抗肾上腺素(anti-adrenal)，如氨鲁米特(aminoglutethimide)、米托坦(mitotane)、曲洛司坦(trilostane)；叶酸补充剂，如frolinic acid；醋葡内酯(aceglatone)；醛磷酰胺糖苷；氨基乙酰丙酸；恩尿嘧啶(eniluracil)；安吖啶(amsacrine)；bestrabucil；比生群(bisantrene)；依达曲沙(edatraxate)；地磷酰胺(defofamine)；秋水仙胺(demecolcine)；地吖醌(diaziquone)；elfornithine；醋酸羟吡咔唑(elliptiniumacetate)；epothilone；乙环氧啶(etoglucid)；硝酸镓；羟基脲；香菇多糖；氯尼达明(lonidainine)；美登木素生物碱，如美登素和美登木素柄型菌素；米托胍腙(mitoguazone)；米托蒽醌(mitoxantrone)；mopidanmol；nitraerine；喷司他丁(pentostatin)；蛋氨氮芥(phenamet)；吡柔比星(pirarubicin)；洛索蒽醌(losoxantrone)；2-ethylhydrazide；甲基苄肼(procarbazine)；多糖复合物(JHS Natural Products,Eugene,OR)；丙亚胺(razoxane)；根霉素(rhizoxin)；西佐喃(sizofiran)；螺旋锗(spirogermanium)；细格孢氮杂酸(tenuazonic acid)；三亚胺醌(triaziquone)；2,2’,2”-三氯三乙胺；单端孢霉烯(trichothecene)(尤其是T-2毒素、verracurin A、杆孢菌素(roridin)A和anguidine)；乌拉坦(urethan)；长春碱酰胺(vindesine)达卡巴嗪(dacarbazine)；甘露莫司汀(mannomustine)；二溴甘露醇(mitobronitol)；二溴卫矛醇(mitolactol)；溴丙哌嗪(pipobroman)；gacytosine；阿糖胞苷(arabinoside)(“Ara-C”)；噻替派(thiotepa)；taxoid，例如紫杉醇(paclitaxel)紫杉醇的清蛋白改造纳米颗粒制剂(ABRAXANE^TM)和doxetaxelchloranbucil；6-硫鸟嘌呤；巯基嘌呤；氨甲喋呤；铂药剂，如顺铂、奥沙利铂(oxaliplatin)(例如)和卡铂；vincas，其阻止微管蛋白聚合形成微管，包括长春灭瘟碱长春花新碱长春碱酰胺和长春瑞滨(vinorelbine)依托泊苷(VP-16)；异环磷酰胺；米托蒽醌；亚叶酸(leucovorin)；诺消灵(novantrone)；依达曲沙(edatrexate)；柔红霉素；氨基喋呤；伊班磷酸盐(ibandronate)；拓扑异构酶抑制剂RFS 2000；二氟甲基鸟氨酸(DMFO)；类视黄醇，如视黄酸，包括贝沙罗汀二膦酸盐，如氯膦酸二钠(例如，或)、依替膦酸钠(etidronate)NE-58095、唑来膦酸(zoledronic acid)/唑来膦酸盐(zoledronate)阿仑膦酸钠(alendronate)氨羟二磷酸二钠(pamidronate)替鲁膦酸钠(tiludronate)或利塞膦酸钠(risedronate)曲沙他滨(troxacitabine)(1,3-二氧戊环核苷胞嘧啶类似物)；反义寡核苷酸，尤其是抑制涉及异常细胞增殖的信号传导途径中的基因(例如PKC-α、Raf、H-Ras和表皮生长因子受体(EGF-R))的表达的那些；疫苗，如疫苗和基因疗法疫苗，例如疫苗、疫苗和疫苗；拓扑异构酶1抑制剂(例如)；rmRH(例如)；BAY439006(索拉非尼(sorafenib)；Bayer)；SU-11248(舒尼替尼(sunitinib)，Pfizer)；哌立福新(perifosine)，COX-2抑制剂(例如塞来昔布或etoricoxib)，蛋白体抑制剂(例如PS341)；波替单抗(bortezomib)CCI-779；tipifarnib(R11577)；orafenib，ABT510；Bcl-2抑制剂，如oblimersen钠盐匹克生琼(pixantrone)；EGFR抑制剂(见下文定义)；酪氨酸激酶抑制剂(见下文定义)；丝氨酸-苏氨酸激酶抑制剂，如雷帕霉素(西罗莫司(sirolimus)，)；法尼基转移酶抑制剂，如lonafarnib(SCH 6636，SARASARTM)；以上任一种的可药用盐、酸或衍生物；以及以上两种或多种的组合，如CHOP(环磷酰胺、多柔比星、长春花新碱和强的松龙的联合治疗的缩写)和FOLFOX(奥沙利铂(ELOXATIN^TM)与5-FU和亚叶酸组合的治疗方案的缩写)。

本文定义的化疗剂包括“抗激素剂”或“内分泌治疗剂”，其发挥作用来调节、减少、阻断或抑制可促进癌症生长的激素的作用。它们本身可以是激素，包括但不限于：具有混合的激动剂/拮抗剂谱的抗雌激素，包括他莫昔芬(tamoxifen)4-羟基他莫昔芬(4-hydroxytamoxifen)、托瑞米芬(toremifene)艾多昔芬(idoxifene)、屈洛昔芬(droloxifene)、雷洛昔芬(raloxifene)曲沃昔芬(trioxifene)、盐酸雷洛昔芬(keoxifene)和选择性雌激素受体调节剂(SERM)，如SERM3；无激动剂特性的纯抗雌激素，如fulvestrant和EM800(这类药剂可以阻断雌激素受体(ER)二聚化，抑制DNA结合，增加ER翻转，和/或抑制ER水平)；芳香酶抑制剂，包括类固醇芳香酶抑制剂，如福美坦(formestane)和依西美坦(exemestane)及非类固醇芳香酶抑制剂，如阿那曲唑(anastrazole)来曲唑(letrozole)和氨鲁米特(aminoglutethimide)，及其他芳香酶抑制剂，包括伏氯唑(vorozole)醋酸甲地孕酮(megestrolacetate)法倔唑(fadrozole)和4(5)-咪唑；促黄体激素释放激素激动剂，包括醋酸亮丙瑞林(leuprolide)(和)、戈舍瑞林(goserelin)、布舍瑞林(buserelin)和tripterelin；性类固醇，包括progestine，如醋酸甲地孕酮和醋酸甲羟孕酮(medroxyprogesteroneacetate)，雌激素，如己烯雌酚(diethylstilbestrol)和马雌激素(premarin)，及雄激素/类视黄醇，如氟羟甲睾酮(fluoxymesterone)、全反式维甲酸和芬维A胺(fenretinide)；奥那司酮(onapristone)；抗孕酮；雌激素受体下调剂(ERD)；抗雄激素，如氟他胺(flutamide)、尼鲁米特(nilutamide)和比卡米特(bicalutamide)；及以上任一种的可要用盐、酸或衍生物；以及以上两种或多种的组合。

本申请中所用的术语“前体药物”指药物活性物质的前体或衍生形式，与亲本药物相比，其对肿瘤细胞的细胞毒性较低，且能够通过酶激活或转化为更具活性的亲本形式。见例如Wilman,“Prodrugs in CancerChemotherapy”Biochemical Society Transactions,14,375-382页,615thMeeting Belfast(1986)；和Stella等,“Prodrugs:A Chemical Approach toTargeted Drug Delivery,”Directed Drug Delivery,Borchardt等,(编辑),247-267页,Humana Press(1985)。本发明的前体药物包括但不限于：包含磷酸的前体药物、包含硫代磷酸的前体药物、包含硫酸的前体药物、包含肽的前体药物、D-氨基酸修饰的药物、糖基化的前体药物、包含β-内酰胺的前体药物、包含可选地取代的苯氧乙酰胺的前体药物或包含可选地取代的苯乙酰胺的前体药物、5-氟胞嘧啶及可以转化为更具活性的细胞毒性游离药物的其他5-氟胞嘧啶前体药物。可以衍生为用于本发明的前体药物形式的细胞毒性药物的实例包括但不限于上文所述的那些化疗剂。

在本文中使用时，“生长抑制剂”指抑制细胞生长的化合物或组合物。生长抑制剂的实例包括阻断细胞周期进程(在S期以外的地方)的药剂，如诱导G1阻滞和M期阻滞的药剂。经典的M期阻断剂包括长春碱(例如长春花新碱和长春灭瘟碱)、紫杉烷(taxane)及诸如多柔比星、表柔比星、柔红霉素、依托泊苷和博来霉素的拓扑异构酶II抑制剂。阻滞G1的那些药剂也涉及S期阻滞，例如DNA烷化剂，如他莫昔芬、强的松、达卡巴嗪、氮芥、顺铂、氨甲喋呤、5-氟尿嘧啶和阿糖胞苷。其他信息可以见于The Molecular Basis of Cancer,Mendelsohn和Israel,编辑,第1章,标题"Cell cycle regulation,oncogenes,and antineoplastic drugs"by Murakami等(WB Saunders:Philadelphia,1995),尤其是第13页。紫杉烷(紫杉醇和紫杉萜(docetaxel))二者都是衍生自紫杉的抗癌药物。衍生自欧洲紫杉的紫杉萜(Rhone-Poulenc Rorer)是紫杉醇(Bristol-Myers Squibb)的半合成类似物。紫杉醇和紫杉萜促进从微管蛋白二聚体组装微管，并通过阻止解聚来稳定微管，这导致细胞有丝分裂的抑制。

“放射疗法”意指用定向的γ射线或β射线来诱导对细胞的足够损伤，以限制其正常执行功能的能力或完全破坏细胞。应理解，将存在本领域已知的许多方式来确定处理的剂量和持续时间。典型的处理作为一次性施用提供，典型的剂量在每天10至200单位(Gray)范围内。

药剂(例如药物制剂)的“有效量”指对在必要的剂量和时间下达到希望的治疗或预防结果有效的量。本发明的物质/分子、激动剂或拮抗剂的“治疗有效量”可以根据诸如个体的疾病状态、年龄、性别和体重、物质/分子、激动剂或拮抗剂在个体中引出希望的反应的能力的因素而变。治疗有效量还是这样的量，其中物质/分子、激动剂或拮抗剂的治疗有益作用超过了任意毒性作用或有害作用。“预防有效量”指对在必要的剂量和时间下达到希望的预防结果有效的量。通常但并非必然，由于预防性剂量是在疾病之前或疾病的早期阶段用于个体，预防有效量将低于治疗有效量。

术语“药物制剂”指这样的制剂，其处于这样的形式，使得允许包含在其中的活性成分的生物学活性有效，且其不包含对将施用该制剂的个体具有不可接受的毒性的附加成分。

“可药用载体”指药物制剂中除活性成分外的成分，其对个体无毒性。可药用载体的实例包括但不限于缓冲剂、赋形剂、稳定剂或防腐剂。

“个体”或“受试者”是哺乳动物。哺乳动物包括但不限于家养动物(例如牛、绵羊、猫、狗和马)、灵长类(例如人类和非人灵长类，如猴)、兔和啮齿类(例如小鼠和大鼠)。在某些实施方案中，该个体或受试者是人。

用术语“包装说明书”来指通常包含在治疗性产品的商业包装中的说明，其包含关于适应症、用途、剂量、施用、组合疗法、禁忌症的信息和/或关于这类治疗性产品的用途的警告。

如本领域技术人员所理解，本文提到“约”某个值或参数包括(和描述)指向该值或参数本身的实施方案。例如，提到“约X”的描述包括“X”的描述。

应理解，本文所述的本发明的方面和实施方案包括“由方面和实施方案组成”和/或“基本由方面和实施方案组成”。除非另有说明，本文所用的单数形式“一”、“一个”和“该”包括复数指代物。

III.本发明的组合物

本文提供相对于野生型遍在蛋白的氨基酸序列具有一个或多个氨基酸取代的构象稳定的遍在蛋白。在一些方面，与野生型遍在蛋白与遍在蛋白加工酶的结合亲和力相比，该构象稳定的遍在蛋白显示提高的与一种或多种遍在蛋白加工酶(如但不限于遍在蛋白特异性蛋白酶(USP)家族脱遍在蛋白酶的一个或多个成员)的结合亲和力。在一些方面，如通过NMR R₂分散所测量，与野生型遍在蛋白中β1/β2环区的动态相比，该构象稳定的遍在蛋白的此区域显示更慢的构象动态。本文还提供编码该构象稳定的遍在蛋白的核酸，用于表达和分离该构象稳定的遍在蛋白的载体和细胞，以及包含构象稳定的遍在蛋白和以高亲和力结合遍在蛋白的特定构象形式的结合配偶体的蛋白复合物。

A.构象稳定的遍在蛋白

在一些方面，本文所述的构象稳定的遍在蛋白以纳摩尔范围内的Kd与结合配偶体(例如USP家族脱遍在蛋白酶)结合。在一些方面，该构象稳定的遍在蛋白以比野生型蛋白质的亲和力高至少1000倍的亲和力与结合配偶体(例如USP家族脱遍在蛋白酶，如USP7)结合。在一些方面，该构象稳定的遍在蛋白抑制一种或多种遍在蛋白加工酶或脱遍在蛋白酶的活性。在一些方面，与野生型蛋白质的结合相比，该构象稳定的遍在蛋白显示与结合配偶体(例如UCH家族脱遍在蛋白酶的成员)无结合或具有减少的结合。

在一些实施方案中，本文公开的构象稳定的遍在蛋白与结合配偶体(例如USP家族脱遍在蛋白酶)具有通过Kd测定的小于约1.0mM、500μM、100μM、50μM、25μM、10μM、5μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、150nM、100nM、90nM、80nM、70nM、60nM、50nM、45nM、40nM、35nM、30nM、25nM、20nM、15nM、10nM、5nM或1nM(包含，包括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中，该结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，该结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一些实施方案中，通过本领域已知的任意方法(尤其是本文所述的方法)来测定结合亲和力。

在一些方面，与结合配偶体与野生型遍在蛋白的结合相比，本文公开的构象稳定的遍在蛋白以更高的亲和力与结合配偶体结合。在一些方面，与结合配偶体与野生型遍在蛋白的结合相比，构象稳定的遍在蛋白以高至少10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000或10,000(包含，包括这些数字之间的任意值)倍中任一个的亲和力与结合配偶体结合。在一些实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一个实施方案中，结合配偶体是USP7。在一些实施方案中，通过本领域已知的任意方法(尤其是本文所述的方法)来测定结合倍数亲和力。

在一些方面，与野生型蛋白质的结合相比，本文提供的构象稳定的遍在蛋白显示与结合配偶体无结合或具有减少的结合。在一些实施方案中，与结合配偶体与野生型遍在蛋白的结合相比，构象稳定的遍在蛋白以减少至少10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000或10,000(包含，包括这些数字之间的任意值)倍中任一个的亲和力与结合配偶体结合。在一些实施方案中，与结合配偶体与野生型遍在蛋白的结合相比，构象稳定的遍在蛋白以低至少5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中任一个的亲和力与结合配偶体结合。在一些实施方案中，构象稳定的遍在蛋白不与结合配偶体结合。在一些实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是UCH家族脱遍在蛋白酶的成员。在一些实施方案中，与野生型遍在蛋白相比，本文提供的构象稳定的遍在蛋白显示与UCH家族脱遍在蛋白酶的成员无结合或具有减少的结合，同时显示增加的与USP家族脱遍在蛋白酶的成员的结合。在一些实施方案中，通过本领域已知的任意方法(尤其是本文所述的方法)来测定通过Kd测定的结合亲和力。

在另一方面，本文提供的构象稳定的遍在蛋白抑制(例如完全抑制)一种或多种遍在蛋白加工酶或一种或多种脱遍在蛋白酶的活性。在一些实施方案中，与野生型遍在蛋白引起的这些酶的抑制相比，构象稳定的遍在蛋白使一种或多种遍在蛋白加工酶(如但不限于E1、E2或E3遍在蛋白加工酶)或一种或多种脱遍在蛋白酶的活性抑制约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中的任一个。在一些实施方案中，构象稳定的遍在蛋白不能掺入多聚遍在蛋白链或单遍在蛋白化靶蛋白。在一些实施方案中，构象稳定的遍在蛋白能够掺入多聚遍在蛋白链或单遍在蛋白化靶蛋白。在一些实施方案中，构象稳定的遍在蛋白能够掺入多聚遍在蛋白链，但与野生型遍在蛋白掺入多聚遍在蛋白链相比，以低约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中任一个的效率掺入。

在本文公开的构象稳定的遍在蛋白中任一个的一些方面，一个或多个氨基酸取代稳定化蛋白质的β1/β2环，使得β1/β2环的构象动态相对于野生型遍在蛋白中此区域的运动减慢。在一些实施方案中，与野生型遍在蛋白中此区域所显示构象动态相比，构象稳定的遍在蛋白中的β1/β2环区显示慢约10％、20％、30％、40％、50％、60％、70％、80％、90％或100％(包含，包括这些值之间的任意百分比)中任一个的构象动态。在一些实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约0.5至(包括约0.7至1.0至1.3至1.6至)均方根偏差(RMSD)内的区域。在一个实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约RMSD内的区域。在一些实施方案中，与野生型遍在蛋白相比，本文公开的任意构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中的任一个。在具体实施方案中，与野生型遍在蛋白相比，本文公开的任意构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约40倍。在一些实施方案中，通过本领域已知的任意方法(尤其是本文所述的方法)来测定本文公开的遍在蛋白变体的β1/β2环区较慢的构象动态的程度。在一个实施方案中，该方法是NMR R₂分散。

本文提供构象稳定的遍在蛋白。在一些方面，本文公开的构象稳定的遍在蛋白在遍在蛋白的三级结构内部具有一个或多个氨基酸取代，其稳定化该蛋白质为特定的构象状态。

在一些实施方案中，构象稳定的遍在蛋白在选自A7、A8、A13、A34、A36、A69和A71的氨基酸残基处包含一个或多个取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，构象稳定的遍在蛋白与结合配偶体具有通过Kd测定的小于约1.0mM、500μM、100μM、50μM、25μM、10μM、5μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、150nM、100nM、90nM、80nM、70nM、60nM、50nM、45nM、40nM、35nM、30nM、25nM、20nM、15nM、10nM、5nM或1nM(包含，包括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中，与野生型遍在蛋白引起的这些酶的抑制相比，构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体的活性抑制约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中的任一个。在一些实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中，构象稳定的遍在蛋白与USP14结合但不能与USP7结合。在一个实施方案中，结合配偶体是USP7。在一个实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中的任一个。在具体实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约40倍。在一些实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约0.5至(包括约0.7至1.0至1.3至1.6至)RMSD内的区域。在一个实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约RMSD内的区域。在一些实施方案中，取代导致在遍在蛋白中形成一个或多个二硫键。在另一实施方案中，取代未导致在遍在蛋白中形成一个或多个二硫键。

在一些方面，构象稳定的遍在蛋白在选自A7(C)、A8(C)和A69(C)的氨基酸残基处包含一个或多个取代，其中氨基酸残基位置是相对于SEQID NO:1。在具体实施方案中，蛋白质包含A7(C)或A8(C)和A69(C)。在一些实施方案中，构象稳定的遍在蛋白在A13处具有进一步的取代。在一个实施方案中，A13处的取代是取代为极性氨基酸残基。在另一实施方案中，蛋白质包含A13(R、N、D、C、E、Q、H、K、S、T或Y)。在一些实施方案中，蛋白质包含A13(N、R、G、K、Y、A、S或H)。还在另一实施方案中，构象稳定的遍在蛋白在A71处具有进一步的取代。在一个实施方案中，A71处的取代是取代为碱性氨基酸。在另一实施方案中，蛋白质包含A71(R、K或H)。在一些实施方案中，蛋白质包含A13(R或K)。在另一实施方案中，构象稳定的遍在蛋白在A13处和A71处都具有进一步的取代，其中A13处的取代是取代为极性氨基酸残基，而A71处的取代是取代为碱性氨基酸。在一些实施方案中，蛋白质包含A13(R、N、D、C、E、Q、H、K、S、T或Y)和A71(R、K或H)。在另一实施方案中，蛋白质包含A13(N、R、G、K、Y、A、S或H)和A71(R或K)。在另一实施方案中，蛋白质包含A7(C)、A8(C)或A69(C)，且可以在A36(Y、F、L或H)、A34(I、F、L或V)、A13(N、R、G、K、Y、A、S或H)或A71(R或K)中的一处或多处具有附加的取代。在一些实施方案中，构象稳定的遍在蛋白与结合配偶体具有通过Kd测定的小于约1.0mM、500μM、100μM、50μM、25μM、10μM、5μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、150nM、100nM、90nM、80nM、70nM、60nM、50nM、45nM、40nM、35nM、30nM、25nM、20nM、15nM、10nM、5nM或1nM(包含，包括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中，与野生型遍在蛋白引起的这些酶的抑制相比，构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体的活性抑制约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中的任一个。在一些实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中，构象稳定的遍在蛋白与USP14结合但不能与USP7结合。在一个实施方案中，结合配偶体是USP7。在一个实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中的任一个。在具体实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约40倍。在一些实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约0.5至(包括约0.7至1.0至1.3至1.6至)RMSD内的区域。在一个实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约RMSD内的区域。在一些实施方案中，取代导致在遍在蛋白中形成一个或多个二硫键。

在一些方面，构象稳定的遍在蛋白在氨基酸残基A71处包含取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，蛋白质包含A71(R、K、A、Q、G、W、H、I或R)。在一些实施方案中，蛋白质包含A71(R)。在一些实施方案中，蛋白质包含A71(K)。在一些实施方案中，蛋白质包含A71(W)。在一些实施方案中，蛋白质包含A71(G)。在一些实施方案中，在A71处具有取代的蛋白质可以在A69(C、G、A、W、K、Y、V、F或I)、A36(Y、F、L、H、A、V、W、I、M或N)、A34(I、F、L、V、S、M或T)、A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M或P)、A8(T、C、D、R、G、C、T、A、Q、F、L或Y)和/或A7(C、N、F、S、R、G、V或D)中的一处或多处具有附加的取代。在一些实施方案中，构象稳定的遍在蛋白与结合配偶体具有通过Kd测定的小于约1.0mM、500μM、100μM、50μM、25μM、10μM、5μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、150nM、100nM、90nM、80nM、70nM、60nM、50nM、45nM、40nM、35nM、30nM、25nM、20nM、15nM、10nM、5nM或1nM(包含，包括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中，与野生型遍在蛋白引起的这些酶的抑制相比，构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体的活性抑制约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中的任一个。在一些实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一个实施方案中，结合配偶体是USP7。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中，构象稳定的遍在蛋白与USP14结合但不能与USP7结合。在一些实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中的任一个。在具体实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约40倍。在一些实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约0.5至(包括约0.7至 1.0至1.3至1.6至)RMSD内的区域。在一个实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约RMSD内的区域。

在一些方面，构象稳定的遍在蛋白在氨基酸残基A34处包含取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，A34处的取代是取代为疏水性氨基酸。在一些实施方案中，蛋白质包含A34(A、V、I、L、M、F、Y或W)。在一些实施方案中，蛋白质包含A34(I、F、L、V、T、S、M或T)。在一些实施方案中，在A34处具有取代的蛋白质可以在A71(R、K、A、Q、W、G、H、I、R或G)、A69(C、G、A、W、K、Y、V、F或I)、A36(Y、F、L、H、A、W、I、M或N)、A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M或P)、A8(T、C、D、R、G、C、T、A、Q、F、L或Y)和/或A7(C、N、F、S、R、G、V或D)中的一处或多处具有附加的取代。在一些实施方案中，构象稳定的遍在蛋白与结合配偶体具有通过Kd测定的小于约1.0mM、500μM、100μM、50μM、25μM、10μM、5μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、150nM、100nM、90nM、80nM、70nM、60nM、50nM、45nM、40nM、35nM、30nM、25nM、20nM、15nM、10nM、5nM或1nM(包含，包括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中，与野生型遍在蛋白引起的这些酶的抑制相比，构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体的活性抑制约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中的任一个。在一些实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一个实施方案中，结合配偶体是USP7。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中，构象稳定的遍在蛋白与USP14结合但不能与USP7结合。在一些实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中的任一个。在具体实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约40倍。在一些实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约0.5至(包括约0.7至1.0至1.3至1.6至)RMSD内的区域。在一个实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约RMSD内的区域。

在一些方面，构象稳定的遍在蛋白在氨基酸残基A7处包含取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一个实施方案中，蛋白质包含A7(C、N、F、S、D、F、R、G或V)。在一些实施方案中，蛋白质包含A7(G)。在一些实施方案中，在A7处具有取代的蛋白质可以在A71(R、K、A、Q、W、G、H、I、R或G)、A69(C、G、A、W、K、Y、V、F或I)、A34(I、F、L、V、S、M或T)、A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M或P)、A8(T、C、D、R、G、C、T、A、Q、F、L或Y)和/或A36(Y、F、L、H、I、A或N)中的一处或多处具有附加的取代。在一些实施方案中，构象稳定的遍在蛋白与结合配偶体具有通过Kd测定的小于约1.0mM、500μM、100μM、50μM、25μM、10μM、5μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、150nM、100nM、90nM、80nM、70nM、60nM、50nM、45nM、40nM、35nM、30nM、25nM、20nM、15nM、10nM、5nM或1nM(包含，包括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中，与野生型遍在蛋白引起的这些酶的抑制相比，构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体的活性抑制约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中的任一个。在一些实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一个实施方案中，结合配偶体是USP7。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中，构象稳定的遍在蛋白与USP14结合但不能与USP7结合。在一些实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中的任一个。在具体实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约40倍。在一些实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约0.5至(包括约0.7至1.0至1.3至1.6至)RMSD内的区域。在一个实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约RMSD内的区域。

在一些方面，构象稳定的遍在蛋白在氨基酸残基A36处包含取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，A36处的取代是取代为芳族氨基酸。在一个实施方案中，蛋白质包含A36(W或Y)。在另一实施方案中，蛋白质包含A36(L、F、W、M、Y、H、I、A或N)。在一些实施方案中，在A36处具有取代的蛋白质可以在A71(R、K、A、Q、W、G、H、I、R或G)、A69(C、G、A、W、K、Y、V、F或I)、A34(I、F、L、V、S、M或T)、A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M或P)、A8(T、C、D、R、G、C、T、A、Q、F、L或Y)和/或A7(C、N、F、S、R、G、V或D)中的一处或多处具有附加的取代。在一些实施方案中，构象稳定的遍在蛋白与结合配偶体具有通过Kd测定的小于约1.0mM、500μM、100μM、50μM、25μM、10μM、5μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、150nM、100nM、90nM、80nM、70nM、60nM、50nM、45nM、40nM、35nM、30nM、25nM、20nM、15nM、10nM、5nM或1nM(包含，包括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中，与野生型遍在蛋白引起的这些酶的抑制相比，构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体的活性抑制约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中的任一个。在一些实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一个实施方案中，结合配偶体是USP7。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中，构象稳定的遍在蛋白与USP14结合但不能与USP7结合。在一些实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中的任一个。在具体实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约40倍。在一些实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约0.5至(包括约0.7至1.0至1.3至1.6至)RMSD内的区域。在一个实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约RMSD内的区域。

在一些实施方案中，构象稳定的遍在蛋白在氨基酸残基A7或A8处及A69和A71处包含取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，蛋白质包含A7(C)或A8(C)和A69(C)，且A71处的取代是取代为碱性氨基酸。在一个实施方案中，蛋白质包含A7(C)、A71(R或K)和A8(T、D、R、G、C、T、A、Q、F、L或Y)。在另一实施方案中，蛋白质包含A8(C)、A71(R或K)和A7(N、F、S、R、G、V或D)。在一些实施方案中，构象稳定的遍在蛋白进一步在A34(I、F、L、V、S、M或T)、A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M或P)和/或A36(Y、F、L、H、I、A或N)中的任意处包含一个或多个取代。

在一些方面，构象稳定的遍在蛋白在氨基酸残基A7或A8处以及A69和A34处包含取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，蛋白质包含A7(C)或A8(C)、A69(C)和A34(I)。在一个实施方案中，蛋白质包含A7(C)和A8(T、D、R、G、C、T、A、Q、F、L或Y)。在另一实施方案中，蛋白质包含A8(C)和A7(N、F、S、R、G、V或D)。在一些实施方案中，构象稳定的遍在蛋白进一步在A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M或P)、A71(R、K、A、Q、W、G、H、I、R或G)和/或A36(Y、F、L、H、I、A或N)中的任意处包含一个或多个取代。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。

在一些方面，构象稳定的遍在蛋白在氨基酸残基A7或A8处以及A69、A34和A36处包含取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，蛋白质包含A7(C)或A8(C)、A69(C)、A34(I)，且A36处的取代是取代为芳族氨基酸。在一个实施方案中，蛋白质包含A7(C)、A36(F或Y)和A8(T、D、R、G、C、T、A、Q、F、L或Y)。在一个实施方案中，蛋白质包含A8(C)、A36(F或Y)和A7(N、F、S、R、G、V或D)。还在另一实施方案中，构象稳定的遍在蛋白进一步在A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M或P)和/或A71(R、K、A、Q、W、G、H、I、R或G)处包含一个或多个取代。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。

在一些方面，构象稳定的遍在蛋白在氨基酸残基A7、A13和A71处包含取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，蛋白质包含A7(F)、A13(Y)和A71(R)。在一些实施方案中，构象稳定的遍在蛋白进一步在A34(I、F、L、V、S、M或T)、A69(C、G、A、W、K、Y、V、F或I)、A8(T、C、D、R、G、C、T、A、Q、F、L或Y)和/或A36(Y、F、L、H、I、A或N)处包含一个或多个取代。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在另一实施方案中，构象稳定的遍在蛋白与USP14结合但不能与USP7结合。

在一些方面，构象稳定的遍在蛋白在氨基酸残基A7、A13、A34、A36和A71处包含取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，蛋白质包含A7(F)、A13(Y)、A71(R)、A34(I或L)和A36(I或L)。在一些实施方案中，蛋白质包含A34(L)和A36(I)。在一些实施方案中，蛋白质包含A34(I)和A36(L)。在一些实施方案中，构象稳定的遍在蛋白进一步在A69(C、G、A、W、K、Y、V、F或I)和/或A8(T、C、D、R、G、C、T、A、Q、F、L或Y)处包含一个或多个取代。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中，构象稳定的遍在蛋白与USP14结合但不能与USP7结合。

在一些方面，构象稳定的遍在蛋白在氨基酸残基A7、A13、A34、A36、A69和A71处包含取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，蛋白质包含A7(F)、A13(Y)、A71(R)、A34(I或L)、A36(I或L)和A69(G或W)。在一个实施方案中，蛋白质包含A69G)、A34(L)和A36(I)。在一些实施方案中，蛋白质包含A69(G)、A34(I)和A36(L)。在一个实施方案中，蛋白质包含A69(W)、A34(L)和A36(I)。在另一实施方案中，蛋白质包含A69(W)、A34(I)和A36(L)。在一些实施方案中，构象稳定的遍在蛋白进一步在A8(T、C、D、R、G、C、T、A、Q、F、L或Y)处包含取代。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中，构象稳定的遍在蛋白与USP14结合但不能与USP7结合。

在一些方面，构象稳定的遍在蛋白在氨基酸残基A7和A71处包含取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，蛋白质包含A7(G)和A71(W)。在一个实施方案中，蛋白质在A8处具有进一步的取代，取代为F或L。在一些实施方案中，蛋白质包含A8(F)。在另一实施方案中，蛋白质包含A8(L)。在一些实施方案中，构象稳定的遍在蛋白进一步在A34(I、F、L、V、S、M或T)、A69(C、G、A、W、K、Y、V、F或I)、A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M或P)和/或A36(Y、F、L、H、I、A或N)处包含一个或多个取代。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中，构象稳定的遍在蛋白与USP14结合但不能与USP7结合。

在一些方面，构象稳定的遍在蛋白包含选自氨基酸残基A7、A8、A13、A34、A36、A69和A71的一个或多个取代，其中氨基酸残基位置是相对于SEQ ID NO:1，且其中取代导致至少一个二硫键的形成。在一些方面，蛋白质包含A7(C)、A8(L)、A13(N)、A34(I)、A36(Y)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(C)、A8(T)、A13(R)、A34(I)、A36(F)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(N)、A8(C)、A13(G)、A34(F)、A36(Y)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(C)、A8(L)、A13(N)、A34(I)、A36(Y)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(C)、A8(D)、A13(K)、A34(I)、A36(L)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(C)、A8(D)、A13(K)、A34(I)、A36(F)、A69(C)和A71(K)。在一些方面，蛋白质包含A7(C)、A8(T)、A13(R)、A34(I)、A36(F)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(F)、A8(R)、A13(Y)、A34(L)、A36(I)、A69(G)和A71(R)。在一些方面，蛋白质包含A7(C)、A8(T)、A13(R)、A34(L)、A36(F)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(C)、A8(G)、A13(A)、A34(V)、A36(H)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(C)、A8(T)、A13(R)、A34(L)、A36(F)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(C)、A8(R)、A13(S)、A34(L)、A36(Y)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(C)、A8(L)、A13(N)、A34(I)、A36(Y)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(C)、A8(D)、A13(K)、A34(I)、A36(F)、A69(C)和A71(K)。在一些方面，蛋白质包含A7(C)、A8(R)、A13(S)、A34(L)、A36(Y)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(C)、A8(D)、A13(K)、A34(I)、A36(L)、A69(C)和A71(R)。在一些方面，蛋白质包含A7(S)、A8(C)、A13(H)、A34(I)、A36(Y)、A69(C)和A71(R)。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在一些方面，蛋白质包含表1中所示的任意克隆的取代。

表1.U7Ub二硫键克隆

在一些方面，构象稳定的遍在蛋白包含选自氨基酸残基A7、A8、A13、A34、A36、A69和A71的一个或多个取代，其中氨基酸残基位置是相对于SEQ ID NO:1，且其中取代未导致至少一个二硫键的形成。在一些方面，蛋白质包含A7(D)、A8(Y)、A13(R)、A34(L)、A36(I)、A69(A)和A71(A)。在一些方面，蛋白质包含A7(F)、A8(A)、A13(Y)、A34(L)、A36(I)、A69(G)和A71(R)。在一些方面，蛋白质包含A7(F)、A8(G)、A13(Y)、A34(I)、A36(L)、A69(W)和A71(R)。在一些方面，蛋白质包含A7(F)、A8(Q)、A13(Y)、A34(L)、A36(I)、A69(G)和A71(R)。在一些方面，蛋白质包含A7(F)、A8(R)、A13(Y)、A34(L)、A36(I)、A69(G)和A71(R)。在一些方面，蛋白质包含A7(R)、A8(Q)、A13(E)、A34(L)、A36(Y)、A69(K)和A71(Q)。在一些方面，蛋白质包含A7(R)、A8(R)、A13(P)、A34(T)、A36(A)、A69(Y)和A71(R)。在一些方面，蛋白质包含A7(S)、A8(Y)、A13(Y)、A34(I)、A36(N)、A69(I)和A71(G)。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中，与野生型遍在蛋白相比，构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在一些方面，蛋白质包含表2中所示的任意克隆的取代。

表2.U7Ub非二硫键克隆

在一些方面，构象稳定的遍在蛋白包含选自氨基酸残基A7、A8、A13、A34、A36、A69和A71的一个或多个取代，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些方面，蛋白质包含A7(G)、A8(L)、A13(T)、A34(T)、A36(L)、A69(I)和A71(W)。在一些方面，蛋白质包含A7(G)、A8(F)、A13(L)、A34(T)、A36(L)、A69(S)和A71(W)。在一些方面，蛋白质包含A7(G)、A8(L)、A13(V)、A34(V)、A36(L)、A69(I)和A71(W)。在一些方面，蛋白质包含A7(G)、A8(L)、A13(L)、A34(S)、A36(L)、A69(V)和A71(W)。在一些方面，蛋白质包含A7(G)、A8(F)、A13(L)、A34(T)、A36(W)、A69(Y)和A71(H)。在一些实施方案中，构象稳定的遍在蛋白与USP14结合但不能与USP7结合。在一些方面，蛋白质包含表3中所示的任意克隆的取代。

表3.U14Ub克隆

在一些方面，构象稳定的蛋白质包含任意U7Ub25、U7Ub7或U14Ub2克隆的取代。

在另一方面，本文所述的任意构象稳定的遍在蛋白可以进一步在蛋白质的表面上具有一个或多个增加其对一种或多种结合配偶体的亲和力的氨基酸取代。在一些实施方案中，构象稳定的蛋白质在A42、A46、A49、A62、A65、A68或A70处具有一个或多个表面氨基酸取代，其中氨基酸残基位置对应于SEQ ID NO:1的A1-A76。在一个实施方案中，构象稳定的遍在蛋白在A42(K、T或W)、A46(G或S)、A49(T、N、L或R)、A62(E)、A65(T或A)、A68(R)或A70(I)中的一处或多处具有表面氨基酸取代。在另一实施方案中，构象稳定的遍在蛋白在A42(W)、A49(R)和A68(R)处具有表面氨基酸取代。在一些方面，构象稳定的蛋白质包含克隆U7Ub25.2540的取代。在一些实施方案中，构象稳定的遍在蛋白与结合配偶体具有通过Kd测定的小于约1.0mM、500μM、100μM、50μM、25μM、10μM、5μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、150nM、100nM、90nM、80nM、70nM、60nM、50nM、45nM、40nM、35nM、30nM、25nM、20nM、15nM、10nM、5nM或1nM(包含，包括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中，与野生型遍在蛋白引起的这些酶的抑制相比，构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体的活性抑制约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中的任一个。在一些实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一个实施方案中，结合配偶体是USP7。在一些实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中的任一个。在具体实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约40倍。在一些实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约0.5至(包括约0.7至1.0至1.3至1.6至)RMSD内的区域。在一个实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约RMSD内的区域。在一些方面，蛋白质包含表4中所示的任意克隆的取代。

表4.表面残基取代

还在其他方面，本文所述的任意构象稳定的遍在蛋白可以进一步在蛋白质的C端区域的表面上具有一个或多个增加其对一种或多种结合配偶体的亲和力的氨基酸取代。在一些实施方案中，构象稳定的蛋白质在A40、A42、A46、A47、A49、A62、A65、A68、A70、A71、A72、A73、A74、A75或A76处具有一个或多个表面氨基酸取代，其中氨基酸残基位置对应于SEQ ID NO:1的A1-A76。在一个实施方案中，构象稳定的遍在蛋白在A42(M)、A46(L或N)、A49(V、Y、L或T)、A62(G或R)、A65(A)、A68(Q)、A70(R)、A72(W或H)、A73(A、R或K)、A74(S、V、G、Y或W)、A75(A、R、P、E、V、H或Y)或A76(R、S、V、A或L)中的一处或多处具有表面氨基酸取代。在另一实施方案中，构象稳定的遍在蛋白在A42(M)、A49(V)、A70(R)、A72(W)、A73(K)、A74(K)、A75(R)和A76(V)处具有表面氨基酸取代。在一些方面，构象稳定的蛋白质包含克隆Ub7.25.216的取代。在一些实施方案中，构象稳定的遍在蛋白与结合配偶体具有通过Kd测定的小于约1.0mM、500μM、100μM、50μM、25μM、10μM、5μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、150nM、100nM、90nM、80nM、70nM、60nM、50nM、45nM、40nM、35nM、30nM、25nM、20nM、15nM、10nM、5nM或1nM(包含，包括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中，与野生型遍在蛋白引起的这些酶的抑制相比，构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体的活性抑制约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中的任一个。在一些实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一个实施方案中，结合配偶体是USP7。在一些实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000(包含，包括这些值之间的任意数字)倍中的任一个。在具体实施方案中，如通过NMR R₂分散所测量，与野生型遍在蛋白相比，构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒R_ex值高至多约40倍。在一些实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约0.5至(包括约0.7至1.0至1.3至1.6至)RMSD内的区域。在一个实施方案中，构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约RMSD内的区域。在一些方面，蛋白质包含表5中所示的任意克隆的取代。

表5.C端区域表面残基取代

除本文公开的在构象上稳定化遍在蛋白的具体氨基酸残基取代外，遍在蛋白还可以包含并不特异性影响构象稳定性的附加突变。这些突变导致本文定义的遍在蛋白多肽与本文公开的任意天然序列遍在蛋白多肽具有至少约80％氨基酸序列同一性。这类遍在蛋白多肽变体包括，例如，其中在天然氨基酸序列的N-或C-端(如遍在蛋白C端二甘氨酸基序)添加或缺失了一个或多个氨基酸残基的遍在蛋白多肽。通常，遍在蛋白多肽变体将与本文公开的天然序列遍在蛋白多肽序列具有至少约80％氨基酸序列同一性，备选地，至少约81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％氨基酸序列同一性。可选地，与天然遍在蛋白多肽序列相比，遍在蛋白变体多肽将具有不超过一个保守氨基酸取代，备选地，与天然遍在蛋白多肽序列相比不超过2、3、4、5、6、7、8、9或10个保守氨基酸取代。

通常，本文所述的构象稳定的遍在蛋白变体包括已用其他氨基酸取代序列中特定位置处的残基的变体，且进一步包括在亲本蛋白质/肽的两个残基之间插入一个或多个附加残基的可能性，以及从亲本序列缺失一个或多个残基或向亲本序列添加一个或多个残基的可能性。本发明可以涵盖任意氨基酸取代、插入或缺失。在一些实施方案中，优选在保留和稳定化蛋白质的部分或全部构象时，取代是本文所述的保守取代。

在一些方面，本文所述的构象稳定的遍在蛋白包含一个或多个氨基酸残基的缺失。在一些实施方案中，蛋白质包含A75和A76的缺失，其中氨基酸残基位置是相对于SEQ ID NO:1。在一些实施方案中，构象稳定的遍在蛋白与USP7结合但不能与USP5结合。在另一实施方案中，构象稳定的遍在蛋白使USP7的酶促活性抑制约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中的任一个，但不抑制USP5的酶促活性。在一些方面，构象稳定的遍在蛋白包含克隆U7Ub25ΔΔGG的取代和缺失。

肽/多肽的保守取代显示在表6中的表头“优选的取代”之下。如果这类取代导致生物学活性的变化，则可以引入表6中称为“示例性取代”或下文中参考氨基酸种类进一步描述的更实质性的变化，并筛选产物。

表6.潜在的氨基酸取代

原残基	示例性取代	优选的取代
			Ala(A)	Val；Leu；Ile	Val
Arg(R)	Lys；Gln；Asn	Lys
			Asn(N)	Gln；His；Asp,Lys；Arg	Gln
Asp(D)	Glu；Asn	Glu
			Cys(C)	Ser；Ala	Ser
Gln(Q)	Asn；Glu	Asn
			Glu(E)	Asp；Gln	Asp
Gly(G)	Ala	Ala
			His(H)	Asn；Gln；Lys；Arg	Arg
Ile(I)	Leu；Val；Met；Ala；Phe；正亮氨酸	Leu
			Leu(L)	正亮氨酸；Ile；Val；Met；Ala；Phe	Ile
Lys(K)	Arg；Gln；Asn	Arg
			Met(M)	Leu；Phe；Ile	Leu
Phe(F)	Trp；Leu；Val；Ile；Ala；Tyr	Tyr
			Pro(P)	Ala	Ala
Ser(S)	Thr	Thr
			Thr(T)	Val；Ser	Ser
Trp(W)	Tyr；Phe	Tyr
			Tyr(Y)	Trp；Phe；Thr；Ser	Phe
Val(V)	Ile；Leu；Met；Phe；Ala；正亮氨酸	Leu

通过选择在其对维持(a)取代区域中的多肽主链的结构(例如折叠或螺旋构象)、(b)分子在靶位点处的电荷或疏水性或(c)侧链的体积的作用上显著不同的取代来实现肽/多肽的生物学特性的实质性修饰。非保守取代将需要将这些种类之一的成员换为另一种类。氨基酸可以按照共同的侧链特性分组：

(1)疏水性氨基酸：正亮氨酸、Met、Ala、Val、Leu、Ile；

(2)中性亲水性氨基酸：Cys、Ser、Thr、Asn、Gln；

(3)酸性氨基酸：Asp、Glu；

(4)碱性氨基酸：His、Lys、Arg；

(5)影响链取向的残基：Gly、Pro；

(6)芳族氨基酸：Trp、Tyr、Phe；

(7)大的疏水性氨基酸：正亮氨酸、Met、Val、Leu、Ile。

在其他实施方案中，本发明的肽或多肽可以包含一个或多个非天然存在的或修饰的氨基酸。“非天然存在的氨基酸残基”指除上文列出的那些天然存在的氨基酸残基之外的残基，其能够共价结合多肽链中邻近的一个或多个氨基酸残基。非天然氨基酸包括但不限于高赖氨酸、高精氨酸、高丝氨酸、氮杂环丁烷羧酸、2-氨基己二酸、3-氨基己二酸、β-丙氨酸、氨基丙酸、2-氨基丁酸、4-氨基丁酸、6-氨基己酸、2-氨基庚酸、2-氨基异丁酸、3-氨基异丁酸、2-氨基庚二酸、叔丁基甘氨酸、2,4-二氨基异丁酸、锁链素、2,2’-二氨基庚二酸、2,3-二氨基丙酸、N-乙基甘氨酸、N-乙基天冬酰胺、高脯氨酸、羟基赖氨酸、别羟基赖氨酸、3-羟脯氨酸、4-羟脯氨酸、异锁链素、别异亮氨酸、N-甲基丙氨酸、N-甲基甘氨酸、N-甲基异亮氨酸、N-甲基戊基甘氨酸、N-甲基缬氨酸、萘丙氨酸、正缬氨酸、正亮氨酸、鸟氨酸、瓜氨酸、戊基甘氨酸、六氢吡啶羧酸和硫代脯氨酸。修饰的氨基酸包括可逆或不可逆地化学封闭、或在其N端氨基或其侧链基团上修饰(例如N-甲基化的D和L氨基酸)、侧链官能团化学修饰为另一官能团的天然和非天然的氨基酸。例如，修饰的氨基酸包括蛋氨酸亚砜；蛋氨酸砜；天冬氨酸的修饰氨基酸天冬氨酸-(β-甲酯)；甘氨酸的修饰氨基酸N-乙基甘氨酸；或丙氨酸的修饰氨基酸丙氨酸羧酰胺。其他非天然的和修饰的氨基酸及将它们掺入蛋白质和肽的方法为本领域已知(见例如Sandberg等,(1998)J.Med.Chem.41:2481-91；Xie和Schultz(2005)Curr.Opin.Chem.Biol.9:548-554；Hodgson和Sanderson(2004)Chem.Soc.Rev.33:422-430)。

在本文所述的任意构象稳定的遍在蛋白的一些实施方案中，蛋白质可以是分离的。在本文所述的任意构象稳定的遍在蛋白的一些实施方案中，蛋白质是通过化学合成产生的合成蛋白质或多肽链。

在一些实施方案中，可以用标准蛋白质纯化技术通过适当的纯化方案从细胞分离本文所述的构象稳定的遍在蛋白。在另一实施方案中，通过重组DNA技术产生本文所述的构象稳定的遍在蛋白。作为重组表达的替代方法，可以用标准肽合成技术化学合成本文所述的构象稳定的遍在蛋白。

在一些实施方案中，本文所述的构象稳定的遍在蛋白是基本上分离的(如分离的)多肽。污染成分包括通常将干扰多肽的诊断或治疗用途的物质，且可以包括酶、激素及其他蛋白质或非蛋白质物质。认为具有优选少于约30wt％的不希望的污染物质(污染物)、优选少于约20％、约10％和优选少于约5％污染物的制剂是基本上分离的。分离的、重组产生的肽/多肽或其生物活性部分优选基本上不含培养基，即培养基代表肽/多肽制剂的体积的优选少于约20％、优选少于约10％和优选小于约5％。污染物的实例包括细胞碎片、培养基及在体外合成肽/多肽的过程中使用和产生的物质。

B.构象稳定的遍在蛋白融合物

本文还提供构象稳定的遍在蛋白融合物，其包含与载体缀合的本文所述的任意构象稳定的遍在蛋白。在任意构象稳定的遍在蛋白融合物的一些实施方案中，构象稳定的遍在蛋白所缀合的载体是生物可降解聚合物。可以使用生物可降解或生物相容性聚合物，如乙烯醋酸乙烯酯、聚酐、聚乙醇酸、聚原酸酯、聚乳酸、PEG、聚交酯、聚乙醇酸交酯、聚己酸内酯、糖类、多肽、胶原、淀粉、纤维素、壳多糖、木质素、及其共聚物。这类物质可以从ALZA Corporation(Mountain View,CA)和NOVAPharmaceuticals,Inc.(Lake Elsinore,CA)购得，或由本领域技术人员制备。脂质体悬液也可以用作可药用载体。这些可以按照本领域技术人员已知的方法制备，如在(Eppstein等,美国专利号4,522,811,1985)中。在一些实施方案中，该载体是多肽。在一些实施方案中，该多肽是白蛋白。在一些实施方案中，该多肽是Fc。在一些实施方案中，该载体是PEG。

在任意构象稳定的遍在蛋白融合物的一些实施方案中，载体缀合至构象稳定的遍在蛋白的C端。在任意构象稳定的遍在蛋白融合物的一些实施方案中，载体缀合至构象稳定的遍在蛋白的N端。

在任意构象稳定的遍在蛋白融合物的一些实施方案中，载体共价缀合至构象稳定的遍在蛋白。在任意构象稳定的遍在蛋白融合物的一些实施方案中，载体直接缀合至构象稳定的遍在蛋白。在任意构象稳定的遍在蛋白融合物的一些实施方案中，载体经接头序列共价缀合至构象稳定的遍在蛋白。在一些实施方案中，载体与构象稳定的遍在蛋白缀合为融合蛋白质。

在任意构象稳定的遍在蛋白融合物的一些实施方案中，与未缀合至载体的构象稳定的遍在蛋白相比，构象稳定的遍在蛋白与载体的缀合提高了构象稳定的遍在蛋白的半衰期和/或生物利用率。

C.蛋白复合物

本文还提供包含本文公开的任意构象稳定的遍在蛋白和结合配偶体的蛋白复合物。在一些实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一些实施方案中，蛋白复合物内的蛋白质以通过Kd测定的小于约1.0mM、500μM、100μM、50μM、25μM、10μM、5μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、150nM、100nM、90nM、80nM、70nM、60nM、50nM、45nM、40nM、35nM、30nM、25nM、20nM、15nM、10nM、5nM或1nM(包含，包括这些数字之间的任意值)中的约任一个的亲和力相互结合。在一些实施方案中，在结合配偶体是酶时，构象稳定的遍在蛋白和酶结合形成蛋白复合物选择性抑制(如完全抑制)酶的酶促活性。在另一实施方案中，在酶和构象稳定的遍在蛋白形成蛋白复合物时，构象稳定的遍在蛋白使酶的酶促活性减少约10％、20％、30％、40％、50％、60％、70％、80％、90％或100％(包含，包括这些值之间的任意百分比)中的任一个。

本文还提供包含与本文公开的任意构象稳定的遍在蛋白直接(例如，直接(例如，通过共价键)或间接)连接的蛋白质的遍在蛋白化蛋白复合物。在一些实施方案中，蛋白质是单遍在蛋白化的。在另一实施方案中，蛋白质在多个(如2、3、4、5、6、7、8、9或10或更多个)赖氨酸残基上多遍在蛋白化。在另一实施方案中，共价附着至蛋白质的构象稳定的遍在蛋白在任意(如任意1、2、3、4、5、6或7个)遍在蛋白的赖氨酸残基上形成多聚遍在蛋白链。在一些实施方案中，除本文公开的构象稳定的遍在蛋白外，多聚遍在蛋白链可以包含一个或多个野生型遍在蛋白。

在一些方面，可以用本领域已知的任意方法将任意构象稳定的遍在蛋白或蛋白复合物固定在固体支持物上。在另一方面，还可以将表达本文公开的任意构象稳定的遍在蛋白的细胞或细胞群体固定在固体支持物上。因此，本发明提供1)与本文公开的任意构象稳定的遍在蛋白偶联的固体支持物和2)与表达本文公开的任意构象稳定的遍在蛋白的细胞或细胞群体偶联的固体支持物。

本文还提供具有蛋白复合物的固体支持物，该蛋白复合物包含与USP家族脱遍在蛋白酶(如但不限于USP7)复合的构象稳定的遍在蛋白(如本文所述的任一种)。适宜的固体支持物的实例包括但不限于玻璃、塑料、金属、胶乳、橡胶、陶瓷、聚合物如聚丙烯、聚偏二氟乙烯、聚乙烯、聚苯乙烯、聚丙烯酰胺、葡聚糖、纤维素、硝酸纤维素、pvdf、尼龙、直链淀粉等。固体支持物可以是平的、凹的、或凸的、球形的、圆柱形的等，且可以是颗粒(如纳米颗粒)、球珠(如磁珠)、膜、链、沉淀、凝胶、片层、容器、孔、毛细管、膜、平板、载片等。固体支持物可以是有磁性的，或是柱。在一些实施方案中，固体支持物适合用于传导表面等离振子共振。在一个具体实施方案中，可以制备蛋白质微阵列，其中可以将本文所述的任意构象稳定的遍在蛋白或蛋白复合物固定至固体支持物的表面上。在一个实施方案中，修饰构象稳定的遍在蛋白或蛋白复合物，以包含一个或多个官能团，该官能团结合单种蛋白质、功能或结构类蛋白质、或一般蛋白质，用于将蛋白质固定至固体支持物。例如，可以利用诸如硫氧还蛋白斑(patch)的融合蛋白质系统、基于内含肽的方法或其他方法来固定构象稳定的遍在蛋白或蛋白复合物。可以用琥珀酰亚胺酯/醛(用于蛋白质的一般固定)、谷胱甘肽(用于固定GST融合蛋白质)、NTA或金属(用于固定His标记的蛋白质)或特异性配体(如来自USP家族脱遍在蛋白酶的脱遍在蛋白酶)修饰构象稳定的遍在蛋白或蛋白复合物来固定特定种类的蛋白质。类似地，为了研究蛋白质-蛋白质相互作用，包括分离蛋白复合物，可以将构象稳定的遍在蛋白、蛋白复合物或修饰的蛋白质(如本文公开的那些中的任一种)固定在雌性或非磁性颗粒(例如MagneSil颗粒)上。

D.核酸

本文提供分离的编码本文公开的任意构象稳定的遍在蛋白的核酸。本公开提供分离的核酸分子，其中该核酸分子编码包含与SEQ ID NO:1的氨基酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的蛋白质。

E.载体

编码本文公开的任意构象稳定的遍在蛋白的多核苷酸序列可以用标准合成技术和/或重组技术获得。可以从适当的来源细胞分离希望的多核苷酸序列并测序。抗体、肽和/或多肽的来源细胞可以包括产生抗体、肽和/或多肽的细胞，如杂交瘤细胞。备选地，可以用核苷酸合成仪或PCR技术合成多核苷酸。一旦获得，即可将编码抗体、肽和/或多肽的序列插入能够在宿主细胞中复制并表达异源多核苷酸的重组载体。本领域可得和已知的许多载体可以用于本发明的目的。适当的载体的选择将主要取决于将要插入该载体的核酸的大小和将要用该载体转化的具体宿主细胞。取决于其功能(扩增或表达异源多核苷酸，或二者)及其与它所驻留的具体宿主细胞的相容性，每种载体包含多种成分。载体成分通常包括但不限于：复制起点(尤其是在将载体插入原核细胞时)、选择标记基因、启动子、核糖体结合位点(RBS)、信号序列、异源核酸插入片段和转录终止序列。在一些实施方案中，该载体是表达载体。

通常，将包含衍生自与宿主细胞相容的物种的复制子和控制序列的质粒载体与这些宿主结合使用。载体通常携带复制位点，以及能够在转化的细胞中提供表型选择的标记序列。例如，通常用衍生自大肠杆菌(E.coli)物种的质粒pBR322转化大肠杆菌。pBR322包含编码氨苄青霉素(Amp)和四环素(Tet)抗性的基因，因此提供了容易的手段来鉴定转化的细胞。pBR322、其衍生物或其他微生物质粒或噬菌体还可以包含或修饰为包含微生物可以用来表达内源蛋白质的启动子。

此外，包含与宿主微生物相容的复制子和控制序列的噬菌体载体可以用作与这些宿主相关的转化载体。例如，诸如λGEM.TM.-11的噬菌体可以用于产生可用来转化诸如大肠杆菌LE392的易感宿主细胞的重组载体。

根据具体情况的需要，可以在本发明中使用组成型或诱导型启动子，这可以由本领域技术人员确定。多种潜在的宿主细胞识别的大量启动子是公知的。可以通过经限制酶消化从源DNA去除启动子，并将分离的启动子序列插入所选择的载体来将所选择的启动子与编码本文所述多肽的顺反子DNA有效连接。天然启动子序列和许多异源启动子都可以用来指导靶基因的扩增和/或表达。但是，优选异源启动子，因为与天然靶多肽启动子相比，它们通常允许所表达的靶基因的更多的转录和更高的产率。

适合用于原核宿主的启动子包括PhoA启动子、β-galactamase和乳糖启动子系统、色氨酸(trp)启动子系统及杂合启动子，如tac或trc启动子。但是，在细菌中具有功能的其他启动子(如其他已知的细菌或噬菌体启动子)也是适宜的。它们的核苷酸序列已公开，从而使得技术人员能够用接头或衔接物提供任意需要的限制位点来将它们有效连接至编码靶轻链和重链的顺反子(Siebenlist等(1980)Cell 20:269)。

在一些实施方案中，重组载体内的每个顺反子包含指导所表达的多肽跨膜易位的分泌信号序列成分。通常，信号序列可以是载体的成分，或者它可以是插入载体中的靶多肽DNA的部分。选择用于本发明的目的的信号序列应是宿主细胞可识别和加工(即通过信号肽酶切割)的信号序列。对于不识别和加工异源多肽的天然信号序列的原核宿主细胞，用选自例如碱性磷酸酶、青霉素酶、Ipp、或热稳定肠毒素II(STII)前导序列、LamB、PhoE、PelB、OmpA和MBP的原核信号序列取代该信号序列。

F.宿主细胞

适合用于表达多肽的原核宿主细胞包括古细菌(Archaebacteria)和真细菌(Eubacteria)，如革兰氏阴性或革兰氏阳性生物。有用的细菌的实例包括埃希氏菌属(Escherichia)(例如大肠杆菌)、芽孢杆菌属(Bacilli)(例如枯草芽孢杆菌(B.subtilis))、肠细菌、假单胞菌属(Pseudomonas)物种(例如铜绿假单胞菌(P.aeruginosa))、鼠伤寒沙门氏菌(Salmonellatyphimurium)、粘质沙雷氏菌(Serratia marcescans)、克雷伯氏菌属(Klebsiella)、变形杆菌属(Proteus)、志贺氏菌属(Shigella)、根瘤菌属(Rhizobia)、透明颤菌属(Vitreoscilla)或副球菌属(Paracoccus)。优选地，使用革兰氏阴性细胞。优选地，宿主细胞应分泌最小量的蛋白水解酶，且可以希望将附加的蛋白酶抑制剂掺入细胞培养物中。

在一个实施方案中，宿主细胞是选自酵母属(Saccharomyces)、毕赤酵母属(Pichia)和假丝酵母属(Candida)的酵母细胞。在另一实施方案中，该细胞是Caenorhabdus elegans线虫细胞。在另一实施方案中，该细胞是昆虫细胞，如果萧属(Drosophila)细胞。还在另一实施方案中，该细胞是斑马鱼细胞。

能够表达本文公开的任意构象稳定的遍在蛋白的哺乳动物细胞的实例可以选自仓鼠细胞、小鼠细胞、大鼠细胞、兔细胞、猫细胞、狗细胞、牛细胞、山羊细胞、猪细胞、马细胞、绵羊细胞、猴细胞、黑猩猩细胞和人细胞。在另一实施方案中，该动物细胞是神经细胞(如但不限于外周神经系统细胞或中枢神经细胞细胞)、肌细胞(如心肌、骨骼肌或平滑肌细胞)、配子(如精细胞或卵母细胞)、癌细胞、免疫细胞(如但不限于巨噬细胞、T细胞或B细胞)、干细胞(如但不限于胚胎干细胞或成体干细胞)或内分泌细胞(如但不限于甲状腺细胞、下丘脑细胞、垂体细胞、肾上腺细胞、睾丸细胞、卵巢细胞、胰细胞(如β细胞)、胃细胞或肠细胞)。在一些实施方案中，该细胞是细胞培养物中的人细胞。在一些实施方案中，该细胞是细胞培养物中的非人细胞。在一些实施方案中，该细胞是癌细胞。

G.构象稳定的遍在蛋白的产生

用上述表达载体转化或转染宿主细胞，并在根据诱导启动子、选择转化体或扩增编码希望的序列的基因的需要改进的常规营养培养基中培养。

转染指实际上表达或不表达任意编码序列的宿主细胞摄取表达载体。许多转染方法为普通技术人员已知，例如CaPO₄沉淀和电穿孔。宿主细胞内存在此载体发挥作用的任意指示时，通常认为是成功转染。

转化意指将DNA引入原核宿主，使得DNA可作为染色体外元件或通过染色体整合体复制。取决于所使用的宿主细胞，用适合于这类细胞的标准技术进行转化。利用氯化钙的钙处理通常用于含有实质性细胞壁屏障的细菌细胞。另一种转化方法利用聚乙二醇/DMSO。所使用的另一种技术是电穿孔。

在本领域已知且适合用于培养所选择的宿主细胞的培养基中培养用于产生本发明的多肽的原核细胞。适宜的培养基的实例包括添加了必需的营养补充物的Luria培养基(LB)。在优选实施方案中，该培养基还包含根据表达载体的构建选择的选择剂，以选择性地允许包含表达载体的原核细胞的生长。例如，向培养基中加入氨苄青霉素来培养表达氨苄青霉素抗性基因的细胞。

还可以按适当的浓度包含除碳、氮和无机磷酸来源以外的任意必需补充物，其单独引入或作为与另一补充物或培养基的混合物(如复合氮源)引入。可选地，该培养基可以包含选自谷胱甘肽、半胱氨酸、胱胺、巯基乙酸盐、二硫赤藓糖醇和二硫苏糖醇的一种或多种还原剂。

在适宜的温度下培养原核宿主细胞。对于大肠杆菌生长，例如，优选的温度在从约20℃至约39℃的范围内，更优选从约25℃至约37℃，甚至更优选在约30℃。主要取决于宿主生物，培养基的pH可以是从约5至约9的范围内的任意pH。对于大肠杆菌，pH优选从约6.8至约7.4，且更优选约7.0。

如果将诱导型启动子用于表达载体中，则在适合用于激活该启动子的条件下诱导蛋白质表达。例如，如果用PhoA启动子来控制转录，则可以在用于诱导的磷酸盐限制培养基中培养转化的宿主细胞。如本领域已知，根据所利用的载体构建体，可以使用多种其他诱导物。

在微生物中表达的本文所述的多肽可以分泌入宿主细胞的周质，并从宿主细胞的周质回收。蛋白质回收通常涉及破裂微生物，通常通过诸如渗透压休克、超声处理或裂解的手段。一旦破裂细胞，即可以例如通过离心或过滤来去除细胞碎片或整个细胞。可以例如通过亲和树脂层析来进一步纯化蛋白质。备选地，蛋白质可以转运入培养基，并从其中分离。可以从培养物去除细胞，过滤并浓缩培养物上清用于所产生的蛋白质的进一步纯化。可以用公知的方法进一步分离和鉴定所表达的多肽，如免疫亲和柱或离子交换柱上的分级分离；乙醇沉淀；反相HPLC；二氧化硅上或诸如DEAE的阳离子交换树脂上的层析；层析聚焦；SDS-PAGE；硫酸铵沉淀；使用例如Sephadex G-75的凝胶过滤；疏水亲和树脂；使用固定在基质上的适宜抗原的配体亲和；和Western印迹测定。

除原核宿主细胞外，真核宿主细胞系统在本领域中也是完善的。适宜的宿主包括哺乳动物细胞系，如CHO，及昆虫细胞，如下文所述的那些。

H.多肽/肽纯化

可以纯化所产生的多肽/肽来获得基本上同质的制剂用于其他测定和用途。可以利用本领域已知的标准蛋白质纯化方法。以下方法是适宜的纯化方法的示例：免疫亲和或离子交换柱上的分级分离、乙醇沉淀、反相HPLC、二氧化硅上或诸如DEAE的阳离子交换树脂上的层析、层析聚焦、SDS-PAGE、硫酸铵沉淀和使用例如Sephadex G-75的凝胶过滤。

IV.本发明的方法

本文提供用于选择性抑制USP家族的脱遍在蛋白酶的方法。本文还提供用于鉴定物质的方法，该物质：1)与遍在蛋白的构象形式(例如遍在蛋白的有利于与USP家族脱遍在蛋白酶的脱遍在蛋白酶结合的构象形式)结合；2)与USP脱遍在蛋白酶/遍在蛋白蛋白复合物结合；3)与USP家族的脱遍在蛋白酶结合；和/或4)能够破坏USP脱遍在蛋白酶/遍在蛋白蛋白复合物。本文还提供用于筛选蛋白质的构象稳定形式的方法，其中与该蛋白质的野生型形式相比，该蛋白质的构象稳定形式与结合配偶体具有提高的结合亲和力。本文还提供通过本文公开的要求中任一项的方法鉴定的物质。

A.用于选择性抑制USP家族的脱遍在蛋白酶的方法

本文提供用于选择性抑制USP家族脱遍在蛋白酶的脱遍在蛋白酶的酶促活性的方法。在一些方面，该方法包括使脱遍在蛋白酶与本文公开的任意构象稳定的遍在蛋白接触。在一些实施方案中，该USP脱遍在蛋白酶是USP1、USP2、USP3、USP4、USP5、USP6、USP7、USP8、USP9X、USP9Y、USP10、USP11、USP12、USP13、USP14、USP15、USP16、USP17、USP17L2、USP17L3、USP17L4、USP17L5、USP17L7、USP17L8、USP18、USP19、USP20、USP21、USP22、USP23、USP24、USP25、USP26、USP27X、USP28、USP29、USP30、USP31、USP32、USP33、USP34、USP35、USP36、USP37、USP38、USP39、USP40、USP41、USP42、USP43、USP44、USP45或USP46中的任一种。在另一实施方案中，该USP脱遍在蛋白酶是USP7、USP5或USP14。在一个实施方案中，该USP脱遍在蛋白酶是USP7。在一些实施方案中，使USP脱遍在蛋白酶与构象稳定的遍在蛋白接触，其中该构象稳定的遍在蛋白包含本文所述的任意氨基酸取代。在一个实施方案中，在体外使USP脱遍在蛋白酶与构象稳定的遍在蛋白接触。在另一实施方案中，在体内(例如，通过本领域已知的任意手段使USP脱遍在蛋白酶与本文公开的任意构象稳定的遍在蛋白共表达，或通过施用脂溶性载体中的构象稳定的遍在蛋白)使USP脱遍在蛋白酶与构象稳定的遍在蛋白接触。在另一实施方案中，该抑制是体内抑制。在一些实施方案中，该构象稳定的遍在蛋白是USP脱遍在蛋白酶拮抗剂。在一些实施方案中，USP脱遍在蛋白酶与本文公开的任意构象稳定的遍在蛋白的接触选择性抑制(如完全抑制)USP脱遍在蛋白酶的酶促活性。在一些实施方案中，与野生型遍在蛋白引起的这些酶的抑制相比，USP脱遍在蛋白酶与本文公开的任意构象稳定的遍在蛋白的接触使USP脱遍在蛋白酶的脱遍在蛋白酶酶促活性选择性抑制约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％(包含，包括这些值之间的任意百分比)中的任一个。

B.用于鉴定与遍在蛋白的构象稳定形式结合的物质的方法

本发明还提供用于鉴定(或筛选)与遍在蛋白的特定构象形式(例如，遍在蛋白的构象形式，其中一个或多个氨基酸取代稳定遍在蛋白的β1/β2环区，使得β1/β2环区限制于蛋白质数据库编号3NHE链B的约RMSD内的区域)结合(如优先结合)的一种或多种物质的方法。这类测定可以包括适于高通量筛选文库(如肽或化学药品文库)的测定。

在一些实施方案中，提供鉴定与遍在蛋白的有利于与结合配偶体结合的构象形式结合(如优先结合)的物质的方法，其包括使物质与构象稳定的遍在蛋白(如本文公开的任意构象稳定的遍在蛋白)接触，并测定物质是否能够与遍在蛋白的该构象稳定形式结合。

用于结合测定的构象稳定的遍在蛋白可以是稳定的遍在蛋白或其片段，只要该片段能够维持与全长稳定蛋白质相同的就β1/β2环区而言的构象稳定性。备选地，构象稳定的遍在蛋白或其片段可以包含在多肽内，即用于结合测定的多肽可以包含不存在于单体构象稳定的遍在蛋白中的附加氨基酸残基。

本文所述的结合测定通常需要使待进行结合测试的两个成分(例如，构象稳定的遍在蛋白(如有利于与USP家族脱遍在蛋白酶的脱遍在蛋白酶结合的稳定的遍在蛋白)和物质)在允许这些成分相互作用的条件和持续时间下接触。可以分离或检测反应混合物中形成的复合物。在一个示例性实施方案中，通过共价或非共价附着将一种成分(例如，构象稳定的遍在蛋白，如本文公开的任一种)固定在固相上，例如微量滴定板上。非共价附着通常通过用物质的溶液包被固体表面并干燥来达到。备选地，可以用固定的亲和分子(如对待固定的物质特异的抗体，例如单克隆抗体)来将它锚定在固体表面。通过向固定成分(例如含有锚定成分的包被表面)加入非固定成分(例如物质)(其可以通过可检测标记来标记)来进行测定。反应完成时，例如通过洗涤来去除非反应性成分，并检测锚定在固体表面上的复合物。在最初未固定的成分携带可检测标记时，检测到固定在表面上的标记指示发生了结合。在最初未固定的成分不携带标记时，可以例如通过使用特异性结合固定的复合物的标记抗体来检测结合。

在一些实施方案中，按以下测试抑制构象稳定的遍在蛋白和结合配偶体(如USP家族脱遍在蛋白酶的成员)的结合的物质：在允许两种成分的相互作用和结合的条件和持续时间下制备包含构象稳定的遍在蛋白或其片段和结合配偶体或其片段的反应混合物。为了测试候选物质抑制结合的能力，在候选物质的缺乏和存在下进行反应。此外，可以在分开的反应混合物中加入安慰剂作为阳性对照。按上文所述监测候选物质、构象稳定的遍在蛋白和结合配偶体(或其等同物)之间的结合(复合物形成)。对照反应中而不是包含候选化合物的反应混合物中形成复合物指示该候选化合物抑制构象稳定的遍在蛋白与结合配偶体的结合。此外，可以测试不同量的候选物质来确定结合的抑制是否是竞争性的。

在备选方法中，可以在液相中进行反应，将反应产物从未反应的成分分开，并检测复合物；例如，用对构象稳定的遍在蛋白、结合配偶体或其片段(如USP家族脱遍在蛋白酶的成员或其片段)、或候选物质特异的固定抗体来锚定溶液中形成的任意复合物，并可以用对可能的复合物的其他成分特异的标记抗体来检测锚定的复合物。备选地，可以用基于细胞的测定来进行结合测定。具体而言，可以使用改造为表达构象稳定的遍在蛋白(例如通过用遍在蛋白变体DNA转染或转导等)的细胞系(例如COS细胞、CHO 3J细胞、成纤维细胞等)。

可以按下文进一步描述针对其结合特异性进一步测定通过上述方法鉴定的物质。鉴定与特定结合部位结合的物质的方法可以独立于上述筛选方法进行，或与抑制筛选测定结合进行。换言之，本文所述的鉴定抑制(如部分或完全抑制)结合配偶体(如USP家族脱遍在蛋白酶的成员)的酶促活性的物质的方法可以通过以下进行，首先筛选抑制(例如竞争性抑制)构象稳定的遍在蛋白与结合配偶体的结合的物质(也称为“基于抑制的筛选”)，然后从该筛选结果鉴定与构象稳定的遍在蛋白上的特定结合部位结合的物质(也称为“基于结合的筛选”)。备选地，可以筛选与构象稳定的遍在蛋白上的特定结合部位结合的物质而不首先进行基于抑制的筛选(或接着基于抑制的测定)。

在一些实施方案中，基于抑制的筛选和/或基于结合的筛选可以与基于物质的功能读出的筛选/鉴定方法结合进行。抑制已知与遍在蛋白相互作用的酶的活性的物质的功能读出可以根据与遍在蛋白/蛋白酶体加工机器相关的生物学活性的知识来设想，其包括但不限于从靶蛋白切割遍在蛋白、在多聚遍在蛋白链中去除或掺入遍在蛋白单体、靶蛋白经蛋白酶体复合物降解、或遍在蛋白加工酶的运行。功能筛选/鉴定方法可以在基于抑制的筛选和/或基于结合的筛选之前或之后进行。

因此，在一些方面，本文提供用于鉴定与遍在蛋白的构象稳定形式(如本文公开的任意遍在蛋白的构象稳定形式)结合(如优先结合)的物质的方法。该物质可以是小分子化合物、抑制性核酸、蛋白质(如非抗体抑制性肽或抗体)、或其任意组合。在一些实施方案中，该方法包括使物质与本文公开的任意构象稳定的遍在蛋白接触，并测定物质是否能够与构象稳定的遍在蛋白结合。

在一些实施方案中，遍在蛋白的构象稳定形式是有利于与一种或多种特异性结合配偶体结合的构象形式。在一些实施方案中，该物质的结合可以抑制与遍在蛋白的构象形式结合(如优先结合)的一种或多种结合配偶体的结合(例如，可以破坏它们之间的相互作用)。在一个实施方案中，结合配偶体是遍在蛋白加工酶，如但不限于任意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中，结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一些实施方案中，该物质竞争性抑制结合配偶体与遍在蛋白的特定构象形式(例如，遍在蛋白的构象形式，其中一个或多个氨基酸取代稳定遍在蛋白的β1/β2环区，使得β1/β2环区限制于蛋白质数据库编号3NHE链B的约RMSD内的区域)的结合，但不影响结合配偶体与遍在蛋白的其他构象形式的结合。在其他实施方案中，在竞争性ELISA测定下，该物质以小于约40nM(例如小于约35nM、30nM、25nM、20nM、15nM、14nM、13nM、12nM、11nM、10nM、9nM、8nM、7nM、6nM、5nM、4nM、3nM、2nM或1nM)的IC₅₀与结合配偶体竞争结合遍在蛋白的特定构象形式。在一些实施方案中，结合于遍在蛋白的物质抑制一种或多种结合配偶体的酶促活性，如USP家族脱遍在蛋白酶的脱遍在蛋白酶的酶促活性。

本文还提供通过本文公开的要求中任一项的方法鉴定的物质。

C.用于鉴定破坏或结合遍在蛋白/USP脱遍在蛋白酶蛋白复合物的物质的方法

本发明还提供用于鉴定(或筛选)与包含USP家族的脱遍在蛋白酶(如但不限于USP7)和遍在蛋白的蛋白复合物结合的一种或多种物质的方法。在一方面，提供用于鉴定(或筛选)可以破坏遍在蛋白/USP脱遍在蛋白酶蛋白复合物的一种或多种物质的方法。这类测定可以包括适于高通量筛选文库(如肽或化学药品文库)的测定。

在一些方面，提供鉴定与USP家族的脱遍在蛋白酶结合(如优先结合)的物质的方法，其包括使物质与包含USP家族的脱遍在蛋白酶和本文公开的任意构象稳定的遍在蛋白的蛋白复合物接触，并测定物质是否能够与脱遍在蛋白酶结合。在一些方面，提供鉴定与遍在蛋白酶结合(如优先结合)的物质的方法，其包括使物质与包含USP家族的脱遍在蛋白酶和本文公开的任意构象稳定的遍在蛋白的蛋白复合物接触，并测定物质是否能够与遍在蛋白结合。

包含USP家族的脱遍在蛋白酶和构象稳定的遍在蛋白的蛋白复合物可以是本文公开的任意蛋白复合物，其包含本文公开的任意构象稳定的遍在蛋白作为成分。蛋白复合物的USP脱遍在蛋白酶成分可以是USP家族的任意成员，如但不限于USP1、USP2、USP3、USP4、USP5、USP6、USP7、USP8、USP9X、USP9Y、USP10、USP11、USP12、USP13、USP14、USP15、USP16、USP17、USP17L2、USP17L3、USP17L4、USP17L5、USP17L7、USP17L8、USP18、USP19、USP20、USP21、USP22、USP23、USP24、USP25、USP26、USP27X、USP28、USP29、USP30、USP31、USP32、USP33、USP34、USP35、USP36、USP37、USP38、USP39、USP40、USP41、USP42、USP43、USP44、USP45或USP46。在另一实施方案中，该USP脱遍在蛋白酶是USP7、USP5或USP14。备选地，构象稳定的遍在蛋白或其片段或USP脱遍在蛋白酶可以包含在多肽内，即用于结合测定的包含蛋白复合物的多肽中的任一个可以包含不存在于单体构象稳定的遍在蛋白中的附加氨基酸残基。

本文所述的结合测定通常需要使待进行结合测试的两个成分(例如，包含构象稳定的遍在蛋白和USP脱遍在蛋白酶的复合物及物质)在允许这些成分相互作用的条件和持续时间下接触。可以分离或检测反应混合物中形成的复合物。在一个示例性实施方案中，通过共价或非共价附着将一种成分(例如，蛋白复合物，如本文公开的任一种)固定在固相上，例如微量滴定板上。非共价附着通常通过用物质的溶液包被固体表面并干燥来达到。备选地，可以用固定的亲和分子(如对待固定的物质特异的抗体，例如单克隆抗体)来将它锚定在固体表面。通过向固定成分(例如含有锚定成分的包被表面)加入非固定成分(例如物质)(其可以通过可检测标记来标记)来进行测定。反应完成时，例如通过洗涤来去除非反应性成分，并检测锚定在固体表面上的复合物。在最初未固定的成分携带可检测标记时，检测到固定在表面上的标记指示发生了结合。在最初未固定的成分不携带标记时，可以例如通过使用特异性结合固定的复合物的标记抗体来检测结合。

在一些实施方案中，按以下测试破坏构象稳定的遍在蛋白和USP家族脱遍在蛋白酶的成员之间形成的复合物的物质：在允许两种成分相互作用并结合形成蛋白复合物的条件和持续时间下，制备包含构象稳定的遍在蛋白或其片段和USP家族脱遍在蛋白酶的成员的反应混合物。为了测试候选物质破坏包含脱遍在蛋白酶的蛋白复合物和构象稳定的遍在蛋白之间的相互作用的能力，在候选物质的缺乏和存在下进行反应。此外，可以在分开的反应混合物中加入安慰剂作为阳性对照。按上文所述监测候选物质和USP脱遍在蛋白酶之间的结合。对照反应中而不是包含候选化合物的反应混合物中形成复合物指示该候选化合物抑制构象稳定的遍在蛋白与结合配偶体的结合。此外，可以测试不同量的候选物质来确定结合的抑制是否是竞争性的。

在备选方法中，可以在液相中进行反应，将反应产物从未反应的成分分开，并检测复合物；例如，用对构象稳定的遍在蛋白、USP脱遍在蛋白酶、或候选物质特异的固定抗体来锚定溶液中形成的任意复合物，并可以用对可能的复合物的其他成分特异的标记抗体来检测锚定的复合物。备选地，可以用基于细胞的测定来进行结合测定。具体而言，可以使用改造为表达构象稳定的遍在蛋白(例如通过用遍在蛋白变体DNA转染或转导等)的细胞系(例如COS细胞、CHO 3J细胞、成纤维细胞等)，以及天然表达或改造为表达USP脱遍在蛋白酶的细胞。

可以按下文进一步描述针对其结合特异性进一步测定通过上述方法鉴定的物质。鉴定与特定结合部位结合的物质的方法可以独立于上述筛选方法进行，或与抑制筛选测定结合进行。换言之，鉴定抑制(如部分或完全抑制)USP家族脱遍在蛋白酶的成员的酶促活性的物质的方法可以通过以下进行，首先筛选破坏包含脱遍在蛋白酶和构象稳定的遍在蛋白的复合物的物质，然后从该筛选结果鉴定与脱遍在蛋白酶上的特定结合部位结合的物质(也称为“基于结合的筛选”)。备选地，可以筛选与脱遍在蛋白酶上的特定结合部位结合的物质而不首先进行基于抑制的筛选(或接着基于抑制的测定)。

在一些实施方案中，基于抑制的筛选和/或基于结合的筛选可以与基于物质的功能读出的筛选/鉴定方法结合进行。抑制已知与遍在蛋白相互作用的酶的活性的物质的功能读出可以根据与遍在蛋白/蛋白酶体加工机器相关的生物学活性的知识来设想，其包括但不限于从靶蛋白切割遍在蛋白、在多聚遍在蛋白链中去除或掺入遍在蛋白单体、或蛋白质经蛋白酶体复合物降解。功能筛选/鉴定方法可以在基于抑制的筛选和/或基于结合的筛选之前或之后进行。

因此，在一些方面，本文提供用于鉴定与包含USP家族的脱遍在蛋白酶和遍在蛋白的蛋白复合物结合(如优先结合)的物质的方法。该物质可以是小分子化合物、抑制性核酸、蛋白质(如非抗体抑制性肽或抗体)、或其任意组合。在一些实施方案中，该方法包括使物质与本文公开的包含构象稳定的遍在蛋白和USP脱遍在蛋白酶的复合物中的任一种接触，并测定物质是否能够与脱遍在蛋白酶或构象稳定的遍在蛋白结合。在一些实施方案中，该物质破坏构象稳定的遍在蛋白和脱遍在蛋白酶之间的相互作用，从而破坏蛋白复合物。在一些实施方案中，蛋白复合物的USP脱遍在蛋白酶成分可以是USP家族的任意成员，如但不限于USP1、USP2、USP3、USP4、USP5、USP6、USP7、USP8、USP9X、USP9Y、USP10、USP11、USP12、USP13、USP14、USP15、USP16、USP17、USP17L2、USP17L3、USP17L4、USP17L5、USP17L7、USP17L8、USP18、USP19、USP20、USP21、USP22、USP23、USP24、USP25、USP26、USP27X、USP28、USP29、USP30、USP31、USP32、USP33、USP34、USP35、USP36、USP37、USP38、USP39、USP40、USP41、USP42、USP43、USP44、USP45或USP46。在一些实施方案中，该USP脱遍在蛋白酶是USP7、USP5或USP14。在一个实施方案中，该USP脱遍在蛋白酶是USP7。在一些实施方案中，在竞争性ELISA测定下，该物质以小于约40nM(例如小于约35nM、30nM、25nM、20nM、15nM、14nM、13nM、12nM、11nM、10nM、9nM、8nM、7nM、6nM、5nM、4nM、3nM、2nM或1nM)的IC₅₀与脱遍在蛋白酶竞争结合构象稳定的遍在蛋白。在一些实施方案中，结合于遍在蛋白的物质抑制一种或多种结合配偶体的酶促活性，如USP家族脱遍在蛋白酶的脱遍在蛋白酶的酶促活性。

在一些方面，与USP家族脱遍在蛋白酶结合的物质是抗体。抗体是与本文公开的任意USP家族脱遍在蛋白酶结合(如优先结合)的多肽。在一些实施方案中，该抗体是USP家族脱遍在蛋白酶(例如USP7、USP5或USP14)拮抗剂。

在一些方面，与USP家族脱遍在蛋白酶结合的物质是非抗体结合多肽。结合多肽是与本文公开的任意USP家族脱遍在蛋白酶结合(如优先结合)的多肽。在一些实施方案中，该结合多肽是USP家族脱遍在蛋白酶(例如USP7、USP5或USP14)拮抗剂。

在一些方面，与USP家族脱遍在蛋白酶结合(如优先结合)的物质是小分子化合物。小分子化合物是与本文公开的任意USP家族脱遍在蛋白酶结合(如优先结合)的化合物。在一些实施方案中，该小分子化合物是USP家族脱遍在蛋白酶(例如USP7、USP5或USP14)拮抗剂。

D.结合构象稳定的遍在蛋白、USP脱遍在蛋白酶或其蛋白复合物的物质

在本文提供的任意方法的一些方面，结合(如优先结合)遍在蛋白的稳定构象形式(如本文提供的任意构象稳定形式的遍在蛋白)、结合(如优先结合)USP家族的脱遍在蛋白酶、或结合和/或破坏USP脱遍在蛋白酶/构象稳定的遍在蛋白蛋白复合物的物质可以是抗体、非抗体结合多肽或小分子化合物。

1.抗体

在一些方面，结合(如优先结合)遍在蛋白的特定构象形式(如本文提供的任意构象稳定形式的遍在蛋白)的物质是抗体。抗体是与本文公开的任意构象稳定的遍在蛋白结合的多肽。在一些实施方案中，该抗体是遍在蛋白加工酶(如E1、E2或E3家族遍在蛋白加工酶的任意成员)拮抗剂。在一些实施方案中，该抗体是脱遍在蛋白酶(如USP家族脱遍在蛋白酶的成员，例如USP7、USP5或USP14)拮抗剂。

还可以根据本领域已知的信息制备抗体的变体而不实质性影响抗体的活性。例如，抗体变体可以在抗体分子中具有至少一个用不同残基取代的氨基酸残基。对于抗体，最有兴趣进行取代诱变的部位通常包括高变区，但也考虑构架区(FR)改变。

对于抗体，一类取代变体涉及取代亲本抗体(例如人源化抗体或人抗体)的一个或多个高变区残基。通常，相对于其所产生自的亲本抗体，所得到的选择用于进一步开发的变体将具有改善的生物学特性。用于产生这类取代变体的方便方式涉及使用噬菌体展示的亲和力成熟。简言之，突变几个高变区位点(例如6-7个位点)来产生每个位点上所有可能的氨基酸取代。这样产生的抗体作为与包装在各颗粒内的M13的基因III产物的融合物从丝状噬菌体颗粒展示。然后针对它们的生物学活性(例如结合亲和力)筛选噬菌体展示的变体。为了鉴定用于修饰的候选高变区位点，可以进行丙氨酸扫描诱变来鉴定显著促成抗原结合的高变区残基。备选地，或此外，分析抗原-抗体复合物的晶体结构来鉴定抗体和抗原之间的接触点可以是有益的。这类接触残基和邻近残基是按照本文所述技术进行取代的候选残基。一旦产生这类变体，即可对该系列的变体进行本文所述的筛选，并可以选择在一项或多项相关测定中具有较优特性的抗体用于进一步开发。

通过本领域已知的多种方法制备编码抗体的氨基酸序列变体的核酸分子。这些方法包括但不限于，从天然来源分离(在天然存在的氨基酸序列变体的情况下)，或通过抗体的早先制备的变体或非变体形式的寡核苷酸介导(或位点定向)诱变、PCR诱变和盒诱变来制备。

可以希望在本发明的免疫球蛋白多肽的Fc区中引入一个或多个氨基酸修饰，从而产生Fc区变体。Fc区变体可以包含在包括铰合部半胱氨酸的一个或多个氨基酸位置上含有氨基酸修饰(例如取代)的人Fc区序列(例如人IgG1、IgG2、IgG3或IgG4Fc区)。

在一个实施方案中，Fc区变体可以展示改变的新生儿Fc受体(FcRn)结合亲和力。这类变体Fc区可以在Fc区的氨基酸位置238、252、253、254、255、256、265、272、286、288、303、305、307、309、311、312、317、340、356、360、362、376、378、380、382、386、388、400、413、415、424、433、434、435、436、439或447中的任意一个或多个处包含氨基酸修饰，其中Fc区中残基的编号是Kabat中的EU指数的编号。与FcRn的结合减少的Fc区变体可以在Fc区的氨基酸位置252、253、254、255、288、309、386、388、400、415、433、435、436、439或447中的任意一个或多个处包含氨基酸修饰，其中Fc区中残基的编号是Kabat中的EU指数的编号。备选地，上述Fc区变体可以展示增加的与FcRn的结合，且在Fc区的氨基酸位置238、256、265、272、286、303、305、307、311、312、317、340、356、360、362、376、378、380、382、413、424或434中的任意一个或多个处包含氨基酸修饰，其中Fc区中残基的编号是Kabat中的EU指数的编号。

与Fc(R的结合减少的Fc区变体可以在Fc区的氨基酸位置238、239、248、249、252、254、265、268、269、270、272、278、289、292、293、294、295、296、298、301、303、322、324、327、329、333、335、338、340、373、376、382、388、389、414、416、419、434、435、437、438或439中的任意一个或多个处包含氨基酸修饰，其中Fc区中残基的编号是Kabat中的EU指数的编号。

例如，Fc区变体可以展示减少的与Fc(RI的结合，且在Fc区的氨基酸位置238、265、269、270、327或329中的任意一个或多个处包含氨基酸修饰，其中Fc区中残基的编号是Kabat中的EU指数的编号。

Fc区变体可以展示减少的与Fc(RII的结合，且在Fc区的氨基酸位置238、265、269、270、292、294、295、298、303、324、327、329、333、335、338、373、376、414、416、419、435、438或439中的任意一个或多个处包含氨基酸修饰，其中Fc区中残基的编号是Kabat中的EU指数的编号。

有利的Fc区变体可以展示减少的与Fc(RIII的结合，且在Fc区的氨基酸位置238、239、248、249、252、254、265、268、269、270、272、278、289、293、294、295、296、301、303、322、327、329、338、340、373、376、382、388、389、416、434、435或437中的任意一个或多个处包含氨基酸修饰，其中Fc区中残基的编号是Kabat中的EU指数的编号。

国际专利申请号WO99/51642中描述了具有改变(即改善或减少)的C1q结合和/或依赖补体的细胞毒性(CDC)的Fc区变体。这类变体可以在Fc区的氨基酸位置270、322、326、327、329、331、333或334中的任意一个或多个处包含氨基酸取代。有关Fc区变体，还见Duncan&WinterNature 322:738-40(1988)；美国专利号5,648,260；美国专利号5,624,821；和国际专利申请号WO94/29351。

2.非抗体结合多肽

在一些方面，结合(如优先结合)遍在蛋白的特定构象形式(如本文提供的任意构象稳定形式的遍在蛋白)的物质是非抗体结合多肽。结合多肽是与本文公开的任意构象稳定的遍在蛋白结合的多肽。在一些实施方案中，该结合多肽是遍在蛋白加工酶(如E1、E2或E3家族遍在蛋白加工酶的任意成员)拮抗剂。在一些实施方案中，该结合多肽是脱遍在蛋白酶(如USP家族脱遍在蛋白酶的成员，例如USP7、USP5或USP14)拮抗剂。

结合多肽可以用已知的多肽合成法化学合成，或者可以用重组技术制备和纯化。结合多肽的长度通常为至少约5个氨基酸，备选地，长度为至少约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个氨基酸或更长，其中这类结合多肽能够与靶标(如本文公开的任意构象稳定的遍在蛋白)结合。可以用本领域公知的技术在不进行过多实验的情况下鉴定结合多肽。在这方面，应指出，用于针对能够与多肽靶标结合的结合多肽筛选多肽文库的技术为本领域公知(见例如美国专利号5,556,762、5,750,373、4,708,871、4,833,092、5,223,409、5,403,484、5,571,689、5,663,143；PCT公开号WO 84/03506和WO84/03564；Geysen等,Proc.Natl.Acad.Sci.U.S.A.,81:3998-4002(1984)；Geysen等,Proc.Natl.Acad.Sci.U.S.A.,82:178-182(1985)；Geysen等,in Synthetic Peptides as Antigens,130-149(1986)；Geysen等,J.Immunol.Meth.,102:259-274(1987)；Schoofs等,J.Immunol.,140:611-616(1988)；Cwirla,S.E.等,(1990)Proc.Natl.Acad.Sci.USA,87:6378；Lowman,H.B.等,(1991)Biochemistry,30:10832；Clackson,T.等,(1991)Nature,352:624；Marks,J.D.等,(1991),J.Mol.Biol.,222:581；Kang,A.S.等,(1991)Proc.Natl.Acad.Sci.USA,88:8363；及Smith,G.P.(1991)Current Opin.Biotechnol.,2:668)。

在这方面，噬菌体展示是一种公知的技术，其允许筛选大的多肽文库来鉴定那些文库中能够与靶多肽(如c-met多肽)结合的成员。噬菌体展示是通过其来将变体多肽作为与外被蛋白的融合蛋白质展示在噬菌体颗粒表面的技术(Scott,J.K.和Smith,G.P.(1990)Science,249:386)。噬菌体展示的用途在于这样的事实，可以针对以高亲和力与靶分子结合的那些序列快速和有效地分选选择性随机化的蛋白质变体(或随机克隆的cDNA)的大文库。噬菌体上展示的肽(Cwirla,S.E.等,(1990)Proc.Natl.Acad.Sci.USA,87:6378)或蛋白质(Lowman,H.B.等,(1991)Biochemistry,30:10832；Clackson,T.等,(1991)Nature,352:624；Marks,J.D.等,(1991),J.Mol.Biol.,222:581；Kang,A.S.等,(1991)Proc.Natl.Acad.Sci.USA,88:8363)文库已用于针对具有特定结合特性的多肽或寡肽筛选成千上万的多肽或寡肽(Smith,G.P.(1991)Current Opin.Biotechnol.,2:668)。分选随机突变体的噬菌体文库需要构建和繁殖大量变体的策略、用靶受体进行亲和纯化的方法及评价结合富集的结果的手段。美国专利号5,223,409、5,403,484、5,571,689和5,663,143。

虽然大多数噬菌体展示法使用丝状噬菌体，但λ形噬菌体展示系统(WO 95/34683；U.S.5,627,024)、T4噬菌体展示系统(Ren等,Gene,215:439(1998)；Zhu等,Cancer Research,58(15):3209-3214(1998)；Jiang等,Infection&Immunity,65(11):4770-4777(1997)；Ren等,Gene,195(2):303-311(1997)；Ren,Protein Sci.,5:1833(1996)；Efimov等,VirusGenes,10:173(1995))和T7噬菌体展示系统(Smith&Scott,Methods inEnzymology,217:228-257(1993)；U.S.5,766,905)也是已知的。

其它改进增强了展示系统针对与选定靶分子的结合筛选肽文库和展示具有针对希望的特性筛选这些蛋白质的潜能的功能蛋白质的能力。已开发了用于噬菌体展示反应的组合反应装置(WO 98/14277)，噬菌体展示文库已用于分析和控制生物分子相互作用(WO 98/20169；WO 98/20159)及受限螺旋肽的特性(WO 98/20036)。WO 97/35196描述了分离亲和配体的方法，其中使噬菌体展示文库与配体在其中将与靶分子结合的一种溶液及亲和配体在其中将不与靶分子结合的第二溶液接触，以选择性分离结合配体。WO97/46251描述了这样的方法，用亲和纯化的抗体生物淘选随机噬菌体展示文库，然后分离结合噬菌体，接着用微孔板进行微淘选，以分离高亲和力结合噬菌体。已报道了金黄色葡萄球菌(Staphylococcus aureus)蛋白A作为亲和标记的用途(Li等,(1998)Mol Biotech.,9:187)。WO 97/47314描述了本底扣减文库在用可以是噬菌体展示文库的组合文库区分酶特异性中的用途。WO 97/09446中描述了用噬菌体展示选择适合用于去垢剂的酶的方法。美国专利号5,498,538、5,432,018和WO 98/15833中描述了选择特异性结合蛋白质的其他方法。

美国专利号5,723,286、5,432,018、5,580,717、5,427,908、5,498,530、5,770,434、5,734,018、5,698,426、5,763,192和5,723,323中也公开了产生肽文库和筛选这些文库的方法。

可以修饰结合多肽来增强它们的抑制和/或治疗作用(包括例如增强的亲和力，改善的药代动力学特性，如半衰期、稳定性和清除率，降低的毒性，等等)。这类修饰包括例如糖基化，聚乙二醇化，用非天然存在但功能上等同的氨基酸、连接基团取代等。

3.小分子

在一些方面，结合(如优先结合)遍在蛋白的特定构象形式(如本文提供的任意构象稳定形式的遍在蛋白)的物质是小分子化合物。小分子化合物是与本文公开的任意构象稳定的遍在蛋白结合的化合物。在一些实施方案中，该小分子化合物是遍在蛋白加工酶(如E1、E2或E3家族遍在蛋白加工酶的任意成员)拮抗剂。在一些实施方案中，该小分子化合物是脱遍在蛋白酶(如USP家族脱遍在蛋白酶的成员，例如USP7、USP5或USP14)拮抗剂。

小分子优选是除本文定义的结合多肽或抗体之外的与本文所述的任意构象稳定的遍在蛋白结合(如优先结合)的有机分子。有机小分子可以用已知的方法鉴定并化学合成(见例如PCT公开号WO00/00823和WO00/39585)。有机小分子的大小通常小于约2000道尔顿，备选地，大小小于约1500、750、500、250或200道尔顿，其中可以用公知的技术在不进行过多实验的情况下鉴定这类能够与本文所述的多肽结合的有机小分子。在这方面，应指出，用于针对能够与多肽靶标结合的分子筛选有机小分子文库的技术为本领域公知(见例如PCT公开号WO00/00823和WO00/39585)。有机小分子可以是例如醛、酮、肟、腙、缩氨基脲、卡巴肼、伯胺、仲胺、叔胺、N-取代的肼、酰肼、醇、醚、硫醇、硫醚、二硫化物、羧酸、酯、酰胺、脲、氨基甲酸酯、碳酸酯、缩酮、酮缩硫醇、缩醛、硫缩醛、芳基卤、芳基磺酸盐、烷基卤、烷基磺酸盐、芳香化合物、杂环化合物、苯胺、烯、炔、二醇、氨基醇、噁唑烷、噁唑啉、噻唑烷、噻唑啉、烯胺、磺酰胺、环氧化物、氮丙啶、异氰酸盐、磺酰氯、重氮化合物、酰基氯等。

在一些方面，该小分子化合物是组合化学药品文库的成分。组合化学药品文库是由更小的亚单位或单体组成的多种类别的化合物的汇集。组合文库具有多种大小，从数百至成千上万种不同类别的化合物。还存在多种文库类型，包括由诸如糖类、寡核苷酸和小的有机分子的化合物组成的寡聚和多聚文库等。这类文库具有多种用途，如化合物的固定和层析分开，以及在鉴定和表征能够结合受体分子(如c-met蛋白质)或介导目的生物学活性(如但不限于细胞增殖的抑制)的配体中的用途。

用于在固相支持物上合成化合物文库的多种技术为本领域已知。固相支持物通常是具有功能化来与亚单位或单体结合形成文库的化合物的表面的聚合物体。一个文库的合成通常涉及大量固相支持物。为了制备组合文库，使固相支持物以仔细控制的预先确定的化学反应顺序与化合物的一种或多种亚单位及与一种或多种试剂反应。换言之，文库亚单位在固相支持物上“生长”。文库越大，所需的反应的数目越大，使追踪构成文库的多种类别的化合物的化学组成的任务复杂化。在一些实施方案中，小分子的大小小于约2000道尔顿，备选地，大小小于约1500、750、500、250或200道尔顿。

本文的任意方面中所述的小分子物质可以衍生自可在固体支持物上进行的任意类型的化学反应。这类化学反应包括但不限于：2+2环加成，包括丁二烯的俘获；[2+3]环加成，包括异噁唑啉、呋喃和修饰肽的合成；缩醛形成，包括二醇、醛和酮的固定；羟醛缩合，包括醛的衍生化、丙二醇的合成；苯偶姻缩合，包括醛的衍生化；环缩合，包括苯二氮和乙内酰脲、噻唑烷、turn mimetics、卟啉、酞菁；Dieckmann环化，包括二酯的环化；Diels-Alder反应，包括丙烯酸的衍生化；亲电加成，包括醇与烯的加成；Grignard反应，包括醛的衍生化；Heck反应，包括双取代烯的合成；Henry反应，包括氧化腈的原位合成(见2+3环加成)；催化氢化，包括信息素和肽的合成(烯的氢化)；Michael反应，包括sulfanyl ketone、二环[2.2.2]辛烷的合成；Mitsunobu反应，包括芳基醚、肽酰磷酸酯和硫醚的合成；亲核芳香取代，包括喹诺酮的合成；氧化，包括醛和酮的合成；Pausen-Khand环加成，包括正菠二烯与1-戊炔-3-醇的环化；光化学环化，包括螺旋烃的合成；与有机金属化合物反应，包括醛和酰氯的衍生化；与配位氢化物和锡化合物还原，包括羰基、羧酸、酯和硝基的还原；Soai反应，包括羰基的还原；Stille反应，包括联苯基衍生物的合成；Stork反应，包括取代的环己酮的合成；还原性胺化，包括喹诺酮的合成；Suzuki反应，包括苯乙酸衍生物的合成；及Wittig-Horner反应，包括醛、信息素和sulfanyl ketone的反应。

公开化学文库的合成以及这些文库的单个化合物在单个固相支持物上的去卷积的参考文献可以见于美国专利申请号2009/0032592；Needels等,(1993),Proc.Natl.Acad.Sci.USA 90:10700-10704；和WO 97/15390中。

E.用构象稳定的遍在蛋白来测定遍在蛋白相关蛋白复合物成分的方法

在一些方面，本文提供用本文公开的任意构象稳定的遍在蛋白来测定动物细胞中的遍在蛋白结合蛋白复合物成分的方法。鉴于野生型遍在蛋白与遍在蛋白结合蛋白和加工酶的结合的瞬时性质，可以用上述稳定的遍在蛋白来确定细胞中的遍在蛋白结合蛋白复合物的一种或多种成分。由于基本上所有动物细胞都表达遍在蛋白，该方法适用于所有动物细胞，无论该方法是在体外、在体内或离体进行。在一些实施方案中，可以将编码本文公开的任意构象稳定的遍在蛋白的核酸转染入动物细胞。在一些实施方案中，该核酸在诱导型或组成型启动子的控制下整合入动物细胞的基因组。在一些实施方案中，该核酸处于诱导型或组成型启动子的控制下，且瞬时转染入动物细胞。还在另一实施方案中，可以按照本领域公知的方法产生包含该核酸的转基因非人动物。在任意以上实施方案中，编码构象稳定的遍在蛋白的核酸可以进一步包含亲和标记。在一些实施方案中，该亲和标记可以非限制性地是His标记(例如包含至少6个组氨酸残基的标记)、麦芽糖结合蛋白标记、HA标记或GST标记。在一些实施方案中，可以裂解包含本文公开的任意构象稳定的遍在蛋白的动物细胞，并通过本领域已知的任意数目的方法获得遍在蛋白结合蛋白复合物。这些非限制性地包括免疫沉淀、亲和纯化、层析方法，如但不限于大小排阻层析。然后可以通过公知的方法(如但不限于2D凝胶电泳和质谱分析法)确定与本文公开的任意构象稳定的遍在蛋白结合的蛋白质的身份。

在一些方面，用本文公开的任意构象稳定的遍在蛋白作为功能获得遗传工具来筛选遍在蛋白加工/蛋白水解途径的下游成分。例如，可以按照本领域已知的方法在酵母中表达本文所述的任意蛋白质来搜寻与例如遍在蛋白缀合机器的酶、遍在蛋白特异性蛋白酶及蛋白体的成分相互作用的蛋白质。

因此，本文提供用构象稳定的遍在蛋白(如本文公开的任意构象稳定的遍在蛋白)来测定遍在蛋白结合蛋白复合物的成分的方法。在一些实施方案中，该方法包括：1)在动物细胞中表达构象稳定的遍在蛋白；2)分离遍在蛋白结合蛋白复合物；和3)确定在动物细胞中与构象稳定的遍在蛋白结合的一种或多种蛋白质的身份。在一些实施方案中，该动物细胞是人细胞、非人灵长类细胞、啮齿动物细胞、酵母细胞、果萧细胞或斑马鱼细胞。在一些实施方案中，该动物细胞是癌细胞。在一些实施方案中，通过免疫沉淀、亲和标记层析或某种其他层析方法(如但不限于大小排阻层析、离子交换层析或疏水层析)来分离遍在蛋白结合蛋白复合物。

F.用于筛选蛋白质的构象稳定形式的方法

本发明还提供用于筛选蛋白质的构象稳定形式的方法，其中与野生型蛋白质相比，构象稳定的蛋白质具有提高的与结合配偶体的亲和力或提高的调节结合配偶体的活性(如酶促活性)的能力。在一些实施方案中，该方法包括使结合配偶体与蛋白质的突变体形式的文库接触，其中突变体形式的文库是通过在一个或多个预先选择的位置处用其他氨基酸残基取代构象动态蛋白质的一个或多个氨基酸残基而产生，其中该预先选择的位置定位在蛋白质的内部，并根据与结合配偶体的结合或与野生型蛋白质相比提高的调节(如提高或降低)结合配偶体的活性(如酶促活性)的能力来鉴定构象稳定的蛋白质。在一个实施方案中，该取代是随机取代。该蛋白质可以是天然显示多种构象状态的任意蛋白质。在一些实施方案中，可以通过诸如NMR或X射线晶体学的结构测定或诸如结合测定的功能测定来评价蛋白质中的多种构象状态。在一些实施方案中，构象动态蛋白质在其apo状态中具有运动。在一些实施方案中，构象动态蛋白质具有通过NMR或X射线晶体学评价的运动。显示多种构象状态的蛋白质可以包括但不限于遍在蛋白、酶(例如HIV蛋白酶或Ras)、核激素受体(例如雌激素受体或雄激素受体)或G蛋白偶联受体(GPCR)。在一些实施方案中，该取代导致在蛋白质中形成一个或多个二硫键。在另一实施方案中，该取代未导致在蛋白质中形成一个或多个二硫键。在一些实施方案中，除蛋白质内部那些预先选择的残基处的取代外，进行附加的取代(在随机位置或预先选择的位置)。

在一些实施方案中，蛋白质内部适合用其他氨基酸残基取代的预先选择的氨基酸残基可以根据每个位置处的氨基酸残基对蛋白质内或蛋白质的区域内的总体构象动态的贡献来选择。在一个实施方案中，可以用解析的构象动态蛋白质的高分辨率晶体结构系列来揭示动态蛋白质在溶液中或在结合于结合配偶体时所采用的一种或多种优先的构象状态。根据用晶体结构鉴定的蛋白质或蛋白质区域的位置，可以用计算搜索鉴定定位在构象动态蛋白质内部的氨基酸残基。在一个实施方案中，该计算搜索是单状态RosettaDesign。在一个实施方案中，该计算搜索是多状态RosettaDesign。

可以通过任意数目的方法来评估候选的构象稳定蛋白质。可以通过测定构象稳定蛋白质调节野生型蛋白质和结合配偶体之间的相互作用的能力来评估构象稳定蛋白质的特征。重要的特征之一是结合亲和力。可以以本领域已知的许多方式中的任一种来评估候选的目的构象稳定蛋白质的结合特征。评估候选的构象稳定蛋白质的另一种方法是用诸如R₂分散实验(对毫秒时间尺度上的运动敏感)和/或H_ZN_Z R_1ρR_ex测量(对微秒时间尺度上的运动敏感)的技术检查其蛋白质主链的构象稳定性程度。

本文还提供用于筛选构象稳定的遍在蛋白的方法，其中与野生型遍在蛋白相比，构象稳定的遍在蛋白具有提高的与结合配偶体的亲和力或提高的调节(如提高或降低)结合配偶体的活性的能力。在一些实施方案中，该方法包括使结合配偶体与遍在蛋白的突变体形式的文库接触，其中突变体形式的文库是通过在蛋白质内部的一个或多个预先选择的位置处用另一氨基酸残基随机取代野生型遍在蛋白的氨基酸序列中的氨基酸残基而产生，并根据与结合配偶体的结合或与野生型遍在蛋白相比提高的调节结合配偶体的活性的能力来鉴定构象稳定的遍在蛋白。在一些实施方案中，该结合配偶体是USP脱遍在蛋白酶。在一些实施方案中，该构象稳定的遍在蛋白选择性抑制(如完全抑制)USP脱遍在蛋白酶的酶促活性。在一个实施方案中，该脱遍在蛋白酶是USP7。本文还提供遍在蛋白的文库，其中该文库中的遍在蛋白在定位在A7、A8、A13、A34、A36、A69和A71的氨基酸残基位置处包含一个或多个用另一氨基酸进行的随机取代，其中该氨基酸位置是相对于SEQ ID NO:1。

该方法中的初始步骤可以包括产生一个或多个包含目的序列的候选的构象稳定蛋白质，然后在适于测定其与结合配偶体的结合特征的条件下展示。例如，可以用与诸如p3或p8的外被蛋白质的蛋白质融合来将候选的构象稳定蛋白质作为肽的羧基端(C端)展示文库展示在噬菌体或噬菌粒(例如丝状噬菌体(粒))的表面上。C端展示为本领域已知。见例如Jespers等,Biotechnology(N Y).13:378-82和WO 00/06717。这些方法可以用来制备本文所述的融合基因、融合蛋白质、载体、重组噬菌体颗粒、宿主细胞及其文库。如本文所述，在一些实施方案中，将候选的构象稳定蛋白质作为肽的氨基端(N端)展示文库展示在噬菌体或噬菌粒的表面上可以是有用的。N端噬菌体(粒)展示的方法包括本文所述的那些，以及本领域公知的那些，例如，如美国专利号5,750,373(和其中引用的参考文献)中所述。表征通过这些方法获得的结合分子的方法也为本领域已知，包括上文引用的参考文献(Jespers等,WO 00/06717和美国专利号5,750,373)中公开及本文中所述的那些。

1.结合噬菌体的分离

使具有展示的候选构象稳定蛋白质的噬菌体展示文库在体外与结合配偶体或其片段接触，以测定文库的与多肽结合的那些成员。可以用技术人员已知的任意方法来进行体外蛋白质结合测定。例如，可以进行1、2、3、4或5轮或更多轮结合选择(a.k.a“淘选”)，然后分离单个噬菌体，并可选地在噬菌体ELISA中分析。可以用噬菌体ELISA(Barrett等,Anal Biochem.204:357-64(1992))测定展示肽的噬菌体颗粒与固定的多肽的结合亲和力。

在评估候选物与已知的构象稳定蛋白质竞争结合多肽的能力的情况下，提供适当的结合竞争条件。例如，在一个实施方案中，可以在一个或多个浓度的已知的构象稳定蛋白质的存在下进行筛选/选择/生物淘选。在另一实施方案中，随后可以在已知的构象稳定蛋白质的存在下在竞争性ELISA测定中评估分离自文库的构象稳定蛋白质。

2.构象稳定的蛋白质的制备

构象稳定蛋白质可以作为包含稳定结构域的蛋白质片段或作为融合多肽用常规的合成或重组技术方便地产生。融合多肽用于其中多肽是靶标的噬菌体(粒)展示、表达研究、细胞定位、生物测定、ELISA(包括结合竞争测定)等。然后可以用亲和层析和与第二多肽结合的捕获试剂按照已知的方法纯化融合蛋白质。多肽可以融合至亲和序列，例如GST(谷胱甘肽S转移酶)序列的C端。这类融合蛋白质便于用例如结合于固体支持物和/或附着于固体支持物(例如用于肽筛选/选择/生物淘选的基质)的谷胱甘肽纯化重组多肽。其他示例性融合显示于表7中，包括这些融合的一些常见用途。

融合蛋白质可以容易地用重组方法产生。可以在多肽的N端、C端或内部将编码多肽(或其部分)的核酸与第二结构域编码核酸符合读框地融合。在一些实施方案中，该第二结构域在多肽的C端融合。融合基因还可以通过常规技术合成，包括自动化DNA合成仪。还使用PCR扩增，该PCR扩增使用在两个连续的基因片段之间产生互补突出端的锚定引物，两个连续的基因片段随后可以退火和再扩增来产生嵌合基因序列。许多便于将多肽符合读框地亚克隆至融合蛋白质的载体是市售的。

表7.用于融合多肽的第二多肽

作为融合蛋白质的实例，可以按以下方式从目的基因制备GST-多肽融合。以全长目的基因为模板，用PCR来扩增编码多肽的DNA片段，用引入方便的限制性核酸内切酶位点的引入来便于亚克隆。用适当的限制酶消化各扩增片段，并克隆入类似地消化的质粒，如pGEX6P-3或pGEX-4T-3，该质粒包含GST，且设计为这样，使得亚克隆的片段将与GST符合读框，且与启动子有效连接，产生编码GST-多肽的质粒。

为了产生融合蛋白质，包含适当表达质粒的大肠杆菌培养物通常例如在约37℃下在LB培养基中培养至中对数期(A₆₀₀＝1.0)，且可以用IPTG诱导。通过离心沉淀细菌，重悬在PBS中，并通过超声处理来裂解。离心悬液，并通过0.5ml谷胱甘肽-Sepharose上的亲和层析来从上清纯化GST-多肽。

对本领域技术人员而言，显而易见的是，许多变通形式都将达到分离构象稳定的蛋白质的目的，且可以用于本发明。例如，可以按上文所述构建与表位标记融合的构象稳定的蛋白质，并用该标记来亲和纯化构象稳定的蛋白质。还可以制备无任何融合的构象稳定的蛋白质；此外，可以使用体外化学合成，而不是用微生物载体来产生构象稳定的蛋白质。可以用其他细胞来产生构象稳定的蛋白质，如其他细菌、哺乳动物细胞(如COS)或杆状病毒系统。用于产生多种融合的多种多核苷酸载体也可得。构象稳定的蛋白质的最终纯化通常将取决于融合配偶体；例如聚-组氨酸标记融合可以在镍柱上纯化。

3.构象稳定的蛋白质的序列的测定

可以对以希望的特征与结合配偶体结合(可选地，不与不相关的序列结合)的噬菌体(粒)进行序列分析。在宿主细胞中扩增展示候选的构象稳定蛋白质的噬菌体(粒)颗粒，分离DNA，并用任意适当的已知测序技术测序适当部分的基因组(编码候选肽)。

4.通过亲和力成熟进一步增强结合

在一些方面，构象稳定的蛋白质与结合配偶体的结合可以通过亲和力成熟进一步增强。在亲和力成熟(Levin和Weiss,Mol.BioSyst.2:49,2006)中，用诱变来改变蛋白质表面的残基，并针对改善的与结合配偶体的结合筛选所得到的突变蛋白质。亲和力成熟的几种方法为本领域已知。这些方法包括经噬菌体(Gram等PNAS 89:3576,1992；Lowman等,J.Mol.Biol.,1993,234,564)、核糖体展示(Lipovsek等J.Immunol.Methods 290(2004),51-67页)、酵母表面展示(Graff等Protein Eng.Des.Sel.17(2004),293-304页)、易错PCR(Schlapschy等Protein Eng.Des.Sel.17(2004),847860页)、增变细菌菌株(Low等J.Mol.Biol.260:359,1996)、逐步聚焦诱变(Wu等PNAS 95:6037,1998)和饱和诱变(Nishimiya等J.Biol.Chem.275:12813,2000；Yang等J.Mol.Biol.254:392,1995；Chowdhury和Pastan,Nat.Biotechnol.17:568,1999)进行的亲和力成熟。其他技术通常用丙氨酸扫描或位点定向诱变来产生特定变体的有限汇集。

5.结合测定

形成构象稳定的蛋白质和结合配偶体的复合物便于将复合形式从其未复合形式及从杂质分开。构象稳定的蛋白质融合可以在溶液中或在结合配偶体之一结合于不溶性支持物的环境中形成。复合物可以例如用柱层析从溶液分开，且可以用公知的技术通过过滤、离心等在与固体支持物结合的同时分开。因此，构象稳定的蛋白质与固体支持物结合便于高通量测定。

可以在候选结合化合物的存在和缺乏下针对调节(例如提高)构象稳定的蛋白质与结合配偶体的相互作用和/或活性的能力筛选测试化合物，且筛选可以在任意适宜的容器中达到，如微量滴定板、试管和离心管。还可以制备融合蛋白质来便于测试或分开，其中融合蛋白质包含允许该蛋白质中的一个或两个结合于基质的附加结构域。例如，GST-构象稳定蛋白质融合蛋白质可以吸附至谷胱甘肽琼脂糖球珠(SIGMA Chemical,St.Louis,MO)或谷胱甘肽衍生的微量滴定板上，然后将其与测试化合物组合，并在允许复合物形成的条件下(例如在生理条件的盐和pH下)孵育混合物。孵育后，洗涤球珠或微量滴定板孔来去除任意未结合的成分，在球珠的情况下去除固定的基质，并直接或间接测定复合物。备选地，可以从基质解离融合，并用标准技术测定结合或活性的水平。

用于将蛋白质固定在基质上的其他融合多肽技术也可以用于筛选测定。可以用生物素-抗生物素蛋白或生物素-链霉抗生物素蛋白系统固定构象稳定的蛋白质或结合配偶体。可以用诸如生物素-N-羟基-琥珀酰亚胺(NHS；PIERCE Chemicals,Rockford,IL)的许多试剂来达到生物素化，并固定在链霉抗生物素蛋白包被的96孔板(PIERCE Chemical)的孔中。备选地，可以将与构象稳定的蛋白质或结合配偶体反应但不干扰结合肽与其靶分子的结合的抗体衍生至孔板的孔，并通过抗体缀合来将未结合的构象稳定的蛋白质或结合配偶体捕获在孔中。除针对GST固定的融合描述的那些之外，用于检测这类融合的方法包括用与结合配偶体或构象稳定的蛋白质反应的抗体对融合进行免疫检测。

6.结合测定：ELISA

为了评估构象稳定的蛋白质的结合亲和力，可以使用竞争结合测定，其中评估构象稳定的蛋白质结合结合配偶体的能力(和结合亲和力，如果希望)，并与已知结合构象稳定的蛋白质的化合物(例如，通过本文所述的噬菌体展示测定的高亲和力结合肽)的能力相比较。

许多方法是已知的，且可以用来鉴定构象稳定的蛋白质与结合配偶体的结合亲和力；例如，可以用ELISA将结合亲和力测定为Kd值。例如，在固相测定中，可以通过用neutravidin、抗生物素蛋白或链霉抗生物素蛋白包被微孔板(优选处理为有效吸附蛋白质)来制备测定板。然后通过加入牛血清白蛋白(BSA)或其他蛋白质(例如脱脂乳)的溶液来封闭非特异性结合位点，然后优选用含去垢剂(如Tween-20)的缓冲液洗涤。制备生物素化的已知的构象稳定蛋白质(例如，与GST或其他这种分子融合以便于纯化和检测的噬菌体肽)并与平板结合。制备待测试的结合配偶体的系列稀释液，并与结合的构象稳定蛋白质接触。洗涤用固定的构象稳定蛋白质包被的平板，然后将各结合反应加至孔中，并短暂孵育。进一步洗涤后，通常用识别融合配偶体的抗体和识别一抗的标记(如辣根过氧化物酶(HRP)、碱性磷酸酶(AP)、或萦光标记，如萦光素)二抗检测结合反应。然后用适当底物(取决于标记)显示平板，并来例如用分光光度读板器定量信号。可以用最小二乘法拟合将吸光度信号拟合至结合曲线。从而可以测量多种结合配偶体结合构象稳定蛋白质的能力。

V.用途的实例

本文所述的构象稳定蛋白质(如构象稳定的遍在蛋白)的鉴定和表征提供了对野生型蛋白质的细胞功能的有价值的了解，并提供了用于调节这些蛋白质和它们的结合配偶体之间的体内相互作用的组合物和方法。例如，这些构象稳定蛋白质可以用来增强体内结合相互作用及改变一种或多种结合配偶体的活性(例如酶促活性)。根据它们相对于本文提供的良好表征的构象稳定蛋白质的结合和/或功能特征，可以方便地产生同源物。这些构象稳定的蛋白质同源物可以进一步用来鉴定与野生型构象动态蛋白质结合的细胞蛋白质及其存在于体内蛋白复合物中的结合配偶体。

良好表征的中等亲和力至高亲和力的构象稳定蛋白质(如构象稳定的遍在蛋白，如本文所述的那些中的任一个)可以进一步用来阐明结合配偶体自身的重要结构特征。本发明提供本文公开的构象稳定蛋白质变体，其具有增强的结合和/或活化一种或多种结合配偶体靶标的能力。其他变体可以类似地鉴定。

根据本文所述的方法发展的构象稳定蛋白质可以用来达到目的调节作用。例如，这种操作可以包括活化构象稳定蛋白质与它的同族结合配偶体(例如，在遍在蛋白的情况下，脱遍在蛋白酶)之间的结合。在另一实例中，这种操作可以包括通过例如诱导由构象稳定蛋白质的结合引起的细胞功能，或通过增强构象稳定蛋白质和它的同族结合配偶体之间的结合而产生的调节(如提高或降低)作用。

构象稳定蛋白质(如构象稳定的遍在蛋白)的其他用途包括用于与蛋白质的野生型形式(例如蛋白质的野生型构象动态形式)及其结合配偶体相关的疾病的诊断测定，融合蛋白质中的构象稳定蛋白质和结合配偶体作为纯化把手(purification handle)和基底锚(anchor的用途。

本文所述的能够以不同亲和力与结合配偶体(如USP家族的脱遍在蛋白酶)结合的构象稳定蛋白质(如构象稳定的遍在蛋白)的鉴定为调节生物学上重要的体内相互作用提供了有用的途径。因此，能够调节这些相互作用的构象稳定蛋白质的鉴定指向治疗和/或诊断应用的途径及在缺乏这类分子和相互作用的知识的情况下将不可能的策略。

可以用本领域已知的适当给药途径(例如经显微注射、antenapedia肽或脂质转染试剂)将构象稳定蛋白质(如构象稳定的遍在蛋白)递送入活细胞，以调节和在一些情况下验证蛋白质的构象稳定形式及其与一种或多种结合配偶体的相互作用在特定组织、细胞、器官或病理条件中的生理学重要性。存在监测构象稳定蛋白质与结合配偶体的相互作用及调节该相互作用的生理学作用的适宜的测定。最后，可以将稳定蛋白质递送入活细胞或动物模型(其是疾病的模型(即模拟疾病的某些特性))来确定与目的结合配偶体的结合或相互作用是否提供与治疗益处的预期相一致的结果。

检测蛋白质-蛋白质(或肽)体内相互作用的方法为本领域已知。例如，可以用Michnick等在美国专利号6,270,964B1和6,294,330B1中所述的方法来分析构象稳定蛋白质(包括本文所述的任一个)和同族结合配偶体(包括本文所述的任一个)的相互作用和/或活性。

构象稳定蛋白质可以用作用于上文针对构象稳定的遍在蛋白所述的任意方法的工具。例如，构象稳定蛋白质可以用作工具来1)筛选与构象稳定蛋白质结合(如优先结合)的物质；2)筛选破坏构象稳定蛋白质/结合配偶体蛋白复合物的物质；3)抑制一种或多种结合配偶体的酶促活性；或4)确定在表达稳定蛋白质的野生型形式的细胞中与构象稳定蛋白质结合的蛋白复合物的一种或多种成分的身份。此外，构象稳定蛋白质不仅限于这些用途，还可以用作本领域已知的任意其他方法的工具。

本文所述的构象稳定的遍在蛋白可以用来在体内抑制脱遍在蛋白酶靶蛋白的脱遍在蛋白化。例如，如果在动物细胞中表达，则可以用构象稳定的遍在蛋白来防止靶蛋白的脱遍在蛋白化，该构象稳定的遍在蛋白就对靶蛋白特异的脱遍在蛋白酶的酶促活性而言为抑制性的。例如，以这种方式使用构象稳定的遍在蛋白可以增加靶蛋白将在蛋白体中经历蛋白水解降解的变化。类似地，可以在体内使用本文公开的构象稳定的遍在蛋白来增强或维持一种或一类靶蛋白的遍在蛋白化状态。例如，一种这样的靶蛋白是癌蛋白Mdm2，其涉及几种类型的癌症的发展，包括软组织肉瘤和骨肉瘤以及乳腺肿瘤。脱遍在蛋白酶USP7特异性脱遍在蛋白化Mdm2，Mdm2转而导致p53肿瘤抑制蛋白的下调。因此，用构象稳定的遍在蛋白(如本文所述的那些中的任一种)抑制USP7的酶促活性可间接导致p53肿瘤抑制蛋白的维持。

VI.药物制剂

通过将具有希望的纯度的这类构象稳定蛋白质与一种或多种可选的可药用载体混合，以冻干制剂或水溶液的形式制备本文所述的构象稳定蛋白质(如构象稳定的遍在蛋白)的药物制剂。可药用载体在所利用的剂量和浓度下一般对受体无毒性，且包括但不限于：缓冲剂，如磷酸、柠檬酸和其他有机酸；抗氧化剂，包括抗坏血酸和甲硫氨酸；防腐剂(如十八烷基二甲基苄基氯化铵；氯化六甲双铵；苯扎氯铵；苄索氯铵；苯酚、丁醇或苯甲醇；对羟基苯甲酸烷基酯，如对羟基苯甲酸甲酯或丙酯；儿茶酚；间苯二酚；环己醇；3-戊醇；和间甲酚)；低分子量(少于约10个残基)多肽；蛋白质，如血清白蛋白、明胶或免疫球蛋白；亲水聚合物，如聚乙烯吡咯烷酮；氨基酸，如甘氨酸、谷氨酰胺、天冬酰胺、组氨酸、精氨酸或赖氨酸；单糖、二糖和其他糖类，包括葡萄糖、甘露糖或糊精；螯合剂，如EDTA；糖，如蔗糖、甘露醇、海藻糖或山梨醇；成盐抗衡离子，如钠；金属络合物(例如，Zn-蛋白质络合物)；和/或非离子型表面活性剂，如聚乙二醇(PEG)。本文的示例性可药用载体进一步包括间质药物分散剂，如可溶性中性活性透明质酸酶糖蛋白(sHASEGP)，例如人可溶性PH 20透明质酸酶糖蛋白，如rHuPH20(Baxter International,Inc.)。某些示例性sHASEGP和使用方法(包括rHuPH20)描述于美国专利公开号2005/0260186和2006/0104968中。在一方面，sHASEGP与一种或多种附加的糖胺聚糖酶(如软骨素酶)组合。

本文的制剂还可以包含所治疗的具体适应症所必需的一种以上活性成分，优选相互无不利影响的具有互补活性的那些。这类活性成分以对预期目的有效的量适宜地组合存在。

构象稳定蛋白质(如构象稳定的遍在蛋白)可以包载在例如通过凝聚技术或通过界面聚合制备的微囊(例如，分别为羟甲基纤维素微囊或明胶微囊和聚-(甲基丙烯酸甲酯)微囊)中、胶体药物递送系统(例如脂质体、白蛋白微球、微乳、纳米颗粒和纳米囊(nanocapsule))中或粗滴乳状液中。这类技术公开于Remington's Pharmaceutical Sciences第16版,Osol,A.编辑(1980)中。

可以制备持续释放制剂。持续释放制剂的适宜实例包括含有构象稳定蛋白质(如构象稳定的遍在蛋白)的固体疏水聚合物的半透性基质，该基质是成形物品(例如膜或微囊)的形式。

将要用于体内施用的制剂通常是无菌的。可以例如通过滤过无菌滤膜来容易地达到无菌。

VII.从筛选获得的构象稳定的蛋白质和物质的治疗用途

具有提高或降低构象动态蛋白质(例如遍在蛋白)的结合配偶体的活性(如酶促活性)的特性的物质是有用的。此活性调节可以以多种方式产生，例如通过对有需要的个体施用有效量的一种或多种本文所述的构象稳定蛋白质(如构象稳定的遍在蛋白)，或通过施用获自本文公开的任意筛选方法的任意物质。

任意构象稳定蛋白质或用本文公开的任意筛选方法获得的任意物质都可以用于治疗方法。在一方面，提供构象稳定蛋白质(如构象稳定的遍在蛋白)用作药物。在一个这种实施方案中，该方法进一步包括对个体施用有效量的至少一种例如下文所述的附加治疗剂。以上实施方案中任一个的“个体”优选是人。在另一方面，本发明提供构象稳定蛋白质(如构象稳定的遍在蛋白)在制造或制备药物中的用途。在一个这种实施方案中，该方法进一步包括对个体施用有效量的至少一种例如下文所述的附加治疗剂。以上实施方案中任一个的“个体”可以是人。

在另一方面，提供获自本文公开的任意筛选方法的物质用作药物。在一个这种实施方案中，该方法进一步包括对个体施用有效量的至少一种例如下文所述的附加治疗剂。以上实施方案中任一个的“个体”优选是人。在另一方面，本发明提供获自本文公开的任意筛选方法的物质在制造或制备药物中的用途。在一个这种实施方案中，该方法进一步包括对个体施用有效量的至少一种例如下文所述的附加治疗剂。

在另一方面，本文提供包含任意构象稳定蛋白质(如构象稳定的遍在蛋白)或获自本文公开的任意筛选方法的物质的药物制剂，例如用于以上治疗方法中的任一个。在一个实施方案中，药物制剂包含本文提供的任意构象稳定蛋白质和可药用载体。在一个实施方案中，药物制剂包含获自本文公开的任意筛选方法的物质和可药用载体。在另一实施方案中，药物制剂包含本文提供的任意构象稳定蛋白质或获自本文公开的任意筛选方法的物质和至少一种例如下文所述的附加治疗剂。

本文所述的构象稳定蛋白质或获自本文公开的任意筛选方法的任意物质可以在治疗中单独使用或与其他物质组合使用。例如，本发明的构象稳定蛋白质可以与至少一种附加治疗剂共同施用。

上文指出的这类联合治疗涵盖组合施用(其中两种或多种治疗剂包含在相同的或分开的制剂中)和分开施用，在分开施用的情况下，本文所述的构象稳定蛋白质的施用可以在施用附加治疗剂之前、同时和/或之后发生。

本文所述的构象稳定蛋白质(如构象稳定的遍在蛋白)或获自本文公开的任意筛选方法的任意物质可以通过包括胃肠外、肺内和鼻内的任意适宜的方式施用，如果希望进行局部治疗，还可以病灶内施用、局部施用或眼内施用。胃肠外输注包括肌内、静脉内、动脉内、腹膜内或皮下施用。部分取决于施用是短暂的还是长期的，可以通过任意适宜的途径，例如通过注射(如静脉内或皮下注射)来给药。本文考虑多种给药方案，其包括但不限于在多个时间点单次或多次施用、快速注射施用和脉冲输注。

应以符合良好医疗规范的方式配制、给药和施用构象稳定蛋白质(如构象稳定的遍在蛋白)或获自本文公开的任意筛选方法的物质。此背景中考虑的因素包括所治疗的具体障碍、所治疗的具体哺乳动物、个体患者的临床病症、障碍的原因、物质的递送部位、施用方法、施用方案及医疗从业人员已知的其他因素。构象稳定蛋白质或获自本文公开的任意筛选方法的物质无需但可选地与目前用来预防或治疗所讨论的障碍的一种或多种物质配制在一起。这类其他物质的有效量取决于存在于制剂中的构象稳定蛋白质的量、障碍或治疗的类型及上文讨论的其他因素。这些物质通常以相同的剂量和本文所述的给药途径使用，或是本文所述剂量的约1-99％，或以经验上/临床上确定为适当的任意剂量和任意途径使用。

对于疾病的预防或治疗，构象稳定蛋白质或获自本文公开的任意筛选方法的物质(在单独使用或与一种或多种其他附加治疗剂组合使用时)的适当剂量将取决于待治疗的疾病的类型、构象稳定蛋白质(例如构象稳定的遍在蛋白)或获自本文公开的任意筛选方法的物质(例如抗体或小分子化合物)的类型、疾病的严重度和病程、为了预防还是治疗的目的而施用构象稳定蛋白质或获自本文公开的任意筛选方法的物质、患者的临床病史和对构象稳定蛋白质或物质的反应及主治医师的判断。在一次或一系列的治疗中适宜地对患者施用构象稳定蛋白质或获自本文公开的任意筛选方法的物质。取决于疾病的类型和严重度，约10ng/kg到至多约100mg/kg(例如0.01至约500mg/kg)的构象稳定蛋白质或物质可以是例如通过一次或多次分开的施用或通过连续输注来对患者施用的初始候选剂量。优选地，剂量水平将为约0.1至约250mg/kg每天；更优选约0.5至约100mg/kg每天。适宜的剂量水平可以是约0.01至约250mg/kg每天、约0.05至约100mg/kg每天或约0.1至约50mg/kg每天。在此范围之内，剂量可以是约0.05至0.5、0.5至5或5至50mg/kg每天中的任一个。对于口服施用，组合物优选以含有约1.0至约1000毫克活性成分的片剂的形式提供，对于待治疗的患者的剂量的症状调整，尤其是约1.0、5.0、10.0、15.0、20.0、25.0、50.0、75.0、100.0、150.0、200.0、250.0、300.0、400.0、500.0、600.0、750.0、800.0、900.0和1000.0毫克活性成分中的任一个。化合物可以按每天1至4次、优选每天1次或2次的方案施用。这类剂量可以间歇施用，例如每周或每三周，例如使得患者接受约2个至约20个，或例如约6个剂量的构象稳定蛋白质。可以施用较高的初始负荷剂量，然后施用一个或多个较低的剂量。但是，可以使用其他剂量方案。通过常规技术和测定容易地监测此治疗的进展。

VIII.制成品

在另一方面，提供包含用于治疗、预防和/或诊断上述疾病和/或障碍的材料的制成品。制成品包含容器及容器上或伴随容器的标签或包装说明书。适宜的容器包括例如瓶、小管、注射器、IV溶液袋等。容器可以形成自多种材料，如玻璃或塑料。容器容纳组合物，该组合物本身或与另一组合物组合对治疗、预防和/或诊断该疾病和/或障碍有效，且可以具有无菌接口(例如容器可以是具有可通过皮下注射针头穿孔的塞子的静脉内溶液袋或小管)。组合物中的至少一种活性剂是构象稳定蛋白质(如构象稳定的遍在蛋白)或获自本文公开的任意筛选方法的物质。标签或包装说明书指示该组合物用于治疗所选择的疾病和/或障碍。此外，制成品可以包含(a)含有组合物的第一容器，其中该组合物包含本文所述的构象稳定蛋白质或获自本文公开的任意筛选方法的物质；和(b)含有组合物的第二容器，其中该组合物包含附加的治疗剂。本发明的此实施方案中的制成品可以进一步包含指示该组合物可以用来治疗具体的疾病和/或障碍的包装说明书。备选地，或此外，制成品可以进一步包含第二(或第三)容器，该容器包含可药用缓冲液，如抑菌性注射用水(BWFI)、磷酸缓冲盐溶液、林格溶液和葡萄糖溶液。它可以进一步包含商业和用户角度希望的其他材料，包括其他缓冲液、稀释液、滤器、针头和注射器。

实施例

以下是本发明的方法和组合物的实施例。应理解，由于上文提供的一般描述，可以实施多种其他实施方案。

实施例1：改造构象稳定的遍在蛋白

此实施例说明用于鉴定和改造构象稳定蛋白质的构象展示新技术。与通常突变表面位置来发现新的焓接触(enthalpic contact)的传统噬菌体展示不同，构象展示筛选埋藏的氨基酸残基来鉴定产生最佳结合构象的新包装排列。从而将具有少数紧密结合构象的柔性分子转化为主要采用高亲和力构象的稳定分子(图1A)。

细胞信号级联放大通常聚集在大量结合配偶体识别的“集线器”蛋白质上。²³遍在蛋白是高度保守的真核信号发放集线器，其在翻译后通过与遍在蛋白羧基端的异肽键附着于底物蛋白质赖氨酸。每个遍在蛋白连接类型携带不同的信号，用严密调节的遍在蛋白链加工来传送多种细胞信息。²⁴因此，已将遍在蛋白加工的失调与包括肿瘤发生和神经变性的几种疾病状态相联系。^25-26

遍在蛋白通过三部分的E1-E2-E3酶促级联标准地附着于底物。遍在蛋白的去除由几个家族的称为脱遍在蛋白酶(DUB)的异肽酶催化。存在约100种人DUB，每种DUB具有不同的底物特异性和酶促特性，暗示基本上未研究过的大量信号调节。两个著名的DUB家族是遍在蛋白C端水解酶(UCH)和遍在蛋白特异性蛋白酶(USP)。UCH主要负责通过从其羧基端去除诸如胞内亲核体和短肽的小的部分来回收遍在蛋白。USP通常作为信号发放调节物发挥作用，通过切割将大的部分(如整个蛋白质)连接至遍在蛋白的异肽键来调节遍在蛋白链。

apo遍在蛋白最近的NMR和计算研究(很大程度上依靠一大组残留偶极耦合的透彻分析)已表明，遍在蛋白的构象可塑性对某些配偶体对它的识别可以十分重要。²⁸此工作表明，β1-β2环区在快速微秒时间尺度上是可移动的，结合配偶体可以从这种已有的平衡中选择不同的构象，但存在几篇矛盾的报道，遍在蛋白相互作用不能仅归因于构象选择结合机制。^29-30虽然这些研究强调构象动态在遍在蛋白识别中的重要性，但这些构象变化影响遍在蛋白-配偶体相互作用的生物学功能的模式尚未得到鉴定，也未研究过扰乱这类运动的结果。

在遍在蛋白的情况下，由于亲本主链构象可能代表具有多种折叠的几种结合配偶体(例如脱遍在蛋白酶、连接酶等)的折衷，容纳单种配偶体的序列的选择还可以鉴定出不见于自然界中的高亲和力构象。因此，此研究部分试图确定不同的DUB是否通过识别其构象整体中的子态来利用遍在蛋白动态。这种区分将在概念上将来自单个实体的遍在蛋白集线器分为一组相关但构象独特的结合配偶体。

材料和方法

脱遍在蛋白酶表达和纯化

将编码脱遍在蛋白酶构建体的DNA克隆入具有TEV可切割的N端6x His标记和C端Avi标记的pET衍生载体，并通过与含有BirA的表达质粒共表达来在大肠杆菌中表达为生物素化的蛋白质。通过质谱分析法确认生物素化。生物素化的催化结构域构建体是USP7残基208-554、USP14残基91-494和UCHL5残基1-228。将UCHL1和UCHL3纯化为全长蛋白质。催化部位突变是USP7C223A、USP14C114A、UCHL1C90A、UCHL3C95A和UCHL5C88A。表达后，通过以下来将蛋白质纯化至同质：通过Ni-NTA柱，用TEV蛋白酶切割His标记，再次通过镍柱，在S-200或S-75凝胶过滤柱(GE Life Sciences)上纯化。对于酶促测定，未生物素化的USP2催化结构域、USP5、USP10、USP47和USP7获自BostonBiochem。

遍在蛋白变体表达和纯化

按之前所述将编码遍在蛋白变体的DNA克隆入具有N端6x His标记的pET衍生载体并在大肠杆菌中表达。⁴⁵通过Ni-NTA亲和层析接着S75大小排阻层析来纯化蛋白质。

在M13噬菌体上展示遍在蛋白

通过修饰之前所述的噬菌粒pS2202b来将遍在蛋白展示在M13噬菌体的表面上。用标准分子生物学技术来用编码遍在蛋白的DNA片段取代pS2202b的编码Erbin PDZ结构域的片段。所得到的噬菌粒p8Ub包含可读框，该可读框编码麦芽糖结合蛋白分泌信号，接着gD标记和遍在蛋白，并以主要外被蛋白p8结束。用M13-KO7辅助噬菌体共感染包含p8Ub的大肠杆菌，并按标准流程扩增。²按照标准流程纯化繁殖的噬菌体，并重悬在1ml PBT缓冲液(PBS、0.5％BSA和0.1％Tween 20)中，导致包封了p8Ub DNA并展示遍在蛋白的噬菌体颗粒的产生。按以下用噬菌体ELISA分析了展示水平：将2μg/ml抗-gD抗体固定在Maxisorp免疫平板上并封闭，将1:3系列稀释的展示gD-遍在蛋白的噬菌体加至孔中。洗涤平板，通过抗-M13-HRP接着TMB底物来检测结合的噬菌体。

文库构建和分选

用Kunkel诱变法构建遍在蛋白文库。用NNK密码子随机化残基T7、L8、I13、E34、I36、L69和L71。用终止模板(p8Ub的单链DNA，其在T7-I13、E34-I36和L69-L71的区域中含有三个终止密码子)来构建含有～5x 1010个独特成员的文库。使文库循环通过溶液中的针对具有C223A突变(命名为USP7catC223A)的USP7的C端单生物素化催化结构域(残基208-554)的多轮结合选择。对于第一轮，将20μg生物素化的USP7catC223A与1ml噬菌体文库(～1×10¹³pfu/ml)在4℃孵育2小时，并通过200μl之前已用封闭缓冲液(PBS，1％BSA)封闭的MyOne链霉抗生物素蛋白在室温下捕获15分钟。弃上清，用PBS、0.1％Tween20洗涤球珠三次。用400μl 0.1M HCl洗脱结合的噬菌体7分钟，并立即用60μl的1M Tris、pH 13中和。按Tonikian等2007²所述扩增所洗脱的噬菌体。对于第二轮，除使用10μg生物素化的USP7catC223A和100μl Dynabead外，流程与第一轮相同。对于第三轮和第五轮，将2μg生物素化的USP7catC223A与来自前一轮的扩增噬菌体孵育，并通过之前用封闭缓冲液处理的NeutrAvidin包被平板捕获噬菌体-USP7catC223A复合物。除用链霉抗生物素蛋白包被的平板来捕获生物素-USP7catC223A-噬菌体复合物外，第四轮与第三轮相同。按标准流程在30℃下在含M13-KO7辅助噬菌体的大肠杆菌XL1-blue中繁殖噬菌体。⁴⁶

结果

由于所有DUB都与遍在蛋白的β1/β2区结合但可分为几个结构家族，假定一些类型的DUB可识别遍在蛋白的不同构象状态。为了研究此问题，用至少一种配偶体进行了复合物中的遍在蛋白的全部56个可用的高分辨率晶体结构的配对比对，结果根据β1/β2的均方根偏差(RMSD)聚类。聚类分析将表观“弥散”的β1-β2环构象(图2A)分为具有细微家族内差异的构象家族(图2B)。这些原子“快照”暗示，遍在蛋白的β1-β2环进入一系列子态，各子态之间具有微小的能障，与子态之间的快速转换一致。²⁸最大的聚类(聚类1)代表β1-β2区的“上”构象，且包含与UCH型DUB复合的所有遍在蛋白结构，表明UCH结合“上”构象(图2C-D)。相反，聚类2代表“下”β1-β2构象，且包含迄今已结晶的每种USP型DUB-遍在蛋白复合物。值得注意的是，UCH型DUB通常以纳摩尔亲和力结合遍在蛋白，且UCH结合态也与apo遍在蛋白聚类，表明“上”状态可以在溶液中占优势。相反，USP型DUB通常对遍在蛋白具有高微摩尔亲和力，且USP结合态在apo遍在蛋白的晶体结构中都未观察到，仅可通过对纳秒至微秒时间尺度上的运动敏感的NMR测量检测到。²⁸因此，“下”状态在溶液中可以仅微弱地存在。“上”和“下”构象的比较揭示了每种状态的显著不同的包装，长期作用以也可以影响与DUB的结合的方式从β1-β2传递至C端。例如，“下”构象使Leu8伸向Leu71，作为杠杆臂将C端推向将它置于与USP型DUB的活性部位相互作用的构象(如2E)。计算停靠也显示DUB与“上”或“下”遍在蛋白构象体的结合相互排斥；UCH家族的酶倾向于结合“上”状态，而USP家族脱遍在蛋白酶结合“下”状态(图30)。

为了以希望的构象稳定遍在蛋白，将全长人遍在蛋白展示在gD标记融合至其N端的M13噬菌体主要(p8)或次要(p3)外被蛋白上。噬菌体表面gD标记的检测显示，两种外被蛋白上的展示水平相似(数据未显示)。由于蛋白质核心的广大和协作，有效的构象展示呈现对哪些位置促成目的区域内的运动的理解。因此，用计算蛋白质设计来鉴定遍在蛋白内显示对采用USP结合态并非最佳且在不同USP间接触可变表面的埋藏氨基酸位置(如3)。在p8或p3展示的遍在蛋白文库中随机化得到的7个位置(Thr7、Leu8、Ile13、Glu34、Ile36、Leu69和Leu71)，并针对USP7催化结构域的催化失活突变体进行选择。

从p8展示的遍在蛋白文库鉴定出总计69个独特序列。这些克隆的约90％在位置7和69处都都包含半胱氨酸，一些用Cys8取代Cys7(如1B)。由于位置7/8和69在遍在蛋白的三级结构中相对，这立即暗示稳定USP7结合构象的二硫键的存在。仅7个独特克隆缺乏二半胱氨酸基序，并在后文中命名为“非二硫键”结合剂(图1B)。与野生型遍在蛋白相比，二硫键和非二硫键结合剂都显示几个显著的序列改变。碱性残基(大多数为Arg，少数为Lys)在所有克隆中在位置71处高度保守；位置34专一性地从野生型中的Glu变为疏水残基(Ile、Leu或Val)；位置36在二硫键克隆中主要是芳族残基(Tyr和Phe)。对于含有二硫键的结合剂，位置13优选极性残基(Arg、His、Ser、Lys和Asn)，而非二硫键克隆优选酪氨酸。

为了测试USP7选择的构象结合剂(命名为“U7UbXX”(其中XX是克隆编号))的特异性，在噬菌体斑点ELISA中针对一系列DUB测试了24个噬菌体展示的克隆。如图1C中所示，这些克隆全都特异性结合USP7，对USP14、UCHL1、UCHL3和UCHL5没有可检测到的结合信号。

表8.U7Ub变体对脱遍在蛋白酶的平衡解离常数(nM)

	USP7^§	USP14^§	UCHL1	UCHL3
					野生型	ND	ND	385²¹	500²²
U7Ub7	200±22	ND	ND	ND
					U7Ub25	86±2	ND	ND	ND
U7Ub25.2540	36±2	ND	ND	ND

^§催化结构域活性位点突变体；ND＝检测不到

为了定量作为纯化的蛋白质的U7Ub变体的结合，将8个克隆转移至N端His标记的pET表达载体。表达并纯化至同质后，通过在遍在蛋白变体的单个浓度下测量稳态反应来测定经生物层干涉量度法的相对亲和力(如4A)。后续生物层干涉量度法揭示，两种最紧密的结合剂U7Ub7(二硫键)和U7Ub25(非二硫键)对USP7的催化核心具有小于200nM的亲和力(表8和9；图4B)。等温滴定量热法确认，U7Ub25按1:1复合物紧密结合USP7的催化核心(图1C)，且具有约190nM的亲和力。值得注意的是，野生型遍在蛋白与USP7的结合在至多200μM的浓度下几乎检测不到(数据未显示¹⁰)，揭示这些最初选择的遍在蛋白变体具有改善1,000倍以上的亲和力。

表9.遍在蛋白变体对USP7catC223A的解离常数，获自生物层干涉量度法数据的稳态和动力学拟合。

	U7Ub7	U7Ub25	U7Ub25.2540
				Kd(稳态)nM	200±22	86±2	36±2
K_on(1/Ms)E+04	1.80±0.95	7.32±0.78	12.5±2.2
				K_off(1/Ms)E-03	7.01±0.56	8.83±0.81	5.48±0.79
Kd(动力学)nM	353±16	121±1	44±2

此实施例验证了构象展示的新技术，鉴定出构象异质遍在蛋白的不能以其他方式在自然界中发现的构象稳定变体。此外，这种新的稳定的遍在蛋白以比野生型遍在蛋白高一千倍的亲和力与脱遍在蛋白酶USP7结合。

实施例2：构象稳定的遍在蛋白的表面成熟

由于构象设计的文库不集中在野生型遍在蛋白表面的残基上，这样做将进一步改善对USP7的亲和力是合乎逻辑的。因此，此实施例证明可以用表面成熟来进一步增强构象稳定蛋白质与底物的结合。

材料和方法

U7Ub25的亲和力成熟

用Kunkel诱变法构建亲和力成熟文库。用掺杂密码子“温和随机化(soft randomized)”表面残基Q2、F4、T14、Q40、R42、A46、G47、Q49、Q62、E64、S65、T66、H68、V70和R72，在该掺杂密码子中，每个碱基位置是70％野生型碱基和10％其他三种碱基的混合物，其将在氨基酸水平上产生～50％突变率。用终止模板(在7-13、34-36和69-71的区域中含有三个终止密码子的p8U7Ub25的单链DNA)来构建含有～4×10¹⁰个独特成员(克隆)的文库。除第3-5轮使用降低的USP7catC223A浓度(分别为10、5和2nM)外，按上文所述针对USP7catC223A循环文库5轮。

斑点噬菌体ELISA

5轮结合选择后，挑取单个噬菌体克隆，并在96孔模块中接种入450μl在37℃过夜培养的含有50μg/ml carbenecillin和M13-KO7辅助噬菌体的2YT培养基中。按以下用斑点噬菌体ELISA分析上清：将生物素化USP7catC223A、USP14催化结构域(C114A)、UCHL1、UCHL3或UCHL5催化结构域捕获至NeutrAvidin包被的384孔Maxisorp免疫平板，并将用PBT缓冲液稀释(1:3)的噬菌体上清加至孔中。洗涤平板，用抗-M13-HRP和随后的TMB底物检测结合的噬菌体。在这些测定中，平行测试了与NeutrAvidin自身的结合来评估背景结合。对USP7catC223A的结合信号比对NeutrAvidin(背景)的结合信号高5倍以上的克隆认为是阳性。对阳性克隆进行DNA序列分析。

等温滴定量热法

将U7Ub25和USP7catC223A过夜透析入50mM HEPES pH 7.5和150mM NaCl，并在MicroCal ITC200上滴定。孔中U7Ub25的浓度为200μM，注射器中USP7catC223A的浓度为20μM。实验以0.2μL初始注射(在数据分析过程中去除)进行，随后是20次间隔250秒的2uL注射。细胞在25℃下1000转/分钟搅拌。在Microcal Origin中将结合曲线拟合至单位点结合模型。

ELISA结合测定

将生物素化USP7catC223A捕获在之前用封闭缓冲液封闭的NeutrAvidin包被的平板上，并用0-20μM浓度范围的His标记遍在蛋白变体的1:3系列稀释液在PBT缓冲液中4℃孵育1小时。然后用PT缓冲液洗涤平板，通过抗-5xHis-HRP缀合物(Qiagen,目录号34460,Germantown,MD)和随后的TMB底物来检测结合的His标记蛋白质。

生物层干涉量度法亲和力测量

在OctetRed 384(Fortebio,Menlo Park,CA)上通过生物层干涉量度法来测量遍在蛋白变体与USP7catC223A的结合亲和力。在含有0.05％Tween20和0.1％BSA的PBS缓冲液中用生物素化USP7catC223A负载链霉抗生物素蛋白生物传感器(Fortebio,目录号18-5020)，在相同的缓冲液中洗涤，并转移至含有相同缓冲液中的0-2μM浓度范围的遍在蛋白变体的孔中。通过用Octet软件将反应非线性拟合至稳态算法来获得解离常数。通过动力学拟合获得了相似的亲和力。

结果

选择最高亲和力的非二硫键变体U7Ub25(其可以通过β1-β2周围的核心重包装来达到高亲和力和特异性)来进行表面成熟。通过随机化U7Ub25的表面残基来设计亲和力成熟文库，该表面残基根据与USP7复合的野生型遍在蛋白的晶体结构(PDB编号1NBF¹⁵)预测为涉及USP7与遍在蛋白的相互作用(图5A)。

为了分离改善的结合剂，针对浓度逐渐降低的USP7选择文库。4轮淘选后，鉴定出6个强烈结合USP7的克隆(图5A)。表达所有独特的亲和力成熟克隆，纯化为His标记蛋白质，并通过ELISA测量EC₅₀的来排序它们的相对亲和力。如图5B中所示，U7Ub25.2540是最紧密的USP7结合剂，且相对于U7Ub25包含三个突变：Gln42Trp、Gln49Arg和His68Arg(图5A)。通过生物层干涉量度法测量的U7Ub25.2540对USP的催化核心的亲和力约为30nM，表示相对于U7Ub25亲本改善7倍(图5C；表8和9)。

此实施例证明，通过与底物蛋白质表面上的残基直接相互作用的氨基酸残基的表面突变，甚至可以进一步提高构象稳定的蛋白质变体的底物结合亲和力。

实施例3：构象稳定的遍在蛋白的晶体结构

在此实施例中，解析了U7Ub7(二硫键)和U7Ub25.2540(非二硫键，亲和力成熟的)二者的晶体结构来理解二硫键和非二硫键种类的USP结合变体内的突变如何影响这些分子的结构。

材料和方法

结晶和数据收集

将细胞糊重悬入25mM Tris pH 8.0、150mM NaCl；在U7Ub25.2540的整个纯化过程中加入还原剂(0.5mM TCEP)。在Ni螯合亲和柱上纯化细胞，用6xhis标记的TEV蛋白酶过夜去除标记。然后在第二Ni螯合亲和柱上进一步纯化经切割的混合物，最后在25mM TRIS pH 8.0、150mMNaCl中在Superdex^TM75(GE Healthcare)大小排阻柱上纯化。

通过将1μl纯化缓冲液中的10mg/ml的蛋白质与1μl含有2.4MAmSO₄和0.1M柠檬酸pH 4.0的结晶溶液混合，用坐滴和悬滴蒸汽扩散法在18℃培养U7Ub7和U7Ub25.2540的衍射质量晶体。晶体生长3天后，转入含有3.2M AmSO₄和0.1M柠檬酸pH 4.0的防冻溶液中。晶体衍射至且属于不对称单元中具有4个分子的空间群P3₁2。用单遍在蛋白链(PDB-ID 1UBQ)作为用于分子取代的搜索模型。

NMR波谱学

作离心沉淀细胞并转移至含有U-²H、¹³C-D-葡萄糖和2/3²H₂O的M9培养基中的修改，按照Cai等⁴⁷的方法进行标记，制备用于NMR波谱学的样品。μs R_ex实验的实施需要约50％氘化。⁴⁸NMR样品含有10％²H₂O和0.1mM三甲基甲硅烷丙酸酯。通过质谱分析法测定氘掺入为约50％。

用PINE从¹H-¹⁵N HSQC、HNCA、HNCACB和HncoCA中峰位置的半自动化分析获得野生型遍在蛋白、U7Ub7和U7Ub25的共振分配。⁴⁹化学位移参考三甲基甲硅烷丙酸酯。获得了野生型遍在蛋白和U7Ub的几乎完整的主链分配。在所有蛋白质中都未观察到E24和G53的酰胺共振。在Bruker DRX分光计上按18.8T或在Bruker Avance III分光计上按14.1T收集所有NMR数据集。除非另有说明，NMR实验在24℃下进行，对氘化甲醇校正。⁵⁰

按照Grzesiek和Bax的方法测定野生型遍在蛋白和7.7的{¹H}-¹⁵N异核NOE值。⁵¹所有实验中的循环延迟和¹H照射时间分别设为5秒和1秒。从H_z’N_z、H_zN_z’、H_z’N_z’和H_zN_z R_1ρ测量结果提取微秒R_ex值，其中撇号表示弛豫延迟期间存在自旋锁场。^48,52所利用的自旋锁场在¹H和¹⁵N频率上分比为10kHz和2kHz。延迟时间对所有具有自旋锁照射的实验在2毫秒和32毫秒之间，对H_zN_z在4毫秒和128毫秒之间，在缺乏照射的情况下测量。将这些实验中的每一个记录为每个平面上具有64个复合物¹⁵N点的伪3D，并以插入方式记录9个弛豫延迟时间，以减轻由不同的样品加热引起的可能的假象。用nmrPipe⁵³拟合演化曲线，按照Hansen等⁵²进行数据分析。按照Tollinger等⁵⁴的方法收集R₂分散数据集，从两点拟合确定R_2obs，以更充分地取样分散曲线。⁵⁵按每个平面具有64个复合物¹⁵N点的插入伪3D和约15CPMG频率收集数据集。采样的CPMG频率在50和950HZ之间，重复两个频率用于误差分析。在14.1T和6℃收集7.25的R₂分散曲线。

结果

如从位置7和69处强烈偏向半胱氨酸所怀疑，U7Ub7的结构揭示，这些残基在β1-β2环的底部形成二硫键(图6-7；表10)。相对于apo野生型构象，此二硫键的取向以类似于针对结合于USP7的野生型遍在蛋白观察到的方式向下扭曲β1-β2(图8A)。Ile36Ty也通过与Arg71的主链形成氢键和与Leu73形成堆积相互作用来促成此扭曲(图8B)。Tyr36-Leu73堆积推动U7Ub7的C端，使得它垂直于野生型遍在蛋白取向，并与β1-β2环形成主链氢键(图8A)。但是，探测快速时间尺度动态的异核NOE NMR测量显示，U7Ub7的C端的移动性略低于野生型遍在蛋白，但并非完全受限(图9)。因此，U7Ub7的C端不寻常的定位可以在其对USP7的高亲和力中不发挥决定性作用。

表10.U7Ub7和U7Ub25.2540晶体的数据收集和提炼统计

最高分辨率层的统计显示在括号中

与U7Ub7不同，U7Ub25.2540的分辨率结构显示，其主链与apo野生型遍在蛋白近乎相同(图8C和10)。核心突变残基(Thr7Phe、Leu8Arg、Ile13Tyr、Glu34Leu、Leu69Gly和Leu71Arg)紧密包装，但包装方式不同于野生型(图7A，C)。通过亲和力成熟引入的突变(Arg42Trp、Gln49Arg和His68Arg)全都聚集在变体的USP7接触片层上，并形成连续的相互作用表面。由于U7Ub25.2540的主链结构与野生型遍在蛋白的主链结构如此相似，用弛豫分散测量来确定apo状态动态是否已被扰乱，但发现与野生象遍在蛋白相比无显著差异(图11)。

此实施例证明，虽然构象稳定的U7Ub25和U7Ub25.2540遍在蛋白具有显著提高的对USP7的亲和力和显著不同的β1-β2元件周围的包装，但与野生型遍在蛋白相比它们的主链受到最低程度的影响。

实施例4：U7Ub25中的核心突变和表面突变协作促成对USP7的亲和力

此实施例评价针对非二硫键构象稳定遍在蛋白克隆观察到的β1-β2周围的备选包装是否决定亲和力。

结果

最初测量了U7Ub25和野生型遍在蛋白背景中的回复和添加突变体的结合(图10)。由于U7Ub变体在三级结构的局部区域包含预定的埋藏变化，预期单个回复突变将产生不协调，并产生弱折叠的蛋白质。一个例外是Leu71Arg突变，其为几乎全部U7Ub2所共有(图1B)，且其暴露于溶剂且相对独立于β1-β2周围的新包装(图7B-C)。因此，将埋藏的非天然核心作为一个突变单位加入或去掉，以及将位置71变为所选择的Arg或野生型Leu。还研究了见于U7Ub25.2540中的亲和力成熟的表面残基的重要性。在以下描述中，克隆名称表明核心突变的身份，表面改变(如果存在)现实在点后，位置71处的残基的身份在下划线之后。例如，Ubwt.2540_L71表示具有野生型遍在蛋白核心、见于U7Ub25.2540中的亲和力成熟的表面突变及位置71处的亮氨酸(野生型身份)的突变体。

在新包装的核心的背景中，Arg71对于USP7的结合至关重要(图10，U7Ub25_R71对U7Ub25_L71)。但是，与遍在蛋白的野生型核心配对的Arg71突变本身不足以进行紧密结合(Ubwt_L71对Ubwt_R71)。因此，由β1-β2周围的埋藏突变引起的包装似乎对Arg71的正确定位至关重要。类似地，横跨亲和力成熟表面的多重突变确实在野生型核心的背景中传递一些亲和力(图10，Ubwt_L71对Ubwt.2540_L71)，但这些改变在相伴的重包装核心和Arg71二者的存在下最有效(图10，Ubwt.2540_L71对U7Ub25.2540_R71)。值得注意的是，携带除重包装核心之外的每种突变的突变体与USP7的结合强烈受损(图10，Ubwt.2540_R71对U7Ub25.2540_R71)。

总之，此实施例显示，见于U7Ub25和U7Ub25.2540中的埋藏突变和表面突变密不可分地协作来产生其对USP7的亲和力的有力提高。

实施例5：U7Ub构象稳定的遍在蛋白变体抑制USP7催化活性

此实施例测定U7Ub25和U7Ub25.2540与USP7的结合就USP7的蛋白水解脱遍在蛋白酶酶促活性而言是否是抑制性的。

材料和方法

将处于0-20μM浓度范围的遍在蛋白变体与250nM遍在蛋白-AMC(Boston Biochem,Boston,MA,目录号U-550)混合。向遍在蛋白-AMC/遍在蛋白变体混合物加入含0.05％Tween20、0.1％BSA和1mMDTT的PBS缓冲液中的一些列DUB(USP7、USP47、USP2和USP5分别按2、5、3和5nM)30分钟，立即通过用SpectraM5e(MolecularDevice,Sunnyvale,CA)监测在340nm激发并在465nm发射的萦光来测量初始速度。根据逐渐增加的萦光信号的斜率计算初始速率。还将酶活性测量为USP10和全长USP7的终点萦光强度，其中将浓度递增的遍在蛋白变体与20nM USP10或1.7nM USP7和2μM遍在蛋白-AMC孵育1小时，然后测量萦光强度。在两种情况下，将速度归一化为最大速率(在抑制剂浓度为零时)的百分比，并用KaleidaGraph通过拟合至以下方程来处理数据：

v = v_{0} + \frac{v_{\max} - v_{0}}{1 + {(\frac{I}{{IC}_{50}})}^{n}}

其中v是最大速率的百分比；I是抑制剂(遍在蛋白变体)的浓度；v₀和v_max分别是速率的最小和最大百分比。

结果

评估了U7Ub25和U7Ub25.2540变体在动力学测定中竞争野生型遍在蛋白的能力。如图12A中所示，U7Ub25和U7Ub25.2540以相似的IC₅₀(分别为250nM和160nM)抑制全长USP7活性，其代表相对于野生型遍在蛋白抑制USP7的能力改进1,000倍(表11)。这与通过生物层干涉量度法和ITC测量的Kd值相一致(图1D、5C，及表9)。

表11.U7Ub变体对USP脱遍在蛋白酶的IC₅₀(nM)

	USP7	USP2^§	USP5	USP10*	USP47
						野生型	N.D.	13,700±1798	8,660±716	ND	13,200±1975
U7Ub25	172±9	ND	373±32	ND	1337±385
						U7Ub25.2540	104±4	ND	251±25	ND	752±214
U7Ub25.2540ΔGG	203±11	NT	ND	NT	NT

§催化结构域；*终点测定(方法)；ND＝检测不到；NT＝未测试

为了测试U7Ub25和U7Ub25.2540抑制USP型酶的特异性，测量了这两种遍在蛋白变体对USP2催化结构域、USP5、USP10和USP47的IC₅₀(图12B-E和表11)。选择USP2作为一般的高活性脱遍在蛋白酶，而选择USP5是因为其包含多个具有不同功能的遍在蛋白结合部位。¹⁶USP47是与USP7最密切相关的脱遍在蛋白酶，且是严格的特异性测试。已知USP10脱遍在蛋白并稳定p53，因此与USP的作用直接相对。因此，靶向USP7以稳定p53的分子必须避免与USP10的交叉反应性。

U7Ub25和U7Ub25.2540二者在至多20μM的浓度下都对USP2和USP10活性无影响(图12B、C)，在其对USP47的抑制上与野生型遍在蛋白类似(图5D)。令人惊奇地，与野生型遍在蛋白(IC₅₀＝8.27μM)相比，U7Ub25和U7Ub25.2540都是相对有效的USP5抑制剂(IC50分别为373nM和251nM)(图12E，上)。但是，与野生型相比，这两种变体的抑制机制不同。低于抑制浓度的遍在蛋白通过与其锌指(ZnF4)结构域的结合强烈激活USP5，这是与调节USP5对线性遍在蛋白链的细胞功能相对的活性。¹⁶值得注意的是，U7Ub25和U7Ub25.2540都不变构激活USP5(图12E，下)，表明它们不结合调节性ZnF4结构域，而仅与催化USP结构域结合。由于USP5的ZnF4结构域主要结合遍在蛋白的C端，在废除USP5抑制的尝试中缺失了U7Ub25的最后两个甘氨酸。得到的变体U7Ub25ΔGG保留了其对全长USP7的效力，但不再抑制USP5(图12A、E)。

总之，此实施例证明，U7Ub25和U7Ub25.2540构象稳定遍在蛋白变体都抑制USP7和USP5酶促活性，但对USP2或USP10无作用。

实施例6：U7Ub25.2540构象稳定遍在蛋白变体在人细胞中是有效的和选择性的USP7抑制剂

由于U7Ub变体基于遍在蛋白支架，此实施例检查稳定的遍在蛋白变体是否与细胞遍在蛋白连接机器相互作用和/或干扰细胞遍在蛋白连接机器，以及该变体是否能够掺入多聚遍在蛋白链。

材料和方法

哺乳动物表达构建体和细胞培养

通过合成3XHA遍在蛋白(MCLAB)并亚克隆入pcDNA3.1(Invitrogen)来产生3XHA-野生型遍在蛋白构建体。通过从噬菌体溶液PCR扩增U7Ub25.2540并将产物亚克隆入改进的包括N端3X HA标记的pcDNA3.1(+)载体(Invitrogen)来产生3XHA-U7Ub25.2540构建体。通过按以下用限制位点NheI和HindIII连接入包括Kozak序列的3XHA序列来产生3XHApcDNA3.1载体：

gctagcGCCGCCACCatggagTACCCATACGACGTACCAGATTACGCTTACCCATACGACGTACCAGATTACGCTTACCCATACGACGTACCAGATTACGCTaagctt

然后用BamHI和EcoRI限制位点将U7Ub25.2540克隆入3XHApcDNA3.1(+)载体。通过将Gly 75和76(GGTGGT)突变为终止密码子(TGATGA)来产生ΔGG形式(UbΔGG和U7Ub25.2540ΔGG)。人细胞系HEK293T、U2OS和SiHa获自ATCC，而HCT116亲本和USP7-/-细胞系获自Horizon Discovery。按标准流程维持细胞，并用Lipofectamine 2000转染试剂(Invitrogen)实现DNA转染。

免疫印迹分析和免疫沉淀

针对以下蛋白质产生的抗体购自所示供应商，并用于用之前所述的标准流程进行免疫印迹。⁵⁶HA-HRP(Sigma HA-7)、遍在蛋白-HRP(SantaCruz Biotech P4D1)、USP7(Bethyl A300-034A)、USP47(AbCam ab72143)、USP14(Bethyl A300-919A)、USP10(AbCam ab70895)、USP5(AbCamab84695)、UCHL1兔多克隆(Invitrogen)、微管蛋白鼠单克隆(MPbiomedical)、MDM2(Calbiochem Ab-1)、p53(Neomarkers Ab-8)、p21(AbCam ab7960)和GAPdH(Assay Designs、1D4)。用所示抗体或抗体缀合的琼脂糖按之前所述(Wertz等Nature 2004)进行标准免疫沉淀：抗-HA琼脂糖(Roche 3F10)或抗-myc(Covance 9E10)。遍在蛋白连接选择性抗体的产生及为用这些抗体进行免疫沉淀优化的具体流程之前已描述过。^57-59

蛋白质组学和质谱分析法

按上文所述纯化抗-HA免疫沉淀。在SDS样品缓冲液中洗脱蛋白复合物，通过SDS-PAGE分开，然后用胰蛋白酶消化。通过反相层析分开肽，接着在LTQ-Orbitrap Velos(Thermo Fisher)中进行串联质谱分析。使用50ppm前体离子耐受和全胰蛋白酶特异性，用Mascot⁶⁰(Matrix Science,London,UK)对包含从Uniprot数据库提取的人蛋白质和常见污染物的链接靶标-诱饵数据库检索MS/MS数据。用线性判别分析将肽谱匹配过滤至1％FDR。

结果

在利用E1UBE1和E2s Cdc34(促进K48多遍在蛋白化)或Uev1a/UbcH13(促进K63多遍在蛋白化)的生化连接测定中，U7Ub3和U7Ub7都未有效掺入K48-或K63-连接的链；单体遍在蛋白库的排除支持该变体部分结合所评价的E1和/或E2酶(图13)。相反，用U7Ub25未达到可检测到的多聚化，但存在在生化测定中包括E3蛋白质可以增强U7Ub变体的多聚化的可能性。

然后探讨了U7Ub变体与细胞脱遍在蛋白化酶的相互作用。为此，在人细胞中表达了野生型遍在蛋白、遍在蛋白ΔGG、U7Ub25.2540和U7Ub25.2540ΔGG的HA表位标记的形式(图14A)。与生化测定类似，虽然存在细胞环境中表达的遍在蛋白连接酶，但U7Ub25.2540微弱地掺入多聚遍在蛋白链(图14A和15)。通过Western印迹未检测到细胞遍在蛋白化模式的改变，表明U7Ub变体的表达对内源遍在蛋白连接机器具有极小的影响(图14A)。

然后探讨了U7Ub在细胞环境中的DUB结合选择性和DUB抑制功效。内源USP7未能与HA-野生型遍在蛋白结合，但以剂量依赖性方式在HA-U7Ub25.2540免疫沉淀中检测到(图16)。USP5是在HA-U7Ub25.2540免疫沉淀中检测到的仅有的其他DUB(图16)。由于从U7Ub25缺失C端二甘氨酸提供在酶促抑制测定中对USP7的附加特异性，去除了亲和力成熟的变体的C端(U7Ub25.2540ΔGG)。在转染入人细胞系中时，此克隆特异性免疫沉淀内源USP7而与USP5无明显结合(图14B)。通过质谱分析确认了这些数据：USP7基本上富集(至多15倍)在来自两种细胞系的HA-U7Ub25.2540ΔGG免疫沉淀中，而大多数其他DUB以相对于二甘氨酸缺失的野生型遍在蛋白等同或较低的程度被HA-U7Ub25.2540ΔGG拉下(图17)。如增强的MDM2遍在蛋白化(图14C)和翻转(图14D)所示，与内源USP7结合一致，HA-U7Ub25.2540ΔGG的表达还抑制USP7催化活性。抑制USP7活性和降低MDM2蛋白质水平的净结果是稳定p53肿瘤抑制物(图14E)。

因此，此实施例显示，生物物理、生物化学和细胞数据共同证明，构象展示是可以用来改造选择性结合从而抑制致癌的DUB USP7的细胞作用的遍在蛋白变体的有力工具。

实施例7：用构象展示来鉴定构象稳定的USP14结合遍在蛋白变体

由于它们在调节胞内信号发放中的关键作用，DUB作为有前景的新治疗靶标出现。³¹例如，最近已显示，蛋白酶体结合的USP14DUB的小分子抑制增强了涉及淀粉状蛋白生成性神经变性的蛋白质的降解³²，并阻止肿瘤进展。³³它们相对弱的活性使USP型DUB机制和调节的研究变得复杂：USP型DUB的催化结构域通常具有10³至105M^-1s^-1的酶效率和高微摩尔底物亲和力，使得有必要在结构研究中使用共价的自杀“弹头”。³⁴相反，UCH型DUB通常为高活性，具有至多10⁸M^-1s^-1的酶效率，且对遍在蛋白的亲和力在低纳摩尔范围内。^35-36此实施例研究构象展示是否可以用来产生与USP14紧密结合的稳定的遍在蛋白变体。

材料和方法

“上”和“下”β1-β2构象的鉴定

在高于的分辨率下测定的结合于配偶体蛋白质的遍在蛋白的所有晶体结合获自PDB，并划分为各含有单个遍在蛋白-配偶体对的个体模型。还包括两个apo遍在蛋白结构(1ubi和1ubq)来测定β1-β2的主导apo构象。手工检查各结构后，如果β1-β2环清楚地涉及晶体包装，则排除模型。剩余的56个结构(表12)在球状核心sansβ1-β2(残基1-5和11-70)的Cα上配对比对，并计算β1-β2环(残基6-10)的CαRMSD。用MATLAB(clustergram,Bioinformatics toolbox)将这些RMSD组织为矩阵并聚类。两个主要聚类的每一个中的结构的目检揭示，它们代表了β1-β2的上”和“下”构象。包含各复合物PDB编号和个配偶体的链标识符的详细标注的聚类图在图21中可得。

表12.用于聚类β1-β2环构象的PDB。名称为<PDB编号><遍在蛋白链字母>-<配偶体链字母>的形式

确定对β1-β2构象重要的残基的计算设计

用计算设计策略鉴定了影响β1-β2的构象的位置。简言之，在计算上允许遍在蛋白的β1-β2区和疏水核心内的残基在上或下状态中突变，考虑在噬菌体展示实验中对于野生型遍在蛋白和相对状态相比采用不同的优选同一性的位置进行变异。

选择了以下模板晶体结构进行计算设计：apo野生型遍在蛋白(1ubi)、结合“上”状态(1cmx,1xd3,3ifw)和USP结合“下”状态(2ayo,2hd5,2ibi)。利用单状态和多状态设计策略，允许位置3、5、7、8、13、15、23、26、30、34、36、43、50、56、61、67、69和71突变。在单状态流程中，各模板用RosettaDesign(Kuhlman等,Science 302,1364–1368(2003))独立地设计10,000次，将按总系统能排序的前1,000个序列与其他模板比较(图22A)。在多状态流程中，用遗传算法设计各模板用来在2000个成员的群体内优化有利于三个“下”阳性状态(2ayo，2hd5，2ibi)和不利于三个“上”阴性状态(1cmx，1xd3，3ifw)的适应度函数150代(Havranek&Harbury,Nat.Struct.Biol.10,45–52(2003))。对各阳性状态的主链模板独立地重复此流程三次，并用Boltzmann序列适应度加权构建位置特异性评分矩阵(图22B)(Smith&Kortemme,PLoS ONE 6,e20451(2011))。单状态和多状态法都表明，位置7、8、13、34、36、61和71处的野生型残基对“下”USP结合状态而言为次优(图22)。在随后的噬菌体展示实验中将这些位置与邻近的位置69以其随机化为NNK密码子。

计算交叉停靠

将结合于USP或UCH型脱遍在蛋白酶的遍在蛋白的结构(PDB编号3IFW、2AYO、2HD5、1CMX、1XD3和2IBI)分为遍在蛋白(链B)和脱遍在蛋白酶(链A)成分。为了避免由柔性C端尾的定位引起的晶体学偏差，仅停靠遍在蛋白的球状部分(残基1-70)。通过预包装apo状态中的所有侧链来去除结合复合物的记忆。通过在同族遍在蛋白上比对来将每个遍在蛋白结构放入每个脱遍在蛋白酶的结合部位，然后在和8°的小的随机扰动后用RosettaDock(Gray,等,J.Mol.Biol.331,281–299(2003))停靠至脱遍在蛋白酶上。每个遍在蛋白-脱遍在蛋白酶复合物运行1,800个轨迹，相对于最低评分的模型(设为零得分)归一化各组合的总系统能。相对于结合于所讨论的脱遍在蛋白酶的遍在蛋白的同族结构计算残基1-70的CαRMSD。

M13噬菌体上的展示遍在蛋白

通过改变之前所述的噬菌粒pS2202d(Skelton,N.J.等,J.Biol.Chem.278,7645–7654(2003))来将遍在蛋白展示在M13噬菌体的表面上。用标准分子生物学技术来用编码遍在蛋白的DNA片段取代pS2202d的编码ErbinPDZ结构域的片段。得到的噬菌粒p3Ub包含可读框，该可读框编码麦芽糖结合蛋白分泌信号，随后是gD和遍在蛋白，并以次要外被蛋白p3的C端结构域结束。用M13-KO7辅助噬菌体共感染含有p3Ub的大肠杆菌，并按标准流程(Tonikian等,Nat Protoc.,2(6):1368-86(2007))扩增。按照标准流程(Tonikian等,Nat Protoc.,2(6):1368-86(2007))纯化所繁殖的噬菌体，并重悬在1mL PBT缓冲液(PBS、0.5％BSA和0.1％Tween 20)中，导致包封了p3Ub DNA并展示遍在蛋白的噬菌体颗粒的产生。用噬菌体ELISA分析展示水平。

文库构建和分选

用Kunkel诱变法(Kunkel等,Meth.Enzymol.154,367–382(1987))构建遍在蛋白文库。用NNK密码子随机化残基T7、L8、I13、E34、I36、L69和L71。用终止模板(p8Ub的单链DNA，其在T7-I13、E34-I36和L69-L71的区域中含有三个终止密码子)来构建含有～2x 10¹⁰个独特成员的文库。使文库循环通过溶液中的针对具有C114A突变(命名为USP14catC114A)的USP14的C端单生物素化催化结构域(残基D91-Q494)的多轮结合选择。对于第一轮，将20μg生物素化的USP14catC114A与1ml噬菌体文库(～1×10¹³pfu/mL)在4℃孵育2小时，并通过200μl之前已用封闭缓冲液(PBS，1％BSA)封闭的MyOne链霉抗生物素蛋白在室温下捕获15分钟。弃上清，用PBS、0.1％Tween20洗涤球珠三次。用400μl 0.1M HCl洗脱结合的噬菌体7分钟，并立即用60μl的1M Tris、pH 13中和。按Tonikian等,Nat Protoc.,2(6):1368-86(2007)所述扩增所洗脱的噬菌体。对于第二轮，除使用10μg生物素化的USP14catC114A和100μl Dynabead外，流程与第一轮相同。对于第三轮和第五轮，将2μg生物素化的USP14catC114A与来自前一轮的扩增噬菌体孵育，并通过之前用封闭缓冲液处理的NeutrAvidin包被平板捕获噬菌体-USP14catC114A复合物。除用链霉抗生物素蛋白包被的平板来捕获生物素-USP14catC114A-噬菌体复合物外，第四轮与第三轮相同。按标准流程(Tonikian等,Nat Protoc.,2(6):1368-86(2007))在30℃下在含M13-KO7辅助噬菌体的大肠杆菌XL1-blue中繁殖噬菌体。

斑点噬菌体ELISA

5轮结合选择后，挑取单个噬菌体克隆，并在96孔模块中接种入450μl含有50μg/ml carbenecillin和M13-KO7辅助噬菌体的2YT培养基，37℃过夜培养。按以下用斑点噬菌体ELISA分析上清：将生物素化USP14catC114A捕获至NeutrAvidin包被的384孔Maxisorp免疫平板，并将用PBT缓冲液稀释(1:3)的噬菌体上清加至孔中。洗涤平板，用抗-M13-HRP和随后的TMB底物检测结合的噬菌体。在这些测定中，平行测试了与NeutrAvidin自身的结合来评估背景结合。对USP14catC114A的结合信号比对NeutrAvidin(背景)的结合信号高5倍以上的克隆认为是阳性。对阳性克隆进行DNA序列分析。

遍在蛋白变体表达和纯化

将编码遍在蛋白变体的DNA克隆入具有N端6x His标记的pET衍生载体(EitNTH载体)，并按之前所述(Dueber等,Science 334,376–380(2011))在大肠杆菌中表达。简言之，用含有U14Ub的质粒转化BL21(DE3)gold大肠杆菌细胞，在含有50mg/L羧苄青霉素的LB培养基中培养至OD₆₀₀为～0.7，用0.2-0.5mM异丙基β-D-1-硫代半乳吡喃糖苷在16℃诱导16小时，然后通过离心收集。将细胞重悬在补加了Roche完全蛋白酶抑制剂(无EDTA)和10mM咪唑的PBS中，并通过超声处理裂解。激昂可溶性级分上样至Ni-NTA树脂(Qiagen)上，用约10柱体积补加了20mM咪唑PBS洗涤，然后用补加了300mM咪唑的PBS洗脱。然后通过加入TEV蛋白酶来从蛋白质切除6xHis标记并在4℃对PBS过夜透析用于晶体学和NMR波谱学。然后在Ni-NTA树脂上运行此溶液来去除切下的标记和TEV。然后用3kDa MWCO Ultra-free 15离心过滤装置(Amersham)浓缩样品，并在凝胶过滤柱(S75Superdex 16/60,GE Healthcare)上运行。然后混合级分，通过SDS-PAGE分析，并浓缩至1-20mg/mL。

作离心沉淀细胞并转移至含有U-²H、¹³C-D-葡萄糖和2/3²H₂O的M9培养基中的修改，按照Cai等(J Biomol NMR 11,97–102(1998))的方法进行标记，制备用于NMR波谱学的样品。μs R_ex实验的实施需要约50％氘化(Hansen等,J.Am.Chem.Soc.129,11468–11479(2007))。NMR样品含有10％²H₂O和0.1mM三甲基甲硅烷丙酸酯。通过质谱分析法测定氘掺入为约50％。

ELISA结合测定

将生物素化USP14catC114A、UCHL3或UCHL1捕获在之前用封闭缓冲液封闭的NeutrAvidin包被的平板上，并用0-20μM浓度范围的His标记遍在蛋白变体的1:3系列稀释液在PBT缓冲液中4℃孵育1小时。然后用PT缓冲液洗涤平板，通过抗-5xHis-HRP缀合物(Qiagen,目录号34460,Germantown,MD)和随后的TMB底物来检测结合的His标记蛋白质。

生物层干涉量度法亲和力测量

在OctetRed 384(Fortebio,Menlo Park,CA)上通过生物层干涉量度法来测量遍在蛋白变体与USP14catC114A的结合亲和力。在含有0.05％Tween20和0.1％BSA的PBS缓冲液中用生物素化USP14catC114A负载链霉抗生物素蛋白生物传感器(Fortebio,目录号18-5020)，在相同的缓冲液中洗涤，并转移至含有相同缓冲液中的0-50μM浓度范围的遍在蛋白变体的孔中。从所有结合数据扣除仅包含缓冲液的参考孔的信号。对于每个浓度的配体，用负载或未负载生物素化USP14catC114A的两个生物传感器来平行检测结合。从来自用USP14catC114A负载的生物传感器的结合信号扣除通过秃生物传感器检测到的信号。通过用Octet软件将反应非线性拟合至稳态算法来获得解离常数K_D。

对于动力学，用KaleidaGraph软件将结合数据拟合至以下两阶段结合模型方程：

r = R_{\max} f_{fast} (1 - e^{- k_{fast} t}) + R_{\max} (1 - f_{fast}) (1 - e^{{- k}_{slow} t})

(方程1)

R_max是最大反应

f_fast是来自快速阶段结合的贡献对总R_max的分数

k_fast是快速阶段结合的结合常数

k_fslow是慢速阶段结合的结合常数

r是任意时间点的反应，t是时间。

通过用Octet软件将解离数据拟合至1:1模型来获得解离常数k_off。

对于快速阶段，k_on＝(k_fast-k_off)/[L](方程2)，其中[L]是配体的浓度。对于慢速阶段，k_slow＝k_f+k_r/(1+[L]/K_D)(方程3)用于“构象选择”模型，而k_slow＝k_r+k_f/(1+K_D/[L])(方程4)用于“诱导契合”模型(Hammes等,Proc.Natl.Acad.Sci.U.S.A.106,13737–13741(2009)；James等,Science 299,1362–1367(2003))。

衍生自动力学拟合的K_D计算为k_off/_kon，其中从方程2计算k_on。

从多种配体浓度下获自方程1的k_slow的依赖性的形状看，很明显，诱导契合模型(方程4)描述了实验数据。在拟合方法中，K_D是自由参数，将获自k_slow的拟合的值与获自稳态和动力学拟合二者的K_D值相比较(表13)。

表13.对USP14具有最高表观亲和力的U14Ub的表征。对USP14具有最高表观亲和力的5个U14Ub的序列和基于ELISA的EC50。

使用微分静态光散射的热稳定性测量

将U14Ub的热稳定性与野生型遍在蛋白相比较，使用Vedadi等(Proc.Natl.Acad.Sci.U.S.A.103,15835–15840(2006)所述的市售微分静态光散射仪(Stargazer,Harbinger Biotech)。各蛋白质的浓度为0.2mg/Ml。

结果

为了改变遍在蛋白的β1-β2环的动态，用单状态和多状态RosettaDesign计算搜索了预测其中的突变稳定USP结合“下”状态的核心位置。^37-39两类设计实验都鉴定出一组一致的位置，预测其中的突变有利于USP结合状态。将此信息掺入遍在蛋白变体的噬菌体展示文库，针对USP14的USP结构域的催化失活突变体淘选该文库(图22)。

选择USP14结合遍在蛋白变体(U14Ub)产生几个强烈的序列偏好，如在位置7处几乎不变地掺入甘氨酸(图18A)。克隆、表达、纯化了超过40个U14Ub(命名为U14UbXX，其中XX表示克隆编号)，并通过ELISA和/或生物层干涉量度法针对其结合USP14、UCHL1和UCHL3的能力进行筛选。分析集中在对USP14具有最高表观亲和力的五个克隆上：U14Ub1、2、14、22和24(图18B)。热稳定性测量显示，就野生型而言U14Ub未显著去稳定化(图27)。这些遍在蛋白变体的ELISA和生物层干涉量度法滴定揭示，与野生型遍在蛋白相比，各以改善100-500倍的亲和力结合USP14(图18B)。相反，各变体以比野生型弱40-2,000倍的亲和力结合UCHL1和UCHL3(图18B；表14)。用U14Ub滴定USP14的严格检查最初揭示，结合动力学的单参数拟合足以解释数据。相反，观察到两阶段结合，较慢的速率对U14Ub的浓度的依赖性指示结合的诱导契合机制(图18C和28-29)。⁴⁰

表14.Usp14与U14Ub的结合的平衡和动力学参数。从方法中所讨论的滴定数据测定动力学参数。^a将最高的三个浓度的动力学拟合平均在一起，所报道的误差是三个最高浓度的值的标准差。

	U14Ub1	U14Ub14	U14Ub2	U14Ub22	U14Ub24
						K_d(稳态)μM	2.90±0.07	0.39±0.03	0.77±0.06	0.59±0.07	1.1±0.1
k_on ^a(1/M*s)	(4.0±2.8)x10³	(5.0±3.1)x10³	(4.2±2.6)x10³	(4.3±2.8)x10³	(2.7±2.0)x10³
						k_offa ⁽1/s)	(3.7±0.01)x10^-3	(2.0±0.2)x10^-3	(2.2±0.3)x10^-3	(2.5±0.1)x10^-3	(1.5±0.1)x10^-3
K_D ^a(动力学)μM	1.3±0.9	0.5±0.3	0.7±0.5	0.7±0.4	0.8±0.5
						k_f(1/s)	(3.7±0.6)x10^-3	(3.3±2.4)x10^-3	(2.6±0.3)x10^-3	(2.2±0.1)x10^-3	(1.9±0.1)x10^-3
k_r(1/s)	(0.0±0.5)x10^-3	(0.0±1.4)x10^-3	(0.6±0.2)x10^-3	(0.6±0.1)x10^-3	(0.4±0.1)x10^-3
						K_D(诱导契合)μM	4.4±3.5	0.29±0.31	2.8±1.5	2.9±0.8	4.5±0.8

如果U14Ub通过构象选择机制结合USP14，则可预期有能力进行USP14结合的U14Ub状态的群体将相对于野生型富集；在其最极端的情况下，这可导致U14Ub的基态结构的变化。但是，如果U14Ub通过诱导契合机制结合USP14，则可预期U14Ub-USP14遭遇复合和完全结合的状态之间的转换可以变得更有利。构象选择和诱导契合结合模型代表单反应周期的两个极端⁴⁰，因此，不利于该途径的一条臂的扰动将有利于另一条臂。由于两种结合机制似乎都在野生型遍在蛋白结合相互作用中发挥作用^29-30，与诱导契合主导的结合机制一致的结合动力学的观察可以与apoU14Ub构象整体中的子态之间的转换的扰动相联系。

通过生物层干涉量度法检测的用U14Ub滴定USP14的进一步检查未在1,000秒测量内拟合至单阶段结合模型(图35)。但是，在测量时间延长至1,800秒时，则发现通过生物层干涉量度法检测的用U14Ub滴定USP14非常好地拟合至单阶段解离模型(图36)。在早期时间点和较高的U14Ub浓度下存在从理想化行为的小的偏离，不受限于理论，其可能与U14Ub-USP14结合事件的诱导契合性质相联系。但是，由于可用来足够地采样较快速阶段的数据有限，这些数据未拟合至两阶段解离模型。

此实施例证明，构象展示技术可以成功鉴定出与野生型遍在蛋白相比以改善100-500倍的亲和力与USP14结合的构象稳定的遍在蛋白变体。此遍在蛋白变体就USP14而言显示与诱导契合机制一致的结合动力学。

实施例8：U14Ub2的晶体结构

此实施例研究向诱导契合结合机制的转变与apo U14Ub的结构和动态之间的联系。

材料和方法

X射线晶体学和结构测定

按上文所述纯化用于晶体学的U14Ub2，在含100mM NaCl的25mMHEPES pH 7.2中进行最后的凝胶过滤步骤。将最后的库浓缩至15mg/mL，并冷冻在-80℃。在19℃下在悬吊在母液(0.1M MES pH 6.1、1％2-甲基-2,4-戊二醇和3.5M硫酸铵)上方的由1:1比例的蛋白质(15mg/mL)和母液组成的悬滴中结晶U14Ub2。晶体在2天后出现，并在1周后生长至全尺寸。对于数据收集，将晶体转移至新鲜母液，然后在液氮中快速冷冻。晶体衍射至且属于不对称单元中具有8个分子的空间群P2₁。用单遍在蛋白链(PDB编号：1UBQ)作为用于分子取代的搜索模型。表15中显示晶体学统计。

表15.晶体学统计

结果

解析了U14Ub2的晶体结构，并分配了全部5个U14Ub的主链NMR共振。晶体结构和NMR衍生的CS-Rosetta模型⁴¹都表明，每种变体的基态折叠与野生型不可区分(图24和31)。但是，在所有U14Ub的¹H/¹⁵NHSQC谱中，许多主链酰胺共振相对于野生型变宽(图19A)。变宽的残基在空间上聚集在β1-β2环周围及邻近的β3和β5链中，表明这些区域中的构象动态的调节。相反，{¹H}-¹⁵N异核NOE保持基本不变，表明快速的亚纳秒运动未收扰动。⁴²

连同野生型遍在蛋白的β1-β2区在亚50微秒时间尺度上可移动的观察²⁸，在此实施例中观察到的线变宽表明apo U14Ub的此区域中的大范围构象动态减慢，而小范围快速运动无变化。

实施例9：构象稳定的遍在蛋白变体中的β1-β2区的构象动态

此实施例利用R₂分散实验来检查构象稳定的遍在蛋白中的β1-β2结构基序是否显示与可在野生型遍在蛋白中的此区域中观察到的运动相比减慢的动态。

材料和方法

NMR波谱学

用PINE(Bahrami等,PLoS Comput.Biol.5,e1000307(2009))从¹H-¹⁵NHSQC、HNCA、HNCACB和HncoCA中峰位置的半自动化分析获得野生型遍在蛋白和U14Ub的共振分配。获得了野生型遍在蛋白和U14Ub的几乎完整的主链分配。在所有蛋白质中都未观察到E24和G53的酰胺共振。如下文所讨论及图19和图23中所示，所有U14Ub都显示由化学交换引起的NMR共振的变宽。这在U14Ub14中最显著，U14Ub14需要在更高温度下进行的三次共振实验来建立残基之间的连接性。总之，除所有蛋白质都未观察到残基24和53外，U14Ub1未观察到残基9和12，U14Ub2未观察到残基9和73，U14Ub14未观察到残基8-12、41和72，U14Ub24未观察到残基9和10。将¹H、¹⁵N、¹³Cα和¹³Cβ化学位移连同氨基酸序列用作输入来产生CS-Rosetta模型(Shen等Proc.Natl.Acad.Sci.U.S.A.105,4685–4690(2008))。对于每个U14Ub，最低能量CS-Rosetta模型收敛于与野生型不可区分的单个折叠(图24)。在Bruker DRX分光计上按18.8T或在Bruker Avance III分光计上按14.1T收集所有NMR数据集。NMR实验在24℃下进行，对氘化甲醇校正(Findeisen等,Magn Reson Chem 45,175–178(2007))。

按照Grzesiek和Bax(Grzesiek&Bax,J.Am.Chem.Soc.115,12593–12594(1993))的方法测定{¹H}-¹⁵N异核NOE值。所有实验中的循环延迟和¹H照射时间分别设为5秒和1秒。从H_z’N_z、H_zN_z’、H_z’N_z’和H_zN_zR_1ρ测量结果提取微秒R_ex值，其中撇号表示弛豫延迟期间存在自旋锁场(Hansen等,J.Am.Chem.Soc.129,11468–11479(2007)；Hansen等,J.Am.Chem.Soc.131,16257–16265(2009))。所利用的自旋锁场在¹H和¹⁵N频率上分比为10kHz和2kHz。延迟时间对所有具有自旋锁照射的实验在2毫秒和32毫秒之间，对H_zN_z在4毫秒和128毫秒之间，在缺乏照射的情况下记录。将这些实验中的每一个记录为每个平面上具有64个复合物¹⁵N点的伪3D，并以插入方式记录9个弛豫延迟时间，以减轻由不同的样品加热引起的可能的假象。用nmrPipe(Delaglio等,J Biomol NMR 6,277–293(1995))拟合演化曲线，按照Hansen等(J.Am.Chem.Soc.131,16257–16265(2009))进行数据分析。

按照Tollinger等(J.Am.Chem.Soc.123,11341–11352(2001))的方法收集R₂分散数据集，从两点拟合确定R_2obs，以更充分地取样分散曲线(Mulder等,J.Am.Chem.Soc.123,967–975(2001))。按每个平面具有64个复合物¹⁵N点的插入伪3D和约15CPMG频率收集数据集。采样的CPMG频率在50和950HZ之间，重复两个频率用于误差分析。结果中及图25中所述的ms R_ex对序列的的作图是衍生自在50和950Hz的CPMG频率测定的R_2obs的差异的估计值。在18.8T和14.1T收集所有U14Ub的R₂分散曲线。U14Ub1、2和14具有足够的分散来拟合至MATLAB内通过GUARDD程序(Kleckner&Foster,J Biomol NMR 52,11–22(2012))执行的Carver-Richards方程(Richards&Carver,Journal of Magnetic Resonance(1972))。将分散数据拟合至在物理上聚簇的残基组，并显示相似的交换行为(图26)。除U14Ub2外，所有U14Ub都处于快速交换状态；因此，状态之间的群体和化学位移差异不可分开。针对U14Ub1、U14Ub2和U14Ub14测定的交换速率分别为4700±1200s^-1、1250±260s^-1和1870±190s^-1。U14Ub2的基态的群体为99.6±0.05％。在更低温度下探讨了R₂分散，但数据集一般由于目的区域中增加的变宽而不顺从分析。

结果

为了确认稳定的遍在蛋白变体显示β1-β2区中大范围构象动态的减慢并提供对这些运动的更深入了解，进行了对毫秒时间尺度(ms R_ex)上的运动敏感的R₂分散实验⁴²，以及在微秒时间尺度(μs R_ex)上探测主链酰胺的动态的H_zN_z R_1ρR_ex测量⁴³。在这些测量中，越高的R_ex值暗示可移动区段在通过实验探测的时间尺度上更慢的构象交换。虽然存在于野生型遍在蛋白中的运动基本上太快而不能通过ms R_ex观察到⁴⁴，但几个U14Ub在室温下显示显著的R₂分散(ms R_ex)，在U14Ub14中最显著(图19B)。R₂分散数据良好地符合两部位交换模型⁴²；但是，大多数U14Ub处于快速交换限制中，即激发态的群体与化学位移变化不可分开。例外情况是U14Ub2，U14Ub2可以符合群体稀少的激发态(0.4±0.05％)。三级结构中的β1-β2环周围区域中的μs R_ex值在U14Ub中比野生型中对应的位置高至多40倍，在U14Ub2中最显著(图19B)。

此实施例证明，虽然野生型遍在蛋白的运动如此之快，以致需要复杂的基于RDC的分析来观察²⁸，但U14Ub的动态由慢得多的μs-ms时间尺度主导。由于apo U14Ub中的运动已相对于野生型减慢，因而断定子态之间的能障已提高。不受限于理论，可以假定，这已降低了通过该途径的构象选择臂的通量，产生由诱导契合占主导的结合机制。

实施例10：U14Ub掺入多聚遍在蛋白链

总之，之前的实施例的数据表明，U14Ub通过调节apo态结构而不是基态结构的构象动态来达到亲和力改变。设计用于稳定USP结合“下”构象的突变已导致构象子态之间的能障提高，从而通过反应周期的诱导契合臂驱动U14Ub-USP14相互作用(图20A-B)。此实施例中的实验试图确定U14Ub中减慢的构象动态对遍在蛋白加工的其他方面是否具有影响。因此，检查了它们组装入链中的能力。

材料和方法

酵母中的U14Ub转化和生长

含有在半乳糖调节的启动子上表达野生型遍在蛋白的pUB146URA3标记质粒的SUB328(MATa lys2-801leu2-3,2-112ura3-52his3-Δ200trp1-1ubil-Δ1::TRP1ubi2-Δ2::URA3ubi3Δub-2ubi4-Δ2::LEU2)感受态酵母细胞在30℃培养于YPDRafGal中，并用Zymo Research Frozen-EZ酵母转化试剂盒II制备。用BglII/Kpn1限制位点将各U14Ub和野生型遍在蛋白克隆入在铜诱导型启动子上表达的Yep96TRP1标记质粒(Hanna&Finley,Mol.Cell.Biol.23,9251–9261(2003))。将400ng的各质粒与感受态细胞孵育，并按试剂盒流程转化。沉淀细胞，重悬在YPDRafGal培养基中，然后系列稀释，并滴种至YEPD+5’FOA平板上进行Yep96表达质粒的选择。将平板在30℃孵育3天并成像。

Ub14链多聚化

按之前所述(Dong等,Structure 19,1053–1063(2011)在100mM Tris(pH 8)、20mM ATP、20mM MgCl₂和1.2mM DTT中进行遍在蛋白链多聚化。每个反应包含30μM遍在蛋白或变体、125nM UBE1和1.25μMCdc34。使反应在37℃进行20小时，然后在还原型SDS上样缓冲液中猝灭，并通过18％tris-甘氨酸SDS-PAGE来显示。

结果

U14UB以与野生型遍在蛋白相似的程度通过UBE1和Cdc34组装入Lys48连接的链(图32)，表明β1-β2周围的突变可以影响DUB相互作用而不破坏遍在蛋白信号发放。有趣的是，虽然能够加工为Lys48连接的链(生长所需的唯一的链连接⁴⁵)，但U14Ub不能支持酵母中的体内生长(图20C)。

此实施例首次揭示了构象能量景貌如何可以具有显著的体内影响。因此，遍在蛋白受精细调节的构象可塑性(维持其与多组结合配偶体相互作用的能力所需)与其在真核生物中深远的保守性密不可分地联系在一起。

结论

总之，虽然噬菌体展示(与随机或靶向诱变偶联)是选择改善支架和目的靶标之间的亲和力的表面突变的有效工具，但这些方法通常忽略蛋白质-蛋白质相互作用时的动态和构象变化的影响，虽然它们可以偶尔利用动态来选择构象特异性作用。¹⁸最近描述了这样的方法，该方法用小分子来将柔性靶标“锁定”为一种给定的状态，允许改造结合某种构象的抗体。但是，这预先设想存在影响蛋白质的构象平衡的化学工具。^1-2据信，这些研究代表了第一种情况，其中用序列多样性法来有目的地发现有利于希望的构象的序列。

通过诱变蛋白质的核心并选择高亲和力相互作用，构象展示无疑有利于降低靶标的apo态的熵。由于大分子结合通常排斥特定构象，apo态的熵的降低导致复合物形成时更小的熵罚。这从最初的淘选中发现的形成分子内二硫键的U7Ub克隆的优势得到证明(图1B)。值得注意的是，二硫键稳定化暗示常用于药物化学中的策略，其中通过加入大体积基团、不饱和或环化来使具有柔性扭曲的小分子变得更稳固。¹⁹由于蛋白质通常具有比小分子多得多的自由度，对其主链柔性的决定子确定得较少，构象展示有效筛选许多序列，以找到降低柔性的埋藏氨基酸的组合来促进高亲和力相互作用。

此外，鉴定了控制其与治疗相关USP-和UCH-型脱遍在蛋白酶的相互作用的遍在蛋白功能构象，并调节了将这些状态与对USP14的提高的亲和力及对其他DUB的降低的亲和力相联系的能量景貌。据信，这些代表了影响蛋白质界面处的构象运动的第一批功能获得突变。

实施例11：U7Ub25的第二代亲和力成熟

U7Ub7的apo结构暗示C端区域可涉及通过表面相互作用与USP7结合。因此，在此区域中进行了表面残基的进一步成熟。

材料和方法

按上文所述进行亲和力成熟和斑点噬菌体ELISA。通过用掺杂密码子温和随机化(各氨基酸处～50％突变率)表面残基Q40,R42,A46,G47,Q49,Q62,E64,S65,T66,H68,V70和R72及用NNK密码子剧烈随机化C端残基R72-G76的组合来设计第二代亲和力成熟文库。用终止模板(在34-36和69-76的区域中含有两个终止密码子的p8U7Ub25的单链DNA)来构建含有～2×10¹⁰个独特成员的文库。针对USP7catC223A循环文库4轮，鉴定出61个独特结合剂。

结果

10个克隆通过斑点噬菌体竞争ELISA显示20nM范围内的IC50(数据未显示)，并选择用于进一步表征(图33)。将10个克隆中的5个表达，并纯化为蛋白质，并用ELISA排序亲和力，其中将his标记的U7Ub的系列稀释液加至用USP7catC223A固定的平板，并用抗-His-HRP检测结合的U7Ub。如图34中所示，与U7Ub25.2540(第一代亲和力成熟的U7Ub25)相比，所有第二代U7Ub25变体都显示改善的结合亲和力。最强的结合剂U7Ub25.216显示与U7Ub25.2540相比具有改善～100倍的亲和力。

虽然已为了理解的清晰性的目的以说明和实例的方式较为详细地描述了前述发明，但不应将该描述和实例解释为限制本发明的范围。本文引用的所有专利和科学文献的公开内容明确以其整体引入作为参考。

参考文献

1.Rizk,S.S.等Allosteric control of ligand-binding affinity usingengineered conformation-specific effector proteins.Nat Struct Mol Biol(2011).doi:10.1038/nsmb.2002

2.Gao,J.,Sidhu,S.S.&Wells,J.A.Two-state selection ofconformation-specific antibodies.Proc Natl Acad Sci USA 106,3071–3076(2009).

3.Lange,O.F.等Recognition dynamics up to microseconds revealedfrom an RDC-derived ubiquitin ensemble in solution.Science 320,1471–1475(2008).

4.Clague,M.J.&Urbé,S.Ubiquitin:same molecule,differentdegradation pathways.Cell 143,682–685(2010).

5.Pickart,C.M.Mechanisms underlying ubiquitination.Annu RevBiochem 70,503–533(2001).

6.Pickart,C.M.&Fushman,D.Polyubiquitin chains:polymericprotein signals.Curr Opin Chem Biol 8,610–616(2004).

7.Komander,D.,Clague,M.J.&Urbé,S.Breaking the chains:structure and function of the deubiquitinases.Nat Rev Mol Cell Biol 10,550–563(2009).

8.Nicholson,B.&Suresh Kumar,K.G.The multifaceted roles ofUSP7:new therapeutic opportunities.Cell Biochem Biophys 60,61–68(2011).

9.Hussain,S.,Zhang,Y.&Galardy,P.J.DUBs and cancer:the role ofdeubiquitinating enzymes as oncogenes,non-oncogenes and tumorsuppressors.Cell Cycle 8,1688–1697(2009).

10.Faesen,A.C.等Mechanism of USP7/HAUSP Activation by ItsC-Terminal Ubiquitin-like Domain and Allosteric Regulation byGMP-Synthetase.Mol Cell 44,147–159(2011).

11.Fernández-Montalván,A.等Biochemical characterization ofUSP7reveals post-translational modification sites and structuralrequirements for substrate processing and subcellular localization.FEBS J.274,4256–4270(2007).

12.Humphris,E.L.&Kortemme,T.Design of multi-specificity inprotein interfaces.PLoS Comput Biol 3,e164(2007).

13.Friedland,G.D.,Lakomek,N.-A.,Griesinger,C.,Meiler,J.&Kortemme,T.A correspondence between solution-state dynamics of anindividual protein and the sequence and conformational diversity of itsfamily.PLoS Comput Biol 5,e1000393(2009).

14.Li,M.,Brooks,C.L.,Kon,N.&Gu,W.A dynamic role ofHAUSP in the p53-Mdm2pathway.Mol Cell 13,879–886(2004).

15.Hu,M.等Crystal structure of a UBP-family deubiquitinatingenzyme in isolation and in complex with ubiquitin aldehyde.Cell 111,1041–1054(2002).

16.Reyes-Turcu,F.E.等The ubiquitin binding domain ZnF UBPrecognizes the C-terminal diglycine motif of unanchored ubiquitin.Cell124,1197–1208(2006).

17.Yuan,J.,Luo,K.,Zhang,L.,Cheville,J.C.&Lou,Z.USP10regulates p53localization and stability by deubiquitinating p53.Cell 140,384–396(2010).

18.Ganesan,R.等Unraveling the allosteric mechanism of serineprotease inhibition by an antibody.Structure 17,1614–1624(2009).

19.The Practice of Medicinal Chemistry,第二版736(AcademicPress:2003).

20.Hammes,G.G.,Benkovic,S.J.&Hammes-Schiffer,S.Flexibility,diversity,and cooperativity:pillars of enzyme catalysis.Biochemistry 50,10422–10430(2011).

21.Boudreaux,D.A.,Maiti,T.K.,Davies,C.W.&Das,C.Ubiquitinvinyl methyl ester binding orients the misaligned active site of the ubiquitinhydrolase UCHL1into productive conformation.Proc Natl Acad Sci USA107,9117–9122(2010).

22.Larsen,C.N.,Price,J.S.&Wilkinson,K.D.Substrate bindingand catalysis by ubiquitin C-terminal hydrolases:identification of twoactive site residues.Biochemistry 35,6735–6744(1996).

23.Jeong,H.,Mason,S.P.,Barabási,A.L.&Oltvai,Z.N.Lethalityand centrality in protein networks.Nature 411,41–42(2001).

24.Komander,D.The emerging complexity of protein ubiquitination.Biochem.Soc.Trans.37,937–953(2009).

25.Ciechanover,A.&Schwartz,A.L.The ubiquitin system:pathogenesis of human diseases and drug targeting.Biochim.Biophys.Acta1695,3–17(2004).

26.Shi,D.&Grossman,S.R.Ubiquitin becomes ubiquitous incancer:emerging roles of ubiquitin ligases and deubiquitinases intumorigenesis and as therapeutic targets.Cancer Biol.Ther.10,737–747(2010).

27.Komander,D.,Clague,M.J.&Urbé,S.Breaking the chains:structure and function of the deubiquitinases.Nat.Rev.Mol.Cell Biol.10,550–563(2009).

28.Lange,O.F.等Recognition dynamics up to microsecondsrevealed from an RDC-derived ubiquitin ensemble in solution.Science 320,1471–1475(2008).

29.Wlodarski,T.&Zagrovic,B.Conformational selection andinduced fit mechanism underlie specificity in noncovalent interactions withubiquitin.Proc.Natl.Acad.Sci.U.S.A.106,19346–19351(2009).

30.Long,D.&Brüschweiler,R.In silico elucidation of therecognition dynamics of ubiquitin.PLoS Comput.Biol.7,e1002035(2011).

31.Cohen,P.&Tcherpakov,M.Will the ubiquitin system furnish asmany drug targets as protein kinases？Cell 143,686–693(2010).

32.Lee,B.-H.等Enhancement of proteasome activity by asmall-molecule inhibitor of USP14.Nature 467,179–184(2010).

33.D'Arcy,P.等Inhibition of proteasome deubiquitinating activityas a new cancer therapy.Nat.Med.17,1636–1640(2011).

34.Ovaa,H.Active-site directed probes to report enzymatic action inthe ubiquitin proteasome system.Nat Rev Cancer 7,613–620(2007).

35.Luchansky,S.J.,Lansbury,P.T.&Stein,R.L.SubstrateRecognition and Catalysis by UCH-L1.Biochemistry 45,14717–14725(2006).

36.Renatus,M.等Structural Basis of Ubiquitin Recognition by theDeubiquitinating Protease USP2.Structure 14,1293–1302(2006).

37.Leaver-Fay,A.等Methods in Enzymology.487,545–574(Elsevier:2011).

38.Fleishman,S.J.等RosettaScripts:A Scripting LanguageInterface to the Rosetta Macromolecular Modeling Suite.PLoS ONE 6,e20161(2011).

39.Havranek,J.J.&Harbury,P.B.Automated design of specificityin molecular recognition.Nat.Struct.Biol.10,45–52(2003).

40.Hammes,G.G.,Chang,Y.-C.&Oas,T.G.Conformationalselection or induced fit:a flux description of reaction mechanism.Proc.Natl.Acad.Sci.U.S.A.106,13737–13741(2009).

41.Shen,Y.等Consistent blind protein structure generation fromNMR chemical shift data.Proc.Natl.Acad.Sci.U.S.A.105,4685–4690(2008).

42.Palmer,A.G.,Kroenke,C.D.&Loria,J.P.Nuclear magneticresonance methods for quantifying microsecond-to-millisecond motions inbiological macromolecules.Meth.Enzymol.339,204–238(2001).

43.Hansen,D.F.,Feng,H.,Zhou,Z.,Bai,Y.&Kay,L.E.Selectivecharacterization of microsecond motions in proteins by NMR relaxation.J.Am.Chem.Soc.131,16257–16265(2009).

44.Massi,F.,Grey,M.J.&Palmer,A.G.Microsecond timescalebackbone conformational dynamics in ubiquitin studied with NMR R1rhorelaxation experiments.Protein Sci.14,735–742(2005).

45.Dueber,E.C.等Antagonists induce a conformational change incIAP1that promotes autoubiquitination.Science 334,376–380(2011).

46.Tonikian,R.,Zhang,Y.,Boone,C.&Sidhu,S.S.Identifyingspecificity profiles for peptide recognition modules from phage-displayedpeptide libraries.Nat Protoc 2,1368–1386(2007).

47.Cai,M.等An efficient and cost-effective isotope labelingprotocol for proteins expressed in Escherichia coli.J Biomol NMR 11,97–102(1998).

48.Hansen,D.F.等An Exchange-Free Measure of 15N TransverseRelaxation:An NMR Spectroscopy Application to the Study of a FoldingIntermediate with Pervasive Chemical Exchange.J Am Chem Soc 129,11468–11479(2007).

49.Bahrami,A.,Assadi,A.H.,Markley,J.L.&Eghbalnia,H.R.Probabilistic interaction network of evidence algorithm and its applicationto complete labeling of peak lists from protein NMR spectroscopy.PLoSComput Biol 5,e1000307(2009).

50.Findeisen,M.,Brand,T.&Berger,S.A1H-NMR thermometersuitable for cryoprobes.Magn.Reson.Chem.45,175–178(2007).

51.Grzesiek,S.&Bax,A.The importance of not saturating water inprotein NMR.Application to sensitivity enhancement and NOEmeasurements.J Am Chem Soc 115,12593–12594(1993).

52.Hansen,D.F.,Feng,H.,Zhou,Z.,Bai,Y.&Kay,L.E.Selectivecharacterization of microsecond motions in proteins by NMR relaxation.JAm Chem Soc 131,16257–16265(2009).

53.Delaglio,F.等NMRPipe:a multidimensional spectral processingsystem based on UNIX pipes.J Biomol NMR 6,277–293(1995).

54.Tollinger,M.,Skrynnikov,N.R.,Mulder,F.A.,Forman-Kay,J.D.&Kay,L.E.Slow dynamics in folded and unfolded states of an SH3domain.J Am Chem Soc 123,11341–11352(2001).

55.Mulder,F.A.A.,Skrynnikov,N.R.,Hon,B.,Dahlquist,F.W.&Kay,L.E.Measurement of Slow(μs-ms)Time Scale Dynamics in ProteinSide Chains by 15N Relaxation Dispersion NMRSpectroscopy:Application to Asn and Gln Residues in a Cavity Mutant ofT4Lysozyme.J Am Chem Soc 123,967–975(2001).

56.Wertz,I.E.等De-ubiquitination and ubiquitin ligase domains ofA20downregulate NF-kappaB signalling.Nature 430,694–699(2004).

57.Newton,K.等Using linkage-specific monoclonal antibodies toanalyze cellular ubiquitylation.Methods Mol Biol 832,185–196(2012).

58.Matsumoto,M.L.等Engineering and StructuralCharacterization of a Linear Polyubiquitin-Specific Antibody.J Mol Biol(2011).doi:10.1016/j.jmb.2011.12.053

59.Matsumoto,M.L.等K11-linked polyubiquitination in cell cyclecontrol revealed by a K11linkage-specific antibody.Mol Cell 39,477–484(2010).

60.Perkins,D.N.,Pappin,D.J.,Creasy,D.M.&Cottrell,J.S.Probability-based protein identification by searching sequence databasesusing mass spectrometry data.Electrophoresis 20,3551–3567(1999).

序列

SEQ ID NO:1-野生型遍在蛋白

MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG

Claims

1.构象稳定的遍在蛋白，其相对于野生型遍在蛋白包含一个或多个氨基酸取代。

2.权利要求1的构象稳定的遍在蛋白，其中所述一个或多个氨基酸取代稳定蛋白质的β1/β2环，使得β1/β2环限制于蛋白质数据库编号3NHE链B的约均方根偏差内的区域。

3.权利要求1或2的构象稳定的遍在蛋白，其中如通过NMR R₂分散所测量，与野生型遍在蛋白相比，所述蛋白质的β1/β2环区显示更慢的构象动态。

4.权利要求1-3中任一项的构象稳定的遍在蛋白，其中如通过NMRR₂分散所测量，与野生型遍在蛋白相比，所述β1/β2环周围的区域中的微秒R_ex值高至多40倍。

5.权利要求1-4中任一项的构象稳定的遍在蛋白，其中所述蛋白质在选自A7、A8、A13、A34、A36、A69和A71的位置处包含一个或多个氨基酸取代，其中位置相对于A1-A76(SEQ ID NO:1)。

6.权利要求5的构象稳定的遍在蛋白，其包含(a)取代A7(C)，或取代A8(C)；及(b)取代A69(C)。

7.权利要求6的构象稳定的遍在蛋白，其进一步包含选自A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M或P)、A34(I、F、L、V、S、M或T)、A36(Y、F、L、H、A、V、W、I、M或N)和A71(R、K、A、Q、W、G、H、I、R或G)的一个或多个取代。

8.权利要求5的构象稳定的遍在蛋白，其包含选自A7(D、F、R或S)、A8(Y、A、G、Q、R或Y)、A13(R、Y、E或P)、A34(I、L或T)、A36(L、Y、A或N)、A69(A、G、W、K、Y或I)和A71(A、R、Q、R或G)的一个或多个取代。

9.权利要求5-8中任一项的构象稳定的遍在蛋白，其进一步包含定位在A42、A46、A49、A62、A65、A68或A70处的一个或多个氨基酸取代，其中氨基酸残基位置对应于SEQ ID NO:1中的位置。

10.权利要求5-9中任一项的构象稳定的遍在蛋白，其进一步包含定位在A40、A42、A46、A47、A49、A62、A65、A68、A70、A71、A72、A73、A74、A75或A76处的一个或多个氨基酸取代，其中氨基酸残基位置对应于SEQ ID NO:1中的位置。

11.权利要求1-10中任一项的构象稳定的遍在蛋白，其中与野生型遍在蛋白相比，构象稳定的遍在蛋白显示与遍在蛋白特异性蛋白酶(USP)家族的脱遍在蛋白酶的结合增加。

12.权利要求1-11中任一项的构象稳定的遍在蛋白，其中构象稳定的遍在蛋白以纳摩尔范围内的Kd与脱遍在蛋白酶结合。

13.权利要求1-12中任一项的构象稳定的遍在蛋白，其中构象稳定的遍在蛋白以比野生型蛋白质的亲和力高至少1000倍的亲和力与脱遍在蛋白酶结合。

14.权利要求1-13中任一项的构象稳定的遍在蛋白，其中构象稳定的遍在蛋白抑制脱遍在蛋白酶的活性。

15.权利要求1-14中任一项的构象稳定的遍在蛋白，其中与野生型遍在蛋白相比，构象稳定的遍在蛋白显示与遍在蛋白C端水解酶(UCH)家族的脱遍在蛋白酶无结合或结合减少。

16.核酸，其编码权利要求1-15中任一项的构象稳定的遍在蛋白。

17.载体，其包含权利要求16的核酸。

18.权利要求17的载体，其中载体是表达载体。

19.细胞，其包含权利要求15的核酸，或权利要求17或18的载体。

20.权利要求19的细胞，其中细胞选自动物细胞、细菌细胞、昆虫细胞、线虫细胞和酵母细胞。

21.权利要求20的细胞，其中动物细胞是人细胞或非人细胞。

22.蛋白复合物，其包含权利要求1-15中任一项的构象稳定的遍在蛋白，和USP家族的成员的脱遍在蛋白酶。

23.权利要求22的蛋白复合物，其中脱遍在蛋白酶是USP7、USP5或USP 14。

24.权利要求23的蛋白复合物，其中脱遍在蛋白酶是USP7。

25.蛋白质，其共价连接至权利要求1-15中任一项的构象稳定的遍在蛋白中的一种或多种。

26.固体支持物，其包含固定在其上的权利要求1-15中任一项的构象稳定的遍在蛋白。

27.权利要求26的固体支持物，其中固体支持物是适合用于表面等离振子共振的表面。

28.权利要求26的固体支持物，其中固体支持物是纳米颗粒、球珠或玻璃。

29.细胞的群体，其细胞包含表达在其表面上的权利要求1-15中任一项的构象稳定的遍在蛋白。

30.抑制USP家族的脱遍在蛋白酶的方法，其包括使脱遍在蛋白酶与权利要求1-15中任一项的构象稳定的遍在蛋白接触。

31.权利要求30的方法，其中抑制是体内的或体外的。

32.鉴定结合遍在蛋白的构象形式的物质的方法，所述构象形式有利于与USP家族的脱遍在蛋白酶结合，所述方法包括：

a)使物质与权利要求1-15中任一项的构象稳定的遍在蛋白接触；和

b)测定物质是否与所述构象稳定的遍在蛋白结合。

33.权利要求32的方法，其中物质是小分子化合物、抗体、蛋白质、抑制性核酸，或其任意组合。

34.鉴定与蛋白复合物结合的物质的方法，所述蛋白复合物包含遍在蛋白和USP家族的脱遍在蛋白酶，所述方法包括：

a)使物质与权利要求22-24中任一项的蛋白复合物接触；和

b)测定物质是否能够与所述蛋白复合物结合。

35.权利要求34的方法，其中物质是小分子化合物、抗体、蛋白质、抑制性核酸，或其任意组合。

36.权利要求34的方法，其中物质破坏脱遍在蛋白酶和遍在蛋白之间的相互作用。

37.物质，其通过权利要求32-36中任一项的方法鉴定。

38.筛选蛋白质的构象稳定形式的方法，其中与野生型蛋白质相比，构象稳定形式具有提高的与结合配偶体的结合亲和力，或具有提高的调节结合配偶体的活性的能力，所述方法包括：

a)使结合配偶体与蛋白质的突变体形式的文库接触，其中突变体形式的文库是通过在一个或多个预先选择的位置处用另一氨基酸残基取代构象动态蛋白质中的氨基酸残基而产生，其中预先选择的位置定位在蛋白质的内部；和

b)根据与结合配偶体的结合或与野生型蛋白质相比提高的调节结合配偶体的活性的能力来鉴定构象稳定形式。

39.权利要求38的方法，其中根据每个位置处的氨基酸残基对蛋白质内或蛋白质的区域内的构象动态的贡献来选择预先选择的位置。

40.权利要求38或39的方法，其中文库是编码所述蛋白质的突变体形式的核酸的文库。

41.权利要求40的方法，其中文库是噬菌体展示文库。

42.权利要求41的方法，其中用于噬菌体展示文库的载体选自M13噬菌体、f1噬菌体、fd噬菌体、Ike噬菌体、N1噬菌体、肠细菌噬菌体T4、噬菌体T7和肠细菌噬菌体λ。

43.权利要求38-42中任一项的方法，其进一步包括通过用其他氨基酸残基取代一个或多个表面氨基酸残基来突变所鉴定的构象稳定蛋白质的表面上的一个或多个氨基酸残基，并筛选与不含一个或多个取代的表面氨基酸残基的构象稳定蛋白质相比具有提高的结合亲和力或调节能力的蛋白质。

44.权利要求38-43中任一项的方法，其中蛋白质选自G蛋白偶联受体(GPCR)、核激素受体、酪氨酸激酶受体和配体门控型离子通道。

45.权利要求38-44中任一项的方法，其中蛋白质是遍在蛋白。

46.权利要求38的方法，其中结合配偶体选自脱遍在蛋白酶、E1遍在蛋白活化酶、E2遍在蛋白缀合酶、E3遍在蛋白-蛋白质连接酶，和细胞蛋白酶体复合物的一个或多个成员。

47.权利要求46的方法，其中结合配偶体是脱遍在蛋白酶。

48.权利要求47的方法，其中脱遍在蛋白酶是遍在蛋白特异性蛋白酶(USP)家族脱遍在蛋白酶的成员。

49.权利要求48的方法，其中脱遍在蛋白酶选自USP7、USP5和USP14。

50.权利要求49的方法，其中脱遍在蛋白酶是USP7。