CN105308602A

CN105308602A - 获得改善的治疗性配体

Info

Publication number: CN105308602A
Application number: CN201480033334.7A
Authority: CN
Inventors: 施继晔; T·S·贝克尔; A·D·G·劳森; 刘晓峰
Original assignee: UCB SA
Current assignee: UCB SA
Priority date: 2013-06-13
Filing date: 2014-06-13
Publication date: 2016-02-03
Anticipated expiration: 2034-06-13
Also published as: GB201310544D0; US20160125124A1; CA2914726A1; US11942188B2; RU2016100234A; CN105308602B; SG11201510084TA; BR112015031171A2; EP3008648B1; KR20160019504A; CL2015003591A1; AU2014280055A1; JP6484612B2; MX2015016822A; EP3008648A2; SG10201707917UA; WO2014198951A3; JP2016527481A; RU2016100234A3; HK1218579A1

Abstract

本发明提供了涉及从头设计将与大分子靶的结合位点结合的配体或者鉴定用于改善配体对大分子靶的结合位点的亲和性的配体修饰的方法和相关的设备，其包括使用从生物大分子的数据库中提取的关于非键合的分子间或分子内原子与原子接触的信息，以鉴定针对特定原子类型，与结合位点相邻的有利区域，以及修饰候选配体以增加候选配体的原子与有利区域之间的交叉。可以通过计算机来实施本方法的一个或多个步骤。

Description

获得改善的治疗性配体

本发明涉及获得改善的治疗性配体，特别是通过确定现有或候选配体可如何被修饰以改善该配体在靶蛋白质上的结合位点处的结合或者通过帮助将作为前体的候选配体从头设计成治疗剂来获得。

治疗性分子(配体)分成2种不同的类别：化学实体(或新型化学实体，NCE)和生物制品。前者为低分子量有机化合物，其分子量通常为500道尔顿或更低，并且是化学合成的或分离自天然产物。这些化合物通常衍生自通过筛选化学或天然产物文库而发现的起始化学物质或“苗头化合物”。这样的苗头化合物通常对靶具有亚最佳的结合亲和性，并且需要在化学修饰中大量的反复试验以获得针对靶的较好的亲和性(通常具有低微摩尔或更低的亲和常数(K_D))。优选的是，苗头化合物具有较低的分子量(例如，300道尔顿或更低)，以便随后的化学修饰不会超过500道尔顿的界限。这些苗头化合物通常被称为“片段”。用以获得候选治疗性分子或前导分子的苗头化合物优化通过结构信息而大幅增强；例如通过获得与苗头分子或片段共复合的蛋白质的x射线晶体结构。这样的数据提供了对于小分子在靶蛋白质上的结合位置的洞察，并且重要的是表明了该两者之间的原子相互作用如何导致结合。此外，揭示了紧紧围绕所结合的苗头化合物的蛋白质表面的拓扑性质；具体而言，如果其为裂沟或口袋，则该结构将表明所述苗头化合物可如何经过精细的加工以更好地填充口袋内的空间以及如何与蛋白质进一步相互作用并由此改善结合亲和性和特异性。

有大量的基于计算机的算法可以用来帮助医药药剂师对苗头化合物的化学精细加工进行合理的选择。这些是基于物理学的方法(其试图根据第一原理来计算小分子与蛋白质之间的结合自由能)(例如Schrodinger(RTM)软件套件)或统计势方法(其依赖于从蛋白质-小分子结构的集合提取的原子相互作用的数据库)(例如SuperStar)。

生物制品为大的肽或蛋白质分子(其分子量超过1000道尔顿)。它们通常为识别并结合靶分子的抗体或抗体样分子，其通常具有比NCE更好的亲和性和特异性(低纳摩尔或更低的K_D)。它们还可以为其它类型的蛋白质分子，例如激素、细胞因子、生长因子或可溶性受体。

候选生物治疗性分子与结合位点的结合可以通过使该候选治疗性分子突变来修饰。这可被需要来改善结合亲和性或改变结合特异性。然而，实施突变以及检验突变分子的结合效率是相对耗时的。在得到结合效率的改善之前可能需要许多不同的突变。

已知使用计算机来预测可能是最有效的修饰类型。然而，给定的分子可以以巨大量的方式修饰，并且难以配置计算机以使得预测可以在实用的时间段内可靠地实现。

LaskowskiRA,ThorntonJM,HumbletC&SinghJ(1996)“X-SITE:useofempiricallyderivedatomicpackingpreferencestoidentifyfavourableinteractionregionsinthebindingsitesofproteins”,JournalofMolecularBiology,259,175-201公开了基于计算机的方法，其用于鉴定针对蛋白质表面上(例如在二聚体界面上或在分子识别或结合位点上)不同原子类型的有利相互作用区域。Laskowski等人的预测基于关于在高分辨率蛋白质结构中所观察到的非键合的分子内接触的经验数据的数据库。

在Laskowski等人的方法中，20种氨基酸被打碎以产生总计488种可能的3原子片段。考虑到化学相似性，这些片段减少至一组163种片段类型(其将数据库细分)。每个片段均包含第一原子(被称为“位置3”)，其与2个其它原子定义了三角测量(或空间标准化)位置。通过记录其中原子(其可被称为“第二原子”)被发现与3原子片段中的第一原子形成非键合分子内接触的各个位置而衍生密度函数。

Laskowski等人通过将密度函数植入结合位点而获得针对给定原子类型的预测的有利相互作用区域。植入各密度函数以使得与密度函数相应的3原子片段的3个原子的坐标被迭加至结合位点中相应的3原子片段的坐标上。当来自结合位点中不同的3原子片段的密度函数重叠时，使用平均“密度”来预测有利的相互作用区域。

Laskowski等人的方法是相对复杂的，并丢弃了潜在有用的数据。Laskowski等人通过利用针对各片段类型的第二原子接触的位置填充3D网格来获得密度函数。不同的网格用于163种片段类型的每一种。然后，将各第二原子类型的数据进行数学转换以给出密度函数。通过使用Laskowski等人的片段定义，片段类型可以由相同残基上的不同原子和由不同残基上的原子所共有。当Laskowski等人的数据库在这些片段类型上建立时，存在主链片段过剩，这需要在将密度函数植入结合位点的阶段进行权重下调。此外，给定的片段类型可包括数个实际片段，其在键长和键角中具有微小差异、以及在第二原子分布中具有伴随差异，当在这些标度(division)中结合时，这些差异将被掩盖。

Laskowski等人用于获得经验数据的蛋白质短程二级结构可导致偏倚并降低经验数据指示有利相互作用区域的效率。

本发明的目的是解决上文讨论的现有技术的至少一个问题。

根据本发明的方面，提供了用于从头设计将与大分子靶的结合位点结合的配体或者鉴定用于改善配体对大分子靶的结合位点的亲和性的配体修饰的方法，其包括：

a)鉴定形成靶结合位点的表面的原子的靶列表；

b)将靶列表中的各原子(下文被称为θ原子)鉴定为特定的θ原子类型；

c)从生物大分子的结构数据库中提取关于非键合的分子内或分子间原子与原子接触的信息，其中原子的接触对中的第一原子为特定的θ原子类型，并且该接触对中相对的第二原子(下文被称为ι原子)为特定的ι原子类型，所述信息包括关于ι原子相对于θ原子的空间和/或上下文数据，并且针对给定θ原子类型的多个接触从所述数据库收集的所述数据在下文中被称为θ接触集；

d)对于在步骤b)中在靶列表中鉴定的每个θ原子，根据在步骤c)中提取的相应θ接触集，将关于给定ι原子类型或预定的相关ι原子类型组的数据在靶结合位点中或其周围进行迭加；

e)以预测结合位点的一个或多个有利区域的方式组合和/或解析迭加的数据，在所述有利区域中给定的ι原子类型或预定的相关ι原子类型组具有高的理论倾向性；以及

f)通过使用理论上对接至结合位点中的候选配体，将候选配体的一个或多个原子的类型和位置与针对各自ι原子类型所预测的有利区域相比较，以就备选的和/或额外的候选配体原子而言鉴定候选配体的修饰，所述修饰将在备选的和/或额外的候选配体原子与各自ι原子类型有利区域之间产生更大的交叉，从而使得修饰的候选配体对结合位点的亲和性相较于未修饰的候选配体得到改善；

其中数据库中的每个非键合的分子内或分子间接触被定义为蛋白质折叠的相对残基之间或者大分子折叠的相对单体单元之间或者2个相互作用的大分子伴侣之间的接触，并且特别是折叠的一侧上或第一相互作用伴侣上的θ原子与相对一侧上或第二相互作用伴侣上的ι原子之间的接触；在该情形中，满足以下条件：

s-Rw≤t，其中s为所述接触的2个原子之间的间隔，Rw为所述接触的2个原子的范德华半径的总和，而t为预定的阈值距离；以及

其中在步骤b)中独特地鉴定θ原子类型，使得在针对给定的θ原子类型在步骤c)中提取的θ接触集的数据与针对任何其它θ原子类型在步骤c)中提取的任何其它θ接触集的数据之间不存在交叉，除了关于涉及作为ι原子的给定θ原子的接触的数据以外。

因此，结合位点中的各靶原子类型被独特地分类，并且与关于从结构数据库提取的接触集(其是独特的，并且不与与任何其它原子类型有关的接触集重叠，除了涉及本身作为ι原子的靶原子类型的那些接触以外)的信息有关。这意味着基于结合位点中的一个靶原子测定的针对给定ι原子类型或预定的相关ι原子类型组的理论位置的分布可以更有效地(例如不进行加权)与基于结合位点中的另一个靶原子测定的针对ι原子类型或预定的相关ι原子类型组的理论位置的分布结合(例如通过总和)，例如以提供针对ι原子类型或预定的相关ι原子类型组的一个或多个有利区域的改善的预测。并且由于结合位点中的各靶原子被独特地分类，故不存在要考虑的键长或键角变化，因此给定ι原子的理论位置更精确。

在实施方案中，利用简单的规则来为三角测量的目的独特地鉴定相邻的原子。不需要关于相邻原子的化学性质进行假设，这例如在根据Laskowski等人的163个3原子片段类型来表征接触类型时是必需的。

在实施方案中，在步骤c)中提取的空间数据通过几何参照θ原子的位置和第三及第四原子的位置而定义了θ接触集中指定的各ι原子的位置，其中第三原子与θ原子共价键合，并且第四原子与第三原子共价键合。在这样的实施方案的实例中，对于θ接触集中指定的各个ι原子，在步骤c)中提取的所述空间数据还通过几何参照θ原子的位置和第三及第四原子的位置而定义了第五和第六原子的位置，其中第五原子与ι原子共价键合，并且第六原子与第五原子或ι原子共价键合。

在实施方案中，步骤d)的靶位点中或其周围的迭加包括：解析θ接触集以提取针对包含给定的ι原子类型或一种或多种预定的相关ι原子类型组的接触的空间数据；和标绘此空间数据以测定理论位置，其代表了其中如果：i)该接触的θ原子定位于靶结合位点中的相应θ原子的位置；以及ii)该接触的第三和第四原子定位于靶结合位点中的相应θ原子的第三和第四原子的位置，则各ι原子类型或一种或多种预定的相关ι原子类型组的每一种会定位于的位置。在实施方案中，在标绘步骤之前针对上下文数据对空间数据进行解析。

在实施方案中，其中针对ι原子类型(或者一种或多种预定的相关ι原子类型组)的理论位置的密度高于预定阈值的区域被鉴定为有利区域之一。在这样的实施方案的实例中，针对靶列表上的多个θ原子测定针对给定ι原子类型或一种或多种预定的相关ι原子类型组的理论位置，并且其中累积理论位置的密度高于预定阈值的区域被鉴定为有利区域之一。

因此，将来自结合位点中不同原子的理论位置累积结合起来，随后为预测有利区域的目的获得理论位置的密度。这导致更准确地统计学表示给定ι原子类型或在相关ι原子类型的给定组中，位于给定位置处的概率，因为其以成比例且无偏的方式考虑了结合位点所有相关原子类型的贡献。相反，在Laskowski等人的方法中，密度函数衍生自3原子片段的组。每个原子可以与几个不同的3原子片段组关联，因此不可能简单地以与本发明的实施方案相当的方式将密度函数加算在一起。实际上，在组合密度函数之前必须进行加权和/或平均，这增加了复杂性和/或降低了准确性。

在实施方案中，仅将彼此间隔4个或更多残基的原子之间的接触用于鉴定有利区域。这显著减少或避免了由于短程二级结构所导致的偏倚。在实施方案中，接触数据主要代表了远程的交叉折叠的蛋白质数据。

根据本发明的另一个方面，提供了生成数据库的方法，所述数据库用于从头设计将与大分子靶的结合位点结合的配体或者鉴定用于改善配体对大分子靶的结合位点的亲和性的配体修饰的方法，所述生成数据库的方法包括：

分析多个蛋白质或其它生物学大分子的每一个中原子的相对位置，以鉴定所述蛋白质或大分子的第一原子(被称为θ原子)与第二原子(被称为ι原子)之间的非键合分子内接触的情形；以及

生成数据库，对于各个鉴定的接触，所述数据库指定：θ原子的类型，ι原子的类型，以及ι原子相对于θ原子的位置；

其中非键合的分子内接触被定义为满足以下条件的情形：

s-Rw≤t，其中s为θ原子和ι原子之间的间隔，Rw为θ原子和ι原子的范德华半径的总和，而t为预定的阈值距离，其通常为2.5埃，优选为0.8埃；以及

其中在蛋白质的情况下，θ原子和ι原子在线性多肽上彼此间隔至少4个残基的氨基酸残基上，或者在分开的多肽链上。

生成数据库，对于各个鉴定的接触而言，数据库指定：θ原子的类型，ι原子的类型，以及ι原子相对于θ原子的位置；

其中非键合的分子内接触被定义为满足以下条件的情形：

其中该方法包括将数据库细分以形成鉴定的接触的组，其中θ原子为蛋白质的20种天然氨基酸中存在的167种非氢原子的一种且仅一种，并且ι原子在通过基于化学相似性将蛋白质的20种天然氨基酸中存在的167种非氢原子分选成组而获得的多个非重叠组中的一种且仅一种中。

现将参照附图，仅以举例的方式描述本发明的实施方案，在附图中相应的参照符号表示相应的部分，并且其中：

图1为针对非键合分子内或分子间接触的原子和用于坐标标准化的相邻原子的示例性命名法的示意图；

图2-6示出了针对非键合分子内或分子间接触中的原子的坐标标准化的过程；

图7为示出从头设计将与大分子靶的结合位点结合的配体或者鉴定用于改善配体对大分子靶的结合位点的亲和性的配体修饰的方法中的步骤的流程图；

图8为计算机生成的可视化图像，其描绘了轻链苏氨酸30至精氨酸30的突变；

图9为计算机生成的可视化图像，其描绘了轻链精氨酸54至丝氨酸54的突变；

图10为计算机生成的可视化图像，其描绘了轻链丝氨酸56至异亮氨酸56的突变；

图11为计算机生成的可视化图像，其描绘了轻链丝氨酸60至天冬氨酸60的突变；

图12为计算机生成的可视化图像，其描绘了轻链苏氨酸72至精氨酸72的突变；

图13为计算机生成的可视化图像，其描绘了抗体496i轻链中5个突变的组合，其导致对IL17F的亲和性改善180倍；

图14为示出预测Fab的VH-VL界面处的点突变的作用的方法中的步骤的流程图；

图15为计算机生成的可视化图像，其描绘了重链苏氨酸71至精氨酸71的突变；

图16为计算机生成的可视化图像，其描绘了轻链丝氨酸107至谷氨酸107的突变；

图17为计算机生成的可视化图像，其描绘了轻链苏氨酸109至异亮氨酸109的突变；

图18为计算机生成的可视化图像，其描述了FabX中3个突变的组合，其导致81.2℃的Tm。

世界范围蛋白质数据库(wwPDB)保存了大分子结构数据的档案，其是全球公众可自由且公开获得的。到2013年5月为止，该数据集达到了90000个结构的里程碑。大部分的这些大分子为蛋白质，其大多数已通过X射线晶体学进行了测定。因此，储存的数据包含以构成各个蛋白质结构的个体原子的笛卡尔坐标形式的原子水平下的3维数据。

本发明人假设可以从该档案提取有用的信息，其可用于帮助设计新型治疗剂。初生蛋白质的多肽链以显著可重复的方式折叠成复杂的三维三级和四级结构，以产生成熟的蛋白质。影响蛋白质二级结构(诸如螺旋、β折叠和转角的元件)形成的相互作用是已知的。然而，很少了解预测较高级的蛋白质折叠的规则。尽管如此，本发明人认识到，一定存在控制相同分子内(例如蛋白质折叠的相对面上)或不同分子上的非键合的但“接触”的原子的相互作用的精确的规则。

在实施方案中，分析了生物学大分子的结构数据库(例如wwPDB)以提取这样的规则，并利用该规则来促进药物发现。下文描述了这样的过程的实例。

在实施方案中，在大分子的结构数据库(例如wwPDB)中，针对每个大分子(例如蛋白质)或较少于所有大分子的亚组，鉴定了接触原子(分别被称为“θ”和“ι”原子)的非键合对。这样的接触可以例如在蛋白质折叠的相对残基之间或者在大分子折叠的相对单体单元之间(大分子结构的分开的链之间)或者在2个相互作用的大分子伴侣之间形成。每个接触均被分类为在折叠一侧或第一相互作用伴侣上的θ原子与相对一侧上或第二相互作用伴侣上的ι原子之间。

在实施方案中，非键合的分子内或分子间接触被定义为其中满足以下条件的情形：1)s-Rw≤t，其中s为接触的2个原子之间的间隔，Rw为接触的2个原子的范德华半径的总和，而t为预定的阈值距离；以及任选地还满足以下条件：2)接触的2个原子沿着线性多肽链上彼此间隔至少4个残基，或者在分开的多肽链上。在实施方案中，预定的距离为2.5埃。在另一个实施方案中，预定的距离为1.5埃。在另一个实施方案中，预定的距离为1.0埃。在另一个实施方案中，预定的距离为0.8埃。

在以下描述中，对“接触”的任何引述均被理解为意指根据上文给出的定义的“非键合的分子内接触或分子间接触”。

诸如wwPDB的数据库可以具有关于彼此极为相似和/或具有相关的结构的蛋白质的信息。在实施方案中，解析数据库以避免/减少由这样的相似性/关系所引起的偏倚。在实施方案中，基于一级序列同源性进行解析，例如以使得选择各相似/相关蛋白质家族的仅一个代表性结构来于分析。此外或备选地，可以使用一个或多个其它的选择标准，例如可以并入高分辨率和低温度系数的结构。在实施方案中，由生物学大分子的(一级)结构数据库(例如wwPDB)起始构建次级数据库。次级数据库包含关于非键合的分子内或分子间接触的信息。在实施方案中，次级数据库包含关于超过1x10⁶个接触对的信息，任选地超过5x10⁶个接触对，任选地超过1.1x10⁷个接触对。在一个实施方案中，次级数据库包含从大约20000个非同源蛋白质提取的超过1.5x10⁷个接触原子对的信息。

在实施方案中，次级数据库包含关于接触对的精确原子类型的信息。在实施方案中，次级数据库包含定义了θ原子与ι原子的3维关系的空间数据。在实施方案中，次级数据库还包含关于接触的局部环境的上下文数据。在实施方案中，上下文数据包含关于各接触对的局部环境的信息，包括以任意组合的下述的一个或多个：二级结构，包含接触对的氨基酸类型或其它单体类型，在接触的任一侧上的聚合物链中的相邻单体单元和/或其局部几何学，在接触的任一侧上的多肽链中的相邻氨基酸，所述相邻单体单元或氨基酸的局部几何学，θ原子的温度系数，ι原子的温度系数，θ原子的可及表面积，ι原子的可及表面积，针对特定θ原子的不同ι原子接触的数量，以及在与θ原子相同的单体单元上其它θ原子的数量。

在实施方案中，接触对和共价附着的相邻原子(作为一组)的3D坐标针对如下文所述的共同数据库参照系进行标准化。这简化了随后的接触模式或规则下的势的分析和任何这样的规则至药物设计的应用。

在实施方案中，θ原子类型被鉴定为以下的一种且仅一种：构成蛋白质的20种天然氨基酸结构单元的167种共价原子类型(除了氢以外)(在这种情形下，次级数据库可被相应地划分并包含关于多至27889(167x167)种不同接触类型的信息)；和/或脱氧核糖核酸聚合物(DNA)的4种核苷酸中存在的82种非氢原子；和/或甲基化的DNA核苷酸、磷酸胞苷和磷酸腺苷中存在的42种非氢原子；和/或核糖核酸聚合物(RNA)的4种磷酸核苷酸中存在的85种非氢原子；和/或RNA的2-O’-甲基化磷酸核糖核苷酸中存在的89种非氢原子；和/或最常见的转录后碱基修饰的RNA中存在的超过400种非氢原子。

在实施方案中，ι原子类型被鉴定为以下的一种且仅一种：构成蛋白质的20种天然氨基酸结构单元的167种共价原子类型(除了氢以外)；和/或在蛋白质结合的、结构相关的水分子中存在的氧原子(这可以是有用的，因为一级数据库中的晶体结构通常包含结构相关的水分子，即，某些蛋白质原子显示与结合的水分子的明确的相互作用)；和/或脱氧核糖核酸聚合物(DNA)的4种核苷酸中存在的82种非氢原子；和/或甲基化的DNA核苷酸、磷酸胞苷和磷酸腺苷中存在的42种非氢原子；和/或核糖核酸聚合物(RNA)的4种磷酸核苷酸中存在的85种非氢原子；和/或RNA的2-O’-甲基化磷酸核糖核苷酸中存在的89种非氢原子；和/或最常见的转录后碱基修饰的RNA中存在的超过400种非氢原子。

在接触对中，从接触上的任一侧来观察并记录相对的原子。示例性实施方案中的命名法描述于下文中并且在图1中示意性地说明。

在接触的参照侧上的原子被称为θ原子1，而相对的原子被称为ι原子2。在该实例中，用于标准化3D坐标的其它原子如下定义。氨基酸的Cα原子方向上d与θ原子1共价键合的下一原子被称为第三原子3，而再下一原子被称为第四原子4。第四原子4与第三原子3共价键合。各个氨基酸的Cα原子方向上的与ι原子2共价键合的下一原子被称为第五原子5，而再下一原子被称为第六原子6。第六原子与第五原子或ι原子2共价键合。

在实施方案中，为了避免模糊不清，针对各个指定的θ原子类型独特地选择第三和第四原子。此外，在实施方案中，还独特地选择第五和第六原子。在实施方案中，使用以下约定。如果θ原子1碰巧为Cα原子，则第三和第四原子分别为主链羰基碳和氧原子。如果θ原子1为主链羰基碳，则第三原子3和第四原子4分别为为Cα碳和主链氮。如果θ原子1为主链氮，则第三原子3和第四原子4分别为Cα碳和主链羰基碳。如果θ原子1为Cβ碳原子，则第三原子3和第四原子4分别为Cα碳和主链羰基碳。在其中第三和第四原子位置存在2个ε碳原子选择的苯丙氨酸和酪氨酸侧链中，则选择与主链氮原子最近的原子。

在实施方案中，对θ、ι、第三和第四原子、以及任选第五和第六原子(作为一组)进行每个接触的坐标标准化，以使得它们的3D关系得到保持。所得的标准化的坐标可以被称为标准化的坐标组。在实施方案中，如图2-6中所示，这通过依次实施以下步骤来实现。

图2示出了根据一级数据库(例如wwPDB)中给出的坐标，相对于参照系(相对于x、y和z轴定义的)定位的非键合分子内或分子间接触的θ原子1、第三原子3和第四原子4。在示例性坐标标准化过程的第一步中，将原子组坐标进行转换，以使得θ原子1位于零坐标上(图3)。接着，将组作为整体绕着z轴旋转，直至第三原子3在y＝0上(图4)。接着，将组绕着y轴旋转，直至第三原子在y＝0和z＝0上(图5)。接着，将组绕着x轴旋转，直至第四原子4在y＝0上，并且组作为整体位于x-y平面(所有3个原子均在y＝0上，图6)上。按照这种方式，167种第一原子类型的每一种可以针对该类型进行迭加，并将次级数据库进行相应地细分。进而第一原子划分的每一个可被细分至167种ι原子类型，从而促进每种ι原子类型相对于每种θ原子类型的空间分布的分析。

在实施方案中，对ι原子相对于θ原子的分布模式进行分析，以鉴定针对名义上不同的ι原子类型的分布模式之间的相似性。按照这种方式，独特的ι原子类型(例如上文提及的167种共价原子类型)可被组合至多个组(本文称为“预定的相关ι原子类型组”)，以简化数据的随后使用。根据分布模式的相似性将原子类型分组在一起会减少与下文例如参照图7描述的方法相关的计算负荷，从而提高速度和/或减少硬件费用。

在实施方案中，通过使用极坐标而非笛卡尔坐标来简化此过程(在实施方案中，例如在一级数据库中的数据使用笛卡尔坐标来呈现时，这通过进行笛卡尔坐标与极坐标之间的转换处理来实现)。在实施方案中，使用2维极坐标，从而仅根据2个极角θ(theta)和Φ(phi)(相应于球体上的纬度和经度)来指定θ和ι原子的相对位置。所得的2维纬度-经度图不显示关于θ与ι原子之间的距离变化的任何信息。然而，发现该距离是相对恒定的，从而θ-Φ图包含了关于接触的大部分相关信息。将分析简化至2维而非3维的问题极大地改善随后分析的效率。在实施方案中，使用等高线来显示ι原子的相对位置的变化。等高线可以表示θ和ι原子的相对定位的恒定“密度”或概率的线。

这样的极角图的分析揭示控制ι原子频率的模式的特别重要的因素为ι原子的元素性质和杂化状态，即Csp3,Csp2(芳香族),Csp2(非芳香族),Nsp3,Nsp2,Osp3,Osp2或S。因此，可能的是根据这些经鉴定的8个组通过将167种原子类型分组来改善分析效率。在其它的实施方案中，可以使用不同的分组。

通常，接触周围的环境因素(例如相邻氨基酸的性质)对ι频率模式产生较小的影响，二级结构除外。如可以预期的，主链酰胺氮θ原子相对主链氧ι原子(反之亦然)的频率模式被二级结构偏斜，特别是关于它们是否来自β折叠。

在实施方案中，次级数据库用局部二级结构类型(螺旋、β折叠或随机卷曲)标记接触数据。这为在后期区分二级结构对接触模式的任何潜在影响提供基础。

在实施方案中，基于上文提供了有助于鉴定配体的修饰的方法，所述修饰改善配体对结合位点的结合强度或亲和性。在实施方案中，该方法用于辅助NCE或生物药物设计。关于前者，该方法可以用于预测靶蛋白质的潜在药物结合位点中的“热点(hotspot)”或药效团原子位置。这可以促进从头药物设计。在其中结合于结合位点中的化学物质的可利用结构存在的情形下，该方法可以提示用于精细加工化学过程以获得具有良好结合特性的配体的原子类型和位置。在蛋白质药物(例如抗体)的情形下，该方法可以用于预测蛋白质或抗体结合位点中会引起结合亲和性或特异性的改善的突变。该方法还可以用于提示用于大分子结构中的修饰以改善大分子的性质的位置。例如如下文中实施例部分中所示，该方法可以用于鉴定抗体VH和VL链中的点突变，以改善抗体的热稳定性。突变是在分开的链上，但仍在抗体大分子内。

图7示出了用于从头设计将与大分子靶的结合位点结合的配体或者鉴定用于改善配体对大分子靶的结合位点的亲和性的配体修饰的示例性方法。

在步骤S1中，例如从本地或远程存储装置5获得代表靶蛋白质的靶结合位点的数据。鉴定了形成了靶结合位点的表面的原子的靶列表。

在步骤S2中，将靶列表中的每个原子鉴定为特定的θ原子类型。

在步骤S3中，从生物学大分子的结构数据库(例如wwPDB)(例如通过本地或远程存储装置7提供)提取关于非键合的分子内或分子间接触的信息，其中原子接触对中的第一原子为特定的θ原子类型，并且该原子接触对的相对的第二原子为特定的ι原子类型。所提取的信息包括关于ι原子相对于θ原子的空间和/或上下文数据。针对给定θ原子类型的多个接触收集数据，并且所得的数据集被称为θ接触集。在实施方案中，θ接触集包含针对给定θ原子类型的所有可获得的接触而收集的数据。所提取的信息可以形成作为上文所讨论的“次级数据库”的实例的数据库。在实施方案中，将在步骤S3中提取的信息收集于次级数据库中，该数据库包含针对各种θ原子类型的一种且仅一种θ接触集。在这样的实施方案的实例中，次级数据库的θ接触集被细分为多个非重叠的ι原子类型或非重叠的相关ι原子类型组。在这样的实施方案的实例中，数据库被细分以形成所鉴定的接触的组，其中第一原子为蛋白质的20种天然氨基酸中存在的167种非氢原子的一种且仅一种，并且第二原子在通过基于化学相似性将蛋白质的20种天然氨基酸中存在的167种非氢原子分选至组而获得的多个非重叠组的一种且仅一种中。

在步骤S4中，对于在步骤S2中在靶列表中鉴定的各个θ原子，将来自在步骤S3中提取的相应θ接触集的关于给定ι原子类型或预定的相关ι原子类型组的数据在靶结合位点中或其周围进行迭加。在实施方案中，迭加包括：解析θ接触集以提取针对包含给定的ι原子类型或一种或多种预定的相关ι原子类型组的接触的空间数据；和标绘此空间数据以测定理论位置，其代表了其中如果：i)该接触的θ原子定位于靶结合位点中的相应θ原子的位置；以及ii)该接触的第三和第四原子定位于靶结合位点中的相应θ原子的第三和第四原子的位置，则各ι原子类型或一种或多种预定的相关ι原子类型组的每一种会定位于的位置。当测定的理论位置与结合位点原子相冲突和/或被掩埋于靶蛋白质中时，这些可以从进一步分析中除去。例如如果测定个体ι原子的理论位置以比Rw-0.2埃更近的距离与靶大分子的原子的位置交叉，则从随后的分析排除该ι原子。

在步骤S5中，以预测结合位点的一个或多个有利区域的方式组合和/或解析迭加的数据，在所述有利区域中给定的ι原子类型或预定的相关ι原子类型组具有高的理论倾向性。

在步骤S6中，将候选配体理论上地对接至结合位点。可以例如从本地或远程存储装置9提供定义候选配体的数据。随后在候选配体的一个或多个原子的类型和位置与针对各ι原子类型所预测的有利区域之间进行比较。基于该比较，就备选或额外的候选配体原子而言鉴定候选配体的修饰，所述修饰将在备选的和/或额外的候选配体原子与各自ι原子类型有利区域之间产生更大的交叉，从而使得修饰的候选配体对结合位点的亲和性相较于未修饰的候选配体得到改善。

在步骤S7中，修饰的候选配体作为对现有配体的建议改善或作为从头设计的新配体的一部分输出。任选地，可以重复步骤S7和S6以进一步修饰配体。本地或远程存储装置5、7和9可以在单一的硬件(例如单一的存储装置)中或者在2个或更多个不同的分开的设备中实现。

在实施方案中，修饰的候选配体被输出至输出存储装置用于储存或传输，和/或输出至显示器用于可视化。

在实施方案中，在步骤S2中独特地鉴定给定θ原子的类型，以使得针对给定θ原子的接触集(针对其在步骤S3中提取信息)与针对任何其它θ原子类型的接触集之间不存在交叉(除了涉及作为ι原子的给定θ原子的接触以外)。

在实施方案中，步骤S5包括测定针对多个不同的ι原子类型和/或预定的相关ι原子类型组的每一个的一个或多个有利区域。在这样的实施方案中，对于多个不同的ι原子类型和/或预定的相关ι原子类型组的每一个，可以重复比较步骤S6以鉴定涉及不同的ι原子类型或预定的相关ι原子类型组的潜在修饰。

在实施方案中，对结合位点处的多个不同原子实施步骤S2-S7。在实施方案中，如下文所述，通过累积组合(例如总和)ι原子类型的测定的理论位置的分布(其是针对结合位点处的多个不同原子导出的)而可以更精确地测定有利区域。

在实施方案中，将分析扩展，以使得针对每个有利区域，推导出描述第五原子相对于各自ι原子的位置的矢量。对该矢量进行分析，以鉴定有利的键矢量，其代表区域中理论一致的ι原子的共价连接的预测。然后，根据具体情况，可以使用所鉴定的有利的键矢量来适当地精制候选配体的设计和/或精制候选配体的修饰。例如可以使用所鉴定的有利的键矢量来表明不同有利区域中的ι原子可如何键合在一起，从而帮助鉴定涉及原子的复数加入或交换的修饰。在实施方案中，分析为聚类分析。

理论位置的分布给出了具体的ι原子类型(或者预定的相关ι原子类型组)在结合位点中的不同位置处将如何有利存在的量度或倾向性。在实施方案中，其中理论位置的密度高于预定阈值的区域被鉴定为有利区域之一。理论位置的密度为测定的理论位置的数量的量度，所述理论位置例如在给定的空间体积中出现。在实施方案中，针对结合位点中的多个靶原子测定ι原子理论位置，并且其中ι原子(或者预定的相关ι原子类型组)针对多个靶原子的累积理论位置的密度高于预定阈值的区域被鉴定为有利区域之一。可以将针对结合位点处的不同靶原子测定的理论位置进行总和，例如以获得累积理论位置。此考虑结合位点中不同原子的作用的方法是计算高效的，并且将关于候选配体与结合位点之间的相互作用的信息的损失降至最低。此方法可以通过就简单原子类型、或者简单原子类型与预定的简单原子类型组的原子相组合的配对的接触的表征来促进。当例如就3原子片段来表征接触时(例如Laskowski等人的情形)，这样的方法是无效的。

可以以多种方式转换所得的理论位置的分布，以生成概率密度函数，即，在结合位点中的给定位置处优选给定ι原子类型的统计势。继而，可以按照与电子密度类似的方式来处理概率密度函数，并将其转化成ccp4文件，其是在分子图形学软件(例如Pymol)中可视化这样的图谱的标准方式。

在实施方案中，在步骤S5中，在极坐标中表示一个或多个有利区域，任选地仅包括极角和方位角，任选地其中通过参照第三和第四原子3,4而将参照系标准化。

在实施方案中，步骤S6包括：鉴定候选配体的修饰，该修饰增加候选配体的原子(无论在修饰之前该原子是否存在)与针对结合位点中相同类型的原子所预测的有利区域之间的重叠程度。在实施方案中，将所生成的理论位置和/或有利区域的分布作为在与各自候选配体复合的靶大分子结构上的迭加来例如通过计算机软件或人工方式进行检查。如果例如候选配体与抗体有关，则可以检查抗体与靶大分子之间的界面，以测定抗体原子与针对该原子鉴定的各ι原子理论位置分布和/或有利区域之间的重叠程度。在一些情况下，重叠程度将已经是高的。然而，在界面的其它区域中，重叠可以是低的。正是在这些区域中，抗体的相邻氨基酸残基中的突变可以被最有效地鉴定/提供。在实施方案中，在该位置中依次考虑以其各自的所有旋转异构体构象的19种其它天然氨基酸的每一种，并且在每种情形下，检查与相关ι原子理论位置分布和/或有利区域的重叠程度，目的在于选择针对所提出的突变具有最大重叠程度的那些残基。按照这种方式，提供了选择突变的合理手段，所述突变可以在所选择的抗体中使亲和性得到改善。可以生成抗体-靶蛋白界面的不同区域中的个别点突变；使得亲和性得到改善的那些突变可以与2种或更多种可以使亲和性协同增高的突变组合来进行检验。

在实施方案中，步骤S6包括使用选自其它19种天然氨基酸的一个或多个(任选所有)残基的每一个替代配体的一个或多个(任选所有)氨基酸残基(其与靶结合位点直接接触或与靶结合位点紧密靠近)的每一个。每种这样的替代在本文中被称为“残基替代”，并且包括通过用不同的残基来单一替代一个残基的配体修饰。在实施方案中，针对不导致与配体或靶的相邻原子发生冲突(例如，替代残基的一个或多个原子与靶或配体的一个或多个其它原子之间的重叠)的每个这样的残基替代，将替代残基的每个原子的类型和位置与各自ι原子类型有利区域相比较，以鉴定它们是否产生比原始残基的原子更大的交叉。在实施方案中，随后输出被鉴定为产生比原始残基的原子更大的交叉的残基替代的列表。在实施方案中，针对所列出的残基替代的每一个，随后使候选配体突变以产生经修饰的单一残基突变的配体，该配体并入了残基替代。然后，可以通过试验来检验各种经修饰的配体与靶结合位点的亲和性，以鉴定提供针对候选配体的最大亲和性改善的那些修饰。例如可以鉴定一组残基替代，其产生比预定阈值更大的残基替代。在实施方案中，预定阈值可以为0，以使得所选的组仅由改善亲和性至一定程度的残基替代组成。然后给予此信息，可以对候选配体实施更高级的修饰。例如，在实施方案中，可以对候选配体进行修饰以并入多个残基替代，例如多个被个别地测定为提供最大亲和性改善的那些残基替代。按照这种方式，可能的是设计具有改善的亲和性的配体，所述改善甚至比仅替代单一残基而可能获得的改善还要高。

在一些实施方案中，可以生成残基替代的列表，其满足提供比原始残基的原子更大的交叉(具有小于0的ΔIOTA得分)。该列表可以另外地基于其它的标准进行评级。例如可以基于ΔΔG得分来过滤列表(参见下文)。具有小于0的ΔΔG得分的残基替代意味着比原始残基更强的相互作用。因此，可以生成列表，其中残基满足ΔIOTA得分小于0(负的ΔIOTA得分)和ΔΔG小于0(负的ΔΔG)的标准。这示于以下实施例2中。

在化学物质(例如结合在靶蛋白质口袋中的低分子量化学片段的晶体结构)的情形下，在结合位点处显示的ι原子理论位置分布和/或有利区域可以表明可以产生较高效价的原型NCE的原子类型和用于片段生长的化学键的矢量。

在实施方案中，鉴定对候选配体的多个修饰。在这种情形下，方法可以进一步包括选择所鉴定的修饰的亚组，例如以鉴定在改善亲和性方面可能更有效的修饰。可以基于备选的和/或额外的候选配体原子与各自ι原子类型有利区域之间的交叉比未修饰的候选配体高出的程度来进行选择。例如可以选择使得交叉升高高于预定阈值的修饰，并丢弃使得交叉升高低于预定阈值的修饰。这样的选择过程的实例在下文的“实施例2”上下文中进行讨论。“ΔIOTA得分”为备选的和/或额外的候选配体原子与各自ι原子类型有利区域之间的交叉比未修饰的候选配体高出的程度的量度的实例。备选地或额外地，可以基于促成由经修饰的候选配体与结合位点的结合而形成的复合物的总能量的一种或多种因素相较于其中结合未修饰的候选配体的情形所减少的程度来进行选择。例如可以选择导致一种或多种因素的降低(例如一种或多种因素的总和的降低)高于预定阈值的修饰，并丢弃导致一种或多种因素的降低(例如一种或多种因素的总和的降低)低于预定阈值的修饰。这样的选择过程的实例在下文的“实施例2”上下文中进行讨论。“RosettaΔΔG得分”为促成由候选配体与结合位点的结合而形成的复合物的总能量的一种或多种因素减少的程度的量度的实例。促成复合物的总能量的因素的实例包括Lennard-Jones项，虚拟溶剂项，取向依赖的氢键项，由PDB推导的侧链和主链的扭转势能，基于知识的短程静电项，以及针对20种氨基酸的每一种的模拟未折叠状态的参照能，如下文所讨论的。

在实施方案中，鉴定候选配体的修饰的方法为计算机实施的方法。在实施方案中，步骤S1-S7的任意一步或多步是在计算机上执行的。在实施方案中，步骤S1-S7的所有步骤都是在计算机上执行的。此外，图14的步骤S101-S109(示出了用于预测抗体的VH-VL界面上的点突变的工作流程)的任意一步或多步可以是自动化的。步骤S101-S109的任意一步或多步可以在计算机上执行。在实施方案中，步骤S101-S109的所有步骤是自动化的。步骤S101-S109的所有步骤可以在计算机上执行。

本领域技术人员公知的广泛多样的标准计算配置可以用作实施本方法的平台。方法不限于用于储存或传输用于定义和/或实施方法步骤所必需的软件的任何特定的硬件配置、操作系统或工具。在实施方案中，提供了包括用于使计算机执行方法的计算机可读指令(例如以计算机编程语言的编码)的计算机可读介质或信号。

在实施方案中，提供了制造治疗性配体的方法。在实施方案中，制造方法包括根据上文描述的一个或多个实施方案来设计新的配体或修饰现有的配体。

实施例1：抗IL17F抗体的Fab片段的亲和性成熟

引言

抗体亲和性成熟的体外方法是公知的(参见US8303953B2，第13列，第19至33行)。在最近的实例中，Fujino等人(Fujino等人(2012)“Robustinvitroaffinitymaturationstrategybasedoninterface-focusedhigh-throughputmutationalscanning”,Biochem.Biophys.Res.Comm.,428,395-400)报告了高通量突变扫描策略，其基于在抗体的50个经鉴定的抗原界面残基的每一个上的单点突变单链Fab文库的核糖体展示筛选，随后进行增强的结合剂的组合核糖体展示，这导致亲和性改善超过2000倍的Fab的鉴定。这样的方法需要在基于试验室的资源的大量投入，因此，不同的研究组(综述：Kuroda等人(2012)“Computer-aidedantibodydesign”,Prot.Eng.Design&Selection,25,507-521)研究了预测抗体亲和性改善的计算机模拟方法以减少或消除就改善的亲和性筛选大量的突变抗体变体的需要。这些计算机协助的抗体设计方案是基于知识的，即，使用由观察数据推导的统计势；或者是基于物理学的，即，使用由基础物理相互作用的模型推导的能量函数。Lippow等人(2007)(Lippow等人(2007),“Computationaldesignofantibody-affinityimprovementbeyondinvivomaturation”,NatBiotech.,25,1171-1176)使用基于静电相互作用的上述后一种方法已实现了适度的成功，然而我们对这样的方法的参数化仍远没有完全理解。到目前为止，基于知识的方法倾向于鉴定用于随机诱变的个别抗体残基(例如Barderas等人(2008)“Affinitymaturationofantibodiesassistedbyinsilicomodelling”,PNAS,105,9029-9034)，其仍需要大量的基于试验室的工作。

在本实施例中，应用基于知识的方法来使US8303953B2中描述的抗IL17F抗体的Fab片段亲和性成熟。最终的亲和性成熟的抗体在WO2012/095662A1中被描述为全长IgG1分子。然而使该抗体亲和性成熟的方法没有在后一出版物中公开。

方法

包含IL17F表位的靶(θ)原子的鉴定

通过使用WO2009/130459A2中描述的共结晶IL17F/Fab496复合物结构的坐标，在任何Fab496原子的内的所有IL17F原子均被鉴定为表位原子并列于表1中。在209种θ原子的该列表中，有86种特定的θ原子类型。

表1：包含IL17F表位的原子的列表，其中符号(1)-(2)-(3)-(4)是指：(1)IL17同源二聚体的各自F和I链；(2)氨基酸残基；(3)残基数量；以及(4)原子类型。

IOTA数据库的创建

从超过20000种非同源蛋白质结构(其中分辨率为≤)提取超过1.1x10⁷个分子内原子接触数据的次级数据库。接触被定义为蛋白质折叠的相对侧上任意2个间隔+它们各自的范德华半径的总和或更短的距离的原子，并且局限于在线性肽序列上分开至少4个残基的残基上的原子。接触对的第一原子被命名为θ原子，第二原子命名为ι原子。根据θ原子类型，将数据库分成167个接触集，在包含20种天然氨基酸残基的蛋白质中存在167种非氢原子类型。在接触集中，在标准化θ-ι原子对坐标后，记录各个ι原子位置的相对坐标。所述标准化通过以下设定来实现：将θ原子设定为x,y,z＝0,0,0；将与θ原子共价连接(在肽主链的方向上)的下一个原子(3^rd原子)设定为x,y,z＝x’,0,0；并且将再下一个共价连接的原子(4^th原子)设定为x,y,z＝x”,0,z’。使用一致的约定来定义3^rd和4^th原子。

每个θ接触集被进一步细分成167种ι原子类型，然而为了方便，根据基于Engh和Huber的定义(Engh和Huber(1991)“AccurateBondandAngleParametersforX-rayProteinStructureRefinement”,ActaCryst.,A47,392-400)的化学类型，将这些连结成26个亚组。

在本实施例中，使用以下ι亚组：

将ι数据迭加在IL17F表位表面上

针对包含IL17F表位的209种θ原子的每一个，从IOTA数据库选择相应的θ接触集，并从该接触集选择合适的ι亚组，例如羰基氧。将来自该亚组的相对ι坐标相对于IL17F表位的给定θ原子的参照系进行转置(表2示出了示例性的数据)。由此，将针对给定亚组的ι数据集累积在整个IL17F表位上。在其中给定ι数据点的位置与IL17F的原子以比它们各自的范德华半径的总和更近的距离交叉的情况下，则从数据集中排除这些数据点。对于所有相关ι亚组重复该过程，以生成针对IL17F表位的一系列ι数据集。

表2：

表2(续表)：

表2：表解(续表)

IL17Fι数据集的可视化

使用分子图形学计算机软件(例如Pymol)关于IL17F/Fab496结构可视化各个ι数据集。这可以通过如下实现：将ι数据集作为个体点直接标绘，或者首先将数据集数学转化成密度函数和对于分子图形学展示兼容的文件形式(例如ccp4)，以便可以在IL17表位上展示较高密度的等高图谱。

针对与Fab496互补位原子的交叉检查ι密度图谱

检查IL17F/Fab496界面以测定每残基的个体Fab496原子与相应的ι密度图谱之间的交叉程度。鉴定了其中不具有或具有较少的交叉的残基。在这些情形下，通过分子图形学软件来取代备选残基，以测定在残基原子与相关ι密度图谱之间是否可实现更好的交叉。简短地列出产生良好的ι密度图谱交叉的氨基酸取代，用于作为Fab496的完整IgG形式的体外生产并作为单点突变测试。

DNA操作和一般方法

使用大肠杆菌菌株INVαF(Invitrogen)用于转化和常规培养生长。DNA限制性酶和修饰酶得自RocheDiagnosticsLtd.和NewEnglandBiolabs。使用MaxiPlasmid纯化试剂盒(Qiagen,目录No.12165)来进行质粒制备。DNA测序反应使用ABIPrismBigDye终止子测序试剂盒(目录No.4304149)来进行，并在ABI3100自动化测序仪(AppliedBiosystems)上运行。使用程序AutoAssembler(AppliedBiosystems)来分析数据。寡核苷酸得自Invitrogen。通过IgG组装ELISA来测定IgG的浓度。

抗体CA028_00496的亲和性成熟

CA028_0496为人源化的中和抗体，其结合IL17A和IL17F亚型。CA028_0496包含植入的可变区(被称为gL7和gH9)，其序列在WO2008/047134中公开。按照以下过程来制备该抗体的野生型Fab’片段(Fab496)及突变变体：设计并构建寡核苷酸引物序列，以根据在上述简短列表中所测定的残基和位置，在轻链可变区(gL7)中引入单点突变。将每个突变的轻链单独地亚克隆至包含编码人C-κ恒定区(Km3同种异型)的DNA的UCBCelltech人轻链表达载体pKH10.1中。将未改变的重链可变区(gH9)序列亚克隆至包含编码人重链γ-1恒定区CH1的DNA的UCBCelltech表达载体pVhg1Fab6His中。使用293fectin^TM程序，根据制造商的说明书(InVitrogen.CatalogueNo.12347-019)将编码重链和轻链的质粒共转染至HEK293细胞中。通过ELISA来评估培养10至12天后分泌至培养上清液中的IgG1抗体水平，并通过表面等离子共振来评估结合动力学(参见下文)。然后，将显示与IL17F的改善或类似结合的突变体结合双重、三重、四重或五重轻链突变来如上所述制备和检测。

表面等离子共振(SPR)

使用HBS-EP运行缓冲剂(10mMHEPESpH7.4,150mMNaCl3mMEDTA0.005％(v/v)表面活性剂P20,BiacoreAB)，在25℃下在Biacore3000系统(BiacoreAB)上进行所有的SPR试验。根据制造商的建议，通过胺偶联方法，使山羊F(ab’)₂抗IgGFab’特异性抗体(JacksonLabs.产品编号109-006-097)与CM5传感器芯片(GEHealthcare)的表面共价连接。简言之，使用50mMN-羟基琥珀酼亚胺和200mM1-乙基-3-(3-二甲基氨基丙基)-碳二亚胺的新鲜混合物，在10μl/min流速下活化羧甲基葡聚糖表面5分钟。在相同的流速下，注射10mM乙酸钠pH5.0缓冲剂中50μg/ml的抗Fab抗体，进行60秒。最后，使用1M乙醇胺.HClpH8.5的10分钟脉冲使表面失活，从而在芯片上留下4000至5000个反应单位(RU)的固定抗体。通过从上述过程中省略蛋白质来在相同的芯片上制备参照流动池。

从培养上清液中收获3至30μg/ml的野生型和突变的496Fab，并将粗上清液在运行缓冲剂中稀释至0.5至2μg/ml。为了评价与IL17F的结合动力学，首先通过在10μl/min下注射60秒将各抗体捕获在抗Fab’表面上，以产生额外的150至250RU信号。在运行缓冲剂中从10nM滴定重组人IL17F，并在30μl/ml下注射，以产生超过180秒的结合相，随后为300秒的解离相。在各循环结束时，使用40mMHCl的60秒脉冲随后5mMNaOH的30秒脉冲在10μl/min下使表面再生。对于各种Fab’，实施对照循环，其中使用运行缓冲剂的注射来替代IL17F注射。

通过减去参照流动池信号随后减去各自Fab’的对照循环sensogram来校正sensogram。使用Biaevaluation软件(BiacoreAB)将解离速率常数(k_d)和结合速率常数(ka)拟合至数据。Fab亲和性(K_D)以K_D＝k_d/ka计算。

结果

ι密度图谱与Fab496原子的交叉

对Fab496表面的形成与IL17F的界面的那部分的检查表明，在许多区域中，在给定Fab496原子与相应的ι密度图谱之间存在完整交叉。对于包含Fab496重链的氨基酸残基而言尤其如此。然而，存在许多包含轻链的区域，其中Fab496原子与相应的ι密度图谱之间无交叉或极少交叉(图8至13，图A)。

通过在这些位置将备选残基取代至Fab496结构中，可能实现取代残基的一个或多个原子与相应的ι密度图谱之间的交叉(图8至13，图B)。因此，在Fab496轻链上，苏氨酸30Cγ2原子不与甲基碳ι密度图谱交叉，并且Oγ1原子不与羟基氧ι密度图谱交叉。然而，当苏氨酸30突变成精氨酸时，在Nε原子与仲酰胺ι密度图谱之间存在交叉(图8)。

图9显示分散在轻链精氨酸54周围的四面体亚甲基ι密度和仲酰胺ι密度，其中与该残基的各个侧链原子不具有任何交叉。相反，当在该位置处突变成丝氨酸时，在羟基氧ι密度与丝氨酸侧链的γ氧原子之间存在良好的交叉。轻链丝氨酸56γ氧原子与羟基氧ι密度不交叉。然而，当该残基突变成异亮氨酸时，异亮氨酸侧链的δ1甲基原子与甲基ι密度交叉(图10)。在丝氨酸60的情形下，同样地γ氧与相邻的羟基氧ι密度相隔太远而不能形成交叉(图11)，然而将该残基突变成天冬氨酸使得侧链δ氧原子与羧基氧ι密度形成交叉。

轻链苏氨酸72不是CDR残基，而是构架3的一部分，其侧链甲基原子不与甲基碳ι密度交叉，并且其侧链氧原子不与羟基氧ι密度交叉。然而，精氨酸72突变使得侧链δ碳原子与亚甲基碳ι密度交叉，并且侧链η氮原子与胍基氮ι密度交叉。

抗体CA028_00496上的ι设计突变对结合动力学的效应

在Fab496中的5个ι设计的轻链单点突变(T30R,R54S,S56I,S60D和T72R)显示1.7至3.6倍的结合亲和性小幅改善。对非CDR突变T72R所观察到的改善是出人意料的，因为该位置上的残基通常不接触抗原。对于所有这些突变，除一个以外(S60D)，改善由解离速率常数的降低驱动(表3)。这些突变的成对组合导致结合的协同改善，其中解离速率常数降低3.8至7.5倍；其中三重和四重组合使得解离速率常数进一步降低(表3)。

所有5个轻链突变的组合产生最大的结合亲和性改善(表4)，从而得到对IL17F的11pM的亲和性值，这比原始Fab496好大约180倍。重要的发现是，不存在对与IL17A同工型的结合的不利效应，事实上，亲和性得到改善，其中亲和性常数为2pM，相比之下原始Fab496为14pM。有趣的是，所设计的突变的组合产生亲和性的协同增强；一种解释是它们在轻链互补位表面上被合理地间隔开(图13)并由此避免了负面相互作用效应。

表3：抗体CA028_000496的单个残基和组合残基轻链突变对IL17F解离速率常数的效应

表4：抗体CA028_000496与包含5个轻链突变的变体的亲和常数

结论

在IL17F的表位表面上生成ι密度图谱以预测相应抗体(Fab496)中的有利突变的方法已被证明是成功的，因为亲和常数被改善180倍至11pM的K_D。该方法未假设仅可使用CDR突变，而是证实构架区突变对于亲和性成熟也是重要的。

实施例2：在Ab重链/轻链之间的区域中利用本发明的自动化方法来改善稳定性

方法

FabX的Fv界面的重链和轻链的靶(θ)原子的鉴定

通过使用与抗原复合的抗体Fab片段“FabX”的晶体结构的坐标，在任何轻链原子的内的所有重链原子被鉴定为表位原子(表5中列举的167种θ原子)。类似地，在任何重链原子的内的所有轻链原子被鉴定为表位原子(表5中列举的159种θ原子)。

表5：包含重链和轻链表位的原子的列表，其中符号(1)-(2)-(3)是指：(1)FabX的各自H和L链；(2)残基数量；以及(3)原子类型。

结合口袋(θ)＝H结合伴侣(ι)＝L

结合口袋(θ)＝L结合伴侣(ι)＝H

ι数据在重链和轻链界面表面上的迭加

对于包含重链表位的167种θ原子的每一个，从IOTA数据库选择相应的θ接触集，并从该接触集选择合适的ι亚组，例如羰基氧。将来自该亚组的相对ι坐标相对于重链表位的给定θ原子的参照系进行转置。由此，将针对给定亚组的ι数据集累积在整个重链表位上。在其中给定ι数据点的位置与重链的原子以比它们各自的范德华半径的总和更近的距离交叉的情况下，则从数据集中排除这些数据点。对于所有相关ι亚组重复该过程，以生成针对重链表位的一系列ι数据集。

对于包含轻链表位的159种θ原子的每一个，从IOTA数据库选择相应的θ接触集，并从该接触集选择合适的ι亚组，例如羰基氧。将来自该亚组的相对ι坐标相对于重链表位的给定θ原子的参照系进行转置。由此，将针对给定亚组的ι数据集累积在整个轻链表位上。在其中给定ι数据点的位置与轻链的原子以比它们各自的范德华半径的总和更近的距离交叉的情况下，则从数据集中排除这些数据点。对于所有相关ι亚组重复该过程，以生成针对轻链表位的一系列ι数据集。

针对与重链-轻链原子的交叉检查ι密度图谱

使用内部定制的Rosettapython文库脚本自动地执行整个过程，所述文库脚本特别设计用于可突变位置鉴定、单点突变体生成、低能量旋转异构体状态计数、定量IOTA得分计算、VH-VL链结合能估计以及点突变体优先排序。

两种评分方法用于突变体评级：

1.ΔIOTA得分

上文提及的所生成的IOTA密度图谱用于计算在每个可突变位置处的残基的各个重原子与附近的相应类型的图谱中的密度临界点之间的空间交叉值。IOTA得分为具有最大IOTA密度的一个残基的重原子与相应类型定义之间的体积重叠的总和，其反映了每残基的个体FabX原子与相应的ι密度图谱之间的交叉程度。IOTA得分是负数的，其中较低的值意味着更多的交叉。ΔIOTA得分为突变残基与野生型残基之间的IOTA得分的变化；类似地，ΔIOTA得分值负数越低，则越表示突变体比野生型更有利。

2.RosettaΔΔG得分

Rosetta能函数是模拟原子间相互作用力的项(溶剂化效应和扭转能)的线性组合。更具体而言，Score12(Rosetta中的缺省完全原子能函数)包括Lennard-Jones项，虚拟溶剂项，取向依赖的氢键项，由PDB推导的侧链和主链的扭转势能，基于知识的短程静电项，以及针对20种氨基酸的每一种的模拟未折叠状态的参照能。两个结合伴侣之间的结合强度或ΔG可以通过减去个体伴侣的Rosetta得分以及由两个伴侣形成的复合结构的Rosetta得分来计算。较低的ΔG意味着更强的结合。ΔΔG为突变复合物与野生型复合物之间的ΔG的变化；ΔΔG值负数越低，则越表示突变体结合亲和性比野生型更高。

图14示出了预测FabX结构的VH-VL界面处的点突变的计算机模拟的流程图。

在步骤S101中，具有至少一个在任何轻链重原子的内的重原子的重链上的所有残基被鉴定为可突变的位置。类似地，具有至少一个在任何重链重原子的内的重原子的轻链上的所有残基被鉴定为可突变的位置。

在步骤S102中，对于野生型FabX晶体结构，分别计算残基相关的IOTA得分和结合能ΔG。在步骤S102.1中，计算在具有附近的相应IOTA密度图谱的当前可突变位置上的野生型残基的IOTA得分，称为(IOTA得分_wt，位置_j)；在步骤S102.2中，使用Rosetta得分12函数来计算野生型FabXVH和VL链的结合能，被称为ΔG_wt。

在步骤S103中，在步骤S101中鉴定的当前可突变位置上的野生型残基被其它氨基酸类型替换(突变)。在20种天然氨基酸类型中，从突变中排除脯氨酸和半胱氨酸。所有其它18种类型(丙氨酸、精氨酸、天冬酰胺、天冬氨酸、谷氨酸、谷氨酰胺、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸)，除了野生型本身，在各个可突变位置上逐一突变。

在步骤S104中，对于各个可突变位置处的每个突变残基类型，使用Rosetta生成前100个能量最低(根据Rosetta评分函数)旋转异构体状态。丢弃其它高能量旋转异构体状态。

在步骤S105中，对于在S104中生成的突变残基的各个旋转异构体状态，按照步骤S102的相同方式来计算IOTA得分，称为(IOTA得分_突变体，位置_j，类型_k，旋转异构体_i)。

在步骤S106中，通过(IOTA得分_突变体，位置_j，类型_k，旋转异构体_i)减去(IOTA得分_wt，位置_j)来计算旋转异构体状态、突变残基类型和可突变位置的当前组合的ΔIOTA得分，其被称为(ΔIOTA得分_突变体，位置_j，类型_k，旋转异构体_i)。重复步骤S105和S106，以计算当前突变残基类型和可突变位置的各个旋转异构体状态的所有ΔIOTA得分。

在步骤S107中，使用最低的ΔIOTA得分值来测定当前突变残基类型和可突变位置的最佳旋转异构体状态，如步骤S107.1中所示。按照与步骤S102.2相同的方式在步骤S107.2中计算具有最佳旋转异构体状态的突变体的结合能，称为(ΔG_突变体，位置_j，类型_k)。在步骤S107.3中，通过ΔG_突变体减去ΔG_wt来计算突变体与野生型之间的结合能变化ΔΔG。在对最佳旋转异构体状态进行优先排序之后，针对当前可突变位置处的下一个突变氨基酸类型重复步骤S103至S107。

在步骤S108中，对于当前可突变位置，仅保留满足ΔIOTA得分<0且ΔΔG<0的标准的候选突变体用于之后的评级。丢弃其它的突变体。重复步骤S102至S108以检查所有可突变位置，并生成满足同一标准的所有候选突变体。

在步骤S109中，输出所有候选突变体结构用于后期可视化分析。将候选突变体的最终列表通过最低ΔIOTA得分进行分选和评级。

所用的运行命令和参数如下：

对于轻链突变预测，命令为：“pythonmultiRotamersFabInterfaceIOTAScan.py--pdbFabX.pdb--only_chainsL--regionall--useIOTA--IOTAtype167--output_mutant”

对于重链突变预测，命令为：“pythonmultiRotamersFabInterfaceIOTAScan.py--pdbFabX.pdb--only_chainsH--regionall--useIOTA--IOTAtype167--output_mutant”

通过将以下编码加入至“multiRotamersFabInterfaceIOTAScan.py”中来初始化额外的Rosetta相关参数：“init(extra_options＝“-ex1-ex2-score:weightsscore12-no_his_his_pairE-constant_seed-edensity:mapreso3.0-correct-muteall”

DNA操作和一般方法

FabX通过重链-轻链界面的亲和性成熟而改善热稳定性

按照以下过程来制备FabX的野生型Fab片段及突变变体：设计并构建寡核苷酸引物序列，以根据在上述简短列表中所测定的残基和位置，在重链和轻链可变区中引入单点突变。将每个突变的轻链单独地亚克隆至包含编码人C-κ恒定区(Km3同种异型)的DNA的UCBCelltech人轻链表达载体pKH10.1中。将每个突变的重链可变区序列单独地亚克隆至包含编码人重链γ-1恒定区CH1的DNA的UCBCelltech表达载体pVhg1Fab6His中。使用293fectin^TM程序，根据制造商的说明书(InVitrogen.CatalogueNo.12347-019)将编码重链和轻链的质粒共转染至HEK293细胞中。通过ELISA来评估培养10至12天后分泌至培养上清液中的IgG1Fab抗体水平，并通过表面等离子共振来评估结合动力学(参见下文)。

然后，如上文所述结合双重或三重突变制备和检验显示热稳定性改善的突变体。

表面等离子共振(SPR)

在BIAcoreT200(GEHealthcare)上实施所有的SPR实验。通过胺偶联化学作用，将F(ab')₂片段特异性的AffinipureF(ab’)₂片段山羊抗人IgG(JacksonImmunoResearch)固定于CM5传感器芯片上至≈5000反应单位(RU)的捕获水平。使用HBS-EP缓冲剂(10mMHEPESpH7.4,0.15MNaCl,3mMEDTA,0.05％表面活性剂P20,GEHealthcare)作为运行缓冲剂，其中流速为10μL/min。使用10μLFabX(0.75μg/mL)注射用于固定的抗人IgG-F(ab')₂的捕获。在捕获的FabX上在各种浓度(50nM至6.25nM)下，以30μL/min的流速滴定抗原。通过50mMHCl的2x10μL注射随后5mMNaOH的5μL注射在10μl/min的流速下使表面再生。使用T200评价软件(1.0版)按照标准程序来分析背景减除结合曲线。由拟合算法测定动力学参数。

热稳定性测定

进行Thermofluor测定以评估纯化分子的热稳定性。将纯化的蛋白质(0.1mg/ml)与Orange染料(Invitrogen)混合，并将混合物以一式四份分配于384PCR光学孔平板中。在20℃至99℃的温度范围内在7900HTFastReal-TimePCRSystem(AgilentTechnologies)上分析样品，其中缓变率为1.1℃/min。针对温度标绘每孔的荧光强度变化，并使用所得斜率的拐点来生成T_m。

结果

ι密度图谱与界面的重链和轻链原子的交叉

使用Rosetta扫描的自动化方法产生通过IOTA得分进行评级的突变的表(表6)。

FabX上的ι设计突变对热稳定性的效应

在FabX中的6个ι设计的单点突变(H-T71R,H-T71K,H-T71N,H-T71H,L-S107E和L-T109I)显示相对于野生型的热稳定性小幅改善，范围为0.5℃至2.9℃(表7)。图15、16和17提供了计算机生成的可视化图像，其描绘了这些单点突变的效应。具体而言，这些图显示虽然H-T71、L-S107和L-T109不具有密度交叉，但H-R71与酰胺密度交叉，L-E107与羧酸酯密度交叉，并且L-I109与甲基密度交叉。这些突变的成对组合导致热稳定性的协同改善；其中三重组合使得热稳定性进一步改善(表8)。

H-T71R、L-S107E和L-T109I突变的组合产生最大的热稳定性改善(表8)，从而得到81.2℃的Tm，这比原始FabX高大约5.8℃。三种突变的这种组合示于图18中。重要的发现是，与其抗原的结合不存在显著的损失。

表6：通过Rosetta扫描方法生成的所提出的突变以及其按IOTA得分的次序的评级

表7：与75.7℃的野生型热稳定性相比，突变的热稳定性

ND＝未测定

表8：突变的组合的热稳定性和亲和性

ND＝未测定

Claims

1.一种方法，其用于从头设计将与大分子靶的结合位点结合的配体或者鉴定用于改善配体对大分子靶的结合位点的亲和性的配体修饰，所述方法包括：

a)鉴定形成靶结合位点的表面的原子的靶列表；

b)将靶列表中的各原子，该原子在下文中被称为θ原子，鉴定为特定的θ原子类型；

c)从生物大分子的结构数据库中提取关于非键合的分子内或分子间原子与原子接触的信息，其中原子的接触对中的第一原子为特定的θ原子类型，并且所述接触对中的相对的第二原子，该第二原子在下文中被称为ι原子，为特定的ι原子类型，所述信息包括关于ι原子相对于θ原子的空间和/或上下文数据，并且针对给定θ原子类型的多个接触从所述数据库收集的所述数据在下文中被称为θ接触集；

e)以预测结合位点的一个或多个有利区域的方式组合和/或解析迭加的数据，在所述有利区域中给定ι原子类型或预定的相关ι原子类型组具有高的理论倾向性；以及

其中所述数据库中的每个非键合的分子内或分子间接触被定义为蛋白质折叠的相对残基之间或者大分子折叠的相对单体单元之间或者两个相互作用的大分子伴侣之间的接触，并且特别是折叠的一侧上或第一相互作用伴侣上的θ原子与相对一侧上或第二相互作用伴侣上的ι原子之间的接触；在该情形中，满足以下条件：

s-Rw≤t，其中s为所述接触的两个原子之间的间隔，Rw为所述接触的两个原子的范德华半径的总和，而t为预定的阈值距离；以及

其中在步骤b)中独特地鉴定θ原子类型，以使得针对给定θ原子类型在步骤c)中提取的θ接触集的数据与针对任何其它θ原子类型在步骤c)中提取的任何其它θ接触集的数据之间不存在交叉，除了关于涉及作为ι原子的给定θ原子的接触的数据以外。

2.根据权利要求1的方法，其中对于在步骤c)中从蛋白质成员的结构数据库中提取的每个非键合的分子内接触而言，还满足以下条件：

所述接触的θ原子和ι原子在沿线性多肽间隔至少4个残基的不同残基上，或者在分开的多肽链上。

3.根据前述权利要求的任意一项的方法，其中所述θ原子类型被鉴定为：

在蛋白质的20种天然氨基酸中存在的167种非氢原子中的一种且仅一种；

在脱氧核糖核酸聚合物(DNA)的4种核苷酸中存在的82种非氢原子中的一种且仅一种；

在甲基化的DNA核苷酸、磷酸胞苷和磷酸腺苷中存在的42种非氢原子中的一种且仅一种；

在核糖核酸聚合物(RNA)的4种磷酸核苷酸中存在的85种非氢原子中的一种且仅一种；

在RNA的2-O’-甲基化磷酸核糖核苷酸中存在的89种非氢原子中的一种且仅一种；

在最常见的转录后碱基修饰的RNA中存在的超过400种非氢原子中的一种且仅一种。

4.根据前述权利要求的任意一项的方法，其中在步骤c)中提取的信息是在次级数据库中收集的，所述次级数据库包含针对各个θ原子类型的一种且仅一种θ接触集。

5.根据权利要求4的方法，其中将所述次级数据库θ接触集的每一个细分成多个非重叠的ι原子类型或非重叠的相关ι原子类型组。

6.根据前述权利要求的任意一项的方法，其中所述ι原子类型被鉴定为：

在蛋白质的20种天然氨基酸中存在的167种非氢原子以下的一种且仅一种；

在蛋白质结合的、结构相关的水分子中存在的氧原子以下的一种且仅一种；

在脱氧核糖核酸聚合物(DNA)的4种核苷酸中存在的82种非氢原子以下的一种且仅一种；

在甲基化的DNA核苷酸、磷酸胞苷和磷酸腺苷中存在的42种非氢原子以下的一种且仅一种；

在核糖核酸聚合物(RNA)的4种磷酸核苷酸中存在的85种非氢原子以下的一种且仅一种；

在RNA的2-O’-甲基化磷酸核糖核苷酸中存在的89种非氢原子以下的一种且仅一种；和/或

在最常见的转录后碱基修饰的RNA中存在的超过400种非氢原子以下的一种且仅一种。

7.根据前述权利要求的任意一项的方法，其中所述预定的相关ι原子类型组为多个非重叠组之一，所述非重叠组通过将在蛋白质的20种天然氨基酸中存在的167种非氢原子分选成相似化学类型的组来获得。

8.根据权利要求7的方法，其中根据以下因素的一种或多种将ι原子类型分选成多个非重叠组：原子类型的元素性质、原子类型的杂化状态。

9.根据权利要求7或8的方法，其中所述ι原子类型被分选成多个非重叠组，包括：Csp³,Csp²(芳香族),Csp²(非芳香族),Nsp³,Nsp²,Osp³,Osp²,S。

10.根据前述权利要求的任意一项的方法，其中：

在步骤c)中提取的所述空间数据通过几何参照θ原子的位置和第三及第四原子的位置来定义θ接触集中指定的各ι原子的位置；

第三原子与θ原子共价键合；以及

第四原子与第三原子共价键合。

11.根据权利要求10的方法，其中：

对于θ接触集中指定的各个ι原子，在步骤c)中提取的所述空间数据通过几何参照θ原子的位置和第三及第四原子的位置来定义第五和第六原子的位置；

第五原子与ι原子共价键合；以及

第六原子与第五原子或ι原子共价键合。

12.根据权利要求11的方法，其中步骤d)的在靶位点中或其周围的迭加包括：

解析θ接触集以提取针对包含给定ι原子类型或一种或多种预定的相关ι原子类型组的接触的空间数据；以及

标绘此空间数据以测定理论位置，所述理论位置代表了其中如果：i)所述接触的θ原子定位于靶结合位点中的相应θ原子的位置；以及ii)所述接触的第三和第四原子定位于靶结合位点中的相应θ原子的第三和第四原子的位置，则各ι原子类型或一种或多种预定的相关ι原子类型组的每一种会定位于的位置。

13.根据权利要求12的方法，其中：

在所述标绘步骤之前，针对所述上下文数据对提取的空间数据进行解析。

14.根据权利要求12和13的方法，其中给定ι原子类型或一种或多种预定的相关ι原子类型组的理论位置的密度高于预定阈值的区域被鉴定为有利区域之一。

15.根据权利要求12-14的任意一项的方法，其中针对靶列表上的多个θ原子测定给定ι原子类型或一种或多种预定的相关ι原子类型组的理论位置，并且其中累积理论位置的密度高于预定阈值的区域被鉴定为有利区域之一。

16.根据权利要求12-15的任意一项的方法，其中：

如果个体ι原子的理论位置与靶大分子的原子的位置以比Rw-0.2埃更近的距离交叉，则从随后的分析中排除该ι原子。

17.根据权利要求11-16的任意一项的方法，其中：

针对各个指定的θ原子类型独特地选择第三和第四原子。

18.根据权利要求11-17的任意一项的方法，其中：

针对各个指定的ι原子类型独特地选择第五和第六原子。

19.根据权利要求11-18的任意一项的方法，其中：

对于每个有利区域，推导矢量以描述第五原子相对于其各自ι原子的位置，并对所述矢量进行分析以鉴定有利的键矢量，其代表所述区域中理论一致的ι原子的共价连接的预测，所述经鉴定的有利的键矢量用于精制候选配体的设计和/或候选配体的修饰。

20.根据前述权利要求的任意一项的方法，其中：

在步骤c)中提取的所述上下文数据包含关于θ接触集中各接触对的局部环境的上下文信息，包括以任意组合的下述的一个或多个：二级结构，包含接触对的氨基酸类型或其它单体类型，在接触的任一侧上的聚合物链中的相邻单体单元和/或其局部几何学，在接触的任一侧上的多肽链中的相邻氨基酸，所述相邻单体单元或氨基酸的局部几何学，θ原子的温度系数，ι原子的温度系数，θ原子的可及表面积，ι原子的可及表面积，针对特定θ原子的不同ι原子接触的数量，以及在与θ原子相同的单体单元上的其它θ原子的数量。

21.根据前述权利要求的任意一项的方法，其中步骤f)包括：

鉴定候选配体的修饰，所述修饰增加候选配体的一个或多个原子与针对结合位点中的ι原子类型或预定的相关ι原子类型组所预测的一个或多个有利区域之间的重叠程度。

22.根据前述权利要求的任意一项的方法，其中在步骤f)中鉴定候选配体的多个修饰，并且所述方法还包括基于以下的一种或两种来选择所鉴定的修饰的亚组：1)备选的和/或额外的候选配体原子与各自ι原子类型有利区域之间的交叉比未修饰的候选配体高出的程度；以及2)促成由经修饰的候选配体与结合位点的结合而形成的复合物的总能量的一种或多种因素相较于其中结合未修饰的候选配体的情形所减少的程度。

23.根据前述权利要求的任意一项的方法，其中t＝2.5埃。

24.根据前述权利要求的任意一项的方法，其中t＝0.8埃。

25.根据前述权利要求的任意一项的方法，其还包括：

输出代表在步骤f)中鉴定的修饰的数据。

26.根据权利要求1-25的任意一项的方法，其中所述配体为蛋白质。

27.根据权利要求26的方法，其中所述配体为抗体。

28.根据权利要求26或27的方法，其中步骤f)包括使用选自其它19种天然氨基酸的一个或多个备选残基的每一个来替代配体的一个或多个氨基酸残基的每一个，所述配体的一个或多个氨基酸残基与靶结合位点直接接触或者与靶结合位点紧密靠近，每种替代被称为残基替代，

其中针对在替代残基与配体或靶的相邻原子之间不导致冲突的每个残基替代，将替代残基的每个原子的类型和位置与各自ι原子类型有利区域相比较，以鉴定它们是否将产生比原始残基的原子更大的交叉。

29.根据权利要求28的方法，其还包括：

输出残基替代的列表，所述残基替代被鉴定为产生比原始残基的原子更大的交叉；

针对每个所列出的残基替代，使用候选配体的突变来产生并入残基替代的经修饰的配体；

检验各种经修饰的配体与靶结合位点的亲和性，以测定导致高于预定阈值的亲和性改善的残基替代。

30.根据权利要求29的方法，其还包括：

修饰候选配体以并入多个残基替代，所述残基替代已被测定为导致高于预定阈值的亲和性改善。

31.一种包含计算机可读指令的计算机可读介质或信号，其用于使计算机实施前述权利要求的任意一项的方法。

32.根据权利要求31的介质或信号，其中使所述计算机实施至少步骤c)-e)。

33.根据权利要求31或32的介质或信号，其中使计算机实施至少步骤f)。

34.一种制造治疗性配体的方法，其包括：

根据权利要求1-30的任意一项的方法来设计治疗性配体；以及

制造由此设计的治疗性配体。

35.一种治疗性配体，其根据权利要求34的方法制造。

36.根据权利要求34或35的方法或配体，其中所述配体为蛋白质。

37.根据权利要求36的方法或配体，其中所述蛋白质为抗体。

38.一种生成数据库的方法，所述数据库用于在从头设计将与大分子靶的结合位点结合的配体或者鉴定用于改善配体对大分子靶的结合位点的亲和性的配体修饰的方法中使用，所述生成数据库的方法包括：

分析多个蛋白质或其它生物学大分子的每一个中的原子的相对位置，以鉴定所述蛋白质或大分子的第一原子与第二原子之间的非键合的分子内接触的情形，所述第一原子被称为θ原子，所述第二原子被称为ι原子；以及

其中非键合的分子内接触被定义为满足以下条件的情形：

39.根据权利要求38的方法，其中所述方法包括将所述数据库细分以形成所鉴定的接触的组，其中θ原子为蛋白质的20种天然氨基酸中存在的167种非氢原子的一种且仅一种，并且ι原子在通过基于化学相似性将蛋白质的20种天然氨基酸中存在的167种非氢原子分选成组而获得的多个非重叠组的一种且仅一种中。

40.一种生成数据库的方法，所述数据库用于在从头设计将与大分子靶的结合位点结合的配体或者鉴定用于改善配体对大分子靶的结合位点的亲和性的配体修饰的方法中使用，所述生成数据库的方法包括：

分析多个蛋白质或其它生物学大分子的每一个中原子的相对位置，以鉴定所述蛋白质或大分子的第一原子与第二原子之间的非键合的分子内接触的情形，所述第一原子被称为θ原子，所述第二原子被称为ι原子；以及

其中非键合的分子内接触被定义为满足以下条件的情形：

其中所述方法包括将所述数据库细分以形成所鉴定的接触的组，其中θ原子为蛋白质的20种天然氨基酸中存在的167种非氢原子的一种且仅一种，并且ι原子在通过基于化学相似性将蛋白质的20种天然氨基酸中存在的167种非氢原子分选成组而获得的多个非重叠组的一种且仅一种中。

41.根据权利要求39或40的方法，其中：

对于各接触，ι原子的位置通过几何参照θ原子的位置和第三及第四原子的位置来定义，所述第三原子与θ原子共价键合，并且所述第四原子与第三原子共价键合，所述方法还包括：

将各接触的ι原子、θ原子、第三原子和第四原子的坐标作为一组进行标准化，以生成标准化的坐标组；

对于一种或多种θ原子类型的每一种，使用针对多个接触的标准化的坐标组来生成二维极坐标图，其中所述接触涉及θ原子类型和给定的ι原子类型，所述二维极坐标图代表了给定ι原子在纬度和经度上相对于θ原子的方向的分布；

针对不同的ι原子类型重复上述步骤；

比较所得的二维极坐标图以鉴定产生相似的方向分布的ι原子类型组，并且将那些组用作为基于化学相似性以将在蛋白质的20种天然氨基酸中存在的167种非氢原子分选成多个非重叠组的组。

42.根据权利要求38-41的任意一项的生成数据库的方法，其包括：

从至少2000种蛋白质或其它生物大分子提取接触信息，所提取的信息包含关于至少2x10⁶个接触原子对的信息。

43.根据权利要求38-42的任意一项的生成数据库的方法，其包括：

从至少10000种蛋白质或其它生物大分子提取接触信息，所提取的信息包含关于至少1x10⁷个接触原子对的信息。

44.一种计算机可读介质，其存储根据前述权利要求的任意一项生成的数据库。

45.根据权利要求1至30的任意一项的方法，或者使用根据权利要求38至43的任意一项编辑的数据库的方法，其中：对于给定的抗体-抗原复合物，预测在抗体结合位点中或其周围的氨基酸残基的特定突变，以产生抗体与抗原的更高结合亲和性。