CN113874395A

CN113874395A - 鉴定表位和互补位的方法

Info

Publication number: CN113874395A
Application number: CN201980092868.XA
Authority: CN
Inventors: A·M·沃拉科特; L·罗宾森; B·兰马克里斯南; H·缇斯瑞; K·维斯瓦纳森; Z·西里瓦; G·巴布考克
Original assignee: Visterra Inc
Current assignee: Visterra Inc
Priority date: 2018-12-24
Filing date: 2019-12-23
Publication date: 2021-12-31
Also published as: KR20210142092A; EA202191783A1; CA3124359A1; JP2022516445A; JP7511561B2; US20220059184A1; TW202041533A; SG11202106452YA; EP3902831A1; AU2019417720A1; WO2020139834A1

Abstract

本公开是鉴定靶多肽上表位的方法和鉴定抗体上互补位的方法。

Description

鉴定表位和互补位的方法

相关申请的交叉引用

本申请要求2018年12月24日提交的美国临时申请号62/784,617的权益。上述申请的内容通过引用的方式全文纳入本文。

背景技术

抗体结合靶抗原具有高特异性和亲和性。在分子上，通过抗体(互补位)和抗原(表位)中的氨基酸子集促进结合，这些氨基酸有助于结合发生能量有利的相互作用。确定控制抗体-抗原相互作用的结构特征对于理解抗体的作用机制和作为辅助抗体工程改造尝试的参考是很重要的。X射线共结晶学是确定抗体-抗原复合物结构的领先方法，可以高分辨率详细描述结构互补位和表位。然而，高分辨率共结晶结构的获取具有相当大的资源、通量和专业技术专门知识需求。其他表征互补位和表位的方法提供了更高的通量和实验可及性，但通常在分辨率上有所折衷。通过竞争结合的表位分箱(binning)或通过丙氨酸扫描的表位表征均提供比晶体学分析更高的速度和通量，但不能提供分子细节或晶体学分析中表征的综合性。因此，本领域中需要用于鉴定在抗体和其识别的抗原之间表位和互补位区域的改进方法。

发明概述

在一个方面中，本公开的特征在于一种鉴定靶多肽(例如，本文所述的靶多肽)上表位的方法，该方法包括：

(a)将抗体分子(例如，本文所述抗体分子)与多种靶多肽变体结合；

(b)获取(例如，富集)多种表现出改变(例如，降低)与抗体分子结合的变体；

(c)确定(例如，计算)多种所获取(例如，富集)的变体中各自的富集评分；

(d)生成抗体分子-靶多肽对接模型，其中所述抗体分子-靶多肽对接模型根据富集评分进行约束；且

(e)基于抗体分子-靶多肽对接模型，鉴定靶多肽上能够被抗体分子结合的位点；

从而鉴定靶多肽上的表位。

在一个实施方式中，所述改变的结合包括改变结合亲和力，例如，降低的结合亲和力。

在一个实施方式中，步骤(a)包括将抗体分子与展示多种靶多肽的变体的文库结合。在一个实施方式中，步骤(a)包括将抗体分子与包含表达(例如，展示)多种靶多肽的变体的多种细胞的文库结合。在一个实施方式中，多种细胞中的每一种表达靶多肽的大约一种独特的变体。在一个实施方式中，细胞是真核细胞，例如，酵母细胞。

在一个实施方式中，多种变体包括靶多肽的一种或多种表面残基上的突变。在一个实施方式中，多种变体包括靶多肽的选定表面残基的不同突变。在一个实施方式中，多种变体包括靶多肽的多种选定表面残基的各自不同突变。

在一个实施方式中，相对于靶多肽的野生型氨基酸序列，多种变体包括单氨基酸取代。在一个实施方式中，相对于靶多肽的野生型氨基酸序列，多种变体中的每一种包括单氨基酸取代。在一个实施方式中，单氨基酸取代发生在靶多肽的表面残基处。

在一个实施方式中，改变(例如，降低)结合包括相对于检测到的野生型靶多肽和抗体的结合，检测到的变体和抗体分子结合的改变(例如，降低)。

在一个实施方式中，步骤(b)包括获得(例如，富集)表现出少于约80％(例如，少于约0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、20％、30％、40％、50％、60％、70％或80％)的野生型靶多肽表现出的抗体分子结合的变体。在一个实施方式中，降低的结合是至少约20％(例如，至少约20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％)的野生型靶多肽表现出的结合。

在一个实施方式中，步骤(b)包括获得(例如，富集)细胞，其表现出少于约80％(例如，少于约0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、20％、30％、40％、50％、60％、70％或80％)的包含野生型靶多肽的细胞表现出的抗体分子结合。在一个实施方式中，降低的结合是至少约20％(例如，至少约20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％)的包含野生型靶多肽的细胞表现出的结合。

在一个实施方式中，步骤(b)包括对表现出与抗体分子结合降低的变体进行一次或多次，例如，两次、三次、四次、五次、六次、七次、八次、九次、十次或更多次富集。

在一个实施方式中，该方法进一步包括，例如，在步骤(c)之前，例如，通过测序编码变体的基因，例如，通过下一代测序，鉴定表现出抗体分子结合改变(例如，降低)的变体。

在一个实施方式中，步骤(c)包括确定多个获得的(例如，富集的)变体中的每一个的出现频率。在一个实施方式中，步骤(c)进一步包括总计在特定残基处包含不同突变的每个变体的出现的频率和/或加权(例如，重度加权(heavily weighting))具有更高出现频率的变体。

在一个实施方式中，富集评分对靶多肽的氨基酸序列的单个残基是特异性的。在一个实施方式中，每个富集评分对靶多肽的氨基酸序列的不同单个残基是特异的。

在一个实施方式中，该方法进一步包括用靶多肽的多种变体的重复重复步骤(a)-(c)至少一次(例如，一次、两次、三次、四次、五次、六次、七次、八次、九次、十次或更多)，且其中步骤(c)进一步包括省略一种或多种混杂突变，例如，超过50％重复具有高于30％的富集评分的突变，和超过75％重复具有高于15％的富集评分的突变。

在一个实施方式中，通过添加一种或多种吸引约束(attractive constraint)来约束抗体分子-靶多肽对接模型，任选地，其中吸引约束是用于富集评分高于第一预选值的残基。在一个实施方式中，第一预选值介于20％和40％之间，例如，介于25％和35％之间，例如，约25％、约30％或约35％。在一个实施方式中，吸引约束包括基于富集评分的线性缩放奖励(linearly scaled bonus)。

在一个实施方式中，通过为富集评分小于第二预选值的残基添加排斥约束(repulsive constraint)来约束抗体分子-靶多肽对接模型。在一个实施方式中，第二预选值在5％和20％之间，例如，介于10％和15％之间，例如，约10％、约12.5％或约15％。

在一个实施方式中，步骤(d)包括在抗体分子模型和靶多肽模型之间生成对接姿势。在一个实施方式中，步骤(d)包括在抗体分子模型和靶多肽模型之间生成多种对接姿势。

在一个实施方式中，步骤(d)进一步包括根据对接算法(例如，SnugDock)对多种对接姿势评分。在一个实施方式中，步骤(d)进一步包括选定具有最高评分的多个对接姿势子集，例如，最高评分1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、300、400、500、600、700、800、900、1000或更多对接姿势。在一个实施方式中，步骤(d)进一步包括使用选定子集的多个对接姿势生成整体对接姿势，并设定与整体对接姿势一致的抗体分子模型和靶多肽模型。

在一个实施方式中，抗体分子模型包括衍生自多种抗体同源模型的整体抗体同源模型。

在一个实施方式中，步骤(d)进一步包括除去抗体分子-靶多肽对接模型，其表现出与已知抗体-抗原复合物非典型的接合模式，例如，根据源自抗体-抗原晶体结构的结构过滤器。

在一个实施方式中，步骤(d)包括生成多种抗体分子-靶多肽模型。

在一个实施方式中，步骤(e)包括鉴定靶多肽上能够被抗体分子结合的多个位点。

在一个实施方式中，所述位点包括或由一种或多种靶多肽上的非连续区域组成。在一个实施方式中，所述位点包括或由靶多肽上的连续区域组成。

在另一方面，本公开的特征在于一种鉴定靶多肽(例如，本文所述的靶多肽)上表位的方法，该方法包括：

(a)生成抗体-靶多肽对接模型，其中抗体-靶多肽对接模型根据多种富集评分约束，其由一种方法确定，其包括：

(i)将抗体分子(例如，本文所述抗体分子)与多种靶多肽变体结合，

(ii)获取(例如，富集)多种表现出改变(例如，降低)与抗体分子结合的变体，以及

(iii)确定(例如，计算)多种所述富集的变体中各自的富集评分；以及

(b)基于抗体-靶多肽对接模型，鉴定靶多肽上能够被抗体分子结合的位点；

从而鉴定靶多肽上的表位。

在一个实施方式中，步骤(a)(i)包括将抗体分子与展示多种靶多肽的变体的文库结合。在一个实施方式中，步骤(a)(i)包括将抗体分子与包含表达(例如，展示)多种靶多肽的变体的多种细胞的文库结合。在一个实施方式中，多种细胞中的每一种表达靶多肽的大约一种独特的变体。在一些实施方式中，细胞是真核细胞，例如，酵母细胞。

在一个实施方式中，多种变体包括靶多肽的一种或多种表面残基上的突变。在一个实施方式中，多种变体包括靶多肽的选定表面残基上的不同突变。在一个实施方式中，多种变体包括靶多肽的多种选定表面残基的各自不同突变。

在一个实施方式中，步骤(a)(ii)包括获得(例如，富集)表现出少于约80％(例如，少于约0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、20％、30％、40％、50％、60％、70％或80％)的野生型靶多肽表现出的抗体分子结合的变体。在一个实施方式中，降低的结合是至少约20％(例如，至少约20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％)的野生型靶多肽表现出的结合。

在一个实施方式中，步骤(a)(ii)包括获得(例如，富集)细胞，其表现出少于约80％(例如，少于约0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、20％、30％、40％、50％、60％、70％或80％)的包含野生型靶多肽的细胞表现出的抗体分子结合。在一个实施方式中，降低的结合是至少约20％(例如，至少约20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％)的包含野生型靶多肽的细胞表现出的结合。

在一个实施方式中，步骤(a)(ii)包括对表现出与抗体分子结合降低的变体进行一次或多次，例如，两次、三次、四次、五次、六次、七次、八次、九次、十次或更多次富集。

在一个实施方式中，该方法进一步包括，例如，在步骤(a)(iii)之前，例如，通过测序编码变体的基因，例如，通过下一代测序，鉴定表现出抗体分子结合改变(例如，降低)的变体。

在一个实施方式中，步骤(a)(iii)包括确定多种获得的(例如，富集的)变体中每一种的出现频率。在一个实施方式中，步骤(a)(iii)进一步包括总计在特定残基处的包含不同突变的各个变体出现频率和/或对具有更高出现频率的变体进行加权(例如，重度加权)。

在一个实施方式中，富集评分对靶多肽的氨基酸序列的单个残基是特异性的。在一个实施方式中，各个富集评分对靶多肽的氨基酸序列的不同单个残基是特异性的。

在一个实施方式中，该方法进一步包括用靶多肽的多种变体的重复重复步骤(a)(i)-(a)(iii)至少一次(例如，一次、两次、三次、四次、五次、六次、七次、八次、九次、十次或更多)，且其中步骤(a)(iii)进一步包括省略一种或多种混杂突变，例如，超过50％重复具有高于30％的富集评分的突变，和超过75％重复具有高于15％的富集评分的突变。

在一个实施方式中，通过添加一种或多种吸引约束来约束抗体分子-靶多肽对接模型，任选地，其中吸引约束是用于富集评分高于第一预选值的残基。在一个实施方式中，第一预选值在20％和40％之间，例如，介于25％和35％之间，例如，约25％、约30％或约35％。在一个实施方式中，吸引约束包括基于富集评分的线性缩放奖励。

在一个实施方式中，通过为具有小于第二预选值的富集评分的残基添加排斥约束来约束抗体分子-靶多肽对接模型。在一个实施方式中，第二预选值在5％和20％之间，例如，介于10％和15％之间，例如，约10％、约12.5％或约15％。

在一个实施方式中，步骤(a)包括在抗体分子模型和靶多肽模型之间生成对接姿势。在一个实施方式中，步骤(a)包括在抗体分子模型和靶多肽模型之间生成多种对接姿势。

在一个实施方式中，步骤(a)进一步包括根据对接算法(例如，SnugDock)对多种对接姿势评分。在一个实施方式中，步骤(a)进一步包括选定具有最高评分的多个对接姿势子集，例如，最高评分1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、300、400、500、600、700、800、900、1000或更多的对接姿势。在一个实施方式中，步骤(a)进一步包括使用选定子集的多个对接姿势生成整体对接姿势，并设定与整体对接姿势一致的抗体分子模型和靶多肽模型。

在一个实施方式中，步骤(a)进一步包括除去抗体分子-靶多肽对接模型，其表现出与已知抗体-抗原复合物非典型的接合模式，例如，根据源自抗体-抗原晶体结构的结构过滤器。

在一个实施方式中，步骤(a)包括生成多种抗体分子-靶多肽模型。

在一个实施方式中，步骤(b)包括鉴定能够被抗体分子结合的靶多肽上的多个位点。

在另一个方面中，本公开的特征在于一种鉴定抗体分子上互补位的方法，该方法包括：

(a)将抗体分子与多种靶多肽的变体结合；

(b)获取(例如，富集)多种表现出降低与抗体分子结合的变体；

(c)确定(例如，计算)多种富集的变体中各自的富集评分；

(d)生成抗体分子-靶多肽对接模型，其中所述抗体-靶多肽对接模型根据富集评分进行约束；且

(e)基于抗体-靶多肽对接模型，鉴定抗体分子上能够被靶多肽结合的一个或多个位点；

从而鉴定抗体分子上的互补位。

在一个实施方式中，步骤(a)包括将抗体分子与展示多种靶多肽的变体的文库结合。在一个实施方式中，步骤(a)包括将抗体分子与包含表达(例如，展示)多种靶多肽的变体的多种细胞的文库结合。在一个实施方式中，多种细胞中的每一种表达靶多肽的大约一种独特的变体。在一些实施方式中，细胞是真核细胞，例如，酵母细胞。

在一个实施方式中，步骤(c)包括确定多种获得的(例如，富集的)变体中每一种的出现频率。在一个实施方式中，步骤(c)进一步包括总计在特定残基处的包含不同突变的各个变体出现频率和/或对具有更高出现频率的变体进行加权(例如，重度加权)。

在一个实施方式中，步骤(e)包括鉴定能够被靶多肽结合的抗体分子上的多个位点。

在一个实施方式中，所述位点包括或由一种或多种抗体分子上的非连续区域组成。在一个实施方式中，所述位点包括或由抗体分子上的连续区域组成。

在另一个方面中，本公开的特征在于一种鉴定抗体上互补位的方法，该方法包括：

(a)生成抗体-靶多肽对接模型，其中抗体-靶多肽对接模型根据多种富集评分约束，其由一种方法确定(例如，计算)，其包括：

(i)将抗体与多种靶多肽的变体结合，

(ii)获取(例如，富集)表现出与抗体分子结合降低的变体，以及

(iii)确定(例如，计算)多种获取(例如，富集)的变体中各自的富集评分；以及

(b)基于抗体-靶多肽对接模型，鉴定抗体分子上能够被靶多肽结合的一个或多个位点；

从而鉴定靶多肽上的互补位。

在一个方面，本公开的特征在于根据本文所述的方法鉴定表位在靶多肽上的抗体分子或抗体分子上针对靶多肽的互补位。

在一个方面，本公开的特征在于编码本文所述抗体分子的核酸分子或本文所述抗体分子的一条或多条链(例如，VH和/或VL)。在另一个方面，本公开的特征在于一种载体，其包含本文所述的核酸分子。在另一个方面，本公开特征之一在于一种宿主细胞，其包含本文所述的核酸分子或本文所述的载体。在一个方面，本公开的特征在于一种制备抗体分子的方法，其包括在适合表达抗体分子的条件下培养本文所述宿主细胞。

附图简要说明

图1A-1B是一系列图，其显示APRIL表面上询问的位置。(A)小鼠和人APRIL比对，在深度突变扫描文库中询问的位置以灰色突出显示。通过将muAPRIL中红色下划线的5个位置突变为huAPRIL中发现的相对应氨基酸生成APRIL的嵌合形式。(B)APRIL同源三聚体结构，选用于文库多样性的位置涂成灰色，选择以均匀覆盖在抗原表面。文库设计中存在但未在APRIL晶体结构中观察到的APRIL的9个N-末端氨基酸被示出(结构下方的框)；选择了两个Lys残基进行多样化。

图2是显示抗体和TACI亲和力对于酵母表面表达的APRIL的图表。评估了纯化的抗-APRIL抗体子集(2419、4035、4540和3530)、同种型对照和TACI对酵母表面表达的APRIL的近似亲和力。结合等温线用于估计每种抗体产生80％最大结合的浓度，用于文库富集。

图3是一系列图，其显示利用计算对接工作流程表位映射的概况。APRIL抗原文库的位点饱和文库是通过酵母表面展示生成并表达的。抗体被用于酵母文库，并进行FACS富集以富集文库中的非结合成员。对富集的文库进行NGS以确定和计数潜在的突变。突变富集评分被映射到APRIL表面，以确定映射抗体的推定的表位区域。这些数据可用于约束抗体-抗原对接，生成与突变概况数据一致的模型聚类。生成的高置信模型提供了表位和互补位残基的分子定义。

图4A-4B是一系列图，其显示针对多种抗体和TACI的文库的FACS富集。富集前后，WT APRIL或文库酵母种群的流式细胞术分析被示出。X轴代表APRIL表面表达(c-myc)而Y轴代表抗体/TACI结合。第一列显示了每种抗体或TACI与酵母表面表达的WT APRIL的结合。第二列表示相同的结合条件，但针对开始的未富集的APRIL文库。最后一列表示两轮FACS富集后，富集的未结合群。

图5A-5D是一系列图，其显示所有测试的抗-APRIL抗体的突变概况热图。富集热图(左)为抗体(A)2419、(B)4035、(C)4540和(D)3530计算，对于每种抗体，以残基富集评分映射到APRIL表面(右)。

图6A-6C是一系列图，其显示TACI的表位映射与共结晶结构表现出很强的一致性。(A)计算TACI(左)的富集热图，其值映射到APRIL表面(右)。(B)TACI的总体富集评分，针对每个突变位置计算。表位残基定义为那些距离TACI重原子距离

的残基。(C)TACI在与APRIL组成的复合体内的结构。APRIL上与TACI接触

的突变位置在根据其总体富集评分涂阴影的球体中显示。

图7A-7B是一系列图，其显示混杂突变的实例。(A)APRIL的残基V132针对测试配体组的富集热图。Asp和Glu的混杂突变被突出显示(列)，且对于2419(行)的抗体-特异性突变被突出显示。(B)TACI的结构(深灰色)结合APRIL(浅灰色)。APRIL在不同单体上的残基V132和E182在APRIL同源三聚体的背景上是邻近的。

图8A-8C是一系列图，显示APRIL的同源寡聚体组合件的对称性将来自不同链的等效残基位置靠近分子顶点，但不靠近赤道区域(equatorial region)。APRIL的结构，由链(A)和残基位置(B和C)着色。浅灰色着色的残基，在(B)的顶点，源自同源三聚体的3个不同的链。(C)APRIL同源三聚体相对于(B)旋转90°以显示来自不同链的等效残基位置在赤道区域不邻近。

图9A-9D是一系列显示N末端截短的APRIL中唯一丢失3530结合的图。抗体3530和TACI结合酵母表面表达的APRIL的两种不同形式。示出了3530(A)和TACI(C)结合全长APRIL(残基96-241)。示出了3530(B)和TACI(D)结合N末端截短的APRIL(残基106-241)。

图10是显示示例性计算对接工作流程的示意图，根据衍生自深度突变扫描的突变数据，使用抗体-抗原对接以生成分子上定义的表位和互补位映射。

图11A-11C是一系列图，其显示建模的2419的计算对接与共结晶结构表现出很强的一致性。(A)2419-APRIL复合物的前500个对接模型的计算Rosetta界面评分(Isc)与相对于天然结构的界面RMSD。前100个评分的对接模型被加以阴影：浅灰色(FW

)，中灰色(

)，和深灰色(FW

)。(B)排名靠前的2419-APRIL对接模型和2419-APRIL的天然结构的叠加，显示高度重叠。对接模型和天然结构是仅基于APRIL配体的Cα坐标叠加。(C)实验性地确定2419与APRIL结合的残基富集评分。基于对接置信评分(在前100的对接姿势中发现对应的残基与2419接触

的频率)对条形加阴影。星号表示从天然结构中鉴定的接触位置。

图12A-12B是一系列图，显示互补位对接评分和映射到2419表面的位置。(A)对接置信评分(互补位)映射到2419表面。(B)互补位位置涂黑，来源于huAPRIL-2419的天然结构。残基之间的接触被定义为重原子距离

图13A-13D是一系列图，显示被纳入计算工作流程的实验衍生的约束能够收敛到接近天然接合模式。图中的顶行表示APRIL与2419残基接触，根据在对接模型中残基与抗体接触(重原子距离

)的频率加阴影。底行显示前10名评分的对接2419-APRIL模型或天然结构。(A)无实验性约束的全局对接。(B)纳入富集评分约束的全局对接。(C)表位映射全工作流程(受约束的全局对接，然后是受约束的SnugDock，然后使用抗体特异性结构过滤器)。(D)2419-APRIL天然结构。

图14A-14B是一系列图，显示了约束对对接结果的影响。与2419-APRIL复合物的天然结构相比，由Rosetta计算的对接界面得分对比抗体配体(框架)RMSD(仅叠加在抗原上)的点图，不使用富集评分作为约束(A)，使用富集评分作为约束(B)。评分前100的对接模型被着色：浅灰色(FW

)，中灰色

和深灰色(FW

)，排名未在前100的模型着色为灰色。

图15A-15C是一系列图，显示每种抗体与APRIL的预测接合模式。上图：基于对接置信评分为APRIL残基加阴影，计算为抗原残基与抗体接触(重原子距离

)的模型的百分比。示出了2419(A列)、4035(B列)和4540(C列)的映射。下图：为清楚起见，显示了与ARIL(灰色)相互作用和阻断TACI(中灰色)结合的单个最高评分抗体姿势。由于抗体结合而在TACI上预测的空间位阻区域以浅灰色表示。

图16A-16C是一系列图，显示计算模型能够实现物种结合特异性的合理的抗体工程改造。(A)小鼠和人APRIL之间的差异在APRIL结构上突出显示。非同源突变着色为中灰色，同源突变示为深灰色。每种抗体的对接表位(排名最高的模型)以浅灰色轮廓显示。(B)基于对接结果，预测位置E181和I219邻近APRIL的重链R54。MuAPRIL结构中第181和219位精氨酸和赖氨酸的突变预计会导致与2419的HCDR2上的R54的相互作用不稳定。(C)通过ELISA确定2419的结合和针对muAPRIL设计的变体抗体。设计的变体包括取代：R54D(设计1)；T28A_R54D(设计2)；L53V_R54D_S56A(设计3)。

图17示出2419重新设计物与人APRIL的结合的图。2419和设计的变体与人APRIL的ELISA结合结果。设计的变体包括取代：R54D(设计1)；T28A_R54D(设计2)；L53V_R54D_S56A(设计3)。半最大结合浓度是20nM(2419)，73nM(设计1)，63nM(设计2)和306nM(设计3)。

发明详述

定义

如本文所用，术语“抗体分子”指的是多肽，其包括来自免疫球蛋白重链可变区的足够序列，和/或来自免疫球蛋白轻链可变区的足够序列，以提供抗原特异性结合。其包括全长抗体和其片段，例如，支持抗原结合的Fab片段。通常抗体分子将包含重链CDR1、CDR2和CDR3以及轻链CDR1、CDR2和CDR3序列。抗体分子包括人、人源化、CDR移植抗体及其抗原结合片段。在一个实施方式中，抗体分子包括蛋白质，其包括至少一个免疫球蛋白可变区区段，例如，氨基酸序列，其提供免疫球蛋白可变结构域或免疫球蛋白可变结构域序列。

抗体分子的VH或VL链可进一步包括所有或部分的重链或轻链恒定区，从而分别形成重或轻免疫球蛋白链。在一种实施方式中，抗体分子是两个重免疫球蛋白链和两个轻免疫球蛋白链的四聚体。

抗体分子可包括重链(或轻链)免疫球蛋白可变区段之一或两者。如本文所用，术语“重链(或轻链)免疫球蛋白可变区段”指的是能够结合抗原的整体重链(或轻链)免疫球蛋白可变区或其片段。重链或轻链区段结合抗原的能力分别用与轻链或重链配对的区段来测量。在一些实施方式中，当与合适的链配对时，小于全长可变区的重链或轻链区段将分别以全长链与轻链或重链配对时的至少20、30、40、50、60、70、80、90或95％亲和力结合。

免疫球蛋白可变区段可能与参考或共有序列不同。如本文所用，“不同”意为参考序列或共有序列中的残基被不同的残基或缺失或插入残基替换。

抗体分子可包含重(H)链可变区(本文中缩写为VH)和轻(L)链可变区(本文中缩写为VL)。在另一个实例中，抗体包含两条重(H)链可变区和两条轻(L)链可变区或其抗体结合片段。免疫球蛋白的轻链可能是κ或λ型。在一个实施方式中，抗体分子是糖基化的。抗体分子对于抗体依赖性细胞毒性和/或补体介导的细胞毒性是有功能的，或对于这些活性中的一种或两种是无功能的。抗体分子可以是完整的抗体或其抗原结合片段。

抗体分子包括全长抗体的“抗原结合片段”，例如，全长抗体的一种或多种片段，其保留有特异性地结合感兴趣的HA靶标的能力。术语全长抗体的“抗原结合片段”所包含的结合片段的实例包括(i)Fab片段，由VL、VH、CL和CH1结构域组成的单价片段；(ii)F(ab′)或F(ab′)₂片段，二价片段，包括在铰链区通过二硫桥联接的两个Fab片段；(iii)由VH和CH1结构域组成的Fd片段；(iv)由抗体单臂的VL和VH结构域组成的Fv片段，(v)dAb片段(Ward等.，(1989)Nature 341：544-546)，其由VH结构域组成；以及(vi)保留功能性的分离的互补决定区(CDR)。此外，尽管Fv片段的两个结构域VL和VH分别由不同基因编码，但可通过重组方法利用合成接头使其连接成为一条蛋白链，其中VL和VH区配对形成单价分子，称为单链Fv(scFv)。参见例如Bird等，(1988)Science 242：423-426；和Huston等.(1988)Proc.Natl.Acad.Sci.USA 85：5879-5883。抗体分子包括双抗体。

如本文所用，“抗体”指的是多肽，例如，四聚体或单链多肽，其包含免疫球蛋白的结构和功能特征，特别是抗原结合特征。通常，人抗体包含两条相同的轻链和两条相同的重链。每条链包含可变区。

重链可变(VH)和轻链可变(VL)区可进一步细分为超变区，称为“互补决定区”(“CDR”)，其间间插更保守的区，被称为“框架区”(FR)。人抗体具有三个VH CDR和三个VLCDR，由框架区FR1-FR4分隔。FR和CDR的范围已经被精确划定(参见Kabat，E.A.等，(1991)《热门免疫学蛋白质序列》，第五版，美国卫生和人服务部，NIH出版号91-3242，和Chothia，C.等，(1987)J.Mol.Biol.196：901-917)。本文使用Kabat定义。各VH和VL通常由三个CDR和四个FR组成，从氨基末端到羧基末端按照如下顺序排列：FRi，CDR1，FR2，CDR2，FR3，CDR3和FR4。

重和轻免疫球蛋白链可通过二硫键相连。重链恒定区通常包含三个恒定结构域CH1、CH2和CH3。轻链恒定域通常包括CL结构域。重链和轻链的可变区包含与抗原相互作用的结合结构域。抗体的恒定域通常介导抗体与宿主组织或因子的结合，包括免疫系统的各种细胞(例如，效应细胞)和经典补体系统的第一成分(Clq)。

术语“免疫球蛋白”包括可在生物化学上区分的各种广泛类型的多肽。本领域技术人员将理解，重链被分类为γ、μ、α、δ或ε(γ、μ、α、δ、ε)，其中还有一些亚类(例如γ1-γ4)。该链的特性决定抗体“类别”分别为IgG、IgM、IgA、IgD或IgE。免疫球蛋白亚类(同种型)例如IgG1、IgG2、IgG3、IgG4、IgA1等已被充分表征，且已知提供功能性特化。根据本文公开内容，本领域技术人员不难区分这些类别和同种型的修饰形式，因此，它们涵盖在本公开范围内。所有免疫球蛋白类别清楚地包含于本发明的范围内。轻链分类为κ或λ(κ，λ)。各重链类别可与κ或λ轻链结合。

合适的抗体包括但不限于单克隆、单特异性、多克隆、多特异性、人抗体、灵长类抗体、嵌合抗体、双特异性抗体、人源化抗体、偶联抗体(即，抗体与其他蛋白质、放射性标记、细胞毒素偶联或融合)，小模块免疫药物(“SMIPs^TM”)，单链抗体、骆驼抗体和抗体片段。

在一个实施方式中，抗体是人源化抗体。人源化抗体指包含人框架区和一个或多个来自非人(例如，小鼠或大鼠)免疫球蛋白的CDR。提供CDR的免疫球蛋白通常称为“供体”，而提供框架的人免疫球蛋白通常称为“受体”，尽管在一个实施方式中不隐含来源或过程限制。通常人源化抗体包含人源化的轻链和人源化的重链免疫球蛋白。

“免疫球蛋白结构域”指的是来自免疫球蛋白分子的可变区或恒定区的结构域。免疫球蛋白结构域通常包含由大约七个β-链形成的两个β-折叠，和保守的二硫键(参见，例如，A.F.Williams和A.N.Barclay(1988)Ann.Rev.Immunol.6：381-405)。

如本文所用，“免疫球蛋白可变结构域序列”是指能形成免疫球蛋白可变结构域结构的氨基酸序列。例如，该序列可包括天然存在可变结构域氨基酸序列的全部或部分。例如，该序列可省略一个、两个或更多N-或C-末端氨基酸，内部氨基酸，可以包括一个或多个插入或额外的末端氨基酸，或者可以包括其他改变。在一个实施方式中，包含免疫球蛋白可变结构域序列的多肽可与另一个免疫球蛋白可变结构域序列相连接以形成靶结合结构(或称“抗原结合位点”)，例如，与靶抗原相互作用的结构。

如本文所用，术语抗体包括完整的单克隆抗体、多克隆抗体、单域抗体(例如，鲨鱼单域抗体(例如，IgNAR或其片段))，至少由两种完整的抗体形成的多特异性抗体(例如，双特异性抗体)，和抗体片段，只要它们表现出所需要的生物学活性。本文所使用的抗体可以是任何类型(例如，IgA、IgD、IgE、IgG、IgM)。

抗体或抗体分子可衍生自哺乳动物，例如，啮齿动物，例如，小鼠或大鼠、马、猪或山羊。在一个实施方式中，使用重组细胞产生抗体或抗体分子。在一个实施方式中，抗体或抗体分子是嵌合抗体，例如，来自小鼠、大鼠、马、猪或其他物种，负载了人恒定区和/或可变区结构域。

如本文所用，术语“变体”是指包含氨基酸序列的多肽，所述氨基酸序列相对于野生型靶多肽的氨基酸序列含有一个或多个突变(例如，氨基酸取代、缺失、插入或本领域已知的任何其他突变)。在一些情况下，相对于野生型靶多肽的氨基酸序列，变体包括例如表面残基的约一种氨基酸取代。如本文所用，“野生型”是指包含参考氨基酸序列的靶多肽的形式。在一些情况下，野生型靶多肽包含天然存在的氨基酸序列(例如，来自活生物体的内源性序列)。在其他情况下，野生型靶多肽包含任何参考氨基酸序列(例如，共有氨基酸序列，例如，从多种靶多肽的天然存在版本编成)。

如本文所用，术语“靶多肽”是指期望被抗体分子结合的任何多肽。靶多肽在其表面上可以包括一个或多个与抗体分子接触的表位。本文所述的方法可用于鉴定此类表位区域。靶多肽可以结合抗体分子上的一个或多个互补位区域，其同样可根据本文所述方法鉴定。在一些情况下，术语“靶多肽”和“抗原”可以互换使用。

如本文所用，术语“表位”指的是靶多肽(例如，如本文所述)与另一个多肽，例如，抗体分子接触的部分，例如通过抗体分子的一个或多个CDR和/或抗体分子的一个或多个框架残基。在一些情况下，表位包括一个或多个靶多肽的表面残基。蛋白质或多肽的“表面残基”通常是位于蛋白质或多肽外表面上的氨基酸残基，例如，使得至少部分氨基酸(例如，侧链)对于蛋白质或多肽外部的另一分子是可及的。表位残基可能是连续的或不连续的。在一些情况下，表位包括接触抗体分子的多个区域或斑块(patch)。在某些情况下，两个或更多区域或斑块是不连续或物理上不接近的，例如，构象表位。

如本文所用，术语“互补位”是指被靶多肽(例如，如本文所述)接触抗体分子的部分或其变体。互补位可包括一个或多个抗体分子的CDR和/或一个或多个抗体分子的框架残基。在一些情况下，互补位包括一个或多个抗体分子的表面残基。互补位残基可能是连续的或不连续的。在一些情况下，互补位包括接触靶多肽的多个区域或斑块。在某些情况下，两个或更多区域或斑块是不连续或物理上不接近的。

如本文所用，术语“模型”通常指的是一种或多种分子(例如，靶多肽和/或抗体分子)的结构，例如，三维模型，例如，模拟的和/或计算的结构。在一些情况下，术语“建模”用于指生成模型的过程。可以通过例如X-射线晶体学分析或通过计算方法生成模型，例如，如本文所述。可以通过总计一个或多个其他模型的信息生成模型。在一些情况下，模型包括多个其他模型。在一些情况下，使用多个其他模型生成模型。实体“的模型”指的是代表实体的结构的模型。如本文所用术语“对接模型”通常指的是抗体分子和靶多肽之间相互作用的模型(例如，三维模型)，或其变体。在一些情况下，对接模型包括抗体分子的模型和靶多肽的模型，或其变体。在一些情况下，对接模型显示抗体分子和靶多肽之间的接触点，或其变体。

在本文中用于抗体分子的上下文中时，例如，从天然来源获得的抗体、免疫原或通常的多肽，术语纯化的”和“分离的”指的是基本上不含来自天然来源的污染材料的分子，例如，来自天然来源的细胞材料，例如，细胞碎片、膜、细胞器、存在于细胞中的大部分核酸或蛋白质。因此，分离的多肽，例如，抗体分子，包括具有低于约30％、20％、10％、5％、2％或1％(以干重计)的细胞材料和/或污染材料的多肽制备物。在本文中用于化学合成物质的上下文中时，例如，抗体分子，或免疫原，术语“纯化的”和“分离的”指的是基本不含有化学前体或其他在分子合成中涉及的化学品的物质。

两条序列间的“同源性”或“序列相同性”或“相同性”(这些术语在本文中可互换使用)的计算可如下进行。可以为了最佳比较目的而对序列进行比对(例如，可以在第一和第二氨基酸或核酸序列之一或两者中引入缺口以达到最佳对齐，并且出于比较目的可以不考虑非同源序列)。使用GCG软件包中的GAP程序将最佳对齐确定为最佳分数，其中Blossum 62评分矩阵的缺口罚分为12、缺口延伸罚分为4、移码缺口罚分为5。然后比较对应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当第一序列中的位置被与第二序列中对应位置相同的氨基酸残基或核苷酸占据时，则分子在该位置是相同的(如本文所用，氨基酸或核酸的“相同性”等同于氨基酸酸或核酸“同源性”)。两条序列之间的百分比相同性是序列共有相同位置的数目的函数。

细胞展示试验

本发明的方法通常包括在细胞(例如，酵母细胞)上展示靶多肽的变体和评估抗体对靶多肽的变体的结合能力，例如，通过富集展示变体表现出与抗体结合降低(例如，结合亲和力降低)的细胞群。根据本文所述的方法，可以使用的细胞实例包括但不限于，真核细胞(例如，真菌细胞，例如，酵母细胞；哺乳动物细胞；例如，CHO细胞或人细胞)或原核细胞(例如，细菌细胞，例如，大肠杆菌细胞)。在一个实施方式中，所述细胞是酵母细胞。

在一个实施方式中，表位映射数据源自靶多肽(本文中也称为抗原)的文库的深度突变扫描，其解决了典型诱变基因型-表型研究的低通量特性，且能够同时测试许多(例如，数百个、数千个或数万个)突变变体对功能的影响。该方法的通量可以实现对表面残基和每个残基多种不同突变(即，不仅是丙氨酸突变)的更全面的取样，因此实现更灵敏且完整的表位映射，包括构象表位。

在一个实施方式中，靶多肽的变体在细胞(例如，酵母细胞)表面表达，例如，通过接头序列与内源细胞表面蛋白(例如，酵母蛋白Aga2)融合。在一个实施方式中，例如，其中靶多肽通常形成多聚体，接头和给定变体之间的长柔性接头序列(例如，接头包含至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多氨基酸)可以为相邻的靶多肽分子提供足够的接近度以进行结合，从而呈现天然四级结构。在一个实施方式中，接头包含35个氨基酸。

在一个实施方式中，该方法包含实施例中所述的一个或多个步骤。在一个实施方式中，根据实施例进行此方法。

靶多肽变体

在一个实施方式中，测试靶多肽的变体群对感兴趣的抗体的结合能力和/或结合亲和力。在一个实施方式中，靶多肽变体群可包括靶多肽的表面残基的突变，其可用于鉴定与感兴趣的抗体接触的多肽的表面区域，例如，使用本文所述或领域内已知的表位映射方法。例如，变体群的每一个可包括至少一个(例如，1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个)表面残基的氨基酸取代。在一个实施方式中，所述群体包括具有表面残基突变分布的变体，该分布适于以所需分辨率鉴定抗体和靶多肽之间接触的区域。

此类变体文库可通过深度突变扫描生成，例如，如本文所述。在一个实施方式中，变体文库被设计成将源自深度突变扫描的表位映射信息输出最大化，例如，通过首先鉴定在突变时不可能对蛋白结构有显著不利影响的所有表面残基。在一个实施方式中，基于相对侧链表面可及性(例如，使用Discovery Studio)挑选表面残基。在一个实施方式中，挑选表现出相对侧链表面可及性高于约25％(例如，高于约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、60％、70％、80％、90％、95％或99％)的残基用于突变。在一个实施方式中，可鉴定耐受突变的残基，例如，通过视检和/或他们与相邻残基相互作用和/或与相邻残基邻近。在一个实施方式中，所有靶多肽的表面残基被鉴定为具有与结合抗体直接接触的潜力的残基子集。在一个实施方式中，Pro和/或Gly残基被排除在考虑之外，因为突变此类残基更可能扰乱蛋白质结构，这可能通过对结合的间接影响造成表位映射假阳性。

在一个实施方式中，选择将要突变的残基子集以均匀覆盖靶多肽的表面。在一个实施方式中，残基可以在视觉上被整理以确保均匀覆盖，用于挑选用于跨越整个表面的突变的表面位置子集。在一个实施方式中，可以挑选额外的N-末端和/或C-末端残基用于突变。在一个实施方式中，可以挑选在靶多肽的X-射线晶体学结构中未解析的一个或多个残基用于突变。在一个实施方式中，挑选至少约5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300、350、400、450、500、550、600、650、700、750、800、850、900、950或1000个残基用于突变。

在一个实施方式中，合成表示所选位置的单位点饱和诱变文库，例如，使用NNK简并性。合成文库的深度测序可用于验证在预期位置存在突变。在一个实施方式中，通过将单个突变与表型配对来维持基因型-表型的联接，例如，使用非组合的位点饱和文库。

文库选择

可以将靶多肽变体文库转化进细胞中并评估突变对结合的影响。在一个实施方式中，文库被转化进酵母细胞。优选地，对于独特的遗传多样性(例如，在每个位置有32种可能的密码子)，转化提供了彻底的(例如，约5000倍，例如，约100倍、500倍、1000倍、2000倍、3000倍、4000倍、5000倍、6000倍、7000倍、8000倍、9000倍、10000倍或更多)的过量采样(oversampling)。在一个实施方式中，将破坏抗体结合的突变的检测灵敏度最大化，例如，使用的抗体浓度对应于细胞上展示野生型靶多肽的最大结合的约80％(例如，约50％、60％、70％、80％、90％或100％)。在一个实施方式中，抗体结合被用于区分表现出不同结合特性的变体。在一个实施方式中，选择表现出结合降低的变体。在一个实施方式中，选择表现出结合增强的变体。

在一个实施方式中，荧光激活细胞分选(FACS)被用于选择(例如，富集)表现出不同结合特性(例如，相对于野生型靶多肽的结合降低或增强)的变体。在一个实施方式中，被挑选的变体相对于野生型靶多肽表现出结合降低，例如，至少约20％(例如，至少约20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％)的包含野生型靶多肽的细胞表现出的结合的降低的结合。在一个实施方式中，被挑选的变体相对于野生型靶多肽表现出结合增强，例如，至少约20％(例如，至少约20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％)的包含野生型靶多肽的细胞表现出的结合的增强的结合。在一个实施方式中，进行至少两轮(例如，至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多轮)FACS富集(例如，富集表达但非结合的群体)。在一个实施方式中，对于给定样品收集至少约1000个细胞(例如，至少约1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000或100,000个细胞)。在一个实施方式中，对于给定样品收集至少约30,000个细胞。在某个实施方式中，FACS富集收获对于其各自抗体缺乏任何显著结合能力的群体。

在一个实施方式中，表达靶多肽变体文库的细胞(例如，酵母细胞)暴露于抗体，例如，其浓度对应于抗体与靶多肽最大结合的约80％(例如，约50％、60％、70％、80％、90％或100％)，例如，基于与表达野生型靶多肽的细胞(例如，酵母细胞)的抗体滴定结合实验。

深度测序与生物信息学

在一个实施方式中，从结合实验中选择的变体进行深度测序，例如，以确定和量化潜在的基因型。在一个实施方式中，从数据集中除去质量评分低于预定阈值(例如，质量评分小于约30)的测序读数(sequencing reads)。在一个实施方式中，从数据集中除去包括插入和/或缺失突变的读数。在一个实施方式中，从数据集中除去包含超过预定阈值的数量的碱基取代的读数(例如，大于约5、6、7、8、9、10、11、1213、14、15、20、30、40或50个碱基取代)。在一个实施方式中，相对于野生型靶多肽，包含内部终止密码子、在非预期位置的突变和/或多于一个氨基酸取代的读数被从数据集中除去。在一个实施方式中，核酸读数被转化为氨基酸读数。在一个实施方式中，从数据集中除去读数数少于预定阈值(例如，少于约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、400、500、600、700、800、900或1000个读数)的突变变体。

在一个实施方式中，进行生物信息学分析以计算针对抗体的测序变体的富集水平。在一个实施方式中，相对于起始文库，在非结合群体(non-binding population)中富集的变体代表抗体结合亲和力降低的突变。在一个实施方式中，相对于起始文库，在结合提高群体(elevated binding population)中富集的变体代表抗体结合亲和力增强的突变。预期引起结合降低的机制包括，例如，直接影响，例如与抗体直接接触的残基侧链改变，以及间接影响，例如通过与接触残基无关的局部或全局蛋白质结构改变。结构破坏性突变可能影响抗体与不同表位的结合。在一个实施方式中，一组抗体以不同的结合模式(例如，使用竞争结合实验确定的)被纳入，以帮助识别可能导致间接影响抗体结合的突变的计算工作。

富集评分

例如，基于如本文所述生成的选择数据，可针对各变体计算富集评分，其代表文库选择后特定变体的富集水平。在一个实施方式中，针对各突变的富集评分可如下计算：对于在非结合库中收集的各样品，样品中位置依赖性突变的出现频率由该突变在表达子(expresser)库中的出现频率归一化，并由在非结合库中发现的变体的分数按如下缩放：

其中

是给定氨基酸(aa)在样品(s)的位置(p)上的富集评分，NB^s是在非结合库中发现的变体的分数(库大小)，以及f_p，aa是在样品(s)或表达子库(wt)中所观察到的氨基酸的位置频率。在一个实施方式中，富集评分表示在非结合库中发现的来自表达子库的突变的分数(例如，本文中表示为百分比)。

在一个实施方式中，基于测序结果计算在非结合库中各突变的分数。在一个实施方式中，对于各突变，在非结合库中发现的出现频率相对于在表达子库中发现的频率被用于计算富集评分。在一个实施方式中，为变体计算的富集评分表示在非结合库中发现的特定突变的分数，例如，范围为0-100％。在一个实施方式中，由于对Pro、Gly或Cys的突变更倾向于改变三级或四级结构，它们被从考虑中省略。在一个实施方式中，预期会插入或移除糖基化位点的位点特异性突变被从考虑中省略。在一个实施方式中，通过总计各个特定残基的各突变的富集评分计算残基富集评分，例如，以更重度加权具有高富集评分的突变的方式。具有更高富集评分的残基通常对于结合的突变反映更敏感，例如，表明该位置更可能是表位的部分。在一个实施方式中，然后将富集评分映射到靶多肽的表面，且具有高富集评分的位置(例如，在靶多肽的表面斑块上)被指定为表位的部分。

不希望囿于理论，某些突变可能在多个系统中显示高于背景的富集评分，通常具有低到中的富集评分值。在某些情况下，对于许多抗体结合的这种混杂效应可能代表假阳性，例如，通过间接机制降低结合引起的假阳性。为了从表位映射中去除，鉴定混杂突变的阈值可根据经验确定，例如，基于对所有样品的富集映射的检查。在一个实施方式中，超过约50％(例如，约30％、40％、45％、50％、55％、60％或70％)的样品中具有超过约30％(例如，约20％、25％、30％、35％、40％、45％、或50％)的富集评分的突变，和任选的超过约75％(例如，约50％、60％、70％、75％、80％、90％或95％)的样品中具有超过15％(例如，约5％、10％、15％、20％、25％或30％)的富集评分的突变，被认为是假阳性并为表位测定所除去。在一个实施方式中，可以通过抗体-抗原复合物的结构分析鉴定混杂突变，例如，以显示这种残基并不参与抗体-抗原接触，或突变可能使例如二级、三级或四级结构去稳定(例如，通过静电吸引或排斥)。

在一个实施方式中，可为多个生物学复制(例如，至少2、3、4、5、6、7、8、9、10、15、20、25或30个生物学复制)计算富集评分和表位映射，例如，以评估重复性。在一个实施方式中，可以验证富集评分的精确度，例如，通过将靶多肽与抗体或其类似的替代物(例如，靶多肽的配体或受体)的共结晶结构与其相比。

在一个实施方式中，可以生成靶多肽上给定氨基酸位置的突变数据的总和，例如，用于评估该氨基酸位置是表位的部分。在一个实施方式中，为每个残基计算总富集评分，例如，通过总计在对应位置的各突变的影响。在一个实施方式中，富集评分如下计算：

其中N_p，aa是过滤后在给定位置的氨基酸突变数。通常，计算出的总残基富集评分更重度加权显示出高富集评分的突变的影响，和/或降低显示出低富集评分的突变的加权贡献。这可以确保可能由于噪声对多个突变显示低富集水平的位置不会掩盖来自可能具有较少数目但更高富集水平的突变的位置的信号。在一个实施方式中，一旦计算了各个位置的总富集评分，该总富集评分就可以映射到蛋白质表面以促进富集表位映射的可视化。

抗体-抗原复合物的计算建模

本文描述的方法通常涉及鉴定靶多肽上被感兴趣的抗体或其抗原结合片段结合的一个或多个表位区域或位点。例如，可以使用抗体-抗原复合物计算建模(例如，使用对接算法)来鉴定这种表位区域，可以通过例如，如本文所述的细胞展示试验的结果通知。在一个实施方式中，细胞展示试验(例如，如本文所述的富集评分)的结果作为约束纳入对接算法。在一个实施方式中，该方法包含实施例中所述的一个或多个步骤。在一个实施方式中，根据实施例进行此方法。

抗体-抗原对接

通常，可以实施多步骤对接方法以生成抗体-抗原模型，其优选地(1)纳入实验衍生的表位映射作为约束，(2)使用整体抗体模型以更好地解释同源建模中的不确定性，以及(3)利用大量抗体-特异性结构知识以更有效地识别具有抗体-抗原复合物特征的对接模型。在一个实施方式中，残基富集评分(例如，如本文所述从深度突变扫描数据获得的)被用作抗体-抗原全局对接算法的约束，例如，其在整个抗原表面上对抗体接合进行采样。在一个实施方式中，约束被用于在与高富集位置进行最大接触时指定抗体-抗原姿势为有利的，和/或在被确定为耐受突变的接触位置时指定抗体-抗原姿势为不利。

在一个实施方式中，例如，使用本领域已知的算法和/或方案(例如，Rosetta抗体同源建模，例如，Rosette 3.8或BioLuminate

)生成抗体同源模型(例如，用于生成抗体-抗原对接模型)。在一个实施方式中，抗体同源模型是变化的，例如，在CDR区域的构象(例如，HCDR1、HCDR2、HCDR3、LCDR1、LCDR2和/或LCDR3)。在一个实施方式中，模型变化主要发生在HCDR3的构象(例如，在HCDR3环中)。

例如，可以使用不同抗体同源模型的整体作为输入进行对接。在一个实施方式中，对接程序PIPER用于全局对接，例如，使用源自已知抗体-抗原复合物的定制评分函数。在一个实施方式中，在对接模型的生成期间使用来自富集评分的约束，例如，利用吸引和/或排斥约束以改变对接结果。这允许使用表位映射方法，该方法鉴定具有高富集评分的残基(例如，转化为对接的吸引约束)，和/或鉴定具有低富集评分的残基，其将不会成为表位的一部分(例如，转化为排斥约束)。在一个实施方式中，仅使用具有高或低富集评分的残基生成约束，例如，使得在对接期间具有中富集评分的残基不被约束。在一个实施方式中，从一组抗体中生成的数据被用于鉴定影响许多抗体结合且因此更可能为假阳性的突变。在一个实施方式中，可以在生成约束时排除这种假阳性。在一个实施方式中，本文所述的对接方法不依赖于绝对截止值，该值决定富集位置是否被包含为表位的一部分。

在一个实施方式中，如下将约束纳入对接运行：基于富集评分，为具有残基富集评分高于约30％(高于约20％、25％、30％、35％、40％、45％或50％)的位点添加吸引约束和吸引奖励，例如，线性缩放从例如0.35到0.99。在一个实施方式中，为具有残基富集评分低于约12.5％(例如，约5％、10％、11％、12％、12.5％、13％、14％、15％、20％、25％或30％)的位点添加排斥约束。在一个实施方式中，为一系列输入抗体同源模型(例如，一系列至少约5、10、15、20、25、30、40、50或更多输入抗体同源模型)的每一个进行全局对接。在一个实施方式中，生成总计至少约50、100、200、300、400、500、600、700、800、900或1000个对接姿势。在一个实施方式中，从每个样品中获得代表聚类中心(cluster centers)的约30个姿势(例如，约10、15、20、25、30、35、40、45或50个姿势)。

在一个实施方式中，计算表位映射评分以评估每个对接模型与实验确定的富集评分之间的一致性水平。在一个实施方式中，使用以下公式计算表位映射评分：

其中ES是表位映射评分，N是突变位点数量，c_p是位置p的约束，E_p是在位置p的富集评分。在一个实施方式中，按其表位映射评分为对接模型排序。在一个实施方式中，选择一定数量的排序靠前的模型(例如，前5、10、15、20、25、30、35、40、45、50、60、70、80、90、100或更多个模型)。

在一个实施方式中，抗体-抗原对接涉及生成整体对接模型，其中多种抗体同源模型对接一种或多种抗原模型。在一个实施方式中，多种抗体同源模型对接一种抗原模型。在一个实施方式中，多种抗体同源模型对接多种抗原模型。在一个实施方式中，最优解(topsolutions)的整体被用于代表抗体-抗原复合物。在一个实施方式中，从对接工作流程中选择一个排名最高的模型代表对接复合物。

在一个实施方式中，可以例如使用局部对接算法(例如，SnugDock)来改进如本文所述生成的对接姿势。在一个实施方式中，局部对接算法改进对接姿势，例如，通过探索小刚性体运动，允许侧链的重新包装，CDR区域(例如，HCDR1、HCDR2、HCDR3、LCDR1、LCDR2和/或LCDR3；优选为HCDR2和/或HCDR3)重新建模，CDR环(例如，HCDR1、HCDR2、HCDR3、LCDR1、LCDR2和/或LCDR3；优选为HCDR2和/或HCDR3)的改进，和/或VH/VL取向的重新采样。.在一个实施方式中，在局部对接(例如，如上文所述针对全局对接)中使用来自富集评分的约束，例如，利用吸引和/或排斥约束以改变局部对接结果。在一个实施方式中，具有高富集评分的残基被转化为对对接的吸引约束。在一个实施方式中，具有低富集评分的残基被转化为排斥约束。

在一个实施方式中，抗体-特异性结构过滤器子集，例如，源自可获得的抗体-抗原晶体结构子集，应用于除去表现出与已知抗体-抗原复合物非典型的接合模式的模型。在一个实施方式中，结构过滤器选自列于表1的那些(例如，至少1、2、3、4、5、6、7、8、9、10、11、12、13、14或所有列于表1的结构过滤器)。在一个实施方式中，如果两个残基中的一对重原子相距

则残基被认为是接触的。

表1：用于过滤对接姿势的示例性抗体-抗原结构过滤器

在一个实施方式中，使用至少约100种(例如，约100、150、200、250、300、350、400、450、500或更多)可用的抗体-抗原复合物的结构以生成结构过滤器。在一个实施方式中，在界面附近具有缺失区域的复合物和/或在界面上具有配体或翻译后修饰的复合物被除去。通常，对于用于生成结构过滤器的抗体-抗原复合物子集，计算关键界面特性的结构特征的分布(例如，接合表位的CDR和/或框架残基的数量，参与相互作用的CDR环的数量和类型，表位残基的数量，被掩盖的表面积，和/或成对残基倾向)。在一个实施方式中，选择上述一个或多个界面特性的阈值，使得结构的预定量(例如，至少约85％、90％、95％、96％、97％、98％、99％或99.9％)失败不超过一个结构过滤器。

在一个实施方式中，为每一个对接模型计算界面特性。在一个实施方式中，超过一个结构过滤器失败的模型被除去。在一个实施方式中，剩余的对接模型基于表位映射评分过滤(例如，如本文所述)。在一个实施方式中，允许对接模型接触低富集评分的少数残基。在一个实施方式中，除去富集评分小于最大观察到的表位映射评分的约80％的模型。在一个实施方式中，剩余的对接模型基于其界面能量(Isc)排序，例如，使用Rosetta计算的。

在一个实施方式中，使用源自大量可用结构的抗体-抗原复合物特定知识鉴定接近天然的模型。对接算法通常利用基于物理的评分函数，其已被参数化为通用于蛋白-蛋白相互作用。在一个实施方式中，生成策划的抗体-抗原结构数据库并计算结构特征的分布，例如，包括掩盖的表面积、接合抗原的CDR残基的数量和类型、来自CDR环的互补位残基的分数、和/或成对残基倾向。然后可以根据这些结构特征评估候选对接模型，而具有非典型界面的模型可从考虑中去除。

抗体工程改造

除了鉴定与晶体结构一致的表位残基之外，对接模型还可以提供互补位信息。这可用于抗体的进一步工程改造，例如，在人源化、亲和力成熟、抗原结合特异性的改变、和/或生物物理学特性(例如，聚集倾向)的改进中。在一个实施方式中，可以使用如本文所述生成的抗体-抗原对接模型鉴定互补位残基和/或区域。

在一个实施方式中，鉴定的互补位残基可被工程改造以调节抗体的活性或改变抗体的结构特征。例如，可以修饰互补位残基以增强或减弱对于靶多肽的跨物种反应性(例如，小鼠和人、食蟹猴和人、小鼠和食蟹猴或其他任何成对的物种组合)，和/或以增强或减弱靶多肽和一种或多种相关蛋白质的交叉反应性。

在一个实施方式中，本公开包括通过本文所述的方法工程改造的抗体分子。在一个实施方式中，本公开包括组合物(例如，药物组合物)其包括由本文所述方法工程改造的抗体分子和药学上可接受的运载体。在一个实施方式中，本公开包括编码由本文所述的方法工程改造的抗体分子的核酸分子。在一个实施方式中，本公开包括包含了编码由本文所述的方法工程改造的抗体分子的核酸分子的载体。在一个实施方式中，本公开包括包含了编码由本文所述的方法工程改造的抗体分子的核酸分子的细胞(例如，宿主细胞)。在一个实施方式中，本公开包括制备由本文所述的方法工程改造的抗体分子的方法。

本公开还包括如下编号段落中的任意内容：

1.一种鉴定靶多肽上表位的方法，所述方法包括：

(a)将抗体分子与多种所述靶多肽的变体结合；

(b)获取(例如，富集)多种表现出与所述抗体分子结合降低(例如，结合亲和力降低)的变体；

(c)确定(例如，计算)多种所述获取(例如，富集)的变体中各自的富集评分；

(e)基于所述抗体分子-靶多肽对接模型，鉴定所述靶多肽上能够被所述抗体分子结合的位点；

从而鉴定靶多肽上的表位。

2.如段落1所述的方法，其中步骤(a)包括将所述抗体分子与展示多种所述靶多肽的变体的文库结合。

3.如段落1或2所述的方法，其中步骤(a)包括将所述抗体分子与包含表达(例如，展示)多种所述靶多肽的变体的多种细胞的文库结合。

4.如段落3所述的方法，其中所述多种细胞中的每一种表达所述靶多肽的大约一种独特的变体。

5.如段落3或4所述的方法，其中所述细胞是真核细胞，例如，酵母细胞。

6.如前述段落中任一项所述的方法，其中所述多种变体包括所述靶多肽的一个或多个表面残基上的突变。

7.如前述段落中任一项所述的方法，其中所述多种变体包括所述靶多肽的选定表面残基上的不同突变。

8.如前述段落中任一项所述的方法，其中所述多种变体包括多种所述靶多肽的选定表面残基上每一种的不同突变。

9.如前述段落中任一项所述的方法，其中相对于所述靶多肽的野生型氨基酸序列，所述多种变体包括单氨基酸取代。

10.如前述段落中任一项所述的方法，其中相对于所述靶多肽的野生型氨基酸序列，所述多种变体各自包括单氨基酸取代。

11.如段落9或10所述的方法，其中所述单氨基酸取代发生在所述靶多肽的表面残基处。

12.如前述段落中任一项所述的方法，其中相对于检测到的野生型靶多肽和所述抗体的所述结合，所述降低结合包括检测到的所述变体和所述抗体分子结合的降低。

13.如前述段落中任一项所述的方法，其中步骤(b)包括获得(例如，富集)变体，其表现出少于约80％(例如，少于约0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、20％、30％、40％、50％、60％、70％或80％)的野生型靶多肽表现出的所述抗体分子结合。

14.如段落13所述的方法，其中所述降低的结合是至少约20％(例如，至少约20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％)的所述野生型靶多肽表现出的结合。

15.如前述段落中任一项所述的方法，其中步骤(b)包括获得(例如，富集)细胞，其表现出少于约80％(例如，少于约0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、20％、30％、40％、50％、60％、70％或80％)的包含野生型靶多肽的细胞表现出的所述抗体分子结合。

16.如段落15所述的方法，其中所述降低的结合是至少约20％(例如，至少约20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％)的所述包含所述野生型靶多肽的细胞表现出的结合。

17.如前述段落中任一项所述的方法，其中步骤(b)包括对表现出与所述抗体分子结合降低的变体进行一次或多次，例如，两次、三次、四次、五次、六次、七次、八次、九次、十次或更多次富集。

18.如前述段落中任一项所述的方法，其进一步包括，例如，在步骤(c)之前，例如，通过测序所述编码变体的基因，例如，通过下一代测序，鉴定所述表现出与所述抗体分子结合降低的变体。

19.如前述段落中任一项所述的方法，其中步骤(c)包括确定多种所述获得的(例如，富集的)变体的每一个的出现频率。

20.如段落19所述的方法，其中步骤(c)进一步包括总计所述在特定残基处的包含不同突变的各个变体出现的频率和/或对具有更高出现频率的变体进行重度加权。

21.如前述段落中任一项所述的方法，其中所述富集评分对所述靶多肽的所述氨基酸序列的单个残基是特异的。

22.如前述段落中任一项所述的方法，其中每个富集评分对所述靶多肽的所述氨基酸序列的不同单个残基是特异的。

23.如前述段落中任一项所述的方法，其进一步包括用靶多肽的多种变体的重复重复步骤(a)-(c)至少一次(例如，一次、两次、三次、四次、五次或更多)，且其中步骤(c)进一步包括省略一种或多种混杂突变，例如，超过50％重复具有高于30％的富集评分的突变，和超过75％重复具有高于15％的富集评分的突变。

24.如前述段落中任一项所述的方法，其中所述抗体分子-靶多肽对接模型通过添加一种或多种吸引约束来约束，其中所述吸引约束是用于富集评分高于第一预选值的残基。

25.如段落24所述的方法，其中所述第一预选值介于20％和40％之间，例如，介于25％和35％，例如，约30％。

26.如段落24或25所述的方法，其中所述吸引约束包括基于富集评分的线性缩放奖励。

27.如前述段落中任一项所述的方法，其中通过为具有小于第二预选值的富集评分的残基添加排斥约束来约束所述抗体分子-靶多肽对接模型。

28.如段落27所述的方法，其中所述第二预选值介于5％和20％之间，例如，介于10％和15％，例如，约12.5％。

29.如前述段落中任一项所述的方法，其中步骤(d)包括在所述抗体分子模型和所述靶多肽模型之间生成对接姿势。

30.如前述段落中任一项所述的方法，其中步骤(d)包括在所述抗体分子模型和所述靶多肽模型之间生成多种对接姿势。

31.如段落30所述的方法，其中步骤(d)进一步包括根据对接算法，例如，SnugDock，对多种对接姿势评分。

32.如段落31所述的方法，其中步骤(d)进一步包括选定具有最高评分的多个对接姿势子集，例如，最高评分1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、300、400、500、600、700、800、900、1000或更多的对接姿势。

33.如段落32所述的方法，其中步骤(d)进一步包括使用所述选定子集的多种对接姿势生成整体对接姿势，并设定与所述整体对接姿势一致的所述抗体分子模型和靶多肽模型。

34.如段落29-33中任一项所述的方法，其中所述抗体分子模型包括衍生自多种抗体同源模型的整体抗体同源模型。

35.如前述段落中任一项所述的方法，其中步骤(d)进一步包括除去抗体分子-靶多肽对接模型，其表现出与已知抗体-抗原复合物非典型的接合模式，例如，根据源自抗体-抗原晶体结构的结构过滤器。

36.如前述段落中任一项所述的方法，其中步骤(d)包括生成多种抗体分子-靶多肽模型。

37.如前述段落中任一项所述的方法，其中步骤(e)包括鉴定能够被所述抗体分子结合的所述靶多肽上的多个位点。

38.一种鉴定靶多肽上表位的方法，所述方法包括：

(i)将所述抗体分子与多种所述靶多肽的变体结合，

(ii)获取(例如，富集)多种表现出与所述抗体分子结合降低的变体，以及

(b)基于所述抗体分子-靶多肽对接模型，鉴定所述靶多肽上能够被所述抗体分子结合的位点；

从而鉴定靶多肽上的表位。

39.一种鉴定抗体分子上互补位的方法，所述方法包括：

(a)将所述抗体分子与多种所述靶多肽的变体结合；

(b)获取(例如，富集)多种表现出与所述抗体分子结合降低的变体；

(c)确定(例如，计算)多种所述富集的变体中各自的富集评分；

(d)生成抗体分子-靶多肽对接模型，其中所述抗体-靶多肽对接模型根据富集评分进行约束；以及

(e)基于所述抗体-靶多肽对接模型，鉴定所述抗体分子上能够被所述靶多肽结合的一个或多个位点；

从而鉴定抗体分子上的互补位。

40.一种鉴定抗体上互补位的方法，所述方法包括：

(a)生成抗体-靶多肽对接模型，其中所述抗体-靶多肽对接模型根据多种富集评分约束，其由一种方法确定(例如，计算)，其包括：

(i)将所述抗体与多种所述靶多肽的变体结合，

(ii)获取(例如，富集)表现出与所述抗体分子结合降低的变体，以及

(iii)确定(例如，计算)所述多种获取(例如，富集)的变体中各自的富集评分；以及

(b)基于所述抗体-靶多肽对接模型，鉴定抗体分子上能够被靶多肽结合的一个或多个位点；

从而鉴定靶多肽上的互补位。

41.一种抗体分子，其所述靶多肽上的表位或所述抗体分子上针对所述靶多肽的互补位根据前述段落中任一项所述的方法鉴定。

42.一种核酸分子，其编码段落41所述抗体分子的一条或多条链(例如，VH和/或VL)。

43.一种包含段落42所述核酸分子的载体。

44.一种宿主细胞，其包含如段落42所述的核酸分子或如段落43所述的载体。

45.一种制备抗体分子的方法，其包括在适合所述抗体分子表达的条件下培养段落44所述宿主细胞。

实施例

实施例1：通过综合性抗原文库的深度测序，结合构象表位映射的抗体-抗原复合物计算建模

为了提高抗体-APRIL模型结构质量，实验衍生的抗原(APRIL)突变数据作为约束纳入到计算对接工作流程中。APRIL突变概况衍生自抗原文库的深度突变扫描，其解决了典型诱变基因型-表型研究的低通量性质，并能够实现对同时影响结合的数千个突变变体的同时测试。该方法的通量能够对表面残基和所有突变(即，不仅仅是Ala)实现更彻底的取样，而且因此提供了有助于抗体结合的抗原残基的更灵敏和完整的表征。

酵母表面展示由于其能够展示构象完整的抗原，且系统易于文库构建和选择，被用于促进综合性突变文库的高通量筛选。与之前的观察一致，发现huAPRIL在酵母表面的生产性表达差。因此，设计了小鼠APRIL(muAPRIL)的嵌合形式，其TACI-结合位点内和周围的表面残基突变为huAPRIL中的等效残基(图1)，以保留TACI和阻断抗体的结合位点。除非另有说明，所得到的嵌合体在本文中称为APRIL。所有人特异性抗-APRIL抗体和TACI均显示与此设计的APRIL结合(图2)，证明其构象的完整性。

包含35-残基的柔性接头(以促进多聚化)的Aga2-APRIL融合蛋白表现出对TACI的强结合(图2)。TACI的结合位点由四级结构组成，在跨两个相邻APRIL单体的界面上有显著的接触。这些结合结果表明在酵母表面上形成了生产性APRIL单体-单体界面。

针对酵母表面表达的APRIL测试小鼠衍生的抗-huAPRIL抗体组。所有抗体都显示出与其和纯化的重组huAPRIL一致的可滴定结合(图2)，进一步支持酵母表面表达的APRIL蛋白的结构完整性。针对APRIL抗体筛选位点饱和诱变的APRIL表面位置的酵母表面展示文库，以生成影响突变的综合性概况，并将该结果用于约束计算抗体-抗原对接(图3)。

实施例2：文库选择和深度测序

使用本文所述的NNK简并性合成单位点饱和诱变文库，且文库的深度测序证实了所有突变在预期位置存在。合成的文库被转化进酵母中，并获得与未突变APRIL类似的表面表达。使用TACI和抗-APRIL抗体组的结合研究表明，大多数文库保留了强结合，少数显示出结合减少或未结合(图4A-4B，前两列)。对表达但不结合的群体进行两轮FACS富集(图4A-4B，最后一列)。然后如本文所述对来自不同结合实验的非结合库进行深度测序。

实施例3：为每种抗体生成突变概况

为了生成每种抗体的定量突变概况，进行生物信息学分析以计算针对每种抗体的每种抗原变体的富集水平，如本文所述。相对于起始文库，在非结合群体中富集的变体代表抗体结合亲和力降低的突变。被认为可能造成结合降低的有两种主要的方法：直接影响，例如与抗体直接接触的侧链，和间接影响，通过全局或局部蛋白质结构改变，而不是源于接触残基的突变引起的。表征过的抗体组识别不同的表位(使用竞争结合实验确定，表2)，这有助于识别可能通过蛋白质结构改变间接影响抗体结合的突变(即，影响大多数或所有抗体的结合)的计算工作。针对所有抗体(图5A-5D)和TACI(图6A)生成所有被查询的APRIL突变的突变概况。

表2：抗体竞争研究结果。(+)表示两种抗体竞争(在竞争ELISA中结合降低＞90％)。

观察到一些APRIL突变在大多数配体上显示出高于背景的富集评分。鉴于从竞争实验中确定的所有抗体的非重叠表位(表2)，这种对许多抗体结合的混杂效应可能代表了通过间接机制降低结合造成的假阳性。基于所有样品的富集映射的检查(参见辅助信息)，确定鉴定混杂突变用以去除的阈值。

观察到混杂突变的一个说明性实例V132突变为Asp或Glu。这些突变导致对于除3530以外的所有配体都有高富集评分(图7)，包括对与TACI的两个生物学复制样本结合有显著影响。TACI在与APRIL的复合物中的结构分析清晰地表明，这些残基不与TACI接触且不预期对结合造成直接影响。值得注意的是，发现残基V132位于两个单体之间的界面上，且与另一个单体上的E182结构上相邻。V132突变为Asp或Glu可能导致了与E182的静电排斥，使APRIL的四级结构不稳定，从而间接影响了与配体组的结合。即使V132突变为负电荷残基消融了与大多数抗体的结合，但突变为多种其他氨基酸导致仅对于抗体2419的特异性结合降低(图7)。在这种情况下，突变的V132D和V132E被认为是假阳性，从进一步地考虑中除去，且不包括在总残基富集的计算中。

实施例4：突变概况的分析

除3530外，所有的样品都显示出2到6个位置，其突变为大多数破坏结合的其他氨基酸(图5)。如同预期，一些位置，例如针对TACI结合评估的R197(图6A)，对Ala突变的富集评分低，但对于突变为其他氨基酸敏感，证明了通过位点饱和诱变更彻底地询问每个位置的益处。

对照蛋白TACI的突变概况在其已知的与muAPRIL共结晶结构的背景下分析。由于富集水平预计与对结合的影响程度有关，保留了用于分析和结构可视化的定量信息。富集评分被映射到APRIL表面用于可视化，显示出由8个残基构成的明确定义的斑块，最高富集评分的残基位于表位中心(图6B)，与X-射线结构良好一致。这些位置是在APRIL二聚体界面上发现的；在一个单体上发现了残基F167、V172、R186、1188和R222，以及在相邻的单体上发现了R197、Y199和H232，再次证明了在酵母表面表达的APRIL形成了生产性单体-单体界面。在表位外周发现的四个残基(T183、D123、S192和E196)显示具有与非表位残基无法区分的富集评分(图6C)，表明在这些位置具有突变耐受性。总体上，TACI的突变概况结果与来自共结晶结构数据的结构概况紧密匹配。

对于每个抗体，突变概况数据在APRIL的表面上可视化(对于所有链)，高评分的位置也被观察到聚集成表面斑块，表明每个抗体可能的表位区域(图5)。与TACI相似，当目测检查时，抗体2419的表位区域显示由源自不同单体的残基在二聚体界面形成的表面斑块。当观察表面时，抗体4035和4540的高残基富集的斑块似乎比2419更大更分散。映射清晰度的差异部分由于同源寡聚体APRIL分子的对称性和形状。不同APRIL单体上的等效残基位置非常接近分子的顶点(图8)，使得顶点结合分子的斑块表现得大得多，如4035。

与抗体3530识别APRIL的N-末端线性表位一致，只有APRIL的N-末端的两个残基显示出高富集评分，在muAPRIL的X-射线结构中二者都未被解析。这与针对APRIL位点饱和文库测试抗体3530的观察一致，不同于其他抗体和TACI，其独特地显示出非常低的非结合物百分比(图2)。通过与缺失N-末端肽的APRIL结合的结果(图9A-9D)和证明3530与其他抗体缺乏结合竞争的研究(表2)证明了这些结果。

实施例5：计算抗体-抗原对接

实施多步骤对接方法以生成抗体-抗原模型(图10)。为每个针对APRIL的抗体进行全局刚性体对接，使用与其实验衍生的富集评分成比例加权的位点约束；这确保了当与高富集位置进行最大接触时该抗体-抗原姿势是最有利的，而相反地与确定突变不影响结合的位置相互作用是不利的。然后，排名靠前的对接姿势被用作基于整体的局部对接算法SnugDock的输入。所得到的排名前100的模型被预期为在对于抗体-抗原取向通常正确的姿势上富集，这能够实现鉴定在表位和互补位中的接触残基，以及在较低程度上，鉴定表位-互补位残基的相互作用对。基于残基的对接置信评分被计算为选择的模型的分数，在该模型中发现残基与抗体或抗原接触。

实施例6：2419对接模型与晶体结构比较

为了验证对接结果，解析2419和huAPRIL的共结晶结构。与huAPRIL形成复合物的2419的Fab结构域的单晶体结构(残基115-120)以

分辨率测定。在晶体结构中，Fab-APRIL复合物形成了3∶3的分子复合物，与非晶体学假三重对称(non-crystallographicpseudo three-fold symmetry)相关。huAPRIL分子形成了与muAPRIL(PDB：1U5Y)相似的同源三聚体。每个Fab结构域结合在交联两个huAPRIL单体的同源三聚体界面上。由于分辨率低，2419和huAPRIL的侧链没有观察到清晰的电子密度；然而，huAPRIL的结构之前已经作为与BAFF的异源三聚体以高分辨率解析出来(PDB：4ZCH)。先前确定的huAPRIL的结构与2419-huAPRIL的电子密度明确吻合，因此用于建模复合物，能够从高置信的复合物中鉴定huPARIL表位残基。基于电子密度映射，2419相对于huAPRIL的取向是明确的，其允许阐明核心互补残基，尽管由于CDR区域更大的不确定性，无法明确定义外周互补位残基。观察到VH和VL结构域的CDR主要在同源三聚体界面结合单独的huAPRIL单体，其中VH阻塞了TACI结合位点。

对2419对接结果的分析显示，APRIL对接模型的接合模式与天然结构非常一致。获得的大量模型证明了接近天然的抗体-抗原取向，大多数模型(90/100)具有低抗体配体

形成清晰的结合能漏斗(图11A)。抗体配体RMSD通过仅叠加抗原坐标，并随后在抗体框架骨架原子上评估RMSD，提供对接模型和天然结构的严格比较。使用基于抗体配体RMSD的CAPRI-型排名，基于这个单一度量，27/100的模型被认为是中等质量

63/100是可接受质量(L_rms介于

和

之间)，以及10个模型被认为是不正确的。排名靠前的模型相对于天然结构(仅在抗原上叠加)示于图11B，可以观察到与接合模式良好一致。对于2419，具有高实验衍生的富集评分的残基也具有高对接置信评分(图11C)，表明大多数对接模型与那些一经突变即对结合显示出最大影响的残基接触。

虽然对接模型的接合模式与2419的天然结构类似，但建模的HCDR3并未采用类似天然的构象。对于经典CDR，在排名前100的评分模型上计算的平均RMSD为：

和

然而，对于HCDR3，平均RMSD为

排名前10的评分模型的RMSD值如表3所示。

表3：观察到2419的排名前10的对接模型的Ca RMSDs

抗体配体为叠加在抗原残基上之后在抗体框架残基上计算的RMSD。基于抗体框架残基，在叠加之后为六个CDR环(Chothia定义)的每一个计算RMSD。

2419的HCDR3包含11个残基(使用Chothia编号)，通常认为这种长度的环难以准确建模。尽管对2419的HCDR构象准确建模存在挑战，包括仅抗原衍生的实验数据作为建模约束足以指导对接工作流程，以鉴定抗体和抗原相互作用表面的接近正确的接触。

对从2419对接模型确定的表位的分析显示，表面斑块比仅从实验数据得出的斑块详细得多。在从2419天然结构中确定的22个接触表位残基中，有14个突变了，但其中仅发现7个具有高富集评分(＞20％)(图11C)。相较之下，排名靠前的对接模型正确地鉴定了表位上22个接触残基中的21个。排名靠前的对接模型可正确地鉴定2419的表位残基(由图1IC中的星号表示)，即使这些残基未突变或当它们具有低实验确定的富集评分时。

除了鉴定与晶体结构一致的表位残基之外，对接模型还可以提供有价值的互补位信息。即使对互补位没有实验确定的约束，从对接模型中确定的互补位与低分辨率天然结构也具有良好的总体一致性(14个天然互补位残基中有10个对接置信评分＞50％)(图12A-12B)。与表位残基的确定相反，在对接模型中的残基与天然结构中未观察到的抗原发生接触的情况下，鉴定到一些假阳性(3个残基对接评分＞50％)。对于2419，在HCDR3环上发现了这些残基，反映了在正确建模该环构象时的错误。通过采用不正确的构象，对接模型中的HCDR3残基可与在天然结构中未观察到的抗原发生接触。在一些情况下，抗体同源建模(包括在SnugDock中重建模HCDR3)中的错误，加上缺乏明确的实验约束，可能会使互补位映射不如表位映射准确。总体而言，预测的和实际的互补位表面之间存在良好的一致性。

实施例7：约束对对接的影响

该计算工作流程利用漏斗法来缩小与实验数据一致的模型，因此更可能是接近天然的姿势(图13A-13D)。为了评估在工作流程中纳入约束的影响，以2419为例，评估由三种不同方法生成的排名靠前的模型的对接表位结果：(i)不使用实验突变概况数据的全局对接，(ii)使用突变概况数据的全局对接，以及(iii)全对接工作流程(包括基于抗体-抗原界面特征的SnugDock和过滤)。

如同预期，不包括实验衍生约束的全局对接产生多样的对接模型。在此，大多数对接模型预测2419在可视取向上结合APRIL底部附近的某处，但模型之间极少有共识。这产生了具有低总体对接置信评分的映射(图13A)，并且其与2419的实际表位几乎没有相似性(图13D)。在全局对接程序中包括突变概况数据导致更大量过度重叠的姿势集中在真实表位附近，但是仍然观察到相对结合取向的大变化(图13B)。完整对接工作流程的使用，包括整体局部对接组件(SnugDock)，产生近天然姿势的紧密簇(图13C)和与源自晶体结构的表位映射非常相似的表位映射。包括实验衍生的突变概况数据产生近天然结构的清晰的对接漏斗，而进行无约束对接工作流程产生更高数量的非天然模型(图14A-14B)。该结果表明，突变概况数据的纳入可以在选择近天然模型时克服计算对接评分方法的不足。

实施例8：对接模型的分析揭示机械洞察

所有3种抗体的对接模型表明了它们与APRIL的接合模式以及它们阻断TACI结合的方式(图15A-15C)。2419结合二聚体界面，以其重链与APRIL的赤道区域结合，从而堵塞TACI结合位点。4035结合APRIL顶点附近，其重链显示出与TACI结合位点显著相互作用。对于4540，对接模型表明主要是轻链堵塞了TACI结合位点。所有3种抗体的对接模型显示了每种抗体的不同表位，且表位的重叠与竞争结合数据一致，其显示了4540与2419和4035竞争，而2419不与4035竞争(表2)。最佳对接模型的视检显示，所有抗体都可以与抗体的3∶3结合比一致的方式接合APRIL，从而在APRIL同源三聚体的所有3个单体上阻断TACI结合位点。

实施例9：应用于抗体工程改造

对于治疗性抗体开发，与啮齿动物和人类的交叉反应性结合可能是可取的，以促进在啮齿动物模型中更方便的功效和PK/PD测试。因此，建模结果被用于实现合理的工程改造以提高跨物种反应性，作为分子定义的表位和互补位的实用性和准确性的说明。muAPRIL和huAPRIL共享85.6％的序列相同性(图1)，序列差异在muAPRIL的结构上可视化，并在由建模工作流程获得的每种抗体生成的对接置信映射的背景下分析。发现2419表位斑块的非保守突变最少。与其他抗体相比，发现这些突变位于2419表位的外周(图16A)。非保守突变导致氨基酸大小、电荷或疏水性的巨大差异，预期将对抗体结合产生更大影响。

最佳模型复合物中APRIL-2419界面残基的视检显示，两个非保守的人-小鼠突变，Q181R和1219K，位于2419的重链上R54近处(图16B)。推测muAPRIL中181位和219位的两个带正电荷的残基的存在将导致静电排斥以及与2419的HCDR2上Arg54的潜在的空间位阻，且可能是缺乏2419与muAPRIL结合的主要决定因素。HCDR2上R54突变为Asp预测会与muAPRIL中R181和K219的正电荷形成有利相互作用，而不显著影响与人残基Q181和I219的结合。另外，2419的一些其他突变被指定与R54D组合，其中残基被突变为较小氨基酸(T28A、L53V和S56A)以减轻任何潜在的空间位阻，其可能是由muAPRIL中181位和219位较大侧链的存在导致的。这些突变的实验结果表明，2419的所有3种设计的变体都显示显著结合muAPRIL(图16C)，对与huAPRIL的结合仅有轻微影响(图17)。这些结果表明，该工作流程生成的抗体-抗原结构模型的质量足以促进结构指导的抗体重新设计。

实施例10：材料和方法

APRIL突变位置选择

简言之，使用同源三聚体小鼠APRIL(PDB：1XU1)的结构作为指导，通过选择相对侧链表面可及性＞25％挑选表面残基初始子集，并确保蛋白质表面位置的表面覆盖均匀。挑选结构中解析的46个表面位置，并且选择在未解析的蛋白质N-末端的另外两个残基用作突变询问(在图1中的APRIL的序列和结构上突出显示)。设计并合成(IDT)位点饱和文库，在每个待改变位置上使用NNK简并密码子。

酵母文库构建和FACS选择

如前所述进行酵母表面展示。简言之，使用小鼠序列(残基96-241)设计嵌合APRIL基因，该序列在TACI结合位点内及其周围的5个位置突变为人APRIL(huAPRIL)基因中发现的氨基酸(A120D、H163Q、R181Q、K219I、N224R)(也见图1A)。PCR扩增合成APRIL基因的简并(NNK)文库并用线性化表达载体共转化到EBY100酵母中并如前所述培养。表达APRIL文库的酵母暴露于80％最大结合对应浓度的抗体中，用针对测试抗体和酵母APRIL表面表达标签Myc的荧光抗体染色，并用BD FACSAria分选。选择显示cMyc表达且与非突变的APRIL结合更低的酵母。进行两轮FACS，所富集的文库的APRIL基因被PCR扩增并由Illumina MiSeq2x75PE(Genewiz)测序。

下一代测序(NGS)分析

简言之，组装高质量的读数，选择包含相对于模板基因(APRIL)的单氨基酸改变的读数用于进一步分析。以类似前述的方式计算每种突变的富集评分，代表FACS后在非结合库中发现的来自表达子库的突变的分数。

高质量读数与模板基因(APRIL)比对，除去包含N’、插入缺失和碱基取代＞10的读数。核苷酸读数被转换为氨基酸读数，那些相对于模板基因包含终止密码子、非预期位置的突变或超过一个氨基酸取代的读数被去除。将正向和反向氨基酸读数合并，并且如果观察到多于1个取代，或如果在重叠区域上的序列不一致，就将合并读数除去。每个样本中的每个突变的中位数为1,845，其范围为453(第5个百分位数)到7,760(第95个百分位数)。观察到少于100个读数的突变被从考虑中去除。以类似前述的方式计算每个突变的富集评分，对于在非结合库中收集的各样品，样品中位置依赖性突变的出现频率由该突变在表达子(expresser)库中的出现频率归一化，并由在非结合库中发现的变体的分数按如下缩放：

其中

是给定氨基酸(aa)在样品(s)的位置(p)上的富集评分，NB^s是在非结合库中发现的变体的分数(库大小)，以及f_p，aa是在样品(s)的非结合库中或表达子库(wt)中所观察到的氨基酸的位置频率。因此，富集评分表示FACS之后在非结合库中发现的来自表达子库的突变的分数(本文中表示为百分比)。

Pro、Gly或Cys突变被从进一步的分析中除去，因为它们是被预测会引入或除去N-糖基化位点的突变。被观察到影响大多数蛋白质的结合的突变被除去，因为这些突变更有可能通过间接影响例如改变三级或四级结构发挥作用。通过总计在对应位置的各突变的影响为每个残基计算总富集评分。具有更高富集评分的残基对于结合的突变反映更敏感，表明该位置更可能是表位的一部分。对于这项研究，超过50％的样本具有＞30.0％富集评分的突变和超过75％的样本具有＞15.0％富集评分的突变被从进一步分析中除去(“混杂效应”，对蛋白质折叠的全局影响)，导致本研究中可能的816个突变中除去68个。

虽然富集评分是为多种单点突变计算的，但在确定残基是否为表位的一部分时，必须考虑每个位置的突变数据的总和。通过总计在对应位置的各突变的影响为每个残基计算总富集评分。富集评分如下计算：

其中N_p，aa是过滤后在给定位置的氨基酸突变数。计算出的总残基富集评分更重度加权显示出大富集评分的突变的影响，并降低显示出低富集评分的突变贡献的权重，而不是每个突变富集评分的简单加和。一旦对每个位置进行计算，残基富集评分被映射到蛋白质表面以促进可视化分析。

抗体和APRIL同源建模

10个结构多样的抗体同源模型选自2,800个模型，这些模型是按照用于模型选择的公开方案中所述指导，使用最新描述的Rosetta抗体同源建模方案生成的(在Rosetta3.8中实现)。同源模型也是用BioLuminate’s(

Release 2016-4：BioLuminate，

LLC，纽约，NY，2016)使用默认设置的抗体同源建模方案生成的。为排名前2的非同源结构模板的每一个生成5个模型，2419的模板是3DGG和3S35，4035的模板是1FLD和4EDW，4540的模板是2E27和5AZ2。

使用muAPRIL(PDB：1XU1)的结构作为模板，用Rosetta为抗原，APRIL生成了同源模型。使用fixbb设计方案在APRIL中引入相对于muAPRIL存在的5个突变，确保在同源三聚体中的每个链上进行恰当的突变。然后在Rosetta中完成使用松弛方案生成抗原结构的整体，基于其Rosetta总评分，从100个松弛的结构中选择25个最低评分模型。

具有约束的全局对接

简言之，全局刚性体对接是使用PIPER在BioLuminate中实施进行的，如使用默认设置并纳入高置信富集评分作为位点约束。在观察到突变后会对结合有显著影响的位点(本文中定义为残基富集评分＞30.0％)添加吸引约束，在突变后对结合有最小影响的位点(本文中定义为残基富集评分＜12.5％)添加排斥约束。为输入的20个抗体同源模型的每一个进行全局对接，生成总计600个对接姿势(每个样品获得30个代表聚类中心的姿势)。

计算“表位评分”以评估在每个对接模型和实验测定的富集评分之间一致水平，使用以下公式：

其中ES是表位评分，N是具有约束的位点数量，c_p是在位置p处的约束，E_p是位置p处实验衍生的富集评分(如前所述计算)。对于每种抗体，600个对接模型通过表位评分排序，并选择排名前25的模型作为进一步局部对接的起始模板。

使用SnugDock局部对接

在全局对接之后，使用最新描述的方案使用整体SnugDock(Ensemble SnugDock)(在Rosetta 3.8中实施)进行局部对接。将20个抗体同源模型作为抗体结构的整体。通过BioLuminate生成的同源模型首先使用Rosetta进行松弛，以确保所有模型都由相同的力场生成并与其一致。排名前25的全局对接姿势被用作整体SnugDock的起始输入坐标，并且为每个输入生成200个对接模型，从而产生总计5,000个对接模型。与PIPER一样，基于富集评分对接约束被用于SnugDock。为了说明同源三聚体的对称性，将Rosetta模糊位点约束(使用S形函数)应用于抗原残基，以允许它们源自APRIL的任一单体。在局部对接中受约束的残基组等同于在全局对接中受约束的残基组。

通过SnugDock生成的对接姿势被过滤以除去具有非典型抗体-抗原界面的模型。获得了公开可用的抗体-蛋白质复合物的非冗余数据库，⁴并对其进行了整理以去除界面附近有缺失区域的结构，或界面处有配体或翻译后修饰的复合物。对于所得到的297个复合物，计算了关键界面特性的结构特征分布，包括接合表位的CDR和框架残基的数量，参与相互作用的CDR环的数量和类型，表位残基的数量，被掩盖的表面积和成对残基倾向(表1)。根据经验选择适当的阈值，以使得95.2％的天然结构失败不超过一个结构过滤器。计算出的过滤器和其阈值列于表1。计算每个对接模型的界面特性，超过一个结构过滤器失败的模型被除去。剩余的对接模型基于表位映射评分过滤(如全局对接所述)。由于表位外周的残基可能预期为对突变更耐受，对接模型被允许与少量具有低富集评分的残基接触；此处我们去除具有富集评分＜观察到的最大表位映射的80％的模型。剩余的对接模型基于界面能量(Isc)排序，如使用Rosetta计算的。

竞争ELISA

将生物素化的测试抗体(固定为50ng/mL)和未标记的竞争抗体(从10,000ng/mL开始的8点系列稀释)以0.1μg/孔的量转移到预包被有人APRIL的孔中。洗涤板并加入链霉亲和素-辣根过氧化物酶，然后洗涤并使用3，3’，5，5’-四甲基联苯胺底物进行显色。观察到生物素化的测试抗体结合的部分或完全降低，表明抗体之间对于结合重叠或相邻的表位存在竞争。如果即使存在比测试抗体200倍摩尔过量(10,000比50ng/m1)也无法阻断＞90％的结合信号，则抗体被归类为“非竞争性”抗体。

制备，结晶和结构测定

人APRIL(残基105-250，(His)₆表位标签)和小鼠抗体2419在Expi293细胞中重组表达，并分别使用镍或蛋白质A亲和层析纯化。通过木瓜蛋白酶消化生成2419的Fab片段。APRIL和Fab在溶液中形成3∶3复合物(通过尺寸排阻色谱法确定)并纯化该复合物。使用2.2M硫酸铵、160mM硝酸铵、4％乙二醇和1mM NiCl₂作为沉淀剂获得衍射级晶体。大多数晶体的衍射分辨率仅达到

并且使用20-36％的乙二醇作为冷冻保护剂，在100K下从晶体中收集了完整的X射线衍射数据集(表4)。

表4：X-射线数据收集和优化参数。

高分辨率壳。

自旋函数表明存在假三重对称，证实了3∶3APRIL-Fab复合物与这种假三重对称有关。该结构通过分子置换解析，使用基于小鼠APRIL同源三聚体晶体结构(PDB 1U5Y)和Fab结构生成的同源三聚体APRIL模型，获得了包含结合到APRIL同源三聚体的三个Fab分子的独特结构解析。最终的优化统计示于表4。

其他示例性方法描述于Wollacott等.，JMol Recognit.2019；32(7)：e2778，其内容通过引用全文纳入本文。

通过引用纳入

本文提到的所有出版物、专利和登记号在此通过引用全文纳入本文，如同每个单独的出版物或专利被明确单独指明通过引用纳入。

等同形式

尽管讨论了本发明的具体实施方式，但以上说明书仅为说明性而非限制性的。本领域的技术人员阅读了本说明书和所附权利要求后将清楚了解本发明的许多变化。本发明的全部范围应该通过参考所附权利要求书连同其等同物的全部范围，以及说明书连同此类变化来确定。

Claims

1.一种鉴定靶多肽上表位的方法，所述方法包括：

(a)将抗体分子与多种所述靶多肽的变体结合；

(b)获取(例如，富集)多种表现出对所述抗体分子结合降低(例如，结合亲和力降低)的变体；

(d)生成抗体分子-靶多肽对接模型，其中所述抗体分子-靶多肽对接模型根据所述富集评分约束；且

从而鉴定靶多肽上的表位。

2.如权利要求1所述的方法，其中步骤(a)包括将所述抗体分子与展示多种所述靶多肽的变体的文库结合。

3.如权利要求1或2所述的方法，其中步骤(a)包括将所述抗体分子与包含表达(例如，展示)多种所述靶多肽的变体的多种细胞的文库结合。

4.如权利要求3所述的方法，其中所述多种细胞中的每一种表达所述靶多肽的大约一种独特的变体。

5.如权利要求3或4所述的方法，其中所述细胞是真核细胞，例如，酵母细胞。

6.如前述权利要求中任一项所述的方法，其中所述多种变体包括所述靶多肽的一个或多个表面残基上的突变。

7.如前述权利要求中任一项所述的方法，其中所述多种变体包括所述靶多肽的选定表面残基上的不同突变。

8.如前述权利要求中任一项所述的方法，其中所述多种变体包括多种所述靶多肽的选定表面残基上每一种的不同突变。

9.如前述权利要求中任一项所述的方法，其中相对于所述靶多肽的野生型氨基酸序列，所述多种变体包括单氨基酸取代。

10.如前述权利要求中任一项所述的方法，其中相对于所述靶多肽的野生型氨基酸序列，所述多种变体各自包括单氨基酸取代。

11.如权利要求9或10所述的方法，其中所述单氨基酸取代发生在所述靶多肽的表面残基处。

12.如前述权利要求中任一项所述的方法，其中相对于检测到的野生型靶多肽和所述抗体的结合，所述结合降低包括检测到的所述变体和所述抗体分子结合的降低。

13.如前述权利要求中任一项所述的方法，其中步骤(b)包括获得(例如，富集)表现出少于约80％(例如，少于约0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、20％、30％、40％、50％、60％、70％或80％)的野生型靶多肽表现出的所述抗体分子结合的变体。

14.如权利要求13所述的方法，其中所述结合降低是至少约20％(例如，至少约20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％)的所述野生型靶多肽表现出的结合。

15.如前述权利要求中任一项所述的方法，其中步骤(b)包括获得(例如，富集)表现出少于约80％(例如，少于约0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、20％、30％、40％、50％、60％、70％或80％)的包含野生型靶多肽的细胞表现出的所述抗体分子结合的细胞。

16.如权利要求15所述的方法，其中所述结合降低是至少约20％(例如，至少约20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％)的所述包含所述野生型靶多肽的细胞表现出的结合。

17.如前述权利要求中任一项所述的方法，其中步骤(b)包括对表现出与所述抗体分子结合降低的变体进行一次或多次，例如，两次、三次、四次、五次、六次、七次、八次、九次、十次或更多次富集。

18.如前述权利要求中任一项所述的方法，其进一步包括，例如，在步骤(c)之前，例如，通过测序编码所述变体的基因，例如，通过下一代测序，鉴定所述表现出与所述抗体分子结合降低的变体。

19.如前述权利要求中任一项所述的方法，其中步骤(c)包括确定多种所述获得的(例如，富集的)变体的每一个的出现频率。

20.如权利要求19所述的方法，其中步骤(c)进一步包括总计所述在特定残基处的包含不同突变的各个变体出现频率和/或对具有更高出现频率的变体进行重度加权。

21.如前述权利要求中任一项所述的方法，其中所述富集评分对所述靶多肽的所述氨基酸序列的单个残基是特异的。

22.如前述权利要求中任一项所述的方法，其中每个富集评分对所述靶多肽的所述氨基酸序列的不同单个残基是特异的。

23.如前述权利要求中任一项所述的方法，其进一步包括用靶多肽的多种变体的重复重复步骤(a)-(c)至少一次(例如，一次、两次、三次、四次、五次或更多)，且其中步骤(c)进一步包括省略一种或多种混杂突变，例如，超过50％重复具有高于30％的富集评分的突变，和超过75％重复具有高于15％的富集评分的突变。

24.如前述权利要求中任一项所述的方法，其中所述抗体分子-靶多肽对接模型通过添加一种或多种吸引约束来约束，其中所述吸引约束是用于富集评分高于第一预选值的残基。

25.如权利要求24所述的方法，其中所述第一预选值介于20％和40％之间，例如，介于25％和35％，例如，约30％。

26.如权利要求24或25所述的方法，其中所述吸引约束包括基于富集评分的线性缩放奖励。

27.如前述权利要求中任一项所述的方法，其中通过为具有小于第二预选值的富集评分的残基添加排斥约束来约束所述抗体分子-靶多肽对接模型。

28.如权利要求27所述的方法，其中所述第二预选值介于5％和20％之间，例如，介于10％和15％，例如，约12.5％。

29.如前述权利要求中任一项所述的方法，其中步骤(d)包括在所述抗体分子模型和所述靶多肽模型之间生成对接姿势。

30.如前述权利要求中任一项所述的方法，其中步骤(d)包括在所述抗体分子模型和所述靶多肽模型之间生成多种对接姿势。

31.如权利要求30所述的方法，其中步骤(d)进一步包括根据对接算法，例如，SnugDock，对多种对接姿势评分。

32.如权利要求31所述的方法，其中步骤(d)进一步包括选定具有最高评分的多个对接姿势子集，例如，最高评分1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、300、400、500、600、700、800、900、1000或更多的对接姿势。

33.如权利要求32所述的方法，其中步骤(d)进一步包括使用选定子集的多种对接姿势生成整体对接姿势，并设定与所述整体对接姿势一致的所述抗体分子模型和靶多肽模型。

34.如权利要求29-33中任一项所述的方法，其中所述抗体分子模型包括衍生自多种抗体同源模型的整体抗体同源模型。

35.如前述权利要求中任一项所述的方法，其中步骤(d)进一步包括除去抗体分子-靶多肽对接模型，其表现出与已知抗体-抗原复合物非典型的接合模式，例如，根据源自抗体-抗原晶体结构的结构过滤器。

36.如前述权利要求中任一项所述的方法，其中步骤(d)包括生成多种抗体分子-靶多肽模型。

37.如前述权利要求中任一项所述的方法，其中步骤(e)包括鉴定能够被所述抗体分子结合的所述靶多肽上的多个位点。

38.一种鉴定靶多肽上表位的方法，所述方法包括：

(a)生成抗体-靶多肽对接模型，其中所述抗体-靶多肽对接模型根据多种富集评分约束，其由一种方法确定，其包括：

(i)将所述抗体与多种所述靶多肽的变体结合，

(ii)获取(例如，富集)多种表现出降低与所述抗体分子结合的变体，以及

(b)基于所述抗体-靶多肽对接模型，鉴定所述靶多肽上能够被所述抗体分子结合的位点；

从而鉴定靶多肽上的表位。

39.一种鉴定抗体分子上互补位的方法，所述方法包括：

(a)将所述抗体分子与多种所述靶多肽的变体结合；

(b)获取(例如，富集)多种表现出降低与所述抗体分子结合的变体；

(d)生成抗体-靶多肽对接模型，其中所述抗体-靶多肽对接模型根据富集评分进行约束；以及

从而鉴定抗体分子上的互补位。

40.一种鉴定抗体上互补位的方法，所述方法包括：

(i)将所述抗体与多种所述靶多肽的变体结合，

(b)基于所述抗体分子-靶多肽对接模型，鉴定抗体分子上能够被靶多肽结合的一个或多个位点；

从而鉴定靶多肽上的互补位。

41.一种抗体分子，其所述靶多肽上的表位或所述抗体分子上针对所述靶多肽的互补位如前述权利要求中任一项所述的方法鉴定。

42.一种核酸分子，其编码权利要求41所述抗体分子的一条或多条链(例如，VH和/或VL)。

43.一种包含权利要求42所述核酸分子的载体。

44.一种宿主细胞，其包含如权利要求42所述的核酸分子或如权利要求43所述的载体。

45.一种制备抗体分子的方法，其包括在适合所述抗体分子表达的条件下培养权利要求44所述宿主细胞。