CN117015302A

CN117015302A - 抗原特异性抗体的鉴定和产生

Info

Publication number: CN117015302A
Application number: CN202180068573.6A
Authority: CN
Inventors: 刘亚孰; 郭春光; 章乾; 娜塔莎·利文柯娃; 安德鲁·J·玛菲; 威廉·奥森
Original assignee: Regeneron Pharmaceuticals Inc
Current assignee: Regeneron Pharmaceuticals Inc
Priority date: 2020-09-11
Filing date: 2021-09-10
Publication date: 2023-11-07

Abstract

公开了一种从进行免疫接种的基因修饰的非人类哺乳动物获得编码对特定抗原具有特异性的抗体的免疫球蛋白可变结构域的核苷酸序列的方法。还公开了一种制造针对特定抗原的抗体的方法。

Description

抗原特异性抗体的鉴定和产生

相关申请的交叉引用

本申请要求2020年9月11日提出的美国临时专利申请第63/077133号和2020年9月11日提出的美国临时专利申请第63/077140号的权益，两者的内容以引用的方式整体并入本文中。

发明领域

提供了用于获得编码对抗原具有特异性的抗体氨基酸序列，例如可变结构域氨基酸序列的核酸的方法。公开了如下方法，其包括从进行免疫接种的宿主获得编码来自第一样品的抗体序列和来自第二样品的针对所关注抗原的多种抗体的核酸序列，以获得编码对抗原具有特异性的人免疫球蛋白可变结构域或其部分的核苷酸序列。还公开了制造针对所关注抗原的抗体的方法。

背景技术

抗体通常包含重链组分，其中每个重链单体与轻链缔合，这些链的可变结构域组合形成抗原结合位点。抗体，尤其是单克隆抗体，在诊断和治疗中具有广泛的用途。

两种传统的方法已用于制备单克隆抗体：杂交瘤技术和DNA展示(例如，在噬菌体、酵母或细菌系统中)。在杂交瘤技术中，来自免疫动物的B细胞通常与骨髓瘤细胞系融合，产生分泌抗原的杂交瘤系。分离产生所关注的单克隆抗体的细胞，在培养物中生长，并纯化所得到的所需抗体。高质量的纯化对于去除污染物来说至关重要。因此，由于杂交瘤培养的生产量有限，故通过杂交瘤技术分离抗体效率不高。

展示技术涉及从噬菌体、酵母或哺乳动物文库中产生先导候选抗体。虽然可利用从表达抗体的B细胞中直接分离DNA，但DNA文库在例如噬菌体、酵母或细菌系统的细胞表达系统中表达，然后“淘选”或滴定以选择具有高亲和力的抗体。展示技术可提供高质量的蛋白质文库，但它们提供的多样性有限。因此，基于体外诱变的亲和力成熟通常是产生源自这类文库的高亲和力抗体的下一步。

此外，抗体通常从血浆、血清、腹水、细胞培养基和细菌培养物中表达和分离。这些都是含有大量污染物的来源。因此，从这些来源中有效地纯化抗体是必要的。因此，所属领域仍然需要有效地产生和分离对靶抗原具有必需特异性和结合亲和力的抗体。

发明内容

本公开尤其描述了使用质谱法(“MS”)与下一代测序(“NGS”)的组合获得抗体的方法。还公开了制备抗体的方法。

所提供的方法能够有效地鉴定和/或选择抗体、尤其是来自已经用所关注的抗原进行免疫接种的宿主(例如，基因修饰的非人类动物，例如啮齿动物)的抗体的人免疫球蛋白可变结构域序列和/或互补决定区(CDR)序列。在一些实施方案中，所提供的方法包括将宿主的多个抗体序列(例如，由NGS产生的抗体序列的文库)与和/或针对来自宿主的抗体肽的MS分析进行比较和/或询问的步骤。如本文使用的“数据库”可以是示例性“文库”。

在一些实施方案中，所提供的方法包括从用所关注的抗原进行免疫接种的宿主(例如从非人类动物，例如啮齿动物的B细胞)获得和/或产生多个免疫球蛋白可变结构域和/或CDR序列(例如文库)。在一些实施方案中，抗体序列的文库包含通过NGS获得的多个核酸序列。在一些实施方案中，抗体序列的文库包含多个CDR3序列。

在一些实施方案中，所提供的方法包括对从已经用所关注的抗原进行免疫接种的宿主(例如啮齿动物)获得的抗体样品的MS分析。本公开涵盖如下的认识，即，可在体内和/或离体针对期望特征对用于MS分析的抗体样品进行富集。举例来说，可基于体内定位富集抗体样品。因此，在一些实施方案中，抗体样品可以从宿主内的任何期望来源，例如血清、血浆、淋巴器官、肠、脑脊髓液、脑、脊髓、胎盘或它们的组合获得。在一些实施方案中，可离体针对一种或多种期望特征(例如抗原结合、与细胞的结合等)对抗体样品进行富集。本公开提供了如下的领悟：这类富集与所提供的方法组合使得能够鉴定出通过其它方法难以鉴定的抗体(例如因为以低滴度存在)。在一些实施方案中，本公开提供了一种获得对抗原具有特异性的抗体的人免疫球蛋白可变结构域或互补决定区(CDR)的方法。在一些实施方案中，本文所述的方法包括将来自第一样品的多个人免疫球蛋白可变结构域的氨基酸序列用来自第二样品的抗体群体的重链和/或轻链可变结构域的肽序列进行询问。在一些情况下，进行询问步骤由此获得对所述抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列。在一些实施方案中，询问包括将抗体群体的重链和/或轻链可变结构域的肽序列相互比对和与多个免疫球蛋白可变结构域的氨基酸序列进行比对。

在一些实施方案中，对抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR(例如CDR3)是从用特定抗原进行免疫接种的宿主获得的。在一些实施方案中，宿主是基因修饰的非人类哺乳动物。在一些实施方案中，宿主在其基因组，例如其种系基因组中包含免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段(又称V_H基因区段)、一个或多个人D基因区段(又称人D_H基因区段)和一个或多个人重链J基因区段(又称人J_H基因区段)。在一些实施方案中，重链可变区可操作地连接于恒定区(例如免疫球蛋白重链恒定区)。

在一些实施方案中，宿主在其基因组，例如其种系基因组中包含免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段(又称人V_L基因区段)和一个或多个人轻链J基因区段(又称人J_L基因区段)。在一些实施方案中，轻链可操作地连接于恒定区(例如免疫球蛋白轻链恒定区)。

在一些实施方案中，本文所述的方法包括从来自进行免疫接种的宿主的第一样品获得编码多个人免疫球蛋白可变结构域的多个核酸并确定编码的多个免疫球蛋白可变结构域的氨基酸序列。在一些实施方案中，本文所述的方法包括从进行免疫接种的宿主获得包含针对所述抗原的抗体群体的第二样品并从其中确定抗体群体的重链和/或轻链可变结构域的肽序列。

在一些实施方案中，宿主是啮齿动物，例如大鼠或小鼠。

在一些实施方案中，本公开提供了一种鉴定对抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列(例如CDR3序列)的方法，所述方法包括：(i)获得或确定从样品获得的人免疫球蛋白重链和/或轻链可变结构域的多个肽序列，所述样品包含由用所述抗原进行免疫接种的啮齿动物产生的抗体群体，和(ii)将人免疫球蛋白重链和/或轻链可变结构域序列的文库用通过MS确定的所述多个肽序列进行询问，其中所述文库包含由所述免疫啮齿动物的B细胞编码的多个人免疫球蛋白重链和/或轻链可变结构域序列，由此获得对所述抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列。

在一些实施方案中，本公开提供了一种鉴定对抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列(例如CDR3序列)的方法，所述方法包括：(i)获得人免疫球蛋白重链和/或轻链可变结构域序列的文库，所述文库包含由用所述抗原进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链和/或轻链可变结构域序列，和(ii)将所述文库用从样品获得的人免疫球蛋白重链和/或轻链可变结构域的多个肽序列进行询问，所述样品包含由用所述抗原进行免疫接种的啮齿动物产生的抗体群体。

在一些实施方案中，免疫啮齿动物在其种系基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于恒定区。

在一些实施方案中，免疫啮齿动物在其种系基因组中包含有限免疫球蛋白轻链谱系。在一些实施方案中，免疫啮齿动物在其种系基因组中包含单个重排人轻链V/J。在一些实施方案中，免疫啮齿动物在其种系基因组中包含两个人轻链V基因区段和一个或多个人轻链J区段。

在一些实施方案中，免疫啮齿动物产生包含两条免疫球蛋白重链和两条免疫球蛋白轻链的抗体。在一些实施方案中，免疫啮齿动物不产生单结构域抗体、仅重链抗体和/或纳米抗体。在一些实施方案中，免疫啮齿动物在其种系基因组中包含有限免疫球蛋白重链谱系，例如通用重链。

在一些实施方案中，免疫啮齿动物在其种系基因组中包含CH1缺失修饰。在一些实施方案中，免疫啮齿动物产生单结构域抗体、仅重链抗体和/或纳米抗体。

在一些实施方案中，第一样品(即用于序列分析的样品)包含来自初级或次级淋巴器官的B细胞群体，例如来自骨髓样品和/或脾样品的B细胞、来自淋巴结的B细胞、来自培氏斑(Peyer’s patches)的B细胞等。在一些实施方案中，从第一样品获得编码多个免疫球蛋白可变结构域的多个核酸序列包括从核酸序列制备cDNA并对所述第一样品中的重排重链VDJ序列和/或重排轻链VJ序列进行测序。在一些实施方案中，从第一样品获得编码多个免疫球蛋白可变结构域的多个核酸序列包括使用DNA测序技术，例如下一代DNA测序。

在一些实施方案中，第二样品(即用于分析肽序列的样品)是或包含任何包含抗体的体液。在一些实施方案中，第二样品是或包含血清、血浆、淋巴器官、肠、脑脊髓液、脑、脊髓、胎盘或它们的组合。在一些实施方案中，第二样品肽序列是经由第二样品中的抗体群体的重链和/或轻链可变结构域的质谱(MS)分析(例如通过组合液相色谱法与质谱法(LC-MS))获得的。另外，在一些实施方案中，在质谱分析之前，可对抗体群体的重链和/或轻链可变结构域进行蛋白水解消化。

在一些实施方案中，可以已针对一种或多种期望特征离体对用于分析肽序列的抗体的样品进行富集(例如在MS分析之前)。在一些实施方案中，获得第二样品还包括使第二样品耗竭不针对特定抗原的抗体。在一些实施方案中，获得第二样品还包括使第二样品富集针对特定抗原的抗体。

在一些实施方案中，将来自第一样品的多个免疫球蛋白可变结构域的氨基酸序列用来自第二样品的抗体群体的重链和/或轻链可变结构域的肽序列进行询问包括将抗体群体的重链和/或轻链可变结构域的肽序列与多个免疫球蛋白可变结构域的氨基酸序列进行比对并任选地相互比对。

在一些实施方案中，本文所述的方法包括在第二重组抗体中表达所获得的编码人免疫球蛋白可变结构域的核苷酸序列。在一些实施方案中，编码人可变结构域的核苷酸序列可以在与人免疫球蛋白恒定区呈可操作的连接下在细胞系中进行表达。更具体地说，在一些实施方案中，人可变结构域是在与人免疫球蛋白重链恒定区呈可操作的连接下进行表达以产生人免疫球蛋白重链的人重链可变结构域。在一些实施方案中，人免疫球蛋白重链在具有人免疫球蛋白轻链的细胞系中进行表达。在人可变结构域是人轻链可变结构域的实施方案中，其可以在与人免疫球蛋白轻链恒定区呈可操作的连接下进行表达以产生人免疫球蛋白轻链。在一些实施方案中，人免疫球蛋白轻链在具有人免疫球蛋白重链的细胞系中进行表达。

在一些实施方案中，本文所述的方法还包括在重组抗原结合蛋白中表达所获得的编码人免疫球蛋白可变结构域的核苷酸序列。

在一些实施方案中，重组抗原结合蛋白是人类抗体，例如人类双特异性抗体。

在一些实施方案中，对重组抗原结合蛋白进行纯化。在一些实施方案中，测定纯化的重组抗原结合蛋白对特定抗原的亲和力和/或特异性。

在一些实施方案中，宿主是基因修饰的小鼠，其在其基因组(例如其种系基因组)中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包括一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于鼠恒定区。在一些实施方案中，免疫球蛋白重链可变区可操作地连接于小鼠重链恒定区，和/或免疫球蛋白轻链可变区可操作地连接于小鼠轻链恒定区。更进一步，免疫球蛋白重链可变区可在内源小鼠重链基因座处可操作地连接于小鼠重链恒定区，和/或可操作地连接于小鼠轻链恒定区的免疫球蛋白轻链可变区处于内源小鼠轻链基因座处。

在一些实施方案中，宿主是基因修饰的小鼠，所述基因修饰的小鼠在其基因组中，包括在其种系基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含多个人重链V基因区段、多个人D基因区段和多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠重链恒定区；和可操作地连接于鼠轻链恒定区的免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含仅两个未重排人Vκ基因区段和五个未重排人Jκ基因区段。在一些实施方案中，仅两个未重排人Vκ基因区段是人Vκ1-39基因区段和人Vκ3-20基因区段。

在一些实施方案中，宿主可以是基因修饰的小鼠，其基因组(例如种系基因组)在内源重链基因座处包含：(i)可操作地连接于小鼠重链恒定区的免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含多个未重排人V_H基因区段、多个未重排人D_H基因区段和多个未重排人J_H基因区段；(ii)可操作地连接于小鼠重链恒定区的受限的未重排重链可变区，所述受限的未重排重链可变区包含单个人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段；(iii)通用重链编码序列，所述通用重链编码序列包含可操作地连接于小鼠重链恒定区的单个重排人重链可变区；(iv)可操作地连接于小鼠重链恒定区的经组氨酸修饰的未重排重链可变区，所述经组氨酸修饰的未重排重链可变区包含一个或多个未重排人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段，还包含至少一个组氨酸对非组氨酸残基的取代或插入；(v)仅重链免疫球蛋白编码序列，所述仅重链免疫球蛋白编码序列包含可操作地连接于重链恒定区的免疫球蛋白重链可变区，所述重链可变区包含一个或多个未重排人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段，其中非IgM基因，例如IgG基因缺乏编码功能性CH1结构域的序列；或(vi)可操作地连接于小鼠免疫球蛋白重链恒定区基因的工程化的内源啮齿动物免疫球蛋白重链基因座，所述基因座包含一个或多个未重排人V_L基因区段和一个或多个未重排人J_L基因区段。在一些实施方案中，宿主可以是基因修饰的小鼠，其基因组(例如种系基因组)在内源轻链基因座处包含：(i)可操作地连接于小鼠轻链恒定区的免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含多个未重排人Vκ基因区段和多个未重排人Jκ基因区段；(ii)通用轻链编码序列，所述通用轻链编码序列包含可操作地连接于小鼠轻链恒定区的单个重排人轻链可变区；(iii)可操作地连接于小鼠轻链恒定区的受限的轻链可变区，所述受限的轻链可变区包含两个未重排人Vκ基因区段和一个或多个未重排人Jκ基因区段；或(iv)可操作地连接于小鼠轻链恒定区的经组氨酸修饰的轻链可变区，所述经组氨酸修饰的轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，还包含至少一个组氨酸对非组氨酸残基的取代或插入。

在一些实施方案中，宿主包含功能性ADAM6基因，任选地其中宿主是基因修饰的小鼠并且功能性ADAM6基因是小鼠ADAM6基因。在一些实施方案中，宿主可包含和/或表达外源末端脱氧核苷酸转移酶(TdT)基因。

本公开还提供了获得对抗原具有特异性的抗体的免疫球蛋白可变结构域或CDR的方法，所述方法包括：将来自从用抗原进行免疫接种的宿主获得的样品的抗体群体的重链和/或轻链可变结构域的肽序列相对于包含多个人免疫球蛋白可变结构域的氨基酸序列的文库进行询问，由此获得对抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列。在一些实施方案中，所述方法包括从用抗原进行免疫接种的宿主获得包含针对抗原的抗体群体的样品。在一些实施方案中，所述方法包括确定抗体群体的重链和/或轻链可变结构域的肽序列。

本公开还提供了用于鉴定对特定抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR的方法，所述方法包括：将由多个核酸编码的多个氨基酸序列与包含来自由针对所述抗原的抗体群体产生的轻链和/或重链可变结构域的肽片段的氨基酸序列进行比较，所述多个核酸编码由用所述抗原进行免疫接种的动物产生的多个人免疫球蛋白可变结构域；并且由此鉴定对所述抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列。

在一些实施方案中，进行免疫接种的宿主是基因修饰的非人类哺乳动物，所述基因修饰的非人类哺乳动物在其种系基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段；其中所述重链可变区可操作地连接于恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段；其中所述免疫球蛋白轻链可变区可操作地连接于恒定区。

在一些实施方案中，本公开还提供了从用特定抗原进行免疫接种的宿主获得对所述抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR的方法，所述方法包括：获得由从所述宿主获得的多个核酸序列编码的多个人免疫球蛋白可变结构域的氨基酸序列；确定从进行免疫接种的宿主获得的抗体群体的人重链可变结构域的肽序列；将编码的多个人免疫球蛋白重链可变结构域的氨基酸序列用所述抗体群体的人重链可变结构域的肽序列进行询问，由此获得对所述抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR。在一些实施方案中，宿主是基因修饰的小鼠，所述基因修饰的小鼠在其基因组中，包括在其种系基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含多个人重链V基因区段、多个人重链D基因区段和多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠恒定区：和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区是包含单个人轻链V基因区段和单个人轻链J基因区段的单个重排人轻链可变区，其中所述人免疫球蛋白轻链可变区可操作地连接于鼠轻链恒定区。

在一些实施方案中，单个重排人轻链可变区是包含单个人轻链Vκ基因区段和单个人轻链Jκ基因区段的单个重排人κ轻链可变区。在一些实施方案中，单个人轻链Vκ基因区段是Vκ1-39或Vκ3-20基因区段，并且单个人轻链Jκ基因区段是Jκ1或Jκ5基因区段。在一些实施方案中，单个重排人κ轻链可变区包含Vκ1-39基因区段和Jκ5基因区段。在一些实施方案中，单个重排人κ轻链可变区包含Vκ3-20基因区段和Jκ1基因区段。

在一些实施方案中，鼠轻链恒定区是小鼠κ轻链恒定区。在一些实施方案中，单个重排人轻链可变区可操作地连接于小鼠κ轻链恒定区。在一些实施方案中，单个重排人轻链可变区在内源小鼠κ轻链基因座处可操作地连接于小鼠κ轻链恒定区。

在一些实施方案中，宿主包含功能性ADAM6基因或其片段，任选地其中宿主是基因修饰的小鼠且功能性ADAM6基因是小鼠ADAM6基因。

在一些实施方案中，第一样品包含来自初级或次级淋巴器官的B细胞群体，例如来自骨髓样品和/或脾样品的B细胞、来自淋巴结的B细胞、来自培氏斑的B细胞等。

在一些实施方案中，从第一样品获得编码多个人免疫球蛋白重链可变结构域的多个核酸序列包括从所述核酸序列制备cDNA并对所述第一样品中的重排重链VDJ序列进行测序。

在某些实施方案中，从第一样品获得的编码多个免疫球蛋白可变结构域的多个核酸序列使用DNA测序技术来确定。

在一些实施方案中，第二样品是或包含任何包含抗体的体液。在一些实施方案中，第二样品是或包含血清、血浆、淋巴器官、肠、脑脊髓液、脑、脊髓或胎盘。在一些实施方案中，确定来自第二样品的肽序列包括对第二样品中的抗体群体的重链可变结构域的质谱，例如包括液相色谱和质谱法(LC-MS)分析。本文所述的方法可包括在质谱分析之前对抗体群体的重链可变结构域进行蛋白水解消化。

在一些实施方案中，本文所述的方法包括使第二样品耗竭不针对特定抗原的抗体。在一些实施方案中，本文所述的方法包括使第二样品耗竭针对不同抗原和/或相同抗原(例如用于对宿主进行免疫接种)的不同表位的抗体。在一些实施方案中，本文所述的方法包括使第二样品富集针对所关注的抗原(例如用于对宿主进行免疫接种)的抗体。

在一些实施方案中，将多个人免疫球蛋白重链可变结构域的氨基酸序列用抗体群体的人重链可变结构域的肽序列进行询问包括将抗体群体的重链和/或轻链可变结构域的肽序列与多个免疫球蛋白可变结构域的氨基酸序列进行比对并任选地相互比对。

在一些实施方案中，本公开提供了鉴定对抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列(例如CDR3序列)的方法，所述方法包括：(i)获得从样品获得的人免疫球蛋白重链和/或轻链可变结构域的多个肽序列，所述样品包含由用所述抗原进行免疫接种的啮齿动物产生的抗体群体，和(ii)将人免疫球蛋白重链和/或轻链可变结构域序列的文库用所述多个肽序列进行询问，其中所述文库包含由所述进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链和/或轻链可变结构域序列，由此获得对所述抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列。

在一些实施方案中，本公开提供了鉴定对抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列(例如CDR3序列)的方法，所述方法包括：(i)获得人免疫球蛋白重链和/或轻链可变结构域序列的文库，所述文库包含由用所述抗原进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链和/或轻链可变结构域序列，和(ii)将所述文库用从样品获得的人免疫球蛋白重链和/或轻链可变结构域的多个肽序列进行询问，所述样品包含由用所述抗原进行免疫接种的啮齿动物产生的抗体群体。

在一些实施方案中，免疫啮齿动物在其种系基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含多个人重链V基因区段、多个人D基因区段和多个人重链J基因区段；和包含以下的免疫球蛋白轻链可变区：(i)通用轻链编码序列，所述通用轻链编码序列包含可操作地连接于小鼠轻链恒定区的重排人轻链可变区，所述重排人轻链可变区包含单个人V_L基因区段和单个人轻链J_L基因区段；(ii)可操作地连接于小鼠轻链恒定区的受限的轻链可变区，所述受限的轻链可变区包含两个未重排人V_L基因区段和一个或多个未重排人J_L基因区段；或(iii)可操作地连接于小鼠轻链恒定区的经组氨酸修饰的轻链可变区，所述经组氨酸修饰的轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，还包含至少一个组氨酸对非组氨酸残基的取代或插入。在一些实施方案中，所提供的方法包括获得人免疫球蛋白重链可变结构域序列的文库，所述文库包含由用所述抗原进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链可变结构域序列，和(ii)将所述文库用从样品获得的人免疫球蛋白重链可变结构域的多个肽序列进行询问，所述样品包含由用所述抗原进行免疫接种的啮齿动物产生的抗体群体。

在一些实施方案中，免疫啮齿动物在其种系基因组中包含：可操作地连接于小鼠轻链恒定区的免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含多个未重排人V_L基因区段和多个未重排人J_L基因区段；和包含以下的免疫球蛋白重链可变区：(i)可操作地连接于小鼠重链恒定区的受限的未重排重链可变区，所述受限的未重排重链可变区包含单个人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段；(ii)通用重链编码序列，所述通用重链编码序列包含可操作地连接于小鼠重链恒定区的单个重排人重链可变区，所述单个重排人重链可变区包含单个人V_H基因区段、单个人D_H基因区段和单个人J_H基因区段；或(iii)可操作地连接于小鼠重链恒定区的经组氨酸修饰的未重排重链可变区，所述经组氨酸修饰的未重排重链可变区包含一个或多个未重排人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段，还包含至少一个组氨酸对非组氨酸残基的取代或插入。在一些实施方案中，所提供的方法包括获得人免疫球蛋白轻链可变结构域序列的文库，所述文库包含由用所述抗原进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白轻链可变结构域序列，和(ii)将所述文库用从样品获得的人免疫球蛋白轻链可变结构域的多个肽序列进行询问，所述样品包含由用所述抗原进行免疫接种的啮齿动物产生的抗体群体。

在一些实施方案中，本文所述的方法可包括获得对所述抗原具有特异性的抗体的人重链可变结构域的核苷酸序列并在抗原结合蛋白中表达所获得的编码人免疫球蛋白重链可变结构域的核苷酸序列。在一些实施方案中，抗原结合蛋白是第二(例如重组)抗体。

在一些实施方案中，编码人重链可变结构域的核苷酸序列在与人免疫球蛋白重链恒定区呈可操作的连接下在细胞系中进行表达。在一些实施方案中，人免疫球蛋白重链可在具有人免疫球蛋白轻链的细胞系中表达。在一些实施方案中，人免疫球蛋白轻链可源自与所述小鼠中所存在相同的单个重排可变区序列或其体细胞突变型式。

在一些实施方案中，本文所述的方法包括在重组抗原结合蛋白中表达所获得的编码人免疫球蛋白可变结构域的核苷酸序列。在一些实施方案中，重组抗原结合蛋白是第二重组抗体。在一些实施方案中，第二抗体是人类抗体且可以是双特异性抗体。可对第二抗体进行纯化并确定纯化的第二抗体对特定抗原的亲和力和/或特异性。

在一些实施方案中，用于确定重链和/或轻链可变结构域的肽序列的样品是或包含任何包含抗体的体液。在一些实施方案中，第二样品是或包含血清、血浆、淋巴器官、肠、脑脊髓液、脑、脊髓或胎盘或它们的组合。在一些实施方案中，确定重链和/或轻链可变结构域的肽序列包括进行MS分析(例如LC/MS分析)。在一些实施方案中，确定重链和/或轻链可变结构域的肽序列包括对包含从用抗原进行免疫接种的宿主获得的抗体的样品进行MS分析(例如LC/MS分析)。

在一些实施方案中，包含多个人免疫球蛋白可变结构域的氨基酸序列的文库由从用抗原进行免疫接种的宿主获得的多个核酸编码。在一些实施方案中，包含多个人免疫球蛋白可变结构域的氨基酸序列的文库由从B细胞样品，例如骨髓和/或脾样品获得的多个核酸编码。

从以下详细描述中，结合随附权利要求书，将更完全地了解本公开中所提供的这些和其它特征和优点。应注意，权利要求书的范围由其中的叙述界定，而非由本说明书中所阐述的特征和优点的特定论述界定。

附图说明

图1包括使用LC-MS与下一代测序联合针对示例性所关注的抗原获得抗体的示例性方法的示意性概述。

图2A和2B包括展示在从用CD22进行免疫接种的小鼠供体的脾和骨髓获得的IgG中人重链V(图2A)和J(图2B)基因使用的多样性的图，描述为序列％(Y轴)。

图3A和3B展示了如通过下一代测序分析所确定，(图3A)在来自不同小鼠的脾中(约2％重叠)和(图3B)在来自同一小鼠的骨髓和脾中(10-14％重叠)的HCDR3重叠。

图4展示了基于来自一组含有同源CDR3序列的Ab的质谱匹配和NGS计数选择抗CD22抗体的实例。图4顶部是抗CD22抗体重链可变结构域的序列；虚线框描绘CDR1、CDR2和CDR3序列(分别从左到右)。下划线指示来自质谱分析的序列覆盖度，CDR1覆盖度是100％，CDR2覆盖度是0％，CDR3覆盖度是100％。

图5展示了基于从通用轻链小鼠获得的所描绘的CDR3序列的抗体多样化。根据抗体CDR3序列的差异对抗体进行分组，并选择多样谱系用于进一步克隆和表征。

具体实施方式

本公开提供了使用质谱法和下一代测序的组合获得具有人可变结构域的抗体的方法。本公开还提供了用于制备抗体的方法。

某些定义

如根据本公开所使用，除非另有指示，否则以下术语应理解为具有以下含义。除非上下文另有要求，否则单数术语应包括复数，并且复数术语应包括单数。

此外，除非上下文另有明确规定，否则单数形式“一(a/an)”和“所述”包括多个提及物。因此，例如，对“一种方法”的提及包括一种或多种方法，和/或本文所描述和/或所属领域的技术人员在阅读本公开后将变得显而易见的类型的步骤。

术语“约”或“大约”包括在一个值的有意义的范围内。术语“约”或“大约”所涵盖的容许变化取决于所研究的特定系统，并且可以为所属领域的普通技术人员容易理解。

术语“抗原”是指当引入免疫活性宿主时被宿主的免疫系统识别且引发宿主的免疫反应的任何试剂(例如蛋白质、肽、多糖、脂质、糖蛋白、糖脂、核苷酸、核酸、聚合物和/或它们的一部分或组合)。在一些实施方案中，抗原引发体液反应(例如，包括抗原特异性抗体的产生)。

术语“抗体”、“抗原结合蛋白”或“表位结合蛋白”等是指单克隆抗体、IgA、IgG、IgE或IgM抗体、多特异性抗体、人类抗体、人源化抗体、嵌合抗体、反向嵌合抗体、重链上有轻链可变基因区段的抗体、轻链上有重链可变基因区段的抗体，以及单链Fv(scFv)、单链抗体、Fab片段、F(ab')片段、二硫键连接的Fv(sdFv)、胞内抗体、微型抗体、双功能抗体和抗独特型(抗Id)抗体(包括例如针对抗原特异性TCR的抗Id抗体)，以及以上任一者的表位结合片段。因此，本文还涵盖抗原结合分子的“抗原结合片段”和“抗原结合部分”和“表位结合片段”，并且是指保留结合抗原的能力的片段。术语“抗原结合蛋白”还包括例如单结构域抗体、仅重链抗体、共价双功能抗体(例如以引用的方式整体并入本文中的美国专利申请公布第20070004909号中公开的那些抗体)以及Ig-DARTS(例如以引用的方式整体并入本文中的美国专利申请公布第20090060910号中公开的那些Ig-DARTS)。在一些特定实施方案中，抗体是包括至少两条重(H)链和两条轻(L)链(例如，通过二硫键相互连接)的规范抗体。

术语“特异性结合”、“以特异方式结合”、“抗原特异性”指示参与特异性结合的分子(1)能够在生理条件下彼此稳定结合(例如缔合，例如形成分子间非共价键)，并且(2)在生理条件下不能与指定结合对之外的其它分子稳定结合。特异性结合的特征还在于平衡解离常数(K_D)在低微摩尔至皮摩尔范围内。高特异性可在低纳摩尔范围内，极高特异性在皮摩尔范围内。用于确定两个分子是否特异性结合的方法是所属领域中众所周知的，并且包括例如平衡渗透和表面等离子体共振。

“宿主”是指响应于经由注射或其它合适途径引入宿主的外来分子或抗原而产生免疫系统蛋白质的动物或非人类哺乳动物。将抗原或其它外来物质引入宿主会引发抗体产生和相关免疫反应。

术语“非人类哺乳动物”等是指非人类的任何脊椎动物生物体。在一些实施方案中，非人类动物是圆口类动物、多骨鱼、软骨鱼(例如鲨鱼或鳐)、两栖动物、爬行动物、哺乳动物和禽类。在一些实施方案中，非人类动物是哺乳动物。在一些实施方案中，非人类哺乳动物是灵长类动物、山羊、绵羊、猪、犬、母牛或啮齿动物。下文另外描述了各种非人类动物。此外，如本文所用的术语“基因修饰的非人类哺乳动物”是指如上所述的“非人类哺乳动物”，其中已使用基因工程技术改变非人类哺乳动物的遗传物质，例如以引入、删除、增强、抑制或突变非人类哺乳动物的基因序列。

术语“人源化”、“嵌合”、“人类/非人类”等通常用于指包括如下序列(例如核酸、蛋白质等)的抗体(或抗原结合蛋白，或抗体组分)，其中所述序列的至少一部分源自于人或其中序列的至少一部分为非人类来源(例如啮齿动物，例如小鼠)，序列用相应人类抗体(或抗原结合蛋白，或抗体组分)序列的相应部分替换，使得修饰(例如，人源化、嵌合、人类/非人类等)的分子保留其生物学功能和/或维持执行所保留的生物功能的结构。例如，嵌合抗体包括在第一个物种(例如，人类)中发现的V_H和V_L区序列和在第二个不同物种(例如非人类动物，例如啮齿动物，例如小鼠)中发现的恒定区序列。在一些实施方案中，具有连接到非人恒定区(例如，小鼠恒定区)的人V_H和V_L区的抗体称为“反向嵌合抗体”。相反，“人类”抗体等涵盖只具有人类来源的序列(例如，人类核苷酸和/或蛋白质序列)。

术语“基因修饰的非人类动物”和“基因工程化的非人类动物”在本文中可互换使用且是指任何非天然存在的非人类动物(例如啮齿动物，例如大鼠或小鼠)，其中整体或部分地，所述非人类动物的一个或多个细胞含有异源核酸和/或编码所关注多肽的一种或多种基因。举例来说，在一些实施方案中，“基因修饰的非人类动物”或“基因工程化的非人类动物”是指含有如本文所述的转基因或转基因构建体的非人类动物。在一些实施方案中，异源核酸和/或基因直接或间接地通过引入前驱细胞中、借助于故意遗传操纵，例如通过显微注射或通过感染重组病毒来引入细胞中。术语遗传操纵不包括经典繁育技术，而是针对重组DNA分子的引入。该分子可整合在染色体内。短语“基因修饰的非人类动物”或“基因工程化的非人类动物”是指对于异源核酸和/或基因是异型接合或同型接合的动物，和/或具有异源核酸和/或基因的单个或多个拷贝的动物。

如本文所用，术语“种系配置”是指如在野生型动物(例如小鼠、大鼠或人)的内源种系基因组中发现的序列排列(例如基因区段)。免疫球蛋白基因区段的种系配置的实例可见于例如LeFranc,M-P.,The Immunoglobulin FactsBook,Academic Press,2001年5月23日(本文中称为“LeFranc 2001”)：

●人重链可变区基因区段和人重链恒定区基因的一种示例性配置可见于LeFranc2001第47页；

●人λ轻链可变区基因区段和人λ轻链恒定区基因的一种示例性配置可见于LeFranc 2001第61页；

●人κ轻链可变区基因区段和人κ轻链恒定区基因的一种示例性配置可见于LeFranc 2001第53页；

●小鼠重链可变区基因区段和小鼠重链恒定区基因的一种示例性配置可见于Lucas,J.等人,第1章:The Structure and Regulation of the Immunoglobulin Loci,Molecular Biology of B Cells,第2版,Academic Press,2015(Lucas)；

●小鼠λ轻链可变区基因区段和小鼠λ轻链恒定区基因的一种示例性配置可见于LeFranc,M-P等人,第4章:Immunoglobulin Lamb da(IGL)Genes of Human and Mouse,Molecular Biology of B Ce lls,第1版,Academic Press,2004(LeFranc 2004)；和

●小鼠κ轻链可变区基因区段和小鼠κ轻链恒定区基因的一种示例性配置可见于Christele,M-J等人,Nomenclature and Overview of the Mouse(Mus musculus and Mussp.)Immunoglobulin Kappa(IGK)Genes,Exp Clin Immunogenet 2001,18:255-279(Christele)。

上文所列出的LeFranc 2001、Lucas、LeFranc 2004和Christele的各引述部分以引用的方式并入本文中。

如本文所用，术语“种系基因组”是指在动物形成中使用的生殖细胞(例如配子，例如精子或卵)中发现的基因组。种系基因组是动物中细胞的基因组DNA的来源。因而，在种系基因组中具有修饰的动物(例如小鼠或大鼠)被视为在其所有细胞的基因组DNA中均具有修饰。

如本文所用，术语“种系序列”是指如在野生型动物(例如小鼠、大鼠或人)的内源种系基因组中发现的DNA序列，或由如在动物(例如小鼠、大鼠或人)的内源种系基因组中发现的DNA序列编码的RNA或氨基酸序列。免疫球蛋白基因区段的代表性种系序列可见于例如LeFranc 2001：

●在如本文所述的一些实施方案中可利用的人V_H基因区段的代表性种系核苷酸序列和人V_H基因区段的代表性种系氨基酸序列可见于LeFranc 2001第107-234页；

●在如本文所述的一些实施方案中可利用的人D基因区段的代表性种系核苷酸序列和人D基因区段的代表性种系氨基酸序列可见于LeFranc 2001第98-100页；

●在如本文所述的一些实施方案中可利用的人J_H基因区段的代表性种系核苷酸序列和人J_H基因区段的代表性种系氨基酸序列可见于LeFranc 2001第104页；

●在如本文所述的非人类动物的一些实施方案中可利用的人Vλ基因区段的代表性种系核苷酸序列和人Vλ基因区段的代表性种系氨基酸序列可见于LeFranc 2001第350-428页；并且

●在如本文所述的非人类动物的一些实施方案中可利用的人Jλ基因区段的代表性种系核苷酸序列和人Jλ基因区段的代表性种系氨基酸序列可见于LeFranc 2001第346页。

上文所列出的LeFranc 2001的各引述部分以引用的方式并入本文中。

短语“互补决定区”或术语“CDR”包括通常(即在野生型动物中)出现在免疫球蛋白分子(例如，抗体)的轻链或重链可变结构域中的两个框架(FR)区之间的由生物体免疫球蛋白基因的核酸序列编码的氨基酸序列。CDR可由例如种系序列或重排或未重排序列编码，并且例如由幼稚或成熟B细胞编码。CDR可进行体细胞突变(例如，不同于动物种系中编码的序列)、人源化和/或用氨基酸取代、添加或缺失进行修饰。在一些情况下(例如，对于CDR3)，CDR可由两个或多个不连续(例如，在未重排核酸序列中)但例如作为连接序列的结果(例如，V-D-J重组形成重链CDR3)而在B细胞核酸序列中连续的序列(例如，种系序列)编码。所属领域已建立了用于定义CDR边界的某些系统(例如Kabat、Chothia等)；所属领域的技术人员理解这些系统之间的差异，并且能够在理解和实践所要求的发明所需的程度上了解CDR边界。

短语“基因区段”或“区段”包括对可变(V)基因区段(例如，免疫球蛋白轻链可变(V_L)基因区段或免疫球蛋白重链可变(V_H)基因区段)、免疫球蛋白重链多样性(D)基因片段或接合(J)基因片段，例如免疫球蛋白轻链接合(J_L)基因片段或免疫球蛋白重链接合(J_H)基因片段的提及，其包括免疫球蛋白基因座处的可参与重排(例如由内源重组酶介导)以形成重排轻链V_L/J_L或重排重链V_H/D/J_H序列的未重排序列。除非另有指示，否则未重排V、D和J区段与根据12/23规则允许V_L/J_L重组或V_H/D_H/J_H重组的重组信号序列(RSS)缔合。

如本文所用，术语“重排”描述DNA序列包括两个或更多个接合(直接或间接)在一起的免疫球蛋白基因区段，以便接合在一起的基因区段具有编码免疫球蛋白的可变区的DNA序列。重排DNA序列的两个或更多个免疫球蛋白基因区段不再与发挥功能的重组信号序列(RSS)缔合，因而无法进行进一步重排。所属领域的技术人员将认识到，虽然重排DNA序列的两个或更多个免疫球蛋白基因区段不能进一步重排，但它并不意谓同一基因座内的其它免疫球蛋白基因区段无法进行例如第二次重排。所属领域的技术人员将了解，重排基因区段(例如在重排免疫球蛋白可变区中)可经由天然VDJ重组过程接合在一起。所属领域的技术人员还将了解，重排基因区段(例如在重排免疫球蛋白可变区中)可被工程化成例如通过使用标准重组技术接合所述基因区段而接合在一起。重排免疫球蛋白可变区通常包括两个或更多个接合的免疫球蛋白基因区段。举例来说，重排免疫球蛋白λ轻链可变区可包括与Jλ基因区段接合的Vλ基因区段。重排免疫球蛋白重链可变区可包括接合的V_H基因区段、D基因区段、J_H基因区段。所属领域的技术人员还将了解，一般在重排免疫球蛋白可变区中的免疫球蛋白基因区段之间去除所有或基本上所有基因间序列。所属领域的技术人员将进一步了解，重排序列可尤其在基因区段中包括内含子。

如本文所用，术语“未重排”描述DNA序列包括两个或更多个尚未经历重组事件或尚未以其它方式接合，因此在之间包括基因间序列的免疫球蛋白基因区段。所属领域的技术人员将了解，未重排V基因区段和J基因区段可与完整重组信号序列(RSS)缔合。未重排D基因区段可侧接两个完整重组信号序列(RSS)。所属领域的技术人员将进一步了解，未重排基因区段(例如未重排V基因区段)可尤其包括内含子。

术语“蛋白质”或可互换地“多肽”在本文中使用，涵盖所有种类的天然存在和合成的蛋白质，包括所有长度的蛋白质片段、肽、融合蛋白和经修饰的蛋白质，包括但不限于糖蛋白，以及所有其它类型经修饰的蛋白质(例如，包括但不限于由磷酸化、乙酰化、肉豆寇酰化、棕榈酰化、糖基化、氧化、甲酰化、酰胺化、聚谷氨酰化、ADP核糖基化、聚乙二醇化和生物素化产生的蛋白质)。

除非另有说明，术语“核酸”和“核苷酸”包括DNA与RNA两者。具体地说，术语“核酸”和“核苷酸序列”在本文中可互换使用。

术语“可操作地连接”是指一种并置，其中所描述的组件处于允许其以其预期方式起作用的关系中。例如，如果未重排可变区基因区段能够重排形成在B细胞或其祖细胞中与恒定区基因结合表达为抗原结合蛋白的多肽链的重排可变区基因，那么未重排可变区基因区段“可操作地连接”于连续恒定区基因。“可操作地连接”于编码序列的控制序列以在与控制序列相容的条件下实现编码序列的表达的方式定位。“可操作地连接”的序列包括与所关注基因相连的表达控制序列和反式作用或隔开一定距离控制所关注基因(或所关注序列)的表达控制序列两者。术语“表达控制序列”包括影响其所连结的编码序列的表达和加工所必需的多核苷酸序列。“表达控制序列”包括：适当转录起始、终止、启动子和增强子序列；高效RNA加工信号，例如剪接和多腺苷酸化信号；稳定细胞质mRNA的序列；增强翻译效率(即科扎克一致序列(Kozak consensus sequence))的序列；增强多肽稳定性的序列；和需要时，增强多肽分泌的序列。这类控制序列的性质取决于宿主生物体。举例来说，在原核生物中，这类控制序列一般包括启动子、核糖体结合位点和转录终止序列，而在真核生物中，这类控制序列通常包括启动子和转录终止序列。术语“控制序列”意图包括存在对于表达和加工来说不可或缺的组分，并且还可包括存在有利的额外组分，例如前导序列。

术语“异源”是指来自不同来源的试剂或实体。举例来说，当在提及特定细胞或生物体中存在的多肽、基因或基因产物时使用时，所述术语阐明相关多肽、基因或基因产物：1)人为工程化；2)人为(例如经由基因工程)引入细胞或生物体中(或其前驱细胞)；和/或3)并非相关细胞或生物体(例如相关细胞类型或生物体类型)天然产生或其中不存在。“异源”还包括特定天然细胞或生物体中通常存在，但已经例如通过突变或置于非天然相关和在一些实施方案中非内源调控元件(例如启动子)的控制下而改变或修饰的多肽、基因或基因产物。

抗体“重链”通常包括免疫球蛋白重链可变结构域和免疫球蛋白重链恒定结构域。可变结构域可进一步再分成称为互补决定区(CDR)的高变区，中间散布有称为框架区(FR)的较保守区。除非另有说明，否则重链可变结构域包括三个重链CDR和四个FR区(例如，FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4)。重链的片段包括CDR、CDR和FR，以及其组合。通常，全长重链从N端到C端包含以下：包括FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4的重链可变结构域、CH1结构域、铰链、CH2结构域和CH3结构域。在一些实施方案中，全长重链还包含CH4结构域(例如，IgE和IgM同种型抗体)。重链的功能片段包括能够特异性识别表位(例如，以微摩尔、纳摩尔或皮摩尔范围内的K_D识别表位)的片段，其能够表达并从细胞分泌，并且包含至少一个CDR。

短语“轻链”包括来自任何生物体的免疫球蛋白轻链序列，并且除非另有说明，否则包括人κ和λ轻链，以及替代轻链(例如，包含VpreB、λ5等)。除非另有说明，否则轻链可变结构域通常包括三个轻链CDR和四个框架(FR)区。通常，全长轻链自从氨基端到羧基端包括：包括FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4的V_L结构域，和轻链恒定结构域。轻链包括例如不选择性结合被其出现的表位结合蛋白选择性结合的第一或第二表位的那些轻链。轻链还包括结合和识别，或协助重链结合和识别被其出现的表位结合蛋白选择性结合的一个或多个表位的那些轻链。轻链的实例包括通用或常见轻链，例如源自于单个重排人轻链可变区的那些轻链，例如人Vκ1-39Jκ5或人Vκ3-20Jκ1，如本文所述，并且包括其体细胞突变(例如，亲和力成熟)型式。

当关于“源自于”未重排可变区和/或未重排可变区基因区段的重排可变区基因或可变结构域使用时，短语“源自于”是指将重排可变区基因或可变结构域的序列追溯到一组可重排形成表达可变结构域的重排可变区基因的未重排可变区基因区段的能力(在适用的情况下，考虑剪接差异和体细胞突变)。例如，经过体细胞超突变的重排可变区基因不会改变其源自于未重排可变区基因区段的事实。此外，通用轻链上下文中的短语“源自于”可指将表达的抗体序列追溯到小鼠基因组中存在的通用或单个重排轻链的能力；这类源自于基因组中的单个重排轻链序列的轻链可能因体细胞超突变而与单个重排轻链序列不同。

如本文所用，术语“基因座”是指染色体上含有一组相关遗传元件(例如，基因、基因区段或调控元件)的区域。例如，未重排免疫球蛋白基因座可包括指导V(D)J重组和免疫球蛋白表达的免疫球蛋白可变区基因区段、一种或多种免疫球蛋白恒定区基因和相关调控元件(例如，启动子、增强子、开关元件等)。基因座可以是内源或非内源的。术语“内源基因座”是指染色体上天然发现特定遗传元件的位置。

根据本文的公开内容，可采用所属领域技术范围内的常规分子生物学、微生物学和重组DNA技术。这类技术在文献中充分解释。参见例如Sambrook,Fritsch&Maniatis,Molecular Cloning:A Laboratory Manual,第二版Cold Spring Harbor,NY:Cold SpringHarbor Laboratory Press,1989(本文中为“Sambrook等人,1989”)；DNA Cloning:APractical Approach,第I卷和第II卷(D.N.Glover编辑1985)；OligonucleotideSynthesis(M.J.Gait编辑1984)；Nucleic Acid Hybridization[B.D.Hames和S.J.Higgins编辑(1985)]；Transcription And Translation[B.D.Hames和S.J.Higgins编辑(1984)]；Animal Cell Culture[R.I.Freshney编辑(1986)]；Immobilized Cells And Enzymes[IRLPress,(1986)]；B.Perbal,A Practical Guide To Molecular Cloning(1984)；Ausubel,F.M.等人(编辑).Current Protocols in Molecular Biology.John Wiley&Sons公司,1994，每篇出版物均以引用的方式整体并入本文中。这些技术包括定点诱变，参见例如Kunkel,Proc.Natl.Acad.Sci.USA 82:488-492(1985)；美国专利第5,071,743号；Fukuoka等人,Biochem.Biophys.Res.Commun.263:357-360(1999)；Kim和Maas,BioTech.28:196-198(2000)；Parikh和Guengerich,BioTech.24:4 28-431(1998)；Ray和Nickoloff,BioTech.13:342-346(1992)；Wang等人,BioTech.19:556-559(1995)；Wang和Malcolm,BioTech.26:680-682(1999)；Xu和Gong,BioTech.26:639-641(1999)；美国专利第5,789,166号和第5,932,419号；Hogrefe,Strategies l4.3:74-75(2001)；美国专利第5,702,931号、第5,780,270号和第6,242,222号；Angag和Schutz,Biotech.30:486-488(2001)；Wang和Wilkinson,Biotech.29:976-978(2000)；Kang等人,Biotech.20:44-46(1996)；Ogel和McPherson,Protein Engineer.5:467-468(1992)；Kirsch和Joly,Nucl.Acids.Res.26:1848-1850(1998)；Rhem和Hancock,J.Bacteriol.178:3346-3349(1996)；Boles和Miogsa,Curr.Genet.28:197-198(1995)；Barrenttino等人,Nuc.Acids.Res.22:541-542(1993)；Tessier和Thomas,Meths.Molec.Biol.57:229-237；以及Pons等人,Meth.Molec.Biol.67:209-218；每篇出版物均以引用的方式整体并入本文中。

用于鉴定抗原特异性抗体的方法

本公开提供了用于鉴定和/或选择具有人可变结构域的抗原结合蛋白(例如抗体)的序列的方法。本文所述的各种方法利用核酸测序和质谱分析(MS)来选择结合特定抗原的抗体序列(例如可变结构域序列或CDR序列)。在示例性实施方案中，LC-MS和下一代序列(NGS)用于从多个可变结构域序列中选择抗体或可变结构域序列。在一些实施方案中，LC-MS和NGS利用有关人免疫球蛋白可变结构域的信息来鉴定和获得针对所给定的抗原的抗体。在一些实施方案中，鉴定和获得所关注的抗体的互补决定区3(CDR3)。

在各种实施方案中，本文所述的方法允许从基因修饰的非人类动物鉴定例如经由常规方法可能不容易检测到的抗原特异性抗体序列。已知的用于从基因修饰的动物鉴定抗体的方法依赖于活B细胞的存在和/或抗体在B细胞表面上的表达(例如经由杂交瘤技术)。本文提供的方法允许在缺乏活细胞(例如B细胞)下鉴定/分离抗体。在一些实施方案中，本文提供的方法允许鉴定/分离例如血清中的分泌抗体。本文提供的方法还允许从常规抗体鉴定方法中不通常使用的抗体来源鉴定抗体。

在一些实施方案中，本文提供的方法可与常规抗体鉴定/分离方法结合使用以富集和/或增加从基因修饰的动物获得的针对所关注的抗原的抗体池。举例来说，本文所述的方法可与杂交瘤技术结合使用，或与涉及从抗原阳性B细胞直接分离的方法结合使用，参见例如美国专利第7,582,298号，所述专利以引用的方式整体并入本文中。

适应性免疫反应具有高度特异性，并且可作为保留未来抗原遭遇的记忆的长期免疫防御。适应性免疫反应具有抗原特异性，并且部分由V(D)J重组或重排介导。免疫球蛋白V(D)J重组发生在发育中的骨髓B细胞中，并且允许识别多种抗原。VDJ重排是免疫球蛋白重链中可变(V)、接合(J)和多样性(D)基因片段的重排。轻链的过程类似，但轻链缺少D基因片段，因此只进行VJ重排。

重要的是，V(D)J重组和抗体多样化的其它过程，例如接合核苷酸添加/减去和体细胞超突变，会从有限数量的基因中产生大量抗体。这些过程允许产生针对各种抗原的特异性高亲和力抗体。这种产生抗体的能力已经被用于基因修饰的动物，以产生针对人类靶标的治疗性抗体。包含人V(D)J基因区段的基因修饰的小鼠(例如以下中描述的基因修饰的小鼠：美国专利第5,633,425号、第5,770,429号、第5,814,318号、第6,075,181号、第6,114,598号、第6,150,584号、第6,998,514号、第7,795,494号、第7,910,798号、第8,232,449号、第8,703,485号、第8,907,157号和第9,145,588号，每一者以引用的方式整体并入本文中；以及美国专利公布第2008/0098490号、第2010/0146647号、第2013/0145484号、第2012/0167237号、第2013/0167256号、第2013/0219535号、第2012/0207278号和第2015/0113668号，每一者以引用的方式整体并入本文中；以及PCT公布第WO2007117410号、第WO2008151081号、第WO2009157771号、第WO2010039900号、第WO2011004192号、第WO2011123708号、第WO2014093908号、第WO2014093908号、第WO2006008548号、第WO2010109165号、第WO2016062990号、第WO2018039180号、第WO2011158009号、第WO2013041844号、第WO2013041846号、第WO 2013079953号、第WO2013061098号、第WO2013144567号、第WO2013144566号、第WO2013171505号、第WO2019008123号和第WO2020169022号，每一者以引用的方式整体并入本文中)针对所关注的抗原进行免疫接种，并且对抗原特异性的抗体进行鉴定、纯化，然后针对所需的治疗特性进行筛选。其它包含人V(D)J基因区段的基因修饰的小鼠(例如以下中描述的基因修饰的小鼠：美国专利第6,596,541号、第6,586,251号、第8,642,835号、第9,706,759号、第10,238,093号、第8,754,287号、第10,143,186号、第9,796,788号、第10,130,081号、第9,226,484号、第9,012,717号、第10,246,509号、第9,204,624号和第9,686,970号，并且每一者以引用的方式整体并入本文中；以及美国专利公布第2013/0212719号、第2015/0289489号、第2017/0347633号、第2019/0223418号、第2018/0125043号、第2019/0261612号和第2019/0380316号，每一者以引用的方式整体并入本文中；PCT公布第WO2013138680号、第WO2013138712号、第WO2013138681号、第WO2015042250号、第WO2012148873号、第WO2013134263号、第WO2013184761号、第WO2014160179号、第WO2017214089号、第WO2016149678号和第WO2017123808号；和Murphy,A.,“VelocImmune:Immunoglobulin Variable Region Hu manized Mouse”,RecombinantAntibodies for Immunotherapy,New York,NY,Cambridge University Press,101-107(2009)，每一者以引用的方式整体并入本文中)针对所关注的抗原进行免疫接种，并且对抗原特异性抗体进行鉴定、纯化，然后针对所需的治疗特性进行筛选。可用于本文所述的方法中的某些示例性的基因工程化的非人类动物，例如啮齿动物，例如大鼠或小鼠的详细实施方案在以下单独部分中进一步详述。本发明的各种实施方案允许从直接获自免疫动物的分泌抗体分子获得具有所需特性的治疗性抗体。获得分泌抗体分子不需要在细胞表面表达抗体的活细胞的存在。如本文所述，可使用质谱法从抗体群体获得具有所需特性的抗体，如本文所讨论。

在本文所述的各种实施方案中，通过所述方法获得/鉴定的抗体可以是任何同型的抗体，例如IgM、IgD、IgG、IgA和IgE。在一些实施方案中，通过所述方法获得/鉴定的抗体属于IgG同型。在其它实施方案中，通过所述方法获得/鉴定的抗体属于IgM同型。

在一些实施方案中，通过本文提供的方法获得/鉴定的抗体或抗原结合蛋白不为单结构域抗体、仅重链抗体和/或纳米抗体。

在各种实施方案中，本文提供了获得对所述抗原具有特异性的抗体的人免疫球蛋白可变结构域的方法，所述方法包括：获得编码多个免疫球蛋白可变结构域的多个核酸序列，所述多个免疫球蛋白可变结构域从来自用特定抗原进行免疫接种的宿主的第一样品获得；确定从来自宿主的第二样品获得的抗体群体的重链和/或轻链可变结构域的肽序列，所述第二样品包含针对抗原的抗体群体；将编码的多个免疫球蛋白可变结构域的氨基酸序列用抗体群体的重链和/或轻链可变结构域的肽序列进行询问，从而获得对抗原具有特异性的抗体的人免疫球蛋白可变结构域。在一些实施方案中，询问包括将抗体群体的重链和/或轻链可变结构域的肽序列相互比对和与多个免疫球蛋白可变结构域的氨基酸序列进行比对。

在各种实施方案中，所述方法还包括获得对抗原具有特异性的抗体的人可变结构域的核苷酸序列。由于遗传密码的简并性，多个核苷酸序列可编码对抗原具有特异性的抗体的人可变结构域，并且在本文所述的一些实施方案中，可优化核苷酸序列，例如用于在细胞中表达，例如用于在哺乳动物细胞中表达。

测序样品

本公开涵盖如下认识，即关于具有某些结合特性的特定抗体的信息可使用NGS和MS技术来鉴定，如本文进一步描述。虽然用于本文所述的方法中的编码抗体的核酸和抗体本身的来源不限于动物，但当动物(例如，如本文所述的基因修饰的动物)是核酸样品与抗体样品两者的来源时，本文公开的方法尤其有利。尽管如此，本文所述的方法还可以与其它抗体平台技术或其它抗体表达技术一起使用，包括使用例如噬菌体展示或智能设计方法的那些技术。

此外，本公开提供了如下认识，即源自受限的重链或轻链可变序列的抗体允许简化NGS和MS分析，因为所述分析可集中在仅非受限的免疫球蛋白链的可变结构域或CDR，例如CDR3谱系的确定上。本公开还认识到源自受限的重链或轻链可变序列的抗体可以从基因修饰的非人类动物获得，例如包含受限的重链或轻链可变序列的那些非人类动物。举例来说，这类动物提供的益处在于它们产生的抗体已经经历了自然免疫系统过程，因此，尤其可具有增加的表现出高亲和力和特异性结合的机会，同时还具有降低的具有免疫原性的机会。

在一些实施方案中，通过NGS分析的抗体序列包含具有受限的轻链谱系的抗体群体，例如通用轻链抗体群体。在一些实施方案中，通过NGS分析的抗体序列包含具有受限的重链谱系的抗体群体，例如通用轻链抗体群体。

即便如此，当前技术还允许使用单细胞测序方法鉴定多个免疫球蛋白分子中的全长重链和轻链(参见例如DeKosky等人(2015)Nat.Med.21(1):85-91；Goldstein等人(2019)Commun.Biol.2:304；和Singh等人(2019)Nat.Commun.10(1):3120；以引用的方式整体并入本文中)；因此，在一些实施方案中，可使用单B细胞下一代测序方法从第一样品同时获得编码多个免疫球蛋白重链和轻链可变结构域的多个核酸序列，因此，所述方法可涵盖从非人类动物宿主鉴定(不限于)轻链或重链序列。

在一些实施方案中，所关注的抗原是疾病相关抗原。在一些实施方案中，疾病相关抗原是肿瘤抗原。T细胞定义的肿瘤抗原数据库(van der Bruggen P,Stroobant V,Vigneron N,Van den Eynde B.Peptide database:T cell-defined tumorantigens.Cancer Immun 2013)中列出了各种肿瘤抗原。在一些其它实施方案中，所关注的抗原是传染病抗原，例如病毒抗原或细菌抗原。可使用所属领域已知的技术，用DNA或蛋白质形式的所关注的抗原对非人类动物进行免疫接种。

在一些实施方案中，第一样品包含B细胞群体。在一些实施方案中，B细胞群体从骨髓样品和/或脾样品中分离。在另外实施方案中，第一样品可以从其它淋巴器官，例如淋巴结、肠道的培氏斑等获得。

所属领域的技术人员将理解，“B细胞”可指广泛范围的B细胞亚型，包括但不限于浆母细胞、浆细胞(例如，长寿命浆细胞)、记忆B细胞和B-2细胞、FO B细胞和MZ B细胞。所属领域的技术人员将理解，取决于在本文所述的方法中待获得的抗体的期望来源而定，不同的B细胞来源可用于第一样品。

测序分析

样品制备

在一些实施方案中，本文提供的方法可包括产生包含多个核酸分子的核酸文库。在一些实施方案中，产生核酸文库包括从宿主分离多个核酸。在一些实施方案中，多个核酸为多个RNA分子，例如mRNA分子。

在一些实施方案中，产生核酸文库包括产生cDNA文库。在一些实施方案中，cDNA文库包含与从宿主分离的多个mRNA分子对应的多个cDNA分子。在一些实施方案中，多个cDNA分子是双链cDNA分子。

在本发明的各种实施方案中，编码多个免疫球蛋白可变结构域或CDR的多个核酸序列是从获自进行免疫接种的宿主的样品(即，用于测序的样品或第一样品，如上所述)获得的。

在一些实施方案中，在从进行免疫接种的宿主获得第一样品之后，从所述第一样品获得编码多个免疫球蛋白可变结构域或CDR的多个核酸序列。在一些实施方案中，从第一样品获得的编码多个免疫球蛋白可变结构域的多个核酸包括从核酸序列制备cDNA并且对第一样品中的重排重链VDJ序列和/或重排轻链VJ序列进行测序。

在一些实施方案中，产生核酸文库包括富集多个核酸分子。在一些实施方案中，富集多个核酸分子包括例如通过PCR，例如巢式PCR扩增多个核酸分子。在一些实施方案中，富集多个核酸分子包括捕捉多个核酸分子。捕捉技术可包括例如混合捕捉技术。

在一些实施方案中，本文提供的方法包括将索引附加到核酸文库的每个核酸分子。索引可具有样品特异性。在一些实施方案中，索引的长度在1-25个核苷酸之间。在一些实施方案中，索引的长度在1-10个核苷酸之间。

在一些实施方案中，本文提供的方法包括将测序引物和/或其互补序列附接到核酸文库的每个核酸分子。

在一些实施方案中，对核酸文库中的多个核酸分子进行片段化。在一些实施方案中，核酸分子通过机械(例如，超声处理)或化学(例如，酶)方法进行片段化。

在一些实施方案中，本文提供的方法包括对核酸文库中的核酸分子进行尺寸选择。可基于即将进行的测序类型来确定尺寸选择参数。在示例性尺寸选择中，核酸长度的尺寸选择范围是200-1000bp，例如400-900bp，例如400-700bp。

在一些实施方案中，本文提供的方法包括定量核酸文库中核酸的量。在一些实施方案中，量可以是核酸的总量，例如纳克。在一些实施方案中，量可以是浓度，例如每毫升核酸的纳克。

在一些实施方案中，使用下一代测序技术确定编码多个免疫球蛋白可变结构域的多个核酸序列。在一些实施方案中，多个核酸序列编码足够数目的氨基酸序列供鉴定结合特定抗原的免疫球蛋白可变结构域。氨基酸序列的示例性代表性数目可包括数十、数百、数千或数万个序列。在一些实施方案中，由使用下一代测序技术确定的多个免疫球蛋白可变区构建的最终参考序列数据库可能会排除单读段序列(例如，在测序操作期间仅产生单个序列读段的序列)以减少测序误差的影响。因此，在一些实施方案中，可在排除这类单读段序列之后确定由核酸序列编码的独特氨基酸序列的数目。

下一代测序(NGS)

本文提供的方法可包括进行NGS测序。在一些实施方案中，本文提供的方法可包括执行一种或多种NGS技术。

如本文所用，“下一代测序”(NGS)，又称大规模并行或深度测序，涉及可并行对数百万个小DNA片段进行测序并检测核酸序列的变体的测序技术。在一些实施方案中，对核酸进行多次测序以提供高保真度和深度的结果。无需物理分离单个反应即可进行NGS测序。不希望受理论束缚，在核酸提取后，可使用多种仪器和技术，包括靶向测序、全外显子组测序和全基因组测序进行NGS测序，然后生成文库或模板，以及使用生物信息学进行数据分析。通常，存在各种用于进行NGS和数据分析的平台和生物信息学工具。参见例如Levy S.E.和Myers R.M.,2016Annu.Rev.Genom.Hum.Genet.17:95-115；Behjati S.和Tarpey P.S.,2013Arch Dis Child Pract Ed.98(6):236-238；Alekseyev等人,2018AcademicPathology，5:1-11。在本文所述的方法的一些实施方案中，更深的测序将增加抗体谱系的覆盖度。

根据本公开使用的示例性NGS方法包括测序技术，包括“第二代测序”、“第三代测序”和“第四代测序”技术。

在一些实施方案中，本文提供的方法包括通过包括但不限于454焦磷酸测序、IonTorrent测序和Illumina测序的技术进行测序。

在一些实施方案中，本文提供的方法包括通过454焦磷酸测序进行测序。454焦磷酸测序检测焦磷酸盐(核苷酸并入的副产物)，以报导特定碱基是否并入不断增长的DNA链中((Ronaghi,Karamohamed,Pettersson,Uhlen和Nyren,Anal.Biochem.1996年11月1日；242(1):84-9.)；又参见Slatko,Gardner和Ausubel,Curr.Protoc.Mol.Biol.2018；122(1):e59)，两者均以引用的方式整体并入本文中。在典型的454测序方法中，例如400-900bp，例如400-700bp长的个别DNA片段与接头连接，并且在个别乳液“珠粒”(emPCR)反应中通过PCR进行扩增。珠粒上的DNA序列可与接头上的序列互补，使得DNA片段直接结合于珠粒，理想情况下，一个片段结合于每个珠粒。然后合成DNA，然后对DNA合成反应进行化学检测，并且测量焦磷酸盐的释放。包括样品的皮升大小的腔室充满含有4种核苷酸之一的测序试剂。当正确的核苷酸并入合成链中时，利用发光反应测量焦磷酸盐的释放。可通过测量反应产生的光的强度来检测序列中核苷酸的均聚物“操作。”历史上，454测序技术已经被用于基因组测序和宏基因组样品，因为其通常可实现较长的读段长度(高达600-800nt)和相对较高的通量(2500万个碱基，在4小时操作内99％或更佳的精确度)，有助于基因组的组装。

在一些实施方案中，本文提供的方法包括通过Ion Torrent测序进行测序。IonTorrent^TM技术将核苷酸序列直接转换为半导体芯片上的数字信息(Rothberg等人,Nature475,348-352(2011)，以引用的方式整体并入)。在DNA合成反应中，当正确的核苷酸从其互补碱基并入正在生长的DNA链中时，会释放出一个氢离子。氢离子的释放改变溶液的pH值，这可以通过离子传感器记录为电压变化，很像pH计。如果未并入核苷酸，那么不会出现电压尖峰。通过使用一次只包括4种核苷酸中的一种的测序试剂依次充满和冲洗“测序腔”，当并入适当的核苷酸时会发生电压变化。当两个相邻核苷酸并入相同核苷酸时，会释放两个氢，并且电压加倍。因此还可以确定单个核苷酸的“操作”。

Ion Torrent测序首先将DNA片段化为200-1500个碱基片段，然后将这些片段连接到接头。DNA片段通过珠粒和接头上的互补序列附接到珠粒，然后通过乳液PCR(emPCR)在珠粒上进行扩增。然后珠粒流过含有孔的芯片，以便只有一个珠粒可进入个别孔。然后测序试剂流过孔，并且当并入适当的核苷酸时，释放出氢离子并记录信号。

在一些实施方案中，本文提供的方法包括通过Illumina测序进行测序。Illumina测序基于一种称为“桥式扩增”的技术，其中每端连接有适当接头的DNA分子(约500bp)用作底物，用于在含有与连接的接头互补的寡核苷酸序列的固相载体上进行重复扩增合成反应。载体上的寡核苷酸被间隔开，以使得DNA然后进行重复数轮的扩增，创建由每个寡核苷酸片段约1000个拷贝组成的克隆“簇”。每个载体可包括数百万个并行簇反应。在合成反应过程中，并入与四种碱基中的每一种相对应的各具有不同荧光标记的经修饰的核苷酸，然后检测。核苷酸还充当每个反应的合成终止剂，在检测到下一轮合成后打开。反应重复300轮或更多轮。与基于相机的成像相比，由于直接成像，所以荧光检测的使用提高了检测速度。

在一些实施方案中，本文提供的方法包括通过单分子实时(SMRT)测序进行测序。SMRT测序可对很长的片段进行测序，最长可达30-50kb或更长。SMRT测序涉及将具有待测序DNA的工程化的DNA聚合酶结合于孔SMRT流通池中的零模式波导(ZMW)的底部。ZMW是一个小的腔室，可将光能引导到尺寸相对于照明光波长较小的区域。由于ZMW的设计和使用的光波长，成像通常只发生在ZMW的底部，在那里DNA聚合酶与DNA结合，将每个碱基并入到生长中的链中。四种核苷酸用不同的磷酸连接的荧光团标记以进行差异检测。当核苷酸并入到生长中的链时，随着正确的荧光标记的核苷酸被结合，成像发生在毫秒时间尺度上。并入后，释放磷酸连接的荧光部分，不再能检测到。然后可并入下一个核苷酸。成像与核苷酸并入的速率同步，以便在每个碱基并入到生长中的DNA链中时对其进行鉴定。这同时发生在SMRT单元内的单个芯片上存在的多达一百万个仄升(zeptoliter)ZMW中。

使用SMRT测序的模板制备涉及“SMRTbell”的产生，它是一种环状双链DNA分子，具有已知的与用于在模板上启动DNA合成的引物互补的接头序列。这种配置使得聚合酶能够通过穿过每个ZMW中的环状分子来多次读取大模板，直到聚合酶停止，以建立共有序列(CCS，环状共有序列)。由于连接到插入物每一侧的接头各具有DNA合成引发位点，因此测序聚合酶可在任一DNA股上的5'至3'方向穿过环状SMRTbell，提供来自ds“SMRTbell”两条链的互补信息。

在一些实施方案中，本文提供的方法包括通过纳米孔测序进行测序。在一些实施方案中，本文提供的方法包括通过原位测序(ISS)进行测序。

生物信息学

在一些实施方案中，生物信息学用于分析由测序产生的数据。举例来说，在一些实施方案中，生物信息学可用于描绘有待分析的抗体或抗原结合蛋白的特定区域，例如免疫球蛋白可变区的核酸序列、免疫球蛋白可变结构域的氨基酸序列、编码框架区或互补决定区的核酸序列、或框架区或互补决定区的氨基酸序列。

NGS测序通常会产生大量测序数据。在一些实施方案中，序列读段可多路分解。在一些实施方案中，多路分解包括基于获得测序核酸的样品或来源对序列读段进行计算机分类。可通过基于相关索引对序列读段进行计算机分类来进行多路分解。在一些实施方案中，在进行多路分解之后，可以从序列读段中去除索引的序列。在一些实施方案中，可将索引、来源或样品的鉴定添加到与序列读段相关的序列信息中。

在一些实施方案中，基于质量得分(例如Phred得分)从进一步分析中去除(“过滤掉”)序列读段。在一些实施方案中，质量得分代表序列读段中的一个或多个核苷酸被错误调用的概率。在一些实施方案中，质量得分系一种将置信度分配给读段内的特定碱基的方式。

在一些实施方案中，基于序列读段长度从进一步分析中去除(“过滤掉”)序列读段。举例来说，可从分析中去除太短或太长的序列读段。

在一些实施方案中，基于序列读段的一部分与已知序列的同一性，从进一步分析中去除(“过滤掉”)序列读段。举例来说，在一些实施方案中，如果与引物(例如，IgG恒定区引物)对应的序列读段的一部分具有小于90％、小于95％、小于100％与已知引物序列的同一性，那么可从进一步分析中去除序列读段。

在一些实施方案中，由于对特定核酸序列检测到少量读段，因此从进一步分析中去除序列读段。

在一些实施方案中，可在分析之前去除非生产性重排(例如，具有终止密码子的重排或框外重排)。

在一些实施方案中，本文所述的方法包括进行NGS，包括进行双末端测序，并且所述方法包括合并重叠的双末端读段。

在一些实施方案中，可去除重复读段。重复读段是对应于相同原始DNA片段的读段。例如，由于测序技术中的扩增步骤，可产生重复读段。在一些实施方案中，重复读段的去除在确定由核酸序列文库中的多个核酸序列编码的氨基酸序列之前进行。

在一些实施方案中，通过进行NGS获得的测序信息用于确定与测序的原始DNA片段对应的一致序列。

在一些实施方案中，对从NGS获得的核苷酸序列排序。在一些实施方案中，核苷酸序列基于核苷酸序列的cDNA丰度、读段长度和/或置信度进行排序。在一些实施方案中，对NGS分析的前1,000个序列进行排序。在一些实施方案中，对NGS分析的前500个序列进行排序。在一些实施方案中，对通过MS获得的前400种肽进行排序。在一些实施方案中，对NGS分析的前300个序列进行排序。在一些实施方案中，对NGS分析的前200个序列进行排序。在一些实施方案中，对NGS分析的前100个序列进行排序。

在一些实施方案中，经由NGS获得的多个核酸序列(例如，编码免疫球蛋白可变结构域的那些核酸序列)与种系V(D)J序列进行比对。在一些实施方案中，经由NGS获得的多个核酸序列(例如，编码免疫球蛋白可变结构域的那些核酸序列)与种系V(D)J序列进行比对，并且进一步分析以提取关于例如可变区序列、可变结构域序列、框架序列和/或CDR序列(例如，CDR3序列)的信息。

在一些实施方案中，分析测序读段以确定其编码的氨基酸序列(例如，通过计算机翻译)并将序列折叠成独特的全长框内氨基酸序列。在一些实施方案中，所提供的方法包括通过计算机翻译例如序列读段文库的测序读段，产生氨基酸序列文库。

在一些实施方案中，分析这些提取的核酸序列或CDR3序列的氨基酸序列，以通过获得相应核酸或CDR3序列的氨基酸序列(例如，通过计算机翻译)并将序列折叠成独特的全长框内氨基酸序列来确定其氨基酸序列。在一些实施方案中，这些独特氨基酸序列用于构建代表多个免疫球蛋白可变结构域或免疫球蛋白CDR的氨基酸序列文库。

如本文所用，编码多个免疫球蛋白可变结构域的核酸序列涵盖编码约10,000-500,000个独特氨基酸序列，包括约10,000个、约15,000个、约20,000个、约25,000个、约30,000个、约35,000个、约40,000个、约45,000个、约50,000个、约55,000个、约60,000个、约65,000个、约70,000个、约75,000个、约80,000个、约85,000个、约90,000个、约95,000个、约100,000个、约110,000个、约120,000个、约130,000个、约140,000个、约150,000个、约160,000个、约170,000个、约180,000个、约190,000个、约200,000个、约250,000个、约300,000个、约350,000个、约400,000个、约450,000个或约500,000个独特氨基酸序列的核酸序列。在一些实施方案中，编码多个免疫球蛋白可变结构域的核酸序列可涵盖编码约10-100,000个独特氨基酸序列，或约10个、约25个、约50个、约75个、约100个、约250个、约500个、约750个、约1000个、约1500个、约2000个、约2500个、约3000个、约3500个、约4000个、约4500个、约5000个、约10,000个、约15,000个、约20,000个、约25,000个、约30,000个、约35,000个、约40,000个、约45,000个、约50,000个、约55,000个、约60,000个、约65,000个、约70,000个、约75,000个、约80,000个、约85,000个、约90,000个、约95,000个或约100,000个独特氨基酸序列的核酸序列。在一些实施方案中，多个核酸序列编码约10,000-80,000个独特氨基酸序列，并且可涵盖约10,000个、约15,000个、约20,000个、约25,000个、约30,000个、约35,000个、约40,000个、约45,000个、约50,000个、约55,000个、约60,000个、约65,000个、约70,000个、约75,000个或约80,000个独特氨基酸序列。此外，在一些实施方案中，鉴定结合特定抗原的免疫球蛋白可变结构域可能仅需要单个氨基酸序列。

用于肽分析的样品

在一些实施方案中，本文提供的方法包括获得和/或确定从抗体样品获得的人免疫球蛋白重链和/或轻链可变结构域的多个肽序列。在一些实施方案中，抗体样品包含从进行免疫接种的宿主获得的抗体群体。

本公开涵盖如下认识，即，可在体内使用于肽分析的样品富集具有期望特征的抗体。举例来说，可基于体内定位富集抗体样品。因此，在一些实施方案中，包含抗体的样品可以从宿主内任何期望来源，例如血清、血浆、淋巴器官、肠、脑脊髓液、脑、脊髓、胎盘或它们的组合获得。

在一些实施方案中，用于肽分析的样品是或包含任何包含抗体的体液。在一些实施方案中，用于肽分析的样品是或包含从血清、血浆、淋巴器官、肠、脑脊髓液、脑、脊髓、胎盘或它们的组合获得的样品。在一些特定实施方案中，用于肽分析的样品是或包含从进行免疫接种的宿主(例如非人类动物，例如啮齿动物)的血清获得的抗体。在一些实施方案中，用于肽分析的样品(“第二样品”)可以从组织溶解产物中获得。在一些实施方案中，第二样品可含有不同水平的可分离和测序的循环抗体。如上所述，在一些实施方案中，如果需要评估来自特定抗体来源的抗体，那么第二样品可源自所述来源，例如分泌抗体来源。在一些实施方案中，用于肽分析的样品包含从特定组织获得的抗体以富集定位于所述组织的抗体。

在一些实施方案中，用于肽分析的样品包含抗体群体。在一些实施方案中，离体使用于肽分析的样品富集具有所需特征的抗体。在一些实施方案中，使用色谱法，例如离子交换色谱法，使样品富集抗体。在一些实施方案中，使用例如亲和色谱法使样品富集对特定靶标具有亲和力的抗体。在一些实施方案中，亲和色谱法用于去除具有某些不希望(例如，脱靶)的结合亲和力的抗体。在一些实施方案中，通过将抗体暴露于一种或多种条件，例如热和/或氧化以选择抗体稳定性，使用于肽分析的样品富集具有所需特征的抗体。

在一些实施方案中，第二样品包含来自进行免疫接种的宿主的针对所关注的抗原的抗体，并且耗竭不针对所关注的抗原的抗体。可使用多种方法，包括但不限于色谱法、亲和纯化法、尺寸排阻法、缓冲液交换、白蛋白耗竭技术、蛋白酶抑制剂、免疫球蛋白耗竭技术和高丰度蛋白质耗竭来耗竭样品。在一些实施方案中，在非人类动物进行免疫接种期间的免疫原与佐剂复合的情况下，可能使第二样品耗竭针对佐剂的抗体。在免疫原与Fc部分融合的一些实施方案中，第二样品耗竭针对Fc的抗体。在其它实施方案中，免疫原可与标签融合，例如His、FLAG、Myc、HA、GST、GFP、V5等，并且使第二样品耗竭针对所述标签的抗体。

在一些实施方案中，使第二样品富集针对所关注的抗原的抗体。与耗竭方法类似，可使用多种方法，包括色谱法、亲和纯化方法、尺寸排阻方法等实现样品的富集。在一些实施方案中，可通过涉及与抗原免疫原结合的各种方法来富集第二样品。由于富集步骤可能取决于抗体与多肽的结合；在此步骤中，可针对所关注的抗体的特定特性来询问抗体池。在一个实例中，可基于所关注的抗体在特定结合条件下结合抗原的能力使第二样品富集所述抗体。举例来说，可基于所关注的抗体结合抗原的特定同源异构体/变体、抗原的特定片段/表位、抗原的单体或寡聚物形式、或抗原的其它所需构象的能力，使第二样品富集所述抗体。在一些实施方案中，例如通过使用蛋白A(或用于其它主要Ig类别的亲和纯化的抗IgA和抗IgM抗体)的亲和色谱，使用于肽分析的样品富集特定Ig类别。

在一些实施方案中，在肽分析之前使包含抗体群体的样品进行消化和/或片段化。在一些实施方案中，使用于肽分析的抗体样品消化成肽。在一些实施方案中，用于肽分析的抗体样品经酶消化成肽(例如，使用胰蛋白酶和/或胃蛋白酶)。在一些实施方案中，用于肽分析的抗体样品在消化之前进行变性和还原。在一些实施方案中，用于肽分析的抗体样品在消化之前进行烷基化(例如，使用碘乙酰胺)。在一些实施方案中，用于肽分析的抗体样品进行变性、还原和/或烷基化，然后经酶消化(例如，使用胰蛋白酶和/或胃蛋白酶)。在一些实施方案中，将样品分成多个等分试样，所述等分试样用不同酶消化和/或消化不同时间量。在一些实施方案中，将样品分成至少两个等分试样，所述等分试样用至少两种不同酶消化。

在一些实施方案中，抗体被消化成肽并使用MS分析(例如，串联质谱法)测序。在一些实施方案中，针对抗体序列文库询问来自MS分析的肽序列。

在一些实施方案中，通过色谱法，例如液相色谱法分离和/或分辨抗体的肽。在一些实施方案中，通过高效液相色谱法分离和/或分辨抗体的肽。在一些实施方案中，通过逆相色谱法分离和/或分辨抗体的肽。

在某些实施方案中，可经由CDR3序列末端的独特Cys与允许纯化这类肽的硫醇特异性试剂的特异性结合来富集CDR3肽而非无关肽。在一些实施方案中，用于肽分析的抗体样品被消化(例如，经酶消化)成多种肽并使用硫醇特异性试剂使多种肽富集CDR3肽。

文库的MS和询问

在一些实施方案中，本文所述的方法利用质谱法(MS)。质谱法通过使分子电离并测量其飞行时间或分子轨迹对电场和/或磁场的响应来获得有关化合物的分子量和结构信息。

本公开进一步预期任何MS方法均可适用于本公开的方法。示例性MS方法包括但不限于串联MS(MS/MS)、LC-MS、LC-MS/MS、基质辅助激光脱附电离质谱法(MALDI-MS)、傅里叶变换质谱法(Fourier transform mass spectrometry，FTMS)、离子迁移分离与质谱法(IMS-MS)、电子转移解离(ETD-MS)和它们的组合。这类方法描述于例如Pitt,Clin.Biochem.Rev.30:19-34(2009)。可用于本公开的方法中的质谱仪是所属领域已知的并且可购自例如Agilent公司、Bruker公司和Thermo Scientific。

在一些实施方案中，使用抗体群体的重链和/或轻链可变结构域的质谱分析来确定第二样品的肽序列。在一些实施方案中，质谱分析将液相色谱法与质谱法(LC-MS)组合，然后对抗体群体的重链和/或轻链可变结构域进行蛋白水解消化。但是，可使用替代分离和质谱方法，包括加速器质谱法、气相色谱-质谱法(GC-MS)、离子迁移谱-MS、基质辅助激光脱附电离飞行时间(MALDI-TOF)和表面增强激光脱附电离(SELDI-TOF)。通常，还可以使用自上而下的蛋白质组学，其中无需消化即可分析完整蛋白质，从而保留完整的蛋白质质量信息。参见Chen等人2018Anal Chem.90(1):110-127。在一些实施方案中，所提供的方法结合多维高压液相色谱法(LC/LC)和/或串联质谱法(MS/MS)。

在一些特定实施方案中，MS分析是定量的。

在一些实施方案中，对从MS分析获得的肽序列进行排序。在一些实施方案中，基于肽丰度和/或肽置信度对肽序列进行排序。在一些实施方案中，对通过MS获得的前1,000种肽进行排序。在一些实施方案中，对通过MS获得的前500种肽进行排序。在一些实施方案中，对通过MS获得的前400种肽进行排序。在一些实施方案中，对通过MS获得的前300种肽进行排序。在一些实施方案中，对通过MS获得的前200种肽进行排序。在一些实施方案中，对MS分析之前100种肽进行排序。在一些实施方案中，手动确认排名靠前的肽序列的MS谱质量。

在各种实施方案中，将通过MS分析(例如第二样品)获得的肽序列(例如重链和/或轻链可变结构域的肽序列)用从序列分析(例如，第一个样品)获得的多个免疫球蛋白可变结构域的氨基酸序列进行询问。在一些实施方案中，将肽序列用通过翻译由NGS获得的核苷酸序列(例如，第一样品)所获得的氨基酸序列进行询问。

在一些实施方案中，将多个免疫球蛋白可变结构域的氨基酸序列用抗体群体的重链和/或轻链可变结构域的肽序列进行询问包括将抗体群体的重链和/或轻链可变结构域的肽序列相互比对并与多个免疫球蛋白可变结构域的氨基酸序列进行比对。如本文所用，比对还意指将抗体群体的重链和/或轻链可变结构域的肽序列与多个免疫球蛋白可变结构域的氨基酸序列进行比较，并且任选地相互进行比较。在一些实施方案中，可针对含有从第一样品获得的多个可变结构域的文库筛选通过第二样品的质谱分析获得的肽序列。如本公开所设想，可使用多种方法对氨基酸序列进行询问。

在一些实施方案中，使用市售软件(例如Mascot，Martix Science；PEAKS，Bioinformatics Solutions公司；Sequest，ThermoFisher Scie ntific；Byonic，ProteinMetrics)将通过第二样品的质谱分析获得的肽序列相对于从测序分析(例如，第一样品)获得的抗体序列(例如可变结构域序列和/或CDR序列)文库进行映射和/或搜索。基于各种标准，获得所关注的抗体的可变结构域的序列。

在一些实施方案中，获得对抗原具有特异性的抗体的人免疫球蛋白重链和/或轻链可变结构域或CDR基于以下中的一者或多者：(1)从第二样品获得的独特肽与从第一样品获得的氨基酸序列中的CDR3序列匹配(例如，指定同源性)；(2)从第二样品获得的独特肽与从第一样品获得的所述氨基酸序列中的CDR1和/或CDR2序列匹配(例如，指定同源性)；(3)从第二样品获得的一种或多种独特肽与从第一样品获得的氨基酸序列中的一个或多个框架序列匹配(例如，指定同源性)；(4)下一代序列计数的数目，(5)排除具有甲硫氨酸的CDR序列；和(6)排除具有潜在N糖基化的CDR序列。在一些实施方案中，获得对抗原具有特异性的抗体的人免疫球蛋白重链和/或轻链可变结构域或CDR基于这些参数中的两者或更多者、三者或更多者、四者或更多者、五者或更多者或全部六者。

在一些实施方案中，获得对抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR基于从MS分析获得的独特肽与文库中的CDR序列和/或框架序列的同源性。在一些实施方案中，文库包含与通过NGS获得的核酸序列(例如，从进行免疫接种的宿主获得的第一样品)对应的抗体重链可变结构域的氨基酸序列。

在一些实施方案中，从MS分析获得的肽序列用于询问文库以仅选择共享至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％同一性或100％同一性的那些氨基酸序列。

在一些实施方案中，询问包括查询与通过MS分析获得的肽序列(例如，CDR序列)同源的序列的文库。在一些实施方案中，询问包括查询与通过MS分析获得的CDR3肽序列同源的序列的文库。在一些实施方案中，询问包括查询与通过MS分析获得的CDR3肽序列至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％同源的序列的文库。在一些实施方案中，询问包括查询与通过MS分析获得的CDR3肽序列100％同源的序列的文库。

在一些实施方案中，使用以下搜索参数中的一个或多个，相对于从测序分析获得的抗体序列(例如可变结构域序列和/或CDR序列)文库搜索通过第二样品的MS分析获得的肽序列：酶促裂解位点、酶促消化特异性、酶促裂解缺失、质量偏差和/或固定修饰。在一些实施方案中，使用市售软件将与通过样品的MS获得的抗体可变结构域的CDR(例如CDR3)对应的肽序列相对于从测序分析(例如第一样品)获得的抗体序列(例如CDR序列)的文库进行映射和/或搜索。

在本发明的各种实施方案中，从第二样品的质谱分析获得的肽与通过NGS产生的氨基酸序列文库的匹配包括与NGS获得的序列具有80％或更高同一性的肽。在一些实施方案中，从第二样品的质谱分析获得的肽与通过NGS产生的氨基酸序列文库的同一性百分比是与NGS获得的序列至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％同一性。如本文中结合肽序列与NGS获得的序列的比对或比较所用，“同一性”是指如通过所属领域中已知的可用于测量核苷酸和/或氨基酸序列同一性的许多不同算法确定的同一性。在另一实施方案中，匹配可以是肽序列与NGS获得的序列的精确匹配。在一些实施方案中，从MS分析获得的肽可覆盖NGS数据库中的整个CDR或框架序列或其一部分。

在一些实施方案中，基于一个或多个标准选择获得的抗体、可变结构域和/或CDR序列。在一些实施方案中，抗体序列(或其一部分)基于同源性进行分组。在一些实施方案中，获得的抗体和/或可变结构域序列基于一个或多个CDR的同源性进行分组。在一些实施方案中，获得的抗体和/或可变结构域序列基于CDR3的同源性进行分组。

在一些实施方案中，免疫球蛋白重链可变结构域序列基于同源性分组。在一些实施方案中，免疫球蛋白轻链可变结构域序列基于同源性分组。

在一些实施方案中，对映射到从测序分析获得的抗体序列(例如可变结构域序列和/或CDR序列)文库中的肽序列进行排序。在一些实施方案中，基于序列覆盖度和/或肽置信度对肽序列进行排序。在一些实施方案中，对前1,000个抗体命中进行排序。在一些实施方案中，对前500个抗体命中进行排序。在一些实施方案中，对前400个抗体命中进行排序。在一些实施方案中，对前300个抗体命中进行排序。在一些实施方案中，对前200个抗体命中进行排序。在一些实施方案中，对前100个抗体命中进行排序。在一些实施方案中，手动确认排名靠前的肽序列的MS谱质量。

在一些实施方案中，鉴定的免疫球蛋白重链和/或轻链可变结构域序列表达为重组抗原结合蛋白(例如，抗体)。在一些实施方案中，鉴定的免疫球蛋白重链和/或轻链可变结构域序列进行密码子优化并表达为重组抗原结合蛋白。

在一些实施方案中，表征包含鉴定的可变结构域序列的重组抗原结合蛋白(例如，抗体)。在一些实施方案中，评估包含鉴定的可变结构域序列的重组抗体对靶标的结合亲和力。

非人类动物

本文提供的方法包括使用非人类动物。下面详细描述了用于所公开方法的示例性非人类动物。简单地说，然而，在各种实施方案中，宿主(例如进行免疫接种的宿主)是基因修饰的非人类动物，例如非人类哺乳动物，所述基因修饰的非人类动物在其基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于恒定区。

在一些实施方案中，基因修饰的非人类动物可以是任何非人类动物。在一些实施方案中，非人类动物是脊椎动物。在一些实施方案中，非人类动物是哺乳动物。在一些实施方案中，本文所述的基因修饰的非人类动物可选自由以下组成的组：小鼠、大鼠、兔、猪、牛(例如母牛、公牛、水牛)、鹿、绵羊、山羊、骆驼、鸡、猫、犬、雪貂、灵长类动物(例如绒、恒河猴等)。对于合适的可基因修饰的ES细胞不易获得的非人类动物，可采用其它方法来制造包含本文所述的基因修饰的非人类动物。这类方法包括例如对非ES细胞基因组(例如纤维母细胞或诱导的多潜能性细胞)进行修饰和采用核转移将经修饰的基因组转移到适合细胞，例如卵母细胞中，以及在非人类动物中在适合形成胚胎的条件下孕育经修饰的细胞(例如经修饰的卵母细胞)。

在一些实施方案中，非人类动物是哺乳动物。在一些实施方案中，非人类动物是小型哺乳动物，例如跳鼠科(Dipodoidea)或鼠总科(Muroidea)。在一些实施方案中，非人类动物是啮齿动物。在某些实施方案中，啮齿动物是小鼠、大鼠或仓鼠。在一些实施方案中，啮齿动物选自鼠总科。在一些实施方案中，非人类动物来自选自以下的科：丽仓鼠科(Calomyscidae)(例如小鼠样仓鼠)、仓鼠科(Cricetidae)(例如仓鼠、新世界大鼠和小鼠、野鼠)、鼠科(Muridae)(例如真正小鼠和大鼠、沙鼠、刺毛鼠、冠毛鼠)、马岛鼠科(Nesomyidae)(例如攀鼠、岩鼠、白尾鼠、马达加斯加大鼠(Malagasy rat)和小鼠)、刺山鼠科(Platacanthomyidae)(例如多刺睡鼠)和鼹形鼠科(Spalacidae)(例如摩尔鼠(molerate)、竹鼠和鼢鼠)。在一些实施方案中，啮齿动物选自真正小鼠或大鼠(鼠科)、沙鼠、刺毛鼠和冠毛鼠。在一些实施方案中，小鼠系来自鼠科成员。在一些实施方案中，非人类动物是啮齿动物。在一些实施方案中，啮齿动物选自小鼠和大鼠。在一些实施方案中，非人类动物是小鼠。

在一些实施方案中，非人类动物是C57BL品系的小鼠。在一些实施方案中，C57BL品系选自C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola。在一些实施方案中，非人类动物是129品系的小鼠。在一些实施方案中，129品系选自由以下组成的组：品系129P1、129P2、129P3、129X1、129S1(例如129S1/SV、129S1/SvIm)、129S2、129S4、129S5、129S9/SvEvH、129S6(129/SvEvTac)、129S7、129S8、129T1、129T2。在一些实施方案中，基因修饰的小鼠是129品系与C57BL品系的混合物。在一些实施方案中，小鼠是129品系的混合物，和/或C57BL/6品系的混合物。在一些实施方案中，混合物的129品系是129S6(129/SvEvTac)品系。在一些实施方案中，小鼠是BALB品系(例如BALB/c)。在一些实施方案中，小鼠是BALB品系与另一品系(C57BL品系和/或129品系)的混合物。在一些实施方案中，本文提供的非人类动物可以是来源于上述品系的任何组合的小鼠。

在一些实施方案中，本文提供的非人类动物是大鼠。在一些实施方案中，大鼠选自威斯塔鼠(Wistar rat)、LEA品系、斯普雷格多利品系(Sprague Dawley strain)、费雪品系(Fischer strain)、F344、F6和黑刺豚鼠(Dark Agouti)。在一些实施方案中，大鼠品系是两种或更多种选自由以下组成的组的品系的混合物：威斯塔鼠、LEA、斯普雷格多利、费雪、F344、F6和黑刺豚鼠。

因此，在一些实施方案中，进行免疫接种的非人类动物宿主是啮齿动物，例如大鼠或小鼠。因此，在一些实施方案中，宿主是基因修饰的啮齿动物，所述基因修饰的啮齿动物在其基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段(又称人V_H基因区段)、一个或多个人D基因区段(又称人D_H基因区段)和一个或多个人重链J基因区段(又称人J_H基因区段)，其中所述重链可变区可操作地连接于恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于恒定区。

在一些实施方案中，宿主是基因修饰的小鼠，所述基因修饰的小鼠在其基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于鼠恒定区。

在一个态样中，包含人重链V、D和J基因区段的免疫球蛋白重链可变区可操作地连接于小鼠重链恒定区，并且包含人轻链V和J基因区段的免疫球蛋白轻链可变区可操作地连接于小鼠轻链恒定区。在另一态样中，可操作地连接于小鼠重链恒定区的包含人重链V、D和J基因区段的免疫球蛋白重链可变区位于内源小鼠重链基因座处，并且可操作地连接于小鼠轻链恒定区的包含人轻链V和J基因区段的免疫球蛋白轻链可变区位于内源小鼠轻链基因座处。下文更详细地描述了基因修饰的非人类动物，例如啮齿动物，例如小鼠的各种实施方案。

在一些实施方案中，宿主是基因修饰的非人类动物，其包含受限的重链或受限的轻链可变序列，例如包含重链或轻链可变V(D)J基因区段的有限谱系，例如单个重排重链或轻链可变序列，如下文所述。

用于鉴定抗原特异性抗体的基因修饰的宿主

本发明的抗体通过首先用所关注的抗原对非人类动物宿主进行免疫接种来获得。因此，在一些实施方案中，如本文所述的进行免疫接种的非人类动物宿主是啮齿动物，例如大鼠或小鼠。在一些实施方案中，如本文所述的进行免疫接种的非人类动物宿主是基因修饰的非人类动物宿主，例如基因修饰的啮齿动物。下文更详细地描述了基因修饰的非人类动物，例如啮齿动物，例如大鼠或小鼠的各种实施方案。

在一些实施方案中，进行免疫接种的非人类动物宿主是啮齿动物，例如大鼠或小鼠。在一些实施方案中，宿主是基因修饰的啮齿动物，所述基因修饰的啮齿动物在其基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述免疫球蛋白重链可变区可操作地连接于恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于恒定区。

在一些实施方案中，宿主是基因修饰的小鼠，所述基因修饰的小鼠在其基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠类(例如大鼠或小鼠)恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于鼠恒定区。

在一些实施方案中，免疫球蛋白重链可变区可操作地连接于小鼠重链恒定区，和/或免疫球蛋白轻链可变区可操作地连接于小鼠轻链恒定区。在一些实施方案中，可操作地连接于小鼠重链恒定区的免疫球蛋白重链可变区位于内源小鼠重链基因座处，和/或可操作地连接于小鼠轻链恒定区的免疫球蛋白轻链可变区位于内源小鼠轻链基因座处。一种示例性实施方案描述于Macdonald等人,Proc.Natl.Aca d.Sci.USA 111:5147-52和支持信息(www.pnas.org/cgi/content/short/1323896111)，其以引用的方式整体并入本文中。下文更详细地描述了基因修饰的非人类动物，例如啮齿动物，例如大鼠或小鼠的各种实施方案。

在一些实施方案中，基因修饰的啮齿动物在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白重链基因座(例如工程化的内源啮齿动物免疫球蛋白重链基因座)，所述基因座包含在一个或多个啮齿动物(例如大鼠或小鼠)免疫球蛋白重链恒定区基因(例如一个或多个内源啮齿动物(例如大鼠或小鼠)免疫球蛋白重链恒定区基因)上游(例如可操作连接)的一个或多个未重排人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段。这类工程化的免疫球蛋白重链基因座在本文中称为“HoH基因座。”包括HoH基因座的啮齿动物在例如以下中举例说明：美国专利第6,596,541号、第8,642,835号和第8,697,940号；和Murphy,A.,“VelocImmune:Immunoglobulin Variable RegionHumanized Mouse”,Recombinant Ant ibodies for Immunotherapy,New York,NY,Cambridge University Press,101-107(2009)，每一者以引用的方式整体并入。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座处是异型接合的。

在一些实施方案中，一个或多个未重排人V_H基因区段包括至少六个人V_H基因区段。在一些实施方案中，一个或多个未重排人V_H基因区段包括至少18个人V_H基因区段。在一些实施方案中，一个或多个未重排人V_H基因区段包括至少39个人V_H基因区段。在一些实施方案中，一个或多个未重排人V_H基因区段包括至少80个人V_H基因区段。在一些实施方案中，一个或多个未重排人D_H基因区段包括至少27个人D_H基因区段。在一些实施方案中，一个或多个未重排人J_H基因区段包括至少六个人J_H基因区段。

在一些实施方案中，一个或多个未重排人V_H基因区段包括所有功能性人V_H基因区段。在一些实施方案中，一个或多个未重排人V_H基因区段包括少于80个人V_H基因区段。在一些实施方案中，一个或多个未重排人V_H基因区段包括少于39个人V_H基因区段。在一些实施方案中，一个或多个未重排人V_H基因区段包括少于18个人V_H基因区段。在一些实施方案中，一个或多个未重排人V_H基因区段包括少于10个人V_H基因区段。

在一些实施方案中，一个或多个未重排人V_H基因区段包括至少18个人V_H基因区段，一个或多个未重排人D_H基因区段包括27个人D_H基因区段，并且一个或多个未重排人J_H基因区段包括六个人J_H基因区段。这类工程化的免疫球蛋白重链基因座在本文中称为“1HoH基因座”。在一些实施方案中，一个或多个未重排人V_H基因区段包括至少39个人V_H基因区段，一个或多个未重排人D_H基因区段包括27个人D_H基因区段，并且一个或多个未重排人J_H基因区段包括六个人J_H基因区段。这类工程化的免疫球蛋白重链基因座在本文中称为“/>2HoH基因座”。在一些实施方案中，一个或多个未重排人V_H基因区段包括至少80个人V_H基因区段，一个或多个未重排人D_H基因区段包括27个人D_H基因区段，并且一个或多个未重排人J_H基因区段包括六个人J_H基因区段。这类工程化的免疫球蛋白重链基因座在本文中称为“/>3HoH基因座”。

在一些实施方案中，例如响应于抗原刺激，包含HoH基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含重链的抗体，其中每条重链包含可操作地连接于啮齿动物(例如大鼠或小鼠)重链恒定结构域的人重链可变结构域。

在一些实施方案中，基因修饰的啮齿动物在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白重链基因座(例如工程化的内源啮齿动物免疫球蛋白重链基因座)，所述基因座包含一个或多个未重排人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段，还包含至少一个组氨酸对非组氨酸残基的取代或插入，以使得未重排免疫球蛋白重链可变基因序列在互补决定区3(CDR3)编码序列中包含至少一个非组氨酸密码子经组氨酸密码子的取代或至少一个组氨酸密码子的插入(参见例如PCT公布第WO2013/138712和WO2013/138681号，以引用的方式整体并入本文中)。对包含非组氨酸残基经组氨酸残基取代或组氨酸残基插入的基因修饰的啮齿动物进行免疫接种有助于使用本文和实施例中所述的谱系测序与MS方法的组合鉴定对抗原表现出pH值依赖性特性的抗体。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白重链基因座，所述基因座例如包含受限的重链可变区序列，包含有限人重链可变区谱系。

在一些实施方案中，基因修饰的啮齿动物在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白重链基因座(例如工程化的内源啮齿动物免疫球蛋白重链基因座)，所述基因座包含在一个或多个啮齿动物(例如大鼠或小鼠)免疫球蛋白重链恒定区基因(例如一个或多个内源啮齿动物(例如大鼠或小鼠)免疫球蛋白重链恒定区基因)上游(例如可操作连接)的单个人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段。具有这类工程化的免疫球蛋白重链基因座(例如工程化的内源啮齿动物免疫球蛋白重链基因座)的基因修饰的啮齿动物在例如美国专利公布第2019/0261612号和美国专利第10,238,093号(每一者以引用的方式整体并入)中举例说明。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白重链基因座(例如工程化的内源啮齿动物免疫球蛋白重链基因座)，所述基因座包含在一个或多个啮齿动物(例如大鼠或小鼠)恒定区基因上游(例如可操作地连接)的单个重排人重链可变区。这类工程化的免疫球蛋白重链基因座在本文中称为“UHC基因座”或“通用重链基因座”或“常见重链基因座”。包括UHC基因座的啮齿动物在例如美国专利第9,204,624号(以引用的方式整体并入)中举例说明。

在一些实施方案中，单个重排人重链可变区包含单个人V_H基因区段、单个人D_H基因区段和单个人J_H基因区段。在一些实施方案中，单个人V_H基因区段是人V_H3-23，单个人D_H基因区段是人D_H4-4，并且单个人J_H基因区段是人J_H4。

在一些实施方案中，单个重排人重链可变区包含由两个氨基酸分隔的单个人V_H基因区段和单个人J_H基因区段。在一些实施方案中，单个人V_H基因区段是人V_H3-23，单个人J_H基因区段是人J_H4，并且两个氨基酸是甘氨酸和酪氨酸。

在一些实施方案中，一个或多个啮齿动物(例如小鼠或大鼠)重链恒定区基因是一个或多个内源啮齿动物(例如小鼠或大鼠)重链恒定区基因。

在一些实施方案中，例如响应于抗原刺激，包含UHC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含免疫球蛋白链的抗体，其中每条免疫球蛋白链包含可操作地连接于恒定结构域的人重链可变结构域。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白重链基因座(例如工程化的内源啮齿动物免疫球蛋白重链基因座)，所述基因座包含在一个或多个啮齿动物(例如大鼠或小鼠)免疫球蛋白重链恒定区基因(例如一个或多个内源啮齿动物(例如大鼠或小鼠)免疫球蛋白重链恒定区基因上游(例如可操作地连接)的一个或多个未重排人V_L基因区段和一个或多个未重排人J_L基因区段。在一些实施方案中，这类基因修饰的啮齿动物包含具有轻链(例如轻链可变区)和重链(例如重链恒定区)序列两者的杂交重链基因座。这类工程化的免疫球蛋白重链基因座在本文中称为“LoH基因座”。包括LoH基因座的啮齿动物在例如美国专利第9,686,970号和美国专利公布第2013/0212719号(每一者以引用的方式整体并入)中举例说明。在一些实施方案中，一个或多个未重排人V_L基因区段和一个或多个未重排人J_L基因区段是一个或多个未重排人Vκ基因区段和一个或多个未重排人Jκ基因区段。在一些实施方案中，一个或多个未重排人V_L基因区段和一个或多个未重排人J_L基因区段是一个或多个未重排人Vλ基因区段和一个或多个未重排人Jλ基因区段。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoH基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoH基因座处是异型接合的。

在一些实施方案中，例如响应于抗原刺激，包含LoH基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含免疫球蛋白链的抗体，其中每条免疫球蛋白链包含可操作地连接于啮齿动物(例如大鼠或小鼠)重链恒定结构域的人轻链可变结构域。

在一些实施方案中，免疫啮齿动物产生包含两条免疫球蛋白重链和两条免疫球蛋白轻链的抗体。在一些实施方案中，免疫啮齿动物不产生单结构域抗体、仅重链抗体和/或纳米抗体。

在一些实施方案中，如本文提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含修饰的基因组(例如种系基因组)，所述修饰包括编码内源IgG恒定区基因的CH1结构域的核酸序列的缺失，本文中称为“CH1缺失修饰。”在一些实施方案中，包含CH1缺失修饰的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含免疫球蛋白重链的IgG重链抗体，其中每条免疫球蛋白重链完全或部分缺乏CH1结构域。在一些实施方案中，如本文提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含仅重链免疫球蛋白编码序列的基因组(例如种系基因组)，所述仅重链免疫球蛋白编码序列包含与内源重链恒定区呈可操作的连接的未重排人重链可变区，其中内源重链恒定区包含(1)编码与轻链缔合的IgM同型的完整内源IgM基因，和(2)缺乏编码功能性CH1结构域的序列的非IgM基因，例如IgG基因，其中所述非IgM基因编码缺乏能够与轻链恒定结构域共价缔合的CH1结构域的非IgM同型。在一些实施方案中，所产生的IgG抗体还缺乏同源轻链并将IgG仅含重链的抗体分泌到其血清中。包含CH1缺失修饰的示例性啮齿动物描述于例如美国专利第8,754,287号、US专利公布第2015/0289489号和PCT公布第WO2006/008548号、第WO2010/109165号和第WO2016062990号中，每一者以引用的方式整体并入本文中。在一些实施方案中，进行免疫接种的啮齿动物产生单结构域抗体、仅重链抗体和/或纳米抗体。

在一些实施方案中，本公开提供了鉴定来自啮齿动物的对抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR序列(例如CDR3序列)的方法，所述啮齿动物在其种系基因组中包括包含CH1缺失修饰的免疫球蛋白重链可变区，所述方法包括：(i)获得从样品获得的人免疫球蛋白重链可变结构域的多个肽序列，所述样品包含由用所述抗原进行免疫接种的基因修饰的啮齿动物产生的抗体群体；和(ii)将人免疫球蛋白重链可变结构域序列的文库用所述多个肽序列进行询问，其中所述文库包含由所述进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链可变结构域序列。

在一些实施方案中，本公开提供了鉴定来自啮齿动物的对抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR序列(例如CDR3序列)的方法，所述啮齿动物在其种系基因组中包括包含CH1缺失修饰的免疫球蛋白重链可变区，所述方法包括：(i)获得人免疫球蛋白重链可变结构域序列的文库，所述文库包含由用所述抗原进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链可变结构域序列；和(ii)将所述文库用从样品获得的人免疫球蛋白重链可变结构域的多个肽序列进行询问，所述样品包含由用所述抗原进行免疫接种的啮齿动物产生的抗体群体。

在一些实施方案中，如本文提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含工程化的免疫球蛋白重链(例如HoH、UHC、LoH)基因座(例如工程化的内源啮齿动物免疫球蛋白重链基因座)的基因组(例如种系基因组)，所述基因座缺乏功能性内源啮齿动物Adam6基因。在一些实施方案中，如本文提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含编码一种或多种啮齿动物ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列的基因组(例如种系基因组)。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6a。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6b。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6a和小鼠ADAM6b。包括编码一种或多种啮齿动物ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一种或多种核苷酸序列的啮齿动物在例如美国专利第8,642,835号、第8,697,940号、第9,706,759号、第10,130,081号、第10,238,093号和美国专利公布第2013/0212719号中举例说明，每一者以引用的方式整体并入。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)表达一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列的基因组(例如种系基因组)，所述一个或多个核苷酸序列包括在与工程化的免疫球蛋白重链(例如HoH、UHC、LoH)基因座相同的染色体上。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含工程化的免疫球蛋白重链(例如HoH、UHC、LoH)基因座的基因组(例如种系基因组)，所述基因座包含编码一种或多种啮齿动物ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一种或多种核苷酸序列。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列代替人类Adam6伪基因的基因组(例如种系基因组)。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含替代人类Adam6伪基因的编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列的基因组(例如种系基因组)。

在一些实施方案中，如所提供的基因修饰的啮齿动物具有包含以下的基因组(例如种系基因组)：包含第一和第二人V_H基因区段的一个或多个人V_H基因区段，和介于第一人V_H基因区段与第二人V_H基因区段之间的编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列。在一些实施方案中，第一人V_H基因区段是V_H1-2且第二人V_H基因区段是V_H6-1。

在一些实施方案中，编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列介于人V_H基因区段与人D_H基因区段之间。

在一些实施方案中，编码一种或多种啮齿动物ADAM6多肽的一个或多个核苷酸序列恢复或增强雄性啮齿动物的生育力。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白轻链基因座(例如工程化的内源啮齿动物免疫球蛋白轻链基因座)，所述基因座包含在一个或多个免疫球蛋白轻链恒定区基因上游(例如可操作地连接)的一个或多个未重排人V_L基因区段和一个或多个未重排人J_L基因区段。在一些实施方案中，一个或多个未重排人V_L基因区段和一个或多个未重排人J_L基因区段是一个或多个未重排人Vκ基因区段和一个或多个未重排人Jκ基因区段。在一些实施方案中，一个或多个未重排人V_L基因区段和一个或多个未重排人J_L基因区段是一个或多个未重排人Vλ基因区段和一个或多个未重排人Jλ基因区段。在一些实施方案中，一个或多个未重排免疫球蛋白轻链恒定区基因是或包含Cκ。在一些实施方案中，一个或多个未重排免疫球蛋白轻链恒定区基因是或包含Cλ。

在一些实施方案中，工程化的免疫球蛋白轻链基因座(例如工程化的内源啮齿动物免疫球蛋白轻链基因座)包含非天然前导序列。在一些实施方案中，前导序列包含信号肽。在一些实施方案中，前导序列包含非天然信号肽。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白轻链基因座(例如工程化的内源啮齿动物免疫球蛋白轻链基因座)，所述基因座包含在Cκ基因上游(例如可操作地连接)的一个或多个未重排人Vκ基因区段和一个或多个未重排人Jκ基因区段。这类工程化的免疫球蛋白轻链基因座在本文中称为“KoK基因座”。包括KoK基因座的啮齿动物在例如美国专利第6,596,541号、第8,642,835号和第8,697,940号(每一者以引用的方式整体并入)中举例说明。在一些实施方案中，KoK基因座的免疫球蛋白κ轻链恒定区基因是啮齿动物(例如大鼠或小鼠)Cκ基因。在一些实施方案中，KoK基因座的免疫球蛋白κ轻链恒定区基因是内源啮齿动物(例如大鼠或小鼠)Cκ基因。在一些实施方案中，KoK基因座的免疫球蛋白κ轻链恒定区基因是在内源免疫球蛋白κ轻链基因座处的内源啮齿动物(例如大鼠或小鼠)Cκ基因。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在KoK基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在KoK基因座处是异型接合的。

在一些实施方案中，例如响应于抗原刺激，包含KoK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含κ轻链的抗体，其中每条κ轻链包含可操作地连接于啮齿动物(例如大鼠或小鼠)κ轻链恒定结构域的人κ轻链可变结构域。

在一些实施方案中，一个或多个未重排人Vκ基因区段包括至少六个人Vκ基因区段。在一些实施方案中，一个或多个未重排人Vκ基因区段包括至少16个人Vκ基因区段。在一些实施方案中，一个或多个未重排人Vκ基因区段包括至少30个人Vκ基因区段。在一些实施方案中，一个或多个未重排人Vκ基因区段包括至少40个人Vκ基因区段。在一些实施方案中，一个或多个未重排人Jκ基因区段包括至少五个人Jκ基因区段。

在一些实施方案中，一个或多个未重排人Vκ基因区段包括至少16个人Vκ基因区段，并且一个或多个未重排人Jκ基因区段包括至少五个人Jκ基因区段。这类工程化的免疫球蛋白轻链基因座在本文中称为“1KoK基因座”。在一些实施方案中，一个或多个未重排人Vκ基因区段包括至少30个人Vκ基因区段，并且一个或多个未重排人Jκ基因区段包括至少五个人Jκ基因区段。这类工程化的免疫球蛋白轻链基因座在本文中称为“2KoK基因座”。在一些实施方案中，一个或多个未重排人Vκ基因区段包括至少40个人Vκ基因区段，并且一个或多个未重排人Jκ基因区段包括至少五个人Jκ基因区段。这类工程化的免疫球蛋白轻链基因座在本文中称为“/>3KoK基因座”。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白轻链基因座(例如工程化的内源啮齿动物免疫球蛋白轻链基因座)，所述基因座包含在一个或多个未重排人Jλ基因区段和一个或多个Cλ基因上游(例如可操作地连接)的一个或多个未重排人Vλ基因区段。这类工程化的免疫球蛋白轻链基因座在本文中称为“LoL基因座”。包括LoL基因座的小鼠在例如美国专利第9,012,717号、第9,226,484号、第9,029,628号和美国专利公布第2018/0125043号(每一者以引用的方式整体并入)中举例说明。在一些实施方案中，LoL基因座的一个或多个未重排人Jλ基因区段和一个或多个Cλ基因存在于Jλ-Cλ簇中。在一些实施方案中，LoL基因座的一个或多个Cλ基因包含一个或多个人类Cλ基因。在一些实施方案中，LoL基因座的一个或多个Cλ基因包含一个或多个小鼠Cλ基因。在一些实施方案中，LoL基因座的一个或多个Cλ基因包含一个或多个人类Cλ基因和一个或多个小鼠Cλ基因。在一些实施方案中，LoL基因座的一个或多个小鼠Cλ基因包含小鼠Cλ1基因。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoL基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoL基因座处是异型接合的。

在一些实施方案中，例如响应于抗原刺激，包含LoL基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含λ轻链的抗体，其中每条λ轻链包含可操作地连接于啮齿动物(例如大鼠或小鼠)λ轻链恒定结构域的人λ轻链可变结构域。在一些实施方案中，例如响应于抗原刺激，包含LoL基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含λ轻链的抗体，其中每条λ轻链包含可操作地连接于人λ轻链恒定结构域的人λ轻链可变结构域。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白轻链基因座，所述基因座包含在Cκ基因上游(例如可操作地连接)的一个或多个未重排人Vλ基因区段和一个或多个未重排人Jλ基因区段。这类工程化的免疫球蛋白轻链基因座在本文中称为“LoK基因座”。包括LoK基因座的啮齿动物在例如美国专利第9,006,511号和第9,035,128号(每一者以引用的方式整体并入)中举例说明。在一些实施方案中，LoK基因座的Cκ基因是啮齿动物(例如大鼠或小鼠)Cκ基因。在一些实施方案中，LoK基因座的Cκ基因是内源啮齿动物(例如大鼠或小鼠)Cκ基因。在一些实施方案中，LoK基因座的Cκ基因是在内源免疫球蛋白κ轻链基因座处的内源啮齿动物(例如大鼠或小鼠)Cκ基因。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoK基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoK基因座处是异型接合的。

在一些实施方案中，例如响应于抗原刺激，包含LoK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含轻链的抗体，其中每条轻链包含可操作地连接于啮齿动物(例如大鼠或小鼠)κ轻链恒定结构域的人λ轻链可变结构域。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)，所述基因座包含在Cλ基因上游(例如可操作地连接)的一个或多个未重排人Vλ基因区段和一个或多个未重排人Jλ基因区段。这类工程化的免疫球蛋白轻链基因座在本文中称为“LiK基因座”。包括LiK基因座的啮齿动物在例如美国专利公布第2019/0223418号(作为美国专利第11,051,498号颁与)(以引用的方式整体并入)中举例说明。在一些实施方案中，LiK基因座的Cλ基因是啮齿动物(例如大鼠或小鼠)Cλ基因。在一些实施方案中，LiK基因座的Cλ基因是小鼠Cλ1基因。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LiK基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LiK基因座处是异型接合的。

在一些实施方案中，例如响应于抗原刺激，包含LiK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含λ轻链的抗体，其中每条λ轻链包含可操作地连接于啮齿动物(例如大鼠或小鼠)λ轻链恒定结构域的人λ轻链可变结构域。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)，所述基因座包含在一个或多个未重排人Jλ基因区段和一个或多个人类Cλ基因上游(例如可操作地连接)的一个或多个未重排人Vλ基因区段。在一些实施方案中，这类工程化的免疫球蛋白κ轻链基因座的一个或多个未重排人Jλ基因区段和一个或多个Cλ基因存在于Jλ-Cλ簇。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)对于这类工程化的免疫球蛋白κ轻链基因座来说是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)对于这类工程化的免疫球蛋白κ轻链基因座来说是异型接合的。在一些实施方案中，例如响应于抗原刺激，包含这类工程化的免疫球蛋白κ轻链基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含λ轻链的抗体，其中每条λ轻链包含可操作地连接于人λ轻链恒定结构域的人λ轻链可变结构域。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)具有包含有限人轻链可变区谱系的种系基因组。

具有包含有限人轻链可变区谱系的种系基因组的包含人V(D)J基因区段的示例性基因修饰的啮齿动物描述于例如美国专利第9,796,788号、第10,130,081号、第10,143,186号、第10,167,344号、10,412,940和第10,130,081号以及WO 2019/008123、WO2020/247623和WO2020/132557(每一者以引用的方式整体并入本文中)中。在一些实施方案中，有限人轻链可变区谱系包含有限数目的人V_L基因区段。在一些实施方案中，有限数目的人V_L基因区段包含两个人V_L基因区段。在一些实施方案中，有限数目的人V_L基因区段是一个人V_L基因区段。举例来说，在一些实施方案中，有限数目的人V_L基因区段是一个人Vκ基因区段。一个人Vκ基因区段可以是例如人Vκ1-39基因区段、人Vκ3-15基因区段、人Vκ3-11基因区段或人Vκ3-20基因区段。在一些实施方案中，有限数目的人V_L基因区段是一个人Vλ基因区段。一个人Vλ基因区段可以是例如人Vλ1-51基因区段、人Vλ5-45基因区段、人Vλ1-44基因区段、人Vλ1-40基因区段、人Vλ3-21基因区段或人Vλ2-14基因区段。

在一些实施方案中，有限人轻链可变区谱系包含一个或多个J_L基因区段。在一些实施方案中，有限人轻链可变区谱系包含一个J_L基因区段。在一些实施方案中，一个J_L基因区段是Jκ基因区段。在一些实施方案中，一个J_L基因区段是Jλ基因区段。在一些实施方案中，一个J_L基因区段是人J_L基因区段。在一些实施方案中，一个J_L基因区段是小鼠J_L基因区段。

在一些实施方案中，有限人轻链可变区谱系包含(i)人Vκ基因区段和人Jκ基因区段，(ii)人Vκ基因区段和小鼠Jκ基因区段，(iii)人Vκ基因区段和人Jλ基因区段，或(iv)人Vκ基因区段和小鼠Jλ基因区段。

在一些实施方案中，有限人轻链可变区谱系包含(i)人Vλ基因区段和人Jλ基因区段，(ii)人Vλ基因区段和小鼠Jλ基因区段，(iii)人Vλ基因区段和人Jκ基因区段，或(iv)人Vλ基因区段和小鼠Jκ基因区段。

在一些实施方案中，有限人轻链可变区谱系包含(i)人Vκ1-39基因区段和人Jκ5基因区段，(ii)人Vκ1-39基因区段和人Jκ1基因区段，(iii)人Vκ3-20基因区段和人Jκ1基因区段，或(iv)人Vκ3-20基因区段和人Jκ5基因区段。

在一些实施方案中，有限人轻链可变区谱系包含(i)人Vκ1-39基因区段和小鼠Jκ2基因区段，(ii)人Vκ3-20基因区段和小鼠Jκ2基因区段，或(iii)人Vκ3-15基因区段和小鼠Jκ2基因区段。

在一些实施方案中，有限人轻链可变区谱系包含(i)人Vλ1-51基因区段和人Jλ2基因区段，(ii)人Vλ5-45基因区段和人Jλ2基因区段，(iii)人Vλ1-44基因区段和人Jλ2基因区段，(iv)人Vλ1-40基因区段和人Jλ2基因区段，(v)人Vλ3-21基因区段和人Jλ2基因区段，或(vi)人Vλ2-14基因区段和人Jλ2基因区段。

在一些实施方案中，有限人轻链可变区谱系可操作地连接于Cκ基因区段。在一些实施方案中，Cκ基因区段是人类的。在一些实施方案中，Cκ基因区段是小鼠的。在一些实施方案中，小鼠Cκ基因区段是例如在内源小鼠免疫球蛋白κ轻链基因座处的内源小鼠Cκ基因区段。在一些实施方案中，小鼠Cκ基因区段处于内源小鼠免疫球蛋白λ轻链基因座处。

在一些实施方案中，有限人轻链可变区谱系可操作地连接于Cλ基因区段。在一些实施方案中，Cλ基因区段是人类的。在一些实施方案中，Cλ基因区段是小鼠的。在一些实施方案中，小鼠Cλ基因区段是例如在内源小鼠免疫球蛋白λ轻链基因座处的内源小鼠Cλ基因区段。在一些实施方案中，小鼠Cλ基因区段处于内源小鼠免疫球蛋白κ轻链基因座处。

在一些实施方案中，基因修饰的小鼠对于有限人轻链可变区谱系来说是异型接合的。在一些实施方案中，基因修饰的小鼠对于有限人轻链可变区谱系来说是同型接合的。

在一些实施方案中，基因修饰的啮齿动物包含工程化的免疫球蛋白轻链基因座(例如工程化的内源啮齿动物免疫球蛋白轻链基因座)，所述基因座包含受限的轻链可变区序列，包含有限人轻链可变区谱系。在一些实施方案中，有限人轻链可变区谱系包含一个或两个人轻链V基因区段和一个或多个人轻链J基因区段。在一些实施方案中，有限人轻链可变区谱系可操作地连接于轻链恒定区基因区段。在一些实施方案中，包含有限人轻链可变区谱系的基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含可操作地连接于轻链恒定区序列的仅两个未重排人轻链V基因区段和一个或多个未重排人轻链J基因区段。这类工程化的免疫球蛋白轻链基因座在本文中称为“DLC基因座”。在一些实施方案中，包含有限人轻链可变区谱系的基因修饰的啮齿动物在其基因组(例如其种系基因组)中包含单个重排轻链可变区基因座，所述基因座包含相对于单个人轻链J基因区段重排的单个人轻链V基因区段。在一些实施方案中，包含有限人轻链可变区谱系的基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含可操作地连接于轻链恒定区序列的单个重排轻链可变区基因座，其中单个重排轻链可变区基因座包含相对于单个人轻链J基因区段重排的单个人轻链V基因区段。这类工程化的免疫球蛋白轻链基因座在本文中称为“ULC基因座”。如本文所用，短语“ULC基因座”与“通用轻链基因座”或“常见轻链基因座”可互换。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)具有包含有限人κ轻链可变区谱系的种系基因组。在一些实施方案中，基因修饰的啮齿动物包含工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)，所述基因座包含有限人κ轻链可变区谱系。在一些实施方案中，有限人κ轻链可变区谱系包含一个或两个人Vκ基因区段和一个或多个人Jκ基因区段。在一些实施方案中，有限人κ轻链可变区谱系可操作地连接于轻链恒定区基因区段。在一些实施方案中，如所提供的基因修饰的啮齿动物包含可操作地连接于Cκ基因区段的有限人κ轻链可变区谱系。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含有限人κ轻链可变区谱系，其中所述有限人κ轻链可变区谱系包含单个重排人κ轻链可变区(Vκ/Jκ)。单个重排人κ轻链可变区包含与人Jκ基因区段接合的人Vκ基因区段。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)，所述基因座包含在Cκ基因上游(例如可操作地连接)的单个重排人κ轻链可变区。这类工程化的免疫球蛋白轻链基因座称为“κULC基因座”并且是ULC基因座的一实例。包括κULC基因座的啮齿动物在例如美国专利第10,130,081号和第10,143,186号(每一者以引用的方式整体并入)中举例说明。

在一些实施方案中，单个重排人κ轻链可变区包含人Vκ基因区段和人Jκ基因区段。在一些实施方案中，人Vκ基因区段是人Vκ1-39基因区段或人Vκ3-20基因区段。在一些实施方案中，人Jκ基因区段是人Jκ1基因区段、人Jκ2基因区段、人Jκ3基因区段、人Jκ4基因区段或人Jκ5基因区段。在一些实施方案中，人Vκ基因区段是人Vκ1-39基因区段，并且人Jκ基因区段是人Jκ5基因区段。在一些实施方案中，单个重排人κ轻链可变区是人Vκ1-39/Jκ5。在一些实施方案中，人Vκ基因区段是人Vκ3-20基因区段，并且人Jκ基因区段是人Jκ1基因区段。在一些实施方案中，单个重排人κ轻链可变区是人Vκ3-20/Jκ1。在一些实施方案中，人Vκ基因区段是人Vκ3-11基因区段，并且人Jκ基因区段选自人Jκ1基因区段、人Jκ2基因区段、人Jκ3基因区段、人Jκ4基因区段或人Jκ5基因区段。在一些实施方案中，人Vκ基因区段是人Vκ3-11基因区段，并且人Jκ基因区段是人Jκ1基因区段。在一些实施方案中，单个重排人κ轻链可变区是Vκ3-11/Jκ1。

在一些实施方案中，κULC基因座的Cκ基因是啮齿动物(例如大鼠或小鼠)Cκ基因。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在κULC基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在κULC基因座处是异型接合的。

在一些实施方案中，包含κULC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)缺乏能够重排形成内源κ轻链可变区的内源Vκ和/或Jκ基因区段。在一些实施方案中，包含κULC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)缺乏能够重排形成内源λ轻链可变区的内源Vλ和/或Jλ基因区段。

在一些实施方案中，例如响应于抗原刺激，包含κULC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含κ轻链的抗体，其中每条κ轻链包含可操作地连接于啮齿动物(例如大鼠或小鼠)κ轻链恒定结构域的人κ轻链可变结构域。在一些实施方案中，由包含κULC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)的B细胞表达的所有κ轻链均包含由单个重排人κ轻链可变区或其体细胞超突变型式表达的人κ轻链可变结构域。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)，所述基因座包含可操作地连接于Cκ基因的κ轻链恒定区序列(例如可操作地连接)的仅两个未重排人Vκ基因区段和一个或多个未重排人Jκ基因区段。这类工程化的免疫球蛋白κ轻链基因座在本文中称为“κDLC基因座”并且是DLC基因座的一实例。包括κDLC基因座的啮齿动物在例如美国专利第9,796,788号、第10,167,344号、第10,412,940号和第10,130,081号(以引用的方式整体并入)中举例说明。

在一些实施方案中，仅两个未重排人Vκ基因区段包含人Vκ1-39基因区段和人Vκ3-20基因区段。在一些实施方案中，一个或多个未重排人Jκ基因区段包含两个人Jκ基因区段。在一些实施方案中，一个或多个未重排人Jκ基因区段包含三个人Jκ基因区段。在一些实施方案中，一个或多个未重排人Jκ基因区段包含四个人Jκ基因区段。在一些实施方案中，一个或多个未重排人Jκ基因区段包含五个人Jκ基因区段。在一些实施方案中，一个或多个未重排人Jκ基因区段包含人Jκ1基因区段、人Jκ2基因区段、人Jκ3基因区段、人Jκ4基因区段、人Jκ5基因区段或它们的组合。

在一些实施方案中，包含κDLC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如种系基因组)中包含仅两个未重排人Vκ基因区段和五个未重排人Jκ基因区段。在一些实施方案中，仅两个未重排人Vκ基因区段包含人Vκ1-39基因区段和人Vκ3-20基因区段，并且五个未重排人Jκ基因区段包含人Jκ1基因区段、人Jκ2基因区段、人Jκ3基因区段、人Jκ4基因区段和人Jκ5基因区段。

在一些实施方案中，κDLC基因座的Cκ基因是啮齿动物(例如大鼠或小鼠)Cκ基因。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在κDLC基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在κDLC基因座处是异型接合的。

在一些实施方案中，包含κDLC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)缺乏能够重排形成内源免疫球蛋白κ轻链可变区的内源免疫球蛋白Vκ和/或Jκ基因区段。在一些实施方案中，包含κDLC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)缺乏能够重排形成内源λ轻链可变区的内源Vλ和/或Jλ基因区段。

在一些实施方案中，例如响应于抗原刺激，包含κDLC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含κ轻链的抗体，其中每条κ轻链包含可操作地连接于啮齿动物(例如大鼠或小鼠)κ轻链恒定结构域的人κ轻链可变结构域。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)具有包含有限人λ轻链可变区谱系的基因组(例如种系基因组)。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)具有包含工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)的基因组(例如种系基因组)，所述基因座包含有限人λ轻链可变区谱系。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)包含工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)，所述基因座包含有限人λ轻链可变区谱系，其中有限人λ轻链可变区谱系包含一个或两个人Vλ基因区段和一个或多个人Jλ基因区段。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)包含可操作地连接于轻链恒定区基因区段的有限人λ轻链可变区谱系。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)包含可操作地连接于啮齿动物(例如大鼠或小鼠)Cκ基因区段的有限人λ轻链可变区谱系。在一些实施方案中，如所提供的基因修饰的啮齿动物包含可操作地连接于啮齿动物(例如大鼠或小鼠)Cλ基因区段的有限人λ轻链可变区谱系。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)具有包含工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)的基因组(例如种系基因组)，所述基因座包含有限人λ轻链可变区谱系，其中有限人λ轻链可变区谱系包含单个重排人免疫球蛋白λ轻链可变区(Vλ/Jλ)。单个重排人λ轻链可变区包含与人Jλ基因区段接合的人Vλ基因区段。在一些实施方案中，基因修饰的啮齿动物包含可操作地连接于啮齿动物(例如大鼠或小鼠)Cκ或Cλ基因区段(例如小鼠Cλ1基因区段)的有限人λ轻链可变区谱系。这类工程化的免疫球蛋白轻链基因座是ULC基因座的一实例并且在本文中称为“ULCiK基因座”。包括ULCiK基因座的啮齿动物在例如WO2020/247623(以引用的方式整体并入)中举例说明。

在一些实施方案中，人Vλ基因区段选自由以下组成的组：Vλ4-69、Vλ8-61、Vλ4-60、Vλ6-57、Vλ10-54、Vλ5-52、Vλ1-51、Vλ9-49、Vλ1-47、Vλ7-46、Vλ5-45、Vλ1-44、Vλ7-43、Vλ1-40、Vλ5-37、Vλ1-36、Vλ3-27、Vλ3-25、Vλ2-23、Vλ3-22、Vλ3-21、Vλ3-19、Vλ2-18、Vλ3-16、Vλ2-14、Vλ3-12、Vλ2-11、Vλ3-10、Vλ3-9、Vλ2-8、Vλ4-3和Vλ3-1。在一些实施方案中，人Vλ基因区段选自由以下组成的组：Vλ5-52、Vλ1-51、Vλ9-49、Vλ1-47、Vλ7-46、Vλ5-45、Vλ1-44、Vλ7-43、Vλ1-40、Vλ5-37、Vλ1-36、Vλ3-27、Vλ3-25、Vλ2-23、Vλ3-22、Vλ3-21、Vλ3-19、Vλ2-18、Vλ3-16、Vλ2-14、Vλ3-12、Vλ2-11、Vλ3-10、Vλ3-9、Vλ2-8、Vλ4-3和Vλ3-1。在一些实施方案中，人Vλ基因区段选自由以下组成的组：Vλ1-51、Vλ5-45、Vλ1-44、Vλ1-40、Vλ3-21和Vλ2-14。在一些实施方案中，人Vλ基因区段是Vλ1-51或Vλ2-14。在一些实施方案中，人Jλ基因区段选自由以下组成的组：Jλ1、Jλ2、Jλ3、Jλ6和Jλ7。在一些实施方案中，人Jλ基因区段选自由以下组成的组：Jλ1、Jλ2、Jλ3和Jλ7。在一些实施方案中，人Jλ基因区段是Jλ2。

在一些实施方案中，包含ULCiK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)缺乏能够重排形成内源κ轻链可变区的内源Vκ和/或Jκ基因区段。在一些实施方案中，包含ULCiK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)缺乏能够重排形成内源λ轻链可变区的内源Vλ和/或Jλ基因区段。

在一些实施方案中，例如响应于抗原刺激，包含ULCiK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含轻链的抗体，其中每条轻链包含可操作地连接于(例如大鼠或小鼠)轻链恒定结构域(例如Cλ或Cκ域)的人λ轻链可变结构域。在一些实施方案中，由包含ULCiK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)的B细胞表达的所有轻链均包含由单个重排人λ轻链可变区或其体细胞超突变型式表达的人λ轻链可变结构域。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)具有包含工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)的基因组(例如种系基因组)，所述基因座包含有限人λ轻链可变区谱系，其中有限人λ轻链可变区谱系包含两个未重排人Vλ基因区段和一个或多个未重排人Jλ基因区段。在一些实施方案中，有限人λ轻链可变区谱系包含两个未重排人Vλ基因区段和四个未重排人Jλ基因区段。在一些实施方案中，有限人λ轻链可变区谱系包含两个未重排人Vλ基因区段和五个未重排人Jλ基因区段。在一些实施方案中，基因修饰的啮齿动物包含可操作地连接于啮齿动物(例如大鼠或小鼠)Cλ基因区段(例如小鼠Cλ1基因区段)的有限人λ轻链可变区谱系。这类工程化的免疫球蛋白轻链基因座是DLC基因座的一实例并且在本文中称为“DLCiK基因座”。包括DLCiK基因座的啮齿动物在例如WO2020/247623(以引用的方式整体并入)中举例说明。

在一些实施方案中，基因修饰的啮齿动物的种系基因组对于包含有限人λ轻链可变区谱系的工程化的免疫球蛋白κ轻链基因座来说是同型接合的。在一些实施方案中，基因修饰的啮齿动物的种系基因组对于包含有限人λ轻链可变区谱系的工程化的免疫球蛋白κ轻链基因座来说是异型接合的。

在一些实施方案中，包含DLCiK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)缺乏能够重排形成内源免疫球蛋白κ轻链可变区的内源免疫球蛋白Vκ和/或Jκ基因区段。在一些实施方案中，包含DLCiK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)缺乏能够重排形成内源λ轻链可变区的内源Vλ和/或Jλ基因区段。

在一些实施方案中，例如响应于抗原刺激，包含DLCiK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含轻链的抗体，其中每条轻链包含可操作地连接于啮齿动物(例如大鼠或小鼠)轻链恒定结构域(例如Cλ或Cκ域)的人λ轻链可变结构域。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)包含外源末端脱氧核苷酸转移酶(TdT)基因。包括外源TdT的啮齿动物在例如美国专利公布第2019/0223418号和PCT公布第WO 2017/210586号(每一者以引用的方式整体并入)中举例说明。在一些实施方案中，与无外源TdT基因的啮齿动物相比，包含外源TdT基因的啮齿动物(例如大鼠或小鼠)可具有增加的抗原受体多样性。

在一些实施方案中，如本文所述的啮齿动物具有包含可操作地连接于转录控制元件的外源TdT基因的基因组。

在一些实施方案中，转录控制元件包括RAG1转录控制元件、RAG2转录控制元件、免疫球蛋白重链转录控制元件、免疫球蛋白κ轻链转录控制元件、免疫球蛋白λ轻链转录控制元件或它们的任何组合。

在一些实施方案中，外源TdT位于免疫球蛋白κ轻链基因座、免疫球蛋白λ轻链基因座、免疫球蛋白重链基因座、RAG1基因座或RAG2基因座处。

在一些实施方案中，TdT是人TdT。在一些实施方案中，TdT是TdT的短同源异构体(TdTS)。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座和KoK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座和LoL基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座、KoK基因座和LoL基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座、KoK基因座、LoL基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座、KoK基因座和LoK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座、KoK基因座和LiK基因座。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座和LoK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座、LoK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座和LiK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座、LiK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座和ULC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座、ULC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座和DLC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座、DLC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座和κULC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座、κULC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座和κDLC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座、κDLC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座和ULCiK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座、ULCiK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座和DLCiK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座、DLCiK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含HoH基因座和HULC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座、HULC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座和KoK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座和LoL基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座、KoK基因座和LoL基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座、KoK基因座、LoL基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座、KoK基因座和LoK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座、KoK基因座和LiK基因座。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座和LoK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座、LoK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座和LiK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座、LiK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座和ULC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座、ULC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座和DLC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座、DLC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座和κULC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座、κULC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座和κDLC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座、κDLC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座和ULCiK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座、ULCiK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座和DLCiK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座、DLCiK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含UHC基因座和HULC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座、HULC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座和KoK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座和LoL基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座、KoK基因座和LoL基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoH基因座、KoK基因座、LoL基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座、KoK基因座和LoK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座、KoK基因座和LiK基因座。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座和LoK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoH基因座、LoK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座和LiK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoH基因座、LiK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座和κULC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoH基因座、κULC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座和κDLC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoH基因座、κDLC基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座和ULCiK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoH基因座、ULCiK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座和DLCiK基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoH基因座、DLCiK基因座或它们的组合处是同型接合的。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如其种系基因组)中包含LoH基因座和HULC基因座。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在LoH基因座、HULC基因座或它们的组合处是同型接合的。

包含κ通用轻链基因座的示例性啮齿动物

在本发明的一些示例性实施方案中，在取决于对未受限免疫球蛋白链的基于谱系序列和质谱法的分析的方法中宜利用包含具有在产生广泛可变区谱系的能力方面受到限制的免疫球蛋白基因座之一的基因组的基因修饰的非人类动物，例如啮齿动物，例如小鼠。在一些实施方案中，受限免疫球蛋白链为轻链，例如κ轻链。在一些实施方案中，基因修饰的啮齿动物在其基因组(例如其种系基因组)中包含：工程化的免疫球蛋白重链基因座(例如工程化的内源啮齿动物免疫球蛋白重链基因座)，所述基因座包含在一个或多个啮齿动物(例如大鼠或小鼠)免疫球蛋白重链恒定区基因(例如一个或多个内源啮齿动物(例如大鼠或小鼠)免疫球蛋白重链恒定区基因)上游(例如可操作地连接)的一个或多个未重排人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段(即，HoH基因座)；和工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)，所述基因座包含在Cκ基因上游(例如可操作地连接)的单个重排人κ轻链可变区(Vκ/Jκ)(κULC基因座)。包括HoH基因座和κULC基因座的示例性啮齿动物在例如美国专利第10,130,081号和第10,143,186号(每一者以引用的方式整体并入)中举例说明。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座和/或κULC基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座和κULC基因座处是同型接合的。

在一些实施方案中，在HoH基因座处的一个或多个未重排人V_H基因区段包括至少六个人V_H基因区段。在一些实施方案中，在HoH基因座处的一个或多个未重排人V_H基因区段包括至少18个人V_H基因区段。在一些实施方案中，在HoH基因座处的一个或多个未重排人V_H基因区段包括至少39个人V_H基因区段。在一些实施方案中，在HoH基因座处的一个或多个未重排人V_H基因区段包括至少80个人V_H基因区段。在一些实施方案中，在HoH基因座处的一个或多个未重排人D_H基因区段包括至少27个人D_H基因区段。在一些实施方案中，在HoH基因座处的一个或多个未重排人J_H基因区段包括至少六个人J_H基因区段。

在一些实施方案中，在HoH基因座处的一个或多个未重排人V_H基因区段包括至少18个人V_H基因区段，在HoH基因座处的一个或多个未重排人D_H基因区段包括27个人D_H基因区段，并且在HoH基因座处的一个或多个未重排人J_H基因区段包括六个人J_H基因区段。如本文所论述，这类工程化的免疫球蛋白重链基因座称为“1HoH基因座”。在一些实施方案中，在HoH基因座处的一个或多个未重排人V_H基因区段包括至少39个人V_H基因区段，在HoH基因座处的一个或多个未重排人D_H基因区段包括27个人D_H基因区段，并且在HoH基因座处的一个或多个未重排人J_H基因区段包括六个人J_H基因区段。如本文所论述，这类工程化的免疫球蛋白重链基因座称为“/>2HoH基因座”。在一些实施方案中，在HoH基因座处的一个或多个未重排人V_H基因区段包括至少80个人V_H基因区段，在HoH基因座处的一个或多个未重排人D_H基因区段包括27个人D_H基因区段，并且在HoH基因座处的一个或多个未重排人J_H基因区段包括六个人J_H基因区段。如本文所论述，这类工程化的免疫球蛋白重链基因座称为“/>3HoH基因座”。/>

在一些实施方案中，包含HoH基因座和κULC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)还包括缺乏功能性内源啮齿动物Adam6基因的基因组(例如种系基因组)。在一些实施方案中，包含HoH基因座和κULC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如种系基因组)中还包括编码一种或多种啮齿动物ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6a。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6b。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6a和小鼠ADAM6b。包含HoH基因座和κULC基因座并包括编码一种或多种啮齿动物ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列的啮齿动物在例如美国专利第10,130,081号(以引用的方式整体并入)中举例说明。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)表达一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列的基因组(例如种系基因组)，所述一个或多个核苷酸序列包括在与HoH基因座相同的染色体上。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含HoH基因座的基因组(例如种系基因组)，所述基因组包含编码一种或多种啮齿动物ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列代替人类Adam6伪基因的基因组(例如种系基因组)。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含替代人类Adam6伪基因的编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列的基因组(例如种系基因组)。

在一些实施方案中，包含HoH基因座和κULC基因座的基因修饰的啮齿动物包括包含以下的基因组(例如种系基因组)：包含第一和第二人V_H基因区段的一个或多个人V_H基因区段，和介于第一人V_H基因区段与第二人V_H基因区段之间的编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列。在一些实施方案中，第一人V_H基因区段是V_H1-2并且第二人V_H基因区段是V_H6-1。在一些实施方案中，编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列介于人V_H基因区段与人D_H基因区段之间。

在一些实施方案中，在κULC基因座处的单个重排人κ轻链可变区包含人Vκ基因区段和人Jκ基因区段。在一些实施方案中，人Vκ基因区段是人Vκ1-39基因区段或人Vκ3-20基因区段。在一些实施方案中，人Jκ基因区段是人Jκ1基因区段、人Jκ2基因区段、人Jκ3基因区段、人Jκ4基因区段或人Jκ5基因区段。在一些实施方案中，人Vκ基因区段是人Vκ1-39基因区段，并且人Jκ基因区段是人Jκ5基因区段。在一些实施方案中，在κULC基因座处的单个重排人κ轻链可变区是人Vκ1-39/Jκ5。在一些实施方案中，人Vκ基因区段是人Vκ3-20基因区段，并且人Jκ基因区段是人Jκ1基因区段。在一些实施方案中，在κULC基因座处的单个重排人κ轻链可变区是人Vκ3-20/Jκ1。

在一些实施方案中，κULC基因座包含非天然前导序列。在一些实施方案中，前导序列包含信号肽。在一些实施方案中，前导序列包含非天然信号肽。

在一些实施方案中，例如响应于抗原刺激，包含HoH基因座和κULC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含以下的抗体：(a)重链，其中每条重链包含可操作地连接于啮齿动物(例如大鼠或小鼠)重链恒定结构域的人重链可变结构域；(b)κ轻链，其中每条κ轻链包含可操作地连接于κ轻链恒定结构域的人κ轻链可变结构域。在一些实施方案中，由基因修饰的啮齿动物(例如大鼠或小鼠)表达的所有κ轻链均包含由单个重排人κ轻链可变区或其体细胞超突变型式表达的人κ轻链可变结构域。

在一些实施方案中，包括包含单个人类重排κ可变区的κULC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)在其轻链可变区，例如其CDR3区中还包含至少一个非组氨酸残基经组氨酸区的取代。这类基因修饰的啮齿动物描述于美国专利第9,801,362号(以引用的方式整体并入本文中)中。对包含非组氨酸残基经组氨酸残基取代或组氨酸残基插入的基因修饰的啮齿动物进行免疫接种有助于使用本文和实施例中所述的谱系测序与MS方法的组合鉴定对抗原表现出pH值依赖性特性的抗体。

在一些实施方案中，本公开提供了鉴定来自啮齿动物的对抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR序列(例如CDR3序列)的方法，所述啮齿动物在其种系基因组中包含κULC基因座，所述方法包括：(i)获得从样品获得的人免疫球蛋白重链可变结构域的多个肽序列，所述样品包含由用所述抗原进行免疫接种的基因修饰的啮齿动物产生的抗体群体；和(ii)将人免疫球蛋白重链可变结构域序列的文库用所述多个肽序列进行询问，其中所述文库包含由所述进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链可变结构域序列。

在一些实施方案中，本公开提供了鉴定来自啮齿动物的对抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR序列(例如CDR3序列)的方法，所述啮齿动物在其种系基因组中包含κULC基因座，所述方法包括：(i)获得人免疫球蛋白重链可变结构域序列的文库，所述文库包含由用所述抗原进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链可变结构域序列；和(ii)将所述文库用从样品获得的人免疫球蛋白重链可变结构域的多个肽序列进行询问，所述样品包含由用所述抗原进行免疫接种的啮齿动物产生的抗体群体。

包含λ通用轻链基因座的示例性啮齿动物

在本发明的其它实施方案中，所述方法利用受限λ轻链。在一些实施方案中，基因修饰的啮齿动物在其基因组(例如其种系基因组)中包含：工程化的免疫球蛋白重链基因座(例如工程化的内源啮齿动物免疫球蛋白重链基因座)，所述基因座包含在一个或多个啮齿动物(例如大鼠或小鼠)免疫球蛋白重链恒定区基因(例如一个或多个内源啮齿动物(例如大鼠或小鼠)免疫球蛋白重链恒定区基因)上游(例如可操作地连接)的一个或多个未重排人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段(即，HoH基因座)；和工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)，所述基因座包含有限人λ轻链可变区谱系，其中有限人λ轻链可变区谱系包含单个重排人免疫球蛋白λ轻链可变区(Vλ/Jλ)并且在(例如可操作地连接)轻链恒定区基因上游(ULCiK基因座)。包括HoH基因座和ULCiK基因座的啮齿动物在例如WO 2020/247623(以引用的方式整体并入)中举例说明。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座和/或ULCiK基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在HoH基因座和ULCiK基因座处是同型接合的。

在一些实施方案中，在HoH基因座处的一个或多个未重排人V_H基因区段包括至少18个人V_H基因区段，在HoH基因座处的一个或多个未重排人D_H基因区段包括27个人D_H基因区段，并且在HoH基因座处的一个或多个未重排人J_H基因区段包括六个人J_H基因区段。如本文所论述，这类工程化的免疫球蛋白重链基因座称为“1HoH基因座”。在一些实施方案中，在HoH基因座处的一个或多个未重排人V_H基因区段包括至少39个人V_H基因区段，在HoH基因座处的一个或多个未重排人D_H基因区段包括27个人D_H基因区段，并且在HoH基因座处的一个或多个未重排人J_H基因区段包括六个人J_H基因区段。如本文所论述，这类工程化的免疫球蛋白重链基因座称为“/>2HoH基因座”。在一些实施方案中，在HoH基因座处的一个或多个未重排人V_H基因区段包括至少80个人V_H基因区段，在HoH基因座处的一个或多个未重排人D_H基因区段包括27个人D_H基因区段，并且在HoH基因座处的一个或多个未重排人J_H基因区段包括六个人J_H基因区段。如本文所论述，这类工程化的免疫球蛋白重链基因座称为“/>3HoH基因座”。

在一些实施方案中，包含HoH基因座和ULCiK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)还包括缺乏功能性内源啮齿动物Adam6基因的基因组(例如种系基因组)。在一些实施方案中，包含HoH基因座和ULCiK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)在其基因组(例如种系基因组)中还包括编码一种或多种啮齿动物ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6a。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6b。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6a和小鼠ADAM6b。包含HoH基因座和ULCiK基因座并且包括编码一种或多种啮齿动物ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列的啮齿动物在例如美国专利第10,130,081号(以引用的方式整体并入)中举例说明。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)表达一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列的基因组(例如种系基因组)，所述一个或多个核苷酸序列包括在与HoH基因座相同的染色体上。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含HoH基因座的基因组(例如种系基因组)，所述基因组包含编码一种或多种啮齿动物ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列代替人类Adam6伪基因的基因组(例如种系基因组)。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含替代人类Adam6伪基因的编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列的基因组(例如种系基因组)。

在一些实施方案中，包含HoH基因座和ULCiK基因座的基因修饰的啮齿动物包括包含以下的基因组(例如种系基因组)：包含第一和第二人V_H基因区段的一个或多个人V_H基因区段，和介于第一人V_H基因区段与第二人V_H基因区段之间的编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列。在一些实施方案中，第一人V_H基因区段是V_H1-2且第二人V_H基因区段是V_H6-1。在一些实施方案中，编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列介于人V_H基因区段与人D_H基因区段之间。

在一些实施方案中，在ULC基因座处的单个重排人λ轻链可变区包含人Vλ基因区段和人Jλ基因区段。在一些实施方案中，人Vλ基因区段选自由以下组成的组：Vλ4-69、Vλ8-61、Vλ4-60、Vλ6-57、Vλ10-54、Vλ5-52、Vλ1-51、Vλ9-49、Vλ1-47、Vλ7-46、Vλ5-45、Vλ1-44、Vλ7-43、Vλ1-40、Vλ5-37、Vλ1-36、Vλ3-27、Vλ3-25、Vλ2-23、Vλ3-22、Vλ3-21、Vλ3-19、Vλ2-18、Vλ3-16、Vλ2-14、Vλ3-12、Vλ2-11、Vλ3-10、Vλ3-9、Vλ2-8、Vλ4-3和Vλ3-1。在一些实施方案中，人Vλ基因区段选自由以下组成的组：Vλ5-52、Vλ1-51、Vλ9-49、Vλ1-47、Vλ7-46、Vλ5-45、Vλ1-44、Vλ7-43、Vλ1-40、Vλ5-37、Vλ1-36、Vλ3-27、Vλ3-25、Vλ2-23、Vλ3-22、Vλ3-21、Vλ3-19、Vλ2-18、Vλ3-16、Vλ2-14、Vλ3-12、Vλ2-11、Vλ3-10、Vλ3-9、Vλ2-8、Vλ4-3和Vλ3-1。在一些实施方案中，人Vλ基因区段选自由以下组成的组：Vλ1-51、Vλ5-45、Vλ1-44、Vλ1-40、Vλ3-21和Vλ2-14。在一些实施方案中，人Vλ基因区段是Vλ1-51或Vλ2-14。在一些实施方案中，人Jλ基因区段选自由以下组成的组：Jλ1、Jλ2、Jλ3、Jλ6和Jλ7。在一些实施方案中，人Jλ基因区段选自由以下组成的组：Jλ1、Jλ2、Jλ3和Jλ7。在一些实施方案中，人Jλ基因区段是Jλ2。

在一些实施方案中，ULC基因座包含非天然前导序列。在一些实施方案中，ULC基因座包含单个重排人λ轻链可变区和Vκ前导序列。在一些实施方案中，前导序列包含信号肽。在一些实施方案中，前导序列包含非天然信号肽。

在一些实施方案中，基因修饰的啮齿动物包含可操作地连接于啮齿动物(例如大鼠或小鼠)Cκ或Cλ基因区段(例如小鼠Cλ1基因区段)的有限人λ轻链可变区谱系。

在一些实施方案中，人Vλ基因区段是Vλ1-51，人Jλ基因区段是Jλ2，并且轻链恒定区基因是啮齿动物Cλ(例如小鼠Cλ1)。在一些实施方案中，人Vλ基因区段是Vλ1-51，人Jλ基因区段是Jλ2，并且轻链恒定区基因是啮齿动物Cκ。在一些实施方案中，人Vλ基因区段是Vλ2-14，人Jλ基因区段是Jλ2，并且轻链恒定区基因是啮齿动物Cλ(例如小鼠Cλ1)。在一些实施方案中，人Vλ基因区段是Vλ2-14，人Jλ基因区段是Jλ2，并且轻链恒定区基因是啮齿动物Cκ。

在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在ULCiK基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在ULCiK基因座处是异型接合的。

在一些实施方案中，例如响应于抗原刺激，包含HoH基因座和ULC基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含以下的抗体：(a)重链，其中每条重链包含可操作地连接于啮齿动物(例如大鼠或小鼠)重链恒定结构域的人重链可变结构域；和(b)轻链，其中每条轻链包含可操作地连接于(例如大鼠或小鼠)轻链恒定结构域(例如Cλ或Cκ域)的人λ轻链可变结构域。在一些实施方案中，由包含ULCiK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)的B细胞表达的所有轻链均包含由单个重排人λ轻链可变区或其体细胞超突变型式表达的人λ轻链可变结构域。

在一些实施方案中，本公开提供了鉴定来自啮齿动物的对抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR序列(例如CDR3序列)的方法，所述啮齿动物在其种系基因组中包含ULCiK基因座，所述方法包括：(i)获得从样品获得的人免疫球蛋白重链可变结构域的多个肽序列，所述样品包含由用所述抗原进行免疫接种的基因修饰的啮齿动物产生的抗体群体；和(ii)将人免疫球蛋白重链可变结构域序列的文库用所述多个肽序列进行询问，其中所述文库包含由所述进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链可变结构域序列。

在一些实施方案中，本公开提供了鉴定来自啮齿动物的对抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR序列(例如CDR3序列)的方法，所述啮齿动物在其种系基因组中包含ULCiK基因座，所述方法包括：(i)获得人免疫球蛋白重链可变结构域序列的文库，所述文库包含由用所述抗原进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链可变结构域序列；和(ii)将所述文库用从样品获得的人免疫球蛋白重链可变结构域的多个肽序列进行询问，所述样品包含由用所述抗原进行免疫接种的啮齿动物产生的抗体群体。

包含通用重链基因座的示例性啮齿动物

在其它实施方案中，用于本文所述的方法中的小鼠中的受限免疫球蛋白链是重链。在一些实施方案中，基因修饰的啮齿动物在其基因组(例如其种系基因组)中包含：工程化的免疫球蛋白重链基因座(例如工程化的内源啮齿动物免疫球蛋白重链基因座)，所述基因座包含在一个或多个啮齿动物(例如大鼠或小鼠)恒定区基因上游(例如可操作地连接)的单个重排人重链可变区(即，UHC基因座或常见重链基因座)；和工程化的免疫球蛋白κ轻链基因座(例如工程化的内源啮齿动物免疫球蛋白κ轻链基因座)，所述基因座包含在Cκ基因上游(例如可操作地连接于)的一个或多个未重排人Vκ基因区段和一个或多个未重排人Jκ基因区段(即，KoK基因座)。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座和/或KoK基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在UHC基因座和KoK基因座处是同型接合的。

在一些实施方案中，在UHC基因座处的单个重排人重链可变区包含单个人V_H基因区段、单个人D_H基因区段和单个人J_H基因区段。在一些实施方案中，单个人V_H基因区段是人V_H3-23，单个人D_H基因区段是人D_H4-4，并且单个人J_H基因区段是人J_H4。

在一些实施方案中，在UHC基因座处的单个重排人重链可变区包含由两个氨基酸分隔的单个人V_H基因区段和单个人J_H基因区段。在一些实施方案中，单个人V_H基因区段是人V_H3-23，单个人J_H基因区段是人J_H4，并且两个为甘氨酸和酪氨酸。

在一些实施方案中，在UHC基因座处的一个或多个啮齿动物(例如小鼠或大鼠)重链恒定区基因是一个或多个内源啮齿动物(例如小鼠或大鼠)重链恒定区基因。

在一些实施方案中，包含UHC基因座和KoK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)缺乏功能性内源啮齿动物Adam6基因。在一些实施方案中，包含UHC基因座和KoK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)包括编码一种或多种啮齿动物ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6a。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6b。在一些实施方案中，一种或多种啮齿动物ADAM6多肽是或包含小鼠ADAM6a和小鼠ADAM6b。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)表达一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列的基因组(例如种系基因组)，所述一个或多个核苷酸序列包括在与UHC基因座相同的染色体上。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含UHC基因座的基因组(例如种系基因组)，所述基因组包含编码一种或多种啮齿动物ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列代替人类Adam6伪基因的基因组(例如种系基因组)。在一些实施方案中，如所提供的基因修饰的啮齿动物(例如大鼠或小鼠)具有包含替代人类Adam6伪基因的编码一种或多种啮齿动物(例如大鼠或小鼠)ADAM6多肽、其功能直系同源物、功能同源物或功能片段的一个或多个核苷酸序列的基因组(例如种系基因组)。

在一些实施方案中，在KoK基因座处的一个或多个未重排人Vκ基因区段包括至少六个人Vκ基因区段。在一些实施方案中，在KoK基因座处的一个或多个未重排人Vκ基因区段包括至少16个人Vκ基因区段。在一些实施方案中，在KoK基因座处的一个或多个未重排人Vκ基因区段包括至少30个人Vκ基因区段。在一些实施方案中，在KoK基因座处的一个或多个未重排人Vκ基因区段包括至少40个人Vκ基因区段。在一些实施方案中，一个或多个未重排人Jκ基因区段在KoK基因座处包括至少五个人Jκ基因区段。

在一些实施方案中，在KoK基因座处的一个或多个未重排人Vκ基因区段包括至少16个人Vκ基因区段，并且一个或多个未重排人Jκ基因区段包括至少五个人Jκ基因区段。如本文所述，这类工程化的免疫球蛋白重链基因座在本文中称为“1KoK基因座”。在一些实施方案中，在KoK基因座处的一个或多个未重排人Vκ基因区段包括至少30个人Vκ基因区段，并且在KoK基因座处的一个或多个未重排人Jκ基因区段包括至少五个人Jκ基因区段。如本文所述，这类工程化的免疫球蛋白重链基因座在本文中称为“2KoK基因座”。在一些实施方案中，在KoK基因座处的一个或多个未重排人Vκ基因区段包括至少40个人Vκ基因区段，并且在KoK基因座处的一个或多个未重排人Jκ基因区段包括至少五个人Jκ基因区段。如本文所述，这类工程化的免疫球蛋白重链基因座在本文中称为“/>3KoK基因座”。

在一些实施方案中，KoK基因座的免疫球蛋白κ轻链恒定区基因是啮齿动物(例如大鼠或小鼠)Cκ基因。在一些实施方案中，KoK基因座的免疫球蛋白κ轻链恒定区基因是内源啮齿动物(例如大鼠或小鼠)Cκ基因。在一些实施方案中，KoK基因座的免疫球蛋白κ轻链恒定区基因是在内源免疫球蛋白κ轻链基因座处的内源啮齿动物(例如大鼠或小鼠)Cκ基因。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在KoK基因座处是同型接合的。在一些实施方案中，基因修饰的啮齿动物(例如大鼠或小鼠)在KoK基因座处是异型接合的。

在一些实施方案中，例如响应于抗原刺激，包含UHC基因座和KoK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)产生尤其包含以下的抗体：(a)重链，其中每条重链包含可操作地连接于啮齿动物(例如大鼠或小鼠)重链恒定结构域的人重链可变结构域；和(b)κ轻链，其中每条κ轻链包含可操作地连接于啮齿动物(例如大鼠或小鼠)κ轻链恒定结构域的人κ轻链可变结构域。在一些实施方案中，由基因修饰的啮齿动物(例如大鼠或小鼠)表达的所有重链均包含由单个重排人重链可变区或其体细胞超突变型式表达的人重链可变结构域。

在一些实施方案中，包含UHC基因座和KoK基因座的基因修饰的啮齿动物(例如大鼠或小鼠)还包含外源末端脱氧核苷酸转移酶(TdT)基因。在一些实施方案中，与无外源TdT基因的啮齿动物相比，包含外源末端脱氧核苷酸转移酶(TdT)基因的啮齿动物(例如大鼠或小鼠)可具有增加的抗原受体多样性。

在一些实施方案中，如本文所述的啮齿动物具有包含可操作地连接于转录控制元件的外源末端脱氧核苷酸转移酶(TdT)基因的基因组。

在一些实施方案中，TdT为人TdT。在一些实施方案中，TdT为TdT的短同源异构体(TdTS)。

在一些实施方案中，本公开提供了鉴定来自啮齿动物的对抗原具有特异性的抗体的人免疫球蛋白轻链可变结构域或CDR序列(例如CDR3序列)的方法，所述啮齿动物在其种系基因组中包含UHC基因座，所述方法包括：(i)获得从样品获得的人免疫球蛋白轻链可变结构域的多个肽序列，所述样品包含由用所述抗原进行免疫接种的基因修饰的啮齿动物产生的抗体群体；和(ii)将人免疫球蛋白轻链可变结构域序列的文库用所述多个肽序列进行询问，其中所述文库包含由所述进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白轻链可变结构域序列。

在一些实施方案中，本公开提供了鉴定来自啮齿动物的对抗原具有特异性的抗体的人免疫球蛋白轻链可变结构域或CDR序列(例如CDR3序列)的方法，所述啮齿动物在种系基因组中包含UHC基因座，所述方法包括：(i)获得人免疫球蛋白轻链可变结构域序列的文库，所述文库包含由用所述抗原进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白轻链可变结构域序列；和(ii)将所述文库用从样品获得的人免疫球蛋白轻链可变结构域的多个肽序列进行询问，所述样品包含由用所述抗原进行免疫接种的啮齿动物产生的抗体群体。

产生的抗原特异性抗体

在已经使用本文所述的方法从基因修饰的非人类动物(例如啮齿动物，例如大鼠或小鼠)鉴定出所关注的抗体(例如所关注的可变结构域和/或所关注的CDR序列)之后，所述方法还可包括在抗原结合蛋白或第二重组抗体中表达编码所获得的抗体(即第一抗体)或其部分(例如可变区)的核苷酸序列。在一些实施方案中，通过本文所述的方法鉴定的抗体序列随后在宿主细胞中表达。在一些实施方案中，本文鉴定的抗体的可变区序列被克隆成在宿主细胞中表达的第二重组抗体。下文描述了第二重组抗体的各种实施方案。在各种实施方案中，对通过本文所述的方法获得的抗体进行进一步测试以确认与抗原免疫原的结合，或确定抗体的动力学结合参数。在一些实施方案中，在多种测定法中对来自表达(例如转染)通过本文所述的方法获得的第二抗体的细胞的上清液或纯化的蛋白质进行筛选以确定对抗原的结合亲和力和/或特异性。可使用的各种测定法包括上述实例中描述的那些测定法，以及所属领域的技术人员将显而易见的其它测定法。在各种实施方案中，抗体与所关注的抗原或所关注的抗原上的表位特异性结合(例如，K_D在微摩尔、纳摩尔或皮摩尔范围内)。

在一些实施方案中，编码所获得的抗体的核苷酸序列来自进行免疫接种的宿主(例如基因修饰的非人类动物，例如啮齿动物，例如小鼠或大鼠)，所述宿主在其基因组(例如其种系基因组)中包含受限的重链和/或轻链可变区谱系。在一些实施方案中，编码重链可变结构域的核苷酸序列从进行免疫接种的宿主(例如基因修饰的非人类动物，例如啮齿动物，例如小鼠或大鼠)获得，所述宿主在其基因组(例如其种系基因组)中包含受限的免疫球蛋白轻链可变区谱系。在一些实施方案中，编码轻链可变结构域的核苷酸序列从进行免疫接种的宿主(例如基因修饰的非人类动物，例如啮齿动物，例如小鼠或大鼠)获得，所述宿主在其基因组(例如其种系基因组)中包含受限的免疫球蛋白重链可变区谱系。

在一些实施方案中，编码重链可变结构域的核苷酸序列是从进行免疫接种的啮齿动物(例如小鼠)获得，所述啮齿动物在其基因组(例如其种系基因组)中包含单个重排人轻链可变区，所述单个重排人轻链可变区包含单个轻链V基因区段和单个轻链J基因区段，例如单个人轻链Vκ基因区段和单个人轻链Jκ基因区段或单个人轻链Vλ基因区段和单个人轻链Jλ基因区段(包含ULC基因座的啮齿动物，参见例如美国专利第10,143,186号和第10,130,081号，以整体引用的方式并入本文中)。因此，在用所关注的抗原对这类啮齿动物(例如小鼠)进行免疫接种之后，本文所述的方法允许分析针对所关注的抗原的抗体的重链可变区(例如，重链CDR3)序列，并选择重链可变区序列。

在一些实施方案中，对编码从进行免疫接种的宿主(例如，基因修饰的非人类动物，例如啮齿动物，例如小鼠或大鼠)获得的抗体的核苷酸序列进行密码子优化。在一些实施方案中，对编码所获得的重链和/或轻链可变结构域的核苷酸序列进行密码子优化。在一些实施方案中，对编码一个或多个所获得的CDR序列的核苷酸序列进行密码子优化。

在一些实施方案中，将所获得的编码人免疫球蛋白可变结构域(例如重链和/或轻链可变区)的核苷酸序列插入到用于表达抗原结合蛋白的构建体中。在一些实施方案中，抗原结合蛋白是抗体。

在一些实施方案中，将所获得的编码人免疫球蛋白可变结构域的核苷酸序列与人免疫球蛋白恒定区呈可操作的连接下插入到构建体中，使得抗体表达为完全人类抗体，其中人可变区在人恒定区上游。在一些实施方案中，在获得编码如本文所述的人免疫球蛋白重链可变结构域和/或人免疫球蛋白轻链可变结构域的核苷酸序列之后，所述方法还包括(i)将编码人免疫球蛋白重链可变结构域的核苷酸序列接合或连结到编码人免疫球蛋白重链恒定结构域的核苷酸序列，由此形成编码完全人免疫球蛋白重链的人免疫球蛋白重链序列，和/或(ii)将编码人免疫球蛋白轻链可变结构域(例如人免疫球蛋白κ和/或λ轻链可变结构域)的核苷酸序列接合或连结到编码人免疫球蛋白轻链恒定结构域(例如人免疫球蛋白κ和/或λ轻链恒定结构域)的核苷酸序列，由此形成编码完全人免疫球蛋白κ和/或λ轻链的人免疫球蛋白κ和/或λ轻链序列。在某些实施方案中，人免疫球蛋白重链序列和人免疫球蛋白κ和/或λ轻链序列在细胞(例如宿主细胞、哺乳动物细胞)中表达以便表达完全人免疫球蛋白重链和完全人免疫球蛋白κ和/或λ轻链并形成人类抗体。在一些实施方案中，人类抗体从细胞或包括细胞的培养基分离。

在一些实施方案中，抗原结合蛋白(例如第二抗体)是人类抗体和/或双特异性抗体。短语“双特异性抗体”包括能够选择性地结合两个或更多个表位的抗体。双特异性抗体一般包含两条不相同的重链，每条重链特异性结合不同表位-在两种不同分子上(例如，两种不同免疫原上的不同表位)或在相同分子上(例如，相同免疫原上的不同表位)。如果双特异性抗体能够选择性地结合两种不同表位(第一表位和第二表位)，那么第一重链对第一表位的亲和力一般比第一重链对第二表位的亲和力低至少一个至两个或三个或四个数量级，并且反之亦然。双特异性抗体特异性结合的表位可在相同或不同靶标上(例如，在相同或不同蛋白质上)。双特异性抗体可例如通过将识别相同抗原的不同表位的重链进行组合来制备。举例来说，可将编码识别相同免疫原的不同表位的重链可变序列的核酸序列与编码相同或不同重链恒定区的核酸序列融合，并且可在表达免疫球蛋白轻链的细胞中表达这类序列。典型的双特异性抗体具有两条重链，每条重链具有三个重链CDR，然后是(N端到C端)CH1结构域、铰链、CH2结构域和CH3结构域；和免疫球蛋白轻链，其不赋予表位结合特异性但可与每条重链缔合，或可与每条重链缔合并且可结合由重链表位结合区结合的一个或多个表位，或者可与每条重链缔合并能够将一条或两条重链结合于一个或两个表位。

举例来说，在抗原结合蛋白(例如，第二抗体)是双特异性抗体的情况下，在一些实施方案中，双特异性抗体通过对基因修饰的非人类动物，例如啮齿动物，例如小鼠或大鼠进行免疫接种来产生，所述非人类动物在其基因组(例如其种系基因组)中包含受限的重链和/或轻链可变区谱系。在一些实施方案中，非人类动物是小鼠并且小鼠在其基因组(例如其种系基因组)中包含单个重排人轻链可变区，所述单个重排人轻链可变区包含单个轻链V基因区段和单个轻链J基因区段，例如单个人轻链Vκ基因区段和单个人轻链Jκ基因区段或单个人轻链Vλ基因区段和单个人轻链Jλ基因区段(包含ULC基因座的啮齿动物，参见例如美国专利第10,143,186号和第10,130,081号，以整体引用的方式并入本文中)。因此，在用第一种所关注的抗原对这类小鼠进行免疫接种之后，本文所述的方法允许分析针对第一种所关注的抗原的抗体的重链可变区(例如，重链CDR3)序列，并且选择第一重链可变区序列用于双特异性抗体中。重复所述方法以通过对第二只小鼠进行免疫接种来获得针对第二所关注的抗原的第二个重链可变区，所述第二只小鼠还包含单个重排人轻链可变区，所述单个重排人轻链可变区包含单个轻链V基因区段和单个轻链J基因区段(例如与第一只小鼠中存在的轻链V和J基因区段相同)，并且使用本文所述的方法从所述第二只小鼠获得第二重链可变区。可替代地，第二重链可变区序列可使用所属领域已知的方法(例如杂交瘤技术或以引用的方式整体并入本文中的美国专利第10,143,186号和第10,130,081号中描述的其它方法)获得。第一和第二重链可变区在第一和第二重链(例如第一和第二人重链)中连同与第一和第二小鼠中存在的相同的轻链或其体细胞突变形式一起表达，从而产生双特异性抗体。

在一些实施方案中，例如在抗原结合蛋白(例如第二抗体)是双特异性抗体的情况下，将所获得的编码人免疫球蛋白可变结构域(例如人免疫球蛋白重链可变结构域)的核苷酸序列在与人重链免疫球蛋白恒定区呈可操作的连接下插入到构建体中，其中重链的Fc结构域包含促进重链异源二聚体形成和/或抑制重链同源二聚体形成的修饰。这类修饰提供于例如美国专利第5,731,168号、第5,807,706号、第5,821,333号、第7,642,228号和第8,679,785号和美国专利公布第2013/0195849号(每一者以引用的方式并入本文)中。在另一个实施方案中，例如在第二抗体是双特异性抗体的情况下，将所获得的编码人免疫球蛋白可变结构域，例如人免疫球蛋白重链可变结构域的核苷酸序列在与人重链免疫球蛋白恒定区(例如人IgG恒定区)呈可操作的连接下插入到构建体中，其中双特异性抗体的一条重链被修饰成略去结合蛋白A的决定子，使得同源二聚抗原结合蛋白与异源二聚抗原结合蛋白的亲和力有差异。因而，双特异性抗体的一条免疫球蛋白重链包含选自IgG1、IgG2和IgG4的人IgG的第一CH3区，其中第一CH3区结合蛋白A，并且第二免疫球蛋白重链包含选自IgG1、IgG2和IgG4的人IgG的第二CH3区，其中第二CH3区包含减少或消除第二CH3区与蛋白A结合的修饰，而双特异性抗体的免疫球蛋白轻链与两条免疫球蛋白重链配对。解决这一问题的组合物和方法描述于美国专利第9,309,326号中，每一专利以引用的方式整体并入本文中。

在一些实施方案中，通过本文所述的方法获得的编码人可变结构域的核苷酸序列在细胞系中以与人免疫球蛋白恒定区可操作连接的方式表达，从而产生完全人类抗体。在一些实施方案中，表达完全人类抗体的细胞系是适合于表达重组核酸序列的任何细胞。细胞包括原核生物和真核生物的细胞(单细胞或多细胞)、细菌细胞(例如大肠杆菌、芽孢杆菌属(Bacillus spp.)、链霉菌属(Streptomyces spp.)等菌株)、分枝杆菌属(mycobacteria)细胞、真菌细胞、酵母细胞(例如酿酒酵母(S.cerevisiae)、粟酒裂殖酵母(S.pombe)、巴氏毕赤酵母(P.pastoris)、甲醇毕赤酵母(P.methanolica)等)、植物细胞、昆虫细胞(例如SF-9、SF-21、杆状病毒感染的昆虫细胞、粉纹夜蛾(Trichoplusia ni)等)、非人类动物细胞、人类细胞或细胞融合物，例如杂交瘤或四体瘤。在一些实施方案中，细胞是人、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施方案中，细胞是真核的并且选自以下细胞：CHO(例如CHO Kl、DXB-11CHO、Veggie-CHO)、COS(例如COS-7)、视网膜细胞、Vera、CVl、肾(例如HEK293、293EBNA、MSR 293、MDCK、HaK、BHK)、HeLa、HepG2、WI38、MRC 5、Colo205、HB 8065、HL-60、(例如BHK21)、Jurkat、Daudi、A431(表皮)、CV-1、U937、3T3、L细胞、C127细胞、SP2/0、NS-0、MMT060562、Sertoli细胞、BRL 3A细胞、HTl 080细胞、10骨髓瘤细胞、肿瘤细胞和源自前述细胞的细胞系。在一些实施方案中，细胞包含一个或多个病毒基因，例如表达病毒基因的视网膜细胞(例如PER.C6^TM细胞)。

用于产生抗体的哺乳动物宿主细胞可在多种培养基中培养。市售培养基，例如Ham's F10(Sigma)、最低必需培养基((MEM)，Sigma)、RPMI-1640(Sigma)和杜尔贝科改良伊格尔培养基((Dulbecco’s Modif ied Eagle's Medium，DMEM)，Sigma)，适用于培养宿主细胞。培养基可根据需要补充激素和/或其它生长因子(例如胰岛素、运铁蛋白或表皮生长因子)、盐(例如氯化钠、钙、镁和磷酸盐)、缓冲液(例如HE PES)、核苷(例如腺苷和胸苷)、抗生素(例如庆大霉素(gentamycin))、微量元素(定义为通常以微摩尔范围的最终浓度存在的无机化合物)和葡萄糖或等效能源。如所属领域的技术人员已知的，还可包括适当浓度的任何其它补充剂。在各种实施方案中，培养条件，例如温度、pH值等，是先前用于被选择用于表达的宿主细胞的那些条件，并且对所属领域的技术人员来说是显而易见的。

制造抗原结合蛋白和编码其的核酸序列的方法

本文的公开内容描述了从用所关注的抗原进行免疫接种的宿主(即，本文所述的基因修饰的宿主)获得抗体的轻链和/或重链的氨基酸和/或核苷酸序列的方法。

在一些实施方案中，一种方法包括获得编码对所述抗原具有特异性的第一抗体的人免疫球蛋白可变结构域的核苷酸序列，所述方法包括：从来自进行免疫接种的宿主的第一样品获得包含编码多个免疫球蛋白可变结构域的多个核酸序列并且确定所述多个免疫球蛋白可变结构域的氨基酸序列，从进行免疫接种的宿主获得包含针对所关注的抗原的抗体群体的第二样品并且由此确定抗体群体的重链和/或轻链可变结构域的肽序列，将多个免疫球蛋白可变结构域的氨基酸序列用抗体群体的重链和/或轻链可变结构域的肽序列进行询问，从而获得对抗原具有特异性的抗体的人可变结构域的序列，并且获得编码对抗原具有特异性的抗体的人免疫球蛋白可变结构域的核苷酸序列。在一些实施方案中，所述方法还包括在抗原结合蛋白(例如第二抗体)中利用所获得的编码人免疫球蛋白可变结构域的核苷酸序列。在一些实施方案中，对抗原结合蛋白中编码人免疫球蛋白可变结构域的核苷酸序列进行密码子优化。

在一些实施方案中，本文提供了一种获得编码对抗原具有特异性的抗体的人免疫球蛋白可变结构域的核苷酸序列的方法，所述方法包括：从来自用抗原进行免疫接种的宿主的第一样品获得编码多个免疫球蛋白可变结构域的多个核酸序列并且确定所编码的多个免疫球蛋白可变结构域的氨基酸序列；从进行免疫接种的宿主获得包含针对所关注的抗原的抗体群体的第二样品并由此确定抗体群体的重链和/或轻链可变结构域的肽序列；将所编码的多个免疫球蛋白可变结构域的氨基酸序列用抗体群体的重链和/或轻链可变结构域的肽序列进行询问，从而获得对抗原具有特异性的抗体的人免疫球蛋白可变结构域；以及获得编码对抗原具有特异性的抗体的人免疫球蛋白可变结构域的核苷酸序列。

在一些实施方案中，本文提供了一种获得编码对抗原具有特异性的抗体的人免疫球蛋白可变结构域CDR(例如CDR3)序列的核苷酸序列的方法，所述方法包括：从来自用抗原进行免疫接种的宿主的第一样品获得编码多个免疫球蛋白可变结构域的多个核酸序列并且确定所编码的多个免疫球蛋白可变结构域的氨基酸序列；从进行免疫接种的宿主获得包含针对所关注的抗原的抗体群体的第二样品并由此确定抗体群体的重链和/或轻链可变结构域的肽序列；将多个免疫球蛋白可变结构域的氨基酸序列用来自第二样品的抗体群体的重链和/或轻链可变结构域的肽序列进行询问，从而获得对抗原具有特异性的抗体的人免疫球蛋白可变结构域CDR(例如CDR3)序列，并且获得编码对抗原具有特异性的抗体的人免疫球蛋白可变结构域CDR(例如CDR3)序列的核苷酸序列。

在一些实施方案中，本文提供了一种获得对抗原具有特异性的抗体的人免疫球蛋白可变结构域序列的方法，所述方法包括：从来自用抗原进行免疫接种的宿主的第一样品获得编码多个免疫球蛋白可变结构域的多个核酸序列并且确定所编码的多个免疫球蛋白可变结构域的氨基酸序列；从进行免疫接种的宿主获得包含针对所关注的抗原的抗体群体的第二样品并由此确定抗体群体的重链和/或轻链可变结构域的肽序列；对多个免疫球蛋白可变结构域的氨基酸序列进行询问，从而获得对抗原具有特异性的抗体的人免疫球蛋白可变结构域序列。

在一些实施方案中，本文提供了一种获得对抗原具有特异性的抗体的人免疫球蛋白可变结构域CDR(例如CDR3)序列的方法，所述方法包括：从来自用抗原进行免疫接种的宿主的第一样品获得编码多个免疫球蛋白可变结构域的多个核酸序列并且确定所编码的多个免疫球蛋白可变结构域的氨基酸序列，从进行免疫接种的宿主获得包含针对所关注的抗原的抗体群体的第二样品并由此确定抗体群体的重链和/或轻链可变结构域的肽序列，将多个免疫球蛋白可变结构域的氨基酸序列用抗体群体的重链和/或轻链可变结构域的肽序列进行询问，从而获得对抗原具有特异性的抗体的人免疫球蛋白可变结构域CDR，例如CDR3序列。

因此，在一些实施方案中，本文提供了一种核酸序列，其编码使用本文所述的方法获得的人免疫球蛋白可变结构域或编码人免疫球蛋白可变结构域CDR(例如CDR3)。在其它实施方案中，本文提供了一种核酸序列，其编码使用本文所述的方法获得的免疫球蛋白轻链或重链。

在一些实施方案中，本文还提供了使用本文所述的方法获得的人可变结构域或CDR(例如CDR3)的氨基酸序列。在其它实施方案中，本文提供了使用本文所述的方法获得的免疫球蛋白轻链或重链的氨基酸序列。

在一些实施方案中，本文还提供了一种制造抗体的方法，所述方法包括：在宿主细胞中表达(i)编码免疫球蛋白重链的核酸，所述免疫球蛋白重链包含可操作地连接于免疫球蛋白重链恒定区序列的人免疫球蛋白重链可变区序列；和(ii)编码免疫球蛋白轻链的核酸，所述免疫球蛋白轻链包含可操作地连接于免疫球蛋白轻链恒定区序列的人免疫球蛋白轻链可变区序列，其中人免疫球蛋白重链可变区序列和/或人免疫球蛋白轻链可变区序列通过本文提供的任何方法鉴定。在一些实施方案中，宿主细胞在使得宿主细胞表达包含免疫球蛋白重链和免疫球蛋白轻链的抗体的条件下培养。

在一些实施方案中，本文还提供了一种制备完全人免疫球蛋白重链和/或完全人免疫球蛋白轻链的方法，所述方法包括：(a)通过本文提供的任何方法鉴定人免疫球蛋白重链和/或轻链可变结构域序列；(b)将编码人免疫球蛋白重链可变结构域的核酸与编码人免疫球蛋白重链恒定结构域的核酸可操作地连接，以形成完全人免疫球蛋白重链，和/或将编码人免疫球蛋白轻链可变结构域的核酸与编码人免疫球蛋白轻链恒定结构域的核酸可操作地连接，以形成完全人免疫球蛋白轻链；以及(c)表达完全人免疫球蛋白重链和/或完全人免疫球蛋白轻链。在一些实施方案中，完全人免疫球蛋白重链和/或完全人免疫球蛋白轻链在宿主细胞中表达。

在一些实施方案中，本文还提供了一种抗体，其包含使用本文所述的方法获得的序列。

在一些实施方案中，提供了一种细胞，其表达源自于通过本文所述的方法获得的人免疫球蛋白可变结构域的抗原结合蛋白。在一些实施方案中，细胞是用于制造抗原结合蛋白，例如制造用于施用于受试者的抗原结合蛋白的细胞系。

药物组合物

在一些实施方案中，可向受试者(例如人类受试者)施用由本文公开的方法产生或源自由本文公开的方法产生的抗体、核酸或其治疗相关部分的抗原结合蛋白、编码抗原结合蛋白的核酸或其治疗相关部分。在一些实施方案中，药物组合物包括由本文公开的非人类动物产生的抗体。在一些实施方案中，药物组合物可包括缓冲剂、稀释剂、赋形剂或它们的任何组合。在一些实施方案中，必要时，组合物还可含有一种或多种额外治疗活性物质。

虽然对本文提供的药物组合物的描述主要针对适合于伦理上施用于人的药物组合物，但熟练技术人员将了解，这类组合物一般适合于施用于各种动物。非常了解为使组合物适合于施用于多种动物而对适合于施用于人类的药物组合物进行修改，并且一般熟练兽医学药理学家可利用常规实验(如果有)设计和/或进行这类修改。

举例来说，本文提供的药物组合物可以呈无菌可注射形式(例如适合于皮下注射或静脉内输注的形式)。举例来说，在一些实施方案中，药物组合物呈适合于注射的液体剂型提供。在一些实施方案中，药物组合物任选地在真空下呈粉剂(例如冻干和/或杀菌)提供，在注射之前可用水性稀释剂(例如水、缓冲液、盐溶液等)复原。在一些实施方案中，药物组合物在水、氯化钠溶液、乙酸钠溶液、苯甲醇溶液、磷酸盐缓冲盐水等中稀释和/或复原。在一些实施方案中，粉剂应轻轻地与水性稀释剂混合(例如不震荡)。

本文所述的药物组合物的制剂可通过药理学领域中已知或此后开发的任何方法制备。一般来说，这类制备方法包括使活性成分与稀释剂或另一赋形剂和/或一种或多种其它辅助剂缔合，然后必要和/或需要时，使产物成形和/或包装成所需单剂量或多剂量单元的步骤。

在一些实施方案中，包括由本文公开的方法产生的抗体的药物组合物可包括在用于存储或施用的容器中，例如小瓶、注射器(例如IV注射器)或袋(例如IV袋)。根据本公开的药物组合物可以呈单个单位剂量和/或呈多个单位剂量制备、包装和/或整批出售。如本文所用，“单位剂量”是包含预先确定量的活性成分的药物组合物的离散量。活性成分的量一般等于将施用于受试者的活性成分的剂量，和/或这类剂量的合宜分数，例如这类剂量的一半或三分之一。

根据本公开的药物组合物中活性成分、药学上可接受的赋形剂和/或任何额外成分的相对量将视所治疗的受试者的身分、体型和/或状态而变化，并且进一步视施用组合物的途径而变化。举例来说，组合物可包含0.1％与100％(w/w)之间的活性成分。

药物组合物可另外包含药学上可接受的赋形剂，如本文所用，药学上可接受的赋形剂包括适合于期望特定剂型的任何和所有溶剂、分散介质、稀释剂或其它液体媒剂、分散或悬浮助剂、表面活性剂、等张剂、增稠或乳化剂、防腐剂、固体粘合剂、润滑剂等。Remington's The Science and Practice of Pharmacy,第21版,A.R.Gennaro(Lippincott,Williams&Wilkins,Baltimore,MD,2006)公开了多种用于配制药物组合物的赋形剂和已知的用于制备其的技术。除非例如通过产生任何不合需要的生物效应或以有害方式另外与药物组合物的任何其它组分相互作用，使得任何常规赋形剂介质与物质或其衍生物不相容，否则其使用涵盖在本公开的范围内。

在一些实施方案中，药学上可接受的赋形剂是至少95％、至少96％、至少97％、至少98％、至少99％或100％纯。在一些实施方案中，赋形剂经批准用于人类和兽医学用途。在一些实施方案中，赋形剂经美国食品与药物管理局(the United States Food and DrugAdministr ation)批准。在一些实施方案中，赋形剂是医药级。在一些实施方案中，赋形剂满足美国药典(the United States Pharmacopoeia，USP)、欧洲药典(the EuropeanPharmacopoeia，EP)、英国药典(the British Pharmacopoeia)和/或国际药典(theInternational Pharmacopoeia)的标准。

在制造药物组合物中所用的药学上可接受的赋形剂包括(但不限于)惰性稀释剂、分散和/或成粒剂、表面活性剂和/或乳化剂、崩解剂、粘合剂、防腐剂、缓冲剂、润滑剂和/或油类。这类赋形剂可任选地包括在医药制剂中。根据配方设计师的判断，例如可可脂和栓剂蜡、着色剂、包覆剂、甜味剂、调味剂和/或芳香剂的赋形剂可存在于组合物中。

在一些实施方案中，所提供的药物组合物包含一种或多种药学上可接受的赋形剂(例如防腐剂、惰性稀释剂、分散剂、表面活性剂和/或乳化剂、缓冲剂等)。在一些实施方案中，药物组合物包含一种或多种防腐剂。在一些实施方案中，药物组合物不含防腐剂。

在一些实施方案中，药物组合物呈可冷藏和/或冷冻的形式提供。在一些实施方案中，药物组合物呈不可冷藏和/或冷冻的形式提供。在一些实施方案中，复原的溶液和/或液体剂型可存储达复原后某一段时间(例如2小时、12小时、24小时、2天、5天、7天、10天、2周、一个月、两个月或更长时间)。在一些实施方案中，抗体组合物存储超过规定时间会引起抗体降解。

液体剂型和/或复原的溶液在施用之前可包含颗粒物质和/或褪色。在一些实施方案中，如果褪色或混浊和/或如果在过滤后仍然有颗粒物质，那么不应使用溶液。

药剂的配制和/或制造中的一般考虑可见于例如以引用的方式并入本文中的Remington:The Science and Practice of Pharmacy第21版,Lippincott Williams&Wilkins,2005。

试剂盒

本公开还提供了包装或试剂盒，所述包装或试剂盒包含一个或多个装有至少通过如本文所述的方法获得的蛋白质(单一或复杂(例如抗体或其片段))的容器。试剂盒可用于任何适用方法(例如研究法)中。任选地通告可以与这类容器相联，所述通告呈管制药品或生物产品的制造、使用或销售的政府机构指定的形式，其反映了(a)制造、使用或销售的机构批准用于施用于人类，(b)使用说明，和/或(c)管理两个或更多个实体和其组合之间材料和/或生物产品(例如如本文所述的非人类动物或非人类细胞)的转移的合同。

在一些实施方案中，提供了包含通过如本文所述的方法获得的氨基酸(例如抗体或其片段)的试剂盒。在一些实施方案中，提供了包含编码通过如本文所述的方法获得的抗体或其抗原结合片段的核酸(例如编码抗体或其片段的核酸)的试剂盒。在一些实施方案中，提供了包含通过如本文所述的方法获得的序列(氨基酸和/或核酸序列)的试剂盒。

在一些实施方案中，提供了如本文所述的试剂盒，所述试剂盒用于制造和/或研发用以治疗或诊断的药物(例如抗体或其片段)。

在一些实施方案中，提供了如本文所述的试剂盒，所述试剂盒用于制造和/或研发用以治疗、预防或改善疾病、病症或疾患的药物(例如抗体或其片段)。

在示例性实施方案的以下描述过程中某些实施方案的其它特征将变得显而易见，所述实施方案出于说明而给出，不意图限制。

虽然本发明已经特别参考许多实施方案来展示和描述，但所属领域的技术人员将了解，在不脱离本发明的精神和范围下可对本文公开的各种实施方案的形式和细节进行多种变化，并且本文公开的各种实施方案不意图充当对权利要求书的范围的限制。

示例性实施方案

实施方案1.一种从用特定抗原进行免疫接种的宿主获得对所述抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR的方法，所述方法包括：(i)从来自所述进行免疫接种的宿主的第一样品获得编码多个人免疫球蛋白可变结构域的多个核酸并确定编码的多个免疫球蛋白可变结构域的氨基酸序列，(ii)从所述进行免疫接种的宿主获得包含针对所述抗原的抗体群体的第二样品并从其中确定所述抗体群体的重链和/或轻链可变结构域的肽序列，(iii)将来自所述第一样品的编码的多个人免疫球蛋白可变结构域的氨基酸序列用来自所述第二样品的所述抗体群体的重链和/或轻链可变结构域的肽序列进行询问，由此获得对所述抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列；其中所述宿主是基因修饰的非人类哺乳动物，所述基因修饰的非人类哺乳动物在其基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于恒定区。

实施方案2.实施方案1的方法，其中所述宿主是啮齿动物。

实施方案3.实施方案2的方法，其中所述宿主是大鼠。

实施方案4.实施方案2的方法，其中所述宿主是小鼠。

实施方案5.实施方案1的方法，其中所述第一样品包含B细胞群体。

实施方案6.实施方案5的方法，其中所述第一样品是骨髓样品和/或脾样品。

实施方案7.前述实施方案中任一项的方法，其中从所述第一样品获得编码多个免疫球蛋白可变结构域的多个核酸序列包括从所述核酸序列制备cDNA并且对所述第一样品中的重排重链VDJ序列和/或重排轻链VJ序列进行测序。

实施方案8.实施方案7的方法，其中从所述第一样品获得编码多个免疫球蛋白可变结构域的多个核酸使用DNA测序技术来确定。

实施方案9.实施方案8的方法，其中所述DNA测序技术是下一代DNA测序。

实施方案10.前述实施方案中任一项的方法，其中所述第二样品选自由血清、血浆、淋巴器官、肠、脑脊髓液、脑、脊髓或胎盘组成的组。

实施方案11.前述实施方案中任一项的方法，其中从所述第二样品确定肽序列包括对所述第二样品中的所述抗体群体的重链和/或轻链可变结构域进行质谱分析。

实施方案12.实施方案11的方法，其中所述质谱分析将液相色谱法与质谱法组合(LC-MS)。

实施方案13.实施方案11或12的方法，其中所述方法还包括在质谱分析之前对所述抗体群体的重链和/或轻链可变结构域进行蛋白水解消化。

实施方案14.前述实施方案中任一项的方法，其中从所述进行免疫接种的宿主获得包含针对所述特定抗原的抗体群体的第二样品包括使所述第二样品耗竭不针对所述特定抗原的抗体。

实施方案15.前述实施方案中任一项的方法，其中从所述进行免疫接种的宿主获得包含针对所述特定抗原的抗体群体的第二样品包括使所述第二样品富集针对所述特定抗原的抗体。

实施方案16.前述实施方案中任一项的方法，其中将来自所述第一样品的所述多个免疫球蛋白可变结构域的氨基酸序列用来自所述第二样品的所述抗体群体的重链和/或轻链可变结构域的肽序列进行询问包括将所述抗体群体的重链和/或轻链可变结构域的肽序列相互比对并与所述多个免疫球蛋白可变结构域的氨基酸序列进行比对。

实施方案17.前述实施方案中任一项的方法，所述方法还包括获得对所述抗原具有特异性的所述抗体的人可变结构域的核苷酸序列。

实施方案18.实施方案17的方法，其中所述方法还包括在第二重组抗体中表达所获得的编码所述人免疫球蛋白可变结构域的核苷酸序列。

实施方案19.实施方案18的方法，其中编码所述人可变结构域的所述核苷酸序列在与人免疫球蛋白恒定区呈可操作的连接下在细胞系中进行表达。

实施方案20.实施方案19的方法，其中所述人可变结构域是在与人免疫球蛋白重链恒定区呈可操作的连接下进行表达以产生人免疫球蛋白重链的人重链可变结构域。

实施方案21.实施方案20的方法，其中所述人免疫球蛋白重链在具有人免疫球蛋白轻链的细胞系中进行表达。

实施方案22.实施方案19的方法，其中所述人可变结构域是在与人免疫球蛋白轻链恒定区呈可操作的连接下进行表达以产生人免疫球蛋白轻链的人轻链可变结构域。

实施方案23.实施方案22的方法，其中所述人免疫球蛋白轻链在具有人免疫球蛋白重链的细胞系中表达。

实施方案24.实施方案18-23中任一项的方法，其中所述第二抗体是完全人类抗体。

实施方案25.实施方案18-24中任一项的方法，其中所述第二抗体是双特异性抗体。

实施方案26.实施方案18-25中任一项的方法，其中所述方法还包括对所述第二抗体进行纯化并确定所述纯化的第二抗体对特定抗原的亲和力和/或特异性。

实施方案27.前述实施方案中任一项的方法，其中所述宿主是基因修饰的小鼠，所述基因修饰的小鼠在其基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于鼠恒定区。

实施方案28.实施方案27的方法，其中所述免疫球蛋白重链可变区可操作地连接于小鼠重链恒定区，和/或所述免疫球蛋白轻链可变区可操作地连接于小鼠轻链恒定区。

实施方案29.实施方案28的方法，其中所述可操作地连接于小鼠重链恒定区的免疫球蛋白重链可变区处于内源小鼠重链基因座处，和/或所述可操作地连接于小鼠轻链恒定区的免疫球蛋白轻链可变区处于内源小鼠轻链基因座处。

实施方案30.实施方案27-29中任一项的方法，其中所述宿主是基因修饰的小鼠，所述基因修饰的小鼠在其基因组中，包括在其种系基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含多个人重链V基因区段、多个人D基因区段和多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠重链恒定区；和免疫球蛋白轻链可变区，其包含可操作地连接于鼠轻链恒定区的仅两个未重排人Vκ基因区段和五个未重排人Jκ基因区段，其中所述仅两个未重排人Vκ基因区段是人Vκ1-39基因区段和人Vκ3-20基因区段。

实施方案31.实施方案27的方法，其中所述宿主是基因修饰的小鼠，其基因组(a)在内源重链基因座处包含：(i)可操作地连接于小鼠重链恒定区的免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含多个未重排人V_H基因区段、多个未重排人D_H基因区段和多个未重排人J_H基因区段；(ii)可操作地连接于小鼠重链恒定区的受限的未重排重链可变区，所述受限的未重排重链可变区包含单个人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段；(iii)通用重链编码序列，所述通用重链编码序列包含可操作地连接于小鼠重链恒定区的单个重排人重链可变区；(iv)可操作地连接于小鼠重链恒定区的经组氨酸修饰的未重排重链可变区，所述经组氨酸修饰的未重排重链可变区包含一个或多个未重排人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段，还包含至少一个组氨酸对非组氨酸残基的取代或插入；(v)仅重链免疫球蛋白编码序列，所述仅重链免疫球蛋白编码序列包含可操作地连接于重链恒定区的免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个未重排人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段，其中非IgM基因，例如IgG基因缺乏编码功能性CH1结构域的序列；或(vi)可操作地连接于小鼠免疫球蛋白重链恒定区基因的工程化的内源啮齿动物免疫球蛋白重链基因座，所述基因座包含一个或多个未重排人V_L基因区段和一个或多个未重排人J_L基因区段；和/或(b)在内源轻链基因座处包含：(i)可操作地连接于小鼠轻链恒定区的免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含多个未重排人Vκ基因区段和多个未重排人Jκ基因区段；(ii)通用轻链编码序列，所述通用轻链编码序列包含可操作地连接于小鼠轻链恒定区的单个重排人轻链可变区；(iii)可操作地连接于小鼠轻链恒定区的受限的轻链可变区，所述受限的轻链可变区包含两个未重排人Vκ基因区段和一个或多个未重排人Jκ基因区段；或(iv)可操作地连接于小鼠轻链恒定区的经组氨酸修饰的轻链可变区，所述经组氨酸修饰的轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，还包含至少一个组氨酸对非组氨酸残基的取代或插入。

实施方案32.前述实施方案中任一项的方法，其中所述基因修饰的小鼠还包含功能性ADAM6基因，任选地其中所述功能性ADAM6基因是小鼠ADAM6基因。

实施方案33.前述实施方案中任一项的方法，其中所述基因修饰的小鼠还表达外源末端脱氧核苷酸转移酶(TdT)基因。

实施方案34.一种从用特定抗原进行免疫接种的宿主获得对所述抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR的方法，所述方法包括：从来自所述进行免疫接种的宿主的第一样品获得编码多个人类人免疫球蛋白重链可变结构域的多个核酸并确定编码的多个人免疫球蛋白可变结构域的氨基酸序列，从所述进行免疫接种的宿主获得包含针对所述特定抗原的抗体群体的第二样品并从其中确定所述抗体群体的人重链可变结构域的肽序列，将所述多个人免疫球蛋白重链可变结构域的氨基酸序列用所述抗体群体的人重链可变结构域的肽序列进行询问，由此获得对所述抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR；其中所述宿主是基因修饰的小鼠，所述基因修饰的小鼠在其基因组中，包括在其种系基因组中包含；免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含多个人重链V基因区段、多个人D基因区段和多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠恒定区；和免疫球蛋白轻链可变区，其为包含单个人轻链V基因区段和单个人轻链J基因区段的单个重排人轻链可变区，其中所述人免疫球蛋白轻链可变区可操作地连接于鼠轻链恒定区。

实施方案35.实施方案34的方法，其中所述单个重排人轻链可变区是包含单个人轻链Vκ基因区段和单个人轻链Jκ基因区段的单个重排人κ轻链可变区。

实施方案36.实施方案35的方法，其中所述单个人轻链Vκ基因区段是Vκ1-39或Vκ3-20基因区段，并且所述单个人轻链Jκ基因区段是Jκ1或Jκ5基因区段。

实施方案37.实施方案35的方法，其中所述鼠轻链恒定区是小鼠κ轻链恒定区。

实施方案38.实施方案35的方法，其中所述单个重排人轻链可变区在所述内源小鼠κ轻链基因座处可操作地连接于小鼠轻链恒定区。

实施方案39.实施方案35-38中任一项的方法，其中所述基因修饰的小鼠还包含功能性ADAM6基因，任选地其中所述功能性ADAM6基因是小鼠ADAM6基因。

实施方案40.实施方案39的方法，其中所述第一样品包含B细胞群体。

实施方案41.实施方案40的方法，其中所述第一样品是骨髓样品和/或脾样品。

实施方案42.实施方案34-41中任一项的方法，其中从所述第一样品获得编码多个人免疫球蛋白重链可变结构域的多个核酸序列包括从所述核酸序列制备cDNA并对所述第一样品中的重排重链VDJ序列进行测序。

实施方案43.实施方案42的方法，其中从所述第一样品获得编码多个免疫球蛋白可变结构域的多个核酸序列使用DNA测序技术来确定。

实施方案44.实施方案43的方法，其中所述DNA测序技术是下一代DNA测序。

实施方案45.实施方案34-44中任一项的方法，其中所述第二样品选自由血清、血浆、淋巴器官、肠、脑脊髓液、脑、脊髓或胎盘组成的组。

实施方案46.实施方案34-45中任一项的方法，其中从所述第二样品确定肽序列包括对所述第二样品中的所述抗体群体的重链可变结构域进行质谱分析。

实施方案47.实施方案46的方法，其中所述质谱分析将液相色谱法与质谱法组合(LC-MS)。

实施方案48.实施方案46或47的方法，其中所述方法还包括在质谱分析之前对所述抗体群体的重链可变结构域进行蛋白水解消化。

实施方案49.实施方案34-48中任一项的方法，其中从所述进行免疫接种的宿主获得包含针对所述特定抗原的抗体群体的第二样品包括使所述第二样品耗竭不针对所述特定抗原的抗体。

实施方案50.实施方案34-49中任一项的方法，其中从所述进行免疫接种的宿主获得包含针对所述特定抗原的抗体群体的第二样品包括使所述第二样品富集针对所述特定抗原的抗体。

实施方案51.实施方案34-50中任一项的方法，其中将所述多个人免疫球蛋白重链可变结构域的氨基酸序列用所述抗体群体的人重链可变结构域的肽序列进行询问包括将所述抗体群体的人重链可变结构域的肽序列相互比对并与所述多个人免疫球蛋白重链可变结构域的氨基酸序列进行比对。

实施方案52.实施方案34-51中任一项的方法，所述方法还包括获得对所述抗原具有特异性的所述抗体的人重链可变结构域的核苷酸序列。

实施方案53.实施方案52的方法，其中所述方法还包括在第二重组抗体中表达所获得的编码所述人免疫球蛋白重链可变结构域的核苷酸序列。

实施方案54.实施方案53的方法，其中编码所述人重链可变结构域的所述核苷酸序列在与人免疫球蛋白重链恒定区呈可操作的连接下在细胞系中进行表达以产生人免疫球蛋白重链。

实施方案55.实施方案54的方法，其中所述人免疫球蛋白重链在具有人免疫球蛋白轻链的细胞系中进行表达。

实施方案56.实施方案55的方法，其中所述人免疫球蛋白轻链源自与所述小鼠中所存在相同的单个重排可变区序列或其体细胞突变型式。

实施方案57.实施方案53-56中任一项的方法，其中所述第二抗体是人类抗体。

实施方案58.实施方案53-57中任一项的方法，其中所述第二抗体是双特异性抗体。

实施方案59.实施方案53-58中任一项的方法，其中所述方法还包括对所述第二抗体进行纯化并确定所述纯化的第二抗体对所述特定抗原的亲和力和/或特异性。

实施方案60.前述实施方案中任一项的方法，其中获得对所述抗原具有特异性的抗体的人免疫球蛋白重链可变结构域或CDR基于以下中的一者或多者：(1)从所述第二样品获得的独特肽与从所述第一样品获得的所述氨基酸序列中的CDR3序列匹配；(2)从所述第二样品获得的独特肽与从所述第一样品获得的所述氨基酸序列中的CDR1和/或CDR2序列匹配；(3)从所述第二样品获得的一种或多种独特肽与从所述第一样品获得的所述氨基酸序列中的一个或多个框架序列匹配；(4)下一代序列计数的数目，(5)排除具有甲硫氨酸的CDR序列，以及(6)排除具有潜在N糖基化的CDR序列。

实施方案61.一种获得对抗原具有特异性的抗体的免疫球蛋白可变结构域或CDR的方法，所述方法包括：从用所述抗原进行免疫接种的宿主获得包括针对抗原的抗体群体的样品，并且确定所述抗体群体的重链和/或轻链可变结构域的肽序列，将来自所述样品的所述抗体群体的重链和/或轻链可变结构域的肽序列用包含多个人免疫球蛋白可变结构域的氨基酸序列的文库进行询问，由此获得对所述抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列；其中所述进行免疫接种的宿主是基因修饰的非人类哺乳动物，所述基因修饰的非人类哺乳动物在其种系基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于恒定区。

实施方案62.实施方案61的方法，其中包含多个人免疫球蛋白可变结构域的所述氨基酸序列的文库由从用所述抗原进行免疫接种的宿主获得的多个核酸编码，其中所述进行免疫接种的宿主是基因修饰的非人类哺乳动物，所述基因修饰的非人类哺乳动物在其种系基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于恒定区。

实施方案63.实施方案61-62的方法，其中所述样品选自由血清、血浆、淋巴器官、肠、脑脊髓液、脑、脊髓或胎盘组成的组。

实施方案64.实施方案62-63的方法，其中包含多个人免疫球蛋白可变结构域的所述氨基酸序列的文库由从B细胞样品获得的多个核酸编码，所述B细胞样品是骨髓和/或脾样品。

实施方案65.一种用于鉴定对特定抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR的方法，所述方法包括：将由多个核酸编码的多个氨基酸序列与包含来自由针对所述抗原的抗体群体产生的轻链和/或重链可变结构域的肽片段的氨基酸序列进行比较，所述多个核酸编码由用所述抗原进行免疫接种的动物产生的多个人免疫球蛋白可变结构域；并且由此鉴定对所述抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR，其中所述动物是基因修饰的非人类哺乳动物，所述基因修饰的非人类哺乳动物在其基因组中包含：免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于恒定区；和免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于恒定区。

实施方案66.实施方案65的方法，其中所述多个核酸和所述肽片段从用所述抗原进行免疫接种的所述动物获得。

实施例

通过以下非限制性实施例进一步说明本发明。提出这些实施例是为了帮助理解本发明，而非意图且不应解释为以任何方式限制其范围。所述实施例不包括对所属领域的普通技术人员众所周知的常规方法(分子克隆技术等)的详细描述。除非另有指示，否则份数是重量份数，分子量是平均分子量，并且温度以摄氏度指示。所属领域的普通技术人员将理解，步骤的顺序不一定是绝对的，并且在某些实施方案中可变化以实现相同的结果。

本文图1中提供了所述过程的示例性概述。简单地说，并且如以下实施例中所述，将啮齿动物(例如小鼠或大鼠)用所关注的抗原(例如CD22-Fc融合蛋白)进行免疫接种，并且评估抗抗原滴度。将血液表现出高抗抗原滴度的动物处死，获得骨髓和/或脾，并且通过下一代测序(NGS)纯化和加工B细胞以产生免疫球蛋白序列(例如可变结构域序列，例如重链可变结构域序列)数据库。还从同一处死的动物获得血清(或替代所需样品)，并且富集抗原特异性抗体(在以下示例性实施方案中，针对抗Fc滴度进行耗竭并针对抗CD22滴度进行富集)；富集抗原的抗体经酶消化成肽，并且通过质谱法对这些肽进行测序。针对产生的NGS数据库搜索消化的肽序列以确定特异性针对所关注的抗原的抗体的可变结构域序列(例如，重链可变结构域序列)。

实施例1.对通用轻链小鼠的免疫接种

免疫接种

将κ通用轻链(κULC)小鼠(包含可操作地连接于小鼠Cκ的单个重排人Vk1-39Jκ5或Vk3-20Jκ1，并且还包含可操作地连接于小鼠重链恒定区的多个人重链V、D和J基因区段的小鼠；分别称为ULC1-39或ULC3-20的小鼠)用人CD22.Fc嵌合体(hCD22.hFc)免疫原进行免疫接种。κ通用轻链小鼠先前描述例如于美国专利第10,130,081号、第10,143,186号和第US2019/0090462号(全文并入本文中)中。在免疫接种开始之前从小鼠收集免疫前血清。使用标准佐剂和免疫方案以变化的时间间隔对小鼠进行加强。小鼠定期放血，并且测定各自抗原的抗血清滴度。

抗血清滴度测定

对蛋白质：

使用ELISA对蛋白质测定血清中针对免疫原的抗体滴度。在4℃下将九十六(96)孔微量滴定板(Thermo Scientific)用磷酸盐缓冲盐水(PBS，Irvine Scientific)中各2μg/ml的hCD22或人Fc蛋白包被过夜。将培养板用含有0.05％Tween 20的磷酸盐缓冲盐水(PBS-T，Sigma-Aldrich)洗涤，并在室温下用300μl含0.5％牛血清白蛋白(BSA，Sig ma-Aldrich)的PBS封闭1小时。免疫前和免疫抗血清在0.5％BSA-PBS中连续稀释三倍，并在室温下添加到培养板，保持1小时。洗涤培养板并将山羊抗小鼠IgG-Fc-辣根过氧化酶(HRP)结合的二级抗体(Jackson Immunoresearch)添加到培养板并在室温下孵育1小时。洗涤培养板并根据制造商推荐的程序，使用TMB/H₂O₂作为底物进行显影，并且使用分光光度计(Victor，PerkinElmer)记录450nm处的吸光度。使用Graphpad PRISM软体计算抗体滴度，其中抗体滴度定义为结合信号是背景的2倍的内推血清稀释因子。

对细胞：

使用Meso Scale Discovery(MSD)细胞结合ELISA对细胞测定血清中针对免疫原的抗体滴度。在37℃下将九十六(96)孔碳表面盘用PBS中40,000个细胞/孔的Raji和Jurkat细胞包被1小时。轻轻倒出细胞包被溶液，并在室温(RT)下将培养板用150μL含2％牛血清白蛋白(BSA，Sigma-Aldrich)的PBS封闭1小时。使用洗盘机(来自Mole cular Devices的2000)用PBS将培养板洗涤3次。免疫前和免疫抗血清在1％BSA-PBS中连续稀释三倍，并在室温下添加到培养板，保持1小时。洗涤培养板，然后将山羊抗小鼠IgG-Fc钌结合的二级抗体以1μg/mL添加到培养板，并在室温下孵育1小时。洗涤培养板，并且通过每孔添加150μl MSD的4X无表面活性剂的读取缓冲液T(稀释到1X)进行显影，并在MSD SECTOR^TM成像仪600仪器上读取。使用Graphpad PRISM软体计算抗血清滴度，其中抗体滴度定义为结合信号是背景的2倍的内推血清稀释因子。

结果

在用hCD22蛋白免疫原进行免疫接种之后研究ULC1-39和ULC3-20小鼠中的体液免疫反应。使用ELISA对人CD22和人Fc蛋白以及使用MSD细胞结合测定法对Raji和Jurkat细胞测定血清中的抗体滴度。来自小鼠的抗血清对hCD22和hFc蛋白显示出高滴度。在Raji细胞上引发高特异性滴度(表1)。抗体滴度定义为结合信号是背景的2倍的内推血清稀释因子。

表1.CD22 Fc免疫小鼠的抗体滴度

收集所有小鼠的脾和骨髓用于下一代测序(NGS)实验。每只小鼠的血清用于液相色谱质谱法(LC-MS)实验。

实施例2.参考抗体数据库的下一代测序和构建

实施例2.1.下一代测序(NGS)

对小鼠骨髓和脾细胞进行下一代测序或谱系测序。通过用含有2.5％胎牛血清(FBS)的1x磷酸盐缓冲盐水(PBS，Gibco)冲洗股骨，从CD22免疫小鼠的股骨收集骨髓。从小鼠的脾制备单细胞悬浮液。将来自脾的红血球和骨髓制剂用ACK溶解缓冲剂(Gibco)溶解。通过使用抗CD19(小鼠，B细胞标志物)磁珠和柱(Miltenyi Biotech)进行磁性细胞分选，从全部脾细胞阳性富集脾B细胞。对于谱系测序，加工每个小鼠组织，重复四次。使用RNeasy Plus RNA分离试剂盒(Qiagen)，根据制造商的说明书，从骨髓和纯化的脾B细胞分离全部RNA。/>

使用SMARTer^TM RACE cDNA扩增试剂盒(Clontech)和寡聚-dT引物进行逆转录以产生含有IgG恒定区序列的人重链cDNA。在逆转录期间，作为模板转换(TS)引物的反向补体的DNA序列附接于新合成cDNA的3′末端。纯化的cDNA通过两轮半巢式PCR扩增，以产生编码由获得mRNA的细胞表达的总IgG可变结构域补体的多个cDNA，然后第三轮PCR，以附接测序引物和索引。用于IgG谱系文库构建的示例性引物提供于表2中。

表2.用于IgG谱系测序的文库制备中所用的引物

/>

“XXXXXX”代表6碱基对的索引序列以实现用于测序的样品多路复用

使用Pippin Prep(SAGE Science)对人可变结构域cDNA进行400-700bp尺寸选择，并且通过qPCR使用KAPA文库定量试剂盒(KAPABiosystems)定量，然后将样品装载到Miseq测序器(Illumina)上进行2×300个循环的测序。

实施例2.2.抗体参考数据库构建

使用来自ULC小鼠的可变多样性接合(VDJ)区序列构建小鼠特异性蛋白质序列数据库，每个小鼠样品按组织分组。首先将从NGS获得的VDJ序列数据多路分解并基于质量、长度和与IgG恒定区引物的匹配进行过滤。将重叠双端读段合并且使用公共可用的IgBLAS T(NCBI，v2.2.25+)的本地安装进行分析，以将重排重链序列与人类种系V和J基因数据库比对。使用国际免疫遗传信息系统(Internation al Immunogenetics Information System，IMGT)边界提取CDR3序列。IMGT克隆型(AA)定义为具有保守CDR3-IMGT锚(半胱氨酸C 104、色氨酸W 118或苯丙氨酸F 118)的独特V-(D)-J重排，和独特CDR3-IMGT AA接合序列。计算每个蛋白质序列和HCDR3的出现频率。对于用于经由MS进行抗体鉴定的参考序列数据库构建，排除单读段序列以减少测序误差的影响。

应用额外的过滤器去除具有终止密码子和框外重排的非生产性序列。在创建数据库期间，还删除了含有框架区不完全比对的截短序列。

总共从骨髓和脾样品中获得6,452,901个读段。

VDJ编码序列基于氨基酸序列折叠，并且总共927,191个独特全长框内VDJ基因用于构建参考序列数据库。来自经CD22免疫接种的ULC小鼠的所有组织的结果用于构建数据库，所述数据库可通过从血清来源的抗体中鉴定的可变结构域肽进行询问。

描绘用CD22进行免疫接种的ULC小鼠中的基因使用和包含血清IgG谱系的抗体克隆型。在脾和骨髓中鉴定多样重链可变基因片段(IGHV；图2A)和重链接合基因片段(IGHJ：图2B)的使用。表3中概述了在脾和骨髓样品中检测到的不同HCDR3序列的数目。不同人CDR3序列的数目随着读段数目的增加而增加(数据未示)。

表3.检测到的抗体和HCDR3序列的数目

/>

在不同小鼠中观测到有限数目的公共HCDR3氨基酸序列。在同一组织中超过一只小鼠中观测到的HCDR3序列占2％。(图3A)。发现在同一小鼠的骨髓与脾样品之间共享10-14％HCDR3氨基酸序列(图3B)。由高通量测序管道产生的小鼠特异性参考序列数据库用于解释经由蛋白质组学分析获得的肽质谱(见图1)。

实施例3.通过抗hFc和抗hCD22的亲和捕捉对具有所需特征的抗体进行示例性富集

实施例3.1.血清的抗hFc耗竭

所有ULC小鼠的血清均含有针对hCD22和hFc的抗体滴度。应用连续亲和捕捉步骤分别分离抗hFc抗体和抗hCD22抗体(图1)。将进行免疫接种的ULC小鼠血清样品用PBS稀释到1mL的最终体积，并通过hFc结合的琼脂糖柱以使样品耗竭抗Fc抗体。将PBS(1mL)添加到柱中，将流出液合并且使用300道尔顿(分子量)截止过滤器浓缩到100μL的最终体积。抗hFc耗竭的血清流出液用于下游进行抗CD22富集。将琼脂糖柱用1mL 20mM Tris-HCl pH8.0洗涤3次，并且用1mL ddH2O洗涤一次。将结合的抗hFc抗体用2mL 300mM乙酸洗提。抗hFc抗体洗提液用Speedvac干燥，并且通过SDS凝胶分离蛋白质，并且制备蛋白质用于LC-MS分析(未显示抗Fc抗体的后续数据)。

实施例3.2.抗CD22抗体分离

从抗hFc耗竭的血清样品中分离抗CD22抗体。将生物素化的人CD22胞外结构域多肽(100μg/mL)固定在链霉亲和素顺磁珠(100μL)上，并在室温下在96深孔盘中与抗Fc耗竭的血清一起孵育两小时。将顺磁珠用3×600μL HBS-SP、1×600μL水和1×600μL 10％乙腈洗涤。通过将链霉亲和素珠与70μL含1％甲酸的30％乙腈/70％水一起在室温下孵育15分钟来洗提抗hCD22抗体。然后将每个样品转移到Eppendorf管中并在LC-MS分析之前完全干燥。

实施例4.液相色谱-质谱法和数据库搜索

实施例4.1.液相色谱-质谱法(LC-MS)

在37℃下，将抗hFc和抗hCD22抗体分别溶解在10μL 8M尿素和含20mM TCEP的20mMTris-HCl(pH 8.0)中，历时1小时。然后将变性和还原的样品用5mM碘乙酰胺烷基化30分钟，然后在37℃下用胰蛋白酶(w/v＝1:20)消化过夜。通过与Q Exactive质谱仪联用的nano-LC1200高效液相色谱法分析胰蛋白酶肽。首先以4μL/min的流速将肽捕集到75μm×2cm C18捕集柱上，然后使用75μm×25cm C18柱在40℃下以250nL/min分离，梯度如下：157分钟内5％-30％乙腈；15分钟内30％-40％乙腈；2分钟内40％-90％乙腈，和90％乙腈15分钟。使用以下参数在正离子模式下获得质谱：MS1分辨率：70,000；MS1目标：1E6；最大注入时间：100ms；扫描范围：350至1,800m/z；MS/MS分辨率：17,500；MS/MS目标：2e5；前N：10；分离窗：2Th；电荷排除：1，>5；动态排除：30秒。

实施例4.2.数据库搜索

使用Protein Metrics制造的Byonic^TM搜索引擎，针对经由NGS测序产生的相应数据库搜索从每个进行免疫接种的ULC小鼠血清样品获得的LC-MS数据。搜索参数如下：裂解位点：赖氨酸或精氨酸；裂解位点：C端；消化特异性：完全特异性；错过的裂解：2；前驱体质量公差：10ppm；碎片类型：HCD；碎片质量容差：20ppm；固定修饰：半胱氨酸处的氨甲酰甲基。根据序列覆盖度和肽置信度对前200个命中进行排序并手动检查。

实施例5.抗体序列选择

针对所有匹配的CDR3肽的谱质量手动检查前200个序列命中，以确保大多数碎片离子可由指定的肽序列解释。抗体序列需要一种或多种具有良好谱质量的独特CDR3肽才能进行阳性鉴定。序列映射到CDR3数据库并基于CDR3进行分组。根据以下参数选择用于克隆的抗体：1)独特CDR3肽的精确匹配；2)独特的CDR1和CDR2肽的精确匹配；3)独特框架肽的精确匹配；4)下一代测序计数的数目；5)排除具有甲硫氨酸和潜在N糖基化的CDR序列。图4中展示了基于质谱的谱匹配和NGS从一组含有同源CDR3序列的抗CD22抗体中选择抗CD22抗体Bone629(BM_629,mAb14)的实例。手动检查产生总共50种抗体用于表达和克隆。为了获得更多样化的抗体覆盖范围以进行克隆，基于CDR3同源性对来自通用轻链小鼠的序列进行分组。图5中展示了代表多样化CDR3组的23种特异性抗CD22抗体。

实施例6.克隆和转染

对候选hCD22抗体(n＝23)的可变结构域核苷酸序列进行密码子优化，用于中国仓鼠卵巢(CHO)细胞表达，并且合成为gblock(Integrated DNA Technologies)。将可变结构域gblock在与人免疫球蛋白重链恒定区呈可操作的连接下克隆到载体中。将重链载体(1μg)与包含与人免疫球蛋白κ轻链恒定区(1μg)呈可操作的连接下的ULC 3-20的轻链载体或包含与人免疫球蛋白κ轻链恒定区(1μg)呈可操作的连接下的ULC 1-39的轻链载体配对，用于使用Lipofectamine(Thermo Fisher Scientific)瞬时转染到CHO K1细胞的9cm²孔。转染后约84小时收集上清液(500μL)并浓缩，并且将浓缩物用于BIAcore结合分析。在还原条件下经由蛋白质印迹确认转染效率。

实施例7.克隆的抗CD22抗体的动力学结合

实施例7.1.克隆的抗CD22抗体与人CD22相互作用的动力学结合参数

使用SPR-Biacore技术分析所有转染细胞的上清液对CD22的结合亲和力和特异性。在25℃和pH 7.4下，通过将抗体经由其Fcγ结构域从转染的CHO细胞上清液中捕捉到固定在CM5芯片表面上的山羊抗人Fcγ多克隆抗体，直到信号大约为165-202相对单位(RU)，然后注射CD22蛋白来测量CD22与每种克隆抗体的结合。将浓度范围为0.313nM至10.0nM的重组CD22和浓度范围为1.25nM至40.0nM的阴性对照物以50μL/min的流速个别地注射到捕捉抗CD22的表面和参考表面(抗Fcγ偶合芯片表面，未捕捉抗CD22)，历时3分钟，然后为10分钟(CD22)解离阶段，并且记录结合信号的变化。使用10mM甘氨酸-HCl pH 1.5的40秒脉冲实现芯片的再生。

动力学结合参数使用双重参考程序从特定SPR-Biacore动力学传感图确定。通过从注射在实验表面(Fcγ捕捉的抗CD22表面)上的CD22的信号中减去注射在参考表面(仅山羊抗人Fcγ偶合的表面)上的CD22的信号来实现双重参考，从而消除折射率变化的影响。此外，在计算动力学结合参数时，还考虑由捕捉的抗CD22从山羊抗人Fcγ多克隆抗体对照缓冲液注射(无CD22)中解离而导致的信号变化差异。

表4中概述了计算的动力学结合参数。

表4.所选的抗CD22单克隆抗体与人CD22的动力学结合参数的概述

/>

从上表4中的数据可明显看出，在分析结合CD22的23种上清液中，许多显示出对人CD22的高亲和力，KD小于1.0×10^-8M。其中，11种被提交用于抗体纯化。所有11种纯化抗体均显示与人CD22特异性结合，但不与小鼠CD22结合(数据未示)。

仅基于重链可变结构域与抗CD22 mAB BM_629与重链可变结构域的序列同源性，选择另外16个单克隆抗体序列用于BiaCore分析。所有16种单克隆抗体均显示出对CD22的结合特性显著降低或丧失(表5)，此表明了LC-MS谱提供抗体选择的基本信息。

表5.仅基于序列同源性选择的抗CD22抗体的动力学结合参数概述

因此，本文所述的示例性方法能够从具有所需特征的进行免疫接种的宿主内的特定体内抗体来源(例如血清)中鉴定抗体可变结构域序列。所提供的方法提供了用于快速地从基因修饰的非人类动物(例如啮齿动物，例如小鼠)鉴定具有所需特征(例如，高结合亲和力)的抗体的抗体的稳健方式。

以引用的方式并入

本文中提及的所有出版物、专利和专利申请均以引用的方式整体并入本文中，如同每个单独的出版物、专利或专利申请具体且单独地指示为以引用的方式并入一般。在发生冲突的情况下，以本申请(包括本文的任何定义)为准。

等效物

所属领域的技术人员将认识到或仅使用常规实验就能够确定本文所述的本发明的特定实施方案的许多等效物。这类等效物意图含在以下权利要求书中。

Claims

1.一种鉴定对抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列的方法，所述方法包括：

获得从样品获得的人免疫球蛋白重链和/或轻链可变结构域的多个肽序列，所述样品包含由用所述抗原进行免疫接种的啮齿动物产生的抗体群体，和

将人免疫球蛋白重链和/或轻链可变结构域序列的文库用所述多个肽序列进行询问，其中所述文库包含由所述进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链和/或轻链可变结构域序列，由此获得对所述抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列，并且

其中所述进行免疫接种的啮齿动物在其种系基因组中包含：

免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于恒定区，和

免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于恒定区。

2.一种鉴定对抗原具有特异性的抗体的人免疫球蛋白可变结构域或CDR序列的方法，所述方法包括：

获得人免疫球蛋白重链和/或轻链可变结构域序列的文库，所述文库包含由用所述抗原进行免疫接种的啮齿动物的B细胞编码的多个人免疫球蛋白重链和/或轻链可变结构域序列，

将所述文库用从样品获得的人免疫球蛋白重链和/或轻链可变结构域的多个肽序列进行询问，所述样品包含由用所述抗原进行免疫接种的所述啮齿动物产生的抗体群体，并且

其中所述进行免疫接种的啮齿动物在其种系基因组中包含：

免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包含一个或多个人重链V基因区段、一个或多个人D基因区段和一个或多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠恒定区，和

免疫球蛋白轻链可变区，所述免疫球蛋白轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，其中所述轻链可操作地连接于鼠恒定区。

3.如权利要求1或2所述的方法，其中所述文库的所述多个人免疫球蛋白重链和/或轻链可变结构域序列通过对包含来自所述啮齿动物的骨髓和/或脾的B细胞群体的样品进行测序来获得。

4.如前述权利要求中任一项所述的方法，其中所述文库的所述多个人免疫球蛋白重链和/或轻链可变结构域序列通过对包含重排重链VDJ序列和/或重排轻链VJ序列的cDNA进行测序来获得。

5.如权利要求4所述的方法，其中所述测序通过下一代DNA测序进行。

6.如前述权利要求中任一项所述的方法，其中包含由用所述抗原进行免疫接种的所述啮齿动物产生的抗体群体的所述样品源自于所述啮齿动物的血清、血浆、淋巴器官、肠、脑脊髓液、脑、脊髓和/或胎盘。

7.如前述权利要求中任一项所述的方法，其中人免疫球蛋白重链和/或轻链可变结构域的所述多个肽序列通过质谱法(MS)获得或确定。

8.如权利要求7所述的方法，其中人免疫球蛋白重链和/或轻链可变结构域的所述多个肽序列通过组合的液相色谱法与质谱法(LC-MS)获得或确定。

9.如权利要求7或8所述的方法，其中在MS分析之前使包含由用所述抗原进行免疫接种的所述啮齿动物产生的抗体群体的所述样品变性。

10.如权利要求7至9中任一项所述的方法，其中在MS分析之前对包含由用所述抗原进行免疫接种的所述啮齿动物产生的抗体群体的所述样品进行蛋白水解消化。

11.如权利要求7至10中任一项所述的方法，其中在MS分析之前针对一种或多种特征对包含由用所述抗原进行免疫接种的所述啮齿动物产生的抗体群体的所述样品进行富集。

12.如权利要求11所述的方法，其中使包含由用所述抗原进行免疫接种的所述啮齿动物产生的抗体群体的所述样品富集结合所述抗原的抗体。

13.如权利要求12所述的方法，其中使包含由用所述抗原进行免疫接种的所述啮齿动物产生的抗体群体的所述样品耗竭结合第二不同抗原的抗体。

14.如前述权利要求中任一项所述的方法，其中将所述人免疫球蛋白重链和/或轻链可变结构域序列的文库用所述多个肽序列进行询问包括将所述肽序列相互比对并与所述多个人免疫球蛋白重链和/或轻链可变结构域的氨基酸序列进行比对。

15.如权利要求7至14中任一项所述的方法，其中所述文库是人免疫球蛋白重链可变结构域序列的文库并且用所述多个肽序列进行的所述询问基于以下中的一者或多者：

(1)所述人免疫球蛋白重链和/或轻链可变结构域序列的文库中的CDR3序列与通过MS获得或确定的独特肽匹配，

(2)所述人免疫球蛋白重链和/或轻链可变结构域序列的文库中的独特CDR1和/或CDR2序列与通过MS获得或确定的一种或多种独特肽匹配，

(3)所述人免疫球蛋白重链和/或轻链可变结构域序列的文库中的一个或多个框架序列与通过MS获得或确定的一种或多种独特肽匹配，

(4)所述人免疫球蛋白重链和/或轻链可变结构域序列的文库中的序列的大量下一代测序计数，

(5)排除具有甲硫氨酸的CDR序列，以及

(6)排除具有潜在N糖基化的CDR序列。

16.如前述权利要求中任一项所述的方法，其中询问所述文库鉴定出对所述抗原具有特异性的抗体的多个人免疫球蛋白可变结构域或CDR序列，并且其中对所述多个人免疫球蛋白可变结构域或CDR序列进行排序。

17.如权利要求1至16中任一项所述的方法，其中所述啮齿动物是大鼠。

18.如权利要求1至16中任一项所述的方法，其中所述啮齿动物是小鼠。

19.如前述权利要求中任一项所述的方法，其中所述免疫球蛋白重链可变区可操作地连接于小鼠重链恒定区，和/或所述免疫球蛋白轻链可变区可操作地连接于小鼠轻链恒定区。

20.如权利要求19所述的方法，其中所述可操作地连接于小鼠重链恒定区的免疫球蛋白重链可变区处于内源小鼠重链基因座处，和/或所述可操作地连接于小鼠轻链恒定区的免疫球蛋白轻链可变区处于内源小鼠轻链基因座处。

21.如前述权利要求中任一项所述的方法，其中所述免疫球蛋白重链可变区包含多个人重链V基因区段、多个人D基因区段和多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠重链恒定区，并且

所述免疫球蛋白轻链可变区包含：

(i)通用轻链编码序列，所述通用轻链编码序列包含可操作地连接于小鼠轻链恒定区的重排人轻链可变区，所述重排人轻链可变区包含单个人V_L基因区段和单个人轻链J_L基因区段；

(ii)可操作地连接于小鼠轻链恒定区的受限的轻链可变区，所述受限的轻链可变区包含两个未重排人V_L基因区段和一个或多个未重排人J_L基因区段；或

(iii)可操作地连接于小鼠轻链恒定区的经组氨酸修饰的轻链可变区，所述经组氨酸修饰的轻链可变区包含一个或多个人轻链V基因区段和一个或多个人轻链J基因区段，还包含至少一个组氨酸对非组氨酸残基的取代或插入。

22.如权利要求1至20中任一项所述的方法，其中所述免疫球蛋白轻链可变区包含多个人轻链V基因区段和多个人轻链J基因区段，其中所述轻链可变区可操作地连接于鼠轻链恒定区，并且其中所述免疫球蛋白重链可变区包含：

(i)可操作地连接于小鼠重链恒定区的受限的未重排重链可变区，所述受限的未重排重链可变区包含单个人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段；

(ii)通用重链编码序列，所述通用重链编码序列包含可操作地连接于小鼠重链恒定区的单个重排人重链可变区，所述单个重排人重链可变区包含单个人V_H基因区段、单个人D_H基因区段和单个人J_H基因区段；

(iii)可操作地连接于小鼠重链恒定区的经组氨酸修饰的未重排重链可变区，所述经组氨酸修饰的未重排重链可变区包含一个或多个未重排人V_H基因区段、一个或多个未重排人D_H基因区段和一个或多个未重排人J_H基因区段，还包含至少一个组氨酸对非组氨酸残基的取代或插入。

23.如权利要求1至20中任一项所述的方法，其中所述免疫球蛋白轻链可变区包含通用轻链编码序列，所述通用轻链编码序列包括包含单个人Vκ基因区段和单个人轻链Jκ基因区段的重排人轻链可变区，其中所述重排人轻链可变区处于内源小鼠κ轻链基因座处并且可操作地连接于小鼠轻链恒定区，并且其中所述免疫球蛋白重链可变区包含多个人重链V基因区段、多个人D基因区段和多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠重链恒定区。

24.如权利要求1至20中任一项所述的方法，其中所述免疫球蛋白轻链可变区包含工程化的免疫球蛋白κ轻链基因座，所述基因座包括包含与人Jλ基因区段接合的人Vλ基因区段的单个重排人免疫球蛋白λ轻链可变区，并且其中所述免疫球蛋白重链可变区包含多个人重链V基因区段、多个人D基因区段和多个人重链J基因区段，其中所述重链可变区可操作地连接于鼠重链恒定区。

25.如前述权利要求中任一项所述的方法，其中所述基因修饰的小鼠还包含功能性ADAM6基因，任选地其中所述功能性ADAM6基因是小鼠ADAM6基因。

26.如前述权利要求中任一项所述的方法，其中所述基因修饰的小鼠还表达外源末端脱氧核苷酸转移酶(TdT)基因。

27.如前述权利要求中任一项所述的方法，其中所述方法还包括在重组抗原结合蛋白中表达编码所述鉴定出的人免疫球蛋白重链和/或轻链可变结构域的核苷酸序列。

28.如权利要求27所述的方法，其中所述重组抗原结合蛋白是人类抗体。

29.如权利要求27所述的方法，其中所述重组抗原结合蛋白是双特异性抗体。

30.一种用于制造抗体的方法，所述方法包括：

(a)在宿主细胞中表达(i)编码包含可操作地连接于免疫球蛋白重链恒定区序列的人免疫球蛋白重链可变区序列的免疫球蛋白重链的核酸和(ii)编码包含可操作地连接于免疫球蛋白轻链恒定区序列的人免疫球蛋白轻链可变区序列的免疫球蛋白轻链的核酸，其中所述人免疫球蛋白重链可变区序列和/或所述人免疫球蛋白轻链可变区序列分别编码通过如权利要求1至26中任一项所述的方法鉴定出的人免疫球蛋白重链可变结构域和/或人免疫球蛋白轻链可变结构域；和

(b)在使所述宿主细胞表达包含所述免疫球蛋白重链和所述免疫球蛋白轻链的抗体的条件下培养所述宿主细胞。

31.一种制造完全人免疫球蛋白重链和/或完全人免疫球蛋白轻链的方法，所述方法包括：

(a)通过如权利要求1至26中任一项所述的方法鉴定出人免疫球蛋白重链和/或轻链可变结构域序列；

(b)将编码所述人免疫球蛋白重链可变结构域的核酸与编码人免疫球蛋白重链恒定结构域的核酸可操作地连接以形成完全人免疫球蛋白重链，和/或将编码所述人免疫球蛋白轻链可变结构域的核酸与编码人免疫球蛋白轻链恒定结构域的核酸可操作地连接以形成完全人免疫球蛋白轻链；以及

(c)表达所述完全人免疫球蛋白重链和/或所述完全人免疫球蛋白轻链。