CN110055593A

CN110055593A - 与样品相关的多核苷酸的鉴定

Info

Publication number: CN110055593A
Application number: CN201910010319.5A
Authority: CN
Inventors: W·H·罗宾森; 陈衍璁; J·索科洛芙
Original assignee: Leland Stanford Junior University; US Department of Veterans Affairs VA
Current assignee: Leland Stanford Junior University; US Department of Veterans Affairs VA
Priority date: 2011-04-28
Filing date: 2012-04-27
Publication date: 2019-07-26
Also published as: SG194233A1; AU2012249158B2; ES2925799T3; KR20140057692A; SI3415619T1; KR20190014575A; AU2018286622A1; DK2702146T3; EP3418380B1; EP3421592B1; IL264056B; IL290935A; AU2018286623B2; PL3415619T3; SG10201900183VA; EP2702146A2; EP3415619A3; KR20190012280A; KR102151655B1; PT3418380T

Abstract

本文公开了用于测序、分析和利用样品如单一样品的组合物和方法。本文还公开了用于将来自样品的两个或更多个序列匹配在一起的组合物和方法。本文还公开了用于表达和筛选目标分子的组合物和方法。

Description

与样品相关的多核苷酸的鉴定

本申请是申请日为2012年04月27日和发明名称为“与样品相关的多核苷酸的鉴定”的201280031099.0号发明专利申请的分案申请。

相关申请的交叉引用

本申请与2011年4月28日提交的美国临时专利申请61/517,976 号、2011年8月24日提交的美国临时专利申请61/575,652号、2012 年2月16日提交的美国临时专利申请61/599,870号和2012年3月8 日提交的美国临时专利申请61/608,571号有关，其公开内容为所有目的通过引用并入本文。

有关联邦赞助研究或开发的声明

本发明是利用由美国国立卫生研究院国家心肺和血液研究中心给予的N01-HV-28183 NHLBI蛋白质组学中心和N01-HV-00242蛋白质组学中心的政府支持而完成的。政府在本发明中具有某些权利。

序列表

本申请包含“冗长”的序列表，其通过CD-R提交以代替打印的纸件，且通过引用全部并入本文中。刻录于2012年4月25目的所述 CD-R分别标记为“CRF”、“Copy 1-SEQUENCELISTING PART”、 “Copy 2-SEQUENCE LISTING PART”和“Copy 3-SEQUENCE LISTINGPART”，且各包含名称为 20786PCT_CRF_Sequencelising.EXE的单一自解压文件(138，571，776 字节)，其随之包含名称为20786PCT_CRF_Sequencelisting.TXT的一个未压缩的ASCII文本文件(795，566，080字节)。

背景技术

从人类来源产生治疗性的单克隆抗体是生物学和技术方面的挑战。迄今为止，已经描述了几种方法，包括产生人杂交瘤、使用表达人免疫球蛋白的转基因小鼠和使用人免疫球蛋白噬菌体展示文库。

人杂交瘤可能难以产生，因为人骨髓瘤融合伴体与其小鼠对应物不同，它在产生杂交瘤方面是无效的。人杂交瘤还具有在持续的培养后自发丧失所表达的抗体基因的倾向。埃-巴二氏病毒(EBV)转化使B细胞永生化，但所有EBV-转化的B细胞中仅极少的部分是亲和力成熟的或识别靶抗原。杂交瘤的产生通常包括大量的筛选以获得治疗性单克隆抗体。当前被美国FDA批准的治疗性单克隆抗体中没有一种是通过人杂交瘤的生成或B细胞的EBV-转化而产生的，这也证明了这些方法所面临的技术难题和挑战。

人抗体序列的噬菌体展示文库代表了用于产生治疗性人单克隆抗体的另一种方法。这一方法利用重组DNA技术以随机地共同表达人抗体重链和轻链序列以使得能够筛选结合靶抗原的组合。但是，这一策略没有产生亲和力成熟的抗体，且以这种方式产生的抗体经常以低亲和力和亲抗原性与抗原结合。然后需要后续的突变和选择/ 筛选步骤以产生高亲和力的抗体。

产生治疗性人单克隆抗体的另一种方式是通过产生或利用具有人抗体谱(antibody repertoire)的转基因小鼠。当免疫时，这种小鼠产生靶向于免疫的抗原的抗体，且随后可以产生杂交瘤以用于产生治疗性人单克隆抗体。这种转基因小鼠是专有的且通常不可用于产生人抗体。

因此本发明认识到对于例如可产生大量的亲和力成熟的人抗体的组合物、试剂盒和方法的需要，从而避免了繁重和耗时的抗体人源化的需要或进行大量筛选的需要。本文描述的组合物、试剂盒和方法满足了这一需要。另外，本文描述的组合物、方便和方法可广泛地应用于人抗体领域之外且可以用于多种不同的应用中，包括例如，将源自于单一样品和存在于多核苷酸文库中的两个或更多个目标多核苷酸匹配在一起。

发明内容

本文公开了包含多核苷酸的组合物，其中所述多核苷酸包含第一区域和第二区域，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含至少一个识别区域，且其中所述第一区域与所述第二区域偶联。

在一些方面，所述可变免疫球蛋白区域包含从直径大于或等于8 μm的活化人B细胞分离的IgG免疫球蛋白核苷酸序列的VDJ区域，且其中所述免疫球蛋白区域的5’端与所述识别区域的3’端偶联。在一些方面，所述组合物包括在克隆家族(clonal family)中。

在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述 B细胞是活化B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是浆母细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是单一B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是单一活化B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是位于受试者的血液中的单一活化B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是人活化B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是记忆B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是浆细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是抗原特异性B细胞。在一些方面，所述免疫球蛋白区域从哺乳动物B细胞分离。在一些方面，所述免疫球蛋白区域从人B细胞分离。在一些方面，所述免疫球蛋白区域从小鼠B细胞分离。在一些方面，所述免疫球蛋白区域从来自于患有关注的疾病或病症的受试者的B细胞分离。在一些方面，所述免疫球蛋白区域从来自于正从关注的疾病或病症恢复或已从关注的疾病或病症恢复的受试者的B细胞分离。在一些方面，所述免疫球蛋白区域从来自于施用至少一种目标抗原的受试者的B细胞分离。在一些方面，所述免疫球蛋白区域从来自于施用至少一种目标抗原和佐剂的受试者的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的血液中的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的骨髓中的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的脾中的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的至少一个淋巴结中的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的淋巴组织中的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的肠中的B细胞分离。在一些方面，所述免疫球蛋白区域从直径为约8-20μm的活化B细胞分离。在一些方面，所述免疫球蛋白区域从直径为8、9、10、11、12、13、14、15、16、17、18、 19、20或大于20μm的活化B细胞分离。在一些方面，所述免疫球蛋白区域从面积为约60、70、80、90、100、120、130、140、150、 200、250、300、350或大于350μm²的活化B细胞分离。在一些方面，所述免疫球蛋白区域从体积为约250、268、300、400、500、600、 700、800、900、1000、2000、3000、4000或大于4000μm³的活化B 细胞分离。在一些方面，所述免疫球蛋白区域从直径尺寸比对照静息B细胞的中值直径大10％或更大的活化B细胞分离。在一些方面，所述免疫球蛋白区域从直径尺寸比对照静息B细胞的中值直径大 15％或更大的活化B细胞分离。在一些方面，所述免疫球蛋白区域从直径尺寸比对照静息B细胞的中值直径大20％或更大的活化B细胞分离。在一些方面，所述免疫球蛋白区域从能够分泌免疫球蛋白的活化B细胞分离。在一些方面，所述免疫球蛋白区域从处于细胞周期的合成前期(G1)、合成期(S)、合成后期(G2)或有丝分裂期(M) 的B细胞分离。在一些方面，所述免疫球蛋白区域从非处于细胞周期的静息期(G0)的B细胞分离。在一些方面，所述免疫球蛋白区域从通过流式细胞术鉴定为具有大于静息B淋巴细胞的FSC平均值的 1.2倍的FSC的B细胞分离。在一些方面，所述免疫球蛋白区域从通过流式细胞术鉴定为具有人单核细胞的FSC平均值的0.7-1.15倍的FSC平均值的B细胞分离。在一些方面，所述免疫球蛋白区域从单一CD19阳性B细胞分离。在一些方面，所述免疫球蛋白区域从单一CD38阳性B细胞分离。在一些方面，所述免疫球蛋白区域从单一CD27阳性B细胞分离。在一些方面，所述免疫球蛋白区域从单一CD20阴性B细胞分离。在一些方面，所述免疫球蛋白区域从单一CD19⁺CD20^-CD27⁺CD38^hiB细胞分离。

在一些方面，所述免疫球蛋白区域的5’端与所述识别区域的3’ 端偶联。

在一些方面，所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的VDJ区域。在一些方面，所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的VJ区域。在一些方面，所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的V、D和/或J区域。在一些方面，所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的重链和/或轻链。在一些方面，所述可变免疫球蛋白区域包含IgG、IgM、IgD、 IgE或IgA免疫球蛋白序列。在一些方面，所述可变免疫球蛋白区域包含人IgG1、IgG2、IgG3或IgG4免疫球蛋白序列。在一些方面，所述可变免疫球蛋白区域包含小鼠IgG1、IgG2a、IgG2b或IgG3免疫球蛋白序列。在一些方面，所述免疫球蛋白区域长度为约200-2000 个核苷酸。在一些方面，所述免疫球蛋白区域长度为小于200、200、 300、400、500、600、700、800、900、1000、1100、1200、1300、 1400、1500、1600、1700、1800、1900、2000或大于2000个核苷酸。

在一些方面，所述识别区域包含多个识别区域。在一些方面，所述识别区域包含多个识别区域，且其中该多个识别区域中的各识别区域具有独特的序列。在一些方面，所述识别区域包含至少一个样品识别区域和至少一个板识别区域(plate identificationregion)。在一些方面，所述识别区域包含与所述免疫球蛋白区域的序列不同的序列。在一些方面，所述识别区域长度为约2-100个核苷酸。在一些方面，所述识别区域长度为2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、 100或大于100个核苷酸。在一些方面，所述识别区域长度为2-1,000 个核苷酸。在一些方面，所述识别区域长度等于或大于100个核苷酸。在一些方面，所述识别区域包含连续的非编码核苷酸序列。在一些方面，所述识别区域包含非编码核苷酸序列。在一些方面，所述识别区域包含非连续的非编码核苷酸序列。在一些方面，所述识别区域的序列长度小于所述免疫球蛋白区域的序列长度。

在一些方面，本文描述的组合物可以包括第三区域，其中所述第三区域包含接合体区域。在一些方面，所述第三区域包含接合体区域，且其中所述第三区域位于所述第一区域和所述第二区域之间。在一些方面，所述第三区域包含接合体区域，且其中所述接合体区域包含位于其3’端的至少一个G核苷酸。

在一些方面，所述识别区域为2-100个核苷酸长并具有不同于所述免疫球蛋白区域序列的序列，且其中所述接合体区域包含在其3’ 端的至少一个G核苷酸并位于所述样品识别区域的3’侧和所述免疫球蛋白区域的5’侧，且其中所述可变免疫球蛋白区域已发生超变而不同于原始B细胞的种系序列。

在一些方面，所述组合物存在于容器中。在一些方面，多个所述组合物存在于容器中。在一些方面，多个所述组合物存在于包含多个孔的单一板的单一孔中。

在一些方面，所述组合物处于组合物文库中，其中各组合物存在于单独的容器中，其中各组合物包含含有第一区域和第二区域的多核苷酸，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，其中各识别区域的核苷酸序列不同于文库中存在的其它识别区域的核苷酸序列，且文库中的多个可变免疫球蛋白区域的最后核苷酸序列共有至少80-99％的序列同一性。

在一些方面，所述组合物包括在包含多个多核苷酸组合物的文库中，其中各组合物存在于单独的容器中，其中各组合物包含多核苷酸，其中所述多核苷酸包含第一区域和第二区域，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，且其中各识别区域的核苷酸序列不同于文库中各单独容器中存在的其它识别区域的核苷酸序列。

本文还描述了包含多个多核苷酸组合物的多核苷酸组合物文库，其中各组合物存在于单独的容器中，其中各组合物包含多核苷酸，其中所述多核苷酸包含第一区域和第二区域，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，且其中各识别区域的核苷酸序列不同于文库中各单独容器中存在的其它识别区域的核苷酸序列。

本文还描述了包含多个多核苷酸的多核苷酸文库，其中所述多个多核苷酸的各多核苷酸存在于单独的容器中，其中所述多个多核苷酸的各多核苷酸包含第一区域和第二区域，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，其中各识别区域的核苷酸序列不同于文库中存在的其它识别区域的核苷酸序列，且其中所述多个多核苷酸中的至少两个可变免疫球蛋白区域共有至少 80-99％的序列同一性。

本文还描述了包含多核苷酸的克隆家族的多核苷酸文库，其中所述文库中的各多核苷酸包含第一区域和第二区域，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，其中各识别区域的核苷酸序列不同于家族中存在的其它识别区域的核苷酸序列，且其中家族中的各可变免疫球蛋白区域表现出至少80-99％的序列同一性。在一些方面，所述文库包含多个克隆家族。

本文还描述了免疫球蛋白序列的克隆家族，其中家族中的各序列与识别区域偶联。在一些方面，各识别区域不同于其它识别区域。在一些方面，所述免疫球蛋白序列包含重链免疫球蛋白序列。在一些方面，所述免疫球蛋白序列包含轻链免疫球蛋白序列。在一些方面，所述免疫球蛋白序列包含重链和轻链免疫球蛋白序列。在一些方面，一个或多个所述识别区域包含轻链免疫球蛋白序列。在一些方面，一个或多个所述识别区域包含重链免疫球蛋白序列。

本文还描述了本文所述的两个或更多个克隆家族的集合。

本文还描述了本文所述的2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、19、20或更多个克隆家族的集合。

本文还描述了免疫球蛋白序列的克隆家族，其中所述家族中的各序列可操作地与至少一个连续核苷酸序列偶联。在一些方面，所述免疫球蛋白序列包含重链免疫球蛋白序列且所述的至少一个连续核苷酸序列包含轻链免疫球蛋白序列。在一些方面，所述免疫球蛋白序列包含轻链免疫球蛋白序列且所述的至少一个连续核苷酸序列包含重链免疫球蛋白序列。

本文还描述了用于产生免疫球蛋白序列的克隆家族的方法，包括获得多个免疫球蛋白序列，其各具有V、D和/或J区域且各与识别区域偶联；和将该多个免疫球蛋白序列中的两个或更多个序列分组以产生所述克隆家族，其中所述克隆家族中的各序列是具有V、D 和/或J区域的相同种系免疫球蛋白序列的突变形式或者具有该V、D 和/或J区域的种系免疫球蛋白序列。

在一些方面，各识别区域不同于其它识别区域。

本文还描述了产生免疫球蛋白序列的克隆家族的方法，包括获得多个免疫球蛋白序列，其各具有V、D和/或J区域且各与识别区域偶联，且其中各识别区域不同于其它识别区域；去除一个或多个识别区域；和将该多个免疫球蛋白序列中的两个或更多个序列分组以产生所述克隆家族，其中所述克隆家族中的各序列是具有V、D 和/或J区域的相同种系免疫球蛋白序列的突变形式或者具有该V、D 和/或J区域的种系免疫球蛋白序列。

本文还描述了鉴别与第一识别区域偶联的第二cDNA的方法，包括选择与所述第一识别区域偶联的第一cDNA和基于与各cDNA 偶联的识别区域的共有同一性鉴别所述第二cDNA。

本文还描述了产生第二核苷酸序列上的3’尾的方法，包括获得第一核苷酸序列和使该第一核苷酸序列与在低于50℃的温度下具有模板转换活性的热稳定的RNA酶H^-反转录酶接触，其中所述接触产生所述3’尾和所述第二核苷酸序列。在一些方面，所述第一核苷酸序列在约低于50、49、48、47、46、45、44、43、42或低于42℃ 下接触。在一些方面，所述第一核苷酸序列在42℃下接触。在一些方面，所述第一核苷酸序列在45.5℃下接触。在一些方面，所述转录酶是莫洛尼鼠白血病病毒(MMLV)RNA酶H^-反转录酶。在一些方面，所述转录酶是SuperScript III。

本文还描述了确定第一目标序列的天然存在序列的方法，包括获得与该第一序列相关且各与第一识别区域偶联的多个序列，其中各第一识别区域是相同的，且其中所述多个序列中的一个或多个序列不同于所述天然存在的序列；和比较所述多个序列中的序列以确定所述第一目标序列的天然存在的序列。在一些方面，所述多个序列包含免疫球蛋白序列。在一些方面，多个序列包含免疫球蛋白序列。在一些方面，所述多个序列包含免疫球蛋白序列。在一些方面，所述多个序列各与第二识别区域偶联且各第二识别区域是相同的。在一些方面，所述第一目标序列是免疫球蛋白序列。在一些方面，所述多个序列是免疫球蛋白序列。

本文还描述了包含多核苷酸的组合物，该多核苷酸包含第一区域和第二区域，其中所述第一区域包含B细胞源的可变免疫球蛋白区域和第二区域包含识别区域，且其中所述第一区域与所述第二区域偶联。

本文还描述了包含多个多核苷酸组合物的多核苷酸组合物文库，其中各组合物存在于单独的容器中，其中各组合物包含含有B 细胞源的可变免疫球蛋白区域和识别区域的多核苷酸，其中所述可变免疫球蛋白区域与所述识别区域偶联，其中各识别区域的核苷酸序列不同于文库中各单独容器中存在的其它识别区域的核苷酸序列。

本文还描述了用于产生多核苷酸组合物的方法，包括：获得包含第一区域的多核苷酸，其中所述第一区域包含与受试者相关的表达的B细胞可变免疫球蛋白区域；和通过将所述第一区域与第二区域偶联产生包含第一区域和第二区域的多核苷酸组合物，其中所述第二区域包含识别区域。

在一些方面，获得所述多核苷酸包括获得与受试者相关的B细胞和处理该细胞以制备所述多核苷酸。在一些方面，获得所述多核苷酸包括直接或间接地从已经处理与受试者相关的B细胞以制备所述多核苷酸的第三方接收所述多核苷酸。在一些方面，获得所述多核苷酸包括直接或间接地从已经溶解与受试者相关的B细胞以制备所述多核苷酸的第三方接收所述多核苷酸。在一些方面，获得所述多核苷酸包括使用流式细胞仪获得B细胞。在一些方面，获得所述多核苷酸包括使用微流体装置获得B细胞。

在一些方面，所述可变免疫球蛋白区域包含IgG免疫球蛋白核苷酸序列的VDJ区域，其从直径大于或等于8μm的活化人B细胞分离，且其中所述免疫球蛋白区域的5’端与所述识别区域的3’端偶联。在一些方面，所述组合物包括在克隆家族中。

在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述 B细胞是活化B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是浆母细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是单一B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是单一活化B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是位于受试者的血液中的单一活化B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是人活化B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是记忆B细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是浆细胞。在一些方面，所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是抗原特异性B细胞。在一些方面，所述免疫球蛋白区域从哺乳动物B细胞分离。在一些方面，所述免疫球蛋白区域从人B细胞分离。在一些方面，所述免疫球蛋白区域从小鼠B细胞分离。在一些方面，所述免疫球蛋白区域从来自于患有关注的疾病或病症的受试者的B细胞分离。在一些方面，所述免疫球蛋白区域从来自于受试者的B细胞分离，该受试者正从关注的疾病或病症恢复或已经恢复。在一些方面，所述免疫球蛋白区域从来自于施用至少一种目标抗原的受试者的B细胞分离。在一些方面，所述免疫球蛋白区域从来自于施用至少一种目标抗原和佐剂的受试者的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的血液中的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的骨髓中的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的脾中的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的至少一个淋巴结中的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的淋巴组织中的B细胞分离。在一些方面，所述免疫球蛋白区域从位于受试者的肠中的B细胞分离。在一些方面，所述免疫球蛋白区域从直径为约8-20μm的活化B细胞分离。在一些方面，所述免疫球蛋白区域从直径为8、9、10、11、12、13、14、15、16、17、18、19、20 或大于20μm的活化B细胞分离。在一些方面，所述免疫球蛋白区域从面积为约60、70、80、90、100、120、130、140、150、200、 250、300、350或大于350μm²的活化B细胞分离。在一些方面，所述免疫球蛋白区域从体积为约250、268、300、400、500、600、700、 800、900、1000、2000、3000、4000或大于4000μm³的活化B细胞分离。在一些方面，所述免疫球蛋白区域从直径尺寸比对照静息B 细胞的中值直径大10％或更大的活化B细胞分离。在一些方面，所述免疫球蛋白区域从直径尺寸大于对照静息B细胞的中值直径15％或更大的活化B细胞分离。在一些方面，所述免疫球蛋白区域从直径尺寸大于对照静息B细胞的中值直径20％或更大的活化B细胞分离。在一些方面，所述免疫球蛋白区域从能够分泌免疫球蛋白的活化B细胞分离。在一些方面，所述免疫球蛋白区域从处于细胞周期的合成前期(G1)、合成期(S)、合成后期(G2)或有丝分裂期(M)的B细胞分离。在一些方面，所述免疫球蛋白区域从非处于细胞周期的静息期(G0)的B细胞分离。在一些方面，所述免疫球蛋白区域从通过流式细胞术鉴定为具有大于静息B淋巴细胞的FSC平均值的1.2倍的FSC的B细胞分离。在一些方面，所述免疫球蛋白区域从通过流式细胞术鉴定为具有人单核细胞的FSC平均值的0.7-1.15倍的FSC 平均值的B细胞分离。在一些方面，所述免疫球蛋白区域从单一 CD19阳性B细胞分离。在一些方面，所述免疫球蛋白区域从单一 CD38阳性B细胞分离。在一些方面，所述免疫球蛋白区域从单一CD27阳性B细胞分离。在一些方面，所述免疫球蛋白区域从单一 CD20阴性B细胞分离。在一些方面，所述免疫球蛋白区域从单一 CD19⁺CD20^-CD27⁺CD38^hi B细胞分离。

在一些方面，所述识别区域包含多个识别区域。在一些方面，所述识别区域包含多个识别区域，且其中该多个识别区域中的各识别区域具有独特的序列。在一些方面，所述识别区域包含至少一个样品识别区域和至少一个板识别区域。在一些方面，所述识别区域包含与所述免疫球蛋白区域的序列不同的序列。在一些方面，所述识别区域长度为约2-100个核苷酸。在一些方面，所述识别区域长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、30、40、50、60、70、80、90、100或大于100个核苷酸。在一些方面，所述识别区域长度为2-1,000个核苷酸。在一些方面，所述识别区域长度等于或大于100个核苷酸。在一些方面，所述识别区域包含连续的非编码核苷酸序列。在一些方面，所述识别区域包含非编码核苷酸序列。在一些方面，所述识别区域包含非连续的非编码核苷酸序列。在一些方面，所述识别区域的序列长度小于所述免疫球蛋白区域的序列长度。

在一些方面，本文所述的组合物包含第三区域，其中所述第三区域包含接合体区域。在一些方面，所述第三区域包含接合体区域，且其中所述第三区域位于所述第一区域和所述第二区域之间。在一些方面，所述第三区域包含接合体区域，且其中所述接合体区域包含位于其3’端的至少一个G核苷酸。

在一些方面，所述识别区域为2-100个核苷酸长并具有不同于所述免疫球蛋白区域序列的序列，且其中所述接合体区域在其3’端包含至少一个G核苷酸并位于所述样品识别区域的3’侧和所述免疫球蛋白区域的5’侧，且其中所述可变免疫球蛋白区域已发生超变且不同于原始B细胞的种系序列。

在一些方面，所述组合物包括在包含多个多核苷酸组合物的文库中，其中各组合物存在于单独的容器中，其中各组合物包含多核苷酸，其中所述多核苷酸包含第一区域和第二区域，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，且其中各识别区域的核苷酸序列不同于文库中各单独的容器中存在的其它识别区域的核苷酸序列。

本文还描述了用于产生多核苷酸组合物的方法，包括：获得与受试者相关的B细胞；从包含表达的B细胞可变免疫球蛋白区域的所述细胞分离多核苷酸；和通过将所述可变免疫球蛋白区域与识别区域偶联产生包含所述可变免疫球蛋白区域和识别区域的多核苷酸组合物。

本文还描述了用于产生多核苷酸组合物的方法，包括：获得包含受试者相关的B细胞源的可变免疫球蛋白区域的多核苷酸；和通过将所述可变免疫球蛋白区域与识别区域偶联产生包含所述可变免疫球蛋白区域和识别区域的多核苷酸组合物。

在一些方面，获得所述多核苷酸包括获得B细胞和处理该细胞以制备所述多核苷酸。在一些方面，获得所述多核苷酸包括直接或间接地从已经处理B细胞以制备所述多核苷酸的第三方接收所述多核苷酸。

本文还描述了用于产生两个或更多个多核苷酸组合物的方法，包括：获得包含与从一个或多个受试者获得的多个样品相关的多个多核苷酸的多核苷酸文库，其中一个或多个多核苷酸包含表达的B 细胞可变免疫球蛋白区域，其中各样品与B细胞相关，且其中与各样品相关的各多核苷酸存在于单独的容器中；和通过将所述多核苷酸与所述识别区域偶联产生两个或更多个多核苷酸组合物，该多核苷酸组合物各包含来自所述多个多核苷酸的多核苷酸和识别区域，其中各识别区域的序列不同于与文库中其它多核苷酸偶联的识别区域的序列。

在一些方面，获得所述多核苷酸文库包括获得多个B细胞并处理该细胞以制备所述多核苷酸文库。在一些方面，获得所述多核苷酸文库包括直接或间接地从已经处理多个B细胞以制备所述多核苷酸文库的第三方接收所述多核苷酸文库。

本文还描述了用于产生两个或更多个多核苷酸组合物的方法，包括：获得包含与从一个或多个受试者获得的多个样品相关的多个多核苷酸的多核苷酸文库，其中一个或多个多核苷酸包含B细胞源的可变免疫球蛋白区域，且其中与各样品相关的各多核苷酸存在于单独的容器中；和通过将所述多核苷酸与所述识别区域偶联产生两个或更多个多核苷酸组合物，该多核苷酸组合物各包含来自所述多个多核苷酸的多核苷酸和识别区域，其中各识别区域的序列不同于与文库中其它多核苷酸偶联的识别区域的序列。

本文还描述了包含多个多核苷酸组合物的多核苷酸组合物文库，其中各组合物存在于单独的容器中，其中各组合物包含单一样品来源的eDNA区域和样品识别-接合体区域，所述cDNA区域包含在该eDNA区域的3’端的核苷酸C，所述样品识别-接合体区域包含与接合体区域偶联的样品识别区域，其中各样品识别-接合体区域的所述样品识别区域的核苷酸序列不同于文库中各单独的容器中存在的其它样品识别-接合体区域的样品识别区域的核苷酸序列，其中所述接合体区域包含在所述接合体区域的3’端的核苷酸G，且其中所述样品识别-接合体区域通过所述C和G之间的结合连接于所述 cDNA区域。

在一些方面，所述cDNA区域包含与DNA多核苷酸杂交的RNA 多核苷酸。在一些方面，所述cDNA区域包含与cDNA多核苷酸杂交的mRNA多核苷酸。在一些方面，所述cDNA区域包含在3’端的至少一个C和其中所述接合体区域包含在3’端的至少一个G。

本文还描述了包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含样品识别区域、接合体区域和单一样品来源的cDNA区域，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述cDNA区域与所述接合体区域的3’端偶联，其中来自第一单一样品的各多核苷酸的样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列，且其中所述样品识别区域是双链的。在一些方面，各多核苷酸包含多个样品识别区域。

本文还描述了包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述通用引物区域的序列在所述多个多核苷酸中的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

在一些方面，所述扩增子区域的5’端与所述接合体区域的3’端偶联，其中所述通用引物区域包含序列 CACGACCGGTGCTCGATTTAG，且其中所述接合体区域包含至少一个G。在一些方面，所述通用引物区域的序列不与任何人基因外显子完全互补，且其中所述通用引物区域具有不干扰所述接合体区域的最小二级结构。在一些方面，所述通用引物区域是序列 CACGACCGGTGCTCGATTTAG。在一些方面，所述扩增子区域包含含有cDNA核苷酸序列的cDNA区域。在一些方面，来自于第一单一样品的各多核苷酸的所述样品识别区域的序列与来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列具有至少一个核苷酸的不同。在一些方面，来自于第一单一样品的各多核苷酸的所述样品识别区域的序列与来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列具有至少2个核苷酸的不同。在一些方面，所述样品识别区域长度为至少10个核苷酸。在一些方面，所述样品识别区域长度为至少1个核苷酸。在一些方面，各样品识别区域的序列选自表2和7。在一些方面，所述接合体区域的序列包含在其3’ 端的至少一个G核苷酸。在一些方面，所述扩增子区域包含免疫球蛋白重链扩增子序列、免疫球蛋白轻链扩增子序列、T细胞受体α 扩增子序列或T细胞受体β扩增子序列。

本文还描述了包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-D-3’，其中A是通用引物区域，其中B是样品识别区域，其中C是接合体区域，其中D是来自于单一样品的扩增子区域，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

本文还描述了包含通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域的多核苷酸，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，且其中所述扩增子区域可操作地与所述接合体区域偶联。

在一些方面，所述扩增子区域的5’端与所述接合体区域的3’端偶联，其中所述通用引物区域包含CACGACCGGTGCTCGATTTAG，且其中所述接合体区域包含至少一个G。

本文还描述了包含序列5’-A-B-C-D-3’的多核苷酸，其中A是通用引物区域，其中B是样品识别区域，其中C是接合体区域，且其中D是来自于单一样品的扩增子区域。

本文还描述了包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含第一板识别区域、通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域，其中所述通用引物区域的3’ 端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述第一板识别区域可操作地与所述通用引物区域偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

在一些方面，来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列不同于来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列。在一些方面，来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列与来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列具有至少一个核苷酸的不同。在一些方面，来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列与来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列具有至少2个核苷酸的不同。在一些方面，所述第一板识别区域长度为至少10个多核苷酸。在一些方面，所述第一板识别区域的序列选自表3和6。在一些方面，所述第一板识别区域的3’端与所述通用引物区域的5’端偶联，其中所述扩增子区域的5’端与所述接合体区域的3’端偶联，其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG，其中所述接合体区域包含至少一个G，其中各多核苷酸进一步包含第二板识别区域、第一测序区域和第二测序区域，其中所述第二板识别区域的5’端与所述扩增子区域的3’端偶联，其中所述第一测序区域的3’端与所述第一板识别区域的5’端偶联，且其中所述第二测序区域的5’端与所述第二板识别区域的3’端偶联。在一些方面，所述第二板识别区域的序列与各多核苷酸上所述第一板识别区域的序列相同。在一些方面，来自第一组单一样品的各多核苷酸的所述第二板识别区域的序列不同于来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列。在一些方面，来自第一组单一样品的各多核苷酸的所述第二板识别区域的序列与来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列具有至少一个多核苷酸的不同。在一些方面，来自第一组单一样品的各多核苷酸的所述第二板识别区域的序列与来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列具有至少2个多核苷酸的不同。在一些方面，所述第二板识别区域长度为至少10个多核苷酸。在一些方面，所述第二板识别区域的序列选自表3和6。在一些方面，所述第一测序区域包含 GAGAGACTGACAGCGTATCGCCTCCCTCGCGCCATCAG。在一些方面，所述第二测序区域包含 CTATGCGCCTTGCCAGCCCGCTCAG。

本文还描述了包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-D-3’，其中A是板识别区域，其中B是通用引物区域，其中C是样品识别区域，其中D是接合体区域，其中E 是来自于单一样品的扩增子区域，且其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

本文还描述了包含第一板识别区域、通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域的多核苷酸，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述第一板识别区域可操作地与所述通用引物区域偶联，且其中所述扩增子区域可操作地与所述接合体区域偶联。

在一些方面，所述第一板识别区域的3’端与所述通用引物区域的5’端偶联，其中所述扩增子区域的5’端与所述接合体区域的3’端偶联，其中所述通用引物区域包含CACGACCGGTGCTCGATTTAG，其中所述接合体区域包含至少一个G，其中各多核苷酸进一步包含第二板识别区域、第一测序区域和第二测序区域，其中所述第二板识别区域的5’端与所述扩增子区域的3’端偶联，其中所述第一测序区域的3’端与所述第一板识别区域的5’端偶联，且其中所述第二测序区域的5’端与所述第二板识别区域的3’端偶联。

本文还描述了包含序列5’-A-B-C-D-E-3’的多核苷酸，其中A是板识别区域，其中B是通用引物区域，其中C是样品识别区域，其中D是接合体区域，且其中E是来自于单一样品的扩增子区域。

本文还描述了包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含第一限制性位点区域、通用引物区域、样品识别区域、接合体区域、来自于单一样品的扩增子区域和第二限制性位点区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述第一限制性位点区域可操作地与所述通用引物区域偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述第二限制性位点区域可操作地与所述扩增子区域偶联，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

在一些方面，所述第一限制性位点区域包含一个或多个限制性位点。在一些方面，所述第一限制性位点区域包含选自NheI、XhoI、 BstBI、EcoRI、SacII、BbvCI、PspXI、AgeI、ApaI、KpnI、Acc65I、 XmaI、BstEII、DraIII、PacI、FseI、AsiSI和AscI的一个或多个限制性位点。在一些方面，所述第二限制性位点区域包含一个或多个限制性位点。在一些方面，所述第二限制性位点区域包含选自NheI、 XhoI、BstBI、EcoRI、SacII、BbvCI、PspXI、AgeI、ApaI、KpnI、 Acc65I、XmaI、BstEII、DraIII、PacI、FseI、AsiSI和AscI的一个或多个限制性位点。在一些方面，所述第一限制性位点区域的3’端与所述通用引物区域的5’端偶联，其中所述接合体区域的3’端与所述扩增子区域的5’端偶联，其中所述扩增子区域的3’端与所述第二限制性位点区域的5’端偶联，其中所述通用引物区域包含CACGACCGGTGCTCGATTTAG，且其中所述接合体区域包含至少一个G。

本文还描述了包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-D-E-F-3’，其中A是第一限制性位点区域，其中B是通用引物区域，其中C是样品识别区域，其中D是接合体区域，其中E是来自于单一样品的扩增子区域，其中F是第二限制性位点区域，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

本文还描述了用于插入载体中的多核苷酸，其包含第一限制性位点区域、通用引物区域、样品识别区域、接合体区域、来自于单一样品的扩增子区域和第二限制性位点区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述第一限制性位点区域可操作地与所述通用引物区域偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，且其中所述第二限制性位点区域可操作地与所述扩增子区域偶联。

在一些方面，所述第一限制性位点区域的3’端与所述通用引物区域的5’端偶联，其中所述接合体区域的3’端与所述扩增子区域的 5’端偶联，其中所述扩增子区域的3’端与所述第二限制性位点区域的5’端偶联，其中所述通用引物区域包含CACGACCGGTGCTCGATTTAG，且其中所述接合体区域包含至少一个G。

本文还描述了用于插入载体中的多核苷酸，包含序列 5’-A-B-C-D-E-F-3’，其中A是第一限制性位点区域，其中B是通用引物区域，其中C是样品识别区域，其中D是接合体区域，其中E 是来自于单一样品的扩增子区域，和其中F是第二限制性位点区域。

本文还描述了多核苷酸接合体分子，其包含通用引物区域、样品识别区域和接合体区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，且其中所述样品识别区域的3’端与所述接合体区域的5’端偶联。在一些方面，所述通用引物区域包含CACGACCGGTGCTCGATTTAG，且其中所述接合体区域包含至少一个G。

本文还描述了多核苷酸引物，其包含通用引物区域和板识别区域，且其中所述板识别区域的3’端与所述通用引物区域的5’端偶联。在一些方面，所述通用引物区域包含CACGACCGGTGCTCGATTTAG，其中所述引物进一步包含测序区域，且其中所述测序区域的3’端与所述板识别区域的5’端偶联。

本文还描述了包含本文所述的多核苷酸的载体。在一些方面，所述载体包含多个多核苷酸。在一些方面，所述载体选自pEE6.4和 pEE12.4。

本文还描述了分离的宿主细胞，其包含本文所述的载体或本文所述的多核苷酸。在一些方面，所述宿主细胞选自CHO细胞、 CHO-K1细胞、CHO-S细胞、NS0细胞、为dhfr-的CHO细胞、 CHO-dhfr-、DUKX-B11CHO细胞和DG44CHO细胞。

本文还描述了用于产生一个或多个目标多核苷酸的方法，包括：获得包含与从一个或多个受试者获得的多个样品相关的多个cDNA 的cDNA文库，其中各cDNA与所述多个样品中的单一样品相关，且其中与各样品相关的各cDNA存在于单独的容器中；和将接合体分子添加到与各样品相关的cDNA上以产生所述一个或多个目标多核苷酸，其中所述接合体分子包含样品识别区域和接合体区域，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，且其中各接合体分子的所述样品识别区域的序列不同于文库中添加到各cDNA上的其它接合体分子的样品识别区域的序列。

在一些方面，所述方法进一步包括使所述接合体区域的3’端连接到所述文库中各cDNA的3’端以产生所述一个或多个目标多核苷酸。在一些方面，获得所述cDNA文库包括获得所述多个样品和处理所述样品以制备所述cDNA文库。在一些方面，所述接合体分子进一步包含通用引物区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联。在一些方面，各cDNA区域包含与cDNA 多核苷酸杂交的mRNA多核苷酸。在一些方面，各样品包含细胞。在一些方面，所述细胞是B细胞。在一些方面，所述B细胞是浆母细胞、记忆B细胞或浆细胞。在一些方面，各样品包含多个细胞。在一些方面，获得所述cDNA文库包括直接或间接地从已经处理所述多个样品以制备所述cDNA文库的第三方接收所述cDNA文库。在一些方面，通过将所述接合体与在反转录反应过程中生成的cDNA 的3’尾退火而添加所述接合体。在一些方面，各cDNA包含至少一个C核苷酸，其中C位于各cDNA的3’端，其中所述接合体区域包含至少一个G核苷酸，其中G位于所述接合体区域的3’端，且其中所述接合体区域通过所述G和C之间的结合连接到各cDNA上。在一些方面，所述接合体分子是单链的，且进一步包括通过允许酶将所述接合体分子形成为双链而将所述接合体分子并入到各cDNA中。在一些方面，所述接合体分子通过MMLV H^-反转录酶并入到各 cDNA中以产生所述目标多核苷酸。

本文还描述了产生一个或多个用于测序的目标多核苷酸的方法，包括：获得包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的 5’端偶联，且其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列；和利用引物组扩增所述多核苷酸文库以产生所述一个或多个用于测序的多核苷酸，其中所述一个或多个用于测序的目标多核苷酸包含第一测序区域、第一板识别区域、通用引物区域、样品识别区域、接合体区域、来自于单一样品的扩增子区域和第二测序区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述第一板识别区域可操作地与所述通用引物区域偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述第一测序区域位于所述目标多核苷酸的5’端，且其中所述第二测序区域位于所述目标多核苷酸的3’端。

在一些方面，所述方法进一步包括对所述一个或多个目标多核苷酸进行测序。在一些方面，所述方法进一步包括利用454测序对所述一个或多个目标多核苷酸进行测序。在一些方面，所述方法进一步包括利用SMRT测序对所述一个或多个目标多核苷酸进行测序。在一些方面，所述方法进一步包括利用SOLiD测序对所述一个或多个目标多核苷酸进行测序。在一些方面，所述方法进一步包括利用SOLEXA测序对所述一个或多个目标多核苷酸进行测序。在一些方面，所述方法进一步包括利用tSMS测序对所述一个或多个目标多核苷酸进行测序。在一些方面，所述引物组选自表1和5中所示的引物。在一些方面，获得所述多核苷酸文库包括在实验室中制备所述多核苷酸文库。在一些方面，获得所述多核苷酸文库包括直接或间接地从已经制备所述多核苷酸文库的第三方接收所述多核苷酸文库。

本文还描述了用于分析测序数据的方法，包括：获得与多个多核苷酸相关的数据集，其中所述数据集包含所述多个多核苷酸的测序数据，其中所述多个多核苷酸中的各多核苷酸包含样品识别区域，且其中各多核苷酸上的各样品识别区域对于单一样品是独特的，其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的所述多个多核苷酸中其它多核苷酸的样品识别区域的序列；和分析所述数据集以将具有相同样品识别区域的多核苷酸匹配在一起，其中匹配表示所述多核苷酸源自于相同的样品。

在一些方面，所述多个多核苷酸中的各多核苷酸还包含第一板识别区域，其中在各多核苷酸上各第一板识别区域与样品识别区域的各个组合对于单一样品是独特的，其中来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列不同于来自于与所述第一组单一样品不同的一个或多个单一样品组的所述多个多核苷酸中其它多核苷酸的第一板识别区域的序列；和进一步包括分析所述数据集以将具有相同的第一板识别区域和相同的样品识别区域的多核苷酸匹配在一起，其中两个区域的匹配表示所述多核苷酸源自于相同的样品。在一些方面，获得所述数据集包括获得所述多个多核苷酸并对所述多个多核苷酸测序以通过实验确定所述数据集。在一些方面，获得所述数据集包括直接或间接地从已经对所述多个多核苷酸测序以通过实验确定所述数据集的第三方接收所述数据集。在一些方面，所述数据集存储在电子存储介质上。在一些方面，所述单一样品是单一细胞。在一些方面，所述单一样品包含单一细胞。在一些方面，所述单一样品包含单一B细胞。在一些方面，所述单一样品包含多个B细胞。在一些方面，进一步包括选择一个或多个多核苷酸用于克隆。

本文还描述了用于基于第一目标多核苷酸的选择识别第二目标多核苷酸的方法，包括：获得与多个多核苷酸相关的数据集，其中所述数据集包含所述多个多核苷酸的测序数据，其中所述多个多核苷酸的各多核苷酸包含样品识别区域，且其中各多核苷酸上的各样品识别区域对于单一样品是独特的，从而将所述多个多核苷酸中的各多核苷酸与独特的单一样品相关联，其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的所述多个多核苷酸中其它多核苷酸的样品识别区域的序列；和从所述数据集选择与第一单一样品相关的第一目标多核苷酸和基于所述第一目标多核苷酸的样品识别区域识别所述第一单一样品中的第二目标多核苷酸。

在一些方面，所述多个多核苷酸中的各多核苷酸还包含第一板识别区域，其中在各多核苷酸上各第一板识别区域与样品识别区域的各个组合对于单一样品是独特的，其中来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列不同于来自于与所述第一组单一样品不同的一个或多个单一样品组的所述多个多核苷酸中其它多核苷酸的第一板识别区域的序列；和进一步包括基于所述第一目标多核苷酸的样品识别区域和第一板识别区域识别所述第一单一样品中的第二目标多核苷酸。在一些方面，所述第一单一样品包含B 细胞。在一些方面，所述第一单一样品包含多个B细胞。在一些方面，所述第一单一样品包含B细胞，其中所述第一目标多核苷酸包含抗体重链核苷酸序列，且其中所述第二目标多核苷酸包含抗体轻链核苷酸序列。在一些方面，所述第一单一样品包含B细胞，其中所述第一目标多核苷酸包含抗体轻链核苷酸序列，且其中所述第二目标多核苷酸包含抗体重链核苷酸序列。在一些方面，获得所述数据集包括获得所述多个多核苷酸并对所述多个多核苷酸测序以通过实验确定所述数据集。在一些方面，获得所述数据集包括直接或间接地从已经对所述多个多核苷酸测序以通过实验确定所述数据集的第三方接收所述数据集。在一些方面，所述数据集存储在电子存储介质上。

本文还描述了产生用于克隆的一个或多个目标多核苷酸的方法，包括：获得包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的 5’端偶联，且其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列；和利用引物组扩增所述多核苷酸文库以产生所述一个或多个用于克隆的目标多核苷酸，其中所述一个或多个用于克隆的目标多核苷酸包含第一限制性位点区域、通用引物区域、样品识别区域、接合体区域、来自于单一样品的扩增子区域和第二限制性位点区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述第一限制性位点区域位于所述目标多核苷酸的5’端，且其中所述第二限制性位点区域位于所述目标多核苷酸的3’端。

在一些方面，获得所述多核苷酸文库包括在实验室中制备所述多核苷酸文库。在一些方面，获得所述多核苷酸文库包括直接或间接地从已经制备所述多核苷酸文库的第三方接收所述多核苷酸文库。

本文还描述了产生目标分子的方法，包括：获得包含多核苷酸的宿主细胞，该多核苷酸包含样品识别区域、接合体区域和来自于单一样品的扩增子区域，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，且其中所述扩增子区域可操作地与所述接合体区域偶联；和在足以产生所述目标分子的条件下培养所述宿主细胞。在一些方面，获得所述宿主细胞包括在实验室中制备所述包含多核苷酸的宿主细胞。在一些方面，获得所述宿主细胞包括直接或间接地从已经制备所述宿主细胞的第三方接收所述包含多核苷酸的宿主细胞。在一些方面，所述目标分子是蛋白质。在一些方面，所述目标分子是抗体。在一些方面，所述目标分子是人单克隆抗体。在一些方面，进一步包括收集所述目标分子。

本文还描述了一种试剂盒，其包含本文所述的多核苷酸、多核苷酸文库、载体或宿主细胞及使用说明。

本文还描述了连接和条码标记(barcoding)多个非连续的目标多核苷酸序列的方法，所述方法包括：(a)提供多个cDNA分子；(b)物理连接目标cDNA分子；和(c)在物理连接之前、期间或之后将条码 (barcode)序列添加到目标cDNA上。

在一些方面，所述物理连接是通过连接反应。在一些方面，所述物理连接是通过重组。在一些方面，所述物理连接包括使用重叠- 延伸序列。在一些方面，所述条码序列位于物理连接的cDNA的一端或两端。在一些方面，所述条码序列位于物理连接的cDNA之间。在一些方面，所述连接反应通过相容末端的退火和连接进行。在一些方面，所述相容末端是限制性位点。在一些方面，所述连接反应通过平端连接进行。在一些方面，所述重叠-延伸序列在使用包含重叠-延伸尾的引物的扩增的过程中添加。在一些方面，所述重叠-延伸序列在使用包含重叠-延伸尾的引物的反转录的过程中添加。在一些方面，所述重叠-延伸序列通过将接合体与在反转录过程中产生的 cDNA的3’尾退火来添加。在一些方面，所述条码序列通过连接反应添加。在一些方面，所述连接反应通过相容末端的退火和连接进行。在一些方面，所述相容末端是限制性位点。在一些方面，所述连接反应通过包含条码序列的接合体的平端连接进行。在一些方面，所述条码序列在使用包含所述条码序列的引物的扩增反应的过程中添加。在一些方面，所述条码序列在使用包含所述条码序列的引物的反转录反应的过程中添加。在一些方面，所述条码序列通过将接合体与在反转录反应过程中产生的cDNA的3’尾退火来添加。在一些方面，所述cDNA的3’端包含至少一个C核苷酸，且其中所述接合体的3’端包含至少一个G核苷酸，且其中所述接合体通过所述C 和G之间的结合连接到各cDNA上。在一些方面，所述接合体是单链的，且进一步包括通过允许酶将所述接合体分子形成为双链而将所述接合体并入到各cDNA中。在一些方面，所述接合体通过MMLV H^-反转录酶并入到各cDNA中。在一些方面，所述重叠-延伸序列包含条码序列。在一些方面，所述目标多核苷酸序列包含抗体重链和轻链。在一些方面，进一步包括(d)在物理连接之前、期间或之后将测序区域添加到所述目标cDNA上。在一些方面，所述测序区域利用接合体添加。在一些方面，进一步包括(e)使用NextGen测序平台对物理连接的目标cDNA分子进行测序。在一些方面，所述NextGen 测序平台是454测序。在一些方面，所述NextGen测序平台是SMRT 测序。在一些方面，所述NextGen测序平台是SOLiD测序。在一些方面，所述NextGen测序平台是SOLEXA测序。在一些方面，所述 NextGen测序平台是tSMS测序。在一些方面，所述多个cDNA分子来自于容纳在具有至少6个孔、至少12个孔、至少24个孔、至少48个孔、至少96个孔、至少384个孔、至少1536个孔或更多个孔的板中的单一样品。在一些方面，所述多个cDNA分子来自于容纳在至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、二十个、三十个、四十个、五十个、七十五个、一百个或更多个各具有96个孔的板中的单一样品。

本文还描述了连接和条码标记包含目标多核苷酸序列的多个样品的方法，所述方法包括：(a)将所述样品分布在多个容器中；(b)使用来自所述样品的模板合成目标多核苷酸序列，其中所述合成导致条码序列的添加；和(c)实现步骤(b)中合成的所述目标多核苷酸序列的连接。

在一些方面，各样品包含细胞。在一些方面，所述细胞是B细胞。在一些方面，所述B细胞是浆母细胞、记忆B细胞或浆细胞。在一些方面，各样品包含多个细胞。在一些方面，所述目标多核苷酸序列包含抗体重链和轻链。在一些方面，所述合成包括RT-PCR 扩增。在一些方面，所述RT-PCR扩增在单一步骤中进行。在一些方面，所述目标核苷酸序列的连接在使用重叠-延伸引物的RT-PCR 扩增的过程中进行。在一些方面，进一步包括(d)在条码序列添加或连接之前、期间或之后将测序区域添加到所述目标多核苷酸序列上。在一些方面，所述测序区域利用接合体添加。在一些方面，进一步包括(e)使用NextGen测序平台对所述连接的目标多核苷酸序列进行测序。在一些方面，所述NextGen测序平台是454测序。在一些方面，所述NextGen测序平台是SMRT测序。在一些方面，所述NextGen 测序平台是SOLiD测序。在一些方面，所述NextGen测序平台是 SOLEXA测序。在一些方面，所述NextGen测序平台是tSMS测序。在一些方面，所述多个样品是容纳在具有至少6个孔、至少12个孔、至少24个孔、至少48个孔、至少96个孔、至少384个孔、至少1536 个孔或更多个孔的板中的单一样品。在一些方面，所述多个样品是容纳在至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、二十个、三十个、四十个、五十个、七十五个、一百个、两百个、五百个或更多个各具有96个孔的板中的单一样品。

本文还描述了连接和条码标记多个非连续的目标多核苷酸序列的方法，所述方法包括：(a)将细胞分布在多个容器中以获得分离的一个或多个细胞；(b)使用来自所述分离的一个或多个细胞的模板扩增目标多核苷酸序列，其中所述扩增导致条码序列的添加；和(c)实现步骤(b)中扩增的所述目标多核苷酸序列的连接。

在一些方面，所述目标核苷酸序列包含抗体重链和轻链。在一些方面，所述扩增包括RT-PCR扩增。在一些方面，所述RT-PCR 扩增在单一步骤中进行。在一些方面，所述目标核苷酸序列的连接在使用重叠-延伸引物的RT-PCR扩增的过程中进行。在一些方面，进一步包括(d)在条码序列添加或连接之前、期间或之后将测序区域添加到所述目标多核苷酸序列上。在一些方面，所述测序区域利用接合体添加。在一些方面，进一步包括(e)使用NextGen测序平台对所述连接的目标多核苷酸序列进行测序。在一些方面，所述NextGen测序平台是454测序。在一些方面，所述NextGen测序平台是SMRT 测序。在一些方面，所述NextGen测序平台是SOLiD测序。在一些方面，所述NextGen测序平台是SOLEXA测序。在一些方面，所述 NextGen测序平台是tSMS测序。在一些方面，所述一个或多个细胞容纳在具有至少6个孔、至少12个孔、至少24个孔、至少48个孔、至少96个孔、至少384个孔、至少1536个孔或更多个孔的板中。在一些方面，所述一个或多个细胞容纳在至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、二十个、三十个、四十个、五十个、七十五个、一百个或更多个各具有96个孔的板中。

本文还描述了包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-D-3’，其中A是样品识别区域(条码序列)，其中B是来自于单一样品的第一cDNA区域，其中C是接头区域，其中D是来自相同的单一样品的第二cDNA区域，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

本文还描述了包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-D-3’，其中A是来自于单一样品的第一 cDNA区域，其中B是接头区域，其中C是来自相同的单一样品的第二cDNA区域，其中D是样品识别区域(条码序列)，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

本文还描述了包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-3’，其中A是来自于单一样品的第一eDNA 区域，其中B是包含样品识别区域(条码序列)的接头区域，其中 C是来自相同的单一样品的第二cDNA区域，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

在一些方面，所述第一eDNA区域包含抗体重链和所述第二 cDNA区域包含抗体轻链。在一些方面，所述文库包含至少2个、至少3个、至少10个、至少30个、至少100个、至少300个、至少 1000个、至少3000个、至少10,000个、至少30,000个、至少100,000 个、至少300,000个、至少1,000,000个、至少3,000,000个、至少 10,000,000个、至少30,000,000个或更多个成员。在一些方面，所述文库包含细胞样品的整个转录组中的至少2个、至少3个、至少10 个、至少30个、至少100个、至少300个、至少1000个、至少3000 个、至少10,000个、至少30,000个或更多个基因。在一些方面，所述文库包含存在于个体的血液中的至少1种、至少2种、至少3种、至少10种、至少30种、至少100种、至少300种、至少1000种、至少10,000种、至少100,000种、至少1,000,000种、至少10,000,000 种、至少100,000,000种或更多种不同的抗体种类。在一些方面，所述抗体由浆母细胞、浆细胞、记忆B细胞、长寿浆细胞、其它B谱系细胞或其组合表达。

特别地，本发明涉及以下各项：

1.一种包含多核苷酸的组合物，其中所述多核苷酸包含第一区域和第二区域，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域，所述第二区域包含至少一个识别区域，且其中所述第一区域与所述第二区域偶联。

2.第1项的组合物，其中所述可变免疫球蛋白区域包含从直径大于或等于8μm的活化人B细胞分离的IgG免疫球蛋白核苷酸序列的VDJ区域，且其中所述免疫球蛋白区域的5’端与所述识别区域的3’端偶联。

3.第1-2项中任一项的组合物，其中所述组合物包括在克隆家族中。

4.第1-3项中任一项的组合物，其中所述免疫球蛋白区域从B 细胞分离，且其中所述B细胞是活化B细胞。

5.第1-4项中任一项的组合物，其中所述免疫球蛋白区域从B 细胞分离，且其中所述B细胞是浆母细胞。

6.第1-5项中任一项的组合物，其中所述免疫球蛋白区域从B 细胞分离，且其中所述B细胞是单一B细胞。

7.第1-6项中任一项的组合物，其中所述免疫球蛋白区域从B 细胞分离，且其中所述B细胞是单一活化B细胞。

8.第1-7项中任一项的组合物，其中所述免疫球蛋白区域从B 细胞分离，且其中所述B细胞是位于受试者的血液中的单一活化B 细胞。

9.第1-8项中任一项的组合物，其中所述免疫球蛋白区域从B 细胞分离，且其中所述B细胞是人活化B细胞。

10.第1-9项中任一项的组合物，其中所述免疫球蛋白区域从 B细胞分离，且其中所述B细胞是记忆B细胞。

11.第1-10项中任一项的组合物，其中所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是浆细胞。

12.第1-11项中任一项的组合物，其中所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是抗原特异性B细胞。

13.第1-12项中任一项的组合物，其中所述免疫球蛋白区域从哺乳动物B细胞分离。

14.第1-13项中任一项的组合物，其中所述免疫球蛋白区域从人B细胞分离。

15.第1-14项中任一项的组合物，其中所述免疫球蛋白区域从小鼠B细胞分离。

16.第1-15项中任一项的组合物，其中所述免疫球蛋白区域从来自于患有关注的疾病或病症的受试者的B细胞分离。

17.第1-16项中任一项的组合物，其中所述免疫球蛋白区域从来自于正从关注的疾病或病症恢复或已从关注的疾病或病症恢复的受试者的B细胞分离。

18.第1-17项中任一项的组合物，其中所述免疫球蛋白区域从来自于施用至少一种目标抗原的受试者的B细胞分离。

19.第1-18项中任一项的组合物，其中所述免疫球蛋白区域从来自于施用至少一种目标抗原和佐剂的受试者的B细胞分离。

20.第1-19项中任一项的组合物，其中所述免疫球蛋白区域从位于受试者的血液中的B细胞分离。

21.第1-20项中任一项的组合物，其中所述免疫球蛋白区域从位于受试者的骨髓中的B细胞分离。

22.第1-21项中任一项的组合物，其中所述免疫球蛋白区域从位于受试者的脾中的B细胞分离。

23.第1-22项中任一项的组合物，其中所述免疫球蛋白区域从位于受试者的至少一个淋巴结中的B细胞分离。

24.第1-23项中任一项的组合物，其中所述免疫球蛋白区域从位于受试者的淋巴组织中的B细胞分离。

25.第1-24项中任一项的组合物，其中所述免疫球蛋白区域从位于受试者的肠中的B细胞分离。

26.第1-25项中任一项的组合物，其中所述免疫球蛋白区域从直径为约8-20μm的活化B细胞分离。

27.第1-26项中任一项的组合物，其中所述免疫球蛋白区域从直径为8、9、10、11、12、13、14、15、16、17、18、19、20或大于20μm的活化B细胞分离。

28.第1-27项中任一项的组合物，其中所述免疫球蛋白区域从面积为约60、70、80、90、100、120、130、140、150、200、250、300、350或大于350μm2的活化B细胞分离。

29.第1-28项中任一项的组合物，其中所述免疫球蛋白区域从体积为约250、268、300、400、500、600、700、800、900、1000、 2000、3000、4000或大于4000μm3的活化B细胞分离。

30.第1-29项中任一项的组合物，其中所述免疫球蛋白区域从直径尺寸比对照静息B细胞的中值直径大10％或更大的活化B细胞分离。

31.第1-30项中任一项的组合物，其中所述免疫球蛋白区域从直径尺寸比对照静息B细胞的中值直径大15％或更大的活化B细胞分离。

32.第1-31项中任一项的组合物，其中所述免疫球蛋白区域从直径尺寸比对照静息B细胞的中值直径大20％或更大的活化B细胞分离。

33.第1-32项中任一项的组合物，其中所述免疫球蛋白区域从能够分泌免疫球蛋白的活化B细胞分离。

34.第1-33项中任一项的组合物，其中所述免疫球蛋白区域从处于细胞周期的合成前期(G1)、合成期(S)、合成后期(G2)或有丝分裂期(M)的B细胞分离。

35.第1-34项中任一项的组合物，其中所述免疫球蛋白区域从非处于细胞周期的静息期(G0)的B细胞分离。

36.第1-35项中任一项的组合物，其中所述免疫球蛋白区域从通过流式细胞术鉴定为具有大于静息B淋巴细胞的FSC平均值的 1.2倍的FSC的B细胞分离。

37.第1-36项中任一项的组合物，其中所述免疫球蛋白区域从通过流式细胞术鉴定为具有人单核细胞的FSC平均值的0.7-1.15 倍的FSC平均值的B细胞分离。

38.第1-37项中任一项的组合物，其中所述免疫球蛋白区域从单一CD19阳性B细胞分离。

39.第1-38项中任一项的组合物，其中所述免疫球蛋白区域从单一CD38阳性B细胞分离。

40.第1-39项中任一项的组合物，其中所述免疫球蛋白区域从单一CD27阳性B细胞分离。

41.第1-40项中任一项的组合物，其中所述免疫球蛋白区域从单一CD20阴性B细胞分离。

42.第1-41项中任一项的组合物，其中所述免疫球蛋白区域从单一CD19+CD20-CD27+CD38hi B细胞分离。

43.第1-42项中任一项的组合物，其中所述免疫球蛋白区域的5’端与所述识别区域的3’端偶联。

44.第1-43项中任一项的组合物，其中所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的VDJ区域。

45.第1-44项中任一项的组合物，其中所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的VJ区域。

46.第1-45项中任一项的组合物，其中所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的V、D和/或J区域。

47.第1-46项中任一项的组合物，其中所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的重链和/或轻链。

48.第1-47项中任一项的组合物，其中所述可变免疫球蛋白区域包含IgG、IgM、IgD、IgE或IgA免疫球蛋白序列。

49.第1-48项中任一项的组合物，其中所述可变免疫球蛋白区域包含人IgG1、IgG2、IgG3或IgG4免疫球蛋白序列。

50.第1-49项中任一项的组合物，其中所述可变免疫球蛋白区域包含小鼠IgG1、IgG2a、IgG2b或IgG3免疫球蛋白序列。

51.第1-50项中任一项的组合物，其中所述免疫球蛋白区域长度为约200-2000个核苷酸。

52.第1-51项中任一项的组合物，其中所述免疫球蛋白区域长度为小于200、200、300、400、500、600、700、800、900、1000、 1100、1200、1300、1400、1500、1600、1700、1800、1900、2000 或大于2000个核苷酸。

53.第1-52项中任一项的组合物，其中所述识别区域包含多个识别区域。

54.第1-53项中任一项的组合物，其中所述识别区域包含多个识别区域，且其中该多个识别区域中的各识别区域具有不同的序列。

55.第1-54项中任一项的组合物，其中所述识别区域包含至少一个样品识别区域和至少一个板识别区域。

56.第1-55项中任一项的组合物，其中所述识别区域包含与所述免疫球蛋白区域的序列不同的序列。

57.第1-56项中任一项的组合物，其中所述识别区域长度为约2-100个核苷酸。

58.第1-57项中任一项的组合物，其中所述识别区域长度为2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、30、40、50、60、70、80、90、100或大于100个核苷酸。

59.第1-58项中任一项的组合物，其中所述识别区域长度为 2-1,000个核苷酸。

60.第1-59项中任一项的组合物，其中所述识别区域长度等于或大于100个核苷酸。

61.第1-60项中任一项的组合物，其中所述识别区域包含连续的非编码核苷酸序列。

62.第1-61项中任一项的组合物，其中所述识别区域包含非编码核苷酸序列。

63.第1-62项中任一项的组合物，其中所述识别区域包含非连续的非编码核苷酸序列。

64.第1-63项中任一项的组合物，其中所述识别区域的序列长度小于所述免疫球蛋白区域的序列长度。

65.第1-64项中任一项的组合物，进一步包含第三区域，其中所述第三区域包含接合体区域。

66.第1-65项中任一项的组合物，进一步包含第三区域，其中所述第三区域包含接合体区域，且其中所述第三区域位于所述第一区域和所述第二区域之间。

67.第1-66项中任一项的组合物，进一步包含第三区域，其中所述第三区域包含接合体区域，且其中所述接合体区域包含至少一个位于其3’端的G核苷酸。

68.第1-67项中任一项的组合物，其中所述识别区域为2-100 个核苷酸长并具有不同于所述免疫球蛋白区域序列的序列，且其中所述接合体区域包含在其3’端的至少一个G核苷酸并位于所述样品识别区域的3’侧和所述免疫球蛋白区域的5’侧，且其中所述可变免疫球蛋白区域已发生超变而不同于原始B细胞的种系序列。

69.第1-68项中任一项的组合物，其中所述组合物存在于容器中。

70.第1-69项中任一项的组合物，其中多个所述组合物存在于容器中。

71.第1-70项中任一项的组合物，其中多个所述组合物存在于包含多个孔的单一板的单一孔中。

72.第1-71项中任一项的组合物，其中所述组合物处于组合物文库中，其中各组合物存在于单独的容器中，其中各组合物包含含有第一区域和第二区域的多核苷酸，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，其中各识别区域的核苷酸序列不同于文库中存在的其它识别区域的核苷酸序列，且其中文库中的多个可变免疫球蛋白区域的最后核苷酸序列共有至少80-99％的序列同一性。

73.第1-72项中任一项的组合物，其中所述组合物包括在包含多个多核苷酸组合物的文库中，其中各组合物存在于单独的容器中，其中各组合物包含多核苷酸，其中所述多核苷酸包含第一区域和第二区域，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，且其中各识别区域的核苷酸序列不同于文库中各单独容器中存在的其它识别区域的核苷酸序列。

74.一种包含多个多核苷酸组合物的多核苷酸组合物文库，其中各组合物存在于单独的容器中，其中各组合物包含多核苷酸，其中所述多核苷酸包含第一区域和第二区域，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，且其中各识别区域的核苷酸序列不同于文库中各单独容器中存在的其它识别区域的核苷酸序列。

75.一种包含多个多核苷酸的多核苷酸文库，其中所述多个多核苷酸的各多核苷酸存在于单独的容器中，其中所述多个多核苷酸的各多核苷酸包含第一区域和第二区域，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，其中各识别区域的核苷酸序列不同于文库中存在的其它识别区域的核苷酸序列，且其中所述多个多核苷酸中的至少两个可变免疫球蛋白区域共有至少80-99％的序列同一性。

76.一种包含多核苷酸的克隆家族的多核苷酸文库，其中所述家族中的各多核苷酸包含第一区域和第二区域，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，其中各识别区域的核苷酸序列不同于家族中存在的其它识别区域的核苷酸序列，且其中家族中的各可变免疫球蛋白区域表现出至少80-99％的序列同一性。

77.第76项的文库，其中所述文库包含多个克隆家族。

78.一种免疫球蛋白序列的克隆家族，其中家族中的各序列与识别区域偶联。

79.第78项的克隆家族，其中各识别区域不同于其它识别区域。

80.第78-79项中任一项的克隆家族，其中所述免疫球蛋白序列包含重链免疫球蛋白序列。

81.第78-80项中任一项的克隆家族，其中所述免疫球蛋白序列包含轻链免疫球蛋白序列。

82.第78-81项中任一项的克隆家族，其中所述免疫球蛋白序列包含重链和轻链免疫球蛋白序列。

83.第78-82项中任一项的克隆家族，其中一个或多个所述识别区域包含轻链免疫球蛋白序列。

84.第78-83项中任一项的克隆家族，其中一个或多个所述识别区域包含重链免疫球蛋白序列。

85.两个或更多个第78-84项中任一项的克隆家族的集合。

86.2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20或更多个第78-85项中任一项的克隆家族的集合。

87.一种免疫球蛋白序列的克隆家族，其中所述家族中的各序列与至少一个连续核苷酸序列可操作地偶联。

88.第87项的克隆家族，其中所述免疫球蛋白序列包含重链免疫球蛋白序列且所述的至少一个连续核苷酸序列包含轻链免疫球蛋白序列。

89.第87项的克隆家族，其中所述免疫球蛋白序列包含轻链免疫球蛋白序列且所述的至少一个连续核苷酸序列包含重链免疫球蛋白序列。

90.一种产生免疫球蛋白序列的克隆家族的方法，包括获得多个免疫球蛋白序列，其各具有V、D和/或J区域且各与识别区域偶联；和将该多个免疫球蛋白序列中的两个或更多个序列分组以产生所述克隆家族，其中所述克隆家族中的各序列是具有V、D和/或J区域的相同种系免疫球蛋白序列的突变形式或者具有该V、D和/或 J区域的种系免疫球蛋白序列。

91.第90项的方法，其中各识别区域不同于其它识别区域。

92.一种产生免疫球蛋白序列的克隆家族的方法，包括获得多个免疫球蛋白序列，其各具有V、D和/或J区域且各与识别区域偶联，且其中各识别区域不同于其它识别区域；去除一个或多个识别区域；和将该多个免疫球蛋白序列中的两个或更多个序列分组以产生所述克隆家族，其中所述克隆家族中的各序列是具有V、D和/或 J区域的相同种系免疫球蛋白序列的突变形式或者具有该V、D和/ 或J区域的种系免疫球蛋白序列。

93.一种识别与第一识别区域偶联的第二cDNA的方法，包括选择与所述第一识别区域偶联的第一cDNA和基于与各cDNA偶联的识别区域的共有同一性识别所述第二eDNA。

94.一种产生第二核苷酸序列上的3’尾的方法，包括获得第一核苷酸序列和使该第一核苷酸序列与在低于50℃的温度下具有模板转换活性的热稳定RNA酶H-反转录酶接触，其中所述接触产生所述3’尾和所述第二核苷酸序列。

95.第94项的方法，其中所述第一核苷酸序列在约低于50、 49、48、47、46、45、44、43、42或低于42℃下接触。

96.第94-95项中任一项的方法，其中所述第一核苷酸序列在 42℃下接触。

97.第94-96项中任一项的方法，其中所述第一核苷酸序列在 45.5℃下接触。

98.第94-97项中任一项的方法，其中所述转录酶是莫洛尼鼠白血病病毒(MMLV)RNA酶H-反转录酶。

99.第94-98项中任一项的方法，其中所述转录酶是 SuperScript III。

100.一种确定第一目标序列的天然存在序列的方法，包括获得与该第一序列相关且各与第一识别区域偶联的多个序列，其中各第一识别区域是相同的，且其中所述多个序列中的一个或多个序列不同于所述天然存在的序列；和比较所述多个序列中的序列以确定所述第一目标序列的天然存在的序列。

101.第100项的方法，其中所述多个序列包含免疫球蛋白序列。

102.第100-101项中任一项的方法，其中所述多个序列包含免疫球蛋白序列。

103.第100-102项中任一项的方法，其中所述多个序列包含免疫球蛋白序列。

104.第100-103项中任一项的方法，其中所述多个序列各与第二识别区域偶联且各第二识别区域是相同的。

105.第100-104项中任一项的方法，其中所述第一目标序列是免疫球蛋白序列。

106.第100-105项中任一项的方法，其中所述多个序列是免疫球蛋白序列。

107.一种包含多核苷酸的组合物，该多核苷酸包含第一区域和第二区域，其中所述第一区域包含B细胞源的可变免疫球蛋白区域和所述第二区域包含识别区域，且其中所述第一区域与所述第二区域偶联。

108.一种包含多个多核苷酸组合物的多核苷酸组合物文库，其中各组合物存在于单独的容器中，其中各组合物包含含有B细胞源的可变免疫球蛋白区域和识别区域的多核苷酸，其中所述可变免疫球蛋白区域与所述识别区域偶联，其中各识别区域的核苷酸序列不同于文库中各单独容器中存在的其它识别区域的核苷酸序列。

109.一种用于产生多核苷酸组合物的方法，包括：

获得包含第一区域的多核苷酸，其中所述第一区域包含与受试者相关的表达的B细胞可变免疫球蛋白区域；和

通过将所述第一区域与第二区域偶联产生包含第一区域和第二区域的多核苷酸组合物，其中所述第二区域包含识别区域。

110.第109项的方法，其中获得所述多核苷酸包括获得与受试者相关的B细胞和处理该细胞以制备所述多核苷酸。

111.第109-110项中任一项的方法，其中获得所述多核苷酸包括直接或间接地从已经处理与受试者相关的B细胞以制备所述多核苷酸的第三方接收所述多核苷酸。

112.第109-111项中任一项的方法，其中获得所述多核苷酸包括直接或间接地从已经溶解与受试者相关的B细胞以制备所述多核苷酸的第三方接收所述多核苷酸。

113.第109-112项中任一项的方法，其中获得所述多核苷酸包括使用流式细胞仪获得B细胞。

114.第109-113项中任一项的方法，其中获得所述多核苷酸包括使用微流体装置获得B细胞。

115.第109-114项中任一项的方法，其中所述可变免疫球蛋白区域包含从直径大于或等于8μm的活化人B细胞分离的IgG免疫球蛋白核苷酸序列的VDJ区域，且其中所述免疫球蛋白区域的5’端与所述识别区域的3’端偶联。

116.第109-115项中任一项的方法，其中所述组合物包括在克隆家族中。

117.第109-116项中任一项的方法，其中所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是活化B细胞。

118.第109-117项中任一项的方法，其中所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是浆母细胞。

119.第109-118项中任一项的方法，其中所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是单一B细胞。

120.第109-119项中任一项的方法，其中所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是单一活化B细胞。

121.第109-120项中任一项的方法，其中所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是位于受试者的血液中的单一活化B细胞。

122.第109-121项中任一项的方法，其中所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是人活化B细胞。

123.第109-122项中任一项的方法，其中所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是记忆B细胞。

124.第109-123项中任一项的方法，其中所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是浆细胞。

125.第109-124项中任一项的方法，其中所述免疫球蛋白区域从B细胞分离，且其中所述B细胞是抗原特异性B细胞。

126.第109-125项中任一项的方法，其中所述免疫球蛋白区域从哺乳动物B细胞分离。

127.第109-126项中任一项的方法，其中所述免疫球蛋白区域从人B细胞分离。

128.第109-127项中任一项的方法，其中所述免疫球蛋白区域从小鼠B细胞分离。

129.第109-128项中任一项的方法，其中所述免疫球蛋白区域从来自于患有关注的疾病或病症的受试者的B细胞分离。

130.第109-129项中任一项的方法，其中所述免疫球蛋白区域从来自于正从关注的疾病或病症恢复或已从关注的疾病或病症恢复的受试者的B细胞分离。

131.第109-130项中任一项的方法，其中所述免疫球蛋白区域从来自于施用目标抗原的受试者的B细胞分离。

132.第109-131项中任一项的方法，其中所述免疫球蛋白区域从来自于施用目标抗原和佐剂的受试者的B细胞分离。

133.第109-132项中任一项的方法，其中所述免疫球蛋白区域从位于受试者的血液中的B细胞分离。

134.第109-133项中任一项的方法，其中所述免疫球蛋白区域从位于受试者的骨髓中的B细胞分离。

135.第109-134项中任一项的方法，其中所述免疫球蛋白区域从位于受试者的脾中的B细胞分离。

136.第109-135项中任一项的方法，其中所述免疫球蛋白区域从位于受试者的至少一个淋巴结中的B细胞分离。

137.第109-136项中任一项的方法，其中所述免疫球蛋白区域从位于受试者的淋巴组织中的B细胞分离。

138.第109-137项中任一项的方法，其中所述免疫球蛋白区域从位于受试者的肠中的B细胞分离。

139.第109-138项中任一项的方法，其中所述免疫球蛋白区域从直径为约8-20μm的活化B细胞分离。

140.第109-139项中任一项的方法，其中所述免疫球蛋白区域从直径为8、9、10、11、12、13、14、15、16、17、18、19、20或大于20μm的活化B细胞分离。

141.第109-140项中任一项的方法，其中所述免疫球蛋白区域从面积为约60、70、80、90、100、120、130、140、150、200、250、 300、350或大于350μm2的活化B细胞分离。

142.第109-141项中任一项的方法，其中所述免疫球蛋白区域从体积为约250、268、300、400、500、600、700、800、900、1000、 2000、3000、4000或大于4000μm3的活化B细胞分离。

143.第109-142项中任一项的方法，其中所述免疫球蛋白区域从直径尺寸大于对照静息B细胞的中值直径10％或更大的活化B细胞分离。

144.第109-143项中任一项的方法，其中所述免疫球蛋白区域从直径尺寸大于对照静息B细胞的中值直径15％或更大的活化B细胞分离。

145.第109-144项中任一项的方法，其中所述免疫球蛋白区域从直径尺寸大于对照静息B细胞的中值直径20％或更大的活化B细胞分离。

146.第109-145项中任一项的方法，其中所述免疫球蛋白区域从能够分泌免疫球蛋白的活化B细胞分离。

147.第109-146项中任一项的方法，其中所述免疫球蛋白区域从处于细胞周期的合成前期(G1)、合成期(S)、合成后期(G2)或有丝分裂期(M)的B细胞分离。

148.第109-147项中任一项的方法，其中所述免疫球蛋白区域从非处于细胞周期的静息期(G0)的B细胞分离。

149.第109-148项中任一项的方法，其中所述免疫球蛋白区域从通过流式细胞术鉴定为具有大于静息B淋巴细胞的FSC平均值的1.2倍的FSC平均值的B细胞分离。

150.第109-149项中任一项的方法，其中所述免疫球蛋白区域从通过流式细胞术鉴定为具有人单核细胞的FSC平均值的0.7-1.15 倍的FSC的B细胞分离。

151.第109-150项中任一项的方法，其中所述免疫球蛋白区域从单一CD19阳性B细胞分离。

152.第109-151项中任一项的方法，其中所述免疫球蛋白区域从单一CD38阳性B细胞分离。

153.第109-152项中任一项的方法，其中所述免疫球蛋白区域从单一CD27阳性B细胞分离。

154.第109-153项中任一项的方法，其中所述免疫球蛋白区域从单一CD20阴性B细胞分离。

155.第109-154项中任一项的方法，其中所述免疫球蛋白区域从单一CD19+CD20-CD27+CD38hi B细胞分离。

156.第109-155项中任一项的方法，其中所述免疫球蛋白区域的5’端与所述识别区域的3’端偶联。

157.第109-156项中任一项的方法，其中所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的VDJ区域。

158.第109-157项中任一项的方法，其中所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的VJ区域。

159.第109-158项中任一项的方法，其中所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的V、D和/或J区域。

160.第109-159项中任一项的方法，其中所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的重链和/或轻链。

161.第109-160项中任一项的方法，其中所述可变免疫球蛋白区域包含IgG、IgM、IgD、IgE或IgA免疫球蛋白序列。

162.第109-161项中任一项的方法，其中所述可变免疫球蛋白区域包含人IgG1、IgG2、IgG3或IgG4免疫球蛋白序列。

163.第109-162项中任一项的方法，其中所述可变免疫球蛋白区域包含小鼠IgG1、IgG2a、IgG2b或IgG3免疫球蛋白序列。

164.第109-163项中任一项的方法，其中所述免疫球蛋白区域长度为约200-2000个核苷酸。

165.第109-164项中任一项的方法，其中所述免疫球蛋白区域长度为小于200、200、300、400、500、600、700、800、900、1000、 1100、1200、1300、1400、1500、1600、1700、1800、1900、2000 或大于2000个核苷酸。

166.第109-165项中任一项的方法，其中所述识别区域包含多个识别区域。

167.第109-166项中任一项的方法，其中所述识别区域包含多个识别区域，且其中该多个识别区域中的各识别区域具有不同的序列。

168.第109-167项中任一项的方法，其中所述识别区域包含至少一个样品识别区域和至少一个板识别区域。

169.第109-168项中任一项的方法，其中所述识别区域包含与所述免疫球蛋白区域的序列不同的序列。

170.第109-169项中任一项的方法，其中所述识别区域长度为约2-100个核苷酸。

171.第109-170项中任一项的方法，其中所述识别区域长度为 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、 19、20、30、40、50、60、70、80、90、100或大于100个核苷酸。

172.第109-171项中任一项的方法，其中所述识别区域长度为 2-1,000个核苷酸。

173.第109-172项中任一项的方法，其中所述识别区域长度等于或大于100个核苷酸。

174.第109-173项中任一项的方法，其中所述识别区域包含连续的非编码核苷酸序列。

175.第109-174项中任一项的方法，其中所述识别区域包含非编码核苷酸序列。

176.第109-175项中任一项的方法，其中所述识别区域包含非连续的非编码核苷酸序列。

177.第109-176项中任一项的方法，其中所述识别区域的序列长度小于所述免疫球蛋白区域的序列长度。

178.第109-177项中任一项的方法，进一步包含第三区域，其中所述第三区域包含接合体区域。

179.第109-178项中任一项的方法，进一步包含第三区域，其中所述第三区域包含接合体区域，且其中所述第三区域位于所述第一区域和所述第二区域之间。

180.第109-179项中任一项的方法，进一步包含第三区域，其中所述第三区域包含接合体区域，且其中所述接合体区域包含位于其3’端的至少一个G核苷酸。

181.第109-180项中任一项的方法，其中所述识别区域为2-100 个核苷酸长并具有不同于所述免疫球蛋白区域序列的序列，且其中所述接合体区域包含在其3’端的至少一个G核苷酸并位于所述样品识别区域的3’侧和所述免疫球蛋白区域的5’侧，且其中所述可变免疫球蛋白区域已发生超变且不同于原始B细胞的种系序列。

182.第109-181项中任一项的方法，其中所述组合物存在于容器中。

183.第109-182项中任一项的方法，其中多个所述组合物存在于容器中。

184.第109-183项中任一项的方法，其中多个所述组合物存在于包含多个孔的单一板的单一孔中。

185.第109-184项中任一项的方法，其中所述组合物处于组合物文库中，其中各组合物存在于单独的容器中，其中各组合物包含含有第一区域和第二区域的多核苷酸，其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域，其中所述第一区域与所述第二区域偶联，其中各识别区域的核苷酸序列不同于文库中存在的其它识别区域的核苷酸序列，且其中文库中的多个可变免疫球蛋白区域的核苷酸序列共有至少80-99％的序列同一性。

186.一种用于产生多核苷酸组合物的方法，包括：

获得与受试者相关的B细胞；

从包含表达的B细胞可变免疫球蛋白区域的所述细胞分离多核苷酸；和

通过将所述可变免疫球蛋白区域与识别区域偶联产生包含所述可变免疫球蛋白区域和识别区域的多核苷酸组合物。

187.一种用于产生多核苷酸组合物的方法，包括：

获得包含受试者相关的B细胞源可变免疫球蛋白区域的多核苷酸；和

188.第187项的方法，其中获得所述多核苷酸包括获得B细胞和处理该细胞以制备所述多核苷酸。

189.第187项的方法，其中获得所述多核苷酸包括直接或间接地从已经处理B细胞以制备所述多核苷酸的第三方接收所述多核苷酸。

190.一种用于产生两个或更多个多核苷酸组合物的方法，包括：

获得包含多个多核苷酸的多核苷酸文库，该多个多核苷酸与从一个或多个受试者获得的多个样品相关，其中一个或多个多核苷酸包含表达的B细胞可变免疫球蛋白区域，其中各样品与B细胞相关，且其中与各样品相关的各多核苷酸存在于单独的容器中；和

通过将所述多核苷酸与识别区域偶联产生两个或更多个多核苷酸组合物，该多核苷酸组合物各包含来自所述多个多核苷酸的多核苷酸和识别区域，其中各识别区域的序列不同于与文库中其它多核苷酸偶联的识别区域的序列。

191.第190项的方法，其中获得所述多核苷酸文库包括获得多个B细胞并处理该细胞以制备所述多核苷酸文库。

192.第190项的方法，其中获得所述多核苷酸文库包括直接或间接地从已经处理多个B细胞以制备所述多核苷酸文库的第三方接收所述多核苷酸文库。

193.一种用于产生两个或更多个多核苷酸组合物的方法，包括：

获得包含多个多核苷酸的多核苷酸文库，该多个多核苷酸与从一个或多个受试者获得的多个样品相关，其中一个或多个多核苷酸包含B细胞源可变免疫球蛋白区域，且其中与各样品相关的各多核苷酸存在于单独的容器中；和

194.第193项的方法，其中获得所述多核苷酸文库包括获得多个B细胞并处理该细胞以制备所述多核苷酸文库。

195.第193项的方法，其中获得所述多核苷酸文库包括直接或间接地从已经处理多个B细胞以制备所述多核苷酸文库的第三方接收所述多核苷酸文库。

196.一种包含多个多核苷酸组合物的多核苷酸组合物文库，其中各组合物存在于单独的容器中，其中各组合物包含单一样品来源的cDNA区域和样品识别-接合体区域，所述cDNA区域包含在该 cDNA区域的3’端的核苷酸C，所述样品识别-接合体区域包含与接合体区域偶联的样品识别区域，其中各样品识别-接合体区域的所述样品识别区域的核苷酸序列不同于文库中各单独的容器中存在的其它样品识别-接合体区域的样品识别区域的核苷酸序列，其中所述接合体区域包含在所述接合体区域的3’端的核苷酸G，且其中所述样品识别-接合体区域通过所述C和G之间的结合连接于所述cDNA区域。

197.第196项的文库，其中所述cDNA区域包含与DNA多核苷酸杂交的RNA多核苷酸。

198.第196项或第197项的文库，其中所述cDNA区域包含与 cDNA多核苷酸杂交的mRNA多核苷酸。

199.第196-198项中任一项的文库，其中所述cDNA区域包含在3’端的至少一个C和其中所述接合体区域包含在3’端的至少一个G。

200.一种包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含样品识别区域、接合体区域和单一样品来源的cDNA区域，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述cDNA区域与所述接合体区域的3’端偶联，其中来自第一单一样品的各多核苷酸的样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列，且其中所述样品识别区域是双链的。

201.第200项的文库，其中各多核苷酸包含多个样品识别区域。

202.一种包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的 5’端偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述通用引物区域的序列在所述多个多核苷酸中的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

203.第202项的文库，其中所述扩增子区域的5’端与所述接合体区域的3’端偶联，其中所述通用引物区域包含序列 CACGACCGGTGCTCGATTTAG，且其中所述接合体区域包含至少一个G。

204.第202-203项中任一项的文库，其中所述通用引物区域的序列不与任何人基因外显子完全互补，且其中所述通用引物区域具有不干扰所述接合体区域的最小二级结构。

205.第202-204项中任一项的文库，其中所述通用引物区域是序列CACGACCGGTGCTCGATTTAG。

206.第202-205项中任一项的文库，其中所述扩增子区域包含含有cDNA核苷酸序列的cDNA区域。

207.第202-206项中任一项的文库，其中来自于第一单一样品的各多核苷酸的所述样品识别区域的序列与来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列具有至少一个核苷酸的不同。

208.第202-207项中任一项的文库，其中来自于第一单一样品的各多核苷酸的所述样品识别区域的序列与来自于与所述第一单一样品的不同一个或多个样品的文库中其它多核苷酸的样品识别区域的序列具有至少2个核苷酸的不同。

209.第202-208项中任一项的文库，其中所述样品识别区域长度为至少10个核苷酸。

210.第202-209项中任一项的文库，其中所述样品识别区域长度为至少1个核苷酸。

211.第202-210项中任一项的文库，其中各样品识别区域的序列选自表2和7。

212.第202-211项中任一项的文库，其中所述接合体区域的序列包含在其3’端的至少一个G核苷酸。

213.第202-211项中任一项的文库，其中所述扩增子区域包含免疫球蛋白重链扩增子序列、免疫球蛋白轻链扩增子序列、T细胞受体α扩增子序列或T细胞受体β扩增子序列。

214.一种包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-D-3’，其中A是通用引物区域，其中B是样品识别区域，其中C是接合体区域，其中D是来自于单一样品的扩增子区域，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

215.一种多核苷酸，包含通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域，其中所述通用引物区域的 3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的 3’端与所述接合体区域的5’端偶联，且其中所述扩增子区域可操作地与所述接合体区域偶联。

216.第215项的多核苷酸，其中所述扩增子区域的5’端与所述接合体区域的3’端偶联，其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG，且其中所述接合体区域包含至少一个G。

217.一种包含序列5’-A-B-C-D-3’的多核苷酸，其中A是通用引物区域，其中B是样品识别区域，其中C是接合体区域，且其中D是来自于单一样品的扩增子区域。

218.一种包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含第一板识别区域、通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述第一板识别区域可操作地与所述通用引物区域偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

219.第218项的文库，其中来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列不同于来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列。

220.第218-219项中任一项的文库，其中来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列与来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列具有至少一个核苷酸的不同。

221.第218-220项中任一项的文库，其中来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列与来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列具有至少2个核苷酸的不同。

222.第218-221项中任一项的文库，其中所述第一板识别区域长度为至少10个多核苷酸。

223.第218-222项中任一项的文库，其中所述第一板识别区域的序列选自表3和6。

224.第218-223项中任一项的文库，其中所述第一板识别区域的3’端与所述通用引物区域的5’端偶联，其中所述扩增子区域的 5’端与所述接合体区域的3’端偶联，其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG，其中所述接合体区域包含至少一个G，其中各多核苷酸进一步包含第二板识别区域、第一测序区域和第二测序区域，其中所述第二板识别区域的5’端与所述扩增子区域的3’端偶联，其中所述第一测序区域的3’端与所述第一板识别区域的5’端偶联，且其中所述第二测序区域的5’端与所述第二板识别区域的3’端偶联。

225.第218-224项中任一项的文库，其中所述第二板识别区域的序列与各多核苷酸上所述第一板识别区域的序列相同。

226.第218-225项中任一项的文库，其中来自第一组单一样品的各多核苷酸的所述第二板识别区域的序列不同于来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列。

227.第218-226项中任一项的文库，其中来自第一组单一样品的各多核苷酸的所述第二板识别区域的序列与来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列具有至少一个多核苷酸的不同。

228.第218-227项中任一项的文库，其中来自第一组单一样品的各多核苷酸的所述第二板识别区域的序列与来自于与所述第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列具有至少2个多核苷酸的不同。

229.第218-228项中任一项的文库，其中所述第二板识别区域长度为至少10个多核苷酸。

230.第218-229项中任一项的文库，其中所述第二板识别区域的序列选自表3和6。

231.第218-230项中任一项的文库，其中所述第一测序区域包含GAGAGACTGACAGCGTATCGCCTCCCTCGCGCCATCAG。

232.第218-231项中任一项的文库，其中所述第二测序区域包含CTATGCGCCTTGCCAGCCCGCTCAG。

233.一种包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-D-3’，其中A是板识别区域，其中B是通用引物区域，其中C是样品识别区域，其中D是接合体区域，其中E 是来自于单一样品的扩增子区域，且其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

234.一种包含第一板识别区域、通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域的多核苷酸，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述第一板识别区域可操作地与所述通用引物区域偶联，且其中所述扩增子区域可操作地与所述接合体区域偶联。

235.第234项的多核苷酸，其中所述第一板识别区域的3’端与所述通用引物区域的5’端偶联，其中所述扩增子区域的5’端与所述接合体区域的3’端偶联，其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG，其中所述接合体区域包含至少一个G，其中各多核苷酸进一步包含第二板识别区域、第一测序区域和第二测序区域，其中所述第二板识别区域的5’端与所述扩增子区域的3’端偶联，其中所述第一测序区域的3’端与所述第一板识别区域的5’端偶联，且其中所述第二测序区域的5’端与所述第二板识别区域的3’端偶联。

236.一种包含序列5’-A-B-C-D-E-3’的多核苷酸，其中A是板识别区域，其中B是通用引物区域，其中C是样品识别区域，其中D是接合体区域，且其中E是来自于单一样品的扩增子区域。

237.一种包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含第一限制性位点区域、通用引物区域、样品识别区域、接合体区域、来自于单一样品的扩增子区域和第二限制性位点区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述第一限制性位点区域可操作地与所述通用引物区域偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述第二限制性位点区域可操作地与所述扩增子区域偶联，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

238.第237项的文库，其中所述第一限制性位点区域包含一个或多个限制性位点。

239.第237-238项中任一项的文库，其中所述第一限制性位点区域包含选自NheI、XhoI、BstBI、EcoRI、SacII、BbvCI、PspXI、AgeI、ApaI、KpnI、Acc65I、XmaI、BstEII、DraIII、PacI、FseI、 AsiSI和AscI的一个或多个限制性位点。

240.第237-239项中任一项的文库，其中所述第二限制性位点区域包含一个或多个限制性位点。

241.第237-240项中任一项的文库，其中所述第二限制性位点区域包含选自NheI、XhoI、BstBI、EcoRI、SacII、BbvCI、PspXI、 AgeI、ApaI、KpnI、Acc65I、XmaI、BstEII、DraIII、PacI、FseI、 AsiSI和AscI的一个或多个限制性位点。

242.第237-241项中任一项的文库，其中所述第一限制性位点区域的3’端与所述通用引物区域的5’端偶联，其中所述接合体区域的3’端与所述扩增子区域的5’端偶联，其中所述扩增子区域的 3’端与所述第二限制性位点区域的5’端偶联，其中所述通用引物区域包含CACGACCGGTGCTCGATTTAG，且其中所述接合体区域包含至少一个G。

243.一种包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-D-E-F-3’，其中A是第一限制性位点区域，其中B是通用引物区域，其中C是样品识别区域，其中D是接合体区域，其中E是来自于单一样品的扩增子区域，其中F是第二限制性位点区域，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

244.一种用于插入载体中的多核苷酸，其包含第一限制性位点区域、通用引物区域、样品识别区域、接合体区域、来自于单一样品的扩增子区域和第二限制性位点区域，其中所述通用引物区域的 3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述第一限制性位点区域可操作地与所述通用引物区域偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，且其中所述第二限制性位点区域可操作地与所述扩增子区域偶联。

245.第244项的多核苷酸，其中所述第一限制性位点区域的3’ 端与所述通用引物区域的5’端偶联，其中所述接合体区域的3’端与所述扩增子区域的5’端偶联，其中所述扩增子区域的3’端与所述第二限制性位点区域的5’端偶联，其中所述通用引物区域包含CACGACCGGTGCTCGATTTAG，且其中所述接合体区域包含至少一个G。

246.一种用于插入载体中的多核苷酸，包含序列5’ -A-B-C-D-E-F-3’，其中A是第一限制性位点区域，其中B是通用引物区域，其中C是样品识别区域，其中D是接合体区域，其中E 是来自于单一样品的扩增子区域，和其中F是第二限制性位点区域。

247.一种多核苷酸接合体分子，其包含通用引物区域、样品识别区域和接合体区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，且其中所述样品识别区域的3’端与所述接合体区域的5’端偶联。

248.第247项的分子，其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG，且其中所述接合体区域包含至少一个G。

249.一种多核苷酸引物，其包含通用引物区域和板识别区域，且其中所述板识别区域的3’端与所述通用引物区域的5’端偶联。

250.第249项的引物，其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG，其中所述引物进一步包含测序区域，且其中所述测序区域的3’端与所述板识别区域的5’端偶联。

251.一种包含第1-250项中任一项的多核苷酸的载体。

252.第251项的载体，其中所述载体包含多个多核苷酸。

253.第251-252项中任一项的载体，其中所述载体选自pEE6.4 和pEE12.4。

254.一种分离的宿主细胞，其包含第251-253项中任一项的载体或第1-250项中任一项的多核苷酸。

255.第254项的宿主细胞，其中所述宿主细胞选自CHO细胞、 CHO-K1细胞、CHO-S细胞、NS0细胞、为dhfr-的CHO细胞、 CHO-dhfr-、DUKX-B11 CHO细胞和DG44 CHO细胞。

256.一种用于产生一个或多个目标多核苷酸的方法，包括：

获得包含与从一个或多个受试者获得的多个样品相关的多个 cDNA的cDNA文库，其中各cDNA与所述多个样品中的单一样品相关，且其中与各样品相关的各cDNA存在于单独的容器中；和

将接合体分子添加到与各样品相关的cDNA上以产生所述一个或多个目标多核苷酸，其中所述接合体分子包含样品识别区域和接合体区域，其中所述样品识别区域的3’端与所述接合体区域的5’ 端偶联，且其中各接合体分子的所述样品识别区域的序列不同于文库中添加到各cDNA上的其它接合体分子的样品识别区域的序列。

257.第256项的方法，进一步包括使所述接合体区域的3’端连接到所述文库中各cDNA的3’端以产生所述一个或多个目标多核苷酸。

258.第256-257项中任一项的方法，其中获得所述cDNA文库包括获得所述多个样品和处理所述样品以制备所述cDNA文库。

259.第256-258项中任一项的方法，其中所述接合体分子进一步包含通用引物区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联。

260.第256-259项中任一项的方法，其中各cDNA区域包含与 cDNA多核苷酸杂交的mRNA多核苷酸。

261.第256-260项中任一项的方法，其中各样品包含细胞。

262.第256-261项中任一项的方法，其中所述细胞是B细胞。

263.第256-262项中任一项的方法，其中所述B细胞是浆母细胞、记忆B细胞或浆细胞。

264.第256-263项中任一项的方法，其中各样品包含多个细胞。

265.第256-264项中任一项的方法，其中获得所述cDNA文库包括直接或间接地从已经处理所述多个样品以制备所述cDNA文库的第三方接收所述cDNA文库。

266.第256-265项中任一项的方法，其中通过将所述接合体与在反转录反应过程中生成的cDNA的3’尾退火而添加所述接合体。

267.第256-266项中任一项的方法，其中各cDNA包含至少一个C核苷酸，其中C位于各cDNA的3’端，其中所述接合体区域包含至少一个G核苷酸，其中G位于所述接合体区域的3’端，且其中所述接合体区域通过所述G和C之间的结合连接到各cDNA上。

268.第256-267项中任一项的方法，其中所述接合体分子是单链的，且进一步包括通过允许酶将所述接合体分子形成为双链而将所述接合体分子并入到各cDNA中。

269.第256-268项中任一项的方法，其中所述接合体分子通过 MMLV H-反转录酶并入到各cDNA中以产生所述目标多核苷酸。

270.一种产生一个或多个用于测序的目标多核苷酸的方法，包括：

获得包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域，其中所述通用引物区域的3’端与所述样品识别区域的5’ 端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，且其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列；和

利用引物组扩增所述多核苷酸文库以产生所述一个或多个用于测序的目标多核苷酸，其中所述一个或多个用于测序的目标多核苷酸包含第一测序区域、第一板识别区域、通用引物区域、样品识别区域、接合体区域、来自于单一样品的扩增子区域和第二测序区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述第一板识别区域可操作地与所述通用引物区域偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述第一测序区域位于所述目标多核苷酸的5’端，且其中所述第二测序区域位于所述目标多核苷酸的3’端。

271.第270项的方法，进一步包括对所述一个或多个目标多核苷酸进行测序。

272.第270项的方法，进一步包括利用454测序对所述一个或多个目标多核苷酸进行测序。

273.第270项的方法，进一步包括利用SMRT测序对所述一个或多个目标多核苷酸进行测序。

274.第270项的方法，进一步包括利用SOLiD测序对所述一个或多个目标多核苷酸进行测序。

275.第270项的方法，进一步包括利用SOLEXA测序对所述一个或多个目标多核苷酸进行测序。

276.第270项的方法，进一步包括利用tSMS测序对所述一个或多个目标多核苷酸进行测序。

277.第270项的方法，其中所述引物组选自表1和5中所示的引物。

278.第270项的方法，其中获得所述多核苷酸文库包括在实验室中制备所述多核苷酸文库。

279.第270项的方法，其中获得所述多核苷酸文库包括直接或间接地从已经制备所述多核苷酸文库的第三方接收所述多核苷酸文库。

280.一种用于分析测序数据的方法，包括：

获得与多个多核苷酸相关的数据集，其中所述数据集包含所述多个多核苷酸的测序数据，其中所述多个多核苷酸中的各多核苷酸包含样品识别区域，且其中各多核苷酸上的各样品识别区域对于单一样品是独特的，其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的所述多个多核苷酸中其它多核苷酸的样品识别区域的序列；和

分析所述数据集以将具有相同样品识别区域的多核苷酸匹配在一起，其中匹配表示所述多核苷酸源自于相同的样品。

281.第280项的方法，其中所述多个多核苷酸中的各多核苷酸还包含第一板识别区域，其中各多核苷酸上的各第一板识别区域与样品识别区域的各组合对于单一样品是独特的，其中来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列不同于来自于与所述第一组单一样品不同的一个或多个单一样品组的所述多个多核苷酸中其它多核苷酸的第一板识别区域的序列；和进一步包括分析所述数据集以将具有相同的第一板识别区域和相同的样品识别区域的多核苷酸匹配在一起，其中两个区域的匹配表示所述多核苷酸源自于相同的样品。

282.第280项的方法，其中获得所述数据集包括获得所述多个多核苷酸并对所述多个多核苷酸测序以通过实验确定所述数据集。

283.第280项的方法，其中获得所述数据集包括直接或间接地从已经对所述多个多核苷酸测序以通过实验确定所述数据集的第三方接收所述数据集。

284.第280项的方法，其中所述数据集存储在电子存储介质上。

285.第280项的方法，其中所述单一样品是单一细胞。

286.第280项的方法，其中所述单一样品包含单一细胞。

287.第280项的方法，其中所述单一样品包含单一B细胞。

288.第280项的方法，其中所述单一样品包含多个B细胞。

289.第280项的方法，进一步包括选择一个或多个多核苷酸用于克隆。

290.一种用于基于第一目标多核苷酸的选择鉴别第二目标多核苷酸的方法，包括：

获得与多个多核苷酸相关的数据集，其中所述数据集包含所述多个多核苷酸的测序数据，其中所述多个多核苷酸中的各多核苷酸包含样品识别区域，且其中各多核苷酸上的各样品识别区域对于单一样品是独特的，从而将所述多个多核苷酸中的各多核苷酸与独特的单一样品相关联，其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的所述多个多核苷酸中其它多核苷酸的样品识别区域的序列；和

从所述数据集选择与第一单一样品相关的第一目标多核苷酸和基于所述第一目标多核苷酸的样品识别区域鉴别所述第一单一样品中的第二目标多核苷酸。

291.第290项的方法，其中所述多个多核苷酸的各多核苷酸还包含第一板识别区域，其中各多核苷酸上的各第一板识别区域与样品识别区域的各组合对于单一样品是独特的，其中来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列不同于来自于与所述第一组单一样品不同的一个或多个单一样品组的所述多个多核苷酸中其它多核苷酸的第一板识别区域的序列；和进一步包括基于所述第一目标多核苷酸的样品识别区域和第一板识别区域鉴别所述第一单一样品中的第二目标多核苷酸。

292.第291项的方法，其中所述第一单一样品包含B细胞。

293.第291项的方法，其中所述第一单一样品包含多个B细胞。

294.第291项的方法，其中所述第一单一样品包含B细胞，其中所述第一目标多核苷酸包含抗体重链核苷酸序列，且其中所述第二目标多核苷酸包含抗体轻链核苷酸序列。

295.第291项的方法，其中所述第一单一样品包含B细胞，其中所述第一目标多核苷酸包含抗体轻链核苷酸序列，且其中所述第二目标多核苷酸包含抗体重链核苷酸序列。

296.第291项的方法，其中获得所述数据集包括获得所述多个多核苷酸并对所述多个多核苷酸测序以通过实验确定所述数据集。

297.第291项的方法，其中获得所述数据集包括直接或间接地从已经对所述多个多核苷酸测序以通过实验确定所述数据集的第三方接收所述数据集。

298.第291项的方法，其中所述数据集存储在电子存储介质上。

299.一种产生用于克隆的一个或多个目标多核苷酸的方法，包括：

利用引物组扩增所述多核苷酸文库以产生所述用于克隆的一个或多个目标多核苷酸，其中所述用于克隆的一个或多个目标多核苷酸包含第一限制性位点区域、通用引物区域、样品识别区域、接合体区域、来自于单一样品的扩增子区域和第二限制性位点区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述第一限制性位点区域位于所述目标多核苷酸的5’端，且其中所述第二限制性位点区域位于所述目标多核苷酸的3’端。

300.第299项的方法，其中获得所述多核苷酸文库包括在实验室中制备所述多核苷酸文库。

301.第299项的方法，其中获得所述多核苷酸文库包括直接或间接地从已经制备所述多核苷酸文库的第三方接收所述多核苷酸文库。

302.一种产生目标分子的方法，包括：

获得包含多核苷酸的宿主细胞，该多核苷酸包含样品识别区域、接合体区域和来自于单一样品的扩增子区域，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，且其中所述扩增子区域可操作地与所述接合体区域偶联；和

在足以产生所述目标分子的条件下培养所述宿主细胞。

303.第302项的方法，其中获得所述宿主细胞包括在实验室中制备包含所述多核苷酸的所述宿主细胞。

304.第302项的方法，其中获得所述宿主细胞包括直接或间接地从已经制备所述宿主细胞的第三方接收包含所述多核苷酸的所述宿主细胞。

305.第302项的方法，其中所述目标分子是蛋白质。

306.第302项的方法，其中所述目标分子是抗体。

307.第302项的方法，其中所述目标分子是人单克隆抗体。

308.第302项的方法，进一步包括收集所述目标分子。

309.一种试剂盒，包含第1-308项中任一项的多核苷酸、多核苷酸文库、载体或宿主细胞及使用说明。

310.一种连接和条码标记多个非连续的目标多核苷酸序列的方法，所述方法包括：

(a)提供多个cDNA分子；

(b)物理连接目标cDNA分子；和

(c)在物理连接之前、期间或之后将条码序列添加到目标cDNA 上。

311.第310项的方法，其中所述物理连接是通过连接反应。

312.第310项的方法，其中所述物理连接是通过重组。

313.第310项的方法，其中所述物理连接包括使用重叠-延伸序列。

314.第310项的方法，其中所述条码序列位于物理连接的 cDNA的一端或两端。

315.第310项的方法，其中所述条码序列位于物理连接的cDNA之间。

316.第311项的方法，其中所述连接反应通过相容末端的退火和连接进行。

317.第310项的方法，其中所述相容末端是限制性位点。

318.第310项的方法，其中所述连接反应通过平端连接进行。

319.第310项的方法，其中所述重叠-延伸序列在使用包含重叠-延伸尾的引物进行的扩增的过程中添加。

320.第310项的方法，其中所述重叠-延伸序列在使用包含重叠-延伸尾的引物进行的反转录的过程中添加。

321.第310项的方法，其中所述重叠-延伸序列通过将接合体与在反转录过程中产生的cDNA的3’尾退火来添加。

322.第310项的方法，其中所述条码序列通过连接反应添加。

323.第310项的方法，其中所述连接反应通过相容末端的退火和连接进行。

324.第310项的方法，其中所述相容末端是限制性位点。

325.第310项的方法，其中所述连接反应通过包含条码序列的接合体的平端连接进行。

326.第310项的方法，其中所述条码序列使用包含所述条码序列的引物在扩增反应的过程中添加。

327.第310项的方法，其中所述条码序列使用包含所述条码序列的引物在反转录反应的过程中添加。

328.第310项的方法，其中所述条码序列通过将接合体与在反转录反应过程中产生的cDNA的3’尾退火来添加。

329.第310项的方法，其中所述cDNA的3’端包含至少一个 C核苷酸，且其中所述接合体的3’端包含至少一个G核苷酸，且其中所述接合体通过所述C和G之间的结合连接到各cDNA上。

330.第310项的方法，其中所述接合体是单链的，且进一步包括通过允许酶将所述接合体分子形成为双链而将所述接合体并入到各cDNA中。

331.第310项的方法，其中所述接合体通过MMLV H-反转录酶并入到各cDNA中。

332.第310项的方法，其中所述重叠-延伸序列包含条码序列。

333.第310项的方法，其中所述目标多核苷酸序列包含抗体重链和轻链。

334.第310项的方法，进一步包括(d)在物理连接之前、期间或之后将测序区域添加到所述目标cDNA上。

335.第310项的方法，其中所述测序区域利用接合体添加。

336.第310项的方法，进一步包括(e)使用NextGen测序平台对物理连接的目标cDNA分子进行测序。

337.第310项的方法，其中所述NextGen测序平台是454测序。

338.第310项的方法，其中所述NextGen测序平台是SMRT 测序。

339.第310项的方法，其中所述NextGen测序平台是SOLiD 测序。

340.第310项的方法，其中所述NextGen测序平台是SOLEXA 测序。

341.第310项的方法，其中所述NextGen测序平台是tSMS测序。

342.第310项的方法，其中所述多个cDNA分子来自于容纳在具有至少6个孔、至少12个孔、至少24个孔、至少48个孔、至少 96个孔、至少384个孔、至少1536个孔或更多个孔的板中的单一样品。

343.第310项的方法，其中所述多个cDNA分子来自于容纳在至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、二十个、三十个、四十个、五十个、七十五个、一百个或更多个各具有96个孔的板中的单一样品。

344.一种连接和条码标记包含目标多核苷酸序列的多个样品的方法，所述方法包括：(a)将所述样品分布在多个容器中；(b)使用来自所述样品的模板合成目标多核苷酸序列，其中所述合成导致条码序列的添加；和(c)实现步骤(b)中合成的所述目标多核苷酸序列的连接。

345.第344项的方法，其中各样品包含细胞。

346.第344项的方法，其中所述细胞是B细胞。

347.第344项的方法，其中所述B细胞是浆母细胞、记忆B 细胞或浆细胞。

348.第344项的方法，其中各样品包含多个细胞。

349.第344项的方法，其中所述目标多核苷酸序列包含抗体重链和轻链。

350.第344项的方法，其中所述合成包括RT-PCR扩增。

351.第344项的方法，其中所述RT-PCR扩增在单一步骤中进行。

352.第344项的方法，其中所述目标核苷酸序列的连接在使用重叠-延伸引物的RT-PCR扩增的过程中进行。

353.第344项的方法，进一步包括(d)在条码序列添加或连接之前、期间或之后将测序区域添加到所述目标多核苷酸序列上。

354.第344项的方法，其中所述测序区域利用接合体添加。

355.第344项的方法，进一步包括(e)使用NextGen测序平台对连接的目标多核苷酸序列进行测序。

356.第344项的方法，其中所述NextGen测序平台是454测序。

357.第344项的方法，其中所述NextGen测序平台是SMRT 测序。

358.第344项的方法，其中所述NextGen测序平台是SOLiD 测序。

359.第344项的方法，其中所述NextGen测序平台是SOLEXA 测序。

360.第344项的方法，其中所述NextGen测序平台是tSMS测序。

361.第344项的方法，其中所述多个样品是容纳在具有至少6 个孔、至少12个孔、至少24个孔、至少48个孔、至少96个孔、至少384个孔、至少1536个孔或更多个孔的板中的单一样品。

362.第344项的方法，其中所述多个样品是容纳在至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、二十个、三十个、四十个、五十个、七十五个、一百个、两百个、五百个或更多个各具有96个孔的板中的单一样品。

363.一种连接和条码标记多个非连续的目标多核苷酸序列的方法，所述方法包括：(a)将细胞分布在多个容器中以获得分离的一个或多个细胞；(b)使用来自所述分离的一个或多个细胞的模板扩增目标多核苷酸序列，其中所述扩增导致条码序列的添加；和(c)实现步骤(b)中扩增的所述目标多核苷酸序列的连接。

364.第363项的方法，其中所述目标核苷酸序列包含抗体重链和轻链。

365.第363项的方法，其中所述扩增包括RT-PCR扩增。

366.第363项的方法，其中所述RT-PCR扩增在单一步骤中进行。

367.第363项的方法，其中所述目标核苷酸序列的连接在使用重叠-延伸引物的RT-PCR扩增的过程中进行。

368.第363项的方法，进一步包括(d)在条码序列添加或连接之前、期间或之后将测序区域添加到所述目标多核苷酸序列上。

369.第363项的方法，其中所述测序区域利用接合体添加。

370.第363项的方法，进一步包括(e)使用NextGen测序平台对连接的目标多核苷酸序列进行测序。

371.第363项的方法，其中所述NextGen测序平台是454测序。

372.第363项的方法，其中所述NextGen测序平台是SMRT 测序。

373.第363项的方法，其中所述NextGen测序平台是SOLiD 测序。

374.第363项的方法，其中所述NextGen测序平台是SOLEXA 测序。

375.第363项的方法，其中所述NextGen测序平台是tSMS测序。

376.第363项的方法，其中所述一个或多个细胞容纳在具有至少6个孔、至少12个孔、至少24个孔、至少48个孔、至少96个孔、至少384个孔、至少1536个孔或更多个孔的板中。

377.第363项的方法，其中所述一个或多个细胞容纳在至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、二十个、三十个、四十个、五十个、七十五个、一百个或更多个各具有96个孔的板中。

378.一种包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-D-3’，其中A是样品识别区域(条码序列)，其中B是来自于单一样品的第一cDNA区域，其中C是接头区域，其中D是来自相同的单一样品的第二cDNA区域，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

379.一种包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-D-3’，其中A是来自于单一样品的第一cDNA 区域，其中B是接头区域，其中C是来自相同的单一样品的第二 cDNA区域，其中D是样品识别区域(条码序列)，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

380.一种包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含序列5’-A-B-C-3’，其中A是来自于单一样品的第一cDNA 区域，其中B是包含样品识别区域(条码序列)的接头区域，其中 C是来自相同的单一样品的第二cDNA区域，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。

381.第378项的多核苷酸文库，其中所述第一cDNA区域包含抗体重链和所述第二cDNA区域包含抗体轻链。

382.第378项的多核苷酸文库，其中所述文库包含至少2个、至少3个、至少10个、至少30个、至少100个、至少300个、至少1000个、至少3000个、至少10,000个、至少30,000个、至少100,000 个、至少300,000个、至少1,000,000个、至少3,000,000个、至少 10,000,000个、至少30,000,000个或更多个成员。

383.第378项的多核苷酸文库，其中所述文库包含细胞样品的整个转录组中的至少2个、至少3个、至少10个、至少30个、至少100个、至少300个、至少1000个、至少3000个、至少10,000 个、至少30,000个或更多个基因。

384.第378项的多核苷酸文库，其中所述文库包含个体的血液中存在的至少1种、至少2种、至少3种、至少10种、至少30种、至少100种、至少300种、至少1000种、至少10,000种、至少100,000 种、至少1,000,000种、至少10,000,000种、至少100,000,000种或更多种不同的抗体种类。

385.第378项的抗体种类，其中所述抗体由浆母细胞、浆细胞、记忆B细胞、长寿浆细胞、其它B谱系细胞或其组合表达。

附图说明

参照以下及附图，这些以及其它特征、方面和优势将更好理解，其中：

图1.B细胞分化。成熟的原始B细胞是CD19⁺且可以在二级淋巴组织如淋巴结和脾中受到抗原激发时被激活以增殖和分化。它们在小结外位点(extra-follicular foci)中或在生发中心中增殖和分化。在小结外位点中的分化B细胞通常分化成为短寿浆细胞且经常驻留在它们所起源的二级淋巴组织中。在生发中心中分化的B细胞可以变成记忆B细胞(其可以进一步经由随后的抗原激发进行刺激以分化) 或者具有成为长寿浆细胞的潜能的浆母细胞。这些浆母细胞可以进入循环中并运输到长寿浆细胞驻留于其中的各种组织，如骨髓、粘膜组织(对于IgA+浆细胞)和发炎的组织。一些运输的浆细胞也存在于血液中。所有上述细胞类型也可以在血液的循环中发现。

图2.来自单一分选细胞的配对基因的高通量测序、克隆和表达的图解。所需的细胞群体是基于其细胞表面标志物的表达分选到96- 孔板中的单一细胞。在反转录过程中，条码标记的(样品-ID)DNA 接合体分子利用MMLV H^-反转录酶的模板转换特性添加到合成的第一链cDNA上。来自各板的RT产物然后单独地汇合并进行2轮的 PCR以扩增特定的扩增子区域(扩增子)。PCR利用具有5’侧翼条码的引物进行以将板识别区域(板-ID)添加到扩增子上。然后扩增子发送用于454测序(a)。获得的序列在序列组装之前通过板-ID和样品-ID分成亚组(subset)。来自相同细胞的扩增子使用板-ID和样品-ID 配对在一起且选择所需的克隆用于克隆和表达(b)。特定的扩增子可以通过使用与该特定扩增子的样品-ID互补的克隆引物从各合并的扩增子板进行扩增。克隆引物也添加限制性位点区域(RS)，其随后用于将克隆插入到哺乳动物表达载体中用于下游表达和筛选。在该实例中，扩增子是编码抗体的免疫球蛋白(Ig)重链和轻链基因。表达的抗体然后可以用于下游筛选(c)。5’RS和3’RS：分别为5’和3’限制性位点。HC和LC：分别为重链和轻链。

图3.反转录和PCR以添加样品-ID和板-ID到Ig扩增子上的示意图。反转录(RT)利用Superscript II或Superscript III(其为MMLV H^-反转录酶)进行。这些反转录酶具有3’加尾活性并将一对胞嘧啶添加到新合成的第一链cDNA的3’端。以-GGG(接合体区域)结束的寡核苷酸可以与它互补碱基配对，且然后反转录酶切换模板到该寡核苷酸并继续转录，从而导致样品-ID接合体并入到cDNA的3’ 端(a)。由于样品-ID接合体含有5’不可变序列(通用引物区域)，与该序列互补的正向引物可以用于后续的PCR。第一PCR利用Fw长引物1、Fw短引物1和GSP1进行。Fw长引物1具有含板-ID条码和用于454测序的454钛引物(Titanium Primer)A(它们被整合到扩增子中)的5’侧翼区域。Fw短引物1具有与GSP1引物类似的Tm 并包括该Fw短引物1以略微提高PCR的效率。各GSP1(基因特异性引物1)具有互补的基因特异性序列且用于扩增特定基因。此处，基因特异性引物用于κ和λ轻链及γ重链以扩增这些基因。显示了引物的序列(b)。第二PCR是嵌套PCR且利用Fw引物2、长GSP2 引物和RV引物2进行。用于引物的序列如所示。长GSP2引物具有含板-ID条码和用于454测序的454钛引物B(其整合到扩增子中) 的5’侧翼区域。长GSP2引物再次扩增κ和λ轻链及γ重链。RV引物2具有与Fw引物2类似的Tm并包括该RV引物2以略微提高PCR 效率。显示了引物的序列。在RT和2个PCR后，各扩增子将具有用于454测序的454钛引物A和B、两个相同的板-ID(各确定该扩增子为来自特定的单细胞分选的96-孔板)和确定其在96-孔板上的位置的样品-ID(c)。

图4.使用测序和克隆引物成功扩增单一细胞分选的B细胞。96- 孔板的单一细胞分选的B细胞如图1和图2中所示进行反转录、汇合和扩增。用于κ轻链、λ轻链和γ重链的条带在琼脂糖凝胶上可视化，其具有预期的大小：对于κ和λ为～600bp和对于γ为～700bp(a)。γ重链从5’端的Sanger测序的DNA色谱显示对应于汇合的板的多个样品 -ID的“可变”序列(b)。κ轻链从3’端的Sanger测序显示在恒定区之后且在对应于多个轻链的VJ接合区处开始的“可变”序列(c)。对于孔A1 特异性的克隆引物对用于扩增κ轻链。Sanger测序显示，与(c)相反，仅扩增了一个清晰的序列(d)。所有结果代表其它扩增的免疫球蛋白基因。M:100bp DNA梯状序列，K:κ轻链，L:λ轻链，G:γ重链。

图5.CCP+RA患者具有与疾病活动性和分泌的抗瓜氨酸自身抗体相关的外周血浆母细胞百分比。浆母细胞是 CD19⁺CD20^-CD27⁺CD38⁺⁺且首先选通(gated on)CD3-细胞，然后如所示的进行选通(a)。外周血从同意的RA患者获得且浆母细胞以总 PBMC的百分比作图。Mann-Whitney检验显示CCP+RA患者具有比 CCP-RA患者显著高(p＜0.05)的浆母细胞百分比(b)。浆母细胞百分比在CCP+患者中通过线性回归与临床活动性指数(CDAI)明显相关。线性回归在对数转换的浆母细胞百分比上进行以实现数据集的正态性 (c)。CCP+浆母细胞也进行模拟分选或进行具有＞95％浆母细胞清除的浆母细胞-耗竭分选(d)并在补充10％FBS的RPMI中培养7天。收集上清液并利用Luminex分析抗-瓜氨酸肽的反应性。抗各肽的抗体反应性的平均荧光强度作为肽反应性作图(e)。

图6.选择和筛选用于中和抗体的克隆的策略。配对的LC和 HC抗体序列从454-测序的扩增子的生物信息学分析获得并基于其 LC和HC V(D)J使用(usage)分组成克隆家族。在各克隆家族中以最高频率存在的克隆选择性地进行克隆、表达和使用ELISA筛选与目标靶抗原的结合。分泌结合抗体的来自整个克隆家族的代表性克隆然后进行克隆和表达用于中和抗体的筛选。各个抗体图形代表克隆。

图7.免疫球蛋白重链V(D)J序列和源自单个人类受试者的克隆家族的表征。血液从具有以下病症的人获得：(i)在未服用抗生素 (由于非顺应性)但其免疫系统在脱离抗生素的情况下在几个月内有效抑制感染和防止暴发性感染的人中的慢性金黄色葡萄球菌骨髓炎；(ii)患有需要转移到重症监护病房中的急性和暴发性金黄色葡萄球菌菌血症且具有积极的静脉内抗生素治疗的人；(iii)患有慢性活动性类风湿性关节炎(RA)(疾病活动性评分(DAS)＞5)的3个人；(iv) 接受三价流感病毒疫苗(Fluzone，Sanofi)后7天的人；和(v)预期死亡但其后的化疗进入长期非进展状态的患有转移性肺腺癌的人。在所有情况中，人类患者表现出其外周血浆母细胞水平的升高(外周血B 细胞的1.5-6％是浆母细胞[CD20^-CD19⁺CD38⁺⁺CD27⁺]，而正常人体中的水平是外周血B细胞的0.1-0.2％)，表明激活的免疫应答。浆母细胞单一细胞分选到96-孔板中，且如图2和3中所描述的进行所表达的免疫球蛋白cDNA的条码标记和454测序。生物信息学分析用于配对由单个浆母细胞表达的重链和轻链免疫球蛋白。显示了单个患者的重链V(D)J使用百分比的饼图-各楔形代表表达独特重链 V(D)J序列重排的浆母细胞的百分比。

图8.来自人类受试者的免疫球蛋白重链V(D)J序列的聚类表明了克隆家族和克隆亚家族。图7中所述的研究中所产生的免疫球蛋白重链序列数据集使用Clustal程序进行分级聚类。分级聚类产生代表在各单个人体中的抗体反应的进化树。

图9.RT和PCR以添加样品-ID和板-ID到任何扩增子上及下游利用的示意图。包含单一细胞或多细胞的单个样品在孔中单独地反转录。反转录如前所述地将样品-ID和5’通用引物区域添加到所有第一链cDNA上(a)。汇合来自板的所有孔的cDNA并进行2轮PCR。第一PCR使用Fw短引物1、Fw长引物1作为正向引物，且添加用于454测序的454钛引物A和板-ID到序列的5’端。Fw短引物1具有类似于GSP1引物的Tm并包括该Fw短引物1以略微提高PCR的效率。各GSP1引物具有基因特异性序列且可以特异性地扩增该基因。显示了引物的序列。注意，无论扩增哪个基因，正向引物保持恒定(b)。第二PCR是嵌套PCR。Fw引物2是正向引物，且反向引物是长GSP2引物和Rv引物2。长GSP2是基因特异性的且仅扩增特定基因。其还添加用于454测序的454钛引物B和板-ID到扩增子的3’端。RV引物2具有类似于Fw引物2的Tm且包括该RV引物 2以略微提高PCR效率。显示了引物的序列。在RT和2轮PCR后，汇合来自所有板的扩增子并进行454-测序。板-ID和样品-ID的组合允许鉴别源自于相同样品的序列。这允许多个样品之间的序列比较。来自于相同来源的序列也可以成对表达以获得来自原始细胞的准确蛋白质，如T-细胞受体和其它Ig同种型如IgM、IgE和IgA(c)。

图10.用于免疫球蛋白重链和轻链的反转录(RT-GSP)的基因特异性引物。在重链和轻链基因的反转录中使用RT-GSP而非寡(dT) 作为引物。然后cDNA通过PCR扩增并在琼脂糖凝胶上可视化。 RT-GSP引物IgKC_v3(a)、IgLC_v5、IgLC_v6、IgLC_v7和IgLC_v8 分别处于1-4道(b)，IgHGC_v10、IgHGC_v11、IgHGC_v13和 IgGC_v15分别处于1-4道(c)和IgHGC_v16(d)。引物名称中的KC、 LC和GC表明引物分别对于κ链、λ链和γ重链是特异性的。凝胶照片中的白色条带表示已修剪掉非相关道的位置。

图11.接合体区域序列。RNA用包含处于3’末端的接合体区域和通用引物区域的寡核苷酸反转录。cDNA然后使用通用引物区域序列作为正向引物和使用基因特异性序列作为反向引物扩增。扩增的产物在琼脂糖凝胶上可视化。接合体区域由分别在1和2道中的G (a)、GGGGG和rGrGrG组成(b)。rG表示RNA核苷酸而非DNA核苷酸。

图12.通用引物序列。RNA用包含3’末端的接合体区域和通用引物区域的寡核苷酸反转录。cDNA然后通过使用与通用引物区域互补的正向引物和与基因特异性序列互补的反向引物的PCR扩增。 Univ_seq_4(a)、univ_seq_5(b)和univ_seq_f(c)。凝胶照片中的竖直白色条带表示已修剪掉非相关道的位置。其它道属于相同的凝胶照片。

图13.用于第一PCR反应的基因特异性引物序列。用于第一 PCR反应中的序列扩增的基因特异性引物。第一PCR反应或后续的第二嵌套PCR产物进行分析并在琼脂糖凝胶上可视化。使用的反向引物是分别在1-3道上的IgKC_v4、IgLC_v5、IgHGC_v13(a)，分别在1-3道上的K_GSP1、L_GSP1、G_GSP1(b)，分别在1-2道上的 K_GSP1c、L_GSP1c(c)，分别在1-2道上的G_GSP1(d)、L_GSP1d、 G_GSP1g(e)，分别在1-4道上的G_GSP1h、G_GSP1k、L_GSP1f、 L_GSP1g(f)，G_GSP1d(g)分别在1-8道上的L_GSP1h-o(h)，分别在1-6道上的G_GSP1m-q和G_GSP1t(i)。引物名称中的K、L和 G表示引物分别对于κ、λ和γ免疫球蛋白恒定区是特异性的。各凝胶以左侧的道标记开始，之后是样品道。相同凝胶照片上道之间的白色条表示已修剪掉其间的非相关道的位置。

图14.用于第二PCR反应的基因特异性序列。用于第二PCR 反应的序列扩增的基因特异性反向引物。PCR产物进行分析并在琼脂糖凝胶上可视化。使用的反向引物是分别在1-3道上的K_GSP2、 L_GSP2、G_GSP2(a)，分别在1-3道上的K_GSP2v2a、K_GSP2v2b、 L_GSP2v2(b)，分别在1-4道上的K_GSP2v2c、K_GSP2v2c、 G_GSP2v2c1、G_GSP2v2c2(c)，分别在1-3道上的K_GSP2v2d-f(d)，分别在1-3道上的K_GSP2v2g、L_GSP2v2d和G_GSP2b(e)。引物名称中的K、L、G表示它们分别对于κ、λ和γ免疫球蛋白恒定区是特异性的。各凝胶以左侧的道标记开始，之后是样品道。相同凝胶照片上道之间的白色条表示其间的非相关道已被修剪掉。

图15.鉴别连接的多核苷酸序列对的条码序列的潜在位置。示意图显示了两个核酸片段A和B(例如两个cDNA)的物理连接。条码(BC)附连于任一端或两端或连接A和B的序列中的任何位置。在一个实施方式中，A和B代表免疫球蛋白重链和轻链序列。

图16.重叠-延伸尾的不同类型。粗线对应于基因特异性序列和细线对应于重叠尾。如所示的，重叠可能完全是由于引物序列的重叠或另外地由于与基因特异性序列的部分或全部重叠。如所示的，重叠也可以包含条码序列。结构I、II和III表明重叠的潜在位置。

图17.连接的抗体轻链和重链对的外部条码添加的示意概图。显示的是反转录反应的产物。LC基因特异性引物含有条码、测序引物位点和限制性位点(RE1)以允许这些元件添加到所得PCR产物的 3’端。显示了具有重叠-延伸并编码限制性位点(RE3)的对于LC和HC 特异性的引物。也显示了含有测序引物位点和限制性位点(RE2)的对于HC特异性的反向引物。扩增产生在一端具有条码的具有所示连接结构的核酸。

图18.连接的抗体轻链和重链对的内部条码添加的示意概图。显示的是使用包含延伸重叠的接合体接合通过使用寡(dT)引物的 mRNA反转录获得的cDNA的方法。所示的方法利用了反转录酶的3’加尾和模板转换活性以将重叠-延伸序列添加到待接合的cDNA 上。在该实例中，接合体之一将条码和重叠-延伸序列两者添加到待接合的cDNA之一上，而仅重叠-延伸序列添加到待接合的另一cDNA 上。扩增后，生成了在连接的cDNA之间带有一个条码序列的连接结构。

图19.使用通用序列重叠-延伸引物将两个内部条码添加到连接的抗体轻链和重链对上的示意概图。显示的是使用包含通用序列和条码两者的接合体接合由使用寡(dT)引物的mRNA反转录获得的 cDNA的方法。在该实例中，对于通用序列的PCR引物将重叠-延伸序列添加到待接合的各cDNA上。在所示的扩增方案后，生成了在连接的cDNA之间带有两个条码的连接结构。

图20.使用重叠-延伸接合体将两个内部条码添加到连接的抗体轻链和重链对上的示意概图。显示的是使用包含条码和重叠-延伸序列两者的接合体接合通过使用基因特异性引物(GSP)的mRNA反转录获得的cDNA的方法。在该实例中，添加到各cDNA上的接合体上的重叠-延伸序列允许通过退火接合cDNA。在所示的扩增方案后，生成了在连接的cDNA之间带有两个条码的连接结构。

图21.与模板转换添加的接合体结合在反转录过程中条码标记的GSP的用途。RT利用总PBMC RNA及univ_seq_2模板转换寡聚体和具有另外的5’侧翼序列的IgKC_v3GSP(道1-2)和IgLC_v5 GSP(道3-4)进行，其中第一部分是Fixed_PCR3序列，且最后8bp 是条码。等份的RT反应物用于后续PCR反应中，用5’V_K(道1)或 V_L(道3)引物或者Univ_seq_2(道2和4)作为5’引物，且Fixed_PCR3 作为3’引物。道2和4中的PCR产物产生弥散条带，表明条码标记的GSP在RT反应中是非特异性的且不适合用于模板转换添加的接合体。

图22.用于将单一细胞流式细胞分选到96-孔板中的选通方案。浆母细胞定义为CD19⁺CD20^-CD27⁺CD38⁺⁺。单一PBMC首先基于其 FSC和SSC特性(未显示)选通。然后活的CD19⁺B细胞选通(左图)，且进一步缩窄到CD20-B细胞(左起第二图)，并细化到 CD27⁺CD38⁺⁺细胞。由此，IgG⁺浆母细胞确定为IgA^-和IgM^-，因为 IgG⁺浆母细胞不表达细胞表面IgG。这一群体是单一细胞分选到96- 孔板中。

图23.浆母细胞存在于经历免疫球蛋白激发的人中。浆母细胞在代表性健康供体中占外周血B细胞的0.15％，且在发生多种免疫球蛋白激发(包括感染(金黄色葡萄球菌和艰难梭菌感染)、癌症 (患有转移性黑素瘤的患者，其由于易普利单抗治疗而成为非进展者＞4年，及患有肺的转移性腺癌的患者，其接受化疗后成为长期非进展者＞3年)和疫苗接种(接受流感病毒疫苗))的人中其范围为 0.5％-16.4％。这表明浆母细胞在广泛的发生目标免疫应答的受试者中升高并可从这些受试者获得以用于单个浆母细胞的分离，其抗体谱的高通量测序以鉴定主动体液反应。

图24.表达的重组抗体在瞬时转染中分泌2-3周。如图2中概述的，配对的重链和轻链免疫球蛋白cDNA通过PCR克隆并以48- 孔规模共转染到293T细胞中。每隔一天收集上清液，持续18天。进行抗-人IgG ELISA以测定收集的上清液中分泌抗体的量，并对一组个体共转染体的上清液中抗体的浓度作图。分泌倾向于到第9天达到峰值并基本上到第18天时消失。

图25.来自流感疫苗接种的人的配对抗体重链(HC)和轻链(LC) 表现出互补决定区(CDR)间的变异。图25A：流感病毒抗体的部分树状图。在重链和轻链配对后，对于重链产生多序列比对，且对于轻链产生另一多序列比对。两个多序列比对使用Clustalw2 2.1以缺省参数产生。两个比对连结在一起并用于在CLC Sequence Viewer v. 6.5.2中采用具有100个引导(bootstrap)重复的邻接法构建树状图 (tree)。图25B：用于来自流感疫苗接种的患者的克隆家族的重链 CDR。图中的标识符如下对应于序列表中的序列名称：51.A11.1＝ NA.51.11.A11.1.454.heavy.3.nb-aa，49.A08.1＝NA.49.8.A08.1.454.heavy.3.nb-aa，51.D07.1是通过翻译框1中的NA.51.40.D07.1.454.heavy.3.nb获得的氨基酸序列。图25C：用于来自流感疫苗接种的患者的克隆家族的轻链CDR。图中的标识符如下对应于序列表中的序列名称：51.A11.1＝NA.51.11.A11.1.454.light.4.nb-aa，49.A08.1＝ NA.49.8.A08.1.454.light.4.nb-aa，51.D07.1＝ NA.51.40.D07.1.454.light.4.zerom50-aa。

图26.重组抗-流感病毒抗体结合Fluzone流感病毒疫苗。进行了对于图7中所描述的流感疫苗接种的人产生的重链和轻链抗体谱数据集的进化树(图8)的分析以选择所确定的克隆家族代表性的抗体。代表两个克隆家族以及几个单一态分支的所选择抗体的重链和轻链通过PCR克隆并共转染到293T细胞中(如图2中概述的)，且如图24中所述从转染体收集上清液。然后重组抗体通过ELISA测试针对Fluzone流感病毒疫苗(Sanofi)的反应性，其中Fluzone疫苗涂覆在ELISA板上。重组流感病毒抗体以100ng/ml在ELISA板中孵育，且辣根过氧化物酶(HRP)-偶联的抗-人IgG抗体用于检测抗体结合。允许TMB底物反应进行30分钟，然后用酸停止液淬灭。读数显示为450nm吸光度，因为没有提供标准品。代表所确定的克隆家族的多个重组抗体结合流感病毒疫苗，而其它克隆家族代表性的重组抗体和“死端(dead end)”不结合流感疫苗。

图27.克隆家族代表性的重组抗-流感病毒抗体以皮摩尔亲和力结合流感病毒血凝素。在ELISA分析(图26)中结合流感疫苗的来自于经Fluzone疫苗接种的人的克隆家族代表性的重组抗流感病毒抗体使用表面等离子体共振(SPR)仪(ProteOn System，Bio-RadLaboratories)进行测试以测定其对于流感病毒血凝素的结合亲和力 (疫苗中存在H3N2A/Perth/16/2009和H1N1 A/California/07/2009 株)。重组抗流感病毒抗体使用EDAC-NHS化学作用结合到表面上，且H3N2 Perth和H1N1 California血凝素独立地作为配体进行测试，以血凝素作为分析物。Ka栏代表结合速率(on-rate)，Kd栏代表解离速率(off-rate)和K_D代表解离常数。多个重组抗体以皮摩尔亲和力结合H3N2Perth或H1N1California血凝素。

图28.重组抗-流感病毒抗体在微量中和分析中中和流感病毒传染力。在FluzoneELISA上表现出反应性的六种抗体(图26)送到协议研究机构(CRO)Virapur，LLC，(SanDiego，CA)以使用H1N1 California/07/2009流感病毒株和H3N2 A/Perth/16/2009流感病毒株 (Fluzone疫苗中三种流感病毒株中的两种)在微量中和分析中进行测试。6种重组抗体中的5种在微量中和分析中中和流感病毒，从而以微克/毫升水平和可能地亚微克/毫升的浓度阻止传染。重组抗体 F21中和H3N2Perth，且虽然其在ELISA分析中结合Fluzone，但其在SPR分析中不显示结合(图27)，很可能是由于所使用的血凝素分析物的浓度太低以至于结合不能检测到。

图29.重组抗-金黄色葡萄球菌抗体通过流式细胞术结合固定的金黄色葡萄球菌。对于从控制(无抗生素的情况下)慢性金黄色葡萄球菌的骨髓炎(如图7中所述)的人产生的重链和轻链抗体谱数据集的进化树(图8)的分析使得能够选择所确定的克隆家族代表性的抗体。对于代表两个克隆家族以及几个单一态分支的所选择抗体的重链和轻链通过PCR克隆并共转染到293T细胞中(如图2中概述的)，且如图24中所述从转染体收集上清液。重组抗-金黄色葡萄球菌抗体然后测试针对固定的金黄色葡萄球菌的反应性。使用的第二抗体是FITC-偶联的小鼠抗-人IgG，并在BD LSR II或LSR Fortessa 上分析样品。显示了阳性染色的百分比，其中两个抗流感病毒抗体用作阴性对照。2°抗体单独不导致高于背景的结合，因为蛋白A很弱地结合小鼠IgG1(其为2°抗体的同种型)。观察到的高于背景的染色是由于重组抗-金黄色葡萄球菌抗体与小百分比的表达蛋白的金黄色葡萄球菌Wood株的结合(a)。对于2个阳性结合抗-金黄色葡萄球菌抗体S6和S11以及同种型匹配的阴性对照抗流感病毒抗体显示了流式细胞分析图(b)。抗-金黄色葡萄球菌抗体与金黄色葡萄球菌的结合水平与使用的抗体量成比例。黑色实线代表10ug/ml的抗体浓度，黑色虚线代表5ug/ml的抗体浓度，和灰色虚线代表1ug/ml的抗体浓度(c)。

图30.抗-金黄色葡萄球菌抗体减小金黄色葡萄球菌集落形成单位的数目。重组抗-金黄色葡萄球菌抗体结合作为补体源的幼兔血清与金黄色葡萄球菌一起孵育，然后系列稀释和在5％胰酪胨大豆琼脂(TSA)血液琼脂板上生长过夜。然后计数集落形成单位(CFU)并作图。两种重组抗-金黄色葡萄球菌抗体(Ab-a和Ab-b)导致杀死金黄色葡萄球菌并因此导致CFU/ml数的降低。

图31.由发生针对慢性金黄色葡萄球菌感染的有效免疫应答的人产生重组抗-金黄色葡萄球菌抗体的金黄色葡萄球菌抗体抗原靶标的鉴别。从临床金黄色葡萄球菌分离菌株产生蛋白质裂解产物。在来自发生免疫应答的人的抗体谱中鉴定的克隆家族代表性的重组抗-金黄色葡萄球菌抗体(其阻止慢性金黄色葡萄球菌骨髓炎感染的进展)用于免疫沉淀来自金黄色葡萄球菌Spa^-临床分离菌株的蛋白质。免疫沉淀物通过SDS-PAGE分离，切除鉴定的条带并使用质谱法(Agilent XCT-Plus离子阱质谱仪)鉴别图中给出的免疫沉淀的蛋白质。

图32.从作为长期非进展者的患转移性肺腺癌的人产生抗-肺腺癌抗体。化疗后成为长期非进展者的患转移性肺腺癌的人表现出持续升高的血液浆母细胞，表明持续活化的免疫反应(图7)。患者的外周血浆母细胞进行分选，对抗体谱进行测序，并且克隆家族代表性的抗体(图8)进行克隆和重组表达。表达的重组抗体之一(其为鉴定的克隆家族之一代表性的)在免疫组织化学染色中结合独立的肺腺癌。然后组织阵列用于进一步表征这一抗体的反应性。含多种独立的肺腺癌、鳞状细胞癌和健康肺组织的组织阵列用100ug/ml的 F(ab)山羊抗-人抗体封闭过夜。载玻片用抗-肺腺癌抗体或作为阴性对照的抗流感病毒抗体染色，并用Vector Red可视化。载玻片用苏木精复染。使用Photoshop消除苏木精的蓝色，从而仅核和Vector Red (红色)染色在图像中显现为深灰色。这一重组抗体结合所测试的 (组织阵列中包含的)5个独立肺腺癌组织样品中的4个，但不结合肺鳞状细胞癌或健康肺组织。

图33.鉴别的抗-肺腺癌抗体(图32)结合肺腺癌细胞系的表面。重组抗-肺腺癌抗体(图32)强染色肺腺癌细胞系H1650的表面，并仅显示低水平的肾上皮和肺鳞状细胞肿瘤细胞系的染色。这一抗-肺腺癌抗体不结合第二种肺腺癌细胞系(H2009)，这与我们通过免疫组织化学测试观察到的这一抗体结合5种独立肺腺癌组织样品中的4种的现象一致(图32)。

图34.由类风湿关节炎(RA)患者产生类风湿因子抗体。在从RA 患者产生的抗体谱的进化树(图8)中鉴定的克隆家族代表性的重组抗体进行选择、克隆和重组表达。源自RA患者的重组抗体在直接 ELISA中用作第一抗体和抗-人IgG-HRP用作第二抗体，并且结合用TMB底物可视化。重组抗体RA2和RA3表现出反应性，且因此代表类风湿因子抗体。

图35.从RA患者产生抗-CCP和抗-组蛋白2A抗体。从具有活动性疾病的RA患者产生的另外的重组抗体使用组蛋白2A ELISA和环-瓜氨酸化肽(CCP)ELISA(使用CCP2 ELISA试剂盒[Axis Shield]) 表征。重组抗体以125ug/ml使用。图(a)给出了来自组蛋白2AELISA 的结果，且多种重组抗体结合组蛋白2A。图(b)给出了CCP2 ELISA 的结果，且几种重组抗体表现出阳性反应性。抗-CCP2 ELISA包括血清反应阴性的和两种血清反应阳性的对照。对于两种分析，吸光度记录为读数。高于背景(虚线)的吸光度值被认为是阳性的。

图36.证明活动期RA患者的抗-组蛋白2A抗体产生的验证性独立实验。源自RA患者进化树(图8和图35)的重组抗体在组蛋白 2A ELISA分析中进一步测试。抗体以30ug/ml(比图35中使用的浓度低4倍)使用。吸光度记录为读数。高于背景的吸光度值被认为是阳性的。

图37.使用RA抗原阵列鉴别抗-组蛋白和抗-瓜氨酸化蛋白抗体。源自RA患者的抗体用于探测含原始和瓜氨酸化蛋白和肽的谱的RA抗原阵列。在与Cy-3-标记的抗-人IgG第二抗体一起孵育后，重组抗体的结合通过用Axon Instruments GenePix微阵列扫描仪扫描来定量。反应性显示为热图(heatmap)。源自RA的重组抗体结合几种独特的瓜氨酸化或原始抗原。

图38.Pacific Biosciences测序提供IgG重链扩增子的全长测序阅读片段(read)。来自板44的IgG重链扩增子提供给Pacific Biosciences用于SMRT测序。显示了对应于所选择孔的具有条码的环状共有序列(CCS)阅读片段。

图39.可选细胞表面标志物和其它细胞特征用于鉴定血液浆母细胞。浆母细胞可以通过使用多种细胞表面标志物和/或细胞特征鉴别和分选。图(a)表明浆母细胞表现出比静息B细胞高的前向散射 (FSC)。浆母细胞基于CD19⁺CD20^-CD27⁺CD38^hi染色鉴别，且这些结果表明B细胞(灰色)小于浆母细胞(黑色)。图(b)表明与FSC结合使用抗-CD19染色鉴别含72％浆母细胞的B细胞群体。图(c)表明，对于CD19⁺B细胞群体(细胞被预选通为CD19阳性)，侧向散射(SSC) 和FSC可以用于鉴别含37％浆母细胞的B细胞群体。图(d-f)给出了鉴别在CD19⁺B细胞群体内的浆母细胞的几种途径。选通(gating on)FSC^hi细胞给出37％纯度的浆母细胞(c)。选通FSC^hiCD20-细胞给出71％纯度的浆母细胞(d)。选通FSC^hiCD38⁺细胞给出浆母细胞的 80％纯度(e)。选通FSC^hiCD27⁺细胞给出浆母细胞的44％纯度(f)。

图40.人未成熟B细胞(浆母细胞)平均大于静息B细胞但小于单核细胞。单一态单核细胞、B细胞和浆母细胞进行选通并对于侧向散射和前向散射参数进行比较。单核细胞通过其特征性的FSC和 SSC特性定义，并定义为CD19^-CD3^-。B细胞定义为CD19⁺CD20⁺。浆母细胞定义为CD19⁺CD20^-CD27⁺CD38⁺⁺。细胞显示在FSC-A(前向散射面积)和SSC-A(侧向散射面积)轴上(a)。细胞显示在FSC-W(前向散射宽度)和SSC-W(侧向散射宽度)轴上(b)。浆母细胞FSC-A、 SSC-A、FSC-W、SSC-W的中值除以静息B细胞或单核细胞的中值以获得代表细胞类型之间的尺寸关系的比率(c)。浆母细胞的20分位的FSC-A、SSC-A、FSC-W、SSC-W的中值除以静息B细胞或单核细胞的中值以获得代表细胞类型之间的尺寸关系的比率，其中至少 80％的浆母细胞大于该比率(d)。误差棒表示95％置信区间。

图41.通过显微镜检与静息B细胞相比的人浆母细胞尺寸。浆母细胞和静息B细胞分别分选为CD19⁺CD20^-CD27⁺CD38⁺⁺和 CD19⁺CD20⁺。然后细胞使用Olympus显微镜以200x成像。细胞面积使用ImageJ测量和直径使用面积＝π x r²确定，其中直径＝2x半径，且体积按照4/3xπr³确定。误差棒代表四分位数间距。≥8uM或 ≥50uM²或≥268uM³的截止值将包括96％的浆母细胞和排除92％的静息B细胞。

图42.Superscript III在50℃或低于50℃的温度下具有模板转换活性。使用以rGrGrG结束的接合体采用道上方所示的温度进行反转录(RT)90分钟，且1轮PCR使用GAPDH作为3’引物(序列 ATGGTTCACACCCATGACG)进行。如可以看到的，在55℃下可以观察到没有添加到接合体上的模板转换活性，且模板转换活性从 50℃下的最低活性提高到42℃(所测试的最低温度)下的最高活性，如在～450bp处条带的亮度所表示的。标志物是100bp的标志物。 Superscript III是具有导致RNA酶H活性丧失的特定突变且具有导致聚合酶结构域提高热稳定性的突变和在50℃的RT温度下具有 220分钟的半衰期的MMLV反转录酶。已工程化以具有更高热稳定性的其它MMLV H^-酶预期表现出相似的活性。

图43.用于人κ、λ和γ恒定区的另外的引物。这些引物用于第一PCR，和然后使用表1的引物进行第二PCR，且PCR产物在2％琼脂糖凝胶上分离并获取图像。用于第一PCR的引物分别是κGSP1、 κGSP1e、κGSP1f、λGSP1、λGSP1x和λGSP1y。序列在表10中。相同凝胶照片上道之间的白色条表明其间的非相关道已修剪掉。

图44.用于其它人恒定区和基因的另外的引物。进行第一和第二PCR且产物在2％琼脂糖凝胶上分析和成像。道从左到右为：标志物、μ、α恒定区、TCRα(a)和标志物、TCRβ(b)。使用的引物和序列在表10中。相同的凝胶照片上道之间的白色条表示其间的非相关道已修剪掉。

图45.用于小鼠基因的另外的引物。进行第一和第二PCR且产物在2％琼脂糖凝胶上分析跑样和成像。道从左到右是：标志物、κ、 λ、λ、λ、λ轻链和μ重链。4个λ道具有所使用引物的这一组合：小鼠_λ_GSP1a与小鼠_λ_GSP2a，小鼠_λ_GSP 1a与小鼠λGSP2b，小鼠_λ_GSP1b与小鼠_λ_GSP2a，及小鼠_λ_GSP1b与小鼠λGSP2a (a)。标志物和α重链(b)。分别使用mo_g12_GSP2d和mo_g12_GSP2e 的第二PCR的γ1、2a、2c重链，标志物(c)。标志物，分别使用mo_g3_GSP2d、mo_g3_GSP2e的第二PCR的γ3重链，之后是分别使用mo_g2b_GSP2d、mo_g2b_GSP2e的第二PCR的γ2b重链(d)。标志物，TCRα(e)。标志物，TCRβ(f)。相同凝胶照片上道之间的白色条表示其间的非相关道已修剪掉。

图46.HL-60嗜中性白细胞细胞系的抗-金黄色葡萄球菌抗体介导的金黄色葡萄球杀灭。各种重组抗-金黄色葡萄球菌抗体(staph 1、 staph 4、staph 6、staph 7、staph9、staph 12)在4℃下与金黄色葡萄球菌一起孵育30分钟，然后洗掉未结合的抗体，且金黄色葡萄球菌在37℃下与活化的HL-60细胞和幼兔补体一起孵育45分钟。细胞然后洗涤两次并且细胞外细菌系列接种在5％TSA血液琼脂板上、孵育过夜和计数集落形成单位(CFU)。重组抗体staph 6、stepha 9和 staph 12诱导超过20％的金黄色葡萄球菌杀灭。

具体实施方式

组合物

多核苷酸

在一些方面，组合物可以包括多核苷酸。术语“多核苷酸”是指核酸如DNA分子和RNA分子及其类似物(例如，使用核苷酸类似物或使用核酸化学作用生成的DNA或RNA)。需要时，多核苷酸可以通过合成制备，例如使用本领域公认的核酸化学，或者使用例如聚合酶通过酶学方法制备，且在需要时可以进行修饰。典型的修饰包括甲基化、生物素化和其它本领域已知的修饰。另外多核苷酸可以是单链的或双链的，且在需要时可以连接可检测部分。在一些方面，多核苷酸可以包括杂交分子，例如，包含DNA和RNA。

一般地，“G”、“C”、“A”、“T”和“U”名各代表分别包含鸟嘌呤、胞嘧啶、腺嘌呤、胸腺嘧啶和尿嘧啶作为碱基的核苷酸。但是，应理解，术语“核糖核苷酸”或“核苷酸”也可以指修饰的核苷酸或替代的置换部分。本领域技术人员都知道鸟嘌呤、胞嘧啶、腺嘌呤和尿嘧啶可以被其它部分置换而不实质改变包含带有这种置换部分的核苷酸的寡核苷酸的碱基配对性质。例如，非限制地，包含肌苷作为其碱基的核苷酸可以与含有腺嘌呤、胞嘧啶或尿嘧啶的核苷酸碱基配对。因此，含有尿嘧啶、鸟嘌呤或腺嘌呤的核苷酸可以在核苷酸序列中被含有例如肌苷的核苷酸置换。在另一个实例中，寡核苷酸中任何地方的腺嘌呤和胞嘧啶可以分别用鸟嘌呤和尿嘧啶置换以形成与靶 mRNA的G-U摆动碱基配对。含有这种置换部分的序列适合于本文所述的组合物和方法。

如本文中所用的，且除非另外指明，术语“互补的”在用于相对于第二核苷酸序列描述第一核苷酸序列时，如本领域技术人员所理解的，是指包含第一核苷酸序列的多核苷酸在特定条件下与包含第二核苷酸序列的多核苷酸杂交并形成双链结构的能力。这样的条件可以是，例如，严格条件，其中严格条件可以包括：400mM NaCl、 40mM PIPES pH 6.4、1mM EDTA、50℃或70℃下12-16小时，随后洗涤。可以应用其它条件，例如，如可在生物体体内见到的生理相关条件。本领域技术人员能够按照杂交的核苷酸的最终应用确定最适合两个序列的互补性测试的条件的集合。

互补的序列包括在一个或两个核苷酸序列的长度或一部分上，包含第一核苷酸序列的多核苷酸区域与包含第二核苷酸序列的多核苷酸区域的碱基配对。这样的序列在本文中可以称为彼此“互补的”。然而，在本文中第一序列被称为与第二序列“基本上互补”的情况中，两个序列可以互补，或它们可以在碱基配对的区域中包括一个或多个，但通常不超过约5、4、3或2个错配的碱基对。对于具有错配的碱基对的两个序列，该序列被认为是“基本上互补的”，只要两个核苷酸序列通过碱基配对彼此结合。

如本文中所用的，“互补的”序列也可以包括非沃森-克里克碱基对和/或由非天然和修饰的核苷酸形成的碱基对或者完全由这样的碱基对形成，只要上述实施方式在其杂交的能力方面得到满足。这样的非沃森-克里克碱基对包括，但不限于，G：U摆动或Hoogstein碱基配对。

术语百分“同一性”在两个或更多个核酸或多肽序列的情况中是指当对比或比对以获得最大对应性时具有指定百分比的相同核苷酸或氨基酸的两个或更多个序列或子序列，如使用下面描述的序列对比算法之一(例如，BLASTP和BLASTN或本领域技术人员可得的其它算法)或通过目视检查测定的。取决于应用，百分“同一性”可以存在于对比的序列的区域上，例如在功能域上，或者可选地存在于待对比的两个序列的全长上。

对于序列对比，通常一个序列起到测试序列与其对比的参照序列的作用，当使用序列对比算法时，测试和参照序列输入计算机中，在必要时指定子序列坐标和指定序列算法程序参数。然后序列对比算法基于指定的程序参数相对于参照序列计算测试序列的百分序列同一性。

可以进行用于对比的序列的最佳比对，例如通过Smith＆ Waterman，Adv.Appl.Math.2：482(1981)的局部同源性算法、通过 Needleman＆Wunsch，J.Mol.Biol.48：443(1970)的同源性比对算法、通过Pearson＆Lipman，Proc.Nat′l.Acad.Sci.USA 85：2444(1988)的相似性检索方法、通过这些算法的计算机执行(Wisconsin Genetics Software Package，Genetics Computer Group，575Science Dr.，Madison， Wis.中的GAP、BESTFIT、FASTA和TFASTA)或通过目视检查(一般地参见Ausubel等，下文)。

适合确定百分序列同一性和序列相似性的算法的一个实例是BLAST算法，其描述于Altschul等，J.Mol.Biol.215：403-410(1990) 中。用于执行BLAST分析的软件通过National Center for Biotechnology Information网站向公众提供。

相同的序列包括包含第一核苷酸序列的多核苷酸与包含第二核苷酸序列的多核苷酸在一个或两个序列的整个长度上100％的同一性。这样的序列在本文中可以称为彼此“完全相同”。但是，在一些方面，在本文中第一序列被称为与第二序列“基本上相同”的情况中，两个序列可以完全互补，或者它们在比对时可以具有一个或多个，但通常不超过约5、4、3或2个错配的核苷酸。在一些方面，在本文中第一序列被称为与第二序列“基本上相同”的情况中，两个序列可以完全互补，或者它们可以是彼此约50、60、70、80、81、82、 83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、 98或99％相同。

在本文中第一序列相对于第二序列的同一性被称为“不同”的情况中，两个序列在比对时具有至少一个或多个错配的核苷酸。在一些方面，不同的序列在比对时可以具有2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、 25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、 40、41、42、43、44、45、46、47、48、49、50或更多个错配的核苷酸。在一些方面，不同的序列可以是彼此约1、2、3、4、5、6、7、 8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、 80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、 95、96、97、98、99或低于100％相同。在一些方面，在本文中第一序列相对于第二序列被称为“不同”的情况中，两个序列可以具有基本上或完全相同的序列，但另外基于序列内不同的修饰模式而彼此不同。这样的修饰一般是本领域中已知的，例如甲基化。

在一些方面，多核苷酸可以存在于多核苷酸文库中。在一些方面，多核苷酸文库可以包括多个多核苷酸。在一些方面，多个多核苷酸中的各多核苷酸可以源自单一样品。在一些方面，单一样品可以包括单一细胞如B细胞。

本文中常规符号标记用于描述核苷酸序列：单链核苷酸序列的左手端是5′-端；双链核苷酸序列的左手方向称作5′-方向。核苷酸添加至新生RNA转录物上的5′至3′添加方向称作转录方向。具有与 mRNA相同的序列的DNA链称作“编码链”；在具有与从该DNA转录的mRNA相同的序列的DNA链上且位于RNA转录物5′-端的5′ 侧的序列称作“上游序列”；在具有与RNA相同的序列的DNA链且位于编码的RNA转录物3′-端的3′侧的序列称作“下游序列”。

术语“信使RNA”或“mRNA”是指没有内含子且可以翻译成多肽的RNA。

术语“cDNA”是指与mRNA互补或与mRNA相同的DNA，其为单链或双链形式。

术语“扩增子”是指核酸扩增反应，例如RT-PCR，的扩增产物。

术语“杂交”是指与互补核酸的序列特异性非共价结合相互作用。杂交可以对核酸序列的全部或一部分发生。本领域技术人员会认识到，核酸双链体或杂交体的稳定性可以通过Tm确定。关于杂交条件的另外的教导可以在Current Protocols in MolecularBiology， John Wiley＆Sons，N.Y.，1989，6.3.1-6.3.6和Sambrook等，MolecularCloning，a Laboratory Manual，Cold Spring Harbor Laboratory Press， 1989，Vol.3中找到。

如本文中所用的，“区域”是指多核苷酸的核苷酸序列的连续部分。区域的实例在本文中描述并包括识别区域、样品识别区域、板识别区域、接合体区域等等。在一些方面，多核苷酸可以包括一个或多个区域。在一些方面，多核苷酸可以包括少于2个、2个、3个、 4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、 14个、15个、16个、17个、18个、19个、20个、21个、22个、 23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、 41个、42个、43个、44个、45个、46个、47个、48个、49个、 50个或更多个区域。在一些方面，区域可以偶联。在一些方面，区域可以可操作地偶联。在一些方面，区域可以物理偶联。

如本文中所用的，“可变区域”是指由重组事件产生的可变核苷酸序列，例如它可以包括免疫球蛋白的V、J和/或D区域或从目标T 细胞或B细胞(如活化的T细胞或活化的B细胞)分离的T细胞受体序列。

如本文中所用的，“B细胞可变免疫球蛋白区域”是指从B细胞分离的可变免疫球蛋白核苷酸序列。例如，可变免疫球蛋白序列可以包括从目标B细胞(如记忆B细胞、活化B细胞或浆母细胞)分离的免疫球蛋白序列的V、J和/或D区域。

如本文中所用的，“识别区域”是指可以与至少一个核苷酸序列偶联以用于例如随后识别该至少一个核苷酸序列的核苷酸序列标记 (例如，独特的条码序列)。

如本文中所用的，“免疫球蛋白区域”是指来自抗体的一条或两条链(重链和轻链)的核苷酸序列的连续部分。

如本文中所用的，“接合体区域”是指将第一核苷酸序列与第二核苷酸序列偶联的接头。在一些方面，接合体区域可以包括作为接头的核苷酸序列的连续部分。例如，接合体区域可以具有序列GGG 并通过GGG和CCC之间的结合将第一序列与第二序列偶联。

在一些方面，多核苷酸可以包括cDNA区域。在一些方面，多核苷酸可以包括样品识别-接合体区域。在一些方面，多核苷酸可以包括样品识别区域。在一些方面，多核苷酸可以包括接合体区域。在一些方面，多核苷酸可以包括通用引物区域。在一些方面，多核苷酸可以包括扩增子区域。在一些方面，多核苷酸可以包括板识别区域。在一些方面，多核苷酸可以包括第一板识别区域。在一些方面，多核苷酸可以包括第二板识别区域。在一些方面，多核苷酸可以包括限制性位点区域。在一些方面，多核苷酸可以包括第一限制性位点区域。在一些方面，多核苷酸可以包括第二限制性位点区域。在一些方面，多核苷酸可以包括测序区域。在一些方面，多核苷酸可以包括第一测序区域。在一些方面，多核苷酸可以包括第二测序区域。

在一些方面，多核苷酸可以包括多个本文中描述的任何区域。例如多核苷酸可以包括第一样品识别区域和第二样品识别区域。在一些方面，第一样品识别区域和第二样品识别区域相同或基本上相同。在一些方面，第一样品识别区域和第二样品识别区域不同。在一些方面，识别区域与可变免疫球蛋白区域偶联。

在一些方面，区域的序列至少足够长以在PCR反应中用作引物或探针的靶序列。在一些方面，区域长度可以是1碱基对至大于5000 碱基对。例如，区域长度可以是1-10,000个核苷酸，例如2-30核苷酸的长度，包括其间的所有子范围。作为非限制性的实例，区域可以是1-30个核苷酸、1-26个核苷酸、1-23个核苷酸、1-22个核苷酸、 1-21个核苷酸、1-20个核苷酸、1-19个核苷酸、1-18个核苷酸、1-17 个核苷酸、18-30个核苷酸、18-26个核苷酸、18-23个核苷酸、18-22 个核苷酸、18-21个核苷酸、18-20个核苷酸、19-30个核苷酸、19-26个核苷酸、19-23个核苷酸、19-22个核苷酸、19-21个核苷酸、19-20 个核苷酸、20-30个核苷酸、20-26个核苷酸、20-25个核苷酸、20-24 个核苷酸、20-23个核苷酸、20-22个核苷酸、20-21个核苷酸、21-30 个核苷酸、21-26个核苷酸、21-25个核苷酸、21-24个核苷酸、21-23 个核苷酸或21-22个核苷酸。在一些方面，区域长度可以是约1、2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、 35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、 50或更多个核苷酸。在一些方面，区域长度可以是小于50、50-100、 100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000或大于1000个核苷酸。在一些方面，区域长度可以是小于1000、1000-2000、2000-3000、3000-4000、4000-5000、5000-6000、6000-7000、7000-8000、8000-9000、9000-10000或大于 10000个核苷酸。在一些方面，区域可以包括本文公开的多核苷酸的至少两个核苷酸、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个或更多个核苷酸。

术语“样品”可以包括取自受试者(例如，哺乳动物受试者、动物受试者、人类受试者或非人类动物受试者)的RNA、DNA、单一细胞或多细胞或细胞片段或等份的体液。样品可以由本领域技术人员使用现在已知的或以后发现的方式选择，包括离心、静脉穿刺、抽血、排泄、拭子、射精、按摩、活组织检查、针吸、灌洗样品、刮擦、手术切开、激光捕获显微解剖、梯度分离或介入或者本领域中已知的其它方式。样品也可以由本领域技术人员使用一种或多种已知与目标样品相关的标志物来选择。样品也可以使用本领域已知的方法(如细胞分选和FACS)来选择。样品选择方法的其它实例描述在下面的“实施例”节中。

在一些方面，多核苷酸可以源自单一样品或与单一样品相关。在一些方面，区域可以源自单一样品或与单一样品相关。在一些方面，cDNA区域可以源自单一样品或与单一样品相关。在一些方面，扩增子区域可以源自单一样品或与单一样品相关。“单一样品”包括包含从单一来源获取的多核苷酸的样品。在一些方面，单一来源包括在特定时间点或在特定位置(例如在受试者中或细胞瓶中或细胞板中)获取的样品。在一些方面，第一单一样品在第一时间点从第一受试者获取和第二单一样品在不同于第一时间点的第二时间点从第一受试者获取。在一些方面，第一单一样品在第一位置从第一受试者获取和第二单一样品在不同于第一位置的第二位置从第一受试者获取。在一些方面，第一单一样品在某时间点从第一受试者获取和第二单一样品在某时间点从第二受试者获取。在一些方面，第一单一样品在某位置从第一受试者获取和第二单一样品在某位置从第二受试者获取。在一个实施方式中，样品包含包括源自一个或多个B 细胞的mRNA的多核苷酸。在另一个实施方式中，样品包含包括源自一个或多个B细胞的cDNA的多核苷酸。在另一个实施方式中，单一样品包含源自一个或多个分选到96-孔或384-孔板的单一孔中的B细胞的mRNA。样品一般地源自原核细胞(例如，细菌细胞)、真核细胞(例如，哺乳动物和酵母细胞)或遗传物质的其它来源如病毒或噬菌体。术语“哺乳动物”或“哺乳动物的”，如本文中所用的，包括人类和非人类，且包括，但不限于人类、非人灵长类、犬科动物、猫科动物、鼠科动物、牛科动物、马科动物和猪科动物。在一些方面，本发明的方法应用于具有至少96个孔、至少384个孔、至少1536个孔或更多个孔的板中的单一样品。在进一步的方面，本发明的方法应用于各具有至少96个孔的至少一个、两个、三个、四个、五个、六个、七个、八个、十个、十五个、二十个、三十个或更多个板中的单一样品。

在一些方面，5’接合体区域序列和/或样品识别区域添加到来自于单一样品的所有cDNA上(例如在RT过程中)而不只是添加到 Ig基因上。在一些方面，3’基因特异性引物(GSP)可以用于扩增单一样品中的任何表达的基因。在一些方面，扩增具有5’可变区域的基因，例如T细胞受体和细胞受体，而不需要多个简并5’引物来扩增目标基因。GSP可以包括对于IgG、IgM、IgD、IgA、IgE、TCR链及其它目标基因特异性的引物。

在一些方面，也可以进行多轮PCR，例如使用嵌套GSP。对于这种嵌套GSP，用于第二轮PCR的GSP在相对于第一轮PCR中使用的GSP杂交的位置沿靶基因序列5′侧的位置处与靶基因序列杂交。

在一些方面，cDNA区域或扩增子区域可以包括DNA多核苷酸。在一些方面，cDNA区域或扩增子区域可以包括cDNA多核苷酸。在一些方面，cDNA区域或扩增子区域可以包括与DNA多核苷酸杂交的RNA多核苷酸。在一些方面，cDNA区域或扩增子区域可以包括与cDNA多核苷酸的mRNA多核苷酸。

在一些方面，通用引物区域不与任何人外显子完全互补。在一些方面，通用引物区域不与任何表达的人基因完全互补。在一些方面，通用引物区域具有最低的二级结构。

在一些方面，扩增子区域包含免疫球蛋白重链扩增子序列。在一些方面，扩增子区域包含免疫球蛋白轻链扩增子序列。在一些方面，扩增子区域包含T细胞受体α扩增子序列。在一些方面，扩增子区域包含T细胞受体β扩增子序列。

在一些方面，多核苷酸存在于多核苷酸文库中且可以基于多核苷酸的区域与文库中存在的其它多核苷酸区分开。

在一些方面，源自第一单一样品的文库中各多核苷酸的样品识别区域的序列不同于源自与该第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。在一些方面，源自第一单一样品的文库中各多核苷酸的样品识别区域的序列与源自与该第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列具有至少一个核苷酸的不同。在一些方面，源自第一单一样品的文库中各多核苷酸的样品识别区域的序列与源自与该第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列具有至少2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个核苷酸的不同。在一些方面，源自第一单一样品的文库中各多核苷酸的样品识别区域的序列可以与源自与该第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列约1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、 25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、 40、41、42、43、44、45、46、47、48、49、50、60、70、80、81、 82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、 97、98、99或低于100％相同。在一些方面，源自第一单一样品的文库中各多核苷酸的样品识别区域的序列与源自与该第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列低于100％相同。在一些方面，样品识别区域用作从单一样品反转录的所有第一链cDNA上的数字条码。在一些方面，样品识别区域长度为至少1个核苷酸。在一些方面，样品识别区域可以包含至少3 个核苷酸，且样品识别区域彼此可以具有至少1个核苷酸的不同。在一个实施方式中，样品识别区域长度为3-15个核苷酸且彼此具有至少1个核苷酸的不同。在一些方面，样品识别区域可以包含至少 64个变体(使用长度3个核苷酸的样品识别区域，其中各样品-ID 彼此具有至少1个核苷酸的不同)，或在一些方面，包含更大数目的变体。在一些方面，3’连接于样品识别区域的序列可以是包含至少 1个G的接合体区域。在优选的实施方式中，3’连接于样品识别区域的序列可以是包含至少2个G的接合体区域。在一个实施方式中，连接于样品识别区域的5’端的序列是可以在PCR扩增过程中使用的通用引物区域，从而不需要后续添加5’通用引物序列(通过连接反应或另一种方法)或者使用多个简并5’引物以扩增具有可变5’区域的基因。样品识别区域的实例显示于表2和8中。

在一些方面，源自于第一组单一样品的文库中各多核苷酸的第一板识别区域的序列不同于源自于与该第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列。在一些方面，源自于第一组单一样品的文库中各多核苷酸的第一板识别区域的序列与源自于与该第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列具有至少1个核苷酸的不同。在一些方面，源自于第一组单一样品的文库中各多核苷酸的第一板识别区域的序列与源自于与该第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列具有至少2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个核苷酸的不同。在一些方面，源自于第一组单一样品的文库中各多核苷酸的第一板识别区域的序列可以与源自于与该第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列约1、2、3、 4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、 35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、 50、60、70、80、81、82、83、84、85、86、87、88、89、90、91、 92、93、94、95、96、97、98、99或低于100％相同。在一些方面，源自于第一组单一样品的文库中各多核苷酸的第一板识别区域的序列与源自于与该第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列低于100％相同。第一板识别区域的实例显示于表3和7中。

在一些方面，源自于第一组单一样品的文库中各多核苷酸的第二板识别区域的序列不同于源自于与该第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列。在一些方面，源自于第一组单一样品的文库中各多核苷酸的第二板识别区域的序列与源自于与该第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列具有至少1个核苷酸的不同。在一些方面，源自于第一组单一样品的文库中各多核苷酸的第二板识别区域的序列与源自于与该第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列具有至少2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、 43、44、45、46、47、48、49、50或更多个核苷酸的不同。在一些方面，第二板识别区域的序列与多核苷酸上第一板识别区域的序列相同。在一些方面，源自于第一组单一样品的文库中各多核苷酸的第二板识别区域的序列可以与源自于与该第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、 32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、 47、48、49、50、60、70、80、81、82、83、84、85、86、87、88、 89、90、91、92、93、94、95、96、97、98、99或低于100％相同。在一些方面，源自于第一组单一样品的文库中各多核苷酸的第二板识别区域的序列可以与源自于与该第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列低于 100％相同。第二板识别区域的实例显示于表3和7中。

在一些方面，板识别区域(例如，第一板识别区域或第二板识别区域)可以包含至少2个核苷酸，且板识别区域彼此具有至少1 个核苷酸的不同。在一个实施方式中，板识别区域长度为2-10个核苷酸且彼此具有至少1个核苷酸的不同。在一些方面，仅在一些实施方式中发现了板识别区域的使用，因为较大数目的不同样品识别区域(每个待分析的单一样品一个)的使用可以消除对板识别区域的需要。在一些方面，板识别区域用于减少需要合成的含样品识别区域的独特寡核苷酸的数目。

在一些方面，多核苷酸包括一个或多个接合体区域。在一些方面，接合体区域包括一个或多个G。在一些方面，接合体区域包括2、 3、4、5、6、7、8、9、10或更多个G。在一些方面，接合体区域利用MMLV H^-反转录酶的模板转换性质连接到cDNA的3’端。存在着连接接合体区域的不同方法，包括，但不限于使用具有5’侧翼接合体区域序列的引物进行PCR、粘端和平端连接、模板转换介导的核苷酸添加或者其它将核苷酸共价连接到多核苷酸的5’端、到3’端或到5’和3’端的方法。这些方法可以利用通常用于分子生物学中的酶的特性。PCR可以使用例如耐热的DNA聚合酶。互补或基本上互补的粘性末端通过用遗留悬端的限制性内切酶切割dsDNA产生或通过酶(如TdT(末端转移酶))的3’加尾活性产生。粘端和平端然后可以使用连接酶如T4连接酶与互补的接合体区域连接。模板转换利用 MMLV H^-反转录酶的3’加尾活性以将一个或多个胞嘧啶(C)添加到 cDNA的3’端及利用其转换模板的能力以从mRNA转换到具有互补的G的接合体区域。在一些方面，cDNA在其3’端包括1、2、3、4、 5、6、7、8、9、10或更多个C。

在一些方面，多核苷酸包括一个或多个限制性位点区域。限制性位点区域包括一个或多个限制性位点。限制性位点可以包括： NheI、XhoI、BstBI、EcoRI、SacII、BbvCI、PspXI、AgeI、ApaI、 KpnI、Acc65I、XmaI、BstEII、DraIII、PacI、FseI、AsiSI和AscI。在一些方面，可以使用任何稀有8-切点酶(rare 8-cutter enzyme)限制性位点。

在一些方面，本文描述的多核苷酸的一个或多个区域可以可操作地与多核苷酸的一个或多个其它区域偶联。在一些方面，单一多核苷酸的两个或更多个独特区域可以可操作地偶联。例如，通用引物区域可以可操作地与接合体区域偶联。在一些方面，序列上彼此基本上相同或描述上相同的两个或更多个区域可以可操作地偶联在一起。例如，第一样品识别区域可以可操作地与第二样品识别区域偶联。在一些方面，第一样品识别区域和第二样品识别区域的序列相同或基本上相同。在一些方面，第一样品识别区域和第二样品识别区域的序列不同或相异。

在一些方面，本文描述的多核苷酸的一个或多个区域可以与多核苷酸的一个或多个其它区域偶联。在一些方面，单一多核苷酸的两个或更多个不同区域可以偶联。例如，通用引物区域可以与接合体区域偶联。在一些方面，序列上彼此基本上相同或描述上相同的两个或更多个区域可以偶联在一起。例如，第一样品识别区域可以与第二样品识别区域偶联。在一些方面，第一样品识别区域和第二样品识别区域的序列相同或基本上相同。在一些方面，第一样品识别区域和第二样品识别区域的序列不同或相异。

在一些方面，多核苷酸包括序列5’-A-B-3’，其中A是样品识别区域，和其中B是接合体区域。在一些方面，多核苷酸包括序列 5’-A-B-C-3’，其中A是通用引物区域，其中B是样品识别区域，和其中C是接合体区域。在一些方面，多核苷酸包括序列5’-A-B-C-3’，其中A是样品识别区域，其中B是接合体区域，和其中C是源自单一样品的扩增子区域。在一些方面，多核苷酸包括序列 5’-A-B-C-D-3’，其中A是通用引物区域，其中B是样品识别区域，其中C是接合体区域，和其中D是源自单一样品的扩增子区域。在一些方面，多核苷酸包括序列5’-A-B-C-D-E-3’，其中A是板识别区域，其中B是通用引物区域，其中C是样品识别区域，其中D是接合体区域，和其中E是源自单一样品的扩增子区域。在一些方面，多核苷酸包括序列5’-A-B-C-D-E-F-3’，其中A是第一限制性位点区域，其中B是通用引物区域，其中C是样品识别区域，其中D是接合体区域，其中E是源自单一样品的扩增子区域，和其中F是第二限制性位点区域。

在一些方面，上述序列中各序列的区域可以以不同的顺序重排，例如，5’-C-A-D-B-3’或5’-E-A-C-B-D-F-3’或5’-B-A-3’。在一些方面，上述序列的一个或多个区域可以被删除，例如5’-A-D-3’或 5’-B-C-3’。在一些方面，一个或多个另外的区域可以添加到上述序列上，例如5’-A-A₂-B-3’或5’-A-B-C-D-E-F-G-3’。在这样的实例中，一个或多个另外的区域可以是本文公开的任何区域或其等同物。在一些方面，上述序列的一个或多个区域可以被修饰，例如甲基化。

在一些方面，多核苷酸可以包括接合体分子。在一些方面，多核苷酸接合体分子可以包括通用引物区域、样品识别区域和接合体区域，其中通用引物区域的3’端与样品识别区域的5’端偶联，且其中样品识别区域的3’端与接合体区域的5’端偶联。在一些方面，接合体分子包括含有与通过反转录在第一链cDNA的3’端添加的C结合的至少2个核苷酸。在一些方面，接合体分子包括包含3-6个G (DNA G)的脱氧核糖多核苷酸。在另一个实施方式中，接合体分子包括由3-6个G(RNA G)组成的核糖多核苷酸。在其它实施方式中，接合体分子可以利用核苷酸类似物，如锁核酸(LNA)，例如LNA G。在其它实施方式中，核苷酸碱基也可以是通用的或简并的碱基，如可以与C碱基配对的5-硝基吲哚和3-硝基吡咯，以及任何组合的其它核苷酸。

在一些方面，多核苷酸可以包括引物或探针。在一些方面，引物可以包括通用引物区域和板识别区域，且其中板识别区域的3’端与通用引物区域的5’端偶联。

在一些方面，组合物可以包括多核苷酸组合物文库。在一些方面，多核苷酸组合物文库包括多个多核苷酸组合物。在一些方面，各组合物存在于单独的容器中。在一些方面，容器可以是试管。在一些方面，容器可以是板中的孔。在一些方面，容器可以是96-孔板中的孔。在一些方面，容器可以是384-孔板中的孔。在一些方面，各组合物包含源自单一样品的cDNA区域。在一些方面，各组合物包含含有与接合体区域偶联的样品识别区域的样品识别-接合体区域。在一些方面，文库中各样品识别-接合体区域的样品识别区域的序列不同于文库中各单独容器中存在的其它样品识别-接合体区域的样品识别区域的核苷酸序列。在一些方面，样品识别-接合体区域连接到cDNA区域上。在一些方面，样品识别-接合体区域通过其3’区域间的结合连接到cDNA区域上。在一些方面，样品识别-接合体区域通过G∶C结合连接到cDNA区域上。在一些方面，cDNA区域包含与DNA多核苷酸杂交的RNA多核苷酸。在一些方面，cDNA区域包含与cDNA多核苷酸杂交的mRNA多核苷酸。

在一些方面，多核苷酸文库中的多个多核苷酸组合物可以包含至少2个、至少3个、至少10个、至少30个、至少100个、至少 300个、至少1000个、至少3000个、至少10,000个、至少30,000 个、至少100,000个、至少300,000个、至少1,000,000个、至少 3,000,000个、至少10,000,000个、至少30,000,000个或更多个成员。在其它方面，多核苷酸文库中的多个多核苷酸组合物可以包含细胞样品的整个转录组中的至少2个、至少3个、至少10个、至少30 个、至少100个、至少300个、至少1000个、至少3000个、至少 10,000个、至少30,000个或更多个基因。在其它方面，多核苷酸文库中的多个多核苷酸组合物包含个体血液中存在的至少1个、至少2 个、至少3个、至少10个、至少30个、至少100个、至少300个、至少1000个、至少10,000个、至少100,000个、至少1,000,000个、至少10,000,000个、至少1,000,000,000个或更多个不同的抗体种类。这些抗体种类可以由浆母细胞、浆细胞、记忆B细胞、长寿浆细胞、原始B细胞、其它B谱系细胞或其组合表达。

载体

在一些方面，组合物可以包括载体。载体可以用于用核酸序列转化宿主细胞。在一些方面，载体可以包括一个或多个本文所述的多核苷酸。在一个实施方式中，编码目标多肽的核酸序列的文库可以引入细胞群体中，从而允许文库的筛选。术语“载体”用于指核酸序列可以插入其中的载体核酸分子以引入到其可以复制的细胞中。核酸序列可以是“外源的”或“异源的”，这意味着它对于载体被引入其中的细胞是外来的，或者该序列对于细胞中的序列是同源的但它处于宿主细胞核酸内该序列原先不存在的位置中。载体包括质粒、粘粒和病毒(例如噬菌体)。本领域技术人员可以通过标准重组技术构建载体，其描述于Maniatis等，1988和Ausubel等，1994中，这两篇参考文献通过引入并入本文。在一些方面，载体可以是具有预工程化加入的抗体恒定区的载体。以这种方式，本领域技术人员可以仅克隆目标抗体的VDJ区域并将那些区域克隆到预工程化的载体中。

术语“表达载体”是指包含编码至少部分能够转录的基因产物的核酸序列的载体。在一些情况中，RNA分子然后翻译成蛋白质、多肽或肽。表达载体可以包含多个“控制序列”，其是指用于可操作地连接的编码序列在特定宿主生物体中的转录及可能的翻译的核酸序列。除了管理转录和翻译的控制序列外，载体和表达载体可以包含也发挥其它功能的核酸序列。

在一些方面，载体可以包括启动子。在一些方面，载体可以包括增强子。“启动子”是在该处控制转录的起始和速率的核酸序列的区域。它可以包含在此处调控蛋白质和分子如RNA聚合酶和其它转录因子可以结合的遗传元件。短语“可操作地定位”、“可操作地连接”、 “在控制下”和“在转录控制下”意思是启动子处于相对于核酸序列的正确功能位置和/或方向以控制该序列的转录起始和/或表达。启动子可以与“增强子”(其是指参与核酸序列的转录活化的顺式作用调控序列)结合使用或不与其结合。

启动子可以是天然与基因或序列相关的启动子，如可以通过分离位于编码片段和/或外显子上游的5′非编码序列获得的。这样的启动子可以称作“内源的”。类似地，增强子可以是天然与核酸序列相关的增强子，其位于该序列的下游或上游。或者，某些优势通过将编码核酸片段定位在重组的或异源的启动子(其是指正常情况下在其自然环境中不与核酸序列相关的启动子)的控制下而获得。重组的或异源的增强子也指正常情况下在其自然环境中不与核酸序列相关的增强子。这样的启动子或增强子可以包括其它基因的启动子或增强子，和从任何其它原核细胞分离的启动子或增强子，和非“天然存在的”启动子或增强子，即含有不同转录调控区域的不同元件和/ 或改变表达的突变。除了通过合成产生启动子和增强子的核酸序列外，序列可以使用与本文描述的组合物相关的重组克隆和/或核酸扩增技术(包括PCR)产生(参见U.S.专利号4,683,202，U.S.专利号 5,928,906，各通过引用并入本文)。

在一些方面，启动子和/或增强子有效地在选择用于表达的细胞类型中指导DNA片段的表达。可以使用的这种启动子的实例是大肠杆菌阿拉伯糖或T7启动子。分子生物学领域的那些技术人员通常熟悉用于蛋白质表达的启动子、增强子和细胞类型组合的使用，例如，参见Sambrook等(1989)，其通过引用并入本文。使用的启动子可以是组成型的、组织特异性的、诱导型的和/或可用于在适当条件下指导引入的DNA片段的高水平表达，如在大规模生产重组蛋白质和/ 或肽中有利的。启动子可以是异源的或内源的。

在一些方面，载体可以包括起始信号和/或内部核糖体结合位点。也可以包括用于有效翻译编码序列的特定的起始信号。这些信号包括ATG起始密码子或邻接序列。可能需要提供外源翻译控制信号，包括ATG起始密码子。本领域技术人员能够容易地确定这一点并提供必要的信号。公知的是，起始密码子必须与所需编码序列的阅读框是“同框(in-frame)”的以确保整个插入序列的翻译。外源翻译控制信号和起始密码子可以是天然的或合成的。表达效率可以通过包括适当的转录增强子元件而增强。

在一些方面，载体可以包括提高或优化编码目标基因的DNA片段的表达水平的序列。这样的序列的例子包括在表达的mRNA中添加内含子(Brinster，R.L.等(1988)Intronsincrease transcriptional efficiency in transgenic mice.Proc.Natl.Acad.Sci.USA85，836-40； Choi，T.等(1991)A generic intron increases gene expression intransgenic mice.Mol.Cell.Biol.11，3070-4)。用于优化DNA片段的表达的方法的另一实例是“密码子优化”。密码子优化包括将沉默突变插入到DNA片段中以减少稀有密码子的使用，从而优化蛋白质翻译(Codon engineering for improved antibody expression inmammalian cells.Carton JM，Sauerwald T，Hawley-Nelson P，Morse B，Peffer N， BeckH，Lu J，Cotty A，Amegadzie B，Sweet R.Protein Expr Purif.2007 Oct；55(2)：279-86.Epub 2007Jun 16.)。

在一些方面，载体可以包括多克隆位点。载体可以包括多克隆位点(MCS)，其是含有多个限制性酶切位点的核酸区域，其中的任何限制性酶切位点可以结合标准重组技术使用以消化载体(参见 Carbonelli等，1999，Levenson等，1998和Cocea，1997，通过引用并入本文)。“限制性酶消化”是指核酸分子用仅在核酸分子的特定位置发挥功能的酶进行酶促切割。许多的这些限制性酶是商业可得的。本领域技术人员知道这样的酶的使用。经常地，载体使用在MCS内切割的限制性酶线性化或片段化以使得外源序列能够连接到载体上。 “连接反应”是指在两个核酸片段(其可以相对于彼此是连续的或不连续的)之间形成磷酸二酯键的过程。涉及限制性酶和连接反应的技术是重组技术领域的技术人员公知的。

在一些方面，载体可以包括终止信号。载体或构建体一般包含至少一个终止信号。“终止信号”或“终止子”由参与由RNA聚合酶导致的RNA转录物的特定终止的DNA序列构成。因此，在某些实施方式中，设想了终止RNA转录物产生的终止信号。终止子可能是体内需要的以实现所需的信息水平。

设想使用的终止子包括本文描述的或本领域技术人员已知的任何已知转录终止子，包括但不限于，例如，rho依赖性或rho非依赖性终止子。在某些实施方式中，终止信号可以缺乏可转录或可翻译序列，如由于序列截断。

在一些方面，载体可以包括复制起点。

为了在宿主细胞中增殖载体，它可以包含一个或多个复制起点位点(通常称作“ori”)，其是复制起始的特定核酸序列。

在一些方面，载体可以包括一个或多个可选择和/或可筛选的标记。在某些实施方式中，含有核酸构建体的细胞可以通过在表达载体中包括标记而在体外或体内鉴别。这样的标记对细胞赋予允许容易地识别包含表达载体的细胞的可鉴别的变化。一般地，可选择标记是赋予允许对其进行选择的性质的标记。阳性可选择标记是其中标记的存在允许对其进行选择的标记，而阴性可选择标记是其中其存在阻止其选择的标记。阳性可选择标记的实例是药物抗性标记。

通常，包括药物选择标记有助于克隆和转化体的鉴别，例如，赋予对新霉素、嘌呤霉素、潮霉素、DHFR、GPT、博来霉素(zeocin) 和组氨醇的抗性的基因是可用的选择标记。除了赋予允许基于条件的执行区分转化体的表型的标记外，也设想了其它类型的标记(包括可筛选标记如GFP，其基础是比色分析)。或者，可以使用可筛选的酶如氯霉素乙酰转移酶(CAT)。本领域技术人员也知道如何使用免疫标志物，可能的话与FACS分析结合。使用的标志物据信不是重要的，只要它能够与编码基因产物的核酸同时表达。可选择和可筛选标记的进一步实例是本领域技术人员公知的。

在一个方面，载体可以表达编码多个目标多肽的DNA片段。例如，编码免疫球蛋白重链和轻链两者的DNA片段可以通过单一载体编码和表达。在一个方面，两个DNA片段可以包括在相同的表达 RNA上且和内部核糖体结合位点(IRES)序列用于使DNA片段能够表达为独立的多肽(Pinkstaff JK，Chappell SA，Mauro VP，Edelman GM，Krushel LA.，Internal initiation of translation of five dendritically localized neuronalmRNAs.，Proc Natl Acad Sci U S A.2001 Feb 27；98(5)：2770-5.Epub 2001 Feb 20.)。在另一个方面，各DNA片段具有其自己的启动子区域，导致单独mRNA的表达(Andersen CR，Nielsen LS，Baer A，Tolstrup AB，Weilguny D.Efficient Expression from One CMVEnhancer Controlling Two Core Promoters.Mol Biotechnol.2010 Nov 27.[Epubahead of print])。

宿主细胞和表达系统

在一些方面，组合物可以包括宿主细胞。在一些方面，宿主细胞可以包括本文描述的多核苷酸或载体。在一些方面，宿主细胞可以包括真核细胞(例如，昆虫、酵母或哺乳动物)或原核细胞(例如，细菌)。在表达异源核酸序列的情况中，“宿主细胞”可以指原核细胞，且其包括能够复制载体和/或表达载体编码的异源基因的任何可转化生物体。宿主细胞可以且已经用作载体的接受者。宿主细胞可以是“转染的”或“转化的”，其是指外源核酸转移或引入到宿主细胞中的过程。转化的细胞包括原代主体细胞或其后代。

在特定的实施方式中，宿主细胞是革兰氏阴性细菌细胞。这些细菌适合使用，因为它们具有内膜与外膜之间的周质间隙和特别地周质与细胞质之间的前述内膜，其也称作细胞质膜。如此，可以使用具有这样的周质间隙的任何其它细胞。革兰氏阴性细菌的例子包括，但不限于大肠杆菌(E.coli)、铜绿假单胞菌(Pseudomonas aeruginosa)、霍乱弧菌(Vibrio cholera)、鼠伤寒沙门氏菌(Salmonella typhimurium)、弗氏志贺氏菌(Shigella flexneri)、流感嗜血杆菌 (Haemophilus influenza)、百日咳杆菌(Bordotella pertussi)、解淀粉欧文氏菌(Erwinia amylovora)、根瘤菌(Rhizobiumsp.)。革兰氏阴性细菌细胞还可以进一步定义为已用编码包含能够结合所选择的配体的候选结合多肽的融合多肽的序列转化的细菌细胞。多肽锚定到胞质膜的外表面上而面对周质间隙，且可以包含抗体编码序列或另一序列。用于多肽表达的一种手段是通过将前导序列连接到能够引起这种指引的多肽上。

多种原核细胞系和培养物可用作宿主细胞，且它们可以通过美国典型培养物保藏中心(ATCC)获得，美国典型培养物保藏中心是用作活培养物和遗传材料的储藏库的机构。适宜的宿主可以由本领域技术人员基于载体骨架和所需的结果确定。例如，质粒或粘粒可以引入用于许多载体的复制的原核宿主细胞中。用作用于载体复制和/ 或表达的宿主细胞的细菌细胞包括DH5-α、JM109和KC8，以及多种商业可得的细菌宿主如SURE^TMCompetent Cells和SOLOPACK^TMM Gold Cells(STRATAGENE^TM，La Jolla)。在一些方面，设想其它细菌细胞如大肠杆菌LE392用作宿主细胞。

来自各种细胞类型和生物体的许多宿主细胞是可得的且是本领域技术人员已知的。类似地，病毒载体可以与原核宿主细胞结合使用，特别是允许载体的复制或表达的原核宿主细胞。一些载体可以利用允许其在原核和真核细胞中复制和/或表达的控制序列。本领域技术人员可以进一步理解用于孵育所有以上描述的宿主细胞以维持它们和允许载体的复制的条件。还理解和知道允许大规模产生载体以及产生载体所编码的核酸及其同源多肽、蛋白质或肽的技术和条件。

在一些方面，宿主细胞是哺乳动物的。其实例包括CHO细胞、 CHO-K1细胞或CHO-S细胞。其它哺乳动物细胞包括NS0细胞和为 dhfr-的CHO细胞，例如CHO-dhfr-、DUKX-B 11CHO细胞和DG44 CHO细胞。

存在的多种表达系统可以包含本文公开的组合物的至少一部分或全部。表达系统可以包括真核表达系统和原核表达系统。这样的系统可以用于，例如，产生确定为能够结合特定配体的多肽产物。基于原核生物的系统可以用于产生核酸序列或它们的同源多肽、蛋白质和肽。许多这样的系统是商业上和普遍可得的。表达系统的其它例子包括含有强原核启动子如T7、Tac、Trc、BAD、λpL、四环素或Lac启动子的载体、pET表达系统和大肠杆菌表达系统。

多肽

在一些方面，组合物可以包括多肽。在一些方面，可以由例如宿主细胞表达通过本文描述的多核苷酸编码的多肽。术语“多肽”或 “蛋白质”包括具有原始蛋白质的氨基酸序列的大分子，即由天然存在的和非重组的细胞产生的蛋白质；或者它由遗传工程化的或重组的细胞产生，且包含具有原始蛋白质的氨基酸序列的分子或具有原始序列的一个或多个氨基酸的缺失、添加和/或置换的分子。该术语还包括其中一个或多个氨基酸是相应的天然存在的氨基酸和聚合物的化学类似物的氨基酸聚合物。术语“多肽”和“蛋白质”涵盖抗原结合蛋白、抗体或具有抗原结合蛋白的一个或多个氨基酸的缺失、添加和/或置换的序列。术语“多肽片段”是指与全长原始蛋白质相比具有氨基端缺失、羧基端缺失和/或内部缺失的多肽。这样的片段与原始蛋白质相比也可以包含修饰的氨基酸。在某些实施方式中，片段为约5-500个氨基酸长。例如，片段可以是至少5、6、8、10、14、20、 50、70、100、110、150、200、250、300、350、400或450个氨基酸长。可用的多肽片段包括抗体的免疫功能性片段，包括结合结构域。在结合抗体的情况中，可用的片段包括，但不限于CDR区、重链和/或轻链的可变结构域、抗体链的一部分或仅其可变区包括两个 CDR，等等。

术语“分离的蛋白质”意思是所述蛋白质(1)不含天然状态下与其一起存在的至少一部分其它的蛋白质，(2)基本上不含来自相同来源 (例如，同一物种)的其它蛋白质，(3)由来自不同物种的细胞表达，(4)已经与其天然相关的多肽、脂质、碳水化合物或其它材料的至少约50％分离，(5)可操作地与天然不相关的多肽关联(通过共价或非共价相互作用)或(6)不是天然存在的。通常，“分离的蛋白质”占给定样品的至少约5％、至少约10％、至少约25％或至少约50％。基因组DNA、cDNA、mRNA或其它RNA、合成来源的核酸或其任何组合可以编码这样的分离的蛋白质。优选地，分离的蛋白质基本上不含在其天然环境中存在的干扰其治疗、诊断、预防、研究或其它用途的蛋白质或多肽或其它污染物。

在一些方面，多肽可以包括抗原结合蛋白(ABP)。如本文中所用的，“抗原结合蛋白”(“ABP”)意思是结合指定的靶抗原的任何蛋白质。“抗原结合蛋白”包括，但不限于抗体及其结合部分，如免疫功能性片段。肽体(peptibody)是抗原结合蛋白的另一实例。如本文中所用的，术语抗体或免疫球蛋白链(重链或轻链)抗原结合蛋白的“免疫功能性片段”或(简称为“片段”)是包含缺乏全长链中存在的至少一些氨基酸但其仍然能够特异性结合抗原的抗体一部分(无论该部分是如何获得或合成的)的抗原结合蛋白物质。这样的片段是生物活性的，因为它们结合靶抗原且可以与其它抗原结合蛋白(包括完整抗体)竞争结合给定的表位。在一些实施方式中，片段是中和片段。这些生物活性片段可以通过重组DNA技术产生，或可以通过抗原结合蛋白质(包括完整抗体)的酶促或化学切割产生。免疫功能性免疫球蛋白片段包括，但不限于Fab、双特异抗体(在与轻链可变结构域相同的多肽上的重链可变结构域，通过太短而不允许同一链上的两个结构域之间配对的短肽接头连接)、Fab′、F(ab′)2、Fv、域抗体和单链抗体，且可以源自任何哺乳动物来源，包括但不限于人、小鼠、大鼠、骆驼(camelid)或兔。进一步设想本文公开的抗原结合蛋白质的功能性部分，例如一个或多个CDR，可以共价结合第二蛋白质或小分子以产生针对身体中的特定靶标的治疗剂，从而具有双功能治疗性能，或具有延长的血清半衰期。如本领域技术人员可以理解的，抗原结合蛋白可以包括非蛋白质成分。关于抗原结合蛋白和抗体的其它细节如修饰、变体、制备方法和筛选方法可以在美国专利公开20110027287中找到，其为了所有目的通过引用并入本文。

在一些方面，多肽可以包括抗体。术语“抗体”是指任何同种型的完整免疫球蛋白或可以与完整抗体竞争与靶抗原的特异性结合的其片段，且包括，例如嵌合的、人源化的、完全人的和双特异性的抗体。“抗体”是抗原结合蛋白的种类。完整抗体一般包含至少两个全长重链和两个全长轻链，但在一些情况中，可以包括较少的链，如天然存在于骆驼中的抗体，其可以仅包含重链。抗体可以只源自单一来源，或可以是“嵌合的”，即抗体的不同部分可以源自两个不同的抗体。抗原结合蛋白、抗体或结合片段可以在杂交瘤中产生，通过重组DNA技术产生或通过完整抗体的酶促或化学切割产生。除非另外表明，术语“抗体”除了包含两个全长重链和两个全长轻链的抗体之外还包括其衍生物、变体、片段和突变蛋白。此外，除非明确排除，抗体分别包括单克隆抗体、双特异性抗体、微抗体、域抗体、合成抗体(有时在本文中称作“抗体模拟物”)、嵌合抗体、人源化抗体、人抗体、抗体融合体(本文中有时称作“抗体偶联物”) 及其片段。在一些实施方式中，该术语还涵盖肽体。

治疗有效量的ABP可以施用于需要的受试者。ABP可以配制在药物组合物中。这些组合物可以在一种或多种ABP之外另外包含药学可接受的赋形剂、载体、缓冲剂、稳定剂或其它本领域技术人员公知的材料。这样的材料应当是无毒的且不应干扰活性成分的效力。载体或其它材料的准确性质可以取决于施用途径，例如口服、静脉内、皮肤或皮下、经鼻、肌肉内、腹膜内途径。

用于口服施用的药物组合物可以是片剂、胶囊、粉末或液体形式。片剂可以包括固体载体如明胶或辅剂。液体药物组合物一般包括液体载体如水、石油、动物或植物油、矿物油或合成油。可以包括生理盐水溶液、右旋糖或其它糖溶液或二醇类如乙二醇、丙二醇或聚乙二醇。

对于静脉内、皮肤或皮下注射，或者在患病部位的注射，活性成分为肠胃外可接受的水性溶液的形式，其为无热原的且具有适当的pH、等渗性和稳定性。相关技术领域的技术人员能够使用例如等渗媒介如氯化钠注射液、林格氏注射液、乳酸林格氏注射液制备合适的溶液。按照需要，可以包括防腐剂、稳定剂、缓冲剂、抗氧化剂和/或其它添加剂。

ABP施用优选以“治疗有效量”或“预防有效量”(视情况而定，虽然预防可以视为治疗)，这足以显示对个体的益处。施用的实际量以及施用的速率和时程取决于待治疗疾病的性质和严重性。治疗的处方，例如剂量的决定等，在一般实施者和其它医学医生的责任范围内，且通常考虑待治疗的病症、个别患者的情况、递送的位点、施用的方法和实施者已知的其它因素。上述技术和方案的实例可以在Remington′s PharmaceuticalSciences，16th edition，Osol，A.(ed)， 1980中找到。

组合物可以单独或与其它治疗结合施用，根据待治疗的病症同时地或顺序地施用。

免疫细胞

样品可以包括免疫细胞。免疫细胞可以包括T细胞和B细胞。T 细胞(T淋巴细胞)包括，例如，表达T细胞受体的细胞。B细胞包括，例如，活化B细胞、未成熟B细胞、浆细胞、浆母细胞、记忆B细胞、B1细胞、B2细胞、边缘区B细胞和小结B细胞。T细胞包括活化T细胞、未成熟T细胞、辅助性T细胞(效应T细胞或Th细胞)、细月包毒性T细胞(CTL)、记忆T细胞、中枢记忆性T细胞、效应记忆性T细胞和调节T细胞。样品可以在一些应用(例如定义相关T或 B细胞的校准测试)中包括单一细胞或更通常地包括至少1,000、至少10,000、至少100,000、至少250,000、至少500,000、至少750,000 或至少1,000,000个细胞

B细胞

如本文中所用的，“B细胞”是指具有至少一个重排的免疫球蛋白基因座的任何细胞。B细胞可以包括至少一个重排的免疫球蛋白重链基因座或至少一个重排的免疫球蛋白轻链基因座。B细胞可以包括至少一个重排的免疫球蛋白重链基因座和至少一个重排的免疫球蛋白轻链基因座。B细胞是作为适应性免疫系统的部分的淋巴细胞。 B细胞可以包括表达作为细胞表面上的B细胞受体(BCR)的膜结合形式的抗体或作为分泌的抗体的任何细胞。B细胞可以表达免疫球蛋白(抗体、B细胞受体)。抗体可以包括由重和轻免疫球蛋白链形成的异二聚体。重链由可变、多样和接合(VDJ)基因的基因重排形成以形成可变区(其与恒定区结合)而形成。轻链由可变和接合(VJ) 基因的基因重排以形成可变区(其随后结合到恒定区)而形成。由于大量可能的接合组合，抗体基因(其也是BCR)的可变区具有巨大的多样性，从而使得B细胞能够识别任何外来抗原并引起针对它的反应。

B-细胞激活和分化

B细胞在炎症免疫反应的情况中识别抗原时激活和分化。它们通常包括2个信号以成为活化的，一个通过BCR(重排的免疫球蛋白的结合形式)递送的信号和另一个通过CD40或另一共刺激分子递送的信号。这种第二信号可以通过与辅助性T细胞(其表达在其表面上的CD40的配体(CD40L))的相互作用提供。B细胞然后增殖且可以发生体细胞超变，其中形成抗体基因的核苷酸序列的随机改变，且选择其抗体具有较高亲和力的B细胞。它们也可以发生“类别转换”，其中编码IgM同种型的重链的恒定区转换为编码IgG、IgA 或IgE同种型的恒定区。分化B细胞可以终止于记忆B细胞，其通常具有较高亲和力和发生类型转换，尽管一些记忆B细胞仍然是IgM 同种型。记忆B细胞也可以变成活化的和分化成浆母细胞并最终分化成浆细胞。分化B细胞也可以首先变成浆母细胞，其随后分化而变成浆细胞。

亲和力成熟和克隆家族

克隆家族一般通过使用2个或更多个样品的相关免疫球蛋白重链和/或轻链V(D)J序列定义。相关免疫球蛋白重链V(D)J序列可以通过基因组中编码的其共有V(D)J基因片段的使用鉴定。在克隆家族内一般存在着根据其V(D)J片段中的共有突变而变化的亚家族，其可以在B细胞基因重组和体细胞超变的过程中产生。

活化的B细胞迁移并形成淋巴组织或其它组织内的生发中心，在此处它们发生亲和力成熟。B细胞也可以在生发中心之外发生亲和力成熟。在亲和力成熟过程中，B细胞在其抗体基因中发生随机突变，其集中于编码直接与该B细胞针对其而激活的靶抗原结合并识别该靶抗原的抗体部分的基因的互补决定区(CDR)中。这产生了来自原始增殖B细胞的亚克隆，该原始增殖B细胞表达与原始克隆及彼此略有不同的免疫球蛋白。选择竞争抗原的克隆和较高亲和力的克隆，而较低亲和力的克隆通过细胞凋亡死亡。这一过程导致B细胞的“亲和力成熟”并随后导致以较高亲和力与抗原结合的免疫球蛋白的B细胞的产生。所有来源于相同“亲本”B细胞的B细胞形成克隆家族，且这些克隆家族包括识别相同或相似抗原性表位的B细胞。在一些方面，我们预期，以较高频率存在的克隆代表以较高亲和力与抗原结合的克隆，因为较高亲和力的克隆在亲和力成熟的过程中选择。在一些方面，具有不同V(D)J片段使用的克隆表现出不同的结合特征。在一些方面，具有相同的V(D)J片段但不同的突变的克隆表现出不同的结合特征。

记忆B细胞

记忆B细胞通常是亲和力成熟的B细胞，且可以发生类别转换。它们是可以更快速地对后续抗原激发作出响应的细胞，从而显著地将天然生物体中针对该抗原的亲和力成熟抗体的分泌所需的约14天的时间减少到约7天。

浆母细胞和浆细胞

浆细胞可以是长寿的或短寿的。长寿浆细胞可以存活生物体的一生，而短寿浆细胞可以维持3-4天。长寿浆细胞驻留于炎症区域中、粘膜区域中(在IgA-分泌浆细胞的情况中)、在二级淋巴组织(如脾或淋巴结)中或在骨髓中。为达到这些分散的区域，注定变成长寿浆细胞的浆母细胞可以在利用各种趋化因子梯度运输到适宜区域之前首先通过血流移动。浆母细胞是亲和力成熟的、通常类别转换的且通常分泌抗体(尽管通常以比浆细胞产生的抗体量低的量分泌抗体)的细胞。浆细胞是专性的抗体分泌者。

TCR和BCR基因的特征

由于识别的重组存在于各单个适应性免疫细胞的DNA中以及其相关RNA转录物中，RNA或DNA可以测序。来自T细胞或B细胞的重组序列也可以称为克隆型(clonotype)。DNA或RNA可以对应于来自T细胞受体(TCR)基因或编码抗体的免疫球蛋白(Ig)基因的序列。例如，DNA和RNA可以对应于编码TCR的α、β、γ或δ链的序列。在大多数T细胞中，TCR是由α-链和β-链构成的异二聚体。 TCR-α链通过VJ重组产生，且β链受体通过V(D)J重组产生。对于 TCR-β链，在人体中存在48个V片段、2个D片段和13个J片段。在两个接合区的各接合区处可以删除几个碱基和添加其它的碱基 (称作N和P核苷酸)。在大多数T细胞中，TCR由γ和δ链组成。 TCRγ链通过VJ重组产生，且TCRδ链通过V(D)J重组产生(Kenneth Murphy，PaulTravers和Mark Walport，Janeway′s Immunology 7th edition，Garland Science，2007，其全文通过引用引入)。

在该方法中分析的DNA和RNA可以对应于编码具有恒定区(α、 δ、γ、ε或μ)的重链免疫球蛋白(IgH)或具有恒定区λ或κ的轻链免疫球蛋白(IgK或IgL)的序列。各抗体可以具有两个相同的轻链和两个相同的重链。各链由恒定(C)和可变区组成。对于重链，可变区由可变(V)、多样(D)和接合(J)片段组成。编码各类型的这些片段的几个不同序列存在于基因组中。特定的VDJ组合事件在B细胞发育过程中发生，标记该细胞以产生特定的重链。轻链中的多样性以相似的方式产生，除了不存在D区之外，因而仅存在VJ重组。体细胞突变通常靠近重组的位点发生，从而导致几个核苷酸的添加或删除，进一步增加由B细胞产生的重链和轻链的多样性。然后由B细胞产生的抗体的可能的多样性是不同重链和轻链的产物。重链和轻链的可变区导致形成抗原识别(或结合)区或位点。增加这种多样性的是体细胞超变的过程，其可以在产生针对某些表位的特定应答后发生。在这一过程中，突变在能够识别该特定表位的那些B细胞中发生，从而导致在可能能够更强地结合特定表位的抗体中更高的多样性。所有这些因素造成由B细胞产生的抗体的高度多样性。可以产生数百万种和也许超过万亿种不同的抗体。产生T细胞多样性的基本前提与由B细胞产生抗体的前提相似。T细胞和B细胞激活的要素是其与表位的结合。特定细胞的激活导致更多的相同类型细胞的产生，从而导致克隆扩增。

互补决定区(CDR)或高变区是可以结合抗原的抗原受体(例如， T细胞受体和免疫球蛋白)的可变结构域中的序列。各抗原受体的链含有三个CDR(CDR1、CDR2和CDR3)。形成T细胞(α和β)和免疫球蛋白(IgH和IgK或IgL)的两个多肽造成三个CDR的形成。

编码TCR-β的CDR1和CDR2的部分位于47个功能性V片段之一内。CDR多样性主要发现于CDR3中，其中该多样性由T淋巴细胞发育过程中的体细胞重组事件产生。

多种多样的BCR存在于个体之间和个体内。BCR由编码抗体重链和轻链的两个基因IgH和IgK(或IgL)组成。结合抗原的三个互补决定区(CDR)序列和MHC分子在IgH和IgK(或IgL)中具有最高的多样性。编码IgH的CDR1和CDR2的部分位于44个功能性V片段之一内。原始B细胞中的主要多样性出现于B淋巴细胞发育期间通过体细胞重组事件生成CDR3的过程中。重组可以生成具有各V、D 和J片段之一的分子。在人体中，存在44个V、27个D和6个J 片段，因此存在着超过7,000种组合的理论可能性。在小部分BCR (约5％)中，发现了两个D片段。此外，在两个区中的各接合区处可以删除几个碱基和添加其它的碱基(称为N和P核苷酸)，从而产生高度的多样性。在B细胞激活后，发生通过体细胞超变的亲和力成熟的过程。在这个过程中，激活的B细胞的后代细胞在整个基因内累积不同的体细胞突变，在CDR区中具有更高的浓度，导致产生具有与抗原的更高亲和力的抗体。除了体细胞超变外，活化的B 细胞经历同种型转换的过程。具有相同可变片段的抗体根据恒定片段的不同可以具有不同的形式(同种型)。尽管所有原始B细胞表达IgM(或IgD)，活化的B细胞大多表达IgG，但也表达IgM、IgA 和IgE。这种从IgM(和/或IgD)到IgG、IgA或IgE的表达转换通过导致一个细胞专门产生特定同种型的重组事件而发生。对于IgM、 IgD和IgE各存在一个片段，对于IgA存在两个片段，和对于IgG存在四个片段。

方法

应用于保健和生物技术用途

本文所述的组合物和方法用于识别抗体和TCR和用于将抗体和 TCR分组成克隆家族的用途具有许多保健和生物技术研究方面的有利和新型的应用。抗体克隆家族可以包含亲和力成熟的非相同克隆和TCR克隆家族可以包含相同的克隆。这些应用包括，但不限于： 1)抗体或抗体衍生疗法的发现和开发；2)诊断法的发现和开发；3) 可用于健康和生物技术研究的研究工具的发现和开发；和4)候选疫苗的开发和评估及可用作疫苗成分的抗原的鉴别。

由于本发明可用于任何类型的B或T细胞，细胞来源和特定的 B或T细胞亚型基于所需的最终产品的特性选择。B或T细胞的特定类别用项用途的实例描述于一般材料和方法章节的“细胞和细胞亚群的分离和富集”小节中。一般地，细胞可以来自具有特定临床状态或病程或者接受了特定治疗方案或者已暴露于特定激发、免疫或诱导免疫条件集的特定人或动物受试者。

应用于疗法、诊断法和研究工具的发现和开发

为了开发用作治疗、诊断或研究工具的抗体或源自抗体的分子，可以首先鉴别和发现在体内或体外系统中结合某种或所需抗原或表位和/或具有所需功能序列的抗体和/或抗体的抗原结合区域的衍生物。这些候选抗体然后进一步筛选对于预期的产品特定的其它所需性能。这些目标产品性能对于不同类型的治疗、诊断和研究工具抗体是不同的，且本发明提供可用的鉴别用于针对任何这些产品途径的进一步开发的候选者的手段。

基于最终产品性能的所需特征，相关B细胞的来源可以是，但不限于患有疾病的患者，如感染性疾病、癌症或自身免疫性病症；接受治疗的患者，如癌症治疗或疫苗；或患有疾病或以诱导免疫应答的方式治疗的动物，如免疫或疾病模型的诱导/建立。

一般地，意图开发为治疗、诊断和研究工具的候选抗体或源自抗体结合区域的候选大分子通过落在两种总体途径之一中的多种技术发现：1)从人的或动物的免疫反应分离目标抗体；和2)源自异源表达的或使用一种或多种展示技术筛选的免疫球蛋白分子或其衍生物的展示文库的抗体分离(综述于Hoogenboom HR，Trends Biotechnol.，1997，15：62-70；Hammond PW，MAbs，2010，2：157-64； Nissim A，Chernajovsky Y，Handb ExpPharmacol.，2008，(181)：3-18； Steinitz M，Hum Antibodies，2009；18：1-10；BradburyAR，Sidhu S， Dübel S和McCafferty，Nat Biotechnol.，2011，29245-54；AntibodyEngineering(Kontermann RE和Dübel S eds.，Springer，第2版))。

对于前一途径(#1)，候选抗体选自如在例如一般材料和方法章节中所述的从相关供体鉴别的特定克隆家族。本发明可以如所述的应用于来自于适当人供体或动物的适当的B细胞(例如，未成熟B细胞) 以鉴别候选抗体。例如，对于癌症治疗抗体候选者，适当的人供体可以是通过免疫反应成功抑制癌症进展的患者；或者对于特定的诊断抗体候选者，适当的供体可以是具有抗诊断标志物的自身抗体的患者或针对该标志物进行免疫的小鼠；或者对于抗体试剂工具候选者，适当的供体可以是小鼠、兔、山羊、大鼠、马、鸡、狗或用抗体试剂要识别的靶分子和/或表位免疫的其它动物。用于表达和调试的抗体的序列和选择可以如一般材料和方法章节中所述的进行。这样的技术应用可以提供通常经由更费力和费时的方法获得的候选抗体(例如，杂交瘤技术、病毒诱导的B细胞永生化等)。

对于后一途径(#2)，在#1途径中获得的来自于一个或多个人或动物抗体谱的配对重链和轻链序列的亚集或整个集合用于作为含识别区域的文库的种子(seed)以在文库和/或文库的选定/富集亚集使用下一代测序平台测序时追踪样品来源和来自样品的原始同源对。可变区和框架区信息可以整合到一个或多个抗体展示文库格式中以发现候选抗体。Ig基因的可变区可以使用一般材料和方法章节的“克隆及克隆的轻链和重链免疫球蛋白对的表达”小节中所述的方法克隆和整合到表达载体中。例如来自如#1途径中获得的同源对重链和轻链的片段和/或结构域可以用于作为Fab酵母(Weaver-Feldhaus JM， LouJ，Coleman JR等.，FEBS Lett，2004，564：24-34)或噬菌粒(Kashyap AK，Steel J，Oner AF等，Proc Natl Acad Sci U S A，2008，105：5986-91) 文库的种子，该文库具有追踪各链到适当的原始B细胞来源的识别区域而无论不同重链和轻链组合匹配到非-内源(非-同源)配对中。如#1途径中获得的同源对重链和轻链也可以超出噬菌粒或酵母以外的其它展示平台，且可用于Fab片段表达构建体以外的其它抗体衍生物表达构建体[AntibodyEngineering(Kontermann，RE和Dübel S编辑，Springer，第2版)]。在识别区域的可选应用中，识别区域可以添加到早已存在的展示文库上以提供识别区域追踪和下一代测序数据的错误校正的益处。取决于文库类型、格式和表达/展示系统，识别区域可以使用PCR反应或反转录酶后的PCR反应并入(参见，例如，一般材料和方法章节中的“来自单一B细胞的配对轻链和重链免疫球蛋白基因的测序”小节)。

候选抗体，无论来自B细胞库(参见，例如，一般材料和方法章节)或展示表达文库“集合”(Kashyap AK，Steel J，Oner AF等，Proc Natl Acad Sci U S A，2008，105：5986-91；Weaver-Feldhaus JM，Lou J， Coleman JR等，FEBS Lett，2004，564：24-34；Ravn U，Gueneau F， Baerlocher L等，Nucleic Acids Res，2010，38：e193；Antibody Engineering(Kontermann，RE和Dübel S编辑，Springer，第2版)，都通过表达和在用于结合所需抗原/靶标和/或表位的分析中或在用于在体内或体外(包括离体样品/制备物)情况中测试功能结果的分析中测试抗体或抗体衍生分子或者分子文库来鉴别。公布的报告已经描述了识别区域用于追踪在表达文库中使用的获自B细胞库的抗体序列的供体来源的用途(例如，Kashyap AK，Steel J，Oner AF等，Proc Natl Acad Sci U S A，2008，105：5986-91)。本文描述的识别区域技术特别地提供了对于这种识别区域应用的有利改进。本发明1)提供了用于追踪不仅各供体而且用于重链和轻链的同源配对的各供体的B细胞的手段；2)提供了回溯到原始B细胞样品以获取更多样品用于克隆和/或测试的手段；3)提供了追踪重链和轻链源而无论表达文库内的非-同源组合配对的手段；4)提供了在多轮的选择-富集中追踪重链和轻链源的手段(例如，当在体外合并选择过程中监测序列进化时，如Ravn U，Gueneau F，Baerlocher L等，Nucleic Acids Res，2010， 38：e193)。

B细胞免疫应答库中最常表现的重链或轻链序列的鉴别及基于单个链的等级次序频率将重链和轻链对组合已证明是鉴别一些候选抗体的可行方式，尽管存在着在以这种方式进行时同源对信息未保持在下一代序列分析中的事实(Reddy ST，Ge X，Miklos AE等，Nat Biotechnol，2010，28：965-9)。本发明也允许这种类型的频率分析技术，但可以进一步提供使用下一代测序评估库中实际抗体的频率的手段，而不是简单地分离，独立的重链和轻链。

此外，本发明提供了超越频率分析以外的重要应用的三个改进： 1)因为重链和轻链的同源配对可以被追踪，可以鉴别来自免疫应答的实际抗体的发现和在免疫应答中由B细胞产生的实际抗体克隆家族 (克隆包括从相同细胞祖先共进化的特定的同源重链和轻链对且关于亲和力成熟过程内的天然配对的信息在文献中描述的途径在基础上改进以使用下一代测序分析免疫应答[例如，Wu X，Yang ZY，Li Y， Hogerkorp CM等，Science，2010，329：856-61])；2)识别区域提供了最小化或甚至消除下一代测序平台共同的测序错误对序列分析的影响 (参见，例如，一般材料和方法章节中的“其它测序数据分析选项” 小节)；和3)识别区域提供了在单一细胞水平连结和追踪区表达的≥2 个序列的能力。

对于那些已鉴别为具有所需的对抗原、靶标或表位的结合性能的或具有所需功能效应的候选抗体，来自相应克隆家族的更多抗体可以克隆和表达(参见，例如一般材料和方法章节)以测试相似的但潜在地更佳的抗体或在结合或功能性质方面相似但含有对于最终产品特征重要的其它差异的抗体的存在。

对于其中候选者从展示表达文库鉴别的情况，识别区域可以提供通过识别不是在筛选富集中选择的而是含有鉴别的候选者的识别区域且因此源自作为文库种子的相同的原始重链和/或轻链而鉴别具有与候选者潜在相似的序列的抗体。在体外选择轮次中丧失但与选择的候选抗体相似的抗体可以恢复或“拯救”用于作为潜在候选者进行进一步分析。这样的拯救可以消除表达或分析系统中的偏向的影响，这种偏向可能遗漏有用的和功能性的抗体(Ravn U，Gueneau F， Baerlocher L等，Nucleic Acids Res，2010，38：e193)。

一旦具有所需结合和/或功能性质的候选者被鉴别，它们随后可以继续进行相关分析和基于所需的下游产品特征的其它评估。对于意图用于被动免疫中的治疗性抗体，候选者继续用于分析和临床前测试模型以确定用于人体中的临床测试或用于动物健康中的最佳候选者，包括，但不限于如稳定性和凝聚的性能的评估、制剂和给药简易性、蛋白质表达和生产、物种选择性、药理学、药代动力学、安全性和毒性、吸收、代谢和靶-抗体周围率以及免疫原性[参见，例如，Lynch CM，Hart BW和Grewal IS，MAbs，2009，1：2-11；Chapman K，Pullen N，Coney L等，mAbs，2009，1，505-516；S.Dübel，Handbook ofTherapeutic Antibodies：Technologies，Emerging Developments and ApprovedTherapeutics(John Wiley＆Sons，2010)；Therapeutic Monoclonal Antibodies：FromBench to Clinic，(Z.An ed.，John Wiley ＆Sons，2009)Antibody Engineering(Kontermann RE and Dübel S编辑， Springer，第2版)]，因此，选择许多候选者是因为其中大多数对于需要在人体测试前评估的许多性能中的至少一种来说不足以用于人体测试(即损耗)。例如，如上所述，克隆家族可以挖掘与早已鉴定的候选者相似的但可能携带相对于在临床前工作中评估的一种或多种性质的差异的候选者。可能需要特定的抗体工程化策略以用于优化特定性能[Antibody Engineering(Kontermann RE和Dübel S编辑，Springer，第2版)]。

对于诊断，本发明可以用于鉴别通过感染或用于检测感染剂的疫苗接种产生的抗体、TCR和克隆家族(Selvarajah S，Chatterji U， Kuhn R等，2012，6：29-37；Berry JD，Vet J，2005，170：193-211)，以及用于任何非感染性疾病、病理状态或医学处理或治疗。这种的抗体、 TCR和/或克隆家族可以提供对于生物标志物的有用的探针或提供关于人或动物的疾病状态或治疗效果的免疫系统信息。如此，特定的抗体或TCR或者任一免疫受体类别的特定克隆家族可以提供用于诊断工具和个性化医疗的功用。在用于诊断的另一应用中，已知疾病或治疗反应标志物可以用作免疫原以对从其中收获B细胞以鉴别抗体的小鼠或其它动物进行免疫(参见，例如，一般材料和方法章节)，所述抗体针对随后可用于诊断测试如ELISA或其它免疫分析中的生物标志物(Selvarajah S，Chatterji U，Kuhn R等，2012，6：29-37)。一旦鉴别为具有潜在的诊断功用，候选抗体、TCR和/或克隆家族可继续用于分析、模型和可能的与诊断产品的所需特征相关的试验中[Berry JD，Vet J，2005，170：193-211；Diagnostic and Therapeutic Antibodies in Methods in MolecularMedicine，Vol.40(George AJT和Urch CE编辑.， Humana Press)；Antibody Engineering(Kontermann RE和Dübel S编辑， Springer，第2版)；Colwill K，Renewable ProteinBinder Working Group，和S，Nat Methods，2011，8：551-8；Pershad K，Pavlovic JD，S等，Protein Eng Des Sel，2010，23：279-88.]。可能需要采用特定的抗体工程化策略以优化某些性能[Antibody Engineering(Kontermann RE和DübelS编辑，Springer，第2版)]。

对于研究工具抗体，例如，如上所述鉴别的抗体可以继续用于测试它们如何在该研究工具抗体预期所用的研究应用中执行(例如，免疫沉淀、免疫印迹、免疫染色和组织学、免疫亲和纯化、捕获-和夹心-和检测免疫分析；例如，如Antibodies：A LaboratoryManual，E Harlow和D Lane(Cold Spring Harbor Laboratory Press，1988)中所述的)。验证标准将基于最终的预期研究用途(Colwill K，Renewable Protein Binder WorkingGroup，和S，Nat Methods，2011， 8：551-8；Pershad K，Pavlovic JD，S等，Protein Eng Des Sel， 2010，23：279-88)。可能需要采用特定的抗体工程化策略来优化某些性能[Antibody Engineering(Kontermann RE和Dübel S编辑.，Springer，第2版)]。

用于疫苗发现和开发的应用

本发明可以用于针对人或动物中的疫苗激发鉴别抗体、TCR和这些免疫类别中各类别的克隆家族。特定的抗体可以用作探针以鉴别被抗体识别的疫苗成分及用作探针的抗体所属的克隆家族。关于抗体和克隆家族的这一信息可以用于进行关于靶向疫苗的特定抗原和/或表位的免疫应答的比例或强度。对于不同疫苗成分的抗体免疫应答的评估可以补充所收集的关于对于疫苗的伴随TCR库应答的信息(参见，例如，一般材料和方法章节中“对于其它类型”和“其它免疫球蛋白重链和T细胞受体(TCR)链的PCR”小节)。这一信息随后可以用于理解哪些疫苗成分或哪些疫苗变体或哪种佐剂从人或动物的免疫系统产生了有效或更理想的应答(Haynes BF，Gilbert PB， McElrath MJ等.，N Engl J Med，2012，366：1275-86)。该途径也可用于比较个体或群体对于疫苗的反应。

可进行类似的分析以鉴别和评估响应于实际的病原体而产生的抗体、TCR和克隆家族，且其可能与感兴趣的临床后果如对于感染的保持性反应相关(例如，从严重流感大流行的生存者鉴别抗体， Yu X，Tsibane T，McGraw PA等，Nature，2008，455：532-6或使用广谱HIV-中和血清从HIV-感染的个体鉴别特定抗体，Wu X，Yang ZY， Li Y，Hogerkorp CM等，Science，2010，329：856-61和Walker LM， Phogat SK，Chan-Hui PY等，Science，2009，326：285-9)。这种保护相关性的确认可以与如上所述由疫苗和/或特定成分产生的应答比较且两个数据集可以比较以评估疫苗产生与实际感染情况中看到的所需结果相关的免疫应答。

因此，本发明提供了在人或动物在实际感染激发之前通过抗体和/或TCR库序列分析获得疾病保护和疫苗反应的代理读数的有用手段。一旦克隆家族被确认为结合特定抗体或表位，在其中发现跨库的相同或类似克隆家族的情况中鉴别被其它免疫反应库靶定的抗原或表位而不进行分析是可能的。因此，在其中足够的关于克隆家族的信息和其抗原/表位结合已知的那些情况中(参见，例如，一般材料和方法章节中“表达的人抗体的筛选”小节)，新分析的库的单独序列分析就可提供该库的抗原对于其包含的已知克隆家族的读数。这一应用可以提供监测疫苗临床试验中一个、一些或许多个体的反应和在群体水平上监测一个、一些或许多人的免疫性的感染性疾病关系的有用手段。

此外，与对抗病原体的保护相关的抗体、TCR和克隆家族可用于识别介导对抗抗原的保护性的和/或有效的免疫应答的特定抗原和抗原集(包括已知的新型的抗原)。在有效免疫应答中靶向的抗原的鉴别可用于指导包括在疫苗中的预期在免疫的人或动物中产生保护性的抗体-和TCR-介导反应的抗原的选择。

在分析中不结合已知抗原的抗体、TCR和克隆家族变成用于鉴别抗体和/或TCR针对其提供保护的潜在新抗原和/或病原体的表位的候选者。已知不结合早先已知的抗原的抗体可以与免疫分离和质谱结合用作探针以鉴别先前未鉴别的抗原或表位(Zhu YZ，CaiCS， Zhang W等，PLoS One，2010，5：e13915；且参见，例如，一般材料和方法章节中的“用源自葡萄球菌感染的患者的抗体免疫分离葡萄球菌抗原”和“肽的质谱鉴别”)。这类新抗原或表位可以用作预期在免疫的人或动物中产生保护性的抗体-和TCR-介导反应或导致其产生的疫苗成分。

除了帮助开发针对微生物抗原的疫苗外，抗体、TCR和克隆家族还可以用于开发肿瘤疫苗。发生针对癌症或癌前细胞的免疫反应的人或动物可以产生可用于鉴别单个抗原的抗原组合的抗体、TCR 和克隆家族，且克隆家族也可以用于开发肿瘤疫苗。发生针对癌症或前癌细胞的免疫应答的人或动物可以产生可用于鉴别可整合到癌症的预防或治疗疫苗中的单个抗原和抗原组合的抗体、TCR和克隆家族。

用于产生一个或多个目标多核苷酸的方法

在一些方面，方法包括获得包含多个与从一个或多个获得的多个样品相关的cDNA的cDNA文库，其中各cDNA与多个样品中的单一样品相关，且其中与各个样品相关的各cDNA存在于单独的容器中；将接合体分子添加到与各个样品相关的cDNA上，其中接合体分子包含样品识别区域和接合体区域，其中样品识别区域与接合体区域偶联，且其中各接合体分子的样品识别区域的序列不同于添加到文库中各cDNA上的其它接合体分子的样品识别区域的序列；和使接合体区域连接到文库中各cDNA上以产生一个或多个目标多核苷酸。

在一些方面，获得cDNA文库包括获得多个样品和处理样品以制备cDNA文库。在一些方面，获得cDNA文库包括直接或间接地从已经处理多个样品以制备cDNA文库的第三方接收cDNA文库。

在一些方面，接合体分子进一步包含通用引物区域，其中通用引物区域的3’端与样品识别区域的5’端偶联。在一些方面，各cDNA 区域包含与cDNA多核苷酸杂交的mRNA多核苷酸。

在一些方面，各样品包含细胞。在一些方面，细胞是B细胞。在一些方面，B细胞是浆母细胞、记忆B细胞或浆细胞。在一些方面，各样品包含多个细胞。

在一些方面，各接合体区域通过结合，例如G：C结合连接到各 cDNA上。

在一些方面，接合体分子是单链的，且进一步包括通过允许酶将接合体分子形成为双链而将接合体分子并入到各cDNA中。在一些方面，接合体分子并入到各cDNA中以通过MMLV H^-反转录酶产生目标多核苷酸。

在一些方面，方法可以包括扩增步骤如PCR和其它本领域中通常已知的扩增反应。

用于连接和条码标记目标多核苷酸的方法

在一些方面，方法包括两个目标多核苷酸序列的连接，例如来自于单一样品的抗体轻链(LC)的抗体重链(HC)，并提供一个或多个条码或序列识别序列。在这一方面，提供了目标多核苷酸序列之间的物理连接以及一个或多个条码以提供标识符，从而允许确定源自特定来源或样品的多核苷酸序列，例如，单一细胞、样品孔、单一样品等。单一样品可以包含一个或多个B-谱系细胞或其它细胞类型。连接两个目标多核苷酸序列的方法的实例是本领域中已知的，例如 WO 99/16904、WO 93/03151和US 7,749,697，其通过引入并入本文。与连接的多核苷酸序列中条码的使用相关的其它优势包括帮助高通量测序和将序列映射回原始样品，以使得其可以再测序和PCR克隆以表达多核苷酸序列，例如HC和LC免疫球蛋白多核苷酸。一些高通量测序技术表现出1-10+％的测序误差率，且条码的使用使得能够重复模板测序以利于生物信息学误差校正。这对于区分来自基因变异的测序误差特别重要，如在免疫球蛋白多核苷酸中的那些。具体地，可能难以确定是否密切相关的序列是事实上不同的序列或是否它们反而代表由测序误差产生的人工制品。条码通过实现单个模板重复测序的分析因而能够实现测序误差校正，因此提供序列是否相对于来自测序误差的人工制品不同的确定。在一个实施方式中，多核苷酸序列是由于体细胞超变而相异的免疫球蛋白HC和LC序列，而且仅相差1个核苷酸。

关于这一点，通常获得如图15中所示的物理连接和条码标记的结构。图15显示了两个核酸片段A和B(例如，两个cDNA)的物理连接。条码(BC)附接于连接A和B的接头的任一末端或接头中。 A和B的这一物理连接以及条码的添加通过多种方式中的任一种完成，包括通过连接反应、重组、扩增或重叠-延伸或者这些方法的组合实现，如下面更详细地描述的。任选地，另外的条码可以添加到如图15所示的结构上以提供条码标记的化合物而能够使用较少数目的条码实现多个连接的多核苷酸的测序。并且，可以理解，根据用于连接两个核酸片段的特定策略，可以获得相关于正义和反义定向的片段的任何相关定向，即，片段(如cDNA)可以头至尾、头至头或尾至头结合。

条码可以使用本领域中已知的方法在物理连接之前、期间或之后添加到多核苷酸序列上。这些方法包括，但不限于，例如连接方法(如条码接合体的平端连接)，及通过相容性末端(如通过同聚加尾产生的那些)的退火和连接、接头的限制性酶消化或通过反转录酶的cDNA 3’加尾。条码也可以使用携带条码序列的适当引物在扩增反应中添加。条码也可以使用含条码序列的适当引物在反转录反应中添加。条码也可以通过重叠-延伸尾或其它方法并入到将目标基因连接到一起的寡核苷酸中而添加，以使得它们位于两个目标基因之间。因此，使用这些方法，条码可以整合到物理连接的多核苷酸序列的末端上或接合两个目标多核苷酸序列的接头序列中。

在一个实施方式中，连接是通过使用重叠-延伸完成的(参见图 16)。一般地，重叠延伸尾是添加到待接合的目标多核苷酸序列上的互补序列。附接到目标多核苷酸分子上的重叠-延伸尾的退火允许它们被连接(参见图17、18、19和20)。如以下所述的，重叠-延伸尾可以通过多种公知的方法添加，包括，但不限于多核苷酸合成反应，如核酸扩增和反转录、连接反应和重组。因为可用于实现连接的方法的多样性，将认识到的是，可以相对于正义和反义定向获得多核苷酸片段的不同相对定向，即片段(例如，抗体重链和轻链) 可以头至尾、头至头或尾至头接合。

在一个实施方式中，重叠-延伸尾能够实现在多核苷酸合成反应中产生的多核苷酸序列的连接。例如，重叠延伸尾可以在多核苷酸合成反应如扩增或反转录反应的过程中通过使用携带重叠-延伸尾的引物引入。或者，可以使用连接反应。如图17、18、19和20中所示，在互补的重叠延伸尾退火后，DNA沿5’-3’的方向在多核苷酸合成反应(如PCR)的延伸阶段中填充以产生具有物理接合的两个目标多核苷酸的双链多核苷酸。

在一些实施方式中，重叠-延伸RT-PCR方法允许序列与在单管中进行反应的同时连接，因此避免了中间纯化的需要。在一些实施方式中，重叠延伸尾包含条码序列。

图17总体示出了使用重叠-延伸尾接合编码抗体轻链和重链的多核苷酸序列和提供至少一个条码的一个实例。可用于连接两个目标多核苷酸序列的其它方法如下讨论。在这一实例中，在进行多核苷酸合成(例如，反转录)后，使用含有条码、任选的测序引物位点和任选的限制性位点(RE1)的LC基因特异性PCR引物允许这些元件添加到所得的PCR产物的末端。显示了具有延伸重叠的和编码任选的限制性位点(RE3)的对于LC(在一个实施方式中，V_L区域)和 HC(在一个实施方式中，V_H区域)特异性的引物。在一个实施方式中，LC包含具有或不具有短的恒定区片段的重排VJ，和HC包含具有或不具有短的重链恒定区片段的重排V(D)J。在一个实施方式中，重叠-延伸引物也包含条码序列。也使用含有任选的RE2的对于HC 特异性的反向引物。由于使用这些引物进行扩增，生成在一端具有条码的具有所示的连接结构的核酸。来自在单一样品中进行的反应的产物可以容易地集成到本文中公开的其它工作流程中。例如，任选的第二条码可以添加并结合第一条码使用以进一步实现多重复用，从而使用相对最少数目的条码鉴别大量的序列。对于测序，单一条码可能是足够的。

图17中所示的一般方案的变化是清楚的，其实例在本文中阐明。例如，条码可以放置在最终产物的另一端或在两端或在多核苷酸之间。此外，条码可以包括作为延伸重叠的部分(例如，在RE3的另一侧上或者条码可以被RE3序列分割)。

LC(包括V_L序列)和HC(包括V_H序列)序列可以利用寡dT 或基因特异性引物通过mRN的反转录产生。在一个实施方式中，反转录和后续的扩增反应同时进行，即RT-PCR反应，以得到最终产物。当使用反转录时，延伸重叠区域以及其它元件如限制性位点、测序引物位点或通用序列可以通过包含一个或多个G残基的接合体与在如例如图18、19和20中所示的反转录反应中生成的cDNA的3’ 加尾产生的一个、两个、三个或更多个C残基退火而添加。通过反转录酶的类别转换允许延伸重叠区域(和其它序列元件)添加到 cDNA上。例如，如图18中所示，当利用反转录酶的3’加尾和模板转换时，第一接合体可以用于添加延伸重叠序列和条码到第一目标多核苷酸上，而具有与第一接合体的重叠-延伸互补的序列的第二接合体可以添加到第二目标cDNA上。互补的延伸重叠序列在后续的核酸合成反应如PCR的过程中退火以接合两个目标多核苷酸。从重叠点的延伸产生双链DNA分子，其中两个目标多核苷酸利用它们之间的条码连接。允许在两个连接的多核苷酸序列之间生成两个内部定位的条码的变型显示在图19和20中。

用于接合或连接目标多核苷酸序列的其它方法包括通过连接反应。在这一实施方式中，用于扩增的引物混合物设计为使得扩增的靶序列可以用适当的限制性酶切割，并且可以进行通过DNA连接的共价连接。在用这种引物混合物扩增后，形成靶序列的相容性末端所需的限制性酶添加到混合物中。然后靶序列用连接酶连接到一起。在限制性酶消化或连接步骤之前不需要PCR产物的纯化，虽然可以进化纯化。

在另一实施方式中，目标多核苷酸序列可以通过重组连接。在这一途径中，扩增的目标多核苷酸序列可以使用相同的重组位点接合。连接通过添加适当的重组酶以促进重组而进行。合适的重组酶系统包括具有多个FRT位点的Flp重组酶、具有多个lox位点的Cre 重组酶、进行attP位点和attB位点之间的重组的整合酶□C31、□- 重组酶-6系统以及Gin-gix系统。通过重组的连接已经对于两个核苷酸序列(与V_L连接的V_H)进行了示例(Chapal，N.等，1997 BioTechniques 23，518-524)，其通过引用并入。

因此，在一个方面，该方法包括使用源自分离的单一细胞或同基因细胞群体的模板通过PCT或RT-PCR扩增来扩增目标核苷酸序列及(1)实现扩增的目标核苷酸序列的连接和(2)添加再一个条码到连接的多核苷酸序列上。该方法包括进行连接产物的另外扩增的步骤以例如添加另外的条码、限制性位点、测序引物位点等等。

在另一个方面，提供了产生来自供体的单一细胞的含条码标记的连接抗体重链和轻链对的文库的方法。这一方面包括提供来自供体的含淋巴细胞的细胞部分，其任选地从所述细胞部分富集特定的淋巴细胞群体。此外，分离的单一细胞群体通过在多个器皿、容器或孔之间分配来自含淋巴细胞的细胞部分或者富集的细胞部分的细胞获得。进行分离的单一细胞群体包含的可变区编码序列的多重分子扩增(例如，多重RT-PCR扩增)，并完成重链和轻链对的连接和条码添加。此外，在不同的实施方式中，方法可以包括两个任选的步骤：在第一步中，单一细胞群体中的单个分离细胞可以在进行多重RT-PCR扩增之前扩增成同基因细胞的群体，从而提供具有同基因细胞群体的多个器皿、容器或孔(一个同基因细胞群体在一个器皿、容器或孔中)。另一个任选步骤包括进行连接的轻链和重链编码序列的另外的扩增。这一另外的扩增步骤可用于简单地增加连接的核酸的量，或者添加第一或第二条码序列或者其它序列元件到连接的核酸上。

在一些方面，多重RT-PCR扩增作为两步骤过程进行(其中反转录(RT)与多重PCR扩增(或可选的多重分子扩增)独立地进行) 或者作为单步骤过程进行(其中RT和多重PCR扩增步骤在一个管中利用相同的引物进行)。

反转录(RT)利用含反转录酶活性的酶进行，从而导致从来自分离的单一细胞的总RNA、mRNA或靶特异性RNA产生cDNA。可以用于反转录的引物包括寡-dT引物、随机六聚物或对于目标核苷酸序列特异性的引物。在一些实施方式中，这样的引物可包含如条码、通用引发位点、限制性位点、测序引物位点等的元件。

两步的多重RT-PCR扩增程序允许在RT步骤中产生的cDNA分配到超过一个容器中，从而允许在进行扩增(如果需要的话)之前储存模板部分。另外，cDNA分配到超过一个管中允许进行源自相同模板的核酸的超过一个多重PCR扩增。这一两步骤途径可以例如用于利用相同的模板扩增和连接在一个管中的重链可变区和κ轻链可变区编码序列和在不同的管中的重链可变区和λ轻链可变区编码序列。单一细胞通常仅表达轻链之一。但是，通常更容易同时进行反应而不是在进行另一反应之前等待所述反应之一的结果。此外，κ 和λ两者的扩增用作内部阴性对照，因为预期仅κ或λ从单一细胞扩增。

在单步骤多重RT-PCR过程中，反转录和多重PCR扩增在相同的器皿、容器或孔中进行。在单步骤中进行反转录和多重PCR需要的所有成分最初添加到器皿、容器或孔中并进行反应。一般地，一旦反应开始，则不需要添加另外的成分。单步骤多重RT-PCR的优点在于它减少甚至进一步产生本发明的条码连接的核苷酸序列所需步骤的数目。当在单一细胞的阵列上进行多重RT-PCR时(其中相同的反应在多个容器中进行)，这是特别有用的。一般地，单步骤多重RT-PCR需要的组合物包含核酸模板、具有反转录酶活性的酶、具有DNA聚合酶活性的酶、脱氧核苷三磷酸混合物(包含dATP、 dCTP、dGTP和dTTP的dNTP混合物)和多重引物混合物。核酸模板优选是源自分离的单一细胞的总RNA或mRNA，其为纯化的形式、或作为细胞的裂解产物或包含在完整细胞中。

在一个方面，所述方法产生连接的和条码标记的目标多核苷酸的文库。在一些方面，多核苷酸文库中的多个多核苷酸组合物可以包含至少2、至少3、至少10、至少30、至少100、至少300、至少 1000、至少3000、至少10,000、至少30,000、至少100,000、至少 300,000、至少1,000,000、至少3,000,000、至少10,000,000、至少 30,000,000或更多个成员。在其它方面，多核苷酸文库中的多个多核苷酸组合物可以包含细胞样品的全转录组的至少2、至少3、至少10、至少30、至少100、至少300、至少1000、至少3000、至少10,000、至少30,000或更多个基因。在其它方面，多核苷酸文库中的多个多核苷酸组合物包含至少1、至少2、至少3、至少10、至少30、至少 100、至少300、至少1000、至少10,000、至少100,000、至少1,000,000、至少10,000,000、至少1,000,000,000或更多个存在于个体的血液中的不同抗体种类。这些抗体种类可以由浆母细胞、浆细胞、记忆B 细胞、长寿浆细胞、原始B细胞、其它B谱系细胞或其组合表达。

通过上述公开的方法产生的连接的和条码标记的多核苷酸组合物可以有利地进行高通量的多重测序，优选地使用本文中描述的 NextGen测序平台。

通过上述公开的方法产生的连接的和条码标记的多核苷酸组合物也可以用于如本文中所公开的克隆、产生目标多核苷酸和筛选。

产生一个或多个用于测序的目标多核苷酸的方法

在一些方面，所述方法包括获得包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含通用引物区域、样品识别区域、接合体区域和源自单一样品的扩增子区域，其中通用引物区域的序列在多个多核苷酸的各多核苷酸上相同，且其中源自第一单一样品的各多核苷酸的样品识别区域的序列不同于源自与第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列；并用一组引物扩增多核苷酸文库以产生用于测序的一个或多个目标多核苷酸，其中用于测序的一个或多个目标多核苷酸包含第一测序区域、第一板识别区域、通用引物区域、样品识别区域、接合体区域、源自单一样品的扩增子区域和第二测序区域。

在一些方面，方法进一步包括测序一个或多个目标多核苷酸。在一些方面，测序是454测序。

在一些方面，测序包括较长的测序阅读片段(sequencing read)以使得正向和反向测序阅读充分重叠以能够重构例如抗体轻链(LC)的整个大约600个碱基对(bp)序列(其中精确的序列长度可取决于5’ 非翻译区(UTR)的长度)和重链(HC)的大约700bp序列。因此，在一些方面，可以使用可产生至少350-400bp的测序阅读片段并因此获得包括用于序列组装的重叠的任何测序技术，且能够获得600-700+ bp的阅读片段的测序技术允许仅使用正向引物测序(从5’端测序)。

可以使用本领域技术人员已知的任何用于核酸测序的技术。 DNA测序技术包括使用标记的终止子或引物的典型的双脱氧测序反应(Sanger方法)和垂直板型或毛细管电泳的凝胶分离。在优选的实施方式中，下一代(NextGen)测序平台有利地用于实施本发明。NextGen测序是指多种后经典Sanger型测序方法中的任何一种，其能够同时地高通量、多重测序大量样品。当前的NextGen测序平台，如下面更详细地描述的那些，能够在同一测序操作中从多个不同的核酸产生阅读片段。通量是变化的，每次具有1亿碱基至6千亿碱基，且由于技术的改进，通量快速提高。不同NextGen测序平台的操作原理也发生变化，且包括：使用可逆地末端标记的核苷酸通过合成测序、焦磷酸测序、454测序、与标记寡核苷酸探针的文库的等位基因特异性杂交、使用与标记的克隆的文库等位基因特异性杂交通过合成测序并接着连接、在聚合步骤过程中标记核苷酸并入的实时监测、聚合酶克隆测序、单分子实时测序和SOLiD测序。测序使用聚合酶或连接酶通过顺序或单一延伸反应以及通过使用探针文库的单一或顺序杂交来演示。这些反应在许多克隆序列上平行地进行，包括在超过1亿序列的当前商用应用中平行地演示。这些测序途径因此可以用于研究T-细胞受体(TCR)和/或B-细胞受体(BCR)及其它目标序列的库。

测序技术可以产生每次操作至少1000个阅读片段、每次操作至少10,000个阅读片段、每次操作至少100,000个阅读片段、每次操作至少500,000个阅读片段或每次操作至少1,000,000个阅读片段。

测序技术可以产生每阅读片段约30bp、约40bp、约50bp、约 60bp、约70bp、约80bp、约90bp、约100bp、约110、约120bp、约150bp、约200bp、约250bp、约300bp、约350bp、约400bp、约450bp、约500bp、约550bp、约600bp、约650bp或约700bp 或更多bp。

测序技术可以产生每阅读片段至少30、40、50、60、70、80、 90、100、110、120、150、200、250、300、350、400、450、500、 550、600、650、700或更多个核苷酸。

可以使用的测序技术，例如Helicos True Single Molecule Sequencing(tSMS)(Harris T.D.等(2008)Science 320：106-109)。在 tSMS技术中，DNA样品切割成大约100-200核苷酸的链，且聚A 序列添加到各DNA链的3′端。各链通过添加荧光标记的腺嘌呤核苷酸进行标记。DNA链然后固定到流动池上，流动池含有固定在流动池表面上的数百万寡聚-T捕获位点。模板可以为约1亿模板/cm²的密度。流动池然后加载到仪器中，例如HeliScope^TM测序仪，且激光照射流动池的表面，从而揭示各模板的位置。CCD相机可以映射流动池表面上模板的位置。然后切割并洗掉模板荧光标记。测序反应通过引入DNA聚合酶和荧光标记的核苷酸而开始。寡聚-T核酸用作引物。聚合酶以模板指定的方式将标记的核苷酸合并到引物上。除去聚合酶和未合并的核苷酸。已经指导荧光标记核苷酸的并入的模板通过流动池表面的成像来检测。在成像后，切割步骤移除荧光标记，且揽胜其它的荧光标记核苷酸重复该过程直到获得所需的阅读片段长度。序列信息用各个核苷酸添加步骤收集。

可以使用的DNA测序技术的另一实例是454测序(Roche) (Margulies，M等，2005，Nature，437，376-380)。454测序包括两个步骤。在第一步骤中，DNA剪切成约300-800碱基对的片段，且片段平端化。然后寡核苷酸接合体连接到片段的末端上。接合体用作用于片段扩增和测序的引物。片段可以使用例如含5′-生物素标签的接合体B连接到DNA捕获株例如抗生蛋白链菌素涂覆的珠上。连接到珠上的片段在油-水乳液的小滴内PCR扩增。结果是在各珠上多个拷贝的克隆扩增DNA片段。在第二步骤上，珠捕获在孔(皮大小的) 中。焦磷酸测序在各DNA片段上平行地进行。一个或多个核苷酸的添加产生通过测序仪中的CCD相机记录的光信号。信号强度与并入的核苷酸的数目成比例。

焦磷酸测序利用在核苷酸添加时释放的焦磷酸(PPi)。PPi在腺苷 5’磷酰硫酸存在下通过ATP硫酸化酶转化为ATP。萤光素酶利用 ATP将萤光素转化为氧化萤光素，且这一反应产生检测和分析的光。

可以使用的DNA测序技术的另一实例是SOLiD技术(Applied Biosystems)。在SOLiD测序中，基因组DNA剪切成片段，且接合体连接到片段的5′和3′端上以产生片段文库。或者，内部接合体可以通过将接合体连接到片段的5′和3′端上、使片段环化、消化环化的片段以产生内部接合体并将接合体连接到所得片段的5′和3′端上以产生末端配对文库(mate-paired library)而引入。接着，克隆珠群体在含珠、引物、模板和PCR成分的微型播放器中制备。在PCR后，模板退火且珠富集以分离具有延伸的模板的珠。在选择的珠上的模板进行允许与玻璃载玻片粘结的3′修饰。

序列可以通过具有由荧光团识别的中央确定碱基(或碱基对) 的部分随机寡核苷酸的顺序杂交和连接测定。在记录颜色后。连接的寡核苷酸被切割和去除，且随后重复该过程。

可以使用的DNA测序技术的另一实例是SOLEXA测序 (Illumina)。SOLEXA测序是基于使用折回PCR和锚定的引物在固体表面上的DNA扩增。基因组DNA被断裂，且接合体添加到片段的 5′和3′端上。连接到流动池通道表面上的DNA片段被延伸和桥接扩增。片段变成双链的，且双链分子退火。多个循环的固相扩增接着退火可以在流动池的各通道中产生几百万个约1,000拷贝的相同模板的单链DNA分子簇。引物、DNA聚合酶和四种荧光团标记的可逆封端核酸用于进行连续的测序。在核苷酸并入后，激光用于激发荧光团，且获取图像和记录第一碱基的身份。除去各并入的碱基的 3′终端和荧光团并重复并入、检测和识别的步骤。

可以使用的测序技术的另一实例包括Pacific Biosciences的单分子、实时(SMRT^TM)技术。在SMRT中，四种碱基中的各种连接到四种不同荧光染料之一上。这些染料进行磷连接。单一DNA聚合酶使用模板单链DNA的单一分子在零模波导(ZMW)的底部固定。ZMW是使得能够针对快速扩散进出ZMW(以微秒计)的荧光核苷酸的背景观察单一核苷酸通过DNA聚合酶的并入。它花几毫秒将核苷酸并入生长链中。在此期间，荧光标记被激发并产生荧光信号，且切除荧光标签。相应的染料荧光的检测哪种碱基并入。重复该过程。

可以使用的测序技术的另一实例是纳米孔测序(Soni G V和 Meller A.(2007)Clin Chem 53：1996-2001)。纳米孔是直径约1纳米的小孔。将纳米孔浸入电导液中和施加跨纳米孔的电位产生由于离子通过纳米孔的传导而导致的轻微电流。流动的电流的量对于纳米孔的尺寸是敏感的。随着DNA分子经过纳米孔，DNA分子上的各核苷酸阻塞纳米孔到不同的程度。因此，在DNA分子经过纳米孔时流过纳米孔的电流的变化代表DNA序列的阅读。

可以使用的测序技术的另一实例涉及使用化学敏感场效应晶体管(chemFET)阵列以测序DNA(例如，如在美国专利申请公开No. 20090026082中所述的)。在该技术的一个实例中，DNA分子可以置于反应室中，且模板分子可以与结合到聚合酶上的测序引物杂交。一个或多个三磷酸在测序引物的3’端并入到新核酸链中可以通过由 chemFET导致的电流变化检测。阵列可以具有多个chemFET传感器。在另一实例中，单一核酸可以连接到珠上，和核酸可以在珠上扩增，并且单个的珠可以转移到chemFET阵列上的单个反应室，其中各室具有chemFET传感器，且核酸可以被测序。

可以使用的测序技术的另一实例涉及使用电子显微镜 (Moudrianakis E.N.和Beer M.Proc Natl Acad Sci USA.1965March； 53：564-71)。在该技术的一个实例中，单个DNA分子使用金属标记进行标记，该金属标记可使用电子显微镜区分。这些分子然后在平面上伸展并使用电子显微镜成像以测定序列。

在一些方面，获得多核苷酸文库包括在实验室中制备多核苷酸文库。在一些方面，获得多核苷酸文库包括直接或间接地从已制备多核苷酸文库的第三方接收多核苷酸文库。

用于分析测序数据的方法

在一些方面，方法包含获得与多个多核苷酸相关的数据集，其中该数据集包含多个多核苷酸的测序数据，其中多个多核苷酸中的各多核苷酸包含样品识别区域，且其中各多核苷酸上的各样品识别区域对于单一样品是独特的，其中源自第一单一样品的各多核苷酸的样品识别区域的序列不同于源自于与第一单一样品不同的一个或多个样品的多个多核苷酸中其它多核苷酸的样品识别区域的序列；并分析数据集以将具有相同样品识别区域的多核苷酸匹配在一起，其中匹配表示多核苷酸来源于相同的样品。

在一些方面，多个多核苷酸中各多核苷酸还包含第一板识别区域，其中各多核苷酸上各第一板识别区域和样品识别区域的各种组合对于单一样品是独特的，其中源自第一组单一样品的各多核苷酸的第一板识别区域的序列不同于源自与第一组单一样品不同的一个或多个单一样品组的多个多核苷酸中其它多核苷酸的第一板识别区域的序列，且进一步包括分析数据集以将具有相同第一板识别区域和相同样品识别区域的多核苷酸匹配在一起，其中两个区域之间的匹配表示多核苷酸来源于相同的样品。

在一些方面，两个多核苷酸都包括可变区。在一些方面，一个多核苷酸包括可变区。在一些方面，没有一个多核苷酸包括可变区。

在一些方面，获得数据集包括获得多个多核苷酸并测序多个多核苷酸以通过试验测定该数据集。在一些方面，获得数据集包括直接或间接地从已测序多个多核苷酸以通过试验测定数据集的第三方接收数据集。在一些方面，数据集存储在电子存储介质上。在一些方面，数据集在互联网上传递。

在一些方面，方法在计算机上执行，例如，其是计算机执行的方法。

在一些方面，单一样品是单一细胞。在一些方面，单一样品包含单一细胞。在一些方面，单一样品包含单一B细胞。在一些方面，单一样品包含多个B细胞。在一些方面，单一样品包含单一B细胞和一个或多个其它细胞。

在一些方面，由测序(例如，454测序)产生的数据可以通过 454GS FLX数据分析软件进行分析，且具有低质量评分的序列可以过滤掉。良好质量的序列然后可以通过使用Python中的脚本在序列使用生物信息学方法(例如通过使用Newbler)组装之前按照其样品识别区域(且在一些实施方式中，其样品识别区域和板识别区域的组合)细分。因为反向阅读片段在一些方面中可以仅具有第二板识别区域，因此有可能在来自不同细胞的序列的正向和反向阅读片段之间发生序列组装。为避免这一潜在的问题，正向和反向阅读片段两者的重链和轻链V(D)J使用可以首先使用HighV-QUEST确定。然后序列可以在组装之前按照其V(D)J使用进一步分组。在一些方面，序列组装可能不耐受核苷酸错配，从而防止来自共有相同V(D)J使用的不同细胞的正向和反向阅读片段的组装。在一些方面，序列然后可以通过使用计算机程序基于其V(D)J使用聚类在一起。

在一些方面，生物信息学方法可以用于鉴别形成克隆家族和亚家族的序列的组，并因而鉴别目标免疫球蛋白序列。这样的生物信息学方法包括测量序列相似性。这样的生物信息学方法可以用于鉴别源自单个人、源自一个或多个人、源自具有病症的一个或多个人或源自具有不同病症的一个或多个人的目标序列。

在一些方面，相关免疫球蛋白重链和/或轻链序列可以通过免疫球蛋白重链和/或轻链V(D)J序列之间同源性的系统发生计算分析来鉴别。在一些方面，代表单个V、D和/或J基因片段和/或其组合的序列和/或源自免疫球蛋白重链和/或轻链的其它序列的标准分类方法(即聚类)可以用于鉴别克隆家族或亚家族(例如，通过使用 ClustalX)。

如本文中所用的，“克隆家族”是指各具有V、D和/或J区域的多个免疫球蛋白序列，其中各序列是具有V、D和/或J区域的相同种系免疫球蛋白序列的突变形式或具有V、D和/或J区域的种系免疫球蛋白序列。在一些方面，所述多个免疫球蛋白序列是多个重链序列。在一些方面，所述多个免疫球蛋白序列是多个轻链序列。在一些方面，所述多个免疫球蛋白序列是多个配对的重链和轻链序列。在一些方面，各序列具有V、D和J区域。在一些方面，各序列具有 V和D区域。在一些方面，各序列具有D和J区域。在一些方面，各序列具有V和J区域。在一些方面，各序列具有V区域。在一些方面，各序列具有D区域。在一些方面，各序列具有J区域。在一些方面，一个或多个突变位于V、D和/或J区域内。在一些方面，一个或多个突变位于V、D和/或J区域之间。

在一些方面，其重链全部使用相同V和J基因片段的一组抗体是克隆家族。在一些方面，其重链全部使用相同V和J基因片段且其P/N核苷酸和D核苷酸长度的总和为相同的长度的一组抗体是克隆家族。在一些方面，其重链全部使用相同的V、D和J基因片段的一组抗体是克隆家族。在一些方面，其重链全部使用相同的V、D 和J基因片段且其V和D基因片段之间的P/N核苷酸为相同的长度且其D和J基因片段之间的P/N核苷酸为相同的长度的一组抗体是克隆家族。在一些方面，其重链全部使用相同的V和J基因片段且其轻链全部使用相同的V和J基因片段的一组抗体是克隆家族。在一些方面，其重链全部使用相同的V和J基因片段且其P/N核苷酸和D核苷酸长度的总和为相同长度，并且其轻链全部使用相同的V和J基因片段且其P/N核苷酸为相同的长度的一组抗体是克隆家族。在一些方面，其重链全部使用相同的V、D和J基因片段且其轻链全部使用相同的V和J基因片段的一组抗体是克隆家族。在一些方面，其重链全部使用相同的V、D和J基因片段且V和D基因片段之间的P/N核苷酸为相同的长度且其D和J基因片段之间的P/N核苷酸为相同的长度。并且其轻链全部使用相同的V和J基因片段且其V 和J基因片段之间的P/N核苷酸为相同的长度的一组抗体是克隆家族。

用于构建克隆家族的方法

T细胞受体(TCR)或免疫球蛋白可变基因查询序列的V、D和J 使用可以通过鉴别最有可能产生该序列的种系V、D(如果可用的话) 和J基因片段确定。D片段存在于一些TCR和免疫球蛋白序列(例如，TCRβ、TCRδ和抗体重链序列)中但不存在于其它序列(例如， TCRα、TCRγ和抗体轻链序列)中。以下描述包括D片段，但相同的途径可应用于缺乏D片段的可变序列。在所有情况中，V(D)J使用的确定使用种系V、D和J基因片段序列的参考数据库如IMGT/GENE-DB(Giudicelli V，Chaume D，Lefranc MP. IMGT/GENE-DB：a comprehensivedatabase for human and mouse immunoglobulin and T cell receptor genes.NucleicAcids Res.2005Jan 1；33(Database issue)：D256-61.)。

在确定V(D)J使用的一种途径中，查询序列独立地与各V、D 和J种系基因片段顺次地比较且各型(V、D或J)的最相似基因片段选择为最可能已产生该查询序列。V-QUEST和High V-QUEST是这一途径的实例(Giudicelli V，Chaume D，Lefranc MP.IMGT/V-QUEST，an integrated software program for immunoglobulin and T cell receptor V-J andV-D-J rearrangement analysis.Nucleic Acids Res.2004Jul 1；32(Web Serverissue)：W435-40.；Brochet X，Lefranc MP，Giudicelli V. IMGT/V-QUEST：the highlycustomiZed and integrated system for IG and TR standardized V-J and V-D-Jsequence analysis.Nucleic Acids Res.2008Jul 1；36(Web Server issue)：W503-8.)。V-QUEST首先产生查询序列和各V基因片段序列的逐对比对。然后它产生V片段的推导 3’端下游查询序列区域和各J基因片段序列的逐对比对。如果D片段存在，则V-QUEST产生在匹配V和J片段的区域之间存在的查询序列区域与各D片段序列的逐对比对。V-QUEST也可以推断V-D、 V-J和/或D-J接合区的边界。

在确定V(D)J使用的另一途径中，最可能已产生查询序列的种系V、D和J片段的组合在单一步骤中而不是在分别用于V、D和J 的三个独立步骤中鉴别。这一途径具有一种类型的片段(V、D或J) 的鉴别可以考虑关于与另两种类型的片段的潜在匹配的信息的优势。例如，最佳匹配的D片段可能取决于考虑哪种V片段匹配。SoDA 是这一途径的实例(VolpeJM，Cowell LG，Kepler TB.SoDA： implementation of a 3D alignment algorithm forinference of antigen receptor recombinations.Bioinformatics.2006Feb15；22(4)：438-44.)。 SoDA首先选择候选V、D和J片段。它产生查询序列和各V基因片段序列的逐对局部比对，且然后仅保持满足评分域值的比对的V片段。对于J片段和D片段重复这些步骤。然后对于各可能的候选V、 D和J片段的组合产生最佳比对。比对使用广泛用于序列比对中的相同的一般动态编程方式产生(Needleman，S.B.和Wunsch，C.D.(1970)A general methodapplicable to the search for similarities in the amino acid sequence of twoproteins.J.Mol.Biol.，48,443-453.)，但允许在V-D、 V-J和/或D-J接合区插入另外的核苷酸。这样的插入通常发生在 V(D)J重组的生物学过程中。在通过动态编程的序列比对中，通常存在与插入、缺失和错配相关的罚分。但是，在确定V(D)J使用的这一途径中，对于片段之间接合区处核苷酸的插入不应用罚分。选择产生最高评分的比对的V(D)J组合以表示查询序列的V(D)J使用。这一途径也可以鉴别接合序列区域的边界。

从克隆家族和亚克隆家族，多种途径可用于选择特定的克隆用于表达其编码的配对重链和轻链免疫球蛋白基因和表征其结合特性。在一些方面，来自克隆家族和/或克隆亚家族的最高频率克隆以及来自克隆家族和克隆亚家族的其它代表性克隆进行表达和其结合特性的筛选。克隆也可以从所有克隆、从所有或选择的克隆家族和/ 或从所有或选择的克隆亚家族随机地选择用于表达和其结合特性的表征。克隆也可以基于在抗体的可变区中具有大量变异进行选择。可以构建系统发生树，且可以基于系统发生树的特征选择克隆，例如，通过系统发生树下行总是选择具有最多数目的下方叶节点的分支。

在一些方面，方法进一步包括选择一个或多个用于克隆的多核苷酸。

用于基于第一目标的选择鉴别第二目标多核苷酸的方法

在一些方面，方法包括获得与多个多核苷酸相关的数据集，其中数据集包含多个多核苷酸的测序数据，其中多个多核苷酸中的各多核苷酸包含样品识别区域，且其中各多核苷酸上的各样品识别区域对于单一样品是独特的，因而将多核苷酸中的各多核苷酸与独特的单一样品相关联，其中源自于第一单一样品的各多核苷酸的样品识别区域的序列不同于源自与第一单一样品不同的一个或多个样品的多个多核苷酸中其它多核苷酸的样品识别区域的序列，并从数据集选择与第一单一样品相关的第一目标多核苷酸并基于第一目标多核苷酸的样品识别区域鉴别第一单一样品中的第二目标多核苷酸。

在一些方面，多个多核苷酸中的各多核苷酸进一步包含第一板识别区域，其中各多核苷酸上的各第一板识别区域和样品识别区域的各种组合对于单一样品是独特的，其中源自第一组单一样品的各多核苷酸的第一板识别区域的序列不同于源自与第一组单一样品不同的一个或多个单一样品组的多个多核苷酸中其它多核苷酸的第一板识别区域的序列，且进一步包括基于第一目标多核苷酸的样品识别区域和第一板识别区域鉴别第一单一样品中的第二目标多核苷酸。

在一些方面，两个多核苷酸都包括可变区。在一些方面，一个多核苷酸包括可变区。在一些方面，没有任何一个多核苷酸包括可变区。

在一些方面，方法在计算机上执行，例如，它是计算机执行的方法。

在一些方面，第一单一样品包含B细胞。在一些方面，第一单一样品包含单一B细胞和一个或多个其它细胞。在一些方面，第一单一样品包含多个B细胞。在一些方面，第一单一样品包含B细胞，其中第一目标多核苷酸包含抗体重链核苷酸序列，且其中第二目标多核苷酸包含抗体轻链核苷酸序列。在一些方面，第一单一样品包含B细胞，其中第一目标多核苷酸包含抗体轻链核苷酸序列，且其中第二目标多核苷酸包含抗体重链核苷酸序列。

在一些方面，获得数据集包括获得多个多核苷酸并测序该多个多核苷酸以通过试验测定该数据集。在一些方面，获得数据集包括直接或间接地从已经测序多个多核苷酸以通过试验测定该数据集的第三方接收数据集。在一些方面，数据集存储在电子存储介质上。

产生一个或多个用于克隆的目标多核苷酸的方法

在一些方面，方法包括获得包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含通用引物区域、样品识别区域、接合体区域和源自单一样品的扩增子区域，其中通用引物区域的序列在多个多核苷酸的各多核苷酸上是基本上相同的，且其中源自第一单一样品的各多核苷酸的样品识别区域的序列不同于源自与第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列；和使用一组引物扩增多核苷酸文库以产生用于克隆的一个或多个目标多核苷酸，其中用于克隆的一个或多个目标多核苷酸包含第一限制性位点区域、通用引物区域、样品识别区域、接合体区域、源自单一样品的扩增子区域和第二限制性位点区域。

在一些方面，获得多核苷酸文库包括在实验室中制备多核苷酸文库。在一些方面，获得多核苷酸文库包括直接或间接地从已经制备多核苷酸文库的第三方接收多核苷酸文库。

在一些方面，方法进一步包括克隆一个或多个多核苷酸，例如克隆到本文中公开的载体中。

产生目标分子的方法

在一些方面，方法包括获得包含目标多核苷酸的宿主细胞；和在足以产生目标分子的条件下培养宿主细胞。

在一些方面，获得宿主细胞包括在实验室中制备包含多核苷酸的宿主细胞。在一些方面，获得宿主细胞包括直接或间接地从已经制备宿主细胞的第三方接收包含多核苷酸的宿主细胞。

在一些方面，目标分子是多肽。在一些方面，目标分子是抗体。在一些方面，目标分子是人单克隆抗体。

在一些方面，方法进一步包括收集目标分子。

在一些方面，希望的是“重折叠”特定多肽，例如包含一个或多个ABP成分或ABP本身的多肽。在某些实施方式中，这样的多肽使用本文中讨论的表达系统产生。在某些实施方式中，多肽“重折叠” 和/或氧化以形成所需的三级结构和/或产生二硫键。在某些实施方式中，这种结构和/或连接与多肽的特定生物活性相关。在某些实施方式中，重折叠使用本领域中已知的多种过程中的任一种完成。示例性的方法包括，但不限于将溶解的多肽试剂在离液剂存在下暴露于通常高于7的pH。示例性的离液剂是胍。在某些实施方式中，重折叠和氧化溶液还含有还原剂和该还原剂的氧化形式。在某些实施方式中，还原剂及其氧化形式以产生允许二硫重排发生的特定氧化还原电位的比率存在。在某些实施方式中，这样的重排允许形成半胱氨酸桥。示例性的氧化还原对包括，但不限于半胱氨酸/胱胺、谷胱甘肽/二硫双GSH、氯化铜、二硫苏糖醇DTT/二噻烷DTT和2-巯基乙醇(bME)/二硫代-bME。在某些实施方式中，共溶剂用于提高重折叠的效率。示例性的共溶剂包括，但不限于甘油、各种分子量的聚乙二醇和精氨酸。

在某些实施方式中，充分地纯化多肽，例如包含一个或多个ABP 成分或ABP本身的多肽。特定的蛋白质纯化技术是本领域技术人员已知的。在某些实施方式中，蛋白质纯化包括从非-多肽部分粗分馏多肽级分。在某些实施方式中，多肽使用色谱和/或电泳技术纯化。示例性的纯化方法包括，但不限于硫酸铵沉淀、PEG沉淀、免疫沉淀、热变性后离心、色谱法(包括，但不限于亲和色谱(例如，蛋白-A-琼脂糖凝胶)、离子交换色谱、排阻色谱和反相色谱)、凝胶过滤、羟磷灰石色谱、等电聚焦、聚丙烯酰胺凝胶电泳及这些技术和其它技术的组合。在某些实施方式中，多肽通过快速蛋白液相色谱或通过高压液相色谱(HPLC)纯化。在某些实施方式中，纯化步骤可以改变或特定步骤可以省略而仍获得用于制备基本上纯化的多肽的适当方法。

在某些实施方式中，定量多肽制备物的纯化程度。用于定量纯化程度的特定方法是本领域技术人员已知的。特定的示例性方法包括，但不限于测定制备物的特异性结合活性和通过SDS/PAGE分析评估制备物中多肽的量。用于评估多肽制备物的纯化量的特定示例性方法包括计算制备物的结合活性和将其与初始提取物的结合活性比较。在某些实施方式中，这种计算的结果表示为“纯化倍数”。用于代表结合活性的量的单位取决于进行的特定分析。

在某些实施方式中，包含一个或多个ABP成分或ABP本身的多肽被部分纯化。在某些实施方式中，部分纯化可以通过使用较少的纯化步骤或通过利用相同的一般纯化方案的不同形式完成。例如，在某些实施方式中，利用HPLC设备进行的阳离子交换柱色谱一般产生比利用低压色谱系统的相同技术更高的“纯化倍数”。在某些实施方式中，产生较低纯化程度的方法可以具有多肽总回收率或保持多肽的结合活性方面的优势。

在某些情况中，多肽的电泳迁移可以随SDS/PAGE的不同条件而变化，有时是显著地变化。参见，例如Capaldi等，Biochem.Biophys. Res.Comm.，76：425(1977)。应当理解，在不同的电泳条件下，纯化的或部分纯化的多肽的表观分子量可以是不同的。

筛选方法

在一些方面，筛选目标分子的活性。在一些方面，目标分子是 ABP。在一些方面，目标分子是抗体。

在一些方面，筛选本文中公开的文库的方法用于鉴别能够结合所需的靶标的ABP。设想了允许基于结合靶分子的ABP从文库选择 ABP的任何体外或体内筛选方法。

在一个实施方式中，文库可以使用本领域公认的体外无细胞表型-基因型关联展示进行筛选。这样的方法是本领域中公知的且描述于例如U.S.专利No.7,195,880；6,951,725；7,078,197；7,022,479； 6,518,018；7,125,669；6,846,655；6,281,344；6,207,446；6,214,553；6,258,558；6,261,804；6,429,300；6,489,116；6,436,665；6,537,749； 6,602,685；6,623,926；6,416,950；6,660,473；6,312,927；5,922,545和 6,348,315中。这些方法包括以使得蛋白质与其所来源的核酸物理关联或结合的方式从核酸体外转录蛋白质。通过用靶分子选择表达的蛋白质，也可以选择编码该蛋白质的核酸。

为提高scFv蛋白质的表达，以上所指的体外筛选分析可以包括特定试剂的添加或移除。在一个实施方式中，蛋白质二硫化物异构酶可以添加到体外表达系统中以提高功能性scFv分子的产生。在另一实施方式中，温和氧化剂(例如，GSSG(氧化的谷胱甘肽)/GSH(还原的谷胱甘肽)，例如100mM GSSG/10mM GSH)可以添加到 scFv蛋白质的体外翻译反应混合物中以允许在scFv分子的VH和 VL区域中形成链内二硫键。在另一实施方式中，还原剂(例如，二硫苏糖醇(DTT))可以从scFv的体外翻译反应混合物移除。

在另一实施方式中，一个或多个标记的氨基酸或其衍生物可以添加到体外翻译系统以使得标记的氨基酸变为并入到所得抗体中。设想了任何本领域公认的标记氨基酸，例如放射标记的氨基酸，例如³⁵S-标记的甲硫氨酸或半胱氨酸。

在一个实施方式中，体外筛选分析可以包括在一个或多个抗体的体外选择后，与所述一个或多个抗体物理关联的mRNA可以反转录以产生编码所述一个或多个抗体的cDNA。设想了用于反转录的任何合适的方法，例如，酶介导的，例如莫洛尼鼠白血病病毒反转录酶。

筛选方法可以包括扩增编码特异性结合所需靶标的抗体的核酸。在一个实施方式中，与一个或多个抗体物理相关的mRNA可以扩增以产生更多的mRNA。设想了任何本领域公认的RNA复制方法，例如，使用RNA复制酶。在另一实施方式中，与一个或多个抗体物理相关的mRNA在通过PCR扩增前首先反转录成cDNA。在一个实施方式中，PCR扩增使用高保真校读聚合酶，例如来自Thermococcus kodakaraensis的KOD1热稳定DNA聚合酶或PlatinumTaq DNA Polymerase High Fidelity(Invitrogen，Carlsbad，Calif.)。在另一实施方式中，PCR扩增可以在导致突变引入扩增的DNA中的条件下进行，即易错PCR。

筛选方法也可以包括提高靶结合筛选方法的严格性以选择具有提高的靶标亲和力的抗体。设想了提高抗体-靶标相互作用分析的严格性的任何本领域公认的方法。在一个实施方式中，一个或多个分析条件可以变化(例如，分析缓冲液的盐浓度)以降低抗体分子对所需靶标的亲和力。在另一实施方式中，可以缩短允许抗体结合所需靶标的时间长度。在另一实施方式中，竞争结合步骤可以添加到抗体-靶标相互作用分析中。例如，可以首先使得抗体结合所需的固定靶标。然后可以添加特定浓度的非固定靶标，其用于竞争结合固定的靶标以使得具有对抗原的最低亲和力的抗体从固定的靶标洗脱，导致富集具有改善的抗原结合亲和力的抗体。在一个实施方式中，分析条件的严格性可以进一步通过提高添加到分析中的非固定靶标的浓度而提高。

筛选方法也可以包括多轮的选择以富集具有改善的靶结合的一种或多种抗体。在一个实施方式中，在各轮选择中，进一步的氨基酸突变可以使用本领域公认的方法引入抗体中。在另一实施方式中，在各轮选择中，可以提高结合所需靶标的严格性以选择具有对所需靶标的更高亲和力的抗体。

筛选方法可以包括从体外翻译系统的成分纯化RNA-抗体融合蛋白。这可以使用任何本领域公认的分离方法完成。在一个实施方式中，RNA-抗体融合蛋白可以使用聚脱氧腺苷(polydT)树脂通过色谱法分离。在另一实施方式中，RNA-抗体融合蛋白可以使用对RNA-抗体融合蛋白的抗体成分中存在的表位特异性的抗体通过色谱法分离。在一个实施方式中，表位可以是氨基酸序列标签，例如 FLAG或HA标签，其整合到RNA-抗体融合蛋白的抗体成分的氨基酸序列中，例如在可变区间接头的N-末端、C-末端或其中。

从文库选择抗体可以包括使用固定的靶分子。在一个实施方式中，靶分子可以直接连接固体基质，例如琼脂糖珠。在另一实施方式中，靶分子可以首先进行修饰，例如生物素化，且修饰的靶分子可以通过对固体载体的修饰结合，例如抗生蛋白链菌素-M280、neutravidin-M280、SA-M270、NA-M270、SA-MyOne、NA-MyOne、 SA-琼脂糖和NA-琼脂糖。

在一些方面，荧光-标记的抗原用于单一细胞分选仅浆母细胞或具有针对特定的标记抗原的反应性的其它B谱系细胞。在其它方面中，荧光-标记的抗原用于在进行单一细胞分选前富集浆母细胞或具有针对特定的标记抗原的反应性的其它B谱系细胞。在一些方面，产荧光或生色分子可用于鉴别和分选B谱系细胞。在一些方面，所需的浆母细胞或其它B谱系细胞可以通过磁激活的细胞分选(MACS) 或甚至通过淘选分离。所得的产物一般是针对多种靶标(包括但不限于：癌症抗原、细胞因子、趋化因子、生长因子、分泌的蛋白质、细胞表面和其它抗原)的单克隆抗体以耗竭具有特定意义的细胞类型、微生物、细菌、分枝杆菌、寄生虫和病毒。其它筛选方法描述于下面的实施例章节中。

计算机执行

在一些方面，一种或多种本文描述的方法可以在计算机上执行。在一个实施方式中，计算机包含与芯片偶联的至少一个处理器。还与芯片偶联的有存储器、存储装置、键盘、图形适配器、点击设备和网络适配器。显示器与图形适配器偶联。在一个实施方式中，芯片的功能性由内存控制中心和I/O控制中心提供。在另一实施方式中，存储器直接与处理器而不是芯片偶联。

存储装置是能够保持数据的任何装置，如硬盘驱动器、光盘只读存储器(CD-ROM)、DVD或固态存储装置。存储器保持由处理器使用的指令和数据。点击设备可以是鼠标、轨迹球或其它类型的点击设备，且用于与键盘组合以将数据输入计算机系统中。图形适配器在显示器上显示图像和其它信息。网络适配器将计算机系统与局域网或广域网偶联。

如本领域中已知的，计算机可以具有不同的和/或先前描述的那些以外的其它部件。另外，计算机可以缺少特定的部件。而且，存储装置可以对于计算机是本地的和/或远程的(如在存储区域网(SAN) 中实施)。

如本领域中已知的，计算机适应于执行用于提供本文中描述的功能性的计算机程序模块。如本文中所用的，术语“模块”是指用于提供特定功能性的计算机程序逻辑。因此，模块可以在硬件、固件和/或软件中执行。在一个实施方式中，程序模块存储在存储装置上、加载到存储器中和通过处理器执行。

本文中描述的实体的实施方式可以包括此处描述的模块以外的其它的和/或不同的模块。另外，归因于模块的功能性可以在其它实施方式中通过其它的或不同的模块执行。此外，本说明书偶尔省略术语“模块”以达到清楚和方便的目的。

试剂盒

试剂盒可以包括本文中公开的多核苷酸、多核苷酸文库、载体和/或宿主细胞及使用说明。试剂盒可以在适当的容器中包含本文中公开的多核苷酸、多核苷酸文库、载体和/或宿主细胞，一个或多个对照及本领域中公知的各种缓冲剂、试剂、酶和其它标准成分。

容器可以包括含有一个或多个孔的板上的至少一个孔。容器可以包括至少一个小瓶、试管、烧瓶、瓶子、注射器或其它容器装置，其中可以放置多核苷酸、多核苷酸文库、载体和/或宿主细胞且在一些情况中适当地等分。在提供另外的成分的情况中，试剂盒可以包含可以在其中放置这种成分的另外的容器。试剂盒还可以包括用于容纳多核苷酸、多核苷酸文库、载体和/或宿主细胞的装置和紧密封闭以用于商业售卖的任何其它试剂容器。这样的容器可以包括在其中保持所需小瓶的注塑或吹塑塑料容器。容器可以包括具有使用说明和/或警告的标签。

实施例

实施例仅用于示例说明的目的而不意图以任何方式限制本发明的任何实施方式的范围。已经努力确保使用的数字(例如，量、温度等)的精确性，但当然应当允许一些试验误差和变异。

除非另外指明，各种方法可以采用本领域技术范围内的蛋白质化学、生物化学、重组DNA技术和药理学的常规方法。这样的技术在文献中充分地解释。参见，例如，T.E.Creighton，Proteins：Structures and Molecular Properties(W.H.Freeman andCompany，1993)；A.L. Lehninger，Biochemistry(Worth Publishers，Inc.，currentaddition)； Sambrook等，Molecular Cloning：A Laboratory Manual(2nd Edition，1989)；Methods In Enzymology(S.Colowick and N.Kaplan编辑， Academic Press，Inc.)；Remington′s Pharmaceutical Sciences，第18版 (Easton，Pennsylvania：MackPublishing Company，1990)；Carey和 Sundberg Advanced Organic Chemistry第3版.(Plenum Press)Vols A and B(1992)；Current Protocols in Molecular Biology(2002-；Wiley； Online ISBN：9780471142720；DOI：10.1002/04711142727)；CurrentProtocols in Immunology(2001-；Wiley；Online ISBN：9780471142737； DOI：10.1002/0471142735)。

一般材料和方法

血液收集和PBMC的分离

所有人类样品在知情同意后和按照研究审查委员会(IRB)-批准的人类受试者方案收集。血液收集在肝素管(Beckton Dickinson and Company，目录号BD366664)中或在CPT管(Beckton Dickinson and Company，目标号BD362761)中。对于肝素管的处理，一毫升血液转移到微离心管中并以12,000rpm旋转3分钟，收集血浆和在-80℃ 下冷冻(用于后面抗体反应性的测试)，剩余的血液在Ficoll上成层并在室温下、以最小加速度和不使用制动器的情况下在具有 SX4750Swinging Bucket Rotor的Beckman Coulter Allegra X-15R台式离心机中对肝素管离心20分钟，并收集外周血单核细胞(PBMC) 层。或者，CPT管在室温下、以最小加速度和不使用制动器的情况下以1，500g直接离心20分钟，并收集PMBC层。收集的PBMC然后在使用前用PBS洗涤两次。

PBMC也可以冷冻以用于进一步的使用和B-细胞、记忆B-细胞、浆母细胞、浆细胞或其它B-细胞群体的分离。用于冷冻PBMC的一种方法包括重悬PBMC在冷冻管中的90％胎牛血清(FBS)和10％二甲亚砜中，且随后在Mr.Frosty(Sigma C1562-1EA)中缓慢地在-80℃下冷冻容纳在小瓶中的细胞过夜。冷冻细胞的小瓶然后转移到液氮中用于长期储存，并可以在较晚时间解冻以用于单个B细胞的分离和配对的免疫球蛋白基因的高通量测序。解冻的细胞在含有过量DNase I(通常25ug/ml)(Sigma D4513)的培养基中孵育直到第一分选的结束以防止细胞结块。

细胞和细胞亚群的分离和富集

浆母细胞。对于一些样品，PBMC首先通过使用改良的浆细胞分离试剂盒II(Miltenyi 130-093-628)富集浆母细胞。这是任选的步骤。这产生较少的用于后续分选的总细胞，从而具有较短的分选时间。这主要在需要在同一天对多个样品进行单一细胞分选时使用。也可能使用不同试剂盒以富集不同B细胞群体(参见下文)。对于每5x10⁷个PBMC，细胞悬浮在200μL冰冷的MACS缓冲液(具有 0.5％FBS的PBS)中。添加50uL的非-浆细胞生物素-抗体混合物，且细胞在冰箱(4℃)中孵育10分钟。添加100μL的MACS缓冲液、 100μL的非-浆细胞微珠混合物和50μL的CD56微珠并在冰箱中孵育另外10分钟。然后细胞用7mLMACS缓冲液洗涤，以300g在 4℃下离心5分钟，重悬在500μL MACS缓冲液中并在磁场中的平衡的LS柱上分析。该柱用4x3mL的MACS缓冲液洗涤且富集的细胞处于阴性级分中。

记忆B-细胞。CD19+微珠(Miltenyi 130-050-301)和CD27+微珠 (130-051-601)可以用于在细胞分选前富集记忆B-细胞以缩短分选时间。也可以使用其它富集方法如记忆B-细胞分离试剂盒(Miltenyi 130-093-546)，只要它们富集CD19⁺CD27⁺细胞。对于每5x10⁷个 PBMC，300μL的冰冷MACS缓冲液用于重悬。然后添加100μL的CD19微珠和100μL的CD27微珠，且样品在4℃下孵育15分钟。然后细胞用7mL的MACS缓冲液洗涤，以300g在4℃下离心5分钟，并重悬在500μL MACS缓冲液中。然后细胞在磁场中通过平衡的LS柱分析，并用2x3mL的MACS缓冲液洗涤。LS柱然后从磁场移除，且细胞用5mL的MACS缓冲液洗掉以洗脱富集的细胞。

总B-细胞。CD19+微珠(Miltenyi 130-050-301)可以用于在细胞分选前富集总B细胞，例如以缩短分选时间。其它富集方法也可以使用，只要它们富集CD19⁺细胞。对于每5x10⁷个PBMC，将细胞重悬在400μL的冰冷MACS缓冲液中。添加100μL的CD19+微珠并在冰箱(4℃)中孵育15分钟。然后细胞用7mL的MACS缓冲液洗涤，以300g在4℃下离心5分钟，并重悬在500μL MACS缓冲液中。然后细胞在磁场中通过平衡的LS柱分析，并用2x 3mL的MACS缓冲液洗涤。LS柱然后从磁场移除，且细胞用5mL的MACS缓冲液洗脱脱，从而产生富集的细胞。

其它细胞类型。虽然不是必需的，所需细胞群体的MACS富集可以缩短分选时间。其它细胞群体包括浆细胞、其它B-细胞群体和非B-细胞群体也可以使用MACS或其它使用适宜试剂的系统富集。例如，总T-细胞可以使用CD3+微珠富集，且效应T-细胞和辅助T- 细胞分别使用CD8+和CD4+微珠分离。CD45RO微珠可以用于分离记忆T-细胞，并与CD8+或CD4+珠结合，用于分别分离记忆效应 T-细胞或记忆辅助T-细胞。

单一-细胞分选

MACS富集不是分选所需的，但可以进行浆母细胞的MACS富集以缩短分选时间。如果PBMC已进行MACS富集，等份的未富集 PBMC(～1百万细胞)也串联地分析，允许确定样品中的基线浆母细胞百分比。为了分选浆母细胞，细胞用制造商推荐体积的 CD3-V450(BD560365)、IgA-FITC(AbD Serotec STAR142F)、 IgM-FITC(AbD Serotec STAR146F)或IgM-PE(AbD Serotec STAR146PE)、CD20-PerCP-Cy5.5(BD 340955)、CD38-PE-Cy7(BD 335808)、CD19-APC(BD 340437)和CD27-APC-H7(BD 560222)在50 μL的FACS缓冲液(具有2％FBS的PBS或HBSS)在冰上黑暗中染色20分钟。一些细胞也可以替代地与IgM-FITC一起用IgG-PE(BD 555787)、CD138-PE(eBioscience 12-1389-42)或HLA-DR-PE(BD 555812)染色。对于浆母细胞、记忆B-细胞和原始B-细胞的同时分选，使用以下染色方案：IgD-FITC(Biolegend348205)、IgG-PE(BD 555787)、CD20-PerCP-Cy5.5、CD38-PECy7、IgM-APC(BD 551062)、CD27-APC-H7、IgA-biotin(AbD Serotec 205008)，之后链霉亲和素 -eFluor710(eBioScience 49-4317-82)和CD19-BV421(Biolegend 302233)。记忆B-细胞也分选为CD19⁺CD27⁺IgG⁺或 CD19⁺CD20⁺IgG⁺，原始B-细胞分选为CD19⁺IgD⁺IgM⁺。IgA⁺浆母细胞也进行分选，并定义为CD19⁺CD20^-CD27⁺CD38⁺⁺IgA⁺IgM^-。也可以使用其它细胞表面标志物，只要B-细胞或其它细胞群体可使用细胞表面标志物通过表型鉴别，群体可进行单一细胞分选。参见下文。然后细胞用2mL的FACS缓冲液洗涤一次并以适宜体积重悬以进行 FACS。细胞首先在BD Aria II上分选到5mL圆底管中。通常，＞80％的纯度从第一分选获得。单一细胞分选到含有6.65μL低渗缓冲液 (10mM Tris-HCl pH7.6)的96-孔PCR板的前11列中，低渗缓冲液包含2mM dNTP(NEB N0447L)、5μM寡(dT)₂₀VN和1单位的Ribolock (Fermentas EO0384)，RNA酶抑制剂。作为阴性对照，最后一列保持不含细胞。对于IgG⁺浆母细胞，选通(细胞的选择)策略是 CD19⁺CD20^-CD27⁺CD38⁺⁺IgA^-IgM^-。分选的板用铝板密封剂(Axygen PCR-AS-600)密封并立即在干冰上冷冻和在-80℃下储存。

单一细胞分选选通策略

B-细胞。对于B-细胞，选通方式包括分选一种或多种以下标志物：IgM、IgG、IgA、IgD、CD19或CD20。对于总IgG⁺B-细胞，选通方式包括分选IgG⁺。对于总IgA⁺B-细胞，选通方式包括分选 IgA⁺。对于总IgM⁺B-细胞，选通方式包括分选IgM⁺。

活化B细胞。活化B细胞包括通过其膜抗原受体与同源抗原的结合刺激的和/或从识别源自相同的大分子抗原的表位的T细胞接受 T细胞辅助的B细胞。活化B细胞也可以通过多种性质包括增大的细胞尺寸(例如，“未成熟B细胞”，参见下文)、一种或多种细胞表面标志物的表达、一种或多种细胞内标志物的表达、一种或多种转录因子的表达、退出细胞周期的G0期、进展通过细胞周期、细胞因子或其它因子的产生和/或一种或多种特定细胞表面标志物、一种或多种细胞内标志物、一种或多种转录因子或其它因子的下调来鉴别。鉴别活化B细胞的一种方法是结合B细胞标志物(如CD19或免疫球蛋白)与活化标志物(如增大的细胞尺寸或体积、细胞表面活化标志物CD69或者基于细胞渗透性吖啶橙DNA染色或另一细胞周期分析的进展通过细胞周期的检测)的检测。

不成熟B细胞。“不成熟B细胞”是活化的和相对于静息B细胞尺寸增大的B细胞。不成熟B细胞包括浆母细胞群体以及其它活化 B细胞群体，且不成熟B细胞在尺寸上物理大于静息B细胞。不成熟B细胞可以使用几种不同的途径进行单一细胞分选，包括按照细胞直径、细胞体积、电阻抗、FSC、FSC脉冲的积分(面积)(FSC-A)、 FSC高度(FSC-H)、前向散射脉冲宽度(FCS-W)、侧向散射(SSC)、侧向散射脉冲面积(SSC-A)、侧向散射高度(SSC-H)、侧向散射宽度 (SSC-W)、自发荧光和/或细胞尺寸的其它量度而基于其物理较大而进行B细胞的选通(选择)。

在流式细胞术中，前向散射(FSC)使用与细胞流一致的光束测量并提供有关各细胞的比例尺寸和直径的信息。使用FSC，可以选择具有大于静息B细胞的中值FSC的FSC的B细胞，例如大于静息B 细胞5％、大于静息B细胞10％、大于静息B细胞15％、大于静息B 细胞20％、大于静息B细胞30％、大于静息B细胞40％、大于静息 B细胞50％、大于静息B细胞60％的FSC-A或FSC-H。通过分析特定尺寸的校准珠，可以使用FSC确定B细胞相对于校准珠的相对尺寸。由此，可以特别地选通并因此选择具有约8um、＞8um、＞9um、＞10μm、＞11μm、＞12μm、＞13μm、＞14μm、＞15μm、＞16μm、＞17um、＞18um、＞19um或＞20um的直径的B细胞。

细胞尺寸的另一量度是细胞体积。细胞体积的“金标准”使用基于电测量的Coulter原理(Tzur等，PLoS ONE，6(1)：e16053. doi：10.1371/journal.pone.0016053，2011)。虽然通过小滴带电和折射分选的方法首先用于通过阻抗测量细胞体积的装置中，当前可用的流式细胞仪仅进行光学测量。FSC测量，特别是FSC-A(FSC积分面积) 通常用于评估细胞尺寸，虽然FSC测量可受微粒和流体之间的折射率差异影响(Tzur等，PLoS ONE，6(1)：e16053. doi：10.1371/journal.pone.0016053，2011)。有人已经证明体积评估可通过组合光学参数改善，包括FSC-W、SSC和450/50-A自发荧光(Tzur 等，PLoS ONE，6(1)：e16053.doi：10.1371/journal.pone.0016053， 2011)。

例如，基于增大的尺寸选择活化B细胞可以通过使用标志物如 CD19鉴别B细胞和通过FSC或FSC-A评估其尺寸来实现。其它B 细胞标志物和/或用于尺寸评估的参数在本文中描述。

浆母细胞。对于浆母细胞的分离，选通方式包括分选 CD19⁺CD38⁺⁺B-细胞。对于IgG⁺浆母细胞的分离，选通方式包括分选CD19⁺CD38⁺⁺IgA^-IgM^-B-细胞。对于IgA+浆母细胞的分离，选通方式包括分选CD19⁺CD38⁺⁺IgA⁺B-细胞。对于IgM+浆母细胞的分离，选通方式包括分选CD19⁺CD38⁺⁺IgM⁺B-细胞。另外，其它选通策略可以用于分离足够数目的浆母细胞以完成本文中描述的方法。浆母细胞也使用以下标志物表达谱CD19^low/+、CD20^low/-、CD27⁺和CD38⁺⁺分离。一般来说，虽然所有这些标志物的使用导致从单一细胞分选产生最纯的浆母细胞群体，但不是所有上述标志物都需要使用。例如，浆母细胞也可以使用以下选通策略分离：用于较大细胞 FSC^hiCD19^lo细胞、FSC^hi和CD27⁺、CD38⁺⁺或CD20-细胞的前向散射高度(FSC^hi)。任何这些标志物或发现能够区分浆母细胞与其它B细胞的其它标志物的组合一般地提高分选的浆母细胞的纯度，但是任何一种上述标志物单独(包括FSC^hi)可以区分浆母细胞与其它B细胞，尽管具有较低的纯度。

对于记忆B-细胞。对于IgG⁺记忆B-细胞，选通途径包括分选 CD19⁺CD27⁺IgG⁺或CD19⁺CD20⁺IgG⁺。对于IgA⁺记忆B-细胞，选通策略包括CD19⁺CD27⁺IgA⁺或CD19⁺CD20⁺IgA⁺。对于IgM⁺记忆B- 细胞，选通策略包括CD19⁺CD27⁺IgM⁺或CD19⁺CD20⁺IgM⁺。

对于其它细胞类型。只要B-细胞、T-细胞或其它细胞群体可使用细胞标志物通过表型鉴别，它就可以进行单一细胞分选。例如， T-细胞可以鉴别为CD3⁺或TCR⁺，原始T-细胞鉴别为CD3⁺CD45RA⁺，记忆T-细胞鉴别为CD3⁺CD45RO⁺。效应T-细胞和辅助T-细胞可以分别鉴别为CD3⁺CD8⁺和CD3⁺CD4⁺。细胞群体可以通过使用标志物的组合进一步细分，如对于记忆辅助T细胞的CD3⁺CD4⁺CD45RO⁺。

来自单一B细胞的配对轻链和重链免疫球蛋白基因的测序

接合体分子的反转录

单一细胞分选的板在冰上解冻并在使用前简短地离心。板在热循环仪中55℃下孵育3分钟、42℃下孵育2分钟和4℃下不定时孵育。板简短地再次离心并小心地打开以避免气溶胶形成。1μL的适当接合体分子(各接合体分子一般具有样品识别区域(样品-ID))的 10μM溶液添加到各孔中，所有阴性对照孔(仅含有RNA防腐缓冲液或非-B细胞)接受相同的接合体分子。添加2.35μL含有0.75μL H₂O、1μL 10x M-MuLV RT缓冲液(NEB B0253S)、0.6μL 50mM MgCl₂、0.25μL Ribolock(40U/μL)和0.125μL Superscript III(200 U/μL)(Invitrogen 18080-085)的混合物并通过吸液混合。板简短地离心并使用热板振荡器在42℃下孵育120分钟至8小时和然后保持在 -20℃下。在反应后，来自所有孔的RT产物汇合在微离心管中。汇合的RT产物然后使用具有～0.1％8-羟基氯喹(Sigma 77617)的苯酚-氯仿-异丙醇提取，然后在凝胶-锁相管(5PRIME 2302820)中用氯仿萃取进行提取。RT产物然后浓缩并用Amicon Ultra-0.530kDa (Millipore UFC503096)或Ultra-0.5100kDa(Millipore UFC510096)通过以14000g旋转5分钟，接着用TE(10mM Tris-HCl pH 7.6，具有1mM EDTA)以14000g旋转5分钟并最终用EB(Qiagen 19086)以14 000g旋转5分钟脱盐。RT产物通过在新离心管中反转Amicon Ultra 柱洗脱并以1000g离心2分钟。此时，将RT产物保持在-20℃或-80℃ 下。

降落PCR(Touchdown PCR)

对于454测序操作1和2，降落PCR方法如下使用。对于PCR 操作3和4中的一些样品，改变PCR方法，从而导致更多数目的配对重链和轻链。这一改变在以下“非-降落PCR”小节中详细说明。

对于第一PCR和嵌套的第二PCR，Phusion Hot Start II DNA聚合酶(NEB F-549L)用于提供的GC缓冲液中。对于IgG，引物和接合体分子显示于表1中。样品-ID序列显示于表2中。板-ID序列显示于表3中。也参见图3和9。反应条件包括1.8mM的最终MgCl₂浓度、200μM dNTP、0.2μM的所有引物、0.2U的Phusion聚合物、作为添加剂的变化量的DMSO和25μL最终体积中的2μL模板。对于第一PCR，λ和κ轻链及γ重链在不同的孔中扩增，且DMSO分别以8％、5％和10％的最终浓度使用。用于第一PCR中的正向引物是FW长引物1和FW短引物1。因为FW长引物1添加板识别区域 (板-ID)到扩增子区域(扩增子)的5’端，含不同板-ID的FW长引物 1添加到不同的样品中。基因特异性反向引物用于扩增κ、λ和γ链，其分别为κGSP1、λGSP1和γGSP1。用于第一PCR的循环条件包括 98℃下30”的初始变性步骤，接着2个循环的98℃下10”，72℃ 下25”；7个降落循环，98℃下10”，71.5℃至68.5℃下15”和72℃下20”，各后续退火步骤具有0.5℃的下降；30个循环的98℃下10”， 68℃下15”和72℃下20”，接着72℃下5’的最终延伸并保持在4℃ 下不定时。来自第一PCR的产物在TE中稀释100x且2μL用于嵌套的第二PCR。对于第二PCR，5％DMSO在所有样品中用作添加剂。正向引物是FW引物2而反向引物是RV引物2和GSP长引物 2。κGSP长引物2、λGSP长引物2和γ长引物2用于扩增其相应的扩增子。因为GSP长引物2也添加板-ID到扩增子的3’端，具有板特异性的板-ID的不同GSP长引物2添加到各汇合的板样品。用于嵌套第二PCR的循环条件包括98℃下30”的初始变性步骤，30-40 个循环的98℃下10”，67℃下15”和72℃下20”，接着72℃下5’ 的最终延伸和保持在4℃下不定时。

非-降落PCR

对于非-降落PCR，除非另外说明，条件与降落PCR相同。第一 PCR循环参数是95℃下5′的初始变性，15-25个循环的98℃下30″， 62℃下30″，72℃下30″，72℃下5′的最终延伸和保持在4℃下不定时。第一PCR是多重PCR，其中所有3个基因特异性反向引物， κ、λ和γ恒定区反向引物分别以0.2、0.2和0.24μM结合使用。使用的所有其它引物与降落PCR中相同。基因特异性引物可以是用于降落PCR中的那些，且也可以是指明为适合第一PCR的那些中的任一种(表6)。DMSO以5％的最终浓度使用；0.1mg/ml的BSA(NEB B9001S)和ET-SSB(NEB M2401S)也可以以1∶100添加用于PCR反应。在第一PCR过程中，4-6ul的cDNA模板用于总共80或90ul反应体积中。各PCR1反应分成八或九个10ul的反应，各反应在不同的孔中发生。第一PCR在PCR后再次汇合并在TE0.1中稀释100x，且2ul用于第二PCR。第二PCR是对于各基因特异性引物的单独反应(非多重的)，且反应混合物除了以下外与降落第二PCR相同：可以使用指定为用于第二PCR的任何基因特异性恒定区引物(表 6)，引物始终以0.2μM或0.4μM使用，或者基因特异性引物以0.2μM 使用和其余以0.4μM使用。0.1mg/ml BSA添加到反应中且ET-SSB 也可以以1∶100使用。第二半嵌套PCR循环参数是95℃下5′的初始变性，20-35循环的98℃下30″，67℃下30″，72℃下30″，72℃下 5′的最终延伸和保持在4℃下不定时。结合的第一和第二PCR的PCR 循环总数对于非-降落PCR通常在50-60循环之间。由于发生PCR 循环的不同汇合孔倾向于使用不同数目的循环以获得合理的DNA 产物量(通常1-12ng/ul之间)，对于各第二PCR进行4种不同的 PCR循环，例如23、26、30和33个循环，5ul在2％琼脂糖凝胶上分析并进行比较。基于PCR产物量的定性判断，仅来自第二PCR循环数之一的PCR产物用于各汇合孔第二PCR以准备用于454测序操作。

对于人中的其它免疫球蛋白重链、小鼠中的免疫球蛋白重链和轻链及人和小鼠中的TCR链的PCR，PCR条件与上述非-降落PCR 节相同，除了第一PCR是非多重的，其中各cDNA单独地扩增。以下表10和表11中的3′引物用于PCR1和2中。

准备用于454 XLR70测序操作

对于第一和第二454操作，用于454钛测序操作的测序引物(分别为钛引物A和B)在第一和嵌套第二PCR期间添加到扩增子上。 5μL的各扩增子在具有质量DNA梯状序列的琼脂糖凝胶(Fermentas SM0383)上分析，获取图像，并分析条带强度和用AlphaFC Imager 软件(Cell Biosciences)定量。5ng的各κ、λ和γ扩增子单独地汇合，在0.8％琼脂糖凝胶上分析，并用GelGreen(Biotium 41005)可视化。切割适当大小(对于κ和λ为～600bp，和对于γ为～750bp)的条带并按照制造商的指示以轻微的改进用MinElute Gel Extraction试剂盒 (Qiagen 28606)纯化。简单地说，琼脂糖凝胶在QG缓冲液中不加热的条件下熔解，并进行另外的QG洗涤步骤。使PE洗涤缓冲液在离心前静置5分钟。也进行另外的PE洗涤步骤。样品用25uL的EB 缓冲液洗脱。对于454第二操作样品也使用1∶0.65的DNA体积：珠体积比例用SPRI珠清洁一次。DNA浓度用Picogreen DNA分析试剂盒(Invitrogen P11496)测定，且样品汇合以使得γ：κ：λ的DNA浓度为 2∶1∶1。汇合的样品为＞0.5ng/μL的浓度并运送到454DNA测序机构进行454测序。

对于第三和后续的454测序操作，改变方案。扩增子仍然单独地汇合以对来自各PCR反应的DNA量进行标准化，但首先按照制造商的指示进行SPRI珠清洁以除去小DNA片段。扩增子在3％琼脂糖凝胶上分析，并切割适当的条带和如前用MinElute GelExtraction 试剂盒纯化。此后，扩增子进行另2轮的SPRI珠清洁以除去甚至更小的DNA片段，并用Picogreen定量，用Nanodrop检验质量以确保 OD260/280比率＞1.8且1μl在凝胶上分析以确保没有小DNA片段。 λ和κ扩增子以1∶1的比率汇合，γ原样使用。DNA然后按照454的说明稀释到1x 10⁹拷贝，并发送到测序机构(Roche)用于以1cpb进行emPCR和测序；γ重链在一个区域中和汇合的轻链在picotiter板的另一区域中。

准备用于454 XL+测序操作

当前454 XL+测序操作不支持用于XLR70操作的Lib-A测序试剂盒。XL+当前仅支持Lib-L试剂盒，其为单向测序。为使我们的方案适应于进行XL+测序，按照用于XLR70操作的方案，但在凝胶清洁步骤后，各扩增子(κ、λ和γ)进行两个独立的PCR(各5个循环长)以添加到Lib-L A和B接合体上。PCR条件如下：使用Phusion 聚合酶，5x GC缓冲液和最终浓度5％的DMSO。引物以0.2uM使用。 0.1mg/ml BSA添加到反应中。PCR循环参数是95℃下5′的初始变性、 20-35个循环的98℃下30″，67℃下30″，72℃下30″，72℃下5′ 的最后延伸和保持在4℃下不定时。对于各扩增子进行两个PCR：一个PCR中5LIB-LA和3LIB-LB，和另一个PCR中5LIB-LB和 3LIB-LA。添加接合体以使得各扩增子变成5’-LibA-扩增子-LibB-3’ 或5’-LibB-扩增子-LibA-3’。这些扩增子在5’端上具有LibA“A”或 “B”接合体(和在3’端上具有对应的“B”或“A”接合体)，这允许双向测序。然后具有新Lib A接合体的扩增子在按照用于XLR70操作的方案进行3轮SPRI珠清洁以定量DNA和检验DNA质量，之后稀释到1x 10⁹拷贝并发送到454测序机构(Roche)用于1cpb下的emPCR 和测序。

准备用于PacBio测序操作

对于PacBio测序操作，降落PCR如上使用。DNA汇合和清洁如以上“准备用于454XLR70操作”节中进行。为获得测序所需的足够的DNA(500ng)，最少1ug的DNA汇合用于凝胶和SPRI清洁。不进行Picogreen定量和1x 10⁹稀释，因为它不是PacBio测序所需要的。如果从第二PCR未获得足够的DNA，重复第二PCR和汇合步骤直到获得足够的DNA。最少500ng的清洁的DNA发送到PacBio 测序机构用于测序。

其它测序途径

本文中公开的方法不依赖于454或PacBio测序。λ和κ轻链为～600bp和γ重链为～700bp。因此，一般希望的是具有较长的测序阅读片段的能力以使得正向和反向测序阅读片段足够重叠以能够重构全部的轻链(LC)的约600bp序列(精确的序列长度取决于5’非翻译区(UTR)的长度)和重链(HC)的约700bp序列。因此，可以利用可产生至少约350-400bp的测序阅读片段并因而获得用于序列组装的重叠的任何测序技术，且能够实现约600-700+bp阅读片段的测序技术允许只使用正向(Fw)引物测序(从5’端测序)。

序列

用于上述操作的序列数据从相关机构接收并如下所述进行处理。

序列命名法

序列表中对应于测序阅读片段、序列组装或序列的氨基酸翻译的各序列具有标识符。各个这样的标识符具有由句点“.”分隔的9个字段。字段从1-9编号并给出以下信息：

1.阅读片段ID。与用于确定阅读片段的测序技术相关的软件赋予的阅读片段ID，或者如果序列不是原始阅读片段，则为“NA”。

2.板号。序列与之相关的板号。对应的生物样品信息参见表12 (板-样品对映表)。

3.样品ID。表示序列与之相关的孔的样品ID。样品ID号在1-89 (包括)之间。样品ID和孔名称之间的对应参见表2。

4.孔名称。包含序列与之相关的孔的孔名称。孔名称对应于通常的96孔板名称，例如D07。孔名称和样品ID是指明板上的特定孔的等同方式。

5.重叠群ID。重叠群ID区分来自给定的组装和链类型的与孔相关的不同序列。

6.平台。平台字段表明序列所来源的测序技术。用于平台的可能值是454、Sanger和PacBio。

7.链类型。链类型字段表明序列是否与一组重链抗体序列、轻链抗体序列或含重链和轻链抗体序列的组相关。可能的值是“重”、 “轻”或“CMB”。

8.操作ID。特定平台上的一组阅读片段的标识符。

9.序列类型。序列的类型。可能的值对于原始测序技术阅读片段是“原始”，对于组装的阅读片段(参见“序列的组装”章节)是“nb”、 “urt”、“multim50”、“zerom50”或“pb”，或者对于源自各种不同nt组装共有序列的氨基酸序列为“nb-aa”、“urt-aa”、“multim50-aa”、 “zerom50-aa”或“sanger-aa”。

用于分析的序列的制备

从454测序产生的数据通过454GS FLX数据分析软件进行分析，且返回通过过滤器的高质量序列。由于454GS FLX数据分析软件使用的默认扩增子过滤器的严格性，过滤器严格性可能需要放松以获得足够长的阅读片段。一种方式是按照454技术公告APP No.001-2010的建议。将扩增子过滤器的<vfScanAllFlows>从“TiOnly” 改变为“False”可能导致通过过滤器的具有良好质量的序列的大的增加。另一选项是将<vfTrimBackScaleFactor>改变为较低的数。对于 454操作1，使用标准散弹处理，和对于操作2，<vfScanAllFlows> 改变为“False”，且对于操作3和4使用标准扩增子流水线处理。

由Pacific Biosciences测序产生的数据作为具有相关质量评分的 CircularConsensus Sequence阅读片段从Pacific Biosciences接收。

序列到孔的分配

来自样品的cDNA用454或Pacific Biosciences测序技术测序。阅读片段是序列表中其序列类型为“原始”的那些。分析测序阅读片段并分配到源板和孔或者放弃。

用于阅读片段的板和孔的分配通过使用常规表达比较观察的阅读片段序列与可能的板识别区域、通用引物区域和样品识别区域序列来进行。比较使用表13、14和15中所列的常规表达在三个阶段中进行。

在阶段1(可能的板识别区域的分析)中，阅读片段针对表13 中“板识别区域常规表达”列中所列的所有常规表达进行检验，需要匹配以序列的第一核苷酸开始。如果没有发现匹配，则放弃该阅读片段，并继续用下一可得的阅读片段进行板/孔分配(如果有的话)。如果发现匹配，则为该序列分配来自“板ID”列的相应ID作为其板 ID。记录与板常规表达匹配的阅读片段的核苷酸用于在匹配的后面阶段中或在组装过程中使用。

在阶段2(通用引物区域的分析)中，阅读片段针对“通用引物常规表达”“CACGACCGGTGCTCGATT+AG”进行检验，要求阅读片段匹配以板常规表达匹配的最后阅读片段核苷酸后的第一核苷酸开始。如果阅读片段不匹配通用引物常规表达，则放弃该阅读片段，并继续用下一可得的阅读片段进行板/孔分配(如果有的话)。否则记录与通用引物常规表达匹配的阅读片段的核苷酸用于在匹配的最后阶段中和在组装过程中使用。

在阶段3(可能的样品识别区域的分析)中，阅读片段针对表 14中“样品识别区域常规表达”列中所列的所有常规表达进行检验，要求匹配以与通用引物常规表达匹配的最后阅读片段核苷酸后的第一核苷酸开始。如果没有发现匹配，则放弃该阅读片段，并继续用下一可得的阅读片段进行板/孔分配(如果有的话)。如果发现匹配且样品ID列仅包含单一标识符，则阅读片段的样品ID分配为在样品ID列中发现的ID。如果样品ID列包含超过单一标识符，那些标识符被认为是“候选样品ID”。然后阅读片段顺序地针对表15的“样品识别区域常规表达”列中所列的所有常规表达进行检验，其中至少一个表15的“样品ID”列中的相应样品ID与候选样品ID匹配。如果阅读片段匹配该常规表达，且匹配以与通用引物常规表达匹配的最后阅读片段核苷酸之后的第一核苷酸开始，则候选样品ID的最右标识符分配为阅读片段的样品ID。否则，最右标识符从候选样品ID 的列表去除并以较小的候选样品ID列表重复该过程直到发现匹配，或者如果在表15的常规表达列表中没有发现匹配的常规表达，则最后的候选样品ID(即，候选样品ID原始列表中最左的)分配为用于阅读片段的样品ID。

在板ID和样品ID分配过程中放弃的阅读片段不包括在序列表中。

序列的组装

分配到与孔相关的样品ID的所有序列阅读片段进行组装以产生共有序列。这些共有序列对应于在分选的细胞中表达的重链和轻链 mRNA序列。

序列采用Newbler 2.5组装(操作1和2)，且对于其它序列采用Newbler版本2.6和/或Mira版本3.4.0。

在列表中具有平台字段“454”、链类型字段“混合的”、操作ID“1” 或“2”和序列类型“nb”的序列是使用newbler的组装产生的重叠群。为组装这些序列，来自454测序的sff输出文件(其含有序列和各核苷酸的质量评分)使用Biopython包和根据如上所述的其化合物条码 (样品-ID+板-ID)细分的序列读入Python中并输出到单独的sff 文件中。然后这些文件通过sfffile(由GS FLX数据分析软件提供) 使用“-force”、“-cdna”和“-urt”选项再解析成具有Newbler(在GS FLX 数据分析软件套装中提供的序列组装器)理解的文件头的sff文件。然后Newbler组装具有共有的化合物条码的正向阅读片段。因为反向阅读片段仅具有3’板-ID，有可能序列组装可以发生在来自不同细胞的序列的正向和反向阅读片段之间。为避开这一潜在问题，组装的正向阅读片段和未组装的反向阅读片段两者的重链和轻链V(D)J 使用可以首先使用HighV-QUEST (http：//imgt.cines.fr/HighV-QUEST/index.action)鉴别。然后序列可以在使用一个组装的正向阅读片段和共有相同的V(D)J使用的反向阅读片段用Newbler再次组装之前进一步按照其V(D)J使用分组。这可以对于所有组装的正向阅读片段重复。也可以进行序列组装以对于核苷酸错配为不耐受的，从而防止共有相同的V(D)J使用的来自不同细胞的正向阅读片段和反向阅读片段的组装。以这种方式，来自不同细胞的高度相似序列之间反向阅读片段的不当序列组装可以大部分避免。

在列表中具有平台字段“454”、链类型字段“重”或“轻”、操作 ID“3”或“4”和序列类型“nb”的序列是从454阅读片段的组装产生的重叠群，使用这一命令行：runAssembly-cdna-o执行newbler输出 seqs.fastaq(其中seqs.fastq含FastQ格式的单一孔的修剪阅读片段)。

对于Newbler不产生恰好一个重链重叠群或恰好一个轻链重叠群的操作ID 3或操作ID 4的任何孔通过用mira组装进行再分析。在列表中具有平台字段“454”、链类型字段“重”或“轻”、操作ID“3” 或“4”和序列类型“multim50”或“zerom50”的序列是由这些组装产生的重叠群，使用这一命令行：mira--project＝seqs --job＝denovo，est，accurate，454454_SETTINGS-ED：ace＝yes -AL：egp＝no-CL：pvlc＝yes--fastq-notraceinfo执行mira。

名称为seqs_in.454.fastq的文件含有FastQ格式的单一孔的修剪阅读片段。

对于其中Newbler和mira使用上述组装命令都未产生重叠群的操作ID 3或操作ID 4的孔，执行不同的Newbler命令。在列表中具有平台字段“454”、链类型字段“重”或“轻”、操作ID“3”或“4”和序列类型“urt”的序列是由这些组装产生的重叠群，其中Newbler用这一命令行：runAssembly-cdna-ud-urt-o执行输出seqs.fastaq，其中 seqs.fastq含FastQ格式的单一孔的修剪阅读片段。

在列表中具有平台字段“PacBio”、链类型“重”和序列类型“pb”的序列是由来自PacBio平台的阅读片段的组装产生的重叠群，用这一命令行：mira--project＝seqs--job＝denovo，est，accurate，454 454_SETTINGS-ED：ace＝yes-AL：egp＝no-CL：pvlc＝yes--fastq -notraceinfo执行mira。

名称为seqs_in.454.fastq的文件含FastQ格式的单一孔的修剪阅读片段。

氨基酸序列

在列表中具有平台字段“454”和序列类型“nb-aa”、“urt-aa”、 “multim50-aa”或“zerom50-aa”的序列是通过翻译如“序列的组装”中描述的454阅读片段的组装的核苷酸序列确定的氨基酸序列。

在列表中具有平台字段“PacBio”和序列类型“pb-aa”的序列是通过翻译如“序列的组装”中描述的Pacifc Biosciences阅读片段的组装的核苷酸序列确定的氨基酸序列。

在列表中具有序列类型“sanger-aa”的序列是通过直接翻译通过 Sanger测序确定的阅读片段而确定的氨基酸序列。

其它测序数据分析选项

以上描述的数据分析的工程流程可用于准确地确定各细胞的重链和轻链序列。但是，这一信息对于我们的“选择筛选”方式(参见“表达的人抗体的筛选”)不是绝对必须的。为了使选择筛选起作用，我们首先将配对的抗体序列基于其重链V(D)J使用和轻链VJ使用聚类成克隆家族。因此，我们不需要免疫球蛋白重链和轻链的全序列，且可以使用充分的序列信息以确定V(D)J使用。因此，我们可以忍受测序错误且可以通过454或任何其它测序技术产生的低质量阅读片段。正向阅读片段的序列组装一般不是问题，因为所有序列可以在被组装之前首先按照其化合物条码分组。因为各化合物条码来自一个样品/细胞，因此对于具有相同化合物条码的各免疫球蛋白链仅具有一个“正确”的序列。不同链中的测序错误然后可以平均，因为不太可能所有测序错误在相同的碱基处发生，意味着获取共有碱基序列将给出最准确的序列。在模糊的情况中，一般改为选择具有高 Phred质量评分的碱基。因为454从3’端修剪序列阅读片段直到仅保留较高质量的阅读片段，这可以导致非常短的阅读片段。利用我们的方法，我们可以忍受低质量阅读片段并因此使用由454产生的长得多的阅读片段(400-500bp)。使用这些较长的阅读片段，我们可以确定V(D)J使用而不需要正向阅读片段与反向阅读片段的组装，从而在一些方面使得3’板-ID为非必要的。此外，最后一代454测序可以测序直到746bp的平均值和800bp的模式。因此，从仅正向阅读片段测序可能足以覆盖整个重链和轻链免疫球蛋白扩增子，也在一些方面使得3’板-ID为非必要的，因为不再需要将正向阅读片段与反向阅读片段组装。

抗体的选择和克隆

组装后，分析重链和轻链序列以选择用于表征的抗体。抗体基于预测的V(D)J种系使用和源自抗体序列的进化树的检查来选择。选择的抗体进行克隆、表达和以不同分析方法表征。

V(D)J分配

来自操作1和2的重链和轻链序列用V-QUEST(Brochet，X.等， Nucl.AcidsRes.36，W503-508(2008))软件(将抗体链序列与种系序列的已知等位基因的数据库比较，并预测用于抗体中的种系等位基因、种系序列如何重组及抗体中的相对于种系的突变的软件)进行分析。表18显示对于选择用于进一步表征的抗体的V-QUEST V(D)J 分配的结果，对于来自操作1和操作2的所有其它序列组装也获得相同的数据。来自操作3和操作4组装的一些序列也用SoDA(Volpe， Cowell和Kepler，Bioinformatics(2006)22(4)：438-444)(类似于 V-QUEST的软件)进行分析。

如果患者的基因组已经被测序，则基因组序列数据可以用作用于VDJ分配分析的种系序列，从而进一步提高可靠地鉴别患者的抗体序列中的体细胞超变的能力。

进化树和克隆家族

对应于来自操作1和2的重链的成熟肽的核苷酸序列分成对应于其所来源的患者的集合。从这些单个集合，软件clustalx2(Larkin MA，Blackshields G，Brown NP，ChennaR，McGettigan PA，McWilliam H，Valentin F，Wallace IM，Wilm A，Lopez R，Thompson JD，Gibson TJ， Higgins DG.(2007)Bioinformatics，23，2947-2948)用于使用所有参数的默认设置产生分配和树。

来自患者的序列的进化树也可以从来自单个克隆家族的序列集合构建。对于该家族的推定的祖先抗体重链和轻链序列可以推断，并且如果它们原先不存在于序列集合中则添加到该集合。对于该集合的进化树可以使用例如最大简约法、最大似然法或任何合适的算法构建，且树可以以祖先抗体的序列为根。树可以在仅重链或仅轻链的基础上构建或优选通过同时基于单个重链和轻链构建树，以使得树代表重链和轻链的共进化。

抗体选择

对于各患者，与从操作1或操作2序列构建的树结合来考察 V-QUEST结果的表格(在TreeViewX： http：//darwin.zoology.gla.a.c.uk/～rpage/treeviewx中观察)。基于V-QUEST数据选择代表性序列以覆盖存在的VDJ的不同家族，从而检查树上的相应序列以选择表现为进化枝的代表的序列。通常一个序列从各进化枝选择。一些选择的序列来自具有许多成员的家族，但一些也选自具有少数成员或一个成员的家族。选择的序列描述于表18中。对于表18中的各抗体，“抗体”列与序列表中的序列相关的名称的重叠群ID字段中“-”后的文字相同。

克隆的轻链和重链免疫球蛋白对的克隆和表达

载体

一种系统是从Invitrogen载体pcDNA3.3和pOptivec改进的新霉素和二氢叶酸还原酶(DHFR)选择载体系统。可选的系统是Lonza GS 系统，其中可扩增的选择标记是谷氨酰胺合成酶(GS)(参见下文)。编码免疫球蛋白κ轻链、λ轻链和γ重链的序列插入载体中。Kozak 共有序列和先导序列已存在于克隆中，且因此不需要工程化到载体中。合成恒定区以包含5’-侧翼限制性位点和一个或多个其它内部限制性位点。为利于改变的免疫球蛋白重链和轻链的克隆，插入片段被工程化而具有提高克隆本身不包含限制性位点且因此不被内部切割的可能性的多个限制性位点。插入片段在插入区域的5’端和在两个工程化到恒定区中的不同限制性位点处具有两个不同的8-切点限制性位点。5’限制性位点对于两种轻链是FseI和PacI，且对于γ重链是AscI和AsiSI。工程化到恒定区本身中的限制性位点对于两种轻链是NheI和XhoI，且对于γ重链是EcoRI和SacII。对于包含限制性位点的恒定区插入片段的序列参见表16。来自第一PCR反应的重链或轻链克隆然后利用克隆引物(其具有并入到克隆中的5’侧翼限制性位点)进行第二轮PCR。适宜的限制性酶用于切割表达载体和克隆，其现在具有互补性末端且使用T4 DNA连接酶连接到一起。 Invitrogen和Lonza GS载体系统都含可扩增选择标记。这一标记在 Invitrogen系统中是DHFR和在LonzaGS系统中是GS。在适宜的选择剂(对于DHFR是甲氨喋呤和对于葡萄糖合成酶(GS)是L-蛋氨酸亚砜亚胺)的选择压力下，与选择标记连接的基因与其一起扩增。利用更多拷贝的免疫球蛋白基因，存在更多的抗体分泌。当需要纯化大量的抗体用于后续的对于中和抗体的体内筛选时，这是有用的。

克隆和表达

假定在生发中心成熟过程中选择最高亲和力的浆母细胞，我们预期最高亲和力克隆家族也具有最高的克隆数目。此外，各克隆家族内的最高亲和力克隆也是该家族内最常见的克隆。在这些假设的基础上，在一些方面，我们选择从来自各患者样品的前5个最大克隆家族表达最高频率的克隆。克隆从第一PCR cDNA扩增，其中来自相同板的所有样品(各含单一细胞)已汇合到一起。正向引物包含样品-ID且因此仅扩增用该特定样品-ID条码标记的DNA。这是高度特异性的，因为样品-ID包含彼此之间的核苷酸差异。一些样品-ID可具有相同的克隆正向引物且通过这些引物扩增的克隆然后也必须通过细菌集落选择彼此区分。正向引物和反向引物两者包含允许克隆整合(利用对准的编码框)到已包含κ、λ或γ恒定区的载体中的侧翼限制性位点(第一和第二限制性位点区域)。克隆引物序列参见表4和5。轻链克隆到修饰的pcDNA3.3中，且重链克隆到修饰的 pOptivec中，或两个链克隆到Lonza GS双重表达载体中。哺乳动物细胞用编码免疫球蛋白重链和轻链基因的单独表达载体双重转染，或者用含重链和轻链基因两者的双重表达载体单一转染。然后收集含分泌的抗体的上清液并对所需的性能进行筛选。

在一些情况中，Ig基因的可变区可通过DNA合成进行克隆，并使用限制性酶和标准分子生物学将合成的DNA并入到含适宜恒定区的载体中。在合成过程中，不需要遵循精确的核苷酸序列，只要氨基酸序列不改变，除非诱变是需要的。这允许可导致更高表达水平的密码子优化。这也允许添加用于克隆目的的限制性位点。非翻译序列如5’UTR和条码序列不需要合成，且前导序列也可以交换为已知用于更高表达水平的其它信号肽序列。这些导致可以与高通量阅读片段非常不同但在表达时给出相同氨基酸序列的Ig核苷酸序列。

在一些情况中，在反转录过程中添加的样品-ID条码接合体也早已整合限制性酶位点。这产生PCR扩增子池中具有样品-ID条码3’ 侧的限制性位点的接合体。在用克隆引物克隆过程中，所需的扩增子使用与样品-ID条码序列互补的5’引物和链特异性3’引物(用于κ、 λ和γ链)从板特异性扩增子池扩增。3’引物将添加3’限制性位点。 5’引物不需要添加限制性位点，因为5’引物早已包含孔-ID条码3’ 侧的限制性位点。在这一扩增后，限制性酶用于切割扩增子用于连接到含恒定区插入片段的载体中。在限制性酶消化过程中，添加到 Ig基因序列的5’端的序列如条码和通用序列被切割，因为它们在5’ 限制性位点的5’侧。

用于克隆和表达的可选方法

在另一个方面，Ig基因的可变区可以通过DNA合成进行克隆，并使用限制性酶和标准分子生物学将合成的DNA并入到含合适恒定区的载体中。在合成过程中，不需要遵循精确的核苷酸序列，只要氨基酸序列不改变，除非诱变是需要的。这允许可导致更高表达水平的密码子优化。这也允许添加用于克隆目的的限制性位点。非翻译序列如5’UTR和条码序列不需要合成，前导序列也可以交换为已知用于更高表达水平的其它信号肽序列。这些产生可以与高通量阅读片段非常不同但在表达时给出相同氨基酸序列的Ig核苷酸序列。

在另一个方面，在反转录过程中添加的孔-ID条码接合体也早已整合限制性酶位点。这产生PCR扩增子池中具有孔-ID条码3’侧的限制性位点的接合体。在用克隆引物克隆过程中，所需的扩增子使用与孔-ID条码序列互补的5’引物和链特异性3’引物(用于κ、λ和γ链)从板特异性的扩增子池扩增。3’引物将添加3’限制性位点。不需要5’引物以添加限制性位点，因为5’引物早已包含孔-ID条码3’ 侧的限制性位点。在这一扩增后，限制性酶用于切割扩增子以用于连接到含恒定区插入片段的载体中。在限制性酶消化过程中，添加到Ig基因序列的5’端的序列如条码和通用序列被去除，因为它们在 5’限制性位点的5’侧。

重链和轻链克隆到Lonza载体中

克隆免疫球蛋白恒定区

Lonza载体通过斯坦福大学与Lonza的学术许可协议获得。κ和 λ轻链插入载体pEE12.4中且γ重链插入载体pEE6.4中。重链和轻链序列以两个步骤克隆：第一，恒定区被克隆到其中，之后是免疫球蛋白链的5’端(前导和V(D)J序列)。恒定区插入片段通过Intergrated DNA Technologies(IDT)进行基因合成，并包含用于基因优化和限制性位点并入的合适静默突变。插入片段从IDT在其专有的pIDTSmart载体中获得。插入序列在表17中。IgG1用作γ重链恒定区。使用的等位基因对于κ、λ和γ链分别是Km3、Mcg^-Ke^-Oz^-和G1m3。为将恒定区整合到Lonza载体中，Lonza载体和pIDTSmart- 恒定区插入片段全都单独地转化到感受态的dam-dcm-大肠杆菌中且质粒使用Qiagen miniprep试剂盒按照制造商的说明纯化。然后质粒使用HindIII和BclI在37℃下消化1小时并在1.2％琼脂糖凝胶上以150V运行1小时。消化的Lonza载体和恒定区插入片段进行凝胶纯化和使用T4 DNA连接酶在RT下以3∶1的插入片段：载体比率连接(具有Km3或Mcg^-Ke^-Oz^-轻链的pEE12.4和具有G1m3γ1重链的 pEE6.4)10分钟。T4 DNA连接酶然后在70℃下灭活8分钟且5ul 的连接混合物使用标准的分子生物学技术转化到热休克的感受态 TOP10细胞中。挑取集落并通过Sanger测序验证插入。

克隆免疫球蛋白可变区

接着，含λ或κ轻链的pEE12.4在37℃下使用AscI和XmaI消化5小时并凝胶纯化。含γ1重链的pEE6.4在37℃下使用AscI和 AgeI消化5小时并凝胶纯化。选择的扩增子使用孔-ID特异性正向引物和恒定区特异性反向引物(表4和5)从第一PCR的特定板-ID 100x稀释液选择性扩增。正向引物具有引物的5’端上的限制性位点 AscI，且反向引物分别对于轻链和重链引物恒定区引物含XmaI或 AgeI限制性位点。PCR循环使用98℃下30秒的初始变性及35-45 个循环的98℃下10秒、68℃下15秒和72℃下20秒进行。最终延伸是72℃下5分钟和保持在4℃下不定时。PCR产物使用来自 Millipore的PCR_u96超滤板按照制造商的说明纯化。这之后，PCR产物对于轻链使用AscI和XmaI及对于γ1重链使用AscI和AgeI在37℃ 下双重消化3小时。消化的产物然后在2.5％低熔琼脂糖上用gelgeen (Biotium)分析并在蓝光下可视化。切除含适宜尺寸的条带的凝胶条。在凝胶中，连接通过在65℃下熔化凝胶条并添加适宜的消化和 Antarctic磷酸酶(NEB)处理的含恒定区插入片段的Lonza载体，并且与T4 DNA连接酶在RT下孵育1-3小时而进行。热休克的感受态细菌然后转化和接种在氨苄青霉素琼脂上。挑取每构建体6个克隆并生长在2xLB(2x浓缩的Luria-Bertani肉汤)中。Miniprep使用 Millipore的Multiscreen 96-孔过滤板按照制造商的说明(www.millipore.com/techpublications/tecg1/tn004)进行以获得质粒 DNA。菌落PCR使用95℃下5分钟的初始变性，以及40个循环的 95℃下1分钟、50℃下2分钟、72℃下1分钟及72℃下5分钟的最终延伸和保持在4℃下不定时而进行。具有适宜插入片段的克隆发送用于在Sequetech，Mountain View，CA，USA处进行Sanger测序。克隆VDJ鉴别使用IMGTHIGHV-Quest进行且正确的克隆保持作为细菌原种(用15％甘油储存在-80℃下)和质粒两者。

单克隆抗体在293T中的表达

配对的pEE12.4-轻链和pEE6.4-重链构建体的瞬时双重转染使用 Lipofectamine2000按照制造商的方案进行。转染在48-孔、24-孔、 6-孔、60mm和100mm盘中进行。简而言之，293T细胞在 DMEM+10％超低IgG FBS(Invitrogen)中培养以在下游蛋白A纯化步骤防止牛IgG与分泌的人IgG竞争。293T细胞培养20代，然后解冻和使用新的等份的液N₂。对于48-孔板转染，各孔在前一天用8x10⁴个细胞接种，并允许在下一天生长到～90％汇合。50ng的各重链和轻链构建体在50ul最终体积的Optimem培养基中孵育，并且 Lipofectamine2000也用50ul的Optimem培养基单独地孵育。两次孵育都是5-25分钟。Lipofectamine2000和构建体然后通过温和吸液进行混合，并在添加到293T细胞之前孵育20分钟和温和地混合。第二天更换培养基，并在两周时间内每隔一天(例如，星期一、星期三和星期五)收集培养上清液。对于其它大小的转染，使用以下量的构建体和Lipofectamine 2000：对于24-孔板转染，使用100ng的各构建体及1.25ul的Lipofectamine2000。对于60mm盘，使用625ng 的各构建体及12.5ul的Lipofectamine 2000。对于100mm盘转染， 3ug的各构建体在37.5ul的Lipofectamine 2000中使用。

抗-人IgG ELISA

在一些情况中，对样品进行人IgG ELISA以定量培养上清液中表达的IgG的量，且培养上清液在抗体量标准化后直接用于下游应用。抗-人IgG ELISA定量试剂盒购自Bethyl Laboratories并按照制造商的说明进行。简而言之，100ul的捕获抗体在4℃下涂布在Nunc Maxisorp板上过夜并用PBST(具有0.05％Tween20的PBS)洗涤 5x。孔用PBS中的1％BSA封闭1小时，然后用PBST洗涤5x。孔然后在RT下与来自试剂盒的适当标准稀释液或稀释的培养上清液孵育1小时，然后用PBST洗涤5x。100ul稀释的HRP检测抗体添加到各孔中并在RT下孵育1小时，然后用PBST洗涤5x。添加50ul 的TMB底物溶液并用50ul的终止液停止反应。吸光度在SpectraMax M5分光光度计上450nm处读取，并用4-参数曲线生成标准曲线。抗体在具有0.1％叠氮化钠作为防腐剂的PBS中保持在4℃下。

表达的单克隆抗体的蛋白A-IgG纯化

在其它情况中，抗体首先从培养上清液纯化并在使用前使用 BCA定量。简而言之，在两周时间内培养上清液一周3次收集到50ml 管中并以0.1％叠氮化钠作为添加剂储存在4℃下直到蛋白A-IgG纯化。培养上清液离心并倾倒以除去任何细胞聚集物。1M pH 9.0Tris 添加到培养上清液中以确保pH在7.5-8.0之间，如通过pH试纸条测定的。蛋白A+琼脂糖珠(Pierce)用PBS洗涤2x，然后400ul的50％浆液添加到培养上清液中并在4℃下在旋转器上孵育过夜以确保珠的均匀混合。珠通过以1000g旋转培养上清液5分钟回收并从管的底部吸出珠到5ml重力流柱中。珠用4x2ml的PBS洗涤，然后用 2x 1.5ml的IgG洗脱缓冲液(Pierce)(其为低pH洗脱缓冲液)洗脱到 Amicon-4100kDa浓缩柱中。洗脱的抗体立即用400ul的1M Tris pH8.0中和。抗体然后通过在Amicon-4 100kDa浓缩器中以1000g旋转10分钟进行浓缩，接着是PBS的2mL洗涤和具有1％叠氮化钠的 PBS的2mL洗涤。抗体浓度通过BCA分析测定，并调节到0.5mg/ml。蛋白A+琼脂糖通过用1x2ml的PBS、3x2ml的IgG洗脱缓冲液洗涤和具有0.1％叠氮化钠的3ml PBS洗涤进行再生，并保持在4℃下。柱可以再生最多5次。

表达的人抗体的筛选

抗体-抗原结合的筛选

选择的抗体(参见以上“克隆和表达”章节)首先筛选其结合目标抗原的能力，然后表达整个克隆家族的抗体并筛选其阻断或中和抗原的能力(参见以下“功能筛选”)。含目标抗体的上清液中的 IgG浓度首先通过IgG ELISA测定，以使得相同量的IgG可用于抗体-抗原结合筛选中的各样品。在其它情况中，IgG使用蛋白A琼脂糖珠从上清液纯化，并使用牛免疫球蛋白作为标准利用BCA分析定量。纯化的IgG然后在用于筛选抗体之前标准化到相同的浓度。为筛选结合抗原的抗体，我们进行间接ELISA。96-孔板用目标抗原涂覆过夜，且然后洗掉过量抗原。含目标抗体的上清液然后添加到孔中并孵育4小时，之后孔进行洗涤。作为阳性对照，对抗原特异性的已知量的商业可得抗体(来自非人物种)添加到含抗原的单独的孔中。作为阴性对照，对于不相关抗原特异性的商业可得抗体添加到含目标抗原的单独的孔中。HRP-偶联的第二抗体然后添加到孔中，孵育30分钟并洗掉过量的抗体。四甲联苯胺(TMB)然后添加到板上，且允许反应继续进行直到在阳性孔中观察到颜色。然后反应用酸终止，并测量吸光度。如果特定的孔上清液产生的吸光度读数显著高于在阴性对照中观察到的，则它们视为包含结合目标抗原的抗体。

Fluzone ELISA

志愿者施用来自Fluzone的2010/2011季流感疫苗，其由3株灭活病毒(A/California/7/2009、A/Perth/16/2009、B/Brisbane/60/2008 株)组成。进行FluzoneELISA以确定是否源自疫苗接种的志愿者的单克隆抗体结合流感疫苗本身以作为具有结合活性的表达抗体的初始筛选。Fluzone疫苗在pH9碳酸盐缓冲液中稀释100x并在RT下涂布在Nunc Maxisorp板上1小时或在4℃下过夜。板然后用PBST (PBSw/0.05％Tween20)洗涤5x并在RT下用PBS w/1％BSA封闭1 小时。100ul的100ng/ml表达的流感抗体然后在RT下添加到孔中1 小时，之后用PBST洗涤5x和在RT下添加稀释的HRP检测抗体(来自Bethyl Labs人IgG ELISA定量试剂盒)1小时。板用PBST洗涤 5x并添加50ul的TMB底物。使得显色最多30min，然后用50ul的终止溶液终止反应。板在SpectroMax M5分光光度计上读取450nm 处吸光度。这一分析中使用的抗体描述于表19中。抗体的序列可以在主表表18中提到。

流感抗体亲和力的表面等离子体共振测定

单克隆抗体(mAb)与HA分子的结合在25℃下使用ProteOn表面等离子体共振生物传感器(BioRad Labs)分析。源自流感疫苗接种的供体的浆母细胞的表达流感单克隆抗体(25nM在pH 4.5乙酸盐缓冲液中)使用EDAC-NHS化学利用氨基偶联在测试流动池中以800共振单位(RU)的目标密度偶联到GLC传感器芯片上。未反应的活性酯基团用乙醇胺淬灭。纯化的重组血细胞凝集素H3 (HA(ΔTM)(H3N2/Perth/16/2009)和H1 (HA(ΔTM)(A/California/07/2009)(H1N1))购自Immune Technology Corp.(New York，NY)并稀释到100、50、25、12.5、6.25nM，其与空白缓冲液对照一起以30μL/min的流速注射，接触时间为120秒和解离时间为2000秒。结合动力学和数据分析采用BioRad ProteON管理软件进行。亲和力测量使用二价分析物算法计算，因为HA由几个重复单元组成。拟合的曲线的准确性通过检验各拟合的优度的χ²值低于峰结合值(Rmax)的10％而证实。用于这一分析中的抗体描述于表20中。抗体的序列可以在主表表18中提到。

在RA抗原微阵列上的RA抗体反应性

为打印抗原微阵列，抗原在磷酸盐缓冲盐水中稀释到0.2mg/mL 并使用ArrayItNanoPrint Protein LM210系统连接到ArrayIt SuperEpoxy载玻片上。载玻片用疏水性标记免疫组化笔(hydrophobic marker pap pen)标记并在具有3％胎牛血清和0.05％Tween20的PBS 中在4℃下封闭过夜，以30rpm轻轻振摇。阵列用400uL的40ug/mL 单克隆抗体在4℃下探测1小时，以30rpm轻轻振摇。然后阵列进行洗涤并在以1∶2500稀释的Cy3偶联抗人IgG/IgM第二抗体中在 4℃下孵育45分钟，以30rpm轻轻振摇。在另一洗涤后，载玻片使用GenePix 4300A微阵列扫描仪扫描。GenePix 7软件用于发现各特征的中值荧光强度和背景。

为分析数据，从各特征减去背景荧光强度并表示为各阵列上四个抗原特征的中值。中值强度以10的截止值对数转换。这些值使用 Cluster软件基于彼此的相似性以排列抗原而进行分级聚类。关系使用Java TreeView软件展示为热图。用于这一分析中的抗体描述于表21中。抗体的序列可以在主表表18中提到。

抗-组蛋白2A ELISA

直接ELISA用于针对组蛋白2A的抗体的检测。微滴定板(Nunc Maxisorp)以20μg/ml在碳酸盐缓冲液中用100μl的重组H2A涂覆，并在4℃下孵育过夜。在含1％牛血清白蛋白(BSA)的PBS中封闭后， RA患者来源的抗体在稀释缓冲液(含0.1％BSA和0.1％Tween-20 的PBS)中以15ug/ml至250ug/ml的滴度使用，以100μl/孔一式两份添加到板上，并在室温下孵育2小时。样品然后在室温下与单克隆体辣根过氧化物酶标记的山羊抗人抗体的1∶5,000稀释液孵育1小时。反应通过应用3，3′，5，5′-四甲基联苯胺底物(TMB)(Sigma-Aldrich) 进行15分钟，并通过添加50μl的2N H₂SO₄终止。针对的抗体的相对定量使用已知血清型RA血清作为阳性对照通过光密度测量法在 450nm处进行。用于这一分析中的抗体描述于表22中。抗体的序列可以在主表表18中提到。

抗-CCP2 ELISA

抗-CCP2 ELISA按照制造商的说明(Eurodiagnostica，Malmo， Sweden)进行。简而言之，源自RA患者的抗体在稀释缓冲液(含0.1％ BSA和0.1％Tween-20的PBS)中稀释至大约125ug/ml，以100μl/ 孔添加到预封闭的商业CCP2 ELISA板，并在室温下孵育2小时。样品然后在室温下与单克隆辣根过氧化物酶标记的山羊抗人抗体的 1∶5,000稀释液孵育1小时。反应通过应用3，3′，5，5′-四甲基联苯胺底物(TMB)(Sigma-Aldrich)进行15分钟，并通过添加50μl的2N H₂SO₄终止。针对的抗体的相对定量通过光密度测量法使用由零售商提供的标准品和已知阳性RA血清进行。用于这一分析中的抗体描述于表22中。抗体的序列可以在主表表18中提到。

抗-类风湿因子ELISA

对于针对类风湿因子(RF)的抗体的检测，微滴定板(Nunc Maxisorp)用碳酸盐缓冲液中10ug/ml的兔IgG涂覆，并在4℃下孵育过夜。在含0.1％胎牛血清(BSA)的PBS中封闭后，RA患者来源的抗体为5ug/ml稀释缓冲液(含0.1％BSA和0.1％Tween-20的PBS)，以100μl/孔一式两份添加到板上，并在室温下孵育2小时。样品然后在室温下与单克隆辣根过氧化物酶标记的山羊抗人抗体的1∶5,000 稀释液孵育1小时。反应通过应用3，3′，5，5′-四甲基联苯胺底物(TMB) (Sigma-Aldrich)进行15分钟，并通过添加50μl的2N H₂SO₄终止。针对的抗体的相对定量通过光密度测量法使用两个已知的RF+对照血清作为阳性对照在450nm处进行。用于这一分析中的抗体描述于表23中。抗体的序列可以在主表表18中提到。

来自肺腺癌患者的抗体在肺癌组织阵列上的免疫组织化学

两种不同类型的组织微阵列载玻片购自US Biomax。它们是VLC 12和BS0481。多种肺癌组织核包括在载玻片上，包括肺腺癌，且也包括正常肺组织对照。载玻片在柠檬酸盐pH6.0抗原修复缓冲液中 95-99℃下加热40分钟，之后使其冷却到RT。载玻片用0.02％Triton-X和0.6％H₂O₂预处理20分钟。然后载玻片用10％正常山羊血清在TBST(具有0.05％Tween20的TBS)中封闭2小时，之后进一步在100ug/ml的F(ab)山羊-抗人IgG(JacksonImmunoresearch)中 4℃下封闭过夜。然后载玻片按照制造商的说明进行抗生物素蛋白/生物素封闭(Vector Laboratories)。然后载玻片在5或10ug/ml的表达肺抗体中在室温下孵育1小时，用TBST洗涤3x5分钟，且然后与生物素化的山羊-抗人第二抗体在RT下孵育20分钟。然后载玻片用 TBST洗涤3x5分钟并与制备的Vectastain ABC试剂在RT下孵育30 分钟。然后载玻片用TBST洗涤3x5分钟并用Vector Red(Vector Laboratories)染色和用光学显微镜追踪显色。在适当的染色时间后，反应通过用蒸馏水洗涤终止并用苏木精复染。载玻片被水性加载并用BX-51显微镜拍照。用于这一分析中的抗体描述于表24中。抗体的序列可以在主表表18中提到。

由肺腺癌患者表达的抗体与肺癌细胞系结合的流式细胞术测定

使用的肺癌细胞系是A549、H226、H441、H23、H1975、H1437、 H2126、H1650和H2009。HEK 293T细胞也用作阴性对照。细胞通过在不含Ca²⁺和Mg²⁺含2mM EDTA的PBS中37℃下孵育1小时脱离。这是为防止用胰蛋白酶消化或任何其它蛋白水解消化以脱离细胞可能造成的细胞表面抗原损伤。细胞用FACS缓冲液(具有2％FCS 的HBSS)洗涤一次，之后悬浮在50ul的FACS缓冲液中并与10ug/ml、 3ug/ml、1ug/ml、0.2ug/ml的表达的肺抗体孵育以滴定剂量。最佳浓度发现为0.2-1ug/ml的范围。因此，随后使用1ug/ml、0.5ug/ml、 0.25ug/ml的肺抗体。肺抗体在4℃下孵育30分钟，之后在96-孔板中用2x 200ul的FACS缓冲液洗涤。然后添加抗-人IgG-PE并在黑暗中4℃下孵育15分钟。然后样品用FACS缓冲液洗涤2x200ul并重悬在200ul的FACS缓冲液中和在BD LSR II或LSR Fortessa上进行分析。Sytox蓝用作活/死染色。用于这一分析中的抗体描述于表 24中。抗体的序列可以在主表表18中提到。

葡萄球菌流式细胞术

固定的金黄色葡萄球菌颗粒(Wood菌株)从Invitrogen获得。 Wood菌株是由一些细菌表达最小蛋白A的菌株。颗粒以10x10⁶细胞/50ul悬浮在50ul的FACS缓冲液中，并用源自葡萄球菌个体的 10ug/ml、5ug/ml或1ug/ml滴度的表达抗体在4℃下孵育1小时。固定的葡萄球菌颗粒然后用FACS缓冲液洗涤两次，之后在黑暗中4℃ 下与抗-人IgG-FITC抗体孵育15min。颗粒然后用1ml的FACS缓冲液洗涤并重悬在200ul的FACS缓冲液用于在BD LSRII或LSR Fortessa上的分析。用于这一分析中的抗体描述于表25中。抗体的序列可以在主表表18中提到。

功能筛选

对于受体-配体相互作用的阻断抗体

为筛选抗体阻断配体-受体相互作用(例如，细胞因子-受体相互作用)的能力，我们用编码适当受体的载体转染293T细胞。这些293T 细胞也用NF-κB-依赖性萤光素酶受体稳定地转染-从而在NF-κB激活时这些稳定转染的293T细胞表达萤光素酶。我们然后在候选抗体存在或不存在的情况下用适宜的抗体培养转染的293T细胞。293T 细胞最后通过测量萤光素酶依赖性光发射对萤光素酶表达进行分析。配体与其受体之间的相互作用，例如IL-17A与IL-17R之间的相互作用，激活NF-KB。阻断抗体阻止配体-受体结合的NF-κB信号传导并因此消除萤光素酶的表达，在其中配体-受体相互作用不激活 NF-κB的情况中，其它转录反应元件用于驱动萤光素酶基因的启动子，例如AP-1反应元件等。

筛选抗体抑制细胞因子功能或抑制功能分析的能力

功能分析也可以用于筛选患者血清中或克隆和表达的抗体中的抗-细胞因子抗体。在这一途径中，表达的人抗体测试其抑制细胞因子或其它的细胞反应的免疫介质诱导。

靶向细菌、病毒感染的细胞、寄生虫或癌症细胞的抗体

为筛选杀灭或中和细菌、病毒感染的细胞、寄生虫或癌症细胞的抗体，我们在抗体存在或不存在的情况下与非热灭活血清(其包含补体因子)一起培养适宜的细胞类型。如果抗体是中和抗体，其调理(opsonize)细菌、其它微生物或癌症细胞并激活形成膜攻击复合体(MAC)(其诱导细胞死亡)的补体成分。为测试中和作用，我们进行荧光活/死分析(Invitrogen)，其中活细胞和死细胞用不同的荧光团染色。细胞可以通过使用流式细胞术分析活细胞和死细胞的百分比。导致最高死细胞百分比的抗体将是良好的候选中和抗体，其进一步在体内筛选中进行分析。

中和病毒的抗体

为筛选中和病毒的抗体，我们进行标准的空斑减少分析或其它体外细胞感染分析。中和抗体预期减少细胞的病毒感染。候选抗体然后在体内模型中测试。

流感病毒微中和分析

显示出与Fluzone ELISA的结合活性的一些表达的流感病毒抗体发送到外部CRO，Virapur，LLC用于微中和分析。简而言之，各抗体的两倍稀释(从100ug/ml开始)在96孔板的孔中一式四份地与等体积的约100TCID₅₀感染单位的滴定原病毒悬液混合。病毒/抗体溶液孵育2小时并随后混合物转移到含80％汇合的MDCK细胞的96 孔板。细胞、抗体和病毒在37℃下孵育另外的2小时，这之后除去病毒，冲洗单层并将病毒生长培养基添加到各孔。孔在72小时后用显微镜观察流感病毒感染的存在。用于这一分析中的抗体描述于表26中。抗体的序列可以在主表表18中提到。

葡萄球菌抑制分析

使用处于对数期生长的金黄色葡萄球菌。它们添加到96-孔聚丙烯板中，且来自葡萄球菌患者的抗葡萄球菌抗体以10ug/ml添加。幼兔补体(Cedarlane)以制造商推荐的量添加并充分混合。板在以1∶10、 1∶100和1∶1000稀释之前在37℃下孵育45分钟，并接种在5％TSA 血液琼脂板上和生长过夜。计数细菌CFU并在第二天制表 (tabulated)。用于这一分析中的抗体描述于表27中。抗体的序列可以在主表表18中提到。

葡萄球菌抗原与源自葡萄球菌感染患者的抗体的免疫沉淀

葡萄球菌蛋白质裂解液通过使用具有100ng/ml的溶葡萄菌素的 B-PerBacterial Protein Extraction Reagent(Pierce)在RT下与1x Halt 蛋白质抑制剂一起裂解金黄色葡萄球菌30分钟而制备，并通过在微量离心机中以15000rpm离心与不溶性部分分离。裂解液通过在RT 下与蛋白G Dynabeads孵育1小时预清洁。5ug的源自葡萄球菌患者的抗体通过在RT下孵育1小时结合到蛋白G Dynabeads上。蛋白 G-结合的抗体然后在4℃下与预清洁的葡萄球菌裂解液孵育过夜。珠然后用PBST(含0.1％Tween20的PBS)洗涤3x并在95℃下用 5x还原性泳道样品缓冲液(Thermo Scientific)加热5分钟，之后在 4-12％Criterion Bis-Tris凝胶上运行SDS-PAGE。蛋白质用 RAPIDStain Reagent(Calbiochem)可视化。用于这一分析中的抗体描述于表28中。抗体的序列可以在主表表18中提到。

肽的质谱鉴别

染色的目标蛋白质条带从凝胶切除，浸入含10mM DTT和100 mM碘乙酰胺的10mM碳酸氢铵中，用100％乙腈处理，且然后在37℃下在含10％乙腈的10 mM乙酸铵中用0.1 mg胰蛋白酶 (Sigma-Aldrich)消化过夜。胰蛋白酶消化的蛋白质如先前描述的 (Lopez-AvilaV，SharpeO，Robinson WH：Determinationof ceruloplasminin human serum bySEC-ICPMS.Anal Bioanal Chem 2006，386：180-7.)通过使用Agilent 1100 LC系统和Agilent XCT Ultra Ion Trap(Agilent Technologies，Santa Clara，CA)用LCMS鉴别。LCMS 数据通过使用SpectrumMill软件(Agilent)针对SwissProt或NCBInr 数据库进行扫描以检测用于鉴别蛋白质的肽。用于该分析中的抗体描述于表29中。

实施例1：来自单个B细胞的配对重链和轻链序列的高通量测序

我们开发了添加化合物条码(样品-ID+板-ID)到序列上以明确地鉴别哪些序列来源于板中的相同孔的方法。我们使用这一途径以测序来自单个B细胞的配对重链和轻链免疫球蛋白基因。单个B 细胞可以通过流式细胞术从血液、整批外周血单核细胞(PBMC)、整批B细胞、浆母细胞、浆细胞、记忆B细胞或其它B细胞群体分选 (图1)。

首先，B细胞经单细胞分选到96-孔PCR板中，一列孔保持为空作为阴性对照。含不同样品-ID条码的寡核苷酸在反转录(RT)过程中添加到不同的孔中。在反转录mRNA后，MMLV H^-反转录酶转换模板并转录寡核苷酸，从而将其和样品-ID条码并入第一链cDNA的3’ 端中(图2a)。来自一个板的所有cDNA(用样品-ID条码标记的)然后汇合并进行两轮PCR。在PCR过程中，454测序引物(第一和第二测序区域)和板-ID条码通过使用具有5’-侧翼条码序列的PCR引物添加到扩增子的5’和3’端上。来自不同板的扩增子(扩增子区域)现在具有n个不同板-ID，且包含板-ID和样品-ID的化合物条码明确地鉴别序列为来自特定的细胞，从而允许测序的重链和轻链基因的配对(图2b-c)。

图3描述了使用的一般方法和相关的序列。引物和接合体分子显示于表1中。样品-ID序列显示于表2中。板-ID序列显示于表3 中。克隆引物显示于表4中，其中克隆正向引物的3’序列显示于表5 中。

我们获得预期大小的PCR产物：对于κ和λ轻链～600bp和对于 γ重链～700bp(图4a)。接着，我们将材料发送用于Sanger测序。我们获得通过NCBI BLAST鉴定为κ、λ和γ链的序列(数据未显示)。 DNA色谱的进一步研究显示在样品-ID条码处开始的几个峰的混合，表明我们在RT过程中成功地将样品-ID条码添加到来自不同孔的细胞的cDNA并成功地在两轮后续PCR中扩增它们(图4b)。来自3’端的Sanger测序链也显示在VJ接合区处开始的几个峰的混合(由于来自不同细胞的基因的扩增)，其由于不同V和J基因的插入和删除和随机重组而在VJ接合区后不同。此外，当我们用对于孔A1样品-ID特异性的克隆引物进行PCR时，我们获得单一峰而不是几个峰的混合，表明我们事实上可以扩增来自池内的特定细胞的序列(图 4c-d)。

实施例2：用于浆母细胞的单一细胞分选的选通方案

对于该实验，浆母细胞定义为CD19⁺CD20^-CD27⁺CD38⁺⁺。图22 显示用于单一浆母细胞流式细胞分选到96-孔板中的选通方案。

制备单一PBMC并如上所述染色。细胞首先基于其FSC和SSC 特性选通(数据未显示)。活的CD19⁺B细胞然后选通(左图)，并进一步缩窄到CD20^-B细胞(从左数第二图)和优化到 CD27⁺CD38⁺⁺细胞。由此，IgG⁺浆母细胞确定为IgA-和IgM-，因为 IgG⁺浆母细胞不表达细胞表面IgG。这一群体单一细胞分选到96-孔板中。

实施例3：浆母细胞存在于经历免疫激发的受试者中

浆母细胞在健康供体中一般代表B细胞的约0.15％，但在经历多种免疫激发包括感染(例如，金黄色葡萄球菌和艰难梭菌感染)、与非进展相关的癌症(例如，转移性黑素瘤和肺的转移性腺癌，其中患者在介入(在肺腺癌患者的情况中的化疗和在转移性黑素瘤患者的情况中的易普利单抗(ipilimumab))后变成与活性B细胞反应相关的长期非进展者)和疫苗接种(例如，流感)的受试者中的范围为约3.3％-16.4％。

图23显示浆母细胞存在于广泛的受试者中并可从其获得以用于配对的抗体谱的高通量测序和活性体液反应抗体谱的表征。这证明本文中公开的方法可用于获得重链和轻链(H＆L)的进化树并使用这一信息以克隆和/或表达抗体用于：例如，a)新抗原的发现；b)为疫苗设计提供信息-例如，使用免疫系统以使我们知道哪些是已知的和新抗原很可能可用于调理和吞噬作用和/或杀死/抑制目标病原体或靶标，并任选地将其用于疫苗设计中；c)例如，从疫苗制备中和单克隆抗体；d)制备结合单克隆抗体；e)制备针对微生物病原体的抗体；和f)制备针对癌症的抗体。这些的实例更详细地在下面描述。

实施例4：CCP+RA中的疾病活动性与循环浆母细胞相关

已经证明我们的方法可以用于可鉴别对中免疫球蛋白基因的测序，我们使用我们的方法研究CCP+RA患者中浆母细胞的抗体谱。我们从同意的RA患者获得血液样品并通过流式细胞术对浆母细胞染色(图5a)。循环浆母细胞表示为总PBMC的百分比。我们发现CCP+ RA患者具有显著高于CCP-RA患者的外周血浆母细胞百分比(图 5b)。此外，CCP+患者中的浆母细胞百分比与疾病活动性相关(r＝0.35 和p＝0.028)，但在CCP-患者中不相关(图5c)。

实施例5：浆母细胞产生抗-CCP抗体

虽然CCP+患者具有与疾病活动性相关的浆母细胞百分比，这些患者可以具有正在发生的感染或提升其循环浆母细胞百分比的其它因素。为确定CCP+患者中循环浆母细胞的特异性，来自患者的 RosetteSep-富集的B细胞在补充10％FBS的RPMI中培养。不使用其它培养基补充剂如抗-IgM、IL-6、BAFF等以使得浆母细胞为分泌抗体的仅有细胞(其它B细胞保持失活)。为证实仅浆母细胞产生抗体，我们耗竭一些样品的浆母细胞(图5d)。然后B细胞在收集上清液和在Luminex肽阵列上分析之前培养几天。阵列分析抗体对瓜氨酸化肽的反应性。与伪耗竭B细胞的上清液相比，抗体反应性不存在于浆母细胞耗竭样品的上清液中，表明浆母细胞分泌大量的抗- 瓜氨酸肽自身抗体(图5e)。此外，当对于各样品计数具有高于60的平均荧光强度(MFI)的肽时，在循环浆母细胞百分比和抗体与之反应的肽的数目之间发现强相关性(r＝0.90和p＝0.0139)。选择60的 MFI，因为这是其之下>99％的肽反应性落在浆母细胞耗竭样品的上清液中的域值。

实施例6：454测序和序列的分析

来自患者的浆母细胞如上所述单一细胞分选到96-孔板中，且其 RNA按照在“材料和方法”章节中的“降落PCR”反转录并PCR扩增以使得它们包含样品-ID(样品识别区域)和板-ID(板识别区域)条码，如上所述。参见图3。cDNA的序列然后从454-测序机构(DNASequencing Center，Brigham Young University和454测序中心，Roche) 获得。

序列使用散弹途径从第一454测序操作获得。具有可接受质量的序列通过454 GSFLX数据分析套装的改进的扩增子过滤器从第二454测序操作获得。改进扩增子过滤器以使<vfScanAllFlows>设定为“假”和<vfBadFlowThreshold>改变为“6”。来自第三和第四操作的序列使用标准454扩增子过滤器获得。经过过滤器的序列然后如在 “材料和方法”中的“序列分配到孔”节中描述的进行处理，且各孔中的序列如在“材料和方法”中的“序列的组装”中描述的单个组装。然后组装的序列用IMGT HighV-Quest解析以获得所使用的VDJ区域的鉴别。

在序列组装和V(D)J使用鉴别后，ClustalX用于将序列聚类成克隆家族(图6)。或者，序列可以使用正向和反向阅读片段两者组装。在这种情况中，细分的正向序列首先如上所述组装。正向和反向序列V(D)J使用然后利用HighV-QUEST鉴别且正向和反向序列按照板 -ID和V(D)J使用分成亚集，且正向和反向序列使用Newbler组装。因为免疫球蛋白序列大部分相似，来自较小序列亚集的组装避免来自不同细胞的序列不正确配对的潜在问题。

实施例7：序列群聚到进化树中

外周血单核细胞(PBMC)从具有所示诊断的或在疫苗接种后的人类受试者分离。浆母细胞单一细胞分选到96-孔板的单个孔中，使得各孔中生成单一细胞样品，然后各孔中的mRNA反转录，且然后汇合孔内容物并进行两轮PCR以扩增免疫球蛋白重链和轻链cDNA。反转录将识别样品-ID添加到从各单一样品产生的所有cDNA上，且第一轮和第二轮将板-ID及随后将454钛引物A和B分别添加到每一扩增子上，如在“材料和方法”章节中“降落PCR和非-降落PCR” 中所描述的。一般方法在图3中概述。汇合的扩增子用454测序技术测序，如上所述获得具有可接受质量的阅读片段。如在“材料和方法”的“阅读片段分配到孔”和“序列的组装”节中描述的阅读片段分配到孔中并组装。组装的序列中的V(D)J片段然后使用HighV-QUEST 识别。具有共有化合物条码的鉴别的重链和轻链序列然后可以通过将组装的序列与匹配的化合物条码放在一起简单地配对。

来自单个人类受试者的扩增子基于这些V(D)J片段聚类，并且表达相同V(D)J片段的序列分类为来自相同的克隆家族(图7)。各饼图代表源自表达相同V(D)J基因片段的单个人类受试者的单个浆母细胞的克隆的百分比(即，各克隆家族中的克隆百分比)。人类受试者包括具有脓毒症(2个受试者)、类风湿性关节炎(3个受试者)、肺癌(1个受试者)和针对流感的疫苗接种后(1个受试者)的那些受试者。选择这些受试者以证明克隆家族可以从经历急性状况(脓毒症和流感疫苗)和慢性状况(类风湿性关节炎和肺癌)的受试者的浆母细胞分离。

来自图7的单个人类受试者的免疫球蛋白重链V(D)J序列利用 ClustalX聚类并用Treeview展示为无根的放射状树(图8)。各放射状树代表源自单个人类受试者的重链序列。对于各放射状树，末端代表独特的序列。主要分支代表克隆家族，且较小分支代表由于突变而彼此不同的克隆亚家族，所述突变经由接合区多样性(P-核苷酸或N-核苷酸的添加或者核苷酸删除)、体细胞超变和亲和力成熟产生。

实施例8：抗体的克隆、表达和纯化

所有选择的抗体如以上“材料和方法”章节中所述进行克隆、表达和分离(参见章节：重链和轻链克隆到Lonza载体中；单克隆抗体在293T中的表达；抗-人IgG ELISA；和表达的单克隆抗体的蛋白 A-IgG纯化)。纯化的抗体然后用于进一步研究，如下面所讨论的。

实施例9：来自流感疫苗接种后的受试者的抗体的表征

如上所述选择和分离来自施用流感疫苗的人的抗体。选择用于下面的进一步表征的抗体显示于适当的章节中。

Fluzone ELISA

志愿者施用来自Fluzone的2010/2011季流感疫苗，其由3株灭活病毒(A/California/7/2009、A/Perth/16/2009、B/Brisbane/60/2008 株)组成。如上所述进行Fluzone ELISA以确定是否源自疫苗接种的志愿者的单克隆抗体结合流感疫苗本身以作为具有结合活性的表达抗体的初始筛选。结合Fluzone ELISA的31种抗体中的14种(图26)和它们的亚集随后选择并使用表面等离子体共振测试与血球凝集素的结合活性。通过Fluzone ELISA表征的抗体是：Flul4-Flu23、Flu25 -Flu27、Flu29、Flu30、Flu34、Flu35、Flu37、Flu39-Flu41、Flu43 -Flu46。S1和S2用作阴性对照。

流感病毒抗体亲和力的表面等离子体共振测定

单克隆抗体(mAb)与HA分子的结合如上所述使用ProteOn表面等离子体共振生物传感器(BioRad Labs)在25℃下分析。结合Fluzone ELISA的14种抗体中，10种结合H3和1种结合H1，而3种不结合(图27)。选择非结合者之一、H1结合者和4种其它的随机选择的 H3结合者并发送给合同研究机构(CRO)以在微中和分析中测试中和活性。通过SPR表征的抗体是：Flu14-Flu22、Flu26、Flu29、Flu34、 Flu35、Flu46。

流感病毒微中和分析

在Fluzone ELISA中显示结合活性的一些表达的流感病毒抗体发送到外部CRO，Virapur LLC，用于如上所述的微中和分析。分析的结果表明在前面的分析中结合H1的抗体中和H1，而在前面的分析中结合H3的抗体中和H3。非结合者不中和流感病毒(图28)。通过微中和分析表征的抗体是Flu15、Flu16、Flu18、Flu19、Flu20、 Flu21。

CDR变异

流感抗体如上所述获得。图25显示为清楚起见放大的部分树状图(a)。克隆家族清楚可见且加阴影的克隆家族具有如灰色框中所示的分配的V(D)J。重链和轻链的CDR(加框的区域)上的氨基酸序列分别如图25(b)和(c)中所示，显示出链之间的一些残基差异。

以上的这些结果证明进化树可以使用本文中描述的组合物和方法获得。完全人单克隆抗体可以使用本文中描述的组合物和方法从发生急性状况的受试者的活化B细胞如浆母细胞分离。这些完全人单克隆抗体也可以是使用本文中描述的组合物和方法的中和抗体。结果也证明本文中公开的组合物和方法也可以分离用于靶向外源抗原的mAb。

实施例10：来自患有RA的受试者的抗体的表征

如上所述选择和分离来自患有类风湿性关节炎(RA)的人的抗体。选择用于以下的进一步表征的抗体示出在适当的章节中。

在RA抗原微阵列上的RA抗体反应性

源自RA患者的抗体如“材料和方法”的“RA抗原阵列上的RA抗体反应性”节中所述的在RA抗原阵列上探测并用GenePix仪进行荧光扫描。确认的关系使用Java TreeView软件显示为热图(图37)。通过这一分析表征的抗体是：RA1、RA2、RA3、RA4、RA8-RA13、 RA16、RA19、RA22和RA23。Flu14和Flu26用作阴性对照。

抗-组蛋白2A ELISA

对于针对H2A的抗体的检测，如“材料和方法”章节的“抗-组蛋白2A ELISA”中描述的进行直接ELISA。图35a显示对各测试的抗体检测的吸光度值。在图35a中和在以下的抗-CCP2 ELISA中表征的抗体是：RA1、RA2、RA4-RA16、RA 19、RA23-RA24。图36显示使用30ug/ml的抗体在另一独立ELISA上的选择抗体(RA1、RA2、 RA8、RA9)。

抗-CCP2 ELISA

抗-CCP2 ELISA如“材料和方法”章节的“抗-CCP2 ELISA”中描述的进行。图35b显示对各测试抗体检测的吸光度值。

抗-类风湿因子ELISA

源自RA患者的抗体在直接ELISA中用作第一抗体，且抗-人 IgG-HRP用作第二抗体，并用TMB底物可视化。对于针对类风湿因子(RF)的抗体的检测，抗-RF ELISA如“材料和方法”章节的“抗-类风湿因子ELISA”中描述的进行。图34表明抗体RA2和RA3显示反应性。这里表征的抗体是：RA1-RA6、RA8-RA12、RA14。

上述这些结果证明抗体可以使用本文中描述的组合物和方法从发生慢性状况的受试者的活化B细胞如浆母细胞分离。结果也证明本文中公开的组合物和方法也可以用于分离靶向自身抗原的mAb。

实施例11：来自患肺癌的受试者的抗体的表征

如上所述选择和分离来自患有转移性肺腺癌的长期非进展的人的抗体。该个人发生转移性肺腺癌并预期死于癌症，但是在化疗后，这一患者进入与占所有外周血B细胞的3.1％的浆母细胞相关的长期非进展状态超过4年。这一患者中升高的外周血浆母细胞水平表示正在发生的免疫应答可造成其长期非进展。以下抗体选择用于下面的进一步表征：LC1、LC5-LC7、LC9-LC18。Flu16用作阴性对照。

在肺癌组织阵列上来自肺腺癌患者的抗体的免疫组织化学

使用两种不同类型的组织微阵列载玻片的免疫组织化学如“材料和方法”章节的“在肺癌组织阵列上来自肺腺癌患者的抗体的免疫组织化学”中描述的进行。我们的结果证明表达的抗体之一结合肺腺癌(图32)。

由肺腺癌患者表达的抗体与肺腺癌细胞系结合的流式细胞测定

抗体与各种肺癌细胞系的结合如“材料和方法”章节的“由肺腺癌患者表达的抗体与肺癌细胞系结合的流式细胞测定”中描述的进行。我们的结果表明一种抗体结合肺腺癌细胞系并可以对于肺腺癌是特异性的(图33)。

上述的这些结果证明抗体可以使用本文中描述的组合物和方法从发生慢性状况如癌症的受试者的活化B细胞如浆母细胞分离。结果也证明本文中公开的组合物和方法也可以用于分离靶向自身抗原的mAb。

实施例12：来自具有金黄色葡萄球菌感染的受试者的抗体的表征

具有金黄色葡萄球菌感染的人，包括具有在不存在抗生素的情况下的免疫介导的感染控制的慢性金黄色葡萄球菌骨髓炎的人，用作染色和分选的外周血浆母细胞的外周血来源。用条码标记处理 cDNA、454测序和生物信息学分析产生在发生针对金黄色葡萄球菌的有效免疫应答的人中抗体谱的进化树。如上所述选择和分离来自发生针对金黄色葡萄球菌的有效免疫应答的人的抗体。选择用于下面的进一步表征的抗体示出在适当的章节中。

葡萄球菌流式细胞术

抗-葡萄球菌抗体如“材料和方法”的“葡萄球菌流式细胞术”中所描述的用于染色固定的金黄色葡萄球菌。我们的结果表明抗体S6和 S11结合金黄色葡萄球菌的表面且可以是用于调理的候选者，从而导致金黄色葡萄球菌的吞噬作用和杀死/抑制(图29)。在这一分析中表征的抗体是：S1-S4、S6-S13，以F26作为阴性对照。

葡萄球菌抑制分析

处于对数期生长的金黄色葡萄球菌与抗-葡萄球菌抗体结合以如 “材料和方法”的“葡萄球菌抑制分析”中描述的抗体的抑制性活性。我们的结果证明几种克隆和表达的抗体显示出对金黄色葡萄球菌的强效杀灭/抑制活性(图30)。通过这一分析表征的抗体是S6和S9，以 LC1作为阴性对照。

葡萄球菌抗原与源自葡萄球菌感染的患者的抗体的免疫沉淀

抗体用于如“材料和方法”的“葡萄球菌抗原与源自葡萄球菌感染的患者的抗体的免疫沉淀”中所描述的免疫沉淀各种候选葡萄球菌抗原。免疫沉淀的蛋白质然后如下所述用质谱鉴定。通过这一分析表征的抗体是S1-S13。

肽的质谱鉴定

选择染色的目标蛋白质条带并如“材料和方法”的“肽的质谱鉴定”中所描述的进行质谱分析。结果确认酚可溶性调控蛋白α1肽或δ- 溶血素为抗体S4的可能的结合靶标。这证明本文公开的方法可用于进行新抗原的发现(图31)。通过这一分析表征的抗体是S4。

上述这些结果证明抗体可以使用本文中描述的组合物和方法从发生急性状况如细菌感染的受试者的活化B细胞如浆母细胞分离。结果也证明本文中公开的组合物和方法可用于分离靶向外来抗原的 mAb和确定选择的抗体所结合的抗原的身份。

实施例13：未成熟细胞和浆母细胞表征

来自由正在发生的免疫应答激活的B细胞的免疫球蛋白序列可用于产生正在发生的免疫应答的进化树，如上所述。这一进化树通常通过代表来自多个后代系的活化B细胞的多个克隆家族表征。来自原始B细胞的序列一般不能够用于产生这种进化树，因为它们不被激活且因此提供很少或不提供关于活性的正在发生的免疫应答的信息。活化B细胞首先变成未成熟细胞，其被活化并尺寸较大。这些未成熟细胞然后继续变成记忆B细胞或浆细胞。在人体中，虽然记忆B细胞和浆细胞由免疫应答产生，但它们加入已由对先前的免疫侮辱的反应产生的记忆B细胞和浆细胞的大的池，使得难以区分针对当前的和先前的免疫应答的记忆B细胞和浆细胞。因此，在人体中，未成熟细胞是用于测序的优选候选者以获得正在发生的免疫应答的进化树。然而，在受控条件下繁育的研究动物(例如，小鼠)中，未成熟B细胞、记忆B细胞和浆细胞是用于测序的所有候选者以获得进化树，因为它们在清洁环境中繁育，使得这在严厉的针对该免疫侮辱的免疫反应后大多数记忆B细胞和浆细胞是可能的，特别是在加强注射后，因为它们不具有之前已观察到任何主要免疫激发的大的记忆或浆细胞群体。

对于T细胞类似地，在人体中，进行测序以获得正在发生的免疫应答的进化树的优选细胞是未成熟T细胞。对于小鼠，活化的、未成熟和记忆T细胞都是进行测序以获得进化树的优选候选者。

未成熟B细胞已知大于典型的B细胞。小的淋巴细胞(静息B 细胞是其中之一)的尺寸通常在6-8μm之间。未成熟淋巴细胞(T 和B细胞)尺寸通常在8-14μm之间(参见图41，也见Tzur等，PLoS ONE，6(1)：e16053.doi：10.1371/journal.pone.0016053，2011；Teague等，Cytometry，14：7 2005)。浆母细胞可具有以下表达谱：CD19^low/+、 CD20^low/-、CD27⁺和CD38^high。虽然所有这些标志物的使用产生用于单一细胞分选的最纯群体，但不是所有上述标志物需要用于分离浆母细胞。

如图39中例示的，浆母细胞可以通过使用对于较大细胞的FSC^hi选通，从而产生37％纯的浆母细胞群体。选通FSC^hiCD19^hi细胞给出 72％浆母细胞纯度。选通FSC^hi和CD27⁺、CD38^hi或CD20^-分别给出 44、80和71％的浆母细胞纯度。任何这些标志物或发现能够区分浆母细胞与其它B细胞的其它标志物可用于提高分选的浆母细胞的纯度，但是这些标志物中的任何一种可以单独地区分浆母细胞与其它B 细胞，尽管是以较低的纯度。

实施例14：用于测序和分析的可选平台

来自单一板(板44)的重链阅读片段制备以使用“材料和方法” 的“降落PCR”中描述的方法进行PacBio测序操作以扩增γ重链 cDNA。进行48个第二PCR以获得足够的DNA以进行PacBio操作。 DNA的汇合和清洁如“准备用于PacBio测序操作”中描述的进行。 DNA发送到PacBio用于制备和测序。CCS阅读片段从PacBio获得并按照“材料和方法”的“序列分配到孔”和“序列的组装”分配到孔和组装。分配的结果在图38中。这表明我们的方法和组合物对于高通量测序不是平台特异性的。

实施例15：对于454 XL+操作的测序和分析

测序可以通过按照“准备用于454 XL+测序操作”中描述的方法适应于454 XL+操作。这需要进行，因为454 XL+操作目前仅支持 Lib-L化学，而我们的454 XLR70操作利用Lib-A化学。这一般也可以适应于其中Lib-L化学对于用于在XLR70操作上的扩增子测序的典型Lib-A化学为优选的情况中。来自454 XL+操作的阅读片段仍可以按照“序列分配到孔”和“序列的组装”中描述的方法分配到孔和组装。来自454过滤后的XLR70和XL+操作的阅读片段可以相同的方式使用，即用于克隆和表达及抗体功能特性的分析的抗体的下游选择仍可按照图6和9进行。

实施例16：配对的免疫球蛋白基因的克隆

假定各克隆家族识别相同的表位且各家族内的序列变异是由于体细胞超变，我们可以首先克隆和表达各克隆家族的最常见的克隆用于筛选结合目标抗原的抗体(图6)。我们使用最常见的克隆，因为在亲和力成熟和在生发中心中的选择的过程中，以最高亲和力结合抗原的中心细胞与其它中心细胞竞争存活因子。因此，我们预期最高频率克隆也具有最高结合亲和力。一旦克隆已确认为能够结合抗原的抗体，则克隆、表达来自整个克隆家族的代表性配对免疫球蛋白序列和筛选为中和抗体(图6)。这一过程可以包括克隆和表达代表克隆家族内的多个亚克隆或者编码克隆家族内不同同种型的抗体的序列，以使得能够直接测试和比较代表克隆家族内包含的抗体谱的特定克隆的结合和功能特性。表现所需的结合和功能特性的特定克隆然后选择用于进一步表征和考虑用于开发为治疗性人抗体。

从家族(或任何其它目标抗体集合)选择用于克隆的候选者的替代方式是构建抗体的系统树(在克隆家族的情况中以种系序列为根)。在这种树中的叶节点对应于抗体家族成员。用于克隆的候选者然后通过从树的顶部下降进行选择，从而总是选择具有最大数目的下方叶节点的分支(在持平(tie)的情况中随机选择)，然后在叶上方的最后节点处选择具有最大数目的突变的叶或在持平的事件中随机选择。如果需要的话，另外的候选者可以通过重复选择候选者直到获得所需数目而进行选择，如下所述。对于树中的每一节点，如果没有选择到作为节点的派生物的叶，则计数作为派生物的叶的数目。对于具有最大的这种计数的节点(在持平的情况中随机选择)，下降，从而总是选择具有最大数目的派生叶节点的分支(在分支之间持平的情况中随机选择)。然后，在叶上方的最后节点处，选择具有最大数目的突变的叶或在持平的情况中随机选择。

从抗体的家族(或任何其它目标抗体集合)选择候选者的再另一途径是通过使相对于种系的非-静默突变的数目下降来列举抗体和从列表中按顺序选择，从而选择最高进化的抗体。

实施例17：持久转染和候选人抗体的表达

所需的克隆通过使用对于给定样品-ID特异性的克隆引物从序列的汇合板选择性扩增；这些引物也将不同的5’和3’限制性位点并入克隆中。这些限制性位点然后用于将克隆插入载体中。因为扩增的克隆可以仅包含部分恒定区序列，载体早已包含κ、λ或γ恒定区，其具有需要在开放阅读框中插入扩增的克隆中的适宜限制性位点。因为克隆具有可变序列，多个限制性位点工程化到载体中以避免也存在于克隆本身(其随后也通过限制性酶切割)中的限制性位点的潜在问题。这允许尽可能多的克隆被插入。使用的载体是具有不同哺乳动物选择标记的两个独立的载体(含具有工程化限制性位点的恒定区基因的修饰的Invitrogen pcDNA3.3或pOptivec载体)或含两种基因的双重表达载体(Lonza GS系统；pEE6.4和pEE12.4)。恒定区插入片段的序列分别参见表16和17。选择标记是可扩增的，如 pOptivec中的二氢叶酸还原酶(DHFR)或Lonza GS系统中的谷氨酰胺合成酶(GS)，以允许基因扩增和抗体的有效产生以用于需要大量抗体的进一步筛选目的(例如，体内筛选)。哺乳动物细胞使用双重转染(轻链在一个载体中和重链在另一载体中)(修饰的pOptivec 和pcDNA3.3)或含两个基因的双重表达载体(Lonza GS系统)进行转染。

修饰的Invitrogen载体。载体是具有不同哺乳动物选择标记和工程化限制性位点的两个独立载体。pcDNA3.3具有新霉素抗性基因作为选择标记，和pOptivec具有DHFR-选择标记。CHO DHFR-细胞在遗传霉素选择下用修饰的pcDNA3.3和pOptivec共转染。仅用pOptivec(其含有DHFR的拷贝)转染的DHFR-细胞存活，且 pcDNA3.3中的新霉素抗性基因赋予对遗传霉素的抗性。这允许选择用两种载体(在一个载体中含轻链和在另一载体中含重链)成功转染的细胞，并因此将产生功能性免疫球蛋白。

Lonza GS系统。Lonza GS系统利用载体pEE 12.4和pEE6.4。载体pEE 12.4包含GS基因作为可扩增的选择标记，且pEE6.4是补充载体。轻链将克隆到载体之一中和重链将克隆到另一载体中。之后，两个载体用限制性酶切割并连接到一起以形成可在单独启动子上表达重链和轻链基因两者的单一载体。因此，是双重表达载体系统，从而允许从单一载体表达两个基因。CHO细胞在蛋氨酸亚砜亚胺选择下用双重表达载体转染。因此转染的细胞选择用于。

基因扩增

二氢叶酸还原酶(DHFR)和GS两者是可扩增选择标记。在相应的提高量的氨甲喋呤和蛋氨酸亚砜亚胺选择压力下，具有含DHFR 和GS基因的重复基因组区域的转染细胞系会存活，因为它们对选择试剂具有更高抗性。靠近选择标记的基因如插入的重链和轻链免疫球蛋白基因也扩增，从而产生更高的基因拷贝和更高的免疫球蛋白产生率。产生在体外筛选(参见以下)中发现具有中和性能的抗体的克隆被扩增以使得可获得更多的抗体用于后续的体内研究。

实施例18：确定表达的人抗体的特异性

抗体筛选以两个阶段发生。我们利用新的“选择性筛选”过程，其中我们首先选择适当的克隆家族以用于中和抗体的筛选中。我们筛选各克隆家族的最常见的1-3个克隆结合抗原的能力。我们的筛选通常采取间接ELISA的方式，虽然流式细胞术可用于鉴别细胞结合抗体。这包括首先将适宜的抗原结合到ELISA板上，然后将其与含表达的抗体的上清液一起孵育。结合抗原的抗体通过特定的第二抗体检测。

一旦结合抗体被确认，该克隆的整个克隆家族在“选择筛选”的筛选阶段中克隆和表达。虽然克隆家族中的所有抗体预期结合相同的表位，它们在抗原结合的亲和力和其在抗原上的定位中可以轻微不同，差异可以影响抗体的结合性能和/或中和能力；因此，在大多数情况中，表达几种不同的抗体(在其CDR3区域中具有较小差异) 并筛选其结合和中和性能。

对于靶向于特定配体/受体对的中和抗体，293T细胞首先用信息传导途径报告构建体稳定地转染，如含与NF-kB转录响应元件连接的萤光素酶基因的质粒。转染的细胞中NF-kB的激活诱导萤光素酶的表达，其水平可以在萤光素酶分析中测定。这测量通过配体-受体结合激活的NF-kB信号传导。NF-kB是选择的信号传导元件，因为大多数信号传导事件激活NF-kB。对于分析其它信号传导途径，例如，萤光素酶基因启动子区域包含适宜的转录结合位点，如对于AP-1 的转录结合位点。接着，293T细胞用靶受体转染。293T细胞然后在96-孔板中与配体和目标结合抗体一起孵育。在24或48小时后，进行萤光素酶分析以测定萤光素酶基因的表达。具有中和抗体的孔具有最小的萤光素酶表达至没有萤光素酶表达。结果通过Western印迹验证NF-kB信号传导途径中的磷酸化信号传导蛋白质。中和抗体防止配体-受体信号传导；且因此取消信号传导蛋白质的磷酸化。

对于存在于活细胞上的抗原，如癌抗原和细菌抗原，体外中和分析采取检测活/死细胞的分析的形式，且可以以高通量形式进行。癌细胞或细菌在96-孔板中与候选抗体一起孵育。区分活细胞与死细胞并与流式细胞术相容的染色剂然后可以应用于各孔。活细胞和死细胞用不同的荧光团染色并使用流进行筛选以给出活细胞和死细胞的百分比。通过体外筛选的抗体随后体内筛选其中和活性。

病毒体外中和分析可以使用标准空斑中和分析进行。通过在96- 孔板中进行空斑中和分析，各孔可以使用显微镜成像且空斑计数可以用图像分析软件自动进行。中和抗体减少空斑形成。这些抗体然后进一步体内筛选中和活性。

对于使用ELISA(实施例7)和流式细胞术(实施例9和10) 的结合活性的成功分析参见实施例9“Fluzone ELISA”节、实施例 11“流式细胞术…”节和实施例12“葡萄球菌流式细胞术”节。对于具有中和活性的抗体的成功分析参见实施例9“流感病毒微中和分析”节。

实施例19：每孔具有超过一个细胞的B细胞的测序

具有多个B细胞的单个样品在容器中单独地反转录。反转录将样品-ID和5’通用引物区域添加到所有第一链eDNA上。汇合来自一组容器的所有容器的eDNA并进行2轮PCR。步骤如“材料和方法” 的“降落PCR和非-降落PCR”、“准备用于454 XLR70测序操作”中所描述的。引物的序列也显示于图9中。注意，无论哪个基因被扩增，正向引物保持恒定(b)。在RT和2轮PCR后，来自所有容器组的扩增子汇合并进行454-测序。序列分配到孔和序列的组装按照“材料和方法”的“序列分配到孔”和“序列的组装”中所描述的方案。板-ID和样品-ID的组合允许鉴别来源于相同样品的序列。

即使一个孔中存在多个细胞，我们可以配对单个重链与轻链。来自于源自共同祖先的B细胞的重链将是克隆相关的，正如轻链一样。因此，我们可以通过观察孔间的相关性将重链克隆家族与轻链克隆家族相关联。一旦在克隆家族的重链和克隆家族的轻链之间建立关联性，链对通过选择作为重链克隆家族的成员的重链和作为轻链克隆家族的成员的轻链在各孔中分配。当在孔中存在仅单一例的重链家族和仅单一例的轻链家族时，对的选择是明确的。在确定哪些重链和轻链彼此相关后，可以绘制进化树和选择抗体用于其功能特性的下游表征。

实施例20：每孔具有一个或多个细胞的B细胞的测序

样品可以在一些板中用每孔一个B细胞分选，和在其它板中用每孔多个B细胞分选，而重链和轻链仍可以对于具有超过一个B细胞的那些孔配对。我们检验由上述实施例9的流感疫苗接种患者产生的序列，其中一些孔具有观察到的超过一个的独特重链序列组装或超过一个的独特轻链序列组装。RT、PCR、测序及序列分配到孔和序列组装按照上述实施例9中的方案。为确定哪些重链和轻链彼此关联，重链通过将所有具有相同的V和J基因使用和在V基因片段的末端与J基因片段的开始之间的相同数目的核苷酸的重链分组而分配到克隆家族。轻链通过将所有具有相同的V和J基因使用和在V基因片段的末端与J基因片段的开始之间的相同数目的核苷酸的轻链分组而分配到克隆家族。重链和轻链之间的配对关系首先基于其共有一个孔(即具有相同的化合物条码)对于具有恰好一个重链和一个轻链的孔分配。然后，对于重链克隆家族与轻链克隆家族的各可能的配对计算评分。评分通过计数重链家族和轻链家族的成员共有一个孔的次数确定。然后，各重链家族与获得最高评分的轻链家族相关联，或者如果超过一个轻链家族获得最高评分，则重链家族不与轻链家族相关联。单个重链和轻链然后通过以总体最高评分重链家族开始而配对，并通过家族分配对逐孔进行，然后继续进行到下一重链家族。对于给定的重链家族，对于各孔，如果在孔内存在作为重链家族成员的单一重链，则属于重链家族的相关轻链家族的来自该孔的轻链分配为重链的对。如果存在超过一个这样的轻链，没有配对被分配。这一将重链与轻链相关联的过程继续直到所有家族和这些家族中的所有链已被考虑，如果对于给定的重链或轻链，该过程产生超过一个候选者用于配对，则重链和轻链都被放弃。进化树从配对的链产生，且抗体选择用于其功能特性的下游表征。一部分进化树显示于图25A中。

实施例21：分选的浆母细胞产生人单克隆抗体的用途

从具有导致急性、亚急性或正在发生的循环浆母细胞产生的最近或当前状况的受试者，在外周血(全血或外周血单核细胞(PBMC)) 上进行流式细胞术以鉴别浆母细胞群体。这一B细胞群体然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生 cDNA。在RT过程中，孔特异性的样品-ID接合体寡核苷酸添加到反应中。这些接合体具有可鉴别序列为来源于不同的孔的孔特异性条码序列(样品-ID)。利用MMLV H^-反转录酶的3’加尾和模板转换活性，样品-ID添加到第一链cDNA的3’端。来自各板的cDNA 汇合在一起。在第一轮PCR过程中，板特异性FW长引物1添加板 -ID到扩增子的5’端。因此，具有不同板-ID的FW长引物1添加到不同的板上以给予各PCR产物识别条码序列。基因特异性反向引物用于扩增κ、λ和γ链，它们分别是κGSP1、λGSP1和γGSP1。这些引物结合免疫球蛋白基因的恒定区。来自第一轮PCR的产物被稀释和用于第二嵌套PCR。FW引物2用作正向引物且反向引物κ、λ和 γGSP长引物用于扩增其相应的扩增子。值得注意的是，用于各板的 GPS长引物2添加共同的板ID到对于各板的各扩增子的3’端，因此各自终止于具有两个板-ID和样品-ID条码。对于RT、第一和第二 PCR的进一步细节见于“材料和方法”的“非-降落PCR”中。然后多个板按照“准备用于454 XLR70测序操作”中详细描述的方法汇合和进行高通量454 DNA测序，且单个序列利用用作识别符的其条码确认哪个重链和/或轻链从各孔获得，因此按照“材料和方法”的“序列分配到孔”和“序列的组装”中详细描述的方法提供用于将源自相同初始细胞的单个可变重链和轻链匹配的指导。然后绘制进化树和选择抗体用于克隆、表达和功能活性的测定(参见图6-8)。

来自特定细胞来源的候选重链和轻链基因然后克隆和表达用于如实施例8中的所需性质的筛选。一旦稳定或瞬时转染，配对的重链和轻链的表达将导致重演初始分选细胞的特异性的单克隆抗体的产生。含分泌的抗体的上清液然后筛选所需的性能，包括但不限于针对目标靶抗原的抗原特异性以及适当功能分析的功能性。图9和6 各提供用于实施这一方法的一般方法的一个实例。图26-27表明这如何使用本发明的组合物和方法进行以获得针对来自流感疫苗接种的人的单一细胞分选的浆母细胞的人单克隆抗体。

实施例22：分选的无偏或抗原特异性记忆B细胞用于产生人单克隆抗体

从具有证明的或疑似的目标抗原暴露的受试者，在外周血(全血或分离外周血单核细胞，PBMC)上进行FACS以鉴别记忆B细胞群体(定义为CD19⁺CD20⁺CD27⁺)。另外，对目标抗原特异性的记忆B细胞也可以通过用记忆B细胞表面标志物和用荧光团偶联抗原 (CD19⁺CD20⁺CD27⁺抗原⁺)染色外周血或PBMC来分选。这一细胞群体然后通过FACS分选为单一细胞或多个细胞到孔中。重复实施例 21中详细描述的过程以条码标记和从454测序获得序列并将序列分配到孔和组装序列。HighV-QUEST用于鉴别VDJ基因使用，且进化树上各克隆家族的多个成员选择用于如实施例8中的克隆和表达。克隆和表达如实施例8中详细描述的进行。一旦转染，整个配对重链和轻链的表达导致产生重演初始分选细胞的特异性的单克隆抗体。含抗体的上清液筛选针对目标靶抗原的抗原特异性以及通过适当功能分析的功能性。图9和6各提供用于完成该方法的一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得人单克隆抗体的另一实例。

实施例23：分选的无偏或抗原特异性总B细胞用于产生人单克隆抗体

从具有证明的或疑似的先前目标抗原暴露的受试者，在外周血 (全血或分离的外周血单核细胞，PBMC)上进行FACS以鉴别CD19⁺ B细胞群体。这一细胞群体然后通过FACS分选为单一细胞或多个细胞到孔中。重复实施例21中详细描述的过程。重复实施例21中详细描述的过程以进行条码标记，并从454测序获得序列及分配序列到孔和组装序列。HighV-QUEST用于鉴别VDJ基因使用，且进化树上各克隆家族的多个成员如实施例8中选择用于克隆和表达。一旦转染，配对的重链和轻链的表达导致产生重演初始分选细胞的特异性的单克隆抗体。含表达的抗体的上清液筛选针对目标靶抗原的抗原特异性以及通过适当功能分析的功能性。图9和6各提供用于完成该方法的一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得人单克隆抗体的另一实例。

实施例24：浆细胞用于产生人单克隆抗体

从具有证明的或疑似的先前目标抗原暴露的受试者，在外周血 (全血或分离的外周血单核细胞，PBMC)或骨髓细胞上进行FACS 以鉴别CD138⁺浆细胞群体。这一细胞群体然后通过FACS分选为单一细胞或多个细胞到孔中。重复实施例21中详细描述的过程以进行条码标记，并从454测序获得序列及分配序列到孔和组装序列。 HighV-QUEST用于鉴别VDJ基因使用，且进化树上各克隆家族的多个成员选择用于克隆和表达。一旦转染，配对的重链和轻链的表达导致产生重演初始分选细胞的特异性的单克隆抗体。含表达的抗体的上清液筛选针对目标靶抗原的抗原特异性以及通过适当功能分析的功能性。图9和6各提供用于完成该方法的一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得人单克隆抗体的另一实例。

实施例25：未成熟B细胞用于产生人单克隆抗体

从具有证明的或疑似的先前目标抗原暴露的受试者，在外周血 (全血或分离的外周血单核细胞，PBMC)上进行FACS以鉴别FSC^hi未成熟B细胞群体。未成熟细胞是活化B细胞，且因此是已针对抗原作出反应并活跃增殖的细胞。这些B细胞由克隆家族组成且其配对的重链和轻链可用于获得进化树。B细胞激活的其它标志物如 CD69^hi和CD44^hi也可以结合使用。另外地，DNA内容物(其可以使用细胞渗透性DNA染色剂如SYTO Blue(Invitrogen)染色以确定活化的细胞)、增殖和处于细胞周期中也可以结合使用以描绘未成熟B 细胞。这一细胞群体然后通过FACS分选为单一细胞或多个细胞到孔中。重复实施例21中详细描述的过程以进行条码标记，并从454 测序获得序列及分配序列到孔和组装序列。HighV-QUEST用于鉴别 VDJ基因使用，且进化树上各克隆家族的多个成员选择用于克隆和表达。一旦转染，配对的重链和轻链的表达导致产生重演初始分选细胞的特异性的单克隆抗体。含表达的抗体的上清液筛选针对目标靶抗原的抗原特异性以及通过适当功能分析的功能性。图9和6各提供用于完成该方法的一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得人单克隆抗体的另一实例。

实施例26：鼠B细胞用于产生单克隆抗体

小鼠用目标抗原激发，并可以给予几次加强注射，然后处死小鼠以获得鼠B细胞。鼠B细胞可以从血液、从脾细胞或从骨髓获得。进行流式细胞术以获得CD19⁺或B220⁺B细胞。这一B细胞群体然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。RT、第一和第二PCR如“材料和方法”的“非-降落PCR” 中详细描述的进行。小鼠基因特异性引物在表11中找到，且用于 RT和PCR的其它引物在表1中找到。然后多个板按照“准备用于454 XLR70测序操作”中详细说明的方法汇合并进行高通量454 DNA测序，且按照“材料和方法”的“序列分配到孔”和“序列的组装”中详细描述的方法，单个序列用它们的条码(其用作哪个重链和/或轻链从各孔获得的标识符)鉴别，因此提供匹配源自相同初始细胞的单个可变重链和轻链的指导。然后绘制进化树且选择抗体用于克隆、表达和功能活性的测定。

用于克隆的序列可以通过合成基因的合成获得或使用克隆引物从第一PCR产物扩增。正向克隆引物是样品特异性的且可以从扩增子的池扩增特异性序列。各重链和轻链的序列然后克隆到含对于通过克隆引物引入的限制性位点互补的限制性位点的表达载体中。载体也含有重链或轻链恒定区，该重链或轻链序列克隆到(对准的阅读框)中以产生整个抗体。含重链或轻链克隆的载体然后双重转染到哺乳动物表达系统中，或者两个扩增子可以克隆到双重表达载体中以允许单一转染到哺乳动物细胞中。

来自特定细胞源的候选重链和轻链基因然后使用表达以如上所述用于所需性能的筛选。一旦稳定或瞬时转染，配对的重链和轻链的表达导致产生重演初始分选细胞的特异性的单克隆抗体。含分泌的抗体的上清液然后筛选所需的性质，包括，但不限于针对目标靶抗原的抗原特异性以及通过适当功能分析的功能性。图9和6各提供用于完成该方法的一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得人单克隆抗体的另一实例。

实施例27：鼠浆细胞用于产生单克隆抗体

小鼠用目标抗原激发，并可以给予几次加强注射，然后处死小鼠以获得鼠B细胞。鼠浆细胞可以从血液、从脾细胞或从骨髓获得，虽然通常使用脾细胞和骨髓。进行流式细胞术以获得 CD19^low/-B220^low/-CD138⁺浆细胞。这一浆细胞群体然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。RT、第一和第二PCR如“材料和方法”的“非-降落PCR”中详细描述的进行。小鼠基因特异性引物在表11中找到，且用于RT和PCR的其它引物在表1中找到。然后多个板按照“准备用于454 XLR70测序操作” 中详细说明的方法汇合并进行高通量454DNA测序，且按照“材料和方法”的“序列分配到孔”和“序列的组装”中详细描述的方法，单个序列用它们的条码(其用作哪个重链和/或轻链从各孔获得的标识符) 鉴别，因此提供匹配源自相同初始细胞的单个可变重链和轻链的指导。然后绘制进化树且选择抗体用于克隆、表达和功能活性的测定。

用于克隆的序列可以通过合成基因的合成获得或使用如实施例 26中描述的克隆引物从第一PCR产物扩增。来自特定细胞源的候选重链和轻链基因然后使用表达以如上所述用于所需性能的筛选。一旦稳定或瞬时转染，配对的重链和轻链的表达导致产生重演初始分选细胞的特异性的单克隆抗体。含分泌的抗体的上清液然后筛选所需的性质包括，但不限于针对目标靶抗原的抗原特异性以及通过适当功能分析的功能性。图9和6各提供用于完成该方法的一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得单克隆抗体的另一实例。

实施例28：无偏的或抗原特异性鼠记忆B细胞用于产生单克隆抗体

小鼠用目标抗原激发，并可以给予几次加强注射，然后处死小鼠以获得鼠B细胞。鼠记忆B细胞通常可以从脾细胞或淋巴结获得。进行流式细胞术以获得CD19⁺或B220⁺和CD38⁺IgG⁺记忆B细胞。也可以使用其它标志物如CD45RO。抗原特异性记忆B细胞也可以使用荧光团偶联的抗原染色来可视化和分选。这一记忆B细胞群体然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。RT、第一和第二PCR，之后的测序、序列分配到孔和序列组装如实施例26中进行。然后绘制进化树且选择抗体用于克隆、表达和功能活性的测定。

用于克隆的序列可以通过合成基因的合成获得或使用如实施例 26中描述的克隆引物从第一PCR产物扩增。来自特定细胞源的候选重链和轻链基因然后使用表达以如上所述用于所需性能的筛选。一旦稳定或瞬时转染，配对的重链和轻链的表达导致产生重演初始分选细胞的特异性的单克隆抗体。含分泌的抗体的上清液然后筛选所需的性质，包括，但不限于针对目标靶抗原的抗原特异性以及通过适当功能分析的功能性。图3和9各提供用于完成该方法的一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得单克隆抗体的另一实例。

实施例29：鼠短寿浆母细胞用于产生单克隆抗体

小鼠用目标抗原激发，并可以给予几次加强注射，然后处死小鼠以获得鼠B细胞。鼠短寿浆母细胞通常可以从脾细胞获得。这些浆母细胞多样化地描述为CD19^low/-B220^low/-和CD22^low或CDllc⁺，且也描述为CD138⁺。进行流式细胞术以获得浆母细胞。这一浆母细胞群体然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR 以产生cDNA。RT、第一和第二PCR，之后的测序、序列分配到孔和序列组装如实施例26中进行。然后绘制进化树且选择抗体用于克隆、表达和功能活性的测定。

用于克隆的序列可以通过合成基因的合成获得或如实施例26中描述的使用克隆引物从第一PCR产物扩增。来自特定细胞源的候选重链和轻链基因然后使用其进行表达以如上所述用于所需性能的筛选。一旦稳定或瞬时转染，配对的重链和轻链的表达导致产生重演初始分选细胞的特异性的单克隆抗体。含分泌的抗体的上清液然后筛选所需的性质，包括，但不限于针对目标靶抗原的抗原特异性以及通过适当功能分析的功能性。图9和6各提供用于完成该方法的一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得单克隆抗体的另一实例。

实施例30：鼠未成熟B细胞用于产生单克隆抗体

小鼠用目标抗原激发，并可以给予几次加强注射，然后处死小鼠以获得鼠B细胞。鼠未成熟B细胞通常可以从脾细胞获得。未成熟细胞是活化B细胞，且因此是针对抗原作出响应并活跃增殖扩增的细胞。这些B细胞由克隆家族组成且其配对的重链和轻链可以用于获得进化树。未成熟B细胞可以分选为FSC^hi，且也可以进一步经由细胞表面标志物如CD44^hiCD69^hi鉴别，并作为未成熟B细胞增殖，它们也可以通过具有如通过细胞渗透性DNA染色剂如SYTO Blue 染色的增加的DNA含量而鉴别为已进入细胞周期。进行流式细胞术以获得未成熟B细胞。这一浆母细胞群体然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。RT、第一和第二PCR，之后的测序、序列分配到孔和序列组装如实施例26中进行。然后绘制进化树且选择抗体用于克隆、表达和功能活性的测定。

实施例31：从无偏或抗原特异性人IgA+B细胞获得单克隆抗体

从具有或不具有证明的或疑似的先前目标抗原暴露的受试者，在外周血(全血或分离的外周血单核细胞，PBMC)上或在骨髓上进行FACS以分离IgA+B细胞。这些B细胞可以是记忆B细胞、浆细胞或浆母细胞。这些IgA⁺B细胞也可以是抗原特异性的，通过使用荧光团偶联的抗原染色IgA⁺B细胞而对抗原阳性B细胞进行分选。这一细胞群体然后通过FACS分选为单一细胞或多个细胞到孔中。重复实施例21中详细描述的过程以条码标记和从454测序获得序列，并分配序列到孔和组装序列，且用于PCR的IgA恒定区特异性引物在表10中。HighV-QUEST用于鉴别VDJ基因使用，且进化树上各克隆家族的多个成员如实施例8中选择用于克隆和表达。含表达的抗体的上清液筛选针对目标靶抗原的抗原特异性以及通过适当功能分析的功能性。图9和6各提供用于完成该方法的一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得人单克隆抗体的另一实例。

实施例32：从无偏的或抗原特异性的人IgM+B细胞获得单克隆抗体

从具有或不具有证明的或疑似的先前目标抗原暴露的受试者，在外周血(全血或分离的外周血单核细胞，PBMC)上进行FACS以分离IgM+B细胞。这些B细胞可以是记忆B细胞、浆细胞或未成熟B细胞。这些IgM⁺B细胞也可以是抗原特异性的，通过使用荧光团偶联的抗原染色IgM⁺B细胞而对抗原阳性B细胞进行分选。这一细胞群体然后通过FACS分选为单一细胞或多个细胞到孔中。重复实施例21中详细描述的过程以条码标记和从454测序获得序列，并分配序列到孔和组装序列，且用于PCR的IgM恒定区特异性引物在表10中。HighV-QUEST用于鉴别VDJ基因使用，且进化树上各克隆家族的多个成员如实施例8中选择用于克隆和表达。含表达的抗体的上清液筛选针对目标靶抗原的抗原特异性以及通过适当功能分析的功能性。图9和6各提供用于完成该方法的一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得人单克隆抗体的另一实例。

实施例33：从无偏的或抗原特异性的鼠IgA+B细胞获得单克隆抗体

小鼠用目标抗原激发，并可以给予几次加强注射，然后处死小鼠以获得鼠IgA⁺B细胞。这些B细胞可以是记忆B细胞、浆细胞、浆母细胞或未成熟B细胞，且通常可以从脾细胞获得。这些IgA⁺B 细胞也可以是抗原特异性的，通过使用荧光团偶联的抗原染色IgA⁺ B细胞而对抗原阳性B细胞进行分选。这一IgA⁺B细胞群体然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生 cDNA。RT、第一和第二PCR，之后的测序、序列分配到孔和序列组装如实施例26中进行，且用于PCR的IgA恒定区特异性引物在表11中。然后绘制进化树且选择抗体用于克隆、表达和功能活性的测定。图9和6提供用于完成该方法的一般方法的一个实例。

实施例34：从无偏的或抗原特异性的鼠IgM+B细胞获得单克隆抗体

小鼠用目标抗原激发，并可以给予几次加强注射，然后处死小鼠以获得鼠IgM⁺B细胞。这些B细胞可以是记忆B细胞、浆细胞、浆母细胞或未成熟B细胞，且通常可以从脾细胞获得。这些IgM⁺B 细胞也可以是抗原特异性的，通过使用荧光团偶联的抗原染色IgM⁺ B细胞而对抗原阳性B细胞进行分选。这一IgM⁺B细胞群体然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生 cDNA。RT、第一和第二PCR，之后的测序、序列分配到孔和序列组装如实施例26中进行，且用于PCR的IgA恒定区特异性引物在表11中。然后绘制进化树且选择抗体用于克隆、表达和功能活性的测定。图9和6提供用于完成该方法的一般方法的一个实例。

实施例35：来自人T细胞的多于一个序列的测序

从具有导致急性、亚急性或正在发生的循环T细胞产生的最近或当前状况的受试者，在外周血(全血或外周血单核细胞(PBMC)) 上进行流式细胞分析以鉴别目标T细胞群体。这一T细胞群体可以是活化T细胞或未成熟T细胞。活化T细胞可以使用CD44^hi、CD69^hi、CD154⁺、CD137⁺或未成熟T细胞鉴别，其也是可以通过其大小或 FSC^hi描绘的活化T细胞，且也可以使用细胞渗透DNA染料如SYTO Blue鉴别为处于细胞周期中。活化T细胞应当由随后可以群集成进化树的克隆家族组成，在克隆家族中具有相同的家族成员，其可以用于选择用于下游功能分析的克隆。T细胞然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。RT和PCR以条码标记TCR基因详述于“材料和方法”的“非-降落PCR”中，测序准备详述于“材料和方法”的“准备用于454 XLR70测序操作”中，且序列分配到孔和阅读片段的组装详述于“材料和方法”的“序列分配到孔”和“序列的组装”中，TCR基因特异性引物见于表10中。然后构建进化树且随后选择来自特定细胞源的候选基因以克隆和表达用于所需性质的筛选。用于克隆的序列可以基因合成或用克隆引物从第一PCR产物扩增。特定的克隆可以通过具有对于样品-ID条码序列特异性的正向克隆引物从克隆的池分离。反向克隆引物对于适当基因是互补的。正向和反向引物都包含侧翼限制性位点以将克隆(对准的阅读框)整合到载体中。细胞用两个表达载体(各包含任一目标基因)双重转染或用表达两个目标基因(例如，T细胞α和β链) 的双重表达载体单一转染。

一旦稳定或瞬时转染，目标基因可以表达和使用所需的筛选方法进行功能性质的筛选。

实施例36：来自鼠T细胞的多于一个序列的测序

小鼠用目标抗原激发，并可以给予几次加强注射，然后处死小鼠以获得鼠T细胞。T细胞是CD3⁺，且辅助T细胞是CD4⁺和细胞毒性T细胞是CD8⁺。这一T细胞群体可以是记忆或活化T细胞或者未成熟T细胞。记忆T细胞可以鉴别为CD45RO⁺。活化T细胞可以使用CD44^hi、CD69^hi或未成熟T细胞鉴别，其也是可以通过其大小或FSC^hi描绘的活化T细胞，且也可以使用细胞渗透DNA染料如 SYTO Blue确认为处于细胞周期中。在重复的抗原暴露之后保持在清洁环境中的小鼠中的所有这些T细胞应当具有随后可以显示为进化树的大部分的克隆家族，进化树然后可以用于选择TCR用于克隆和表达及下游功能分析。

T细胞使用以上提出的标志物通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。进行RT和PCR以条码标记TCR基因详述于“材料和方法”的“非-降落PCR”中，测序准备详述于“材料和方法”的“准备用于454 XLR70测序操作”中，且序列分配到孔和阅读片段的组装详述于“材料和方法”的“序列分配到孔”和 “序列的组装”中，TCR基因特异性引物见于表11中。然后构建进化树且随后选择来自特定细胞源的候选基因以克隆和表达用于所需性质的筛选。用于克隆的序列可以基因合成或用克隆引物从第一PCR 产物扩增。特定的克隆可以通过具有对于样品-ID条码序列特异性的正向克隆引物从克隆的池分离。反向克隆引物对于适当基因是互补的。正向和反向引物都包含侧翼限制性位点以将克隆(对准的阅读框)整合到载体中。细胞用两个表达载体(各包含任一目标基因) 双重转染或用表达两个目标基因(例如，T细胞α和β链)的双重表达载体单一转染。

实施例37：来自样品的多于一个序列的测序

鉴别包含目标核酸的单一样品。单一样品可以具有单一细胞或细胞群体。样品可以通过流式细胞术分选为单一细胞到含具有RNA 酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。这一B细胞群体然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。RT、第一和第二PCR如“材料和方法”的“非-降落PCR”中详细描述的进行。然后多个板按照“准备用于454 XLR70测序操作”中详细描述的方法汇合和进行高通量454 DNA测序，且单个序列利用用作识别符的其条码确认哪个重链和/或轻链从各孔获得，因此按照“材料和方法”的 “序列分配到孔”和“序列的组装”中详细描述的方法提供用于将源自相同初始细胞的单个可变重链和轻链匹配的指导。然后绘制进化树和选择抗体用于克隆、表达和功能活性的测定。

来自特定细胞源的候选基因然后选择进行克隆和表达以用于所需性质的筛选或其它需要。用于克隆的序列可以基因合成或用克隆引物从第一PCR产物扩增。特定的克隆可以通过具有对于样品-ID 条码序列特异性的正向克隆引物从克隆的池分离。反向克隆引物对于适当基因是互补的。正向和反向引物都包含侧翼限制性位点以将克隆(对准的阅读框)整合到载体中。细胞用两个或更多个表达载体(各包含任一目标基因)转染或用表达目标基因的表达载体单一转染。

一旦稳定或瞬时转染，目标基因可以表达和在需要的情况下进行筛选。图9和6提供用于完成该方法的一般方法的一个实例。

实施例38：通过DNA合成克隆免疫球蛋白V(D)J区域

所需的免疫球蛋白轻链和重链V(D)J区域可以通过DNA合成来合成产生而用于克隆到表达载体中。用于合成的序列可以直接源自高通量454序列，或者编码来自目标样品的重链和轻链免疫球蛋白的cDNA可以从单个样品或合并有样品重测序以进一步确认序列，且这一序列用于合成选择的轻链和重链V(D)J区域。Ig基因的可变区可以通过DNA合成克隆，并使用限制性酶和标准分子生物学将合成的DNA并入含适当恒定区的载体中。在合成过程中，不需要遵循精确的核苷酸序列，只要氨基酸序列不发生变化，除非诱变是需要的。这允许可导致更高表达水平的密码子优化。这也允许加入用于克隆目的的限制性位点。非翻译序列如5’UTR和条码序列不需要合成，前导序列也可以交换为已知用于更高表达水平的其它信号肽序列。这些导致可以与高通量阅读片段非常不同但在表达时给出相同氨基酸序列的Ig核苷酸序列。

在一个实施方式中，扩增的V(D)J区域插入早已含有κ、λ、γ 或其它重链同种型恒定区的载体中，其具有将扩增的克隆插入开放阅读框中需要的适当限制性位点。在另一实施方式中，整个可变区可以用恒定区合成并克隆到表达载体中的基因用于表达和抗体性能的下游功能测试。

实施例39：通过使用早已存在于样品识别区别接合体中的限制性位点克隆免疫球蛋白V(D)J区域

在另一方面，所需的免疫球蛋白轻链和重链V(D)J区域可以使用在反转录过程中添加的早已并入样品-ID接合体中的限制性位点进行克隆。这产生在PCR扩增子池中具有孔-ID条码3’侧的限制性位点的接合体。在用克隆引物克隆过程中，所需的扩增子使用与孔 -ID条码序列互补的5’引物和链特异性的3’引物(对于κ、λ和γ链) 从板特异性扩增子池扩增。3’引物添加3’限制性位点。5’引物不需要添加限制性位点，因为5’引物早已包含孔-ID条码3’侧限制性位点。在这一扩增后，限制性酶用于切割扩增子以连接到含恒定区插入片段的载体中。在限制性酶消化过程中，添加到Ig基因序列的5’端上的序列如条码和通用序列被切割，因为它们在5’限制性位点的5’侧。

实施例40：通过测序仅一条免疫球蛋白链(重链或轻链)，然后通过克隆配对的免疫球蛋白重链和轻链V(D)J区域鉴别克隆家族

抗体重链和轻链从mRNA反转录，从而将独特的样品-ID并入到从各样品产生的cDNA上，且汇合样品cDNA用于扩增PCR。扩增免疫球蛋白cDNA且使用454高通量测序对免疫球蛋白重链或轻链进行测序，并且序列按照表现出相同基因组编码V(D)J片段的使用的其免疫球蛋白重链V(D)J或轻链V(D)J序列的使用分组。生物信息学用于鉴别目标克隆家族，且来自相同样品的所需免疫球蛋白轻链和重链V(D)J区域然后选择性扩增用于测序和/或克隆。对于 PCR扩增，正向引物包括样品-ID和反向引物对于轻链或重链恒定区是特异性的。引物可以将限制性位点并入扩增子中。然后扩增子可以插入早已包含重链或轻链恒定区的适当表达载体中。然后抗体可以表达和筛选所需性质。

实施例41：仅使用样品-ID(不使用无板-ID)鉴别用于抗体的克隆和表达的来自免疫球蛋白重链和轻链V(D)J测序的克隆家族

抗体重链和轻链从各样品中的mRNA反转录，从而将独特的样品-ID并入到从各样品产生的cDNA中。各样品-ID长度为至少6个核苷酸长且具有1碱基对的差异，从而产生4096个独特的潜在样品 -ID。独特的样品-ID用于各样品，且独特的样品-ID鉴别源自不同样品的cDNA并使配对测序和单个样品中表达的2个或更多个cDNA 的克隆成为可能。重链和轻链扩增子使用PCR扩增，其添加454高通量测序所需的钛接合体A和B且然后所有样品发送用于测序。序列按照“材料和方法”中“序列分配到孔”和“序列的组装”节分配到孔和组装。V(D)J分配使用HighV-QUEST进行并基于其V(D)J使用分组到克隆家族中。选择的克隆然后用克隆引物特异性扩增，克隆引物也将限制性位点添加到扩增子中。扩增子然后同框插入早已含用于表达筛选所需性质的抗体的适当重链或轻链恒定区的表达载体中。

实施例42：通过连接在通用引物序列上克隆配对的序列

抗体重链和轻链基因从mRNA反转录，其添加3′序列到由接合体区域和样品-ID条码组成的新合成cDNA上。样品然后汇合到一起且通用引物序列使用T4 DNA连接酶和5′磷酸化反义通用引物寡核苷酸添加到第一链cDNA的3′端。或者，可以进行第二链cDNA合成以获得双链cDNA而不是mRNA/cDNA杂合体，随后连接在通用引物序列上。然后进行两轮PCR以扩增cDNA并添加板-ID和用于 454测序的钛引物A和B。或者，板-ID和钛引物也可以通过DNA 连接添加而不是在PCR过程中通过使用T4 DNA连接酶并入。在454 测序后，组装序列并鉴别克隆家族。从克隆家族选择的克隆可以使用添加限制性位点到扩增子上的克隆引物特异性克隆。然后序列同框插入早已具有适当重链或轻链恒定区的表达载体中。然后表达抗体并筛选所需的性质。

实施例43：用于免疫球蛋白重链和轻链的反转录的基因特异性引物(RT-GSP)的测试

在重链和轻链基因的反转录中使用RT-GSP代替寡(dT)作为引物。cDNA然后通过PCR扩增并在琼脂糖凝胶上可视化。RT-GSP 引物在道1-4中分别是IgKC_v3(a)、IgLC_v5、IgLC_v6、IgLC_v7 和IgLC_v8(b)，在道1-4中分别是IgHGC_v10、IgHGC_v11、 IgHGC_v13和IgGC_v15(c)及IgHGC_v16(d)。引物名称中的KC、 LC和GC表示引物分别对于κ链、λ链和γ重链是特异性的。凝胶照片中的白色条带表示非-相关道被修剪掉的位置。参见图10和表6。

实施例44：接合体区域序列的测试

RNA用在3’末端包含通用引物区域和接合体区域的寡核苷酸反转录。然后eDNA使用通用引物区域序列作为正向引物和基因特异性序列作为反向引物扩增。扩增的产物在琼脂糖凝胶上可视化。接合体区域由G(a)、分别在道1和2中的GGGGG和rGrGrG(b)组成。 rG表示RNA核苷酸而非DNA核苷酸。参见图11和表6。

实施例45：通用引物序列的测试

RNA用在3’末端包含通用引物区域和接合体区域的寡核苷酸反转录。然后cDNA使用与通用引物区域互补的正向引物和与基因特异性序列互补的反向引物的PCR扩增。Univ_seq_4(a)、univ_seq_5(b) 和univ_seq_f(c)。凝胶照片中的竖直白色条带表示非相关条带被修剪掉的位置。另外的道属于相同的凝胶照片。参见图12和表6。

实施例46：用于第一PCR反应的基因特异性引物序列的测试

基因-特异性反向引物在第一PCR反应中用于序列的扩增中。第一PCR反应或后续的第二嵌套PCR产物进行分析并在琼脂糖凝胶上可视化。使用的反向引物是分别在道1-3上的IgKC_v4、IgLC_v5、 IgHGC_v13(a)，分别在道1-3上的K_GSP1、L_GSP1、G_GSP1(b)，分别在道1-2上的K_GSP1c、L_GSP1c(c)，分别在道1-2上的G_GSP1 (d)、L_GSP1d、G_GSP1g(e)，分别在道1-4上的G_GSP1h、G_GSP1k、 L_GSP1f、L_GSP1g(f)，分别在道1-8上的G_GSP1d(g)L_GSP1h-o (h)，分别在道1-6上的G_GSP1m-q和G_GSP1t(引物名称中的K、L 和G指示引物分别对于κ、λ和γ免疫球蛋白恒定区是特异性的)。各凝胶以左侧的道标记开始，之后是样品道。相同凝胶照片上的道之间的白色条表示其间的非相关道被修剪掉的位置。参见图13。另外，更多的引物在图43中测试。这些引物用于第一PCR，且然后第二PCR使用来自表1的引物进行且PCR产物在2％琼脂糖凝胶上分析和获取图像。用于第一PCR的引物分别是κGSP1、κGSP1e、 κGSP1f、λGSP1、λGSP1x和λGSP1y。使用的序列也参见表6。

实施例47：用于第二PCR反应的基因特异性序列的测试

基因特异性反向引物在第二PCR反应中用于序列的扩增中。 PCR产物进行分析并在琼脂糖凝胶上可视化。使用的反向引物是分别在道1-3中的K_GSP2、L_GSP2、G_GSP2(a)，分别在道1-3中的 K_GSP2v2a、K_GSP2v2b、L_GSP2v2(b)，分别在道1-4中的 K-GSP2v2c、K-GSP2v2c、G_GSP2v2c1、G_GSP2v2c2(c)，分别在道1-3中的K_GSP2v2d-f(d)，分别在道1-3中的K_GSP2v2g、 L_GSP2v2d和G_GSP2b(e)。引物名称中的K、L和G指示它们分别对于κ、λ和γ免疫球蛋白恒定区是特异性的。各凝胶以左侧的道标记开始，之后是样品道。相同凝胶照片上的道之间的白色条表示其间的非相关道被修剪掉。参见图14和表6。

实施例48：用于其它人可变区基因的基因特异性引物的测试

第一和第二PCR使用基因-特异性反向引物进行，且产物在2％琼脂糖凝胶上分析和成像。从左起的道为：标志物、μ、α恒定区、 TCRα(a)和标志物、TCRβ(b)。使用的3′引物的序列在表10中。相同凝胶照片上的道之间的白色条表示其间的非相关道被修剪掉的位置。参见图44。

实施例49：用于小鼠可变区基因的基因特异性引物的测试

进行第一和第二PCR且产物在2％琼脂糖凝胶上分析和成像。从左起的道为：标志物、κ、λ、λ、λ、λ轻链和μ重链(a)。4个λ道具有所使用引物的这一组合：小鼠_λ_GSP1a与小鼠e_λGSP2a、小鼠_λ_GSP1a与小鼠_λGSP2b、小鼠_λ_GSP1b与小鼠_λGSP2a和小鼠_λ_GSP1b与小鼠_λGSP2a。标志物和α重链(b)。分别使用 mo_g12_GSP2d和mo_g12_GSP2e的第二PCR的γ1、2a、2c重链，标志物(c)。分别使用mo_g3_GSP2d、mo_g3_GSP2e的第二PCR的γ3 重链，之后是分别使用mo_g2b_GSP2d、mo_g2b_GSP2e的第二PCR 的γ2b重链，接着是标志物(d)。标志物、TCRα(e)。标志物、TCRβ(f)。相同凝胶照片上的道之间的白色条表示其间的非相关道被修剪掉的位置。参见图45和表11。

实施例50：在一端具有条码的连接的抗体重链和轻链对的产生

如图1中所示的，单个B细胞可以通过流式细胞术从血液、整批外周血单核细胞(PBMC)、整批B细胞、浆母细胞、浆细胞、记忆 B细胞或其它B细胞群体分选。B细胞经单一细胞分选到96-孔PCR 板中，留下一列孔空白作为阴性对照。图17描述了可用于连接两个目标多核苷酸和在一端添加条码的方法的一般方法学。

单步骤多重重叠-延伸RT-PCR可以使用商购的一步RT-PCR试剂盒(例如，Qiagen一步RT-PCR试剂盒)按照制造商的推荐进行。在这一特定实例中，多核苷酸合成反应如反转录反应用于从mRNA 样品产生cDNA模板。参见图17，用于RT-PCR反应的正向基因特异性引物包含限制性酶位点(RE1)、测序引物位点和条码以将这些元件添加到第一目标cDNA上。两个另外的引物(显示为含RE3)具有互补的重叠-延伸尾。这些引物用于PCR反应中产生携带重叠延伸尾的两个目标cDNA，其允许两个目标cDNA退火并在扩增过程中连接。在所示的实例中，产生具有所示结构的产物，其中LC和HC 链在一端用条码物理连接。

RE1和RE2限制性位点可以用于克隆PCR产物到用于测序的适宜载体中。

实施例51：具有内部条码的连接的抗体重链和轻链对的产生

如图1中所示，单个B细胞可以通过流式细胞术从血液、整批外周血单核细胞(PBMC)、整批B细胞、浆母细胞、浆细胞、记忆B 细胞或其它B细胞群体分选。B细胞单一细胞分选到96-孔PCR板中，留下一列空白孔作为阴性对照。图18描述了可用于连接具有位于其间的条码的两个目标多核苷酸的方法的一般方法学。可用于抗体重链和轻链的引物和寡核苷酸显示于表30中。限制性位点AsiSI 和PacI包括在RT寡核苷酸中。样品-ID序列显示于表2中。

图18显示的方法依赖于cDNA合成反应过程中反转录酶的3’ 加尾和模板转换活性。添加到合成的cDNA上的3’C尾可用于带有重叠延伸序列和条码的接合体分子的退火。两种类型的接合体分子用于连接两个cDNA。携带重叠延伸和条码序列的第一接合体添加到第一cDNA上。携带重叠延伸的反向互补序列而没有条码序列的第二接合体添加到第二cDNA上。反转录酶的模板转换性质添加这些序列到其相应cDNA的3’端上。

在PCR反应中，如图18中所示，互补重叠延伸序列退火和对应的DNA链从退火的位点合成。使用外部引物的后续轮的PCR导致连接的cDNA分子的扩增。

通过适当限制性位点的添加和并入到用于扩增反应的引物中的测序引物位点的添加或者之后通过连接反应，PCR产物可以克隆到用于测序的合适载体中。

实施例52：使用通用序列重叠-延伸引物产生具有两个内部条码的连接的抗体重链和轻链对

如图1中所示，单个B细胞可以通过流式细胞术从血液、整批外周血单核细胞(PBMC)、整批B细胞、浆母细胞、浆细胞、记忆B 细胞或其它B细胞群体分选。B细胞单一细胞分选到96-孔PCR板中，留下一列空白孔作为阴性对照。图19描述了可用于在两个连接的目标多核苷酸之间引入两个内部条码的方法的一般方法学。可用于抗体重链和轻链的引物和寡核苷酸显示于表31中。限制性位点 AsiSI和PacI包括在RT寡核苷酸中。样品-ID序列显示于表2中。

图19中显示的方法依赖于cDNA合成反应过程中反转录酶的3’ 加尾和模板转换活性。在这一实例中，添加到寡(dT)引发的cDNA 上的3’C尾可用于携带通用序列和条码的接合体分子与待接合的各 cDNA退火。反转录酶的模板转换性质添加这些序列到其相应cDNA的3’端。使用带有互补重叠-延伸序列的针对通用序列的引物与外部 LC和HC特异性引物结合进行的后续重叠-延伸PCR产生其中LC 用LC和HC之间的两个内部条码连接到HC上的结构，如图19中所示。

实施例53：使用重叠-延伸接合体产生具有两个内部条码的连接的抗体重链和轻链对

如图1中所示，单个B细胞可以通过流式细胞术从血液、整批外周血单核细胞(PBMC)、整批B细胞、浆母细胞、浆细胞、记忆B 细胞或其它B细胞群体分选。B细胞经单一细胞分选到96-孔PCR 板中，留下一列空白孔作为阴性对照。图20描述了可用于在两个连接的目标多核苷酸之间引入两个内部条码的另一方法的一般方法学。可用于抗体重链和轻链的引物和寡核苷酸显示于表32中。限制性位点AsiSI和PacI包括在RT寡核苷酸中。样品-ID序列显示于表中。

图20中显示的方法也依赖于cDNA合成反应过程中反转录酶的 3’加尾和模板转换活性。在这一实例中，添加到使用基因特异性引物合成的cDNA上的3’C尾可用于带有自身互补或回文重叠-延伸序列和条码的接合体分子与待接合的各cDNA退火。反转录酶的模板转换性质添加这些序列到其相应cDNA的3’端。添加到LC和HC cDNA 上的重叠-延伸序列的后续退火在重叠的位点将它们连接到一起。使用对于LC和HC的外部引物的重叠-延伸PCR导致其中LC用LC 和HC之间的两个内部条码连接到HC上的结构，如图20中所示。

实施例54：添加条码的不同方法的研究

我们研究了可以在反转录或扩增反应过程中使用包含条码序列的寡核苷酸添加条码序列的多种方法。我们测试了通过将条码并入基因特异性引物(GSP)中和可通过模板转换添加到cDNA的3’端的含一个或多个G的寡核苷酸中的条码添加。基于文献和我们的科学知识，我们的预期是我们能够使用5’条码标记的寡核苷酸或3’条码标记的GSP有效地条码标记cDNA。

如图21中表明的，RT用1μg总PBMC RNA和0.5μM univ_seq_2模板转换寡聚体及具有另外的5’侧翼序列的0.1μM IgKC_v3GSP(道1-2)和IgLC_v5GSP(道3-4)进行，其中第一部分是 Fixed_PCR3序列，且最后8bp AACAATAC是条码。RT反应使用 NucleoTraPCR(Macherey-Nagel)清洁并溶解在50μl终体积中。2μl 的这一反应用于各后续PCR反应中，其使用内部5’V_K(道1)或V_L (道3)引物或Univ_seq_2(道2和4)作为5’引物及Fixed_PCR3作为3’ 引物。注意，V_K引物对于κV基因1和2是特异性的，且V_L引物对于λV基因2是特异性的。序列在表33中。如可看到的，道2和4 中的PCR产物分析为弥散条带。相反地，内部5’引物产生明显不同的条带(道1和3)，表明引物对发挥作用，且在道1和3中显示的弥散可能不归因于设计不良的引物。由于寡核苷酸添加到所有全长反转录eDNA序列上，当在使用univ_seq_2和3’条码标记的GSP的 PCR扩增过程中获得弥散条带时，这表明使用条码标记的GSP的反转录在RT反应中产生非特异性引发的核酸序列。我们的结果表明5’ 通用序列接合体和3’条码标记的引物的使用不是用于B细胞或其它细胞表达的免疫球蛋白或其它基因的条码标记和特异性扩增的良好策略。

事后看来，DNA的几种生物学性质和使用的分子反应可能导致我们观察的现象。反转录通常在低温如42℃或56℃下进行。与 PCR不同，在退火步骤通常在仅略低于引物的Tm的温度下进行以促进引发的特异性的情况中，这不能对于反转录进行，因为反转录酶在高温下失活。因此，在RT过程中使用的基因特异性引物通常对于目标基因不是非常特异的，因为反应在比引物的Tm高得多的温度下进行。在这种情况下，引物也可以结合具有一些错配的脱靶mRNA 序列，并发生错误引发(mispriming)。如果条码添加到GSP上，引物也必须具有用于后续PCR中的条码5’侧的固定序列。这使得引物非常长(～60nt)，从而产生具有甚至高得多的错误引发程度的引物。但是，PCR过程中的特异性扩增通常仍可通过使用高度基因特异性正向引物实现；只要引物对的一个成员是特异性的，通常可以存在特异性扩增，如道1和3中所示。

如果模板转换技术用于添加接合体，该接合体添加到经合成以形成第一链cDNA的所有mRNA上。如上所述，条码标记的GSP将具有显著量的错误引发，特别地由于RT酶Superscript III在56℃下丧失其模板转换活性且反转录在42℃下进行。特定的嵌套5’或3’ 引物不能使用，因为其将丧失其PCR扩增所有免疫球蛋白基因(因此由于可变V基因必须借助于使用多个简并5’引物的多重PCR)的能力或丧失3’条码。因此，条码标记的GSP不适合用于模板转换添加的接合体或任何其它5’接合体，因为添加5’接合体的其它方法如TdT加尾或平端克隆也无区别地添加接合体。因此，内部3’引物或者嵌套或半嵌套的PCR扩增策略也是需要的，且条码标记的3’GSP 不允许使用这些策略进行来自B细胞或其它细胞的基因的特异性扩增。基于我们的结果，也预计条码标记的寡(dT)出于我们认为条码标记的GSP表现不良的多种相同理由而表现不良。这些理由包括但不限于不能使用内部3’引物或者用于来自B细胞或其它细胞的基因的特异性扩增的嵌套或半嵌套PCR策略。

相反，我们的结果(参见其它实施例)证明了使用包含条码序列和与在反转录反应过程中生成的cDNA的3’尾退火的接合体的引物在反转录反应过程中进行条码序列添加的优越性。在这样的实施方式中，接合体序列可以包含条码序列且可以用于标记编码抗体重链和轻链的基因。因此，如本文中公开的，模板转换或任何其它cDNA 加尾的方法添加可用于PCR扩增的序列而无需预先了解5’序列本身，使得能够有效和无偏地表示抗体谱。此外，这一途径允许获得编码抗体以外的蛋白质的其它共表达基因的组库。另外，使用模板转换接合体的途径具有优于本领域中公开的使用简并正向引物组扩增多个V基因的方法的明显优势。这些方法也不能捕获整个抗体谱，因为已知的5′引物组：a)覆盖大多数而不是整个谱集合；b)不能够覆盖人类群体中迄今为止已知的V基因变异体(多态性)；和c)可能不能有效扩增已发生广泛体细胞超变(SHM)的抗体序列。SHM效应的实例参见，例如，Scheid等，Sciencexpress，14July 2011。

因此，模板转换接合体用于制备表达的基因(例如抗体重链和轻链)的文库通过允许无偏地表示特定基因家族和其它共表达基因而提供了优于本领域中已知的其它方法的明显优势。模板转换接合体或使用任何其它方法(例如但不限于TdT加尾和平端连接)添加的5’接合体的使用也与条码标记的5’接合体而不是条码标记的3’ GSP或条码标记的寡(dT)更相容，理由如上所述。

实施例55：在流式细胞仪上通过前向散射和/或侧向散射和/或与其它细胞标志物结合分选浆母细胞

浆母细胞是激活的、已增殖/正在增殖和已发生亲和力成熟的未成熟B细胞。浆母细胞代表活性免疫应答，且通过实施本发明的方法和组合物允许利用结合目标靶抗原(无论是感染、疫苗、自身免疫或癌抗原)的抗体的克隆家族来生物信息学构建进化树。

浆母细胞是未成熟B细胞且大于静息B细胞(图40A-B)。因此浆母细胞可以在流式细胞仪上使用其前向散射和侧向散射性质分选。如图40c中所示，浆母细胞具有大于其它CD20⁺B细胞的中值 FSC-A～1.29-1.66x的中值FSC-A，具有大于静息CD20⁺B细胞的 1.04-1.16x的中值FSC-W。浆母细胞也具有单核细胞中值FSC-A的 0.85-0.98x的中值FSC-A和单核细胞中值FSC-W的0.92-1.02x的中值FSC-W，如通过95％置信区间确定的。此处FSC-A和FSC-H可以是可互换的且是等同的，因为FSC-A和FSC-H在校准的流式细胞仪上缩放以给出相同的值。对于SSC-A(和SSC-H，由于缩放)和 SSC-W类似地，浆母细胞具有作为CD20⁺B细胞中值SSC-A的 0.74-2.56x和单核细胞中值SSC-A的0.21-0.84x的中值SSC-A，和作为CD20⁺B细胞中值SSC-W的1.01-1.20x和单核细胞中值SSC-W 的0.82-1.03x的中值SSC-W。浆母细胞与B细胞的比率是与淋巴细胞的比率典型的，因为静息淋巴细胞尺寸上是相似的。

鉴别浆母细胞的可选方式是使用浆母细胞的20分位FSC或SSC 与CD20⁺B细胞或单核细胞的中值FSC或SSC(图40D)，其是CD20⁺ B细胞中值FSC-A(FSC-W)的1.04-1.50x(1.02-1.11x)和单核细胞中值 FSC-A(FSC-W)的0.70-0.88x(0.88-1.00x)。浆母细胞具有作为CD20⁺ B细胞中值SSC-A(SSC-W)的0.67-1.89x(0.99-1.11x)和单核细胞中值 SSC-A(SSC-W)的0.20-0.62x(0.77-0.99x)的20分位SSC-A(SSC-W)。这些数值允许包括80％的浆母细胞和排除其它淋巴细胞的选通截止。这允许与单色或双色染色剂结合使用FSC(和/或SSC)以在单一细胞分选的浆母细胞中选通浆母细胞。这样的组合可以包括 FSC^hiCD19^lo(图39b)、CD19⁺FSC^hi(图39c)、CD19⁺FSC^hiCD20^-(图39d)、 CD19⁺FSC^hiCD38^hi(图39e)和CD19⁺FSC^hiCD27⁺(图39f)。分选的细胞然后可以进行RT、用于条码标记的PCR，如在“材料和方法”的“非降落PCR”中完成的。用于测序、克隆和表达的下游准备按照实施例6 和8中进行。注意给出的比率是95％置信区间的比率，或其中95％的比率应落入该范围。

实施例56：在任何筛分装置如微流体装置上通过大小分选浆母细胞

浆母细胞是未成熟B细胞且大于静息B细胞。浆母细胞和CD20⁺ B细胞经FACS分选并用台盼蓝染色以排除死细胞和以200x放大倍率成像。成像52个浆母细胞和51个CD20⁺B细胞并用ImageJ测量细胞面积。成像的浆母细胞的直径为7.8-13uM，面积为48-121uM²和体积为251-996uM³。CD20⁺B细胞不是未成熟的且是较小的，大部分的直径为6-8uM，或小于50uM²，或小于268uM³，其中51个细胞中仅4个细胞大于该值(图41)。能够分离直径大于或小于8uM 或者面积大于或小于50uM²或者体积大于或小于268uM³的筛分装置能够将浆母细胞与CD20⁺静息B细胞分离，捕获96％的浆母细胞和筛分掉92％的静息B细胞。这样的装置可以是具有8uM直径孔的细筛或具有仅允许或阻止直径大于8uM或者面积大于50uM²或者体积大于268uM³的细胞通过的微流体装置。这些细胞然后可以在微流体装置中通过致动器/泵分选到孔中，以使得仅存在一个或一些细胞/ 孔，且然后RT、用于条码标记的PCR使用相同试剂浓度如“材料和方法”的“非降落PCR”中进行。用于测序、克隆和表达的下游制备如实施例6和8中进行。

实施例57：抗金黄色葡萄球菌抗体增强嗜中性细胞系的金黄色葡萄球菌细胞吞噬

发生针对其金黄色葡萄球菌感染的有效免疫应答的具有金黄色葡萄球菌感染的人，例如清除金黄色葡萄球菌感染而不需要抗生素疗法的人，用作染色和分选外周血浆母细胞的外周血的来源。浆母细胞如“材料和方法”的“非降落PCR”中详细描述的进行单一细胞分选条码标记，并如“材料和方法”的“准备用于454 XLR70测序”中详细描述的准备用于测序。进化树通过生物信息学方法构建且各克隆家族的一些选择的代表性克隆如实施例8中进行选择和克隆用于表达为重组抗体。金黄色葡萄球菌Wood菌株(其为～5％蛋白质A阳性的)接种在5％胰酶解酪蛋白大豆琼脂(TCA)血液琼脂上且集落生长并保持在4℃下作为原种。这一原种每周通过挑取另一集落更新。 1mL的这一原种用于接种金黄色葡萄球菌生长直到OD550＝0.5，其为大致对数生长中期。金黄色葡萄球菌在室温下在4％多聚甲醛(PFA) 中轻度固定15分钟并用Hanks平衡盐溶液(HBSS)洗涤一次，然后室温下用1uMCFSE染色15分钟。固定的细菌然后洗涤并与10ug/ml 表达的重组抗金黄色葡萄球菌抗体或作为阴性对照的10ug/ml表达的抗流感病毒抗体一起孵育。然后细菌洗涤两次。HL-60(一种嗜中性细胞系)用25uM视黄酸活化96hr，并用1∶1至1∶100比率的标记的固定细菌在37℃下孵育45分钟，在96孔板中以300rpm轻轻振摇。HL-60然后洗涤两次并在流式细胞仪上分析。HL-60中标记的 CFSE的量是细胞吞噬的金黄色葡萄球菌量的指示。一些表达的抗金黄色葡萄球菌抗体将结合葡萄球菌细胞表面蛋白质和调理细菌，从而导致细胞吞噬增加。

实施例58：抗金黄色葡萄球菌抗体增强嗜中性白细胞介导的金黄色葡萄球菌杀灭

能够有效控制和/或清除其金黄色葡萄球菌感染的人如在上述相关实施例中进行选择，且分离浆母细胞并单一细胞分选以用于如在上述相关实施例中测序及克隆和表达。金黄色葡萄球菌临床分离物接种在5％TCA血液琼脂上且集落生长和作为原种保持在4℃下。这一原种通过挑取另一集落每周更新。1mL的这一原种用于接种金黄色葡萄球菌生长直到OD550＝0.5，其为大致对数生长中期。金黄色葡萄球菌然后与2ug/ml的表达抗金黄色葡萄球菌抗体在4C下孵育30分钟，然后洗涤两次。HL-60嗜中性白细胞用25uM视黄酸活化96hr，并用1∶1至1∶100比率的幼兔补体和金黄色葡萄球菌在37℃ 下孵育45分钟，在96孔板中以300rpm振摇。HL-60细胞然后快速置于冰上并洗涤3x以移除松散连接的金黄色葡萄球菌。细胞外金黄色葡萄球菌然后系列稀释并接种在5％TSA血液琼脂上和在37℃下培养过夜。第二天计数集落以确定集落形成单位(CFU)的数目。通过特定抗金黄色葡萄球菌重组抗体(在与金黄色葡萄球菌孵育后)的 CFU的降低证明那些抗体有效介导增强的细胞吞噬作用和通过细胞 HL-60杀灭金黄色葡萄球菌或降低其生长(图46)。

实施例59：在小鼠模型中使用表达的抗金黄色葡萄球菌抗体治疗金黄色葡萄球菌感染的小鼠

如在实施例58中表现出体外杀灭、降低生长或结合活性的抗金黄色葡萄球菌抗体也可以具有体内活性。具有杀灭活性的抗金黄色葡萄球菌抗体如实施例55-58中从能够控制其葡萄球菌感染的金黄色葡萄球菌感染的人分离。小鼠给予致死剂量的金黄色葡萄球菌且然后使用对照抗体或表现出体外杀灭、降低生长或结合活性的重组抗金黄色葡萄球菌抗体治疗。如果小鼠如通过Kaplan-Meier生存测试确定的具有较长生存期或降低的感染严重性，它们视为获得保护。源自控制或减轻其金黄色葡萄球菌感染的严重性的抗金黄色葡萄球菌抗体因而评价其赋予针对金黄色葡萄球菌的被动保护的能力。

实施例60：有效的抗金黄色葡萄球菌免疫应答的抗原靶标用于开发疫苗

由表现出杀灭、降低生长或结合活性的金黄色葡萄球菌抗体所靶向的金黄色葡萄球菌抗原是金黄色葡萄球菌疫苗的良好候选。发生针对那些特异性抗原的强应答的疫苗可以获得针对金黄色葡萄球菌感染的保护或表现出降低的金黄色葡萄球菌感染的严重程度。具有杀灭、降低生长或结合活性的抗金黄色葡萄球菌抗体从能够控制其金黄色葡萄球菌感染的金黄色葡萄球菌感染的人分离，且如实施例55-58中使用质谱鉴别其靶抗原。小鼠用模拟载体进行疫苗接种或用候选金黄色葡萄球菌抗原进行疫苗接种，且然后在两个月时间内加强两次。小鼠可以单独地或组合地用候选金黄色葡萄球菌抗原进行免疫。抗金黄色葡萄球菌抗原抗体效价通过ELISA证实。小鼠然后用致死剂量的金黄色葡萄球菌激发。如果小鼠如通过Kaplan-Meier 生存测试确定的具有较长生存期，它们视为获得针对金黄色葡萄球菌的保护。因此针对这些选择的金黄色葡萄球菌抗原的免疫赋予保护或降低感染的严重性，从而表明本文中的组合物和方法可有助于疫苗设计。

实施例61：使用在人体中具有体内杀灭、降低生长或结合活性的重组抗金黄色葡萄球菌抗体治疗金黄色葡萄球菌感染的人

源自控制其金黄色葡萄球菌感染的人，并且如实施例55-59中表现体外和体内杀灭、减少生长或结合活性的抗体可以用于治疗金黄色葡萄球菌感染的患者。获得抗体并如实施例55-59中测试体外和体内杀灭活性。良好生产作业(GMP)生产的抗金黄色葡萄球菌单克隆抗体可以静脉内或皮下给予金黄色葡萄球菌感染的人，特别是被甲氧西林抗性金黄色葡萄球菌(MRSA)或其它药物抗性金黄色葡萄球菌感染的患者，并与抗生素一起进行效力比较。如果患者获得针对侵袭性金黄色葡萄球菌感染的保护，具有较不严重的金黄色葡萄球菌感染和/或与单独给予抗生素或未给予抗生素的患者相比更快地恢复，则抗金黄色葡萄球菌抗体视为具有治疗效用。重组抗金黄色葡萄球菌抗体可以治疗性地给予具有活性金黄色葡萄球菌感染的患者以降低感染的严重程度和/或增强感染的清除以及预防性地给予高风险患者群体如进行肾衰竭的血液透析的患者、接收住院的患者或对金黄色葡萄球菌或MRSA筛选阳性的患者。

实施例62：使用鉴别的金黄色葡萄球菌抗原的金黄色葡萄球菌疫苗接种以在人体中产生保护性免疫

由在体内表现出杀灭或结合活性的金黄色葡萄球菌抗体所靶向的且在小鼠模型中进行疫苗接种时产生针对金黄色葡萄球菌激发的保护的金黄色葡萄球菌抗原可能是人体中预防性疫苗的良好候选。抗金黄色葡萄球菌抗体源自控制其金黄色葡萄球菌感染的人，并且如实施例55-58和59中在小鼠中作为疫苗候选者被克隆、表达和测试其体内杀灭、减少生长或结合活性。然后给予人含作为抗金黄色葡萄球菌抗体靶标的金黄色葡萄球菌抗原的金黄色葡萄球菌疫苗，该金黄色葡萄球菌抗体具有杀灭、减少生长或结合活性，以安慰剂作为对照。追踪同龄组的金黄色葡萄球菌感染的发生率或严重程度。如果其降低疫苗接种的同龄组与安慰剂同龄组相比的金黄色葡萄球菌感染的发生率或严重程度，则疫苗被视为成功的。

实施例63：由作为关联保护的候选金黄色葡萄球菌疫苗诱导的免疫应答的监测

在如实施例62中用候选金黄色葡萄球菌疫苗对人进行免疫后，免疫应答可以通过确定是否诱生抗目标金黄色葡萄球菌靶抗原的稳定克隆家族来监测。血液在疫苗接种后7-14天抽取，且浆母细胞如 “材料和方法”的“非降落PCR”和“准备用于454 XLR70测序”中详细描述的进行单一细胞分选、条码标记和454测序。绘制进化树且然后各克隆家族的2-3个成员如实施例8中进行克隆和表达，并在 ELISA中测试其与目标葡萄球菌抗原的结合。我们预期具有强的疫苗诱导抗金黄色葡萄球菌免疫应答的人表现出针对有效人免疫应答中靶向的金黄色葡萄球菌抗原的大的克隆家族。这一途径具有提供金黄色葡萄球菌疫苗的关联保护的潜力且如此能够使得临床试验和开发更为流畅。这一抗体和/或TCR免疫组库监测使得能够快速评估候选疫苗提供疗效的可能性。

实施例64：使用重组抗-肺腺癌抗体治疗患有肺腺癌的小鼠

结合细胞表面蛋白质或其它肺腺癌蛋白质的抗-肺腺癌抗体可以用作将毒素靶向于肺腺癌细胞或靶向肺腺癌细胞表达的其它分子的载体。具有细胞表面结合活性的抗-肺腺癌抗体或其它肺腺癌抗原如实施例11中从长期非进展者肺腺癌患者分离。裸鼠给予皮下注射的 H 1650肺腺癌细胞系，且允许肿瘤生长一周。抗肺腺癌抗体然后与毒素如缺乏R-结构域(其为细胞结合结构域并允许白喉毒素进入细胞)的白喉毒素偶联。因此缺乏R-结构域的白喉毒素仅对于抗体与之结合并递送白喉毒素有效负载的肺腺癌细胞是致死性的。与无R 结构域的白喉毒素偶联的对照抗体用作对照。如果肿瘤负荷比对照中降低更多，则肺腺癌抗体视为已成功递送其有效负载以杀死肺腺癌细胞。或者，在某些情况中，重组抗体本身可能能够介导肿瘤细胞杀灭或防止肿瘤细胞生长(在不存在偶联的毒素的情况下)。

实施例65：使用表达的抗-肺腺癌抗体治疗肺腺癌患者

结合细胞表面抗原的抗-肺腺癌抗体可以用作将毒素靶向于肺腺癌细胞的载体。具有细胞表面结合活性的抗-肺腺癌抗体如实施例11 中从长期非进展者肺腺癌患者分离。GMP单克隆抗体或其它抗-肺腺癌单克隆抗体可以静脉内或皮下给予肺腺癌患者，特别是给予其活检的肺腺癌细胞表达高水平的被该单克隆抗体靶向的细胞表面抗原的患者。重组单克隆抗体肺腺癌抗原或来自其所来源的克隆家族的其它成员可以用于免疫组织化学染色单个患者的肺腺癌的活检样本以得到关于肿瘤抗原表达水平的信息，且该信息可用于确定是否单个患者可能对该单克隆抗体治疗有反应。抗-肺腺癌抗体可以与毒素偶联，如缺乏R-结构域(其为细胞结合结构域并允许白喉毒素进入细胞中)的白喉毒素。因此缺乏R-结构域的白喉毒素仅对于抗体与之结合并递送白喉毒素有效负载的肺腺癌细胞是致死性的。标准护理的化疗用于治疗对比者组。如果患者存活较长时间或者在复发或进展前表现出较长的时间，抗-腺癌抗体视为已递送其有效负载且具有治疗效用。或者，在某些情况中，抗肺腺癌抗原的重组抗体本身可能能够介导肿瘤细胞杀灭或防止肿瘤细胞生长(在不存在偶联的毒素的情况下)。

实施例66：人中使用鉴别的抗原的肺腺癌治疗性疫苗接种

由抗肺腺癌抗体结合的细胞表面抗原可以用于治疗性疫苗中以治疗确立的肺腺癌或保护以避免肺腺癌的发生。具有细胞表面结合活性的抗肺腺癌抗体如实施例11中从长期非进展者肺腺癌患者分离，并使用免疫沉淀或免疫印迹和质谱鉴别靶抗原。受接种者给予含目标肺腺癌抗原的疫苗或对照疫苗。然后遵循同龄组并追踪肺腺癌的发生率或进展。如果用靶抗原接种的人与标准护理对比者组相比具有延长的存活期或延长的复发时间，则疫苗被视为成功的。

实施例67：肺腺癌疫苗接种用于应答效力的免疫监测

在如实施例66中用肺腺癌疫苗对人进行免疫后，疫苗反应可以通过确定是否诱生抗疫苗中的目标腺癌抗原的稳定克隆家族而监测。在疫苗接种后7-14天之间抽血且浆母细胞进行单一细胞分选和条码标记，并且如“材料和方法”的“非降落-PCR”和“准备用于454 XLR70测序”中详细描述的进行454测序。绘制进化树并且各克隆家族的2-3个成员然后如实施例8中克隆和表达并在ELISA中测试其与目标葡萄球菌抗原的结合。我们预期具有强免疫应答的人将具有针对目标肺腺癌抗原的大的克隆家族和/或许多抗目标肺腺癌抗原的克隆家族。这种免疫监测允许我们快速预测候选疫苗的效力。

实施例68.Superscript III在反转录过程中用于模板转换的用途

在我们的方法中，样品识别区域和接合体区域在反转录过程中添加。这利用了RNA酶H^-反转录酶的3′加尾活性和模板转换活性。最通常地，反转录酶如Superscript II(Invitrogen)在其42℃的工作温度下使用。也已针对热稳定性工程化的具有50℃的推荐工作温度的 MMLV H^-反转录酶如Superscript III报告为不具有这种3′加尾活性且因此不具有模板转换能力 (http：//tools.invitrogen.com/content/sfs/ProductNotes/F_Superscript％20 III％20Enzyme％20RD-MKT-TL-HL0506021.pdf？ProductNoteId＝36)。但是，在图42中，我们证明Superscript III确实具有3′加尾和模板转换活性。这种性能在50℃(Superscript III的推荐反转录温度)下是弱的，且可以解释为什么SuperscriptIII的3′加尾活性之前未报道。但是，随着RT温度从50℃降低到45.5℃再降低到42℃，3′加尾活性和模板转换显著提高。我们预期所有已针对热稳定性工程化的 MMLV RNA酶H-反转录酶在较低工作温度(即42℃至50℃)下也具有3′加尾活性。

实施例69.共表达基因的分析以鉴别与记忆B细胞和浆细胞反应相关的以及归巢于特定组织的抗体

由B细胞、T细胞或如所描述的通过本发明的方法和组合物分选到单独孔中的其它细胞产生的所有cDNA的条码标记使得能够表征浆母细胞、其它B细胞、T细胞和单一细胞水平的其它细胞中的基因共表达。这使得能够使用共表达的基因以鉴别由已经过诱导以分化成记忆B细胞、浆细胞、记忆T细胞、特定类型的效应T细胞 (例如Th1、Th2、Th17或T-调节T细胞)或诱导以归巢到特定组织或位点(例如，胃肠道、皮肤或脑)的B和T细胞表达的特定抗体和TCR。由特定样品中的单个细胞或细胞集产生的所有cDNA的条码标记使得能够对于第一和第二PCR使用另外的3’PCR引物以鉴定特定的这类基因的共表达。5’引物保持与用于扩增可变区基因的那些相同。此外，共表达的基因的分析使克隆家族的亲和力成熟和与B 细胞分化成记忆B细胞、短寿浆母细胞和长寿浆细胞相关的基因的共表达(表34)、原始或记忆T细胞分化成Tregs或Th1、Th2、Th17 细胞(表35)或者B或T细胞归巢到特定位点之间关系的生物信息学分析成为可能。这样的分析可进一步准确地确定介导有效免疫应答的关键抗体或TCR。

例如，源自发生免疫应答的个体的PMBC用于单一细胞分选浆母细胞。本文的方法和组合物用于分析与浆母细胞归巢到不同组织中相关的基因的共表达(参见表36)。数据集的生物信息学分析鉴别与不同身体位置处的分泌相关的抗体。这些抗体基因然后重组地表达以如实施例8中在体外筛选分析中表征。

相关领域的技术人员应当理解，可以在本发明中进行形式和细节的各种变化而不脱离本发明各个方面的精神和范围。

必须注意，如说明书和所附权利要求中使用的，单数形式“一”、 “一个”和“该”包括复数指代，除非上下文明确指示另外的情况。

本说明书文本中引用的所有参考文献、授权的专利和专利申请为了所有目的通过引用全文并入本文。

表格

一般参考文献

Burbelo，P.D.，S.K.Browne等(2010).″Anti-cytokine autoantibodies areassociated with opportunistic infection in patients with thymic neoplasia.″Blood116(23)：4848-4858.

Hua，J.，K.Kirou等(2006).″Functional assay of type I interferon insystemic lupus erythematosus plasma and association with anti-RNA bindingprotein autoantibodies.″Arthritis Rheum54(6)：1906-1916.

May，L.T.，R.Neta等(1993).″Antibodies chaperone circulating IL-6.Paradoxical effects of anti-IL-6″neutralizing″antibodies in Vivo.″ J Immunol151(6)：3225-3236.

Mostbock，S.(2009).″Cytokine/Antibody complexes：an emerging class ofimmunostimulants.″Curr Pharm Des15(7)：809-825.

Robinson，W.H.，C.DiGennaro等(2002).″Autoantigen microarrays formultiplex characterization of autoantibody responses.″ Nat Med8(3)：295-301.

Watanabe，M.，K.Uchida等(2007).″Anti-cytokine autoantibodies areubiquitous in healthy individuals.″FEBS Lett581(10)：2017-2021.

Wildbaum，G.，M.A.Nahir等(2003).″Beneficial autoimmunity toproinflammatory mediators restrains the consequences of self-destructiveimmunity.″Immunity19(5)：679-688.

Wrammert，J.，K.Smith等(2008).″Rapid cloning of high-affinity humanmonoclonal antibodies against influenza virus.″Nature 453(7195)：667-671.

Claims

1.一种包含多个组合物的多核苷酸文库，其中所述多个组合物包含编码属于相同克隆家族的可变区域的cDNA，其中

各组合物存在于单独的容器中；

所述组合物包含单一样品来源的cDNA分子，该单一样品包含单一亲和力成熟的B细胞，其中所述cDNA分子与样品识别区域共价连接，且所述样品识别区域的核苷酸序列不同于文库中其它单独容器中存在的其它组合物的样品识别区域的核苷酸序列；和

其中所述单一样品来源的cDNA分子包含编码免疫球蛋白重链可变区的cDNA分子和编码免疫球蛋白轻链可变区的cDNA分子，且

其中所述单独的容器中的cDNA分子编码免疫球蛋白重链和轻链可变区的同源对。

2.权利要求1的文库，其中所述cDNA分子通过接合体区域连接于所述样品识别区域。

3.权利要求2的文库，其中所述cDNA分子包含在其3’端的核苷酸C。

4.权利要求1的文库，其中所述属于相同克隆家族的可变区域是B细胞免疫球蛋白可变区。

5.权利要求1的文库，其中所述组合物还包含连接于所述样品识别区域的通用引物区域，且其中所述通用引物区域在各单独容器中是基本上相同的。

6.权利要求1的文库，其中所述单一样品是单一B细胞。

7.权利要求6的文库，其中来自单一B细胞的所述cDNA分子包含编码免疫球蛋白重链和轻链可变区的同源对的cDNA分子。

8.权利要求6的文库，其中所述单一B细胞是单一浆母细胞。

9.权利要求8的文库，其中来自单一浆母细胞的所述多个cDNA分子包含编码免疫球蛋白重链和轻链可变区的同源对的cDNA分子。

10.一种包含多个组合物的多核苷酸文库，其中

各组合物存在于单独的容器中；

所述组合物包含：

单一样品来源的多个cDNA分子，该单一样品包含单一亲和力成熟的B细胞，各cDNA分子包含3’端的核苷酸C，和

样品识别-接合体区域，其包含与接合体区域偶联的样品识别区域；

各样品识别-接合体区域的所述样品识别区域的核苷酸序列不同于文库中其它单独容器中存在的其它组合物的样品识别-接合体区域的样品识别区域的核苷酸序列；且

所述样品识别-接合体区域共价连接于所述组合物中的cDNA分子，

其中所述单独的容器中的cDNA分子编码(a)免疫球蛋白重链和轻链可变区的同源对或(b)T细胞受体α链和β链序列的同源对。

11.权利要求10的文库，其中各cDNA分子包含可变区域。

12.权利要求11的文库，其中所述可变区域是B细胞免疫球蛋白可变区。

13.权利要求10的文库，其中各组合物还包含与所述样品识别-接合体区域的所述样品识别区域连接的通用引物区域，且其中所述通用引物区域在各单独容器中是基本上相同的。

14.权利要求10的文库，其中所述单一B细胞是浆母细胞。

15.一种用于产生一个或多个目标多核苷酸的方法，包括：

获得权利要求1-14中任一项所述的文库；和

利用引物组扩增所述多核苷酸文库以产生所述一个或多个目标多核苷酸。

16.权利要求15的方法，进一步包括：对所述一个或多个目标多核苷酸测序；和选择一个或多个目标多核苷酸。

17.权利要求15的方法，其中所述引物组包含一个或多个3’基因特异性引物及任选的5’通用引物。

18.一种用于分析和使用测序数据的方法，包括：

获得与获自权利要求1-9中任一项的文库的多个多核苷酸相关的数据集，其中所述数据集包含所述多个多核苷酸的测序数据，其中所述多个多核苷酸中的各多核苷酸包含样品识别区域，其中各多核苷酸的样品识别区域对于单一样品是独特的，使得来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于所述多个多核苷酸中其它多核苷酸的样品识别区域的序列，该其它多核苷酸来自于与所述第一单一样品不同的一个或多个样品；

通过计算机分析所述数据集以将与具有相同样品识别区域的多核苷酸相关的数据匹配在一起，其中匹配表示所述多核苷酸来源于相同的样品；和

选择一个或多个多核苷酸并克隆该一个或多个多核苷酸。

19.权利要求1的文库，其中所述cDNA分子和所述样品识别区域合并到相同的DNA链中。

20.权利要求1的文库，其中所述cDNA分子使用逆转录酶与所述样品识别区域共价连接。

21.权利要求1的文库，其中所述组合物进一步包含与(i)所述cDNA分子的至少一部分和(ii)所述样品识别区域互补的DNA分子。

22.权利要求3的文库，其中所述cDNA分子包含在其3’端的序列CCC。

23.权利要求1的文库，其中所述组合物中编码可变区域的所有cDNA分子来源于相同的细胞。

24.权利要求1的文库，其中一部分的所述重链可变区和轻链可变区显示出至少80-99％的序列同一性。

25.权利要求1的文库，其中所有所述重链可变区和轻链可变区显示出至少80-99％的序列同一性。

26.权利要求1或10的文库，其中所述重链可变区和轻链可变区是误差校正的。

27.权利要求26的文库，其中所述文库与非源自包含单一B细胞的单一样品的文库相比包含降低的测序误差。

28.一种基于第一目标多核苷酸的选择识别第二目标多核苷酸的方法，包括：

(a)获得与多个多核苷酸相关的数据集，其中所述数据集包含所述多个多核苷酸的测序数据，其中所述多个多核苷酸的各多核苷酸包含样品识别区域，且其中各多核苷酸上的各样品识别区域对于单一样品是独特的，从而将所述多个多核苷酸中的各多核苷酸与单一样品相关联，其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的所述多个多核苷酸中其它多核苷酸的样品识别区域的序列；和

(b)从所述数据集选择与第一单一样品相关的第一目标多核苷酸和基于所述第一目标多核苷酸的样品识别区域识别所述第一单一样品中的第二目标多核苷酸。

29.权利要求28的方法，其中所述第一单一样品包含多个B细胞。

30.权利要求28的方法，其中所述第一单一样品包含单一B细胞。

31.权利要求28的方法，其中所述第一单一样品包含多个T细胞。

32.权利要求28的方法，其中所述第一单一样品包含单一T细胞。

33.权利要求29的方法，其中：

(a)其中所述第一目标多核苷酸包含抗体轻链可变区核苷酸序列，且其中所述第二目标多核苷酸包含抗体重链可变核苷酸序列；或

(b)所述第一目标多核苷酸包含抗体重链可变区核苷酸序列，且其中所述第二目标多核苷酸包含抗体轻链可变区核苷酸序列。

34.权利要求28-33任一项的方法，其中所述多核苷酸是cDNA。

35.权利要求28-34任一项的方法，其中获得所述数据集包括获得所述多个多核苷酸并对所述多个多核苷酸测序以通过实验确定所述数据集。

36.权利要求28-35任一项的方法，其中获得所述数据集包括直接或间接地从已经对所述多个多核苷酸测序以通过实验确定所述数据集的第三方接收所述数据集。

37.一种获得包含多个与从一个或多个受试者获得的多个样品相关的cDNA的cDNA文库的方法，其中各cDNA与所述多个样品中的单一样品相关，且其中与各个样品相关的cDNA存在于单独的容器中；

(a)将接合体分子添加到与各个样品相关的cDNA上，其中所述接合体分子包含样品识别区域和接合体区域，其中所述样品识别区域与所述接合体区域偶联，且其中各接合体分子的所述样品识别区域的序列不同于添加到存在于其它单独的容器中的与所述样品相关的cDNA上的其它接合体分子的所述样品识别区域的序列；和

(b)使所述接合体区域连接到所述文库中的各cDNA上以产生所述一个或多个目标多核苷酸。

38.权利要求37的方法，其中获得所述cDNA文库包括获得所述多个样品和处理所述样品以制备所述cDNA文库。

39.权利要求37-38任一项的方法，其中所述接合体分子进一步包含通用引物区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联。

40.权利要求37-39任一项的方法，其中各样品包含细胞。

41.权利要求37-40任一项的方法，其中所述细胞是B细胞。

42.权利要求37-41任一项的方法，其中所述B细胞是浆母细胞、记忆B细胞或浆细胞。

43.权利要求37-42任一项的方法，其中各样品包含多个细胞。

44.权利要求41-43任一项的方法，其中所述cDNA包含编码抗体轻链可变区的序列和/或编码抗体重链可变区的序列。

45.权利要求37-44任一项的方法，其中获得所述cDNA文库包括直接或间接地从已经处理所述多个样品以制备所述cDNA文库的第三方接收所述cDNA文库。

46.一种用于产生一个或多个目标多核苷酸的方法，包括：

(a)获得包含与从一个或多个受试者获得的多个样品相关的多个cDNA的cDNA文库，其中各cDNA与所述多个样品中的单一样品相关，且其中与各样品相关的各cDNA存在于单独的容器中；和

(b)将接合体分子添加到与各样品相关的cDNA上以产生所述一个或多个目标多核苷酸，其中所述接合体分子包含样品识别区域和接合体区域，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，且其中各接合体分子的所述样品识别区域的序列不同于添加到存在于其它单独的容器中的与所述样品相关的cDNA上的其它接合体分子的所述样品识别区域的序列。

47.权利要求46的方法，其中各样品包含细胞。

48.权利要求46或47的方法，其中所述细胞是B细胞。

49.权利要求46-48任一项的方法，其中各样品包含多个细胞。

50.权利要求48或49的方法，其中所述cDNA包含编码抗体轻链可变区的序列和/或编码抗体重链可变区的序列。

51.一种用于产生两个或更多个多核苷酸组合物的方法，包括：获得包含与从一个或多个受试者获得的多个样品相关的多个多核苷酸的多核苷酸文库，其中一个或多个多核苷酸包含表达的可变区多核苷酸，其中各样品与细胞相关，且其中与各样品相关的所述多核苷酸存在于单独的容器中；和通过将所述多核苷酸与识别区域偶联产生两个或更多个多核苷酸组合物，该多核苷酸组合物各包含来自所述多个多核苷酸的多核苷酸和所述识别区域，其中各识别区域的序列不同于文库中与其它样品相关的其它多核苷酸偶联的识别区域的序列。

52.一种用于产生两个或更多个多核苷酸组合物的方法，包括：获得包含与从一个或多个受试者获得的多个样品相关的多个多核苷酸的多核苷酸文库，其中一个或多个多核苷酸包含可变区，且其中与各样品相关的所述多核苷酸存在于单独的容器中；和通过将所述多核苷酸与识别区域偶联产生两个或更多个多核苷酸组合物，该多核苷酸组合物各包含来自所述多个多核苷酸的多核苷酸和所述识别区域，其中各识别区域的序列不同于与文库中其它多核苷酸偶联的识别区域的序列。

53.权利要求51或52的方法，其中所述可变区是B细胞免疫球蛋白可变区。

54.权利要求53的方法，其中获得所述多核苷酸文库包括获得多个B细胞并处理该细胞以制备所述多核苷酸文库。

55.权利要求53的方法，其中获得所述多核苷酸文库包括直接或间接地从已经处理多个B细胞以制备所述多核苷酸文库的第三方接收所述多核苷酸文库。

56.权利要求53-55任一项的方法，其中所述B细胞是记忆B细胞、活化B细胞或浆母细胞。

57.权利要求53-56任一项的方法，其中所述B细胞免疫球蛋白可变区包括抗体轻链区或抗体重链区。

58.权利要求53-57任一项的方法，其中所述B细胞免疫球蛋白可变区包括抗体轻链区和抗体重链区。

59.一种产生一个或多个用于测序的目标多核苷酸的方法，包括：

a.获得包含多个多核苷酸的多核苷酸文库，其中各多核苷酸包含通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，且其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的，且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列；和

b.利用引物组扩增所述多核苷酸文库以产生所述一个或多个用于测序的目标多核苷酸，其中所述一个或多个用于测序的目标多核苷酸包含第一测序区域、第一板识别区域、通用引物区域、样品识别区域、接合体区域、来自于单一样品的扩增子区域和第二测序区域，其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联，其中所述样品识别区域的3’端与所述接合体区域的5’端偶联，其中所述第一板识别区域可操作地与所述通用引物区域偶联，其中所述扩增子区域可操作地与所述接合体区域偶联，其中所述第一测序区域位于所述目标多核苷酸的5’端，且其中所述第二测序区域位于所述目标多核苷酸的3’端。

60.权利要求59的方法，还包括对所述一个或多个目标多核苷酸进行测序。

61.一种用于分析测序数据的方法，包括：

a.获得与多个多核苷酸相关的数据集，其中所述数据集包含所述多个多核苷酸的测序数据，其中所述多个多核苷酸中的各多核苷酸包含样品识别区域，且其中各多核苷酸上的各样品识别区域对于单一样品是独特的，其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的所述多个多核苷酸中其它多核苷酸的样品识别区域的序列；和

b.分析所述数据集以将具有相同样品识别区域的多核苷酸匹配在一起，其中匹配表示所述多核苷酸源自于相同的样品。

62.权利要求61的方法，其中所述多个多核苷酸中的各多核苷酸还包含第一板识别区域，其中在各多核苷酸上各第一板识别区域与样品识别区域的各个组合对于单一样品是独特的，其中来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列不同于来自于与所述第一组单一样品不同的一个或多个单一样品组的所述多个多核苷酸中其它多核苷酸的第一板识别区域的序列；和进一步包括分析所述数据集以将具有相同的第一板识别区域和相同的样品识别区域的多核苷酸匹配在一起，其中两个区域之间的匹配表示所述多核苷酸源自于相同的样品。

63.权利要求61或62的方法，其中所述单一样品是单一细胞。

64.权利要求61或62的方法，其中所述单一样品包含单一B细胞。

65.权利要求61或62的方法，其中所述单一样品包含多个B细胞。

66.权利要求61或62的方法，还包括选择一个或多个多核苷酸用于克隆。

67.一种测序来自单个B细胞的配对的重链和轻链的方法，包括以下步骤：

a.通过流式细胞术分选单个B细胞；

b.在反转录期间添加条码；

c.汇合带条码的cDNA；和

d.测序汇合的cDNA。

68.权利要求67的方法，其中所述条码是包含样品-ID和板-ID的化合物条码。