CN110191959B

CN110191959B - 用于免疫组库测序的核酸样品制备方法

Info

Publication number: CN110191959B
Application number: CN201780080046.0A
Authority: CN
Inventors: 贾森·迈尔斯; 乔舒阿·斯塔尔; 布拉迪·卡尔弗; 布赖恩·库德洛; 延斯·埃伯莱因
Original assignee: Asherdex Co ltd
Current assignee: Asherdex Co ltd
Priority date: 2016-11-02
Filing date: 2017-11-02
Publication date: 2024-04-09
Anticipated expiration: 2037-11-02
Also published as: ES2940620T3; US20180155767A1; WO2018085599A2; AU2017355460B2; WO2018085599A3; CA3042391A1; US20210180118A1; AU2023201370A1; US10947582B2; EP4198140A1; JP2022185155A; JP7161991B2; CN110191959A; EP3535405A2; EP3535405A4; AU2017355460A1; EP3535405B1; JP2019537439A

Abstract

本文公开的技术的一些方面涉及制备和分析核酸(例如编码免疫受体和免疫球蛋白的核酸)的方法。在一些实施方案中，本文提供了制备用于序列分析(例如，使用下一代测序)的核酸的方法。

Description

用于免疫组库测序的核酸样品制备方法

相关申请的交叉引用

本申请根据35 U.S.C.§119(e)要求于2016年11月2日提交的美国临时专利申请No.62/416,677的优先权，其通过引用整体并入本文。

技术领域

本文所述的技术涉及可用于制备用于分析的核酸分子的方法和组合物。

背景技术

适应性免疫系统由旨在消除或预防病原体生长的高度特化的系统细胞和过程构成。T细胞和B细胞可认为是适应性免疫系统的主要细胞组分，其通过其抗原受体基因座的遗传重组和体细胞突变产生多种多样的抗原结合分子来驱动适应性免疫应答。未成熟的T细胞和B细胞经历选择性过程以产生基本上没有自身反应性的群体。有了该初始的抗原结合分子组库(repertoire)(例如，T细胞受体和免疫球蛋白)，初始T和B细胞在整个身体内循环，在那里它们可以与抗原接触。

在暴露于同源抗原并且与足够的共刺激信号结合之后，抗原特异性T或B细胞被活化并增殖，并且在B细胞的情况下，可以对其免疫受体基因座进行进一步的序列编辑(例如，通过体细胞超突变(hypermutation)和/或另外的重组)。

作为这些选择性过程的结果，单独的样品中结合特异性的组库可以提供过去抗原暴露的历史以及固有组库能力和限制的信息。

发明概述

本文公开的技术的一些方面涉及制备和分析核酸的方法。在一些实施方案中，本文提供的方法可用于检测核酸制备物(包括代表免疫组库(immune repertoire)的序列，其包含编码免疫受体和免疫球蛋白的多种多样情况的核酸序列)中的超低频核酸变体(例如，剪接变体、融合、单核苷酸变体、插入和缺失、拷贝数变体、来自体细胞重组的免疫受体基因座的mRNA以及表达水平变体)。在一些实施方案中，本文提供的方法涉及基于连接的捕获，其富集具有对应于反映先前发生的重组和/或剪接事件的转录核酸的核苷酸序列的核酸分子。在一些实施方案中，独特的分子捕获相对于从个体(例如携带肿瘤的个体或免疫受损的个体)提取核酸的常规方法得到极大改善。在一些实施方案中，与从个体(例如携带肿瘤的个体或免疫受损个体)提取核酸的常规方法相比，捕获效率至少加倍。在一些实施方案中，由于改善的前端捕获化学，实现了改善的深度。

在一些实施方案中，本文提供的方法可用于通过测序评价RNA免疫组库。在一些实施方案中，本文提供了可用于制备用于序列分析(例如，使用下一代测序)的核酸样品的方法和组合物。在一些实施方案中，本文所述的技术涉及确定核酸序列的方法。在一些实施方案中，本文所述的方法和组合物涉及在测序之前富集包含一种或更多种靶核苷酸序列的核酸。在一些方面，本公开内容提供了制备核酸(例如，用于测序分析)的方法，其涉及使用以捕获部分修饰的引物来合成第一核酸链，或者涉及将一个或更多个以捕获部分修饰的核苷酸添加至核酸。

在一些实施方案中，所述方法还涉及将衔接子核酸连接至核酸，其中以捕获部分修饰的引物已用于合成核酸的第一链以产生连接产物。在一些实施方案中，所述方法还涉及将衔接子核酸与已添加以捕获部分修饰的核苷酸的核酸连接以产生连接产物。在一些实施方案中，所述方法还涉及通过使连接产物与以捕获部分修饰的引物的捕获部分的结合配偶体或以捕获部分修饰的核苷酸的捕获部分的结合配偶体接触来捕获连接产物。

在一些方面，本公开内容提供了制备用于分析的核酸的方法，其中所述方法包括：(a)在杂交条件下使包含靶核苷酸序列的核酸分子与以捕获部分修饰的引物接触，所述以捕获部分修饰的引物与所述靶核苷酸序列特异性退火；(b)进行第一链合成反应，其由杂交的以捕获部分修饰的引物引发并使用所述核酸分子作为模板；(c)进行第二链合成反应，其使用所述第一链合成反应的产物作为模板以产生包含捕获部分的双链核酸；(d)将衔接子核酸与所述双链核酸连接以产生包含所述捕获部分的连接产物；(e)通过使所述连接产物与所述捕获部分的结合配偶体接触来捕获所述连接产物；以及(f)使用包含与所述靶核苷酸序列特异性退火的3’部分的靶特异性引物和与所述衔接子核酸的互补序列特异性退火的第一衔接子引物通过聚合酶链式反应(polymerase chain reaction，PCR)扩增所捕获的连接产物，其中所述靶特异性引物包含不与所述靶核苷酸序列特异性退火的5’尾部分。

在一些实施方案中，本文提供的方法还包括(g)使用包含与所述靶特异性引物的5’尾部分的互补序列特异性退火的3’部分的尾引物和与所述衔接子核酸的互补序列特异性退火的第二衔接子引物通过聚合酶链式反应扩增步骤(f)的扩增产物，其中所述尾引物包含不与所述靶特异性引物的互补序列特异性退火的5’部分。在一些实施方案中，尾引物的5’部分包含样品索引(index)区、PCR引物结合区、分子条形码(barcode)区和测序引物位点区中的至少一种。在一些实施方案中，第一衔接子引物和第二衔接子引物相同。例如，在一些实施方案中，第一衔接子引物和第二衔接子引物由相同的核苷酸序列组成。在一些实施方案中，第一衔接子引物和第二衔接子引物不同(例如，由不同的核苷酸序列组成和/或包含一个或更多个不同的部分)。在一些实施方案中，第二衔接子引物相对于第一衔接子引物嵌套(nested)。在一些实施方案中，第二衔接子引物不是相对于第一衔接子引物嵌套。

在一些实施方案中，步骤(d)包括在连接酶将所述衔接子核酸与所述双链核酸连接的条件下组合所述衔接子核酸、双链核酸和连接酶，其中与所述双链核酸组合的衔接子核酸包含双链体部分和单链突出端序列，其中所述单链突出端序列包含与位于所述双链核酸的3’端的单链突出端序列互补的核苷酸序列。在一些实施方案中，衔接子核酸包含样品索引区、PCR引物结合区、分子条形码区(例如，唯一识别输入分子的区)和测序引物位点区中的至少一个。

在一些实施方案中，步骤(d)包括在连接酶将所述衔接子核酸与所述双链核酸连接的条件下组合所述衔接子核酸、所述双链核酸和所述连接酶，其中与所述双链核酸组合的所述衔接子核酸是单链的。

在一些实施方案中，以捕获部分修饰的引物包含至少一个以捕获部分修饰的核苷酸。在一些实施方案中，以捕获部分修饰的引物包含第一化学偶联基团，其配置成结合与捕获部分连接的第二化学偶联基团。在一些实施方案中，捕获部分是生物素部分。在一些实施方案中，生物素部分包含生物素-三乙二醇、双-生物素、可光裂解生物素、脱硫生物素、脱硫生物素-三乙二醇或生物素叠氮化物。在一些实施方案中，捕获部分的结合配偶体是链霉抗生物素蛋白。在一些实施方案中，链霉抗生物素蛋白与基底附接。在一些实施方案中，基底包含固体表面。在一些实施方案中，固体表面包含顺磁珠。

在一些实施方案中，本文所述的方法还包括从捕获部分的结合配偶体释放捕获的连接产物的步骤。在一些实施方案中，捕获的连接产物通过与化学试剂接触和/或施加热而从捕获部分的结合配偶体释放。在一些实施方案中，化学试剂是碱或碱溶液。在一些实施方案中，化学试剂包括氢氧化钠(NaOH)。应当理解，在一些实施方案中，接触可以包括将两种溶液(例如，包含碱的溶液和包含经洗涤的经固定核酸的溶液)混合，向溶液添加固体，或向固体添加溶液。在一些实施方案中，捕获的连接产物通过与NaOH接触并加热(例如，加热至室温以上，例如25℃至90℃、25℃至70℃、25℃至50℃、35℃至65℃、35℃至45℃、30℃至40℃、40℃至50℃的温度)从捕获部分的结合配偶体释放。在一些实施方案中，捕获的连接产物保持与捕获部分的结合配偶体结合，例如，以进一步制备用于分析。在一些实施方案中，在进一步制备用于分析之前，捕获的连接产物从捕获部分的结合配偶体释放。

在一些实施方案中，本文提供的方法还包括在步骤(d)之后和步骤(e)之前的洗涤步骤。

在一些实施方案中，本文提供的方法还包括在步骤(e)之后和步骤(f)之前：i)将包含捕获部分的双链核酸固定在顺磁性基底上；以及ii)洗涤经固定双链核酸。在一些实施方案中，本文提供的方法在步骤ii)之后还包括：iii)从顺磁性基底释放经经洗涤的经固定双链核酸。

在一些实施方案中，本文提供的方法还包括在步骤(c)之后和步骤(d)之前，对所述双链核酸进行5’磷酸化。在一些实施方案中，5’磷酸化包括在双链核酸的链的5’端处产生磷酸基团。例如，在一些实施方案中，可以将磷酸基团添加至链的5’端处的羟基(例如，通过多核苷酸激酶的作用)。

在一些实施方案中，本文提供的方法还包括在步骤(c)之后和步骤(d)之前，对双链核酸进行末端修复以产生平末端双链核酸。在一些实施方案中，末端修复包括平末端化。在一些实施方案中，通过从双链核酸的链去除末端未配对的核苷酸(例如，单链突出端序列)来实现平末端化。例如，在一些实施方案中，可通过使用具有核酸外切酶活性的酶(例如，Klenow片段)从双链核酸的链去除末端未配对的核苷酸(例如，以水解末端磷酸二酯键，从而一次一个碱基地去除单链突出端)。在一些实施方案中，通过在存在三磷酸核苷酸的情况下用聚合酶(例如DNA聚合酶)填充凹入的末端来实现平末端化。

在一些实施方案中，本文提供的方法还包括将一个或更多个核苷酸添加(例如，连接，加尾)至平末端双链核酸的3’端。在一些实施方案中，一个或更多个核苷酸包含脱氧腺苷核苷酸。例如，在一些实施方案中，所述方法还包括(例如，使用Klenow片段)对双链核酸的3’端进行dA-加尾。在一些实施方案中，衔接子核酸包含位于3’端的核苷酸序列，所述位于3’端的核苷酸序列包含与添加至所述平末端双链核酸的3’端的所述一个或更多个核苷酸互补的一个或更多个核苷酸。在一些实施方案中，衔接子核酸的3’端的核苷酸序列包含一个或更多个脱氧胸苷核苷酸。在一些实施方案中，衔接子核酸还包含与包含位于3’端的核苷酸序列的扩增链退火的阻断链，并且其中所述位于3’端的核苷酸序列未配对以使其形成单链突出端序列。

在一些实施方案中，所述方法还包括在末端修复之后：i)将包含所述捕获部分的所述双链核酸固定在顺磁性基底上；ii)洗涤经固定双链核酸；以及iii)从顺磁性基底上释放经洗涤的经固定双链核酸。

在一些实施方案中，所述方法还包括在末端修复之后：i)将包含所述捕获部分的所述双链核酸固定在顺磁性基底上；以及ii)洗涤经固定双链核酸。在一些实施方案中，所述方法还包括在末端修复之后和步骤i)之前的洗涤步骤。

在一些实施方案中，本文提供的方法还包括：(h)将步骤(g)的扩增产物固定在顺磁性基底上；(i)洗涤经固定扩增产物；以及(j)从顺磁性基底释放经洗涤的经固定扩增产物。在一些实施方案中，所述方法还包括在步骤(g)之后和步骤(h)之前的洗涤步骤。

在一些实施方案中，在步骤(d)中，在存在拥挤剂(crowding agent)的情况下将双链核酸与所述衔接子核酸连接。在一些实施方案中，拥挤剂是聚乙二醇，其量为连接混合物的5％至50％。

在一些实施方案中，本文提供的方法还包括在步骤(b)之后和步骤(c)之前，使核酸分子与核糖核酸酶接触。在一些实施方案中，核糖核酸酶降解核酸分子的部分，使得片段保持与第一链合成反应的产物退火。在一些实施方案中，第二链合成反应由与第一链合成反应的产物杂交的核酸分子的片段引发。

在一些实施方案中，使用多种随机引物随机引发第二链合成。在一些实施方案中，多种随机引物的长度为6个碱基至15个碱基。

在一些实施方案中，核酸分子包含mRNA。在一些实施方案中，核酸分子获自包含T细胞、B细胞或其混合物的样品。在一些实施方案中，样品包含一种或更多种T细胞、一种或更多种B细胞或者其混合物。在一些实施方案中，样品包含T细胞和B细胞的混合物。在一些实施方案中，T细胞和B细胞的混合物还包含一种或更多种非血细胞类型。在一些实施方案中，T细胞和B细胞的混合物还包含一种或更多种类型的白细胞(例如，中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、自然杀伤(NK)细胞、单核细胞、组织细胞、树突细胞、肥大细胞、小胶质细胞等)。

在一些实施方案中，样品获自患有或怀疑患有T细胞恶性疾病或B细胞恶性疾病的对象。在一些实施方案中，样品获自患有或怀疑患有淋巴瘤或白血病(例如，多发性骨髓瘤、急性淋巴细胞白血病或慢性淋巴细胞白血病)的对象。在一些实施方案中，样品获自患有或怀疑患有实体瘤(例如，肉瘤、癌、淋巴瘤或者可能包含或可能不包含非恶性免疫细胞的任何非淋巴来源的肿瘤)的对象。在一些实施方案中，样品获自已经经历或将要经历移植的对象。在一些实施方案中，样品获自对正在评价其对治疗的免疫应答的对象。在一些实施方案中，样品获自患有或怀疑患有白细胞恶性疾病的对象。在一些实施方案中，样品获自患有或怀疑患有自身免疫病症的对象。例如，在一些实施方案中，免疫病症是由自身反应性T细胞、自身反应性B细胞或其组合驱动的任何病症。在一些实施方案中，样品获自患有或怀疑患有T细胞恶性疾病和/或B细胞恶性疾病(例如，淋巴瘤及其亚型，多发性骨髓瘤等)的对象。在一些实施方案中，样品获自患有实体瘤的对象。在一些实施方案中，对象是人。在一些实施方案中，对象是脊索动物。在一些实施方案中，核酸分子获自包含白细胞的样品。在一些实施方案中，靶核苷酸序列包含对应于T细胞受体(TCR)基因或B细胞受体(BCR)基因的一部分的核苷酸序列。

在一些实施方案中，以捕获部分修饰的引物包含与免疫受体基因或免疫球蛋白基因互补的核苷酸序列。在一些实施方案中，以捕获部分修饰的引物与互补决定区3(CDR3)下游的恒定区特异性退火。在一些实施方案中，靶特异性引物与CDR3下游的恒定区或J区段特异性退火。在一些实施方案中，靶特异性引物与在恒定区和J区段之间形成的外显子-外显子衔接点(exon-exon junction)特异性退火，并且其中所述外显子-外显子衔接点在CDR3的下游。

在一些方面，本公开内容提供了制备用于分析的核酸的方法，其中所述方法包括：(a)在杂交条件下使包含已知靶核苷酸序列和未知靶核苷酸序列的核酸分子与以捕获部分修饰的引物接触，所述以捕获部分修饰的引物与所述已知靶核苷酸序列特异性退火；(b)进行第一链合成反应，其由杂交的以捕获部分修饰的引物引发并使用所述核酸分子作为模板；(c)进行第二链合成反应，其由所述核酸分子的片段引发并使用所述第一链合成反应的产物作为模板以产生包含捕获部分的双链核酸；(d)对所述双链核酸进行末端修复以产生包含所述捕获部分的平末端双链核酸；(e)将衔接子核酸与所述平末端双链核酸连接以产生连接产物，其中所述连接产物包含侧翼为所述衔接子核酸和所述捕获部分的未知靶核苷酸序列；(f)通过使所述连接产物与所述捕获部分的经固定结合配偶体接触来捕获所述连接产物；(g)使用包含与所述已知靶核苷酸序列特异性退火的3’部分的靶特异性引物和与所述衔接子核酸的互补序列特异性退火的第一衔接子引物通过聚合酶链式反应扩增所述连接产物，其中所述靶特异性引物包含不与所述已知靶核苷酸序列特异性退火的5’尾部分；以及(h)使用与所述靶特异性引物的5’尾部分的互补序列特异性退火的尾引物和与所述衔接子核酸的互补序列特异性退火的第二衔接子引物通过聚合酶链式反应扩增步骤(g)的扩增产物。在一些实施方案中，本文所述的方法还包括在步骤(e)之后和步骤(f)之前，洗涤连接产物。在一些实施方案中，本文所述的方法还包括在步骤(f)之后和步骤(g)之前，洗涤捕获的连接产物。在一些实施方案中，本文所述的方法还包括(i)洗涤步骤(h)的扩增产物。在一些实施方案中，步骤(c)的第二链合成反应可以由含有核酸分子的样品中存在的任何核酸片段引发。例如，在一些实施方案中，样品包含核酸的复杂混合物，其能够与互补链解离并与混合物内存在的不同链重新退火。

在一些方面，本公开内容提供了制备用于分析的核酸的方法，其中所述方法包括：(a)在杂交条件下使包含靶核苷酸序列的核酸分子与第一靶特异性引物接触，所述第一靶特异性引物与所述靶核苷酸序列特异性退火；(b)进行第一链合成反应，其由杂交的第一靶特异性引物引发并使用所述核酸分子作为模板；(c)进行第二链合成反应，其由所述核酸分子的杂交片段(例如，杂交部分(part)或杂交部分(portion))引发并使用所述第一链合成反应的产物作为模板以产生双链核酸；(d)将衔接子核酸与所述双链核酸连接以产生连接产物；(e)使用包含与所述靶核苷酸序列特异性退火的3’部分的第二靶特异性引物和与所述衔接子核酸的互补序列特异性退火的第一衔接子引物通过聚合酶链式反应扩增所述连接产物，其中所述第二靶特异性引物包含不与所述靶核苷酸序列特异性退火的5’尾部分；以及(f)使用包含与所述第二靶特异性引物的5’尾部分的互补序列特异性退火的3’部分的尾引物和与所述衔接子核酸的互补序列特异性退火的第二衔接子引物通过聚合酶链式反应扩增步骤(e)的扩增产物，其中所述尾引物包含不与所述第二靶特异性引物的互补序列特异性退火的5’部分。在一些实施方案中，步骤(c)的第二链合成反应可以由含有核酸分子的样品中存在的任何核酸片段引发。例如，在一些实施方案中，样品包含核酸的复杂混合物，其能够与互补链解离并与混合物内存在的不同链重新退火。

在一些实施方案中，第一靶特异性引物包含捕获部分。在一些实施方案中，本文提供的方法还包括在步骤(d)之后和步骤(e)之前，通过使所述连接产物与所述捕获部分的结合配偶体接触来捕获所述连接产物。

在一些实施方案中，使用至少一种类型的以捕获部分修饰的核苷酸进行所述第一链合成反应，并且其中所述第一链合成反应的产物包含至少一个捕获部分。在一些实施方案中，本文提供的方法还包括在步骤(d)之后和步骤(e)之前，通过使所述连接产物与所述至少一个捕获部分的经固定结合配偶体接触来捕获所述连接产物。

在一些实施方案中，本文提供的方法还包括在步骤(c)之后和步骤(d)之前，通过使所述双链核酸与所述至少一个捕获部分的经固定结合配偶体接触来捕获所述双链核酸。

在一些方面，本公开内容提供了确定样品中免疫组库的方法，其中所述方法包括：(a)获得包含编码免疫受体和免疫球蛋白中的至少一种的核酸分子的样品；(b)在杂交条件下使来自所述样品的核酸分子与第一靶特异性引物接触，所述第一靶特异性引物与所述核酸分子的靶核苷酸序列特异性退火；(c)进行第一链合成反应，其由杂交的第一靶特异性引物引发并使用所述核酸分子作为模板；(d)进行第二链合成反应，其使用所述第一链合成反应的产物作为模板以产生双链核酸；(e)将衔接子核酸与所述双链核酸连接以产生连接产物；以及(f)使用包含与所述靶核苷酸序列特异性退火的3’部分的第二靶特异性引物和与所述衔接子核酸的互补序列特异性退火的第一衔接子引物通过聚合酶链式反应扩增所述连接产物，其中所述第二靶特异性引物包含不与所述靶核苷酸序列特异性退火的5’尾部分；(g)使用包含与所述第二靶特异性引物的5’尾部分的互补序列特异性退火的3’部分的尾引物和与所述衔接子核酸的互补序列特异性退火的第二衔接子引物通过聚合酶链式反应扩增步骤(f)的扩增产物，其中所述尾引物包含不与所述第二靶特异性引物的互补序列特异性退火的5’部分；以及(h)使用第一测序引物和第二测序引物对步骤(g)的扩增产物进行测序。

在一些实施方案中，免疫受体包含TCR。在一些实施方案中，免疫球蛋白包含BCR。在一些实施方案中，靶核苷酸序列对应于遗传重组序列。在一些实施方案中，靶核苷酸序列对应于TCR基因座(例如，TCRA、TCRB、TCRG或TCRD)至少一种。在一些实施方案中，靶核苷酸序列对应于BCR基因座(例如，IGH、IGK或IGL)中的至少一种。在一些实施方案中，样品包含T细胞、B细胞或其混合物。在一些实施方案中，样品获自对象。在一些实施方案中，对象是人。在一些实施方案中，对象是啮齿动物。例如，在一些实施方案中，对象是小鼠、大鼠、沙鼠、仓鼠、豚鼠、毛丝鼠、松鼠或人源化形式的任何这样的啮齿动物(例如，表达人TCR和/或人BCR的啮齿动物)。

在一些方面，本公开内容提供了制备用于分析的核酸的方法，其中所述方法包括：(a)在产生引物杂交的核酸分子的条件下使包含靶核苷酸序列的核酸分子与第一靶特异性引物接触，所述第一靶特异性引物与所述靶核苷酸序列特异性退火；(b)使所述引物杂交的核酸分子与多种类型的核苷酸接触，以并入到与所述核酸分子互补的第一链之中，其中多种类型的核苷酸中的至少一种包含捕获部分；(c)进行第一链合成反应，其由所述引物杂交的核酸分子的所述第一靶特异性引物引发并使用所述引物杂交的核酸分子的核酸分子作为模板，其中所述第一链合成反应的产物包含至少一个捕获部分；(d)进行第二链合成反应，其由所述核酸分子的片段引发并使用所述第一链合成反应的产物作为模板，以产生包含所述至少一个捕获部分的双链核酸；(e)将衔接子核酸与所述双链核酸连接以产生包含所述至少一个捕获部分的连接产物；以及(f)使用包含与所述靶核苷酸序列特异性退火的3’部分的第二靶特异性引物和与所述衔接子核酸的互补序列特异性退火的第一衔接子引物通过聚合酶链式反应扩增所述连接产物，其中所述第二靶特异性引物包含不与所述靶核苷酸序列特异性退火的5’尾部分。在一些实施方案中，步骤(d)的第二链合成反应可以由含有核酸分子的样品中存在的任何核酸片段引发。例如，在一些实施方案中，样品包含核酸的复杂混合物，其能够与互补链解离并与混合物内存在的不同链重新退火。

在一些实施方案中，本文提供的方法还包括在步骤(e)之后和步骤(f)之前，通过使所述连接产物与所述捕获部分的经固定结合配偶体接触来捕获所述连接产物。

在一些实施方案中，本文提供的方法还包括在步骤(d)之后和步骤(e)之前，通过使所述双链核酸与所述捕获部分的经固定结合配偶体接触来捕获所述双链核酸。

在一些方面，本公开内容提供了制备用于分析的核酸的方法，其中所述方法包括：(a)在杂交条件下使包含靶核苷酸序列的核酸分子与以捕获部分修饰的引物接触，所述以捕获部分修饰的引物包含与所述靶核苷酸序列特异性退火的3’部分和不与所述靶核苷酸序列特异性退火的5’尾部分；(b)进行第一链合成反应，其由杂交的以捕获部分修饰的引物引发并使用所述核酸分子作为模板；(c)在杂交条件下使所述第一链合成反应的产物与多种随机引物接触，其中所述多种随机引物中的每一个包含非随机5’尾部分，所述非随机5’尾部分包含共有序列；(d)进行第二链合成反应，其由所述多种随机引物中的至少一种引发并使用所述第一链合成反应的产物作为模板，以产生包含所述捕获部分的双链核酸；(e)通过使所述双链核酸与所述捕获部分的结合配偶体接触来捕获包含所述捕获部分的所述双链核酸；(f)使用第一尾引物和与所述靶核苷酸序列特异性退火的第一靶特异性引物通过聚合酶链式反应扩增所述双链核酸，其中所述第一尾引物包含与所述共有序列的互补序列特异性退火的3’部分和不与所述共有序列的互补序列特异性退火的5’尾部分；以及(g)使用第二靶特异性引物和与所述第一尾引物的5’尾部分的互补序列特异性退火的第二尾引物通过聚合酶链式反应扩增步骤(f)的扩增产物，其中所述第二靶标特异性引物包含与所述靶核苷酸序列特异性退火的3’部分和不与所述靶核苷酸序列特异性退火的5’尾部分。

当结合附图考虑时，通过本发明的多种非限制性实施方案的以下详细描述，本公开内容的其他优点和新颖特征变得明显。在本说明书和通过引用并入的文件包含冲突和/或不一致的公开内容的情况下，以本说明书为准。

附图简述

将参考附图通过实例描述本发明的非限制性实施方案，附图是示意性的并且不旨在按比例绘制。为了清楚起见，并非每个组件都标记在每个图中，在说明不是使本领域的普通技术人员理解本发明所必需的情况下，也没有在附图中展示本发明的每个实施方案的每个组件。在图中：

图1是使用以捕获部分修饰的引物制备用于分析的核酸分子的策略的举例说明。

图2是使用以捕获部分修饰的核苷酸制备用于分析的核酸分子的策略的举例说明。

图3举例说明了使用以捕获部分修饰的引物或以捕获部分修饰的核苷酸的核酸制备策略的比较。

图4是显示与输入量相关的重复之间的克隆型重叠的举例说明。所有样品的交叉(intersection)产生六十六个重叠的克隆型。

图5是举例说明重复样品的成对分析证明测定的高度可重现性质的图表。

图6A和6B描绘了所有克隆(图6A)和重叠克隆(图6B)之间的比较。

图7举例说明了输入量驱动观察的复杂性和多样性，其中顶部示出的是与样本量相关的多样性，并且底部示出的是描绘香农多样性指数(Shannon diversity index)的图。

图8是显示高度可重现和定量克隆追踪的图。

图9示出了跨稀释物的克隆追踪在独立实验室之间是高度可重现的。

图10是描绘使用Jurkat样品稀释系列的实验室内可重现性的图。

图11是描绘使用Jurkat样品稀释系列的实验室间可重现性的图。

图12是未按比例示出的示意图，其大致描绘了T细胞受体引物位置。

图13是未按比例绘制的示意图，其大致描绘了免疫球蛋白重链(IgH)引物位置。

图14是显示逆转录酶(RT)引物的结构的示意图。

发明详述

在另一些方面，本公开内容提供了与制备用于免疫组库分析的核酸文库相关的改进技术。如本文所述，使用核酸分子作为模板，使包含已知靶核苷酸序列的靶核酸分子(例如mRNA)与靶特异性引物接触并在第一链合成反应中延伸。在一些实施方案中，可以进行第一链合成反应，使得第一链合成反应的产物包含捕获部分，并且捕获部分的结合配偶体可用于捕获(例如，分离)产物。因此，本公开内容的一些方面提供了可用于富集与包含靶核酸分子(例如mRNA)的初始输入互补的第一链合成的产物的技术。

在一些方面，本公开内容涉及这样的认识：在文库制备期间将捕获部分并入到从靶核酸分子(例如RNA)合成的第一链之中使得在包含靶核苷酸序列的核酸的富集期间非靶核酸的存在最小化。当制备用于免疫组库测序的核酸文库时，这可能是特别有利的。例如，尽管TCR和BCR基因组序列将存在于所有细胞中，但TCR和BCR mRNA将仅分别在T细胞和B细胞中表达。免疫组库的评价依赖于在加工(例如，重组、剪接等)之后分析这些基因以评价系统中存在的序列情况(sequence landscape)。因此，在一些实施方案中，本文提供的技术允许选择性捕获由重组免疫基因座表达的mRNA。例如，如本文所述，当第一链直接由靶核酸合成时，捕获部分允许富集期望的产物，同时使非靶核酸携带最小化。

在一些方面，本公开内容提供了制备用于分析的核酸的方法，其包括使用以捕获部分修饰的引物并使用包含靶核苷酸序列的核酸分子作为模板来合成第一核酸链，将衔接子核酸与第一核酸链连接，以及用捕获部分的结合配偶体捕获连接衔接子的第一核酸链。

在一些实施方案中，以捕获部分修饰的引物是以生物素部分修饰的引物。该方法的描述示于图1中，其提供了涉及以生物素部分修饰的引物的方法的非限制性实例。在该实施方案中，RNA分子(例如，mRNA)与经修饰以包含生物素部分的DNA引物退火。以生物素部分修饰的引物在第一链合成反应中延伸以产生DNA/RNA杂交体(hybrid)。通过核糖核酸酶的作用使DNA/RNA杂交体的RNA降解，并且与DNA保持退火的RNA片段在第二链合成反应中用作引物以产生双链cDNA。在一些实施方案中，第二链合成反应可以由含有核酸分子的样品中存在的任何核酸片段引发。例如，在一些实施方案中，样品包含核酸的复杂混合物，其能够与互补链解离并与混合物内存在的不同链重新退火。对双链cDNA进行末端修复和dA-加尾以产生适于连接反应的3’单链突出端。在将衔接子核酸与双链cDNA连接之后，使用链霉抗生物素蛋白包被的基底(例如，顺磁性基底)从未经连接的衔接子捕获或分离这些文库分子。

在一些实施方案中，在捕获之后，进行经基底固定的、捕获的衔接子连接的双链cDNA的第一轮PCR扩增。在另一些实施方案中，在第一轮PCR之前，从顺磁性基底洗脱捕获的衔接子连接的双链cDNA。作为实例而非限制，可以使用化学试剂和/或热来进行从顺磁性基底洗脱捕获的衔接子连接的核酸。在一些实施方案中，化学试剂是碱(例如，NaOH)。在一些实施方案中，用低浓度(例如，小于1M、小于0.5M、小于0.1M、小于0.05M、小于0.01M、小于0.001M、小于0.0001M)的NaOH洗脱捕获的衔接子连接的双链cDNA。在一些实施方案中，用低浓度的NaOH和热洗脱捕获的衔接子连接的双链cDNA。

使用第一衔接子引物和靶特异性引物对经固定或洗脱的衔接子连接的双链cDNA进行第一轮PCR扩增，所述第一衔接子引物与衔接子的互补序列退火，并且靶特异性引物与靶核苷酸序列杂交并具有包含共有序列非杂交尾区。以这种方式，第一衔接子引物引发由靶特异性引物产生的链。使用与共有序列的互补序列退火的尾引物和与衔接子的互补序列退火的第二衔接子引物进行第二轮PCR扩增。如所示出的，尾引物包括索引1条形码化引物。在一些实施方案中，尾引物包括索引2条形码化引物。在一些实施方案中，衔接子核酸包含索引1引物，并且尾引物包含索引2引物。

在一些方面，本公开内容提供了制备用于分析的核酸的方法，其包括使包含靶核苷酸序列的引物杂交的核酸分子与以捕获部分修饰的核苷酸接触以并入到新合成的链之中，使所述混合物置于延伸条件以合成包含至少一个以捕获部分修饰的核苷酸的第一核酸链，将衔接子核酸与第一核酸链连接，以及用捕获部分的结合配偶体捕获衔接子连接的第一核酸链。

在一些实施方案中，以捕获部分修饰的核苷酸的捕获部分是生物素部分。例如，图2描绘了涉及使用经生物素修饰的核苷酸的方法的一个非限制性实施方案。在该实施方案中，RNA分子(例如mRNA)与DNA引物退火。使用生物素化的核苷酸进行第一链合成反应，以产生生物素化的DNA/RNA杂交体。通过核糖核酸酶的作用使DNA/RNA杂交体的RNA降解，并且与DNA保持退火的RNA片段在第二链合成反应中用作引物以产生双链cDNA。在一些实施方案中，第二链合成反应可以由含有核酸分子的样品中存在的任何核酸片段引发。例如，在一些实施方案中，样品包含核酸的复杂混合物，其能够与互补链解离并与混合物内存在的不同链重新退火。对双链cDNA进行末端修复和dA-加尾以产生适于连接反应的3’单链突出端。在将衔接子核酸与双链cDNA连接之后，使用链霉抗生物素蛋白包被的顺磁珠从未经连接的衔接子捕获或分离这些文库分子。

如前所述，本公开内容的一些方面提供了制备用于分析的核酸分子的技术，其可以涉及使用捕获部分来捕获在制备过程期间产生的核酸产物。图3是比较使用捕获部分的核酸制备的不同策略的举例说明。示出了用于第一过程310的所选择的制备步骤，第一过程310使用以捕获部分修饰的引物将捕获部分并入到核酸产物之中(例如，如图1中所示)，并且示出了用于第二过程320的所选择的制备步骤，第二过程320使用以捕获部分修饰的核苷酸将捕获部分并入到核酸产物之中(例如，如图2中所示)。在第一过程310和第二过程320中的每一个中，在促进引物杂交的条件下将核酸分子暴露于靶特异性引物(步骤i))。如所示出的，第一过程310的靶特异性引物是以捕获部分修饰的引物312，而第二过程320的靶特异性引物使用不包含捕获部分修饰的第一靶特异性引物322。

引物杂交之后，在第一过程310中，使用核酸分子作为模板使用用于并入到新合成的第一链316之中的多种类型的核苷酸314进行第一链合成反应(步骤ii))。相比之下，在第二过程320中，使用多种类型的核苷酸324进行第一链合成反应(步骤ii))，其中多种中的至少一种是以捕获部分修饰的核苷酸。作为实例而非限制，显示C核苷酸具有捕获部分修饰。以这种方式，在使用核酸分子作为模板的第一链合成期间，以捕获部分修饰的核苷酸在与核酸分子中的G核苷酸互补的位置处并入到新合成的第一链326之中。

在第一过程310或第二过程320中的任一个中的第一链合成之后，任选地对包含捕获部分的核酸进行进一步加工(步骤iii))，其涉及对核酸的另外修饰。进一步加工的实例可包括但不限于第二链合成、末端修复、衔接子连接和本文其他地方所述的其他加工步骤。在第一过程310或第二过程320中的任一个中的任选的进一步加工之后，使包含捕获部分的核酸产物与捕获部分的结合配偶体接触，为的是捕获从任何一个过程产生的核酸产物(步骤iv))。如所示出的，可以使用任选地固定至基底354的捕获部分的结合配偶体352进行产物捕获。当基底354是顺磁性基底时，可以通过暴露于磁场356来分离核酸产物。

在一些方面，本公开内容提供了制备用于分析免疫组库的核酸文库的方法。例如，在一些实施方案中，核酸文库由包含编码免疫受体(例如TCR)、免疫球蛋白(例如BCR)或其混合物的核酸序列的样品制备。

免疫组库

由于适应性免疫系统部分地通过表达独特抗原结合分子的细胞的克隆扩增起作用，因此准确地测量每个T细胞或B细胞克隆的总丰度变化对于理解适应性免疫应答的动态是重要的。利用高通量测序的进步，最近出现了新的分子免疫学领域以用于描述巨大的TCR和BCR组库。在一些实施方案中，本文所述的技术可用于分析免疫细胞克隆型。

本文中使用的“克隆型”是指在重排过程期间为编码免疫受体链或其部分的一种或更多种基因产生的成功重组的核苷酸序列。在一些实施方案中，“成功重组的核苷酸序列”是指由mRNA包含并经历遗传重组以产生独特克隆型的核苷酸序列。因此，在一些实施方案中，本公开内容中提供的技术可用于检测作为mRNA表达的IR基因座的成功重排，而不是IR重排本身。在一些实施方案中，克隆型是指对应于编码单个受体链的mRNA的核苷酸序列。在一些实施方案中，本公开内容中提供的技术可用于检测一个或更多个体细胞超突变。在一些实施方案中，本公开内容中提供的技术可用于检测TCR和/或BCR同种型(例如，A、D、E、G和M IgH同种型，及其选择亚类)。在一些实施方案中，克隆型是T细胞或B细胞的重组核苷酸序列。在一些实施方案中，克隆型编码TCR或BCR或者其部分。在一些实施方案中，克隆型可以编码以下中的全部或部分：IgH的VDJ重排、IgH的DJ重排、IgK的VJ重排、IgL的VJ重排、TCRβ的VDJ重排、TCRβ的DJ重排、TCRα的VJ重排、TCRγ的VJ重排、TCRδ的VDJ重排、TCRδ的VD重排、κ缺失元件(KDE)重排等。在一些实施方案中，克隆型具有足够长的序列以代表或反映它们所来源的免疫分子的多样性。因此，在一些实施方案中，克隆型的长度可以变化很大。在一些实施方案中，本公开内容的方法可用于确定克隆型谱。

本文中使用的“克隆型谱”是指来源于淋巴细胞群的独特克隆型及其相对丰度的列表。在一些实施方案中，淋巴细胞群获自组织样品。克隆型谱与“免疫组库”的免疫学概念相关。在一些实施方案中，克隆型谱包含编码重排免疫受体的核酸的多种列表和丰度，所述核酸可以来源于选定的淋巴细胞亚群(例如，组织浸润性淋巴细胞，免疫表型亚群等)，或者其可以编码与完全免疫受体相比具有降低的多样性的免疫受体部分。在一些实施方案中，克隆型谱可包含至少10³个独特的克隆型、至少10⁴个独特的克隆型、至少10⁵个独特的克隆型、至少10⁶个独特的克隆型或至少10⁷个独特的克隆型。在一些实施方案中，克隆型谱可包含约1至500,000个独特的克隆型。在一些实施方案中，克隆型可包含约1至1,000,000个独特的克隆型(例如，约1至约100,000、约100,000至约200,000、约200,000至约300,000、约300,000至约400,000、约400,000至约500,000、约500,000至约600,000、约600,000至约700,000、约700,000至约800,000、约800,000至约900,000、约900,000至约1,000,000个独特的克隆型)。在一些实施方案中，这样的克隆型谱还可包含每个独特克隆型的丰度或相对频率。在一个方面，克隆型谱是一组独特的重组核苷酸序列(以及其丰度)，其分别编码个体淋巴细胞群中的TCR或BCR或其片段，其中所述组的核苷酸序列与基本上所有淋巴细胞群的独特淋巴细胞或其克隆亚群一一对应。在一个方面，选择定义克隆型的核酸区段，使得它们的多样性(例如，组中独特核酸序列的数目)足够大使得个体中基本上每个T细胞或B细胞或其克隆携带这样的组库的独特核酸序列。也就是说，优选地，样品的每个不同的克隆具有不同的克隆型。在另一些方面，对应于组库的淋巴细胞群可以是循环B细胞，或可以是循环T细胞，或可以是前述群中的任一个的亚群，包括但不限于CD4+T细胞，或CD8+T细胞，或由细胞表面标志物等限定的其他亚群。在一些实施方案中，可以通过从特定组织(例如骨髓或淋巴结等)采集样品或者通过基于一种或更多种细胞表面标志物、大小、形态等从样品(例如外周血)分选或富集细胞来获得这样的亚群。在另一些方面，对应于组库的淋巴细胞群可来源于疾病组织，例如肿瘤组织、感染组织等。在一些实施方案中，包含对应于TCR和/或BCR链或其片段的核酸的克隆型谱包含许多独特的核苷酸序列，其范围为约1至约25、约25至约50、约50至约100、约11至约250、约250至约500、约500至约1000、约1000至约2500、约2500至约5000、约5000至约7500、约7500至约10000、约10000至约25000、约25000至约50000、约50000至约100000、约100000至约250000、约250000至约500000、约500000至约750000、约750000至约1000000。

在一些实施方案中，克隆型谱包含编码BCR的V(D)J区的基本上所有区段(例如，IgH链)的一组核苷酸序列。在一个方面，本文中使用的“基本上所有”意指相对丰度为0.0001％或更高、0.0005％或更高、0.001％或更高、0.005％或更高、0.01％或更高、0.05％或更高，或者0.1％或更高的每个区段；或者在另一个方面，本文中使用的“基本上所有”意指相对丰度为0.0001％或更高的每个区段。在一些实施方案中，并未表示所有V、D和J区段。在另一个实施方案中，克隆型谱包含编码TCR的V(D)J区的基本上所有区段(例如，TCRβ链、TCRδ链)的一组核苷酸序列。在另一个实施方案中，克隆型谱包含长度范围为1至25、1至50、1至100、1至200、1至300、1至400、1至450、1至500、25至100、25至200、25至300、25至400、25至450、25至500、100至200、100至300、100至400、100至450、100至500、200至300、200至400、200至450、200至500、300至400、300至450、300至500、400至450、400至500、450至500或更多个核苷酸并且包含TCR的V、D和J区的区段(例如，TCRβ链、TCRδ链)的一组核苷酸序列。在另一个实施方案中，克隆型谱包含长度范围为1至25、1至50、1至100、1至200、1至300、1至400、1至450、1至500、25至100、25至200、25至300、25至400、25至450、25至500、100至200、100至300、100至400、100至450、100至500、200至300、200至400、200至450、200至500、300至400、300至450、300至500、400至450、400至500、450至500或更多个核苷酸并且包含BCR的V、D和J区的区段(例如，IgH链)的一组核苷酸序列。在另一个实施方案中，克隆型谱包含与表达独特的BCR(例如，IgH链、IgK链、IgL链)的淋巴细胞数目基本上相等的许多独特的核苷酸序列。在另一个实施方案中，克隆型谱包含与表达独特的TCR(例如，TCRβ链、TCRδ链、TCRα链、TCRγ链)的淋巴细胞数目基本上相等的许多独特的核苷酸序列。在另一个实施方案中，“基本上相等”意指具有99％概率的克隆型谱将包含编码由个体的每个淋巴细胞群携带或表达的BCR(例如，IgH、IgK、IgL)或TCR(例如，TCRβ、TCRδ、TCRα、TCRγ)或其部分的核苷酸序列。在另一个实施方案中，“基本上相等”意指具有99％概率的核苷酸序列组库将包含编码由样品中存在的每个淋巴细胞携带或表达的BCR(例如，IgH、IgK、IgL)或TCR(例如，TCRβ、TCRδ、TCRα、TCRγ)或其部分的核苷酸序列。

在一些实施方案中，克隆型谱获自存在于多种组织中的免疫细胞样品。在一些实施方案中，目的免疫细胞包括T细胞和/或B细胞。在一些实施方案中，T细胞(T淋巴细胞)包括例如表达TCR的细胞。在一些实施方案中，B细胞(B淋巴细胞)包括例如表达BCR的细胞。在一些实施方案中，T细胞包括辅助T细胞(效应T细胞或Th细胞)、细胞毒性T细胞(CTL)、记忆T细胞和调节T细胞，其可通过细胞表面标志物来区分。在一些实施方案中，免疫细胞样品还可包含B细胞。在一些实施方案中，B细胞包括例如血浆B细胞、记忆B细胞、B1细胞、B2细胞、边缘区B细胞和滤泡B细胞。B细胞可以表达免疫球蛋白(在本文中也称为抗体或B细胞受体)。

T细胞受体

适应性免疫系统采用数种策略来产生T和B细胞抗原受体(例如，适应性免疫受体)的组库，其具有足够的多样性以识别潜在病原体的全域。TCR识别与多种癌症或感染性生物体相关的抗原的全域的能力由其TCR赋予，TCR是来自TCRA基因座的α(α)链和来自TCRB基因座的β(β)链的异二聚体，或者是来自TCRG基因座的γ(γ)链和来自TCRD基因座的δ(δ)链的异二聚体。构成这些链的蛋白质由DNA编码，其在淋巴细胞中采用独特的重排机制以产生TCR的巨大多样性。该多亚单位免疫识别受体与CD3复合物相关，并与由抗原呈递细胞(APC)表面上的主要组织相容性复合体(MHC)I类或MHC II类蛋白质呈递的肽结合。TCR与APC上的抗原肽的结合是T细胞活化的中心事件，其发生在T细胞和APC之间的接触点处的免疫突触处。

每个TCR肽包含可变互补决定区(CDR)，以及框架区(FR)和恒定区。αβT细胞的序列多样性在很大程度上取决于α和β链可变结构域的第三互补决定区(CDR3)环的氨基酸序列，其多样性分别是β链基因座中的可变(Vβ)、多样性(Dβ)和连接(Jβ)基因区段之间，以及α链基因座中类似的Jα和Jα基因区段之间的重组的结果。在TCRα和β链基因座中多个这样的基因区段的存在允许编码大量独特的CDR3序列。在TCR基因重排过程期间，通过在Vβ-Dβ、Dβ-Jβ和Vα-Jα连接处独立地添加和缺失核苷酸来进一步提高CDR3序列多样性。在这方面，免疫活性(immunocompetence)来源于TCR的多样性。

γδTCR异二聚体与αβTCR的区别在于它编码与固有免疫系统紧密相互作用的受体，并以非HLA依赖性方式识别抗原。TCRγδ在发育早期表达，并且具有专门的解剖学分布、独特的病原体和小分子特异性，以及广谱的固有和适应性细胞相互作用。在个体发育早期建立了TCRγV和J区段表达的偏倚模式。因此，成体组织中多种多样的TCRγ组库是环境暴露于病原体和毒性分子刺激后之广泛的外周扩张的结果。

用于产生TCR多样性的方法类似于对免疫球蛋白描述的那些。TCRα链通过VJ重组产生，而β链通过V(D)J重组产生。类似地，TCRγ链的产生涉及VJ重组，而TCRδ链的产生通过V(D)J重组发生。这些特异性区(α或γ链的V和J，β或δ链的V D和J)的交叉对应于对抗原-MHC识别重要的CDR3区。它是该区区段，以及回文的和随机的N-核苷酸和P-核苷酸添加的独特组合，这是TCR结合组库的原因。另外，CDR3区以νβ基因的3’区中的第二保守半胱氨酸开始，并以由Iβ基因的5’区编码的保守苯基丙氨酸结束。因此，可以非正式地翻译扩增的序列以定位保守的半胱氨酸，获得居间的肽序列，并将样品中每个独特克隆的计数制成表格。

B细胞受体

免疫球蛋白(Ig)，在本文中也称为B细胞受体(BCR)，是由B细胞表达的蛋白质，其由以下四条多肽链组成：来自IGH基因座的两条重链(H链)和来自IGK基因座或IGL基因座中任何一个的两条轻链(L链)，形成H2L2结构。H链和L链各自包含参与抗原识别的三个CDR，以及框架区和恒定结构域，类似于TCR。Ig的H链最初使用IGM或IGD恒定区外显子表达为结合膜的同种型，但在抗原识别之后，恒定区可以类别转换为数个另外的同种型，包括IGG、IGE和IGA。与TCR一样，个体内初始Ig的多样性主要由高变CDR决定。与TCRB类似，H链的CDR3结构域通过VH、DH和JH基因区段的组合连接产生。在Ig基因重排过程期间，通过VH-DH、DH-JH和VH-JH连接处的核苷酸的独立添加和缺失进一步提高了高变区序列多样性。与TCR不同，在初始B细胞最初识别抗原后，通过重排的IG基因的体细胞超突变(somatichypermutation，SHM)进一步提高Ig序列多样性。SHM的过程不限于CDR3，并因此可以在框架区CDR1和CDR2以及在体细胞重排的CDR3中引入种系序列的变化。

在一些方面，在本文所述的方法中分析的DNA和RNA可以对应于编码具有恒定区(α、δ、ε、γ或μ)的重链免疫球蛋白(IgH)或具有恒定区(λ或κ)的轻链免疫球蛋白(IgK或IgL)的序列。每种抗体具有两条相同的轻链和两条相同的重链。每条链由恒定(C)和可变区构成。对于重链，可变区由可变(V)、多样性(D)和连接(J)区段构成。编码这些区段中的每种类型的数种独特序列存在于基因组中。在B细胞的发育过程期间发生特异性VDJ重组事件，标记该细胞以产生特异性的重链。轻链中的多样性以类似的方式产生，除了没有D区，因此仅存在VJ重组。体细胞突变通常发生在重组位点附近，引起数个核苷酸的添加或缺失，进一步提高了由B细胞产生的重链和轻链的多样性。因此，由B细胞产生的抗体的可能多样性是不同的重链和轻链的产物。重链和轻链的可变区有助于形成抗原识别(或结合)区或位点。添加至该多样性的是体细胞超突变的过程，其可以在针对某个表位进行特异性应答之后发生。

在一些实施方案中，抗体通过B谱系细胞中的重组基因组Ig序列产生。免疫球蛋白轻链来源于κ或λ基因。λ基因由四个恒定(C)基因和约三十个可变(V)基因构成。相比之下，κ基因由一个C基因和250个V基因构成。重链基因家族由数百个V基因、15个D基因和4个连接(J)基因构成。B细胞分化期间的体细胞重组随机选择重链中的一个V-D-J组合和κ或λ轻链中的一个V-J组合。由于存在这么多基因，可以有数百万的独特组合。V基因在重组后也经历体细胞超突变，产生进一步的多样性。尽管存在这种潜在的复杂性，但在数个多重反应中可以使用靶向保守序列的许多引物对完整的重链和轻链互补序列进行测序。

免疫组库分析

在一些方面，本文所述的技术可用于确定目的病症的存在。在一些实施方案中，确定目的病症的存在可能涉及诊断应用，其中对象患有或怀疑患有该病症。在一些实施方案中，确定目的病症的存在可能可用于预防性治疗目的的预测措施。在一些实施方案中，免疫组库的分析可指示目的病症的存在。例如，在一些实施方案中，癌症病史可以反映在与一种或更多种癌抗原结合的免疫受体序列的存在中。在一些实施方案中，自身免疫病的存在可以反映在与自身抗原结合的免疫受体序列的存在中。在一些实施方案中，可以使用本文所述的技术在特定时间点评价或在一段时间内追踪与自身免疫相关的病症。在一些实施方案中，与自身免疫相关的病症包括多发性硬化(MS)、乳糜泻、1型糖尿病、结节病、系统性红斑狼疮(SLE)、舍格伦综合征(syndrome)、伴有多血管炎的嗜酸性肉芽肿病(eosinophilicgranulomatosis with polyangiitis)、桥本甲状腺炎、格雷夫斯病(Graves’disease)、特发性血小板减少性紫癜、艾迪生病(Addison’s disease)、类风湿性关节炎(RA)、强直性脊柱炎、多肌炎(PM)和皮肌炎(DM)。因此，在一些实施方案中，本文所述的方法可用于确定病症的治疗是否适当。例如，在一些实施方案中，可以通过特异性CDR3序列随时间追踪恶性T细胞和B细胞的丰度。

在一些方面，本公开内容提供的方法可用于确定最佳治疗性治疗。在一些实施方案中，可以通过对样品中的免疫组库进行分析，并基于该信息选择合适的治疗、剂量或治疗方式(其对于刺激或抑制靶向免疫应答同时使不期望的毒性最小化来说是最佳的)来确定最佳治疗性治疗。在一些实施方案中，通过选择使不期望的毒性最小化同时提供有效活性的治疗来对治疗进行优化。例如，在一些实施方案中，可以评估对象(例如，患者)的与自身免疫病相关的免疫组库，并且可以基于该信息选择系统或靶向免疫抑制方案。

在一些方面，由本公开内容提供的技术可用于在对象中评估病症的进展。例如，在一些实施方案中，免疫组库的分析可用于评估病症的进展、停滞或消退。在这样的实施方案中，可以在用治疗剂治疗之前、期间和/或之后有利地评估免疫组库，以评估在治疗病症中治疗剂的有效性。例如，在一些实施方案中，本文所述的方法可用于检测随疾病途径(例如，致癌途径、炎性途径等)的最早期变化，和/或监测多种治疗和预防性干预的效力。

在一些方面，本文公开的方法还可用于分析药剂对免疫系统的细胞的作用。例如，在一些实施方案中，可以进行暴露于一种或更多种测试化合物之后的免疫组库变化的分析，以分析测试化合物对个体的作用。在这样的实施方案中，这些分析可用于多种目的，例如用于免疫抑制或免疫增强治疗的开发。在一些实施方案中，待分析潜在治疗价值的药剂可以是任何化合物、小分子、蛋白质、脂质、碳水化合物、核酸或适于治疗用途的其他药剂。在一些实施方案中，在体内(例如，使用动物模型)进行测试以确定对免疫组库的作用。

在一些实施方案中，免疫组库的分析可用于确定在生物体中抗原攻击的作用。在一些实施方案中，在生物体用抗原攻击之后(例如，疫苗接种之后)从生物体获得核酸。在一些实施方案中，在生物体用抗原攻击之前从生物体获得核酸。在一些实施方案中，比较攻击之前和之后存在的免疫组库的多样性可以帮助分析生物体对攻击的响应。

捕获部分

本文所述的技术的一些方面涉及捕获部分用于分离目的分子(例如，核酸、连接产物等)的用途。本文中使用的“捕获部分”是指出于捕获(例如，分离/纯化)目的分子的目的而配置成选择性地与结合配偶体相互作用的部分。

捕获部分和捕获部分的结合配偶体可包含任何合适的结合对。在一些实施方案中，结合对可通过共价或非共价结合选择性地相互作用。在一些实施方案中，结合对可通过杂交、离子键合、氢键、范德华相互作用或这些力的任何组合选择性地相互作用。在一些实施方案中，捕获部分和/或结合配偶体可包含，例如，生物素、抗生物素蛋白、链霉抗生物素蛋白、地高辛、肌苷、抗生物素蛋白、GST序列、经修饰的GST序列、生物素连接酶识别(BiTag)序列、S标签、SNAP-标签、肠激酶位点、凝血酶位点、抗体或抗体结构域、抗体片段、抗原、受体、受体结构域、受体片段，或其组合。

在一些实施方案中，捕获部分包含生物素部分。在一些实施方案中，本文所述的技术可用于制备用于分析的核酸样品。因此，在一些实施方案中，核酸分子包含生物素捕获部分。在一些实施方案中，核酸分子包含至少一个包含生物素部分的以捕获部分修饰的核苷酸。在一些实施方案中，以捕获部分修饰的核苷酸包含式(I)的通式结构：

如式(I)中所示，以捕获部分修饰的核苷酸可包含与核苷酸的核碱基附接的生物素部分。例如，在一些实施方案中，生物素部分包含生物素-三乙二醇、双-生物素、可光裂解生物素、脱硫生物素、脱硫生物素-三乙二醇或生物素叠氮化物。以捕获部分修饰的核苷酸的非限制性实例示于表1中。

表1.以捕获部分修饰的核苷酸的实例结构

/>

在一些实施方案中，以捕获部分修饰的核苷酸包含捕获部分与核苷酸的核碱基之间的接头。在一些实施方案中，捕获部分通过任意合适长度的接头与核碱基共价连接。在一些实施方案中，捕获部分通过长度为5至20个原子的接头与核碱基共价连接。在一些实施方案中，接头包含脂族链。在一些实施方案中，接头包含-(CH₂)n-，其中n是1至20的整数，包括端值。在一些实施方案中，n是1至10的整数，包括端值。在某些实施方案中，接头包含杂脂族链。在一些实施方案中，接头包含聚乙二醇部分。在一些实施方案中，接头包含聚丙二醇部分。在一些实施方案中，接头包含-(CH₂CH₂O)n-，其中n为1至20的整数，包括端值。在一些实施方案中，接头包含-(CH₂CH₂O)n-，其中n为1至10的整数，包括端值。在某些实施方案中，接头包含一个或更多个亚芳基。在一些实施方案中，接头包含一个或更多个亚苯基(例如，对位取代的亚苯基)。在某些实施方案中，接头包含手性中心。在某些实施方案中，接头包含一个或更多个磷酸酯、脂族链、杂脂族链和一个或更多个酰胺(例如-C(＝O)NH-)。

在一些实施方案中，以捕获部分修饰的核苷酸是生物素-n-dNTP，其中n是5至20的整数，其代表生物素部分的羰基与NTP核碱基上的附接位置之间的接头原子数。

在一些实施方案中，结合配偶体与不溶性支持物连接。因此，在一些实施方案中，可通过捕获部分与附接于不溶性支持物的捕获部分的结合配偶体之间形成的选择性结合相互作用将目的分子固定在不溶性支持物上。

在一些实施方案中，不溶性支持物包含珠或其他固体表面。例如，在一些实施方案中，珠是顺磁珠。珠用于分离的用途是本领域中公知的，并且任何合适的珠分离方法可以与本文所述的技术一起使用。在一些实施方案中，珠可用于分离，因为目的分子可附接于珠，并且可以洗涤珠以除去未附接于珠上的溶液组分，从而允许纯化和分离。在一些实施方案中，可以基于例如尺寸、密度或介电特性、离子特性和磁性特性将珠与溶液中的其他组分分离。

在一些实施方案中，不溶性支持物是顺磁珠。珠的使用允许通过离心或过滤，或者在顺磁珠的情况下通过施加磁场，将衍生的核酸捕获部分与反应混合物分离。在一些实施方案中，可使用磁场将顺磁珠引入、混合、取出并将其释放至溶液中。在一些实施方案中，利用顺磁珠的方法可以是自动化的。在一些实施方案中，可使用公知的化学方法使珠官能化，以提供具有合适的官能化的表面，用于连接捕获部分的结合配偶体。表面的衍生化以允许捕获部分的结合是本领域常规的。例如，用链霉抗生物素蛋白包被表面允许结合生物素化的捕获部分。用链霉抗生物素蛋白包被表面已描述于，例如，Miller的美国专利No.5,374,524中。在一些实施方案中，可使用除珠之外的固体表面。在一些实施方案中，固体表面可以是平面表面，例如用于杂交微阵列的那些，或者固体表面可以是分离柱的填充物。

在一些实施方案中，捕获部分的结合配偶体可以在结合捕获部分之前，与其同时或在其之后与不溶性支持物附接。在一些实施方案中，优选使捕获部分与捕获部分的结合配偶体在二者都在溶液中时接触。在这样的实施方案中，然后可通过使捕获部分：结合配偶体复合物与适当衍生的表面接触，将该复合物固定在不溶性支持物上。因此，在一些实施方案中，目的分子可通过在与靶分子附接的捕获部分和捕获部分的结合配偶体之间形成的复合物分离。

在一些实施方案中，可能需要将捕获部分与核苷酸的核碱基附接。以这种方式，3’端保持游离以任选与衔接子核酸连接，同时捕获部分可被结合配偶体捕获。在一些实施方案中，以捕获部分修饰的核苷酸包含选自腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶和胞嘧啶的核碱基，或其衍生物。例如，在一些实施方案中，以捕获部分修饰的核苷酸包含腺嘌呤核碱基或其衍生物。在一些实施方案中，捕获部分与腺嘌呤核碱基或其衍生物的第5、6、7或8位处共价连接。在一些实施方案中，捕获部分与腺嘌呤核碱基的第7位处共价连接。腺嘌呤环如式(II)所示：

在一些实施方案中，可能需要修饰与捕获部分附接的核碱基上的一个或更多个位置。例如，在一些实施方案中，腺嘌呤核碱基的第7位是碳原子。然而，应当理解，任何能够形成另外的共价键的原子(例如，C、O、N、S等)可以被取代至适于附接捕获部分的核碱基上的位置。在一些实施方案中，在捕获衔接子连接的片段后，对文库进行扩增以富集靶核苷酸序列。

用于分析的核酸的制备

本公开内容的一些方面提供了确定与已知靶核苷酸序列(例如，免疫受体的已知靶核苷酸序列)邻接的核苷酸序列的改进方法。传统的测序方法随机地(例如，“鸟枪”测序)或在用于设计引物的两个已知序列之间产生序列信息。相比之下，在一些实施方案中，本文所述的某些方法允许以高水平的特异性和灵敏度确定已知序列的单个区的上游或下游的核苷酸序列(例如，测序)。

在一些实施方案中，本文所述的技术允许从核酸样品富集靶核苷酸序列。在一些实施方案中，核酸样品包含基因组DNA。在一些实施方案中，核酸样品包含cDNA。在一些实施方案中，可通过使用与靶核酸退火的以捕获部分修饰的引物进行第一链合成反应并使用靶核酸的片段作为引物进行第二链合成反应来制备cDNA。

样品纯化

在一些实施方案中，可以在方法的任何适当步骤之前和/或之后从酶、引物或缓冲组分中分离靶核酸和/或其扩增产物。可使用任何合适的分离核酸的方法。在一些实施方案中，分离可包括固相可逆固定(Solid Phase Reversible Immobilization，SPRI)净化。用于SPRI净化的方法是本领域中公知的，例如Agencourt AMPure XP-PCR Purification(目录号A63880，Beckman Coulter；Brea，CA)。在一些实施方案中，酶可通过热处理失活。在一些实施方案中，通过酶处理去除未标记的dNTP。在一些实施方案中，进行净化步骤(例如，SPRI净化)以去除未延伸或过多的引物(例如，以捕获部分修饰的引物、靶特异性引物、衔接子引物等)。

在一些实施方案中，SPRI净化涉及使用结合DNA的顺磁珠。例如，在一些实施方案中，SPRI净化利用具有由磁铁矿薄层围绕的聚苯乙烯核心的珠，这使得珠是顺磁性的(即，珠仅在暴露于磁场时聚集)。在一些实施方案中，珠被包含羧基的分子包被，所述羧基提供用于DNA结合的带电基团。在一些实施方案中，SPRI净化在存在聚乙二醇(PEG)和盐的情况下进行，所述聚乙二醇(PEG)和盐一起作为拥挤剂起作用以活化珠以可逆地结合DNA。在一些实施方案中，SPRI包括将DNA样品与顺磁珠混合并使珠与DNA结合，施加磁场以使结合DNA的珠聚集，用乙醇(例如，70％乙醇)清洗珠，以及从顺磁珠洗脱DNA。

在一些实施方案中，可使用适当的方法(例如，纯化、消化等)从核酸制备物去除未杂交的引物。在一些实施方案中，核酸酶(例如核酸外切酶I)用于从制备物去除引物。在一些实施方案中，这样的核酸酶在引物消化后被热失活。一旦核酸酶失活，可以将另一组引物与其他合适的组分(例如酶，缓冲液)一起添加以进行进一步的扩增反应。

在一些实施方案中，本文提供的方法的步骤任选地包括居间样品纯化步骤。在一些实施方案中，样品纯化步骤包括洗涤步骤。在一些实施方案中，样品纯化步骤包括SPRI净化(例如，AMPure)。例如，制备用于分析的核酸的方法可包括：(i)洗涤经基底固定的核酸；(ii)从顺磁性基底或表面释放经洗涤的经固定核酸。

核酸衔接子

本文中使用的术语“衔接子核酸”、“核酸衔接子”或“衔接子”是指可以与包含靶核苷酸序列的核酸连接以在靶核苷酸序列的扩增和/或测序期间提供一种或更多种元件的核酸分子。在一些实施方案中，衔接子是单链的。在一些实施方案中，衔接子是双链的。在一些实施方案中，双链衔接子包含第一可连接双链末端和第二未配对末端。在一些实施方案中，衔接子包含扩增链和阻断链。在一些实施方案中，扩增链包含5’未配对部分和3’双链体部分。在一些实施方案中，扩增链还包含3’单链突出端。在一些实施方案中，3’单链突出端是3’T单链突出端。在一些实施方案中，扩增链包含与第一和第二衔接子引物相同的核苷酸序列。在一些实施方案中，衔接子的阻断链包含5’双链体部分和不可延伸的3’部分。在一些实施方案中，阻断链还包含3’未配对部分。在一些实施方案中，扩增链和阻断链的双链体部分基本上互补，并且双链体部分具有足够的长度以在连接温度下保持双链体形式。

在一些实施方案中，扩增链的包含与第一和第二衔接子引物相同的核苷酸序列的部分可以至少部分地包含在扩增链的5’未配对部分中。

在一些实施方案中，衔接子可具有“Y”形，即第二未配对末端包含扩增链的5’未配对部分和阻断链的3’部分。阻断链的3’未配对部分的长度可以比扩增链的5’未配对部分更短、更长或与其相等。在一些实施方案中，阻断链的3’未配对部分可以比扩增链的5’未配对部分更短。Y形衔接子的优点是阻断链的未配对部分在PCR方案期间不会受到3’延伸。

在一些实施方案中，衔接子的阻断链还可包含3’未配对部分，其基本上不与扩增链的5’未配对部分互补，其中阻断链的3’未配对部分基本上不与任何引物互补或相同。在一些实施方案中，阻断链还可包含在退火温度下不与扩增链的5’未配对部分特异性退火的3’未配对部分，其中阻断链的3’未配对部分在退火温度下不与任何引物或其互补物特异性退火。在一些实施方案中，衔接子核酸在最低程度下包含用于多重化的样品索引序列。然而，在一些实施方案中，衔接子核酸还包含随机分子条形码。

延伸和扩增

本公开内容的一些方面涉及可包括一个或更多个延伸反应(例如，第一链合成、第二链合成)和/或一轮或更多轮扩增的技术。如本文所述，可以使用一种或更多种靶特异性引物进行延伸反应和扩增。

本文中使用的“靶特异性引物”是指包含与靶核苷酸序列互补的序列的引物。在一些实施方案中，靶特异性引物用于引发第一链合成反应。例如，在一些实施方案中，靶特异性引物是逆转录酶引物，其与包含靶核苷酸序列的mRNA分子退火。在一些实施方案中，如本文所述，以捕获部分修饰的引物是可以用于引发第一链合成反应的靶特异性引物。在一些实施方案中，靶特异性引物用于引发扩增反应。例如，在一些实施方案中，本文所述的方法可包括使用靶特异性引物的扩增步骤，所述靶特异性引物包含与靶核苷酸序列特异性退火的3’部分。在一些实施方案中，本公开内容提供了可包括在多于一个的步骤中使用靶特异性引物(例如，相同或不同的靶特异性引物)的方法。

因此，在本文所述方法的一些实施方案中，当术语靶特异性引物出现在多于一个的步骤中并且是指分开的引物时，可以包括另外的术语以便澄清。例如，在一些实施方案中，初始靶特异性引物可用于第一链合成反应中以产生cDNA，随后使用不同的靶特异性引物扩增该cDNA。在这样的实施方案中，初始靶特异性引物可称为“以捕获部分修饰的引物”，而后一种靶特异性引物可称为“靶特异性引物”。作为替代地，在一些实施方案中，初始靶特异性引物和后一种靶特异性引物可分别称为“第一”和“第二”靶特异性引物。

应当理解，在一些实施方案中，可以相对使用术语“第一”、“第二”、“第三”等，使得这些术语可以根据正在描述的技术的背景指代不同类别的引物。例如，在一些实施方案中，靶特异性逆转录酶引物与mRNA分子一起使用以产生cDNA，使用另外的靶特异性引物进一步对该cDNA进行PCR反应。在这样的实施方案中，靶特异性逆转录酶引物可称为“第一靶特异性引物”，与已知的靶序列结合的后续PCR引物称为“第二靶特异性引物”、“第三靶特异性引物”等。在一些实施方案中，多种随机逆转录酶引物与mRNA分子一起使用以产生cDNA，使用靶特异性引物进一步对该cDNA进行PCR反应。在这样的实施方案中，多种随机引物不称为“靶特异性”；因此，如果后续PCR反应利用靶特异性引物，则可根据不同的反应(例如，在制备用于测序的核酸的方法中)使用术语“第一靶特异性引物”、“第二靶特异性引物”等。

在一些方面，本公开内容提供了可以包括使用第一靶特异性引物(例如，以捕获部分修饰的引物)进行第一链合成反应的方法。在一些实施方案中，使用第二靶特异性引物(例如靶特异性引物)和第一衔接子引物进行第一轮扩增。

在一些实施方案中，“靶特异性引物”是包含这样的核酸序列的寡核苷酸，所述核酸序列可以在合适的退火条件下与核酸分子(例如模板核酸)的靶核苷酸序列特异性退火。在一些实施方案中，序数术语(例如，第一、第二、第三)可用于将在多步骤方法的不同步骤中使用的一种靶特异性引物与另一种区分开。例如，在一些实施方案中，第二靶特异性引物是用于这样的过程中的扩增反应中的靶特异性引物，所述过程包括涉及使用第一靶特异性引物的在先第一链合成。在这样的实施方案中，在扩增期间，第二靶特异性引物产生与其模板互补的链，并且该互补链能够与第一衔接子引物杂交。

本文中使用的“衔接子引物”是包含核酸序列的寡核苷酸，所述核酸序列可以在合适的退火条件下与衔接子核酸的互补序列特异性退火。在一些实施方案中，衔接子引物(例如，第一衔接子引物)与衔接子的至少一部分相同，并且其与由靶特异性引物(例如，第二靶特异性引物)产生的互补链退火以允许进行扩增。

在一些实施方案中，在第一扩增步骤的第一PCR扩增循环中，第二靶特异性引物可以与包含靶核苷酸序列的核酸的模板链特异性退火。在一些实施方案中，取决于设计第二靶特异性引物的取向，靶核苷酸序列上游或下游的序列将合成为与模板链互补的链。在一些实施方案中，如果在PCR的延伸阶段期间，模板链的5’端终止于连接的衔接子中，则新合成的互补链的3’端将包含能够与第一衔接子引物杂交的序列。在随后的PCR扩增循环中，第二靶特异性引物和第一衔接子引物都能够与靶核酸序列的合适链特异性退火，并且可以扩增已知的核苷酸靶序列和衔接子之间的序列。在一些实施方案中，第二靶特异性引物包含不与靶核苷酸序列特异性退火的5’尾部分。例如，在一些实施方案中，5’尾部分可包含为随后的延伸反应(例如，在扩增期间)提供引物结合位点的区。在一些实施方案中，使用尾引物和第二衔接子引物进行第二轮扩增。

本文中使用的“尾引物”是包含这样的核酸序列的寡核苷酸，所述核酸序列包含3’部分，其可以在合适的退火条件下与由在前的扩增步骤产生的扩增子所包含的靶特异性引物(例如，第二靶特异性引物)的5’尾部分的互补序列特异性退火。在一些实施方案中，尾引物包含这样的5’部分，其不与靶特异性引物的5’尾部分的互补序列特异性退火。在一些实施方案中，尾引物的5’部分包含样品索引区、PCR引物结合区、分子条形码区和测序引物位点区中的至少一种。尽管本文中使用的尾引物通常涉及用于第二轮PCR的引物，但应理解该术语可用于指与这样的序列杂交的任何引物，所述序列与在前的反应中使用的引物的5’尾部分互补。

在一些实施方案中，衔接子引物(例如，第二衔接子引物)与衔接子的至少一部分相同，并且其与由尾引物产生的互补链退火以允许进行扩增。

在一些实施方案中，第二衔接子引物相对于第一衔接子引物嵌套。在一些实施方案中，使用嵌套的衔接子引物消除了产生最终的扩增子的可能性，所述最终的扩增子可扩增(例如，在桥式PCR或乳液PCR期间)但不能测序，这是在半嵌套方法期间可能出现的情况。在其他情况下，使用与测序引物相同的引物的半嵌套方法可导致从第一PCR步骤到第二PCR步骤的不需要的扩增产物的遗留，并最终产生人工测序读取。在一些实施方案中，第二衔接子引物相对于第一衔接子引物嵌套至少1个核苷酸，例如，1、2、3、4、5、6、7、8、9、10个或更多个核苷酸。在一些实施方案中，第二衔接子引物相对于第一衔接子引物嵌套约5个核苷酸至约10个核苷酸、约10个核苷酸至约15个核苷酸、约15个核苷酸至约20个核苷酸，或者约20个核苷酸或更多个核苷酸。

在另一些方面，本文所述的技术可涉及使用一种或更多种嵌套引物。在一些实施方案中，由于无法预期的引物结合位点的扩增，使用嵌套引物可以减少PCR产物中的非特异性结合。本文中使用的术语“嵌套”用于描述引物对的引物的退火位点与另一引物对的另一引物的退火位点之间的位置关系。例如，在一些实施方案中，第二引物相对于第一引物嵌套1、2、3个或更多个核苷酸，这意味着其与模板链上的位点结合，所述位点移位1、2、3个或更多个核苷酸。

在一些实施方案中，靶特异性引物(例如，第二靶特异性引物)包含与靶核苷酸序列特异性退火的3’部分和不与靶核苷酸序列退火的5’尾。在一些实施方案中，5’尾包含与尾引物的3’部分相同的核酸序列。在一些实施方案中，反应中存在的多个引物(例如，一个或更多个靶特异性引物和/或一个或更多个衔接子引物)可包含相同的5’尾序列部分。

在一些实施方案中，5’尾可以是富含GC的序列。在一些实施方案中，5’尾序列可包含至少50％GC含量、至少55％GC含量、至少60％GC含量、至少65％GC含量、至少70％GC含量、至少75％GC含量、至少80％GC含量或更高的GC含量。在一些实施方案中，5’尾序列可包含至少60％GC含量。在一些实施方案中，5’尾序列可包含至少65％GC含量。

在一些实施方案中，第一轮扩增包含第二靶特异性引物，其包含5’尾、第一衔接子引物和另外的引物。在一些实施方案中，另外的引物包含与第二靶特异性引物的5’尾相同的3’部分。在一些实施方案中，另外的引物可包含位于杂交序列5’的另外的序列，其可包括条形码、索引、衔接子序列或测序引物位点。在一些实施方案中，另外的引物是通用测序衔接子/索引引物。

在一些实施方案中，两种靶特异性引物(例如，第一和第二靶特异性引物)与靶核酸的相同链基本上互补。在一些实施方案中，与已知的靶序列特异性退火的第一和第二靶特异性引物的部分可包含已知的靶核苷酸序列的总共至少20个独特碱基，例如20个或更多个独特碱基、25个或更多个独特碱基、30个或更多个独特碱基、35个或更多个独特碱基、40个或更多个独特碱基，或者50个或更多个独特碱基。在一些实施方案中，与已知的靶序列特异性退火的第一和第二靶特异性引物的部分可包含已知的靶核苷酸序列的总共至少30个独特碱基。

在一些实施方案中，第一衔接子引物可包含与衔接子的扩增链的约20个最5’碱基相同的核酸序列，并且第二衔接子引物可包含与衔接子的扩增链的约30个碱基相同的核酸序列，其具有5’碱基，其是位于扩增链的5’端的3’的至少1个核苷酸。

在一些实施方案中，衔接子连接的核酸(例如，连接产物)是极少的。在这样的实施方案中，可以使用第一衔接子引物，其在其3’端包含一部分衔接子核酸序列，然后在其5’端包含另外的测序仪重要信息。在这样的实施方案中，可以使用第二衔接子引物，其在其3’端包含第一衔接子引物的5’端。在这样的实施方案中，第二衔接子引物还可具有允许在其5’端测序的核苷酸序列。在这样的实施方案中，可以使用PCR产生与测序仪兼容的文库。

引物

通常，包含与目的序列互补的序列(例如，靶序列或衔接子序列)的引物可以仅由互补序列组成，或者还可以包含与目的序列不互补的另外的序列(例如，尾序列、衔接子序列、索引序列等)。在一些实施方案中，引物还可包含非核苷酸部分(例如，捕获部分等)。

在一些实施方案中，设计引物(例如，第一和第二靶特异性引物，第一和第二衔接子引物，尾引物，以捕获部分修饰的引物)，使得它们将在约61℃至72℃(例如，约61℃至69℃、约63℃至69℃、约63℃至67℃、约64℃至66℃)的退火温度下与其互补序列特异性退火。在一些实施方案中，设计引物使得它们在低于72℃的退火温度下与其互补序列特异性退火。在一些实施方案中，设计引物使得它们在低于70℃的退火温度下与其互补序列特异性退火。在一些实施方案中，设计引物使得它们在低于68℃的退火温度下与其互补序列特异性退火。在一些实施方案中，设计引物使得它们在约65℃的退火温度下与其互补序列特异性退火。在一些实施方案中，本文提供的系统配置成改变容器温度(例如，通过在不同温度范围之间循环)以促进引物退火。

在一些实施方案中，与靶核苷酸序列(例如，已知的靶核苷酸序列)特异性退火的靶特异性引物的部分将在约61℃至72℃(例如，约61℃至69℃、约63℃至69℃、约63℃至67℃、约64℃至66℃)的温度下特异性退火。在一些实施方案中，与已知的靶核苷酸序列特异性退火的靶特异性引物的部分将在PCR缓冲液中在约65℃的温度下特异性退火。

在一些实施方案中，本文所述的引物(例如，随机引物、靶特异性引物)包含逆转录酶引物。在一些实施方案中，逆转录酶引物与mRNA分子在以下的温度下特异性退火：约50℃至52℃、约51℃至53℃、约52℃至54℃、约53℃至55℃、约54℃至56℃、约55℃至57℃、约56℃至58℃、约57℃至59℃、约58℃至60℃。例如，在一些实施方案中，逆转录酶引物的退火温度为约53℃、约53.5℃、约54℃、约54.5℃、约56℃。在一些实施方案中，逆转录酶引物包含一个或更多个捕获部分(例如，如本文所述)。在一些实施方案中，所述一个或更多个捕获部分可以与位于引物核酸的5’端的逆转录酶引物附接。在一些实施方案中，逆转录酶引物包含将最5’碱基与相邻的倒数第二5’端的碱基连接的硫代磷酸酯键。

核酸延伸、扩增和PCR

在一些实施方案中，本文所述的方法包括延伸方案或步骤。在这样的实施方案中，延伸可从一个或更多个杂交随机引物使用所述引物与之杂交的核酸分子作为模板进行。本文描述了延伸步骤。在一些实施方案中，一个或更多种随机引物可与样品中的基本上所有核酸杂交，其中许多核酸可不包含靶核苷酸序列。因此，在一些实施方案中，由于与不包含靶核苷酸序列的模板杂交，可发生随机引物的延伸。

在一些实施方案中，本文所述的方法可涉及聚合酶链式反应(PCR)扩增方案，其涉及一个或更多个扩增循环。本文所述的方法的扩增步骤可各自包含PCR扩增方案，即一组聚合酶链式反应(PCR)扩增循环。本文中使用的术语“扩增方案”是指特异性扩增(提高其丰度)目的核酸的过程。在一些实施方案中，当先前聚合酶延伸的产物充当连续轮次延伸的模板时，发生指数扩增。在一些实施方案中，根据本文公开的方法的PCR扩增方案可包含至少一个，并且在一些情况下至少5个或更多个迭代循环。在一些实施方案中，每个迭代循环包括以下步骤：1)链分离(例如，热变性)；2)寡核苷酸引物与模板分子退火；3)退火引物的核酸聚合酶延伸。应当理解，可使用这些步骤中的每一个中涉及的任何合适的条件和时间。在一些实施方案中，所选择的条件和时间可取决于长度、序列含量、解链温度、二级结构特征，或者与反应中使用的核酸模板和/或引物相关的其他因素。在一些实施方案中，根据本文所述方法的扩增方案在热循环仪中进行，该热循环仪中的许多是可商购的。在一些实施方案中，本文所述的方法可包括线性扩增。例如，在一些实施方案中，使用嵌套引物进行的扩增步骤可使用线性扩增进行。在一些实施方案中，可使用基于核酸序列的扩增(NASBA)进行扩增。例如，在一些实施方案中，扩增包括T7介导的NASBA反应。

在一些实施方案中，核酸延伸反应涉及使用核酸聚合酶。本文中使用的短语“核酸聚合酶”是指催化核苷三磷酸的模板依赖性聚合以形成与模板核酸序列互补的引物延伸产物的酶。核酸聚合酶在退火的引物的3’端开始合成，并在朝向模板的5’端的方向上进行。许多核酸聚合酶是本领域中已知的并且是可商购的。一组核酸聚合酶是热稳定的，即它们在经受足以使互补核酸的退火链变性的温度(例如94℃，或有时更高)后保持功能。用于扩增的方案的非限制性实例涉及在以下条件下使用聚合酶(例如，Phoenix Taq，VeraSeq)：98℃下持续30秒，随后是14至22个循环，每个循环包括在98℃下解链10秒，随后在68℃下退火30秒，接着在72℃下延伸3分钟，随后在4℃下保持反应。然而，也可使用其他适当的反应条件。在一些实施方案中，可以调节退火/延伸温度以引起盐浓度的差异(例如，高3℃以得到更高的盐浓度)。在一些实施方案中，减慢升温速率(例如，1℃/s、0.5℃/s、0.28℃/s、0.1℃/s或更慢)，例如，从98℃至65℃，改善了高度多路复用样品的引物性能和覆盖均匀性。在一些实施方案中，本文提供的系统配置成改变容器温度(例如，通过在不同温度范围之间循环，具有受控的升温或降温速率)以有利于扩增。

在一些实施方案中，核酸聚合酶在酶进行模板依赖性延伸的条件下使用。在一些实施方案中，核酸聚合酶是DNA聚合酶I、Taq聚合酶、Phoenix Taq聚合酶、Phusion聚合酶、T4聚合酶、T7聚合酶、Klenow片段、Klenow exo-、phi29聚合酶、AMV逆转录酶、M-MuLV逆转录酶、HIV-1逆转录酶、VeraSeq ULtra聚合酶、VeraSeq HF 2.0聚合酶、EnzScript，或其他合适的聚合酶。在一些实施方案中，核酸聚合酶不是逆转录酶。在一些实施方案中，核酸聚合酶作用于DNA模板。在一些实施方案中，核酸聚合酶作用于RNA模板。在一些实施方案中，延伸反应涉及对RNA进行逆转录以产生互补DNA分子(RNA依赖性DNA聚合酶活性)。在一些实施方案中，逆转录酶是小鼠莫洛尼鼠白血病病毒(moloney murine leukemia virus，M-MLV)聚合酶、AMV逆转录酶、RSV逆转录酶、HIV-1逆转录酶、HIV-2逆转录酶，或其他合适的逆转录酶。

在一些实施方案中，核酸扩增反应涉及包括链分离步骤的循环，其通常包括加热反应混合物。本文中使用的术语“链分离”或“对链进行分离”意指处理核酸样品，以使得互补的双链分子分离成可用于与寡核苷酸引物退火的两条单链。在一些实施方案中，根据本文所述方法的链分离通过将核酸样品加热至高于其解链温度(T_m)来实现。在一些实施方案中，对于在适合于核酸聚合酶的反应制备物中的含有核酸分子的样品，加热至94℃足以实现链分离。在一些实施方案中，合适的反应制备物含有一种或更多种盐(例如，1至100mMKCl，0.1至10mM MgCl₂)、至少一种缓冲液(例如，1至20mM Tris-HCl)和载体(例如，0.01％至0.5％BSA)。合适缓冲液的非限制性实例包括50mM KCl，10mM Tris-HCl(在25℃下pH8.8)，0.5至3mM MgCl₂和0.1％BSA。合适缓冲液的另一个非限制性实例包含50mM KCl，10mMTris-HCl(在25℃下pH 8.8)，0.5至5mM(例如，约0.5mM、约1mM、约2mM、约3mM、约4mM、约5mM)MgCl₂和0.1％BSA。

在一些实施方案中，核酸扩增涉及将引物与具有靶核酸特征链的核酸模板退火。在一些实施方案中，靶核酸链可用作模板核酸。本文中使用的术语“退火”是指在两个核酸之间形成一个或更多个互补碱基对。在一些实施方案中，退火涉及杂交在一起的两条互补或基本上互补的核酸链。在一些实施方案中，在延伸反应的情况下，退火涉及引物与模板的杂交，从而形成模板依赖性聚合酶的引物延伸底物。在一些实施方案中，退火(例如，在引物与核酸模板之间)的条件可基于引物的长度和序列而变化。在一些实施方案中，退火的条件基于引物的T_m(例如，所计算的T_m)。在一些实施方案中，延伸方案的退火步骤涉及在链分离步骤后将温度降低至基于引物的T_m(例如，所计算的T_m)的温度，持续足以允许这种退火的时间。在一些实施方案中，可使用许多算法中的任意一种来确定T_m(例如，OLIGO^TM(MolecularBiology Insights Inc.Colorado)引物设计软件和VENTRO NTI^TM(Invitrogen，Inc.California)引物设计软件和可获自互联网的程序，包括Primer3、Oligo Calculator和NetPrimer(Premier Biosoft；Palo Alto，CA；并且可免费获自万维网(例如，在premierbiosoft.com/netprimer/netprlaunch/Help/xnetprlaunch.html))。在一些实施方案中，引物的T_m可使用下式计算，该公式由NetPrimer软件使用并且在Frieir等的PNAS1986 83：9373-9377中更详细地描述，该文献通过引用整体并入本文。

T_m＝ΔH/(ΔS+R*ln(C/4))+16.6log([K⁺]/(1+0.7[K⁺]))-273.15

其中：ΔH是螺旋形成的焓；ΔS是螺旋形成的熵；R是摩尔气体常数(1.987cal/℃*mol)；C是核酸浓度；[K⁺]是盐浓度。对于大多数扩增方案，退火温度选择为比预测的T_m低约5℃，尽管可使用接近和高于T_m(例如，比预测的T_m低1℃至5℃或比预测的T_m高1℃至5℃)的温度，同样可使用例如比预测的T_m低超过5℃的温度(例如，低6℃、低8℃、低10℃或更低)。在一些实施方案中，退火温度越接近T_m，退火越具有特异性。在一些实施方案中，在延伸反应期间(例如，在PCR扩增方案的情况下)用于引物退火的时间至少部分地基于反应的体积来确定(例如，其中较大体积涉及较长时间)。在一些实施方案中，在延伸反应期间(例如，在PCR扩增方案的情况下)用于引物退火的时间至少部分地基于引物和模板浓度来确定(例如，其中较高的引物与模板的相对浓度涉及比较低相对浓度更短的时间)。在一些实施方案中，取决于体积和相对引物/模板浓度，延伸反应中(例如，在扩增方案的情况下)的引物退火步骤可以是1秒至5分钟、10秒至2分钟，或30秒至2分钟。本文中使用的“基本上退火”是指当在PCR扩增方案的上下文中使用时，在两个核酸之间形成互补碱基对的程度足以产生可检测水平的特异性扩增产物。

本文中使用的术语“聚合酶延伸”是指通过核酸聚合酶将至少一个互补核苷酸模板依赖性地添加至与核酸模板退火的引物的3’端。在一些实施方案中，聚合酶延伸添加多于一个核苷酸，例如，直至并包含对应于模板全长的核苷酸。在一些实施方案中，聚合酶延伸的条件至少部分基于所用聚合酶的特性。在一些实施方案中，用于聚合酶延伸的温度基于酶的已知活性性质。在一些实施方案中，其中退火温度低于酶的最佳温度，使用较低的延伸温度可以是可接受的。在一些实施方案中，在低于其最佳延伸温度的情况下，酶可保持至少部分活性。在一些实施方案中，聚合酶延伸(例如，用热稳定聚合酶(例如Taq聚合酶及其变体)进行)在65℃至75℃或68℃至72℃下进行。在一些实施方案中，本文提供的方法涉及引物的聚合酶延伸，所述引物在PCR扩增方案的每个循环时与核酸模板退火。在一些实施方案中，使用具有相对强的链置换活性的聚合酶进行聚合酶延伸。在一些实施方案中，出于检测融合(例如，5’融合)的目的，具有强链置换的聚合酶可用于制备核酸。在一些实施方案中，具有5’→3’外切核酸酶活性的聚合酶(例如Taq聚合酶)可用于产生长文库片段。

在一些实施方案中，引物延伸在允许退火的寡核苷酸引物延伸的条件下进行。本文中使用的术语“允许退火的寡核苷酸延伸以使得产生延伸产物的条件”是指一组条件(例如，温度、盐和辅因子浓度、pH和酶浓度)，在该条件下核酸聚合酶催化引物延伸。在一些实施方案中，这样的条件至少部分基于所用的核酸聚合酶。在一些实施方案中，聚合酶可在合适的反应制备物中进行引物延伸反应。

在一些实施方案中，合适的反应制备物包含一种或更多种盐(例如，1至100mMKCl，0.1至10mM MgCl₂)、至少一种缓冲液(例如，1至20mM Tris-HCl)、载体(例如，0.01％至0.5％BSA)，和一种或更多种NTP(例如，dATP、dTTP、dCTP和dGTP各自10至200μM)。一组非限制性条件是在72℃下，50mM KCl，10mM Tris-HCl(在25℃下，pH 8.8)，0.5至3mM MgCl₂，200μM每种dNTP和0.1％BSA，在该温度下聚合酶(例如，Taq聚合酶)催化引物延伸。

在一些实施方案中，合适的反应制备物包含一种或更多种盐(例如，1至100mMKCl，0.5至5mM MgCl₂)、至少一种缓冲液(例如，1至20mM Tris-HCl)、载体(例如，0.01至0.5％BSA)，和一种或更多种NTP(例如，dATP、dTTP、dCTP和dGTP各自50至350μM)。一组非限制性条件是在72℃下，50mM KCl，10mM Tris-HCl(在25℃下，pH 8.8)，3mM MgCl₂、200μM每种dNTP和0.1％BSA，在该温度下聚合酶(例如，Taq聚合酶)催化引物延伸。另一组非限制性条件是在72℃下，50mM KCl，10mM Tris-HCl(在25℃下，pH 8.8)，3mM MgCl₂、266μM dATP，200μM dCTP，133μM dGTP，200μM dTTP和0.1％BSA，在该温度下聚合酶(例如，Taq聚合酶)催化引物延伸。

在一些实施方案中，起始和延伸的条件可包括在合适的缓冲液中存在一种、两种、三种或四种不同的脱氧核苷三磷酸(例如，选自dATP、dTTP、dCTP和dGTP)和聚合诱导剂(例如DNA聚合酶或逆转录酶)。在一些实施方案中，“缓冲液”可包含溶剂(例如，水性溶剂)加合适的辅因子和影响pH、离子强度等的试剂。在一些实施方案中，两种、三种或四种不同的脱氧核苷三磷酸以等摩尔浓度或大约等摩尔浓度存在。在一些实施方案中，两种、三种或四种不同的脱氧核苷三磷酸以不同浓度存在，所述浓度已经通过实验确定为适合于该技术的特定实施。

在一些实施方案中，核酸扩增涉及多至5轮、多至10轮、多至20轮、多至30轮、多至40轮或更多轮(循环)的扩增。在一些实施方案中，核酸扩增可包括一组长度为5个循环至20个循环的PCR扩增方案的循环。在一些实施方案中，扩增步骤可包括一组长度为10个循环至20个循环的PCR扩增方案的循环。在一些实施方案中，每个扩增步骤可包括一组长度为12个循环至16个循环的PCR扩增方案的循环。在一些实施方案中，退火温度可低于70℃。在一些实施方案中，退火温度可低于72℃。在一些实施方案中，退火温度可为约65℃。在一些实施方案中，退火温度可为约61℃至约72℃。

在多种实施方案中，本文所述的方法和组合物涉及用本文所述的一种或更多种类型的引物进行PCR扩增方案。本文中使用的“引物”是指这样的寡核苷酸，其能够与核酸模板特异性退火并提供充当模板依赖性聚合酶的底物的3’端，以产生与模板互补的延伸产物。在一些实施方案中，引物是单链的，以使得引物及其互补物可退火以形成两条链。根据本文所述的方法和组合物的引物可包含杂交序列(例如，与核酸模板退火的序列)，其长度为小于或等于300个核苷酸，例如，长度为小于或等于300、或250、或200、或150、或100、或90、或80、或70、或60、或50、或40、或30或更少，或20或更少，或15或更少，但至少6个核苷酸。在一些实施方案中，引物的杂交序列的长度可以为6至50个核苷酸、6至35个核苷酸、6至20个核苷酸、10至25个核苷酸。

任何合适的方法可用于合成寡核苷酸和引物。在一些实施方案中，商业来源提供了适合于提供用于本文所述方法和组合物之引物的寡核苷酸合成服务(例如，INVITROGEN^TM定制DNA寡核苷酸(Life Technologies，Grand Island，NY)或来自Integrated DNATechnologies(Coralville，IA)的定制DNA寡核苷酸)。

靶核酸

本文中使用的术语“靶核酸”、“包含靶核苷酸序列的核酸分子”和“包含靶核苷酸序列的核酸”是指目的核酸分子(例如，待制备用于分析的核酸)。在一些实施方案中，靶核酸包含靶核苷酸序列(例如，已知或预先确定的核苷酸序列)和待确定的相邻核苷酸序列(其可被称为未知序列)二者。靶核酸可具有任何合适的长度。在一些实施方案中，靶核酸是双链的。在一些实施方案中，靶核酸是DNA。在一些实施方案中，靶核酸包含基因组或染色体DNA(gDNA)。在一些实施方案中，靶核酸包含互补DNA(cDNA)。在一些实施方案中，靶核酸是单链的。在一些实施方案中，靶核酸包含RNA(例如，mRNA、rRNA、tRNA、cfDNA、cfRNA、长非编码RNA、微RNA)。

许多适用于本文所述方法的测序方法提供了具有数十至数百个核苷酸碱基的最佳读取长度的测序运行(例如，Ion Torrent技术可产生200至400bp的读取长度)。由例如基因组DNA或mRNA构成的靶核酸可由基本上长于该最佳读取长度的核酸分子构成。为了使由第二扩增步骤产生的扩增的核酸部分具有合适的长度(例如，多至100bp、200bp、300bp、400bp、500bp、1kb、2kb)以用于特定测序技术，已知的靶核苷酸序列与衔接子可与之连接的靶核酸末端之间的距离应该尽可能接近所选技术的最佳读取长度。例如，如果给定测序技术的最佳读取长度是200bp，则根据本文所述方法扩增的核酸分子应具有约400bp或更短的平均长度。然而，应当理解，在一些实施方案中，当核酸分子的长度超过400bp时，可以实施本文所述的技术。例如，在一些实施方案中，核酸片段可以是约400个或更多个核苷酸、500个或更多个核苷酸、600个或更多个核苷酸、700个或更多个核苷酸、800个或更多个核苷酸、900个或更多个核苷酸、1000个或更多个核苷酸、1500个或更多核苷酸、2000个或更多个核苷酸、2500个或更多个核苷酸、3000个或更多个核苷酸、4000个或更多个核苷酸、5000个或更多个核苷酸、10000个或更多个核苷酸。

由例如基因组DNA或mRNA构成的靶核酸可被剪切，例如机械或酶促地剪切，以产生具有任何期望尺寸的片段。机械剪切过程的非限制性实例包括超声处理、雾化和可从Covaris(Woburn，MA)获得的AFA^TM剪切技术。在一些实施方案中，可通过超声处理机械剪切由基因组DNA构成的靶核酸。

在一些实施方案中，当靶核酸由RNA构成时，可对样品进行逆转录酶方案以产生DNA模板。在一些实施方案中，然后可以剪切DNA模板。在一些实施方案中，DNA模板未被剪切。例如，在一些实施方案中，可以调节在逆转录酶方案期间使用的引物浓度，使得产物cDNA具有合适的“片段化”长度。在一些实施方案中，可以在进行逆转录酶方案之前剪切靶RNA。在一些实施方案中，包含靶RNA的样品可用于本文所述的方法中，其使用从新鲜或降解的试样中提取的总核酸；无需去除基因组DNA以进行cDNA测序；无需耗尽核糖体RNA以进行cDNA测序；在任何步骤中都无需机械或酶促剪切；通过使用随机六聚体对RNA进行双链cDNA合成；以及通过使核酸进行末端修复、磷酸化和腺苷酸化。

在一些实施方案中，靶核苷酸序列可由基因重排构成。本文所述的方法适用于确定基因重排的存在和/或身份，因为基因重排的仅一半必须先前已知(即，将被基因特异性引物靶向的基因重排的一半)。在一些实施方案中，基因重排可包含癌基因(oncogene)。在一些实施方案中，基因重排可包含融合癌基因。在一些实施方案中，基因重排可包含V(D)J重组产物。

本文中使用的术语“已知的靶核苷酸序列”或“靶核苷酸序列”是指靶核酸的一部分，该部分的序列(例如，核酸的核苷酸碱基的身份和顺序)是已知的。例如，在一些实施方案中，已知的靶核苷酸序列是核酸的核苷酸序列，其是已知的或在探询核酸的相邻未知序列之前已经确定的。已知的靶核苷酸序列可具有任何合适的长度。

在一些实施方案中，靶核苷酸序列(例如，已知的靶核苷酸序列)长度为10个或更多个核苷酸、30个或更多个核苷酸、40个或更多个核苷酸、50个或更多个核苷酸、100个或更多个核苷酸、200个或更多个核苷酸、300个或更多个核苷酸、400个或更多个核苷酸、500个或更多个核苷酸、600个或更多个核苷酸、700个或更多个核苷酸、800个或更多个核苷酸、900个或更多个核苷酸、1000个或更多个核苷酸、1500个或更多个核苷酸、2000个或更多个核苷酸、2500或更多个核苷酸、3000或更多个核苷酸、4000个或更多个核苷酸、5000个或更多个核苷酸、10000个或更多个核苷酸。在一些实施方案中，靶核苷酸序列(例如，已知的靶核苷酸序列)长度为10至100个核苷酸、10至500个核苷酸、10至1000个核苷酸、100至500个核苷酸、100至1000个核苷酸、500至1000个核苷酸、500至5000个核苷酸。

在一些实施方案中，本文提供了用于确定核酸的邻接(或相邻)部分的序列的方法。本文中使用的术语“与……邻接的核苷酸序列”是指紧邻另一核苷酸序列(例如，已知的核苷酸序列)的上游或下游的核酸分子(例如，靶核酸)的核苷酸序列。在一些实施方案中，与已知的靶核苷酸序列邻接的核苷酸序列可具有任何合适的长度。在一些实施方案中，与已知的靶核苷酸序列邻接的核苷酸序列包含1kb或更短的核苷酸序列，例如1kb或更短的核苷酸序列、750bp或更短的核苷酸序列、500bp或更短的核苷酸序列、400bp或更短的核苷酸序列、300bp或更短的核苷酸序列、200bp或更短的核苷酸序列、100bp或更短的核苷酸序列。在一些实施方案中，其中样品包含含有已知的靶核苷酸序列的不同靶核酸(例如，其中已知的靶核苷酸序列在其基因组中或在分开的、不同的染色体上多次出现的细胞)，存在包含“与已知的靶核苷酸序列邻接的核苷酸序列”的多个序列。本文中使用的术语“确定(所述)核苷酸序列”是指确定核酸的核苷酸碱基的身份和相对位置。

在一些实施方案中，已知的靶核酸可含有由基因重排产生的融合序列。在一些实施方案中，本文所述的方法适合于确定基因重排的存在和/或身份。在一些实施方案中，基因重排的一部分的身份是先前已知的(例如，将由基因特异性引物靶向的基因重排的部分)，并且其他部分的序列可使用本文公开的方法确定。在一些实施方案中，基因重排可涉及癌基因。在一些实施方案中，基因重排可包含融合癌基因。

分子条形码和索引序列

在一些实施方案中，引物和/或衔接子可含有另外的序列，例如标识符序列(例如条形码、索引)、测序引物杂交序列(例如，Rd1)和衔接子序列。在一些实施方案中，衔接子序列是与下一代测序系统一起使用的序列。在一些实施方案中，衔接子序列是基于Illumina的测序技术的P5和P7序列。在一些实施方案中，衔接子序列是与Ion Torrent测序技术兼容的P1和A。

在一些实施方案中，本文中使用的“条形码”、“分子条形码”和“分子条形码标签”可互换使用，并且通常是指衔接子核酸的区，其可用作与其连接的特定核酸的标识符。在一些实施方案中，分子条形码包含随机化核酸序列，其为与其连接的核酸提供独特的标识符。在一些实施方案中，分子条形码可用于识别独特片段并从样品中“去重复”测序读取。在一些实施方案中，分子条形码可用于识别和去除PCR重复。在一些实施方案中，分子条形码的长度可以为2至25个核苷酸、2至15个核苷酸、2至10个核苷酸、2至6个核苷酸。在一些实施方案中，分子条形码包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24个或至少25个核苷酸。在一些实施方案中，分子条形码包含8个核苷酸。

在一些实施方案中，本文中使用的“索引”、“索引序列”、“索引区”和“样品索引”可互换使用，并且通常是指衔接子核酸的区，该区可用作连接核酸所属群体的标识符。在一些实施方案中，索引包含固定的核酸序列，其可用于识别属于共有文库的序列集合。例如，索引可用于识别对应于核酸的样品。在一些实施方案中，索引可用作例如源标识符、位置标识符、日期或时间标识符(例如，取样或处理的日期或时间)，或者核酸的与共享或共有特性相关的(例如，在文库的其他核酸中共有的)其他标识符。在一些实施方案中，这样的索引序列可用于识别核酸群体中存在的核酸的不同方面。在一些实施方案中，索引序列可提供靶核酸的来源或位置标识符。例如，索引序列可用于识别从中获得核酸的患者。在一些实施方案中，索引序列使得能够在单个反应上(例如，在单个流动单元中进行)对多个不同样品进行测序。在一些实施方案中，出于检测个体测序反应的目的，索引序列可用于对序列成像仪进行定向。在一些实施方案中，索引序列的长度可以为2至25个核苷酸、长度为2至15个核苷酸、长度为2至10个核苷酸、长度为2至6个核苷酸。在一些实施方案中，索引包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24个或至少25个核苷酸。

在一些实施方案中，当根据本文所述的方法使用加尾随机引物群时，在扩增之后可存在多种可区分的扩增产物。在一些实施方案中，因为加尾随机引物在样品的所有核酸分子中的多个位置杂交，一组靶特异性引物可使由多于1个杂交事件产生的延伸产物杂交(和扩增)，例如，一个加尾随机引物可以在与靶特异性引物杂交位点相隔第一距离(例如，100个核苷酸)处杂交，并且另一个加尾随机引物可以在与靶特异性引物杂交位点相隔第二距离(例如，200个核苷酸)处杂交，从而产生了两种扩增产物(例如，包含约100bp的第一扩增产物和包含约200bp的第二扩增产物)。在一些实施方案中，可使用下一代测序技术对这些多重扩增产物各自进行测序。在一些实施方案中，这些多重扩增产物的测序是有利的，因为其提供了多个重叠序列读取，其可彼此比较以检测在扩增或测序过程中引入的序列错误。在一些实施方案中，可比对单独的扩增产物(例如，来源于单个分子的)，并且当它们在特定碱基处存在的序列不同时，可存在PCR和/或测序的伪象(artifact)或错误。

DNA剪切/片段化

本文所述的核酸分子可被剪切(例如，机械或酶促地剪切，通过喷雾器剪切)以产生具有任何期望尺寸的片段。机械剪切过程的非限制性实例包括超声处理、雾化和可从Covaris(Woburn，MA)获得的AFA^TM剪切技术。在一些实施方案中，可通过超声处理机械剪切核酸。在一些实施方案中，靶核酸未经剪切或消化。在一些实施方案中，制备步骤的核酸产物(例如，延伸产物、扩增产物)未经剪切或酶促消化。

在一些实施方案中，当靶核苷酸序列包含RNA时，可对样品进行逆转录酶方案以产生DNA模板，并可随后剪切DNA模板。在一些实施方案中，可在进行逆转录酶方案之前剪切靶RNA。在一些实施方案中，包含靶RNA的样品可用于本文所述的方法中，其使用从新鲜或降解的试样中提取的总核酸；无需去除基因组DNA以进行cDNA测序；无需耗尽核糖体RNA以进行cDNA测序；在任意步骤中都无需机械或酶促剪切；通过使用随机六聚体对RNA进行双链cDNA合成。

测序

在一些方面，本文所述的技术涉及富集用于寡核苷酸测序的核酸样品的方法。在一些实施方案中，可通过下一代测序方法进行测序。本文中使用的“下一代测序”是指寡核苷酸测序技术，其在高于通过常规测序方法(例如，Sanger测序)可能的速率的速率下能够对寡核苷酸进行测序，因为同时进行和读出数千至数百万个测序反应。下一代测序方法/平台的非限制性实例包括大规模平行签名测序(Lynx Therapeutics)；454焦磷酸测序(454Life Sciences/Roche Diagnostics)；固相可逆染料-终止子测序(Solexa/Illumina)；SOLiD技术(Applied Biosystems)；离子半导体测序(ION Torrent)；DNA纳米球测序(Complete Genomics)；以及可从Pacific Biosciences、Intelligen Bio-systems和Oxford Nanopore Technologies获得的技术。在一些实施方案中，测序引物可包含与所选择的下一代测序方法相容的部分。下一代测序技术以及相关测序引物的限制和设计参数是本领域中公知的(参见例如，Shendure等，“Next-generation DNA sequencing，”Nature，2008，第26卷，第10期，1135-1145；Mardis，“The impact of next-generation sequencingtechnology on genetics”，Trends in Genetics，2007，第24卷，第3期，第133至141页；Su等，“Next-generation sequencing and its applications in moleculardiagnostics”，Expert Rev Mol Diagn，2011，11(3)：333-43；Zhang等，“The impact ofnext-generation sequencing on genomics”，J Genet Genomics，2011，38(3)：95-109；(Nyren，P等，Anal Biochem 208：17175(1993)；Bentley，D.R.Curr Opin Genet Dev 16：545-52(2006)；Strausberg，R.L.等，Drug Disc Today 13：569-77(2008)；美国专利No.7,282,337；美国专利No.7,279,563；美国专利No.7,226,720；美国专利No.7,220,549；美国专利No.7,169,560；美国专利No.6,818,395；美国专利No.6,911,345；美国公开号2006/0252077；2007/0070349；和20070070349；其通过引用整体并入本文。

在一些实施方案中，测序步骤依赖于使用第一和第二测序引物。在一些实施方案中，选择第一和第二测序引物以与本文所述的下一代测序方法相容。

将测序读取与基因组和/或cDNA序列的已知序列数据库比对的方法是本领域中公知的，并且该过程的软件可商购获得。在一些实施方案中，没有完整地定位到野生型序列数据库的读取(较少的测序引物和/或衔接子核苷酸序列)可以是基因组重排或大的插入缺失突变。在一些实施方案中，包含定位到基因组中多个位置的序列的读取(较少的测序引物和/或衔接子核苷酸序列)可以是基因组重排。在一些实施方案中，可以构建重叠成邻接序列或“重叠群(contig)”的读取的从头组装，并用于测序读取的比对。在一些实施方案中，可以利用不依赖于可公开访问的基因组数据库的热点参考。

样品

在一些实施方案中，核酸(例如，靶核酸、包含靶核苷酸序列的核酸)存在于或获自合适的样品(例如，食物样品、环境样品、生物样品(例如血液样品)等)中。在一些实施方案中，靶核酸是获自对象的生物样品。在一些实施方案中，样品可以是获自对象的诊断样品。在一些实施方案中，样品还可包含蛋白质、细胞、流体、生物流体、防腐剂和/或其他物质。作为非限制性实例，样品可以是颊部拭子(cheek swab)、血液、血清、血浆、痰、脑脊液、尿液、泪液、肺泡分离物、胸膜液、心包液、囊液、肿瘤组织、组织、活检物、唾液、吸出物、或其组合。在一些实施方案中，可通过切除或活检获得样品。

在一些实施方案中，样品可获自需要治疗与遗传改变相关的疾病(例如癌症或遗传性疾病)的对象。在一些实施方案中，已知的靶序列存在于疾病相关基因中。

在一些实施方案中，样品获自需要治疗癌症的对象。在一些实施方案中，样品包含肿瘤细胞群，例如至少一个/种肿瘤细胞。在一些实施方案中，样品包含肿瘤活检物，包括但不限于未经处理的活检物组织或经处理的活检物组织(例如，福尔马林固定的和/或石蜡包埋的活检物组织)。

在一些实施方案中，样品是新鲜收集的。在一些实施方案中，在用于本文所述的方法和组合物之前储存样品。在一些实施方案中，样品是未经处理的样品。本文中使用的“未经处理的样品”是指除了在溶液中稀释和/或悬浮之外没有进行任何先前样品预处理的生物样品。在一些实施方案中，样品获自对象并在用于本文所述的方法和组合物之前进行保存或加工。作为非限制性实例，样品可包埋在石蜡中、冷藏或冷冻。根据本文所述的方法和组合物，在确定核酸的存在之前，可将冷冻的样品解冻。在一些实施方案中，样品可以是经加工或处理的样品。用于处理或加工样品的示例性方法包括但不限于离心、过滤、超声处理、均化、加热、冷冻和解冻、与防腐剂(例如，抗凝剂或核酸酶抑制剂)接触，及其任意组合。在一些实施方案中，可用化学和/或生物试剂处理样品。可使用化学和/或生物试剂以在加工和/或储存期间保护样品或样品所包含的核酸，和/或维持样品或样品所包含的核酸的稳定性。作为补充或替代，可使用化学和/或生物试剂以从样品的其他组分释放核酸。作为非限制性实例，在用于本文所述的方法和组合物之前，可用抗凝剂对血液样品进行处理。

用于核酸分析的样品的加工、保存或处理的合适的方法和过程可用于本文公开的方法中。在一些实施方案中，样品可以是经澄清流体样品。在一些实施方案中，可通过低速离心(例如，3,000×g或更低)使样品澄清并收集包含经澄清流体样品的上清液。

在一些实施方案中，可在用于本文所述的方法和组合物之前对样品中存在的核酸进行分离、富集或纯化。可使用从样品分离、富集或纯化核酸的合适方法。例如，用于从多种样品类型中分离基因组DNA的试剂盒是可商购的(例如，目录号51104、51304、56504和56404；Qiagen；Germantown，MD)。

在一些实施方案中，本文所述的方法涉及富集靶核酸(例如，在靶核酸测序之前)的方法。在一些实施方案中，在测序之前不知道待富集的靶核酸的一端的序列。在一些实施方案中，本文所述的方法涉及在使用下一代测序技术确定核苷酸序列之前富集特定核苷酸序列的方法。在一些实施方案中，富集特定核苷酸序列的方法不包括杂交富集。

靶基因和治疗应用

本公开内容的一些方面可用于免疫系统的遗传分析。然而，应当理解，本文所述的技术可应用于任何靶基因或目的核酸。在本文所述技术的一些实施方案中，确定与已知的寡核苷酸靶序列邻接的序列可提供与疾病治疗相关的信息。因此，在一些实施方案中，本文公开的方法可用于帮助治疗疾病。在一些实施方案中，样品可以来自需要治疗与遗传改变相关的疾病的对象。在一些实施方案中，已知的靶序列是疾病相关基因(例如，癌基因)的序列。在一些实施方案中，与已知的寡核苷酸靶序列邻接的序列和/或已知的寡核苷酸靶序列可包含与疾病相关的突变或遗传异常，例如SNP、插入、缺失和/或基因重排。在一些实施方案中，样品中存在的与已知的靶序列邻接的序列和/或已知的靶序列包含基因重排产物的序列。在一些实施方案中，基因重排可以是癌基因，例如融合癌基因。

某些癌症治疗对于包含某些癌基因的肿瘤特别有效，例如，靶向给定融合癌基因的作用或表达的治疗剂可对包含该融合癌基因的肿瘤有效，但对缺乏该融合癌基因的肿瘤无效。本文所述的方法可有助于确定揭示癌基因状态(例如，突变、SNP和/或重排)的特定序列。在一些实施方案中，本文所述的方法还可允许在侧翼区的序列已知时确定特定序列，例如，本文所述的方法可确定涉及已知基因(例如，癌基因)的基因重排的存在和身份，其中在实施本文所述的方法之前，精确位置和/或重排配偶体是未知的。

在一些实施方案中，对象需要治疗肺癌(例如，用EGFR-TKI，一种靶向癌症治疗)。在一些实施方案中，例如，当从需要治疗肺癌的对象获得样品时，已知的靶序列可包含来自选自ALK、ROS1和RET的基因的序列。因此，在一些实施方案中，基因重排导致涉及ALK、ROS1或RET的融合。涉及ALK、ROS1或RET的基因排列的非限制性实例描述于例如Soda等，Nature2007 448561-6：Rikova等，Cell 2007 131：1190-1203；Kohno等，Nature Medicine 201218：375-7；Takouchi等，Nature Medicine 2012 18：378-81；其通过引用整体并入本文。然而，应理解的是，基因重排的精确位置和参与重排的第二基因的身份可以不是事先已知的。因此，在本文所述的方法中，可检测这种重排的存在和身份，而不必须知道重排的位置或参与基因重排的第二基因的身份。

在一些实施方案中，已知的靶序列可包含来自选自以下的基因的序列：ALK、ROS1和RET。

在一些实施方案中，从对象的肿瘤获得的样品中的ALK的基因重排的存在可表明肿瘤易于用选自以下的治疗进行治疗：ALK抑制剂；EGFR；克唑替尼(crizotinib)(PF-02341066)；AP26113；LDK378；3-39；AF802；IPI-504；ASP3026；AP-26113；X-396；GSK-1838705A；CH5424802；ALK激酶活性的二氨基和氨基嘧啶抑制剂例如NVP-TAE684和PF-02341066(参见，例如，Galkin等，Proc Natl Acad Sci USA，2007，104：270-275；Zou等，Cancer Res，2007，67：4408-4417；Hallberg和Palmer F1000 Med Reports 2011 3：21；Sakamoto等，Cancer Cell 2011 19：679-690；以及WO 04/079326中公开的分子)。所有前述参考文献都通过引用整体并入本文。ALK抑制剂可包括降低ALK或其一部分的表达和/或激酶活性的任何药剂，包括例如降低ALK或其一部分的表达和/或活性的寡核苷酸、小分子和/或肽。本文中使用的“间变性淋巴瘤激酶(anaplastic lymphoma kinase)”或“ALK”是指通常以野生型形式参与神经元调节的跨膜tyROSline激酶。ALK基因和mRNA的核苷酸序列对于许多物种，包括人(例如，如根据NCBI基因ID：238所注释)是已知的。

在一些实施方案中，从对象的肿瘤获得的样品中的ROS1的基因重排的存在可表明肿瘤易于用选自下组的治疗进行治疗：ROS1抑制剂和如上所述的ALK抑制剂(例如，克唑替尼)。ROS1抑制剂可包括降低ROS1或其一部分的表达和/或激酶活性的任何药剂，包括例如降低ROS1或其一部分的表达和/或活性的寡核苷酸、小分子和/或肽。本文中使用的“c-ros癌基因1”或“ROS1”(在本领域中也称为ros-1)是指sevenless亚家族的跨膜酪氨酸激酶，其与PTPN6相互作用。ROS1基因和mRNA的核苷酸序列对于许多物种，包括人(例如，如根据NCBI基因ID：6098所注释)是已知的。

在一些实施方案中，从对象的肿瘤获得的样品中的RET的基因重排的存在可表明肿瘤易于用选自以下的治疗进行治疗：RET抑制剂；DP-2490、DP-3636、SU5416；BAY 43-9006、BAY 73-4506(瑞戈非尼)、ZD6474、NVP-AST487、索拉非尼、RPI-1、XL184、凡德他尼、舒尼替尼、伊马替尼、帕唑帕尼、阿西替尼、莫特塞尼、吉非替尼和醉茄素A(withaferin A)(参见，例如，Samadi等，Surgery 2010 148：1228-36；Cuccuru等，JNCI 2004 13：1006-1014；Akeno-Stuart等，Cancer Research 2007 67：6956；Grazma等，J Clin Oncol 2010 28：15s5559；Mologni等，J Mol Endocrinol 2006 37：199-212；Calmomagno等，Journal NCI 200698：326-334；Mologni，Curr Med Chem 2011 18：162-175；以及WO 06/034833；美国专利公开2011/0201598和美国专利8,067,434中公开的化合物)。所有前述参考文献都通过引用整体并入本文。RET抑制剂可包含降低RET或其一部分的表达和/或激酶活性的任何药剂，包括例如降低RET或其一部分的表达和/或活性的寡核苷酸、小分子和/或肽。本文中使用的“在转染期间重排”或“RET”是指钙黏蛋白超家族的受体酪氨酸激酶，其参与神经嵴发育并识别神经胶质细胞系来源的神经营养因子家族信号传导分子。RET基因和mRNA的核苷酸序列对于许多物种，包括人(例如，如根据NCBI基因ID：5979所注释)是已知的。

在一些实施方案中，已知的靶序列可包含选自表2的基因。

表2.已知的靶序列

/>

本文所述方法的应用的另一些非限制性实例包括检测血液恶性标志物及其组(例如，包括检测淋巴瘤和白血病中的基因组重排的那些)、检测肉瘤相关的基因组重排及其组；以及检测IGH/TCR基因重排及其组用于淋巴瘤测试。

在一些实施方案中，本文所述的方法涉及用针对癌症的治疗来治疗患有或诊断为患有例如癌症的对象。患有癌症的对象可由医生使用当前诊断癌症的方法来识别。例如，表征这些病症并有助于诊断的肺癌症状和/或并发症是本领域中公知的，其包括但不限于呼吸微弱(weak breathing)、锁骨上淋巴结肿大、肺部异常声音、当胸部被敲击时有浊音，以及胸部疼痛。可以帮助诊断例如肺癌的测试包括但不限于X射线、针对高水平的某些物质(例如钙)的血液测试、CT扫描和肿瘤活检。肺癌的家族史或暴露于肺癌的风险因素(例如，吸烟或暴露于烟雾和/或空气污染)也可有助于确定对象是否可能患有肺癌或有助于进行肺癌的诊断。

癌症可包括但不限于癌，包括腺癌、淋巴瘤、母细胞瘤、黑素瘤、肉瘤、白血病、鳞状细胞癌、小细胞肺癌、非小细胞肺癌、胃肠癌、霍奇金和非霍奇金淋巴瘤、胰腺癌、胶质母细胞瘤、基底细胞癌、胆道癌、膀胱癌、包括胶质母细胞瘤和髓母细胞瘤在内的脑癌；乳腺癌、宫颈癌、绒毛膜癌；结肠癌、结直肠癌、子宫内膜癌、子宫内膜癌；食管癌、胃癌；多种类型的头颈部癌症、包括鲍恩病(Bowen’s disease)和佩吉特病(Paget’s disease)在内的上皮内肿瘤；包括急性淋巴细胞白血病和急性髓细胞性白血病在内的血液肿瘤(hematologicalneoplasm)；卡波西肉瘤(Kaposi’s sarcoma)、毛细胞白血病；慢性髓细胞性白血病、AIDS相关白血病和成人T细胞白血病淋巴瘤；肾癌，例如肾细胞癌、T细胞急性淋巴细胞白血病/淋巴瘤、包括霍奇金病和淋巴细胞淋巴瘤在内的淋巴瘤；肝癌例如肝癌(hepatic carcinoma)和肝细胞瘤(hepatoma)、梅克尔细胞癌(Merkel cell carcinoma)、黑素瘤、多发性骨髓瘤；神经母细胞瘤；包括鳞状细胞癌在内的口腔癌；包括由上皮细胞引起的那些在内的卵巢癌、包括平滑肌肉瘤、横纹肌肉瘤、脂肪肉瘤、fibROS1肉瘤和骨肉瘤在内的肉瘤；胰腺癌；包括黑素瘤、间质细胞、生殖细胞和间充质细胞在内的皮肤癌；pROS1tate癌症，直肠癌；外阴癌，包括腺癌在内的肾癌；睾丸癌，其包括生殖肿瘤(germinal tumor)，例如精原细胞瘤、非精原细胞瘤(畸胎瘤、绒毛膜癌)、间质瘤和生殖细胞肿瘤；包括甲状腺腺癌和髓样癌在内的甲状腺癌；食管癌、唾液腺癌和肾母细胞瘤(Wilms’tumor)。在一些实施方案中，癌症可以是肺癌。

多路复用方法

本文所述的方法可以以多路复用形式使用。在本文所述方法的一些实施方案中，多路复用应用可包括确定与一种或更多种已知的靶核苷酸序列邻接的核苷酸序列。本文中使用的“多路复用扩增”是指涉及在一个或更多个反应容器中同时扩增多于一种靶核酸的过程。在一些实施方案中，方法涉及随后使用一组或更多组引物确定多路复用扩增产物的序列。多路复用可以指在单个反应中检测约2至1,000个不同的靶序列。然而，在一些实施方案中，多路复用可指在单个反应中检测约1,000至10,000个不同的靶序列。在一些实施方案中，多路复用可以指在单个反应中检测约10,000至100,000个不同的靶序列。本文中使用的多路复用是指在单个反应中检测2至1,000个不同的靶序列之间的任何范围，例如，5至500、25至1,000或10至100个不同的靶序列等。术语“多路复用”应用于PCR意味着在同一PCR反应中存在对至少两种不同靶序列具有特异性的引物。

在一些实施方案中，可用多种引物(例如，多个第一和第二靶特异性引物)扩增样品中的靶核酸或样品的分离部分。在一些实施方案中，多种引物(例如，多种第一和第二靶特异性引物)可存在于单反应混合物中，例如，可在同一反应混合物中产生多种扩增产物。在一些实施方案中，多个引物(例如，多组第一和第二靶特异性引物)可与由单独的基因构成的已知的靶序列特异性退火。在一些实施方案中，至少两组引物(例如，至少两组第一和第二靶特异性引物)可与已知的靶序列的不同部分特异性退火。在一些实施方案中，至少两组引物(例如，至少两组第一和第二靶特异性引物)可与单个基因所包含的已知靶序列的不同部分特异性退火。在一些实施方案中，至少两组引物(例如，至少两组第一和第二靶特异性引物)可与包含已知靶序列的基因的不同外显子特异性退火。在一些实施方案中，多个引物(例如，第一靶特异性引物)可包含相同的5’标签序列部分。

在本文所述方法的一些实施方案中，多路复用应用可包括在一个测序反应或测序运行中确定与多个样品中的一个或更多个已知靶核苷酸序列邻接的核苷酸序列。在一些实施方案中，多个样品可以具有不同的来源，例如来自不同组织和/或不同对象。在这样的实施方案中，引物(例如，加尾的随机引物)还可包含条形码部分。在一些实施方案中，可以将具有独特条形码部分的引物(例如，加尾的随机引物)添加至每个样品中并与其中的核酸连接；随后可以合并样品。在这样的实施方案中，扩增产物的每个所得测序读取将包含条形码，其标识含有扩增产物所来源的模板核酸的样品。

实施例

以下实施例旨在举例说明本文所述的某些实施方案，包括本发明的某些方面，但不是示例本发明的全部范围。

实施例1：核酸样品制备

举例说明制备用于分析的核酸样品的方法的方案的实例示于图1中。

将生物素化的受体特异性引物与样品RNA退火。将热循环仪加热至65℃，并且在冰上时将经纯化的总核酸或RNA(20至250ng)与无核酸酶的水合并，然后与受体特异性引物合并。然后将样品转移至热循环仪并与热盖(heated lid)(≥100℃)在65℃下一起孵育5分钟，并随后保持在4℃下。一旦完成，将样品置于冰上持续至少2分钟。

退火之后，通过逆转录酶的作用通过延伸受体特异性引物来合成第一链cDNA，以产生DNA/RNA杂交体。将样品在带有热盖(≥100℃)的热循环仪中在50℃下孵育30分钟，然后在80℃下孵育20分钟，并随后保持在4℃下。

所得DNA/RNA杂交体的RNA链通过核糖核酸酶的作用部分降解，留下与用作第二链合成反应的引物的第一链退火的RNA片段。按照在带有热盖(≥100℃)的热循环仪中与DNAPolI一起在16℃下孵育60分钟，然后在75℃下孵育20分钟来合成第二链cDNA，并随后保持在4℃下。

对双链cDNA样品进行末端修复以使cDNA产生平末端并使5’端磷酸化。在该步骤中，将过量的T4 DNA聚合酶和T4多核苷酸激酶与足够的dNTP一起添加至样品并使其在热循环仪(没有热盖)中在25℃下孵育30分钟。使用珠(2.5x)对DNA进行净化步骤。通过涡旋将珠完全重悬，并在混合下添加至每个反应以确保均匀混合物。然后将反应在室温(20℃至25℃)下孵育5分钟。然后将管旋转下来并置于磁体上持续4分钟以确保珠完全紧靠管壁沉淀。在不干扰珠沉淀物的情况下弃去上清液，并且必要时使用更大的放大率以使珠重新沉淀。在珠仍然在磁体上时将其用70％乙醇洗涤30秒，然后弃去上清液。重复洗涤两次。最终洗涤之后，完全去除可见的上清液残余物，并将珠在室温下打开盖干燥5分钟。珠不应过度干燥，因为这会显著降低核酸的总产率。通过将珠重悬于10mM Tris-HCl pH 8.0中来洗脱DNA。然后将管放回磁体上持续2分钟。

在第一连接步骤中，随后将经纯化DNA在带有热盖(≥100℃)的热循环仪中在37℃下孵育15分钟期间对其进行dA-加尾反应，该反应将dAMP并入到DNA链的3’端之上，并随后保持在4℃下。然后将反应旋转下来并置于冰上。

在A加尾之后，使用珠(2.5x)按照上述相同操作清洁样品。使用不含核酸酶的水洗脱DNA。

在第二连接步骤中，在热循环仪(没有热盖)中在25℃下孵育15分钟之后，通过DNA连接酶的作用将独特的核苷酸序列或分子条形码(MBC)与DNA连接，然后保持在4℃下。然后使用链霉抗生物素蛋白包被的珠对样品进行纯化。将样品置于磁体上持续1分钟或直至珠沉淀。在不干扰珠沉淀物的情况下使用移液管去除上清液。然后将珠重悬于连接净化缓冲液(1M NaCl，1mM EDTA，0.1％Tween，10mM Tris pH 8)中。将连接的DNA产物(50μL)与连接净化珠(50μL，总共100μL)混合，并将反应物在室温下孵育5分钟，随后混合，并再孵育5分钟。将样品旋转下来并置于磁体上持续1分钟以确保珠完全紧靠管壁沉淀。在不干扰珠的情况下弃去上清液，并将珠用连接缓冲液洗涤并置于磁体上持续1分钟。一旦浆液已清除，弃去上清液。然后用缓冲液洗涤珠两次，并随后用不含核酸酶的水洗涤一次。然后将结合MBC衔接子的珠转移至单独的组分混合物用于第一PCR步骤。

使用第一基因特异性引物和第一衔接子引物进行第一PCR。将反应保持在冰上，然后使用表3中所述的程序，在带有热盖(≥100℃)的热循环仪中进行第一PCR。一旦反应达到4℃，将反应短暂旋转下来并置于冰上。

表3：第一次PCR反应的PCR条件。

然后使用AMPure XP珠(1.2x)清洁PCR反应，并在室温(20℃至25℃)下孵育5分钟。然后将管短暂旋转下来并置于磁体上持续4分钟，以确保珠完全紧靠管壁沉淀。在不干扰珠沉淀物的情况下弃去上清液。然后将管在保持在磁体上的同时用70％乙醇洗涤30秒。重复洗涤两次。最终洗涤之后，用移液管去除上清液，并将管在室温下干燥3分钟。珠不应过度干燥，因为这会显著降低核酸的总产率。通过将珠重悬于10mM Tris-HCl pH 8.0中洗脱DNA。然后将管置于磁体上持续2分钟，然后将上清液转移至单独的组分混合物用于第二PCR步骤。

使用第二基因特异性引物和第二衔接子引物进行第二轮PCR。如图1中所示，第二PCR步骤并入了P7尾，其作为第二基因特异性引物的5’尾区并入。索引1(P7)标签的序列示于表4中。

表4：索引1(P7)序列表。

将来自第一PCR的经纯化文库DNA与第二基因特异性引物和第二衔接子引物以及PCR组分混合，并使用表5中所述的程序在带有热盖(≥100℃)的热循环仪中进行第二PCR。一旦反应达到4℃，将反应短暂旋转下来并置于冰上。

表5：第二PCR反应的PCR条件。

然后使用AMPure XP珠(1.2x)按照第一PCR反应中概述的相同操作清洁PCR反应。通过将珠重悬于10mM Tris-HCl pH 8.0中并在磁体上孵育2分钟来洗脱DNA。然后将文库标记的DNA转移至新PCR管用于储存、量化，或者归一化和测序。

实施例2：多样性和可重现性

使用上述方法在重复实验中从不同输入量(25、100、200、400、800和1600ng)的样品获得测序信息。如图4中所示，重复实验之间的克隆型重叠随着输入量而提高。使用来自256,000个读取的数据进一步进行重复样品的成对分析。图5中示出了800和1600ng输入样品的结果，该结果证明了测定的高度可重现性。图6A和6B描绘了所有克隆(图6A)与重叠克隆(图6B)的完全并行分析。图7示出了多样性与样本量的图(顶部)，以及输入大小与香农多样性指数的图(底部)，其示出了输入量驱动观察的复杂性和多样性。

如图8至10中所示，使用Jurkat稀释系列来测试实验室内和实验室间的可重现性。将表达TCRα：β受体的Jurkat细胞系添加到健康供体外周血淋巴细胞(peripheral bloodlymphocyte，PBL)RNA中以确定T细胞受体β链(T cell receptor beta chain，TRB)检测的限度并评估实验室间测定变化。将Jurkat总RNA一式两份进行连续稀释(1∶10稀释度至1∶10,000[ng Jurkat/(ng Jurkat+ng PBL)])到PBL RNA中。

将连续稀释分成两个等分试样每次稀释，并且制备文库并测序。图11中的结果示出了两个实验室之间的强相关。

将所有文库都归一化为600,000，去重复并误差校正。通过将1∶10稀释度的克隆型频率乘以10并将所得数目除以各自的稀释因子来确定预期频率(例如，因子＝0.5(1∶10稀释度)×10＝5。5/稀释因子＝给定稀释因子的实验频率)。

实施例3：引物

图12描绘了用于分析TCR(β/γ)组库的FFPE优化策略。如所示出的，逆转录酶(RT)引物结合位点对应于恒定结构域外显子的5’区。设计第一PCR基因特异性引物(GSP)以与对应于J区段的3’区或跨越J区段的区结合：C外显子交叉。从RT引物的5’端到CDR3的5’端的平均距离小于100个碱基对。设计引物组用于TCR(β/γ)和TCR(α/δ)的免疫组库测序，分别列于表6和表7中。

表6：T细胞受体(β/γ)引物组

/>

表7：T细胞受体(α/δ)引物组

与TCR组相比，除克隆型(CDR3)识别之外，BCR IgH引物组还具有一些另外的要求，因为IgH组确定同种型(A、D、E、G、M)和挑选出来的亚类。它还确定克隆是否经历了体细胞超突变(V-区段分析)。IgH引物位置如图13中所示。RT引物和第一PCR基因特异性引物与对应于相应同种型恒定区的CH1外显子的区结合，以区分挑选出来的同种型亚类。设计引物组用于BCR(IgH)和BCR(IgK/IgL)的免疫组库测序，分别列于表8和表9中。

表8：B细胞受体(IgH)引物组

/>

表9：B细胞受体(IgK/IgL)引物组

/>

作为替代地列出表6至9中的RT引物的核苷酸序列，其中根据Integrated DNATechnologies(IDT)命名法用符号表示修饰一其中“*”表示序列中在“*”之前的核苷酸与“*”之后的核苷酸之间的硫代磷酸酯键，并且“/52-Bio/”表示5’双重生物素部分。图14示出了RT引物的实例，所述RT引物具有与最5’碱基(“A”)连接的5’双重生物素部分，其中在最5’碱基和倒数第二最5’碱基(“C”)之间具有硫代磷酸酯键。双重生物素部分允许选择RT产物并确保更高的捕获效率。但是，可以使用单生物素。硫代磷酸酯连接防止外切核酸酶降解，从而确保不去除含生物素的碱基。

等同物

虽然本文中已描述并举例说明了本发明的数个实施方案，但本领域普通技术人员将容易预见到用于执行本文所述的功能和/或获得结果和/或一种或更多种优势的多种其他手段和/或结构，并且每种这样的改变和/或修改都被认为在本文所述的本发明的范围之内。更一般性地，本领域技术人员将容易理解，本文所描述的所有参数、尺寸、材料和构造都意在为示例性的，并且实际的参数、尺寸、材料和/或构造将根据使用本发明教导的具体应用而使用。本领域技术人员将认识到，或能够仅使用常规实验确定本文所描述的本发明具体实施方案的许多等同方案。因此，应当理解的是，前面的实施方案仅仅通过实例的方式展示，并且除非特别描述并要求，本发明的实施方案可以在所附权利要求范围及其等同的范围内实施。本公开内容的本发明的实施方案涉及本文所描述的每个单独的特征、系统、制品、材料、套件和/或方法。此外，如果该特征、系统、制品、材料、套件和/或方法并非互相不一致，则任何两个或更多个该特征、系统、制品、材料、套件和/或方法的组合也包含在本公开内容的本发明的范围内。

如本文所定义和使用的所有定义应理解为支配所定义项目的字典定义、在被合并以作参考的文献中的定义以及/或者其通常含义。

本文公开的所有参考文献、专利和专利申请均关于其所引用的主题通过引用并入本文，该主题在某些情况下可涵盖整个文件。

除非明确相反指明，否则本文在说明书和权利要求中所使用的没有数量词修饰的名词应理解为意指“至少一个/种”。

本文在说明书和权利要求书中使用的短语“和/或”应理解为意指相关联的要素(即在某些情况下相关联存在，而在其他情况下不相关联地存在的要素)中的“任意一个或二者”。除非明确相反指明，否则除了被“和/或”分句特别地确定的要素之外，其他要素可以任选地存在，无论其与特别确定的那些要素是否相关。因此，作为一个非限制实例，当与开放性语句如“包括/包含”结合使用提及“A和/或B”时，在一个实施方案中，可指有A而没有B(任选地，包括除了B之外的要素)；在另一个实施方案中，可指有B而没有A(任选地，包括除了A之外的要素)；在另一个实施方案中，可指A与B二者(任选地，包括其他要素)；等。

本文在说明书和权利要求中使用的“或”应该理解为与上文定义的“和/或”具有相同含义。例如，当分离列表中的项时，“或”或者“和/或”应被解释为包括性的，即在许多要素或要素列表中，以及任选地另外的未列出的项中，包括至少一个/种，但也包括多于一个/种的要素。仅当术语明确相反指明，例如“只有其中之一”或“恰好其中之一”，或者当在权利要求中使用“由……组成”时，将指包含许多要素或要素列表中的恰好一个/种要素。一般而言，当前面是排他性术语如“任一”、“其中之一”、“仅其中之一”或“恰好其中之一”时，本文所使用的术语“或”应当仅被解释为排他性的选择(即，“一个或另一个，但并非二者全部”)。当在权利要求中使用“基本上由……组成”时，应当具有其用于专利法领域中的通常含义。

本文在说明书和权利要求中使用的短语“至少一个/种”涉及一系列的一个/种或更多个/种要素，应当被理解为意指在要素列表中，选自任何一个/种或更多个/种要素的至少一个/种要素，但未必包括该要素列表中具体列出的各个/种和每个/种要素中的至少一个/种，并且不排除该要素列表中的任何要素的组合。该定义也允许除了在要素列表中被具体确定的、短语“至少一个/种”所指的要素以外，其他要素可任选的存在，无论是否与具体确定的那些要素相关。因此，作为一个非限制性实例，“A和B中的至少一个/种”(或等同的，“A或B中的至少一个/种”，或等同的，“A和/或B中的至少一个/种”)在一个实施方案中可指至少一个/种(任选地包括多于一个/种)A，而不存在B(且任选地包括除B之外的要素)；在另一个实施方案中，指至少一个/种(任选地包括多于一个/种)B，而不存在A(且任选地包括除A之外的要素)；在另一个实施方案中，指至少一个/种(任选地包括多于一个/种)A，和至少一个/种(任选地包括多于一个/种)B(并且任选地包括其他要素)；等。

还应该理解，除非明确相反地指出，否则在本文要求保护的包括多于一个步骤或操作的任何方法中，该方法的步骤或操作的顺序不一定限于所记载的该方法的步骤或操作的顺序。

在权利要求以及在上述的说明书中，所有的过渡短语如“包含”、“包括”、“带有”、“具有”、“含有”、“涉及”、“保持/容纳”、“由……构成”等应理解为开放式的，即意为包括但不限于。如美国专利局的专利审查程序手册(the United States Patent Office Manualof Patent Examining Procedures)，2111.03章所述，只有过渡短语“由……组成”和“基本上由……组成”应分别为封闭式或半封闭式过渡短语。应当理解，在作为替代实施方案中，在本文件中描述的使用开放式过渡短语(例如，“包含/括”)的实施方案也被认为是“由开放式过度短语所述的特征组成”和“基本上由开放式过度短语所述的特征组成”。例如，如果本公开内容描述了“包含A和B的组合物”，则本公开内容还考虑了作为替代实施方案“由A和B组成的组合物”和“基本上由A和B组成的组合物”。

Claims

1.制备用于分析的核酸的方法，所述方法包括：

(a)在杂交条件下使包含靶核苷酸序列的核酸分子与以捕获部分修饰的引物接触，所述以捕获部分修饰的引物与所述靶核苷酸序列特异性退火；

(b)进行第一链合成反应，其由杂交的以捕获部分修饰的引物引发并使用所述核酸分子作为模板；

(c)进行第二链合成反应，其使用所述第一链合成反应的产物作为模板以产生包含捕获部分的双链核酸；

(d)将衔接子核酸与所述双链核酸连接以产生包含所述捕获部分的连接产物；

(e)通过使所述连接产物与所述捕获部分的结合配偶体接触来捕获所述连接产物；以及

(f)使用包含与所述靶核苷酸序列特异性退火的3’部分的靶特异性引物和与所述衔接子核酸的互补序列特异性退火的第一衔接子引物通过聚合酶链式反应扩增所捕获的连接产物，其中所述靶特异性引物包含不与所述靶核苷酸序列特异性退火的5’尾部分。

2.权利要求1所述的方法，其还包括：

(g)使用包含与所述靶特异性引物的5’尾部分的互补序列特异性退火的3’部分的尾引物和与所述衔接子核酸的互补序列特异性退火的第二衔接子引物通过聚合酶链式反应扩增步骤(f)的扩增产物，其中所述尾引物包含不与所述靶特异性引物的互补序列特异性退火的5’部分。

3.权利要求2所述的方法，其中所述尾引物的5’部分包含样品索引区、分子条形码区和测序引物位点区中的至少一种。

4.权利要求1至3中任一项所述的方法，其中步骤(d)包括在连接酶将所述衔接子核酸与所述双链核酸连接的条件下组合所述衔接子核酸、双链核酸和连接酶，其中与所述双链核酸组合的衔接子核酸包含双链体部分和单链突出端序列，其中所述单链突出端序列包含与位于所述双链核酸3’端的单链突出端序列互补的核苷酸序列。

5.权利要求1至3中任一项所述的方法，其中步骤(d)包括在连接酶将所述衔接子核酸与所述双链核酸连接的条件下组合所述衔接子核酸、双链核酸和连接酶，其中与所述双链核酸组合的衔接子核酸是单链的。

6.权利要求1至3中任一项所述的方法，其中所述以捕获部分修饰的引物包含至少一个以捕获部分修饰的核苷酸。

7.权利要求1至3中任一项所述的方法，其中所述以捕获部分修饰的引物包含第一化学偶联基团，其配置成结合与捕获部分连接的第二化学偶联基团。

8.权利要求1至3中任一项所述的方法，其中所述捕获部分是生物素部分。

9.权利要求8所述的方法，其中所述生物素部分包含生物素-三乙二醇、双-生物素、可光裂解生物素、脱硫生物素、脱硫生物素-三乙二醇或生物素叠氮化物。

10.权利要求8所述的方法，其中所述结合配偶体是链霉抗生物素蛋白。

11.权利要求10所述的方法，其中所述链霉抗生物素蛋白与基底附接。

12.权利要求11所述的方法，其中所述基底包含固体表面。

13.权利要求12所述的方法，其中所述固体表面包含顺磁珠。

14.权利要求1至3中任一项所述的方法，其还包括在步骤(d)之后和步骤(e)之前的洗涤步骤。

15.权利要求1至3中任一项所述的方法，其还包括，在步骤(e)之后和步骤(f)之前：

i)将包含所述捕获部分的双链核酸固定在顺磁性基底上；以及

ii)洗涤经固定双链核酸。

16.权利要求15所述的方法，其还包括在步骤ii)之后：

iii)从所述顺磁性基底释放经洗涤的经固定双链核酸。

17.权利要求1至3中任一项所述的方法，其还包括在步骤(c)之后和步骤(d)之前，对所述双链核酸进行5’磷酸化。

18.权利要求1至3中任一项所述的方法，其还包括在步骤(c)之后和步骤(d)之前，对所述双链核酸进行末端修复以产生平末端双链核酸。

19.权利要求18所述的方法，其还包括将一个或更多个核苷酸添加至所述平末端双链核酸的3’端。

20.权利要求19所述的方法，其中所述一个或更多个核苷酸包含脱氧腺苷核苷酸。

21.权利要求19所述的方法，其中所述衔接子核酸包含位于3’端的核苷酸序列，所述位于3’端的核苷酸序列包含与添加至所述平末端双链核酸的3’端的所述一个或更多个核苷酸互补的一个或更多个核苷酸。

22.权利要求21所述的方法，其中位于所述衔接子核酸的3’端的核苷酸序列包含一个或更多个脱氧胸苷核苷酸。

23.权利要求21所述的方法，其中所述衔接子核酸还包含与扩增链退火的阻断链，所述扩增链包含位于3’端的核苷酸序列，并且其中所述位于3’端的核苷酸序列未配对以使其形成单链突出端序列。

24.权利要求18所述的方法，其还包括在末端修复之后：

i)将包含所述捕获部分的双链核酸固定在顺磁性基底上；

ii)洗涤经固定双链核酸；以及

iii)从所述顺磁性基底释放经洗涤的经固定双链核酸。

25.权利要求18所述的方法，其还包括在末端修复之后：

ii)洗涤经固定双链核酸。

26.权利要求24或权利要求25所述的方法，其还包括在末端修复之后和步骤i)之前的洗涤步骤。

27.权利要求2或3中任一项所述的方法，其还包括：

(h)将步骤(g)的扩增产物固定在顺磁性基底上；

(i)洗涤经固定扩增产物；以及

(j)从所述顺磁性基底释放经洗涤的经固定扩增产物。

28.权利要求27所述的方法，其还包括在步骤(g)之后和步骤(h)之前的洗涤步骤。

29.权利要求1至3中任一项所述的方法，其中在步骤(d)中，在存在拥挤剂的情况下将所述双链核酸与所述衔接子核酸连接。

30.权利要求1至3中任一项所述的方法，其还包括在步骤(b)之后和步骤(c)之前，使所述核酸分子与核糖核酸酶接触。

31.权利要求1至3中任一项所述的方法，其中所述第二链合成反应由与所述第一链合成反应的产物杂交的核酸分子的片段引发。

32.权利要求1至3中任一项所述的方法，其中使用多种随机引物随机引发所述第二链合成。

33.权利要求32所述的方法，其中所述多种随机引物的长度为6个碱基至15个碱基。

34.权利要求1至3中任一项所述的方法，其中所述核酸分子包含mRNA。

35.权利要求1至3中任一项所述的方法，其中所述核酸分子获自包含T细胞、B细胞或其混合物的样品。

36.权利要求35所述的方法，其中所述样品获自患有或怀疑患有T细胞恶性疾病或B细胞恶性疾病的对象。

37.权利要求36所述的方法，其中所述T细胞恶性疾病或B细胞恶性疾病选自淋巴瘤、多发性骨髓瘤、急性淋巴细胞白血病和慢性淋巴细胞白血病。

38.权利要求1至3中任一项所述的方法，其中所述样品获自已经经历或将要经历移植的对象。

39.权利要求1至3中任一项所述的方法，其中所述样品获自正在评价其对治疗的免疫应答的对象。

40.权利要求1至3中任一项所述的方法，其中所述样品获自患有或怀疑患有白细胞恶性疾病的对象。

41.权利要求1至3中任一项所述的方法，其中所述对象是人。

42.权利要求1至3中任一项所述的方法，其中所述对象是脊索动物。

43.权利要求1至3中任一项所述的方法，其中所述核酸分子获自包含白细胞的样品。

44.权利要求1至3中任一项所述的方法，其中所述靶核苷酸序列包含对应于T细胞受体(TCR)基因或B细胞受体(BCR)基因的一部分的核苷酸序列。

45.权利要求1至3中任一项所述的方法，其中所述以捕获部分修饰的引物包含与免疫受体基因或免疫球蛋白基因互补的核苷酸序列。

46.权利要求45所述的方法，其中所述以捕获部分修饰的引物与互补决定区3(CDR3)下游的恒定区特异性退火。

47.权利要求45所述的方法，其中所述靶特异性引物与CDR3下游的恒定区或J区段特异性退火。

48.权利要求45所述的方法，其中所述靶特异性引物与在恒定区和J区段之间形成的外显子-外显子衔接点特异性退火，并且其中所述外显子-外显子衔接点在CDR3的下游。

49.权利要求2至3中任一项所述的方法，其中所述第一衔接子引物与所述第二衔接子引物相同。

50.权利要求2至3中任一项所述的方法，其中所述第一衔接子引物与所述第二衔接子引物不同。

51.权利要求2至3中任一项所述的方法，其中所述第二衔接子引物相对于所述第一衔接子引物嵌套。

52.制备用于分析的核酸的方法，所述方法包括：

(a)在杂交条件下使包含已知靶核苷酸序列和未知靶核苷酸序列的核酸分子与以捕获部分修饰的引物接触，所述以捕获部分修饰的引物与所述已知靶核苷酸序列特异性退火；

(c)进行第二链合成反应，其由所述核酸分子的片段引发并使用所述第一链合成反应的产物作为模板以产生包含捕获部分的双链核酸；

(d)对所述双链核酸进行末端修复以产生包含所述捕获部分的平末端双链核酸；

(e)将衔接子核酸与所述平末端双链核酸连接以产生连接产物，其中所述连接产物包含侧翼为所述衔接子核酸和捕获部分的未知靶核苷酸序列；

(f)通过使所述连接产物与所述捕获部分的经固定结合配偶体接触来捕获所述连接产物；

(g)使用包含与所述已知靶核苷酸序列特异性退火的3’部分的靶特异性引物和与所述衔接子核酸的互补序列特异性退火的第一衔接子引物通过聚合酶链式反应扩增所述连接产物，其中所述靶特异性引物包含不与所述已知靶核苷酸序列特异性退火的5’尾部分；

(h)使用与所述靶特异性引物的5’尾部分的互补序列特异性退火的尾引物和与所述衔接子核酸的互补序列特异性退火的第二衔接子引物通过聚合酶链式反应扩增步骤(g)的扩增产物；以及

(i)洗涤步骤(h)的扩增产物。

53.制备用于分析的核酸的方法，所述方法包括：

(a)在产生引物杂交的核酸分子的条件下使包含靶核苷酸序列的核酸分子与第一靶特异性引物接触，所述第一靶特异性引物与所述靶核苷酸序列特异性退火；

(b)使所述引物杂交的核酸分子与多种类型的核苷酸接触，以并入到与所述核酸分子互补的第一链之中，其中所述多种类型的核苷酸中的至少一种包含捕获部分；

(c)进行第一链合成反应，其由所述引物杂交的核酸分子中的所述第一靶特异性引物引发并使用所述引物杂交的核酸分子中的核酸分子作为模板，其中所述第一链合成反应的产物包含至少一个捕获部分；

(d)进行第二链合成反应，其由所述核酸分子的片段引发并使用所述第一链合成反应的产物作为模板，以产生包含所述至少一个捕获部分的双链核酸；

(e)将衔接子核酸与所述双链核酸连接以产生包含所述至少一个捕获部分的连接产物；

(f)通过使所述连接产物与所述捕获部分的经固定结合配偶体接触来捕获所述连接产物；以及

(g)使用包含与所述靶核苷酸序列特异性退火的3’部分的第二靶特异性引物和与所述衔接子核酸的互补序列特异性退火的第一衔接子引物通过聚合酶链式反应扩增所述连接产物，其中所述第二靶特异性引物包含不与所述靶核苷酸序列特异性退火的5’尾部分。