CN113396227A

CN113396227A - 用于目标互补dna富集的方法

Info

Publication number: CN113396227A
Application number: CN201980090479.3A
Authority: CN
Inventors: J·斯科尔尼克; 王颖婷; 云翔
Original assignee: Agency for Science Technology and Research Singapore; National University of Singapore
Current assignee: Agency for Science Technology and Research Singapore; National University of Singapore
Priority date: 2018-12-28
Filing date: 2019-12-26
Publication date: 2021-09-14
Also published as: EP3902923A4; KR20210141449A; SG11202106810UA; WO2020136440A3; JP2022515466A; EP3902923A2; CA3124887A1; WO2020136440A2; US20220112539A1

Abstract

本发明提供了用于富集目标互补DNA(cDNA)的方法，包括：(a)提供多个cDNA，每个cDNA在末端包含第一通用序列，并且其中所述多个cDNA包含目标cDNA；(b)用与第一通用序列互补的通用正向引物和基因特异性反向引物扩增目标cDNA，且其中通过核酸扩增反应、通过连接或通过引物延伸反应将第二通用序列添加到与第一通用序列相反的目标cDNA的末端；(c)使用通用正向引物和与第二通用序列互补的通用反向引物扩增所述扩增子或延伸产物。在一个实施方式中，通用正向引物、基因特异性反向引物和第二通用反向引物在相同的反应混合物中提供，使得扩增是单一步骤。

Description

用于目标互补DNA富集的方法

相关申请

本申请要求于2018年12月28日提交的美国临时专利申请第62/785,916号的优先权，上述申请的全部教导通过引用并入本文。

发明背景

富集样品中特定的核苷酸或蛋白质的能力对于分子生物学研究和医学应用都很重要。特别是，在单细胞RNA测序中有获得特定基因的序列信息或标签计数的特定需求。

发明概述

本发明提供了用于富集目标互补DNA(cDNA)的方法。

在各个方面，本发明提供了富集目标cDNA的方法，其包括以下步骤：

(a)提供多个cDNA，其中每一个cDNA在末端包含第一通用序列，并且其中多个cDNA包含待富集的目标cDNA；

(b)提供第一反应混合物，包含：

至少一个基因特异性引物(例如，至少一种基因特异性反向引物)，其包含与目标cDNA中序列的全部或一部分互补的序列，并且在至少一个基因特异性引物的末端进一步包含至少一个第二通用序列；

(c)将多个cDNA与第一反应混合物接触，使得至少一个基因特异性引物与目标cDNA杂交；

(d)延伸至少一个基因特异性引物以获得至少一个延伸产物；

(e)提供第二反应混合物，其包含：

1)通用寡核苷酸正向引物，其包含与第一通用序列的全部或一部分互补的序列；和

2)通用寡核苷酸反向引物，其包含与所述至少一个第二通用序列的全部或一部分互补的序列；

(f)使至少一个延伸产物与第二反应混合物接触；和

(g)扩增至少一个延伸产物，从而富集目标cDNA。

在进一步的方面，本发明提供了富集目标互补DNA(cDNA)的方法。该方法一般地包括以下步骤：

(a)提供多个不同的cDNA，其中每一个cDNA在末端包含第一通用序列，并且其中多个cDNA包含待富集的目标cDNA；

(b)提供第一反应混合物，其包含：

1)通用寡核苷酸正向引物，其包含与第一通用序列的全部或一部分互补的序列，和

2)至少一个基因特异性反向引物，其中所述至少一个基因特异性反向引物包含与目标cDNA中序列的全部或一部分互补的序列，并且在至少一个基因特异性引物的末端进一步包含至少一个第二通用序列；

(c)使多个cDNA与第一反应混合物接触；

(d)扩增目标cDNA以获得扩增子；

(e)提供第二反应混合物，其包含：

2)通用寡核苷酸反向引物，其中所述通用寡核苷酸反向引物包含与所述至少一个第二通用序列的全部或一部分互补的序列；从而富集目标cDNA；

(f)使扩增子与第二反应混合物接触；和

(g)扩增扩增子，从而富集目标cDNA。

在另外的方面，富集目标cDNA的方法一般包括以下步骤：

(b)提供反应混合物，其包含：

1)通用寡核苷酸正向引物，其包含与第一通用序列的全部或一部分互补的序列，

2)至少一个基因特异性反向引物，其中所述至少一个基因特异性反向引物包含与目标cDNA中序列的全部或一部分互补的序列，并且在至少一个基因特异性引物的末端进一步包含至少一个第二通用序列，和

3)通用寡核苷酸反向引物，其中所述通用寡核苷酸反向引物包含与所述至少一个第二通用序列的全部或一部分互补的序列；

(c)使多个cDNA与反应混合物接触；和

(d)扩增目标cDNA，从而富集目标cDNA。

在其他方面，本发明提供了富集目标cDNA的方法，其包括以下步骤：

(b)提供第一反应混合物，其包含：

1)包含与第一通用序列的全部或一部分互补的序列的第一通用寡核苷酸正向引物，和

2)基因特异性反向引物，其包含与目标cDNA中的序列互补的序列；

(c)使多个cDNA与第一反应混合物接触；

(d)扩增目标cDNA以获得第一扩增子；

(e)在第一扩增子中每一个目标cDNA的末端添加至少一个第二通用序列以获得缀合的扩增子；

(f)提供第二反应混合物，其包含：

1)包含与第一通用序列的全部或一部分互补的序列的第二通用寡核苷酸正向引物，和

(g)使缀合的扩增子与第二反应混合物接触；和

(h)扩增缀合的扩增子，从而富集目标cDNA。

在本发明各个方面的特定实施方式中，多个cDNA中的每一个cDNA还包含细胞识别标签或独特的分子标识符(UMI)序列或其组合。在一些实施方式中，通过逆转录来自单个细胞的mRNA获得多个cDNA。

附图简述

现在将参考以下附图详细描述本发明，所述附图显示：

图1说明了用于产生3'标记的cDNA文库的示例性方法中的一般步骤。在此实施例中，3'标签包括通用序列、细胞识别标签(细胞ID)和独特的分子标识符(UMI)序列。相同的过程可用于建立5'标记的cDNA文库。如所示的，寡聚物可以连接到珠上。

图2说明了利用标记的cDNA文库和在引物末端具有通用序列的基因特异性引物来富集目标cDNA的本发明的示例性方法。随后，可以用第一通用序列和第二通用序列进行另一PCR(例如，使用两个通用引物进行文库扩增)以准备用于测序。

图3说明了利用标记的cDNA文库、缺乏通用序列的基因特异性引物和连接的通用序列来富集目标cDNA的本发明的示例性方法。随后，可以将扩增子连接到测序特异性序列(例如，

P7序列)。添加测序特异性序列后，可以使用通用引物对DNA进行PCR扩增以富集连接的或标签片段化的(tagmented)DNA。

图4说明了本发明的示例性方法，其中通用寡核苷酸正向引物的一个末端具有封闭基团，从而阻断通用寡核苷酸正向引物在该一个末端的磷酸化。T/A连接是任选的，但可以提高连接效率。对于连接，只需要一条链用于连接，并且在这种情况下，只有底部链连接，因为连接接头的顶部链没有用于连接的5'磷酸。

图5说明了本发明的示例性测序方法，其可以在图3或图4所示的富集方法之后使用。

图6说明了利用3'标记的cDNA文库的本发明的示例性方法。只显示了cDNA的一条链；然而，在使用基因特异性引物(GSP)进行靶向(未显示)之前，可以通过两个通用引物对cDNA进行PCR扩增。因此，它在进行基因特异性分析时是双链的(未显示)。或者，可以在使用两个通用引物进行扩增之前运行相同的分析。

图7说明了靶向沿着一个cDNA的多个区域的本发明的示例性方法。

图8显示了使用TCRα(TCRA)(泳道2)和TCRβ(TCRB)(泳道3)引物在1.2％琼脂糖EtBr凝胶上的PCR结果。泳道1显示了1kb MW标记。

图9显示了在琼脂糖EtBr凝胶上TCRα(TCRA)和TCRβ(TCRB)RNA扩增的PCR结果。泳道1显示1kb MW标记；泳道2显示TCRα连接反应；泳道3显示TCRβ连接反应；泳道4显示了TCRαPCR产物；泳道5显示了TCRβPCR产物；和泳道6显示了不使用模板的对照PCR产物。

图10是染色的琼脂糖凝胶，其显示使用单个(非合并的)TCRα和TCRβ引物获得的PCR产物。

图11是染色的琼脂糖凝胶，其显示分别使用合并的TCRα(TCRa)引物和TCRβ(TCRb)引物获得的PCR产物。右列包含1kb plus梯状标记(ThermoFisher Scientific,Waltham,MA)。

发明详述

下面是示例性实施方式的描述。

除非另外定义，否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。

应当注意，贯穿本说明书，术语“包含”用于表示本发明的实施方式“包含”所提到的特征，并且因此也可以包含其他特征。然而，在本发明的上下文中，术语“包含”还可以涵盖其中本发明“基本上由相关特征组成”或“由相关特征组成”的实施方式。

术语“核苷酸”是指天然存在的核糖核苷酸或脱氧核糖核苷酸单体，以及它们的非天然存在的衍生物和类似物。因此，核苷酸可以包括，例如，包含天然存在的碱基(例如，A、G、C或T)的核苷酸和包含修饰的碱基(例如，7-脱氮鸟苷或肌苷)的核苷酸。

关于核酸的术语“序列”是指通过共价键(例如，磷酸二酯键)连接的一系列连续的核苷酸。

本发明提供了从例如测序文库富集cDNA库中的一种或多种目标互补DNA(cDNA)的方法。

如本文所用，“互补DNA”或“cDNA”是指在通过逆转录酶催化的反应中从单链RNA(例如，信使RNA(mRNA)或微RNA)模板合成的核酸分子。

本文所描述的方法可应用于多细胞(多个细胞)或应用于单细胞。在一个实施方式中，该方法适用于来自单细胞测序文库的cDNA库内的特定cDNA。在一些实施方式中，通过逆转录来自单个细胞的mRNA获得cDNA或“多个cDNA”。在其他实施方式中，通过逆转录来自多个细胞(合并细胞)的mRNA获得cDNA。在一些实施方式中，一种或多种目标cDNA的逆转录是cDNA文库生成过程的部分。cDNA文库可以是总体cDNA文库(例如，来自细胞的总mRNA的cDNA文库)或目标cDNA文库。

产生可用于本发明方法的cDNA文库的方法的实例示于图1。图1所示的方法显示了3'标记的cDNA文库的生成，其中3'标签包含第一通用序列(或PCR柄(PCR handle))、细胞识别标签(或细胞ID)和UMI(或独特的分子标识符)。本发明的方法还可以应用于在文库cDNA的5'末端上具有通用序列(或PCR柄)、细胞识别标签(或细胞ID)和UMI(或独特的分子标识符)的5'标记的cDNA文库。如所示的，逆转录寡聚物可结合于珠并与来自细胞或细胞池的mRNA和必要聚合酶接触以引起逆转录。得到的cDNA包含由逆转录寡聚物提供的第一通用序列、细胞ID和UMI。

如本文所用，“细胞识别标签”是指可并入延伸产物(例如，扩增子)中并用于测序应用以识别其中生成延伸产物的特定细胞(例如，单个细胞)或细胞类型的核苷酸序列。细胞识别标签可以包含在引物(例如，延伸引物，例如寡聚(dT)引物或扩增引物)中以用于引入到延伸产物(例如，RT产物、扩增子)中。细胞识别标签可以通过合适的核酸聚合酶如逆转录酶或DNA聚合酶并入延伸产物中。

“独特的分子标识符”或“UMI”，其也称为“随机分子标签(RMT)”，是用于标记核酸分子(例如，在扩增之前)并有助于识别重复项的核苷酸序列。UMI通常是随机序列并且通常大小范围为约4至约20个核苷酸长度。UMI的实例是本领域已知的。

在一些实施方式中，样品(例如，单细胞)中的目标和非目标核酸分子(即，mRNA)两者被逆转录，从而产生目标cDNA产物和非目标cDNA产物。

术语“细胞”涵盖哺乳动物细胞、植物细胞、细菌细胞和真菌细胞。

本文所述的方法可以使用标准实验室设备进行，例如，平板上或阵列中的孔(例如，微孔或纳米孔)。孔还可包含寡核苷酸(例如，引物)，其可固定在珠上。

本文所述的方法利用核酸扩增技术，例如聚合酶链反应(PCR)。在一些实施方式中，所描述的方法利用RNase H依赖性PCR(rhPCR)。在rhPCR中，PCR寡核苷酸引物的3'末端包含封闭结构域，该结构域通过单个RNA碱基与引物分隔开。当引物与其靶标杂交时，RNAseH能够切割RNA碱基，从而释放封闭结构域并允许从引物开始聚合。这种活性减少了引物二聚体的形成，这在大型多重PCR反应中很重要，例如在T细胞受体(TCR)反应中，其需要各自约30个引物来扩增所有可能的α和β链。

在第一方面，本发明提供了一种富集目标cDNA的方法，如图2所示。该方法一般包括以下步骤：

(b)提供第一反应混合物，其包含：

(c)使多个cDNA与第一反应混合物接触；

(d)扩增目标cDNA以获得扩增子；

(e)提供第二反应混合物，其包含：

2)通用寡核苷酸反向引物，其中所述通用寡核苷酸反向引物包含与至少一个第二通用序列的全部或一部分互补的序列；从而富集目标cDNA；

(f)使扩增子与第二反应混合物接触；和

(g)扩增扩增子，从而富集目标cDNA。

如本文所用，“目标互补DNA”或“目标cDNA”是指通过所述方法富集的cDNA库中的特定cDNA。目标cDNA可能以低水平表达，并且可能有利于人为增加拷贝数(即富集)用于分析(例如，测序)较大库中的目标cDNA。

在上述本发明的第一方面中，在一些实施方式中，第一通用引物和第二通用引物可以是相同的引物，或者，在其他实施方式中，可以是不同的引物，条件是不同的引物中每一个包含与第一通用序列的全部或一部分互补的序列。

本发明的这个第一方面允许其中在总cDNA扩增步骤之前或之后，一部分cDNA可以去除并专门用作靶向PCR反应的输入以富集目标cDNA的情况。

在第二方面，本发明提供了一种富集目标cDNA的方法，其包括以下步骤：

(b)提供反应混合物，其包含：

(c)使多个cDNA与反应混合物接触；和

(d)扩增目标cDNA，从而富集目标cDNA。

在第二方面，在相同的反应混合物中提供基因特异性反向引物和通用寡核苷酸反向引物，使得扩增是单一步骤。在一种情况下，将基因特异性引物添加到总cDNA扩增PCR步骤中，以便扩增所有cDNA并特异性扩增某些cDNA以确保它们不会退出测定。

在一些实施方式中，多个cDNA中的每一个cDNA还包含细胞识别标签或独特分子标识符(UMI)序列或其组合。细胞识别标签或UMI序列或它们的组合可以进一步包含聚(T)序列。在一些实施方式中，细胞识别标签或UMI序列或其组合在扩增目标cDNA后被保持。

在各种实施方式中，第一通用序列在每一个cDNA分子的5'末端，而在其他实施方式中，第一通用序列在每一个cDNA分子的3'末端(图6)。例如，相同的方法可以用例如使用10X基因组学5'VdJ分析翻转的初始链执行，其中将细胞识别标签添加到cDNA的生长3'末端，而不是cDNA的5'末端。

在一些实施方式中，本发明上述方面的步骤(d)中目标cDNA的扩增包括通过聚合酶链反应(PCR)进行扩增。在其他实施方式中，本发明前述方面的步骤(d)中目标cDNA的扩增包括通过基于非PCR的扩增方法例如通过环介导的等温扩增(LAMP)进行扩增。

在一些实施方式中，至少一个基因特异性反向引物进一步包含通过RNA碱基与引物分隔开的封闭结构域。当至少一个基因特异性反向引物包含通过RNA碱基与引物分隔开的封闭结构域时，步骤(d)中目标cDNA的扩增可以通过rhPCR进行。

在一些实施方式中，该方法进一步包括使用通用寡核苷酸正向引物、通用寡核苷酸反向引物、至少一个基因特异性反向引物或其组合对目标cDNA的一个或多个部分进行测序。

在另一方面，本发明提供了一种富集目标cDNA的方法，图3中举例说明了其实例，其包括以下步骤：

(b)提供第一反应混合物，其包含：

(c)使多个cDNA与第一反应混合物接触；

(d)扩增目标cDNA以获得第一扩增子；

(f)提供第二反应混合物，其包含：

(g)使缀合的扩增子与第二反应混合物接触；和

(h)扩增缀合的扩增子，从而富集目标cDNA。

在一些实施方式中，多个cDNA中的每一个cDNA还包含细胞识别标签或UMI序列或其组合。细胞识别标签或UMI序列或它们的组合可以进一步包含聚(T)序列。在一些实施方式中，细胞识别标签或UMI序列或其组合在目标cDNA的缀合扩增子扩增后被保持。

在各种实施方式中，第一通用序列在每一个cDNA分子的5'末端，而在其他实施方式中，第一通用序列在每一个cDNA分子的3'末端。

在一些实施方式中，本发明上述方面的至少一个扩增步骤包括通过聚合酶链反应进行扩增。

在一些实施方式中，基因特异性反向引物进一步包含通过RNA碱基与引物分隔开的封闭结构域。当基因特异性反向引物包含通过RNA碱基与引物分隔开的封闭结构域时，扩增步骤中的至少一个可以通过RNase H依赖性聚合酶链反应进行。

在一些实施方式中，将至少一个第二通用序列(例如，

P7序列)连接至与第一通用序列(例如，

p5序列)相对的第一扩增子的末端，如图3所示。在一些实施方式中，根据本领域技术人员已知的标准技术(例如，标签片段化)使用转座子添加至少一个第二通用序列。在其他实施方式中，通过将第一扩增子中的核酸分子片段化并将至少一个第二通用序列连接至片段，通过引物延伸反应或通过核酸扩增反应或它们的组合添加至少一个第二通用序列。连接可以仅限于基因特异性引物末端，因为通用引物侧已经包含适当的测序特异性序列(例如，

P5序列)。如本领域所理解的，还可以通过片段化然后连接来缩短扩增子，或者可以将扩增子用作用于标签片段化或添加测序特异性序列的其他方法的底物。在一些实施方式中，通过连接、通过引物延伸反应或通过核酸扩增反应或其组合添加至少一个第二通用序列，将至少一个第二通用序列在与至少一个第一通用序列相反的末端添加到第一扩增子中每一个目标cDNA的末端。

在一些实施方式中，通用寡核苷酸正向引物的一个末端具有封闭基团，从而在一个末端阻断通用寡核苷酸正向引物的磷酸化，如图4所示。在一些实施方式中，封闭基团是反向dTTP和/或在通用寡核苷酸正向引物的5'末端。

在进一步的实施方式中，该方法还包括使用通用寡核苷酸正向引物、通用寡核苷酸反向引物、基因特异性反向引物、基因特异性正向引物或其组合对目标cDNA的一个或多个部分进行测序。可用于本文方法中的测序技术的示例性说明示于图5中。

测序可以是正常的

测序或可以使用基因特异性引物(或两者的混合)。在其中需要扩增子的长区域且扩增子未被消化的情况下，可以使用基因特异性引物代替任何标准测序引物。在图5所示的实例中，执行正常阅读1以收集细胞标识符和UMI序列。原因可能不对DNA的部分进行测序，例如在TCR序列中，阅读1的继续将导致对信息目的不可用的共同序列。因此，索引阅读(index read)可以使用基因特异性引物，并对具有有用信息内容的附加碱基进行测序。随后，可以使用标准引物(或另一基因特异性引物)进行

阅读2以对另外的有用序列进行测序。例如，对于TCR，有用的序列数据必须有覆盖所有重组的片段。在本实例中，阅读1将仅读入恒定区中，所以取而代之的是使用与恒定区杂交的基因特异性引物，以跳过插入序列并识别J区序列。阅读2然后以V区开始并通过D区进行测序。

需要注意的其他事项，尤其是围绕TCR：(1)该图示中的索引阅读序列以所有扩增子共有的多个碱基开始。它们必须与其他cDNA一起测序以平衡碱基组成(特别是对于

测序)，或者必须在测序运行中包含合成碱基平衡DNA集，其被专门匹配以平衡来自共同TCR区域的碱基。(2)对于TCR(在这种情况下)可能有用的是具有突变或缺失的标准

索引阅读引物结合位点，以便标准

索引阅读引物不会与这些特异性扩增子杂交。这样，基因特异性引物和索引阅读引物可以混合在一起，并且TCR可以与其他cDNA一起测序。

在其他方面，本发明提供了富集目标cDNA的方法，图7中说明了该方法的一个实例，其包括以下步骤：

(b)提供第一反应混合物，其包含：

至少一个基因特异性反向引物，其包含与目标cDNA中序列的全部或一部分互补的序列，并且在所述至少一个基因特异性引物的末端还包含至少一个第二通用序列；

(c)使多个cDNA与第一反应混合物接触，使得至少一个基因特异性反向引物与目标cDNA杂交；

(d)延伸至少一个基因特异性反向引物以获得至少一个延伸产物；

(e)提供第二反应混合物，其包含：

(f)使至少一个延伸产物与第二反应混合物接触；和

(g)扩增至少一个延伸产物，从而富集目标cDNA。

在一些实施方式中，多个cDNA中的每一个cDNA还包含细胞识别标签或UMI序列或其组合。细胞识别标签或UMI序列或它们的组合可以进一步包含聚(T)序列。在一些实施方式中，细胞识别标签或UMI序列或其组合在至少一个延伸产物扩增后被保持。

在一些实施方式中，延伸步骤(d)利用瓣状核酸内切酶活性缺陷的聚合酶。在其他实施方式中，在延伸步骤(d)中使用标准的热稳定DNA聚合酶，其包括瓣状核酸内切酶活性。

在一些实施方式中，(g)中扩增至少一个延伸产物的步骤包括通过聚合酶链反应进行扩增。

如图7所示，针对多个基因的多个探针和可能沿着相同cDNA杂交的多个探针(如所示的)可以与cDNA杂交并延伸。然后，反应清洁并使用共同引物进行PCR扩增。这具有能够靶向沿着一个cDNA的多个区域的优势。可选的实施方式可以包括每一个cDNA杂交一个探针，扩增和片段化用于如本文先前所述的

测序。另一个实施方式可以涉及每个基因杂交一个探针并将其用作长阅读测序的模板，例如Oxford纳米孔技术。

在进一步的实施方式中，该方法还包括使用通用寡核苷酸正向引物、通用寡核苷酸反向引物、基因特异性反向引物、基因特异性正向引物或其组合对目标cDNA的一个或多个部分进行测序。在其他实施方式中，该方法进一步包括对富集的目标cDNA进行测序的步骤。

在本文所述方面的一些实施方式中，基因特异性引物可包含修饰的碱基以增加特异性。例如，rh-PCR可以与基因特异性引物一起使用。可以使用基因特异性引物库，而不仅仅是一个引物，例如，可以结合所有(或大部分)TCR V区域的引物库。

在本文所述方面的一些实施方式中，连接方法可以包括在第一PCR中使用5'封闭的通用引物(例如，5'反向dT)，和然后使用5'磷酸化的基因特异性引物。然后这可以仅在一个末端通过未磷酸化的连接接头进行连接。或者，代替使用磷酸化的基因特异性引物，可以在使用PNK的PCR之前或之后将5'磷酸添加到引物。此外，可以通过剪切(例如，covaris)或酶促(例如，外切或内切核酸酶处理)进行消化。DNA可以被消化到不同的长度，以使得测序能够对目标cDNA的所有必要的感兴趣区域进行测序，和然后生物信息学地组装这些不同长度的阅读片段。

使用本文所述的方法可以获得以下特征和相关益处：

(1)富集来自单细胞测序文库的cDNA库内的特定cDNA-特定RNA的表达水平较低，且在较大库中人工增加拷贝数用于对这些特定cDNA进行测序是有益的，同时仍然测序较大的库；

(2)具有用于扩增的通用引物的单一靶向引物-在5'末端的感兴趣的目标cDNA，同时保留添加到cDNA 3'末端的任何细胞识别序列；

(3)从3'标记cDNA的T细胞受体测序-在形成单细胞RNA测序文库时，使用3'标签测序可能是有益的；然而，诸如给定细胞所表达的特定T细胞受体的信息将会丢失。本发明提供的方法从3'标签测序重新捕获TCR序列；

(4)从3'标记的cDNA的剪接位点监测-与上述类似，该方法使得全长cDNA内的任何特异性序列能够被捕获，同时仍保留用于基因表达分析的整个cDNA库，并还保持来自3'标记的测序文库制备的细胞ID序列；

(5)目标cDNA的单引物扩增(即一轮靶向扩增)-代替用于靶向RNA测序的嵌套PCR，本发明允许进行一轮靶向PCR以相对于背景富集cDNA，使得不会丢失并且能够被测序；

(6)可能包括通过在测序反应中使用基因特异性引物对测序分析本身进行修改，以从基因内的特定点进行靶向测序–使得能够对感兴趣基因的关键部分进行测序并绕过某些区域，例如，TCR的恒定区，或能够对基因内的多个剪接接合点进行测序；

(7)与单细胞水平的3'标签测序和DNA偶联蛋白分析相容；

(8)可以使用RH-PCR或其他改进的引物方法来提高PCR特异性-提高PCR目标特异性，以便只有一个引物可以与通用引物一起使用来扩增所需的产物；和/或

(9)识别标准单细胞RNA测序不识别的转基因-某些转基因的表达不够高而无法在标准RNA测序中进行识别。本发明的方法可以专门针对它们进行表达分析。

实施例1

用于从单细胞3'RNA测序分析对T细胞受体(TCR)基因座进行测序的cDNA富集

该实施例中，显示了一种用于富集源自3'标记的单细胞RNA测序文库的cDNA的方法，由此富集目标cDNA，同时保持添加到基因3'末端的任何细胞识别序列。特别地，该方法使得能够从单细胞3'RNA测序分析对T细胞受体基因座进行测序。该分析如预期的从TCR获得测序数据。

用于从TCRα和β链扩增TCR序列的Rh-引物：

A1 ACACTGGCTGCAACAGCATCrCaggaC/3SpC3/(SEQ ID NO:1)

A2 GGATAAACATCTGTCTCTGCGrCattgG/3SpC3/(SEQ ID NO:2)

A3 AACAGAATGGCCTCTCTGGCrAatcgG/3SpC3/(SEQ ID NO:3)

A4 GAACATCACAGCCACCCAGACCGGrAgactG/3SpC3/(SEQ ID NO:4)

A5 CTTGGAGAAAGGCTCAGTTCrAagtgA/3SpC3/(SEQ ID NO:5)

A6 CTGAGGAAACCCTCTGTGCArGtggaC/3SpC3/(SEQ ID NO:6)

A7 AAGGGAATCCTCTGACTGTGrAaatgG/3SpC3/(SEQ ID NO:7)

A8 TCCACCAGTTCCTTCAACTTCACCrAtcacT/3SpC3/(SEQ ID NO:8)

A9 TTGATACCAAAGCCCGTCTCrAgcacG/3SpC3/(SEQ ID NO:9)

A10 TTCATCAAAACCCTTGGGGACAGCrTcatcT/3SpC3/(SEQ ID NO:10)

A11 GATGGAAGGTTTACAGCACAGCTCrAatagT/3SpC3/(SEQ ID NO:11)

A12 TCCCAGCTCAGCGATTCAGCCTCCrTacatG/3SpC3/(SEQ ID NO:12)

A13 CACAGTGGAAGATTAAGAGTCACGCrTtgacT/3SpC3/(SEQ ID NO:13)

A14 GCAAAGCTCCCTGTACCTTACGGrCctccG/3SpC3/(SEQ ID NO:14)

A15 AATCCGCCAACCTTGTCATCTCCGrCttcaG/3SpC3/(SEQ ID NO:15)

A16 ACCCTGAGTGTCCAGGAGGGrTgacaT/3SpC3/(SEQ ID NO:16)

A17 CTGAGGAAACCCTCTGTGCArTtggaC/3SpC3/(SEQ ID NO:17)

A18 CCCAGCAGGCAGATGATTCTCGTTrAttcgG/3SpC3/(SEQ ID NO:18)

A19 CCCAGCAGGCAGATGATTCTCGTTrAttcgG/3SpC3/(SEQ ID NO:19)

A20 TCTGGTATGTGCAATACCCCAACCrAaggaG/3SpC3/(SEQ ID NO:20)

A21 TTACAAACGAAGTGGCCTCCrCtgttA/3SpC3/(SEQ ID NO:21)

A22 GGATTGCGCTGAAGGAAGAGrCtgcaT/3SpC3/(SEQ ID NO:22)

A23 AACTGCACGTACCAGACATCrTgggtA/3SpC3/(SEQ ID NO:23)

A24 TGAAGGTCACCTTTGATACCACCCrTtaaaG/3SpC3/(SEQ ID NO:24)

A25 CACTGCTGACCTTAACAAAGGCGrAgacaA/3SpC3/(SEQ ID NO:25)

A26 AAGGAGAGGACTTCACCACGrTactgG/3SpC3/(SEQ ID NO:26)

A27 TGCCTCGCTGGATAAATCATCAGGrAcgtaC/3SpC3/(SEQ ID NO:27)

A28 AACTGCACGTACCAGACATCrTgggtA/3SpC3/(SEQ ID NO:28)

A29 GATAGCCATACGTCCAGATGrTgagtC/3SpC3/(SEQ ID NO:29)

A30 TGCCACTCTTAATACCAAGGAGGGrTtacaC/3SpC3/(SEQ ID NO:30)

A31 TCTGGTATGTGCAATACCCCAACCrAaggaG/3SpC3/(SEQ ID NO:31)

A32 GTCCTGTCCTCTTGATAGCCrTtataA/3SpC3/(SEQ ID NO:32)

A33 AGCAAAAACTTCGGAGGCGGrAaataA/3SpC3/(SEQ ID NO:33)

A34 ACCCTGCTGAAGGTCCTACATTCCrTgataA/3SpC3/(SEQ ID NO:34)

A35 TCCTGGTGACAGTAGTTACGrGgtggT/3SpC3/(SEQ ID NO:35)

A36 ACCCTGAGTGTCCAGGAGGGrAgacaC/3SpC3/(SEQ ID NO:36)

A37 AGGCTCAAAGCCTTCTCAGCAGGGrAcgatT/3SpC3/(SEQ ID NO:37)

A38 GATGGAAGGTTTACAGCACAGCTCrAataaT/3SpC3/(SEQ ID NO:38)

A39 AGCCCAGCCATGCAGGCATCTACCrTctgtC/3SpC3/(SEQ ID NO:39)

B1 CTCCCTGATTCTGGAGTCCGCCArGcaccT/3SpC3/(SEQ ID NO:40)

B2 CCACTCTGAAGATCCAGCCCTCAGrAacccT/3SpC3/(SEQ ID NO:41)

B3 CTGTAGCCTTGAGATCCAGGCTACGArAgcttC/3SpC3/(SEQ ID NO:42)

B4 CTAACATTCTCAACTCTGACTGTGAGCAACArTgagcG/3SpC3/(SEQ ID NO:43)

B5 TCGCTCAGGCTGGAGTCGGCTGrCtcccA/3SpC3/(SEQ ID NO:44)

B6 TCAAATTTCACTCTGAAGATCCGGTCCACAArAgctgC/3SpC3/(SEQ ID NO:45)

B7 GATAACTTCCAATCCAGGAGGCCGAACArCttctA/3SpC3/(SEQ ID NO:46)

B8 CCCTGACCCTGGAGTCTGCCArGgcccA/3SpC3/(SEQ ID NO:47)

B9 GCTCAGGCTGCTGTCGGCTGrCtcccA/3SpC3/(SEQ ID NO:48)

B10 GCTCTGAGCTGAATGTGAACGCCTTGrTtgctT/3SpC3/(SEQ ID NO:49)

B11 GCTCTGAGATGAATGTGAGTGCCTTGrGagctC/3SpC3/(SEQ ID NO:50)

B12 CCACTCTGACGATTCAGCGCACAGrAgcagG/3SpC3/(SEQ ID NO:51)

B13 CCACTCTCAAGATCCAGCCTGCAGrAgcttC/3SpC3/(SEQ ID NO:52)

B14 CCCCTCAAGCTGGAGTCAGCTGrCtcccA/3SpC3/(SEQ ID NO:53)

B15 CTCCCTGTCCCTAGAGTCTGCCATrCcccaT/3SpC3/(SEQ ID NO:54)

B16 GCATCCTGAGGATCCAGCAGGTAGrTgcgaC/3SpC3/(SEQ ID NO:55)

B17 GCTCTGAGCTGAATGTGAACGCCTTGrTtgctC/3SpC3/(SEQ ID NO:56)

B18 CACTCAGGCTGGTGTCGGCTGrCtcccA/3SpC3/(SEQ ID NO:57)

B19 GCTCACTTAAATCTTCACATCAATTCCCTGGrAgcttC/3SpC3/(SEQ ID NO:58)

B20 CCACTCTGAAGATCCAGCCCTCAGrAacccT/3SpC3/(SEQ ID NO:59)

B21 CCCTCACGTTGGCGTCTGCTGrTacccA/3SpC3/(SEQ ID NO:60)

B22 CCCCTCACTCTGGAGTCTGCTGrCctccA/3SpC3/(SEQ ID NO:61)

B23 GCTGGGGTTGGAGTCGGCTGrCtcccA/3SpC3/(SEQ ID NO:62)

B24 CCACTCTGAAGATCCAGCGCACAGrAgcagC/3SpC3/(SEQ ID NO:63)

B25 CCACTCTCAAGATCCAGCCTGCAGrAgcttC/3SpC3/(SEQ ID NO:64)

B26 GCTCTGAGCTGAATGTGAACGCCTTGrTtgctC/3SpC3/(SEQ ID NO:65)

B27 CCCCCTCACTCTGGAGTCAGCTArCccgcA/3SpC3/(SEQ ID NO:66)

B28 CTTATTCCTTCACCTACACACCCTGCrAgccaC/3SpC3/(SEQ ID NO:67)

B29 CGCTCAGGCTGGAGTTGGCTGrCtcccA/3SpC3/(SEQ ID NO:68)

B30 CATTCTGAACTGAACATGAGCTCCTTGGrAgctgC/3SpC3/(SEQ ID NO:69)

B31 GCTCTGAGATGAATGTGAGCACCTTGrGagctC/3SpC3/(SEQ ID NO:70)

B32 CACTCTGACGATCCAGCGCACACrAgcagC/3SpC3/(SEQ ID NO:71)

B33 CCCTGATCCTGGAGTCGCCCArGccccT/3SpC3/(SEQ ID NO:72)

B34 CTTAAACCTTCACCTACACGCCCTGCrAgccaC/3SpC3/(SEQ ID NO:73)

B35 CTTGTCCACTCTGACAGTGACCAGTGrCccatG/3SpC3/(SEQ ID NO:74)

B36 CACCTTGGAGATCCAGCGCACAGrAgcagC/3SpC3/(SEQ ID NO:75)

B37 GCTCTGAGCTGAATGTGAACGCCTTGrGagctC/3SpC3/(SEQ ID NO:76)

B38 CAGCCTGGCAATCCTGTCCTCAGrAaccgC/3SpC3/(SEQ ID NO:77)

B39 CCACTCTGAAGATCCAGCCCTCAGrAacccT/3SpC3/(SEQ ID NO:78)

B40 CTACTCTGAAGGTGCAGCCTGCAGrAactgC/3SpC3/(SEQ ID NO:79)

B41 CCTCTCACTGTGACATCGGCCCrAaaagT/3SpC3/(SEQ ID NO:80)

B42 CACTCTGACGATCCAGCGCACAGrAgcagG/3SpC3/(SEQ ID NO:81)

B43 GCACTCTGAACTAAACCTGAGCTCTCTGrGagctC/3SpC3/(SEQ ID NO:82)

B44 CCACTCTGAAGTTCCAGCGCACACrAgcagC/3SpC3/(SEQ ID NO:83)

B45 CCTCCTCACTCTGGAGTCCGCTArCcagcA/3SpC3/(SEQ ID NO:84)

B46 CTCTACTCTGAAGATCCAGCGCACAGrAgcagC/3SpC3/(SEQ ID NO:85)

目前用于与10X基因组文库一起工作的通用引物是

/5InvddT/AATGATACGGCGACCACCGAGATCTACACTCTTTC CCTACACGACGCTCTTCCGATCT(SEQ ID NO:86)

RH-PCR TCR A和TCR B

引物混合物包含：

1.TE中100μM的5'封闭-TCR(反向-dT)引物

2.与rhPrimer TCR A(标A的管)和TCR B(标A的管)混合物(各25μM)1:1组合，然后稀释10倍

表1.RHPrimer PCR TCR AB反应混合物和PCR条件

3.等分成两个样品，并分别添加0.5μL的每一种引物混合物用于TCR-A和TCR-B。

4.使用如表2所示的循环运行Platinum Taq PCR。

表2.用于TCR-A和TCR-B样品的PCR参数。

5.循环25个循环。

6.以1:1的比例进行Ampure净化并用80％ETHO洗涤，用20μL EB缓冲液(10mM TrispH 8.5)洗脱。

PCR结果示于图7中。

7.因为platinum Taq在末端添加“A”，所有需要做的就是添加PNK以磷酸化5'末端。

8.对于每一个样品制备如下表3中的反应

表3.PNK反应混合物。

37℃，30分钟

65℃，20分钟

连接接头：

表4.连接反应

9.在室温下连接15分钟。

10.用1:1的比例进行Ampure净化，并用80％ETOH洗涤，用20μL EB缓冲液(10mMTris pH 8.5)洗脱

11.使用10μL的洗脱液进行PCR。

文库富集：

表5.文库富集反应和PCR参数。

PCR
		95℃	1分钟
95℃	15秒
		60℃	1秒
72℃	10秒
		4℃	持续

12个循环

结果

使用所描述的分析法对TCRα和TCRβRNA进行PCR扩增并且结果示于图9中。在泳道4和5中，PCR产物显示出正确的大小(在泳道5中具有额外的条带，较低MW)。PCR之后，如所述连接

接头，并且在TCRα和β(泳道2和3)中都可以看到正确的条带。

类似的方法已被用于扩增特定的CAR转基因，但不是连接

接头，而是使用索引PCR步骤。CAR序列的识别需要PCR方法，因为转基因本身的测序深度不足以识别哪些细胞是CAR阳性的。虽然显著更深的测序可能会解决这个问题，但所描述的方法要便宜得多，而且更可靠。

实施例2

使用合并的引物PCR富集用于T细胞受体α和β测序的cDNA

使用图3中描绘的一般方法的实施方式，通过个体和合并引物PCR扩增来富集T细胞受体α(TCRa)和β(TCRb)cDNA，以便能够进行后续测序。TCR引物最初单独测试，然后合并。在这些实验中使用了以下材料和方法。

方法

个体引物PCR

cDNA输入是源自人类PBMC的cDNA，按照推荐的指导通过10x Genomics3'RNAseq测定进行。

PCR条件：使用1U的platinum taq(Thermofisher Scientific,Waltham,MA)、1XPCR缓冲液(Thermofisher Scientific)、1.5mM MgCl₂、0.52mU RNAseH2(IDT)、100nM每种引物(Integrated DNA Technologies,Inc.(IDT),Coralville,IA)的25μl反应。PCR反应：94℃，2分钟，然后30个循环的94℃15秒，60℃(TCRα)/64℃(TCRβ)30秒，68℃1分钟。

使用100碱基阅读1和400碱基阅读2在MiSeq(Illumina,Inc.,San Diego,CA)上进行测序。使用MIXCR分析数据：Bolotin,D.、Poslavsky,S.、Mitrophanov,I.等，MiXCR：software for comprehensive adaptive immunity profiling.Nat Methods 12,380–381(2015)doi:10.1038/nmeth.3364。

合并引物PCR

单个TCRα引物以每个25nM合并。单独地，将TCRβ引物以每个25nM合并。对TCRα和TCRβ中的每一个进行单一PCR。

PCR条件：使用1U的platinum taq(Thermofisher Scientific)、1X PCR缓冲液(Thermofisher Scientific)、1.5mM MgCl₂、0.52mU RNAseH2(Integrated DNATechnologies,Inc.(IDT),Coralville,IA)，100nM反向通用引物(IDT)和25nM的每个TCR引物的库的25μl反应。PCR反应：94℃，2分钟，然后30个循环的94℃15秒，60℃(TCRα)/64℃(TCRβ)30秒，68℃1分钟。

PCR产物的纯化和测序

使用Ampure珠(Beckman Coulter Life Sciences，Indianapolis，IN)以1:1的比率纯化PCR产物。用多核苷酸激酶处理PCR产物并使用快速连接试剂盒(Quick LigationKit，NEB,Ipswich,MA)在37℃下30分钟，然后在65℃下20分钟连接到测序接头。PCR产物连接到以下双链寡聚物：5'GATCGGAAGAGCACACGT(SEQ ID NO:87)和5'GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO:88)。

用Ampure以1:1的比率纯化连接产物，随后使用MyTaq(Bioline MeridianBioscience,Memphis,TN)在25μl反应中进行PCR扩增，其中用200nM的各AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGAT*C*T(SEQ ID NO:89)和CAAGCAGAAGACGGCATACGAGATCGTCCATTGTGACTGGAGTTCAGACGTGTGCTCTTC(SEQ ID NO:90)，其中*＝硫代磷酸酯键。PCR条件为：95℃1分钟，然后是12个循环的95℃15秒，60℃1分钟，72℃10秒。

用Ampure以1:1的比率纯化PCR产物并用于在MiSeq(Illumina)上测序，使用的运行参数：阅读1，100个碱基，阅读2，400个碱基。对阅读片段进行质量修剪，并使用MIXCR分析所得数据：Bolotin,D.,Poslavsky,S.,Mitrophanov,I.等。MiXCR：software forcomprehensive adaptive immunity profiling.Nat Methods 12,380–381(2015)doi:10.1038/nmeth.3364。

MIXCR输出数据总结如下。

MIXCR输出数据：

分析日期：2019年4月23日星期二04:16:01UTC

输入文件：

/data/input/samples/231750570/JS296_S1_L001_R1_001.fastq.gz/data/input/samples/231750570/JS296_S1_L001_R2_001.fastq.gz

输出文件：

命令行参数：

总测序阅读数：4867049

成功比对阅读数：80353

成功比对，百分比：1.65％

由于没有V命中而失败的比对：4.53％

由于没有J命中而失败的比对：89.94％

因低总分而失败的比对：3.88％

重叠，百分比：7.72％

重叠且比对，百分比：0.33％

重叠且未比对，百分比：7.39％

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

分析日期：2019年4月23日星期二04:16:04UTC

输入文件：

输出文件：

命令行参数：

最终克隆型计数：2025

克隆型中使用的总阅读数：5678

使用的阅读，总数的百分比：0.12％

用作核心的阅读，使用数的百分比：50.16％

映射的低质量阅读，使用数的百分比：49.84％

在PCR误差校正中簇集的阅读，使用数的百分比：0.12％

通过PCR误差校正消除的克隆型：7

由于缺乏克隆序列而退出的阅读百分比：

由于低质量而退出的阅读百分比：0％

由于映射失败而退出的阅读百分比：0.17％

结果

单个(图10)和合并(图11)引物PCR反应均成功地用于本文所述方法的实施例中以在源自人PBMC的cDNA中富集TCRα和TCRβ序列。随后纯化并分析来自PCR反应的所得扩增子以确认TCRα和TCRβ序列的存在。

如本文所用，除非明确指出相反，否则不定冠词“一”和“一个”应理解为表示“至少一个”。

如本文所用，短语“和/或”应理解为意指如此相联的元素中的“任一或两者”，即在一些情况下结合存在而在其他情况下分离存在的元素。

还应该理解的是，除非明确指出相反，在本文描述的包含超过一个步骤或动作的任何方法中，该方法的步骤或动作的顺序不一定限于其中叙述了该方法的步骤或动作的顺序。

除非另有说明或从上下文和本领域普通技术人员的理解中明显看出，表示为范围的值可以假定在各种实施方式中所述范围内的任何特定值或子范围，除非上下文另有明确规定。

本文引用的所有专利、公开的申请和参考文献的教导通过引用整体并入。

虽然已经具体地示出和描述了示例性实施方式，但是本领域技术人员将理解，在不脱离所附权利要求所涵盖的实施方式的范围的情况下，可以在形式和细节上进行各种改变。

Claims

1.一种富集目标互补DNA(cDNA)的方法，包括以下步骤：

(a)提供多个不同的cDNA，其中每个cDNA在末端包含第一通用序列，并且其中所述多个cDNA包含待富集的目标cDNA；

(b)提供第一反应混合物，其包含：

1)包含与所述第一通用序列的全部或一部分互补的序列的第一通用寡核苷酸正向引物，和

2)至少一个基因特异性反向引物，其中所述至少一个基因特异性反向引物包含与所述目标cDNA中序列的全部或一部分互补的序列，并且在所述至少一个基因特异性引物的末端进一步包含至少一个第二通用序列；

(c)使所述多个cDNA与所述第一反应混合物接触；

(d)扩增所述目标cDNA以获得扩增子；

(e)提供第二反应混合物，其包含：

1)包含与所述第一通用序列的全部或一部分互补的序列的第二通用寡核苷酸正向引物，和

2)通用寡核苷酸反向引物，其中所述通用寡核苷酸反向引物包含与所述至少一个第二通用序列的全部或一部分互补的序列；从而富集所述目标cDNA；

(f)使所述扩增子与所述第二反应混合物接触；和

(g)扩增所述扩增子，从而富集所述目标cDNA。

2.如权利要求1所述的方法，其中所述多个cDNA中的每一个cDNA还包含细胞识别标签或独特的分子标识符(UMI)序列，或其组合。

3.如权利要求2所述的方法，其中所述细胞识别标签或UMI序列或其组合还包含聚(T)序列。

4.如权利要求1-3中任一项所述的方法，其中所述第一通用序列位于每一个cDNA分子的5'末端。

5.如权利要求1-3中任一项所述的方法，其中所述第一通用序列位于每一个cDNA分子的3'末端。

6.如权利要求1-5中任一项所述的方法，其中通过逆转录来自单个细胞的mRNA获得所述多个cDNA。

7.如权利要求1-6中任一项所述的方法，其中在(d)中扩增所述目标cDNA包括通过聚合酶链反应进行扩增。

8.如权利要求1-6中任一项所述的方法，其中所述至少一个基因特异性反向引物还包含通过RNA碱基与所述引物分隔开的封闭结构域。

9.如权利要求8所述的方法，其中(d)中扩增所述目标cDNA包括通过RNase H依赖性聚合酶链反应进行扩增。

10.如权利要求2-9中任一项所述的方法，其中所述细胞识别标签或所述UMI序列或其组合在所述目标cDNA扩增后被保持。

11.如权利要求1-10中任一项所述的方法，还包括使用所述通用寡核苷酸正向引物、所述通用寡核苷酸反向引物、所述至少一个基因特异性反向引物或其组合对所述目标cDNA的一个或多个部分进行测序。

12.一种富集目标互补DNA(cDNA)的方法，包括以下步骤：

(a)提供多个cDNA，其中每一个cDNA在末端包含第一通用序列，并且其中所述多个cDNA包含待富集的所述目标cDNA；

(b)提供第一反应混合物，其包含：

1)通用寡核苷酸正向引物，其包含与所述第一通用序列的全部或一部分互补的序列，和

2)基因特异性反向引物，其包含与所述目标cDNA中的序列互补的序列；

(c)使所述多个cDNA与所述第一反应混合物接触；

(d)扩增所述目标cDNA以获得第一扩增子；

(e)在所述第一扩增子中每一个目标cDNA的末端添加至少一个第二通用序列以获得缀合的扩增子；

(f)提供第二反应混合物，其包含：

1)通用寡核苷酸正向引物，其包含与所述第一通用序列的全部或一部分互补的序列，

(g)使所述缀合的扩增子与所述第二反应混合物接触；和

(h)扩增所述缀合的扩增子，从而富集所述目标cDNA。

13.如权利要求12所述的方法，其中所述多个cDNA中的每一个cDNA还包含细胞识别标签或独特的分子标识符(UMI)序列，或其组合。

14.如权利要求13所述的方法，其中所述细胞识别标签或UMI序列或其组合还包含聚(T)序列。

15.如权利要求12-14中任一项所述的方法，其中所述第一通用序列位于每一个cDNA分子的5'末端。

16.如权利要求12-14中任一项所述的方法，其中所述第一通用序列位于每一个cDNA分子的3'末端。

17.如权利要求12-16中任一项所述的方法，其中通过逆转录来自单个细胞的mRNA获得所述多个cDNA。

18.如权利要求12-17中任一项所述的方法，其中所述扩增步骤中的至少一个包括通过聚合酶链反应进行扩增。

19.如权利要求12-17中任一项所述的方法，其中所述基因特异性反向引物还包含通过RNA碱基与所述引物分隔开的封闭结构域。

20.如权利要求19所述的方法，其中所述扩增步骤中的至少一个包括通过RNase H依赖性聚合酶链反应进行扩增。

21.如权利要求12所述的方法，其中所述至少一个第二通用序列连接于与所述第一通用序列相对的所述第一扩增子的末端。

22.如权利要求12所述的方法，其中所述通用寡核苷酸正向引物的一个末端具有封闭基团，从而在所述一个末端阻断所述通用寡核苷酸正向引物的磷酸化。

23.如权利要求22所述的方法，其中所述封闭基团是反向dTTP。

24.如权利要求22-23中任一项所述的方法，其中所述封闭基团位于所述通用寡核苷酸正向引物的5'末端。

25.如权利要求12所述的方法，其中使用转座子添加所述至少一个第二通用序列。

26.如权利要求12所述的方法，其中通过将所述至少一个第二通用序列连接到所述第一扩增子中每一个目标cDNA的末端，通过引物延伸反应或通过核酸扩增反应或其组合添加所述至少一个第二通用序列。

27.如权利要求12所述的方法，其中通过将所述第一扩增子中的核酸分子片段化并将所述至少一个第二通用序列连接至所述片段、通过引物延伸反应或通过核酸扩增反应或其组合添加所述至少一个第二通用序列。

28.如权利要求12所述的方法，其中在与所述至少一个第一通用序列相反的末端添加所述至少一个第二通用序列。

29.如权利要求12-28中任一项所述的方法，其中所述细胞识别标签或所述UMI序列或其组合在所述目标cDNA的缀合扩增子扩增后被保持。

30.如权利要求12-29中任一项所述的方法，还包括使用所述通用寡核苷酸正向引物、所述通用寡核苷酸反向引物、所述基因特异性反向引物、基因特异性正向引物或它们的组合对目标cDNA的一个或多个部分进行测序。

31.一种富集目标互补DNA(cDNA)的方法，包括以下步骤：

(b)提供第一反应混合物，其包含：

至少一个基因特异性引物，其包含与所述目标cDNA中序列的全部或一部分互补的序列，并且在所述至少一个基因特异性引物的末端还包含至少一个第二通用序列；

(c)使所述多个cDNA与所述第一反应混合物接触，使得所述至少一个基因特异性引物与所述目标cDNA杂交；

(d)延伸所述至少一个基因特异性引物以获得至少一个延伸产物；

(e)提供第二反应混合物，其包含：

(f)使所述至少一个延伸产物与所述第二反应混合物接触；和

(g)扩增所述至少一个延伸产物，从而富集所述目标cDNA。

32.如权利要求31所述的方法，其中所述多个cDNA中的每一个cDNA还包含细胞识别标签或独特的分子标识符(UMI)序列或其组合。

33.如权利要求32所述的方法，其中所述细胞识别标签或UMI序列或其组合还包含聚(T)序列。

34.如权利要求31-33中任一项所述的方法，其中所述第一通用序列位于每一个cDNA分子的5'末端。

35.如权利要求31-33中任一项所述的方法，其中所述第一通用序列位于每一个cDNA分子的3'末端。

36.如权利要求31-35中任一项所述的方法，其中通过逆转录来自单个细胞的mRNA获得所述多个cDNA。

37.如权利要求31-36中任一项所述的方法，其中(g)中扩增所述至少一个延伸产物包括通过聚合酶链反应进行扩增。

38.如权利要求31-37中任一项所述的方法，其中在所述至少一个延伸产物扩增之后，所述细胞识别标签或所述UMI序列或其组合保持。

39.如权利要求31-38中任一项所述的方法，还包括使用所述通用寡核苷酸正向引物、所述通用寡核苷酸反向引物、所述基因特异性引物或其组合对所述目标cDNA的一个或多个部分进行测序。

40.如权利要求31-39中任一项所述的方法，其中所述第一反应混合物包含瓣状核酸内切酶活性缺陷的聚合酶。

41.如前述权利要求中任一项所述的方法，还包括对富集的目标cDNA进行测序的步骤。

42.一种富集目标互补DNA(cDNA)的方法，包括以下步骤：

(a)提供多个不同的cDNA，其中每一个cDNA在末端包含第一通用序列，并且其中所述多个cDNA包含待富集的所述目标cDNA；

(b)提供反应混合物，其包含：

2)至少一个基因特异性反向引物，其中所述至少一个基因特异性反向引物包含与所述目标cDNA中序列的全部或一部分互补的序列，并且在所述至少一个基因特异性引物的末端进一步包含至少一个第二通用序列，和

3)通用寡核苷酸反向引物，其中所述通用寡核苷酸反向引物包含与所述至少一个第二通用序列的全部或部分互补的序列；

(c)使所述多个cDNA与所述反应混合物接触；和

(d)扩增所述目标cDNA，从而富集所述目标cDNA。

43.如权利要求42所述的方法，其中所述多个cDNA中的每一个cDNA还包含细胞识别标签或独特的分子标识符(UMI)序列或其组合。

44.如权利要求43所述的方法，其中所述细胞识别标签或UMI序列或其组合还包含聚(T)序列。

45.如权利要求42-44中任一项所述的方法，其中所述第一通用序列位于每一个cDNA分子的5'末端。

46.如权利要求42-44中任一项所述的方法，其中所述第一通用序列位于每一个cDNA分子的3'末端。

47.如权利要求42-46中任一项所述的方法，其中通过逆转录来自单个细胞的mRNA获得所述多个cDNA。

48.如权利要求42-47中任一项所述的方法，其中(d)中扩增所述目标cDNA包括通过聚合酶链反应进行扩增。

49.如权利要求42-47中任一项所述的方法，其中所述至少一个基因特异性反向引物还包含通过RNA碱基与所述引物分隔开的封闭结构域。

50.如权利要求49所述的方法，其中(d)中扩增所述目标cDNA包括通过RNase H依赖性聚合酶链反应进行扩增。

51.如权利要求43-50中任一项所述的方法，其中所述细胞识别标签或所述UMI序列或其组合在所述目标cDNA扩增后保持。

52.如权利要求42-51中任一项所述的方法，其进一步包括使用所述通用寡核苷酸正向引物、所述通用寡核苷酸反向引物、所述至少一个基因特异性反向引物或其组合对所述目标cDNA的一个或多个部分进行测序。