CN112243461B

CN112243461B - 在相对的转录物末端进行分子条形码化

Info

Publication number: CN112243461B
Application number: CN201980037342.1A
Authority: CN
Inventors: 艾琳·夏姆; 克里斯蒂娜·范
Original assignee: Becton Dickinson and Co
Current assignee: Becton Dickinson and Co
Priority date: 2018-05-03
Filing date: 2019-05-01
Publication date: 2024-07-12
Anticipated expiration: 2039-05-01

Abstract

本文公开了用于在核酸靶的5’末端进行分子条形码化的系统、方法、组合物和试剂盒。在使用包含靶结合区和分子标记的寡核苷酸条形码对核酸靶进行条形码化以产生经条形码化的核酸分子之后，可以添加包含所述靶结合区的互补体的寡核苷酸以产生包含所述靶结合区和所述靶结合区的所述互补体的经条形码化的核酸分子。通过所述经条形码化的核酸分子的分子内杂交形成茎环，可以将所述茎环延伸以产生包含所述分子标记和所述分子标记的互补体的经延伸的经条形码化的核酸分子。

Description

在相对的转录物末端进行分子条形码化

相关申请

本申请要求2018年5月3日提交的美国临时申请号62/666,506的权益，将其通过引用以其全部内容并入本文。

技术领域

本公开内容一般涉及分子生物学领域，特别涉及使用分子条形码化的多组学分析。

背景技术

诸如分子条形码化的方法和技术对于单细胞转录组学分析是有用的，特别是使用例如逆转录、聚合酶链式反应(PCR)扩增、和下一代测序(NGS)来解密基因表达谱以确定细胞的状态。分子条形码化还可用于单细胞蛋白质组学分析。

发明内容

本文公开了用于将寡核苷酸条形码附接至样品中的靶的方法。举例来说，靶可以包含核酸靶，基本上由核酸靶组成或由核酸靶组成。在一些实施例中，所述方法包括：使用多个寡核苷酸条形码对样品中的核酸靶的拷贝进行条形码化，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含所述核酸靶的序列、分子标记和靶结合区，并且其中所述多个寡核苷酸条形码中的至少10个包含不同的分子标记序列；将包含所述靶结合区的互补体的寡核苷酸附接至所述多个经条形码化的核酸分子，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含所述靶结合区和所述靶结合区的互补体；使所述多个经条形码化的核酸分子中的每一个内的所述靶结合区和所述靶结合区的互补体杂交以形成茎环；并且延伸所述多个经条形码化的核酸分子的3’末端以延伸所述茎环，以产生多个经延伸的经条形码化的核酸分子，每个经延伸的经条形码化的核酸分子包含所述分子标记和所述分子标记的互补体。任选地，所述方法进一步包括扩增所述多个经条形码化的核酸分子以产生多个经扩增的经条形码化的核酸分子。附接包含靶结合区的互补体的寡核苷酸可以包括将寡核苷酸附接到多个经扩增的经条形码化的核酸分子，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含靶结合区和靶结合区的互补体。任选地，所述方法进一步包括扩增多个经延伸的经条形码化的核酸分子。样品中的核酸靶的数量可以在扩增多个经延伸的经条形码化的核酸分子之后确定。在一些实施例中，所述方法包括：基于与多个经延伸的经条形码化的核酸分子相关联的具有不同序列的分子标记、其互补序列或其组合的数量，确定样品中的核酸靶的数量。在一些实施例中，所述方法包括：基于与多个经延伸的经条形码化的核酸分子相关联的具有不同序列的分子标记的数量，确定样品中的核酸靶的数量。

本文公开了用于确定样品中的靶数量的方法。举例来说，靶可以包含核酸，基本上由核酸组成或由核酸组成。在一些实施例中，所述方法包括：使用多个寡核苷酸条形码对样品中的核酸靶的拷贝进行条形码化，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含所述核酸靶的序列、分子标记和靶结合区，并且其中所述多个寡核苷酸条形码中的至少10个包含不同的分子标记序列；将包含所述靶结合区的互补体的寡核苷酸附接至所述多个经条形码化的核酸分子，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含所述靶结合区和所述靶结合区的互补体；使所述多个经条形码化的核酸分子中的每一个内的所述靶结合区和所述靶结合区的互补体杂交以形成茎环；延伸所述多个经条形码化的核酸分子的3’末端以延伸所述茎环，以产生多个经延伸的经条形码化的核酸分子，每个经延伸的经条形码化的核酸分子包含所述分子标记和所述分子标记的互补体；并且基于与多个经延伸的经条形码化的核酸分子相关联的具有不同序列的分子标记的互补序列的数量，确定样品中的核酸靶的数量。任选地，所述方法进一步包括扩增所述多个经条形码化的核酸分子以产生多个经扩增的经条形码化的核酸分子。附接包含靶结合区的互补体的寡核苷酸可以包括将寡核苷酸附接到多个经扩增的经条形码化的核酸分子，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含靶结合区和靶结合区的互补体。任选地，所述方法进一步包括扩增多个经延伸的经条形码化的核酸分子。样品中的核酸靶的数量可以在扩增多个经延伸的经条形码化的核酸分子之后确定。在一些实施例中，所述方法包括基于与多个经延伸的经条形码化的核酸分子相关联的具有不同序列的分子标记、其互补序列或其组合的数量，确定样品中的核酸靶的数量。

在一些实施例中，本文描述的方法中的任一个包括对多个靶的拷贝进行条形码化，包括：使所述核酸靶的拷贝与所述多个寡核苷酸条形码接触，其中所述多个寡核苷酸条形码中的每一个包含能够与所述核酸靶杂交的靶结合区；并且延伸与寡核苷酸条形码杂交的核酸靶的拷贝，以产生多个经条形码化的核酸分子。在一些实施例中，本文描述的方法中的任一个包括：对所述多个靶的拷贝进行条形码化包括：使核酸靶的拷贝与多个寡核苷酸条形码接触，其中多个寡核苷酸条形码中的每一个包含靶结合区。靶结合区可以与核酸靶杂交。所述方法可以进一步包括延伸与寡核苷酸条形码杂交的核酸靶的拷贝，以产生多个经条形码化的核酸分子。

在一些实施例中，本文描述的方法中的任一个包括：扩增多个经条形码化的核酸分子以产生多个经扩增的经条形码化的核酸分子，其中将包含靶结合区的互补体的寡核苷酸附接包括：将包含靶结合区的互补体的寡核苷酸附接至所述多个经扩增的经条形码化的核酸分子，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含靶结合区和靶结合区的互补体。

在一些实施例中，本文描述的方法中的任一个包括：扩增多个经延伸的经条形码化的核酸分子，以产生多个经单标记的核酸分子，每个经单标记的核酸分子包含分子标记的互补体，其中确定样品中的核酸靶的数量包括：基于与所述多个经单标记的核酸分子相关联的具有不同序列的分子标记的互补序列的数量，确定所述样品中的所述核酸靶的数量。

在一些实施例中，所述方法包括：扩增多个经延伸的经条形码化的核酸分子，以产生多个经延伸的经条形码化的核酸分子的拷贝，其中确定样品中的核酸靶的数量包括：基于与所述多个经延伸的经条形码化的核酸分子的拷贝相关联的具有不同序列的分子标记的互补序列的数量，确定所述样品中的所述核酸靶的数量。

本文公开了用于确定样品中的核酸靶数量的方法。在一些实施例中，所述方法包括：使样品中的核酸靶的拷贝与多个寡核苷酸条形码接触，其中所述多个寡核苷酸条形码中的每个包含分子标记和能够与所述核酸靶杂交的靶结合区，并且其中所述多个寡核苷酸条形码中的至少10个包含不同的分子标记序列；延伸与所述寡核苷酸条形码杂交的核酸靶的拷贝以产生多个核酸分子，每个核酸分子包含与所述核酸靶的至少一部分互补的序列；扩增多个经条形码化的核酸分子以产生多个经扩增的经条形码化的核酸分子；将包含所述靶结合区的互补体的寡核苷酸附接至所述多个经扩增的经条形码化的核酸分子，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含所述靶结合区和所述靶结合区的互补体；使所述多个经条形码化的核酸分子中的每一个内的所述靶结合区和所述靶结合区的互补体杂交以形成茎环；延伸所述多个经条形码化的核酸分子的3’末端以延伸所述茎环，以产生多个经延伸的经条形码化的核酸分子，每个经延伸的经条形码化的核酸分子包含所述分子标记和所述分子标记的互补体；扩增所述多个经延伸的经条形码化的核酸分子，以产生多个经单标记的核酸分子，每个经单标记的核酸分子包含所述分子标记的所述互补体；并且基于与多个经单标记的核酸分子相关联的具有不同序列的分子标记的互补序列的数量，确定样品中的核酸靶的数量。

在一些实施例中，对于本文所述的方法中的任一个，在延伸多个经条形码化的核酸分子的3’末端之后，将分子标记与分子标记的互补体杂交，所述方法包括使多个经延伸的经条形码化的核酸分子变性，之后扩增多个经延伸的经条形码化的核酸分子以产生多个经单标记的核酸分子。使样品中的核酸靶的拷贝接触可以包括使多个核酸靶的拷贝接触多个寡核苷酸条形码。延伸核酸靶的拷贝可包括延伸与寡核苷酸条形码杂交的多个核酸靶的拷贝，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含与多个核酸靶中之一的至少一部分互补的序列。确定核酸靶的数量可包括基于与包含多个核酸靶中的每一个的序列的多个经单标记的核酸分子的经单标记的核酸分子相关联的具有不同序列的分子标记的互补序列的数量，确定样品中的多个核酸靶中各自的数量。多个核酸靶中的每个的序列可以包含多个核酸靶中的每个的子序列。

在一些实施例中，对于本文所述的方法中的任一个，多个经条形码化的核酸分子中的核酸靶的序列包含核酸靶的子序列。靶结合区可包含基因特异性序列。附接包含靶结合区的互补体的寡核苷酸可以包括将包含靶结合区的互补体的寡核苷酸与多个经条形码化的核酸分子连接。

在一些实施例中，对于本文所述的方法中的任一个，靶结合区可包含聚(dT)序列，其中附接包含靶结合区的互补体的寡核苷酸包括：使用末端脱氧核苷酸转移酶将多个腺苷一磷酸添加至所述多个经条形码化的核酸分子。

在一些实施例中，对于本文所述的方法中的任一个，延伸与寡核苷酸条形码杂交的核酸靶的拷贝可包括逆转录与寡核苷酸条形码杂交的核酸靶的拷贝以产生多个经条形码化的互补脱氧核糖核酸(cDNA)分子。延伸与寡核苷酸条形码杂交的核酸靶的拷贝可包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中至少一种的DNA聚合酶延伸与寡核苷酸条形码杂交的核酸靶的拷贝。DNA聚合酶可以包含克列诺(Klenow)片段。

在一些实施例中，本文描述的方法中的任一个包括：获得所述多个经延伸的经条形码化的核酸分子的序列信息。获得序列信息可以包括将测序衔接子附接到多个经延伸的经条形码化的核酸分子。

在一些实施例中，对于本文所述的方法中的任一个，靶结合区的互补体可包含靶结合区的反向互补序列。靶结合区的互补体可以包含靶结合区的互补序列。分子标记的互补体可以包含分子标记的反向互补序列。分子标记的互补体可以包含分子标记的互补序列。

在一些实施例中，对于本文所述的方法中的任一个，多个经条形码化的核酸分子可包含经条形码化的脱氧核糖核酸(DNA)分子。经条形码化的核酸分子可以包含经条形码化的核糖核酸(RNA)分子。核酸靶可以包含核酸分子。核酸分子可包含核糖核酸(RNA)、信使RNA(mRNA)、微小RNA、小干扰RNA(siRNA)、RNA降解产物、包含聚(A)尾的RNA、或其任意组合。

在一些实施例中，对于本文所述的方法中的任一个，核酸靶可包含细胞组分结合试剂。核酸分子可以与细胞组分结合试剂相关联。所述方法可以包括：使所述核酸分子和所述细胞组分结合试剂解离。

在一些实施例中，对于本文所述的方法中的任一个，多个寡核苷酸条形码的每个分子标记包含至少6个核苷酸。寡核苷酸条形码可以包含相同的样品标记。多个寡核苷酸条形码的每个样品标记可包含至少6个核苷酸。寡核苷酸条形码可以包含相同的细胞标记。多个寡核苷酸条形码的每个细胞标记可包含至少6个核苷酸。

在一些实施例中，对于本文所述的方法中的任一个，当使多个经条形码化的核酸分子中的每个之内的靶结合区和靶结合区的互补体杂交形成茎环时，多个经条形码化的核酸分子中的至少一个与固体支持物相关联。当使多个经条形码化的核酸分子中的每个之内的靶结合区和靶结合区的互补体杂交形成茎环时，多个经条形码化的核酸分子中的至少一个可以与固体支持物解离。当使多个经条形码化的核酸分子中的每个之内的靶结合区和靶结合区的互补体杂交形成茎环时，多个经条形码化的核酸分子中的至少一个可以与固体支持物相关联。

在一些实施例中，对于本文所述的方法中的任一个，当延伸多个经条形码化的核酸分子的3’末端以延伸茎环从而产生多个经延伸的经条形码化的核酸分子(每个经延伸的经条形码化的核酸分子包含分子标记和分子标记的互补体)时，多个经条形码化的核酸分子中至少一个与固体支持物相关联。当延伸多个经条形码化的核酸分子的3’末端以延伸茎环从而产生多个经延伸的经条形码化的核酸分子(每个经延伸的经条形码化的核酸分子包含分子标记和分子标记的互补体)时，多个经条形码化的核酸分子中至少一个可以与固体支持物解离。当延伸多个经条形码化的核酸分子的3’末端以延伸茎环从而产生多个经延伸的经条形码化的核酸分子(每个经延伸的经条形码化的核酸分子包含分子标记和分子标记的互补体)时，多个经条形码化的核酸分子中至少一个可以与固体支持物相关联。固体支持物可以包含合成颗粒。固体支持物可包含平坦表面(例如载玻片，例如显微镜载玻片和盖玻片)。在一些实施例中，本文描述的溶液可以分配在包含不超过一个细胞的分配区中。分配区可以包括以下中的至少之一：微滴，孔(例如，微孔)，例如在基底上的孔，或流体装置例如微流体装置的腔室。所述微滴可包含水凝胶。

在一些实施例中，对于本文所述的方法中的任一个，当使多个经条形码化的核酸分子中的每个之内的靶结合区和靶结合区的互补体杂交形成茎环时，多个经条形码化的核酸分子中的至少一个处于溶液中。当延伸多个经条形码化的核酸分子的3’末端以延伸茎环从而产生多个经延伸的经条形码化的核酸分子(每个经延伸的经条形码化的核酸分子包含分子标记和分子标记的互补体)时，多个经条形码化的核酸分子中至少一个可以处于溶液中。

在一些实施例中，对于本文所述的方法中的任一个，样品包含单细胞，所述方法包括使包含多个寡核苷酸条形码的合成颗粒与样品中的单细胞相关联合。所述方法可以包括：在将所述合成颗粒与所述单细胞相关联之后，裂解所述单细胞。裂解单细胞可以包括将样品加热、使样品与洗涤剂接触、改变样品的pH、或其任何组合。合成颗粒和单细胞可以在相同的孔中。合成颗粒和单细胞可以在相同的滴中。

在一些实施例中，对于本文所述的方法中的任一个，可以将多个寡核苷酸条形码中的至少一个固定在合成颗粒上。多个寡核苷酸条形码中的至少一个可以部分地固定在合成颗粒上。多个寡核苷酸条形码中的至少一个可以封闭在合成颗粒中。多个寡核苷酸条形码中的至少一个可以部分地封闭在合成颗粒中。合成颗粒可以是可破坏的。合成颗粒可以包含珠。珠可以包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。合成颗粒可以包含选自下组的材料，该组由以下组成：聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、琼脂糖凝胶、纤维素、尼龙、硅酮、及其任何组合。合成颗粒可以包含可破坏的水凝胶颗粒。多个寡核苷酸条形码中的每一个可以包含接头官能团。合成颗粒可以包含固体支持物官能团。支持物官能团和接头官能团可以彼此相关联。接头官能团和支持物官能团可以单独地选自下组，该组由以下组成：C6、生物素、链霉亲和素、一个或多个伯胺、一个或多个醛、一个或多个酮、及其任何组合。

本文公开了试剂盒，其用于将寡核苷酸条形码附接至样品中的靶，确定样品中的靶数量和/或确定样品中的核酸靶数量。在一些实施例中，试剂盒包括：多个寡核苷酸条形码，其中所述多个寡核苷酸条形码中的每个包含分子标记和靶结合区，并且其中所述多个寡核苷酸条形码中的至少10个包含不同的分子标记序列；末端脱氧核苷酸转移酶或连接酶；以及缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶。试剂盒可进一步包含多个寡核苷酸，所述多个寡核苷酸包含靶结合区的互补体。包含所述靶结合区的所述互补体的所述多个寡核苷酸被配置为附接至DNA分子例如cDNA分子的3’末端。DNA聚合酶可以包含克列诺(Klenow)片段。试剂盒可包含缓冲液。试剂盒可包含柱体。试剂盒可包含用于逆转录反应的一种或多种试剂。试剂盒可包含用于扩增反应的一种或多种试剂。

在一些实施例中，对于本文所述的任何试剂盒或方法，靶结合区包含基因特异性序列、寡聚(dT)序列、随机多聚体、或其任何组合。寡核苷酸条形码可以包含相同的样品标记和/或相同的细胞标记。多个寡核苷酸条形码的每个样品标记和/或细胞标记可包含至少6个核苷酸。多个寡核苷酸条形码的每个分子标记可包含至少6个核苷酸。

在一些实施例中，对于本文所述的任何试剂盒或方法，多个寡核苷酸条形码中的至少一个固定在合成颗粒上。多个寡核苷酸条形码中的至少一个可以部分地固定在合成颗粒上。多个寡核苷酸条形码中的至少一个可以封闭在合成颗粒中。多个寡核苷酸条形码中的至少一个可以部分地封闭在合成颗粒中。合成颗粒可以是可破坏的。合成颗粒可以包含珠。珠可以包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。合成颗粒可以包含选自下组的材料，该组由以下组成：聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、琼脂糖凝胶、纤维素、尼龙、硅酮、及其任何组合。合成颗粒可以包含可破坏的水凝胶颗粒。多个寡核苷酸条形码中的每一个可以包含接头官能团。合成颗粒可以包含固体支持物官能团。支持物官能团和接头官能团可以彼此相关联。接头官能团和支持物官能团可以单独地选自下组，该组由以下组成：C6、生物素、链霉亲和素、一个或多个伯胺、一个或多个醛、一个或多个酮、及其任何组合。

附图说明

图1示出了一些实施例的非限制性示例性条形码。

图2示出了一些实施例的条形码化和数字计数的非限制性示例性工作流程。

图3是示出了根据一些实施例用于从多个靶产生在3’末端条形码化的靶的索引文库的非限制性示例性过程的示意图。

图4A-4B示出了一些实施例的在5’末端上基因特异性地标记核酸靶的非限制性示例性方法的示意图。

图5A-5B示出了针对一些实施例的全转录组分析在5’末端上标记核酸靶的非限制性示例性方法的示意图。

具体实施方式

在以下详细描述中参考附图，附图形成在此的一部分。在图中，类似的符号典型地鉴别类似的部件，除非上下文另外规定。在详细描述、图示以及权利要求书中所描述的说明性实施例并不意图进行限制。在不脱离在此呈现的主题精神或范围的情况下，可以采用其他实施例，并且可做出其他改动。易于理解的是，如在此总体所述的和在附图中示出的本披露的方面可以各种的不同构造方式进行布置、取代、组合、分隔和设计，所有这些明显是涵盖于此的并且组成在此的披露内容的一部分。

所有专利、公开的专利申请、其他出版物和GenBank上的序列以及此处引用的其他数据库就相关技术而言均通过引用的方式完整地结合。

量化少量核酸(例如信使核糖核酸(mRNA)分子)在临床上对于确定例如在不同发育阶段或在不同环境条件下在细胞中表达的基因非常重要。然而，确定核酸分子(例如，mRNA分子)的绝对数量也是非常具有挑战性的，尤其是当分子数量非常小时。确定样品中分子绝对数量的一种方法是数字聚合酶链式反应(PCR)。理想情况下，PCR在每个循环中产生相同的分子拷贝。但是，PCR可能具有缺点，即每个分子均以随机概率复制，并且该概率随PCR周期和基因序列而变化，从而导致扩增偏差和基因表达测量不准确。具有独特分子标记(也称为分子索引(MI))的随机条形码可用于计算分子数量并校正扩增偏差。诸如Precise^TM测定(细胞研究公司(Cellular Research,Inc.)(帕洛阿尔托，加利福尼亚))和Rhapsody^TM测定(贝克顿迪金森公司(Becton,Dickinson and Company)(富兰克林湖，新泽西州))的随机条形码化可以通过使用分子标记(ML)在逆转录(RT)期间标记mRNA来校正由PCR和文库制备步骤诱导的偏差。需要用于对核酸靶分子在5’末端和3’末端之一或两者上进行分子条形码化的方法和技术。

Precise^TM测定可利用具有大量的(例如6561至65536个)随机条形码的非耗尽性池、聚(T)寡核苷酸上的独特分子标记序列，以在RT步骤期间与样品中的所有聚(A)-mRNA杂交。随机条形码可包括通用PCR引发位点。在RT期间，靶基因分子与随机条形码随机地反应。每个靶分子可以与随机条形码杂交，从而产生经随机经条形码化的互补核糖核苷酸(cDNA)分子。在标记后，可将来自微孔板微孔的经随机经条形码化的cDNA分子合并到单个管中用于PCR扩增和测序。可以分析原始测序数据以产生读段数量、具有独特分子标记序列的随机条形码数量以及mRNA分子数量。

本文公开了用于将寡核苷酸条形码附接至样品中的靶的方法。在一些实施例中，所述方法包括：使用多个寡核苷酸条形码对样品中的核酸靶的拷贝进行条形码化，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含所述核酸靶的序列、分子标记和靶结合区，并且其中所述多个寡核苷酸条形码中的至少10个包含不同的分子标记序列；将包含所述靶结合区的互补体的寡核苷酸附接至所述多个经条形码化的核酸分子，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含所述靶结合区和所述靶结合区的互补体；使所述多个经条形码化的核酸分子中的每一个内的所述靶结合区和所述靶结合区的互补体杂交以形成茎环；并且延伸所述多个经条形码化的核酸分子的3’末端以延伸所述茎环，以产生多个经延伸的经条形码化的核酸分子，每个经延伸的经条形码化的核酸分子包含所述分子标记和所述分子标记的互补体。

本文公开了用于确定样品中的靶数量的方法。在一些实施例中，所述方法包括：使用多个寡核苷酸条形码对样品中的核酸靶的拷贝进行条形码化，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含所述核酸靶的序列、分子标记和靶结合区，并且其中所述多个寡核苷酸条形码中的至少10个包含不同的分子标记序列；将包含所述靶结合区的互补体的寡核苷酸附接至所述多个经条形码化的核酸分子，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含所述靶结合区和所述靶结合区的互补体；使所述多个经条形码化的核酸分子中的每一个内的所述靶结合区和所述靶结合区的互补体杂交以形成茎环；延伸所述多个经条形码化的核酸分子的3’末端以延伸所述茎环，以产生多个经延伸的经条形码化的核酸分子，每个经延伸的经条形码化的核酸分子包含所述分子标记和所述分子标记的互补体；并且基于与多个经延伸的经条形码化的核酸分子相关联的具有不同序列的分子标记的互补序列的数量，确定样品中的核酸靶的数量。

本文公开了试剂盒，其用于将寡核苷酸条形码附接至样品中的靶，确定样品中的靶数量和/或确定样品中的核酸靶数量。在一些实施例中，试剂盒包括：多个寡核苷酸条形码，其中所述多个寡核苷酸条形码中的每个包含分子标记和靶结合区，并且其中所述多个寡核苷酸条形码中的至少10个包含不同的分子标记序列；末端脱氧核苷酸转移酶或连接酶；以及缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶。DNA聚合酶可以包含克列诺(Klenow)片段。试剂盒可包含缓冲液。试剂盒可包含柱体。试剂盒可包含用于逆转录反应的一种或多种试剂。试剂盒可包含用于扩增反应的一种或多种试剂。

除非另有定义，否则在此所使用的技术和科学术语具有与本披露所属领域的普通技术人员通常理解的相同的含义。本领域普通技术人员可获得的参考文献的实例包括，Singleton等人,Dictionary of Microbiology and Molecular Biology[微生物学和分子生物学词典]第2版,约翰·威利父子出版公司(J.Wiley&Sons)(纽约,纽约州1994)；Sambrook等人，分子克隆实验室手册(Molecular Cloning,A Laboratory Manual)，冷泉港出版社(Cold Springs Harbor Press)(纽约冷泉港(Cold Springs Harbor,NY)1989)。

如本文所使用的，鉴于本说明书，术语“衔接子”在本领域中具有其习惯和普通含义。它可以指促进相关联的核酸的扩增或测序的序列。关联的核酸可以包括靶核酸。关联的核酸可以包含空间标记、靶记、样品标记、索引标记或条形码序列(例如，分子标记)中的一个或多个。衔接子可以是线性的。衔接子可以是预腺苷酸化的衔接子。衔接子可以是双链或单链的。一个或多个衔接子可以位于核酸的5’或3’端上。当衔接子包含在5’和3’端上的已知序列时，已知序列可以是相同或不同的序列。位于多核苷酸的5’和/或3’端上的衔接子可以能够与固定在表面上的一个或多个寡核苷酸杂交。在一些实施例中，衔接子可以包含通用序列。通用序列可以是两个或更多个核酸分子共有的核苷酸序列区域。两个或更多个核酸分子还可以具有不同序列区域。因此，例如，5’衔接子可以包含相同和/或通用核酸序列并且3’衔接子可以包含相同和/或通用序列。可以存在于多个核酸分子的不同成员中的通用序列可以允许使用与通用序列互补的单一通用引物复制或扩增多个不同的序列。类似地，可以存在于核酸分子集合体的不同成员中的两个(例如一对)或更多个通用序列可以允许使用与通用序列互补的至少一个、两个(例如一对)或更多个通用引物复制或扩增多个不同的序列。因此，通用引物包含可与这种通用序列杂交的序列。具有靶核酸序列的分子可以被修饰成将通用衔接子(例如，非靶核酸序列)连接到不同的靶核酸序列的一端或两端。连接到靶核酸的一个或多个通用引物可以为通用引物的杂交提供位点。连接到靶核酸的一个或多个通用引物可以是彼此相同或不同的。

如本文所使用的，鉴于本说明书，术语“相关联”或“与……相关联”在本领域中具有其习惯和普通含义。它可以意指两个或更多个物质在某一时间点可识别为共定位。关联可以意指两个或更多个物质在或曾经在类似容器内。关联可以是信息学关联。例如关于两个或更多个物质的数字信息可以被存储并且可以用于确定一个或多个物质在某一时间点共定位。关联还可以是物理关联。在一些实施例中，两个或更多个关联的物质彼此“系接”、“连接”或“固定”，或“系接”、“连接”或“固定”至共同的固体或半固体表面。关联可以是指用于将标记连接到固体或半固体支持物诸如珠上的共价或非共价方式。关联可以是靶与标记之间的共价键。关联可以包括两个分子(例如靶分子和标记)之间的杂交。

如本文所使用的，鉴于本说明书，术语“互补”在本领域中具有其习惯和普通含义。它可以是指两个核苷酸之间精确配对的能力。例如，如果核酸的指定位置处的核苷酸能够与另一个核酸的核苷酸氢键结合，则认为两个核酸在那一位置是彼此互补的。两个单链核酸分子之间的互补性可以是“部分的”，其中仅一些核苷酸结合，或者当单链分子之间存在总体互补性时该结合可以是完全的。如果第一核苷酸序列与第二核苷酸序列互补，则可以称为第一核苷酸序列是第二序列的“互补序列”。如果第一核苷酸序列与反向(即核苷酸的次序是相反的)于第二序列的序列互补，则可以称为第一核苷酸序列是第二序列的“反向互补序列”。如本文所用，“互补”序列可以指序列的“互补”或“反向互补”。从本披露中理解的是，如果分子可以与另一个分子杂交，则它可以与正在杂交的分子互补或部分互补。

如在此所用，术语“数字计数”可以是指用于估计样品中靶分子的数量的方法。数字计数可以包括确定已与样品中的靶关联的独特标记数量的步骤。所述方法本质上可以是随机的，其将计数分子的问题从定位并识别相同分子的一个问题转变成关于检测一组预先定义的标记的一系列是/否数字问题。

如本文所用，鉴于本说明书，术语“标记”或“多个标记”在本领域中具有其习惯和普通含义。它可以指与样品中的靶相关联的核酸代码。标记可以是例如核酸标记。标记可以是整体或部分可扩增的标记。标记可以是整体或部分可测序的标记。标记可以是天然核酸中可鉴定为不同的一部分。标记可以是已知序列。标记可以包括核酸序列的接合点，例如天然序列和非天然序列的接合点。如在此所用，术语“标记”可以与术语“索引”、“标签”或“标记-标签”互换使用。标记可以传达信息。例如，在不同的实施例中，标记可用于确定样品身份、样品来源、细胞身份和/或靶。

如在此所用，术语“非消耗贮存池(non-depleting reservoirs)”可以是指由许多不同的标记构成的条形码(例如，随机条形码)池。非消耗贮存池可以包含大量的不同条形码，使得当非消耗贮存池与靶库相关联时，每个靶很可能与独特的条形码相关联。每个标记的靶分子的独特性可以通过随机选择的统计学确定，并且取决于与标记的多样性相比集合体中相同靶分子的拷贝数。所得到的标记的靶分子组的大小可以通过条形码化过程的随机性质和检测到的条形码的数量分析确定，然后允许计算原始集合体或样品中存在的靶分子的数量。当存在的靶分子的拷贝数与独特的条形码的数量的比率较低时，标记的靶分子是高度独特的(即用指定的标记来标记一个以上的靶分子的可能性非常低)。

如本文所使用的，鉴于本说明书，术语“核酸”在本领域中具有其习惯和普通含义。它是指多核苷酸序列或其片段。核酸可以包括核苷酸。核酸对细胞可以是外源性或内源性的。核酸可以存在于无细胞环境中。核酸可以是基因或其片段。核酸可以是DNA。核酸可以是RNA。核酸可以包括一个或多个类似物(例如改变的骨架、糖或核碱基)。类似物的一些非限制性实例包括：5-溴尿嘧啶、肽核酸、xeno核酸、吗啉化合物、锁核酸、二醇核酸、苏糖核酸、双脱氧核苷酸、蛹虫草菌素、7-脱氮-GTP、荧光团(例如，连接至糖的罗丹明或荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化的核苷酸、肌苷、硫尿苷、假尿苷、二氢尿苷、辫苷以及怀俄苷。“核酸”、“多核苷酸”、“靶多核苷酸”和“靶核酸”可以互换使用。

核酸可以包含一个或多个修饰(例如，碱基修饰、骨架修饰)以提供具有新的或增强的特征(例如，改善的稳定性)的核酸。核酸可以包含核酸亲和标签。核苷可以是碱基-糖组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两种最常见的种类是嘌呤和嘧啶。核苷酸可以是进一步包含共价连接至核苷的糖部分的磷酸酯基团的核苷。对于包含戊呋喃糖的那些核苷，磷酸酯基团可以连接至糖的2’、3’或5’羟基部分。在形成核酸时，磷酸酯基团可以共价连接彼此相邻的核苷以形成线性聚合化合物。进而，该线性聚合化合物的对应末端可以进一步连接以形成环状化合物；然而，线性化合物通常是适合的。此外，线性化合物可以具有内部的核苷酸碱基互补性并且因此可以便于产生完全或部分双链化合物的方式折叠。在核酸内，磷酸酯基团可以通常涉及形成核酸的核苷间骨架。键联或骨架可以是3’至5’磷酸二酯键。

核酸可以包含修饰的骨架和/或修饰的核苷间键联。修饰的骨架可以包括在骨架中保留磷原子的那些和在骨架中不具有磷原子的那些。其中含有磷原子的适合的修饰的核酸骨架可以包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基以及其他烷基膦酸酯(诸如3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯)、亚膦酸酯、氨基磷酸酯(包括3’-氨基氨基磷酸酯和氨基烷基氨基磷酸酯、二氨基磷酸酯)、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基膦酸三酯、硒代磷酸酯以及具有正常3’-5’键联、2’-5’键联类似物的硼烷磷酸酯，以及具有其中一个或多个核苷酸间键联是3’至3’、5’至5’或2’至2’键联的反向极性的那些。

核酸可以包含这样的多核苷酸骨架，这些多核苷酸骨架通过短链烷基或环烷基核苷间键联、混合杂原子以及烷基或环烷基核苷间键联、或一个或多个短链杂原子或杂环核苷间键联形成。这些骨架可以包括具有以下各项的那些：吗啉代键联(部分地从核苷的糖部分中形成)；硅氧烷骨架；硫化物、亚砜和砜骨架；甲酰乙酰基和硫代甲酰乙酰基骨架；亚甲基甲酰乙酰基和硫代甲酰乙酰基骨架；核乙酰基(riboacetyl)骨架；含烯烃的骨架；氨基磺酸酯骨架；亚甲基亚氨基和亚甲基肼基骨架；磺酸酯和磺酰胺骨架；酰胺骨架；以及具有混合的N、O、S和CH₂组分的其他骨架。

核酸可以包括核酸模拟物。术语“模拟物”可以旨在包括这样的多核苷酸，其中仅呋喃糖环或呋喃糖环和核苷酸间键联两者被非呋喃糖基团置换，仅呋喃糖环的置换也可以称之为糖替代物。杂环碱基部分或修饰的杂环碱基部分可以被保持以用于与适当的靶核酸的杂交。一种这样的核酸可以是肽核酸(PNA)。在PNA中，多核苷酸的糖骨架可以被含酰胺骨架，具体地氨基乙基甘氨酸骨架置换。核苷酸可以被保留并且直接或间接地结合至骨架的酰胺部分的氮杂氮原子。PNA化合物中的骨架可以包含给予PNA含酰胺骨架的两个或更多个连接的氨基乙基甘氨酸单元。杂环碱基部分可以直接或间接地结合至该骨架的酰胺部分的氮杂氮原子。

核酸可以包含吗啉代骨架结构。例如，核酸可以包含6元吗啉代环以取代核糖环。在这些实施例中的一些中，二氨基磷酸酯或其他非磷酸二酯核苷间键联可以置换磷酸二酯键。

核酸可以包含连接的吗啉代单元(例如吗啉代核酸)，这些吗啉代单元具有连接到吗啉代环的杂环碱基。连接基团可以连接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化合物可以与细胞蛋白质具有不太希望的相互作用。基于吗啉代的多核苷酸可以是核酸的非离子模拟物。吗啉代种类内的多种化合物可以使用不同的连接基团连接。另一种类的多核苷酸模拟物可以称之为环己烯基核酸(CeNA)。核酸分子中正常地存在的呋喃糖环可以被环己烯基环置换。可以制备CeNA DMT保护的亚磷酰胺单体并且将其用于使用亚磷酰胺化学的寡聚化合物合成。将CeNA单体掺入到核酸链可以增加DNA/RNA杂合体的稳定性。CeNA寡腺苷酸可以与核酸补体形成复合体，这些复合体具有与天然复合体类似的稳定性。另一修饰可以包括锁核酸(LNA)，其中2’-羟基基团连接至糖环的4’碳原子，从而形成2’-C、4’-C-氧基亚甲基键，从而形成二环糖部分。键可以是桥接2’氧原子和4’碳原子的亚甲基(-CH₂)基团，其中n是1或2。LNA和LNA类似物可以显示出与互补核酸相当高的双链体热稳定性(Tm＝+3至+10℃)、3’核酸外切降解稳定性和良好的溶解特性。

核酸还可以包含核碱基(经常简称为“碱基”)修饰或取代。如在此所用，“未修饰的”或“天然的”核碱基可以包括嘌呤碱基(例如腺嘌呤(A)和鸟嘌呤(G))，以及嘧啶碱基(例如胸腺嘧啶(T)、胞嘧啶(C)以及尿嘧啶(U))。修饰的核碱基可以包括其他合成以及天然的核碱基，诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基以及其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基以及其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶以及2-硫胞嘧啶、5-卤代尿嘧啶以及胞嘧啶、5-丙炔基(-C＝C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物、6-偶氮基尿嘧啶、胞嘧啶以及胸腺嘧啶，5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶，8-卤基、8-氨基、8-氢硫基、8-硫烷基、8-羟基以及其他8-取代腺嘌呤和鸟嘌呤，5-卤基具体地5-溴、5-三氟甲基以及其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮鸟嘌呤和8-氮腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤、以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。修饰的核碱基可以包括三环嘧啶诸如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、酚噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G夹环(G-clamp)诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、酚噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G夹环诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3’,2’:4,5)吡咯并[2,3-d]嘧啶-2-酮)。

如本文所使用的，鉴于本说明书，术语“样品”在本领域中具有其习惯和普通含义。它可以指包含靶的组合物。适合用于由本披露方法、装置和系统进行的分析的样品包括细胞、组织、器官或生物体。在一些实施例中，样品包括单细胞。在一些实施例中，样品包含以下，基本上由以下组成，或由以下组成：至少100,000、200,000、300,000、500,000、800,000或1,000,000个单细胞。

如在此所用，术语“取样装置”或“装置”可以是指可获得样品切片和/或将切片放置于基底上的装置。样品装置可以是指例如荧光激活细胞分选(FACS)器、细胞分选器、活检针、活检装置、组织切片装置、微流体装置、刀片网格和/或切片机。

如本文所用，鉴于本说明书，术语“固体载体”在本领域中具有其惯常和普通的含义。它可以是指多个条形码(例如，随机条形码)可以连接到其上的离散固体或半固体表面。固体支持物可以涵盖核酸可固定(例如共价地或非共价地)在其上的由塑料、陶瓷、金属或聚合物材料(例如水凝胶)组成的任何类型的固体、多孔或中空球体、球、轴承、圆柱或其他类似的构型。固体支持物可以包括离散颗粒，该离散颗粒可以是球形(例如微球)或具有非球形或不规则形状诸如立方体、长方体、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。珠的形状可以是非球形的。以阵列间隔开的多个固体支持物可以不包含基底。固体支持物可以与术语“珠”互换使用。可以想到的是，无论在何处描述固体支持物，例如颗粒或表面(例如，如果条形码固定在固体支持物、颗粒、珠等上)，则另一种选择是将溶液分配到分配区中，以便使细胞标记与分配区一对一地相关联(并且使细胞标记与分配区中的单细胞一对一地相关联)。示例性的分配区可以包括滴(例如微滴)，可以位于基底(例如多孔板)上的孔(例如微孔)以及流体装置(例如微流体装置)中的腔室。在一些实施例中，本文描述的溶液可以分配在包含不超过一个细胞的分配区中。分配区可以包括以下中的至少之一：微滴、微孔、或流体装置例如微流体装置的腔室。所述微滴可包含水凝胶。条形码可以固定在基底分配区上，也可以游离在分配区中的溶液中。

如在此所用，术语“随机条形码”可以是指包含本披露的标记的多核苷酸序列。随机条形码可以是可用于随机经条形码化的多核苷酸序列。随机条形码可以用于定量样品内的靶。随机条形码可以用于控制在标记与靶关联后可能发生的错误。例如，随机条形码可以用于评价扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。

如在此所用，术语“基因特异性随机条形码”可以是指包含标记和基因特异性的靶结合区的多核苷酸序列。随机条形码可以是可用于随机经条形码化的多核苷酸序列。随机条形码可以用于定量样品内的靶。随机条形码可以用于控制在标记与靶关联后可能发生的错误。例如，随机条形码可以用于评价扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。

如在此所用，术语“随机条形码化”可以是指核酸的随机标记(例如条形码化)。随机条形码化可以利用递归泊松策略来相关联和定量与靶关联的标记。如在此所用，术语“随机条形码化”可以与“随机进行标记”互换使用。

如本文所使用的，鉴于本说明书，术语“靶”在本领域中具有其习惯和普通含义。它可以是指可以与条形码(例如，随机条形码)关联的成分。适合用于由本披露方法、装置和系统进行的分析的示例性靶包括寡核苷酸、DNA、RNA、mRNA、微小RNA、tRNA等。靶可以是单链或双链的。在一些实施例中，靶可以是蛋白质、肽或多肽。在一些实施例中，靶是脂质。如本文所使用的，“靶”可以与“种类”互换使用。

如本文所用，鉴于本说明书，术语“逆转录酶”在本领域中具有其惯常和普通的含义。它可以是指具有逆转录酶活性(即催化由RNA模板对DNA的合成)的一组酶。一般来讲，此类酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶、细菌逆转录酶、II组内含子衍生的逆转录酶以及其突变体、变体或衍生物。非逆转录病毒逆转录酶包括非LTR逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶以及II组内含子逆转录酶。II组内含子逆转录酶的实例包括乳酸乳球菌(Lactococcus lactis)LI.LtrB内含子逆转录酶、嗜热细长聚球藻(Thermosynechococcuselongates)TeI4c内含子逆转录酶或嗜热脂肪土芽孢杆菌(Geobacillusstearothermophilus)GsI-IIC内含子逆转录酶。其他种类的逆转录酶可以包括许多种类的非逆转录病毒逆转录酶(即转录子、II组内含子以及多样性生成的逆转录因子等等)。

术语“通用衔接引物”、“通用引物衔接子”或“通用衔接序列”可互换使用，是指可以用于杂交条形码(例如，随机条形码)以生成基因特异性条形码的核苷酸序列。通用衔接序列可以例如是在用于本披露方法中的所有条形码上通用的已知序列。例如，当使用在此披露的方法标记多个靶时，靶特异性序列中的每一个可以连接到相同通用衔接序列上。在一些实施例中，多于一个通用衔接序列可以用于在此披露的方法中。例如，当使用在此披露的方法标记多个靶时，靶特异性序列中的至少两个连接到不同通用衔接序列上。通用衔接引物和其补体可以被包含在两个寡核苷酸中，这两个寡核苷酸中的一个包含靶特异性序列而另一个包含条形码。例如，通用衔接序列可以是包含靶特异性序列以生成与靶核酸互补的核苷酸序列的寡核苷酸部分。包含条形码和通用衔接序列的互补序列的第二寡核苷酸可以与该核苷酸序列杂交并且生成靶特异性条形码(例如，靶特异性随机条形码)。在一些实施例中，通用衔接引物具有与用于本披露方法中的通用PCR引物不同的序列。

条形码

条形码化(诸如随机条形码化)已描述于例如US 2015/0299784、WO 2015/031691、以及Fu等人,Proc Natl Acad Sci U.S.A.[美国国家科学院院刊]2011年5月31日；108(22):9026-31中(这些出版物中每一个的内容均通过引用整体并入本文)。在一些实施例中，本文披露的条形码可以是随机条形码，所述随机条形码可以是指可以用于随机地标记(例如条形码化、加标签)靶的多核苷酸序列。如果随机条形码的不同条形码序列的数量与有待标记的任何靶的出现的数量的比率可以是或约是1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1，或这些值中任何两个之间的数字或范围，则条形码可以称作随机条形码。靶可以是包含具有相同或几乎相同序列的mRNA分子的mRNA种类。如果随机条形码的不同条形码序列的数量与有待标记的任何靶的出现的数量的比率是至少或至多1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1，则条形码可以称作随机条形码。随机条形码的条形码序列可以称为分子标记。

条形码，例如随机条形码，可以包含一个或多个标记。示例性标记可以包括通用标记、细胞标记、条形码序列(例如，分子标记)、样品标记、板标记、空间标记和/或预空间标记。图1示出了具有空间标记的示例性条形码104。条形码104可以包含可以将条形码连接至固体支持物105的5’胺。条形码可以包含通用标记、维标记、空间标记、细胞标记和/或分子标记。条形码可以包含通用标记、细胞标记和分子标记。条形码可以包含通用标记、空间标记、细胞标记和分子标记。条形码可以包含通用标记、维标记、细胞标记和分子标记。条形码中不同标记(包括但不限于通用标记、维标记、空间标记、细胞标记和/或分子标记)的顺序可以变化。例如，如图1所示，通用标记可以是最5’端标记，并且分子标记可以是最3’端标记。空间标记、维标记和细胞标记可以呈任何顺序。在一些实施例中，通用标记、空间标记、维标记、细胞标记以及分子标记呈任何次序。条形码可以包含靶结合区。靶结合区可以与样品中的靶(例如，靶核酸、RNA、mRNA、DNA)相互作用。例如，靶结合区可以包含可以与mRNA的聚(A)尾相互作用的寡(dT)序列。在一些情况中，条形码的标记(例如，通用标记、维标记、空间标记、细胞标记以及条形码序列)可以通过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个核苷酸分开。

标记例如细胞标记可以进一步包含限定长度例如各自七个核苷酸(等于在一些汉明纠错码中使用的位数)的独特的核酸子序列组，该核酸子序列组可以被设计成提供纠错能力。包括七个核苷酸序列的纠错子序列组可以被设计成使得组中的任何成对序列组合表现出限定的“遗传距离”(或错配碱基数)，例如纠错子序列组可以被设计成表现出三个核苷酸的遗传距离。在这种情况下，检查针对标记的靶核酸分子(下文更全面描述的)的序列数据组中的纠错序列可以允许检测或校正扩增或测序错误。在一些实施例中，用于产生纠错码的核酸子序列的长度可以变化，例如，它们可以是或约是1、2、3、4、5、6、7、8、9、10、15、20、30、31、40、50个核苷酸长度或这些值中任何两个之间的数字或范围。在一些实施例中，其他长度的核酸子序列可以用于产生纠错码。

条形码可以包含靶结合区。靶结合区可以与样品中的靶相互作用。靶可以是或包括核糖核酸(RNA)、信使RNA(mRNA)、微小RNA、小干扰RNA(siRNA)、RNA降解产物、各自包含多聚(A)尾的RNA或其任何组合。在一些实施例中，多个靶可以包括脱氧核糖核酸(DNA)。

在一些实施例中，靶结合区可以包含可以与mRNA的聚(A)尾相互作用的寡(dT)序列。条形码的一个或多个标记(例如，通用标记、维标记、空间标记、细胞标记和条形码序列(例如，分子标记))可以通过间隔子与条形码的另一个或两个其余标记分开。间隔子可以是例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个，或更多个核苷酸。在一些实施例中，条形码的标记中没有标记被间隔物分开。

通用标记

条形码可以包含一个或多个通用标记。一些实施例中，一个或多个通用标记对于连接到指定固体支持物的条形码组中的所有条形码可以是相同的。在一些实施例中，一个或多个通用标记对于连接到多个珠的所有条形码可以是相同的。在一些实施例中，通用标记可以包含能够与测序引物杂交的核酸序列。测序引物可以用于对包含通用标记的条形码进行测序。测序引物(例如，通用的测序引物)可以包括与高通量测序平台相关联的测序引物。在一些实施例中，通用标记可以包含能够与PCR引物杂交的核酸序列。在一些实施例中，通用标记可以包含能够与测序引物和PCR引物杂交的核酸序列。通用标记的能够与测序引物或PCR引物杂交的核酸序列可以称之为引物结合位点。通用标记可以包含可以用于启动条形码的转录的序列。通用标记可以包含可以用于延伸条形码或条形码内的区域的序列。通用标记的长度可以是或可以约是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。例如，通用标记可以包含至少约10个核苷酸。通用标记的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。在一些实施例中，可切割接头或修饰的核苷酸可以是通用标记序列的一部分以能够使条形码从支持物上切割下来。

维标记

条形码可以包含一个或多个维标记。在一些实施例中，维标记可以包含提供关于出现标记(例如随机标记)的维度的信息的核酸序列。例如，维标记可以提供关于靶被经条形码化的时间的信息。维标记可以与样品的条形码化(例如随机条形码化)时间关联。维标记可以在标记的时间处被激活。不同的维标记可以在不同的时间处被激活。维标记提供了关于靶、靶组和/或样品被经条形码化的顺序的信息。例如，可以在细胞周期的G0期时对细胞群条形码化。可以在细胞周期的G1期时用条形码(例如，随机条形码)再次脉冲处理细胞。可以在细胞周期的S期时用条形码再次脉冲处理细胞，如此类推。每次脉冲(例如细胞周期的每个阶段)下的条形码可以包含不同的维标记。以此方式，维标记提供了关于在细胞周期的哪个阶段标记了哪个靶的信息。维标记可以询问许多不同的生物时期。示例性的生物时期可以包括但不限于细胞周期、转录(例如转录起始)以及转录物降解。在另一实例中，样品(例如一个细胞、细胞群)可以在用药物和/或疗法治疗之前和/或之后被标记。不同靶的拷贝数量的变化可以指示样品对药物和/或疗法的应答。

维标记可以是可激活的。可激活的维标记可以在特定时间点处被激活。可激活的标记可以例如是组成型激活的(例如不被关闭的)。可激活的维标记可以例如是可逆型激活的(例如，可激活的维标记可以被打开和关闭)。维标记可以例如可逆地激活至少1、2、3、4、5、6、7、8、9、10次或更多次。维标记可以可逆地激活例如至少1、2、3、4、5、6、7、8、9、10次或更多次。在一些实施例中，维标记可以用以下各项激活：荧光、日光、化学事件(例如切割、另一分子的连接、修饰的添加(例如聚乙二醇化、苏素化、乙酰化、甲基化、脱乙酰化、脱甲基化)、光化学事件(例如光笼蔽)以及非天然核苷酸的引入。

在一些实施例中，维标记对于连接到指定固体支持物(例如珠)的所有条形码(例如随机条形码)可以是相同的，但对于不同的固体支持物(例如珠)可以是不同的。在一些实施例中，相同固体支持物上的至少60％、70％、80％、85％、90％、95％、97％、99％或100％的条形码可以包含相同的维标记。在一些实施例中，相同固体支持物上的至少60％的条形码可以包含相同的维标记。在一些实施例中，相同固体支持物上的至少95％的条形码可以包含相同的维标记。

在多个固体支持物(例如珠)中可以呈现多至10⁶种或更多个独特的维标记序列。维标记的长度可以是或可约以是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。维标记的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。维标记可以包含约5个至约200个之间的核苷酸。维标记可以包含约10个至约150个之间的核苷酸。维标记的长度可以包含约20个至约125个之间的核苷酸。

空间标记

条形码可以包含一个或多个空间标记。在一些实施例中，空间标记可以包含提供关于与条形码相关联的靶分子的空间取向的信息的核酸序列。空间标记可以与样品的坐标相关联。坐标可以是固定坐标。例如坐标可以相对于基底是固定的。空间标记可以是参考二维或三维网格。坐标可以相对于界标是固定的。界标在空间中可以是可鉴定的。界标可以是可被成像的结构。界标可以是生物结构，例如解剖学界标。界标可以是细胞界标，例如细胞器。界标可以是非天然界标诸如具有可鉴定的标识符诸如颜色编码、条形码编码、磁性特性、荧光剂、放射性或独特的大小或形状的结构。空间标记可以与物理分割(例如，孔、容器或微滴)相关联。在一些实施例中，多个空间标记一起使用以编码空间中的一个或多个位置。

空间标记对于连接到指定固体支持物(例如珠)上的所有条形码可以是相同的，但对于不同的固体支持物(例如珠)可以是不同的。在一些实施例中，在包含相同空间标记的相同固体支持物上的条形码的百分比可以是或约是60％、70％、80％、85％、90％、95％、97％、99％、100％，或这些值中任何两个之间的数字或范围。在一些实施例中，在包含相同空间标记的相同固体支持物上的条形码的百分比可以是至少或至多60％、70％、80％、85％、90％、95％、97％、99％、或100％。在一些实施例中，相同固体支持物上的至少60％的条形码可以包含相同的空间标记。在一些实施例中，相同固体支持物上的至少95％的条形码可以包含相同的空间标记。

在多个固体支持物(例如珠)中可以呈现多至10⁶种或更多个独特的空间标记序列。空间标记的长度可以是或可以约是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。空间标记的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。空间标记可以包含约5个至约200个之间的核苷酸。空间标记可以包含约10个至约150个之间的核苷酸。空间标记的长度可以包含约20个至约125个之间的核苷酸。

细胞标记

条形码(例如，随机条形码)可以包括一个或多个细胞标记。在一些实施例中，细胞标记可以包含提供用于确定哪种靶核酸源自于哪个细胞的信息的核酸序列。在一些实施例中，细胞标记对于连接至指定固体支持物(例如珠)的所有条形码是相同的，但对于不同的固体支持物(例如珠)是不同的。在一些实施例中，在包含相同细胞标记的相同固体支持物上的条形码的百分比可以是或约是60％、70％、80％、85％、90％、95％、97％、99％、100％，或这些值中任何两个之间的数字或范围。在一些实施例中，在包含相同细胞标记的相同固体支持物上的条形码的百分比可以是或约是60％、70％、80％、85％、90％、95％、97％、99％、或100％。例如，相同固体支持物上的至少60％的条形码可以包含相同的细胞标记。作为另一个实例，相同固体支持物上的至少95％的条形码可以包含相同的细胞标记。

在多个固体支持物(例如珠)中可以呈现多至10⁶种或更多个独特的细胞标记序列。细胞标记的长度可以是或可以约是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。细胞标记的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。例如，细胞标记可以包含约5个至约200个之间的核苷酸。作为另一个实例，细胞标记可以包含约10个至约150个之间的核苷酸。作为又一个实例，细胞标记的长度可以包含约20个至约125个之间的核苷酸。

条形码序列

条形码可以包含一个或多个条形码序列。在一些实施例中，条形码序列可以包含提供对与条形码杂交的靶核酸物质的具体类型的鉴定信息的核酸序列。条形码序列可以包含为与条形码(例如靶结合区)杂交的靶核酸物质的具体出现次数提供计数器的核酸序列(例如，提供粗略的近似)。

在一些实施例中，一组不同的条形码序列被连接到指定固体支持物(例如珠)上。在一些实施例中，可以存在或大约存在10²、10³、10⁴、10⁵、10⁶、10⁷、10⁸、10⁹个独特分子标记序列或这些值中的任意两个或两个之间的数字或范围。例如，多个条形码可以包含具有不同序列的约6561个条形码序列。作为另一个实例，多个条形码可以包含具有不同序列的约65536个条形码序列。在一些实施例中，可以存在至少或至多10²、10³、10⁴、10⁵、10⁶、10⁷、10⁸或10⁹个独特条形码序列。独特分子标记序列可以连接至给定的固体支持物(例如珠)。在一些实施例中，独特分子标记序列被颗粒(例如，水凝胶珠)部分或全部包围。

在不同的实现方式中，条形码的长度可以不同。例如，条形码的长度可以是或可以约是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。作为另一个实例，条形码的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。

分子标记

条形码(例如，随机条形码)可以包括一个或多个分子标记。分子标记可以包括条形码序列。在一些实施例中，分子标记可以包含提供对与条形码杂交的靶核酸物质的具体类型的鉴定信息的核酸序列。分子标记可以包含为与条形码(例如靶结合区)杂交的靶核酸物质的具体出现次数提供计数器的核酸序列。

在一些实施例中，一组不同的分子标记被连接到指定固体支持物(例如珠)上。在一些实施例中，可以存在或大约存在10²、10³、10⁴、10⁵、10⁶、10⁷、10⁸、10⁹个独特分子标记序列或这些值中的任意两个或两个之间的数字或范围。例如，多个条形码可以包含具有不同序列的约6561个分子标记。作为另一个实例，多个条形码可以包含具有不同序列的约65536个分子标记。在一些实施例中，可以存在至少或至多10²、10³、10⁴、10⁵、10⁶、10⁷、10⁸或10⁹个独特分子标记序列。具有独特分子标记序列的条形码可以连接至给定的固体支持物(例如珠)。

对于使用多个随机条形码的形码化(例如随机条形码化)，不同分子标记序列的数量与任何靶的出现数量的比率可以是或约是1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1，或这些值中任何两个之间的数字或范围。靶可以是包含具有相同或几乎相同序列的mRNA分子的mRNA种类。在一些实施例中，不同分子标记序列的数量与任何靶的出现数量的比率是至少或至多1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1。

分子标记的长度可以是或可以约是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。分子标记的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。

靶结合区

条形码可包含一个或多个靶结合区，例如捕获探针。在一些实施例中，靶结合区可以与目的靶杂交。在一些实施例中，靶结合区可以包含与靶(例如靶核酸、靶分子，例如待分析的细胞核酸)例如特定基因序列特异性杂交的核酸序列。在一些实施例中，靶结合区可以包含可以连接(杂交)至特定靶核酸的特异性位置的核酸序列。在一些实施例中，靶结合区可以包含能够与限制性内切酶位点突出端(例如EcoRI粘性突出端)特异性杂交的核酸序列。条形码然后可以连接至包含与限制性内切位点突出端互补的序列的任何核酸分子。

在一些实施例中，靶结合区可以包含非特异性靶核酸序列。非特异性靶核酸序列可以是指可以不依赖于靶核酸的特异性序列结合多个靶核酸的序列。例如，靶结合区可以包含随机多聚体序列，或与mRNA分子上的聚(A)尾杂交的寡(dT)序列。随机多聚体序列可以是例如随机二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体、九聚体、十聚体或具有任何长度的较高的多聚体序列。在一些实施例中，靶结合区对于连接到指定珠上的所有条形码是相同的。在一些实施例中，对于连接到指定珠的多个条形码的靶结合区可以包含两个或更多个不同的靶结合序列。靶结合区的长度可以是或可以约是5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。靶结合区的长度可以是至多约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。

在一些实施例中，靶结合区可以包含寡(dT)，所述寡(dT)可以与包含聚腺苷酸化端部的mRNA杂交。靶结合区可以是基因特异性的。例如，靶结合区可以被配置成杂交到靶的特异性区域上。在一些实施例中，靶结合区不包含寡(dT)。靶结合区的长度可以是或约是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26 27、28、29、30个或者这些值中的任何两个值之间的数字或范围的核苷酸。靶结合区的长度可以是至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。靶结合区的长度可以是从约5-30个核苷酸。当条形码包含基因特异性靶结合区时，条形码可以在此被称为基因特异性条形码。

取向特性

随机条形码(例如，随机条形码)可以包含可以用于定向(例如比对)条形码的一个或多个取向特性。条形码可以包含用于等电聚焦的一个部分。不同的条形码可以包含不同的等电聚焦点。当这些条形码被引入到样品时，可以使样品经受等电聚焦以便使条形码取向为已知方式。以此方式，取向特性可以用于发展样品中条形码的已知谱图。示例性取向特性可以包括电泳迁移率(例如基于条形码的大小)、等电点、自旋、导电性和/或自组装。例如，具有自组装取向特性的条形码可以在激活后自组装为特定取向(例如核酸纳米结构)。

亲和特性

条形码(例如，随机条形码)可以包括一个或多个亲和特性。例如，空间标记可以包含亲和特性。亲和特性可以包括可以有利于条形码结合到另一实体(例如细胞受体)上的化学和/或生物部分。例如，亲和特性可包含抗体，例如对样品上的特定部分(例如受体)具有特异性的抗体。在一些实施例中，抗体可以将条形码引导至特定细胞类型或分子。在特定细胞类型或分子处和/或附近的靶可以是标记的(例如随机标记的)。在一些实施例中，亲和特性还可以提供除空间标记的核苷酸序列之外的空间信息，因为抗体可以将条形码引导至特定位置。该抗体可以是治疗性抗体，例如单克隆抗体或多克隆抗体。抗体可以是人源化的或嵌合的。该抗体可以是裸抗体或融合抗体。

抗体可以是指全长(即天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如IgG抗体)或免疫球蛋白分子的免疫活性(即特异性结合)部分，如抗体片段。

抗体片段可以是抗体的一部分，诸如F(ab’)2、Fab’、Fab、Fv、sFv等。在一些实施例中，抗体片段可以结合通过全长抗体鉴定的相同抗原。抗体片段可以包括由抗体的可变区组成的分离片段，诸如由重链和轻链的可变区组成的“Fv”片段以及其中轻链可变区和重链可变区通过肽接头(“scFv蛋白”)连接的重组单链多肽分子。示例性抗体可以包括但不限于用于癌细胞的抗体、用于病毒的抗体、结合到细胞表面受体(CD8、CD34、CD45)上的抗体以及治疗性抗体。

通用衔接子引物

条形码可以包含一个或多个通用衔接子引物。例如，基因特异性条形码，例如基因特异性随机条形码，可以包含通用衔接子引物。通用衔接子引物可以是指在所有条形码上通用的核苷酸序列。通用衔接子引物可用于构建基因特异性条形码。通用衔接子引物可以是或约是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、2627、28、29、30个或者在这些中的任何两个值之间的数值或范围的核苷酸。通用衔接子引物的长度可以是至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。通用衔接引物的长度可以是从5-30个核苷酸。

接头

当条形码包含一个以上一种类型的标记(例如，一个以上细胞标记或一个以上条形码序列，例如一个分子标记)时，标记可以散布有接头标记序列。接头标记序列的长度可以是至少约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。接头标记序列的长度可以是至多约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。在某些情况下，接头标记序列的长度是12个核苷酸。接头标记序列可用于促进条形码的合成。接头标记可以包括纠错码(例如汉明码)。

固体支持物

在一些实施例中，本文披露的条形码，例如随机条形码，可以与固体支持物关联。固体支持物可以是例如合成颗粒。在一些实施例中，一些或全部条形码序列，例如固体支持物上多个条形码(例如，第一多个条形码)中的随机条形码(例如，第一多个条形码序列)的分子标记相差至少一个核苷酸。同一固体支持物上条形码的细胞标记可以相同。不同固体支持物上条形码的细胞标记可以相差至少一个核苷酸。例如，第一固体支持物上的第一多个条形码的第一细胞标记可以具有相同的序列，第二固体支持物上的第二多个条形码的第二细胞标记可以具有相同的序列。第一固体支持物上的第一多个条形码的第一细胞标记和第二固体支持物上的第二多个条形码的第二细胞标记可以相差至少一个核苷酸。细胞标记可以是例如约5-20个核苷酸长。条形码序列可以是例如约5-20个核苷酸长。合成颗粒可以是例如珠。

珠可以是例如硅胶珠、可控孔度玻璃珠、磁性珠、Dynabead、交联葡聚糖/交联琼脂糖珠、纤维素珠、聚苯乙烯珠、或其任何组合。珠可以包含以下材料：例如聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮或其任何组合。

在一些实施例中，珠可以是用条形码或随机条形码官能化的聚合物珠，例如可变形珠或凝胶珠(例如来自10X基因公司(10X Genomics)(旧金山，加利福尼亚州)的凝胶珠)。在一些实施方式中，凝胶珠可以包含基于聚合物的凝胶。凝胶珠可以例如通过将一个或多个聚合物前体包封成液滴来产生。当聚合物前体暴露于促进剂(例如四甲基乙二胺(TEMED))后，可产生凝胶珠。

在一些实施例中，颗粒可以是可破坏的(例如，可溶的、可降解的)。例如，聚合物珠可以例如在期望条件下溶解、熔化或降解。期望条件可以包括环境条件。期望条件可以导致聚合物珠以受控方式溶解、熔融或降解。凝胶珠可由于化学刺激、物理刺激、生物刺激、热刺激、磁刺激、电刺激、光刺激或其任何组合而溶解、熔化或降解。

可以将分析物和/或试剂(例如寡核苷酸条形码)例如偶联/固定在凝胶珠的内表面上(例如，通过寡核苷酸条形码和/或用于产生寡核苷酸条形码的材料的扩散进入内部空间)和/或本文所述的凝胶珠或任何其他微胶囊的外表面。偶联/固定化可以通过任何形式的化学键合(例如，共价键，离子键)或物理现象(例如，范德华力，偶极-偶极相互作用等)来进行。在一些实施例中，试剂与本文所述的凝胶珠或任何其他微胶囊的偶联/固定可以是可逆的，例如经由不稳定的部分(例如，经由包括此处所述化学交联剂的化学交联剂)。在施加刺激后，不稳定部分可以被切割并释放固定化的试剂。在一些实施例中，不稳定部分是二硫键。例如，在通过二硫键将寡核苷酸条形码固定在凝胶珠上的情况下，将二硫键暴露于还原剂可以切割二硫键并使寡核苷酸条形码从珠脱离。不稳定部分可以作为凝胶珠或微胶囊的一部分，作为将试剂或分析物与凝胶珠或微胶囊连接的化学接头的一部分和/或作为试剂或分析物的一部分而包括在内。在一些实施例中，多个条形码中的至少一个条形码可以固定在颗粒上、部分地固定在颗粒上、封闭在颗粒中、部分地封闭在颗粒中，或其任何组合。

在一些实施例中，凝胶珠可包含多个不同的聚合物，包括但不限于：聚合物、热敏聚合物、光敏聚合物、磁性聚合物、pH敏感聚合物、盐敏感聚合物、化学敏感聚合物、聚电解质、多糖、肽、蛋白质和/或塑料。聚合物可以包括但不限于以下材料，例如聚(N-异丙基丙烯酰胺)(PNIPAAm)、聚(苯乙烯磺酸盐)(PSS)、聚(烯丙基胺)(PAAm)、聚(丙烯酸)(PAA)、聚(乙烯亚胺)(PEI)、聚(二烯丙基二甲基氯化铵)(PDADMAC)、聚(吡咯)(PPy)、聚(乙烯吡咯烷酮)(PVPON)、聚(乙烯基吡啶)(PVP)、聚(甲基丙烯酸)(PMAA)、聚(甲基丙烯酸甲酯)(PMMA)、聚苯乙烯(PS)、聚(四氢呋喃)(PTHF)、聚(邻苯二甲醛)(PTHF)、聚(己基紫精)(PHV)、聚(L-赖氨酸)(PLL)、聚(L-精氨酸)(PARG)、聚(乳酸-共-乙醇酸)(PLGA)。

可以使用多种化学刺激来触发珠的破坏、溶解或降解。这些化学变化的例子可以包括但不限于pH介导的珠壁的变化，通过交联键的化学切割使珠壁崩解，触发珠壁的解聚和珠壁转换反应。容积变化也可以用于引发珠的破坏。

通过各种刺激对微胶囊进行体积或物理改变在设计释放试剂的胶囊方面也具有许多优势。容积或物理变化发生在宏观范围内，其中珠破裂是由刺激引起的机械物理力的结果。这些过程可包括但不限于压力引起的破裂、珠壁熔化或珠壁的孔隙率变化。

生物刺激还可以用于引发珠的破坏、溶解或降解。通常，生物触发物类似于化学触发物，但是许多实例使用生物分子或生物系统中常见的分子，例如酶、肽、糖、脂肪酸、核酸等。例如，珠可以包含具有对特定蛋白酶的切割敏感的肽交联的聚合物。更具体地，一个实例可以包括包含GFLGK肽交联的微胶囊。添加诸如蛋白酶组织蛋白酶B的生物触发物后，壳孔的肽交联被切割，珠的内容物被释放。在其他情况下，蛋白酶可以被热激活。在另一个实例中，珠包括包含纤维素的壳壁。水解酶壳聚糖的添加是纤维素键切割、壳壁解聚和释放其内部内容物的生物触发物。

施加热刺激后，也可诱导珠释放其内容物。温度变化会可导致珠发生多种变化。热的变化可能导致珠熔化，从而使珠壁崩解。在其他情况下，热可能会增加珠内部组分的内部压力，从而使珠破裂或爆破。在其他情况下，热可以将珠转变成收缩的脱水状态。热还可以作用在珠壁内的热敏聚合物上，从而导致珠破裂。

将磁性纳米颗粒包含到微胶囊的珠壁中可允许珠的触发破裂以及将珠引导成阵列。为了任何一个目的，本披露的设备可以包括磁珠。在一个实例中，在存在振荡磁场刺激的情况下，将Fe₃O₄纳米颗粒掺入到包含珠的聚电解质中引发破裂。

由于电刺激，珠也可以被破坏、溶解或降解。类似于上一部分中所述的磁性颗粒，电敏感珠可同时触发珠破裂和其他功能，例如在电场中对齐、电导率或氧化还原反应。在一个实例中，将包含电敏材料的珠在电场中对齐，使得可以控制内部试剂的释放。在其他实例中，电场可在珠壁自身内引起氧化还原反应，这可增加孔隙率。

光刺激也可以用来破坏珠。许多光触发物都是可能的，并且可以包括使用各种分子(例如能够吸收特定波长范围的光子的纳米颗粒和发色团)的系统。例如，金属氧化物涂层可以用作胶囊触发物。涂有SiO₂的聚电解质胶囊的UV照射可以导致珠壁崩解。在又一个实例中，可将光可切换材料例如偶氮苯基团掺入在珠壁中。施加UV或可见光后，此类化学药品在吸收光子后会发生可逆的顺式至反式异构化。在这个方面，光子开关的引入导致珠壁可在施加光触发物后崩解或变得更加多孔。

例如，在图2中所示的条形码化(例如，随机条形码化)的非限制性实例中，在框208处将诸如单细胞的细胞引入微孔阵列的多个微孔之后，可以在框212将珠引入微孔阵列的多个微孔。每个微孔可包含一个珠。珠可以包含多个条形码。条形码可以包含附着在珠上的5’胺区。条形码可以包含通用标记、条形码序列(例如，分子标记)、靶结合区或其任何组合。

在此披露的条形码可以与固体支持物(例如珠)关联(例如连接)。与固相支持物关联的条形码可各自包含选自包含具有独特序列的至少100或1000个条形码序列的组的条形码序列。在一些实施例中，与固体支持物关联的不同条形码可以包含具有不同序列的条形码。在一些实施例中，与固体支持物关联的条形码的一定百分比包含相同的细胞标记。例如，所述百分比可以是或约是60％、70％、80％、85％、90％、95％、97％、99％、100％或这些值中任意两个之间的数字或范围。作为另一个实例，所述百分比可以是至少或至多60％、70％、80％、85％、90％、95％、97％、99％或100％。在一些实施例中，与固体支持物关联的条形码可以具有相同的细胞标记。与不同固体支持物关联的条形码可以具有不同的细胞标记，所述细胞标记选自包含具有独特序列的至少100或1000个细胞标记的组。

在此披露的条形码可以与固体支持物(例如珠)关联(例如连接)。在一些实施例中，对样品中的多个靶进行条形码化可以通过包括与多个条形码关联的多个合成颗粒的固体支持物执行。在一些实施例中，固体支持物可以包括与多个随机条形码关联的多个合成颗粒。不同固体支持物上的多个条形码的空间标记的区别可以在于至少一个核苷酸。固体支持物可以例如包含呈二维或三维的多个条形码。合成颗粒可以是珠。珠可以是硅胶珠、可控孔度玻璃珠、磁性珠、Dynabeads、交联葡聚糖/交联琼脂糖珠、纤维素珠、聚苯乙烯珠、或其任何组合。固体支持物可以包括聚合物、基质、水凝胶、针阵列装置、抗体、或其任何组合。在一些实施例中，固体支持物可以是自由浮动的。在一些实施例中，固体支持物可以被包埋在半固体或固体阵列中。条形码可以不与固体支持物关联。条形码可以是单个核苷酸。条形码可以与基底关联。

如在此所用，术语“系接”、“连接”和“固定”可互换使用，并且可以是指用于将条形码连接到固体支持物的共价或非共价方式。多个不同的固体支持物中的任一种可以用作用于连接预先合成的条形码或用于条形码的原位固相合成的固体支持物。

在一些实施例中，固体支持物是珠。珠可以涵盖核酸可固定(例如共价地或非共价地)在其上的固体、多孔或中空球体、球、轴承、圆柱或其他类似构型中的一种或多种类型。珠可以是例如由塑料、陶瓷、金属、聚合物材料或其任何组合组成的。珠可以是或包括离散颗粒，该离散颗粒是球形(例如微球)或具有非球形或不规则形状诸如立方体、长方体、锥形、圆柱形、圆锥形、椭圆形或圆盘形等等。在一些实施例中，珠可以是非球形形状。

珠可以包括多种材料，包括但不限于，顺磁体材料(如镁、钼、锂和钽)，超顺磁体材料(如铁氧体(Fe₃O₄；磁铁矿)纳米粒子)、铁磁材料(例如铁、镍、钴、其一些合金以及一些稀土金属化合物)、陶瓷、塑料、玻璃、聚苯乙烯、二氧化硅、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、琼脂糖凝胶、琼脂糖、水凝胶、聚合物、纤维素、尼龙或其任何组合。

在一些实施例中，珠(例如，标记附着于其上的珠)是水凝胶珠。在一些实施例中，珠包含水凝胶。

本文披露的一些实施例包括一个或多个颗粒(例如，珠)。每个颗粒可以包含多个寡核苷酸(例如，条形码)。多个寡核苷酸中的每个可以包含条形码序列(例如，分子标记序列)、细胞标记和靶结合区(例如，寡(dT)序列、基因特异性序列、随机多聚体，或其组合)。多个寡核苷酸中的每个的细胞标记序列可以相同。不同颗粒上的寡核苷酸的细胞标记序列可以不同，从而可以鉴定不同颗粒上的寡核苷酸。在不同的实现方式中，不同的细胞标记序列的数量可以不同。在一些实施例中，细胞标记序列的数量可以是或约是10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、10⁶、10⁷、10⁸、10⁹，这些值中任何两个之间的数字或范围，或更大。在一些实施例中，细胞标记序列的数量可以是至少或至多10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、10⁶、10⁷、10⁸或10⁹。在一些实施例中，多个颗粒中的不超过1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或更多个包括具有相同细胞序列的寡核苷酸。在一些实施例中，包括具有相同细胞序列的寡核苷酸的多个颗粒可以是至多0.1％、0.2％、0.3％、0.4％、0.5％、0.6％、0.7％、0.8％、0.9％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％或更多。在一些实施例中，多个颗粒中没有颗粒具有相同的细胞标记序列。

每个颗粒上的多个寡核苷酸可包含不同的条形码序列(例如，分子标记)。在一些实施例中，条形码序列的数量可以是或约是10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、10⁶、10⁷、10⁸、10⁹，或这些值中任何两个之间的数字或范围。在一些实施例中，条形码序列的数量可以是至少或至多10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、10⁶、10⁷、10⁸或10⁹。例如，多个寡核苷酸中的至少100个包含不同的条形码序列。作为另一个实例，在单个颗粒中，多个寡核苷酸中的至少100、500、1000、5000、10000、15000、20000、50000个、这些值中的任何两个之间的数量或范围、或者更多个包含不同的条形码序列。一些实施例提供了多个包含条形码的颗粒。在一些实施例中，有待标记的靶的出现(或拷贝或数量)与不同条形码序列的比率可以是至少1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90或更多。在一些实施例中，多个寡核苷酸中的每个进一步包含样品标记、通用标记或两者。颗粒可以是例如纳米颗粒或微粒。

珠的大小可以变化。例如，珠的直径可以在0.1微米至50微米的范围内。在一些实施例中，珠的直径可以是或约是0.1、0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50微米，或这些值中任何两个之间的数字或范围。

珠的直径可以与基底的孔直径相关。在一些实施例中，珠的直径可以比孔的直径长或短或约10％、20％、30％、40％、50％、60％、70％、80％、90％、100％或这些值中任何两个之间的数字或范围。珠的直径可以与细胞(例如由基底的孔截留的单细胞)直径相关。在一些实施例中，例如，珠的直径可以比孔的直径长或短至少或至多10％、20％、30％、40％、50％、60％、70％、80％、90％或100％。珠的直径可以与细胞(例如由基底的孔截留的单细胞)直径相关。在一些实施例中，珠的直径可以比细胞的直径长或短或约10％、20％、30％、40％、50％、60％、70％、80％、90％、100％、150％、200％、250％、300％或这些值中任何两个之间的数字或范围。在一些实施例中，例如，珠的直径可以比细胞的直径长或短至少或至多10％、20％、30％、40％、50％、60％、70％、80％、90％、100％、150％、200％、250％或300％。

珠可以连接到和/或包埋在基底中。珠可以连接到和/或包埋在凝胶、水凝胶、聚合物和/或基质中。珠在基底(例如凝胶、基质、支架或聚合物)中的空间位置可以使用珠上条形码上存在的可以充当位置地址的空间标记鉴定。

珠的实例可以包括但不限于链霉亲和素珠、琼脂糖珠、磁性珠、微珠、抗体缀合的珠(例如抗免疫球蛋白微珠)、蛋白质A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠以及BcMag^TM羧基末端的磁性珠。

珠可以关联有(例如浸渗有)量子点或荧光染料以使得其在一个荧光光学通道或多个光学通道中发荧光。珠可以与氧化铁或氧化铬关联以使得其具有顺磁性或铁磁性。珠可以是可鉴定的。例如，可以使用照相机对珠进行成像。珠可以具有与珠关联的可检测编码。例如，珠可以包含条形码。珠可以例如由于在有机或无机溶液中的溶胀而改变大小。珠可以是疏水性的。珠可以是亲水性的。珠可以是生物相容的。

固体支持物(例如珠)可以是可视化的。固体支持物可以包含可视化标签(例如荧光染料)。固体支持物(例如珠)可以被蚀刻有标识符(例如数字)。标识符可以通过对珠进行成像来可视化。

固体支持物可以包含不溶性、半溶性或不溶性材料。当固体支持物包含接头、支架、构建块或连接到其上的其他反应性部分时它可以被称为“官能化的”，然而，当固体支持物没有连接到其上的这种反应性部分时它可以被称为“非官能化的”。固体支持物可以下述形式采用：游离于溶液中，诸如以微量滴定孔形式；以流通形式，诸如在柱中；或在测试条(dipstick)中。

固体支持物可以包括膜、纸、塑料、涂覆表面、平表面、玻璃、载玻片、芯片或其任何组合。固体支持物可以呈树脂、凝胶、微球或其他几何构型的形式。固体支持物可以包含二氧化硅芯片、微粒、纳米颗粒、板、阵列、毛细管、板支持物诸如玻璃纤维过滤器、玻璃表面、金属表面(钢铁、金、银、铝、硅以及铜)、玻璃支持物、塑料支持物、硅支持物、芯片、过滤器、膜、微孔板、载玻片、塑料材料包括多孔板或膜(例如由聚乙烯、聚丙烯、聚酰胺、聚偏氟乙烯形成的)、和/或晶片、梳状物、插针或针(例如适合于组合性合成或分析的插针阵列)或平表面诸如晶片(硅晶片)、带有具有或不具有滤底的凹陷的晶片的凹陷或纳升孔的阵列中的珠。

固体支持物可以包含聚合物基质(例如，凝胶，水凝胶)。聚合物基质可以能够渗透细胞内空间(例如在细胞器周围)。聚合物基质可以能够被泵送贯穿整个循环系统。

基底和微孔阵列

如本文所用，基底可以指固体支持物的类型。基底可以是指可以包含本披露的条形码随机条形码的固体支持物。基底可以例如包含多个微孔。例如，基底可以是包含两个或更多个微孔的孔阵列。在一些实施例中，微孔可以包括限定体积的小反应室。在一些实施例中，微孔可以截留一个或多个细胞。在一些实施例中，微孔可以仅截留一个细胞。在一些实施例中，微孔可以截留一个或多个固体支持物。在一些实施例中，微孔可以仅截留一个固体支持物。在一些实施例中，微孔截留单细胞和单个固体支持物(例如珠)。微孔可包含本披露的条形码试剂。

条形码化方法

本披露提供了用于估计身体样品(例如，组织、器官、肿瘤、细胞)中的不同位置处的不同靶的数量的方法。这些方法可以包括将条形码(例如，随机条形码)放置成紧密接近样品、裂解样品、使不同的靶与条形码关联、扩增靶并且/或者数字计数靶。该方法可以进一步包括分析和/或可视化从条形码上的空间标记获得的信息。在一些实施例中，方法包括可视化样品中的多个靶。将多种靶映射到样品的谱图上可以包括生成样品的二维谱图或三维谱图。二维谱图和三维谱图可在对样品中的多个靶进行条形码化(例如，随机条形码化)之前或之后产生。可视化样品中的多种靶可以包括将多种靶映射到样品的谱图(map)上。将多种靶映射到样品的谱图上可以包括生成样品的二维谱图或三维谱图。二维谱图和三维谱图可在对样品中的多个靶进行条形码化之前或之后产生。在一些实施例中，二维谱图和三维谱图可在裂解样品之前生成。在生成二维谱图或三维谱图之前或之后裂解样品可以包括加热样品、使样品与洗涤剂接触、改变样品的pH、或其任何组合。

在一些实施例中，对多个靶进行条形码化包括将多个条形码与多个靶进行杂交以产生经条形码化的靶(例如，经随机经条形码化的靶)。对多个靶进行条形码化可以包括生成经条形码化的靶的索引文库。可以使用包括多个条形码(例如，随机条形码)的固体支持物来执行经条形码化的靶的索引文库的产生。

使样品和条形码接触

本披露提供了用于使样品(例如细胞)与本披露的基底接触的方法。可以使包括例如细胞、器官或组织薄切片的样品与条形码(例如，随机条形码)接触。可以例如通过重力流动接触细胞，其中细胞可以沉降并且产生一个单层。样品可以是组织薄切片。薄切片可以置于基底上。样品可以是一维的(例如形成平表面)。样品(例如细胞)可以例如通过使细胞生长/培养在基底上而铺开在基底上。

当条形码紧密接近靶时，靶可以与条形码杂交。可以非可消耗比接触条形码，使得每个不同的靶可以与本披露的不同的条形码关联。为了确保靶与条形码之间的有效关联，靶可以交联至条形码。

细胞裂解

在分布细胞和条形码之后，可以裂解细胞以释放靶分子。细胞裂解可以通过多种方式中的任何一种完成，例如通过化学或生化方式、通过渗透压休克或通过热裂解、机械裂解或光线裂解。细胞可以通过添加以下各项来裂解：包含洗涤剂(例如SDS、十二烷基硫酸锂、Triton X-100、吐温-20或NP-40)的细胞裂解缓冲液、有机溶剂(例如甲醇或丙酮)或消化酶(例如蛋白酶K、胃蛋白酶或胰蛋白酶)或其任何组合。为了增加靶和条形码的关联，可以通过例如降低温度和/或增加裂解物的粘度改变靶分子的扩散速率。

在一些实施例中，样品可以使用滤纸裂解。滤纸可以用在滤纸之上的裂解缓冲液浸湿。可以在可以有助于样品的裂解和样品的靶与基底的杂交的压力存在下，将滤纸施加至样品。

在一些实施例中，裂解可以通过机械裂解、热裂解、光学裂解和/或化学裂解执行。化学裂解可以包括使用消化酶诸如蛋白酶K、胃蛋白酶和胰蛋白酶。裂解可以通过向基底添加裂解缓冲液来执行。裂解缓冲液可以包含Tris HCl。裂解缓冲液可包括至少约0.01M、0.05M、0.1M、0.5M、或1M或更多Tris HCl。裂解缓冲液可包括至多约0.01M、0.05M、0.1M、0.5M、或1M或更多Tris HCL。裂解缓冲液可以包含约0.1M Tris HCl。裂解缓冲液的pH可以是至少约1、2、3、4、5、6、7、8、9、10，或更高。裂解缓冲液的pH可以是至多约1、2、3、4、5、6、7、8、9、10，或更高。在一些实施例中，裂解缓冲液的pH是约7.5。裂解缓冲液可以包含盐(例如LiCl)。在裂解缓冲液中盐的浓度可以是至少约0.1M、0.5M、或1M、或更高。在裂解缓冲液中盐的浓度可以是至多约0.1M、0.5M、或1M、或更高。在一些实施例中，裂解缓冲液中盐的浓度是约0.5M。裂解缓冲液中可以包含洗涤剂(例如SDS、十二烷基硫酸锂、triton X、吐温、NP-40)。裂解缓冲液中洗涤剂的浓度可以是至少约0.0001％、0.0005％、0.001％、0.005％、0.01％、0.05％、0.1％、0.5％、1％、2％、3％、4％、5％、6％、或7％或更高。裂解缓冲液中洗涤剂的浓度可以是至多约0.0001％、0.0005％、0.001％、0.005％、0.01％、0.05％、0.1％、0.5％、1％、2％、3％、4％、5％、6％或7％或更高。在一些实施例中，裂解缓冲液中洗涤剂的浓度是约1％十二烷基硫酸锂。裂解方法中使用的时间可以取决于使用的洗涤剂的量。在一些实施例中，使用的洗涤剂越多，裂解需要的时间越少。裂解缓冲液可以包含螯合剂(例如EDTA、EGTA)。裂解缓冲液中螯合剂的浓度可以是至少约1、5、10、15、20、25或30mM或更高。裂解缓冲液中螯合剂的浓度可以是至多约1、5、10、15、20、25或30mM或更高。在一些实施例中，裂解缓冲液中螯合剂的浓度是约10mM。裂解缓冲液可以包含还原剂(例如β-巯基乙醇、DTT)。裂解缓冲液中还原剂的浓度可以是至少约1、5、10、15、或20mM或更高。裂解缓冲液中还原剂的浓度可以是至多约1、5、10、15、或20mM或更高。在一些实施例中，裂解缓冲液中还原剂的浓度是约5mM。在一些实施例中，裂解缓冲液可以包含约0.1M TrisHCl、约pH 7.5、约0.5M LiCl、约1％十二烷基硫酸锂、约10mM EDTA以及约5mM DTT。

裂解可以在约4℃、10℃、15℃、20℃、25℃或30℃的温度下执行。裂解可以执行约1、5、10、15或20或更多分钟。裂解细胞可以包含至少约100000、200000、300000、400000、500000、600000或700000个或更多个靶核酸分子。裂解细胞可以包含至多约100000、200000、300000、400000、500000、600000或700000个或更多个靶核酸分子。

条形码连接到靶核酸分子上

在裂解细胞并使核酸分子从其释放之后，核酸分子可以与共定位的固体支持物的条形码随机地关联。关联可以包括条形码的靶识别区与靶核酸分子的互补部分的杂交(例如条形码的寡(dT)可以与靶的聚(A)尾相关作用)。用于杂交的测定条件(例如缓冲液pH、离子强度、温度等)可以被选择以促进特定的稳定性杂交体的形成。在一些实施例中，从裂解的细胞中释放的核酸分子可以与基底上的多个探针关联(例如与基底上的探针杂交)。当探针包含寡(dT)时，mRNA分子可以与探针杂交并且进行逆转录。寡核苷酸的寡(dT)部分可以充当用于cDNA分子的第一链合成的引物。例如，在图2中所示的条形码的非限制性实例中，在框216，mRNA分子可以与珠上的条形码杂交。例如，单链核苷酸片段可以与条形码的靶结合区杂交。

连接可以进一步包括将条形码的靶识别区与靶核酸分子的一部分连接。例如，靶结合区可以包括可能够与限制性位点突出端(例如，EcoRI粘性末端突出端)进行特异性杂交的核酸序列。测定程序可以进一步包括用限制性内切酶(例如EcoRI)处理靶核酸以产生限制位点突出端。条形码然后可以连接至包含与限制性内切位点突出端互补的序列的任何核酸分子。连接酶(例如T4 DNA连接酶)可以用于接合两个片段。

例如，在图2中所示的条形码的非限制性实例中，在框220处，来自多个细胞(或多个样品)的经标记的靶(例如，靶-条形码分子)可以随后合并到例如管中。可以通过例如回收条形码和/或与靶-条形码分子连接的珠来合并经标记的靶。

连接的靶-条形码分子的基于固体支持物的集合体的收回可以通过使用磁性珠和外部施加的磁场来实现。一旦靶-条形码分子已被合并，所有进一步的加工可以在单一反应器中进行。另外的加工可以包括例如逆转录反应、扩增反应、切割反应、解离反应和/或核酸延伸反应。另外的加工反应可以在微孔内进行，也就是说，无需首先合并来自多个细胞的标记的靶核酸分子。

逆转录

本披露提供了一种用于使用逆转录产生靶-条形码缀合物的方法(例如，在图2的框224处)。靶-条形码缀合物可以包含条形码和靶核酸(即，经条形码化的cDNA分子，例如经随机经条形码化的cDNA分子)的全部或一部分的互补序列。关联的RNA分子的逆转录可以通过添加逆转录引物以及逆转录酶发生。逆转录引物可以是寡(dT)引物、随机的六核苷酸引物或靶特异性寡核苷酸引物。寡(dT)引物可以是或可以约是12-18个核苷酸的长度并且结合哺乳动物mRNA的3’端处的内源性聚(A)尾。随机的六核苷酸引物可以在多个互补位点处结合mRNA。靶特异性寡核苷酸引物典型选择性地引发目的mRNA。

在一些实施例中，标记的RNA分子的逆转录可以通过添加逆转录引物发生。在一些实施例中，逆转录引物是寡(dT)引物、随机的六核苷酸引物或靶特异性寡核苷酸引物。一般来讲，寡(dT)引物是约12-18个核苷酸的长度并且结合哺乳动物mRNA的3’端处的内源性聚(A)尾。随机的六核苷酸引物可以在多个互补位点处结合mRNA。靶特异性寡核苷酸引物典型选择性地引发目的mRNA。

逆转录可以重复地发生以产生多个标记的cDNA分子。在此披露的方法可以包括进行至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次逆转录反应。该方法可以包括进行至少约25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100次逆转录反应。

扩增

可以执行一次或多次核酸扩增反应(例如，在图2的框228处)以产生经标记的靶核酸分子的多个拷贝。扩增可以多重复路方式执行，其中多个靶核酸序列同时进行扩增。扩增反应可以用于向核酸分子添加测序衔接子。扩增反应可以包括扩增样品标记(若存在的话)的至少一部分。扩增反应可以包括扩增细胞标记和/或条形码序列(例如，分子标记)的至少一部分。扩增反应可包括扩增样品标签、细胞标记、空间标记、条形码序列(例如，分子标记)、靶核酸或其组合的至少一部分。扩增反应可以包括扩增多个核酸的0.5％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、97％、100％或在这些值的任何两个值之间的范围或数值。该方法可以进一步包括进行一次或多次cDNA合成反应以产生包含样品标记、细胞标记、空间标记和/或条形码序列(例如，分子标记)的靶-条形码分子的一个或多个cDNA拷贝。

在一些实施例中，扩增可以使用聚合酶链式反应(PCR)执行。如在此所用，PCR可以是指用于通过同时引物延伸DNA的互补链进行特定DNA序列的体外扩增的反应。如在此所用，PCR可以涵盖反应的衍生形式，包括但不限于RT-PCR、实时PCR、巢式PCR、定量PCR、多重PCR、数字PCR以及组装PCR。

标记的核酸的扩增可以包括基于非PCR的方法。基于非PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环-对-环扩增。其他基于非PCR的方法包括用于扩增DNA或RNA靶的DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多个循环、连接酶链式反应(LCR)和Qβ复制酶(Qβ)方法、使用回文探针、链置换扩增、使用限制性内切酶的寡核苷酸驱动的扩增、其中引物与核酸序列杂交并且所得双链体在延伸反应和扩增之前被切割的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增以及分枝式延伸扩增(RAM)。在一些实施例中，扩增不产生环化的转录物。

在一些实施例中，本文披露的方法进一步包括对经标记的核酸(例如，经标记的RNA、经标记的DNA、经标记的cDNA)进行聚合酶链式反应，以产生经标记的扩增子(例如，经随机标记的扩增子)。经标记的扩增子可以是双链分子。双链分子可以包括双链RNA分子、双链DNA分子或与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标记、空间标记、细胞标记和/或条形码序列(例如分子标记)。经标记的扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本披露的核酸可以包括合成的或改变的核酸。

扩增可以包括使用一个或多个非天然核苷酸。非天然核苷酸可以包括光不稳定性或可触发的核苷酸。非天然核苷酸的实例可以包括但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及二醇核酸(GNA)和苏糖核酸(TNA)。非天然核苷酸可以添加到扩增反应的一个或多个循环。非天然核苷酸的添加可以用于鉴定扩增反应中特定循环或时间点的产物。

进行一次或多次扩增反应可以包括使用一个或多个引物。一个或多个引物可以包含例如1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个或更多个核苷酸。一个或多个引物可以包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个或更多个核苷酸。一个或多个引物可以包含小于12-15个核苷酸。一个或多个引物可以退火至多个经标记的靶(例如，经随机标记的靶)的至少一部分。一个或多个引物可以退火至多个经标记的靶的3’末端或5’末端。一个或多个引物可以退火至多个经标记的靶的内部区域。内部区域可以是自多个经标记的靶的3’末端的至少约50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900或1000个核苷酸。一个或多个引物可以包括一组固定引物。一个或多个引物可以包括至少一个或多个定制引物。一个或多个引物可以包括至少一个或多个对照引物。一个或多个引物可以包括至少一个或多个基因特异性引物。

一个或多个引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一个或多个定制引物可以退火至第一样品标记、第二样品标记、空间标记、细胞标记、条形码序列(例如，分子标记)、靶或其任何组合。一个或多个引物可以包括通用引物和定制引物。定制引物可以被设计用于扩增一个或多个靶。靶可以包括一个或多个样品中总核酸的亚组。靶可以包括一个或多个样品中总的标记的靶的亚组。一个或多个引物可以包括至少96个或更多个定制引物。一个或多个引物可以包括至少960个或更多个定制引物。一个或多个引物可以包括至少9600个或更多个定制引物。一个或多个定制引物可以退火至两个或更多个不同的标记的核酸。两个或更多个不同的标记的核酸可以对应于一个或多个基因。

任何扩增方案可以用于本披露的方法中。例如，在一种方案中，第一轮PCR可以使用基因特异性引物和针对通用Illumina测序引物1序列的引物扩增连接到珠的分子。第二轮PCR可以使用侧接Illumina测序引物2序列的巢式基因特异性引物和针对通用Illumina测序引物1序列的引物扩增第一PCR产物。第三轮PCR添加P5和P7以及样品索引以将PCR产物转入到Illumina测序文库中。使用150bp×2测序的测序可以揭示读数1上的细胞标记和条形码序列(例如分子标记)、读数2上的基因和索引1读数上的样品索引。

在一些实施例中，可以使用化学切割将核酸从基底去除。例如，可以使用核酸中存在的化学基团或修饰碱基来有助于其从固体支持物的去除。例如，可以使用酶将核酸从基底去除。例如，可以通过限制性内切核酸酶消化将核酸从基底去除。例如，用尿嘧啶-d-糖基化酶(UDG)处理含有dUTP或ddUTP的核酸可以用于将核酸从基底去除。例如，可以使用执行核苷酸切除的酶诸如碱基切除修复酶诸如脱嘌呤/脱嘧啶(AP)将核酸从基底去除。在一些实施例中，可以使用光可切割的基团和光将核酸从基底去除。在一些实施例中，可以使用可切割接头将核酸从基底去除。例如，可切割接头可以包括生物素/抗生物素蛋白、生物素/链霉亲和素、生物素/中性链亲和素、Ig蛋白A、光不稳定性接头、酸或碱不稳定性接头或适体中的至少一种。

当探针是基因特异性的时，分子可以与探针杂交并且进行逆转录和/或扩增。在一些实施例中，在核酸已合成(例如逆转录)之后，可以对其进行合成。扩增可以多重复路方式执行，其中多个靶核酸序列同时进行扩增。扩增可以向核酸添加测序衔接子。

在一些实施例中，扩增可以在基底上例如以桥式扩增执行。可以对cDNA进行同聚物加尾以生成用于使用基底上的寡(dT)探针进行的桥式扩增的相容性端。在桥式扩增中，与模板核酸的3’端互补的引物可以是每对中共价地连接到固体颗粒的第一引物。当含有模板核酸的样品与颗粒接触并且执行单个热循环时，模板分子可以退火至第一引物并且通过添加核苷酸使第一引物在正向方向上延长以形成由模板分子和与模板互补的新形成的DNA组成的双链体分子。在下一循环的加热步骤中，可以使双链体分子变性，从而模板分子从颗粒中释放并且留下通过第一引物连接到颗粒的互补DNA链。在随后进行的退火和延长步骤的退火阶段中，互补链可以与第二引物杂交，该第二引物与从第一引物去除的位置处的互补链的区段互补。这种杂交可以使得互补链在第一引物与第二引物之间形成桥，该桥通过共价键固定到第一引物并且通过杂交固定到第二引物。在延长阶段中，可以通过在相同反应混合物中添加核苷酸使第二引物在反向方向上延长，从而将桥转化为双链桥。然后开始下一循环，并且可以使双链桥变性以产生两个单链的核酸分子，每个核酸分子具有经由第一引物和第二引物连接到颗粒的一端，并且每个核酸分子的另一端是未连接的。在这个第二循环的退火和延长步骤中，每个链可以与相同颗粒上的先前未使用的另外的互补引物杂交以形成新的单链桥。现在杂交的两种先前未使用的引物进行延长以将两个新桥转化为双链桥。

扩增反应可以包括扩增多个核酸的至少1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、97％或100％。

标记的核酸的扩增可以包括基于PCR的方法或基于非PCR的方法。标记的核酸的扩增可以包括标记的核酸的指数式扩增。标记的核酸的扩增可以包括标记的核酸的线性扩增。扩增可以通过聚合酶链式反应(PCR)执行。PCR可以是指用于通过同时引物延伸DNA的互补链进行特定DNA序列的体外扩增的反应。PCR可以涵盖反应的衍生形式，包括但不限于RT-PCR、实时PCR、巢式PCR、定量PCR、多重PCR、数字PCR、抑制PCR、半抑制PCR以及组装PCR。

在一些实施例中，标记的核酸的扩增包括基于非PCR的方法。基于非PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环-对-环扩增。其他基于非PCR的方法包括用于扩增DNA或RNA靶的DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多个循环、连接酶链式反应(LCR)、Qβ复制酶(Qβ)、使用回文探针、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、其中引物与核酸序列杂交并且所得双链体在延伸反应和扩增之前被切割的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增和/或分枝式延伸扩增(RAM)。

在一些实施例中，在此披露的方法进一步包括在扩增的扩增子(例如靶)上进行巢式聚合酶链式反应。扩增子可以是双链分子。双链分子可以包括双链RNA分子、双链DNA分子或与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标签或分子标识符标记。可替代地，扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本文所述的核酸可包含合成的或改变的核酸。

在一些实施例中，该方法包括重复地扩增标记的核酸以产生多个扩增子。在此披露的方法可以包括进行至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次扩增反应。可替代地，该方法包括进行至少约25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100次扩增反应。

扩增可以进一步包括将一个或多个对照核酸添加到包含多个核酸的一个或多个样品。扩增可以进一步包括将一个或多个对照核酸添加到多个核酸。对照核酸可以包含对照标记。

扩增可以包括使用一个或多个非天然核苷酸。非天然核苷酸可以包括光不稳定性和/或可触发的核苷酸。非天然核苷酸的实例包括但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及二醇核酸(GNA)和苏糖核酸(TNA)。非天然核苷酸可以添加到扩增反应的一个或多个循环。非天然核苷酸的添加可以用于鉴定扩增反应中特定循环或时间点的产物。

进行一次或多次扩增反应可以包括使用一个或多个引物。一个或多个引物可以包括一个或多个寡核苷酸。一个或多个寡核苷酸可以包含至少约7-9个核苷酸。一个或多个寡核苷酸可以包含小于12-15个核苷酸。一个或多个引物可以退火至多个标记的核酸的至少一部分。一个或多个引物可以退火至多个标记的核酸的3’端和/或5’端。一个或多个引物可以退火至多个标记的核酸的内部区域。内部区域可以是自多个标记的核酸的3’端的至少约50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900或1000个核苷酸。一个或多个引物可以包括一组固定引物。一个或多个引物可以包括至少一个或多个定制引物。一个或多个引物可以包括至少一个或多个对照引物。一个或多个引物可以包括至少一个或多个管家基因引物。一个或多个引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一个或多个定制引物可以退火至第一样品标签、第二样品标签、分子标识符标记、核酸或其产物。一个或多个引物可以包括通用引物和定制引物。定制引物可以被设计用于扩增一个或多个靶核酸。靶核酸可以包括一个或多个样品中总核酸的亚组。在一些实施例中，引物是连接到本披露的阵列的探针。

在一些实施例中，对样品中的多个靶进行条形码化(例如，随机条形码化)还包括生成经条形码化的靶(例如，经随机经条形码化的靶)或经条形码化的靶片段的索引文库。不同条形码的条形码序列(例如，不同随机条形码的分子标记)可以彼此是不同的。生成经条形码化的靶的索引文库包括由样品中的多个靶生成多个索引的多核苷酸。例如，对于包含第一索引的靶和第二索引的靶的经条形码化的靶的索引文库，第一索引的多核苷酸的标记区与第二索引的多核苷酸的标记区的区别可以在于，在于约，在于至少或在于至多1、2、3、4、5、6、7、8、9、10、20、30、40、50个核苷酸，或这些值中的任何两个之间的数字或范围。在一些实施例中，生成经条形码化的靶的索引文库包括使多个靶例如mRNA分子与多个寡核苷酸(包含聚(T)区和标记区)接触；并且使用逆转录酶进行第一链合成以产生单链标记的cDNA分子，每个cDNA分子包含cDNA区和标记区，其中多个靶包括具有不同序列的至少两个mRNA分子并且多个寡核苷酸包括具有不同序列的至少两个寡核苷酸。生成经条形码化的靶的索引文库可以进一步包括扩增单链标记的cDNA分子，以产生双链标记的cDNA分子；并且对双链标记的cDNA分子进行巢式PCR，以产生标记的扩增子。在一些实施例中，该方法可以包括生成衔接子标记的扩增子。

条形码化(例如，随机条形码化)可以使用核酸条形码或标签标记单独的核酸(例如DNA或RNA)分子。在一些实施例中，当cDNA分子由mRNA生成时，随机条形码化涉及将DNA条形码或标签添加到cDNA分子中。巢式PCR可以被进行来使PCR扩增偏移最小化。衔接子可以被添加来使用例如下一代测序(NGS)进行测序。测序结果可用于确定靶的一个或多个拷贝的细胞标记、分子标记和核苷酸片段序列，例如在图2的框232处。

图3是显示用于产生经条形码化的靶(例如经随机经条形码化的靶)(例如经条形码化的mRNA或其片段)的索引文库的非限制性示例性过程的示意图。如步骤1所示，逆转录过程可编码具有独特分子标记序列、细胞标记序列和通用PCR位点的每个mRNA分子。具体地，通过将一组条形码(例如随机条形码)310与RNA分子302的聚(A)尾区308杂交(例如随机杂交)，RNA分子302可以被逆转录来产生经标记的cDNA分子304(包括cDNA区306)。条形码310中的每个可以包含靶结合区，例如聚(dT)区312、标记区314(例如条形码序列或分子)和通用PCR区316。

在一些实施例中，细胞标记序列可以包含3至20个核苷酸。在一些实施例中，分子标记序列可以包含3至20个核苷酸。在一些实施例中，多个随机条形码中的每个进一步包含通用标记和细胞标记中的一个或多个，其中通用标记对于固体支持物上的多个随机条形码是相同的并且细胞标记对于固体支持物上的多个随机条形码是相同的。在一些实施例中，通用标记可以包含3至20个核苷酸。在一些实施例中，细胞标记包含3至20个核苷酸。

在一些实施例中，标记区314可以包含条形码序列或分子标记318和细胞标记320。在一些实施例中，标记区314可以包含通用标记、维标记以及细胞标记中的一个或多个。条形码序列或分子标记318的长度可以是，可以是约，可以是至少或可以是至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。细胞标记320的长度可以是，可以是约，可以是至少，或可以是至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。通用标记的长度可以是，可以是约，可以是至少或可以是至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。通用标记对于固体支持物上的多个随机条形码可以是相同的并且细胞标记对于固体支持物上的多个随机条形码可以是相同的。维标记的长度可以是，可以是约，可以是至少，或可以是至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。

在一些实施例中，标记区314可以包含，包含约，包含至少或包含至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000个或者在这些值中的任何值之间的数值或范围的不同标记，诸如条形码序列或分子标记318和细胞标记320。每个标记的长度可以是，可以是约，可以是至少或可以是至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。条形码或随机条形码310的组可以包含，包含约，包含至少或包含至多10、20、40、50、70、80、90、10²、10³、10⁴、10⁵、10⁶、10⁷、10⁸、10⁹、10¹⁰、10¹¹、10¹²、10¹³、10¹⁴、10¹⁵、10²⁰或这些值中的任何值之间的数值或范围的条形码或随机条形码310。并且，条形码或随机条形码310的组可以例如各自包含独特标记区314。经标记的cDNA分子304可以被纯化以去除多余的条形码或随机条形码310。纯化可以包括Ampure珠纯化。

如步骤2所示，来自步骤1的逆转录过程的产物可以合并到1个管中并且使用第1PCR引物库和第1通用PCR引物进行PCR扩增。由于独特的标记区314，合并是可能的。具体地，标记的cDNA分子304可以被扩增来产生巢式PCR标记的扩增子322。扩增可以包括多重PCR扩增。扩增可以包括在单一反应体积中使用96种多重引物进行的多重PCR扩增。在一些实施例中，多重PCR扩增可以利用，利用约，利用至少或利用至多10、20、40、50、70、80、90、10²、10³、10⁴、10⁵、10⁶、10⁷、10⁸、10⁹、10¹⁰、10¹¹、10¹²、10¹³、10¹⁴、10¹⁵、10²⁰个或者在这些值中的任何值之间的数值或范围的多重引物。扩增可包括使用第一PCR引物池324，其包含靶向特定基因的定制引物326A-C和通用引物328。定制引物326可以与经标记的cDNA分子304的cDNA部分306’内的区域杂交。通用引物328可以与经标记的cDNA分子304的通用PCR区316杂交。

如图3的步骤3所示，来自步骤2的PCR扩增的产物可以用巢式PCR引物库和第2通用PCR引物扩增。巢式PCR可以使PCR扩增偏移最小化。具体地，巢式PCR标记的扩增子322可以通过巢式PCR进一步扩增。巢式PCR可以包括在单一反应体积中使用巢式PCR引物332a-c的巢式PCR引物池330和第2通用PCR引物328’进行多重PCR。巢式PCR引物池328可以包含，包含约，包含至少或包含至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000个或者在这些值中的任何值之间的数值或范围的不同巢式PCR引物330。巢式PCR引物332可以含有衔接子334并且与经标记的扩增子322的cDNA部分306”内的区域杂交。通用引物328’可以含有衔接子336并且与标记的扩增子322的通用PCR区316杂交。因此，步骤3产生衔接子标记的扩增子338。在一些实施例中，巢式PCR引物332和第2通用PCR引物328’可以不含有衔接子334和336。衔接子334和336反而可以连接至巢式PCR的产物，以产生经衔接子标记的扩增子338。

如步骤4所示，来自步骤3的PCR产物可以使用文库扩增引物进行PCR扩增以用于测序。具体地，衔接子334和336可以用于对衔接子标记的扩增子338进行一种或多种另外的测定。衔接子334和336可以与引物340和342杂交。一个或多个引物340和342可以是PCR扩增引物。一个或多个引物340和342可以是测序引物。一个或多个衔接子334和336可以用于进一步扩增经衔接子标记的扩增子338。一个或多个衔接子334和336可以用于对经衔接子标记的扩增子338进行测序。引物342可以包含板索引344，从而可以使用下一代测序(NGS)在一个测序反应中对使用同一组条形码或随机条形码310产生的扩增子进行测序。

在核酸靶的5’末端进行条形码化

本文公开了用于将具有分子标记(或分子索引)的条形码(例如，随机条形码)附接至进行条形码化或进行标记的核酸靶(例如，脱氧核糖核酸分子，和核糖核酸分子)的5’末端的系统、方法、组合物和试剂盒。本文公开的基于5’的转录物计数方法可以补充或弥补例如基于3’的转录物计数方法(例如，Rhapsody^TM测定(贝克顿迪金森公司(富兰克林湖，新泽西州))，Chromium^TM单细胞3’解决方案(10X基因公司(旧金山，加利福尼亚州))。经条形码化的核酸靶可用于以高通量的方式进行序列鉴定、转录物计数、可变剪接分析、突变筛选和/或全长测序。针对5’末端(相对于进行标记的靶核酸靶为5’)的转录物计数可显示核酸分子5’末端的或接近核酸分子5’末端的可变剪接异构体和变体(包括但不限于剪接变体、单核苷酸多态性(SNP)、插入、缺失、取代)。在一些实施例中，所述方法可以涉及分子内杂交。

图4A-4B示出了在5’末端上基因特异性地标记核酸靶的非限制性示例性方法400的示意图。具有靶结合区(例如，聚(dT)尾422)的条形码420(例如，随机条形码)可以经由聚(dA)尾426与聚腺苷酸化RNA转录物424或其他核酸靶结合，用于进行标记或条形码化(例如，进行独特标记)。条形码420可包括用于分别标记转录物424和跟踪RNA转录物424的样品来源的分子标记(ML)428和样品标记(SL)430，以及一个或多个另外的序列(例如，共有序列，例如衔接子序列432)，其位于每个条形码420的分子标记428/样品标记430区域的侧翼，用于后续反应。每个样品的条形码中分子标记的序列库可以足够大用于对RNA转录物进行随机标记。

在框402处的cDNA合成以产生包含RNA转录物424(或其一部分)的经条形码化的cDNA分子434之后，基因特异性方法可用于进行5’分子条形码化。在框404进行基因特异性扩增后(其可以是任选的)，可以在框406处添加末端转移酶和三磷酸脱氧腺苷(dATP)，以促进3’聚(dA)加尾，从而产生带有聚(A)尾438的扩增子436。在框408处的短变性步骤允许分离扩增子436的正向链436m和反向链436c(例如，具有聚(dA)尾的经条形码化的cDNA分子)。在框410处，扩增子436的反向链436c可通过其3’末端的聚(dA)尾438和链的聚(dT)区422末端在分子内杂交以形成发夹或茎环440。然后在框412处，可使用聚合酶(例如，克列诺片段)从聚(dA)尾438延伸以复制条形码以形成经延伸的经条形码化的反向链442。然后可以执行框414处的基因特异性扩增(例如，任选地)以扩增目的基因，以产生在5’末端(相对于RNA转录物424)具有条形码的扩增子444，用于在框416处测序。在一些实施例中，方法400包括在框404处的经条形码化的cDNA分子434的基因特异性扩增和在框414处的经延伸的经条形码化的反向链442的基因特异性扩增中的一者或两者。

图5A-5B示出了针对全转录组分析在5’末端上标记核酸靶的非限制性示例性方法500的示意图。具有靶结合区(例如，聚(dT)尾422)的条形码420(例如，随机条形码)可以经由聚(dA)尾426与聚腺苷酸化RNA转录物424或其他核酸靶结合，用于进行标记或条形码化(例如，进行独特标记)。例如，具有靶结合区的条形码420可以与核酸靶结合用于进行标记或条形码化。条形码420可以包括分子标记(ML)428和样品标记(SL)430。分子标记428和样品标记430分别可用于标记转录物424或核酸靶(例如，抗体寡核苷酸，无论与抗体相关联还是已与抗体解离)和追踪转录物424的样品来源，连同一个或多个另外的序列(例如，共有序列，例如衔接子序列432)，其位于每个条形码420的分子标记428/样品标记430区域的侧翼，用于后续反应。每个样品的条形码中分子标记428的序列库可以足够大用于对RNA转录物424或核酸靶进行随机标记化。

在框402处合成cDNA以产生经条形码化的cDNA分子434后，在框406处可以使用末端转移酶对经条形码化的cDNA分子434的3’末端(相当于经标记的RNA转录物的5’末端)进行A加尾以产生各自具有3’聚(dA)尾438的cDNA分子436c。具有3’聚(dA)尾438的cDNA分子436c的分子内杂交可以被启动(例如，通过加热和冷却循环，或通过具有聚(dA)尾部438的经条形码化的cDNA分子436c的稀释)，使得新的3’聚(dA)尾438与同一经标记的cDNA分子的聚(dT)尾(尽管考虑到对于除聚(dA)以外的靶结合区序列，相关靶结合序列的相应互补体可以退火至靶结合区)422退火以在框410处产生经条形码化的cDNA分子发夹或茎环结构440。在框412处，可以添加聚合酶(例如克列诺酶)与dNTP，以促进3’延伸到新的3’聚(dA)尾438之外，从而复制条形码(例如分子标记428，其位于带有茎环440的经标记的cDNA分子的5’末端)。可以在框414处使用镜像的衔接子432、432rc或包含衔接子432、432rc的序列(或子序列)的引物进行全转录组扩增(WTA)。例如加标签或随机引物之类的方法可在框418处用于产生具有测序衔接子(例如，P5 446和P7 448序列)的较小扩增子444片段，以进行测序(例如，使用Illumina(圣地亚哥，加利福尼亚州，美国))测序仪)。在一些实施例中，可以将用于其他测序方法或测序仪(例如，来自加利福尼亚州太平洋生物科学公司(PacificBiosciences of California,Inc.)(曼洛帕克(Menlo Park)，加利福尼亚州，美国)或牛津纳米孔技术有限公司(Oxford Nanopore Technologies Limited)(牛津，英国)的测序仪)的测序衔接子直接连接以产生扩增子用于测序。

本文公开了用于确定样品中的核酸靶数量的方法。在一些实施例中，所述方法包括：使样品中的核酸靶424的拷贝与多个寡核苷酸条形码420接触，其中多个寡核苷酸条形码420中的每个包含分子标记序列428和能够与核酸靶424杂交的靶结合区(例如，聚(dT)序列422)，并且其中多个寡核苷酸条形码420中的至少10个包含不同的分子标记序列428；在框402处，延伸与寡核苷酸条形码420杂交的核酸靶424的拷贝以产生多个核酸分子434，每个核酸分子434包含与核酸靶424的至少一部分互补的序列450c；在框404处，扩增多个经条形码化的核酸分子434以产生多个经扩增的经条形码化的核酸分子436；在框406处，将包含靶结合区422的互补体438的寡核苷酸附接至多个经扩增的经条形码化的核酸分子436，以产生多个经条形码化的核酸分子436c，每个经条形码化的核酸分子436c包含靶结合区422和靶结合区的互补体438；在框410处，使靶结合区422和多个经条形码化的核酸分子436c中的每一个内的靶结合区422的互补体438杂交以形成茎环440；在框412处，延伸各自具有茎环440的多个经条形码化的核酸分子的3’末端以延伸茎环440，以产生多个经延伸的经条形码化的核酸分子442，每个经延伸的经条形码化的核酸分子442包含分子标记428和分子标记的互补体428rc；在框414处，扩增多个经延伸的经条形码化的核酸分子442，以产生多个经单标记的核酸分子444c，每个经单标记的核酸分子444c包含分子标记的互补体428rc；并且基于与多个经单标记的核酸分子相关联的具有不同序列的分子标记的互补序列428rc的数量，确定样品中的核酸靶的数量。

在一些实施例中，在延伸多个经条形码化的具有茎环440的核酸分子的3’末端之后，分子标记428与分子标记的互补体428rc杂交。所述方法可以包括在扩增多个经延伸的经条形码化的核酸分子442以产生多个经单标记核酸分子444c(其可以是扩增子444c的一部分)之前，使多个经延伸的经条形码化的核酸分子442变性。使样品中的核酸靶424的拷贝接触可以包括使多个核酸靶424的拷贝接触多个寡核苷酸条形码420。延伸核酸靶424的拷贝可包括延伸与寡核苷酸条形码420杂交的多个核酸靶424的拷贝，以产生多个经条形码化的核酸分子436c，每个经条形码化的核酸分子436c包含与多个核酸靶424中之一的至少一部分互补的序列450c。确定核酸靶424的数量可包括基于与包含多个核酸靶424中的每一个的序列452c的多个经单标记的核酸分子444c的经单标记的核酸分子相关联的具有不同序列的分子标记的互补序列428rc的数量，确定样品中的多个核酸靶424中各自的数量。多个核酸靶中的每个的序列452c可以包含多个核酸靶424中的每个的子序列(包括互补体或反向互补体)。

本文公开了用于确定样品中的靶数量的方法。在一些实施例中，所述方法包括：使用多个寡核苷酸条形码420对样品中的核酸靶424的拷贝进行条形码化，以产生多个经条形码化的核酸分子434，每个经条形码化的核酸分子434包含核酸靶424的序列450c(例如，互补序列、反向互补序列或其组合)，分子标记428和靶结合区(例如聚(dT)区422)，并且其中多个寡核苷酸条形码420中的至少10个包含不同的分子标记序列428；将包含靶结合区422的互补体438的寡核苷酸附接406至多个经条形码化的核酸分子434，以产生多个经条形码化的核酸分子436，每个经条形码化的核酸分子436包含靶结合区422和靶结合区422的互补体438；使靶结合区422和多个经条形码化的核酸分子436c中的每一个内的靶结合区的互补体438杂交410以形成茎环440；延伸412多个经条形码化的核酸分子的3’末端以延伸茎环440，以产生多个经延伸的经条形码化的核酸分子442，每个经延伸的经条形码化的核酸分子442包含分子标记428和分子标记的互补体428rc；并且基于与多个经延伸的经条形码化的核酸分子442相关联的具有不同序列的分子标记的互补序列428rc的数量，确定样品中的核酸靶424的数量。

本文公开了用于将寡核苷酸条形码附接至样品中的靶的方法。在一些实施例中，所述方法包括：使用多个寡核苷酸条形码420对样品中的核酸靶424的拷贝进行条形码化，以产生多个经条形码化的核酸分子434，每个经条形码化的核酸分子434包含核酸靶424的序列450c、分子标记428和靶结合区422，并且其中多个寡核苷酸条形码420中的至少10个包含不同的分子标记序列428；将包含靶结合区422的互补体438的寡核苷酸附接至多个经条形码化的核酸分子434，以产生多个经条形码化的核酸分子436c，每个经条形码化的核酸分子436c包含靶结合区422和靶结合区422的互补体438；使靶结合区422和多个经条形码化的核酸分子436c中的每一个内的靶结合区422的互补体438杂交410以形成茎环440；并且延伸412多个经条形码化的核酸分子的3’末端以延伸茎环440，以产生多个经延伸的经条形码化的核酸分子442，每个经延伸的经条形码化的核酸分子442包含分子标记428和分子标记428的互补体428rc。在一些实施例中，所述方法包括：基于与多个经延伸的经条形码化的核酸分子442相关联的具有不同序列的分子标记428、其互补序列428rc或其组合的数量，确定样品中的核酸靶424的数量。例如，可以基于具有不同序列的分子标记428、其互补序列428rc之一或两者来确定核酸靶424的数量。

在一些实施例中，所述方法包括：对多个靶424的拷贝进行条形码化402，包括：使核酸靶424的拷贝与多个寡核苷酸条形码420接触，其中多个寡核苷酸条形码420中的每一个包含能够与核酸靶424杂交的靶结合区422；然后延伸402与寡核苷酸条形码420杂交的核酸靶424的拷贝，以产生多个经条形码化的核酸分子434。

在一些实施例中，所述方法包括：扩增404多个经条形码化的核酸分子434以产生多个经扩增的经条形码化的核酸分子436c，其中将包含靶结合区422的互补体438的寡核苷酸附接包括：将包含靶结合区的互补体438的寡核苷酸附接至多个经扩增的经条形码化的核酸分子，以产生多个经条形码化的核酸分子436r，每个经条形码化的核酸分子436r包含靶结合区422和靶结合区的互补体438。

基因特异性分析。在一些实施例中，所述方法(例如，方法400)包括：扩增414多个经延伸的经条形码化的核酸分子442，以产生多个经单标记的核酸分子444c，每个经单标记的核酸分子444c包含分子标记428的互补体428rc。当包含经单标记的核酸分子444c的扩增子444变性时，可以产生经单标记的核酸分子444c。确定样品中的核酸靶424的数量可包括：基于与多个经单标记的核酸分子444c相关联的具有不同序列的分子标记428的互补序列428rc的数量，确定样品中的核酸靶424的数量。

全转录组分析。在一些实施例中，所述方法(例如，方法500)包括：扩增414多个经延伸的经条形码化的核酸分子442，以产生多个经延伸的经条形码化的核酸分子的拷贝444c。确定样品中的核酸靶424的数量包括：基于与多个经延伸的经条形码化的核酸分子的拷贝444c相关联的具有不同序列的分子标记428的互补序列428rc的数量，确定样品中的核酸靶424的数量。当包含多个经延伸的经条形码化的核酸分子的拷贝444c的扩增子444被变性时，可以形成多个经延伸的经条形码化的核酸分子的拷贝444c。

在一些实施例中，多个经条形码化的核酸分子中的核酸靶的序列包含核酸靶的子序列452c。靶结合区可包含基因特异性序列。附接406包含靶结合区422的互补体438的寡核苷酸可以包括将包含靶结合区422的互补体438的寡核苷酸与多个经条形码化的核酸分子434连接。

在一些实施例中，靶结合区可包含聚(dT)序列422(其在本文中也可称为寡(dT)序列)。附接包含靶结合区422的互补体438的寡核苷酸包括：使用末端脱氧核苷酸转移酶将多个腺苷一磷酸添加至多个经条形码化的核酸分子434。在一些实施例中，靶结合区不包含聚(dT)序列。

在一些实施例中，延伸与寡核苷酸条形码420杂交的核酸靶424的拷贝可包括逆转录与寡核苷酸条形码420杂交的核酸靶424的拷贝以产生多个经条形码化的互补脱氧核糖核酸(cDNA)分子434。延伸与寡核苷酸条形码420杂交的核酸靶424的拷贝可包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中至少一种的DNA聚合酶延伸402与寡核苷酸条形码420杂交的核酸靶424的拷贝。DNA聚合酶可以包含克列诺(Klenow)片段。

在一些实施例中，所述方法包括：获得多个经延伸的经条形码化的核酸分子442的序列信息。获得序列信息可以包括将测序衔接子(例如，P5 446和P7 448衔接子)附接到多个经延伸的经条形码化的核酸分子442。

在一些实施例中，靶结合区的互补体438可包含靶结合区的反向互补序列。靶结合区的互补体438可以包含靶结合区的互补序列。分子标记的互补体428rc可以包含分子标记的反向互补序列。分子标记的互补体可以包含分子标记的互补序列。

在一些实施例中，多个经条形码化的核酸分子434可包含经条形码化的脱氧核糖核酸(DNA)分子。经条形码化的核酸分子434可以包含经条形码化的核糖核酸(RNA)分子。核酸靶424可以包含核酸分子。核酸分子可包含核糖核酸(RNA)、信使RNA(mRNA)、微小RNA、小干扰RNA(siRNA)、RNA降解产物、包含聚(A)尾的RNA、或其任意组合。

抗体寡核苷酸。在一些实施例中，核酸靶可包含细胞组分结合试剂。与核酸靶相关联的细胞结合试剂(例如，抗体寡核苷酸，诸如样品索引寡核苷酸)已经描述于US 2018/0088112；以及2018年3月27日提交的美国申请号15/937,713；这些申请中的每一个的内容通过引用整体并入本文。在一些实施例中，可以使用本披露的5’条形码化方法获得单细胞的多组学信息，例如基因组学、染色质可接近性、甲基化组学、转录组学和蛋白质组学。核酸分子可以与细胞组分结合试剂相关联。所述方法可以包括：使所述核酸分子和所述细胞组分结合试剂解离。

在一些实施例中，多个寡核苷酸条形码420的每个分子标记428包含至少6个核苷酸。寡核苷酸条形码420可包含相同的样品标记430。多个寡核苷酸条形码420的每个样品标记430可包含至少6个核苷酸。寡核苷酸条形码420可以包含相同的细胞标记。多个寡核苷酸条形码420的每个细胞标记可包含至少6个核苷酸。

在一些实施例中，当使靶结合区和多个经条形码化的核酸分子中的每个之内的靶结合区的互补体杂交410形成茎环时，多个经条形码化的核酸分子436c中的至少一个与固体支持物相关联。当使靶结合区422和多个经条形码化的核酸分子436c中的每个之内的靶结合区422的互补体438杂交410形成茎环440时，多个经条形码化的核酸分子436c中的至少一个可以与固体支持物解离。当使靶结合区422和多个经条形码化的核酸分子436c中的每个之内的靶结合区的互补体438杂交410形成茎环440时，多个经条形码化的核酸分子436c中的至少一个可以与固体支持物相关联。

在一些实施例中，当延伸412多个经条形码化的核酸分子的3’末端以延伸茎环440从而产生多个经延伸的经条形码化的核酸分子442(每个经延伸的经条形码化的核酸分子442包含分子标记428和分子标记的互补体428rc)时，多个经条形码化的核酸分子中至少一个与固体支持物相关联。当延伸412多个经条形码化的核酸分子的3’末端以延伸茎环440从而产生多个经延伸的经条形码化的核酸分子442(每个经延伸的经条形码化的核酸分子442包含分子标记428和分子标记的互补体428rc)时，多个经条形码化的核酸分子中至少一个可以与固体支持物解离。当延伸412多个经条形码化的核酸分子的3’末端以延伸茎环440从而产生多个经延伸的经条形码化的核酸分子442(每个经延伸的经条形码化的核酸分子442包含分子标记428和分子标记的互补体428rc)时，多个经条形码化的核酸分子436c中至少一个可以与固体支持物相关联。固体支持物可以包含合成颗粒454。固体支持物可包含平坦表面或基本平坦的表面(例如载玻片，例如显微镜载玻片或盖玻片)。

在一些实施例中，当使靶结合区422和多个经条形码化的核酸分子436c中的每个之内的靶结合区422的互补体438杂交410形成茎环440时，多个经条形码化的核酸分子436c中的至少一个处在溶液中。例如，当溶液中的多个经条形码化的核酸分子436c的浓度足够低时，会发生这种分子内杂交。当延伸412多个经条形码化的核酸分子的3’末端以延伸茎环440从而产生多个经延伸的经条形码化的核酸分子442(每个经延伸的经条形码化的核酸分子442包含分子标记428和分子标记的互补体428rc)时，多个经条形码化的核酸分子中至少一个可以处在溶液中。

在一些实施例中，样品包括单细胞，所述方法包括使包含多个寡核苷酸条形码420的合成颗粒454与样品中的单细胞相关联。所述方法可以包括：在将合成颗粒454与单细胞相关联之后，裂解单细胞。裂解单细胞可以包括将样品加热、使样品与洗涤剂接触、改变样品的pH、或其任何组合。合成颗粒和单细胞可以在相同的孔中。合成颗粒和单细胞可以在相同的滴中。

在一些实施例中，多个寡核苷酸条形码420中的至少一个可以固定在合成颗粒454上。多个寡核苷酸条形码420中的至少一个可以部分地固定在合成颗粒454上。多个寡核苷酸条形码420中的至少一个可以封闭在合成颗粒454中。多个寡核苷酸条形码420中的至少一个可以部分地封闭在合成颗粒454中。合成颗粒454可以是可破坏的。合成颗粒454可以包含珠。珠可以包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。合成颗粒454可以包含选自下组的材料，该组由以下组成：聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、琼脂糖凝胶、纤维素、尼龙、硅酮、及其任何组合。合成颗粒454可以包含可破坏的水凝胶颗粒。多个寡核苷酸条形码420中的每一个可以包含接头官能团。合成颗粒454可以包含固体支持物官能团。支持物官能团和接头官能团可以彼此相关联。接头官能团和支持物官能团可以单独地选自下组，该组由以下组成：C6、生物素、链霉亲和素、一个或多个伯胺、一个或多个醛、一个或多个酮、及其任何组合。

用于在核酸靶的5’末端进行条形码化的试剂盒

本文公开了试剂盒，其用于将寡核苷酸条形码420附接至样品中的靶424，确定样品中的靶424的数量和/或确定样品中的核酸靶424的数量。在一些实施例中，试剂盒包括：多个寡核苷酸条形码420，其中多个寡核苷酸条形码420中的每个包含分子标记428和靶结合区(例如，聚(dT)序列422)，并且其中所述多个寡核苷酸条形码420中的至少10个包含不同的分子标记序列428；末端脱氧核苷酸转移酶或连接酶；以及缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶。试剂盒可包含多个寡核苷酸，所述多个寡核苷酸包含靶结合区的互补体。可以将包含靶结合区的互补体的多个寡核苷酸与多个寡核苷酸条形码分开。在一些实施例中，包含靶结合区的互补体的多个寡核苷酸被配置为附接至DNA分子例如cDNA分子的3’末端。包含靶结合区的互补体的多个寡核苷酸可用于与靶结合区杂交，从而DNA分子形成如本文所述的发夹。DNA聚合酶可以包含克列诺(Klenow)片段。试剂盒可包含缓冲液。试剂盒可包含柱体。试剂盒可包含用于逆转录反应的一种或多种试剂。试剂盒可包含用于扩增反应的一种或多种试剂。

在一些实施例中，靶结合区包含基因特异性序列、寡聚(dT)序列、随机多聚体、或其任何组合。寡核苷酸条形码可以包含相同的样品标记和/或相同的细胞标记。多个寡核苷酸条形码的每个样品标记和/或细胞标记可包含至少6个核苷酸。多个寡核苷酸条形码的每个分子标记可包含至少6个核苷酸。

在一些实施例中，多个寡核苷酸条形码420中的至少一个固定在合成颗粒454上。多个寡核苷酸条形码420中的至少一个可以部分地固定在合成颗粒454上。多个寡核苷酸条形码420中的至少一个可以封闭在合成颗粒454中。多个寡核苷酸条形码420中的至少一个可以部分地封闭在合成颗粒454中。合成颗粒454可以是可破坏的。合成颗粒454可以包含珠。珠可以包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。合成颗粒可以包含选自下组的材料，该组由以下组成：聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、琼脂糖凝胶、纤维素、尼龙、硅酮、及其任何组合。合成颗粒454可以包含可破坏的水凝胶颗粒。多个寡核苷酸条形码中的每一个可以包含接头官能团。合成颗粒454可以包含固体支持物官能团。支持物官能团和接头官能团可以彼此相关联。接头官能团和支持物官能团可以单独地选自下组，该组由以下组成：C6、生物素、链霉亲和素、一个或多个伯胺、一个或多个醛、一个或多个酮、及其任何组合。

虽然在此已披露了各个方面和实施例，其他方法和实施例对于本领域技术人员而言将是清楚的。在此所披露的各个方面和实施例是出于说明的目的并且不预期是限制性的，其中真实的范围和精神是由以下权利要求书所指示的。

本领域的技术人员将理解，对于本文披露的这个和其他过程和方法，可以以不同的顺序来实现在所述过程和方法中执行的功能。此外，概述的步骤和操作仅作为示例提供，并且某些步骤和操作可以是任选的，在不背离所披露实施例的实质的情况下可以组合为较少的步骤和操作，或者可以扩展为附加的步骤和操作。

关于在此使用基本上任何复数和/或单数术语，那些本领域技术人员可以根据上下文和/或应用的需要将复数翻译成单数和/或将单数翻译成复数。为了清晰起见，可以在此清晰地列出各种单数/复数的转换。

本领域技术人员将理解的是，一般而言，在此所使用的术语，尤其是在所附权利要求书中的术语(例如，所附权利要求书的主体)通常意指“开放性的”术语(例如，术语“包含(including)”应当被解释为“包含但不局限于”，术语“具有”应当被解释为“具有至少”，术语“包括(includes)”应当被解释为“包括但不限于”等)。本领域的普通技术人员另外将认识到的是，如果意指特定数量的一种所介绍的权利要求陈述，那么将在该权利要求中明确陈述这种意思，并且在无这类陈述的存在下，不呈现这种意思。例如，为了有助于理解，以下所附权利要求书可以包含介绍性短语“至少一个”和“一个或多个”的使用，以用来介绍权利要求陈述。然而，此类短语的使用不应当解释为意指经由不定冠词“一个”或“一种”介绍权利要求陈述将任何含有此类介绍的权利要求陈述的具体权利要求限制于仅含有一个这种陈述的实施例，即使在相同的权利要求包括介绍性短语“一个或多个”或“至少一个”以及不定冠词例如“一个”或“一种”(例如，“一个”和/或“一种”，也应当解释为表示“至少一个”或“一个或多个”)的时候也是如此；这对于使用定冠词来介绍权利要求陈述同样适用。另外，即使明确地陈述一个介绍的权利要求陈述的特定数量，本领域技术人员将会意识到此陈述物也应当解释为意味着至少该陈述的数量(例如，仅陈述“两个陈述”而无其他修饰语意指至少两个陈述，或两个或者多个陈述)。此外，在使用类似于“A、B以及C等中的至少一个”的惯例的情况下，通常这样的句法结构意指在一定意义上本领域技术人员将理解该惯例(例如，“具有A、B以及C中的至少一个的系统”将包括但不局限于仅具有A、仅具有B、仅具有C、同时具有A和B、同时具有A和C、同时具有B和C、和/或同时具有A、B以及C等的系统)。在使用类似于“A、B以及C等中的至少一个”的惯例的情况下，通常这样的句法结构意指在一定意义上本领域技术人员将理解该惯例(例如，“具有A、B或C中的至少一个的系统”将包括但不局限于仅具有A、仅具有B、仅具有C、同时具有A和B、同时具有A和C、同时具有B和C、和/或同时具有A、B以及C等的系统)。本领域的普通技术人员将进一步理解的是无论是在说明书、权利要求书还是附图中，呈现两个或更多个替代性术语的几乎任何分离性词语和/或短语都应当理解为考虑到了包括这些术语中的一者、这些术语中的任一者或这两个术语的可能性。例如，短语“A或B”应理解为包括“A”或“B”或“A和B”的可能性。

此外，当以马库什(Markush)组的方式描述本披露的多个特征或方面时，在本领域内的技术人员将会认识到还以该马库什组中任一个单独的成员或多个成员的子组的方式来对本披露进行描述。

如本领域技术人员将理解，出于诸如就提供书面说明而言的任何和所有目的，在此披露的所有范围也包括任何和所有可能的子范围及其子范围的组合。任何列出的范围都可以容易被认为已经充分描述并使得同一范围分成至少相等的二等分、三等分、四等分、五等分、十等分等。作为一个非限制性实例，在此讨论的每个范围可以容易分为下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的是，所有诸如“多至”、“至少”等语言包括所提数值，并且是指可以接着分成如上所讨论的子范围的范围。最后，如本领域技术人员将理解，一个范围包括每个独立成员。因此，例如，具有1-3个细胞的组是指具有1、2或3个细胞的组。类似地，具有1-5个细胞的组是指具有1、2、3、4或5个细胞的组，等等。

根据前述内容，将理解的是，出于说明的目的已经在本文中描述了本披露的各种实施例，并且在不脱离本披露的范围和精神的情况下可以进行各种修改。因此，本文披露的各种实施例不旨在限制，真实的范围和精神由所附权利要求指示。

Claims

1.一种将寡核苷酸条形码附接至样品中的核酸靶并且产生多个经延伸的经条形码化的核酸分子的方法，所述方法包括：

使用多个寡核苷酸条形码对样品中的所述核酸靶的拷贝进行条形码化，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含所述核酸靶的序列、分子标记和靶结合区，并且其中所述多个寡核苷酸条形码中的至少10个包含不同的分子标记序列，其中对所述核酸靶的拷贝进行条形码化包括：

使所述核酸靶的拷贝与所述多个寡核苷酸条形码接触，其中所述多个寡核苷酸条形码中的每一个包含所述靶结合区，其中所述靶结合区与所述核酸靶杂交；并且

延伸与所述寡核苷酸条形码杂交的所述核酸靶的拷贝，以产生多个经条形码化的核酸分子；

将包含所述靶结合区的互补体的寡核苷酸附接至所述多个经条形码化的核酸分子，以产生多个延长的经条形码化的核酸分子，每个延长的经条形码化的核酸分子包含所述靶结合区和所述靶结合区的互补体；

使所述多个延长的经条形码化的核酸分子中的每一个内的所述靶结合区和所述靶结合区的互补体杂交以形成茎环；并且

延伸所述多个延长的经条形码化的核酸分子的3’末端以延伸所述茎环，以产生多个经延伸的经条形码化的核酸分子，每个经延伸的经条形码化的核酸分子包含所述分子标记和所述分子标记的互补体。

2.如权利要求1所述的方法，所述方法进一步包括：基于与所述多个经延伸的经条形码化的核酸分子相关联的具有不同序列的分子标记、其互补序列或其组合的数量，确定所述样品中的所述核酸靶的数量。

3.一种用于确定样品中靶的数量的方法，所述方法包括：

使用多个寡核苷酸条形码对样品中的核酸靶的拷贝进行条形码化，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含所述核酸靶的序列、分子标记和靶结合区，并且其中所述多个寡核苷酸条形码中的至少10个包含不同的分子标记序列，其中对所述核酸靶的拷贝进行条形码化包括：

使所述多个延长的经条形码化的核酸分子中的每一个内的所述靶结合区和所述靶结合区的互补体杂交以形成茎环；

延伸所述多个延长的经条形码化的核酸分子的3’末端以延伸所述茎环，以产生多个经延伸的经条形码化的核酸分子，每个经延伸的经条形码化的核酸分子包含所述分子标记和所述分子标记的互补体；并且

基于与所述多个经延伸的经条形码化的核酸分子相关联的具有不同序列的分子标记的互补序列的数量，确定所述样品中的所述核酸靶的数量。

4.如权利要求1-3中任一项所述的方法，

所述方法包括扩增所述多个经条形码化的核酸分子以产生多个经扩增的经条形码化的核酸分子，

其中附接包含所述靶结合区的所述互补体的所述寡核苷酸包括：将包含所述靶结合区的所述互补体的所述寡核苷酸附接至所述多个经扩增的经条形码化的核酸分子，以产生多个延长的经条形码化的核酸分子，每个延长的经条形码化的核酸分子包含所述靶结合区和所述靶结合区的互补体。

5.如权利要求2-3中任一项所述的方法，

所述方法包括扩增所述多个经延伸的经条形码化的核酸分子，以产生多个经单标记的核酸分子，每个经单标记的核酸分子包含来源于延伸3’末端的步骤的分子标记的所述互补体，其中所述多个经单标记的核酸分子不包含来源于将所述核酸靶的拷贝条形码化的步骤的分子标记；

其中确定所述样品中的所述核酸靶的数量包括：基于与所述多个经单标记的核酸分子相关联的具有不同序列的分子标记的互补序列的数量，确定所述样品中的所述核酸靶的数量。

6.如权利要求2-3中任一项所述的方法，

所述方法包括扩增所述多个经延伸的经条形码化的核酸分子，以产生所述多个经延伸的经条形码化的核酸分子的拷贝，

其中确定所述样品中的所述核酸靶的数量包括：基于与所述多个经延伸的经条形码化的核酸分子的拷贝相关联的具有不同序列的分子标记的互补序列的数量，确定所述样品中的所述核酸靶的数量。

7.一种确定样品中的核酸靶的数量的方法，所述方法包括：

使样品中的核酸靶的拷贝与多个寡核苷酸条形码接触，其中所述多个寡核苷酸条形码中的每个包含分子标记和能够与所述核酸靶杂交的靶结合区，并且其中所述多个寡核苷酸条形码中的至少10个包含不同的分子标记序列；

延伸与所述寡核苷酸条形码杂交的核酸靶的拷贝以产生多个核酸分子，每个核酸分子包含与所述核酸靶的至少一部分互补的序列；

扩增多个经条形码化的核酸分子以产生多个经扩增的经条形码化的核酸分子；

将包含所述靶结合区的互补体的寡核苷酸附接至所述多个经扩增的经条形码化的核酸分子，以产生多个延长的经条形码化的核酸分子，每个延长的经条形码化的核酸分子包含所述靶结合区和所述靶结合区的互补体；

延伸所述多个延长的经条形码化的核酸分子的3’末端以延伸所述茎环，以产生多个经延伸的经条形码化的核酸分子，每个经延伸的经条形码化的核酸分子包含所述分子标记和所述分子标记的互补体；

扩增所述多个经延伸的经条形码化的核酸分子，以产生多个经单标记的核酸分子，每个经单标记的核酸分子包含所述分子标记的所述互补体；并且

基于与所述多个经单标记的核酸分子相关联的具有不同序列的分子标记的互补序列的数量，确定所述样品中的所述核酸靶的数量。

8.如权利要求7所述的方法，其中在延伸所述多个延长的经条形码化的核酸分子的3’末端之后，将所述分子标记与所述分子标记的互补体杂交，所述方法包括使所述多个经延伸的经条形码化的核酸分子变性，之后扩增所述多个经延伸的经条形码化的核酸分子以产生所述多个经单标记的核酸分子。

9.如权利要求7所述的方法，

其中使所述样品中的所述核酸靶的拷贝接触包括使多个核酸靶的拷贝接触多个寡核苷酸条形码，

其中延伸所述核酸靶的拷贝包括延伸与所述寡核苷酸条形码杂交的多个核酸靶的拷贝，以产生多个经条形码化的核酸分子，每个经条形码化的核酸分子包含与所述多个核酸靶中之一的至少一部分互补的序列，并且

其中确定所述核酸靶的数量包括基于与包含所述多个核酸靶中的每一个的序列的多个经单标记的核酸分子中的经单标记的核酸分子相关联的具有不同序列的分子标记的互补序列的数量，确定所述样品中的所述多个核酸靶中各自的数量。

10.如权利要求9所述的方法，其中所述多个核酸靶中的每个的序列包含所述多个核酸靶中的每个的子序列。

11.如权利要求1或3中任一项所述的方法，其中所述多个经条形码化的核酸分子中的核酸靶的序列包含所述核酸靶的子序列。

12.如权利要求1、3或7中任一项所述的方法，其中所述靶结合区包含基因特异性序列。

13.如权利要求1、3或7中任一项所述的方法，其中附接包含所述靶结合区的所述互补体的所述寡核苷酸包括：将包含所述靶结合区的所述互补体的所述寡核苷酸与所述多个经条形码化的核酸分子连接。

14.如权利要求1、3或7中任一项所述的方法，

其中所述靶结合区包含聚(dT)序列，并且

其中附接包含所述靶结合区的所述互补体的所述寡核苷酸包括：使用末端脱氧核苷酸转移酶将多个腺苷一磷酸添加至所述多个经条形码化的核酸分子。

15.如权利要求1、3或7中任一项所述的方法，其中延伸与所述寡核苷酸条形码杂交的所述核酸靶的所述拷贝包括逆转录与所述寡核苷酸条形码杂交的所述核酸靶的所述拷贝以产生多个经条形码化的互补脱氧核糖核酸(cDNA)分子。

16.如权利要求1、3或7中任一项所述的方法，其中延伸与所述寡核苷酸条形码杂交的所述核酸靶的所述拷贝包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中至少一种的DNA聚合酶延伸与所述寡核苷酸条形码杂交的所述核酸靶的所述拷贝。

17.如权利要求16所述的方法，其中所述DNA聚合酶包含克列诺片段。

18.如权利要求1、3或7中任一项所述的方法，所述方法包括获得所述多个经延伸的经条形码化的核酸分子的序列信息。

19.如权利要求18所述的方法，其中获得所述序列信息包括将测序衔接子附接至所述多个经延伸的经条形码化的核酸分子。

20.如权利要求1、3或7中任一项所述的方法，其中所述靶结合区的互补体包含所述靶结合区的反向互补序列。

21.如权利要求1、3或7中任一项所述的方法，其中所述分子标记的互补体包含所述分子标记的反向互补序列。

22.如权利要求1、3或7中任一项所述的方法，其中所述多个经条形码化的核酸分子包含经条形码化的脱氧核糖核酸(DNA)分子。

23.如权利要求1、3或7中任一项所述的方法，其中所述核酸靶包含核糖核酸(RNA)，或由核糖核酸(RNA)组成。

24.如权利要求23所述的方法，其中所述核糖核酸(RNA)包含信使RNA(mRNA)、微小RNA、小干扰RNA(siRNA)或RNA降解产物。

25.如权利要求1、3或7中任一项所述的方法，其中所述核酸靶包含含聚(A)尾的RNA。

26.如权利要求1、3或7中任一项所述的方法，其中所述核酸靶与细胞组分结合试剂共价地关联。

27.如权利要求26所述的方法，所述方法包括使所述核酸靶和所述细胞组分结合试剂解离。

28.如权利要求1、3或7中任一项所述的方法，其中所述多个寡核苷酸条形码的每个分子标记包含至少6个核苷酸。

29.如权利要求1、3或7中任一项所述的方法，其中所述寡核苷酸条形码包含相同的样品标记。

30.如权利要求29所述的方法，其中所述多个寡核苷酸条形码的每个样品标记包含至少6个核苷酸。

31.如权利要求1、3或7中任一项所述的方法，其中所述寡核苷酸条形码包含相同的细胞标记。

32.如权利要求31所述的方法，其中所述多个寡核苷酸条形码的每个细胞标记包含至少6个核苷酸。

33.如权利要求1、3或7中任一项所述的方法，其中当使所述多个延长的经条形码化的核酸分子中的每个之内的所述靶结合区和所述靶结合区的互补体杂交形成茎环时，所述多个延长的经条形码化的核酸分子中的至少一个与固体支持物共价地关联。

34.如权利要求1、3或7中任一项所述的方法，其中当使所述多个延长的经条形码化的核酸分子中的每个之内的所述靶结合区和所述靶结合区的互补体杂交形成茎环时，所述多个延长的经条形码化的核酸分子中的至少一个与固体支持物解离。

35.如权利要求1、3或7中任一项所述的方法，其中当使所述多个延长的经条形码化的核酸分子中的每个之内的所述靶结合区和所述靶结合区的互补体杂交形成茎环时，所述多个延长的经条形码化的核酸分子中的至少一个不与固体支持物共价地关联。

36.如权利要求1、3或7中任一项所述的方法，其中当延伸所述多个延长的经条形码化的核酸分子的3’末端以延伸所述茎环从而产生各自包含所述分子标记和所述分子标记的互补体的多个经延伸的经条形码化的核酸分子时，所述多个延长的经条形码化的核酸分子中的至少一个与固体支持物共价地关联。

37.如权利要求1、3或7中任一项所述的方法，其中当延伸所述多个延长的经条形码化的核酸分子的3’末端以延伸所述茎环从而产生各自包含所述分子标记和所述分子标记的互补体的多个经延伸的经条形码化的核酸分子时，所述多个延长的经条形码化的核酸分子中的至少一个与固体支持物解离。

38.如权利要求1、3或7中任一项所述的方法，其中当延伸所述多个延长的经条形码化的核酸分子的3’末端以延伸所述茎环从而产生各自包含所述分子标记和所述分子标记的互补体的多个经延伸的经条形码化的核酸分子时，所述多个延长的经条形码化的核酸分子中的至少一个不与固体支持物共价地关联。

39.如权利要求33所述的方法，其中所述固体支持物包含合成颗粒。

40.如权利要求34所述的方法，其中所述固体支持物包含合成颗粒。

41.如权利要求35所述的方法，其中所述固体支持物包含合成颗粒。

42.如权利要求36所述的方法，其中所述固体支持物包含合成颗粒。

43.如权利要求37所述的方法，其中所述固体支持物包含合成颗粒。

44.如权利要求38所述的方法，其中所述固体支持物包含合成颗粒。

45.如权利要求1、3或7中任一项所述的方法，其中当使所述多个延长的经条形码化的核酸分子中的每个之内的所述靶结合区和所述靶结合区的互补体杂交形成茎环时，所述多个延长的经条形码化的核酸分子中的至少一个处于溶液中；或者

其中当延伸所述多个延长的经条形码化的核酸分子的3’末端以延伸所述茎环从而产生各自包含所述分子标记和所述分子标记的互补体的多个经延伸的经条形码化的核酸分子时，所述多个延长的经条形码化的核酸分子中的至少一个处于溶液中。

46.如权利要求45所述的方法，其中所述溶液在包含不超过一个细胞的分配区中分配。

47.如权利要求46所述的方法，其中所述分配区包含微滴、微孔或流体装置的腔室中的至少一种。

48.如权利要求1、3或7中任一项所述的方法，其中所述样品包含单细胞，所述方法包括在分配区中使包含所述多个寡核苷酸条形码的合成颗粒与所述样品中的所述单细胞相关联。

49.如权利要求48所述的方法，所述方法包括在将所述合成颗粒与所述单细胞相关联之后，裂解所述单细胞。

50.如权利要求49所述的方法，其中裂解所述单细胞包括将所述样品加热、使所述样品与洗涤剂接触、改变所述样品的pH、或其任何组合。

51.如权利要求48所述的方法，其中所述合成颗粒和所述单细胞在相同的孔中。

52.如权利要求48所述的方法，其中所述合成颗粒和所述单细胞在相同的滴中。

53.如权利要求48所述的方法，其中所述多个寡核苷酸条形码中的至少一个固定在所述合成颗粒上。

54.如权利要求48所述的方法，其中所述多个寡核苷酸条形码中的至少一个部分地固定在所述合成颗粒上。

55.如权利要求48所述的方法，其中所述多个寡核苷酸条形码中的至少一个封闭在所述合成颗粒中。

56.如权利要求48所述的方法，其中所述多个寡核苷酸条形码中的至少一个部分地封闭在所述合成颗粒中。

57.如权利要求48所述的方法，其中所述合成颗粒是可破坏的。

58.如权利要求48所述的方法，其中所述合成颗粒包含珠。

59.如权利要求58所述的方法，其中所述珠包含交联琼脂糖珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。

60.如权利要求48所述的方法，其中所述合成颗粒包含选自下组的材料，该组由以下组成：聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、琼脂糖凝胶、纤维素、尼龙、硅酮、及其任何组合。

61.如权利要求48所述的方法，其中所述合成颗粒包含可破坏的水凝胶颗粒。

62.如权利要求48所述的方法，

其中所述多个寡核苷酸条形码中的每个包含接头官能团，

其中所述合成颗粒包含固体支持物官能团，并且

其中所述支持物官能团和所述接头官能团彼此共价地关联。

63.如权利要求62所述的方法，其中所述接头官能团和所述支持物官能团单独地选自下组，该组由以下组成：C6、生物素、链霉亲和素、一个或多个伯胺、一个或多个醛、一个或多个酮、及其任何组合。