CN117396612A

CN117396612A - 通过系列引物延伸进行空间作图

Info

Publication number: CN117396612A
Application number: CN202280038340.6A
Authority: CN
Inventors: S·佛雷德里克森; F·卡尔松
Original assignee: Purcergen Technologies Ag
Current assignee: Purcergen Technologies Ag
Priority date: 2021-03-30
Filing date: 2022-03-29
Publication date: 2024-01-12
Also published as: WO2022208327A1; AU2022247468A9; AU2022247468A1; CA3213800A1; EP4303315A2; EP4298240B1; US20240175078A1; EP4303315A3; EP4298240A1; JP2024512943A

Abstract

本文提供了探针系统，其包含：核酸分子群，核酸分子具有可延伸的末端，第一组条形码颗粒，每个条形码颗粒具有核苷酸序列，核苷酸序列包含：(i)结合序列，其与核酸分子的可延伸的末端互补，(ii)唯一颗粒标记序列，和(iii)第一模板序列，和第二组条形码颗粒，每个条形码颗粒具有核苷酸序列，所述核苷酸序列包含：(i)第一模板序列和(ii)唯一颗粒标记序列。在使用中，使用第一组条形码颗粒作为模板延伸核酸分子产生延伸产物，延伸产物含有颗粒的唯一颗粒标记序列的互补序列和第一模板序列的互补序列。还提供了使用探针系统对细胞样品中或细胞样品上的结合事件进行作图的方法。

Description

通过系列引物延伸进行空间作图

交叉引用

本申请要求享有于2021年3月30日提交的美国临时申请号63/168,132的权益，其公开内容通过引用全文并入本文。

背景

样品和分子索引通常用于当今的许多基因组学工作流程。样品索引是一种常用的方法，使得能够以多重方式对样品进行测序和分析。在样品索引方法中，具体样品中的所有核酸都使用相同的序列标签标记，并且标记的文库与用不同条形码加标签的其他文库合并，并且在单次测序运行中对合并的库并行测序。然后，在分析过程中，样品特异性的索引允许软件将多重序列数据分离为样品特异性的数据集。另一方面，分子索引的目标是在PCR扩增之前用唯一序列对样品中的每个分子加标签。在这些方法中，起始样品中的每个核酸都用唯一分子索引加标签，并且序列分析软件过滤掉重复的读长(read)(即，来自同一分子的拷贝的读长)，并使用该索引消除PCR/测序错误。

本公开内容采用索引来提供空间信息，这被认为是分子索引的新用途。

概述

除其他事项外，本公开内容提供一种探针系统，其包含：(a)核酸分子群，核酸分子具有可延伸的末端；(b)第一组条形码颗粒，每个条形码颗粒具有核苷酸序列，核苷酸序列包含：(i)结合序列，其与(a)的核酸分子的可延伸的末端互补，(ii)唯一颗粒标记序列(identifier sequence)，和(iii)第一模板序列；(c)第二组条形码颗粒，每个条形码颗粒具有核苷酸序列，所述核苷酸序列包含：(i)第一模板序列，和(ii)唯一颗粒标记序列。在该探针系统中，使用(b)的第一组条形码颗粒作为模板延伸(a)的核酸分子，产生延伸产物，延伸产物含有(a)(ii)的颗粒的唯一颗粒标记序列的互补序列和第一模板序列的互补序列。

在下面的描述中，具有可延伸的末端的核酸分子是引物，并且使用引物延伸实现该方法。在替代实施方案(如图12-14所示)中，使用缺口填充/连接或基于连接的方法实现该方法。因此，本发明的系统和方法不应仅限于基于引物延伸的方法。

在一些实施方案中，该方法包括：将第一组条形码颗粒与第一引物分子群杂交，使用第一组条形码颗粒的核苷酸序列作为模板延伸杂交的引物分子，以产生第一引物延伸产物，第一引物延伸产物含有来自第一组条形码颗粒中的条形码颗粒的唯一颗粒标记序列的互补序列和第一模板序列的互补序列；去除第一组条形码颗粒；将第一引物延伸产物与第二组条形码颗粒杂交，其中第一引物延伸产物中的第一模板序列的互补序列与第二组条形码颗粒中的第一模板序列杂交；并且使用第二组条形码颗粒的核苷酸序列作为模板延伸第一引物延伸产物，以产生第二引物延伸产物，第二引物延伸产物含有：来自第一组条形码颗粒中的条形码颗粒的唯一颗粒标记序列，第一模板序列，和来自第二组条形码颗粒中的条形码颗粒的唯一颗粒标记序列。

该探针系统可用于对细胞样品上的结合事件进行作图的方法。在实施方案中，该方法可包括：(a)获得：i.含有与细胞中或细胞上的位点结合的引物分子的样品；ii.第一组条形码颗粒，每个条形码颗粒具有核苷酸序列，核苷酸序列包含：(i)引物结合序列，其与引物分子的3’末端互补，(ii)唯一颗粒标记序列，和(iii)第一模板序列；iii.第二组条形码颗粒，每个条形码颗粒具有核苷酸序列，所述核苷酸序列包含：(i)第一模板序列，和(ii)唯一颗粒标记序列；(b)将第一组条形码颗粒与样品特异性杂交，其中第一组条形码颗粒中的至少一些条形码颗粒的核苷酸序列与至少两种引物分子杂交；(c)使用引物与其杂交的核苷酸序列作为模板延伸与步骤(b)中条形码颗粒杂交的引物，以产生第一引物延伸产物，每个第一引物延伸产物包含第一唯一颗粒标记序列；(d)从样品去除第一组条形码颗粒；(e)将第二组条形码颗粒与(c)的第一引物延伸产物特异性杂交，其中第二组条形码颗粒中的至少一些条形码颗粒的核苷酸序列与引物延伸产物中的至少两种分子杂交；(f)使用引物与其杂交的核苷酸序列作为模板延伸与步骤(e)中条形码颗粒杂交的第一引物延伸产物，以产生第二引物延伸产物，第二引物延伸产物包含两种唯一颗粒标记序列；(g)确定哪种唯一颗粒标记序列或其互补序列在第二引物延伸产物中；并且(h)使用在第二引物延伸产物中的唯一颗粒标记序列对引物的相对位置进行作图。

替代实施方案涉及一种探针系统，其包含：(a)引物分子群；(b)一组条形码颗粒，每个条形码颗粒具有核苷酸序列，核苷酸序列包含：(i)引物结合序列，其与(a)的引物分子的3’末端互补，(ii)唯一颗粒标记序列，和(iii)第一模板序列；和(c)连接夹板，其包含第一寡核苷酸和第二寡核苷酸，其中第一寡核苷酸包含第一序列和第一模板序列；并且第二寡核苷酸包含第一模板序列和与第一序列互补的第二序列。

该替代探针系统可用于一种方法，其包括：i.将(b)的一组条形码颗粒与(a)的引物分子群杂交，ii.使用核苷酸序列作为模板延伸杂交的引物分子，以产生第一引物延伸产物，第一引物延伸产物含有：i.来自条形码颗粒的唯一颗粒标记序列的互补序列和ii.第一模板序列的互补序列；iii.去除条形码颗粒；iv.将第一引物延伸产物与连接夹板杂交，其中两个近端第一引物延伸产物中的第一模板序列的互补序列与连接夹板的第一序列和第二序列杂交；并且将杂交的连接夹板的第一寡核苷酸或第二寡核苷酸中的至少一个与第一引物延伸产物连接，并且使用连接产物中的第一引物延伸产物作为模板延伸夹板中的连接的第一寡核苷酸或第二寡核苷酸的3'末端，从而将两种唯一颗粒标记序列添加到引物上。

附图的简要说明

本领域技术人员将了解，下面描述的附图仅用于说明目的。这些附图无意以任何方式限制本发明教导的范围。

图1示意性说明了本公开内容的探针系统。

图2示意性说明了一种方法，其可以使用该探针系统。

图3示意性说明了一种探针系统，其具有引物结合位点，从而允许扩增延伸产物。

图4示意性说明了该方法的实施方案，其中拴着(tegher)引物。

图5示意性说明了可以如何使用该探针系统以产生阵列。

图6也示出了可以如何使用该探针系统以产生阵列。

图7示出了可以如何使用图5和6所示出的阵列分析样品。

图8示意性说明了可以如何在空间上重构结合位点。

图9A-9C示意性说明了本发明的方法的实施方案的进一步的细节。

图10示意性说明了替代探针系统和使用其的方法。

图11示意性说明了一种方法，其中可以使用图10所示的替代探针系统。

图12示意性说明了缺口填充/连接实现本发明的方法。

图13示意性说明了本发明的方法的基于连接的形式，其中核酸分子附接至“预先制备的”条形码。

图14示意性说明了本发明的方法的缺口填充/连接的形式，其可用于将条形码添加至cDNA。

图15示意性说明了如何可以使用滚环复制产物使用每个重复中的发夹实现该方法。

图16接着图15并示出可以这样涉及的测定的一个实例，使得引物延伸产物在限定的核苷酸处结束，从而允许其被用作该方法的下一步中的引物。

图17示意性说明了能够如何设计测定的替代实例，以使引物延伸产物在确定的核苷酸处结束，从而允许其在该方法的下一步中用作引物。

图18A-18C显示每个簇内标记物计数的相关性图。CD3和HLA-DR之间相关性差表明每个簇代表单个细胞。

图19是使用力生成的布局算法(force-generated layout algorithm)的图形组件(簇)的可视化。可以区分不同的抗体类型。

定义

在更详细地描述示例性实施方案之前，提出以下定义以说明和定义描述中使用的术语的含义和范围。

数值范围包含定义范围的数字。除非另有说明，否则分别地，核酸以5'至3'的方向从左到右书写；并且，氨基酸序列以氨基到羧基的方向从左到右书写。

除非另有定义，否则本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。Singleton,et al.,DICTIONARY OFMICROBIOLOGY AND MOLECULAR BIOLOGY,2D ED.,John Wiley and Sons,New York(1994),和Hale&Markham,THE HARPER COLLINSDICTIONARY OF BIOLOGY,Harper Perennial,N.Y.(1991)提供了本文使用的术语中许多术语的一般含义的技能之一。不过，为了清楚起见和便于参考，下面对某些术语进行了定义。

必须注意的是，如本文和所附权利要求书中使用的，除非上下文另有明确规定，否则单数形式“a”、“an”和“the”包括复数指代物。例如，术语“引物(a primer)”是指一个或多个引物，即单个引物和多个引物。另外注意的是，在撰写权利要求时可以排除任何任选的要素。因此，本声明旨在作为在叙述权利要求要素使用“唯一”、“只有”等排他性术语或使用“否定”限制的先行基础。

术语“核苷酸”旨在包括那些不仅含有已知嘌呤和嘧啶碱基，还含有其他已被修饰的杂环碱基的部分。这种修饰包括甲基化嘌呤或嘧啶、酰化嘌呤或嘧啶、烷基化核糖或其它杂环。此外，术语“核苷酸”包括那些含有半抗原或荧光标记的部分，并且可能不仅含有常规核糖和脱氧核糖，还含有其他糖。修饰的核苷或核苷酸还包括对糖部分的修饰(例如，其中羟基中的一个或多个被卤原子或脂肪族基团取代)，被官能化为醚、胺等。

术语“核酸”和“多核苷酸”在本文中可互换使用，以描述任何长度的聚合物，例如，大于约2个碱基、大于约10个碱基、大于约100个碱基、大于约500个碱基、大于1000个碱基、最多约10,000个或更多个由核苷酸组成的碱基，例如脱氧核糖核苷酸或核糖核苷酸，并且可以酶促或合成地生产(例如，美国专利号5,948,902和其中引用的参考文献中描述的PNA)，其可以以类似于两个天然存在的核酸的序列特异性方式与天然存在的核酸杂交，例如，可以参与Watson-Crick碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤、胞嘧啶、腺嘌呤、胸腺嘧啶、尿嘧啶(分别为G、C、A、T和U)。DNA和RNA分别具有脱氧核糖和核糖主链，而PNA的主链由通过肽键连接的重复N-(2-氨基乙基)-甘氨酸单元组成。在PNA中，各种嘌呤和嘧啶碱基通过亚甲基羰基键与主链连接。锁核酸(LNA)，通常称为无法接近的RNA，是一种修饰的RNA核苷酸。LNA核苷酸的核糖部分通过连接2'氧和4'碳的额外键桥进行修饰。键桥将核糖“锁定”在通常存在于A型双链体中的3'-内(北)构象中。LNA核苷酸可在需要时与寡核苷酸中的DNA或RNA残基混合。术语“非结构化核酸”或“UNA”是一种含有非天然核苷酸的核酸，这些核苷酸以降低的稳定性相互结合。例如，非结构化核酸可能含有G'残基和C'残基，其中这些残基对应于G和C的非天然形式即类似物，其碱基以降低的稳定性相互配对，但分别保留与天然存在的C和G残基进行碱基配对的能力。非结构化核酸描述于US20050233340中，其通过引用并入本文以公开UNA。

本文所用的术语“寡核苷酸”表示约2至200个核苷酸的核苷酸的单链多聚体，长度可达500个核苷酸。寡核苷酸可以是合成的，也可以是酶促制备的，并且在一些实施方案中，长度为30至150个核苷酸。寡核苷酸可含有核糖核苷酸单体(即，可以是寡核糖核苷酸)或脱氧核糖核苷酸单体。例如，寡核苷酸的长度可以是10至20、21至30、31至40、41至50、51至60、61至70、71至80、80至100、100至150或150至200个核苷酸。

本文所用的术语“引物”是指这样的寡核苷酸，当置于诱导与核酸链互补的引物延伸产物的合成的条件下，即在核苷酸和诱导剂(如DNA聚合酶)存在下并在合适的温度和pH下，能够充当合成起始点的寡核苷酸。引物可以是单链的，并且必须足够长，以便在诱导剂存在下引发所需延伸产物的合成。引物的确切长度将取决于许多因素，包括温度、引物来源和方法的用途。例如，对于诊断应用，取决于目标序列或片段的复杂性，寡核苷酸引物通常含有15-25个或更多个核苷酸，但它也可能含有较少的核苷酸。本文中的引物被选为与特定目标DNA序列的不同链基本互补。这意味着引物必须具有足够的互补性才能与各自的链杂交。因此，引物序列不需要反映模板的确切序列。例如，非互补核苷酸片段可以附接至引物的5'末端，引物序列的其余部分与链互补。或者，非互补碱基或较长的序列可以穿插到引物中，前提是引物序列与链的序列具有足够的互补性以与其杂交，从而形成用于合成延伸产物的模板。

术语“引物延伸产物”是指引物延伸的产物或本身就是引物延伸产物的分子延伸的产物。术语“第一引物延伸产物”是指作为引物延伸的产物的分子。术语“第二引物延伸产物”是指通过延伸第一引物延伸产物获得的产物。如果对第二引物延伸产物进行测序，则整个分子(或大部分分子)可以被测序，该序列至少包括在第一引物延伸反应中加入到引物上的序列和在第二引物延伸反应中加入到第一引物延伸产物上的序列。

术语“杂交(hybridization或hybridizes)”是指这样的过程，其中核酸链在正常杂交条件下与第二互补核酸链退火并形成稳定的双链体(同源双链体或异源双链体)，并且在相同的正常杂交条件下与无关的核酸分子不形成稳定的双链体。双链体的形成是通过在杂交反应中使两条互补核酸链退火来完成的。通过调整发生杂交反应的杂交条件(通常称为杂交严格性)，可以使杂交反应具有高度特异性，使得两条核酸链之间的杂交不会形成稳定的双链体，例如，在正常严格条件下保持双链区域的双链体，除非这两条核酸链含有一定数量的基本上或完全互补的特定序列的核苷酸。对于任何给定的杂交反应，“正常杂交或正常严格条件”都很容易确定。参见例如Ausubel et al.,Current Protocols in MolecularBiology,John Wiley&Sons,Inc.,New York或Sambrook et al.,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Laboratory Press。如本文所用，术语“杂交(hybridizing或hybridization)”是指核酸链通过碱基配对与互补链结合的任何过程。

如果两个序列在中等至高度严格的杂交和洗涤条件下特异性地相互杂交，则认为核酸与参考核酸序列“选择性杂交”。中等和高度严格的杂交条件是已知的(参见例如Ausubel,et al.,Short Protocols in Molecular Biology,3rd ed.,Wiley&Sons 1995and Sambrook et al.,Molecular Cloning:A Laboratory Manual,Third Edition,2001Cold Spring Harbor,N.Y.)。高严格条件的一个实例包括在约42℃下在50％甲酰胺、5XSSC、5X Denhardt溶液、0.5％SDS和100ug/ml变性载体DNA中杂交，然后在室温下在2X SSC和0.5％SDS中洗涤两次，在42℃下在0.1X SSC和0.5％SDS中再洗涤两次。

本文所用的术语“测序”是指通过其获得至少10个连续核苷酸的同一性(例如，至少20个、至少50个、至少100个或至少200个或更多个连续核苷酸的同一性)的多核苷酸的方法。

术语“下一代测序”是指目前由Illumina、Life Technologies、BGI Genomics(Complete Genomics技术)和Roche等公司采用的所谓的并行合成测序或连接测序平台。下一代测序方法还可包括纳米孔测序方法或基于电子检测的方法，例如Life Technologies商业化的Ion Torrent技术。

本文所用的术语“双链体”或“双链体的”描述了碱基配对即杂交在一起的两个互补多核苷酸。

术语“确定”、“测量”、“评价”、“评估”、“测定”和“分析”在本文中可互换使用，以指代测量形式，包括确定要素是否存在。这些术语包括定量和/或定性确定。评估可以是相对的，也可以是绝对的。

本文所用的术语“连接”是指第一DNA分子5'末端的末端核苷酸与第二DNA分子3'末端的末端核苷酸的酶催化连接。

术语“多个”、“组”和“群体”可互换使用，以指代至少包含2个成员的事物。在某些情况下，多个可以有至少10个、至少100个、至少1000个、至少10,000个或至少100,000个成员。

“引物结合位点”是指寡核苷酸在目标多核苷酸或片段中与其杂交的位点。如果寡核苷酸为引物“提供”结合位点，则该引物可能与该寡核苷酸或其互补序列杂交。

本文所用的术语“链”是指由通过共价键例如磷酸二酯键共价连接在一起的核苷酸组成的核酸。

本文所用的术语“延伸”是指通过连接或使用聚合酶添加核苷酸来延伸核酸。如果与多核苷酸退火的核酸发生延伸，则多核苷酸充当延伸反应的模板。在这些实施方案中，核酸可以通过模板依赖性聚合酶或通过连接至与多核苷酸互补的寡核苷酸进行延伸，其中该多核苷酸充当夹板。

术语“延伸”包括3'末端或5'末端的延伸。引物延伸、连接和缺口填充连接反应是延伸的类型。

术语“可延伸的5'或3'末端”分别指5'磷酸基团和3'羟基，两者都可通过连接延伸。3'羟基也可以通过聚合酶延伸。

本文所用的术语“作为模板”是指：(a)在一条链中的引物延伸反应充当通过聚合酶添加核苷酸的模板，(b)夹板连接，其中一条链充当模板(或“夹板”)以将两个核酸分子连接在一起。在连接反应中，两个分子都与模板杂交而变成连接的。连接可以在核酸分子的5'末端或核酸分子的3'末端。在3'末端或5'末端；(c)缺口填充/连接反应。在缺口填充/连接反应中，两个核酸杂交到中间有缺口的模板上。一个核酸分子通过引物延伸向另一个核酸分子延伸，然后产物的3'末端连接到另一个核酸上。本文所用的术语“滚环扩增”或简称“RCA”是指使用链置换聚合酶产生环状核酸模板的线性连环化拷贝的等温扩增。RCA在分子生物学领域中是众所周知的，并在各种出版物中都有描述，包括但不限于，Lizardi et al(Nat.Genet.1998 19:225-232),Schweitzer et al(Proc.Natl.Acad.Sci.2000 97:10113-10119),Wiltshire et al(Clin.Chem.2000 46:1990-1993)和Schweitzer et al(Curr.Opin.Biotech 2001 12:21-27)，它们通过引用并入本文。

本文所用的术语“滚环扩增产物”是指滚环扩增反应的连环化产物。

本文所用的术语“表面”是指可含有细胞或衍生自细胞的生物分子的任何组合的任何固体材料(例如玻璃、金属、陶瓷、有机聚合物表面或凝胶)，衍生自细胞的生物分子例如蛋白质、核酸、脂质、寡糖/多糖、生物分子复合物、细胞器、细胞碎片或分泌物(excretions)(外泌体、微囊泡)等。组织印迹、蛋白质印迹和载玻片是具有表面的固体材料的实例。细胞，例如哺乳动物细胞的悬浮液，是表面的另一实例。

本文所用的术语“夹板”是指与另外两个寡核苷酸的末端杂交并将这些末端结合在一起以产生可通过缺口填充/连接反应填充的可连接的衔接点(junction)或缺口的寡核苷酸。

本文所用的术语“条形码颗粒”意在指条形码RCA产物和条形码纳米颗粒两者，其中条形码颗粒群中的颗粒各自被单独地条形码编码为唯一颗粒标记序列，即，每个颗粒所唯一拥有的序列使得颗粒可以通过其唯一标记序列彼此区分。

其他的术语定义可能出现在整个说明书中。

示例实施方案的描述

在描述各种实施方案之前，应当理解，本公开内容的教导不限于所描述的具体实施方案，并且因此可以当然而然地发生变化。还应理解，本文所用的术语仅用于描述具体实施方案的目的，而不旨在限制，因为本发明教导的范围将仅受所附权利要求的限制。

本文所用的章节标题仅用于组织目的，不得解释为以任何方式限制所描述的主题。虽然本发明教导是结合各种实施方案描述的，但并不旨在将本发明教导局限于这些实施方案。相反，正如本领域技术人员所理解的那样，本发明教导包括各种替代、修改和等同物。

除非另有定义，否则本文中使用的所有技术和科学术语具有与本公开内容所属领域的普通技术人员通常理解的含义相同的含义。尽管任何与本文描述的相似或等同的方法和材料也可用于本发明教导的实践或测试，但现在描述了一些示例性的方法和材料。

任何出版物的引用都是为了在申请日之前公开，不应被解释为承认本发明的权利要求无权根据在先发明提前发布(antedate)此类出版物。此外，所提供的出版日期可能与实际出版日期不同，可能需要独立确认。

正如本领域技术人员在阅读本公开内容时所知道的那样，本文描述和示出的每个单独实施方案都具有离散的组件和特征，这些组件和特征可以容易地与任何其他几个实施方案的特征分开或组合，而不会偏离本发明教导的范围或精神。任何记载方法都可以按照记载事件的顺序或任何其他逻辑上可能的顺序进行。

本文提及的所有专利和出版物，包括此类专利和出版物中公开的所有序列，均通过引用明确并入本文。

在更详细地描述本发明的某些方面之前，重要的是要注意，附图示出了本发明的采用RCA产物的探针系统和方法的实施方案。如下所述，图中示出的原理可以容易地应用于条形码纳米颗粒，因此，本发明不应局限于附图中描述的内容。此外，图中仅显示了一个RCA产物重复。众所周知，条形码RCA产物(和条形码纳米颗粒)可以包含至少10个、至少50个、至少100个、至少500个或至少1,000个重复的分子(它们要么在RCA产物中连环化，要么拴在纳米颗粒的表面)。

此外，认识到的是，本发明的探针系统和方法不需要实现为引物延伸测定(如图2所示)。如图12-14所示，该方法可以使用缺口填充/连接或连接测定来实现，这两者都可以涉及使用条形码颗粒作为模板延伸核酸分子的5'末端。因此，虽然下面的描述侧重于采用引物延伸的实施方案，但应当认识到的是，下面描述的基于引物延伸的实施方案只是一个如何实现该方法的实例。

在图1中示例了本发明的探针系统的一些原理。参考图1，探针系统可以包括：引物分子群2(如图所示，其具有序列C-BS1'的3'末端)。如下文将更详细地描述的那样，引物分子可以是合成寡核苷酸或cDNA分子，例如在3'末端具有引物序列。在一些实施方案中，引物分子可以与结合剂(例如，寡核苷酸探针、抗体、适配体等)连接，并且在其他实施方案中，引物分子可以连接到平面基底而作为草坪(lawn)，其中寡核苷酸的3'末端位于基底的远端并且能够通过聚合酶延伸。如图所示，探针系统还包含第一组条形码颗粒4和第二组条形码颗粒12。如图所示，第一组条形码颗粒4中的颗粒各自具有核苷酸序列，核苷酸序列包含：与引物分子2的3'末端互补的引物结合序列6(C-BS1)，以及唯一颗粒标记序列8(UMI1)和第一模板序列10(C-BS2)。第二组条形码颗粒12中的颗粒各自具有核苷酸序列，核苷酸序列包含：第一模板序列10(即，与第一组颗粒中相同的模板序列C-BS2)和唯一颗粒标记序列14(UMI2)。在所示的实施方案中，第二组条形码颗粒的核苷酸序列不含引物结合序列6(CBS1)。然而，在其它实施方案中，第二组条形码颗粒的核苷酸序列可含有引物结合序列6(CBS1)。在该探针系统中(如图2所示)，使用第一组条形码颗粒4作为模板延伸引物分子2，产生第一引物延伸产物16，其含有第一组条形码颗粒的颗粒序列的唯一颗粒标记序列的互补序列18(即，UMI1的互补序列，或UMI1')和第一模板序列的互补序列20(C-BS2'，它是C-BS2的互补序列)。如下文将更详细地描述的，引物延伸产物16的3'末端能够与第二组颗粒的第一模板序列10杂交。如图所示，使用来自第二组条形码颗粒的颗粒作为模板延伸引物延伸产物16的3'末端，导致第二引物延伸产物22，其含有来自第一组颗粒的唯一颗粒标记序列的互补序列18，第一模板序列的互补序列20，和来自第二组颗粒的唯一颗粒标记序列的互补序列24。在一些实施方案中，可以存在紧邻第一模板序列下游的内部发夹。

在一些实施方案中，第一组条形码颗粒和第二组条形码颗粒可以是滚环扩增(RCA)产物或条形码纳米颗粒。例如，在一些实施方案中，第一组条形码颗粒和第二组条形码颗粒可以是RCA产物，第一组条形码颗粒和第二组条形码颗粒可以是条形码纳米颗粒，或者第一组条形码颗粒可以是RCA产物或条形码纳米颗粒，而第二组条形码颗粒可以是另一种类型。

在条形码颗粒是RCA产物的实施方案中，RCA产物各自含有重复序列形式的唯一序列。换句话说，如果有1,000个RCA产物，则每个产物将具有唯一序列(在本文中称为唯一分子标记“UMI”或唯一标记“UID”)。一个颗粒的UID与其他颗粒的UID不同。可以通过例如合成具有简并序列的初始寡核苷酸，使用夹板环化初始寡核苷酸以及通过RCA扩增环状寡核苷酸来制备RCA产物。在一些实施方案中，取决于所需的唯一RCA产物的数量，初始寡核苷酸可以含有6-10个核苷酸或者甚至更多个随机核苷酸的简并(例如，随机)序列。具有简并序列的环状寡核苷酸的扩增应产生一群RCA产物，每个RCA产物都有一个唯一标记(即，一个与群体中其他RCA产物不同的序列)。例如，Wu et al(Nat.Comm.2019 10:3854)和US20160281134中描述了生成具有唯一标记的RCA产物的方法，并且易于适应本文使用。在一些实施方案中，用于制备第一组RCA产物和第二组RCA产物的不同寡核苷酸分别制成，然后混合在一起。在其它实施方案中，不同的寡核苷酸可以以阵列的形式平行地在平面载体(support)上制成，然后从阵列切割出来。例如，Cleary et al.(Nature Methods 2004 1:241-248)和LeProust et al.(Nucleic Acids Research 2010 38:2522-2540)描述了此类方法的实例。在一些实施方案中，一组或两组RCA产物可以含有尿嘧啶或胸腺嘧啶(uracilof thymine)，从而允许RCA产物通过USER(参见例如Bitinaite et al Nucleic AcidsRes.2007 35:1992-2002)酶促降解，USER含有UDG(尿嘧啶DNA糖基化酶)和AP裂解酶，其在无嘌呤位点切割磷酸二酯主链。

在条形码颗粒是条形码纳米颗粒的实施方案中，条形码纳米颗粒是小珠子或金属颗粒等，它们包被寡核苷酸，其中每个颗粒上的表面拴系寡核苷酸具有唯一序列，该唯一序列不同于与群体中其他颗粒拴在一起的寡核苷酸中的序列。换言之，如果有1,000个条形码颗粒，则拴在每个颗粒上的寡核苷酸将具有唯一序列(本文中称为唯一分子标记“UMI”或唯一标记“UID”。一个颗粒的UID与其他颗粒的UID不同。这些颗粒可以是任何合适的尺寸、材料和形状。在许多实施方案中，颗粒具有10nm-200nm的尺寸。可以使用金颗粒(例如，可以很容易地制成1.8nm至1500nm范围内的任何直径)，但是颗粒也可以由银、二氧化硅、二氧化钛、碳、聚合物(如聚苯乙烯、聚丙烯酸酯等)、琼脂糖等制成。也可以使用铁和各种合金的磁性颗粒(Creative Diagnostics,Shirley,NY,USA)。颗粒不需要具有磁性，但在某些情况下可以使用磁性纳米球(Creative Diagnostics,Shirley,NY,USA)。有几种表面化学物质用于功能化金属表面，以便它们可以与核酸连接。例如，可将颗粒改性以含有反应性基团，包括但不限于N-羟基琥珀酰亚胺酯、磺基-N-羟基琥珀酰亚胺酯、卤代取代的苯酚酯、五氟苯酚酯、硝基取代的苯酚酯、酸酐、异氰酸酯、异硫氰酸酯、亚氨酸酯、马来酰亚胺、碘乙酰基、酰肼、醛或环氧化物。其它合适的基团是本领域已知的，并且可以在例如Hermanson,“Bioconjugate Techniques”Academic Press,2nd Ed.,2008中描述。最常用的捕获剂反应性基团是NHS(其为胺反应性)和马来酰亚胺(其为巯基反应性)，但是可以使用许多其他基团。这些颗粒也可以包被链霉抗生物素蛋白，链霉抗生物素蛋白可以与生物素化的核酸结合。在一些实施方案中，条形码颗粒可以通过乳液PCR制成，该方法已成功用于其它应用并且描述于例如Kanagal-Shamanna et al(Methods Mol Biol 2016 1392:33-42)和Shao etal(PlosOne 2011 0024910)。在一些实施方案中，如上所讨论的，条形码颗粒的核酸可以含有尿嘧啶，从而允许使用USER切割它们。

在任何实施方案中，引物分子2可含有5'尾部，其不与条形码颗粒的任何核酸杂交。5'尾部可含有引物结合位点(例如，用于正向引物)和目标标记序列，目标标记序列可以在操作方案的后面使用。如上所述，引物分子可以是合成的人造寡核苷酸，其长度为10-200个核苷酸。在其中一些实施方案中，引物分子可以与结合剂(例如，寡核苷酸探针、抗体、适配体等)连接。在这些实施方案中，引物分子不是cDNA。在一些实施方案中，引物分子可含有在3'末端具有引物序列的cDNA分子，即可用作引物的附加序列。在这些实施方案中，cDNA可以通过以下方式制成，例如，将逆转录引物(例如，具有由寡(dT)、随机序列或基因特异性序列制成的3'末端的引物，其任选地具有不与RNA杂交的5'末端，并且可含有为PCR引物提供结合位点的序列)与RNA杂交，例如，样品中的RNA原位杂交。逆转录引物可以原位延伸(在含有NTP、逆转录酶和任何其他必要试剂的反应中)产生cDNA产物以产生第一链cDNA。引物序列可以通过模板转换(参见例如Zhu et al BioTechniques 2001 30:892-7)、连接3'衔接子或通过加尾例如通过末端转移酶添加到cDNA中。如上所述，在cDNA实施方案中，cDNA可以原位制备，因此，引物可以在组织切片中或组织切片上。在其它实施方案中，引物分子可以例如通过它们的5'末端连接到平面基底，使得它们形成“草坪”。

在引物分子可以与结合剂连接的实施方案中，例如，结合剂可以是寡核苷酸探针、抗体或适配体。在这些实施方案中，引物分子可另外包含标记与结合剂结合的目标的序列。例如，如果引物与抗体连接，则引物可能还含有目标标记序列，该目标标记序列标记抗体名称或在引物的5'末端(任何引物序列的下游)抗体与其结合的目标(例如，表位)。因此，在一些实施方案中，引物可以是捕获剂-引物缀合物的一部分，其中捕获剂例如抗体或适配体与引物以非共价(例如，通过链霉抗生物素蛋白/生物素相互作用)或共价(例如，通过点击反应等)连接到单链引物的方式，使得捕获剂仍能与其结合位点结合。寡核苷酸和捕获剂可以通过许多不同的方法连接，包括那些使用具有半胱氨酸反应性的马来酰亚胺或含卤素基团的方法。捕获剂和寡核苷酸可以在寡核苷酸的5'末端近端或5'末端、在寡核苷酸的3'末端近端或3'末端或介于两者之间的任何位置连接。在一些实施方案中，寡核苷酸可以通过将寡核苷酸与捕获剂隔开的接头与捕获剂连接。寡核苷酸可以使用任何方便的方法与捕获剂连接(参见例如Gong et al.,Bioconjugate Chem.2016 27:217-225和Kazane et al.ProcNatl Acad Sci 2012 109:3731-3736)。如上所述，与结合剂缀合的引物序列唯一标记结合剂与其结合的表位或序列。例如，如果使用10种不同的抗体进行该方法，则每种抗体被拴在不同的引物上，该引物包含标记抗体与其结合的表位的序列。该特征允许该方法变成多重方法(to be multiplexed)，并且在某些实施方案中，至少5种、至少10种、至少20种或至少50种与细胞内或表面上的不同标记物结合的不同抗体可用于该方法。每种抗体与不同的目标标记序列缀合，并且抗体标记序列允许对特定抗体的结合事件进行作图。这样的加标签的抗体描述于例如Wu et al(Nat.Comm.2019 10:3854)和US20160281134以及其他文献中。

在引物分子可以连接到平面基底的实施方案中，基底可以通过以下方式制成，例如，合成制备引物分子，例如，使用亚磷酰胺化学并将引物分子通过其化学性质众所周知的5'末端拴在平面载体上，例如，载玻片等。

在任何实施方案中，引物分子2可具有5'尾部，其具有正向引物序列30，并且第二组条形码颗粒12的核苷酸序列在唯一颗粒标记序列14的下游具有反向引物序列32，如图3所示。在该实施方案中(并如图4所示)，第二引物延伸产物具有正向和反向引物序列，从而允许产物通过PCR扩增。

本文所述的核酸分子的组成部分的长度可以变化。在一些实施方案中，与引物结合序列6(C-BS1)杂交的引物部分长度可以为至少10个核苷酸，例如长度为12-50个核苷酸，UMI序列的长度可以为至少5个核苷酸，例如长度为6-20个核苷酸，并且第一模板序列10的长度可以为至少10个核苷酸，例如，长度为12-50个核苷酸。

在任何实施方案中，第一组条形码颗粒和第二组条形码颗粒可各自包含至少10个成员(例如，至少100、至少1,000、至少10,000、至少100,000、至少1百万、至少1千万、至少1亿、至少10亿或至少100亿个成员)，它们各自可通过其颗粒标记序列被唯一地标记。在一些实施方案中，第一组条形码颗粒和第二组条形码颗粒中的条形码颗粒的核酸序列可以除了它们的颗粒标记序列之外彼此相同。

本文还提供了一种使用本发明的探针系统将唯一粒子标记序列添加到引物中的方法。该方法的原理如图2所示。在这些实施方案中，该方法可包括将第一组条形码颗粒4与引物分子群2杂交，使用第一组条形码颗粒的核苷酸序列作为模板来延伸杂交引物分子，以产生第一延伸产物16，其含有：i.来自第一组条形码颗粒的唯一颗粒标记序列的互补序列18和ii.第一模板序列的互补序列20。接下来，去除第一组条形码颗粒，例如变性和洗涤，或者例如通过在第一条形码颗粒中并入尿嘧啶残基代替胸苷并酶处理产物，例如，使用含有尿嘧啶-n-糖基化酶和AP裂解酶的USER(NEB)，其能够在无嘌呤位点特异性地切割磷酸二酯键，从而降解第一条形码颗粒并释放延伸引物。在这些实施方案中，引物2(以及因此引物延伸产物16)可以拴在载体或样品上(例如，通过捕获剂)，并且，因此，第一组条形码颗粒可以经受严格的洗涤条件，而无需从样品或载体上去除引物或引物延伸产物。此外，第一引物延伸产物可以在正确的位置(即，在第一模板序列的末尾)终止，方法是在该位置设计限制性酶的位点，然后在引物延伸产物产生后用限制性酶消化引物延伸产物(这将是双链的)，或者将封闭寡核苷酸杂交到紧邻第一模板序列下游的序列，或者通过设计一个紧邻第一模板序列下游的内部发夹，这将导致聚合酶停滞。在这些后面的实施方案中，聚合酶(其应该是非链置换聚合酶)在遇到封闭寡核苷酸或发夹时应终止合成。在指定位点终止核酸合成的替代方法如图15-17所示。图15说明了含有发夹环的RCA产物。这些发夹环可以被限制性酶切割，以释放5'和3'末端作为平端或突出端。图16说明了引物延伸如何在产物中的指定位点终止。在该实施方案中，消化发夹以产生平端或突出端，但RCA产物作为复合物保持在一起。然后将RCA产物与缀合的寡核苷酸杂交，并且链置换DNA聚合酶(例如大肠杆菌DNA聚合酶I的Klenow片段)从RCA产物复制条形码，置换发夹，并随着模板结束而自然终止。然后，该引物延伸产物可用作下一组像素(pixel)的引物。发夹的限制性酶切割可以在RCA产物与寡核苷酸杂交之前或之后进行。图17说明了如何能够在延伸产物制成后通过消化它们来产生指定的末端，而它们仍然是双链的。

接下来，该方法可包括将第一引物延伸产物16与第二组条形码颗粒12杂交，其中第一引物延伸产物中的第一模板序列的互补序列20与第二组条形码颗粒中的第一模板序列杂交。接下来，该方法包括使用第二组条形码颗粒的核苷酸序列作为模板来延伸第一引物延伸产物，以产生第二引物延伸产物，其含有：来自第一组条形码颗粒中的条形码颗粒的唯一颗粒标记序列18、第一模板序列20、以及来自第二组条形码颗粒中的条形码颗粒的唯一颗粒标记序列20。

如图3所示，引物分子2可以具有正向引物序列，并且第二组条形码颗粒12的核苷酸序列可以在唯一颗粒标记序列下游具有反向引物序列。在这些实施方案中，第一引物延伸产物16应在5'末端含有正向引物序列，第二引物延伸产物22应在5'末端含有正向引物序列并且在3'末端含有反向引物序列。在该实施方案中，该方法可包括使用靶向正向引物序列和反向引物序列的引物通过PCR扩增第二引物延伸产物22。图4示出了将引物拴在载体或样品上的方法的实施方案。

在一些实施方案中，该方法可包括对第二引物延伸产物或其扩增拷贝进行测序。在这些实施方案中，每个第二引物延伸产物应含有两种条形码颗粒的唯一标记，从而在不同的杂交步骤中标记哪些条形码颗粒与引物杂交。在一些实施方案中，并且如下文将更详细地描述的那样，该方法可包括使用位于第二引物延伸产物中的唯一颗粒标记序列对来对引物的相对位置进行作图。

如上所述，在一些实施方案中，引物可以通过结合剂附接到细胞样品上。在这些实施方案中，第二引物延伸产物中的唯一颗粒标记指示结合剂在细胞样品上的相对位置。该实施方案如图4所示。从图4可以看出，在这些实施方案中，引物可包括目标标记序列(target identification sequence)。在图4所示的实施方案中，在步骤A和B中，引物分子含有目标标记并固定在样品上，例如通过结合剂。在该方法中，第一组条形码颗粒与样品杂交，并且使用杂交的颗粒作为模板将引物所杂交的颗粒中的UMI和C-BS2序列的互补序列复制到引物分子的末端上。在步骤C和D中，去除第一组条形码颗粒，杂交第二组颗粒。杂交后，引物延伸产物被延伸，以将第二组颗粒中的UMI添加到引物延伸产物的末端上。可以分析复制到引物末端上的条形码对，以确定不同引物在样品中的相对位置。

如上所述，在替代实施方案中，该方法可以使用缺口填充/连接和/或基于连接的方法来实现，其中，在这些实施方案中，可以使用(b)的条形码颗粒作为模板通过缺口填充/连接或连接反应延伸核酸的5'末端。在图12-14中示意性说明了这些实施方案。参考图12，不是通过从与结合剂偶联的引物的游离3'末端聚合来复制条形码颗粒中的条形码(如上所述)，而是可以使用缺口填充/连接反应将条形码复制到与抗体缀合的寡核苷酸的5'末端上，其中寡核苷酸具有5'磷酸。这些实施方案可以使用例如T4 DNA聚合酶和T4 DNA连接酶的组合来完成。图13显示了与结合剂缀合的寡核苷酸的5'末端或3'末端如何连接到含有颗粒条形码的“预先制备的”分子上。在这些实施方案中，条形码首先通过缺口填充/连接反应复制。在测定本身过程中，抗体的寡核苷酸连接到条形码预先制备的拷贝的5'末端或3'末端上。在该图中，寡核苷酸的5'末端连接到条形码的拷贝上，但是这可以反过来完成，即与抗体偶联的寡核苷酸携带一个游离的3'末端，该末端连接到UMI拷贝序列的5'磷酸末端。图14说明了如何通过缺口填充/连接反应将cDNA的5'末端添加到条形码上。在该方法中，mRNA在逆转录反应中复制(使用寡d(T)引物、随机引物或基因特异性引物)，一旦产生cDNA，将条形码通过缺口填充连接反应添加到cDNA的5'末端上。可以考虑这些实现方法和其他实现方法。

如上所述，在一些实施方案中，引物分子可以附接至平面基底，例如，载玻片等。在这些实施方案中，至少10⁶、10⁷、10⁸或10⁹个引物分子可以附接至平面载体并使用上述方法进行延伸。在图5中示意性说明了该方法。在这个实施方案中，第一组条形码颗粒和第二组条形码颗粒与位于载体50上的重叠区域中的序列杂交。第一引物延伸反应将分子标记添加到与第一组条形码颗粒杂交的引物中，以产生对应于第一引物延伸产物的第一特征阵列52。在所示的实例中，有六个特征58，每个特征对应于一个条形码颗粒并且每个特征含有不同的分子标记。在第一引物延伸反应完成后，去除第一组条形码颗粒，并将第二组条形码颗粒杂交到基底上。在该步骤中，第二组条形码颗粒与第一引物延伸产物杂交，但以重叠的方式与第一组条形码颗粒杂交。杂交的第二组条形码颗粒的延伸将来自第二组条形码颗粒的分子标记添加到第一引物延伸产物中，以产生对应于第二引物延伸产物的第二特征阵列56。作为示例，在阵列56中，特征60和62具有来自第一条形码颗粒的相同唯一标记(对应于特征58)，但具有来自第二条形码颗粒的不同的唯一标记。

还在图6中说明了该得到阵列的方法的实施方案。参考图6，该方法可以从具有固定化寡核苷酸的固体表面开始。在步骤1中，固定化寡核苷酸的游离3'末端延伸到具有唯一分子标记的第一组条形码颗粒(例如RCA产物)中。该延伸步骤将唯一分子标记的互补序列从第一组条形码颗粒复制到寡核苷酸上。然后去除条形码颗粒。在步骤2中，将第二组条形码颗粒添加到表面上，有效地将第二随机条形码添加到表面上。然后引物延伸产物被延伸，其将第二组颗粒的标记并入到初始延伸产物中。第二标记提供有关第一标记靠近的信息。由于第二次添加与第一次添加只有部分重叠，因此将产生连接的标记的空间图，如图6底部所示。然后，该阵列可用于捕获结合在细胞或组织样品中的生物分子，从而提供生物分子的空间信息。分辨率可能与颗粒的尺寸相当，其可能是50-500纳米，大大超过其他方法的分辨率。或者，可以在含有固定化寡核苷酸的表面上捕获样品中的生物分子(例如mRNA结合探针或cDNA的多A引物)(在引物延伸之前)。使用这种阵列的实例如图7所示。

本发明的探针系统可用于对细胞样品中或细胞样品上的结合事件进行作图。在图8中示意性说明了该方法。在这些实施方案中，该方法可包括获得含有与细胞内或细胞上的位点结合的引物分子的样品。例如，如上所述，该样品可以这样制备：通过将与结合剂(例如，寡核苷酸探针、抗体或适配体)附接的引物与细胞内或细胞上的位点结合，或者通过将第一引物与细胞中的RNA杂交，延伸引物以制备cDNA，并将第二引物附加到cDNA的5'末端上，其中cDNA成为本方法中使用的引物分子。该方法中使用的其他组分包括如上所述的第一组条形码颗粒，即每个颗粒具有核苷酸序列的颗粒，所述核苷酸序列包含：引物结合序列，其与引物分子的3'末端互补，唯一颗粒标记序列和第一模板序列，如图1所示，以及第二组条形码颗粒，每个颗粒具有核苷酸序列，所述核苷酸序列包含：第一模板序列和唯一颗粒标记序列，如图1所示。在任何实施方案中并且如图1所示，第二组条形码颗粒的核苷酸序列可缺少在第一组条形码颗粒的核苷酸序列中的引物结合序列。因此，在任何实施方案中，第二组条形码颗粒的核苷酸序列可缺少在第一组条形码颗粒的核苷酸序列中的引物结合序列，即可包含第一模板序列和唯一颗粒标记序列，但不含在第一组条形码颗粒的核苷酸序列中的引物结合序列。

如上所述，该方法涉及将第一组条形码颗粒与样品特异性杂交，其中第一组条形码颗粒中的至少一些条形码颗粒的核苷酸序列与至少两种引物分子杂交。如图8所示，与每个条形码颗粒杂交的引物分子的数量可能会有所不同。第一组条形码颗粒中的一些条形码颗粒可以与一个引物分子杂交，但许多应该与至少两个、至少5个、至少10个或至少20个引物分子杂交，这取决于引物分子的密度和所用颗粒的尺寸。与上述方法一样，该方法包括使用引物与其杂交的核苷酸序列作为模板延伸与条形码颗粒杂交的引物，以产生第一引物延伸产物，每个第一引物延伸产物包含第一唯一颗粒标记序列。接下来，该方法可以包括如上所述从样品中去除第一组条形码颗粒，并且将第二组条形码颗粒与第一引物延伸产物特异性杂交。在该方法的这一步中，第二组条形码颗粒中的至少一些条形码颗粒的核苷酸序列与引物延伸产物中的至少两种分子杂交。同样，使用引物与其杂交的核苷酸序列作为模板延伸先前与条形码颗粒杂交的第一引物延伸产物，以产生第二引物延伸产物，第二引物延伸产物包含两种唯一颗粒标记序列，一种来自第一组中的颗粒，另一种来自第二组中的颗粒。接下来，该方法包括哪种唯一颗粒标记序列或其互补序列在第二引物延伸产物中，并使用第二引物延伸产物中的唯一颗粒标记序列制作引物的相对位置图。

在图9A-C中详细列出了该方法的步骤。从图9A-C可以看出，引物可以含有目标标记序列，从而允许该测定变成多重测定。在该方法中，可以对第二引物延伸产物群一起进行扩增和测序。每个序列读长应含有一个目标标记以及两种颗粒标记，一种来自第一组颗粒，另一种来自第二组颗粒。由于在分开的杂交反应中第一组颗粒和第二组颗粒结合的位点重叠，因此引物能够定位到样品中的位点。具体来说，可以通过确定将哪些标记对添加到引物中来产生条形码颗粒的关系图。目标序列可以定位到关系图上，从而提供引物的结合位点(或它们所结合的位点，例如表位或序列)的图。

下文中描述了基于连接的替代实施方案。这些实施方案避免了使用两组条形码颗粒，而只需要1个引物延伸步骤。在这些实施方案中，可以通过连接夹板连接附近的引物延伸产物来产生标记对。在图10和11中示意性说明了这些实施方案。在这些实施方案中，探针系统可包含：引物分子群(如图所示，其可含有这样的序列，其提供引物结合位点、目标标记和引物序列C-BS1)；一组条形码颗粒，条形码颗粒具有核苷酸序列，核苷酸序列包含：(i)引物结合序列(C-BS1)，其与引物分子的3'末端互补，(ii)唯一颗粒标记序列(UMI)和(iii)第一模板序列(C-BS2)。该探针系统不含第二组条形码颗粒，而是包含连接夹板。如图10所示，连接夹板由第一寡核苷酸和第二寡核苷酸组成，其中第一寡核苷酸包含第一序列和第一模板序列(C-BST')；第二寡核苷酸包含第一模板序列(C-BST')和与第一序列互补的第二序列。夹板中的两个寡核苷酸可能具有相同的序列，并通过5'末端的序列相互杂交。

一般而言，该系统的组件类似于上述系列延伸系统组件，不同之处在于替代系统具有连接夹板而不是第二组条形码颗粒。例如，所述条形码颗粒可以是滚环扩增(RCA)产物，或者所述条形码颗粒可以是条形码纳米颗粒，其中所述核苷酸序列被拴在所述条形码颗粒的表面上。同样，(a)的引物分子是长度为10-200nt的合成寡核苷酸，其可能与结合剂(例如，寡核苷酸探针、抗体、适配体等)连接。在一些实施方案中，引物分子可以是在3'末端具有引物序列的cDNA分子。

与系列延伸实施方案一样，该组条形码颗粒可以含有至少10个颗粒，每个颗粒具有唯一颗粒标记序列。在该实施方案中，该组条形码颗粒可各自包含至少10个成员(例如，至少100、至少1,000、至少10,000、至少100,000、至少1百万、至少1千万、至少1亿、至少10亿或至少100亿个成员)，它们各自可通过其颗粒标记序列被唯一地标记。在一些实施方案中，条形码颗粒的核酸序列可以除了它们的颗粒标记序列之外彼此相同。

可以与上述系列探针系统类似的方式使用替代探针系统对细胞样品中或细胞样品上的结合事件进行作图。提供了一种使用替代探针系统将唯一颗粒标记序列添加到引物上的方法。在图10和11中说明的该方法可包括将该组条形码颗粒与引物分子群(如图所示，其可固定在载体上)杂交，并且使用核苷酸序列作为模板延伸杂交的引物分子。该步骤导致产生第一引物延伸产物，第一引物延伸产物含有：i.来自条形码颗粒的唯一颗粒标记序列(UMI)的互补序列和ii.第一模板序列(C-BS2)的互补序列。如图所示，去除条形码颗粒之后，该方法包括将第一引物延伸产物与连接夹板杂交，其中两个近端第一引物延伸产物中的第一模板序列的互补序列与连接夹板的第一序列和第二序列杂交。接下来，该方法包括将杂交的连接夹板的第一寡核苷酸或第二寡核苷酸中的至少一个与第一延伸产物连接，并使用连接产物中的第一延伸产物作为模板延伸夹板中的第一寡核苷酸和第二寡核苷酸中的至少一个的3'末端，从而将两种唯一颗粒标记序列添加到引物上。如图10所示，引物能够被工程改造为正向引物序列和反向引物序列和模板标记序列，从而提供含有PCR引物位点、一对模板标记序列和两种颗粒标记的产物。如图11所示意性说明的，可以分析这些序列以确定条形码颗粒和引物(或它们所拴的结合剂、探针或cDNA分子)的相对位置。显而易见，该方法可以包括对第二引物延伸进行测序，从而标记哪些唯一颗粒标记序列对在第二引物延伸产物中。该方法还可以包括使用第二引物延伸产物中的唯一颗粒标记序列对了来对i.的引物的相对位置进行作图。

与上述系列延伸实施方案一样，可以通过结合剂(例如抗体、适配体或探针将引物分子附接到细胞样品上，第二引物延伸产物中的唯一颗粒标记可以指示结合剂在细胞样品上的相对位置。同样，引物可以上在细胞样品中原位制成的cDNA的3'末端，其中第二引物延伸产物中的唯一颗粒标记指示cDNA在细胞样品中的相对位置。

在任何实施方案中，如果将两个复合标记添加到同一分子中，则条形码颗粒可以相对于彼此进行作图。该方法生成的图可以是三维图或二维图，具体取决于该方法的实现方式。例如，如果复合物产物被固定在细胞内(例如，在细胞中原位产生)，则产生的图可以是三维的。在其它实施方案中，例如，如果将复合物固定在一个或多个表面(例如，一个或多个可以悬浮或安装在载体上的细胞的表面)上，则由该方法生成的图可以是二维的或潜在的三维的，因为在理论上，该图可以是球形的。虽然该方法可以应用于细胞(如下所述)，但该方法可以适用于对固定在任何表面(例如，可能具有组织印迹或蛋白质印迹的载玻片等)上的相邻复合物进行作图。同样，尽管复合物可以通过抗体(例如，与寡核苷酸缀合的抗体，寡核苷酸具有与复合物中序列互补的序列)锚定在细胞中或细胞上或表面上的位点上，但复合物可以通过任何类型的相互作用(例如，共价或非共价相互作用)直接或间接固定。例如，在一些实施方案中，复合物可以通过结合剂(例如，适配体、抗体或寡核苷酸等)与细胞结合，其中结合剂结合到复合物中的序列和细胞中或一个或多个细胞的表面上的位点上。在一些实施方案中，复合物可以通过杂交到寡核苷酸来固定，寡核苷酸也与核酸杂交(例如，与细胞RNA)杂交，或者RCA产物可以通过静电相互作用、通过链霉抗生物素蛋白/生物素相互作用或通过共价键(例如，通过点击偶联)非共价固定到位点。

在任何实施方案中，复合物可以固定在细胞中或细胞上，所述细胞是溶液中的细胞、载体(例如载玻片)上的细胞、三维组织样品中的细胞或组织切片中的细胞。例如，含有溶液中细胞的样品可以是作为细胞悬浮液生长的培养细胞样品。在其它实施方案中，可以使用解离的细胞(所述细胞可以是通过使用胰蛋白酶等解离培养的细胞或位于例如诸如肝脏或脾脏的软组织的实体组织中的细胞来产生)。在具体实施方案中，复合物可以固定在可以在血液中发现的细胞上，例如，在全血中的细胞或其亚群细胞。全血的亚群细胞包括血小板、红细胞(红血球)和白细胞(即外周血白细胞，由中性粒细胞、淋巴细胞、嗜酸性粒细胞、嗜碱性粒细胞和单核细胞组成)。这五种类型的白细胞可以进一步分为两组，粒细胞(也称为多形核白细胞，包括中性粒细胞、嗜酸性粒细胞和嗜碱性粒细胞)和单核白细胞(包括单核细胞和淋巴细胞)。淋巴细胞可进一步分为T细胞、B细胞和NK细胞。外周血细胞存在于血液循环库中，而不是隔离(sequestered)在淋巴系统、脾脏、肝脏或骨髓中。如果使用固定在载体上的细胞，则可以通过例如在平面表面上培养细胞，在平面表面上沉积细胞，例如通过离心，通过将包含细胞的三维物体切割成切片并将切片安装到平面表面上即产生组织切片来制备样品。在替代实施方案中，可以通过将细胞组分吸收到表面上来制成表面。

在任何实施方案中，该方法可包括将数千、数万、数十万或至少一百万个条形码颗粒(每个具有唯一标记)固定到细胞群中(例如，通过抗体)，以便在每个细胞上条形码颗粒有效包被细胞。条形码颗粒可以与其他寡核苷酸(这些寡核苷酸拴在细胞内或细胞上的位点)杂交，以产生包含条形码颗粒的基质。杂交后，相邻复合物的唯一标记序列可以从一个条形码颗粒复制到另一个条形码颗粒。能够根据已复制的序列构建复合物的物理图以及条形码颗粒与细胞结合的位点。

除了制作条形码颗粒的图外，该方法还可能涉及在与细胞中或细胞表面的位点结合的一个或多个结合剂(例如，与细胞上的细胞表面标记物结合的抗体)之间进行邻近测定。在这些实施方案中，产品可以包含一对唯一的复合物标记序列以及结合剂标记序列。在一些实施方案中，结合剂可以是抗体-寡核苷酸缀合物，而在其它实施方案中，捕获剂可以是寡核苷酸探针或cDNA。寡核苷酸和捕获剂可以通过许多不同的方法连接，包括那些使用具有半胱氨酸反应性的马来酰亚胺或含卤素基团的方法。捕获剂和寡核苷酸可以在寡核苷酸的5'末端近端或5'末端、在寡核苷酸的3'末端近端或3'末端或介于两者之间的任何位置连接。在一些实施方案中，寡核苷酸可以通过将寡核苷酸与捕获剂隔开的接头与捕获剂连接。如上所述，寡核苷酸可以使用任何方便的方法与捕获剂连接。在许多实施方案中，与结合剂缀合的引物序列唯一标记结合剂与其结合的表位或序列。例如，如果使用10种不同的抗体进行该方法，则每种抗体被拴在不同的序列上，该序列标记抗体与其结合的表位。该特征允许该方法变成多重方法，并且在某些实施方案中，至少5种、至少10种、至少20种或至少50种与细胞内或表面上的不同标记物结合的不同抗体可用于该方法。每种抗体与不同抗体标记序列缀合，并且抗体标记序列允许对特定抗体的结合事件进行作图。这样的加标签的抗体描述于例如Wu et al(Nat.Comm.2019 10:3854)和US20160281134以及其他文献中。

实施方案

实施方案1.一种探针系统，其包含：(a)引物分子群；(b)第一组条形码颗粒，每个条形码颗粒具有核苷酸序列，核苷酸序列包含：(i)引物结合序列，其与(a)的引物分子的3'末端互补，(ii)唯一颗粒标记序列，和(iii)第一模板序列；(c)第二组条形码颗粒，每个条形码颗粒具有核苷酸序列，所述核苷酸序列包含：(i)第一模板序列，和(ii)唯一颗粒标记序列；其中使用(b)的第一组条形码颗粒作为模板延伸(a)的引物分子，以产生引物延伸产物，引物延伸产物含有(b)(ii)的颗粒的唯一颗粒标记序列的互补序列和第一模板序列的互补序列。

实施方案2.根据实施方案1所述的探针系统，其中(b)和/或(c)的条形码颗粒是滚环扩增(RCA)产物。

实施方案3.根据实施方案1所述的探针系统，其中(b)和/或(c)的条形码颗粒是条形码纳米颗粒，其中核苷酸序列拴在条形码颗粒的表面上。

实施方案4.根据前述任一项实施方案所述的探针系统，其中(a)的引物分子是长度为10-200nt的合成寡核苷酸。

实施方案5.根据前述任一项实施方案所述的探针系统，其中(a)的引物分子是在3'末端具有引物序列的cDNA分子。

实施方案6.根据前述任一项实施方案所述的探针系统，其中(a)的引物分子具有正向引物序列，并且第二组条形码颗粒的核苷酸序列具有位于唯一颗粒标记序列下游的反向引物序列。

实施方案7.根据前述任一项实施方案所述的探针系统，其中(a)的引物分子与结合剂(例如，寡核苷酸探针、抗体、适配体等)连接。

实施方案8.根据实施方案7所述的探针系统，其中引物分子进一步包含目标标记序列，目标标记序列指示与它们连接的结合剂。

实施方案9.根据实施方案1-6中任一项所述的探针系统，其中引物分子与平面基底连接。

实施方案10.根据前述任一项实施方案所述的探针系统，其中第一组条形码颗粒和第二组条形码颗粒独立地含有至少10,000个颗粒，每个颗粒具有唯一颗粒标记序列。

实施方案11.根据前述任一项实施方案所述的探针系统，其中第二组条形码颗粒的核苷酸序列缺乏(b)(i)的引物结合序列。

实施方案12.一种使用实施方案1-11中任一项所述的探针系统将唯一颗粒标记序列添加到引物上的方法，其包括：

i.将(b)的第一组条形码颗粒与(a)的引物分子群杂交，

ii.使用第一组条形码颗粒的核苷酸序列作为模板延伸杂交的引物分子，以产生第一引物延伸产物，第一引物延伸产物含有：i.来自第一组条形码颗粒中的条形码颗粒的唯一颗粒标记序列的互补序列和ii.第一模板序列的互补序列；

iii.去除第一组条形码颗粒；

iv.将第一引物延伸产物与第二组条形码颗粒杂交，其中第一引物延伸产物中的第一模板序列的互补序列与第二组条形码颗粒中的第一模板序列杂交；并且

v.使用第二组条形码颗粒的核苷酸序列作为模板延伸第一引物延伸产物，以产生第二引物延伸产物，第二引物延伸产物含有：

来自第一组条形码颗粒中的条形码颗粒的唯一颗粒标记序列，

第一模板序列，和

来自第二组条形码颗粒中的条形码颗粒的唯一颗粒标记序列。

实施方案13.根据实施方案12所述的方法，其中引物分子具有正向引物序列，并且第二组条形码颗粒的核苷酸序列具有位于唯一颗粒标记序列下游的反向引物序列，并且该方法包括扩增v的第二引物延伸产物。

实施方案14.根据实施方案12或13所述的方法，其中该方法包括对v的第二引物延伸产物进行测序。

实施方案15.根据实施方案14所述的方法，使用在第二引物延伸产物中的唯一颗粒标记序列对，对i的引物的相对位置进行作图。

实施方案16.根据实施方案12-15中任一项所述的方法，其中引物附接到平面基底上，并且该方法得到位于基底上的第二引物延伸产物的阵列。

实施方案17.根据实施方案12-15中任一项所述的方法，其中引物通过结合剂附接到细胞样品上，并且第二引物延伸产物中的唯一颗粒标记指示细胞样品上结合剂的相对位置。

实施方案18.根据实施方案12-15中任一项所述的方法，其中引物在细胞样品中原位制成的cDNA，其中第二引物延伸产物中的唯一颗粒标记指示细胞样品中cDNA的相对位置。

实施方案19.一种对细胞样品中或细胞样品上的结合事件进行作图的方法，其包括：(a)获得：i.含有与细胞中或细胞上的位点结合的引物分子的样品；ii.第一组条形码颗粒，每个条形码颗粒具有核苷酸序列，核苷酸序列包含：(i)引物结合序列，其与(a)的引物分子的3'末端互补，(ii)唯一颗粒标记序列，和(iii)第一模板序列；iii.第二组条形码颗粒，每个条形码颗粒具有核苷酸序列，所述核苷酸序列包含：(i)第一模板序列，和(ii)唯一颗粒标记序列；(b)将(a)(ii)的第一组条形码颗粒与样品特异性杂交，其中第一组条形码颗粒中的至少一些条形码颗粒的核苷酸序列与至少两种引物分子杂交；(c)使用引物与其杂交的核苷酸序列作为模板延伸与步骤(b)中条形码颗粒杂交的引物，以产生第一引物延伸产物，每个第一引物延伸产物包含第一唯一颗粒标记序列；(d)从样品去除第一组条形码颗粒；(e)将(a)(iii)的第二组条形码颗粒与(c)的第一引物延伸产物特异性杂交，其中第二组条形码颗粒中的至少一些条形码颗粒的核苷酸序列与第一引物延伸产物中的至少两种分子杂交；(f)使用引物与其杂交的核苷酸序列作为模板延伸与步骤(e)中第二条形码颗粒杂交的第一引物延伸产物，以产生第二引物延伸产物，第二引物延伸产物包含两种唯一颗粒标记序列；(g)确定哪种唯一颗粒标记序列或其互补序列在第二引物延伸产物中；并且(h)使用在第二引物延伸产物中的唯一颗粒标记序列对(a)(i)的引物的相对位置进行作图。

实施方案20.根据实施方案19所述的方法，其中通过将与结合剂附接的引物与细胞中或细胞上的位点结合来制备(a)的样品。

实施方案21.根据实施方案20所述的方法，其中结合剂是寡核苷酸探针、抗体或适配体。

实施方案22.根据实施方案20或21所述的方法，其中引物进一步包含目标标记序列，目标标记序列指示与它们连接的结合剂。

实施方案23.根据实施方案19所述的方法，其中通过将第一引物与细胞中的RNA杂交、延伸引物以制备cDNA并且将第二引物附加到cDNA的5'末端上来制备(a)的样品。

实施方案24.根据前述任一项实施方案所述的探针系统，其中第二组条形码颗粒的核苷酸序列缺乏第一组条形码颗粒的引物结合序列。

实施方案25.一种探针系统，其包含：(a)引物分子群；(b)一组条形码颗粒，每个条形码颗粒具有核苷酸序列，核苷酸序列包含：(i)引物结合序列，其与(a)的引物分子的3'末端互补，(ii)唯一颗粒标记序列，和(iii)第一模板序列；和(c)连接夹板，其包含第一寡核苷酸和第二寡核苷酸，其中第一寡核苷酸包含第一序列和第一模板序列；并且第二寡核苷酸包含第一模板序列和与第一序列互补的第二序列。

实施方案26.根据实施方案25所述的探针系统，其中(b)的条形码颗粒是滚环扩增(RCA)产物。

实施方案27.根据实施方案25所述的探针系统，其中(b)的条形码颗粒是条形码纳米颗粒，其中(b)的核苷酸序列拴在条形码颗粒的表面上。

实施方案28.根据实施方案25-27中任一项所述的探针系统，其中(a)的引物分子是长度为10-200nt的合成寡核苷酸。

实施方案29.根据实施方案25-27中任一项所述的探针系统，其中(a)的引物分子是在3'末端具有引物序列的cDNA分子。

实施方案30.根据实施方案25-28中任一项所述的探针系统，其中(a)的引物分子与结合剂(例如，寡核苷酸探针、抗体、适配体等)连接。

实施方案31.根据实施方案25-30中任一项所述的探针系统，其中一组条形码颗粒可含有至少10,000个颗粒，每个颗粒具有唯一颗粒标记序列。

实施方案32.一种使用实施方案25-31中任一项所述的探针系统将唯一颗粒标记序列添加到引物上的方法，其包括：

i.将(b)的一组条形码颗粒与(a)的引物分子群杂交，

ii.使用核苷酸序列作为模板延伸杂交的引物分子，以产生第一引物延伸产物，第一引物延伸产物含有：i.来自条形码颗粒的唯一颗粒标记序列的互补序列和ii.第一模板序列的互补序列；

iii.去除条形码颗粒；

iv.将第一引物延伸产物与连接夹板杂交，其中两个近端第一引物延伸产物中的第一模板序列的互补序列与连接夹板的第一序列和第二序列杂交；

v.将杂交的连接夹板的第一寡核苷酸或第二寡核苷酸中的至少一个与第一引物延伸产物连接，并且使用连接产物中的第一引物延伸产物作为模板延伸夹板中的连接的第一寡核苷酸或第二寡核苷酸的3'末端，从而将两种唯一颗粒标记序列添加到引物上。

实施方案33.根据实施方案32所述的方法，其中该方法包括对v的第二引物延伸产物进行测序。

实施方案34.根据实施方案32或33所述的方法，其进一步包括使用在第二引物延伸产物中的唯一颗粒标记序列对，对i的引物的相对位置进行作图。

实施方案35.根据实施方案32-34中任一项所述的方法，其中i的引物分子通过结合剂附接到细胞样品上，并且第二引物延伸产物中的唯一颗粒标记指示细胞样品上结合剂的相对位置。

实施方案36.根据实施方案32-34中任一项所述的方法，其中引物是在细胞样品中原位制成的cDNA，其中第二引物延伸产物中的唯一颗粒标记指示细胞样品中cDNA的相对位置。

实施例

提出以下实施例是为了向本领域普通技术人员提供关于如何制备和使用本发明的附加公开内容和描述，并且不打算限制本发明人认为是其发明的范围，也不打算表示以下实验是所有或唯一进行的实验。

方法

探针环化和滚环扩增：在含有100nM探针寡核苷酸、100nM模板寡核苷酸、1mM ATP、200U T4 DNA连接酶和含有33mM Tris-乙酸盐、10mM Mg-乙酸盐、66mM K-乙酸盐、1mM DTT和0.1％吐温20的反应缓冲液的50μl连接反应中使用模板寡核苷酸(3或4)环化探针寡核苷酸(1或2)。将反应在37℃孵育30分钟。

通过在连接后将10U核酸外切酶I和100U核酸外切酶III添加到每个反应中来消化非环化的探针。核酸外切酶消化在37℃进行30分钟，然后在85℃热灭活20分钟。

核酸外切酶消化后将RCA引物寡核苷酸3或4添加到每个反应中至浓度为100nM，并通过在37℃孵育20分钟来使其与环化的探针杂交。

在含有2.5nM环化的探针、0.75mM的每种d(AUGC)TP和7.5U phi29 DNA聚合酶并且在与探针环化所使用的相同反应缓冲液中的75μl的反应中进行滚环扩增。将反应在37℃孵育20分钟，然后在65℃热灭活10分钟。

细胞染色和固定：从单独的T75培养瓶中吸出Raji和Jurkat细胞，并以300×g离心(spin down)5分钟。对细胞进行计数并取对应于1百万个细胞的细胞悬液。细胞在FACS缓冲液(溶于1x PBS的2％FBS、2mM EDTA)中洗涤两次。用Fc封闭剂封闭细胞并离心以去除上清液。将靶向各种免疫细胞标记物(CD3、CD4等)的2TotalSeq B(Biolegend inc)抗体-寡核苷酸缀合物(寡核苷酸8-27)库以每种缀合物的浓度为5μg/ml添加到细胞中并在冰上孵育30分钟。用300μl的FACS缓冲液洗涤经缀合物染色的细胞两次，然后离心细胞，去除上清液，加入250μl的1％PFA以固定样品。在室温下孵育10分钟后，通过加入12.5μl的2.5M甘氨酸来淬灭固定，然后用250μl的溶于PBS的125mM甘氨酸洗涤。在PBS中再次洗涤后，将细胞重悬于PBS中并储存在+4℃直至使用。

引物延伸测定：将经缀合物染色并固定的Raji和Jurkat细胞以1:1的比例混合，并将相当于总共约20 000个细胞的等分试样放入PCR管中。

在含有2.5nM RCA产物(源自寡核苷酸1)、0.5μM的封闭寡核苷酸(5)并且在含有300mM NaCl、15mM MgCl₂、20mM Tris-HCl(pH 8)的缓冲液中的40μl反应中进行RCA产物与与细胞结合的抗体-缀合物寡核苷酸的杂交。将反应在55℃孵育15分钟。

将样品以500×g离心2分钟以沉淀细胞，去除上清液并加入100μl洗涤缓冲液(50mM NaCl、1mM EDTA、20mM Tris-HC，pH 8l)并重悬细胞。再次将样品离心以沉淀细胞并去除上清液。

通过加入在含有50mM Na-乙酸盐、10mM Mg-乙酸盐、20mM Tris-乙酸盐、100μg/mlBSA的缓冲液中含有0.2mM dNTP、1μl的Klentaq DNA聚合酶的预混液，进行50μlDNA聚合酶延伸反应以并入像素条形码序列。将反应在30℃孵育15分钟。在与前面描述的相同条件下再次进行洗涤步骤，之后通过加入50μl包含50mM NaCl、1mM EDTA、20mM Tris-HC和1U的USER酶的缓冲液进行USER消化(尿嘧啶DNA糖基化酶+核酸内切酶VII)反应以降解DNA像素。将反应在37℃孵育30分钟。

进行洗涤步骤，然后加入由溶于50mM NaCl、1mM EDTA、20mM Tris-HCl,pH 8的1U的UGI蛋白质组成的50μl USER灭活预混液。将反应在37℃孵育15分钟。

在洗涤步骤之后，使用与在前面描述的针对RCA产物1的杂交在其他方面相同的条件使用源自寡核苷酸2的RCA产物进行第二次RCA产物杂交反应。类似地，在第二次杂交反应之后进行相同的延伸和USER灭活操作方案。第二次USER消化步骤之后，进行洗涤步骤，然后将细胞重悬于50μl的洗涤缓冲液。将所得细胞悬液定量并稀释至浓度为20个细胞/μl。

在系列延伸测定之后，通过抗体结合与细胞结合的每个缀合物寡核苷酸具有两个DNA像素条形码序列和一个通过测定的延伸步骤并入的反向PCR引物基序。

在含有5μl的稀释样品、0.2mM dNTP、0.4μM的每种含有Illumina衔接子序列的正向和反向引物(6、7)、1μl的Phusion DNA聚合酶的在1x的Phusion HF反应缓冲液的反应中进行15个循环的PCR。PCR反应由以下组成：98℃变性1分钟，之后是15个循环的98℃变性10秒、60℃退火30秒、72℃40秒，然后在72℃最终延伸5分钟。

使用Ampure XP珠根据制造商的说明但使用1.2的珠与样品比来最终纯化PCR产物。使用Qubit荧光计对纯化的PCR产物进行定量，并在Illumina NextSeq 2000测序仪上进行测序。

/>

结果

并入到每个缀合物寡核苷酸上的2个DNA像素条形码的组合代表在系列延伸测定期间靠近分子的两个DNA像素，因为每个像素仅占据不同的空间区域。这一点，再加上多个相邻分子将因此共享相同的像素条形码这一事实，允许使用图论方法对每个分子的相对位置进行空间重建，该方法通过将DNA像素条形码视为图中的节点，并且每个分子的2个像素条形码的组合代表图中的边缘(链接)。

对生成的4千万个读长进行了一系列数据过滤步骤。简而言之，过滤步骤由去除以下的读长组成：短于预期长度、不包含预期在特定位置的常见序列基序和仅在数据中观察到一次。平均读长深度为7.99，即每个唯一分子平均有7.99个拷贝。

在过滤之后剩下的读长中，基于其为缀合寡核苷酸序列的一部分的唯一分子标记(UMI)序列总共标记了340万个唯一分子。总共发现了来自组A的361575个DNA像素序列和来自组B的451177个DNA像素序列。与来自组A的每个像素相关的唯一缀合物寡核苷酸的平均数为7.47，而与来自组B的每个像素相关的唯一缀合物寡核苷酸的平均数为9.31。

过滤掉小的图组件之后，所生成的图或物理图由一组约100个图组件(簇)组成，每个图组件(簇)包括至少1000个节点。为每个组件生成诱导子图，并针对每个簇汇总了每种表面标记物类型的计数。使用散点图比较了每个簇内标记物计数的相关性(图18A-18C)。如果两种B细胞标记物针对彼此(HLA-DR、CD19)或者两种T细胞标记物(CD3、CD7)进行绘图，则观察到标记物计数的线性相关性。而如果B细胞标记物(HLA-DR)针对T细胞标记物(CD3)进行绘图，则观察不到这样的相关性。总之，这些结果表明，每个分开的图簇都是从该实验中单个细胞生成并代表单个细胞的，该实验含有具有B和T细胞、Raji和Jurkat的混合物的样品。

选择代表性簇并使用Kamada-Kawai力生成的图形布局算法进行可视化(图19)。可以用不同的颜色表示图19中图的每个边缘(链接)，以标记不同的抗体类型，其中信息已从与抗体缀合的每个寡核苷酸的条形码序列中解码，并且图的每个节点代表DNA像素序列。

序列表

<110> 普赛尔根技术股份公司

<120> 通过系列引物延伸进行空间作图

<130> PIXL-006WO

<150> 63168132

<151> 2021-03-30

<160> 27

<170> PatentIn version 3.5

<210> 1

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (23)..(42)

<223> n是a, c, g, 或 t

<400> 1

gctttaaggc cggtcctagc aannnnnnnn nnnnnnnnnn nncaacatca gtattcccag 60

gctacctgca ggttaagcgg attg 84

<210> 2

<211> 94

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (26)..(45)

<223> n是a, c, g, 或 t

<400> 2

caacatcagt attcccaggc taaaannnnn nnnnnnnnnn nnnnnagatc ggaagagcgt 60

cgtgtaggga aagacctgca ggttaagcgg attg 94

<210> 3

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<400> 3

ttgctaggac cggccttaaa gccaatccgc ttaacctgca gg 42

<210> 4

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<400> 4

tagcctggga atactgatgt tgcaatccgc ttaacctgca gg 42

<210> 5

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<400> 5

cctgcaggtt aagcggattg 20

<210> 6

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<400> 6

caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tg 52

<210> 7

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<400> 7

aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60

c 61

<210> 8

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 8

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnntccctt gcgatttacn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 9

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 9

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnntatccc ttgggatggn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 10

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 10

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnnctgggc aattactcgn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 11

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 11

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnngccgga cgacattaan 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 12

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 12

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnnttctgg gtccctagan 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 13

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 13

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnngtctct tggcttaaan 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 14

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 14

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnnaatagc gagcaagtan 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 15

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 15

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnngctgcg ctttccattn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 16

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 16

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnncaatca gacctatgan 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 17

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 17

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnnatatgt atcacgcgan 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 18

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 18

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnntcaatc cttccgcttn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 19

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 19

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnnctccga atcatgttgn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 20

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 20

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnngtccct gcaacttgan 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 21

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 21

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnntcccac ttccgctttn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 22

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 22

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnntggatt cccggacttn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 23

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 23

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnncgcgaa cataagaagn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 24

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 24

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnncagtcg tggtagatan 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 25

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 25

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnnatatgt cagagcaccn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 26

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 26

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnnggtggc tagataatgn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

<210> 27

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成序列

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a, c, g, 或 t

<220>

<221> misc_feature

<222> (60)..(68)

<223> n是a, c, g, 或 t

<400> 27

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnngagatg tctgcaactn 60

nnnnnnnngc tttaaggccg gtcctagcaa 90

Claims

1.一种探针系统，其包含：

(a)核酸分子群，核酸分子具有可延伸的5'或3'末端；

(b)第一组条形码颗粒，每个条形码颗粒具有核苷酸序列，核苷酸序列包含：

(i)结合序列，其与(a)的核酸分子的可延伸的末端互补，

(ii)唯一颗粒标记序列，和

(iii)第一模板序列；

(c)第二组条形码颗粒，每个条形码颗粒具有核苷酸序列，所述核苷酸序列包含：

(i)第一模板序列，和

(ii)唯一颗粒标记序列；

其中使用(b)的第一组条形码颗粒作为模板延伸(a)的核酸分子，以产生延伸产物，延伸产物含有(b)(ii)的颗粒的唯一颗粒标记序列的互补序列和第一模板序列的互补序列。

2.根据权利要求1所述的探针系统，其中(b)和/或(c)的条形码颗粒是滚环扩增(RCA)产物。

3.根据权利要求1所述的探针系统，其中(b)和/或(c)的条形码颗粒是条形码纳米颗粒，其中核苷酸序列拴在条形码颗粒的表面上。

4.根据前述任一项权利要求所述的探针系统，其中(a)的核酸分子是长度为10-200nt的合成寡核苷酸。

5.根据前述任一项权利要求所述的探针系统，其中(a)的核酸分子是具有可延伸的3'末端的cDNA分子。

6.根据前述任一项权利要求所述的探针系统，其中(a)的核酸分子包含正向引物序列，并且第二组条形码颗粒的核苷酸序列包含位于唯一颗粒标记序列下游的反向引物序列。

7.根据前述任一项权利要求所述的探针系统，其中(a)的核酸分子与结合剂或平面基底连接。

8.根据权利要求7所述的探针系统，其中(a)的核酸分子进一步包含目标标记序列，目标标记序列指示与它们连接的结合剂。

9.根据前述任一项权利要求所述的探针系统，其中第一组条形码颗粒和第二组条形码颗粒独立地含有至少10,000个颗粒，每个颗粒具有唯一颗粒标记序列。

10.根据前述任一项权利要求所述的探针系统，其中第二组条形码颗粒的核苷酸序列缺乏(b)(i)的结合序列。

11.根据前述任一项权利要求所述的探针系统，其中核酸分子是具有3'羟基或5'磷酸的寡核苷酸分子或cDNA。

12.一种使用权利要求1-11中任一项所述的探针系统将唯一颗粒标记序列添加到核酸分子上的方法，其包括：

i.将(b)的第一组条形码颗粒与(a)的核酸分子群杂交，

ii.使用第一组条形码颗粒的核苷酸序列作为模板延伸杂交的核酸分子，以产生第一延伸产物，第一延伸产物含有：i.来自第一组条形码颗粒中的条形码颗粒的唯一颗粒标记序列的互补序列和ii.第一模板序列的互补序列；

iii.去除第一组条形码颗粒；

iv.将第一延伸产物与第二组条形码颗粒杂交，其中第一延伸产物中的第一模板序列的互补序列与第二组条形码颗粒中的第一模板序列杂交；并且

v.使用第二组条形码颗粒的核苷酸序列作为模板延伸第一延伸产物，以产生第二延伸产物，第二延伸产物含有：

第一模板序列，和

13.根据权利要求12所述的方法，其中核酸分子具有正向引物序列，并且第二组条形码颗粒的核苷酸序列具有位于唯一颗粒标记序列下游的反向引物序列，并且该方法包括扩增v的第二延伸产物。

14.根据权利要求12或13所述的方法，其中该方法包括对v的第二延伸产物进行测序。

15.根据权利要求14所述的方法，使用在第二延伸产物中的唯一颗粒标记序列对，对i的核酸分子的相对位置进行作图。

16.根据权利要求12-15中任一项所述的方法，其中核酸分子附接到平面基底上，并且该方法得到位于基底上的第二延伸产物的阵列。

17.根据权利要求12-15中任一项所述的方法，其中核酸分子通过结合剂附接到细胞样品上，并且第二延伸产物中的唯一颗粒标记指示细胞样品上结合剂的相对位置。

18.根据权利要求12-15中任一项所述的方法，其中核酸分子是在细胞样品中原位制成的cDNA，其中第二延伸产物中的唯一颗粒标记指示细胞样品中cDNA的相对位置。

19.一种对细胞样品中或细胞样品上的结合事件进行作图的方法，其包括：

(a)获得：

i.含有与细胞中或细胞上的位点结合的核酸分子的样品；

ii.第一组条形码颗粒，每个条形码颗粒具有核苷酸序列，核苷酸序列包含：

(i)结合序列，其与(a)的核酸分子的可延伸的末端互补，

(ii)唯一颗粒标记序列，和

(iii)第一模板序列；

iii.第二组条形码颗粒，每个条形码颗粒具有核苷酸序列，所述核苷酸序列包含：

(i)第一模板序列，和

(ii)唯一颗粒标记序列；

(b)将(a)(ii)的第一组条形码颗粒与样品特异性杂交，其中第一组条形码颗粒中的至少一些条形码颗粒的核苷酸序列与(a)的核酸分子中的至少两种核酸分子杂交；

(c)使用第一条形码颗粒作为模板延伸与步骤(b)中条形码颗粒杂交的核酸分子，以产生第一延伸产物，每个第一延伸产物包含第一唯一颗粒标记序列；

(d)从样品去除第一组条形码颗粒；

(e)将(a)(iii)的第二组条形码颗粒与(c)的第一延伸产物特异性杂交，其中第二组条形码颗粒中的至少一些条形码颗粒的核苷酸序列与第一延伸产物中的至少两种分子杂交；

(f)使用第二条形码颗粒作为模板延伸与步骤(e)中第二条形码颗粒杂交的第一延伸产物，以产生第二延伸产物，第二延伸产物包含两种唯一颗粒标记序列；

(g)确定哪种唯一颗粒标记序列或其互补序列在第二延伸产物中；并且

(h)使用在第二延伸产物中的唯一颗粒标记序列对(a)(i)的核酸的相对位置进行作图。

20.根据权利要求19所述的方法，其中通过将与结合剂连接的寡核苷酸与细胞中或细胞上的位点结合来制备(a)的样品。

21.根据权利要求20所述的方法，其中结合剂是寡核苷酸探针、抗体或适配体。

22.根据权利要求20或21所述的方法，其中寡核苷酸进一步包含目标标记序列，目标标记序列指示与它们连接的结合剂。

23.根据权利要求19所述的方法，其中(a)的核酸分子是cDNA分子。

24.根据前述任一项权利要求所述的探针系统，其中第二组条形码颗粒的核苷酸序列缺乏第一组条形码颗粒的结合序列。

25.一种探针系统，其包含：

(a)核酸分子群，核酸分子具有可延伸的5'或3'末端；

(b)一组条形码颗粒，每个条形码颗粒具有核苷酸序列，核苷酸序列包含：

(i)结合序列，其与(a)的核酸分子的5'或3'末端互补，

(ii)唯一颗粒标记序列，和

(iii)第一模板序列；和

(c)连接夹板，其包含第一寡核苷酸和第二寡核苷酸，其中

第一寡核苷酸包含第一序列和第一模板序列；并且

第二寡核苷酸包含第一模板序列和与第一序列互补的第二序列。

26.根据权利要求25所述的探针系统，其中(b)的条形码颗粒是滚环扩增(RCA)产物。

27.根据权利要求25所述的探针系统，其中(b)的条形码颗粒是条形码纳米颗粒，其中(b)的核苷酸序列拴在条形码颗粒的表面上。

28.根据权利要求25-27中任一项所述的探针系统，其中(a)的核酸分子是长度为10-200nt的合成寡核苷酸。

29.根据权利要求25-27中任一项所述的探针系统，其中(a)的核酸分子是cDNA分子。

30.根据权利要求25-28中任一项所述的探针系统，其中(a)的核酸分子与结合剂连接。

31.根据权利要求25-30中任一项所述的探针系统，其中一组条形码颗粒可含有至少10,000个颗粒，每个颗粒具有唯一颗粒标记序列。

32.一种使用权利要求25-31中任一项所述的探针系统将唯一颗粒标记序列添加到核酸分子上的方法，其包括：

i.将(b)的一组条形码颗粒与(a)的核酸分子群杂交，

ii.使用核苷酸序列作为模板延伸杂交的核酸分子，以产生第一延伸产物，第一延伸产物含有：i.来自条形码颗粒的唯一颗粒标记序列的互补序列和ii.第一模板序列的互补序列；

iii.去除条形码颗粒；

iv.将第一延伸产物与连接夹板杂交，其中两个近端第一延伸产物中的第一模板序列的互补序列与连接夹板的第一序列和第二序列杂交；

v.将杂交的连接夹板的第一寡核苷酸或第二寡核苷酸中的至少一个与第一延伸产物连接，并且使用连接产物中的第一延伸产物作为模板延伸夹板中的连接的第一寡核苷酸或第二寡核苷酸的3'或5'末端，从而将两种唯一颗粒标记序列添加到核酸上。

33.根据权利要求32所述的方法，其中该方法包括对v的第二延伸产物进行测序。

34.根据权利要求32或33所述的方法，其进一步包括使用在第二延伸产物中的唯一颗粒标记序列对，对i的核酸分子的相对位置进行作图。

35.根据权利要求32-34中任一项所述的方法，其中i的核酸分子通过结合剂附接到细胞样品上，并且第二延伸产物中的唯一颗粒标记指示细胞样品上结合剂的相对位置。

36.根据权利要求32-34中任一项所述的方法，其中核酸分子是在细胞样品中原位制成的cDNA，其中第二延伸产物中的唯一颗粒标记指示细胞样品中cDNA的相对位置。