CN115176027A

CN115176027A - 用于光指导的生物分子条形码化的组合物和方法

Info

Publication number: CN115176027A
Application number: CN202080096537.6A
Authority: CN
Inventors: 乔斯林·基希; 刘宁宁; 西内姆·萨卡; 尹鹏; 盛宽伟
Original assignee: Harvard College
Current assignee: Harvard College
Priority date: 2019-12-12
Filing date: 2020-12-11
Publication date: 2022-10-11
Also published as: EP4073246A1; US20230029257A1; CA3161183A1; WO2021119402A1; EP4073246A4; AU2020400056A1; JP2023506176A

Abstract

本文提供了用于核酸条形码化的组合物、试剂盒和方法。本文提供的条形码组合物可用于对样品中的多个靶标进行线性、组合性或空间条形码化。本文还提供了用于本文提供的条形码化方法的装置，所述装置包含光源和样品支持器。

Description

用于光指导的生物分子条形码化的组合物和方法

相关申请的交叉引用

根据35U.S.C.§119(e)，本申请要求2019年12月12日提交的美国临时申请No.62/947,237的权益，以引用的方式将其内容整体并入本文。

政府支持

本发明是在由美国国防部/海军研究办公室资助的N00014-16-1-2410和N00014-18-1-2549、美国国立卫生研究院资助的HL145600和GM133052、以及美国国家科学基金会资助的1317291和1729397的政府支持下完成的。美国政府对本发明享有一定的权利。

技术领域

本公开涉及用于核酸条形码化的组合物和方法。

背景技术

为了了解细胞如何发挥作用、分化和响应于环境因素，对单个细胞在其天然环境中的分子状态进行分析对于基础研究应用和生物医学是必要的。单细胞测序通过提供定量的细胞水平转录组学信息，揭示了对生物学的重要新理解。然而，在亚细胞水平和位于组织内的细胞水平两者上的多尺度空间信息在对细胞解离进行细胞水平测序的过程中丢失。

发明内容

本文提供了用于光指导的条形码化随后测序的组合物和方法，其允许用原位附着至核苷酸序列的条形码序列跨长度尺度(亚细胞到大组织)对生物分子进行可编程标记。本文提供的方法为高通量的，并且与以前的条形码化方法相比具有数个优点，例如，提供具有空间信息的序列信息两者的能力、改进的信号对背景噪音比、多重化(multiplexing)能力、改进的检测速度、选择性、可扩展性、并且不需要预先确定的捕获阵列或破坏样品。

在一个方面，本文提供了组合物(例如条形码组合物)，所述组合物包含第一核酸链和第二核酸链，其中，第一核酸以5'至3'方向包含任选的唯一分子标识符(UMI)序列、第一靶向结构域和杂交结构域；并且第二核酸以5'至3'方向包含条形码结构域和杂交结构域，其中，第一核酸链的杂交结构域与第二核酸的杂交结构域实质上互补，并且第一核酸链的杂交结构域和第二核酸的杂交结构域中的至少一个包含光反应元件。

在另一方面，本文提供了组合物(例如条形码组合物)，所述组合物包含第一核酸链和第二核酸链，其中，第一核酸以5'至3'方向包含任选的唯一分子标识符序列、第一靶向结构域和杂交结构域；并且第二核酸以5'至3'方向包含杂交结构域和条形码结构域，其中，第一核酸链的杂交结构域与第二核酸的杂交结构域实质上互补，并且第一核酸链的杂交结构域和第二核酸的杂交结构域中的至少一个包含光反应元件。

在一些实施方式中，第二核酸链还包含唯一分子标识符序列。例如，唯一分子标识符序列可存在于条形码序列的5'，例如，在5'端。第二核酸链也可包含引物序列。例如，在实施方式中，第二核酸链包含引物序列。例如，第二核酸链可在条形码结构域或唯一分子标识符序列的5'端包含引物序列。通常，引物序列将处于或临近第二核酸的5'端。

在一些实施方式中，本文所述的组合物进一步包含第三核酸链，其中第三核酸链包含条形码结构域，其中，第三核酸的条形码结构域与第二核酸链的条形码结构域实质上互补。在一些实施方式中，第三核酸进一步在条形码结构域的5'端包含唯一分子标识符序列。第三核酸也可包含引物序列。例如，第三核酸还可在条形码结构域或唯一分子标识符序列的5'端包含引物序列。通常，引物序列将处于或临近第三核酸的5'端。

在又一方面，本文提供了组合物(例如条形码组合物)，所述组合物包含第一核酸和n个额外的核酸，所述第一核酸以5'至3'方向包含任选的唯一分子标识符序列、第一靶向结构域和杂交结构域，其中n为1至100的整数，并且其中，各额外的核酸以5'至3'方向包含第一杂交结构域、条形码结构域和第二杂交结构域，并且其中，第n个核酸的第一杂交结构域与第(n-1)个核酸的第二杂交结构域实质上互补，其中，n＝1核酸的第一杂交结构域与第一核酸的第一杂交结构域实质上互补，并且其中，各核酸的第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件，并且其中，第一核酸链的杂交结构域和n＝1核酸链的第一杂交结构域中的至少一个包含光反应元件。

在一些实施方式中，所述组合物进一步包含第一帽核酸链，所述第一帽核酸链以5'至3'方向包含第一帽杂交结构域和第二帽杂交结构域，其中，第一帽杂交结构域与第n个核酸的第二杂交结构域实质上互补；并且其中，第一帽杂交结构域和第n个核酸链的第二杂交结构域中的至少一个包含光反应元件。

在一些实施方式中，所述组合物进一步包含第一帽核酸链和第二帽核酸链，所述第二核酸链以5'至3'方向包含引物序列结构域、任选的唯一分子标识符序列、以及杂交结构域，其中，所述杂交结构域与第一帽核酸的第二帽杂交结构域实质上互补，并且其中，所述第一帽核酸链的第二杂交结构域和第二帽核酸的杂交结构域中的至少一个包含光反应元件。

组合物的核酸链可包含额外的元件或结构域。例如，第一核酸可进一步包含引物序列。引物序列可存在于靶向结构域或唯一分子标识符序列的5'端。通常，引物序列将处于或临近第一核酸链的5'端。

本文还提供了包含本文所述组合物的试剂盒。例如，包含本文所述的核酸链和任选的额外元件或装置的试剂盒。

本文公开的组合物和试剂盒对检测靶标和/或对靶标进行条形码化而言有用。本文公开的组合物和试剂盒可用于在体外、在体内、在原位或在整体上对生物分子进行条形码化。因此，本文还提供了对靶核酸进行条形码化或检测的方法。在一个方面，本文提供了用于检测靶mRNA的方法。通常，该方法包括：(i)使靶mRNA(第一核酸)与第二核酸杂交，并且其中，所述mRNA包含杂交结构域，所述杂交结构域包含polyA序列，并且所述第二核酸以5'至3'方向包含杂交结构域和第一条形码结构域，其中，第二核酸的杂交结构域与第一核酸的杂交结构域实质上互补，并且杂交结构域中的至少一个包含光反应元件；(ii)使mRNA与第二核酸光交联，从而形成探针-引物复合物；(iii)由探针-引物复合物合成记录核酸(record nucleic acid)；以及(iv)检测记录核酸。

在另一方面，本文提供了用于检测靶核酸的方法。通常，该方法包括：(i)使靶核酸与第一核酸杂交，并使第二核酸与第一核酸杂交，其中，第一核酸以5'至3'方向包含任选的唯一分子标识符(UMI)序列、与靶标元件的核酸实质上互补的靶向结构域、以及杂交结构域；其中，第二核酸以5'至3'方向包含杂交结构域和条形码结构域，并且其中，第二链的杂交结构域与第一链的杂交结构域实质上互补，并且杂交结构域中的至少一个包含光反应元件；(ii)将第一核酸与第二核酸光交联，从而形成探针-引物复合物；(iii)任选地，使探针-引物复合物从靶核酸变性；(iv)由探针-引物复合物合成记录核酸；以及(v)检测记录核酸。

在又一方面，本文提供了用于检测靶mRNA的方法。该方法包括：(i)使靶mRNA(第一核酸)与第二核酸杂交，其中，所述mRNA包含杂交结构域，所述杂交结构域包含polyA序列，并且其中，所述第二核酸以5'至3'方向包含杂交结构域和条形码结构域，并且其中，第二链的杂交结构域与mRNA的杂交结构域实质上互补并包含光反应元件；(ii)使mRNA与第二核酸光交联，从而形成第一复合物；(iii)将第三核酸杂交至第一复合物中的第二核酸，从而形成探针-引物复合物，其中，第三核酸包含与第二核酸的第一条形码结构域实质上互补的条形码结构域；(iv)由探针-引物复合物合成记录核酸；以及(v)检测记录核酸。

本文还提供了用于检测靶核酸的方法。该方法包括：(i)使靶核酸与第一核酸杂交，并使第二核酸杂交至第一核酸，其中，第一核酸以5'至3'方向包含任选的唯一分子标识符序列、靶向结构域以及杂交结构域，其中，靶向结构域与靶核酸实质上互补，其中，第二核酸以5'至3'方向包含杂交结构域和条形码结构域，并且其中，第二杂交结构域与第一核酸的第一杂交结构域实质上互补，并且杂交结构域中的至少一个包含光反应元件；(ii)使第一核酸与第二核酸光交联，从而形成第一复合物；(iii)任选地，使第一复合物从靶核酸变性；(iv)使第三核酸杂交至第一复合物中的第二核酸，从而形成探针-引物复合物，其中，第三核酸包含与第二核酸的条形码结构域实质上互补的条形码结构域；(v)由探针-引物复合物合成记录核酸；以及(vi)检测记录核酸。

在又一方面，本文提供了用于检测靶核酸的方法。通常，该方法包括制备多联体(concatemer)。例如，该方法包括：(i)使靶核酸与第一核酸杂交，其中，第一核酸以5'至3'方向包含任选的唯一标识符序列、靶向结构域以及杂交结构域，其中，第一靶向结构域与靶核酸实质上互补；(ii)通过例如以逐步的方式使n个额外的核酸杂交，并将所述额外的核酸与第一链光交联来制备多联体，其中，n为1至100的整数，并且其中，各额外的核酸以5'至3'方向包含第一杂交结构域、条形码结构域以及第二杂交结构域，其中，第n个核酸的第一杂交结构域与第(n-1)个核酸的第二杂交结构域实质上互补，其中，n＝1核酸的第一杂交结构域与第一核酸的杂交结构域实质上互补，并且其中，各个核酸的第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件，并且n＝1核酸的第一杂交结构域和第一核酸的杂交结构域中的至少一个包含光反应元件；(iii)使第一帽核酸链与多联体杂交，从而形成加帽多联体，其中，第一帽核酸包含第一帽杂交结构域和第二帽杂交结构域，其中，第一帽杂交结构域与第n个核酸的第二杂交结构域实质上互补；(iv)使第二帽核酸链杂交至加帽多联体，从而形成多联体-引物复合物，其中，第二帽核酸链以5'至3'方向包含引物序列结构域、任选的唯一分子标识符序列和杂交结构域，其中，第二帽核酸的杂交结构域与第一帽核酸的第二帽杂交结构域实质上互补，并且其中，第二帽核酸的杂交结构域和第一帽核酸的第二帽杂交结构域中的至少一个包含光反应元件；(v)检测多联体-引物复合物，或者由多联体-引物复合物合成记录核酸并检测记录核酸。

用于检测记录链的示例性方法包括但不限于对记录核酸进行测序、光学显微术、高通量扫描仪、共聚焦显微术、光片显微术、电子显微术、原子力显微术和/或肉眼。

在一些实施方式中，可在检测(例如测序)之前扩增记录链。如果期望，可在对记录链进行扩增和/或测序之前切割、解交联、去除或逆转连接两条核酸链的光交联。

在另一方面，本文提供了用于对样品中的多个靶标进行线性、组合性或空间条形码化的方法。通常，该方法包括使多个靶标的各个成员中的靶核酸链与第一核酸链杂交，随后通过以逐步的方式使一个或多个额外的核酸链杂交并使所述额外的核酸链与第一复合物光交联来制备多联体，然后检测多联体和/或由多联体合成记录核酸并检测记录核酸。

靶核酸链可被包含在另一个核酸分子内，或者靶核酸链与多个靶标中的成员缀合，或者靶核酸链由细胞表达，或者靶核酸链通过化学交联、遗传编码、病毒转导、转染、缀合、细胞融合、细胞摄取、杂交、DNA结合蛋白或靶标结合剂/配体直接或间接呈现在靶标或细胞上。

在一些实施方式中，第一核酸链以5'至3'方向包含：1.任选的唯一分子标识符(UMI)序列；2.第一靶向结构域，其中，第一靶向结构域与靶核酸实质上互补；以及3.第一杂交结构域。在一些实施方式中，在多个靶标的各个成员中靶核酸链是不同的。在一些实施方式中，光交联步骤包括选择样品的预定区域，并在使各额外的核酸链杂交之后将预定区域暴露于光，从而使互补杂交结构域交联，并且在暴露于光之后并在使下一个额外的核酸链杂交之前去除任何未交联的额外的核酸链。

在一些实施方式中，各额外的核酸链以5’至3’方向包含：i.第一杂交结构域；ii.条形码结构域；以及iii.第二杂交结构域。在一些实施方式中，第n个额外的核酸链的第一杂交结构域与第(n-1)个额外的核酸链的第二杂交结构域实质上互补。在一些实施方式中，第一额外的核酸链的第一杂交结构域与第一核酸链的第一杂交结构域实质上互补。在一些实施方式中，各核酸链的第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件。

在又一方面，本文提供了本文提供的方法用于筛选治疗候选物库的用途。在一些实施方式中，该用途包括通过本文提供的方法对预限定区域进行条形码化和成像来鉴别一种或多种表型标志物。

在另一方面，本文提供了本文提供的方法用于如下的用途：候选物筛选的鉴别、药物靶标的鉴别、生物标志物的鉴别、谱分析(profiling)、表型至基因型细胞状态的表征、新疾病模型的生成、细胞和疾病模型的表征、分化状态和细胞状态的表征、组织映射(tissuemapping)、多维分析、高内涵筛选、基于机器学习的聚类或分类、细胞疗法的开发、CAR-T疗法的开发、抗体筛选、个性化医疗、细胞富集以及它们的任何组合。

在另一方面，本文提供了用于本文提供的方法中的装置。在一些实施方式中，该装置包括光源和样品支持器(holder)。

附图说明

图1A-图1C示出了双光指导的条形码化(策略1)。图1A示出了探针序列结合至感兴趣的靶标以及随后的含条形码的引物。如果用正确波长的UV光照，引物变得共价连接(交联)至探针序列，并且使用聚合酶复制完整的记录链，然后用不同的光波长逆转交联。记录扩增子在被提交用于测序之前可能首先进行PCR扩增。图1B示出了除基因组/转录组靶标外，探针序列可原位结合至任何标记有核酸的实体，例如结合至靶蛋白的DNA缀合抗体。图1C示出了非靶向方法也可用于条形码化。例如，mRNA转录物的polyA尾可结合至条形码引物，所述条形码引物然后可如前所述进行交联。逆转录用于在后续制备步骤和测序之前复制部分或全部mRNA转录物序列。

图2A-图2D示出了带有条形码化的桥序列的光指导的条形码化(策略2)。图2A示出了探针序列结合至感兴趣的靶标以及随后的含条形码的桥链。如果用适当波长的UV光照，桥变得共价连接(交联)至探针序列，并且探针-桥复合物可在相应的引物杂交至条形码序列之前变性。聚合酶用于复制完整的记录链，然后可在测序前对所述记录链进行PCR扩增。如果使用链置换聚合酶，则聚合反应也可在探针仍结合至靶标时发生(部分(图2B))。图2C示出了非靶向方法也可用于条形码化。例如，mRNA转录物的polyA尾可结合至包含数个T碱基的条形码桥。图2D示出了，这些条形码桥届时可如前所述地进行交联并被制备用于测序(使用逆转录等)。然后使用测序来回收转录物加条形码信息。

图3A-图3C示出了具有多联体组装的光指导的条形码化(策略3)。图3A示出了探针序列结合至感兴趣的靶标以及随后的条形码链。如果用正确波长的UV光照，条形码变得共价连接(交联)至探针序列。多联体通过迭代的条形码杂交和交联反应而形成。图3B示出了使用链置换聚合酶用于通过跨连接体(cross-junction)合成反应来复制完整记录链，然后可在测序前对所述记录链进行PCR扩增。序列显示了组合的条形码序列和靶标序列信息。在引发和跨连接体合成之前，多联体组装体也可首先从样品/表面变性(部分(图3C))。

图4A-图4D示出了光指导的条形码化。图4A示出了基本的序列特异性交联反应涉及彼此结合的两个互补或大部分互补的序列，其中一个含有CNVK修饰。暴露于UV光引起链的共价连接(交联)。图4B示出了，通过将光照限制在特定区域或区域集合，也可将交联限制在这些区域(使用如前所述的策略1化学)。例如，含有CNVK的探针序列被结合，但只有一些区域被交联，然后在洗去所有非交联链后得到仅在光照区域中结合的探针。图4C示出了使用具有不同条形码序列(例如B1到Bn)的条形码引物的迭代轮次的杂交、空间图案化交联和洗涤可用于标记不同区域。测序后，回收组合的条形码序列和靶标/转录物信息，所述测序可以发生于同时合成并在测序过程中合并的所有记录体。对于之前描述的第二种条形码化化学(策略2)，迭代的空间图案化交联也可类似地进行，但在不同的轮次中结合的是条形码桥链而不是不同的条形码引物(部分(图4D))。

图5A-图5C示出了光指导的组合性条形码化。图5A示出了组合性的光指导的条形码组装是通过用具有不同条形码序列(例如序列0和1)的条形码链进行迭代轮次的杂交、空间图案化交联和洗涤来实现的。图5B示出了如果期望，各个单独的区域可接收唯一的组装顺序(例如，所示实例中的1010010或0011101)，或者多个区域可接收相同的组装顺序。图5C示出了通过跨连接体合成反应将所组装的条形码序列加原始探针序列信息的顺序在记录链中合成。可在对记录体进行测序之前进行PCR扩增。

图6A-图6F示出了空间图案化交联的实验验证。图6A示出了经CNVK(灰色实心圆圈)修饰的条形码链与空间光掩模组合使用以指导条形码交联至选定细胞中的RNA靶标。条形码链含有条形码序列(蓝色和紫色)和Cy3b荧光团(绿色星形)。可通过连续的洗涤和UV交联事件进行迭代的光指导的条形码构建。图6B示出了所示的最终交联步骤，该步骤将传递和交联携带有引物结合位点(橙色)的链，所述引物结合位点用于Cy5标记的引物链(带有品红色星形的橙色链)。对于该步骤，进行了全场域(whole field)交联。图6C示出了DAPI(蓝色通道)标记的EY.T4细胞。没有交联。图6D示出了应用空间掩模以使细胞的核糖体RNA与Cy3b(绿色通道)标记的条形码链交联。绿色通道显示了甲酰胺洗涤后处于交叉矩形图案的成功交联。图6E示出了子图(d)在两个矩形之间的“交点”处的更近视野。图6F示出了在子图(图6B)中示出的最终引物加帽组之后，在DAPI(蓝色)、Cy3b(绿色)和Cy5(品红色)通道中的成像。由于全场域UV交联，预期Cy5标记的链交联至所有细胞。包含条形码链和引物链两者的细胞在绿色和品红色通道中均叠加(overlaid)，并且预期在通道叠加中显示为白色。注意的是，品红色通道对比度经缩放以匹配经条形码化的细胞，所述细胞预期具有与Cy5相比高3×的Cy3b荧光团。

图7A-图7C示出了多至3个连接体(junction)的多联体的迭代组装。图7A示出了用Cy3b标记的条形码链和Cy5标记的引物进行的迭代连接体组装的示意图。图7B示出了一个连接体的组装体和三个连接体的组装体的跨连接体合成、随后对记录体进行PCR扩增的代表性示意图。图7C示出了PAGE变性凝胶，所述变性凝胶显示了两个实验的PCR产物以及无探针对照。

图8A-图8C示出细胞水平空间标记的实验验证。图8A示出了显示不同表型标志物的细胞的混合物。选择经GFP转染的细胞(绿色圆圈)与携带报告荧光团(橙色星形)的CNVK链(灰色实心圆圈)交联。图8B示出了明场和绿色通道图像的叠加，其示出了经GFP转染的和未转染的细胞的混合物。在显示GFP信号的细胞周围绘出选择用于交联的多个感兴趣的区域(黄色、蓝色、绿色、红色轮廓)。图8C示出了交联后细胞的荧光图像。核染色(蓝色)、GFP(绿色)和荧光CNVK链(黄色)叠加。

图9A-图9D示出了测序结果。利用策略2的变体(UMI处于扩增子的两端)，在固定的HeLa细胞上使用图案化光照对三个不同的空间上分开的区域进行连续条形码化。图9A展示了用FISH将6个不同的探针序列(两个靶向核糖体RNA以及四个靶向Xist RNA)结合至它们的靶RNA序列。随后是迭代条形码化、含条形码的引物的结合、记录体的合成和扩增。使用Collibri测序制备试剂盒为下一代测序(HiSeq)制备扩增子。图9B-图9C示出了在比对后，以高百分比回收预期格式的读段(read)。图9D示出了对于各个探针-区域对而显示的数据大子集的读段分布。

图10展示了条形码化的靶向方法和非靶向方法。任何类型的核酸都可条形码化。这些核酸通常与原位定位的生物分子相关联、结合或杂交。可通过靶向方法或基于亲和力的方法靶向特定的生物分子，所述方法例如用于DNA/RNA靶标的FISH、用于蛋白质靶标的IF(例如通过核酸缀合抗体或纳米抗体)或能够与核酸缀合或以其它方式相关联的任何其它基于亲和力的试剂。可以替代地使用非靶向的方法，由此以非靶向方式定位或产生核酸。例如，以下可被条形码化：由RNA逆转录产生的cDNA拷贝、或预先存在的RNA或DNA、或经修饰的骨架序列，或由聚合酶、连接酶、限制性酶、核酸酶、端粒酶、末端转移酶、重组酶或转座酶的作用原位产生的其它反应产物(例如邻近连接技术、引物交换反应、自循环邻近记录或标记的那些)。

图11A-图11B示出了针对细胞或其它感兴趣区域的条形码的组装。(图11A)在原位定位的核酸(例如cDNA序列)上迭代形成多联体，引起形成用于来自该细胞的读段的特定条形码(例如m-g-o-m-y-r-c)。示出了cDNA的3'条形码化的取向，但也可进行5'条形码化(参见例如图18和图19)。(图11B)使用跨连接体合成和PCR来制备用于测序的记录体。

图12示出了本文提供的方法和组合物的应用。

图13示出了用于解离拆分-合并(split-pool)条形码化的工作流程。将细胞或其它相关联的生物分子(例如水凝胶片)迭代地拆分至管中，对核酸进行条形码化(例如通过在别处描述的光指导的多联体形成)，然后再合并，使唯一的条形码序列能够与各个单独的细胞/成分相关联。先前，拆分-合并策略通过多个昂贵的酶促连接步骤用于单细胞条形码化，但使用基于多联体的条形码化策略显著降低了成本，因为每个条形码步骤都可在不需要昂贵的酶或其它试剂的情况下执行。可与序列在表面上时类似地通过记录体的跨连接体合成和PCR来提取序列。

图14A-图14C示出了空间条形码化的实施方式。(图14A)通常通过使用CNVK修饰来交联条形码，并且使用UV光激活交联。(图14B)通过空间寻址UV光光照分布，条形码可仅在期望的位置交联至对接序列(dock sequence)，并且在严格的洗涤步骤(例如，含有甲酰胺的缓冲液)之后，所有未交联的条形码链都可被洗掉。(图14C)结合、交联特定区域和严格洗涤的迭代步骤使得能够迭代构建与那些特定区域相关联的条形码。

图15A展示了执行N个区域(例如N个不同的细胞)的线性条形码化，使得N个条形码中的单个被分配至各个感兴趣的位置(或多个位置)。然后可一起批量地(in bulk)提取测序结果，并且可根据读段中的条形码序列将读段映射(mapped)回其原始对应位置。图15B展示了组合性条形码化的方法，迭代地构建串联的(concatenated)条形码，使得读段应归属于的各个区域(例如细胞)收到唯一的条形码(参见例如图18)。例如，对于N轮次的M个条形码，能可行地分配M^N个唯一条形码。

图16示出了样品的组合成像和RNA测序数据的工作流程的实施方式。通常，可在条形码化之前或之后添加额外的成像步骤和其它测定，并且可任选地在条形码之前或之后进行A加尾(A-tailing)步骤。可替代地使用不同的加尾(例如，可利用通过末端转移酶或其它酶进行的T加尾、C加尾、G加尾或任何其它类型的加尾)。对于靶向方法，工作流程非常相似，不同之处在于探针可能已经包含5'和3'尾部，因此可跳过RT和A加尾步骤。任何结构域(例如，1字母、2字母、3字母或4字母)均可用于3'尾部序列。

图17示出了UV功率和光照条件的实验验证。用以对条形码化的UV功率和光照条件进行优化的一组实验，对结合至HeLa细胞中rRNA转录物的FISH探针进行所述条形码化。在孔上栅格化棋盘图案，每个单独的区域测试不同的UV功率和光照时间条件。

图18示出了在跨连接体合成引物上具有UMI的5'光指导的条形码化策略的链图。具有悬垂的5'结构域的引物(例如末端具有随机N个碱基)定位至RNA(例如mRNA、非编码RNA)并产生cDNA序列。然后cDNA序列可在3'端附加碱基，例如通过使用末端转移酶和dATP附加polyA尾。随后，通过结合、UV交联和洗涤步骤，将组合性条形码直接迭代组装至cDNA的5'悬垂部分或其它原位定位序列上。(A加尾步骤可包括在条形码化之前或之后)。任选地，可在跨连接体合成之前或同时从RNA进行条形码的RNaseH置换。跨连接体合成后，通过PCR扩增形成完整的记录体。

图19示出了在条形码加帽链上具有UMI的5'光指导的条形码化策略的链的图解。具有悬垂的5'结构域的引物(例如末端具有随机N个碱基)被定位至RNA(例如mRNA、非编码RNA)并产生cDNA序列。然后cDNA序列可在3'端附加碱基，例如通过用末端转移酶和dATP附加polyA尾。随后，通过结合、UV交联和洗涤步骤，将组合性条形码直接迭代组装到cDNA的5'悬垂部分或其它原位定位序列上。任选地，可在跨连接体合成之前或同时从RNA进行条形码的RNaseH置换。跨连接体合成后，通过PCR扩增形成完整的记录体。

图20示出了用于cDNA文库生成的引物组的实验验证。(顶部)用于逆转录(RT)的引物和浓度的表格。孔标记(A1-B4)与底部显示的图像取向匹配。孔B1-B4具有非逆转录阴性对照以及引物的组合。(底部)使用Cy5标记的引物进行逆转录后cDNA文库的定位图像。然后使用DMD和10×物镜以棋盘图案添加并交联Cy3 CNVK条形码，并以Cy3成像。

图21示出了不同RT引物的测序结果。用不同引物在经固定的HeLa细胞中进行原位逆转录，所述引物含有5'条形码化结构域以及3'端的NNNNNNN(7个N，实验A1)、NNNNNGGG(5个N和3个G，实验A2)或NNNNNCCC(5个N和3个C，实验A3)。根据图18中描述的策略进行条形码化、跨连接体合成和PCR之后，将PCR扩增子用Ampure XP珠进行纯化并送去测序(250bp配对末端)。示出了这些引物各自的数个预期的读段结果的实例，并且突出显示的cDNA序列(蓝色)如预期地映射至已知的智人(homo sapiens)序列。这些数据确认了一般策略的成功，并且确认了各个引物都可用于成功产生转录组记录体。

图22A示出了对5'序列(例如，cDNA、FISH探针等上的5'尾部)进行条形码化的序列结构。由反向(Rev)引物加帽链、零个以上的条形码链以及带有polyA尾的cDNA、FISH或其它的探针序列形成的多联体可使用跨连接体合成引物进行有效复制，以形成可测序的PCR可扩增记录体，所述跨连接体合成引物含有正向(For)引物和polyT 3'端。在这种情况下，使用了两种不同取向的条形码序列(W/X结构域和Y/Z结构域)，但也可使用更多不同的条形码序列。链可经纯化或未经纯化，并且可在3'或5'端包含额外的碱基(例如，用以防止延伸或降解的修饰、T接头、荧光团)。图22B示出了用于在接下来的数幅图中展示的结合结构域条形码序列的实施方式，根据其结构域对所述序列进行着色。具有不同(条形码)结构域序列的任意数量的条形码链可用于条形码化。图22C示出了所有后续图中报告的实验的完整序列信息。PCR引物序列基于Smart Seq3协议。在对数十个跨连接体合成反应进行建模和广泛测试之后，所有其它序列(尤其是用于条形码化的那些序列)均为这种条形码化应用而特别设计和实验。另见工作实施例中的表1-表3。

图23A-图23E示出了链霉亲和素包被的表面(载玻片)上的迭代条形码组装体的验证。图23A示出了荧光标记的DNA条形码链的迭代条形码组装、随后为跨连接体合成和PCR的示意图。图23B示出了具有2到7个连接体的串联的条形码的示意图，分别含有1到6个条形码。图23C示出了不同孔中预期的DNA条形码长度分布(顶部)。8孔室中的左上孔含有长度为6的DNA条形码，并将显示最高量的荧光信号。随后为5和4等。以Cy3荧光通道对8孔室的扫描(底部)。图23D示出了基于图22A-图22C所示序列对于7个连接体的多联体和扩增子的完整序列设计。图23E示出了在提取、PCR和用MinElute PCR纯化柱进行纯化后，对来自左上孔(6连接体)的扩增子进行测序(250bp配对末端测序)。示出了对于全长(包含6个条形码的读段)以及截短的读段(例如，含有2个或4个条形码)两者的示例测序结果。由于多联体形成步骤中的一些低效率，除了全长读段外，预期截短的读段。

图24示出了遵循图19中描述的策略的数种不同的固定、透化、RT和条形码化条件的测序结果。(顶部)示出了数个序列，所述序列针对数种固定/透化条件(实验B1至B8)中的每一个而获得，并在两轮条形码化后与预期的序列格式相匹配。这些序列示出了各种情况下的预期的条形码序列以及出现的不同UMI和序列长度的实例。(底部)在保持固定和透化不变的同时，与对照一起对RT步骤的数种变化进行测定。对于C1至C4的各个实验，首先引入一个条形码，但在严格洗涤之前未交联(交换1)，然后引入第二个条形码，该条形码用UV进行交联并且应当出现在测序读段中(交换2)。如预期的那样，在除了在RT期间含有RNase A的对照之外的所有条件下，交联的正确条形码在大多数读段中出现(检查的2000个读段中>1500个)并且不正确的(非交联的交换1条形码)条形码极少出现(低至2000个读段中的0个)。在除无逆转录酶(RT)对照(实验B1)之外的所有条件(实验B2至B8、C1至C4)中，突出显示的cDNA序列(蓝色)映射至已知的智人序列。例外：如图所示，A加尾在条形码化后发生的一些条件，以及RNaseH处理与跨连接体合成孵育结合的所有条件。

图25A-图25D展示了实验B1至B8以及C1至C4的成像和凝胶结果。图25A示出了实验B1至B8的成像结果，其显示了在用荧光团(Alexa 488)标记的RT引物进行逆转录(RT)后的不同荧光形态。如所预期的，在置换后，来自经定位引物的荧光信号显著下降，表明它们在组合的RNaseH和跨连接体合成步骤期间已成功置换。图25B示出了对于在RT期间包含RNaseA且没有RNaseOUT的对照条件，信号要高得多，而较低的对比度可视化显示了强烈的疑似核仁信号。图25C示出了实验C1、C3和C4的成像结果。图25D示出了所有条件下的凝胶结果，该结果显示了PCR扩增后产生的记录体的长度(具有Sybr Gold的1％琼脂糖E-凝胶)。对于含有逆转录和没有RNase A的情况，所回收的典型长度范围在约150bp和1300bp之间。

图26示出了转录组映射结果。使用STAR比对器对测序结果进行转录组映射。(左侧)左侧示出了实验B7的以预期序列格式标识的1024个转录物的映射结果的示例的输出日志文件。40.5％的读段唯一映射，而49％映射至多个基因座，以及9.5％过短而无法映射。(右侧)基因映射结果按所映射的转录物的频次分选，并描绘了列表的顶部。最常见的唯一映射的基因对应于线粒体rRNA。

图27示出了表面上的自动化条形码分配和迭代条形码化。示例性工作流程，通过该流程可将一系列条形码(BC1、BC2、BC3等...)转换为一系列光掩模(中间子图)，每个感兴趣区域(白色正方形、中间子图)分配唯一的条形码。在一系列6个条形码化步骤后拍摄图像，使用荧光DNA链对112个感兴趣区域的阵列进行唯一标示和条形码化(右子图)。

图28A-图28G示出了生物分子样品的自动化条形码化。图28A示出了工作流程，通过该流程可用计算机算法检测细胞集合并选择性地靶向进行条形码递送，从而使每个细胞具有唯一的条形码分配。图28B示出了具有靶向RNA的荧光DNA引物的细胞图像。图28E示出了使用来自子图(图28C、图28F)的掩模用荧光DNA条形码(绿色)进行6轮条形码化后的细胞图像。图28C和图28F示出了检测到的细胞掩膜(白色轮廓)的叠加。图28D和图28G示出了分别来自(图28C)和(图28F)的框出的正方形的放大图像。

具体实施方式

本文提供的核酸条形码化的基本策略描绘于图1A-图9D中。

通常，本文提供的方法部分基于使得能够高通量检测靶核酸和产生序列和空间信息的方法和组合物的发现。本文提供的方法和组合物可用于许多应用，例如诊断、病理学和基础研究。

特别而言，本文提供的组合物和方法可用于空间映射、检测生物分子定位、鉴别组织中的各种细胞类型、分子编码、数据存储、组织工程、通信和生物传感。本文提供的方法可用于为寡核苷酸阵列创建图案化和条形码化表面。例如，本文提供的方法和组合物可用于较高水平的图案化、掩蔽和捕获核酸靶标(例如，感兴趣的生物标志物)。

作为另一实例，工作实施例中提供的靶向方法(例如，策略1)也可用于结合固定在样品中或表面上的其它核酸，例如结合至感兴趣的蛋白质靶标的DNA缀合抗体(参见图1B)。一般而言，可标记有或交联至感兴趣的链的任何实体(例如核酸、蛋白、肽、脂质、糖基、小分子、纳米颗粒、珠、玻璃表面)都可使用本文提供的方法进行图案化、条形码化和记录。

在一些实施方式中，条形码组合物包含：

a.第一核酸，所述第一核酸以5’至3’方向包含：(i)任选的唯一分子标识符(UMI)序列；(ii)第一靶向结构域；和(iii)第一杂交结构域，以及

b.第二核酸，所述第二核酸以5’至3’方向包含：(i)条形码结构域；以及(ii)第二杂交结构域，其中，所述第二杂交结构域与第一核酸的第一杂交结构域实质上互补，并且

其中，所述第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件。

在一些实施方式中，条形码组合物包含：

a.第一核酸，所述第一核酸以5’至3’方向包含：(i)任选的唯一分子标识符序列；(ii)第一靶向结构域；和(iii)第一杂交结构域；以及

b.第二核酸，所述第二核酸以5’至3’方向包含：(i)第二杂交结构域，其中，所述第二杂交结构域与第一核酸的第一杂交结构域实质上互补；以及(ii)第一条形码结构域，并且

在一些实施方式中，条形码组合物包含：

b.第二核酸，所述第二核酸以5’至3’方向包含：(i)第二杂交结构域，其中，所述第二杂交结构域与第一核酸的第一杂交结构域实质上互补；以及(ii)第一条形码结构域；以及(iii)第三杂交结构域，并且

其中，所述第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件，并且第三杂交结构域任选地包含光反应元件。

在一些实施方式中，条形码组合物进一步包含n个额外的核酸，其中：n任选为从1至100的整数，并且各个额外的核酸以5’至3’方向包含：(i)第一杂交结构域；(ii)条形码结构域；和(iii)第二杂交结构域，并且其中，第n个核酸的第一杂交结构域与第(n-1)个核酸的第二杂交结构域实质上互补，其中，n＝1核酸的第一杂交结构域与第三杂交结构域实质上互补，并且其中，各个核酸的第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件。

在一些实施方式中，条形码组合物进一步包含第一帽核酸链，所述第一帽核酸链以5'至3'方向包含：(i)第一帽杂交结构域，其中，当n为1以上时，所述第一帽杂交结构域与第n个核酸的第二杂交结构域实质上互补，或者当n为0时，所述帽杂交结构域与第三杂交结构域实质上互补；以及(ii)第二帽杂交结构域；其中，所述第一帽杂交结构域任选地包含光反应元件。

在一些实施方式中，条形码组合物进一步包含第一帽核酸链和第二帽核酸链，第二帽核酸链以5'至3'方向包含：(i)引物序列结构域；(ii)任选的唯一分子标识符(UMI)序列；以及(iii)杂交结构域，其中，所述杂交结构域与所述第一帽核酸的第二帽杂交结构域实质上互补，并且其中，所述第二帽杂交结构域和所述第二核酸的杂交结构域中的至少一个包含光反应元件。

本文所述的组合物和方法的核酸链包含一个或多个结构域。不受限制地，各个结构域可独立地包含任何期望的核苷酸序列或核苷酸数量。换句话说，各个结构域可独立地为任何长度。因此，每个结构域可独立地为一个核苷酸至数千个核苷酸的长度。例如，各个结构域可独立地长度为1个至1000个、1个至500个、1个至250个、1个至200个、1个至150个、1个至100个、1个至75个、1个至50个或1个至25个核苷酸。在一些实施方式中，各个结构域可独立地长度为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个或更多个核苷酸。

如本文所述，两条核酸链的杂交结构域可彼此杂交以形成双链结构。不受限制地，各个双链体区域可独立地包含任何期望数量的碱基对。换言之，各个双链体区域可独立地为任何长度。因此，各个双链体区域可独立地长度为一个碱基对至数十个碱基对。在一些实施方式中，各个双链体区域可独立地长度为1个至50个、1个至45个、1个至40个、1个至35个、1个至30个、1个至25个、1个至20个或1个至15个核苷酸或碱基对。例如，各个双链体区域可独立地长度为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个或更多个核苷酸或碱基对。

各核酸链可独立地为任何长度。例如，各核酸链的长度可为数个核苷酸至数千个核苷酸。例如，各核酸链可独立地长度为1个至50个、1个至75个、1个至100个、1个至150个、1个至175个、1个至200个、1个至250个、1个至300个、1个至400个、1个至500个、1个至750个、1个至1000个或更多个核苷酸。

各个结构域可独立地包含任何期望的核苷酸序列。此外，各个结构域可独立地使用1字母、2字母、3字母或4字母代码。如本文所使用的，“1字母代码”意指该结构域仅包含一种类型的核碱基，即仅腺嘌呤、胸腺嘧啶/尿嘧啶、鸟嘌呤和胞嘧啶中的一种或其修饰形式。例如，使用1字母代码的结构域包含核苷酸的伸长段(stretch)，该核苷酸的伸长段包含相同的核碱基或核碱基的修饰形式。例如，结构域可包含polyA、polyT、polyC或polyG的伸长段。在一些实施方式中，第一核酸的杂交结构域使用1字母代码。例如，第一核酸的杂交结构域可包含poly(A)序列。

“2字母代码”意指结构域仅包含四个核碱基中的两个，即腺嘌呤、胸腺嘧啶/尿嘧啶、鸟嘌呤和胞嘧啶中的仅两个或其修饰形式。例如，2字母代码可包含选自于由以下所组成的组中的核碱基或由选自于由以下所组成的组中的核碱基组成：腺嘌呤和胸腺嘧啶/尿嘧啶、腺嘌呤和鸟嘌呤、腺嘌呤和胞嘧啶、胸腺嘧啶/尿嘧啶和鸟嘌呤、胸腺嘧啶/尿嘧啶和胞嘧啶、以及鸟嘌呤和胞嘧啶。

“3字母代码”意指结构域仅包含四个核碱基中的三个，即腺嘌呤、胸腺嘧啶/尿嘧啶、鸟嘌呤和胞嘧啶中的仅三个或其修饰形式。例如，3字母代码可包含选自于由以下所组成的组中的核碱基或由选自于由以下所组成的组中的核碱基组成：腺嘌呤、胸腺嘧啶/尿嘧啶和鸟嘌呤；腺嘌呤、胸腺嘧啶/尿嘧啶和胞嘧啶；腺嘌呤、鸟嘌呤和胞嘧啶；以及胸腺嘧啶/尿嘧啶、鸟嘌呤和胞嘧啶。

在一些实施方式中，至少一个结构域包含相同类型的核碱基。例如，结构域仅包含嘌呤核碱基或嘧啶核碱基。

第一核酸链可为RNA分子，例如RNA转录物。在一个实例中，第一核酸为mRNA。例如，第一核酸链为mRNA，并且杂交结构域包含polyA序列。

如本文所述，核酸链包含唯一分子标识符序列或结构域。可通过在碱基添加化学合成过程中使用核苷酸混合物来合成唯一分子标识符序列或结构域，以创建随机序列(简并序列)文库。唯一分子标识符序列或结构域可以由串列的数个此类随机碱基组成，插入或不插入已知的核苷酸序列。在一些实施方式中，从引物和记录序列中排除唯一分子标识符序列或结构域。在一些实施方式中，核酸的唯一分子标识符序列或结构域被并入同一核酸的其它结构域之一中。

如本文所述，杂交结构域可包含光反应元件。如本文所使用的，术语“光反应元件”是指在通过光源进行光照时可以允许对另一核苷酸进行杂交的任何元件(例如，核苷酸、蛋白或抗体)。在一些实施方式中，光反应元件为光反应核苷酸。在一些实施方式中，光反应核苷酸为CNVK或CNVD交联碱基。在一些实施方式中，光反应元件为补骨脂素(psoralen)。

在本文所述的任意方面的一些实施方式中，核酸链可包含核酸修饰。例如，靶向结构域、条形码结构域、杂交结构域、唯一分子标识符序列和/或引物序列结构域中的至少一个可独立地包含核酸修饰。示例性核酸修饰包括但不限于核碱基修饰、糖修饰、糖间连接修饰、缀合物(例如，配体)及它们的任意组合。核酸修饰还包括非天然的核碱基或简并的核碱基。

示例性修饰的核碱基包括但不限于肌苷、黄嘌呤、次黄嘌呤、nubularine、异鸟苷、杀结核菌素，以及腺嘌呤、鸟嘌呤、胞嘧啶和尿嘧啶的经取代或修饰的类似物，例如2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基和其它烷基衍生物；腺嘌呤和鸟嘌呤的2-丙基和其它烷基衍生物；5-卤代尿嘧啶和胞嘧啶、5-丙炔基尿嘧啶和胞嘧啶，6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶，5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、5-卤代尿嘧啶、5-(2-氨基丙基)尿嘧啶、5-氨基烯丙基尿嘧啶，8-卤代、氨基、硫醇、硫代烷基、羟基和其它8-取代腺嘌呤和鸟嘌呤，5-三氟甲基和其它5-取代尿嘧啶和胞嘧啶、7-甲基鸟嘌呤、5-取代的嘧啶、6-氮杂嘧啶以及N-2、N-6和O-6取代的嘌呤，包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶、二氢尿嘧啶、3-脱氮-5-氮杂胞嘧啶、2-氨基嘌呤、5-烷基尿嘧啶、7-烷基鸟嘌呤、5-烷基胞嘧啶、7-脱氮腺嘌呤、N6,N6-二甲基腺嘌呤、2,6-二氨基嘌呤、5-氨基-烯丙基-尿嘧啶、N3-甲基尿嘧啶、取代的1,2,4-三唑、2-吡啶酮、5-硝基吲哚、3-硝基吡咯、5-甲氧基尿嘧啶、尿嘧啶-5-氧乙酸、5-甲氧羰基甲基尿嘧啶、5-甲基-2-硫尿嘧啶、5-甲氧羰基甲基-2-硫尿嘧啶、5-甲基氨基甲基-2-硫尿嘧啶、3-(3-氨基-3羧丙基)尿嘧啶、3-甲基胞嘧啶、5-甲基胞嘧啶、N⁴-乙酰胞嘧啶、2-硫胞嘧啶、N6-甲基腺嘌呤、N6-异戊基腺嘌呤、2-甲硫基-N6-异戊烯基腺嘌呤、N-甲基鸟嘌呤或O-烷基化碱基。其它嘌呤和嘧啶包括在U.S.Pat.No.3,687,808号中公开的那些；在Concise Encyclopedia of Polymer Science and Engineering，第858-859页，Kroschwitz,J.I.编著，John Wiley&Sons，1990中公开的那些；以及由Englisch等，Angewandte Chemie,International Edition,1991,30,613公开的那些。

在一些实施方式中，修饰的核碱基可选自于由如下所组成的组：肌苷、黄嘌呤、次黄嘌呤、nubularine、异鸟苷、杀结核菌素、2-(卤代)腺嘌呤、2-(烷基)腺嘌呤、2-(丙基)腺嘌呤、2-(氨基)腺嘌呤、2-(氨基烷基)腺嘌呤、2-(氨基丙基)腺嘌呤、2-(甲硫基)-N⁶-(异戊烯基)腺嘌呤、6-(烷基)腺嘌呤、6-(甲基)腺嘌呤、7-(脱氮)腺嘌呤、8-(烯基)腺嘌呤、8-(烷基)腺嘌呤、8-(炔基)腺嘌呤、8-(氨基)腺嘌呤、8-(卤代)腺嘌呤、8-(羟基)腺嘌呤、8-(硫代烷基)腺嘌呤、8-(硫醇)腺嘌呤、N⁶-(异戊基)腺嘌呤、N⁶-(甲基)腺嘌呤、N⁶,N⁶-(二甲基)腺嘌呤、2-(烷基)鸟嘌呤、2-(丙基)鸟嘌呤、6-(烷基)鸟嘌呤、6-(甲基)鸟嘌呤、7-(烷基)鸟嘌呤，7-(甲基)鸟嘌呤，7-(脱氮)鸟嘌呤、8-(烷基)鸟嘌呤、8-(烯基)鸟嘌呤、8-(炔基)鸟嘌呤、8-(氨基)鸟嘌呤、8-(卤代)鸟嘌呤、8-(羟基)鸟嘌呤、8-(硫代烷基)鸟嘌呤、8-(硫醇)鸟嘌呤、N-(甲基)鸟嘌呤、2-(硫代)胞嘧啶、3-(脱氮)-5-(氮杂)胞嘧啶、3-(烷基)胞嘧啶、3-(甲基)胞嘧啶、5-(烷基)胞嘧啶、5-(炔基)胞嘧啶、5-(卤代)胞嘧啶、5-(甲基)胞嘧啶、5-(丙炔基)胞嘧啶、5-(丙炔基)胞嘧啶、5-(三氟甲基)胞嘧啶、6-(偶氮)胞嘧啶、N⁴-(乙酰基)胞嘧啶、3-(3-氨基-3-羧丙基)尿嘧啶、5-乙炔基-2'-脱氧尿苷、2-(硫代)尿嘧啶、5-(甲基)-2-(硫代)尿嘧啶、5-(甲基氨基甲基)-2-(硫代)尿嘧啶、4-(硫代)尿嘧啶、5-(甲基)-4-(硫代)尿嘧啶、5-(甲基氨基甲基)-4-(硫代)尿嘧啶、5-(甲基)-2,4-(二硫代)尿嘧啶、5-(甲基氨基甲基)-2,4-(二硫代)尿嘧啶、5-(2-氨基丙基)尿嘧啶、5-(烷基)尿嘧啶、5-(炔基)尿嘧啶、5-(烯丙基氨基)尿嘧啶、5-(氨基烯丙基)尿嘧啶、5-(氨基烷基)尿嘧啶、5-(胍正离子烷基)尿嘧啶、5-(1,3-二唑-1-烷基)尿嘧啶、5-(氰基烷基)尿嘧啶、5-(二烷基氨基烷基)尿嘧啶、5-(二甲基氨基烷基)尿嘧啶、5-(卤代)尿嘧啶、5-(甲氧基)尿嘧啶、尿嘧啶-5-氧乙酸、5-(甲氧基羰基甲基)-2-(硫代)尿嘧啶、5-(甲氧基羰基-甲基)尿嘧啶、5-(丙炔基)尿嘧啶、5-(丙炔基)尿嘧啶、5-(三氟甲基)尿嘧啶、6-(偶氮)尿嘧啶、二氢尿嘧啶、N³-(甲基)尿嘧啶、5-尿嘧啶(即假尿嘧啶)、2-(硫代)假尿嘧啶、4-(硫代)假尿嘧啶、2,4-(二硫代)假尿嘧啶、5-(烷基)假尿嘧啶、5-(甲基)假尿嘧啶、5-(烷基)-2-(硫代)假尿嘧啶、5-(甲基)-2-(硫代)假尿嘧啶、5-(烷基)-4-(硫代)假尿嘧啶、5-(甲基)-4-(硫代)假尿嘧啶、5-(烷基)-2,4-(二硫代)假尿嘧啶、5-(甲基)-2,4-(二硫代)假尿嘧啶、1-取代的假尿嘧啶、1-取代的2-(硫代)-假尿嘧啶、1-取代的4-(硫代)假尿嘧啶、1-取代的2,4-(二硫代)假尿嘧啶、1-(氨基羰基亚乙基)-假尿嘧啶、1-(氨基羰基亚乙基)-2-(硫代)-假尿嘧啶、1-(氨基羰基亚乙基)-4-(硫代)假尿嘧啶、1-(氨基羰基亚乙基)-2,4-(二硫基)假尿嘧啶、1-(氨基烷基氨基羰基亚乙基)-假尿嘧啶、1-(氨基烷基氨基羰基亚乙基)-2-(硫代)-假尿嘧啶、1-(氨基烷基氨基羰基亚乙基)-4-(硫代)假尿嘧啶、1-(氨基烷基氨基羰基亚乙基)-2,4-(二硫代)假尿嘧啶、1,3-(二氮杂)-2-(氧代)-吩噁嗪-1-基、1-(氮杂)-2-(硫代)-3-(氮杂)-吩噁嗪-1-基、1,3-(二氮杂)-2-(氧代)-吩噻嗪-1-基、1-(氮杂)-2-(硫代)-3-(氮杂)-吩噻嗪-1-基、7-取代的1,3-(二氮杂)-2-(氧代)-吩噁嗪-1-基、7-取代的1-(氮杂)-2-(硫代)-3-(氮杂)-吩噁嗪-1-基、7-取代的1,3-(二氮杂)-2-(氧代)-吩噻嗪-1-基、7-取代的1-(氮杂)-2-(硫代)-3-(氮杂)-吩噻嗪-1-基、7-(氨基烷基羟基)-1,3-(二氮杂)-2-(氧代)-吩噁嗪-1-基、7-(氨基烷基羟基)-1-(氮杂)-2-(硫代)-3-(氮杂)-吩噁嗪-1-基、7-(氨基烷基羟基)-1,3-(二氮杂)-2-(氧代)-吩噻嗪-1-基、7-(氨基烷基羟基)-1-(氮杂)-2-(硫代)-3-(氮杂)-吩噻嗪-1-基、7-(胍正离子烷基羟基)-1,3-(二氮杂)-2-(氧代)-吩噁嗪-1-基、7-(胍正离子烷基羟基)-1-(氮杂)-2-(硫代)-3-(氮杂)-吩噁嗪-1-基、7-(胍正离子烷基-羟基)-1,3-(二氮杂)-2-(氧代)-吩噻嗪-1-基、7-(胍正离子烷基羟基)-1-(氮杂)-2-(硫代)-3-(氮杂)-吩噻嗪-1-基、1,3,5-(三氮杂)-2,6-(二氧杂)-萘、肌苷、黄嘌呤、次黄嘌呤、nubularine、杀结核菌素、异鸟苷、肌苷基(inosinyl)、2-氮杂-肌苷基、7-脱氮-肌苷基、硝基咪唑基、硝基吡唑基、硝基苯并咪唑基、硝基吲唑基、氨基吲哚基、吡咯并嘧啶基、3-(甲基)异喹诺酮基(3-(methyl)isocarbostyrilyl)、5-(甲基)异喹诺酮基、3-(甲基)-7-(丙炔基)异喹诺酮基、7-(氮杂)吲哚基、6-(甲基)-7-(氮杂)吲哚基、咪唑并吡啶基(imidizopyridinyl)、9-(甲基)-咪唑并吡啶基、吡咯并吡嗪基(pyrrolopyrizinyl)、异喹诺酮基、7-(丙炔基)异喹诺酮基、丙炔基-7-(氮杂)吲哚基、2,4,5-(三甲基)苯基、4-(甲基)吲哚基、4,6-(二甲基)吲哚基、苯基、萘基、蒽基、菲蒽基(phenanthracenyl)、芘基、芪基、并四苯基(tetracenyl)、并五苯基(pentacenyl)、二氟甲苯基、4-(氟)-6-(甲基)苯并咪唑、4-(甲基)苯并咪唑、6-(偶氮)胸腺嘧啶、2-吡啶酮、5-硝基吲哚、3硝基吡咯、6-(氮杂)嘧啶、2-(氨基)嘌呤、2,6-(二氨基)嘌呤、5-取代的嘧啶、N²取代的嘌呤、N⁶-取代的嘌呤、O⁶-取代的嘌呤、经取代的1,2,4-三唑及其任何O-烷基化或N-烷基化衍生物。

示例性糖修饰包括但不限于2'-氟、3'-氟、2'-OMe、3'-OMe、2'-脱氧修饰和无环核苷酸，例如肽核酸(PNA)、解锁核酸(UNA)或乙二醇核酸(GNA)。

在一些实施方式中，核酸修饰可包括糖间连接的替换或修饰。示例性的糖间连接修饰包括但不限于磷酸三酯、甲基膦酸酯、氨基磷酸酯、硫代磷酸酯、亚甲基甲基亚氨基、硫代二酯、硫氨酯(thionocarbamate)、硅氧烷、N,N'-二甲基肼(-CH₂-N(CH₃)-N(CH₃)-)、酰胺-3(3'-CH₂-C(＝O)-N(H)-5')和酰胺-4(3'-CH₂-N(H)-C(＝O)-5')、羟基氨基、硅氧烷(二烷基硅氧烷)、甲酰胺、碳酸酯、羧甲基、氨基甲酸酯、羧酸酯、硫醚、环氧乙烷接头、硫化物、磺酸酯、磺胺、磺酸酯、硫代甲缩醛(3'-S-CH₂-O-5')、甲缩醛(3'-O-CH₂-O-5')、肟、亚甲基亚氨基、亚甲基羰基氨基、亚甲基甲基亚氨基(MMI，3'-CH₂-N(CH₃)-O-5')、亚甲基肼撑(methylenehydrazo)、亚甲基二甲基肼撑、亚甲氧基甲基亚氨基、醚(C3'-O-C5')、硫醚(C3'-S-C5')、硫代乙酰氨基(C3'-N(H)-C(＝O)-CH₂-S-C5'、C3'-O-P(O)-O-SS-C5'、C3'-CH₂-NH-NH-C5'、3'-NHP(O)(OCH₃)-O-5'和3'-NHP(O)(OCH₃)-O-5')。

在一些实施方式中，核酸修饰可包括肽核酸(PNA)、桥接核酸(BNA)、morpholinos、锁核酸(LNA)、乙二醇核酸(GNA)、苏糖核酸(TNA)或本领域中描述的任何其它异种核酸(XNA)。

在本文所述的各个方面的一些实施方式中，核酸可在3'端和/或5'端被独立修饰。例如，可将标记、荧光团、标签或帽添加到本文所述核酸的3'端和/或5'端。

在本文所述的各个方面的一些实施方式中，本文所述的核酸链可例如在内部位置、在3'端和/或5'端用接头或间隔区进行修饰。不希望受理论束缚，接头或间隔区可用于将核酸链与部分(moiety)(例如固体支持物或标记)连接。在一些实施方式中，接头或间隔区可选自于由如下所组成的组：光可切割接头、可水解接头、氧化还原可切割接头、基于磷酸酯的可切割接头、酸可切割接头、基于酯的可切割接头、基于肽的可切割接头和它们的任意组合。在一些实施方式中，可切割接头可包含二硫键、四嗪-反式-环辛烯基团、巯基基团、硝基苄基基团、硝基吲哚啉基团、溴代羟基香豆素基团、溴代羟基喹啉基团、羟基苯甲酰甲基基团、安息香二甲醚基团，或它们的任意组合。

可使用任何本领域公认的光可切割接头。在一些实施方式中，可切割接头可包括光可切割接头。通常，光可切割接头包含光不稳定官能团，该官能团在暴露于光源(例如，UV光)或特定波长时可切割。例如，光可切割间隔区的非限制性示例可见于美国专利No.6,589,736 B1；7,622,279 B2；9,371,348 B2；7,547,530 B2；和7,057,031 B2；以及PCT公开号WO2014200767，以引用的方式将它们全部的内容以其整体并入本文。

在本文所述的各个方面的一些实施方式中，条形码组合物包含可检测的标记。例如，可用可检测的标记(例如在内部位置、在3'端和/或5'端)对本文描述的核酸链进行修饰。不希望受理论束缚，此类可检测的标记可促进检测。如本文所使用的，术语“可检测的标记”是指能够产生指示靶标存在的可检测信号的组合物。可检测的标记包括可通过光谱学、光化学、生物化学、免疫化学、电学、光学或化学方式检测的任何组合物。合适的标记包括荧光分子、放射性同位素、核苷酸生色团、酶、底物、化学发光部分、生物发光部分等。因此，标记为可通过光谱学、光化学、生物化学、免疫化学、电学、光学或化学方式检测的任何组合物。

本领域已知多种荧光报告染料。通常，荧光团为芳香族或杂芳族化合物，并且可为芘、蒽、萘、吖啶、芪、吲哚、苯并吲哚、噁唑、噻唑、苯并噻唑、花青素、羰花青(carbocyanine)、水杨酸盐/酯、邻氨基苯甲酸盐/酯(anthranilate)、香豆素、荧光素、罗丹明或其它类似化合物。

示例性的荧光团包括但不限于1,5 IAEDANS；1,8-ANS；4-甲基伞形酮；5-羧基-2,7-二氯荧光素；5-羧基荧光素(5-FAM)；5-羧基萘基荧光素(pH 10)；5-羧基四甲基罗丹明(5-TAMRA)；5-FAM(5-羧基荧光素)；5-羟色胺(HAT)；5-ROX(羧基-X-罗丹明)；5-TAMRA(5-羧基四甲基罗丹明)；6-羧基罗丹明6G；6-CR 6G；6-JOE；7-氨基-4-甲基香豆素；7-氨基放线菌素D(7-AAD)；7-羟基-4-甲基香豆素；9-氨基-6-氯-2-甲氧基吖啶；ABQ；酸性品红；ACMA(9-氨基-6-氯-2-甲氧基吖啶)；吖啶橙；吖啶红；吖啶黄；吖啶黄素(Acriflavin)；AcriflavinFeulgen SITSA；水母发光蛋白(发光蛋白)；Alexa Fluor 350^TM；Alexa Fluor 430^TM；AlexaFluor 488^TM；Alexa Fluor 532^TM；Alexa Fluor 546^TM；Alexa Fluor 568^TM；Alexa Fluor594^TM；Alexa Fluor 633^TM；Alexa Fluor 647^TM；Alexa Fluor 660^TM；Alexa Fluor 680^TM；茜素氨羧络合剂(Alizarin Complexon)；茜素红；别藻蓝蛋白(APC)；AMC、AMCA-S；AMCA(氨基甲基香豆素)；AMCA-X；氨基放线菌素D；氨基香豆素；苯胺蓝；蒽基硬脂酸酯；APC-Cy7；APTS；Astrazon Brilliant Red 4G；Astrazon Orange R；Astrazon Red 6B；Astrazon Yellow 7GLL；阿的平；ATTO-TAG^TMCBQCA；ATTO-TAG^TMFQ；金胺；Aurophosphine G；Aurophosphine；BAO9(双氨基苯基噁二唑)；BCECF(高pH)；BCECF(低pH)；硫酸小檗碱；β内酰胺酶；BFP蓝移型GFP(Y66H)；BG-647；Bimane；双苯甲酰胺；Blancophor FFG；Blancophor SV；BOBO^TM-1；BOBO^TM-3；Bodipy 492/515；Bodipy 493/503；Bodipy 500/510；Bodipy 505/515；Bodipy 530/550；Bodipy 542/563；Bodipy 558/568；Bodipy 564/570；Bodipy 576/589；Bodipy 581/591；Bodipy 630/650-X；Bodipy 650/665-X；Bodipy 665/676；Bodipy Fl；Bodipy FL ATP；Bodipy Fl-神经酰胺；Bodipy R6G SE；Bodipy TMR；Bodipy TMR-X缀合物；Bodipy TMR-X，SE；Bodipy TR；Bodipy TR ATP；Bodipy TR-X SE；BO-PRO^TM-1；BO-PRO^TM-3；BrilliantSulphoflavin FF；钙黄绿素；钙黄绿素蓝；钙红^TM；钙绿；钙绿-1Ca²⁺染料；钙绿-2Ca²⁺；钙绿-5N Ca²⁺；钙绿-C18 Ca²⁺；钙橙；钙荧光白；羧基-X-罗丹明(5-ROX)；级联蓝^TM；级联黄；儿茶酚胺；CFDA；CFP-青色荧光蛋白；叶绿素；色霉素A；色霉素A；CMFDA；腔肠素；腔肠素cp；腔肠素f；腔肠素fcp；腔肠素h；腔肠素hcp；腔肠素ip；腔肠素O；香豆素鬼笔环肽；CPM甲基香豆素；CTC；Cy2^TM；Cy3.1 8；Cy3.5^TM；Cy3^TM；Cy5.1 8；Cy5.5^TM；Cy5^TM；Cy7^TM；青色GFP；环AMP荧光传感器(cyclic AMP Fluorosensor，FiCRhR)；d2；Dabcyl；丹磺酰；丹磺酰胺；丹磺酰尸胺；丹磺酰氯；丹磺酰DHPE；丹磺酰氟(Dansyl fluoride)；DAPI；Dapoxyl；Dapoxyl 2；Dapoxyl 3；DCFDA；DCFH(二氯二氢荧光素二乙酸酯)；DDAO；DHR(二氢罗丹明123)；二-4-ANEPPS；二-8-ANEPPS(非比例)；DiA(4-二-16-ASP)；DIDS；二氢罗丹明123(DHR)；DiO(DiOC18(3))；DiR；DiR(DiIC18(7))；多巴胺；DsRed；DTAF；DY-630-NHS；DY-635-NHS；EBFP；ECFP；EGFP；ELF 97；曙红；赤藓红；赤藓红ITC；溴乙啡锭二聚体-1(EthD-1)；Euchrysin；氯化铕(III)；铕；EYFP；固蓝；FDA；Feulgen(副蔷薇苯胺)；FITC；FL-645；Flazo橙；Fluo-3；Fluo-4；荧光素二乙酸酯；Fluoro-Emerald；荧光金(羟芪巴脒)；Fluor-Ruby；FluorX；FM 1-43^TM；FM 4-46；FuraRed^TM(高pH)；Fura-2，高钙；Fura-2，低钙；Genacryl Brilliant Red B；GenacrylBrilliant Yellow 10GF；Genacryl粉红3G；Genacryl黄5GF；GFP(S65T)；红移型GFP(rsGFP)；野生型GFP，非UV激发(wtGFP)；野生型GFP，UV激发(wtGFP)；GFPuv；GloxalicAcid；粒蓝(Granular Blue)；血卟啉；Hoechst 33258；Hoechst 33342；Hoechst 34580；HPTS；羟基香豆素；羟芪巴脒(荧光金)；羟色胺；吲哚二碳菁(DiD)；吲哚三碳菁(DiR)；Intrawhite Cf；JC-1；JO-JO-1；JO-PRO-1；LaserPro；Laurodan；LDS 751；Leucophor PAF；Leucophor SF；Leucophor WS；丽丝胺罗丹明；丽丝胺罗丹明B；LOLO-1；LO-PRO-1；荧光黄(Lucifer Yellow)；Mag绿；马格达拉红(Magdala Red)(根皮红B)；镁绿；镁橙；孔雀石绿；Marina Blue；Maxilon Brilliant Flavin 10GFF；Maxilon Brilliant Flavin 8 GFF；Merocyanin；甲氧基香豆素；Mitotracker绿FM；Mitotracker橙；Mitotracker红；Mitramycin；单溴二胺；单溴二胺(mBBr-GSH)；单氯二胺；MPS(甲基绿焦宁二苯乙烯)；NBD；NBD胺；尼罗红；硝基苯并噁二唑；去甲肾上腺素；核固红；核黄；Nylosan Brilliant IavinE8G；俄勒冈绿^TM；俄勒冈绿488-X；俄勒冈绿^TM488；俄勒冈绿^TM500；俄勒冈绿^TM514；太平洋蓝；副蔷薇苯胺(Feulgen)；PE-Cy5；PE-Cy7；PerCP；PerCP-Cy5.5；PE-TexasRed(红613)；根皮红B(马格达拉红)；Phorwite AR；Phorwite BKL；Phorwite Rev；Phorwite RPA；磷化氢3R；光刻胶(PhotoResist)；藻红蛋白B[PE]；藻红蛋白R[PE]；PKH26；PKH67；PMIA；Pontochrome蓝黑；POPO-1；POPO-3；PO-PRO-1；PO-PRO-3；樱草灵(Primuline)；Procion黄；碘化丙啶(PI)；PyMPO；苯并芘；焦宁；焦宁B；Pyrozal Brilliant Flavin 7GF；QSY 7；芥子喹吖因；试卤灵；RH 414；Rhod-2；罗丹明；罗丹明110；罗丹明123；罗丹明5GLD；罗丹明6G；罗丹明B 540；罗丹明B 200；碱性玫瑰精；罗丹明BB；罗丹明BG；罗丹明绿；罗丹明Phallicidine；罗丹明鬼笔环肽；罗丹明红；罗丹明WT；玫瑰红；R-藻红蛋白(PE)；红移型GFP(rsGFP，S65T)；S65A；S65C；S65L；S65T；蓝宝石型GFP；血清素；Sevron Brilliant Red 2B；Sevron Brilliant Red 4G；Sevron Brilliant Red B；Sevron橙；Sevron黄L；sgBFP^TM；sgBFP^TM(超发光BFP)；sgGFP^TM；sgGFP^TM(超发光GFP)；SITS；SITS(樱草灵)；SITS(二苯乙烯异硫代磺酸)；SPQ(6-甲氧基-N-(3-磺丙基)-喹啉鎓)；芪；磺基罗丹明B can C；磺基罗丹明G Extra；四环素；四甲基罗丹明；Texas Red^TM；Texas Red-X^TM缀合物；噻二碳菁(Thiadicarbocyanine，DiSC3)；噻嗪红R；噻唑橙；硫代黄素5；硫代黄素S；硫代黄素TCN；Thiolyte；Thiozole橙；Tinopol CBS(钙荧光白)；TMR；TO-PRO-1；TO-PRO-3；TO-PRO-5；TOTO-1；TOTO-3；TriColor(PE-Cy5)；TRITC(四甲基罗丹明异硫氰酸酯)；True Blue；TruRed；Ultralite；荧光素钠B(Uranine B)；UvitexSFC；wt GFP；WW 781；XL 665；X-罗丹明；XRITC；二甲苯橙；Y66F；Y66H；Y66W；黄色GFP；YFP；YO-PRO-1；YO-PRO-3；YOYO-1；以及YOYO-3。可获得并可使用这些荧光化合物的许多合适形式。

其它示例性的可检测标记包括发光标志物和生物发光标志物(例如，生物素、荧光素酶(例如，细菌、萤火虫、叩甲等)、荧光素和水母发光蛋白)、放射性标记(例如，3H、125I、35S、14C或32P)、酶(例如，半乳糖苷酶、glucorinidase、磷酸酶(例如，碱性磷酸酶)、过氧化物酶(例如辣根过氧化物酶)和胆碱酯酶)以及比色标记，例如胶体金或有色玻璃或塑料(例如，聚苯乙烯、聚丙烯和胶乳)珠。教导使用此类标记的专利包括U.S.Pat.Nos.3,817,837、3,850,752、3,939,350、3,996,345、4,277,437、4,275,149和4,366,241，以引用的方式将它们各自以其整体并入本文。

在一些实施方式中，可检测标记选自于由如下所组成的组：荧光分子、纳米颗粒、稳定同位素、放射性同位素、核苷酸生色团、酶、酶底物、化学发光部分和生物发光部分、回波发生(echogenic)物质、非金属同位素、光学报告子、顺磁性金属离子和铁磁性金属；任选地，可检测标记为荧光团。

检测此类标记的方式为本领域技术人员所熟知。因此，例如，可使用照相胶片或闪烁计数器检测放射性标记，可使用检测发射光的光检测器检测荧光标记。通常通过向酶提供酶底物并检测由酶对酶底物的作用产生的反应产物来检测酶标记，并且可通过使有色标记可视化来检测比色标记。

在一些实施方式中，可检测标记为荧光团或量子点。不希望受理论束缚，使用荧光试剂可降低成像/读出中的信噪比，从而保持灵敏度。

在一些实施方式中，标签可被配置为包括“智能标签”，所述标签在与本文提供的条形码组合物缀合时是不可检测的。

也可对本文所述的核酸链进行Acrydite修饰。Acrydite修饰可使核酸链能够用于与诸如硫醇的亲核试剂进行的反应(例如，微阵列)中或掺入凝胶(例如，聚丙烯酰胺)中。因此，在一些实施方式中，核酸链可包含一种或多种acrydite核苷。acrydite核苷可位于核酸链的3'端、5端和/或内部位置。

在本文所述的各个方面的一些实施方式中，条形码组合物进一步包含纳米颗粒。例如，本文所述的核酸链可在例如内部位置、3'端和/或5'端缀合有纳米颗粒。在一些实施方式中，纳米颗粒为上转换(up-converting)纳米颗粒。仅作为示例，上转换纳米颗粒可用于在不同波长下进行交联。

在一些实施方式中，本文描述的核酸链可在3'端包含修饰以抑制通过聚合酶进行的延伸。例如，核酸链可包含“尾部”(例如一系列T碱基)以防止延伸。

还可对本文提供的核酸链进行任何修饰，所述修饰允许进行纯化、提取、表达的定量、结合、电泳等。

在本文公开的各个方面的一些实施方式中，条形码组合物进一步包含引物。如本文所使用的，术语“引物”用于描述与核酸链配对并提供聚合酶开始合成核酸链的游离3'-OH的DNA(或RNA)序列。优选地，引物由寡核苷酸组成。引物的确切长度将取决于许多因素，包括温度和引物来源。例如，根据靶序列的复杂性，寡核苷酸引物通常包含15-25个或更多个核苷酸，尽管它可能包含更少的核苷酸。短的引物分子通常需要较低的温度来与模板形成足够稳定的杂交复合物。

在任何方面的一些实施方式中，条形码组合物进一步包含三磷酸核苷酸或三磷酸脱氧核苷酸。

在本文公开的各个方面的一些实施方式中，条形码组合物进一步包含DNA或RNA聚合酶。“聚合酶”是指进行多核苷酸(例如DNA和/或RNA)的模板指导的合成的酶。该术语涵盖全长多肽和具有聚合酶活性的结构域两者。DNA聚合酶是本领域技术人员熟知的，包括但不限于由激烈火球菌(Pyrococcus furiosus)、Thermococcus litoralis和海栖热袍菌(Thermotoga maritime)中分离或衍生的DNA聚合酶，或其经修饰形式。可商购的聚合酶的额外的实例包括但不限于：Klenow片段(New England

Inc.)、Taq DNA聚合酶(QIAGEN)、9°N^TMDNA聚合酶(New England

Inc.)、Deep Vent^TMDNA聚合酶(NewEngland

Inc.)、Manta DNA聚合酶

Bst DNA聚合酶(NewEngland

Inc.)和phi29 DNA聚合酶(New England

Inc.)。聚合酶包括DNA依赖性聚合酶和RNA依赖性聚合酶(例如逆转录酶)两者。已知DNA依赖性DNA聚合酶的至少5个家族，尽管大多数属于A、B和C家族。各个家族之间几乎没有或没有序列相似性。大多数A家族聚合酶为单链蛋白，所述蛋白可包含多种酶促功能，包括聚合酶、3'至5'外切核酸酶活性和5'至3'外切核酸酶活性。B家族聚合酶通常具有单个催化结构域以及辅助因子，所述催化结构域具有聚合酶和3'至5'外切核酸酶活性。C家族聚合酶通常为具有聚合以及3'至5'外切核酸酶活性的多亚基蛋白。在大肠杆菌(E.coli)中，已发现三种类型的DNA聚合酶，即DNA聚合酶I(A家族)、II(B家族)和III(C家族)。在真核细胞中，三种不同的B家族聚合酶(DNA聚合酶α、δ和ε)牵涉于核复制，而A家族聚合酶(聚合酶γ)用于线粒体DNA复制。其它类型的DNA聚合酶包括噬菌体聚合酶。类似地，RNA聚合酶通常包括真核RNA聚合酶I、II和III，以及细菌RNA聚合酶以及噬菌体和病毒聚合酶。RNA聚合酶可为DNA依赖性和RNA依赖性的。

注意到的是，从核酸模板合成核酸序列的试剂(例如链置换DNA或RNA聚合酶)和方法是本领域熟知的，并且适用于本发明。例如，参见US20050277146A1、US20100035303A1和WO2006030455A1，以引用的方式将它们全部的内容以其整体并入本文。

在一些实施方式中，聚合酶为链置换聚合酶。

在各个方面的一些实施方式中，条形码组合物进一步包含用于核酸合成的缓冲液或盐。在考虑之列的是，对条形码组合物中使用的缓冲液进行选择，使得条形码组合物的核酸稳定。选择此类缓冲液的方法在本领域中是已知的，并且还可根据它们在各种条件(包括所进行反应的pH或温度)下的特性进行选择。

在一些实施方式中，两个不同的结构域可包含相同的核苷酸序列。在一些实施方式中，核酸链可包含限制性位点。例如，可以在结合的条形码链之间的结合区域中使用限制位点，并且发夹可连接到经切割的末端以形成完整记录链。或者，跨连接体桥接的链可结合至组装体，然后连接在一起。

条形码组合物还可包括额外的组分和元件。例如，条形码组合物可包含用于光交联和/或切割、解交联、去除或逆转交联的光源。在一些实施方式中，光源为UV光源。

在本文所述的各个方面的一些实施方式中，条形码组合物进一步包括靶标元件。如本文所使用的，“靶标元件”是指可通过本文提供的方法检测的任何分子、化合物、核酸、多肽、脂质、抗体或病毒。

在一些实施方式中，靶标元件被固定在底物表面上。在一些实施方式中，以预定图案固定靶标元件。在一些实施方式中，靶标元件为mRNA。在一些实施方式中，靶标元件为核酸、脂质、糖、小分子、微生物体或其片段、多肽和/或生物材料。生物材料可选自组织、组织切片、经工程化的组织、细胞、源自患者的细胞、原代细胞、类器官、细胞外基质、3D生物器官、解离细胞、活细胞、固定的细胞等。细胞可为原核细胞或真核细胞。

通常，第一核酸的靶向结构域与靶核酸实质上互补。不受限制地，靶核酸可为任意核酸。例如，靶核酸可为天然存在的核酸或合成的核酸。它可以只是较大核酸分子的一部分。

此外，靶核酸可为游离的或其可与靶标结合剂缀合，或者靶核酸可与靶分子缀合。此外，靶核酸可由靶细胞表达。或者或另外，靶核酸可例如通过化学交联、遗传编码、病毒转导、转染、缀合、细胞融合、细胞摄取、杂交、DNA结合蛋白或衔接分子(例如靶标结合配体)而直接或间接呈现在靶标分子或细胞上。

在本文公开的各个方面的一些实施方式中，靶核酸与靶标结合剂缀合。如本文所使用的，“靶标结合剂”意指可结合至靶标元件的部分。示例性靶标结合剂包括但不限于氨基酸、肽、蛋白、单糖、二糖、三糖、寡糖、多糖、脂多糖、凝集素(lectin)、核苷、核苷酸、核酸、维生素、类固醇、激素、辅因子、受体和受体配体。在一些实施方式中，靶标结合剂为抗体或其抗原结合片段。

在一些实施方式中，本文提供的条形码组合物的核酸和/或靶核酸共价或非共价地缀合至底物，例如底物的表面。注意的是，本文提供的条形码组合物的核酸和/或靶核酸可应用于任何底物表面，而不需要专门的表面处理，例如形成微阵列芯片中常见的微孔。表面只需要用核酸链进行功能化，所述核酸链将作为新生链条形码多联体的初始对接链。或者，核酸可与底物形成非共价相互作用。

如本文所使用的，术语“底物”或“底物表面”可互换使用以描述如下的结构，在该结构上本文提供的一种或多种核酸条形码或核酸条形码的多联体可进行展示或接触以用于与额外的核酸和/或标签接触。本文提供的核酸条形码可缀合至底物表面。

如本文所使用的，术语“缀合至”涵盖核酸与底物表面、相变剂或亲和对的成员通过共价键合的缔合，包括但不限于通过交联剂交联，或通过在缀合物待被使用的条件下保持的强非共价相互作用。

如本文所使用的，术语“杂交”是指单链核酸或其区域与另一单链核酸或其区域(分子间杂交)或与同一核酸的另一单链区域(分子内杂交)形成氢键合的碱基对相互作用的现象。杂交受所涉及的碱基序列控制，互补的核碱基形成氢键，并且任何杂交体的稳定性由碱基对的身份(例如，G:C碱基对强于A:T碱基对)以及连续碱基对的数量决定，互补碱基的更长的伸长段形成更稳定的杂交体。例如，对接链与包含光反应性核碱基(例如CNVK碱基)的核酸条形码之间的杂交使得能够对存储在底物表面上的数据进行光指导的读取和/或可视化。

本文提供的底物表面能以如下形式存在：生物材料(例如细胞、组织或其片段)、平台、柱、过滤器或片、盘、微流体捕获装置、毛细管、电化学响应平台、支架、筒(cartridge)、树脂、基质、珠、相变剂或本领域已知的其它底物表面。可使用多种表面类型。底物表面的非限制性实例包括玻璃、透明聚合物、聚苯乙烯、水凝胶、金属、陶瓷、纸、琼脂糖、明胶、藻酸盐/酯、葡聚糖、氧化铁、不锈钢、金纳米珠或颗粒、氯化银、铜、聚碳酸酯、聚二甲基硅氧烷、聚乙烯、丙烯腈丁二烯苯乙烯、环烯烃聚合物或环烯烃共聚物、链霉亲和素、Sepharose^TM树脂、生物材料(例如细胞、组织、细胞膜、细胞外基质蛋白等)及它们的组合。

在一些实施方式中，底物可为玻璃或聚合物表面。在一些实施方式中，底物为可压缩的水凝胶。

在一些实施方式中，生物材料选自于由组织、细胞、类器官、经工程化组织、以及细胞外基质所组成的组。

在一些实施方式中，本文提供的靶核酸和/或条形码组合物可应用于或嵌入可压缩水凝胶。在一些实施方式中，本文提供的靶核酸和/或条形码组合物代表特殊信息(例如数字数据)，并且可存储任何信息，包括但不限于文本、图像、图形、电影、测序数据和/或健康记录。在一些实施方式中，核酸条形码或核酸条形码的多联体代表空间信息。

用核酸链对这些底物进行表面功能化的方法在本领域中是已知的，并且需要很少的材料要求和最少的制备时间。典型的制备首先涉及用牛血清白蛋白-生物素(BSA-生物素)钝化表面。BSA与玻璃表面非特异性结合。其次，链霉抗生物素蛋白将结合至BSA蛋白上的生物素附着物。最后，可引入生物素标记的核酸以结合至链霉亲和素蛋白上其它可用的结合位点，从而完成玻璃表面的功能化。

在一些实施方式中，条形码组合物用acrydite进行修饰。经Acrydite修饰的核酸链可与底物或水凝胶材料混合，并与底物或水凝胶材料一起聚合。

在一些实施方式中，基质为水凝胶。水凝胶可为天然存在的、源自天然来源或源自合成来源。水凝胶可为通过一种或多种单体的反应产生的任何水溶胀和交联的聚合物材料。水凝胶可为聚合材料，所述聚合材料能够溶胀以在其结构中保留显著部分的水而不溶解至水性溶液中。水凝胶也可为任何可收缩材料，例如热收缩塑料、粘弹性泡沫、记忆泡沫。

水凝胶可源自天然单体分子(例如，糖胺聚糖)、亲水材料(例如，甲基丙烯酸酯、电解质复合物、乙酸乙烯酯、丙烯酰胺)或天然聚合材料(例如，肽、糖)。其它合适的水凝胶组合物描述于2001年8月7日授予的U.S.Patent No.6,271,278中，其标题为“Hydrogelcomposites and superporous hydrogel composites having fast swelling,highmechanical strength,and superabsorbent properties”。水凝胶可由疏水和/或亲水材料组成，其中，疏水材料不被物理吸引至水而亲水材料被物理吸引至水。

在一些实施方式中，水凝胶可为基于均聚物的水凝胶，其中，水凝胶源自单一单体种类或分子。在一些实施方式中，水凝胶可为基于共聚物的水凝胶，其中，水凝胶源自两种以上的不同的单体种类或分子。在一些实施方式中，基于共聚物的水凝胶以随机、嵌段或交替构型排列，任选地沿着单体之一的主链排列。在一些实施方式中，水凝胶可为基于多聚物互穿聚合物的水凝胶，其中，水凝胶源自至少两种不同的、任选交联的聚合物亚单元。在一些实施方式中，基于多聚物互穿聚合物的水凝胶包含交联的一种聚合物亚单元和非交联的一种聚合物亚单元。

水凝胶可为非结晶的、半结晶的或结晶的。水凝胶可为或可不是共价交联的。可使用化学方法(例如化学交联)或物理方法(例如疏水相互作用)来合成水凝胶。水凝胶可为电荷中性、带净正电荷或带净负电荷。在一些实施方式中，水凝胶包含带正电荷的基团和带负电荷的基团。在一些实施方式中，水凝胶可为两性的或两性离子的。

在一些实施方式中，水凝胶可在用核酸编码之前预先浇注到凝胶、模具或其它包埋材料中。在一些实施方式中，水凝胶可在用核酸编码后浇注到凝胶、模具或其它包埋材料中。

可使用外部刺激(例如电场、磁场、压力、吸力和毛细作用)来促进核酸或其它分子种类的合成、操作和/或添加到水凝胶中。可对本文提供的水凝胶进行修饰，以用作生物传感器(例如，监测疾病、用受控药物释放机制治疗疾病、接触镜、皮肤或粘膜组织植入或微阵列疾病检测)。用于组织植入和细胞支架的水凝胶的修饰是本领域已知的。

在一些实施方式中，微流体可用于合成、操作核酸或其它分子种类，或将其添加到水凝胶中。

在一些实施方式中，水凝胶以压缩状态存在，其中，水凝胶被完全压缩或收缩，并且水凝胶的水含量降低。在一些实施方式中，水凝胶以膨胀状态存在，其中，水凝胶完全膨胀、扩大或溶胀，并且水凝胶的水含量增加。在一些实施方式中，水凝胶能以完全压缩和完全膨胀之间的中间状态存在。在一些实施方式中，水凝胶响应于外部环境条件的变化而被压缩或膨胀。在一些实施方式中，外部环境条件可包括物理条件和化学条件，其中，物理条件包括温度、电势、光、压力和声音，并且其中，化学条件包括pH、溶剂组成(例如，有机溶剂、水的量的变化)、离子强度和小分子溶质。

在一些实施方式中，可将生物材料(例如分子、无细胞反应、细胞、组织切片、类器官和生物体)固定在本文提供的底物上。可用空间条形码的已知配置对经条形码化表面和底物进行预图案化。经条形码化表面可用作对生物材料进行空间条形码化的网格。底物可充当生物样品中的各种靶标的对接位点，包括基因组靶标和核糖核酸靶标。经条形码化的底物上的对接位点可携带官能团(包括化学标签或蛋白标签)，所述官能团可用于结合至生物材料中的蛋白、代谢或其它靶标。任选地，经条形码化的底物上的核酸条形码可使用化学方法、酶学方法或光化学方法从表面切去，并通过扩散或电泳、力光谱学(forcespectroscopy)或磁场转移到生物材料上，同时保留整个条形码图案。

在任何方面的一些实施方式中，本文提供的核酸可缀合至固体支持物。不受限制地，固体支持物能以如下形式存在：平台、柱、过滤器或片、盘、微流体捕获装置、毛细管、电化学响应平台、支架、筒、树脂、基质、珠或其它本领域已知的固体支持物。

在一些实施方式中，固体支持物包括如下的材料，所述材料包括但不限于聚合物、金属、陶瓷、凝胶、纸或玻璃。作为非限制性实例，固体支持物的材料可进一步包括聚苯乙烯、琼脂糖、明胶、藻酸盐/酯、氧化铁、不锈钢、金纳米珠或颗粒、氯化银、铜、聚碳酸酯、聚二甲基硅氧烷、聚乙烯、丙烯腈丁二烯苯乙烯、环烯烃聚合物或环烯烃共聚物，或Sepharose^TM树脂。

在一些实施方式中，固体支持物可进一步包括磁响应元件，例如磁响应珠。在一些实施方式中，磁响应元件或珠处于以下形式：球体、立方体、矩形、圆柱体、圆锥体或本领域中描述的任何其它形状。

在一些实施方式中，磁响应元件包括磁石(magnetite)、氧化铁(III)、钐-钴、terfenol-D或本领域中描述的任何其它磁性元件。

在一些实施方式中，底物包含预定图案的靶标元件或核酸。

在一些实施方式中，底物不具有靶核酸的预定图案。例如，靶核酸(例如，生物标志物)的空间信息在与条形码组合物杂交之前可能是未知的。

方法

本文还提供了用于对靶标元件进行检测或条形码化的方法。

在一个方面，该方法包括：(a)使靶mRNA(第一核酸)与第二核酸杂交，并且其中，(i)所述mRNA包含第一杂交结构域，该第一杂交结构域包含polyA序列；并且(ii)第二核酸以5'至3'方向包含：(1)第二杂交结构域，其中，第二杂交结构域与第一杂交结构域实质上互补，并包含光反应元件；和(2)第一条形码结构域；以及(b)使mRNA与第二核酸光交联，从而形成探针-引物复合物；(c)由探针-引物复合物合成记录核酸；以及(d)检测记录核酸。

在另一个方面，该方法包括：(a)使靶核酸与第一核酸杂交，并使第二核酸与第一核酸杂交，其中，(i)第一核酸以5'至3'方向包含：(1)任选的唯一分子标识符(UMI)序列；(2)与靶标元件的核酸实质上互补的第一靶向结构域；以及(3)第一杂交结构域；并且(ii)第二核酸以5'至3'方向包含：(1)第二杂交结构域，其中，第二杂交结构域与第一杂交结构域实质上互补；以及(2)第一条形码结构域，并且其中，第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件；(b)将第一核酸与第二核酸光交联，从而形成探针-引物复合物；(c)任选地，使探针-引物复合物从靶核酸变性；(d)由探针-引物复合物合成记录核酸；以及(e)检测记录核酸。

在另一方面，该方法包括：(a)使靶mRNA(第一核酸)与第二核酸杂交，并且其中，(i)所述mRNA包含第一杂交结构域，所述第一杂交结构域包含polyA序列；并且(ii)第二核酸以5'至3'方向包含：(1)第二杂交结构域，其中，第二杂交结构域与mRNA的第一杂交结构域实质上互补，并且包含光反应元件；以及(2)第一条形码结构域；以及(b)使mRNA与第二核酸光交联，从而形成第一复合物；(c)使第三核酸杂交至第一复合物中的第二核酸，从而形成探针-引物复合物，其中，第三核酸包含与第二核酸的第一条形码结构域实质上互补的第二条形码结构域；(d)由探针-引物复合物合成记录核酸；以及(e)检测记录核酸。

在另一方面，该方法包括：(a)使靶核酸与第一核酸杂交，并将第二核酸杂交至第一核酸，其中，(i)第一核酸以5'至3'方向包含：(1)任选的唯一分子标识符(UMI)序列；(2)第一靶向结构域，其中，第一靶向结构域与靶核酸实质上互补；和(3)第一杂交结构域；并且(ii)第二核酸以5'至3'方向包含：(1)第二杂交结构域，其中，第二杂交结构域与第一核酸的第一杂交结构域实质上互补；以及(2)第一条形码结构域，并且其中，第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件；以及(b)将第一核酸与第二核酸光交联，从而形成第一复合物；(c)任选地，使第一复合物从靶核酸变性；(d)使第三核酸杂交至第一复合物中的第二核酸，从而形成探针-引物复合物，其中，第三核酸包含与第二核酸的第一条形码结构域实质上互补的第二条形码结构域；(e)由探针-引物复合物合成记录核酸；以及(f)检测记录核酸。

在另一方面，该方法包括：(a)将靶核酸与第一核酸杂交，其中，(i)第一核酸以5’至3’方向包含：(1)任选的唯一分子标识符(UMI)序列；(2)第一靶向结构域，其中，第一靶向结构域与靶核酸实质上互补；以及(3)第一杂交结构域；(b)通过使n个额外的核酸杂交并且使额外的核酸与第一复合物光交联来制备多联体，其中，n任选为从1至100的整数，并且其中，各额外的核酸以5’至3’方向包含：(i)第一杂交结构域；(ii)条形码结构域；以及(iii)第二杂交结构域，并且其中，第n个核酸的第一杂交结构域与第(n-1)个核酸的第二杂交结构域实质上互补，其中，n＝1核酸的第一杂交结构域与第一核酸的第一杂交结构域实质上互补，并且其中，各个核酸的第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件；(c)使第一帽核酸与多联体杂交，从而形成加帽多联体，其中，第一帽核酸包含：(i)第一帽杂交结构域，其中第一帽杂交结构域与第n个核酸的第二杂交结构域实质上互补；以及(ii)第二帽杂交结构域；(d)使第二帽核酸杂交至加帽多联体，从而形成多联体-引物复合物，其中，第二帽核酸以5'至3'方向包含：(i)引物序列结构域；(ii)任选的唯一分子标识符(UMI)序列；以及(iii)杂交结构域，其中，杂交结构域与第一帽核酸的第二帽杂交结构域实质上互补，并且其中，第一帽核酸的第二帽杂交结构域和第二帽核酸的杂交结构域中的至少一个包含光反应元件；以及(e)检测多联体-引物复合物，或由多联体-引物复合物合成记录核酸并检测记录核酸。

另一方面，该方法包括：(a)使多个靶标的各个成员中的靶核酸链与第一核酸链杂交，其中，多个靶标的各个成员中靶核酸链是不同的，其中，所述靶核酸链被包含在另一核酸分子中，或者所述靶核酸链与多个靶标中的成员缀合，或者所述靶核酸链由细胞表达，或者所述靶核酸链通过化学交联、遗传编码、病毒转导、转染、缀合、细胞融合、细胞摄取、杂交、DNA结合蛋白或靶标结合剂/配体而直接或间接呈现在靶标或细胞上，并且其中，(i)所述第一核酸链以5'至3'方向包含：(1)任选的唯一分子标识符(UMI)序列；(2)第一靶向结构域，其中，所述第一靶向结构域与靶核酸实质上互补；和(3)第一杂交结构域；(b)通过使一个或多个额外的核酸链以逐步方式杂交，并将所述额外的核酸链与第一复合物光交联来制备多联体，其中，所述光交联包括选择样品的预定区域，并在使各个额外的核酸链杂交后将预定区域暴露于光从而使互补杂交结构域交联，以及在暴露于光之后和在使下一额外的核酸链杂交之前去除任何未交联的额外核酸链，并且其中，每个额外的核酸链以5'至3'方向包含：(i)第一杂交结构域；(ii)条形码结构域；以及(iii)第二杂交结构域，并且其中，第n个额外核酸链的第一杂交结构域与第(n-1)个额外核酸链的第二杂交结构域实质上互补，其中，第一额外核酸链的第一杂交结构域与第一核酸链的第一杂交结构域实质上互补，并且其中，各条核酸链的第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件；以及(c)检测所述多联体和/或由所述多联体合成记录核酸并检测所述记录核酸。

在本文提供的方面的各种实施方式中，所述方法包括制备生物样品。样品制备可包括从受试者获得生物样品。样品制备还可包括通过本领域已知的方法培养细胞、组织和类器官。在一些实施方式中，对样品进行成像。在一些实施方式中，样品经历活细胞成像。在一些实施方式中，样品经固定并被透化以用于成像。制备样品的时间的量可由技术人员确定。

在本文提供的方面的各种实施方式中，所述方法包括对样品中的靶核酸进行成像和条形码化。本文提供的样品可经历原位逆转录、A加尾和任选的原位杂交(ISH)、免疫荧光(IF)或其它免疫组织化学方法。

在本文提供的方面的各种实施方式中，所述方法包括光交联两条以上的核酸链。可在任何需要的条件下进行光交联。在一些实施方式中，可在水性溶液中进行光交联。

用于光交联的光将取决于光反应元件。通常，光交联使用350-400nm波长的光。优选地，光交联使用具有约365nm波长的光源。

在一些实施方式中，所述方法进一步包括一个或多个洗涤步骤，例如，用以洗去任何剩余的试剂和/或核酸链。

在本文所述的各种方法的一些实施方式中，靶标元件(例如，靶核酸)可缀合有靶标结合配体。例如，靶核酸可缀合有用以结合至待条形码化和/或检测的实际靶标元件的靶标结合元件。

在本文所述的各种方法的一些实施方式中，靶核酸被包含在生物材料中。例如，靶核酸可由靶细胞表达，靶核酸可通过化学交联、遗传编码、病毒转导、转染、缀合、细胞融合、细胞摄取、杂交、DNA结合蛋白或衔接分子(例如靶标结合配体)直接或间接呈现在靶标或细胞上。

在本文所述的各种方法的一些实施方式中，靶标元件(例如，靶标核酸)被固定在底物表面上。靶标元件(例如靶核酸)可以按预定的图案固定在底物表面上。

在一些实施方式中，所述方法进一步包括选择用于光照或检测的感兴趣的一个或多个特定区域。选择可为手动的或计算机辅助的。通常，选择基于一种或多种表型标志物。用于选择用于光照或检测的感兴趣的一个或多个特定区域的示例性表型标志物包括但不限于荧光、形状或形态学。在一些实施方式中，表型标志物为荧光、形状、强度、组织学染色、抗体染色或形态学。

本文描述的各个方面的一些实施方式进一步包括软件，所述软件用于自动检测和处理感兴趣的一个或多个区域以用于空间光照或检测。

在本文提供的方面的各种实施方式中，所述方法包括记录链提取和测序。可通过RNase H置换和/或原位或体外hopPER合成来进行记录体提取。在一些实施方式中，可通过本领域已知的基于珠或柱的纯化方法来纯化链。然后可扩增这些链以通过PCR进行测序和/或检测。任选地，扩增子可与二级扩增步骤和/或用于文库制备的衔接子连接一起纯化。任选地，也可通过本领域已知的方法减少rRNA。

在任何方面的一些实施方式中，所述方法可应用于合成的cDNA文库的5'端。

在一些实施方式中，所述方法可利用光反应剂充当封闭结构域。在一些实施方式中，光反应剂为CNVK。

在任何方面的一些实施方式中，所述方法进一步包括例如在检测之前扩增记录链。如本文所使用的，术语“扩增”是指将核酸序列递交至足以允许多核苷酸扩增的条件的步骤，如果反应的所有组分都是完整的。扩增反应的组分包括例如引物、多核苷酸模板、聚合酶、核苷酸等。术语“扩增”通常是指靶核酸的“指数”增加。然而，如本文所使用的“扩增”还可指核酸的选定靶序列的数量的线性增加，例如通过循环测序获得的。扩增和合成核酸序列的方法是本领域已知的。例如，参见美国专利号7,906.282、8,367,328、5,518,900、7,378,262、5,476,774和6,638,722，以引用的方式将它们所有的内容以其整体并入本文。

在一些实施方式中，扩增记录链包括聚合酶链式反应(PCR)。PCR为本领域技术人员所熟知；例如，参见美国专利号4,683,195和4,683,202；以及PCR Protocols:A Guide toMethods and Applications，Innis等编，1990，以引用的方式将全部内容以其整体并入本文。示例性PCR反应条件通常包括两步或三步循环。两步循环具有变性步骤，随后为杂交/延伸步骤。三步循环包括变性步骤，随后为杂交步骤，随后为单独的延伸步骤。

在一些实施方式中，扩增步骤包括具有与扩增步骤正交的发夹的额外的多核苷酸序列或模板。不希望受理论束缚，此类额外的DNA发夹可减少或校正脱靶反应。例如，当使用三字母代码时，这些包含额外发夹的序列或模板可用于吸尽某些样品中可能存在的痕量的不期望的核苷酸。

在一些实施方式中，连接两条核酸链的光交联可在扩增和/或测序记录链之前被切割、解交联、去除或逆转。使用波长约315nm的光源，光交联可被切割、解交联、去除或逆转。

可使用核酸测序技术读取记录链。在一些实施方式中，可通过使用标记有可检测部分的互补序列来确定记录链的序列，所述可检测部分例如荧光团、量子点、肽标签、珠(例如，琼脂糖、胶乳、磁响应性、染色质)、聚合物点、纳米颗粒、额外的对接位点、标签(如生物素)或官能团，使得可通过例如荧光显微术、荧光扫描仪、光学扫描仪等来检测其存在。

在本文提供的任何方面的一些实施方式中，所述方法包括在感兴趣的预限定区域中对生物分子进行条形码化。例如，整个组织、组织区域、细胞集合、单细胞、亚细胞区域、微生物和表面。为了将每个区域标示以进行多模式整合分析，可使用如上所述的基于成像的方法和/或测序。

在本文提供的任何方面的一些实施方式中，该方法包括对生物分子进行条形码化以创建空间标签，该空间标签将测序读段关联回至空间位置，用以进行感兴趣的所选区域的多模式整合分析。

本文提供的方法可用于筛选各种疾病和紊乱的候选治疗库(例如，小分子药物、生物制品、治疗性核酸、基因或细胞疗法、siRNA、gRNA、质粒、噬菌体、病毒、肽、蛋白质、抗体、代谢物、激素、DNA编码文库)。在一些实施方式中，通过成像来鉴别表型结果。使用本文提供的方法，可通过曝光对选定区域进行条形码化，用以进行基于测序的分析。

本文提供的方法可用于鉴别各种疾病和紊乱的新疗法和诊断方法。可筛选小分子药物、生物制品、治疗性核酸、基因或细胞疗法、siRNA、gRNA、肽、蛋白质、抗体、代谢物、激素、DNA编码文库，以鉴别药物靶标和/或生物标志物。本文提供的方法的非限制性应用实例包括药物筛选、生物标志物鉴别、谱分析、表型至基因型细胞状态的表征、新疾病模型的生成、细胞和疾病模型的表征、分化状态和细胞状态的表征、组织映射、多维分析、高内涵筛选、基于机器学习的聚类或分类、细胞疗法的开发、CAR-T疗法的开发、抗体筛选、个性化医疗、和细胞富集。

装置

本文描述的方法可在装置上执行。例如，本文描述的方法可在包含光源和样品支持器的装置上执行。在一些实施方式中，本文描述的方法可在如下装置上执行，所述装置包含光源、光学掩模或数字微镜装置和样品支持器以及用于聚焦光的任选的一个或多个透镜。在一些实施方式中，本文描述的方法可在如下装置上执行，所述装置包含光源、光学掩模或数字微镜装置、样品支持器以及流体或微流体系统，其中，该装置被配置用于自动化。在一些实施方式中，本文描述的方法可在包含流体系统的装置上执行，该流体系统被配置为以预限定的步骤将条形码组合物递送到样品上。在一些实施方式中，本文描述的方法可在如下装置上执行，所述装置包含光源、光学掩模或数字微镜装置、照相机、流体或微流体系统以及一组软件工具，其中，该装置被配置用于自动鉴别细胞和/或分配条形码。

在一些实施方式中，本文描述的方法可在包含传感器的装置上执行，其中，该装置被配置为响应来自本文描述的方法的信号，并调整/调节条形码组合物的递送。在一些实施方式中，本文描述的方法可在包含传感器和流体装置的装置上执行，其中，该装置被配置为响应来自一个或多个获取的图像的外部输入和/或来自本文描述的方法的信号，并调整/调节条形码组合的递送。

注意到的是，可在装置中包含本文所述的条形码组合物。例如，装置可包含本文所述的条形码组合物，并且该装置包含以用于自动化的预限定步骤将条形码组合物递送到样品上的递送机构。在一些实施方式中，本文所述的装置包含样品支持器，所述样品支持器被配置用于自动化递送本文所述的条形码组合物。在一些实施方式中，本文所述的装置包含样品支持器，所述样品支持器被配置用于固定本文所述的条形码组合物。包含本文所述的条形码组合物的装置可被配置用于附着至和/或扩充现有装置和工作流程。

在一些实施方式中，装置可包含用于容纳本文所述的条形码组合物的一种或多种组分的贮存器。例如，所述装置可包含用于容纳包含光反应性元件的核酸链(例如经CNVK修饰的条形码化链)的贮存器。

在另一方面，本文提供了用于本文提供的方法的装置，其中，该装置包含光源和样品支持器。在一些实施方式中，该装置在样品支持器中包含本文提供的条形码组合物。

在一些实施方式中，该装置还包含光学掩模或数字微镜装置。在一些实施方式中，该装置进一步包含用于聚焦光的至少一个透镜。在任一方面的一些实施方式中，本文提供的光源为UV光源、照射灯、LED、通过透镜系统调制或不调制的双光子激光器或至少一个激光器、光掩模、数字微镜装置、针孔和/或结构化照明。

在一些实施方式中，该装置包含外壳。在一些实施方式中，该装置进一步包含流体或微流体系统。在一些实施方式中，该装置包含用于以预限定步骤将本文提供的组合物递送至样品支持器的流体或微流体系统。微流体系统是本领域中已知的，并且描述于例如美国申请号16/125,433；16/134,746；美国专利号9,694,361 B2；5,876,675 A；6,991,713B2；和WO2001/045843A2，以引用的方式将其整体并入本文。

在一些实施方式中，该装置进一步包含检测器。在一些实施方式中，该装置进一步包含照相机。

在一些实施方式中，该装置包含用于处理通过本文提供的方法检测到的条形码的组件。在一些实施方式中，该装置包含用于自动鉴别细胞和/或分配条形码的软件。

在一些实施方式中，该装置包含含有可交联链的贮存器。在一些实施方式中，该装置包含含有经CNVK修饰的条形码化链的贮存器。

在一些实施方式中，本文提供的装置具有使得能够递送本文提供的组合物的自动化特征。

在一些实施方式中，该装置包含设计用于固定本文提供的组合物的样品支持器。

在一些实施方式中，该装置包含传感器。在一些实施方式中，该装置包含响应于来自所获取图像的外部输入、本文提供的检测到的信号，并调节本文提供的组合物的递送的流体装置、传感器。

在一些实施方式中，该装置附接到显微镜和/或计算机系统。

定义：

为方便起见，在下文提供了在说明书、实施例和所附权利要求中使用的一些术语和短语的含义。除非另有说明或从上下文暗示，否则以下术语和短语包括以下提供的含义。除非另有明确说明或从上下文显而易见，否则以下术语和短语不排除该术语或短语在其所属领域中已获得的含义。提供这些定义是为了帮助描述本文提供的方面的特定实施方式，而不旨在限制要求保护的发明，因为本发明的范围仅由权利要求限制。此外，除非上下文另有要求，否则单数术语应包括复数形式，而复数术语应包括单数形式。

免疫学和分子生物学中常用术语的定义可见于The Merck Manual of Diagnosisand Therapy，第19版，由Merck Sharp&Dohme Corp.出版，2011(ISBN 978-0-911910-19-3)；Robert S.Porter等(编)，The Encyclopedia of Molecular Cell Biology andMolecular Medicine，由Blackwell Science Ltd.出版，1999-2012(ISBN9783527600908)；以及Robert A.Meyers(编)，Molecular Biology and Biotechnology:aComprehensive Desk Reference，由VCH Publishers,Inc.出版，1995(ISBN 1-56081-569-8)；Immunology by Werner Luttmann，由Elsevier出版，2006；Janeway's Immunobiology，Kenneth Murphy、Allan Mowat、Casey Weaver(编)，Taylor&Francis Limited，2014(ISBN0815345305，9780815345305)；Lewin's Genes XI，由Jones&Bartlett Publishers出版，2014(ISBN-1449659055)；Michael Richard Green和Joseph Sambrook，MolecularCloning:A Laboratory Manual，第4版，Cold Spring Harbor Laboratory Press，ColdSpring Harbor，N.Y.，USA(2012)(ISBN 1936113414)；Davis等，Basic Methods inMolecular Biology，Elsevier Science Publishing，Inc.，New York，USA(2012)(ISBN044460149X)；Laboratory Methods in Enzymology:DNA，Jon Lorsch(编)，Elsevier，2013(ISBN 0124199542)；Current Protocols in Molecular Biology(CPMB)，FrederickM.Ausubel(编)，John Wiley and Sons，2014(ISBN 047150338X,9780471503385)，CurrentProtocols in Protein Science(CPPS)，John E.Coligan(编)，John Wiley and Sons,Inc.，2005年；以及Current Protocols in Immunology(CPI)(John E.Coligan，ADA MKruisbeek，David H Margulies，Ethan M Shevach，Warren Strobe(编)John Wiley andSons,Inc.，2003(ISBN 0471142735，9780471142737)，以过引用方式将它们的内容以其整体全部并入本文。

如本文所使用的，“核酸”意指DNA、RNA、单链的、双链的或更高度聚集的杂交基序，以及它们的任何化学修饰。

术语“统计学上显著”或“显著”是指统计显著性，并且通常意指两个标准偏差(2SD)或更大的差异。

如本文所使用的，术语“包括”或“包含”用于指组合物、方法及其各自的组分，其对于方法或组合物是必要的，但无论必要与否，对包含未指定的要素而言是开放性的。

如本文所使用的，术语“基本上由……组成”是指给定实施方式所需的那些要素。该术语允许不实质影响本发明的该实施方式的基础和新颖性或功能特征的额外要素的存在。

除非上下文另有明确指示，单数术语“一个/一种(a/an)”和“该(the)”包括复数指示物。类似地，除非上下文另有明确指示，否则词语“或”旨在包括“和”。尽管与本文所提供的方法和材料类似或等同的方法和材料可用于本公开的实践或测试，但合适的方法和材料在下文描述。缩写“例如(e.g.)”源自拉丁语exempli gratia，并且在本文中用于指示非限制性示例。因此，缩写“例如(e.g.)”与术语“例如(for example)”同义。

此外，除非上下文另有要求，否则单数术语应包括复数形式，并且复数术语应包括单数形式。

除了在操作实例中或另有指示的情况下，本文使用的表示成分的量或反应条件的所有数字都应理解为在所有情况下都由术语“约”修饰。当与百分比相连使用时，术语“约”可意指±1％。

术语“实质上相同”意指两个以上的核苷酸序列具有至少65％、70％、80％、85％、90％、95％或97％相同的核苷酸。在一些实施方式中，“实质上相同”意指两个以上的核苷酸序列具有相同的核苷酸。

如本文所使用的，术语“互补的”通常是指在两组核酸之间杂交配对或结合相互作用的潜能。根据经典(cononical)的Watson-Crick碱基配对和非Watson-Crick碱基配对(例如Wobble碱基配对和Hoogsteen碱基配对)，互补核酸能够通过氢键配对彼此结合。在一些实施方式中，两组核酸可彼此100％互补。在其它实施方式中，两组核酸可包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个不互补的核苷酸。在其它实施方式中，两组核酸可至少50％、至少60％、至少70％、至少80％或至少90％互补。在一些实施方式中，只要两组核酸能够形成稳定的或瞬时的复合物，它们即是互补的。如本文所使用的，“互补”序列还可包括非Watson-Crick碱基对和/或由非天然和经修饰的核苷酸形成的碱基对，或完全由非Watson-Crick碱基对和/或由非天然和经修饰的核苷酸形成的碱基对形成，只要满足上述关于它们杂交能力的要求。此类非Watson-Crick碱基对包括但不限于G:U Wobble或Hoogsteen碱基配对。

如本文所使用的，术语“杂交结构域”通常是指第一核酸或第二核酸的一部分，其中，第二核酸的第二杂交结构域与第一核酸的第一杂交结构域实质上互补。在一些实施方式中，杂交结构域是如本文所定义的光反应链。在一些实施方式中，杂交结构域是如本文定义的互补链。在一些实施方式中，两个交替的杂交结构域是指单个交联链和单个互补链。

如本文所使用的，术语“探针结构域”或“靶向结构域”通常是指第一核酸的与靶标元件互补的部分。

如本文所使用的，“附着核酸链”是指使得本文提供的核酸能够与本文提供的底物或另一种核酸相关联、交联、嵌入其中、或栓系(tether)、共价或非共价相互作用的任何核酸。在一些实施方式中，附着核酸链包含条形码结构域和杂交结构域，其中，杂交结构域任选地包含光反应元件。在一些实施方式中，附着核酸链与第一核酸的至少一部分实质上互补。

如本文所使用的，“条形码结构域”是指包含表示空间、测序信息和/或编码数据的核酸序列的条形码链部分。可由条形码文库预先确定条形码结构域序列。条形码结构域可为包含DNA、RNA、合成核碱基或它们的任何组合的序列。可为条形码结构域分配位值(bitvalue)。例如，可为各个条形码结构域独立分配位值。注意到的是，位值不限于0和1。包含条形码结构域的核酸链在本文中也可称为条形码链。

如本文所使用的，术语“条形码文库”是具有相关信息的存储的核酸序列的集合。各个序列及相关的信息与诸如序列、模式、结构和标签的信息一起存储在数据库中。条形码文库可用于解码或读取各个条形码链中包含的特殊信息。条形码文库还可用于对多联体的数据存储、写入和读取的多联体模式进行预先确定。在一些实施方式中，第一核酸和/或第二核酸的条形码结构域选自最小汉明距离为4的条形码文库。

如本文所使用的，术语“核酸多联体”通常是指包含至少三个核酸条形码的核酸。核酸多联体可包含通过光反应性核苷酸彼此共价连接的核酸条形码。在一些实施方式中，核酸多联体可包含至少1个、至少2个、至少3个、至少4个、至少5个或至少10个核酸条形码。在一些实施方式中，核酸多联体可包含各自并入数据的至少1条、至少2条、至少3条、至少4条、至少5条或至少10条条形码链，例如，每条条形码链可唯一地/独立地分配空间或测序信息。

如本文所使用的，术语“空间信息”为可存储在条形码中的生物组织或基质中的任何信息、坐标、标志物。空间信息可告知本领域技术人员特定标志物、条形码或图案位于底物上的何处。例如，空间信息可用于用核酸条形码创建图像或QR码。空间信息也可用于检测特定的核酸靶标。

如本文所使用的，术语“试剂”是指合成的或生物来源的任何物质、化学成分、化学分子。

应当理解，本公开不限于本文提供的特定方法、方案和试剂等，因此可以变化。本文使用的术语仅用于描述特定实施方式的目的，而不旨在限制仅由权利要求限定的本公开的范围。本发明通过以下实施例进一步说明，这不应解释为进一步限制。

实施方式

实施例1：光指导的生物分子条形码概要

单细胞测序通过提供定量的细胞水平转录组学信息，揭示了对生物学的重要新理解。但处于亚细胞水平和位于组织内的细胞水平两者的多尺度空间信息在对细胞解离以进行细胞水平测序的过程中丢失。本文提供了用于光指导的条形码化随后测序的方法，该方法允许用原位附着至固定的序列的条形码序列跨长度尺度(亚细胞到大组织)对固定的生物分子进行可编程标记。串联的条形码和原位序列可用下一代测序平台读出，以提供组合的序列和空间信息。

为了解细胞如何发挥作用、分化和响应环境因素，能够分析单个细胞在其天然环境中的分子状态的高通量方法是必要的。下一代测序方法允许通过同时检测来自细胞群的数千个不同转录物来表征细胞多样性。更为近来，这些方法已进一步通过单细胞RNA-Seq(scRNA-Seq)方法(如Drop-Seq)而扩展用于对单个细胞进行转录组分析，所述方法依赖于将转录信息追踪回分离的细胞或细胞核。然后，测序读出可用于通过读段谱的聚类来定义细胞类型和状态。然而，这些方法需要特殊仪器(如细胞分选仪、微孔或定制微流体)，并且提供有限的通量(throughput)。更重要的是，获得的读段固有地缺乏使得能够将分子谱与组织中单个细胞的原始位置、以及这些细胞内感兴趣的分子的亚细胞定位联系起来的空间信息。

用显微术对样品进行直接成像(如在单分子FISH(smFISH)中)使得能够使序列信息与空间背景相协调。然而，FISH方法受制于低信号背景比和低多重化。为了提高信号水平用以可靠地检测具有高自发荧光和散射的组织样本中的RNA，数项研究使用如滚动环扩增(RCA)、杂交链式反应(HCR)、分支DNA测定(bDNA)、通过交换反应进行的信号扩增(SABER)或clampFISH的方法，将FISH与信号扩增整合以提高每个点的荧光，但将大量荧光寡核苷酸定位在同一靶标上。

由于同一样品的光谱重叠多重化分析也相当受限，仅允许低重(low-plex，一次3-4个靶标)研究。已通过荧光团或探针的迭代交换轮次、组合荧光条形码化或原位测序来克服多重化限制。虽然交换成像方法扩大规模耗时长，但依赖组合荧光标记或原位测序的方法需要靶标在空间上分离并可作为独特的斑点(puncta)解析，因此通常对低丰度转录物执行更可靠。这对每个细胞可获得的读段数量设置了上限，并导致检测灵敏度不良，尤其是当考虑到来自原位酶促反应的噪声和偏差、以及与读段深度、读段长度和碱基调用错误相关的原位测序中的限制时。即使有了最新的改进，这些方法的检测效率也<smFISH的50％。虽然将组合标记方法与超分辨率方法(如定位显微术和膨胀显微术)配对进一步提供超分辨率信息，但由于成像时间长且随体积变化，数据采集变得抑制性地缓慢。此外，由于光学元件对最终结果有强的影响，因此进行设置以设置光学元件(如相机、物镜、针孔、光源)的变化以及使用不同的荧光团进行成像测定改变如下方面：例如光收集、噪音、色差、光照场的平坦度、离焦荧光、光谱穿透(spectral bleed-through)、光漂白、淬灭。

将空间信息与单细胞测序技术相结合的新兴策略是利用通过每个空间位置打印或连接独特DNA序列(即DNA条形码)而经预条形码化的寡核苷酸捕获阵列或表面。然后这些DNA条形码与各个条形码空间位置附近的感兴趣分子相关联，并最终被测序以对每个捕获的靶标的空间信息进行抓取(retrieve)和映射。其它近期的进展允许基于与分子标志(如细胞器)的邻近、细胞膜的差异透化、或RNA的加工阶段来部分抓取转录物的亚细胞分布信息。也可以使用将附近序列物理连接在一起的方法，根据彼此的邻近对RNA转录物和基因组读段进行分组。

为了一起解决所有这些限制，开发了基于光的空间条形码化和高通量测序策略，该策略直接在各个靶分子上原位编码空间信息，而不需要预先图案化的捕获阵列，并且不破坏样品。本文提供了用于将条形码链选择性地交联至处于指定空间位置的靶分子的DNA光刻方法。

本文提供的方法以可扩展的方式将高通量和高度多重化的下一代测序的能力与FISH的检测灵敏度和采样效率相协调，同时为各个靶分子保留具有亚细胞分辨率的绝对空间信息。它补充了现有的单细胞测序方法，并使得能够以期望水平的分辨率探测样品，并有可能基于标志物进一步限定感兴趣的区域。这种额外的灵活性也可用于实现FACS样的原位分选，而无需细胞解离或对功能标志物或空间标志物附近的分子亚集进行基于邻近的标记。

方法：本文提供的光指导的生物分子条形码化方法的基本策略利用快速DNA交联化学和空间受限的光图案来以大规模并行化的方式进行空间寻址和打印DNA条形码。这种交联设计是序列特异的和可逆的，这允许实现独特的交联几何结构，所述几何结构可经工程化用于条形码抓取。

实施例2：条形码化的反应化学

策略1：双光指导的条形码化：

第一种策略利用两种波长的光将引物交联(～365nm)至感兴趣的转录物/探针，随后是交联逆转步骤(～312nm)，参见图1A-图1D。在靶向方法中，探针原位杂交，所述探针被设计为与基因组序列、转录组序列或其它感兴趣的序列互补(图1A)。二级杂交步骤结合引物，该引物在5'端的额外结构域之外在与探针互补的区域中包含CNVK修饰，所述5'端的额外结构域包括正向引物(For)、可选的唯一分子标识符(UMI)和条形码序列(紫色)。在UV光(约365nm)下光照后，引物变得与探针序列共价连接(交联)，并且聚合酶用于复制完整的记录链。这可以在探针-引物复合物从样品变性之后进行，或者可使用链置换聚合酶原位置换记录链。使用约312nm的UV光来逆转交联。记录链可被进行PCR扩增，然后进行最终测序以回收组合的条形码/UMI和探针序列/身份信息。

靶向方法也可用于结合固定在样品中或表面上的其它核酸，例如结合至感兴趣的蛋白靶标的DNA缀合抗体(图1B)。一般来说，任何可标记有或交联至感兴趣的链的实体都可使用此策略进行记录。

在非靶向方法中，引物结合至感兴趣的靶标中的保守或丰富序列。例如，在其3'端具有polyA序列的mRNA可通过包含一个或多个polyT序列的互补的含CNVK序列结构域而结合至含条形码的引物(图1C)。除了含CNVK的结构域之外，引物还包含引物结构域(For)、任选的唯一分子标识符(UMI)结构域、条形码结构域(条形码/Bar)。然后可使用逆转录酶来延伸引物，以在交联被逆转之前或之后复制mRNA序列。然后制备包含组合的条形码和mRNA序列信息的记录序列，用于使用标准方法进行测序，例如通过利用模板转换寡核苷酸(TSO)，所述模板转换寡核苷酸(TSO)在记录链的3'端附加引物以实现PCR扩增。记录体的测序用于回收组合的RNA转录物和条形码序列数据。可通过使用具有随机序列的引物和/或引物文库来检查RNA和DNA分子的其它类型和/或部分。

策略2：具有桥序列的光指导的条形码化：

第二种策略仅使用单一波长的光(～365nm)用于将含CNVK的序列交联至半互补或完全互补的序列，并使用桥接序列来避免对交联逆转的需要，参见图2A-图2D。

在靶向方法中，使设计为与感兴趣的基因组或转录组序列互补的探针原位杂交(图2A-图2B)。二级杂交步骤结合桥序列，所述桥序列除条形码结构域(条形码*)之外，在与探针互补的区域中含有CNVK修饰。在UV光(约365nm)下光照后，桥变得共价连接(交联)至探针序列。在探针-桥复合物变性后，使引物杂交。该引物含有正向引物序列(For)、任选的唯一分子标识符(UMI)、与桥互补的条形码序列(条形码)以及与探针悬垂部分互补的短的3'悬垂部分，以使其能够伸过探针-桥连接体(图2A)。聚合酶用于复制完整的记录链。记录链可用正向(For)和反向(Rev)引物进行PCR扩增，然后最终被测序以回收组合的条形码/UMI和探针序列/身份信息。如果使用链置换聚合酶复制记录体，则可跳过变性步骤，并且可将引物直接原位杂交至探针-桥复合物(图2B)。

在非靶向方法中，桥结合至感兴趣的靶标中的保守或丰富序列。例如，在其3'端具有polyA序列的mRNA可通过包含一个或多个polyT序列的互补的含CNVK序列结构域而结合至包含条形码的桥(图2C-图2D)。引物包含引物结构域(For)、任选的唯一分子标识符(UMI)结构域和结合桥链上的条形码结构域(条形码*)的条形码结构域(条形码)。然后可使用逆转录酶来延伸引物，从而在交联被逆转之前或之后复制mRNA序列。然后制备包含组合的条形码和mRNA序列信息的记录序列，用于使用标准方法进行测序，例如通过利用在记录链的3'端附加引物以实现PCR扩增的模板转换寡核苷酸(TSO)。记录体的测序被用于回收组合的RNA转录物和条形码序列数据。可通过使用具有随机序列的引物和/或引物文库来检查其它类型和/或部分的RNA和DNA分子。

策略3：具有多联体组装体的光指导的条形码化：

第三种策略再次仅使用单一波长的光(～365nm)用以将含CNVK的序列交联至半互补或完全互补的序列。该策略利用在相同区域或序列上进行多轮交联，从而组装多链复合物(多联体)，见图3A-图3C。然后可使用跨连接体合成将多联体上的条形码序列链复制到可测序的记录链中。

在靶向方法中，使设计成与感兴趣的基因组序列或转录组序列互补的探针原位杂交(图3A-图3C)。二级杂交步骤结合条形码序列，该序列在以下中包含CNVK修饰：与链一端的探针上的悬垂部分互补的区域、链中间的条形码序列结构域、以及与其另一端的另一含CNVK的条形码链互补的区域。在UV光(约365nm)下光照后，第一条形码变得共价连接(交联)至探针序列。随后可将第二条形码链杂交至多联体并交联。可交联另外的链以迭代地组装多联体序列。最后的多联体条形码链(“加帽”条形码链)结合包含“加帽”引物的结合位点，并且可能或可能不交联至多联体组装体。

引入的最终链为“加帽”引物，所述“加帽”引物包含正向引物序列(For)、任选的唯一分子标识符(UMI)、以及与“加帽”条形码链互补的引物序列。然后可使用链置换聚合酶以通过跨连接体合成反应复制完整的记录链，这可在从底物变性之前(图3B)或之后(图3C)进行。记录链可用正向(For)和反向(Rev)引物进行PCR扩增，然后最终测序以回收组合的条形码/UMI和探针序列/身份信息。多联体组装被描绘在探针序列的3'悬垂部分，但也可在5'悬垂部分进行，使得在复制探针序列后进行跨连接体合成。这种策略还使得能够在整个多联体中重复使用相同的条形码序列，并且可被认为是组合性组装方法。

靶向方法还可用于结合固定在样品中或表面上的其它核酸，例如结合至感兴趣的蛋白靶标的DNA缀合抗体(参见图3B)。一般来说，可标记有或交联至感兴趣链的任何实体都可使用此策略记录。

多联体组装也可与非靶向方法配对，或者通过将多联体组装在条形码链的结合结构域上的悬垂部分上(例如参见图3A-图3C)，类似于策略1和2中描述的方法。多联体也可在模板转换寡核苷酸(TSO)的5'悬垂部分上形成。

关于变化的注释：

条形码结构域的长度可为0-100个核苷酸、或者更长，并且可使用1字母、2字母、3字母或4字母代码序列。它们还可包含修饰、非天然的或简并碱基。

UMI结构域可任选地包含在条形码链和/或探针链中。

UMI结构域可通过在碱基添加化学合成期间使用核苷酸混合物来合成，以产生随机序列(简并序列)文库。它们可能由串列的数个此类随机碱基组成，其中插入或不插入已知的核苷酸序列。

所有链中的所有结构域可为1字母、2字母、3字母或4字母代码序列。它们还可包含修饰、非天然的或简并碱基。

所提出的方法可用于产生经图案化和条形码化的表面，其可任选地用作寡核苷酸阵列，用以进行更高水平的图案化、掩蔽和捕获。

靶向方法还可用于结合固定在样品中或表面上的其它核酸，例如结合至感兴趣的蛋白靶标的DNA缀合抗体(参见图1B)。一般而言，可标记有或交联至感兴趣的链的任何实体(例如核酸、蛋白、肽、脂质、糖基、小分子、纳米颗粒、珠、玻璃表面)都可用这个策略而被图案化、条形码化和记录。

可在用聚合酶进行记录体合成之前或之后进行交联逆转(策略1)。

可在高离液序列(chaotropic)或变性条件下(例如在含尿素、氯化胍或甲酰胺的缓冲液中或在低盐条件下)进行交联逆转(策略1)。

可在高温条件下进行交联逆转(策略1)。

可在链置换聚合酶存在的情况下进行交联逆转(策略1)。

对于策略2，条形码结构域可为结合结构域(例如，结合mRNA的polyA尾的结构域)的5'或3'。

在多联体组装方法(策略3)中，可使用任意数量的轮次来产生任意长度的多联体(例如，包括1、2、3或高达500条链或更多)。

在多联体组装方法中，每轮有2到100个中任意个或更多个不同的条形码序列。

可在记录体测序之前进行PCR。还可进一步处理记录体，为下一代测序做准备。

可任选地从引物和记录序列中排除UMI。

条形码链可在3'端包含修饰以抑制通过聚合酶的延伸。它们也可包含“尾部”(例如一系列T碱基)以防止延伸。也可不阻止它们通过聚合酶延伸。

在一些变化中，扩增子任一侧的引物(例如，For和Rev结构域)可以是相同的。

使用CNVK碱基交联的替代方法是在条形码链的5'端使用光可切割间隔区，所述间隔区使得条形码链连接到探针或其它序列的3'端。未切割的链不会共价连接至探针/靶标，并且可在随后的条形码化轮次之前被洗掉。

交联可在UV(300-400nm)或近UV波长(400-500nm)、或通过使用2光子照射在更高波长下进行。

用于逆转交联的波长可在UV和近UV波长(300-405nm)下进行。

上转换纳米颗粒可用于在不同波长下进行交联。

可使用其它方法将交联的组装体转换为可测序的记录体。例如，可在结合的条形码链之间的结合区域内使用限制性位点，并且可将发夹连接到切割末端以形成完整的记录链。或者，可能在使用聚合酶的空位(gap)填充步骤之后或期间，跨连接体桥接的链可结合到组装体，然后连接在一起。

可使用其它方法来观察或验证条形码化过程，例如使用荧光团或纳米颗粒进行显微观察。

在感兴趣的生物分子上直接组装条形码的替代方案为，可在附近的分子上形成条形码，例如在共价连接至水凝胶基质的链上。然后，这些附近的组装体可通过触及其它分子并复制序列信息、或者通过近端序列的连接或以其它方式物理链接(例如，使用来自Hi-C或DNA显微术的策略)来转换为记录体。

使用靶向方法，反向引物位点(Rev)可以替代地移动到另一悬垂链(在探针序列的3'端)，所述悬垂链在Rev结构域和结合条形码链的结构域之间具有探针识别区域3'。该探针识别结构域的长度可为0个、1个、2个、多至50个或更多个碱基，并且可充当识别所结合的何种探针序列的索引，而不实际上需要对探针结合序列本身进行测序。

经条形码化的生物分子也与下游测定兼容。例如，蛋白可能非特异性标记有(缀合至)随后被条形码化的核酸链。条形码化后，可从样品纯化蛋白并应用至蛋白或抗体微阵列，以揭示蛋白的身份，该微阵列也可被条形码化到靶标上(例如，通过组装更大的条形码多联体)。一般来说，以某种方式对分子进行物理分离或分选的任何下游测定(例如凝胶、蛋白印迹、FACS、体积排阻柱)都可利用随后的条形码化步骤来在组装的条形码序列中编码有关靶标/转录物的额外信息。

二级测定可在条形码化之后进行进一步分析。这些测定可包括qPCR、显微术、pull-downs、DNA/RNA微阵列、蛋白质微阵列、抗体阵列、电泳凝胶、蛋白质印迹、细胞分选、FACS、基于液滴或微流体的方法、质谱、质谱成像、激光显微切割。

实施例3：具有迭代光交联的空间图案化。

任何光指导的条形码化策略(例如，上述策略1-3)可与空间图案化光照的迭代轮次配对，以实现更高水平的多重化测序读出。在图4A中描述了基本的交联反应。含有CNVK修饰的序列结合至部分或完全互补的序列，并在UV光照下形成共价键。通过将光照的面积或体积空间限制到特定区域或区域集合，可使交联仅在受光照区域内发生(图4B)。洗去未交联的链后，只有该区域将保持结合至所交联的链。

按照前一节中描述的条形码化程序，通过使用所选择的光指导的条形码化策略，利用迭代轮次的杂交和交联，不同的条形码序列在不同位置原位组装，并且可在相同的测序运行中合并在一起。在测序时，条形码序列用于将测序数据映射到与该条形码序列相关的条形码化轮次期间的原始指定(光照)位置。该测序数据可任选地进一步与感兴趣表面或样品的显微术或其它类型的分析配对，以提供更高维度的数据。下图示出了使用数字微镜装置(DMD)的图案化光照，但能够进行可编程光照的任何装置(例如点扫描共聚焦、旋转盘共聚焦、光片显微术、高通量扫描仪、结构化照明显微镜、受激发射损耗显微镜)可与条形码化学相结合。

在一些实验中，多个区域可在同一轮次期间接收相同的条形码序列，这可代表不同于空间定位的属性。例如，如果所有具有相同标志物基因或其它共享属性(例如，相同的细胞状态)的细胞都标记有相同的条形码序列，那么它们的测序读段可在以后分组在一起。在一些实验中，光照可在亚细胞水平、仅在细胞核区域、在整个细胞水平或在大于细胞的水平上进行。光照可在固定的细胞或组织样品中进行，也可直接在功能化表面上进行。

方法：利用双波长进行迭代光交联的空间图案化(策略1)。图4C中描绘了利用针对光指导的条形码化描述的第一种策略的使得多个(n)区域能够标记有唯一的条形码序列(B1到Bn)的迭代光交联的实例。各轮次将由以下组成：条形码链结合至所有区域的杂交步骤，光照被限制在特定的经编程区域的交联步骤，以及从样品/底物解离所有非交联条形码链的洗涤步骤。任选地，也可在杂交步骤期间进行交联。指定区域可各自接收带有唯一条形码序列(B1到Bn)的条形码链，该序列随后在测序期间被回收，从而使得探针/转录物序列信息映射回光照区域。

方法：使用桥序列进行迭代光交联的空间图案化(策略2)。图4D中描绘了利用针对光指导的条形码化描述的第二种策略的使多个(n)区域能够标记有唯一的条形码序列(B1至Bn)的迭代光交联的实例。各轮次将由以下组成：条形码链结合至所有区域的杂交步骤，光照被限制在特定的经编程区域的交联步骤，以及从样品/底物解离所有非交联条形码链的洗涤步骤。任选地，也可在杂交步骤期间进行交联。指定区域可各自接收带有唯一条形码序列(B1到Bn)的条形码链，该序列随后在测序期间被回收，从而使得探针/转录序列信息映射回光照区域。

方法：使用迭代光交联和多联体组装来创建组合条形码的空间图案化(策略3)。

大规模多重化条形码的策略描绘于图5A-图5C中。该策略分为两部分。在第一阶段，DNA条形码以独特的交联几何形状迭代地光交联至生长的链，这将用作第二阶段中酶促复制的模板(图5A)。第二阶段利用链置换DNA聚合酶复制经交联条形码的经组装链，以将条形码信息复制到单个连续DNA链中，然后可通过测序抓取其信息(图5B)。

各轮次中各个条形码链将发生以下步骤：条形码链结合至所有区域的杂交步骤，光照被限制在特定的经编程区域的交联步骤，以及从样品/底物解离所有非交联条形码链的洗涤步骤。任选地，也可在杂交步骤期间进行交联。各轮都由经历该过程的多个条形码链组成。例如，如果在n轮的每一轮中使用m条条形码链来构建包含n条条形码序列的多联体，则存在可编程组装的m"n个可能的多联体序列。在图5A中，示出了m＝2的实例，因此在n轮中将有2"n个可能的可编程多联体序列。

实验验证

在固定的EY.T4细胞上验证了空间图案化光照。使用4％PFA将细胞作为单层固定到盖玻片上的孔室中。随后，进行数次洗涤以及在具有0.5％(vol/vol)Triton X-100的1×PBS中的10分钟的孵育以透化细胞，并在37℃下，在包含2×SSCT、50％甲酰胺、10％葡聚糖、0.1％吐温-20和～67nM探针序列的缓冲液(按照标准方案在60℃下孵育3分钟后)中将靶向核糖体RNA(rRNA)的探针原位杂交过夜。探针序列包含第一条形码链可结合的3'悬垂部分。为了验证，条形码链在5'端带有Cy3b荧光团。将细胞样品与PBS中的50nM第一条形码链孵育10min。未结合的链用PBS洗涤3×1min。然后使用具有4×物镜的DMD，将选定区域暴露于365nm的UV激光(5，功率密度为光纤外10w/cm"2)2sec以诱导交联。未交联的链用PBS中的50％的甲酰胺洗涤2×2.5min。用PBS洗涤1分钟后，用DAPI标记细胞核，并用广角显微镜在20×下成像(图6A-图6F)。

还使用相同类型的rRNA靶向样品测试了用于生物分子条形码化的迭代交联。在这种情况下，在每个步骤中，使用手持式UV枪照射整个样品，并按顺序组装包含多达三个条形码链的多联体，所述枪输出365nm的光，功率密度为2w/cm"2。在各轮次中，将50nM的Cy3b标记的条形码链在PBS中施加到细胞上10min，然后为通过PBS洗涤3×1min去除未结合的链，UV暴露，以及用PBS中的50％甲酰胺洗涤2×3min去除未交联的链。在最终轮次中，Cy5标记的引物链(引物加帽)被施加并用于跨连接体DNA合成(图7A)。在跨连接体合成和PCR扩增之后，1连接体和3连接体组装体的正确长度的链在15％TBE-尿素PAGE变性凝胶上可视化(图7B，实验2)。

在跨连接体合成和PCR(实验1)后，主要具有单连接体组装体的另一样品(对应图6A-图6F中的样品，所述样品只包含图案化至整个样品中较长的组装体的小的区域)被可视化。最后，通过方案运行没有底层探针(原位杂交期间没有探针)但接受所有后续条形码和交联处理的对照样品，并且所述对照样品没有产生预期的记录长度的链。

实施例4：空间标记和测序的验证

图8A-图8C示出细胞水平的空间标记的实验验证。在显示GFP信号的细胞周围绘制预先选择的用于交联的多个感兴趣区域(黄色、蓝色、绿色、红色轮廓)(图8B)。

图9A-图9D示出测序结果。利用策略2的变体(UMI处于在扩增子的两端)，在固定的HeLa细胞上使用图案化光照对三个不同的空间分离区域进行连续条形码化。图9A展示了6个不同的探针序列(两个靶向核糖体RNA以及四个靶向Xist RNA)用FISH结合至它们的靶RNA序列。随后为迭代条形码化、含条形码的引物的结合、记录体的合成和扩增。使用Collibri测序制备试剂盒为下一代测序(HiSeq)制备扩增子。图9B-图9C示出了预期格式的读段在比对后以高百分比回收。图9D示出了对于各个探针-区域对而显示的数据大子集的读段分布。

实施例5：条形码化方法

靶向条形码化可在cDNA序列、FISH探针序列、缀合至抗体的核酸或通过亲和试剂原位定位至感兴趣的生物分子的任何其它核酸上进行。或者，非靶向方法(例如使用随机引物生成cDNA序列以进行全转录组谱分析)可作为条形码化的底物，所述条形码化可在以下上进行：任何预先存在的RNA或DNA序列或具有经修饰骨架(例如LNA或PNA)或核酸类似物或经修饰的单体的其它核酸聚合物，或通过聚合酶、连接酶、限制性酶、核酸酶、端粒酶、末端转移酶、重组酶或转座酶的作用原位生成的其它反应产物(例如邻近连接技术、引物交换反应、自循环邻近记录或加标签(tagmentation)的那些)(图10)。可迭代地执行条形码化以形成以多连接体多联体布置的条形码的已知排列，用于从特定区域(例如单个细胞，图11A)提取的读段。跨连接体合成和PCR可用于从这些多联体提取可测序的读段。这种在生物分子上的原位组合性条形码构建具有多种可能的应用，包括单细胞拆分-合并(split-pool)条形码化(图13)、感兴趣的单个细胞或亚细胞区域和超细胞区域上的空间条形码组装(图14)、以及对具有某些表型的细胞的特异性条形码化(例如用于药物发现(图12))。

可以按线性方式进行条形码化，其中各个条形码化区域接收单个唯一条形码(图15A)。或者，可以按组合性方式形成连接体多联体，由此，各具有M个条形码的N个轮次可产生M^N个唯一条形码排列(图15B)。

通常，条形码化可用于将基于形态学成像的数据集与测序数据集直接连接，所述测序数据集与完全相同的样品或感兴趣区域相关联。图16描述了将RNA测序与成像数据结合的一般工作流程。细胞、组织或类器官都可在固定和透化后进行条形码化。对于转录组分析，原位逆转录的cDNA序列和/或基于FISH的探针可为条形码化的底物。对于蛋白质组学和其它类型的组学分析，缀合至抗体、蛋白质、纳米抗体或其它亲和试剂的核酸可充当靶标或条形码化底物。在一些情况下，可能需要加尾步骤(例如“A加尾”)来将3'悬垂部分添加到被条形码化的核酸(例如cDNA序列)。在进行期望的成像测定后，然后通过连接体多联体的迭代构建对细胞和/或亚细胞区域或超细胞区域进行条形码化。可使用特异性切割RNA的酶(例如RNaseH)置换结合至RNA的多联体，这可在随后的合成步骤中任选发生。跨连接体合成可直接原位进行，也可在置换过程中/置换后(如果适用)进行。在对完整记录体进行PCR扩增后，将扩增子制备用于测序(例如纯化、通过凝胶电泳分析、文库制备)，然后进行测序。从测序读段中提取条形码，以便将这些测序读段映射回分配了这些条形码的特定区域。

可通过使用末端转移酶和dATP来实现加尾(例如，“A加尾”)。可任选地以低浓度包含ddATP或另一终止核苷酸以随机终止3'端，从而在跨连接体合成步骤期间保护其免受后续延伸。加尾可替代地使用不同的核苷酸(例如dCTP、dGTP或dTTP)或核苷酸的混合物进行。也可使用其它策略来添加3'悬垂部分，例如连接。

在制备的HeLa细胞上测试了不同的UV功率和光照时间条件。靶向rRNA的FISH探针原位杂交，并通过其5'悬垂结构域充当条形码化底物(图17)。创建了控制宏来自动在多个视野中对样品进行栅格化，用棋盘图案光照区域，并相应地调整UV功率和光照时间。各个特定光源的最佳UV条件使交联效率最大化，并使脱靶交联最小化。取决于光源、波长、功率、距离、放大倍率、焦点和其它限制条件，该光照时间量可能变化很大，例如在1ms到数分钟或更长之间。例如，这种光照可能为1ms、5ms、10ms、100ms、1000ms、10000ms、100000ms、1000000ms等，功率为1％、2％、5％、10％、100％等。

在图18和图19中示出了用于对原位定位的核酸的5'悬垂部分进行条形码化的链图的数个变体。

对数种不同的Cy5标记的引物设计测试cDNA文库生成(图20A)。HeLa细胞在Ibidi8孔腔室中制备，并在1％PFA中固定，并用200μL 70％甲醇和30％PBS缓冲液(补充有0.1％吐温-20)进行透化。除阴性对照外，对所有孔执行相同的逆转录(RT)方案。之后，引物以Cy5通道成像以测定它们的定位(图20B)。某些引物设计偏好胞浆区域，表明不同的引物可在RT步骤中访问和复制不同类型的RNA种类。然后通过以棋盘图案将Cy3标记的CNVK条形码交联至相同细胞来验证所有引物设计的条形码化。数种这些引物的测序结果在图21中示出。

在图22A和下表1中描述了用于对原位定位的核酸的5'悬垂部分进行条形码化的一般序列设计策略。

表1.用于两个方向设置的条形码化链的一般结构(还参见图22A)。条形码化通过构建包含rev加帽条形码链、零个以上的条形码链和对接链(例如，经延伸以在RNA上创建cDNA序列的RT引物、FISH或其它靶向探针、或通过某种亲和关系原位定位到生物分子的链)的多联体来完成。在本例中，存在序列的两种取向，取向每隔一个条形码化轮次交替。也可使用更多取向。星号表示互补或大部分互补的结构域，例如，(结合结构域X)杂交至(结合结构域X)*。

在图22B和表2中描述了在随后的图中使用的特异性结合结构域序列。在本实例中，随后为CNVK修饰的A碱基由两个T核苷酸跨越配对(paired across)。已经发现，交联后，CNVK作为聚合酶延伸的阻断剂非常有效，因此即使在所有四种核苷酸(dATP、dTTP、dCTP、dGTP)都存在时，它也可直接用作跨连接体合成过程中的阻断结构域。

表2.具有d0和d1结合结构域的序列的特定结构(还参见图22B)。描述了经过实验验证的条形码化结合结构域的具体的组(d0＝表1中描述的(结合结构域W)并且d1＝表1中的(结合结构域Y))。结合结构域必须设计得足够短，使得非交联的条形码链可被洗掉，而不破坏对接序列(例如cDNA序列或经定位的FISH或靶向探针)的潜在亲和力或结合。

图22C和表3示出了随后图中使用的确切的条形码化和引物序列。

表3.经实验验证的序列(还参见图22C和数据图)。条形码序列通过完整的条形码化工作流程验证，包括测序。

通过对结合至经链霉亲和素包被的载玻片的生物素化链的迭代条形码化将多达8条链串联在一起(以形成7个连接体)来测试这些序列(图23A-图23B)。在6个孔中的各个孔中，引入不同数量的条形码以产生2-7个连接体用于跨连接体合成(图23C)。完整的预期连接体和扩增子序列设计在图23D中描绘，预期的交联位点由CNVK(“X”)修饰指示。测序后鉴别出具有预期的六个条形码的一些完整序列，以及大多数的截短的四个条形码、两个条形码和零个条形码序列，指示组装效率不完美。绝大多数读段以正确的引入顺序显示条形码，指示条形码记录体确实反映了特定条形码序列的时间性引入。

然后按照图19中描述的工作流程，将这些序列用于对固定的HeLa细胞中的cDNA序列进行条形码化。多种固定、透化、RT、A-加尾和条形码化条件一起进行了测试，并且所有示出的条件都产生了一些预期的测序结果(图24)。在示出的测序结果中，除了缺少RT酶的对照，突出显示的cDNA读段(蓝色)映射到已知的智人序列。总之，这些数据表明了该技术在广泛围的RT、透化和固定条件下的稳健性。实验C1到C4的结果进一步表明，来自在先前轮次中引入但未交联的条形码的背景非常少，因为对于那些较早期条形码，发现非常少的读段。这表明所选择的严格洗涤条件(1×PBS或1×PBS-吐温中的40％甲酰胺)足以洗去结合但非交联的条形码链。这些相同实验(B1到B8和C1到C4)的成像和凝胶结果在图25A-图25D中示出。来自这些实验之一(B7)的正确序列格式的1,024个解析读段的成功的基因序列映射结果的实例在图26中示出。

使用一组六个DNA条形码进行组合性条形码化策略的实验测试，并与自动化流体交换单元以及控制宏整合以调整每个条形码化轮次的光掩模(图27)。总共112个正方形尺寸化的感兴趣区域被分配了唯一的DNA条形码序列。我们的编码策略利用三元编码方案(0,1,2)。进行了共六个条形码化轮次，随后为添加rev引物链的最终加帽轮次。各个条形码轮次都被分配了唯一的光掩模，以在视野内并行化条形码分配。在添加最终的加帽链后，以Cy3通道拍摄图像以使成功的条形码并入可视化。

整合的自动化细胞检测、光掩蔽和条形码化工作流程的实验测试(图28A)。HeLa细胞接种在Ibidi流动室中，并用4％PFA固定，并在补充有0.25％Triton-X的1×PBS中透化。5N.3G(参见图22A-图22C)引物用于逆转录并以Cy5通道成像(图28B)。基于Cy5信号使用算法来鉴别细胞，并且检测到的细胞的轮廓叠加在Cy5信号上(图28C)。各个细胞的轮廓都作为感兴趣的区域发挥作用，并分配有自己唯一的条形码序列。使用Cy3标记的CNVK DNA条形码在选定的细胞上进行自动化条形码化和DNA条形码交换。随后，细胞以Cy3通道成像(图28E)以确认成功的条形码递送。

图16中提供的工作流程可用于对感兴趣的预限定区域(例如整个组织、组织区域、细胞集合、单细胞、亚细胞区域、微生物、表面)中的生物分子进行条形码化，以便通过基于成像的方法和基于测序的方法两者将它们标示用于多模式整合分析。在这种情况下，本文提供的方法用于创建将测序读段关联回至它们源自的空间位置的空间标签。因此，条形码化方法使得能够筛选候选治疗的库(小分子药物、治疗性核酸、基因或细胞疗法、肽、蛋白质、抗体、代谢物、激素、DNA编码文库)，其中通过成像识别表型结果，并使用本文提供的方法通过曝光对选定区域进行条形码化用于进行基于测序的分析。该方法的应用包括但不限于疗法的筛选(小分子药物、生物制品、治疗性核酸、基因或细胞疗法、siRNA、gRNA、肽、蛋白质、抗体、代谢物、激素、DNA编码文库)、药物靶标的鉴别、生物标志物的鉴别、谱分析、表型至基因型细胞状态的表征、新疾病模型的生成、细胞和疾病模型的表征、分化状态和细胞状态的表征、组织映射、多维分析、高内涵筛选、基于机器学习的聚类或分类、细胞疗法开发、CAR-T疗法开发、抗体筛选、个性化医疗、细胞富集。

该方法可应用于任何预先存在的靶核酸和其它生物分子，这些生物分子或者直接缀合至核酸或通过如下衔接子间接结合至核酸，所述衔接子例如亲和结合剂、抗体、纳米抗体适体、亲和体(affibodies)、标签、融合蛋白、接头。在这种情况下，潜在的靶标分子包括但不限于肽、蛋白质、抗体、配体、质粒、siRNA、向导RNA(gRNA)、质粒、噬菌体、病毒、代谢物、激素、小分子的DNA编码文库，以及经DNA条形码化的表面、亚细胞结构或整个细胞或微生物体。

本文提供的方法通过使用本文提供的任何组合物并将感兴趣的预限定区域中的分子暴露于光，可用于线性或组合性地用交联DNA链对生物分子进行条形码化。

例如，该方法可用于对预定的感兴趣区域(整个组织、组织区域、细胞集合、单细胞、亚细胞区域、微生物、表面)中的生物分子进行条形码化，以便通过基于成像的方法和基于测序的方法两者将它们标示用于多模式整合分析。

此外，可实现对生物分子进行条形码化以创建将测序读段关联回至空间位置的空间标签，用于通过基于成像的方法和基于测序的方法两者对选定的感兴趣区域进行多模式整合分析。

图16中的工作流程也可用于筛选各种疾病的候选治疗库。例如，筛选小分子药物、生物制品、治疗性核酸、基因或细胞疗法、siRNA、gRNA、质粒、噬菌体、病毒、肽、蛋白质、抗体、代谢物、激素和DNA编码文库。表型结果通过成像进行鉴别，并且使用本文提供的方法通过曝光对选定区域进行条形码化用于进行基于测序的分析。

本文提供的方法可对多种应用而言有利，所述应用包括但不限于药物靶标的鉴别、生物标志物的鉴别、谱分析、表型至基因型细胞状态的表征、新疾病模型的生成、细胞和疾病模型的表征、分化状态和细胞状态的表征、组织映射、多维分析、高内涵筛选、基于机器学习的聚类或分类、细胞疗法的开发、CAR-T疗法的开发、抗体筛选、个性化医疗以及细胞富集。

参考文献

1)S.Picelli et al.,Nat.Methods 10，1096-1098(2013).

2)T.Hashimshony，F.Wagner，N.Sher，I.Yanai，Cell Reports 2，666-673(2012).

3)D.A.Jaitin et al.，Science 343，776-779(2014).

4)Z.Macosko et al.，Cell 161,1202-1214(2015).

5)M.Klein et al.，Cell 161，1187-1201(2015).

6)G.X.Y.Zheng et al.，Nat.Commun.8,14049(2017).

7)P.L.

etal.，Science 353，78-82(2016).

8)Rodriques，S.G.，Stickels，R.R.，Goeva,A.，Martin,C.A.,Murray，E.，Vanderburg，C.R.，...&Macosko，E.Z.(2019).Slide-seq：A scalable technology formeasuring genome-wide expression at high spatial resolution.Science,363(6434),1463-1467.

9)Rosenberg,A.B.，Roco，C.M.，Muscat,R.A.,Kuchina,A.，Sample,P.，Yao,Z.，...&Pun，S.H.(2018).Single-cell profiling of the developing mouse brain andspinal cord with split-pool barcoding.Science，360(6385)，176-182.

10)Vickovic，S.，Eraslan，G.，Klughammer，J.，Stenbeck,L.,Salmen,F.,Aijo,T.，...&Frisen，J.(2019).High-density spatial transcriptomics arrays for insitu tissue profiling.bioRxiv，563338.

11)Fazal，Furqan M.，Shuo Han，Kevin R.Parker，Pomchai Kaewsapsak,Jin Xu,Alistair N.Boettiger，Howard Y.Chang，and Alice Y.Ting.″Atlas of subcellularRNA localization revealed by APEX-seq.″Cell(2019).

12)Sundah，Noah R.，Nicholas RY Ho，Geok Soon Lim，Auginia Natalia,Xianguang Ding,Yu Liu,Ju,Ee Seet，Ching Wan Chan，Tze Ping Loh，and HuilinShao.″Barcoded DNA nanostructures for the multiplexed profiling ofsubcellular protein distribution.″Nature biomedical engineering(2019)：1-11.

13)Femino，A.M.，Fay，F.S.，Fogarty，K.&Singer，R.H.Visualization of singleRNA transcripts in situ.Science 280,585-590(1998).

14)Raj，A.，van den Bogaard，P.，Rifkin，S.A.，van Oudenaarden，A.&Tyagi，S.Imaging individual mRNA molecules using multiple singly labeledprobes.Nat.Methods 5，877-879(2008).

15)Kishi，J.Y.,Lapan，S.W.，Beliveau，B.J.，West，E.R.，Zhu，A.，Sasaki，H.M.，Saka，S.K.，Wang,Y.，Cepko，C.L.and Yin,P.，2019.SABER amplifies FISH：enhancedmultiplexed imaging of RNA and DNA in cells and tissues.Nature methods，16(6)，p.533(2019)

16)Lubeck,E.&Cai,L.Single-cell systems biology by super-resolutionimaging and combinatorial labeling.Nat.Methods 9，743-748(2012).

17)Lubeck,E.,Coskun,A.F.，Zhiyentayev，T.，Ahmad，M.&Cai，L.Single-cell insitu Profiling the transcriptome with RNA SPOTs.Nat.Methods 14，1153-1155(2017).

18)Eng，C.L.，Shah,S.,Thomassie，J.&Cai,L.Shah,S.et al.Dynamics andspatial genomics of the nascent transcriptome by intron seqFISH.Cell 174，363-376.e16(2018).

19)Eng，C.H.L.，Lawson，M.，Zhu，Q.，Dries，R.，Koulena,N.,Takei，Y.,...&Cai，L.(2019).Transcriptome-scale super-resolved imaging in tissues by RNA seqFISH+.Nature，568(7751)，235.

20)Kerstens，H.M.，Poddighe，P.J.&Hanselaar，A.G.A novel in situhybridization signal amplification method based on the deposition ofbiotinylated tyramine.J.Histochem.Cytochem.43，347-352(1995).

21)Dirks，R..M.&Pierce，N.A.Triggered amplification by hybridizationchain reaction.Proc.Natl Acad.Sci.USA 101，15275-15278(2004).

22)Choi,H.M.T.et al.Programmable in situ amplification formultiplexed imaging of mRNA expression.Nat.Biotechnol.28，1208-1212(2010).

23)Choi，H.M.，Beck，V.A.&Pierce，N.A.Next-generation in situhybridization chain reaction：higher gain，lower cost，greater durability.ACSNano 8，4284-4294(2014).

24)Rouhanifard，S.H.et al.ClampFISH detects individual nucleic acidmolecules using click chemistry-based amplification.Nat.Biotechnol.37，84-89(2018).

25)Nagendran，M.，Riordan,D.P.,Harbury，P.B.&Desai，T.J.Automated cell-type classification in intact tissues by single-cell molecularprofiling.Elife 7(2018).

26)Player，A.N.，Shen，S.P.，Kenny，D.，Antao，V.P.&Kolberg，J.A.Single-copygene detection using branched DNA(bDNA)in situ hybridization.J.Histochem.Cytochem.49，603-611(2001).

27)Xia,C.,Babcock,H.P.,Moffitt，J.R.and Zhuang，X.，2019.Multiplexeddetection of RNA using MERFISH and branched DNA amplification.Scientificreports,9(1)，p.7721.

28)Wang,F.et al.RNAscope：a novel in situ RNA analysis platform forformalin-fixed，paraffin-embedded tissues.J.Mol.Diagn.14,22-29(2012).

29)Shah,S.et al.Single-molecule RNA detection at depth viahybridization chain reaction and tissue hydrogel embedding andclearing.Development 92,2862-2867(2016).

30)Chen，F.，Tillberg，P.W.&Boyden，E.S.Expansion microscopy.Science 347,543-548(2015).

31)Wang...Zhuang et al,Scientific Reports(2018)

32)Chen et al.，Science(2015)

33)Ke，R.et al.In situ sequencing for RNA analysis in preserved tissueand cells.Nat.Methods 10，857-860(2013).

34)Lee，J.H.et al.Highly multiplexed subcellular RNA sequencing insitu.Science(80-.).343，1360-1363(2014).

35)Iyer,Eswar Prasad Ramachandran，et al.″Barcoded oligonucleotidesligated on RNA amplified for multiplex and parallel in-situ analyses.″bioRxiv(2018)：281121.

36)Wang...Deisseroth et al.，Science(2018)

37)Liu N.，Dai M.，Saka S.K.，Yin P.Super-resolution labelling withAction-PAINT.Nature Chemistry(2019)，in press.

38)Kim，S.H.，Liu，Y.，Hoelzel，C.，Zhang，X.，&Lee，T.H.(2019).Super-Resolution Optical Lithography with DNA.Nano letters.

39)Lieberman-aiden,E.et al.Comprehensive Mapping of Long-RangeInteractions Reveals Folding Principles of the Human Genome.Science(80-.).326,289-293(2009).

40)Schaus，T.E.，Woo，S.，Xuan，F.，Chen，X.，&Yin，P.(2017).A DNA nanoscopevia auto-cycling proximity recording.Nature communications，8(I)，696.

41)Boulgakov，A.A.，Xiong，E.，Bhadra，S.，Ellington，A.D.，&Marcotte，E.M.(2018).From Space to Sequence and Back Again：Iterative DNA Proximity Ligationand its Applications to DNA-Based Imaging.BioRxiv；470211.

42)Weinstein,J.A.,Regev,A.，&Zhang，F.(2019).DNA microscopy：Optics-freespatio-genetic imaging by a stand-alone chemical reaction.Cell.

43)Zhu YY，Machleder EM，et al.(2001)Reverse transcriptase templateswitching：a SMART approach for full-length cDNA library constructionBiotechniques，

30(4)：892-897.

44)Chu，H.，Zhao，J.，Mi，Y.，Zhao，Y.，&Li，L.(2019).Near-infrared Light-Initiated Hybridization Chain Reaction for Spatially-and Temporally-ResolvedSignal Amplification.Angewandte Chemie International Edition.

45)Singh-Gasson，S.，Green，R.D.，Yue，Y.，Nelson，C.，Blattner，F.，Sussman，M.R.，&Cerrina，F.(1999).Maskless fabrication of light-directed oligonucleotidemicroarrays using a digital micromirror array.Nature biotechnology，17(10),974.

46)Rosenberg，Alexander B.，et al.″Single-cell profiling of thedeveloping mouse brain and spinal cord with split-pool barcoding.″Science360.6385(2018)：176-182.

47)Hagemann-Jensen，Michael，et al.″Single-cell RNA counting at alleleand isoform resolution using Smart-seq3.″Nature Biotechnology 38.6(2020)：708-714.

48)Dobin，Alexander，et al.″STAR：ultrafast universal RNA-seq aligner.″Bioinformatics 29.1(2013)：15-21.

Claims

1.一种条形码组合物，所述条形码组合物包含：

a.第一核酸，所述第一核酸以5’至3’方向包含：i.任选的唯一分子标识符(UMI)序列；ii.第一靶向结构域；和iii.第一杂交结构域，以及

b.第二核酸，所述第二核酸以5’至3’方向包含：i.条形码结构域；以及ii.第二杂交结构域，其中，所述第二杂交结构域与所述第一核酸的第一杂交结构域实质上互补，并且

2.如权利要求1所述的条形码组合物，其中，所述第二核酸在5'端进一步包含唯一分子标识符序列。

3.如权利要求1或2所述的条形码组合物，其中，所述第二核酸在5'端进一步包含引物序列。

4.一种条形码组合物，所述条形码组合物包含：

a.第一核酸，所述第一核酸以5’至3’方向包含：i.任选的唯一分子标识符序列；ii.第一靶向结构域；和iii.第一杂交结构域；以及

b.第二核酸，所述第二核酸以5’至3’方向包含：i.第二杂交结构域，其中，所述第二杂交结构域与所述第一核酸的第一杂交结构域实质上互补；以及ii.第一条形码结构域，并且

5.如权利要求1-4中任一项所述的条形码组合物，所述条形码组合物进一步包含第三核酸，所述第三核酸包含第二条形码结构域，其中，所述第二条形码结构域与所述第一条形码结构域实质上互补。

6.如权利要求5所述的条形码组合物，其中，所述第三核酸在5'端进一步包含唯一分子标识符序列。

7.如权利要求5或6所述的条形码组合物，其中，所述第三核酸在5'端进一步包含引物序列。

8.一种条形码组合物，所述条形码组合物包含：

b.第二核酸，所述第二核酸以5’至3’方向包含：i.第二杂交结构域，其中，所述第二杂交结构域与所述第一核酸的第一杂交结构域实质上互补；以及ii.第一条形码结构域；iii.第三杂交结构域，并且

其中，所述第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件，并且所述第三杂交结构域任选地包含光反应元件。

9.如权利要求8所述的条形码组合物，其中，所述组合物进一步包含n个额外的核酸，其中：

n为从1至100的整数，并且

各个额外的核酸以5’至3’方向包含：i.第一杂交结构域；ii.条形码结构域；和iii.第二杂交结构域，并且

其中，第n个核酸的第一杂交结构域与第(n-1)个核酸的第二杂交结构域实质上互补，

其中，n＝1核酸的第一杂交结构域与所述第三杂交结构域实质上互补，并且

其中，各个核酸的第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件。

10.如权利要求8或9所述的条形码组合物，其中，所述组合物进一步包含第一帽核酸链，所述第一帽核酸链以5'至3'方向包含：

i.第一帽杂交结构域，其中，当n为1以上时，所述第一帽杂交结构域与第n个核酸的第二杂交结构域实质上互补，或者当n为0时，所述帽杂交结构域与所述第三杂交结构域实质上互补；以及

ii.第二帽杂交结构域；

其中，所述第一帽杂交结构域任选地包含光反应元件。

11.如权利要求10所述的条形码组合物，其中，所述组合物进一步包含第二帽核酸链，所述第二帽核酸链以5'至3'方向包含：

i.引物序列结构域；

ii.任选的唯一分子标识符(UMI)序列；以及

iii.杂交结构域，其中，所述杂交结构域与所述第一帽核酸的第二帽杂交结构域实质上互补，并且

其中，所述第一帽核酸链的第二帽杂交结构域和所述第二核酸链的杂交结构域中的至少一个包含光反应元件。

12.如权利要求1-11中任一项所述的条形码组合物，其中，所述第一核酸为RNA或RNA转录物，并且任选地，所述第一杂交结构域包含poly(A)序列。

13.如权利要求1-12中任一项所述的条形码组合物，其中，所述第一核酸在5'端进一步包含引物序列。

14.如权利要求1-13中任一项所述的条形码组合物，其中，所述第一核酸的第一靶向结构域与靶核酸实质上互补。

15.如权利要求14所述的条形码组合物，其中，所述靶核酸与靶标结合剂缀合，或者所述靶核酸与靶分子缀合，或者所述靶核酸被包含在靶分子(例如RNA)中，或者所述靶核酸由靶细胞表达，或者所述靶核酸通过化学交联、遗传编码、病毒转导、转染、缀合、细胞融合、细胞摄取、杂交、DNA结合蛋白或衔接分子例如靶结合配体直接或间接呈现在靶分子或细胞上。

16.如权利要求15所述的条形码组合物，其中，所述靶标结合剂选自于由如下所组成的组：氨基酸、肽、蛋白质、单糖、二糖、三糖、寡糖、多糖、脂多糖、凝集素、核苷、核苷酸、核酸、维生素、类固醇、激素、辅因子、受体和受体配体；任选地，所述靶标结合剂为抗体或其抗原结合片段。

17.如权利要求1-16中任一项所述的条形码组合物，其中，各个结构域独立地包含1字母代码、2字母代码、3字母代码或4字母代码。

18.如权利要求1-17中任一项所述的条形码组合物，其中，各个结构域独立地包含零个或至少一个核酸修饰。

19.如权利要求18所述的条形码组合物，其中，所述核酸修饰选自于由核碱基修饰、糖修饰和核苷酸间连接修饰所组成的组。

20.如权利要求1-19中任一项所述的条形码组合物，其中，各个结构域的长度独立地为1-1000个核苷酸。

21.如权利要求1-20中任一项所述的条形码组合物，其中，核酸的UMI被并入同一核酸的其它结构域之一中。

22.如权利要求1-21中任一项所述的条形码组合物，其中，所述核酸中的至少一种包含可切割的间隔区。

23.权利要求22所述的条形码组合物，其中，所述可切割间隔区为光可切割间隔区。

24.如权利要求1-23中任一项所述的条形码组合物，其中，所述条形码组合物进一步包含可检测的标记。

25.如权利要求24所述的条形码组合物，其中，所述可检测的标记包含在所述核酸之一中。

26.如权利要求24或25所述的条形码组合物，其中，所述可检测的标记选自于由如下所组成的组：荧光分子、纳米颗粒、稳定同位素、放射性同位素、核苷酸生色团、酶、酶底物、化学发光部分和生物发光部分、回波发生物质、非金属同位素、光学报告子、顺磁性金属离子和铁磁性金属；任选地，所述可检测的标记为荧光团。

27.如权利要求1-26中任一项所述的条形码组合物，所述条形码组合物进一步包含聚合酶。

28.如权利要求27所述的条形码组合物，其中，所述聚合酶为链置换聚合酶。

29.如权利要求1-28中任一项所述的条形码组合物，所述条形码组合物进一步包含用于核酸合成的缓冲液或盐。

30.如权利要求1-29中任一项所述的条形码组合物，所述条形码组合物进一步包含天然的或合成的三磷酸核苷酸或三磷酸脱氧核苷酸。

31.如权利要求1-30中任一项所述的条形码组合物，所述条形码组合物进一步包含靶标元件。

32.如权利要求31所述的条形码组合物，其中，所述靶标元件固定在底物表面上。

33.如权利要求32所述的条形码组合物，其中，所述靶标元件以预定图案固定在所述底物表面上。

34.如权利要求31-33中任一项所述的条形码组合物，其中，所述靶标元件为核酸、脂质、糖、小分子、微生物体或其片段、多肽和/或生物材料。

35.如权利要求34所述的条形码组合物，其中，所述生物材料选自于由组织、细胞、类器官、经工程化的组织、以及细胞外基质所组成的组。

36.如权利要求31-35中任一项所述的条形码组合物，其中，所述底物选自于由如下所组成的组：玻璃、透明聚合物、聚苯乙烯、水凝胶、金属、陶瓷、纸、琼脂糖、明胶、藻酸盐/酯、葡聚糖、氧化铁、不锈钢、氯化银、铜、金、聚碳酸酯、聚二甲基硅氧烷、聚乙烯、丙烯腈丁二烯苯乙烯、环烯烃聚合物、环烯烃共聚物、链霉亲和素、树脂以及生物材料。

37.如权利要求1-36中任一项所述的条形码组合物，其中，所述光反应元件为光反应核苷酸；任选地，所述光反应核苷酸为CNVK或CNVD交联碱基。

38.如权利要求1-37中任一项所述的条形码组合物，所述条形码组合物进一步包含PCR引物。

39.如权利要求1-38中任一项所述的条形码组合物，所述条形码组合物进一步包含光源；任选地，所述光源为UV光源。

40.如权利要求1-39中任一项所述的条形码组合物，所述条形码组合物处于试剂盒形式。

41.一种检测靶mRNA的方法，所述方法包括：

a.使靶mRNA(第一核酸)与第二核酸杂交，并且其中，i.所述mRNA包含含有polyA序列的第一杂交结构域；并且ii.所述第二核酸以5’至3’方向包含：1.第二杂交结构域，其中，所述第二杂交结构域与所述第一杂交结构域实质上互补，并且包含光反应元件；以及2.第一条形码结构域，以及

b.使所述mRNA与所述第二核酸光交联，从而形成探针-引物复合物；

c.由所述探针-引物复合物合成记录核酸；以及

d.检测所述记录核酸。

42.一种检测靶核酸的方法，所述方法包括：

a.使靶核酸与第一核酸杂交并且使第二核酸与所述第一核酸杂交，其中，i.所述第一核酸以5’至3’方向包含：1.任选的唯一分子标识符(UMI)序列；2.与靶标元件的核酸实质上互补的第一靶向结构域；以及3.第一杂交结构域；并且

ii.所述第二核酸以5’至3’方向包含：1.第二杂交结构域，其中，所述第二杂交结构域与所述第一杂交结构域实质上互补；以及2.第一条形码结构域，并且

其中，所述第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件；

b.使所述第一核酸与所述第二核酸光交联，从而形成探针-引物复合物；

c.任选地，使探针-引物复合物从所述靶核酸变性；

d.由所述探针-引物复合物合成记录核酸；以及

e.检测所述记录核酸。

43.如权利要求41或42所述的方法，其中，所述第二核酸在5'端进一步包含唯一分子标识符(UMI)序列。

44.如权利要求41-43中任一项所述的方法，其中，所述第二核酸在5'端进一步包含引物序列。

45.如权利要求41-44中任一项所述的方法，其中，所述检测包括对所述记录核酸进行测序、光学显微术、高通量扫描仪、共聚焦显微术、光片显微术、电子显微术、原子力显微术或肉眼。

46.如权利要求45所述的方法，所述方法进一步包括在测序之前切割、解交联、去除或逆转所述光交联，以及扩增所述记录核酸。

47.如权利要求46所述的方法，其中，所述切割、解交联、去除或逆转使用300-350nm波长的光，任选312nm波长的光。

48.一种检测靶mRNA的方法，所述方法包括：

a.使靶mRNA(第一核酸)与第二核酸杂交，并且其中，i.所述mRNA包含含有polyA序列的第一杂交结构域；并且ii.所述第二核酸以5'到3'方向包含：1.第二杂交结构域，其中，所述第二杂交结构域与所述mRNA的第一杂交结构域实质上互补，并且包含光反应元件；以及2.第一条形码结构域，以及

b.使所述mRNA与所述第二核酸光交联，从而形成第一复合物；

c.将第三核酸杂交至所述第一复合物中的第二核酸，从而形成探针-引物复合物，其中，所述第三核酸包含与所述第二核酸的第一条形码结构域实质上互补的第二条形码结构域；

d.由所述探针-引物复合物合成记录核酸；以及

e.检测所述记录核酸。

49.一种检测靶核酸的方法，所述方法包括：

a.使靶核酸与第一核酸杂交，并使第二核酸杂交至所述第一核酸，其中，i.所述第一核酸以5’至3’方向包含：1.任选的唯一分子标识符(UMI)序列；2.第一靶向结构域，其中，所述第一靶向结构域与所述靶核酸实质上互补；以及3.第一杂交结构域；并且

ii.所述第二核酸以5’至3’方向包含：1.第二杂交结构域，其中，所述第二杂交结构域与所述第一核酸的第一杂交结构域实质上互补；2.第一条形码结构域，并且

其中，所述第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件；以及

b.使所述第一核酸与所述第二核酸光交联，从而形成第一复合物；

c.任选地，使所述第一复合物从所述靶核酸变性；

d.使第三核酸杂交至所述第一复合物中的第二核酸，从而形成探针-引物复合物，其中，所述第三核酸包含与所述第二核酸的第一条形码结构域实质上互补的第二条形码结构域；

e.由所述探针-引物复合物合成记录核酸；以及

f.检测所述记录核酸。

50.如权利要求48或49所述的方法，其中，所述第三核酸在5'端进一步包含唯一分子标识符(UMI)序列。

51.如权利要求48-50中任一项所述的方法，其中，所述第三核酸在5'端进一步包含引物序列。

52.如权利要求48-51中任一项所述的方法，其中，所述检测包括对所述记录核酸进行测序、光学显微术、高通量扫描仪、共聚焦显微术、光片显微术、电子显微术、原子力显微术或肉眼。

53.如权利要求52所述的方法，所述方法进一步包括在测序之前扩增所述记录核酸。

54.一种检测靶核酸的方法，所述方法包括：

a.使靶核酸与第一核酸杂交，其中，i.所述第一核酸以5’至3’方向包含：1.任选的唯一分子标识符(UMI)序列；2.第一靶向结构域，其中，所述第一靶向结构域与所述靶核酸实质上互补；以及3.第一杂交结构域；

b.通过使n个额外的核酸杂交，并使所述额外的核酸与第一复合物光交联来制备多联体，其中，n为从1至100的整数，并且其中，各额外的核酸以5’至3’方向包含：i.第一杂交结构域；ii.条形码结构域；和iii.第二杂交结构域，并且

其中，第n个核酸的第一杂交结构域与第(n-1)个核酸的第二杂交结构域实质上互补，其中，n＝1核酸的第一杂交结构域与所述第一核酸的第一杂交结构域实质上互补，并且其中，各个核酸的第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件；

c.使第一帽核酸链与所述多联体杂交，从而形成加帽多联体，其中，所述第一帽核酸包含：i.第一帽杂交结构域，其中，所述第一帽杂交结构域与第n个核酸的第二杂交结构域实质上互补；以及ii.第二帽杂交结构域；

d.使第二帽核酸链杂交至所述加帽多联体，从而形成多联体-引物复合物，其中，所述第二帽核酸链以5'至3'方向包含：i.引物序列结构域；ii.任选的唯一分子标识符(UMI)序列；以及iii.杂交结构域，其中，所述杂交结构域与所述第一帽核酸的第二帽杂交结构域实质上互补；以及

e.检测所述多联体-引物复合物，或由所述多联体-引物复合物合成记录核酸并检测所述记录核酸。

55.如权利要求54所述的方法，其中，所述检测包括对所述记录核酸进行测序、光学显微术、高通量扫描仪、共聚焦显微术、光片显微术、电子显微术、原子力显微术或肉眼。

56.如权利要求55所述的方法，所述方法进一步包括在测序之前扩增所述记录核酸。

57.如权利要求41-54中任一项所述的方法，其中，所述光交联在水性溶液中进行。

58.如权利要求41-55中任一项所述的方法，其中，所述光交联使用350-400nm波长的光，任选365nm波长的光。

59.如权利要求41-58中任一项所述的方法，所述方法进一步包括一个或多个洗涤步骤。

60.如权利要求41-59中任一项所述的方法，其中，所述靶核酸与靶标结合配体缀合。

61.如权利要求60所述的方法，其中，所述靶标结合配体选自于由如下所组成的组：氨基酸、肽、蛋白质、单糖、二糖、三糖、寡糖、多糖、脂多糖、凝集素、核苷、核苷酸、核酸、维生素、类固醇、激素、辅因子、受体和受体配体，任选地，所述靶标结合配体为抗体或其抗原结合片段。

62.如权利要求41-61中任一项所述的方法，其中，所述靶核酸被包含在生物材料中。

63.如权利要求62所述的方法，其中，所述生物材料选自于由组织、细胞、类器官、经工程化的组织以及细胞外基质所组成的组。

64.如权利要求41-63中任一项所述的方法，其中，所述靶核酸被固定在底物表面上。

65.如权利要求41-64中任一项所述的方法，其中，所述靶核酸以预定图案固定在底物表面上。

66.如权利要求65所述的方法，其中，所述底物选自于由如下所组成的组：玻璃、透明聚合物、聚苯乙烯、水凝胶、金属、陶瓷、纸、琼脂糖、明胶、藻酸盐/酯、葡聚糖、氧化铁、不锈钢、氯化银、铜、金、聚碳酸酯、聚二甲基硅氧烷、聚乙烯、丙烯腈丁二烯苯乙烯、环烯烃聚合物、环烯烃共聚物、链霉亲和素、树脂以及生物材料。

67.如权利要求41-66中任一项所述的方法，其中，所述第一核酸在5'端进一步包含引物序列。

68.如权利要求41-67中任一项所述的方法，其中，各个结构域独立地包含1字母代码、2字母代码、3字母代码或4字母代码。

69.如权利要求41-68中任一项所述的方法，其中，各个结构域独立地包含零个或至少一个核酸修饰。

70.如权利要求69所述的方法，其中，所述核酸修饰选自于由核碱基修饰、糖修饰和核苷酸间连接修饰所组成的组。

71.如权利要求41-70中任一项所述的方法，其中，各个结构域的长度独立地为1-1000个核苷酸。

72.如权利要求41-71中任一项所述的方法，其中，核酸的UMI被并入同一核酸的探针结构域或条形码结构域中。

73.如权利要求41-72中任一项所述的方法，其中，所述核酸中的至少一个包含可切割的间隔区。

74.如权利要求73所述的方法，其中，所述可切割间隔区为光可切割间隔区。

75.如权利要求41-74中任一项所述的方法，其中，所述核酸中的至少一个包含可检测的标记。

76.如权利要求75所述的方法，其中，所述可检测的标记选自于由如下所组成的组：荧光分子、放射性同位素、核苷酸生色团、酶、酶底物、化学发光部分和生物发光部分、回波发生物质、非金属同位素、光学报告子、顺磁性金属离子和铁磁性金属；任选地，所述可检测的标记为荧光团。

77.如权利要求41-76中任一项所述的方法，其中，所述合成记录核酸包括使用链置换聚合酶。

78.如权利要求41-77中任一项所述的方法，所述方法进一步包括选择感兴趣的一个或多个特定区域用于光照或检测。

79.如权利要求78所述的方法，其中，所述选择一个或多个特定区域为手动或计算机辅助的。

80.如权利要求78或79所述的方法，其中，所述选择基于一种或多种表型标志物。

81.如权利要求80所述的方法，其中，所述一种或多种表型标志物为荧光、形状、强度、组织学染色、抗体染色或形态学。

82.如权利要求41-81中任一项所述的方法，所述方法进一步包括软件，所述软件自动检测感兴趣的一个或多个区域用于空间光照或检测。

83.一种用于对样品中的多个靶标进行线性、组合性或空间条形码化的方法，所述方法包括：

a.使所述多个靶标的各个成员中的靶核酸链与第一核酸链杂交，其中，所述靶核酸链在所述多个靶标的各个成员中不同，其中，所述靶核酸链被包含在另一核酸分子中，或者所述靶核酸链与所述多个靶标中的成员缀合，或者所述靶核酸链由细胞表达，或者所述靶核酸链通过化学交联、遗传编码、病毒转导、转染、缀合、细胞融合、细胞摄取、杂交、DNA结合蛋白或靶标结合剂/配体而直接或间接呈现在靶标或细胞上，并且其中，

i.所述第一核酸链以5'至3'方向包含：1.任选的唯一分子标识符(UMI)序列；2.第一靶向结构域，其中，所述第一靶向结构域与所述靶核酸实质上互补；以及3.第一杂交结构域；

b.通过以逐步方式使一个或多个额外的核酸链杂交，并将所述额外的核酸链与第一复合物光交联来制备多联体，其中，所述光交联包括选择样品的预定区域，并在使各额外的核酸链杂交后将所述预定区域暴露于光，由此使互补的杂交结构域交联，并且在暴露于光之后且在使下一额外的核酸链杂交之前去除任何未交联的额外的核酸链，并且

其中，各额外的核酸链以5'至3'方向包含：i.第一杂交结构域；ii.条形码结构域；以及iii.第二杂交结构域，并且

其中，第n个额外的核酸链的第一杂交结构域与第(n-1)个额外的核酸链的第二杂交结构域实质上互补，其中，第一额外的核酸链的第一杂交结构域与所述第一核酸链的第一杂交结构域实质上互补，并且其中，各个核酸链的第一杂交结构域或第二杂交结构域中的至少一个包含光反应元件；以及

c.检测所述多联体和/或由所述多联体合成记录核酸并检测所述记录核酸。

84.如权利要求83所述的方法，其中，多个靶标中的至少一个成员被包含在另一核酸分子内。

85.如权利要求83或84所述的方法，其中，多个靶标中的至少一个成员被包含在另一核酸分子内，所述另一核酸分子独立地选自于由如下所组成的组：RNA、RNA转录物、基因组DNA、核酸扩增产物及它们的任意组合。

86.如权利要求83-85中任一项所述的方法，其中，多个靶标中的至少一个成员为cDNA。

87.如权利要求83-86中任一项所述的方法，其中，多个靶标中的至少一个成员为缀合至所述靶核酸链的非核酸分子。

88.如权利要求83-87中任一项所述的方法，其中，多个靶标中的至少一个成员为通过连接至所述靶核酸链的靶标结合剂而缀合至所述靶核酸链的非核酸分子。

89.如权利要求83-88中任一项所述的方法，其中，所述靶标结合剂/配体选自于由如下所组成的组：氨基酸、肽、蛋白质、单糖、二糖、三糖、寡糖、多糖、脂多糖、凝集素、核苷、核苷酸、核酸、维生素、类固醇、激素、辅因子、受体和受体配体；任选地，所述靶标结合剂为抗体或其抗原结合片段。

90.如权利要求83-89中任一项所述的方法，其中，所述多个靶标中的至少一个成员为核酸，并且所述多个靶标中的至少一个成员为非核酸分子。

91.如权利要求83-90中任一项所述的方法，其中，多个靶标中的至少一个成员为蛋白。

92.如权利要求83-91中任一项所述的方法，其中，所述样品为生物材料。

93.如权利要求83-92中任一项所述的方法，其中，所述样品为选自于由组织、细胞、类器官、经工程化的组织以及细胞外基质所组成的组中的生物材料。

94.如权利要求83-92中任一项所述的方法，其中，所述样品选自于由完整组织、组织区域、细胞集合、单细胞、亚细胞区域及它们的任意组合所组成的组。

95.如权利要求83-94中任一项所述的方法，其中，所述光反应元件为CNVK。

96.如权利要求83-95中任一项所述的方法，其中，所述光反应元件抑制或阻断聚合酶的活性；任选地，所述聚合酶为链置换聚合酶。

97.如权利要求83-96中任一项所述的方法，其中，所述方法包括通过成像方法检测所述多联体和/或记录链，并且对所述记录核酸进行测序，用于对所述样品的预限定区域进行多模式整合分析。

98.如权利要求83-97中任一项所述的方法，其中，所述方法包括通过成像方法检测所述多联体和/或记录链，并对所述记录核酸进行测序，用以将所述记录链的序列关联至空间位置，用于对所述样品的预限定区域进行多模式整合分析。

99.如权利要求83-98中任一项所述的方法，其中，所述检测包括对所述记录核酸进行测序、光学显微术、高通量扫描仪、共聚焦显微术、光片显微术、电子显微术、原子力显微术或肉眼。

100.如权利要求99所述的方法，所述方法进一步包括在测序之前扩增所述记录核酸。

101.如权利要求100所述的方法，所述方法进一步包括在测序之前切割、解交联、去除或逆转所述光交联并扩增所述记录核酸。

102.如权利要求83-101中任一项所述的方法，其中，所述光交联使用350-400nm波长的光，任选365nm波长的光。

103.如权利要求83-102中任一项所述的方法，其中，各个结构域独立地包含1字母代码、2字母代码、3字母代码或4字母代码。

104.如权利要求83-103中任一项所述的方法，其中，所述核酸链中的至少一个包含可检测的标记。

105.如权利要求104所述的方法，其中，所述可检测的标记选自于由如下所组成的组：荧光分子、放射性同位素、核苷酸生色团、酶、酶底物、化学发光部分和生物发光部分、回波发生物质、非金属同位素、光学报告子、顺磁性金属离子以及铁磁性金属；任选地，所述可检测的标记为荧光团。

106.如权利要求83-105中任一项所述的方法，其中，所述合成记录核酸包括使用链置换聚合酶。

107.如权利要求83-106中任一项所述的方法，其中，选择所述预定区域为手动的或计算机辅助的。

108.权利要求40-107中任一项所述的方法用于筛选治疗候选物库的用途，所述用途包括通过如权利要求40-107中任一项所述的方法对预限定区域进行成像和条形码化来鉴别一种或多种表型标志物。

109.权利要求108所述的用途，其中，所述一种或多种表型标志物为荧光、形状、强度、组织学染色、抗体染色或形态学。

110.权利要求40-107中任一项所述的方法用于如下的用途：候选物筛选的鉴别、药物靶标的鉴别、生物标志物的鉴别、谱分析、表型至基因型细胞状态的表征、新疾病模型的生成、细胞和疾病模型的表征、分化状态和细胞状态的表征、组织映射、多维分析、高内涵筛选、基于机器学习的聚类或分类、细胞疗法的开发、CAR-T疗法的开发、抗体筛选、个性化医疗、细胞富集以及它们的任何组合。

111.如权利要求108-110中任一项所述的用途，其中，所述候选物选自于由如下所组成的组：小分子药物、生物制品、治疗性核酸、基因或细胞疗法、siRNA、gRNA、肽、蛋白质、抗体、代谢物、激素以及DNA编码文库。

112.用于使用权利要求83-111中任一项所述的方法在体外、在体内、在原位或在整体上对生物分子进行条形码化的方法中的权利要求40所述的试剂盒。