CN117015617A - 基于探针的核酸和蛋白质分析 - Google Patents

基于探针的核酸和蛋白质分析 Download PDF

Info

Publication number
CN117015617A
CN117015617A CN202280020480.0A CN202280020480A CN117015617A CN 117015617 A CN117015617 A CN 117015617A CN 202280020480 A CN202280020480 A CN 202280020480A CN 117015617 A CN117015617 A CN 117015617A
Authority
CN
China
Prior art keywords
probe
sequence
molecule
nucleic acid
barcode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280020480.0A
Other languages
English (en)
Inventor
凯瑟琳·法伊弗
A·S·科韦
A·J·希尔
保罗·尤金·隆德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
10X Genomics Inc
Original Assignee
10X Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 10X Genomics Inc filed Critical 10X Genomics Inc
Priority claimed from PCT/US2022/017377 external-priority patent/WO2022182682A1/en
Publication of CN117015617A publication Critical patent/CN117015617A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文提供了用于处理来自样品的生物分子(例如,核酸分子、蛋白质)的系统和方法。用于处理生物分子的方法可以包括使探针分子与核酸分子(例如,核糖核酸(RNA)分子)的靶区域杂交,并为所述探针‑核酸分子复合物或其衍生物加条形码。这种方法可以包括进行核酸反应,例如延伸、变性和扩增。用于处理样品的方法可以包括使探针与(i)核酸分子(例如,RNA分子)的靶区域和(ii)特征结合基团的报告寡核苷酸杂交,并为所述探针缔合的分子加条形码。可以在一个分区诸如液滴或孔内执行本文所述的方法的一个或多个过程。

Description

基于探针的核酸和蛋白质分析
交叉引用
本申请要求2021年10月1日提交的美国临时专利申请号63/251,446、2021年8月20日提交的美国临时专利申请号63/235,487、2021年6月4日提交的美国临时专利申请号63/196,834和2021年2月23日提交的美国临时专利申请号63/152,709的权益,以上申请中的每一者均全文以引用方式并入本文。
背景技术
样品可以出于各种目的而进行处理,诸如鉴定样品内的某种类型的部分。样品可以是生物样品。可以处理生物样品,诸如以便检测疾病(例如,癌症)或鉴定特定物类。处理样品的方法有多种,诸如聚合酶链反应(PCR)和测序。
可以在各种反应环境(诸如分区)内处理生物样品。分区可以是孔或液滴。可以采用液滴或孔以使生物样品能够被单独地分隔和处理的方式处理生物样品。例如,此类液滴可以与其他液滴流体地隔离,从而实现液滴中的相应环境的准确控制。
可以对分区中的生物样品进行各种过程,诸如化学过程或物理过程。可以对分区中的样品进行加热或冷却或化学反应,以便产生可以定性或定量处理的物类。
可以探测和/或处理生物样品内的生物分子,诸如核酸和蛋白质,以用于定量或定性评估。
发明内容
本公开提供了用于样品处理和分析的方法。本文所提供的方法可以包括使探针与感兴趣的分子(例如,靶蛋白质、靶核酸分子)杂交,并处理探针-分子复合物。这种处理可以包括为探针、探针-分子复合物或分子加条形码,和/或进行核酸反应。探针可以包含核酸分子,并且进一步的处理可以包括延伸、变性和扩增过程,以提供包含与感兴趣的核酸分子(例如,靶核酸分子)的靶区域相同或基本相同或互补的序列的核酸分子。方法可以包括使第一探针和第二探针与核酸分子的第一靶区域和第二靶区域杂交,连接第一探针和第二探针以提供探针连接的核酸分子,以及为探针连接的核酸分子加条形码。方法可以包括使第一探针与核酸分子的第一靶区域杂交,为探针加条形码,以及使第二探针与核酸分子的第二靶区域杂交,以产生加有条形码的、探针连接的核酸分子。在一些方面,该方法可以包括使探针与附着于特征结合部分的核酸分子杂交,以提供探针结合部分复合物,并为探针加条形码。可以在一个分区(诸如液滴或孔)内执行本文所提供的方法的一个或多个过程。本公开的方法可用于例如分析物(诸如生物颗粒、核酸和蛋白质)的受控分析和处理。本文所述的一种或多种方法可以允许以更高的灵敏度进行基因组、转录组或外显子组谱分析。本公开的方法可用于检测变体并表征核酸分子,例如用于评估单核苷酸多态性(SNP)、选择性剪接、插入、缺失、V(D)J重排等。本公开的方法可用于核酸和蛋白质的多重分析,同时最小化试剂用量,例如通过减少用于分析的未被占据的分区的数量。
在一个方面,本文公开了一种用于多重核酸测定的方法,该方法包括:(a)在足以产生第一探针缔合的分子和第二探针缔合的分子的条件下,使细胞、细胞核或细胞珠粒与第一探针、第二探针和第三探针接触,其中细胞、细胞核或细胞珠粒包含(i)包含第一靶区域和第二靶区域的核酸分子以及(ii)偶联到特征结合基团的特征,其中特征结合基团包含(i)与特征缔合的报告寡核苷酸和(ii)特征探针结合序列,其中第一探针包含(i)与第一靶区域互补的第一探针序列和(ii)探针捕获序列,其中第二探针包含与第二靶区域互补的第二探针序列,其中第三探针包含(i)与特征探针结合序列互补的第三探针序列和(ii)探针捕获序列;(b)在第一组分区的第一分区中,在足以产生第一加有条形码的核酸分子和第二加有条形码的核酸分子的条件下,使第一探针缔合的分子和第二探针缔合的分子与探针结合分子和条形码分子接触,其中该条形码分子包含(i)为包含该条形码分子的多个条形码分子所共有的共同序列和(ii)为第一组分区的第一分区所共有的第一条形码序列,其中探针结合分子包含(i)与探针捕获序列互补的探针结合序列和(ii)与共同序列互补的条形码结合序列;以及(c)在第二组分区的第二分区中,(i)在足以产生第三加有条形码的核酸分子的条件下,使第一加有条形码的核酸分子或其衍生物与多个捕获分子中的第一捕获分子接触,以及(ii)在足以产生第四加有条形码的核酸分子的条件下,使第二加有条形码的核酸分子或其衍生物与多个捕获分子中的第二捕获分子接触,其中多个捕获分子包含第二条形码序列,其中第三加有条形码的核酸分子和第四加有条形码的分子中的每一者包含与第一条形码序列相对应的序列和与第二条形码序列相对应的序列。
在一些实施方案中,第一靶区域和第二靶区域位于核酸分子的同一条链上。在一些实施方案中,探针捕获序列为包括第一探针的多个第一探针所共有,其中第一组分区的一个或多个附加分区包括一个或多个附加探针缔合的核酸分子,其中一个或多个附加探针缔合的核酸分子中的每一者包含探针捕获序列。在一些实施方案中,第二探针包含与多个捕获分子的捕获序列互补的第二探针捕获序列,并且其中(c)包括使第二探针捕获序列与捕获序列杂交。在一些实施方案中,条形码分子包含与多个捕获分子的捕获序列互补的捕获结合序列,并且其中(c)包括使捕获结合序列与捕获序列杂交。在一些实施方案中,第一组分区是多个孔。在一些实施方案中,第二组分区是多个液滴。在一些实施方案中,第二组分区是多个孔。在一些实施方案中,多个捕获分子偶联到颗粒。在一些实施方案中,颗粒是珠粒。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,与凝胶珠粒偶联的多个捕获分子中的每个捕获分子包含第二条形码序列。在一些实施方案中,第二组分区的一个或多个附加分区包括多个凝胶珠粒中的一个或多个附加凝胶珠粒,并且其中第二条形码序列是多个凝胶珠粒中的该凝胶珠粒特有的。在一些实施方案中,多个捕获分子中的一个捕获分子包含多个捕获分子中的该捕获分子特有的第三条形码序列。在一些实施方案中,第二组分区的一个或多个附加分区包括一个或多个附加捕获分子,并且其中第二条形码序列是第二组分区中的第二分区特有的。在一些实施方案中,(a)包括使第一探针和第二探针分别与第一靶区域和第二靶区域杂交。在一些实施方案中,该方法还包括使第一探针缔合的分子经受足以产生探针连接的核酸分子的条件,该探针连接的核酸分子包含与第二探针连接的第一探针。在一些实施方案中,经由第一探针和第二探针的化学连接或酶促连接来产生探针连接的核酸分子。在一些实施方案中,化学连接或酶促连接在(b)之后发生。在一些实施方案中,第一靶区域和第二靶区域相邻。在一些实施方案中,第一靶区域和第二靶区域不相邻,并且该方法还包括(i)分别朝向第二靶区域或第一靶区域延伸分别退火到第一靶区域或第二靶区域的第一探针或第二探针,以产生延伸的探针,以及(ii)将延伸的探针分别连接到第二探针或第一探针。在一些实施方案中,(a)包括使第一探针和第二探针与细胞或细胞核内的核酸分子接触。在一些实施方案中,第一分区包括多个细胞、细胞珠粒或细胞核。在一些实施方案中,细胞或细胞核被透化。在一些实施方案中,细胞或细胞核被固定。在一些实施方案中,该方法还包括从细胞、细胞核或细胞珠粒中释放第一探针缔合的分子或其衍生物。在一些实施方案中,释放包括裂解细胞。在一些实施方案中,报告寡核苷酸包含特征探针结合序列。在一些实施方案中,该方法还包括在(b)之后和(c)之前,合并第一加有条形码的核酸分子、第二加有条形码的核酸分子、来自第一组分区的附加的第一加有条形码的核酸分子和来自第一组分区的附加的第二加有条形码的核酸分子。在一些实施方案中,该方法还包括在(c)之后和测序之前,合并第三加有条形码的核酸分子、第四加有条形码的核酸分子、来自第二组分区的附加的第三加有条形码的核酸分子和来自第二组分区的附加的第四加有条形码的核酸分子。在一些实施方案中,探针捕获序列为8至50bp。
在本公开的另一个方面,本文提供了一种方法,该方法包括:(a)使核酸分子与第一探针接触以产生探针缔合的核酸分子,其中核酸分子包含第一靶区域和不与第一靶区域相邻的第二靶区域,其中第一探针包含与第一靶区域互补的第一探针序列;(b)在足以产生延伸的探针分子的条件下延伸第一探针,该延伸的探针分子包含与第二靶区域互补的序列;(c)在多个分区中的一个分区中,在足以产生加有条形码的分子的条件下,提供延伸的探针分子、第二探针、条形码分子和探针结合分子,其中第二探针包含与第二靶区域相对应的第二探针序列,其中第一探针或第二探针包含探针捕获序列,其中条形码分子包含(i)条形码捕获序列和(ii)条形码序列,其中探针结合分子包含(i)与探针捕获序列互补的探针结合序列和(ii)与条形码捕获序列互补的条形码结合序列,其中加有条形码的分子包含与第一靶区域相对应的序列、与第二靶区域相对应的序列、与探针捕获序列相对应的序列和与条形码序列相对应的序列。
在一些实施方案中,(c)包括连接第二探针和条形码分子。在一些实施方案中,连接包括化学连接或酶促连接。在一些实施方案中,颗粒是珠粒。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,细胞或细胞核被透化。在一些实施方案中,细胞或细胞核被固定。在一些实施方案中,第一探针包含探针捕获序列。在一些实施方案中,该方法还包括在(b)之后,从核酸分子中释放延伸的探针分子。在一些实施方案中,释放包括使用核糖核酸酶释放核糖核酸(RNA)链。在一些实施方案中,释放包括热循环。在一些实施方案中,(c)包括(i)使第二探针的第二探针序列与第二靶区域的互补序列杂交,以及(ii)延伸第二探针。在一些实施方案中,在(c)中,条形码分子和探针结合分子作为预退火复合物提供,其中条形码捕获序列退火到预退火复合物中的条形码结合序列。在一些实施方案中,第一探针包含探针捕获序列,其中(c)包括(i)将探针结合序列和条形码结合序列分别退火到探针捕获序列和条形码捕获序列,(ii)连接条形码分子和延伸的探针分子以产生第一加有条形码的分子,以及(iii)将第二探针退火到第一加有条形码的分子并引发延伸反应以产生加有条形码的分子。在一些实施方案中,在分区外部执行(ii)和(iii)。在一些实施方案中,第二探针包含探针捕获序列,其中(c)包括(i)将第二探针退火到延伸的探针分子并引发延伸反应以产生延伸分子,(ii)将探针结合序列和条形码结合序列退火到探针捕获序列和条形码捕获序列,以及(iii)连接条形码分子和延伸分子。
在另一个方面,本文提供了一种分析样品的方法,该方法包括:(a)提供:(i)与样品的至少一部分结合的特征结合基团,其中特征结合基团包含报告寡核苷酸,其中报告寡核苷酸包含报告条形码序列、第一靶区域和第二靶区域,其中第一靶区域和第二靶区域设置在报告寡核苷酸的同一条链上;(ii)包含第一探针序列的第一探针,其中第一探针的第一探针序列与报告寡核苷酸的第一靶区域互补;以及(iii)包含第二探针序列的第二探针,其中第二探针的第二探针序列与报告寡核苷酸的第二靶区域互补;(b)使样品经受足以(i)使第一探针的第一探针序列与报告寡核苷酸的第一靶区域杂交并(ii)使第二探针的第二探针序列与报告寡核苷酸的第二靶区域杂交的条件,以产生探针缔合的报告寡核苷酸复合物;以及(c)使探针缔合的报告寡核苷酸复合物经受足以产生探针连接的核酸分子的条件,该探针连接的核酸分子包含与第二探针连接的第一探针。
在一些实施方案中,该方法还包括(d)将条形码分子附着到探针连接的核酸分子。在一些实施方案中,(d)发生在一个分区中。在一些实施方案中,分区是液滴或孔。在一些实施方案中,样品包含核酸分子,并且其中(d)还包括将附加条形码分子附着到核酸分子或其衍生物。在一些实施方案中,特征结合基团是抗体。在一些实施方案中,第一探针或第二探针包含附加探针序列。在一些实施方案中,该方法还包括将条形码序列附着到附加探针序列。在一些实施方案中,该方法还包括(d)提供条形码分子和探针结合分子,该探针结合分子包含(i)与附加探针序列互补的第一序列和(ii)与条形码分子的捕获序列互补的第二序列。在一些实施方案中,该方法还包括提供足以使第一序列与附加探针序列杂交并使第二序列与条形码分子的捕获序列杂交的条件,从而产生加有条形码的、探针缔合的复合物。在一些实施方案中,(d)发生在多个分区中的一个分区中。在一些实施方案中,该方法还包括将来自该分区的加有条形码的、探针缔合的复合物与来自多个分区中的其他分区的其他加有条形码的、探针缔合的复合物合并,以产生加有条形码的、探针缔合的复合物的合并组。在一些实施方案中,该方法还包括(i)将加有条形码的、探针缔合的复合物的合并组分隔到多个附加分区中,其中多个附加分区中的一个附加分区包括加有条形码的、探针缔合的复合物和具有附加条形码序列的附加条形码分子,以及(ii)将附加条形码分子附着到加有条形码的、探针缔合的复合物。在一些实施方案中,附加条形码分子偶联到珠粒。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,附加条形码分子可释放地偶联到珠粒。在一些实施方案中,(d)在(c)之前发生。在一些实施方案中,(d)在(c)之后发生。在一些实施方案中,样品的至少该部分包含该特征。在一些实施方案中,该特征是蛋白质。在一些实施方案中,蛋白质是细胞表面受体或细胞内蛋白质。在一些实施方案中,样品包含细胞或细胞珠粒。在一些实施方案中,细胞是福尔马林固定、石蜡包埋的细胞。在一些实施方案中,(c)发生在一个分区中。在一些实施方案中,分区是多个分区之一。在一些实施方案中,(c)包括酶促连接或化学连接。在一些实施方案中,在没有三磷酸腺苷的情况下执行连接。在一些实施方案中,第一探针或第二探针包含腺苷酸化末端、磷酸化末端、核糖核苷酸、双脱氧核苷酸或翘翼(flap)序列。在一些实施方案中,第一靶区域和第二靶区域由设置在第一靶区域和第二靶区域之间的间隙区域分开。在一些实施方案中,(c)包括进行延伸反应以填充间隙区域,从而产生探针连接的核酸分子。在一些实施方案中,(c)包括提供包含与间隙区域互补的第三探针序列的第三探针,使第三探针序列与间隙区域杂交,以及提供足以产生探针连接的核酸分子的条件,该探针连接的核酸分子包含经由第三探针来连接到第二探针的第一探针。
本公开的另一个方面提供了一种非暂时性计算机可读介质,该非暂时性计算机可读介质包含机器可执行代码,该机器可执行代码在由一个或多个计算机处理器执行时实现上文或本文别处的任何方法。
本公开的另一个方面提供了一种系统,该系统包括一个或多个计算机处理器和与之联接的计算机存储器。计算机存储器包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实现上文或本文中别处的任何方法。
通过以下详细描述,本公开的另外的方面和优点将对本领域技术人员变得显而易见,以下详细描述中仅示出和描述了本公开的说明性实施方案。如将认识到的,本公开能够具有其他和不同的实施方案,并且其若干细节能够在各种明显的方面进行修改,所有这些都不脱离本公开。因此,附图和说明书本质上被认为是说明性的,而不是限制性的。
以引用方式并入
本说明书中提到的所有出版物、专利和专利申请都以引用的方式并入本文,其程度与每个单独出版物、专利或专利申请特异性地且单独地指示以引用的方式并入相同。在以引用方式并入的出版物和专利或专利申请与本说明书中包含的公开内容相矛盾的情况下,本说明书旨在取代和/或优先于任何这样的矛盾资料。
附图说明
在所附权利要求中具体阐述了本发明的新颖特征。将通过参考以下阐述利用本发明的原理的说明性实施方案的详细描述以及附图(在本文中也称为“图”)来获得对本发明的特征和优点的更好理解,在附图中:
图1示出了用于分隔单独生物颗粒的微流体通道结构的实例。
图2示出了用于将珠粒受控分隔到离散液滴中的微流体通道结构的实例。
图3示出了携带条形码的珠粒的实例。
图4展示了携带条形码的珠粒的另一个实例。
图5示意性地示出了示例微孔阵列。
图6示意性地示出了用于处理核酸分子的示例工作流程。
图7示意性地示出了用于处理核酸分子的另一示例工作流程。
图8示意性地示出了用于处理核酸分子的另一示例工作流程。
图9示意性地示出了用于处理核酸分子的另一示例工作流程。
图10示意性地示出了用于分析细胞、细胞核或细胞珠粒的示例工作流程。
图11示意性地示出了附着有核酸分子的示例标记剂。
图12A示意性地示出了标记剂的实例。图12B示意性地示出了用于处理核酸分子的另一示例工作流程。图12C示意性地示出了用于处理核酸分子的另一示例工作流程。
图13示意性地示出了携带条形码的珠粒的另一个实例。
图14示出了计算机系统,该计算机系统被编程或以其他方式配置为实现本文所提供的方法。
图15示出了本文所述的示例经处理的核酸分子。
图16A示出了用于在一个分区中处理多种分析物的示例工作流程。图16B示出了用于在一个分区中处理多种分析物的另一示例工作流程。
图17示意性地示出了本文所述的特征结合基团。
图18示出了来自本文所述的工作流程的示例数据。
图19示出了来自本文所述的工作流程的附加示例数据。
图20示出了来自本文所述的工作流程的附加示例数据。
图21A示出了比较固定细胞和非固定细胞的示例数据。图21B示出了比较固定细胞和非固定细胞的附加示例数据。图21C示出了比较固定细胞和非固定细胞的附加示例数据。
图22示意性地示出了用于测定两种不同分析物类型的示例工作流程。
图23示出了本文所述的加条形码方法的示例数据。
图24示出了使用本文所述的加条形码方法得出的不同分析物类型的示例数据。
图25示意性地示出了用于处理核酸分子的示例方法。
图26示出了用于处理核酸分子的另一示例方法。
图27示出了用于产生探针连接的核酸分子的示例工作流程。
图28示出了用于产生探针连接的核酸分子的另一示例工作流程。
图29示出了用于根据本文所述的方法处理细胞的示例工作流程。
图30A示出了使用不同样品制备参数为多种分析物加条形码所得到的示例蛋白质表达数据。图30B示出了使用不同样品制备参数为多种分析物加条形码所得到的附加蛋白质表达数据。
图31示出了使用不同样品制备参数为多种分析物加条形码所得到的示例基因表达数据。
图32A-C示出了阴性对照组的多分析物探测的示例数据。图32A示出了显示不同免疫细胞团的示例数据。图32B示出了GZMB基因的基因表达的示例数据。图32C示出了由抗体染色得到的蛋白质表达的示例数据。
图33A-C示出了实验组的多分析物探测的示例数据。图33A示出了显示不同免疫细胞团的示例数据。图33B示出了GZMB基因的基因表达的示例数据。图33C示出了由抗体染色得到的蛋白质表达的示例数据。
图34A-C示出了实验组的多分析物探测的示例数据。图34A示出了显示不同免疫细胞团的示例数据。图34B示出了GZMB基因的基因表达的示例数据。图34C示出了由抗体染色得到的蛋白质表达的示例数据。
图35A-C示出了实验组的多分析物探测的示例数据。图35A示出了显示不同免疫细胞团的示例数据。图35B示出了GZMB基因的基因表达的示例数据。图35C示出了由抗体染色得到的蛋白质表达的示例数据。
图36A-C示出了实验组的多分析物探测的示例数据。图35A示出了显示不同免疫细胞团的示例数据。图36B示出了GZMB基因的基因表达的示例数据。图36C示出了由抗体染色得到的蛋白质表达的示例数据。
图37A-C示出了实验组的多分析物探测的示例数据。图37A示出了显示不同免疫细胞团的示例数据。图37B示出了GZMB基因的基因表达的示例数据。图37C示出了由抗体染色得到的蛋白质表达的示例数据。
图38示出了用于测定两种不同分析物类型的另一示例工作流程。
具体实施方式
虽然本文已经示出和描述了本发明的各种实施方案,但是对于本领域技术人员显而易见的是,这些实施方案仅作为实例来提供。在不脱离本发明的情况下,本领域技术人员可以想到许多变型、变化和替代。应当理解,可以采用本文所述的本发明的实施方案的各种替代形式。
在值被描述为范围的情况下,应当理解,此类公开内容包括此类范围内的所有可能子范围的公开内容,以及落入此类范围内的具体数值,而不论具体数值或具体子范围是否被明确陈述。
除非上下文另有明确规定,否则本文所使用的术语“一个”、“一种”和“该”一般是指单数和复数引用。
每当术语“至少”、“大于”或“大于或等于”在一系列两个或更多个数值中的第一个数值之前时,术语“至少”、“大于”或“大于或等于”适用于该系列数值中的每个数值。例如,大于或等于1、2或3相当于大于或等于1、大于或等于2或者大于或等于3。
每当术语“不大于”、“小于”或“小于或等于”在一系列两个或更多个数值中的第一个数值之前时,术语“不大于”、“小于”或“小于或等于”适用于该系列数值中的每个数值。例如,小于或等于3、2或1相当于小于或等于3、小于或等于2或者小于或等于1。
如本文所用,术语“条形码”一般是指传达或能够传达关于分析物的信息的标签或标识符。条形码可以是分析物的部分。条形码可以独立于分析物。条形码可以是附着到分析物(例如,核酸分子)的标签或该标签加上分析物的内在特性(例如,分析物或末端序列的大小)的组合。条形码可以是独特的。条形码可以具有多种不同的形式。例如,条形码可以包括:多核苷酸条形码;随机核酸和/或氨基酸序列;以及合成核酸和/或氨基酸序列。条形码能够以可逆或不可逆方式附着到分析物。条形码可以在样品测序之前、期间和/或之后加入例如脱氧核糖核酸(DNA)或核糖核酸(RNA)样品的片段中。条形码可以允许鉴定和/或定量单独测序读段。
如本文所用,术语“实时”可以指小于约1秒、十分之一秒、百分之一秒、一毫秒或更小的响应时间。响应时间可以大于1秒。在一些情况下,实时可以指同时或基本上同时的处理、检测或鉴定。
如本文所用,术语“受试者”一般是指动物诸如哺乳动物(例如,人类、小鼠、大鼠)或禽(例如,鸟),或其他生物体诸如植物。例如,受试者可以是脊椎动物,诸如哺乳动物、啮齿动物(例如,小鼠)、灵长类动物、猿或人类。动物可以包括但不限于农场动物、运动动物和宠物。受试者可以是健康或无症状的个体、患有或疑似患有疾病(例如,癌症)或易患该疾病的个体和/或需要治疗或疑似需要治疗的个体。受试者可以是患者。受试者可以是微生物体或微生物(例如,细菌、真菌、古生菌、病毒)。
如本文所用,术语“基因组”一般是指来自受试者的基因组信息,该基因组信息可以是例如受试者的遗传信息的至少一部分或全部。基因组可以在DNA中或RNA中编码。基因组可以包含(例如,编码蛋白质的)编码区以及非编码区。基因组可以包含生物体中所有染色体一起的序列。例如,人类基因组通常具有总共46个染色体。所有这些染色体一起的序列可以构成人类基因组。
术语“衔接物”、“衔接子”和“标签”可以同义地使用。可以通过任何方法(包括连接、杂交或其他方法)将衔接物或标签偶联至要“标记”的多核苷酸序列。
如本文所用,术语“测序”一般是指用于确定一个或多个多核苷酸中的核苷酸碱基的序列的方法和技术。这些多核苷酸可以是例如核酸分子,诸如脱氧核糖核酸(DNA)或核糖核酸(RNA),包括其变体或衍生物(例如,单链DNA)。测序可以由当前可用的各种系统执行,诸如但不限于Pacific Biosciences/>Oxford/>或LifeTechnologies/> 生产的测序系统。另选地或此外,测序可以使用核酸扩增、聚合酶链反应(PCR)(例如,数字PCR、定量PCR或实时PCR)或等温扩增来执行。此类系统可以提供与受试者(例如,人类)的遗传信息相对应的多个原始遗传数据,如这些系统从受试者提供的样品所产生的。在一些实例中,此类系统提供测序读段(本文也称为“读段”)。读段可以包括与已被测序的核酸分子的序列相对应的一连串核酸碱基。在一些情况下,本文所提供的系统和方法可以与蛋白质组信息一起使用。
如本文所用,术语“珠粒”一般是指颗粒。珠粒可以是固体或半固体颗粒。珠粒可以是凝胶珠粒。凝胶珠粒可以包括聚合物基质(例如,通过聚合或交联形成的基质)。聚合物基质可以包括一种或多种聚合物(例如,具有不同官能团或重复单元的聚合物)。聚合物基质中的聚合物可以是随机排列的,例如在随机共聚物中,和/或具有有序结构,例如在嵌段共聚物中。交联可以经由共价、离子或诱导相互作用或者物理缠结。珠粒可以是大分子。珠粒可以由结合在一起的核酸分子形成。珠粒可以经由分子(例如,大分子)诸如单体或聚合物的共价或非共价组装形成。此类聚合物或单体可以是天然的或合成的。此类聚合物或单体可以是或包括例如核酸分子(例如,DNA或RNA)。珠粒可以由聚合物材料形成。珠粒可以是磁性的或非磁性的。珠粒可以是刚性的。珠粒可以是柔性的和/或可压缩的。珠粒可以是可破坏的或可溶解的。珠粒可以是覆盖有包含一种或多种聚合物的涂层的固体颗粒(例如,基于金属的颗粒,包括但不限于氧化铁、金或银)。此类涂层可以是可破坏的或可溶解的。
如本文所用,术语“加有条形码的核酸分子”通常是指由例如用核酸序列(例如,与核酸条形码分子所包含的核酸引物序列互补的核酸序列)处理核酸条形码分子而产生的核酸分子。核酸序列可以是靶向序列或非靶向序列。例如,在本文所述的方法和系统中,细胞或细胞核的核酸分子(例如,信使RNA(mRNA)分子)与核酸条形码分子(例如,含有条形码序列和与mRNA分子的核酸序列互补的核酸引物序列的核酸条形码分子)杂交和逆转录产生具有对应于mRNA的核酸序列的序列和条形码序列(或其反向互补序列)的加有条形码的核酸分子。加有条形码的核酸分子可以充当模板,诸如模板多核苷酸,其可以被进一步处理(例如,扩增)和测序以获得靶核酸序列。例如,在本文所述的方法和系统中,可以进一步对加有条形码的核酸分子进行处理(例如,扩增)和测序以获得mRNA的核酸序列。
如本文所用,术语“样品”一般是指受试者的生物样品。生物样品可以包含任何数量的大分子,例如细胞大分子。样品可以是细胞样品。样品可以是细胞系或细胞培养样品。样品可以包含一个或多个细胞或细胞核。样品可以包含一种或多种微生物。生物样品可以是核酸样品或蛋白质样品。生物样品也可以是碳水化合物样品或脂质样品。生物样品可以来源另一种样品。样品可以是组织样品,诸如活检样品、芯针活检样品、针抽吸物或细针抽吸物。组织样品可以是新鲜组织样品、冷冻组织样品(例如,快速冷冻、冻干、冷冻切片等),或者固定的组织样品(例如,福尔马林固定石蜡包埋的组织样品)。样品可以是流体样品,诸如血液样品、尿液样品或唾液样品。样品可以是皮肤样品。样品可以是颊拭子。样品可以是血浆或血清样品。样品可以是无细胞样品或不含细胞的样品。无细胞样品可以包含细胞外多核苷酸。可以从身体样品分离细胞外多核苷酸,该身体样品可以选自由血液、血浆、血清、尿液、唾液、粘膜分泌物、痰、粪便和泪液组成的组。
如本文所用,术语“生物颗粒”一般是指来源于生物样品的离散生物系统。生物颗粒可以是大分子。生物颗粒可以是小分子。生物颗粒可以是病毒。生物颗粒可以是细胞或细胞的衍生物。生物颗粒可以是细胞器。来自细胞的细胞器的实例包括但不限于细胞核、核糖体、高尔基氏体、内质网、叶绿体、胞吞囊泡、胞吐囊泡、液泡和溶酶体。生物颗粒可以是来自细胞群体的稀有细胞。生物颗粒可以是任何类型的细胞,包括但不限于原核细胞、真核细胞、细菌、真菌、植物、哺乳动物或其他动物细胞类型、支原体、正常组织细胞、肿瘤细胞或无论从单细胞生物体还是多细胞生物体衍生的任何其他细胞类型。生物颗粒可以是细胞的成分。生物颗粒可以是或可以包括DNA、RNA、细胞器、蛋白质或它们的任何组合。生物颗粒可以是或可以包括基质(例如,凝胶或聚合物基质),该基质包含细胞或来自细胞的一种或多种成分(例如,细胞珠粒),诸如来自细胞的DNA、RNA、细胞器、蛋白质或它们的任何组合。生物颗粒可以从受试者(例如,人类、小鼠、大鼠或其他哺乳动物)的组织中获得。生物颗粒可以是硬化的细胞。此类硬化的细胞可以包括或可以不包括细胞壁或细胞膜。生物颗粒可以包括细胞的一种或多种成分,但是可以不包括细胞的其他成分。此类成分的实例是细胞核或细胞器。细胞可以是活细胞。活细胞可以是能够被培养的,例如,当被封闭在凝胶或聚合物基质中时被培养,或者当包含凝胶或聚合物基质时被培养。
如本文所用,术语“大分子成分”一般是指包含在生物颗粒内或来自生物颗粒的大分子。大分子成分可以包含核酸。在一些情况下,生物颗粒可以是大分子。大分子成分可以包含DNA。大分子成分可以包含RNA。RNA可以是编码的或非编码的。RNA可以是例如信使RNA(mRNA)、核糖体RNA(rRNA)或转运RNA(tRNA)。RNA可以是转录物。RNA可以是长度小于200个核酸碱基的小RNA,或长度大于200个核酸碱基的大RNA。小RNA可以包括5.8S核糖体RNA(rRNA)、5S rRNA、转运RNA(tRNA)、微RNA(miRNA)、小干扰RNA(siRNA)、小核仁RNA(snoRNA)、与Piwi蛋白相互作用的RNA(piRNA)、tRNA衍生的小RNA(tsRNA)和小rDNA衍生的RNA(srRNA)。RNA可以是双链RNA或单链RNA。RNA可以是环状RNA。大分子成分可以包含蛋白质。大分子成分可以包含肽。大分子成分可以包含多肽。
如本文所用,术语“分子标签”一般是指能够结合于大分子成分的分子。分子标签可以以高亲和力结合于大分子成分。分子标签可以以高特异性结合于大分子成分。分子标签可以包含核苷酸序列。分子标签可以包含核酸序列。核酸序列可以是分子标签的至少一部分或全部。分子标签可以是核酸分子或可以是核酸分子的一部分。分子标签可以是寡核苷酸或多肽。分子标签可以包含DNA适体。分子标签可以是或包含引物。分子标签可以是或包含蛋白质。分子标签可以包含多肽。分子标签可以是条形码。
如本文所用,术语“分区”一般是指可以适合于包含一种或多种物类或进行一种或多种反应的空间或体积。分区可以是物理隔室,诸如液滴或孔。分区可以将空间或体积与另一个空间或体积隔离。液滴可以是与第一相不混溶的第二相(例如油)中的第一相(例如水相)。液滴可以是不与第一相相分离的第二相中的第一相,例如水相中的胶囊或脂质体。分区可以包括一个或多个其他(内部)分区。在一些情况下,分区可以是虚拟隔室,其可以由跨越多个和/或远程物理隔室的索引(例如,索引文库)定义且鉴定。例如,物理隔室可以包括多个虚拟隔室。
本文提供了用于样品处理和/或分析的方法。本公开的方法可以包括为一种或多种类型的生物分子(例如,核酸分子、蛋白质、脂质、碳水化合物或它们的组合)加条形码。生物分子可以是例如核酸分子(例如,核糖核酸(RNA)分子)或蛋白质。这种方法可以涉及将一个或多个探针(例如,核酸探针)附着到生物分子,随后将包含条形码序列的核酸条形码分子附着到一个或多个探针。例如,核酸条形码分子可以附着到探针的突出端序列或探针的末端。从探针的一端延伸到核酸条形码分子的一端可以形成延伸的核酸分子,该延伸的核酸分子包含与条形码序列互补的序列和与核酸分子的靶区域互补的序列。然后延伸的核酸分子可以从核酸条形码分子变性,并且核酸分子可以被复制。可以在一个分区(诸如液滴或孔)内进行该方法的一个或多个过程。
本公开还提供了一种处理样品(例如,细胞样品或组织样品)的方法,该方法提供了附着有连接的探针分子的加有条形码的核酸分子。该方法可以包括提供包含具有第一靶区域和第二靶区域的核酸分子(例如,RNA分子)的样品;具有(i)与第一靶区域互补的第一探针序列和(ii)附加探针序列的第一探针;以及具有与第二靶区域互补的第二探针序列的第二探针。在一些情况下,第一靶区域和第二靶区域相邻。第一探针序列和第二探针序列还可以分别包含第一反应性部分和第二反应性部分。在第一探针的第一探针序列与核酸分子的第一靶区域杂交以及第二探针的第二探针序列与核酸分子的第二靶区域杂交时,反应性部分可以彼此相邻。在充分条件下相邻反应性部分之间的后续反应可以连接第一探针和第二探针以产生探针连接的核酸分子。探针连接的核酸分子(probe-linked nucleic acidmolecule)也可以称为探针接合的核酸分子(probe-ligated nucleic acid molecule)。在其他情况下,第一靶区域和第二靶区域不相邻,并且可以进行核酸反应(例如,核酸延伸反应、间隙填充反应)以产生探针连接的核酸分子。
可以用核酸条形码分子的条形码序列为探针连接的核酸分子加条形码,以提供加有条形码的、探针连接的核酸分子。加条形码可以通过使核酸条形码分子的结合序列与探针连接的核酸分子的第一探针的附加探针序列杂交来实现。加有条形码的、探针连接的核酸分子可以经受扩增反应,以产生包含第一靶区域和第二靶区域以及条形码序列或与这些序列互补的序列的扩增产物。因此,该方法可以在不使用逆转录的情况下提供扩增产物。可以在一个分区(诸如液滴或孔)内执行一个或多个过程。
本公开还提供了一种产生加有条形码的、探针连接的核酸分子的方法。该方法可以包括提供包含具有第一靶区域和第二靶区域的核酸分子(例如,RNA分子)的样品;具有与第一靶区域互补的第一探针序列和任选附加探针序列的第一探针;以及具有与第二靶区域互补的第二探针序列的第二探针。第一探针的附加探针序列可以包含探针捕获序列。另选地或此外,第二探针可以包含探针捕获序列。第一探针的第一探针序列可以与核酸分子的第一靶区域杂交,产生探针缔合的核酸分子,并且可以进行核酸反应(例如,使用聚合酶或逆转录酶的核酸延伸反应)以产生延伸的核酸分子,该延伸的核酸分子包含与第二靶区域互补的序列。在核酸延伸反应之前、期间或之后,第二探针可以与核酸分子(或延伸的核酸分子或其互补序列)杂交,并且任选地,可以进行核酸延伸反应。可以为延伸的核酸分子加条形码,诸如通过(a)核酸条形码分子的条形码结合序列与第一探针(例如,第一探针的附加探针序列)或第二探针(例如,第二探针的探针捕获序列)的杂交,或(b)经由探针结合分子(本文也称为“夹板分子”或“夹板寡核苷酸”),其中探针结合分子包含(i)与第一探针的附加探针序列(其可以包含探针捕获序列)和/或第二探针的捕获序列互补的探针结合序列,以及(ii)与条形码分子的序列(例如,共同序列)互补的条形码结合序列。在一些情况下,可以在第二探针与第二靶区域杂交之前进行加条形码。在此类情况下,加有条形码的核酸分子可以经受足以使第二探针的第二探针序列与核酸分子(或加有条形码的核酸分子)的第二靶区域杂交的条件。可以进行核酸反应(例如,核酸延伸),从而产生加有条形码的、探针连接的核酸分子。
本公开的另一个方面提供了一种为多种分析物加条形码的方法,该多种分析物诸如为本文所述的探针连接的核酸分子,以及其他类型的生物分子(例如,蛋白质)。该方法可以包括提供(i)包含具有第一靶区域和第二靶区域的核酸分子(例如,RNA分子)的样品,以及(ii)包含具有捕获序列的报告寡核苷酸的特征结合部分;(iii)具有与第一靶区域互补的第一探针序列和附加探针序列的第一探针;(iv)具有与第二靶区域互补的第二探针序列的第二探针;以及(v)具有与报告寡核苷酸的序列互补的第三探针序列的第三探针。第一探针和第二探针可以经受足以分别与第一靶区域和第二靶区域杂交并产生探针连接的核酸分子的条件。第三探针的第三探针序列可以经受足以与报告寡核苷酸的捕获序列杂交的条件,从而产生探针结合部分复合物。探针连接的核酸分子和探针结合部分复合物可以经受足以加条形码的条件,从而产生加有条形码的、探针连接的核酸分子和加有条形码的探针结合部分复合物。加有条形码的、探针连接的分子可以经受扩增反应,以产生包含第一靶区域和第二靶区域以及条形码序列或与这些序列互补的序列的扩增产物。加有条形码的探针结合部分复合物可以类似地经受扩增反应,以产生包含第四探针序列和条形码序列的扩增产物。可以在一个细胞珠粒和/或一个分区(诸如液滴或孔)内执行一个或多个过程。有利的是,本文所述的方法可用于将细胞、细胞核或细胞珠粒索引至分区;这种索引可用于被超过一个细胞占据的分区中,并且识别分析物所源自的细胞、细胞核、细胞珠粒或分区。
固定的样品
样品可以是固定的样品。例如,样品可以包括多个固定的样品,诸如多个固定的细胞或固定的细胞核。另选地或此外,样品可以包括固定的组织。细胞或细胞成分或包含多个细胞或细胞核的组织的固定可以包括化学物类或化学刺激的施加。如本文中关于生物样品所使用的术语“固定的”通常是指防止腐烂和/或降解的状态。“固定”通常是指产生固定的样品的过程,并且在一些情况下可以包括使生物样品内的生物分子与固定剂(或固定试剂)接触一定时间量,由此固定剂引起样品中生物分子之间的共价键相互作用,诸如交联。“固定的生物样品”通常可以指已与固定试剂或固定剂接触的生物样品。例如,甲醛固定的生物样品已与固定试剂甲醛接触。“固定的细胞”、“固定的细胞核”或“固定的组织”是指已在足以允许或引起生物样品中生物分子之间形成分子内和分子间共价交联的条件下与固定剂接触的细胞/细胞核或组织。通常,生物样品(例如,细胞或细胞核)与固定试剂(例如,多聚甲醛或PFA)的接触引起生物样品中生物分子之间形成分子内和分子间共价交联。在一些情况下,固定试剂甲醛可以产生RNA、DNA和/或蛋白质分子内的共价缩醛胺交联。例如,广泛使用的固定试剂多聚甲醛或PFA通过催化蛋白质中碱性氨基酸(诸如赖氨酸和谷氨酰胺)之间的交联形成来固定组织样品。蛋白质中可以形成分子内和分子间交联。这些交联可以保存蛋白质的二级结构,也可以消除保存的组织样品中的酶活性。固定试剂的实例包括但不限于醛固定剂(例如,甲醛,通常也称为“多聚甲醛”、“PFA”和“福尔马林”;戊二醛;等等)、酰亚胺酯、NHS(N-羟基琥珀酰亚胺)酯等。
在一些实施方案中,可用于固定样品的固定剂或固定试剂是甲醛。术语“甲醛”在固定剂的上下文中使用时,也可以指“多聚甲醛”(或“PFA”)和“福尔马林”,这两个术语都具有与甲醛组合物相关的特定含义(例如,福尔马林是甲醛和甲醇的混合物)。因此,甲醛固定的生物样品也可以称为福尔马林固定的或PFA固定的。使用甲醛作为固定试剂来制备固定的生物样品的方案和方法是本领域熟知的并且可用于本公开的方法和组合物中。例如,用于制备固定的生物样品的甲醛浓度的合适范围是0.1%-10%、1%-8%、1%-4%、1%-2%、3%-5%或3.5%-4.5%。在本公开的一些实施方案中,使用1%甲醛、4%甲醛或10%甲醛的最终浓度来固定生物样品。通常,甲醛是从更浓的储备溶液稀释而来的,例如35%、25%、15%、10%、5%的PFA储备溶液。
固定剂的其他实例包括例如有机溶剂,诸如醇类(例如,甲醇或乙醇)、酮类(例如,丙酮)和醛类(例如,多聚甲醛、甲醛(例如,福尔马林)或戊二醛)。如本文所述,交联剂也可以用于固定,包括但不限于双琥珀酰亚胺辛二酸酯(DSS)、二甲基辛二酰亚胺酯(DMS)、福尔马林和二甲基己二酰亚胺酯(DMA)、二硫代-双(琥珀酰亚胺丙酸酯)(DSP)、二琥珀酰亚胺酒石酸酯(DST)和乙二醇双(琥珀酰亚胺琥珀酸酯)(EGS)。在一些情况下,交联剂可以是可裂解的交联剂(例如,可热裂解的、可光裂解的等)。
在一些情况下,当制备固定的生物样品时,可以组合使用超过一种固定试剂。例如,第一固定剂(诸如有机溶剂)可以与第二固定剂(诸如交联剂)组合使用。有机溶剂可以是醇(例如,乙醇或甲醇)、酮(例如,丙酮)或醛(例如,多聚甲醛、甲醛或戊二醛)。交联剂可以选自由双琥珀酰亚胺辛二酸酯(DSS)、二甲基辛二酰亚胺酯(DMS)、福尔马林和二甲基己二酰亚胺酯(DMA)、二硫代-双(琥珀酰亚胺丙酸酯)(DSP)、二琥珀酰亚胺酒石酸酯(DST)和乙二醇双(琥珀酰亚胺琥珀酸酯)(EGS)组成的组。在一些情况下,可以向细胞或细胞核提供第一固定剂或使第一固定剂与细胞或细胞核接触,以引起细胞/细胞核的第一特性或特性组的变化,并且可以向细胞或细胞核提供固定剂或使固定剂与细胞或细胞核接触,以引起细胞或细胞核的第二特性或特性组的变化。例如,可以向细胞或细胞核提供第一固定剂或使第一固定剂与细胞或细胞核接触,以引起细胞尺寸的变化(例如,横截面直径的减小,参见例如美国专利公开号2020/0033237,其全文以引用方式并入本文),并且可以向细胞或细胞核提供第二固定剂或使第二固定剂与细胞或细胞核接触,以引起细胞的第二特性或特性组的变化(例如,在细胞或细胞核内和/或周围形成交联)。可以在相同或不同的时间向细胞或细胞核提供第一固定剂和第二固定剂或使第一固定剂和第二固定剂与细胞或细胞核接触。其他合适的固定剂包括在例如国际PCT申请号PCT/US2020/066705中公开的那些,其全文以引用方式并入本文。
在一个实例中,可以向细胞提供为有机溶剂的第一固定剂以改变第一特性(例如,细胞大小),并且可以向细胞提供为交联剂的第二固定剂以改变第二特性(例如,细胞流动性或刚性)。可以在第二固定剂之前向细胞提供第一固定剂。
在另一个实施方案中,生物分子(例如生物样品,诸如组织标本)与含有甲醛和戊二醛的固定试剂接触,因此接触的生物分子可以包括由甲醛诱导的固定和戊二醛诱导的固定产生的固定交联。通常,用作固定试剂的戊二醛的合适浓度可以是0.1%至1%。固定和洗涤试剂也可以包括可商购获得的产品,例如固定缓冲液(420801)和透化洗涤缓冲液(421002)。
细胞或细胞成分的特性或一组特性的变化(例如,在与一种或多种固定剂相互作用时引起的)可以是至少部分可逆的(例如,经由再水合或去交联)。另选地,细胞或细胞成分的特性或一组特性的变化(例如,在与一种或多种固定剂相互作用时引起的)可能基本上是不可逆的。
样品(例如,细胞样品)可以在任何有用的时间点经受固定过程。例如,样品的细胞、细胞核和/或细胞/细胞核成分可以在任何后续处理(诸如用于储存)开始之前经受涉及一种或多种固定剂(例如,如本文所述)的固定过程。在储存前经受固定过程的细胞、细胞核和/或细胞/细胞核成分(诸如组织样品的细胞、细胞核和/或细胞/细胞核成分)可以储存在水溶液中,任选地与一种或多种防腐剂组合,该一种或多种防腐剂被配置为保留细胞和/或细胞组分的形态、大小或其他特征。固定的细胞、细胞核和/或细胞/细胞核成分可以在低于室温下储存,诸如储存在冰箱中。另选地,样品的细胞、细胞核和/或细胞/细胞核成分可以在一个或多个其他过程(诸如过滤、离心、搅拌、选择性沉淀、纯化、透化、分离、加热等)之后经受涉及一种或多种固定剂的固定过程。例如,来自样品的给定类型的细胞、细胞核和/或细胞/细胞核成分可以在分离和/或富集程序(例如,如本文所述)之后经受固定过程。在一个实例中,包含多个细胞(包括多个给定类型的细胞)的样品可以经受正向分离过程,以提供富含多个给定类型的细胞的样品。然后富集的样品可以经受涉及一种或多种固定剂(例如,如本文所述)的固定过程,以提供包含多个固定的细胞的富集的样品。可以在本体溶液中执行固定过程。在一些情况下,固定的样品(例如,固定的细胞、固定的细胞核和/或细胞/细胞核成分)可以在多个分区(例如,液滴或孔)中分隔,并经受如本文别处所述的处理。在一些情况下,固定的样品可以在分隔和任何后续处理之前经历附加处理,诸如通过例如再水合或去交联来部分或完全逆转固定过程。在一些情况下,固定的样品可以在多个分区内经历固定过程的部分或完全逆转(例如,在本文别处描述的附加处理之前或同时)。
在一些情况下,可以处理包含多个细胞、细胞核和/或细胞/细胞核成分的组织标本,以提供福尔马林固定石蜡包埋(FFPE)组织。组织标本可以与福尔马林接触(例如,被福尔马林浸透),然后包埋在石蜡中。FFPE处理可以便于组织样品的保存(例如,在后续处理和分析之前)。包括FFPE组织样品在内的组织样品可以附加地或另选地储存在低温冰箱中。细胞、细胞核和/或细胞/细胞核成分可以在经历后续处理之前从组织样品(例如,FFPE组织样品)中解离。在一些情况下,组织样品(诸如FFPE组织样品)的单独细胞、细胞核和/或细胞/细胞核成分可以在任何这样的解离之前进行光学检测、标记或其他处理。这种检测、标记或其他处理可以根据二维或三维阵列并任选地根据预定模式来执行。
核酸分析方法
在一个方面,本公开提供了一种为核酸分子加条形码的方法。该方法通常可以包括使核酸分子与一对探针和条形码分子接触,以产生加有条形码的分子(例如,加有条形码的、探针连接的分子)。核酸分子可以包含与靶序列或模板序列相对应的序列。可以进行一个或多个核酸反应(例如,连接、核酸延伸反应、扩增等)以产生加有条形码的分子。在一些方面,该方法包括:使核酸分子与第一探针接触以产生探针缔合的核酸分子,其中核酸分子包含第一靶区域和第二靶区域,其中第一探针包含与第一靶区域互补的第一探针序列;进行核酸反应(例如,核酸延伸反应,例如,通过使用聚合酶或逆转录酶等)以产生延伸的探针分子,该延伸的探针分子包含与第二靶区域互补的序列;提供(i)包含与第二靶区域相对应或互补的第二探针序列的第二探针以及(ii)核酸条形码分子;以及使延伸的探针分子或其衍生物经受足以产生加有条形码的分子的条件。第一靶区域和第二靶区域可以彼此相邻设置,或者可以彼此分开(例如,设置在间隙区域的相对两端)。在一些情况下,可以通过提供探针结合分子(在本文中也称为“夹板分子”或在一些情况下称为“夹板寡核苷酸”)来促进加条形码。例如,第一探针和/或第二探针可以包含探针捕获序列,并且探针结合分子可以包含与探针捕获序列互补的探针结合序列。此外或另选地,核酸条形码分子可以包含条形码序列和条形码捕获序列,并且探针结合分子可以包含与条形码捕获序列互补的条形码结合序列。在一些情况下,探针结合分子可以预退火到核酸条形码分子。加条形码可以包括探针结合分子与第一探针和/或第二探针的探针捕获序列(或其互补序列)以及与核酸条形码分子的条形码捕获序列的杂交。因此,加有条形码的分子可以包含与第一靶区域相对应的序列、与第二靶区域相对应的序列、与探针捕获序列相对应的序列和与条形码序列相对应的序列。可以在一个分区(例如,液滴或孔)内执行一个或多个操作。
本文所述的方法可以使用例如核酸延伸反应、探针杂交、化学连接或酶促连接、加条形码、扩增和测序,促进具有单细胞、单细胞核或单细胞珠粒分辨率的基因表达谱分析。本文所述的方法可以允许基因表达分析,同时避免使用专门的成像设备,并且在某些情况下,避免使用逆转录,逆转录可能非常容易出错并且效率低。在一些情况下,该方法可以用于以灵敏和准确的方式分析单细胞、细胞核或细胞珠粒群体中的一组预定的靶基因。本文所述的方法也可用于检测或表征遗传变体,例如,在设置在靶区域之间的区域(例如,间隙区域)的序列未知的情况下。在一些情况下,本文所述的方法可用于分析单核苷酸多态性(SNP)、选择性剪接、插入、突变、缺失、基因重排(例如,V(D)J重排)、转座子或其他遗传元件或变体。在一些情况下,由本文所述的方法分析的核酸分子可以包含融合基因(例如,通过易位、中间缺失或染色体倒位产生的杂合基因)。在一些情况下,本文所述的方法可用于分析细胞、细胞核、细胞珠粒、组织样品、细胞、细胞核或组织的空间阵列等中的基因组、转录组、外显子组和/或蛋白质组元件。
由本文所述的方法分析的核酸分子可以是单链或双链核酸分子。双链核酸分子可以完全或部分变性,以接近核酸分子的一条链的靶区域(例如,靶序列)。变性可以通过例如以下方式实现:调节包含核酸分子的溶液的温度或pH;使用化学剂,诸如甲酰胺、胍、水杨酸钠、二甲基亚砜、丙二醇、尿素或碱性试剂(例如,NaOH);或使用机械搅拌(例如,离心或涡旋包含核酸分子的溶液)。
核酸分子可以是靶核酸分子。靶核酸分子可以是RNA分子。RNA分子可以是例如转运RNA(tRNA)分子、核糖体RNA(rRNA)分子、线粒体RNA(mtRNA)分子、信使RNA(mRNA)分子、非编码RNA分子、合成RNA分子或另一种类型的RNA分子。例如,RNA分子可以是mRNA分子。在一些情况下,核酸分子可以是病毒或病原RNA。在一些情况下,核酸分子可以是先前引入细胞中或细胞上的合成核酸分子。例如,核酸分子可以包含多个条形码序列,并且两个或更多个条形码序列可以是核酸分子的靶区域。在一些情况下,核酸分子是指导RNA(gRNA),其可以外源性引入细胞或细胞珠粒中。在一些情况下,核酸分子是来源于外源性引入的核酸分子的RNA分子,例如来源于质粒、整合的DNA序列(例如,使用细胞中的病毒转导)、来自CRISPR遗传元件的gRNA等的RNA。
核酸分子(例如,RNA分子)可以包含选自由以下各项组成的组的一个或多个特征:5’帽结构、非翻译区(UTR)、5’三磷酸部分、5’羟基部分、Kozak序列、Shine-Dalgarno序列、编码序列、密码子、内含子、外显子、开放阅读框、调控序列、增强子序列、沉默子序列、启动子序列和多聚(A)序列(例如,多聚(A)尾)。例如,核酸分子可以包含选自由以下各项组成的组的一个或多个特征:5’帽结构、非翻译区(UTR)、Kozak序列、Shine-Dalgarno序列、编码序列和多聚(A)序列(例如,多聚(A)尾)。
核酸分子的特征可以具有任何有用的特性。5’帽结构可以包含由接头(诸如三磷酸(ppp)接头)连接的一个或多个核苷部分。5’帽结构可以包含天然存在的核苷和/或非天然存在的(例如,修饰的)核苷。例如,5’帽结构可以包含鸟嘌呤部分或修饰的(例如,烷基化的、还原的或氧化的)鸟嘌呤部分,诸如7-甲基鸟苷酸(m7G)帽。5’帽结构的实例包括但不限于m7GpppG、m7Gpppm7G、m7GpppA、m7GpppC、GpppG、m2,7GpppG、m2,2,7GpppG和抗反向帽类似物,诸如m7,2’OmeGpppG、m7,2’dGpppG、m7,3’OmeGpppG和m7,3’dGpppG。非翻译区(UTR)可以是5’UTR或3’UTR。UTR可以包含任何数量的核苷酸。例如,UTR可以包含至少3、5、7、10、20、30、40、50、60、70、80、90、100个或更多个核苷酸。在一些情况下,UTR可以包含少于20个核苷酸。在其他情况下,UTR可以包含至少100个核苷酸,诸如超过200、300、400、500、600、700、800、900或1000个核苷酸。类似地,编码序列可以包含任何数量的核苷酸,诸如至少3、5、10、20、30、40、50、60、70、80、90、100个或更多个核苷酸。核酸分子的UTR、编码序列或其他序列可以具有任何核苷酸或碱基含量或排列。例如,核酸分子的序列可以包含任何数量或浓度的鸟嘌呤、胞嘧啶、尿嘧啶和腺嘌呤碱基。核酸分子也可以包含非天然存在的(例如,修饰的)核苷。修饰的核苷可以在其核碱基和/或糖部分中包含一个或多个修饰(例如,烷基化、羟基化、氧化或其他修饰)。
核酸分子可以包含一个或多个靶区域。在一些情况下,靶区域可以对应于基因或其一部分。每个区域可以具有相同或不同的序列。例如,核酸分子可以包含两个具有相同序列的靶区域,它们位于沿着核酸分子的一条链的不同位置。另选地,核酸分子可以包含两个或更多个具有不同序列的靶区域。不同的靶区域可以由不同的探针探查。靶区域可以彼此相邻,或者可以沿着核酸分子的一条链在空间上分开。靶区域可以位于相同的链或不同的链上。如本文中关于两个实体所使用的,“相邻”可以意指实体彼此直接紧挨(例如,邻接)或彼此接近。例如,第一靶区域可以直接与第二靶区域紧挨(例如,在第一靶区域和第二靶区域之间没有设置其他实体)或接近第二靶区域(例如,在第一靶区域和第二靶区域之间具有间插序列或分子)。在一些情况下,双链核酸分子可以在每条链中包含可能相同或不同的靶区域。对于包含多个靶区域的核酸分子,可以一次对一个或多个靶区域执行本文所述的方法。例如,可以分析多个靶区域中的单个靶区域(例如,如本文所述),或者可以同时分析两个或更多个靶区域。分析两个或更多个靶区域可以涉及提供两个或更多个探针,其中第一探针具有与第一靶区域互补的序列,第二探针具有与第二靶区域互补的序列,等等。
每个探针(例如,第一探针和第二探针)还可以包含一个或多个附加序列(例如,附加探针序列、独特分子标识符(UMI)、条形码序列、引物序列、捕获序列或其他功能序列)。例如,在一些情况下,第一探针和/或第二探针可以包含相同或不同的条形码序列。在一些实例中,第一探针和第二探针可以被配置为与一个或多个核酸条形码分子杂交。例如,第一探针和/或第二探针可以包含探针捕获序列,其可以被配置为与核酸条形码分子或探针结合分子(例如,夹板寡核苷酸)杂交,该探针结合分子被配置为与核酸条形码分子杂交(例如,经由与核酸条形码分子的捕获序列互补的条形码结合序列)。探针捕获序列可以是任何有用的长度;例如,探针捕获序列的长度可以是约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约20、约30、约40、约50、约60、约70、约80、约90、约100个或更多个核苷酸。探针捕获序列的长度可以是至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100个或更多个核苷酸。探针捕获序列的长度可以是至多100、至多90、至多80、至多70、至多60、至多50、至多40、至多30、至多20、至多10、至多9、至多8、至多7、至多6、至多5、至多4、至多3、至多2或至多1个核苷酸。探针捕获序列的长度范围,诸如长度为约8至约50个核苷酸等。在一些情况下,探针捕获序列长度可以基于任何有用的应用和特性而变化,例如解链温度、退火温度、退火强度(例如,GC含量)、杂交严格性等。
类似地,探针结合分子和核酸条形码分子还可以包含一个或多个附加序列(例如,独特分子标识符(UMI)、条形码序列、引物序列、捕获序列或其他功能序列)。例如,在一些情况下,探针结合分子或条形码分子可以包含功能序列、引物序列(例如,测序引物序列或部分测序引物序列)、UMI等。探针结合分子和核酸条形码分子可以是任何有用的长度;例如,任一者或两者的长度可以是约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约20、约30、约40、约50、约60、约70、约80、约90、约100个或更多个核苷酸。探针结合分子或条形码分子的长度可以是至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100个或更多个核苷酸。探针捕获结合分子或条形码分子的长度可以是至多100、至多90、至多80、至多70、至多60、至多50、至多40、至多30、至多20、至多10、至多9、至多8、至多7、至多6、至多5、至多4、至多3、至多2或至多1个核苷酸。可以使用一定长度范围的探针结合分子或条形码分子,诸如长度为约16至约100个核苷酸等。在一些情况下,探针结合分子或条形码分子的长度可以基于任何有用的应用和特性而变化,例如解链温度、退火温度等。在一些情况下,核酸分子的第一靶区域和第二靶区域不相邻。例如,第一靶区域和第二靶区域可以由设置在第一靶区域和第二靶区域之间的一个或多个间隙区域分开。间隙区域可以包含例如至少一个核苷酸碱基、至少约2、至少约3、至少约4、至少约5、至少约6、至少约7、至少约8、至少约9、至少约10、至少约20、至少约30、至少约40、至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约200、至少约300、至少约400、至少约500个或更多个碱基。间隙区域可以包含至多约1000、至多约500、至多约400、至多约300、至多约200、至多约100、至多约90、至多约80、至多约70、至多约60、至多约50、至多约40、至多约30、至多约20、至多约10或至多约5个碱基。间隙区域可以包含一定范围的碱基数,诸如约1至30个碱基。
核酸分子的靶区域可以具有一种或多种有用的特性。例如,靶区域可以具有任何有用的长度、碱基含量、序列、熔点或其他特性。靶区域可以包含例如至少10个碱基,诸如至少约20、25、30、35、40、45、50、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、250、300、350、400、450、500个或更多个碱基。靶区域可以具有任何有用的碱基含量及任何有用的碱基序列和组合。例如,靶区域可以包含一个或多个腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶和/或鸟嘌呤碱基(例如,天然或规范碱基)。靶区域也可以包含天然或规范碱基的一种或多种衍生物或修饰形式,诸如氧化的、烷基化的(例如甲基化的)、羟基化的或其他修饰的碱基。类似地,靶区域可以包含核糖或脱氧核糖部分和磷酸部分或其衍生物或修饰形式。
核酸分子的靶区域可以包含核酸分子的一个或多个序列或特征或其部分。例如,靶区域可以包含核酸分子的全部或部分UTR(例如,3’UTR或5’UTR)、Kozak序列、Shine-Dalgarno序列、编码序列、多聚A序列、帽结构、内含子、外显子或任何其他序列或特征。
样品的核酸分子(例如,RNA分子,诸如mRNA分子)可以包含在细胞、细胞核或细胞珠粒内。例如,样品可以包含具有核酸分子的细胞或细胞核。细胞、细胞核或细胞珠粒可以包含可能与感兴趣的核酸分子相同或不同的附加核酸分子。在一些情况下,样品可以包含多个细胞,并且每个细胞可以包含一个或多个核酸分子。细胞可以是例如人细胞、动物细胞或植物细胞。在一些情况下,如本文所述,细胞可以来源于组织或流体。细胞可以是原核细胞或真核细胞。细胞可以是淋巴细胞,诸如B细胞或T细胞。细胞可以包含在珠粒内,诸如美国专利号10,428,326中公开的那些,其全文以引用方式并入本文。在一些情况下,细胞包含在组织样品内,并且可以固定到基板。例如,如上所述,细胞可以是福尔马林固定石蜡包埋(FFPE)样品的细胞。在这样的情况下,该方法可以包括用于制备细胞或其中包含的核酸分子的附加操作,例如脱蜡、染色(例如,使用免疫剂)或脱色、解交联、洗涤、酶处理等。在探针杂交之前和之后处理FFPE样品的附加实例包括在PCT/US2020/066720中,其全文以引用方式包括在本文中。
可以通过裂解或透化细胞或细胞核来接近包含在细胞、细胞核或细胞珠粒中的核酸分子。裂解细胞、细胞核或细胞珠粒可以从细胞、细胞核或细胞珠粒中释放包含在其中的核酸分子。可以使用裂解剂(诸如生物活性剂)裂解细胞或细胞核。可用于裂解细胞或细胞核的生物活性剂可以是例如酶(例如,如本文所述)。用于裂解细胞或细胞核的酶可能能够或可能不能够执行附加功能,诸如降解、延伸、逆转录或以其他方式改变核酸分子。另选地,可以使用离子或非离子表面活性剂诸如TritonX-100、吐温20、十二烷基肌氨酸钠或十二烷基硫酸钠来裂解细胞或细胞核。细胞/细胞核裂解也可以使用细胞破碎方法来实现,诸如电穿孔或热、声或机械破碎方法。另选地,可以透化细胞或细胞核,以接近其中包含的核酸分子。透化可以涉及部分或完全溶解或破坏细胞膜/核膜或其一部分。透化可以通过例如使细胞膜与有机溶剂(例如,甲醇)或去污剂(诸如Triton X-100或NP-40)接触来实现。如本文别处所述,细胞、细胞核或细胞珠粒可以是固定的。
在一些情况下,细胞可以在细胞珠粒内裂解,并且细胞内内容物的子集可以与珠粒缔合。在一些情况下,细胞珠粒可以包含硫代丙烯酰胺基(thioacrydite)修饰的核酸分子,该核酸分子可以与来自细胞的核酸杂交。例如,多聚T核酸序列可以进行硫代丙烯酰胺基修饰并结合于细胞珠粒基质。在细胞或细胞核裂解后,细胞核酸(例如,mRNA)可以与多聚T序列杂交。被保留的细胞内/细胞核内内含物可以例如通过添加还原剂(例如,DTT、TCEP等)来释放。释放可以发生在任何方便的步骤,诸如在分隔之前或之后。
核酸分子或探针缔合的核酸分子可以经受足以产生探针连接的分子的条件。例如,第一靶区域可以与第二靶区域相邻,并且第一探针和第二探针可以分别与第一靶区域和第二靶区域杂交。第一探针可以包含第一反应性部分,并且第二探针可以包含第二反应性部分。在一些情况下,第一探针的第一反应性部分与第二探针的第二反应性部分相邻。然后,反应性部分可以经受足以使它们反应的条件,以产生探针连接的核酸分子,该探针连接的核酸分子包含与第二探针连接的第一探针。例如,反应性部分可以经由点击化学或酶促连接而连接在一起,诸如美国专利公开号2020/0239874、国际公开号WO 2019/165318和国际专利公开号WO2021/237087中公开的那些,以上专利公开中的每一者均全文以引用方式并入本文。在一些实例中,第一探针或第二探针可以包含腺苷酸化的寡核苷酸或部分(例如,腺苷酸化的磷酸基团),其可用于减少非特异性连接反应。在一些情况下,探针的连接(例如,经由连接反应)可以在基本上无ATP的条件下进行,任选地所使用的酶(例如,连接酶)不需要ATP(例如,截短的T4 RNA连接酶)或被预活化(例如,预活化的T4 DNA连接酶)。此类连接方案的附加实例可见于PCT/US2020/066720和2021年5月21日提交的国际专利申请号PCT/US2021/33649,其全文以引用方式并入本文。
在一些情况下,核酸分子(例如,RNA分子)的第一靶区域可能不与第二靶区域相邻。在此类情况下,核酸分子可以经受足以使第一探针的第一探针序列与第一靶区域杂交的条件,以产生探针缔合的核酸分子。探针缔合的核酸分子可以经受核酸反应(例如,核酸延伸反应、逆转录等)以产生延伸的探针分子,该延伸的探针分子包含与第二靶区域互补的序列。包含第二探针序列的第二探针可以与延伸的探针分子(或其互补序列)杂交,并经受足以产生探针连接的分子的条件(例如,核酸延伸、扩增、附加探针分子的杂交、连接等),该探针连接的分子包含与第一靶区域相对应的序列和与第二靶区域相对应的序列。另选地或此外,可以同时提供第一探针和第二探针,并且在第一探针序列和第二探针序列分别与第一靶区域和第二靶区域杂交以产生双探针缔合的核酸分子之后,可以(例如,经由核酸延伸或间隙填充反应和/或与间隙区域的至少一部分杂交的附加探针分子的杂交)填充间隙(例如,设置在第一靶区域和第二区域之间的区域)。在一些情况下,一个或两个探针可以包含突出端序列或翘翼序列(例如,在5’端),其可被酶(例如,核酸内切酶,诸如FEN1核酸内切酶)识别或裂解。例如,第二探针可以包含5’翘翼序列,如果第二探针的至少一个特定部分与核酸分子(例如,靶分子)杂交,则该翘翼序列会被FEN1核酸内切酶裂解。在第二探针与核酸分子的第二靶序列杂交后,可以使用核酸内切酶(例如,FEN1)裂解翘翼序列,留下第二探针的可连接末端(例如,磷酸化末端)。在第一靶区域不与第二靶区域相邻的情况下,可以填充间隙区域,然后裂解翘翼序列。在一些情况下,可以连接(例如,化学连接或酶促连接)第一探针或第二探针和间隙填充区域。用于产生探针连接的核酸分子和间隙填充反应的系统和方法的附加实例可见于例如美国专利公开号2020/0239874、国际公开号WO 2019/165318和国际专利公开号WO2021/237087,以上专利公开中的每一者均全文以引用方式并入本文。
可以为探针连接的核酸分子加条形码以提供加有条形码的、探针连接的核酸分子,或者加条形码可以发生在探针连接的核酸分子产生之前。可以使用多种技术执行加条形码。例如,第一探针或第二探针可以包含探针捕获序列。核酸条形码分子可以包含能够与探针捕获序列杂交的条形码捕获序列。另选地,加条形码可以由探针结合分子(例如,夹板寡核苷酸)介导,该探针结合分子包含(i)探针结合序列,其可以与第一探针或第二探针的探针捕获序列互补;和(ii)条形码结合序列,其可以与核酸条形码分子的条形码捕获序列互补。在一些情况下,加条形码之后可以进行连接,例如化学或酶介导的连接,以将核酸条形码分子共价连接到探针(或共价连接到探针结合序列,并且探针结合序列可以连接到探针)。核酸分子的化学连接的实例可以包括“点击化学”方法,例如叠氮化物和炔烃部分的反应,如美国专利公开号2020/0239874所述,其全文以引用方式并入本文。
举例来说,第一探针可以包含第一探针序列和探针捕获序列,并且第一探针可以经受足以使第一探针序列与第一靶区域杂交的条件,从而产生探针缔合的核酸分子。在一些情况下,探针缔合的核酸分子可以经受洗涤或其他条件,以从混合物中去除未退火的探针。探针缔合的核酸分子可以从第一探针的一端向与其杂交的核酸分子的一端延伸(向接近第二靶区域的一端延伸)以提供延伸的核酸分子。延伸的核酸条形码分子可以包含第一探针序列和第二靶区域的互补序列。在一些情况下,可以例如通过以下方式为延伸的核酸分子加条形码:使核酸条形码分子的条形码捕获序列与探针捕获序列杂交,或者(i)使包含探针结合序列和条形码结合序列的探针结合分子与探针捕获序列杂交,以及(ii)使核酸条形码分子的条形码捕获序列与探针结合分子的条形码结合序列杂交。在一些情况下,可以提供预退火到核酸条形码分子的探针结合分子。随后,可以提供包含第二探针序列的第二探针。加有条形码的、延伸的核酸分子可以经受足以使第二探针序列与第二靶区域或其互补序列杂交的条件。可以进行核酸延伸反应,从而产生加有条形码的分子(例如,加有条形码的、探针连接的分子),该加有条形码的分子包含与第一靶区域相对应的序列、与第二靶区域相对应的序列、与探针捕获序列相对应的序列和与条形码序列相对应的序列。
图7示意性地示出了如本文所述的用于产生加有条形码的核酸分子的方法。可以提供包含第一靶区域702和第二靶区域704的核酸分子(例如,RNA分子)700。可以使核酸分子700与包含第一探针序列708和任选的功能序列710的第一探针706接触,从而产生探针缔合的核酸分子。第一探针序列708可以与第一靶区域702互补。功能序列710可以包含例如用于下游加条形码的探针捕获序列,或者它可以包含不同的功能序列,诸如引物序列、部分引物序列、条形码序列、测序引物序列等。
在操作701中,探针缔合的核酸分子可以经受足以延伸第一探针706的条件,从而产生延伸的探针分子712,该延伸的探针分子包含与第二靶区域704互补的序列。在一些情况下,延伸的探针分子712可以从核酸分子700释放,例如,通过使核酸分子700变性和/或降解(例如,使用RNA酶、升高的温度或热循环、pH等)。在操作703中,可以提供核酸条形码分子。在一些情况下,核酸条形码分子可以是部分双链的,并且可以包含具有条形码序列的第一链720,以及具有与条形码序列至少部分互补的序列724和探针结合序列726的第二链722,该探针结合序列可以与第一探针706的功能序列(例如,探针捕获序列)710至少部分互补。在一些情况下,核酸条形码分子是单链的,并且仅包含具有条形码序列和条形码捕获序列的第一链720。可以提供探针结合分子(例如,夹板寡核苷酸)722,该探针结合分子包含与条形码捕获序列至少部分互补的条形码结合序列724和探针结合序列726。在一些情况下,探针结合分子和核酸条形码分子可以作为预退火复合物提供。核酸条形码分子(或预退火复合物)可以偶联到珠粒,诸如如本文所述的凝胶珠粒,并且可以包含附加功能序列,包括但不限于独特分子标识符(UMI)、捕获序列、引物序列(例如,R1/R2序列)。
在操作705中,可以通过使探针结合序列726与功能序列(例如,探针捕获序列710)杂交来为延伸的探针分子加条形码。在一些情况下,核酸条形码分子可以例如以酶促方式(例如,使用连接酶)或化学方式(例如,使用点击化学)共价连接到延伸的探针分子(例如,经由探针捕获序列)。在操作707中,可以提供第二探针分子716。在一些情况下,操作707也可以包括双链分子的变性。第二探针分子716可以包含与第二靶区域704相对应的第二探针序列714和任选的功能序列718,该功能序列可以包含探针捕获序列、条形码序列、引物序列、测序引物序列等。在操作709中,可以例如使用聚合酶进行核酸延伸反应,以沿着延伸的探针分子延伸第二探针716,从而产生加有条形码的分子,该加有条形码的分子包含与第一靶区域702、第二靶区域704相对应的序列、与探针捕获序列710相对应的序列和与条形码序列720相对应的序列。
在另一个实例中,第一探针和第二探针可以在加条形码之前连接(例如,通过化学连接或酶促延伸和/或连接)。在这样的实例中,第一探针可以与核酸分子杂交(例如,经由第一探针序列与第一靶区域的杂交)以产生探针缔合的核酸分子。探针缔合的核酸分子可以从第一探针的一端向与其杂交的核酸分子的一端延伸以提供延伸的核酸分子。延伸的分子可以经受足以使第二探针与第二靶区域或其互补序列杂交的条件(例如,经由第二探针序列与第二靶区域或其互补序列的杂交)。可以进行附加核酸延伸反应,以产生延伸的分子,并且可以为所得的延伸产物加条形码,产生加有条形码的分子。加有条形码的分子可以包含与第一靶区域相对应的序列、与第二靶区域相对应的序列、与探针捕获序列相对应的序列和与条形码序列相对应的序列。在一些情况下,核酸条形码分子(或探针结合分子)可以以化学方式连接到第一探针或第二探针,诸如通过连接反应或点击化学。例如,核酸条形码分子可以包含第一反应性部分,并且第一探针或第二探针可以包含第二反应性部分;第一反应性部分可以被配置为与第二反应性部分反应以产生共价键。然后可以任选地通过任何合适的技术(包括核酸测序,例如Illumina测序)进一步处理和分析加有条形码的核酸分子或其衍生物。
图8示意性地示出了如本文所述的用于产生加有条形码的核酸分子的另一种方法。可以提供包含第一靶区域802和第二靶区域804的核酸分子(例如,RNA分子)800。可以使核酸分子800与包含第一探针序列808和任选的功能序列810的第一探针806接触,从而产生探针缔合的核酸分子。第一探针序列808可以与第一靶区域802互补。功能序列810可以包含例如用于下游加条形码的探针捕获序列,或者它可以包含不同的功能序列,诸如引物序列、部分引物序列、条形码序列、测序引物序列等。
在操作801中,探针缔合的核酸分子可以经受足以延伸第一探针806的条件,从而产生延伸的探针分子812,该延伸的探针分子包含与第二靶区域804互补的序列。在一些情况下,延伸的探针分子812可以从核酸分子800释放,例如,通过使核酸分子800变性和/或降解(例如,使用RNA酶、升高的温度或热循环、pH等)。在操作803中,可以提供核酸条形码分子和第二探针816。第二探针816可以包含与第二靶区域804相对应的第二探针序列814和任选的功能序列818,该功能序列可以包含探针捕获序列。在一些情况下,核酸条形码分子可以是部分双链的,并且可以包含具有条形码序列的第一链820,以及具有与条形码序列互补的序列824和探针结合序列826的第二链822,该探针结合序列可以与第二探针816的功能序列(例如,探针捕获序列)818互补。在一些情况下,核酸条形码分子是单链的,并且仅包含具有条形码序列和条形码捕获序列的第一链820。可以提供探针结合分子(例如,夹板寡核苷酸)822,该探针结合分子包含与条形码捕获序列互补的条形码结合序列824和探针结合序列826。在一些情况下,探针结合分子和核酸条形码分子可以作为预退火复合物提供。核酸条形码分子(或预退火复合物)可以偶联到珠粒,诸如如本文所述的凝胶珠粒,并且可以包含附加功能序列,包括但不限于独特分子标识符(UMI)、捕获序列、引物序列(例如,R1/R2序列)。在操作803中,第二探针816可以与延伸的探针分子812杂交(例如,经由第二探针序列814与第二靶区域804或其互补序列的杂交),并且核酸条形码分子可以附着或偶联到第二探针816(例如,经由探针结合序列826与探针捕获序列818的杂交)。在一些情况下,核酸条形码分子或探针结合分子可以连接到第二探针816(例如,使用连接酶或经由化学连接,诸如点击化学)。
在操作805中,可以例如使用聚合酶(例如,DNA聚合酶、热启动聚合酶等)进行核酸延伸反应,以沿着延伸的探针分子延伸核酸条形码分子和第二探针816,从而产生加有条形码的分子,该加有条形码的分子包含与第一靶区域802、第二靶区域804相对应的序列、与探针捕获序列818相对应的序列和与条形码序列820相对应的序列。然后可以任选地通过任何合适的技术(包括核酸测序,例如Illumina测序)进一步处理和分析加有条形码的核酸分子或其衍生物。
图9以类似于图8所示的方式示意性地示出了用于产生加有条形码的核酸分子的另一种方法。可以提供包含第一靶区域902和第二靶区域904的核酸分子(例如,RNA分子)900。可以使核酸分子900与包含第一探针序列908和任选的功能序列910的第一探针906接触,从而产生探针缔合的核酸分子。第一探针序列908可以与第一靶区域902互补。功能序列910可以包含例如探针捕获序列,或者它可以包含不同的功能序列,诸如引物序列、部分引物序列、条形码序列、测序引物序列等。
在操作901中,探针缔合的核酸分子可以经受足以延伸第一探针906的条件,从而产生延伸的探针分子912,该延伸的探针分子包含与第二靶区域906互补的序列。在一些情况下,延伸的探针分子912可以从核酸分子900释放,例如,通过使核酸分子900变性和/或降解(例如,使用RNA酶、升高的温度或热循环、pH等)。在操作903中,可以提供第二探针916。第二探针916可以包含与第二靶区域904相对应的第二探针序列914和任选的功能序列918,该功能序列可以包含探针捕获序列。在操作905中,可以例如使用聚合酶进行核酸延伸反应,以沿着延伸的探针分子延伸核酸条形码分子和第二探针916,从而产生探针连接的分子,该探针连接的分子包含与第一靶区域902和第二靶区域904相对应的序列。
在操作905中,也可以为核酸条形码分子提供第二探针。在一些情况下,核酸条形码分子可以是部分双链的,并且可以包含具有条形码序列的第一链920,以及具有与条形码序列互补的序列924和探针结合序列926的第二链922,该探针结合序列可以与第二探针916的功能序列(例如,探针捕获序列)918互补。在一些情况下,核酸条形码分子是单链的,并且仅包含具有条形码序列和条形码捕获序列的第一链920。可以提供探针结合分子(例如,夹板寡核苷酸)922,该探针结合分子包含与条形码捕获序列互补的条形码结合序列924和探针结合序列926。在一些情况下,探针结合分子和核酸条形码分子可以作为预退火复合物提供。核酸条形码分子(或预退火复合物)可以偶联到珠粒,诸如如本文所述的凝胶珠粒,并且可以包含附加功能序列,包括但不限于独特分子标识符(UMI)、捕获序列、引物序列(例如,R1/R2序列)。在操作907中,可以将核酸条形码分子附着或偶联到第二探针916,例如,经由探针结合序列926与探针捕获序列918的杂交。所得的加有条形码的产物可以包含与第一靶区域902、第二靶区域904相对应的序列、与探针捕获序列918相对应的序列和与条形码序列920相对应的序列。在一些情况下,核酸条形码分子可以例如以酶促方式(例如,使用连接酶)或化学方式(例如,使用点击化学)共价连接到延伸的探针分子(例如,经由探针捕获序列918)。然后可以任选地通过任何合适的技术(包括核酸测序,例如Illumina测序)进一步处理和分析加有条形码的核酸分子或其衍生物。
在附加实例中,本公开的方法可以包括产生探针缔合的核酸分子,以及为探针缔合的核酸分子加条形码,并任选地进行连接操作(例如,在为探针缔合的核酸分子加条形码之前或之后)。例如,可以提供包含第一靶区域和第二靶区域的核酸分子(例如,RNA分子)。可以使核酸分子与(i)包含与第一靶区域互补的第一探针序列的第一探针和(ii)包含与第二靶区域互补的第二探针序列的第二探针接触,从而产生探针缔合的核酸分子。在一些情况下,探针缔合的核酸分子可以经受足以将第一探针连接到第二探针的条件(例如,酶促连接,诸如用聚合酶、逆转录酶和/或连接酶,或化学连接),从而产生探针连接的核酸分子。随后可以为探针缔合的核酸分子或探针连接的分子加条形码(例如,在一个分区中)以产生加有条形码的核酸分子。
例如,图25示意性地示出了用于产生探针连接的核酸分子的示例方法,该探针连接的核酸分子随后可以例如在一个分区中加条形码,以产生加有条形码的核酸分子。可以提供包含第一靶区域2502和第二靶区域2504的核酸分子(例如,RNA分子)2500。在一些情况下,第一靶区域与第二靶区域相邻。在操作2501中,可以使核酸分子2500与包含与第一靶区域2502互补的第一探针序列2508的第一探针2506和包含与第二靶区域2504互补的第二探针序列2514的第二探针2516接触,从而产生探针缔合的核酸分子。第一探针2506和/或第二探针2516可以包含功能序列,例如探针捕获序列、引物序列、部分引物序列、条形码序列、测序引物序列等。
在一些情况下,探针之一(例如,第二探针2516)包含翘翼序列或突出端序列2530,其可以在第二探针序列2514退火到第二靶区域2504时被核酸内切酶(例如,FEN1)识别。例如,第二探针2516可以包含5’翘翼序列2530,并且在第一探针2506和第二探针2516退火到核酸分子2500之后,翘翼序列可以与第一探针的一端(例如,3’端)以及第二探针的一端(例如,5’端)相邻。在操作2503中,核酸内切酶(例如,FEN1)可以用于去除翘翼序列2530,留下第二探针2516的可连接末端(例如,5’磷酸化末端)。在操作2507中,可以进行连接反应(例如,使用连接酶)以将第一探针连接到第二探针,从而产生探针连接的核酸分子。随后可以例如在分区中为探针连接的核酸分子加条形码,如本文别处所述。在一些情况下,探针缔合的核酸分子可以被加条形码和连接(例如,在分区中)。
图26示出了与图25所示的工作流程类似的另一示例工作流程,其中核酸分子的靶区域不相邻。这种工作流程可以包括附加间隙填充反应以产生探针缔合的分子。在一个这样的实例中,核酸分子2600的第一靶区域2602可以不与第二靶区域2604相邻。例如,间隙区域可以设置在第一靶区域和第二靶区域之间。在操作2601中,第一探针2606可以退火到第一靶区域2602,并且第二探针2616可以退火到第二靶区域2604。在操作2603中,可以进行延伸反应(例如,使用聚合酶、逆转录酶等)以填充第一探针2606和第二探针2616之间的间隙区域,产生间隙填充的核酸分子。在一些情况下,第二探针2616包含翘翼序列2630。在这样的情况下,在操作2605中,核酸内切酶(例如,FEN1)可以用于去除翘翼序列2630,留下第二探针2616的可连接末端(例如,5’磷酸化末端)。在操作2607中,可以进行连接反应(例如,使用连接酶)以将第一探针连接到第二探针,从而产生探针连接的核酸分子。可以例如在一个分区中为探针连接的核酸分子或另选地未连接的分子加条形码。
图27示出了通过使用第三探针进行间隙填充反应来产生探针连接的核酸分子的附加方案。在图27图A中,第一探针2706和第二探针2716退火(例如,分别经由第一探针序列和第二探针序列)到核酸分子2700的第一靶区域2702和第二靶区域2704以产生探针缔合的核酸分子。间隙序列可以设置在第一靶区域2702和第二靶区域2704之间。可以提供第三探针分子2770(示出为可用于SNP检测的两种不同的探针分子),其可以退火到间隙序列(图27图B)。在图27图C中,可以连接(例如,使用连接酶)第一探针、第三探针和第二探针,以产生探针连接的核酸分子。可以例如在一个分区中为探针连接的核酸分子或另选地探针缔合的核酸分子加条形码。
图28示出了用于产生探针连接的核酸分子的连接方案的实例。在这样的实例中,探针分子可以与核酸分子杂交。可以使用酶,任选地通过如上所述的间隙填充操作,将第一探针连接到第二探针。在一些情况下,酶可以是预活化的酶,例如预活化的T4 DNA连接酶,并且连接可以在ATP减少或去除ATP的条件下发生,例如使用腺苷三磷酸双磷酸酶。
用于产生探针缔合的核酸分子并为探针缔合的核酸分子加条形码的方法和系统的附加实例可见于例如美国专利公开号2020/0239874、国际公开号WO 2019/165318、国际申请号PCT/US2020/066720和2021年5月21日提交的国际专利申请号PCT/US2021/33649,以上文献中的每一者均全文以引用方式并入本文。
应当理解,例如,参见图7至图9和图25至图28,核酸条形码分子可以附着(例如,经由杂交)到第一探针和/或第二探针(例如,经由包含在第一探针或第二探针中的探针捕获序列)。类似地,第一探针和第二探针可以包含任何有用的功能序列,诸如引物序列、条形码序列、独特分子标识符(UMI)序列、流动池附着序列、引物结合序列、捕获序列等。第一探针可以与核酸分子(例如700、800或900)的左侧(例如,3’端)或右侧(例如,5’端)杂交。类似地,第二探针可以与核酸分子的左侧或右侧杂交。
如本文所述,可以对探针杂交的核酸分子进行一个或多个延伸反应。例如,探针可以从探针的一端延伸到核酸条形码分子的一端,或者第二探针可以从第二探针的一端延伸到探针缔合的核酸分子的第一探针的一端。延伸可以包括使用酶(例如,聚合酶、逆转录酶)在探针末端添加一个或多个核苷酸。延伸可以提供延伸的核酸分子,其包含与感兴趣的核酸分子的靶区域互补的序列、条形码序列,以及任选的核酸条形码分子的一个或多个附加序列,诸如一个或多个结合序列。在一些情况下,可以施加适当的条件和/或化学剂(例如,如本文所述)以使延伸的核酸分子从核酸条形码分子和靶核酸分子变性。在一些情况下,一个或多个过程可以涉及热敏剂的使用。例如,在一些情况下,探针可以在一组温度条件下退火或杂交,而延伸可以在一组不同的温度条件下发生。在一些情况下,可以使用温启动或热启动聚合酶。在一些情况下,核酸条形码分子与一个或多个探针的杂交(例如,直接杂交或经由探针结合分子诸如夹板寡核苷酸)可以先于探针与核酸分子的靶区域的杂交。加条形码后,加有条形码的核酸分子可以通过例如一个或多个扩增反应来复制或扩增。扩增反应可以包括聚合酶链反应(PCR),并且可以涉及使用一种或多种引物或聚合酶。可以在一个分区内或在本体中进行延伸、变性和/或扩增过程。在一些情况下,延伸的核酸分子或其衍生物(例如,加有条形码的分子)可以在一个分区内复制或扩增以提供扩增产物。可以经由测序(例如,如本文所述)来检测加有条形码的产物或其互补序列(例如,扩增产物)。
可以在一个分区(诸如孔或液滴)内提供核酸分子或其衍生物(例如,探针连接的核酸分子、具有与其杂交的一个或多个探针的核酸分子、加有条形码的、探针连接的核酸分子或延伸的核酸分子或其互补序列)或者包含核酸分子或其衍生物的细胞或细胞珠粒,例如如本文所述。一种或多种试剂可以与核酸分子或其衍生物或者包含核酸分子或其衍生物的细胞共同分隔。例如,核酸分子或其衍生物或者包含核酸分子或其衍生物的细胞可以与一种或多种试剂共同分隔,该一种或多种试剂选自由以下各项组成的组:裂解剂或缓冲液、透化剂、酶(例如,能够消化一种或多种RNA分子、延伸一种或多种核酸分子、逆转录RNA分子、透化或裂解细胞或者执行其他动作的酶)、荧光团、寡核苷酸、引物、探针、条形码、核酸条形码分子(例如,包含一个或多个条形码序列的核酸条形码分子)、缓冲液、脱氧核苷酸三磷酸、去污剂、还原剂、螯合剂、氧化剂、纳米颗粒、珠粒和抗体。在一些情况下,核酸分子或其衍生物或者包含核酸分子或其衍生物的细胞(例如,细胞珠粒)可以与一种或多种试剂共同分隔,该一种或多种试剂选自由以下各项组成的组:温度敏感酶、pH敏感酶、光敏感酶、逆转录酶、蛋白酶、连接酶、聚合酶、限制性酶、核酸酶、蛋白酶抑制剂、核酸外切酶和核酸酶抑制剂。例如,核酸分子或其衍生物或者包含核酸分子或其衍生物的细胞可以与聚合酶和核苷酸分子共同分隔。分隔核酸分子或其衍生物或者包含核酸分子或其衍生物的细胞和一种或多种试剂可以包括使包含水性流体、细胞和一种或多种试剂的第一相及包含与水性流体不混溶的流体的第二相流向连接部。在第一相和第二相相互作用时,可以形成包含核酸分子或其衍生物或者含核酸分子或其衍生物的细胞(例如,细胞珠粒)和一种或多种试剂的第一相的离散液滴。在一些情况下,分区可以包括单个细胞。可以在分区(例如,液滴)内裂解或透化细胞,以接近细胞的核酸分子。
可以在一个分区(例如,液滴、孔等)内进行一个或多个过程。例如,核酸分子或者包含核酸分子的细胞或细胞珠粒可以在该方法的任何有用阶段与一种或多种试剂(例如,如本文所述)共同分隔。例如,探针缔合的核酸分子(例如,与第一探针杂交的核酸分子)可以在本体中(例如,在可以是活的或固定的和/或透化的细胞群体中、在组织样品中等)产生并经受足以产生延伸的探针分子的条件。延伸的探针分子随后可以被分隔在多个分区中的一个分区中。该分区可以包括第二探针和核酸条形码分子,以及任选的探针结合分子。如本文所述,第二探针可以(例如,经由第二探针序列)与探针缔合的分子的第二靶区域或其互补序列杂交。分区可以包括用于进行核酸反应(例如,消化、连接、延伸、扩增)的附加试剂。例如,探针缔合的核酸分子可以包含核酸分子或与核酸分子杂交,并且分区可以包括降解酶(例如,RNA酶),其可用于从延伸的探针分子中消化或去除模板链(例如,核酸分子,诸如RNA分子)。分区可以包括聚合酶,其可以用于延伸与延伸的探针分子杂交的第二探针。在一些情况下,分区包括连接酶(linking enzyme)(例如,连接酶(ligase)),其可以用于将核酸条形码分子连接到第一探针或第二探针(例如,经由探针捕获序列)。在一些情况下,连接酶可以用于将探针结合分子连接到第一探针或第二探针的探针捕获序列。在一些情况下,探针结合分子、探针捕获序列和/或条形码捕获序列包含一个或多个反应性部分,其可以用于将核酸条形码分子化学或酶促连接到探针捕获序列或其互补序列。所得的加有条形码的产物可以包含与第一靶区域相对应的序列、与第二靶区域相对应的序列、与探针捕获序列相对应的序列和与条形码序列相对应的序列。
例如,再次参见图7,操作701可以在本体中(例如,在分区外部)执行,而操作703、705可以在一个分区中执行。操作707和709可以在本体中或在分区内执行。类似地,参见图8,操作801可以在本体中执行,而操作803可以在一个分区中执行。操作805可以在本体中或在一个分区中执行。参见图9,操作901可以在本体中执行,而操作903、905和907可以在一个分区中执行。应当理解,任何操作都可以在任何方便的步骤在本体中或在分区中执行,并且操作的顺序可以为了合适或有用的目的而改变。
类似地,核酸分子或者包含核酸分子或其衍生物(例如,探针缔合的分子、延伸的分子、加有条形码的分子等)的细胞或细胞珠粒可以在该方法的任何有用阶段从一个分区中释放。例如,延伸的探针分子可以与第二探针杂交,并在核酸条形码分子的条形码捕获序列与第一探针、第二探针或探针结合分子杂交之后从分区中释放。另选地,延伸的探针分子可以在(i)第二探针和核酸条形码分子的杂交以及(ii)第二探针的延伸以产生加有条形码的分子之后从分区中释放,该加有条形码的分子包含与第一靶区域相对应的序列、与第二靶区域相对应的序列、与探针捕获序列相对应的序列和与条形码序列相对应的序列。可以在分区内或在本体中(例如在溶液内)进行延伸的核酸分子的复制和/或扩增。在一些情况下,溶液可以包含通过在不同分区中进行的相同过程产生的附加延伸的核酸分子。每个延伸的核酸分子可以包含不同的条形码序列,并且该条形码序列可用于鉴定延伸的核酸分子来源的分区或细胞。在此类情况下,溶液可以包含合并的混合物,该合并的混合物包含两个或更多个分区(例如,液滴)的内容物。
可以在一个分区内执行附加过程或操作,包括但不限于:样品的一种或多种组分的裂解、透化、变性、杂交、延伸、复制和扩增。在一些情况下,在一个分区内进行多个过程。
可以在一个分区内或分区外部执行探针序列与核酸分子的靶区域的杂交。在一些情况下,杂交之前可以对双链核酸分子进行变性以提供单链核酸分子,或者对细胞进行裂解或透化。在一些情况下,杂交可以发生在包含细胞的细胞珠粒中。与靶区域互补的探针序列可以位于探针的一端。另选地,该序列可以设置在其他序列之间,使得当探针序列与靶区域杂交时,附加探针序列在一个或多个方向上延伸超过杂交的序列。与核酸分子的靶区域杂交的探针序列可以具有与靶区域相同或不同的长度。例如,探针序列可以比靶区域短,并且可以仅与靶区域的一部分杂交。另选地,探针序列可以比靶区域长,并且可以与整个靶区域杂交并在一个或多个方向上延伸超过靶区域。除了与核酸分子的靶区域互补的探针序列之外,探针还可以包含一个或多个附加探针序列。例如,探针可以包含与靶区域互补的探针序列和第二探针序列。第二探针序列可以具有任何有用的长度和其他特性。
探针(例如,第一探针或第二探针)可以包含一个或多个附加序列或部分,诸如一个或多个条形码序列或独特分子标识符(UMI)序列、衔接子序列、功能序列(例如,引物序列、测序引物序列等)。在一些情况下,探针的一个或多个探针序列可以包含可检测部分,诸如荧光团或荧光部分。在一些情况下,第一探针或第二探针可以包含反应性部分,如本文别处所述。例如,第一探针或第二探针可以包含叠氮化物部分、炔烃部分、硫代磷酸酯部分、碘化物部分、胺部分、磷酸酯部分或它们的组合。第一探针可以包含第一反应性部分,并且第二探针可以包含第二反应性部分,并且第一反应性部分和第二反应性部分的反应可能足以产生探针连接的分子,该探针连接的分子包含与第二探针连接的第一探针。在一些情况下,第一反应性部分和第二反应性部分经由连接反应来连接。因此,第一探针或第二探针可以包含一个或多个部分或修饰的核苷酸以促进连接反应,例如,一个或多个核糖核苷酸或双脱氧核苷酸(ddNTP),其可以使用连接酶(例如,T4DNA连接酶,SplintR连接酶)连接到第二探针的磷酸化末端。在一些情况下,探针(例如,第一探针或第二探针)可以包含可被核酸内切酶(例如,FEN1核酸内切酶)识别或裂解的突出端序列或翘翼序列。可以使用其他合适的酶,例如连接酶,例如2021年4月5日提交的美国临时申请号63/171,031中公开的酶和连接酶,其全文以引用方式并入本文。
如本文所述,探针的探针序列可能能够与核酸条形码分子或探针结合分子(例如,夹板寡核苷酸)的序列杂交。核酸条形码分子可以包含与探针的探针序列(例如,探针捕获序列)互补的第一结合序列(例如,条形码捕获序列)。核酸条形码分子可以包含一个或多个附加功能序列,例如引物序列、引物退火序列和固定化序列。结合序列可以具有任何有用的长度和其他特性。在一些情况下,与探针的探针序列互补的结合序列(例如,条形码捕获序列)可以与探针序列的长度相同。另选地,结合序列可以是不同长度的探针序列。例如,结合序列可以比探针序列短,并且可以仅与探针序列的一部分杂交。另选地,结合序列可以比探针序列长,并且可以与整个探针序列杂交并在一个或多个方向上延伸超过探针序列。类似地,在使用探针结合分子的情况下,核酸条形码分子的结合序列(例如,条形码捕获序列)可以与探针结合分子的条形码结合序列的长度相同,或者结合序列可以比条形码结合序列长或短。
可以在细胞、细胞核或细胞珠粒中进行本文所述的一个或多个过程。例如,在一些实施方案中,多个细胞、细胞核或细胞珠粒可以包含多个核酸分子。细胞、细胞核或细胞珠粒可以是活的或固定的和/或透化的。在一些情况下,可以将第一探针提供给细胞、细胞核或细胞珠粒,诸如在本体溶液中。任选地,可以洗涤细胞、细胞核或细胞珠粒以去除未结合的第一探针,并且可以执行如本文所述的核酸延伸反应。随后,可以将包含多个核酸分子(或延伸的探针核酸分子)的细胞、细胞核或细胞珠粒分隔到多个单独分区中,其中多个单独分区的至少一个子集包括单个细胞、单个细胞核或单个细胞珠粒。可以通过裂解或透化细胞核或细胞(例如,如本文所述)(这可以在分隔之前或期间执行)来接近包含在一个分区中的细胞、细胞核或细胞珠粒内的靶核酸分子。可以在单独的分区内执行附加探针杂交(例如,提供第二探针)和/或加条形码。如本文所述,加条形码可以包括使用核酸条形码分子来附着或杂交到靶核酸分子或其衍生物(例如,延伸的探针分子或其互补序列)。多个单独分区中的每个分区内提供的核酸条形码分子可以被提供为附着到珠粒。在一些情况下,如本文别处所述,核酸条形码分子可以可释放地附着到珠粒(例如,经由不稳定键)。多个单独分区中的每个分区(或分区的子集)可以包括珠粒,该珠粒包含附着于其上的多个核酸条形码分子(例如,如本文所述)。附着到每个珠粒的多个核酸条形码分子可以包含独特条形码序列,使得多个单独分区中的每个分区包括不同的条形码序列。在从多个单独分区中的多个不同分区释放组分时(例如,在加条形码之后),源自单个细胞、单个细胞核或单个细胞珠粒的加有条形码的分子可以具有相同的条形码序列(例如,共同条形码序列),使得每个加有条形码的核酸分子可以被追溯到给定的分区和/或在一些情况下,给定的细胞、细胞核或细胞珠粒。
本文所述的方法可以包括附加的加条形码操作,其可用于例如将核酸分子索引到细胞、细胞核、细胞珠粒、样品、一个分区或多个分区。这种索引可用于单个分区被多个细胞、细胞核或细胞珠粒占据时的情况。在一些情况下,可能有利的是使分区过载,使得一个分区包括不止单个细胞、单个细胞核或单个细胞珠粒;例如,在某些情况下可能有用的是使分区过载,例如,克服分区中的泊松负载统计和/或防止试剂浪费(例如,由未被占据的分区引起)。因此,这种索引可用于将多重占据的分区中的细胞、细胞核或核酸分子归属于起始细胞、细胞核、细胞珠粒、分区、样品等。
在一个实例中,可以提供加有条形码的分子,诸如使用本文所述的方法产生的加有条形码的分子(例如,在图7至图9、图25至图28中,以及在美国专利公开号2020/0239874和国际公开号WO 2019/165318中描述的加有条形码的、探针连接的核酸分子,以上文献中的每一者以引用方式并入本文)。如本文所述,加有条形码的分子可以包含与第一靶区域相对应的序列、与第二靶区域相对应的序列、与探针捕获序列(其可以设置在第一探针或第二探针上)相对应的序列和与核酸条形码分子的条形码序列相对应的序列。这种条形码序列可能对该分区是特异的,并且可能不同于其他分区的其他条形码序列,因此可以用于鉴定核酸分子(或其衍生物)所源自的分区。在一些情况下,一些分区可以包括单个细胞、单个细胞核或单个细胞珠粒,因此核酸条形码分子或条形码序列可以用于鉴定核酸分子(或其衍生物)所源自的细胞、细胞核或细胞珠粒。
在一些情况下,加有条形码的分子可以经受附加的加条形码操作(例如,在分区中或在本体中)。例如,加有条形码的分子可以被重新分隔在包括多个附加核酸条形码分子的多个分区中的一个分区中。多个附加核酸条形码分子可以包含在各分区之间不同的附加条形码序列。加有条形码的分子可以经受足以为加有条形码的分子加条形码的条件,以产生包含两个条形码序列的组合式加条形码的分子。由于每个条形码序列属于一个独特分区,所以条形码的组合可用于产生更加多样化的加有条形码的分子,以及用于鉴定组合式加条形码的分子的起始分区。
在一些情况下,可以使用例如分裂池方法执行条形码片段的组合组装。例如,在一些实施方案中,可以使用分裂池方法对探针连接的核酸分子进行组合式加条形码。在一个这样的实例中,可以将包含例如任选地可以加有条形码的、探针连接的核酸分子(例如,图7的操作709、图8的操作805或图9的操作905或907后的产物)的多个透化细胞(或透化细胞核或细胞珠粒)分隔到多个分区(例如,多个孔)中,其中多个分区中的每个分区包括不同的(即,独特的)条形码序列片段。另选地,可以将多个透化细胞(或透化细胞核或细胞珠粒)分隔,然后将不同的条形码序列片段递送到包含细胞、细胞核和/或细胞珠粒的相应分区。在添加条形码序列片段之后,可以从多个分区中收集细胞(或细胞核或细胞珠粒),将其合并并且分隔到附加的多个分区(例如,多个孔)中,其中附加的多个分区中的每个分区包括不同的(即,独特的)第二条形码序列片段。重复该分裂池过程允许产生包含任何合适量的条形码序列片段的条形码或加有条形码的分子。如本文所述的组合式加条形码可以包括至少1、2、3、4、5、6、7、8个或更多个操作(例如,分裂池循环)。包括多个操作的组合式加条形码可用于例如产生更大的条形码多样性,以及在源自多个细胞、细胞核、细胞珠粒中的每个单细胞、细胞核或细胞珠粒的核酸分子上合成独特的条形码序列。例如,包括三个操作(每个操作包括在96个分区的每个分区中附着一个独特的核酸序列)的组合式加条形码将产生至多884,736个独特的条形码组合。通常,在存在M个分区并且执行N次分裂池迭代的情况下,可以产生至多MN个独特的条形码组合。可以分隔细胞或细胞核或细胞珠粒,使得在多个分区的每个分区中存在至少一个细胞(或细胞核或细胞珠粒)。可以分隔细胞、细胞核或细胞珠粒,使得单个分区中存在至少1;2;3;4;5;10;20;50;100;500;1,000;5,000;10,000;100,000;1,000,000;或更多个细胞、细胞核或细胞珠粒。可以分隔细胞、细胞核或细胞珠粒,使得单个分区中存在至多1,000,000;100,000;10,000;5,000;1,000;500;100;50;20;10;5;4;3;2;或1个细胞(或细胞核或细胞珠粒)。可以以随机的配置分隔细胞、细胞核和/或细胞珠粒。
在一些情况下,可以在本文所述的一些操作之前执行附加的加条形码操作。例如,可能有利的是例如在产生延伸的探针分子或探针连接的分子之前或之后,在本体溶液中对第一探针进行组合式加条形码。在此类情况下,可以使核酸分子例如在本体中与第一探针接触,以产生探针缔合的分子。可以任选地例如使用本文所述的方法延伸探针缔合的分子,以产生延伸的探针分子。然后,探针缔合的分子或延伸的探针分子可以例如如上所述在分区中经受组合式加条形码,以产生组合式加条形码的分子。然后可以将组合式加条形码的分子与第二探针和核酸条形码分子一起分隔,如本文所述,该核酸条形码分子可以附着到第一探针(或组合式加条形码的探针)、第二探针或这两种探针。由于组合式加条形码过程的每个分区包括不同的条形码序列片段,所以多个组合式加条形码的分子可以追溯到它们所源自的单独分区。此外,组合式加条形码可用于产生更大的探针多样性。
有利的是,当与第二探针和核酸条形码分子组合时,第一探针的组合式加条形码可能特别有用,该核酸条形码分子可以包含对该分区特异的条形码序列。例如,探针特异性条形码和分区特异性条形码序列的存在可以允许对分区内的单独细胞(或细胞核或细胞珠粒)进行索引。例如,包含细胞/细胞核/细胞珠粒多重体(例如,细胞双联体、三联体等)的分区可以在计算上解卷积为单个细胞/细胞核/细胞珠粒。因此,在一些情况下,可以使用条件将细胞、细胞核或细胞珠粒“过载”到分区中,使得有更高概率形成细胞/细胞核/细胞珠粒多重体(每个分区2、3、4、5+个细胞、细胞核或细胞珠粒),其中这些细胞多重体的靶文库可以在计算上解卷积为单个细胞、细胞核或细胞珠粒。
图10示意性地示出了在包含细胞/细胞核/细胞珠粒多重体的分区中为核酸分子加条形码的示例工作流程。在操作1010中,一个或多个细胞/细胞核/细胞珠粒(或其中包含的核酸分子)群体可以经受加条形码,如本文所述(例如,使用图7至图9和图15至图16中所示和所述的过程)。例如,第一细胞(或细胞核或细胞珠粒)群体1002(包含第一多个核酸分子)可以在第一多个分区的第一子集中经受加条形码,产生包含第一条形码序列的第一多个加有条形码的核酸分子。第二细胞(或细胞核或细胞珠粒)群体1004可以在第一多个分区的第二子集中进行加条形码,产生包含第二条形码序列的第二多个加有条形码的核酸分子。第一条形码序列可能不同于第二条形码序列。在操作1020中,可以将第一细胞(或细胞核或细胞珠粒)群体1002与第二细胞(或细胞核或细胞珠粒)群体1004合并在一起,以产生细胞的混合物。在操作1030中,可以将细胞(或细胞核或细胞珠粒)的混合物分隔到第二多个分区中。在一些情况下,可以将细胞/细胞核/细胞珠粒的混合物分隔到第二多个分区中,使得第二多个分区中的一些分区包括超过一个细胞(例如,细胞多重体分区)。例如,第二多个分区中的分区1035可以包括来自第一细胞群体1002的细胞、细胞核或细胞珠粒(“细胞A”)和来自第二细胞群体1004的细胞、细胞核或细胞珠粒(“细胞B”)。分区1035可以包括附加条形码序列,该附加条形码序列可以是该分区特有的。每个分区中的细胞/细胞核/细胞珠粒可以经受附加的加条形码操作,以在加有条形码的核酸分子上补加附加条形码序列。在操作1040中,可以使用不同的条形码序列(例如,第一条形码序列、第二条形码序列和附加条形码序列)对加有条形码的核酸分子进行解卷积,以鉴定起始细胞/细胞核/细胞珠粒。例如,包含来自分区1035的附加条形码序列和来自第一细胞(或细胞核或细胞珠粒)群体1002的第一条形码序列的加有条形码的核酸分子可以用于将该加有条形码的核酸分子鉴定为源自细胞A。类似地,包含来自分区1035的附加条形码序列和来自第二细胞(或细胞核或细胞珠粒)群体1004的第二条形码序列的加有条形码的核酸分子可以用于将该加有条形码的核酸分子鉴定为源自细胞B。
在基于分区的加条形码之后,可以合并分区的内容物,并且可以通过例如一个或多个扩增反应来复制或扩增加有条形码的分子(例如,加有条形码的、探针连接的核酸分子),在一些情况下,该一个或多个扩增反应可以是等温的。扩增反应可以包括聚合酶链反应(PCR),并且可以涉及使用一种或多种引物或聚合酶。一种或多种引物可以包含一个或多个功能序列(例如,引物序列/引物结合序列、测序引物序列(例如,R1或R2)、部分测序引物序列(例如,部分R1或部分R2)、被配置为附着到测序仪的流动池的序列(例如,P5或P7,或其部分序列)等)并且可以促进将所述一个或多个功能序列添加到延伸的核酸分子。加有条形码的分子或其衍生物可以经由核酸测序来检测(例如,如本文所述)。
在一些方面,本文提供了可用于为核酸分子加条形码的系统。系统可以包括本文所述的任何部件,例如多个分区(例如,液滴、孔),其可以以任何有用的形式提供,例如微流体装置、多孔阵列或板等。该系统可以包括核酸条形码分子,其任选地偶联到支持物(例如,颗粒、珠粒、凝胶珠粒等)。在一些情况下,该系统可以包括本文所述的任何探针,诸如第一探针或多个第一探针、第二探针或多个第二探针,以及任何有用的反应组分(例如,用于进行核酸反应,例如延伸、连接、扩增等)。在非限制性实例中,此类有用的反应组分可以包括酶(例如,连接酶、聚合酶、逆转录酶、限制性酶等)、核苷酸碱基等。
本文还提供了对于为核酸分子加条形码的系统和方法有用的组合物。组合物可以包含本文所述的任何探针。例如,组合物可以包含多个第一探针、多个第二探针和/或多个第一探针和多个第二探针。一个探针或一组探针可以被设计成靶向特异性序列或一组特异性序列。此类探针可以被设计成在不同的分区内具有相同或不同的序列。例如,第一组合物可以包含被设计成靶向第一基因的两个区域的第一探针和第二探针,并且第二组合物可以包含被设计成靶向第二基因的两个区域的第一探针和第二探针,该第二基因不同于第一基因。组合物可以包含核酸条形码分子和/或探针结合分子,其可以任选地被提供为偶联到支持物(例如,颗粒、珠粒)。组合物可以是反应混合物的一部分或包含反应混合物,该反应混合物可以包含反应组分或试剂,例如酶、核苷酸碱基、催化剂、缓冲液等。
核酸和蛋白质的多重分析
在另一个方面,本公开提供了用于进行多重测定的方法。这种多重测定可以包括测定或分析一种或多种生物分子(例如,核酸分子、蛋白质、脂质、碳水化合物等)。方法可以包括使用一个或多个探针和核酸条形码分子为细胞/细胞核/细胞珠粒的核酸分子加条形码,从而产生第一加有条形码的核酸分子;将特征结合基团附着或偶联到细胞/细胞核/细胞珠粒的特征,其中特征结合基团包含报告寡核苷酸,该报告寡核苷酸包含识别特征结合基团的报告序列;使用附加核酸条形码分子和任选的附加探针为报告序列加条形码,以产生第二加有条形码的核酸分子;以及任选地为第一加有条形码的核酸分子和第二加有条形码的核酸分子加条形码,以产生第三加有条形码的核酸分子和第四加有条形码的核酸分子。可以在一个分区(例如,液滴或孔)内执行一个或多个操作。
本文所述的方法可以促进使用例如探针杂交、特征结合基团(例如,抗体、抗体片段、表位结合基团等)、加条形码、扩增和测序以单细胞/单细胞核/单细胞珠粒分辨率对一种或多种生物分子进行谱分析。该方法可用于从单个细胞/细胞核/细胞珠粒提供基因组、转录组、蛋白质组、外显子组或其他“组学”信息。如本文所述,该方法可以用于以灵敏和准确的方式分析一组预定的靶基因和一组预定的靶特征(例如,蛋白质、肽或其他生物分子)。另选地或此外,该方法可以用于分析细胞的全基因组、全转录组、全外显子组等特性。
在一些方面,该方法包括在足以产生第一探针缔合的分子和第二探针缔合的分子的条件下,使细胞/细胞核/细胞珠粒与第一探针、第二探针和第三探针接触。细胞/细胞核/细胞珠粒可以包含:(i)包含第一靶区域和第二靶区域的核酸分子(例如,靶核酸分子,诸如RNA或DNA),和(ii)偶联到特征结合基团的特征(例如,蛋白质、肽或其他生物分子)。特征结合基团可以包含或偶联到:(i)包含报告序列的报告寡核苷酸,其可以与特征缔合或可以用于鉴定特征,和(ii)特征探针结合序列。第一探针可以包含与核酸分子的第一靶区域互补的第一探针序列,以及任选的附加探针序列,诸如探针捕获序列或其他功能序列。第二探针可以包含与第二靶区域互补的第二探针序列,以及任选的探针捕获序列或功能序列。第三探针可以包含(i)与特征探针结合序列互补的第三探针序列,和(ii)探针捕获序列或功能序列,其可以是与第一探针和/或第二探针的探针捕获序列相同的序列。
在一些情况下,第一探针缔合的分子可以包含核酸分子、第一探针、第二探针或其组合或互补序列。第二探针缔合的分子可以包含报告寡核苷酸(其包含报告序列)和第三探针或其互补序列。
在一些方面,该方法包括提供第一探针缔合的分子和第二探针缔合的分子,并且为第一探针缔合的分子和第二探针缔合的分子加条形码。此类加条形码操作可以发生在第一组分区(例如,液滴或孔)中。这种示例方法可以包括在足以产生第一加有条形码的核酸分子和第二加有条形码的核酸分子的条件下,使第一探针缔合的分子和第二探针缔合的分子与探针结合分子(例如,夹板寡核苷酸)和条形码分子(例如,核酸条形码分子)接触。条形码分子可以包含(i)条形码捕获序列,例如为多个条形码分子所共有的共同序列,以及(ii)第一条形码序列。在使用分区的情况下,第一条形码序列可以是第一组分区的第一分区特有的,并且第一分区内的条形码分子可以共享相同的第一条形码序列。探针结合分子可以包含(i)与(第一探针、第二探针和/或第三探针的)探针捕获序列互补的探针结合序列,和(ii)与多个条形码分子的条形码捕获序列(例如,共同序列)互补的条形码结合序列。因此,第一探针缔合的分子和第二探针缔合的分子的加条形码可以包括探针结合分子与以下序列的杂交:(i)第一探针、第二探针和/或第三探针的探针捕获序列(或其互补序列),和(ii)核酸条形码分子的条形码捕获序列(或共同序列)。在一些实例中,第一加有条形码的核酸分子包含与第一探针序列相对应的序列、与第二探针序列相对应的序列和与第一条形码序列相对应的序列。类似地,第二加有条形码的核酸分子可以包含与报告序列相对应的序列、与第三探针序列相对应的序列和与第一条形码序列相对应的序列。
该方法还可以包括提供第二组分区,并且在第二组分区的第二分区中,(i)在足以产生第三加有条形码的核酸分子的条件下,使第一加有条形码的核酸分子或其衍生物(例如,其互补序列、扩增子、延伸产物)与多个捕获分子中的第一捕获分子接触,以及(ii)在足以产生第四加有条形码的核酸分子的条件下,使第二加有条形码的核酸分子或其衍生物与多个捕获分子中的第二捕获分子接触。多个捕获分子可以各自包含第二条形码序列,该第二条形码序列可以与来自第一组分区的第一条形码序列相同或不同。第二条形码序列可以是该分区特有的(即,在各分区之间不同)。第三加有条形码的核酸分子和第四加有条形码的分子可以各自包含与第一条形码序列相对应的序列和与第二条形码序列相对应的序列。例如,第三加有条形码的核酸分子可以包含与第一靶区域相对应的序列、与第二靶区域相对应的序列、与探针捕获序列相对应的序列、第一条形码序列和第二条形码序列。第四加有条形码的核酸分子可以包含与报告序列相对应的序列、与特征探针结合序列相对应的序列、与第三探针相对应的序列、第一条形码序列和第二条形码序列。
特征结合基团可以包括标记剂,如本文别处所述。因此,在一些实例中,特征结合基团可以包括抗体或抗体片段、表位结合部分、蛋白质、肽、亲脂部分(诸如胆固醇)、细胞表面受体结合分子、受体配体、小分子、双特异性抗体、双特异性T细胞衔接体、T细胞受体衔接体、B细胞受体衔接体、抗体前药、适体、单抗体、affimer、darpin和蛋白质支架或它们的任何组合。
第一探针(或第二探针)的探针捕获序列可以为多个第一探针(或第二探针)、多个分区和/或多个细胞/细胞核/细胞珠粒所共有。例如,第一组分区可以包括一个或多个附加分区,其包括附加探针缔合的核酸分子。附加探针缔合的核酸分子可以包含与第一分区的探针缔合的核酸分子相同的序列(例如,第一探针序列、第二探针序列),或者附加分区的附加探针缔合的核酸分子可以包含与第一分区的探针缔合的核酸分子不同的序列(例如,不同的探针序列)。在一些情况下,一个或多个附加探针缔合的核酸分子中的每一者都包含探针捕获序列,其在第一组分区中可以是相同的或不同的。
探针缔合的分子可以是探针连接的分子。例如,探针缔合的分子可以是本文所述的探针缔合的分子或加有条形码的分子(例如,在图7至图9中),或者是探针连接的分子,诸如美国专利公开号2020/0239874和国际公开号WO 2019/165318中所述的那些,以上文献中的每一者均全文以引用方式并入本文。在一些实例中,可以产生两组探针缔合的分子,其中:(i)第一探针缔合的分子包含核酸分子,其中第一探针和第二探针与该核酸分子杂交(例如,经由第一探针序列与第一靶区域的杂交以及第二探针序列与第二靶区域的杂交),并且(ii)第二探针缔合的分子包含报告寡核苷酸(其包含报告序列),其中第三探针与该报告寡核苷酸杂交。
第一探针、第二探针和/或第三探针可以包含探针捕获序列。第一探针上的探针捕获序列可以与第二探针或第三探针的探针捕获序列相同或不同。类似地,第二探针的探针捕获序列可以与第三探针的探针捕获序列相同或不同。因此,本文所述的加条形码操作可以发生在第一探针、第二探针、第三探针或它们的任何组合上。例如,对于包含核酸分子及与之杂交的第一探针(“探针1”)和第二探针(“探针2”)的探针缔合的分子,包含第一条形码序列(“BC1”)的第一条形码分子可以与第一探针杂交(例如,直接或经由探针结合分子)以产生第一加有条形码的核酸分子,并且随后包含第二条形码序列(“BC2”)的捕获分子可以退火到第一条形码分子的区域,从而产生包含BC2-BC1-探针1-探针2的序列或互补序列的分子。另选地或此外,包含第一条形码序列(“BC1”)的第一条形码分子可以与第二探针杂交(例如,直接或经由探针结合分子)以产生第一加有条形码的核酸分子,并且随后包含第二条形码序列(“BC2”)的捕获分子可以退火到第一条形码分子的区域,从而产生包含探针1-探针2-BC1-BC2序列的分子。另选地或此外,条形码分子和捕获分子可以退火到不同的探针。例如,包含第一条形码序列(“BC1”)的第一条形码分子可以与第一探针杂交(例如,直接或经由探针结合分子)以产生第一加有条形码的核酸分子,并且随后包含第二条形码序列(“BC2”)的捕获分子可以退火到第二探针,从而产生包含BC1-探针1-探针2-BC2序列的分子。另选地或此外,包含第一条形码序列(“BC1”)的第一条形码分子可以与第二探针杂交(例如,直接或经由探针结合分子)以产生第一加有条形码的核酸分子,并且随后包含第二条形码序列(“BC2”)的捕获分子可以退火到第一探针,从而产生包含BC2-探针1-探针2-BC1序列的分子。应当理解,虽然本文描述了加条形码方案的若干实例,但是条形码序列的附加组合和定位是可能的;例如,组合式加条形码可以用于产生更大的条形码多样性,如本文所述,并且这种加条形码可以发生在任何探针分子(或已加有条形码的分子)上。
在一些情况下,条形码分子可以包含与多个捕获分子的捕获序列互补的捕获结合序列。例如,第一探针可以包含可以与探针结合分子杂交的探针捕获序列,该探针结合分子可以介导条形码分子的杂交(例如,经由探针结合分子的条形码结合序列与条形码分子的条形码捕获序列(例如,共同序列)的杂交)。条形码分子可以另外包含捕获结合序列,这可以允许捕获分子的捕获序列与条形码分子杂交。
图15示意性地示出了如本文所述的示例加有条形码的核酸分子。参见图A,可以提供包含第一靶区域1502和第二靶区域1504的核酸分子(例如,RNA分子)1500。可以使核酸分子1500与包含第一探针序列1508和任选的第一探针捕获序列1510的第一探针1506接触。第一探针序列1508可以与第一靶区域1502互补。另外,在一些情况下,第一探针捕获序列1510可以包含功能序列,诸如引物序列、部分引物序列、条形码序列、测序引物序列等。还可以使核酸分子1500与包含第二探针序列1514和任选的第二探针捕获序列1518的第二探针1516接触。第二探针序列1514可以与第二靶区域1504互补。第二探针捕获序列1518可以另外包含功能序列。第一探针1506和第二探针1516与核酸分子1500的杂交可以产生探针缔合的分子。
如本文所述,探针缔合的分子可以经受一次或多次加条形码操作。这种加条形码操作可以发生在一个或多个分区(例如,第一组分区)中,并且可以包括使探针结合分子1517和包含条形码捕获序列(例如,共同序列)的条形码分子1519与探针缔合的分子杂交。在一些情况下,探针结合分子1517和条形码分子1519可以作为预退火复合物提供,或者它们可以作为单独的分子提供。条形码捕获序列(例如,共同序列)可以是为第一组分区中的多个条形码分子所共有的序列,或者共同序列可以是仅单个第一分区中的条形码分子特有的(即,共同序列在第一组分区的各分区之间不同)。探针结合分子1517可以包含与第二探针1516的探针捕获序列1518互补的探针结合序列,以及与条形码分子1519的序列互补的条形码结合序列。探针缔合的分子可以经受足以产生第一加有条形码的核酸分子的条件,其可以包括探针结合分子1517退火到(i)探针捕获序列1518和(ii)条形码分子1519的条形码捕获序列(例如,共同序列)。加条形码过程可以包括附加操作,诸如连接,其可以以化学方式或酶促方式进行,如本文别处所述。
第一加有条形码的核酸分子或其衍生物(例如,互补序列、扩增子、延伸产物、组合式加条形码的核酸分子,如本文别处所述)可以经受第二加条形码操作。这种第二加条形码操作可以发生在第二组分区中。例如,可以将第一加有条形码的核酸分子从第一组分区中取出,合并(例如,与来自第一组分区的其他第一分区的其他加有条形码的核酸分子合并),并分隔在第二组分区的第二分区中。第二分区可以包括捕获分子1520。捕获分子1520可以包含第二条形码序列和与第一探针1506的探针捕获序列1510互补的序列。第二条形码序列可以是为第二组分区中的多个捕获分子所共有的序列,或者条形码序列可以是仅第二分区中的捕获分子特有的(即,在各分区之间不同)。捕获分子1520可以与探针捕获序列1510杂交,以产生附加的加有条形码的分子(本文也称为“第三加有条形码的核酸分子”)。附加的加有条形码的分子可以包含与(条形码分子1519的)第一条形码序列相对应的序列,以及与(捕获分子1520的)第二条形码序列相对应的序列。
图15的图B示意性地示出了另一个示例加有条形码的分子,其中捕获分子1520与条形码分子1519杂交。与图A类似,在图B中,可以提供包含第一靶区域1502和第二靶区域1504的核酸分子(例如,RNA分子)1500。可以使核酸分子1500与包含第一探针序列1508和探针捕获序列1510的第一探针1506接触。第一探针序列1508可以与第一靶区域1502互补。另外,探针捕获序列1510可以包含功能序列,诸如引物序列、部分引物序列、条形码序列、测序引物序列等。还可以使核酸分子1500与包含第二探针序列1514和任选的附加序列1518的第二探针1516接触。第二探针序列1514可以与第二靶区域1504互补。附加序列1518可以包含例如探针捕获序列或功能序列(例如,引物、引物结合位点、测序引物序列等)。第一探针1506和第二探针1516与核酸分子1500的杂交可以产生探针缔合的分子。
可以使探针缔合的分子与一个或多个条形码分子接触。如本文所述,此类加条形码操作可以发生在多个分区(例如,第一组分区的第一分区和/或第二组分区的第二分区)中。可以使探针缔合的分子与探针结合分子1517和条形码分子1519接触,该条形码分子可以包含第一条形码捕获序列(例如,共同序列)和第二条形码捕获序列1521(本文也称为“捕获结合序列”)。在一些情况下,探针结合分子1517和条形码分子1519可以作为预退火复合物提供,或者作为单独的分子提供。第一条形码捕获序列(例如,共同序列)可以是为第一组分区中的多个条形码分子所共有的序列,或者共同序列可以是仅第一分区中的条形码分子特有的(即,在各分区之间不同)。探针结合分子1517可以包含与探针捕获序列1510互补的探针结合序列,以及与条形码分子1519的第一条形码捕获序列(例如,共同序列)互补的条形码结合序列。探针缔合的分子可以经受足以产生第一加有条形码的核酸分子的条件,其可以包括探针结合分子1517退火到(i)探针捕获序列1510和(ii)条形码分子1519的第一条形码捕获序列(例如,共同序列)。加条形码过程可以包括附加操作,诸如连接,其可以以化学方式或酶促方式进行,如本文别处所述。
第一加有条形码的核酸分子或其衍生物可以经受第二加条形码操作。这种第二加条形码操作可以发生在第二组分区中。例如,可以将第一加有条形码的核酸分子从第一分区中取出,并分隔在第二组分区(例如,液滴)的第二分区中。第二分区可以包括捕获分子1520。捕获分子1520可以包含第二条形码序列和与条形码分子1519的第二条形码捕获序列1521互补的序列。第二条形码序列可以是为第二组分区中的多个捕获分子所共有的序列,或者条形码序列可以是仅第二分区中的捕获分子特有的(即,在各分区之间不同)。捕获分子可以与第二条形码捕获序列1521杂交,以产生附加的加有条形码的分子(本文也称为“第三加有条形码的核酸分子”)。附加的加有条形码的分子可以包含与(条形码分子1519的)第一条形码序列相对应的序列,以及与(捕获分子1520的)第二条形码序列相对应的序列。
图15的图C示出了另一个示例加有条形码的核酸分子。可以提供包含第一靶区域1502和第二靶区域1504的核酸分子(例如,RNA分子)1500。可以使核酸分子1500与包含第一探针序列1508和任选的第一探针捕获序列1510的第一探针1506接触。第一探针序列1508可以与第一靶区域1502互补。另外,在一些情况下,第一探针或第一探针捕获序列1510可以包含功能序列,诸如引物序列、部分引物序列、条形码序列、测序引物序列等。还可以使核酸分子1500与包含第二探针序列1514和任选的第二探针捕获序列1518的第二探针1516接触。第二探针序列1514可以与第二靶区域1504互补。第二探针捕获序列1518可以另外包含功能序列。第一探针1506和第二探针1516与核酸分子1500的杂交可以产生探针缔合的分子或复合物。
如本文所述,探针缔合的分子可以经受一次或多次加条形码操作。这种加条形码操作可以发生在一个或多个分区(例如,第一组分区)中,并且可以包括使探针结合分子1517和包含条形码捕获序列(例如,共同序列)的条形码分子1519与探针缔合的分子或复合物杂交。在一些情况下,探针结合分子1517和条形码分子1519作为预退火复合物(例如,包含探针结合分子1517和条形码分子1519的部分双链分子)提供,或者它们可以作为单独的分子提供,这些单独的分子可以单独退火到探针缔合的分子或复合物(例如,探针结合分子1517可以例如经由第二探针捕获序列1518与探针缔合的分子或复合物杂交,并且条形码分子1519可以与探针结合分子1517杂交)。条形码捕获序列(例如,共同序列)可以是为第一组分区中的多个条形码分子所共有的序列,或者共同序列可以是仅单个第一分区中的条形码分子特有的(即,共同序列在第一组分区的各分区之间不同)。探针结合分子1517可以包含与第二探针1516的探针捕获序列1518互补的探针结合序列,以及与条形码分子1519的序列互补的条形码结合序列。在一些情况下,探针结合分子1517和/或条形码分子1519包含附加序列,例如衔接子序列、引物序列(例如,测序引物序列或部分测序引物序列)、UMI、样品索引序列等。在一些情况下,探针结合分子1517包含条形码分子1519的完整序列,因此没有留下突出端。在一些情况下,探针结合分子1517和条形码分子1519包含样品索引序列,其可用于鉴定靶核酸分子1500所源自的分区、细胞、细胞核或细胞珠粒。探针缔合的分子可以经受足以产生第一加有条形码的核酸分子的条件,其可以包括探针结合分子1517退火到(i)探针捕获序列1518和(ii)条形码分子1519的条形码捕获序列(例如,共同序列)。加条形码过程可以包括附加操作,诸如连接(例如,条形码分子1519与探针捕获序列1518的连接),其可以以化学方式或酶促方式进行,如本文别处所述。
第一加有条形码的核酸分子或其衍生物(例如,互补序列、扩增子、延伸产物、组合式加条形码的核酸分子,如本文别处所述)可以经受第二加条形码操作。这种第二加条形码操作可以发生在第二组分区中。例如,可以将第一加有条形码的核酸分子从第一组分区中取出,合并(例如,与来自第一组分区的其他第一分区的其他加有条形码的核酸分子合并),并分隔在第二组分区的第二分区中。第二分区可以包括捕获分子1520。捕获分子1520可以包含第二条形码序列和与第一探针1506(和/或第二探针1516)的探针捕获序列1510互补的序列。第二条形码序列可以是为第二组分区中的多个捕获分子所共有的序列,或者条形码序列可以是仅第二分区中的捕获分子特有的(即,在各分区之间不同)。捕获分子1520可以与探针捕获序列1510杂交,以产生附加的加有条形码的分子(本文也称为“第三加有条形码的核酸分子”)。附加的加有条形码的分子可以包含与(条形码分子1519的)第一条形码序列相对应的序列,以及与(捕获分子1520的)第二条形码序列相对应的序列。
除了为核酸分子加条形码之外,本公开还提供了多重分析(例如,处理附加生物分子类型,诸如蛋白质和肽)的方法。该方法可以包括提供特征结合基团(例如,抗体、蛋白质、结合部分等),其可以偶联到或结合于细胞、细胞核或细胞珠粒的特征(例如,蛋白质、肽)。这种方法可以包括提供具有感兴趣的特征(例如,蛋白质)的细胞、细胞核或细胞珠粒,并使细胞、细胞核或细胞珠粒与特征结合基团接触。特征结合基团可以偶联到感兴趣的特征。特征结合基团可以包含报告寡核苷酸,该报告寡核苷酸包含与之偶联的报告序列,该报告序列对于特定特征可以具有特异性,因此用于鉴定该特征。例如,特征结合基团可以是抗体,并且报告寡核苷酸可以包含鉴定抗体偶联或结合的抗原或结合部分(例如,表位、表位片段)的报告序列。另选地或此外,特征结合基团可以包含特征探针结合序列,其可以用于下游探针结合和/或加条形码。在细胞(细胞核或细胞珠粒)与特征结合基团接触后,细胞/细胞核/细胞珠粒可以包含偶联到特征结合基团的特征。
在一些情况下,本文所述的方法可以另外包括:提供包含(i)包含第一靶区域和第二靶区域的核酸分子以及(ii)偶联到特征结合基团的特征的细胞、细胞核或细胞珠粒,并使细胞、细胞核或细胞珠粒与多个探针接触。可以使细胞/细胞核/细胞珠粒与第一探针、第二探针和第三探针接触(例如,在第一分区中)。如本文所述,第一探针和第二探针可以与核酸分子的第一靶区域和第二靶区域缔合,从而产生第一探针缔合的分子。类似地,第三探针可以(例如,经由杂交)与特征结合基团缔合,从而产生第二探针缔合的分子。在一些情况下,第三探针可以包含与特征探针结合序列互补的第三探针序列,并且在一些情况下,第三探针可以另外包含探针捕获序列。第一探针和/或第二探针还可以包含探针捕获序列,其可以与第三探针的探针捕获序列相同或不同。
在第一组分区中,可以为第一探针缔合的分子(例如,具有与之缔合的第一探针和第二探针的核酸分子)和第二探针缔合的分子(例如,具有与之缔合的第三探针的特征结合基团)加条形码。这种加条形码操作可以包括例如提供包含第一条形码序列和条形码捕获序列(诸如共同序列)的条形码分子,其可以例如经由探针捕获序列直接与第一探针缔合的分子和第二探针缔合的分子杂交。另选地或此外,可以为条形码分子提供探针结合分子,其包含(i)与第一探针、第二探针和/或第三探针的探针捕获序列互补的探针结合序列,以及(ii)可以与条形码分子的共同序列互补的条形码结合序列。在一些情况下,探针结合分子和条形码分子可以作为预退火复合物提供。第一探针缔合的分子和第二探针缔合的分子的加条形码可以包括条形码分子(例如,条形码捕获序列诸如共同序列)与第一探针缔合的分子和第二探针缔合的分子的一部分(例如,探针捕获序列)的杂交,或者加条形码可以包括条形码分子与探针结合分子的杂交以及探针结合分子与第一探针缔合的分子或第二探针缔合的分子的杂交。可以执行诸如连接(例如,酶促连接或化学连接)的附加操作,以产生第一加有条形码的分子和第二加有条形码的分子。
第一加有条形码的分子和第二加有条形码的分子可以例如在第二组分区中经受附加的加条形码操作。此类附加的加条形码操作可以包括:使第一加有条形码的核酸分子或其衍生物与多个捕获分子中的第一捕获分子接触,以产生第三加有条形码的核酸分子,以及使第二加有条形码的核酸分子或其衍生物与多个捕获分子中的第二捕获分子接触,以产生第四加有条形码的核酸分子。一个分区内的捕获分子可以各自包含第二条形码序列,该第二条形码序列可以是该分区特有的(即,在各分区之间不同)。因此,第三加有条形码的核酸分子和第四加有条形码的核酸分子都可以包含第一条形码序列(或其互补序列)和第二条形码序列(或其互补序列)。
图16A示意性地示出了用于为细胞、细胞核或细胞珠粒的多种分析物加条形码的示例工作流程。细胞、细胞核或细胞珠粒1600可以包含核酸分子(例如,RNA分子或其他靶核酸分子)1601,该核酸分子包含第一靶区域1602和第二靶区域1604。细胞、细胞核或细胞珠粒可以另外包含特征(例如,蛋白质,诸如细胞表面受体(或核膜蛋白质)或细胞内/细胞核内蛋白质)1650。在一些情况下,细胞、细胞核或细胞珠粒1600可以被处理,例如被固定、被透化、用处理方法处理等。在一些情况下,这种处理可以包括提供一种或多种特征结合基团(例如,抗体、抗体片段等)1652,该一种或多种特征结合基团可以偶联到特征1650。特征结合基团1652可以包含或偶联到报告寡核苷酸1657,该报告寡核苷酸可以包含报告序列1654。报告序列1654可以指示特征结合基团1652或特征1650。例如,报告序列1654可以被预先索引或分配到特定的抗体或其他特征结合基团,使得报告序列1654的存在指示样品中特定特征1650的存在。特征结合基团1652或报告寡核苷酸1657还可以包含或偶联到特征探针结合序列1656。在一些情况下,可以使细胞、细胞核或细胞珠粒1600与特征结合基团1652接触并固定,例如作为接触前的固定和透化操作的补充或替代。
在一些情况下,可以执行细胞(或细胞核)的细胞内和/或细胞核内蛋白质和膜蛋白质的分析。在一个实施方案中,可以使透化的(和任选固定的)细胞(或细胞核)与以下特征结合基团接触:(i)被配置为偶联到细胞内蛋白质(或细胞核内蛋白质)的一种或多种特征结合基团(或标记试剂),和/或(ii)被配置为偶联到细胞膜蛋白质(或核膜蛋白质)的一种或多种特征结合基团(或标记试剂)。如本文进一步所述,透化可以涉及部分或完全溶解或破坏细胞膜(或核膜)或其一部分。透化可以通过例如使细胞膜(或核膜)与有机溶剂(例如,甲醇)或去污剂(诸如Triton X-100或NP-40)接触来实现。如本文别处所述,细胞、细胞核或细胞珠粒可以是固定的。
再次参见图16A,类似于1652的第二特征结合基团(或标记试剂)(未示出)可以用于偶联到细胞内特征,诸如细胞内蛋白质,并且包含或偶联到第二报告寡核苷酸,该第二报告寡核苷酸可以包含第二报告序列。第二报告序列可以指示第二特征结合基团或细胞内特征。例如,第二报告序列可以被预先索引或分配到特定的抗体或其他特征结合基团,使得第二报告序列的存在指示样品中特定细胞内特征的存在。第二特征结合基团或第二报告寡核苷酸还可以包含或偶联到与1656类似的第二特征探针结合序列。
可以在足以产生第一探针缔合的分子(或探针缔合的复合物)1630和第二探针缔合的分子(或探针缔合的复合物)1665的条件下,使细胞、细胞核或细胞珠粒1600与第一探针1606、第二探针1616和第三探针1658接触。如本文别处所述,第一探针缔合的分子1630可以是或包含探针连接的分子。例如,第一探针缔合的分子1630(或探针连接的分子)可以是本文所述的任何探针缔合的分子或探针连接的分子(例如,从延伸的探针、加有条形码的延伸的探针等产生的分子)。第一探针1606可以包含第一探针序列1608和任选的探针捕获序列1610。第一探针序列1608可以与第一靶区域1602互补。第二探针1616可以包含第二探针序列1615和任选的探针捕获序列1618。第二探针序列1615可以与第二靶区域1604互补。第三探针1658可以包含第三探针序列1660和探针捕获序列1662。第三探针序列1660可以与特征探针结合序列1656互补。在一些情况下,探针捕获序列1662是分别与第一探针和/或第二探针的探针捕获序列1610、1618相同的探针捕获序列。
在一个实施方案中,可以在产生附加探针缔合的分子或探针缔合的复合物的条件下,进一步使细胞、细胞珠粒或细胞核1600与附加探针接触。如本文别处所述,附加探针缔合的分子可以是或包含探针连接的分子。例如,附加探针缔合的分子或探针连接的分子可以是本文所述的任何探针缔合的分子或探针连接的分子(例如,从延伸的探针、加有条形码的延伸的探针等产生的分子)。在一个实施方案中,可以进一步使细胞(或细胞珠粒或细胞核)1600与类似于1658的第四探针(未示出)接触,该第四探针包含(i)类似于1660的第四探针序列和(ii)类似于1662的第四探针捕获序列。如本文进一步所述,第四探针序列可以与第二特征探针结合序列互补。在一些情况下,第四探针捕获序列是分别与第一探针和/或第二探针的探针捕获序列1610、1618相同的探针捕获序列。
在一个实施方案中,细胞、细胞核或细胞珠粒1600可以在上述任何处理操作之前被分隔到第一组分区的第一个分区中,这些处理操作包括但不限于固定、透化、与探针接触以及产生探针缔合的或探针连接的分子。在另一个实施方案中,细胞、细胞核或细胞珠粒1600可以在分隔在第一分区中之前被固定并任选地被透化,然后在第一分区中进行后续处理,例如,与探针接触并产生分子。
在操作1670中,包含第一探针缔合的分子1630和第二探针缔合的分子1665的细胞、细胞核或细胞珠粒1600可以被分隔到第一组分区的第一分区中,或者进一步在第一分区中处理。在另一个实施方案中,细胞、细胞珠粒或细胞核1600还可以包含附加探针缔合的分子或复合物。例如,参见图16A,1600可以包含类似于1665的第三探针缔合的复合物(未示出),但包含(i)具有与第二特征探针结合序列互补的第四探针序列的第四探针,和(ii)报告寡核苷酸(类似于1657),如本文进一步所述。报告寡核苷酸可以作为第二特征结合基团的一部分提供或偶联到第二特征结合基团,该第二特征结合基团例如为被配置为偶联到细胞内蛋白质的特征结合基团。在一些情况下,细胞、细胞核或细胞珠粒1600可以在该分区内经受处理,诸如裂解,以在该分区内释放细胞/细胞核组分(例如,第一探针缔合的分子和第二探针缔合的分子)。另选地,细胞、细胞核或细胞珠粒1600可以保持完整。在一个实施方案中,细胞珠粒被处理以释放细胞组分,同时保持细胞珠粒完整。在第一分区内,可以提供探针结合分子1617和条形码分子1619。可以使第一探针缔合的分子1630和第二探针缔合的分子1665与一个或多个探针结合分子1617和条形码分子1619接触。在一些实例中,第一分区还包含类似于1665的一种或多种附加探针缔合的分子或复合物(未示出)。附加探针缔合的复合物可以包含上述第三探针缔合的复合物,其包含第四探针和用于第二特征结合基团的报告寡核苷酸,该第二特征结合基团例如为被配置为偶联到细胞内蛋白质的特征结合基团。可以使附加探针缔合的复合物(诸如第三探针缔合的复合物)与一个或多个探针结合分子1617和条形码分子1619接触。在一个实施方案中,第一分区中的细胞、细胞核或细胞珠粒1600与一个或多个探针结合分子的接触可以与如上所述的探针(例如1606、1616、1658和任选的第四探针)的接触同时进行。条形码分子1619可以包含条形码捕获序列或为多个条形码分子所共有的共同序列以及为第一组分区的第一分区所共有的第一条形码序列。在一些情况下,核酸条形码分子可以偶联到珠粒,诸如如本文所述的凝胶珠粒或其他支持物,并且可以包含附加功能序列,包括但不限于独特分子标识符(UMI)、捕获序列、引物序列(例如,R1/R2序列)、附加条形码序列片段等。探针结合分子1617可以包含与探针捕获序列1610、1618、1662、第四探针捕获序列中的任一者或组合互补的探针结合序列,以及与条形码分子1619的共同序列互补的条形码结合序列。在一些情况下,探针结合分子1617和条形码分子1619可以作为预退火复合物提供。探针结合分子1617和条形码分子1619可以与第一探针缔合的分子1630和第二探针缔合的分子1665和/或附加探针缔合的复合物(诸如第三探针缔合的复合物)杂交(例如,经由探针结合分子1617与探针捕获序列1610、1618、1662和第四探针捕获序列的杂交),从而产生第一加有条形码的核酸分子和第二加有条形码的核酸分子以及任选附加的加有条形码的核酸分子。附加处理可以发生在第一分区内,例如,条形码分子1619与探针(1606、1616、1658或第四探针)的连接。在一个附加实施方案中,使用附加探针缔合的复合物(例如,第三探针缔合的复合物(未示出))、探针结合分子1617和条形码分子1619产生附加的加有条形码的核酸分子。
在操作1680中,可以从第一组分区,例如从操作1670中收集每个分区或第一组分区的子集的内容物,并将其重新分隔到第二组分区中。第一组分区的内容物可以包含细胞、细胞核或细胞珠粒1600和/或经处理的细胞或细胞核组分,例如第一加有条形码的核酸分子、第二加有条形码的核酸分子和任选附加的加有条形码的核酸分子。可以将第一组分区的各分区的内容物合并在一起并重新分布到第二组分区。因此,第二组分区的第二分区可以包括细胞、细胞核或细胞珠粒1600和/或经处理的细胞/细胞核组分。在一些情况下,细胞、细胞核或细胞珠粒1600可以在第二分区内经受处理,诸如裂解,以在第二分区内释放细胞/细胞核组分(例如,第一加有条形码的核酸分子、第二加有条形码的核酸分子和任选附加的加有条形码的核酸分子)。另选地,细胞、细胞核或细胞珠粒1600可以保持完整。在第二分区内,可以提供多个捕获分子1620。在一些情况下,多个捕获分子1620可以偶联到支持物(例如,颗粒、珠粒、凝胶珠粒等)。在一些情况下,多个捕获分子1620可以可释放地偶联到支持物,并且多个捕获分子1620可以在第二分区中释放。捕获分子1620可以各自包含第二条形码序列,该第二条形码序列可以是与(条形码分子1619的)第一条形码序列相同的序列或不同的序列。第二条形码序列可以是第二分区特有的,并且不同于第二组分区的其他分区的第二条形码序列。可以使第一加有条形码的核酸分子和第二加有条形码的核酸分子各自与捕获分子1620接触。捕获分子1620可以包含第二条形码捕获序列,该第二条形码捕获序列可以与条形码分子1619的序列互补。捕获分子1620与第一加有条形码的分子和第二加有条形码的核酸分子的杂交可足以产生第三加有条形码的核酸分子和第四加有条形码的核酸分子。此外,捕获分子1620与附加的加有条形码的核酸分子(例如,来自附加特征结合基团1652上的附加报告寡核苷酸1657)的杂交可足以产生第五加有条形码的核酸分子。另选地,捕获分子1620与第一加有条形码的分子和第二加有条形码的核酸分子的杂交可足以将捕获分子(包含第二条形码序列)偶联到第一加有条形码的分子和第二加有条形码的核酸分子两者。此外,捕获分子1620与附加的加有条形码的核酸分子的杂交可足以将捕获分子(包含第二条形码序列)偶联到附加的加有条形码的核酸分子。任选地,可以进行进一步的处理,例如,将捕获分子1620连接到第一加有条形码的核酸分子和第二条形码核酸分子(以及任选附加的加有条形码的核酸分子)。连接后,第一加有条形码的核酸分子和第二加有条形码的核酸分子可以包含捕获分子1620。第三加有条形码的核酸分子、第四加有条形码的核酸分子和第五加有条形码的核酸分子可以各自包含与第一条形码序列相对应的序列和与第二条形码序列相对应的序列。在一些情况下,进行延伸反应(例如,从捕获分子1620朝向报告寡核苷酸序列1657)以产生第四加有条形码的分子和/或第五加有条形码的核酸分子。图16B示意性地示出了用于为细胞、细胞核或细胞珠粒的多种分析物加条形码的另一示例工作流程。在这样的实例中,用于处理核酸分子(例如,RNA分子)的工作流程可以基本上类似于图16A中描绘的工作流程,但是用于处理特征(例如,蛋白质)的工作流程可以不同。例如,特征结合基团1652或报告寡核苷酸1657可以包含能够与探针结合分子1617和/或条形码分子1619杂交的结合序列。
如本文所述,可以使透化的(和任选固定的)细胞或细胞核与一种或多种特征结合基团1652接触,该一种或多种特征结合基团可以(a)包含报告寡核苷酸1657并且(b)被配置为偶联到(i)细胞内蛋白质(或细胞核内蛋白质)或(ii)细胞膜蛋白质(或核膜蛋白质)。在一些实施方案中,一种或多种特征结合基团1652包括(i)第一特征结合基团,其包含报告寡核苷酸1657并被配置为偶联到细胞内蛋白质(或细胞核内蛋白质);和(ii)第二特征结合基团,其包含报告寡核苷酸1657并被配置为偶联到细胞膜蛋白质(或核膜蛋白质)。
在操作1670中,包含第一探针缔合的分子1630和一种或多种特征结合基团1652的细胞、细胞核或细胞珠粒1600可以被分隔到第一组分区的第一分区中,或者进一步在第一分区中处理。在第一分区内,可以提供探针结合分子1617和条形码分子1619。可以使偶联到报告寡核苷酸1657的特征结合基团1652(例如,被配置为偶联到细胞内蛋白质或细胞核内蛋白质的一种或多种特征结合基团)与一个或多个探针结合分子1617和条形码分子1619接触。条形码分子1619可以包含条形码捕获序列或为多个条形码分子所共有的共同序列以及为第一组分区的第一分区所共有的第一条形码序列。在一些情况下,核酸条形码分子可以偶联到珠粒,诸如如本文所述的凝胶珠粒或其他支持物,并且可以包含附加功能序列,包括但不限于独特分子标识符(UMI)、捕获序列、引物序列(例如,R1/R2序列)、附加条形码序列片段等。探针结合分子1617可以包含与报告寡核苷酸1657的序列互补的探针结合序列。在一些情况下,探针结合分子1617和条形码分子1619可以作为预退火复合物提供。探针结合分子1617和条形码分子1619可以与第一探针缔合的分子1630(如上所述)和报告寡核苷酸1657杂交(例如,经由探针结合分子1617与报告寡核苷酸1657的序列杂交),从而产生第一加有条形码的核酸分子和第二加有条形码的核酸分子。可以使用来自附加特征结合基团1652(例如,被配置为偶联到细胞或核膜蛋白质和/或细胞内或细胞核内蛋白质)的附加报告寡核苷酸1657产生附加的加有条形码的核酸分子。附加处理可以发生在第一分区内,例如,条形码分子1619与探针(1606、1616)或报告寡核苷酸1657的连接。
在操作1680中,可以从第一组分区,例如从操作1670中收集每个分区或第一组分区的子集的内容物,并将其重新分隔到第二组分区中。第一组分区的内容物可以包含细胞、细胞核或细胞珠粒1600和/或经处理的细胞/细胞核组分,例如第一加有条形码的核酸分子、第二加有条形码的核酸分子和任选附加的加有条形码的核酸分子。可以将第一组分区的各分区的内容物合并在一起并重新分布到第二组分区。因此,第二组分区的第二分区可以包括细胞、细胞核或细胞珠粒1600和/或经处理的细胞/细胞核组分(例如,加有条形码的产物)。在一些情况下,细胞、细胞核或细胞珠粒1600可以在第二分区内经受处理,诸如裂解,以在第二分区内释放细胞/细胞核组分(例如,第一加有条形码的核酸分子、第二加有条形码的核酸分子和任选附加的加有条形码的核酸分子)。另选地,细胞、细胞核或细胞珠粒1600可以保持完整。在第二分区内,可以提供多个捕获分子1620。在一些情况下,多个捕获分子1620可以偶联到支持物(例如,颗粒、珠粒、凝胶珠粒等)。在一些情况下,多个捕获分子1620可以可释放地偶联到支持物,并且多个捕获分子1620可以在第二分区中释放。捕获分子1620可以各自包含第二条形码序列,该第二条形码序列可以是与(条形码分子1619的)第一条形码序列相同的序列或不同的序列。第二条形码序列可以是第二分区特有的,并且不同于第二组分区的其他分区的第二条形码序列。可以使第一加有条形码的核酸分子和第二加有条形码的核酸分子各自与捕获分子1620接触。捕获分子1620可以包含第二条形码捕获序列,该第二条形码捕获序列可以与条形码分子1619的序列互补。另选地,捕获分子1620可以包含与附加探针结合分子(例如,夹板寡核苷酸,未示出)互补的序列,并且探针结合分子可以包含与条形码分子1619的序列互补的序列。捕获分子1620与第一加有条形码的分子和第二加有条形码的核酸分子(或与可以与第一加有条形码的分子和第二加有条形码的分子杂交的附加探针结合分子)的杂交可足以产生第三加有条形码的核酸分子和第四加有条形码的核酸分子。此外,1620与附加的加有条形码的核酸分子(例如,来自附加特征结合基团1652上的附加报告寡核苷酸1657)的杂交可足以产生第五加有条形码的核酸分子。另选地,捕获分子1620与第一加有条形码的分子和第二加有条形码的核酸分子的杂交可足以将捕获分子(包含第二条形码序列)偶联到第一加有条形码的分子和第二加有条形码的核酸分子两者。此外,1620与附加的加有条形码的核酸分子的杂交可足以将捕获分子(包含第二条形码序列)偶联到附加的加有条形码的核酸分子(例如,由附加特征结合基团1652上的附加报告寡核苷酸1657产生)。任选地,可以进行进一步的处理,例如,进行延伸反应,将捕获分子1620连接到第一加有条形码的核酸分子、第二条形码核酸分子和任选附加的加有条形码的核酸分子。连接后,第一加有条形码的核酸分子和第二加有条形码的核酸分子可以包含捕获分子1620。第三加有条形码的核酸分子、第四加有条形码的核酸分子和第五加有条形码的核酸分子可以各自包含与第一条形码序列相对应的序列和与第二条形码序列相对应的序列。在一些情况下,进行延伸反应(例如,从捕获分子1620朝向报告寡核苷酸序列1657)以产生第四加有条形码的分子和/或第五加有条形码的核酸分子。
在一些情况下,可以使特征结合基团的报告寡核苷酸(包含报告序列)与多个探针接触。例如,可能有利的是使特征结合基团与一对探针接触。在一些情况下,报告寡核苷酸包含一个或多个特征探针结合序列,该一个或多个特征探针结合序列可以包含与该对探针互补的序列。例如,参见图17,细胞、细胞核或细胞珠粒1700可以包含特征(例如,蛋白质,诸如细胞/核膜蛋白质或细胞内/细胞核内蛋白质)1750。特征结合基团1752可以偶联到特征1750。特征结合基团1752可以包含或偶联到包含报告寡核苷酸(包含报告序列)1754的寡核苷酸,以及在一些情况下,包含或偶联到附加功能序列,诸如引物序列、测序引物序列、UMI等,如本文别处所述。报告寡核苷酸1754可以包含任何数量的靶区域。例如,报告寡核苷酸1754可以包含两个靶区域,第一探针1757和第二探针1758可以与这两个靶区域杂交。这两个靶区域可以是相邻的或不相邻的,并且它们可以设置在报告寡核苷酸1754的同一条链上。如本文所述,探针可以包含与报告寡核苷酸1754的靶区域互补的序列,并且每个探针可以包含其他有用的序列。例如,探针(例如,第一探针1757或第二探针1758)可以包含(i)与报告寡核苷酸1754的靶区域互补的探针序列(例如,1760),和(ii)可以与探针结合分子1717(也称为夹板或夹板寡核苷酸)的序列互补的探针捕获序列1762。探针结合分子1717还可以包含与条形码分子1719的序列(例如,捕获序列)互补的序列。这种加条形码(例如,探针结合分子1717和条形码分子1719与探针捕获序列1762的杂交)可以发生在本体中或一个分区中。在一些实施方案中,加条形码可以在没有探针结合分子的情况下进行。例如,条形码分子1719可以包含与探针捕获序列1762互补的序列,并直接退火到探针。
在一些情况下,在使特征结合基团与探针分子1757和1758接触(例如,在本体中或在一个分区中)后,特征结合基团1752经受足以使探针分子与报告寡核苷酸1754杂交的条件,从而产生探针缔合的报告寡核苷酸复合物。探针与报告寡核苷酸1754的偶联可以发生在本体中或一个分区中。在一些情况下,在探针与报告寡核苷酸1754偶联或杂交后,探针可以连接在一起(例如,以酶促方式或化学方式),从而产生探针连接的核酸分子(或复合物)。例如,第一探针1757可以包含第一反应性部分,并且第二探针1758可以包含第二反应性部分。反应性部分可以被定位为使得在第一探针1757和第二探针1758与报告寡核苷酸1754杂交后,反应性部分是相邻的。然后,反应性部分可以经受足以使它们反应的条件,以产生探针连接的核酸分子(或复合物),该探针连接的核酸分子(或复合物)包含与第二探针1758连接的第一探针1757。在一些情况下,探针包含“点击化学”部分。另选地或此外,第一探针可以酶促连接(例如,经由连接反应)到第二探针。在其他情况下,在探针与报告寡核苷酸1754杂交后,可以在第一探针1757和第二探针1758之间设置间隙区域(未示出)。在此类情况下,可以使用间隙填充方法(诸如上文描述的那些)将第一探针1757连接到第二探针1758。
然后探针连接的核酸分子(或复合物)可以经受加条形码(例如,与探针结合分子1717和条形码分子1719接触),这可以发生在一个分区中。另选地,加条形码可以发生在探针连接之前。例如,报告寡核苷酸1754可以与探针杂交,被分隔,被加条形码,然后探针可以被连接。另选地,报告寡核苷酸1754可以与探针杂交,被连接,被分隔,然后被加条形码。在又一个实例中,报告寡核苷酸1754可以与探针杂交,被分隔,被连接,然后被加条形码。应当理解,本文所述的操作(例如,杂交、探针连接、加条形码)可以在任何有用的过程中发生,或者以任何有用的顺序发生。在一些情况下,可以执行多个分隔操作,例如,用于组合式加条形码。
报告寡核苷酸可以包含与核酸分子(例如,RNA分子)相同的靶序列(例如,702、704、802、804、902、904、1502、1504、1602、1604等)。例如,参见图17,第一探针可以具有与核酸分子的第一靶序列(例如,702、802、902、1502、1602)和报告寡核苷酸1754的第一序列都互补的第一序列,并且第二探针可以具有与核酸分子的第二靶序列(例如704、804、904、1504、1604)和报告寡核苷酸1754的第二序列都互补的第二序列。在这样的情况下,向细胞、细胞核或细胞珠粒提供仅两种探针类型(例如,第一探针和第二探针)可足以产生第一加有条形码的分子(例如,从核酸分子例如RNA分子产生)、第二加有条形码的分子(例如,从特征结合基团(诸如被配置为偶联到细胞/核膜蛋白质的基团)的报告寡核苷酸产生)和附加的加有条形码的分子(例如,从附加特征结合基团(诸如被配置为偶联到细胞内/细胞核内蛋白质的基团)的报告寡核苷酸产生)。如本文所述,每个探针(例如,第一探针和第二探针)可能能够或被配置为与条形码分子(例如,在第一分区中)和/或捕获分子杂交。也如本文别处所述,每个探针可以被多重化或组合式加条形码,使得多重体分区(例如,包含超过一个细胞、一个细胞核或细胞珠粒的分区)可以被解卷积,例如以确定一个分区内每个细胞、细胞核或细胞珠粒的起始分区或样品(参见,例如图10)。类似地,加有条形码的分子可以用于确定不同分析物类型(例如,蛋白质、核酸分子等)的来源;例如,两种分析物类型可以被归属于相同的起始细胞、细胞核、细胞珠粒、样品或分区。
在一些情况下,报告寡核苷酸包含与核酸分子(例如,RNA分子)的靶序列不同的两个或更多个靶序列。因此,可以提供四种探针类型来进行多重测定;第一探针和第二探针可以与核酸分子的第一靶区域和第二靶区域杂交,并且第三探针和第四探针可以与报告寡核苷酸(例如,来自特征结合基团(诸如被配置为偶联到细胞/核膜蛋白质的特征结合基团)的报告寡核苷酸)的靶区域杂交。可以提供附加探针类型,诸如第五探针和第六探针,其与附加报告寡核苷酸(例如,来自特征结合基团(诸如被配置为偶联到细胞内/细胞核内蛋白质的特征结合基团)的报告寡核苷酸)的靶区域杂交。每个探针或探针的组合可以包含探针捕获序列,该探针捕获序列可以用于随后的加条形码。例如,每个探针(例如,第一探针、第二探针、第三探针、第四探针、第五探针、第六探针或它们的组合)可能能够或被配置为与条形码分子(例如,在第一分区中)和/或捕获分子(例如,在第二分区中)杂交。如本文别处所述,每个探针可以被多重化或组合式加条形码,使得多重体分区(例如,包含超过一个细胞、细胞核或细胞珠粒的分区)可以被解卷积,例如以确定一个分区内每个细胞、细胞核或细胞珠粒的起始分区或样品(参见,例如图10)。类似地,加有条形码的分子可以用于确定不同分析物类型(例如,蛋白质、核酸分子等)的来源;例如,两种分析物类型可以被归属于相同的起始细胞、细胞核、细胞珠粒、样品或分区。
如本文别处所述,核酸分子(例如,来自细胞、细胞核或细胞珠粒或者报告寡核苷酸)可以包含一个或多个靶区域。一个或多个靶区域可以对应于基因或其一部分,或另一种已知序列。靶区域可以具有相同或不同的序列,并且可以位于相同的链内或不同的链上。靶区域可以彼此相邻,或者可以沿着核酸分子的一条链在空间上分开。靶区域可以位于相同的链或不同的链上。分析两个或更多个靶区域可以涉及提供两个或更多个探针,其中第一探针具有与第一靶区域互补的序列,第二探针具有与第二靶区域互补的序列,等等。如本文别处所述,核酸分子可以是靶核酸分子,并且可以包含任何数量的核酸特征或核苷酸。
也如本文别处所述,任何探针(例如,第一探针、第二探针、第三探针等)、报告寡核苷酸或条形码或捕获分子可以包含任何数量的附加衔接物或功能序列,诸如附加探针序列、独特分子标识符、条形码序列、引物序列、捕获序列、测序引物序列等。
如本文所述,可以在一个分区(诸如液滴或孔)内执行一个或多个操作。例如,核酸分子(例如,RNA分子)和特征(例如,蛋白质)或者包含核酸分子和特征的细胞、细胞核或细胞珠粒可以在该方法的任何有用阶段与一种或多种试剂(例如,如本文所述)共同分隔。例如,任选地包含在细胞、细胞核或细胞珠粒之内或之上的探针连接的或探针缔合的核酸分子可以在本体溶液中或在一个分区中产生。类似地,可以使细胞、细胞核或细胞珠粒在本体溶液或一个分区中与特征结合基团接触。探针(例如,第一探针、第二探针和第三探针)的提供可以发生在本体溶液中或单独的分区中。在使用分区的情况下,一个分区(例如,第一组分区的第一分区)可以包括第一探针、第二探针、第三探针或它们的组合。第一组分区内的不同分区可以包括相同或不同的探针(例如,针对不同的靶序列或不同的报告序列)。另选地或此外,探针结合分子和核酸条形码分子可以在一个分区中提供。例如,可以使包含该特征和核酸分子的细胞、细胞核或细胞珠粒在本体中与探针接触,并分隔到第一组分区中。第一组分区可以包括探针结合分子和包含共同序列的核酸条形码分子。第一组分区中的不同分区可以包括具有不同条形码序列的条形码分子;例如,第一组分区的附加分区可以包括多个条形码分子,每个条形码分子具有该分区特有(即,在各分区之间不同)的条形码序列。分区可以包括用于进行核酸反应(例如,消化、连接、延伸、扩增)的附加试剂。例如,分区可以包括连接酶(linking enzyme)(例如,连接酶(ligase)),其可以用于将核酸条形码分子连接到第一探针、第二探针或第三探针(例如,经由每个探针的探针捕获序列)。在一些情况下,探针结合分子、探针捕获序列和/或条形码捕获序列(例如,共同序列)包含一个或多个反应性部分,其可以用于将核酸条形码分子化学连接到探针捕获序列。所得的加有条形码的产物可以包含:第一加有条形码的产物,其包含与第一靶区域相对应的序列、与第二靶区域相对应的序列、与第一探针或第二探针的探针捕获序列相对应的序列以及与条形码序列相对应的序列;和第二加有条形码的产物,其包含与报告序列、第三探针的探针捕获序列(其可以与第一探针或第二探针的探针捕获序列相同或不同)和条形码序列相对应的序列。
如本文所述,本文所述的一个或多个过程可以在细胞(例如,溶液中的细胞,或组织样品内包含的细胞)、细胞核或细胞珠粒中进行。例如,多个细胞、细胞核或细胞珠粒可以包含多个核酸分子和特征。细胞、细胞核或细胞珠粒可以是活的或固定的和/或透化的。在一些情况下,可以使细胞、细胞核或细胞珠粒与包含报告序列的特征结合基团接触。也可以在本体溶液或一个分区中将第一探针、第二探针和第三探针提供给细胞、细胞核或细胞珠粒,以产生第一探针缔合的分子和第二探针缔合的分子。任选地,可以洗涤细胞、细胞核或细胞珠粒以去除未结合的探针。随后,可以将包含探针缔合的分子的细胞、细胞核或细胞珠粒分隔到多个单独分区中,其中多个单独分区的至少一个子集包括单个细胞、单个细胞核或单个细胞珠粒。加条形码可以在单独的分区内执行。如本文所述,加条形码可以包括将核酸条形码分子附着或杂交到第一探针缔合的分子和第二探针缔合的分子。多个单独分区中的每个分区内提供的核酸条形码分子可以被提供为附着到珠粒。在一些情况下,如本文别处所述,核酸条形码分子可以可释放地附着到珠粒(例如,经由不稳定键)。多个单独分区中的每个分区(或分区的子集)可以包括珠粒,该珠粒包含附着于其上的多个核酸条形码分子(例如,如本文所述)。附着到每个珠粒的多个核酸条形码分子可以包含独特条形码序列,使得多个单独分区中的每个分区包括不同的条形码序列。在从多个单独分区中的多个不同分区释放组分时(例如,在加条形码之后),源自单个细胞、单个细胞核或单个细胞珠粒的加有条形码的分子可以具有相同的条形码序列(例如,共同条形码序列),使得每个加有条形码的核酸分子可以被追溯到给定的分区和/或在一些情况下,单个细胞、单个细胞核或单个细胞珠粒。然后,如本文所述,可以将释放的组分分隔在包括具有第二条形码序列的捕获分子的第二组分区中,使得第二组分区中的不同分区具有独特的第二条形码序列。
可以在加条形码之前、期间或之后处理本文所述的细胞、细胞核或细胞珠粒。例如,可以在任何有用的时间点固定或透化细胞、细胞核或细胞珠粒。在一些情况下,可以在探针杂交之前或之后或者在与特征结合基团接触之前或之后,固定和透化细胞、细胞核或细胞珠粒。在一些情况下,可以在与特征结合基团接触之前固定和透化细胞、细胞核或细胞珠粒,然后使细胞、细胞核或细胞珠粒与探针接触。可以重复固定或透化过程。例如,可以固定和透化细胞、细胞核或细胞珠粒,使细胞、细胞核或细胞珠粒与探针和特征结合基团接触(同时或以逐步方式),然后再次固定细胞、细胞核或细胞珠粒。
在固定和/或透化后,可以先将细胞、细胞核或细胞珠粒储存一段时间,再进行进一步处理,例如,使细胞、细胞核或细胞珠粒与探针和/或特征结合基团接触。例如,可以固定和/或透化细胞、细胞核或细胞珠粒,然后在约1分钟、10分钟、30分钟、1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时、24小时或更长时间后使细胞、细胞核或细胞珠粒与探针和/或特征结合基团接触。可以固定和/或透化细胞、细胞核或细胞珠粒,然后在约1天、2天、3天、4天、5天、6天、7天或更长时间后使细胞、细胞核或细胞珠粒与探针和/或特征结合基团接触。可以固定和/或透化细胞、细胞核或细胞珠粒,然后在约1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、20周、30周、40周、50周或更长时间后使细胞、细胞核或细胞珠粒与探针和/或特征结合基团接触。可以固定和/或透化细胞、细胞核或细胞珠粒,然后在约1个月、2个月、3个月、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月、12个月或更长时间后使细胞、细胞核或细胞珠粒与探针和/或特征结合基团接触。可以固定和/或透化细胞、细胞核或细胞珠粒,然后在任何有用的时间使细胞、细胞核或细胞珠粒与探针和/或特征结合基团接触,该时间可以在一定时间范围内,例如,约2-5周后、约3-6个月后、约1-2年后等。
在一些情况下,例如在固定和/或透化之后,可以冷冻细胞、细胞核或细胞珠粒。细胞、细胞核或细胞珠粒的这种冷冻可用于将样品储存更长的持续时间(例如,如果在样品与探针和/或特征结合基团接触之前要将样品储存1-2周以上)。例如,可以将细胞、细胞核或细胞珠粒固定,任选地透化,然后冷冻任何有用的持续时间,随后使细胞、细胞核或细胞珠粒与探针和/或特征结合基团接触。另选地,在细胞、细胞核或细胞珠粒与探针和/或特征结合基团接触之前或之后,可以固定、冷冻和透化细胞、细胞核或细胞珠粒。应当理解,冷冻操作可以在任何有用或方便的时间进行,例如,在固定、透化、与探针接触、与特征结合基团接触等之前、同时或之后。
可以在任何有用的时间使细胞、细胞核或细胞珠粒在分区中或在本体中与探针和特征结合基团接触。例如,可以使细胞、细胞核或细胞珠粒在与特征结合基团接触之前、期间或之后与探针接触。与探针和/或特征结合基团的接触可以发生在本体中或分区(例如,液滴、孔)中。在一些情况下,可以使细胞、细胞核或细胞珠粒与探针和特征结合基团接触(同时或以逐步方式),然后在分区中加条形码。在其他情况下,可以使细胞、细胞核或细胞珠粒在分区中与探针和特征结合基团接触。
图29示出了根据本文所述的方法处理细胞的示例工作流程。可以例如在4%甲醛和0.01%吐温-20或可商购获得的固定和透化缓冲液(例如,可商购获得的固定和透化缓冲液)中固定和透化细胞。在一个实例中,可以将固定和透化的细胞与第一探针和第二探针一起温育,以产生第一探针缔合的分子(例如,探针缔合的RNA分子)。然后可以使细胞与包含报告寡核苷酸的特征结合基团(例如,抗体)接触,以产生包含偶联到特征结合基团的特征的细胞。可以例如在分区中执行后续加条形码。
在一些实例中,可以将固定和透化的细胞与特征结合基团一起温育,任选地再次固定该细胞,然后使该细胞与第一探针和第二探针接触以产生探针缔合的分子(例如,探针缔合的RNA分子)。另选地,可以将固定和透化的细胞与第一探针和第二探针一起温育以产生探针缔合的分子,然后使该细胞与特征结合基团接触。可以例如在分区中执行后续加条形码。
在一些情况下,在使细胞与探针或特征结合基团接触之前透化细胞可能是有用的(例如,作为阴性对照)。因此,可以固定细胞,使该细胞与探针和/或特征结合基团接触,然后接着透化该细胞。应当理解,可以在任何方便或有用的步骤并以任何顺序执行固定、透化、探针杂交、与特征结合基团接触等操作的任何顺序,并且可以重复任何过程。例如,可以使细胞、细胞核或细胞珠粒与特征结合基团接触,固定和/或透化细胞、细胞核或细胞珠粒,使细胞、细胞核或细胞珠粒与附加特征结合基团接触(这对于分析细胞外和细胞内的肽、多肽或蛋白质可能是有益的),并且任选地,再次固定细胞、细胞核或细胞珠粒。另选地,可以固定和/或透化细胞、细胞核或细胞珠粒,然后使细胞、细胞核或细胞珠粒与特征结合基团(例如,用于细胞内和/或细胞外分析物)接触,并且任选地再次固定细胞、细胞核或细胞珠粒。在这些过程之前或之后,可以使细胞、细胞核或细胞珠粒与探针组(例如,第一探针、第二探针和/或第三探针)接触。另参见实施例8和9。
本公开的方法、组合物、试剂盒和系统可以包括提供用于处理固定的生物颗粒(例如,细胞、细胞核或细胞珠粒)的方法。在一个实施方案中,该方法包括a)固定和透化生物颗粒或提供固定和透化的生物颗粒。
该方法还可以包括b)使固定和透化的生物颗粒与第一试剂接触,该第一试剂被配置为偶联到生物颗粒的分析物。在一个实施方案中,分析物是细胞内分析物,诸如核酸或多肽,并且生物颗粒是细胞。在另一个实施方案中,分析物是细胞核内分析物,诸如核酸或多肽,并且生物颗粒是细胞核。被配置为偶联到分析物的第一试剂可以是(i)被配置为偶联到核酸的第一试剂(诸如如本文所述的一个或多个核酸探针)或(ii)被配置为偶联到肽、多肽或蛋白质的第一试剂(诸如如本文所述的一种或多种特征结合基团)。在另一个实施方案中,b)提供固定和透化的生物颗粒,例如细胞或细胞核,其包含与生物颗粒的分析物(例如,核酸或多肽)偶联的第一试剂。
该方法还可以包括c)对来自b)的生物颗粒进行附加固定。在一个实施方案中,c)包括来自b)的生物颗粒的附加固定,其中来自b)的生物颗粒包含被配置为与生物颗粒的分析物偶联的第一试剂。第一试剂可以偶联到生物颗粒(例如,细胞或细胞核)的分析物(核酸或多肽)。第一试剂可以是被配置为偶联到核酸分析物的试剂或者被配置为偶联到多肽的试剂。在一个实施方案中,c)包括生物颗粒(诸如细胞)的附加固定,其中细胞包含偶联到多肽的第一试剂。在另一个实施方案中,多肽是细胞内多肽。
该方法还可以包括:d)包括使来自c)的生物颗粒(例如,细胞或细胞核)(其已经被初始固定和透化,与第一试剂接触或者包含第一试剂,并且另外被固定)与被配置为偶联到分析物(例如,核酸或多肽)的第二试剂接触,其中第二试剂不同于第一试剂,和/或第二试剂被配置为偶联到与第一试剂被配置为偶联到的分析物不同的分析物。在一个实施方案中,第一试剂被配置为偶联到多肽(诸如如本文所述的一种或多种特征结合基团),并且第二试剂被配置为偶联到核酸(诸如如本文所述的一个或多个核酸探针)。d)的生物颗粒可以包含偶联到多肽的第一试剂和偶联到核酸的第二试剂。
可以例如使用组合式加条形码(例如,分裂池)方法为给定的核酸分子和/或特征结合基团进行任何数量的加条形码操作。如本文所述,附加的加条形码操作可用于例如将核酸分子和特征(例如,蛋白质)索引到细胞、细胞核、细胞珠粒、样品、一个分区或多个分区。这种索引可用于单个分区被多个细胞、细胞核或细胞珠粒占据时的情况。在一些情况下,可能有利的是使分区过载,使得一个分区包括超过一个细胞、细胞核或细胞珠粒;例如,在某些情况下可能有用的是使分区过载,例如,克服分区中的泊松负载统计和/或防止试剂浪费(例如,由未被占据的分区引起)。因此,这种索引可用于将多重占据的分区中的(i)核酸分子和(ii)特征(例如,蛋白质)归属于起始细胞、细胞核、细胞珠粒、分区、样品等,如本文别处所述。
例如,可以对细胞、细胞核或细胞珠粒群体内的核酸分子和特征(例如,蛋白质)执行图10中提供的工作流程。在这样的实例中,在操作1010之前,可以使第一细胞、细胞核或细胞珠粒群体1002与第一探针、第二探针和任选的第三探针接触(例如,如图16A和图16B所示)。第一探针和第二探针可以与核酸分子杂交,产生第一探针缔合的分子(或复合物),并且任选地,第三探针可以与报告寡核苷酸(包含报告序列)或特征结合基团(例如,被配置为偶联到细胞/核膜蛋白质的基团)的特征探针结合序列杂交,以产生第二探针缔合的分子(或复合物)。可以提供附加探针,以与第一细胞、细胞核或细胞珠粒群体的附加特征结合基团(例如,被配置为偶联到细胞内/细胞核内蛋白质的基团)的附加报告寡核苷酸或特征探针结合序列杂交,从而产生附加探针缔合的分子。第二细胞、细胞核或细胞珠粒群体1004也可以以相同的方式处理,例如,用第四探针、第五探针和任选的第六探针处理。第四探针和第五探针可以与第二细胞、细胞核或细胞珠粒群体的核酸分子杂交,以产生第三探针缔合的分子,并且任选地,第六探针可以与第二细胞、细胞核或细胞珠粒群体的特征结合基团的报告寡核苷酸或特征探针结合序列杂交,以产生第四探针缔合的分子。可以提供附加探针,以与第二细胞、细胞核或细胞珠粒群体的附加特征结合基团(例如,被配置为偶联到细胞内/细胞核内蛋白质的基团)的附加报告寡核苷酸或特征探针结合序列杂交,从而产生附加探针缔合的分子。如本文所述,第一细胞(或细胞核或细胞珠粒)群体1002和第二细胞(或细胞核或细胞珠粒)群体1004可以用第一条形码序列进行加条形码,使得第一细胞(或其中的组分,诸如第一探针缔合的分子和第二探针缔合的分子)群体1002具有与第二细胞(或细胞核或细胞珠粒或者细胞、细胞核或细胞珠粒内的组分,诸如第三探针缔合的分子和第四探针缔合的分子)群体1004不同的第一条形码序列。在操作1020中,可以将第一细胞(或细胞核或细胞珠粒)群体1002与第二细胞(或细胞核或细胞珠粒)群体1004合并在一起,以产生细胞(或细胞核或细胞珠粒)的混合物。在操作1030中,可以将细胞(或细胞核或细胞珠粒)的混合物分隔到第二多个分区中。在一些情况下,可以将细胞(或细胞核或细胞珠粒)的混合物分隔到第二多个分区中,使得第二多个分区中的一些分区包括超过一个细胞(例如,细胞、细胞核或细胞珠粒多重体分区)。例如,第二多个分区中的分区1035可以包括来自第一细胞(或细胞核或细胞珠粒)群体1002的细胞、细胞核或细胞珠粒(“细胞A”)和来自第二细胞(或细胞核或细胞珠粒)群体1004的细胞、细胞核或细胞珠粒(“细胞B”)。分区1035可以包括附加条形码序列,该附加条形码序列可以是该分区特有的。每个分区中的细胞(或细胞核或细胞珠粒)可以经受附加的加条形码操作,以在加有条形码的核酸分子上补加附加条形码序列。在操作1040中,可以使用不同的条形码序列(例如,第一条形码序列、第二条形码序列和附加条形码序列)对加有条形码的核酸分子进行解卷积,以鉴定起始细胞、细胞核或细胞珠粒。例如,包含来自分区1035的附加条形码序列和来自第一细胞群体1002的第一条形码序列的加有条形码的核酸分子可以用于将该加有条形码的核酸分子鉴定为源自细胞A。类似地,包含来自分区1035的附加条形码序列和来自第二细胞群体1004的第二条形码序列的加有条形码的核酸分子可以用于将该加有条形码的核酸分子鉴定为源自细胞B。
在一些情况下,特征结合基团(例如,被配置为偶联到细胞内/细胞核内蛋白质的特征结合基团和/或被配置为偶联到细胞内/细胞核内蛋白质的特征结合基团)可以被预先索引到一个分区。例如,不是特征结合基团具有可以与探针(例如,第三探针)杂交并随后用鉴定细胞、细胞核、细胞珠粒或分区的条形码序列加条形码(例如,如图16A-B所述)的特征探针结合序列,而是特征结合基团可以以预先索引的方式在分区中提供,例如,使用该分区特有的条形码序列。例如,在为细胞内的核酸分子加条形码之后,可以在该方法的后续操作中提供特征结合基团。例如,在第二加条形码操作(例如,图16A-B的操作1680)期间,可以提供特征结合基团并使特征结合基团与细胞、细胞核或细胞珠粒的特征1650接触(或从第二分区中的细胞、细胞核或细胞珠粒释放)。特征结合基团可以包含或杂交到对第二分区特异的并在第二分区之间不同的条形码序列。因此,条形码序列可以用于将特征结合基团索引到特定分区并返回到起始细胞或细胞珠粒,而不是使用分别来自第一分区和第二分区的第一条形码序列和第二条形码序列来鉴定分区、细胞、细胞核或细胞珠粒。
在其他实例中,可以通过将分区特异性条形码序列直接附着或偶联到特征结合基团来将特征结合基团索引到分区,从而避免使用第三探针。在这样的情况下,特征结合基团可以包含或偶联到包含报告序列和附着序列的报告寡核苷酸,该附着序列可以用于将条形码分子直接附着到特征结合基团。例如,特征结合基团可以包含探针捕获序列(例如,1662),从而消除了对包含探针捕获序列的第三探针的需要。可以随后为探针捕获序列加条形码,例如,用第一分区内的条形码分子的第一条形码序列加条形码以及用第二分区内的捕获分子的第二条形码序列加条形码。在一些情况下,附着序列可以用于杂交探针结合分子(例如,夹板分子或夹板寡核苷酸),该探针结合分子可以与条形码分子(如本文所述)部分互补。例如,报告寡核苷酸的附着序列可以用于杂交探针结合分子,该探针结合分子可以例如在第一分区中杂交(或预退火)到条形码分子。可以在第一分区或不同的(例如,第二)分区中提供来自捕获分子的第二条形码序列,该第二条形码序列可以退火到第一条形码分子的一部分。在一些情况下,执行附加操作,例如延伸、连接等,以产生包含与第一条形码序列、第二条形码序列和报告序列相对应的序列的加有条形码的分子。
在基于分区的加条形码之后,可以合并分区的内容物,并且可以通过例如一个或多个扩增反应来复制或扩增加有条形码的分子,在一些情况下,该一个或多个扩增反应可以是等温的。扩增反应可以包括聚合酶链反应(PCR),并且可以涉及使用一种或多种引物或聚合酶。一种或多种引物可以包含一个或多个功能序列(例如,引物序列/引物结合序列、测序引物序列(例如,R1或R2)、部分测序引物序列(例如,部分R1或部分R2)、被配置为附着到测序仪的流动池的序列(例如,P5或P7,或其部分序列)等)并且可以促进将所述一个或多个功能序列添加到延伸的核酸分子。加有条形码的分子或其衍生物可以经由核酸测序来检测(例如,如本文所述)。
在一些方面,本文提供了可用于为核酸分子加条形码的系统。系统可以包括本文所述的任何部件,例如多个分区(例如,液滴、孔),其可以以任何有用的形式提供,例如微流体装置、多孔阵列或板等。在一些情况下,该系统可以包括第一组分区和第二组分区。第一组分区可以是与第二组分区相同或不同类型的分区。例如,第一组分区可以包括微孔,并且第二组分区可以包括液滴。作为另一个实例,第一组分区和第二组分区都可以包括液滴。该系统可以包括核酸条形码分子,其任选地偶联到支持物(例如,颗粒、珠粒、凝胶珠粒等)。在一些情况下,该系统可以包括本文所述的任何探针,诸如第一探针或多个第一探针、第二探针或多个第二探针、第三探针或多个第三探针,以及任何有用的反应组分(例如,用于进行核酸反应,例如延伸、连接、扩增等)。该系统可以包括一种或多种特征结合基团。特征结合基团在各分区之间可以是相同的或不同的;例如,特征结合基团可以包含结合于单个分区内的不同表位的多种抗体,或者分区可以包括结合于不同表位或部分的不同特征结合基团。该系统可以包括有用的反应组分,诸如,在非限制性实例中,包括酶(例如,连接酶、聚合酶、逆转录酶、限制性酶等)、核苷酸碱基等。
本文还提供了对于为多种分析物(例如,核酸分子和蛋白质)加条形码(例如,经由包含在特征结合基团中或偶联到特征结合基团的核酸分子,诸如报告寡核苷酸)的系统和方法有用的组合物。组合物可以包含本文所述的任何探针。例如,组合物可以包含多个第一探针、多个第二探针、多个第三探针和/或多个第一探针、多个第二探针和多个第三探针。一个探针或一组探针可以被设计成靶向特异性序列或一组特异性序列。此类探针可以被设计成在不同的分区内具有相同或不同的序列。例如,第一组合物可以包含被设计成靶向第一基因的两个区域的第一探针和第二探针,并且第二组合物可以包含被设计成靶向第二基因的两个区域的第一探针和第二探针,该第二基因不同于第一基因。类似地,第三探针(或探针对)可以被设计成靶向报告寡核苷酸(包含报告序列)或特征探针结合序列的区域,该区域在各分区之间可以是相同的或不同的。组合物可以包含核酸条形码分子和/或探针结合分子,其可以任选地被提供为偶联到支持物(例如,颗粒、珠粒)。组合物可以包含捕获分子,其任选地偶联到支持物。组合物可以是反应混合物的一部分或包含反应混合物,该反应混合物可以包含反应组分或试剂,例如酶、核苷酸碱基、催化剂等。
用于样品隔室化的系统和方法
在一个方面,本文所述的系统和方法提供了将一个或多个颗粒(例如,生物颗粒、生物颗粒的大分子成分、珠粒、试剂等)隔室化、沉积或分隔到离散的隔室或分区(本文可互换地称为分区)中,其中每个分区保持其自身内容物与其他分区的内容物分开。分区可以是乳液或孔中的液滴。分区可以包括一个或多个其他分区。
分区可以包括一个或多个颗粒。分区可以包括一种或多种类型的颗粒。例如,本公开的分区可以包括一个或多个生物颗粒和/或其大分子成分。分区可以包括一个或多个珠粒。分区可以包括一个或多个凝胶珠粒。分区可以包括一个或多个细胞珠粒。分区可以包括单个凝胶珠粒、单个细胞珠粒或单个细胞珠粒和单个凝胶珠粒两者。分区可以包括一种或多种试剂。另选地,分区可以是未被占据的。例如,分区可以不包括珠粒。细胞珠可为如经由含有生物颗粒和能够聚合或胶凝的前体的液滴的聚合,被包封在凝胶或聚合物基质内的生物颗粒和/或其大分子组成成分中的一种或多种。可以在液滴产生之前、之后或同时,将诸如条形码之类的独特标识符诸如经由支持物(例如,珠粒)注入液滴中,如本文别处所述。
本公开的方法和系统可以包括用于产生一个或多个分区(诸如液滴)的方法和系统。液滴可以包括乳液中的多个液滴。在一些实例中,液滴可以包括胶体中的液滴。在一些情况下,乳液可以包括微乳液或纳米乳液。在一些实例中,液滴可以借助于微流体装置和/或通过使不混溶相的混合物经受搅拌(例如,在容器中)来产生。在一些情况下,所提及方法的组合可以用于形成液滴和/或乳液。
可以通过混合和/或搅拌不混溶相产生乳液来形成液滴。混合或搅拌可以包括各种搅拌技术,诸如涡旋、移液、轻轻弹管,或其他搅拌技术。在一些情况下,混合或搅拌可以在不使用微流体装置的情况下进行。在一些实例中,液滴可以通过将混合物暴露于超声波或超声处理来形成。在国际申请号PCT/US20/17785中描述了通过搅拌产生液滴和/或乳液的系统和方法,该国际申请全文以引用方式并入本文用于所有目的。
包括微流体通道网络(例如,在芯片上)的微流体装置或平台可以用于产生如本文所述的分区(诸如液滴和/或乳液)。在美国专利公开号2019/0367997和2019/0064173中描述了用于产生分区(诸如液滴)的方法和系统、包封生物颗粒的方法、增加液滴产生通量的方法,以及微流体装置和通道的各种几何形状、架构和构造,这些专利公开中的每一者均全文以引用方式并入本文用于所有目的。
在一些实例中,通过将水性流体中的颗粒的流动料流引入非水性流体的流动料流或储器中,使得可以在两个料流/储器的连接部处(诸如在本文别处所提供的微流体装置的连接部处)产生液滴,可以将单独的颗粒分隔到离散分区。
本公开的方法可以包括产生分区和/或包封颗粒,诸如生物颗粒,在一些情况下为单独的生物颗粒,诸如单个细胞、细胞核或细胞珠粒。在一些实例中,试剂可以被包封和/或分隔(例如,与生物颗粒共同分隔)在分区中。在分隔单独的颗粒时可以采用各种机制。一个实例可以包括多孔膜,细胞的水性混合物可以穿过该多孔膜被挤压到流体(例如,非水性流体)中。
分区在流体流中可以是可流动的。分区可以包括例如具有围绕内部流体中心或核心的外部屏障的微囊。在一些情况下,分区可以包括能够将材料夹带和/或保持在其基质内的多孔基质。分区可以是第二相内的第一相的液滴,其中第一相和第二相是不混溶的。例如,分区可以是非水性连续相(例如,油相)内的水性流体的液滴。在另一个实例中,分区可以是水相内的非水性流体的液滴。在一些实例中,分区可以以油包水乳液或水包油乳液的形式提供。在例如美国专利申请公开号2014/0155295中描述了多种不同的容器,该美国专利申请公开全文以引用方式并入本文以用于所有目的。在例如美国专利申请公开号2010/0105112中描述了用于在非水性或油连续相中产生稳定的液滴的乳液体系,该美国专利申请公开全文以引用方式并入本文以用于所有目的。
可以调节流体特性(例如,流体流速、流体粘度等)、颗粒特性(例如,体积分数、粒度、颗粒浓度等)、微流体体系结构(例如,通道几何形状等)以及其他参数以控制所得分区的占据率(例如,每个分区的生物颗粒的数量、每个分区的珠粒的数量等)。例如,可以通过以颗粒的一定浓度和/或流速提供水流来控制分区占据率。为了产生单生物颗粒分区,可以选择不混溶流体的相对流速,使得分区中的每个分区平均可以包含少于一个生物颗粒,以确保被占据的那些分区主要是单占据的。在一些情况下,多个分区中的分区可以包含最多一个生物颗粒(例如,珠粒、DNA、细胞或细胞物质)。在一些实施方案中,可以选择或调节各种参数(例如,流体特性、颗粒特性、微流体体系结构等),使得占据大部分区,例如仅允许小百分比的未被占据的分区。可以控制流动和通道体系结构,以确保给定数量的单占据分区小于一定水平的未被占据的分区和/或小于一定水平的多重占据的分区。
图1示出了用于分隔单独生物颗粒的微流体通道结构100的实例。通道结构100可以包括在通道连接部110处连通的通道段102、104、106和108。在操作中,可以将包括悬浮的生物颗粒(或细胞)114的第一水性流体112沿着通道段102运输到连接部110中,而将与水性流体112不混溶的第二流体116从通道段104和106中的每个通道段递送至连接部110,以产生第一水性流体112的离散液滴118、120,所述离散液滴流入通道段108,并远离连接部110流动。通道段108可以流体联接至出口储库,在该出口储库中可以储存和/或收获离散液滴。所产生的离散液滴可以包括单独生物颗粒114(诸如液滴118)。所产生的离散液滴可以包括超过一个单独生物颗粒114(图1中未示出)。离散液滴可以不含有生物颗粒114(诸如液滴120)。每个离散分区可以保持其自身内容物(例如,单独生物颗粒114)与其他分区的内容物分开。
第二流体116可以包含油,诸如氟化油,其包括用于稳定所得液滴(例如,抑制所得液滴118、120的后续聚结)的氟表面活性剂。在例如美国专利申请公开号2010/0105112中描述了特别有用的分隔流体和含氟表面活性剂的实例,该美国专利申请公开全文以引用方式并入本文以用于所有目的。
应当理解,本文所述的通道段可以联接至多种不同流体源或接收部件中的任何一者,包括储库、管道、歧管或其他系统的流体部件。应当理解,微流体通道结构100可以具有其他几何形状。例如,微流体通道结构可以具有超过一个通道连接部。例如,微流体通道结构可以具有各自携带颗粒(例如,生物颗粒、细胞珠粒和/或凝胶珠粒)的2、3、4或5个通道段,这些通道段在通道连接部处相遇。流体可以经由一个或多个流体流动单元被引导沿着一个或多个通道或储库流动。流体流动单元可以包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。也可以或另行经由施加的压力差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。
所产生的液滴可以包括液滴的两个子组:(1)包含一个或多个生物颗粒114的被占据的液滴118,以及(2)不包含任何生物颗粒114的未被占据的液滴120。被占据的液滴118可以包括单占据的液滴(具有一个生物颗粒)和多重占据的液滴(具有超过一个生物颗粒)。如本文别处所述,在一些情况下,大部分被占据的分区的每个被占据分区可以包括不超过一个生物颗粒,并且一些所产生的分区可以是未被(任何生物颗粒)占据的。但是,在一些情况下,一些被占据的分区可以包括超过一个生物颗粒。在一些情况下,可以控制分隔过程,使得少于约25%的被占据的分区包含超过一个生物颗粒,并且在许多情况下,少于约20%的被占据的分区具有超过一个生物颗粒,而在一些情况下,少于约10%或甚至少于约5%的被占据的分区的每个分区包括超过一个生物颗粒。
在一些情况下,可能期望使过多数量的空分区的产生最小化,以便降低成本和/或提高效率。虽然可以通过在分隔连接部110处提供足够数量的生物颗粒(例如,生物颗粒114)来实现这种最小化,以便确保至少一个生物颗粒被包封在分区中,但泊松分布可能预期会增加包括多个生物颗粒的分区的数量。因此,在将要获得单占据分区的情况下,最多约95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、5%或更少的所产生的分区可以是未被占据的。
在一些情况下,可以控制一个或多个生物颗粒(例如,在通道段102中)或被引导进入分隔连接部的其他流体(例如,在通道段104、106中)的流动,使得在许多情况下,不超过约50%的所产生的分区、不超过约25%的所产生的分区或不超过约10%的所产生的分区未被占据。可以控制这些流动,以便呈现单占据分区的非泊松分布,同时提供较低水平的未被占据的分区。可以实现未被占据的分区的上述范围,同时仍然提供上述任何一个单占据率。例如,在许多情况下,使用本文所述的系统和方法得到的分区可以具有小于约25%、小于约20%、小于约15%、小于约10%并且在许多情况下小于约5%的多重占据率,同时未被占据的分区少于约50%、少于约40%、少于约30%、少于约20%、少于约10%、少于约5%或更小百分比。
应当理解,上述占据率也适用于同时包括生物颗粒和附加试剂的分区,包括但不限于携带加有条形码的核酸分子(例如,寡核苷酸)的支持物诸如珠粒(例如,凝胶珠粒)(相对于图2描述)。被占据的分区(例如,至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或99%的被占据的分区)可以同时包括具有加有条形码的核酸分子的支持物(例如,珠粒)和生物颗粒。
在另一个方面,作为基于液滴的分隔的补充或替代,生物颗粒可以被包封在支持物内,该支持物包括其中夹带了一个或多个单独生物颗粒或小群生物颗粒的外壳、层或多孔基质。支持物可以包括其他试剂。可以通过多种过程执行生物颗粒的包封。此类过程可以将含有生物颗粒的水性流体与聚合物前体材料组合,在向聚合物前体施加特定的刺激时该聚合物前体材料可能能够形成为凝胶或其他固体或半固体基质。此类刺激可以包括例如热刺激(例如,加热或冷却)、光刺激(例如,通过光固化)、化学刺激(例如,通过交联、前体的聚合引发(例如,通过添加的引发剂))、机械刺激或它们的组合。
可以通过多种方法执行包含生物颗粒(例如,细胞)的支持物的制备。例如,气刀液滴或气溶胶发生器可以用于将前体流体的液滴分配到胶凝溶液中,以形成包括单独生物颗粒或小群生物颗粒的珠粒(例如,凝胶珠粒)。同样,基于膜的包封系统可以用于产生包含如本文所述的包封的生物颗粒的珠粒。诸如图1所示的本公开的微流体系统可以容易地用于包封如本文所述的生物颗粒(例如,细胞)。具体地讲,并且参考图1,包含(i)生物颗粒114和(ii)聚合物前体材料(未示出)的水性流体112流入通道连接部110,水性流体在该通道连接部通过非水性流体116的流动而被分隔成液滴118、120。在包封方法的情况下,非水性流体116还可以包括引发剂(未示出),以引起聚合物前体的聚合和/或交联,从而形成包括所夹带的生物颗粒的多孔基质。聚合物前体/引发剂对的实例包括在美国专利申请公开号2014/0378345中描述的那些,该美国专利申请公开全文以引用方式并入本文以用于所有目的。
在一些情况下,包封的生物颗粒可以选择性地从支持物中释放出来,诸如通过时间的流逝或在施加特定刺激时,这使支持物充分地降解以允许生物颗粒(例如,细胞)或它的其他内容物从支持物中释放出来,诸如释放到分区(例如,液滴)中。参见例如美国专利申请公开No.2014/0378345,该美国专利申请公开全文以引用方式并入本文以用于所有目的。
生物颗粒可以经受足以使前体聚合或胶凝的其他条件。足以使前体聚合或胶凝的条件可以包括暴露于加热、冷却、电磁辐射和/或光。足以使前体聚合或胶凝的条件可以包括足以使前体聚合或胶凝的任何条件。在聚合或胶凝之后,可以在生物颗粒周围形成聚合物或凝胶。聚合物或凝胶对于化学试剂或生化试剂而言可以是扩散渗透性的。聚合物或凝胶对于生物颗粒的大分子成分而言可以是扩散不可渗透性的。这样,聚合物或凝胶可以起到让生物颗粒经受化学或生化操作的作用,同时将大分子成分在空间上限制于由聚合物或凝胶限定的液滴的区域。聚合物或凝胶可以包括二硫化物交联的聚丙烯酰胺、琼脂糖、藻酸盐、聚乙烯醇、聚乙二醇(PEG)-二丙烯酸酯、PEG-丙烯酸酯、PEG-巯基、PEG-叠氮化物、PEG-炔烃、其他丙烯酸酯、壳聚糖、透明质酸、胶原蛋白、纤维蛋白、明胶或弹性蛋白中的一种或多种。聚合物或凝胶可以包括任何其他聚合物或凝胶。
可以将聚合物或凝胶功能化以结合于靶向的分析物,诸如核酸、蛋白质、碳水化合物、脂质或其他分析物。聚合物或凝胶可以经由被动机理聚合或胶凝。聚合物或凝胶在碱性条件或升高的温度下可以是稳定的。聚合物或凝胶可以具有与珠粒的机械特性类似的机械特性。例如,聚合物或凝胶可以具有与珠粒类似的尺寸。聚合物或凝胶可以具有与珠粒类似的机械强度(例如,拉伸强度)。聚合物或凝胶的密度可以低于油。聚合物或凝胶的密度可以大致类似于缓冲液的密度。聚合物或凝胶可以具有可调的孔径。可以选择孔径以例如保留变性的核酸。可以选择孔径以维持对外源化学品(诸如氢氧化钠(NaOH))和/或内源化学品(诸如抑制剂)的扩散渗透性。聚合物或凝胶可以是生物相容的。聚合物或凝胶可以维持或增强细胞活力。聚合物或凝胶可以是生物化学相容的。聚合物或凝胶可以通过热、化学、酶和/或光学方式聚合和/或解聚。
该聚合物可以包括通过二硫键交联的聚(丙烯酰胺-共-丙烯酸)。聚合物的制备可以包括两步反应。在第一活化步骤中,可以将聚(丙烯酰胺-共-丙烯酸)暴露于酰化剂以将羧酸转化成酯。例如,可以将聚(丙烯酰胺-共-丙烯酸)暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉盐酸盐(DMTMM)。可以将聚丙烯酰胺-共-丙烯酸暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓的其他盐。在第二交联步骤中,可以将在第一步骤中形成的酯暴露于二硫化物交联剂。例如,可以将该酯暴露于胱胺(2,2'-二硫代双(乙胺))。在这两个步骤之后,生物颗粒可以被通过二硫桥连接在一起的聚丙烯酰胺链围绕。这样,生物颗粒可以被包封在凝胶或基质(例如,聚合物基质)内部或包含该凝胶或基质以形成“细胞珠粒”。
细胞珠粒可以包含生物颗粒(例如,细胞)或生物颗粒的大分子成分(例如,RNA、DNA、蛋白质等)。细胞珠粒可以包括单个细胞或多个细胞,或单个细胞或多个细胞的衍生物。例如,在裂解和洗涤细胞之后,可以将细胞裂解物中的抑制组分洗掉,并且大分子成分可以结合为细胞珠粒。本文所公开的系统和方法可以适用于包含生物颗粒的细胞珠粒(和/或液滴或其他分区)和包含生物颗粒的大分子成分的细胞珠粒(和/或液滴或其他分区)。细胞珠粒可以是或包括在基质(诸如聚合物基质)中、在基质内或包裹在基质中的细胞、细胞衍生物、细胞材料和/或来源于细胞的材料。在一些情况下,细胞珠粒可以包含活细胞。在一些情况下,活细胞当被包封在凝胶或聚合物基质中时可以能够进行培养,或者当包含凝胶或聚合物基质时可以能够进行培养。在一些情况下,聚合物或凝胶对某些组分可以是可扩散渗透的,而对其他组分(例如,大分子成分)可以是不可扩散渗透的。
如本文所述,一个或多个过程可以在分区中执行,该分区可以是孔。孔可以是基底的多个孔中的孔,例如微孔阵列或板的微孔,或者孔可以是包含基底的装置(例如,微流体装置)的微孔或微腔室。孔可以是孔阵列或板的孔,或者孔可以是装置(例如,流体装置)的孔或腔室。相应地,孔或微孔可以采取“开放”配置,其中孔或微孔暴露于环境(例如,含有开放表面),并且在基底的一个平面表面上是可接近的,或者孔或微孔可以采取“关闭”或“密封”配置,其中微孔在基底的平面表面上是不可接近的。在一些情况下,孔或微孔可以配置为在“开放”和“关闭”配置之间切换。例如,一个“开放”微孔或一组微孔可以使用膜(例如,半透膜)、油(例如,覆盖水溶液的氟化油)或盖子进行“关闭”或“密封”,如本文别处所述。
该孔可以具有小于1毫升(mL)的体积。例如,孔可以配置为容纳最多1000微升(μL)、最多100μL、最多10μL、最多1μL、最多100纳升(nL)、最多10nL、最多1nL、最多100皮升(pL)、最多10(pL)或更少的体积。孔可以配置为容纳约1000μL、约100μL、约10μL、约1μL、约100nL、约10nL、约1nL、约100pL、约10pL等的体积。孔可以配置为容纳至少10pL、至少100pL、至少1nL、至少10nL、至少100nL、至少1μL、至少10μL、至少100μL、至少1000μL或更多的体积。孔可以配置为容纳在本文中列出的体积范围内的体积,例如,约5nL至约20nL、约1nL至约100nL、约500pL至约100μL等。孔可以是具有不同体积的多个孔,并且可以配置为容纳适合容纳本文所述的任何分区体积的体积。
在一些情况下,微孔阵列或板包括单一种类的微孔。在一些情况下,微孔阵列或板包括各种各样的微孔。例如,微孔阵列或板可以包括在单个微孔阵列或板内的一种或多种类型的微孔。微孔的类型可以具有不同的尺寸(例如,长度、宽度、直径、深度、横截面积等)、形状(例如,圆形、三角形、正方形、矩形、五边形、六边形、七边形、八边形、九边形、十边形等)、长宽比或其它物理特性。微孔阵列或板可以包括任何数量的不同类型的微孔。例如,微孔阵列或板可以包括1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000种或更多种不同类型的微孔。孔可以具有任何尺寸(例如,长度、宽度、直径、深度、横截面积、体积等)、形状(例如,圆形、三角形、正方形、矩形、五边形、六边形、七边形、八边形、九边形、十边形、其它多边形等)、长宽比或本文关于任何孔描述的其它物理特性。
在某些情况下,微孔阵列或板包括在阵列或板内彼此相邻定位的不同类型的微孔。例如,具有一组尺寸的微孔可以与具有一组不同尺寸的另一个微孔相邻并接触定位。类似地,不同几何形状的微孔可以彼此相邻或接触放置。相邻的微孔可以被配置为容纳不同的物品;例如,一个微孔可以用于容纳细胞、细胞珠粒或其他样品(例如,细胞组分、核酸分子等),而相邻微孔可以用于容纳支持物(例如,珠粒诸如凝胶珠粒)、液滴或其他试剂。在一些情况下,相邻的微孔可以被配置为例如在施加刺激时或自发地在接触每个微孔中的物品时将保持在其中的内容物融合。
如本文别处所述,在本文描述的系统、组合物和方法中可使用多个分区。例如,可以产生或以其他方式提供任何合适数目的分区(例如,孔或液滴)。例如,在使用孔时的情况下,可以产生或以其他方式提供至少约1,000个孔、至少约5,000个孔、至少约10,000个孔、至少约50,000个孔、至少约100,000个孔、至少约500,000个孔、至少约1,000,000个孔、至少约5,000,000个孔至少约10,000,000个孔、至少约50,000,000个孔、至少约100,000,000个孔、至少约500,000,000个孔、至少约1,000,000,000个孔或更多个孔。此外,多个孔可以包括未被占据的孔(例如,空孔)和占据的孔两者。
孔可以包括本文所述的任何试剂或其组合。这些试剂可以包括例如条形码分子、酶、衔接子,以及它们的组合。试剂可以与置于孔中的样品(例如细胞、细胞珠粒或细胞组分,例如蛋白质、核酸分子等)物理分离。这种物理分离可以通过将试剂包含在置于孔内的支持物(例如,珠粒诸如凝胶珠粒)内或者与置于孔内的支持物偶联来实现。这种物理分离也可以通过在孔中分配试剂并且在将多核苷酸样品引入孔中之前用例如可溶解、可融化或可渗透的层覆盖试剂来实现。该层可以是例如油、蜡、膜(例如,半透膜)等。孔可以在任何时间点密封,例如,在添加支持物(例如,珠粒)之后、在添加试剂之后,或者在添加这些组分中的任一种之后。孔的密封可以用于多种目的,包括防止珠粒或装载的试剂从孔中逸出、允许选择性递送某些试剂(例如,经由使用半透膜)、在进一步处理之前或之后将孔储存好,等等。
孔可以包含游离试剂,以及/或者包封在支持物(例如,珠粒)或液滴中,或以其他方式与支持物(例如,珠粒)或液滴偶联或缔合的试剂。本公开中所述的任何试剂可以与任何化学物质、颗粒和适用于涉及生物分子的样品处理反应的元素一起包封在支持物(例如,珠粒)或液滴中或者以其他方式与支持物(例如,珠粒)或液滴偶联,其中生物分子诸如但不限于核酸分子和蛋白质。例如,在用于DNA测序的样品制备反应中使用的珠粒或液滴可以包含一种或多种以下试剂:酶、限制性酶(例如,多重切割酶)、连接酶、聚合酶、荧光团、寡核苷酸条形码、衔接子、缓冲剂、核苷酸(例如,dNTP、ddNTP)等等。
试剂的附加实例包括但不限于:缓冲剂、酸性溶液、碱性溶液、温度敏感酶、pH敏感酶、光敏感酶、金属、金属离子、氯化镁、氯化钠、锰、水性缓冲剂、温和缓冲剂、离子缓冲剂、抑制剂、酶、蛋白质、多核苷酸、抗体、糖类、脂质、油、盐、离子、去污剂、离子去污剂、非离子去污剂、寡核苷酸、核苷酸、脱氧核糖核苷酸三磷酸(dNTP)、双脱氧核糖核苷酸三磷酸(ddNTP)、DNA、RNA、肽多核苷酸、互补DNA(cDNA)、双链DNA(dsDNA)、单链DNA(ssDNA)、质粒DNA、粘粒DNA、染色体DNA、基因组DNA、病毒DNA、细菌DNA、mtDNA(线粒体DNA)、mRNA、rRNA、tRNA、nRNA、siRNA、snRNA、snoRNA、scaRNA、微RNA、dsRNA、核酶、核糖开关和病毒RNA、聚合酶、连接酶、限制酶、蛋白酶、核酸酶、蛋白酶抑制剂、核酸酶抑制剂、螯合剂、还原剂、氧化剂、荧光团、探针、发色团、染料、有机物、乳化剂、表面活性剂、稳定剂、聚合物、水、小分子、药物、放射性分子、防腐剂、抗生素、适体和药品化合物。如本文所述,孔中的一种或多种试剂可以用于进行一种或多种反应,包括但不限于:细胞裂解、细胞固定、透化、核酸反应(例如核酸延伸反应)、扩增、逆转录、转座酶反应(例如,标签片段化)等。
孔可以作为试剂盒的一部分提供。例如,试剂盒可以包括使用说明、微孔阵列或装置,以及试剂(例如,珠粒)。该试剂盒可以包括用于进行本文所述过程的任何有用的试剂,这些过程例如核酸反应、为核酸分子加条形码、样品处理(例如,用于细胞裂解、固定和/或透化)。
在一些情况下,孔包括支持物(例如,珠粒)或液滴,该支持物(例如,珠粒)或液滴包含具有相似属性的一组试剂(例如,一组酶、一组矿物质、一组寡核苷酸、不同条形码分子的混合物、相同条形码分子的混合物)。在其他情况下,支持物或液滴包含试剂的非均质混合物。在一些情况下,试剂的非均质混合物可以包含进行反应所必需的所有组分。在一些情况下,这样的混合物可以包含进行反应所必需的所有组分,但进行反应所必需的1、2、3、4、5种或更多种组分除外。在一些情况下,此类附加组分包含在不同的支持物或液滴内或以其他方式偶联至不同的支持物或液滴,或者包含在系统的分区(例如,微孔)内的溶液中。
图5示意性地展示了微孔阵列的一个实例。该阵列可以容纳在基板500内。基板500包括多个孔502。孔502可以具有任何尺寸或形状,并且孔之间的间距、每个基板中孔的数量以及基板500上的孔密度可以根据具体应用而改变。在一个这样的示例应用中,可以包含细胞或细胞组分(例如,核酸分子)的样品分子506与珠粒504共同分隔,该珠粒可以包括与其偶联的核酸条形码分子。孔502可以使用重力或其他装载技术(例如,离心、液体处理器、声学装载、光电子器件等)来装载。在一些情况下,至少一个孔502包含单个样品分子506(例如,细胞)和单个珠粒504。
试剂可以依次或同时装载到孔中。在一些情况下,试剂在特定操作之前或之后被引入装置中。在一些情况下,试剂(在某些情况下,可以在支持物或液滴中提供)被依次引入,使得不同的反应或操作在不同的步骤发生。也可以在穿插有反应或操作步骤的操作中装载试剂(或者支持物或液滴)。例如,可以将包含用于使多核苷酸片段化的试剂(例如,限制性酶)和/或其他酶(例如,转座酶、连接酶、聚合酶等)的支持物(或液滴)装载到一个或多个孔中,随后装载包含用于将核酸条形码分子附着到样品核酸分子的试剂的支持物或液滴。试剂可以与样品例如细胞或细胞组分(例如,细胞器、蛋白质、核酸分子、碳水化合物、脂质等)同时或依次提供。因此,在进行多步操作或反应时,使用孔可能是有用的。
如本文别处所述,核酸条形码分子和其他试剂可以包含在支持物(例如,珠粒)或液滴内。这些支持物或液滴可以在装载细胞之前、之后或装载细胞的同时装载到分区(例如,微孔)中,使得每个细胞与不同的支持物或液滴接触。该技术可以用于将独特的核酸条形码分子附着到从每个细胞获得的核酸分子。另选地或此外,样品核酸分子可以附着到支持物。例如,分区(例如,微孔)可以包括珠粒,其具有与之偶联的多个核酸条形码分子。样品核酸分子或其衍生物可以偶联或附着到支持物上的核酸条形码分子。然后可以将所得加有条形码的核酸分子从分区取出,并且在一些情况下,合并并测序。在此类情况下,核酸条形码序列可以用于追踪样品核酸分子的来源。例如,具有相同条形码的多核苷酸可以被确定来源于相同的细胞或分区,而具有不同条形码的多核苷酸可以被确定来源于不同的细胞、细胞核、细胞珠粒或分区。
可以使用多种方法将样品或试剂装载到孔或微孔中。样品(例如,细胞、细胞珠粒或细胞组分)或试剂(如本文所述)可以使用外力(例如,重力、电力、磁力)或使用驱动样品或试剂进入孔中的机构(例如,经由压力驱动流动、离心、光电子器件、声学装载、动电泵送、真空、毛细流动等)装载到孔或微孔中。在某些情况下,可以使用流体处理系统将样品或试剂装载到孔中。样品或试剂的装载可以遵循泊松分布或非泊松分布,例如超泊松或亚泊松的。可以修改微孔的几何形状、孔之间的间距、密度和大小以适应有用的样品或试剂分布;例如,可以调节微孔的大小和间距,使得样品或试剂能够以超泊松方式分布。
在一个特定的非限制性实例中,微孔阵列或微孔板包括成对的微孔,其中每对微孔被配置为容纳液滴(例如,包含单细胞)和单个珠粒(诸如本文所述的那些,其在一些情况下也可以被包封在液滴中)。液滴和珠粒(或包含珠粒的液滴)可以同时或依次装载,并且液滴和珠粒可以融合,例如,在液滴与珠粒接触时,或者在施加刺激(例如,外力、搅拌、热、光、磁力或电力等)时。在一些情况下,液滴和珠的装载是超泊松的。在微孔对的其他实例中,孔配置为容纳包含不同试剂和/或样品的两个液滴,其在接触时或在施加刺激时融合。在这样的情况下,该对中的一个微孔的液滴可包含可以与该对中的另一个微孔的液滴中的剂反应的试剂。例如,一个液滴可包含配置为释放位于相邻微孔中的另一个液滴中包含的珠的核酸条形码分子的试剂。在液滴融合时,核酸条形码分子可以从珠粒释放到分区(例如,微孔或接触的微孔对)中,并且可以进行进一步的处理(例如,加条形码、核酸反应等)。在完整细胞或活细胞被装载于微孔中的情况下,其中一个液滴可以包含用于在液滴融合时将细胞裂解的裂解试剂。
液滴或支持物(例如,珠粒)可以被分隔到一个孔中。液滴可以在装载到孔中之前进行选择或经受预处理。例如,液滴可以包含细胞,并且只有某些液滴(诸如包含单细胞(或至少一个细胞)的那些液滴)可以被选择用于装载孔。这种预选过程可以用于有效装载单细胞,诸如以获得非泊松分布,或者在孔中进一步分隔之前预过滤具有选定特征的细胞。此外,该技术可以用于在装载微孔之前或期间获得细胞双联体或多重体,或者防止形成细胞双联体或多重体。
在一些情况下,孔可以包含附着到其上的核酸条形码分子。核酸条形码分子可以附着到孔的表面(例如,孔的壁)。一个孔的核酸条形码分子(例如,分区条形码序列)可以不同于另一个孔的核酸条形码分子,这可允许单个分区或孔内所含内容物的鉴定。在一些情况下,核酸条形码分子可包含空间条形码序列,其可鉴定孔例如在孔阵列或孔板内的空间坐标。在一些情况下,核酸条形码分子可以包括用于识别个体分子的独特分子标识符。在一些情况下,核酸条形码分子可以被配置为附着到或捕获分布在孔中的样品或细胞内的核酸分子。例如,核酸条形码分子可以包含捕获序列,该捕获序列可以用于捕获样品内的核酸分子(例如,RNA、DNA)或者与该核酸分子杂交。在一些情况下,核酸条形码分子可以从微孔释放。例如,核酸条形码分子可以包含化学交联剂,其可以在施加刺激(例如,光刺激、磁刺激、化学刺激、生物刺激)时被切割。可以将释放的核酸条形码分子(其可以与样品核酸分子杂交或被配置为与样品核酸分子杂交)收集起来合并用于进一步的处理,该进一步的处理可以包括核酸处理(例如,扩增、延伸、逆转录等)和/或表征(例如,测序)。在此类情况下,独特的分区条形码序列可以用于识别核酸分子来源的细胞或分区。
可以对孔内的样品进行表征。在非限制性实例中,这种表征可以包括对样品(例如,细胞、细胞珠粒或细胞组分)或其衍生物成像。表征技术(诸如显微镜法或成像)可以用于测量固定空间位置中的样品剖面。例如,当细胞(细胞核或细胞珠粒)被分隔时,任选地与珠粒一起分隔时,对每个微孔和其中容纳的内容物成像可以提供关于以下各项的有用信息:细胞双联体形成(例如,频率、空间位置等)、细胞-珠粒对效率、细胞活力、细胞大小、细胞形态、生物标志物(例如,表面标志物、其中的荧光标记分子等)的表达水平、细胞或珠粒装载速率、细胞-珠粒对的数量,等等。在一些情况下,成像可以用于表征孔中的活细胞,包括但不限于:动态活细胞追踪、细胞-细胞相互作用(当两个或更多个细胞被共同分隔时)、细胞增殖,等等。另选地或此外,成像可以用于表征孔中的扩增产物的量。
在操作中,孔可以同时或依次装载样品和试剂。在装载细胞、细胞核或细胞珠粒时,可以对孔进行洗涤,例如以从孔、微孔阵列或板中去除过量的细胞(或细胞核或细胞珠粒)。类似地,可以进行清洗以从孔、微孔阵列或微孔板中去除多余的珠粒或其他试剂。在使用活细胞的情况下,这些细胞可以在各个分区中裂解,以释放细胞内组分或细胞分析物。另选地,细胞可以在各个分区中固定或透化。细胞内组分或细胞分析物可以偶联到支持物,例如在微孔的表面上、在固体支持物(例如,珠粒)上,或者它们可以被收集用于进一步的下游处理。例如,在细胞裂解后,可以将细胞内组分或细胞分析物转移到各个液滴或其他分区以便加条形码。另选地或此外,细胞内组分或细胞分析物(例如,核酸分子)可以偶联到包含核酸条形码分子的珠粒;随后,可以收集珠粒并进一步处理,例如经受核酸反应如逆转录、扩增或延伸,并且可以例如经由测序来进一步表征其上的核酸分子。另选地或此外,可以在孔中为细胞内组分或细胞分析物加条形码(例如,使用包含可释放的核酸条形码分子的珠粒或在包含核酸条形码分子的微孔的表面上)。加有条形码的核酸分子或分析物可以在孔中进一步处理,或者加有条形码的核酸分子或分析物可以从各个分区收集并在分区外经受进一步处理。进一步处理可以包括核酸处理(例如,执行扩增、延伸)或表征(例如,扩增分子的荧光监测、测序)。在任何方便或有用的步骤中,可以将孔(或者微孔阵列或微孔板)密封(例如,使用油、膜、蜡等),这使得能够储存测定或选择性地引入附加试剂。
孔一旦被密封,就可以经受进一步处理孔中的生物颗粒(例如,细胞、细胞珠粒或细胞核)的条件。例如,孔中的试剂可以允许对生物颗粒进行进一步的处理,例如将细胞或细胞核裂解,如本文进一步描述的。另选地,包含生物颗粒(例如,细胞、细胞珠粒或细胞核)的孔(或多个孔,诸如基于孔的阵列中的那些孔)可以经受冷冻-解冻循环以对生物颗粒进行处理,例如将细胞或细胞核裂解。含有生物颗粒(例如,细胞、细胞珠粒或细胞核)的孔可以经受冷冻温度(例如,0℃、低于0℃、-5℃、-10℃、-15℃、-20℃、-25℃、-30℃、-35℃、-40℃、-45℃、-50℃、-55℃、-60℃、-65℃、-70℃、-80℃,或者-85℃)。冷冻能够以合适的方式进行,例如零度以下的冷冻器或干冰/乙醇浴。在初始冷冻后,可以使包含生物颗粒(例如,细胞、细胞珠粒、一个或多个细胞核)的孔(或多个孔)经受冷冻-解冻循环,以将生物颗粒裂解。在一个实施方案中,将最初冷冻的孔(或多个孔)解冻至高于冷冻温度的温度(例如,室温或25℃)。在另一个实施方案中,冷冻时间少于10分钟(例如,5分钟或7分钟),之后在室温下的解冻时间少于10分钟(例如,5分钟或7分钟)。该冷冻-解冻循环可以重复多次,例如2、3或4次,以在孔(或多个孔)中获得生物颗粒(例如,细胞、细胞珠粒、一个或多个细胞核)的裂解物。在一个实施方案中,冷冻、解冻和/或冷冻/解冻循环在没有裂解缓冲液的情况下进行。
图6示意性地示出了用于处理样品内的核酸分子的示例工作流程。可以提供包括多个微孔602的基板600。可以包含细胞、细胞珠粒、细胞组分或分析物(例如,蛋白质和/或核酸分子)的样品606可以在多个微孔602中与包含核酸条形码分子的多个珠粒604一起被共同分隔。在过程610期间,样品606可以在分区内处理。例如,就活细胞而言,细胞可以经受足以使细胞或细胞核裂解并释放其中所包含的分析物的条件。在过程620中,珠粒604可以被进一步处理。举例来说,过程620a和620b示意性地展示了不同的工作流程,具体取决于珠粒604的特性。
在620a中,珠粒包括附着到其上的核酸条形码分子,并且样品核酸分子(例如,RNA、DNA)可以例如经由连接杂交而附着到核酸条形码分子。这种附着可以发生在珠粒上。在过程630中,可以从多个孔602收集珠粒604加以合并。可以在过程640中执行进一步处理。例如,可以进行一种或多种核酸反应,如逆转录、核酸延伸、扩增、连接、转座等。在一些情况下,衔接子序列与核酸分子或其衍生物连接,如本文中别处所述。例如,测序引物序列可以补加到核酸分子的每一端。在过程650中,可以进行进一步的表征(诸如测序),以产生测序读段。这些测序读段可以产生关于单独的细胞或细胞群体的信息,该信息可以例如在图655中以视觉或图形方式呈现。
在620b中,珠粒包含可释放地附着到其上的核酸条形码分子,如下文所述。珠粒可以降解或以其他方式将核酸条形码分子释放到孔602中;然后,核酸条形码分子可以用于对孔602内的核酸分子加条形码。进一步的处理可以在分区内部或分区外部执行。例如,可以进行一种或多种核酸反应,如逆转录、核酸延伸、扩增、连接、转座等。在一些情况下,衔接子序列与核酸分子或其衍生物连接,如本文中别处所述。例如,测序引物序列可以补加到核酸分子的每一端。在过程650中,可以进行进一步的表征(诸如测序),以产生测序读段。这些测序读段可以产生关于单独的细胞或细胞群体的信息,该信息可以例如在图655中以视觉或图形方式呈现。
珠粒
可以经由固体支持物或载体(例如,珠粒)将核酸条形码分子递送至一个分区(例如,液滴或孔)。在一些情况下,核酸条形码分子最初与固体支持物缔合,然后在施加刺激时从固体支持物释放,这允许核酸条形码分子解离或从固体支持物释放。在具体实例中,核酸条形码分子最初与固体支持物(例如珠粒)缔合,然后在施加生物刺激、化学刺激、热刺激、电刺激、磁刺激和/或光刺激时从固体支持物释放。
核酸条形码分子可以包含条形码序列和功能序列,诸如核酸引物序列或模板开关寡核苷酸(TSO)序列。
固体支持物可以是珠粒。固体支持物(例如,珠粒)可以是多孔的、无孔的、中空的(例如,微胶囊)、固体的、半固体的以及/或者它们的组合。珠粒可以是固体的、半固体的、半流体的、流体的和/或它们的组合。在一些情况下,固体支持物(例如,珠粒)可以是至少部分可溶解的、可破裂的和/或可降解的。在一些情况下,固体支持物(例如,珠粒)可以不是可降解的。在一些情况下,固体支持物(例如,珠粒)可以是凝胶珠粒。凝胶珠粒可以是水凝胶珠粒。凝胶珠粒可以由分子前体(诸如聚合物或单体物类)形成。半固体支持物(例如,珠粒)可以是脂质体珠粒。固体支持物(例如,珠粒)可以包含金属,包括氧化铁、金和银。在一些情况下,固体支持物(例如,珠粒)可以是二氧化硅珠粒。在一些情况下,固体支持物(例如,珠粒)可以是刚性的。在其他情况下,固体支持物(例如,珠粒)可以是柔性的和/或可压缩的。
分区可以包括一个或多个独特标识符,诸如条形码。条形码可以被预先、随后或同时递送到容纳隔室化的或分隔的生物颗粒的分区中。例如,可以分别在液滴产生或在微孔中提供试剂之前、之后或同时,将条形码注入到液滴中或沉积在微孔中。条形码到特定分区的递送允许稍后将单独生物颗粒的特性归属于特定分区。条形码可以经由任何合适的机制例如在核酸分子(例如,寡核苷酸)上递送至分区。加有条形码的核酸分子可以经由支持物(例如,珠粒)递送至分区。在一些情况下,支持物可以包括珠粒。下文进一步详细描述珠粒。
在一些情况下,加有条形码的核酸分子最初可以与支持物(例如,珠粒)缔合,然后从支持物中释放。加有条形码的核酸分子的释放可以是被动的(例如,通过扩散出支持物或扩散到支持物之外)。此外或另选地,从支持物的释放可以是在施加刺激后进行的,该刺激允许加有条形码的核酸分子解离或从支持物(例如,珠粒)释放。这种刺激可以破坏支持物,即,将加有条形码的核酸分子偶联至支持物或偶联在支持物内或两者兼有的相互作用。这种刺激可以包括例如热刺激、光刺激、化学刺激(例如,pH变化或使用还原剂)、机械刺激、辐射刺激;生物刺激(例如,酶)或它们的任何组合。在美国专利公开号2019/0367997和2019/0064173以及国际申请号PCT/US20/17785中提供了用于将携带条形码的珠粒分隔到液滴中的方法和系统,这些文献中的每一者均全文以引用方式并入本文用于所有目的。
在一些实例中,珠粒、生物颗粒和液滴可以沿通道(例如,微流体装置的通道)流动,在一些情况下,以基本上规则的流动剖面(例如,以规则的流速)流动。此类规则流型可以允许液滴包括单个珠粒和单个生物颗粒。此类规则流型可以允许液滴具有大于5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%的占据率(例如,具有珠粒和生物颗粒的液滴)。在例如美国专利公开号2015/0292988中提供了此类规则流型和可以用于提供此类规则流型的装置,该美国专利公开全文以引用方式并入本文。
珠粒可以是多孔的、无孔的、固体的、半固体的、半流体的、流体的和/或它们的任何组合。在一些情况下,珠粒可以是可溶解的、可破坏的或可降解的。在一些情况下,珠粒可以不是可降解的。在一些情况下,珠粒可以是凝胶珠粒。凝胶珠粒可以是水凝胶珠粒。凝胶珠粒可以由分子前体(诸如聚合物或单体物类)形成。半固体珠粒可以是脂质体珠粒。固体珠粒可以包含金属,包括氧化铁、金和银。在一些情况下,珠粒可以是二氧化硅珠粒。在一些情况下,珠粒可以是刚性的。在其他情况下,珠粒可以是柔性的和/或可压缩的。
珠粒可以具有任何合适的形状。珠粒形状的实例包括但不限于球形、非球形、椭圆形、长方形、无定形的、圆形、圆柱形以及它们的变型。
珠粒可以具有一致的尺寸或非均一的尺寸。在一些情况下,珠粒的直径可以为至少约10纳米(nm)、100nm、500nm、1微米(μm)、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更大。在一些情况下,珠粒可以具有小于约10nm、100nm、500nm、1μm、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更小的直径。在一些情况下,珠粒可以具有约40-75μm、30-75μm、20-75μm、40-85μm、40-95μm、20-100μm、10-100μm、1-100μm、20-250μm或20-500μm的范围内的直径。
在某些方面,珠粒可以以具有相对单分散的尺寸分布的珠粒群体或多个珠粒的形式提供。在可能期望在分区内提供相对一致的量的试剂的情况下,维持相对一致的珠粒特性(诸如尺寸)可以有助于总体的一致性。具体地讲,本文所述的珠粒可以具有这样的尺寸分布,所述尺寸分布具有小于50%、小于40%、小于30%、小于20%并且在一些情况下小于15%、小于10%、小于5%或更小的珠粒横截面尺寸的变异系数。
珠粒可以包含天然的和/或合成的材料。例如,珠粒可以包含天然聚合物、合成聚合物或天然聚合物和合成聚合物两者。天然聚合物的实例包括蛋白质和糖,诸如脱氧核糖核酸、橡胶、纤维素、淀粉(例如,直链淀粉、支链淀粉)、蛋白质、酶、多糖、蚕丝、聚羟基链烷酸酯、壳聚糖、葡聚糖、胶原、角叉菜胶、卵叶车前子、阿拉伯树胶、琼脂、明胶、虫胶、梧桐胶、黄原胶、玉米糖胶、瓜尔胶、刺梧桐胶、琼脂糖、藻酸、藻酸盐或它们的天然聚合物。合成聚合物的实例包括丙烯酸、尼龙、硅酮、氨纶(spandex)、粘胶人造丝、聚羧酸、聚乙酸乙烯酯、聚丙烯酰胺、聚丙烯酸酯、聚乙二醇、聚氨酯、聚乳酸、二氧化硅、聚苯乙烯、聚丙烯腈、聚丁二烯、聚碳酸酯、聚乙烯、聚对苯二甲酸乙二醇酯、聚(氯三氟乙烯)、聚(环氧乙烷)、聚(对苯二甲酸乙二醇酯)、聚乙烯、聚异丁烯、聚(甲基丙烯酸甲酯)、聚(甲醛)、聚甲醛、聚丙烯、聚苯乙烯、聚(四氟乙烯)、聚(乙酸乙烯酯)、聚(乙烯醇)、聚(氯乙烯)、聚(偏二氯乙烯)、聚(偏二氟乙烯)、聚(氟乙烯),和/或它们的组合(例如,共聚物)。珠粒也可以由除聚合物之外的材料形成,所述材料包括脂质、胶束、陶瓷、玻璃陶瓷、材料复合物、金属、其他无机材料等。
在一些情况下,珠粒可以含有分子前体(例如,单体或聚合物),所述分子前体可以经由分子前体的聚合来形成聚合物网络。在一些情况下,前体可以是能够经历进一步聚合(例如,经由化学交联键)的已经聚合的物类。在一些情况下,前体可以包括丙烯酰胺或甲基丙烯酰胺单体、寡聚物或聚合物中的一种或多种。在一些情况下,珠粒可以包含预聚物,所述预聚物是能够进一步聚合的寡聚物。例如,可以使用预聚物制备聚氨酯珠粒。在一些情况下,珠粒可以含有可以进一步聚合在一起的单独聚合物。在一些情况下,可以经由不同前体的聚合来产生珠粒,使得它们包含混合的聚合物、共聚物和/或嵌段共聚物。在一些情况下,珠粒可以在聚合物前体(例如,单体、寡聚物、线性聚合物)、核酸分子(例如,寡核苷酸)、引物和其他实体之间包含共价键或离子键。在一些情况下,共价键可为碳-碳键、硫醚键或碳-杂原子键。
取决于所使用的特定交联剂,交联可以是永久的或可逆的。可逆交联可以允许聚合物在适当的条件下线性化或解离。在一些情况下,可逆交联也可以允许结合于珠粒表面的材料的可逆附着。在一些情况下,交联剂可以形成二硫键。在一些情况下,形成二硫键的化学交联剂可以是胱胺或经修饰的胱胺。
在一些情况下,二硫键可以在掺入到珠粒中的分子前体单元(例如,单体、寡聚物或线性聚合物)或前体与核酸分子(例如,寡核苷酸)之间形成。胱胺(包括经修饰的胱胺)例如是包含二硫键的有机剂,其可以用作珠粒的单独单体或聚合物前体之间的交联剂。聚丙烯酰胺可以在存在胱胺或包含胱胺的物类(例如,经修饰的胱胺)的情况下聚合,以产生包含二硫键的聚丙烯酰胺凝胶珠粒(例如,包含可化学还原的交联剂的可化学降解的珠粒)。二硫键可以在珠粒暴露于还原剂时允许珠粒被降解(或溶解)。
在一些情况下,壳聚糖(一种线性多糖聚合物)可以经由亲水链与戊二醛交联以形成珠粒。壳聚糖聚合物的交联可以通过由热、压力、pH变化和/或辐射引发的化学反应来实现。
在一些情况下,珠粒可以包含acrydite部分,其在某些方面可以用于将一个或多个核酸分子(例如,条形码序列、加有条形码的核酸分子、加有条形码的寡核苷酸、引物或其他寡核苷酸)附着到珠粒。在一些情况下,acrydite部分可以指由acrydite与一种或多种物类反应(诸如,在聚合反应期间acrydite与其他单体和交联剂的反应)产生的acrydite类似物。可以修饰acrydite部分以与待附着的物类诸如核酸分子(例如,条形码序列、加有条形码的核酸分子、加有条形码的寡核苷酸、引物或其他寡核苷酸)形成化学键。Acrydite部分可以用能够形成二硫键的巯基基团修饰,或者可以用已经包含二硫键的基团修饰。巯基或二硫键(通过二硫键交换)可以用作待附着的物类的锚定点,或者acrydite部分的另一部分可以用于附着。在一些情况下,附着可以是可逆的,使得当二硫键断裂时(例如,在存在还原剂的情况下),附着的物类从珠粒释放。在其他情况下,acrydite部分可以包含可以用于附着的反应性羟基基团。
为附着核酸分子(例如,寡核苷酸)而对珠粒的功能化可以通过多种不同的方法来实现,包括聚合物内化学基团的活化、聚合物结构中活性或可激活的官能团的掺入,或者在珠粒产生的预聚物或单体阶段的附着。
例如,聚合以形成珠粒的前体(例如,单体、交联剂)可以包含acrydite部分,使得当产生珠粒时,该珠粒还包含acrydite部分。acrydite部分可以附着到核酸分子(例如,寡核苷酸),该核酸分子包含可用于掺入到珠粒等中的一个或多个功能序列,该一个或多个功能序列诸如为TSO序列或引物序列(例如,多聚T序列,或与靶核酸序列互补和/或用于扩增靶核酸序列的核酸引物序列,随机引物,或信使RNA的引物序列),和/或一个或多个条形码序列。一个或多个条形码序列可以包括对于偶联至给定珠粒的所有核酸分子而言相同的序列和/或在偶联至给定珠粒的所有核酸分子中不同的序列。可以将核酸分子掺入到珠粒中。
在一些情况下,核酸分子可以包含功能序列(例如,用于附着到测序流动池),例如用于测序的P5序列(或其一部分)。在一些情况下,核酸分子或其衍生物(例如,从核酸分子产生的寡核苷酸或多核苷酸)可以包含另一个功能序列,例如,用于附着到用于Illumina测序的测序流动池的P7序列(或其一部分)。在一些情况下,核酸分子可以包含条形码序列。在一些情况下,核酸分子还可以包含独特分子标识符(UMI)。在一些情况下,核酸分子可以包含用于Illumina测序的R1引物序列。在一些情况下,核酸分子可以包含用于Illumina测序的R2引物序列。可以与本公开的组合物、装置、方法和系统一起使用的此类核酸分子(例如,寡核苷酸、多核苷酸等)及其用途的实例提供于美国专利公开号2014/0378345和2015/0376609中,这些美国专利公开中的每一篇全文以引用方式并入本文。
在一些情况下,核酸分子可以包含一个或多个功能序列。例如,功能序列可以包含用于附着到测序流动池的序列,例如用于测序的P5序列。在一些情况下,核酸分子或其衍生物(例如,从核酸分子产生的寡核苷酸或多核苷酸)可以包含另一个功能序列,例如,用于附着到用于Illumina测序的测序流动池的P7序列。在一些情况下,功能序列可以包含一个条形码序列或多个条形码序列。在一些情况下,功能序列可以包含独特分子标识符(UMI)。在一些情况下,功能序列可以包含引物序列(例如,用于Illumina测序的R1引物序列、用于Illumina测序的R2引物序列等)。在一些情况下,功能序列可以包含部分序列,诸如部分条形码序列、部分锚定序列、部分测序引物序列(例如,部分R1序列、部分R2序列等)、被配置为附着到测序仪的流动池的部分序列(例如,部分P5序列、部分P7序列等),或本文别处所述的任何其他类型的序列的部分序列。例如,部分序列可以包含完整序列的邻接或连续部分或片段,但不是全部。在一些情况下,下游程序可以延伸部分序列或其衍生物,以获得部分序列或其衍生物的完整序列。
可以与本公开的组合物、装置、方法和系统一起使用的此类核酸分子(例如,寡核苷酸、多核苷酸等)及其用途的实例提供于美国专利公开号2014/0378345和2015/0376609中,这些美国专利公开中的每一篇全文以引用方式并入本文。
图3示出了携带条形码的珠粒的实例。核酸分子302(诸如寡核苷酸)可以通过可释放键306(诸如二硫化物接头)偶联到珠粒304。相同的珠粒304可以(例如,经由可释放键)偶联到一个或多个其他核酸分子318、320。核酸分子302可以是或包含条形码。如本文别处所述,条形码的结构可以包含多个序列元件。核酸分子302可以包含可以在后续处理中使用的功能序列308。例如,功能序列308可以包含测序仪特异性流动池附着序列(例如,用于测序系统的P5序列)和测序引物序列(例如,用于/>测序系统的R1引物)或其部分序列中的一者或多者。核酸分子302可以包含用于为样品(例如,DNA、RNA、蛋白质等)加条形码的条形码序列310。在一些情况下,条形码序列310可以是珠粒特异性的,使得条形码序列310对于偶联至相同珠粒304的所有核酸分子(例如,包括核酸分子302)是共有的。另选地或此外,条形码序列310可以是分区特异性的,使得条形码序列310对于与一个或多个被分隔到相同分区中的珠粒偶联的所有核酸分子是共有的。核酸分子302可以包含特异性引物序列312,诸如mRNA特异性引物序列(例如,多聚T序列)、靶向引物序列和/或随机引物序列。核酸分子302可以包含锚定序列314,以确保特异性引物序列312在(例如,mRNA的)序列末端杂交。例如,锚定序列314可以包括核苷酸的随机短序列,诸如1-mer、2-mer、3-mer或更长的序列,其可以确保多聚T片段更可能在mRNA的多聚A尾的序列末端杂交。
核酸分子302可以包含独特分子鉴定序列316(例如,独特分子标识符(UMI))。在一些情况下,独特分子鉴定序列316可以包含约5至约8个核苷酸。另选地,独特分子鉴定序列316可以压缩少于约5个或多于约8个核苷酸。独特分子鉴定序列316可以是在偶联至单个珠粒(例如,珠粒304)的单独核酸分子(例如,302、318、320等)之间变化的独特序列。在一些情况下,独特分子鉴定序列316可以是随机序列(例如,诸如随机N-mer序列)。例如,UMI可以提供被捕获的起始mRNA分子的独特标识符,以便允许定量初始表达的RNA的数量。应当理解,尽管图3示出了偶联至珠粒304的表面的三个核酸分子302、318、320,但是单独珠粒可以偶联至任何数量的单独核酸分子,例如,从一个到数十个到数十万个或甚至数百万个单独核酸分子。单独核酸分子的相应条形码可以包含在偶联至相同珠粒的不同单独核酸分子之间的共同序列片段或相对共同的序列片段(例如308、310、312等)和可变或独特的序列片段(例如316)。
在操作中,可以将生物颗粒(例如,细胞、DNA、RNA等)连同带有条形码的珠粒304一起共同分隔。可以从分区中的珠粒304释放核酸条形码分子302、318、320。举例来说,在分析样品RNA的上下文中,释放的核酸分子之一(例如,302)的多聚T片段(例如,312)可以与mRNA分子的多聚A尾杂交。逆转录可以产生mRNA的cDNA转录物,但是该转录物包括核酸分子302的每个序列片段308、310、316。由于核酸分子302包含锚定序列314,因此其更可能与mRNA的多聚A尾的序列末端杂交并引发逆转录。在任何给定的分区内,单独mRNA分子的所有cDNA转录物都可以包含一个共同的条形码序列片段310。然而,由给定分区内的不同mRNA分子制备的转录物可能会在独特分子鉴定序列312片段(例如,UMI片段)处发生变化。有利的是,即使在给定分区的内容物的任何后续扩增之后,不同UMI的数量也可以指示源自给定分区的mRNA的量,并因此指示源自生物颗粒(例如,细胞)的mRNA的量。如上所述,可以对转录物进行扩增、净化和测序以鉴定mRNA的cDNA转录物的序列,以及对条形码片段和UMI片段进行测序。虽然描述了多聚T引物序列,但其他靶向或随机引物序列也可以用于引发逆转录反应。同样,尽管描述为将加有条形码的寡核苷酸释放到分区中,但是在一些情况下,结合于珠粒(例如,凝胶珠粒)的核酸分子可以用于杂交和捕获珠粒固相上的mRNA,例如,以促进RNA与其他细胞内容物的分离。在此类情况下,可以在分区中或在分区外(例如,在本体中)进行进一步的处理。例如,珠粒上的RNA分子可以经受逆转录或其他核酸处理,可以将附加的衔接子序列添加到加有条形码的核酸分子,或者可以进行其他核酸反应(例如,扩增、核酸延伸)。珠粒或其产物(例如,加有条形码的核酸分子)可以从分区收集,以及/或者合并在一起,随后经受净化和进一步表征(例如,测序)。
本文所述的操作可以在任何有用或方便的步骤中执行。例如,包含核酸条形码分子的珠粒可以在将样品引入分区(例如,孔或液滴)之前、期间或之后引入该分区中。可以为样品的核酸分子加条形码,这可以发生在珠粒上(在核酸分子保持偶联到珠粒的情况下)或者发生在核酸条形码分子释放到分区中之后。在来自样品的核酸分子保持附着到珠粒的情况下,可以将来自各种分区的珠粒收集、合并,然后经受进一步处理(例如,逆转录、附着衔接子、扩增、净化、测序)。在其他情况下,该处理可以发生在分区中。例如,可以在分区中提供足以进行加条形码、附着衔接子、逆转录或其他核酸处理操作的条件,并且在净化和测序之前进行这些操作。
在一些情况下,珠粒可以包含捕获序列或结合序列,其配置为结合于对应捕获序列或结合序列。在一些情况下,珠可以包含多个不同的捕获序列或结合序列,这些不同的捕获序列或结合序列配置为与不同的各自的相应捕获序列或结合序列结合。例如,珠可以包含一个或多个各自配置为与第一相应捕获序列结合的捕获序列的第一子集、一个或多个各自配置为与第二相应捕获序列结合的捕获序列的第二子集、一个或多个各自配置为与第三相应捕获序列结合的捕获序列的第三子集等。珠可以包含任何数量的不同捕获序列。在一些情况下,珠粒可以包含至少2、3、4、5、6、7、8、9、10个或更多个不同的捕获序列或结合序列,其配置为分别结合于不同的相应捕获序列或结合序列。另选地或此外,珠粒可以包含至多约10、9、8、7、6、5、4、3或2个不同的捕获序列或结合序列,其配置为结合于不同的相应捕获序列或结合序列。在一些情况下,不同的捕获序列或结合序列可以配置为促进相同类型的分析物的分析。在一些情况下,不同的捕获序列或结合序列可以配置为便于不同类型的分析物(具有相同的珠粒)的分析。捕获序列可以被设计为附着到对应捕获序列。有利的是,这种对应捕获序列可以被引入或以其他方式被诱导到生物颗粒(例如,细胞、细胞珠粒等)中以便以各种形式(例如,包含对应捕获序列的加有条形码的抗体、包含对应捕获序列的加有条形码到MHC dextramer、包含对应捕获序列的加有条形码的指导RNA分子等)进行不同的测定法,使得对应捕获序列可以在稍后与和珠粒缔合的捕获序列相互作用。在一些情况下,偶联到珠粒(或其他支持物)的捕获序列可以配置为附着到接头分子,诸如夹板分子,其中接头分子配置为通过接头分子将珠粒(或其他支持物)偶联到其他分子,诸如偶联到一种或多种分析物或一种或多种其他接头分子。
图4展示了携带条形码的珠粒的另一个实例。核酸分子405(诸如寡核苷酸)可以通过可释放键406(诸如二硫化物接头)偶联到珠粒404。核酸分子405可以包含第一捕获序列460。相同的珠粒404可以偶联(例如,经由可释放键)到一个或多个包含其他捕获序列的其他核酸分子403、407。核酸分子405可以是或包含条形码。如本文别处所指出的,条形码的结构可以包括许多序列元件,诸如功能序列408(例如,流动池附着序列、测序引物序列等)、条形码序列410(例如,珠粒共有的珠粒特异性序列、分区共有的分区特异性序列等),以及独特分子标识符412(例如,附着到珠粒的不同分子内的独特序列),或者它们的部分序列。捕获序列460可以被配置为附着到对应捕获序列465。在一些情况下,对应捕获序列465可以偶联到另一个分子,该另一个分子可以是分析物或中间载体。例如,如图4所展示,对应捕获序列465偶联到包含靶序列464的指导RNA分子462,其中该靶序列464被配置为附着到分析物。附着到珠粒404的另一个寡核苷酸分子407包含第二捕获序列480,该第二捕获序列被配置为附着到第二对应捕获序列485。如图4所展示,第二对应捕获序列485偶联到抗体482。在一些情况下,抗体482可以对分析物(例如,表面蛋白)具有结合特异性。另选地,抗体482可以不具有结合特异性。附着到珠粒404的另一个寡核苷酸分子403包含第三捕获序列470,该第三捕获序列被配置为附着到第二对应捕获序列475。如图4所展示,第三对应捕获序列475偶联到分子472。分子472可以被配置为或可以不被配置为靶向分析物。其他寡核苷酸分子403、407可以包含关于寡核苷酸分子405描述的其他序列(例如,功能序列、条形码序列、UMI等)。虽然图4展示了包含每个捕获序列的单个寡核苷酸分子,但是应当理解,对于每个捕获序列,珠粒可以包含一组一个或多个寡核苷酸分子,其中每个寡核苷酸分子均包含捕获序列。例如,珠粒可以包含任何数量的具有一个或多个不同的捕获序列的集合。另选地或此外,珠粒404可以包含其他捕获序列。另选地或此外,珠粒404可以包含更少类型的捕获序列(例如,两种捕获序列)。另选地或此外,珠粒404可以包含寡核苷酸分子,该寡核苷酸分子包含引物序列,诸如特异性引物序列,诸如mRNA特异性引物序列(例如,多聚T序列),靶向引物序列,和/或随机引物序列,例如以便于对基因表达进行测定。
在操作中,加有条形码的寡核苷酸可以被释放(例如,在一个分区中),如本文别处所述。另选地,结合于珠粒(例如,凝胶珠粒)的核酸分子可以用于杂交和捕获珠粒固相上的分析物(例如,一种或多种类型的分析物)。
在一些情况下,可以使包含反应性的或能够被活化使得其变得反应性的官能团的前体与其他前体聚合以产生包含活化的或可活化的官能团的凝胶珠粒。然后,该官能团可以用于将附加物类(例如,二硫化物接头、引物、其他寡核苷酸等)附着到凝胶珠粒。例如,一些包含羧酸(COOH)基团的前体可以与其他前体共聚,以形成还包含COOH官能团的凝胶珠粒。在一些情况下,丙烯酸(包含游离COOH基团的物类)、丙烯酰胺和双(丙烯酰)胱胺可以共聚在一起以产生包含游离COOH基团的凝胶珠粒。可以活化凝胶珠粒的COOH基团(例如,经由1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)和N-羟基琥珀酰亚胺(NHS)或4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉盐酸盐(DMTMM)),使得其是反应性的(例如,在EDC/NHS或DMTMM用于激活的情况下,对胺官能团是反应性的)。然后,活化的COOH基团可以与包含将要连接至珠粒的部分的适当物类(例如,在羧酸基团被活化而对胺官能团具有反应性的情况下,包含胺官能团的物类)反应。
可以通过使一些二硫键还原为游离巯基,将在其聚合物网络中包含二硫键的珠粒用附加物类功能化。可以通过例如还原剂(例如,DTT、TCEP等)的作用使二硫键还原以产生游离的巯基基团,而不溶解珠粒。然后,珠粒的游离巯基可以与物类的游离巯基或者与包含另一个二硫键的物类反应(例如,通过巯基-二硫键交换),使得该物类可以连接至珠粒(例如,通过产生的二硫键)。在一些情况下,珠粒的游离巯基可以与任何其他合适的基团反应。例如,珠粒的游离巯基可以与包含acrydite部分的物类反应。珠粒的游离巯基基团可以通过迈克尔加成化学来与acrydite反应,使得包含acrydite的物类连接至珠粒。在一些情况下,可以通过加入巯基封端剂诸如N-乙基马来酰亚胺(N-ethylmalieamide)和碘乙酸盐来防止不受控制的反应。
可以控制珠粒内的二硫键的活化,使得只有少量的二硫键被活化。可以例如通过控制用于产生游离巯基基团的还原剂的浓度和/或控制用于在珠粒聚合中形成二硫键的试剂的浓度来施加控制。在一些情况下,低浓度(例如,还原剂:凝胶珠粒的分子比率小于或等于约1:100,000,000,000、小于或等于约1:10,000,000,000、小于或等于约1:1,000,000,000、小于或等于约1:100,000,000、小于或等于约1:10,000,000、小于或等于约1:1,000,000、小于或等于约1:100,000、小于或等于约1:10,000)的还原剂可以用于还原。控制被还原成游离巯基的二硫键的数量对于确保在功能化期间珠粒结构完整性可能是有用的。在一些情况下,光活性剂诸如荧光染料可以经由珠粒的游离巯基偶联至珠粒,并且用于定量珠粒中存在的游离巯基的数量和/或跟踪珠粒。
在一些情况下,在凝胶珠粒形成之后向凝胶珠粒添加部分可能是有利的。例如,在凝胶珠粒形成后添加寡核苷酸(例如,加有条形码的寡核苷酸)可以避免在聚合期间可能发生的链转移终止过程中的物类损失。此外,较小的前体(例如,不包含侧链基团和连接的部分的单体或交联剂)可以用于聚合,并且可以最低限度地因粘滞效应而被阻碍生长链末端。在一些情况下,在凝胶珠粒合成之后的功能化可以使待负载的物类(例如,寡核苷酸)在潜在的损伤剂(例如,自由基)和/或化学环境中的暴露最小化。在一些情况下,所产生的凝胶可以具有上临界溶解温度(UCST),该温度可以允许珠粒的温度驱动溶胀和塌缩。这种功能性可以在随后用寡核苷酸对珠粒的功能化期间帮助寡核苷酸(例如,引物)渗透到珠粒中。产生后的功能化还可以用于控制珠粒中物类的负载比,使得例如负载比的变异性最小化。物类负载还可以在分批过程中进行,使得多个珠粒可以在单批中用该物类功能化。
注入或以其他方式引入到分区中的珠粒可以包含可释放地、可裂解地或可逆地附着的条形码。注入或以其他方式引入到分区中的珠粒可以包含可活化的条形码。注入或以其他方式引入到分区中的珠粒可以是可降解的、可破坏的或可溶解的珠粒。
条形码可以是可释放地、可裂解地或可逆地附着到珠粒,使得条形码可以通过条形码分子和珠粒之间的键的裂解而被释放或可释放,或通过基础珠粒自身的降解而被释放,从而允许条形码被其他试剂接近或可接近,或两者。在非限制性实例中,可以通过还原二硫键,使用限制性酶、光活化的裂解或经由其他类型的刺激(例如,化学、热、pH、酶促等)裂解和/或反应来实现裂解,如本文别处所述。可释放的条形码有时可以称为可活化的,因为其一旦被释放即可用于反应。因此,例如,可以通过将条形码从珠粒(或本文所述的其他合适类型的分区)释放来活化可活化的条形码。在所描述的方法和系统的上下文中也设想了其他可活化的构型。
作为珠粒和缔合的分子诸如含有条形码的核酸分子(例如,加有条形码的寡核苷酸)之间的可裂解的键的补充或替代,珠粒可以是自发地或在暴露于一种或多种刺激(例如,温度变化、pH变化、暴露于特定化学物类或化学相、暴露于光、还原剂等)时可降解的、可破坏的或可溶解的。在一些情况下,珠粒可以是可溶解的,使得当暴露于特定化学物类或环境变化(诸如温度变化或pH变化)时,珠粒的材料组分溶解。在一些情况下,凝胶珠粒可以在升高的温度和/或碱性条件下降解或溶解。在一些情况下,珠粒可以是可热降解的,使得当珠粒暴露于适当的温度变化(例如,热)时,珠粒降解。与物类(例如,核酸分子,例如加有条形码的寡核苷酸)结合的珠粒的降解或溶解可以导致该物类从珠粒释放。
从上述公开内容将会理解,珠粒的降解可以指结合的或夹带的物类从珠粒上的离解,伴随和不伴随物理珠粒自身的结构降解。例如,珠粒的降解可以涉及经由本文别处描述的一种或多种物类和/或方法使可裂解的键的裂解。在另一个实例中,夹带的物类可以通过例如由于化学环境改变导致的渗透压差而从珠粒释放。举例来说,通常可能在珠粒自身没有结构降解的情况下发生因渗透压差引起的珠粒孔径的改变。在一些情况下,因珠粒的渗透性溶胀引起的孔径的增加可以允许珠粒内夹带的物类释放。在其他情况下,由于孔径缩小,珠粒的渗透性收缩可以使珠粒更好地保持夹带的物类。
可以将可降解的珠粒引入到分区(诸如乳液的液滴或孔)中,使得当施加适当的刺激时,珠粒在分区内降解并且任何缔合的物类(例如,寡核苷酸)均被释放到液滴内。游离物类(例如,寡核苷酸、核酸分子)可以与分区中包含的其他试剂相互作用。例如,可以将包含胱胺且经由二硫键连接至条形码序列的聚丙烯酰胺珠粒与还原剂在油包水乳液的液滴内组合。在液滴内,该还原剂可以破坏各个二硫键,导致珠粒降解和条形码序列释放到液滴的水性内环境中。在另一个实例中,将包含珠粒结合的条形码序列的液滴在碱性溶液中加热也可以导致珠粒降解和所附着的条形码序列释放到液滴的水性内环境中。
任何合适数量的分子标签分子(例如,引物、加有条形码的寡核苷酸)都可以与珠粒缔合,使得从珠粒释放后,分子标签分子(例如,引物,例如加有条形码的寡核苷酸)以预定义的浓度存在于分区中。可以选择这种预定义的浓度以促进用于在分区内产生测序文库的某些反应,例如扩增。在一些情况下,引物的预定义的浓度可以通过产生带有核酸分子(例如,寡核苷酸)的珠粒的过程来限制。
在一些情况下,珠粒可以非共价地负载有一种或多种试剂。可以通过例如以下方式非共价地负载珠粒:使珠粒经受足以溶胀珠粒的条件,使试剂有足够的时间扩散到珠粒内部中,以及使珠粒经受足以去溶胀珠粒的条件。珠粒的溶胀可以例如通过以下方式完成:将珠粒置于热力学上有利的溶剂中,使珠粒经受较高或较低的温度,使珠粒经受较高或较低的离子浓度,和/或使珠粒经受电场。珠粒的溶胀可以通过各种溶胀方法完成。珠粒的去溶胀可以例如通过以下方式完成:将珠粒转移到热力学上不利的溶剂中,使珠粒经受较低或较高的温度,使珠粒经受较低或较高的离子浓度,和/或去除电场。珠粒的去溶胀可以通过各种去溶胀方法完成。转移珠粒可能会导致珠粒中的孔收缩。然后,收缩可能会阻碍珠粒内的试剂扩散出珠粒的内部。该阻碍可能是由于试剂与珠粒内部之间的空间相互作用。转移可以通过微流体完成。例如,转移可以通过将珠粒从一种协流溶剂流移动至不同协流溶剂流来实现。珠粒的可溶胀性和/或孔径可以通过改变珠粒的聚合物组成来调节。
在一些情况下,连接至前体的acrydite部分、连接至前体的另一物类或前体自身可以包含不稳定键,诸如化学、热或光敏感的键,例如二硫键、UV敏感的键等。一旦acrydite部分或包含不稳定键的其他部分被掺入到珠粒中,该珠粒也可以包含该不稳定键。不稳定键可以例如在将物类(例如,条形码、引物等)可逆地连接(共价连接)至珠粒时是有用的。在一些情况下,热不稳定的键可以包括基于核酸杂交的附着(例如,在寡核苷酸与附着到珠粒的互补序列杂交的情况下),使得杂交体的热解链从支持物(例如,珠粒,诸如凝胶珠粒)释放寡核苷酸,例如,含有条形码的序列。
向凝胶珠粒添加多种类型的不稳定键可以使得产生能够响应于不同刺激的珠粒。每种类型的不稳定键可能对相关的刺激(例如,化学刺激、光、温度、酶促等)敏感,使得可以通过施加适当的刺激来控制经由每种不稳定键附着到珠粒的物类的释放。这种功能性可能对物类从凝胶珠粒上的受控释放是有用的。在一些情况下,可以在凝胶珠粒形成后经由例如如上文所述的凝胶珠粒的活化官能团将包含不稳定键的另一物类连接至凝胶珠粒。如应理解,可释放地、可裂解地或可逆地附着到本文描述的珠粒的条形码包括通过条形码分子与珠粒之间的键的裂解而被释放或可释放,或通过基础珠粒自身的降解而被释放的条形码,从而允许条形码被其他试剂接近或可接近,或两者。
在一些情况下,附着到固体支持物(例如,珠粒)的物类(例如,包含条形码的寡核苷酸分子)可以包含允许物类从珠粒释放的U-切除元件。在一些情况下,U-切除元件可以包含含有至少一个尿嘧啶的单链DNA(ssDNA)序列。所述物类可以经由含有至少一个尿嘧啶的ssDNA序列附着到固体支持物。所述物类可以通过尿嘧啶-DNA糖基化酶(例如,以去除尿嘧啶)和核酸内切酶(例如,以诱导ssDNA断裂)的组合来释放。如果核酸内切酶从裂解中产生5’磷酸基团,那么可以在下游处理中包括附加酶处理以消除磷酸基团,例如在连接附加测序柄元件之前,该附加测序柄元件例如为Illumina完整P5序列、部分P5序列、完整R1序列和/或部分R1序列。
如本文所述可释放的条形码有时可被称为可活化的,因为它们一旦被释放就可用于反应。因此,例如,可以通过将条形码从珠粒(或本文所述的其他合适类型的分区)释放来活化可活化的条形码。在所描述的方法和系统的上下文中也设想了其他可活化的构型。
除了热可裂解的键、二硫键和UV敏感的键之外,可以偶联至前体或珠粒的不稳定键的其他非限制性实例还包括酯键(例如,可用酸、碱或羟胺裂解的)、邻二醇键(例如,可经由高碘酸钠裂解的)、狄尔斯–阿尔德(Diels-Alder)键(例如,可经由热裂解的)、砜键(例如,可经由碱裂解的)、甲硅烷基醚键(例如,可经由酸裂解的)、糖苷键(例如,可经由淀粉酶裂解的)、肽键(例如,可经由蛋白酶裂解的)或磷酸二酯键(例如,可经由核酸酶(例如,DNA酶)裂解的)。可以经由其他核酸分子靶向酶诸如限制性酶(例如,限制性核酸内切酶)来裂解键,如下文进一步描述。
可以在珠粒产生期间(例如,在前体聚合期间)将物类包封在珠粒中。此类物类可以参与或可以不参与聚合。此类物类可以进入聚合反应混合物中,使得在珠粒形成时所产生的珠粒包含该物类。在一些情况下,此类物类可以在凝胶珠粒形成后添加至凝胶珠粒。此类物类可以包括例如核酸分子(例如,寡核苷酸)、用于核酸扩增反应的试剂(例如,引物、聚合酶、dNTP、辅因子(例如,离子辅因子)、缓冲液)(包括本文所述的那些)、用于酶促反应的试剂(例如,酶、辅因子、底物、缓冲液)、用于核酸修饰反应(诸如聚合、连接或消化)的试剂和/或用于一种或多种测序平台(例如,的/>)的模板制备(例如,标签片段化(tagmentation))的试剂。此类物类可以包括本文所述的一种或多种酶,包括但不限于聚合酶、逆转录酶、限制性酶(例如,核酸内切酶)、转座酶、连接酶、蛋白酶K、DNA酶等。此类物类可以包括本文别处所述的一种或多种试剂(例如,裂解剂、抑制剂、灭活剂、螯合剂、刺激物)。此类物类的俘获可以通过在前体聚合期间产生的聚合物网络密度、凝胶珠粒内离子电荷的控制(例如,经由连接至聚合的物类的离子型物类)或通过其他物类的释放来控制。包封的物类可以在珠粒降解时和/或通过施加能够使物类从珠粒释放的刺激而从珠粒释放。另选地或此外,可以在分区形成期间或之后将物类分隔在分区(例如,液滴)中。此类物类可以包括但不限于也可以包封在珠粒中的上述物类。
可降解的珠粒可以包含一种或多种具有不稳定键的物类,使得当珠粒/物类暴露于适当的刺激时,该键被破坏并且珠粒降解。该不稳定键可以是化学键(例如,共价键、离子键),或者可以是另一种类型的物理相互作用(例如,范德华相互作用、偶极-偶极相互作用等)。在一些情况下,用于产生珠粒的交联剂可以包含不稳定键。在暴露于适当的条件时,不稳定键可以被破坏并且珠粒降解。例如,在包含胱胺交联剂的聚丙烯酰胺凝胶珠粒暴露于还原剂时,胱胺的二硫键可以被破坏并且珠粒降解。
与不降解的珠粒相比,当向珠粒施加适当的刺激时,可降解珠粒可以用于更快地从珠粒释放附着的物类(例如,核酸分子、条形码序列、引物等)。例如,对于与多孔珠粒的内表面结合的物类或在被包封物类的情况下,该物类在珠粒降解时可以具有更高的迁移性和对于溶液中的其他物类更高的可接近性。在一些情况下,还可以通过可降解的接头(例如,二硫化物接头)将物类附着到可降解的珠粒。可降解的接头可以与可降解的珠粒响应于相同的刺激,或者这两种可降解的物类可以响应于不同的刺激。例如,可以经由二硫键将条形码序列附着到包含胱胺的聚丙烯酰胺珠粒。在加有条形码的珠粒暴露于还原剂时,珠粒降解,并且在条形码序列与珠粒之间的二硫键以及珠粒中的胱胺的二硫键断裂时条形码序列得到释放。
从上述公开内容将会理解,虽然称为珠粒的降解,但在许多上文提到的情况下,该降解可以指结合的或夹带的物类从珠粒上的离解,伴随和不伴随物理珠粒自身的结构降解。例如,夹带的物类可以通过例如由于化学环境改变导致的渗透压差而从珠粒释放。举例来说,通常可能在珠粒自身没有结构降解的情况下发生因渗透压差引起的珠粒孔径的改变。在一些情况下,因珠粒的渗透性溶胀引起的孔径的增加可以允许珠粒内夹带的物类释放。在其他情况下,由于孔径缩小,珠粒的渗透性收缩可以使珠粒更好地保持夹带的物类。
在提供可降解的珠粒的情况下,可能有利的是避免在给定时间之前将此类珠粒暴露于导致这种降解的一种或多种刺激,以便例如避免珠粒过早降解以及由这种降解所引发的问题,包括例如流动特性差和聚集。举例来说,在珠粒包含可还原的交联基团诸如二硫化物基团的情况下,将期望避免使此类珠粒与还原剂(例如,DTT或其他二硫键裂解试剂)接触。在此类情况下,对本文所述珠粒的处理在一些情况下将在无还原剂(诸如DTT)时提供。由于还原剂通常在商业酶制剂中提供,因此可能期望在处理本文所述的珠粒时提供无还原剂(或无DDT)的酶制剂。此类酶的实例包括例如聚合酶制剂、逆转录酶制剂、连接酶制剂以及许多其他可以用于处理本文所述的珠粒的酶制剂。术语“无还原剂的”或“无DTT的”制剂可以指具有在降解珠粒中使用的此类材料的下限范围的小于约1/10、小于约1/50或甚至小于约1/100的制剂。例如,对于DTT,无还原剂的制剂可以具有小于约0.01毫摩尔(mM)、0.005mM、0.001mM DTT、0.0005mM DTT或甚至小于约0.0001mM DTT。在许多情况下,DTT的量可能是检测不到的。
许多化学触发物可以用于触发珠粒的降解。这些化学变化的实例可以包括pH介导的珠粒内组分完整性变化、经由交联键的裂解发生的珠粒组分的降解以及珠粒组分的解聚。
在一些实施方案中,珠粒可以由包含可降解化学交联剂(诸如BAC或胱胺)的材料形成。此类可降解交联剂的降解可以通过多种机制实现。在一些实例中,可以使珠粒与可诱导氧化、还原或其他化学变化的化学降解剂接触。例如,化学降解剂可以是还原剂,诸如二硫苏糖醇(DTT)。还原剂的附加实例可以包括β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫代丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或它们的组合。还原剂可以降解在形成珠粒的凝胶前体之间形成的二硫键,因此降解珠粒。在其他情况下,溶液pH的变化(诸如pH增加)可以触发珠粒的降解。在其他情况下,暴露于水溶液(诸如水)可以触发水解降解,因此降解珠粒。在一些情况下,刺激的任何组合都可以触发珠粒的降解。例如,pH的改变可以使化学剂(例如,DTT)能够成为有效的还原剂。
当施加热刺激时,也可以诱导珠粒释放其内容物。温度的变化可以引起珠粒的多种变化。例如,热可以引起固体珠粒液化。热的变化可以引起珠粒的熔化,使得珠粒的一部分降解。在其他情况下,热可以增加珠粒组分的内部压力,使得珠粒破裂或爆炸。热还可以作用于用作构建珠粒的材料的热敏性聚合物。
任何合适的试剂都可以降解珠粒。在一些实施方案中,温度或pH的变化可以用于降解珠粒内的热敏的或pH敏感的键。在一些实施方案中,化学降解剂可以用于通过氧化、还原或其他化学变化来降解珠粒内的化学键。例如,化学降解剂可以是还原剂,诸如DTT,其中DTT可以降解在交联剂与凝胶前体之间形成的二硫键,从而降解珠粒。在一些实施方案中,可以添加还原剂以降解珠粒,这可以引起或可以不引起珠粒释放其内容物。还原剂的实例可以包括二硫苏糖醇(DTT)、β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫代丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或它们的组合。还原剂可以以约0.1mM、0.5mM、1mM、5mM、10mM的浓度存在。还原剂可以以至少约0.1mM、0.5mM、1mM、5mM、10mM或大于10mM的浓度存在。还原剂可以以至多约10mM、5mM、1mM、0.5mM、0.1mM或更低的浓度存在。
任何合适数量的分子标签分子(例如,引物、加有条形码的寡核苷酸)都可以与珠粒缔合,使得从珠粒释放后,分子标签分子(例如,引物,例如加有条形码的寡核苷酸)以预定义的浓度存在于分区中。可以选择这种预定义的浓度以促进用于在分区内产生测序文库的某些反应,例如扩增。在一些情况下,引物的预定义的浓度可以通过产生带有寡核苷酸的珠粒的过程来限制。
在一些实例中,多个分区中的一个分区可以包括单个生物颗粒(例如,单个细胞或细胞的单个细胞核)。在一些实例中,多个分区中的一个分区可以包括多个生物颗粒。此类分区可以称为多重占据的分区,并且可以在单个分区内包含例如两个、三个、四个或更多个包含加有条形码的核酸分子(例如,寡核苷酸)的细胞和/或支持物(例如,珠粒)。因此,如上所述,可以控制含有生物颗粒和/或珠粒的流体和分隔流体的流动特性,以提供此类多重占据的分区。特别地,可以控制流动参数以提供大于分区的约50%、大于约75%并且在一些情况下大于约80%、90%、95%或更高的给定占据率。
在一些情况下,可以使用附加支持物(例如,珠粒)将附加试剂递送到分区。在此类情况下,可能有利的是从不同的珠粒来源(例如,含有不同的相关试剂)通过进入共同通道或液滴产生连接部的不同通道入口,将不同的珠粒引入这种共同通道或液滴产生连接部中。在此类情况下,可以控制不同珠粒进入该通道或连接部中的流动和频率,以提供特定比率的来自每个来源的支持物,同时确保此类珠粒的给定配对和组合与给定数量的生物颗粒一起进入分区(例如,每个分区有一个生物颗粒和一个珠粒)。
本文所述的分区可以具有小体积,例如小于约10微升(μL)、5μL、1μL、900皮升(pL)、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL、500纳升(nL)、100nL、50nL或更小。
例如,在基于液滴的分区的情况下,液滴的总体积可以小于约1000pL、900pL、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL或更少。在与支持物共同分隔的情况下,应当理解,分区内的样品流体体积(例如,包括共同分隔的生物颗粒和/或珠粒)可以小于上述体积的约90%、小于上述体积的约80%、小于上述体积的约70%、小于上述体积的约60%、小于上述体积的约50%、小于上述体积的约40%、小于上述体积的约30%、小于上述体积的约20%,或小于上述体积的约10%。
如本文别处所述,分隔物类可以产生分区群体或多个分区。在此类情况下,可以产生或以其他方式提供任何合适数量的分区。例如,可以产生或以其他方式提供至少约1,000个分区、至少约5,000个分区、至少约10,000个分区、至少约50,000个分区、至少约100,000个分区、至少约500,000个分区、至少约1,000,000个分区、至少约5,000,000个分区、至少约10,000,000个分区、至少约50,000,000个分区、至少约100,000,000个分区、至少约500,000,000个分区、至少约1,000,000,000个分区或更多个分区。此外,所述多个分区可以包括未被占据的分区(例如,空的分区)和被占据的分区。
多重分析
本公开提供了用于多重分析以及以其他方式增加分析的通量的方法和系统。例如,单个或集成的处理工作流程可以允许处理、鉴定和/或分析更多或多种分析物、更多或多种类型的分析物,以及/或者更多或多种类型的分析物表征。例如,在本文所述的方法和系统中,能够结合到或以其他方式偶联到一个或多个细胞特征的一种或多种标记剂可以用于表征生物颗粒和/或细胞特征。在一些情况下,细胞特征包括细胞表面特征。细胞表面特征可以包括但不限于受体、抗原、表面蛋白、跨膜蛋白、分化蛋白簇、蛋白通道、蛋白泵、载体蛋白、磷脂、糖蛋白、糖脂、细胞-细胞相互作用、蛋白复合物、抗原呈递复合物、主要组织相容性复合物、工程化的T细胞受体、T细胞受体、B细胞受体、嵌合抗原受体、间隙连接和粘附连接或它们的任何组合。在一些情况下,细胞特征可以包括细胞内分析物,诸如蛋白质、蛋白质修饰(例如,磷酸化状态或其他翻译后修饰)、核蛋白、核膜蛋白或它们的任何组合。标记剂可以包括但不限于蛋白质、肽、抗体(或其表位结合片段)、亲脂部分(诸如胆固醇)、细胞表面受体结合分子、受体配体、小分子、双特异性抗体、双特异性T细胞衔接体、T细胞受体衔接体、B细胞受体衔接体、抗体前药、适体、单抗体、affimer、darpin和蛋白质支架或它们的任何组合。标记剂可以包括(例如,附着到)报告寡核苷酸,该报告寡核苷酸指示结合基团所结合的细胞表面特征。例如,报告寡核苷酸可以包含允许鉴定标记剂的条形码序列。例如,对一种类型的细胞特征(例如,第一细胞表面特征)具有特异性的标记剂可以具有与之偶联的第一报告寡核苷酸,而对不同的细胞特征(例如,第二细胞表面特征)具有特异性的标记剂可以具有与之偶联的不同的报告寡核苷酸。关于示例标记剂、报告寡核苷酸和使用方法的描述,参见例如美国专利10,550,429;美国专利公开20190177800;以及美国专利公开20190367969,这些专利中的每一者均全文以引用方式并入本文用于所有目的。
在特定实例中,可以提供潜在的细胞特征标记剂或结合基团的文库,其中相应的细胞特征标记剂与核酸报告分子(或报告寡核苷酸)缔合,使得不同的报告寡核苷酸序列与能够结合到特定细胞特征的每种标记剂缔合。在一些方面,该文库的不同成员可以通过不同寡核苷酸序列标签的存在来表征。例如,能够结合到第一蛋白质的抗体可能具有与之相关联的第一报告寡核苷酸序列,而能够结合到第二蛋白质的抗体可能具有与之相关联的不同的报告寡核苷酸序列。特定寡核苷酸序列的存在可以指示特定抗体或可以被特定抗体识别或结合的细胞特征的存在。
能够与一个或多个生物颗粒结合或以其他方式偶联的标记剂可以用于将生物颗粒表征为属于特定的生物颗粒组。例如,标记剂可以用于对细胞、细胞核或细胞珠粒的样品或一组细胞、细胞核或细胞珠粒进行标记。这样,一组细胞可以被标记为不同于另一组细胞(或细胞核或细胞珠粒)。在一个实例中,第一组细胞可以来源于第一样品,第二组细胞可以来源于第二样品。标记剂可以允许第一组和第二组具有不同的标记剂(或与标记剂缔合的报告寡核苷酸)。这可以例如促进多重分析,其中第一组的细胞和第二组的细胞可以分别标记,然后合并到一起用于下游分析。标签的下游检测可以指示分析物属于特定的组。
例如,报告寡核苷酸可以连接至抗体或其表位结合片段,并且标记生物颗粒可以包括使抗体连接的条形码分子或表位结合片段连接的条形码分子经受适用于将抗体结合于生物颗粒表面上存在的分子的条件。抗体或其表位结合片段与表面上存在的分子之间的结合亲和力可以在有用的范围内,以确保抗体或其表位结合片段保持与分子结合。例如,结合亲和力可以在有用的范围内,以确保抗体或其表位结合片段在各种样品处理步骤(例如分隔和/或核酸扩增或延伸)期间保持与分子结合。抗体或其表位结合片段和它与之结合的分子之间的解离常数(Kd)可以小于约100μM、90μM、80μM、70μM、60μM、50μM、40μM、30μM、20μM、10μM、9μM、8μM、7μM、6μM、5μM、4μM、3μM、2μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、100nM、90nM、80nM、70nM、60nM、50nM、40nM、30nM、20nM、10nM、9nM、8nM、7nM、6nM、5nM、4nM、3nM、2nM、1nM、900pM、800pM、700pM、600pM、500pM、400pM、300pM、200pM、100pM、90pM、80pM、70pM、60pM、50pM、40pM、30pM、20pM、10pM、9pM、8pM、7pM、6pM、5pM、4pM、3pM、2pM或1pM。例如,该解离常数可以小于约10μM。
在另一个实例中,报告寡核苷酸可以偶联到细胞穿透肽(CPP),并且标记细胞可以包括将CPP偶联的报告寡核苷酸递送到生物颗粒中。标记生物颗粒可以包括由细胞穿透肽将CPP缀合的寡核苷酸递送到细胞和/或细胞珠粒中。可以用于本文所提供的方法中的细胞穿透肽可以包含至少一个非官能半胱氨酸残基,其可以是游离的或衍生的,用于与寡核苷酸形成二硫键,该寡核苷酸已针对这种键合进行过修饰。可以用于本文实施方案中的细胞穿透肽的非限制性实例包括渗透素、转运素、plsl、TAT(48-60)、pVEC、MTS和MAP。可用于本文提供的方法中的细胞穿透肽可以具有诱导细胞群体的至少约30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%细胞的细胞穿透的能力。细胞穿透肽可以是富含精氨酸的肽转运载体。细胞穿透肽可以是渗透素或Tat肽。
在另一个实例中,报告寡核苷酸可以偶联到荧光团或染料,并且标记细胞(或细胞核或细胞珠粒)可以包括使荧光团连接的条形码分子经受适用于将荧光团结合于生物颗粒表面的条件。在一些情况下,荧光团可以与脂质双层强烈地相互作用,并且标记生物颗粒可以包括使荧光团连接的条形码分子经受一定条件,使得荧光团结合于生物颗粒的膜或插入生物颗粒的膜中。在一些情况下,荧光团是水溶性的有机荧光团。在一些情况下,荧光团是Alexa 532马来酰亚胺、四甲基罗丹明-5-马来酰亚胺(TMR马来酰亚胺)、BODIPY-TMR马来酰亚胺、磺基-Cy3马来酰亚胺、Alexa 546羧酸/琥珀酰亚胺酯、Atto 550马来酰亚胺、Cy3羧酸/琥珀酰亚胺酯、Cy3B羧酸/琥珀酰亚胺酯、Atto 565生物素、磺基罗丹明B、Alexa 594马来酰亚胺、Texas Red马来酰亚胺、Alexa 633马来酰亚胺、Abberior STAR 635P叠氮化物、Atto 647N马来酰亚胺、Atto 647SE,或者磺基-Cy5马来酰亚胺。参见例如,Hughes L D等人,PLoS One.2014年2月4日;9(2):e87649,该文献据此全文以引用方式并入本文用于所有目的,旨在说明有机荧光团。
报告寡核苷酸可以偶联到亲脂性分子,并且标记生物颗粒可以包括由亲脂性分子将核酸条形码分子递送到生物颗粒的膜或核膜。亲脂性分子可以与脂质膜(诸如细胞膜和核膜)缔合和/或插入脂质膜中。在一些情况下,插入可以是可逆的。在一些情况下,亲脂性分子与生物颗粒之间的缔合可以是这样的,使得生物颗粒在后续处理(例如,分隔、细胞透化、扩增、合并等)期间保留亲脂性分子(例如,以及其缔合的组分,诸如核酸条形码分子)。报告核苷酸可以进入细胞内空间和/或细胞核中。
报告寡核苷酸可以是核酸分子的一部分,该核酸分子包含任何数目的如本文别处所述的功能序列,诸如靶标捕获序列、随机引物序列等,并且与另一个核酸分子偶联,该另一个核酸分子是分析物或源自分析物。
在分隔之前、期间或之后,可以将细胞(或细胞核或细胞珠粒)与标记剂的文库一起温育,这些标记剂可以是用于一组广泛的不同细胞特征(例如,受体、蛋白质等)的标记剂,并且包括其缔合的报告寡核苷酸。可以将未结合的标记剂从细胞洗去,然后可以如本文别处所述将这些细胞(或细胞核或细胞珠粒)连同分区特异性条形码寡核苷酸(例如,附着到支持物,诸如珠粒或凝胶珠粒)一起共同分隔(例如,共同分隔到液滴或孔中)。因此,分区可以包括一个或多个细胞以及结合的标记剂及其已知的相关联的报告寡核苷酸。
在其他情况下,例如为了促进样品多重分析,对特定细胞特征具有特异性的标记剂可以具有偶联至第一报告寡核苷酸的第一多种标记剂(例如,抗体或亲脂部分)和偶联至第二报告寡核苷酸的第二多种标记剂。例如,第一组多种标记剂和第二组多种标记剂可以与不同的细胞、细胞群体或样品相互作用,从而允许特定的报告寡核苷酸指示特定的细胞群体(或者细胞或样品)和细胞特征。这样,可以对不同样品或群组进行独立处理并且随后组合在一起以进行合并分析(例如,如本文别处所述的基于分区的加条形码)。参见例如美国专利公开20190323088,该专利据此全文以引用方式并入本文用于所有目的。
如本文别处所述,标记剂文库可以与特定的细胞特征缔合,也可以用于将分析物鉴定为源自特定的生物颗粒、群体或样品。可以将生物颗粒与多个文库一起温育,并且给定生物颗粒可以包含多种标记剂。例如,细胞可以包含与之偶联的亲脂性标记剂和抗体。该亲脂性标记剂可以指示细胞是特定细胞样品的成员,而该抗体可以指示细胞含有特定的分析物。这样,报告寡核苷酸和标记剂可以允许对多分析物进行多重分析。
在一些情况下,这些报告寡核苷酸可以包含这样的核酸条形码序列:这些核酸条形码序列允许鉴定报告寡核苷酸与之偶联的标记剂。使用寡核苷酸作为报告子可以提供以下优点:能够在序列方面产生显著多样性,同时还可易于附着到大多数生物分子(例如,抗体等),而且易于进行检测(例如,使用测序或阵列技术)。
报告寡核苷酸附着(偶联)到标记剂可以通过多种直接或间接、共价或非共价缔合或附着中的任何一种来实现。例如,寡核苷酸可以使用化学缀合技术(例如,可从InnovaBiosciences获得的抗体标记试剂盒)共价附着到标记剂(诸如蛋白质,例如抗体或抗体片段)的一部分,以及使用其他非共价附着机制进行附着,例如使用生物素酰化抗体和带有亲和素或链霉亲和素接头的寡核苷酸(或包括偶联至寡核苷酸的一个或多个生物素酰化接头的珠粒)。抗体和寡核苷酸生物素酰化技术是可用的。参见例如Fang等人,“Fluoride-Cleavable Biotinylation Phosphoramidite for 5′-end-Labelling andAffinity Purification of Synthetic Oligonucleotides,”Nucleic Acids Res.2003年1月15日;31(2):708-715,其出于所有目的全文以引用方式并入本文。同样,蛋白质和肽生物素酰化技术已经被开发并且是现成的。参见例如美国专利号6,265,552,该专利全文以引用方式并入本文以用于所有目的。此外,点击反应化学诸如甲基四嗪-PEG5-NHS酯反应、TCO-PEG4-NHS酯反应等可以用于将报告寡核苷酸偶联至标记剂。可商购获得的试剂盒(诸如来自Thunderlink和Abcam的那些)以及本领域中常见的技术可以在适当时用于将报告寡核苷酸偶联至标记剂。在另一个实例中,标记剂间接(例如,经由杂交)偶联至报告寡核苷酸,该报告寡核苷酸包含鉴定该标记剂的条形码序列。例如,标记剂可以直接偶联(例如,共价结合)至杂交寡核苷酸,该杂交寡核苷酸包含与报告寡核苷酸的序列杂交的序列。杂交寡核苷酸与报告寡核苷酸的杂交将标记剂偶联至报告寡核苷酸。在一些实施方案中,诸如在施加刺激时,报告寡核苷酸可从标记剂释放。例如,报告寡核苷酸可以通过不稳定键(例如,化学不稳定、光不稳定、热不稳定等)附着到标记剂,如本文别处针对从支持物释放分子大体描述的。在一些情况下,本文所述的报告寡核苷酸可以包括可用于后续处理的一个或多个功能序列,诸如衔接子序列、独特分子标识符(UMI)序列、测序仪特异性流动池附着序列(诸如P5、P7或者部分P5或P7序列)、引物或引物结合序列、测序引物或引物结合序列(诸如R1、R2或者部分R1或R2序列)。
在一些情况下,标记剂可以包含报告寡核苷酸和标签。标签可以是荧光团、放射性同位素、能够发生比色反应的分子、磁性颗粒或者能够检测的任何其他合适的分子或化合物。标签可以直接或间接缀合至标记剂(或报告寡核苷酸)(或,标签可以缀合至可结合于标记剂或报告寡核苷酸的分子)。在一些情况下,标签缀合到与报告寡核苷酸的序列互补的寡核苷酸,并且可以允许该寡核苷酸与报告寡核苷酸杂交。
图11描述了包含与之附着的报告寡核苷酸(1140)的示例标记剂(1110、1120、1130)。标记剂1110(例如,本文所述的任何标记剂)附着(要么直接附着(例如,共价附着),要么间接附着)到报告寡核苷酸1140。报告寡核苷酸1140可以包含鉴定标记剂1110的条形码序列1142。报告寡核苷酸1140还可以包含可用于后续处理的一个或多个功能序列,诸如衔接子序列、独特分子标识符(UMI)序列、测序仪特异性流动池附着序列(诸如P5、P7或者部分P5或P7序列)、引物或引物结合序列、测序引物或引物结合序列(诸如R1、R2或者部分R1或R2序列)。
参见图11,在一些情况下,缀合至标记剂(例如,1110、1120、1130)的报告寡核苷酸1140包含引物序列1141、鉴定标记剂(例如,1110、1120、1130)的条形码序列和功能序列1143。功能序列1143可以被配置为杂交于互补序列,诸如存在于核酸条形码分子1190(未示出)上的互补序列,诸如本文别处所述的那些。在一些情况下,核酸条形码分子1190附着到支持物(例如,珠粒,诸如凝胶珠粒),诸如本文别处所述的那些。例如,核酸条形码分子1190可以经由可释放键(例如,包括不稳定键)(诸如本文别处所述的那些)附着到支持物。在一些情况下,报告寡核苷酸1140包含一个或多个附加功能序列,诸如上文所述的那些。
在一些情况下,标记剂1110是包含报告寡核苷酸1140的蛋白质或多肽(例如,抗原或预期抗原)。报告寡核苷酸1140包含条形码序列1142,该条形码序列鉴定多肽1110并且可以用于推断分析物(例如,多肽1110的结合伴侣(即,多肽1110可以与之结合的分子或化合物))的存在。在一些情况下,标记剂1110是包含报告寡核苷酸1140的亲脂部分(例如,胆固醇),其中选择该亲脂部分,使得标记剂1110整合到细胞膜或细胞核中。报告寡核苷酸1140包含鉴定亲脂部分1110的条形码序列1142,该亲脂部分在一些情况下用于为细胞(例如,成群的细胞、细胞样品等)加标签并且可以如本文别处所述用于进行多重分析。在一些情况下,标记剂是包含报告寡核苷酸1140的抗体1120(或其表位结合片段)。报告寡核苷酸1140包含条形码序列1142,该条形码序列鉴定抗体1120并且可以用于推断例如抗体1120的靶标(即,抗体1120结合的分子或化合物)的存在。在其他实施方案中,标记剂1130包含具有肽1132的MHC分子1131和鉴定肽1132的报告寡核苷酸1140。在一些情况下,MHC分子偶联至支持物1133。在一些情况下,支持物1133可以是多肽(诸如链霉亲和素),或多糖(诸如葡聚糖)。在一些情况下,报告寡核苷酸1140能够以任何合适的方式直接或间接地偶联到MHC标记剂1130。例如,报告寡核苷酸1140可以与MHC分子1131、支持物1133或肽1132偶联。在一些实施方案中,标记剂1130包含多个MHC分子(例如是MHC多聚体,其可以偶联到支持物(例如,1133))。可以与本文所公开的组合物、方法和系统一起使用的I类和/或II类MHC多聚体有许多可能构型,例如MHC四聚体、MHC五聚体(经由卷曲螺旋结构域组装的MHC,例如MHCI类五聚体(ProImmune,Ltd.))、MHC八聚体、MHC十二聚体、MHC装饰的葡聚糖分子(例如,MHC(Immudex))等。关于示例标记剂(包括基于抗体和MHC的标记剂)、报告寡核苷酸和使用方法的描述,参见例如美国专利10,550,429和美国专利公开20190367969,这些专利中的每一者均全文以引用方式并入本文用于所有目的。
图13展示了携带条形码的珠粒的另一个实例。在一些实施方案中,对多种分析物(例如,RNA和一种或多种分析物,使用本文所述的标记剂)的分析可以包括核酸条形码分子,如图13中所大致描绘的。在一些实施方案中,核酸条形码分子1310和1320经由如本文别处所述的可释放键1340(例如,包括不稳定键)附着到支持物1330。核酸条形码分子1310可以包含衔接子序列1311、条形码序列1312和衔接子序列1313。核酸条形码分子1320可以包含衔接子序列1321、条形码序列1312和衔接子序列1323,其中衔接子序列1323包含与衔接子序列1313不同的序列。在一些情况下,衔接子1311和衔接子1321包含相同序列。在一些情况下,衔接子1311和衔接子1321包含不同序列。尽管支持物1330被示出为包含核酸条形码分子1310和1320,但是本文设想了包含共同条形码序列1312的任何合适数量的条形码分子。例如,在一些实施方案中,支持物1330还包含核酸条形码分子1350。核酸条形码分子1350可以包含衔接子序列1351、条形码序列1312和衔接子序列1353,其中衔接子序列1353包含与衔接子序列1313和1323不同的序列。在一些情况下,核酸条形码分子(例如,1310、1320、1350)包含一个或多个附加功能序列,诸如本文所述的UMI或其他序列。核酸条形码分子1310、1320或1350可以与如本文别处所述的分析物相互作用,例如,如图12A-C中所描绘的。
参见图12A,在用标记剂对细胞进行标记的情况下,序列1223可以与报告寡核苷酸的衔接子序列互补。细胞(或细胞核或细胞珠粒)可以与一种或多种报告寡核苷酸1220缀合的标记剂1210(例如,多肽、抗体或本文别处所述的其他标记剂)接触。在一些情况下,细胞(或细胞核或细胞珠粒)可以在加条形码之前被进一步处理。例如,此类处理可以包括一个或多个清洗和/或细胞分选操作。在一些情况下,将与缀合到寡核苷酸1220的标记剂1210结合的细胞和包含核酸条形码分子1290的支持物1230(例如珠粒,诸如凝胶珠粒)分隔到多个分区之中的一个分区(例如,液滴乳液的液滴或微孔阵列的孔)中。在一些情况下,该分区至多包含结合于标记剂1210的单个细胞。在一些情况下,缀合至标记剂1210(例如,多肽、抗体、pMHC分子诸如MHC多聚体等)的报告寡核苷酸1220包含第一衔接子序列1211(例如,引物序列)、鉴定标记剂1210(例如,多肽、抗体或者pMHC分子或复合物的肽)的条形码序列1212和衔接子序列1213。衔接子序列1213可以被配置为与互补序列杂交,该互补序列诸如存在于核酸条形码分子1290上的序列1223。在一些情况下,寡核苷酸1220包含一个或多个附加功能序列,诸如本文别处所述的那些。
加有条形码的核酸可以从图12A-C中描述的构建体产生(例如,经由核酸反应,诸如核酸延伸或连接)。例如,然后可以使序列1213与互补序列1223杂交,以产生(例如,经由核酸反应,诸如核酸延伸或连接)包含细胞(例如,分区特异性)条形码序列1222(或其反向互补序列)和报告条形码序列1212(或其反向互补序列)的加有条形码的核酸分子。然后可以任选地如本文别处所述的那样处理加有条形码的核酸分子,例如以扩增所述分子和/或将测序平台特异性序列补加至所述片段。参见例如美国专利公开2018/0105808,该专利据此全文以引用方式并入本文用于所有目的。然后可以在合适的测序平台上对加有条形码的核酸分子或由其产生的衍生物进行测序。
在一些实施方案中,可以对多种分析物(例如,核酸和一种或多种分析物,使用本文所述的标记剂)进行分析。例如,工作流程可以包括在图12A至图12C的任一者中大致描绘的工作流程,或者如本文别处所述的针对单独分析物的工作流程的组合。例如,通过使用在图12A至图12C中大致描绘的工作流程的组合,可以对多种分析物进行分析。
在一些情况下,对分析物(例如,核酸、多肽、碳水化合物、脂质等)的分析包括在图12A中大致描绘的工作流程。核酸条形码分子1290可以与一种或多种分析物共同分隔。在一些情况下,核酸条形码分子1290附着到支持物1230(例如,珠粒,诸如凝胶珠粒),诸如本文别处所述的那些。例如,核酸条形码分子1290可以经由可释放键1240(例如,包括不稳定键)(诸如本文别处所述的那些)附着到支持物1230。核酸条形码分子1290可以包含条形码序列1221,并且任选地包含其他附加序列,例如UMI序列1222(或本文别处所述的其他功能序列)。核酸条形码分子1290可以包含序列1223,该序列可以与另一核酸序列互补,使得其可以与特定序列杂交。
例如,序列1223可以包含poly-T序列,并且可以用于与mRNA杂交。参见图12C,在一些实施方案中,核酸条形码分子1290包含与来自细胞的RNA分子1260的序列互补的序列1223。在一些情况下,序列1223包含对RNA分子具有特异性的序列。序列1223可以包含已知序列或靶向序列,或者随机序列。在一些情况下,可以进行核酸延伸反应,从而产生包含序列1223、条形码序列1221、UMI序列1222、任何其他功能序列和对应于RNA分子1260的序列的加有条形码的核酸产物。
在另一个实例中,序列1223可以与已经补加到分析物上的突出端序列或衔接子序列互补。例如,参见图12B图1201,在一些实施方案中,引物1250包含与来自生物颗粒的核酸分子1260(诸如编码BCR序列的RNA)的序列互补的序列。在一些情况下,引物1250包含不与RNA分子1260互补的一个或多个序列1251。序列1251可以是如本文别处所述的功能序列,例如,衔接子序列、测序引物序列,或者便于与测序仪的流动池偶联的序列。在一些情况下,引物1250包含多聚T序列。在一些情况下,引物1250包含与RNA分子中的靶序列互补的序列。在一些情况下,引物1250包含与免疫分子的区域(诸如TCR或BCR序列的恒定区)互补的序列。引物1250与核酸分子1260杂交,并且产生互补分子1270(参见图1202)。例如,互补分子1270可以是在逆转录反应中产生的cDNA。在一些情况下,可以将附加序列补加到互补分子1270上。例如,可以选择逆转录酶,使得几个非模板碱基1280(例如,多聚C序列)补加到cDNA上。在另一个实例中,末端转移酶也可以用于补加该附加序列。核酸条形码分子1290包含与非模板碱基互补的序列1224,并且逆转录酶对核酸条形码分子1290执行模板转换反应,以产生包含细胞(例如,分区特异性)条形码序列1222(或其反向互补序列)和互补分子1270序列(或其一部分)的加有条形码的核酸分子。在一些情况下,序列1223包含与免疫分子的区域(诸如TCR或BCR序列的恒定区)互补的序列。序列1223与核酸分子1260杂交,产生互补分子1270。例如,互补分子1270可以在逆转录反应中产生,该逆转录反应产生包含细胞(例如,分区特异性)条形码序列1222(或其反向互补序列)和互补分子1270序列(或其一部分)的加有条形码的核酸分子。适用于为由mRNA转录物(包括编码免疫细胞受体的V(D)J区的那些)产生的cDNA加条形码的附加方法和组合物以及/或者包括模板转换寡核苷酸的加条形码方法和组合物在以下专利中有所描述:国际专利申请WO2018/075693、美国专利公开号2018/0105808、2015年6月26日提交的美国专利公开号2015/0376609,以及美国专利公开号2019/0367969,这些专利申请中的每一者均全文以引用方式并入本文用于所有目的。
试剂
根据某些方面,可以将生物颗粒连同裂解试剂一起分隔,以释放该分区内的生物颗粒的内容物。在此类情况下,裂解剂可以在诸如通过通道连接部上游的一个或多个附加通道将生物颗粒引入到分隔连接部/液滴产生区(例如,连接部210)中的同时或紧接在其之前与生物颗粒悬浮液接触。根据其他方面,附加地或另选地,生物颗粒可以连同其他试剂一起分隔,如将在下文进一步描述。
本公开的方法和系统可以包括可以用于共同分隔生物颗粒或生物颗粒与试剂的微流体装置及其使用方法。此类系统和方法在美国专利公开号US/20190367997中有所描述,该专利公开全文以引用方式并入本文用于所有目的。
有利的是,当裂解试剂和生物颗粒被共同分隔时,裂解试剂可以促进在分区内释放生物颗粒的内容物。.分区中释放的内容物可以与其他分区的内容物保持离散。
应当理解,本文别处所述的微流体装置的通道段可以联接到多种不同流体源或接收部件中的任何一者,包括储库、管道、歧管,或者其他系统的流体部件。应当理解,微流体通道结构可以具有多种几何形状和/或构造。例如,微流体通道结构可以具有超过两个通道连接部。例如,微流体通道结构可以具有各自携带相同或不同类型的珠粒、试剂和/或生物颗粒的2、3、4、5个或更多个通道段,这些通道段在通道连接部处相遇。可以控制每个通道段中的流体流动,以控制将不同元素分隔到液滴中。流体可以经由一个或多个流体流动单元被引导沿着一个或多个通道或储库流动。流体流动单元可以包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。也可以或另行经由施加的压力差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。
裂解剂的实例包括生物活性试剂,例如用于裂解不同细胞类型(例如革兰氏阳性或阴性细菌、植物、酵母、哺乳动物等)的裂解酶,诸如溶菌酶、无色肽酶、溶葡萄球菌素、labiase、立枯丝核菌裂解酶(kitalase)、溶壁酶和可从例如Sigma-Aldrich,Inc.(StLouis,MO)获得的多种其他裂解酶,以及其他可商购获得的裂解酶。其他裂解剂可以附加地或另选地与生物颗粒共同分隔,以引起生物颗粒的内容物释放到分区中。例如,在一些情况下,可以使用基于表面活性剂的裂解溶液裂解细胞,但是对于其中表面活性剂可能干扰稳定乳液的基于乳液的体系而言,这些溶液可能不太理想。在某些情况下,裂解溶液可以包含非离子表面活性剂,诸如TritonX-100和吐温20。在一些情况下,裂解溶液可以包含离子型表面活性剂,诸如十二烷基肌氨酸钠和十二烷基硫酸钠(SDS)。电穿孔、热、声或机械细胞破坏也可以用于某些情况,例如基于非乳液的分隔,诸如生物颗粒的包封,其可以作为液滴分隔的补充或替代,其中在细胞破坏后包封物的任何孔径足够小到保留给定大小的核酸片段。
作为与上述生物颗粒共同分隔的裂解剂的替代或补充,其他试剂也可以与生物颗粒共同分隔,包括例如DNA酶和RNA酶失活剂或抑制剂,例如蛋白酶K、螯合剂诸如EDTA,以及用于去除或以其他方式减少不同细胞裂解物组分对后续核酸处理的负活性或影响的其他试剂。此外,就包封的生物颗粒(例如,聚合物基质中的细胞或细胞核)而言,可以将生物颗粒暴露于适当的刺激以从共同分隔的支持物(例如,珠粒)释放生物颗粒或其内容物。例如,在一些情况下,化学刺激可以与包封的生物颗粒一起被共同分隔以允许支持物降解以及细胞或其内容物释放到更大的分区中。在一些情况下,该刺激可以与本文别处所述的用于从其相应支持物(例如,珠粒)释放核酸分子(例如,寡核苷酸)的刺激相同。在另选实例,这可以是不同且不重叠的刺激,以便允许包封的生物颗粒在与将核酸分子释放到相同分区中的不同时间释放到分区中。关于用于包封细胞(也称为“细胞珠粒”)的方法、组合物和系统的描述,参见例如美国专利10,428,326和美国专利公开20190100632,这些专利均全文以引用方式并入。
附加试剂诸如核酸内切酶也可以与生物颗粒共同分隔,以使生物颗粒的DNA、DNA聚合酶和用于扩增生物颗粒的核酸片段的dNTP片段化,并将条形码分子标签附着到扩增的片段。可以共同分隔其他酶,包括但不限于聚合酶、转座酶、连接酶、蛋白酶K、DNA酶等。附加试剂还可以包括逆转录酶(包括具有末端转移酶活性的酶)、引物和寡核苷酸以及可用于模板转换的转换寡核苷酸(本文也称为“转换寡核苷酸”或“模板转换寡核苷酸”)。在一些情况下,模板转换可以用于增加cDNA的长度。在一些情况下,模板转换可以用于将预定义的核酸序列补加至cDNA。在模板转换的实例中,cDNA可以由模板(例如细胞mRNA)的逆转录产生,其中具有末端转移酶活性的逆转录酶可以以不依赖模板的方式向cDNA添加附加核苷酸,例如多聚C。转换寡核苷酸可以包括与附加核苷酸互补的序列,例如多聚G。cDNA上的附加核苷酸(例如,多聚C)可以与转换寡核苷酸上的附加核苷酸(例如,多聚G)杂交,由此逆转录酶可以将转换寡核苷酸用作模板以进一步延伸cDNA。模板转换寡核苷酸可以包含杂交区和模板区。杂交区可以包含能够与靶标杂交的任何序列。在一些情况下,如先前所述,杂交区包含一系列G碱基,以与cDNA分子的3’末端的悬垂C碱基互补。该系列G碱基可以包括1个G碱基、2个G碱基、3个G碱基、4个G碱基、5个G碱基或超过5个G碱基。模板序列可以包含要掺入到cDNA中的任何序列。在一些情况下,模板区包含至少1个(例如,至少2个、3个、4个、5个或更多个)标签序列和/或功能序列。转换寡核苷酸可以包含脱氧核糖核酸;核糖核酸;经修饰的核酸,包括2-氨基嘌呤、2,6-二氨基嘌呤(2-氨基-dA)、倒位dT、5-甲基dC、2’-脱氧肌苷、Super T(5-羟基丁炔-2’-脱氧尿苷)、Super G(8-氮杂-7-脱氮鸟苷)、锁核酸(LNA)、解锁核酸(UNA,例如UNA-A、UNA-U、UNA-C、UNA-G)、Iso-dG、Iso-dC、2’氟代碱基(例如,氟代C、氟代U、氟代A和氟代G)或任何组合。
在一些情况下,转换寡核苷酸的长度可以为至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸或更长。
在一些情况下,转换寡核苷酸的长度可以为至多约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸。
一旦将细胞(或细胞核或细胞珠粒)的内容物释放到它们的相应分区中,就可以在分区内进一步处理其中包含的大分子组分(例如,生物颗粒的大分子成分,诸如RNA、DNA或蛋白质)。根据本文所述的方法和系统,可以为单独生物颗粒的大分子组分内容物提供独特标识符,使得在表征那些大分子组分时,它们可以被归属为已衍生自一个或多个相同的生物颗粒。通过将独特标识符特异性地分配给单独生物颗粒或生物颗粒群来提供将特征归属于单独生物颗粒或生物颗粒群的能力。可以为单独生物颗粒或生物颗粒群分配或关联例如核酸条形码形式的独特标识符,以便用独特标识符加标签于或标记生物颗粒的大分子组分(及因此其特征)。然后,这些独特标识符可以用于将生物颗粒的组分和特征归属于单独生物颗粒或生物颗粒群。
在一些方面,这是通过将单独生物颗粒或生物颗粒群与独特标识符共同分隔来执行的,诸如上文所述(参考图2)。在一些方面,以核酸分子(例如,寡核苷酸)的形式提供独特标识符,所述核酸分子包含核酸条形码序列,所述核酸条形码序列可以附着到单独生物颗粒的核酸内容物或以其他方式与该核酸内容物缔合,或附着到生物颗粒的其他组分,特别是附着到这些核酸的片段。核酸分子被分隔,使得在给定分区中的核酸分子之间时,包含在其中的核酸条形码序列是相同的,但是在不同分区之间时,核酸分子可以并且确实具有不同的条形码序列,或者至少代表在给定分析中所有分区中的大量不同的条形码序列。在一些方面,仅一个核酸条形码序列可以与给定分区相关联,但在一些情况下,可以存在两个或更多个不同的条形码序列。
核酸条形码序列可以在核酸分子(例如,寡核苷酸)的序列内包含约6至约20个或更多个核苷酸。核酸条形码序列可以包含约6至约20、30、40、50、60、70、80、90、100个或更多个核苷酸。在一些情况下,条形码序列的长度可以为约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可以为至少约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可以为至多约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更短。这些核苷酸可以是完全连续的,即在相邻核苷酸的单段中,或者它们可以被分成两个或更多个被1个或更多个核苷酸分开的单独子序列。在一些情况下,分开的条形码子序列的长度可以为约4至约16个核苷酸。在一些情况下,条形码子序列可以为约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列可以为至少约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列可以为至多约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更短。
共同分隔的核酸分子还可以包含在来自共同分隔的生物颗粒的核酸的处理中有用的其他功能序列。这些序列包括例如靶向或随机/通用扩增引物序列(用于扩增分区内来自各个生物颗粒的核酸(例如,mRNA、基因组DNA),同时附着缔合的条形码序列)、测序引物或引物识别位点、杂交或探测序列(例如,用于鉴定序列的存在或用于拉下加有条形码的核酸)或许多其他潜在功能序列中的任何一个功能序列。还可以采用共同分隔寡核苷酸的其他机制,包括例如两个或更多个液滴的聚结,其中一个液滴含有寡核苷酸,或将(例如,附着到珠粒的)寡核苷酸微分配到分区中,例如微流体系统内的液滴。
在一个实例中,提供了支持物,诸如珠粒,其各自包括大量可释放地附着到珠粒的上述加有条形码的核酸分子(例如,加有条形码的寡核苷酸),其中附着到特定珠粒的所有核酸分子都将包括相同的核酸条形码序列,但在使用的珠粒的群体间呈现大量的多样化条形码序列。在一些实施方案中,使用例如包含聚丙烯酰胺聚合物基质的水凝胶珠作为核酸分子进入分区的固体支持和递送媒介物,因为它们能够携带大量核酸分子,并且可以配置为在暴露于特定刺激后释放这些核酸分子,如本文中别处所述。在一些情况下,珠粒群体提供包括至少约1,000个不同条形码序列、至少约5,000个不同条形码序列、至少约10,000个不同条形码序列、至少约50,000个不同条形码序列、至少约100,000个不同条形码序列、至少约1,000,000个不同条形码序列、至少约5,000,000个不同条形码序列、或至少约10,000,000个不同条形码序列或更多的多样化条形码序列文库。此外,可以为每个珠粒提供附着的大量核酸(例如,寡核苷酸)分子。特别地,单独的珠粒上包含条形码序列的核酸分子的分子数量可为至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸分子、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子并且在一些情况下至少约10亿个核酸分子或更多。给定珠粒的核酸分子可以包含相同(或共同)条形码序列、不同条形码序列或两者的组合。给定珠粒的核酸分子可以包括多组核酸分子。给定组的核酸分子可以包括相同的条形码序列。相同的条形码序列可以不同于另一组核酸分子的条形码序列。
此外,当对珠粒群体进行分隔时,所得的分区群体也可以包括多样的条形码文库,该文库包括至少约1,000个不同的条形码序列、至少约5,000个不同的条形码序列、至少约10,000个不同的条形码序列、至少约50,000个不同的条形码序列、至少约100,000个不同的条形码序列、至少约1,000,000个不同的条形码序列、至少约5,000,000不同的条形码序列或至少约10,000,000个不同的条形码序列。此外,该群体的每个分区可以包括至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子,并且在一些情况下,至少约10亿个核酸分子。
在一些情况下,可能期望将多个不同的条形码掺入到给定分区中,这些条形码附着到分区内的单个或多个珠粒。例如,在一些情况下,混合但已知的条形码序列组可以在后续处理中提供更大的鉴定保证,例如,通过提供条形码至给定分区的更强地址或归属,作为给定分区的输出的重复确认或独立确认。
在向珠粒施加特定刺激时,核酸分子(例如,寡核苷酸)可从珠粒释放。在一些情况下,该刺激可以是光刺激,例如通过光不稳定键的裂解,由此释放核酸分子。在其他情况下,可以使用热刺激,其中珠粒环境的温度升高将使得核酸分子从珠粒发生键的裂解或其他释放。在其他情况下,可以使用化学刺激,该化学刺激裂解核酸分子与珠粒的键,或以其他方式使得核酸分子从珠粒释放。在一种情况下,此类组合物包括上述用于包封生物颗粒的聚丙烯酰胺基质,并且可以通过暴露于还原剂(诸如DTT)而降解以释放附着的核酸分子。
在一些方面,提供了用于受控分隔的系统和方法。可以通过调节通道体系结构(例如,微流体通道体系结构)中的某些几何特征来控制液滴尺寸。例如,可以调节通道的扩展角、宽度和/或长度来控制液滴尺寸。
图2示出了用于将珠粒受控分隔到离散液滴中的微流体通道结构的实例。通道结构200可以包括通道段202,该通道段在通道连接部206(或相交处)处与储库204连通。储库204可以是室。如本文所用,对“储库”的任何引用也可以指“室”。在操作中,包含悬浮珠粒212的水性流体208可以沿着通道段202运输到连接部206中,以遇到与储库204中的水性流体208不混溶的第二流体210,从而产生流入储库204中的水性流体208的液滴216、218。在水性流体208和第二流体210相遇的连接部206,可以基于诸如在连接部206的流体动力、两种流体208、210的流速、流体特性和通道结构200的某些几何参数(例如,w、h0、α等)来形成液滴。通过从通道段202经连接部206连续地注入水性流体208,可以在储库204中收集多个液滴。
所产生的离散液滴可以包括珠粒(例如,如在被占据的液滴216中一样)。另选地,所产生的离散液滴可以包括超过一个珠粒。另选地,所产生的离散液滴可以不包括任何珠粒(例如,如在未被占据的液滴218中一样)。在一些情况下,所产生的离散液滴可以含有一个或多个生物颗粒,如本文别处所述。在一些情况下,所产生的离散液滴可以包含一种或多种试剂,如本文别处所述。
在一些情况下,水性流体208可以具有基本上一致的浓度或频率的珠粒212。珠粒212可以从单独的通道(图2中未示出)引入到通道段202中。可以通过控制将珠粒212引入到通道段202中的频率和/或通道段202和单独的通道中的流体的相对流速来控制通道段202中的珠粒212的频率。在一些情况下,可以将珠粒从多个不同的通道引入到通道段202中,并且相应地控制频率。
在一些情况下,通道段202中的水性流体208可以包含生物颗粒。在一些情况下,水性流体208可以具有基本上一致的浓度或频率的生物颗粒。与珠粒一样,可以将生物颗粒从单独的通道引入到通道段202中。可以通过控制将生物颗粒引入到通道段202中的频率和/或通道段202和单独的通道中的流体的相对流速来控制通道段202中的水性流体208中的生物颗粒的频率或浓度。在一些情况下,可以将生物颗粒从多个不同的通道引入到通道段202中,并且相应地控制频率。在一些情况下,第一单独通道可以将珠粒引入到通道段202中,并且第二单独通道可以将生物颗粒引入到该通道段中。引入珠粒的第一单独通道可以在引入生物颗粒的第二单独通道的上游或下游。
第二流体210可以包含油,诸如氟化油,其包括用于稳定所得液滴(例如,抑制所得液滴的后续聚结)的氟表面活性剂。
在一些情况下,第二流体210可以不经受和/或不被引导至流入或流出储库204的任何流动。例如,第二流体210可以在储库204中基本上静止。在一些情况下,第二流体210可以诸如通过向储库204施加压力和/或受连接部206处的水性流体208的来流影响而经受在储库204内流动,但不流入或流出储库204。另选地,第二流体210可以经受和/或被引导至流入或流出储库204。例如,储库204可以是将第二流体210从上游引导到下游的通道,从而运输所产生的液滴。
在连接部206处或附近的通道结构200可以具有某些几何特征,其至少部分地确定由通道结构200形成的液滴的尺寸。通道段202可以在连接部206处或附近具有高度h0和宽度w。举例来说,通道段202可以具有矩形横截面,该矩形横截面通向具有较宽横截面(诸如在宽度或直径上)的储库204。另选地,通道段202的横截面可以是其他形状,例如圆形形状、梯形形状、多边形形状或任何其他形状。在连接部206处或附近的储库204的顶壁和底壁可以以扩展角α倾斜。扩展角α允许舌状物(在连接部206处离开通道段202并在液滴形成之前进入储库204的水性流体208的部分)增加深度并且促进减小中间形成的液滴的曲率。液滴尺寸可能会随着扩展角的增加而减小。可以通过上述h0、w和α几何参数的以下方程预测最终的液滴半径Rd
举例来说,对于w=21μm、h=21μm和α=3°的通道结构,预测的液滴尺寸为121μm。在另一个实例中,对于w=25μm、h=25μm和α=5°的通道结构,预测的液滴尺寸为123μm。在另一个实例中,对于w=28μm、h=28μm和α=7°的通道结构,预测的液滴尺寸为124μm。
在一些情况下,扩展角α可以在约0.5°至约4°、约0.1°至约10°或约0°至约90°的范围内。例如,扩展角可以为至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更高。在一些情况下,扩展角可以为至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更小。在一些情况下,宽度w可以在约100微米(μm)至约500μm的范围内。在一些情况下,宽度w可以在约10μm至约200μm的范围内。另选地,宽度可以小于约10μm。另选地,宽度可以大于约500μm。在一些情况下,进入连接部206的水性流体208的流速可以介于约0.04微升(μL)/分钟(min)与约40μL/min之间。在一些情况下,进入连接部206的水性流体208的流速可以介于约0.01微升(μL)/分钟(min)与约100μL/min之间。另选地,进入连接部206的水性流体208的流速可以小于约0.01μL/min。另选地,进入连接部206的水性流体208的流速可以大于约40μL/min,诸如45μL/min、50μL/min、55μL/min、60μL/min、65μL/min、70μL/min、75μL/min、80μL/min、85μL/min、90μL/min、95μL/min、100μL/min、110μL/min、120μL/min、130μL/min、140μL/min、150μL/min或更大。在较低的流速(诸如约小于或等于10微升/分钟的流速)下,液滴半径可能不取决于进入连接部206的水性流体208的流速。
在一些情况下,所产生的至少约50%的液滴可以具有一致的尺寸。在一些情况下,所产生的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的液滴可以具有一致的尺寸。另选地,所产生的小于约50%的液滴可以具有一致的尺寸。
液滴产生的通量可以通过增加产生点来增加,例如增加水性流体208的通道段(例如,通道段202)和储库204之间的连接部(例如,连接部206)的数量。另选地或此外,液滴产生的通量可以通过增加通道段202中的水性流体208的流速来增加。
本文所述的方法和系统可以用于极大地提高单细胞应用和/或接收基于液滴的输入的其他应用的效率。例如,在分选被占据的细胞和/或适当大小的细胞之后,可以执行的后续操作可以包括产生扩增产物、纯化(例如,经由固相可逆固定化(SPRI))、进一步的处理(例如,功能序列的剪切、连接以及随后的扩增(例如,经由PCR))。这些操作可以在本体中(例如,在分区外部)发生。在分区是乳液中的液滴的情况下,乳液可以被破坏并且液滴的内容物被合并以用于附加操作。可以与带有条形码的珠粒一起共同分隔的附加试剂可以包括用于封闭核糖体RNA(rRNA)的寡核苷酸和用于消化细胞中的基因组DNA的核酸酶。另选地,可以在附加处理操作期间应用rRNA去除剂。通过这种方法产生的构建体的构型可以帮助在测序期间最小化(或避免)多聚T序列的测序和/或对多核苷酸序列的5’端进行测序。可以对扩增产物(例如第一扩增产物和/或第二扩增产物)进行测序以进行序列分析。在一些情况下,可以使用部分发夹式测序扩增(PHASE)方法进行扩增。
多种应用需要评估生物颗粒群内不同生物颗粒或生物体类型的存在和定量,包括例如微生物组分析和表征、环境测试、食品安全性测试、例如在污染物溯源中的流行病学分析等。
计算机系统
本公开提供了被编程为实现本公开的方法的计算机系统。图14示出了计算机系统1401,该计算机系统被编程或以其他方式配置为处理或分析测序读段。计算机系统1401可以调节本公开的各个方面,例如,比对测序读段、将测序读段索引到细胞、分区等。计算机系统1401可以是用户的电子设备或相对于该电子设备位于远程位置的计算机系统。电子设备可以是移动电子设备。
计算机系统1401包括中央处理单元(CPU,本文也称为“处理器”和“计算机处理器”)1405,该中央处理单元可以是单核处理器或多核处理器,或者是用于并行处理的多个处理器。计算机系统1401还包括存储器或存储器位置1410(例如,随机存取存储器、只读存储器、闪速存储器)、电子存储单元1415(例如,硬盘)、用于与一个或多个其他系统通信的通信接口1420(例如,网络适配器),以及外围设备1425,诸如高速缓存、其他存储器、数据存储装置和/或电子显示适配器。存储器1410、存储单元1415、接口1420和外围设备1425通过诸如母板的通信总线(实线)与CPU 1405通信。存储单元1415可以是用于存储数据的数据存储单元(或数据储存库)。计算机系统1401可以借助于通信接口1420来可操作地耦接到计算机网络(“网络”)1430。网络1430可以是互联网、互联网和/或外联网,或者与互联网通信的内联网和/或外联网。网络1430在一些情况下是电信网络和/或数据网络。网络1430可以包括一个或多个计算机服务器,所述一个或多个计算机服务器可以支持分布式计算,诸如云计算。网络1430在一些情况下可以借助于计算机系统1401实现点对点网络,这可以使耦接到计算机系统1401的设备能够起到客户端或服务器的作用。
CPU 1405可以执行机器可读指令序列,该机器可读指令序列可以体现在程序或软件中。指令可以存储在诸如存储器1410的存储器位置中。指令可以指向CPU 1405,其可以随后编程或以其他方式配置CPU 1405以实现本公开的方法。由CPU 1405执行的操作的实例可以包括取回、解码、执行和写回。
CPU 1405可以是电路(诸如集成电路)的一部分。系统1401的一个或多个其他部件可以包括在该电路中。在一些情况下,该电路是专用集成电路(ASIC)。
存储单元1415可以存储文件,诸如驱动程序、文库和保存的程序。存储单元1415可以存储用户数据,例如用户偏好和用户程序。在一些情况下,计算机系统1401可以包括位于计算机系统1401外部(诸如位于通过内联网或互联网与计算机系统1401通信的远程服务器上)的一个或多个附加数据存储单元。
计算机系统1401可以通过网络1430来与一个或多个远程计算机系统通信。例如,计算机系统1401可以与用户(例如,操作者)的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如,便携式PC)、板型PC或平板PC(例如,iPad、/>Galaxy Tab)、电话、智能电话(例如,/>iPhone、支持Android的设备、/>)或个人数字助理。用户可以经由网络1430访问计算机系统1401。
如本文所述的方法可以通过存储在计算机系统1401的电子存储位置上(诸如,存储器1410或电子存储单元1415上)的机器(例如,计算机处理器)可执行代码的方式来实现。机器可执行代码或机器可读代码可以以软件的形式提供。在使用期间,该代码可以由处理器1405执行。在一些情况下,可以从存储单元1415检索代码并将其存储在存储器1410上,以供处理器1405随时访问。在一些情况下,可以排除电子存储单元1415,并且将机器可执行指令存储在存储器1410上。
代码可以被预编译并且被配置用于与具有适于执行该代码的处理器的机器一起使用,或者可以在运行时期间编译。代码可以以可被选择以使该代码能够以预编译或已编译的方式执行的编程语言来提供。
本文所提供的系统和方法的各方面(诸如计算机系统1401)可以在编程中体现。该技术的各个方面可以被认为是“产品”或“制品”,其通常为在一种类型的机器可读介质上携带或在该介质中体现的机器(或处理器)可执行代码和/或相关联的数据的形式。机器可执行代码可以存储在电子存储单元上,诸如存储器(例如,只读存储器、随机存取存储器、闪速存储器)或硬盘上。“存储”型介质可以包括计算机、处理器等的任何或所有有形存储器或其相关联的模块,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可以在任何时间为软件编程提供非暂时性存储。软件的全部或部分有时可以通过互联网或各种其他电信网络来通信。此类通信例如可以使软件能够从一个计算机或处理器加载到另一个计算机或处理器中,例如,从管理服务器或主机加载到应用服务器的计算机平台中。因此,可以承载软件元件的另一类型的介质包括诸如跨本地设备之间的物理接口、通过有线和光学陆上通信线网络以及通过各种空中链路而使用的光波、电波和电磁波。携带此类波的物理元件,诸如有线或无线链路、光学链路等,也可以被认为是承载软件的介质。如本文所用,除非限制于非暂时性的有形“存储”介质,否则诸如计算机或机器“可读介质”的术语是指参与向处理器提供指令以供执行的任何介质。
因此,诸如计算机可执行代码的机器可读介质可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,诸如任何计算机中的任何存储设备等,诸如附图中所示的可用于实现数据库的那些介质等。易失性存储介质包括动态存储器,诸如这种计算机平台的主存储器。有形传输介质包括同轴电缆、铜线和光纤,包括构成计算机系统内的总线的导线。载波传输介质可以采取电信号或电磁信号或者声波或光波的形式,诸如射频(RF)和红外(IR)数据通信期间产生的那些。因此,计算机可读介质的常见形式包括例如:软盘、柔性盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、打孔卡、纸带、任何其他具有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储器芯片或匣盒、传送数据或指令的载波、传送这种载波的电缆或链路,或者计算机可以从中读取编程代码和/或数据的任何其他介质。这些计算机可读介质形式中的许多形式可以涉及将一个或多个指令的一个或多个序列携带至处理器以供执行。
计算机系统1401可以包括电子显示器1435或与之通信,该电子显示器包括用户界面(UI)1440,用于提供例如测序分析结果等。UI的实例包括但不限于图形用户界面(GUI)和基于Web的用户界面。
本公开的方法和系统可以通过一种或多种算法实现。算法可以通过软件在由中央处理单元1405执行时实现。例如,该算法可以执行测序。
本公开的装置、系统、组合物和方法可以用于各种应用,诸如处理来自单个细胞的单种分析物(例如,RNA、DNA或蛋白质)或多种分析物(例如,DNA和RNA、DNA和蛋白质、RNA和蛋白质或RNA、DNA和蛋白质)。例如,将生物颗粒(例如,细胞或细胞珠粒)分隔在分区(例如,液滴)中,并且处理来自该生物颗粒的多种分析物以供后续处理。所述多种分析物可以来自单细胞。这可以实现例如细胞同时进行蛋白质组学、转录组学和基因组分析。
实施例
预言性实施例1-RNA模板化连接和加条形码
一个或多个加有条形码的分子的产生(例如,在细胞或细胞珠粒之内或之上)可以在一组或多组分区内依次进行。例如,细胞或细胞珠粒可以包含用于加条形码的靶RNA分子和/或特征,该特征可以具有特征结合基团,该特征结合基团包含与之偶联的报告寡核苷酸(包含报告序列)。可以使靶RNA分子与第一探针和第二探针杂交;例如,靶RNA分子可以具有与第一探针的第一探针序列和第二探针的第二探针序列互补的第一靶区域和第二靶区域。在一些情况下,可以产生探针连接的分子,例如,经由探针在与RNA分子杂交时的连接,或使用一种或多种核酸反应,例如,经由延伸反应和/或酶促连接或化学连接。可以在一组或多组分区中为探针连接的分子加条形码。
在一个实例中,可以将细胞(或细胞核或细胞珠粒)分隔在第一组分区(例如,微孔或其他容器)中,并与包含第一探针、第二探针、探针结合分子(例如,夹板寡核苷酸)和条形码分子的杂交缓冲液接触。杂交缓冲液可以包含试剂(例如,甲酰胺、碳酸亚乙酯、盐等)以促进第一探针和第二探针与靶核酸分子的杂交。然后可以将来自多个分区的细胞(或细胞核或细胞珠粒)合并和洗涤,例如以去除未杂交的探针。之后可以对细胞(或细胞核或细胞珠粒)进行计数并重新分隔在第二组分区(例如,液滴)中。在液滴内,可以进行连接和延伸反应以产生加有条形码的核酸分子。在一些情况下,液滴可以另外包含捕获分子,该捕获分子包含附加条形码序列。因此,液滴内的加有条形码的核酸分子可以包含两个条形码序列。
在另一个实例中,可以将细胞(或细胞核或细胞珠粒)分隔在第一组分区(例如,微孔)中,并与包含第一探针、第二探针、探针结合分子(例如,夹板寡核苷酸)和条形码分子的杂交缓冲液接触。然后可以将分区内的细胞(或细胞核或细胞珠粒)洗涤,例如以去除未杂交的探针,随后合并在一起。之后可以对细胞(或细胞核或细胞珠粒)进行计数并重新分隔在第二组分区(例如,液滴)中。在液滴内,可以进行连接和延伸反应以产生加有条形码的核酸分子。在一些情况下,液滴可以另外包含捕获分子,该捕获分子包含附加条形码序列。因此,液滴内的加有条形码的核酸分子可以包含两个条形码序列。
在又一个实例中,可以将细胞(或细胞核或细胞珠粒)分隔在第一组分区(例如,微孔)中,并与包含第一探针、第二探针、探针结合分子(例如,夹板寡核苷酸)和条形码分子的杂交缓冲液接触。然后可以将来自多个分区的细胞(或细胞核或细胞珠粒)合并和洗涤,例如以去除未杂交的探针。之后可以对细胞(或细胞核或细胞珠粒)进行计数并使之经受足以将条形码分子连接到探针杂交的核酸分子的条件。然后可以将连接的分子分隔到例如液滴中。在液滴内,可以进行延伸反应以产生加有条形码的核酸分子。在一些情况下,液滴可以另外包含捕获分子,该捕获分子包含附加条形码序列。因此,液滴内的加有条形码的核酸分子可以包含两个条形码序列。
在另一个实例中,可以将细胞(或细胞核或细胞珠粒)分隔在第一组分区(例如,微孔)中,并与包含第一探针、第二探针、探针结合分子(例如,夹板寡核苷酸)和条形码分子的杂交缓冲液接触。然后可以将分区内的细胞(或细胞核或细胞珠粒)洗涤,例如以去除未杂交的探针,随后合并在一起。之后可以对细胞(或细胞核或细胞珠粒)进行计数并使之经受足以将条形码分子连接到探针杂交的核酸分子的条件。然后可以将连接的分子分隔到例如液滴中。在液滴内,可以进行延伸反应以产生加有条形码的核酸分子。在一些情况下,液滴可以另外包含捕获分子,该捕获分子包含附加条形码序列。因此,液滴内的加有条形码的核酸分子可以包含两个条形码序列。
在每个实例之后,可以在附加分区中,例如在液滴中,使加有条形码的核酸分子经受附加的加条形码操作。另选地或此外,可以将液滴的内容物合并并在下游处理用于分析(例如,经由测序)。
在一些情况下,可以以不同的顺序执行若干操作。例如,可以首先将可以任选地被固定和透化的细胞、细胞核或细胞珠粒与一组探针杂交,然后进行加条形码(例如,在分区中)。
在一个实例中,可以使细胞(或细胞核或细胞珠粒)例如在本体溶液中与包含第一探针和第二探针的杂交缓冲液接触。然后可以将细胞(或细胞核或细胞珠粒)洗涤,例如以去除未杂交的探针,随后分隔到第一组分区(例如,微孔)中。第一组分区可以各自包括探针结合分子和条形码分子。第一组分区中的细胞(或细胞核或细胞珠粒)可以经受足以使探针结合分子和条形码分子与靶核酸分子、探针分子或其衍生物(例如,延伸的、探针缔合的分子等)杂交的条件。
在一些实例中,随后可以将分区的内容物合并在一起,并且任选地洗涤。之后可以对细胞(或细胞核或细胞珠粒)进行计数并分隔到第二组分区中,并且使之经受足以将条形码分子延伸和/或连接到探针杂交的核酸分子的条件,从而产生加有条形码的核酸分子。在一些情况下,液滴可以另外包含捕获分子,该捕获分子包含附加条形码序列。因此,液滴内的加有条形码的核酸分子可以包含两个条形码序列。
在其他实例中,可以将分区可以洗涤,然后合并在一起。之后可以对细胞(或细胞核或细胞珠粒)进行计数并分隔到第二组分区中,并且使之经受足以将条形码分子延伸和/或连接到探针杂交的核酸分子的条件,从而产生加有条形码的核酸分子。在一些情况下,液滴可以另外包含捕获分子,该捕获分子包含附加条形码序列。因此,液滴内的加有条形码的核酸分子可以包含两个条形码序列。
在其他实例中,随后可以将分区的内容物合并在一起,并且任选地洗涤。之后可以使细胞(或细胞核或细胞珠粒)经受足以将条形码分子连接到探针杂交的核酸分子的条件。可以将连接的分子分隔在第二组分区(例如,液滴)中,并使之经受足以延伸连接的分子的条件以产生加有条形码的核酸分子。在一些情况下,液滴可以另外包含捕获分子,该捕获分子包含附加条形码序列。因此,液滴内的加有条形码的核酸分子可以包含两个条形码序列。
在其他实例中,可以首先洗涤分区,然后可以将分区的内容物合并在一起。之后可以使细胞(或细胞核或细胞珠粒)经受足以将条形码分子连接到探针杂交的核酸分子的条件。可以将连接的分子分隔在第二组分区(例如,液滴)中,并使之经受足以延伸连接的分子的条件以产生加有条形码的核酸分子。在一些情况下,液滴可以另外包含捕获分子,该捕获分子包含附加条形码序列。因此,液滴内的加有条形码的核酸分子可以包含两个条形码序列。
在一些情况下,可以将细胞、细胞核或细胞珠粒首先与一组探针杂交,洗涤,计数,经受足以连接探针或产生探针连接的核酸分子的条件,再次洗涤,然后分隔。在一个实例中,可以将细胞(或细胞核或细胞珠粒)与探针结合分子和条形码分子一起分隔在第一组分区(例如,微孔)中。在第一组分区内,探针结合分子和条形码分子可以与探针缔合的分子(或探针连接的分子)杂交,合并,洗涤(另选地,在分区中洗涤,然后合并),计数,然后装载到第二组分区(例如,液滴)中。之后可以使细胞(或细胞核或细胞珠粒)经受足以将条形码分子延伸和/或连接到探针缔合的或探针连接的核酸分子的条件,从而产生加有条形码的核酸分子。另选地,可以将细胞(或细胞核或细胞珠粒)在本体中连接,并在第二组分区内延伸。在一些情况下,液滴可以另外包含捕获分子,该捕获分子包含附加条形码序列。因此,液滴内的加有条形码的核酸分子可以包含两个条形码序列。
预言性实施例2-多重测定:RNA模板化连接产物和探针缔合的报告寡核苷酸的加条形码
如本文所述,可能有利的是测定细胞、细胞核或细胞珠粒群体中的多种分析物。如本文所述,可以使细胞或细胞珠粒与包含或偶联到报告寡核苷酸(包含报告序列)的特征结合基团接触。特征结合基团可以偶联到细胞的一种或多种特征(例如,蛋白质)。该细胞还可以包含用于测定的靶核酸分子(例如,RNA分子)。
示例方案1:在一个示例方案中,可以将具有与其偶联的特征结合基团的细胞、细胞核或细胞珠粒分隔在第一组分区中。第一组分区的每个分区可以包括例如50微升体积中约50,000个细胞。这些分区各自可以包括一组探针(例如,第一探针、第二探针和第三探针),其可以以2微摩尔的浓度提供。每个分区可以另外包括5微摩尔的夹板寡核苷酸(探针结合分子)和7.5微摩尔的条形码分子。条形码分子在各分区之间可能不同。在第一组分区内,探针分子可以杂交到(i)靶核酸(例如,RNA)分子(例如,经由第一探针和第二探针)和(ii)特征结合基团(例如,经由第三探针)。然后,可以将第一组分区的内容物合并、洗涤,并且例如使用光学方法(诸如吸光度、荧光等)、凝胶电泳或经由测序来分析。
示例方案2:在另一个示例方案中,可以将具有与其偶联的特征结合基团的细胞、细胞核或细胞珠粒在本体中与第一组探针(例如,第一探针、第二探针和第三探针)杂交,第一组探针可以以2微摩尔浓度提供。细胞、细胞核或细胞珠粒可以经受足以使探针分子与靶核酸和/或特征结合基团杂交的条件。然后可以将细胞、细胞核或细胞珠粒洗涤,随后分隔在第一组分区中。第一组分区的每个分区可以包括例如50微升体积中约50,000个细胞。这些分区各自可以包括1微摩尔的夹板寡核苷酸(探针结合分子)和2微摩尔的条形码分子。条形码分子在第一组分区之间可能不同。在第一组分区内,条形码分子可以与探针缔合的分子杂交。然后,可以将第一组分区的内容物合并、洗涤,并且例如使用光学方法(诸如吸光度、荧光等)、凝胶电泳或经由测序来分析。
图18示出了本文所述的加条形码方案(示例方案1)的示例数据。图18示出了荧光强度作为序列长度(以碱基对计)的函数的两个图。每条线代表加有条形码的细胞的一个样品,其中每个样品都附着有不同的条形码序列(n=8个样品)。左图示出了在外周血单核细胞(PBMC)中进行的加条形码,并且右图示出了在各种细胞系中进行的加条形码。可以鉴定两个峰:230bp序列和270碱基对序列。270碱基对序列对应于第一探针和第二探针的靶RNA分子的第一靶区域和第二靶区域。
图19示出了本文所述的加有条形码的分子的DNA凝胶电泳的示例数据。左图指示67摄氏度的退火温度,而右图指示63摄氏度的退火温度。上图指示一种使用LED验证条形码产物的方法。下图指示另一种使用V2验证条形码产物的方法。
每个凝胶电泳图中的第一个泳道(“泳道0”)是核酸标准品梯。泳道1是没有条形码的PBMC(阴性对照),泳道2是没有条形码的细胞系样品(阴性对照),泳道3是具有合成条形码的PBMC(阳性对照),泳道4是具有合成条形码的细胞系(阳性对照),泳道5是根据示例方案1进行的具有夹板分子的PBMC,泳道6是根据示例方案1进行的具有夹板分子的细胞系,泳道7是根据示例方案2进行的具有夹板分子的PBMC,并且泳道8是根据示例方案2进行的具有夹板的细胞系。可以看出,63度退火温度得到更高的产量(更暗的条带)。
图20示出了本文所述的加条形码方案的附加示例数据。左图示出了荧光强度作为使用示例方案1加条形码的PBMC细胞的序列长度的函数。右图示出了荧光强度作为使用示例方案1加条形码的细胞系的序列长度的函数。总之,结果表明使用示例方案1和示例方案2用双探针加条形码实现了相对完全的加条形码。
实施例3-关于PBMC样品的固定RNA谱分析
可以对PBMC样品进行多聚甲醛固定,然后在4℃下储存7天。可以根据本文所述的方案处理固定的细胞(或细胞核或细胞珠粒)。可以制备测序文库,使用2000基因免疫肿瘤学组合富集测序文库并分析测序文库。图21A-C示出了比较固定细胞和非固定对照样品的示例数据。图21A显示了条形图,并示出了当与第0天非固定对照样品比较时,固定细胞在七天的储存中表现出稳定细胞类型注释。图21B示出了作为检测到的UMI的函数的每个细胞的组合读段的线图。该数据说明了每个细胞的基因和UMI计数的可比较的中位数。图21C示出了第0天和第7天样品之间的单基因UMI计数的对数图。可以看到第0天对照和第7天之间的单基因UMI计数之间很好的相关性。结果表明,固定样品被有效地稳定了7天,这允许在固定后进行进一步的各种操纵,例如,样品收集、储存、运输、与其他样品分批等。
此外,可以根据本文所述的方案处理固定PBMC,并且将所得文库与用3’单细胞基因表达溶液(10x Genomics)处理的新鲜PBMC进行比较。2000基因组合上的UMI检测说明了新鲜工作流程和固定工作流程之间的可比较的灵敏度。此外,两个样品之间的细胞类型注释也类似。在两个样品中均可以检测到主要PBMC细胞类型。
实施例4-多重测定:RNA模板化连接产物和探针缔合的报告寡核苷酸的加条形码
如本文所述,可能有利的是测定细胞、细胞核或细胞珠粒群体中的多种分析物。如本文所述,可以使细胞、细胞核或细胞珠粒与包含或偶联到报告寡核苷酸(包含报告序列)的特征结合基团接触。特征结合基团可以偶联到细胞的一种或多种特征(例如,蛋白质)。该细胞还可以包含用于测定的靶核酸分子(例如,RNA分子)。
在一个实例中,使细胞与两组抗体接触,如图22中示意性描绘的。第一组抗体(“抗体A”)2252包含具有两个靶序列的报告寡核苷酸。第二组抗体(“抗体B”)2253包含具有捕获序列的报告寡核苷酸。然后使细胞(例如,2200)与一对探针接触。该对探针(“探针1”2206和“探针2”2216)被配置为与细胞中核酸分子2201(例如mRNA)的第一靶区域2202和第二靶区域2204杂交,从而产生探针缔合的分子2230。该对探针中的至少一个探针可以包含捕获序列(例如,2210和/或2218)。此外,在一些情况下,探针对2206、2216被配置为与抗体A的两个靶序列杂交。在其他情况下,可以提供不同于探针1和探针2的附加探针对(“探针3”和“探针4”,未示出);附加探针对可以包含抗体A的靶序列的互补序列,并且可以与抗体A的报告寡核苷酸杂交。
随后的加条形码(例如,操作2280)可以在本体中或分区(例如,孔或液滴)中进行。包含第一条形码序列的条形码分子2220可以直接或经由夹板分子杂交到(i)探针缔合的分子2230或其衍生物(例如,其互补序列或扩增产物),(ii)抗体A-探针对复合物,其包含与抗体A2252的报告寡核苷酸杂交的探针对(例如,探针1 2206和探针2 2216或探针3和探针4(未示出)),和/或(iii)抗体B 2253(例如,经由报告寡核苷酸的捕获序列)。条形码分子2220可以任选地偶联到珠粒。在图22中,条形码分子被示出为直接与探针或捕获序列杂交,但是条形码分子杂交可以经由夹板分子介导(例如,如图16A所示)。还可以执行附加的加条形码操作(未示出)。然后对加有条形码的分子或其衍生物进行测序。
图23示出了从如图22所述的这种加条形码操作产生的示例数据。图23示出了从加有条形码的RNA产物(例如,加有条形码的、探针缔合的分子2230)的测序中获得的四种生物标志物(CD4、CD8、CD3和CD14)的基因表达图。斑点的强度指示使用双探针检测的基因表达和使用第一组抗体(“抗体A”)或第二组抗体(“抗体B”)检测的蛋白质表达之间的重叠。总的来说,这些图表明使用任一组抗体(抗体A或抗体B)在检测感兴趣的分析物时具有类似的覆盖范围。因此,任一组或两组抗体可以用于检测蛋白质分析物(例如,CD4、CD8、CD3、CD14)。在一些情况下,可能有利的是使用第一组抗体(“抗体A”),因为用于为报告寡核苷酸加条形码的双探针允许附加多重分析或组合式加条形码,这允许改善细胞、样品或分区来源的索引和确定。另选地或此外,使用一个或多个探针为报告寡核苷酸加条形码可用于将附加功能序列(例如,引物、捕获序列、UMI、条形码序列等)补加到报告寡核苷酸或其衍生物。
在一些情况下,图23所示的数据可以在没有为任何RNA分子加条形码的情况下产生。例如,可能有用的是比较使用两种不同方法为特征结合基团加条形码的功效。在一个实例中,再次参见图22,可以使细胞与(i)包含具有两个靶序列的报告寡核苷酸的第一组抗体(“抗体A”)2252和(ii)包含捕获序列的第二组抗体(“抗体B”)2253接触。然后可以使细胞(例如,2200)与一对探针接触。该对探针(“探针1”2206和“探针2”2216)被配置为与抗体A的报告寡核苷酸的靶区域杂交。该对探针中的至少一个探针可以包含捕获序列(例如,2210和/或2218)。可以进行如上所述的加条形码,产生两种加有条形码的产物:(i)抗体A-探针对,其包含与抗体A2252的报告寡核苷酸杂交的探针对(例如,探针12206和探针22216),和(ii)抗体B2253(例如,经由捕获序列)。然后可以对加有条形码的产物或其衍生物进行测序,并且可以重叠序列读段以产生图23的图。通过比较抗体A和抗体B的加有条形码的产物,可以推断使用任一方法(抗体A对抗体B)的加条形码效率是类似的,并且在检测分析物(例如,蛋白质)时,两种或任一方法是可行的。如上所述,在一些情况下,可能有利的是使用第一组抗体(“抗体A”),因为用于为报告寡核苷酸加条形码的双探针允许附加多重分析或组合式加条形码,这允许改善细胞、样品或分区来源的索引和确定。另选地或此外,使用一个或多个探针为报告寡核苷酸加条形码可用于将附加功能序列(例如,引物、捕获序列、UMI、条形码序列等)补加到报告寡核苷酸或其衍生物。
实施例5-多重测定:RNA模板化连接产物和特征结合基团的报告寡核苷酸的加条形码
如本文所述,可能有利的是测定细胞、细胞核或细胞珠粒群体中的多种分析物。如本文所述,可以使细胞、细胞核或细胞珠粒与包含或偶联到报告寡核苷酸(包含报告序列)的特征结合基团接触。特征结合基团可以偶联到细胞的一种或多种特征(例如,蛋白质)。该细胞还可以包含用于测定的靶核酸分子(例如,RNA分子)。
在一个实例中,参见图22,可以使细胞与一组抗体(“抗体B”)2253接触,其中该组抗体包含捕获序列。在一些情况下,可以对细胞进行处理,例如经受固定和/或透化,这可以在使细胞与抗体接触之前、之后或之前和之后发生。然后使细胞(或固定和/或透化细胞)(例如,2200)与一对探针接触。该对探针(“探针1”2206和“探针2”2216)被配置为与细胞中核酸分子2201(例如mRNA)的第一靶区域2202和第二靶区域2204杂交,从而产生探针缔合的分子2230。探针可以任选地彼此连接(例如,使用延伸反应、连接反应和/或化学连接)。该对探针中的至少一个探针可以包含捕获序列(例如,2210和/或2218)。
随后的加条形码(例如,操作2280)可以在本体中或分区(例如,孔或液滴)中进行。包含第一条形码序列的条形码分子2220可以直接或经由夹板分子杂交到(i)探针缔合的分子2230或其衍生物(例如,其互补序列或扩增产物),和/或(ii)抗体B 2253(例如,经由捕获序列)。条形码分子2220可以任选地偶联到珠粒。然后对加有条形码的分子或其衍生物进行测序。
图24示出了由上述加条形码方案产生的基因表达和蛋白质分析数据的示例数据。每个图示出了从(i)加有条形码的RNA产物(例如,加有条形码的、探针缔合的分子2230)和(ii)加有条形码的抗体B(例如,加有条形码的报告寡核苷酸)的测序中获得的生物标志物(CD14、CD8a、CD19和CD3)的图。斑点的强度指示从加有条形码的产物中检测到的相对表达水平(例如,基因表达或蛋白质表达)。总的来说,这些图表明加有条形码的抗体产物(例如,加有条形码的报告寡核苷酸)在检测特定分析物或生物标志物时具有与加有条形码的RNA产物(例如,加有条形码的、探针缔合的分子)类似的覆盖范围。因此,可以通过测定生物标志物蛋白质(例如,为结合生物标志物蛋白质的特征结合基团的报告寡核苷酸加条形码)来确定生物标志物谱,或者可以通过测定生物标志物基因表达(例如,使用用于基因表达谱分析的双探针为RNA加条形码)来确定生物标志物谱。在一些情况下,基因表达谱和蛋白质谱都可用于表征细胞,例如,以确定基因表达和蛋白质表达之间的相关性。
实施例6-使细胞在分区中过载
可以使细胞(或细胞核或细胞珠粒)与特征结合基团接触,该特征结合基团包含鉴定特征或特征结合基团的报告寡核苷酸和一个或多个探针(例如,用于与靶核酸分子(例如,mRNA)的靶区域杂交)。
如本文别处所述,可以在多个分区中为报告寡核苷酸和/或一个或多个探针(或探针缔合的分子)加条形码。分区可以被过载,使得多个分区中较少的分区未被占据。在一个非限制性实例中,可以将约100,000个细胞的群体装载到约80,000个分区中。
如果分区被过载,可能仍有许多包含单个细胞的分区。可以鉴定或过滤单细胞分区。例如,可以过滤多个分区(例如,使用10x Genomics CellPlex),使得仅分析单占据的分区。可以从单占据的分区中获得蛋白质信息和RNA信息。
对于多重体分区(包含超过一个细胞),可以例如使用具有类似谱图的细胞的基因表达和蛋白质谱图(例如,从单细胞分析获得)推断蛋白质信息(来自报告寡核苷酸)。这种细胞过载的实例可用于减少试剂浪费,同时提供关于单独细胞中基因表达和蛋白质谱的有用的、多重分析的数据。
实施例7-细胞、细胞核和/或细胞珠粒的固定
可以固定细胞、细胞核和/或细胞珠粒。在一些情况下,可以在本文所述的探针分子杂交之前进行固定。下面列出了用于固定包含细胞、细胞核或细胞珠粒的样品的示例方案和试剂列表。
制备缓冲液
试剂与消耗品
示例方案
a.用温培养基解冻多达1000万个细胞。
b.在4℃下以300g离心5分钟。
c.在不扰动细胞团块的情况下去除上清液,并用1mL冷细胞重悬缓冲液重悬细胞团块。
d.转移到1.5mL试管中,并测量浓度和活力。如果细胞悬液有可见的碎片块,用Flowmi过滤并再次计数。
e.在4℃下以300g离心5分钟。
f.在不扰动细胞团块的情况下去除上清液。
g.使用常规口径移液器吸头,向细胞团块中添加1mL固定缓冲液,并轻轻吸打混合物15次。
h.在室温下温育1小时。
i.在固定快结束时,制备淬灭缓冲液的1mL等分试样。在湿冰上冷却。
j.在室温下以850g离心5分钟。
k.去除上清液但不要触碰试管底部,以免吸走团块。
l.将细胞团块重悬于1mL冰冷的淬灭缓冲液中。储存在冰上。
m.储存固定的细胞。
实施例8-双固定单细胞中RNA和蛋白质的多重分析
本文所公开的方法可用于测定单个细胞中的多种分析物。在一些情况下,可以测定多个细胞的两种分析物:(i)使用一对探针(例如,包含与RNA靶区域互补的序列)测定RNA,以及(ii)使用包含报告寡核苷酸的特征结合基团(例如,抗体)测定肽、多肽或蛋白质。例如,通过测定细胞内的基因和蛋白质表达,可以使RNA和蛋白质数据相互关联以更好地理解单个细胞内的转录组和蛋白质组谱。
在一个实例中,可以将多个细胞固定和透化,并与(i)包含第一探针和第二探针的多个探针以及(ii)包含报告寡核苷酸的抗体接触。第一探针和第二探针可以与细胞内RNA分子的第一靶区域和第二靶区域杂交,以产生探针缔合的分子,并且抗体可以与细胞上或细胞内的靶蛋白质结合。随后,可以例如在分区中进行加条形码,以便为探针缔合的分子和报告寡核苷酸加条形码。可以对加有条形码的分子(例如,加有条形码的、探针缔合的分子或其衍生物以及加有条形码的报告寡核苷酸或其衍生物)进行测序并基于条形码序列来归属于单细胞。
可以测试用于制备要在细胞内加条形码的RNA和蛋白质分子的多种参数。在一些情况下,可能有利的是例如在使抗体与靶蛋白质接触(本文也称为“抗体染色”)后,提供附加固定操作,这可有助于在下游处理(例如,加条形码)期间将抗体固定到靶蛋白质。在一些情况下,可以在第一探针和第二探针(也统称为“探针”)杂交之前或之后进行抗体染色。在一些情况下,可以使用不同的固定和透化方法进行细胞的固定或透化。在一些情况下,可能有利的是例如在封闭缓冲液中淬灭抗体。可以通过实验来测试此类示例参数。
例如,可以进行多种细胞固定方案(例如,如图29所示)。可以使用多个实验组:1.阴性对照组:将细胞与报告寡核苷酸缀合的抗体接触,固定并透化,淬灭,然后与第一探针和第二探针接触。2.A组:将细胞固定和透化并任选淬灭(例如,在包含牛血清白蛋白(0.5%)和吐温(0.01%)的封闭缓冲液中),然后与抗体接触,之后与探针接触;3.B组:将细胞固定和透化并任选淬灭(例如,在包含牛血清白蛋白(0.5%)和吐温(0.01%)的封闭缓冲液中),然后与抗体接触,再次固定,再次淬灭,之后与探针接触;4.C组:将细胞固定和透化并任选淬灭(例如,在包含牛血清白蛋白(0.5%)和吐温(0.01%)的封闭缓冲液中),然后与抗体接触,再次固定和透化,淬灭,之后与探针接触;5.D组:将细胞固定和透化并任选淬灭(例如,在包含牛血清白蛋白(0.5%)和吐温(0.01%)的封闭缓冲液中),然后与探针接触,冲洗,之后与抗体接触;6.E组:将细胞固定和透化并任选淬灭(例如,在包含牛血清白蛋白(0.5%)和吐温(0.01%)的封闭缓冲液中),之后与探针接触,冲洗,并与抗体在封闭溶液(例如,0.5%BSA)中接触;7.F组:使用可商购获得的试剂固定和透化细胞,使用/>Permwash洗涤细胞,使细胞与抗体接触,之后与探针接触,8.G组:使用试剂固定和透化细胞,使用/>Permwash洗涤细胞,使细胞与抗体接触,淬灭,再次固定和透化,淬灭,之后与探针接触。然后可以对所有组进行加条形码(例如,为探针或探针缔合的分子或其衍生物以及抗体的报告寡核苷酸或其衍生物加条形码),测序,以及将RNA和报告寡核苷酸(指示细胞中存在靶蛋白质)与单细胞缔合。
在一个实验设置中,使用PBMC细胞。使细胞与针对穿孔素的报告寡核苷酸缀合抗体(dG9)(ab270703)和颗粒酶B(QA18A28)抗体的接触。
图30A示出了从上面列出的实验组得到的示例数据。从左到右,样品指示对以下组“有用”(例如,可以从条形码序列归属回单个细胞)的抗体读段的分数:阴性对照、A组、B组、C组、D组、E组、F组、G组。从图30A中可以看出,在探针杂交之前进行抗体染色(例如,A组、B组和C组)产生更高百分比的可用抗体读段,并且在抗体染色后进行附加固定操作(B组、C组和G组)进一步提高了抗体读段的分数(与没有第二次固定的A组、D组、E组、F组相比)。正如所料,阴性对照组(抗体染色后固定和透化)产生低分数的可用抗体读段。有趣的是,探针杂交后抗体染色且未再次固定的样品(D组和E组)产生低分数的可用抗体,这表明在一些情况下,可能有用的是在探针杂交前进行抗体染色以获得更高的可用读段计数。
图30B示出了来自相同实验的示例数据,其指示抗体染色后的第二次固定操作的结果。这些图指示使用测序和条形码鉴定,按单位细胞密度检测到的对于如下两种蛋白质的抗体密度:穿孔素(左)和颗粒酶(右)。分为三种条件:抗体染色后固定(例如,B组、C组和G组)、阴性对照和没有第二次固定。
对于穿孔素,在所有三种条件中都显示了一个初始峰,这可能归因于背景信号。观察到各组之间无实质性差异。对于颗粒酶,阴性对照(标记为阴性对照,2)具有头两个峰(这可能归因于背景信号)和第三个峰(这可能归因于抗体的非特异性结合)。对于无第二次固定条件(标记为无,3),观察到单峰。对于抗体染色后固定的条件(标记为加抗体后固定,1),观察到两个峰,其可以指示两个细胞群体,这两个细胞群体可以是一个阴性群体(例如,具有背景信号或非特异性染色的单核细胞)和一个阳性群体(例如,对于第二次固定具有较高信号的细胞,例如,自然杀伤细胞和/或细胞毒性T细胞的特异性染色)或者可能是两个阳性群体。进一步的研究可能试图阐明特定群体,例如,通过运行同型对照。
图31示出了从上面列出的实验组得到的示例基因表达数据。从左到右,样品指示以下组中检测到的基因的中位数(例如,通过对探针缔合的分子或其衍生物进行测序):阴性对照、A组、B组、C组、D组、E组、F组、G组。从图31中可以看出,在抗体染色后进行附加固定操作(B组、C组和G组)可以降低该测定法检测到的基因数量(例如,敏感性)。因此,当使用第二次固定操作时,可以观察到抗体敏感性和基因表达敏感性之间的折衷。阴性对照组(抗体染色后固定和透化)使得检测到相对高数量的基因。
图32-37示出了上述一些实验组的基因表达和抗体染色结果的示例数据。图32A-C示出了阴性对照组(在固定和透化之前用抗体染色的细胞)的t-SNE图。图32A示出了不同免疫细胞团的图,其中椭圆形指示自然杀伤细胞和细胞毒性T细胞类型;图32B示出了免疫细胞中GZMB的基因表达谱(例如,通过为靶向GZMB的探针或探针缔合的分子加条形码而产生),并且图32C示出了免疫细胞中的抗体染色谱。GZMB基因表达谱指示GZMB在自然杀伤细胞和细胞毒性T细胞中表达。抗体染色显示在单核细胞和B细胞上的一些非特异性染色以及在自然杀伤细胞上的有限染色。
图33A-C示出了D组(固定和透化、与探针接触、然后用抗体染色的细胞)的t-SNE图。图33A示出了不同免疫细胞团的图,其中椭圆形指示自然杀伤细胞和细胞毒性T细胞类型;图33B示出了免疫细胞中GZMB的基因表达谱(例如,通过为靶向GZMB的探针或探针缔合的分子加条形码而产生),并且图33C示出了免疫细胞中的抗体染色谱。对于D组细胞,GZMB基因表达谱指示GZMB在自然杀伤细胞和细胞毒性T细胞中的表达。抗体染色显示在单核细胞和B细胞上的一些非特异性染色以及在自然杀伤细胞上的一些特异性染色。
图34A-C示出了B组(固定和透化、与抗体接触、再次固定、然后与探针接触的细胞)的t-SNE图。图34A示出了不同免疫细胞团的图,其中椭圆形指示自然杀伤细胞和细胞毒性T细胞类型;图34B示出了免疫细胞中GZMB的基因表达谱(例如,通过为靶向GZMB的探针或探针缔合的分子加条形码而产生),并且图34C示出了免疫细胞中的抗体染色谱。对于B组细胞,GZMB基因表达谱指示GZMB在自然杀伤细胞和细胞毒性T细胞中的表达。与D组细胞相比,抗体染色显示在单核细胞上的一些非特异性染色以及在自然杀伤细胞上更强的特异性染色。
图35A-C示出了E组(固定和透化、与探针接触、然后在封闭溶液中用抗体染色的细胞)的t-SNE图。图35A示出了不同免疫细胞团的图,其中椭圆形指示自然杀伤细胞和细胞毒性T细胞类型;图35B示出了免疫细胞中GZMB的基因表达谱(例如,通过为靶向GZMB的探针或探针缔合的分子加条形码而产生),并且图35C示出了免疫细胞中的抗体染色谱。对于E组细胞,GZMB基因表达谱指示GZMB在自然杀伤细胞和细胞毒性T细胞中的表达。抗体染色显示一些非特异性染色。
图36A-C示出了F组(使用可商购获得的试剂盒固定和透化、用抗体染色、然后与探针接触的细胞)的t-SNE图。图36A示出了不同免疫细胞团的图,其中椭圆形指示自然杀伤细胞和细胞毒性T细胞类型;图36B示出了免疫细胞中GZMB的基因表达谱(例如,通过为靶向GZMB的探针或探针缔合的分子加条形码而产生),并且图36C示出了免疫细胞中的抗体染色谱。对于F组细胞,GZMB基因表达谱指示GZMB在自然杀伤细胞和细胞毒性T细胞中的表达。抗体染色显示一些非特异性染色。
图37A-C示出了G组(使用可商购获得的试剂盒固定和透化、用抗体染色、再次固定、然后与探针接触的细胞)的t-SNE图。图37A示出了不同免疫细胞团的图,其中椭圆形指示自然杀伤细胞和细胞毒性T细胞类型;图37B示出了免疫细胞中GZMB的基因表达谱(例如,通过为靶向GZMB的探针或探针缔合的分子加条形码而产生),并且图37C示出了免疫细胞中的抗体染色谱。对于F组细胞,GZMB基因表达谱指示GZMB在自然杀伤细胞和细胞毒性T细胞中的表达。抗体染色显示在单核细胞和其他细胞中的一些非特异性染色,但在自然杀伤细胞上优先染色。与没有第二次固定相比,在第二次固定时观察到更特异的染色。
总之,这些结果表明,在某些条件下,在自然杀伤细胞和细胞毒性T细胞上发生一些特异性染色。在样品中观察到最大的特异性,其中细胞被固定和透化、染色(与抗体接触)、再次固定、然后与探针接触。由于观察到单核细胞的一些非特异性染色,可以通过排除单核细胞来评估或观察抗体染色的特异性。总的来说,这些结果表明,当探测多种分析物(例如,蛋白质和RNA)时,第二固定过程可能有助于改善蛋白质表达信号。
实施例9-多重测定:RNA模板化连接产物和特征结合基团的报告寡核苷酸的加条形码
本文所述的方法可用于测定细胞、细胞核或细胞珠粒群体中的多种分析物。如本文所述,可以使细胞、细胞核或细胞珠粒与包含或偶联到报告寡核苷酸(包含报告序列)的特征结合基团接触。特征结合基团可以偶联到细胞的一种或多种特征(例如,蛋白质)。该细胞还可以包含用于测定的靶核酸分子(例如,RNA分子)。
图38示出了用于测定细胞特征(例如,蛋白质)和靶核酸分子(例如,RNA分子)的另一个示例性多重工作流程。可以例如在4%甲醛和0.01%吐温-20或可商购获得的固定和透化缓冲液(例如,可商购获得的固定和透化缓冲液)中固定和透化细胞、细胞核或细胞珠粒。在一些情况下,在固定和透化之前或之后,可以使细胞、细胞核或细胞珠粒与一种或多种包含报告寡核苷酸的特征结合基团接触。一种或多种特征结合基团可以特异性结合于细胞特征(例如,特异性蛋白质)(如果存在于细胞、细胞核或细胞珠粒之上或之内的话)。在一些情况下,报告寡核苷酸可以用于鉴定特征结合基团,从而鉴定靶细胞特征(例如,特异性蛋白质)存在与否。例如,可以使多个细胞与多种特征结合基团接触,该多种特征结合基团可以相同或不同,并且可以包含相同或不同的报告寡核苷酸。在一个非限制性实例中,可以使多个细胞中的一个细胞与不同的特征结合基团接触,这些不同的特征结合基团可以结合于不同的细胞特征(例如,不同的表面或细胞内蛋白质)。由于每种特征结合基团包含具有鉴定特征结合基团的条形码序列的报告寡核苷酸,因此可以通过条形码序列的存在来评估(例如,经由测序)此类不同细胞特征(例如,不同表面或细胞内蛋白质)的存在。
作为使细胞、细胞核或细胞珠粒与一种或多种特征结合基团接触的替代或补充,可以使细胞、细胞核或细胞珠粒与第一探针和第二探针接触,以产生探针缔合的分子(例如,探针缔合的RNA分子),如本文所述。例如,可以任选地被固定和透化的细胞、细胞核或细胞珠粒可以包含具有第一靶区域和第二靶区域的靶核酸分子(例如,RNA分子)。第一探针可以包含与第一靶区域至少部分互补的第一探针序列,并且第二探针可以包含与第二靶区域至少部分互补的第二探针序列。第一探针序列与第一靶区域的杂交以及第二探针序列与第二靶区域的杂交可以足以产生探针缔合的分子。
在一些情况下,可以使细胞、细胞核或细胞珠粒与多个不同探针接触。如果存在的话,多个不同探针可以与靶核酸分子的靶区域特异性杂交。在一些情况下,探针序列可以包含可以用于鉴定探针的探针条形码序列。例如,可以使多个细胞与多个探针接触,该多个探针可以相同或不同,并且可以包含相同或不同的序列(例如,条形码序列、探针序列、衔接子序列)。在一个非限制性实例中,可以使多个细胞中的一个细胞与不同的探针接触,该不同的探针可以与靶核酸分子(例如,RNA分子)的不同靶区域杂交。每个探针可以包含鉴定该探针的探针条形码序列,并且可以通过探针条形码序列或探针序列的存在来评估(例如,经由测序)此类不同靶序列的存在。在一些情况下,探针条形码序列可以用于鉴定起始样品或对序列进行解卷积并将该序列鉴定为源自细胞、细胞核或细胞珠粒(例如,如图10所示)。
在细胞、细胞核或细胞珠粒与探针(例如,第一探针和第二探针)接触后,可以洗涤细胞、细胞核或细胞珠粒以去除任何未结合或未杂交的探针。然后可以将细胞、细胞核或细胞珠粒分隔(例如,在液滴或孔中)以用于加条形码,如本文所述。在一个非限制性实例中,可以将细胞、细胞核或细胞珠粒与核酸条形码分子(在图38中示出为偶联到珠粒)一起分隔。核酸条形码分子可以包含条形码序列和与探针之一(例如,第一探针或第二探针)的序列互补的捕获序列。核酸条形码分子可以包含附加序列,例如UMI、引物序列、测序引物序列(例如,P5、P7、R1、R2序列)。核酸条形码分子的捕获序列可以退火到探针之一(例如,第一探针或第二探针)的互补序列,并且任选地,可以进行延伸反应以产生加有条形码的核酸分子,该加有条形码的核酸分子包含条形码序列或其互补序列和至少一个探针的序列或其互补序列。
在一些情况下,如果细胞、细胞核或细胞珠粒包含与其偶联的特征结合基团,则核酸条形码分子捕获序列也可以退火到报告寡核苷酸的序列(图38中未示出)。在一些情况下,可以进行延伸反应以产生附加的加有条形码的核酸分子,该附加的加有条形码的核酸分子包含报告寡核苷酸的序列或其互补序列和条形码序列或其互补序列。
在加条形码之后,可以将加有条形码的核酸分子和附加的加有条形码的核酸分子从分区中取出,并经受足以测序的条件,例如扩增、净化、样品索引PCR等。这种示例工作流程可用于获得关于细胞特征(例如,蛋白质)的多重信息,并将这些特征与核酸信息(例如,靶核酸分子(例如,RNA)的存在或基因型)相关联。
应当理解,本文所述的过程可以以任何有用或方便的顺序来执行。例如,对于细胞、细胞核或细胞珠粒,固定、透化、与特征结合基团接触以及与第一探针和第二探针接触可以以任何有用的顺序发生,并且可以重复任何次数。这些过程(例如,固定、透化、与特征结合基团接触以及与第一探针和第二探针接触)中的任何一个过程都可以在本体中或在分区中进行。
实施例10-用于组织样品中的全转录组分析的RNA模板化连接
本文所述的方法可用于测定组织样品中的核酸分子(例如,mRNA),该组织样品例如为新鲜组织样品、冷冻(例如,快速冷冻)组织样品等。在一些情况下,可以在组织样品中进行全转录组分析。在一个这样的实例中,组织样品可以包含mRNA分子,该mRNA分子可以与多个第一探针和第二探针接触。多个第一探针和第二探针可以包含一组全转录组分析探针,使得可以分析数百、数千或数百万个RNA靶标。例如,多个第一探针和第二探针可以包含数千个不同的第一探针和第二探针,它们可以与mRNA的不同靶序列(例如,编码或非编码)杂交。总之,多个第一探针和第二探针可以具有足够的序列多样性和覆盖范围来分析样品的整个转录组。多个第一探针和第二探针可以包含基因特异性序列,该基因特异性序列可以是物种特异性的(例如,能够区分不同的动物细胞类型,例如人类和小鼠)。
在一些情况下,与使用单探针(例如3’单细胞基因表达解决方案(10xGenomics))相比,使用双探针(例如,使用分别与mRNA分子的第一靶区域和第二靶区域杂交的第一探针和第二探针)方法进行mRNA分析可能有利于提供更高的分析物敏感性、提高加条形码的效率和/或辨别更大数量的条形码、UMI或两者。表1示出了在使用(i)单探针方法(例如,如图12B所示和所述,在表1中标记为单细胞3’(“SC3P”))或(ii)双探针方法(例如,如图16A-16B中的核酸分析所示,在表1中标记为RNA模板化连接(“RTL”))进行全转录组分析的快速冷冻的人类和小鼠组织样品中检测到的UMI数量的比较的示例数据。测试了来自肝、结肠、空肠、回肠、睾丸的五种不同的人类样品以及来自脑的一种小鼠样品。所有样品都是快速冷冻的。表1的数值列的每一列示出了在RTL(双探针全转录组分析)和SC3P(单探针全转录组分析)方法中,在5,000个组合读段/细胞(“PRPC”)或10,000个PRPC时检测到的UMI的数量。从表1中可以看出,RTL工作流程使得在所有不同的快速冷冻组织样品中检测到了更高数量的UMI。
表1.使用单探针或双探针方法在快速冷冻组织样品中进行全转录组分析时检测到的UMI数量的比较。
类似地,表2示出了在使用(i)单探针方法(“SC3P”)或(ii)双探针方法(“RTL”)进行全转录组分析的新鲜小鼠组织样品中检测到的UMI数量的比较的示例数据。测试了来自脑、结肠、肾、肺和肝的五种不同的小鼠样品。所有样品都是新鲜的。表2的数值列的每一列示出了在RTL(双探针全转录组分析)和SC3P(单探针全转录组分析)方法中,在5,000个组合读段/细胞(“PRPC”)或10,000个PRPC时检测到的UMI的数量。从表2中也可以看出,RTL工作流程使得在所有新鲜组织样品中检测到了更高数量的UMI。
表2.使用单探针或双探针方法在新鲜组织样品中进行全转录组分析时检测到的UMI数量的比较。
总之,这些数据表明使用双探针方法分析mRNA提供了一种测定组织样品中全转录组的灵敏方法。
虽然本文已经示出和描述了本发明的优选实施方案,但是对于本领域技术人员显而易见的是,这些实施方案仅作为实例来提供。并非旨在本发明受到说明书内提供的具体实例的限制。虽然已经参考前述说明书描述了本发明,但是本文实施方案的描述和说明并非意在以限制性的意义来解释。在不脱离本发明的情况下,本领域技术人员现在可以想到许多变型、变化和替代。此外,应当理解,本发明的所有方面不限于本文所阐述的具体描绘、构型或相对比例,其取决于多种条件和变量。应当理解,本文所述的本发明的实施方案的各种替代形式可以用于实践本发明。因此,设想了本发明还应涵盖任何这样的替代形式、修改形式、变型形式或等同物。旨在以下权利要求限定本发明的范围并且由此涵盖在这些权利要求及其等同物的范围内的方法和结构。

Claims (78)

1.一种用于多重核酸测定的方法,包括:
a.在足以产生第一探针缔合的分子和第二探针缔合的分子的条件下,使细胞与第一探针、第二探针和第三探针接触,其中所述细胞包含(i)包含第一靶区域和第二靶区域的核酸分子以及(ii)偶联到特征结合基团的特征,
其中所述特征结合基团包含(i)与所述特征缔合的报告寡核苷酸和(ii)特征探针结合序列,
其中所述第一探针包含(i)与所述第一靶区域互补的第一探针序列和(ii)探针捕获序列,
其中所述第二探针包含与所述第二靶区域互补的第二探针序列,
其中所述第三探针包含(i)与所述特征探针结合序列互补的第三探针序列和(ii)所述探针捕获序列,
b.在第一组分区的第一分区中,在足以产生第一加有条形码的核酸分子和第二加有条形码的核酸分子的条件下,使所述第一探针缔合的分子和所述第二探针缔合的分子与探针结合分子和条形码分子接触,
其中所述条形码分子包含(i)为包含所述条形码分子的多个条形码分子所共有的共同序列和(ii)为所述第一组分区的所述第一分区所共有的第一条形码序列,
其中所述探针结合分子包含(i)与所述探针捕获序列互补的探针结合序列和(ii)与所述共同序列互补的条形码结合序列;以及
c.在第二组分区的第二分区中,(i)在足以产生第三加有条形码的核酸分子的条件下,使所述第一加有条形码的核酸分子或其衍生物与多个捕获分子中的第一捕获分子接触,以及(ii)在足以产生第四加有条形码的核酸分子的条件下,使所述第二加有条形码的核酸分子或其衍生物与所述多个捕获分子中的第二捕获分子接触,其中所述多个捕获分子包含第二条形码序列,
其中所述第三加有条形码的核酸分子和所述第四加有条形码的分子中的每一者包含与所述第一条形码序列相对应的序列和与所述第二条形码序列相对应的序列。
2.根据权利要求1所述的方法,其中所述第一靶区域和所述第二靶区域位于所述核酸分子的同一条链上。
3.根据权利要求1或2所述的方法,其中所述探针捕获序列为包括所述第一探针的多个第一探针所共有,其中所述第一组分区的一个或多个附加分区包括一个或多个附加探针缔合的核酸分子,其中所述一个或多个附加探针缔合的核酸分子中的每一者包含所述探针捕获序列。
4.根据权利要求1至3中任一项所述的方法,其中所述第二探针包含与所述多个捕获分子的捕获序列互补的第二探针捕获序列,并且其中(c)包括使所述第二探针捕获序列与所述捕获序列杂交。
5.根据权利要求1至4中任一项所述的方法,其中所述条形码分子包含与所述多个捕获分子的捕获序列互补的捕获结合序列,并且其中(c)包括使所述捕获结合序列与所述捕获序列杂交。
6.根据权利要求1至5中任一项所述的方法,其中所述第一组分区是多个孔。
7.根据权利要求1至6中任一项所述的方法,其中所述第二组分区是多个液滴。
8.根据权利要求1至6中任一项所述的方法,其中所述第二组分区是多个孔。
9.根据权利要求1至8中任一项所述的方法,其中所述多个捕获分子偶联到颗粒。
10.根据权利要求9所述的方法,其中所述颗粒是珠粒。
11.根据权利要求10所述的方法,其中所述珠粒是凝胶珠粒。
12.根据权利要求11所述的方法,其中与所述凝胶珠粒偶联的所述多个捕获分子中的每个捕获分子包含所述第二条形码序列。
13.根据权利要求12所述的方法,其中所述第二组分区的一个或多个附加分区包括多个凝胶珠粒中的一个或多个附加凝胶珠粒,并且其中所述第二条形码序列是所述多个凝胶珠粒中的所述凝胶珠粒特有的。
14.根据权利要求12所述的方法,其中所述多个捕获分子中的一个捕获分子包含所述多个捕获分子中的所述捕获分子特有的第三条形码序列。
15.根据权利要求1至14中任一项所述的方法,其中所述第二组分区的一个或多个附加分区包括一个或多个附加捕获分子,并且其中所述第二条形码序列是所述第二组分区中的所述第二分区特有的。
16.根据权利要求1至15中任一项所述的方法,其中(a)包括使所述第一探针和所述第二探针分别与所述第一靶区域和所述第二靶区域杂交。
17.根据权利要求1至16中任一项所述的方法,还包括使所述第一探针缔合的分子经受足以产生探针连接的核酸分子的条件,所述探针连接的核酸分子包含与所述第二探针连接的所述第一探针。
18.根据权利要求17所述的方法,其中经由所述第一探针和所述第二探针的化学连接或酶促连接来产生所述探针连接的核酸分子。
19.根据权利要求17所述的方法,其中所述化学连接或酶促连接在(b)之后发生。
20.根据权利要求1至19中任一项所述的方法,其中所述第一靶区域和所述第二靶区域相邻。
21.根据权利要求1至19中任一项所述的方法,其中所述第一靶区域和所述第二靶区域不相邻,并且所述方法还包括(i)分别朝向所述第二靶区域或所述第一靶区域延伸分别退火到所述第一靶区域或所述第二靶区域的所述第一探针或所述第二探针,以产生延伸的探针,以及(ii)将所述延伸的探针分别连接到所述第二探针或所述第一探针。
22.根据权利要求1至21中任一项所述的方法,其中(a)包括使所述第一探针和所述第二探针与所述细胞内的所述核酸分子接触。
23.根据权利要求22所述的方法,其中所述第一分区包括多个细胞。
24.根据权利要求1至23中任一项所述的方法,其中所述细胞被透化。
25.根据权利要求1至24中任一项所述的方法,其中所述细胞被固定。
26.根据权利要求1至25中任一项所述的方法,还包括从所述细胞中释放所述第一探针缔合的分子或其衍生物。
27.根据权利要求26所述的方法,其中所述释放包括裂解所述细胞。
28.根据权利要求1至27中任一项所述的方法,其中所述报告寡核苷酸包含所述特征探针结合序列。
29.根据权利要求1至28中任一项所述的方法,还包括在(b)之后和(c)之前,合并所述第一加有条形码的核酸分子、所述第二加有条形码的核酸分子、来自所述第一组分区的附加的第一加有条形码的核酸分子和来自所述第一组分区的附加的第二加有条形码的核酸分子。
30.根据权利要求1至28中任一项所述的方法,还包括在(c)之后和测序之前,合并所述第三加有条形码的核酸分子、所述第四加有条形码的核酸分子、来自所述第二组分区的附加的第三加有条形码的核酸分子和来自所述第二组分区的附加的第四加有条形码的核酸分子。
31.根据权利要求1至30中任一项所述的方法,其中所述探针捕获序列为8至50bp。
32.一种方法,包括:
a.使核酸分子与第一探针接触以产生探针缔合的核酸分子,其中所述核酸分子包含第一靶区域和不与所述第一靶区域相邻的第二靶区域,其中所述第一探针包含与所述第一靶区域互补的第一探针序列;
b.在足以产生延伸的探针分子的条件下延伸所述第一探针,所述延伸的探针分子包含与所述第二靶区域互补的序列;
c.在多个分区中的一个分区中,在足以产生加有条形码的分子的条件下,提供所述延伸的探针分子、第二探针、条形码分子和探针结合分子,
其中所述第二探针包含与所述第二靶区域相对应的第二探针序列,
其中所述第一探针或所述第二探针包含探针捕获序列,
其中所述条形码分子包含(i)条形码捕获序列和(ii)条形码序列,
其中所述探针结合分子包含(i)与所述探针捕获序列互补的探针结合序列和(ii)与所述条形码捕获序列互补的条形码结合序列,
其中所述加有条形码的分子包含与所述第一靶区域相对应的序列、与所述第二靶区域相对应的序列、与所述探针捕获序列相对应的序列和与所述条形码序列相对应的序列。
33.根据权利要求32所述的方法,其中(c)包括连接所述第二探针和所述条形码分子。
34.根据权利要求33所述的方法,其中所述连接包括化学连接或酶促连接。
35.根据权利要求32至34中任一项所述的方法,其中所述颗粒是珠粒。
36.根据权利要求35所述的方法,其中所述珠粒是凝胶珠粒。
37.根据权利要求32至36中任一项所述的方法,其中所述细胞被透化。
38.根据权利要求32至37中任一项所述的方法,其中所述细胞被固定。
39.根据权利要求32至38中任一项所述的方法,其中所述第一探针包含所述探针捕获序列。
40.根据权利要求32至39中任一项所述的方法,还包括在(b)之后,从所述核酸分子中释放所述延伸的探针分子。
41.根据权利要求40所述的方法,其中所述释放包括使用核糖核酸酶释放核糖核酸(RNA)链。
42.根据权利要求40所述的方法,其中所述释放包括热循环。
43.根据权利要求32至42中任一项所述的方法,其中(c)包括(i)使所述第二探针的所述第二探针序列杂交到与所述第二靶区域互补的所述序列以及(ii)延伸所述第二探针。
44.根据权利要求32至43中任一项所述的方法,其中在(c)中,所述条形码分子和所述探针结合分子作为预退火复合物提供,其中所述条形码捕获序列退火到所述预退火复合物中的所述条形码结合序列。
45.根据权利要求32至44中任一项所述的方法,其中所述第一探针包含所述探针捕获序列,其中(c)包括(i)将所述探针结合序列和所述条形码结合序列分别退火到所述探针捕获序列和所述条形码捕获序列,(ii)连接所述条形码分子和所述延伸的探针分子以产生第一加有条形码的分子,以及(iii)将所述第二探针退火到所述第一加有条形码的分子并引发延伸反应以产生所述加有条形码的分子。
46.根据权利要求45所述的方法,其中在所述分区外部执行(ii)和(iii)。
47.根据权利要求32至44中任一项所述的方法,其中所述第二探针包含所述探针捕获序列,其中(c)包括(i)将所述第二探针退火到所述延伸的探针分子并引发延伸反应以产生延伸分子,(ii)将所述探针结合序列和所述条形码结合序列退火到所述探针捕获序列和所述条形码捕获序列,以及(iii)连接所述条形码分子和所述延伸分子。
48.一种分析样品的方法,包括:
a.提供:
(i)与所述样品的至少一部分结合的特征结合基团,其中所述特征结合基团包含报告寡核苷酸,其中所述报告寡核苷酸包含报告条形码序列、第一靶区域和第二靶区域,其中所述第一靶区域和所述第二靶区域设置在所述报告寡核苷酸的同一条链上;
(ii)包含第一探针序列的第一探针,其中所述第一探针的所述第一探针序列与所述报告寡核苷酸的所述第一靶区域互补;以及
(iii)包含第二探针序列的第二探针,其中所述第二探针的所述第二探针序列与所述报告寡核苷酸的所述第二靶区域互补;
b.使所述样品经受足以(i)使所述第一探针的所述第一探针序列与所述报告寡核苷酸的所述第一靶区域杂交并(ii)使所述第二探针的所述第二探针序列与所述报告寡核苷酸的所述第二靶区域杂交的条件,以产生探针缔合的报告寡核苷酸复合物;以及
c.使所述探针缔合的报告寡核苷酸复合物经受足以产生探针连接的核酸分子的条件,所述探针连接的核酸分子包含与所述第二探针连接的所述第一探针。
49.根据权利要求48所述的方法,还包括(d)将条形码分子附着到所述探针连接的核酸分子。
50.根据权利要求48或49所述的方法,其中(d)发生在一个分区中。
51.根据权利要求50所述的方法,其中所述分区是液滴或孔。
52.根据权利要求49所述的方法,其中所述样品包含核酸分子,并且其中(d)还包括将附加条形码分子附着到所述核酸分子或其衍生物。
53.根据权利要求48至52中任一项所述的方法,其中所述特征结合基团是抗体。
54.根据权利要求48至53中任一项所述的方法,其中所述第一探针或所述第二探针包含附加探针序列。
55.根据权利要求54所述的方法,还包括将条形码序列附着到附加探针序列。
56.根据权利要求54所述的方法,还包括(d)提供条形码分子和探针结合分子,所述探针结合分子包含(i)与所述附加探针序列互补的第一序列和(ii)与所述条形码分子的捕获序列互补的第二序列。
57.根据权利要求56所述的方法,还包括提供足以使所述第一序列与所述附加探针序列杂交并使所述第二序列与所述条形码分子的所述捕获序列杂交的条件,从而产生加有条形码的、探针缔合的复合物。
58.根据权利要求57所述的方法,其中(d)发生在多个分区中的一个分区中。
59.根据权利要求58所述的方法,还包括将来自所述分区的所述加有条形码的、探针缔合的复合物与来自所述多个分区中的其他分区的其他加有条形码的、探针缔合的复合物合并,以产生加有条形码的、探针缔合的复合物的合并组。
60.根据权利要求59所述的方法,还包括(i)将所述加有条形码的、探针缔合的复合物的合并组分隔到多个附加分区中,其中所述多个附加分区中的一个附加分区包括所述加有条形码的、探针缔合的复合物和具有附加条形码序列的附加条形码分子,以及(ii)将所述附加条形码分子附着到所述加有条形码的、探针缔合的复合物。
61.根据权利要求60所述的方法,其中所述附加条形码分子偶联到珠粒。
62.根据权利要求61所述的方法,其中所述珠粒是凝胶珠粒。
63.根据权利要求61所述的方法,其中所述附加条形码分子可释放地偶联到所述珠粒。
64.根据权利要求56所述的方法,其中(d)在(c)之前发生。
65.根据权利要求56所述的方法,其中(d)在(c)之后发生。
66.根据权利要求48至65中任一项所述的方法,其中所述样品的所述至少所述部分包含特征。
67.根据权利要求66所述的方法,其中所述特征是蛋白质。
68.根据权利要求67所述的方法,其中所述蛋白质是细胞表面受体或细胞内蛋白质。
69.根据权利要求48至68中任一项所述的方法,其中所述样品包含细胞或细胞珠粒。
70.根据权利要求69所述的方法,其中所述细胞是福尔马林固定、石蜡包埋的细胞。
71.根据权利要求48至69中任一项所述的方法,其中(c)发生在一个分区中。
72.根据权利要求71所述的方法,其中所述分区是多个分区之一。
73.根据权利要求48至72中任一项所述的方法,其中(c)包括酶促连接或化学连接。
74.根据权利要求73所述的方法,其中在没有三磷酸腺苷的情况下执行所述连接。
75.根据权利要求48至74中任一项所述的方法,其中所述第一探针或所述第二探针包含腺苷酸化末端、磷酸化末端、核糖核苷酸、双脱氧核苷酸或翘翼序列。
76.根据权利要求48至75中任一项所述的方法,其中所述第一靶区域和所述第二靶区域由设置在所述第一靶区域和所述第二靶区域之间的间隙区域分开。
77.根据权利要求76所述的方法,其中(c)包括进行延伸反应以填充所述间隙区域,从而产生所述探针连接的核酸分子。
78.根据权利要求76所述的方法,其中(c)包括提供包含与所述间隙区域互补的第三探针序列的第三探针,使所述第三探针序列与所述间隙区域杂交,以及提供足以产生所述探针连接的核酸分子的条件,所述探针连接的核酸分子包含经由所述第三探针来连接到所述第二探针的所述第一探针。
CN202280020480.0A 2021-02-23 2022-02-22 基于探针的核酸和蛋白质分析 Pending CN117015617A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US63/152,709 2021-02-23
US63/196,834 2021-06-04
US63/235,487 2021-08-20
US202163251446P 2021-10-01 2021-10-01
US63/251,446 2021-10-01
PCT/US2022/017377 WO2022182682A1 (en) 2021-02-23 2022-02-22 Probe-based analysis of nucleic acids and proteins

Publications (1)

Publication Number Publication Date
CN117015617A true CN117015617A (zh) 2023-11-07

Family

ID=88564011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280020480.0A Pending CN117015617A (zh) 2021-02-23 2022-02-22 基于探针的核酸和蛋白质分析

Country Status (1)

Country Link
CN (1) CN117015617A (zh)

Similar Documents

Publication Publication Date Title
US11952626B2 (en) Probe-based analysis of nucleic acids and proteins
US20210230584A1 (en) Ligation mediated analysis of nucleic acids
US11155881B2 (en) Systems and methods for quality control in single cell processing
US10752950B2 (en) Methods and systems for processing polynucleotides
US20230167432A1 (en) Methods and systems for analysis and identification of barcode multiplets
US20230167433A1 (en) Methods and systems for increasing cell recovery efficiency
CN112639985A (zh) 用于代谢组分析的系统和方法
CN115916972A (zh) 用于被固定样品的组合物和方法
EP4298239A1 (en) Drug screening methods
CN111051523A (zh) 功能化凝胶珠
JP2018500921A (ja) 核酸配列決定ライブラリーを作製するためのプロセス及びシステム、並びにこれらを使用して作製したライブラリー
WO2023076528A2 (en) Methods for sample preparation
US20220403375A1 (en) Methods for enriching nucleic acid libraries for target molecules that do not produce artefactual antisense reads
US20220162671A1 (en) Methods and systems for barcoding multiple nucleic acid analytes
US11852628B2 (en) Methods and systems for characterizing analytes from individual cells or cell populations
CN117015617A (zh) 基于探针的核酸和蛋白质分析
US20240002914A1 (en) Probe-based analysis of nucleic acids and proteins
US20240209346A1 (en) Nucleic acid processing via circularization
CN117980500A (zh) 经由环化进行核酸处理
CN116981780A (zh) 药物筛选方法
EP4388123A1 (en) Compositions, systems and methods for enzyme optimization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination