接合介导的核酸分析
交叉引用
本申请要求于2018年2月22日提交的美国临时专利申请No.62/633,982和于2019年2月12日提交的美国临时专利申请No.62/804,648的权益,每个所述临时专利申请通过引用整体并入本文中。
背景技术
可以出于各种目的,例如鉴定样品内的部分的类型,对样品进行加工。样品可以是生物样品。可以出于各种目的,例如检测疾病(例如癌症)或鉴定特定物质,对生物样品进行加工。存在各种用于加工样品的方法,例如聚合酶链式反应(PCR)和测序。
可以在各种反应环境内,例如分区内,对生物样品进行加工。分区可以是孔或液滴。液滴或孔可用于以使得能够将生物样品分区并单独加工的方式来加工生物样品。例如,此类液滴可以与其它液滴流体分离,从而使得能够精确控制液滴中的相应环境。
分区和/或分区中的生物样品可以经受各种过程,例如化学过程或物理过程。分区和/或分区中的样品可以经受加热或冷却,或化学反应,例如以得到可以定性或定量加工的物质。
发明内容
本公开提供了用于各种样品加工和分析应用中的方法。本文提供的方法可包括使探针与所关注的核酸分子的靶标区域杂交,将所得复合物条形码化,并执行延伸、变性和扩增过程以提供包含与所关注的核酸分子的靶标区域的序列相同或基本上相同或互补的序列的核酸分子。一种方法可包括使第一探针和第二探针与核酸分子的第一靶标区域和第二靶标区域杂交,连接第一探针和第二探针以提供与探针连接的核酸分子,并将与探针连接的核酸分子条形码化。本文提供的方法的一个或多个过程可在例如液滴或孔的分区内执行。本公开的方法可消除在核糖核酸分子分析期间对逆转录的需要且可用于例如对例如生物颗粒、核酸和蛋白质的分析物的控制分析和加工。
在一方面,本文提供了一种分析包含核酸分子的样品的方法,所述方法包括:(a)提供:(i)包含所述核酸分子的样品,其中所述核酸分子包含第一靶标区域和第二靶标区域,其中所述第一靶标区域与所述第二靶标区域相邻;(ii)第一探针,所述第一探针包含第一探针序列和第二探针序列,其中所述第一探针的所述第一探针序列与所述核酸分子的第一靶标区域互补,并且其中所述第一探针序列包含第一反应部分;以及(iii)第二探针,所述第二探针包含第三探针序列,其中所述第二探针的第三探针序列与所述核酸分子的第二靶标区域互补,并且其中所述第三探针序列包含第二反应部分;(b)使所述样品经受足以实现以下的条件:(i)使所述第一探针的第一探针序列与所述核酸分子的第一靶标区域杂交,以及(ii)使所述第二探针的第三探针序列与所述核酸分子的第二靶标区域杂交,以使得所述第一探针的第一探针序列的第一反应部分与所述第二探针的第三探针序列的第二反应部分相邻;(c)使第一反应部分和第二反应部分经受足以得到与探针连接的核酸分子的条件,所述与探针连接的核酸分子包含连接至第二探针的第一探针;以及d)在分区中利用与探针连接的核酸分子,将与探针连接的核酸分子条形码化以提供条形码化的与探针连接的核酸分子。
在一些实施方案中,分区是孔。在一些实施方案中,分区是液滴。在一些实施方案中,(d)包括:(i)在分区中,提供包含结合序列和条形码序列的核酸条形码分子,其中结合序列与第一探针的第二探针序列互补,以及(ii)在分区中使结合序列与第二探针序列杂交。在一些实施方案中,核酸条形码分子还包含额外的结合序列。在一些情况下,在多个分区中的一个分区中使结合序列与第二探针序列杂交。在一些实施方案中,在(c)之后,与探针连接的核酸分子与核酸条形码分子共分区。在一些实施方案中,在(a)之后,核酸分子与第一探针、第二探针和核酸条形码分子共分区。在一些实施方案中,(b)和(c)是在分区中执行。在一些实施方案中,所述方法还包括使用条形码化的与探针连接的核酸分子使分区经受足以进行扩增反应的条件,从而在分区内产生扩增产物。在一些实施方案中,扩增反应是聚合酶链式反应。在一些实施方案中,所述方法还包括从分区释放扩增产物。在一些实施方案中,所述方法还包括对扩增产物进行测序。
在一些实施方案中,第二探针包含第四探针序列,并且其中(d)还包括在分区中提供核酸结合分子,其中核酸结合分子包含与第二探针的第四探针序列互补的第二结合序列。在一些实施方案中,核酸结合分子还包含第三结合序列。在一些实施方案中,核酸结合分子还包含第二条形码序列。在一些实施方案中,所述方法还包括在分区中使第二结合序列与第二探针的第四探针序列杂交。
在一些实施方案中,将核酸条形码分子附连至珠粒。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,珠粒包含多个附连至珠粒的核酸条形码分子,其中所述多个核酸条形码分子包含核酸条形码分子。在一些实施方案中,珠粒包含至少10,000个附连至珠粒的核酸条形码分子。在一些实施方案中,珠粒包含至少100,000个附连至珠粒的核酸条形码分子。在一些实施方案中,珠粒包含至少1,000,000个附连至珠粒的核酸条形码分子。在一些实施方案中,珠粒包含至少10,000,000个附连至珠粒的核酸条形码分子。在一些实施方案中,所述多个核酸条形码分子以可释放的方式附连至珠粒。在一些实施方案中,所述多个核酸条形码分子在施加刺激后可从珠粒释放。在一些实施方案中,刺激选自由以下组成的组:热刺激、光刺激和化学刺激。在一些实施方案中,刺激是还原剂。在一些实施方案中,刺激是二硫苏糖醇。
在一些实施方案中,刺激的施加引起以下中的一种或多种:(i)所述多个核酸条形码分子的核酸条形码分子与珠粒之间的连接的裂解,以及(ii)珠粒的降解,从而从珠粒释放所述多个核酸条形码分子的核酸条形码分子。在一些实施方案中,(d)包括:(i)在分区中,提供以可释放的方式附连至珠粒的核酸条形码分子,其中核酸条形码分子包含结合序列和条形码序列;(ii)从珠粒释放核酸条形码分子;以及(iii)在分区中使释放的核酸条形码分子的结合序列与第二探针序列杂交。
在一些实施方案中,第一探针还包含条形码序列或独特分子标识符。在一些实施方案中,第二探针还包含条形码序列或独特分子标识符。
在一些实施方案中,第一探针的第一反应部分包含叠氮化物部分。在一些实施方案中,第二探针的第二反应部分包含炔烃部分。在一些实施方案中,在与探针连接的核酸分子中第一探针经由连接子连接至第二探针,其中连接子包含三唑部分。
在一些实施方案中,第一探针的第一反应部分包含硫代磷酸酯部分。在一些实施方案中,第二探针的第二反应部分包含碘化物部分。在一些实施方案中,在与探针连接的核酸分子中第一探针经由连接子连接至第二探针,其中连接子包含硫代磷酸酯键。
在一些实施方案中,第一探针的第一反应部分包含胺部分。在一些实施方案中,第二探针的第二反应部分包含磷酸酯部分。在一些实施方案中,在与探针连接的核酸分子中第一探针经由连接子连接至第二探针,其中连接子包含磷酰胺酯键。
在一些实施方案中,第一探针的第一反应部分包含胺部分。在一些实施方案中,第二探针的第二反应部分包含磷酸酯部分。在一些实施方案中,在与探针连接的核酸分子中第一探针经由连接子连接至第二探针,其中连接子包含氨基磷酸酯键。在一些实施方案中,样品包含细胞,并且其中核酸分子含于细胞内。在一些实施方案中,所述方法还包括在(a)之后,透化细胞,从而接近核酸分子。细胞可为活的或死的(例如固定)。在一些实施方案中,所述方法还包括在(a)之后,溶解细胞,从而从细胞释放核酸分子。在一些实施方案中,细胞是原核细胞。在一些实施方案中,细胞是真核细胞。在一些实施方案中,细胞是淋巴细胞。在一些实施方案中,细胞是B细胞。在一些实施方案中,细胞是T细胞。在一些实施方案中,细胞是人细胞。在一些实施方案中,细胞提供在分区中。
在一些实施方案中,核酸分子是单链核酸分子。在一些实施方案中,核酸分子在核酸分子的末端包含多聚A序列。在一些实施方案中,核酸分子包含非翻译区(UTR)。在一些实施方案中,核酸分子包含5′帽结构。在一些实施方案中,核酸分子是核糖核酸(RNA)分子。在一些实施方案中,核酸分子是信使RNA(mRNA)分子。
在一些实施方案中,核酸分子是脱氧核糖核酸(DNA)分子。
在一些实施方案中,分区还包含一种或多种选自由以下组成的组的试剂:荧光团、寡核苷酸、引物、核酸条形码分子、条形码、缓冲剂、三磷酸脱氧核苷酸、DNA夹板、洗涤剂、还原剂、螯合剂、氧化剂、纳米颗粒、抗体和酶。
在一些实施方案中,分区还包含一种或多种选自由以下组成的组的试剂:温度敏感性酶、pH敏感性酶、光敏感性酶、蛋白酶、连接酶、聚合酶、限制酶、核酸酶、蛋白酶抑制剂和核酸酶抑制剂。
在一些实施方案中,样品包含细胞珠粒,并且其中核酸分子含于细胞珠粒内。
在一些实施方案中,(a)-(c)是在无逆转录下执行。
在一些实施方案中,第一探针和第二探针是相同核酸分子的部分。
在另一方面,本文提供了一种分析包含核酸分子的样品的方法,所述方法包括:(a)提供:(i)包含所述核酸分子的样品,其中所述核酸分子包含第一靶标区域、间隙区域和第二靶标区域,其中所述间隙区域设置在所述第一靶标区域与第二靶标区域之间;(ii)第一探针,所述第一探针包含第一探针序列和第二探针序列,其中所述第一探针的第一探针序列与所述核酸分子的第一靶标区域互补;以及(iii)第二探针,所述第二探针包含第三探针序列,其中所述第二探针的第三探针序列与所述核酸分子的第二靶标区域互补;(b)使所述样品经受足以实现以下的条件:(i)使所述第一探针的第一探针序列与所述核酸分子的第一靶标区域杂交,(ii)使所述第二探针的第三探针序列与所述核酸分子的第二靶标区域杂交,以及(iii)得到与探针连接的核酸分子,所述与探针连接的核酸分子包含连接至第二探针的第一探针;和(c)在分区中利用与探针连接的核酸分子,将与探针连接的核酸分子条形码化以提供条形码化的与探针连接的核酸分子。
在一些实施方案中,分区是孔。在一些实施方案中,分区是液滴。
在一些实施方案中,(b)包括执行核酸反应。在一些实施方案中,(b)包括执行酶促接合反应或延伸反应。在一些实施方案中,(b)包括执行延伸反应与酶促接合反应。在一些实施方案中,核酸反应包括使用选自由以下组成的组的酶:T4 RNL2、SplintR、PBCV1、DNA聚合酶和Mu聚合酶,或它们的衍生物。在一些实施方案中,间隙区域包含至少一个碱基的长度。
在一些实施方案中,(c)包括:(i)在分区中,提供包含结合序列和条形码序列的核酸条形码分子,其中结合序列与第一探针的第二探针序列互补,以及(ii)在分区中使结合序列与第二探针序列杂交。在一些实施方案中,核酸条形码分子还包含额外的结合序列。在一些实施方案中,在多个分区中的一个分区中使结合序列与第二探针序列杂交。
在一些实施方案中,所述方法还包括在(b)之后,将与探针连接的核酸分子和核酸条形码分子共分区。在一些实施方案中,在(a)之后,将核酸分子与第一探针、第二探针和核酸条形码分子共分区。在一些实施方案中,在分区中执行(b)。在一些实施方案中,所述方法还包括使分区经受足以使用条形码化的与探针连接的核酸分子进行扩增反应的条件,从而在分区内产生扩增产物。在一些实施方案中,扩增反应是聚合酶链式反应。在一些实施方案中,所述方法还包括从分区释放扩增产物。在一些实施方案中,所述方法还包括对扩增产物进行测序。在一些实施方案中,第二探针包含第四探针序列,并且其中(d)还包括在分区中,提供核酸结合分子,其中核酸结合分子包含与第二探针的第四探针序列互补的第二结合序列。
在一些实施方案中,核酸结合分子还包含第三结合序列。在一些实施方案中,核酸结合分子还包含第二条形码序列。在一些实施方案中,所述方法还包括在分区中使第二结合序列与第二探针的第四探针序列杂交。在一些实施方案中,将核酸条形码分子附连至珠粒。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,珠粒包含多个附连至珠粒的核酸条形码分子,其中所述多个核酸条形码分子包含核酸条形码分子。在一些实施方案中,珠粒包含至少10,000个附连至珠粒的核酸条形码分子。在一些实施方案中,珠粒包含至少100,000个附连至珠粒的核酸条形码分子。在一些实施方案中,珠粒包含至少1,000,000个附连至珠粒的核酸条形码分子。在一些实施方案中,珠粒包含至少10,000,000个附连至珠粒的核酸条形码分子。在一些实施方案中,所述多个核酸条形码分子以可释放的方式附连至珠粒。在一些实施方案中,所述多个核酸条形码分子在施加刺激后可从珠粒释放。在一些实施方案中,刺激选自由以下组成的组:热刺激、光刺激和化学刺激。在一些实施方案中,刺激是还原剂。在一些实施方案中,刺激是二硫苏糖醇。
在一些实施方案中,刺激的施加引起以下中的一种或多种:(i)所述多个核酸条形码分子的核酸条形码分子与珠粒之间的连接的裂解,以及(ii)珠粒的降解,从而从珠粒释放所述多个核酸条形码分子的核酸条形码分子。
在一些实施方案中,(c)包括:(i)在分区中,提供以可释放的方式附连至珠粒的核酸条形码分子,其中核酸条形码分子包含结合序列和条形码序列;(ii)从珠粒释放核酸条形码分子;以及(iii)在分区中使释放的核酸条形码分子的结合序列与第二探针序列杂交。在一些实施方案中,第一探针还包含条形码序列或独特分子标识符。在一些实施方案中,第二探针还包含条形码序列或独特分子标识符。在一些实施方案中,样品包含细胞,并且其中核酸分子含于细胞内。在一些实施方案中,所述方法还包括在(a)之后,透化细胞,从而接近核酸分子。在一些实施方案中,所述方法还包括在(a)之后,溶解细胞,从而从细胞释放核酸分子。
在一些实施方案中,细胞是原核细胞。在一些实施方案中,细胞是真核细胞。在一些实施方案中,细胞是淋巴细胞。在一些实施方案中,细胞是B细胞。在一些实施方案中,细胞是T细胞。在一些实施方案中,细胞是人细胞。在一些实施方案中,细胞提供在分区中。在一些实施方案中,核酸分子是单链核酸分子。在一些实施方案中,核酸分子在所述核酸分子的末端包含多聚A序列。
在一些实施方案中,核酸分子包含非翻译区(UTR)。在一些实施方案中,核酸分子包含5′帽结构。在一些实施方案中,核酸分子是核糖核酸(RNA)分子。在一些实施方案中,核酸分子是信使RNA(mRNA)分子。在一些实施方案中,核酸分子是脱氧核糖核酸(DNA)分子。
在一些实施方案中,分区还包含一种或多种选自由以下组成的组的试剂:荧光团、寡核苷酸、引物、核酸条形码分子、条形码、缓冲剂、三磷酸脱氧核苷酸、三磷酸脱氧核苷、DNA夹板、洗涤剂、还原剂、螯合剂、氧化剂、纳米颗粒、抗体和酶。
在一些实施方案中,分区还包含一种或多种选自由以下组成的组的试剂:温度敏感性酶、pH敏感性酶、光敏感性酶、蛋白酶、连接酶、聚合酶、限制酶、核酸酶、蛋白酶抑制剂和核酸酶抑制剂。
在一些实施方案中,样品包含细胞珠粒,并且核酸分子含于细胞珠粒内。在一些实施方案中,(b)是在无逆转录下执行。
在一些实施方案中,第一探针或第二探针包含已知序列。
在一些实施方案中,第一探针或第二探针包含简并序列。
在一些实施方案中,第一探针或第二探针包含基于Phi-29的滚环式扩增序列。
在另一方面,本文提供了一种分析包含核酸分子的样品的方法,所述方法包括:(a)提供:(i)包含所述核酸分子的样品,其中所述核酸分子包含靶标区域;(ii)探针,所述探针包含探针序列和衔接子序列,其中探针序列与靶标区域互补;以及(iii)衔接子,所述衔接子包含结合序列,其中结合序列与衔接子序列互补;(b)使所述样品经受足以实现以下的条件:(i)使探针的探针序列与靶标区域杂交,以及(ii)使探针的衔接子序列与衔接子的结合序列杂交,以得到与衔接子结合的探针;和(c)在分区中的与衔接子结合的探针下,将与衔接子结合的探针条形码化以提供条形码化核酸分子。
在一些实施方案中,衔接子序列包含5至10个核苷酸。
在另一方面,本公开提供了一种分析包含核酸分子的样品的方法,所述方法包括:(a)提供:(i)包含所述核酸分子的样品,其中所述核酸分子包含第一靶标区域、间隙区域和第二靶标区域,其中间隙区域设置在第一靶标区域与第二靶标区域之间;(ii)第一探针,所述第一探针包含第一探针序列和第二探针序列,其中所述第一探针的第一探针序列与所述核酸分子的第一靶标区域互补;以及(iii)第二探针,所述第二探针包含第三探针序列,其中所述第二探针的第三探针序列与所述核酸分子的第二靶标区域互补;(b)使所述样品经受足以实现以下的条件:(i)使所述第一探针的第一探针序列与所述核酸分子的第一靶标区域杂交,(ii)使所述第二探针的第三探针序列与所述核酸分子的第二靶标区域杂交,以及(iii)得到与探针连接的核酸分子,所述与探针连接的核酸分子包含连接至第二探针的第一探针;和(d)在分区中的与探针连接的核酸分子下,将与探针连接的核酸分子条形码化以提供条形码化的与探针连接的核酸分子。
在另一方面,本公开提供了一种分析包含核酸分子的样品的方法,所述方法包括:(a)提供:(i)包含所述核酸分子的样品,其中所述核酸分子包含第一靶标区域和第二靶标区域,其中所述第一靶标区域和所述第二靶标区域设置在所述核酸分子的同一条链上;(ii)第一探针,所述第一探针包含第一探针序列和第二探针序列,其中所述第一探针的所述第一探针序列与所述核酸分子的所述第一靶标区域互补;以及(iii)第二探针,所述第二探针包含第三探针序列,其中所述第二探针的所述第三探针序列与所述核酸分子的所述第二靶标区域互补;(b)使所述样品经受足以实现以下的条件:(i)使所述第一探针的所述第一探针序列与所述核酸分子的所述第一靶标区域杂交,以及(ii)使所述第二探针的所述第三探针序列与所述核酸分子的所述第二靶标区域杂交,得到与探针缔合的核酸分子;(c)使所述与探针缔合的核酸分子经受足以得到与探针连接的核酸分子的条件,所述与探针连接的核酸分子包含连接至第二探针的第一探针;和(d)在分区内,将条形码序列附连至所述与探针连接的核酸分子。
在一些实施方案中,所述分区是多个孔中的一个孔。
在一些实施方案中,所述分区是多个液滴中的一个液滴。
在一些实施方案中,(d)包括:(i)在所述分区中提供包含结合序列和条形码序列的核酸条形码分子,其中所述结合序列与所述第一探针的所述第二探针序列互补,以及(ii)使所述分区经受足以使所述结合序列与所述第二探针序列杂交的条件。在一些实施方案中,所述方法还包括使所述分区经受足以进行核酸延伸反应的条件,以产生条形码化核酸分子,所述条形码化核酸分子包含与所述第一探针对应的序列、与所述第二探针对应的序列和与所述条形码序列对应的序列。在一些实施方案中,所述方法还包括使所述分区经受足以将所述与探针连接的核酸分子连接至所述核酸条形码分子的条件,以产生条形码化核酸分子,所述条形码化核酸分子包含与所述第一探针对应的序列、与所述第二探针对应的序列和与所述条形码序列对应的序列。在一些实施方案中,所述方法还包括使所述条形码化核酸分子经受足以进行扩增反应的条件,以产生扩增产物,所述扩增产物包含包括与所述第一探针对应的所述序列、与所述第二探针对应的所述序列和与所述条形码序列对应的所述序列的核酸分子。在一些实施方案中,扩增反应包含使用包含一个或多个功能序列的引物,并且其中所述扩增产物包含还包含所述一个或多个功能序列的核酸分子。在一些实施方案中,所述扩增是等温扩增。在一些实施方案中,扩增反应是在分区内执行。在一些实施方案中,所述方法还包括从所述分区回收所述扩增产物。在一些实施方案中,扩增反应是在所述分区外执行。在一些实施方案中,所述方法还包括对所述扩增产物或其衍生物进行测序。
在一些实施方案中,所述方法还包括(i)提供包含与所述第二探针序列互补的第一序列和第二序列的夹板寡核苷酸,以及(ii)使所述分区经受足以使所述夹板寡核苷酸的所述第一序列与所述第二探针序列杂交的条件。在一些实施方案中,在(c)之前使所述夹板寡核苷酸的所述第一序列与所述第二探针序列杂交。在一些实施方案中,在(c)之后使所述夹板寡核苷酸的所述第一序列与所述第二探针序列杂交。在一些实施方案中,(d)包括:(i)在所述分区中提供包含结合序列和条形码序列的核酸条形码分子,其中所述结合序列与所述夹板寡核苷酸的所述第二序列互补,以及(ii)使所述分区经受足以使所述结合序列与所述夹板寡核苷酸的所述第二序列杂交的条件。在一些实施方案中,所述核酸条形码分子的所述结合序列包含一个或多个核糖碱基。在一些实施方案中,所述方法还包括使(i)与所述第二探针序列杂交的所述夹板寡核苷酸和(ii)所述核酸条形码分子经受足以将所述与探针连接的核酸分子连接至所述核酸条形码分子的条件。在一些实施方案中,所述方法还包括使(i)与所述第二探针序列杂交的所述夹板寡核苷酸和(ii)所述核酸条形码分子经受足以进行核酸延伸反应的条件,以产生条形码化核酸分子,所述条形码化核酸分子包含与所述第一探针对应的序列、与所述第二探针对应的序列和与所述条形码序列对应的序列。在一些实施方案中,所述方法还包括使所述条形码化核酸分子经受足以进行扩增反应的条件,以产生扩增产物,所述扩增产物包含包括与所述第一探针对应的所述序列、与所述第二探针对应的所述序列和与所述条形码序列对应的所述序列的核酸分子。在一些实施方案中,所述扩增反应是聚合酶链式反应。在一些实施方案中,所述扩增反应是在分区内执行。在一些实施方案中,所述方法还包括从所述分区回收所述扩增产物。在一些实施方案中,扩增反应是在所述分区外执行。在一些实施方案中,扩增反应是等温扩增。在一些实施方案中,所述方法还包括对所述扩增产物或其衍生物进行测序。
在一些实施方案中,所述核酸条形码分子还包含独特分子标识符序列、测序引物序列和/或部分测序引物序列。在一些实施方案中,在(c)之后,所述与探针缔合的核酸分子与所述核酸条形码分子共分区。在一些实施方案中,在(a)之后,所述核酸分子与所述第一探针、所述第二探针和所述核酸条形码分子共分区。在一些实施方案中,(c)是在分区内执行。在一些实施方案中,(b)和(c)是在分区内执行。
在一些实施方案中,所述第二探针包含第四探针序列,并且其中所述方法还包括在所述分区中提供核酸结合分子,其中所述核酸结合分子包含与所述第二探针的所述第四探针序列互补的第二结合序列。在一些实施方案中,所述方法还包括在分区内使所述第二结合序列与所述第二探针的所述第四探针序列杂交。
在一些实施方案中,将所述核酸条形码分子偶联至珠粒。在一些实施方案中,所述珠粒是凝胶珠粒。在一些实施方案中,所述核酸条形码分子经由不稳定部分偶联至所述珠粒。在一些实施方案中,所述珠粒包含多个偶联至所述珠粒的核酸条形码分子,其中所述多个核酸条形码分子包含核酸条形码分子。在一些实施方案中,所述珠粒包含至少100,000个偶联至所述珠粒的核酸条形码分子。在一些实施方案中,所述多个核酸条形码分子以可释放的方式偶联至所述珠粒。在一些实施方案中,所述多个核酸条形码分子在施加刺激后可从所述珠粒释放。在一些实施方案中,所述刺激选自由以下组成的组:热刺激、光刺激、生物刺激和化学刺激。在一些实施方案中,所述刺激是还原剂。在一些实施方案中,所述刺激的施加引起以下中的一种或多种:(i)所述多个核酸条形码分子的核酸条形码分子与所述珠粒之间的连接的裂解,以及(ii)所述珠粒的降解,从而从所述珠粒释放所述多个核酸条形码分子的核酸条形码分子。在一些实施方案中,所述珠粒提供于分区中,并且其中在所述分区内从所述珠粒释放所述核酸条形码分子。
在一些实施方案中,(c)是在(d)之前执行。在一些实施方案中,(d)是在(c)之前执行。
在一些实施方案中,所述第一探针或所述第二探针还包含条形码序列或独特分子标识符。
在一些实施方案中,所述第二探针包含第四探针序列,所述第四探针序列与所述核酸分子的第三靶标区域杂交。在一些实施方案中,所述第二靶标区域与所述第三靶标区域不相邻,并且其中所述第二探针的所述第三探针序列和所述第四探针序列被连接子序列隔开。
在一些实施方案中,所述第一探针的所述第一探针序列包含第一反应部分并且所述第二探针的所述第三探针序列包含第二反应部分,其中,在(b)之后,所述第一反应部分与所述第二反应部分相邻。在一些实施方案中,其中(c)包括使所述第一反应部分和所述第二反应部分经受足以将所述第一探针序列连接至所述第三探针序列的条件。在一些实施方案中,所述第一探针的所述第一反应部分或所述第二探针的所述第二反应部分包含叠氮化物部分、炔烃部分、硫代磷酸酯部分、碘化物部分、胺部分或磷酸酯部分。在一些实施方案中,在与探针连接的核酸分子中第一探针经由连接子连接至第二探针,其中所述连接子包含三唑部分、硫代磷酸酯键或磷酰胺酯氨基磷酸酯键。
在一些实施方案中,(c)包括执行酶促接合反应和/或延伸反应。在一些实施方案中,所述酶促接合反应和/或所述延伸反应包括使用选自由以下组成的组的酶:T4 RNL2、SplintR、T4 DNA连接酶、PBCV1、DNA聚合酶和Mu聚合酶,或它们的衍生物。在一些实施方案中,在(a)之前,第一探针经由一个或多个连接序列连接至所述第二探针。在一些实施方案中,一个或多个连接序列包含以下中的一个或多个:间隔子序列、测序引物或其互补序列、捕获序列、限制位点、转座位点和独特分子标识符序列。在一些实施方案中,所述一个或多个连接序列包含热不稳定的、可光裂解的或可酶促裂解的位点。
在一些实施方案中,第一靶标区域与所述第二靶标区域相邻。
在一些实施方案中,第一靶标区域和所述第二靶标区域由设置在第一靶标区域与第二靶标区域之间的间隙区域隔开。在一些实施方案中,间隙区域的长度为至少一个核苷酸。在一些实施方案中,间隙区域的长度为至少10个核苷酸。在一些实施方案中,间隙区域的长度为至少100个核苷酸。
在一些实施方案中,所述方法还包括使用核酸外切酶消化一个或多个核酸分子或其部分。
在一些实施方案中,第一探针或第二探针包含已知序列或简并序列。
在一些实施方案中,第一探针或第二探针包含基于Phi-29的滚环式扩增序列。在一些实施方案中,第一探针或第二探针包含可裂解位点,其中所述可裂解位点可使用热、光、化学或生物刺激裂解。在一些实施方案中,所述方法还包括使第一探针或第二探针与转座酶接触。
在一些实施方案中,所述样品包含细胞,并且其中所述核酸分子含于所述细胞内。在一些实施方案中,所述方法还包括在(a)之后,溶解或透化所述细胞,从而接近所述核酸分子。在一些实施方案中,所述细胞是原核细胞。在一些实施方案中,所述细胞是真核细胞。在一些实施方案中,所述细胞是人细胞。在一些实施方案中,所述细胞是固定的悬浮细胞或福尔马林固定的石蜡包埋的细胞。在一些实施方案中,所述细胞提供在分区内。在一些实施方案中,所述细胞是单细胞。
在一些实施方案中,核酸分子是核糖核酸(RNA)分子。在一些实施方案中,核酸分子是信使RNA(mRNA)分子。在一些实施方案中,核酸分子在所述核酸分子的末端包含多聚-A序列。
在一些实施方案中,所述核酸分子是脱氧核糖核酸(DNA)分子。
在一些实施方案中,分区还包含一种或多种选自由以下组成的组的试剂:荧光团、寡核苷酸、引物、核酸条形码分子、条形码、缓冲剂、三磷酸脱氧核苷酸、DNA夹板、洗涤剂、还原剂、螯合剂、氧化剂、纳米颗粒、抗体、温度敏感性酶、pH敏感性酶、光敏感性酶、蛋白酶、连接酶、聚合酶、逆转录酶、限制酶、核酸酶、蛋白酶抑制剂和核酸酶抑制剂。在一些实施方案中,所述聚合酶是选自以下的组的聚合酶:DNA聚合酶、RNA聚合酶、Hot Start聚合酶和Warmstart聚合酶。在一些实施方案中,样品包含细胞珠粒,并且其中核酸分子含于所述细胞珠粒内。在一些实施方案中,(a)-(c)是在无逆转录下执行。
在另一方面,本公开提供了一种分析包含核酸分子的样品的方法,所述方法包括:(a)提供:(i)包含所述核酸分子的样品,其中所述核酸分子包含靶标区域;(ii)探针,所述探针包含探针序列和结合序列,其中所述探针序列与所述靶标区域互补;以及(iii)衔接子,所述衔接子包含第一序列和第二序列,其中所述衔接子的所述第一序列与所述探针的所述结合序列互补;(b)使所述样品经受足以实现以下的条件:(i)使所述探针的所述探针序列与所述靶标区域杂交,以及(ii)使所述探针的所述结合序列与所述衔接子的所述第一序列杂交,以得到与衔接子结合的探针;以及(c)在分区内,将所述与衔接子结合的探针条形码化以提供条形码化核酸分子。
在另一方面,本公开提供了一种分析包含核酸分子的样品的方法,所述方法包括:(a)提供:(i)包含所述核酸分子的样品,其中所述核酸分子包含靶标区域;(ii)探针,所述探针包含探针序列和第一反应部分,其中所述探针序列与所述靶标区域互补;以及(iii)核酸条形码分子,所述核酸条形码分子包含第二反应部分和条形码序列;(b)使所述样品经受足以实现以下的条件:使探针的探针序列与靶标区域杂交以提供与探针缔合的核酸分子;和(c)在分区内,使与探针缔合的核酸分子的第一反应部分和核酸条形码分子的第二反应部分经受足以将与探针缔合的核酸分子和核酸条形码分子连接的条件以提供条形码化核酸产物。
本领域的技术人员从以下详细描述将显而易见本公开的额外方面和优点,其中仅仅展示和描述本公开的例示性实施方案。正如将认识到的那样,本公开能够具有其它不同的实施方案,并且其若干细节能够在各种明显的方面进行修改,都不脱离本公开。因此,图式和描述本质上应视为说明性而非限制性的。
以引用的方式并入
本说明书中所提及的所有公布、专利和专利申请都以引用的方式并入本文中,其引用程度如同特别且个别地指示每篇个别公布、专利或专利申请以引用的方式并入一般。在以引用的方式并入的公布和专利或专利申请与本说明书中所含的公开内容矛盾的程度上,本说明书意图取代和/或优先于任何这类矛盾材料。
附图说明
本发明的新颖特征在随附申请专利范围中详细地阐述。通过参考阐述其中利用本发明的原理的例示性实施方案的以下详细描述和如下附图(本文中又称为“图”和“图”),将更好地了解本发明的特征和优点:
图1示出用于将单独的生物颗粒分区的微流体通道结构的一个实例。
图2示出用于递送携带条形码的珠粒至液滴的微流体通道结构的一个实例。
图3示出用于将生物颗粒和试剂共分区的微流体通道结构的一个实例。
图4示出用于将珠粒在控制下分区至不连续的液滴中的微流体通道结构的一个实例。
图5示出用于增加液滴生成的通过量的微流体通道结构的一个实例。
图6示出用于增加液滴生成的通过量的微流体通道结构的另一实例。
图7A示出具有用于控制分区的几何元件的微流体通道结构的另一实例的横截面图。图7B示出图7A的通道结构的透视图。
图8说明携带条形码的珠粒的一个实例。
图9示意性说明一种用于分析靶标核酸分子的方法。图9A说明与靶标核酸分子杂交的探针。图9B说明与探针序列杂交的核酸条形码分子并且图9C说明探针的延伸。图9D说明延伸的核酸分子从靶标核酸分子的任选的变性。图9E说明延伸的核酸分子的扩增。
图10示意性说明一种用于分析靶标核酸分子的方法。图10A说明靶标核酸分子、第一探针和第二探针,并且图10B说明杂交有第一探针和第二探针的靶标核酸分子。图10C说明与探针连接的核酸分子,而图10D说明条形码化的与探针连接的核酸分子。
图11说明使用分裂-汇集方法的条形码化方案。图11A说明与探针结合的核酸分子。图11B示出第一条形码序列区段的加入。图11C示出第二条形码序列区段的加入。图11D示出第三条形码序列区段的加入。
图12示意性说明一种分析靶标核酸分子的方法。图12A说明靶标核酸分子、第一探针和第二探针,并且图12B说明杂交有第一探针和第二探针的靶标核酸分子。图12C说明与探针连接的核酸分子,而图12D说明杂交至与探针连接的核酸分子的条形码分子。图12E说明条形码化的与探针连接的核酸分子。
图13A-13B示意性说明一种分析靶标核酸分子的方法,所述方法使用分子倒置探针。图13A示意性说明一种使用这类探针的方法。图13A说明包含与靶标核酸分子杂交的第一探针和第二探针末端的分子倒置探针。图13B说明与环状探针连接的核酸分子。图13C说明环状探针的裂解和线性化以供条形码化。图13B说明使用夹板分子对第一探针和第二探针的环化。
图14示出分析多个核酸分子的样品工作流程,所述工作流程包括将核酸分子与条形码化珠粒共分区在液滴内。
图15示出用于化学介导的核酸接合的各种方法。图15A说明三唑键的形成。图15B说明硫代磷酸酯键的形成。图15C说明酰胺键的形成。图15D说明氨基磷酸酯键的形成。图15E说明缀合反应。
图16示出一种用于分析核酸分子的方法。图16A说明靶标核酸分子、第一探针和第二探针,而图16B说明杂交有第一探针和第二探针的核酸分子和探针之间的间隙的延伸。图16C说明延伸的核酸分子,并且图16D说明与探针连接的核酸分子。
图17说明一种用于分析靶标核酸分子的方法。图17A示出靶标核酸分子和第一探针。图17B说明杂交有第一探针的靶标核酸分子和衔接子核酸分子与探针序列的杂交。图17C说明条形码核酸分子与衔接子核酸分子的杂交,以产生条形码化核酸分子。
图18示意性示出一种分析核酸分子的方法。
图19示意性示出分析核酸分子的另一示例方法。
图20示意性说明一种分析核酸分子的方法。图20A示意性示出核酸分子的条形码化。图20A说明与探针连接的核酸分子,而图20B说明缔合与探针连接的核酸分子的夹板分子。图20C说明核酸条形码分子与缔合与探针连接的核酸分子的衔接子分子缔合,而图20D说明条形码化的与探针连接的核酸分子。
图21示意性说明一种分析核酸分子的方法。图21A说明核酸分子、第一探针、第二探针,并且图21B说明杂交有第一探针和第二探针的核酸分子。图21C说明条形码化核酸分子,而图21D说明未杂交的核酸分子的消化。图21E说明与探针连接的条形码化核酸分子。
图22说明一种用于多路复用的条形码化的方法。图22A说明细胞的固定和细胞的分区。图22B示出分区中细胞的条形码化。图22C示出条形码化细胞的汇集。图22D示出使用衔接子分子和条形码分子将条形码化细胞条形码化。
图23示出一种计算机系统,其被编程或以其它方式配置用于实施本文提供的方法。
具体实施方式
虽然本文已经展示和描述了本发明的多种实施方案,但是本领域的技术人员显而易见这类实施方案仅仅是为了举例而提供。在不偏离本发明的情况下本领域技术人员现将进行各种改变、变化和取代。应了解,可以采用本文所述的本发明的实施方案的多个替换方案。
在值被称作范围的情况下,应了解,这类公开内容包括这类范围内的所有可能的子范围的公开,以及在这类范围内的具体数值,不管是否明确说明具体数值或具体子范围。
如本文所用,术语“条形码”通常是指传达或能够传达关于分析物的信息的标记或标识符。条形码可以是分析物的一部分。条形码可以与分析物无关。条形码可以是除分析物的内源特征(例如分析物的尺寸或末端序列)外附连至分析物(例如核酸分子)的标签或标签的组合。条形码可以是独特的。条形码可以具有多种不同的格式。举例来说,条形码可以包括:多核苷酸条形码;随机的核酸和/或氨基酸序列;和合成的核酸和/或氨基酸序列。条形码可以用可逆的或不可逆的方式附连至分析物。条形码可以例如在样品测序之前、期间和/或之后加入至脱氧核糖核酸(DNA)或核糖核酸(RNA)样品的片段。条形码可以允许鉴定和/或定量个别的测序读段。
术语“条形码核酸分子”和“核酸条形码分子”可以在本文中互换使用。条形码核酸分子可包含条形码。条形码核酸分子还可以包含衔接子,例如独特分子标识符序列。
如本文所用,术语“实时”可指小于约1秒、十分之一秒、百分之一秒、毫秒或更少的响应时间。响应时间可以大于1秒。在一些情况下,实时可指同时或基本上同时加工、检测或鉴定。
如本文所用,术语“受试者”通常是指动物,例如哺乳动物(例如人)或鸟禽(例如鸟),或其它生物体,例如植物。举例来说,受试者可以是脊椎动物、哺乳动物、啮齿动物(例如小鼠)、灵长类动物、猿或人。动物可包括(但不限于)农畜、运动动物和宠物。受试者可以是健康或无症状的个体、患病或怀疑患病(例如癌症)或易患病之个体、和/或需要治疗或怀疑需要治疗的个体。受试者可以是患者。受试者可以是微生物(microorganism或microbe)(例如细菌、真菌、古菌、病毒)。
如本文所用,术语“基因组”通常是指来自受试者的基因组信息,其可以是例如受试者遗传信息的至少一部分或全部。基因组可以呈DNA或RNA编码。基因组可以包含编码区(例如编码蛋白质的区域)以及非编码区。基因组可以包括生物体中在一起的所有染色体的序列。举例来说,人类基因组通常具有总共46条染色体。这些在一起的所有染色体的序列可以组成人类基因组。
术语“适配子(adaptor)”、“衔接子(adapter)”和“标签”可以同义使用。术语“衔接子”、“衔接子分子”和“衔接子核酸序列”在本文中也可以互换使用。衔接子或标签可以与多核苷酸序列偶联以通过包括接合、杂交或其它途径的任何途径“标记”。在一些情况下,衔接子分子可以是任何有用的核酸序列,并且可以包括例如测序引物位点、条型码序列、转座位点、限制位点、独特分子标识符、结合序列和它们的任何/或衍生物、变化或组合。
如本文所用,术语“测序”通常是指用于测定一个或多个多核苷酸中核苷酸碱基的序列的方法和技术。多核苷酸可以是例如核酸分子,例如脱氧核糖核酸(DNA)或核糖核酸(RNA),包括它们的变体或衍生物(例如单链DNA)。测序可以通过现用多种系统进行,例如不限于
Pacific Biosciences
Oxford
或LifeTechnologies(Ion
)的测序系统。可替代地或此外,可以使用核酸扩增、聚合酶链式反应(PCR)(例如数字PCR、定量PCR或实时PCR)或等温扩增。此类系统可以提供与受试者(例如人类)的遗传信息相对应的多个原始遗传数据,如通过系统从受试者提供的样品产生。在一些实例中,此类系统提供测序读段(本文中也称为“读段”)。读段可以包括与已经进行测序的核酸分子序列相对应的一串核酸碱基。在一些情形下,本文提供的系统和方法可以与蛋白质组学信息一起使用。
如本文所用,术语“珠粒”通常是指颗粒。珠粒可以是固体或半固体颗粒。珠粒可以是凝胶珠粒。凝胶珠粒可以包括聚合物基质(例如由聚合或交联形成的基质)。聚合物基质可以包括一种或多种聚合物(例如具有不同官能团或重复单元的聚合物)。聚合物基质中的聚合物可以随机排列,例如在无规共聚物中,和/或具有有序结构,例如在嵌段共聚物中。交联可以经由共价、离子或感应相互作用或物理缠结。珠粒可以是大分子。珠粒可以由结合在一起的核酸分子形成。珠粒可以经由分子(例如大分子)、例如单体或聚合物的共价或非共价装配形成。此类聚合物或单体可以是天然的或合成的。此类聚合物或单体可以是或包括例如核酸分子(例如DNA或RNA)。珠粒可以由聚合材料形成。珠粒可以是磁性或无磁性的。珠粒可以是刚性的。珠粒可以是柔性和/或可压缩的。珠粒可以是可破裂或可溶解的。珠粒可以是用包含一种或多种聚合物的涂层覆盖的固体颗粒(例如基于金属的颗粒,包括但不限于氧化铁、金或银)。此类涂层可以是可破裂或可溶解的。
如本文所用,术语“样品”通常是指受试者的生物样品。生物样品可以包含许多大分子,例如细胞大分子。样品可以是细胞样品。样品可以是细胞系或细胞培养物样品。样品可以包括一种或多种细胞。样品可以包括一种或多种微生物。生物样品可以是核酸样品或蛋白质样品。生物样品也可以是碳水化合物样品或脂质样品。生物样品可以源自于另一样品。样品可以是组织样品,例如生检、芯活检、针吸出或细针吸出。样品可以是流体样品,例如血液样品、尿液样品或唾液样品。样品可以是皮肤样品。样品可以是颊拭子。样品可以是血浆或血清样品。样品可以是无细胞的或无细胞样品。无细胞的样品可以包括胞外多核苷酸。胞外多核苷酸可以从可以选自由以下组成的组的身体样品分离:血液、血浆、血清、尿液、唾液、黏膜排泄物、痰液、粪便和眼泪。
如本文所用,术语“生物颗粒”通常是指源自于生物样品的不连续的生物系统。生物颗粒可以是大分子。生物颗粒可以是小分子。生物颗粒可以是病毒。生物颗粒可以是细胞或细胞的衍生物。生物颗粒可以是细胞器。生物颗粒可以是来自细胞群体的稀少细胞。生物颗粒可以任何类型的细胞,包括不限于原核细胞、真核细胞、细菌、真菌、植物、哺乳动物或其它动物细胞类型、支原体、正常组织细胞、肿瘤细胞或任何其它细胞类型,无论源自于单细胞还是多细胞生物体。生物颗粒可以是细胞的成分。生物颗粒可以是或可以包括DNA、RNA、细胞器、蛋白质或它们的任何组合。生物颗粒可以是或可以包括包含细胞或来自细胞(例如细胞珠粒)的一种或多种成分,例如来自细胞的DNA、RNA、细胞器、蛋白质或它们的任何组合的基质(例如凝胶或聚合物基质)。生物颗粒可以从受试者的组织获得。生物颗粒可以是硬化细胞。此类硬化细胞可能包括或可以不包括细胞壁或细胞膜。生物颗粒可以包括细胞的一种或多种成分,但可以不包括细胞的其它成分。此类成分的一实例是细胞核或细胞器。细胞可以是活细胞。活细胞能够被培养,例如当装入凝胶或聚合物基质中时培养,或当包含凝胶或聚合物基质时培养。
细胞珠粒可以包括单细胞或多个细胞,或单细胞或多个细胞的衍生物。例如在溶解和洗涤细胞后,可以洗掉来自细胞溶解产物的抑制组分并且大分子成分可以结合成细胞珠粒。本文公开的系统和方法适用于含有生物颗粒的细胞珠粒(和/或液滴或其它分区)和含有生物颗粒的大分子成分的细胞珠粒(和/或液滴或其它分区)。在一些情况下,细胞或多个细胞可以是活的,并且细胞可以经受进一步加工,例如细胞标记。
如本文所用,术语“大分子成分”通常是指生物颗粒内所含或来自生物颗粒的大分子。大分子成分可以包含核酸。在一些情况下,生物颗粒可以是大分子。大分子成分可以包含DNA。大分子成分可以包含RNA。RNA可以是编码或非编码的。RNA可以是例如信使RNA(mRNA)、核糖体RNA(rRNA)或转运RNA(tRNA)。RNA可以是转录物。RNA可以是长度小于200个核酸碱基的小RNA,或长度大于200个核酸碱基的大RNA。小RNA可以包括5.8S核糖体RNA(rRNA)、5S rRNA、转运RNA(tRNA)、微型RNA(miRNA)、小干扰RNA(siRNA)、小核仁RNA(snoRNA)、Piwi相互作用RNA(piRNA)、源自tRNA的小RNA(tsRNA)和源自小rDNA的RNA(srRNA)。RNA可以是双链RNA或单链RNA。RNA可以是环形RNA。大分子成分可以包含蛋白质。大分子成分可以包含肽。大分子成分可以包含多肽。
如本文所用,术语“分子标签”通常是指能够结合于大分子成分的分子。分子标签可以在高亲和力下结合于大分子成分。分子标签可以在高特异性下结合于大分子成分。分子标签可以包含核苷酸序列。分子标签可以包含核酸序列。核酸序列可以是分子标签的至少一部分或全部。分子标签可以是核酸分子或可以是核酸分子的一部分。分子标签可以是寡核苷酸或多肽。分子标签可以包含DNA适体。分子标签可以是或包含引物。分子标签可以是或包含蛋白质。分子标签可以包含多肽。分子标签可以是条形码。
如本文所用,术语“分区”通常是指适于含有一种或多种物种或进行一种或多种反应的空间或体积。分区可以是物理隔室,例如液滴或孔(例如微孔)。分区可以将空间或体积与另一空间或体积分隔开。液滴可以是在与第一相不可混合的第二相(例如油)中的第一相(例如水相)。液滴可以是在不与第一相相分开的第二相中的第一相,例如在水相中的胶囊或脂质体。分区可以包含一个或多个其它(内部)分区。在一些情况下,分区可以是虚拟隔室,它可以通过标志(例如标志文库)跨越多个和/或偏远的物理隔室界定和鉴定。举例来说,物理隔室可以包含多个虚拟隔室。
本文提供了可用于多种样品加工和/或分析应用中的方法。本公开的方法可允许在分区内在不执行逆转录下将核酸分子(例如核糖核酸(RNA)分子)条形码化。核酸分子条形码可以是被靶向的核酸分子。此类方法可包括将探针附连至核酸分子,随后将包含条形码序列的核酸条形码分子附连至探针。举例来说,核酸条形码分子可附连至探针的悬垂序列或探针的末端。从探针的末端延伸至核酸条形码分子的末端可形成延伸的核酸分子,所述延伸的核酸分子包含与条形码序列互补的序列和与核酸分子的靶标区域互补的序列。然后延伸的核酸分子可从核酸条形码分子和核酸分子变性并复制。这种方法可避免使用逆转录,逆转录可能高度出错。所述方法的一个或多个过程可在例如液滴或孔的分区内进行。
本公开还提供了一种加工样品的方法,所述方法提供了附连有连接的探针分子的条形码化核酸分子。所述方法可包括一个或多个接合介导的反应。所述方法可包括提供包含核酸分子(例如RNA分子)的样品,所述核酸分子具有相邻第一靶标区域和第二靶标区域;第一探针,所述第一探针具有与第一靶标区域互补的第一探针序列和第二探针序列;以及第二探针,所述第二探针具有与第二靶标区域互补的第三探针序列。第一和第三探针序列还可以分别包含第一反应部分和第二反应部分。在第一探针的第一探针序列与核酸分子的第一靶标区域杂交和第二探针的第三探针序列与核酸分子的第二靶标区域杂交后,反应部分可彼此相邻。随后在足够条件下相邻反应部分之间的反应可连接第一探针和第二探针,得到与探针连接的核酸分子。与探针连接的核酸分子还可以称为与探针连接的核酸分子。然后与探针连接的核酸分子可用核酸条形码分子的条形码序列条形码化,以提供条形码化的与探针连接的核酸分子。可通过使核酸条形码分子的结合序列杂交至与探针连接的核酸分子的第一探针的第二探针序列来实现条形码化。条形码化的与探针连接的核酸分子可进行扩增反应,得到包含第一靶标区域和第二靶标区域和条形码序列或与这些序列互补的序列的扩增产物。因此,所述方法可在不使用逆转录下提供扩增产物。一个或多个过程可在例如液滴或孔的分区内执行。
本文提供了加工样品的进一步方法,所述方法提供了附连有连接的探针分子的条形码化核酸分子。所述方法可包括一个或多个核酸反应。所述方法可包括提供包含核酸分子(例如RNA分子)的样品,所述核酸分子在同一条链上具有第一靶标区域和第二靶标区域(例如相邻或不相邻靶标区域);第一探针,所述第一探针具有与第一靶标区域互补的第一探针序列和第二探针序列;以及第二探针,所述第二探针具有与第二靶标区域互补的第三探针序列。第三探针序列可为已知的或简并的(即随机产生)。第一和第三探针序列还可以分别包含第一反应部分和第二反应部分。在核酸分子具有不相邻的第一靶标区域和第二靶标区域的情况下,核酸分子可包含一个或多个介于第一与第二靶标区域之间的间隙区域。在第一探针的第一探针序列与核酸分子的第一靶标区域杂交和第二探针的第三探针序列与核酸分子的第二靶标区域杂交得到与探针缔合的核酸分子后,反应部分可彼此相邻或不相邻。随后相邻或不相邻探针之间的反应可产生与探针连接的核酸分子。与探针连接的核酸分子还可以在本文中称为与探针接合的核酸分子。然后与探针连接的核酸分子可用核酸条形码分子的条形码序列条形码化,以提供条形码化的与探针连接的核酸分子。可通过使核酸条形码分子的结合序列杂交至与探针连接的核酸分子的第一探针的第二探针序列,实现条形码化。还可以通过使条形码核酸分子的结合序列与核酸衔接子序列杂交,实现条形码化,其中核酸衔接子序列包含可与一个或多个核酸探针杂交的结合序列。条形码化的与探针连接的核酸分子可进行扩增反应,得到扩增产物,所述扩增产物包含第一靶标区域和第二靶标区域和条形码序列或与这些序列互补的序列。因此,所述方法可在不使用逆转录下提供扩增产物。一个或多个过程可在细胞珠粒和/或例如液滴或孔的分区内执行。
核酸分析的方法
在一方面,本公开提供了一种方法,所述方法包括:提供:包含核酸分子(例如核糖核酸(RNA)分子)的样品,所述核酸分子包含靶标区域;和探针,所述探针包含(i)与核酸分子的靶标区域的序列互补的第一探针序列和(ii)第二探针序列;将探针的第一探针序列附连(例如杂交)至核酸分子的靶标区域;提供核酸条形码分子,所述核酸条形码分子包含(i)与第二探针序列互补的第一结合序列、(ii)条形码序列和(iii)第二结合序列;将核酸条形码分子的第一结合序列附连(例如杂交)至探针的第二探针序列;将探针从第二探针序列的末端延伸至核酸条形码分子的第二结合序列的末端以形成延伸的核酸分子,所述延伸的核酸分子包含与条形码序列互补的序列和与核酸分子的靶标区域互补的序列;使延伸的核酸分子从核酸条形码分子和核酸分子的靶标区域变性以使核酸条形码分子和核酸分子再生;以及复制延伸的核酸分子。所述延伸的核酸分子可进一步扩增(例如使用聚合酶链式反应(PCR)或线性扩增。如本文所述)以帮助通过例如测序来检测延伸的核酸分子或它的互补物(例如扩增产物)。
本文所述的方法可利用单细胞分辨率,使用例如化学接合介导的条形码化、扩增和测序帮助进行基因表达概况分析。本文所述的方法可允许基因表达分析,同时避免使用专门成像设备和逆转录,这些可能极易出错并且效率低。举例来说,所述方法可以用于以灵敏和精确的方式分析一群单细胞中的预测的靶标基因小组。在一些情况下,通过本文所述的方法分析的核酸分子可以是融合基因(例如经由易位、中间缺失或染色体倒位产生的杂合基因)。
通过本文所述的方法分析的核酸分子可以是单链或双链核酸分子。双链核酸分子可以完全或部分变性以接近核酸分子的一条链的靶标区域(例如靶标序列)。变性可以通过例如以下来实现:调整包含核酸分子的溶液的温度或pH值;使用化学剂,例如甲酰胺、胍、水杨酸钠、二甲亚砜、丙二醇、脲或碱剂(例如NaOH);或使用机械搅动(例如将包括核酸分子的溶液离心或旋转)。
核酸分子可以是RNA分子。RNA分子可以是例如转运RNA(tRNA)分子、核糖体RNA(rRNA)分子、线粒体RNA(mtRNA)分子、信使RNA(mRNA)分子、非编码RNA分子、合成RNA分子或另一类型RNA分子。举例来说,RNA分子可以是mRNA分子。在一些情况下,核酸分子可以是病毒或病原RNA。在一些情况下,核酸分子可以是预先引入细胞中或细胞上的合成核酸分子。举例来说,核酸分子可包含多个条形码序列,并且两个或更多个条形码序列可以是核酸分子的靶标区域。
核酸分子(例如RNA分子)可包含一个或多个选自由以下组成的组的元件:5′帽结构、非翻译区(UTR)、5′三磷酸部分、5′羟基部分、科扎克序列(Kozak sequence)、夏因-达尔加诺序列(Shine-Dalgarno sequence)、编码序列、密码子、内含子、外显子、开放阅读框、调控序列、增强子序列、沉默子序列、启动子序列和多聚(A)序列(例如多聚(A)尾)。举例来说,所述核酸分子可包含一个或多个选自由以下组成的组的元件:5′帽结构、非翻译区(UTR)、科扎克序列、夏因-达尔加诺序列、编码序列和多聚(A)序列(例如多聚(A)尾)。
核酸分子的元件可具有任何适用的特征。5′帽结构可包含由连接子,例如三磷酸(ppp)连接子连结的一个或多个核苷部分。5′帽结构可包含天然存在的核苷和/或非天然存在的(例如修饰的)核苷。举例来说,5′帽结构可包含鸟嘌呤部分或修饰的(例如烷基化、还原或氧化的)鸟嘌呤部分,例如7-甲基鸟苷酸(m7G)帽。5′帽结构的实例包括但不限于m7GpppG、m7Gpppm7G、m7GpppA、m7GpppC、GpppG、m2,7GpppG、m2,2,7GpppG和抗-反向帽类似物,例如m7,2’OmeGpppG、m7,2’dGpppG、m7,3′OmeGpppG和m7,3′dGpppG。非翻译区(UTR)可以是5′UTR或3′UTR。UTR可包括任何数目的核苷酸。举例来说,UTR可包含至少3个、5个、7个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或更多个核苷酸。在一些情况下,UTR可包含少于20个核苷酸。在其它情况下,UTR可包含至少100个核苷酸,例如超过200个、300个、400个、500个、600个、700个、800个、900个或1000个核苷酸。类似地,编码序列可包括任何数目的核苷酸,例如至少3个、5个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或更多个核苷酸。UTR、编码序列或核酸分子的其它序列可具有任何核苷酸或碱基内含物或排列。举例来说,核酸分子的序列可包含任何数目或浓度的鸟嘌呤、胞嘧啶、尿嘧啶和腺嘌呤碱基。核酸分子还可以包括非天然存在的(例如修饰的)核苷。修饰的核苷可在它的核碱基和/或糖部分中包含一个或多个修饰(例如烷基化、羟基化、氧化或其它修饰)。
核酸分子可包含一个或多个靶标区域。在一些情况下,靶标区域可与基因或其一部分相对应。每个区域可具有相同或不同的序列。举例来说,核酸分子可包含两个具有相同序列的位于沿着核酸分子的链的不同位置的靶标区域。可替代地,核酸分子可包含两个或更多个具有不同序列的靶标区域。不同靶标区域可以被不同探针询问。靶标区域可以位置彼此相邻或可沿着核酸分子的链在空间上分开。如本文中关于两个实体所使用,“相邻”可意指实体彼此紧挨着(例如相连)或彼此接近。举例来说,第一靶标区域可以紧挨着第二靶标区域(例如在第一靶标区域和第二靶标区域之间未设置其它实体)或接近第二靶标区域(例如在第一靶标区域和第二靶标区域之间具有介入序列或分子)。在一些情况下,双链核酸分子可在每条链中包含可以相同或不同的靶标区域。对于包含多个靶标区域的核酸分子来说,可每次针对一个或多个靶标区域执行本文所述的方法。举例来说,可以分析多个靶标区域的单个靶标区域(例如如本文所述)或可以同一时间分析两个或更多个靶标区域。分析两个或更多个靶标区域可涉及提供两个或更多个探针,其中第一探针具有与第一靶标区域互补的序列,第二探针具有与第二靶标区域互补的序列等。每个探针还可包含一个或多个彼此不同的额外序列(例如额外探针序列、独特分子标识符(UMI)或其它序列),以使得每个探针可结合于不同核酸条形码分子。在另一实例中,在两个靶标区域不相邻的情况下,第一靶标区域和第二靶标区域可以由一个或多个设置在第一靶标区域与第二靶标区域之间的间隙区域隔开。
核酸分子的靶标区域可具有一个或多个有用特征。举例来说,靶标区域可具有任何有用的长度、碱基内含物、序列、熔点或其它特征。靶标区域可包含例如至少10个碱基,例如至少20个、25个、30个、35个、40个、45个、50个、60个、65个、70个、75个、80个、85个、90个、95个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个、200个、250个、300个、350个、400个、450个、500个或更多个碱基。靶标区域可具有任何有用的碱基内含物和任何有用的序列和碱基组合。举例来说,靶标区域可包含一个或多个腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶和/或鸟嘌呤碱基(例如天然或典范碱基)。靶标区域还可以包含天然或典范碱基的一种或多种衍生物或修饰型式,例如氧化、烷基化(例如甲基化)、羟基化或以其它方式进行修饰的碱基。类似地,靶标区域可包含核糖或脱氧核糖部分和磷酸酯部分或它们的衍生物或修饰型式。
核酸分子的靶标区域可包含核酸分子的一个或多个序列或元件,或它们的一部分。举例来说,靶标区域可包含以下的全部或一部分:UTR(例如3′UTR或5′UTR)、科扎克序列、夏因-达尔加诺序列、编码序列、多聚序列、帽结构、内含子、外显子或核酸分子的任何其它序列或元件。
样品的核酸分子(例如RNA分子、例如mRNA分子)可以包括在细胞内。举例来说,样品可包括包含核酸分子的细胞。细胞可包含可能与所关注的核酸分子相同或不同的额外核酸分子。在一些情况下,样品可包含多个细胞,并且每个细胞可含有一个或多个核酸分子。细胞可以是例如人细胞、动物细胞或植物细胞。在一些情况下,细胞可以源自组织或流体,如本文所述。细胞可以是原核细胞或真核细胞。细胞可以是淋巴细胞,例如B细胞或T细胞。
可以通过溶解或透化细胞来接近细胞中所包括的核酸分子。溶解细胞可从细胞释放其中所含的核酸分子。细胞可使用溶解剂,例如生物活性剂溶解。可用于溶解细胞的生物活性剂可为例如酶(例如如本文所述)。用于溶解细胞的酶能够或不能执行额外功能,例如降解、延伸、逆转录或以其它方式改变核酸分子。可替代地,离子型或非离子型表面活性剂可以用于溶解细胞,例如TritonX-100、Tween 20、十二烷基肌氨酸钠或十二烷基硫酸钠。细胞溶解还可以使用细胞破碎方法,例如电穿孔或热、声或机械破碎方法来实现。可替代地,细胞可以透化以接近其中所包括的核酸分子。透化可涉及部分或完全溶解或破碎细胞膜或它的一部分。透化可以通过例如使细胞膜与有机溶剂(例如甲醇)或例如Triton X-100或NP-40的洗涤剂接触来实现。
核酸分子或其衍生物(例如与探针连接的核酸分子、杂交有一个或多个探针的核酸分子、条形码化的与探针连接的核酸分子或延伸的核酸分子或它的互补物)或包含核酸分子或其衍生物的细胞(例如细胞珠粒)可分区在例如孔或液滴的分区内,例如如本文所述。一种或多种试剂可与核酸分子或其衍生物或包含核酸分子或其衍生物的细胞共分区。举例来说,核酸分子或其衍生物或包含核酸分子或其衍生物的细胞可与一种或多种选自由以下组成的组的试剂共分区:溶解剂或缓冲剂、透化剂、酶(例如能够消化一个或多个RNA分子、延伸一个或多个核酸分子、逆转录RNA分子、透化或溶解细胞或进行其它行为的酶)、荧光团、寡核苷酸、引物、探针、条形码、核酸条形码分子(例如包含一个或多个条形码序列的核酸条形码分子)、缓冲剂、三磷酸脱氧核苷酸、洗涤剂、还原剂、螯合剂、氧化剂、纳米颗粒、珠粒和抗体。在一些情况下,核酸分子或其衍生物或包含核酸分子或其衍生物的细胞(例如细胞珠粒)可与一种或多种选自由以下组成的组的试剂共分区:温度敏感性酶、pH敏感性酶、光敏感性酶、逆转录酶、蛋白酶、连接酶、聚合酶、限制酶、核酸酶、蛋白酶抑制剂、核酸外切酶和核酸酶抑制剂。举例来说,核酸分子或其衍生物或包含核酸分子或其衍生物的细胞可与聚合酶和核苷酸分子共分区。核酸分子或其衍生物或包含核酸分子或其衍生物的细胞和一种或多种试剂分区可包括使包含水性流体、细胞和一种或多种试剂的第一相和包含与水性流体不互溶的第二相流向汇合。在第一相和第二相相互作用后,可形成包含核酸分子或其衍生物或包含核酸分子或其衍生物的细胞(例如细胞珠粒)和一种或多种试剂的第一相的离散液滴。在一些情况下,分区可包含单个细胞。细胞可在分区(例如液滴)内溶解或透化以接近细胞的核酸分子。
在一些实施方案中,细胞可在细胞珠粒内溶解,并且细胞内内含物的子集可与珠粒缔合。在一些情况下,细胞珠粒可包含硫代丙烯酰胺基(thioacrydite)修饰的核酸分子,所述核酸分子可与来自细胞的核酸杂交。举例来说,多聚T核酸序列可进行硫代丙烯酰胺基修饰并结合于细胞珠粒基质。在细胞溶解后,可使细胞核酸(例如mRNA)与多聚T序列杂交。被保留的细胞内内含物可例如通过加入还原剂,例如DTT、TCEP等来释放。释放可发生在任何适宜的步骤,例如分区之前或之后。
一个或多个过程可在分区内进行。举例来说,可在分区内执行一个或多个选自由以下组成的组的过程:包含核酸分子的样品的一种或多种组分的溶解、透化、变性、杂交、延伸、复制和扩增。在一些情况下,多个过程在分区内进行。核酸分子或包含核酸分子的细胞可在所述方法的任何适用阶段与一种或多种试剂(例如如本文所述)共分区。举例来说,细胞内所含的核酸分子可在探针与核酸分子的靶标区域杂交前与探针和一种或多种额外试剂共分区。类似地,核酸分子或包含核酸分子的细胞可在所述方法的任何适用阶段从分区释放。举例来说,核酸分子或包含核酸分子的细胞可在核酸条形码分子的结合序列与杂交至核酸分子的靶标区域的探针的序列杂交后从分区释放。可替代地,核酸分子或包含核酸分子的细胞和/或包含核酸分子的样品的另一组分可在包含与核酸条形码分子的条形码序列互补的序列和与核酸分子的靶标区域互补的序列的复合的延伸的核酸分子变性后从分区释放。然后延伸的核酸分子的复制和/或扩增可在溶液内进行。在一些情况下,溶液可包含通过在不同分区中进行的相同过程产生的额外的延伸的核酸分子。每个延伸的核酸分子可包含不同条形码序列或与不同条形码序列互补的序列。在这种情况下,溶液可以是汇集的混合物,所述混合物包含两个或更多个分区(例如液滴)的内含物。
探针的探针序列与核酸分子的靶标区域的杂交可在分区内或外执行。在一些情况下,杂交之前可使双链核酸分子变性以提供单链核酸分子,或溶解或透化细胞。在一些情况下,杂交可发生在包含细胞的细胞珠粒中。与靶标区域互补的探针的序列可位于探针末端。可替代地,这个序列可设置在其它序列之间,以便当探针序列与靶标区域杂交时,额外探针序列在多个方向上延伸到杂交的序列之外。与核酸分子的靶标区域杂交的探针序列长度可与靶标区域相同或不同。举例来说,探针序列可比靶标区域短,并只能与靶标区域的一部分杂交。可替代地,探针序列可比靶标区域长,并且能与整个靶标区域杂交并在一个或多个方向上延伸到靶标区域之外。除与核酸分子的靶标区域互补的探针序列以外,探针可包含一个或多个额外探针序列。举例来说,探针可包含与靶标区域互补的探针序列和第二探针序列。第二探针序列可具有任何适用的长度和其它特征。探针可包含一个或多个额外序列,例如一个或多个条形码序列或独特分子标识符(UMI)序列。在一些情况下,探针的一个或多个探针序列可包含可检测的部分,例如荧光团或荧光部分。
探针的探针序列能够与核酸条形码分子的序列杂交。核酸条形码分子可包含与探针的探针序列(例如第二探针序列)互补的第一结合序列、条形码序列和第二结合序列。核酸条形码分子还可以包含一个或多个选自由以下组成的组的额外的功能序列:引物序列、引物退火序列和固定序列。结合序列可具有任何适用的长度和其它特征。在一些情况下,与探针的探针序列互补的结合序列长度可与探针序列相同。可替代地,结合序列长度可与探针序列不同。举例来说,结合序列可比探针序列短,并只能与探针序列的一部分杂交。可替代地,结合序列可比探针序列长,并且能与整个探针序列杂交并在一个或多个方向上延伸到探针序列之外。
核酸条形码分子的条形码序列可具有任何适用的长度和其它特征(例如如本文所述)。核酸条形码分子可附连至珠粒,例如凝胶珠粒(例如如本文所述)。珠粒可与核酸分子或包含核酸分子的细胞共分区。珠粒可包含多个核酸条形码分子,所述核酸条形码分子可相同或不同。珠粒可包含至少10,000个附连至珠粒的核酸条形码分子。举例来说,珠粒可包含至少100,000个、1,000,000个或10,000,000个附连至珠粒的核酸条形码分子。在一些情况下,多个核酸条形码分子的每个核酸条形码分子可包含共同的条形码序列。核酸条形码分子还可包含额外的条形码序列,对于附连至珠粒的每个核酸条形码分子来说,额外的条形码序列可不同。多个核酸条形码分子能以可释放的方式附连至珠粒。在施加刺激后多个核酸条形码分子可从珠粒释放。这类刺激可选自由以下组成的组:热刺激、光刺激和化学刺激。举例来说,刺激可以是还原剂,例如二硫苏糖醇。刺激的施加可引起以下中的一种或多种:(i)多个核酸条形码分子的核酸条形码分子与珠粒之间的连接的裂解,以及(ii)珠粒的降解或溶解,从而从珠粒释放多个核酸条形码分子的核酸条形码分子。在一些情况下,一个或多个核酸条形码分子可在核酸条形码分子的结合序列与杂交至所关注的核酸分子的探针的探针序列杂交前从珠粒释放。一个或多个核酸条形码分子可在包括珠粒和核酸分子(或包含核酸分子的细胞)和探针的分区内从珠粒释放。释放可发生在探针序列与核酸分子的靶标区域杂交之前、之后或期间。
在核酸条形码分子的结合序列与杂交至核酸分子的靶标区域的探针的探针序列杂交后,探针可从探针的末端延伸核酸条形码分子的末端。延伸可包含使用酶(例如聚合酶)将一个或多个核苷酸加入至探针的末端。延伸可提供延伸的核酸分子,所述延伸的核酸分子包含与所关注的核酸分子的靶标区域互补的序列、条形码序列和核酸条形码分子的一个或多个额外序列,例如一个或多个结合序列。然后可施加适当条件和或化学剂(例如如本文所述)以使所述延伸的核酸分子从核酸条形码分子和靶标核酸分子变性。在一些情况下,一个或多个过程可涉及热敏剂的使用。举例来说,在一些情况下,探针可在一组温度条件下退火或杂交,并且延伸可发生在不同组温度条件下。在一些情况下,可使用Warm或HotStart聚合酶。然后核酸条形码分子和靶标核酸分子可进行进一步分析。举例来说,可与第一探针相同并包含与核酸分子的靶标区域互补的探针序列的第二探针可与靶标区域杂交,并且核酸条形码分子可与第二探针的额外探针序列杂交。在一些情况下,核酸条形码分子与探针的杂交可在探针与核酸分子的靶标区域的杂交之前。已经从核酸条形码分子和靶标核酸分子释放的延伸的核酸分子可通过例如一个或多个扩增反应复制或扩增。扩增反应可包含聚合酶链式反应(PCR)并且可能涉及一种或多种引物或聚合酶的使用。延伸、变性和/或扩增过程可发生在分区内。可替代地,物质可在延伸、变性或扩增前从分区释放。举例来说,物质可在延伸与变性过程之间从分区释放。然后变性可发生在包含延伸的核酸分子、核酸条形码分子和靶标核酸分子的溶液内。可替代地,物质可在变性后和扩增前从分区释放。在一些情况下,延伸的核酸分子可在分区内复制或扩增以提供扩增产物。延伸的核酸分子或它的互补物(例如扩增产物)可经由测序(例如如本文所述)来检测。
图9示意性说明一种分析核酸分子的代表性方法。图9A示出核酸分子900(例如mRNA分子),所述核酸分子包含靶标区域902。探针904包含探针序列906和908。探针序列906具有与核酸分子900的靶标区域902互补的序列并与之杂交。可任选地使用例如一个或多个洗涤步骤和/或酶促消化反应未杂交的探针去除。图9B示出核酸条形码分子910,所述核酸条形码分子包含结合序列912、衔接子序列916和条形码序列914(其任选地可包含UMI序列)。结合序列912具有与探针序列908互补的序列并与之杂交。衔接子序列916可包含一个或多个功能序列(例如引物序列/引物结合序列、测序引物序列(例如R1或R2)、部分测序引物序列(例如部分R1或部分R2)、被配置成附连至测序仪的流动池的序列(例如P5或P7,或其部分序列)、条形码序列、UMI序列,或这些序列的互补序列)。图9C示出探针904(和/或条形码分子910)的延伸,产生延伸的核酸分子918,所述延伸的核酸分子包含探针序列906和908;序列920,其与条形码序列914互补;以及序列922,其与衔接子序列916互补。图9D示出延伸的核酸分子918从核酸分子900的变性。在其它实施方案中,图9C的核酸延伸反应产生双链分子(包含链918,例如类似于924)并且不执行图9D中所述的变性步骤。在其它实施方案中,核酸条形码分子910是部分双链分子并在图9C中连接至探针904。图9E示出延伸的核酸分子918(或包含链918的双链产物)的任选的复制或扩增,产生扩增产物924。扩增产物924包含;序列926,其与序列922互补并与核酸条形码分子910的衔接子序列相同或基本上相同916;序列928,其与序列920互补并与核酸条形码分子910的条形码序列914相同或基本上相同;序列930,其与探针序列908互补并与核酸条形码分子910的结合序列912相同或基本上相同;以及序列932,其与探针序列906互补并与核酸分子900的靶标区域902相同或基本上相同。可例如经由核酸测序(例如如本文所述)检测条形码化的产物或它的衍生物。
在一些实施方案中,核酸分子900存在于细胞中。例如,在一些实施方案中,将包含核酸分子900的细胞(其任选地被固定)透化并且加入探针904并允许探针进入细胞并与如上所述的区域902杂交。然后将未结合的探针904洗掉(和/或酶促消化)并使细胞溶解以释放探针904(在一些情况下,其仍可与核酸分子900杂交)以如上所述条形码化。可替代地,允许核酸条形码分子910进入透化细胞以如上所述条形码化。
在一些实施方案中,如本文中其它地方所述,将核酸条形码分子910附连至珠粒。举例来说,核酸条形码分子910可以可释放的方式附连至珠粒(例如经由如本文所述的不稳定键)。在一些情况下,珠粒可以是如本文所述的凝胶珠粒,例如可降解的凝胶珠粒。在一些实施方案中,将包含核酸分子900的透化细胞与探针904一起孵育并且然后将细胞与核酸条形码分子910(例如附连至珠粒,例如单个珠粒)一起分区至分区(例如液滴或孔)以条形码化。在其它情况下,包含核酸分子900、探针904和核酸条形码分子910(例如附连至珠粒,例如单个珠粒)的细胞被分区至分区(例如液滴或孔)以结合探针和条形码化。
在一些情况下,本文所述的方法包括使多个透化细胞(或透化的核或细胞珠粒)与靶向一个或多个核酸分子(例如mRNA分子)内的一个或多个区域的一个或多个探针(例如904)接触。在探针结合和去除过量探针后,然后可将包含核酸条形码分子(例如以可释放的方式附连的条形码分子)的多个细胞和多个珠粒(例如凝胶珠粒)分区至多个分区(例如多个液滴或多个孔,例如在微孔测定中),以使得多个分区的至少一些分区包含单个细胞和单个珠粒。然后可如图9中所概述将探针(例如904)条形码化。然后条形码化核酸分子可通过任何合适的技术,包括核酸测序(例如Illumina测序)来分析。
本发明所公开的方法可施加至单个核酸分子或多个核酸分子(例如多个mRNA分子)。一种分析包含核酸分子的样品的方法可包括提供多个核酸分子(例如RNA分子,例如包含多个mRNA分子的细胞),其中每个核酸分子包含靶标区域;和多个探针。在一些情况下,多个核酸分子的核酸分子的靶标区域可包含相同序列。多个探针每一个可包含与多个核酸分子的核酸分子(例如mRNA分子)的靶标区域的序列互补的第一探针序列,以及第二探针序列。一个或多个探针可包含相同第一探针序列。多个探针的第一探针的探针序列可与多个核酸分子的核酸分子的靶标区域杂交。多个核酸条形码分子的核酸条形码分子的结合序列可与多个探针的探针的第二探针序列杂交,所述探针与多个核酸分子的核酸分子的靶标区域杂交。多个核酸条形码分子的每个核酸条形码分子可包含条形码序列和第二结合序列。多个核酸条形码分子的每个核酸条形码分子的条形码序列可相同或不同。在多个核酸条形码分子的核酸条形码分子的结合序列与杂交至多个核酸分子的核酸分子的靶标区域的多个探针的探针的探针序列杂交后,然后多个杂交的探针的每个探针可从探针的末端延伸至所杂交的核酸条形码分子的末端(例如核酸条形码分子的第二结合序列的末端)。从而可建立多个延伸的核酸分子,其中多个延伸的核酸分子的每个延伸的核酸分子包含与多个核酸分子的核酸分子的靶标区域互补的序列和与多个核酸条形码分子的核酸条形码分子的条形码序列互补的序列。
在一些情形下,一个或多个上述过程可在分区内执行。举例来说,多个核酸分子的每个核酸分子可以提供在不同分区内。这可以通过将包含多个核酸分子的多个细胞分区在多个单独分区内来实现,其中每个细胞包含靶标核酸分子并且多个单独分区的多个不同分区的每个分区包含单个细胞。接近分区中的细胞内所含的靶标核酸分子可以通过溶解或透化细胞(例如如本文所述)来提供。多个单独分区的多个不同分区的每个分区内所提供的核酸条形码分子可以附连至珠粒来提供。举例来说,多个单独分区的多个不同分区的每个分区可包含包括多个附连至珠粒的核酸条形码分子(例如如本文所述)的珠粒。附连至每个珠粒的多个核酸条形码分子可包含不同条形码序列,以使得多个单独分区的多个不同分区的每个分区包含不同条形码序列。在组分从多个单独分区的多个不同分区释放后(例如在个探针延伸后),每个延伸的核酸分子可包含与不同条形码序列互补的序列,以便每个延伸的核酸分子能够追溯至给定分区,和在一些情况下追溯至给定细胞。
化学接合方法
在另一方面,本公开提供了一种方法,所述方法包括提供包含核酸分子(例如核糖核酸(RNA)分子)的样品,所述核酸分子具有第一靶标区域和第二靶标区域。所述第一靶标区域可以与第二靶标区域相邻,第一探针和第二探针。第一探针可包含第一探针序列和第二探针序列,其中第一探针的第一探针序列与核酸分子的第一靶标区域互补。第二探针可包含与核酸分子的第二靶标区域互补的第三探针序列。第一探针序列还可以包含第一反应部分,并且第三探针序列可包含第二反应部分。样品可以经受足以实现以下的条件:(i)使第一探针的第一探针序列与核酸分子的第一靶标区域杂交和(ii)使第二探针的第三探针序列与核酸分子的第二靶标区域杂交,以便第一探针序列的第一反应部分与第三探针序列的第二反应部分相邻。然后反应部分可经受足以使其反应的条件,得到包含连接至第二探针的第一探针的与探针连接的核酸分子。然后可将与探针连接的核酸分子条形码化(例如在分区内)以提供条形码化的与探针连接的核酸分子。条形码化可包括使核酸条形码分子的结合序列与第一探针的第二探针序列杂交。随后条形码化的与探针连接的核酸分子的第一探针可从第一探针的末端延伸至其所杂交的核酸条形码分子的末端,以提供延伸的核酸分子。延伸的核酸条形码分子可包含第一探针、第二探针、与核酸条形码分子的条形码序列互补的序列和与核酸条形码分子的另一序列(例如另一结合序列)互补的序列。延伸的核酸分子可以从核酸条形码分子和所关注的核酸分子变性,然后复制或扩增(例如使用聚合酶链式反应(PCR)或线性扩增)以帮助通过例如测序检测延伸的核酸分子或它的互补物(例如扩增产物)。本文所述的一种或多种方法可允许较高灵敏度的基因组、转录组或外显子组概况分析。本文所述的一种或多种方法可允许非多聚腺苷酸化靶标(例如非多聚-A RNA)、剪接位点、单核苷酸多态性(SNP)、固定细胞等的概况分析。本文所述的一种或多种方法可以适用于多路分析,例如使用特征条形码化,如本文中其它地方所述。
本文所述的方法可有助于使用例如化学接合介导的条形码化、扩增和测序在单细胞分辨率下进行基因表达概况分析。本文所述的方法可允许进行基因表达分析,同时避免使用可能极易出错且效率低的酶促接合、专门成像设备和逆转录。举例来说,所述方法可以用于以灵敏和精确的方式分析单细胞群体中预先确定的一组靶标基因。在一些情况下,通过本文所述的方法分析的核酸分子可以是融合基因(例如经由易位、中间缺失或染色体倒位产生的杂合基因)。
通过本文所述的方法分析的核酸分子可以是单链或双链核酸分子(例如如本文所述)。核酸分子可以是RNA分子,例如mRNA分子。在一些情况下,核酸分子可以是病毒或病原RNA。在一些情况下,核酸分子可以是预先引入细胞中或细胞上的合成核酸分子。举例来说,核酸分子可包含多个条形码序列,并且两个或更多个条形码序列可以是核酸分子的靶标区域。
核酸分子(例如mRNA分子)可包含一个或多个选自由以下组成的组的元件:5′帽结构、非翻译区(UTR)、5′三磷酸部分、5′羟基部分、科扎克序列、夏因-达尔加诺序列、编码序列、密码子、内含子、外显子、开放阅读框、调控序列、增强子序列、沉默子序列、启动子序列和多聚(A)序列(例如多聚(A)尾)。核酸分子的元件可具有任何适用的特征。前述部分中提供了核酸分子的额外细节。
核酸分子可包含两个或更多个靶标区域。在一些情况下,靶标区域可与基因或其一部分相对应。每个区域可具有相同或不同序列。举例来说,核酸分子可在沿着核酸分子的链的相邻位置包含两个具有相同序列的靶标区域。可替代地,所述核酸分子可在沿着核酸分子的链的相邻位置包含两个或更多个具有不同序列的靶标区域。如本文中关于两个实体所使用,“相邻”可意指实体紧挨着彼此(例如相连)或接近彼此。举例来说,第一靶标区域可以紧挨着第二靶标区域(例如在第一靶标区域和第二靶标区域之间未设置其它实体)或接近第二靶标区域(例如在第一靶标区域和第二靶标区域之间具有介入序列分子)。在一些情况下,核酸分子可包含设置在沿着核酸分子的相同或不同链的不同位置的额外靶标区域。举例来说,双链核酸分子可在每个可相同或不同的链中包含一个或多个靶标区域。不同靶标区域可以被不同探针询问。举例来说,第一靶标区域可以被具有与第一靶标区域互补的第一探针序列的第一探针询问,并且第二靶标区域可以被具有与第二靶标区域互补的第二探针序列的第二探针询问。一个或两个探针还可包含一个或多个额外序列(例如额外探针序列、独特分子标识符(UMI)或其它序列)。举例来说,第一探针还可包含第二探针序列。第一探针的第二探针序列可与核酸条形码分子的结合序列进行杂交。第二探针还可以包含额外探针序列。这个序列可以不同于第一探针的第二条形码序列,以使得第一探针和第二探针可与不同核酸条形码分子杂交。
核酸分子的靶标区域可具有任何适用的特征(例如如前述部分中所述)。
样品的核酸分子(例如RNA分子,例如mRNA分子)可以包括在细胞(例如如前述部分中所述)内。举例来说,样品可包括包含核酸分子的细胞,所述细胞可为例如人细胞、动物细胞或植物细胞。接近细胞中所包括的核酸分子可以通过溶解或透化细胞(例如如前述部分中所述)来提供。
探针的探针序列与核酸分子的靶标区域的杂交可在细胞、分区和/或容器的内部或外部执行。在一些情况下,细胞可溶解在细胞珠粒内并且一小部分细胞内内含物(例如mRNA)可以保留在细胞珠粒中,如本文中其它地方所述。在这些情形下,探针的探针序列与核酸的靶标区域的杂交可发生在分区前。在一些情况下,在杂交之前可使双链核酸分子变性以提供单链核酸分子,或溶解或透化细胞。与靶标区域互补的探针的序列可位于探针末端。可替代地,这个序列可设置在其它序列之间,以便当探针序列与靶标区域杂交时,额外探针序列在多个方向上延伸到杂交的序列之外。与核酸分子的靶标区域杂交的探针序列可以具有与靶标区域相同或不同的长度。举例来说,探针序列可以比靶标区域短,并只能与靶标区域的一部分杂交。可替代地,探针序列可以比靶标区域长,并且能与整个靶标区域杂交并在一个或多个方向上延伸到靶标区域之外。除与核酸分子的靶标区域互补的探针序列以外,探针可包含一个或多个额外探针序列。举例来说,探针可包含与靶标区域互补的探针序列和第二探针序列。第二探针序列可具有任何适用的长度和其它特征。在一个实例中,第一探针包含能够与所关注的核酸分子的第一靶标区域杂交的第一探针序列和第二探针序列,并且第二探针包含能够与所关注的核酸分子的第二靶标区域杂交的第三探针序列。在一些情况下,第二探针还可包含第四结合序列。第一探针和第二探针都可以包含一个或多个额外序列,例如一个或多个条形码序列或独特分子标识符(UMI)序列。在一些情况下,一个或多个探针的探针序列可包含可检测的部分,例如荧光团或荧光部分。
探针可包含反应部分。举例来说,能够与核酸分子的第一靶标区域杂交的第一探针的探针序列可包含第一反应部分,并且能够与第二核酸分子的靶标区域杂交的第二探针的探针序列可包含第二反应部分。当第一探针和第二探针与核酸分子的第一靶标区域和第二靶标区域杂交时,第一反应部分和第二反应部分可以彼此相邻。探针的反应部分可选自由以下组成的非限制性组:叠氮化物、炔、硝酮(例如1,3-硝酮)、张力烯烃(例如反式-环烯,例如环辛烯或氧杂降冰片二烯)、四嗪、四唑、碘化物、硫代酸酯(例如硫代磷酸酯)、酸、胺和磷酸酯。举例来说,第一探针的第一反应部分可包含叠氮化物部分,并且第二探针的第二反应部分可包含炔烃部分。第一反应部分和第二反应部分可反应形成连接部分。第一反应部分和第二反应部分之间的反应可为例如环加成反应,例如张力促进的叠氮化物-炔环加成、铜催化的叠氮化物-炔环加成、张力促进的炔-硝酮环加成、狄尔斯-阿尔德反应(Diels-Alder reaction)、[3+2]环加成、[4+2]环加成或[4+1]环加成;硫醇-烯反应;亲核取代反应;或另一反应。在一些情况下,第一反应部分和第二反应部分之间的反应可得到三唑部分或异噁唑啉部分。第一反应部分和第二反应部分之间的反应可包括使反应部分经受合适的条件,例如合适的温度、pH或压力,并为反应提供一种或多种试剂或催化剂。举例来说,第一反应部分和第二反应部分之间的反应可以由铜催化剂、钌催化剂或张力物质,例如二氟辛炔、二苯甲基环辛炔或联芳基氮杂环辛炔酮来催化。与第一核酸分子的靶标区域杂交的第一探针的第一探针序列的第一反应部分和与第二核酸分子的靶标区域杂交的第二探针的第三探针序列的第二反应部分之间的反应可连接第一探针和第二探针,以提供与探针连接的核酸分子。在连接后,第一探针和第二探针可以被视为是接合的。因此,第一反应部分和第二反应部分的反应可包含化学接合反应,例如铜催化的5′叠氮化物至3′炔“点击”化学反应以形成两个探针之间的三唑连接。在其它非限制性实例中,碘化物部分可以化学接合至硫代磷酸酯部分以形成硫代磷酸酯键,酸可以接合至胺以形成酰胺键,和/或磷酸酯和胺可以接合以形成氨基磷酸酯键。
图15说明代表性反应的实例。图15A示出炔烃部分1502和叠氮化物部分1504的化学接合反应,它们在铜介导的环加成下反应,形成三唑键1506。图15B示出硫代磷酸酯基1508与碘基1510的化学接合反应,形成硫代磷酸酯键1512。图15C示出酸1514和胺1516的化学接合反应,形成酰胺键1518。图15D示出磷酸酯部分1520和胺部分1522的化学接合反应,形成氨基磷酸酯键1524。图15E示出两种物质1526和1528的偶联反应。
在一些情况下,第一探针和第二探针与核酸分子的第一靶标区域和第二靶标区域杂交,并且第一反应部分和第二反应部分可以彼此相邻。在一些情况下,探针不包含反应部分并且可进行核酸反应,提供与探针连接的核酸分子。举例来说,使用连接酶(例如SplintR连接酶和/或T4或T4连接酶),探针可以进行酶促接合反应。在酶促接合反应后,第一探针和第二探针可以被视为是接合的。在一个实施方案中,第一探针和第二探针均存在于线性核酸分子中。在另一实施方案中,线性核酸分子是分子倒置探针。
在其它情况下,第一探针和第二探针与核酸分子的第一靶标区域和第二靶标区域杂交,并且第一反应部分和第二反应部分可彼此不相邻。(例如在第一探针和第二探针之间包含间隙区域)。第一探针和第二探针可位于(即,杂交至)核酸分子(例如mRNA)上,相隔一个或多个核苷酸。举例来说,第一探针和第二探针可相距至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个或更多个核苷酸。在一些实施方案中,不相邻的第一探针和第二探针可以接合形成与探针连接的核酸分子。使用连接酶,例如SplintR连接酶、T4连接酶、PBCV1酶,探针可以进行酶促接合反应。首先可以在接合前,使用例如Mu聚合酶、DNA聚合酶、RNA聚合酶、逆转录酶、VENT聚合酶、Taq聚合酶和/或其任何组合、衍生物和变体(例如工程化突变体),填充探针之间的间隙。在一些实施方案中,将核糖核苷酸接合在第一探针和第二探针之间。在一些实施方案中,将脱氧核糖核苷酸接合在第一探针和第二探针之间。在一个实施方案中,第一探针和第二探针均存在于线性核酸分子中。在另一实施方案中,在与靶标区域杂交后线性核酸分子可形成环化的核酸分子。然后环化的核酸分子可经受足以接合其末端的条件以形成与探针连接的环形核酸分子。
探针的探针序列(例如与探针连接的核酸分子的探针)能够与核酸条形码分子的序列(例如结合序列)杂交。在其它情形下,探针可包含条形码分子。核酸条形码分子可包含与探针的探针序列(例如第二探针序列)互补的第一结合序列、条形码序列和第二结合序列。在一些情况下,探针的结合序列、条形码核酸分子或两者可以是已知的并且可结合于所关注的靶标(例如编码所关注的基因的mRNA)。在一些情况下,结合序列可以是简并的(即,随机产生)。采用简并的或已知的序列可以分别用于全转录组或外显子组分析或靶向RNA测序。核酸条形码分子还可以包含一个或多个选自由以下组成的组的额外的功能序列:引物序列、引物退火序列和固定序列。结合序列可具有任何适用的长度和其它特征。在一些情况下,与探针的探针序列互补的结合序列长度可与相同探针序列。可替代地,结合序列长度可与探针序列不同。举例来说,结合序列可比探针序列短,并只能与探针序列的一部分杂交。可替代地,结合序列可比探针序列长,并且能与整个探针序列杂交并在一个或多个方向上延伸到探针序列之外。
在一些情况下,条形码核酸分子可在特定取向上与一个或多个探针或衔接子的结合序列杂交。在一些实施方案中,条形码可被配置成结合于探针、衔接子或与衔接子接合的探针的3′末端。在一些情况下,探针与条形码分子的结合是直接的(例如通过直接杂交)或间接的,例如使用如本文中其它地方所述的夹板序列(例如图20)。在一些情况下,探针和/或条形码分子可包含一个或多个核糖核苷酸以促进结合和接合。在一个非限制性实例中,探针的结合序列可包含一对3′端核糖核苷酸。条形码核酸分子可以在5′末端磷酸化并且可经由夹板分子与核糖核苷酸缔合。然后条形码核酸分子可接合至探针的3′末端。条形码核酸分子在探针的3′末端处的杂交和接合可为有利的,因为此过程可最小化下游扩增伪像,最小化条形码交换,并且可与去除未接合的探针相容。
在一些情形下,具有能够与第一核酸分子的靶标区域杂交的第一探针序列的第一探针可包含能够与核酸条形码分子的序列杂交的第二探针序列,并且能够与第二核酸分子的靶标区域杂交的第二探针可不包含能够与核酸条形码分子杂交的序列。在其它情形下,第二探针还可以包含能够与核酸条形码分子的序列杂交的探针序列。第一探针杂交的第一核酸条形码分子可以不同于第二探针杂交的第二核酸条形码分子。举例来说,第一和第二核酸条形码分子可包含一个或多个不同结合序列和/或不同条形码序列。
在一些情形下,具有能够与第一核酸分子的靶标区域杂交的第一探针序列的第一探针可包含能够与核酸衔接子分子的第一序列杂交的第二探针序列。核酸衔接子分子可包含这个第一序列或其互补序列,和可与核酸条形码分子的第一序列杂交的第二序列。核酸衔接子分子还可以包含第三序列,例如用于下游PCR(例如测序引物序列)的引物区域、条形码序列等。核酸衔接子分子可具有上述序列的任何组合和衍生物或变体。在一个非限制性实例中,核酸衔接子分子可包含能够使核酸衔接子分子与第一探针杂交的第一序列和能够使核酸衔接子分子与核酸条形码分子杂交的第二序列。核酸条形码分子可与衔接子分子杂交。在一些实施方案中,核酸条形码分子可以包含额外的功能序列,例如条形码序列、测序引物序列、UMI、间隔子序列和多个核糖核苷酸。
在一些实施方案中,条形码核酸分子可包含夹板核酸序列。条形码核酸分子可以是部分双链的,并包含结合序列和条形码序列。在一些情况下,结合序列可与第一探针、第二探针或两个探针的一部分互补。结合序列与第一探针或第二探针或两个探针的杂交可发生在分区中或分区外。然后使用例如化学或酶促接合,可将核酸条形码分子接合至第一探针、第二探针或两者。
核酸条形码分子的条形码序列可具有任何适用的长度和其它特征(例如如本文所述)。核酸条形码分子可附连至珠粒,例如凝胶珠粒(例如如本文所述)。珠粒可与核酸分子或包含核酸分子的细胞共分区。珠粒可包含多个可相同或不同的核酸条形码分子。珠粒可包含至少10,000个附连至珠粒的核酸条形码分子。举例来说,珠粒可包含至少100,000个、1,000,000个或10,000,000个附连至珠粒的核酸条形码分子。在一些情况下,多个核酸条形码分子的每个核酸条形码分子可包含共同的条形码序列。核酸条形码分子还可包含额外的条形码序列,对于附连至珠粒的每个核酸条形码分子来说,额外的条形码序列可不同。多个核酸条形码分子能以可释放的方式附连至珠粒。在施加刺激后多个核酸条形码分子可从珠粒释放。这类刺激可选自由以下组成的组:热刺激、光刺激和化学刺激。举例来说,刺激可以是还原剂,例如二硫苏糖醇。刺激的施加可引起以下中的一种或多种:(i)所述多个核酸条形码分子的核酸条形码分子与珠粒之间的连接的裂解,以及(ii)珠粒的降解或溶解,从而从珠粒释放所述多个核酸条形码分子的核酸条形码分子。在一些情况下,一个或多个核酸条形码分子可在核酸条形码分子的结合序列与杂交至所关注的核酸分子的探针的探针序列杂交前从珠粒释放。一个或多个核酸条形码分子可在包括珠粒和核酸分子(或包含核酸分子的细胞)和探针的分区内从珠粒释放。释放可发生在探针序列与核酸分子的靶标区域杂交之前、之后或期间。
图10示意性说明一种分析核酸分子的代表性方法。图10A示出核酸分子1000(例如mRNA分子),所述核酸分子包含靶标区域1002和1004。在一些情况下,靶标区域1002和1004彼此相邻。探针1006包含探针序列1008、结合序列1010和反应部分1012。探针1014包含探针序列1016和反应部分1018。探针1006的探针序列1008与核酸分子1000的靶标区域1002互补。类似地,探针1014的探针序列1016与核酸分子1000的靶标区域1004互补。图10B示出与靶标区域1002杂交的探针1006的探针序列1008和与靶标区域1004杂交的探针1014的探针序列1016。在一些情况下,探针1006的反应部分1012和探针1014的反应部分1018彼此相邻。图10C示出通过反应部分1012与1018的反应产生的连接部分1020。在一些情况下,部分1012和1018通过化学方式接合(例如点击化学),并且在其它情形下,酶促接合(例如连接酶,例如SplintR或T4连接酶)。连接的探针1006和1014包括包含序列1010、1008和1016的与探针连接的核酸分子。图10D示出核酸条形码分子1022,所述核酸条形码分子包含衔接子序列1028、条形码序列1026(其任选地可包含UMI序列)和与结合序列1010互补的结合序列1024。衔接子序列1028可包含一个或多个功能序列(例如引物序列/引物结合序列、测序引物序列(例如R1或R2)、部分测序引物序列(例如部分R1或部分R2)、被配置成附连至测序仪的流动池的序列(例如P5或P7,或其部分序列)、条形码序列、UMI序列,或这些序列的互补序列)。然后核酸条形码分子1022杂交至与探针连接的核酸分子的结合序列1010。然后如例如图9C中所述,使用例如核酸延伸反应和/或接合反应产生条形码化的与探针连接的核酸分子。在一些情况下,探针1014可包含额外的结合序列(未示)。探针序列1016可与包含与探针序列1016互补的序列的另一核酸条形码分子或引物杂交。在一些情况下,部分1012和1018可不反应并且可以使用酶(例如连接酶,例如SplintR、T4连接酶等)接合。在一些情况下,在靶标区域1002和1004彼此不相邻的情况下,探针1006和/或1014可在核酸延伸反应中延伸并且如本文中其它地方所述接合在一起。
在一些情况下,在核酸条形码分子1022的结合序列1024与杂交至核酸分子1000的靶标区域的探针(例如与探针连接的核酸分子)的结合序列1010杂交后,探针可在核酸延伸反应中延伸,产生条形码化的与探针连接的核酸分子。延伸可包括使用酶(例如聚合酶)将一个或多个核苷酸加至探针和/或核酸条形码分子的末端。延伸可提供包含与以下互补的序列的条形码化的与探针连接的核酸分子:(i)所关注的核酸分子1000的第一靶标区域1002和第二1004靶标区域;(ii)条形码序列1026;和(iii)核酸条形码分子的一个或多个额外序列,例如一个或多个衔接子序列(例如1028)。在一些情况下,条形码化的与探针连接的核酸分子是单链的。在其它情况下,条形码化的与探针连接的核酸分子是双链的。在一些情况下,在条形码化的与探针连接的核酸分子是单链的情况下,那么可以施加适当的条件和或化学剂(例如如本文所述)以使延伸的核酸分子从靶标核酸分子变性。然后靶标核酸分子可进行进一步分析。举例来说,另一组探针可与核酸分子的靶标区域杂交,并且核酸条形码分子可附加至额外探针之一的探针序列。在一些情况下,核酸条形码分子与第一探针的杂交可在第一探针和第二探针与核酸分子的靶标区域杂交之前。条形码化的与探针连接的核酸分子可以通过例如一个或多个扩增反应来复制或扩增,扩增反应在一些情况下可以是等温的。扩增反应可包含聚合酶链式反应(PCR)并且可能涉及一种或多种引物或聚合酶的使用。一种或多种引物可包含一个或多个功能序列(例如引物序列/引物结合序列、测序引物序列(例如R1或R2)、部分测序引物序列(例如部分R1或部分R2)、被配置成附连至测序仪的流动池的序列(例如P5或P7,或其部分序列)等)并且有助于一个或多个功能序列加至所述延伸的核酸分子。条形码化的与探针连接的核酸分子或其衍生物可经由核酸测序(例如如本文所述)检测。
在一些实施方案中,核酸分子1000存在于细胞中。例如,在一些实施方案中,包含核酸分子1000的细胞(其任选地固定)进行透化并且加入探针1006和1014并允许进入细胞并与区域1002和1004杂交,如上所述。然后如本文中其它地方所述,将未结合的探针洗掉(和/或酶促消化)并将探针通过酶或化学方式连接在一起。然后可溶解细胞以释放与探针连接的核酸分子1030(在一些情况下,其可仍与核酸分子1000杂交)以如上所述条形码化。可替代地,核酸条形码分子1022被允许进入透化细胞以如上所述条形码化。在一些实施方案中,如本文中其它地方所述,将核酸条形码分子1022附连至珠粒。举例来说,核酸条形码分子1022可以可释放的方式附连至珠粒(例如经由如本文所述的不稳定键)。在一些情况下,珠粒可以是如本文所述的凝胶珠粒,例如可降解的凝胶珠粒。在一些实施方案中,将包含核酸分子1000的透化细胞与探针1006和1014一起孵育,然后细胞与核酸条形码分子1022(例如附连至珠粒,例如单个珠粒)一起被分区至分区(例如液滴或孔)以条形码化。在其它情况下,包含核酸分子1000的细胞、探针1006和1014和核酸条形码分子1022(例如附连至珠粒,例如单个珠粒)被分区至分区(例如液滴或孔)以结合探针和条形码化。
在一些情况下,本文所述的方法包括使多个透化细胞(或透化核或细胞珠粒)与靶向一个或多个核酸分子(例如mRNA分子)内的一个或多个区域(例如1002和1004)的一个或多个探针(例如探针1006和1014)接触。在探针结合和去除过量探针后,然后包含核酸条形码分子(例如以可释放的方式附连的条形码分子)的多个细胞和多个珠粒(例如凝胶珠粒)可被分区至多个分区(例如多个液滴或多个孔,例如在微孔测定中),以使得多个分区的至少一些分区包含单个细胞和单个珠粒。然后探针可如上所概述条形码化。然后条形码化核酸分子或其衍生物可任选地进行进一步加工并通过何合适的技术,包括核酸测序(例如Illumina测序)分析。
图12示意性说明一种分析核酸分子的代表性方法。图12A示出核酸分子1200(例如mRNA分子),所述核酸分子包含靶标区域1202和1204。在一些情况下,靶标区域1202和1204彼此相邻。探针1206包含探针序列1208、结合序列1210和反应部分1212。探针1214包含探针序列1216、衔接子序列1248和反应部分1218。探针1206的探针序列1208与靶标区域1202互补。类似地,探针1214的探针序列1216与靶标区域1204互补。图12B示出与靶标区域1202杂交的探针1206的探针序列1208和与靶标区域1204杂交的探针1214的探针序列1216。在一些情况下,探针1206的反应部分1212和探针1214的反应部分1218彼此相邻。
图12C示出通过反应部分1212和1218的反应产生的连接部分1220。在一些情况下,部分1212和1218通过化学方式接合(例如点击化学),并且在其它情形下,酶促接合(例如连接酶,例如SplintR或T4连接酶)。连接的探针1206和1214包含包括序列1210、1208、1216和1248的与探针连接的核酸分子1230。图12D示出核酸条形码分子1222,所述核酸条形码分子包含结合序列1224、条形码序列1226(其任选地可包含UMI序列)和与结合序列1210互补的结合序列1228。衔接子序列1228可包含一个或多个功能序列(例如引物序列/引物结合序列、测序引物序列(例如R1或R2)、部分测序引物序列(例如部分R1或部分R2)、被配置成附连至测序仪的流动池的序列(例如P5或P7,或其部分序列)、条形码序列、UMI序列,或这些序列的互补序列)。然后核酸条形码分子1222杂交至与探针连接的核酸分子1230的结合序列1210。然后如前所述(参见例如图9C),使用例如核酸延伸反应和/或接合反应产生条形码化的与探针连接的核酸分子1240。条形码化的与探针连接的核酸分子1240可包含序列1248、1216、1208、1210、1232(与条形码序列1226互补)和1234(与衔接子序列1228互补)。在一些情况下,条形码化的与探针连接的核酸分子1240是单链的(例如仅仅1230或1222延伸)。在其它情况下,条形码化的与探针连接的核酸分子1240是双链的(例如1230和1222都延伸)。在一些情况下,在条形码化的与探针连接的核酸分子1240是单链的情况下,然后可以施加适当的条件和或化学剂(例如如本文所述)以使延伸的核酸分子从靶标核酸分子变性。条形码化的与探针连接的核酸分子1240可以通过例如一个或多个扩增反应来复制或扩增,扩增反应在一些情况下可以是等温的。扩增反应可包含聚合酶链式反应(PCR)并且可能涉及一种或多种引物或聚合酶的使用。一种或多种引物可包含一个或多个功能序列(例如引物序列/引物结合序列、测序引物序列(例如R1或R2)、部分测序引物序列(例如部分R1或部分R2)、被配置成附连至测序仪的流动池的序列(例如P5或P7,或其部分序列)等)并且有助于一个或多个功能序列加至所述延伸的核酸分子。条形码化的与探针连接的核酸分子1240或其衍生物可经由核酸测序(例如如本文所述)检测。
在一些实施方案中,核酸分子1200存在于细胞中。例如,在一些实施方案中,包含核酸分子1200的细胞(其任选地固定)进行透化并且加入探针1206和1214并允许进入细胞并与区域1202和1204杂交,如上所述。然后如本文中其它地方所述,将未结合的探针洗掉(和/或酶促消化)并将探针通过酶或化学方式连接在一起。然后可溶解细胞以释放与探针连接的核酸分子1230(在一些情况下,其可仍与核酸分子1200杂交)以如上所述条形码化。可替代地,核酸条形码分子1222被允许进入透化细胞以如上所述条形码化。在一些实施方案中,如本文中其它地方所述,将核酸条形码分子1222附连至珠粒。举例来说,核酸条形码分子1222可以可释放的方式附连至珠粒(例如经由如本文所述的不稳定键)。在一些情况下,珠粒可以是如本文所述的凝胶珠粒,例如可降解的凝胶珠粒。在一些实施方案中,将包含核酸分子1200的透化细胞与探针1206和1214一起孵育,然后细胞与核酸条形码分子1222(例如附连至珠粒,例如单个珠粒)一起被分区至分区(例如液滴或孔)以条形码化。在其它情况下,包含核酸分子1200的细胞、探针1206和1214和核酸条形码分子1222(例如附连至珠粒,例如单个珠粒)被分区至分区(例如液滴或孔)以结合探针和条形码化。核酸条形码分子和探针可以设计成任何合适的5′至3′配置。举例来说,附连至珠粒的核酸条形码分子可在核酸条形码分子的3′末端或在核酸条形码分子的5′末端处附连至珠粒。
在一些情况下,本文所述的方法包括使多个透化细胞(或透化核或细胞珠粒)与靶向一个或多个核酸分子(例如mRNA分子)内一个或多个区域(例如1202和1204)的一个或多个探针(例如探针1206和1214)接触。在探针结合和去除过量探针后,然后包含核酸条形码分子(例如以可释放的方式附连条形码分子)的多个细胞和多个珠粒(例如凝胶珠粒)可被分区至多个分区(例如多个液滴或多个孔,例如在微孔测定中),以使得多个分区的至少一些分区包含单个细胞和单个珠粒。然后探针(例如1230)可如上所概述条形码化。然后条形码化核酸分子(例如1240)或其衍生物可任选地进行进一步加工并通过任何合适的技术,包括核酸测序(例如Illumina测序)分析。
在一些情况下,核酸条形码分子(例如1222)可以经由衔接子分子连接至与探针连接的核酸分子(例如1230)。图20示意性说明一种使用这类衔接子分子分析核酸分子的代表性方法。图20A示出与探针连接的核酸分子,例如如图10和图12(例如1230)中所述的那些。图20B示出夹板分子2021,其包含与连接有探针的核酸分子(例如1230)中的衔接子(例如908、1010、1210等)的序列互补的结合序列2022。夹板分子2021还可以包含结合序列2023。在一些实施方案中,结合序列2023可包含或多个核糖核苷酸,例如核糖鸟嘌呤或核糖胞嘧啶。在一些情况下,一个或多个核糖核苷酸存在于衔接子序列的末端(例如5′末端或3′末端)。在一些情况下,夹板分子2021是单链或部分双链的分子。图20C示出条形码核酸分子2022与夹板分子2021的杂交。条形码核酸分子2022包含衔接子序列2028、条形码序列2026和与夹板分子2021的结合序列2023互补的结合序列2024。衔接子序列2028可包含一个或多个功能序列(例如引物序列/引物结合序列、测序引物序列(例如R1或R2)、部分测序引物序列(例如部分R1或部分R2)、被配置成附连至测序仪的流动池的序列(例如P5或P7,或其部分序列)、条形码序列、UMI序列,或这些序列的互补序列)。在一些情况下,条形码核酸分子2022的结合序列2024包含多个核糖核苷酸,例如核糖胞嘧啶或核糖鸟嘌呤。在一些情况下,一个或多个核糖核苷酸存在于条形码核酸分子2022的末端(例如5′末端或3′末端)。在条形码核酸分子2022杂交后,可进行夹板固定的与探针连接的核酸分子和条形码分子2022的接合(例如通过化学方式或酶)以形成例如条形码化核酸分子2040,如图20D中所示。条形码化的与探针连接的核酸分子2040可包含序列1248、1216、1208、1210、2024(与结合序列2023互补)、2025(与条形码序列2026互补)和2029(与衔接子序列2028互补)。可替代地,与核酸条形码分子杂交的夹板固定的与探针连接的核酸分子可使用核酸延伸反应条形码化,如前所述。在一些实施方案中,不利用夹板,而是核酸条形码分子为部分双链的并包含单链部分,所述单链部分包含例如序列2022,以有助于杂交至与探针连接的分子1230。在一些情况下,条形码化的与探针连接的核酸分子为单链的。在其它情况下,条形码化的与探针连接的核酸分子为双链的。随后所述延伸的核酸分子可进行一个或多个扩增反应和/或进一步加工,例如如图12中所述的那些。夹板分子2021可以是DNA分子或可以是RNA分子。
在一些情况下,夹板分子2021预先与条形码核酸分子2022杂交以形成夹板核酸分子。夹板核酸分子可以用于例如图20C中以杂交至与探针连接的核酸分子。
图21示意性说明一种使用第一探针和第二探针分子、衔接子分子和条形码核酸分子分析核酸分子的代表性方法。图21A示出核酸分子2100,所述核酸分子包含相邻的靶标区域2102和2104。核酸分子2100是在3′末端包含多聚A序列的mRNA分子。探针2006包含探针序列2108和2110,并且探针2114包含探针序列2116和2148和循环序列2147。探针2006的探针序列2108与靶标区域2102互补并且包含反应部分2112。类似地,探针2114的探针序列2116与靶标区域2104互补并且包含反应部分2118。图21B示出与靶标区域2102杂交的探针2006的探针序列2108和与靶标区域2104杂交的探针2114的探针序列2116。探针2006的反应部分2112和探针2114的反应部分2118彼此相邻。衔接子分子2121还可以用探针2106和2114来引入。图21C示出衔接子分子2121和条形码分子2122的杂交。衔接子分子2121包含可与探针2106的探针序列2110杂交的结合序列。衔接子分子2121还可以包含间隔子序列2023。在一些实施方案中,间隔子序列2023可包含多个核糖核苷酸,例如核糖鸟嘌呤或核糖胞嘧啶。图21D示出条形码核酸分子2122与衔接子分子2121的杂交。条形码核酸分子2122包含引物序列2128(例如测序引物序列)、条形码序列2126和与衔接子分子2121的间隔子序列2023互补的结合序列2124。在一些情况下,条形码核酸分子2122的结合序列2124包含多个核糖核苷酸,例如核糖胞嘧啶或核糖鸟嘌呤。图21D说明过量探针分子的消化。核酸外切酶(例如3′核酸外切酶)2130可以用于消化未杂交的探针分子2106、2114和衔接子分子2121。图21E示出条形码分子和探针的接合。连接部分2132可以通过反应部分2112和2118的反应产生。在一些情况下,部分2112和2118使用点击化学来接合,并且在其它情形下,可以使用酶(例如SplintR、T4连接酶)。探针分子的接合可以产生与探针连接的分子。类似地,条形码分子2122可以通过连接部分2132连接至探针或与探针连接的分子之一,产生条形码化的与探针连接的分子。此外,可进行与探针连接的核酸分子的所连接的探针的延伸,以形成延伸的核酸分子,类似于图12中所示。
如所了解,一个或多个本文所述的过程可在分区内(例如孔或液滴)或在分区外(例如大批)。一个或多个过程可以任何适宜或有用的次序发生。举例来说,在一些实施方案中,第一探针可与靶标核酸分子杂交。然后第一探针可例如使用衔接子分子和条形码分子、夹板固定的条形码分子或它们的任何组合或衍生物条形码化。条形码分子和探针可(例如使用点击化学或酶促)接合。在一些情况下,然后未杂交的探针可(例如使用核酸外切酶)消化。随后,可以引入第二探针分子,所述第二探针分子可与靶标核酸分子杂交,与条形码化探针分子相邻。然后可接合第二探针分子(例如使用点击化学或酶促)以形成条形码化的与探针连接的核酸分子。在一些情况下,条形码化可在分区前、在分区期间或在分区后进行。类似地,接合和/或消化可发生在分区中或在分区外。
图16示意性说明一种接合不相邻的探针以形成与探针连接的核酸分子的方法。图16A示出核酸分子1600,所述核酸分子包含不相邻的靶标区域1602和1604。核酸分子1600是在3′末端包含多聚A序列的mRNA分子。探针1606包含探针序列1608和1610并且探针1614包含探针序列1616和部分1618。探针1606的探针序列1608与靶标区域1602互补。类似地,探针1614的探针序列1616与靶标区域1604互补并且包含聚合酶可结合至的部分1618。图16B示出与靶标区域1602杂交的探针1606的探针序列1608和与靶标区域1604杂交的探针1614的探针序列1616。聚合酶1620,例如Mu聚合酶或DNA聚合酶,通过分别加入互补核糖核苷酸(例如三磷酸核糖核苷(rNTP))或脱氧核糖核苷酸(例如三磷酸脱氧核糖核苷酸(dNTP))将探针1616延伸。图16C示出彼此相邻的探针1606和延伸的探针1614。图16D示出探针1606和延伸的探针1614的接合反应。接合可通过酶,例如通过使用T4RNA连接酶或PBCV1连接酶进行,以形成与探针连接的核酸分子1622。随后可进行下游分析,例如条形码化和扩增,类似于图12中的图12D-F中所示。
图17示意性示出一种使用衔接子核酸分子将核酸探针条形码化的替代方法。图17A示出核酸分子1700,所述核酸分子包含靶标区域1702。核酸分子1700是在3′末端包含多聚A序列的mRNA分子。探针1706包含探针序列1708和衔接子序列1710。探针1706的探针序列1708与靶标区域1702互补。图17B示出与靶标区域1702杂交的探针1706的探针序列1708。衔接子核酸分子1712包含与核酸探针1706的衔接子序列1710杂交的序列1714,和模块序列1716、1718。模块序列1716、1718可包含例如PCR引物序列、条形码、恒定序列和/或它们的任何变体或衍生物。图17C示意性示出一种将探针核酸1706条形码化的方法。条形码核酸分子1720包含与衔接子核酸分子1712杂交的杂交序列1722和条形码序列1724。条形码核酸分子的杂交可发生在分区之前或在分区期间。在杂交后,可以执行其它核酸反应,例如使用DNA聚合酶延伸,产生双链的条形码化核酸探针(未示)。随后可执行扩增和测序。虽然图10-12、13、20、21描绘第一探针和第二探针是相邻的,但是将了解,这些仅仅是为了说明并且不意味着限制。在某些实施方案中,第一探针和第二探针可以不相邻,如图16中所描绘。因此,图10-12、13、20、21的任何过程、组分、试剂、变体和衍生物也可以应用于不相邻的探针。类似地,图16的任何过程、组分、试剂、变体和衍生物也可以应用于图10-12、13、20、21中所描绘的那些方案。
在一些情况下,附连至相同靶标核酸分子的探针分子可以彼此连接。举例来说,单个探针分子(例如探针核酸分子)可包含(i)在第一末端的第一探针部分,所述第一探针部分包含与核酸分子的第一靶标区域互补的序列;和(ii)在第二末端的第二探针部分,所述第二探针部分包含与邻近第一靶标区域的第二核酸分子的靶标区域互补的序列。单个探针分子可包含额外序列,例如测序引物结合位点或用于如滚环式扩增的下游加工的引物位点。在一些实施方案中,第一探针和/或第二探针可包含可裂解的连接子。在一些情况下,可裂解的连接子可包含限制位点并且可以在加入生物刺激(例如限制酶)后裂解。在一些实施方案中,可裂解的连接子可以在加入刺激,例如化学、热或光刺激后裂解。在第一探针和第二探针部分与标核酸分子杂交后,第一探针和第二探针部分可以相邻并且探针分子和靶标核酸分子可形成环状核酸产物。然后环状核酸产物可经受足以接合核酸产物的条件,形成环状的与探针连接的核酸分子。在一些实施方案中,与探针连接的核酸分子可以进行环化。在一些情形下,探针的连接可发生在环化前,或可替代地,探针的连接可与环化同时发生或在环化后发生。在一些实施方案中,环化可经由夹板核酸,例如环化核酸分子进行。在这类实施方案中,环化核酸分子可与第一探针上的序列和第二探针上的序列杂交,形成环状核酸产物。在一些实施方案中,第一探针和第二探针部分可以连接成单个探针部分。在一些实施方案中,单个探针部分可以是环状核酸产物。在一些实施方案中,单个探针部分可包含可以经由夹板核酸,例如环化核酸分子连接的单链序列。环状核酸产物的杂交动力学与涉及两个不连接的探针的对应的线性产物的杂交动力学基本上不同。在一些情况下,包含两个探针部分的单个探针分子的使用可引起核酸分子的靶标区域选择性增强。举例来说,包含两个探针部分的单个探针分子的使用可引起相对于两个不连接的探针的使用,附连有两个探针部分的靶标核酸分子的数目增加。在不影响接合产物下通过允许使用核酸外切酶,核酸部分的环化还能有助于去除不想要的核酸物质和未杂交的探针。在一些情况下,在形成环状核酸产物后可以从包括环状核酸产物的溶液或分区去除不想要的核酸物质和未杂交的探针。举例来说,可在溶液中形成环状核酸产物,并且在条形码化或其它加工前从溶液去除不想要的和未杂交的物质。在这类实例中,然后环状核酸产物可以与包括一个或多个核酸条形码分子(例如与珠粒偶联,如本文所述)或核酸结合分子的多种物质之一一起分区以进行进一步加工。可替代地,环状核酸产物可在分区内形成并与分区内的核酸条形码分子和/或核酸结合分子杂交,产生条形码化环状核酸产物。然后可从分区释放条形码化环状核酸产物以进行进一步加工。环状核酸产物可以在任何有用的时间打开。举例来说,环状核酸产物可以在去除不想要的和未杂交的物质后打开。可替代地,环状核酸产物可以在核酸条形码分子和/或核酸结合分子与环状核酸产物杂交后打开,产生条形码化环状核酸产物。在一些实施方案中,环状核酸产物可包含不稳定或可裂解的连接子。举例来说,环状核酸产物可包含可被一种或多种限制酶识别的限制位点。一种或多种限制酶的加入可以打开核酸产物。在另一实例中,环状核酸产物可包含光或热敏感的连接子,所述连接子可以在加入光或热后裂解。在一些情况下,环状核酸产物可以在环状核酸产物分区前或后通过滚环式扩增(RCA)扩增。RCA的使用可以通过从相同原始接合事件产生多个靶标来增加条形码化过程的效率。RCA产物由于尺寸大故在分区前不易损失。RCA产物可以在条形码化过程前通过互补探针和限制酶或其它靶向核酸内切酶的杂交在分区内消化。RCA可以与PCR组合或作为PCR的替代使用。
在一些实施方案中,第一探针或第二探针可包含允许进一步加工的序列。在一些情况下,第一探针或第二探针可包含一个位点。在一些情况下,第一探针和第二探针可连接(例如第一探针和第二探针为同一探针的部分)并且可包含转座位点。在一些情况下,第一探针和第二探针可形成包含转座位点的环状核酸产物。在一些实施方案中,转座酶可以用于将序列加入第一探针或第二探针或环状核酸产物。举例来说,转座酶可以是用转座酶循环序列来加载。转座酶循环序列可包含可以用于进一步加工的序列。举例来说,转座酶循环序列可包含引物测序位点、条形码序列、测序引物序列、限制位点、UMI序列、间隔子序列、衔接子序列和它们的任何组合、变体或衍生物。在一些情况下,转座酶可引入转座酶循环序列至第一探针、第二探针或环状核酸分子中。在一些情况下,转座酶还可以引入缺口或间隙在第一探针、第二探针或环状核酸分子中。在这些情形下,缺口或间隙可以例如使用一种或多种酶(例如聚合酶、连接酶)填充。如扩增、滚环式扩增的进一步加工可产生双链探针分子。在一些情况下,双链探针分子可包含限制位点序列和条形码序列并且可以例如在加入限制酶后裂解,产生条形码化核酸片段。可以执行进一步加工,例如扩增反应,产生测序文库。
转座酶一般是指被配置成结合核酸分子,使核酸分子裂解和将核酸序列插入核酸分子中(和任选地使分子碎裂,例如标签化反应)的酶。在一些情况下,转座酶可以被配置成结合于核酸分子上的特定位点。在一些情况下,转座酶可以被配置成结合于核酸分子上的随机位点。此外,在一些情况下,转座酶可以被配置成结合开放染色质(例如常染色质)和和任选地使其碎裂。转座酶的非限制性实例包括:Tn转座酶(例如Tn3、Tn5、Tn7、Tn10、Tn552、Tn903)、MuA转座酶、Vibhar转座酶(例如来自Vibrio harveyi)、原核生物转座酶、转座酶的hAT超家族的任何成员(例如Hermes)、Ac-Ds、Ascot-1、Bs1、Cin4、Copia、En/Spm、F元件、hobo、Hsmar1、Hsmar2、IN(HIV)、IS1、IS2、IS3、IS4、IS5、IS6、IS10、IS21、IS30、IS50、IS51、IS150、IS256、IS407、IS427、IS630、IS903、IS911、IS982、IS1031、ISL2、L1、Mariner、P元件、Tam3、Tc1、Tc3、Tel、THE-1、Tn/O、TnA、Tol1、Tol2、TnlO和Tyl。在一些情况下,转座酶可以源自任何上述,例如包括一个或多个突变或修饰的转座酶。在某些情况下,与亲本转座酶相关和/或源自亲本转座酶的转座酶可以包含具有与亲本转座酶的对应的肽片段至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%氨基酸序列同源性的肽片段。肽片段可以为至少约10个、约15个、约20个、约25个、约30个、约35个、约40个、约45个、约50个、约60个、约70个、约80个、约90个、约100个、约150个、约200个、约250个、约300个、约400个或约500个氨基酸长。举例来说,源自Tn5的转座酶可以包含50个氨基酸长和与亲本Tn5转座酶中的对应的片段约80%同源的肽片段。转座酶的行为(例如插入)可以通过加入一种或多种阳离子,例如一种或多种二价阳离子(例如Ca2+、Mg2+或Mn2+)来促进和/或引发。在一具体方面,转座酶为过度活跃转座酶,例如Tn5。
图13A-B示意性说明一种核酸分子分析的代表性实例。图13A的图13A示出探针分子1305(例如分子倒置探针),所述探针分子包含在第一末端的探针部分1306和在第二末端的探针部分1314。探针部分1306具有与核酸分子1300(例如mRNA分子)的靶标区域1302互补的序列,而探针部分1314具有与核酸分子1300的靶标区域1304互补的序列。探针部分1306可包含反应部分1312,并且探针部分1314可包含反应部分1318。当探针部分1306和1314与核酸分子1300杂交时,反应部分1312和1318可以是相邻的。探针部分1306和1314通过连接序列连接。在一些情况下,连接序列包含衔接子序列1322、可裂解的部分1323和结合序列1324。衔接子序列1322可包含一个或多个功能序列(例如引物序列/引物结合序列、测序引物序列(例如R1或R2)、部分测序引物序列(例如部分R1或部分R2)、被配置成附连至测序仪的流动池的序列(例如P5或P7,或其部分序列)、条形码序列、UMI序列,或这些序列的互补序列)。连接序列还可以包含一个或多个核酸序列和/或其它部分(氨基酸、肽、蛋白质、PEG部分、烃链或其它连接子)。在一些实施方案中,连接序列可包含可裂解的部分1323,例如包含热不稳定的、可光裂解的或可酶促裂解的键的部分。当探针部分1306和1314与核酸分子1300杂交时,反应部分1312和1318可以是相邻的。
图13A的图13B示出反应部分1312和1318的接合(例如化学接合,例如使用点击化学反应,或酶促接合,例如使用连接酶),以形成连接部分1320,从而使探针1305环化。如本文中其它地方所述,连接部分1320可包含由炔烃部分和叠氮化物部分的反应产生的三唑部分。反应部分1312和1318的接合反应可涉及例如铜物质或应变烯的催化剂的使用并且可发生在分区的内部或外部。在一些实施方案中,环状核酸产物可以通过加入刺激,例如生物、化学、热或光刺激来裂解和线性化。在一个非限制性实例中,连接序列可包含限制位点并且限制酶的施加使位点1323裂解,从而将探针1305线性化。在一些情况下,在条形码化前,环化的探针1305进行滚环式扩增,产生探针序列1305的多个拷贝。通过例如使可裂解的部分1323裂解,1305的连环体可以拆分成适于条形码化的分子。在一些情况下,可裂解的部分1323是限制位点并且滚环式扩增产物可以通过用限制位点特异性限制酶消化连环体来裂解。在一些实施方案中,衔接子序列1322包含UMI,以便从滚环式扩增消化的产物将各包含UMI以鉴定源探针1305。
图13A的图13C示出核酸条形码分子1332的序列1335与结合序列1324的杂交。在杂交后,线性化探针1305(其可已进行或尚未进行滚环式扩增和消化)可通过例如如前文所述的核酸延伸和/或接合来条形码化(例如图9、图10、图12等)。条形码化反应可以通过使用如本文中其它地方所述的夹板分子来促进(例如图20)。
图13B的图13A示出结合于核酸分子1300的探针分子1310和探针分子1340。探针分子1310包含探针序列1306、衔接子序列1322、可裂解的部分1323(例如如上所述)和反应部分1312。探针序列1306与核酸分子1300(例如mRNA分子)的靶标区域1302互补。探针分子1340包含探针序列1314、结合序列1324和反应部分1318。探针序列1314与核酸分子1300(例如mRNA分子)的靶标区域1304互补。
探针分子1310和1340还可以包含一个或多个额外核酸序列和/或其它部分(氨基酸、肽、蛋白质、PEG部分、烃链或其它连接子)。环化核酸分子1328可以用于连接探针分子1310和1340。环化核酸分子1328可包含序列1330和1332。环化核酸分子的序列1330能够与探针分子1310的序列杂交,并且环化核酸分子的序列1332能够与探针分子1340的序列(例如1324)杂交。在环化核酸分子与探针分子1310和1340杂交后,两种分子可在1321接合在一起。接合可以是化学或酶促的,如本文中其它地方所述。当探针部分1306和1314与核酸分子1300杂交时,反应部分1312和1318可以是相邻的。探针部分1306和1314通过连接序列1330连接。1306与1314的接合可以是化学或酶促的,如本文中其它地方所述。如本文中其它地方所述,连接部分(例如1320或1321)可包含由炔烃部分和叠氮化物部分的反应产生的三唑部分。反应部分1312和1318的接合反应可涉及例如铜物质或应变烯的催化剂的使用并且可发生在分区的内部或外部。在一些情况下,部分1312和1318可以是相邻的并且可不包含反应部分。在这些情形下,部分1312和1318可以通过酶(例如使用连接酶)接合。在一些情况下,在1320接合前,1310在1321接合至1340。在一些情况下,在1321接合前,1310在1320接合至1340。在一些情况下,1310同时或基本上同时在1321和1320接合至1340。环化的分子1350可如前在图13A中所示条形码化。然后条形码化分子或其衍生物可通过例如核酸测序分析。
本发明所公开的方法的一个或多个过程可在分区内(例如如本文所述)进行。举例来说,包含核酸分子的样品的一种或多种组分的一个或多个选自由溶解、透化、变性、杂交、延伸、复制和扩增组成的组的过程可在分区内执行。在一些情况下,多个过程在分区内进行。
核酸分子或其衍生物(例如与探针连接的核酸分子、具有一个或多个与其杂交的探针的核酸分子、条形码化的与探针连接的核酸分子或延伸的核酸分子或它的互补物)或包含核酸分子或其衍生物的细胞(例如细胞珠粒)以及额外组分(例如探针、核酸条形码分子和试剂)可以提供在分区内。在一些情况下,探针可在分区内与核酸分子的靶标区域杂交并彼此连接或接合。可替代地,探针可在分区外与核酸分子的靶标区域杂交并彼此连接或接合。举例来说,核酸分子或包含核酸分子的细胞可以提供在除分区外的容器中并且在初始容器或非分区的另一容器内进行探针的杂交。在一些情况下,细胞可以透化(例如如本文所述)以接近其中的所关注的核酸分子并且探针与所关注的核酸分子的靶标区域的杂交可发生在细胞内。然后可开始与核酸分子的靶标区域杂交的探针的接合(例如在合适的条件下和通过引入适当的催化剂)以提供与探针连接的核酸分子。举例来说,包含叠氮化物部分的第一探针与包含炔烃部分的第二探针之间的反应可以由铜催化剂来催化。然后可洗掉过量的探针和催化剂并且可以将细胞分区(例如如本文所述)以进一步分析和加工。在另一实例中,杂交的探针的接合可发生在分区内。延伸、变性和/或扩增过程也可以发生在分区内。
核酸分子或其衍生物(例如与探针连接的核酸分子、具有一个或多个与其杂交的探针的核酸分子、条形码化的与探针连接的核酸分子或延伸的核酸分子或它的互补物)或包含核酸分子或其衍生物的细胞(例如细胞珠粒)可在所述方法的任何适用阶段与一种或多种试剂(例如如本文所述)共分区。举例来说,细胞内所含的核酸分子或其衍生物可在产生与探针连接的核酸分子后与一种或多种试剂共分区。类似地,核酸分子或其衍生物或包含核酸分子或其衍生物的细胞可在所述方法的任何适用阶段从分区释放。举例来说,核酸分子或其衍生物或包含核酸分子或其衍生物的细胞可在核酸条形码分子的结合序列杂交至与探针连接的核酸分子(例如与杂交至核酸分子的靶标区域的探针的序列杂交)后从分区释放以提供条形码化的与探针连接的核酸分子。在另一实例中,从分区释放可发生在条形码化的与探针连接的核酸分子延伸后以提供包含与核酸条形码分子的条形码序列互补的序列和与核酸分子的一个或多个靶标区域互补的一个或多个序列的延伸的核酸分子。可替代地,核酸分子或其衍生物或包含核酸分子或其衍生物的细胞可在延伸的核酸分子从核酸分子和核酸条形码分子变性后从分区释放。然后可在溶液内进行延伸的核酸分子的复制和/或扩增。在一些情况下,这类溶液可包含通过在不同分区中进行的相同过程产生的额外的延伸的核酸分子和/或其互补物。每种延伸的核酸分子或其互补物(例如扩增产物)可包含不同的条形码序列或与不同的条形码序列互补的序列。在这种情况下,溶液可以是包含两个或更多个分区(例如液滴)的内含物的汇集的混合物。
例如一种或多种试剂的一种或多种额外组分可与核酸分子或其衍生物或包含核酸分子或其衍生物的细胞共分区(例如如前述部分中所述)。
在一些情况下,本文所述的方法可以用于帮助基因表达分析。举例来说,包含杂合基因的靶标核酸分子可以接触多个不同探针。多个探针的一个或多个探针可具有与杂合基因的第一部分(例如第一靶标区域)互补的序列,并且多个探针的一个或多个探针可具有与接近杂合基因的第一部分的杂合基因的第二部分(例如第二靶标区域)互补的序列。两个探针每一个可包含反应部分,以使得在与杂合基因杂交和暴露于适当的反应条件后,两个探针可彼此接合。包括与探针接合的杂合基因的溶液可进行加工以去除未杂交的探针并且可与包括一个或多个核酸条形码分子的一种或多种试剂一起分区。在包括与探针接合的杂合基因的分区内包括的核酸条形码分子可具有与杂交至杂合基因的探针的序列互补的序列并且可与之杂交,产生条形码化的与探针接合的杂合基因。随后延伸和扩增可发生在分区的内部或外部。在扩增以产生包含杂合基因的部分的序列的扩增产物或它的互补物后,可使用测序检测扩增产物。所得到的序列读段可以用于确定杂合基因的组分。
本发明所公开的方法可应用于单个核酸分子或多个核酸分子。一种分析包含核酸分子的样品的方法可包括提供多个核酸分子(例如RNA分子),其中每个核酸分子包含第一靶标区域和第二靶标区域;多个第一探针和多个第二探针。在一些情况下,多个核酸分子的核酸分子的一个或多个靶标区域可包含相同序列。多个核酸分子的核酸分子的第一靶标区域和第二靶标区域可以彼此相邻。多个第一探针每一个可包含与多个核酸分子的核酸分子的第一靶标区域的序列互补的第一探针序列以及第二探针序列。多个第一探针的第一探针的第一探针序列可包含第一反应部分。多个第一探针的一个或多个第一探针可包含相同的第一探针序列和/或相同的第二探针序列。多个第二探针每一个可包含与多个核酸分子的核酸分子的第二靶标区域的序列互补的第三探针序列。多个第二探针还可包含第四探针序列。多个第二探针的第二探针的第三探针序列可包含第二反应部分。多个第二探针的第二探针的一个或多个探针可包含相同的第三探针序列和/或如果存在的话,相同的第四探针序列。多个第一探针的第一探针的第一探针序列可与多个核酸分子的核酸分子的第一靶标区域杂交。多个第二探针的第二探针的第三探针序列可与多个核酸分子的核酸分子的第二靶标区域杂交。分别与多个核酸分子的核酸分子的第一靶标区域和第二靶标区域杂交的第一和第三探针序列可以彼此相邻,以使得第一探针序列的第一反应部分与第三探针序列的第二反应部分相邻。与多个核酸分子的核酸分子杂交的第一探针和第二探针的第一反应部分和第二反应部分可反应以提供多个与探针连接的核酸分子。多个核酸条形码分子的核酸条形码分子的结合序列可与杂交至多个核酸分子的核酸分子的第一靶标区域或多个与探针连接的核酸分子的与探针连接的核酸分子的多个第一探针的第一探针的第二探针序列杂交。多个核酸条形码分子的每个核酸条形码分子可包含条形码序列和第二结合序列。多个核酸条形码分子的每个核酸条形码分子的条形码序列可相同或不同。在多个核酸条形码分子的核酸条形码分子的结合序列与杂交至多个核酸分子的核酸分子的第一靶标区域或多个与探针连接的核酸分子的与探针连接的核酸分子的多个第一探针的第一探针的第二探针序列杂交后,然后多个杂交探针的每个第一探针可从探针的末端延伸至所杂交的核酸条形码分子的末端(例如核酸条形码分子的第二结合序列的末端)。从而可建立多个延伸的核酸分子,其中多个延伸的核酸分子的每个延伸的核酸分子包含与多个核酸分子的核酸分子的第一靶标区域互补的序列、与多个核酸分子的核酸分子的第二靶标区域互补的序列、多个第一探针的第一探针的第二探针序列、与多个核酸条形码分子的核酸条形码分子的条形码序列互补的序列以及与多个核酸条形码分子的核酸条形码分子的一个或多个额外序列(例如结合或条形码序列)互补的一个或多个序列。
在一些情形下,一个或多个上述过程可在分区内执行。举例来说,多个核酸分子的每个核酸分子可以提供在不同分区内。这可以通过将包含多个核酸分子的多个细胞分区在多个单独分区内来实现,其中每个细胞包含靶标核酸分子并且多个单独分区的多个不同分区的每个分区包含单个细胞。多个细胞可以在探针与其中包括的所关注的核酸分子的靶标区域杂交和探针连接以提供与探针连接的核酸分子之前或之后分区。可以通过溶解或透化细胞(例如如本文所述)来接近分区中的细胞内所含的靶标核酸分子或其衍生物(例如如本文所述)。在多个单独分区的多个不同分区的每个分区内提供的核酸条形码分子可以呈附连至珠粒提供。举例来说,多个单独分区的多个不同分区的每个分区可包括包含多个附连至珠粒的核酸条形码分子的珠粒(例如如本文所述)。附连至每个珠粒的多个核酸条形码分子可包含不同的条形码序列,以使得多个单独分区的多个不同分区的每个分区包含不同的条形码序列。在组分从多个单独分区的多个不同分区释放后(例如在每个探针延伸后),每个延伸的核酸分子可包含与不同条形码序列互补的序列,以使得每个延伸的核酸分子可以被追踪至指定分区和在一些情况下指定细胞。
图14说明一种分析多个核酸分子的方法的样本工作流程,所述方法包括化学接合介导的扩增。核酸分子1404、1406和1408提供在容器1402内。每个核酸分子包含由虚线指示的第一靶标区域和第二靶标区域。每个核酸分子的第一靶标区域可以相同或不同。类似地,每个核酸分子的第二靶标区域可以相同或不同。多个第一探针1403和多个第二探针1405可以提供在容器1402中。多个第一探针1403的第一探针可包含与核酸分子1404、1406和/或1408的第一靶标区域互补的第一探针序列和第二探针序列。多个第一探针1403的第一探针序列可包含第一反应部分。多个第二探针1405的第二探针可包含与核酸分子1404、1406和/或1408的第二靶标区域互补的第三探针序列。多个第二探针1405的第三探针序列可包含第二反应部分。多个第一探针1403的第一探针的第一探针序列可与核酸分子1404、1406和1408的第一靶标区域杂交。类似地,多个第二探针1405的第二探针的第二探针序列可与核酸分子1404、1406和1408的第二靶标区域杂交。然后第一探针序列和第三探针序列的第一反应部分和第二反应部分可反应以提供与探针连接的核酸分子1411、1413和1415。
在过程1410中,与探针连接的核酸分子1411、1413和1415可与珠粒1418、1420和1422共分区至单独液滴1412、1414和1416中,以便每个液滴包括单个与探针连接的核酸分子和单个珠粒。每个珠粒可包含多个附连至珠粒的核酸条形码分子。珠粒1418包含核酸条形码分子1424,珠粒1420包含核酸条形码分子1426,并且珠粒1422包含核酸条形码分子1428。核酸条形码分子1424、1426和1428每一个包含第一和第二结合序列和条形码序列。核酸条形码分子1424、1426和1428的条形码序列不同,以便每个液滴包含不同的条形码序列。
在过程1430中,核酸条形码分子1424、1426和1428从它们相应的液滴内的相应的珠粒释放(例如通过施加降解或溶解珠粒的刺激)。核酸条形码分子1424、1426和1428的结合序列分别杂交至与探针连接的核酸分子1411、1413和1415的第二探针序列,以在每个液滴内提供条形码化的与探针连接的核酸分子。然后每个液滴内的条形码化的与探针连接的核酸分子进行延伸以提供包含延伸的核酸分子1433、1435和1437的复合的延伸的核酸分子1432、1434和1436。延伸的核酸分子1433、1435和1437包含与条形码序列和所源自的核酸分子的靶标区域的序列互补的序列。举例来说,延伸的核酸分子1433包含与核酸分子1404的靶标区域的序列互补的序列和与核酸条形码分子1424的条形码序列互补的序列。
在过程1438中,将液滴1412、1414和1416的内含物汇集以提供包含复合的延伸的核酸分子1432、1434和1436的汇集的混合物1440。然后复合的延伸的核酸分子1432、1434和1436可从进行杂交的核酸分子和核酸条形码分子变性以提供延伸的核酸分子1433、1435和1437。然后延伸的核酸分子1433、1435和1437可扩增以提供与每种延伸的核酸分子对应的扩增产物。扩增产物将包含与条形码序列和所源自的核酸分子的靶标区域的序列相同或基本上相同的序列。举例来说,与延伸的核酸分子1433对应的扩增产物包含与核酸分子1404的靶标区域的序列相同或基本上相同的序列和与核酸条形码分子1424的条形码序列相同或基本上相同的序列。因为每种延伸的核酸分子和每个扩增产物包含不同的条形码序列或其互补序列,所以延伸的核酸分子和扩增产物可以追溯至具体核酸分子,并且在一些情况下,追溯至具体细胞。因此,这种条形码化方法可有助于通过例如测序快速分析核酸分子,无需逆转录。
在一方面,本发明提供了用分子倒置探针分析靶标特定序列(例如RNA序列)的方法。在一个实施方案中,分子倒置探针在与靶标特定序列杂交后可以形成环化的核酸分子。
图18说明一种分析多个核酸分子的方法的示例工作流程,所述方法包括酶促接合介导的扩增。1800是包含核酸分子1802的固定和透化细胞。每个核酸分子1802包含第一靶标区域和第二靶标区域。每个核酸分子的第一靶标区域可以相同或不同。类似地,每个核酸分子的第二靶标区域可以相同或不同。每个核酸分子的第一靶标区域和第二靶标区域可以彼此相邻。包含分别与第一靶标区域和第二靶标区域杂交的第一探针序列和第二探针序列的多个第一探针1804可以引入至细胞1800中。探针1804可以呈线性分子提供并且可包含衔接子序列,例如PCR引物区域、测序位点引物区域和/或间隔子区域,如本文中其它地方所述。多个探针1804的第一探针序列可与核酸分子1802的第一靶标区域杂交。在探针与靶标区域杂交后,可形成环化的核酸分子。类似地,多个探针1804的第二探针序列可与核酸分子1802的第二靶标区域杂交。在一些情况下,第一探针序列和第二靶标探针序列彼此相邻。在一些情况下,它们不相邻并且可使用聚合酶,例如Mu聚合酶接合,如本文中其它地方所述。在一些情况下,探针1804的第一探针序列和第二探针序列包含反应部分。在杂交后,过量的未杂交的探针可以经由洗涤步骤1805去除。然后第一探针序列和第二探针序列可经由引入酶(例如聚合酶、连接酶)或通过化学反应(例如反应部分的点击化学)连接,产生与探针连接的核酸分子1806。
在过程1808中,细胞1800内的与探针连接的核酸分子1806可与条形码核酸分子1810共分区。条形码核酸分子可包含衔接子区域,包括但不限于独特分子标识符序列、PCR引物序列、间隔子序列和测序位点引物区域。条形码核酸分子可附连至珠粒(未示)。每个珠粒可包含多个附连至珠粒的核酸条形码分子。核酸条形码分子的结合序列1810杂交至与探针连接的核酸分子1806的探针1804的序列,以提供条形码化的与探针连接的核酸分子1812。然后条形码化的与探针连接的核酸分子1812进行核酸反应1813,例如扩增,例如基于Phi29的滚环式扩增,以提供所关注的条形码化扩增子1814,所述扩增子包含与核酸分子1802的靶标区域的序列互补的序列、与核酸条形码分子1810的条形码序列互补的序列和探针1804的任何衔接子序列。
在过程1816中,将一个或多个分区的内含物汇集。然后所关注的条形码化扩增子1814可经受足以制备文库的条件。在一些情况下,所关注的条形码化扩增子可以进行核酸反应,例如扩增(例如PCR)。扩增产物将包含与条形码序列和所源自的核酸分子的靶标区域的序列相同或基本上相同的序列。扩增产物可以追溯至具体核酸分子,并且在一些情况下,追溯至具体细胞。因此,这种条形码化方法可有助于通过例如测序快速分析核酸分子,无需逆转录。
图19说明一种分析多个核酸分子的方法的示例工作流程,所述方法包括细胞珠粒中化学接合介导的核酸扩增。1900为包含可溶解的核酸分子捕获部分1901的细胞珠粒。这些部分可以是结合于凝胶珠粒基质的与硫代丙烯酰胺基偶联的核酸分子。包含靶标区域的核酸分子1902在细胞珠粒内。包含分别与靶标区域杂交的探针序列的多个第一探针1904可以引入至细胞珠粒1900中。探针1904可额外地包含衔接子序列,例如PCR引物区域、测序位点引物区域和/或间隔子区域,如本文中其它地方所述。探针1904还可以包含反应部分1903。在杂交后,过量的未杂交的探针可以经由洗涤步骤1905去除。
在过程1908中,包含核酸分子1902的细胞珠粒1900与包含反应部分的条形码核酸分子1910共分区。分区包含足以从细胞珠粒基质释放核酸分子1902的条件。在一些情况下,例如DTT的还原剂可以用于从细胞珠粒释放核酸分子至分区中。条形码核酸分子可附连至珠粒(未示)。每个珠粒可包含多个附连至珠粒的核酸条形码分子。分区可包含足以从珠粒释放核酸条形码分子至分区中的条件。条形码核酸分子1910可与杂交至核酸分子1902的探针1904缔合。然后条形码核酸分子1910和探针1904可例如经由条形码核酸分子上的反应部分和探针1904上的反应部分的点击化学接合,以提供条形码化的与探针连接的核酸分子1912。反应产率可以例如通过合并与间隔子衔接子序列杂交的夹板核酸序列来提高。举例来说,条形码核酸分子1910可包含可与探针1904上的衔接子序列(例如间隔子序列)杂交的序列(例如悬垂序列,未示)。在杂交后,条形码核酸分子1910上的反应部分和探针1904上的反应部分可以接合以提供条形码化的与探针连接的核酸分子。在其它非限制性实例中,条形码核酸分子1910可以是部分双链的并且包含形成夹板核酸序列的序列(例如悬垂序列),所述序列可以部分与探针1904杂交并接合以提供部分双链的条形码化的与探针连接的核酸分子。
在过程1916中,将一个或多个分区的内含物汇集。然后条形码化的与探针连接的核酸分子1912可经受足以制备文库的条件。在一些情况下,清理条形码化的与探针连接的核酸分子。在清理的一非限制性实例中,样品可以经由核酸分子的基于磁性的拉下测定来富集或纯化。在一些情况下,清理过程可允许核酸分子的尺寸选择。在一些情况下,清理过程包括去除以DNA为模板的接合产物。在其它情形下,清理过程包含RNA酶以使例如DNA-RNA双链体中的RNA链裂解。在一些情况下,清理过程包括拉下测定(例如接合柄的生物素拉下)。在一些情况下,清理过程包括接合后核酸外切酶处理。在一些情况下,清理过程包括封阻核酸分子上的自由3′末端,这可使得所述末端无法被聚合酶延伸。在一些情况下,与探针连接的核酸分子可以进行核酸反应,例如扩增(例如PCR)。扩增产物将包含与条形码序列和所源自的核酸分子的靶标区域的序列相同或基本上相同的序列。扩增产物可以追溯至具体核酸分子,并且在一些情况下,追溯至具体细胞。因此,这种条形码化方法有助于通过例如测序快速分析核酸分子,无需逆转录。
本文还提供了可涉及细胞多路复用的方法。细胞可以加工、分区和标记。可以将经过加工的细胞汇集并且可将来自细胞的核酸分子进一步加工。所述过程中的一个或多个可涉及核酸反应、条形码化、分区和/或它们的任何组合或衍生物。本文所公开的方法中的一种或多种可允许细胞多路复用,而不使用染色试剂,并且可提高分区的占用率。所述过程中的一个或多个可涉及使探针与所关注的核酸分子的靶标区域杂交,将所得复合物条形码化,并且执行延伸、变性和扩增过程,以提供包含与所关注的核酸分子的靶标区域相同或基本上相同或互补的序列的核酸分子。
多路复用方法可包括使第一探针和第二探针与核酸分子的第一靶标区域和第二靶标区域杂交,连接第一探针和第二探针以提供与探针连接的核酸分子,以及将与探针连接的核酸分子条形码化。本文提供的方法的一个或多个过程可在例如液滴或孔的分区内执行。
在其它情形下,多路复用方法可包括使第一探针与核酸分子的第一靶标区域杂交,在第一分区内用第一条形码序列将第一探针条形码化,从分区回收条形码化第一探针,将与核酸分子的第一靶标区域杂交的第一探针分区在第二分区内,在第二分区内使第二探针与第二核酸分子的靶标区域杂交,以及用第二条形码序列将与核酸分子杂交的第一或第二探针条形码化。在一些情况下,第一探针可包含第一条形码序列并且在第一分区内用第一条形码序列条形码化可以与第一探针与第一靶标区域杂交同时。在一些情况下,第二探针可包含第二条形码序列并且用第二条形码序列条形码化可以与第二探针与第二靶标区域杂交同时。在一些情况下,第一探针可连接至第二探针(例如经由化学或酶促接合过程,如本文所述)。第一探针和第二探针可以在第二分区内或在第二分区外彼此连接。这个过程可以重复跨越多个第一分区和多个第二分区的多个核酸分子(例如细胞,例如固定细胞或细胞珠粒内包括的核酸分子)。多个第一分区的每个第一分区可包含多个第一条形码序列的不同的第一条形码序列,并且多个第二分区的每个第二分区可包含多个第二条形码序列的不同的第二条形码序列。第一条形码序列可以是与第一多个珠粒偶联的第一核酸条形码分子的组分,而第二条形码序列可以是与第二多个珠粒偶联的第二核酸条形码分子的组分(例如如本文所述)。多个第一分区可以是孔,而第二多个分区可以是液滴(例如如本文所述)。
在一方面,本文提供的多路复用方法包括:(i)固定多个细胞或细胞珠粒;(ii)执行多个细胞或细胞珠粒的第一次分区;(iii)在多个细胞或细胞珠粒内将多个核酸分子条形码化以提供包含条形码化核酸分子的多个标记细胞或细胞珠粒;(iv)汇集包含条形码化核酸分子的多个标记细胞或细胞珠粒;(v)执行包含条形码化核酸分子的多个标记细胞或细胞珠粒的第二次分区;以及(vi)执行条形码化核酸分子的第二次条形码化以产生多路复用的条形码化核酸分子。
在一些实施方案中,细胞或细胞珠粒可以进行加工以将细胞条形码化。细胞珠粒可包含细胞。在一些实施方案中,细胞可以是活的。在一些实施方案中,细胞可以使用例如多聚甲醛、甲醛、乙醇、甲醇等固定剂固定。在一些情况下,固定的细胞还可以透化。在一些实施方案中,多个细胞(例如固定的透化细胞)可以被分区在多个分区中。在一些情况下,细胞(例如固定的细胞)在分区内透化。在多个分区内,多个细胞(例如固定的透化细胞)可以条形码化。在一些实施方案中,多个细胞(例如固定的透化细胞)内的核酸分子可以条形码化。
在一些情况下,方法可包括提供包含核酸分子(例如RNA分子)的样品,所述核酸分子具有相邻的第一靶标区域和第二靶标区域;具有与第一靶标区域互补的第一探针序列和第二探针序列的第一探针;以及具有与第二靶标区域互补的第三探针序列的第二探针。第一和第三探针序列还可以分别包含第一反应部分和第二反应部分。在第一探针的第一探针序列与核酸分子的第一靶标区域杂交和第二探针的第三探针序列与核酸分子的第二靶标区域杂交后,反应部分可以彼此相邻。随后在充足条件下相邻反应部分之间的反应可连接第一探针和第二探针,得到与探针连接的核酸分子。与探针连接的核酸分子还可以称为与探针接合的核酸分子。然后与探针连接的核酸分子可用核酸条形码分子的条形码序列条形码化以提供条形码化的与探针连接的核酸分子。条形码化可以通过使核酸条形码分子的结合序列杂交至与探针连接的核酸分子的第一探针的第二探针序列来实现。在一些情况下,第一探针或第二探针可包含条形码序列。在一些情况下,第一探针和第二探针都包含条形码序列。在一些情况下,第一探针和第二探针可以是相同探针的部分并且可连接。在一些情况下,第一探针和第二探针可以是在第一探针和第二探针与靶标核酸分子杂交后形成环化的核酸产物的线性探针的部分。条形码化核酸分子可以进行扩增反应,得到包含第一靶标区域和第二靶标区域和与这些序列互补的条形码序列的扩增产物。一个或多个过程可在例如液滴或孔的分区内执行。
在一些情况下,方法可包括提供包含核酸分子(例如RNA分子)的样品,所述核酸分子具有第一靶标区域和第二靶标区域;具有与第一靶标区域互补的第一探针序列和第二探针序列的第一探针;以及具有与第二靶标区域互补的第三探针序列的第二探针。第一靶标区域和第二靶标区域可以彼此相邻。可替代地,第一靶标区域和第二靶标区域可以被至少一个核苷酸,例如至少1个、10个、50个或100个核苷酸的间隙区域分开。第一探针的第一探针序列可与核酸分子的第一靶标区域杂交,并且第二探针的第三探针序列可与核酸分子的第二靶标区域杂交以提供与探针缔合的核酸分子。在第一探针的第一探针序列与核酸分子的第一靶标区域杂交和第二探针的第三探针序列与核酸分子的第二靶标区域杂交后,第一探针和第二探针可以彼此连接(例如经由化学或酶促接合过程,如本文所述)。举例来说,第一探针可包含第一反应部分并且第二探针可包含可包含第二反应部分,并且第一反应部分和第二反应部分可在充足条件下反应,可连接第一探针和第二探针,得到与探针连接的核酸分子。与探针连接的核酸分子还可以称为与探针接合的核酸分子。然后与探针连接的核酸分子可用核酸条形码分子的条形码序列条形码化以提供条形码化的与探针连接的核酸分子。可替代地,可将与探针缔合的核酸分子条形码化以提供条形码化与探针缔合的核酸分子。条形码化可以通过使核酸条形码分子的结合序列杂交至与探针连接的核酸分子的第一探针的第二探针序列来实现。在一些情况下,第一探针或第二探针可包含条形码序列。在一些情况下,第一探针和第二探针都包含条形码序列。在一些情况下,第一探针和第二探针可以是相同探针的部分并且可连接(例如通过一个或多个连接序列,如本文所述)。在一些情况下,第一探针和第二探针可以是在第一探针和第二探针与靶标核酸分子杂交后形成环化的核酸产物的线性探针的部分。条形码化核酸分子可以进行扩增反应,得到包含第一靶标区域和第二靶标区域和与这些序列互补的条形码序列的扩增产物。一个或多个过程可在例如液滴或孔的分区内执行。
在一些情况下,可以执行第二次条形码化操作,产生多路复用的条形码化核酸分子。操作可包括(i)汇集多个细胞,其中多个细胞的细胞包含条形码化核酸分子;(ii)将多个细胞分区;以及(iii)将条形码化核酸分子条形码化以产生多路复用的条形码化核酸分子。一个或多个过程可在例如液滴或孔的分区内执行。在一些情况下,包含条形码化核酸分子的细胞的汇集可在容器,例如器皿或管中执行。然后汇集的细胞可进一步分区。分区可包含足以将条形码化核酸分子条形码化的条件,以产生多路复用的条形码化核酸分子。在一些情况下,条件包含条形码分子和酶。在一些情况下,条件包含条形码分子、衔接子分子和酶。酶可以是连接酶、聚合酶或任何其它合适的酶或酶的组合。在一个非限制性实例中,包含条形码化核酸分子的细胞可以与包含探针结合序列和条形码结合序列的衔接子分子一起分区。在一些情况下,分区还包含条形码分子和酶。在一些情况下,衔接子分子的探针结合序列可与条形码化核酸分子上的序列杂交。在一些情况下,衔接子分子的条形码结合序列可与条形码分子的序列杂交。然后条形码分子可与条形码化核酸分子相邻。然后条形码分子可连接(例如使用酶)至条形码化核酸分子,产生多路复用的条形码化核酸分子。多路复用的条形码化核酸分子可以用于确定分区中的细胞占用率并且可提供一种提高细胞加载、增加占用率、确定多重占用的分区的方法,并且可消除对细胞染色试剂的需要。
图22示意性说明一种加工来自细胞的核酸分子的方法。图22A示意性说明经过加工的细胞的第一次分区。多个细胞2202可以在过程2204中固定。在一些情况下,过程2204包含细胞透化。在过程2206中,多个细胞2202被分区在例如多孔板中。图22B示意性展示细胞的条形码化。在每个分区内,细胞可使用核酸条形码分子2208条形码化。在一些情况下,细胞膜可条形码化。在一些情况下,将细胞内的核酸分子条形码化。条形码化可以通过使条形码核酸分子2208与细胞中的核酸分子杂交来实现。在一些实施方案中,条形码核酸分子可包含核糖核酸分子。在一些情况下,条形码核酸分子可与细胞中的一个或多个RNA分子杂交,产生条形码化核酸分子。然后细胞也可以视为是条形码化细胞2210。每个分区可包含独特条形码核酸分子。图22C示意性说明条形码化细胞的汇集。在过程2212中可以从分区去除条形码化细胞2210并汇集。图22D示意性说明第二次分区,其中条形码化的细胞2210被分区在例如液滴中。分区2214可包含足以将条形码化细胞条形码化的试剂。在一个实例中,分区2214可包含用于从条形码化细胞2210溶解和释放条形码化核酸分子的溶解试剂,以及衔接子分子2218和条形码分子2220。在一些情况下,条形码分子2220可以可释放的方式附连至珠粒,珠粒可以是凝胶珠粒,如本文中其它地方所述。分区2214可包含足以从珠粒释放条形码分子2220的条件。在其它实施方案中,条形码分子2220可以保留在珠粒上。在这些情形下,珠粒可随后用于条形码分子的纯化、富集和/或收集。在分区2214内,衔接子分子2218可包含探针结合序列,所述探针结合序列可与条形码化核酸分子2208上的序列杂交。衔接子分子2218还可以包含条形码结合序列,所述条形码结合序列可与条形码分子2220的序列杂交。然后条形码分子2220可与条形码化核酸分子2208相邻。分区2214可包含足以将条形码分子2220接合至条形码化核酸分子2208的条件,以产生多路复用的条形码化核酸分子。
在一些实施方案中,与样品核酸分子(例如细胞mRNA分子)杂交的靶标特异性探针(例如本文所述的与探针连接的分子)可使用例如分裂-汇集方法通过条形码区段的组合装配来条形码化。举例来说,多个透化细胞(或透化核或细胞珠粒)与一个或多个如本文所述的靶标特异性探针接触。图11的图11A描绘了与靶标mRNA分子1100杂交的靶标特异性探针。靶标特异性探针可以使用本文其它地方所述的任何合适的方法配置(参见例如图9-12、14、16、17、分子倒置探针等)。举例来说,在一些情况下,包含结合序列1105和衔接子序列1106的第一探针和包含结合序列1104和衔接子序列1103的第二探针与靶标核酸分子1100(例如mRNA分子)杂交并且两个探针使用例如本文其它地方所述的酶促和/或化学接合方案连接,产生与探针连接的核酸分子1120。结合序列1105被配置成与靶标核酸分子1100的靶标区域1101杂交,而结合序列1104被配置成与靶标核酸分子1100的靶标区域1102杂交。衔接子序列1106和1103每一个可任选地包含一个或多个功能序列(例如引物序列/引物结合序列、测序引物序列(例如R1或R2)、部分测序引物序列(例如部分R1或部分R2)、被配置成附连至测序仪的流动池的序列(例如P5或P7,或其部分序列)、条形码序列、UMI序列,或这些序列的互补序列)。然后与探针连接的核酸分子1120可使用条形码序列区段(即,条形码子单元)的组合装配条形码化。举例来说,在一些实施方案中,与探针连接的核酸分子1120使用分裂-汇集方法组合条形码化。在一些实施方案中,与探针连接的核酸分子1120通过连续加入条形码序列区段而组合条形码化。组合条形码序列可以通过多种方法合成,包括例如接合、杂交、核苷酸聚合或它们的组合。
图11B示出第一条形码序列区段加入至与探针连接的核酸分子1120。部分双链核酸条形码分子杂交至与探针连接的核酸分子1120,所述部分双链核酸条形码分子包含:(i)第一链1108,所述第一链包含第一条形码序列区段和衔接子序列;和(ii)第二链1107,所述第二链包含结合序列。结合序列与衔接子序列1106的至少一部分互补,以便核酸条形码分子杂交至与探针连接的核酸分子1120。然后链1108附连至与探针连接的核酸分子1120(例如使用接合和/或核酸延伸)以加入第一条形码序列区段。
图11C示出第二条形码序列区段加入至包括包含1108的核酸条形码分子的与探针连接的核酸分子1120。部分双链核酸条形码分子杂交至包括包含1108的核酸条形码分子的与探针连接的核酸分子1120,所述部分双链核酸条形码分子包含:(i)第一链1110,所述第一链包含第一条形码序列区段和衔接子序列;和(ii)第二链1109,所述第二链包含结合序列。结合序列与衔接子序列的至少一部分互补,以便核酸条形码分子杂交至包括包含1108的核酸条形码分子的与探针连接的核酸分子1120。然后链1110附连至包括包含1108的核酸条形码分子的与探针连接的核酸分子1120(例如使用接合和/或核酸延伸)以加入第二条形码序列区段。
图11D示出第三条形码序列区段加入至包含1108和1110的与探针连接的核酸分子1120。部分双链核酸条形码分子杂交至包含1108和1110的与探针连接的核酸分子1120,所述部分双链核酸条形码分子包含:(i)第一链1112,所述第一链包含第一条形码序列区段和衔接子序列;和(ii)第二链1111,所述第二链包含结合序列。结合序列与衔接子序列的至少一部分互补,以便核酸条形码分子杂交至包含1108和1110的与探针连接的核酸分子1120。然后链1112附连至包含1108和1110的与探针连接的核酸分子1120(例如使用连接和/或核酸延伸)以加入第三条形码序列区段。
上述组合条形码化方案可以使用例如分裂-汇集方法执行。举例来说,包含例如与探针连接的核酸分子1120(或本文所述的任何其它探针)的多个透化细胞(或透化核或细胞珠粒)可以被分区至第一多个分区(例如多个孔)中,其中多个分区的每个分区包含不同(即,独特)第一条形码序列区段。在加入第一条形码序列区段后,可以从第一多个分区收集细胞(或核或细胞珠粒)并汇集并分区至第二多个分区(例如多个孔)中,其中多个分区的每个分区包含不同(即,独特)第二条形码序列区段。重复这个分裂-汇集过程允许产生包含任何合适量的条形码序列区段的条形码。如本文所述的组合条形码化可包含至少1次、2次、3次、4次、5次、6次、7次、8次或更多次操作(例如分裂-汇集循环)。包含多次操作的组合条形码化可用于例如产生更大的条形码多样性并在源自多个细胞的每个单细胞的核酸分子上合成独特条形码序列。举例来说,组合条形码化包含三次操作,每次操作包含在96个分区中的每个中附连独特核酸序列,将得到多达884,736个独特条形码组合。细胞可以被分区成使得至少一个细胞(或核或细胞珠粒)存在于多个分区的每个分区中。细胞可以被分区成使得至少1个、2个、3个、4个、5个、10个、20个、50个、100个、500个、1,000个、5,000个、10,000个、100,000个、1,000,000个或更多个细胞存在于单个分区中。细胞可以被分区成使得至多1,000,000个、100,000个、10,000个、5,000个、1,000个、500个、100个、50个、20个、10个、5个、4个、3个、2个或1个细胞存在于单个分区中。细胞可以呈随机配置分区。
在一些情况下,本文所述的方法在细胞珠粒中执行。关于示例性细胞珠粒产生和加工方法,参见例如美国专利公布2018/0216162和PCT申请PCT/US18/54458。举例来说,在一些实施方案中,包含细胞的细胞珠粒如本文中其它地方所述产生。在一些情况下,细胞珠粒包含附连至其(例如共价附连至细胞珠粒聚合物或交联基质)的包含多聚T序列的多个核酸分子。在一些情况下,包含多聚T序列的核酸分子以可释放的方式附连至细胞珠粒(例如如本文中其它地方所述,经由不稳定键)。包含多聚T序列的核酸分子还可以包含一个或多个功能序列(例如引物序列/引物结合序列、测序引物序列(例如R1或R2)、部分测序引物序列(例如部分R1或部分R2)、被配置成附连至测序仪的流动池的序列(例如P5或P7,或其部分序列)、条形码序列、UMI序列,或这些序列的互补序列)。然后细胞珠粒中的细胞可溶解以释放细胞成分,包括包含多聚A尾的mRNA分子。可替代地,细胞可在细胞珠粒产生前或与细胞珠粒产生同时(例如在液滴中在细胞珠粒产生前或与细胞珠粒产生同时)溶解。然后含多聚A的mRNA可与多聚T序列杂交,从而使mRNA固定在细胞珠粒中。在一些情况下,被捕获的mRNA进行逆转录反应以将被捕获的mRNA转化成cDNA。在一些情况下,cDNA是单链的。在其它情况下,cDNA是双链的。然后固定在细胞珠粒中的核酸分子可以接触本文所述的探针分子并加工以检测细胞核酸分子(例如mRNA),如本文所述。
用于样品划分的系统和方法
在一方面,本文所述的系统和方法提供一个或多个颗粒(例如生物颗粒、生物颗粒的大分子成分、珠粒、试剂等)划分、沉积或分区至不连续的隔室或分区(本文中可交换地称为分区),其中每个分区维持其自身的内含物与其它分区的内含物分开。分区可以是乳液中的液滴。分区可以包括一个或多个其它分区。
分区可以包括一个或多个颗粒。分区可以包括一种或多种类型的颗粒。举例来说,本公开的分区可以包含一个或多个生物颗粒和/或其大分子成分。分区可以包含一个或多个凝胶珠粒。分区可以包含一个或多个细胞珠粒。分区可以包括单个凝胶珠粒、单个细胞珠粒,或单个细胞珠粒与单个凝胶珠粒。分区可以包括一种或多种试剂。可替代地,分区可以是未被占用的。例如,分区可以不包含珠粒。细胞珠粒可以是例如经由含有生物颗粒的液滴与能够聚合或胶凝的前体的聚合而包裹在凝胶或聚合物基质内的生物颗粒和/或其大分子成分中的一种或多种。可以在液滴生成之前、在液滴生成之后或同时如经由微胶囊(例如珠粒)将如条形码的独特标识符注射至液滴中,如本文中其它地方所述。微流体通道网(例如芯片上)可以用于如本文所述产生分区。替代机制也可以用于将单独的生物颗粒分区,包括多孔膜,通过所述多孔膜,细胞的含水混合物被挤压成不含水流体。
分区在流体流内是可流动的。分区可以包含例如微泡,所述微泡具有环绕内部流体中心或核心的外部屏障。在一些情况下,分区可以包含多孔基质,所述多孔基质能够夹带和/或保持材料在它的基质内。分区可以是在第二相内的第一相的液滴,其中第一相和第二相是不混溶的。举例来说,分区可以是在非水性连续相(例如油相)内的水性流体的液滴。在另一个实例中,分区可以是在水相内的非水性流体的液滴。在一些实例中,分区可以呈油包水乳液或水包油乳液提供。多种不同的容器描述于例如美国专利申请公布No.2014/0155295中,所述公布以引用的方式整体并入本文中以达成所有目的。用于在非水性或油性连续相中建立稳定的液滴的乳液系统描述于例如美国专利申请公布No.2010/0105112中,所述公布以引用的方式整体并入本文中以达成所有目的。
在乳液中的液滴的情况下,在一个非限制性实例中,将个别的颗粒分派至不连续的分区可以通过以下来实现:将水性流体中的流动的颗粒流引入流动的非水性流体流中,以便在两种物流的接点产生液滴。可对流体特性(例如流体流速、流体粘度等)、颗粒特性(例如体积分数、粒度、粒子浓度等)、微流体构造(例如通道几何形状等)及其他参数进行调整以控制所得到的分区的占用率(例如每个分区的生物颗粒数目、每个分区的珠粒数目等)。举例来说,分区占用率可以通过在某些浓度和/或流速的颗粒下提供水性流来控制。为了产生单个生物颗粒分区,不混溶的流体的相对流速经过选择,以便使分区平均每个分区含有小于一个生物颗粒,从而保证被占用的那些分区基本上被单个占用。在一些情况下,多个分区当中的分区可以含有至多一个生物颗粒(例如珠粒、DNA、细胞或细胞物质)。在一些实施方案中,多种参数(例如流体特性、颗粒特性、微流体构造等)经过选择或调整,以便大多数的分区被占用,例如,从而允许仅仅小百分比的分区未被占用。可以控制流速和通道构造以确保给定数目的被单个占用的分区、小于某一水平的未被占用的分区和/或小于某一水平的被多重占用的分区。
图1示出用于将单独的生物颗粒分区的微流体通道结构100的一实例。通道结构100可以包括通道区段102、104、106和108,所述通道区段在通道接点110连通。操作中,包括悬浮的生物颗粒(或细胞)114的第一水性流体112可以沿着通道区段102输送至接点110,而与水性流体112不混溶的第二流体116从通道区段104和106每一个被递送至接点110,从而建立流至通道区段108中并从接点110流走的第一水性流体112的不连续的液滴118、120。通道区段108可以与可以存储和/或收获不连续的液滴的出口储槽以流体方式偶联。生成的不连续的液滴可包括单独的生物颗粒114(例如液滴118)。生成的不连续的液滴可包括超过一个单独的生物颗粒114(图1未示)。不连续的液滴可不含生物颗粒114(例如液滴120)。每个不连续的分区可以维持其自身的内含物(例如单独的生物颗粒114)与其它分区的内含物分开。
第二流体116可以包含油,例如氟化油,氟化油包括用于稳定所得到的液滴,例如抑制随后所得到的液滴118、120凝聚的氟表面活性剂。尤其有用的分区流体和氟表面活性剂的实例描述于例如美国专利申请公布No.2010/0105112中,所述公布以引用的方式整体并入本文中以达成所有目的。
如所了解,本文所述的通道区段可以与多种不同的流体来源或接受组件中的任一种,包括储槽、管道、歧管或其它系统的流控组件偶联。如所了解,微流体通道结构100可具有其它几何形状。举例来说,微流体通道结构可以具有超过一个通道接点。例如,微流体通道结构可以具有2个、3个、4个或5个通道区段,每个通道区段携带在通道接点会合的颗粒(例如生物颗粒、细胞珠粒和/或凝胶珠粒)。可以引导流体沿着一个或多个通道或储槽经由一个或多个流体流动单元流动。流体流动单元可以包含压缩机(例如提供正压)、泵(例如提供负压)、致动器等以控制流体流动。流体还可以或另外经由外加压差、离心力、电动抽吸、真空、毛细管或重力流等来控制。
生成的液滴可能包含两种液滴子集:(1)被占用的液滴118,其含有一个或多个生物颗粒114;和(2)未被占用的液滴120,其不含任何生物颗粒114。被占用的液滴118可以包含被单个占用的液滴(具有一个生物颗粒)和被多重占用的液滴(具有超过一个生物颗粒)。如本文中其它地方所述,在一些情况下,大部分的被占用的分区可以每个被占用的分区包括至多一个生物微粒,并且一些生成的分区可以未被占用(任何生物颗粒)。但是在一些情况下,一些被占用的分区可以包括超过一个生物颗粒。在一些情况下,可以控制分区过程,以使得少于约25%的被占用的分区含有超过一个生物颗粒,并且在多数情况下,少于约20%的被占用的分区具有超过一个生物颗粒,而在一些情况下,少于约10%或甚至少于约5%的被占用的分区每个分区包括超过一个生物颗粒。
在一些情况下,可能需要使过量数目的空分区的建立最小化,以便降低成本和/或增加效率。虽然这个最小化可以通过在分区接点110提供足够数目的生物颗粒(例如生物颗粒114)以便确保分区中包封至少一个生物颗粒来实现,但泊松分布(Poissoniandistribution)可能如所预期地增加包括多个生物颗粒的分区的数目。因而,在将获得被单个占用的分区的情况下,至多约95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、5%或更少的生成的分区可以未被占用。
在一些情况下,可以控制生物颗粒中的一个或多个(例如通道区段102中)或被引导至分区接点(例如通道区段104、106中)的其它流体的流动,以使得在多数情况下至多约50%的生成的分区、至多约25%的生成的分区或至多约10%的生成的分区未被占用。可以控制这些流动,以便呈现被单个占用的分区的非泊松分布,同时提供较低水平的未被占用的分区。可以实现以上指示范围的未被占用的分区,同时仍然提供上述单个占用率中的任一种。举例来说,在多数情况下,本文所述的系统和方法的使用可以建立所得到的分区,这些分区具有小于约25%、小于约20%、小于约15%、小于约10%和在多数情况下小于约5%的多个占用率,同时具有小于约50%、小于约40%、小于约30%、小于约20%、小于约10%、小于约5%或更少的未被占用的分区。
如所了解,上述占用率也适用于包括生物颗粒和额外试剂,包括(但不限于)携带条形码化核酸分子(例如寡核苷酸)的微胶囊或珠粒(例如凝胶珠粒)的分区(关于图2描述)。被占用的分区(例如至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或99%的被占用的分区)可以包括包含条形码化核酸分子的微胶囊(例如珠粒)和生物颗粒。
在另一方面,除基于液滴的分区外或作为替代,生物颗粒可以包封在微胶囊内,所述微胶囊包含夹带一个或多个单独的生物颗粒或小组生物颗粒的外部壳、层或多孔基体。微胶囊可能包括其它试剂。生物颗粒的包封可以通过多种工艺进行。此类工艺可以将含有生物颗粒的水性流体与在施加具体刺激物至聚合物前体下能够形成凝胶或其它固体或半固体基质的聚合物前体材料组合。此类刺激物可以包括例如热刺激(例如加热或冷却)、光刺激(例如通过光固化)、化学刺激(例如通过交联、前体的聚合引发(例如通过添加引发剂))、机械刺激或它们的组合。
可以通过多种方法制备包含生物颗粒的微胶囊。举例来说,气刀液滴或气溶胶发生气可以用于将前体流体的液滴分区至胶凝溶液中以形成包括单独的生物颗粒或小组生物颗粒的微胶囊。同样地,基于膜的包封系统可以用于产生包含如本文所述的被包封的生物颗粒的微胶囊。本公开的微流体系统,例如图1中所示的微流体系统,容易用于包封细胞,如本文所述。具体地说,并参考图1,包含(i)生物颗粒114和(ii)聚合物前体材料(未示)的水性流体112流入通道接点110中,在这里,通过非水性流体116的流动,水性流体被分区成液滴118、120。在包封法的情况下,非水性流体116还可以包括引发剂(未示)以引起聚合物前体聚合和/或交联,从而形成包括所夹带的生物颗粒的微胶囊。聚合物前体/引发剂对的实例包括例如美国专利申请公布No.2014/0378345中所述的那些,所述公布以引用的方式整体并入本文中以达成所有目的。
举例来说,在聚合物前体材料包含线性聚合物材料,例如线性聚丙烯酰胺、PEG或其它线性聚合物材料的情况下,活化剂可以包含交联剂,或在所形成的液滴内活化交联剂的化学物质。同样地,对于包含可聚合单体的聚合物前体,活化剂可以包含聚合引发剂。举例来说,在某些情况下,在聚合物前体包含丙烯酰胺单体与N,N'-双-(丙烯酰基)胱胺(BAC)共聚单体的混合物的情况下,可以在通道区段104和106中的第二流体流116内提供例如四乙基甲二胺(TEMED)的剂,所述剂可以引发丙烯酰胺与BAC共聚成交联聚合物网络或水凝胶。
在第二流体流116与第一流体流112在接点110接触后,在液滴形成期间,TEMED可以从第二流体116扩散至包含线性聚丙烯酰胺的水性流体112中,TEMED将在液滴118、120内活化聚丙烯酰胺的交联,引起凝胶(例如水凝胶)微胶囊的形成,成为夹带细胞114的固体或半固体珠粒或颗粒。虽然是根据聚丙烯酰胺包封描述,但在本文所述的方法和组合物的上下文中也可以采用其它的“可活化的”包封组合物。举例来说,先形成海藻酸盐液滴,接着暴露于二价金属离子(例如Ca2+离子),可以用作使用所述工艺的包封工艺。同样地,琼脂糖液滴也可以通过基于温度的胶凝(例如在冷却后等)而转变成胶囊。
在一些情况下,被包封的生物颗粒可以选择性地从微胶囊释放,例如通过时间推移或在施加具体刺激后,所述刺激使微胶囊降解至足以允许生物颗粒(例如细胞)或它的其它内含物从微胶囊释放至例如分区(例如液滴)中。举例来说,在上述聚丙烯酰胺聚合物的情况下,可以通过引入适当的还原剂,例如DTT等,使将聚合物基质交联的二硫键裂解来实现微胶囊的降解。参见例如美国专利申请公布No.2014/0378345,所述公布以引用的方式整体并入本文中以达成所有目的。
生物颗粒可以经受其它足以使前体聚合或胶凝的条件。足以使前体聚合或胶凝的条件可以包含暴露于加热、冷却、电磁辐射和/或光。足以使前体聚合或胶凝的条件可以包含任何足以使前体聚合或胶凝的条件。在聚合或胶凝后,可以在生物颗粒周围形成聚合物或凝胶。聚合物或凝胶可能是化学或生物化学试剂能够扩散地渗透的。聚合物或凝胶可能是生物颗粒的大分子成分不能扩散地渗透的。以此方式,聚合物或凝胶可以用于使生物颗粒经受化学或生物化学操作,同时在空间上将大分子成分限制于由聚合物或凝胶界定的液滴的区域。聚合物或凝胶可以包括以下中的一种或多种:二硫化物交联的聚丙烯酰胺、琼脂糖、海藻酸盐、聚乙烯醇、聚乙二醇(PEG)-二丙烯酸酯、PEG-丙烯酸酯、PEG-硫醇、PEG-叠氮化物、PEG-炔、其它丙烯酸酯、壳聚糖、透明质酸、胶原蛋白、纤维蛋白、明胶或弹性蛋白。聚合物或凝胶可以包含任何其它的聚合物或凝胶。
聚合物或凝胶可以官能化为与目标分析物,例如核酸、蛋白质、碳水化合物、脂质或其它分析物结合。聚合物或凝胶可以经由被动机制聚合或胶凝。聚合物或凝胶可以在碱性条件中或在高温下是稳定的。聚合物或凝胶可具有类似于珠粒机械性能的机械性能。举例来说,聚合物或凝胶可具有类似于珠粒的尺寸。聚合物或凝胶可具有类似于珠粒机械强度的机械强度(例如抗张强度)。聚合物或凝胶的密度可低于油。聚合物或凝胶的密度可以大致类似于缓冲液的密度。聚合物或凝胶可具有可调的孔径。可以选择孔径,以例如保持变性核酸。可以选择孔径,以维持例如氢氧化钠(NaOH)的外源化学物质和/或例如抑制剂的内源化学物质的扩散渗透性。聚合物或凝胶可以是生物相容的。聚合物或凝胶可以维持或增强细胞活力。聚合物或凝胶可以是生物化学相容的。聚合物或凝胶可以通过热、化学、酶促和/或光学的方式聚合和/或解聚。
聚合物可以包含与二硫键交联的聚(丙烯酰胺-共-丙烯酸)。聚合物的制备可以包括两步反应。在第一活化步骤中,聚(丙烯酰胺-共-丙烯酸)可以暴露于酰化剂以使羧酸转化成酯。举例来说,聚(丙烯酰胺-共-丙烯酸)可以暴露于氯化4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓(DMTMM)。聚丙烯酰胺-共-丙烯酸可以暴露于氯化4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓的其它盐。在第二交联步骤中,在第一步中形成的酯可以暴露于二硫化物交联剂。举例来说,酯可以暴露于胱胺(2,2’-二硫基双(乙胺))。在两步后,生物颗粒可以被通过二硫键连接在一起的聚丙烯酰胺链环绕。以此方式,生物颗粒可以包在凝胶或基质(例如聚合物基质)内或构成凝胶或基质(例如聚合物基质)以形成“细胞珠粒”。细胞珠粒可以含有生物颗粒(例如细胞)或生物颗粒的大分子成分(例如RNA、DNA、蛋白质等)。细胞珠粒可以包括单细胞或多个细胞,或单细胞或多个细胞的衍生物。例如在溶解和洗涤细胞后,可以洗掉来自细胞溶解产物的抑制组分并且大分子成分可以结合成细胞珠粒。本文公开的系统和方法适用于含有生物微粒的细胞珠粒(和/或液滴或其它分区)和含有生物微粒的大分子成分的细胞珠粒(和/或液滴或其它分区)。
被包封的生物颗粒可以提供某些潜在的优点:比基于液滴的被分区的生物颗粒更耐贮藏和更便于携带。此外,在一些情况下,可能需要在分析前允许生物颗粒孵育选定时间段,例如以表征此类生物颗粒在不同的刺激存在或缺乏下随时间的变化。在这种情况下,包封可允许孵育比在乳状液滴中分区更长时间,不过在一些情况下,液滴分区的生物颗粒也可以孵育不同的时间段,例如至少10秒、至少30秒、至少1分钟、至少5分钟、至少10分钟、至少30分钟、至少1小时、至少2小时、至少5小时或至少10小时或更多小时。生物颗粒的包封可以构成其它试剂共分区至的生物颗粒的分区。可替代地或此外,被包封的生物颗粒容易沉积至其它分区(例如液滴)中,如上所述。
珠粒
分区可以包括一个或多个独特标识符,例如条形码。条形码可以预先、随后或同时递送至容纳进行划分或分区的生物颗粒的分区。举例来说,条形码可以在液滴生成前、在液滴生成后或与液滴生成同时注射至液滴中。条形码递送至具体分区允许个别生物颗粒的特征随后归于所述具体分区。可以例如在核酸分子(例如寡核苷酸)上经由任何合适的机制递送条形码至分区。条形码化核酸分子可以经由微胶囊递送至分区。在一些情况下,微胶囊可以包含珠粒。在下文进一步详细地描述珠粒。
在一些情况下,条形码化核酸分子最初可以与微胶囊缔合,然后从微胶囊释放。条形码化核酸分子的释放可能是被动的(例如通过从微胶囊扩散出来)。此外或可替代地,可以在施加刺激后从微胶囊释放,所述刺激允许条形码化核酸核酸分子从微胶囊解离或释放。此类刺激可破坏微胶囊,使条形码化核酸分子偶联至微胶囊或在微胶囊内或两种情况的相互作用。此类刺激可以包括例如热刺激、光刺激、化学刺激(例如pH值变化或使用还原剂)、机械刺激、放射线刺激;生物刺激(例如酶)或它们的任何组合。
图2示出用于递送携带条形码的珠粒至液滴的微流体通道结构200的一实例。通道结构200可以包括通道区段201、202、204、206和208,所述通道区段在通道接点210连通。在操作中,通道区段201可以沿着通道区段201输送包括多个珠粒214(例如具有核酸分子、寡核苷酸、分子标签)的水性流体212至接点210。多个珠粒214可以来源于珠粒悬浮液。举例来说,通道区段201可以连接至包含珠粒214的水性悬浮液的储槽。通道区段202可以沿着通道区段202输送包括多个生物颗粒216的水性流体212至接点210。多个生物颗粒216可以来源于生物颗粒悬浮液。举例来说,通道区段202可以连接至包含生物颗粒216的水性悬浮液的储槽。在一些情况下,第一通道区段201或第二通道区段202或者两个区段中的水性流体212可以包括一种或多种试剂,如以下进一步描述。与水性流体212(例如油)不混溶的第二流体218可以从通道区段204和206每一个通道区段递送至接点210。在来自通道区段201和202每一个通道区段的水性流体212与来自通道区段204和206每一个通道区段的第二流体218会合在通道接点210后,水性流体212可以在第二流体218中被分区为不连续的液滴并且沿着通道区段208从接点210流走。通道区段208可以递送不连续的液滴至与通道区段208以流体方式偶联的出口储槽,在所述储槽中可以收获液滴。
作为替代,通道区段201和202可以在接点210上游的另一接点会合。在此类接点,珠粒和生物颗粒可以形成混合物,所述混合物沿着另一个通道被引导至接点210,产生液滴220。混合物可以用交替方式提供珠粒和生物颗粒,以便例如液滴包含单个珠粒和单个生物颗粒。
珠粒、生物颗粒和液滴可以沿着通道在基本上常规流量剖面下(例如在常规流速下)流动。此类常规流量剖面可以允许液滴包括单个珠粒和单个生物颗粒。此类常规流量剖面可以允许液滴具有大于5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%的占用率(例如具有珠粒和生物颗粒的液滴)。此类常规流量剖面和可以用于提供此类常规流量剖面的装置提供于例如美国专利公布No.2015/0292988中,所述公布以引用的方式整体并入本文中。
第二流体218可以包含油,例如氟化油,氟化油包括用于稳定所得到的液滴,例如抑制随后所得到的液滴220凝聚的氟表面活性剂。
生成的不连续的液滴可以包括单独的生物颗粒216。生成的不连续的液滴可以包括条形码或携带珠粒214的其它试剂。生成的不连续的液滴可以包括单独的生物颗粒与携带珠粒,例如液滴220的条形码。在一些情况下,不连续的液滴可以包括超过一个单独的生物颗粒或不含生物颗粒。在一些情况下,不连续的液滴可以包括超过一个珠粒或不含珠粒。不连续的液滴可以未被占用(例如没有珠粒、没有生物颗粒)。
有利地,将生物颗粒和携带珠粒的条形码分区的不连续的液滴可以有效地允许条形码归属于分区内的生物颗粒的大分子成分。分区的内含物仍然可以与其它分区的内含物不连续。
如所了解,本文所述的通道区段可以与多种不同的流体来源或接受组件中的任一种,包括储槽、管道、歧管或其它系统的流控组件偶联。如所了解,微流体通道结构200可具有其它几何形状。举例来说,微流体通道结构可以具有超过一个通道接点。例如,微流体通道结构可以具有2个、3个、4个或5个通道区段,每个通道区段携带在通道接点会合的珠粒。可以引导流体沿着一个或多个通道或储槽经由一个或多个流体流动单元流动。流体流动单元可以包含压缩机(例如提供正压)、泵(例如提供负压)、致动器等以控制流体流动。流体还可以或另外经由外加压差、离心力、电动抽吸、真空、毛细管或重力流等来控制。
珠粒可以是多孔的、无孔的、固体的、半固体的、半流体的、流体的和/或它们的组合。在一些情况下,珠粒可以是可溶解的、可破裂的和/或可降解的。在一些情况下,珠粒可以不是可降解的。在一些情况下,珠粒可以是凝胶珠粒。凝胶珠粒可以是水凝胶珠粒。凝胶珠粒可以由分子前体、例如聚合物或单体物质形成。半固体珠粒可以是脂质体珠粒。固体珠粒可以包含金属,包括氧化铁、金和银。在一些情况下,珠粒可以是硅石珠粒。在一些情况下,珠粒可以是刚性的。在其它情况下,珠粒可以是柔性和/或可压缩的。
珠粒可以具有任何合适的形状。珠粒形状的实例包括(但不限于)球形、非球形、椭圆形、长方形、非晶形、圆形、圆柱形和它们的变化形式。
珠粒可以具有均一的尺寸或不均一的尺寸。在一些情况下,珠粒的直径可以是至少约10纳米(nm)、100nm、500nm、1微米(μm)、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更大。在一些情况下,珠粒的直径可以小于约10nm、100nm、500nm、1μm、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更少。在一些情况下,珠粒的直径可以在约40-75μm、30-75μm、20-75μm、40-85μm、40-95μm、20-100μm、10-100μm、1-100μm、20-250μm或20-500μm范围内。
在某些方面,珠粒可以呈具有相对单分散性大小分布的一群或多个珠粒提供。在需要在分区内提供相对一致量的试剂的情况下,维持相对一致的珠粒特征,例如尺寸可以有助于整体一致性。具体地说,本文所述的珠粒可具有在横截面尺寸方面具有小于50%、小于40%、小于30%、小于20%和在一些情况下小于15%、小于10%、小于5%或更小的变异系数的大小分布。
珠粒可以包含天然和/或合成材料。举例来说,珠粒可以包含天然聚合物、合成聚合物或天然聚合物与合成聚合物。天然聚合物的实例包括蛋白质和糖,例如脱氧核糖核酸、橡胶、纤维素、淀粉(例如直链淀粉、支链淀粉)、蛋白质、酶、多糖、丝、聚羟基烷基酸酯、壳聚糖、葡聚糖、胶原蛋白、卡拉胶、卵叶车前子、阿拉伯胶、琼脂、明胶、虫胶、梧桐胶、黄原胶、玉米糖胶、瓜尔胶、刺梧桐胶、琼脂糖、海藻酸、海藻酸盐或它们的天然聚合物。合成聚合物的实例包括丙烯酸类、尼龙、硅酮、弹力纤维、粘胶丝、多元羧酸、聚乙酸乙烯酯、聚丙烯酰胺、聚丙烯酸酯、聚乙二醇、聚氨酯、聚乳酸、硅石、聚苯乙烯、聚丙烯腈、聚丁二烯、聚碳酸酯、聚乙烯、聚对苯二甲酸乙二醇酯、聚(氯三氟乙烯)、聚(氧化乙烯)、聚(对苯二甲酸乙二醇酯)、聚乙烯、聚异丁烯、聚(甲基丙烯酸甲酯)、聚(氧亚甲基)、聚甲醛、聚丙烯、聚苯乙烯、聚(四氟乙烯)、聚(乙酸乙烯酯)、聚(乙烯醇)、聚(氯乙烯)、聚(偏二氯乙烯)、聚(偏二氟乙烯)、聚(乙烯基氟)和/或它们的组合(例如共聚物)。珠粒还可以由除聚合物以外的材料形成,包括脂质、胶束、陶瓷、玻璃陶瓷、复合材料、金属、其它无机材料等。
在一些情况下,珠粒可以含有分子前体(例如单体或聚合物),经由分子前体的聚合,可以形成聚合物网络。在一些情况下,前体可以是已经聚合的物质,其能够经由例如化学交联进一步聚合。在一些情况下,前体可以包含丙烯酰胺或甲基丙烯酰胺单体、低聚物或聚合物中的一种或多种。在一些情况下,珠粒可以包含预聚物,预聚物是能够进一步聚合的低聚物。举例来说,聚氨酯珠粒可以使用预聚物制备。在一些情况下,珠粒可以含有能够进一步聚合在一起的个别的聚合物。在一些情况下,珠粒可以经由不同前体的聚合产生,以便珠粒包含混合聚合物、共聚物和/或嵌段共聚物。在一些情况下,珠粒在聚合物前体(例如单体、低聚物、线性聚合物)、核酸分子(例如寡核苷酸)、引物和其它实体之间可以包含共价或离子键。在一些情况下,共价键可以是碳-碳键、硫醚键或碳-杂原子键。
交联可以是永久的或可逆的,取决于使用的具体交联剂。可逆的交联允许聚合物在适当的条件下线性化或解离。在一些情况下,可逆的交联也允许结合于珠粒表面的材料可逆附连。在一些情况下,交联剂可形成二硫键。在一些情况下,形成二硫键的化学交联剂可以是胱胺或修饰胱胺。
在一些情况下,可以在并入珠粒中的分子前体单元(例如单体、低聚物或线性聚合物)或前体与核酸分子(例如寡核苷酸)之间形成二硫键。举例来说,胱胺(包括修饰胱胺)是一种包含二硫键的有机剂,其可以用作珠粒的个别单体或聚合物前体之间的交联剂。聚丙烯酰胺可以在胱胺或包含胱胺的物质(例如修饰胱胺)存在下聚合,以产生包含二硫键的聚丙烯酰胺凝胶珠粒(例如包含可化学还原的交联剂的化学上可降解的珠粒)。二硫键可以允许珠粒在珠粒暴露于还原剂时降解(或溶解)。
在一些情况下,壳聚糖(一种线性多糖聚合物)可以与戊二醛经由亲水链交联,形成珠粒。壳聚糖聚合物的交联可以通过由热、压力、pH值变化和/或放射线引发的化学反应实现。
在一些情况下,珠粒可以包含丙烯酰胺基(acrydite)部分,在某些方面,所述部分可以用于将一种或多种核酸分子(例如条形码序列、条形码化核酸分子、条形码化寡核苷酸、引物或其它寡核苷酸)附连至珠粒。在一些情况下,丙烯酸亚磷酰胺部分可以指在聚合反应期间由丙烯酸亚磷酰胺与一种或多种物质反应,例如丙烯酸亚磷酰胺与其它单体和交联剂反应生成的丙烯酸亚磷酰胺类似物。丙烯酸亚磷酰胺部分可以被修饰成与有待附连的物质,例如核酸分子(例如条形码序列、条形码化核酸分子、条形码化寡核苷酸、引物或其它寡核苷酸)形成化学键。丙烯酸亚磷酰胺部分可以用能够形成二硫键的硫醇基修饰或可以用已经包含二硫键的基团修饰。硫醇或二硫化物(经由二硫化物交换)可以用作有待附连的物质的锚点,或丙烯酸亚磷酰胺部分的另一部分可以用于附连。在一些情况下,附连可以是可逆的,以便在二硫键破裂(例如在还原剂存在下)时从珠粒释放所附连的物质。在其它情况下,丙烯酸亚磷酰胺部分可以包含可以用于附连的反应性羟基。
可以通过各种不同的途径实现珠粒的官能化以附连核酸分子(例如寡核苷酸),所述途径包括活化聚合物内的化学基团、聚合物结构中并入可活化的官能团或在珠粒产生中在预聚物或单体阶段附连。
举例来说,聚合形成珠粒的前体(例如单体、交联剂)可以包含丙烯酸亚磷酰胺部分,以便当产生珠粒时珠粒也包含丙烯酸亚磷酰胺部分。丙烯酸亚磷酰胺部分可以附连至核酸分子(例如寡核苷酸),所述核酸分子可以包括启动序列(例如用于扩增靶标核酸的引物、随机引物、信使RNA的引物序列)和/或一个或多个条形码序列。一个多个条形码序列可以包括对与给定珠粒偶联的所有核酸分子来说是一样的序列和/或在与给定珠粒偶联的所有核酸分子间不同的序列。核酸分子可以并入珠粒中。
在一些情况下,核酸分子可以包含例如用于附连至测序流动池的功能序列,例如用于
测序的P5序列。在一些情况下,核酸分子或其衍生物(例如由核酸分子产生的寡核苷酸或多核苷酸)可以包含另一功能序列,例如用于附连至测序流动池以进行Illumina测序的P7序列。在一些情况下,核酸分子可以包含条形码序列。在一些情况下,引物还可以包含独特分子标识符(UMI)。在一些情况下,引物可以包含用于Illumina测序的R1引物序列。在一些情况下,引物可以包含用于Illumina测序的R2引物序列。此类核酸分子(例如寡核苷酸、多核苷酸等)和其用途,如可用于本公开的组合物、装置、方法和系统的用途的实例提供于美国专利公布No.2014/0378345和2015/0376609中,每篇公布以引用的方式整体并入本文中。
图8说明携带珠粒的条形码的一实例。例如寡核苷酸的核酸分子802可以与珠粒804通过可释放的键806,例如二硫化物连接子偶联。相同珠粒804可以与一种或多种其它核酸分子818、820偶联(例如经由可释放的键)。核酸分子802可以是或包含条形码。如本文中其它地方所述,条形码的结构可以包含许多序列元件。核酸分子802可以包含可以用于后续加工的功能序列808。举例来说,功能序列808可以包括以下中的一种或多种:测序仪特异性的流动池附连序列(例如用于
测序系统的P5序列)和测序引物序列(例如用于
测序系统的R1引物)。核酸分子802可以包含用于将样品(例如DNA、RNA、蛋白质等)条形码化的条形码序列810。在一些情况下,条形码序列810可以是珠粒特异性的,以便条形码序列810对于与相同珠粒804偶联的所有核酸分子(例如包括核酸分子802)来说是共同的。可替代地或此外,条形码序列810可以是分区特异性的,以便条形码序列810对于与分区至相同分区的一个或多个珠粒偶联的所有核酸分子来说是共同的。核酸分子802可以包含特异性启动序列812,例如mRNA特异性启动序列(例如多聚-T序列)、靶向性启动序列和/或随机启动序列。核酸分子802可以包含锚定序列814以确保特异性启动序列812在序列末端(例如mRNA的末端)杂交。举例来说,锚定序列814可以包括核苷酸的随机短序列,例如1聚体、2聚体、3聚体或更长序列,它可以确保多聚-T区段更可能在mRNA的多聚-A尾的序列末端杂交。
核酸分子802可以包含独特分子鉴定序列816(例如独特分子标识符(UMI))。在一些情况下,独特分子鉴定序列816可以包含约5至约8个核苷酸。可替代地,独特分子鉴定序列816可以包含少于约5或多于约8个核苷酸。独特分子鉴定序列816可以是在与单个珠粒(例如珠粒804)偶联的个别的核酸分子(例如802、818、820等)之间变化的独特序列。在一些情况下,独特分子鉴定序列816可以是随机序列(例如随机N聚体序列)。举例来说,UMI可以提供捕获的起始mRNA分子的独特标识符,以允许定量初始表达的RNA的数目。如所了解,虽然图8示出三个与珠粒804的表面偶联的核酸分子802、818、820,但个别珠粒可以与许多个别核酸分子、例如一个至十个至成百上千个乃至几百万个的个别核酸分子偶联。个别核酸分子的相应条形码可以包含共同序列区段或相对共同的序列区段(例如808、810、812等)和在与相同珠粒偶联的不同的个别核酸分子之间可变或独特的序列区段(例如816)。
在操作中,生物颗粒(例如细胞、DNA、RNA等)可以连同负载珠粒804的条形码一起共分区。在分区中条形码化核酸分子802、818、820可以从珠粒804释放。举例来说,在分析样品RNA的情况下,其中一个释放的核酸分子(例如802)的多聚-T区段(例如812)可以与mRNA分子的多聚-A尾杂交。逆转录可产生mRNA的cDNA转录物,所述转录物包括核酸分子802的序列区段808、810、816中的每一个。因为核酸分子802包含锚定序列814,所以其更可能杂交在mRNA的多聚-A尾的序列末端并启动逆转录。在任何给定分区内,个别mRNA分子的所有cDNA转录物都可以包括共同的条形码序列区段810。然而,在给定分区内由不同mRNA分子形成的转录物可以在独特分子鉴定序列812区段(例如UMI区段)变化。有利地,甚至在随后给定分区的内含物的任一次扩增后,不同UMI的数目都可以指示来源于给定分区的mRNA的数量,因此指示来源于生物颗粒(例如细胞)的mRNA的数量。如上所述,转录物可以扩增、清理和测序,以鉴定mRNA的cDNA转录物的序列,以及对条形码区段和UMI区段测序。虽然描述多聚-T引物序列,但其它的靶标或随机启动序列也可以用于启动逆转录反应。同样,虽然描述为释放条形码化寡核苷酸至分区中,但在一些情况下,结合于珠粒(例如凝胶珠粒)的核酸分子可以用于杂交和捕获mRNA在珠粒的固相上,例如以帮助RNA从其它细胞内含物分离。
在一些情况下,包含具有反应性或能够被活化以便变得具有反应性的官能团的前体可以与其它前体聚合,以产生包含活化或可活化的官能团的凝胶珠粒。然后官能团可用于将额外物质(例如二硫化物连接子、引物、其它寡核苷酸等)附连至凝胶珠粒。举例来说,包含羧酸(COOH)基团的一些前体可以与其它前体共聚以形成也包含COOH官能团的凝胶珠粒。在一些情况下,丙烯酸(包含游离COOH基团的物质)、丙烯酰胺和双(丙烯酰基)胱胺可以一起共聚,以产生包含游离COOH基团的凝胶珠粒。凝胶珠粒的COOH基团可以活化(例如经由1-乙基-3-(3-二甲基氨基丙基)碳化二亚胺(EDC)和N-羟基丁二酰亚胺(NHS)或氯化4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓(DMTMM)),以使得其具有反应性(例如对胺官能团具有反应性,其中EDC/NHS或DMTMM用于活化)。然后活化的COOH基团可以与包含有待与珠粒连接的部分的适当物质(例如包含胺官能团的物质,其中羧酸基被活化成能与胺官能团反应)反应。
在聚合物网络中包含二硫键的珠粒可以经由将一些二硫键还原成游离硫醇而用额外物质官能化。二硫键可以经由例如还原剂(例如DTT、TCEP等)作用而还原,产生游离硫醇基,且不溶解珠粒。然后珠粒的游离硫醇可以与包含另一二硫键的物质的游离硫醇反应(例如经由硫醇-二硫化物交换),以便物质可以连接于珠粒(例如经由生成的二硫键)。在一些情况下,珠粒的游离硫醇可以与任何其它的合适基团反应。举例来说,珠粒的游离硫醇可以与包含丙烯酸亚磷酰胺部分的物质反应。珠粒的游离硫醇基可以与丙烯酸亚磷酰胺经由迈克尔加成化学(Michael addition chemistry)反应,以便包含丙烯酸亚磷酰胺的物质连接于珠粒。在一些情况下,通过包括硫醇封端剂,例如N-乙基顺丁烯二酰亚胺或碘乙酸酯来防止失控反应。
珠粒内二硫键的活化可以经过控制,使得仅仅少量的二硫键被活化。控制可以例如通过控制用于产生游离硫醇基的还原剂的浓度和/或用于在珠粒聚合中形成二硫键的试剂的浓度来进行。在一些情况下,低浓度(例如还原剂:凝胶珠粒比率小于或等于约1:100,000,000,000、小于或等于约1:10,000,000,000、小于或等于约1:1,000,000,000、小于或等于约1:100,000,000、小于或等于约1:10,000,000、小于或等于约1:1,000,000、小于或等于约1:100,000、小于或等于约1:10,000的分子)的还原剂可以用于还原。控制被还原为游离硫醇的二硫键的数目可用于确保官能化期间珠粒结构的完整性。在一些情况下,例如荧光染料的光学活性剂可以与珠粒经由珠粒的游离硫醇基偶联并用于定量珠粒中存在的游离硫醇的数目和/或追踪珠粒。
在一些情况下,在凝胶珠粒形成之后部分加入至凝胶珠粒中可能是有利的。举例来说,在凝胶珠粒形成后寡核苷酸(例如条形码化寡核苷酸)的加入可以避免在可能在聚合期间发生的链转移终止期间物质的损失。此外,较小的前体(例如不包含侧链基团和连接的部分的单体或交联剂)可以用于聚合并且由于粘滞效应,可以最低限度地被阻止链端生长。在一些情况下,凝胶珠粒合成后的官能化可以最低程度地使物质(例如寡核苷酸)暴露于可能破坏剂(例如自由基)负载和/或化学环境。在一些情况下,生成的凝胶可以具有上临界溶解温度(UCST),所述温度允许温度驱动的珠粒膨胀和收缩。此类官能基可以帮助寡核苷酸(例如引物)在随后珠粒经寡核苷酸官能化期间浸润至珠粒中。产生后官能化也可用于控制珠粒中物质的荷载比,以使得例如荷载比的变化性减到最少。物质负载也可以呈分批工艺进行,以使得在单批中多个珠粒可以用物种官能化。
注入或以其它方式引入至分区中的珠粒可以包含可释放的方式、可裂解地或可逆地附连的条形码。注入或以其它方式引入至分区中的珠粒可以包含可活化的条形码。注入或以其它方式引入至分区中的珠粒可以是可降解的、可破坏的或可溶解的珠粒。
条形码可以用可释放的方式、可裂解地或可逆地附连至珠粒,以便可以通过条形码分子与珠粒之间的键的裂解,释放条形码或可释放条形码,或通过基础珠粒本身的降解,允许其它试剂接近条形码或可接近条形码而释放,或两者。在非限制性实例中,可以通过还原二硫键、使用限制酶、光活化裂解或经由其它类型的刺激(例如化学、热、pH值、酶促等)和/或反应(例如本文中其它地方所述)裂解来实现裂解。可释放的条形码有时可称为可活化,因为其一旦释放即可用于反应。因此,例如,可活化的条形码可以通过从珠粒(或本文所述的其它合适类型的分区)释放条形码而活化。在所述方法和系统的背景下还设想其它可活化的构型。
除了珠粒与缔合分子(例如含条形码化核酸分子(例如条形码化寡核苷酸)之间的可裂解键外或作为替代,珠粒可以是自发地或在暴露于一种或多种刺激(例如温度变化、pH值变化、暴露于具体的化学物质或相、曝光、还原剂等)后是可降解的、可破坏的或可溶解的。在一些情况下,珠粒可以是可溶解的,以使得在暴露于具体的化学物质或环境变化,例如温度变化或pH值变化时珠粒的材料组分溶解。在一些情况下,凝胶珠粒可以在高温下和/或在碱性条件下降解或溶解。在一些情况下,珠粒可以热降解,以使得当珠粒暴露于适当的温度变化(例如热)时,珠粒降解。结合于物质(例如核酸分子,例如条形码化寡核苷酸)的珠粒的降解或溶解可以引起物质从珠粒释放。
如从以上公开内容所了解,珠粒的降解可指结合或夹带的物质从珠粒解离,在结构上降解和未降解实体珠粒本身。举例来说,珠粒的降解可以涉及可裂解键经由本文中其它地方所述的一种或多种物质和/或方法的裂解。在另一个实例中,夹带的物质可以通过由于例如化学环境变化而产生的渗透压差从珠粒释放。举例来说,由于渗透压差引起的珠粒孔径改变一般在无珠粒本身的结构降解下发生。在一些情况下,由于珠粒的渗透膨胀而引起的孔径增加可允许夹带的物质在珠粒内释放。在其它情况下,珠粒的渗透缩小会由于孔径收缩而使珠粒更好地夹持所夹带的物质。
可降解的珠粒可以引入至分区、例如乳液的液滴或孔中,以使得珠粒在分区内降解并且当施加适当的刺激时任何缔合的物质(例如寡核苷酸)在液滴内释放。游离物质(例如寡核苷酸、核酸分子)可以与分区中所含的其它试剂相互作用。举例来说,包含胱胺被经由二硫键连接至条形码序列的聚丙烯酰胺珠粒可以与还原剂组合在油包水乳液的液滴内。在液滴内,还原剂可以使多个二硫键断裂,引起珠粒降解和条形码序列释放至液滴的水性内部环境中。在另一个实例中,在碱性溶液中包含与珠粒结合的条形码序列的液滴的加热也会引起珠粒降解和所附连的条形码序列释放至液滴的水性内部环境中。
任何合适数目的分子标签分子(例如引物、条形码化寡核苷酸)可以与珠粒缔合,以便在从珠粒释放后,分子标签分子(例如引物,例如条形码化寡核苷酸)以预先界定的浓度存在于分区中。可以选择此类预先界定的浓度,以促进分区内用于产生测序文库的某些反应,例如扩增。在一些情况下,引物的预先界定的浓度可以通过产生负载核酸分子(例如寡核苷酸)的珠粒的过程限制。
在一些情况下,珠粒可以用一种或多种试剂非共价负载。珠粒可以通过例如使珠粒经受足以使珠粒膨胀,允许试剂足够时间扩散至珠粒内部并且使珠粒经受足以使珠粒退胀的条件来非共价负载。珠粒的膨胀可以例如通过将珠粒放在热力学有利的溶剂中,使珠粒经受较高或较低的温度,使珠粒经受较高或较低的离子浓度,和/或使珠粒经受电场来实现。珠粒的膨胀可以通过多种膨胀方法实现。珠粒的退胀可以例如通过将珠粒转移在热力学不利的溶剂中,使珠粒经受较低或高的温度,使珠粒经受较低或较高的离子浓度,和/或去除电场来实现。珠粒的退胀可以通过多种退胀法实现。转移珠粒可引起珠粒的孔缩小。然后缩小可以阻碍珠粒内的试剂从珠粒内部扩散。阻碍可能是由于试剂与珠粒内部之间的空间相互作用。转移可以通过微流体方式实现。举例来说,转移可以通过将珠粒从一个同向流动溶剂流移动至不同的同向流动溶剂流来实现。珠粒的可膨胀性和/或孔径可以通过改变珠粒的聚合物组成来调整。
在一些情况下,连接于前体的丙烯酸亚磷酰胺部分、连接于前体的另一物质或前体本身可以包含不稳定键,例如化学、热或光敏性键,例如二硫键、UV敏感键等。一旦丙烯酸亚磷酰胺部分或包含不稳定键的其它部分并入珠粒中,珠粒也可能包含不稳定键。不稳定键例如可用于可逆地连接(例如共价连接)物质(例如条形码、引物等)至珠粒。在一些情况下,热不稳定键可以包括基于核酸杂交的附连,例如其中寡核苷酸与附连至珠粒的互补序列杂交,使得杂交物的热熔融从珠粒或微胶囊释放寡核苷酸,例如含条形码化序列。
多种不稳定键加入至凝胶珠粒可产生能够对变化的刺激作出反应的珠粒。每一种不稳定键可能对相关刺激(例如化学刺激、光、温度、酶等)敏感,以使得经由每个不稳定键附连至珠粒的物质的释放可以通过施加适当的刺激来控制。此类官能团可用于控制物质从凝胶珠粒释放。在一些情况下,包含不稳定键的另一物质可以在凝胶珠粒形成后经由例如如上所述的凝胶珠粒的活化官能团连接于凝胶珠粒。如所了解,本文所述的用可释放的方式、可裂解地或可逆地附连至珠粒的条形码包括通过条形码分子与珠粒之间的键的裂解释放或可释放的条形码,或通过基础珠粒本身的降解,允许其它试剂接近或可接近而释放的条形码,或两者。
如本文所述可释放的条形码有时可称为可活化,因为其一旦释放即可用于反应。因此,例如,可活化的条形码可以通过从珠粒(或本文所述的其它合适类型的分区)释放条形码而活化。在所述方法和系统的背景下还设想其它可活化的构型。
除可热裂解的键、二硫键和UV敏感的键外,可以与前体或珠粒偶联的不稳定键的其它非限制性实例包括酯键(例如可用酸、碱或羟胺裂解)、邻近二醇键(例如可经由高碘酸钠裂解)、狄尔斯-阿德耳键(Diels-Alder linkage)(例如可经由热裂解)、砜键(例如可经由碱裂解)、甲硅烷基醚键(例如可经由酸裂解)、糖苷键(例如可经由淀粉酶裂解)、肽键(例如可经由蛋白酶裂解)或磷酸二酯键(例如可经由核酸酶(例如DNA酶)裂解)。键可以经由其它核酸靶向酶,例如限制酶(例如限制核酸内切酶)裂解,如下文所述。
在珠粒产生期间(例如在前体聚合期间)物质可以包封在珠粒中。此类物质可参与或不参与聚合。此类物质可以进入聚合反应混合物中,以便在珠粒形成后生成的珠粒包含所述物质。在一些情况下,此类物质可以在形成后加入至凝胶珠粒中。此类物质可以包括例如核酸分子(例如寡核苷酸)、用于核酸扩增反应的试剂(例如引物、聚合酶、dNTP、辅因子(例如离子辅因子)、缓冲剂)(包括本文所述的那些试剂)、用于酶促反应的试剂(例如酶、辅因子、底物、缓冲剂)、用于例如聚合、接合或消化的核酸修饰反应的试剂和/或用于模板制备(例如标签化)以供一个或多个测序平台(例如
的
)使用的试剂。此类物质可以包括本文所述的一种或多种酶,包括不限于聚合酶、逆转录酶、限制酶(例如核酸内切酶)、转座酶、连接酶、蛋白酶K、DNA酶等。此类物质可以包括本文中其它地方所述的一种或多种试剂(例如溶解剂、抑制剂、灭活剂、螯合剂、刺激)。此类物质的捕集可以通过在前体聚合期间生成的聚合物网络密度、凝胶珠粒内离子电荷的控制(例如经由连接于聚合物质的离子物质)或通过释放其它物质来控制。包封的物质可以在珠粒降解后和/或通过施加能够将物质从珠粒释放的刺激而从珠粒释放。可替代地或此外,物质可以在分区形成期间或之后分区在分区(例如液滴)中。此类物质可以包括不限于以上提及的也可以包封在珠粒中的物质。
可降解的珠粒可以包含具有不稳定键的一种或多种物质,以使得当珠粒/物质暴露于适当的刺激时键断裂且珠粒降解。不稳定键可以是化学键(例如共价键、离子键),或可以是另一类型的物理相互作用(例如范德华相互作用(van der Waals interaction)、偶极-偶极相互作用等)。在一些情况下,用于产生珠粒的交联剂可以包含不稳定键。在暴露于适当的条件后,不稳定键会断裂且珠粒降解。举例来说,在包含胱胺交联剂的聚丙烯酰胺凝胶珠粒暴露于还原剂后,胱胺的二硫键会断裂且珠粒降解。
与不降解的珠粒相比,当适当的刺激施加于珠粒时,可降解的珠粒可用于更迅速地从珠粒释放所附连的物质(例如核酸分子、条形码序列、引物等)。举例来说,对于结合于多孔珠粒的内表面的物质或在包封的物质的情况下,在珠粒降解后在溶解状态下物质可具有更大的移动性和其它物质的可接近性。在一些情况下,物质也可以经由可降解的连接子(例如二硫化物连接子)附连至可降解的珠粒。可降解的连接子可以对与可降解的珠粒相同的刺激作出反应或两种可降解的物质可以对不同的刺激作出反应。举例来说,条形码序列可以经由二硫键附连至包含胱胺的聚丙烯酰胺珠粒。在条形码化珠粒暴露于还原剂后,珠粒降解并且在条形码序列与珠粒之间的二硫键和珠粒中的胱胺的二硫键断裂后释放条形码序列。
如从以上公开内容所了解,虽然称为珠粒的降解,但在如上所述的许多情况下所述降解可指结合或夹带的物质从珠粒解离,在结构上降解和未降解实体珠粒本身。举例来说,夹带的物质可以通过由于例如化学环境变化而产生的渗透压差从珠粒释放。举例来说,由于渗透压差引起的珠粒孔径改变一般在无珠粒本身的结构降解下发生。在一些情况下,由于珠粒的渗透膨胀而引起的孔径增加可允许夹带的物质在珠粒内释放。在其它情况下,珠粒的渗透缩小会由于孔径收缩而使珠粒更好地夹持所夹带的物质。
在提供可降解的珠粒下,避免将此类珠粒暴露于在给定时间前引起此类降解的刺激是有益的,以例如避免过早的珠粒降解和由此类降解产生的问题,包括例如差的流动特性和聚集。举例来说,在珠粒包含可还原的交联基团、例如二硫基的情况下,将需要避免此类珠粒与例如DTT或其它使二硫键裂解的试剂的还原剂接触。在这种情况下,对本文所述的珠粒的处理将在一些情况下在无例如DTT的还原剂下提供。因为还原剂常常提供于商业酶制剂中,所以可能需要提供不含还原剂(或不含DTT)的酶制剂来处理本文所述的珠粒。此类酶的实例包括例如聚合酶酶制剂、逆转录酶酶制剂、连接酶酶制剂以及许多可以用于处理本文所述的珠粒的其它酶制剂。术语“不含还原剂”或“不含DTT”的制剂可指对于在降解珠粒中使用的此类材料,具有少于约1/10、少于约1/50或甚至少于约1/100的较低范围的制剂。举例来说,对于DTT,不含还原剂的制剂可以具有少于约0.01毫摩尔(mM)、0.005mM、0.001mM DTT、0.0005mM DTT或甚至少于约0.0001mM DTT。多数情况下,DTT的量可能是不可检测的。
许多的化学触发剂可以用于触发珠粒的降解。这些化学变化的实例可包括(但不限于)pH介导的对珠粒内组分的完整性的改变、经由交联键的裂解的珠粒组分的降解和珠粒组分的解聚。
在一些实施方案中,珠粒可以由包含可降解的化学交联剂、例如BAC或胱胺的材料形成。此类可降解的交联剂的降解可以通过许多机制实现。在一些实例中,珠粒可以与化学降解剂接触,所述化学降解剂可诱发氧化、还原或其它化学变化。举例来说,化学降解剂可以是还原剂,例如二硫苏糖醇(DTT)。还原剂的额外实例可包括β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫基丁胺或DTBA)、三(2-羧乙基)瞵(TCEP)或它们的组合。还原剂可以降解在形成珠粒的凝胶前体之间形成的二硫键,因此降解珠粒。在其它情况下,溶液pH值的变化、例如pH值的增加会触发珠粒的降解。在其它情况下,暴露于水溶液、例如水会触发水解降解,因此降解珠粒。在一些情况下,刺激的任何组合可以触发珠粒的降解。举例来说,pH值的变化可以能够使化学剂(例如DTT)变成有效还原剂。
还可以在施加热刺激后诱导珠粒释放其内含物。温度的变化可以引起珠粒的多种变化。举例来说,热会引起固体珠粒液化。热变化会引起珠粒熔融,使得珠粒的一部分降解。在其它情况下,热可增加珠粒组分的内部压力,使得珠粒破裂或爆炸。热还可以作用于用作构建珠粒的材料的热敏性聚合物。
任何合适的剂都可以降解珠粒。在一些实施方案中,温度或pH值的变化可以用于降解珠粒内的热敏性或pH值敏感性键。在一些实施方案中,化学降解剂可以用于通过氧化、还原或其它的化学变化降解珠粒内的化学键。举例来说,化学降解剂可以是还原剂,例如DTT,其中DTT可以降解在交联剂与凝胶前体之间形成的二硫键,因此降解珠粒。在一些实施方案中,可以加入还原剂以降解珠粒,这可能引起或不引起珠粒释放其内含物。还原剂的实例可以包括二硫苏糖醇(DTT)、β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫基丁胺或DTBA)、三(2-羧乙基)瞵(TCEP)或它们的组合。还原剂可以呈约0.1mM、0.5mM、1mM、5mM、10mM的浓度存在。还原剂可以呈至少约0.1mM、0.5mM、1mM、5mM、10mM或大于10mM的浓度存在。还原剂可以呈至多约10mM、5mM、1mM、0.5mM、0.1mM或更小的浓度存在。
任何合适数目的分子标签分子(例如引物、条形码化寡核苷酸)可以与珠粒缔合,以便在从珠粒释放后,分子标签分子(例如引物,例如条形码化寡核苷酸)以预先界定的浓度存在于分区中。可以选择此类预先界定的浓度,以促进分区内用于产生测序文库的某些反应,例如扩增。在一些情况下,引物的预先界定的浓度可以通过产生负载寡核苷酸的珠粒的过程限制。
虽然在上文中图1和图2已经就提供基本上单个被占用的分区进行描述,但是在某些情况下,可能需要提供多重被占用的分区,例如在单个分区内含有两个、三个、四个或更多个包含条形码化核酸分子(例如寡核苷酸)的细胞和/或微胶囊(例如珠粒)。因此,如上所述,可以控制含有流体和分区流体的生物颗粒和/或珠粒的流动特性以提供此类多重被占用的分区。具体地说,可以控制流动参数以提供大于约50%分区、大于约75%且在一些情况下大于约80%、90%、95%或更高的给定占用率。
在一些情况下,额外的微胶囊可用于递送额外的试剂至分区。在此情况下,宜通过进入共同通道或液滴生成接点(例如接点210)的不同的通道进口从不同的珠粒来源(例如含有不同的相关试剂)将不同的珠粒引入此类共同通道或液滴生成接点。在这种情况下,可以控制不同珠粒进入通道或接点的流速和频率,以提供一定比率的来自每个来源的微胶囊,同时确保此类珠粒与给定数目的生物颗粒的给定配对或组合进入分区(例如每个分区一个生物颗粒和一个珠粒)。
本文所述的分区可以包含小体积,例如少于约10微升(μL)、5μL、1μL、900皮升(pL)、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL、500纳升(nL)、100nL、50nL或更少。
举例来说,在基于液滴的分区的情况下,液滴可具有少于约1000pL、900pL、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL或更少的总体积。在与微胶囊共分区的情况下,应了解,分区内的样品流体体积,例如包括共分区的生物颗粒和/或珠粒,可以少于上述体积的约90%、少于上述体积的约80%、少于约70%、少于约60%、少于约50%、少于约40%、少于约30%、少于约20%或少于约10%。
如本文中其它地方所述,分区物质可以产生一群或多个分区。在这种情况下,可以产生或以其它方式提供任何合适数目的分区。举例来说,可以产生或以其它方式提供至少约1,000个分区、至少约5,000个分区、至少约10,000个分区、至少约50,000个分区、至少约100,000个分区、至少约500,000个分区、至少约1,000,000个分区、至少约5,000,000个分区至少约10,000,000个分区、至少约50,000,000个分区、至少约100,000,000个分区、至少约500,000,000个分区、至少约1,000,000,000个分区或更多个分区。此外,多个分区可以包含未被占用的分区(例如空的分区)和被占用的分区。
试剂
根据某些方面,生物颗粒可以连同溶解试剂一起分区,以在分区内释放生物颗粒的内含物。在这种情况下,可以与生物颗粒引入分区接点/液滴生成区(例如接点210)中同时或在生物颗粒即将引入分区接点/液滴生成区中前,例如通过额外通道或通道接点上游的通道使溶解剂与生物颗粒悬浮液接触。根据其它方面,另外或可替代地,生物颗粒可以连同其它试剂一起分区,如下文进一步描述。
图3示出用于共分区生物颗粒和试剂的微流体通道结构300的一实例。通道结构300可以包括通道区段301、302、304、306和308。通道区段301和302在第一通道接点309连通。通道区段302、304、306和308在第二通道接点310连通。
在一个示例操作中,通道区段301可以沿着通道区段301输送包括多个生物颗粒314的水性流体312至第二接点310中。作为替代或除此之外,通道区段301可以输送珠粒(例如凝胶珠粒)。珠粒可以包含条形码分子。
举例来说,通道区段301可以连接至包含生物颗粒314的水性悬浮液的储槽。在第二接点310上游和即将到达所述第二接点时,通道区段301可以与通道区段302在第一接点309会合。通道区段302可以沿着通道区段302输送悬浮在水性流体312中的多个试剂315(例如溶解剂)至第一接点309中。举例来说,通道区段302可以连接至包含试剂315的储槽。在第一接点309后,通道区段301中的水性流体312可以携带生物颗粒314和试剂315至第二接点310。在一些情况下,通道区段301中的水性流体312可以包括一种或多种试剂,所述试剂可以是与试剂315相同或不同的试剂。与水性流体312(例如油)不混溶的第二流体316可以从通道区段304和306每一个通道区段递送至第二接点310。在来自通道区段301的水性流体312与来自通道区段304和306每一个通道区段的第二流体316会合在第二通道接点310后,水性流体312可以在第二流体316中被分区为不连续的液滴318并且沿着通道区段308从第二接点310流走。通道区段308可以递送不连续的液滴318至与通道区段308以流体方式偶联的出口储槽,在所述储槽中可以收获液滴。
第二流体316可以包含油,例如氟化油,氟化油包括用于稳定所得到的液滴,例如抑制随后所得到的液滴318凝聚的氟表面活性剂。
生成的不连续的液滴可以包括单独的生物颗粒314和/或一种或多种试剂315。在一些情况下,例如经由本文中其它地方所述的其它微流体结构,生成的不连续的液滴可能包括携带条形码的珠粒(未示)。在一些情况下,不连续的液滴可以未被占用(例如没有试剂、没有生物颗粒)。
有利地,当溶解试剂和生物颗粒共分区时,溶解试剂可以促进分区内生物颗粒的内含物的释放。分区中释放的内含物仍然可以与其它分区的内含物不连续。
如所了解,本文所述的通道区段可以与多种不同的流体来源或接受组件中的任一种,包括储槽、管道、歧管或其它系统的流控组件偶联。如所了解,微流体通道结构300可具有其它几何形状。举例来说,微流体通道结构可以具有超过两个通道接点。例如,微流体通道结构可以具有2个、3个、4个或5个通道区段或更多个,每个通道区段携带相同或不同类型的在通道接点会合的珠粒、试剂和/或生物颗粒。可以控制每个通道区段中的流体流动以控制不同要素分区至液滴。可以引导流体沿着一个或多个通道或储槽经由一个或多个流体流动单元流动。流体流动单元可以包含压缩机(例如提供正压)、泵(例如提供负压)、致动器等以控制流体流动。流体还可以或另外经由外加压差、离心力、电动抽吸、真空、毛细管或重力流等来控制。
溶解剂的实例包括生物活性试剂,例如用于溶解例如革兰氏阳性或阴性细菌、植物、酵母、哺乳动物等不同细胞类型的溶解酶,例如溶菌酶、消色肽酶、溶葡球菌酶、labiase、kitalase、lyticase和多种其它的可以从例如Sigma-Aldrich公司(St Louis,MO)获得的溶解酶,以及其它的市售溶解酶。另外或可替代地,其它的溶解剂可以与生物颗粒共分区,引起生物颗粒的内含物释放至分区中。举例来说,在一些情况下,基于表面活性剂的溶解溶液可以用于溶解细胞,不过这些对于基于乳液的系统来说可能不太合乎需要,其中表面活性剂会干扰稳定乳液。在一些情况下,溶解溶液可以包括非离子型表面活性剂,例如TritonX-100和Tween 20。在一些情况下,溶解溶液可以包括非离子型表面活性剂,例如十二烷基肌氨酸钠和十二烷基硫酸钠(SDS)。在某些情况下还可以使用电穿孔、热、声音或机械细胞破碎,例如非基于乳化的分区,例如除液滴分区外或代替液滴分区的生物颗粒的包封,其中包封材料的任何孔径足够小以在细胞破碎后夹持给定尺寸的核酸片段。
可替代地或除上述的与生物颗粒共分区的溶解剂外,其它试剂也可以与生物颗粒共分区,包括例如DNA酶和RNA酶灭活剂或抑制剂,例如蛋白酶K、螯合剂、例如EDTA,和其它用于去除或以其它方式降低不同细胞溶解产物组分对核酸后续加工的消极活性或影响的试剂。此外,在包封的生物颗粒的情况下,生物颗粒可以暴露于适当的刺激以从共分区的微胶囊释放生物颗粒或它们的内含物。举例来说,在一些情况下,化学刺激可以连同包封的生物颗粒一起共分区以允许微胶囊降解和细胞或它的内含物释放至较大的分区中。在一些情况下,这个刺激可以与本文中其它地方所述的用于将核酸分子(例如寡核苷酸)从其相应的微胶囊(例如珠粒)释放的刺激相同。在替代方面,这个刺激可以是不同的和不相重叠的刺激,以允许包封的生物颗粒在与核酸分子释放至同一分区不同的时间释放至分区中。
额外的试剂也可以与生物颗粒共分区,例如用于将生物颗粒的DNA分段的核酸内切酶、DNA聚合酶和用于扩增生物颗粒的核酸片段和将条形码分子标签附连至扩增片段的dNTP。其它的酶可以共分区,包括不限于聚合酶、转座酶、连接酶、蛋白酶K、DNA酶等。额外的试剂还可以包括逆转录酶(包括具有末端转移酶活性的酶)、引物和寡核苷酸,和可用于模板切换的切换寡核苷酸(本文中又称为“切换寡核苷酸”或“模板切换寡核苷酸”)。在一些情况下,模板切换可用于增加cDNA的长度。在一些情况下,模板切换可用于将预先确定的核酸序列附加至cDNA。在模板切换的一个实例中,可以由例如细胞mRNA的模板的逆转录产生cDNA,其中具有末端转移酶活性的逆转录酶可以用非模板依赖性方式添加例如多聚C的额外的核苷酸至cDNA。切换寡核苷酸可以包括与额外核苷酸互补的序列,例如多聚G。cDNA上的额外核苷酸(例如多聚C)可以与切换寡核苷酸上的额外核苷酸(例如多聚G)杂交,其中切换寡核苷酸可以被逆转录酶用作模板以进一步延长cDNA。模板切换寡核苷酸可以包含杂交区和模板区。杂交区可以包含能够与靶标杂交的任何序列。在一些情况下,如前所述,杂交区包含一系列G碱基,在cDNA分子的3'末端与悬垂C碱基互补。一系列G碱基可以包含1个G碱基、2个G碱基、3个G碱基、4个G碱基、5个G碱基或超过5个G碱基。模板序列可以包含将并入cDNA中的任何序列。在一些情况下,模板区包含至少1个(例如至少2个、3个、4个、5个或更多个)标签序列和/或功能序列。切换寡核苷酸可以包含脱氧核糖核酸;核糖核酸;修饰核酸,包括2-氨基嘌呤、2,6-二氨基嘌呤(2-氨基-dA)、反向dT、5-甲基dC、2'-脱氧肌苷、Super T(5-羟基丁炔-2'-脱氧尿苷)、Super G(8-氮杂-7-脱氮鸟苷)、锁核酸(LNA)、解锁核酸(UNA,例如UNA-A、UNA-U、UNA-C、UNA-G)、Iso-dG、Iso-dC、2'氟碱基(例如氟基C、氟基U、氟基A和氟基G)或任何组合。
在一些情况下,切换寡核苷酸的长度可以是至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、121个、122个、123个、124个、125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个、137个、138个、139个、140个、141个、142个、143个、144个、145个、146个、147个、148个、149个、150个、151个、152个、153个、154个、155个、156个、157个、158个、159个、160个、161个、162个、163个、164个、165个、166个、167个、168个、169个、170个、171个、172个、173个、174个、175个、176个、177个、178个、179个、180个、181个、182个、183个、184个、185个、186个、187个、188个、189个、190个、191个、192个、193个、194个、195个、196个、197个、198个、199个、200个、201个、202个、203个、204个、205个、206个、207个、208个、209个、210个、211个、212个、213个、214个、215个、216个、217个、218个、219个、220个、221个、222个、223个、224个、225个、226个、227个、228个、229个、230个、231个、232个、233个、234个、235个、236个、237个、238个、239个、240个、241个、242个、243个、244个、245个、246个、247个、248个、249个或250个核苷酸或更长。
在一些情况下,切换寡核苷酸的长度可以是至多约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、121个、122个、123个、124个、125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个、137个、138个、139个、140个、141个、142个、143个、144个、145个、146个、147个、148个、149个、150个、151个、152个、153个、154个、155个、156个、157个、158个、159个、160个、161个、162个、163个、164个、165个、166个、167个、168个、169个、170个、171个、172个、173个、174个、175个、176个、177个、178个、179个、180个、181个、182个、183个、184个、185个、186个、187个、188个、189个、190个、191个、192个、193个、194个、195个、196个、197个、198个、199个、200个、201个、202个、203个、204个、205个、206个、207个、208个、209个、210个、211个、212个、213个、214个、215个、216个、217个、218个、219个、220个、221个、222个、223个、224个、225个、226个、227个、228个、229个、230个、231个、232个、233个、234个、235个、236个、237个、238个、239个、240个、241个、242个、243个、244个、245个、246个、247个、248个、249个或250个核苷酸。
一旦细胞的内含物释放至其相应的分区中,其中含有的大分子组分(例如生物颗粒的大分子成分,例如RNA、DNA或蛋白质)可以进一步在分区内加工。根据本文所述的方法和系统,个别生物颗粒的大分子组分内含物可以装有独特标识符,以便在表征那些大分子组分后,它们可以被归于源自于相同生物颗粒。通过独特标识符具体分派至单独的生物颗粒或成组生物颗粒,能够将特征归于单独的生物颗粒或成组生物颗粒。例如呈核酸条形码形式的独特标识符可以分派至单独的生物颗粒或成群生物颗粒或与之相关,以用独特标识符标志或标记生物颗粒的大分子组分(因此其特征)。然后这些独特标识符可以将生物颗粒的组分和特征归于单独的生物颗粒或成组生物颗粒。
在一些方面,这通过将单独的生物颗粒或成组生物颗粒与独特标识符共分区来进行,如上所述(参考图2)。在一些方面,独特标识符呈核酸分子(例如寡核苷酸)形式提供,所述形式包含可以附连至或以其它方式缔合个别生物颗粒的核酸内含物或生物颗粒的其它组分和尤其那些核酸的片段的核酸条形码序列。核酸分子经过分区,使得在给定分区中的核酸分子之间,其中所含的核酸条形码序列是相同的,但在不同的分区之间,核酸分子可以具有并且确实具有不同的条形码序列,或至少表示在给定分析中的所有分区间大量不同的条形码序列。在一些方面,仅仅一个核酸条形码序列可以与给定分区有关,不过在一些情况下,可以存在两个或更多个不同的条形码序列。
在核酸分子(例如寡核苷酸)的序列内核酸条形码序列可以包括约6至约20个或更多个核苷酸。核酸条形码序列可以包括约6至约20个、30个、40个、50个、60个、70个、80个、90个、100个或更多个核苷酸。在一些情况下,条形码序列的长度可以是约6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个核苷酸或更长。在一些情况下,条形码序列的长度可为至少约6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个核苷酸或更长。在一些情况下,条形码序列的长度可为至多约6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个核苷酸或更短。这些核苷酸可以是完全相连的,即呈单段相邻核苷酸,或它们可以分成两个或更多个单独子序列,这些子序列被1个或多个核苷酸隔开。在一些情况下,分隔开的条形码子序列长度可为约4至约16个核苷酸。在一些情况下,条形码子序列可为约4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个核苷酸或更长。在一些情况下,条形码子序列可为至少约4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个核苷酸或更长。在一些情况下,条形码子序列可为至多约4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个核苷酸或更短。
共分区的核酸分子还可以包含其它可用于从共分区的生物颗粒加工核酸的功能序列。这些序列包括例如用于从分区内的个别生物颗粒扩增基因组DNA同时附连所缔合的条形码序列的靶向性或随机/通用扩增引物序列、测序引物识别位点、例如用于鉴定序列的存在或拉下条形码化核酸的杂交或探针序列、或许多其它潜在的功能序列中的任一种。还可以采用其它的共分区寡核苷酸的机制,包括例如凝聚两个或更多个液滴,其中一个液滴含有寡核苷酸;或寡核苷酸微分散至微流体系统内的分区、例如液滴中。
在一个实例中,提供例如珠粒的微胶囊,每个微胶囊包括大量的以可释放的方式附连至珠粒的上述条形码化核酸分子(例如条形码化寡核苷酸),其中所有附连至具体的珠粒的核酸分子将包括相同的核酸条形码序列,但其中在所用的珠粒群体中表示很多不同的条形码序列。在一些实施方案中,例如包含聚丙烯酰胺聚合物基质的水凝胶珠粒用作核酸分子的固体载体和递送至分区的工具,因为它们能够携带大量的核酸分子,并且可被配置成在暴露于如本文中其它地方所述的具体刺激后释放那些核酸分子。在一些情况下,珠粒群体提供了多变化的条形码序列文库,所述文库包括至少约1,000个不同条形码序列、至少约5,000个不同条形码序列、至少约10,000个不同条形码序列、至少约50,000个不同条形码序列、至少约100,000个不同条形码序列、至少约1,000,000个不同条形码序列、至少约5,000,000个不同条形码序列、或至少约10,000,000个不同条形码序列或更多。另外,每个珠粒可以附连有大量的核酸(例如寡核苷酸)分子。具体地说,个别珠粒上包括条形码序列的核酸分子的分子数目可为至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子和在一些情况下至少约10亿个核酸分子或更多。给定珠粒的核酸分子可以包括相同(或共同)条形码序列、不同条形码序列或两者的组合。给定珠粒的核酸分子可以包括多组核酸分子。给定组的核酸分子可以包括相同条形码序列。相同条形码序列可以不同于另一组的核酸分子的条形码序列。
此外,当珠粒群体分区时,所得到的分区群体也可以包括多变化的条形码文库,所述文库包括至少约1,000个不同条形码序列、至少约5,000个不同条形码序列、至少约10,000个不同条形码序列、至少至少约50,000个不同条形码序列、至少约100,000个不同条形码序列、至少约1,000,000个不同条形码序列、至少约5,000,000个不同条形码序列或至少约10,000,000个不同条形码序列。另外,所述群体的每个分区可以包括至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子和一些情况下至少约10亿个核酸分子。
在一些情况下,可能需要在给定分区内并入多个不同的条形码,所述条形码附连至分区内的单个或多个珠粒。举例来说,在一些情况下,例如通过为给定分区提供条形码的更强阐明或归属,混合但已知的一组条形码序列可以更大地保证后续加工的鉴定,作为来自给定分区的输出的重复或独立证实。
在向珠粒施加具体的刺激后,核酸分子(例如寡核苷酸)可从珠粒释放。在一些情况下,刺激可以是光刺激,例如通过光不稳定的键的裂解,释放核酸分子。在其它情况下,可以使用热刺激,其中珠粒环境的温度上升将引起键的裂解或核酸分子从珠粒的其它释放。在其它情况下,可以使用化学刺激,所述化学刺激使核酸分子连接至珠粒的键裂解或以其它方式引起核酸分子从珠粒释放。在一情况下,此类组合物包括上文关于生物颗粒包封所述的聚丙烯酰胺基质,并且可以通过暴露于例如DTT的还原剂而降解以释放所附连的核酸分子。
在一些方面,提供了用于控制分区的系统和方法。液滴尺寸可以通过调整通道构造(例如微流体通道构造)的某些几何特征来控制。举例来说,可以调整通道的扩展角、宽度和/或长度以控制液滴尺寸。
图4示出用于控制珠粒分区至不连续的液滴的微流体通道结构的一实例。通道结构400可以包括通道区段402,所述通道区段与储槽404在通道接点406(或交叉点)连通。储槽404可以是腔室。如本文所用,对“储槽”的任何提及也可以指“腔室”。在操作中,包括悬浮的珠粒412的水性流体408可以沿着通道区段402输送至接点406中,与不与储槽404中的水性流体408混溶的第二流体410会合,以建立流入储槽404的水性流体408的液滴416、418。在水性流体408与第二流体410会合的接点406,液滴可以基于例如以下的因素形成:接点406的流体动力、两种流体408、410的流速、流体特性和通道结构400的某些几何参数(例如w、h0、α等)。可以通过从通道区段402不断地注射水性流体408通过接点406,将多个液滴收集在储槽404中。
不连续的液滴生成可包括珠粒(例如如被占用的液滴416中)。可替代地,不连续的液滴生成可包括超过一个珠粒。可替代地,不连续的液滴生成可不包括任何珠粒(例如如未占用的液滴418中)。在一些情况下,不连续的液滴生成可含有一个或多个生物颗粒,如本文中其它地方所述。在一些情况下,不连续的液滴生成可包含一种或多种试剂,如本文中其它地方所述。
在一些情况下,水性流体408可以具有基本上均一浓度或频率的珠粒412。珠粒412可以从独立通道(图4中未示)引入通道区段402中。通道区段402中的珠粒412的频率可以通过控制珠粒412引入通道区段402中的频率和/或通道区段402和独立通道中流体的相对流速来控制。在一些情况下,珠粒可以从多个不同的通道引入通道区段402中,并相应地,控制频率。
在一些情况下,通道区段402中的水性流体408可以包含生物颗粒(例如参考图1和2描述)。在一些情况下,水性流体408可以具有基本上均一浓度或频率的生物颗粒。如同珠粒一样,生物颗粒可以从独立通道引入通道区段402中。通道区段402中的水性流体408中生物颗粒的频率或浓度可以通过控制生物颗粒引入通道区段402中的频率和/或通道区段402和独立通道中流体的相对流速来控制。在一些情况下,生物颗粒可以从多个不同的通道引入通道区段402中,并相应地,控制频率。在一些情况下,第一独立通道可以引入珠粒并且第二独立通道可以引入生物颗粒至通道区段402中。引入珠粒的第一独立通道可以在引入生物颗粒的第二独立通道的上游或下游。
第二流体410可以包含油,例如氟化油,氟化油包括用于稳定所得到的液滴,例如抑制随后所得到的液滴凝聚的氟表面活性剂。
在一些情况下,第二流体410可以不进行和/或被引导至向储槽404的任何流入或流出。举例来说,第二流体410可以在储槽404中基本上不动。在一些情况下,例如经由施加压力至储槽404和/或受水性流体408在接点406的进入流的影响,第二流体410可以在储槽404内进行流动,而不流入或流出储槽404。可替代地,第二流体410可以不进行和/或被引导至向储槽404流入或流出。举例来说,储槽404可以是将第二流体410从上游引导至下游,输送生成的液滴的通道。
在接点406或附近的通道结构400可具有某些至少部分地决定由通道结构400形成的液滴的尺寸的几何特征。通道区段402在接点406或附近可以具有高度h0和宽度w。举例来说,通道区段402可以包含使储槽404具有较宽横截面(例如宽度方或直径上)的矩形横截面。可替代地,通道区段402的横截面可以是其它的形状,例如环形、梯形、多边形或任何其它的形状。在接点406或附近的储槽404的顶部和底部壁可以呈扩展角α倾向。扩展角α允许舌状物(将通道区段402留在接点406并在液滴形成前进入储槽404的水性流体408的部分)以增加在中间形成的液滴的深度和促进曲率的下降。液滴尺寸可以随扩展角增加而减少。所得到的液滴半径Rd,可以通过有关上述几何参数h0、w和α的以下等式预测:
举例来说,对于w=21μm,h=21μm,且α=3°的通道结构来说,预测液滴尺寸是121μm。在另一个实例中,对于w=25μm,h=25μm,且α=5°的通道结构来说,预测液滴尺寸是123μm。在另一个实例中,对于w=28μm,h=28μm,且α=7°的通道结构来说,预测液滴尺寸是124μm。
在一些情况下,扩展角α可以介于约0.5°至约4°、约0.1°至约10°或约0°至约90°的范围之间。举例来说,扩展角可以是至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更高。在一些情况下,扩展角可以是至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更少。在一些情况下,宽度w可以介于约100微米(μm)至约500μm的范围之间。在一些情况下,宽度w可以介于约10μm至约200μm的范围之间。可替代地,宽度可以小于约10μm。可替代地,宽度可以大于约500μm。在一些情况下,进入接点406的水性流体408的流速可以介于约0.04微升(μL)/分钟(min)与约40μL/min之间。在一些情况下,进入接点406的水性流体408的流速可以介于约0.01微升(μL)/分钟(min)与约100μL/min之间。可替代地,进入接点406的水性流体408的流速可以小于约0.01μL/min。可替代地,进入接点406的水性流体408的流速可以大于约40μL/min,例如45μL/min、50μL/min、55μL/min、60μL/min、65μL/min、70μL/min、75μL/min、80μL/min、85μL/min、90μL/min、95μL/min、100μL/min、110μL/min、120μL/min、130μL/min、140μL/min、150μL/min或更大。在较低流速下,例如约小于或等于10微升/分钟的流速下,液滴半径可能不取决于进入接点406的水性流体408的流速。
在一些情况下,生成的至少约50%的液滴可具有均一尺寸。在一些情况下,生成的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大百分比的液滴可具有均一尺寸。可替代地,生成的小于约50%的液滴可具有均一尺寸。
液滴生成的通过量可以通过增加生成点,例如增加水性流体408通道区段(例如通道区段402)与储槽404之间的接点(例如接点406)的数目来增加。可替代地或另外,液滴生成的通过量可以通过增加通道区段402中水性流体408的流速来增加。
图5示出用于增加液滴生成的通过量的微流体通道结构的一实例。微流体通道结构500可以包含多个通道区段502和储槽504。多个通道区段502中的每一个可以与储槽504呈流体连通。通道结构500可以包含介于多个通道区段502与储槽504之间的多个通道接点506。每个通道接点可以是液滴生成点。来自图4中的通道结构400的通道区段402和对其组分的任何描述可以与通道结构500中的多个通道区段502的给定通道区段和对其对应组分的任何描述对应。来自通道结构400的储槽404和对其组分的任何描述可以与来自通道结构500的储槽504和对其对应组分的任何描述对应。
多个通道区段502中的每个通道区段可以包含包括悬浮的珠粒512的水性流体508。储槽504可以包含不与水性流体508混溶的第二流体510。在一些情况下,第二流体510可以不进行和/或被引导至向储槽504的任何流入或流出。举例来说,第二流体510可以在储槽504中基本上不动。在一些情况下,例如经由施加压力至储槽504和/或受水性流体508在接点的进入流的影响,第二流体510可以在储槽504内进行流动,而不流入或流出储槽504。可替代地,第二流体510可以不进行和/或被引导至向储槽504流入或流出。举例来说,储槽504可以是将第二流体510从上游引导至下游,输送生成的液滴的通道。
在操作中,包括悬浮的珠粒512的水性流体508可以沿着多个通道区段502输送至多个接点506以与储槽504中的第二流体510会合,以建立液滴516、518。液滴可以在与储槽504的每个对应接点由每个通道区段形成。在水性流体508与第二流体510会合的接点,液滴可以基于例如以下的因素形成:接点的流体动力、两种流体508、510的流速、流体特性和通道结构500的某些几何参数(例如w、h0、α等),如本文中其它地方所述。可以通过从多个通道区段502不断地注射水性流体508通过多个接点506,将多个液滴收集在储槽504中。通过量可以随通道结构500的平行通道构型而显著地增加。举例来说,具有五个包含水性流体508的进口通道区段的通道结构生成液滴的频率可以是具有一个进口通道区段的通道结构的五倍,条件是通道区段中的流体流速基本上相同。不同的进口通道区段中的流体流速可以基本上相同或不相同。通道结构可以具有与实际和储槽大小所允许的一样多的平行通道区段。举例来说,通道结构可具有至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、500个、250个、300个、350个、400个、450个、500个、600个、700个、800个、900个、1000个、1500个、5000个或更多个平行的或基本上平行的通道区段。
对于多个通道区段502中的每个通道区段来说,几何参数w、h0和α可能是均一或不均一的。举例来说,在与储槽504的相应通道接点处或附近,每个通道区段可具有相同或不同的宽度。举例来说,在与储槽504的相应通道接点处或附近,每个通道区段可具有相同或不同的高度。在另一个实例中,在与多个通道区段502的不同的通道接点,储槽504可具有相同或不同的扩展角。当几何参数均一时,即使通过量增加,也可以控制液滴尺寸。在一些情况下,当需要具有液滴尺寸的不同分布时,多个通道区段502的几何参数可以相应地变化。
在一些情况下,生成的至至少约50%的液滴可具有均一尺寸。在一些情况下,生成的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大百分比的液滴可具有均一尺寸。可替代地,生成的至小于约50%的液滴可具有均一尺寸。
图6示出用于增加液滴生成的通过量的微流体通道结构的另一实例。微流体通道结构600可以包含多个通道区段602,所述通道区段大体上围绕储槽604的周边呈圆形排列。多个通道区段602中的每一个可以与储槽604呈流体连通。通道结构600可以包含介于多个通道区段602与储槽604之间的多个通道接点606。每个通道接点可以是液滴生成点。来自图2中的通道结构400的通道区段402和对其组分的任何描述可以与通道结构600中的多个通道区段602的给定通道区段和对其对应组分的任何描述对应。来自通道结构400的储槽404和对其组分的任何描述可以与来自通道结构600的储槽604和对其对应组分的任何描述对应。
多个通道区段602中的每个通道区段可以包含包括悬浮的珠粒612的水性流体608。储槽604可以包含不与水性流体608混溶的第二流体610。在一些情况下,第二流体610可以不进行和/或被引导至向储槽604的任何流入或流出。举例来说,第二流体610可以在储槽604中基本上不动。在一些情况下,例如经由施加压力至储槽604和/或受水性流体608在接点的进入流的影响,第二流体610可以在储槽604内进行流动,而不流入或流出储槽604。可替代地,第二流体610可以不进行和/或被引导至向储槽604流入或流出。举例来说,储槽604可以是将第二流体610从上游引导至下游,输送生成的液滴的通道。
在操作中,包括悬浮的珠粒612的水性流体608可以沿着多个通道区段602输送至多个接点606以与储槽604中的第二流体610会合,以建立多个液滴616。液滴可以在与储槽604的每个对应接点由每个通道区段形成。在水性流体608与第二流体610会合的接点,液滴可以基于例如以下的因素形成:接点的流体动力、两种流体608、610的流速、流体特性和通道结构600的某些几何参数(例如通道区段602的宽度和高度、储槽的扩展角等),如本文中其它地方所述。可以通过从多个通道区段602不断地注射水性流体608通过多个接点606,将多个液滴收集在储槽604中。用通道结构600的基本上平行的通道构型,可以显著地增加通过量。通道结构可以具有与实际和储槽大小所允许的一样多的基本上平行的通道区段。举例来说,通道结构可具有至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、600个、700个、800个、900个、1000个、1500个、5000个或更多个平行或基本上平行的通道区段。多个通道区段可以例如围绕储槽的边缘或周边基本上以等距离间隔。可替代地,多个通道区段的间隔可以是不均匀的。
储槽604可在每个通道接点处或附近具有扩展角α(图6中未示)。多个通道区段602的每个通道区段可在通道接点处或附近具有宽度w和高度h0。对于多个通道区段602中的每个通道区段来说,几何参数w、h0和α可能是均一或不均一的。举例来说,在与储槽604的相应通道接点处或附近,每个通道区段可具有相同或不同的宽度。举例来说,在与储槽604的相应通道接点处或附近,每个通道区段可具有相同或不同的高度。
在与多个通道区段602的不同的通道接点,储槽604可具有相同或不同的扩展角。举例来说,圆形储槽(如图6所示)可具有圆锥形、圆顶样或半球形顶篷(例如上壁)以在多个通道接点606或附近为每个通道区段602提供相同或基本上相同的扩展角。当几何参数均一时,有利地,即使通过量增加,也可以控制所得液滴尺寸。在一些情况下,当需要具有液滴尺寸的不同分布时,多个通道区段602的几何参数可以相应地变化。
在一些情况下,生成的至少约50%的液滴可具有均一尺寸。在一些情况下,生成的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大百分比的液滴可具有均一尺寸。可替代地,生成的小于约50%的液滴可具有均一尺寸。注射至液滴中的珠粒和/或生物颗粒可能具有或不具有均一的尺寸。
图7A示出具有用于控制分区的几何特征的微流体通道结构的另一实例的横截面图。通道结构700可以包括通道区段702,所述通道区段与储槽704在通道接点706(或交叉点)连通。在一些情况下,通道结构700和其组件中的一种或多种可以与通道结构100和其组件中的一种或多种对应。图7B示出图7A的通道结构700的透视图。
包含多个颗粒716的水性流体712可以沿着通道区段702输送至接点706中,与不与储槽704中的水性流体712混溶的第二流体714(例如油等)会合,以建立流入储槽704的水性流体712的液滴720。在水性流体712与第二流体714会合的接点706,液滴可以基于例如以下的因素形成:接点706的流体动力、两种流体712、714的相对流速、流体特性和通道结构700的某些几何参数(例如Δh等),如本文中其它地方所述。可以通过从通道区段702不断地注射水性流体712在接点706,将多个液滴收集在储槽704中。
生成的不连续的液滴可以包含多个颗粒716的一种或多种颗粒。如本文中其它地方所述,颗粒可以是任何颗粒,例如珠粒、细胞珠粒、凝胶珠粒、生物颗粒、生物颗粒的大分子成分或其它颗粒。可替代地,生成的不连续的液滴可以不包括任何颗粒。
在一些情况下,水性流体712可以具有基本上均一浓度或频率的颗粒716。如本文中其它地方所述(例如参考图4),颗粒716(例如珠粒)可以从独立通道(图7中未示)引入通道区段702中。通道区段702中的颗粒716的频率可以通过控制颗粒716引入通道区段702中的频率和/或通道区段702和独立通道中流体的相对流速来控制。在一些情况下,颗粒716可以从多个不同的通道引入通道区段702中,并相应地,控制频率。在一些情况下,不同的颗粒可以经由独立通道引入。举例来说,第一独立通道可以引入珠粒并且第二独立通道可以引入生物颗粒至通道区段702中。引入珠粒的第一独立通道可以在引入生物颗粒的第二独立通道的上游或下游。
在一些情况下,第二流体714可以不进行和/或不被引导向储槽704作任何流入或流出。举例来说,第二流体714可以在储槽704中基本上不动。在一些情况下,例如经由施加压力至储槽704和/或受水性流体712在接点706的进入流的影响,第二流体714可以在储槽704内进行流动,而不流入或流出储槽704。可替代地,第二流体714可以不进行和/或被引导至向储槽704流入或流出。举例来说,储槽704可以是将第二流体714从上游引导至下游,输送生成的液滴的通道。
在接点706或附近的通道结构700可具有某些至少部分地决定由通道结构700形成的液滴的尺寸和/或形状的几何特征。通道区段702可以具有第一横截面高度h1,并且储槽704可以具有第二横截面高度h2。第一横截面高度h1和第二横截面高度h2可以是不同的,以便在接点706,存在Δh的高度差。第二横截面高度h2可以大于第一横截面高度h1。在一些情况下,此后,例如离接点706越远,储槽的横截面高度可以逐渐增加。在一些情况下,在接点706或附近,储槽的横截面高度可以与扩展角β一致地增加。高度差Δh和/或扩展角β可以允许舌状物(将通道区段702留在接点706并在液滴形成前进入储槽704的水性流体712的部分)以增加在中间形成的液滴的深度和促进曲率的下降。举例来说,液滴尺寸可以随高度差增加和/或扩展角增加而减少。
高度差Δh可为至少约1μm。可替代地,高度差可为至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500μm或更多。可替代地,高度差可为至多约500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1μm或更少。在一些情况下,扩展角β可以介于约0.5°至约4°、约0.1°至约10°或约0°至约90°的范围之间。举例来说,扩展角可为至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更高。在一些情况下,扩展角可为至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更少。
在一些情况下,进入接点706的水性流体712的流速可以介于约0.04微升(μL)/分钟(min)与约40μL/min之间。在一些情况下,进入接点706的水性流体712的流速可以介于约0.01微升(μL)/分钟(min)与约100μL/min之间。可替代地,进入接点706的水性流体712的流速可以小于约0.01μL/min。可替代地,进入接点706的水性流体712的流速可以大于约40μL/min,例如45μL/min、50μL/min、55μL/min、60μL/min、65μL/min、70μL/min、75μL/min、80μL/min、85μL/min、90μL/min、95μL/min、100μL/min、110μL/min、120μL/min、130μL/min、140μL/min、150μL/min或更大。在较低流速下,例如约小于或等于10微升/分钟的流速下,液滴半径可能不取决于进入接点706的水性流体712的流速。第二流体714可以在储槽704中不动或基本上不动。可替代地,第二流体714可以流动,例如在以上针对水性流体712所述的流速下。
在一些情况下,生成的至少约50%的液滴可具有均一尺寸。在一些情况下,生成的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大百分比的液滴可具有均一尺寸。可替代地,生成的小于约50%的液滴可具有均一尺寸。
虽然图7A和7B说明高度差Δh在接点706是突然的(例如梯度增加),但是高度差可以逐渐增加(例如从约0μm增加至最大高度差)。可替代地,高度差可以从最大高度差逐渐减小(例如渐减)。如本文所用,高度差逐渐增加或减小可指高度差连续增长性增加或减小,其中高度剖面的任一差别区段与所述高度剖面的紧邻差别区段之间的角度大于90°。举例来说,在接点706,通道的底壁和储槽的底壁可以呈大于90°的角度会合。可替代地或另外,通道的顶壁(例如顶篷)和储槽的顶壁(例如顶篷)可以呈大于90°的角度会合。逐渐的增加或减小可以是线性或非线性的(例如指数、正弦等)。可替代地或另外,高度差线性或非线性地不定增加和/或减小。虽然图7A和7B说明扩大的储槽横截面高度为线性(例如恒定扩展角β),但横截面高度可以非线性地扩大。举例来说,储槽可以至少部分地由具有可变扩展角的圆顶样(例如半球形)形状界定。横截面高度可以呈任何形状扩大。
例如如上所述或本文中其它地方所述的通道网络可以流动地与适当的流体组分偶联。举例来说,进口通道区段流动地与其将递送至通道接点的材料的适当来源偶联。这些来源可以包括多种不同流体组分中的任一种,从微流体装置的主体结构中界定或连接至微流体装置的主体结构的简单储槽,至从脱离装置来源、歧管、流体流动单元(例如致动器、泵、压缩机)等递送流体的流体导管。同样地,出口通道区段(例如通道区段208、储槽604等)可以与所分区细胞的接收容器或导管流动地偶联以供后续加工。再次,这可以是界定在微流体装置主体内的储槽,或它可以是用于递送所分区细胞至后续工艺操作、仪器或组件的流体导管。
本文所述的方法和系统可以用于大大地增加单细胞应用和/或接受基于液滴的输入的其它应用的效率。举例来说,在被占用的细胞和/或适当筛分的细胞分类后,可以执行的后续操作可以包括产生扩增产物、纯化(例如经由固相可逆固定(SPRI))、进一步加工(例如剪切、功能序列接合和后续扩增(例如经由PCR))。这些操作可以大量存在(例如在分区外)。在分区是乳液中的液滴的情况下,乳液可以破裂并且汇集液滴的内含物供额外操作。可以连同负载条形码的珠粒一起共分区的额外试剂可以包括阻断核糖体RNA(rRNA)和核酸酶从细胞消化基因组DNA的寡核苷酸。可替代地,在额外的加工操作期间可以施加rRNA去除剂。通过这类方法产生的构建体的构型可以帮助在测序期间最小化(或避免)对多聚-T序列进行测序和/或对多核苷酸序列的5'末端进行测序。扩增产物,例如第一扩增产物和/或第二扩增产物可以经受测序以进行序列分析。在一些情况下,可以使用用于测序的部分发夹扩增(Partial Hairpin Amplification for Sequencing,PHASE)法进行扩增。
多种应用需要评估生物颗粒群体内不同生物颗粒或生物体类型的存在和定量,包括例如微生物组分析和表征、环境试验、食品安全试验、流行病学分析,例如追踪污染等等。
计算机系统
本公开提供被编程用于实施本公开的方法的计算机系统。图23示出一种计算机系统2301,其被编程或以其它方式配置用于例如:(i)控制微流体系统(例如流体流动);(ii)将被占用的液滴与未被占用的液滴分类;(iii)使液滴聚合;(iv)进行测序应用;或(v)产生和维持核酸分子的文库。计算机系统2301可以管制本公开的各个方面,例如微流体结构中的一个或多个通道的流体流速、聚合应用单元等。计算机系统2301可以是用户的电子装置或相对于所述电子装置位置较远的计算机系统。电子装置可以是移动电子装置。
计算机系统2301包括中央处理单元(CPU,本文中又称为“处理器”和“计算机处理器”)2305,它可以是单核或多核处理器,或用于并行处理的多个处理器。计算机系统2301还包括存储器或存储位置2310(例如随机存取存储器、只读存储器、快闪存储器)、电子存储单元2315(例如硬盘)、用于与一个或多个其它系统通信的通信接口2320(例如网络适配器)和外围设备2325,例如高速缓冲存储器、其它存储器、数据存储和/或电子显示适配器。存储器2310、存储单元2315、接口2320和外围设备2325与CPU 2305通过通信总线(实线)、例如母板通信。存储单元2315可以是用于存储数据的数据存储单元(或数据储存库)。计算机系统2301可以借助于通信接口2320与计算机网络(“网络”)2330可操作地偶联。网络2330可以是因特网、内网和/或外网或与因特网通信的内网和/或外网。网络2330在一些情况下是无线电通信和/或数据网络。网络2330可以包括一个或多个计算机服务器,所述计算机服务器可以实现分布式计算,例如云计算。在一些情况下,网络2330借助于计算机系统2301可以实施对等网络,所述对等网络可以使与计算机系统2301偶联的装置能够像客户机或服务器一样作用。
CPU 2305可以执行可以在程序或软件中体现的一系列机器可读指令。指令可以存储在存储位置、例如存储器2310中。指令可以针对CPU 2305,随后可以编程或以其它方式配置CPU 2305来实施本公开的方法。通过CPU 2305执行的操作的实例可以包括获取指令、解码、执行和回写。
CPU 2305可以是电路、例如集成电路的一部分。系统2301的一个或多个其它组件可以包括在电路中。在一些情况下,电路是专用集成电路(ASIC)。
存储单元2315可以存储文件夹,例如驱动器、程序库和保存的程序。存储单元2315可以存储用户数据,例如用户偏好和用户程序。在一些情况下,计算机系统2301可以包括一个或多个额外的数据存储单元,所述数据存储单元在计算机系统2301以外,例如位于远程服务器上,所述远程服务器通过内网或因特网与计算机系统2301通信。
计算机系统2301可以与一个或多个远程计算机系统通过网络2330通信。举例来说,计算机系统2301可以与用户(例如操作员)的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如便携式PC)、触屏平板或平板PC(例如
iPad、
Galaxy Tab)、电话、智能手机(例如
iPhone、安卓启动装置、
)或个人数字助理。用户可以经由网络2330进入计算机系统2301。
如本文所述的方法可以借助于计算机系统2301的电子存储位置上,例如存储器2310或电子存储单元2315上存储的机器(例如计算机处理器)可执行代码实施。机器可执行或机器可读代码可以呈软件形式提供。在使用期间,代码可以由处理器2305执行。在一些情况下,可以从存储单元2315撷取代码并存储在存储器2310上以由处理器2305就绪存取。在一些情形下,可以排除电子存储单元2315,并且在存储器2310上存储机器可执行指令。
代码可以预先编译和配置以用于具有被调适成执行所述代码的处理器的机器,或可以在运行时间期间编译。代码可以呈编程语言提供,所述编程语言经过选择,以使代码能够以预先编译或如所编译的方式执行。
本文提供的系统和方法、例如计算机系统2301的方面可以体现在编程上。这项技术的各个方面可以被认为是“产品”或“制品”,通常呈在一种机器可读介质上携带或体现的机器(或处理器)可执行代码和/或相关数据的形式。机器可执行代码可以存储在电子存储单元、例如存储器(例如只读存储器、随机存取存储器、快闪存储器)或硬盘上。“存储”型介质可以包括计算机、处理器等的任何或所有有形存储器,或其相关模块,例如各种半导体存储器、磁带驱动器、磁盘驱动器等,这些模块可以在任何时候为软件编程提供非暂时性存储。软件整体或部分有时可以通过因特网或各种其它电信网通信。这类通信例如能够将软件从一个计算机或处理器装载至另一个计算机或处理器,例如从管理服务器或主机装载至应用服务器的计算机平台。因此,可以负载软件元件的另一类型介质包括光波、电波和电磁波,例如跨越本地设备之间的物理接口使用,通过有线和光学固定网络和经各种空中链路。携带这类波的物理元件,例如有线或无线链路、光链路等,也可以被认为是负载软件的介质。如本文所用,除非局限于非暂时性有形“存储”介质,否则例如计算机或机器“可读介质”的术语是指参与提供指令给处理器来执行的任何介质。
因此,例如计算机可执行代码的机器可读介质可以采取许多形式,包括但不限于有形存储介质、载波介质或人工传输介质。非易失性存储介质包括例如光盘或磁盘,例如图式中所示的任何计算机中的任一存储装置等,例如可以用于实施数据库等。易失性存储介质包括动态存储器,例如这类计算机平台的主存储器。有形传输介质包括同轴电缆;铜丝和光纤,包括包含计算机系统内的母线的电线。载波传输介质可以采取电信号或电磁信号的形式,或声波或光波的形式,例如在射频(RF)和红外线(IR)数据通信期间产生的那些形式。因此,计算机可读介质的常见形式包括例如:软盘、软磁盘、硬盘、磁带、任何其它磁性介质、CD-ROM、DVD或DVD-ROM、任何其它光学介质、穿孔纸带、具有孔图案的任何其它物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其它存储芯片或存储卡、载波输送数据或指令、输送这类载波的电缆或链路或计算机可以从中读取编程代码和/或数据的任何其它介质。计算机可读介质的这些形式中的许多可能参与将一系列或多个系列的一个或多个指令携带至处理器进行执行。
计算机系统2301可以包括电子显示器2335或与其通信,所述电子显示器包含用户界面(UI)2340,用于提供例如测序分析结果等。UI的实例包括不限于图形用户界面(GUI)和基于网络的用户界面。
本公开的方法和系统可以借助于一种或多种算法实施。算法可以借助于软件在由中央处理单元2305执行后来实施。算法可以例如执行测序等。
本公开的装置、系统、组合物和方法可以用于各种应用,例如加工来自单细胞的单个分析物(例如RNA、DNA或蛋白质)或多种分析物(例如DNA和RNA、DNA和蛋白质、RNA和蛋白质或RNA、DNA和蛋白质)。举例来说,生物颗粒(例如细胞或细胞珠粒)被分区在分区(例如液滴)中,并将来自生物颗粒的多种分析物加工以供后续加工。多种分析物可以来自单细胞。这能够对细胞进行例如同时的蛋白质组学、转录物组和基因组分析。
实施方案
在一些情况下,本公开提供了根据以下实施方案的方法:
1.一种分析包含核酸分子的样品的方法,所述方法包括:
(a)提供:
(i)包含所述核酸分子的样品,其中所述核酸分子包含第一靶标区域和第二靶标区域,其中所述第一靶标区域和所述第二靶标区域设置在所述核酸分子的同一条链上;
(ii)第一探针,所述第一探针包含第一探针序列和第二探针序列,其中所述第一探针的所述第一探针序列与所述核酸分子的所述第一靶标区域互补;以及
(iii)第二探针,所述第二探针包含第三探针序列,其中所述第二探针的所述第三探针序列与所述核酸分子的所述第二靶标区域互补;
(b)使所述样品经受足以实现以下的条件:(i)使所述第一探针的所述第一探针序列与所述核酸分子的所述第一靶标区域杂交,以及(ii)使所述第二探针的所述第三探针序列与所述核酸分子的所述第二靶标区域杂交,得到与探针缔合的核酸分子;
(c)使所述与探针缔合的核酸分子经受足以得到与探针连接的核酸分子的条件,所述与探针连接的核酸分子包含连接至所述第二探针的所述第一探针;以及
(d)在分区内,将条形码序列附连至所述第一探针。
2.实施方案1的方法,其中所述分区是多个孔中的一个孔。
3.实施方案1的方法,其中所述分区是多个液滴中的一个液滴。
4.实施方案1-3中任一项的方法,其中(d)包括(i)在所述分区中提供包含结合序列和条形码序列的核酸条形码分子,其中所述结合序列与所述第一探针的所述第二探针序列互补,以及(ii)使所述分区经受足以使所述结合序列与所述第二探针序列杂交的条件。
5.实施方案4的方法,所述方法还包括使所述分区经受足以延伸与所述核酸条形码分子的所述结合序列杂交的所述第二探针序列的条件,产生延伸的第一探针,其中所述延伸的第一探针包含与所述条形码序列互补的序列。
6.实施方案5的方法,所述方法还包括使与所述核酸条形码分子杂交的所述延伸的第一探针经受足以从所述延伸的第一探针分离所述核酸条形码分子的条件。
7.实施方案5或6的方法,所述方法还包括使与所述核酸条形码分子杂交的所述延伸的第一探针经受足以进行扩增反应的条件,以产生扩增产物,所述扩增产物包含所述条形码序列或其互补物。
8.实施方案7的方法,其中所述扩增反应是聚合酶链式反应。
9.实施方案7或8的方法,其中所述扩增反应是在所述分区内执行。
10.实施方案9的方法,所述方法还包括从所述分区回收所述扩增产物。
11.实施方案7或8的方法,其中所述扩增反应是在所述分区外执行。
12.实施方案10或11的方法,所述方法还包括对所述扩增产物进行测序。
13.实施方案1-3中任一项的方法,所述方法还包括(i)提供包含与所述第二探针序列互补的第一序列和第二序列的夹板寡核苷酸,以及(ii)使所述分区经受足以使所述夹板寡核苷酸的所述第一序列与所述第一探针的所述第二探针序列杂交的条件。
14.实施方案13的方法,其中在(c)之前使所述夹板寡核苷酸的所述第一序列与所述第一探针的所述第二探针序列杂交。
15.实施方案13的方法,其中在(c)之后使所述夹板寡核苷酸的所述第一序列与所述第一探针的所述第二探针序列杂交。
16.实施方案13的方法,其中在(d)之前使所述夹板寡核苷酸的所述第一序列与所述第一探针的所述第二探针序列杂交。
17.实施方案13-16中任一项的方法,其中(d)包括(i)在所述分区中提供包含结合序列和条形码序列的核酸条形码分子,其中所述结合序列与所述夹板寡核苷酸的所述第二序列互补,以及(ii)使所述分区经受足以使所述结合序列与所述夹板寡核苷酸的所述第二序列杂交的条件。
18.实施方案17的方法,其中所述核酸条形码分子的所述结合序列包含核糖碱基。
19.实施方案17或18的方法,所述方法还包括使与所述第一探针和所述核酸条形码分子杂交的所述夹板寡核苷酸经受足以将与所述夹板寡核苷酸杂交的所述第二探针序列连接至所述核酸条形码分子的所述结合序列的条件。
20.实施方案17-19中任一项的方法,所述方法还包括使与所述第一探针和所述核酸条形码分子杂交的所述夹板寡核苷酸经受足以将所述夹板寡核苷酸的所述第二序列延伸至所述核酸条形码分子的末端的条件,产生延伸的夹板寡核苷酸,其中所述延伸的夹板寡核苷酸包含与所述条形码序列互补的序列。
21.实施方案20的方法,所述方法还包括使与所述第一探针和所述核酸条形码分子杂交的所述延伸的夹板寡核苷酸经受足以从所述第一探针和所述核酸条形码分子分离所述延伸的夹板寡核苷酸的条件。
22.实施方案17-19中任一项的方法,所述方法还包括使与所述第一探针和所述核酸条形码分子杂交的所述夹板寡核苷酸经受足以延伸所述夹板寡核苷酸的所述第一序列的条件,产生延伸的核酸条形码产物,其中所述延伸的核酸条形码产物包含与所述第一探针的所述第一探针序列互补的序列和与所述第二探针的所述第三探针序列互补的序列。
23.实施方案19-21中任一项的方法,所述方法还包括使所述第一探针和所述核酸条形码分子经受足以进行扩增反应的条件,以产生扩增产物,所述扩增产物包含所述条形码序列或其互补物和所述第一探针序列或其互补物。
24.实施方案23的方法,其中所述扩增反应是聚合酶链式反应。
25.实施方案23或24的方法,其中所述扩增反应是在所述分区内执行。
26.实施方案25的方法,所述方法还包括从所述分区回收所述扩增产物。
27.实施方案23或24的方法,其中所述扩增反应是在所述分区外执行。
28.实施方案26或27的方法,所述方法还包括对所述扩增产物进行测序。
29.实施方案4-28中任一项的方法,其中所述核酸条形码分子还包含独特分子标识符序列。
30.实施方案4-29中任一项的方法,其中所述核酸条形码分子还包含测序引物。
31.实施方案4-30中任一项的方法,其中在(c)之后,所述与探针缔合的核酸分子与所述核酸条形码分子共分区。
32.实施方案4-30中任一项的方法,其中在(a)之后,所述核酸分子与所述第一探针、所述第二探针和所述核酸条形码分子共分区。
33.实施方案32的方法,其中(c)是在所述分区内执行。
34.实施方案33的方法,其中(b)和(c)是在所述分区内执行。
35.实施方案4-34中任一项的方法,其中所述第二探针包含第四探针序列,并且其中所述方法还包括在所述分区中提供核酸结合分子,其中所述核酸结合分子包含与所述第二探针的所述第四探针序列互补的第二结合序列。
36.实施方案35的方法,其中所述核酸结合分子还包含第三结合序列。
37.实施方案35或36的方法,其中所述核酸结合分子还包含第二条形码序列。
38.实施方案35-37中任一项的方法,所述方法还包括在所述分区内使所述第二结合序列与所述第二探针的所述第四探针序列杂交。
39.实施方案4-38中任一项的方法,其中将所述核酸条形码分子偶联至珠粒。
40.实施方案39的方法,其中所述珠粒是凝胶珠粒。
41.实施方案39或40的方法,其中所述核酸条形码分子经由不稳定部分偶联至所述珠粒。
42.实施方案39-41中任一项的方法,其中所述珠粒包含多个偶联至所述珠粒的核酸条形码分子,其中所述多个核酸条形码分子包含所述核酸条形码分子。
43.实施方案42的方法,其中所述珠粒包含至少10,000个偶联至所述珠粒的核酸条形码分子。
44.实施方案43的方法,其中所述珠粒包含至少100,000个偶联至所述珠粒的核酸条形码分子。
45.实施方案44的方法,其中所述珠粒包含至少1,000,000个偶联至所述珠粒的核酸条形码分子。
46.实施方案45的方法,其中所述珠粒包含至少10,000,000个偶联至所述珠粒的核酸条形码分子。
47.实施方案42-46中任一项的方法,其中所述多个核酸条形码分子以可释放的方式偶联至所述珠粒。
48.实施方案47的方法,其中所述多个核酸条形码分子在施加刺激后可从所述珠粒释放。
49.实施方案48的方法,其中所述刺激选自由以下组成的组:热刺激、光刺激和化学刺激。
50.实施方案49的方法,其中所述刺激是还原剂。
51.实施方案50的方法,其中所述刺激是二硫苏糖醇。
52.实施方案48-51中任一项的方法,其中所述刺激的施加引起以下中的一种或多种:(i)所述多个核酸条形码分子的核酸条形码分子与所述珠粒之间的连接的裂解,以及(ii)所述珠粒的降解,从而从所述珠粒释放所述多个核酸条形码分子的核酸条形码分子。
53.实施方案47-52中任一项的方法,其中所述珠粒提供于所述分区中,并且其中在所述分区内从所述珠粒释放所述核酸条形码分子。
54.实施方案1-53中任一项的方法,其中(c)是在(d)之前执行。
55.实施方案1-53中任一项的方法,其中(d)是在(c)之前执行。
56.实施方案1-55中任一项的方法,其中所述第一探针还包含条形码序列或独特分子标识符。
57.实施方案1-56中任一项的方法,其中所述第二探针还包含条形码序列或独特分子标识符。
58.实施方案1-57中任一项的方法,其中所述第二探针包含第四探针序列,所述第四探针序列与所述核酸分子的第三靶标区域杂交。
59.实施方案58的方法,其中所述第二靶标区域与所述第三靶标区域不相邻,并且其中所述第二探针的所述第三探针序列和所述第四探针序列被连接子序列隔开。
60.实施方案1-59中任一项的方法,其中所述第一探针的所述第一探针序列包含第一反应部分并且所述第二探针的所述第三探针序列包含第二反应部分,其中,在(b)之后,所述第一反应部分与所述第二反应部分相邻。
61.实施方案60的方法,其中(c)包括使所述第一反应部分和所述第二反应部分经受足以将所述第一探针序列连接至所述第三探针序列的条件。
62.实施方案60或61的方法,其中所述第一探针的所述第一反应部分包含叠氮化物部分。
63.实施方案60-62中任一项的方法,其中所述第二探针的所述第二反应部分包含炔烃部分。
64.实施方案60-63中任一项的方法,其中在所述与探针连接的核酸分子中所述第一探针经由连接子连接至所述第二探针,其中所述连接子包含三唑部分。
65.实施方案60或61的方法,其中所述第一探针的所述第一反应部分包含硫代磷酸酯部分。
66.实施方案60、61或65中任一项的方法,其中所述第二探针的所述第二反应部分包含碘化物部分。
67.实施方案60、61、65或66中任一项的方法,其中在所述与探针连接的核酸分子中所述第一探针经由连接子连接至所述第二探针,其中所述连接子包含硫代磷酸酯键。
68.实施方案60或61的方法,其中所述第一探针的所述第一反应部分包含胺部分。
69.实施方案60、61或68中任一项的方法,其中所述第二探针的所述第二反应部分包含磷酸酯部分。
70.实施方案60、61、68或69中任一项的方法,其中在所述与探针连接的核酸分子中所述第一探针经由连接子连接至所述第二探针,其中所述连接子包含磷酰胺酯氨基磷酸酯键。
71.实施方案1-59中任一项的方法,其中(c)包括执行核酸反应。
72.实施方案1-59或71中任一项的方法,其中(c)包括执行酶促接合反应或延伸反应。
73.实施方案72的方法,其中(c)包括执行酶促接合反应与延伸反应。
74.实施方案72或73的方法,其中所述酶促接合反应和/或所述延伸反应包括使用选自由以下组成的组的酶:T4 RNL2、SplintR、T4DNA连接酶、PBCV1、DNA聚合酶和Mu聚合酶,或它们的衍生物。
75.实施方案1-74中任一项的方法,其中在(a)之前,所述第一探针经由一个或多个连接序列连接至所述第二探针。
76.实施方案75的方法,其中所述一个或多个连接序列包含间隔子序列。
77.实施方案75或76的方法,其中所述一个或多个连接序列包含测序引物或其互补序列。
78.实施方案75-77中任一项的方法,其中所述一个或多个连接序列包含独特分子标识符序列。
79.实施方案75-78中任一项的方法,其中所述一个或多个连接序列包含限制位点。
80.实施方案75-79中任一项的方法,其中所述一个或多个连接序列包含捕获序列。
81.实施方案75-80中任一项的方法,其中所述一个或多个连接序列包含热不稳定的、可光裂解的或可酶促裂解的位点。
82.实施方案75-81中任一项的方法,其中所述一个或多个连接序列包含转座位点。
83.实施方案1-82中任一项的方法,其中所述第一靶标区域与所述第二靶标区域相邻。
84.实施方案1-82中任一项的方法,其中所述第一靶标区域和所述第二靶标区域由设置在所述第一靶标区域与所述第二靶标区域之间的间隙区域隔开。
85.实施方案84的方法,其中所述间隙区域的长度为至少一个核苷酸。
86.实施方案84或85的方法,其中所述间隙区域的长度介于1-10个核苷酸之间。
87.实施方案84或85的方法,其中所述间隙区域的长度为至少10个核苷酸。
88.实施方案87的方法,其中所述间隙区域的长度为至少50个核苷酸。
89.实施方案88的方法,其中所述间隙区域的长度为至少100个核苷酸。
90.实施方案89的方法,其中所述间隙区域的长度为至少200个核苷酸。
91.实施方案90的方法,其中所述间隙区域的长度为至少500个核苷酸。
92.实施方案87的方法,其中所述间隙区域的长度介于50与200个核苷酸之间。
93.实施方案1-92中任一项的方法,所述方法还包括使用核酸外切酶消化一个或多个核酸分子或其部分。
94.实施方案1-93中任一项的方法,其中所述第一探针或所述第二探针包含已知序列。
95.实施方案1-94中任一项的方法,其中所述第一探针或所述第二探针包含简并序列。
96.实施方案1-95中任一项的方法,其中所述第一探针或所述第二探针包含基于Phi-29的滚环式扩增序列。
97.实施方案1-96中任一项的方法,其中所述第一探针或所述第二探针包含可裂解位点,其中所述可裂解位点可使用热、光、化学或生物刺激裂解。
98.实施方案1-97中任一项的方法,其中所述第一探针或所述第二探针包含转座位点。
99.实施方案1-98中任一项的方法,其中所述样品包含细胞,并且其中所述核酸分子含于所述细胞内。
100.实施方案99的方法,所述方法还包括在(a)之后,透化所述细胞,从而接近所述核酸分子。
101.实施方案99的方法,所述方法还包括在(a)之后,溶解所述细胞,从而从所述细胞释放所述核酸分子。
102.实施方案99-101中任一项的方法,其中所述细胞是原核细胞。
103.实施方案99-101中任一项的方法,其中所述细胞是真核细胞。
104.实施方案99-101中任一项的方法,其中所述细胞是淋巴细胞。
105.实施方案99-101中任一项的方法,其中所述细胞是B细胞。
106.实施方案99-101中任一项的方法,其中所述细胞是T细胞。
107.实施方案99-101中任一项的方法,其中所述细胞是人细胞。
108.实施方案99-107中任一项的方法,其中所述细胞是固定的悬浮细胞或福尔马林固定的石蜡包埋的细胞。
109.实施方案99-108中任一项的方法,其中所述细胞提供在所述分区内。
110.实施方案1-109中任一项的方法,其中所述核酸分子是单链核酸分子。
111.实施方案1-110中任一项的方法,其中所述核酸分子是核糖核酸(RNA)分子。
112.实施方案111的方法,其中所述核酸分子是信使RNA(mRNA)分子。
113.实施方案111或112的方法,其中所述核酸分子在所述核酸分子的末端包含多聚A序列。
114.实施方案111的方法,其中所述RNA分子不包含多聚A序列。
115.实施方案111-114中任一项的方法,其中所述核酸分子包含非翻译区(UTR)。
116.实施方案111-115中任一项的方法,其中所述核酸分子包含5′帽结构。
117.实施方案1-110中任一项的方法,其中所述核酸分子是脱氧核糖核酸(DNA)分子。
118.实施方案1-117中任一项的方法,其中所述分区还包含一种或多种选自由以下组成的组的试剂:荧光团、寡核苷酸、引物、核酸条形码分子、条形码、缓冲剂、三磷酸脱氧核苷酸、DNA夹板、洗涤剂、还原剂、螯合剂、氧化剂、纳米颗粒、抗体和酶。
119.实施方案1-118中任一项的方法,其中所述分区还包含一种或多种选自由以下组成的组的试剂:温度敏感性酶、pH敏感性酶、光敏感性酶、蛋白酶、连接酶、聚合酶、逆转录酶、限制酶、核酸酶、蛋白酶抑制剂和核酸酶抑制剂。
120.实施方案119的方法,其中所述聚合酶是选自以下的组的聚合酶:DNA聚合酶、RNA聚合酶、Hot Start聚合酶和Warm start聚合酶。
121.实施方案1-120中任一项的方法,其中所述样品包含细胞珠粒,并且其中所述核酸分子含于所述细胞珠粒内。
122.实施方案1-121中任一项的方法,其中(a)-(c)是在无逆转录下执行。
123.一种分析包含核酸分子的样品的方法,所述方法包括:
(a)提供:
(i)包含所述核酸分子的样品,其中所述核酸分子包含靶标区域;
(ii)探针,所述探针包含探针序列和结合序列,其中所述探针序列与所述靶标区域互补;以及
(iii)衔接子,所述衔接子包含第一序列和第二序列,其中所述衔接子的所述第一序列与所述探针的所述结合序列互补;
(b)使所述样品经受足以实现以下的条件:(i)使所述探针的所述探针序列与所述靶标区域杂交,以及(ii)使所述探针的所述结合序列与所述衔接子的所述第一序列杂交,以得到与衔接子结合的探针;以及
(c)在分区内,将所述与衔接子结合的探针条形码化以提供条形码化核酸分子。
124.实施方案123的方法,其中所述分区是多个孔中的一个孔。
125.实施方案123的方法,其中所述分区是多个液滴中的一个液滴。
126.实施方案123-125中任一项的方法,其中在所述分区内所述衔接子的所述第一序列与所述探针的所述结合序列杂交。
127.实施方案123-125中任一项的方法,其中在所述分区外所述衔接子的所述第一序列与所述探针的所述结合序列杂交。
128.实施方案123-127中任一项的方法,其中(c)包括(i)在所述分区中提供包含悬垂序列和条形码序列的核酸条形码分子,其中所述悬垂序列与所述衔接子的所述第二序列互补,以及(ii)使所述分区经受足以使所述悬垂序列与所述衔接子的所述第二序列杂交的条件,以得到所述条形码化核酸分子。
129.实施方案128的方法,其中所述核酸条形码分子的所述悬垂序列包含核糖碱基。
130.实施方案128或129的方法,所述方法还包括使所述条形码化核酸分子经受足以将与所述衔接子杂交的所述结合序列接合至所述核酸条形码分子的所述悬垂序列的条件。
131.实施方案130的方法,其中所述接合在所述分区外进行。
132.实施方案128-131中任一项的方法,所述方法还包括使所述条形码化核酸分子经受足以延伸所述衔接子的所述第二序列至所述核酸条形码分子的末端的条件,以产生延伸的衔接子,其中所述延伸的衔接子包含与所述条形码序列互补的序列。
133.实施方案132的方法,所述方法还包括使与所述探针和所述核酸条形码分子杂交的所述延伸的衔接子经受足以将所述探针和所述核酸条形码分子与所述延伸的衔接子分开的条件。
134.实施方案128-134中任一项的方法,其中所述核酸条形码分子还包含独特分子标识符序列。
135.实施方案128-135中任一项的方法,其中所述核酸条形码分子还包含测序引物。
136.实施方案128-135中任一项的方法,其中将所述核酸条形码分子偶联至珠粒。
137.实施方案136的方法,其中所述珠粒是凝胶珠粒。
138.实施方案136或137的方法,其中所述核酸条形码分子经由不稳定部分偶联至所述珠粒。
139.实施方案136-138中任一项的方法,其中所述珠粒包含多个偶联至所述珠粒的核酸条形码分子,其中所述多个核酸条形码分子包含所述核酸条形码分子。
140.实施方案139的方法,其中所述珠粒包含至少10,000个偶联至所述珠粒的核酸条形码分子。
141.实施方案140的方法,其中所述珠粒包含至少100,000个偶联至所述珠粒的核酸条形码分子。
142.实施方案141的方法,其中所述珠粒包含至少1,000,000个偶联至所述珠粒的核酸条形码分子。
143.实施方案142的方法,其中所述珠粒包含至少10,000,000个偶联至所述珠粒的核酸条形码分子。
144.实施方案136-143中任一项的方法,其中所述多个核酸条形码分子以可释放的方式偶联至所述珠粒。
145.实施方案144的方法,其中所述多个核酸条形码分子在施加刺激后可从所述珠粒释放。
146.实施方案145的方法,其中所述刺激选自由以下组成的组:热刺激、光刺激和化学刺激。
147.实施方案146的方法,其中所述刺激是还原剂。
148.实施方案147的方法,其中所述刺激是二硫苏糖醇。
149.实施方案145-148中任一项的方法,其中所述刺激的施加引起以下中的一种或多种:(i)所述多个核酸条形码分子的核酸条形码分子与所述珠粒之间的连接的裂解,以及(ii)所述珠粒的降解,从而从所述珠粒释放所述多个核酸条形码分子的核酸条形码分子。
150.实施方案144-149中任一项的方法,其中所述珠粒提供于所述分区中,并且其中在所述分区内从所述珠粒释放所述核酸条形码分子。
151.实施方案123-150中任一项的方法,所述方法还包括从所述分区回收所述条形码化核酸分子。
152.实施方案151的方法,其中所述分区是液滴,并且其中从所述分区回收所述条形码化核酸分子包括使所述液滴破碎或破裂。
153.实施方案123-153中任一项的方法,所述方法还包括使用核酸外切酶消化一个或多个核酸分子。
154.实施方案153的方法,其中所述消化在(c)之后在本体溶液中执行。
155.实施方案154的方法,其中所述一个或多个核酸分子是未偶联至所述核酸分子的探针和衔接子分子。
156.实施方案123-155中任一项的方法,所述方法还包括提供包含额外探针序列的额外探针,所述额外探针序列与所述核酸分子的额外靶标区域互补。
157.实施方案156的方法,其中所述额外靶标区域与所述核酸分子的所述靶标区域相邻。
158.实施方案156的方法,其中所述靶标区域和所述额外靶标区域设置在所述核酸分子的同一条链上但被间隙区域隔开。
159.实施方案158的方法,其中所述间隙区域的长度为至少一个核苷酸。
160.实施方案158或159的方法,其中所述间隙区域的长度介于1-10个核苷酸之间。
161.实施方案158或159的方法,其中所述间隙区域的长度为至少10个核苷酸。
162.实施方案161的方法,其中所述间隙区域的长度为至少50个核苷酸。
163.实施方案162的方法,其中所述间隙区域的长度为至少100个核苷酸。
164.实施方案163的方法,其中所述间隙区域的长度为至少200个核苷酸。
165.实施方案164的方法,其中所述间隙区域的长度为至少500个核苷酸。
166.实施方案162的方法,其中所述间隙区域的长度介于50与200个核苷酸之间。
167.实施方案156-166中任一项的方法,其中所述额外探针还包含测序引物。
168.实施方案156-167中任一项的方法,所述方法还包括(d)使与所述核酸分子的所述靶标区域杂交的所述条形码化核酸分子经受足以使所述额外探针的所述额外探针序列与所述额外靶标区域杂交的条件。
169.实施方案168的方法,其中所述探针的所述探针序列包含第一反应部分并且所述额外探针的所述额外探针序列包含第二反应部分,其中在(d)之后,所述第一反应部分与所述第二反应部分相邻。
170.实施方案169的方法,所述方法还包括使所述第一反应部分和所述第二反应部分经受足以将所述探针序列连接至所述额外探针序列的条件。
171.实施方案169或170的方法,其中所述第一探针的所述第一反应部分包含叠氮化物部分。
172.实施方案169-171中任一项的方法,其中所述第二探针的所述第二反应部分包含炔烃部分。
173.实施方案169-172中任一项的方法,其中在所述与探针连接的核酸分子中所述第一探针经由连接子连接至所述第二探针,其中所述连接子包含三唑部分。
174.实施方案169或170的方法,其中所述第一探针的所述第一反应部分包含硫代磷酸酯部分。
175.实施方案169、170或174中任一项的方法,其中所述第二探针的所述第二反应部分包含碘化物部分。
176.实施方案169、170、174或175中任一项的方法,其中在所述与探针连接的核酸分子中所述第一探针经由连接子连接至所述第二探针,其中所述连接子包含硫代磷酸酯键。
177.实施方案169或170的方法,其中所述第一探针的所述第一反应部分包含胺部分。
178.实施方案169、170或177中任一项的方法,其中所述第二探针的所述第二反应部分包含磷酸酯部分。
179.实施方案169、170、177或178中任一项的方法,其中在所述与探针连接的核酸分子中所述第一探针经由连接子连接至所述第二探针,其中所述连接子包含磷酰胺酯氨基磷酸酯键。
180.实施方案168的方法,其中与所述靶标区域杂交的所述探针经由核酸反应连接至与所述额外靶标区域杂交的所述额外探针。
181.实施方案168的方法,其中与所述靶标区域杂交的所述探针经由酶促接合反应或延伸反应连接至与所述额外靶标区域杂交的所述额外探针。
182.实施方案181的方法,其中与所述靶标区域杂交的所述探针经由酶促接合反应与延伸反应连接至与所述额外靶标区域杂交的所述额外探针。
183.实施方案181或182的方法,其中所述酶促接合反应和/或所述延伸反应包括使用选自由以下组成的组的酶:T4 RNL2、SplintR、T4 DNA连接酶、PBCV1、DNA聚合酶和Mu聚合酶,或它们的衍生物。
184.实施方案156-183中任一项的方法,其中所述额外探针提供在所述分区内。
185.实施方案156-183中任一项的方法,其中所述额外探针提供在另一分区内。
186.实施方案168-185中任一项的方法,所述方法还包括使经受所述条形码化核酸分子与杂交所述核酸分子足以进行扩增反应的条件,以产生扩增产物,所述扩增产物包含所述条形码序列或其互补物和所述探针序列或其互补物。
187.实施方案186的方法,其中所述扩增反应是聚合酶链式反应。
188.实施方案186或187的方法,其中所述扩增反应是在所述分区内执行。
189.实施方案188的方法,所述方法还包括从所述分区回收所述扩增产物。
190.实施方案186或187的方法,其中所述扩增反应是在所述分区外执行。
191.实施方案189或190的方法,所述方法还包括对所述扩增产物进行测序。
192.实施方案123-191中任一项的方法,其中所述探针还包含条形码序列或独特分子标识符。
193.实施方案156-192中任一项的方法,其中所述探针或所述额外探针包含已知序列。
194.实施方案156-193中任一项的方法,其中所述探针或所述额外探针包含简并序列。
195.实施方案156-194中任一项的方法,其中所述探针或所述额外探针包含可裂解位点,其中所述可裂解位点可使用热、光、化学或生物刺激裂解。
196.实施方案156-195中任一项的方法,其中所述第一探针或所述第二探针包含转座位点。
197.实施方案123-196中任一项的方法,其中所述样品包含细胞,并且其中所述核酸分子含于所述细胞内。
198.实施方案197的方法,所述方法还包括在(a)之后,透化所述细胞,从而接近所述核酸分子。
199.实施方案197的方法,所述方法还包括在(a)之后,溶解所述细胞,从而从所述细胞释放所述核酸分子。
200.实施方案197-199中任一项的方法,其中所述细胞是原核细胞。
201.实施方案197-199中任一项的方法,其中所述细胞是真核细胞。
202.实施方案197-199中任一项的方法,其中所述细胞是淋巴细胞。
203.实施方案197-199中任一项的方法,其中所述细胞是B细胞。
204.实施方案197-199中任一项的方法,其中所述细胞是T细胞。
205.实施方案197-199中任一项的方法,其中所述细胞是人细胞。
206.实施方案197-205中任一项的方法,其中所述细胞是固定的悬浮细胞或福尔马林固定的石蜡包埋的细胞。
207.实施方案197-206中任一项的方法,其中所述细胞提供在所述分区内。
208.实施方案123-207中任一项的方法,其中所述核酸分子是单链核酸分子。
209.实施方案123-208中任一项的方法,其中所述核酸分子是核糖核酸(RNA)分子。
210.实施方案209的方法,其中所述核酸分子是信使RNA(mRNA)分子。
211.实施方案209或210的方法,其中所述核酸分子在所述核酸分子的末端包含多聚A序列。
212.实施方案209的方法,其中所述RNA分子不包含多聚A序列。
213.实施方案209-212中任一项的方法,其中所述核酸分子包含非翻译区(UTR)。
214.实施方案209-213中任一项的方法,其中所述核酸分子包含5′帽结构。
215.实施方案123-208中任一项的方法,其中所述核酸分子是脱氧核糖核酸(DNA)分子。
216.实施方案123-215中任一项的方法,其中所述分区还包含一种或多种选自由以下组成的组的试剂:荧光团、寡核苷酸、引物、核酸条形码分子、条形码、缓冲剂、三磷酸脱氧核苷酸、DNA夹板、洗涤剂、还原剂、螯合剂、氧化剂、纳米颗粒、抗体和酶。
217.实施方案123-216中任一项的方法,其中所述分区还包含一种或多种选自由以下组成的组的试剂:温度敏感性酶、pH敏感性酶、光敏感性酶、蛋白酶、连接酶、聚合酶、逆转录酶、限制酶、核酸酶、蛋白酶抑制剂和核酸酶抑制剂。
218.实施方案217的方法,其中所述聚合酶是选自以下的组的聚合酶:DNA聚合酶、RNA聚合酶、Hot Start聚合酶和Warm start聚合酶
219.实施方案123-218中任一项的方法,其中所述样品包含细胞珠粒,并且其中所述核酸分子含于所述细胞珠粒内。
220.实施方案123-219中任一项的方法,其中(a)-(c)是在无逆转录下执行。
221.一种分析包含核酸分子的样品的方法,所述方法包括:
(a)提供:
(i)包含所述核酸分子的样品,其中所述核酸分子包含靶标区域;
(ii)探针,所述探针包含探针序列和第一反应部分,其中所述探针序列与所述靶标区域互补;以及
(iii)核酸条形码分子,所述核酸条形码分子包含第二反应部分和条形码序列;
(b)使所述样品经受足以使所述探针的所述探针序列与所述靶标区域杂交的条件以提供与探针缔合的核酸分子;以及
(c)在分区内,使所述与探针缔合的核酸分子的所述第一反应部分和所述核酸条形码分子的所述第二反应部分经受足以将所述与探针缔合的核酸分子和所述核酸条形码分子连接的条件以提供条形码化核酸产物。
222.实施方案221的方法,其中所述分区是多个孔中的一个孔。
223.实施方案221的方法,其中所述分区是多个液滴中的一个液滴。
224.实施方案221-223中任一项的方法,其中所述探针还包含测序引物。
225.实施方案221-224中任一项的方法,其中所述探针还包含设置在所述探针序列和所述第一反应部分之间的间隔子序列。
226.实施方案221-225中任一项的方法,其中(b)是在所述分区内执行。
227.实施方案221-225中任一项的方法,其中(b)是在所述分区外执行。
228.实施方案221-227中任一项的方法,其中所述核酸条形码分子包含独特分子标识符序列。
229.实施方案221-228中任一项的方法,其中所述核酸条形码分子包含测序引物。
230.实施方案221-229中任一项的方法,其中所述核酸条形码分子包含设置在所述第二反应部分与所述核酸条形码分子的另一序列之间的间隔子序列。
231.实施方案221-230中任一项的方法,其中将所述核酸条形码分子偶联至珠粒。
232.实施方案231的方法,其中所述珠粒是凝胶珠粒。
233.实施方案231或232的方法,其中所述核酸条形码分子经由不稳定部分偶联至所述珠粒。
234.实施方案231-233中任一项的方法,其中所述珠粒包含多个偶联至所述珠粒的核酸条形码分子,其中所述多个核酸条形码分子包含所述核酸条形码分子。
235.实施方案234的方法,其中所述珠粒包含至少10,000个偶联至所述珠粒的核酸条形码分子。
236.实施方案235的方法,其中所述珠粒包含至少100,000个偶联至所述珠粒的核酸条形码分子。
237.实施方案236的方法,其中所述珠粒包含至少1,000,000个偶联至所述珠粒的核酸条形码分子。
238.实施方案237的方法,其中所述珠粒包含至少10,000,000个偶联至所述珠粒的核酸条形码分子。
239.实施方案234-238中任一项的方法,其中所述多个核酸条形码分子以可释放的方式偶联至所述珠粒。
240.实施方案239的方法,其中所述多个核酸条形码分子在施加刺激后可从所述珠粒释放。
241.实施方案240的方法,其中所述刺激选自由以下组成的组:热刺激、光刺激和化学刺激。
242.实施方案241的方法,其中所述刺激是还原剂。
243.实施方案242的方法,其中所述刺激是二硫苏糖醇。
244.实施方案240-243中任一项的方法,其中所述刺激的施加引起以下中的一种或多种:(i)所述多个核酸条形码分子的核酸条形码分子与所述珠粒之间的连接的裂解,以及(ii)所述珠粒的降解,从而从所述珠粒释放所述多个核酸条形码分子的核酸条形码分子。
245.实施方案231-245中任一项的方法,其中所述珠粒提供于所述分区中,并且其中在所述分区内从所述珠粒释放所述核酸条形码分子。
246.实施方案221-245中任一项的方法,所述方法还包括从所述分区回收所述条形码化核酸分子。
247.实施方案246的方法,其中所述分区是液滴,并且其中从所述分区回收所述条形码化核酸分子包括使所述液滴破碎或破裂。
248.实施方案221-247中任一项的方法,其中所述第一探针的所述第一反应部分包含叠氮化物部分。
249.实施方案221-248中任一项的方法,其中所述第二探针的所述第二反应部分包含炔烃部分。
250.实施方案221-249中任一项的方法,其中在所述与探针连接的核酸分子中所述第一探针经由连接子连接至所述第二探针,其中所述连接子包含三唑部分。
251.实施方案221-247中任一项的方法,其中所述第一探针的所述第一反应部分包含硫代磷酸酯部分。
252.实施方案221-247或251中任一项的方法,其中所述第二探针的所述第二反应部分包含碘化物部分。
253.实施方案221-247、251或252中任一项的方法,其中在所述与探针连接的核酸分子中所述第一探针经由连接子连接至所述第二探针,其中所述连接子包含硫代磷酸酯键。
254.实施方案221-247中任一项的方法,其中所述第一探针的所述第一反应部分包含胺部分。
255.实施方案221-247或254中任一项的方法,其中所述第二探针的所述第二反应部分包含磷酸酯部分。
256.实施方案221-247、254或255中任一项的方法,其中在所述与探针连接的核酸分子中所述第一探针经由连接子连接至所述第二探针,其中所述连接子包含磷酰胺酯氨基磷酸酯键。
257.实施方案221-256中任一项的方法,所述方法还包括使与所述核酸分子杂交的所述条形码化核酸产物经受足以进行扩增反应的条件,以产生扩增产物,所述扩增产物包含所述条形码序列或其互补物和所述探针序列或其互补物。
258.实施方案257的方法,其中所述扩增反应是聚合酶链式反应。
259.实施方案257或258的方法,其中所述扩增反应是在所述分区内执行。
260.实施方案259的方法,所述方法还包括从所述分区回收所述扩增产物。
261.实施方案257或258的方法,其中所述扩增反应是在所述分区外执行。
262.实施方案260或261的方法,所述方法还包括对所述扩增产物进行测序。
263.实施方案221-262中任一项的方法,其中所述探针还包含条形码序列或独特分子标识符。
264.实施方案221-263中任一项的方法,其中所述探针包含已知序列。
265.实施方案221-264中任一项的方法,其中所述探针包含简并序列。
266.实施方案221-265中任一项的方法,其中所述探针包含可裂解位点,其中所述可裂解位点可使用热、光、化学或生物刺激裂解。
267.实施方案221-266中任一项的方法,其中所述探针包含转座位点。
268.实施方案221-267中任一项的方法,其中所述样品包含细胞,并且其中所述核酸分子含于所述细胞内。
269.实施方案268的方法,所述方法还包括在(a)之后,透化所述细胞,从而接近所述核酸分子。
270.实施方案268的方法,所述方法还包括在(a)之后,溶解所述细胞,从而从所述细胞释放所述核酸分子。
271.实施方案268-270中任一项的方法,其中所述细胞是原核细胞。
272.实施方案268-270中任一项的方法,其中所述细胞是真核细胞。
273.实施方案268-270中任一项的方法,其中所述细胞是淋巴细胞。
274.实施方案268-270中任一项的方法,其中所述细胞是B细胞。
275.实施方案268-270中任一项的方法,其中所述细胞是T细胞。
276.实施方案268-270中任一项的方法,其中所述细胞是人细胞。
277.实施方案268-276中任一项的方法,其中所述细胞是固定的悬浮细胞或福尔马林固定的石蜡包埋的细胞。
278.实施方案268-277中任一项的方法,其中所述细胞提供在所述分区内。
279.实施方案221-278中任一项的方法,其中所述核酸分子是单链核酸分子。
280.实施方案221-279中任一项的方法,其中所述核酸分子是核糖核酸(RNA)分子。
281.实施方案280的方法,其中所述核酸分子是信使RNA(mRNA)分子。
282.实施方案280或281的方法,其中所述核酸分子在所述核酸分子的末端包含多聚A序列。
283.实施方案280或281的方法,其中所述RNA分子不包含多聚A序列。
284.实施方案280-283中任一项的方法,其中所述核酸分子包含非翻译区(UTR)。
285.实施方案280-284中任一项的方法,其中所述核酸分子包含5′帽结构。
286.实施方案221-279中任一项的方法,其中所述核酸分子是脱氧核糖核酸(DNA)分子。
287.实施方案221-286中任一项的方法,其中所述分区还包含一种或多种选自由以下组成的组的试剂:荧光团、寡核苷酸、引物、核酸条形码分子、条形码、缓冲剂、三磷酸脱氧核苷酸、DNA夹板、洗涤剂、还原剂、螯合剂、氧化剂、纳米颗粒、抗体和酶。
288.实施方案221-287中任一项的方法,其中所述分区还包含一种或多种选自由以下组成的组的试剂:温度敏感性酶、pH敏感性酶、光敏感性酶、蛋白酶、连接酶、聚合酶、逆转录酶、限制酶、核酸酶、蛋白酶抑制剂和核酸酶抑制剂。
289.实施方案288的方法,其中所述聚合酶是选自以下的组的聚合酶:DNA聚合酶、RNA聚合酶、Hot Start聚合酶和Warm start聚合酶
290.实施方案221-289中任一项的方法,其中所述样品包含细胞珠粒,并且其中所述核酸分子含于所述细胞珠粒内。
291.实施方案221-290中任一项的方法,其中(a)-(c)是在无逆转录下执行。
292.实施方案1-33中任一项的方法,其中针对多个核酸分子、多个第一探针、多个第二探针、多个条形码序列和多个分区重复(a)-(d),其中在(d)中,多个与探针缔合的核酸分子在多个分区中进行分区,其中所述多个分区的每个分区包含所述多个条形码序列的不同条形码序列。
293.实施方案292的方法,其中(c)包括产生多个与探针缔合的核酸分子,并且其中(c)在额外多个分区中执行,所述额外多个分区与所述多个分区不同。
294.实施方案293的方法,其中所述多个分区是多个液滴,并且其中所述多个额外分区是多个孔。
295.实施方案293或294的方法,其中所述多个第一探针或所述多个第二探针包含多个分区条形码序列。
296.实施方案295的方法,其中在(c)中在所述额外多个分区中产生的所述多个与探针缔合的核酸分子的每个与探针缔合的核酸分子包括所述多个分区条形码序列的分区条形码序列。
297.实施方案296的方法,其中所述额外多个分区的每个额外分区包含所述多个分区条形码序列的不同分区条形码序列。
298.实施方案297的方法,所述方法还包括在(d)之前,从所述额外多个分区回收所述多个与探针缔合的核酸分子。
299.实施方案298的方法,其中(d)包括使用包含所述多个条形码序列的多个核酸条形码分子将所述多个条形码序列附连至所述多个与探针缔合的核酸分子的第一探针。
300.实施方案299的方法,其中所述多个分区的每个分区包含所述多个条形码序列的不同条形码序列。
额外实施方案
在一些情况下,本公开提供了一种根据以下额外实施方案的方法:
1.一种分析包含核酸分子的样品的方法,所述方法包括:
a.提供:
(i)包含所述核酸分子的样品,其中所述核酸分子包含第一靶标区域和第二靶标区域,其中所述第一靶标区域和所述第二靶标区域设置在所述核酸分子的同一条链上;
(ii)第一探针,所述第一探针包含第一探针序列和第二探针序列,其中所述第一探针的所述第一探针序列与所述核酸分子的所述第一靶标区域互补;以及
(iii)第二探针,所述第二探针包含第三探针序列,其中所述第二探针的所述第三探针序列与所述核酸分子的所述第二靶标区域互补;
b.使所述样品经受足以实现以下的条件:(i)使所述第一探针的所述第一探针序列与所述核酸分子的所述第一靶标区域杂交,以及(ii)使所述第二探针的所述第三探针序列与所述核酸分子的所述第二靶标区域杂交,得到与探针缔合的核酸分子;
c.使所述与探针缔合的核酸分子经受足以得到与探针连接的核酸分子的条件,所述与探针连接的核酸分子包含连接至所述第二探针的所述第一探针;以及
d.在分区内,将条形码序列附连至所述与探针连接的核酸分子。
2.实施方案1的方法,其中所述分区是多个孔中的一个孔。
3.实施方案1的方法,其中所述分区是多个液滴中的一个液滴。
4.实施方案1-3中任一项的方法,其中(d)包括(i)在所述分区中提供包含结合序列和条形码序列的核酸条形码分子,其中所述结合序列与所述第一探针的所述第二探针序列互补,以及(ii)使所述分区经受足以使所述结合序列与所述第二探针序列杂交的条件。
5.实施方案4的方法,所述方法还包括使所述分区经受足以进行核酸延伸反应的条件,以产生条形码化核酸分子,所述条形码化核酸分子包含与所述第一探针对应的序列、与所述第二探针对应的序列和与所述条形码序列对应的序列。
6.实施方案4的方法,所述方法还包括使所述分区经受足以将所述与探针连接的核酸分子连接至所述核酸条形码分子的条件,以产生条形码化核酸分子,所述条形码化核酸分子包含与所述第一探针对应的序列、与所述第二探针对应的序列和与所述条形码序列对应的序列。
7.实施方案5或6的方法,所述方法还包括使所述条形码化核酸分子经受足以进行扩增反应的条件,以产生扩增产物,所述扩增产物包含包括与所述第一探针对应的所述序列、与所述第二探针对应的所述序列和与所述条形码序列对应的所述序列的核酸分子。
8.实施方案7的方法,其中所述扩增反应包含引物的使用,所述引物包含一个或多个功能序列,并且其中所述扩增产物包含还包含所述一个或多个功能序列的核酸分子。
9.实施方案7或8中任一项的方法,其中所述扩增是等温扩增。
10.实施方案7-9中任一项的方法,其中所述扩增反应是在所述分区内执行。
11.实施方案10的方法,所述方法还包括从所述分区回收所述扩增产物。
12.实施方案7-9中任一项的方法,其中所述扩增反应是在所述分区外执行。
13.实施方案7-12中任一项的方法,所述方法还包括对所述扩增产物或其衍生物进行测序。
14.实施方案1-3中任一项的方法,所述方法还包括(i)提供包含与所述第二探针序列互补的第一序列和第二序列的夹板寡核苷酸,以及(ii)使所述分区经受足以使所述夹板寡核苷酸的所述第一序列与所述第二探针序列杂交的条件。
15.实施方案13的方法,其中在(c)之前所述夹板寡核苷酸的所述第一序列与所述第二探针序列杂交。
16.实施方案13的方法,其中在(c)之后所述夹板寡核苷酸的所述第一序列与所述第二探针序列杂交。
17.实施方案13-16中任一项的方法,其中(d)包括(i)在所述分区中提供包含结合序列和条形码序列的核酸条形码分子,其中所述结合序列与所述夹板寡核苷酸的所述第二序列互补,以及(ii)使所述分区经受足以使所述结合序列与所述夹板寡核苷酸的所述第二序列杂交的条件。
18.实施方案17的方法,其中所述核酸条形码分子的所述结合序列包含一个或多个核糖碱基。
19.实施方案17或18的方法,所述方法还包括使(i)与所述第二探针序列杂交的所述夹板寡核苷酸和(ii)所述核酸条形码分子经受足以将所述与探针连接的核酸分子接合至所述核酸条形码分子的条件。
20.实施方案17-19中任一项的方法,所述方法还包括使(i)与所述第二探针序列杂交的所述夹板寡核苷酸和(ii)所述核酸条形码分子经受足以进行核酸延伸反应的条件,以产生条形码化核酸分子,所述条形码化核酸分子包含与所述第一探针对应的序列、与所述第二探针对应的序列和与所述条形码序列对应的序列。
21.实施方案19或20中任一项的方法,所述方法还包括使所述条形码化核酸分子经受足以进行扩增反应的条件,以产生扩增产物,所述扩增产物包含包括与所述第一探针对应的所述序列、与所述第二探针对应的所述序列和与所述条形码序列对应的所述序列的核酸分子。
22.实施方案21的方法,其中所述扩增反应是聚合酶链式反应。
23.实施方案21或22的方法,其中所述扩增反应是在所述分区内执行。
24.实施方案23的方法,所述方法还包括从所述分区回收所述扩增产物。
25.实施方案21或22的方法,其中所述扩增反应是在所述分区外执行。
26.实施方案21-25中任一项的方法,其中所述扩增反应是等温扩增。
27.实施方案21-26中任一项的方法,所述方法还包括对所述扩增产物或其衍生物进行测序。
28.实施方案4-27中任一项的方法,其中所述核酸条形码分子还包含独特分子标识符序列、测序引物序列和/或部分测序引物序列。
29.实施方案4-28中任一项的方法,其中在(c)之后,所述与探针缔合的核酸分子与所述核酸条形码分子共分区。
30.实施方案4-28中任一项的方法,其中在(a)之后,所述核酸分子与所述第一探针、所述第二探针和所述核酸条形码分子共分区。
31.实施方案30的方法,其中(c)是在所述分区内执行。
32.实施方案31的方法,其中(b)和(c)是在所述分区内执行。
33.实施方案4-32中任一项的方法,其中所述第二探针包含第四探针序列,并且其中所述方法还包括在所述分区中提供核酸结合分子,其中所述核酸结合分子包含与所述第二探针的所述第四探针序列互补的第二结合序列。
34.实施方案33的方法,所述方法还包括在所述分区内使所述第二结合序列与所述第二探针的所述第四探针序列杂交。
35.实施方案4-34中任一项的方法,其中将所述核酸条形码分子偶联至珠粒。
36.实施方案35的方法,其中所述珠粒是凝胶珠粒。
37.实施方案35或36的方法,其中所述核酸条形码分子经由不稳定部分偶联至所述珠粒。
38.实施方案35-37中任一项的方法,其中所述珠粒包含多个偶联至所述珠粒的核酸条形码分子,其中所述多个核酸条形码分子包含所述核酸条形码分子。
39.实施方案38的方法,其中所述珠粒包含至少100,000个偶联至所述珠粒的核酸条形码分子。
40.实施方案38或39的方法,其中所述多个核酸条形码分子以可释放的方式偶联至所述珠粒。
41.实施方案40的方法,其中所述多个核酸条形码分子在施加刺激后可从所述珠粒释放。
42.实施方案41的方法,其中所述刺激选自由以下组成的组:热刺激、光刺激、生物刺激和化学刺激。
43.实施方案42的方法,其中所述刺激是还原剂。
44.实施方案41-43中任一项的方法,其中所述刺激的施加引起以下中的一种或多种:(i)所述多个核酸条形码分子的核酸条形码分子与所述珠粒之间的连接的裂解,以及(ii)所述珠粒的降解,从而从所述珠粒释放所述多个核酸条形码分子的核酸条形码分子。
45.实施方案35-44中任一项的方法,其中所述珠粒提供于所述分区中,并且其中在所述分区内从所述珠粒释放所述核酸条形码分子。
46.实施方案1-45中任一项的方法,其中(c)是在(d)之前执行。
47.实施方案1-45中任一项的方法,其中(d)是在(c)之前执行。
48.实施方案1-47中任一项的方法,其中所述第一探针或所述第二探针还包含条形码序列或独特分子标识符。
49.实施方案1-48中任一项的方法,其中所述第二探针包含第四探针序列,所述第四探针序列与所述核酸分子的第三靶标区域杂交。
50.实施方案49的方法,其中所述第二靶标区域与所述第三靶标区域不相邻,并且其中所述第二探针的所述第三探针序列和所述第四探针序列被连接子序列隔开。
51.实施方案1-50中任一项的方法,其中所述第一探针的所述第一探针序列包含第一反应部分并且所述第二探针的所述第三探针序列包含第二反应部分,其中,在(b)之后,所述第一反应部分与所述第二反应部分相邻。
52.实施方案51的方法,其中(c)包括使所述第一反应部分和所述第二反应部分经受足以将所述第一探针序列连接至所述第三探针序列的条件。
53.实施方案51或52的方法,其中所述第一探针的所述第一反应部分或所述第二探针的所述第二反应部分包含叠氮化物部分、炔烃部分、硫代磷酸酯部分、碘化物部分、胺部分或磷酸酯部分。
54.实施方案51-53中任一项的方法,其中在所述与探针连接的核酸分子中所述第一探针经由连接子连接至所述第二探针,其中所述连接子包含三唑部分、硫代磷酸酯键或磷酰胺酯氨基磷酸酯键。
55.实施方案1-50中任一项的方法,其中(c)包括执行酶促接合反应和/或延伸反应。
56.实施方案55的方法,其中所述酶促接合反应和/或所述延伸反应包括使用选自由以下组成的组的酶:T4 RNL2、SplintR、T4 DNA连接酶、PBCV1、DNA聚合酶和Mu聚合酶,或它们的衍生物。
57.实施方案1-56中任一项的方法,其中在(a)之前,所述第一探针经由一个或多个连接序列连接至所述第二探针。
58.实施方案57的方法,其中所述一个或多个连接序列包含以下中的一个或多个:间隔子序列、测序引物或其互补序列、捕获序列、限制位点、转座位点和独特分子标识符序列。
59.实施方案57或58的方法,其中所述一个或多个连接序列包含热不稳定的、可光裂解的或可酶促裂解的位点。
60.实施方案1-59中任一项的方法,其中所述第一靶标区域与所述第二靶标区域相邻。
61.实施方案1-59中任一项的方法,其中所述第一靶标区域和所述第二靶标区域由设置在所述第一靶标区域与所述第二靶标区域之间的间隙区域隔开。
62.实施方案61的方法,其中所述间隙区域的长度为至少一个核苷酸。
63.实施方案62的方法,其中所述间隙区域的长度为至少10个核苷酸。
64.实施方案63的方法,其中所述间隙区域的长度为至少100个核苷酸。
65.实施方案1-64中任一项的方法,所述方法还包括使用核酸外切酶消化一个或多个核酸分子或其部分。
66.实施方案1-65中任一项的方法,其中所述第一探针或所述第二探针包含已知序列或简并序列。
67.实施方案1-66中任一项的方法,其中所述第一探针或所述第二探针包含基于Phi-29的滚环式扩增序列。
68.实施方案1-67中任一项的方法,其中所述第一探针或所述第二探针包含可裂解位点,其中所述可裂解位点可使用热、光、化学或生物刺激裂解。
69.实施方案1-68中任一项的方法,所述方法还包括使所述第一探针或所述第二探针与转座酶接触。
70.实施方案1-69中任一项的方法,其中所述样品包含细胞,并且其中所述核酸分子含于所述细胞内。
71.实施方案70的方法,所述方法还包括在(a)之后,溶解或透化所述细胞,从而接近所述核酸分子。
72.实施方案70或71的方法,其中所述细胞是原核细胞。
73.实施方案70或71的方法,其中所述细胞是真核细胞。
74.实施方案70或71的方法,其中所述细胞是人细胞。
75.实施方案70-74中任一项的方法,其中所述细胞是固定的悬浮细胞或福尔马林固定的石蜡包埋的细胞。
76.实施方案70-75中任一项的方法,其中所述细胞提供在所述分区内。
77.实施方案76的方法,其中所述细胞是单细胞。
78.实施方案1-77中任一项的方法,其中所述核酸分子是核糖核酸(RNA)分子。
79.实施方案78的方法,其中所述核酸分子是信使RNA(mRNA)分子。
80.实施方案78或79的方法,其中所述核酸分子在所述核酸分子的末端包含多聚-A序列。
81.实施方案1-77中任一项的方法,其中所述核酸分子是脱氧核糖核酸(DNA)分子。
82.实施方案1-81中任一项的方法,其中所述分区还包含一种或多种选自由以下组成的组的试剂:荧光团、寡核苷酸、引物、核酸条形码分子、条形码、缓冲剂、三磷酸脱氧核苷酸、DNA夹板、洗涤剂、还原剂、螯合剂、氧化剂、纳米颗粒、抗体、温度敏感性酶、pH敏感性酶、光敏感性酶、蛋白酶、连接酶、聚合酶、逆转录酶、限制酶、核酸酶、蛋白酶抑制剂和核酸酶抑制剂。
83.实施方案82的方法,其中所述聚合酶是选自以下的组的聚合酶:DNA聚合酶、RNA聚合酶、Hot Start聚合酶和Warm start聚合酶
84.实施方案1-83中任一项的方法,其中所述样品包含细胞珠粒,并且其中所述核酸分子含于所述细胞珠粒内。
85.实施方案1-84中任一项的方法,其中(a)-(c)是在无逆转录下执行。
虽然本文已经展示和描述了本发明的优选实施方案,但是本领域的技术人员显而易见这类实施方案仅仅是为了举例而提供。不意图本发明受本说明书内所提供的特定实例限制。虽然本发明已经参考前述说明书进行了描述,但是对本文的实施方案的描述和说明并不意在以限制性意义进行解释。在不偏离本发明的情况下本领域技术人员现将进行各种改变、变化和取代。此外,应了解本发明的所有方面不限于本文阐述的取决于各种条件和变量的具体描述、配置或相对比例。应了解,可以采用本文所述的本发明的实施方案的多个替换方案实施本发明。因此,预期本发明还将涵盖任何此类替换方案、修改、改变或等效方案。意图以下权利要求书界定本发明的范围,并且因此涵盖在这些权利要求书范围内的方法和结构和它们的等效物。