WO2022237035A1

WO2022237035A1 - 一种超高通量单细胞测序方法

Info

Publication number: WO2022237035A1
Application number: PCT/CN2021/119166
Authority: WO
Inventors: 郭国骥; 廖原; 陈海德; 韩晓平; 王晶晶; 张国栋; 杨蕾
Original assignee: 浙江大学
Priority date: 2021-05-12
Filing date: 2021-09-17
Publication date: 2022-11-17
Also published as: US20240182962A1

Abstract

本发明公开了一种超高通量单细胞测序方法，本发明超高通量单细胞测序方法先使用反转录序列对细胞内进行一次细胞内反转录，或者先使用特异性分子标签转座酶包埋复合物进行细胞核内染色质转座酶可及性基因组序列的转座，再将细胞或细胞核通过微孔板技术或微流控技术使一个分子标记微珠与一个或多个细胞处于分隔的空间中，并在裂解液作用下裂解细胞/细胞核，在桥连引物的帮助下将序列与分子标记微珠上的分子标记序列连接，并通过PCR扩增获得大量序列，构建获得cDNA测序文库，然后进行高通量测序，一次测序便可以获得上百万个单细胞的特异性转录组/基因组开放性信息。大大提高了单细胞测序的通量。

Description

一种超高通量单细胞测序方法

技术领域

本发明涉及单细胞测序技术领域，特别是涉及一种超高通量单细胞测序方法。

背景技术

自2009年汤富酬提出单细胞测序技术以来，单细胞高通量测序平台就如雨后春笋般不断涌现，例如以微流控为主的Drop-seq和inDrop-seq平台，以微孔板为主的Microwell-seq和Seq-well平台以及常见的商用平台10×Gennomics。然而，以微孔板为例，当细胞投入量达到一定程度时，容易出现一个微孔中含有两个甚至更多细胞的情况出现，导致细胞与细胞间转录本的污染。为了避免这种现象的产生，通过分析发现当微孔板中细胞的落孔率约为微孔板总孔数的1/10时，可实现每个微珠仅捕获一个细胞。但这样会导致大量的液滴或者微孔仅仅只有空微珠而没有细胞，大大降低了实验的效率，增加了实验成本，导致这些平台单次实验的细胞通量只能以万为单位。然而，以小鼠和人为例，单个物种个体的细胞总量超过万亿，当下平台通量远远达不到测序的要求，测序通量的不足容易丢失大量的生物信息，因此提高单次测序的通量显得尤为重要。

近年来以单个细胞为独立反应体系的超高通量技术也在不断发展，例如sci-RNA-seq和SPLiT-seq，他们首先将新鲜细胞固定打孔，利用反转录给每一个细胞带上一轮独有的分子标记，随后利用split-pool再给细胞带上不同的分子标记，最终通过分子标记的多重组合使得每一个细胞中的转录本带上独有的分子标记，大大提升了单次实验的通量。但由于这些方法是基于细胞体内的连接反应，存在反应效率低、细胞与细胞之间的转录本易泄露导致污染率较高等问题，降低了方法的实用性。

2019年12月奥地利科学院分子医学研究中心的Paul等(Datlinger,P.,et al.,Ultra-high throughput single-cell RNA sequencing by combinatorial fluidic indexing.BioRxiv,2019.)利用反转录给固定的细胞带上一轮含有96/384种的分子标记后，结合微流控的方法将单细胞测序的通量提高了15倍。但以微流控为基础的测序平台细胞并不是平行进行实验的，批次效应问题比较显著，UMI/Gene比值异常，且存在设备昂贵、不易携带、测序成本高等缺点。

在基因组中，大部分的染色质紧密缠绕在细胞核内，不具有转录活性。染色质状态以细胞类型特定的方式进行动态调节，在特定细胞状态下部分致密的染色质变得松散，这些松散的染色质被称为开放染色质(open chromatin)或可接近性染色质(accessible chromatin)。检测细胞染色质的开放情况，可以得到细胞的转录调控信息，比如转录因子在什么位置能够与基因启动子结合、细胞的哪些基因可能被高效转录等。常用的检测手段是ATAC-seq、DNase-seq、MNase-seq、FAIRE-seq和ChIP-seq等，这些方法基于不同的原理对染色质开放区域进行打断和标记，其中ATAC-seq(高通量染色质转座酶可及性测序方法，assay for transposase-accessible chromatin with high-throughput sequencing)使用修饰的Tn5转座酶，可以将特定DNA序列作为转座子随机插入到染色质的开放区域，能够完整地将整个开放区域的序列直接捕获下来，所以ATAC-seq现在被广泛应用到开放染色体的测序当中。

发明内容

本发明提供了一种超高通量单细胞测序方法，该单细胞测序方法能够一次性获得上百万个单细胞的特异性转录组信息。

本发明首先提供了一种超高通量单细胞测序方法，包括以下步骤：

(1)准备如下试剂：

a)分子标记微珠，所述分子标记微珠包括微珠本体和耦联的分子标记序列，该分子标记序列包括顺序排列的：

通用引物序列，作为PCR扩增时的引物结合区域；

第一细胞标签序列；

第一搭桥序列；

b)反转录序列，用于细胞内反转录，所述反转录序列包括顺序排列的：

第二搭桥序列；

第二细胞标签序列，与第一细胞标签序列配合组成细胞标签序列，所述细胞标签序列用于标识所构建测序文库中各序列所对应的mRNA取自的细胞；

分子标签序列，用于标识所构建测序文库中各序列所对应的mRNA；

多聚T尾，用于与细胞中带有poly-A序列的mRNA互补配对；

c)桥连引物，用于将上述a)中的标记序列与b)中的反转录序列进行连接，所述桥连引物两端具有分别与所述第一搭桥序列和第二搭桥序列互补配对的序列；

(2)取待测序的细胞样品，加入反转录序列进行细胞内反转录，使反转录序列的多聚T尾端连上将细胞内mRNA序列反转录后得到的cDNA序列，获得反转录序列-cDNA序列；

(3)将步骤(2)经细胞内反转录后的细胞通过微孔板技术或微流控技术使一个分子标记微珠与一个或多个细胞处于分隔的空间中，并在裂解液作用下裂解细胞，孵育，通过桥连引物分别与所述第一搭桥序列和第二搭桥序列互补配对，然后使用连接酶连接，使第一搭桥序列和第二搭桥序列连接获得与微珠耦联的分子标记序列-反转录序列-cDNA序列；

(4)收集耦联有分子标记序列-反转录序列-cDNA序列的微珠，进行PCR扩增获得带有第一细胞标签序列、第二细胞标签序列和分子标签序列的cDNA序列；

(5)将步骤(4)获得的产物构建cDNA测序文库，然后进行高通量测序，获得上百万个单细胞的特异性转录组信息。

该测序方法为一种转录组测序方法。通过将细胞标签序列分为第一细胞标签序列和第二细胞标签序列，第二细胞标签序列以反转录序列的形式在细胞内反转录时在各mRNA的反转录序列中引入，从而在出现一个分子标记微珠结合了多个细胞的情况下，能够通过这段第二细胞标签序列来区分开，否则，仅依靠分子标记微珠上的第一细胞标签序列，就无法区分结合同一分子标记微珠的多个细胞来源的序列。现有技术中，为了避免一个分子标记微珠结合多个细胞，需要严格控制条件，比如，将实验的微孔板上的微孔尽量制备成只容纳一个分子标记微珠和一个细胞的大小(这种情况下，分子标记微珠和细胞的相对大小不宜过大，不然，不容易实现一个分子标记微珠结合一个细胞)，同时需要控制细胞的落孔率在较低水平，以便细胞足够分散开，但还是无法避免出现一个分子标记微珠结合多个细胞的情况，而最终测序结果会将这种情况下的序列误判为来自同一个细胞。

同时，第二细胞标签序列与第一细胞标签序列配合组成细胞标签序列，增加了细胞标签序列的组合数量，可以一次实现更大量细胞的检测。

本发明又提供了一种超高通量单细胞测序方法，包括以下步骤：

(1)准备如下试剂：

通用引物序列，作为PCR扩增时的引物结合区域；

第一细胞标签序列；

第一搭桥序列；

b)特异性分子标签转座酶包埋复合物，包括Tn5转座酶和特异性分子标签序列，其中特异性分子标签序列包括顺序排列的：

第二搭桥序列；

第二细胞标签序列，与第一细胞标签序列配合组成细胞标签序列，所述细胞标签序列用于标识所构建测序文库中各序列来源的细胞；

Mosaic Ends序列，用于与Tn5转座酶结合，所述Mosaic Ends序列为双链结构，其中一条链与第二细胞标签序列连接；

c)桥连引物，用于将上述a)中的分子标记序列与b)中的特异性分子标签序列进行连接，所述桥连引物两端具有分别与所述第一搭桥序列和第二搭桥序列互补配对的序列；

(2)取待测序的细胞样品，提取细胞核；

(3)向步骤(2)提取的细胞核中加入特异性分子标签转座酶包埋复合物进行转座反应；

(4)将经过转座反应后的细胞核通过微孔板技术或微流控技术使一个分子标记微珠与一个或多个细胞核处于分隔的空间中，并在裂解液作用下裂解细胞核，孵育，通过桥连引物分别与所述第一搭桥序列和第二搭桥序列互补配对，然后使用连接酶连接，使第一搭桥序列和第二搭桥序列连接获得与微珠耦联的分子标记序列-特异性分子标签序列-染色质转座酶可及性基因组序列；

(5)收集耦联有分子标记序列-特异性分子标签序列-染色质转座酶可及性基因组序列的微珠，进行PCR扩增获得带有第一细胞标签序列、第二细胞标签序列和特异性分子标签序列的染色质转座酶可及性基因组序列；

(6)将步骤(5)获得的产物构建染色质可及性测序文库，然后进行高通量测序，获得上百万个单细胞的染色质转座酶可及性基因组序列信息。

该测序方法为一种染色质转座酶可及性测序方法。通过将细胞标签序列分为第一细胞标签序列和第二细胞标签序列，第二细胞标签序列在Tn5转座酶转座反应时带入到基因组相应的序列上，从而在出现一个分子标记微珠结合了多个细胞的情况下，能够通过这段第二细胞标签序列来区分开，否则，仅依靠分子标记微珠上的第一细胞标签序列，就无法区分结合同一分子标记微珠的多个细胞来源的序列。

优选的，所述微珠与分子标记序列耦联方式为：分子标记序列5’端的核苷酸的C6位上使用胺基取代羟基，微珠表面修饰有羧基，通过羧基与氨基缩合耦联。由于分子标记序列为单链寡核苷酸，其5’端的第一个核苷酸上的羟基用胺基取代，微珠表面修饰羧基，通过氨基与羧基的反应，将分子标记序列耦联到微珠上。

优选的，所述分子标签序列至少部分为随机合成的随机序列。

优选的，所述第一细胞标签序列包括多个特异性片段，所述第二细胞标签序列包括至少一个特异性片段，不同位置的特异性片段选自相同的或不同的特异性片段库，所述第一细胞标签序列和第二细胞标签序列利用所述特异性片段的排列组合方式不同标识细胞。

更优选的，所述分子标记微珠的制备方法包括以下步骤：

(1)用于合成分子标记序列的引物根据特异性片段的数量分为多条引物，每条引物包含一条特异性片段，各引物之间具有用于搭桥连接、互补的接头序列，其中对应于分子标记序列5’端的那条引物还包括所述通用引物序列，对应于分子标记序列3’端的那条引物还包括所述第一搭桥序列；

(2)将对应于分子标记序列5’端的那条引物与微珠本体耦联，然后通过PCR方法将剩余引物依次退火、延伸，从5’端到3’依次串接分子标记序列的其余特异性片段，制备得到所述分子标记微珠。

优选的，所述分子标记序列为：5’-TTTAGGGATAACAGGGTAATAAGCAGTGG TATCAACGCAGAGTACGTNNNNNNCGACTCACTACAGGGNNNNNNTCGGTGACACGATCGNNNNNNTCGTCGGCAGCGTC-3’，其中，N表示A/T/C/G中的任一种，为随机合成。所述反转录序列为：5’-[phos]ACACTCTTTCCCTACACGACGNNNNNN nnnnnnnnnnTTTTTTTTTTTTTTTTTTTTTTTTTVN-3’，其中，5’端加上磷酸化修饰为连接反应提供磷酸基团；N表示A/T/C/G中的任一种，为随机合成；n表示A/T/C/G中的任一种，为随机合成；3’端V表示A/C/G中的任一种，V为随机合成。所述特异性分子标签序列为：5’-ACACTCTTTCCCTACACGACGNNNNNNNNNNAGATGTGTA TAAGAGACAG-3’，其中，N表示A/T/C/G中的任一种，为随机合成，互补形成双链的Mosaic Ends序列为：5’-CTGTCTCTTATACACATCT-3’。所述桥连引物为：5’-CGT CGTGTAGGGAAAGAGTGTGACGCTGCCGACGA[ddC]-3’，ddC为双脱氧胞苷修饰。或者3’端的ddC去掉。反转录序列中，6×N的随机序列作为第二细胞标签序列，10×n的随机序列作为分子标签序列。

对于染色质转座酶可及性测序来说，所述特异性分子标签转座酶包埋复合物中一个转座酶复合物携带两个基因片段，两个基因片段均为所述特异性分子标签序列，或者一个基因片段为所述特异性分子标签序列，另一个基因片段为通用型序列，通用型序列包括：

扩增用引物结合序列，作为PCR扩增时的引物结合区域；

Mosaic Ends序列，用于与Tn5转座酶结合，所述Mosaic Ends序列为双链结构，其中一条链与扩增用引物结合序列连接。

优选的，待测序的细胞样品中含有2种或2种以上的细胞。本申请超高通量单细胞测序方法可以实现多种细胞的同时测序。

优选的，所述微珠本体为磁珠；将经细胞内反转录后的细胞(反转录测序)或经过转座反应后的细胞核(染色质转座酶可及性测序)加入到微孔板中，然后加入分子标记微珠，微孔板中的微孔直径大小为刚好容纳一个分子标记微珠和一个或多个细胞/细胞核；细胞或细胞核加入微孔板中的落孔率控制在大于80％；分子标记微珠加入微孔板中的落孔率大于99％。

由于本申请超高通量单细胞测序方法可以实现一个分子标记微珠结合多个细胞，所以在微珠本体为磁珠、用微孔板方法时，可以实现细胞加入微孔板时落孔率的大大提高。

本发明除了在微珠本体为磁珠、用微孔板方法的单细胞测序之外，也可以用于微流控方法的单细胞测序平台。

更优选的，所述微孔板中微孔深度30-160μm、微孔直径20-150μm；所述微珠本体的直径为20-145μm。

更优选的，所述微孔板的制备方法为：(1)在硅片上刻蚀出微孔作为初始模具； (2)在初始模具上浇注聚二甲基硅氧烷，成型后取下聚二甲基硅氧烷成为具有微柱的第二次模具；(3)在第二次模具上浇注热熔的质量体积比为4％～6％的琼脂糖，冷却成型后，取下琼脂糖即为所述微孔板。

本发明超高通量单细胞测序方法能够进行单细胞的超高通量测序，一次测序的细胞数量可以达到上百万个单细胞，大大提高了单细胞测序的通量。

附图说明

图1为蜂窝排列微孔板示意图。

图2为分子标记磁珠制备流程图。

图3为细胞落入微孔板示意图。

图4为构建cDNA文库流程图，其中通用序列包括图2所述通用引物序列，细胞标签序列1，接头序列1，细胞标签序列2，接头序列2，细胞标签序列3。

图5为制备的cDNA测序文库片段大小分布图。

图6为人鼠混合细胞分群对比图。

图7为不同裂解液测序读长/基因对比图。

图8为小鼠睾丸细胞tSNE分析结果图。

图9为接头序列与Tn5转座酶进行接头包埋，其中两种接头序列分别包含特异性分子标签序列和通用型序列，接头序列通过与Tn5裸酶孵育产生Tn5包埋复合物，单个Tn5包埋复合物同时携带特异性分子标签序列和通用型序列。

图10为构建ATAC文库流程图，其中，通用序列包括图1中的通用引物序列、细胞标签序列1、接头序列1、细胞标签序列2、接头序列2和细胞标签序列3；搭桥序列包括搭桥序列1和搭桥序列2。

图11为制备的基因测序文库片段大小分布图。

图12为人鼠混合细胞分群对比图。

图13为人鼠样品DNA片段大小分布图。

图14为人鼠样品peak注释分布图。

图15为小鼠TSS富集图。

图16为小鼠单细胞ATAC和群体ATAC peak重叠分布图。

图17为小鼠单细胞ATAC和群体ATAC read在8号染色体0-25Mbp分布比较图。

图18为双端都标记的Tn5包埋方法构建ATAC文库流程图，其中，通用序列包括图1中的通用引物序列、细胞标签序列1、接头序列1、细胞标签序列2、接头序列2和细胞标签序列3。

具体实施方式

实施例1

1、微孔板制备

根据实验规模设计微孔板大小(比如，人293T细胞和鼠3T3细胞各50万个，孔板大小为1.8cm×1.8cm)，并在硅片上蚀刻出微孔作为初始模具，微孔为圆柱体型，其中微孔深度60μm、微孔直径50μm、孔间距70μm。接下来在硅片上浇注聚二甲基硅氧烷(PDMS)，成型后拿下PDMS成为板上有微柱的第二次模具，最终实验使用的微孔板是浓度为5％(质量比)的琼脂糖(用无酶水配制)，热融后浇注在PDMS微柱板上冷凝成型，此时的琼脂糖板揭下来后就是具有一定厚度的微孔板(图1)。保存时加上对细胞无害的DPBS-EDTA混合液，加盖保存在4℃冰箱中，即做即用能保证微孔板良好的工作状态。

2、分子标记磁珠制备

磁珠购自苏州知益微球科技有限公司(货号MagCOOH-20190725)，表面羧基包被，直径45μm。分子标记磁珠制备过程如图2所示，共4个步骤：

(1)设计分子标记序列，将分子标记序列分成三段，相邻两段之间设置有用于将相邻两段通过PCR连接起来的接头序列，其中5’开始的第一段包括通用引物序列和部分细胞标签序列，最后一段含有部分细胞标签序列及整个分子标签序列、桥连互补序列，除第一段外，其余序列均为相应序列的互补序列。

(2)各段序列如下表1所示。

表1

其中，6×N为细胞标签序列的核心序列，对应每个磁珠的这个核心序列均不同，且对应同一磁珠的三段序列中的6×N序列也不同，由于每个位点有A/T/C/G这4种选择，所以6×N的序列可以有4 ⁶种选择。N表示A/T/C/G中的任一种，为随机合成。

(3)分别合成所有序列，其中所有序列中属于细胞标签序列部分均设计96种序列，每种独立放置，第一段序列5’端的核苷酸的C6位上使用胺基取代羟基。

(4)将等量的磁珠分别与96种第一段序列偶联，然后收集获得96种带修饰的磁珠，混合均匀后，再均分为96等分，与96种第二段序列混合后进行PCR序列延伸，然后再均分为96等分，与96种第三段序列混合后进行PCR序列延伸，然后变性解链获得具有96×96×96种单链寡核苷酸修饰的磁珠。

完成后，分子标记的序列如下：5’-TTTAGGGATAACAGGGTAATAAGCAGTGGTATCAACGCAGAGTACGTNNNNNNCGACTCACTACAGGGNNNNNNTCGGTGACACGATCGNNNNNNTCGTCGGCAGCGTC-3’，可用于超高通量单细胞测序。

实施例2

特异性转录组超高通量单细胞测序。

1、人293T、鼠3T3混合细胞测试。

小鼠胚胎干细胞(ESC)3T3和人胚肾细胞(293T)各500万分别缓慢滴加5-10ml甲醇(-20℃预冷)在-20℃中固定30分钟，同时，将搭桥引物分装至八联管中，每孔6.5μl，再分装至含有0.5μl反转录引物的96孔板中，静置混匀形成每孔共1μl反转录混合引物。桥连引物序列为5’-CGTCGTGTAGGGAAAGAGTGTGACGCTGCCGACGA[ddC]-3’，3’端加上ddC修饰防止搭桥引物反转录时进行延伸导致副产物的产生。

反转录引物(反转录序列)同上述细胞标签序列也为96种，核心序列为6×N，每种引物每孔独立放置，这段6×N随机序列可以作为细胞标签序列的一部分，后续与实施例1中分子标记磁珠上的细胞标签序列组合用于标识后续所构建测序文库中各序列所对应的mRNA取自的细胞，从而共有96×96×96×96种单链寡核苷酸用来标识细胞，足够用于一次性百万级细胞的使用。反转录引物的最后一段的分子标签序列5’端加上磷酸化修饰为连接反应提供磷酸基团，10×n中n表示A/T/C/G中的任一种，为随机合成，3’端V表示A/C/G中的任一种，N表示A/T/C/G中的任一种，随机合成，主要目的是为了使引物结合到polyA尾的末端，避免结合到polyA尾的中间部分，具体的序列如下：5’-[phos]ACACTCTTTCCCTACACGACGNNNNNNnnnnnnnnnnTTTTTTTTTTTTTTTTTTTTTTTTTVN-3’。

配置310μl反转录体系(50μl dNTP，200μl缓冲液，50μl反转录酶，10μl RNA酶抑制剂)，混匀，分装至含有反转录混合引物的96孔板中，每孔3.1μl。随后将固定完成后的两种细胞在500g转速下离心清洗一次，各取250万进行混合。将混匀后的细胞(每孔约5万)平均分装至含有预混反转录体系(6μl细胞悬液，0.5μl dNTP，1μl反转录混合引物，2μl缓冲液，0.5μl反转录酶，0.1μl RNA酶抑制剂)的96孔板中42℃反应1.5小时。反转录结束后，将96孔板中的细胞先利用排枪收集至八联管中，再集中转移至干净的1.5ml EP管中，用DPBS溶液(Gibco公司，货号14190-144)清洗一次，500g离心5分钟。吸取上清液后，将细胞重悬于500μL DPBS溶液中，再将细胞悬液滴加入微孔板中，使大于80％的微孔中落有细胞(图3)。向落有细胞的微孔板中加入20万个分子标记磁珠，置于磁铁上轻轻混匀，使磁珠覆盖99％以上的微孔，使用DPBS溶液洗去多余的分子标记磁珠。向铺满磁珠的微孔板中缓慢滴加200μL裂解液(ddH ₂O，10％SDS，50％甲酰胺(vol/vol)和3×SSC)，室温裂解孵育30分钟，使磁珠上的搭桥序列和细胞上的搭桥引物充分互补杂交。孵育完成后，将微孔板倒置于磁铁上，收集带有分子标记-mRNA复合物的磁珠，转移至1.5ml EP管中，清洗两次，用20μl移液枪吸取残留的液体，向装有分子标记磁珠的EP管中加入连接混合液50μL(T4连接酶2μl，T4缓冲液5μL，RNase抑制剂1μL，dNTP 2μL，30％PEG8000 5μL，ddH ₂O 35μL)，置于37℃反应1小时。

连接反应完成后，把分子标记磁珠在磁力架上清洗三次，吸弃上清，加入外切酶EXON Ⅰ混合液200μL(EXON Ⅰ缓冲液1×，EXON Ⅰ 1×)37℃反应0.5小时，清除磁珠上没有捕获mRNA的单链核苷酸序列。外切结束后，把分子标记磁珠在磁力架上清洗三次，吸弃上清，加入500μL 0.1％的NaOH溶液处理5分钟，获得单链化cDNA，以便于后续二链合成反应。把NaOH处理过的分子标记磁珠在磁力架上清洗三次，清除残留的NaOH，随后加入二链合成混合液100μL(20μL反转录缓冲液，40μL 30％PEG8000，10μL 10mM dNTP，10μL 100μM随机引物，2.5μL Klenow聚合酶和17.5μL ddH ₂O)于37℃反应1小时，其中随机引物序列为5’-AAGCAGTGGTATCAACGCAGAGTGANNNGGNNNB-3’，B表示G/T/C中的一种，N表示A/T/C/G中的任一种，随机合成。随机引物序列将随机结合在NaOH处理的磁珠单链序列上，聚合酶沿该引物3’方向继续合成互补链，其中NNNGGNNNB为随机结合序列。

二链合成反应结束后，把分子标记磁珠在磁力架上清洗三次，吸弃上清，加入PCR试剂混合液(KAPA HiFi Hot Start Ready Mix 1×，TSO-PCR引物0.1μM)。其中，TSO-PCR引物序列为：5’-AAGCAGTGGTATCAACGCAGAGT-3’。PCR程序：98℃预变性3分钟；98℃变性20秒，67℃退火15秒，72℃延伸6分钟，重复12次；72℃延伸5分钟，4℃保温，即得到大量标记cDNA。使用诺唯赞纯化磁珠纯化PCR产物。使用前将纯化磁珠震荡混匀并置于室温至少30分钟，纯化步骤如下：

(1)加50μL纯化磁珠到上述PCR反应体系中，使用移液器混匀10次以上保证整个体系均匀；(2)室温孵育10分钟；(3)将PCR管置于磁力架上5分钟保证纯化磁珠完全吸附；(4)保持PCR管在磁力架上，小心弃去上清；(5)加入200μL新鲜配制的80％乙醇，孵育30秒后弃掉上清；(6)重复上述步骤一次；(7)开盖，空气中干燥8分钟；(8)加入13μL洗脱缓冲液(Elution buffer)到PCR管中覆盖纯化磁珠，将PCR管从磁力架上取下并重悬纯化磁珠；(9)室温孵育2分钟，吸取12μL为最终的cDNA文库(上述反应具体流程见图4)；(10)利用Agilent 2100 Bioanalyzer对cDNA文库片段大小进行分析(图5)，得到的cDNA文库片段在300-1000bp。

以下述cDNA测序文库构建方法构建基因测序文库，基因测序文库构建好后送至瑞普公司进行测序。测序返回的数据经过拆分筛选比对，得到基因表达谱。将这个矩阵文件导入R语言分析，就能将矩阵数据转换为可视化的图。由图6可知，存在极少量双细胞污染，可以达到单细胞高通量测序水平。

2、cDNA测序文库构建。

(1)5ng起始DNA片段化

使用Vazyme公司TD512试剂盒。

(a)于室温解冻5×TTBL(TruePrep Tagment Buffer L)，上下颠倒混匀后备用。确认5×TS(Terminate Solution，反应终止液)处于室温，并轻弹管壁确认有无沉淀。如有沉淀，可于37℃加热并剧烈震荡充分混匀沉淀即会溶解。

(b)在灭菌PCR管中依次添加各反应组分：5×TTBL，4μl；DNA，5ng；TTE Mix V1，5μl；ddH ₂O补足至20μl。

(c)使用移液器轻轻吹打20次充分混匀。

(d)将PCR管置于PCR仪中，设置如下反应程序：55℃10min；10℃保温。

(e)立即向反应产物中加入5μl 5×TS，使用移液器轻轻吹打充分混匀。置于温室放置5min。

(2)PCR富集

(a)将灭菌PCR管置于冰浴中，依次添加各反应组分：ddH ₂O，4μl；步骤1产物，25μl；5×TAB，10μl；P5(10μM)，1μl；N7XX，5μl；TAE，1μl。

使用试剂盒为：TruePrep ^TM Index Kit V2 for

(Vazyme#TD202)，具体实验步骤参照试剂盒使用说明。

(b)使用移液器轻轻吹打充分混匀，将PCR管置于PCR仪中进行如下反应：72℃3min，98℃预变性30sec；98℃变形15sec，60℃退火30sec；72℃延伸3min，共11个循环；4℃保存。

(3)扩增产物长度分选、纯化

使用AMPure XP磁珠进行长度分选和纯化。起始PCR产物体积应为50μl。因PCR过程中样品挥发会导致产物体积不足50μl，进行下面操作之前必须使用灭菌蒸馏水将体积补齐至50μl，否则分选长度会与预期不一致。分选过程中，两轮磁珠使用量(R1和R2)如下：

第一轮AMPure XP磁珠用量R1＝30.0μl(0.60×)第二轮AMPure XP磁珠用量R2＝7.5μl(0.15×)。

其中，“×”数均根据PCR产物体积计算而得，如“0.60×”表示0.60×50μl＝30.0μl。

(a)涡旋震荡混匀AMPure XP磁珠并吸取R1体积至50μl PCR产物中，使用移液器轻轻吹打10次充分混匀。室温孵育5分钟。

(b)将反应管短暂离心并置于磁力架中分离AMPure XP磁珠和液体。待溶液澄清(约5分钟)小心转移上清至干净EP管中，丢弃磁珠。

(c)涡旋震荡混匀AMPure XP磁珠并吸取R2体积至上清中，使用移液器轻轻吹打10次充分混匀。室温孵育5分钟。

(d)将反应管短暂离心并置于磁力架中分离AMPure XP磁珠和液体。待溶液澄清(约5分钟)小心移除上清。

(e)保持EP管始终处于磁力架中，加入200μl新鲜配制的80％乙醇漂洗AMPure XP 磁珠。室温孵育30秒后小心移除上清。

(f)重复步骤5，总计漂洗两次。

(g)保持EP管始终处于磁力架中，开盖空气干燥AMPure XP磁珠10分钟。

(h)将EP管从磁力架中取出，加入13μl灭菌超纯水洗脱。涡旋振荡或使用移液器轻轻吹打充分混匀。将反应管短暂离心并置于磁力架中分离AMPure XP磁珠和液体。待溶液澄清(约5分钟)小心吸取12μl上清至灭菌EP管中，获得测序文库，置于-20℃保存。

实施例3

不同配比裂解液的优化。

同实施例2，带有分子标签的细胞落板后，使用DPBS溶液洗去多余的分子标记磁珠，分别向三个微孔板中加入三种不同配方的裂解液，依次为对照裂解液(0.1M Tris-HCl pH 7.5，0.5M LiCl，1％SDS，10mM EDTA和5mM dithiothreitol)、裂解液20(ddH ₂O，1％SDS，20％甲酰胺和3×SSC)、裂解液50(ddH ₂O，1％SDS，50％甲酰胺和3×SSC)，充分裂解孵育30分钟，后续步骤同实施例2、3。其中SDS起主要的裂解作用，甲酰胺为促进核酸分子的杂交，SSC辅助提升杂交效率。基因测序文库构建好送至瑞普公司进行测序，采用HiSeq2500PE125测序策略。对测序结果进行分析发现，裂解液50显著性提升了UMI大于500的细胞数量和平均基因数(图7)，大幅提高了平台的反应效率。

实施例4

小鼠睾丸细胞的分析。

取500万个消化好的小鼠按照实施例2的步骤进行建库、获得测序文库。基因测序文库构建好送至瑞普公司进行测序，采用HiSeq2500PE125测序策略。测序返回的数据经过拆分筛选比对，得到基因表达谱。将这个矩阵文件导入R语言分析，就能将矩阵数据转换为可视化的图。图8为小鼠睾丸细胞tSNE分析结果，显示小鼠睾丸可以分为14个亚群。

实施例5

本发明同样可以应用于以微流控为主的单细胞测序平台。通过实施例2中所述方法获得带有一轮细胞标签的固定细胞后，利用10×公司铬芯片E(10×Genomics#2000121)进行反应。进口1注入75μl混合有连接体系的固定细胞(10μl细胞，50.5μl无酶水，7.5μl T4连接缓冲液，3μl T4连接酶，1.5μl 10×Reducing Agent B和2.5μl 100mM桥连引物)，进口2注入40μl含有裂解液的单细胞ATAC凝胶微珠(10×Genomics#2000132，微珠序列按照实施例1中所述)，进口3注入240μl的Partitioning Oil(10×Genomics#220088)。随后将乳液包裹的微珠置于37℃孵育1.5小时，使连接反应充分。反应结束后，收集微珠依照实施例2中所述方案进行外切、单链化、二链合成反应，最终通过PCR扩增、纯化获得cDNA文库。

实施例6

染色质转座酶可及性超高通量单细胞测序。

将实施例1中标签磁珠与桥连引物退火。将磁珠与桥连引物(桥连引物序列：5’-CGTCGTGTAGGGAAAGAGTGTGACGCTGCCGACGA-3’)混匀，梯度退火，形成粘性末端。没有结合桥连引物的序列使用核酸外切酶EXO I切除。外切完成后，用150μl的TE-SDS、TE-TW洗一遍，最后用TE-TW重悬，4℃保存备用。

1、特异性分子标签转座酶包埋复合物的制备

Tn5转座酶裸酶购自南京诺唯赞生物科技有限公司。转座酶及包埋缓冲液由南京诺唯赞生物科技有限公司生产的(Vazyme)Tn5 Transposome(S111)试剂盒提供。

(1)包埋核酸序列如下表2所示。

表2

其中，特异标签片段包含的特异性分子标签10×N为细胞标签序列的核心序列，对应每种Tn5复合物的这个核心序列均不同，由于每个位点有A/T/C/G这4种选择，所以10×N的序列可以有4 ¹⁰种选择。N表示A/T/C/G中的任一种，为随机合成。

(2)96种带特异分子标签寡核苷酸序列退火(P7 adapter片段+Mosaic Ends片段退火得到通用型序列，即图9中接头中的P7 Adapter-Mosaic Ends/Mosaic Ends；特异标签片段+Mosaic Ends片段退火得到特异性分子标签序列，即图9中的搭桥序列2-细胞标签4-Mosaic Ends/Mosaic Ends)。96孔中每孔含两种包埋片段，包括孔间相同的P7 adapter片段+Mosaic Ends片段以及孔间特异的特异标签片段+Mosaic Ends片段。

(3)将Tn5裸酶和包埋缓冲液均匀加入到96孔板中，随后每孔分别加入步骤(2)中96种标签接头冻存液，吹打5次，在30℃孵育1h后于-20℃冰箱保存(图9)。

2、新鲜组织细胞核提取

取50mg新鲜组织样本，液氮研磨成粉，迅速转移到预冷的1.5ml EP管内。用1ml裂解液(ddH ₂O，10mM Tris-HCl pH7.4，10mM NaCl，3mM MgCl ₂，1％BSA，0.1％Tween-20，0.1％IGEPAL CA-630，0.01％洋地黄皂苷)重悬，冰上裂解3min。裂解后用RSBT缓冲液(ddH ₂O，10mM Tris-HCl pH7.4，10mM NaCl，3mM MgCl ₂，1％BSA，0.1％Tween-20)重悬，过滤去掉组织残渣。细胞核用1％甲醛室温固定10分钟。用甘氨酸终止固定交联。配制冻存液(ddH ₂O，50mM Tris-HCl pH8.0，25％甘油，5mM Mg(OAc) ₂，0.1mM EDTA)，取975μl冻存液加5μl 5mM DTT和20μl 50×protease inhibitor cocktail，重悬细胞核后可-80冻存。或者用1ml RSBT缓冲液悬浮细胞核过滤后计数备用。冻存样本复苏时将样品取出，置于放37℃烘箱解冻2min，500g/5min离心，弃上清，用200μl裂解液重悬，置冰上3min。用RSBT清洗过滤后计数备用。

3、人293T和鼠3T3混合细胞的细胞核提取

小鼠成纤维细胞(3T3)和人胚肾细胞(293T)各200万混匀后用PBS洗一遍，转移至1.5ml EP管中，随后用1ml裂解液(ddH ₂O，10mM Tris-HCl pH7.4，10mM NaCl，3mM MgCl ₂，1％BSA，0.1％Tween-20，0.1％IGEPAL CA-630，0.01％洋地黄皂苷)重悬，冰上裂解3min。裂解后用RSBT缓冲液(ddH ₂O，10mM Tris-HCl pH7.4，10mM NaCl，3mM MgCl ₂，1％BSA，0.1％Tween-20)清洗两次。细胞核用1％甲醛室温固定10分钟。用甘氨酸终止固定交联。配制冻存液(ddH ₂O，50mM Tris-HCl pH8.0，25％甘油，5mM Mg(OAc) ₂，0.1mM EDTA)，取975μl冻存液加5μl 5mM DTT和20μl 50×protease inhibitor cocktail，重悬细胞核后可-80冻存。或者用1ml RSBT缓冲液悬浮细胞核过滤后计数备用。冻存样本复苏时将样品取出，置于放37℃烘箱解冻2min，500g/5min离心，弃上清，用200μl裂解液重悬，置冰上3min。用RSBT清洗过滤后计数备用。

4、人293T和鼠3T3混合细胞的Tn5预标记

取制备细胞核，用1ml RSBT重悬过滤并计数。配制2×TD缓冲液(ddH ₂O，20mM Tris-HCl pH7.6，10mM MgCl ₂，20％二甲基甲酰胺)，配制tagmentation缓冲液(每孔22.5μl，包括12.5μl 2×TD buffer，9.5μl 1×DPBS，0.25μl 1％洋地黄皂苷，0.25μl 10％Tween-20)，用tagmentation缓冲液重悬细胞核，分装至96孔板中，每孔约为1万细胞核。取实施例3中的转座酶包埋复合物加入到含细胞核的96孔板中，每孔2.5μl，置于55℃反应30min。反应结束后，每孔加入25μl 2×终止液(25ml 40mM EDTA，3.9μl 6.4M Spermidine)，37℃静置15min。收集液体混合至15ml离心管，500g/5min，弃上清，1ml RSBT清洗一次。计数，将细胞核分装至1.5ml EP管中，每管50万细胞核，20μl RSBT重悬，再加入30μl PNK反应液(5μl 10×PNK buffer，5μl 10mM ATP，10μl ddH ₂O，l0μl PNK酶)，37℃孵育30min，反应完成后离心，弃上清。RSBT清洗两次后置冰上备用。

5、人293T和鼠3T3混合细胞的微孔板ATAC测序

取Tn5标记细胞核。将细胞核悬液滴加入微孔板中，利用离心机短暂离心使80-90％的细胞核落入微孔中，每个孔捕获0-10个细胞核，通过Tn5上的细胞标签4对同一孔内的细胞DNA片段进行区分。将搭桥引物和标记磁珠退火，使标记磁珠上的片段形成粘性末端。向落有细胞核的微孔板中加入20万个分子标记磁珠，置于磁铁上轻轻混匀，使磁珠覆盖99％以上的微孔，使用RSBT溶液洗去多余的分子标记磁珠。向铺满磁珠的微孔板中缓慢滴加200μL裂解液(100μl 10％SDS，40μl蛋白酶K，100μl 10×T4 buffer，200μl 50％PEG 8000(质量体积比)，560μl 10mM Tris-HCl pH8.0)，室温裂解孵育30分钟，使磁珠上的搭桥序列和细胞核上的搭桥引物充分互补杂交。孵育完成后，将微孔板倒置于磁铁上，收集带有分子标记-DNA复合物的磁珠，转移至1.5ml EP管中，6×SSC清洗两次，随后用50mM Tris pH8.0再洗一遍，向装有分子标记磁珠的EP管中加入连接混合液50μL(2μl T4连接酶，5μL T4缓冲液，2μL dNTP，10μL 50％PEG8000(质量体积比)，31μL ddH ₂O)，置于25℃反应1.5小时。连接反应完成后，把分子标记磁珠在磁力架上用TE-SDS、TE-TW、10mM Tris pH8.0各洗一遍，用100μL延伸体系(20μL5×RT buffer，10μL dNTP，2.5μL Klenow聚合酶，20μl 50％PEG(质量体积比)和47.5μl ddH ₂O)悬浮磁珠，置于37℃反应1小时。反应结束后，把分子标记磁珠在磁力架上用TE-SDS、TE-TW、10mM Tris pH8.0各洗一遍，用500μL 0.1M的NaOH悬浮磁珠，室温孵育5分钟进行单链化。然后用TE-TW洗两次、10mM Tris pH8.0洗一遍，用index P5和index P7引物将目的片段从磁珠上富集出来，并用诺唯赞纯化磁珠纯化PCR产物，获得300-500bp的产物。

上述反应具体流程见图10，文库大小分布在300-500bp左右，见图11。

将上述方法构建基因测序文库，基因测序文库构建好后使用MGI/Illumina二代测序仪进行测序。测序返回的数据经过拆分筛选比对，得到cell by peak矩阵。将这个矩阵文件导入R语言分析，就能将矩阵数据转换为可视化的图。由图12-17可知，存在极少量双细胞污染(图12)，片段大小符合预期(图13)，peak分布正常(图14)，TSS富集(图15)，小鼠3T3细胞群体和单细胞ATAC peak分布(图16和图17)，测序质量可以达到单细胞ATAC高通量测序水平。

建库使用引物序列如下表3所示。其中N表示A/T/C/G中的任一种，为随机合成。S表示末端碱基的硫代修饰，提高末端碱基的稳定性。

表3

实施例7

本发明染色质转座酶可及性超高通量单细胞测序同样可以应用于以微流控为主的单细胞测序平台。通过实施例6中所述方法获得带有一轮细胞标签的固定细胞核后，利用10×公司铬芯片E(10×Genomics#2000121)进行反应。进口1注入75μl混合有连接体系的固定细胞(10μl细胞，50.5μl无酶水，7.5μl T4连接缓冲液，3μl T4连接酶，1.5μl 10×Reducing Agent B和2.5μl 100mM桥连引物)，进口2注入40μl含有裂解液的单细胞ATAC凝胶微珠(10×Genomics#2000132，微珠序列按照实施例1中所述)，进口3注入240μl的Partitioning Oil(10×Genomics#220088)。随后将乳液包裹的微珠置于37℃孵育1.5小时，使连接反应充分。反应结束后，收集微珠依照实施例7中所述方案进行外切、单链化、二链合成反应，最终通过PCR扩增、纯化获得基因测序文库，测序和生信分析。基因测序文库按照实施例7中的流程进行测序和生信分析。

实施例8

本发明染色质转座酶可及性超高通量单细胞测序同样可以应用于双端都标记的Tn5包埋方法。

按照实施例6中方法进行包埋，但包埋时，96孔中每孔含1种包埋片段，为孔间特异的特异标签片段+Mosaic Ends片段，特异标签片段+Mosaic Ends片段退火得到特异性分子标签序列，即图9中的搭桥序列2-细胞标签4-Mosaic Ends/Mosaic Ends。

然后，按照实施例6中方案对细胞核进行标记，标记后的细胞核进行微孔板捕获，连接，延伸。加入500μL 0.1M的NaOH溶液处理5分钟进行单链化，再加入P7adapter-Mosaic Ends引物(即包括了P7 adapter和Mosaic Ends片段序列的引物)进行延伸。延伸完成后通过高温变性收集上清单链产物，去掉磁珠。用index P5和index P7引物PCR扩增、纯化获得基因测序文库(如图18)。基因测序文库按照实施例7中的流程进行测序和生信分析。

Claims

一种超高通量单细胞测序方法，其特征在于，包括以下步骤：

(1)准备如下试剂：

a)分子标记微珠，所述分子标记微珠包括微珠本体和耦联的分子标记序列，该分子标记序列包括顺序排列的：

通用引物序列，作为PCR扩增时的引物结合区域；

第一细胞标签序列；

第一搭桥序列；

b)反转录序列，用于细胞内反转录，所述反转录序列包括顺序排列的：

第二搭桥序列；

第二细胞标签序列，与第一细胞标签序列配合组成细胞标签序列，所述细胞标签序列用于标识所构建测序文库中各序列所对应的mRNA取自的细胞；

分子标签序列，用于标识所构建测序文库中各序列所对应的mRNA；

多聚T尾，用于与细胞中带有poly-A序列的mRNA互补配对；

c)桥连引物，用于将上述a)中的标记序列与b)中的反转录序列进行连接，所述桥连引物两端具有分别与所述第一搭桥序列和第二搭桥序列互补配对的序列；

(2)取待测序的细胞样品，加入反转录序列进行细胞内反转录，使反转录序列的多聚T尾端连上将细胞内mRNA序列反转录后得到的cDNA序列，获得反转录序列-cDNA序列；

(3)将步骤(2)经细胞内反转录后的细胞通过微孔板技术或微流控技术使一个分子标记微珠与一个或多个细胞处于分隔的空间中，并在裂解液作用下裂解细胞，孵育，通过桥连引物分别与所述第一搭桥序列和第二搭桥序列互补配对，然后使用连接酶连接，使第一搭桥序列和第二搭桥序列连接获得与微珠耦联的分子标记序列-反转录序列-cDNA序列；

(4)收集耦联有分子标记序列-反转录序列-cDNA序列的微珠，进行PCR扩增获得带有第一细胞标签序列、第二细胞标签序列和分子标签序列的cDNA序列；

(5)将步骤(4)获得的产物构建cDNA测序文库，然后进行高通量测序，获得上百万个单细胞的特异性转录组信息。
一种超高通量单细胞测序方法，其特征在于，包括以下步骤：

(1)准备如下试剂：

a)分子标记微珠，所述分子标记微珠包括微珠本体和耦联的分子标记序列，该分子标记序列包括顺序排列的：

通用引物序列，作为PCR扩增时的引物结合区域；

第一细胞标签序列；

第一搭桥序列；

b)特异性分子标签转座酶包埋复合物，包括Tn5转座酶和特异性分子标签序列，其中特异性分子标签序列包括顺序排列的：

第二搭桥序列；

第二细胞标签序列，与第一细胞标签序列配合组成细胞标签序列，所述细胞标签序列用于标识所构建测序文库中各序列来源的细胞；

Mosaic Ends序列，用于与Tn5转座酶结合，所述Mosaic Ends序列为双链结构，其中一条链与第二细胞标签序列连接；

c)桥连引物，用于将上述a)中的分子标记序列与b)中的特异性分子标签序列进行连接，所述桥连引物两端具有分别与所述第一搭桥序列和第二搭桥序列互补配对的序列；

(2)取待测序的细胞样品，提取细胞核；

(3)向步骤(2)提取的细胞核中加入特异性分子标签转座酶包埋复合物进行转座反应；

(4)将经过转座反应后的细胞核通过微孔板技术或微流控技术使一个分子标记微珠与一个或多个细胞核处于分隔的空间中，并在裂解液作用下裂解细胞核，孵育，通过桥连引物分别与所述第一搭桥序列和第二搭桥序列互补配对，然后使用连接酶连接，使第一搭桥序列和第二搭桥序列连接获得与微珠耦联的分子标记序列-特异性分子标签序列-染色质转座酶可及性基因组序列；

(5)收集耦联有分子标记序列-特异性分子标签序列-染色质转座酶可及性基因组序列的微珠，进行PCR扩增获得带有第一细胞标签序列、第二细胞标签序列和特异性分子标签序列的染色质转座酶可及性基因组序列；

(6)将步骤(5)获得的产物构建染色质可及性测序文库，然后进行高通量测序，获得上百万个单细胞的特异性基因组开放性信息。
根据权利要求1或2所述超高通量单细胞测序方法，其特征在于，所述微珠与分子标记序列耦联方式为：分子标记序列5’端的核苷酸的C6位上使用胺基取代羟基，微珠表面修饰有羧基，通过羧基与氨基缩合耦联。
根据权利要求1或2所述超高通量单细胞测序方法，其特征在于，所述第一细胞标签序列包括多个特异性片段，所述第二细胞标签序列包括至少一个特异性片段，不同位置的特异性片段选自相同的或不同的特异性片段库，所述第一细胞标签序列和第二细胞标签序列利用所述特异性片段的排列组合方式不同标识细胞。
根据权利要求1或2所述超高通量单细胞测序方法，其特征在于，所述分子标记微珠的制备方法包括以下步骤：

(1)用于合成分子标记序列的引物根据特异性片段的数量分为多条引物，每条引物包含一条特异性片段，各引物之间具有用于搭桥连接、互补的接头序列，其中对应于分子标记序列5’端的那条引物还包括所述通用引物序列，对应于分子标记序列3’端的那条引物还包括所述第一搭桥序列；

(2)将对应于分子标记序列5’端的那条引物与微珠本体耦联，然后通过PCR方法将剩余引物依次退火、延伸，从5’端到3’依次串接分子标记序列的其余特异性片段，制备得到所述分子标记微珠。
根据权利要求5所述超高通量单细胞测序方法，其特征在于，所述分子标记序列为：5’-TTTAGGGATAACAGGGTAATAAGCAGTGGTATCAACGCAGAGTACGTNNNNNNCGACTCACTACAGGGNNNNNNTCGGTGACACGATCGNNNNNNTCGTCGGCAGCGTC-3’，其中，N表示A/T/C/G中的任一种，为随机合成。
根据权利要求1或2所述超高通量单细胞测序方法，其特征在于，待测序的细胞样品中含有2种或2种以上的细胞。
根据权利要求1或2所述超高通量单细胞测序方法，其特征在于，所述微珠本体为磁珠，

将经细胞内反转录后的细胞或者经转座反应后的细胞核加入到微孔板中，然后加入分子标记微珠，微孔板中的微孔直径大小为刚好容纳一个分子标记微珠和一个或多个细胞/细胞核；

细胞或细胞核加入微孔板中的落孔率控制在大于80％；分子标记微珠加入微孔板中的落孔率大于99％。
如权利要求8所述的超高通量单细胞测序方法，其特征在于，所述微孔板中微孔深度30-160μm、微孔直径20-150μm；所述微珠本体的直径为20-145μm。
如权利要求8所述的超高通量单细胞测序方法，其特征在于，所述微孔板的制备方法为：

(1)在硅片上刻蚀出微孔作为初始模具；

(2)在初始模具上浇注聚二甲基硅氧烷，成型后取下聚二甲基硅氧烷成为具有微柱的第二次模具；

(3)在第二次模具上浇注热熔的质量体积比为4％～6％的琼脂糖，冷却成型后，取下琼脂糖即为所述微孔板。