CN118222686A - 一种转录组和基因组可及性双模态测序试剂盒和方法 - Google Patents

一种转录组和基因组可及性双模态测序试剂盒和方法 Download PDF

Info

Publication number
CN118222686A
CN118222686A CN202410534391.9A CN202410534391A CN118222686A CN 118222686 A CN118222686 A CN 118222686A CN 202410534391 A CN202410534391 A CN 202410534391A CN 118222686 A CN118222686 A CN 118222686A
Authority
CN
China
Prior art keywords
sequence
primer
cell
sequencing
transcriptome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410534391.9A
Other languages
English (en)
Inventor
韩晓平
汪仁英
郭国骥
王雪怡
鄂唯高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202410534391.9A priority Critical patent/CN118222686A/zh
Publication of CN118222686A publication Critical patent/CN118222686A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种转录组和基因组可及性双模态测序试剂盒和方法,能同时分析一个细胞中的染色体开放区域基因组信息和转录组信息,属于单细胞测序技术领域。所述试剂盒包括带有细胞标签1的转座酶和反转录引物、带有细胞标签2的第一杂交引物、带有细胞标签3的第二杂交引物和第三杂交引物及多种酶试剂;所述方法包括酶切、逆转录、末端转移酶加尾、连接、修复及扩增文库等步骤。本发明基于带有不同细胞标记序列的转座酶,带有不同细胞标签的随机引物、连接引物和杂交引物,实现上亿种分子标记来标记单个细胞,并对其进行超高通量的转录组和基因组可及性测序,具有重要的应用推广价值。

Description

一种转录组和基因组可及性双模态测序试剂盒和方法
技术领域
本发明涉及单细胞测序技术领域,具体地,涉及一种转录组和基因组可及性双模态测序试剂盒和方法,更具体地,涉及一种在同一细胞中同时分析基因组和转录组数据的高通量测序试剂盒和方法。
背景技术
染色质结构和基因表达的调节是细胞谱系中关键转变的基础。随着测序技术的重大发展和测序成本的下降,生物体内的基因组、转录组和表观组的多种组学信息能够以单细胞分辨率进行分析,揭示每个细胞基因调控的独特性,从而解决群体层面的分析无法回答的问题。例如现有的高通量单细胞转录组测序技术(scRNA-seq)能同时处理百万级别的单细胞转录组,在提高精度和灵敏度的同时大大降低了成本。与此同时,多个物种的细胞图谱先后问世,包括线虫、涡虫、水螅等低等生物到小鼠、大鼠、人类等高等哺乳动物。各种图谱的构建在解析各物种细胞多样性中发挥着至关重要的作用,为解码细胞命运决定的宏观分子机制搭建了基础。
然而scRNA-seq也具有一定的局限性,虽然该技术能够发现新的细胞类型和状态,但由于某些细胞异质性的主要来源可能并不与转录组密切相关,因此仅靠转录组信息很难区分转录组相似而功能不同的细胞。为了解决这一问题,单细胞多组学技术顺势应时而生。
多模态的数据分析可以实现比单独的转录组测序更详细的细胞表型表征。随着转录组、染色质可及性、DNA甲基组和组蛋白修饰的高通量单细胞分析技术的进展,人们已经有能力从混合细胞群中分解出细胞类型,并剖析原始组织中细胞类型特异的转录组和表观组状态,所用方法包括基因表达和基因组序列的联合分析,转录组和DNA甲基组的联合分析,以及同时绘制核糖体占有率和DNA甲基组与转录组的图谱。最近有不少研究致力于开发在单个细胞中共同测定RNA和染色质可及性的方法,如基于drop let系统的高通量单细胞RNA和ATAC测序技术SNARE-seq(Chen,S.,Lake,B.B.,and Zhang,K.(2019).High-throughput sequencing of the transcriptome and chromatin accessibility in thesame cell.Nat Biotechnol 37,1452-+.10.1038/s41587-019-0290-0),基于split-pool的SHARE-seq(Ma,S.,Zhang,B.,LaFave,L.M.,Earl,A.S.,Chiang,Z.,Hu,Y.,Ding,J.R.,Brack,A.,Kartha,V.K.,Tay,T.,et al.(2020).Chromatin Potential Identified byShared Single-Cell Profiling of RNA and Chromatin.Cell 183,1103-+.10.1016/j.cell.2020.09.056),Paired-seq(Zhu,C.X.,Yu,M.,Huang,H.,Juric,I.,Abnousi,A.,Hu,R.,Lucero,J.,Behrens,M.M.,Hu,M.,and Ren,B.(2019).An ultra high-throughputmethod for single-cell joint analysis of open chromatin and transcriptome.NatStruct Mol Biol 26,1063-+.10.1038/s41594-019-0323-x),SNARE-seq2(Plongthongkum,N.,Diep,D.,Chen,S.,Lake,B.B.,and Zhang,K.(2021).Scalabledual-omics profiling with single-nucleus chromatin accessibility and mRNAexpression sequencing 2(SNARE-seq2).Nat Protoc 16,4992-+.10.1038/s41596-021-00507-3.)等等。这些联合分析的方法都可以克服scRNA-seq固有的局限性,在获得细胞转录组信息的同时进一步识别活跃的可接近性染色质,提供了一种在单细胞分辨率下识别染色质介导的谱系启动的新机制的方法。建立一种集低成本、大规模、高灵敏度等优势于一体的高通量单细胞RNA和ATAC测序技术是未来的发展趋势。
发明内容
为了解决现有许多单细胞多模态技术污染率不佳,以及成本较高的问题,本发明旨在提供一种基于单端接头转座酶和连接酶的单细胞基因组测序技术,能够一次性获得数百万个单细胞的染色体开放区域基因组信息和转录组信息,并且有超高的灵敏度和超低物种间转录组交叉污染率。为此,本发明采用的技术方案如下:
本发明第一方面提供一种转录组和基因组可及性双模态测序试剂盒,包括:
连接有特殊定制序列的转座酶,用于在切割基因组的同时将所述特殊定制序列连接在基因片段上,所述特殊定制序列为双链序列,分别为第一链序列和第二链序列,其中第一链序列5'-3'依次包括连接序列1(AD1)、细胞标签1(BC1)序列A和包埋序列,其中第二链序列为所述包埋序列的互补序列;
反转录引物,5'-3'依次包括连接序列1、细胞标签1序列R和随机序列,所述随机序列用于与RNA杂交并延伸得到cDNA序列,所述细胞标签1序列R与所述细胞标签1序列A各不相同且一一对应;
第一杂交引物,5'-3'依次包括测序接头1(i7)序列、细胞标签2(BC2)序列和连接序列2((AD2),
桥连引物,5'-3'依次包括至少一部分所述连接序列1的互补序列和至少一部分所述连接序列2的互补序列,用于使所述连接序列1和所述连接序列2连接;
第二杂交引物,5'-3'依次包括所述包埋序列的互补序列、细胞标签3(BC3)序列A、至少一部分所述连接序列1的互补序列和测序接头2(P5)序列;
第三杂交引物,5'-3'依次包括连接序列3、细胞标签3序列R和多聚T序列;
第一PCR扩增引物组合,包括两段第一PCR扩增上游引物和一段第一PCR扩增下游引物,其中一段第一PCR扩增上游引物为测序接头2序列,用于预扩增开放的基因组片段;另一段第一PCR扩增上游引物5'-3'依次包括为至少一部分测序接头2序列和至少一部分连接序列3,用于预扩增cDNA;所述第一PCR扩增下游引物5'-3'为至少一部分测序接头1序列的反向互补序列;
第二PCR扩增引物组合,包括基因组第二PCR扩增上游引物、转录组第二PCR扩增上游引物和第二PCR扩增下游引物,所述基因组第二PCR扩增上游引物5'-3'依次为测序接头2序列和增加扩增特异性的碱基序列,所述转录组第二PCR扩增上游引物5'-3'依次为测序接头2序列和至少一部分连接序列3,所述第二PCR扩增下游引物为包括index序列的测序接头序列。
在本发明的一些实施方案中,所述连接有特殊定制序列的转座酶的制备过程如下:
(1)准备或获得包括所述第一链序列的第一链引物和包括所述第二链序列的第二链引物,按等比例混合后从95℃降至25℃获得转座酶引物工作液;所述第一链引物带有不同的细胞标签1序列A,将同种细胞标签1序列A的第一链引物与第二链引物分别混合,得到多种不同的转座酶引物工作液;
(2)将转座酶分别与不同种转座酶引物工作液于30℃孵育30~60min。
在本发明的一些实施方案中,所述细胞标签1序列A、细胞标签1序列R、细胞标签2序列、细胞标签3序列A和细胞标签序列R分别包括6~15个随机合成的碱基。
在本发明的一些具体实施方案中,对于细胞标签1序列A、细胞标签1序列R、细胞标签2序列、细胞标签3序列A和细胞标签序列R上的任一个中任意一个标签的不同序列之间的汉明距离大于等于4,例如细胞标签1序列A的不同序列之间至少有4个不同的碱基,细胞标签2序列的不同序列之间也至少有4个不同的碱其。并且,不同的细胞标签之间的序列也至少有4个不同的碱基。
在本发明的一些优选实施方案中,所述第二杂交引物序列3'端带有invT修饰,用于防止引物降解和非特异性延伸。
在本发明的一些实施方案中,所述反转录引物中的随机序列包括5~10随机合成的碱基序列,所述随机序列用于与RNA分子互补配对,从而提供反转录反应所需要的结合位点。利用随机序列可得到全长转录组的信息,能发现更多的新基因、可变剪切,精准定位融合基因,改善基因组注释。
进一步地,所述试剂盒还包括细胞核制备液、核裂解液、酶切反应液、反转录缓冲液、末端转移酶缓冲液、连接缓冲液和/或PCR缓冲液。
在本发明的一些实施方案中,所述细胞核制备液包括0.1~0.2% IGEPAL CA-630,1mM DTT,5% BSA,400U/mL RNA酶抑制剂和1×蛋白酶抑制剂。
在本发明的一些实施方案中,所述酶切反应液包括:20mM pH7.5 Tris-HCl,10mMMgCl2,10~20%二甲基甲酰胺和400U/mL RNA酶抑制剂。
本发明第二方面提供利用本发明第一方面所述的转录组和基因组可及性双模态测序试剂盒进行测序的方法,包括以下步骤:
S1,获得待测序细胞的细胞或细胞核并进行固定,将固定后的细胞或细胞核均匀地分装至多孔板中;
S2,利用所述连接有特殊定制序列的转座酶切割基因序列,加入每个孔中的转座酶的所述细胞标签1序列A均不同;
S3,离心洗去酶切体系,向细胞核所在的每个孔中加入所述反转录引物,加入每个孔中的反转录引物的所述细胞标签1序列R不同,其与细胞标签1序列A互不相同且一一对应,在反转录缓冲液中进行反转录反应,得到cDNA序列,将细胞或细胞核收集并混合;
S4,利用末端转移酶向所述cDNA序列的3'端添加一段poly A序列,之后将细胞核再次均匀地分装至多孔板中,向每个孔中加入所述第一杂交引物,加入每个孔中的所述第一杂交引物的所述细胞标签2序列均不同,在所述桥连引物存在的情况下使所述连接序列1和所述连接序列2连接;
S5,将细胞核收集并混合,再次均匀地分装至多孔板中,向每个孔中加入细胞裂解液、所述第二杂交引物和所述第三杂交引物,加入每个孔中的所述第二杂交引物的所述细胞标签3序列A和所述第三杂交引物的所述细胞标签3序列R均不同且一一对应。
S6,利用DNA连接酶和DNA聚合酶将切割后的DNA和cDNA补齐为完整双链;
S7,利用所述第一PCR扩增引物组合进行第一轮扩增,再将产物一分为二,分别用所述第二PCR扩增引物组合进行第二轮扩增。
在本发明的一些实施方案中,步骤S1中,所述进行固定的方法包括:
(1)用4mL 0.2% PFA重悬细胞核,室温固定10min,期间不时进行混匀;
(2)加入30μL 2.5M甘氨酸置于冰上10~20min终止固定,期间不时混匀;
(3)4℃,300~800g离心3~10min,清洗沉淀,30~50μM滤网过滤。
在本发明的一些实施方案中,在步骤S3之后,步骤S4之前,进一步包括进行外切酶切除多余所述反转录引物的步骤。
在本发明的一些实施方案中,在步骤S4中,先将所述第一杂交引物与所述桥连引物退火杂交再与细胞核混合。
本发明的有益效果
对于现有技术,本发明具有以下有益效果:
本发明的试剂盒利用带有细胞标签1序列A的单端接头转座酶包埋复合物对开放的基因组进行转座反应,再在原孔中用带有不同的细胞标签1序列R的逆转录引物标记RNA,再利用两轮杂交反应和一轮PCR反应,使得细胞带上共四轮分子标签,能够一次性标记并获得上亿级别的单细胞染色质开放信息和转录组信息,并且通过将对应的细胞标签1序列数据合并,就能同时对同一细胞的单细胞染色质开放信息和转录组信息进行分析。本发明的测序方法提供了一种直接的方法来确定基因调控层之间的协调,相较于现有的单组学方法能获得更详细的细胞表型表征,从而恢复染色质可及性和基因表达之间精细但生物学上重要的差异。
本发明的测序方法具有超高的灵敏度。相较其他已发表的多模态测序方法,用了一种单端酶切和接头转换的策略,避免了其他已发表多模态测序方法使用Tn5双端酶所导致的酶切片段损失问题,提高了测序文库构建的效率。本方法使用随机引物反转录的设计可得到全长转录组的信息,能发现更多的新基因、可变剪切,精准定位融合基因,改善基因组注释。
本方法整套流程无需借助复杂仪器,具有实验成本低,操作简单,耗时短,精度高和通量高的优势,在单细胞领域具有较高的推广价值。
附图说明
图1示出了本发明公开的高通量单细胞多模态测序方法的流程示意图。
图2示出了本发明实施例2中人鼠混合细胞物种间交叉污染率。左图示出了转录本(UMI)在相同的单细胞中映射到人鼠基因组的比例;中图示出了细胞基因组开放区域捕获片段read读数(UM)在相同的单细胞中映射到人鼠基因组的比例;右图示出了UMI和UM同时映射到人鼠基因组的比例。三图中超过80%的读取映射到人类和小鼠基因组的细胞分别用蓝点和红点表示,其余细胞(混合细胞)用灰点表示。
图3箱形图显示使用不同测序方法捕获的HEK293T、HepG2和NIH/3T3细胞UM(左)和基因数(右),具体的,显示了sci-CAR40(GSE117089)、sci-ATAC-seq(GSE67446)、dscATAC-seq(GSE123581)、SPLiT-seq(GSE110823)、sci-RNA-seq(GSE98561)、Drop-seq(GSE63269)和10X scRNA-seq(1k_hgmm_v3_nextgem数据集)从相同细胞类型捕获的每个细胞的UM或基因数。
图4示出了本发明实施例2中人鼠混合细胞UMI与唯一片段数(UQ)分布情况。将nFeature>200,nFrags>500的3876个细胞认为是高质量细胞,其平均基因数为1137.54,平均UQ为18850.94,平均开放区域在转录起始位点TSS为11.21。
图5示出了本发明实施例3中成体C57BL/6J小鼠全脑组织高质量单细胞转录组数据UMAP分群示意图(左)和单细胞染色质开放区域分群示意图(右)。
具体实施方式
除非另有说明、从上下文暗示或属于现有技术的惯例,否则本申请中所有的份数和百分比都基于重量,且所用的测试和表征方法都是与本申请的提交日期同步的。在适用的情况下,本申请中涉及的任何专利、专利申请或公开的内容全部结合于此作为参考,且其等价的同族专利也引入作为参考,特别这些文献所披露的关于本领域中的相关术语的定义。如果现有技术中披露的具体术语的定义与本申请中提供的任何定义不一致,则以本申请中提供的术语定义为准。
基于现有技术的不足,发明人开发了一种转录组和基因组可及性双模态测序试剂盒和方法。其中,所述试剂盒包括:
(1)连接有特殊定制序列的转座酶
用于在切割基因组的同时将所述特殊定制序列连接在基因片段上,所述特殊定制序列为双链序列,分别为第一链序列和第二链序列,其中第一链序列5'-3'依次包括连接序列1、细胞标签1序列A和包埋序列,其中第二链序列为所述包埋序列的互补序列;
在本发明的一些实施方案中,所述连接有特殊定制序列的转座酶的制备过程如下:
(1)准备或获得包括所述第一链序列的第一链引物和包括所述第二链序列的第二链引物,按等比例混合后从95℃降至25℃获得转座酶引物工作液;所述第一链引物带有不同的细胞标签1序列A,将同种细胞标签1序列A的第一链引物与第二链引物分别混合,得到多种不同的转座酶引物工作液;
(2)将转座酶分别与不同种转座酶引物工作液于30℃孵育30~60min。
在本发明的一些具体实施方案中,
所述第二链序列为:5'-[pho]CTGTCTCTTATACACATCT-3',[pho]代表磷酸化修饰。
包括连接序列1、细胞标签1序列和包埋序列的所述第一链序列为:
5'-phos-ACACTCTTTCCCTACACGACGjjjjjjjjjjAGATGTGTATAAGAGACAG-3’,10j为基因组开放区分子的第一细胞标签(即细胞标签1序列A),每组10j之间汉明距离大于等于4,即任意两个细胞标签之间,至少有4个不同的碱基。在本发明中,设计了768种组合。
(2)反转录引物
所述反转录引物5'-3'依次包括连接序列1、细胞标签1序列R和随机序列。
其中,所述连接序列1为后续进行第一步杂交提供引物结合位点,如此,可以对每个反转录成功的cDNA杂交上细胞标签2序列;
所述细胞标签1序列R与所述细胞标签1序列A各不相同且一一对应,用于区分同一细胞中的ATAC文库和RNA文库;
所述随机序列与RNA分子互补配对,从而提供反转录反应所需要的结合位点,用于与RNA杂交并延伸得到cDNA序列。在本发明的一些实施方案中,所述随机引物序列是随机合成的7个碱基。随机序列与多聚T序列相比,有利于胞内非多聚A尾转录本的捕获,同时也提高了转录本的捕获效率,极大地提升了灵敏度。随机序列同时可以作为分子标签,用于标识所构建测序文库中各序列所对应的mRNA。
在本发明的一些具体实施方案中,所述反转录引物序列为:
5'-phos-ACACTCTTTCCCTACACGACGjjjjjjjjjjNNNNNNN-3’,10j为RNA分子的第一细胞标签(细胞标签1序列R),每组10j之间汉明距离大于等于4,即任意两个细胞标签之间,至少有4个不同的碱基,N表示A/T/C/G中的任一种,7N为随机合成的序列用于与RNA杂交并延伸得到cDNA序列。
(3)第一杂交引物
所述第一杂交引物5'-3'依次包括测序接头1序列、细胞标签2序列和连接序列2,用于在桥连引物存在的情况下使所述连接序列1和所述连接序列2连接。
在本发明的一些实施具体方案中,所述第一杂交引物的序列为:
5'-TTGTCTTCCTAAGACCGCTTGGCCTCCGACTTjjjjjjjjjjGGCAGCGTC-3';10j为细胞标签2序列,每组10j之间汉明距离大于等于4,即任意两个细胞标签之间,至少有4个不同的碱基。在本发明中,设计了768种细胞标签2组合。
(4)桥连引物
所述桥连引物5'-3'依次包括至少一部分所述连接序列1的互补序列和至少一部分所述连接序列2的互补序列。
在本发明的一些具体实施方案中,所述桥连引物由所述连接序列1的互补序列和所述连接序列2的互补序列组成。
在本发明的一些实施具体方案中,所述桥连引物的序列为:
5'-GGAAAGAGTGTGACGCTGCC-3'
(5)第二杂交引物
所述第二杂交引物5'-3'依次包括所述包埋序列的互补序列、细胞标签3序列A、至少一部分所述连接序列1的互补序列和测序接头2序列。
在本发明的一些具体实施方案中,所述第二杂交引物的序列为:
5'-phos-CTGTCTCTTATACACATCTjjjjjjjjjjCGTCGTGTAGGGAAAGAGTGTAAGTCGGATCGTAGCCATGTCGTTCinvT-3';10j为细胞标签3序列A,每组10j之间汉明距离大于等于4,即任意两个细胞标签之间,至少有4个不同的碱基。
在本发明中,设计了16种细胞标签3序列A组合,所述第二杂交引物3'端带有invT修饰,用于防止引物降解和非特异性延伸。
(6)第三杂交引物
所述第三杂交引物5'-3'依次包括连接序列3、细胞标签3序列R和20个胸腺嘧啶(T)。
在本发明的一些具体实施方案中,所述第三杂交引物的序列为:
5'-GACTTGTGGTATCAACGCAGAGTACGjjjjjjjjjjTTTTTTTTTTTTTTTTTTTT-3';10j为细胞标签3序列A,每组10j之间汉明距离大于等于4,即任意两个细胞标签之间,至少有4个不同的碱基。在本发明中,设计了16种细胞标签3序列R组合。
(7)第一PCR扩增引物组合
所述第一PCR扩增引物组合,包括两段第一PCR扩增上游引物和一段第一PCR扩增下游引物,所述其中一段第一PCR扩增上游引物(P5-ATAC)为测序接头2序列用于预扩增开放的基因组片段;另一段第一PCR扩增上游引物(P5-RS1.2)5'-3'依次包括为至少一部分测序接头2序列和至少一部分连接序列3,用于预扩增cDNA;所述第一PCR扩增下游引物(P7A)5'-3'为至少一部分测序接头1序列的反向互补序列。
所述一段第一PCR扩增上游引物P5-ATAC的序列为:
5'-[phos]-GAACGACATGGCTACGATCCGAC-3';
所述另一段第一PCR扩增上游引物P5-RS1.2的序列为:
5'-CGATCCGACTTGTGGTATCAACGCAGAGTACG-3';
所述第一PCR扩增下游引物P7A的序列为:
5'-TTGTCTTCCTAAGACCGCTTGGC-3';
(8)第二PCR扩增引物组合
所述第二PCR扩增引物组合包括两段第二PCR扩增上游引物(基因组第二PCR扩增上游引物和转录组第二PCR扩增上游引物)和一段第二PCR扩增下游引物,基因组第二PCR扩增上游引物(P5-AL)5'-3'依次为测序接头2序列和增加扩增特异性的6碱基序列;转录组第二PCR扩增上游引物(P5-RNA1.2)5'-3'依次为完整测序接头2序列和至少一部分连接序列3;第二PCR扩增下游引物(i7-ATAC)为包括index序列的测序接头序列。
所述基因组第二PCR扩增上游引物P5-AL的序列为:
5'-[phos]-GAACGACATGGCTACGATCCGACTTACAC-3';
所述转录组第二PCR扩增上游引物P5-RNA1.2的序列为:
5'-[phos]-GAACGACATGGCTACGATCCGACTTGTGGTATCAACGC-3';
所述第二PCR扩增下游引物i7-ATAC序列为:
5'-TGTGAGCCAAGGAGTTGnnnnnnnnnnTTGTCTTCCTAAGACCG-3',其中10n为index序列,用来区分同一张上机芯片的不同样品。
(9)试剂
细胞核制备液:0.1~0.2% IGEPAL CA-630,1mM DTT,5% BSA,400U/mL RNA酶抑制剂和1×蛋白酶抑制剂,PBS配制,现配现用。优选地,所述细胞核制备液:0.1%IGEPALCA-630,1mM DTT,5% BSA,400U/mL RNA酶抑制剂,1×蛋白酶抑制剂,PBS配制,现配现用。
核裂解液:1% SDS,0.1mg/mL蛋白酶K,10mM Tris-HCl配制,现配现用。
2×酶切反应液:20mM Tris-HCl(pH7.5),10mM MgCl2,10~20%二甲基甲酰胺,ddH2O配置,4℃保存。
1×反转录缓冲液:8% PEG8000,0.5% Triton X-100,0.5mM dNTP,100U MaximaH Minus反转录酶和20U RNase抑制剂。
1×末端转移酶缓冲液:10mM CoCl2,200μM dATP,400U末端转移酶。
本发明利用上述试剂盒进行测序的方法能同时分析一个细胞核中的染色体开放区域基因组信息和转录组信息,并且有超高灵敏度和超低的细胞核间交叉污染率。结合图1,对本发明的测序方法进行详细描述:
S1,取待测细胞核进行固定处理,并将固定后的细胞核均匀地分装到多孔板中;
在本发明中,细胞的类型不受限定,可以是任何有细胞核的细胞,对细胞的活性状态也没有任何限定,可以是新鲜的细胞,也可以是培养的细胞系,还可以是将各种方式保存的包含细胞的组织样本处理后得到的细胞。在本发明的一些实施例中,所述细胞来源于培养的细胞系,用胰酶将细胞系消化成单细胞悬液,优选地,可以利用1×PBS清洗。
在本发明的一些实施方案中,所述细胞核制备液包括0.1~0.2% IGEPAL CA-630,1mM DTT,5% BSA,400U/mL RNA酶抑制剂和1×蛋白酶抑制剂;在本发明的一些具体实施方案中,所述细胞核制备液包括0.1% IGEPAL CA-630,1mM DTT,5% BSA,400U/mL RNA酶抑制剂和1×蛋白酶抑制剂PBS配置。
在本发明的一些具体实施方案中,将细胞重悬于所述细胞核制备液中混匀,冰上放置3~5min,再利用PBST洗液稀释以终止反应。所述的PBST洗液由PBS配成,其他成分浓度如下:0.05% Triton X-100,1% BSA。
S2,利用所述连接有特殊定制序列的转座酶切割基因序列,加入每个孔中的转座酶的所述细胞标签1序列A均不同;
在本发明中,在本步骤中,可以预先在多孔板的每个孔中加入酶切体系,也可以分装细胞后再加入酶切体系,甚至可以先将酶切体系与细胞核混合后一起分装至多孔板中。在本发明的一些实施方案中,加入至每个孔中的酶切体系包括:连接有特殊定制序列的转座酶工作液1-3μL,1×酶切反应液,0.01%~0.05%洋地黄皂苷,0.1%Tween-20及400U/mLRNA酶抑制剂。其中,所述连接有特殊定制序列的转座酶工作液的浓度为1~5μM。2×酶切反应液包括20mM Tris-HCl(pH7.5),10mM MgCl2,10~20%二甲基甲酰胺ddH2O配置,4℃保存。
在本发明的一些实施方案中,酶切反应结束后,进一步包括利用PBSTin洗液清洗细胞核的步骤。所述PBSTin洗液为0.05~0.1% Tween-20,400U/mL RNA酶抑制剂,PBS配置,现配现用。
S3,离心洗去酶切体系,向细胞核所在的每个孔中加入所述反转录引物,加入每个孔中的反转录引物的所述细胞标签1序列R不同,在反转录试剂存在的情况下进行反转录反应,得到cDNA序列,将细胞或细胞核收集并混合;
在本发明的一些具体实施方案中,反转录体系为6μL体系,包括1×反转录缓冲液,8%PEG8000,0.5%Triton X-100,0.5mM dNTP,100U Maxima H Minus反转录酶和20URNase抑制剂。进一步地,反转录反应的程序如下:
8℃12sec,15℃30sec,20℃45sec,25℃1min,30℃1min,42℃2min,共10个循环,循环后42℃30min。
更进一步地,反应结束后,每孔加入10μL 40mM EDTA终止反应,置于室温下孵育10min。
在本发明的一些优选实施方案中,在步骤S3之后,进一步包括进行外切酶切除多余所述反转录引物的步骤。具体地:
(1)配置外切酶体系100μL(1×ExoⅠ缓冲液,ExoⅠ100U),
将细胞核重悬于体系中,37℃烘箱,30min,10rpm。
(2)加入等体积40mM EDTA终止反应,再加入PBST收集细胞核,4℃,500g离心5min,弃上清,再用PBST洗2次。
S4,利用末端转移酶向所述cDNA序列的3'端添加一段poly A序列,之后将细胞核再次均匀地分装至多孔板中,向每个孔中加入所述第一杂交引物,加入每个孔中的所述第一杂交引物的所述细胞标签2序列均不同,在所述桥连引物存在的情况下使所述连接序列1和所述连接序列2连接。
在本发明的一些实施方案中,cDNA序列通过末端转移酶在3'端添加一段poly A序列,具体地:
(1)配置末端转移酶体系100μL(1×末端转移酶缓冲液,10mM CoCl2,200μM dATP,400U末端转移酶),将细胞核重悬于体系中,37℃烘箱,15min,10rpm。
(2)加入等体积40mM EDTA终止反应,再加入PBST收集细胞核,4℃,500g离心5min,弃上清,再用PBST洗2次。
在本发明的一些实施方案中,先将所述第一杂交引物与所述桥连引物退火杂交再与细胞核混合。在本发明的一些具体实施方案中,先将30μM第一杂交引物和10μM桥连引物1:1混合后,从95℃慢速降至25℃,使得桥连引物上的连接序列2的互补序列与第一杂交引物上的连接序列2杂交,得到第一杂交引物-桥连引物杂合双链。第一杂交引物-桥连引物杂合双链上的连接序列1的互补序列再与连接序列1杂交,使得连接序列1和连接序列2连接,从而实现将细胞标签2序列引入DNA和cDNA序列。
S5,将细胞核收集并混合,再次均匀地分装至多孔板中,向每个孔中加入所述第二杂交引物和所述第三杂交引物。加入每个孔中的所述第二杂交引物的所述细胞标签3序列A和所述第三杂交引物的所述细胞标签3序列R均不同,使得所述的包埋序列的互补序列与所述包埋序列进行杂交,所述连接序列1的互补序列与所述连接序列1进行杂交,并且所述第三杂交引物的poly T序列与cDNA的poly A序列进行杂交,从而将细胞标签3序列和至少一部分测序接头2序列连接到基因片段和cDNA片段上。
在本发明中,加入第二杂交引物后,除所述包埋序列的互补序列能够与所述包埋序列杂交外,所述连接序列1的互补序列还能够与所述连接序列1进行杂交。也就是说,所述第二杂交引物共有两段序列分别与基因组片段上的包埋序列和连接序列1结合,从而达到接头转换的效果。与单端结合相比,这种双端结合方式获得的产物浓度上就可提升3~5倍,因此所述方法有更高的灵敏度。而第三杂交引物与cDNA之间的杂交为效率较高的T/A杂交,从而能轻易将细胞标签3序列R引入cDNA序列。
本发明的本轮杂交反应属于胞外杂交反应,能够大大增加杂交效率,提高测序灵敏度。除此之外第二轮杂交反应与常见的基于寡核苷酸链杂交标记染色体可及性测序相比,无需额外加入封闭寡核苷酸序列进行封闭步骤,同时可控制细胞间污染率处于极低水平,因此整体操作流程更简单快速。
在本发明的一些具体实施方案中,反应程序如下:55℃10min、65℃5min、50℃10min(65℃到50℃设置缓慢降温,0.1℃/s),37℃5min(50℃到37℃设置缓慢降温,0.1℃/s),25℃5min(37℃到25℃设置缓慢降温,0.1℃/s),10度保持。
所设温度使原包埋固定序列先解离,所述第二杂交引物包埋序列的互补序列与所述包埋序列进行杂交,连接序列1的互补序列与所述连接序列1进行杂交,最后所述第三杂交引物与cDNA的poly A序列进行杂交,两个反应互不干扰。
进一步地,本发明的第二轮杂交反应是通过控制退火温度使得包埋序列的互补序列和桥连引物前述步骤产物上脱离释放,并在3'端结合上第二杂交引物。
S6,利用DNA连接酶和DNA聚合酶将切割后的DNA和杂交后的cDNA补齐为完整双链;
S7,利用所述的第一PCR扩增引物组合进行第一轮扩增,再将产物一分为二,分别用所述第二PCR扩增引物组合进行第二轮扩增,完成测序文库构建。
利用上述方法,最终得到的基因组文库(ATAC文库)的结构5'到3'端依次为:测序接头1、细胞标签2序列、连接序列2、连接序列1、细胞标签1序列A、包埋固定序列、基因组开放片段、包埋固定序列、细胞标签3序列A、连接序列1和测序接头2;转录组文库(RNA文库)的结构5'到3'端依次为:测序接头1、细胞标签2序列、连接序列2、连接序列1、细胞标签1序列R、cDNA、PolyA、细胞标签3序列R和测序接头2。在本发明的一些实施方案中,进一步包括将得到的测序文库环化、制作DNB并进行测序。
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。
实施例
以下例子在此用于示范本发明的优选实施方案。本领域内的技术人员会明白,下述例子中披露的技术代表发明人发现的可以用于实施本发明的技术,因此可以视为实施本发明的优选方案。但是本领域内的技术人员根据本说明书应该明白,这里所公开的特定实施例可以做很多修改,仍然能得到相同的或者类似的结果,而非背离本发明的精神或范围。
除非另有定义,所有在此使用的技术和科学的术语,和本发明所属领域内的技术人员所通常理解的意思相同,在此公开引用及他们引用的材料都将以引用的方式被并入。
那些本领域内的技术人员将意识到或者通过常规试验就能了解许多这里所描述的发明的特定实施方案的许多等同技术。这些等同将被包含在权利要求书中。
下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的仪器设备,如无特殊说明,均为实验室常规仪器设备;下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。
实施例1带寡核苷酸细胞标签序列的转座酶的配制
(1)转座酶包埋接头序列保存液:配制浓度为5μM Tn5引物工作液,保存于-80℃冰箱。其序列和配制方法如下:
Tn5 primerA(第二链序列):
5'-[pho]CTGTCTCTTATACACATCT-3',
[pho]代表磷酸化修饰,该序列为转座酶包埋识别固定序列。
Tn5 primerB(第一链序列):
5'-phos-ACACTCTTTCCCTACACGACGjjjjjjjjjjAGATGTGTATAAGAGACAG-3’,
10j为细胞标签1序列A,每组10j之间汉明距离大于等于4,即任意两个细胞标签之间,至少有4个不同的碱基,有1~768种细胞标签组合。
将Tn5 primerA(100μM),Tn5 primerB(100μM)等体积混合,置于PCR仪中从95℃慢速降至25℃获得Tn5引物工作液。
(2)将Tn5裸酶与Tn5引物工作液30℃孵育30~60min后于-20℃冰箱保存。
实施例2物种混合(人293T细胞系和鼠3T3细胞系)细胞实验
1.试剂准备
10%BSA:DPBS配制,4℃保存。
10% Tween-20:ddH2O配置,4℃保存。
40%/50% PEG8000:ddH2O配置,4℃保存。
10% IGEPAL CA-630:ddH2O配制,4℃保存。
1%洋地黄皂苷储存液(Promega G9441):DMSO配制,-20℃保存。
0.2% PFA稀释液:PBS配制,现配现用。
40mM EDTA:10mM Tris-HCl(pH8.0)配置,4℃保存。
100×蛋白酶抑制剂储液(Roche,04693132001):ddH2O配制,-20℃保存12周,4℃保存2周。
2×酶切反应液:20mM Tris-HCl(pH7.5),10mM MgCl2,20%二甲基甲酰胺,ddH2O配置,4℃保存。
WBin洗液:1%BSA,0.05% Triton X-100,400U/mL RNA酶抑制剂,PBS配制,现配现用。
PBSTin洗液:0.05% Tween-20,400U/mL RNA酶抑制剂,PBS配置,现配现用。
PBST洗液:0.05% Tween-20,PBS配置,现配现用。
细胞核制备液:0.1% IGEPAL CA-630,1mM DTT,5% BSA,400U/mL RNA酶抑制剂,1×蛋白酶抑制剂,PBS配制,现配现用。
核裂解液:1% SDS,0.1mg/mL蛋白酶K,10mM Tris-HCl配制,现配现用。
2.细胞核制备
小鼠胚胎成纤维细胞3T3和人胚肾细胞(293T)重悬于细胞核制备液中混匀,冰上放置5min,期间吹悬细胞两次,再利用WBin洗液稀释以终止反应。
3.固定
取人293T细胞核与鼠3T3细胞核进行1:1混合共计400万细胞,用4mL 0.2% PFA稀释液重悬细胞,室温放置固定10min,期间不断摇晃离心管防止细胞核黏连成团,加入30μL2.5M甘氨酸终止固定,冰上放置10min,向细胞核中加满WBin洗液,650g4℃离心5min。1mLWBin洗液洗一次,40μM滤网过滤。
4.Tn5酶切反应
取人293T细胞核与鼠3T3细胞核进行1:1混合,并以每孔8万的细胞数加入到预先加有酶切体系的多孔板中,55℃反应30min。
5.细胞核清洗
往每个孔中加入150μL PBSTin洗液,650g 4℃离心5min,小心弃上清。
6.随机引物反转录
(1)取2μL 10μM反转录引物到96孔板中,置于PCR仪中高温单链化3min,随后立即置于冰上,备用。
反转录引物核苷酸序列为:
5'-phos-ACACTCTTTCCCTACACGACGjjjjjjjjjjNNNNNNN-3’,10j为RNA分子的第一细胞标签(细胞标签1序列R),每组10j之间汉明距离大于等于4,即任意两个细胞标签之间,至少有4个不同的碱基,N表示A/T/C/G中的任一种,7N为随机合成的七个碱基序列(随机序列),提供反转录反应所需要的结合位点。
(2)配置反转录体系的其他组分6μL(1×反转录缓冲液,8% PEG8000,0.5%Triton-100,0.5mM dNTP,100U Maxima H Minus反转录酶,20U RNase抑制剂),用排枪将体系分到装有引物的96孔板中,再用带有引物的8μL反转录体系分别重悬细胞核。随后置于PCR仪内进行反转录反应,程序如下:
8℃12sec,15℃30sec,20℃45sec,25℃1min,30℃1min,42℃2min,共10个循环,循环后42℃30min。
(3)反应结束后,加入10μL 40mM EDTA终止反应,置于室温孵育10min;
(4)随后将96孔板中所有细胞收集到离心管中,4℃,600g离心5min,用PBST清洗两遍。
7.外切
(1)配置外切酶体系200μL(1×ExoⅠ缓冲液,ExoⅠ200U),将细胞核重悬于体系中,37℃烘箱,30min,10rpm。
(2)加入等体积40mM EDTA终止反应,再加入PBST收集细胞核,4℃,600g离心5min,弃上清,再用PBST洗2次。
8.末端转移酶加尾
(1)配置末端转移酶体系100μL(1×末端转移酶缓冲液,5mM CoCl2,100μM dATP,400U末端转移酶),将细胞核重悬于体系中,37℃烘箱,15min,10rpm。
(2)加入等体积40mM EDTA终止反应,再加入PBST收集细胞核,4℃,600g离心5min,弃上清,再用PBST洗2次。
9.杂交-连接反应
预先将768种30μM第一杂交引物和10μM桥连引物1:1混合后,从95℃缓慢降温至25℃,使得桥连引物与第一杂交引物形成双链,得到第一杂交引物-桥连引物杂合双链。配制杂交-连接体系:2μM第一杂交引物-桥连引物杂合双链、1×E.coli buffer,10% PEG,1UE.coli ligase。
用杂交-连接体系重悬细胞,每孔2000个细胞核分孔至多孔板中,16℃连接120min。
第一杂交引物的序列为:
5'-TTGTCTTCCTAAGACCGCTTGGCCTCCGACTTjjjjjjjjjjGGCAGCGTC-3',10j为细胞标签2序列,每组10j之间汉明距离大于等于4,即任意两个细胞标签之间,至少有4个不同的碱基。
桥连引物的序列为:
5'-GGAAAGAGTGTGACGCTGCC-3’。
反应结束后,每孔加入等体积40mM EDTA室温终止5min。用PBST稀释每孔体系后收集所有细胞核于离心管中,再用PBST洗2次。
10.杂交-裂解反应
以每孔200个细胞核,分孔至提前预备有每孔3μL杂交-裂解体系的多孔板中并置于PCR仪中发生反应。
其中,杂交-裂解体系为:细胞核裂解液1μL,10μM第二杂交引物1μL,2.5μM第三杂交引物1μL。
第二杂交引物序列为:
5'-phos-CTGTCTCTTATACACATCTjjjjjjjjjjCGTCGTGTAGGGAAAGAGTGTAAGTCGGATCGTAGCCATGTCGTTCinvT-3';10j为细胞标签3序列A,每组10j之间汉明距离大于等于4,即任意两个细胞标签之间,至少有4个不同的碱基。在本实施例中,设计了16种细胞标签3序列A组合。3'端带有invT修饰,用于防止引物降解和非特异性延伸。
第三杂交引物的序列为:
5'-GACTTGTGGTATCAACGCAGAGTACGjjjjjjjjjjTTTTTTTTTTTTTTTTTTTT-3';10j为细胞标签3序列A,每组10j之间汉明距离大于等于4,即任意两个细胞标签之间,至少有4个不同的碱基。在本实施例中,设计了16种细胞标签3序列R组合。
PCR仪程序如下:55℃10min、65℃5min、50℃10min(65℃到50℃设置缓慢降温,0.1℃/s),37℃5min(50℃到37℃设置缓慢降温,0.1℃/s),25℃5min(37℃到25℃设置缓慢降温,0.1℃/s),10度保持。
11.延伸-连接反应
在杂交-裂解反应结束的体系中每孔加入等体积10% Tween-20,离心混匀后加入3μL延伸-连接体系,置于PCR仪中:25℃10min,37℃30min。
其中,延伸-连接体系为:1×DNA聚合酶缓冲液,2.5U DNA连接酶,1U DNA聚合酶和0.5mM dNTP。
反应结束后每孔加入1μL 40mM EDTA终止反应,收集不同细胞标签3杂交引物孔的反应液,加入1.2×VAHTSDNA Clean Beads(诺唯赞)纯化磁珠进行纯化,具体纯化步骤详见说明书。
12.测序文库扩增
在纯化获得的产物中加入PCR体系进行扩增反应,扩增反应分为两轮,其中第一轮PCR体系为:1×KAPA HiFi HotStart ReadyMix,0.2μM P5-ATAC,0.2μM P5-RS1.2,0.4μMP7A。
P5-ATAC的序列为:
5'-[phos]-GAACGACATGGCTACGATCCGAC-3';
P5-RS1.2的序列为:
5'-CGATCCGACTTGTGGTATCAACGCAGAGTACG-3';
P7A的序列为:
5'-TTGTCTTCCTAAGACCGCTTGGC-3';
PCR程序如下:
95℃5min;98℃,20s;65℃,120s;72℃,60s,2个循环;98℃,20s;65℃,30s;72℃,30s,4个循环;72℃,5min;10℃∞。反应结束后,每孔样品加入1.3×磁珠分选纯化文库片段,洗脱时将产物平均分成两份,分别进行第二轮PCR扩增。
第二轮PCR扩增体系分别为:1×KAPA HiFi HotStart ReadyMix,0.2μM P5-AL,0.2μM i7-ATAC和1×KAPA HiFi HotStart ReadyMix,0.2μM P5-RNA1.2,0.2μM i7-ATAC。
PCR程序如下:
95℃5min;98℃,20s;65℃,120s;72℃,60s,4个循环;98℃,20s;65℃,30s;72℃,30s,8个循环;72℃,5min;10℃∞。
P5-AL的序列为:
5'-[phos]-GAACGACATGGCTACGATCCGACTTACAC-3';
P5-RNA1.2的序列为:
5'-[phos]-GAACGACATGGCTACGATCCGACTTGTGGTATCAACGC-3';
i7-ATAC序列为:
5'-TGTGAGCCAAGGAGTTGnnnnnnnnnnTTGTCTTCCTAAGACCG-3',其中10n为index序列,用来区分同一张上机芯片的不同样品。
反应结束,加入两轮磁珠分选纯化250~500bp文库片段。
13.环化测序文库
使用诺唯赞公司VAHTS Circularization Kit for MGI环化试剂盒,按照说明书方法进行操作进行文库环化,环化产物-20℃保存。使用Qubit 3.0荧光剂测定文库浓度,取1μL文库使用Agilent 2100Bioanalyzer进行长度分布检测,剩余文库利用DNBSEQ-T7测序平台进行DNB的制作。
14.上机测序以及数据分析
测序文库使用DNBSEQ-T7测序平台,PE150模式,返回原始fastq数据。
对于RNA我们使用drop-seq工具包对微孔板测序结果进行预先处理,详细操作流程可见Drop-seq使用教程(https://github.com/broadinstitute/Drop-seq/releases)。
(1)使用sccpipe根据测序index拆分测序数据得到单个col数据。
(2)使用Java的picard软件将reads1与reads2的fastq文件合并为bam文件。
(3)使用Drop-seq tools进行处理,主要包括四个步骤,第一步是预比对工作,从bam文件中提取每对reads的barcodes与umi序列,并打上标签,然后根据碱基质量进行一轮过滤。第二步是比对工作,使用STAR比对工具将Read 2中大于20bp的序列比对到人(hg19)和小鼠(mm10)的参考基因组上,去掉比对到多个位点的比对结果,保留唯一比对reads结果。第三步是将比对结果进行排序。第四步是将比对结果进行整合,合并具有相同独特分子标记且相同细胞条形码的比对结果,并给reads打上比对得到的基因标签。第五步,也是最后一步,生成基因数字表达矩阵(DigitalExpression),一般将独特分子标签少于500个的细胞作为“空细胞”作为转录背景,将独特分子标签大于500个的细胞作为真正的细胞,写入最后的表达矩阵结果中,并生成细胞表达总结文件。
对于ATAC数据,需要额外使用cutadapt删掉序列末尾的包埋固定序列,再使用bwa比对工具将修剪过的序列与参考基因组进行比对,得出的比对结果被snaptools所处理并输出为ATAC-snap格式的文件,最后借助专用的Python工具,将这些ATAC-snap文件中的片段信息提取出来经过排序处理,以便后续进行更深入的分析。
若一个细胞唯一比对到人或小鼠参考基因组的片段数不足90%,则被认为是交叉污染的细胞。图2显示物种间的污染率不论是从开放基因组序列看还是从转录组序列看均低于0.22%,与其他建库平台相比处于极低水平。
另外,综合比较几种已发表的单组学和多组学方法学平台,包括Paired-se、sci-CARF多组学平台;sci-ATAC-seq、dscATAC-seq等单细胞ATAC测序技术以及SPLiT-seq、Drop-seq、sci-RNA-seq、10×scRNA-seq等单细胞转录组测序技术,结果显示在图3,左图为各单细胞ATAC-seq平台单核测得的UM,右图为各单细胞RNA-seq平台单核测得的基因数.
结果表明,本发明测序方法(红色柱)在对HEK293T和NIH/3T3细胞基因检测灵敏度要远远高于其他ATAC-seq平台,而与各RNA-seq平台的比较中,本发明测序方法在对HEK293T和NIH/3T3细胞转录组检测的灵敏度要明显高于其他多组学平台,甚至高于个别单组学平台,从而证明本发明的测序试剂盒和方法具有超高的灵敏度。
实施例3成体C57BL/6J小鼠全脑组织单细胞测序
取野生型C57BL/6J全脑组织,吸干水分后将脑组织置于研钵中,迅速倒入液氮,将组织快速研磨成粉末,用镊子夹取部分组织于细胞核制备液以获得单细胞核悬液,其余步骤同实施例2,并取约15,000细胞进行杂交-裂解反应用于文库构建。文库送DNBSEQ-T7测序平台进行质量检测与测序,使用PE150测序策略,返回原始数据进行筛分比对得到基因组开放性区域富集图谱以及基因表达谱,根据实际测序深度过滤得到高质量数据细胞(nFeature>200,nFrags>500),筛选得到共3,876个单细胞多组学数据,如图4所示,其平均基因数为1137.54,平均fragments为18850.94,平均TSS为11.21。随后使用R分析基因表达与,具体步骤如下:
1.使用ScaleData函数(Seurat包)对整合的Seurat对象中的基因表达进行中心化,使用RunPCA(Seurat包)对高变基因进行主成分分析(Principal component analysis,PCA),并参考ElbowPlot的曲线拐点选择后续使用的PCA维度。
2.在RunUMAP(Seurat包)函数中,通过选取的PCA维度使用fit-tsne进行降维。在该函数中,将dims设置为选取的PCA数。
3.使用FindNeighbors和FindClusters函数(Seurat包),基于细胞间的距离进行分群。将FindNeighbors中k.param设置为10,维度(dims)设置为选择的PCA维度;将FindClusters中迭代次数设置为50,分辨率设置为1。
4.使用DimPlot函数(Seurat包)来对每个组织的分群情况进行可视化。在该函数中,将reduction设置为“UMAP”。
5.通过FindAllMarkers函数(Seurat包),利用Wilcoxon秩和检验来计算每个细胞亚群的特征高表达基因(marker)。
6.使用dscblast(Fuyt27/dscBLAST)方法对数据进行比对注释,可视化UMAP,单细胞水平分群如图5所示,转录组数据(左图)和ATAC数据(右图)分别获得了18和12个细胞群,包括不同脑区的多种神经元以及多种胶质细胞亚型等,说明本发明的测序试剂盒和测序方法对大规模高通量单细胞转录组有较高的灵敏度和细胞亚型高分辨能力。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims (10)

1.一种转录组和基因组可及性双模态测序试剂盒,其特征在于,包括:
连接有特殊定制序列的转座酶,用于在切割基因组的同时将所述特殊定制序列连接在基因片段上,所述特殊定制序列为双链序列,分别为第一链序列和第二链序列,其中第一链序列5'-3'依次包括连接序列1、细胞标签1序列A和包埋序列,其中第二链序列为所述包埋序列的互补序列;
反转录引物,5'-3'依次包括连接序列1、细胞标签1序列R和随机序列,所述随机序列用于与RNA杂交并延伸得到cDNA序列,所述细胞标签1序列R与所述细胞标签1序列A各不相同且一一对应;
第一杂交引物,5'-3'依次包括测序接头1序列、细胞标签2序列和连接序列2,
桥连引物,5'-3'依次包括至少一部分所述连接序列1的互补序列和至少一部分所述连接序列2的互补序列,用于使所述连接序列1和所述连接序列2连接;
第二杂交引物,5'-3'依次包括所述包埋序列的互补序列、细胞标签3序列A、至少一部分所述连接序列1的互补序列和测序接头2序列;
第三杂交引物,5'-3'依次包括连接序列3、细胞标签3序列R和多聚T序列;
第一PCR扩增引物组合,包括两段第一PCR扩增上游引物和一段第一PCR扩增下游引物,其中一段第一PCR扩增上游引物为测序接头2序列,用于预扩增开放的基因组片段;另一段第一PCR扩增上游引物5'-3'依次包括为至少一部分测序接头2序列和至少一部分连接序列3,用于预扩增cDNA;所述第一PCR扩增下游引物5'-3'为至少一部分测序接头1序列的反向互补序列;
第二PCR扩增引物组合,包括基因组第二PCR扩增上游引物、转录组第二PCR扩增上游引物和第二PCR扩增下游引物,所述基因组第二PCR扩增上游引物5'-3'依次为测序接头2序列和增加扩增特异性的碱基序列,所述转录组第二PCR扩增上游引物5'-3'依次为测序接头2序列和至少一部分连接序列3,所述第二PCR扩增下游引物为包括index序列的测序接头序列。
2.根据权利要求所述的一种转录组和基因组可及性双模态测序试剂盒,其特征在于,所述连接有特殊定制序列的转座酶的制备过程如下:
(1)准备或获得包括所述第一链序列的第一链引物和包括所述第二链序列的第二链引物,按等比例混合后从95℃降至25℃获得转座酶引物工作液;所述第一链引物带有不同的细胞标签1序列A,将同种细胞标签1序列A的第一链引物与第二链引物分别混合,得到多种不同的转座酶引物工作液;
(2)将转座酶分别与不同种转座酶引物工作液于30℃孵育30~60min。
3.根据权利要求1所述的一种转录组和基因组可及性双模态测序试剂盒,其特征在于,所述细胞标签1序列A、细胞标签1序列R、细胞标签2序列、细胞标签3序列A和细胞标签3序列R分别包括6~15个碱基。
4.根据权利要求3所述一种转录组和基因组可及性双模态测序试剂盒,其特征在于,所述细胞标签1序列A、细胞标签1序列R、细胞标签2序列、细胞标签3序列A和细胞标签3序列R中任意一个标签的不同序列之间的汉明距离大于等于4。
5.根据权利要求4一种转录组和基因组可及性双模态测序试剂盒,其特征在于,所述第二杂交引物3'端带有invT修饰。
6.根据权利要求1~5任一所述的一种转录组和基因组可及性双模态测序试剂盒,其特征在于,还包括细胞核制备液、核裂解液、酶切反应液、反转录缓冲液、末端转移酶缓冲液、连接缓冲液、PCR缓冲液。
7.根据权利要求6所述的种转录组和基因组可及性双模态测序试剂盒,其特征在于,所述细胞核制备液包括0.1~0.2%IGEPAL CA-630,1mM DTT,5%BSA,400U/mL RNA酶抑制剂和1×蛋白酶抑制剂。
8.根据权利要求6所述的种转录组和基因组可及性双模态测序试剂盒,其特征在于,所述酶切反应液包括:20mM pH7.5 Tris-HCl,10mM MgCl2,10~20%二甲基甲酰胺和400U/mLRNA酶抑制剂。
9.利用权利要求1所述的转录组和基因组可及性双模态测序试剂盒进行测序的方法,其特征在于,包括以下步骤:
S1,获得待测序细胞的细胞核并进行固定,将固定后的细胞核均匀地分装至多孔板中;
S2,利用所述连接有特殊定制序列的转座酶切割基因序列,加入每个孔中的转座酶的所述细胞标签1序列A均不同;
S3,离心洗去酶切体系,向细胞核所在的每个孔中加入所述反转录引物和反转录缓冲液,加入每个孔中的反转录引物的所述细胞标签1序列R不同,其与细胞标签1序列A互不相同且一一对应,在反转录缓冲液中进行反转录反应,得到cDNA序列,将细胞或细胞核收集并混合;
S4,利用末端转移酶向所述cDNA序列的3'端添加一段poly A序列,之后将细胞核再次均匀地分装至多孔板中,向每个孔中加入所述第一杂交引物,加入每个孔中的所述第一杂交引物的所述细胞标签2序列均不同,在所述桥连引物存在的情况下使所述连接序列1和所述连接序列2连接;
S5,将细胞核收集并混合,再次均匀地分装至多孔板中,向每个孔中加入细胞裂解液、所述第二杂交引物和所述第三杂交引物,加入每个孔中的所述第二杂交引物的所述细胞标签3序列A和所述第三杂交引物的所述细胞标签3序列R均不同且一一对应。
S6,利用DNA连接酶和DNA聚合酶将切割后的DNA和cDNA补齐为完整双链;
S7,利用所述第一PCR扩增引物组合进行第一轮扩增,再将产物一分为二,分别用所述第二PCR扩增引物组合进行第二轮扩增。
10.根据权利要求9所述的测序方法,其特征在于,步骤S1中,所述进行固定的方法包括:
(1)用4mL 0.2%PFA重悬细胞核,室温固定10min,期间不时进行混匀;
(2)加入30μL 2.5M甘氨酸置于冰上10~20min终止固定,期间不时混匀;
(3)4℃,300~800g离心3~10min,清洗沉淀,30~50μM滤网过滤。
CN202410534391.9A 2024-04-30 2024-04-30 一种转录组和基因组可及性双模态测序试剂盒和方法 Pending CN118222686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410534391.9A CN118222686A (zh) 2024-04-30 2024-04-30 一种转录组和基因组可及性双模态测序试剂盒和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410534391.9A CN118222686A (zh) 2024-04-30 2024-04-30 一种转录组和基因组可及性双模态测序试剂盒和方法

Publications (1)

Publication Number Publication Date
CN118222686A true CN118222686A (zh) 2024-06-21

Family

ID=91506662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410534391.9A Pending CN118222686A (zh) 2024-04-30 2024-04-30 一种转录组和基因组可及性双模态测序试剂盒和方法

Country Status (1)

Country Link
CN (1) CN118222686A (zh)

Similar Documents

Publication Publication Date Title
CN105506125B (zh) 一种dna的测序方法及一种二代测序文库
CN107604046B (zh) 用于微量dna超低频突变检测的双分子自校验文库制备及杂交捕获的二代测序方法
CN113005121B (zh) 接头元件、试剂盒及其相关应用
CN110129415B (zh) 一种ngs建库分子接头及其制备方法和用途
CN111808854A (zh) 带有分子条码的平衡接头及快速构建转录组文库的方法
WO2023221842A1 (zh) 一种高通量单细胞转录组测序方法及其应用
CN109853047A (zh) 一种基因组dna测序文库快速构建方法及配套试剂盒
CN113249439A (zh) 一种简化dna甲基化文库及转录组共测序文库的构建方法
CN110886021A (zh) 一种单细胞dna文库的构建方法
CN114107459A (zh) 一种基于寡核苷酸链杂交标记的高通量单细胞测序方法
WO2020047769A1 (zh) 一种rna建库方法及试剂盒
CN109207471A (zh) 一种构建分片段核酸文库的方法及其应用
CN114507711A (zh) 一种单细胞转录组测序方法及其应用
CN111996598A (zh) 一种单细胞染色质可及性的建库方法
CN115715323A (zh) 一种高兼容性的PCR-free建库和测序方法
CN118222686A (zh) 一种转录组和基因组可及性双模态测序试剂盒和方法
CN114574569A (zh) 一种基于末端转移酶的基因组测序试剂盒和测序方法
CN116515977B (zh) 基于单端接头转座酶的单细胞基因组测序试剂盒和方法
CN112795990B (zh) 一种灵活多变的降低污染及pcr偏倚的多标签二代测序文库接头
CN111793623A (zh) 62个多等位snp-ngs的分型遗传标记组合物、试剂盒、鉴定体系以及分型方法
CN114854825A (zh) 一种适用于dnbseq技术的简化基因组测序的建库接头及方法
CN118272508A (zh) 基于单端接头转座酶的单细胞基因组测序试剂盒及其应用
CN111485024A (zh) 用于个体特征确认的引物组合、及其应用
CN114277096B (zh) 鉴别地中海贫血αααanti4.2杂合型和HKαα杂合型的方法和试剂盒
CN114686562B (zh) 用于核酸样本扩增的组合物、试剂盒、方法及系统

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination