CN105297142B - 同时对单细胞基因组和转录组构库及测序的方法基于单细胞整合基因组学的测序方法及应用 - Google Patents

同时对单细胞基因组和转录组构库及测序的方法基于单细胞整合基因组学的测序方法及应用 Download PDF

Info

Publication number
CN105297142B
CN105297142B CN201510509535.6A CN201510509535A CN105297142B CN 105297142 B CN105297142 B CN 105297142B CN 201510509535 A CN201510509535 A CN 201510509535A CN 105297142 B CN105297142 B CN 105297142B
Authority
CN
China
Prior art keywords
unicellular
sequencing
genome
cell
transcript profile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510509535.6A
Other languages
English (en)
Other versions
CN105297142A (zh
Inventor
李周芳
贺建奎
王嫣
郭佳杰
张萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest University of Science and Technology
Original Assignee
Southwest University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest University of Science and Technology filed Critical Southwest University of Science and Technology
Priority to CN201510509535.6A priority Critical patent/CN105297142B/zh
Publication of CN105297142A publication Critical patent/CN105297142A/zh
Application granted granted Critical
Publication of CN105297142B publication Critical patent/CN105297142B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种同时对单细胞基因组和转录组进行高通量文库构建及测序的方法。本发明还提供了一种基于单细胞整合基因组学(SCIG)的测序方法及其应用。本发明提供的SCIG方案能够实现在单次实验中同时得到一个单细胞的基因组和转录组,获得单个细胞中遗传和表观遗传信息,并进行综合分析,全方位,多层面的展示该细胞的状态;这些优势使得SCIG在鉴定单细胞的特性和共性方面具有优越性。

Description

同时对单细胞基因组和转录组构库及测序的方法基于单细胞 整合基因组学的测序方法及应用
技术领域
本发明涉及高通量测序领域,具体涉及一种同时对单细胞基因组和转录组构库及测序的方法,基于单细胞整合基因组学(SCIG)的测序方法及应用。
背景技术
单细胞DNA全基因组测序和RNA转录组测序技术在近年来发展迅速。单细胞DNA扩增方法,在最初的Multiple displacement amplification(MDA)方法基础上,又陆续产生了GenomePlex(WGA4)方法和Multiple Annealing and Looping Based AmplificationCycles(MALBAC)方法。单细胞mRNA扩增方面也陆续产生了SMART-Seq,CEL-Seq,Quartz-Seq等新技术,极大提高了微量mRNA的扩增效率。
目前所有有关单细胞技术方面的研究成果尚不完善,具体分成两类:a只测基因组,不测转录组;b只测转录组,不测基因组;然而,这些分析方法无法展示单细胞的全貌。如何实现在单次实验中同时得到一个单细胞的基因组和转录组,获得单个细胞中遗传和表观遗传信息,并进行综合分析,全方位,多层面的展示该细胞的状态,仍是行业难点。
发明内容
为解决上述问题,本发明提供了一种同时对单细胞基因组和转录组构库及测序的方法,基于单细胞整合基因组学(SCIG)的测序方法及应用。
本发明提供的“单细胞整合基因组学(Single Cell Integrated Genomics,SCIG)方法”是指,通过对单个细胞的核质分离,对细胞核和细胞质分别进行单细胞全基因组扩增和转录组扩增,用高通量测序和生物信息学分析。
进一步地,其中的生物信息分析方法,包括:将单个细胞的基因组和转录组数据整合,综合考虑,分别开展聚类分析,相关性分析和进化树分析,准确鉴定细胞(比如单个肿瘤)中的多个亚克隆,结合细胞(比如癌细胞)的基因型和表型特征之间的一一对应关系的分析模型,更准确地鉴定组织内部(尤其是肿瘤内部)的多个不同的细胞克隆。
本发明生物信息分析方法,还包括但不限于:等位基因分析、基因表达分析、RNA编辑分析,比较基因组和转录本之间的关联分析,如某原癌基因调控区域小片段的缺失导致基因表达的不正常上升,引发疾病,或者该基因表达区域一个碱基突变,导致所表达的蛋白失活等等。本发明提供的技术方案可以做到个体样本点对点的相关性分析,而非传统的通过群体相关来推断。
第一方面,本发明提供了一种同时构建单细胞基因组和转录组高通量测序文库的方法,包括如下步骤:
a)获取单细胞;
b)分离细胞核和细胞质;
c)单个细胞核全基因组扩增,获得基因组测序文库;
d)单个细胞去核细胞质全转录组扩增,获得转录组测序文库。
优选地,所述步骤a)中,所述单细胞为卵母细胞、肿瘤细胞、神经细胞或癌细胞。
优选地,所述步骤b)中,采用显微注射(Microinjection)法对单个细胞进行核质分离。
进一步优选地,所述显微注射法中,微细管针(microcapillary needle)的直径在0.5-5微米(microns),抓针(holding needle)的直径在10-50微米(microns)。
在本发明实施例中,分别以卵母细胞和癌细胞为例进行了实验。其中,卵母细胞胞体较大(100微米左右直径),核相对较小,采用显微操作,抽核效果比较好;但是肿瘤细胞胞体比较小(25微米左右直径),核则相对于细胞体比较大,如果用抽核的方法,很难成功,本发明反过来通过抽取细胞质的方法或者采用完全不同的方法,通过裂解细胞膜但保持细胞核膜完整,释放细胞质,收集RNA,然后分别进行细胞质和细胞核的分析。
优选地,所述步骤c)中,采用WGA4或MDA进行全基因组扩增。
优选地,所述步骤d)中,采用Smart-seq2进行全转录组扩增。
本发明提供的同时构建单细胞基因组和转录组高通量测序文库的方法,先对单个细胞的分选,对单细胞进行核质分离,对两种组分分别进行基因组和转录组的扩增、测序文库的构建和质检、二代深度测序等步骤获得完整的单细胞序列文库。
第二方面,本发明提供了一种同时对单细胞基因组和转录组进行高通量测序的方法,包括如下步骤:对第一方面所得的基因组测序文库和转录组测序文库进行高通量测序,分别获得单细胞的基因组序列信息和转录组序列信息。
优选地,对第一方面所得的基因组测序文库进行外显子组高通量测序。
第三方面,本发明提供了一种基于单细胞整合基因组学的测序方法,包括如下步骤:对第二方面所得的单细胞的基因组序列信息和转录组序列信息进行生物信息学分析。
第四方面,本发明提供了一种基于单细胞整合基因组学的方法鉴定细胞亚克隆的方法,包括如下步骤:根据多个第三方面所得的生物信息学分析序列信息,鉴定细胞亚克隆。
优选地,所述生物信息学分析的方法包括:将单个细胞的基因组和转录组数据整合,分别开展聚类分析,相关性分析和进化树分析,准确鉴定细胞(优选为单个肿瘤)中的多个亚克隆。
进一步优选地,所述生物信息学分析的方法还包括:结合细胞(优选为癌细胞)的基因型和表型特征之间的一一对应关系的分析模型,更准确地鉴定组织内部(优选为肿瘤内部)的多个不同的细胞克隆。
如本发明所述的,所述的“聚类分析”、“相关性分析”和“进化树分析”包括但不限于行业内相应的常规分析方法。
优选地,所述细胞亚克隆为肿瘤细胞亚克隆或癌细胞亚克隆。
第五方面,本发明提供了如第三方面所述的基于单细胞整合基因组学的测序方法在等位基因检测中的应用。
优选地,所述等位基因检测为检测杂合子数量和/或纯合子数量。
第六方面,本发明提供了如第三方面所述的基于单细胞整合基因组学的测序方法在基因表达检测中的应用。
优选地,所述的基因表达检测包括检测mRNA和IncRNA中的至少一种。
优选地,所述的基因表达检测为检测小鼠卵母细胞的基因表达,且检测量不低于13,000(优选为13,686)条蛋白编码基因的表达和/或不低于500(优选为521)条IncRNA基因的表达。
第七方面,本发明提供了如第三方面所述的基于单细胞整合基因组学的测序方法在单等位基因(monoallelic)表达检测中的应用。
优选地,所述的单等位基因(monoallelic)表达检测为检测杂合子的单等位基因(monoallelic)表达数量。
第八方面,本发明提供了如第三方面所述的基于单细胞整合基因组学的测序方法在RNA编辑位点(RNA editing sites,RESs)检测中的应用。
优选地,所述的RESs检测包括但不限于:A-to-G、A-to-C、A-to-T、T-to-C、T-to-G、T-to-A、C-to-T、C-to-A、C-to-G、G-to-A、G-to-T、G-to-C、插入突变(ins)及缺失突变(del)中的一种或多种。
优选地,所述的RESs检测为检测小鼠卵母细胞的RESs,且A-to-G和T-to-C类型的检出值占所有检出RESs位点总量不低于20%(优选为30%-38%)。
第九方面,本发明提供了如第一方面所述的同时构建单细胞基因组和转录组高通量测序文库的方法、或如第三方面所述的基于单细胞整合基因组学的测序方法在二代、下一代或单分子高通量测序中的应用。
本发明提供的SCIG方案能够实现在单次实验中同时得到一个单细胞的基因组和转录组,获得单个细胞中遗传和表观遗传信息,并进行综合分析,全方位,多层面的展示该细胞的状态;这些优势使得SCIG在鉴定单细胞的特性和共性方面具有优越性。
目前,高通量测序的主要平台代表有罗氏公司(Roche)的454测序仪(Roch GS FLXsequencer)、Illumina公司的Solexa基因组分析仪(Illumina Genome Analyzer)和ABI的SOLiD测序仪(ABI SOLiD sequencer)等,应当指出的是,本发明提供的技术方案适用于目前任一一种二代高通量测序的文库构建工作,尤其可大大缩短Miseq及Hiseq测序平台中PCR产物的文库构建的工作时间,提高接头(adapter)的连接效果,进而提高目的产物的测序数据质量。
附图说明
图1是本发明实施例提供的SCIG实验流程示意图;
图2是本发明实施例提供的SCIG生物信息学分析流程图;
图3是本发明实施例提供的多个样品分析单细胞外显子组和转录组的流程示意图;
图3-b中英文:nucleus:细胞核;cytoplasm:细胞质;MDA or WAGA4amplification:MDA或WAGA4扩增;exome-sequencing:外显子测序;Smart-seq2amplification:Smart-seq2扩增;heterozygous loci:杂合子位点;allele expressionfrequency:等位基因表达频率;allele specific expression:等位基因特异性表达;homozygous loci:纯合子位点;mismatched RNA sequence:错配RNA测序;RNA editing:RNA编辑。
图4是本发明实施例提供的卵母细胞外显子序列的生物分析结果;
图5是本发明实施例提供的卵母细胞转录组序列的生物分析结果;
图6是本发明实施例提供的卵母细胞基因表达水平的分析结果;
图7是本发明实施例提供的基因组和转录组序列比对分析结果;
图8是本发明实施例进行的预实验中提供的小鼠单个卵母细胞取核过程;
图9是本发明实施例进行的预实验中采用Quartz-Seq方法,不同样品的转录组以及全基因组的扩增结果;
图10是本发明实施例进行的预实验中提供的单个神经元基因组二代测序结果。
具体实施方式
以下所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
本发明实施例中若无特别说明,所用试剂及耗材均为市售商品。
本发明实施例中若特别说明,测序文库构建参照罗氏、illumina或ABI的高通量测序文库构建说明书。
图1是本发明实施例提供的SCIG实验流程示意图,包括单个细胞的分选,对单细胞进行核质分离,对两种组分分别进行基因组和转录组的扩增,测序文库的构建和质检,二代深度测序等获得完整的单细胞序列文库。
图2是本发明实施例提供的SCIG生物信息学分析流程图,为行业常规分析方法,将单个细胞的基因组和转录组数据整合,综合考虑,分别开展聚类分析,相关性分析和进化树分析,准确鉴定单个肿瘤中的多个亚克隆。
(1)聚类分析(Clustering Analysis):比如通过主成分分析(PrincipleComponent Analysis,PCA)比较同一组织中的来源于不同位置的单个细胞,展示同一个组织(比如肿瘤)中几十个细胞的分布,确定几个主要的分支,即亚克隆群。
(2)相关性分析(Correlation Analysis):Heatmap图谱展示单个细胞(比如癌细胞)中单基因突变和细胞拷贝数变化和基因转录水平的相关性,从遗传学和表观遗传两个方面全景展示单个细胞(比如癌细胞)的时空差异。优化单细胞基因组和转录组分析的方法:主要是转录本分别和基因拷贝数CNV和基因突变之前的对应关系的分析。在过去的几年中,有关CNV分析的方法已经有若干种,但是大部分的CNV研究方法都是针对多细胞的,所以我们将在这些方法上结合这一两年发表的有关单个细胞CNV的研究进一步优化去噪。这方面的工作已经取得了初步成果[Ning L,Liu G,Li G,Hou Y,Tong Y,et al.(2014)CurrentChallenges in the Bioinformatics of Single Cell Genomics.Front Oncol 4:7]。再者,我们还进一步分析基因蛋白编码区的序列中的突变。将这个细胞中基因序列,拷贝数的情况和他的转录组的水平结合,找出相关性。
(3)生物进化树分析(Hierarchical Tree):通过SCIG数据的整合,展示所有癌细胞的进化关系。包括不同位置的癌细胞异同,比如癌中心位置和癌周边的单个细胞对于缺氧(hypoxia)和细胞运动(cell mobility)方面基因表达的特异性等。
参照图1和图2,本发明分别对卵母细胞进行测序和生物信息学分析。具体步骤如下:
SCIG实验部分
本发明实施例提供了一种同时构建卵母细胞基因组和转录组高通量测序文库的方法,包括如下步骤:
实施例1:核质分离
1)取单个小鼠次级卵母细胞;
2)分离细胞核和细胞质:
使用eppendorf显微操作系统,采用显微注射(Microinjection)法对单个细胞进行核质分离。准备孔径大小与单个次级卵母细胞和单个细胞核大小接近的玻璃管(所述显微注射法中,微细管针(microcapillary needle)的直径在0.5-5微米(microns),抓针(holding needle)的直径在10-50微米(microns)),分离完后细胞核与细胞质分别放入不同的PCR管中,随后液氮保存,并对下一个进行同样的处理。(注:细胞质中RNA的不稳定性,我们在穿膜步骤中会注射微量RNA抑制剂到细胞质,防止在破膜分核过程中RNA的降解。同时保证整个过程都在4度操作。)
实施例2:全基因组和全转录组高通量测序文库的构建、及高通量测序
1)单个细胞核全基因组扩增
由于单个细胞中DNA量非常有限(6pg左右),所以在测序之前首先要对单个细胞中的DNA量进行均一扩增。我们采用GenomePlex WGA4扩增方法(Sigma-Aldrich的Single Cell Whole Genome Amplification Kit试剂盒,货号WGA4-50RXN,具体步骤参照试剂盒说明书),该方法将基因组通过短时间高温操作进行随机片段化,形成一系列短模板,然后对这些短链DNA进行随机退火,给每个短链两边都加上有特定序列组成的文库,然后针对这些特定序列,进行等温起始扩增。
2)单个细胞去核细胞质全转录组扩增和文库的构建
单个细胞中全部RNA含量大约在10pg左右,mRNA的含量相对更少一些。首先要对mRNA进行反转录和扩增。我们采用Clontech公司的“SMARTer Ultra Low RNA Kit forSequencing”试剂盒来扩增。
Clontech公司该方法是基于传统的5’RACE技术,在反转录过程中在每个序列片段末端通过Tdt末端转移酶或者置换酶加上一个统一的接头序列(Adaptor),再通过和这些接头序列互补的引物进行PCR扩增。扩增之后的转录组文库会用管家基因引物进行验证,只有合格的文库才会进一步构建成IlluminaHiseq平台的测序文库和测序。
3)基因组和转录组扩增的效果验证:通过管家基因和片段大小分布来验证文库的进行质控,具体指标需满足如下:(1)采用Agilent 2100确定片段范围,挑选片段长度合理的文库;(2)10个管家基因检测扩增的覆盖率,至少扩增5个管家基因。
满足以上两条的在华大基因公司用Illumina Hiseq2000平台对全基因组(外显子组测序(Exome seq))和转录组进行高通量测序。从成本考虑,本发明对第1)步所得的样品进行的全基因组测序,采用外显子测序(可选地,也可采用CNV(1x)测序),以极大的减少测序成本和分析的数据量。
SCIG生物信息分析部分
实施例3:生物信息学分析
从基因组序列和mRNA fastq文件序列分别用Bowtie和Tophat方法与基因组比对[72,73]。并用Varscan方法将基因组和mRNA中差异的位点找出来[38]。默认设置varscan,至少涵盖8个序列数才会用于后续的分析,最小的变异等位基因频率为0.01。变异的等位基因频率小于75%的称为杂合子,否则分配到纯合子变异。通过比对基因组序列和mRNAfastq文件序列来检测RESs,每个位点至少涵盖8个序列。用Cufflinks方法中的FPKM值来测定基因的表达水平[74]。下载的Ensembl基因注释(10mm)中,只选择蛋白编码基因和基因间长链非编码RNA(large intergenic non-coding RNA,lincRNA)[75]。
测序结果以及分析
1、多个样品分析单细胞外显子组
按照实施例1的方法,本发明实施例从小鼠(mouse)6个次级卵母细胞(样品编号ID分别为:S1-S6)中分别提取6个细胞核,同时分别获取6个去核细胞的细胞质。同时,我们制备了PB1 counterparts(样品编号ID分别为:P1-P6,为完整单个细胞样品,作为对照),详细流程参见图3a。
按照实施例2的方法,本发明实施例分别对上述单细胞S1-S6样品的细胞核和去核细胞质进行外显子组测序(exome-seq)和转录组测序(mRNA-seq)(参见图3b)。
生物信息学分析:
图4是本发明实施例提供的卵母细胞外显子序列的生物分析结果。
在覆盖小鼠基因组0.93Gb(34.2%)的数据中,联合S1-S6的外显子组测序数据,通过VarScan方法可检测到726,525个差异位点。436,535个变异位点是杂合子,其中,有290,264(66.5%)个杂合子变异位点的两个等位基因都在一个卵母细胞的基因组中出现(在S1-S6中,有36,000~98,000个杂合子位点)。虽然这些卵母细胞是单倍体,但是这些杂合子位点可以用减数分裂同源重组进行解释。鉴于这些次级卵母细胞出于减数分裂II期,每条染色体具有两条姐妹染色单体,因此,减II期的同源染色体之间的基因重组可能导致了单倍体卵母细胞中的杂合子等位基因)[17]。对于各个卵母细胞来说,杂合子位点在小鼠基因组中的分布大体相同,只有少数例外(参见图4)。
为了确认单倍体卵母细胞中的杂合子变异是源于减数分裂同源重组,并精确定位出发生同源重组的区域,有必要对PB1 counterparts的基因组进行测序。此外,为了证明来源于同一个单倍体细胞的外显子组测序数据的纯合子并非误读,比如,因较低的测序深度或者对两个等位基因的测序偏好所导致的误读,本发明采用来源于同一组织的双倍体细胞的外显子组测序数据作为对照,因此,本发明设置了如下对照:1)对单细胞进行外显子组测序(PB1组,样品编号ID:P1-P6);2)对大量小鼠肝脏细胞(cells in bulk)进行外显子组测序(样品编号ID:BL,来源于同一只小鼠)。构建好的高通量测序文库,采用实施例2同样的方法送华大基因测序。
从图4c可以看出,卵母细胞(S1-S6)、PB1组(单个细胞,P1-P6)、肝脏细胞集群组(BL)中杂合子位点分布非常相似。图4d显示了各个PB1样品中重组的杂合子分布,和图4b中S1-S6卵母细胞的(杂合子)分布模式相匹配;杂合子位点和重组后的杂合子位点高度相关的结果表明,从卵母细胞的S1-S6样品中获得的外显子信息是精确的。另一方面,从外显子组测序数据看,在卵母细胞S1-S6样品测序结果中,只有小于0.05%(~46,000)的纯合子位点在肝脏细胞中被标注为杂合子位点,小于0.31%的杂合子位点在肝脏细胞中被标注为纯合子位点,这说明从卵母细胞S1-S6样品中获得的外显子信息忠实地显现了卵母细胞外显子的信息,并没有出现等位基因选择偏好或低质量的测序。总的说来,上述各种类型样品的外显子组测序实验给单个细胞提供了可信的基因组参考序列,可用于后续的整合分析。
2、在单个卵母细胞样品中和多个卵母细胞样品中检测到相似的基因表达数
对于转录组测序(mRNA-seq assays)来说,本发明提供了如下样品:
组1:3个单个的卵母细胞的转录组(样品ID:SW1-SW3;均来源于同一小鼠);
组2:200个卵母细胞的转录组(样品ID:B200;来源于多只小鼠);
对1)和2)分别进行单细胞转录组测序和多细胞转录组测序,以比较单个去核卵母细胞质(S1-S6号样品)、单个卵母细胞(组1)以及多个卵母细胞(组2)之间转录丰度的异同点。
图5是本发明实施例提供的卵母细胞转录组序列的生物分析结果。
S1-S6号样品的转录组测序序列在整个转录组中分布均匀,证明本发明实施例采用的Smart-seq2扩增方法可以覆盖(recover)全长mRNA转录本[16]。通过评估所得序列数占转录本的比例,结果显示,转录本的3’端的覆盖率更高,然而,整个转录本的覆盖率在25%-75%之间,表明在cDNA扩增同样覆盖了转录本的5’端(参见图5a)。选取每个转录本样品中的1%,计算序列的频率,结果发现,有一小部分序列位于转录本的5’端(参见图5b)。进一步地,本发明实施例通过对转录本的长度进行分组,分析了mRNA转录本中的序列覆盖度和序列频率,结果表明,转录本越长,表现出的3’端偏好就越明显[25]。
在每个单个卵母细胞中(包括S1-S6号样品和SW1-SW3号样品),均能检测到超过10,000条蛋白编码基因和IncRNA(long non-coding RNA);当采用更高的标准时,比如FPKM超过0.1时,仍能发现大约10,000条基因在每个卵母细胞中表达(参见图5c)。
如本发明所述的,FPKM(Reads Per Kilobase of exon model per Millionmapped reads,[Mortazavi etal.,2008]),即每1百万个map上的reads中map到外显子的每1K个碱基上的reads个数。
在单个卵母细胞样品(组1和S1-S6号样品)中,表达的基因比多个卵母细胞样品(组2)中的少,在B200(组2)中表达的基因(同时在单个卵母细胞样品中没有发现表达)一般表现出较小的FPKM值(参见图5c)。理论上,鉴于动态的转录调控,以及由于转录爆发导致的转录组异质性(transcriptome heterogeneity),在同样的测序深度前提下,200个细胞的群体样品应该比单个细胞样品具有更多的表达基因,同时可能有一个较低的表达水平。然而,出乎意料的是,本发明实施例发现,在S1-S6号样品的去核细胞质比W1-SW3号样品的完整单细胞具有更多数量的表达基因;此外,所有在W1-SW3号样品中表达的基因在S1-S6号样品中同样也表达,这可能是由于去核细胞质的测序深度相对稍微高了一点,比对碱基数(mapped reads)约超过完整单细胞平均25M(1.5%)。如果对各个样品给定类似的比对数量(小于40million),给的对比的碱基数越高,越多表达基因就可能被发现[9,39]。此外,细胞与细胞之间的差异,以及外界环境的变化可能引起转录本表达数量的差异[40]。当将“表达基因”定义为至少0.1FPKM时,我们在完整的卵母细胞中(而非去核卵母细胞质中则没有发现表达)获得了526个表达基因;另外,在完整的卵母细胞和去核卵母细胞质两种细胞样品中,这些基因的表达水平的差异非常小(中位数为0.97FPKM,即median of 0.97 FPKM,参见图5d),这表明从细胞中提取走细胞核的操作只会带来非常微量的带poly(A)尾的RNA损失。
此外,mRNAs、lncRNA转录本均可被mRNA-seq测序,因为lncRNA也具有poly(A)尾,并且在mRNA-seq测序中的poly(A)尾捕获步骤会被保留下来。因此,在去核细胞质的S1-S6号样品中,我们除了检测到13,686条蛋白编码基因之外,还能检测到521条表达IncRNA基因。Ensembl注释记录了小鼠(mouse)1,793条IncRNA基因和22,182条蛋白编码基因(chrY和chrM除外)。这两种基因被检测的基因比例非常不同(P-value<2.2E-16,chi-square test,卡方检验),同样,在单个卵母细胞(组1)和多个卵母细胞(组2)样品中,类似不同的规律也被观察到(P-value<2.2E-16,chi-square test)。目前,有研究称有一些不带poly(A)尾的lncRNA在mRNA-seq测序中不能被捕获,这就解释了为什么本发明实施例中检测到的lncRNA数量较少[39]。此外,相比mRNA,lncRNA的表达呈现高度的组织特异性,可能在卵母细胞中有一部分lncRNA并不转录[41]。
3、单个的卵母细胞中的基因表达水平高度相关
通过DAVID,发现S1-S6号样品中前100高度表达的基因在GO期(细胞周期中的GO期)丰度较高,包括细胞周期、细胞分裂和配子产生等活动的GO期;此外,在诸如卵母细胞减数分裂和细胞周期的生物途径(biological pathways)中的丰度也较高[42]。在W1-SW3号样品和B200样品中,前100高表达的基因的丰度规律和S1-S6号样品差不多,这表明卵母细胞在这些样品中功能正常,且相关功能基因的转录本表达水平较丰富。
现有文献[10,12]通过计算单个细胞间表达值得相关因子(correlationcoefficient of expression values)来评估细胞间转录组的变异(variability)。本发明实施例采用与上述文献报道相同的方法进行分析,发现:来源于相同组织的单个卵母细胞之间表现出几乎相同的基因表达情况。具体地,任意两对去核卵母细胞质之间的PCC值(Pearson’s correlation coefficient)均大于0.94(P-value<2.2E-16,参见图6a)。此外,去核卵母细胞质(S1-S6号样品)和完整卵母细胞(W1-SW3号样品)之间的FPKM值的相关性也很高(P-value<2.2E-16,Pearson’s correlation test,参见图6b)。除了上述基因之间数目的类似,这些高度相关性进一步证明,去核卵母细胞质的转录组忠实地反应了完整卵母细胞的转录组。
与此不同的是,去核卵母细胞质和多个卵母细胞样品(组2)之间的相关性较低(PCCs小于0.6;P-value<2.2E-16)。PCC值表现出来的巨大差异表明,与不同组织之间的异质性相比,细胞-细胞之间的差异会小得多(参见图6c)。
4、卵母细胞中绝大多数杂合子位点(heterozygous loci)以单等位基因(monoallelic)的方式进行转录
了解等位基因的特异性表达有助于阐明基因表达调控和变异[43]。此外,有些等位基因特异性表达事件对诸如癌症之类的基因疾病机制的重要因素[44]。在多细胞测序中,等位基因频率的异质性和等位基因表达特异性的异质性是不可避免的。为了分析多细胞测序数据中的等位基因特异性表达情况,需要分析大量数据以及依靠复杂的计算机算法[43,45]。本发明提供的同时检测一个细胞的基因组和转录组方法,有利于对杂合子位点进行定位,并在核算水平评估等位基因表达频率。
如前所述的,由于减数分裂的同源重组,可以在单倍体卵母细胞的基因组中检测到杂合子位点。对于这些杂合子位点,可以计算出转录组测序序列中参考等位基因和变异等位基因的数量[46]。结果显示,绝大部分杂合子位点(78.1%~90.0%)只有1个等位基因表达(变异等位基因表达频率少于0.01或者大于0.99)。这个发现在某些方面和现有报道是一致的,比如,通过单等位基因(monoallelic)表达的基因出乎意料的多[18,44,47]。在这些报道中,基因型通过小鼠杂交(mouse crosses)[18]或者SNP芯片[47]等技术被定义或者确认,在基因水平(gene-level)上对等位基因表达频率进行了研究。研究者们发现,具有杂合子SNPs的基因中,5%-26%(常染色体)以单等位基因(monoallelic)的方式表达[18,44,47]。
本发明实施例中,在核酸水平(nucleotide-level)上发现了更多的单等位基因式(monoallelically)的表达位点,其中,有40%-50%的位点位于蛋白质编码区之外或者位于lncRNA剪接转录本之外(外显子之外)。但是,我们发现不同的细胞在相同杂合子位点上等位基因的表达表现出类似的偏好。针对两个细胞相同的杂合子位点,本发明实施例还检测了每个细胞的变异等位基因表达频率。一些单等位基因(monoallelic)位点表现出协同的参考等位基因偏好(左下角),另一些单等位基因(monoallelic)位点中,变异等位基因的表达则占主导(右上角)。
在对两个等位基因都表达的杂合子位点进行分析时,本发明实施例发现变异等位基因的表达频率很均匀地分布在0.01-0.99之间,而不是聚集在0.5,此外,各细胞中,具体等位基因的表达是动态、随机的[18],因此,多个细胞样品的转录组测序结果可能会显示不出单等位基因(monoallelic)表达模式。本发明实施例在多个细胞样品(组2)的转录组测序数据中观察到很少的单等位基因(monoallelic)表达进一步证明了这一点。类似的,我们选用直方图来评估S1-S6样品以及SW1-SW3样品的单细胞转录组测序数据中等位基因表达频率。单等位基因(monoallelic)表达模式非常清楚。然而,通过对2个细胞相同位点等位基因之间表达频率的比较发现,单等位基因式(monoallelically)表达等位基因的偏好性在细胞之间是相关联的,而不是随机的。关于等位基因特异性表达的研究出现等位基因不同偏好这一结论,可能是由于样品来源不同。单个细胞取样品(1)自同一只小鼠,而200个卵母细胞的多细胞样品(组2)则来自不同的小鼠。另外一个原因可能是由于测序的单个细胞数目较少。
总之,基于取自同一个组织的6个单细胞,我们发现单等位基因(monoallelic)表达占主导地位,且某些特定的等位基因经常表达;然而,基于取自不同组织的200个细胞样品的测序结果,发现很少有杂合子位点出现单等位基因(monoallelic)表达模式,这也反应了在这些细胞中,表达的等位基因差异很大。
5、转录组/基因组错配检测出不同类型的RNA编辑
RNA编辑在原核生物、植物、动物中很普遍,并影响转录多样性以及细胞功能。为了检测或确认RNA编辑位点(RNA editing sites,RESs),一般来说,研究者会将相同组织的基因组和转录组进行比较,并且选择将错配位点作为候选[48-53]。本发明实施例通过相同的方法,对单个细胞中的基因组和转录组进行比较(参见图3b),对比基因组序列和转录组序列时,本发明实施例采用了较严格的标准,以找到真正的RESs:要求某个位点的DNA和RNA序列均为这个细胞中的纯合子;因为纯合子DNA和杂合子RNA序列位点可能是由于基因组测序对两个等位基因的偏好导致;另外,杂合子DNA和纯合子RNA序列可能是由于单等位基因(monoallelic)表达。
在每个单细胞中,本发明实施例检测到579~3622个不同类型的RESs(参见图7a)。
其中,A-to-G和T-to-C类型的RESs占所有位点的30%-38%,然而,在先报道中,A-to-I(Inosine is decoded as Guanine in sequencing)编辑才是最常见的[48,51,52]。目前,只有一部分类型的RNA编辑被检测到,但是,也有文献报道一部分non-A-to-G RESs。鉴于本发明实施例中,转录组测序实验不是链特异性(strand-specific)的,我们采用Ensembl基因注释来寻找潜在的转录本正义链(sense-strand)。通过将RESs和蛋白编码基因以及IncRNA基因进行比对,我们发现,将近一半的RESs为基因间区域,这个目前的报道一致。2,577个包含RESs的基因均匀分布在Watson and Crick双链上(参见图7a);其中有1半的RESs位于编码区(参见图7b),只有16个RESs在起始和终止密码子区。联合在先的发现,即在哺乳动物中,A-to-G RNA编辑(而非T-to-CRNA编辑)占主导地位,具有A-to-G和T-to-CRESs的Watson链基因和Crick链基因相近的数量表明,RNA编辑是A-to-G多于T-to-C的原因之一。
通过DNA和RNA比较检测RESs会包括因SNPs和体细胞突变产生假阳性。本发明实施例采用来源于同一个单细胞的DNA和RNA测序数据,可以确保SNPs和体细胞突变不会误读为RESs,而如果测序样品为一群细胞或者只有RNA数据时就会发生这种误读。然而,鉴于单倍体卵母细胞源于双倍体细胞,由双倍体卵母细胞产生的RNA可能保留在了单倍体卵母细胞中,和肝脏细胞中的基因组序列相比,只发现5.5%~9.4%的RESs是杂合子。这些RNA序列可能是有双倍体稀薄中的同1条染色体和成的,并且与含有同源染色体的细胞核一起保留在了细胞质中。
讨论
本发明实施例对单个细胞基因组、转录组以及多个细胞样品的混合基因组和转录组均进行了分析。
本发明实施例对各单个细胞进行整合,分析同种卵母细胞基因组和转录组之间的联系。为了获得基因组gDNA和RNA,我们先将卵母细胞中的细胞核提取出来进行基因组测序,留下的去核细胞质进行转录组测序。这种方法可以有效分离基因组gDNA和RNA,而不用采用磁珠分离或电场分离的方法把RNA从RNA与DNA的混合物中分离出来。然而,我们通过成熟的扩增技术(WGA4,MDA扩增gDNA;Smart-seq2扩增RNA)在微量起始gDNA和RNA的基础上构建了相应的基因组和转录组测序文库。本发明提供的方法高效且没有偏差:基因组测序上:获得了覆盖率广(小鼠基因组34.2%的覆盖率),高测序深度(检测到720,000个变异);转录组测序上:获得了丰富的poly(A)尾转录本(超过10,000个基因)。本发明实施例采用的gDNA和RNA分离技术非常简单、实用,和微流控以及等速电泳比较起来,本发明实施例的方法对平台要求更低。只需要待测单细胞的大小足够大,以及显微注射设备。
为了精确评估等位基因的表达频率和对RESs进行定位,本发明实施例还对基因组序列信息和转录组丰度进行整合分析。
预实验
为进一步说明本发明的有益效果,本发明还提供如下预实验数据:
参照实施例1和2的步骤,本发明对单个卵母细胞进行核质分离;并对基因组和转录组进行扩增并测序。
图8是本发明实施例进行的预实验中提供的小鼠单个卵母细胞取核过程,a-c分别为M2期卵母细胞抽核前、中后的照片。
本发明采用细胞核仁分离的新方法,在保证分选纯度基础上,将原来需要90分钟以上的分离缩减到只需20分钟,同时减少了分离中对细胞的损失,提高了分离效率,并且采用了“冰冻”细胞的效果,可以保留细胞在分离前的原始状态,从而最大得呈现真实的核仁状态。
用Quartz-Seq方法对单个卵母细胞取核和不取核细胞的转录组扩增,和卵母细胞细胞核和神经细胞细胞核的全基因组扩增。图9为本发明实施例进行的预实验中,单个卵母细胞基因组和转录组扩增结果。其中,Quartz-Seq组:C8:去核M2期卵母细胞;E14:M2期卵母细胞;NC:阴性对照;WGA4组:N2:M2期卵母细胞细胞核;3-5:单个神经细胞细胞核;NC:阴性对照
结果显示:Quartz-Seq扩增的转录组片段分布与预期结果接近(其中C8是去核以后的卵母细胞,E14是未去核的卵母细胞,阴性结果中几乎没有条带,只有反应中加入的引物)。基因组扩增中,我们用单个神经元细胞核(3-5)作为阳性对照,改样品已经经高通量测序验证了扩增效率,从卵母细胞中取出的细胞核(N2)的条带分布与阳性对照差不多
图10为本发明实施例进行的预实验中,采用三种单细胞扩增方法扩增小鼠单个神经元细胞基因组以及和多细胞测序结果。其中Bulky为多细胞测序结果。我们用WGA4方法扩增的全基因组数据质量和多细胞结果相当(以1号染色体为例)。对单个神经元基因组二代测序数据表明,我们对单个细胞的基因组测序是成功的。
附注:
本发明有引用的文献或可以作为本发明背景技术的文献如下:
Bioinformatics analysis.
FASTQ files from exome-seq and mRNA-seq were aligned to the mousegenome(mm10)with Bowtie and Tophat respectively[72,73].
Variants were called by VarScan,on both exome-seq and mRNA-seq data[38].
By default setting of VarScan,at least 8reads should cover a base tocall a variant,and the minimum variant allele frequency is 0.01.
Variants with allele frequency less than 75%were calledheterozygous,otherwise assigned to homozygous variants.
When exome-seq and mRNA-seq data were compared to detect RESs,eachposition is at least covered by 8reads.Gene expression level was measured inFPKM value,calculated by Cufflinks[74].
Ensembl gene annotation(mm10)was downloaded and only protein-codingand lincRNA genes were selected[75].
References
1.Koboldt,Daniel C.,et al.,The Next-Generation Sequencing Revolutionand Its Impact on Genomics.Cell,2013.155(1):p.27-38.
2.Mutz,K.-O.,et al.,Transcriptome analysis using next-generationsequencing.Current Opinion in Biotechnology,2013.24(1):p.22-30.
3.Biesecker,L.G.and N.B.Spinner,A genomic view of mosaicism and humandisease.Nat Rev Genet,2013.14(5):p.307-320.
4.Poduri,A.,et al.,Somatic Mutation,Genomic Variation,andNeurological Disease.Science,2013.341(6141):p.1237758.
5.Baslan,T.,et al.,Genome-wide copy number analysis of singlecells.Nat.Protocols,2012.7(6):p.1024-1041.
6.Macaulay,I.C.and T.Voet,Single Cell Genomics:Advances and FuturePerspectives.PLoS Genet,2014.10(1):p.e1004126.
7.Lu,S.,et al.,Probing Meiotic Recombination and Aneuploidy of SingleSperm Cells by Whole-Genome Sequencing.Science,2012.338(6114):p.1627-1630.
8.Huang,S.,Non-genetic heterogeneity of cells in development:morethan just noise.Development,2009.136(23):p.3853-3862.
9.Tang,F.,K.Lao,and M.A.Surani,Development and applications ofsingle-cell transcriptome analysis.Nat Methods,2011.8(4 Suppl):p.S6-11.
10.Marinov,G.K.,et al.,From single-cell to cell-pool transcriptomes:Stochasticity in gene expression and RNA splicing.Genome Research,2014.24(3):p.496-510.
11.Pan,X.,et al.,Two methods for full-length RNA sequencing for lowquantities of cells and single cells.Proceedings of the National Academy ofSciences,2013.110(2):p.594-599.
12.Tang,F.,et al.,mRNA-Seq whole-transcriptome analysis of a singlecell.Nat Meth,2009.6(5):p.377-382.
13.Tang,F.,et al.,Tracing the Derivation of Embryonic Stem Cells fromthe Inner Cell Mass by Single-Cell RNA-Seq Analysis.Cell Stem Cell,2010.6(5):p.468-478.
14.Islam,S.,et al.,Characterization of the single-celltranscriptional landscape by highly multiplex RNA-seq.Genome Research,2011.21(7):p.1160-1167.
15.Zong,C.,et al.,Genome-Wide Detection of Single-Nucleotide andCopy-Number Variations of a Single Human Cell.Science,2012.338(6114):p.1622-1626.
16.Picelli,S.,et al.,Smart-seq2 for sensitive full-lengthtranscriptome profiling in single cells.Nat Meth,2013.10(11):p.1096-1098.
17.Hou,Y.,et al.,Genome analyses of single human oocytes.Cell,2013.155(7):p.1492-506.
18.Deng,Q.,et al.,Single-Cell RNA-Seq Reveals Dynamic,RandomMonoallelic Gene Expression in Mammalian Cells.Science,2014.343(6167):p.193-196.
19.Pollen,A.A.,et al.,Low-coverage single-cell mRNA sequencingreveals cellular heterogeneity and activated signaling pathways in developingcerebral cortex.Nat Biotech,2014.32(10):p.1053-1058.
20.Wang,Y.,et al.,Clonal evolution in breast cancer revealed bysingle nucleus genome sequencing.Nature,2014.512(7513):p.155-60.
21.Sasagawa,Y.,et al.,Quartz-Seq:a highly reproducible and sensitivesingle-cell RNA sequencing method,reveals non-genetic gene-expressionheterogeneity.Genome Biology,2013.14(4):p.R31.
22.Livesey,F.J.,Strategies for microarray analysis of limitingamounts of RNA.Briefings in Functional Genomics&Proteomics,2003.2(1):p.31-36.
23.Kumar,G.,et al.,Improved multiple displacement amplification withphi29 DNA polymerase for genotyping of single human cells.Biotechniques,2008.44(7):p.879-90.
24.Wang,J.,et al.,Genome-wide Single-Cell Analysis of RecombinationActivity and De Novo Mutation Rates in Human Sperm.Cell,2012.150(2):p.402-412.
25.Ramskold,D.,et al.,Full-length mRNA-Seq from single-cell levels ofRNA and individual circulating tumor cells.Nat Biotech,2012.30(8):p.777-782.
26.Shalek,A.K.,et al.,Single-cell transcriptomics reveals bimodalityin expression and splicing in immune cells.Nature,2013.498(7453):p.236-240.
27.Hashimshony,T.,et al.,CEL-Seq:Single-Cell RNA-Seq by MultiplexedLinear Amplification.Cell Reports,2012.2(3):p.666-673.
28.Grindberg,R.V.,et al.,RNA-sequencing from singlenuclei.Proceedings of the National Academy of Sciences,2013.110(49):p.19802-19807.
29.Klein,C.A.,et al.,Combined transcriptome and genome analysis ofsingle micrometastatic cells.Nat Biotech,2002.20(4):p.387-92.
30.Han,L.,et al.,Co-detection and sequencing of genes and transcriptsfrom the same single cells facilitated by a microfluidics platform.Sci.Rep.,2014.4:p.6485.
31.Shintaku,H.,et al.,On-Chip Separation and Analysis of RNA and DNAfrom Single Cells.Analytical Chemistry,2014.86(4):p.1953-1957.
32.Zhao,Q.,et al.,Systematic detection of putative tumor suppressorgenes through the combined use of exome and transcriptome sequencing.GenomeBiology,2010.11(11):p.R114.
33.Nica,A.C.and E.T.Dermitzakis,Expression quantitative trait loci:present and future.Philosophical Transactions of the Royal Society B:Biological Sciences,2013.368(1620).
34.Doss,S.,et al.,Cis-acting expression quantitative trait loci inmice.Genome Research,2005.15(5):p.681-691.
35.Lappalainen,T.,et al.,Transcriptome and genome sequencing uncoversfunctional variation in humans.Nature,2013.501(7468):p.506-511.
36.Keane,T.M.,et al.,Mouse genomic variation and its effect onphenotypes and gene regulation.Nature,2011.477(7364):p.289-294.
37.The Cancer Genome Atlas Research,N.,Comprehensive molecularcharacterization of urothelial bladder carcinoma.Nature,2014.507(7492):p.315-322.
38.Koboldt,D.C.,et al.,VarScan:variant detection in massivelyparallel sequencing of individual and pooled samples.Bioinformatics,2009.25(17):p.2283-2285.
39.Tang,F.,et al.,RNA-Seq analysis to capture the transcriptomelandscape of a single cell.Nat Protoc,2010.5(3):p.516-535.
40.Raj,A.and A.van Oudenaarden,Nature,nurture,or chance:stochasticgene expression and its consequences.Cell,2008.135(2):p.216-26.
41.Fatica,A.and I.Bozzoni,Long non-coding RNAs:new players in celldifferentiation and development.Nat Rev Genet,2014.15(1):p.7-21.
42.Dennis,G.,Jr.,et al.,DAVID:Database for Annotation,Visualization,and Integrated Discovery.Genome Biol,2003.4(5):p.P3.
43.Pastinen,T.,Genome-wide allele-specific analysis:insights intoregulatory variation.Nat Rev Genet,2010.11(8):p.533-8.
44.Gimelbrant,A.,et al.,Widespread monoallelic expression on humanautosomes.Science,2007.318(5853):p.1136-40.
45.Mayba,O.,et al.,MBASED:allele-specific expression detection incancer tissues and cell lines.Genome Biology,2014.15(8):p.405.
46.Swierczek,S.I.,et al.,Methylation of AR locus does not alwaysreflect X chromosome inactivation state.Vol.119.2012.e100-e109.
47.Zwemer,L.M.,et al.,Autosomal monoallelic expression in themouse.Genome Biol,2012.13(2):p.R10.
48.Blow,M.,et al.,A survey of RNA editing in human brain.GenomeResearch,2004.14(12):p.2379-2387.
49.Danecek,P.,et al.,High levels of RNA-editing site conservationamongst 15 laboratory mouse strains.Genome Biology,2012.13(4):p.r26.
50.Eisenberg,E.,et al.,Identification of RNA editing sites in the SNPdatabase.Nucleic Acids Research,2005.33(14):p.4612-4617.
51.Bazak,L.,et al.,A-to-I RNA editing occurs at over a hundredmillion genomic sites,located in a majority of human genes.Genome Research,2014.24(3):p.365-376.
52.Lee,J.-H.,J.K.Ang,and X.Xiao,Analysis and design of RNA sequencingexperiments for identifying RNA editing and other single-nucleotidevariants.RNA,2013.19(6):p.725-732.
53.Wulff,B.-E.,M.Sakurai,and K.Nishikura,Elucidating the inosinome:global approaches to adenosine-to-inosine RNA editing.Nat Rev Genet,2011.12(2):p.81-85.
54.van Leeuwen,F.W.,et al.,Frameshift mutants of beta amyloidprecursor protein and ubiquitin-B in Alzheimer's and Down patients.Science,1998.279(5348):p.242-7.
55.Sharma,P.M.,et al.,RNA editing in the Wilms'tumor susceptibilitygene,WT1.Genes Dev,1994.8(6):p.720-31.
56.Novo,F.J.,et al.,Editing of human alpha-galactosidase RNAresulting in a pyrimidine to purine conversion.Nucleic Acids Res,1995.23(14):p.2636-40.
57.Nutt,S.L.,et al.,Molecular characterization of the human EAA5(GluR7)receptor:a high-affinity kainate receptor with novel potential RNAediting sites.Receptors Channels,1994.2(4):p.315-26.
58.Blanc,V.and N.O.Davidson,C-to-U RNA editing:mechanisms leading togenetic diversity.J Biol Chem,2003.278(3):p.1395-8.
59.Xu,X.,et al.,Single-Cell Exome Sequencing Reveals Single-Nucleotide Mutation Characteristics of a Kidney Tumor.Cell,2012.148(5):p.886-895.
60.Kristensen,V.N.,et al.,Principles and methods of integrativegenomic analyses in cancer.Nat Rev Cancer,2014.14(5):p.299-313.
61.Griffin,J.,et al.,Comparative analysis of follicle morphology andoocyte diameter in four mammalian species (mouse,hamster,pig,and human).J ExpClin Assist Reprod,2006.3:p.2.
62.Hirao,Y.and T.Miyano,In Vitro Growth of Mouse Oocytes:Oocyte Sizeat the Beginning of Culture Influences the Appropriate Length of CulturePeriod.Journal of Mammalian Ova Research,2008.25(1):p.56-62.
63.Zhang,Z.-P.,et al.,Growth of Mouse Oocytes to Maturity fromPremeiotic Germ Cells<italic>In Vitro</italic>.PLoS ONE,2012.7(7):p.e41771.
64.cell size.
65.King,R.,Gene delivery to mammalian cells by microinjection.MethodsMol Biol,2004.245:p.167-74.
66.Stein,P.and K.Schindler,Mouse Oocyte Microinjection,Maturation andPloidy Assessment.2011(53):p.e2851.
67.Stein,P.and P.Svoboda,Microinjection of dsRNA into Mouse Oocytesand Early Embryos.Cold Spring Harbor Protocols,2006.2006(3):p.pdb.prot4511.
68.Lu,V.B.,et al.,Intranuclear Microinjection of DNA into DissociatedAdult Mammalian Neurons.2009(34):p.e1614.
69.Lappe-Siefke,C.,C.Maas,and M.Kneussel,Microinjection into culturedhippocampal neurons:A straightforward approach for controlled cellulardelivery of nucleic acids,peptides and antibodies.Journal of NeuroscienceMethods,2008.175(1):p.88-95.
70.Bar-Sagi,D.and J.R.Feramisco,Microinjection of the ras oncogeneprotein into PC12 cells induces morphological differentiation.Cell.42(3):p.841-848.
71.Abarzua,P.,et al.,Microinjection of monoclonal antibody PAb421intohuman SW480colorectal carcinoma cells restores the transcription activationfunction to mutant p53.Cancer Res,1995.55(16):p.3490-4.
72.Langmead,B.,et al.,Ultrafast and memory-efficient alignment ofshort DNA sequences to the human genome.Genome Biol,2009.10(3):p.R25.
73.Trapnell,C.,L.Pachter,and S.L.Salzberg,TopHat:discovering splicejunctions with RNA-Seq.Bioinformatics,2009.25(9):p.1105-11.
74.Trapnell,C.,et al.,Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during celldifferentiation.Nat Biotechnol,2010.28(5):p.511-5.
75.Hubbard,T.,et al.,The Ensembl genome database project.NucleicAcids Research,2002.30(1):p.38-41.
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种同时构建单细胞基因组和转录组高通量测序文库的方法,其特征在于,包括如下步骤:
a)获取单细胞;
b)分离细胞核和细胞质;采用显微注射法对单个细胞进行核质分离;所述显微注射法中,微细管针的直径在0.5-5微米,抓针的直径在10-50微米;
c)单个细胞核全基因组扩增,获得基因组测序文库;
d)单个细胞去核细胞质全转录组扩增,获得转录组测序文库。
2.一种同时对单细胞基因组和转录组进行高通量测序的方法,其特征在于,包括如下步骤:对如权利要求1所得的基因组测序文库和转录组测序文库进行高通量测序,分别获得所述单细胞的基因组序列信息和转录组序列信息。
3.一种基于单细胞整合基因组学的测序方法,其特征在于,包括如下步骤:对如权利要求2所得的单细胞的基因组序列信息和转录组序列信息进行生物信息学分析。
4.一种基于单细胞整合基因组学的方法鉴定细胞亚克隆的方法,其特征在于,包括如下步骤:根据多个如权利要求3所得的生物信息学分析序列信息,鉴定细胞亚克隆。
5.如权利要求3所述的基于单细胞整合基因组学的测序方法在等位基因检测中的应用。
6.如权利要求3所述的基于单细胞整合基因组学的测序方法在基因表达检测中的应用。
7.如权利要求6所述的应用,其特征在于,所述基因为单等位基因。
8.如权利要求3所述的基于单细胞整合基因组学的测序方法在RNA编辑位点检测中的应用。
9.如权利要求1所述的同时构建单细胞基因组和转录组高通量测序文库的方法、或权利要求3所述的基于单细胞整合基因组学的测序方法在二代、下一代或单分子高通量测序中的应用。
CN201510509535.6A 2015-08-19 2015-08-19 同时对单细胞基因组和转录组构库及测序的方法基于单细胞整合基因组学的测序方法及应用 Expired - Fee Related CN105297142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510509535.6A CN105297142B (zh) 2015-08-19 2015-08-19 同时对单细胞基因组和转录组构库及测序的方法基于单细胞整合基因组学的测序方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510509535.6A CN105297142B (zh) 2015-08-19 2015-08-19 同时对单细胞基因组和转录组构库及测序的方法基于单细胞整合基因组学的测序方法及应用

Publications (2)

Publication Number Publication Date
CN105297142A CN105297142A (zh) 2016-02-03
CN105297142B true CN105297142B (zh) 2018-12-07

Family

ID=55194931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510509535.6A Expired - Fee Related CN105297142B (zh) 2015-08-19 2015-08-19 同时对单细胞基因组和转录组构库及测序的方法基于单细胞整合基因组学的测序方法及应用

Country Status (1)

Country Link
CN (1) CN105297142B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105950760A (zh) * 2016-06-21 2016-09-21 南开大学 同时检测单细胞mRNA表达水平和端粒长度的方法
EP3831958B1 (en) 2016-06-30 2023-09-06 Grail, LLC Differential tagging of rna for preparation of a cell-free dna/rna sequencing library
CN106636435A (zh) * 2017-02-07 2017-05-10 浙江大学 利用hrm和焦磷酸测序在单细胞中进行遗传检测的方法
CN107557874A (zh) * 2017-09-22 2018-01-09 上海美吉医学检验有限公司 适用于单细胞全基因组甲基化与转录组共测序的文库建立方法及其应用
CN109811045B (zh) * 2017-11-22 2022-05-31 深圳华大智造科技股份有限公司 高通量的单细胞全长转录组测序文库的构建方法及其应用
WO2020124391A1 (zh) * 2018-12-18 2020-06-25 深圳先进技术研究院 骨密度性状遗传力分析方法及装置
CN109891508B (zh) * 2019-01-29 2023-05-23 北京大学 单细胞类型检测方法、装置、设备和存储介质
CN110060729B (zh) * 2019-03-28 2020-02-28 广州序科码生物技术有限责任公司 一种基于单细胞转录组聚类结果注释细胞身份的方法
CN110577983A (zh) * 2019-09-29 2019-12-17 中国科学院苏州生物医学工程技术研究所 高通量单细胞转录组与基因突变整合分析方法
WO2021148283A1 (en) * 2020-01-20 2021-07-29 Koninklijke Philips N.V. Guided analysis of single cell sequencing data using bulk sequencing data
CN111454942A (zh) * 2020-03-16 2020-07-28 张晓鲁 一种同一样品的转录组和基因组同时建立测序文库的构建方法
CN113151425B (zh) * 2021-04-08 2023-01-06 中国计量科学研究院 基于关键指标提高准确性的单细胞测序方法
CN115747320B (zh) * 2022-08-03 2024-02-02 伯科生物科技有限公司 Rna靶向测序基因芯片的质控方法及应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9952126B2 (en) * 2012-02-29 2018-04-24 Fluidigm Corporation Methods for multiple single-cell capturing and processing using micro fluidics
WO2014108850A2 (en) * 2013-01-09 2014-07-17 Yeda Research And Development Co. Ltd. High throughput transcriptome analysis
CN104032377A (zh) * 2014-06-30 2014-09-10 北京诺禾致源生物信息科技有限公司 单细胞转录组测序文库的构建方法及其应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Current challenges in the bioinformatics of single cell genomics";Luwen Ning等;《Frontiers in oncology》;20140127;第4卷;摘要,前言,第3页sectionⅡ部分,第4页第一栏第1-3段 *
"Deep sequencing of subcellular RNA fractions shows splicing to be predominantly co-transcriptional in the human genomes but inefficient for IncRNAs";Hagen Tilgner等;《Genome research》;20121231;第22卷;摘要,图1以及补充材料的方法部分 *
"G&T-seq:parallel sequencing of single-cell genomes and transcriptomes";Iain C Macaulay等;《Nature methods》;20150427;第12卷(第6期);第519页第1栏最后1段至第2栏第3段,第520页第1栏第2段,图1 *
"Quantitative assessment of single-cell whole genome amplification methods for detecting copy number variation using hippocampal neurons";Luwen Ning等;《Scientific reports》;20150619;第5卷;第2-3页实验设计部分,第3-8页结果部分,图1 *

Also Published As

Publication number Publication date
CN105297142A (zh) 2016-02-03

Similar Documents

Publication Publication Date Title
CN105297142B (zh) 同时对单细胞基因组和转录组构库及测序的方法基于单细胞整合基因组学的测序方法及应用
Green et al. A comprehensive roadmap of murine spermatogenesis defined by single-cell RNA-seq
Gundry et al. Direct mutation analysis by high-throughput sequencing: from germline to low-abundant, somatic variants
Denker et al. The second decade of 3C technologies: detailed insights into nuclear organization
Gallaher et al. Chlamydomonas genome resource for laboratory strains reveals a mosaic of sequence variation, identifies true strain histories, and enables strain-specific studies
CN103890189B (zh) 一种超级芯片及其制备方法和应用
Mo et al. Advances and applications of single‐cell omics technologies in plant research
Whalen et al. Enhancer function and evolutionary roles of human accelerated regions
Huang et al. Three amphioxus reference genomes reveal gene and chromosome evolution of chordates
Qiao et al. Genome-wide target enrichment-aided chip design: a 66 K SNP chip for cashmere goat
Cheng et al. Genome plasticity in Paramecium bursaria revealed by population genomics
Zhang et al. Genome-wide analysis and functional annotation of chromatin-enriched noncoding RNAs in rice during somatic cell regeneration
Wang et al. Integrated sequencing of exome and mRNA of large-sized single cells
Chen et al. Widespread Increase in Enhancer—Promoter Interactions during Developmental Enhancer Activation in Mammals
Lyu et al. TEAseq-based identification of 35,696 Dissociation insertional mutations facilitates functional genomic studies in maize
Long et al. Independent Evolution of Sex Chromosomes and Male Pregnancy–Related Genes in Two Seahorse Species
Ren et al. Developmental stage related patterns of codon usage and genomic GC content: searching for evolutionary fingerprints with models of stem cell differentiation
Voet et al. Mutational processes shaping the genome in early human embryos
Luo et al. DNA methylome of primary spermatocyte reveals epigenetic dysregulation associated with male sterility of cattleyak
Marti-Marimon et al. Major reorganization of chromosome conformation during muscle development in pig
CN115472223A (zh) 甲基化测序数据分析方法
Gu et al. Exploring crucial molecular events in pearl oyster after pre-grafting conditioning by genome-wide bisulfite sequencing for DNA methylation analysis
CN112359102A (zh) 一种基于基因组学构建烟草核心种质的方法及其应用
Yoo et al. An optimized method for the construction of a DNA methylome from small quantities of tissue or purified DNA from arabidopsis embryo
Guerreiro et al. H3K27me3 dictates atypical genome-nuclear lamina interactions and allelic asymmetry during early embryogenesis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181207

Termination date: 20200819