发明内容
本发明提供一种外泌体miRNA的定量检测方法以克服现有技术的不足。
本发明提供的一种外泌体miRNA的定量检测方法,包括以下步骤:
(1)外泌体总RNA的提取;
(2)3’端和5’端特异性唯一标签接头连接;
(3)反转录合成cDNA并进行PCR扩增;
(4)miRNA文库的筛选纯化与上机测序;
(5)纠错算法的信息分析。
本发明的外泌体来自人外周血或体液,进行外泌体分离后,采用RNA提取试剂盒进行外泌体总RNA的提取。
本发明的外泌体miRNA的定量检测方法中,步骤(2)所述的特异性唯一标签接头连接是指在常规miRNA接头的基础上添加了8个随机的碱基N以及3个固定碱基CGA。接头合成时随机碱基,由AUCG随机合成,因此可以提供48种标签,即理论上每个原始miRNA片段将被一组唯一的标签唯一标签识别,从而后续经过一系列PCR扩增后,不仅可以基于同一个DNA模板的所有测序序列(duplication,DUP)簇矫正测序错误实现变异的精确检测,同时基于每个标记的片段,将不再受PCR扩增的偏好性影响,实现精准定量。
本发明方法的步骤(2)在RNA的3’端连接特异性唯一标签接头的序列为:CGANNNNNNNNAGAUCGGAAGAGACACGUCUGAACUCCAGUCAC;在5’端连接特异性唯一标签接头的序列为:UACACUCUUUCCCUACACGACNNNNNNNNCGA。
进一步地,在步骤(2)特异性唯一标签接头连接完成后,可以利用RNA浓缩液去除溶液中的连接缓冲液、多余的盐离子及其他杂质,得到与5’端和3’端连接唯一标签接头的RNA。
本发明方法中,步骤(3)是将5’端和3’端连接唯一标签接头的RNA反转录合成cDNA,然后以cDNA为模板,加入测序引物进行PCR;反转录引物序列为GTGACTGGAGTTCAGACGTGT。
进一步地,PCR所用的测序引物序列为:
上游引物:AATGATACGGCGACCACCGAGATCTACACTCTTTCCC
TACACGACGCTCTTCCGATCT;
下游引物:CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACT
GGAGTTCAGACGTGTGCTCTTCCGATCT;
其中xxxxxxxx为index标签。
本发明的外泌体miRNA定量检测方法中,步骤(4)miRNA文库的筛选的方法是将步骤(3)中的PCR产物中片段大小为150-170bp的cDNA片段回收,即得到主要成分为miRNA的文库。
在本发明的实施例中,是选用Illumina HiSeq2500/2000上机测序,PE101+8+101。
本发明上述方法中,步骤(5)纠错算法的信息分析包括以下步骤:
1)基于固定碱基CGA确定唯一标签位置,将成对测序序列的测序序列一和测序序列二的唯一标签碱基序列首尾相连,形成16bp的一条索引,并且以这16bp作为成对测序序列的索引进行外部排序,以达到将同一个DNA模板的所有测序序列聚集到一起的目的;
2)对聚集起来的拥有相同索引的测序序列进行中心聚类,根据插入序列之间的汉明距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的汉明距离不超过3,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的;
3)对于每个DNA模板的dup簇中的测序序列的每一个测序碱基进行互相比对,若某种碱基型在测序序列中的一致率达到80%,则记新测序序列的这个碱基为此碱基型,否则记为N,得到代表原始DNA模板序列的新测序序列;
4)基于新测序序列进行数据过滤,去除接头序列以及比对质量小于30的测序序列;
5)根据4)中得到的测序序列进行数据库比对确定已知RNA以及进行未知RNA的软件预测,同时也进行相应的注释与统计定量;
6)根据5)的结果进行表达谱差异、靶基因预测、Passway以及Biomarker其他相关分析。
本发明还提供了一种miRNA定量检测系统,包括以下操作单元:
(1)总RNA的提取单元;
(2)3’端和5’端特异性唯一标签接头连接单元;
(3)反转录合成cDNA并进行PCR扩增单元;
(4)miRNA文库的筛选纯化与上机测序单元;
(5)纠错算法的信息分析单元。
操作单元(1)中的总RNA为外泌体总RNA。
所述单元(2)在RNA的3’端连接特异性唯一标签接头的序列为:CGANNNNNNNNAGAUCGGAAGAGACACGUCUGAACUCCAGUCAC;在5’端连接特异性唯一标签接头的序列为:UACACUCUUUCCCUACACGACNNNNNNNNCGA。
单元(3)中是将5’端和3’端连接唯一标签接头的RNA反转录合成cDNA,然后以cDNA为模板,加入测序引物进行PCR;反转录引物序列为GTGACTGGAGTTCAGACGTGT;PCR所用的测序引物序列为:
上游引物:AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT;
下游引物:CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT;
其中xxxxxxxx为index标签。
单元(4)miRNA文库的筛选的方法是将单元(3)中的PCR产物中片段大小为160bp的cDNA片段回收,即得到主要成分为miRNA的文库。
本发明的miRNA定量检测系统中,操作单元(5)纠错算法的信息分析包括以下步骤:
1)基于固定碱基CGA确定唯一标签位置,将成对测序序列的测序序列一和测序序列二的唯一标签碱基序列首尾相连,形成16bp的一条索引,并且以这16bp作为成对测序序列的索引进行外部排序,以达到将同一个DNA模板的所有测序序列聚集到一起的目的;
2)对聚集起来的拥有相同索引的测序序列进行中心聚类,根据插入序列之间的汉明距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的汉明距离不超过3,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的;
3)对于每个DNA模板的dup簇(即同一个DNA模板的所有测序序列)中的测序序列的每一个测序碱基进行互相比对,若某种碱基型在测序序列中的一致率达到80%,则记新测序序列的这个碱基为此碱基型,否则记为N,得到代表原始DNA模板序列的新测序序列;
4)基于新测序序列进行数据过滤,去除接头序列以及比对质量小于30的测序序列;
5)根据4)中得到的测序序列进行数据库比对确定已知RNA以及进行未知RNA的软件预测,同时也进行相应的注释与统计定量;
6)根据5)的结果进行表达谱差异、靶基因预测、Passway以及Biomarker其他相关分析。
上述步骤2)所述的汉明距离值不超过3是本发明信息分析的一个关键点,因为miRNA平均大小只有20-30bp,为了尽可能多得区分不同miRNA亚型(亚型间的差异往往只是几个碱基的区别),需要尽量压缩汉明距离的容忍度,以得到更加全面的miRNA类型。由此本发明根据成簇的唯一标签类型,确认不同的miRNA亚型,基于每个唯一标签对原始模板的标记,统计每个亚型的个数。
本发明提供了上述定量检测系统在小RNA定量检测中的应用。
本发明提供了上述外泌体miRNA定量检测方法或miRNA定量检测系统在制备疾病早期筛查试剂盒中的应用。
优选地,上述制备试剂盒应用中所述的疾病为肿瘤、神经退行性疾病、心血管系统疾病、生殖系统疾病。
本发明继承并发展了高通量miRNA-seq技术,提出了一种全新的高精度的exosomes miRNA定量检测方法。本发明在RNA的3’端和5’端连接特异性的唯一标签(uniqueidentifier,UID)接头,对每个原始模板进行区分,不仅避免了扩增时分子间存在的偏好性,而且有效实现单个模板的精确计数,可以精确检测低于10个拷贝以下的miRNA分子,从而可以更全面精准的检测所有miRNA的真实表达量以及表达谱。本发明通过唯一标签形成的Dup簇,基于纠错算法的信息分析可以有效矫正相关测序错误,获得更准确的分子序列,有利于相关未知RNA,miRNA家族以及Biomaker的发现。
本发明的外泌体miRNA定量检测方法及其定量检测系统基于其高灵敏,高特异性的检测特点,结合肿瘤源性的exosomes内的miRNA,可以结合微创(抽血)或无创(使用尿液或唾液等)的检测手段为多种相关肿瘤(肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌以及肝癌等)进行早期筛查提供检测手段;另外还可拓展应用到相关神经退行性疾病、心血管疾病,生育健康等检测领域以及其他相关small RNA(piRNA,snoRNA,siRNA等)的精准定量检测以及应用领域。
实施例1外泌体miRNA定量检测方法的建立
1、外泌体(exosomes)total RNA的提取:
1.1抽取受检者外周血2管(5mL/管)于EDTA抗凝管中,轻柔上下颠倒(防止细胞破裂),6-8次充分混匀,在采血当天4-6小时内进行以下处理;在4℃条件下1600g离心10分钟,离心后将上清(血浆)分装到多个1.5mL/2mL离心管中,在吸取过程中不能吸到中间层白细胞;在4℃条件下16000g离心10分钟,去除残余细胞,将上清(血浆)转移到新的1.5mL/2mL离心管中,不能吸到管底白细胞,即得到分离后所需血浆;
1.2血浆样本处理完后,分离得到的全部血浆(约5ml左右)按照exoRNeasy Serum/Plasma Maxi Kit(Qiagen)提取试剂说明书,进行exosomes内的total RNA的提取,回溶14μL RNase-free water,之后基于Qubit2.0(Invitrogen,Qubit RNA HS Assay Kits)进行初步定量。
2、3’端和5’端特异性唯一标签接头连接
2.1 3’端特异性唯一标签接头连接:
将溶液混匀,置于PCR仪上,37℃连接2h。
上述3’端唯一标签接头的序列为:CGANNNNNNNNAGAUCGGAAGAGACACGUCUGAACUCCAGUCAC(SEQ ID NO.1)。
2.2 5’端特异性唯一标签接头连接:
将溶液混匀,置于PCR仪上,20℃孵育过夜。
上述5’端唯一标签接头的序列为:UACACUCUUUCCCUACACGACNNNNNNNNCGA(SEQ IDNO.2)。
之后往反应体系中加入75μL无水乙醇,-20℃放置10分钟,16000g离心10分钟,去上清后冷冻干燥后,加入15μL Rnase Free H2O回溶,去除溶液中的连接缓冲液、多余的盐离子等。
3、反转录合成cDNA并进行PCR扩增
3.1反转录合成cDNA的方法为:
将溶液混匀,置于PCR仪上,42℃孵育1h逆转录合成cDNA。之后向反转录产物中加入4μL RNase H混合均匀,37℃孵育30min,以充分消化剩余的RNA。上述反转录体系中所使用的反转录引物序列为:GTGACTGGAGTTCAGACGTGT(SEQ ID NO.3)。
3.2PCR扩增PCR反应体系为
上述引物Barcode Universal Primer和Barcode Primer 1的序列分别为:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT;
CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT;其中xxxxxxxx为index标签。
PCR反应条件为:
4、miRNA文库的筛选纯化与上机测序
4.1PCR产物在100V 15%TBE-PAGE胶,进行凝胶电泳分析。
4.2切取预期大小分子(150-170bp),按照QIAquick Gel Extraction Kit(Qiagen)试剂说明书进行产量回收,得到高通量测序miRNA seq文库。
4.3上机测序:采用Illumina HiSeq2500 PE101+8+101程序进行上机测序,测序实验按照制造商提供的操作说明书(参见Illumina/Solexa官方公布cBot)进行上机测序操作。
5、纠错算法的信息分析:
5.1基于固定碱基CGA确定唯一标签位置,将成对测序序列的测序序列1和测序序列2的唯一标签碱基序列首尾相连,形成16bp的一条索引,并且以这16bp作为成对测序序列的索引进行外部排序,以达到将同一个DNA模板的所有测序序列聚集到一起的目的。
5.2对聚集起来的拥有相同索引的测序序列进行中心聚类,根据插入序列之间的汉明距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的汉明距离不超过3,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的.
5.3对于每个DNA模板的dup簇中的测序序列的每一个测序碱基进行互相比对,若某种碱基型在测序序列中的一致率达到80%,则记新测序序列的这个碱基为此碱基型,否则记为N,这样便得到了代表原始DNA模板序列的新测序序列;
5.4基于新测序序列进行数据过滤,去除接头序列以及比对质量小于30的测序序列。
5.5根据5.4中得到的测序序列进行数据库比对(Sanger miRBase;ncRNADatabase;piRNA Database;siRNA Database等)确定已知RNA以及进行未知RNA的软件预测,同时也进行相应的注释与统计定量.
5.6基于5.5的结果进行其他相关分析,如表达谱差异、靶基因预测、Passway以及Biomarker等。
6、测序结果分析
采用本发明的上述步骤5中的唯一标签-纠错信息分析与常规信息分析统计结果进行对比,见表1。其中不同种类的RNA分子所占比例统计结果,如表2、表3所示。
表1唯一标签-纠错信息分析与常规信息分析统计结果对比
注:总测序测序序列:总的原始下机测序量;有效比对测序序列数:有效高可信比对测序序列,常规分析对于低copy簇进行过滤处理。
在已知miRNA以及未知miRNA统计中,本发明的唯一标签-纠错信息分析比常规信息分析分别多检出89种和76种。而且6个不同丰度的已知miRNA与QPCR定量的比较显示:高丰度时,常规纠错方法与唯一标签-纠错均与QPCR定量结果一致性好,低丰度时,只有唯一标签-纠错信息分析继续与QPCR结果显示较好的一致性。
表2两种信息分析方法的结果比较
表3两种信息分析方法分析不同种类RNA分子所占比例的统计结果
类型 |
唯一标签-纠错信息分析统计 |
常规信息分析统计 |
miRNA |
73.00% |
61.00% |
piRNA |
2% |
3% |
scaRNA |
1.00% |
2.20% |
ncRNA |
5.50% |
7.20% |
tRNA |
3.20% |
5.60% |
mRNA |
4.00% |
6.30% |
未知 |
11.30% |
14.60% |
以上的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通工程技术人员对本发明的技术方案做出的各种变型和改进,均应落入本发明的权利要求书确定的保护范围内。