构建测序文库的方法及设备
技术领域
本发明涉及生物技术领域,具体地,涉及构建测序文库的方法及设备,以及测序的方法及系统。
背景技术
随着高通量测序技术的应用和发展,第二代测序平台日趋成熟、稳定,存在的主要问题是文库制备步骤繁琐、成本居高不下,所以第二代基因测序还无法满足市场的要求,走入千家万户。解决这个问题的关键在于减少起始样本的投入量和简化文库制备步骤。
传统从总RNA中构建cDNA文库需要依赖oligo(dT),从而将信息RNA捕获出来。这些信息再通过反转录合成一链和二链,加上接头,再经过PCR扩增形成适用于高通量测序的cDNA文库。目前存在的方法有一个局限在于开始投入的RNA产量需要达到数百ng到μg之间,以满足在多种酶反应过程中和在PCR扩增前一系列纯化回收步骤导致的丢失。
因而,目前关于从总RNA中构建cDNA文库的相关研究仍有待深入。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种从非常低的RNA投入量构建cDNA文库适用于高通量测序的构建测序文库的方法。
在本发明的第一方面,本发明提供了一种构建测序文库的方法。根据本发明的实施例,该方法包括:(1)将mRNA打断,以便获得片段化mRNA;(2)将所述片段化mRNA去磷酸化,以便获得去磷酸化mRNA;(3)将所述去磷酸化mRNA连接3’端接头,以便获得连接产物;(4)将所述连接产物进行反转录,以便获得cDNA;(5)从所述cDNA分离单链DNA;以及(6)将所述单链DNA进行环化,以便获得环状DNA,所述环状DNA构成所述测序文库。发明人发现,利用本发明的该方法,能够快速有效的构建测序文库,且该方法能够有效减少样品提取的数量和切胶和胶纯化回收步骤,可以利用非常微量的RNA用于构建文库,RNA的起始量只需要pg级别就能满足要求;在单管中利用连续反应无缝衔接接头连接和反转录,不仅能够简化纯化步骤,还可以缩短文库构建的时间,提高效率;另外,该方法无需进行PCR,能够有效避免PCR带来的偏差(bias)问题,而且步骤简单,利于实现高通量、自动化应用。
根据本发明的实施例,所述步骤(3)和所述步骤(4)是在同一容器中进行的。
根据本发明的实施例,所述步骤(1)的起始mRNA是采用去核糖体RNA方法从总RNA中分离纯化获得的。根据本发明的一些实施例,所述去核糖体RNA方法包括:将所述总RNA与oligo DNA进行退火处理,将所述退火处理得到的产物进行RNaseH酶消化,将所述RNaseH酶消化得到的产物进行DNase I酶消化,以及将所述DNase I酶消化得到的产物进行磁珠纯化,以便获得所述mRNA,其中,所述Oligo DNA是可与rRNA杂交的寡核苷酸单链片段,其长度为45-60bp,优选为45-55bp。由此,能够高效地分离获得mRNA。
根据本发明的实施例,所述步骤(5)是通过以下步骤进行的:(a)向反转录产物中加入1M NaOH,在PCR仪上反应98℃20min,然后向得到的混合物中加入1M HCl;(b)向步骤(a)中所得到的混合物中加入水,然后进行乙醇沉淀,并用1×TE重悬。
根据本发明的实施例,所述步骤(4)的反转录是采用携带生物素的引物进行的。
根据本发明的实施例,所述步骤(6)进一步包括:将所述单链DNA进行单链环化反应,以便获得单链环化反应产物;利用链霉素磁珠对所述单链环化反应产物进行筛选,以便获得所述环状DNA。
在本发明的第二方面,本发明提供了一种测序方法。根据本发明的实施例,该方法包括:通过前面所述的方法构建测序文库;以及对所述测序文库进行测序。发明人发现,利用本发明的该方法,能够快速、有效的进行测序,且通过前面所述的方法构建测序文库能够有效减少样品提取的数量和切胶和胶纯化回收步骤,可以利用非常微量的RNA用于构建文库,RNA的起始量只需要pg级别就能满足要求;在单管中利用连续反应无缝衔接接头连接和反转录,不仅能够简化纯化步骤,还可以缩短文库构建的时间,提高效率;另外,该方法无需进行PCR,能够有效避免PCR带来的偏差(bias)问题,而且步骤简单,利于实现高通量、自动化应用。
在本发明的第三方面,本发明提供了一种构建测序文库的设备。根据本发明的实施例,该设备包括:片段化装置,所述片段化装置用于将mRNA打断,以便获得片段化mRNA;去磷酸化装置,所述去磷酸化装置用于将所述片段化mRNA去磷酸化,以便获得去磷酸化mRNA;接头连接装置,所述接头连接装置用于将所述去磷酸化mRNA连接3’端接头,以便获得连接产物;反转录装置,所述反转录装置用于将所述连接产物进行反转录,以便获得cDNA;分离装置,所述分离装置用于从所述cDNA分离单链DNA;以及环化装置,所述环化装置用于将所述单链DNA进行单链环化,以便获得环状DNA,所述环状DNA构成所述测序文库。利用本发明的该设备,能够有效实施前面所述的构建测序文库的方法,可以利用非常微量的RNA用于构建文库,RNA的起始量只需要pg级别就能满足要求;不需要复杂的纯化装置,且不需进行PCR,不仅设备简单,成本低廉,且能够缩短文库构建的时间,大大提高效率。
根据本发明的实施例,进一步包括:提取装置,所述提取装置用于利用去核糖体RNA方法从总RNA中分离纯化所述mRNA。在本发明的一些实施例中,提取装置中设置有oligoDNA,所述Oligo DNA是长度为45-60bp,优选45-55bp的寡核苷酸单链片段,具有选自SEQ IDNO.:1-195中至少之一所示的序列。
根据本发明的实施例,所述分离装置进一步包括:热解单元,所述热解单元用于向反转录产物中加入1M NaOH,在PCR仪上反应98℃20min,然后向得到的混合物中加入1MHCl;以及沉淀单元,所述沉淀单元用于向所述热解单元中所得到的混合物中加入水,然后进行乙醇沉淀,并用1×TE重悬。
根据本发明的实施例,所述反转录装置中设置有携带生物素的引物,,用于进行反转录反应。
根据本发明的实施例,所述环化装置进一步包括:环化反应单元,所述环化反应单元用于将所述单链DNA进行单链环化反应,以便获得单链环化反应产物;筛选单元,所述筛选单元用于利用链霉素磁珠对所述单链环化产物进行筛选,以便获得所述环状DNA。
在本发明的第四方面,本发明提供了一种测序系统。根据本发明的实施例,该系统包括:前面所述的构建测序文库的设备;以及测序设备。发明人发现,利用本发明的该系统能够快速、有效的实施前面所述的测序方法,且通过前面所述的设备构建测序文库能够有效减少样品提取的数量和切胶和胶纯化回收步骤,可以利用非常微量的RNA用于构建文库,RNA的起始量只需要pg级别就能满足要求;还可以在单管中利用连续反应无缝衔接接头连接和反转录,不仅能够简化纯化步骤,还可以缩短文库构建的时间,提高效率;另外,该系统无需进行PCR,能够有效避免PCR带来的偏差(bias)问题,而且操作简单,利于实现高通量、自动化应用。
附图说明
图1显示了根据本发明的实施例,构建测序文库的方法的流程示意图;
图2显示了根据本发明的实施例,构建测序文库的技术原理概要图;
图3显示了根据本发明的实施例,构建测序文库的设备的结构示意图;
图4显示了根据本发明的实施例,构建获得的测序文库的电泳结果图;以及
图5显示了根据本发明的实施例,构建获得的测序文库的随机性分布结果图。
具体实施方式
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
在本发明的第一方面,本发明提供了一种构建测序文库的方法。根据本发明的实施例,参照图1和图2,该方法包括以下步骤:
S100:将mRNA打断,以便获得片段化mRNA。
根据本发明的实施例,该步骤中,起始mRNA是采用去核糖体RNA方法从总RNA中分离纯化获得的。
在本发明的一些实施例中,去核糖体RNA方法包括以下步骤:将总RNA与oligo DNA进行退火处理,将退火处理得到的产物进行RNaseH酶消化,将RNaseH酶消化得到的产物进行DNase I酶消化,以及将DNase I酶消化得到的产物进行磁珠纯化,以便获得mRNA,其中,所述Oligo DNA是可与rRNA杂交的寡核苷酸单链片段,其长度为45-60bp,优选为45-55bp。由此,能够高效的获得mRNA,且步骤简单,操作容易,有利于提高构建测序文库的效率。
S200:将所述片段化mRNA去磷酸化,以便获得去磷酸化mRNA。由此,能够有效避免在后续步骤中片段化mRNA自身进行连接,有利于减少样品丢失及提高构建文库的效率。
S300:将所述去磷酸化mRNA连接3’端接头,以便获得连接产物。
S400:将所述连接产物进行反转录,以便获得cDNA。
根据本发明的实施例,所述反转录是采用携带生物素的引物进行的。由此,能够在后续步骤中达到高效纯化cDNA的目的,进而能够进一步减少样品的损失,提高构建测序文库的效率。
根据本发明的实施例,所述步骤S300和所述步骤S400是在同一容器中进行的。由此,连续反应无缝衔接接头连接和反转录,不仅减少了切胶纯化步骤,还大大缩短了构建测序文库的时间,有利于提高构建测序文库的效率。
S500:从所述cDNA分离单链DNA。
根据本发明的实施例,可以通过移除cDNA中的模板RNA,然后利用乙醇沉淀单链DNA的方法从所述cDNA分离单链DNA。根据本发明的一个具体示例,从所述cDNA分离单链DNA是通过以下步骤进行的:(a)向反转录产物中加入1M NaOH,在PCR仪上反应98℃20min,然后向得到的混合物中加入1M HCl;(b)向步骤(a)中所得到的混合物中加入水,然后进行乙醇沉淀,并用1×TE重悬。
S600:将所述单链DNA进行环化,以便获得环状DNA,所述环状DNA构成所述测序文库。
根据本发明的实施例,所述步骤S600进一步包括:将所述单链DNA进行单链环化反应,以便获得单链环化反应产物;利用链霉素磁珠对所述单链环化反应产物进行筛选,以便获得所述环状DNA。由此,能够高效纯化获得环状DNA,能够有效减少样品投入量。
发明人发现,利用本发明的该方法,能够快速有效的构建测序文库,且该方法能够有效减少样品提取的数量和切胶和胶纯化回收步骤,可以利用非常微量的RNA用于构建文库,RNA的起始量只需要pg级别就能满足要求;在单管中利用连续反应无缝衔接接头连接和反转录,不仅能够简化纯化步骤,还可以缩短文库构建的时间,提高效率;另外,该方法无需进行PCR,能够有效避免PCR带来的偏差(bias)问题,而且步骤简单,利于实现高通量、自动化应用。
在本发明的第二方面,本发明提供了一种测序方法。根据本发明的实施例,该方法包括:通过前面所述的方法构建测序文库;以及对所述测序文库进行测序。发明人发现,利用本发明的该方法,能够快速、有效的进行测序,且通过前面所述的方法构建测序文库能够有效减少样品提取的数量和切胶和胶纯化回收步骤,可以利用非常微量的RNA用于构建文库,RNA的起始量只需要pg级别就能满足要求;在单管中利用连续反应无缝衔接接头连接和反转录,不仅能够简化纯化步骤,还可以缩短文库构建的时间,提高效率;另外,该方法无需进行PCR,能够有效避免PCR带来的偏差(bias)问题,而且步骤简单,利于实现高通量、自动化应用。
在本发明的第三方面,本发明提供了一种构建测序文库的设备。根据本发明的实施例,参照图3,该设备包括:
片段化装置100,所述片段化装置100用于将mRNA打断,以便获得片段化mRNA。
根据本发明的实施例,进一步包括:提取装置,所述提取装置用于利用去核糖体RNA方法从总RNA中分离纯化所述mRNA。
在本发明的一些实施例中,提取装置中设置有oligo DNA,所述Oligo DNA是可与rRNA杂交的寡核苷酸单链片段,其长度为45-60bp,优选为45-55bp。由此,能够高效地分离纯化获得mRNA,有利于提高效率。
去磷酸化装置200,所述去磷酸化装置200用于将所述片段化mRNA去磷酸化,以便获得去磷酸化mRNA。由此,能够有效避免在后续步骤中片段化mRNA自身进行连接,有利于减少样品丢失及提高构建文库的效率。
接头连接装置300,所述接头连接装置300用于将所述去磷酸化mRNA连接3’端接头,以便获得连接产物。
反转录装置400,所述反转录装置400用于将所述连接产物进行反转录,以便获得cDNA。
根据本发明的实施例,所述反转录装置中设置有携带生物素的引物。由此,能够在后续步骤中达到高效纯化cDNA的目的,进而能够进一步减少样品的损失,提高构建测序文库的效率。
根据本发明的实施例,在本发明的设备中,所述接头连接和所述反转录反应是在同一容器中进行的。由此,连续反应无缝衔接接头连接和反转录,不仅减少了切胶纯化步骤,还大大缩短了构建测序文库的时间,有利于提高构建测序文库的效率。
分离装置500,所述分离装置500用于从所述cDNA分离单链DNA。
根据本发明的实施例,所述分离装置500进一步包括:热解单元,所述热解单元用于向反转录产物中加入1M NaOH,在PCR仪上反应98℃20min,然后向得到的混合物中加入1MHCl;以及沉淀单元,所述沉淀单元用于向所述热解单元中所得到的混合物中加入水,然后进行乙醇沉淀,并用1×TE重悬。
环化装置600,所述环化装置600用于将所述单链DNA进行单链环化,以便获得环状DNA,所述环状DNA构成所述测序文库。
根据本发明的实施例,所述环化装置600进一步包括:环化反应单元,所述环化反应单元用于将所述单链DNA进行单链环化反应,以便获得单链环化反应产物;筛选单元,所述筛选单元用于利用链霉素磁珠对所述单链环化产物进行筛选,以便获得所述环状DNA。由此,能够高效纯化获得环状DNA,能够有效减少样品投入量。
利用本发明的该设备,能够有效实施前面所述的构建测序文库的方法,可以利用非常微量的RNA用于构建文库,RNA的起始量只需要pg级别就能满足要求;不需要复杂的纯化装置,且不需进行PCR,不仅设备简单,成本低廉,且能够缩短文库构建的时间,大大提高效率。
在本发明的第四方面,本发明提供了一种测序系统。根据本发明的实施例,该系统包括:前面所述的构建测序文库的设备;以及测序设备。发明人发现,利用本发明的该系统能够快速、有效的实施前面所述的测序方法,且通过前面所述的设备构建测序文库能够有效减少样品提取的数量和切胶和胶纯化回收步骤,可以利用非常微量的RNA用于构建文库,RNA的起始量只需要pg级别就能满足要求;还可以在单管中利用连续反应无缝衔接接头连接和反转录,不仅能够简化纯化步骤,还可以缩短文库构建的时间,提高效率;另外,该系统无需进行PCR,能够有效避免PCR带来的偏差(bias)问题,而且操作简单,利于实现高通量、自动化应用。
总之,本发明提供了一种从非常低的RNA投入量构建cDNA文库适用于高通量测序的构建测序文库的方法,该方法是一种相对简单和流线型克隆方案,相比较传统克隆方案和已商业化的流线型方案导致重大的样品丢失问题,本发明的方法通过减少样品提取的数量和切胶回收步骤,尽可能最小化减少样品的丢失,该方法涉及测序连接接头和反转录反应在同一单管中完成,在这一单管中一个单独的接头连接上RNA的3’端,紧接着反转录形成带有生物素(biotin)的cDNA;然后cDNA进行环化,带有biotin的cDNAs被筛选出来。
本发明的方法灵敏度高,从人类全血血浆的临床样品分离非常微量的RNA用于构建cDNA文库的起始量只需要pg级别就能满足要求;文库制备流程简单,整个RNA文库制备只需要1.5天就能完成。不管从样品投入量,时间上,成本上,此方法均优于目前已商业化另外二大测序平台(ion torrent和Illumina)的RNA文库制备技术。
实施例1:
实验样本来源:采用材料是人细胞的RNA标准品(Universal Human ReferenceRNA)购自Agilent Technologies。
具体实验步骤:
1、RNaseH纯化mRNA
1.1取100ng总RNA与oligo DNA退火,反应体系如下所示:
其中,Oligo DNA为SEQ ID NO.1-SEQ ID NO.195所示各单条序列按等量的分子比例混合在一起形成的混合物。
1.2在PCR仪上95℃反应2min;梯度降温,每隔1s降0.1℃至22℃;22℃反应5min,迅速置于冰上。
1.3RNaseH酶消化
在37℃反应30min。
1.4DNase I酶消化
1.5反应结束后,产物用RNA clean XP磁珠纯化,溶于10μl无核酸酶水中。
2、mRNA 片段化
向上一步中的洗脱液中加入3.5μL的5×第一链缓冲液,94℃,10min,立即置于冰上。
3、片段化mRNA去磷酸化
将样品置于PCR仪中反应,反应条件:37℃30min;65℃5min;4℃保持。
反应结束后,产物用RNA clean XP磁珠纯化,溶于10μl无核酸酶水中。
4、3’接头连接反应
在PCR仪上30℃反应6h。
其中,3’接头具有如下所示的序列:
5/rApp/GTCTCCAGTCGAAGCCCGATC/Amine/3(SEQ ID NO.196)
5phos/AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAAGCTCXXXXXXXXXXGATCGGGCTTCGACTGGAGAC(SEQ ID NO.197,其中,XXXXXXXXXX代表不同的标签(barcode)序列)。
5、反转录合成cDNA链
混匀后在PCR仪上按照以下程序进行反应:
在该步骤中,上述步骤中连接的3’接头作为反转录引物。
6、分离单链DNA
移除模板RNA和乙醇沉淀cDNA产物,具体如下:
往上步产物加入2μl 1M NaOH,在PCR仪上反应98℃20min(105℃热盖),然后加入2μl 1M HCL。
补水至200μl再进行乙醇沉淀,最后用15μl 1×TE重悬,以便获得单链DNA。
7、单链环化连接反应
在PCR仪上60℃反应2h。
反应结束后80℃反应10min失活ssDNA连接酶。
8、链霉素磁珠结合带有生物素环化产物
取30μl链霉亲和素磁珠(Streptavidin Beads,浓度为10mg/ml)),加入120μl的1×结合缓冲液(1×binding buffer,组成成分是110mM Tris-HCl,200mM NaCl),在不粘管中混匀后置于磁力架上静止吸附,调整不粘管的方向,使得链霉亲和素磁珠在1×bindingbuffer洗液中前后游动,弃上清液后,重复上述操作一次,取出不粘管加入30μl 1×binding buffer悬浮,混匀后室温待用。
向20μl环化产物加入20μl 2×binding buffer(组成成分是220mM Tris-HCl,400mM NaCl)混匀,然后转移到上步骤含有30μl 1×binding buffer悬浮的链霉亲和素磁珠的不粘管中混匀,将此70μl混合物置于室温下结合15-20min,中间轻轻弹匀一次。
9、破坏链霉素与生物素作用,得到环化文库
将上述不粘管磁力架放置3-5min,弃去上清液,用100μl的1×TE洗涤2次,方法同链霉亲和素磁珠的洗涤方法,然后加入50μl无离子灭菌水重悬磁珠进行PCR反应,PCR反应条件如下:
反应结束后,吸取上清到新的1.5mL EP管,用ssDNA Qubit进行定量,并跑6%的变性胶验证文库结果,构建获得的文库的电泳结果见图4,其中,泳道1为fermentas低范围RNA梯(fermentas low range RNA ladder),泳道2为构建获得的文库,可以看到在300-600nt分布的smear(成片条带)就是构建获得的单链环状文库。
10、结果验证
将上述制备获得的文库在Complete Genomics测序平台进行常规数据分析,结果如下:
将上述制备获得的文库与来自Rfam数据库(人核糖体数据库)的参考基因组进行比对,核糖体RNA占的比例结果见表1:
表1
比对基因 |
序列数目 |
百分比 |
总共序列数目 |
8302538 |
100.00% |
总共比对上的序列数 |
2141 |
0.03% |
总共未比对上的序列数 |
8300397 |
99.97% |
将上述制备获得的文库与来自人类基因组数据库h19的参考基因组进行比对,比对到基因组的结果见表2:
表2
总共序列数 |
总共比对序列数 |
唯一匹配序列数 |
8302538(100%) |
8253099(99.40%) |
7744826(93.28%) |
随机性分布结果见图5。
上述结果表明,通过根据本发明实施例的上述方法,能够成功地以少量起始样品制备获得符合要求的测序文库。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。