一种适用于单链DNA的高通量测序文库构建方法
技术领域
本发明涉及生物技术领域,具体涉及一种适用于单链DNA的高通量测序文库构建方法。
背景技术
自2005年第一台高通量测序仪诞生以来,高通量测序方法发展迅速,推陈出新,在测序公司和科研人员的不断努力下,完成了技术的更新迭代(VAN DIJK E L,AUGER H,JASZCZYSZYN Y,et al.Ten years of next-generation sequencing technology[J].Trends Genet,2014,30(9):418-26.)。测序技术的发展推动着高通量测序的不断进步,建库技术的发明与改进也在高通量测序发展中起到了举足轻重的作用。
在高通量测序技术发展史上,研究人员根据不同的建库原理开发了许多建库技术,如基本的双链建库、随机引物建库、AmpliSeq建库、转座酶建库、免疫共沉淀建库等方法(HEAD S R,KOMORI H K,LAMERE S A,et al.Library construction for next-generation sequencing:overviews and challenges[J].Biotechniques,2014,56(2):61-4,6,8,passim.)。双链建库是一种最为基础的建库方法,将DNA进行片段化或将RNA进行反转录成cDNA后,在模板两端加上与测序平台匹配的接头序列,即完成文库构建,由于此方法数据稳定性较好及适用的环境广,双链建库的研究和应用也更为普遍。
现有的双链建库方法无法将单链DNA转化为测序文库:(1)研究表明,cfDNA中也存在有单链DNA,而此类建库方法使用T4DNA连接酶在双链DNA末端连接上双链接头,无法将单链DNA转化为可供测序的文库。(2)目前甲基化测序的方法(亚硫酸氢钠测序法)需要使用重亚硫酸盐处理,但重亚硫酸盐处理会导致DNA分子断裂、形成单链。而目前的甲基化文库构建方法大多是在完成接头连接后进行重亚硫酸盐处理,最终导致分子转化率低的问题。双链建库无法使用UNG去除DNA损伤:一些质量较差的DNA类型,如FFPE样本、古DNA等均存在一定的损伤,有研究表明这些类型的损伤主要是胞嘧啶脱氨基形成尿嘧啶,经过PCR会导致C>T碱基转换,从而导致错误的测序结果(DO H,DOBROVIC A.Dramatic reduction ofsequence artefacts from DNA isolated from formalin-fixed cancer biopsies bytreatment with uracil-DNA glycosylase[J].Oncotarget,2012,3(5):546-58.)。目前去除DNA中尿嘧啶的方法是使用尿嘧啶-N-糖基化酶(uracil N-glycosylase,UNG)处理DNA,该酶可以选择性水解断裂含有dU的双链或单链DNA中的尿嘧啶糖苷键(HOFREITER M.DNAsequences from multiple amplifications reveal artifacts induced by cytosinedeamination in ancient DNA[J].Nucleic Acids Research,2001,29(23):4793-9.)。但经过UNG酶处理后的DNA,因碱基缺失会导致DNA分子断裂形成单链,采用双链建库的方法无法利用这些DNA,结果在去除尿嘧啶的同时导致了DNA分子的损失。
随着研究的发展,血浆游离DNA(cell free DNA,cfDNA)已经成为近年来研究的热点,cfDNA在无创产前筛查、肿瘤液体活检、器官移植等领域有广泛的应用。研究表明,cfDNA大多数以双链形式存在,但也有一定比例的单链cfDNA以及损伤的cfDNA。由于双链建库只能利用双链DNA,单链cfDNA和受损伤的cfDNA在建库过程中往往会丢失,导致分子利用率下降。同时由于血浆中的cfDNA含量较低,具有突变信息的cfDNA含量则是更加微乎其微。因此在进行cfDNA检测时,尽量提高分子利用率是提高检测能力的关键。
使用单链建库进行文库构建时,单链、受损伤的cfDNA均能作为模板进行文库构建,能够有效地提高cfDNA建库的分子利用率。同时,单链建库能够兼容以往技术不适用的样本类型,如经过重亚硫酸盐处理的DNA、单链RNA、寡聚核苷酸等样本的测序成为可能,为与高通量测序相关的研究提供了新思路。
相关文献报道,Circaligase II是一种热稳定的可介导单链DNA或单链RNA 5’磷酸基团与3’羟基连接的一种连接酶,通过去除DNA模板上的磷酸基团,可实现在单链DNA分子3’端直接连上单链接头,再经过单链接头引物延伸后可完成单链DNA分子的文库构建(GANSAUGE M T,MEYER M.Single-stranded DNA library preparation for thesequencing of ancient or damaged DNA[J].Nat Protoc,2013,8(4):737-48.)。
然而,采用CircligaseII连接酶进行单链建库的方法,同时存在连接酶价格高(约400元每个反应)和接头连接效率低的问题,不利于技术向产品的转化。
发明内容
为了有效的解决上述技术问题,本发明提供了一种新的适用于单链DNA的高通量测序文库构建方法。该方法通过高温使双链DNA变性为单链后进行文库构建,不但能够利用DNA样本中双链的分子,也能利用样本中存在的单链分子,能够完美解决双链建库无法利用单链DNA作为模板的问题,大大提高了样本的分子利用率。该方法以单链DNA分子作为建库模板的特点,使得在构建甲基化文库时,可以先进行重亚硫酸盐处理DNA分子,在处理过程中断裂、因碱基变化而无法复性形成的单链分子均能够被本建库技术所利用,很好地解决了先建库后重亚硫酸盐处理导致的分子损失问题。该方法对于质量较差的样本,若采用单链建库则可以直接使用UNG酶去除尿嘧啶,形成的单链DNA分子依然能够被本技术所利用,保证了分子的利用率。另外,相对于已有的单链建库技术,该方法具有价格更便宜、分子利用率更高的优点。
第一方面,本发明要求保护一种适用于单链DNA的高通量测序文库构建方法。
本发明所提供的适用于单链DNA的高通量测序文库构建方法,可包括如下步骤:(1)在待建文库的单链DNA模板的3’末端连接上接头1,所述接头1为带有简并寡核苷酸的双链接头;(2)采用延伸引物进行反应,得到双链产物;(3)在步骤(2)所得双链产物的末端连接上接头2;(4)以步骤(3)所得连接产物为模板进行PCR扩增,所得扩增产物即为最终完整文库。
其中,步骤(2)中进行的所述反应可为“恒温延伸”,也可以为“PCR扩增”。由于只有延伸引物,因此采用PCR扩增的方法,每个循环扩增都只能以待建库单链DNA作为模板,延伸引物作为引物进行扩增。经过PCR后除了延伸得到的双链产物,还会有很多扩增得到的单链产物。这部分单链产物会在后续的纯化步骤被去掉(没有结合在磁珠上),故此步骤如果采用PCR扩增的方法也能正常建库。
具体的,所述方法可包括如下步骤:
(1)在待建文库的单链DNA模板的3’末端连接上接头1;所述接头1为由接头1-1和接头1-2退火形成的所述接头1-2的3’端突出的双链接头;所述接头1-1的5’末端修饰有磷酸基团(PHO,采用T4DNA连接酶或者其他具有相同功能的连接酶进行连接时所需),所述接头1-2的3’端突出的部分为用于结合所述待建文库的单链DNA模板的3’端序列的简并寡核苷酸;
(2)以步骤(1)所得连接产物中含有所述接头1-1的那条链为模板,采用延伸引物进行反应(具体可为恒温延伸或PCR扩增),得到双链产物;所述延伸引物为3’端含有所述接头1-1的反向互补序列的单链DNA或者所述延伸引物的序列为所述接头1-1的反向互补序列;
(3)在步骤(2)所得双链产物的末端连接上接头2;所述接头2被连接到所述双链产物中含有所述待建文库的单链DNA模板的那条链的5’末端(或者称为所述接头2被连接到所述双链产物中不含有所述待建文库的单链DNA模板的那条链的3’末端,即所述接头2的连接位置与所述接头1相对);所述接头2为由接头2-1和接头2-2退火形成的所述接头2-2的3’端突出的双链接头;所述接头2-2的5’末端修饰有磷酸基团(PHO,采用T4DNA连接酶或者其他具有相同功能的连接酶进行连接时所需);
(4)以步骤(3)所得连接产物为模板,采用上游引物和下游引物进行PCR扩增,所得扩增产物即为所述文库;所述上游引物能够与所述接头2中所述接头2-2的3’端突出部分序列反向互补;所述下游引物的序列与所述延伸引物序列相同或者所述下游引物的3’端序列与所述延伸引物序列相同。
进一步地,步骤(1)中,可采用T4DNA连接酶或者其他具有相同功能的连接酶实现在所述待建文库的单链DNA模板的3’末端连接上所述接头1。
进一步地,步骤(1)中,所述接头1-2的两末端带有修饰基团;所述修饰基团能够避免所述接头1在反应过程中被降解(抑制酶对接头1的作用)。
在本发明的具体实施方式中,所述接头1-2的5’末端修饰有AMB(Aminolinker C12修饰),3’末端修饰有AMN(Aminolinker
修饰)。AMN、AMB修饰(由不同长度的C链连接的氨基修饰,从可invitrogen订购)能够抑制酶对所述接头1的作用,保证反应能够顺利进行。当然,AMN、AMB可以更换为其他形式的氨基修饰或其他能够抑制酶反应的修饰。
在本发明的具体实施方式中,所述接头1-1的3’末端修饰有生物素(BIO)。相应的,可通过偶联有链霉亲和素的磁珠对连接产物进行纯化。当然,如建库流程经过修改可以变形为无需生物素修饰的形式,也能够达到单链建库的目的。
在本发明的具体实施方式中,所述下游引物的5’末端修饰有磷酸基团(PHO)。这个PHO修饰是BGISEQ或MGISEQ平台特有的,用于文库环化,所述下游引物上不加PHO修饰不影响文库构建。
进一步地,步骤(1)中,所述简并寡核苷酸可为4-9个(如6-8个,具体如6个)连续N,N为A或T或C或G。当然这里简并碱基的形式不限于N,可根据需要进行调整。
在上述方法中,所述接头1依靠所述简并寡核苷酸序列可随机地结合到单链DNA3’端,使接头序列与DNA模板能够充分靠近,再使用T4DNA连接酶或者其他具有相同功能的连接酶将DNA模板3’羟基与接头序列的5’磷酸(所述接头1引物-1的5’末端修饰有磷酸基团)相连,形成3’,5’-磷酸二酯键,完成所述接头1的连接。
采用含有简并寡核苷酸的接头(即所述接头1)进行连接:第一,使得利用单链DNA作为模板成为可能;第二,采用简并寡核苷酸对单链DNA进行捕获,使单链DNA模板与接头序列更加靠近,增加了接头连接的概率,且经过实验验证,采用T4DNA连接酶进行连接时连接效率比Circaligase II更高;第三,此方法无需使用价格昂贵的Circaligase II连接酶,连接成本降低约100倍。
在本发明的具体实施方式中,步骤(3)中,所述接头2是通过TA连接的方式连接到步骤(2)所得双链产物的末端的。相应的,步骤(2)中,采用所述延伸引物进行反应(具体可为恒温延伸或PCR扩增)后还包括加A的步骤;所述接头2中的所述接头2-1的3’末端核苷酸为T(与加的A互补配对)。本发明以TA连接的方式进行连接,旨在提高连接效率,减少接头自连,当然亦可采用平末端连接方法。
在所述方法中,步骤(3)中,可采用T4DNA连接酶或者其他具有相同功能的连接酶实现在步骤(2)所得双链产物的末端连接上所述接头2。
在本发明的具体实施方式中,所述接头1-1的序列如SEQ ID No.1所示;所述接头1-2的序列如SEQ ID No.2所示;所述接头2-1的序列如SEQ ID No.3所示;所述接头2-2的序列如SEQ ID No.4所示;所述延伸引物的序列如SEQ ID No.5所示;所述上游引物的序列如SEQ ID No.6所示;所述下游引物的序列如SEQ ID No.7所示。上述接头序列是根据BGISEQ-500(或MGISEQ)平台进行设计的,当然亦可根据相同的设计思路,进行适用于Illumina、IonProton等测序平台的接头设计。
在所述方法中,所述待建库的单链DNA模板经过去磷酸化处理。
在所述方法中,所述待建库的单链DNA模板可来自但不限于如下任一:打断的基因组样本(如100-250bp)、cfDNA、经过重亚硫酸盐处理的cfDNA等。样本类型可包括其他样本类型,如古DNA、RNA等样本。当初始样本为双链样本时,还包括变性的步骤(目的:将双链解旋为单链)。
在所述方法中,所述高通量测序可为二代测序或三代测序,不限于如下任一:全基因组测序、全基因组甲基化测序、结合捕获探针进行靶向测序等。
第二方面,本发明要求保护利用前文第一方面中所述方法构建得到的高通量测序文库。
第三方面,本发明要求保护下述生物材料中的任一种:
(A1)以单链形式存在的前文第一方面中所述接头1-1和所述接头1-2;或者前文第一方面中所述的接头1(即由所述接头1-1和所述接头1-2退火后形成的双链接头);
(A2)以单链形式存在的前文第一方面中所述接头1-1、所述接头1-2、所述接头2-1和所述接头2-2;或者由前文第一方面中所述接头1(即由所述接头1-1和所述接头1-2退火后形成的双链接头)和所述接头2(即由所述接头2-1和所述接头2-2退火后形成的双链接头)组成的成套接头;
(A3)由所述(A2)、所述延伸引物、所述上游引物和所述下游引物组成的成套DNA;
(A4)含有所述(A1)、所述(A2)或所述(A3)的试剂盒;
进一步地,所述试剂盒中还含有记载于前文第一方面中任一所述方法的可读性载体。
第四方面,本发明要求保护如下任一所示应用:
(B1)前文第三方面中所述生物材料在构建适用于单链DNA的高通量测序文库中的应用;
(B2)前文第一方面中任一所述方法或前文第二方面中所述文库或前文第三方面中所述生物材料在肿瘤早筛和/或预后监测中的应用。
本发明可用于构建高通量测序文库,且可用于单链DNA文库构建,本发明将提高高通量测序文库构建中单链DNA利用率,进一步实现低起始量建库的目的,在未来肿瘤早筛和预后监测应用中发挥关键作用。
本发明采用特殊的接头进行建库,使T4DNA连接酶可将接头连接到单链模板上,从而实现单链建库技术。单链建库为基因组学研究提供了更加便利、有效的工具,使得样本中的单链分子也能够被检测到,大大提高了分子利用率,使基因检测的灵敏度得到提高。单链建库也为基因组研究者提供了更为广阔的思路,如古DNA、FFPE样本DNA等样本中的由于胞嘧啶脱氨基所形成的尿嘧啶,可以先经过UNG酶消化,再进行文库构建,能够有效地降低C-T转化的影响;在甲基化测序技术上,使得先进行重亚硫酸盐处理成为可能,避免了先建库后重亚硫酸盐处理导致的分子损失,分子转化率大大提高。另外,本发明的建库体系、流程均经过摸索与优化使建库效率更高,检测周期(TAT)更短。
附图说明
图1为单链DNA模板与接头1连接示意图。
图2为本发明单链建库技术流程图。
图3为cfDNA WGBS文库2100图。
图4为测序数据质量值。
图5为碱基平衡。
图6为建库技术建库效率比较。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、适用于单链DNA的高通量测序文库构建方法
本发明是一种高通量测序文库构建的方法,使用本方法可利用单链DNA作为模板进行测序文库构建,适用而不限于BGISEQ-500、MGISEQ、Illumina等测序平台,适用样本类型包括而不限于打断DNA、cfDNA以及重亚硫酸盐处理后的DNA,可实现全基因组测序、全基因组甲基化测序、捕获测序等测试方案。
本实施例所提供的适用于单链DNA的高通量测序文库构建方法,其技术核心在于一种带有6N(N为A或T或C或G)的特殊接头(接头1)使单链模板与接头连接成为可能。带有6N的双链接头可随机地结合到单链DNA的3’末端,使接头序列与DNA模板能够充分靠近,再使用T4DNA连接酶将DNA模板3’羟基与接头序列5’磷酸相连,形成3’,5’-磷酸二酯键,完成接头连接,如图1所示。采用6N接头进行连接:第一,使得利用单链DNA作为模板成为可能;第二,采用6N对单链DNA进行捕获,使单链DNA模板与接头序列更加靠近,增加了接头连接的概率,且经过实验验证,采用T4 DNA连接酶进行连接时连接效率比Circaligase II更高;第三,此方法无需使用价格昂贵的Circaligase II连接酶,连接成本降低约100倍。
本发明技术流程如图2所示,具体步骤如下:
一、引物、接头合成
引物序列,如表1所示。
表1单链建库引物序列
注:表中PHO表示磷酸基团修饰;BIO表示生物素修饰;AMB表示Aminolinker C12修饰;AMN表示Aminolinker
修饰;AMN、AMB修饰为由不同长度的C链连接的氨基修饰,从可invitrogen订购。空格处表示无修饰基团。Ad2-2-61仅为其中一个index的接头,由于index较多不一一列举。
二、样本制备
1、DNA文库样本制备:
基因组DNA:采用商业提取试剂盒(DNeasy Blood&Tissue Kit(250);货号:69506;厂家:Qiagen)进行DNA提取,将DNA片段打断至100-250bp。
cfDNA:使用cfDNA提取试剂盒(MagPure Circulating DNA Maxi Kit;货号:12917PJ-100;厂家:MAGEN)进行DNA提取。
2、甲基化文库制备:
完成步骤1中DNA提取后,使用EZ DNA Methylation-GoldTMKit进行C-U转化。
三、测序接头退火
1、接头1退火:接头1两条引物按1:1(摩尔比)退火成终浓度为10μM的接头(ss-Ad1)。接头1退火反应体系如表2所示。
表2接头1退火反应体系
试剂 |
体积μl |
ss_Ad1-1(100μM) |
8 |
ss_Ad1-2(100μM) |
8 |
NF水 |
64 |
总体积 |
80 |
注:NF水表示Nuclease-Free Water(无核酸酶水),下同。
反应条件:95℃,5min;RAMP 0.1℃/s到10℃;10℃,∞。
2、接头2退火:接头2两条引物按1:1(摩尔比)退火成终浓度为50μM的接头(ss-Ad2)。接头2退火反应体系如表3所示。
表3接头2退火反应体系
试剂 |
体积μl |
ss_Ad2-1(100μM) |
40 |
ss_Ad2-2_61(100μM) |
40 |
总体积 |
80 |
反应条件:95℃5min;RAMP 0.1℃/s到10℃;10℃∞。
四、建库Buffer配制:
在50ml离心管中配制下表(表4)Buffer:
表4建库Buffer配制表
五、文库构建
1、变性与去磷酸化:
(1)按照下表(表5)在冰盒上配制变性与去磷酸化反应体系:
表5变性与去磷酸化反应体系
试剂 |
体积μl |
10×T4RNA ligation buffer(NEB) |
8 |
2%Tween 20 |
2 |
FastAP(1U/μl)(FERMENTAS) |
3 |
总体积 |
13 |
(2)将上述反应体系震荡混匀,分装至PCR管中,加入20μl DNA模板,共33μl的反应体系,在PCR仪中运行以下程序进行反应:37℃20min;95℃3min;95℃,∞。
(3)95℃加热结束后,立即将PCR管取出放在冰盒上5min。
2、接头1连接:
(1)提前在冰盒上配制好接头1连接反应体系,反应体系如表6所示:
表6接头1连接反应体系
试剂 |
体积μl |
NF水 |
20.6 |
50%PEG-8000(NEB) |
20 |
ATP(100mM)(FERMENTAS) |
0.4 |
ss-Ad1(10μM) |
3 |
T4DNA Ligase(ENZYMATICS) |
3 |
总体积 |
47 |
(2)冰浴5min结束后,充分震荡混匀连接反应体系,分装47μl至变性后的DNA中,得到80μl的连接混合液,在PCR仪中运行以下程序进行反应:37℃15min;95℃1min;95℃,∞。
(3)反应结束后,将PCR管取出放在冰盒上5min。
3、连接后纯化:
(1)提前准备纯化磁珠:对每个反应,取20μl Myone C1磁珠(Thermo)于1.5ml离心管中,上磁力架至澄清,去上清。此步骤使用链霉亲和素偶联的磁珠,可与接头1-1修饰的生物素(BIO)结合,优势在于链霉亲和素-生物素亲和力相当高,在纯化过程中始终结合在磁珠上,代替XP磁珠纯化可减少纯化过程导致的分子损失。
(2)向磁珠加入200μl 1×Wash Buffer A,震荡混匀,离心后上磁力架至澄清,去上清。
(3)重复步骤(2)2次,最后用80μl 2×Wash Buffer A重悬磁珠。
(4)将准备好的Myone C1磁珠加入到连接后的混合液中,在垂直混匀仪上,室温孵育至少30min。
(5)孵育结束后,轻微离心,上磁力架,去除上清。加入150μl SWB(45℃预热),在恒温金属浴上以45℃1300rpm混匀5min进行洗涤。
(6)重复步骤(5)一次。
(7)洗涤结束后离心,上磁力架,去上清。加入150μl Wash Buffer B,震荡混匀洗涤后离心,上磁力架,去上清。
4、引物延伸:
(1)提前配制好引物延伸反应体系,反应体系如表7所示:
表7引物延伸反应体系
试剂 |
体积μl |
NF-water |
38.1 |
10×blue buffer(ENZYMATICS) |
5 |
dNTP(25mM)(ENZYMATICS) |
0.4 |
ss_Ext(100μM) |
1 |
1%Tween-20 |
2.5 |
总体积 |
47 |
(2)配制后混匀,取47μl重悬步骤3(7)中的磁珠,在PCR仪中65℃孵育2min,结束后立即放在冰盒上5min。
(3)向PCR管中加入3μl Klenow Fragment酶(ENZYMATICS),共50μl反应体系,在PCR仪中运行以下程序进行反应:25℃5min;37℃25min;75℃10min;4℃∞。
5、加A:
(1)延伸结束后取出PCR管,稍微离心,上磁力架,去上清。
(2)在冰盒上配制表8加A反应体系,并重悬磁珠(Myone C1磁珠):
表8加A反应体系
(3)混匀后稍微离心,在PCR仪上37℃,孵育30min。
6、加A后纯化:
(1)孵育结束后,将PCR管置于磁力架上,去上清。
(2)加入150μl SWB(45℃预热),在恒温金属浴上以45℃1300rpm混匀5min进行洗涤。
(3)洗涤结束后离心,上磁力架,去上清。加入150μl Wash buffer B,震荡混匀洗涤后离心,上磁力架,去上清。
7、接头2连接:
(1)按照下表(表9)在冰盒上配制接头2连接反应体系:
表9接头2连接反应体系
试剂 |
体积μl |
NF水 |
72.5 |
10×T4DNA ligation buffer(ENZYMATICS) |
10 |
50%PEG-4000(HAMPTON RESEARCH) |
10 |
1%Tween-20 |
2.5 |
T4DNA Ligase(ENZYMATICS) |
3 |
总体积 |
98 |
(2)用98μl接头2连接反应体系重悬磁珠(Myone C1磁珠),并加入2μl 50μM ss-Ad2(注意不同样本加入带有不同barcode的接头2;不同barcode即不同index的接头2,指接头2-1与带有不同index的接头2-2退火而成的接头)。
(3)震荡混匀接头2连接反应体系,在PCR仪中22℃孵育15min。
8、连接后纯化:
(1)孵育结束后,将PCR管置于磁力架上,去上清。
(2)加入150μl SWB(45℃预热),在恒温金属浴上以45℃1300rpm混匀5min进行洗涤。
(3)洗涤结束后离心,上磁力架,去上清。加入150μl Wash buffer B,震荡混匀洗涤后离心,上磁力架,去上清。
(4)加入40μl EBT重悬磁珠(Myone C1磁珠)。
9、PCR扩增:
(1)按照下表(表10)在冰盒上配制PCR扩增体系:
表10PCR扩增体系
试剂 |
体积μl |
2×KAPA HiFi HotStart Ready Mix(KAPA) |
50 |
ss_PCR-1(10μM) |
5 |
ss_PCR-2(10μM) |
5 |
总体积 |
60 |
(2)将配制好的PCR扩增混合液加入到步骤8(4)的混合液中,震荡混匀离心。
(3)在PCR仪中运行以下程序进行反应:98℃2min;98℃15s,60℃30s,72℃30s,11个循环;72℃2min;4℃∞。
10、PCR后纯化:
(1)提前取出XP磁珠(Agencourt AMPure XP-Medium,简写XP磁珠;货号:A63882;公司:AGENCOURT),放置在室温平衡30min。XP磁珠是利用DNA和磁珠的电荷不同形成吸附,其作用力较Myone C1弱,采用XP磁珠纯化PCR产物,旨在获得纯净的DNA,故采取结合力较弱的XP进行纯化更便于DNA回收。
(2)在1.5ml管中分装150μl XP磁珠。
(3)PCR结束后,将PCR管取出离心,上磁力架,取上清加入至分装好的XP磁珠中,震荡混匀,在室温下孵育8min。
(4)上磁力架至澄清,去上清。
(5)加入400μl 80%乙醇,转管两周洗涤磁珠,去除80%乙醇。
(6)重复步骤(5)一次。
(7)稍微离心磁珠,上磁力架,尽量去除80%乙醇,开盖使乙醇挥发。
(8)待磁珠干燥至无液体残留后,加入35μl NF水重悬磁珠,震荡混匀后静置10min。
(9)稍微离心,上磁力架至澄清,将上清转移至新的1.5ml离心管中。
文库构建完成,构建好的文库可用于全基因组测序,或进行探针杂交,实行目标区域捕获测序。
实施例2、本发明适用于单链DNA的高通量测序文库构建方法的实际应用
按照实施例1介绍的技术流程进行cfDNA全基因组甲基化测序(WGBS)。
建库模板准备:采用MagPure Circulating DNA Maxi Kit提取健康人cfDNA,取20ng提取好的cfDNA,使用EZ DNA Methylation-GoldTMKit进行重亚硫酸盐转化。
按照实施例1相关步骤进行WGBS文库构建,经过PCR纯化后,使用Qubit进行文库定量,文库总量378ng,文库2100如图3所示。文库构建完成后,采用BGISEQ-500平台进行PE50测序,预期WGBS测序数据量为20G。
WGBS测序数据分析:采用BGISEQ-500进行测序,测序质量值较好(如图4所示,图4由测序仪自动生成)。由于DNA分子中的C经过重亚硫酸盐处理及PCR后会转化为T,故C碱基在测序数据占比很低,T占比较高(如图5所示,图5根据测序时每个RUN的碱基占比描绘)。
进一步地,为了确定采用本发明构建的文库在测序层面上的性能,发明人比较了本发明与单链建库商业试剂盒(
Methyl-Seq DNA Library Kit)的比对率、错配率、覆盖率等数据(注:操作过程中比对软件为:BSMAP,版本:v2.74。其余参数为行业公知)。结果如表11所示。从表中数据可以发现,在大致相同的起始量下,本发明的比对率和错配率均优于试剂盒单链建库流程。在大致相同的测序数据量下,本发明与试剂盒单链建库流程覆盖率相差在1%以内。综合以上数据看,本发明具有比对率更高,错配率更低的优点。
表11单链建库WGBS数据分析对比
样本 |
本发明 |
现有单链建库 |
样本 |
转化后cfDNA |
转化后cfDNA |
建库起始量ng |
20 |
约20 |
测序平台 |
BGISEQ-500 |
HiSeq4000 |
测序策略 |
PE50 |
PE100 |
总数据量Gb |
15.47 |
16.21 |
比对率% |
93.93 |
86.48 |
唯一比对率% |
83.9 |
82.84 |
双链比对率% |
79.98 |
71.12 |
单链比对率% |
13.94 |
15.36 |
错配率% |
1.28 |
2.51 |
整体覆盖率% |
82.37 |
82.73 |
另外,发明人还将本发明与现有的一些建库技术进行了比较。本发明与现有的建库技术采用qPCR进行建库效率比较,在建库效率上均比已有的技术有所提高,如图6所示。图6是一个建库效率的相对定量方法,以本发明的连接产物作为对照,计算2-△CT作为建库效率,用于表示不同方法的优劣。
此外,本发明还采用了qPCR绝对定量的方法确定了本发明的分子利用率,并与相关技术进行了比较:使用两端具有已知引物序列的PCR产物进行文库构建,通过qPCR绝对定量计算接头连接产物拷贝数和未建库的模板拷贝数的比值,可用于反映分子的利用率。具体如下:①首先使用一段具有接头PCR引物结合区和下述已知序列PCR引物结合区的oligo进行标准曲线制作;②使用一段两端为8N并在8N前具有PCR引物结合位置的已知序列作为模板;在建库前取一部分进行建库,一部分不作处理;建库完成后取连接产物和未建库模板进行qPCR,测得建库前后的CT值;③将CT值代入标准曲线,计算出建库前后的绝对模板量,建库后模板量/建库前模板量即为本发明描述的分子利用率。经过比较,本发明的分子利用率可达到58.8%,较使用Circligase II酶建库方法的17%高。对于WGBS,采用本发明进行建库,20ng的cfDNA经过重亚硫酸盐处理平均回收率约80%左右(处理前使用Qubit dsDNA试剂进行定量,处理后使用Qubit ssDNA试剂进行定量,计算处理前后的比值即为本发明描述的重亚硫酸盐处理回收率),即采用本发明进行WGBS文库构建时,分子利用率:58.8%×80%=47.04%;而采用双链建库方法进行WGBS文库构建时,某商业试剂盒需要5μg全基因组DNA作为起始(该试剂盒1μg起始量建库时的转化效率约38%),完成建库后进行重亚硫酸盐处理,经过定量只有大约2.7%的有效文库剩余,即采用该商业试剂盒进行WGBS文库构建时,分子利用率:38%×2.7%=1.026%。采用本发明进行WGBS文库构建,起始量更低,分子利用率可以提高约45倍。
<110> 广州华大基因医学检验所有限公司;深圳华大基因股份有限公司;深圳华大临床检验中心;天津华大医学检验所有限公司
<120> 一种适用于单链DNA的高通量测序文库构建方法
<130> GNCLN1801723
<160> 7
<170> PatentIn version 3.5
<210> 1
<211> 10
<212> DNA
<213> Artificial sequence
<400> 1
aagtcggatc 10
<210> 2
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (13)..(18)
<223> n为a或t或c或g
<400> 2
acgatccgac ttnnnnnn 18
<210> 3
<211> 27
<212> DNA
<213> Artificial sequence
<400> 3
ttcctaagac cgcttggcct ccgactt 27
<210> 4
<211> 58
<212> DNA
<213> Artificial sequence
<400> 4
agtcggaggc caagcggtct taggaagaca atgaagcgtt gcaactcctt ggctcaca 58
<210> 5
<211> 25
<212> DNA
<213> Artificial sequence
<400> 5
gaacgacatg gctacgatcc gactt 25
<210> 6
<211> 17
<212> DNA
<213> Artificial sequence
<400> 6
tgtgagccaa ggagttg 17
<210> 7
<211> 25
<212> DNA
<213> Artificial sequence
<400> 7
gaacgacatg gctacgatcc gactt 25