CN116042767A

CN116042767A - 测序文库的构建方法及试剂盒

Info

Publication number: CN116042767A
Application number: CN202111266991.4A
Authority: CN
Inventors: 罗慧娟; 乔斯坦; 罗甜; 李南南; 曹博洋; 李甫强; 吴逵
Original assignee: BGI Shenzhen Co Ltd
Current assignee: BGI Shenzhen Co Ltd
Priority date: 2021-10-28
Filing date: 2021-10-28
Publication date: 2023-05-02

Abstract

本发明提供了一种测序文库的构建方法及试剂盒。其中，构建方法包括：采用双链泡状接头对单链DNA进行接头连接，双链泡状接头末端含有多个悬垂的随机碱基构成的随机核苷酸，随机核苷酸的至少一部分与单链DNA互补，从而将双链泡状接头与单链DNA进行连接，得到连接产物；对连接产物进行PCR扩增，得到测序文库。该方法在文库构建时不受起始DNA单双链以及片段大小的影响，使得DNA模板利用率提高，相比较于传统的建库方法，本发明提高了所构建文库中100bp以下的目标片段的比例。

Description

测序文库的构建方法及试剂盒

技术领域

本发明涉及测序文库构建领域，具体而言，涉及一种测序文库的构建方法及试剂盒。

背景技术

循环细胞游离DNA(cfDNA)分析目前广泛应用于产前诊断，而且在器官移植、自身免疫性疾病、创伤、心肌梗死和脓毒症等其他领域也具有潜在的临床应用前景。cfDNA浓度在癌症受试者中显著升高，且相当一部分cfDNA可能来源于肿瘤，这对患者提供了潜在的诊断和预后信息。因此，通过分析肿瘤患者血浆或血清中的cfDNA，可以以非侵入性的方式获得肿瘤细胞遗传和表观遗传学改变的特征。因此，对cf DNA进行分析，在临床中具有广泛的应用前景。

近年来的研究发现，cfDNA是一组具有高度多样化和降解性的分子。血液中大多数可检测到的cfDNA都有核小体足迹(约为10-bp周期性重复)，其中超小的cfDNA片段可能主要是由于血液循环中的一条或两条DNA链出现缺口而形成。这些缺口形成的DNA片段不能被传统的下一代测序(NGS)或聚合酶链反应(PCR)方法捕捉到，进而在标准的双链DNA文库制备操作流程中不易被检测到。

双链文库制备技术是最典型的用于cf DNA分析的建库制备技术，其容易操作而且耗时短，建库效率高。但是，由于技术上缺陷，它不能捕获到cfDNA分子中的短片段(尤其是小于100bp)的信息，从而丢失这份小片段上的重要信息。

单链文库制备可以绕过传统双链DNA文库的限制，可以恢复受损和短的单/双链DNA片段的信息。如Gansauge,M.-T.&Meyer,M.Single-stranded DNA librarypreparation for the sequencing of ancient or damaged DNA.Nat.Protoc.8,737–748(2013)报道。但是这种单链文库构建技术耗时长，且连接效率低下(连接效率仅为4％左右)。

发明内容

本发明的主要目的在于提供一种测序文库的构建方法及试剂盒，以解决现有技术中在文库构建时容易损失100bp以下的短片段的问题。

为了实现上述目的，根据本发明的一个方面，提供了一种测序文库的构建方法，该构建方法包括：采用双链泡状接头对单链DNA进行接头连接，双链泡状接头末端含有多个悬垂的随机碱基构成的随机核苷酸，随机核苷酸的至少一部分与单链DNA互补，从而将双链泡状接头与单链DNA进行连接，得到连接产物；对连接产物进行PCR扩增，得到测序文库。

进一步地，DNA为cfDNA，优选为孕妇、肿瘤患者或健康人的cfDNA。

进一步地，在对单链DNA进行接头连接之前，构建方法还包括对单链DNA进行5’磷酸化的步骤，优选采用T4 PNK进行5’磷酸化；优选地，在采用双链泡状接头对单链DNA进行接头连接之前，构建方法还包括将双链DNA变性获得单链DNA。

进一步地，采用双链泡状接头对单链DNA的3’端和5’端进行连接，优选地，对单链DNA先进行3’末端的连接，再进行5’末端的连接。

进一步地，双链泡状接头悬垂的随机碱基为3～6个；更优选地，双链泡状接头包括A接头和B接头，其中A接头由SEQ ID NO:1和SEQ ID NO:2退火而成，B接头由SEQ ID NO:3和SEQ ID NO:4退火而成；进一步优选地，A接头的工作浓度为1～2μmol/L，B接头的工作浓度为0.5～1μmol/L。

进一步地，采用T3 DNA连接酶进行接头连接；优选地，T3 DNA连接酶的工作浓度为4～12U/μL，进一步优选为6～10U/μL；优选地，T3 DNA连接酶的连接缓冲体系包括T4 DNA连接酶缓冲液，其中T4 DNA连接酶缓冲液中的盐离子工作浓度至少为5mM，如5mM～20mM优选为10mM；更优选为如下的10×T4 DNA连接酶缓冲液：pH 7.8 500mM Tris-HCl、100mM Mg²⁺、10mM ATP以及10mM DTT。

进一步地，连接缓冲体系还包括助剂，优选为PEG，更优选为PEG 4000-6000中的任意一种，更优选为PEG 4000。

进一步地，在对连接产物进行PCR扩增之前，构建方法还包括除去多余的未连接单链DNA的双链泡状接头的步骤，优选地，采用磁珠纯化的方式进行除去。

进一步地，对连接产物进行PCR扩增，得到测序文库包括：对连接产物进行PCR扩增，得到第一文库；将第一文库进行解链，得到单链文库；对单链文库环化得到单链环化文库，单链环化文库即为测序文库；优选地，采用文库扩增引物对连接产物进行PCR扩增，得到第一文库，更优选地，文库扩增引物为SEQ ID NO：5和SEQ ID NO：6所示的引物。

进一步地，对单链文库环化得到单链环化文库包括：在环化辅助序列和T4 DNA连接酶的作用下将单链文库连接成环，得到环化产物；对环化产物进行酶切以消化未连接成环的单链文库，得到单链环化文库；其中，环化辅助序列与单链文库中DNA两端的序列互补；优选地，环化辅助序列选自SEQ ID NO：7；更优选地，采用外切酶对环化产物进行酶切，优选外切酶选自Exo I酶和Exo III酶。

根据本发明的另一方面，提供了一种试剂盒，试剂盒包括5’端和3’端的双链泡状接头、接头连接试剂及如下任意一种或多种可选的试剂：文库扩增引物、单链环化相关试剂及5’端磷酸化酶；其中，双链泡状接头为末端带有多个悬垂的随机碱基构成的随机核苷酸双链泡状接头，

进一步地，5’端和3’端的双链泡状接头为A接头和B接头，A接头由SEQ ID NO:1和SEQ ID NO:2退火而成，B接头由SEQ ID NO:3和SEQ ID NO:4退火而成；更优选地，A接头的工作浓度为1～2μmol/L，B接头的工作浓度为0.5～1μmol/L；接头连接试剂包括连接酶、连接酶缓冲液及可选的助剂，优选连接酶为T3 DNA连接酶，进一步优选地，T3 DNA连接酶的工作浓度为4～8U/μL；优选地，连接酶缓冲液为T4 DNA连接酶缓冲液，其盐离子工作浓度至少为5mM，如5mM～20mM，优选为10mM；更优选为如下的10X T4 DNA连接酶缓冲液：500mM Tris-HCl(pH 7.8)、100mM Mg²⁺、10mM ATP及10mM DTT；优选地，可选的助剂为PEG，更优选为PEG4000-6000中的任意一种，进一步优选为PEG 4000；优选地，文库扩增引物选自SEQ ID NO：5和SEQ ID NO：6所示引物；优选地，单链环化相关试剂包括如下任意一种或多种：T4 DNA连接酶、环化辅助序列及外切酶；更优选地，环化辅助序列为SEQ ID NO：7：更优选地，外切酶选自：Exo I酶和Exo III酶；优选地，5’端磷酸化酶为T4 PNK。

应用本发明的技术方案，通过对单链DNA连接双链泡状接头以及PCR扩增接头连接产物，从而获得测序文库。由于单链DNA可以通过双链DNA变性而获得，因此本发明同样能够用于双链DNA建库，且双链DNA变性为单链后，能够实现同时对长短单链片段进文库构建，进而使得所构建的文库既能够覆盖小片段信息，也可覆盖大片的信息，尤其适合用于对游离DNA进行核酸组学检测。总之，本发明方法在文库构建时不受起始DNA单双链以及片段大小的影响，使得DNA模板利用率提高，相比较于传统的建库方法，本发明提高了所构建文库中100bp以下的目标片段的比例。

将传统双链泡状接头的末端改进为末端具有多个悬垂的随机碱基构成的随机核苷酸，因悬垂的随机核苷酸能够与单链DNA任意位置的碱基结合，因而在接头连接时有助于提高双链泡状接头与目标片段的结合能力，进而提高连接效率，从而进一步提高所构建文库中小于100bp的目标片段的比例。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1示出了根据本发明的优选实施例中测序文库构建的流程示意图；

图2示出了根据现有技术中的双链建库方法与本申请的方法对cfDNA进行建库得到的文库中小于100bp的片段的分布图。

图3示出了根据本发明的实施例3，用于文库构建的λ噬菌体基因组DNA的2100生物分析仪检测结果图。

图4示出了根据本发明的实施例3，通过T4 DNA连接酶连接后获得的连接产物，2100生物分析仪检测结果图。

图5示出了根据本发明的实施例3，通过T3 DNA连接酶连接后获得的连接产物，2100生物分析仪检测结果图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。

术语解释：

双链泡状接头：本申请中指应用于高通量测序平台的鼓泡状接头，传统的双链泡状接头包括一条核酸长链和一条核酸短链，两者形成两端序列互补、中间序列不互补而呈鼓泡状的杂交体，本申请中是指在传统双链泡状接头的结构基础上，其中一条链的末端带有多个悬垂的随机碱基构成的随机核苷酸。本申请中利用该随机核苷酸部分与单链DNA互补从而实现双链泡状接头与单链DNA的连接。

如背景技术所提到的，现有的文库构建方法所能捕获的目的片段的长度主要集中在100bp以上，而对小于100bp的片段的捕获效率较低。为了能更有效地对短片段进行捕获构建文库，本申请提出来一种新的改进方案，通过特殊处理的接头，连接变性后的单链DNA，进而通过PCR扩增富集即可得测序文库，也可以进一步PCR扩增富集产物进行单链环化，制备成环化的测序文库。且本申请的方案经实验验证对小片段的捕获效率有所提升。

基于上述研究结果，申请人提出了本申请的技术方案。在本申请一种典型的实施方式中，提供了一种测序文库构建方法，该构建方法包括：采用双链泡状接头对单链DNA进行接头连接，该双链泡状接头末端含有多个悬垂的随机碱基构成的随机核苷酸，随机核苷酸的至少一部分与单链DNA互补，从而将泡状接头与单链DNA进行连接，得到连接产物；对连接产物进行PCR扩增，得到测序文库。

该构建方法通过将具有泡状结构的双链接头连接到单链DNA上，然后经过PCR扩增富集连接产物，即可得到测序文库，由于连接的是单链DNA片段，并且双链泡状接头末端含有多个悬垂的随机碱基构成的随机核苷酸，该随机核苷酸能够与单链DNA的任意位置互补，因此无论单链DNA是长片段、还是小于100bp的短片段，均能有效地与双链泡状接头连接，所获得的文库能将所有长度的片段信息都覆盖到。即既可以覆盖小片段文库信息，也可以覆盖大片段文库信息，相比较于常规的文库构建方法，本发明方法提高了100bp以下的小片段的接头连接效率，是一项可靠的用于检测游离DNA核酸组学的手段。

双链泡状接头，如图1中的泡状接头结构所示，两端是互补双链结构，中间有一段不互补双链结构。

此外需要说明的是，上述对连接产物进行PCR扩增的步骤中，不需要使用带修饰的引物，比如，无需进行硫代磷酸化修饰，或biotin修饰等，因而建库操作更简单，成本也更低。

在一种优选的实施例中，上述双链DNA为游离DNA(即cfDNA)，由于cfDNA中的DNA存在不同的大小分布，可能存在单链DNA，也可能存在100bp以下的小片段，采用本申请的上述建库方法，能够充分利用各种不同长度的单链DNA片段，使得所构建的文库的信息相对更全面。具体来源包括但不限于健康人(此处的健康人不包括孕妇)、孕妇和/或肿瘤患者的cfDNA。

由于目前大多数文库构建时存在物理打断成小片段的步骤(cfDNA不需要打断)，打断后的DNA片段需要进行5’磷酸化修饰的步骤。为进一步提高后续接头连接效率，在一种优选的实施例中，本申请的构建方法在对单链DNA进行接头连接之前，还包括对单链DNA进行5’磷酸化修饰的步骤，优选采用T4 PNK进行5’磷酸化。5’磷酸化是DNA片段之间连接所需要的，为避免有些DNA片段在5’端缺少磷酸化而难以实现接头连接，因而在接头连接之前，先进行单链DNA片段5’磷酸化修饰，使更多的单链DNA片段实现与接头的连接，从而提高建库的模板利用率。

如前述，由于单链DNA可以是待测样本特定状态下自身存在的单链DNA，也可以是由双链DNA变性处理得到，因而无论待建库所用的待测样本中DNA的存在形态是单链还是双链，采用本申请的文库构建方法均能实现建库，因而相对传统的建库方法，大大提高了模板利用率。

上述接头连接的步骤中，双链泡状接头末端的多个悬垂的随机碱基有助于提高接头与单链DNA的连接效率。其中，在一种优选的实施例中，随机碱基的数目可以为3～6个，比如可以是3、4、5或6个。两端的双链泡状接头中，随机碱基的数目可以相同，也可以不同。

对两端的接头进行连接的步骤中，可以对两端同时进行连接，也可以分步连接。同时连接会存在一定程度的接头自连现象，而影响连接效率。因而，在本申请一种优选的实施例中，先进行3’末端的连接，然后再进行5’末端的连接。对两端分步进行连接，有助于提高双链泡状结构的连接成功率和连接效率。通过将双链DNA变性成单链DNA后，再进行双链泡状接头的连接，有助于充分利用短片段，提高100bp以下的短片段的连接效率。这样的建库方法能够实现对不同大小片段的全覆盖。

具体的双链泡状接头的具体序列不限，可以是在MGI测序平台现有的双链泡状接头的基础上，进一步对具有泡状结构的单链增加末端悬垂的随机碱基得到。在一种优选的实施例中，具有末端悬垂的随机碱基双链泡状接头包括A接头和B接头，A接头为A1链和A2链退火而成，泡状结构位于A1链上，且A1链的3’末端具有多个悬垂的随机碱基；B接头为B1链和B2链退火而成，泡状结构位于B1链上，B1链的5’末端具有多个悬垂的随机碱基。

双链泡状接头的具体长度也可以通过合理调整得到。在一种优选的实施例中，A1链的长度为39～48bp，比如可以是39、40、41、42、43、44、45、46、47或48bp。优选地，A1链的3’末端具有1～10个悬垂的随机碱基，更优选3～6个悬垂的随机碱基。具体可以是1、2、3、4、5、6、7、8、9或10个，可以根据需要合理设置具体数目。相应地，A1链的长度也无特别限定，只要能与A1链部分互补形成中间鼓泡、两端存在互补配对区的接头即可。优选地，A2链的长度为50～60bp，比如可以是50、51、52、53、54、55、56、57、58、59或60bp。在该长度范围内，不仅泡状接头中泡状结构两端的互补配对区的长度可以相对较长，使得结构更稳定，进而使接头的连接效率也相对更高。

类似地，B1链和B2链的长度的设置也是类似的原则。在一种优选实施例中，B1链的长度为50～70bp，比如，可以是50、51、52、3、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70bp。其末端悬垂的碱基数目也无特殊限制，根据需要合理设置。优选地，B1链的5’末端具有1～10个，优选3～6个悬垂的随机碱基。比如，可以是1、2、3、4、5、6、7、8、9或10个。在一种优选实施例中，B2链的长度为30～40bp；比如，可以是30、31、32、33、34、35、36、37、38、39或40bp。

在一种优选的实施例中，A接头由SEQ ID NO:1和SEQ ID NO:2退火而成，B接头由SEQ ID NO:3和SEQ ID NO:4退火而成。进一步优选地，A接头的工作浓度为1～2μmol/L，B接头的工作浓度为0.5～1μmol/L，A接头和B接头分别在上述浓度范围内进行连接时，连接效率相对更高。

在依次对单链DNA的3’端和5’端进行接头连接时，由于本申请的目的片段是单链DNA片段，接头是双链的，因而任何能够促进单链DNA与双链DNA进行连接的连接酶均适用于本申请，即本申请中优选采用兼具连接单链和双链的功能的连接酶进行接头连接。在一种优选的实施例中，连接酶为T3 DNA连接酶；更优选地，该连接酶的工作浓度为4～12U/μL，进一步优选为6～10U/μL。

本申请发明人经测试发现：在使用T3 DNA连接酶进行单链DNA与上述双链泡状接头连接时，采用T4 DNA连接酶缓冲液比T3 DNA连接酶缓冲液连接效率和特异性均更好，T4DNA连接酶缓冲液中盐离子强度更高，更适合用于末端带有多个悬垂随机核苷酸的接头的退火连接。此外，由于T3 DNA连接酶具有更高的耐盐性，因此采用盐离子强度更高的T4DNA连接酶缓冲液进行连接，效果更好。并且，本申请发明人经测试进一步发现，在连接单链DNA与双链泡状接头时，采用“T3 DNA连接酶+T4 DNA连接酶缓冲液+PEG4000”的组合，连接效果最好。

因而，在一种优选的实施例中，接头连接步骤中，除了连接酶外，还包括连接缓冲体系，连接缓冲体系包括连接酶缓冲液，优选为T4 DNA连接酶缓冲液，所述T4 DNA连接酶缓冲液中的盐离子工作浓度至少为5mM，如5mM～20mM，可以是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20mM；优选为10mM。

在一种优选的实施例中，T4连接酶缓冲液为10×T4 DNA连接酶缓冲液，其组分为：500mM Tris-HCl(pH 7.8)、100mM Mg²⁺、10mM ATP及10mM DTT。

在一种优选的实施例中，连接缓冲体系进一步包括助剂，优选为PEG，更优选为PEG4000-6000中的任意一种，进一步优选为PEG 4000。

在一优选的实施例中，在对连接产物进行PCR扩增之前，该构建方法还包括去除多余的未连接单链DNA的双链泡状接头的步骤，更优选采用磁珠纯化的方式进行去除，从而获得连接有双端接头的单链DNA，进而利用文库扩增引物进行富集，或进一步单链环化，即可获得所需测序文库。

本申请的建库方法中，通过在单链DNA两端分别连接双链泡状接头后，直接对连接产物进行PCR扩增来得到所需文库。而现有技术中，在采用双链接头与单链DNA连接时，有的是通过延伸成双链DNA后，再通过平末端连接另一端的双端接头，并通过修饰的扩增引物对连接产物进行扩增，该方法一方面平末端连接效率低，另一方面利用修饰的引物进行扩增成本高。也有报道通过PCR的方法引入双链接头，由于PCR本身存在一定的扩增错误率，因而与本申请通过连接的方式引入双端接头相比，所建文库的准确性相对较低。

在一种优选的实施例中，对连接产物进行PCR扩增，得到测序文库包括：对连接产物进行PCR扩增，得到第一文库；将第一文库进行解链，得到单链文库；对单链文库环化得到单链环化文库，单链环化文库即为测序文库。

对连接产物进行PCR扩增的步骤中，采用文库扩增引物对连接产物进行PCR扩增，得到第一文库。具体的文库扩增引物按照常规的文库构建流程进行设计即可(比如，至少部分序列与接头上的部分序列重叠)。更优选地，该文库扩增引物选自如下引物：引物1：SEQID NO：5：5’-GAACGACATGGCTACGA-3’；引物2：SEQ ID NO：6：5’-TGTGAGCCAAGGAGTTG-3’。

根据上述文库扩增所用扩增引物与测序平台的匹配性，如果上述PCR扩增富集后的文库与测序平台匹配，则可以直接进行上机测序。在本申请一种优选的实施例中，在得到上述富集的双链文库后，还包括将其进一步制备成与MGI测序平台相匹配的单链环化文库。其具体制备步骤可参考MGI测序平台的文库构建步骤进行操作。

在本申请一种优选的实施例中，对单链文库环化得到单链环化文库包括：在环化辅助序列和T4 DNA连接酶的作用下将单链文库连接成环，得到环化产物；对环化产物进行酶切以消化未连接成环的单链文库，得到单链环化文库；其中，环化辅助序列与单链文库中DNA两端的序列互补；优选地，环化辅助序列选自SEQ ID NO：7：5’-GCCATGTCGTTCTGTGAGCCAAGG-3’；更优选地，采用外切酶对环化产物进行酶切，进一步优选外切酶选自Exo I酶和Exo III酶。

在本申请另一种典型的实施方式中，提供了一种试剂盒，该试剂盒包括用于构建上述文库的一种或多种相关试剂，比如，包括用于文库构建的5’端和3’端的双链泡状接头、接头连接试剂及如下任意一种或多种可选的试剂：文库扩增引物、单链环化相关试剂及5’端磷酸化酶；其中，双链泡状接头为末端带有多个悬垂的随机碱基构成的随机核苷酸双链泡状接头，优选5’端和3’端的双链泡状接头为A接头和B接头，A接头由SEQ ID NO:1和SEQID NO:2退火而成，B接头由SEQ ID NO:3和SEQ ID NO:4退火而成；更优选地，接头A的工作浓度为1～2μmol/L，接头B的工作浓度为0.5～1μmol/L；接头连接试剂包括连接酶、连接酶缓冲液及可选的助剂，优选连接酶为T3 DNA连接酶，进一步优选地，T3 DNA连接酶的工作浓度为4～8U/μL；优选地，连接酶缓冲液为T4 DNA连接酶缓冲液，其盐离子工作浓度至少为5mM，如5mM～20mM，优选为10mM；更优选为如下的10X T4 DNA连接酶缓冲液：500mM Tris-HCl(pH 7.8)、100mM Mg²⁺、10mM ATP及10mM DTT；优选地，可选的助剂为PEG，更优选为PEG4000-6000中的任意一种，进一步优选为PEG 4000；优选地，文库扩增引物选自SEQ ID NO：5和SEQ ID NO：6所示引物；优选地，单链环化相关试剂包括如下任意一种或多种：T4 DNA连接酶、环化辅助序列及外切酶；更优选地，环化辅助序列为SEQ ID NO：7：更优选地，外切酶选自：Exo I酶和Exo III酶；优选地，5’端磷酸化酶为T4 PNK。

上述试剂盒中的双链泡状接头中悬垂的随机碱基能够与单链DNA任意位置的碱基结合，因而包含该接头的试剂盒，在接头连接时有助于提高接头与不同长度的片段的结合能力，此外配合能够促进单链和双链DNA连接的连接相关试剂，进而提高单链DNA与双链泡状接头的连接效率，实现了同时对单链长短片段进行文库构建，更重要的是，提高所构建文库中小于100bp的目标片段的比例。

下面将结合具体的实施例来进一步说明本申请的有益效果。主要以cfDNA 100bp以下的短片段的文库构建为例进行说明。

以下实施例的主要流程如图1所示：先将cf DNA变性成单链，然后再在两端加上带有随机序列的接头(N为A、T、C或G中任一种)，接着进行PCR扩增，最后将PCR产物环化成单链环用以MGI-SEQ平台测序。具体由以下五部分组成：cf DNA前处理、接头连接、PCR扩增、单链环化及上机测序及数据分析。

实施例1

本实施例中，10X T4连接酶缓冲液成分为：500mM Tris-HCl(pH 7.8)、100mM Mg²⁺、10mM ATP及10mM DTT。未给出来源的其他试剂均为本领域常规的试剂，通过商业化购买即可获得。

步骤一、cf DNA前处理：

通过高温处理，将cfDNA变性成单链，然后进行5’端磷酸化处理。具体为：

取10ng cfDNA(来源于肿瘤患者血浆)，加去离子水到20μL，混匀后，95℃反应3分钟立马至于冰盒上，放置2分钟。然后依次加入以下试剂：

表1：

10x T4连接酶缓冲液	3μL
		T4 PNK	0.6μL
<![CDATA[H<sub>2</sub>O]]>	6.4μL
		共计	10μL

混匀后，37℃反应15分钟，95℃反应3分钟，反应完毕立马置于冰上2分钟。

步骤二、接头连接：

对磷酸化处理后的单链DNA在可以连接单双链的连接酶作用下在其两端加入特殊处理过的接头。具体为：

等上一步反应产物冷却后，依次加入以下试剂：

表2：

上一步得到的DNA混合物	30μL
		接头A(25μM)	3μL
10X T4连接酶缓冲液	2μL
		PEG4000	5μL
T3 DNA连接酶(300U/μL)	1μL
		<![CDATA[H<sub>2</sub>O]]>	9μL
共计	50μL

混匀后，23℃反应60分钟。反应完毕后，用0.8X AMPure beads对连接产物进行纯化，然后回溶于22μL去离子水中，再依次加入以下试剂进行另外一端接头连接：

表3：

上一步得到的DNA	20μL
		接头B(50μM)	0.4μL
10X T4连接酶缓冲液	3μL
		PEG4000	3μL
T3 DNA连接酶(300U/μL)	1μL
		<![CDATA[H<sub>2</sub>O]]>	2.6μL
共计	30μL

混匀后，23℃反应60分钟，然后再用0.8X AMPure beads对连接产物进行纯化，最后溶于24μL去离子水中。

三、PCR扩增

对加入已知接头序列的模板进行PCR扩增。具体在上一步得到的产物中依次加入以下试剂：

表4：

混匀后，按照以下程序进行反应：

表5：

反应完后，加入用1.0倍XP磁珠对反应物进行纯化，再回溶于23μL去离子水中。然后采用Qubit(Invitrogen)进行浓度检测。

四、单链环化

扩增产物经过磁珠纯化后，高温变性成单链，在Ad153 splint oligo，T4 DNA连接酶以及ATP作用下使单链成环。环化产物经过Exo I和Exo III作用下，得到可以上机测序的单链环状文库。

(1)热变性：

取上述产物170ng，加水补足48.2μL体系，混匀后95℃反应5分钟，然后立即置于4℃。依次加入以下试剂：

表6：

10x TA缓冲液	6	μL
			0.1M ATP	0.6	μL
20μM Ad153 splint oligo	5	μL
			T4 DNA连接酶(600U/μL)	0.2	μL
共计	11.8	μL

混匀后，37℃反应30分钟。

(2)Exo I和Exo III酶切：

上述反应结束后，依次加入以下试剂：

表7：

10×TA缓冲液	0.4	μL
			20U/μL Exo I	1.95	μL
200U/μL Exo III	0.65	μL
			<![CDATA[H<sub>2</sub>O]]>	0.65	μL
共计	4	μL

混匀后，37℃反应30分钟。然后用2.5倍XP磁珠进行纯化回收，溶于去离子水中。

前述步骤中的接头、引物的序列信息如下：

表8：

五、测序及数据分析：

将单链环状文库于MGI-seq测序平台中进行双末端测序，根据测序仪操作说明进行，获得下机测序数据，然后通过数据分析比较得到cf DNA小片段分布情况。其中，分析数据时参考的序列为hg19(已知的全基因组序列)，先后经过滤、比对、片段分布分析等步骤。

实施例2

本例为对比例，采用常规的泡状接头连接双链cf DNA的方式进行文库构建，具体地使用现有商业试剂盒(MGIEasy通用DNA文库制备试剂套装)对血浆样本按照试剂盒说明书要求进行建库并获得测序文库，最后参照实施例1步骤五进行测序与数据分析。

数据结果：

实施例1与实施例2的数据经过比对后统计，样本中小于100bp的片段分布占比，如图2所示，横坐标是0～100bp插入片段分布，纵坐标是不同插入片段的占比，虚线部分显示的是实施例1(本申请方法，也称单链法)的结果，实线部分显示的是实施例2(常规方法，也称双链法)的结果。从图2上可以看出，在小于100bp的片段分布图中，单链法得到的小于100bp的插入片段占比明显高于双链法得到的小片段占比。

实施例3

样本：λ噬菌体基因组DNA，使用2100生物分析仪确定其片段大小分布，结果如图3。

λ噬菌体基因组DNA分成2组，分别进行文库构建，构建方法参见实施例1，不同的是接头连接步骤中的连接反应条件，具体如下：

表9：

	条件1	条件2
			上一步得到的DNA混合物	30μL	30μL
接头A(25μM)	3μL	3μL
			10X T4连接酶缓冲液	2μL	2μL
PEG4000	5μL	5μL
			T3 DNA连接酶(300U/μL)	1μL	/
T4 DNA连接酶	/	1μL
			<![CDATA[H<sub>2</sub>O]]>	9μL	9μL
共计	50μL	50μL

条件1：T3 DNA连接酶+T4 DNA连接酶缓冲液+PEG 4000。

条件2：T4 DNA连接酶+T4 DNA连接酶缓冲液+PEG 4000。

其中，10X T4连接酶缓冲液成分为：500mM Tris-HCl(pH 7.8)、100mM Mg²⁺、10mMATP及10mM DTT。条件1的检测结果如图4所示，条件2的检测结果如图5所示。对比图4和图5的2100结果图可以看出，建库前插入片段主峰在70bp左右(图3)，建库完成后主峰应该在150bp左右，图4的2100结果可以明显看到154bpd的主峰，而图5的2100结果显示存在大量的接头、引物自连产物，这说明T3 DNA连接酶作用下的连接效率和得到的连接产物的量远高于T4 DNA连接酶的相应结果。

从以上的描述可见，本申请的方法能够突破传统双链DNA文库对小片段文库的限制，能够提高受损和短的单/双链DNA片段的利用率，从而提高所构建的文库中小片段的比例，从而解决了传统双链建库的弊端。同时本申请还具有实验操作简单及周期短的优点。因此，本发明是一项可靠的用于制备cf DNA文库的全基因组检测技术。此外，本申请除了适用于血浆游离DNA的文库构建及测序检测外，也可应用于其他任何需要进行单链文库构建的样本类型。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

序列表

<110> 深圳华大生命科学研究院

<120> 测序文库的构建方法及试剂盒

<130> PN146430HDSM

<160> 7

<170> SIPOSequenceListing 1.0

<210> 1

<211> 42

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(42)

<223> A接头_下

<220>

<221> misc_feature

<222> (39)..(42)

<223> 随机碱基，n为A、T、C或G

<400> 1

ttgtcttcct aaggaacgac atggctacga tccgacttnn nn 42

<210> 2

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(59)

<223> A接头_上

<400> 2

agtcggaggc caagcggtct taggaagagc aatgtcataa atcaactcct tggctcaca 59

<210> 3

<211> 63

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(63)

<223> B接头_下

<220>

<221> misc_feature

<222> (1)..(4)

<223> 随机碱基，n选自A、T、C或G

<400> 3

nnnnagtcgg aggccaagcg gtcttaggaa gagcaatgtc ataaatcaac tccttggctc 60

aca 63

<210> 4

<211> 38

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(38)

<223> B接头_上（top）

<400> 4

ttgtcttcct aagggaacca catggctacg atccgact 38

<210> 5

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(17)

<223> Ad153_PCR2_1

<400> 5

gaacgacatg gctacga 17

<210> 6

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(17)

<223> Ad153_PCR2_2

<400> 6

tgtgagccaa ggagttg 17

<210> 7

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(24)

<223> Ad153_Spint oligo

<400> 7

gccatgtcgt tctgtgagcc aagg 24

Claims

1.一种测序文库的构建方法，其特征在于，所述构建方法包括：

采用双链泡状接头对单链DNA进行接头连接，所述双链泡状接头末端含有多个悬垂的随机碱基构成的随机核苷酸，所述随机核苷酸的至少一部分与所述单链DNA互补，从而将所述双链泡状接头与所述单链DNA进行连接，得到连接产物；

对所述连接产物进行PCR扩增，得到所述测序文库。

2.根据权利要求1所述的构建方法，其特征在于，所述DNA为cfDNA，优选为孕妇、肿瘤患者或健康人的cfDNA。

3.根据权利要求1所述的构建方法，其特征在于，在对所述单链DNA进行接头连接之前，所述构建方法还包括对所述单链DNA进行5’磷酸化的步骤，优选采用T4 PNK进行所述5’磷酸化；

优选地，在采用双链泡状接头对单链DNA进行接头连接之前，所述构建方法还包括将双链DNA变性获得所述单链DNA。

4.根据权利要求1所述的构建方法，其特征在于，采用所述双链泡状接头对所述单链DNA的3’端和5’端进行连接，

优选地，对所述单链DNA先进行3’末端的连接，再进行5’末端的连接。

5.根据权利要求4所述的构建方法，其特征在于，所述双链泡状接头悬垂的随机碱基为3～6个；

更优选地，所述双链泡状接头包括A接头和B接头，其中所述A接头由SEQ ID NO:1和SEQID NO:2退火而成，所述B接头由SEQ ID NO:3和SEQ ID NO:4退火而成；

进一步优选地，所述A接头的工作浓度为1～2μmol/L，所述B接头的工作浓度为0.5～1μmol/L。

6.根据权利要求1所述的构建方法，其特征在于，采用T3 DNA连接酶进行所述接头连接；

优选地，所述T3 DNA连接酶的工作浓度为4～12U/μL，进一步优选为6～10U/μL；

优选地，所述T3 DNA连接酶的连接缓冲体系包括T4 DNA连接酶缓冲液，所述T4 DNA连接酶缓冲液中的盐离子工作浓度为5mM～20mM，优选为10mM；

更优选地，所述T4 DNA连接酶缓冲液为10×T4 DNA连接酶缓冲液，所述10×T4 DNA连接酶缓冲液的组分包含：pH 7.8 500mM Tris-HCl、100mM Mg²⁺、10mM ATP以及10mM DTT；

优选地，所述连接缓冲体系还包括PEG，优选所述PEG选自PEG 4000-6000中的任意一种，更优选为PEG 4000。

7.根据权利要求1至6中任一项所述的构建方法，其特征在于，在对所述连接产物进行PCR扩增之前，所述构建方法还包括除去多余的未连接所述单链DNA的所述双链泡状接头的步骤，

优选地，采用磁珠纯化的方式进行除去。

8.根据权利要求7所述的构建方法，其特征在于，对所述连接产物进行PCR扩增，得到所述测序文库包括：

对所述连接产物进行PCR扩增，得到第一文库；

将所述第一文库进行解链，得到单链文库；

对所述单链文库环化得到单链环化文库，所述单链环化文库即为所述测序文库；

优选地，采用文库扩增引物对所述连接产物进行PCR扩增，得到所述第一文库，更优选地，所述文库扩增引物为SEQ ID NO：5和SEQ ID NO：6所示的引物。

9.根据权利要求8所述的构建方法，其特征在于，对所述单链文库环化得到单链环化文库包括：

在环化辅助序列和T4 DNA连接酶的作用下将所述单链文库连接成环，得到环化产物；

对所述环化产物进行酶切以消化未连接成环的单链文库，得到所述单链环化文库；

其中，所述环化辅助序列与所述单链文库中DNA两端的序列互补；

优选地，所述环化辅助序列选自SEQ ID NO：7；

更优选地，采用外切酶对所述环化产物进行酶切，优选所述外切酶选自Exo I酶和ExoIII酶。

10.一种试剂盒，其特征在于，所述试剂盒包括5’端和3’端的双链泡状接头、接头连接试剂及如下任意一种或多种可选的试剂：文库扩增引物、单链环化相关试剂及5’端磷酸化酶；

其中，所述双链泡状接头为末端带有多个悬垂的随机碱基构成的随机核苷酸双链泡状接头，优选5’端和3’端的所述双链泡状接头为A接头和B接头，所述A接头由SEQ ID NO:1和SEQ ID NO:2退火而成，所述B接头由SEQ ID NO:3和SEQ ID NO:4退火而成；更优选地，所述A接头的工作浓度为1～2μmol/L，所述B接头的工作浓度为0.5～1μmol/L；

所述接头连接试剂包括连接酶、连接酶缓冲液及可选的助剂，优选所述连接酶为T3DNA连接酶，进一步优选地，所述T3 DNA连接酶的工作浓度为4～8U/μL；

优选地，所述连接酶缓冲液为T4 DNA连接酶缓冲液，所述T4 DNA连接酶缓冲液中的盐离子工作浓度为5mM～20mM，优选为10mM；

优选地，所述可选的助剂为PEG，优选所述PEG选自PEG 4000-6000中的任意一种，更优选为PEG 4000；

优选地，所述文库扩增引物选自SEQ ID NO：5和SEQ ID NO：6所示引物；

优选地，所述单链环化相关试剂包括如下任意一种或多种：T4 DNA连接酶、环化辅助序列及外切酶；更优选地，所述环化辅助序列为SEQ ID NO：7：更优选地，所述外切酶选自：ExoI酶和Exo III酶；优选地，所述5’端磷酸化酶为T4PNK。