CN113728112A

CN113728112A - 使用酶促消化来富集信息性dna片段的文库制备方法

Info

Publication number: CN113728112A
Application number: CN202080031352.7A
Authority: CN
Inventors: 倪晓晖; 向红·婕思敏·周; 曾卫华; 玛丽·路易莎·斯塔克波尔
Original assignee: Early Diagnosis Co ltd; University of California
Current assignee: Early Diagnosis Co ltd; University of California
Priority date: 2019-04-28
Filing date: 2020-04-28
Publication date: 2021-11-30
Also published as: GB2596982B; EP3963093A1; GB202115099D0; AU2020265583A1; CA3136011A1; EP3963093A4; JP2022530289A; GB2596982A; US20220177874A1; WO2020223250A1

Abstract

本公开内容提供了用于制备核酸文库的方法和组合物。在一些实施方案中，核酸包含需要分析(例如通过测序)的无细胞DNA，包括cfDNA。所述方法可包括限制酶消化、衔接子连接和后续扩增，并且可提供用于在所述方法期间降低所产生的衔接子二聚体数目的改进方法。在一个方面中，用于制备核酸文库的方法可包括：用限制酶消化DNA分子以产生DNA片段；通过与连接酶一起孵育来将衔接子与DNA片段连接，以产生经衔接子连接的DNA片段和衔接子二聚体的混合物；扩增经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段；以及通过区分衔接子与DNA片段之间的连接和衔接子与另一衔接子之间的连接来降低衔接子二聚体的数量。

Description

使用酶促消化来富集信息性DNA片段的文库制备方法

交叉引用

本申请要求于2019年4月28日提交的美国临时专利申请No.62/839,719的权益，其通过引用整体并入本文。

技术领域

本公开内容的一些实施方案至少包括核酸制备和分析、测序、分子生物学、细胞生物学和医学的领域。

背景技术

随着下一代测序(next generation sequencing，NGS)技术的快速发展，对脱氧核糖核酸(DNA)中基因组改变的分析已成为提供关于疾病(例如癌症)或其他健康(例如母体血液中的胎儿遗传物质)状态的诊断信息的常规分析。典型的测序文库制备技术可包括一种或更多种操作，例如DNA片段化、片段的末端修复、dA加尾、衔接子连接和聚合酶链反应(polymerase chain reaction，PCR)富集，以及一个或更多个纯化步骤。

某些健康病症例如癌症或感染性疾病可导致DNA释放到血流或淋巴系统中，其中肿瘤DNA或微生物组DNA可成为体液例如血浆或尿中的循环无细胞DNA(cell-free DNA，cfDNA)的一部分。可使这样的cfDNA进行基因组或表观基因组学谱分析以用于临床应用，例如癌症筛选、微生物检测或产前测试。例如，全基因组亚硫酸氢盐测序(whole-genomebisulfite sequencing，WGBS)可提供DNA甲基化组的全面视图，但对整个基因组进行深度测序可能是昂贵的。富集无细胞DNA的信息性区域的方法可有利地允许针对临床诊断应用进行基因组或表观基因组学谱分析。使用限制酶、成簇规律间隔短回文重复序列(clustered regularly interspaced short palindromic repeat，CRISPR)、转座酶或其他技术可以以可通过尺寸选择来富集信息性片段的方式将完整DNA片段化。例如，MspI酶消化可通过产生可用于甲基化谱分析的较小片段来富集富CpG区域。

无细胞DNA的可在约166个碱基对(base pair，bp)处表现出特征峰的片段化性质对典型的基于限制酶消化的富集方法提出了挑战。选择信息性DNA的任何尺寸选择方法均可选择所有或几乎所有的cfDNA群并因此导致低富集。

本公开内容提供了对用于核酸文库制备的方法和组合物的改进。

发明概述

本公开内容提供了使用限制酶和衔接子制备核酸文库的方法，其中这样的制备方法代表了技术上的改进。在一些实施方案中，该方法包括具有降低的衔接子二聚体水平的文库制备。一旦制备，核酸文库就可用于任何目的，例如包括用于下一代测序。在一些实施方案中，本公开内容涉及从信息性脱氧核糖核酸(DNA)片段制备文库的方法，所述DNA片段的序列、修饰状态和/或水平指示医学病症或其风险或其易感性。本文中使用的“信息性片段”是指通过用限制酶进行切割而产生的片段(例如，在MspI限制酶消化之后的多个CpG位点)。核酸可以是任何种类，但在一些实施方案中，核酸包含DNA，包括无细胞DNA(cfDNA)。在一些实施方案中，文库用于cfDNA的甲基化谱分析。

在一个方面中，本公开内容提供了用于制备(例如，来自对象的多种脱氧核糖核酸(DNA)分子的)核酸的文库(例如，出于分析包括通过测序的目的)的方法，其包括：使多个DNA分子发生酶促消化以将所述DNA分子的至少一个子集片段化以产生在一个或两个末端具有突出端的DNA片段；将衔接子与与DNA片段的突出端互补的突出端连接以产生多个经标记的DNA分子；在降低衔接子二聚体的数目之前或之后富集多个经标记的DNA分子(其在本文中可称为经衔接子连接的DNA分子或片段)；以及任选地使多个经标记的DNA分子或其衍生物进行核酸测序以产生多个序列读出。

在一些实施方案中，在连接衔接子期间和/或之后，使用限制酶例如BspDI、ClaI、AclI、NarI、Xhol、SmlI、HpyF30I、PaeR71、Sfr274I或其组合来消化衔接子二聚体。在一些实施方案中，使用以下在同一反应中进行发生和连接步骤：(1)一种或更多种限制酶，例如MspI和/或HpaII和/或Taqα1，以及(2)连接酶，例如T7和/或T4连接酶。在一些实施方案中，使用以下在同一反应中进行发生、连接和降低步骤：(1)一种或更多种限制酶，例如MspI和/或HpaII、和/或TaqαI、和/或BspD1、和/或ClaI、和/或AclI、和/或NarI、和/或XhoI、和/或SmlI、和/或HpyF30I、和/或PaeR7I、和/或Sfr274I，以及(2)连接酶，例如T7和/或T4连接酶。在一些实施方案中，多个经标记DNA的富集包括扩增步骤，例如用聚合酶链反应(PCR)进行的扩增步骤。在一些实施方案中，多个经标记DNA的富集包括靶向捕获。在一些实施方案中，多个经标记DNA发生亚硫酸氢盐转化。在一些实施方案中，用于PCR的引物被设计为识别衔接子与靶DNA之间的连接，但不识别衔接子与衔接子之间的连接。

在一个方面中，本公开内容提供了用于从对象的多个cfDNA分子中富集多个DNA片段的方法，其包括：使多个cfDNA分子发生酶促消化以将cfDNA分子的至少一个子集片段化以产生包含一个或更多个目的区域的片段；将衔接子与与多个片段化cfDNA分子的突出端互补的突出端连接以提供多个经标记的DNA分子；降低衔接子二聚体的数目；任选地使多个经标记的DNA分子或其衍生物进行核酸测序以产生多个序列读出；以及处理多个序列读出以提供一种或更多种临床应用。

在另一个方面中，本公开内容提供了用于制备核酸文库的方法，其包括：(a)提供多个DNA分子；(b)用第一一种或更多种限制酶使所述分子发生消化，其中所述发生产生了DNA片段；(c)使DNA片段经受(例如，连接)衔接子，其中所述经受产生了经衔接子连接的DNA片段和衔接子二聚体的混合物；以及(d)扩增经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段，其中任选地在一些实施方案中该方法还包括以相同操作进行(b)和(c)，其中该方法还包括降低所产生的衔接子二聚体，其中该降低在(c)期间或之后和/或在(d)之后进行，其中该降低包括区分衔接子与DNA片段之间的连接和衔接子与另一衔接子之间的连接。

在另一个方面中，本公开内容提供了用于制备核酸文库的方法，其包括：(a)提供多个DNA分子；(b)用第一一种或更多种限制酶使所述分子发生消化，其中所述发生产生了DNA片段；(c)使DNA片段经受(例如，连接)衔接子，其中所述经受产生了经衔接子连接的DNA片段和衔接子二聚体的混合物；以及(d)扩增经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段，进行以下中的一项或更多项：(1)使用结合DNA片段的末端与衔接子之间的连接但不结合一个衔接子的末端与另一衔接子的末端之间的连接的引物进行(d)；(2)使经衔接子连接的DNA片段和衔接子二聚体的混合物经受第二一种或更多种限制酶，所述第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化DNA片段的末端与衔接子之间的连接；(3)在存在第二一种或更多种限制酶的情况下在与(c)相同的反应中进行(b)，所述第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化DNA片段的末端与衔接子之间的连接；(4)衔接子是经设计的衔接子二聚体，并且第三一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化DNA片段的末端与衔接子之间的连接；和/或(5)扩增还产生扩增的衔接子二聚体，其用第四一种或更多种限制酶消化，所述第四一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接。

在一些实施方案中，使多个cfDNA分子发生酶促消化包括用一种或更多种限制酶对多个无细胞DNA分子进行消化。在一些实施方案中，该方法利用选自以下的一种或更多种限制酶：

AcII，HindIII，MluCI，PciI，AgeI，BspMI，BfuAI，SexAI，MluI，BceAI，HpyCH4IV，HpyCH4III，BaeI，BsaXI，AflIII，SpeI，BsrI，BmrI，BglII，BspDI，PI-SceI，NsiI，AseI，CspCI，MfeI，BssS^αI，DraIII，EcoP15I，AlwNI，BtsIMutI，NdeI，CviAII，FatI，NlaIII，FspEI，XcmI，BstXI，PflMI，BccI，NcoI，BseYI，FauI，TspMI，XmaI，LpnPI，

AclI，ClaI，SacII，HpaII，MspI，ScrFI，StyD4I，BsaJI，BslI，BtgI，NciI，AvrII，MnlI，BbvCI，SbfI，Bpu10I，Bsu36I，EcoNI，HpyAV，BstNI，PspGI，StyI，BcgI，PvuI，EagI，RsrII，BsiEI，BsiWI，BsmBI，Hpy99I，AbaSI，MspJI，SgrAI，BfaI，BspCNI，XhoI，PaeR7I，EarI，AcuI，PstI，BpmI，DdeI，SfcI，AflII，BpuEI，SmlI，AvaI，BsoBI，MboII，BbsI，BsmI，EcoRI，HgaI，AatII，PflFI，Tth111I，AhdI，DrdI，SacI，BseRI，PleI，HinfI，Sau3AI，MboI，DpnII，TfiI，BsrDI，BbvI，Bts^αI，BstAPI，SfaNI，SphI，NmeAIII，NgoMIV，BglI，AsiSI，BtgZI，HhaI，HinP1I，BssHII，NotI，Fnu4HI，MwoI，BmtI，NheI，BspQI，BlpI，TseI，ApeKI，Bsp1286I，AlwI，BamHI，BtsCI，FokI，FseI，SfiI，NarI，PluTI，KasI，AscI，EciI，BsmFI，ApaI，PspOMI，Sau96I，KpnI，Acc65I，BsaI，HphI，BstEII，AvaII，BanI，BaeGI，BsaHI，BanII，CviQI，BciVI，SalI，BcoDI，BsmAI，ApaLI，BsgI，AccI，Tsp45I，BsiHKAI，TspRI，ApoI，NspI，BsrF^αI，BstYI，HaeII，EcoO109I，PpuMI，I-CeuI，I-SceI，BspHI，BspEI，MmeI，Taq^αI，Hpy188I，Hpy188III，XbaI，BclI，PI-PspI，BsrGI，MseI，PacI，BstBI，PspXI，BsaWI，EaeI，HpyF30I，Sfr274I，及其组合。在某些实施方案中，预期可排除这些中的1、2、3、4、5、6、7、8、9、10或更多种，或其中可推导出的任何范围。

在一些实施方案中，使多个cfDNA分子发生酶促消化包括用CRISPR(成簇规律间隔短回文重复序列)-Cas9系统或其功能衍生物切割无细胞DNA分子。在一些实施方案中，使多个cfDNA分子发生酶促消化包括用一种或更多种转座酶或其功能衍生物切割cfDNA分子。

在一些实施方案中，该方法还包括使多个经标记的DNA片段或其衍生物经受足以允许在经标记的DNA片段中区分甲基化核酸碱基和非甲基化核酸碱基的条件。在一些实施方案中，使多个经标记的DNA片段或其衍生物经受区分甲基化碱基与非甲基化碱基的条件包括对多个经标记的DNA片段进行亚硫酸氢盐转化。在一些实施方案中，使多个经标记的DNA片段或其衍生物经受区分甲基化碱基与非甲基化碱基的条件包括酶促和/或化学反应以使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化，随后使氧化反应产物还原和/或脱氨基。

在一些实施方案中，在衔接子的连接期间和/或之后、和/或在PCR扩增步骤之后和/或在亚硫酸氢盐转化和PCR扩增二者之后，使用限制酶，例如BspDI、ClaI、AclI、NarI、Xhol、SmlI、HpyF30I、PaeR7I和/或Sfr274I来消化衔接子二聚体。

在一些实施方案中，使cfDNA发生酶促消化和衔接子连接在同一反应中进行。此外，在一些实施方案中，所使用的酶是MspI和/或BspDI，并且连接酶可以是任何连接酶，包括T7和/或T4 DNA连接酶。

在一些实施方案中，对多个经标记DNA的富集包括扩增，例如PCR。在一些实施方案中，用于PCR的引物被设计为识别(例如，能够结合)衔接子与靶DNA之间的连接，但不识别彼此连接的两个衔接子分子之间的连接。在一些实施方案中，用于PCR的引物被设计为在亚硫酸氢盐转化之后识别衔接子与靶DNA之间的连接，但所述引物在亚硫酸氢盐转化之后不识别衔接子与衔接子之间的连接。在一些实施方案中，用于PCR的引物被设计为在酶促和/或化学反应以使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化随后使氧化反应产物还原和/或脱氨基之后识别衔接子与靶DNA之间的连接，但在酶促和/或化学反应之后不识别衔接子与衔接子之间的连接。

产生的文库可包含可以是任何种类的一个或更多个目的区域。此外，在一些实施方案中，它们包含一个或更多个CpG位点。

用于连接到DNA片段上的衔接子本身可被设计为衔接子-衔接子二聚体，例如，为了长期稳定性。

在一些实施方案中，本公开内容提供了简化DNA片段化和衔接子连接以及降低衔接子二聚体的测序文库制备方法。本公开内容的方法的应用的一个实例是按照本公开内容的文库制备方法对cfDNA甲基化组进行谱分析以用于癌症诊断和筛选。

在另一个方面中，本公开内容提供了用于制备核酸文库的方法，其包括：(a)提供多个DNA分子；(b)用第一一种或更多种限制酶使所述分子发生消化，其中所述发生产生了DNA片段；(c)使DNA片段经受(例如，连接)衔接子和连接酶，其中所述经受产生了经衔接子连接的DNA片段和衔接子二聚体的混合物；以及(d)扩增经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段，其中该方法还包括降低所产生的衔接子二聚体的数量，其中该方法还包括在(c)和/或(d)期间和/或之后进行该降低，其中所述降低包括区分衔接子与DNA片段之间的连接和衔接子与另一衔接子之间的连接。

第一一种或更多种限制酶可包含：

AcII，HindIII，MluCI，PciI，AgeI，BspMI，BfuAI，SexAI，MluI，BceAI，HpyCH4IV，HpyCH4III，BaeI，BsaXI，AflIII，SpeI，BsrI，BmrI，BglII，BspDI，PI-SceI，NsiI，AseI，CspCI，MfeI，BssS^αI，DraIiI，EcoP15I，AlwNI，BtsIMutI，NdeI，CviAII，FatI，NlaIII.FspEI，XcmI，BstXI，PfiMI，BccI，NcoI，BseYI，FauI，TspMI，XmaI，LpnPI，AclI，ClaI，SacII，HpaII，MspI，ScrFI，StyD4I，BsaJI，BslI，BtgI，NciI，AvrII，MnlI，BbvCI，SbfI，Bpu10I，Bsu36I，EcoNI，HpyAV，BstNI，PspGI，StyI，BcgI，PvuI，EagI，RsrII，BsiEI，BsiWI，BsmBI，Hpy99I，AbaSI，MspJI，SgrAI，BfaI，BspCNI，XhoI，PaeR7I，EarI，AcuI，PstI，BpmI，DdeI，SfcI，AflII，BpuEI，SmlI，AvaI，BsoBI，MboII，BbsI，BsmI，EcoRI，HgaI，AatII，PflFI，Tth111I，AhdI，DrdI，SacI，BseRI，PleI，Hinfi，Sau3AI，MboI，DpnII，TfiI，BsrDI，BbvI，Bts^αI，BstAPI，SfaNI，SphI，NmeAIII，NgoMIV，BglI，AsiSI，BtgZI，HhaI，HinP1I，BssHII，NotI，Fnu4HI，MwoI，BmtI，NheI，BspQI，BlpI，TseI，ApeKI，Bsp1286I，AlwI，BamHI，BtsCI，FokI，FseI，SfiI，NarI，PluTI，KasI，AscI，EciI，BsmFI，ApaI，PspOMI，Sau96I，KpnI，Acc65I，BsaI，HphI，BstEII，AvaII，BanI，BaeGI，BsaHI，BanII，CviQI，BciVI，SalI，BcoDI，BsmAI，ApaLI，BsgI，AccI，Tsp45I，BsiHKAI，TspRI，ApoI，NspI，BsrF^αI，BstYI，HaeII，EcoO109I，PpuMI，I-CeuI，I-SceI，BspHI，BspEI，MmeI，Taq^αI，Hpy188I，Hpy188III，XbaI，BclI，PI-PspI，BsrGI，MseI，PacI，BstBI，PspXI，BsaWI，EaeI，HpyF30I，Sfr274I，或其组合。在某些实施方案中，预期可排除这些中的1、2、3、4、5、6、7、8、9、10或更多种。在一些实施方案中，(b)和(c)在同一反应混合物中进行。在一些实施方案中，(b)在与(c)不同或相同的温度下进行。

在一些实施方案中，区分衔接子与DNA片段之间的连接和衔接子与另一衔接子之间的连接还包括使用这样的衔接子：其被设计为在处于二聚化构型时被第二一种或更多种限制酶消化，但是当衔接子与DNA片段的末端连接时，其不能被第二一种或更多种限制酶消化。区分衔接子与DNA片段之间的连接和衔接子与另一衔接子之间的连接可还包括使用这样的衔接子，其被设计成使得用于扩增的引物能够在衔接子与DNA片段之间的连接处引发聚合，但不能在衔接子与另一衔接子之间的连接处引发聚合。

在另一个方面中，本公开内容提供了用于制备核酸文库的方法，其包括：(a)提供多个DNA分子；(b)用第一一种或更多种限制酶使所述分子发生消化，其中所述发生产生了DNA片段；(c)使DNA片段经受(例如，连接)衔接子(例如，衔接子可包含已知序列、独特序列或随机序列)，其中所述经受产生了经衔接子连接的DNA片段和衔接子二聚体的混合物；以及(d)扩增经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段，进行以下中的一项或更多项：(1)使用结合DNA片段的末端与衔接子之间的连接但不结合一个衔接子的末端与另一衔接子的末端之间的连接的引物进行(d)；(2)使经衔接子连接的DNA片段和衔接子二聚体的混合物经受第二一种或更多种限制酶，所述第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化DNA片段的末端与衔接子之间的连接；(3)在同一反应混合物中进行(b)和(c)，并且第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化DNA片段的末端与衔接子之间的连接；(4)衔接子是经设计的衔接子二聚体，并且第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化DNA片段的末端与衔接子之间的连接；和/或(5)扩增产生了扩增的衔接子二聚体，其用第三一种或更多种限制酶消化，所述第三一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接。

在一些实施方案中，该方法还包括使经衔接子连接的片段经受足以允许甲基化核酸碱基可与非甲基化核酸碱基区分开的条件。足以允许甲基化核酸碱基可与非甲基化核酸碱基区分开的条件可包含使经衔接子连接的片段发生亚硫酸氢盐转化。足以允许甲基化核酸碱基可与非甲基化核酸碱基区分开的条件可包含使经衔接子连接的片段发生一个或更多个酶促和/或化学反应，例如以使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化，随后使氧化反应产物还原和/或脱氨基。氧化反应产物的脱氨基可用载脂蛋白B mRNA编辑酶催化多肽样物质(catalytic polypeptide-like)(APOBEC)进行以使胞嘧啶核酸碱基脱氨基。氧化反应产物的还原和/或脱氨基可用吡啶硼烷进行。在一些实施方案中，该方法还包括在一个或更多个酶促和/或化学反应之前进行β-葡糖基转移酶处理。

在一些实施方案中，还使扩增的经衔接子连接的DNA片段的部分或全部进行分析、修饰或二者。分析可包括测序，例如下一代测序。在一些实施方案中，在下一代测序之前进行靶向捕获以进一步富集经衔接子连接的片段。在一些实施方案中，在下一代测序之前进行尺寸选择以进一步富集经衔接子连接的片段。分析可包括分析扩增的经衔接子连接的DNA片段的甲基化模式。衔接子可包括GC(在3’至5’方向)突出端。第一一种或更多种限制酶可包含MspI、HpaII、TaqαI、或其功能类似物或混合物。第二一种或更多种限制酶可包含以下中的一种或更多种：BspD1、ClaI、AclI、NarI、XhoI、SmlI、HpyF30I、PaeR7I、Sfr274I、或其功能类似物或混合物。在一些实施方案中，连接酶是T7 DNA连接酶、T4 DNA连接酶、T3 DNA连接酶、Taq DNA连接酶、或其功能类似物、或其混合物。

在一些实施方案中，所述多个DNA分子包含无细胞DNA。在一些实施方案中，该方法还包括获得cfDNA，例如从获自或来源于对象或个体的样品中获得cfDNA。可针对具有一个或更多个CpG位点的分子富集cfDNA。样品可以是任何种类的，例如来自血浆、血清、骨髓、脑脊液、胸膜液、唾液、粪便或尿。在一些实施方案中，该方法还包括从对象或个体获得样品。

在另一个方面中，本公开内容提供了用于制备核酸文库的方法，其包括：(a)提供多个DNA分子；(b)用第一一种或更多种限制酶使所述分子发生消化，其中所述发生产生了DNA片段；(c)使DNA片段经受(例如，连接)衔接子，其中所述经受产生了经衔接子连接的DNA片段和衔接子二聚体的混合物；以及(d)扩增经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段，其中所述扩增使用结合DNA片段的末端与衔接子之间的连接但不结合一个衔接子的末端与另一衔接子的末端之间的连接的引物组。在一些实施方案中，第一一种或更多种限制酶包含以下中的一种或更多种：MspI、HpaII、TaqαI、或其功能类似物、或其混合物。

在一些实施方案中，该方法还包括在同一反应混合物中进行(b)和(c)。在一些实施方案中，该方法还包括使经衔接子连接的片段经受足以允许甲基化核酸碱基可与非甲基化核酸碱基区分开的条件。足以允许甲基化核酸碱基可与非甲基化核酸碱基区分开的条件可包含使经衔接子连接的片段发生亚硫酸氢盐转化或使经衔接子连接的片段发生一个或更多个酶促和/或化学反应(例如，以使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化，随后使氧化反应产物还原和/或脱氨基)。

在一些实施方案中，氧化用十-十一易位(ten-eleven translocation，TET)酶进行。在一些实施方案中，氧化用高钌酸钾进行。在一些实施方案中，氧化反应产物的脱氨基用APOBEC进行以使胞嘧啶核酸碱基脱氨基，或者氧化反应产物的脱氨基可用吡啶硼烷进行。在一些实施方案中，该方法还包括在一个或更多个酶促或化学反应之前进行β-葡糖基转移酶处理。在一些实施方案中，衔接子包含GC突出端。

在另一个方面中，本公开内容提供了用于制备核酸文库的方法，其包括：(a)提供多个DNA分子；(b)用第一一种或更多种限制酶使所述分子发生消化，其中所述发生产生了DNA片段；(c)使DNA片段经受(例如，连接)衔接子(例如，其可包含GC突出端)，其中所述经受产生了经衔接子连接的DNA片段和衔接子二聚体的混合物；(d)使经衔接子连接的DNA片段和衔接子二聚体的混合物经受第二一种或更多种限制酶，所述第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化DNA片段的末端与衔接子之间的连接；以及(e)扩增经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段。在一些实施方案中，该方法还包括在同一反应混合物中进行(b)、(c)和(d)。

在一些实施方案中，第一一种或更多种限制酶包含以下中的一种或更多种：MspI、HpaII、TaqαI、或其功能类似物、或其混合物。第二一种或更多种限制酶可包含以下中的一种或更多种：BspDI、ClaI、AclI、NarI、XhoI、SmlI、HpyF30I、PaeR7I、Sfr274I、或其功能类似物、或其混合物。

在一些实施方案中，该方法还包括使经衔接子连接的片段经受足以允许甲基化核酸碱基可与非甲基化核酸碱基区分开的条件，例如使经衔接子连接的片段发生亚硫酸氢盐转化或使经衔接子连接的片段发生一个或更多个酶促和/或化学反应，例如以使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化，随后使氧化反应产物还原和/或脱氨基(例如，用APOBEC或吡啶硼烷进行)。在一些实施方案中，氧化用十-十一易位(TET)酶进行。在一些实施方案中，氧化用高钌酸钾进行。在一些实施方案中，该方法还包括在一个或更多个酶促或化学反应之前进行β-葡糖基转移酶处理。在一些实施方案中，衔接子包含GC突出端。

在另一个方面中，本公开内容提供了用于制备核酸文库的方法，其包括：(a)提供多个DNA分子；(b)用第一一种或更多种限制酶使所述分子发生消化，其中所述发生产生了DNA片段；(c)使DNA片段经受(例如，连接)作为经设计的衔接子二聚体的衔接子，其包括使衔接子二聚体经受第二一种或更多种限制酶以产生衔接子，其中所述经受还产生经衔接子连接的DNA片段和衔接子二聚体的混合物，其中第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化DNA片段的末端与衔接子之间的连接；以及(d)扩增经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段。在一些实施方案中，该方法还包括在同一反应混合物中进行(b)和(c)。

在一些实施方案中，第一一种或更多种限制酶包含以下中的一种或更多种：MspI、HpaII、TaqαI、或其功能类似物、或其混合物。第二一种或更多种限制酶可包含以下中的一种或更多种：BspDI、ClaI、AclI、NarI、XhoI、SmlI、HpyF30I、PaeR7I、Sff274I、或其功能类似物、或其混合物。在一些实施方案中，该方法还包括在同一反应混合物中进行(b)和(c)。

在一些实施方案中，该方法还包括使经衔接子连接的片段经受足以允许甲基化核酸碱基可与非甲基化核酸碱基区分开的条件。所述条件可包含使经衔接子连接的片段发生亚硫酸氢盐转化，或使经衔接子连接的片段发生一个或更多个酶促和/或化学反应，例如以使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化，随后使氧化反应产物还原和/或脱氨基(例如，用APOBEC或用吡啶硼烷)。在一些实施方案中，氧化用十-十一易位(TET)酶进行。在一些实施方案中，氧化用高钌酸钾进行。在一些实施方案中，该方法还包括在一个或更多个酶促或化学反应之前进行β-葡糖基转移酶处理。在一些实施方案中，通过第二一种或更多种限制酶对第二衔接子的衔接子二聚体的消化产生了GC突出端。

在另一个方面中，本公开内容提供了用于制备核酸文库的方法，其包括：(a)提供多个DNA分子；(b)用第一一种或更多种限制酶使所述分子发生消化，其中所述发生产生了DNA片段；(c)使DNA片段经受(例如，连接)衔接子，其中所述经受产生了经衔接子连接的DNA片段和衔接子二聚体的混合物；以及(d)扩增经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段和扩增的衔接子二聚体，其中将扩增的衔接子二聚体用消化一个衔接子的末端与另一个衔接子的末端之间的连接的第二一种或更多种限制酶消化。在一些实施方案中，该方法还包括在同一反应混合物中进行(b)和(c)。

在一些实施方案中，该方法还包括使经衔接子连接的片段经受足以允许甲基化核酸碱基可与非甲基化核酸碱基区分开的条件，例如包括使经衔接子连接的片段发生亚硫酸氢盐转化，或使经衔接子连接的片段发生一个或更多个酶促和/或化学反应。一个或更多个酶促反应可以使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化，随后例如用APOBEC或用吡啶硼烷使氧化反应产物还原和/或脱氨基。在一些实施方案中，氧化用十-十一易位(TET)酶进行。在一些实施方案中，氧化用高钌酸钾进行。在一些实施方案中，该方法还包括在一个或更多个酶促或化学反应之前进行β-葡糖基转移酶处理。在一些实施方案中，衔接子包含GC突出端。

在另一个方面中，本公开内容提供了用于制备核酸文库的方法，其包括：(a)提供多个DNA分子；(b)在存在连接酶的情况下用第一限制酶使所述分子发生消化，其中所述消化产生了DNA片段；(c)使DNA片段经受(例如，连接)衔接子，其中所述经受产生了经衔接子连接的DNA片段和衔接子二聚体的混合物，并且其中第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化DNA片段的末端与衔接子之间的连接；以及(d)扩增经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段。

在一些实施方案中，该方法还包括在同一反应混合物中进行(b)和(c)。在一些实施方案中，该方法还包括使经衔接子连接的片段发生亚硫酸氢盐转化。衔接子可包含GC突出端。

在本文中提供的方法的一些实施方案中，消化一个衔接子的末端与另一衔接子的末端之间的连接的限制酶用CRISPR相关内切核酸酶和专门设计的指导RNA替换。

特别预期了关于本发明一个实施方案所讨论的任何限制均可适用于本发明的任何其他实施方案。此外，本发明的任何组合物可用于本发明的任何方法中，并且可使用本发明的任何方法以产生或利用本发明的任何组合物。在实施例中阐述的实施方案的一些方面也是可在不同实施例中的其他地方或在本申请中的其他地方(例如在发明内容、具体实施方式、权利要求书和附图说明中)讨论的一些实施方案的背景下实施的实施方案。

前述内容已经相当宽泛地概述了本公开内容的特征和技术优点，以便可更好地理解下面的详细描述。下文中将描述形成本文中权利要求书的主题的另外的特征和优点。本领域技术人员应当理解，所公开的概念和具体实施方案可容易地用作用于修改或设计用于进行本发明设计相同目的的其他结构的基础。本领域技术人员还应该认识到，这样的等同构造不脱离所附权利要求书中阐述的精神和范围。当结合附图考虑时，将从以下描述中更好地理解在组织和操作方法二者方面被认为是本文中所公开的设计的特征的新特征以及另外的目的和优点。然而，应当清楚地理解，仅出于举例说明和描述的目的提供每幅附图，并且并不旨在作为对本公开内容的限制的限定。本发明的另外的目的、特征、方面和优点将部分地在随后的描述中阐述，并且部分地将从描述中显而易见或可通过本发明的实践而获知。将充分详细地描述本公开内容的多个实施方案以使本领域技术人员能够实践本发明，并且应当理解可利用其他实施方案并且可在不脱离本发明的范围的情况下做出改变。因此，以下详细描述不应被视为限制性意义的，并且本发明的范围由所附权利要求书最合适地限定。

附图简述

本发明的新特征在所附权利要求书中具体阐述。通过参考以下阐述了其中利用本发明的原理的举例说明性实施方案的详细说明和附图(在本文中也称为“附图”和“图”)，将获得对本公开内容的特征和优点的更好的理解，在附图中：

图1示出了利用限制酶消化和衔接子连接随后是所产生的分子的扩增(例如用聚合酶链反应(PCR))从核酸(例如无细胞DNA(cfDNA)和/或基因组DNA(gDNA))产生文库的一个实例。

图2A至2R提供了可在本公开内容的方法中使用的衔接子的一些实例。

图3A至3E提供了可被限制酶消化的衔接子-衔接子二聚体的一些实例。

图4示出了本公开内容的方法的一个实例，其中将cfDNA酶促消化，随后进行衔接子连接、亚硫酸氢盐转化和PCR扩增，其中PCR引物靶向衔接子与DNA片段之间的连接但不靶向衔接子-衔接子连接。

图5示出了本公开内容的方法的一个实例，其中将cfDNA酶促消化，随后进行衔接子连接、亚硫酸氢盐转化和PCR扩增，其中将衔接子二聚体通过合适的限制酶选择性消化。

图6示出了本公开内容的方法的一个实例，其中在存在连接酶和衔接子的情况下将cfDNA酶促消化，随后进行亚硫酸氢盐转化和PCR扩增，其中一种限制酶消化衔接子-衔接子连接并且最初消化起始DNA的酶还消化缺乏衔接子的连接的靶DNA片段；衔接子与靶DNA连接产物的连接不具有可被任一酶消化的识别位点。

图7示出了本公开内容的方法的一个实例，其中将cfDNA在存在连接酶和衔接子的情况下酶促消化，随后进行亚硫酸氢盐转化和PCR扩增，其中一种限制酶(例如BspDI)消化衔接子-衔接子连接，并且最初消化起始DNA的酶(例如MspI)也消化缺乏衔接子的连接的靶DNA片段；衔接子与靶DNA连接产物的连接不具有可被任一限制酶(例如BspDI或MspI)消化的识别位点。

图8示出了本公开内容的方法的一个实例，其中将cfDNA酶促消化，随后进行衔接子连接、亚硫酸氢盐转化和PCR扩增，其中在PCR扩增之后将衔接子二聚体消化。

图9A至9C示出了从对来自三个血浆样品的10纳克(ng)cfDNA进行本公开内容的方法的一个实例获得的结果。反应中使用了限制酶MspI。对文库大小的TBE-尿素-聚丙烯酰胺凝胶分析(图9A)和基于测序数据的片段尺寸分析(图9B)二者均示出了典型的简化代表性亚硫酸氢盐测序(reduced representation bisulfite sequencing，RRBS)文库的结果，其中存在与Alu重复相关的在约68bp、135bp和202bp处的三个特征峰。图9C示出了对测序结果的总结，包括：总测序读出；幸免于QC管道中的修整的测序读出的百分比；重复的百分比；以CGG序列开始的R1测序读出；以CGG序列开始的R2测序读出；映射至特征性RRBS区域的测序读出的百分比。

尽管已经在本文中示出和描述了本公开内容的多个实施方案，但是对于本领域技术人员而言显然的是，这样的实施方案仅通过实例提供。在不脱离本发明的情况下，本领域技术人员可以想到许多变化、改变和替换。应当理解，可采用本文中所述的本公开内容的一些实施方案的多个替代方案。

发明详述

I.定义的一些实例

为了与长期的专利法惯例保持一致，当在本发明说明书中(包括在权利要求书中)结合词语“包含/包括”使用时，未用数量词限定的名词表示“一个/种或更多个/种”。本公开内容的一些实施方案可由本公开内容的一个或更多个要素、方法步骤和/或方法组成或基本上由其组成。预期可相对于本文中所述的任何其他方法或组合物来实施本文中所述的任何方法或组合物以及可将不同的实施方案组合。

本文中使用的术语“或”和“和/或”用于描述彼此组合或彼此排斥的多个组分。例如，“x、y和/或z”可指单独的“x”、单独的“v”、单独的“z”、“x、y和z”、“(x和y)或z”、“x或(y和z)”或“x或y或z”。特别预期了可从实施方案中特别地排除x、y或z。

在本申请通篇，术语“约/大约”根据其在细胞和分子生物学领域中的清晰且普通含义使用，以指示值包含用于确定该值所采用的装置或方法的误差的标准偏差。

与“包括”、“含有”或“以……为特征”同义的术语“包含”是包含性的或开放性的，并且不排除另外的未记载的要素或方法步骤。短语“由......组成”不包括未指定的任何要素、步骤或成分。短语“基本上由......组成”将所描述的主题的范围限制为指定的物质或步骤以及不会实质上影响其基本的和新的特征的那些物质或步骤。预期在术语“包含/包括”的情况下描述的一些实施方案也可在术语“由……组成”或“基本上由……组成”的情况下实施。

本说明书通篇对“一个实施方案(one embodiment)”、“一个实施方案(anembodiment)”、“一个具体实施方案”、“一个相关实施方案”、“某个实施方案”、“一个另外的实施方案”或“另一个实施方案”，或其组合的提及意指结合所述实施方案所描述的特定特征、结构或特性包括在本发明的至少一个实施方案中。因此，在本说明书通篇多个地方出现的前述短语不一定都是指相同的实施方案。此外，特定特征、结构或特性可在一个或更多个实施方案中以任何合适的方式组合。

本公开内容的多个方面可以以范围形式呈现。应当理解，以范围形式的描述仅是为了方便和简洁，而不应被解释为对本公开内容的范围的不灵活的限制。因此，应该将范围的描述视为已明确公开了该范围内的所有可能的子范围以及单独数值，就好像已明确写出一样。例如，对范围例如1至6的描述应理解为已明确公开了该范围内的子范围，例如1至3、1至4、1至5、2至4、2至6、3至6等，以及单独数值，例如1、2、3、4、5和6。无论范围的广度如何，这都适用。当存在范围时，范围可包括范围端点。

本文中使用的术语“衔接子二聚体”是指在将第一衔接子分子与第二衔接子分子连接时产生的分子。

本文中使用的术语“对象”通常是指具有进行处理或分析的生物样品的个体。对象可以是动物或植物。对象可以是哺乳动物，例如人、狗、猫、马、猪或啮齿动物。对象可以是患者，例如患有或被怀疑患有疾病或病症或处于患有疾病或病症的风险之中，所述疾病或病症例如一种或更多种癌症(例如脑癌、乳腺癌、宫颈癌、结直肠癌、子宫内膜癌、食管癌、胃癌、肝胆道癌、白血病、肝癌、肺癌、淋巴瘤、卵巢癌、胰腺癌、皮肤癌、泌尿道癌、睾丸癌、肾癌、肉瘤、胆道癌、甲状腺癌、胆囊癌、脾癌或前列腺癌，并且癌症可包含或可不包含实体瘤)，一种或更多种感染性疾病，一种或更多种遗传病症，或一种或更多种肿瘤，或其任何组合。对于患有或被怀疑患有一种或更多种肿瘤的对象，肿瘤可以是一种或更多种类型。对象可患有疾病或病症，或被怀疑患有疾病或病症。对象可以未患有疾病或病症或未被怀疑患有疾病或病症。对象可以是健康对照。对象对于特定疾病或病症可以是无症状的。

本文中使用的术语“样品”通常是指生物样品。样品可取自组织和/或细胞或者取自组织和/或细胞的环境。在一些实例中，样品可包含或来源于组织活检、细胞活检、血液(例如全血)、血浆、血清、骨髓、脑脊液、胸膜液、唾液、粪便、尿、细胞外液、干血斑、培养的细胞、培养基、废弃的组织、植物物质、合成蛋白、细菌和/或病毒样品、真菌组织、古细菌或原生动物。在收集之前，样品可已与来源分离。样品可包含法医证据。一些非限制性实例包括在收集之前从主要来源分离的指纹、唾液、尿、血液、粪便、精液或其他体液。在一些实例中，在样品制备期间将样品与其主要来源(细胞、组织、体液(例如血液)、环境样品等)分离。样品可来源于灭绝物种，包括但不限于来源于化石的样品。样品可能会或可能不会从其主要来源中纯化或以其他方式富集。在一些实施方案中，在进一步处理之前将主要来源均质化。可将样品过滤或离心以去除血沉棕黄层、脂质或颗粒物质。也可以纯化或富集样品的核酸，或可以用RNase或DNase处理样品。样品可包含完整的、片段化的或部分降解的组织和/或细胞。

样品可获自患有疾病或病症的对象，并且对象可具有或可不具有疾病或病症的诊断。对象可能需要第二意见。疾病或病症可以是感染性疾病、免疫病症或疾病、癌症、遗传性疾病、退行性疾病、生活方式疾病或损伤。感染性疾病可由细菌、病毒、真菌和/或寄生物引起。癌症的一些非限制性实例包括胰腺癌、肝癌、肺癌、结直肠癌、白血病、膀胱癌、骨癌、脑癌、乳腺癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、黑素瘤、卵巢癌、睾丸癌、肾癌、甲状腺癌、胆囊癌、脾癌和前列腺癌。遗传性疾病或病症的一些实例包括但不限于囊性纤维化、夏科-马里-图思病(Charcot-Marie-Tooth disease)、亨廷顿病(Huntington’s disease)、波伊茨-耶格综合征(Peutz-Jeghers syndrome)、唐氏综合症(Down syndrome)、类风湿性关节炎和泰-萨克斯病(Tay-Sachs disease)。生活方式疾病的一些非限制性实例包括肥胖、糖尿病、动脉硬化、心脏病、卒中、高血压、肝硬化、肾炎、癌症、慢性阻塞性肺病(chronicobstructive pulmonary disease，COPD)、听力问题和慢性背痛。损伤的一些实例包括但不限于：擦伤、脑损伤、瘀伤、烧伤、脑震荡、充血性心力衰竭、结构损伤(constructioninjury)、脱臼、连枷胸、骨折、血胸、椎间盘突出(herniated disc)、髋骨隆凸挫伤(hippointer)、低体温、撕裂伤、神经挟捏(pinched nerve)、气胸、肋骨骨折、坐骨神经痛、脊髓损伤、肌腱韧带筋膜损伤、创伤性脑损伤和鞭伤。可以在治疗患有疾病或病症的对象之前和/或之后获取样品。可以在治疗对象的疾病或病症之前和/或之后获取样品。可以在治疗或治疗方案期间获取样品。可以从对象获取多个样品以随时间监测治疗效果，包括从治疗开始之前开始。样品可取自已知或被怀疑患有感染性疾病的对象，对于该感染性疾病，诊断抗体可能存在或可能不存在。可从对象获取样品以监测异常组织特异性细胞死亡或器官移植。

样品可取自被怀疑患有疾病或病症的对象。样品可取自经历了无法解释的症状例如疲劳、恶心、体重减轻、痛、疼痛、虚弱或记忆力减退的对象。样品可取自具有经解释的症状的对象。样品可取自由于一种或更多种因素而处于出现疾病或病症的风险之中的对象，所述因素例如家族和/或个人病史、年龄、环境暴露、生活方式风险因素、其他已知风险因素的存在、或其组合。

样品可取自健康对象或个体。在一些实施方案中，样品可纵向取自同一对象或个体。在一些实施方案中，可对纵向获取的样品进行分析，其目的是监测个体健康以及健康组织的早期检测(例如癌症的早期诊断)。在一些实施方案中，样品可在家庭环境或护理点环境收集，并随后通过邮件递送、快递递送或其他运输方法来运输，然后分析。例如，家庭用户可通过手指点刺收集血斑样品，并且可以将血斑样品干燥并随后通过邮件递送来运输，然后分析。在一些实施方案中，纵向获取的样品可用于监测对预期会影响健康、运动表现或认知表现的刺激的响应。一些非限制性实例包括对药物、节食和/或运动方案的响应。在一些实施方案中，个体样品是多用途的，并且允许进行甲基化谱分析以获得临床相关信息，但也用于获取有关个体的个人或家庭血统的信息。在一些实施方案中，样品可从孕妇和/或其胎儿中收集。

在一些实施方案中，生物样品是包含一个或更多个核酸分子的核酸样品。核酸分子可以是无细胞的或基本上无细胞的核酸分子，例如无细胞DNA(cfDNA)或无细胞RNA(cfRNA)或其混合物。核酸分子可来源于多种来源，包括人、哺乳动物、非人哺乳动物、猿、猴、黑猩猩、爬行动物类、两栖动物或禽类来源。此外，样品可提取自包含无细胞序列的多种动物流体，包括但不限于血液、血清、血浆、骨髓、玻璃体、痰、粪便、尿、眼泪、汗液、唾液、精液、黏膜排泄物、黏液、脑脊液、胸膜液、羊水和淋巴液。样品可取自胚胎、胎儿或孕妇。在一些实例中，样品可分离自母亲的血浆。在一些实例中，样品可包含无细胞核酸(例如，cfDNA)，其是胎儿来源的(通过从妊娠对象获得的身体样品)或者来源于对象自身的组织或细胞。

样品的组分(包括核酸)可例如用可识别的标签标记，以允许样品的多路复用。可识别标签的一些非限制性实例包括：荧光团、磁性纳米粒和核酸条码。荧光团可包括荧光蛋白，例如GFP、YFP、RFP、eGFP、mCherry、tdtomato、FITC、Alexa Fluor 350、Alexa Fluor405、Alexa Fluor 488、Alexa Fluor 532、Alexa Fluor 546、Alexa Fluor 555、AlexaFluor 568、Alexa Fluor 594、Alexa Fluor 647、Alexa Fluor 680、Alexa Fluor 750、Pacific Blue、Coumarin、BODIPY FL、Pacific Green、Oregon Green、Cy3、Cy5、PacificOrange、TRITC、Texas Red、藻红蛋白、别藻蓝蛋白(Allophcocyanin)或其他荧光团。在测序之前，可将一个或更多个条码标签附着(例如，通过偶联或连接)至样品中的无细胞核酸(例如，cfDNA)。条码可以独特地标记样品中的cfDNA分子。或者，条码可以非独特地标记样品中的cfDNA分子。条码可以非独特地标记样品中的cfDNA分子，使得与非独特标签一起组合获取的获自cfDNA分子的另外信息(例如cfDNA分子的内源序列的至少一部分)可用作样品中cfDNA分子的独特标识符(例如，相对于其他分子进行独特识别)。例如，可至少部分地基于在序列读出一个或两个末端处包含一个或更多个连续碱基区域的序列信息、序列读出的长度、和/或在序列读出一个或两个末端处的所附条码的序列来检测具有独特身份(例如，来自给定模板分子)的cfDNA序列读出。通过在扩增之前将DNA(例如cfDNA)样品分成许多(例如至少约50、至少约100、至少约500、至少约1千、至少约5千、至少约1万、至少约5万或至少约10万)个不同的离散亚单位(例如，分区、孔或微滴)使得可以独特地分辨扩增的DNA分子并将其鉴定为来源于它们各自的单独DNA输入分子，可在不进行标记的情况下独特地鉴定DNA分子。

可使任意数目的样品多路复用。例如，多路复用分析可包含至少约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100或更多个样品，或者其中可推导出的任何范围。可识别的标签可提供一种询问每个样品其来源的方法，或者可引导不同的样品分离到不同的区域或固体支持物。

可以在分析之前混合任意数目的样品，而无需标记或多路复用。例如，多路复用分析可包含至少约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100或更多个样品，或者其中可推导出的任何范围。可使用组合合并设计在不进行标记的情况下使样品多路复用，其中以允许使用计算多路分解从分析的合并物中分辨单个样品的信号的方式将样品混合到合并物中。

样品可以在测序之前富集。例如，可选择性富集或非选择性富集cfDNA分子的来自对象基因组或转录物组的一个或更多个区域。例如，可通过靶向序列捕获(例如，使用组)、选择性扩增或靶向扩增以选择性富集cfDNA分子的来自对象基因组或转录物组的一个或更多个区域。作为另一个实例，可通过普遍扩增(universal amplification)非选择性富集cfDNA分子的来自对象基因组或转录物组的一个或更多个区域。在一些实施方案中，扩增包含普遍扩增、全基因组扩增或非选择性扩增。可对cfDNA分子进行尺寸选择以选择具有预定范围的长度的片段。例如，可以在衔接子连接之前对DNA片段进行尺寸选择，以选择40个碱基对(bp)至250bp的长度，或者其中可推导出的任何范围。作为另一个实例，可以在衔接子连接之后对DNA片段进行尺寸选择，以选择160bp至400bp的长度，或者其中可推导出的任何范围。

本文中使用的术语“核酸”或“多核苷酸”通常是指包含一个或更多个核酸亚基或核苷酸的分子。核酸可包含选自腺苷(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)，或其变体的一个或更多个核苷酸。核苷酸通常包含核苷和至少1、2、3、4、5、6、7、8、9、10或更多个(或者其中可推导出的任何范围)磷酸(PO3)基团。核苷酸可包含单独的或组合的核碱基、五碳糖(核糖或脱氧核糖)以及一个或更多个磷酸基团。

本文中使用的术语“核酸分子”、“核酸序列”、“核酸片段”、“寡核苷酸”和“多核苷酸”通常是指多核苷酸，例如脱氧核糖核苷酸(DNA)或核糖核苷酸(RNA)，或其类似物和/或组合(例如DNA和RNA的混合物)。核酸分子可具有多种长度。核酸分子可具有为以下的长度：至少5个碱基、10个碱基、20个碱基、30个碱基、40个碱基、50个碱基、60个碱基、70个碱基、80个碱基、90、100个碱基、110个碱基、120个碱基、130个碱基、140个碱基、150个碱基、160个碱基、170个碱基、180个碱基、190个碱基、200个碱基、300个碱基、400个碱基、500个碱基、1千碱基(kb)、2kb、3kb、4kb、5kb、10kb或50kb，或其中可推导出的任何范围，或者其可具有在任意两个上述值之间的任意数目的碱基。寡核苷酸通常由四种核苷酸碱基的特定序列构成：腺嘌呤(A)；胞嘧啶(C)；鸟嘌呤(G)；和胸腺嘧啶(T)(当多核苷酸为RNA时，尿嘧啶(U)代替胸腺嘧啶(T))。因此，术语“核酸分子”、“核酸序列”、“核酸片段”、“寡核苷酸”和“多核苷酸”至少部分意图是多核苷酸分子的字母表示。或者，该术语可应用于多核苷酸分子本身。该字母表示可以输入到具有中央处理单元的计算机中的数据库中和/或用于生物信息学应用，例如功能基因组学和同源性检索。寡核苷酸可包含一种或更多种非标准核苷酸、核苷酸类似物和/或经修饰的核苷酸。

本文中使用的术语“无细胞DNA”或“cfDNA”通常是指在体液(例如血流或从中的血浆)中自由循环的DNA。在本文中所用方法的一些实施方案中，cfDNA涵盖特定类型的cfDNA，例如循环肿瘤DNA(ctDNA)，其是在血流中的与细胞不相关的肿瘤来源的片段化DNA。cfDNA可以是双链的、单链的或具有二者的特征。

本文中使用的术语“CpG位点”通常是指沿着核酸分子的位置，其在沿5’至3’方向包含与鸟嘌呤(G)邻近的胞嘧啶(C)。核酸分子可包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、500、1000、10000或更多个(或其中可推导出的任何范围)CpG位点。沿着核酸分子的3’至5’方向的这样的CpG位点可称为“GpC位点”。

本文中使用的术语“CpG岛”通常是指满足以下标准的基因组DNA的连续区域：(1)具有大于约0.6的对应于“观察数与预期数比率”的CpG二核苷酸频率；(2)具有大于约0.5的“GC含量”；和(3)长度为至少约0.2千碱基(kb)，可能的例外是排除或掩盖了匹配这些标准的重复区域。鉴定CpG岛的标准由例如Gardiner-Garden et al.(J.Mol.Biol.，196：262-282，1987)描述，其通过引用整体并入在此。

本文中使用的术语“富CpG”通常是指具有高CpG含量的基因组区域，其中可发生大多数DNA甲基化。高CpG含量的区域可具有至少1％、2％、3％、4％、5％、6％、7％、8％、9％、10％(或其中可推导出的任何范围)或更高的CpG含量。在一些实施方案中，这样的CpG含量大于1％。在一些实施方案中，富CpG区域可包含CpG岛和启动子区域。富CpG区域可包括任何长度(例如，长度不限制于至少0.2kb)。

本文中使用的术语“亚硫酸氢盐转化”通常是指用于将非甲基化碱基(例如胞嘧啶碱基)转化为尿嘧啶碱基，从而保留甲基化信息(例如甲基化胞嘧啶)的生物化学过程。用于亚硫酸氢盐转化的试剂的一些实例包括亚硫酸氢钠、亚硫酸氢镁和亚硫酸氢三烷基铵。

II.方法的一些实例

本公开内容提供了用于制备核酸文库的方法，其具有对于富集信息性片段和降低衔接子二聚体的改进，所述衔接子二聚体可降低文库制备的效率。在一些实施方案中，产生文库的DNA的来源包括任何种类的DNA，特别是无细胞DNA(cfDNA)。在一些实施方案中，文库在人工产生的DNA片段化之后产生。尽管在一些实施方案中，起始核酸物质本身可包含片段(例如天然来源的片段化(来自细胞凋亡或坏死，包括来自癌细胞DNA))。

本公开内容提供了采用一系列操作来产生所期望文库的方法。在一些实施方案中，该方法包括以下操作：消化DNA，将衔接子与经消化DNA的末端连接，扩增经衔接子连接的DNA以及对扩增的经衔接子连接的DNA进行测序，其中在该方法过程中的某个时刻，衔接子二聚体作为步骤的副产物产生，并且数目也降低(例如，通过消化或其他方式将其破坏)以提高方法的效率。该方法还可包括亚硫酸氢盐转化，例如当期望确定核酸的甲基化状态时，包括当期望产生甲基化组时。

在一些实施方案中，例如因为当前下一代测序(NGS)测序仪的读出长度有限，因此进行DNA片段化以用于测序文库制备。在用于NGS文库制备的先前方法中，片段化的DNA可在与衔接子连接之前进行末端修复和/或dA加尾，并且典型的衔接子可以是平末端的或具有突出端。

如图1中所示，先前文库方法利用酶促方法，例如使用一种或更多种限制酶，以将两个末端处均具有突出端的DNA片段化。将专门设计的衔接子与片段连接。随后，无论有或没有衔接子去除操作，PCR均可将经衔接子标记(其也可称为衔接子连接)的片段扩增至足够的用于NGS方法的量。

用限制酶消化DNA作为该方法中的初始或早期操作，不仅将DNA片段化，而且还可用作富集目的DNA的通用方法。例如，在简化代表性亚硫酸氢盐测序(RRBS)中使用MspI酶富集了具有CpG位点的DNA片段以用于甲基化谱分析。虽然从基因组DNA(genomic DNA，gDNA)产生的大多数片段在尺寸选择之后可能已被限制酶切割了两次，但这可能不适用于cfDNA片段。无细胞DNA通常包含尺寸分布以约166个碱基对为中心的DNA分子。如图1中所示，一些片段不包含任何限制酶识别位点，并且一些片段仅包含一个限制酶识别位点，因此，与具有多个限制酶识别位点的靶片段相比，这样的片段不是信息性片段或不作为信息性片段。一些限制酶在消化之后产生3’或5’突出端。在图1中，示出了来自被两种限制酶切割的两个代表性突出端(“PQ”、“NM”)及其互补序列(“pq”、“nm”)。

在一些实施方案中，本公开内容提供了专门设计的衔接子以与经酶促消化的DNA片段连接以用于文库制备，特别是从cfDNA富集具有多个限制酶识别位点的片段用于基因组和表观基因组学分析。如图1中所示，衔接子被设计为具有与经限制酶消化的片段的突出端互补的序列的突出端(例如，“MN”、“pq”)。在衔接子与靶片段连接之后，进一步的文库制备过程(例如PCR)可仅选择性地扩增两个末端均与专门设计的衔接子连接的片段，从而从cfDNA中富集信息性片段，以用于随后分析，包括测序。

先前的文库制备方法(例如图1中所示的实例)和其他文库制备方法遇到的一个问题是不期望形成许多衔接子二聚体，而本公开内容的方法至少克服了这样的问题。不同于常规衔接子(其中其突出端彼此不互补并因此不能容易地形成二聚体)，用于与经限制酶消化的片段连接的衔接子可彼此连接形成衔接子二聚体。可对最终文库中的衔接子二聚体测序，因此，这可能会对靶片段的测序读出的产率产生负面影响，以及引入由衔接子二聚体引起的虚假测序读出。所产生文库中的衔接子二聚体可大量存在，并且无法通过简单的纯化步骤(例如Ampure珠纯化)轻易地去除。

本公开内容提供了避免或降低核酸文库(包括为测序而产生的文库)中衔接子二聚体的数量的方法。在一些实施方案中，本公开内容的方法使用专门设计的PCR引物来选择性扩增在两个末端均具有衔接子的DNA片段和/或使用一种或更多种限制酶以在衔接子连接期间或之后切割衔接子二聚体。这些方法在以下使用本公开内容的方法产生核酸文库的具体应用中举例说明。在制备操作之后，该文库可用于任何目的，例如对cfDNA，包括cfDNA甲基化组进行谱分析。

图2示出了可用于从经限制酶消化的cfDNA中富集信息性片段的所设计衔接子的一些实例。不同的限制酶可用于产生信息性cfDNA片段，包括但不限于：

AcII，HindIII，MluCI，PciI，AgeI，BspMI，BfuAI，SexAI，MluI，BceAI，HpyCH4IV，HpyCH4III，BaeI，BsaXI，AflIII，SpeI，BsrI，BmrI，BglII，BspDI，PI-SceI，NsiI，AseI，CspCI，MfeI，BssSαI，DraIII，EcoP15I，AlwNI，BtsIMutI.NdeI，CviAII，FatI，NlaIII，FspEI，XcmI，BstXI，PflMI，BccI，NcoI，BseYI，FauI，TspMI，XmaI，LpnPI，AclI，ClaI，SacII，HpaII，MspI，ScrFI，StyD4I，BsaJI，BslI，BtgI，NciI，AvrII，MnlI，BbvCI，SbfI，Bpu10I，Bsu36I，EcoNI，HpyAV，BstNI，PspGI，StyI，BcgI，PvuI，EagI，RsrII，BsiEI，BsiWI，BsmBI，Hpy99I，AbaSI，MspJI，SgrAI，BfaI，BspCNI，XhoI，PaeR7I，EarI，AcuI，PstI，BpmI，DdeI，SfcI，AflII，BpuEI，SmlI，AvaI，BsoBI，MboII，BbsI，BsmI，EcoRI，HgaI，AatII，PflFI，Tth1111，AhdI，DrdI，SacI，BseRI，PleI，HinfI，Sau3AI，Mbol，DpnII，TfiI，BsrDI，BbvI，BtsαI，BstAPI，SfaNI，SphI，NmeAIII，NgoMIV，BglI，AsiSI，BtgZI，HhaI，HinP1I，BssHII，NotI，Fnu4HI，MwoI，BmtI，NheI，BspQI，BlpI，TseI，ApeKI，Bsp1286I，AlwI，BamHI，BtsCI，FokI，FseI，SfiI，NarI，PluTI，KasI，AscI，EciI，BsmFI，ApaI，PspOMI，Sau96I，KpnI，Acc65I，BsaI，HphI，BstEII，AvaII，BanI，BaeGI，BsaHI，BanII，CviQI，BciVI，SalI，BcoDI，BsmAI，ApaLI，BsgI，AccI，Tsp45I，BsiHKAI，TspRI，ApoI，NspI，BsrFαI，BstYI，HaeII，EcoO109I，PpuMI，I-CeuI，I-SceI，BspHI，BspEI，MmeI，TaqαI，Hpy188I，Hpy188III，XbaI，BclI，PI-PspI，BsrGI，MseI，PacI，BstBI.PspXI，BsaWI，EaeI，HpyF30I，Sfr274I。

在某些实施方案中，预期可排除这些中的1、2、3、4、5、6、7、8、9、10或更多种，或其中可推导出的任何范围。

在本公开内容的方法中用于衔接子连接的衔接子可以是任何种类的，但是在一些实施方案中，它们被专门设计为对应于它们可连接的片段的末端。在一些实施方案中，衔接子被配置为与经酶消化的核酸分子连接。例如，在获得起始核酸物质(例如来自样品的cfDNA)之后，将核酸用一种或更多种特定酶消化。可出于富集特定类型的核酸分子(例如，富CpG)的目的、出于产生基本上具有某尺寸范围的片段的目的或其组合来选择酶。作为一个实例，原始cfDNA可用MspI消化。在这样的情况下，衔接子对应于DNA的在经消化末端包含CG(在5’至3’方向)突出端的经MspI消化的DNA末端。在一些这样的实施方案中，衔接子在其末端具有GC(在3’至5’方向)突出端，使得它们与经MspI消化的DNA末端互补并且能够与其连接。

图2中的衔接子仅是可用于本公开内容的方法中的衔接子的一些实例。用于本公开内容的方法的衔接子可包含：具有与经限制酶消化的片段的突出端互补的序列的突出端的标准衔接子(例如，图2A、图2B、图2C、图2D和图2E)，或者具有随机和/或固定序列加上与经限制酶消化的片段的突出端互补的序列的标准衔接子(例如，图2F、图2G、图2H、图2I、图2J、图2K、图2L、图2M、图2N和图2O)。在一些实施方案中，衔接子可以是衔接子-衔接子二聚体的形式，包括例如以上衔接子的(例如，图2P、图2Q和图2R)；这种类型的衔接子专门设计为衔接子二聚体，与作为方法的副产物产生的衔接子二聚体相反，例如本公开内容的衔接子二聚体。

在一些实施方案中，出于能够在具有两个衔接子分子的衔接子二聚体产生之后被限制酶消化的目的来设计衔接子。除了这个特征之外，它们还可出于这样的目的被设计：当衔接子与cfDNA片段的末端连接时，消化衔接子二聚体本身的限制酶不能消化衔接子与经消化的cfDNA片段的末端之间的连接。图3A至3E示出了可被限制酶消化的一些衔接子二聚体的实例。

图4示出了本公开内容的用于文库制备的方法的一个实例例如用于cfDNA的甲基化谱分析以应用于例如癌症诊断的用途。作为一个实例，限制酶MspI用于在识别位点CCGG处消化cfDNA。两个末端均被MspI切割的片段包含富CpG位点，其可用于甲基化谱分析。具有GC(在3’至5’方向)突出端的所设计衔接子可与MspI切割的末端连接。然后使经消化的片段进行亚硫酸氢盐处理，使得可将甲基化核酸碱基与非甲基化核酸碱基区分开。在亚硫酸氢盐转化之后，可进行PCR以富集两个末端均与专门设计的衔接子连接的片段，以用于测序和甲基化谱分析。

在图4的实例中，具有GC突出端的衔接子可形成在衔接子二聚体的连接处具有5’-CTCGAG-3’序列的衔接子二聚体。然而，衔接子与作为限制酶消化(在本实例中为MspI)的产物的靶DNA片段的末端之间的连接包含不同的序列：5’-CTCGG-3’(或者如果中间C是非甲基化的，则在亚硫酸氢盐转化之后为5’-CTTGG-3’)等。在一些实施方案中，PCR引物被设计为识别衔接子与靶DNA之间的连接，但不识别衔接子二聚体中的衔接子分子之间的连接。通过这种设计，只有在衔接子之间插入了靶DNA片段的连接产物可被扩增和富集，例如以用于测序。

图5示出了用于例如出于cfDNA甲基化组谱分析的目的的酶促文库制备的方法的一个实例。在本实例中，在MspI消化之后，在5’端具有GC突出端的靶DNA片段与在5’端具有GC突出端的衔接子直接连接。识别衔接子-衔接子连接序列但不识别衔接子与靶DNA的连接序列的另一些限制酶(例如Xhol、SmlI和TaqαI)用于在连接反应之后切割衔接子二聚体。然后可使经限制酶消化的连接产物发生亚硫酸氢盐转化和PCR富集。

图6示出了用于酶促文库制备(包括用于cfDNA甲基化组谱分析，作为一个实例)的方法的一个实例。在本实例中，酶促消化和衔接子连接在同一反应中进行。在该反应中，限制酶MspI(作为一个实例)产生了在5’端具有GC(在3’至5’方向)突出端的靶DNA片段。在同一反应中，在存在DNA连接酶的情况下，在5’端具有GC突出端的衔接子与靶DNA片段连接。衔接子和衔接子、或经MspI消化的片段，也可彼此连接。为了避免衔接子-衔接子连接形成衔接子二聚体产物，将限制酶BspDI添加到反应中，限制酶BspDI可识别和切割衔接子-衔接子连接，而混合物中的MspI可消化连接的靶DNA片段。然而，衔接子与靶DNA连接产物的连接不具有可被限制酶(例如BspDI或MspI)消化的识别位点。反应中的限制酶消化和衔接子连接可在相同温度或不同温度下进行。

图7示出了用于cfDNA甲基化组谱分析的酶促文库制备的方法的一个实例。类似于图6中所示的方法，酶促消化和衔接子连接在同一反应中进行。用于该反应的衔接子为了长期稳定性以例如如图2P、图2Q、和图2R中所示的衔接子-衔接子二聚体的形式合成。在本公开内容的方法中，作为用于实现方法步骤的目的(与作为方法步骤的一部分产生的相反)的衔接子二聚体的衔接子是专门人工设计的。BspDI限制酶可消化这种类型的衔接子，以形成可用于与靶DNA片段连接的衔接子产物。

衔接子二聚体的酶促消化可在亚硫酸氢盐转化之后或在PCR扩增之后进行。如图8中所示，在PCR富集步骤之后，可利用限制酶SmlI(作为一个实例)来切割衔接子二聚体。

图9A至9C示出了基于本公开内容的方法从cfDNA制备典型的简化代表性亚硫酸氢盐测序(RRBS)文库的一个实例。在本实例中，进行酶促文库制备以从提取自患者血浆的cfDNA中产生三个RRBS文库。完整的方案包括：

1.酶促反应：酶促反应溶液可包含10纳克(ng)的cfDNA、H₂O、10x CutSmart、ATP、DTT、PEG、衔接子、MspI、BspDI和连接酶。在混合之后，将溶液置于热循环仪中以运行以下程序：17个循环的(37℃30’；25℃30’)；37℃90’；4℃∞。将酶促反应产物用Ampure XP珠(Beckman Coulter)纯化。

2.亚硫酸氢盐转化：亚硫酸氢盐转化可以用EpiTect亚硫酸氢盐试剂盒(Qiagen)按照制造商的方案进行。

3.PCR扩增：扩增亚硫酸氢盐转化产物以在最终文库中富集含有衔接子的片段。PCR反应溶液可包含亚硫酸氢盐转化产物、NEB索引引物、NEB通用引物、KAPA HiFI UracilReady Mix和H₂O。在混合之后，将溶液置于热循环仪中以运行以下程序：98℃45’；15个循环的(98℃15’；60℃30’；72℃30’)；72℃60’；4℃∞。将PCR反应产物用Ampure XP珠(BeckmanCoulter)纯化，以及使经纯化的文库准备好以在平台例如Illumina HiSeq 2000中进行测序。

在该实例中，在酶促反应中使用限制酶MspI以消化cfDNA片段。在亚硫酸氢盐转化和PCR扩增之后，该示例性方法产生了与从完整DNA制备的传统RRBS文库相当的测序文库。如图9A至9C中所示，对文库大小的TBE-尿素-聚丙烯酰胺凝胶分析(图9A)和基于测序数据的片段尺寸分析(图9B)二者均示出了典型RRBS文库的结果，其中存在与Alu重复相关的在约68bp、135bp和202bp处的三个特征峰。图9C示出了对测序结果的总结，包括：总测序读出；幸免于QC管道中的修整的测序读出的百分比；重复的百分比；以CGG序列开始的R1测序读出；以CGG序列开始的R2测序读出；映射至特征性RRBS区域的测序读出的百分比。

本公开内容的一些实施方案至少包括用于制备核酸文库的方法、用于产生多个多核苷酸的方法、用于产生双链DNA的方法、使用核苷酸来产生文库、用于制备测序文库的方法、应用测序文库的方法等。

一些实施方案包括涉及以下任何步骤中的1、2、3、4、5、6、7、8、9、10或更多个，或其中可推导出的任何范围的方法：提供多个DNA分子，分离DNA分子，将DNA片段与衔接子连接，消化多个DNA分子，扩增DNA分子，将衔接子与DNA片段连接，分析任何种类的DNA分子，使用连接酶，产生DNA分子的混合物，产生经连接的分子的混合物，产生经衔接子连接的分子或片段的混合物，富集某些DNA分子(包括不是衔接子二聚体的分子，作为一个实例)的群体，进行某一个或更多个步骤，区分某些DNA分子，区分甲基化和非甲基化碱基，使某些DNA分子发生亚硫酸氢盐转化、酶促反应和/或化学反应等。

III.用于测序文库制备的核酸分子

在一些实施方案中，从中制备测序文库的核酸分子是DNA，并且在一些实施方案中，DNA是无细胞DNA(cfDNA)。cfDNA可从对象或个体(包括哺乳动物)获得。cfDNA可来自需要分析cfDNA的对象或个体，例如以提供关于其健康的确定，例如检测疾病状况或风险或其易感性。cfDNA可获自或来源于来自个体的一种或更多种样品。样品可获自或来源于血浆、血清、骨髓、脑脊液、胸膜液、唾液、粪便或尿。从中制备文库的cfDNA可以是双链的、单链的(并且其中在该方法之前进行的操作可包括第二链的聚合)，或其混合物。

在一些实施方案中，在用于本公开内容的方法之前，可修饰期望为其制备文库的核酸分子。例如，可富集核酸分子中某种类型的核酸分子、某种尺寸的核酸分子，或其组合。在一些实施方案中，核酸分子是已例如针对某种尺寸的分子和/或针对具有一种或更多种特定特征的分子例如包含一个或更多个甲基化位点的那些而被富集的cfDNA。

IV.测序文库的应用

本公开内容提供了与用于任何种类的分析(包括用于测序、用于确定甲基化品质或数量等)的分子的制备相关的方法、系统和组合物。在一些实施方案中，分子包含cfDNA，并且在一些实施方案中，cfDNA获自或来源于个体(例如来自对象或个体的血液或血浆或尿(或其组合)样品)。在一些实施方案中，在文库制备之后，本公开内容提供了用于在cfDNA分子中(例如在cfDNA分子的富CpG区域中)评价DNA甲基化的方法和系统。

本公开内容涉及用于提供关于cfDNA的甲基化信息的方法的多个方面。一些实施方案包括在cfDNA的富CpG区域中评价DNA甲基化的方法。

对于与疾病例如癌症相关的本公开内容的一些实施方案，合适样品中cfDNA的检测和表征可以是用于获得信息的有效方法。例如，在文库制备之后，制备的测序文库可用于确定个体是否患有特定疾病或医学病症或处于其风险或易感性之中。在一个实例中，个体患有或被怀疑患有癌症或处于患有癌症的风险之中，并且对所制备的cfDNA分子的文库的分析有助于确定个体是否患有或被怀疑患有癌症或处于患有癌症的风险之中。

在一些实施方案中，文库制备后的方法(post-library preparation method)涉及非侵入性癌症筛选，包括鉴定肿瘤组织来源。与传统组织活检不同，液体活检(其也可称为流体活检或流体相活检)例如抽血可用于鉴定多种不同的恶性肿瘤并且可用于本公开内容的方法中。

在一些实施方案中，多个DNA片段的至少一个子集具有甲基化的核酸碱基。在一些实施方案中，起始cfDNA分子可具有零个、一个或更多个CpG位点并且该方法包括将无细胞DNA分子鉴定为具有两个或三个或四个或更多个CpG位点。在一些实施方案中，该方法还包括使cfDNA分子或其衍生物(包括经衔接子连接的DNA片段或扩增的经衔接子连接的DNA片段)经受足以允许将分子中的甲基化核酸碱基与非甲基化核酸碱基区分开的条件。在一些实施方案中，使多个cfDNA分子、多个DNA片段、或其衍生物经受足够的条件包括对所述多个DNA片段进行亚硫酸氢盐转化。在一些实施方案中，使多个cfDNA分子、多个DNA片段、或其衍生物经受足够的条件包括进行酶促和/或化学反应以使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化，随后使氧化反应产物还原和/或脱氨基。

在一些实施方案中，该方法还包括测量多个DNA片段的至少一部分或多个经衔接子连接的DNA片段的至少一部分的甲基化状态，以提供多个DNA片段的至少一部分的甲基化谱。在一些实施方案中，该方法还包括测量经衔接子连接的DNA片段或扩增的经衔接子连接的DNA片段的至少一部分的甲基化状态，以提供cfDNA的甲基化谱。在一些实施方案中，该方法还包括针对一个或更多个参考处理甲基化谱。甲基化谱可包含任意数目的CpG位点、富CpG序列和/或CpG岛的信息(包括某些甲基化位点的存在和/或不存在)。在一些实施方案中，参考包含一个或更多个另外对象的参考cfDNA分子甲基化谱。例如，从中获得参考cfDNA甲基化谱的对象可以是健康的、可以无癌症的、可患有癌症或可具有升高的患有癌症的风险。

在一些实施方案中，多个cfDNA分子获自所述对象的身体样品。在一些实施方案中，身体样品选自血浆、血清、骨髓、脑脊液、胸膜液、唾液、粪便、痰、乳头抽出物、活检、颊刮屑、尿及其组合。在一些实施方案中，所述方法还包括处理具有一个或更多个CpG位点的分子，以产生多个cfDNA分子的甲基化谱。在一些实施方案中，所述方法还包括处理甲基化谱以产生对象患有或被怀疑患有疾病或病症的可能性。在其中将来自个体的样品的甲基化谱与一种或更多种参考进行比较的情况下，一种或更多种参考的样品的来源可与该个体的样品来源相同或可与其不同。

在一些实施方案中，期望其信息的疾病或病症选自癌症、多发性硬化、创伤性或缺血性脑损伤、糖尿病、胰腺炎、阿尔茨海默病(Alzheimer’s disease)和胎儿异常。在一些实施方案中，所述疾病或病症是选自以下的癌症：胰腺癌、肝癌、肺癌、结直肠癌、白血病、膀胱癌、骨癌、脑癌、乳腺癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、黑素瘤、卵巢癌、睾丸癌、肾癌、肉瘤、胆道癌、甲状腺癌、胆囊癌、脾癌和前列腺癌。

在一些实施方案中，从所述对象的身体样品获得的cfDNA分子的甲基化模式可用于监测异常的组织特异性细胞死亡或器官移植。

在一些实施方案中，使用本文中涵盖的富集cfDNA中的富CpG区域或CpG岛的方法或系统所产生的文库用于应用。在一些实施方案中，测定文库的一个或更多个特征。可测定文库以确定文库的一些或全部分子中甲基化位点的量和/或位置。在一些实施方案中，确定文库的一些或全部分子中的至少一部分(包括一个或更多个特定位点)的甲基化模式。可对文库的一些或全部分子的至少一部分进行甲基化谱分析。

在一些实施方案中，一个或更多个甲基化位点或标志物可包括多种特定疾病或病症(包括癌症)的血浆甲基化生物标志物。可通过将来自具有某疾病或病症特征(癌症类型、阶段、预后、治疗响应等)的患者的甲基化谱数据与来自健康对照的甲基化谱数据进行比较来鉴定差异甲基化的生物标志物。通过鉴定出对不同癌症或组织类型具有特异性的多种甲基化谱，本文中公开的一些实施方案可基于简单的非侵入性液体活检来检测多种类型的癌症，以及为进一步的具体临床研究提供肿瘤位置信息。例如，基于非侵入性液体活检，甲基化谱可用于检测任何疾病或病症。

在一些实施方案中，至少部分地基于确定对象是否具有指示疾病或病症的cfDNA甲基化谱，可将cfDNA甲基化谱用于诊断对象或患者。在一些方面中，本公开内容提供了基于cfDNA甲基化谱来诊断对象的方法，其包括产生指示癌症、患者是否患有癌症的cfDNA甲基化谱。在一些实施方案中，通过使用本文中涵盖的方法、组合物和系统来处理来自患者的包含无细胞DNA的生物样品来产生cfDNA甲基化谱。

在一些实施方案中，cfDNA甲基化谱可用于诊断具有癌症症状、无癌症症状、具有癌症家族史或患者史、处于癌症的风险之中或已被诊断为患有癌症的患者。患者可以是哺乳动物患者，尽管在大多数实施方案中患者是人。癌症可以是恶性、良性、转移性或癌前期。在另一些实施方案中，癌症是黑素瘤、非小细胞肺癌、小细胞肺癌、肺癌、肝癌、视网膜母细胞瘤、星形细胞瘤、胶质母细胞瘤、牙龈瘤(gum)、舌瘤、白血病、神经母细胞瘤、头癌、颈癌、乳腺癌、胰腺癌、前列腺癌、肾癌、骨癌、睾丸癌、卵巢癌、肝癌、间皮瘤、宫颈癌、胃肠癌、淋巴瘤、脑癌、结肠癌、肉瘤、胆囊癌甲状腺癌、脾癌或膀胱癌。癌症可包括包含肿瘤细胞的肿瘤。

在一些方面中，本公开内容提供了基于本文中的富集包含CpG岛或富CpG DNA以用于癌症诊断的方法和系统，在确定有此需要之后在癌症患者中治疗癌症的方法。这样的治疗方法可包括在基于本文中公开的方法确定患者患有癌症之后，向患者施用有效量的化学治疗、放射治疗、激素治疗、靶向治疗或免疫治疗(或其组合)。可确定癌症的起源点，在这种情况下，将治疗调整至该起源的癌症。在一些实施方案中，肿瘤切除术作为治疗进行，或者可以是具有其他治疗之一的治疗的一部分。化学治疗剂的一些实例包括但不限于：烷化剂，例如双官能烷化剂(例如，环磷酰胺、氮芥、苯丁酸氮芥、美法仑(melphalan))或单官能烷化剂(例如，达卡巴嗪(dacarbazine)(DTIC)、亚硝基脲、替莫唑胺(temozolomide)(口服达卡巴嗪))；蒽环类药物(例如，柔红霉素(daunorubicin)、多柔比星(doxorubicin)、表柔比星(epirubicin)、伊达比星(idarubicin)、米托蒽醌(mitoxantrone)和戊柔比星(valrubicin))；破坏细胞骨架的紫杉烷类(例如，紫杉醇(paclitaxel)、多西他赛(docetaxel)、abraxane、泰索帝(taxotere))；埃博霉素(epothilone)；组蛋白去乙酰酶抑制剂(例如，伏立诺他(vorinostat)、罗米地辛(romidepsin))；拓扑异构酶I抑制剂(例如，伊立替康(irinotecan)、拓扑替康(topotecan))；拓扑异构酶II抑制剂(例如，依托泊苷(etoposide)、替尼泊苷(teniposide)、塔氟泊苷(tafluposide))；激酶抑制剂(例如，硼替佐米(bortezomib)、厄洛替尼(erlotinib)、吉非替尼(gefitinib)、伊马替尼(imatinib)、维罗非尼(vemurafenib)和维莫德吉(vismodegib))；核苷酸类似物和核苷酸前体类似物(例如，阿扎胞苷(azacitidine)、硫唑嘌呤、卡培他滨(capecitabine)、阿糖胞苷、去氧氟尿苷(doxifluridine)、氟尿嘧啶(fluorouracil)、吉西他滨(gemcitabine)、羟基脲、巯基嘌呤、甲氨蝶呤、硫鸟嘌呤(tioguanine)(以前是硫鸟嘌呤(thioguanine))；肽类抗生素(例如，博来霉素(bleomycin)、放线菌素(actinomycin))；基于铂的抗肿瘤药(例如，卡铂、顺铂、奥沙利铂(oxaliplatin))；类视黄醇(例如，维生素A酸(retinoin)、阿利维A酸(alitretinoin)、贝沙罗汀(bexarotene))；以及长春花生物碱(例如，长春碱(vinblastine)、长春新碱(vincristine)、长春地辛(vindesine)和长春瑞滨(vinorelbine))。免疫治疗的一些实例包括但不限于：细胞治疗，例如树突细胞治疗(例如，涉及嵌合抗原受体)；抗体治疗(例如阿仑单抗(Alemtuzumab)、阿特珠单抗(Atezolizumab)、伊匹单抗(Ipilimumab)、纳武单抗(Nivolumab)、奥法木单抗(Ofatumumab)、派姆单抗(Pembrolizumab)、利妥昔单抗(Rituximab)或与这些抗体之一具有相同靶标的其他抗体，例如CTLA-4、PD-1、PD-L1或其他检查点抑制剂)；以及细胞因子治疗(例如干扰素或白介素)。

在一些实施方案中，使用cfDNA甲基化谱分析来诊断对象的方法可还包括在确定患者的甲基化谱之前或之后进行活检，进行CAT扫描，进行乳房X光检查(mammogram)，进行超声检查或以其他方式评价被怀疑为癌性的组织。在一些实施方案中，将发现的癌症以癌症分类或分期(例如，I期、II期、III期或IV期)进行分类。

在一些实施方案中，通过富集cfDNA中CpG岛的方法和系统获得的cfDNA甲基化谱用于监测治疗和/或监测肿瘤进展，包括在治疗期间和/或之后。例如，可在多个时间点抽血以监测贯穿一种或更多种治疗方案的肿瘤进展，并且可测定其中的cfDNA。

在一些实施方案中，通过本公开内容的方法和系统获得的cfDNA甲基化谱可用于评估疾病阶段或用作预后生物标志物，例如在其中不能进行组织活检或其中存档的肿瘤样品不能用于遗传分析的情况下。

在一些实施方案中，通过本文中提供的富集cfDNA中富CpG区域的方法和系统获得的cfDNA甲基化谱可用于癌症的筛选和早期检测。例如，可以定期从没有任何癌症症状的个体抽取血液，以尽早发现癌症或确定对癌症的预先倾向性。

在一些实施方案中，通过本文中提供的富集cfDNA中富CpG区域的方法和系统获得的cfDNA甲基化谱可用于从母体血浆或血清中进行胎儿DNA的产前测试，以鉴定唐氏综合症(Down syndrome)和胎儿中的其他染色体异常。

在一些实施方案中，通过本文中提供的富集cfDNA中富CpG区域的方法和系统获得的cfDNA甲基化谱可用于器官移植监测。

在一些实施方案中，通过本文中提供的富集cfDNA中富CpG区域的方法和系统获得的cfDNA甲基化谱可用于诊断另一些类型的疾病，例如多发性硬化、创伤性/缺血性脑损伤、糖尿病、胰腺炎或阿尔茨海默病、或感染性疾病。

预期本说明书中讨论的任何实施方案均可相对于本发明的任何方法、系统、试剂盒、计算机可读介质或装置来实施，反之亦然。此外，本公开内容中使用的装置可用于实现本公开内容的方法。

在一些实施方案中，一个或更多个CpG位点包含两个或更多个、三个或更多个或四个或更多个CpG位点。在一些实施方案中，所述方法还包括产生报告，例如电子输出指示甲基化谱的报告。在一些实施方案中，所述方法还包括处理甲基化谱以产生对象患有或被怀疑患有至少一种疾病或病症的可能性或风险。在一些实施方案中，疾病或病症选自癌症、多发性硬化、创伤性或缺血性脑损伤、糖尿病、胰腺炎、阿尔茨海默病和胎儿异常。在一些实施方案中，疾病或病症是选自以下的癌症：胰腺癌、肝癌、肺癌、结直肠癌、白血病、膀胱癌、骨癌、脑癌、乳腺癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、黑素瘤、卵巢癌、睾丸癌、肾癌、肉瘤、胆道癌、甲状腺癌、脾癌、胆囊癌和前列腺癌。

在一些实施方案中，一个或更多个CpG位点包含两个或更多个CpG位点。在一些实施方案中，一个或更多个计算机处理器被单独或共同编程以电子输出指示甲基化谱的报告。在一些实施方案中，一个或更多个计算机处理器被单独或共同编程以处理甲基化谱以产生对象患有或被怀疑患有一种或更多种疾病或病症的可能性或风险。在一些实施方案中，所述疾病或病症选自癌症、多发性硬化、创伤性或缺血性脑损伤、糖尿病、胰腺炎、阿尔茨海默病和胎儿异常。在一些实施方案中，所述疾病或病症是选自以下的癌症：胰腺癌、肝癌、肺癌、结直肠癌、白血病、膀胱癌、骨癌、脑癌、乳腺癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、黑素瘤、卵巢癌、睾丸癌、肾癌、肉瘤、胆道癌、甲状腺癌、脾癌、胆囊癌和前列腺癌。

在另一个方面中，本公开内容提供了包含机器可执行代码的非暂时性计算机可读介质，所述代码在由一个或更多个计算机处理器执行时实施用于处理或分析经受本公开内容文库制备方法的多个cfDNA分子的方法，所述方法包括：(a)检索由测序仪产生的多个序列读出，其中所述多个序列读出的至少子集包含含有以下的独立序列读出：(i)来自所述多个cfDNA分子的序列以及(ii)在每个所述独立序列读出的两个末端的衔接子序列，该衔接子序列不来自所述多个无细胞DNA分子；(b)处理所述多个序列读出以(i)从所述多个序列读出中鉴定在两个末端均具有所述衔接子序列的一个或更多个序列读出，以及(ii)将所述一个或更多个序列读出鉴定为与所述多个无细胞DNA分子的一个或更多个CpG位点相关；以及(c)使用在(b)中鉴定的所述一个或更多个CpG位点产生所述多个无细胞DNA分子的甲基化谱。

可使由来自对象的cfDNA样品制备的文库进行任何类型的分析，包括甲基化谱分析，以用于例如肿瘤或非实体癌的筛选、诊断、预后、治疗选择或治疗监测。例如，分析可表明具有某些甲基化谱的患者可最佳地响应于手术、化学治疗、放射治疗、靶向治疗、激素治疗、免疫治疗或其组合。cfDNA样品的准确甲基化谱分析可潜在地阻止将无效治疗开给和施用于患者。

V.测序文库的甲基化谱分析

在使用本文中涵盖的方法制备分子文库之后，可对富集的DNA分子进行甲基化谱分析。例如，可使用任何合适的测序方法从富集的DNA分子产生测序读出。测序方法可以是第一代测序方法，例如Maxam-Gilbert或Sanger测序，或高通量测序(例如，下一代测序或NGS)方法。高通量测序方法可同时(或基本同时)对至少10,000、100,000、1百万、1千万、1亿、10亿或更多个多核苷酸分子进行测序。测序方法可包括但不限于：焦磷酸测序、合成测序(sequencing-by-synthesis)、单分子测序(single-molecule sequencing)、纳米孔测序(nanopore sequencing)、半导体测序(semiconductor sequencing)、连接测序(sequencing-by-ligation)、杂交测序(sequencing-by-hybridization)、数字基因表达(Helicos)、大规模并行测序，例如Helicos、Clonal Single Molecule Array(Solexa/Illumina)、使用PacBio、SOLiD、Ion Torrent或Nanopore平台、BGISEQ或其组合的测序。

在一些实施方案中，测序包括全基因组测序(whole genome sequencing，WGS)。在一些实施方案中，测序包括例如参考DNA样品的全基因组亚硫酸氢盐测序(WGBS)。在一些实施方案中，测序包括例如参考DNA样品的简化代表性亚硫酸氢盐测序(RRBS)。在一些实施方案中，测序包括使用包含多个遗传基因座的组的靶向测序。测序可以在足以以期望的性能(例如，准确性、灵敏度、特异性、阳性预测值(positive predictive value，PPV)、阴性预测值(negative predictive value，NPV)或受试者操作特征(receiver operatorcharacteristic，ROC)曲线下面积(area under curve，AUC))在对象中进行甲基化谱分析的深度进行。在一些实施方案中，测序以至少约5X、至少约10X、至少约20X、至少约50X、至少约75X、至少约100X、至少约125X、至少约150X、至少约175X或至少约200X(或其中可推导出的任何范围)的深度进行。

在一些实施方案中，多个遗传基因座可对应于基因组的编码和/或非编码基因组区域，例如CpG岛、高甲基化区域和/或低甲基化区域、和/或邻近这样的高甲基化区域和/或低甲基化区域的区域。基因组区域可对应于基因组的癌症相关(或肿瘤相关)编码和/或非编码基因组区域，例如癌症驱动突变或遗传变体。遗传变体可包括例如单核苷酸变体(single nucleotide variant，SNV)、拷贝数变体(copy number variant，CNV)、插入或缺失(插失(indel))、融合基因、高甲基化和低甲基化。

在一些实施方案中，对对象进行甲基化谱分析可包括将cfDNA测序读出与参考基因组进行比对。参考基因组可包含基因组(例如，人基因组)的至少一部分。参考基因组可包含整个基因组(例如，整个人基因组)。在一些实施方案中，参考基因组可包含多个基因组区域，其对应于基因组的编码和/或非编码基因组区域，例如富CpG区域、CpG岛、高甲基化区域和/或低甲基化区域、和/或邻近这样的高甲基化区域和/或低甲基化区域的区域。多个基因组区域可对应于基因组的癌症相关(或肿瘤相关)编码和/或非编码基因组区域，例如癌症驱动突变或遗传变体。遗传变体可包括例如单核苷酸变体(SNV)、拷贝数变体(CNV)、插入或缺失(插失)、融合基因、高甲基化和低甲基化。可使用例如Burrows-Wheeler算法或其他比对算法(例如，适用于亚硫酸氢盐转化的读出)来进行比对。

在一些实施方案中，在对象中进行甲基化谱分析可包括产生针对多个遗传基因座中的每一个的cfDNA测序读出的定量测量。可产生对cfDNA测序读出的定量测量，例如与给定基因座(例如，富CpG区域、CpG岛、高甲基化区域、低甲基化区域、邻近高甲基化区域的区域、或邻近低甲基化区域的区域)对齐的DNA测序读出的计数。例如，具有与给定的富CpG区域或CpG岛对齐的测序读出的一部分或全部的cfDNA测序读出可以计入对该富CpG区域或CpG岛的定量测量。

特定和非特定富CpG区域和/或CpG岛的模式的组合可形成对象的甲基化谱。富CpG区域和/或CpG岛的这些模式随时间的变化可指示对象甲基化谱的变化。这样的变化可包括一个或更多个特定CpG位点的甲基化的存在或不存在、特定富CpG位点或岛的甲基化水平的提高、特定富CpG位点或岛的甲基化水平的降低等。

在一些实施方案中，可进行结合测量以用于甲基化谱分析，其可包括使用对多个富集的cfDNA片段中的多个富CpG区域和/或CpG岛具有选择性的探针来测定富集的cfDNA片段。在一些实施方案中，探针是与富CpG区域和/或CpG岛的核酸序列具有序列互补性的核酸分子。在一些实施方案中，核酸分子是引物或富集序列。在一些实施方案中，所述测定包括使用阵列杂交或聚合酶链反应(PCR)或核酸测序。

在一些实施方案中，可针对多个遗传基因座的至少一部分对文库进行富集。在一些实施方案中，富集可包括扩增多个文库分子。例如，可通过选择性扩增(例如，通过使用包含与CpG岛的核酸序列具有序列互补性的核酸分子的引物或探针的组)来扩增多个cfDNA分子。替代地或组合地，可通过通用扩增(例如，通过使用通用引物)来扩增多个cfDNA分子。在一些实施方案中，富集包括选择性地分离多个cfDNA分子的至少一部分。

在一些实施方案中，在对象中进行甲基化谱分析包括处理来自文库的序列读出以获得偏差的定量测量。在一些实施方案中，偏差的定量测量是相对于一个或更多个参考cfDNA样品的z评分。参考cfDNA样品可获自具有特定甲基化谱的对象和/或获自不具有特定甲基化谱的对象。参考cfDNA样品可获自具有癌症类型的对象或不具有癌症类型的对象(例如，胰腺癌、肝癌、肺癌、结直肠癌、白血病、膀胱癌、骨癌、脑癌、乳腺癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、黑素瘤、卵巢癌、睾丸癌、肾癌、肉瘤、胆道癌、甲状腺癌、胆囊癌、脾癌和前列腺癌)。参考cfDNA样品可获自具有特定癌症阶段或不具有特定癌症阶段(包括I期、II期、III期或IV期)的对象。参考cfDNA样品可获自具有异常组织特异性细胞死亡的对象。

在一些实施方案中，在对象中进行甲基化谱分析包括当偏差的定量测量满足预定标准时确定对象的偏差的cfDNA甲基化谱。在一些实施方案中，预定标准是对象的甲基化谱的z评分(或从多个z评分计算的定量测量)大于或小于预定数目。预定数目可以是约0.1、约0.2、约0.5、约1、约1.5、约2、约2.5、约3、约3.5、约4、约4.5、约5或大于约5。

在一些实施方案中，针对一个或更多个特定遗传基因座分析所制备的测序文库。在一些实施方案中，多个遗传基因座包含富CpG区域、CpG岛、高甲基化区域和/或低甲基化区域、和/或邻近这样的高甲基化区域和/或低甲基化区域的区域。多个遗传基因座可包含至少约10个独特遗传基因座、至少约20个独特遗传基因座、至少约30个独特遗传基因座、至少约40个独特遗传基因座、至少约50个独特遗传基因座、至少约75个独特遗传基因座、至少约100个独特遗传基因座、至少约500个独特遗传基因座、至少约1千个独特遗传基因座、至少约5千个独特遗传基因座、至少约1万个独特遗传基因座、至少约5万个独特遗传基因座、至少约10万个独特遗传基因座、至少约50万个独特遗传基因座、至少约100万个独特遗传基因座、至少约200万个独特遗传基因座、至少约300万个独特遗传基因座、至少约400万个独特遗传基因座、至少约500万个独特遗传基因座、至少约1000万个独特遗传基因座、至少约2500万个独特遗传基因座、至少约5000万个独特遗传基因座、至少约7500万个独特遗传基因座、至少约1亿个独特遗传基因座、或超过1亿个独特遗传基因座，或其中可推导出的任何范围。独特遗传基因座的位置可在或可不在同一基因中、同一染色体上或不同染色体上。

在一些实施方案中，以以下灵敏度进行确定对象的偏差的cfDNA甲基化谱：至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％，或其中可推导出的任何范围。

在一些实施方案中，以以下特异性进行确定对象的偏差的cfDNA甲基化谱：至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％，或其中可推导出的任何范围。

在一些实施方案中，以以下阳性预测值(PPV)进行确定对象的偏差的cfDNA甲基化谱：至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％，或其中可推导出的任何范围。

在一些实施方案中，以以下阴性预测值(NPV)进行确定对象的偏差的cfDNA甲基化谱：至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％，或其中可推导出的任何范围。

在一些实施方案中，以以下受试者操作特征(ROC)曲线下面积(AUC)进行确定对象的偏差的cfDNA甲基化谱：至少约0.5、至少约0.6、至少约0.7、至少约0.75、至少约0.8、至少约0.85、至少约0.9、至少约0.95、至少约0.96、至少约0.97、至少约0.98、或至少约0.99，或其中可推导出的任何范围。

在一些实施方案中，在对象中进行甲基化谱分析包括当偏差的定量测量满足预定标准时确定对象的正常cfDNA甲基化谱。在一些实施方案中，预定标准是对象的甲基化谱的z评分(或从多个z评分计算的定量测量)大于或小于预定数目。预定数目可以是约0.1、约0.2、约0.5、约1、约1.5、约2、约2.5、约3、约3.5、约4、约4.5、约5或大于约5，或其中可推导出的任何范围。

在一些实施方案中，以以下灵敏度进行确定对象的正常cfDNA甲基化谱：至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％，或其中可推导出的任何范围。

在一些实施方案中，以以下特异性进行确定对象的正常cfDNA甲基化谱：至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％，或其中可推导出的任何范围。

在一些实施方案中，以以下阳性预测值(PPV)进行确定对象的正常cfDNA甲基化谱：至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％，或其中可推导出的任何范围。

在一些实施方案中，以以下阴性预测值(NPV)进行确定对象的正常cfDNA甲基化谱：至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％，或其中可推导出的任何范围。

在一些实施方案中，以以下受试者操作特征(ROC)曲线下面积(AUC)进行确定对象的正常cfDNA甲基化谱：至少约0.5、至少约0.6、至少约0.7、至少约0.75、至少约0.8、至少约0.85、至少约0.9、至少约0.95、至少约0.96、至少约0.97、至少约0.98、或至少约0.99，或其中可推导出的任何范围。

在一些实施方案中，对象已被诊断为患有癌症或被怀疑患有癌症或处于患有癌症的风险之中。例如，癌症可以是一种或更多种类型，包括：脑癌、乳腺癌、宫颈癌、结直肠癌、子宫内膜癌、食管癌、胃癌、肝胆道癌、白血病、肝癌、肺癌、淋巴瘤、卵巢癌、胰腺癌、皮肤癌、睾丸癌、肾癌、肉瘤、胆道癌、前列腺癌、甲状腺癌、胆囊癌、脾癌或尿道癌。

在一些实施方案中，基于所获得的对象的cfDNA甲基化谱(例如，确定偏差的cfDNA甲基化谱或正常的cfDNA甲基化谱)，本公开内容的方法包括施用治疗有效剂量的一种或更多种治疗以治疗对象的疾病或病症(例如癌症)。在一些实施方案中，所述治疗包括化学治疗、放射治疗、靶向治疗、免疫治疗或其组合。基于所获得的对象的甲基化谱，可中断对象的现有治疗，并且可向对象施用另一治疗。或者，基于所获得的对象的甲基化谱，可继续对象的现有治疗和/或可向对象施用另一治疗。基于甲基化谱的结果，个体可被认为对于一种或更多种治疗是难治性的，并因此，从不给予该治疗，或者给予该治疗但是基于同一个体随后的甲基化谱的结果中断该治疗，或者在一定数目的剂量和/或时间段已经过去之后中断该治疗。

可评估所获得的对象的cfDNA甲基化谱，以在对象中确定癌症的诊断、癌症的预后或肿瘤进展或消退的指示。另外，可基于cfDNA甲基化谱评估或监测(例如，两个或更多个时间点之间的cfDNA甲基化谱的差异)来分配一种或更多种临床结果。这样的临床结果可包括以下中的一种或更多种：诊断对象患有包含一种或更多种类型的肿瘤的癌症，诊断对象患有包含一种或更多种类型和/或阶段的肿瘤的癌症，对患有癌症的对象进行预后(例如，向对象指示、开处方或施用临床治疗方案(例如手术、化学治疗、放射治疗、激素治疗、靶向治疗、免疫治疗或其他治疗)，向对象指示、开处方或施用另一种临床作用方案(例如，不治疗，继续监测(例如基于指定的时间间隔)，停止当前治疗，切换至另一种治疗)，或者指示对象的预期存活时间。

在一些实施方案中，确定对象的cfDNA甲基化谱包括确定一个或更多个遗传基因座(例如，多个富CpG区域和/或CpG岛)的一个或更多个预定阈值。预定阈值(例如，对于多个富CpG区域和/或CpG岛中的每一个)可通过以下来产生：对来自一个或更多个对照对象(例如，已知患有或未患有某疾病或病症的患者，已知患有或未患有某肿瘤类型的患者，已知患有或未患有某阶段的某肿瘤类型的患者，或未诊断出或表现出疾病或病症的任何临床症状的健康对象)的一个或更多个样品进行cfDNA甲基化谱分析以及基于对照样品的cfDNA甲基化谱来确定合适的预定阈值。

可基于期望的灵敏度、特异性、阳性预测值(PPV)、阴性预测值(NPV)或确定对象的偏差的cfDNA甲基化谱或确定对象的正常cfDNA甲基化谱的准确性来调整预定阈值。例如，如果期望确定对象的偏差的cfDNA甲基化谱状态的高灵敏度，则可以将预定阈值调整为较低。或者，如果期望确定对象的偏差的cfDNA甲基化谱的高特异性，则可以将预定阈值调整为较高。可以调整预定阈值以使从对照对象获得的对照样品的受试者操作特征(ROC)曲线下面积(AUC)最大化。可以调整预定阈值以实现在确定对象的偏差的cfDNA甲基化谱中的假阳性(false positive，FP)和假阴性(false negative，FN)之间的期望的平衡。

在一些实施方案中，确定对象的cfDNA甲基化谱还包括在第二随后时间点重复cfDNA甲基化谱分析。可以选择第二时间点，以进行相对于第一时间点的cfDNA甲基化谱的合适比较。第二时间点的一些实例可对应于手术切除之后的时间，在于对象中治疗疾病或病症(例如癌症)的治疗施用期间或治疗施用之后的时间以监测治疗效力，或者在治疗之后在对象中在疾病或病症(例如癌症)不可检测之后的时间，例如以监测对象中的残留疾病或癌症复发。

在一些实施方案中，确定对象的cfDNA甲基化谱还包括确定第一cfDNA甲基化谱与第二cfDNA甲基化谱之间的差异，该差异指示对象的肿瘤的进展或消退。替代地或组合地，该方法可还包括通过计算机处理器生成第一cfDNA甲基化谱和第二cfDNA甲基化谱作为第一时间点和第二时间点的函数的图。该图可指示对象的肿瘤的进展或消退。例如，计算机处理器可生成y轴上的两个或更多个cfDNA甲基化谱相对于x轴上的与在对应于两个或更多个cfDNA甲基化谱的数据的收集时间相对应的时间的图。

所确定的差异或示出第一cfDNA甲基化谱与第二cfDNA甲基化谱之间差异的图可指示对象肿瘤的进展或消退。例如，如果第二cfDNA甲基化谱的偏差大于第一cfDNA甲基化谱的偏差，则该差异可指示例如肿瘤进展，治疗对于对象中的肿瘤无效，肿瘤对正在进行的治疗具有抗性，肿瘤转移到对象中的其他部位，或对象中残留疾病或癌症复发。或者，如果第二cfDNA甲基化谱的偏差小于第一cfDNA甲基化谱的偏差，则该差异可指示例如肿瘤消退，对象中肿瘤的手术切除的效力，治疗对于对象中疾病或病症(例如，癌症)的效力，或对象中没有残留疾病或癌症复发。

在评估和/或监测cfDNA甲基化谱之后，可基于cfDNA甲基化谱评估或监测(例如，两个或更多个时间点之间cfDNA甲基化谱的差异)来分配一种或更多种临床结果。这样的临床结果可包括以下中的一种或更多种：诊断对象患有包含一种或更多种类型的肿瘤的癌症，诊断对象患有包含一种或更多种类型和/或阶段的肿瘤的癌症，对患有癌症的对象进行预后(例如，向对象指示、开处方或施用临床治疗方案(例如手术、化学治疗、放射治疗、靶向治疗、免疫治疗或其他治疗)，向对象指示、开处方或施用另一种临床作用方案(例如，不治疗，继续监测(例如基于指定的时间间隔)，停止当前治疗，切换至另一种治疗)，或者指示对象的预期存活时间。

VI.试剂盒

本文中所述的任何组合物均可包含在试剂盒中。在一个非限制性实例中，cfDNA、一种或更多种用于收集cfDNA的装置、酶、衔接子、引物、dNTP、缓冲液以及其他化学品，包括ATP、DTT、亚硫酸氢钠等可包含在试剂盒中。

试剂盒的组分可在水性介质中或以冻干形式包装。试剂盒的容器装置可包括至少一个小瓶、试管、烧瓶、瓶，或可向其中放置组分并且优选适当地进行等分的其他容器装置。在试剂盒中存在多于一种组分的情况下，试剂盒还可包含第二、第三和/或可向其中单独放置另外组分的其他另外容器。然而，小瓶中可包含组分的多种组合。本公开内容的试剂盒还可包含用于紧密密闭地容纳组分以用于商业销售的装置。这样的容器可包括吹塑的塑料容器，在其中容纳有期望的小瓶。

本公开内容的试剂盒可包含用于进行本文中所提供方法的说明，所述方法例如用于消化和富集cfDNA的方法和用于使富集的cfDNA进行进一步分析(例如，PCR、核酸阵列、下一代测序)的方法。这样的说明可以是物理形式(例如，印刷的说明)或电子形式。

本公开内容的试剂盒可包含用于分析由用该试剂盒制备的测序文库产生的测序数据的软件包或到服务器或云计算平台的网络链接。分析可提供有关试剂盒品质控制的信息，例如消化效率、亚硫酸氢盐转化效率，以及提供富集的cfDNA的甲基化谱。

本公开内容的试剂盒可包含由随试剂盒提供的软件包或由服务器或云计算平台生成的报告。该报告可提供对于以下的信息：(1)对医学病症的诊断和/或预防；(2)对医学病症的治疗；(3)治疗监测；等等。例如，报告可提供关于癌症(包括特定类型的癌症)的存在或风险的信息。

尽管已经详细描述了本公开内容及其优点，但是应当理解，在不脱离由所附权利要求书限定的本发明设计的精神和范围的情况下可以在本文中做出多种修改、替换和更改。此外，本申请的范围不旨在限于说明书中描述的过程、机器、制品、物质组成、手段、方法和步骤的一些具体实施方案。如本领域普通技术人员将从本公开内容容易理解的，根据本公开内容可以利用目前存在的或以后将开发的、执行与本文中所述的对应实施方案基本上相同的功能或实现与本文中所述的对应实施方案基本上相同的结果的过程、机器、制品、物质组成、手段、方法或步骤。因此，所附权利要求书旨在将这样的过程、机器、制品、物质组成、手段、方法或步骤包括在其范围内。

Claims

1.用于制备核酸文库的方法，其包括：

(a)用第一一种或更多种限制酶消化多个DNA分子以产生DNA片段；

(b)通过与连接酶一起孵育来将衔接子与所述DNA片段连接以产生经衔接子连接的DNA片段和衔接子二聚体的混合物；

(c)扩增所述经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段；以及

(d)在(b)之后或期间和/或在(c)之后降低所述衔接子二聚体的数量，其中所述降低包括区分衔接子与DNA片段之间的连接和衔接子与另一衔接子之间的连接。

2.权利要求1所述的方法，其中所述第一一种或更多种限制酶包含：

AcII，HindIII，MluCI，PciI，AgeI，BspMI，BfuAI，SexAI，MluI，BceAI，HpyCH4IV，HpyCH4III，BaeI，BsaXI，AflIII，SpeI，BsrI，BmrI，BglII，BspDI，PI-SceI，NsiI，AseI，CspCI，MfeI，BssS^αI，DraIII，EcoP15I，AlwNI，BtsIMutI，NdeI，CviAII，FatI，NlaIIＩ，FspEI，XcmI，BstXI，PflMI，BccI，NcoI，BseYI，FauI，TspMI，XmaI，LpnPI，AclI，ClaI，SacII，HpaII，MspI，ScrFI，StyD4I，BsaJI，BslI，BtgI，NciI，AvrII，MnlI，BbvCI，SbfI，Bpul0I，Bsu36I，EcoNI，HpyAV，BstNI，PspGI，StyI，BcgI，PvuI，EagI，RsrII，BsiEI，BsiWI，BsmBI，Hpy99I，AbaSI，MspJI，SgrAI，BfaI，BspCNI，XhoI，PaeR7I，EarI，AcuI，PstI，BpmI，DdeI，SfcI，AflII，BpuEI，SmlI，AvaI，BsoBI，MboII，BbsI，BsmI，EcoRI，HgaI，AatII，PflFI，Tth111I，AhdI，DrdI，SacI，BseRI，PleI，HinfI，Sau3AI，MboI，DpnII，TfiI，BsrDI，BbvI，Bts^αI，BstAPI，SfaNI，SphI，NmeAIII，NgoMIV，BglI，AsiSI，BtgZI，HhaI，HinP1I，BssHII，NotI，Fnu4HI，MwoI，BmtI，NheI，BspQI，BlpI，TseI，ApeKI，Bsp1286I，AlwI，BamHI，BtsCI，FokI，FseI，SfiI，NarI，PluTI，KasI，AscI，EciI，BsmFI，ApaI，PspOMI，Sau96I，KpnI，Acc65I，BsaI，HphI，BstEII，AvaＩI，BanI，BaeGI，BsaHI，BanII，CviQI，BciVI，SalI，BcoDI，BsmAI，ApaLI，BsgI，AccI，Tsp45I，BsiHKAI，TspRI，ApoI，NspI，BsrF^αI，BstYI，HaeII，EcoO109I，PpuMI，I-CeuI，I-SceI，BspHI，BspEI，MmeI，Taq^αI，Hpy188I，Hpy188III，XbaI，BclI，PI-PspI，BsrGI，MseI，PacI，BstBI，PspXI，BsaWI，EaeI，HpyF30I，Sfr274I，

或其组合。

3.权利要求1或2所述的方法，其还包括在同一反应混合物中进行(a)和(b)。

4.权利要求3所述的方法，其中(a)在与(b)不同的温度下进行。

5.权利要求3所述的方法，其中(a)在与(b)相同的温度下进行。

6.权利要求1至5中任一项所述的方法，其中区分衔接子与DNA片段之间的连接和衔接子与另一衔接子之间的连接还包括使用这样的衔接子：其被设计为在处于二聚化构型时被第二一种或更多种限制酶消化，但是当所述衔接子与所述DNA片段的末端连接时，其不能被所述第二一种或更多种限制酶消化。

7.权利要求1至6中任一项所述的方法，其中(d)包括在所述扩增期间使用能够在所述衔接子与DNA片段之间的连接处引发聚合但不能在所述衔接子与另一衔接子之间的连接处引发聚合的引物。

8.用于制备核酸文库的方法，其包括：

(b)通过与连接酶一起孵育来将衔接子与所述DNA片段连接以产生经衔接子连接的DNA片段和衔接子二聚体的混合物；以及

(c)扩增所述经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段，

进行以下中的一项或更多项：

(1)使用结合所述DNA片段的末端与所述衔接子之间的连接但不结合一个衔接子的末端与另一衔接子的末端之间的连接的一种或更多种引物进行(c)；

(2)用第二一种或更多种限制酶消化所述经衔接子连接的DNA片段和衔接子二聚体的混合物，所述第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化所述DNA片段的末端与所述衔接子之间的连接；

(3)在同一反应混合物中进行(a)和(b)，以及还包括用第二一种或更多种限制酶消化所述混合物，所述第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化所述DNA片段的末端与所述衔接子之间的连接；

(4)所述衔接子是经设计的衔接子二聚体，以及还包括用第二一种或更多种限制酶消化所述经衔接子连接的DNA片段和衔接子二聚体的混合物，所述第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化所述DNA片段的末端与所述衔接子之间的连接；和/或

(5)(c)产生扩增的衔接子二聚体，其用第三一种或更多种限制酶消化，所述第三一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接。

9.权利要求8所述的方法，其还包括区分所述经衔接子连接的片段中的甲基化核酸碱基和非甲基化核酸碱基。

10.权利要求9所述的方法，其还包括使所述经衔接子连接的片段发生亚硫酸氢盐转化。

11.权利要求9或10所述的方法，其还包括使所述经衔接子连接的片段发生一个或更多个酶促和/或化学反应。

12.权利要求11所述的方法，其还包括使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化以产生氧化反应产物，随后使所述氧化反应产物还原和/或脱氨基。

13.权利要求12所述的方法，其中所述氧化用十-十一易位(TET)酶进行。

14.权利要求12所述的方法，其中所述氧化用高钌酸钾进行。

15.权利要求12所述的方法，其中氧化反应产物的脱氨基用载脂蛋白B mRNA编辑酶催化多肽样物质(APOBEC)进行。

16.权利要求12所述的方法，其中氧化反应产物的还原和/或脱氨基用吡啶硼烷进行。

17.权利要求11至16中任一项所述的方法，其还包括在所述一个或更多个酶促和/或化学反应之前进行β-葡糖基转移酶处理。

18.权利要求8至17中任一项所述的方法，其中对所述扩增的经衔接子连接的DNA片段的部分或全部进行分析、修饰或进行二者。

19.权利要求18所述的方法，其中所述分析包括测序。

20.权利要求19所述的方法，其中所述测序是下一代测序。

21.权利要求20所述的方法，其还包括在所述下一代测序之前进行靶向捕获以进一步富集经衔接子连接的片段。

22.权利要求20或21所述的方法，其还包括在所述下一代测序之前进行尺寸选择以进一步富集经衔接子连接的片段。

23.权利要求18至22中任一项所述的方法，其还包括分析所述扩增的经衔接子连接的DNA片段以产生甲基化谱。

24.权利要求8至23中任一项所述的方法，其中在(1)、(2)、(3)或(5)中，所述衔接子包含GC(在3’至5’方向)突出端。

25.权利要求8至24中任一项所述的方法，其中所述第一一种或更多种限制酶包含MspI、HpaII、TaqαI、或其功能类似物、或其混合物。

26.权利要求8至25中任一项所述的方法，其中所述第二一种或更多种限制酶包含以下中的一种或更多种：BspD1、XhoI、SmlI、HpyF30I、PaeR7I、Sfr274I、或其功能类似物、或其混合物。

27.权利要求8至26中任一项所述的方法，其中所述连接酶是T7DNA连接酶、T4 DNA连接酶、T3 DNA连接酶、Taq DNA连接酶、或其功能类似物、或其混合物。

28.权利要求8至27中任一项所述的方法，其中所述多个DNA分子包含无细胞DNA。

29.权利要求28所述的方法，其还包括获得cfDNA。

30.权利要求29所述的方法，其中所述cfDNA获自或来源于来自对象或个体的样品。

31.权利要求30所述的方法，其中所述样品获自或来源于血浆、血清、骨髓、脑脊液、胸膜液、唾液、粪便或尿。

32.权利要求30或31所述的方法，其还包括从所述对象或个体获得所述样品。

33.权利要求8至32中任一项所述的方法，其中所述衔接子包含已知序列。

34.权利要求8至32中任一项所述的方法，其中所述衔接子包含独特序列。

35.权利要求8至34中任一项所述的方法，其中针对具有一个或更多个CpG位点的分子富集所述核酸。

36.用于制备核酸文库的方法，其包括：

(c)通过使用结合所述DNA片段的末端与所述衔接子之间的连接但不结合一个衔接子的末端与另一衔接子的末端之间的连接的一种或更多种引物来扩增所述经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段。

37.权利要求36所述的方法，其中所述第一一种或更多种限制酶包含以下中的一种或更多种：MspI、HpaII、TaqαI、或其功能类似物、或其混合物。

38.权利要求36或37所述的方法，其还包括在同一反应混合物中进行(a)和(b)。

39.权利要求36至38中任一项所述的方法，其还包括区分所述经衔接子连接的片段中的甲基化核酸碱基和非甲基化核酸碱基。

40.权利要求39所述的方法，其还包括使所述经衔接子连接的片段发生亚硫酸氢盐转化。

41.权利要求39或40所述的方法，其还包括使所述经衔接子连接的片段发生一个或更多个酶促和/或化学反应。

42.权利要求41所述的方法，其还包括使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化以产生氧化反应产物，随后使所述氧化反应产物还原和/或脱氨基。

43.权利要求42所述的方法，其中所述氧化用十-十一易位(TET)酶进行。

44.权利要求42所述的方法，其中所述氧化用高钌酸钾进行。

45.权利要求42所述的方法，其中氧化反应产物的还原和/或脱氨基用APOBEC进行。

46.权利要求42所述的方法，其中氧化反应产物的还原和/或脱氨基用吡啶硼烷进行。

47.权利要求41至46中任一项所述的方法，其还包括在所述一个或更多个酶促或化学反应之前进行β-葡糖基转移酶处理。

48.权利要求36至47中任一项所述的方法，其中所述衔接子包含GC突出端。

49.用于制备核酸文库的方法，其包括：

(c)用第二一种或更多种限制酶消化所述经衔接子连接的DNA片段和衔接子二聚体的混合物，所述第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化所述DNA片段的末端与所述衔接子之间的连接；以及

(d)扩增所述经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段。

50.权利要求49所述的方法，其中所述第一一种或更多种限制酶包含以下中的一种或更多种：MspI、HpaII、TaqαI、或其功能类似物、或其混合物。

51.权利要求49或50所述的方法，其中所述第二一种或更多种限制酶是以下中的一种或更多种：BspDI、ClaI、AclI、NarI、XhoI、SmlI、HpyF30I、PaeR7I、Sfr274I、或其功能类似物、或其混合物。

52.权利要求49至51中任一项所述的方法，其还包括在同一反应混合物中进行(a)、(b)和(c)。

53.权利要求49至52中任一项所述的方法，其还包括区分所述经衔接子连接的片段中的甲基化核酸碱基和非甲基化核酸碱基。

54.权利要求53所述的方法，其还包括使所述经衔接子连接的片段发生亚硫酸氢盐转化。

55.权利要求53所述的方法，其还包括使所述经衔接子连接的片段发生一个或更多个酶促和/或化学反应。

56.权利要求55所述的方法，其还包括使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化以产生氧化反应产物，随后使所述氧化反应产物还原和/或脱氨基。

57.权利要求56所述的方法，其中所述氧化用十-十一易位(TET)酶进行。

58.权利要求56所述的方法，其中所述氧化用高钌酸钾进行。

59.权利要求56所述的方法，其中所述氧化反应产物的还原和/或脱氨基用APOBEC进行。

60.权利要求56所述的方法，其中所述氧化反应产物的还原和/或脱氨基用吡啶硼烷进行。

61.权利要求55至60中任一项所述的方法，其还包括在所述一个或更多个酶促和/或化学反应之前进行β-葡糖基转移酶处理。

62.权利要求49至61中任一项所述的方法，其中所述衔接子包含GC突出端。

63.用于制备核酸文库的方法，其包括：

(b)通过与连接酶一起孵育来将DNA片段与第一衔接子连接，所述第一衔接子是经设计的衔接子二聚体，并且使所述经设计的衔接子二聚体经受第二一种或更多种限制酶以产生第二衔接子，以及还产生与所述第二衔接子连接的DNA片段和所述第二衔接子的衔接子二聚体的混合物，其中所述第二一种或更多种限制酶消化一个第二衔接子的末端与另一第二衔接子的末端之间的连接，但不消化所述DNA片段的末端与所述第二衔接子之间的连接；以及

(c)扩增所述与所述第二衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段。

64.权利要求63所述的方法，其中所述第一一种或更多种限制酶包含以下中的一种或更多种：MspI、HpaII、TaqαI、或其功能类似物、或其混合物。

65.权利要求63或64所述的方法，其中所述第二一种或更多种限制酶包含以下中的一种或更多种：BspDI、ClaI、AclI、NarI、XhoI、SmlI、HpyF30I、PaeR7I、Sfr274I、或其功能类似物、或其混合物。

66.权利要求63至65中任一项所述的方法，其还包括在同一反应混合物中进行(a)和(b)。

67.权利要求63至66中任一项所述的方法，其还包括区分所述与所述第二衔接子连接的DNA片段中的甲基化核酸碱基和非甲基化核酸碱基。

68.权利要求67所述的方法，其还包括使所述与所述第二衔接子连接的DNA片段发生亚硫酸氢盐转化。

69.权利要求67所述的方法，其还包括使所述与所述第二衔接子连接的DNA片段发生一个或更多个酶促和/或化学反应。

70.权利要求69所述的方法，其还包括使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化以产生氧化反应产物，随后使所述氧化反应产物还原和/或脱氨基。

71.权利要求70所述的方法，其中所述氧化用十-十一易位(TET)酶进行。

72.权利要求70所述的方法，其中所述氧化用高钌酸钾进行。

73.权利要求70所述的方法，其中所述氧化反应产物的还原和/或脱氨基用APOBEC进行。

74.权利要求70所述的方法，其中所述氧化反应产物的还原和/或脱氨基用吡啶硼烷进行。

75.权利要求69至74中任一项所述的方法，其还包括在所述一个或更多个酶促或化学反应之前进行β-葡糖基转移酶处理。

76.权利要求63至75中任一项所述的方法，其中通过所述第二一种或更多种限制酶对所述第二衔接子的衔接子二聚体的消化产生GC突出端。

77.用于制备核酸文库的方法，其包括：

(b)将衔接子与所述DNA片段连接以产生经衔接子连接的DNA片段和衔接子二聚体的混合物；

(c)扩增所述经衔接子连接的DNA片段以产生扩增的经衔接子连接的DNA片段和扩增的衔接子二聚体的混合物；以及

(d)用第二一种或更多种限制酶消化所述扩增的经衔接子连接的DNA片段和扩增的衔接子二聚体的混合物，所述第二一种或更多种限制酶消化一个衔接子的末端与另一衔接子的末端之间的连接，但不消化所述DNA片段的末端与所述衔接子之间的连接。

78.权利要求77所述的方法，其中所述第一一种或更多种限制酶包含以下中的一种或更多种：MspI、HpaII、TaqαI、或其功能类似物、或其混合物。

79.权利要求77或78所述的方法，其中所述第二一种或更多种限制酶包含以下中的一种或更多种：BspDI、ClaI、AclI、NarI、XhoI、SmlI、HpyF30I、PaeR7I、Sfr274I、或其功能类似物、或其混合物。

80.权利要求77至79中任一项所述的方法，其还包括在同一反应混合物中进行(a)和(b)。

81.权利要求77至80中任一项所述的方法，其还包括区分所述经衔接子连接的DNA片段中的甲基化核酸碱基和非甲基化核酸碱基。

82.权利要求81所述的方法，其还包括使所述经衔接子连接的片段发生亚硫酸氢盐转化。

83.权利要求81所述的方法，其还包括使所述经衔接子连接的片段发生一个或更多个酶促和/或化学反应。

84.权利要求83所述的方法，其还包括使甲基化胞嘧啶核酸碱基和/或羟甲基化胞嘧啶核酸碱基氧化以产生氧化反应产物，随后使所述氧化反应产物还原和/或脱氨基。

85.权利要求84所述的方法，其中所述氧化用十-十一易位(TET)酶进行。

86.权利要求84所述的方法，其中所述氧化用高钌酸钾进行。

87.权利要求84所述的方法，其中所述氧化反应产物的还原和/或脱氨基用APOBEC进行。

88.权利要求84所述的方法，其中所述氧化反应产物的还原和/或脱氨基用吡啶硼烷进行。

89.权利要求83至88中任一项所述的方法，其还包括在所述一个或更多个酶促和/或化学反应之前进行β-葡糖基转移酶处理。

90.权利要求77至89中任一项所述的方法，其中所述衔接子包含GC突出端。