CN115572756A

CN115572756A - 同时检测甲基化、超低频突变和片段信息的文库构建方法

Info

Publication number: CN115572756A
Application number: CN202211214953.9A
Authority: CN
Inventors: 刘佳慧; 任艳平; 赵美茹; 易鑫
Original assignee: Beijing Jiyinjia Medical Laboratory Co ltd; Shenzhen Guiinga Medical Laboratory
Current assignee: Beijing Jiyinjia Medical Laboratory Co ltd; Shenzhen Guiinga Medical Laboratory
Priority date: 2022-09-30
Filing date: 2022-09-30
Publication date: 2023-01-06
Anticipated expiration: 2042-09-30
Also published as: CN115572756B

Abstract

一种同时检测甲基化、超低频突变和片段信息的文库构建方法，该方法包括：氧化步骤，对核酸样本中5‑甲基胞嘧啶残基进行一次氧化，得到含有氧化的5‑甲基胞嘧啶残基的核酸分子；还原步骤，对氧化后的核酸不进行纯化，直接向氧化反应结束后的体系中加入还原试剂，反应得到还原产物；纯化步骤，包括使用纯化试剂纯化还原产物，得到纯化后的核酸分子，纯化试剂中含有载体试剂，载体试剂中的载体用于吸附核酸分子；杂交步骤，包括使纯化后的核酸分子与探针杂交反应，获得杂交产物。本发明的检测方法能够检测到超低频突变。

Description

同时检测甲基化、超低频突变和片段信息的文库构建方法

技术领域

本发明涉及生物信息学领域，具体涉及一种同时检测甲基化、超低频突变和片段信息的文库构建方法。

背景技术

DNA甲基化指的是胞嘧啶碳-5原子与甲基的共价连接，是哺乳动物基因组的一种稳定但可逆的表观遗传修饰。人类和其他哺乳动物基因组中大约2800万个CpG中的绝大多数是甲基化的。DNA甲基化与早期发育、X染色体失活、分化和基因调控的关键过程有关。细胞偏离正常甲基模式会导致发育畸形和人类疾病，尤其是癌症。

液相杂交捕获技术是通过目标DNA片段和带有生物素标记的探针杂交，然后通过生物素-链霉亲和素的反应使目标DNA片段锚定在带有链霉亲和素的磁珠上。磁珠由磁微粒与高纯度链霉亲和素共价结合而成，可用于捕获生物素标记的底物，生物素-链霉亲和素的相互作用很强，非特异性结合率很低，使得被捕获的底物可满足后续实验要求。液相杂交捕获技术相对于其他靶向捕获方法，具有更好的捕获效率，更少的偏好性，更高的检测灵敏度，尤其适合肿瘤早筛场景下，需检测未知变异的情况。

DNA甲基化、突变以及cfDNA片段特征是液体活检技术和NGS技术的肿瘤早筛研究的重要的标志物。DN A甲基化模式在整个肿瘤组织和相同的肿瘤类型中广泛存在，存在组织和癌症类型特异性，它具有检测早期癌症的能力。cfDNA片段组特征包括周期性振幅、片段大小、片段末端序列等多个特征(如图1所示)ⁱ，这种多组学特征整合分析可以较好地克服单一特征筛选导致的局限性，提高检测灵敏度。这三种标志物的整合有望进一步提高肿瘤早筛的性能。

甲基化测序的一个金标准是全基因组重亚硫酸盐测序(Whole genome bisulfitesequencing，WGBS)，简称BS-seq。其检测原理是用重亚硫酸氢盐处理，将基因组中未发生甲基化的胞嘧啶(C)脱氨基转化为尿嘧啶(U)，在随后进行的PCR扩增过程中，将U碱基识别为胸腺嘧啶(T)，实现C→T的转化。但是以下缺点导致了BS无法满足肿瘤活检或者早筛的需求：1)重亚硫酸盐测序是高盐高酸处理，对核酸破坏严重，传统方法对于DNA起始量要求高(>1000ng)，大部分临床样本，特备是活检样本，无法满足要求；2)近年来兴起的低投入量建库方法，需要使用单链建库，后续分析时，无法使用双链配对信息来进行错误校正。3)重亚硫酸盐测序是对未发生甲基化的胞嘧啶(C)进行转化，未甲基化的C占所有胞嘧啶的95％，这种方法不仅造成数据碱基不平衡、测序数据使用率低，而且无法检测突变信息：重亚硫酸盐测序的数据比对是将参考基因组的所有C碱基转变为T碱基，然后比对时C与T的mismatch位点即为甲基化位点，导致无法区分甲基化导致的T和突变造成的T。4)由于BS测序对DNA损伤严重，模板丢失多，天然cfDNA的片段特征信息也会一并丢失，无法利用。

NEB公司的新推出的酶学转化甲基化建库方法(简称EM-seq)，是甲基化测序的新方法，与BS测序相比，使用酶促转化，过程温和，DNA模板损伤小，能保留cfDNA的片段信息，但是该方法也是对未发生甲基化的胞嘧啶(C)进行转化，同样不能区分突变和甲基化造成的T碱基，尤其是对于液体活检中常用的cfDNA，突变频率一般低至0.1～1％。

2019年，研究人员开发出了一种新型测序技术—TET辅助吡啶硼烷测序技术(TET-assisted pyridine borane sequencing，TAPS)，TAPS也是使用酶法转化方法，是一种温和的转化方法。TAPS使用TET酶将甲基化的胞嘧啶(C)转化为5caC，然后通过吡啶硼烷进一步转化成二氢尿嘧啶U，经过PCR和测序，可以识别为T。然而，该方法流程复杂，导致建库流程中模板大量损失，模板回收率很低，对于cfDNA等样本量有限的情况，容易导致建库失败、数据有效深度不足等问题。

发明内容

根据第一方面，在一实施例中，提供一种构建文库的方法，包括：

氧化步骤，对核酸样本中5-甲基胞嘧啶残基进行一次氧化，得到含有氧化的5-甲基胞嘧啶残基的核酸分子；

还原步骤，对氧化后的核酸不进行纯化，直接向氧化反应结束后的体系中加入还原试剂，反应得到还原产物；

纯化步骤，包括使用纯化试剂纯化所述还原产物，得到纯化后的核酸分子，所述纯化试剂中含有载体试剂，所述载体试剂中的载体用于吸附核酸分子；

杂交步骤，包括使纯化后的核酸分子与探针杂交反应，获得杂交产物。

根据第二方面，在一实施例中，提供第一方面任意一项的方法构建得到的文库。

依据上述实施例的同时检测甲基化、超低频突变和片段信息的文库构建方法，本发明的检测方法能够检测到超低频突变。

在一实施例中，本发明能够保留cfDNA的片段信息，而现有的重亚硫酸盐检测方法对DNA损伤大，丢失了这些信息。

附图说明

图1为cfDNA片段组特征分布图；

图2为一种实施例的建库流程图；

图3为一种实施例的均一化片段覆盖度结果图；

图4.1～4.6为一种实施例的6例肿瘤血浆cfDNA样本全基因组甲基化数据和捕获数据分析结果图；

图5为一种实施例的相同起始量、相同数据量下的有效深度结果图；

图6.1、图6.2为突变频率结果图；

图7为肿瘤个体和健康个体中cfDNA片段分布图；

图8为一种实施例的测序数据中cfDNA片段的周期性规律特征信息图；

图9为重亚硫酸盐检测方法的片段分布图；

图10为实施例2中加入不同体积RPB的转化回收率结果图；

图11为实施例3中加入不同体积、不同温度的乙醇的转化回收率结果图；

图12为各实施例、对比例的测序深度结果图；

图13为不同杂交温度下的测序深度结果图；

图14为均一性与捕获效果测试结果图；

图15为双链建库加双链分子标签UMI建库方法原理示意图；

图16.1、图16.2为实施例6中ImageJ转化率结果图；

图17.1、图17.2为实施例6中测序转化率结果图；

图18为实施例6中不同pH下的测序转化率结果图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中，很多细节描述是为了使得本申请能被更好的理解。然而，本领域技术人员可以毫不费力的认识到，其中部分特征在不同情况下是可以省略的，或者可以由其他材料、方法所替代。在某些情况下，本申请相关的一些操作并没有在说明书中显示或者描述，这是为了避免本申请的核心部分被过多的描述所淹没，而对于本领域技术人员而言，详细描述这些相关操作并不是必要的，他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。

另外，说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时，方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此，说明书和附图中的各种顺序只是为了清楚描述某一个实施例，并不意味着是必须的顺序，除非另有说明其中某个顺序是必须遵循的。

本文中为部件所编序号本身，例如“第一”、“第二”等，仅用于区分所描述的对象，不具有任何顺序或技术含义。

纯化步骤，包括使用纯化试剂纯化还原产物，得到纯化后的核酸分子，纯化试剂中含有载体试剂，载体试剂中的载体用于吸附核酸分子；

在一实施例中，可以在氧化步骤之前进行进行末端修复、测序接头连接，也可以在还原步骤以及纯化步骤之后进行末端修复、测序接头连接。前述两种方式均不影响后续的杂交步骤。

在一实施例中，氧化步骤中，氧化包括酶促氧化。

在一实施例中，氧化步骤中，酶促氧化使用的酶包括TET酶。

十-十一易位(Ten-Eleven Translocation，TET)酶是生物体内存在的一种α-酮戊二酸(α-KG)和Fe²⁺依赖的双加氧酶，TET酶家族有三个成员，分别为TET1、TET2和TET3，三种TET酶均具有将5-mC转化为5caC、5fC、5-hmC等等的能力。TET酶任选为TET1、TET2、TET3中的至少一种。TET1、TET2、TET3可以从市场上购买得到，例如，可以购自NEB公司。

在一实施例中，根据生物体来源不同，适用于本发明的TET酶包括但不限于mTET、hTET、nTET中的至少一种，mTET是指mouse TET，即来源于小鼠的TET酶。hTET是指humanTET，即来源于人的TET酶。nTET是指Naegleria’s TET(耐格里原虫，亦称阿米巴虫)，即来源于耐格里原虫的TET酶。

在一实施例中，本发明使用的TET酶可以从市场上购买得到。购买的酶通常为经过人工改造的截短序列。

在一优选的实施例中，本发明使用的TET酶购自NEB公司，具体为NEB公司

Enzymatic Methyl-seq Conversion Module(货号E7125L)中的TET酶，具体为mTET2。

在一实施例中，氧化步骤中，氧化5-甲基胞嘧啶残基的方法包括：使含有5-甲基胞嘧啶的DNA样本与组合物、TET酶、含有Fe²⁺的化合物接触，使样本中5-甲基胞嘧啶残基氧化，得到含有氧化的5-甲基胞嘧啶残基的DNA，组合物含有如下组分：缓冲剂、金属盐、α-酮戊二酸盐、抗坏血酸、三磷酸腺苷、二硫苏糖醇，组合物的pH为4.3～7.5。

在一实施例中，只对核酸样本进行一次氧化。

在一实施例中，氧化步骤中，核酸样本为提取自待测生物体且预先打断的全基因组样本，或提取自待测生物体的细胞游离DNA样本。

在一实施例中，还原步骤中，使含有氧化的5-甲基胞嘧啶残基的核酸与有机硼烷接触，有机硼烷有效地使氧化的5-甲基胞嘧啶残基还原，从而得到含有二氢尿嘧啶残基代替氧化的5-甲基胞嘧啶残基的核酸。

在一实施例中，还原步骤中，有机硼烷包含硼烷与选自氮杂环和叔胺的含氮化合物的络合物。

在一实施例中，有机硼烷包含硼烷和氮杂环的络合物。

在一实施例中，氮杂环包含任选经1-4个低级烷基取代的吡啶。

在一实施例中，氮杂环包含吡啶、2-甲基吡啶或5-乙基-2-甲基吡啶。

在一实施例中，氮杂环包含2-甲基吡啶，并且有机硼烷是2-甲基吡啶硼烷。

在一实施例中，有机硼烷包含硼烷和叔胺的络合物。

在一实施例中，叔胺选自三乙胺、三(叔丁基)胺中的任意一种。

在一实施例中，有机硼烷包含吡啶硼烷。

在一实施例中，还原体系还含有有机酸盐。

在一实施例中，有机酸盐包括醋酸钠。

在一实施例中，还原体系的pH为4.0～4.5，优选为4.3。

在一实施例中，纯化步骤中，载体试剂中含有磁珠。载体试剂可以从市场上购买得到。当载体试剂为磁珠试剂时，该试剂中通常还含有一定量的聚乙二醇等其它组分，申请人发现，如果直接使用从市场购买的磁珠试剂(例如

AxyPrep Magnetic BeadPurification Kits中的磁珠试剂)加入还原结束后的体系进行纯化，核酸的还原回收率为0，无法实现纯化。

在一实施例中，纯化步骤中，纯化试剂还含有聚乙二醇。本发明惊奇地发现，通过向商购的磁珠试剂中额外加入聚乙二醇，可显著提高还原回收率。

在一实施例中，纯化步骤中，磁珠为干粉状或悬浮液。

在一实施例中，纯化步骤中，磁珠为悬浮液时，组合物中磁珠的体积与聚乙二醇的质量之比为≤1：0.25。

在一实施例中，纯化步骤中，磁珠为悬浮液时，磁珠的体积与聚乙二醇的质量之比为1:(0.25～0.75)。可以向商购的磁珠悬浮液中直接加入聚乙二醇，使用水等溶剂预先将聚乙二醇溶解，再加入磁珠悬浮液中，由于聚乙二醇为固体，为了提高溶解性，优选使用水等溶剂预先将聚乙二醇溶解，再加入磁珠悬浮液中。

在一实施例中，纯化步骤中，磁珠为悬浮液时，磁珠的体积与聚乙二醇的质量之比包括但不限于1：0.25、1：0.3、1：0.35、1：0.4、1：0.45、1：0.5、1：0.55、1：0.6、1：0.65、1：0.7、1：0.75、1：0.8、1：0.85、1：0.9、1：0.95、1：1。

在一实施例中，纯化步骤中，组合物包含磁珠以及聚乙二醇水溶液，磁珠为悬浮液时，磁珠与聚乙二醇水溶液的体积比≤1：0.5，优选为1：(0.5～3)。

在一实施例中，纯化步骤中，聚乙二醇水溶液中聚乙二醇的质量体积百分比为50％。

在一实施例中，纯化步骤中，聚乙二醇的分子量为200～20000，包括但不限于200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000。

在一实施例中，纯化步骤中，还原体系与组合物的体积之比≤1:1。

在一实施例中，纯化步骤中，还原体系与组合物的体积之比为1：(2～8)。

在一实施例中，纯化步骤中，振荡混匀时，混合体系的温度控制在20～60℃，优选为30～60℃，更优选为30～40℃，更优选为30～37℃。振荡混匀时，混合体系的温度包括但不限于20℃、25℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、45℃、50℃、55℃、60℃。

在一实施例中，纯化步骤中，振荡混匀的转速≥500rpm。

在一实施例中，纯化步骤中，振荡混匀的转速≥1000rpm。

在一实施例中，纯化步骤中，振荡混匀的转速为1000～2500rpm，优选为1000～2000rpm。转速包括但不限于500rpm、600rpm、700rpm、800rpm、900rpm、1000rpm、1100rpm、1200rpm、1300rpm、1400rpm、1500rpm、1600rpm、1700rpm、1800rpm、1900rpm、2000rpm、2100rpm、2200rpm、2300rpm、2400rpm、2500rpm、2600rpm、2700rpm、2800rpm、2900rpm、3000rpm。

在一实施例中，纯化步骤中，将混合步骤所得的混合体系置于恒温条件下振荡混匀。

在一实施例中，纯化步骤中，可以将混合体系置于恒温混匀仪中进行振荡混匀。

在一实施例中，纯化步骤中，振荡混匀时间≥15min，优选为15～20min。振荡混匀时间包括但不限于15min、16min、17min、18min、19min、20min、21min、22min、23min、24min、25min、26min、27min、28min、29min、30min。

在一实施例中，纯化步骤中，静置时间≥10min。

在一实施例中，纯化步骤中，吸附结束后，还包括清洗步骤，具体是使用清洗剂对吸附有核酸分子的载体进行清洗。

在一实施例中，清洗步骤中，使用的清洗剂包含乙醇。

在一实施例中，清洗步骤中，清洗剂为体积百分浓度≥80％的乙醇。

在一实施例中，清洗步骤中，清洗剂为体积百分浓度为80％～90％的乙醇。

在一实施例中，清洗步骤中，清洗剂为预冷的清洗剂。

在一实施例中，清洗步骤中，清洗剂为-20～25℃的清洗剂。

在一实施例中，清洗步骤中，清洗剂为预冷至-20～4℃的清洗剂。本发明发现，预冷后的清洗剂可显著提升还原回收率。

在一实施例中，清洗步骤中，加入的清洗剂的体积≥200μL。

在一实施例中，清洗步骤中，加入的清洗剂的体积为200～1500μL。

在一实施例中，清洗步骤中，清洗次数≥1。

在一实施例中，清洗步骤中，清洗次数为1～3。

在一实施例中，纯化步骤中，清洗结束后，还包括洗脱步骤，具体是使用洗脱剂从清洗后的载体上洗脱核酸分子。

在一实施例中，洗脱步骤中，洗脱温度为20～40℃，优选为25～40℃，更优选为37～40℃。

在一实施例中，洗脱步骤中，洗脱所使用的洗脱剂包含水或缓冲液，缓冲液包括但不限于TE缓冲液。

在一实施例中，洗脱步骤中，纯化步骤之后，杂交步骤之前，还包括预文库扩增步骤，包括对纯化后的核酸分子进行预文库扩增，获得预文库扩增产物。氧化还原之后，甲基化的C碱基转变为二氢尿嘧啶(DHU)，预文库扩增之后，DHU对应的互补链上的碱基为A。多次循环后，形成的新的核酸分子中DHU对应位置的碱基转变为T碱基。

在一实施例中，预文库扩增步骤是非必需的，DUH与T碱基一样，能与探针中的A碱基互补配对，进行杂交，然后在杂交后的扩增步骤中使用相匹配的PCR酶即可。

在一实施例中，杂交步骤中，杂交体系的温度控制在60～65℃。

在一实施例中，杂交步骤中，杂交体系的温度控制在60～63℃。

在一实施例中，杂交步骤中，杂交反应的时间为12～16h。

在一实施例中，包括在氧化步骤之前，对片段化的核酸样本进行末端修复、测序接头连接，然后进入氧化步骤。在另一实施例中，包括在纯化步骤之后，对纯化后的核酸样本进行末端修复、测序接头连接，然后进入杂交步骤。

在一实施例中，杂交步骤之后，还包括捕获步骤，包括使用磁珠捕获杂交产物，洗脱得到产物。

在一实施例中，还包括文库扩增步骤，包括对捕获步骤所得的产物进行扩增，获得可用于上机测序的文库。

在一实施例中，氧化步骤中，核酸样本为DNA或RNA，优选为DNA。

在一实施例中，构建得到的文库用于同时检测甲基化、超低频突变和样本片段信息。

在一实施例中，氧化步骤，核酸样本来源于动物。动物包括但不限于哺乳动物，哺乳动物包括但不限于人、非人的灵长目动物、大鼠或小鼠。此处仅为示意性列举，任意的核酸样本均适用于本发明。

在一实施例中，本发明使用改进的TAPS建库(改进的TAPS建库技术下文简称为GM-seq)联合杂交捕获的方法，具有高模板化回收率、高捕获效率、高覆盖均一性，能够一次性获得样本多个基因目标区域甲基化、片段特征以及超低频突变信息。

在一实施例中，本发明提供了一种同时检测区域甲基化、超低频突变和样本片段信息的文库构建方法。首先对核酸进行酶转化建库，然后使用预文库对目标区域基因进行探针液相杂交捕获，最后进行测序，通过生物信息学对得到实验数据进行分析，获得目标区域内甲基化、突变信息和样本片段信息。本发明提供的检测方法能够一次性获得样本多个基因目标区域甲基化、超低频突变信息，同时能保留cfDNA的片段特征，可以实现一个文库多个癌症早筛标志物的检测。

以下实施例及对比例中，如无特别说明，所使用的磁珠为购自美国Axygen公司的磁珠，亦称Axygen磁珠，产品名称为

AxyPrep Magnetic Bead Purification Kits，货号为MAG-PCR-CL-250。该磁珠为悬浮液。

以下实施例及对比例中，如无特别说明，“室温”是指23℃±2℃。

以下本实施例及对比例中，如无特别说明，“80％乙醇”均是指体积百分浓度为80％的乙醇，亦称“80％V/V乙醇”，是由乙醇与NF-H₂O(无核酸酶水，亦称Nuclease-FreeWater)按照80:20的体积比配制而成。

以下实施例中，预冷的乙醇均是指预冷至4℃的乙醇。

以下实施例及对比例中，TE缓冲液(TE Buffer)购自Invitrogen，货号12090015。组成如下：10mM Tris-HCl(pH 8.0)、0.1mM EDTA。

实施例1

本实施例提供一种基于靶向捕获的无需亚硫酸盐转化的甲基化建库方法，建库流程如图2所示，本方法包括：

步骤1：对cfDNA进行末端修复和加“A”；

步骤2：使用连接酶连接修复-加“A”产物和接头，得到加接头的dsDNA；

步骤3：对上述加接头DNA片段进行TET氧化，得到TET酶氧化后的DNA片段；

步骤4：将所述TET酶处理的DNA，再进行吡啶硼烷还原处理，得吡啶硼烷还原产物；

步骤5：以吡啶硼烷处理后的DNA为模板，进行PCR扩增，完成预文库构建；

步骤6：使用探针对预文库进行杂交；

步骤7：使用链霉亲和素磁珠对靶向文库进行捕获；

步骤8：PCR扩增纯化，得到靶向捕获文库。

步骤1、2：末端修复和加“A”、加接头所用的试剂来自常规建库试剂盒，本实施例中具体为

Ultima Pro DNA Library Prep Kit；

步骤2：所述接头为带有互补双端分子标签(Unique Molecular Identifier，简称UMI)的接头；

步骤3：涉及的TET2酶反应液组成：50mM HEPES，100mM NaCl，1mMα-ketoglutate(α-KG)，2mM ascorbate，1.2mM ATP，1mM DTT，100μM Fe(NH₄)₂(SO₄)₂。缓冲体系组成成分为HEPES(pH 4.6～7.0)盐溶液。α-ketoglutate和Fe(NH₄)₂(SO₄)₂盐为mTET2的辅酶，是缓冲液的必要成分；

步骤6、7：使用的杂交试剂为常规杂交捕获试剂盒，实施例中为伯科捕获试剂盒。

GM-seq建库方法：

1.使用cfDNA或者使用片段化后的gDNA，并取5～100ng建库。

2.末端修复和加“A”反应

(1)末端修复和加A反应体系

表1

组分	体积
		DNA	50μL
末端修复&加A-缓冲液	6μL
		末端修复&加A-酶混合物	4μL
总体	60μL

修复反应条件如下表所示。

表2

温度	时间
		30℃	20min
72℃	20min
		4℃	∞

(2)连接反应

表3

组分	体积
		末端修复&加A产物	60μL
双端UMI接头	5μL
		连接缓冲液	30μL
连接酶	5μL
		总体积	100μL

本实施例的双端UMI接头参见公开号为CN112626189A的中国专利《基因测序仪的短接头、双index接头引物和双index建库体系》说明书第52段。

接头根据测序平台不同而不同，不做限制，如果使用其他测序平台，则更换对应的接头。

接头连接反应程序：

表4

温度	时间
		20℃	30min
4℃	∞

(3)连接后纯化

1)磁珠提前半小时取出，室温平衡；新鲜配制80％乙醇。

2)向100μL反应液中加入87μL磁珠，涡旋混匀。

3)震荡混匀，离心，室温孵育5-10min，使DNA与磁珠结合。

4)将EP管置于磁力架2min，溶液澄清，吸去上清。

5)加入200μL 80％的乙醇，静置30s，吸掉乙醇。重复一次。短暂离心，弃净液体。

6)室温下晾干乙醇，磁珠没有明显的发亮或干裂。

7)加入24μL无酶水洗脱DNA。

3.TET酶氧化反应

(1)冰上配制如下TET酶氧化反应体系：

表5

该TET酶来自NEB公司

Enzymatic Methyl-seq Conversion Module(货号E7125L)，具体为mTET2。

TET氧化缓冲液具体组分如下：

167mM HEPES、333mM NaCl、3.3mMα-酮戊二酸盐(α-KG)、6.67mM抗坏血酸、4mMATP、8.33mM DTT。此处各组分的浓度为TET氧化缓冲液与DNA、TET酶、Fe(NH₄)₂(SO₄)₂、无酶水等其他组分混合前的浓度，即初始浓度，而非终浓度。

(2)反应条件：37℃，80min。

(3)加入1.5μL蛋白酶K(0.8U)到氧化反应体系中，50℃孵育30min。

4.吡啶硼烷还原反应

(1)还原反应体系配制

表6

反应混合物	体积
		3M醋酸钠(pH＝4.3)	14.6μL
10M吡啶硼烷	7.3μL
		氧化后产物	51.5μL
总体积	73.4μL

(2)反应条件：37℃，1200rpm孵育16h。

(3)纯化回收

该步骤待纯化物质中，包含了上述氧化步骤的试剂和还原步骤的试剂，混合物成分比单纯还原反应更加复杂，纯化难度更加大。因此，与之前公开的磁珠纯化专利CN113943727A(待纯化物质只包含还原后试剂)相比，进行了以下几点改进：增加RPB溶液的体积、结合步骤转速增加、洗脱孵育步骤由静置改为增加转速，并增加孵育时间。

1)配制RPB溶液：将Axygen磁珠与质量体积百分比为50％的PEG水溶液，按照1：1体积混合，制得RPB溶液。

2)RBP室温平衡0.5h。

3)取下EP管，瞬离，然后向EP管中加入200～600μL RPB(本实施例为400μL)。

4)放入恒温混匀仪中，转速1000～2000rpm，25～30℃孵育15-20min(本实施例为25℃，2000rpm，15min)。

5)瞬离，将EP管置于磁力架，室温放置15～30min(本实施例为15min)，去除上清。

6)加入0.4～1.5mL预冷的80～90％乙醇(本实施例加入1.2mL 90％乙醇)，静置60s。

7)去除上清，重复清洗两次，弃干净液体。

8)晾干乙醇，磁珠没有明显的发亮或干裂。

9)加入25μL TE缓冲液，涡旋震荡后瞬离，放入恒温混匀仪中，转速1000～2000rpm，30～60℃孵育10～25min(本实施例的转速为1800rpm，37℃孵育10min)。

10)瞬离上架，澄清后取1μL进行Qubit dsDNA HS定量，计算回收率。

此处由于氧化后没有进行纯化，无法定量，因此使用以下公式计算：

回收率＝还原后总量/建库初始投入量。

5.预文库扩增

(1)PCR扩增反应体系按下表配制：

表7

组分	体积
		吡啶硼烷处理的DNA	20μL
KAPA HiFi HotStart Uracil+ReadyMix(2X)	25μL
		引物	5μL
总体积	50μL

所用的引物依据所用测序平台和使用的接头而确定，不做限制。体系中的引物最终浓度为0.5～2μM。本实施例中的引物来自MGI平台，引物的终浓度为1μM。

(2)反应条件：

表8

本实施例的循环数具体为9。

反应后，用0.9X磁珠纯化。

6.探针杂交

(1)将下表试剂加入到1.5mL低吸附离心管中，将离心管放入预热的真空浓缩仪中蒸干。

表9

组分	用量
		预文库	500～2000ng
Cot-1	5μL
		Blockers	2μL

本实施例的预文库用量具体为500ng。

(2)杂交反应体系

1)按下表配制Mix，加入到蒸干液体的离心管中，室温孵育10min。瞬时离心，将1.5mL离心管中液体转移到0.2mL低吸附离心管中。

表10

组分	体积(μL)
		2X Hybridization Buffer	8.5
Hybridization Enhancer	2.7
		Nuclease-free water	1.8
总体积	13

2)使用PCR仪95℃孵育10min，使文库变性。

3)将离心管转移至60～63℃PCR仪，然后将4μL生物素标记的探针加入到文库中。

4)60～63℃孵育12～16h。

7.捕获

(1)磁珠清洗

1)将链霉亲和素磁珠(Streptavidin磁珠)从冰箱中(4℃)取出恢复到室温(约30min)

2)磁珠涡旋混匀15sec，取10μL加入到1.5mL低吸附离心管中。将离心管放到磁力架上，直到溶液澄清，移弃上清。

3)将离心管从磁力架上取下，加入200μL 1X Beads Wash Buffer，涡旋振荡10sec。瞬时离心，放到磁力架上，直到溶液澄清，吸弃上清，重复清洗一次。

4)离心管从磁力架上取下，加入100μL 1X Beads Wash Buffer。将离心管中的100μL磁珠重悬液转移到0.2mL低吸附离心管中。将离心管放到磁力架上，直到溶液澄清；吸弃上清，进行后续实验步骤。

(2)捕获

将杂交反应液转移至磁珠中，低速涡旋混匀。使用PCR仪63℃孵育45min。每12min涡旋混匀3sec，确保磁珠处于悬浮状态。

(3)捕获后清洗

1)将100μL预热的1X Wash Buffer I加入到含有磁珠和杂交反应液的0.2mL低吸附离心管中。涡旋混匀使磁珠和杂交反应液重悬，随后立即将所有溶液转移到新的1.5mL低吸附离心管中。

2)将离心管放置到磁力架上，直到溶液澄清(约3sec)，吸弃上清。

3)加入200μL预热的1X Wash Buffer S，涡旋混匀后，在63℃孵育5min。瞬时离心，将离心管放置到磁力架上，直到溶液澄清，吸弃上清。重复步骤。

4)加入180μL 1X Wash Buffer I，涡旋混匀2min。瞬时离心，放置到磁力架上，直到溶液澄清，吸弃上清。

5)加入180μL 1X Wash Buffer II，涡旋混匀1min。瞬时离心，放置到磁力架上，直到溶液澄清，吸弃上清。

6)加入180μL 1X Wash Buffer III，涡旋混匀30sec。瞬时离心，放置到磁力架上，直到溶液澄清，吸弃上清。

7)立即加入20μL无酶水。涡旋混匀，重悬磁珠，进入后续实验步骤。

8.文库扩增

(1)PCR扩增靶向捕获反应体系

表11

所用的引物依据所用测序平台和使用的接头而确定，不做限制。推荐体系中的引物最终浓度为0.5～2μM。

(2)反应条件

表12

应结束后，0.9X磁珠纯化。

9.文库测序与质控分析

三、本实施例的数据结果

1.质控结果

8例cfDNA样本进行了文库构建，并将所构建文库进行上机测序与数据分析，所有样本的检测数据Q30>90％，捕获效率高，均一性好(0.5X mean coverage＞90％)，说明使用本发明的文库构建方法可构建出高质量的测序文库。

表13

序号	样本编号	Q30(％)	覆盖度	捕获效率	0.5X mean coverage
						1	1909	92.71	100％	73.3％	95.4％
2	147	93.07	100％	73.3％	96.0％
						3	154	92.66	100％	71.6％	94.4％
4	2466	92.67	100％	73.4％	95.3％
						5	8076	93.28	100％	74.6％	93.3％
6	1907	93.89	100％	74.7％	95.5％
						7	1919	94.07	100％	70.2％	95.5％
8	1935	93.77	100％	74.6％	95.9％

2.位点均一性结果

6例肿瘤血浆样本GM-seq+捕获数据和6例文献中BS单链建库+杂交捕获数据ⁱⁱ，首先比对文献报道的marker区域和本发明使用panel的重叠区域，然后分析两组数据在这些位点的深度，最后对位点的深度进行均一化，比对两组数据在位点覆盖的均一性。

位点覆盖均一性越好，表明用越少的数据量可以得到目标区域的有效覆盖。

从图3所示的结果可以看出，本实施例的方法位点深度的波动较小，均一性明显比BS单链建库+杂交捕获好。

图3中，gene plus：本实施例的方法数据；buning rock：文献中BS单链建库+杂交捕获方法数据)。

3.甲基化结果

6例肿瘤血浆cfDNA样本全基因组甲基化数据和捕获数据分析结果如图4.1～4.6所示，共同覆盖的位点甲基化率一致性，pearson相关系数≥0.95。说明本实施例的方法与全基因组甲基化数据的甲基化位点一致性很高，能够还原样本真实甲基化水平。

4.低频突变结果

常规甲基化捕获方法对于起始核酸模板降解严重，即使是酶转化的温和方法，例如商业化EM-seq方法、原始TAPS转化方法，由于必须要进行甲基化氧化、转化步骤，不可避免的需要2次甚至更多次纯化，每一次纯化都意味着部分模板的丢失，因此模板回收率必然比常规非甲基化建库流程低得多。

例如原始taps方法的作者发表的早筛应用文章中ⁱⁱⁱ，对于真实cfDNA样本，样本为10ng cfDNA，全基因组测序100G左右，深度是8.2～22X，均值为11.6X；而对于常规非甲基化文库，进行全基因组测序时，数据量在100G左右时，深度可以达到30X以上，说明甲基化建库流程损失了大量模板，导致测序重复率高，有效数据少，有效深度低。

而使用本实施例中的GM-seq方法，在10ng cfDNA起始时，全基因组测序量在100～120G时，深度可以达到29～39X，与全基因组常规文库深度相当，说明建库中模板损失小，有效模板保留多。结合该建库方法的特点，并且在建库中使用双端分子标签标记原始模板及配对信息，然后使用杂交捕获富集目的区域，进行高深度测序，然后在生信流程中使用双端分子标签进行双链模板聚簇、纠错，分析得出低频突变信息。甲基化和低频突变的检出生信流程参照公开号为CN114058681A的中国专利《一种基于目标区域捕获的甲基化突变检测方法及试剂盒》中实施例1的方法。

21例肿瘤血浆样本使用GM-seq建库+甲基化探针捕获和常规建库+非甲基化探针捕获(捕获区域相同)，评估39个组织中已检出突变的一致性(组织中已存在突变在血浆中检出，可视为真阳性突变)。

图5为相同起始量、相同数据量下的有效深度信息，可见GM-seq建库+甲基化探针捕获时，能取得与常规建库+常规探针捕获一样的效果。

图6.2是图6.1的纵坐标放大图，便于看清低频突变。

从数据可知，由于本方案可以高效保留文库中原始有效模板信息，与常规非甲基化流程突变检出一致性很高，能够检测液体活检样本中低至0.1％低频突变信息

5.在全基因组cfDNA测序数据中，片段主峰167bp，在150bp以下，每隔10bp会有一个周期性峰，该片段特征信息该峰反映了核小体片段模式，在肿瘤个体和健康个体中存在差异(图7^iv)。

本实施例的检测方法构建的文库，测序数据能够保留cfDNA片段的周期性规律特征信息(图8)，而重亚硫酸盐检测方法的片段模式明显不同，片段分布规律可能由于转化过程中DNA损伤而丢失(图9^v)。

为了进一步说明本发明的上述优点，以下使用其他实施例和各种对比例进行说明：

实施例2

1.使用3例cfDNA，每例样本取30ng构建6个平行文库，共构建18个文库，末端修复和加A、连接接头、氧化、还原步骤参照实施例1

2.纯化过程中使用磁珠纯化专利公开号为CN113943727A的中国专利《一种组合物及其试剂盒与纯化方法》实施例1中的参数，但是分别使用不同的RPB体积。

表14

组别	A	B	C	D	E	F
							样本例数	3	3	3	3	3	3
纯化参数	实施例2	实施例2	实施例2	实施例2	实施例2	实施例2
							乙醇体积(mL，均预冷)	0.2	0.2	0.2	0.2	0.2	0.2
RPB体积(μL)	100	200	300	400	500	600

还原后回收步骤：

1)配制RPB溶液：将Axygen磁珠与质量体积百分比为50％的PEG水溶液(本实施例的PEG具体为PEG8000)按照1：1体积混合，制得RPB溶液，配制完成后，2～8℃保存。

2)新鲜配制80％乙醇。

3)RPB涡旋混匀震荡，室温平衡半小时。

4)步骤(3)结束后，取下EP管，瞬离30s，然后向EP管中加入100、200、300、400、500、600μL RPB。

5)放入Eppendorf ThermoMixer C恒温混匀仪中，25℃，1000rpm，15min。

6)瞬时离心，将EP管置于磁力架，室温放置15min，待溶液澄清。

7)弃上清。加入200μL预冷的80％乙醇，静置30s。

8)去除上清，重复使用200μL预冷的80％乙醇漂洗一次，弃净上清。室温下晾干乙醇。

9)加入25μL TE缓冲液至磁珠表面，涡旋震荡15s，直至所有磁珠都从管壁表面分离至液体中，瞬离收集液体，37℃孵育5min。

10)瞬离，上架3min，取1μL life Qubit dsDNA HS定量，计算还原回收率。

本实施例中，计算回收率的方法与磁珠纯化专利CN113943727A不同，本实施例氧化后没有纯化，无法定量，所以无法使用“还原回收率＝还原后回收质量/还原投入质量”这一公式来进行定量，因此本实施例使用“转化回收率＝还原回收后质量/建库投入质量”进行定量。

举例说明：30ng投入建库，氧化后纯化定量，得到26ng可投入到还原体系中的核酸，还原后纯化定量，得到18ng核酸，则还原回收率＝18ng(还原后质量)/26ng(投入到还原体系中的质量)＝69.2％，而转化回收率＝18ng(还原后质量)/30ng(建库起始量)＝60％，因为氧化后纯化过程的得率不可能是100％，必然小于100％，相同样本和流程下，投入到还原体系中的质量必然小于建库起始量，因此本实施例定义的转化回收率会比之前还原回收率要低。

图10所示为转化回收率结果图，可见，RPB加入量100μL时，在本实施例的流程中(即氧化后不纯化流程)，回收率均值为59.1％，而增加RPB的加入量，回收率明显提升(67～69％)，且在200～600μL范围内相差不大，其中加入400μL时，波动最小。本实施例的待纯化体系为氧化反应液加还原反应液的混合物，比单纯的还原反应液更加复杂，离子浓度、pH等条件更差，需要加入更多的RPB来增加回收效率。

实施例3

使用3例cfDNA，每例样本取30ng构建6个平行文库，共构建18个文库，末端修复和加“A”反应、连接接头、氧化、还原步骤参照实施例1。

纯化过程中，固定RPB体积为400μL，3例样本使用实施例2中的纯化方法参数(即磁珠纯化专利CN113943727A实施例1中的参数)，且乙醇洗脱体积使用1.2mL，12例样本使用实施例1中的改进的纯化方法参数(结合步骤转速增加、洗脱孵育步骤由静置改为增加转速，并增加孵育时间)，且使用不同的预冷乙醇洗脱体积0.4、0.8、1.2、1.5mL，3例样本使用实施例1中的改进的纯化方法参数，乙醇洗脱体积为1.2mL，但不预冷。

表15

回收率结果如图11所示，可见，A组使用实施例2中的纯化方法参数，用预冷乙醇1.2mL洗涤时，回收率均值为69％，组C～F使用实施例1中改进的纯化方法，将回收率提高到了76％～77％，其中1.2mL乙醇的回收率波动最小；值得注意的是，如果将E组乙醇由预冷改为不预冷，回收率会下降到72.7％。

以上数据充分说明，由于本实施例待纯化体系为氧化反应液加还原反应液的混合物，比单纯的还原反应液更加复杂；且由于氧化后不纯化，需要增加还原试剂的量，所以整个待纯化体系体积更大，磁珠纯化更加困难，因此，需要改进纯化条件，包括增加RPB的体积，让更多的磁珠溶液与待测物混合，克服强酸性、高盐离子的影响；由于RPB体积增加，体系更加粘稠，不易分散，因此需要增加结合步骤转速让磁珠与核酸更加充分结合；由于纯化体系大，需要增加乙醇洗涤液的用量，来洗去整个体系中的杂质，但是太大量的乙醇也会洗去一部分核酸，导致回收率降低，而将乙醇预冷，并选用90％的乙醇(而不是常用的80％乙醇)，可以有效降低核酸在乙醇溶液中的溶解度，减少洗涤带来的损失；最后，由于上述环境中的一些杂质，导致核酸容易与磁珠紧密结合而导致洗脱困难，因此后续洗脱步骤中，孵育增加转速，延长洗脱时间，均是为了让洗脱步骤更加充分，提高回收率。

实施例4

本实施例使用各种对比条件，来证明经过本实施例一系列改进取得的突出效果。

表16

实施例4的实验过程与实施例1完全一致，要点为：氧化过程只进行1次，氧化后不进行纯化，还原后使用本实施例中改进的磁珠纯化方法进行，杂交捕获改进指杂交温度由65℃改进为63℃。

对比例1，建库方法完全参照原始taps方法的作者发表的血浆早筛应用文章^vii，该文章发表于2021年，应用方向是将cfDNA应用于肿瘤早筛方向，目的与本发明最为契合，且该文章使用样本为真实cfDNA样本，相对2018年发表的原始TAPS文章方法^viii，进行了一定程度的实验流程改进，文章中宣称能实现低起始量建库，得到更多的有效模板：建库过程加入100ng carrier DNA，进行两次氧化步骤，每次氧化后用1.8X磁珠纯化，柱纯化指还原回收使用Zymo-IC spin column和DNA binding buffer(Zymo)，按照说明书的要求回收DNA。靶向捕获常规指完全按照“伯科生物捕获试剂盒实验手册(适用于Illumina/MGI测序平台，非甲基化Panel捕获)”进行。

对比例2除样本中加入100ng carrier DNA和氧化步骤之外，其他步骤与实施例1相同，氧化步骤参照对比例1方法，进行两次氧化步骤，第一次氧化后使用1.8X磁珠纯化，第二次氧化后不纯化。

对比例3除样本中加入100ng carrier DNA和氧化后纯化步骤之外，与实施例1相同，氧化后使用1.8X磁珠纯化。

对比例4除样本中加入100ng carrier DNA和还原回收步骤之外，与实施例1相同，还原回收使用Zymo-IC spin column和DNA binding buffer(Zymo)，按照说明书的要求回收DNA。

对比例5除样本中加入100ng carrier DNA和靶向捕获步骤之外，与实施例1相同，靶向捕获按照《伯科生物捕获试剂盒实验手册》(适用于Illumina/MGI测序平台，非甲基化Panel捕获)进行。

对比例6除样本中加入100ng carrier DNA和还原回收步骤之外，与实施例1相同，还原回收使用磁珠纯化专利CN113943727A实施例1中的参数。

对比例7除样本中加入100ng carrier DNA之外，与实施例1相同。

样本使用1例混合cfDNA样本，建库投入量30ng，每例按照上表不同条件进行实验，每个条件重复三次，每个样本使用相同的投入量，扩增循环数，共构建24个文库，分析时截取到相同的数据量，比较不同方法的有效深度。

有效深度与样本本身关系较大，使用相同样本可以排除样本本身有效深度差异较大带来的波动，方便比较数据；但是此方案需要单一样本量太大，普通cfDNA提取质量无法满足需求，因此使用混合样本进行测试。

实验结果如图12所示，结合表16的数据，可见，对比例1为使用原始taps应用文章的数据，有效深度较低，该结论与原文章展示的结论一致：对于真实cfDNA样本，样本为10ngcfDNA，全基因组测序100G左右，深度是8.2-22X，均值11.6X。通常常规非甲基化文库，进行全基因组测序时，数据量在100G左右时，深度可以达到30X以上；使用本实施例4中的改进的GM-seq方法，在10ng cfDNA起始时，全基因组测序量在100～120G时，深度可以达到29～39X，与全基因组常规文库深度相当。说明原始taps方法的建库流程损失了大量模板，导致测序重复率高，有效数据少，有效深度低，虽然作者使用了加入100ng carrier DNA方法来进行改进，但是效果不佳。对比例7和实施例4的数据结果也表明，使用实施例4改进的建库方法后，不论是否加入100ng carrier DNA，有效深度都能达到较高水平。其他各个对比例均是改变部分改进条件，与实施例4进行对比，说明只有综合各个改进点，才能达到较好的效果。值得注意的是，使用还原后柱纯化的对比例，波动明显更大，说明相对于磁珠纯化来说，柱纯化稳定性较差，与之前专利的结论一致。

实施例5

本实施例是为了进一步证明，改进杂交温度有利于提高有效深度，且其他捕获相关参数(捕获效率、均一性)改变基本不大。

对于常规非甲基化文库的杂交捕获，杂交温度一般设定在65℃；对于GM-seq文库，由于检测原理为转化甲基化C，理论上对于基因组GC改变很小，基因组结构与常规文库相似，理论上，应该使用与常规文库一致的杂交温度。但实际测试发现，对于样本的某些高甲基化区域，会有较多C被转化T，造成该区域GC含量降低，探针结合能力变弱，如果使用65℃杂交，会导致部分区域捕获效果不好，表现在质控数据上即为整体有效深度降低。改用略低的温度例如60～63℃左右杂交时，虽然温度改变很小，但是探针与高甲基化区域的结合确能较大增强，从而使得整体有效深度提高。当然，降低杂交温度会带来一定程度的捕获效率下降，从而导致一部分数据量的浪费，但从数值来看幅度很小，降幅在3～4％以内，由于panel整体的捕获效率很高，在80％左右，这个幅度的下降基本不会造成数据量的浪费。

另一方面，杂交温度下降后，高低甲基化区域结合都会变好，从而让探针的均一性数值(0.5X mean)也有了一定幅度的提高。

采用4例真实cfDNA样本，30ng起始量建库，实验流程参照实施例1，杂交温度分别使用60℃、63℃、65℃，分析时截取到统一数据量。

有效深度结果如图13所示，有效深度均值：65℃：3513.8；63℃:4291.8；60℃：4225.2。

有效深度与样本本身关系很大，不同样本片段能转化为最终测序文库的效率有所不同(即建库效率不同)，所以有效深度有差异，此波动由样本本身带来。相同样本重复波动较小，数据参见实施例4。

均一性与捕获效果测试结果如图14所示，图中横坐标说明如下：

Capture efficiency：捕获效率；

0.5X mean：深度大于平均深度0.5的区域所占的比例，反映捕获均一性程度，一般大于0.9说明均一性很好。

从图14可见，随着温度的降低，捕获效率下降，但是杂交温度降低后，高低甲基化区域捕获提高，整体panel的均一性更好。综合样本捕获效率、平均深度和均一性数据，63℃panel整体表现最佳。

实施例6

本实施例对多种TET酶进行了筛选，实验组6.1～6.5、对照组6.01～6.12的实验条件参照公开号为CN113862333A(表17中的参考专利)的中国专利《一种组合物及其氧化5-甲基胞嘧啶的方法》的实施例1，实验组6.6的实验条件参照CN113862333A专利的实施例2，调整的具体试剂、参数见下表。

表17

注一：以上实验均为真实样本氧化1次的结果，由于实验结果显示实施例的转化率较高，所以未测试氧化2次的mCpG的转化率。

注二：“/”表示因image J计算的转化率较低，没有再进行NGS测序。

注三：转化率在不同样本之间会有一定的波动，以上实验除了cfDNA数据之外，都使用相同的样本，即人细胞中提取的DNA，从同一管中取出实验，排除样本本身的影响。

mTET是指mouse TET，即来源于小鼠的TET酶。

hTET是指human TET，即来源于人的TET酶。

nTET是指Naegleria’s TET。

图16.1、图16.2为ImageJ转化率结果图。

ImageJ转化率：通过胶图计算的转化率(图16.1：纵坐标0-100，图16.2：纵坐标55-100，因为左图的部分标识符不易识别，所以右图对纵坐标进行了放大)。

图17.1、图17.2为测序转化率结果图。

测序转化率：通过NGS和生信分析计算的转化率(图17.1：纵坐标0-100，图17.2：纵坐标70-100)。

此外，本实施例还测试了不同样本pH6和pH7时的转化率(TET酶为mTET2)，共19例。图18为不同pH下的测序转化率结果图，可见，虽然pH6时平均转化率只比pH7高了1％左右，但是明显波动更加小，更加稳定，且最低的样本转化率大于95％，产品要求所有样本的转化率都大于95％，因此，pH优选为6。

可见，nTET对于真实样本的转化率非常低，基本不可用，hTET2和mTET1转化率适中，而mTET2在pH4.3～7.5条件下的转化率最高；本发明通过mTET2的筛选和pH的调整，显著提高了转化率。上述数据证实了并非任意的TET酶均能提高实际样本中5mC到T的转化率。

结论

1.突变、甲基化、片段特征都是癌症早筛的重要信息，本方案使用改进的GM-seq建库加杂交捕获的方法，能够一次性获得样本多个基因目标区域甲基化、超低频突变、片段特征信息。

1)与全基因组taps测序相比，本发明的检测方法能够检测到超低频突变。液体活检中cfDNA样本的突变频率一般低至0.1～1％，需要原始深度10000X以上，分子标签纠错后有效深度1000X以上，才能有效检测；限于目前的测序成本，全基因组测序无法得到如此高深度的测序量，因此无法检测超低频突变。

2)现有的BS+靶向富集、EM-seq+靶向富集、以及原始taps建库+靶向富集的测序方法均无法检测到超低频突变，因为两点原因：1，BS和EM-seq都是对未发生甲基化的胞嘧啶(C)进行转化，未甲基化的C占所有胞嘧啶的95％，造成基因组非常大的变化，导致无法区分甲基化导致的T和突变造成的T，尤其是对于低频突变的情况；2，甲基化文库比非甲基化文库多了甲基化转化步骤，转化过程造成核酸丢失，然后甲基化转化过程一般都需要纯化，造成模板进一步丢失。

但是本发明使用GM-seq+杂交捕获，模板回收明显提高，样本的有效深度达到常规文库水平(参见图5)所以能够检测到超低频突变。

TET酶氧化步骤，减少一次氧化，用10ng cfDNA，测序100～120G，深度可以达到29-39X。

3)使用双链建库加双链分子标签UMI建库方法。双链UMI的原理就是给每一条原始DNA片段加上一段特有的标签序列，经PCR扩增后一起进行测序。这样根据不同的标签序列，就能区分不同来源的DNA模板，分辨哪些是PCR扩增及测序过程中的随机错误造成的假阳性突变，哪些是患者真正携带的突变，且双链UMI可以识别原始的互补配对模板，从而进一步提高检测灵敏度和特异性。重亚硫酸盐处理后模板大部分变为单链，只能使用单端分子标签，无法识别原始的互补配对模板，不能实现双链校正，获得低频突变信息(参见图15^ix)。

2.cfDNA的片段特征信息是癌症筛查的一个重要信息，本发明能够保留cfDNA的片段信息，而重亚硫酸盐检测方法对DNA损伤大，丢失了这些信息。

各种不同方法特点总结如下：

表17

本发明的方法即为表17中的GM-seq建库+靶向捕获。

参考文献：

i Enhanced detection of circulating tumor DNA by fragment sizeanalysis.

ii Ultrasensitive detection of circulating tumour DNA via deepmethylation sequencing aided by machine learning.

iii Cell-free DNA TAPS provides multimodal information for earlycancer detection.

iv Preferred end coordinates and somatic variants as signatures ofcirculating tumor DNA associated with hepatocellular carcinoma.

v Cell-free DNA TAPS provides multimodal information for early cancerdetection.

vi Cell-free DNA TAPS provides multimodal information for earlycancer detection.

vii Cell-free DNA TAPS provides multimodal information for earlycancer detection.

viii Bisulfite-free direct detection of 5-methylcytosine and 5-hydroxymethylcytosine at base resolution.

ix Detection of ultra-rare mutations by next-generation sequencing.

以上应用了具体个例对本发明进行阐述，只是用于帮助理解本发明，并不用以限制本发明。对于本发明所属技术领域的技术人员，依据本发明的思想，还可以做出若干简单推演、变形或替换。

Claims

1.一种构建文库的方法，其特征在于，包括：

洗脱步骤，包括使用洗脱剂从清洗后的磁珠上洗脱核酸分子，得到纯化后的核酸分子；

2.如权利要求1所述的方法，其特征在于，所述氧化步骤中，所述氧化包括酶促氧化；

优选地，所述氧化步骤中，所述酶促氧化使用的酶包括TET酶；

优选地，所述氧化步骤中，所述TET酶包括TET1、TET2、TET3中的至少一种；

优选地，所述氧化步骤中，所述TET酶包括mTET、hTET、nTET中的至少一种；

优选地，所述氧化步骤中，所述TET酶包括mTET2。

3.如权利要求1所述的方法，其特征在于，氧化步骤中，氧化5-甲基胞嘧啶残基的方法包括：使含有5-甲基胞嘧啶的核酸样本与组合物、TET酶、含有Fe²⁺的化合物接触，使样本中5-甲基胞嘧啶残基氧化，得到含有氧化的5-甲基胞嘧啶残基的DNA，所述组合物含有如下组分：缓冲剂、金属盐、α-酮戊二酸盐、抗坏血酸、三磷酸腺苷、二硫苏糖醇，所述组合物的pH为4.3～7.5；

优选地，氧化步骤中，所述核酸样本为提取自待测生物体且预先打断的全基因组样本，或提取自待测生物体的细胞游离DNA样本。

4.如权利要求1所述的方法，其特征在于，还原步骤中，使所述含有氧化的5-甲基胞嘧啶残基的核酸与有机硼烷接触，所述有机硼烷使所述氧化的5-甲基胞嘧啶残基还原，从而得到含有二氢尿嘧啶残基代替所述氧化的5-甲基胞嘧啶残基的核酸；

优选地，还原步骤中，所述有机硼烷包含硼烷与选自氮杂环和叔胺的含氮化合物的络合物；

优选地，所述有机硼烷包含硼烷和氮杂环的络合物；

优选地，所述氮杂环包含任选经1-4个低级烷基取代的吡啶；

优选地，所述氮杂环包含吡啶、2-甲基吡啶或5-乙基-2-甲基吡啶；

优选地，所述氮杂环包含2-甲基吡啶，并且所述有机硼烷是2-甲基吡啶硼烷；

优选地，所述有机硼烷包含硼烷和叔胺的络合物；

优选地，所述叔胺选自三乙胺、三(叔丁基)胺中的任意一种；

优选地，所述有机硼烷包含吡啶硼烷；

优选地，还原体系还含有有机酸盐；

优选地，所述有机酸盐包括醋酸钠；

优选地，所述还原体系的pH为4.0～4.5。

5.如权利要求1所述的方法，其特征在于，纯化步骤中，所述载体试剂中含有磁珠；

优选地，纯化步骤中，所述纯化试剂还含有聚乙二醇；

优选地，纯化步骤中，所述载体试剂为干粉状或悬浮液；

优选地，纯化步骤中，所述载体试剂为悬浮液时，所述纯化试剂中载体试剂的体积与聚乙二醇的质量之比为≤1：0.25；

优选地，纯化步骤中，所述载体试剂为悬浮液时，所述载体试剂的体积与聚乙二醇的质量之比为1:(0.25～0.75)；

优选地，纯化步骤中，所述纯化试剂包含载体试剂以及聚乙二醇水溶液，所述载体试剂为悬浮液时，所述载体试剂与聚乙二醇水溶液的体积比≤1：0.5，优选为1：(0.5～3)；

优选地，纯化步骤中，所述聚乙二醇水溶液中聚乙二醇的质量体积百分比为50％；

优选地，纯化步骤中，所述聚乙二醇的分子量为200～20000；

优选地，纯化步骤中，还原体系与纯化试剂的体积之比≤1:1；

优选地，纯化步骤中，还原体系与纯化试剂的体积之比为1：(2～8)。

6.如权利要求1所述的方法，其特征在于，纯化步骤中，纯化试剂与还原产物混合后，在振荡混匀和/或静置条件下，核酸分子吸附至载体。

7.如权利要求1所述的方法，其特征在于，纯化步骤中，振荡混匀时，混合体系的温度控制在20～60℃，优选为30～60℃，优选为30～40℃，更优选为30～37℃；

优选地，纯化步骤中，振荡混匀的转速≥500rpm；

优选地，纯化步骤中，振荡混匀的转速≥1000rpm；

优选地，纯化步骤中，振荡混匀的转速为1000～2500rpm，优选为1000～2000rpm；

优选地，纯化步骤中，将混合步骤所得的混合体系置于恒温条件下振荡混匀；

优选地，纯化步骤中，将混合体系置于恒温混匀仪中进行振荡混匀；

优选地，纯化步骤中，振荡混匀时间≥15min，优选为15～20min；

优选地，纯化步骤中，静置时间≥10min。

8.如权利要求1所述的方法，其特征在于，纯化步骤中，吸附结束后，还包括清洗步骤，具体是使用清洗剂对吸附有核酸分子的载体进行清洗；

优选地，清洗步骤中，使用的清洗剂包含乙醇；

优选地，清洗步骤中，所述清洗剂为体积百分浓度≥80％的乙醇；

优选地，清洗步骤中，所述清洗剂为体积百分浓度为80％～90％的乙醇；

优选地，清洗步骤中，所述清洗剂为预冷的清洗剂；

优选地，清洗步骤中，所述清洗剂为-20～25℃的清洗剂；

优选地，清洗步骤中，所述清洗剂为预冷至-20～4℃的清洗剂；

优选地，清洗步骤中，加入的清洗剂的体积≥200μL；

优选地，清洗步骤中，加入的清洗剂的体积为200～1500μL；

优选地，清洗步骤中，清洗次数≥1；

优选地，清洗步骤中，清洗次数为1～3；

优选地，纯化步骤中，清洗结束后，还包括洗脱步骤，具体是使用洗脱剂从清洗后的载体上洗脱核酸分子；

优选地，洗脱步骤中，洗脱温度为20～40℃，优选为25～40℃，更优选为37～40℃；

优选地，洗脱步骤中，洗脱所使用的洗脱剂包含水或缓冲液；

优选地，洗脱步骤中，所述缓冲液包含TE缓冲液。

9.如权利要求1所述的方法，其特征在于，纯化步骤之后，杂交步骤之前，还包括预文库扩增步骤，包括对纯化后的核酸分子进行预文库扩增，获得预文库扩增产物。

10.如权利要求1所述的方法，其特征在于，杂交步骤中，杂交体系的温度控制在60～65℃，优选为60～63℃。

11.如权利要求1所述的方法，其特征在于，包括在氧化步骤之前，对片段化的核酸样本进行末端修复、测序接头连接，然后进入氧化步骤。

12.如权利要求1所述的方法，其特征在于，包括在纯化步骤之后，对纯化后的核酸样本进行末端修复、测序接头连接，然后进入杂交步骤。

13.如权利要求1所述的方法，其特征在于，杂交步骤之后，还包括捕获步骤，包括使用磁珠捕获所述杂交产物，得到产物；

优选地，还包括文库扩增步骤，包括对捕获步骤所得的产物进行扩增，获得可用于上机测序的文库；

优选地，氧化步骤中，所述核酸样本为DNA或RNA，优选为DNA；

优选地，构建得到的文库用于同时检测甲基化、超低频突变和样本片段信息。

14.如权利要求1～13任意一项所述方法构建得到的文库。