CN116218973A

CN116218973A - 用于二代测序的甲基化靶标检测的探针组、方法及系统

Info

Publication number: CN116218973A
Application number: CN202310149471.8A
Authority: CN
Inventors: 孙雪; 赵颖; 刘星宇; 王伟伟; 田埂
Original assignee: Beijing Yuanma Medical Laboratory Co ltd
Current assignee: Beijing Yuanma Medical Laboratory Co ltd
Priority date: 2023-02-22
Filing date: 2023-02-22
Publication date: 2023-06-06

Abstract

本发明公开用于二代测序的甲基化靶标检测的探针组、方法及系统，该方法包括：利用亚硫酸氢盐处理核酸样品，并进一步单链建库；使核酸样品与捕获探针杂交；富集经捕获探针得到的核酸片段；测序得到该核酸片段的核苷酸序列，通过核苷酸序列得到DNA甲基化状态的信息。本发明的方法能够满足对肿瘤的早期筛查中大量、特定位点的甲基化检测，同时显著提高了探针捕获效率以及对靶标区域的覆盖深度，从而满足肿瘤早筛对于灵敏度的要求。

Description

用于二代测序的甲基化靶标检测的探针组、方法及系统

技术领域

本发明涉及基因检测领域，具体地涉及应用于二代测序平台上的甲基化靶标的捕获富集检测，特别是用于二代测序的甲基化靶标检测的探针组、方法及系统。

背景技术

DNA甲基化是指生物体在DNA甲基转移酶(DNA methyltransferase，DMT)的催化下，以s-腺苷甲硫氨酸(SAM)为甲基供体，将甲基转移到特定碱基上的过程，最常见的是在胞嘧啶上形成5-甲基胞嘧啶(5-mC)。

DNA的甲基化是一种表观调控修饰，可以在不改变碱基序列的情况下参与调控蛋白质的合成。这主要是由于CpG岛的超甲基化改变了DNA区域构象，影响蛋白与DNA的相互作用从而影响转录效率，而启动子区域的甲基化会使基因表达沉默。根据有关文献报道，DNA甲基化和癌症高度相关，启动子区域的甲基化会使抑癌基因沉默，因此，甲基化可作为一种肿瘤筛查，诊断和预后的生物标志物。目前DNA甲基化检测方法大多基于亚硫酸氢盐处理(BS)，经亚硫酸氢钠处理后，未发生甲基化的胞嘧啶被转化为尿嘧啶，而发生甲基化的胞嘧啶不变。

针对肿瘤的早期筛查，需要对大量的、特定的位点的甲基化程度进行检测，同时要达到单核苷酸分辨率，对于这种需求，可以选择BS处理后进行单链建库，再进行靶向捕获结合二代测序的策略。虽然该策略具有高通量，单核苷酸分辨率，DNA投入量低的优势，但该策略仍存在一些问题，在探针捕获前会对DNA进行BS处理，序列中未甲基化的C会转化成T，DNA序列的复杂度降低，GC含量变低，这样会使探针设计变得困难，还会影响捕获效率，降低靶标区域的覆盖深度，而肿瘤早筛对灵敏度有很高的要求。因此，目前仍亟需一种基于二代测序技术的甲基化靶标检测方法来解决这个问题。

背景技术中的信息仅仅在于说明本发明的总体背景，不应视为承认或以任何形式暗示这些信息构成本领域一般技术人员所公知的现有技术。

发明内容

为解决现有技术中存在的技术问题，本发明提供一种用于二代测序的甲基化靶标检测的探针组、方法及系统。具体地，本发明包括以下内容。

本发明的第一方面，提供一种基于二代测序技术的甲基化靶标检测方法，其包括：

(1)利用亚硫酸氢盐处理核酸样品，并进一步单链建库；

(2)使核酸样品与捕获探针杂交，其中捕获探针包括第一探针组和第二探针组，所述第一探针组包括与包含CpG甲基化和/或非甲基化区域的正义链和/或负义链杂交的探针，所述第二探针组包括与所述CpG甲基化和/或非甲基化区域的上游序列和/或下游序列杂交的探针；

(3)富集经所述捕获探针得到的核酸片段；

(4)测序得到所述核酸片段的核苷酸序列，通过所述核苷酸序列得到DNA甲基化状态的信息。

在某些实施方案中，根据本发明所述的基于二代测序技术的甲基化靶标检测方法，其中，所述捕获探针的长度为50-180bp，优选为80-140bp，还优选为120bp。

在某些实施方案中，根据本发明所述的基于二代测序技术的甲基化靶标检测方法，其中，用于甲基化靶标检测的panel大小为1-500K，还优选为12-500K，进一步优选为100-500K，例如100、200、300、400、500K。

在某些实施方案中，根据本发明所述的基于二代测序技术的甲基化靶标检测方法，其中，所述第二探针组覆盖的序列与第一探针组覆盖的序列之间的距离为X个碱基，其中X≥0，还优选地，第二探针组覆盖的序列与CpG甲基化和/或非甲基化区域的距离为50以上个碱基，进一步优选60-400碱基。

在某些实施方案中，根据本发明所述的基于二代测序技术的甲基化靶标检测方法，其中，步骤(2)的杂交温度为50-70℃。

在某些实施方案中，根据本发明所述的基于二代测序技术的甲基化靶标检测方法，其中，所述核酸的样本量为20-40ng，且所述捕获探针的浓度为200-500fmol/μl。

本发明的第二方面，提供一种提高甲基化检测中捕获效率和覆盖深度的方法，其包括使用捕获探针与核酸样本进行杂交捕获的步骤，其中捕获探针包括第一探针组和第二探针组，所述第一探针组包括与包含CpG甲基化和/或非甲基化区域的正义链和/或负义链杂交的探针，所述第二探针组包括与所述CpG甲基化和/或非甲基化区域的上游序列和/或下游序列杂交的探针。

本发明的第三方面，提供一种基于二代测序技术的甲基化靶标检测的探针组，所述探针组包括第一探针组和第二探针组，所述第一探针组包括与包含CpG甲基化和/或非甲基化区域的正义链和/或负义链杂交的探针，所述第二探针组包括与所述CpG甲基化和/或非甲基化区域的上游序列和/或下游序列杂交的探针。

本发明的第四方面，提供一种基于二代测序技术的甲基化靶标检测的试剂盒，其包括本发明第三方面所述的探针组。

本发明的第五方面，提供一种基于二代测序技术的甲基化靶标检测的装置，其包括：

碱基转换单元，其通过亚硫酸氢盐处理进行核酸样品中的碱基转换；

测序数据获取单元，其用于获取所述测序数据，所述测序数据包含通过本发明所述的探针组或试剂盒中的捕获探针(第一探针组和第二探针组中的探针)得到目的片段的核苷酸序列；

数据处理单元，所述数据处理单元通过对所述测序数据进行数据处理得到DNA甲基化状态的信息；和

可选地，输出单元，其用于输出并显示DNA甲基化状态的信息。

本发明为了提高捕获效率，首先优化了探针设计，不仅设计了覆盖靶点的探针，还设计了靶点上游以及下游探针。此外，本发明还测试并确定了合适的panel size，确保了整体捕获效率稳定。同时本发明优化了捕获体系以及杂交条件，测试并优化确定了合适的目标和探针投入比例、总DNA投入量、合适的杂交和洗涤条件。综合以上探针设计、panelsize、实验条件以及合适的DNA投入量等几个条件的优化，显著提高了血检甲基化捕获的捕获效率，还有靶标区域的覆盖深度。

附图说明

图1为靶点覆盖深度比较结果。

图2示出了DNA投入量和捕获效率之间的关系。

具体实施方式

现详细说明本发明的多种示例性实施方式，该详细说明不应认为是对本发明的限制，而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。

应理解本发明中所述的术语仅仅是为描述特别的实施方式，并非用于限制本发明。另外，对于本发明中的数值范围，应理解为具体公开了该范围的上限和下限以及它们之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。

除非另有说明，否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料，但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入，用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时，以本说明书的内容为准。

除非另有说明，本文所用术语“检测”是指包括确定样品中的甲基化存在与否和/或定性甲基化类型(完全甲基化、完全非甲基化)的方法。

本发明中，甲基化位点来源于待测的核酸样本，术语“待测的核酸样本”来源于受试者/患者的生物样品。可用于本发明的生物样品类型的实例包括但不限于以下的一种或多种：全血、血清、血浆、血液成分、骨髓、细胞、组织、器官、体液、淋巴液、脑脊髓液、病变渗出物和由身体产生的其他流体。生物样品类型也可以是冷冻、固定、石蜡包埋或新鲜的活检样品。

本文所用术语“受试者”包括脊椎动物，优选为哺乳动物，还优选为人。哺乳动物包括但不限于鼠类、猿、家畜等，具体的哺乳动物包括大鼠、小鼠、猫、狗、猴子和人。非人类哺乳动物包括除人之外的所有哺乳动物。

本发明所使用的基因检测“panel”是高通量基因检测和基因测序发展来的词语，是指在检测中将若干基因对应的探针设计到同一张捕获芯片上或进行探针混合(pooling)以捕获目标DNA并用于后续的基因测序。在检测中不只是检测一个位点、一个基因，而是同时检测多个位点、多个基因。

在本文中，术语“基因检测panel”、“基因panel”或者“panel”表示相同的意义且可以互换使用，尤其是指作为多基因检测的DNA探针集合或杂交探针组合。

本发明中的基因panel尤其是指针对一定数目的基因或者是基因组区域进行检测的一种探针捕获方案。相比全基因组检测而言，本发明的基因panel可只对少量目标区域捕获从而进行检测。本发明的基因panel可由检测各种实体肿瘤或癌症相关基因的杂交探针组成，其常见的固相载体可以采用基因芯片的硅片或玻片，也可以是液相的探针反应池(pool)，可将各种反应物以及探针在反应池中完成反应，对此不做具体限定。

基于二代测序技术的甲基化靶标检测方法

本发明的第一方面，提供一种基于二代测序技术的甲基化靶标检测方法，其包括以下步骤(1)-(4)。

本发明中，步骤(1)利用亚硫酸氢盐处理核酸样品，使得未发生甲基化的胞嘧啶被转化为尿嘧啶，而发生甲基化的胞嘧啶不变，并进一步单链建库。亚硫酸氢盐处理以及单链建库的具体步骤和使用的试剂不特别限定，可以采用本领域已知的试剂盒进行核酸样本中碱基类型的转化以及文库构建试剂盒进行单链建库流程。

本发明中，步骤(2)和(3)的目的是利用捕获探针进行靶点或目标区域的杂交捕获和富集。本发明首先对捕获探针进行了设计和优化，以提高捕获效率和靶标的覆盖深度。在亚硫酸氢盐处理核酸样品后，DNA的正义链和负义链不再完全互补，变成独立的两条链，考虑到甲基化状态，最终探针设计是以正义链CpG完全甲基化、正义链CpG完全非甲基化、负义链CpG完全甲基化和负义链CpG完全非甲基化进行的，因此，除非另有说明，否则本文中提及探针包括了能够与正义链和/或负义链杂交的探针。

本发明第二探针组中设计的探针与常规设计的探针不同，常规设计覆盖靶点的探针会在靶点两端延伸形成长度在120bp左右的探针，但是对于捕获效率和靶点覆盖深度效果较差。因此，本发明是在传统探针的基础上，增加了能够增加捕获效率和靶点覆盖深度的另外的探针。覆盖靶点的探针在本发明中又称为第一探针组。能够增加捕获效率和靶点覆盖深度的另外的探针在本发明中又称为第二探针组。其中，第二探针组包括CpG甲基化和/或非甲基化区域的上游序列和/或下游序列杂交的探针。优选地，第二探针组包括能够与第一探针组所覆盖的目标区域的上游和/或下游的1-400bp杂交的探针，目标区域的上游的1-400bp是指CpG甲基化和/或非甲基化区域的5’端上游的1-400bp，例如1、10、40、60、80、100、200、300、400bp，目标区域的下游的1-400bp是指CpG甲基化和/或非甲基化区域的3’端下游的1-400bp，例如1、10、40、60、80、100、200、300、400bp。

在探针设计时，需考虑第二探针组的位置，优选地第二探针组的位置紧邻CpG甲基化和/或非甲基化区域，比如左侧(5’端)的第二探针组中探针的3’端紧邻CpG甲基化和/或非甲基化区域的5’端。当紧邻的该探针的特异性差时，可以向靶标的外侧(5’方向)挪动1-20个碱基。或者向内侧(3’方向)挪动1-20个碱基。

在本发明中，对具体探针序列不特别限定，虽然本发明中没有示出具体的探针序列，但是本领域技术人员能够根据感兴趣的靶点和探针设计思路得到所需第一探针组和/或第二探针组的探针，并进一步通过常规合成方法得到所需探针。

本发明中，第二探针组中的探针GC含量优选在40-60％，还优选为50％。

第一探针组包括针对至少一个甲基化位点的探针，每个甲基化位点对应的探针数量至少为4条，分别为针对该位点的正义链CpG完全甲基化探针、正义链CpG完全非甲基化探针、负义链CpG完全甲基化探针和负义链CpG完全非甲基化探针。第一探针组可以是针对5个以上，例如10、15、20、50、100、150、200个以上不同甲基化位点的探针的集合。类似地，第二探针组包括针对至少一个甲基化位点的上游和/或下游探针。在某些实施方案中，第二探针组可以仅包括针对至少一个甲基化位点的上游探针。在某些实施方案中，第二探针组可以仅包括针对至少一个甲基化位点的下游探针。在某些实施方案中，第二探针组可以同时包括针对至少一个甲基化位点的上游和下游探针。

需要说明的是，本发明首先是以小panel进行了测试，发现常规完全覆盖检测位点的探针和本发明的第二探针组合协同地增加了捕获效率和靶点的覆盖深度，上述组合探针捕获效率相比只有单独甲基化目标覆盖的探针组有3倍以上明显的提升。

本发明中，“杂交”是指通过碱基互补配对，探针组中的探针与目标区域结合。本发明还发现panel size和杂交条件能够影响捕获效率和靶点的覆盖深度，同时考虑捕获区域过大会影响整体检测成本，经过大量实验，发现第一探针组与第二探针组组合形成300-700kb大小的组合，能够获得相对稳定的捕获效率区间500kb。当针对110个检测位点设计探针时，panel size大约为13k，捕获效率为2.32％，当panel size为500k左右时，捕获效率可以提升至30-60％之间。

本发明进一步对杂交温度(50-70℃之间)进行了温度梯度和杂交效率关联优化，最终确定温度范围为55-62℃之间。再进一步通过补充GC平衡探针组以及第二探针组，体系整体优化后，将杂交温度稳定在58-62℃，例如58℃、59℃、60℃、61℃、62℃，而不同于常规的杂交捕获在65℃左右。

此外，本发明还发现核酸样本投入量与探针比例也影响整体捕获效率。优选地，当核酸的样本量为20-40ng，例如20、22、24、26、28、30、32、34、36、38、40ng，且捕获探针的浓度为200-500fmol/μl，例如200、225、250、275、300、325、350、375、400、425、450、475、500fmol/μl时，具有显著提高的整体捕获效率。

本发明中，步骤(4)是对核酸片段的核苷酸序列进行测序，其中，用于二代测序的系统或平台不特别限定，其包括但不限于大规模平行签名测序(Massively ParallelSignature Sequencing，MPSS)、聚合酶克隆(Polony Sequencing)、454焦磷酸测序(454pyrosequencing)、Illumina(Solexa)sequencing、ABI SOLiD sequencing、离子半导体测序(Ion semiconductor sequencing)、DNA纳米球测序(DNA nanoball sequencing)等。

本领域技术人员应理解，只要能够实现本发明的目的，在上述步骤(1)-(4)前后，或步骤之间还可包含其他步骤或操作，例如进一步优化和/或改善本发明所述的方法。

提高甲基化检测中捕获效率和覆盖深度的方法

本发明进一步提供一种提高甲基化检测中捕获效率和覆盖深度的方法，包括使用捕获探针与核酸样本进行杂交捕获的步骤，其中捕获探针包括上述的第一探针组和第二探针组。

探针组

本发明的探针组包括第一探针组和第二探针组。上文对第一探针组和第二探针组已进行了详细说明，在此不再赘述。

试剂盒

本发明进一步提供试剂盒，其包含特异性检测甲基化靶标的试剂，所述试剂包括本发明的探针组。

本发明的试剂盒可进一步包含能够通过各种测定类型(诸如核酸提取及定量试剂、使胞嘧啶脱氨为尿嘧啶残基的试剂、DNA/RNA芯片或微阵列、RT-PCR、二代测序等)进行常规检测的其他试剂。

除了上述组分之外，本发明的试剂盒还可包括以政府机构规定的形式与调控制造、使用或销售诊断试剂盒相关的注意事项。另外，本发明的试剂盒还可提供有使用、储存和故障排除的详细说明书。试剂盒还可任选地设置在适合的优选用于以高通量设置的机器人操作的装置中。

在某些实施方案中，本发明的试剂盒的组分(例如，寡核苷酸)可提供为干粉。当试剂和/或组分提供为干粉时，粉末可通过添加适合的溶剂来恢复原状。预期该溶剂还可设置于另一容器中。容器通常会包括至少一种小瓶、试管、烧瓶、瓶、注射器和/或其它容器手段，其中可选等分地放置溶剂。试剂盒还可包括用于包含无菌、药学上可接受的缓冲液和/或其它溶剂的第二容器的手段。

在某些实施方案中，本发明的试剂盒的组分可以溶液形式提供，例如水溶液的形式提供。在以水溶液状态存在的情况下，这些成分的浓度或含量是本领域技术人员能够根据不同需求而方便地确定的。例如，用于储存的目的时，例如寡核苷酸的浓度可以较高的形式存在，当处于工作状态或使用时，可通过例如稀释上述较高浓度的溶液来将浓度降低至工作浓度。

在试剂盒中存在超过一种组分的情况下，该试剂盒还通常会包含可单独放置另外的组分的第二、第三或其它另外的容器。另外，可在容器中包含各多种组分的组合。本文所述的任何组合或试剂可为试剂盒中的组分。

装置

本发明基于二代测序技术的甲基化靶标检测的装置包括：

测序数据获取单元，其用于获取所述测序数据，所述测序数据包含通过本发明所述的探针组或试剂盒中的捕获探针得到目的片段的核苷酸序列；

本领域的技术人员可以理解的是，本发明所述的各种示例性实施方案可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本发明的具体实施方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质或非暂态计算机可读存储介质(可以是CD ROM、U盘、移动硬盘等)中或网络上，包括若干指令以使得计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本发明的方法。

在示例性实施方案中，本发明的程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的实例包括但不限于：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

相应地，基于同一发明构思，本发明还提供一种电子设备。

在示例性实施方案中，电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于：至少一个处理器、至少一个存储器、连接不同系统组件(包括存储器和处理器)的总线。

其中，所述存储器存储有程序代码，所述程序代码可以被所述处理单元执行，使得所述处理单元执行本发明所述的方法，其中处理器至少包括本发明所述的数据处理单元(也可以称为“模块”)。存储器可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)和/或高速缓存存储单元，还可以进一步包括只读存储单元(ROM)。

本发明的存储器还可以包括具有一组(至少一个)程序模块的程序/实用工具，这样的程序模块包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线可以为表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备交互的设备通信，和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。

这种通信可以通过输入/输出(I/O)接口进行。并且，电子设备还可以通过网络适配器与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。网络适配器通过总线与电子设备的其它模块通信。应当明白，尽管本文未示出，可以结合电子设备使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

用途

本发明提供上文所述探针组或试剂盒在癌症或肿瘤相关的甲基化靶标检测中的用途，其中，所述癌症包括但不限于胃癌、结直肠癌、食管癌、子宫内膜癌、肝细胞癌、乳腺癌和卵巢癌等。

实施例

以下示出了具有提高的二代甲基化捕获测序性能进行甲基化靶标捕获富集检测的实验流程。

一、bisulfite处理cfDNA样本

使用ZYMO公司EZ DNA Methylation-Gold^TMKit进行bisulfite处理，将未甲基化的C转化为U，具体操作如下：

CT转化反应体系：

组分	体积
		CT Conversion Reagent	130ul
DNA模板	20ul
		总体系	150ul

反应条件：

/>

待反应结束后，使用柱内脱磺酸技术，回收DNA。

二、bisulfite处理后单链建库

1、使用ABclonal公司的Scale Methyl-DNA Lib prep Kit for Illumina进行文库构建，包括变性，T7接头连接，二链合成，T5接头连接和PCR富集等步骤。

2、文库构建过程中使用Agencourt AMpure XP磁珠进行纯化，文库构建完成后使用Qubit4.0以及Agilent 2100毛细管电泳进行质控。

三、杂交捕获

1、探针设计优化：

由于实验先进行BS处理，再进行捕获，所以是根据处理后的DNA序列进行探针设计，但是并不确定这段序列中的C甲基化状态如何，所以需要分两种情况进行探针设计，一种是序列中的CpG完全甲基化，一种是序列中的CpG完全非甲基化。同时由于BS处理后，考虑到DNA的正义链和负义链，分别设计正义链CpG完全甲基化、正义链CpG完全非甲基化、负义链CpG完全甲基化和负义链CpG完全非甲基化。

传统完全覆盖靶点的设计方案根据要检测的位点信息，在两端各延伸60bp进行初次探针设计，形成120bp长度的探针(示例见表1)。若该位置的探针的特异性和GC含量较差，可以左右移动，移动范围小于60bp。

表1靶点检测4条甲基化捕获探针示例

针对示例性检测的110个位点，单独采用这种传统的探针设计方案与优化后的探针设计进行捕获效率和靶点覆盖深度进行比较。其中探针优化采用以下方案：在原始探针的基础上，增加了针对靶点序列上游和/或下游的第二探针组的探针。第二探针组的探针的设计规则是，在原有的完全覆盖靶点的探针基础上，在其探针位置的上下游400bp的范围内进行筛选，该范围内的候选探针需要满足：首先，与Repbase数据库比对，如果有明显重复序列特征的区域或探针，即将该条探针移除；其次，将与人类基因组数据库有多处比对结果，特异性不好的探针被移除(探针中进行比对非目标区域的碱基个数在40-100个被定为特异性差的探针序列)；最后，在剩下的探针中优选GC含量最佳的探针，杂交反应中稳定性和特异性都最优的探针是GC含量在40-60％范围，同时优化在50％左右的为最佳。在具体应用中，上下游可能都有符合条件的上游探针和/或下游探针，也可能只有一侧有符合条件的上游探针和/或下游探针。

本实施例在要检测的110个位点中随机选择了15个位点按照上述规则设计了上游探针和/或下游探针(见表2)，并将这些上游探针和/或下游探针加入了原来的完全覆盖检测位点的探针pool中进行捕获效率和靶点覆盖深度进行比较。

表2上游探针和/或下游探针位置

染色体	位点位置	上游探针start	上游探针end	下游探针start	下游探针end
						chr1	54518349	54518150	54518270
chr11	111383515			111383654	111383774
						chr11	128563714	128563458	128563578
chr12	4383724	4383522	4383642	4383772	4383892
						chr12	4384022	4383764	4383884	4384139	4384259
chr12	25102072	25101834	25101954	25102201	25102321
						chr14	25518624	25518369	25518489	25518745	25518865
chr17	66287032	66286805	66286925	66287091	66287211
						chr18	70211515	70211272	70211392	70211577	70211697
chr19	38183055	38182834	38182954	38183130	38183250
						chr2	127783168	127782928	127783048	127783306	127783426
chr20	52790139			52790200	52790320
						chr8	104512858			104512955	104513075
chr9	96215837	96215602	96215722	96215974	96216094
						chr9	124461171	124460928	124461048

2、文库杂交捕获

2.1合适的panel size和杂交条件优化

通过与合适大小的探针组进行组合，调整整体panel大小，同时一定程度优化和校正甲基化捕获区域的GC含量严重偏离的问题，可以有效提升对目标区域的捕获效率和覆盖度，而考虑到捕获区域过大又会影响整体检测成本，因此，在多轮测试后，最终确定甲基化捕获探针组与其他探针组组合形成300-700kb大小的组合，获得相对稳定的捕获效率区间500kb。针对110个检测位点设计探针时，panel size大约为13k，捕获效率仅为2.32％，当panel size为500k左右时，捕获效率可以提升至30-60％之间。

因为BS处理后，未甲基化C会被转化为T，导致目标DNA整体GC含量偏离，因此需要对杂交体系和条件进行进一步优化，调整目标区域与探针分子数比例。同时在杂交温度从50-70℃进行温度梯度和杂交效率关联优化，最终缩小范围到55-60℃之间，再进一步通过补充GC平衡探针组以及第二探针组，体系整体优化后，将杂交温度稳定在60℃，而不同于常规的杂交捕获在65℃左右。

2.2合适的cfDNA投入量优化

为了应用于肿瘤早筛，需要对cfDNA进行检测。通过对总投入量和探针比例的测试和优化，发现在20-40ng之间，同时探针pool的浓度在375fmol/ul，是最优的目标与探针组的分子数比例，低于20ng会严重影响捕获效率(见下表3，图2)，大于40ng，对整体捕获效率提升不显著，且需要抽取过多血液(一般大于两管)，不利于医学检测的开展。

表3相同panel不同DNA投入量时的捕获效率

2.3将1000ng制备好的杂交前文库与人cot-1DNA、文库封闭试剂混合，使用真空浓缩仪60℃蒸干后，再复溶于杂交液中，室温孵育10min后放置在PCR仪中，95℃变性10min后转至60℃，加入混合好的探针杂交16-18h。

3、链霉亲和素磁珠捕获

将步骤2产物与链霉亲和素磁珠混合，在PCR仪上孵育45min，孵育过程中每10min涡旋混匀3s，确保磁珠处于悬浮状态，后续用清洗液对磁珠进行清洗。

4、探针捕获区域富集

利用高保真聚合酶，引物对步骤3的产物进行富集，富集后用1.5倍AgencourtAMPure XP磁珠进行纯化，纯化后使用Qubit4.0以及Agilent2100毛细管电泳进行质控。

四、上机测序

针对示例性检测的110个位点，单独采用传统的探针设计方案与优化后的探针设计进行捕获效率和靶点覆盖深度进行比较，结果发现捕获效率和靶点的覆盖深度都比较差，不能达到检测的覆盖度需求，影响到后续甲基化分析和检测报告解读(见下表4)。

表4单独使用覆盖检测靶点探针时的捕获效率和覆盖深度

/>

本实施例在要检测的110个位点中随机选择了15个位点按照上述规则设计了上游探针和/或下游探针(表2)，并将这些上游探针和/或下游探针加入了原来的完全覆盖检测位点的探针pool中进行捕获效率和靶点覆盖深度进行比较。结果发现第二探针组中的探针+原来的完全覆盖检测位点的探针的捕获效率相比只有单独甲基化目标覆盖的探针组有3倍以上明显的提升。P值＜0.01(见图1)靶点的覆盖深度在使用测序数据总reads数均一化后，也有2倍到10倍以上的明显提升(见表5)。

表5覆盖靶点探针+第二探针组中的探针时的捕获效率和覆盖深度

尽管本发明已经参考示例性实施方案进行了描述，但应理解本发明不限于公开的示例性实施方案。在不背离本发明的范围或精神的情况下，可对本发明说明书的示例性实施方案做多种调整或变化。权利要求的范围应基于最宽的解释以涵盖所有修改和等同结构与功能。

Claims

1.一种基于二代测序技术的甲基化靶标检测方法，其特征在于，包括：

(1)利用亚硫酸氢盐处理核酸样品，并进一步单链建库；

(2)使核酸样品与捕获探针杂交，其中捕获探针包括第一探针组和第二探针组，所述第一探针组包括与CpG甲基化和/或非甲基化区域杂交的探针，所述第二探针组包括与所述CpG甲基化和/或非甲基化区域的上游序列和/或下游序列杂交的探针；

(3)富集经所述捕获探针得到的核酸片段；

2.根据权利要求1所述的基于二代测序技术的甲基化靶标检测方法，其特征在于，所述捕获探针的长度为50-180bp。

3.根据权利要求2所述的基于二代测序技术的甲基化靶标检测方法，其特征在于，用于甲基化靶标检测的panel大小为1-500K。

4.根据权利要求3所述的基于二代测序技术的甲基化靶标检测方法，其特征在于，所述第二探针组覆盖的序列与第一探针组覆盖的序列之间的距离为X个碱基，其中X≥0。

5.根据权利要求4所述的基于二代测序技术的甲基化靶标检测方法，其特征在于，步骤(2)的杂交温度为50-70℃。

6.根据权利要求5所述的基于二代测序技术的甲基化靶标检测方法，其特征在于，所述核酸的样本量为20-40ng，且所述捕获探针的浓度为200-500fmol/μl。

7.一种提高甲基化检测中捕获效率和覆盖深度的方法，其特征在于，包括使用捕获探针与核酸样本进行杂交捕获的步骤，其中捕获探针包括第一探针组和第二探针组，所述第一探针组包括与CpG甲基化和/或非甲基化区域杂交的探针，所述第二探针组包括与所述CpG甲基化和/或非甲基化区域的上游序列和/或下游序列杂交的探针。

8.一种基于二代测序技术的甲基化靶标检测的探针组，其特征在于，所述探针组包括第一探针组和第二探针组，所述第一探针组包括与CpG甲基化和/或非甲基化区域杂交的探针，所述第二探针组包括与所述CpG甲基化和/或非甲基化区域的上游序列和/或下游序列杂交的探针。

9.一种基于二代测序技术的甲基化靶标检测的试剂盒，其特征在于，包括权利要求8所述的探针组。

10.一种基于二代测序技术的甲基化靶标检测的装置，其特征在于，其包括：

测序数据获取单元，其用于获取所述测序数据，所述测序数据包含通过根据权利要求8所述的探针组或权利要求9所述的试剂盒中的捕获探针得到目的片段的核苷酸序列；