WO2021073490A1

WO2021073490A1 - 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法

Info

Publication number: WO2021073490A1
Application number: PCT/CN2020/120560
Authority: WO
Inventors: 焦宇辰; 曲春枫; 王宇婷; 王沛; 陈坤; 宋欠欠; 刘慧�; 王京京; 王思振
Original assignee: 中国医学科学院肿瘤医院; 北京泛生子基因科技有限公司
Priority date: 2019-10-16
Filing date: 2020-10-13
Publication date: 2021-04-22
Also published as: EP4023795A1; EP4023795A4; CN112176419A; KR20220088724A; JP2022551688A; US20230272475A1; CN112176419B

Abstract

本发明公开了一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法，该方法可以在一份样本中同时检测ctDNA中的肿瘤特异基因的变异(包括点突变、插入缺失突变、HBV整合等多种突变形式)和/或甲基化的方法，不仅样本量需求低，而且该方法制备的MC文库可以支持10-20次的后续检测，每次检测的结果都可以代表全部原始ctDNA标本的突变状况及酶切位点覆盖区域的甲基化修饰情况，且不会造成灵敏度和特异性的降低。本发明对肿瘤早期筛查、病情追踪、疗效评估、预后预测等具有重要的临床意义，有重大的应用价值。

Description

一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法

技术领域

本发明属于生物医学领域，具体涉及一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法。

背景技术

循环肿瘤DNA(circulating tumor DNA，ctDNA)来源于肿瘤细胞的凋亡、坏死或分泌产生的DNA片段，含有与肿瘤组织DNA相同的基因变异和表观修饰，如点突变、基因重排、融合、拷贝数变异、甲基化修饰等。ctDNA的检测可以应用于癌症早期筛查、诊断和分期、指导靶向用药、疗效评估、复发监测等各方面。结合ctDNA携带的肿瘤特异基因的变异和甲基化两方面信息，有助于提高检测的灵敏度和特异性，更早发现癌症踪迹，对于肿瘤早筛有重要意义。

现有的基因变异检测和甲基化检测需要遵循不同的技术路线。ctDNA基因变异的检测，由于受到ctDNA在cfDNA中占比较低的限制，实质上是低频突变的检测，现有技术分为两类：1)基于PCR的热点突变检测法，通常检测一个或几个热点突变或已知突变，无法检测基因融合等复杂突变，无法检测未知突变，覆盖范围较小；2)捕获测序法：适合多重靶标检测，包括复杂突变，但捕获试剂盒一般价格昂贵、操作复杂、耗时较长。在应用过程中，需要根据靶标的数量和特性，选取适合的检测方法。ctDNA甲基化标志物的优点在于成簇分布，与基因变异相比特异性更高，具有组织特异性，可以追溯肿瘤来源，标志物数量更多，可以达到更高的灵敏度；其检测方法包括：1)甲基化PCR，由于重亚硫酸盐转化步骤造成DNA损失及序列多样性降低，这种方法难以实现多重靶标检测；2)基于探针杂交的甲基化捕获：可覆盖8％-13％的CpG位点，同时检测大量标志物，但受到有限的ctDNA起始量的限制，并且经重亚硫酸盐处理后，基因组序列丰富度下降，探针特异性不易保证；3)基于MspI酶切的RRBS(Reduced representation bisulfite sequencing，RRBS)，它所覆盖的CpG位点由酶切位点“CCGG”决定，约占8％-10％的CpG位点，对甲基化C碱基的识别同样依赖于重亚硫酸盐转化。RRBS检测的甲基化位点集中在CpG岛和启动子区，成本较低。上述3种方法甲基化PCR覆盖位点有限；甲基化捕获可覆盖较多位点，相比RRBS数据更稳定；RRBS成本最低，也可以覆盖大量甲基化位点，在应用过程中需要根据靶标的数量和特性进行取舍。

目前没有简单、低成本和可靠的方案，实现同时检测ctDNA中的基因变异和甲基化这两种重要的肿瘤特异标志物。主要存在以下困难：1)一次抽血获得ctDNA标本量有限，通常仅够支持1-2次检测，这就造成ctDNA临床检测中通常是单平台、一次性的，难以在一份样本中同时实现突变检测和甲基化检测，尤其是依赖于重亚硫酸盐转化的甲基化检测技术，处理过程中会造成较多的DNA损失；2)甲基化检测技术的重亚硫酸盐转化步骤，将导致DNA序列无法呈现大部分突变信息，这部分DNA携带信息的损失可能会导致低频突变检测灵敏度的降低；3)临床检测中经常需要根据首次检测的结果判断后续检测的目标和方案，这就需要在后续检测中重新抽血，检测周期延长；另外，ctDNA相关临床检测或研究中经常需要比较多种技术的优劣，这就需要数倍于正常抽血量的标本，患者通常无法接受；4)无论是PCR法还是捕获法，扩增过程中产生的噪音突变会严重干扰ctDNA低频突变的检测，造成假阳性结果，误导患者的诊断和治疗；5)ctDNA突变含量低，操作过程中易发生污染，造成假阳性结果。

发明公开

本发明的目的是同时检测ctDNA中多种肿瘤特异基因的变异和/或甲基化。

本发明首先保护一种测序文库构建方法，可依次包括如下步骤：

(1)取DNA样本，用甲基化敏感限制性内切酶酶切；

(2)将步骤(1)酶切后的DNA样本依次进行末端修复和3’端加A处理；

(3)将步骤(2)处理后的DNA样本与接头混合物中的接头连接，经过PCR扩增后得到文库；

所述接头混合物由n个接头组成；

每个接头均由一条上游引物甲和一条下游引物甲形成部分双链结构得到；上游引物甲中具有测序接头甲、随机标签、锚定序列甲和位于末端(如3’末端)的碱基T；下游引物甲中具有锚定序列乙和测序接头乙；所述部分双链结构由锚定序列甲和锚定序列乙反向互补形成；

所述测序接头甲和测序接头乙为根据不同测序平台选择对应的测序接头；

所述随机标签为8-14bp(如8-10bp、10-14bp、8bp、10bp或14bp)的随机碱基；

所述锚定序列甲长度为12-20bp(如12-16bp、16-20bp、12bp、16bp或20bp)，连续重复碱基≤3个；

n个接头采用n个不同的锚定序列甲，且每个锚定序列甲中四种碱基平衡，错配碱基数≥3；

n为≥8的任意自然数。

通常，建库用的接头由两条序列退火而成，呈“Y”型结构，两条序列间互补配对的部分(即锚定序列甲和锚定序列乙)称之为锚定序列。所述锚定序列可作为序列固定的内置标签，用于标记原始模板分子。

所述锚定序列不与引物其它部分相互作用(如形成发卡结构、二聚体等)。

所述上游引物甲自5’端依次可包括测序接头甲、随机标签、锚定序列甲和碱基T。

所述上游引物甲自5’端依次可由测序接头甲、随机标签、锚定序列甲和碱基T组成。

所述下游引物甲自5’端依次可包括锚定序列乙和测序接头乙。

所述下游引物甲自5’端依次可由锚定序列乙和测序接头乙组成。

所述“每个锚定序列甲中四种碱基平衡”即A、T、C和G均匀分布。

所述“错配碱基数≥3”可为所述接头混合物包含n个锚定序列甲，各个锚定序列甲之间的碱基至少有3个不同。该不同可为位置不同或顺序不同。

所述DNA样本可为基因组DNA、cDNA、ct DNA或cf DNA样本。

所述n具体可为12。

所述随机标签具体可为8bp的随机碱基。

所述锚定序列甲长度具体可为12bp。

当n＝12时，所述锚定序列甲的核苷酸序列具体分别可为序列表的序列1自5’端第30-41位、序列表的序列3自5’端第30-41位、序列表的序列5自5’端第30-41位、序列表的序列7自5’端第30-41位、序列表的序列9自5’端第30-41位、序列表的序列11自5’端第30-41位、序列表的序列13自5’端第30-41位、序列表的序列15自5’端第30-41位、序列表的序列17自5’端第30-41位、序列表的序列19自5’端第30-41位、序列表的序列21自5’端第30-41位、序列表的序列23自5’端第30-41位所示。

所述测序接头甲具体可为来自Illumina公司的Truseq测序试剂盒的测序接头。所述测序接头甲具体可如序列表的序列1自5’端第1-29位所示。

所述测序接头乙具体可为来自Illumina公司的nextera测序试剂盒的测序接头。所述测序接头乙具体可如序列表的序列2自5’端第13-41位所示。

当n＝12时，所述12个接头如下：

接头1可由序列表的序列1所示的单链DNA分子和序列2所示的单链DNA分子形成部分双链结构得到；接头2可由序列表的序列3所示的单链DNA分子和序列4所示的单链DNA分子形成部分双链结构得到；接头3可由序列表的序列5所示的单链DNA分子和序列6所示的单链DNA分子形成部分双链结构得到；接头4可由序列表的序列7所示的单链DNA分子和序列8所示的单链DNA分子形成部分双链结构得到；接头5可由序列表的序列9所示的单链DNA分子和序列10所示的单链DNA分子形成部分双链结构得到；接头6可由序列表的序列11所示的单链DNA分子和序列12所示的单链DNA分子形成部分双链结构得到；接头7可由序列表的序列13所示的单链DNA分子和序列14所示的单链DNA分子形成部分双链结构得到；接头8可由序列表的序列15所示的单链DNA分子和序列16所示的单链DNA分子形成部分双链结构得到；接头9可由序列表的序列17所示的单链DNA分子和序列18所示的单链DNA分子形成部分双链结构得到；接头10可由序列表的序列19所示的单链DNA分子和序列20所示的单链DNA分子形成部分双链结构得到；接头11可由序列表的序列21所示的单链DNA分子和序列22所示的单链DNA分子形成部分双链结构得到；接头12可由序列表的序列23所示的单链DNA分子和序列24所示的单链DNA分子形成部分双链结构得到。

所述接头可以通过将上游引物甲和下游引物甲进行退火得到。

所述接头混合物中，每个接头可等摩尔混合。

所述方法还可包括对步骤(3)得到的文库进行扩增的步骤。所述扩增的引物是根据接头序列设计的，即所述扩增的引物至少要有一段序列与接头的某段序列完全一致。所述扩增采用的引物对具体可由序列表的序列25和序列26所示的两条单链DNA分子组成。

序列表的序列25所示的单链DNA分子即为测序接头甲自5’端第1至19位。

序列表的序列26所示的单链DNA分子即为测序接头乙自3’端第1至22位。

本发明还保护以上所述的方法构建得到的DNA文库。

本发明还保护一种用于构建测序文库的试剂盒，可包括上述任一所述的接头混合物和甲基化敏感限制性内切酶。

所述用于构建测序文库的试剂盒具体可由上述任一所述的接头混合物和甲基化敏感限制性内切酶组成。

本发明还保护一种用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒，包括上述任一所述接头混合物和引物组合；所述引物组合包括引物组Ⅰ、引物组Ⅱ、引物组Ⅲ、引物组Ⅳ、引物组Ⅴ、引物组Ⅵ、引物组Ⅶ和引物组Ⅷ；

所述引物组Ⅰ和所述引物组Ⅱ中的各个引物是根据与肿瘤突变相关的区域设计的特异性引物，作用是定位于基因组特定位置，实现目标区域的PCR富集；所述引物组Ⅰ和所述引物组Ⅱ分别用于检测DNA正链和负链的突变位点；

所述引物组Ⅲ和所述引物组Ⅳ中的各个引物是根据肿瘤特异高甲基化区域设计的特异性引物，作用是定位于基因组特定位置，实现目标区域的PCR富集；所述引物组Ⅲ和所述引物组Ⅳ分别用于检测DNA正链和负链的甲基化位点；

所述引物组Ⅴ、所述引物组Ⅵ、所述引物组Ⅶ和所述引物组Ⅷ中的各个引物均包括接头序列和特异序列，特异序列用于目标区域进行进一步富集；

所述引物组Ⅴ和所述引物组Ⅰ中，针对同一突变位点设计的两个引物为“巢式”关系；

所述引物组Ⅵ和所述引物组Ⅱ中，针对同一突变位点设计的两个引物为“巢式”关系；

所述引物组Ⅶ和所述引物组Ⅲ中，针对同一甲基化位点设计的两个引物为“巢式”关系；

所述引物组Ⅷ和所述引物组Ⅳ中，针对同一甲基化位点设计的两个引物为“巢式”关系。

所述“根据与肿瘤突变相关的区域设计的特异性引物”具体可为根据肿瘤特异基因变异(如点突变、插入缺失突变、HBV整合等多种突变形式)的区域，设计对应的基因特异引物。

所述“根据肿瘤特异高甲基化区域设计的特异性引物”具体可为根据肿瘤特异甲基化区域，设计对应的基因特异引物。

所述试剂盒中，所述肿瘤可为肝脏恶性肿瘤，即肝细胞癌。

所述与肝细胞癌突变相关的区域具体可为肝细胞癌高频突变基因(TP53、CTNNB1、AXIN1、TERT)的相关区域和针对HBV整合热点区域。

上述任一所述试剂盒中，所述引物组Ⅰ包括78个单链DNA分子，78个单链DNA分子的核苷酸序列依次如序列表的序列28至序列105所示。所述引物组Ⅱ包括82个单链DNA分子，82个单链DNA分子的核苷酸序列依次如序列表的序列106至序列187所示。所述引物组Ⅲ包括14个单链DNA分子，14个单链DNA分子的核苷酸序列依次如序列表的序列188至序列201所示。所述引物组Ⅳ包括15个单链DNA分子，15个单链DNA分子的核苷酸序列依次如序列表的序列202至序列216所示。所述引物组Ⅴ包括75个单链DNA分子，75个单链DNA分子依次包括如序列表的序列220至序列294自5’末端起第16位至3’末端所示的核苷酸序列。所述引物组Ⅵ包括79个单链DNA分子，79个单链DNA分子依次包括如序列表的序列295至序列373自5’末端起第16位至3’末端所示的核苷酸序列。所述引物组Ⅶ包括14个单链DNA分子，14个单链DNA分子依次包括如序列表的序列374至序列387自5’末端起第16位至3’末端所示的核苷酸序列。所述引物组Ⅷ包括15个单链DNA分子，15个单链DNA分子依次包括如序列表的序列388至序列402自5’末端起第16位至3’末端所示的核苷酸序列。

所述引物组Ⅴ中75个单链DNA分子的核苷酸序列依次可如序列表的序列220至序列294所示。所述引物组Ⅵ中79个单链DNA分子的核苷酸序列依次可如序列表的序列295至序列373所示。所述引物组Ⅶ中14个单链DNA分子的核苷酸序列依次可如序列表的序列374至序列387所示。所述引物组Ⅷ中15个单链DNA分子的核苷酸序列依次可如序列表的序列388至序列402所示。

所述引物组Ⅰ具体可由所述78个单链DNA分子组成。

所述引物组Ⅱ具体可由所述82个单链DNA分子组成。

所述引物组Ⅲ具体可由其所述14个单链DNA分子组成。

所述引物组Ⅳ具体可由其所述15个单链DNA分子组成。

所述引物组Ⅴ具体可由所述75个单链DNA分子组成。

所述引物组Ⅵ具体可由所述79个单链DNA分子组成。

所述引物组Ⅶ具体可由其所述14个单链DNA分子组成。

所述引物组Ⅷ具体可由其所述15个单链DNA分子组成。

上述任一所述试剂盒具体可由上述任一所述接头混合物和所述引物组合组成。

上述任一所述引物组合具体可由所述引物组Ⅰ、所述引物组Ⅱ、所述引物组Ⅲ、所述引物组Ⅳ、所述引物组Ⅴ、所述引物组Ⅵ、所述引物组Ⅶ和所述引物组Ⅷ组成。

上述任一所述试剂盒还可包括用于DNA提取的试剂、用于DNA建库的试剂、用于文库纯化的试剂、用于文库捕获的试剂等用于文库构建的材料。

本发明还保护上述任一所述引物组合。所述引物组合的用途可为检测DNA 样本中肿瘤突变和/或甲基化。

本发明还保护S1)或S2)或S3)：

S1)上述任一所述的引物组合在制备用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒中的应用；

S2)上述任一所述的引物组合在区分肿瘤患者血液样本和非肿瘤患者血液样本中的应用；

S3)上述任一所述试剂盒在区分肿瘤患者血液样本和非肿瘤患者血液样本中的应用。

上述应用中，所述肿瘤可为肝脏恶性肿瘤，即肝细胞癌。

本发明还保护一种检测DNA样本中目标突变和/或甲基化的方法，可包括如下步骤：

(1)按照上述任一所述的方法构建文库；

(2)对步骤(1)得到的文库进行两轮巢式PCR扩增，对产物进行测序，根据测序结果分析DNA样本中目标突变和/或甲基化发生情况；

所述步骤(2)中，采用引物组合甲进行第一轮PCR扩增；

引物组合甲由上游引物甲和下游引物组合甲组成；

所述上游引物甲为文库扩增引物，用于步骤(1)的文库扩增；

所述下游引物组合甲为根据X个目标靶点设计的Y条引物的组合；X和Y均为1以上的自然数，且X≤Y；

以第一轮PCR的产物为模板，采用引物组合乙进行第二轮PCR扩增；

引物组合乙由上游引物乙、下游引物组合乙和index引物组成；

所述上游引物乙为文库扩增引物且3’末端与所述上游引物甲部分相同，用于第一轮PCR的产物的扩增；

所述index引物自5’端包括用于测序的区段A、用于区分样本的index序列和用于测序的区段B；

所述下游引物组合乙中的引物具有所述区段B且与下游引物组合甲中检测相同目标靶点的引物形成巢式关系。

所述上游引物乙的核苷酸序列可如序列表的序列217所示。

所述index引物自5’端具体可由所述区段A、所述index序列和所述区段B组成。

所述区段A的核苷酸序列可如序列表的序列218所示。

所述区段B的核苷酸序列可如序列表的序列219所示。

所述上游引物甲的部分序列与“每个接头的上游引物甲的测序接头甲”的序列完全相同。

所述上游引物乙用于补全文库分子的接头序列，使得扩增产物可以直接进行测序。所述上游引物乙和所述上游引物甲(第一轮PCR扩增使用的引物)的部分核苷酸序列完全相同。

所述上游引物甲的核苷酸序列具体可如序列表的序列27所示。

所述上游引物乙的核苷酸序列具体可如序列表的序列188所示。

当所述目标突变为肝细胞癌突变时，所述下游引物组合甲由上述任一所述引物组Ⅰ和引物组Ⅱ组成。所述下游引物组合乙由上述任一所述引物组Ⅴ和引物组Ⅵ组成。使用引物组Ⅰ和引物组Ⅱ分别对模板进行第一轮PCR扩增。使用引物组Ⅰ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅴ进行扩增。使用引物组Ⅱ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅵ进行扩增。最后将扩增产物等体积混合。

当所述目标甲基化为肝细胞癌甲基化时，所述下游引物组合甲由上述任一所述引物组Ⅲ和引物组Ⅳ组成。所述下游引物组合乙由上述任一所述引物组Ⅶ和引物组Ⅷ组成。

使用引物组Ⅲ和引物组Ⅳ分别对模板进行第一轮PCR扩增。使用引物组Ⅲ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅶ进行扩增。使用引物组Ⅳ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅷ进行扩增。最后将扩增产物等体积混合。

上述方法中，所述DNA样本中目标突变的分析方法可为：将测序数据满足标准甲的DNA分子回溯到一个分子簇；将满足标准乙的分子簇标记为一对duplex分子簇；对某一突变来说，如果满足下述(a1)或(a2)，则该突变为来自原始DNA样本的真实突变：(a1)至少有一对duplex分子簇支持(该条件只支持捕获测序的数据，对于race的数据不适用)；(a2)至少有4个分子簇支持；标准甲即同时满足①、②和③；①DNA插入片段长度相同且除突变位点外序列一致；②随机标签序列相同；③锚定序列相同；标准乙即同时满足④和⑤；④DNA插入片段长度相同且除突变位点外序列一致；⑤分子簇两端的锚定序列相同但位置相反。

上述方法中，所述DNA样本中甲基化的分析方法可为：将测序数据满足标准丙的DNA分子标记为一个簇，分别计算片段末端为关注酶切位点的簇的数量，记录为未甲基化的片段；计算扩增片段达到或超过第一个酶切位点的全部簇的数量，记录为片段总数；根据两种片段数量计算对应区域的平均甲基化水平；区域的甲基化水平＝(1-未甲基化片段数/片段总数)×100％；标准丙即同时满足⑥、⑦和⑧；⑥随机标签序列相同；⑦锚定序列相同；⑧DNA插入片段长度相同且除突变位点外序列一致。

以上所述DNA插入片段具体指除了接头以外的扩增出来的DNA片段。

本发明还保护一种检测DNA样本中多种目标突变和/或甲基化的方法，可包括如下步骤：

(1)按照上述任一所述的方法构建文库；

(2)对步骤(1)的文库进行靶区域富集并进行测序，根据测序结果分析DNA样本中目标突变和/或甲基化的发生情况。

上述方法中，所述DNA样本中目标突变的分析方法可为：将测序数据满足标准甲的DNA分子回溯到一个分子簇；将满足标准乙的分子簇标记为一对duplex分子簇；对某一突变来说，如果满足下述(a1)或(a2)，则该突变为来自原始DNA样本的真实突变：(a1)至少有一对duplex分子簇支持；(a2)至少有4个分子簇支持；标准甲即同时满足①、②和③；①DNA插入片段长度相同且除突变位点外序列一致；②随机标签序列相同；③锚定序列相同；标准乙即同时满足④和⑤；④DNA插入片段长度相同且除突变位点外序列一致；⑤分子簇两端的锚定序列相同但位置相反。

所述靶区域富集可采用现有商购的靶向捕获试剂盒(例如Agilent sureselect XT靶向捕获试剂盒，Agilent5190-8646)进行，将其中最后一步PCR扩增的引物对更换为由引物甲和引物乙组成的引物对。所述引物甲的核苷酸序列可如序列表的序列403所示。所述引物乙可包括区段甲、index序列和区段乙。所述引物乙具体可由所述区段甲、所述index序列和所述区段乙组成。所述区段甲的核苷酸序列可如序列表的序列404所示。所述区段乙的核苷酸序列可如序列表的序列405所示。

上述任一所述方法中，所述目标突变和/或甲基化可为肿瘤突变和/或甲基化。所述肿瘤可为肝脏恶性肿瘤，即肝细胞癌。

上文中，通常多个不同样本的文库会混合在一起测序，所述index序列用于标记不同的样本。测序完成后，根据不同的index序列对总的测序数据进行拆分。Index的设计原则与之前描述的锚定序列的设计原则基本相似。

上文中，DNA样本用甲基化敏感限制性内切酶酶切后，形成DNA片段(此时的DNA片段两端均形成粘末端，末端的单链部分的核苷酸序列即为断点序列)；DNA片段进行末端修复后与接头连接(5’末端和3’末端各连接一个接头，可能是相同接头也可能是相反接头)，对于此时的DNA分子来说，两个接头之间的DNA片段即为DNA插入片段。

本发明提供了一种可以在一份样本中同时检测ctDNA中的肿瘤特异基因的变异(包括点突变、插入缺失突变、HBV整合等多种突变形式)和/或甲基化的方法，不仅样本量需求低，而且该方法制备的MC文库可以支持10-20次的后续检测，每次检测的结果都可以代表全部原始ctDNA标本的突变状况及酶切位点覆盖区域的甲基化修饰情况，且不会造成灵敏度和特异性的降低。使用该方法构建的文库可以同时用于PCR的热点检测和捕获法测序，加入的DNA barcode可以有效滤除假阳性结果，实现基于duplex高特异性测序。同时，文库的构建方法不仅适用于cfDNA样本，也适用于基因组DNA或cDNA样本。本发明对肿瘤早期筛查、病情追踪、疗效评估、预后预测等具有重要的临床意义，有重大的应用价值。

附图说明

图1为adapter和引物架构示意图。

图2为RaceSeq靶区富集和文库构建示意图。

图3为MC文库进行捕获和进行duplex测序的示意图。

图4为Padlock方法和突变/甲基化共检法(即本发明提供的方法)对AK055957基因的甲基化水平检测结果。

图5为单独检测突变法和突变/甲基化共检法检测突变和突变频率的结果。

实施发明的最佳方式

以下的实施例便于更好地理解本发明，但并不限定本发明。

下述实施例中的实验方法，如无特殊说明，均为常规方法。

下述实施例中所用的试验材料，如无特殊说明，均为自常规生化试剂商店购买得到的。

以下实施例中的定量试验，均设置三次重复实验，结果取平均值。

下述实施例中的TE缓冲液为ThermoFisher公司的产品，产品目录号为12090015。

下述实施例中，肝细胞癌患者对本发明进行的内容均知情同意。

实施例1、MC文库的构建

一、甲基化敏感限制性内切酶酶切

取5-40ng cfDNA，按照表1所示配置反应体系，然后按照表2的程序在PCR仪进行酶切处理，得到酶切产物(4℃保存)。

Restriction Enzyme和Restriction Enzyme 10×Buffer均为ThermoFisher公司的产品。Restriction Enzyme和Restriction Enzyme 10×Buffer可以根据不同的待测靶标区域进行选择，选择标准为在待测区域内含有至少1个该甲基化敏感限制性内切酶的酶切位点。

表1.反应体系

成分	体积
cfDNA	16.8μl
Restriction Enzyme 10×Buffer	2μl
Acetylated BSA(浓度为10μg/μl)	0.2μl
Restriction Enzyme(浓度为10U/μl)	1μl
总体积	20μl

表2.反应程序

温度

时间

37℃

2h

二、酶切产物的纯化

取步骤一得到的酶切产物，采用Apostle MiniMax ^TM高效游离DNA富集分离试剂盒(标准版)(Apostle公司的产品，产品目录号为A17622-50)进行纯化、富集，得到纯化产物。

三、纯化产物的平末端修复和加A处理

取步骤二得到的纯化产物，按照表3所示配置反应体系，然后按照表4的反应程序在PCR仪进行末端修复及3’末端加A处理，得到反应产物(4℃保存)。

表3.反应体系

成分	体积
纯化产物	50μl
End Repair&A-Tailing Buffer(KAPA KK8505)	7μl
End Repair&A-Tailing Enzyme Mix(KAPA KK8505)	3μl
总体积	60μl

表4.反应程序

温度	时间
20℃	30min
65℃	30min

四、反应产物与adapter连接

按照表5配置反应体系，20℃反应15min，得到连接产物(4℃保存)。

表5.反应体系

成分	体积
步骤三得到的反应产物	60μl
Adapter Mix(50μM)	1.5μl
DNase/RNase-Free Water	8.5μl
Ligation Buffer(KAPA KK8505)	30μl
DNA Ligase(KAPA KK8505)	10μl
总体积	110μl

Adapter序列信息见表6。

分别将表6中的单链DNA分子用TE缓冲液溶解并稀释至浓度为100μM。将同一组中的两条单链DNA分子等体积混合(各50μl)，然后进行退火(退火程序：95℃，15min；25℃，2h)，得到12组DNA溶液，将12组DNA溶液等体积混合，得到Adapter Mix。

表6.Adapter序列信息

表6中，8个N表示8bp的随机标签。实际应用中，随机标签长度可为8-14bp。

下划线表示12bp的锚定序列，每一组的上游序列(名称中含有“F”的为上游序列)和下游序列(名称中含有“R”的为下游序列)中，下划线部分反向互补，通过退火可使上游序列和下游序列结合在一起形成接头。同时，锚定序列可作为序列固定的内置标签，用于标记原始模板分子。实际应用中，锚定序列长度可为12-20bp，连续重复碱基不超过3个，且不能与引物其它部分相互作用(如形成发卡结构、二聚体等)，12组每一个位置碱基平衡(即A、T、C和G均匀分布)，错配碱基数≥3(即各个锚定序列之间的碱基至少有3个不同；不同可为位置不同或顺序不同)。

上游序列中末端加粗的T与原始分子末端加的“A”互补，进行TA连接。

上游序列中，自5’端第1至21位(来自Illumina公司的Truseq测序试剂盒)为测序引物结合序列，其中，自5’端第1至19位为文库扩增引物部分。

下游序列中，非下划线部分(来自Illumina公司的nextera测序试剂盒)为测序引物结合序列，其中，自3’端第1至22位为文库扩增引物的部分。

表6中共包含12组接头，可以形成12×12＝144种标记组合，结合分子本身的序列信息，足以区分原始样品中的所有分子，实际应用中也可适当增加(合成成本增高)或减少(区分效果略弱)组数。

连接产物结构如图1所示。其中，a为接头部分，b和f分别为文库扩增引物，c为8bp随机标签(表6中的8个N表示)，d为12bp锚定序列(表6中的下划线表示)，e为插入片段(cfDNA)。

五、连接产物纯化

向步骤四得到的连接产物中加入110-220μl(即1-2倍体积)的AMPure XP磁珠(贝克曼A63880)，涡旋混匀，室温放置10min，磁力架吸附5min；待溶液澄清后弃上清，然后加入200μl 80％(体积百分含量)乙醇水溶液清洗2次，弃上清；待乙醇晾干后，加入30μl DNase/RNase-Free Water，涡旋混匀，室温放置10min，磁力架吸附5min，吸取上清溶液至PCR管内，作为PCR模板。

六、文库扩增及纯化

1、取步骤五得到的PCR模板，按照表7配置反应体系，按照表8进行PCR扩增，得到PCR扩增产物(4℃保存)。

表7.反应体系

成分	体积
HIFI(KAPA KK8505)	35μl
MC_F(33μM)	2.5μl
MC_R(33μM)	2.5μl
PCR模板	30μl
总体积	70μl

表7中，引物信息如下：

MC_F(序列25)：5’-GACACGACGCTCTTCCGAT-3’；

MC_R(序列26)：5’-GTGGGCTCGGAGATGTGTATAA-3’。

表8.反应程序

2、向步骤1得到的PCR扩增产物中加入70-140μl(即1-2倍体积)的AMPure XP磁珠，涡旋混匀，室温放置10min，磁力架吸附5min；待溶液澄清后弃上清，然后加入200μl 80％(体积百分含量)乙醇水溶液清洗2次，弃上清；待乙醇晾干后，加入100μl DNase/RNase-Free Water，涡旋混匀，室温放置10min，磁力架吸附5min，吸取上清溶液，得到产物(-20℃储存)。产物即为可长期保存、反复使用的MC文库。

经检测，MC文库可以支持10-20次的后续检测，每次检测的结果都可以代表全部原始样本的突变状况及酶切位点覆盖区域的甲基化修饰情况，不会造成灵敏度和特异性的降低。同时，文库的构建方法不仅适用于cfDNA样本，也适用于基因组DNA或cDNA样本。

实施例2、RaceSeq富集靶区并构建测序文库

如图2所示，使用针对我国肝细胞癌高频突变基因(TP53、CTNNB1、AXIN1、TERT)的相关区域、HBV整合热点区域和肝细胞癌特异高甲基化区域(EMX1、LRRC4、BDH1等)设计的引物，和固定引物配合，对MC文库进行两轮PCR扩增，扩增产物即为测序文库。

图2中，a为第一轮文库扩增上游引物，b为第二轮文库扩增上游引物，c为第一轮文库扩增下游引物库，用于特异目标序列富集，d为第二轮文库扩增下游引物库，用于特异目标序列富集，e为index primer，用于添加index序列。

1、取300ng实施例1制备的MC文库，分为两份，配置表9的反应体系(一份加入GSP1A mix，另一份加入GSP1B mix)，按照表11的反应程序进行第一轮PCR扩增，得到第一轮扩增产物(共得到两份第一轮扩增产物，一份为GSP1A mix的扩增产物，一份为GSP1B mix的扩增产物)。

表9.反应体系

成分	体积
Hifi(KAPA KK8505)	15μl
上游引物1355	3μl
GSP1A mix/GSP1B mix	2μl
MC文库	10μl
总体积	30μl

表9中，引物信息如下：

上游引物1355(序列27)：5’-TCTTTCCCTACACGACGCTCTTCCGAT-3’。

GSP1A mix：将表10中属于引物池GSP1A中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP1A中的引物用于扩增模板的正链。

GSP1B mix：将表10中属于引物池GSP1B中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP1B中的引物用于扩增模板的负链。

引物池GSP1A和引物池GSP1B中，相同编号的引物(即引物编号的后四位相同)从正负两个方向检测同一突变位点，同时使用可最大限度的富集原始分子信息。

表10.引物信息

表11.反应程序

2、分别将步骤1得到的两份第一轮扩增产物用30-60μl(即1-2倍体积)的AMPure XP磁珠进行纯化，然后用25μlDNase/RNase-Free Water洗脱，得到第一轮纯化产物。

3、分别以步骤2得到的第一轮纯化产物为模板，配置表12的反应体系(采用GSP1A mix扩增产物作为模板时，采用GSP2A mix扩增；采用GSP1Bmix扩增产物作为模板时，采用GSP2B mix扩增)，按照表14的反应程序进行第二轮PCR扩增，得到第二轮扩增产物(4℃保存)。

表12.反应体系

成分	体积
KapaHifi	15μl
上游引物3355	2μl
GSP2Amix/GSP2Bmix	1μl
Index引物(10μM)	2μl
模板(GSP1A mix/GSP1Bmix)	10μl

总体积

30μl

表12中，引物信息如下：

上游引物3355(序列217)：

5’-AATGATACGGCGACCACCGAGATCTACAC TCTTTCCCTACACGACGCTCT-3’；下划线部分为第一轮的上游引物1355相同的部分，3355及1355均为Illumina测序平台测序的固定序列(也可更换为可在其他测序平台测序的序列)。

GSP2A mix：将表13中属于引物池GSP2A中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP2A中的引物用于扩增模板的正链。

GSP2B mix：将表13中属于引物池GSP2B中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP2B中的引物用于扩增模板的负链。

表13中，自5’端第1至15位为与Index引物结合的部分。

GSP2A mix与GSP1A mix中引物编号相同的引物(即引物编号的后四位相同)为针对同一突变位点设计，两条引物形成巢式关系。

GSP2B mix与GSP2A mix中引物编号相同的引物(即引物编号的后四位相同)为针对同一突变位点设计，两条引物形成巢式关系。

Index引物：5’-CAAGCAGAAGACGGCATACGAGAT(序列218)********GTGACTGGAGTTC CTTGGCACCCGAGAA-3’(序列219)；下划线部分为与GSP2mix结合的部分。********为index序列位置，index的长度为6-8bp，作用是区分样本间的序列，方便多个样本混合测序。除index序列外，其余都是来自Illumina的small RNA测序试剂盒的固定序列。

表13.引物信息

注：NA表示无引物。

表14.反应程序

4、步骤3得到的采用GSP2A mix进行第二轮扩增的产物和采用GSP1B mix进行第二轮扩增的产物等体积混合，利用AMPure XP磁珠按1：(1-2)的比例进行纯化，然后用50μl DNase/RNase-Free Water洗脱，得到第二轮纯化产物，即为可以在Illumina Hiseq X平台测序的测序文库。

MC文库上的DNA随机标签与cfDNA序列一起被添加到测序文库的Read1序列下游。在测序中，依次获得DNA随机标签序列、锚定序列、cfDNA序列(图1中的c、d、e序列)。

肝细胞癌特异基因变异的分析方法为：将测序数据满足标准甲的DNA分子回溯到一个分子簇；将满足标准乙的分子簇标记为一对duplex分子簇；对某一突变来说，如果满足下述(a1)或(a2)，则该突变为来自原始DNA样本的真实突变：(a1)至少有一对duplex分子簇支持；(a2)至少有4个分子簇支持；标准甲即同时满足①、②和③；①DNA插入片段长度相同且除突变位点外序列一致；②随机标签序列相同；③锚定序列相同；标准乙即同时满足④和⑤；④DNA插入片段长度相同且除突变位点外序列一致；⑤分子簇两端的锚定序列相同但位置相反。

肝细胞癌特异甲基化修饰程度的分析方法为：将测序数据满足标准丙的DNA分子标记为一个簇，分别计算片段末端为关注酶切位点的簇的数量，记录为未甲基化的片段；计算扩增片段达到或超过第一个酶切位点的全部簇的数量，记录为片段总数；根据两种片段数量计算对应区域的平均甲基化水平；区域的甲基化水平＝(1-未甲基化片段数/片段总数)×100％；标准丙即同时满足⑥、⑦和⑧；⑥随机标签序列相同；⑦锚定序列相同；⑧DNA插入片段长度相同且除突变位点外序列一致。

实施例3、MC文库的捕获及测序

如图3所示，靶区域富集可基于现有商业化的靶向捕获试剂盒进行优化设计而捕获。例如：基于甲基化区域的捕获可参考Roche SeqCap Epi CpGiant Enrichment Kit(Roche 07138881001)或Illumina Infinium Methylation EPIC BeadChipWG-317-1001)，甲基化区域靶向捕获的设计需要根据酶切位点覆盖程度进行筛选，并调整探针中基于重亚硫酸盐处理所转换的碱基。基于基因变异区域的捕获可参考Agilent sureselect XT靶向捕获试剂盒(Agilent5190-8646)，仅将最后一步PCR扩增的引物更换为如下引物：

上游引物为：5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCT ACACGACGCTCTTCCGATCT-3’(序列403)(图3中的“a”)，下划线部分与引物MC_F部分相同)，作用为扩增文库，其余部分为illumina测序平台测序所需的固定序列。

下游引物为：5’-CAAGCAGAAGACGGCATACGAGAT(序列404)********GTCTC GTGGGCTCGGAGATGTGTATAA-3’(序列405)(图3中的“b”)，下划线部分为与引物MC_R相同，作用为扩增文库。********为index序列位置，index长度为6-8bp，作用是区分样本间的序列，方便多个样本混合测序。其余部分为illumina测序平台测序所需的固定序列。

捕获后的文库与MC文库具有相同的DNA随机标签序列、锚定序列和cfDNA序列，依次位于Read1下游。

将测序数据满足标准甲的DNA分子回溯到一个分子簇；标准甲即同时满足①、②和③；①DNA插入片段长度相同且除突变位点外序列一致；②随机标签序列相同；③锚定序列相同。将满足标准乙的分子簇标记为一对duplex分子簇；标准乙即同时满足④和⑤；④DNA插入片段长度相同且除突变位点外序列一致；⑤分子簇两端的锚定序列相同但位置相反。对某一突变来说，如果满足下述(a1)或(a2)，则该突变为来自原始DNA样本的真实突变：(a1)至少有一对duplex分子簇支持；(a2)至少有4个分子簇支持。在一对duplex分子簇共同支持的突变可靠性更高，可减少90％的假阳性突变。

将测序数据满足标准丙的DNA分子标记为一个簇，分别计算片段末端为关注酶切位点的簇的数量，记录为未甲基化的片段；计算扩增片段达到或超过第一个酶切位点的全部簇的数量，记录为片段总数；根据两种片段数量计算对应区域的平均甲基化水平；区域的甲基化水平＝(1-未甲基化片段数/片段总数)×100％；标准丙即同时满足⑥、⑦和⑧；⑥随机标签序列相同；⑦锚定序列相同；⑧DNA插入片段长度相同且除突变位点外序列一致。

实施例4、检测方法的对比

一、检测方法的对比一

1、收集21例肝细胞癌患者的cfDNA标本。

2、完成步骤1后，取各个cfDNA标本，按照实施例1中的方法构建MC文库，然后按照实施例2中的方法进行RaceSeq靶区富集，测序，得到AK055957基因的甲基化水平。

3、完成步骤1后，取各个cfDNA标本，采用Padlock方法(Xu R H,Wei W,Krawczyk M,et al.Circulating tumour DNA methylation markers for diagnosis and prognosis of hepatocellular carcinoma[J].Nature Materials,2017,16(11):1155.)检测AK055957基因的甲基化水平。Padlock是一种甲基化靶向测序技术，Padlock探针构象与挂锁类似，可应用于高通量甲基化靶向测序，属于高效的亚硫酸氢盐转化后建库方法，被称为“BSPP”。cfDNA经亚硫酸氢盐转化后，与亚硫酸盐锁式探针(BSPP)的捕获臂互补配对时可以扩增并连接成环形，用核酸外切酶可以筛选出连接成环状的锁式探针，对扩增产物进行测序得到相应的DNA甲基化信息。

检测结果见图4。结果表明，Padlock方法和突变/甲基化共检法(即本发明提供的方法)对AK055957基因(属于肝细胞癌特异基因)的甲基化水平检测结果基本一致。

二、检测方法的对比二

1、采用突变/甲基化共检法检测突变和突变频率

(1)收集某肝细胞癌患者的cfDNA。

(2)完成步骤(1)后，取5-40ngcfDNA，按照表1所示配置反应体系，然后在PCR仪进行酶切处理，得到酶切产物(4℃保存)。其中酶切处理的时间为0h、0.2h、0.4h、0.6h、0.8h或1h。

(3)完成步骤(2)后，取所述酶切产物，按照实施例1中二至六的方法构建MC文库，然后按照实施例2中的方法进行RaceSeq靶区富集，测序。在数据分析时，将随机标签序列相同、DNA插入片段长度相同且除突变位点外序列一致的DNA分子测序数据回溯到一个分子簇，如果簇内分子数>5个并且簇内分子突变一致率>80％并且簇个数≥5，则该突变为来自原始DNA样本的真实突变。含该分子突变的簇的比例即为突变频率。

2、采用单独检测突变法检测突变和突变频率

(1)收集某肝细胞癌患者的cfDNA。

(2)完成步骤(1)后，取5-40ng cfDNA，按照表3所示配置反应体系，然后按照表4的反应程序在PCR仪进行末端修复及3’末端加A处理，得到反应产物(4℃保存)。

(3)完成步骤(2)后，取所述反应产物，按照实施例1中四至六的方法构建MC文库，然后按照实施例2中的方法进行RaceSeq靶区富集，测序。在数据分析时，将随机标签序列相同、DNA插入片段长度相同且除突变位点外序列一致的DNA分子测序数据回溯到一个分子簇，如果簇内分子数>5个并且簇内分子突变一致率>80％并且簇个数≥5，则该突变为来自原始DNA样本的真实突变。含该分子突变的簇的比例即为突变频率。

3、将各突变位点根据突变/甲基化共检法得到的突变频率作为横坐标，单独检测突变法得到的突变频率作为纵坐标，绘制散点图，添加线性拟合曲线及相关系数R ²。

结果见图5。结果表明，突变/甲基化共检法和单独检测突变法对于突变和突变频率的检测结果基本一致，即甲基化检测并未影响对突变的检出。

实施例5、准确性实验

突变标准品为Horizon Discovery公司的产品，产品目录号为HD701。

一、准确性实验一

1、取突变标准品，按照实施例1中一至六的方法构建MC文库，然后按照实施例2中的方法(仅将步骤3中的GSP2A mix替换为GSP2A mix-1，GSP2B mix替换为GSP2B mix-1)进行RaceSeq靶区富集，测序。

GSP2A mix-1：将表15中属于引物池GSP2A中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP2A中的引物用于扩增模板的正链。

GSP2B mix-1：将表15中属于引物池GSP2B中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP2B中的引物用于扩增模板的负链。

表15.引物序列

基因名称	染色体	突变位点	引物池	引物编号	引物序列(5’-3’)
PIK3CA	3	178916875	GSP2A	HA2094	cagaaagggaagaattttttgatgaaaca
PIK3CA	3	178921551	GSP2A	HA2095	ctcagaataaaaattctttgtgcaacctac
PIK3CA	3	178936082	GSP2A	HA2096	gctcaaagcaatttctacacgagatc
PIK3CA	3	178952072	GSP2A	HA2097	gcaagaggctttggagtatttcatg
KRAS	12	25398285	GSP2A	HA2115	tgactgaatataaacttgtggtagttgg
KRAS	12	25380277	GSP2A	HA2116	cctgtctcttggatattctcgacac
KRAS	12	25378562	GSP2A	HA2117	gcaagaagttatggaattccttttattgaa
EGFR	7	55241707	GSP2A	HA2121	ttgaggatcttgaaggaaactgaatt
EGFR	7	55242463	GSP2A	HA2122	tgagaaagttaaaattcccgtcgcta

EGFR	7	55249004	GSP2A	HA2123	ctccaggaagcctacgtgatg
EGFR	7	55249071	GSP2A	HA2124	acctccaccgtgcagctc
EGFR	7	55259514	GSP2A	HA2125	ccgcagcatgtcaagatcacag
PIK3CA	3	178916875	GSP2B	HB2094	ggttgaaaaagccgaaggtcac
PIK3CA	3	178921551	GSP2B	HB2095	catttgactttaccttatcaatgtctcgaa
PIK3CA	3	178936082	GSP2B	HB2096	acttacctgtgactccatagaaaatctt
PIK3CA	3	178952072	GSP2B	HB2097	caatccatttttgttgtccagcc
KRAS	12	25398285	GSP2B	HB2115	tagctgtatcgtcaaggcactc
KRAS	12	25380277	GSP2B	HB2116	ggtccctcattgcactgtact
KRAS	12	25378562	GSP2B	HB2117	tgtatttatttcagtgttacttacctgtcttg
EGFR	7	55241707	GSP2B	HB2121	accttatacaccgtgccgaa
EGFR	7	55242463	GSP2B	HB2122	actcacatcgaggatttccttgtt
EGFR	7	55249004	GSP2B	HB2123	cggtggaggtgaggcagat
EGFR	7	55249071	GSP2B	HB2124	gtccaggaggcagccgaa
EGFR	7	55259514	GSP2B	HB2125	gtattctttctcttccgcaccca

2、根据测序结果，得到突变位点的突变频率。

检测结果见表16。结果表明，采用突变/甲基化共检法检测突变标准品，得到的突变位点的突变频率与理论值基本接近。由此可见，突变/甲基化共检法对肝细胞癌特异基因(如CTNNB1基因、TP53基因、AXIN1基因)的变异检测具有较高的准确性。

表16.准确性实验

注：geneID代表基因在Ensemble数据库中编号，Ref为正常类型，Alt为基因变异后类型，INS代表插入，DEL代表缺失，SNP代表单碱基突变。

二、准确性实验二

人甲基化和非甲基化标准品为Zymo Research公司的产品，产品目录号为D5014。

1、将人甲基化和非甲基化标准品中的甲基化标准品和非甲基化标准品按照不同比例进行混合，得到待测样本。待测样本中，甲基化标准品的比例为0％、 20％或100％，即肿瘤特异基因(BDH1基因、EMX1基因、LRRC4基因、CLEC11A基因、HOXA1基因、AK055957基因、COTL1基因、ACP1基因或DAB2IP基因)甲基化的比例为0％、20％或100％。

2、取待测样本，按照实施例1中的方法构建MC文库，然后按照实施例2中的方法进行RaceSeq靶区富集，测序，得到甲基化位点的检测值。

检测结果见表17和表18(样本类型的后四位为肿瘤特异基因的名称)。采用突变/甲基化共检法检测甲基化标准品，检测值与理论值基本接近。由此可见，突变/甲基化共检法对肿瘤特异基因(如BDH1基因、EMX1基因、LRRC4基因、CLEC11A基因、HOXA1基因、AK055957基因、COTL1基因、ACP1基因、DAB2IP基因)的甲基化水平检测具有较高的准确性。

表17.甲基化标准品准确度检测结果(正链)

样本类型	0％甲基化标准品	20％甲基化标准品	100％甲基化标准品
CA2001_BDH1	2％	18％	97％
CA2002_EMX1	3％	19％	96％
CA2003_LRRC4	2％	9％	100％
CA2004_LRRC4	3％	32％	97％
CA2006_CLEC11A	2％	20％	97％
CA2007_CLEC11A	2％	25％	99％
CA2008_HOXA1	3％	20％	99％
CA2009_HOXA1	3％	23％	99％
CA2010_EMX1	3％	32％	99％
CA2011_AK055957	3％	23％	99％
CA2012_COTL1	3％	18％	98％
CA2013_ACP1	4％	27％	98％
CA2014_DAB2IP	2％	21％	98％

表18.甲基化标准品准确度检测结果(负链)

样本类型	0％甲基化标准品	20％甲基化标准品	100％甲基化标准品
CB2001_BDH1	3％	21％	96％
CB2002_LRRC4	3％	17％	98％
CB2004_LRRC4	2％	9％	96％
CB2005_DAB2IP	2％	3％	99％
CB2007_CLEC11A	4％	50％	94％
CB2008_CLEC11A	3％	18％	97％
CB2009_HOXA1	2％	20％	98％
CB2011_EMX1	3％	23％	99％
CB2012_AK055957	4％	19％	100％
CB2013_RASSF2	7％	60％	94％
CB2015_DAB2IP	3％	23％	99％

实施例6、突变/甲基化共检法在肝细胞癌患者cfDNA中的应用

1、收集1例正常人、1例肝硬化患者和3例肝细胞癌患者的血液样本，提取cfDNA。

2、取5-40ng cfDNA，按照实施例1进行MC文库构建，按照实施例2中的方法进行RaceSeq靶区富集，测序。

3、甲基化检测结果见表19和表20。

结果显示肝细胞癌特异高甲基化的基因，在所检测的肝细胞癌样本中的甲基化水平高于非肝细胞癌样本中的甲基化水平。突变/甲基化共检法可以应用于肝细胞癌cfDNA样本的检测。

表19.cfDNA样本靶标区域甲基化水平检测结果(正链)

样本类型	正常	肝硬化	肝细胞癌1	肝细胞癌2	肝细胞癌3
CA2001_BDH1	3％	3％	28％	25％	47％
CA2002_EMX1	4％	6％	11％	26％	4％
CA2003_LRRC4	3％	5％	16％	28％	28％
CA2004_LRRC4	3％	6％	29％	46％	48％
CA2006_CLEC11A	3％	4％	11％	20％	2％
CA2007_CLEC11A	3％	5％	22％	25％	10％
CA2008_HOXA1	4％	4％	24％	33％	5％
CA2009_HOXA1	8％	7％	10％	11％	11％
CA2010_EMX1	7％	9％	21％	47％	8％
CA2011_AK055957	5％	9％	40％	43％	45％
CA2012_COTL1	5％	9％	17％	19％	5％
CA2013_ACP1	1％	3％	5％	5％	14％
CA2014_DAB2IP	5％	7％	19％	27％	50％

表20.cfDNA样本靶标区域甲基化水平检测结果(负链)

样本类型	正常	肝硬化	肝细胞癌1	肝细胞癌2	肝细胞癌3
CB2001_BDH1	5％	5％	24％	23％	56％
CB2002_LRRC4	4％	13％	40％	47％	50％
CB2004_LRRC4	1％	4％	11％	17％	28％
CB2005_DAB2IP	4％	5％	10％	16％	27％
CB2007_CLEC11A	11％	8％	17％	38％	6％
CB2008_CLEC11A	2％	5％	22％	23％	7％
CB2009_HOXA1	4％	2％	10％	21％	3％
CB2011_EMX1	12％	11％	20％	39％	7％
CB2012_AK055957	3％	9％	39％	38％	43％
CB2013_RASSF2	5％	1％	4％	18％	4％
CB2015_DAB2IP	9％	6％	18％	31％	57％

工业应用

本发明公开了一种可以在一份样本中同时检测ctDNA中的肿瘤特异基因的变异(包括点突变、插入缺失突变、HBV整合等多种突变形式)和/或甲基化的方法，不仅样本量需求低，而且该方法制备的MC文库可以支持10-20次的后续检测，每次检测的结果都可以代表全部原始ctDNA标本的突变状况及酶切位点覆盖区域的甲基化修饰情况，且不会造成灵敏度和特异性的降低。同时，文库的构建方法不仅适用于cfDNA样本，也适用于基因组DNA或cDNA样本。本发明对肿瘤早期筛查、病情追踪、疗效评估、预后预测等具有重要的临床意义，有重大的应用价值。

Claims

一种测序文库构建方法，依次包括如下步骤：

(1)取DNA样本，用甲基化敏感限制性内切酶酶切；

(2)将步骤(1)酶切后的DNA样本依次进行末端修复和3’端加A处理；

(3)将步骤(2)处理后的DNA样本与接头混合物中的接头连接，经过PCR扩增后得到文库；

所述接头混合物由n个接头组成；

每个接头均由一条上游引物甲和一条下游引物甲形成部分双链结构得到；上游引物甲中具有测序接头甲、随机标签、锚定序列甲和位于末端的碱基T；下游引物甲中具有锚定序列乙和测序接头乙；所述部分双链结构由锚定序列甲和锚定序列乙反向互补形成；

所述测序接头甲和测序接头乙为根据不同测序平台选择对应的测序接头；

所述随机标签为8-14bp的随机碱基；

所述锚定序列甲长度为12-20bp，连续重复碱基≤3个；

n个接头采用n个不同的锚定序列甲，且每个锚定序列甲中四种碱基平衡，错配碱基数≥3；

n为≥8的任意自然数。
如权利要求1所述的构建方法，其特征在于：

所述上游引物甲自5’端依次包括所述测序接头甲、所述随机标签、所述锚定序列甲和所述碱基T；

所述下游引物甲自5’端依次包括所述锚定序列乙和所述测序接头乙。
如权利要求1所述的构建方法，其特征在于：所述错配碱基数≥3为所述接头混合物包含n个锚定序列甲，各个锚定序列甲之间的碱基至少有3个不同；所述不同为位置不同或顺序不同。
如权利要求1所述的构建方法，其特征在于：所述DNA样本为基因组DNA、cDNA、ct DNA或cf DNA样本。
权利要求1至4任一所述方法构建得到的DNA文库。
一种用于构建测序文库的试剂盒，包括权利要求1至4中所述的接头混合物和甲基化敏感限制性内切酶。
一种用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒，包括权利要求1至4中所述接头混合物和引物组合；所述引物组合包括引物组Ⅰ、引物组Ⅱ、引物组Ⅲ、引物组Ⅳ、引物组Ⅴ、引物组Ⅵ、引物组Ⅶ和引物组Ⅷ；

所述引物组Ⅰ和所述引物组Ⅱ中的各个引物是根据与肿瘤突变相关的区域设计的特异性引物，作用是定位于基因组特定位置，实现目标区域的PCR富集；所述引物组Ⅰ和所述引物组Ⅱ分别用于检测DNA正链和负链的突变位点；

所述引物组Ⅲ和所述引物组Ⅳ中的各个引物是根据肿瘤特异高甲基化区域设计的特异性引物，作用是定位于基因组特定位置，实现目标区域的PCR富集；所述引物组Ⅲ和所述引物组Ⅳ分别用于检测DNA正链和负链的甲基化位点；

所述引物组Ⅴ、所述引物组Ⅵ、所述引物组Ⅶ和所述引物组Ⅷ中的各个引物均包括接头序列和特异序列，特异序列用于目标区域进行进一步富集；

所述引物组Ⅴ和所述引物组Ⅰ中，针对同一突变位点设计的两个引物为“巢式”关系；

所述引物组Ⅵ和所述引物组Ⅱ中，针对同一突变位点设计的两个引物为“巢式”关系；

所述引物组Ⅶ和所述引物组Ⅲ中，针对同一甲基化位点设计的两个引物为“巢式”关系；

所述引物组Ⅷ和所述引物组Ⅳ中，针对同一甲基化位点设计的两个引物为“巢式”关系。
如权利要求7所述的试剂盒，其特征在于：所述肿瘤为肝脏恶性肿瘤。
如权利要求8所述的试剂盒，其特征在于：

所述引物组Ⅰ包括78个单链DNA分子，78个单链DNA分子的核苷酸序列依次如序列表的序列28至序列105所示；

所述引物组Ⅱ包括82个单链DNA分子，82个单链DNA分子的核苷酸序列依次如序列表的序列106至序列187所示；

所述引物组Ⅲ包括14个单链DNA分子，14个单链DNA分子的核苷酸序列依次如序列表的序列188至序列201所示；

所述引物组Ⅳ包括15个单链DNA分子，15个单链DNA分子的核苷酸序列依次如序列表的序列202至序列216所示；

所述引物组Ⅴ包括75个单链DNA分子，75个单链DNA分子依次包括如序列表的序列220至序列294自5’末端起第16位至3’末端所示的核苷酸序列；

所述引物组Ⅵ包括79个单链DNA分子，79个单链DNA分子依次包括如序列表的序列295至序列373自5’末端起第16位至3’末端所示的核苷酸序列；

所述引物组Ⅶ包括14个单链DNA分子，14个单链DNA分子依次包括如序列表的序列374至序列387自5’末端起第16位至3’末端所示的核苷酸序列；

所述引物组Ⅷ包括15个单链DNA分子，15个单链DNA分子依次包括如序列表的序列388至序列402自5’末端起第16位至3’末端所示的核苷酸序列。
权利要求7至9中任一所述的引物组合。
S1)或S2)或S3)：

S1)权利要求7至9中任一所述的引物组合在制备用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒中的应用；

S2)权利要求7至9中任一所述的引物组合在区分肿瘤患者血液样本和非肿瘤患者血液样本中的应用；

S3)权利要求7至9任一所述试剂盒在区分肿瘤患者血液样本和非肿瘤患者血液样本中的应用。
一种检测DNA样本中目标突变和/或甲基化的方法，包括如下步骤：

(1)按照权利要求1至4任一所述的方法构建文库；

(2)对步骤(1)得到的文库进行两轮巢式PCR扩增，对产物进行测序，根据测序结果分析DNA样本中目标突变和/或甲基化发生情况；

所述步骤(2)中，采用引物组合甲进行第一轮PCR扩增；

引物组合甲由上游引物甲和下游引物组合甲组成；

所述上游引物甲为文库扩增引物，用于步骤(1)的文库扩增；

所述下游引物组合甲为根据X个目标靶点设计的Y条引物的组合；X和Y均为1以上的自然数，且X≤Y；

以第一轮PCR的产物为模板，采用引物组合乙进行第二轮PCR扩增；

引物组合乙由上游引物乙、下游引物组合乙和index引物组成；

所述上游引物乙为文库扩增引物且3’末端与所述上游引物甲部分相同，用于第一轮PCR的产物的扩增；

所述index引物自5’端包括用于测序的区段A、用于区分样本的index序列和用于测序的区段B；

所述下游引物组合乙中的引物具有所述区段B且与下游引物组合甲中检测相同目标靶点的引物形成巢式关系。
如权利要求12所述的方法，其特征在于：

所述DNA样本中目标突变的分析方法为：将测序数据满足标准甲的DNA分子回溯到一个分子簇；将满足标准乙的分子簇标记为一对duplex分子簇；对某一突变来说，如果满足下述(a1)或(a2)，则该突变为来自原始DNA样本的真实突变：(a1)至少有一对duplex分子簇支持；(a2)至少有4个分子簇支持；标准甲即同时满足①、②和③；①DNA插入片段长度相同且除突变位点外序列一致；②随机标签序列相同；③锚定序列相同；标准乙即同时满足④和⑤；④DNA插入片段长度相同且除突变位点外序列一致；⑤分子簇两端的锚定序列相同但位置相反；

所述DNA样本中甲基化的分析方法为：将测序数据满足标准丙的DNA分子标记为一个簇，分别计算片段末端为关注酶切位点的簇的数量，记录为未甲基化的片段；计算扩增片段达到或超过第一个酶切位点的全部簇的数量，记录为片段总数；根据两种片段数量计算对应区域的平均甲基化水平；区域的甲基化水平＝(1-未甲基化片段数/片段总数)×100％；标准丙即同时满足⑥、⑦和⑧；⑦随机标签序列相同；⑧锚定序列相同；⑨DNA插入片段长度相同且除突变位点外序列一致。
一种检测DNA样本中多种目标突变和/或甲基化的方法，包括如下步骤：

(1)按照权利要求1至4任一所述的方法构建文库；

(2)对步骤(1)的文库进行靶区域富集并进行测序，根据测序结果分析DNA样本中目标突变和/或甲基化的发生情况。
如权利要求14所述的方法，其特征在于：

所述DNA样本中目标突变的分析方法为：将测序数据满足标准甲的DNA分子回溯到一个分子簇；将满足标准乙的分子簇标记为一对duplex分子簇；对某一突变来说，如果满足下述(a1)或(a2)，则该突变为来自原始DNA样本的真实突变：(a1)至少有一对duplex分子簇支持；(a2)至少有4个分子簇支持；标准甲即同时满足①、②和③；①DNA插入片段长度相同且除突变位点外序列一致；②随机标签序列相同；③锚定序列相同；标准乙即同时满足④和⑤；④DNA插入片段长度相同且除突变位点外序列一致；⑤分子簇两端的锚定序列相同但位置相反；所述DNA样本中甲基化的分析方法为：将测序数据满足标准丙的DNA分子标记为一个簇，分别计算片段末端为关注酶切位点的簇的数量，记录为未甲基化的片段；计算扩增片段达到或超过第一个酶切位点的全部簇的数量，记录为片段总数；根据两种片段数量计算对应区域的平均甲基化水平；区域的甲基化水平＝(1-未甲基化片段数/片段总数)×100％；标准丙即同时满足⑥、⑦和⑧；⑥随机标签序列相同；⑦锚定序列相同；⑧DNA插入片段长度相同且除突变位点外序列一致。