CN110747274A

CN110747274A - 用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒

Info

Publication number: CN110747274A
Application number: CN201911127606.0A
Authority: CN
Inventors: 徐瑞华; 骆卉妍; 赵齐; 韦玮
Original assignee: TUMOR PREVENTION AND THERAPY CENTER ZHONGSHAN UNIV
Current assignee: TUMOR PREVENTION AND THERAPY CENTER ZHONGSHAN UNIV
Priority date: 2019-11-18
Filing date: 2019-11-18
Publication date: 2020-02-04
Anticipated expiration: 2039-11-18
Also published as: CN110747274B

Abstract

本发明公开了一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒。该基因甲基化面板包括第一组甲基化基因和/或第二组甲基化基因，所述第一组甲基化基因选自MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20中的一种或几种，所述第二组甲基化基因选自MYO1G、GCET2、CALML4、KLF3、ATXN1中的一种或几种。该基因甲基化面板及含有该基因甲基化面板的试剂盒，可用于快速、低成本的进行结直肠癌早期诊断、早期评估和早期预防。

Description

用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒

技术领域

本发明涉及基因表观遗传学技术领域，尤其涉及一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒，以及利用该基因甲基化面板诊断肠癌、预测疗效和复发情况，以及预测肠癌预后和死亡风险的方法。

背景技术

作为一种常见的恶性肿瘤，结直肠癌在我国所有恶性肿瘤中，发病率居第三位。结直肠癌在发病初期症状并不显著，难以及时发现、及时治疗，故通过技术革新在结直肠癌初期阶段即发现病症、对症治疗，将对结直肠癌的有效治疗具有重要意义。

目前对结直肠癌的检测方法主要有结直肠镜镜检、粪便隐血试验、计算机扫描断层成像(CT)、粪便DNA检测等。其中，结直肠镜镜检是检出高危人群和早期患者的有效手段，但由于其需要专业操作、价格昂贵，且为侵入性检查，人群顺应性差，导致我国结直肠癌早诊率极低(不足10％)。粪便隐血试验虽然快速，但检测结果假阳性多，且检测结果易受饮食和药物干扰。计算机扫描断层成像方法只能检测到中晚期的癌症，因此无法在早期筛查中应用。目前，美国FDA批准的FIT+粪便DNA多靶标DNA检测，可以检出92％的结直肠癌和43％进展期腺瘤，但是该方法价格高达600多美金，而且在检测过程中需要同时进行多个反应检测，因此操作也十分复杂，并不适合像中国这样的发展中国家应用。由此可见，上述结直肠癌的检测方法均存在一定弊端，难以帮助我国结直肠癌的普及性筛查。然而，早期诊断、早期发现、早期治疗对于提高结直肠癌生存率具有重要意义，因此目前亟需挖掘结直肠癌诊断相关的分子标记物，研发用于早期诊断的、基于外周血的液体活检技术(ctDNA甲基化等)，形成产业化试剂盒并推广应用，并建立适合中国国情、符合卫生经济学的筛查方案。此外，除了早期诊断，开发新的技术对结直肠癌的早期评估、早期预防和早期治疗也十分必要。

发明内容

本发明要解决的技术问题是提供一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒，以解决现有结直肠癌检测方法在操作方便性、结果准确性、检测成本等方面难以兼顾的问题。

第一个方面，本发明提供一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板，所述基因甲基化面板包括第一组甲基化基因和/或第二组甲基化基因，所述第一组甲基化基因选自MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20中的一种或几种，所述第二组甲基化基因选自MYO1G、GCET2、CALML4、KLF3、ATXN1中的一种或几种。

进一步地，所述基因甲基化面板包括所述第一组甲基化基因和所述第二组甲基化基因，所述第一组甲基化基因包括MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20，所述第二组甲基化基因包括MYO1G、GCET2、CALML4、KLF3、ATXN1。

更进一步地，所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变，以预测结直肠癌的治疗疗效；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、GCET2、CALML4、KLF3、ATXN1的基因甲基化水平的改变，以预测肠癌患者的预后和死亡风险。

进一步地，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

进一步地，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A、CD6、Chr13:10、LGAP5、ATXN1和Chr 8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

进一步地，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

进一步地，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A、CD6、ATXN1和Chr 8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

进一步地，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A、CD6和Chr8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

进一步地，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A和Chr 8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

进一步地，所述基因甲基化面板包括以下甲基化基因：MYO1G和ATXN1；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G和ATXN1的基因甲基化水平的改变，以判断结直肠癌的发生。

进一步地，所述基因甲基化面板包括以下甲基化基因：MYO1G；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G的基因甲基化水平的改变，以判断结直肠癌的发生。

第二个方面，本发明提供一种用于诊断、预测结直肠癌疗效和预后的试剂盒，所述试剂盒包括上述基因甲基化面板。

第三个方面，本发明提供一种上述用于诊断、预测结直肠癌疗效和预后的基因甲基化面板的检测方法，包括以下步骤：

第一步，在血浆中提取ctDNA；

第二步，将提取的所述ctDNA进行亚硫酸盐转化，使所述ctDNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶，而甲基化的胞嘧啶保持不变，得到亚硫酸盐转化ctDNA；

第三步，用深度测序的方法测定所述亚硫酸盐转化ctDNA的甲基化水平的改变；

第四步，探针的设计和合成；

第五步，通过所述探针对所述亚硫酸盐转化ctDNA进行捕获扩增并进行测序；

第六步，数据的分析和模型的建立。

在本发明的检测方法的第一步中，血浆可以是正常人的血浆或者结直肠癌患者的血浆。ctDNA(circulating tumor DNA)是指循环肿瘤DNA。在本发明中，深度测序也称高通量测序技术，为本领域技术人员所知晓的一种测序技术。

在上述检测方法中，第四步所述探针的设计和合成具体包括以下步骤：

首先，对TCGA和GSE数据库里的肠癌组织样本和正常人血浆样本的450K基因甲基化芯片数据进行分析，找出甲基化水平明显差异的基因；

针对筛选出来的基因设计探针并合成。

在本发明中，采用常规探针设计软件设计探针，如采用ppDesigner软件设计上述方法筛选出来的甲基化水平差异明显的基因探针。探针的合成方法则采用现有成熟技术，如采用核酸杂交技术，用单独的寡核苷酸进行探针合成。

在本发明中，可以通过本领域常用方法使用探针捕获亚硫酸盐转化ctDNA，经扩增后进行相应测序。或者，优选地，采用以下步骤进行捕获扩增后并测序：

首先，将所述亚硫酸盐转化ctDNA与第四步中合成的所述探针混合于反应缓冲液，在所述反应液中加矿物油；

然后，对所述反应液进行退火、变性、扩增并给每个血浆样本附上条码，PCR反应建立文库，并保留有效的捕获，去除空白的捕获；

最后，根据Illumina公司所提供的PCR方法纯化所建文库，采用Illumina公司的Miseq和Hiseq2500系统测序，得到测序结果。

其中，所述反应缓冲液采用本领域常用于DNA捕获的反应缓冲液。

优先地，所述亚硫酸盐转化ctDNA与所述探针按照1：20000的摩尔比混合。所述矿物油是为了防止反应液蒸发。

进一步地，第五步中对所述亚硫酸盐转化ctDNA进行捕获扩增，是因为测序的原始捕获实验结果(即测序结果)在高效率的探针和低效率的探针中读取的结果有显著差异，为了优化，故需要进行捕获，使测序的覆盖更加均匀、测序结果更加合理。

进一步地，第六步中，所述数据的分析和模型的建立采取以下步骤：

首先，通过将结直肠癌血浆样本和正常对照的血浆样本随机按2：1的比例分为训练集和验证集，用LASSO和随机森林的方法进行基因筛选，两种方法重叠的基因有9个，分别为MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20；

然后，通过逻辑回归方法，采用这9个甲基化基因中的一个或多个作为协变量建立诊断预测模型，计算联合诊断指数，并在所述验证集中进行验证；

同样，将肠癌血浆样本分为训练集和验证集，先通过对每一个基因作为协变量建立一个单变量COX比例风险模型，筛选出与患者预后相关的基因进行下一步分析；

接着，采用LASSO-COX多因素回归分析，最终筛选出甲基化基因进行预后的分析，分别为MYO1G、GCET2、CALML4、KLF3、ATXN1；

最后，通过拟合多变量COX比例风险模型，在训练集确定这5个甲基化基因中每一个基因的系数，计算合并后的预后评分指数，并在验证集中进行验证。

在本发明中，联合诊断指数(combined diagnosis score)定义为cd-score。预后评分指数(combined prognostic score)定义为cp-score。

优先地，所述LASSO方法采用二次抽样方法不重复抽样75％的数据集500次，选择出现频率超过450次的甲基化基因共13个；所述随机森林方法采用OOB误差最小化准则，通过设置变量每次重复的分数下降0.3的原则进行随机变量的消除，最后筛选出22个甲基化基因。其中OOB是指out-of-bag，泛指误差估计的方法。

可选地，在所述第六步的步骤中，采用甲基化基因MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20作为协变量建立诊断预测模型，计算联合诊断指数，并在所述验证集中进行验证。

可选地，在所述第六步的步骤中，采用甲基化基因MYO1G、BMPR1A、CD6、RBP5、Chr13:10、LGAP5、ATXN1、Chr 8:20作为协变量建立诊断预测模型，计算联合诊断指数，并在所述验证集中进行验证。

可选地，在所述第六步的步骤中，采用甲基化基因MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1、Chr 8:20作为协变量建立诊断预测模型，计算联合诊断指数，并在所述验证集中进行验证。

可选地，在所述第六步的步骤中，采用甲基化基因MYO1G、BMPR1A、CD6、LGAP5、ATXN1、Chr 8:20作为协变量建立诊断预测模型，计算联合诊断指数，并在所述验证集中进行验证。

可选地，在所述第六步的步骤中，采用甲基化基因MYO1G、BMPR1A、CD6、ATXN1、Chr8:20作为协变量建立诊断预测模型，计算联合诊断指数，并在所述验证集中进行验证。

可选地，在所述第六步的步骤中，采用甲基化基因MYO1G、BMPR1A、CD6和Chr 8:20作为协变量建立诊断预测模型，计算联合诊断指数，并在所述验证集中进行验证。

可选地，在所述第六步的步骤中，采用甲基化基因MYO1G、BMPR1A和Chr 8:20作为协变量建立诊断预测模型，计算联合诊断指数，并在所述验证集中进行验证。

可选地，在所述第六步的步骤中，采用甲基化基因MYO1G和ATXN1作为协变量建立诊断预测模型，计算联合诊断指数，并在所述验证集中进行验证。

可选地，在所述第六步的步骤中，采用甲基化基因MYO1G作为协变量建立诊断预测模型，计算联合诊断指数，并在所述验证集中进行验证。

第四个方面，本发明提供一种用于预测结直肠癌复发的方法，包括以下步骤：

提供如上所述的基因甲基化面板，以所述第一组甲基化基因构建诊断预测模型，所述第一组甲基化基因包括MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20；

提供结直肠癌血浆样本，根据所述诊断预测模型计算出肠癌血浆样本的联合诊断指数，以预测结直肠癌的复发情况。

第五个方面，本发明提供一种用于预测结直肠癌预后的方法，包括以下步骤：

提供如上所述的基因甲基化面板，以所述第二组甲基化基因构建预后风险模型，所述第二组甲基化基因包括MYO1G、GCET2、CALML4、KLF3、ATXN1；

提供结直肠癌血浆样本，根据所述预后风险模型计算出结直肠癌血浆样本的预后评分指数，以预测结直肠癌的预后情况。

与现有技术相比，本发明具有以下有益效果：

本发明提供的是一种可用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒，同时提供了利用该基因甲基化面板诊断、预测结直肠癌复发和预后的方法，可用于快速、低成本的进行结直肠癌早期诊断、早期评估和早期预防。首先，该基因甲基化面板可通过检测患者血浆中MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20中的一个或者多个基因甲基化水平的改变，来进行结直肠癌的诊断，这意味着早期结直肠癌患者可及时确诊并治疗。尤为重要的，本发明通过对上述基因甲基化表达与结直肠癌之间关系的大量研究，经过不断检测与诊断确认，实现了用较少的基因仍能较准确的诊断结直肠癌，进而大幅降低基因甲基化面板及其试剂盒的经济成本，使本发明的基因甲基化面板及试剂盒具有更好的推广应用价值，更适用于结直肠癌早期诊断，适用于结直肠癌的普及性筛查。其次，该基因甲基化面板通过检测患者血浆中MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20共9个基因甲基化水平的改变，可以用于诊断结直肠癌和预测结直肠癌的疗效，这意味着早期结直肠癌患者可及时确诊并治疗。通过检测患者血浆中MYO1G、GCET2、CALML4、KLF3、ATXN1共5个基因甲基化水平的改变，可以用于预测结直肠癌患者的预后和死亡风险，这有利于指导医生对不同患者进行个体化的精准治疗。本发明提供的是一种可用于诊断、预测结直肠癌疗效和预后的基因甲基化面板，提高了通过结直肠癌患者血液诊断和预后预测的准确性。

附图说明

图1是实施例一基因甲基化面板在应用中的数据分析图。

图2是实施例二基因甲基化面板在应用中的数据分析图。

图3是实施例三基因甲基化面板在应用中的数据分析图。

图4是实施例四基因甲基化面板在应用中的数据分析图。

图5是实施例五基因甲基化面板在应用中的数据分析图。

图6是实施例六基因甲基化面板在应用中的数据分析图。

图7是实施例七基因甲基化面板在应用中的数据分析图。

图8是实施例八基因甲基化面板在应用中的数据分析图。

图9至图11是实施例九基因甲基化面板在应用中的数据分析图。

具体实施方式

以下结合说明书附图和具体实施例来进一步说明本发明，但实施例并不对本发明做任何形式的限定。除非特别说明，本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。除非特别说明，以下实施例所用试剂和材料均为市购。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明实施例的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一

本实施例公开了一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板，该基因甲基化面板由第一组甲基化基因组成，这些甲基化基因是MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20。该基因甲基化面板测定结直肠癌患者血浆中MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平改变，用于诊断结直肠癌的发生。

本实施例还公开了上述用于诊断结直肠癌的基因甲基化面板的检测方法，包括以下步骤：

第一步，在血浆中提取ctDNA；

第二步，将提取的ctDNA进行亚硫酸盐转化，使其ctDNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶，而甲基化的胞嘧啶保持不变，得到亚硫酸盐转化ctDNA；

第三步，用深度测序的方法测定所述亚硫硫酸盐转化ctDNA的甲基化水平的改变；

第四步，探针的设计和合成；具体是：首先，对TCGA和GSE数据库里的肠癌组织样本和正常人血浆样本的450K基因甲基化芯片数据进行分析，找到甲基化水平明显差异的基因；然后，用ppDesigner软件设计上述方法筛选出来的甲基化水平差异明显的基因探针，并进行合成，如采用核酸杂交技术，用单独的寡核苷酸进行探针合成。

第五步，通过所述探针对所述亚硫酸盐转化ctDNA进行捕获扩增并进行测序；具体是：将10ng亚硫酸盐转化ctDNA与第四步中合成的所述探针按照1：20000的摩尔比混合于20μl反应缓冲液中形成反应液，并在反应液中加矿物油防止反应液蒸发；对反应液进行退火、变性、扩增并给每个血浆样本附上条码，PCR反应建立文库，并保留有效的捕获，去除空白的捕获；根据Illumina公司所提供的PCR方法纯化所建文库，采用Illumina公司的Miseq和Hiseq2500系统测序，得到测序结果。

由于测序的原始捕获实验结果(即测序结果)在高效率的探针和低效率的探针中读取的结果有显著差异，为了优化，故对原始的测序结果进行相对效率计算，混合探针时根据调节后的摩尔比率进行混合。

第六步，数据的分析和模型的建立。具体是：首先，通过将肠癌血浆样本和正常对照的血浆样本随机按2：1的比例分为训练集和验证集，选用LASSO和随机森林的方法进行基因筛选；

其中，LASSO方法采用二次抽样方法不重复抽样75％的数据集500次，选择出现频率超过450次的甲基化基因共13个。随机森林方法采用OOB误差最小化准则，通过设置变量每次重复的分数下降0.3的原则进行随机变量的消除，最后筛选出22个甲基化基因。

上述两种方法重叠的甲基化基因有8个(如表1所示)，分别是MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20。

然后，通过逻辑回归方法，采用这8个重叠的甲基化基因作为协变量建立诊断预测模型，计算联合诊断指数(cd-score)，并在所述验证集中进行验证。

表1：8个用于诊断结直肠癌的基因

本实施例还提供一种用于结直肠癌诊断的试剂盒，该试剂盒包括上述基因甲基化面板。

本实施例还提供对上述基因甲基化面板的应用。具体是，通过逻辑回归方法，用基因甲基化面板(包括8个甲基化基因：MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌，在训练集中的敏感性86.93％，特异性90.80％，总体正确率89.10％。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC＝0.956)和验证数据集(AUC＝0.957)(如图1、表2所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。

表2：实施例一基因甲基化面板在训练集中的敏感性和特异性结果

实施例二

本实施例与实施例一的区别仅在于，本实施例的基因甲基化面板中甲基化基因是MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1和Chr 8:20。

通过逻辑回归方法，用基因甲基化面板(包括7个甲基化基因：MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1和Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌，在训练集中的敏感性87.69％，特异性89.91％，总体正确率88.94％。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC＝0.956)和验证数据集(AUC＝0.955)(如图2、表3所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。

表3：实施例二基因甲基化面板在训练集中的敏感性和特异性结果

实施例三

本实施例与实施例一的区别仅在于，本实施例的基因甲基化面板中甲基化基因是MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20。

通过逻辑回归方法，用基因甲基化面板(包括6个甲基化基因：MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌，在训练集中的敏感性85.61％，特异性92.14％，总体正确率89.27％。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC＝0.954)和验证数据集(AUC＝0.954)(如图3、表4所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。

表4：实施例三基因甲基化面板在训练集中的敏感性和特异性结果

实施例四

本实施例与实施例一的区别仅在于，本实施例的基因甲基化面板中甲基化基因是MYO1G、BMPR1A、CD6、ATXN1和Chr 8:20。

通过逻辑回归方法，用基因甲基化面板(包括5个甲基化基因：MYO1G、BMPR1A、CD6、ATXN1和Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌，在训练集中的敏感性92.23％，特异性83.68％，总体正确率87.44％。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC＝0.952)和验证数据集(AUC＝0.952)(如图4、表5所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。

表5：实施例四基因甲基化面板在训练集中的敏感性和特异性结果

实施例五

本实施例与实施例一的区别仅在于，本实施例的基因甲基化面板中甲基化基因是MYO1G、BMPR1A、CD6和Chr 8:20。

通过逻辑回归方法，用基因甲基化面板(包括4个甲基化基因：MYO1G、BMPR1A、CD6和Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌，在训练集中的敏感性84.57％，特异性90.65％，总体正确率88.06％。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC＝0.945)和验证数据集(AUC＝0.952)(如图5、表6所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。

表6：实施例五基因甲基化面板在训练集中的敏感性和特异性结果

实施例六

本实施例与实施例一的区别仅在于，本实施例的基因甲基化面板中甲基化基因是MYO1G、BMPR1A和Chr 8:20。

通过逻辑回归方法，用基因甲基化面板(包括3个甲基化基因：MYO1G、BMPR1A和Chr8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌，在训练集中的敏感性82.58％，特异性93.47％，总体正确率88.69％。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC＝0.943)和验证数据集(AUC＝0.947)(如图6、表7所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。

表7：实施例六基因甲基化面板在训练集中的敏感性和特异性结果

实施例七

本实施例与实施例一的区别仅在于，本实施例的基因甲基化面板中甲基化基因是MYO1G和ATXN1。

通过逻辑回归方法，用基因甲基化面板(包括2个甲基化基因：MYO1G和ATXN1)构建了一个诊断预测模型。应用该模型诊断结直肠癌，在训练集中的敏感性80.44％，特异性92.43％，总体正确率87.09％。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC＝0.927)和验证数据集(AUC＝0.919)(如图7、表8所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。

表8：实施例七基因甲基化面板在训练集中的敏感性和特异性结果

实施例八

本实施例与实施例一的区别仅在于，本实施例的基因甲基化面板中甲基化基因是MYO1G。

通过逻辑回归方法，用基因甲基化面板(包括1个甲基化基因：MYO1G)构建了一个诊断预测模型。应用该模型诊断结直肠癌，在训练集中的敏感性82.10％，特异性85.76％，总体正确率84.13％。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC＝0.904)和验证数据集(AUC＝0.91)(如图8、表9所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。

表9：实施例八基因甲基化面板在训练集中的敏感性和特异性结果

为了验证上述基因甲基化面板对结直肠癌的诊断效果，在前瞻性大型筛查队列中，在16890例筛查人群中，通过问卷调查找出1493名结直肠高危分险人群，对这1493名被评估为结直肠癌高危患者分别采用常规的肠镜检查、本实施例的一个MYO1G基因甲基化进行检测，检测的结果如下表2所示。检测结果具体为：检测出26例早期肠癌患者、检测出26例进展期腺瘤；对癌症的检出率敏感性高达89.7％、特异性达86.8％，对进展期腺瘤的检出率敏感性达33.3％。上述敏感性和特异性结果与现有的筛查方法相比有大幅度提高。

本实施例中仅利用1个甲基化基因来实现对早期结直肠癌的快速检测，在检测成本方面也节省很多。

表10：不同结直肠癌检测方法的结果比较

需要说明的是，上述表格中，进展期腺瘤为：绒毛状腺瘤,腺瘤>1.0cm,无柄锯齿状息肉>1.0cm。

实施例九

本实施例公开了一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板，该基因甲基化面板包括第一组甲基化基因和第二组甲基化基因，第一组甲基化基因包括MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20，第二组甲基化基因包括MYO1G、GCET2、CALML4、KLF3、ATXN1。该基因甲基化面板测定结直肠癌患者血浆中MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平改变，用于诊断肠癌和预测结直肠癌的疗效和复发。该基因甲基化面板测定结直肠癌患者血浆中MYO1G、GCET2、CALML4、KLF3、ATXN1的基因甲基化水平改变，用于预测结直肠癌患者的预后和死亡风险。

本实施例还公开了上述用于诊断、预测结直肠癌复发和预后的基因甲基化面板的检测方法，包括以下步骤：

第一步，在血浆中提取ctDNA；

上述两种方法重叠的甲基化基因有9个(如表11所示)，分别是MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20。

然后，通过逻辑回归方法，采用这9个重叠的甲基化基因作为协变量建立诊断预测模型，计算联合诊断指数(cd-score)，并在所述验证集中进行验证；

同样，将结直肠癌血浆样本分为训练集和验证集，先通过对每一个基因作为协变量建立一个单变量COX比例风险模型，筛选出与患者预后相关的基因进行下一步分析；

接着，采用LASSO-COX多因素回归分析，最终筛选出5个甲基化基因进行预后的分析(如表12所示)，分别为MYO1G、GCET2、CALML4、KLF3、ATXN1；

最后，通过拟合多变量COX比例风险模型，在训练集确定这5个甲基化基因中每一个基因的系数，计算合并后的预后评分指数(cp-score)，并在验证集中进行验证(如表13所示)。

表11：9个用于诊断早期结直肠癌的基因

表12：5个用于预测结直肠癌预后的基因

表13：结直肠癌患者多变量生存分析

通过逻辑回归方法，用基因甲基化面板(包括9个甲基化基因：MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌，在训练集中的敏感性87.5％，特异性89.9％，验证集中的敏感性为87.9％，特异性89.6％。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC＝0.9571)和验证数据集(AUC＝0.9569)(如图9所示)。证实这9个基因甲基化面板可以用于区分结直肠癌患者与正常人。

采用上述建立的诊断预测模型，计算出每个样本的联合诊断指数(cd-score)，采用这个联合诊断指数，可以很好地预测结直肠癌患者的治疗疗效和复发(如图10所示)。有肿瘤负荷的患者的cd-scores值明显高于正常对照组(p<0.0001，如图10a所示)。同样，手术后病人的cd-scores值较手术前明显降低，患者术后出现肿瘤复发，cd-scores值则会再度升高(p<0.001，如图10b所示)。此外，cd-scores值与肿瘤分期有关。早期患者(I，II期)的cd-scores值明显低于晚期(III，IV期)患者(p<0.0001，如图10c所示)。说明根据这9个基因甲基化水平建立的模型可用于结直肠癌的早期诊断、治疗疗效的判断、预测肿瘤的复发。

通过拟合多变量COX比例风险模型，用基因甲基化面板(包括5个甲基化基因：MYO1G、GCET2、CALML4、KLF3、ATXN1)构建了一个预后风险模型，并计算出每个样本的预后评分指数(cp-score)。选取cp-score的中位值为cut-off值，将结直肠癌患者分为低风险组和高风险值。无论在训练集还是验证集，低风险组患者的生存均明显优于高风险组(如图11所示)。多元变量分析表明，cp-score与死亡风险显著相关，并且cp-score是一个独立的预后危险因素(如表13所示)。联合cp-score和分期、肿瘤部位、癌胚抗原等临床指标，可进一步的改进对结直肠癌患者预后的预测能力。

基于上述技术方案，本发明所述的用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及其试剂盒，可有效的用于诊断结直肠癌、预测结直肠癌疗效和预后。该基因甲基化面板通过检测患者血浆中MYO1G、ADAMTS4、Chr 8:20、BMPR1A、CD6、ATXN1、LGAP5、Chr 13:10和RBP5这9个基因中一个或多个基因的甲基化水平改变，可用于诊断结直肠癌和预测结直肠癌的治疗疗效；该基因甲基化面板通过检测患者血浆中MYO1G、GCET2、CALML4、KLF3、ATXN1共5个基因甲基化水平的改变，可用于预测结直肠癌的预后和死亡风险，并通过检测方法来实现。本发明一方面提高了通过受测者血液诊断其是否患有结直肠癌的准确性，另一方面通过对基因甲基化面板的不断优化来使用更少数量、更低成本的基因甲基化面板及试剂盒进行结直肠癌诊断，对结直肠癌早期诊断、普及性筛查具有重要意义。

以上对本发明实施例公开的一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板，其特征在于，所述基因甲基化面板包括第一组甲基化基因和/或第二组甲基化基因，所述第一组甲基化基因选自MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20中的一种或几种，所述第二组甲基化基因选自MYO1G、GCET2、CALML4、KLF3、ATXN1中的一种或几种。

2.根据权利要求1所述的基因甲基化面板，其特征在于，所述基因甲基化面板包括所述第一组甲基化基因和所述第二组甲基化基因，所述第一组甲基化基因包括MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20，所述第二组甲基化基因包括MYO1G、GCET2、CALML4、KLF3、ATXN1；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变，以预测结直肠癌的治疗疗效；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、GCET2、CALML4、KLF3、ATXN1的基因甲基化水平的改变，以预测肠癌患者的预后和死亡风险。

3.根据权利要求1所述的基因甲基化面板，其特征在于，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

4.根据权利要求1所述的基因甲基化面板，其特征在于，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1和Chr 8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

5.根据权利要求1所述的基因甲基化面板，其特征在于，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

6.根据权利要求1所述的基因甲基化面板，其特征在于，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A、CD6、ATXN1和Chr 8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

7.根据权利要求1所述的基因甲基化面板，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A、CD6和Chr 8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

8.根据权利要求1所述的基因甲基化面板，所述基因甲基化面板包括以下甲基化基因：MYO1G、BMPR1A和Chr 8:20；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A和Chr 8:20的基因甲基化水平的改变，以判断结直肠癌的发生。

9.根据权利要求1所述的基因甲基化面板，其特征在于，所述基因甲基化面板包括以下甲基化基因：MYO1G和ATXN1，所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G和ATXN1的基因甲基化水平的改变，以判断结直肠癌的发生；或者，所述基因甲基化面板包括以下甲基化基因：MYO1G；所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G的基因甲基化水平的改变，以判断结直肠癌的发生。

10.一种用于诊断、预测结直肠癌疗效和预后的试剂盒，其特征在于，所述试剂盒包括权利要求1至9所述的基因甲基化面板。