CN110603329A - 用于诊断肝细胞癌和肺癌的甲基化标志物 - Google Patents

用于诊断肝细胞癌和肺癌的甲基化标志物 Download PDF

Info

Publication number
CN110603329A
CN110603329A CN201880029707.1A CN201880029707A CN110603329A CN 110603329 A CN110603329 A CN 110603329A CN 201880029707 A CN201880029707 A CN 201880029707A CN 110603329 A CN110603329 A CN 110603329A
Authority
CN
China
Prior art keywords
methylation
hcc
score
dna
probe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880029707.1A
Other languages
English (en)
Other versions
CN110603329B (zh
Inventor
张康
侯睿
郑良宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meimeijia Tumor Technology Co Ltd
University of California
Original Assignee
Meimeijia Tumor Technology Co Ltd
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meimeijia Tumor Technology Co Ltd, University of California filed Critical Meimeijia Tumor Technology Co Ltd
Publication of CN110603329A publication Critical patent/CN110603329A/zh
Application granted granted Critical
Publication of CN110603329B publication Critical patent/CN110603329B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Abstract

在某些实施方案中,本文公开了用于将受试者诊断为患有肝细胞癌(HCC)或肺癌的方法和试剂盒。在一些情况中,本文还描述了确定患有HCC或肺癌的受试者的预后的方法。在另外的情况中,本文描述了确定受试者的HCC或肺癌的具体分期的方法。

Description

用于诊断肝细胞癌和肺癌的甲基化标志物
交叉引用
本申请要求于2017年3月2日提交的美国临时申请第62/466,328号、于2017年3月2日提交的美国临时申请第62/466,329号和于2017年10月6日提交的美国临时申请第62/569,462号的权益,这些申请中的每一个通过引用以其整体并入本文。
本公开内容的背景
癌症是世界范围内主要的死亡原因,并且预计在接下来的二十年期间,每年病例从2012年的1400万增加至2200万(WHO)。在一些情况中,肝癌的诊断程序仅在患者已经呈现症状后才开始,导致昂贵的、侵入性的、且有时耗时的程序。另外,无法接近的区域有时妨碍准确诊断。另外,高癌症发病率和死亡率与晚期诊断(late diagnosis)有关。
本公开内容的概述
在某些实施方案中,本文公开了用于将受试者诊断为患有肝细胞癌(HCC)或肺癌的方法和试剂盒。在一些情况中,本文还描述了确定患有HCC或肺癌的受试者的预后的方法。在另外的情况中,本文描述了确定受试者的HCC或肺癌的具体分期的方法。
在某些实施方案中,本文公开了选择被怀疑患有肝细胞癌(HCC)或肺癌的受试者进行治疗的方法,所述方法包括(a)使经处理的DNA与探针接触以生成扩增产物,所述探针在高严格性条件下与选自表2、表6、表7、表9或表10的基因的靶序列杂交,其中经处理的DNA是从获得自受试者的生物样品处理的;(b)分析扩增产物以产生基因的甲基化谱;(c)将甲基化谱应用于使来自基因的组(gene panel)的基因的甲基化谱与HCC或肺癌的存在相关的模型;(d)评估来自模型的输出以确定受试者是否患有HCC或肺癌;以及(e)如果确定受试者患有HCC或肺癌,则向受试者施用有效量的治疗剂。
在某些实施方案中,本文公开了确定患有肝细胞癌(HCC)的受试者的预后或监测受试者的HCC的进展的方法,所述方法包括:(a)用脱氨剂处理从受试者获得的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;(b)从经处理的DNA生成包括选自SOCS2、EPSTI1、TIA1、染色体4、染色体6、ZNF323、FOXP4和GRHL2的一种或更多种基因的甲基化谱;(c)基于一种或更多种基因的甲基化谱获得甲基化评分;以及(d)基于甲基化评分,启动第一治疗,如果受试者经历缓解则降低第一治疗剂的剂量,如果受试者经历复发则启动第二治疗,或者如果受试者变得对第一治疗剂是难治的则切换到第二治疗剂。
在某些实施方案中,本文公开了确定患有肺癌的受试者的预后或监测受试者的肺癌的进展的方法,所述方法包括:(a)用脱氨剂处理从受试者获得的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;(b)从经处理的DNA生成包括选自NPBWR1、染色体2、AAK1、SIM1、C10orf46、C17orf101、DEPDC5、ZNF323、GABRA2、PLAC8和ADRA2B的一种或更多种基因的甲基化谱;(c)基于一种或更多种基因的甲基化谱获得甲基化评分;以及(d)基于甲基化评分,启动第一治疗,如果受试者经历缓解则降低第一治疗剂的剂量,如果受试者经历复发则启动第二治疗,或者如果受试者变得对第一治疗剂是难治的则切换到第二治疗剂。
在某些实施方案中,本文公开了包含核酸探针集的试剂盒,所述核酸探针集与SOCS2、EPSTI1、TIA1、染色体4、染色体6、ZNF323、FOXP4、GRHL2、NPBWR1、染色体2、AAK1、SIM1、C10orf46、C17orf101、DEPDC5、ZNF323、GABRA2、PLAC8和ADRA2B的靶序列杂交。
在某些实施方案中,本文公开了包含核酸探针集的试剂盒,所述核酸探针集与选自表2、表6、表7、表9或表10的一种或更多种基因杂交。
在某些实施方案中,本文公开了选择被怀疑患有肝细胞癌(HCC)的受试者进行治疗的方法,所述方法包括:(a)使经处理的DNA与探针接触以生成扩增产物,所述探针在高严格性条件下与选自由以下组成的基因的组的基因的靶序列杂交:BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2和染色体8:20,其中经处理的DNA是从获得自受试者的生物样品处理的;(b)分析扩增产物以生成基因的甲基化谱;(c)将甲基化谱应用于使来自基因的组的基因的甲基化谱与HCC的存在相关的模型;(d)评估来自模型的输出以确定受试者是否患有HCC;以及(e)如果确定受试者患有HCC,则向受试者施用有效量的治疗剂。
在某些实施方案中,本文公开了选择被怀疑患有肝细胞癌(HCC)的受试者进行治疗的方法,所述方法包括:(a)使经处理的DNA与多于一种探针接触以生成扩增产物,其中每种探针在高严格性条件下与选自由以下组成的基因的组的基因的靶序列杂交:BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2和染色体8:20,并且每种探针不同,并且其中经处理的DNA是从获得自受试者的生物样品处理的;(b)分析扩增产物以生成来自基因的组的基因的甲基化谱;(c)将甲基化谱应用于使来自基因的组的基因的甲基化谱与HCC的存在相关的模型;(d)评估来自模型的输出以确定受试者是否患有HCC;以及(e)如果确定受试者患有HCC,则向受试者施用有效量的治疗剂。
在某些实施方案中,本文公开了确定患有肝细胞癌(HCC)的受试者的预后或监测受试者的HCC的进展的方法,所述方法包括:(a)用脱氨剂处理从受试者获得的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;(b)从经处理的DNA生成包括选自以下中的一种或更多种基因的甲基化谱:SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B;(c)基于一种或更多种基因的甲基化谱获得甲基化评分;以及(d)基于甲基化评分,启动第一治疗,如果受试者经历缓解则降低第一治疗剂的剂量,如果受试者经历复发则启动第二治疗,或者如果受试者变得对第一治疗剂是难治的则切换到第二治疗剂。
在某些实施方案中,本文公开了检测受试者的基因的组中的一种或更多种基因的甲基化状态的方法,所述方法包括:(a)用脱氨剂处理从受试者获得的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;及(b)通过以下步骤来检测选自由BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2和染色体8:20组成的基因的组的基因的甲基化状态:使经处理的DNA与在高严格性条件下与所述基因的靶序列杂交的探针接触以生成扩增产物;以及分析扩增产物以确定基因的甲基化状态。
在某些实施方案中,本文公开了检测受试者的基因的组中的一种或更多种基因的甲基化状态的方法,所述方法包括:(a)用脱氨剂处理从受试者获得的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;以及(b)通过以下步骤来检测选自由SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B组成的基因的组的基因的甲基化状态:使经处理的DNA与在高严格性条件下与所述基因的靶序列杂交的探针接触以生成扩增产物;以及分析扩增产物以确定基因的甲基化状态。
在某些实施方案中,本文公开了包含核酸探针集的试剂盒,所述核酸探针集与BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2、染色体8:20、SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B的靶序列杂交。
附图简述
本公开内容的多个方面在所附权利要求中具体阐述。本专利的文件包含至少一幅以彩色执行的附图/照片。具有彩色附图/照片的本专利的副本将在请求及支付必要费用后由主管局提供。通过参考以下详细描述以及附图将获得对本公开内容的特征和优点的更佳的理解,详述阐述了其中使用了本公开内容的原理的说明性实施方案,在附图中:
图1A-图1B示出了用于建立诊断模型(图1A)和预后模型(图1B)的示例性工作流程。
图2A-图2D示出了用于诊断LUNC和HCC的cfDNA甲基化分析。
图2A示出了验证组群中,使用cfDNA甲基化分析的诊断预测模型(cd评分)的接受者操作特征(ROC)曲线和相关曲线下面积(AUC)。
图2B示出了用于分类正常、LUNC或HCC患者的综合评分的箱形图。该图用来源于多类别分类器的评分表示来自验证组群的数据。
图2C-图2D示出了癌症(HCC和LUNC)和正常之间(图2C)以及HCC和LUNC之间(图2D)的差异性甲基化的甲基化标志物的无监督层级聚类。每行表示单个患者,并且每列表示CpG标志物。
图3A-图3C示出了健康对照、高风险患者和癌症患者的甲基化谱分析(profiling)。图3A示出了甲基化谱分析区分了HCC与高风险肝病患者或正常对照。高风险肝病被定义为肝炎、肝硬化和脂肪肝疾病。图3B示出了血清AFP区分了HCC与高风险肝病患者或正常对照。图3C示出了甲基化谱分析区分了LUNC与吸烟的患者和正常对照。
图4A-图4L示出了在LUNC和HCC患者中,使用综合诊断评分,cfDNA甲基化分析可以预测肿瘤负荷、分期和治疗响应。(图4A、图4E)具有和不具有可检测肿瘤负荷的患者的cfDNA甲基化分析综合评分(cd评分);(图4B、图4F)患有I期/II期疾病和III期/IV期疾病的患者的cd评分;(图4C、图4G)手术前、手术后和具有复发的患者的cd评分;(图4D,4H)治疗前、具有治疗响应和具有恶化进展的患者的cd评分;(图4I)整个HCC组群的HCC诊断的cd评分和AFP的ROC曲线和AUC;(图4J)患有I期/II期HCC和III期/IV期HCC的患者的AFP;(图4K)手术前、手术后和具有复发的HCC患者的AFP;(图4L)治疗前、具有治疗响应和具有恶化进展的HCC患者的AFP。复发被定义为肿瘤最初在治疗/手术后消失,但在定义的时期后复发。进展被定义为尽管进行了治疗/手术,但疾病仍然恶化。
图5A-图5F示出了基于cfDNA甲基化分析的HCC和LUNC存活的预后预测。(图5A)根据验证组群中的组合预后评分(cp评分),具有低或高死亡风险的LUNC患者的总体存活曲线。(图5B)根据验证数据集中的组合预后评分(cp评分),具有低或高死亡风险的HCC患者的总体存活曲线。(图5C)验证组群中患有I期/II期和III期/IV期的LUNC患者的存活曲线。(图5D)验证组群中患有I期/II期和III期/IV期HCC的患者的存活曲线。(图5E、图5F)在验证组群中,通过cp评分、分期和cp评分结合LUNC分期(图5E)和HCC分期(图5F)预测的12个月存活的ROC。
图6A示出了HCC和LUNC组织相比于正常血液的DNA的差异性甲基化的前1000种甲基化标志物的无监督层级聚类。
图6B示出了在HCC和LUNC组织DNA之间差异性甲基化的前1000种甲基化标志物的无监督层级聚类。每列表示单个患者,并且每行表示CpG标志物。
图7A-图7B示出了来自LUNC和HCC患者及正常对照的cfDNA样品中包含两个相关甲基化区段(BCM)的说明性区域。图7A示出了在UCSC基因组浏览器(genome.ucsc.edu)内显示的BCM的基因组邻域。皮尔逊相关性轨迹通过对BCM内标志物的r值求和示出了相关性数据。皮尔逊相关性图下方的Cg标志物名称(cg14999168、cg14088196、cg25574765)是来自TCGA的甲基化标志物。还列出了基因名称和常见SNP。图7B示出了属于该区域中的两个BCM的分析的cg标志物的集合的不按比例的表示(not-to-scale representation)。区段之间的边界以黑色矩形表示,而红色正方形表示两个相邻标志物之间的相关甲基化(r>0.5)。任何两种标志物之间的相关性由源自这两种标志物的(虚拟)垂直线的交点处的正方形表示。白色表示没有显著相关性。通过标志物cg14999168锚定的左侧MCB中的10种新鉴定的甲基化标志物或通过cg14088196/cg25574765锚定的右侧MCB中的11种新鉴定的甲基化标志物在HCCctDNA、正常cfDNA和HCC组织DNA中高度一致且相关。使用相同MCB中的标志物可以显著增强等位基因判定(calling)准确性。在图b(panel b)底部的垂直线是两个MCB的边界的基因组坐标。
图8A示出了选择用于在验证组群的诊断预测模型(cd评分)中使用的100种甲基化标志物的无监督层级聚类。
图8B示出了整个cfDNA数据集中所有MCB的监督层级聚类的全局视图。
图9示出了显示出验证组群中100个MCB的行为的箱型图。顶部图:健康患者相比于患有HCC或LUNC的患者的MCB平均值和偏差;底部图:LUNC患者相比于HCC患者的MCB平均值和偏差。
图10A-图10B示出了具有连续血浆样品的HCC和LUNC患者中与治疗结果相关的甲基化值。图10A示出了比较手术后的患者、具有临床响应(部分缓解(PR)或稳定疾病(SD))的患者或具有疾病进展/复发(PD)的患者的甲基化值的变化的总结图。图10B示出了完全手术切除后具有治疗响应和具有疾病进展的单个患者的甲基化值趋势。Δ甲基化率表示治疗前和治疗后的甲基化值差异。PRE:治疗前;POST:治疗后。
图11A示出了使用LUNC患者的MCB的总甲基化拷贝数对治疗结果的动态监测。
图11B示出了使用LUNC患者的MCB的甲基化值对治疗结果的动态监测。PD,进展性疾病;PR,部分响应;SD,稳定疾病;chemo,化学疗法。
图12A示出了使用HCC患者的MCB的总甲基化拷贝数和AFP对治疗结果的动态监测。
图12B示出了使用HCC患者的MCB的甲基化率对治疗结果的动态监测。治疗日期在图中指示。PD,进行展疾病;PR,部分响应;SD,稳定疾病;chemo,化学疗法;TACE,经导管动脉化学栓塞。
图13示出了用于建立诊断和预后模型的工作流程。使用HCC、LUNC和正常血液的全基因组甲基化数据来鉴定用于探针设计的候选标志物。左图:诊断标志物选择:将LASSO分析应用于444名HCC患者、299名LUNC患者和1123名正常患者的训练组群,以确定77种标志物的最终选择。将这77种标志物应用于445名HCC患者、300名LUNC患者和1124名正常患者的验证组群。右图:预后标志物选择:将LASSO-Cox应用于具有存活数据的433名HCC患者和299名LUNC患者的训练组群,以确定20种标志物的最终选择。将这20种标志物应用于具有存活数据的434名HCC和300名LUNC的验证组群。
图14A-图14D示出了用于诊断LUNC和HCC的cfDNA甲基化分析。(图14A)验证组群中使用cfDNA甲基化分析的诊断预测模型(cd评分)的接受者操作特征(ROC)曲线和相关曲线下面积(AUC)。(图14B)用于对正常和癌症患者(左)以及LUNC和HCC患者(右)进行分类的综合评分的箱型图。(图14C-图14D)癌症(HCC和LUNC)和正常之间(图14C)以及HCC和LUNC之间(图14D)的差异性甲基化的甲基化标志物的无监督层级聚类。每行表示单个患者,并且每列表示MCB标志物。
图15A-图15D示出了健康对照、高风险患者和癌症患者的甲基化分析。(图15A)甲基化分析区分了HCC与高风险肝病患者或正常对照。高风险肝病被定义为肝炎、肝硬化和脂肪肝疾病。(图15B)血清AFP区分了HCC与高风险肝病患者或正常对照。(图15C)甲基化分析区分了LUNC与吸烟患者和正常对照。(图15D)血清CEA区分了LUNC与高风险(吸烟)患者。
图16A-图16R示出了使用LUNC和HCC患者的综合诊断评分,cfDNA甲基化分析可以预测肿瘤负荷、分期和治疗响应。LUNC中具有和不具有可检测肿瘤负荷的患者的cd评分(图16A)与CEA(图16I)相比,以及HCC中具有和不具有可检测肿瘤负荷的患者的cd评分(图16E)与AFP(图16M)相比;LUNC中具有I期/II期疾病和III期/IV期疾病的患者的cd评分(图16B)与CEA(图16J)相比,以及HCC患者中具有I期/II期疾病和III期/IV期疾病的患者的cd评分(图16F)与AFP(图16N)相比;LUNC中介入治疗前、手术后及具有复发的患者的cd评分(图16C)与CEA(图16K)相比,以及HCC中介入治疗前、手术后及具有复发的患者的cd评分(图16G)与AFP(图16O)相比;LUNC中介入治疗前、具有治疗响应及具有恶化进展的患者的cd评分(图16D)与CEA(图16L)相比,以及HCC中介入治疗前、具有治疗响应及具有恶化进展的患者的cd评分(图16H)与AFP(图16P)相比;(图16Q)整个LUNC组群中LUNC诊断的cd评分和AFP的ROC曲线和AUC。(图16R)整个HCC组群中HCC诊断的cd评分和AFP的ROC曲线和AUC。
图17A-图17F示出了基于cfDNA甲基化谱分析的HCC和LUNC存活的预后预测。根据验证组群中的组合预后评分(cp评分),具有低或高死亡风险的HCC患者的总体存活曲线(图17A)。根据验证数据集中的组合预后评分(cp评分),具有低或高死亡风险的LUNC患者的总体存活曲线(图17B)。验证组群中I期/II期和III期/IV期的HCC患者的存活曲线(图17C)。验证组群中具有I期/II期和III期/IV期LUNC的患者的存活曲线(图17D)。图17E和图17F示出了验证组群中通过cp评分、CEA、AFP、分期、以及结合HCC分期(图17E)和LUNC分期(图17F)的cp评分预测的12个月存活的ROC。
图18A-图18B示出了使用cfDNA甲基化的组对LUNC的早期检测。在前瞻性试验中,具有尺寸在10mm和30mm之间的肺结节的208名吸烟患者被登记并测量了cfDNA LUNC甲基化的组。将患者分为训练组群和测试组群(图18A);验证组群中I期LUNC相比于良性肺结节的预测的接受者操作特征(ROC)曲线和相关曲线下面积(AUC),准确性为91.4%(图18B);示出了在验证组群中显示出高灵敏度和特异性的I期LUNC相比于良性肺结节之间的预测结果的表(图18C)。
图19A-图19D说明了甲基化标志物可以区分HCC和肝硬化,并检测从肝硬化至HCC的进展。使用217名HCC和241名肝硬化患者建立了预测模型,并将患者分为训练组群和测试组群(图19A);验证组群中I期HCC相比于肝硬化的预测的接受者操作特征(ROC)曲线和相关曲线下面积(AUC),准确性为89.9%(图19B);示出了验证组群中I期HCC和肝硬化之间的预测结果的表(图19C);以高灵敏度(89.5%)和特异性(98%)示出了对从肝硬化向I期HCC的进展的预测结果的表(图19D)。
图20A示出了HCC和LUNC原发性组织相比于正常血液的DNA的差异性甲基化的前1000种甲基化标志物的无监督层级聚类。
图20B示出了在HCC和LUNC组织DNA之间的差异性甲基化的前1000种甲基化标志物的无监督层级聚类。每列表示单个患者,并且每行表示CpG标志物。
图20C示出了整个cfDNA数据集中所有888个MCB的监督层级聚类的全局视图。
图21示出了显示出组群中MCB的特征的箱型图。顶部图:在每一个与其余的比较中,LASSO MCB的平均值和偏差。
图22示出了具有连续血浆样品的HCC和LUNC患者中与治疗结果相关的甲基化值。比较手术后的患者、具有临床响应(部分缓解(PR)或稳定疾病(SD))的患者或具有疾病进展/复发(PD)的患者的甲基化值变化的总结图。
图23A示出了使用LUNC患者的MCB的总甲基化拷贝数对治疗结果的动态监测。
图23B示出了使用LUNC患者的MCB的甲基化值对治疗结果的动态监测。PD,进展性疾病;PR,部分响应;SD,稳定疾病;chemo,化学疗法。
图24示出了使用HCC患者的MCB的总甲基化拷贝数和CEA对治疗结果的动态监测。
图25示出了用HCC患者的MCB的甲基化率对治疗结果的动态监测。治疗日期在图中指示。PD,进展性疾病;PR,部分响应;SD,稳定疾病;chemo,化学疗法;TACE,经导管动脉化学栓塞。
图26示出了本文描述的数据生成及分析的示例性工作流程图。
图27A-图27H示出了用于诊断HCC的cfDNA甲基化分析。图27A示出了28对匹配的HCC肿瘤DNA和血浆cfDNA的甲基化的热图,以0.1的平均甲基化值阈值作为截止值。图27B示出了正常血液、HCC肿瘤DNA和HCC患者cfDNA中的十种诊断标志物的甲基化值和标准差。图27C示出了在训练数据集中诊断预测模型的二元结果的混淆表,且图27D示出了在验证数据集中诊断预测模型的二元结果的混淆表。图27E和图27F示出了训练数据集(图27E)和验证数据集(图27F)的甲基化标志物的诊断预测模型的ROC。图27G和图27H示出了选择的用于在训练数据集(图27G)和验证数据集(图27H)中在诊断预测模型中使用的十种甲基化标志物的无监督层级聚类。
图28A-图28K示出了cfDNA甲基化分析和肿瘤负荷、治疗响应和分期。图28A和图28B示出了健康对照、患有肝病(HBV/HCV感染、肝硬化和脂肪肝)的个体和HCC患者的组合诊断评分(cd评分)(图28A)和AFP(图28B)。图28C示出了正常对照及具有和不具有可检测肿瘤负荷的HCC患者的cd评分。图28D示出了正常对照、治疗前、具有治疗响应和具有进展的HCC患者的cd评分。图28E示出了正常对照及手术前、手术后和具有复发的HCC患者的cd评分。图28F示出了正常对照和从I期-IV期的HCC患者的cd评分。图28G示出了在整个HCC组群中HCC诊断的cd评分和AFP的ROC。图28H和图28I示出了具有初始诊断(在手术或其他治疗之前)、具有治疗响应、具有进展及具有复发的HCC患者的cd评分(图28H)和AFP(图28I)。图28J和图28K示出了I期-IV期的HCC患者的cd评分(图28J)和AFP(图28K)。
图29A-图29G示出了用于预后预测HCC存活的cfDNA甲基化分析。图29A和图29B示出了根据训练数据集(图29A)和验证数据集(图29B)的组合预后评分(cp评分)在6个月时具有低或高死亡风险的HCC患者的总体存活曲线。图29C和图29D示出了训练数据集(图29C)和验证数据集(图29D)中I期/II期和III期/IV期的HCC患者的存活曲线。图29E和图29F示出了训练数据集(图29E)和验证数据集(图29F)的cp评分、分期和结合分期的cp评分的ROC。图29G以整个HCC组群的cp评分风险和分期的组合示出了HCC患者的存活曲线。
图30示出了HCC肿瘤DNA和正常血液之间的差异性甲基化的前1000种甲基化标志物的无监督层级聚类。每列表示单个患者,并且每行表示CpG标志物。
图31A-图31B示出了来自HCC和正常对照的cfDNA样品中包含两个相关甲基化区段(BCM)的示例性区域。图31A示出了在UCSC基因组浏览器内显示的BCM的基因组邻域。皮尔逊相关性轨迹通过对BCM内标志物的r值求和示出了相关性数据。皮尔逊相关性图下方的Cg标志物名称(cg14999168、cg14088196、cg25574765)是来自TCGA的甲基化标志物。还列出了基因名称和常见SNP。图31B示出了属于该区域中的两个BCM的分析的cg标志物的集合的不按比例的表示。区段之间的边界以黑色矩形表示,而红色正方形表示两个相邻标志物之间的相关甲基化(r>0.5)。任何两种标志物之间的相关性由源自这两种标志物的(虚拟)垂直线交点处的正方形表示。白色表示没有显著相关性。通过标志物cg14999168锚定的左侧MCB中的10种新鉴定的甲基化标志物或通过标志物cg14088196/cg25574765锚定的右侧MCB中的11种新鉴定的甲基化标志物在HCC ctDNA、正常cfDNA和HCC组织DNA中高度一致且相关。使用相同MCB中的标志物可以显著增强等位基因判定(calling)的准确性。在b图底部的垂直线是两个MCB的边界的基因组坐标。
图32A-图32B示出了具有连续血浆样品的HCC患者中与治疗结果相关的甲基化值。图32A示出了比较手术后、具有临床响应及具有疾病进展的患者的cd评分的变化(***p<0.001)。图32B示出了完全手术切除后具有治疗响应和具有疾病进展的单个患者的cd评分趋势。PRE:治疗前;POST:治疗后。
图33示出了用cd评分和AFP对个体患者的治疗结果的动态监测。治疗日期以垂直蓝色箭头表示。PD,进展性疾病;PR,部分响应;SD,稳定疾病;TACE,经导管动脉化学栓塞。
图34A-图34B示出了HCC诊断的cfDNA甲基化分析。图34A示出了28对匹配的HCC肿瘤DNA和血浆cfDNA的甲基化的热图,以0.1的平均甲基化值阈值作为截止值。图34B示出了正常血浆、HCC肿瘤DNA和HCC患者cfDNA中的十种诊断标志物的甲基化值和标准差。
图35示出了TCGA HCC组织DNA、华人HCC组织DNA、HCC ctDNA和正常血浆cfDNA中10种诊断标志物的层级聚类。每列表示单个患者,并且每行表示CpG标志物。组内聚类显示β值遵循原发性HCC组织和正常cfDNA之间的梯度,肿瘤cfDNA显示出中间的β值。具有更高分期的肿瘤的样品的cfDNA具有接近原发性HCC组织样品的β值。
图36示出了用甲基化综合值和AFP对个体患者的治疗结果的动态监测。治疗日期以垂直蓝色箭头表示。PD,进展性疾病;PR,部分响应;SD,稳定疾病;TACE,经导管动脉化学栓塞。
图37A-图37B示出了用于预后预测HCC存活的TNM分期、训练数据集(图37A)和验证数据集(图37B)中I期/II期和III期/IV期的HCC患者的存活曲线。
图38A-图38C示出了测量来自肿瘤组织基因组DNA(gDNA)的cfDNA分数的混合实验。图38A示出了数字PCR(ddPCR)结果。上图,每个蓝色点表示单个PCR反应和一个甲基化的DNA分子。下图,每个绿色点表示单个PCR反应和一个未甲基化的DNA分子。A01至A08表示混合实验(A01,100%正常cfDNA,0%HCC gDNA;A02,90%正常cfDNA,10%HCC gDNA;A04,70%正常DNA,30%HCC gDNA;A07,40%正常cfDNA,60%HCC gDNA;A08,0%正常cfDNA,100%HCCgDNA)。结果的总结参见b和c。图38B示出了用不同分数的正常cfDNA和HCC(gDNA)的混合实验结果。图38C示出了作为混合正常cfDNA和纯HCC gDNA(ca_gDNA)的产物的HCC cfDNA的最终甲基化值。每条垂直线表示混合实验(从左至右,A01,A02,A04,A07,A08)。对应于左侧Y轴(Ch1)的绿色点和条表示未甲基化的值的平均值和标准误差(S.E.);对应于右侧Y轴(Ch2)的蓝色点和条表示甲基化的值的平均值和S.E.。X轴表示正常的cfDNA和HCC gDNA的不同浓度(详情参见图38A)。
图39A-图39C示出了正常血浆样品和HCC血浆样品中的cfDNA浓度的测量值。图39A示出了11±4.7ng cfDNA/1mL正常血浆,和22±7.7ng cfDNA/1mL HCC血浆。数据以平均标值±准偏差(X±SD)示出。P<0.001(学生t检验)。图39B示出了通过数字液滴PCR证明DNA的量和总拷贝数之间的线性关系的图(甲基化的加未甲基化的)(P<0.001)。图39C示出了不同商业提取试剂盒的cfDNA产量的比较。Elitehealth和Qiagen试剂盒给出了较高且相当的产量(Elitehealth和Qiagen之间的产量没有显著差异,P>0.05;EliteHealth相比于ThermoFisher之间的产量存在显著差异,P<0.05,或者Qiagen相比于Thermo Fisher之间的产量存在显著差异,P<0.05)。
本公开内容的详述
癌症的特征在于由基因的一种或更多种突变或修饰引起细胞异常生长,导致细胞增殖和细胞死亡的平衡失调。DNA甲基化使肿瘤抑制基因的表达沉默,并且其本身表现为最早的赘生性变化之一。存在于赘生性组织和血浆中的甲基化模式表现出均质性,并且在一些情况中被用作灵敏的诊断标志物。例如,在一项研究中,当用于诊断转移性乳腺癌时,cMethDNA测定已经显示出具有约91%的灵敏度(sensitive)和约96%的特异性。在另一项研究中,当被用于鉴定大组群(cohort)的患有转移性结肠癌的患者中的KRAS基因突变时,循环肿瘤DNA(ctDNA)具有约87.2%的灵敏度和约99.2%的特异性(Bettegowda等人,Detection of Circulating Tumor DNA in Early-and Late-Stage HumanMalignancies.Sci.Transl.Med,6(224):ra24.2014)。同一研究还证明,ctDNA在>75%的患有晚期胰腺癌、卵巢癌、结肠直肠癌、膀胱癌、胃食管癌、乳腺癌、黑素瘤、肝细胞癌和头颈癌的患者中是可检测的(Bettegowda等人)。
另外的研究已经证明了CpG甲基化模式与赘生性进展相关。例如,在乳腺癌甲基化模式的一项研究中,已经发现P16超甲基化与早期乳腺癌相关,而TIMP3启动子超甲基化与晚期乳腺癌相关。另外,已经示出了BMP6、CST6和TIMP3启动子超甲基化与乳腺癌转移到淋巴结中相关。
在一些实施方案中,对于癌症检测,DNA甲基化谱分析提供了与体细胞突变分析相比更高的临床灵敏度和动态范围。在其他情况中,已经示出了改变的DNA甲基化特征与某些癌症的治疗响应的预后相关。例如,一项研究表明,在患有晚期直肠癌的一组患者中,十个差异性甲基化区域被用于预测患者的预后。同样,在不同研究中,血清中的RASSF1A DNA甲基化测量被用于预测乳腺癌患者中经受辅助疗法的患者中的不良结果。另外,在不同研究中,SRBC基因超甲基化与用奥沙利铂治疗的患有结肠直肠癌的患者中的不良结果相关。另一项研究已经证明,ESR1基因甲基化与接受他莫昔芬的乳腺癌患者中的临床响应相关。另外,ARHI基因启动子超甲基化被示出是未用他莫昔芬治疗的乳腺癌患者的长期存活的预测因子。
在一些实施方案中,本文公开了基于DNA甲基化谱分析来诊断肺癌和肝细胞癌(HCC)的方法和试剂盒。在一些情况中,本文提供了基于DNA甲基化谱分析来区分肺癌和HCC的方法和试剂盒。在其他情况中,本文提供了基于DNA甲基化谱分析来鉴定患有肺癌或HCC的受试者的方法和试剂盒。在另外的情况中,本文提供了基于DNA甲基化谱分析来确定患有肺癌或HCC的受试者的预后以及确定受试者的肺癌或HCC的进展的方法和试剂盒。
使用方法
诊断受试者的方法
本文在某些实施方案中公开了诊断肝细胞癌(HCC)以及选择被怀疑患有肝癌的受试者进行治疗的方法。在一些情况中,该方法包括使用本文描述的一种或更多种生物标志物。在一些情况中,生物标志物包括胞嘧啶甲基化位点。在一些情况中,胞嘧啶甲基化包括5-甲基胞嘧啶(5-mCyt)和5-羟甲基胞嘧啶。在一些情况中,胞嘧啶甲基化位点出现于CpG二核苷酸基序中。在其他情况中,胞嘧啶甲基化位点出现于CHG或CHH基序中,其中H是腺嘌呤、胞嘧啶或胸腺嘧啶。在一些情况中,一个或更多个CpG二核苷酸基序或CpG位点形成CpG岛(富含CpG二核苷酸的短DNA序列)。在一些情况中,CpG岛的长度通常但不总是在约0.2kb至约1kb之间。在某些情况中,生物标志物包括CpG岛。
本文在一些实施方案中公开了选择被怀疑患有肝细胞癌(HCC)或肺癌的受试者进行治疗的方法,所述方法包括(a)使经处理的DNA与探针接触以生成扩增产物,所述探针在高严格性条件下与选自表2、表6、表7、表9或表10的基因的靶序列杂交,其中经处理的DNA是从获得自受试者的生物样品处理的;(b)分析扩增产物以生成基因的甲基化谱;(c)将甲基化谱应用于使来自基因的组的基因的甲基化谱与HCC或肺癌的存在相关的模型;(d)评估来自模型的输出以确定受试者是否患有HCC或肺癌;以及(e)如果确定受试者患有HCC或肺癌,则向受试者施用有效量的治疗剂。
在一些实施方案中,本文描述的基因的组中的一种或更多种基因还包括甲基化相关区段(MCB)。在一些情况中,MCB包括约2种至约30种、约2种至约25种、约2种至约20种、约2种至约15种、约2种至约10种、约2种至约8种、或约2种至约5种基因。在一些情况中,MCB包括约2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、30种或更多种基因。
在一些情况中,MCB包括选自表2、表3、表6、表7、表9或表10的一种或更多种基因。在一些情况中,MCB包括选自表2的一种或更多种基因。在一些情况中,MCB包括选自表3的一种或更多种基因。在一些情况中,MCB包括选自表6的一种或更多种基因。在一些情况中,MCB包括选自表7的一种或更多种基因。在一些情况中,MCB包括选自表9的一种或更多种基因。在一些情况中,MCB包括选自表10的一种或更多种基因。
在一些情况中,MCB包括选自SOCS2、EPSTI1、TIA1、染色体4、染色体6、ZNF323、FOXP4、GRHL2、NPBWR1、染色体2、AAK1、SIM1、C10orf46、C17orf101、DEPDC5、ZNF323、GABRA2、PLAC8和ADRA2B的一种或更多种基因。在一些情况中,MCB包括选自SOCS2、EPSTI1、TIA1、染色体4、染色体6、ZNF323、FOXP4和GRHL2的一种或更多种基因。在一些情况中,MCB包括选自NPBWR1、染色体2、AAK1、SIM1、C10orf46、C17orf101、DEPDC5、ZNF323、GABRA2、PLAC8和ADRA2B的一种或更多种基因。在一些情况中,MCB包括SOCS2。在一些情况中,MCB包括EPSTI1。在一些情况中,MCB包括TIA1。在一些情况中,MCB包括染色体4。在一些情况中,MCB包括染色体6。在一些情况中,MCB包括ZNF323。在一些情况中,MCB包括FOXP4。在一些情况中,MCB包括NPBWR1。在一些情况中,MCB包括GRHL2。在一些情况中,MCB包括染色体2。在一些情况中,MCB包括AAK1。在一些情况中,MCB包括SIM1。在一些情况中,MCB包括C10orf46。在某些情况中,MCB包括C17orf101。在一些情况中,MCB包括DEPDC5。在一些情况中,MCB包括ZNF323。在一些情况中,MCB包括GABRA2。在一些情况中,MCB包括PLAC8。在一些情况中,MCB包括ADRA2B。
在一些情况中,该方法还包括使经处理的DNA与至少一种另外的探针接触以生成另外的扩增产物,所述另外的探针在高严格性条件下与选自基因的组的另外的基因的靶序列杂交,并分析另外的扩增产物以生成该另外的基因的甲基化谱,从而确定受试者中HCC或肺癌的存在。
在一些情况中,将生物样品用脱氨剂处理以生成经处理的DNA。
在一些情况中,模型包括来自从HCC阳性样品或肺癌阳性样品生成的基因的组的基因的甲基化谱。在一些情况中,HCC阳性样品包括来自转移性HCC的细胞。在一些情况中,肺癌阳性样品包括来自转移性肺癌的细胞。
在一些情况中,模型还包括来自从正常样品生成的基因的组的基因的甲基化谱。
在一些情况中,模型是基于来自表3、表6或表7的生物标志物的甲基化谱开发的。
在一些情况中,模型是基于来自表9或表10的生物标志物的甲基化谱开发的。
在一些情况中,模型是使用选自以下中的一种或更多种算法开发的:主成分分析、逻辑回归分析、最近邻分析、支持向量机和神经网络模型。
在一些情况中,该方法还包括区分HCC和肺癌。
在一些情况中,肝细胞癌(HCC或恶性肝细胞瘤)是最常见的肝癌类型。在一些情况中,HCC是病毒性肝炎感染(例如,通过乙型肝炎或丙型肝炎)、代谢毒素(例如,酒精或黄曲霉毒素)、非酒精性脂肪性肝疾病(NASH)、血色素沉着病或α1-抗胰蛋白酶缺乏症的结果。
在一些实施方案中,HCC通过分期被进一步分类。在一些情况中,分期考虑了肿瘤尺寸、肿瘤数量、脉管侵袭和肝外扩散的存在、肝功能(血清胆红素和白蛋白的水平、腹水和门静脉高压的存在)和患者的健康。在一些情况中,分期是巴塞罗纳临床肝癌(BarcelonaClinical Liver Cancer)(BCLC)分期分类。在一些情况中,HCC的分期包括I期、II期、III期和IV期。
在一些情况中,本文描述的一种或更多种标志物被用于将受试者诊断为患有HCC。在一些情况中,HCC是转移的HCC。在一些情况中,本文描述的一种或更多种标志物被用于区分受试者的HCC和肺癌。
在一些实施方案中,肺癌是任何类型的肺癌。在一些情况中,肺癌包括非小细胞肺癌(NSCLC)、小细胞肺癌(SCLC)、支气管类癌(bronchial carcinoid)或间皮瘤。在一些情况中,非小细胞肺癌包括腺癌、鳞状细胞癌、大细胞癌或大细胞神经内分泌肿瘤。在一些情况中,肺癌是转移的肺癌。在其他情况中,肺癌是复发的或难治性肺癌。
在一些实施方案中,探针包括DNA探针、RNA探针或其组合。在一些情况中,探针包括天然核酸分子和非天然核酸分子。在一些情况中,探针包括标记探针,诸如例如,荧光标记探针或放射性标记探针。在一些情况中,探针与CpG位点相关。在一些情况中,探针在下一代测序反应中被使用,以生成CpG甲基化数据。在另外的情况中,探针在基于溶液的下一代测序反应中被使用,以生成CpG甲基化数据。在一些情况中,探针包括分子信标探针(molecular beacon probe)、TaqMan探针、锁核酸探针(locked nucleic acid probe)、扣锁探针(padlock probe)或蝎形探针(Scorpion probe)。在一些情况中,探针包括扣锁探针。
在一些情况中,治疗包括经导管动脉化学栓塞、射频消融或近距离放射治疗。
在一些情况中,治疗包括化学治疗剂或用于靶向疗法的剂。在一些情况中,化学治疗剂包括顺铂、多柔比星、氟嘧啶、吉西他滨、伊立替康、米托蒽醌、奥沙利铂、沙利度胺或其组合。在一些情况中,用于靶向疗法的剂包括阿西替尼、贝伐单抗、西妥昔单抗、埃罗替尼、雷莫芦单抗、瑞戈非尼、索拉非尼、舒尼替尼、胸苷激酶(TK)抑制剂或其组合。
在一些实施方案中,治疗包括手术。在一些情况中,手术包括治愈性切除。在其他情况中,手术包括肝移植。
在一些实施方案中,生物样品包括血液样品。
在一些情况中,生物样品包括组织的活组织检查样品。
在一些情况中,生物样品包括循环肿瘤细胞。
在一些情况中,受试者是人类。
HCC基因的组
本文在一些实施方案中公开了选择被怀疑患有肝细胞癌(HCC)的受试者进行治疗的方法,所述方法包括:(a)使经处理的DNA与探针接触以生成扩增产物,所述探针在高严格性条件下与选自由以下组成的基因的组的基因的靶序列杂交:骨形态发生蛋白受体1A型(BMPR1A)、普列克底物蛋白同源性及含SEC7结构域蛋白1(PSD)、Rho GTP酶活化蛋白25(ARHGAP25)、Kruppel样因子3(KLF3)、胎盘特异性8(PLAC8)、共济失调蛋白(ataxin)1(ATXN1)、染色体6:170、染色体6:3、ATP酶家族含AAA结构域蛋白2(ATAD2)和染色体8:20,其中经处理的DNA是从获得自受试者的生物样品处理的;(b)分析扩增产物以生成所述基因的甲基化谱;(c)将甲基化谱应用于使来自基因的组的基因的甲基化谱与HCC的存在相关的模型;(d)评估来自模型的输出以确定受试者是否患有HCC;以及(e)如果确定受试者患有HCC,则向受试者施用有效量的治疗剂。
本文在一些实施方案中还公开了选择被怀疑患有肝细胞癌(HCC)的受试者进行治疗的方法,所述方法包括:(a)使经处理的DNA与多于一种探针接触以生成扩增产物,其中每种探针在高严格性条件下与选自由以下组成的基因的组的基因的靶序列杂交:BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2和染色体8:20,并且每种探针不同,以及其中经处理的DNA是从获得自受试者的生物样品处理的;(b)分析扩增产物以生成来自基因的组的所述基因的甲基化谱;(c)将甲基化谱应用于使来自基因的组的所述基因的甲基化谱与HCC的存在相关的模型;(d)评估来自模型的输出以确定受试者是否患有HCC;以及(e)如果确定受试者患有HCC,则向受试者施用有效量的治疗剂。
本文在另外的实施方案中公开了确定患有肝细胞癌(HCC)的受试者的预后或监测受试者的HCC的进展的方法,所述方法包括:(a)用脱氨剂处理从受试者获得的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;(b)从经处理的DNA生成包括选自SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B的一种或更多种基因的甲基化谱;(c)基于一种或更多种基因的甲基化谱获得甲基化评分;以及(d)基于甲基化评分,启动第一治疗,如果受试者经历缓解则降低第一治疗剂的剂量,如果受试者经历复发则启动第二治疗,或者如果受试者变得对第一治疗剂是难治的则切换到第二治疗剂。
本文在另外的实施方案中开了检测受试者的基因的组中的一种或更多种基因的甲基化状态的方法,所述方法包括:(a)用脱氨剂处理获得自受试者的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;及(b)通过以下步骤来检测选自由BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2和染色体8:20组成的基因的组的基因的甲基化状态:使经处理的DNA与在高严格性条件下与所述基因的靶序列杂交的探针接触以生成扩增产物;以及分析扩增产物以确定所述基因的甲基化状态。
在一些实施方案中,基因的组中的一种或更多种基因还包括甲基化相关区段(MCB)。在一些情况中,MCB包括约2种至约30种、约2种至约25种、约2种至约20种、约2种至约15种、约2种至约10种、约2种至约8种、或约2种至约5种基因。在一些情况中,MCB包括约2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、30种或更多种基因。
在一些情况中,MCB包括选自BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2、染色体8:20、SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B的一种或更多种基因。在一些情况中,MCB包括选自BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2和染色体8:20的一种或更多种基因。在一些情况中,MCB包括选自SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B的一种或更多种基因。在一些情况中,MCB包括BMPR1A。在一些情况中,MCB包括PSD。在一些情况中,MCB包括KLF3。在一些情况中,MCB包括PLAC8。在一些情况中,MCB包括ATXN1。在一些情况中,MCB包括染色体6:170。在一些情况中,MCB包括染色体6:3。在一些情况中,MCB包括ATAD2。在一些情况中,MCB包括染色体8:20。在一些情况中,MCB包括SH3PXD2A。在一些情况中,MCB包括C11orf9。在一些情况中,MCB包括PPFIA1。在一些情况中,MCB包括染色体17:78。在一些情况中,MCB包括ARHGAP25。在一些情况中,MCB包括SERPINB5。在一些情况中,MCB包括NOTCH3。在一些情况中,MCB包括GRHL2。在一些情况中,MCB包括TMEM8B。
在一些情况中,该方法还包括使经处理的DNA与至少一种另外的探针接触以生成另外的扩增产物,所述另外的探针在高严格性条件下与选自基因的组的另外的基因的靶序列杂交,并分析所述另外的扩增产物以生成所述另外的基因的甲基化谱,从而确定受试者中HCC的存在。
在一些情况中,将生物样品用脱氨剂处理以生成经处理的DNA。
在一些情况中,模型包括来自从HCC阳性样品生成的基因的组的基因的甲基化谱。在一些情况中,HCC阳性样品包括来自转移性HCC的细胞。
在一些情况中,模型还包括来自从正常样品生成的基因的组的基因的甲基化谱。
在一些情况中,模型是基于来自表15或表16的生物标志物的甲基化谱开发的。
在一些情况中,模型是使用选自以下中的一种或更多种算法开发的:主成分分析、逻辑回归分析、最近邻分析、支持向量机和神经网络模型。
在一些情况中,肝细胞癌(HCC或恶性肝细胞瘤)是最常见的肝癌类型。在一些情况中,HCC是病毒性肝炎感染(例如,通过乙型肝炎或丙型肝炎)、代谢毒素(例如,酒精或黄曲霉毒素)、非酒精性脂肪性肝疾病(NASH)、血色素沉着病或α1-抗胰蛋白酶缺乏症的结果。
在一些实施方案中,HCC通过分期被进一步分类。在一些情况中,分期考虑了肿瘤尺寸、肿瘤数量、脉管侵袭和肝外扩散的存在、肝功能(血清胆红素和白蛋白的水平、腹水和门静脉高压的存在)和患者的健康。在一些情况中,分期是巴塞罗纳临床肝癌(BCLC)分期分类。在一些情况下,HCC的分期包括I期、II期、III期和IV期。
在一些实施方案中,本文描述的一种或更多种生物标志物将HCC与另一种类型的肝癌区分开。在一些情况中,另一种类型的肝癌包括肝硬化或肝脂肪变性(或脂肪性肝疾病)。
在一些实施方案中,探针包括DNA探针、RNA探针或其组合。在一些情况中,探针包括天然核酸分子和非天然核酸分子。在一些情况中,探针包括标记探针,诸如例如,荧光标记探针或放射性标记探针。在一些情况中,探针与CpG位点相关。在一些情况中,探针在下一代测序反应中被使用,以生成CpG甲基化数据。在另外的情况中,探针在基于溶液的下一代测序反应中被使用,以生成CpG甲基化数据。在一些情况中,探针包括分子信标探针、TaqMan探针、锁核酸探针、扣锁探针或蝎形探针。在一些情况中,探针包括扣锁探针。在一些情况中,探针是扣锁探针。
在一些情况中,探针包括与选自SEQ ID NO:1-18的探针约80%、85%、90%、95%或99%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-18的探针约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-18的探针约90%的序列同一性。在一些情况中,探针包括与选自SEQID NO:1-18的探针约91%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-18的探针约92%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-18的探针约93%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-18的探针约94%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-18的探针约95%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-18的探针约96%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-18的探针约97%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-18的探针约98%的序列同一性。在一些情况中,探针包括与选自SEQ IDNO:1-18的探针约99%的序列同一性。
在一些情况中,探针包括与选自SEQ ID NO:1-10的探针约80%、85%、90%、95%或99%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-10的探针约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-10的探针约90%的序列同一性。在一些情况中,探针包括与选自SEQID NO:1-10的探针约91%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-10的探针约92%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-10的探针约93%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-10的探针约94%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-10的探针约95%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-10的探针约96%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-10的探针约97%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:1-10的探针约98%的序列同一性。在一些情况中,探针包括与选自SEQ IDNO:1-10的探针约99%的序列同一性。
在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约80%、85%、90%、95%或99%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约90%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约91%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约92%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约93%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约94%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约95%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约96%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约97%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约98%的序列同一性。在一些情况中,探针包括与选自SEQ ID NO:11-18的探针约99%的序列同一性。
在一些情况中,治疗包括经导管动脉化学栓塞、射频消融或近距离放射治疗。
在一些情况中,治疗包括化学治疗剂或用于靶向疗法的剂。在一些情况中,化学治疗剂包括顺铂、多柔比星、氟嘧啶、吉西他滨、伊立替康、米托蒽醌、奥沙利铂、沙利度胺或其组合。在一些情况中,用于靶向疗法的剂包括阿西替尼、贝伐单抗、西妥昔单抗、埃罗替尼、雷莫芦单抗、瑞戈非尼、索拉非尼、舒尼替尼、胸苷激酶(TK)抑制剂或其组合。
在一些实施方案中,治疗包括手术。在一些情况中,手术包括治愈性切除。在其他情况中,手术包括肝移植。
在一些实施方案中,生物样品包括血液样品。
在一些情况中,生物样品包括组织的活组织检查样品。
在一些情况中,生物样品包括循环肿瘤细胞。
在一些情况中,受试者是人类。
确定受试者的预后或监测受试者的HCC或肺癌的进展
本文在一些实施方案中公开了包括确定患有HCC或肺癌的受试者的预后或监测受试者的HCC或肺癌的进展的方法。本文在一些实施方案中公开了确定患有肝细胞癌(HCC)的受试者的预后或监测受试者的HCC的进展的方法,所述方法包括:(a)用脱氨剂处理获得自受试者的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;(b)从经处理的DNA生成包括选自以下中的一种或更多种基因的甲基化谱:细胞因子信号传导抑制因子2(SOCS2)、上皮基质相互作用蛋白1(EPSTI1)、TIA1细胞毒性颗粒相关RNA结合蛋白(TIA1)、染色体4、染色体6、锌指及含SCAN结构域蛋白31(ZNF323)、叉头盒P4(FOXP4)和粒状转录因子2(grainyhead like transcription factor 2)(GRHL2);(c)基于一种或更多种基因的甲基化谱获得甲基化评分;以及(d)基于甲基化评分,启动第一治疗,如果受试者经历缓解则降低第一治疗剂的剂量,如果受试者经历复发则启动第二治疗,或者如果受试者变得对第一治疗剂是难治的则切换到第二治疗剂。
本文在一些实施方案中公开了确定患有肺癌的受试者的预后或监测受试者的肺癌的进展的方法,所述方法包括:(a)用脱氨剂处理获得自受试者的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;(b)从经处理的DNA生成包括选自以下的一种或更多种基因的甲基化谱:神经肽B/W受体1(NPBWR1)、染色体2、AP2相关激酶1(AAK1)、专一性家族BHLH转录因子1(single-minded family BHLH transcription factor 1)(SIM1)、C10orf46、C17orf101、含DEP结构域蛋白5(DEPDC5)、锌指及含SCAN结构域蛋白31(ZNF323)、γ-氨基丁酸A型受体α2亚基(GABRA2)、胎盘特异性8(PLAC8)和肾上腺素受体α2B(ADRA2B);(c)基于一种或更多种基因的甲基化谱获得甲基化评分;以及(d)基于甲基化评分,启动第一治疗,如果受试者经历缓解则降低第一治疗剂的剂量,如果受试者经历复发则启动第二治疗,或者如果受试者变得对第一治疗剂是难治的则切换到第二治疗剂。
本文在另外的实施方案中公开了确定患有肝细胞癌(HCC)的受试者的预后或监测受试者的HCC的进展的方法,所述方法包括:(a)用脱氨剂处理获得自受试者的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;(b)从经处理的DNA生成包括选自以下的一种或更多种基因的甲基化谱:SH3和PX结构域2A(SH3PXD2A)、C11orf9、PTPRF相互作用蛋白α1(PPFIA1)、染色体17:78、丝氨酸蛋白酶抑制剂家族B成员5(SERPINB5)、神经源性基因座Notch同源蛋白3(NOTCH3)、粒状转录因子2(GRHL2)和跨膜蛋白8B(TMEM8B);(c)基于一种或更多种基因的甲基化谱获得甲基化评分;以及(d)基于甲基化评分,启动第一治疗,如果受试者经历缓解则降低第一治疗剂的剂量,如果受试者经历复发则启动第二治疗,或者如果受试者变得对第一治疗剂是难治的则切换到第二治疗剂。
在一些情况中,使用甲基化评分来确定受试者的预后。在一些情况中,甲基化评分在本文中还被称为组合预后评分(cp评分)。在一些情况中,预后是指肝癌的可归因于癌症的死亡或进展,包括复发、转移性扩散和耐药性的可能性的预测。术语“预测”在本文中用于指受试者将对药物或药物集有利或不利响应的可能性,以及这些响应的程度,或者受试者在化学疗法后将存活一定时间段而没有癌症复发和/或随后的手术(例如,脾切除)的可能性。在一些情况中,使用甲基化评分来确定患有肝癌的受试者的预后。
在一些实施方案中,甲基化评分(或cp评分)与“良好”预后相关。在一些情况中,“良好”预后是指受试者将可能对药物或药物集有利响应,导致肝癌的完全或部分缓解或肝癌进展的降低和/或停止的可能性。在一些情况中,“良好”预后是指受试者存活至少1个月至至少90年。在一些情况中,“良好”预后是指受试者的存活,其中受试者在治疗后存活至少1个月至至少90年。在一些情况中,受试者的存活还指接受疗程的受试者相对于未接受相同疗程的受试者的增加的存活率(extended survival rate)。在一些情况中,“良好”预后是指接受疗程的受试者相对于未接受相同疗程的受试者的延长的存活时间。
在一些情况中,甲基化评分(或cp评分)与至少1个月至至少90年的存活相关。在一些情况中,约1.5至约4的甲基化评分表示存活至少2个月、4个月、6个月、8个月、10个月、1年、1.5年、2年、3年、4年、5年、10年、15年、20年、30年、50年或更长。
在一些实施方案中,甲基化评分(或cp评分)与“不良”预后相关。在一些情况中,“不良”预后是指受试者将可能对药物或药物集不利响应,导致白血病进展(例如,进展为转移性白血病)和/或对一种或更多种治疗剂是难治性的可能性。在一些情况中,“不良”预后是指受试者将不对药物或药物集响应,导致白血病进展的可能性。在一些情况中,“不良”预后是指受试者存活少于5年至少于1个月。在一些情况中,“不良”预后是指受试者的存活,其中受试者在治疗后存活少于5年至少于1个月。在一些情况中,“不良”预后还指受试者将发展对一种或更多种药物是难治性白血病的可能性。
在一些情况中,甲基化评分(或cp评分)与少于5年至少于1个月的存活相关。在一些情况中,少于1.5的甲基化评分表示少于5年、4年、3年、2年、1.5年、1年、10个月、8个月、6个月、4个月或2个月的存活。
在一些实施方案中,甲基化评分是例如基于存活分析的模型来计算的。在一些情况中,存活分析是用于分析直到一种或更多种感兴趣的事件发生的期望的持续时间的统计分析。在一些情况中,存活分析包括Cox比例风险(PH)回归分析、时序检验或乘积极限估计量。在一些情况中,甲基化评分基于Cox比例风险(PH)回归分析、时序检验或乘积极限估计量来计算。在一些情况中,甲基化评分基于Cox比例风险(PH)回归分析来计算。在一些实施方案中,甲基化评分还基于时序检验来计算。在一些情况中,时序检验是比较两个样本(例如,训练集和验证集)的存活分布的假设检验。在一些情况中,时序检验也被称为Mantel-Cox检验或时间分层的Cochran-Mantel-Haenszel检验。在一些情况中,甲基化评分基于乘积极限估计量来另外计算。乘积极限估计量(也称为Kaplan-Meier估计量)是用于从寿命数据估计存活函数的非参数统计。在一些实施方案中,甲基化评分最初基于Cox比例风险(PH)回归分析来计算,并且然后用时序检验来重新处理。
检测方法
在一些实施方案中,在将受试者鉴定为患有肝癌、确定肝癌亚型、患有肝癌的受试者的预后、以及在治疗剂的存在下受试者的肝癌的进展或消退中,使用了许多方法来测量、检测、确定、鉴定及表征基因或生物标志物(例如,含CpG岛的区域/片段)的甲基化状态/水平。
在一些情况中,甲基化谱从分离自个体的生物样品生成。在一些实施方案中,生物样品是活组织检查。在一些情况中,生物样品是组织样品。在一些情况中,生物样品是组织的活组织检查样品。在一些情况中,生物样品是血液样品。在其他情况中,生物样品是无细胞生物样品。在其他情况中,生物样品是循环肿瘤DNA样品。在一个实施方案中,生物样品是包含循环肿瘤DNA的无细胞生物样品。
在一些实施方案中,生物标志物(或表观遗传标志物)从液体样品获得。在一些实施方案中,液体样品包括血液和生物来源的其他液体样品(包括但不限于,外周血液、血清、血浆、腹水、尿液、脑脊液(CSF)、痰、唾液、骨髓、滑液、房水、羊水、耳垢、母乳、支气管肺泡灌洗液、精液、前列腺液、考珀液或预射精液、女性喷射液、汗液、泪液、囊液、胸膜液和腹膜液、心包液、腹水、淋巴液、食糜、乳糜、胆汁、间质液、月经、脓、皮脂、呕吐物、阴道分泌物/冲洗液、滑液、粘膜分泌物、粪便水、胰液、来自窦腔的灌洗液、支气管肺抽吸物、囊胚腔液(blastocyl cavity fluid)、或脐带血)。在一些实施方案中,生物液体是血液、血液衍生物或血液级分,例如,血清或血浆。在具体实施方案中,样品包括血液样品。在另一个实施方案中,使用血清样品。在另一个实施方案中,样品包括尿液。在一些实施方案中,液体样品还包括在获得后已经以任何方式操作的样品,诸如通过离心、过滤、沉淀、透析、层析、用试剂处理、洗涤或富集某些细胞群体。
在一些实施方案中,生物标志物(或表观遗传标志物)从组织样品获得。在一些情况下,组织对应于任何细胞。不同类型的组织对应于不同类型的细胞(例如,肝、肺、血液、结缔组织等),但也对应于健康细胞与肿瘤细胞或处于不同肿瘤形成期的肿瘤细胞,或移位的恶性肿瘤细胞。在一些实施方案中,组织样品还包括临床样品,并且还包括培养物中的细胞、细胞上清液、器官等。样品还包括新鲜冷冻和/或福尔马林固定的石蜡包埋的组织块,诸如从临床或病理活组织检查制备的块、制备用于病理分析或通过免疫组织化学研究的块。
在一些实施方案中,生物标志物(或表观遗传标志物)在正常样品(例如,没有疾病的正常或对照组织、或者正常体液或对照体液、粪便、血液、血清、羊水)中是甲基化的或非甲基化的,最重要的在健康粪便、血液、血清、羊水或其他体液中是甲基化的或非甲基化的。在其他实施方案中,生物标志物(或表观遗传标志物)在来自患有疾病(例如,本文描述的一种或更多种适应症)或处于疾病(例如,本文描述的一种或更多种适应症)风险的患者的样品中是低甲基化的或超甲基化的;例如,与正常样品相比,甲基化频率(分别)降低了或增加了至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。在一个实施方案中,与患有疾病(例如,本文描述的一种或更多种适应症)或处于疾病(例如,本文描述的一种或更多种适应症)风险的同一患者的先前获得的样品分析相比,特别是比较疾病的进展,样品也是低甲基化的或超甲基化的。
在一些实施方案中,甲基化组(methylome)包括表观遗传标志物集或生物标志物集,诸如上文描述的生物标志物。在一些情况中,将对应于生物体(例如,人类)的肿瘤的甲基化组的甲基化组分类为肿瘤甲基化组。在一些情况中,肿瘤甲基化组使用肿瘤组织或生物样品中的无细胞(或无蛋白)肿瘤DNA确定。感兴趣的甲基化组的其他实例包括将DNA贡献到体液中的器官的甲基化组(例如,组织诸如脑、乳房、肺、前列腺和肾、血浆等的甲基化组)。
在一些实施方案中,血浆甲基化组是从动物(例如,人类)的血浆或血清确定的甲基化组。在一些情况中,血浆甲基化组是无细胞甲基化组或无蛋白甲基化组的实例,因为血浆和血清包含无细胞DNA(cell-free DNA)。血浆甲基化组也是混合甲基化组的实例,因为它是肿瘤甲基化组和其它感兴趣的甲基化组的混合物。在一些情况中,尿液甲基化组从受试者的尿液样品确定。在一些情况中,细胞甲基化组对应于从患者的细胞(例如,血细胞)确定的甲基化组。血细胞的甲基化组被称为血细胞甲基化组(或血液甲基化组)。
在一些实施方案中,DNA(例如,基因组DNA,诸如提取的基因组DNA或经处理的基因组DNA)通过本领域的任何标准手段、包括使用商购可得的试剂盒分离。简言之,在感兴趣的DNA被包封在细胞膜内的情况下,生物样品通过酶促、化学或机械手段被破坏及裂解。在一些情况中,然后例如通过用蛋白酶K消化来使DNA溶液清除蛋白和其他污染物。然后将DNA从溶液中回收。在这种情况中,这通过多种方法的方式来进行,包括盐析、有机提取或使DNA结合至固相支持物。在一些情况中,方法的选择受若干因素的影响,包括时间、费用和需要的DNA的量。
在样品DNA未被包封在膜内的情况下(例如,来自无细胞样品诸如血液或尿液的循环DNA),任选地采用本领域中用于分离和/或纯化DNA的标准方法(参见例如,Bettegowda等人,Detection of Circulating Tumor DNA in Early-and Late-Stage HumanMalignancies.Sci.Transl.Med,6(224):ra24.2014)。这样的方法包括使用蛋白变性试剂,例如离液盐,例如盐酸胍或尿素;或去垢剂,例如十二烷基硫酸钠(SDS)、溴化氰。可选的方法包括但不限于乙醇沉淀或丙醇沉淀、真空浓缩,除其他外,通过离心机的手段。在一些情况中,本领域技术人员还使用装置,诸如过滤装置,例如超滤、二氧化硅表面或膜、磁性颗粒、聚苯乙烯颗粒、聚苯乙烯表面、带正电荷的表面和带正电荷的膜、带电荷的膜、带电荷的表面、带电荷的转换膜、带电荷的转换表面。
在一些情况中,在核酸已经被提取后,甲基化分析通过本领域已知的任何手段进行。各种甲基化分析程序是本领域中已知的,并且可以被用于实践本文公开的方法。这些分析允许确定组织样品内的一个或多于一个CpG位点的甲基化状态。另外,这些方法可以被用于甲基化核酸的绝对定量或相对定量。除其他技术外,这样的甲基化测定包括两个主要步骤。第一步骤是甲基化特异性反应或分离,诸如(i)亚硫酸氢盐处理,(ii)甲基化特异性结合,或(iii)甲基化特异性限制酶。第二主要步骤包括(i)扩增及检测,或(ii)通过各种方法直接检测,诸如(a)PCR(序列特异性扩增),诸如Taqman(R),(b)未经处理的DNA和经亚硫酸氢盐处理的DNA的测序,(c)通过连接染料修饰的探针(包括循环连接和裂解)测序,(d)焦磷酸测序,(e)单分子测序,(f)质谱术,或(g)Southern印迹分析。
另外,可以使用从亚硫酸氢盐转化的DNA扩增的PCR产物的限制酶消化,例如,由Sadri和Hornsby描述的方法(1996,Nucl.Acids Res.24:5058-5059),或COBRA(联合亚硫酸氢盐限制性分析)(Xiong和Laird,1997,Nucleic Acids Res.25:2532-2534)。COBRA分析是定量性甲基化测定,可用于确定少量基因组DNA中特定基因座处的DNA甲基化水平。简言之,限制酶消化被用于揭示经亚硫酸氢钠处理的DNA的PCR产物中的甲基化依赖性序列差异。甲基化依赖性序列差异首先根据Frommer等人描述的程序(Frommer等人,1992,Proc.Nat.Acad.Sci.USA,89,1827-1831)通过标准亚硫酸氢盐处理来引入到基因组DNA中。然后亚硫酸氢盐转化的DNA的PCR扩增使用对感兴趣的CpG位点特异性的引物进行,随后为限制性内切酶消化、凝胶电泳、和使用特异性的标记的杂交探针检测。原始DNA样品中的甲基化水平以遍及广泛(wide spectrum)的DNA甲基化水平的线性定量的方式通过消化的和未消化的PCR产物的相对的量表示。另外,该技术可以被可靠地应用于从显微切片的(micro-dissected)石蜡包埋的组织样品获得的DNA。用于COBRA分析的典型试剂(例如,如可能在典型的基于COBRA的试剂盒中发现的试剂)可以包括但不限于:针对特定基因(或甲基化改变的DNA序列或CpG岛)的PCR引物、限制酶和适当的缓冲液、基因杂交寡核苷酸、对照杂交寡核苷酸、用于寡核苷酸探针的激酶标记试剂盒和放射性核苷酸。另外,亚硫酸氢盐转化试剂可以包括:DNA变性缓冲液、磺化缓冲液、DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱)、脱磺酸基缓冲液、和DNA回收组分(component)。
在一个实施方案中,选择的CpG位点的甲基化谱使用甲基化特异性PCR(MSP)确定。MSP允许评估CpG岛内的CpG位点的几乎任何组的甲基化状态,不依赖于甲基化敏感性限制酶的使用(Herman等人,1996,Proc.Nat.Acad.Sci.USA,93,9821-9826;美国专利第5,786,146号、第6,017,704号、第6,200,756号、第6,265,171号(Herman和Baylin);美国专利公布第2010/0144836号(Van Engeland等人);其通过引用以其整体并入)。简言之,将DNA被脱氨剂诸如亚硫酸氢钠修饰,以将未甲基化的胞嘧啶而非甲基化的胞嘧啶转化为尿嘧啶,并且随后用相比于未甲基化的DNA对甲基化的DNA特异性的引物来扩增。在一些情况中,用于MSP分析的典型试剂(例如,如可能在典型的基于MSP的试剂盒中发现的试剂)包括但不限于:针对特定基因(或甲基化改变的DNA序列或CpG岛)的甲基化和未甲基化的PCR引物、优化的PCR缓冲液和脱氧核苷酸以及特异性探针。人们可以使用如Fackler等人描述的定量多重甲基化特异性PCR(QM-PCR)。Fackler等人,2004,Cancer Res.64(13)4442-4452;或Fackler等人,2006,Clin.Cancer Res.12(11Pt 1)3306-3310。
在实施方案中,选择的CpG位点的甲基化谱使用MethyLight和/或重甲基方法(Heavy Methyl Methods)确定。MethyLight和重甲基测定是高通量定量甲基化测定,该测定使用基于荧光的实时PCR(Taq Man(R))技术,在PCR步骤后不需要另外操作(Eads,C.A.等人,2000,Nucleic Acid Res.28,e 32;Cottrell等人,2007,J.Urology 177,1753;美国专利第6,331,393号(Laird等人),其内容通过引用以其整体并入)。简言之,MethyLight方法以基因组DNA的混合样品开始,将该样品根据标准程序在亚硫酸氢钠反应中转化为甲基化依赖性序列差异的混合汇集物(亚硫酸氢盐方法将未甲基化的胞嘧啶残基转化为尿嘧啶)。然后,基于荧光的PCR以“无偏倚”(用不与已知CpG甲基化位点重叠的引物)PCR反应进行,或者以“偏倚”(用与已知CpG二核苷酸重叠的PCR引物)反应进行。在一些情况中,序列区别(sequence discrimination)在扩增过程的水平或在荧光检测过程的水平或两者发生。在一些情况中,MethyLight测定被用作基因组DNA样品中甲基化模式的定量测试,其中序列区别在探针杂交的水平发生。在这种定量形式中,PCR反应在与特定的推定甲基化位点重叠的荧光探针的存在下提供无偏倚扩增。输入DNA的量的无偏倚对照通过其中引物和探针都不覆盖任何CpG二核苷酸的反应提供。可选择地,基因组甲基化的定性测试通过用不“覆盖”已知甲基化位点的对照寡核苷酸(基于荧光的形式的“MSP”技术)或用覆盖潜在的甲基化位点的寡核苷酸探测偏倚的PCR汇集物实现。用于MethyLight分析的典型试剂(例如,如可能在典型的基于MethyLight的试剂盒中发现的试剂)可以包括但不限于:针对特定基因(或甲基化改变的DNA序列或CpG岛)的PCR引物、TaqMan(R)探针、优化的PCR缓冲液和脱氧核苷酸和Taq聚合酶。
定量MethyLight使用亚硫酸氢盐以转化基因组DNA,并且甲基化位点使用PCR用不依赖于甲基化的引物扩增。对甲基化的位点和未甲基化的位点特异性的具有两种不同荧光团的检测探针提供了甲基化的同时定量测量。重甲基技术以硫酸氢盐转化DNA开始。接下来的特异性阻断剂防止未甲基化的DNA的扩增。甲基化的基因组DNA不结合阻断剂,并且它们的序列将被扩增。扩增的序列用甲基化特异性探针检测。(Cottrell等人,2004,Nuc.AcidsRes.32:e10,其内容通过引用以其整体并入)。
Ms-SNuPE技术是基于亚硫酸氢盐处理DNA,随后为单核苷酸引物延伸的用于评估特定CpG位点处的甲基化差异的定量方法(Gonzalgo和Jones,1997,Nucleic AcidsRes.25,2529-2531)。简言之,基因组DNA与亚硫酸氢钠反应,以将未甲基化的胞嘧啶转化为尿嘧啶,同时保持5-甲基胞嘧啶不变。然后期望的靶序列的扩增使用对亚硫酸氢盐转化的DNA特异性的PCR引物进行,并且将所得产物分离并用作感兴趣的CpG位点处的甲基化分析的模板。在一些情况中,分析了少量的DNA(例如,显微切片的病理切片),并且该方法避免使用用于确定CpG位点处的甲基化状态的限制酶。用于Ms-SNuPE分析的典型试剂(例如,如在典型的基于Ms-SNuPE的试剂盒中发现的试剂)包括但不限于:针对特定基因(或甲基化改变的DNA序列或CpG岛)的PCR引物、优化的PCR缓冲液和脱氧核苷酸、凝胶提取试剂盒、阳性对照引物、针对特定基因的Ms-SNuPE引物、反应缓冲液(用于Ms-SNuPE反应)和放射性核苷酸。另外,亚硫酸氢盐转化试剂可以包括:DNA变性缓冲液、磺化缓冲液、DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱)、脱磺酸基缓冲液和DNA回收组分。
在另一个实施方案中,选择的CpG位点的甲基化状态使用基于差异性结合的甲基化检测方法来确定。为了鉴定差异性甲基化区域,一种方法是捕获甲基化的DNA。这种方法使用其中MBD2的甲基结合结构域融合至抗体的Fc片段的蛋白(MBD-FC)(Gebhard等人,2006,Cancer Res.66:6118-6128;和PCT公布第WO 2006/056480A2号(Relhi),其内容通过引用以其整体并入)。这种融合蛋白比传统甲基化特异性抗体具有若干优点。MBD-FC对甲基化的DNA具有更高的亲和力,且MBD-FC结合双链DNA。最重要的是,两种蛋白结合DNA的方式不同。甲基化特异性抗体随机(stochastically)结合DNA,这意味着仅可以获得二元答案。在另一方面,MBD-FC的甲基结合结构域结合DNA分子,不论其甲基化状态。这种蛋白-DNA相互作用的强度由DNA甲基化水平决定。结合基因组DNA后,具有增加的盐浓度的洗脱溶液可以被用于将非甲基化的DNA和甲基化的DNA分级,允许更受控的分离(Gebhard等人,2006,Nucleic Acids Res.34:e82)。因此,这种被称为甲基-CpG免疫沉淀(MCIP)的方法不仅富集了基因组DNA,而且还根据甲基化水平对基因组DNA进行分级,这在还应该研究未甲基化的DNA级分时特别有益。
在可选择的实施方案中,5-甲基胞苷抗体结合并沉淀甲基化的DNA。抗体可从Abeam(Cambridge,MA)、Diagenode(Sparta,NJ)或Eurogentec(c/o AnaSpec,Fremont,CA)获得。在甲基化片段已经被分离后,它们可以使用基于微阵列的技术诸如甲基化的CpG岛回收测定(MIRA)或甲基化的DNA免疫沉淀(MeDIP)来测序(Pelizzola等人,2008,GenomeRes.18,1652-1659;O’Geen等人,2006,BioTechniques 41(5),577-580,Weber等人,2005,Nat.Genet.37,853-862;Horak和Snyder,2002,Methods Enzymol,350,469-83;Lieb,2003,Methods Mol Biol,224,99-109)。另一种技术是甲基-CpG结合结构域柱/部分解链的分子的分离(MBD/SPM,Shiraishi等人,1999,Proc.Natl.Acad.Sci.USA 96(6):2913-2918)。
在一些实施方案中,用于检测甲基化的方法包括随机剪切或随机片段化基因组DNA,用甲基化依赖性或甲基化敏感性限制酶切割DNA,并且随后选择性鉴定和/或分析切割或未切割的DNA。选择性鉴定可以包括,例如,分离切割和未切割的DNA(例如,通过大小),并量化被切割或可选择地未切割的感兴趣的序列。参见例如,美国专利第7,186,512号。可选择地,该方法可以包括在限制酶消化后扩增完整DNA,从而仅扩增在扩增区域中未被限制酶裂解的DNA。参见例如,美国专利第7,910,296号、第7,901,880号和第7,459,274号。在一些实施方案中,扩增可以使用基因特异性引物来进行。
例如,存在甲基敏感性酶,如果其DNA识别序列是非甲基化的,则优先或基本上在其DNA识别序列处裂解或消化。因此,未甲基化的DNA样品比甲基化的DNA样品被切割成更小的片段。相似地,超甲基化的DNA样品不被裂解。相比之下,存在仅在其DNA识别序列被甲基化时,才在其DNA识别序列处裂解的甲基敏感性酶。适用于在该技术的方法中使用的消化未甲基化的DNA的甲基敏感性酶包括但不限于HpalI、HhaI、MaelI、BstUI和AciI。在一些情况中,使用的酶是仅切割未甲基化的序列CCGG的HpalI。在其他情况中,使用的另一种酶是仅切割未甲基化的序列GCGC的HhaI。两种酶均可从New England BioLabs(R),Inc.获得。还使用了两种或更多种仅消化未甲基化的DNA的甲基敏感性酶的组合。仅消化甲基化的DNA的合适的酶包括但不限于DpnI和McrBC,Dpnl仅在完全甲基化的5'-GATC序列处切割,MCrBC是内切核酸酶,其切割包含修饰的胞嘧啶(5-甲基胞嘧啶或5-羟甲基胞嘧啶或N4-甲基胞嘧啶)的DNA,并在识别位点5'...PumC(N4o-3ooo)PumC...3'处切割(New England BioLabs,Inc.,Beverly,MA)。用于选择的限制酶在特定位点处切割DNA的裂解方法和程序是本领域技术人员熟知的。例如,许多限制酶的供应商提供关于特定限制酶切割的DNA序列的条件和类型的信息,包括New England BioLabs、Pro-Mega Biochems、Boehringer-Mannheim等。Sambrook等人(参见Sambrook等人,Molecular Biology:A Laboratory Approach,ColdSpring Harbor,N.Y.1989)提供了使用限制酶和其他酶的方法的一般描述。
在一些情况中,甲基化依赖性限制酶是在甲基化识别序列处或甲基化识别序列附近裂解或消化DNA、但是当识别序列未甲基化时不在同一序列处或同一序列附近裂解DNA的限制酶。甲基化依赖性限制酶包括在甲基化识别序列处切割的那些(例如,DpnI)和在识别序列附近的序列但不在识别序列处切割的酶(例如,McrBC)。例如,McrBC的识别序列是5'RmC(N40-3000)RmC 3',其中“R”是嘌呤,并且“mC”是甲基化胞嘧啶,并且“N40-3000”表示观察到限制性事件的两个RmC半位点之间的距离。McrBC通常接近一个半位点或另一个半位点切割,但是裂解位置通常分布于距甲基化的碱基约30个碱基对的若干个碱基对上。McrBC有时切割两个半位点的3',有时切割两个半位点的5',并且有时在两个位点之间切割。示例性甲基化依赖性限制酶包括例如,McrBC、McrA、MrrA、BisI、GlaI和DpnI。本领域技术人员将理解,任何甲基化依赖性限制酶,包括本文描述的限制酶的同源物和直系同源物,也适用于以本文描述的一种或更多种方法使用。
在一些情况中,甲基化敏感性限制酶是在未甲基化的识别序列处或未甲基化的识别序列附近裂解DNA、但是当识别序列被甲基化时不在同一序列处或同一序列附近裂解的限制酶。示例性甲基化敏感性限制酶在例如McClelland等人,22(17)NUCLEIC ACIDSRES.3640-59(1994)中描述。当识别序列内的胞嘧啶在位置C5处被甲基化时,在其识别序列处或其识别序列附近不裂解DNA的合适的甲基化敏感性限制酶包括例如Aat II、Aci I、AcdI、Age I、Alu I、Asc I、Ase I、AsiS I、Bbe I、BsaA I、BsaH I、BsiE I、BsiW I、BsrF I、BssH II、BssK I、BstB I、BstN I、BstU I、Cla I、Eae I、Eag I、Fau I、Fse I、Hha I、HinPlI、HinC II、Hpa II、Hpy99I、HpyCH4IV、Kas I、Mbo I、Mlu I、MapAl I、Msp I、Nae I、Nar I、Not I、Pml I、Pst I、Pvu I、Rsr II、Sac II、Sap I、Sau3A I、Sfl I、Sfo I、SgrA I、Sma I、SnaB I、Tsc I、Xma I和Zra I。当识别序列内的腺苷在位置N6处被甲基化时,在其识别序列处或其识别序列附近不裂解DNA的合适的甲基化敏感性限制酶包括例如Mbo I。本领域技术人员将理解,任何甲基化敏感性限制酶,包括本文描述的限制酶的同源物和直系同源物,也适用于以本文描述的一种或更多种方法使用。本领域技术人员还将理解,在其识别序列处或其识别序列附近的胞嘧啶甲基化的存在下不能切割的甲基化敏感性限制酶可能对在其识别序列处或其识别序列附近的腺苷的甲基化的存在不敏感。同样,在其识别序列处或其识别序列附近的腺苷的甲基化的存在下不能切割的甲基化敏感性限制酶可能对在其识别序列处或其识别序列附近的胞嘧啶的甲基化的存在不敏感。例如,Sau3AI对在其识别序列处或其识别序列附近的甲基化的胞嘧啶的存在敏感(即不能切割),但对在其识别序列处或其识别序列附近的甲基化的腺苷的存在不敏感(即切割)。本领域技术人员还将理解,一些甲基化敏感性限制酶被包含其识别序列的DNA的一条或两条链上的碱基的甲基化阻断,而其他甲基化敏感性限制酶仅被两条链上的甲基化阻断,但是如果识别位点是半甲基化的,则可以切割。
在可选择的实施方案中,任选地将衔接子添加至随机片段化的DNA的末端,然后将DNA用甲基化依赖性限制酶或甲基化敏感性限制酶消化,并且随后将完整DNA使用与衔接子序列杂交的引物扩增。在这种情况中,进行第二步骤以确定在扩增的DNA汇集物中特定基因的存在、缺失或量。在一些实施方案中,使用实时、定量PCR扩增DNA。
在其他实施方案中,该方法包括量化基因组DNA的群体内的靶序列的平均甲基化密度。在一些实施方案中,该方法包括在允许基因座中的潜在限制酶裂解位点的至少一些拷贝保持未被裂解的条件下,使基因组DNA与甲基化依赖性限制酶或甲基化敏感性限制酶接触;量化基因座的完整拷贝;并比较扩增产物的量与表示对照DNA的甲基化的量的对照值,从而量化与对照DNA的甲基化密度相比的基因座中的平均甲基化密度。
在一些情况中,DNA的基因座甲基化的量通过以下步骤确定:提供包含基因座的基因组DNA的样品,将DNA用甲基化敏感性限制酶或甲基化依赖性限制酶裂解,并且然后量化完整DNA的量或量化感兴趣的DNA基因座处的切割的DNA的量。完整或切割的DNA的量将取决于包含基因座的基因组DNA的初始量、基因座中的甲基化的量、以及基因组DNA中甲基化的基因座中的核苷酸的数目(即,分数)。DNA基因座中的甲基化的量可以通过将完整DNA或切割的DNA的量与表示相似处理的DNA样品中的完整DNA或切割的DNA的量的对照值进行比较来确定。对照值可以表示已知或预测的甲基化核苷酸的数目。可选择地,对照值可以表示来自另一个(例如正常的、未患病的)细胞或第二基因座的相同位点的完整DNA或切割的DNA的量。
通过在允许基因座中的潜在限制酶裂解位点的至少一些拷贝保持未被裂解的条件下,使用至少一种甲基化敏感性限制酶或甲基化依赖性限制酶,并且随后量化剩余的完整拷贝并将该量与对照进行比较,可以确定基因座的平均甲基化密度。如果使甲基化敏感性限制酶与DNA基因座的拷贝在允许基因座中的潜在限制酶裂解位点的至少一些拷贝保持未被裂解的条件下接触,那么剩余的完整DNA将与甲基化密度成正比,并且因此可以与对照比较,以确定样品中的基因座的相对甲基化密度。相似地,如果使甲基化依赖性限制酶与DNA基因座的拷贝在允许基因座中的潜在限制酶裂解位点的至少一些拷贝保持未被裂解的条件下接触,那么剩余的完整DNA将与甲基化密度成反比,并且因此可以与对照比较,以确定样品中的基因座的相对甲基化密度。这样的测定在例如美国专利第7,910,296号中公开。
甲基化CpG岛扩增(MCA)技术是可以被用于筛选基因组DNA中的改变的甲基化模式,并分离与这些改变相关的特定序列的方法(Toyota等人,1999,Cancer Res.59,2307-2312;美国专利第7,700,324号(Issa等人),其内容通过引用以其整体并入)。简言之,在任意引发的PCR扩增之前,使用对其识别位点中的胞嘧啶甲基化具有不同敏感性的限制酶来消化来自原发肿瘤、细胞系和正常组织的基因组DNA。在高分辨率聚丙烯酰胺凝胶上解析PCR产物后,对显示出差异性甲基化的片段进行克隆及测序。然后将克隆的片段用作Southern分析的探针,以确认这些区域的差异性甲基化。用于MCA分析的典型试剂(例如,如可能在典型的基于MCA的试剂盒中发现的试剂)可以包括但不限于:用于任意引发基因组DNA的PCR引物、PCR缓冲液和核苷酸、限制酶和适当的缓冲液、基因杂交寡核苷酸或探针、对照杂交寡核苷酸或探针。
另外的甲基化检测方法包括在例如,美国专利第7,553,627号;第6,331,393号;美国专利序列第12/476,981号;美国专利公布第2005/0069879号;Rein等人,26(10)NUCLEICACIDS RES.2255-64(1998);和Olek等人,17(3)NAT.GENET.275-6(1997)中描述的那些方法。
在另一个实施方案中,选择的CpG位点的甲基化状态使用甲基化敏感性高分辨率熔解(High Resolution Melting,HRM)来确定。最近,Wojdacz等人报导了甲基化敏感的高分辨率熔解作为评估甲基化的技术。(Wojdacz和Dobrovic,2007,Nuc.Acids Res.35(6)e41;Wojdacz等人,2008,Nat.Prot.3(12)1903-1908;Balic等人,2009J.Mol.Diagn.11102-108;和美国专利公布第2009/0155791号(Wojdacz等人),其内容通过引用以其整体并入)。多种商业上可获得的实时PCR仪具有HRM系统,包括Roche LightCycler480、CorbettResearch RotorGene6000和Applied Biosystems 7500。HRM还可以与其他扩增技术诸如焦磷酸测序组合,如由Candiloro等人描述的(Candiloro等人,2011,Epigenetics 6(4)500-507)。
在另一个实施方案中,选择的CpG位点的甲基化状态使用引物延伸测定确定,包括产生用于使用质谱术分析的扩增靶的优化的PCR扩增反应。测定还可以以多重方式进行。质谱术是用于检测与差异性甲基化的调控元件相关的多核苷酸的特别有效的方法。多核苷酸序列的存在通过比较检测到的信号的质量与感兴趣的多核苷酸的预期质量来验证。特定多核苷酸序列的相对信号强度,例如谱上的质量峰,指示特定等位基因的相对群体,因此能够从数据直接计算等位基因比率。这种方法在PCT公布第WO 2005/012578A1号(Beaulieu等人)中详细描述,其通过引用以其整体并入。对于甲基化分析,可以采用该测定来检测亚硫酸氢盐引入的甲基化依赖性C至T序列改变。这些方法对于在单个孔中进行多重扩增反应和多重引物延伸反应(例如,多重均质引物大规模延伸(hME)测定)特别有用,以进一步增加通量并减少引物延伸反应的每次反应的成本。
用于DNA甲基化分析的其他方法包括限制性标记基因组扫描(RLGS,Costello等人,2002,Meth.Mol Biol,200,53-70)、甲基化敏感性代表性差异分析(MS-RDA,Ushijima和Yamashita,2009,Methods Mol Biol 507,117-130)。相对甲基化综合高通量阵列(comprehensive high-throughput arrays for relative methylation)(CHARM)技术在WO 2009/021141(Feinberg和Irizarry)中描述。Roche(R)NimbleGen(R)微阵列包括芯片上染色质免疫沉淀(Chromatin Immunoprecipitation-on-chip,ChIP-芯片)或芯片上甲基化DNA免疫沉淀(methylated DNA immunoprecipitation-on-chip,MeDIP-芯片)。这些工具已经被用于各种癌症应用,包括黑素瘤、肝癌和肺癌(Koga等人,2009,Genome Res.,19,1462-1470;Acevedo等人,2008,Cancer Res.,68,2641-2651;Rauch等人,2008,Proc.Nat.Acad.Sci.USA,105,252-257)。其他文献已经报导了用于甲基化的高通量检测的硫酸氢盐转化、扣锁探针杂交、环化、扩增和下一代或多重测序(Deng等人,2009,Nat.Biotechnol 27,353-360;Ball等人,2009,Nat.Biotechnol 27,361-368;美国专利第7,611,869号(Fan))。作为硫酸氢盐氧化的替代物,Bayeyt等人已经报导了氧化5-甲基胞嘧啶,而不与胸苷反应的选择性氧化剂,其随后为PCR或焦磷酸测序(WO 2009/049916(Bayeyt等人))。这些技术的这些参考文献通过引用以其整体并入。
在一些情况中,在限制性消化后,定量扩增方法(例如,定量PCR或定量线性扩增)被用于量化侧接扩增引物的基因座内的完整DNA的量。定量扩增的方法在例如美国专利第6,180,349号;第6,033,854号和第5,972,602号,以及在例如DeGraves等人,34(1)BIOTECHNIQUES 106-15(2003);Deiman B等人,20(2)MOL.BIOTECHNOL.163-79(2002);和Gibson等人,6GENOME RESEARCH 995-1001(1996)中公开。
在一些情况中,使核酸以甲基化特异性方式反应或分离后,使核酸经受基于序列的分析。例如,在确定来自样品的一个特定基因组序列与其对应序列相比是超甲基化或低甲基化的之后,可以确定该基因组序列的量。随后,可以将该量与标准对照值比较,并用于确定样品中肝癌的存在。在许多情况中,期望使用本领域熟知的若干核酸扩增程序中的任一种来扩增核酸序列。具体地,核酸扩增是包含与被扩增的核酸序列(模板)互补的序列的核酸拷贝的化学或酶促合成。本方法和试剂盒可以使用本领域技术人员已知的任何核酸扩增或检测方法,诸如在美国专利第5,525,462号(Takarada等人);第6,114,117号(Hepp等人);第6,127,120号(Graham等人);第6,344,317号(Urnovitz);第6,448,001号(Oku);第6,528,632号(Catanzariti等人);和PCT公布第WO 2005/111209号(Nakajima等人)中描述的那些;所有这些通过引用以其整体并入本文。
在一些实施方案中,通过使用本领域技术人员已知的方法的PCR扩增来扩增核酸。然而,本领域技术人员将认识到,扩增可以通过任何已知的方法实现,诸如连接酶链式反应(LCR)、Q-复制物扩增、滚环扩增、转录扩增、自持的序列复制(self-sustained sequencereplication)、基于核酸序列的扩增(NASBA),其每种均提供足够的扩增。支链DNA技术也被任选地用于定性地证明代表特定甲基化模式的技术的序列的存在,或者定量地确定样品中该特定基因组序列的量。Nolte评述了支链DNA信号扩增用于直接量化临床样品中的核酸序列(Nolte,1998,Adv.Clin.Chem.33:201-235)。
PCR方法是本领域熟知的,并且包括例如,逆转录PCR、连接介导的PCR、数字PCR(dPCR)或液滴数字PCR(ddPCR)。对于PCR方法和方案的综述,参见例如Innis等人编辑,PCRProtocols,A Guide to Methods and Application,Academic Press,Inc.,San Diego,Calif.1990;美国专利第4,683,202号(Mullis)。PCR试剂和方案也可从商业供应商获得,诸如Roche Molecular Systems。在一些情况中,PCR用热稳定的酶以自动化方法进行。在该方法中,反应混合物的温度通过变性区、引物退火区和延伸反应区自动循环。特别适用于这个目的的仪器是商购可得的。
在一些实施方案中,扩增序列也使用侵入性裂解反应来测量,诸如Invader(R)技术(Zou等人,2010,2010年7月28日的Association of Clinical Chemistry(AACC)海报展示,“Sensitive Quantification of Methylated Markers with a Novel MethylationSpecific Technology”;和美国专利第7,011,944号(Prudent等人))。
合适的下一代测序技术可广泛获得。实例包括454Life Sciences平台(Roche,Branford,CT)(Margulies等人,2005Nature,437,376-380);Illumina的基因组分析仪,GoldenGate甲基化测定,或Infinium甲基化测定,即Infinium HumanMethylation 27KBeadArray或VeraCode GoldenGate甲基化阵列(Illumina,San Diego,CA;Bibkova等人,2006,Genome Res.16,383-393;美国专利第6,306,597号和第7,598,035号(Macevicz)、第7,232,656号(Balasubramanian等人));来自Bio-Rad的QX200TM Droplet DigitalTM PCR系统;或通过连接的DNA测序,SOLiD系统(Applied Biosystems/Life Technologies;美国专利第6,797,470号、第7,083,917号、第7,166,434号、第7,320,865号、第7,332,285号、第7,364,858号和第7,429,453号(Barany等人));Helicos True单分子DNA测序技术(Harris等人,2008Science,320,106-109;美国专利第7,037,687号和第7,645,596号(Williams等人)、第7,169,560号(Lapidus等人)、第7,769,400号(Harris));Pacific Biosciences的单分子实时(SMRTTM)技术及测序(Soni和Meller,2007,Clin.Chem.,1996-2001);半导体测序(Ion Torrent;Personal Genome Machine);DNA纳米球测序;使用来自Dover Systems(Polonator)的技术的测序,以及在测序之前不需要扩增或以其他方式转化天然DNA的技术(例如,Pacific Biosciences和Helicos),诸如基于纳米孔的策略(例如,OxfordNanopore、Genia Technologies和Nabsys)。这些系统允许对从样品分离的许多核酸分子以并行方式以高多重化量级测序。这些平台中的每一种均允许对核酸片段的克隆扩增或非扩增的单个分子进行测序。某些平台包括例如,(i)通过连接染料修饰的探针来测序(包括循环连接和裂解),(ii)焦磷酸测序,和(iii)单分子测序。
焦磷酸测序是基于合成测序的核酸测序方法,其依赖于检测核苷酸掺入时释放的焦磷酸。通常,合成测序包括一次一个核苷酸地合成与正在研究其序列的链互补的DNA链。可以将研究核酸固定至固体支持物,与测序引物杂交,与DNA聚合酶、ATP硫酸化酶、萤光素酶、腺苷三磷酸双磷酸酶、腺苷5'磷酸硫酸酯和萤光素一起孵育。依次添加并移除核苷酸溶液。核苷酸的正确掺入释放焦磷酸,焦磷酸与ATP硫酸化酶相互作用,并在腺苷5'磷酸硫酸酯的存在下产生ATP,促进萤光素反应,萤光素反应产生允许序列确定的化学发光信号。用于焦磷酸测序的仪器和甲基化特异性试剂可从Qiagen,Inc.(Valencia,CA)获得。还参见Tost和Gut,2007,Nat.Prot.2 2265-2275。普通技术人员可以使用的基于焦磷酸测序的系统的实例通常包括以下步骤:将衔接子核酸连接至研究核酸,并将研究核酸与珠杂交;在乳液中扩增研究核酸中的核苷酸序列;使用皮升多孔固体支持物分选珠;以及通过焦磷酸测序方法(例如,Nakano等人,2003,J.Biotech.102,117-124)对扩增的核苷酸序列进行测序。这样的系统可以被用于指数扩增通过本文描述的方法生成的扩增产物,例如,通过将异源核酸连接至通过本文描述的方法生成的第一扩增产物上。
CpG甲基化数据分析方法
在某些实施方案中,将针对生物标志物的组(biomarker panel)的生物标志物测量的甲基化值数学组合,并且组合值与潜在的诊断问题相关。在一些情况中,甲基化的生物标志物值通过任何适当的现有(state of the art)数学方法来组合。用于使生物标志物组合与疾病状态相关联的熟知的数学方法采用以下方法,如判别分析(DA)(例如,线性DA、二次DA、正则化DA)、判别函数分析(DFA)、核方法(例如,SVM)、多维量表(MDS)、非参数方法(例如,k最近邻分类器)、PLS(偏最小二乘法)、基于树的方法(例如,逻辑回归、CART、随机森林方法、Boosting/Bagging方法)、广义线性模型(例如,逻辑回归)、基于主成分的方法(例如,SIMCA)、广义相加模型、基于模糊逻辑的方法、基于神经网络和遗传算法的方法。技术人员在选择评估本文描述的表观遗传标志物或生物标志物组合的适当的方法的方面将没有困难。在一个实施方案中,在将表观遗传标志物或生物标志物组合的甲基化状态与例如诊断肝癌或肝癌亚型相关联中使用的方法选自DA(例如,线性判别分析、二次判别分析、正则化判别分析)、DFA、核方法(例如,SVM)、MDS、非参数方法(例如,k-最近邻分类器)、PLS(偏最小二乘法)、基于树的方法(例如,逻辑回归、CART、随机森林方法、Boosting方法)或广义线性模型(例如,逻辑回归)和主成分分析。与这些统计方法相关的细节可以在以下参考文献中找到:Ruczinski等人,12J.OF COMPUTATIONAL AND GRAPHICAL STATISTICS 475-511(2003);Friedman,J.H.,84J.OF THE AMERICAN STATISTICAL ASSOCIATION 165-75(1989);Hastie,Trevor,Tibshirani,Robert,Friedman,Jerome,The Elements ofStatistical Learning,Springer Series in Statistics(2001);Breiman,L.,Friedman,J.H.,Olshen,R.A.,Stone,C.J.Classification and regression trees,California:Wadsworth(1984);Breiman,L.,45MACHINE LEARNING 5-32(2001);Pepe,M.S.,TheStatistical Evaluation of Medical Tests for Classification and Prediction,Oxford Statistical Science Series,28(2003);和Duda,R.O.,Hart,P.E.,Stork,D.O.,Pattern Classification,Wiley Interscience,第2版(2001)。
在一个实施方案中,每个甲基化的组的关联结果通过它们与疾病或肿瘤类型阳性状态的相关性来评估(rated),诸如例如,通过p值检验或t值检验或F检验。然后,随后选择评估的(最佳者优先,即,低p值或t值)生物标志物并将其添加至甲基化的组,直到达到某个诊断值。这样的方法包括使用例如随机方差t检验来鉴定甲基化的组,或者更广泛地,在若干类别中鉴定差异性甲基化的基因(Wright G.W.和Simon R,Bioinformatics 19:2448-2455,2003)。其他方法包括指定用于确定将被包括在生物标志物的组中的表观遗传标志物的显著性水平的步骤。在类别之间以小于指定阈值的单变量参数显著性水平发生差异性甲基化的表观遗传标志物被包括在组中。指定的显著性水平是否小到足以排除足够的假性发现(false discovery)并不重要。在一些问题中,更佳的预测通过使被用作特征的生物标志物的组更丰富(more liberal)来实现。然而,在一些情况中,如果包括较少的标志物,则这些组是生物学上可解释的及临床上可应用的。与交叉验证相似,对交叉验证过程中创建的每个训练集重复生物标志物选择。这是为了提供预测误差的无偏估计的目的。用于新患者样品数据的甲基化的组是由应用“已知的”甲基化信息的甲基化选择和分类器而产生的甲基化的组或对照甲基化的组。
用于使用甲基化谱来预测未来样品的类别的模型也可以被使用。这些模型可以基于混合协变量预测器(Radmacher等人,Journal of Computational Biology 9:505-511,2002)、对角线线性判别分析(Dudoit等人,Journal of the American StatisticalAssociation 97:77-87,2002)、最近邻分类(也是Dudoit等人)和具有线性核的支持向量机(Ramaswamy等人,PNAS USA 98:15149-54,2001)。这些模型并入了以指定显著性水平(例如0.01、0.05或0.1)发生差异性甲基化的标志物,如通过随机方差t检验(Wright G.W.和Simon R.Bioinformatics 19:2448-2455,2003)评估的。每个模型的预测误差可以使用交叉验证、优选地使用留一法交叉验证来估计(Simon等人,Journal of the NationalCancer Institute 95:14-18,2003)。对于每个留一法交叉验证训练集,重复整个模型构建过程,包括表观遗传标志物选择过程。在一些情况中,还评估了模型的交叉验证误差率估计值是否显著小于来自随机预测的预期。在一些情况中,将类别标签被随机排列,并且然后重复整个留一法交叉验证过程。显著性水平是给出交叉验证误差率不大于用真实的甲基化数据获得的交叉验证误差率的随机排列的比例。
另一种分类方法是Bo和Jonassen描述的贪婪对方法(greedy-pairs method)(Genome Biology 3(4):research0017.1-0017.11,2002)。贪婪对方法以将所有标志物基于它们在训练集上的t评分来排序开始。这种方法试图选择一起良好地区分类别的的标志物对。
另外,用于使用甲基化谱的二叉树分类器被任选地用于预测未来样品的类别。树的第一节点并入了区分类别总集的两个子集的二元分类器。单个的二元分类器基于并入了标志物中以如通过随机方差t检验评估的显著性水平(例如0.01、0.05或0.1)差异表达的标志物的“支持向量机”(Wright G.W.和Simon R.Bioinformatics 19:2448-2455,2003)评估的。评估了所有可能的二元分区的分类器,并且所选的分区为使得交叉验证的预测误差最小的分区。然后对通过先前二元拆分确定的两个类别子集连续重复该过程。二叉树分类器的预测误差可以通过交叉验证整个树构建过程来估计。这种总体交叉验证包括在每个节点处重新选择最佳分区,以及重新选择用于每个交叉验证的训练集的标志物,如Simon等人(Simon等人,Journal of the National Cancer Institute 95:14-18,2003)描述的。进行若干倍交叉验证,其中一部分样品被保留,对剩余样品开发二叉树,并且然后预测所保留样品的类别成员。将该过程重复若干次,每次保留不同百分比的样品。将样品随机分成部分测试集(Simon R和Lam A.BRB-ArrayTools User Guide,3.2版,Biometric ResearchBranch,National Cancer Institute)。
因此,在一个实施方案中,每个标志物的相关结果b)通过它们与疾病的正确相关性来评估,优选地通过p值检验来评估。还可以包括一个步骤,其中d)标志物以它们的等级顺序被选择。
在另外的实施方案中,在向患者施用疗法之前、期间或之后,可以另外使用因素,诸如转录速率、mRNA水平、翻译速率、蛋白水平、生物活性、细胞特征或特性、基因型、表型等的值、水平、特征(feature)、特征(characteristic)、特性等,以能够进一步分析患者的癌症状态。
在一些实施方案中,正确预测状态的诊断测试按测定的灵敏度、测定的特异性或接受者操作特征(“ROC”)曲线下面积来测量。在一些情况中,灵敏度是被测试预测为阳性的真阳性的百分比,而特异性是被测试预测为阴性的真阴性的百分比。在一些情况中,ROC曲线提供测试的灵敏度随1-特异性的变化。例如,ROC曲线下面积越大,测试的预测值就越准确或有力。测试效用的其他有用的度量包括阳性预测值和阴性预测值。阳性预测值是测试呈阳性的人实际为阳性的百分比。阴性预测值是测试呈阴性的人实际为阴性的百分比。
在一些实施方案中,本文公开的一种或更多种生物标志物示出了在不同样品中的至少p<0.05、p<10-2、p<10-3、p<10-4或p<10-5的统计差异。使用这些生物标志物的诊断测试可以显示出至少0.6、至少约0.7、至少约0.8或至少约0.9的ROC。在一些情况中,生物标志物在患有或不患有肝癌的不同受试者中被差异性甲基化。在另外的实例中,不同亚型肝癌的生物标志物被差异性甲基化。在某些实施方案中,使用本文描述的方法测量患者样品中的生物标志物,并将其与例如预定义的生物标志物水平进行比较,并用于确定患者是否患有肝癌、患者患有何种肝癌亚型和/或患有肝癌的患者的预后如何。在其他实施方案中,将患者样品中的生物标志物的组合的相关性与例如预定义的生物标志物集进行比较。在一些实施方案中,然后将测量值与区分肝癌的存在或不存在、肝癌亚型以及“良好”或“不良”预后的相关诊断量、截止值(cut-off)或多变量模型评分比较。如本领域充分理解的,取决于诊断医师的偏好,通过调整测定中使用的特定诊断截止值,可以增加诊断测定的灵敏度或特异性。在一些实施方案中,特定诊断截止值例如,通过测量来自患有或不患有肝癌的患者和来自患有不同肝癌亚型的患者的统计显著的数量的样品中的生物标志物超甲基化或低甲基化的量,并划定适合期望的特异性和灵敏度水平的临界值来确定。
试剂盒/制品
在一些实施方案中,本文提供了包括用于检测和/或表征本文描述的生物标志物的甲基化谱的试剂盒。在一些情况中,试剂盒包含检测或测量一种或更多种样品的甲基化状态/水平的多于一种引物或探针。在一些情况中,这样的试剂盒包含与本文描述的甲基化标志物序列中的至少一种杂交的至少一种多核苷酸和用于检测基因甲基化的至少一种试剂。用于检测甲基化的试剂包括,例如,硫酸氢钠、被设计为如果标志物序列未甲基化(例如,包含至少一个C-U转换)则与标志物序列的产物杂交的多核苷酸、和/或甲基化敏感性限制酶或甲基化依赖性限制酶。在一些情况中,试剂盒提供了呈适于在测定中使用的测定装置的形式的固体支持物。在一些情况中,试剂盒还包含任选地连接至试剂盒中的多核苷酸,例如探针的可检测标记物。
在一些实施方案中,试剂盒包含一种或更多种(例如,1种、2种、3种、4种或更多种)不同的多核苷酸(例如,引物和/或探针),所述多核苷酸能够特异性扩增本文描述的生物标志物的DNA区域的至少一部分。任选地,试剂盒中还包括能够与扩增部分杂交的一种或更多种可检测地标记的多肽。在一些实施方案中,试剂盒包含足够的引物以扩增2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个不同的DNA区域或其部分,并且任选地包括能够与每个扩增的DNA区域或其部分杂交的可检测地标记的多核苷酸。试剂盒还可以包含甲基化依赖性限制酶或甲基化敏感性限制酶和/或亚硫酸氢钠。
在一些实施方案中,试剂盒包含亚硫酸氢钠、用于全基因组扩增的引物和衔接子(例如,可以连接(ligate)或以其他方式连接(link)至基因组片段的寡核苷酸)、以及量化来自本文描述的表观遗传标志物的DNA区域的至少一个胞嘧啶的转化的甲基化序列和/或转化的未甲基化序列的存在的多核苷酸(例如,可检测地标记的多核苷酸)。
在一些实施方案中,试剂盒包含甲基化感测限制酶(例如,甲基化依赖性限制酶和/或甲基化敏感性限制酶)、用于全基因组扩增的引物和衔接子、以及量化本文描述的表观遗传标志物的DNA区域的至少一部分的拷贝数的多核苷酸。
在一些实施方案中,试剂盒包含甲基化结合部分和量化本文描述的标志物的DNA区域的至少一部分的拷贝数的一种或更多种多核苷酸。甲基化结合部分是指特异性结合甲基胞嘧啶的分子(例如,多肽)。
实例包括缺乏DNA切割活性但保留结合甲基化的DNA的能力的限制酶或其片段、特异性结合甲基化的DNA的抗体等。
在一些实施方案中,试剂盒包括包装材料。如本文使用的,术语“包装材料”可以指容纳试剂盒的组分的物理结构。在一些情况下,包装材料维持试剂盒组分的无菌性,并且由通常用于这种目的的材料(例如,纸、波纹纤维、玻璃、塑料、箔、安瓿等)制成。试剂盒中包括可用于执行测定的其他材料,包括试管、移液吸管等。在一些情况中,试剂盒还包括在本文描述的任何测定中使用这些试剂中的一种或更多种的书面说明书。
在一些实施方案中,试剂盒还包括缓冲剂、防腐剂或蛋白/核酸稳定剂。在一些情况中,试剂盒还包括如本文描述的反应混合物的其他组分。例如,试剂盒包括如本文描述的热稳定的DNA聚合酶的一个或更多个等分试样和/或dNTP的一个或更多个等分试样。在一些情况中,试剂盒还包括含有基因座的单个等位基因的已知量的模板DNA分子的对照样品。在一些实施方案中,试剂盒包括阴性对照样品,例如,不包含含有基因座的单个等位基因的DNA分子的样品。在一些实施方案中,试剂盒包括阳性对照样品,例如,包含已知量的基因座的单个等位基因中的一种或更多种的样品。
某些术语
除非另外定义,否则本文使用的所有技术术语和科学术语具有与所要求保护的主题所属领域的技术人员通常理解的相同的含义。将理解,前述一般性描述和以下详细描述仅是示例性和说明性的,而不限制任何要求保护的主题。在本申请中,单数的使用包括复数,除非另外具体说明。必须注意,如本说明书和所附权利要求书中使用的,单数形式“一(a)”、“一(an)”和“所述/该(the)”包括复数指示物,除非上下文另外明确指示。在本申请中,“或”的使用意指“和/或”,除非另外说明。另外,术语“包括(including)”以及其他形式,诸如,“包括(include)”、“包括(includes)”和“包括(included)”的使用不是限制性的。
如本文使用的,范围和量可以被表示为“约”特定值或范围。约也包括精确的量。因此,“约5μL”意指“约5μL”,并且也意指“5μL”。通常,术语“约”包括将被预期在实验误差内的量。
本文使用的章节标题仅用于组织目的,且不应被解释为限制所描述的主题。
如本文使用的,术语“个体”、“受试者”和“患者”意指任何哺乳动物。在一些实施方案中,哺乳动物是人类。在一些实施方案中,哺乳动物是非人类。这些术语都不要求或都不受限于以医疗护理工作者(例如,医师、注册护士、执业护士、医师助理、勤务员或临终关怀工作者)的监管(例如持续或间歇)为特征的情况。
“位点”对应于单个位点,其在一些情况中是单个碱基位置或相关碱基位置的组,例如,CpG位点。“基因座”对应于包括多于一个位点的区域。在一些情况中,基因座包括一个位点。
实施例
提供这些实施例仅用于说明性目的,而非限制本文提供的权利要求的范围。
实施例1
肺癌(LUNC)和肝细胞癌(HCC)是世界范围内癌症死亡的主要原因。与许多癌症一样,在早期发现的LUNC和HCC具有与晚期疾病相比的很大改善的预后,部分是由于局部治疗与全身治疗相比的相对效力。在一些情况中,早期检测具有减少死亡率的潜力。
DNA甲基化是基因表达的表观遗传调节物(regulator),通常导致基因沉默。在癌症中,DNA甲基化通常在肿瘤抑制基因中增加,并且其本身表现为首次赘生性变化中的一种。循环肿瘤DNA(ctDNA)包括经由肿瘤细胞坏死、凋亡及主动释放DNA而脱落到血浆中的细胞外核酸片段。在一些情况中,携带癌症特异性甲基化模式的ctDNA被用作癌症诊断的生物标志物。
患者数据
组织DNA甲基化数据从癌症基因组图谱(The Cancer Genome Atlas)(TCGA)获得。完整的临床、分子和组织病理学数据集可在TCGA网站获得。捐献样品的各个机构协调同意过程,并根据其各自的机构审查委员会从每个患者获得了知情书面同意。
第二个独立的华人组群由中国广州中山大学肿瘤防治中心(Sun Yat-senUniversity Cancer Center)、西安西京医院(Xijing Hospital)和成都华西医院(theWest China Hospital)的654名LUNC患者和654名HCC患者组成。选择并在本研究中登记呈现I期-IV期LUNC和HCC的患者。患者特征和肿瘤特征总结在表S1中。LUNC和HCC的TNM分期分类根据AJCC癌症分期手册第7版(Edge,S.B.和Compton,C.C.(2010).The American JointCommittee on Cancer:the 7th edition of the AJCC cancer staging manual and thefuture of TNM.Annals of surgical oncology 17,1471-1474)进行。本项目由中山大学肿瘤防治中心、西京医院和华西医院的IRB批准。从所有患者获得了知情同意。肿瘤和正常组织按临床上对于患者护理所指示的获得,并被保留用于本研究。人类血液样品通过静脉穿刺术收集,并且血浆样品通过离心后取上清液获得,并且在cfDNA提取之前储存在-80℃。
数据源
使用Infinium 450K甲基化阵列生成的485,000个位点的DNA甲基化数据从TCGA以及从研究Hannum,G.等人,(2013)Genome-wide methylation profiles revealquantitative views of human aging rates,Mol Cell 49,359-367(GSE40279)生成的数据集获得,在该数据集中分析了HCC和血液的DNA甲基化谱。生成了包含每个扫描珠的比值的甲基化数据的IDAT格式文件。使用来自Bioconductor的minfi包,将这些数据文件转换成被称为β值的评分。华人组群的甲基化值通过使用分子倒位探针(molecular inversionprobe)的靶向硫酸氢盐测序获得,并如下文描述地进行分析。
统计分析
用于诊断和预后分析的DNA甲基化标志物预选
对TCGA数据的差异性甲基化分析使用“调节的t统计收缩(moderated t-statistics shrinking)”方法进行,并且然后通过Benjamini-Hochberg程序多重测试来校正每个标志物的p值,以将FDR控制在0.05的显著性水平。将列表按调整的p值排序,并选择前1000种标志物用于设计用于区分癌症(LUNC和HCC两者)和正常样品的扣锁探针,并选择1000种标志物的单独的组用于区分LUNC和HCC(图1)。获得了给出阳性且特异性PCR扩增信号的约1673种扣锁探针,并且因此将它们在cfDNA样品的随后的实验中用作捕获探针。具有低质量或少于30,000读段/样品的cfDNA样品也被排除。我们的研究中包括了约2,173个cfDNA样品(654个LUNC血液样品和654个HCC血液样品以及865个正常血液样品)。每种标志物的甲基化读段定义为总的独特的甲基化读段,并且每种标志物的甲基化值被定义为具有甲基化的读段计数除以总读段计数的比例。对于具有少于20个独特读段的特定甲基化标志物,使用HCC或正常健康对照的估算(imputed)平均甲基化值。
建立诊断模型
cfDNA特征构建与MCB
将扣锁探针设计成包括在LUNC和HCC两者相比于血液之间以及在LUNC和HCC之间的比较中被发现是差异性甲基化的2000个CpG甲基化位点。捕获及测序在硫酸氢盐转化的cfDNA样品中进行。MCB的概念被用于将近端CpG标志物合并到MCB中,产生总计888个MCB。对于每个MCB,将MCB特异性甲基化值量化为log10(总甲基化读段计数+1),使用log变换来减少异常值效应。
基于cfDNA的诊断分类器构建
将从被诊断患有肝癌(HCC)、肺癌(LUNC)的患者和正常对照获得的cfDNA样品数据分为训练组群和验证组群。如果样品具有少于30,000的总独特读段,则排除样品。从具有足够读段以确保良好代表MCB的剩余样品中,我们选择了各654个的肺癌和肝癌样品及865个健康样品,以确保平衡的数据集。将整个数据集以2:1的比随机划分,以形成训练组群和验证组群。
选择了遍及cfDNA样品显示出良好甲基化范围的MCB。另外,使用双样本t检验来鉴定在癌症样品(LUNC或HCC)相比于正常对照样品之间具有MCB甲基化读段的最大标准化绝对平均值差异的MCB。根据排序的多重测试形成校正后仍然显著的p值选择最高的MCB,并使用前100种标志物构建诊断预测模型。将MCB的组合并(aggregate)为综合评分(cd评分),以在LUNC和正常、HCC和正常、及LUNC和HCC之间进行成对二元分类。综合评分由多分类逻辑回归(multinomial logistic regression)模型生成,每项比较使用前50个MCB。
治疗前甲基化水平或初始甲基化水平在初始诊断时获得,并且治疗后水平在治疗后约2个月评估,其中治疗是指化学疗法或肿瘤的手术切除。主要终点(包括对治疗的响应:进展性疾病(PD)、部分响应(PR)和稳定疾病(SD))根据RECIST指南(Eisenhauer等人,2009)定义。对于用手术切除治疗并且在评估的时间未复发的患者,我们假设他们具有完全响应(CR)。临床类别之间的cd评分分布的差异通过单侧t检验检查,因为使用Shapiro-Wilk检验显示出cd评分是非正态分布的。
建立用于预后和存活的预测模型
研究了使用基于ctDNA中的总甲基化读段的组合预后评分(cp评分)系统结合临床特征和人口学特征(包括年龄、性别和AJCC分期)用于预测LUNC和HCC的预后的潜力。对于每种类型的癌症,从整个数据集中随机选择三分之二的观察结果作为训练组群,并将其余的视为验证组群。对训练组群进行变量选择,并对验证组群建立综合评分。在训练组群内,采用了“随机lasso”方案(Meinshausen,N.,和Bühlmann,P.(2010)Stabilityselection.Journal of the Royal Statistical Society:Series B(StatisticalMethodology)72,417-473)以减少采样依赖性以稳定变量选择,从而以高置信度选择生物标志物。将组群以2:1的比随机划分。最初对三分之二的训练组群进行变量选择程序,并且然后使用剩余的三分之一组群在相同训练组群内进行内部验证测试。变量选择程序如下地进行:首先,使用单变量Cox回归模型来去除过量噪声,并基于Wald检验来选择具有小于或等于0.05的p值的任何生物标志物。其次,LASSO用最佳调节参数(tuning parameter)来实施,该参数由来自10倍交叉验证的预期泛化误差或基于信息的标准AIC/BIC中对所选生物标志物产生最高的ρ2(解释的随机性的比例)的任何一个来确定。所选生物标志物的Cox回归的区分能力使用一致性概率(也被称为C指数)在内部验证组群上被进一步评估。在HCC中,ρ2(中位数:0.773;四分位数:0.722-0.838)和C指数(中位数:0.768;四分位数:0.728-0.796)两者证明了内部验证组群中生物标志物的潜力。相似地,在LUNC中,ρ2(中位数:0.737;四分位数:0.636-0.793)和C指数(0.614;四分位数:0.585-0.650)两者证明了生物标志物的潜在临床效用。汇总了在100次运行中出现至少30次的生物标志物,这产生了HCC的10种标志物和LUNC的12种标志物(表3)。为了外部评估每个组的可预测性,通过将来自Cox回归的无偏系数估计值与甲基化读段相乘,获得验证组群中的每个患者的综合评分。Kaplan-Meier曲线和时序检验使用二分综合评分生成,二分综合评分根据其中位数形成高风险和低风险组成员分配。这种分割(segmentation)与通过AJCC期形成的分割相容。时间依赖的ROC被用于总结综合评分、AJCC期和两者的组合的区分潜力,ROC曲线随时间变化并适应删失数据(censored data)。最后,拟合多变量Cox回归模型来评估潜在风险因素的显著性。所有假设检验为双侧的,且认为p值<0.05为统计显著的。所有分析均以R 3.2.3版进行,并使用以下软件包:“glmnet”、“pROC”、“limma”、“survival”、“survivalROC”、“survcomp”。
肿瘤DNA提取
从新鲜冷冻的健康组织或癌症组织提取基因组DNA使用QIAampDNA迷你试剂盒(Qiagen)根据制造商的建议进行。使用约0.5mg的组织来获得平均5μg的基因组DNA。将DNA储存在-20℃,并在制备的一周内分析。
从FFPE样品提取DNA
使用有若干修改的QIAamp DNA FFPE组织试剂盒从冷冻FFPE样品提取基因组DNA。将DNA样品储存在-20℃用于进一步分析。
从血浆样品提取无细胞DNA
从1.5ml血浆样品提取cfDNA使用QIAamp cfDNA试剂盒(Qiagen)根据制造商的建议进行。
基因组DNA的亚硫酸氢盐转化
使用EZ DNA Methylation-LightningTM试剂盒(Zymo Research)根据制造商的方案将约10ng的cfDNA转化为双DNA。所得双DNA具有~200-3000bp的尺寸分布,峰值为约~500-1000bp。如通过双DNA的深度测序及分析CH(非CG)二核苷酸的C至T转化的比率证实的,亚硫酸氢盐转化效率为>99.8%。
通过用分子倒位(扣锁)探针捕获的双DNA的深度测序确定DNA甲基化水平
将在任何癌症组织和正常血液之间的任何比较中甲基化水平显著不同的CpG标志物用于设计用于cfDNA的捕获及测序的扣锁探针。双DNA的扣锁捕获基于具有修改的公开方法的技术(Deng,J.,Shoemaker,R.,Xie,B.,Gore,A.,LeProust,E.M.,Antosiewicz-Bourget,J.,Egli,D.,Maherali,N.,Park,I.H.,Yu,J.等人(2009)Targeted bisulfitesequencing reveals changes in DNA methylation associated with nuclearreprogramming.Nat Biotechnol 27,353-360;Diep,D.,Plongthongkum,N.,Gore,A.,Fung,H.L.,Shoemaker,R.和Zhang,K.(2012)Library-free methylation sequencingwith bisulfite padlock probes.Nat Methods 9,270-272;Porreca,G.J.,Zhang,K.,Li,J.B.,Xie,B.,Austin,D.,Vassallo,S.L.,LeProust,E.M.,Peck,B.J.,Emig,C.J.,Dahl,F.等人(2007)Multiplex amplification of large sets of human exons.Nat Methods 4,931-936)。
探针设计和合成
扣锁探针使用ppDesigner软件设计。捕获区域的平均长度为100bp,且CpG标志物位于捕获区域的中央部分。臂之间的接头序列包含扩增引物的结合序列,该结合序列被可变的C链段分隔以产生相等长度的探针。将6-bp独特分子标识符(UMI)序列掺入探针设计中,以允许鉴定独特的单个分子捕获事件及DNA甲基化水平的准确的评分。
探针使用标准商业合成方法(ITD)合成为单独的寡核苷酸。对于捕获实验,将探针混合,用T4PNK(NEB)根据制造商的建议进行体外磷酸化,并使用P-30Micro Bio-Spin柱(Bio-Rad)纯化。
双DNA捕获
将约10ng亚硫酸氢盐转化的DNA与扣锁探针在含有1X Ampligase缓冲液(Epicentre)的20μl反应中混合。为了使探针退火至DNA,在95℃变性30秒,随后以每秒0.02℃的速率缓慢冷却至55℃。留在55℃持续15小时以完成杂交。为了填充退火的臂之间的空位,向每个反应中添加5μl的以下混合物:2U的PfuTurboCx聚合酶(Agilent)、0.5U的Ampligase(Epicentre)和1X Ampligase缓冲液中的250pmol的每种dNTP。在55℃孵育5小时后,使反应在94℃变性持续2分钟。添加5μl的核酸外切酶混合物(20U的ExoI和100U的ExoIII,两者均来自Epicentre),并且在37℃持续2小时进行单链DNA降解,随后在94℃持续2分钟使酶失活。
使位点特异性捕获的环状产物通过PCR扩增,同时进行单独样品的条形码化。扩增使用对其中之一包含特异性6bp条形码的扣锁探针内的接头DNA特异性的引物进行。两种引物均包含Illumina下一代测序衔接子序列。PCR如下地进行:1X Phusion Flash主混合物、3μl捕获的DNA和200nM引物,使用以下循环:在98℃10s,8X的(在98℃1s,在58℃5s,在72℃10s),25X的(在98℃1s,在72℃15s),在72℃60s。将PCR反应混合,并且使用AgencourtAMPure XP珠(Beckman Coulter)对所得文库进行大小选择,以包括有效捕获物(~230bp)并排除“空”捕获物(~150bp)。文库的纯度通过使用Illumina流通池衔接子引物(P5和P7)的PCR验证,并且浓度使用Qubit dsDNA HS测定(Thermo Fisher)确定。文库使用MiSeq和HiSeq2500系统(Illumina)测序。
捕获覆盖率均一性的优化
初始试验性捕获实验的深度测序显示出被最有效探针和非有效探针捕获的读段的数目之间的显著差异(60-65%的捕获区域具有>0.2x平均值的覆盖率)。为了改善这种情况,从测序数据计算相对效率,并以调整的摩尔比混合探针。这使捕获均一性增加至85%的区域具有>0.2x的平均覆盖率。
测序数据分析
测序读段的映射使用具有一些修改的软件工具bisReadMapper进行。首先,从每个测序读段提取UMI,并使用定制脚本将其附加至FASTQ文件内的读段头上。使用Bowtie2将读段在运行中(on-the-fly)转换,如同所有C是非甲基化的并映射至人类基因组的计算机转换的DNA链,还如同所有C是非甲基化的。将原始读段合并及针对单一UMI过滤,即,携带相同UMI的读段被弃去,留下单一的独特的读段。被扣锁探针捕获的区域内包含的所有CpG二核苷酸的甲基化频率通过将在询问位置处携带C的独特读段的数目除以覆盖询问位置的读段总数计算。
相关甲基化区段(BCM)的鉴定
跨来自两个诊断类别例如正常血液和HCC的每一个类别的50个cfDNA样品,分别计算被不多于200bp分隔的每对CpG标志物的甲基化频率之间的皮尔逊相关系数。将皮尔逊r<0.5的值用于鉴定具有非相关甲基化的相邻标志物之间的边界。将未被边界分隔的标志物组合为甲基化相关区段(MCB)。该程序在我们的扣锁数据内的每个诊断类别中鉴定出总计~1550个BCM,每个区段中组合了2个和22个之间的CpG位置。整个BCM的甲基化频率通过将BCM内所有询问的CpG位置处的C的数目相加并除以这些位置处的C+T的总数计算。
DNA分离和数字定量PCR
肿瘤和对应的血浆样品从经受手术肿瘤切除的患者获得;将样品冷冻并保存在-80℃直至使用。从样品中分离DNA和RNA分别使用AllPrepDNA/RNA迷你试剂盒和cfDNA提取试剂盒(Qiagen,Valencia,CA)进行。
患者和样品特征
对来自癌症基因组图谱(TCGA)的827个LUNC肿瘤样品和377个HCC肿瘤样品和来自在对衰老的甲基化研究(GSE40279)(Hannum,G.等人(2013)Genome-wide methylationprofiles reveal quantitative views of human aging rates.Mol Cell 49,359-367)中使用的数据集的754个正常样品,收集了临床特征和分子DNA甲基化谱。对两个患者组群进行了研究。第一组群为来自TCGA的实体肿瘤,并且第二组群为来自中国的cfDNA样品。为了研究LUNC和HCC的ctDNA,从2,173名患有HCC或LUNC的华人患者和随机选择的群体匹配的经受常规医疗保健护理的健康对照获得血浆样品,产生了654名LUNC患者和654名HCC患者以及865名正常健康对照的组群。所有参与者均提供了书面知情同意。所有患者和对照的临床特征在表4中列出。
区分LUNC和HCC及血液的甲基化标志物的鉴定
假设因为来源于肿瘤细胞的cfDNA是在cfDNA主要由白细胞释放的背景下检测的,因此当与正常对照的CpG标志物相比时,在LUNC或HCC相比于正常白细胞之间的甲基化值方面具有最大差异的CpG标志物显示出HCC或LUNC患者的cfDNA的可检测的甲基化差异。为了鉴定推定的标志物,将源自来自TCGA的癌症组织DNA的甲基化数据与正常血液比较,包括827个LUNC、436个HCC和来自健康对照的754个血液样品。为了鉴定在LUNC或HCC与正常血液之间具有显著不同的甲基化率的DNA位点,使用了采用经验贝叶斯的t统计用于缩小方差,并选择了前1000种标志物,使用Benjamini-Hochberg程序以将FDR控制在0.05的显著性水平。这些前1000种标志物的无监督层级聚类能够区分LUNC、HCC和正常血液(图6)。设计了用于从血浆捕获测序cfDNA的对应于这2000种标志物的约2,000种分子倒位(扣锁)探针。
用于改善等位基因判定准确性的甲基化区段结构
使用已确立的遗传连锁不平衡(LD区段)的概念(Reich,D.E.等人,(2001)Linkagedisequilibrium in the human genome.Nature 411,199-204)来研究不同DNA链之间的共甲基化程度,基础假设是,极为接近的DNA位点比远离的位点更可能被共甲基化。将配对末端Illumina测序读段用于识别每个单独的甲基化区段(mBlock),并应用皮尔逊相关方法来量化共甲基化或mBlock。区域的所有共同mBlock通过计算不同的mBlock分数来汇编。使用通常在遗传连锁不平衡分析中使用的0.5的r2截止值,将基因组划分为我们称为甲基化相关区段(MCB)的紧密共甲基化CpG位点。在500个正常样品的cfDNA中检测MCB,并且发现MCB高度一致。除了500个正常样品外,还测定了500个LUNC样品和500个HCC样品的cfDNA的MCB内的甲基化水平。与LD区段的情况相似,当比较正常cfDNA样品与HCC和LUNC的cfDNA样品时,发现MCB内的甲基化模式一致,这显著增强了等位基因判定的准确性(图7)。因此,将MCB值用于所有的随后的分析。在过滤具有低动态甲基化范围的MCB以排除无信息的MCB(在所有cfDNA样品中<5%)后,将2000个差异性甲基化的CpG甲基化位点合并到888个MCB中(图7)。另参见附录A。
用于LUNC和HCC的ctDNA诊断预测模型
通过双样品t-检验分析在cfDNA样品中显示出良好甲基化范围的888个选择的MCB(图7B)的甲基化值,以鉴定在癌症样品(LUNC和HCC)相比于正常对照样品之间给出每种标志物的甲基化读段的最大标准化绝对平均差异的标志物。选择按在控制家族式误差率(family-wise error rate)后的调整的p值排序的前100个最显著差异性甲基化的MCB来构建诊断预测模型。按样品对这些MCB进行的无监督层级聚类在图8A中示出,并且按肿瘤类型的每个选择的MCB的甲基化值在图9中示出。为了比较,所有MCB的层级聚类在图8B中示出。使用这个100个MCB的组来生成综合评分(cd评分),以在LUNC和正常、HCC和正常以及LUNC和HCC之间进行成对二元分类。综合评分使用每次比较的前50个MCB从多分类逻辑回归模型获得。将整个数据集随机划分,以2:1的比形成训练组群和验证组群。使用436个LUNC、436个HCC和576个正常对照cfDNA样品训练评分系统,并且然后在218个LUNC、218个HCC和289个正常样品中验证评分系统。应用该模型在验证数据集中得到对于HCC的85.8%以及对于LUNC的80.3%的灵敏度,以及88.2%的特异性(表1A)。我们还发现,在验证组群中,该模型可以成功区分LUNC和HCC样品与正常对照(AUC正常=0.957,AUC LUNC=0.937,AUC HCC=0.974)(图2A,表1B,表1C)。对这50个MCB的无监督层级聚类能够以高特异性和灵敏度区分HCC和LUNC与正常对照(图2C和图2D)。
评估了用于区分肝病(HBV/HCV感染、肝硬化和脂肪肝)和HCC的模型的cd评分,因为这些肝病是HCC的已知的主要风险因素。发现cd评分能够区分HCC患者与患有肝病的患者或健康对照(图3A)。这些结果与通过HCC中的AFP水平预测的结果一致且相当(图3B)。综合诊断评分还可以区分LUNC患者与处于增加的LUNC风险的具有吸烟史(>1包/天持续十年)的非LUNC患者(图3C)。
甲基化标志物预测的肿瘤负荷、治疗响应和分期
研究了cd评分在评估治疗响应、治疗后残留肿瘤的存在、以及LUNC和HCC的分期中的效用。在LUNC中,治疗后具有可检测的残留肿瘤的患者(n=513)的cd评分显著高于不具有可检测的肿瘤的那些患者(n=126)的cd评分(p=0.002,图4A和图10B)。相似地,cd评分与肿瘤分期之间存在良好的相关性。患有早期疾病(I、II)的患者与患有晚期疾病(III、IV)的患者相比具有实质上(substantially)较低的cd评分(p=0.016,图4B)。另外,手术后完全切除肿瘤的患者(n=124)的cd评分与手术前的那些cd评分(n=59)相比显著较低,而在具有复发的患者(n=48)中变得较高(p<0.01,图3C)。另外,治疗前(n=59)或具有进展(n=120)的患者的cd评分与具有阳性治疗响应的患者(n=277)的cd评分相比显著较高(p<0.001,图4D)。在HCC中,治疗后具有可检测的残留肿瘤的患者(n=495)的cd评分显著高于不具有可检测的肿瘤的患者(n=156)的cd评分(p<0.0001,图4E)。相似地,cd评分与肿瘤分期之间存在高度正相关性。患有早期疾病(I、II)的患者与患有晚期疾病(III、IV)的患者相比具有实质上较低的cd评分(p<0.001,图3F)。另外,手术后完全切除肿瘤的患者(n=146)的cd评分与手术前的cd评分(n=72)相比显著较低,而在具有复发的患者(n=72)中变得较高(p=0.036,图3G)。另外,治疗前(n=72)或具有进展(n=245)的患者的cd评分与具有治疗响应的患者(n=105)的cd评分相比显著较高(p<0.001,图4H)。我们能够获得若干患有LUNC的个体或HCC患者的甲基化值的连续纵向动态变化,以监测治疗响应,并且发现甲基化值与治疗结果之间存在高相关性(图10、图11和图12)。总体上,这些结果表明cd评分(即,血浆中的ctDNA的量)与肿瘤负荷高度相关,并且可以具有用于预测肿瘤响应及用于监测以检测复发的效用。
ctDNA诊断预测模型和AFP的效用。
在一些情况中,用于HCC的风险评估及监测的血液生物标志物是血清AFP水平。然而,AFP具有低灵敏度,使其不足以检测出所有将发展HCC的患者,并严重限制了其临床效用。在一些情况中,许多肝硬化患者发展HCC,而不具有AFP水平的任何增加。例如,HCC研究组群中约40%的患者具有正常的AFP值(<25ng/ml)。在活组织检查证实的HCC患者中,cd评分显示出用于HCC诊断的优于AFP的灵敏度和特异性(AUC 0.998相比于0.855,图4I)。cd评分和AFP值两者均与肿瘤分期高度相关(图4J和4K)。在具有治疗响应、肿瘤复发或进展的患者中,cd评分比AFP显示出更显著的从初始诊断的变化(图4K和4L)。在具有连续样品的患者中,与治疗前相比,具有阳性治疗响应的患者具有伴随的且显著的cd评分的降低,并且在手术后在患者中存在甚至进一步降低的cd评分。相比之下,患有进行性或复发性疾病的患者具有甲基化率的增加(图10)。相比之下,AFP对于评估个体患者中的治疗效力的灵敏度较低(图12)。
用于HCC和LUNC的ctDNA预后模型
研究了使用基于cfDNA甲基化分析的组合预后评分(cp评分)结合临床特征和人口学特征(包括年龄、性别、AJCC分期和AFP值)用于预测LUNC和HCC的预后的潜力。在HCC组群中,训练数据集包含具有69个事件的764个观察值,并且验证数据集包含具有31个事件的382个观察值。通过使用统计学习方法,构建了使用10种CpG标志物(表3)的预测模型,所述10种CpG标志物可以将HCC组群分为高风险组和低风险组,低风险组的中位存活期显著大于高风险组(时序检验=4.884,df=1,p=0.027)(图5A)。在LUNC组群中,训练数据集包含具有69个事件的437个观察值,并且验证数据集包含具有33个事件的220个观察值。12种CpG标志物的组(表3)能够将LUNC组群分为高风险组和低风险组,低风险组的中位存活显著大于高风险组(时序检验=4.35,df=1,p=0.037)(图5B)。
多变量Cox回归模型显示出cp评分与HCC和LUNC两者的死亡率显著相关。cp评分是HCC和LUNC验证组群两者中存活的独立的风险因素(在HCC中Coef 0.37、p=0.03;在LUNC中Coef:0.28、p=0.0017;表S2)。令人感兴趣地,在HCC中,当考虑cp评分和其他临床特征时,AFP作为风险因素不再是显著的(表5)。如预期的,在HCC和LUNC两者中,TNM分期(如按AJCC指南定义的)预测了患者的预后(图5C和图5D)。cp评分和TNM分期的组合显著改善了我们预测HCC组群的预后(AUC 0.762)和LUNC组群的预后(AUC 0.740)的能力(图5E和图5F)。
表1A示出了验证组群中多分类预测诊断的混淆表。
验证组群 HCC LUNC 正常
HCC 187 13 8
LUNC 22 175 26
正常 9 30 255 总计
总计 218 218 289 725
正确 187 175 255 617
灵敏度(%) 85.8 80.3
特异性(%) 88.2 85.1
表1B示出了验证组群中正常和HCC之间的二元分类预测诊断的混淆表。
验证组群 HCC 正常
HCC 207 13
正常 11 276 总计
总计 218 289 507
正确 207 276 483
灵敏度(%) 94.9
特异性(%) 95.5 95.3
表1C示出了验证组群中正常和LUNC之间的二元分类诊断的混淆表。
验证组群 LUNC 正常
LUNC 189 26
正常 29 263 总计
总计 218 289 507
正确 189 263 452
灵敏度(%) 86.7
特异性(%) 91.0 89.2
表1D示出了验证组群中LUNC和HCC之间二元分类诊断的列联表(contingencytable)。
验证组群 HCC LUNC
HCC 196 14
LUNC 22 204 总计
总计 218 218 436
正确 196 204 400
灵敏度(%) 89.9
特异性(%) 93.6 91.7
表2示出了100种甲基化标志物的特征及其在诊断中的系数。
表3示出了用于预测预后的HCC中的10个MCB和LUNC中的12个MCB的特征。标志物,MCB名称;靶ID,用于进行靶向捕获测序的初始cg标志物;参考基因,与MCB重叠的基因。
表4示出了研究组群的临床特征。
表5示出了使用甲基化标志物的综合评分和相关变量针对HCC患者和LUNC患者的多变量存活分析。
表6示出了本文描述的1000种标志物(以cg标识符示出)的说明性列表。在一些情况中,标志物在HCC相比于肺分析中使用。
表7示出了本文描述的1000种标志物(以cg标识符示出)的说明性列表。在一些情况中,标志物在HCC-肺-血液分析中使用。
实施例2
原发性组织患者数据
来自癌症患者的原发性实体组织和来自健康供体的血液组织两者通过Illumina450k Infinium珠芯片来测量。从癌症基因组图谱(TCGA)获得了485,000个位点的原发性肿瘤DNA甲基化数据。完整的临床、分子和组织病理学数据集可在TCGA网站获得。捐献样品的各个机构协调同意过程,并根据它们各自的机构审查委员会从每个患者获得了知情书面同意。来自健康供体的血液组织DNA甲基化数据基于来自Hannum等人,2013,Mol Cell 49,359-367(GSE40279)的研究获得及生成,在该研究中分析了HCC和血液的DNA甲基化谱。
血清样品患者数据
第二个独立的华人组群由中国广州中山大学肿瘤防治中心、西安西京医院和成都华西医院的LUNC和HCC患者组成。选择并在本研究中登记呈现从I期-IV期的LUNC和HCC的患者。患者特征和肿瘤特征总结在表11中。LUNC和HCC的TNM分期分类根据AJCC癌症分期手册第7版进行。本项目由中山大学肿瘤防治中心、西京医院和华西医院的IRB批准。从所有患者获得了知情同意。进行了使用用于预测高风险群体中的癌症发生的甲基化标志物的LUNC和HCC患者的早期检测的两项前瞻性试验。在第一项研究中,患者是从2015年12月至2016年12月经受基于CT扫描的肺癌筛查的吸烟者的组中招募的。选择呈现肺结节的患者(<10mm,n=232,表14)在筛查时进行甲基化谱分析(profiling),并且随后通过二次测试,以通过组织的活组织检查和病理诊断验证来确定结节是由于癌症还是炎性或感染性状况引起的。在第二项试验中,登记了具有肝硬化的高风险患者(n=242)。
肿瘤和正常组织按临床上对于患者护理所指示的获得,并被保留用于本研究。人类血液样品通过静脉穿刺术收集,并且血浆样品通过离心后取上清液获得,并且在cfDNA提取之前储存在-80℃。
治疗前血清样品在初始诊断时获得,并且治疗后血清样品在治疗后约2个月评估,其中治疗是指化学疗法或肿瘤的手术切除。主要终点(包括对治疗的响应:进展性疾病(PD)、部分响应(PR)和稳定疾病(SD))根据RECIST指南定义。对于用手术移除治疗并且在评估的时间未复发的患者,我们假设他们具有完全响应(CR)。
从血浆提取cfDNA
确定了为得到用于靶向测序的一致的量的cfDNA所需的最小血浆体积。作为粗略的指导,目标是以扣锁探针的组覆盖的90%的标志物的~20X覆盖率(参见以下)。观察到每个样品20,000个或更多的总独特读段满足这个标准。发现1.5ml或更多的血浆可以可靠地产生足够的cfDNA来产生>20,000个独特读段。使用数字液滴PCR进一步研究了1.5ml血浆中的cfDNA量与检测到的拷贝数之间的关系。发现1.5ml血浆产生>10ng,这在每个数字液滴PCR测定中产生至少140个拷贝的检测到的扩增子。因此决定在我们的所有实验中使用15ng/1.5ml作为截止值,以获得DNA甲基化的一致且可靠的测量。
使用EliteHealth cfDNA提取试剂盒(EliteHealth,中国广州优泽),根据制造商的建议,从1.5ml血浆提取cfDNA。
基因组或cfDNA的亚硫酸氢盐转化
使用EZ DNA Methylation-LightningTM试剂盒(Zymo Research),根据制造商的方案将10ng的DNA转化为双DNA。所得的双DNA具有~200-3000bp的尺寸分布,峰值为约~500-1000bp的。如通过双DNA的深度测序及分析CH(非CG)二核苷酸的C至T转化的比率证实的,亚硫酸氢盐转化效率为>99.8%。
用于扣锁探针的组设计的标志物选择
为了鉴定区分HCC、LUNC和正常血液甲基化特征的标志物,采用了用Benjamini-Hochberg程序对450k甲基化数据的“调节的t统计收缩”方法,以使用377个HCC样品和827个LUNC样品(TCGA)以及754个正常血液样品(GSE40279,我们先前的研究(参考文献HANNUM))的成对比较,将FDR控制在0.05的显著性水平。将列表按调整的p值排序,并选择前1000种标志物用于设计用于区分癌症(LUNC和HCC两者)和正常样品的扣锁探针,以及单独的1000种标志物的组用于区分LUNC和HCC(图20)。
使用所有2000种标志物来设计用于cfDNA的捕获及测序的扣锁探针。双DNA的扣锁捕获基于Deng等人,2009,Nature Biotechnology 27,353-360;Diep等人,2012,NatureMethods 9,270-272;和Porreca等人,2007,Nature Methods 4,931-936的方法进行;并且具有进一步的修改。因为捕获区域/cg标志物的总尺寸相对适当,这种方法提供了比任何当前方法(包括全甲基化组范围测序)低得多的测序成本,因此使我们能够评估大量样品。另外,直接靶向测序方法提供了数字读段,并且需要比基于芯片上杂交(例如Infinium,Illumina)或通过杂交的靶富集(例如SureSelect,Agilent)的更传统的最近的方法少得多的起始cfDNA材料(10-15ng)。这种方法还对不相等扩增更不灵敏,因为该方法使用分子标识符(molecular identifier,UMI)。
扣锁探针设计、合成及验证
所有探针使用ppDesigner软件来设计。捕获区域的平均长度为70bp,CpG标志物位于捕获区域的中央80%中。6bp的6-bp独特分子标识符(UMI)侧接于捕获臂,以在确定DNA甲基化频率中辅助消除扩增偏倚。臂之间的接头序列包含扩增引物的结合序列,该结合序列被可变的C链段分隔以产生相等长度的探针。探针作为单独的寡核苷酸(IDT)合成。对于捕获实验,将探针以等摩尔的量混合并在Qiagen柱上纯化。
初始试验性捕获实验的深度测序显示出被最有效的探针和非有效探针捕获的读段数目之间的显著差异(60-65%的捕获区域具有>0.2x平均值的覆盖率)。为了改善这种情况,由测序数据计算相对效率,并将探针以调整的摩尔比混合。这使捕获均一性增加至85%的区域具有>0.5x的平均覆盖率。
使用双DNA扣锁探针捕获的靶向甲基化测序
将10ng的亚硫酸氢盐转化的DNA与扣锁探针在含有1X Ampligase缓冲液(Epicentre)的20μl反应中混合。为了使探针退火至DNA,在95℃变性30秒,随后以0.02℃/秒的速率缓慢冷却至55℃,并在55℃孵育15小时。为了填充退火的臂之间的空位,向每个反应中添加5μl的以下混合物:2U的PfuTurboCx聚合酶(Agilent)、0.5U的Ampligase(Epicentre)和1X Ampligase缓冲液中的250pmol的每种dNTP。在55℃孵育5小时后,使反应在94℃变性2分钟。添加5μl核酸外切酶混合物(Epicentre的20U的ExoI和100U的ExoIII),并且在37℃进行单链DNA降解2小时,随后在94℃使酶失活2分钟。
使用对扣锁探针内的接头DNA特异性的引物,通过PCR来扩增环状捕获产物。两种引物包含用于独特双索引多重化的10bp条形码和Illumina下一代测序衔接子序列。PCR如下地进行:1X Phusion Flash主混合物、3μl的捕获的DNA和200nM引物,使用以下循环:在98℃10s,8X的(在98℃1s,在58℃5s,在72℃10s),25X的(在98℃1s,在72℃15s),在72℃60s。将PCR反应混合,并且将所得文库在2.5%琼脂糖凝胶上进行尺寸选择,以包括有效捕获(~230bp)并排除“空”捕获(~150bp)。文库的纯度使用Illumina流通池衔接子引物(P5和P7)通过TapeStation(Agilent)和PCR来证实,并且浓度使用Qubit dsDNA HS测定(ThermoFisher)确定。文库使用PE100读段在MiSeq和HiSeq2500系统(Illumina)上测序。每个样品的中位总读段为500,000,并且中靶可映射性(on-target mappability)为25%(~125,000个中靶非独特读段)。
捕获覆盖率均一性的优化
初始试验性捕获实验的深度测序显示出通过最有效探针和非有效探针捕获的读段的数目之间的显著差异(60-65%的捕获区域具有>0.2x平均值的覆盖率)。为了改善这种情况,由测序数据计算相对效率,并将探针以调整的摩尔比混合。这使捕获均一性增加至85%的区域具有>0.5x的平均覆盖率。
测序数据分析
测序读段的映射使用具有一些修改的软件工具bisReadMapper进行。首先,从每个测序读段提取UMI,并使用定制脚本将其附加至FASTQ文件内的读段头上。使用Bowtie2将读段在运行中转换,如同所有C是非甲基化的并映射至人类基因组的计算机转换的DNA链,还如同所有C是非甲基化的。将原始读段合并并针对单一UMI过滤,即,将携带相同UMI的读段弃去,留下单一的、独特的读段。被扣锁探针捕获的区域内包含的所有CpG二核苷酸的甲基化频率通过将在询问位置处携带C的独特读段的数目除以覆盖询问位置的读段总数计算。
DNA分离和数字定量PCR
肿瘤和对应的血浆样品从经受手术肿瘤切除的患者获得;将样品冷冻并保存在-80℃直至使用。从样品中分离DNA和RNA分别使用DNA/RNAMiniPrep试剂盒和cfDNA提取试剂盒(EliteHealth,中国广州优泽)进行。为了评估肿瘤cfDNA分数,我们用不同分数的正常cfDNA和HCC肿瘤基因组DNA(gDNA)进行了混合实验,并通过dPCR测定了甲基化值和拷贝数(详情参见下一节)。数字液滴PCR(ddPCR)根据制造商的说明书(Bio-Rad,Hercules,CA)进行。在本研究中使用以下ddPCR测定:cg10590292-正向引物5'-TGTTAGTTTTTATGGAAGTTT,反向引物5'-AAACIAACAAAATACTCAAA;用于甲基化的等位基因检测的荧光探针5'/6-FAM/TGGGAGAGCGGGAGAT/BHQ1/-3';用于未甲基化的等位基因检测的探针,5'/HEX/TTTGGGAGAGTGGGAGATTT/BHQ1/-3'。ddPCR根据制造商的说明书(Bio-Rad,Hercules,CA)进行,使用以下循环条件:1X的在98℃10min,40X的(在98℃30秒,在53℃60秒),1X的在98℃10min。
肿瘤cfDNA分数的计算
假设对HCC cfDNA样品观察到的特定甲基化值由正常cfDNA和肿瘤cfDNA的组合贡献产生。来源于肿瘤的cfDNA的分数使用以下公式来估计:样品i中由肿瘤DNA贡献的分数=[样品i中HCC cfDNA的甲基化值-正常cfDNA的平均甲基化值/[肿瘤DNA的平均甲基化值-正常cfDNA的平均甲基化值]。使用这种方法,估计HCC cfDNA样品中的平均肿瘤分数为约23%。然后将样品根据评估肿瘤负荷的因素,诸如晚期和治疗前状态分组,因为预期这些因素影响ctDNA的肿瘤分数。事实上,观察到与较高肿瘤分期和严重性相关的状况也倾向于具有较大的肿瘤分数。为了进一步检验(vet)这种方法,用不同分数的正常cfDNA(0-100%)和肿瘤基因组DNA(0-100%)进行了混合实验,并使用数字PCR测定了甲基化值。示出了肿瘤基因组DNA的增量添加可以将甲基化分数百分比增加至在HCC患者样品中观察到的值。具体地,当使用从实验获得的甲基化值时,可以通过以上公式预测10%、20%、40%、60%或100%分数的肿瘤基因组DNA的添加。
统计分析
用于诊断和预后分析的DNA甲基化标志物选择
在2000种初始设计的扣锁探针中,仅1673种提供了信息,即能够给出阳性和特异性PCR扩增信号,并且因此在cfDNA样品的随后的实验中被用作捕获探针。测序深度被用作样品纳入标准。将其中少于100个MCB(参见以下)显示出10X读段覆盖率的样品从进一步分析中排除。因为每个MCB平均包含~3个CG标志物,因此10X覆盖率确保了每个MCB至少30个甲基化测量。使用这些标准,纳入了所有样品的73%,中位数为每个样品34K映射读段。
在已经获得1673种CG标志物的DNA甲基化数据后,使用了将邻近CpG标志物合并到MCB中的MCB的概念,产生了总计888个MCB。对于每个MCB,将MCB特异性甲基化值用两个数字来量化:log10(总甲基化读段计数+1)和log10(总未甲基化读段计数+1),使用对数变换以减少异常值效应。
获得了约1673种提供信息的扣锁探针,所述扣锁探针能够给出阳性且特异性PCR扩增信号,并且将它们在cfDNA样品的随后的实验中用作捕获探针。具有少于100个>30x覆盖率的MCB的cfDNA样品也被排除。每种标志物的甲基化读段被定义为总独特甲基化的读段,并且每种标志物的甲基化值被定义为具有甲基化的读段计数除以总读段计数的比例。
使用MCB的基于cfDNA的诊断分类器构建(cd评分)
将从被诊断患有肝癌(HCC)、肺癌(LUNC)的患者和正常对照获得的cfDNA样品数据分为训练组群和验证组群。将整个数据集以随机划分,以形成1:1的比的训练组群和验证组群。
标志物选择:在训练组群内,采用了“随机LASSO”方案来减少采样依赖性并稳定变量选择,以便以高置信度来选择生物标志物。首先将训练集以1:1的比随机划分。对三分之二的样品进行变量选择程序,并保留三分之一的样品用于评估特征选择过程的性能。特征选择过程由重复50次的两个步骤组成。如果在50个特征选择迭代中的40个中选择了MCB,则纳入MCB用于训练最终模型。基于Friedman等人,2010,J Stat Softw 33,1-22的构建了多类别预测系统,以使用所选择的MCB的组预测测试数据中的样品的组成员。除了基于训练集的保留部分的预测准确性以外,还提供了混淆矩阵和ROC曲线,以评估灵敏度和特异性。
分类过程:采用了两步分类过程:癌症对正常人、LUNC对HCC通过建立两个二元多分类逻辑回归模型进行。多分类逻辑回归具有优点,其中它可以产生直观的概率评分,并允许较容易的解释。例如,如果癌症对正常模型对于给定甲基化谱产生70%的概率评分,则表明患者具有70%的可能性患癌症。为了使错误癌症预测的数目最小化,我们将癌症预测置信度阈值设置为80%。对于具有至少80%的癌症可能性的患者,我们将癌症相比于癌症的回归模型应用于LUNC和HCC之间的分类,该分类模型将仅在分类样品具有大于55%的置信度时才做出决定。
建立用于预后和存活的预测模型
研究了使用基于ctDNA中的每个MCB的甲基化读段和非甲基化的读段二者的组合预后评分(cp评分)系统结合临床特征和人口学特征(包括年龄、性别和AJCC分期),用于预测LUNC和HCC的预后的潜力。对于每种类型的癌症,通过从全部数据集中随机选择一半的观察结果作为训练组群,并将其余的视为验证组群,来建立并验证cp评分模型。对训练组群进行变量选择,并对验证组群建立综合评分。在训练组群内,采用了“随机lasso”方案来减少采样依赖性以稳定变量选择,从而以高置信度选择生物标志物。将整个组群以1:1的比随机划分。对三分之二的训练组群进行变量选择程序。LASSO用最佳调节参数来实施,该参数由来自10倍交叉验证的预期泛化误差或基于信息的标准AIC/BIC中对所选生物标志物产生最高(解释的随机性的比例)的任何一个来确定。然后汇总了来自HCC和LUNC中10个最常出现的特征(表10)。为了外部评估每个组合的可预测性,通过将来自Cox回归的无偏系数估计值与甲基化读段相乘,获得验证组群中的每个患者的综合评分。Kaplan-Meier曲线和时序检验使用二分综合评分生成,二分综合评分根据其中位数形成高风险和低风险组成员分配。这种分割与通过AJCC期形成的分割相容。时间依赖性ROC被用于总结综合评分、AJCC期和两者的组合的区分潜力,ROC曲线随时间变化并适应删失数据。最后,我们还拟合了多变量Cox回归模型来评估潜在风险因素的显著性。
所有分析以R(3.2.3版)和python(2.7.13版)进行,并使用以下软件包:“glmnet”、“limma”、“survival”、“sklearn”、“lifeline”、“survivalROC”、“survcomp”。
所有假设检验均通过双侧进行,p值<0.05被认为是统计显著的,除非另外具体说明。
患者和样品特征
对来自癌症基因组图谱(TCGA)的827个LUNC肿瘤样品和377个HCC肿瘤样品和来自在我们先前对衰老的甲基化研究(GSE40279)(Hannum等人,2013)中使用的数据集的754个正常样品,收集了临床特征和分子DNA甲基化谱。对两个患者组群进行了研究。第一组群为来自TCGA的实体肿瘤样品,并且第二组群为来自中国的血浆样品。为了研究LUNC和HCC的cfDNA,从2,396名患有HCC或LUNC的华人患者和从随机选择的群体匹配的经受常规医疗保健护理的健康对照获得血浆样品,产生了892名LUNC患者和1504名HCC患者以及2247名正常健康对照的组群。从每个研究参与者获得了知情书面同意。所有患者和对照的临床特征在表11中列出。
区分LUNC和HCC及血液的甲基化标志物的鉴定
先前的报导表明,血浆含有从体内的组织释放的DNA。假设因为来源于肿瘤细胞的cfDNA可以在cfDNA主要由白细胞释放的背景下被检测到,因此当与正常对照的CpG标志物相比时,在LUNC或HCC相比于正常白细胞之间的甲基化值方面具有最大差异的CpG标志物将最有可能显示出HCC或LUNC患者的cfDNA的可检测的甲基化差异性。为了鉴定推定的标志物,将源自来自TCGA的癌症组织DNA的甲基化数据与正常血液比较,包括827个LUNC、377个HCC和来自健康对照的754个血液样品。为了鉴定在LUNC或HCC与正常血液之间具有显著不同的甲基化率的DNA位点,使用了采用经验贝叶斯的t统计用于缩小方差,并选择了前1000种显著的标志物,使用Benjamini-Hochberg程序以将FDR控制在0.05的显著性水平。这些前1000种标志物的无监督层级聚类能够区分LUNC、HCC和正常血液,以及LUNC和HCC(图20)。然后设计了用于从血浆中捕获测序cfDNA的对应于这2000种标志物的约2,000种分子倒位(扣锁)探针(1000种用于癌症相比于正常,并且1000种用于LUNC相比于HCC)。
用于LUNC和HCC的cfDNA诊断预测模型
进一步分析了在cfDNA样品中显示出良好的甲基化范围的888个选择的甲基化相关区段(MCB)的甲基化数据,以鉴定在癌症样品(LUNC和HCC)相比于正常对照样品之间显示出显著不同甲基化的MCB。使用遍及样品的甲基化的读段对这些选择的MCB的无监督层级聚类在图20C中示出,并且正常样品、LUNC样品和HCC样品的MCB甲基化的读段值的分布在图21中示出。因此,通过最小绝对收缩和选择算子(LASSO)方法分析了888个MCB的整个甲基化数据集,并进一步减少了MCB的数目。基于LASSO的特征选择鉴定出用于区分LUNC相比于HCC和正常的28个MCB,用于区分HCC相比于LUNC和正常的27个MCB,用于区分正常相比于HCC和LUNC的22个MCB,产生了77种独特标志物(5个MCB在模型之间重叠)。该方法将通过MCB捕获的信息组合为基于cfDNA的综合评分(综合诊断评分:cd评分)。使用保留策略,评估了该评分用于预测LUNC或HCC的存在的效用,其中将样品以1:1的比随机分配至训练集和验证集。评分系统使用229个LUNC、444个HCC和1123个正常对照cfDNA样品训练,并且然后在300个LUNC、445个HCC和1124个正常样品上验证。将拟合模型应用于验证集样品,在多分类方案中得到对于HCC的92.4%以及对于LUNC的85.8%的灵敏度,以及对于正常对照的99.0%的特异性(表8A)。发现该模型可以成功区分验证组群中的LUNC和HCC样品与正常对照(AUC癌症相比于正常=0.979;AUC LUNC相比于HCC=0.924;图14A,表8B,表8C)。对77个MCB的无监督层级聚类能够以高特异性和灵敏度区分HCC和LUNC与正常对照(图14C和图14D)。
肝病,诸如肝硬化和脂肪肝,是HCC的主要风险因素。因此,评估模型的cd评分,用于区分肝病和HCC。发现cd评分能够区分HCC患者与患有肝病的患者或健康对照(图15A)。这些结果与通过HCC中的AFP水平预测的结果一致且相当(图15B)。cd评分还可以区分LUNC患者与处于增加的LUNC风险的具有吸烟史(>1包/天持续十年)的非LUNC患者(图15C)。这些结果与通过HCC中的AFP水平预测的结果一致且相当(图15D)。
甲基化谱预测的肿瘤负荷、治疗响应和分期
然后,研究了cd评分在评估治疗响应、治疗后残留肿瘤的存在、以及LUNC和HCC的分期中的效用。在LUNC中,治疗后具有可检测的残留肿瘤的患者(n=559)的cd评分显著高于不具有可检测的肿瘤的那些患者(n=160)的cd评分(p<0.001,图16A)。相似地,cd评分与肿瘤分期之间存在良好的相关性。患有早期疾病(I、II)的患者与患有晚期疾病(III、IV)的患者相比具有实质上较低的cd评分(p=<0.005,图16B)。另外,手术后完全切除肿瘤的患者(n=158)的cd评分与手术前的那些cd评分(n=67)相比显著较低,而在具有复发的患者(n=56)中变得较高(p<0.01,图16C)。另外,治疗前(n=67)或具有进展(n=136)的患者的cd评分与具有阳性治疗响应的患者(n=328)的cd评分相比显著较高(p<0.001,图16D)。在HCC中,治疗后具有可检测的残留肿瘤的患者(n=889)的cd评分显著高于不具有可检测的肿瘤的患者(n=314)的cd评分(p<0.0001,图16E)。相似地,cd评分与肿瘤分期之间存在高度正相关性。患有早期疾病(I、II)的患者与患有晚期疾病(III、IV)的患者相比具有实质上较低的cd评分(p<0.001,图16F)。另外,手术后完全切除肿瘤的患者(n=293)的cd评分与介入前的cd评分(n=109)相比显著较低,而在具有复发的患者(n=155)中变得较高(p<0.01,图16G)。另外,治疗前(n=109)或具有进展(n=381)的患者的cd评分与具有治疗响应的患者(n=249)的cd评分相比显著较高(p<0.001,图16H)。获得了若干患有LUNC的个体或HCC患者的CpG位点cg10673833的甲基化值的连续纵向动态变化,以监测治疗响应,并且发现甲基化值与治疗结果之间存在高相关性(图23、图24和图25)。总体上,结果显示出cd评分(即,血浆中的cfDNA的量)与肿瘤负荷之间的显著相关性,证明其用于预测肿瘤响应及用于监测以检测复发的效用。
与AFP和CEA相比的cfDNA的诊断效用
尽管付出了巨大努力,但仍然缺乏用于监测及诊断LUNC和HCC的有效的无创的基于血液的生物标志物。CEA(癌胚抗原)和AFP已经对于肺癌和HCC起到此作用持续数十年,但是其灵敏度和特异性不足。此外,患有鳞状细胞癌或小细胞肺癌的一些患者将不具有增加的血液CEA水平。然而,AFP具有60%的低灵敏度,使其不足以检测出将发展HCC的所有患者,并因此严重限制了其临床效用。事实上,对于患有HCC的肝硬化患者,不显示AFP水平的增加是常见的。引人注意地,HCC研究组群中30%的患者具有正常AFP值(<25ng/ml)。在整个组群中的活组织检查证实的LUNC患者中,对于LUNC诊断,cd评分显示出优于CEA的灵敏度和特异性(AUC 0.977(cd评分)相比于0.856(CEA),图16Q)。cd评分和CEA值两者均与肿瘤分期高度相关(图16J、图16B)。另一方面,在活组织检查证实的HCC患者中,对于HCC诊断,cd评分显示出优于AFP的灵敏度和特异性(AUC 0.993相比于0.835,图4R)。cd评分和AFP值两者均与肿瘤分期高度相关(图16F和图16N)。在具有治疗响应、肿瘤复发或进展的患者中,cd评分显示出比AFP更多的从初始诊断的变化(图16G、图16H、图16O和图16P)。在具有治疗响应、肿瘤复发或进展的LUNC患者中,cd评分显示出比AFP更显著的从初始诊断的变化(图16C、图16D、图16K和图16L)。在具有连续样品的LUNC和HCC患者中,具有阳性治疗响应的患者的cd评分比治疗前的患者的cd评分存在伴随的且显著的降低。手术后患者的cd评分甚至进一步降低。相比之下,存在患有进行性或复发性疾病的患者中的甲基化率的增加(图23)。相比之下,CEA和AFP对于评估个体患者的治疗效力的灵敏度较低(图24和图25)。
用于HCC和LUNC的cfDNA预后模型
研究了使用基于cfDNA甲基化分析的组合预后评分(cp评分)结合临床特征和人口学特征(包括年龄、性别、AJCC分期和AFP值)用于预测LUNC和HCC的预后的潜力。将总计599名LUNC患者和867名HCC患者纳入了预后分析(将不具有肿瘤负荷的患者从分析中排除)。LUNC组群的中位随访时间为9.5个月(范围为0.6-26个月),并且HCC组群的中位随访时间为6.7个月(范围为1.2-21.0个月)。在HCC组群中,训练数据集包含具有41个事件的433个观察值,并且验证数据集包含具有58个事件的434个观察值。通过使用统计学习方法,使用可以将HCC组群分为高风险组和低风险组的10种CpG MCB构建了预测模型(表10),低风险组的中位存活显著大于高风险组(时序检验=24.323,df=1,p<0.001)(图17A)。在LUNC组群中,训练数据集包含具有61个事件的299个观察值,并且验证数据集包含具有58个事件的434个观察值。10种CpG标志物的组(表10)能够将LUNC组群分为高风险组和低风险组,低风险组的中位存活显著大于高风险组(时序检验=6.697,df=1,p<0.001)(图17B)。
多变量Cox回归模型显示出cp评分与HCC和LUNC两者的死亡的发生率显著相关。cp评分是HCC和LUNC验证组群的边界两者中存活的独立风险因素(在HCC中,风险比率=2.4881,p=0.000721;在LUNC中,风险比率=1.74,p=0.068;在LUNC中,p=0.0017;表12)。令人感兴趣的是,当在HCC中考虑cp评分和其他临床特征时,AFP作为风险因素不再是显著的(表13)。如预期的,在HCC(图17C)和LUNC(图17D)两者中,TNM分期(如按AJCC指南定义的)预测了患者的预后。cp评分和TNM分期的组合显著改善了我们预测HCC组群的预后(AUC0.867,图17E)和LUNC组群的预后(AUC 0.825,图17F)的能力。
LUNC和HCC的早期诊断的甲基化标志物
因为LUNC和HCC是具有不良预后和存活的侵袭性很强的癌症,并且在1期手术去除癌症具有有利得多的预后,因此早期检测成为减少发病率和死亡率的关键策略。在两项前瞻性研究中,研究了使用甲基化标志物来预测高风险群体的癌症发生的方法。在第一项研究中,连续患者(consecutive patient)从具有在胸部CT扫描上发现的>10mm的实体肺结节的患者的组中招募。这些患者被登记在对吸烟者的早期肺检测的研究中,并经受了基于CT扫描的肺癌筛查。选择呈现实体肺结节(尺寸在10mm和30mm之间,n=208,表13)的患者以在筛查时进行甲基化分析。随后对这些患者进行二次测试,以通过组织的活组织检查和病理学验证来确定结节是由于LUNC引起的,还是由于炎症或感染引起的良性状况。甲基化谱足以区分患有活组织检查证实的1期LUNC病变的患者与患有由于炎性或感染性状况引起的良性结节的患者(图18,表14)。在具有至少59%的诊断置信度的患者中,I期癌症的阳性预测值(PPV)为95.9%,并且阴性预测值(NPV)为97.4%。相似地,我们前瞻性地登记了患有肝硬化的高风险HCC患者(n=236,表13)。甲基化谱能够以至少58%的诊断置信度在患者中以89.5%的灵敏度和98.2%的特异性预测向1期HCC的进展(图19,表14)。PPV为80.9%,且NPV为99.1%。
在本研究中,首先在LUNC和HCC肿瘤样品相比于正常血液中确定差异性甲基化的CpG位点。然后,在LUNC和HCC患者以及正常对照的大组群的cfDNA中研究这些标志物。使用cfDNA的甲基化开发预测癌症的存在,而同时区分LUNC和HCC的诊断模型(cd评分)。
cd评分区分患有HCC的患者与患有HBV/HCV感染、肝硬化和脂肪肝疾病的患者以及健康对照。在一些情况中,重要的是血清测试可靠地区分这些疾病状态与HCC。根据结果,HCC的cd评分的灵敏度与肝超声相当,肝超声是用于HCC筛查的当前标准。另外,在一些情况中,cd评分优于HCC的唯一的临床上使用的生物标志物AFP,使cd评分成为更具成本效益且资源密集度更低的方法。另外,通过显示其与HCC肿瘤负荷、治疗响应和分期的高相关性,该模型的cd评分在即时组群中显示出优于AFP的性能(对于我们的40%的HCC患者,在他们的疾病的整个过程期间,AFP值处于正常范围内)。在一些情况中,cd评分可能对评估HCC的治疗响应及监测复发特别有用。因为本研究中几乎所有HCC患者均患有肝炎(最可能为乙型肝炎),由其他病因引起的HCC可能具有不同的cfDNA甲基化模式。与HCC相似,筛查肺癌具有高成本,包括具有相关辐射暴露和高假阳性率的胸部CT成像。在一些情况中,cd评分可靠地区分吸烟者与患有肺癌的患者,并且还可能具有改善筛查及监测的效用。
还由cp评分构建了用于HCC和LUNC的预后预测模型。cp评分有效地区分具有不同预后的HCC和LUNC患者,并在我们的组群中的多变量分析中被证实为独立的预后风险因素。值得注意的是,对于预测HCC的预后,cfDNA分析再次优于AFP。在一些情况中,这种类型的分析有助于鉴定需要或多或少的积极治疗及监测的患者。
表8A.验证组群中多分类诊断的列联表
预测 HCC LUNC 正常
HCC 329 19 6
LUNC 23 145 6
正常 4 5 921
未确定 89 131 191
总计 354 174 930
正确 329 145 921
灵敏度(%) 92.4 85.8
特异性(%) 99.0
表8B.HCC与正常之间的二元分类诊断的列联表
预测 HCC 正常
癌症 371 16
正常 4 921
未确定 70 187
总计 375 937
正确 371 921
灵敏度(%) 98.9
特异性(%) 98.3
表8C.LUNC与正常之间的二元分类诊断的列联表
预测 LUNC 正常
癌症 188 16
正常 5 921
未确定 107 187
总计 193 937
正确 188 921
灵敏度(%) 97.4
特异性(%) 98.3
表9.通过多类别LASSO选择并用于cd评分生成的MCB的列表。A,正常;B,LUNC;C,HCC。
A,正常
B:LUNC
C:HCC
表10.LUNC预后预测中的10个MCB的特征及HCC预后预测中的10个MCB的特征
表11.研究组群的临床特征
表12.在验证组群中用甲基化标志物的综合评分(cp评分)和相关变量对HCC患者和LUNC患者的多变量存活分析
表13.I期LUNC和良性肺结节的检测的临床特征及灵敏度/特异性
表14.从肝硬化进展至I期HCC的检测的临床特征及灵敏度/特异性
实施例3
肝细胞癌(HCC)是世界范围内癌症死亡的主要原因。与许多癌症一样,在早期发现的HCC具有与晚期疾病相比的很大改善的预后,部分是由于局部治疗与全身治疗相比的相对效力。在一些情况中,早期检出具有减少HCC的死亡率的潜力。在一些情况中,甲胎蛋白(AFP)被用于检测及监测HCC。然而,在一些情况中,其临床效用受限于低灵敏度。
DNA甲基化是基因表达的表观遗传调节物,通常导致基因沉默。在癌症中,DNA甲基化通常在肿瘤抑制基因中增加,并且其本身表现为首次赘生性变化中的一种。循环肿瘤DNA(ctDNA)包括经由肿瘤细胞坏死、凋亡及主动释放DNA而脱落到血浆中的细胞外核酸片段。在一些情况中,携带癌症特异性甲基化模式的ctDNA被用作癌症诊断的生物标志物。
患者数据
组织DNA甲基化数据从癌症基因组图谱(TCGA)获得。完整的临床、分子和组织病理学数据集可在TCGA网站获得。捐献样品的各个机构协调同意过程,并根据其各自的机构审查委员会从每个患者获得了知情书面同意。
第二个独立的华人组群由中国广州中山大学肿瘤防治中心、西安西京医院和成都华西医院的HCC患者组成。选择并在本研究中登记呈现I期-IV期HCC的患者。患者特征和肿瘤特征总结在表17中。HCC的TNM分期分类根据NCCN肝胆癌症临床实践指南(NCCNHepatobiliary Cancers Clinical Practice Guidelines)(Benson III AB,Abrams TA,Ben-Josef E等人,Hepatobiliary Cancers:Clinical Practice Guidelines inOncology.Journal of the National Comprehensive Cancer Network:JNCCN 2009;7:350)进行。本项目由中山大学肿瘤防治中心、西京医院和华西医院的IRB批准。从所有患者获得了知情同意。肿瘤和正常组织按临床上对于患者护理所指示的获得,并被保留用于本研究。人类血液样品通过静脉穿刺术收集,并且血浆样品通过离心后取上清液获得,并且在cfDNA提取之前储存在-80℃。
数据源
使用Infinium 450K甲基化阵列生成的485,000个位点的DNA甲基化数据从TCGA以及从先前的研究(GSE40279)生成的数据集获得,在该数据集中分析了HCC和血液的DNA甲基化谱。生成了包含每个扫描珠的比值的甲基化数据的IDAT格式文件。使用来自Bioconductor的minfi包,将这些数据文件转换成被称为β值的评分。华人组群的甲基化值通过使用分子倒位探针的靶向硫酸氢盐测序获得,并如下文描述地进行分析。
统计分析-用于诊断和预后分析的DNA甲基化标志物预选
对TCGA数据的差异性甲基化分析首先使用“调节的t统计收缩”方法进行,并且然后通过Benjamini-Hochberg程序多重测试来校正每个标志物的P值,以将FDR控制在0.05的显著性水平。将列表按调整的P值排序,并选择前1000种标志物用于设计扣锁探针(图26)。获得了给出阳性且特异性的PCR扩增信号的约682种扣锁探针,并将其在cfDNA样品的随后的实验中用作捕获探针(图27A-图27H)。具有低质量或少于20,000读段/样品的cfDNA样品也被排除。本研究中包括了约1933个cfDNA样品(1098个HCC血液样品和835个正常血液样品)。每个标志物的甲基化值被定义为具有甲基化的读段计数除以总的读段计数的比例。在排除了在匹配的肿瘤组织和肿瘤血液样品中具有小于0.1的甲基化值范围的甲基化标志物后,保留了682种扣锁探针中的约401种标志物用于进一步分析(图27A)。对于具有少于20个独特读段的特定甲基化标志物,使用HCC或正常健康对照的估算平均甲基化值。
建立诊断模型
将完整的cfDNA数据集(1098个HCC血液样品和835个正常血液样品)以2:1的比随机分成训练组群和验证组群,分别对应于1275个和658个总样品。应用了适用于预筛选的训练数据集的高维度的两种变量选择方法:最小绝对收缩和选择算子(LASSO)及使用OOB误差的基于随机森林的变量选择方法。由于结果强烈地取决于稀疏高维数据的随机样品划分的任意选择,因此采用了“多重划分”方法的分析,这改善了变量选择一致性,同时控制有限样品误差。对于LASSO选择算子,将75%的数据集在没有替换的情况下进行次级采样500次,并选择具有重复出现频率多于450次的标志物。调节参数根据来自10倍交叉验证的预期泛化误差和基于信息的标准AIC/BIC估计确定,并且我们采用λ的最大值,使得误差在最小值的一个标准误差内,称为“1-se”λ。对于随机森林分析,使用OOB误差作为最小化标准,通过为变量设置0.3的每次迭代下降分数(dropping fraction),从随机森林中进行变量消除。通过两种方法选择10种重叠甲基化标志物,用于建立二元预测模型。使用这10种标志物作为协变量来拟合逻辑回归模型,并通过将训练和验证数据集两者中的无偏系数估计值和标志物甲基化值矩阵相乘来获得组合诊断评分(称为cd评分)。模型的可预测性通过ROC下面积(AUC,也称为C指数)评估,ROC下面积计算所有观察对中一致对的比例,1.0表示完美的预测准确性。使用具有最大约登指数(Youden’s index)的优化的cd评分截止值生成混淆表。
治疗前甲基化水平或初始甲基化水平在基线评估,并且后甲基化水平在治疗后约2个月评估,其中治疗是指化学疗法或肿瘤的手术切除。主要终点(包括对治疗的响应:进展性疾病(PD)、部分响应(PR)和稳定疾病(SD))根据RECIST指南定义。对于用手术切除治疗并且在评估的时间未复发的患者,假设他们具有完全响应(CR)。临床类别之间的cd评分分布的差异通过Wilcoxon秩和检验来检查,因为使用Shapiro-Wilk检验,cd评分被检验为非正态分布的。
建立用于预后和存活的预测模型
将HCC组群分成训练数据集和验证数据集,并探索了建立用于预后和存活的预测模型。将约680例用于训练,并且369例用于验证。然后,在训练数据集中,将基于序变模型(sequential model)的变量选择策略应用于筛选用于预测存活结果的标志物。首先进行了单变量预筛选程序来去除过多的噪声,以便于计算分析,这通常推荐在应用任何变量选择方法之前进行。对于每种甲基化标志物,通过使用每种标志物作为协变量来拟合单变量Cox比例风险模型。将具有来自Wald统计的p值<0.05的标志物保留在数据集中。其次,相似的次级采样策略在基于LASSO-cox方法的诊断标志物选择过程中使用,以将标志物数目缩小至合理的范围(少于事件)。与二元分类器略微不同,在事件比例对于模型构建来说太低的情况下,在训练数据集中进行具有复位(replacement)的次级采样。将频率截止值设置为50,以保留约十分之一的总事件。以上分析生成了构建预后特征的8种最终标志物。通过对这8种标志物拟合多变量Cox比例风险模型,确定了每种标志物的系数,并获得了每个个体的组合预后评分(称为cp评分)。为了验证预测模型,使用来自训练数据集的系数估计值来计算验证数据集中的每个患者的cp评分。通过根据cp评分的中位数来划分cp评分,形成了具有粗略相等数目的观察值的高cp评分组和低cp评分组。使用Kaplan-Meier估计量和时序检验研究了中位存活时间在这两个组之间是否显著不同。
使用cp评分和临床信息作为协变量,在训练和验证数据集中分别拟合多变量Cox比例风险模型,以推断当与AFP、分期、性别和年龄相比时cp评分是否为HCC预后的独立预测因素。
所有假设检验均为双侧的,p值<0.05被认为是统计显著的。所有分析均以R 3.2.3版使用以下软件包进行:“glmnet”、“rms”、“pROC”、“limma”、“ROCR”、“varSelRF”、“survival”。
肿瘤DNA提取
从新鲜冷冻的健康或癌症组织提取基因组DNA用QIAamp DNA迷你试剂盒(Qiagen)根据制造商的建议进行。使用约0.5mg的组织来获得平均5μg的基因组DNA。DNA被储存在-20℃,并在制备一周内分析。
从FFPE样品提取DNA
来自冷冻FFPE样品的基因组DNA使用有若干修改的QIAamp DNA FFPE组织试剂盒提取。DNA被储存在-20℃用于进一步分析。
从血浆样品提取无细胞DNA
从1.5ml血浆样品提取cfDNA用QIAamp cfDNA试剂盒(Qiagen)根据制造商的建议进行。
研究了将给出一致的cfDNA回收和可靠的测序覆盖率的血浆的最小体积,所述可靠的测序覆盖定义为靶cg标志物的多于20个读段。示出了至少20,000总读段/样品的要求相当于对于样品中~90%的标志物,20个或更多个读段/cg标志物,并且在良好预测对应cg标志物的β值的方面是准确的。发现对于样品中~90%的标志物,1.5ml或更多的血浆可以给出20个或更多个读段/cg标志物。使用数字液滴PCR进一步研究了1.5ml血浆中的cfDNA的量与拷贝数之间的关系。发现15ng的DNA的量给出了良好的拷贝数,如通过在每个数字液滴PCR测定中>140总拷贝的检测到的扩增子(图39B)定义的,并且最小1.5ml血浆体积给出了15ng的DNA的产量。实验中使用约15ng/1.5ml作为截止值,以获得一致且可靠的DNA量的测量和良好回收。还比较了若干商业cfDNA提取试剂盒(EliteHealth、Qiagen和ThermoFisher)的cfDNA产量。发现EliteHealth或Qiagen cfDNA提取试剂盒以高度一致的方式产生最高的cfDNA量,[~10ng+/-3ng/每1ml血浆,图39C]。
基因组DNA的亚硫酸氢盐转化
使用EZ DNA Methylation-LightningTM试剂盒(Zymo Research)根据制造商的方案将约10-15ng的cfDNA转化为双DNA。所得双DNA具有~200-3000bp的尺寸分布,峰值为约~500-1000bp。如通过双DNA的深度测序及分析CH(非CG)二核苷酸的C至T转化的比率证实的,亚硫酸氢盐转化的效率为>99.8%。
通过用分子倒位(扣锁)探针捕获的双DNA的深度测序确定DNA甲基化水平
将在任何癌症组织和任何正常组织之间的任何比较中甲基化水平显著不同的CpG标志物用于设计用于cfDNA的捕获及测序的扣锁探针。双DNA的扣锁捕获基于具有修改的公布的方法的技术。
探针设计和合成
扣锁探针使用ppDesigner软件设计。捕获区域的平均长度为100bp,CpG标志物位于捕获区域的中央部分。臂之间的接头序列包含扩增引物的结合序列,该结合序列被可变的C链段分隔以产生相等长度的探针。将6-bp独特分子标识符(UMI)序列掺入到探针设计中,以允许鉴定独特的单个分子捕获事件和DNA甲基化水平的准确的评分。参见表19。
探针使用标准商业合成方法(ITD)作为单独的寡核苷酸合成。对于捕获实验,将探针混合,用T4 PNK(NEB)根据制造商的建议进行体外磷酸化,并使用P-30 Micro Bio-Spin柱(Bio-Rad)纯化。
双DNA捕获
将约10ng亚硫酸氢盐转化的DNA与扣锁探针在含有1X Ampligase缓冲液(Epicentre)的20μl反应中混合。为了使探针退火至DNA,在95℃变性30秒,随后以每秒0.02℃的速率缓慢冷却至55℃。在55℃保持15小时以完成杂交。为了填充退火的臂之间的空位,向每个反应中添加5μl的以下混合物:2U的PfuTurboCx聚合酶(Agilent)、0.5U的Ampligase(Epicentre)和1X Ampligase缓冲液中的250pmol的每种dNTP。在55℃孵育5小时后,使反应在94℃变性持续2分钟。添加5μl的核酸外切酶混合物(20U的ExoI和100U的ExoIII,两者均来自Epicentre),并且在37℃持续2小时进行单链DNA降解,随后在94℃持续2分钟使酶失活。
使位点特异性捕获的环状产物通过PCR扩增,同时进行单独样品的条形码化。扩增使用对其中之一包含特异性6bp条形码的扣锁探针内的接头DNA特异性的引物进行。两种引物均包含Illumina下一代测序衔接子序列。PCR如下地进行:1X Phusion Flash主混合物、3μl捕获的DNA和200nM引物,使用以下循环:在98℃10s,8X的(在98℃1s,在58℃5s,在72℃10s),25X的(在98℃1s,在72℃15s),在72℃60s。将PCR反应混合,并且使用AgencourtAMPure XP珠(Beckman Coulter)对所得文库进行大小选择,以包括有效捕获物(~230bp)并排除“空”捕获物(~150bp)。文库的纯度通过使用Illumina流通池衔接子引物(P5和P7)的PCR验证,并且浓度使用Qubit dsDNA HS测定(Thermo Fisher)确定。文库使用MiSeq和HiSeq2500系统(Illumina)测序。
捕获覆盖率均一性的优化
原始试验性捕获实验的深度测序显示出被最有效探针和非有效探针捕获的读段的数目之间的显著差异(60-65%的捕获区域具有率>0.2x平均值的覆盖率)。为了改善这种情况,从测序数据计算相对效率,并以调整的摩尔比混合探针。这使捕获均一性增加至85%的区域具有>0.2x的平均覆盖率。
测序数据分析
测序读段的映射使用具有一些修改的软件工具bisReadMapper进行。首先,从每个测序读段提取UMI,并使用定制脚本将其附加至FASTQ文件内的读段头上。使用Bowtie2将读段在运行中转换,如同所有C是非甲基化的并映射至人类基因组的计算机转换的DNA链,还如同所有C是非甲基化的。将原始读段合并及针对单一UMI过滤,即,携带相同UMI的读段被弃去,留下单一的独特的读段。被扣锁探针捕获的区域内包含的所有CpG二核苷酸的甲基化频率通过将在询问位置处携带C的独特读段的数目除以覆盖询问位置的读段总数计算。
相关甲基化区段(BCM)的鉴定
跨来自两个诊断类别,即正常健康血液和HCC的每一个类别的50个cfDNA样品,分别计算由不多于200bp分隔的每对CpG标志物的甲基化频率之间的皮尔逊相关系数。将皮尔逊r<0.5的值用于鉴定表明非相关甲基化的任何两个相邻标志物之间的过渡点(边界)。将未被边界分隔的标志物组合为相关甲基化区段(BCM)。该程序在我们的扣锁数据内的每个诊断类别中鉴定出总计~1550个BCM,每个区段中组合了2个和22个之间的CpG位置。整个BCM的甲基化频率通过将BCM内所有询问的CpG位置处的C的数目相加并除以这些位置处的C+T的总数计算。
DNA分离和数字定量PCR
肿瘤和对应的血浆样品从经受手术肿瘤切除的患者获得;将样品冷冻并保存在-80℃直至使用。从样品中分离DNA和RNA分别使用AllPrepDNA/RNA迷你试剂盒和cfDNA提取试剂盒(Qiagen,Valencia,CA)进行。
为了评估肿瘤cfDNA分数,用不同分数的正常cfDNA和HCC肿瘤基因组DNA(gDNA)进行混合实验,并且通过数字液滴PCR(ddPCR,详情参见下一节)测定了甲基化值和拷贝数。ddPCR根据制造商的说明书(Bio-Rad,Hercules,CA)进行。ddPCR如下地建立:扩增引物对,cg10590292-正向5'-TGTTAGTTTTTATGGAAGTTT,cg10590292-反向5'-AAACIAACAAAATACTCAAA;用于甲基化的等位基因检测的荧光探针,cg10590292-M 5'/6-FAM/TGGGAGAGCGGGAGAT/BHQ1/-3';用于未甲基化的等位基因检测的探针,cg10590292-NM5'/HEX/TTTGGGAGAGTGGGAGATTT/BHQ1/-3'。循环条件:1X的在98℃10min,40X的(在98℃30s,在53℃60s),1X的在98℃10min。
肿瘤cfDNA分数的计算
假设对HCC cfDNA样品观察到的特定甲基化值由正常cfDNA和肿瘤cfDNA的组合贡献产生。来源于肿瘤的cfDNA的分数使用以下公式来估计:样品i中由肿瘤DNA贡献的分数=[样品i中HCC cfDNA的甲基化值-正常cfDNA的平均甲基化值/[肿瘤DNA的平均甲基化值-正常cfDNA的平均甲基化值]。使用这种方法,估计HCC cfDNA样品中的平均肿瘤分数为约23%。然后将样品根据评估肿瘤负荷的因素,诸如晚期和治疗前状态分组,因为预期这些因素影响ctDNA的肿瘤分数(表20)。事实上,观察到与较高肿瘤分期和严重性相关的状况也倾向于具有较大的肿瘤分数(表20)。为了进一步检验这种方法,用不同分数的正常cfDNA(0-100%)和肿瘤基因组DNA(0-100%)进行了混合实验,并使用数字PCR测定了甲基化值。示出了肿瘤基因组DNA的增量添加可以将甲基化分数百分比增加至在HCC患者样品中观察到的值(图38A-图38C)。具体地,当使用从实验获得的甲基化值时,可以通过以上公式预测10%、20%、40%、60%或100%分数的肿瘤基因组DNA添加。
cfDNA浓度在正常血浆样品和HCC血浆样品中使用荧光染料方法10测量。将从1.5mL血浆样品提取的20ul cfDNA中的1ul稀释在包含dsDNA HS试剂的199ul工作溶液中。发现平均在1mL正常血浆中存在约11ng cfDNA,并且在1mL HCC血浆中存在约22ng cfDNA(图39A)。
患者和样品特征
临床特征和分子分析包括用于比较HCC和血液淋巴细胞之间的甲基化数据,包括来自癌症基因组图谱(TCGA)的377个HCC肿瘤样品和来自对衰老的甲基化研究(GSE40279)中使用的数据集的754个正常样品。为了研究HCC中的ctDNA,从患有HCC的华人患者和随机选择的经受常规医疗保健护理的健康对照获得血浆样品,产生了715名HCC患者和560名正常健康对照的训练组群以及383名HCC患者和275名健康对照的验证组群。所有参与者提供了书面知情同意。所有患者和对照的临床特征在表17中列出。
区分HCC和血液的甲基化标志物的鉴定
假设具有在HCC和正常血液之间的甲基化的最大差异的CpG标志物可能在与正常对照的cfDNA比较时,在HCC患者的cfDNA中显示可检测的甲基化差异。使用了用于缩小方差的采用经验贝叶斯的“调节的t-统计”方法,并且使用了Benjamini-Hochberg程序以将FDR控制在0.05的显著性水平,以得到具有最低的P值的前1000种标志物,鉴定HCC和血液之间最显著不同的甲基化率(图26)。这些前1000种标志物的无监督层级聚类能够区分HCC和正常血液(图30)。设计了对应于这1000种标志物的分子倒位(扣锁)探针并在同一患者的28对HCC组织DNA和匹配的血浆ctDNA中测试。HCC肿瘤DNA和匹配的血浆ctDNA的甲基化谱高度一致,给出了它们作为灵敏的诊断标志物的潜力(图27A、图27B、图34A和图34B)。401种标志物显示出良好的扩增谱和动态甲基化值,并因此被选择为用于进一步分析的良好候选。
用于改善等位基因判定准确性的甲基化区段结构
使用遗传连锁不平衡(LD区段)的概念来研究不同DNA链中的共甲基化程度。使用成对末端Illumina测序读段来鉴定每个单独的甲基化区段(mBlock)。应用皮尔逊相关法来量化共甲基化或mBlock。区域的所有共同mBlock通过计算不同的mBlock分数来汇编。接下来,使用0.5的r2截止值,将基因组划分为被称为甲基化相关区段(MCB)的紧密共甲基化CpG位点。在500个正常样品的cfDNA中检测MCB,并且发现MCB是一致的。然后确定了500个HCC样品的cfDNA中的MCB内的甲基化水平。发现当比较正常cfDNA样品与HCC cfDNA样品时,MCB具有一致的甲基化模式(图31A-图31B)。
用于HCC的ctDNA诊断预测模型
通过随机森林和最小绝对收缩和选择算子(LASSO)方法分析了在cfDNA样品中显示出良好甲基化范围的401种选择的标志物的甲基化值,以通过将它们在715个HCC ctDNA和560个正常cfDNA样品中建模来进一步减少标志物的数目(图26)。使用随机森林分析获得了约24种标志物。使用LASSO分析获得30种标志物,其中要求所选标志物在总计500次重复中出现多于450次。这两种方法之间存在10种重叠的标志物(表15)。使用逻辑回归方法,用这10种标志物构建了诊断预测模型。应用该模型,在715个HCC样品和560个正常样品的训练数据集中得到对于HCC的85.7%的灵敏度和94.3%的特异性(图27C),并在383个HCC样品和275个正常样品的验证数据集中得到83.2%的灵敏度和90.5%的特异性(图27D)。在一些情况中,该模型在训练数据集(AUC=0.966)和验证数据集(AUC=0.944)两者中还区分了HCC与正常对照(图27E和图27F)。对这10种标志物的无监督层级聚类能够以高特异性和灵敏度区分HCC与正常对照(图27G、图27H和图35)。
评估了用于区分肝病(例如,HBV/HCV感染、肝硬化和脂肪肝)和HCC的模型的组合诊断评分(cd评分),因为这些肝病是HCC的已知的风险因素。发现与患有肝病的患者或健康对照相比,cd评分能够区分HCC患者(图28A)。这些结果与通过AFP水平预测的结果一致且相当(图28B)。
甲基化标志物预测的肿瘤负荷、治疗响应和分期
进一步研究了cd评分在评估治疗响应、治疗后残留肿瘤的存在、以及HCC的分期中的效用。在分析中包括了临床特征和人口学特征,诸如年龄、性别、种族和AJCC分期。治疗后具有可检测的残留肿瘤的患者(n=828)的cd评分显著高于不具有可检测的肿瘤的患者(n=270),并且两者均显著高于正常对照(n=835)(p<0.0001,图28C)。相似地,与具有治疗响应的患者(n=248)相比,治疗前(n=109)或具有进展(n=381)的患者的cd评分显著较高(p<0.0001,图28D)。另外,具有手术后完全切除的肿瘤的患者(n=170)的cd评分与手术前的那些cd评分(n=109)相比显著较低,而在具有复发的患者(n=155)中变得较高(p<0.0001,图28E)。另外,在cd评分与肿瘤分期之间存在良好的相关性。患有早期疾病(I、II)的患者与患有晚期疾病(III、IV)的患者相比具有实质上较低的cd评分(p<0.05,图28F)。总体上,这些结果表明cd评分(即,血浆中的ctDNA的量)与肿瘤负荷良好相关,并且可以具有预测肿瘤响应及监测复发的效用。
ctDNA诊断预测模型和AFP的效用
在一些情况中,用于HCC的风险评估及监测的血液生物标志物是血清AFP水平。然而,它的低灵敏度使其不足以检测出所有将发展HCC的患者,并严重限制了其临床效用。在一些情况中,许多肝硬化患者发展HCC,而不具有AFP水平的任何增加。在另外的情况中,HCC研究组群中40%的患者具有正常的AFP值(<25ng/ml)。
在活组织检查证实的HCC患者中,cd评分显示出用于HCC诊断的优于AFP的灵敏度和特异性(AUC 0.969相比于0.816,图28G)。在具有治疗响应、肿瘤复发或进展的患者中,与初始诊断时的测试相比,cd评分显示出比AFP更显著的变化(图28H和图28I)。在具有连续样品的患者中,与治疗前相比,具有阳性治疗响应的患者具有伴随的显著的cd评分的降低,并且在手术后在患者中存在甚至进一步的降低。相比之下,患有进行性或复发性疾病的患者都具有cd评分的增加(图32A-图32B)。相比之下,AFP对于评估个体患者中的治疗效力的灵敏度较低(图33和图36)。
另外,cd评分与肿瘤分期良好相关(图28J),特别是在患有I期、II期和III期的患者中,而除了在III期和IV期患者之间以外,在具有不同分期的患者中,不存在显著差异的AFP值(图28K),表明在区分早期HCC方面cd评分相对于AFP的优势。
用于HCC的ctDNA预后预测模型
研究了使用ctDNA中的甲基化标志物结合临床特征和人口学特征(包括年龄、性别、种族和AJCC分期)用于预测HCC的预后的潜力。将具有完整存活信息的1049名HCC患者以2:1的分配随机分为训练数据集和验证数据集。执行Unicox和LASSO-cox方法来减少维度,并用8标志物的组构建cox模型来预测预后(表16)。Kaplan-Meier曲线在训练数据集和验证数据集中使用这些标志物的组合预后评分(cp评分)生成。高风险组(cp评分>-0.24)具有训练数据集中的具有53个事件的341个观察值,和验证数据集中的具有26个事件的197个观察值;并且低风险组(cp评分≤-0.24)具有训练数据集中的具有7个事件的339个观察值,和验证数据集中的具有9个事件的172个观察值。通过时序检验,中位存活在训练集(p<0.0001)和验证集(p=0.0014)两者中显著不同(图29A和图29B)。
多元变量分析示出了,cp评分与训练数据集和验证数据集二者中的死亡风险显著相关,并且cp评分是独立的存活风险因素(风险比率[HR]:2.512;95%置信区间[CI]:1.966-3.210;训练集中p<0.001;HR:1.553,CI:1.240-1.944;验证集中p<0.001,表18)。令人感兴趣的是,当考虑cp评分和其他临床特征时,AFP作为风险因素不再是显著的(表18)。
TNM分期预测了训练数据集和验证数据集中的患者的预后(图29C、图29D、图37A和图37B)。然而,cp评分和TNM分期的组合改善了在训练数据集(AUC 0.7935)和验证数据集(AUC 0.7586)两者中预测预后的能力。Kaplan-Meier曲线还示出了,通过cp评分和分期二者区别的患者具有显著不同的预后(p<0.0001,图29G)。
表15示出了十种甲基化标志物的特征及其在HCC诊断中的系数。
标志物 参考基因 系数 SE z值 p值
15.595 2.395 6.513 <0.001
cg10428836 BMPR1A 11.543 0.885 -13.040 <0.001
cg26668608 PSD 4.557 0.889 5.129 <0.001
cg25754195 ARHGAP25 2.519 0.722 3.487 <0.001
cg05205842 KLF3 -3.612 0.954 -3.785 <0.001
cg11606215 PLAC8 6.865 1.095 6.271 <0.001
cg24067911 ATXN1 -5.439 0.868 -6.265 <0.001
cg18196829 Chr 6:170 -9.078 1.355 -6.698 <0.001
cg23211949 Chr 6:3 -5.209 1.081 -4.819 <0.001
cg17213048 ATAD2 6.660 1.422 4.683 <0.001
cg25459300 Chr 8:20 1.994 1.029 1.938 <0.053
SE:系数的标准误差;z值:Wald z-静态值
表16示出了八种甲基化标志物的特征及其在HCC预后预测中的系数。
HR:风险比率;CI:95%置信区间;SE:系数的标准误差;z值:Wald z-静态值
表17示出了研究组群的临床特征。
表18示出了用甲基化标志物的cp评分和相关变量对HCC患者的多变量存活分析。
HR:风险比率;CI:95.0%置信区间;SE:系数的标准误差;z值:Wald z统计值
表19示出了本文描述的示例性扣锁序列。
表20示出了来源于根据肿瘤分期和治疗状态分层的肿瘤的HCCcfDNA的分数。具有晚期肿瘤分期的HCC患者和治疗前的HCC患者具有较高的肿瘤cfDNA分数。
肿瘤cfDNA分数±STDEV
肿瘤分期状态
1 0.098±0.020
2 0.161±0.146
3 0.301±0.273
4 0.389±0.178
治疗状态
治疗前* 0.389±0.148
治疗后* 0.109±0.085
*治疗前的组群包括任何治疗(手术或化学治疗)前的患者。治疗后包括对手术或化学治疗具有阳性响应和肿瘤负荷减少的患者。
实施方案1叙述了检测受试者的基因的组中的一种或更多种基因的甲基化状态的方法,所述方法包括:(a)用脱氨剂处理从受试者获得的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;及(b)通过以下步骤来检测选自由BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2、染色体8:20、SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B组成的基因的组的基因中的甲基化状态:(i)使经处理的DNA与在高严格性条件下与所述基因的靶序列杂交的探针接触以生成扩增产物;以及(ii)分析扩增产物以确定所述基因的甲基化状态。
实施方案2:如实施方案1所述的方法,其中探针包括与选自SEQ ID NO:1-18的探针约80%、85%、90%、95%或99%的序列同一性。
实施方案3:如实施方案1所述的方法,其中探针是选自SEQ ID NO:1-18的扣锁探针。
实施方案4:如实施方案1所述的方法,其中基因选自BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATA4D2和染色体8:20。
实施方案5:如实施方案1所述的方法,其中基因选自SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B。
实施方案6:如实施方案1所述的方法,还包括检测来自由BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2、染色体8:20、SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B组成的基因的组的两种或更多种基因的甲基化状态。
实施方案7:如实施方案[0401]所述的方法,其中检测包括在高严格性条件下与探针集杂交,其中探针集与来自基因的组的多达18种且不多于18种基因杂交。
实施方案8:如实施方案1所述的方法,还包括基于所述一种或更多种基因的甲基化状态确定组合诊断评分(cd评分)或组合预后分数(cp评分),其中cd评分和cp评分各自独立地与生物样品中存在的循环肿瘤DNA(ctDNA)的量相关。
实施方案9:如实施方案[0403]所述的方法,其中cd评分和cp评分使用选自以下中的一种或更多种的算法各自独立地确定:主成分分析、逻辑回归分析、最近邻分析、支持向量机和神经网络模型。
实施方案10:如实施方案1所述的方法,其中将生物样品用脱氨剂处理以生成经处理的DNA。
实施方案11:如实施方案1所述的方法,其中受试者被怀疑患有肝细胞癌(HCC)。
实施方案12:如实施方案1所述的方法,其中受试者患有I期、II期、III期或IV期HCC。
实施方案13:如实施方案1所述的方法,其中受试者还用有效量的治疗剂治疗。
实施方案14:如实施方案8所述的方法,其中治疗包括:(a)经导管动脉化学栓塞、射频消融或近距离放射治疗;(b)化学治疗剂或用于靶向疗法的剂;或者(c)手术。
实施方案15:如实施方案9所述的方法,其中化学治疗剂包括顺铂、多柔比星、氟嘧啶、吉西他滨、伊立替康、米托蒽醌、奥沙利铂、沙利度胺或其组合。
实施方案16:如实施方案9所述的方法,其中用于靶向疗法的剂包括阿西替尼、贝伐单抗、西妥昔单抗、埃罗替尼、雷莫芦单抗、瑞戈非尼、索拉非尼、舒尼替尼、胸苷激酶(TK)抑制剂或其组合。
实施方案17:如实施方案1所述的方法,其中生物样品包括血液样品、组织的活组织检查样品或循环肿瘤细胞。
实施方案18叙述了选择被怀疑患有肝细胞癌(HCC)的受试者进行治疗的方法,所述方法包括:(a)使经处理的DNA与在高严格性条件下与选自由以下组成的基因的组的基因的靶序列杂交的探针接触以生成扩增产物:BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2和染色体8:20,其中经处理的DNA是从获得自受试者的生物样品处理的;分析扩增产物以生成所述基因的甲基化谱;(b)将甲基化谱应用于使来自基因的组的基因甲基化谱与HCC的存在相关的模型;(c)评估来自模型的输出以确定受试者是否患有HCC;以及(d)如果确定受试者患有HCC,则向受试者施用有效量的治疗剂。
实施方案19:如实施方案18所述的方法,其中探针包括与选自SEQ ID NO:1-10的探针约80%、85%、90%、95%或99%的序列同一性。
实施方案20:如实施方案18所述的方法,还包括使经处理的DNA与至少一种另外的探针接触以生成另外的扩增产物,所述另外的探针在高严格性条件下与选自基因的组的另外的基因的靶序列杂交,并分析所述另外的扩增产物以生成所述另外的基因的甲基化谱,从而确定受试者中HCC的存在。
实施方案21:如实施方案18所述的方法,其中接触包括在高严格性条件下与探针集杂交,其中探针集与来自基因的组的多达十种且不多于十种基因杂交。
实施方案22:如实施方案18所述的方法,其中将生物样品用脱氨剂处理以生成经处理的DNA。
实施方案23:如实施方案18所述的方法,其中模型包括来自从HCC阳性样品生成的基因的组的基因的甲基化谱。
实施方案24:如实施方案23所述的方法,其中HCC阳性样品包括来自转移性HCC的细胞。
实施方案25:如实施方案18或23所述的方法,其中模型还包括来自从正常样品生成的基因的组的基因的甲基化谱。
实施方案26:如实施方案18或23-25中任一项所述的方法,其中模型是基于来自表15或表16的生物标志物的甲基化谱开发的。
实施方案27:如实施方案18或23-26中任一项所述的方法,其中模型使用选自以下的一种或更多种的算法来开发:主成分分析、逻辑回归分析、最近邻分析、支持向量机和神经网络模型。
实施方案28:如实施方案18所述的方法,还包括将HCC确定为I期、II期、III期或IV期。
实施方案29叙述了选择被怀疑患有肝细胞癌(HCC)或肺癌的受试者进行治疗的方法,所述方法包括(a)使经处理的DNA与在高严格性条件下与选自表2、表6、表7、表9或表10的基因的靶序列杂交的探针接触以生成扩增产物,其中经处理的DNA是从获得自受试者的生物样品处理的;(b)分析扩增产物以生成基因的甲基化谱;(c)将甲基化谱应用于使来自基因的组的基因的甲基化谱与HCC或肺癌的存在相关的模型;(d)评估来自模型的输出以确定受试者是否患有HCC或肺癌;以及(e)如果确定受试者患有HCC或肺癌,则向受试者施用有效量的治疗剂。
实施方案30:如实施方案29所述的方法,还包括使经处理的DNA与在高严格性条件下与选自基因的组的另外的基因的靶序列杂交的至少一种另外的探针接触以生成另外的扩增产物,并分析所述另外的扩增产物以生成所述另外的基因的甲基化谱,从而确定受试者中HCC或肺癌的存在。
实施方案31:如实施方案29所述的方法,其中探针是扣锁探针。
实施方案32:如实施方案29所述的方法,其中将生物样品用脱氨剂处理以生成经处理的DNA。
实施方案33:如实施方案29所述的方法,其中模型包括来自从HCC阳性样品或肺癌阳性样品生成的基因的组的基因的甲基化谱。
实施方案34:如实施方案33所述的方法,其中HCC阳性样品包括来自转移性HCC的细胞。
实施方案35:如实施方案33所述的方法,其中肺癌阳性样品包括来自转移性肺癌的细胞。
实施方案36:如实施方案29或33-35中任一项所述的方法,其中模型还包括来自从正常样品生成的基因的组的基因的甲基化谱。
实施方案37:如实施方案29或33-36中任一项所述的方法,其中模型是基于来自表3、表6、表7、表9或表10的生物标志物的甲基化谱开发的。
实施方案38:如实施方案29或33-37中任一项所述的方法,其中模型使用选自以下中的一种或更多种算法来开发:主成分分析、逻辑回归分析、最近邻分析、支持向量机和神经网络模型。
实施方案39:如实施方案29所述的方法,还包括区分HCC和肺癌。
实施方案40:如实施方案18或29所述的方法,其中治疗包括:(a)经导管动脉化学栓塞、射频消融或近距离放射治疗;(b)化学治疗剂或用于靶向疗法的剂;或者(c)手术。
实施方案41叙述了确定患有肝细胞癌(HCC)的受试者的预后或监测受试者的HCC进展的方法,所述方法包括:(a)用脱氨剂处理从受试者获得的生物样品,以产生包含脱氨基核苷酸的经处理的DNA;(b)从经处理的DNA生成包括选自SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B的一种或更多种基因的甲基化谱;(c)基于一种或更多种基因的甲基化谱获得甲基化评分;以及(d)基于甲基化评分,启动第一治疗,如果受试者经历缓解则降低第一治疗剂的剂量,如果受试者经历复发则启动第二治疗,或者如果受试者变得对第一治疗剂是难治的则切换到第二治疗剂。
实施方案42:如实施方案41所述的方法,其中甲基化评分与至少6个月、1年、1.5年、2年、2.5年、3年、4年、5年或更长时间的存活相关。
实施方案43:如实施方案41所述的方法,其中甲基化评分基于Cox比例风险(PH)回归分析来计算。
实施方案44:如实施方案41所述的方法,其中步骤b)中的生成还包括使经处理的DNA与在高严格性条件下与选自以下的基因的靶序列杂交的探针接触:SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B。
实施方案45:如实施方案41所述的方法,其中探针包括与选自SEQ ID NO:11-18的探针约80%、85%、90%、95%或99%的序列同一性。
实施方案46:如实施方案41所述的方法,其中生成包括在高严格性条件下与探针集杂交,其中探针集与来自基因的组的多达八种且不多于八种基因杂交。
实施方案47叙述了确定患有肝细胞癌(HCC)的受试者的预后或监测受试者的HCC进展的方法,所述方法包括:(a)用脱氨剂处理从受试者获得的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;(b)从经处理的DNA生成包括选自SOCS2、EPSTI1、TIA1、染色体4、染色体6、ZNF323、FOXP4和GRHL2的一种或更多种基因的甲基化谱;(c)基于一种或更多种基因的甲基化谱获得甲基化评分;以及(d)基于甲基化评分,启动第一治疗,如果受试者经历缓解则降低第一治疗剂的剂量,如果受试者经历复发则启动第二治疗,或者如果受试者变得对第一治疗剂是难治的则切换到第二治疗剂。
实施方案48叙述了确定患有肺癌的受试者的预后或监测受试者的肺癌进展的方法,所述方法包括:(a)用脱氨剂处理从受试者获得的生物样品,以生成包含脱氨基核苷酸的经处理的DNA;(b)从经处理的DNA生成包括选自NPBWR1、染色体2、AAK1、SIM1、C10orf46、C17orf101、DEPDC5、ZNF323、GABRA2、PLAC8和ADRA2B的一种或更多种基因的甲基化谱;(c)基于一种或更多种基因的甲基化谱获得甲基化评分;以及(d)基于甲基化评分,启动第一治疗,如果受试者经历缓解则降低第一治疗剂的剂量,如果受试者经历复发则启动第二治疗,或者如果受试者变得对第一治疗剂是难治的则切换到第二治疗剂。
实施方案49:如实施方案47或48所述的方法,其中甲基化评分与至少6个月、1年、1.5年、2年、2.5年、3年、4年、5年或更长时间的存活相关。
实施方案50:如实施方案47或48所述的方法,其中甲基化评分基于Cox比例风险(PH)回归分析来计算。
实施方案51:如实施方案41、47或48中任一项所述的方法,其中第一治疗包括:(a)经导管动脉化学栓塞、射频消融或近距离放射治疗;(b)化学治疗剂或用于靶向疗法的剂;或者(c)手术。
实施方案52:如实施方案41、47或48中任一项所述的方法,其中第二治疗包括:(a)经导管动脉化学栓塞、射频消融或近距离放射治疗;(b)化学治疗剂或用于靶向疗法的剂;或者(c)手术。
实施方案53:如前述实施方案中任一项所述的方法,其中化学治疗剂包括顺铂、多柔比星、氟嘧啶、吉西他滨、伊立替康、米托蒽醌、奥沙利铂、沙利度胺或其组合。
实施方案54:如前述实施方案中任一项所述的方法,其中用于靶向疗法的剂包括阿西替尼、贝伐单抗、西妥昔单抗、埃罗替尼、雷莫芦单抗、瑞戈非尼、索拉非尼、舒尼替尼、胸苷激酶(TK)抑制剂或其组合。
实施方案55:如前述实施方案中任一项所述的方法,其中生物样品包括血液样品、组织的活组织检查样品或循环肿瘤细胞。
实施方案56:如前述实施方案中任一项所述的方法,其中受试者是人类。
实施方案57叙述了诊断受试者的肝细胞癌(HCC)的方法,所述方法包括:(a)从来自受试者的血液样品获得经处理的DNA;(b)使经处理的DNA与在高严格性条件下与选自由以下组成的基因的组的基因的靶序列杂交的探针接触以生成扩增产物:BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2和染色体8:20;(c)分析扩增产物以确定组合诊断评分(cd评分),其中cd评分与血液样品中存在的循环肿瘤DNA(ctDNA)的量相关;以及(d)当cd评分相对于从健康受试者的血液样品获得的cd评分升高时,则诊断受试者患有HCC。
实施方案58:如实施方案57所述的方法,其中探针包括与选自SEQ ID NO:1-10的探针约80%、85%、90%、95%或99%的序列同一性。
实施方案59:如实施方案57所述的方法,其中探针包括与选自SEQ ID NO:1-10的探针约100%的序列同一性或由选自SEQ ID NO:1-10的探针组成。
实施方案60:如实施方案57所述的方法,还包括使经处理的DNA与至少一种另外的探针接触以生成另外的扩增产物,所述另外的探针在高严格性条件下与选自基因的组的另外的基因的靶序列杂交,并分析所述另外的扩增产物以生成另外的cd评分。
实施方案61:如实施方案57所述的方法,其中接触包括在高严格性条件下与探针集杂交,其中探针集与来自基因的组的多达十种且不多于十种基因杂交。
实施方案62:如实施方案57所述的方法,其中将血液样品用脱氨剂处理以生成经处理的DNA。
实施方案63:如实施方案57所述的方法,还包括将HCC确定为I期、II期、III期或IV期。
实施方案64:如实施方案57所述的方法,其中受试者还用有效量的治疗剂治疗。
实施方案65:如实施方案64所述的方法,其中治疗包括:(a)经导管动脉化学栓塞、射频消融或近距离放射治疗;(b)化学治疗剂或用于靶向疗法的剂;或者(c)手术。
实施方案66:如实施方案57-65中任一项所述的方法,其中化学治疗剂包括顺铂、多柔比星、氟嘧啶、吉西他滨、伊立替康、米托蒽醌、奥沙利铂、沙利度胺或其组合。
实施方案67:如实施方案57-65中任一项所述的方法,其中用于靶向疗法的剂包括阿西替尼、贝伐单抗、西妥昔单抗、埃罗替尼、雷莫芦单抗、瑞戈非尼、索拉非尼、舒尼替尼、胸苷激酶(TK)抑制剂或其组合。
实施方案68:如实施方案57所述的方法,其中cd评分相对于从健康受试者的血液样品获得的cd评分升高约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍或更多。
实施方案69:如实施方案57所述的方法,其中cd评分相对于从健康受试者的血液样品获得的cd评分升高约5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更多。
实施方案70:如实施方案57所述的方法,其中cd评分基于来自基因的组的一种或更多种基因的甲基化状态。
实施方案71:如实施方案57所述的方法,其中cd评分使用选自以下中的一种或更多种算法来确定:主成分分析、逻辑回归分析、最近邻分析、支持向量机和神经网络模型。
实施方案72叙述了确定患有肝细胞癌(HCC)的受试者的预后的方法,所述方法包括:(a)从来自受试者的血液样品获得经处理的DNA;(b)使经处理的DNA与在高严格性条件下与选自由以下组成的基因的组的基因的靶序列杂交的探针接触以产生扩增产物:SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B;(c)分析扩增产物以确定组合预后评分(cp评分),其中cp评分与血液样品中存在的循环肿瘤DNA(ctDNA)的量相关;以及(d)当cp评分相对于从健康受试者的血液样品获得的cp评分升高时,确定患有HCC的受试者的预后。
实施方案73:如实施方案72所述的方法,其中探针包括与选自SEQ ID NO:11-18的探针约80%、85%、90%、95%或99%的序列同一性。
实施方案74:如实施方案72所述的方法,其中探针包括与选自SEQ ID NO:11-18的探针约100%的序列同一性或由选自SEQ ID NO:11-18的探针组成。
实施方案75:如实施方案72所述的方法,其中cp评分与至少6个月、1年、1.5年、2年、2.5年、3年、4年、5年或更长时间的存活相关。
实施方案76:如实施方案72所述的方法,还包括使经处理的DNA与在高严格性条件下与选自基因的组的另外的基因的靶序列杂交的至少一种另外的探针接触以生成另外的扩增产物,并分析所述另外的扩增产物以生成另外的cp评分。
实施方案77:如实施方案72所述的方法,其中生成包括在高严格性条件下与探针集杂交,其中探针集与来自基因的组的多达八种且不多于八种基因杂交。
实施方案78:如实施方案72所述的方法,其中cp评分相对于从健康受试者的血液样品获得的cd评分升高约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍或更多。
实施方案79:如实施方案72所述的方法,其中cp评分相对于从健康受试者的血液样品获得的cd评分升高约5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更多。
实施方案80:如实施方案72所述的方法,其中cp评分基于来自基因的组的一种或更多种基因的甲基化状态。
实施方案81:如实施方案72所述的方法,其中cp评分使用选自以下中的一种或更多种算法来确定:主成分分析、逻辑回归分析、最近邻分析、支持向量机和神经网络模型。
实施方案82:如实施方案72所述的方法,其中在确定受试者的预后之前,用HCC的治疗剂治疗所述受试者。
实施方案83:如实施方案72所述的方法,其中受试者是未被治疗的受试者(naivesubject)或未被HCC的治疗剂治疗的受试者。
实施方案84:如前述实施方案中任一项所述的方法,其中受试者是人类。
虽然本文已经示出并描述了本公开内容的优选实施方案,但对于本领域技术人员将明显的是,这些实施方案仅通过示例的方式提供。本领域技术人员现在将想到许多变化、改变和替换,而不偏离本公开内容。应当理解,本文描述的本公开内容的实施方案的多种替代方案可以被用于实践本公开内容。以下权利要求意图限定本公开内容的范围,并且从而涵盖在这些权利要求范围内的方法和结构及其等同物。

Claims (28)

1.一种诊断受试者的肝细胞癌(HCC)的方法,所述方法包括:
a)从来自所述受试者的血液样品获得经处理的DNA;
b)使所述经处理的DNA与探针接触以生成扩增产物,所述探针在高严格性条件下与选自由以下组成的基因的组的基因的靶序列杂交:BMPR1A、PSD、ARHGAP25、KLF3、PLAC8、ATXN1、染色体6:170、染色体6:3、ATAD2和染色体8:20;
c)分析所述扩增产物以确定组合诊断评分(cd评分),其中所述cd评分与所述血液样品中存在的循环肿瘤DNA(ctDNA)的量相关;并且
d)当所述cd评分相对于从健康受试者的血液样品获得的cd评分升高时,则诊断所述受试者患有HCC。
2.如权利要求1所述的方法,其中所述探针包括与选自SEQ ID NO:1-10的探针约80%、85%、90%、95%或99%的序列同一性。
3.如权利要求1所述的方法,其中所述探针包括与选自SEQ ID NO:1-10的探针约100%的序列同一性或由选自SEQ ID NO:1-10的探针组成。
4.如权利要求1所述的方法,还包括使所述经处理的DNA与至少一种另外的探针接触以生成另外的扩增产物,所述另外的探针在高严格性条件下与选自所述基因的组的另外的基因的靶序列杂交,并分析所述另外的扩增产物以生成另外的cd评分。
5.如权利要求1所述的方法,其中所述接触包括在高严格性条件下与探针集杂交,其中所述探针集与来自所述基因的组的多达十种且不多于十种基因杂交。
6.如权利要求1所述的方法,其中将所述血液样品用脱氨剂处理以生成所述经处理的DNA。
7.如权利要求1所述的方法,还包括将所述HCC确定为I期、II期、III期或IV期。
8.如权利要求1所述的方法,其中所述受试者还用有效量的治疗剂来治疗。
9.如权利要求8所述的方法,其中所述治疗包括:
a)经导管动脉化学栓塞、射频消融或近距离放射治疗;
b)化学治疗剂或用于靶向疗法的剂;或者
c)手术。
10.如权利要求9所述的方法,其中所述化学治疗剂包括顺铂、多柔比星、氟嘧啶、吉西他滨、伊立替康、米托蒽醌、奥沙利铂、沙利度胺或其组合。
11.如权利要求9所述的方法,其中所述用于靶向疗法的剂包括阿西替尼、贝伐单抗、西妥昔单抗、埃罗替尼、雷莫芦单抗、瑞戈非尼、索拉非尼、舒尼替尼、胸苷激酶(TK)抑制剂或其组合。
12.如权利要求1所述的方法,其中所述cd评分相对于从健康受试者的血液样品获得的cd评分升高约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍或更多。
13.如权利要求1所述的方法,其中所述cd评分相对于从健康受试者的血液样品获得的cd评分升高约5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更多。
14.如权利要求1所述的方法,其中所述cd评分基于来自所述基因的组的一种或更多种基因的甲基化状态。
15.如权利要求1所述的方法,其中所述cd评分使用选自以下中的一种或更多种算法来确定:主成分分析、逻辑回归分析、最近邻分析、支持向量机和神经网络模型。
16.一种确定患有肝细胞癌(HCC)的受试者的预后的方法,所述方法包括:
a)从来自所述受试者的血液样品获得经处理的DNA;
b)使所述经处理的DNA与探针接触以生成扩增产物,所述探针在高严格性条件下与选自由以下组成的基因的组的基因的靶序列杂交:SH3PXD2A、C11orf9、PPFIA1、染色体17:78、SERPINB5、NOTCH3、GRHL2和TMEM8B;
c)分析所述扩增产物以确定组合预后评分(cp评分),其中所述cp评分与所述血液样品中存在的循环肿瘤DNA(ctDNA)的量相关;并且
d)当所述cp评分相对于从健康受试者的血液样品获得的cp评分升高时,确定所述患有HCC的受试者的预后。
17.如权利要求16所述的方法,其中所述探针包括与选自SEQ ID NO:11-18的探针约80%、85%、90%、95%或99%的序列同一性。
18.如权利要求16所述的方法,其中所述探针包括与选自SEQ ID NO:11-18的探针约100%的序列同一性或由选自SEQ ID NO:11-18的探针组成。
19.如权利要求16所述的方法,其中所述cp评分与至少6个月、1年、1.5年、2年、2.5年、3年、4年、5年或更长时间的存活相关。
20.如权利要求16所述的方法,还包括使所述经处理的DNA与至少一种另外的探针接触以生成另外的扩增产物,所述另外的探针在高严格性条件下与选自所述基因的组的另外的基因的靶序列杂交,并分析所述另外的扩增产物以生成另外的cp评分。
21.如权利要求16所述的方法,其中所述生成包括在高严格性条件下与探针集杂交,其中所述探针集与来自所述基因的组的多达八种且不多于八种基因杂交。
22.如权利要求16所述的方法,其中所述cp评分相对于从健康受试者的血液样品获得的cd评分升高约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍或更多。
23.如权利要求16所述的方法,其中所述cp评分相对于从健康受试者的血液样品获得的cd评分升高约5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更多。
24.如权利要求16所述的方法,其中所述cp评分基于来自所述基因的组的一种或更多种基因的甲基化状态。
25.如权利要求16所述的方法,其中所述cp评分使用选自以下中的一种或更多种算法来确定:主成分分析、逻辑回归分析、最近邻分析、支持向量机和神经网络模型。
26.如权利要求16所述的方法,其中在确定所述受试者的预后之前,所述受试者被用于HCC的治疗剂治疗。
27.如权利要求16所述的方法,其中所述受试者是未被治疗的受试者或未被用于HCC的治疗剂治疗的受试者。
28.如权利要求1或权利要求16所述的方法,其中所述受试者是人类。
CN201880029707.1A 2017-03-02 2018-03-02 用于诊断肝细胞癌和肺癌的甲基化标志物 Active CN110603329B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201762466328P 2017-03-02 2017-03-02
US201762466329P 2017-03-02 2017-03-02
US62/466,329 2017-03-02
US62/466,328 2017-03-02
US201762569462P 2017-10-06 2017-10-06
US62/569,462 2017-10-06
PCT/US2018/020761 WO2018161031A1 (en) 2017-03-02 2018-03-02 Methylation markers for diagnosing hepatocellular carcinoma and lung cancer

Publications (2)

Publication Number Publication Date
CN110603329A true CN110603329A (zh) 2019-12-20
CN110603329B CN110603329B (zh) 2023-12-05

Family

ID=63370299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880029707.1A Active CN110603329B (zh) 2017-03-02 2018-03-02 用于诊断肝细胞癌和肺癌的甲基化标志物

Country Status (5)

Country Link
US (3) US10513739B2 (zh)
EP (1) EP3589371A4 (zh)
CN (1) CN110603329B (zh)
BR (1) BR112019018272A2 (zh)
WO (1) WO2018161031A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112280865A (zh) * 2020-11-17 2021-01-29 圣湘生物科技股份有限公司 一种用于检测肝癌的试剂组合,试剂盒及其用途
CN112397150A (zh) * 2021-01-20 2021-02-23 臻和(北京)生物科技有限公司 基于目标区域捕获测序的ctDNA甲基化水平预测装置及方法
CN112410425A (zh) * 2020-11-09 2021-02-26 天津脉络生物科技有限公司 用于肝癌早期筛查的基因甲基化数字pcr试剂盒及其应用
CN112662764A (zh) * 2020-03-17 2021-04-16 博尔诚(北京)科技有限公司 一种检测11种癌症的探针组合物
CN112899359A (zh) * 2021-01-27 2021-06-04 广州市基准医疗有限责任公司 用于肺结节良恶性检测的甲基化标记物或其组合及应用
CN112908477A (zh) * 2021-01-28 2021-06-04 黑龙江省医院 一种用于胃癌患者的预后风险评估系统
WO2021185274A1 (zh) * 2020-03-17 2021-09-23 博尔诚(北京)科技有限公司 一种检测6种中国高发癌症的探针组合物
CN113621691A (zh) * 2021-09-27 2021-11-09 广东省妇幼保健院 基于一代测序技术直接检测KLF1基因启动子区CpG甲基化的方法和试剂盒
CN113637759A (zh) * 2021-09-23 2021-11-12 南京求臻基因科技有限公司 一种用于肺癌早期筛查的组合物及试剂盒、以及肺癌早期ctDNA甲基化的检测方法
CN115578307A (zh) * 2022-05-25 2023-01-06 广州市基准医疗有限责任公司 一种肺结节良恶性分类方法及相关产品
CN116092680A (zh) * 2023-03-08 2023-05-09 成都工业学院 基于随机森林算法的腹主动脉瘤早期预测方法及系统
CN116083581A (zh) * 2022-12-27 2023-05-09 广州优泽生物技术有限公司 一种用于检测早期消化道肿瘤的试剂盒
CN117327708A (zh) * 2023-11-14 2024-01-02 北京大学 Ppfia1在肝细胞癌治疗、诊断以及预后评估中的应用

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10093986B2 (en) 2016-07-06 2018-10-09 Youhealth Biotech, Limited Leukemia methylation markers and uses thereof
EP3481403B1 (en) 2016-07-06 2022-02-09 Youhealth Biotech, Limited Solid tumor methylation markers and uses thereof
US11961589B2 (en) 2017-11-28 2024-04-16 Grail, Llc Models for targeted sequencing
US20230026916A1 (en) * 2018-07-05 2023-01-26 Active Genomes Expressed Diagnostics, Inc Viral Oncogene Influences and Gene Expression Patterns as Indicators of Early Tumorigenesis
AU2019351130A1 (en) 2018-09-27 2021-04-08 Grail, Llc Methylation markers and targeted methylation probe panel
US20200203016A1 (en) * 2018-12-19 2020-06-25 Grail, Inc. Cancer tissue source of origin prediction with multi-tier analysis of small variants in cell-free dna samples
US20200239965A1 (en) * 2018-12-21 2020-07-30 Grail, Inc. Source of origin deconvolution based on methylation fragments in cell-free dna samples
PT3914736T (pt) * 2019-01-25 2024-03-27 Grail Inc Deteção de cancro, tecido do cancro de origem e/ou um tipo de celula de cancro
KR102068310B1 (ko) * 2019-02-28 2020-01-20 주식회사 레피다인 간암 재발 예측용 dna 메틸화 마커 및 이의 용도
KR102103885B1 (ko) * 2019-10-08 2020-04-24 주식회사 레피다인 생물학적 시료의 간 조직 유래 여부를 판별하는 방법
CA3154466A1 (en) * 2019-10-11 2021-04-15 Qinwen LIU Cancer classification with tissue of origin thresholding
US20220162676A1 (en) * 2019-12-23 2022-05-26 Active Motif, Inc. Methods and Kits for Detection of N-4-acetyldeoxycytidine in DNA
EP4130289A4 (en) * 2020-03-25 2023-09-13 FUJIFILM Corporation METHOD AND PROGRAM FOR CALCULATION OF BASE METHYLATION LEVELS
US20240093318A1 (en) * 2020-06-23 2024-03-21 The Regents Of The University Of Colorado, A Body Corporate Method for diagnosing respiratory pathogens and predicting covid-19 related outcomes
CN112011619A (zh) * 2020-09-17 2020-12-01 山东大学深圳研究院 Sfrp2作为标志物在乙型肝炎病毒相关肝细胞癌早期诊断中的应用及检测试剂盒
WO2022226231A1 (en) * 2021-04-21 2022-10-27 Helio Health Inc. Liver cancer methylation and protein markers and their uses
JP2024519082A (ja) * 2021-05-21 2024-05-08 オフィオミクス-インベスティガカオ イー デセンボルヴィメント エン バイオテクノロジア エスエー 肝細胞がんのdnaメチル化バイオマーカー
US11781175B1 (en) 2022-06-02 2023-10-10 H42, Inc. PCR-based epigenetic age prediction
US20230154560A1 (en) * 2021-11-12 2023-05-18 H42, Inc. Epigenetic Age Predictor
CN114657247B (zh) * 2022-02-28 2022-12-02 北京莱盟君泰国际医疗技术开发有限公司 用于早期肝癌检测的dna甲基化生物标记物或组合及其应用
CN114606316A (zh) * 2022-03-12 2022-06-10 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 一种nk/t细胞淋巴瘤早期诊断和预后预测模型构建方法
CN114921555B (zh) * 2022-06-22 2022-11-11 中国医学科学院肿瘤医院 用于早期肝癌检测的dna甲基化生物标记物、应用及试剂盒

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014082067A1 (en) * 2012-11-26 2014-05-30 The Johns Hopkins University Methods and compositions for diagnosing and treating gastric cancer
US20160210403A1 (en) * 2015-01-18 2016-07-21 The Regents Of The University Of California Method and system for determining cancer status

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5525462A (en) 1991-05-02 1996-06-11 Toyo Boseki Kabushiki Kaisha Nucleic acid sequence amplification method, detection method, and reagent kit therefor
US6033854A (en) 1991-12-16 2000-03-07 Biotronics Corporation Quantitative PCR using blocking oligonucleotides
WO1995006137A1 (en) 1993-08-27 1995-03-02 Australian Red Cross Society Detection of genes
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9517955D0 (en) 1995-07-25 1995-11-08 Univ Strathclyde Nucleotide sequence detection and analysis
US5985557A (en) 1996-01-24 1999-11-16 Third Wave Technologies, Inc. Invasive cleavage of nucleic acids
US6852487B1 (en) 1996-02-09 2005-02-08 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
EP2369007B1 (en) 1996-05-29 2015-07-29 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
US6017704A (en) 1996-06-03 2000-01-25 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US5786146A (en) 1996-06-03 1998-07-28 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US5858665A (en) 1996-07-25 1999-01-12 Navix, Inc. Homogeneous diagnostic assay method utilizing simultaneous target and signal amplification
CA2268069A1 (en) 1996-10-04 1998-04-09 Chronix Biomedical Diagnostic detection of nucleic acids
JPH10253632A (ja) 1997-03-10 1998-09-25 Nissui Pharm Co Ltd 分析方法、キット及び装置
US6558901B1 (en) 1997-05-02 2003-05-06 Biomerieux Vitek Nucleic acid assays
US6054276A (en) 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
WO1999057321A1 (en) 1998-05-01 1999-11-11 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and dna molecules
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
US7700324B1 (en) 1998-11-03 2010-04-20 The Johns Hopkins University School Of Medicine Methylated CpG island amplification (MCA)
US6331393B1 (en) 1999-05-14 2001-12-18 University Of Southern California Process for high-throughput DNA methylation analysis
US6180349B1 (en) 1999-05-18 2001-01-30 The Regents Of The University Of California Quantitative PCR method to enumerate DNA copy number
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
DE10130800B4 (de) 2001-06-22 2005-06-23 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierung mit hoher Sensitivität
WO2003064700A2 (en) 2002-01-30 2003-08-07 Epigenomics Ag Identification of cell differentiation states based on methylation patterns
CA2489360C (en) 2002-06-26 2013-01-29 Cold Spring Harbor Laboratory Methods and compositions for determining methylation profiles
DE602004019941D1 (de) 2003-07-31 2009-04-23 Sequenom Inc Verfahren für multiplex-polymerasekettenreaktionen auf hohem niveau und homogenen massenverlängerungsreaktionen zur genotypisierung von polymorphismen
US20060183128A1 (en) 2003-08-12 2006-08-17 Epigenomics Ag Methods and compositions for differentiating tissues for cell types using epigenetic markers
ES2383970T3 (es) 2003-10-21 2012-06-27 Orion Genomics, Llc Fragmentación enzimática diferencial
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US7459274B2 (en) 2004-03-02 2008-12-02 Orion Genomics Llc Differential enzymatic fragmentation by whole genome amplification
JP2005328709A (ja) 2004-05-18 2005-12-02 Toyobo Co Ltd 高速dnaポリメラーゼを用いた高速pcr
US7643818B2 (en) 2004-11-22 2010-01-05 Seven Networks, Inc. E-mail messaging to/from a mobile terminal
CA2589487C (en) 2004-11-29 2014-07-29 Klinikum Der Universitat Regensburg Means and methods for detecting methylated dna
US20080261217A1 (en) 2006-10-17 2008-10-23 Melnikov Anatoliy A Methylation Profile of Cancer
GB0700374D0 (en) 2007-01-09 2007-02-14 Oncomethylome Sciences S A NDRG family methylation markers
US8911937B2 (en) 2007-07-19 2014-12-16 Brainreader Aps Method for detecting methylation status by using methylation-independent primers
WO2009021141A1 (en) 2007-08-07 2009-02-12 The Johns Hopkins University Comprehensive high throughput arrays for relative methylation
EP2053131A1 (en) 2007-10-19 2009-04-29 Ludwig-Maximilians-Universität München Method for determining methylation at deoxycytosine residues
WO2012006181A2 (en) * 2010-06-29 2012-01-12 Mount Sinai School Of Medicine Compositions and methods for inhibiting oncogenic micrornas and treatment of cancer
WO2012031329A1 (en) 2010-09-10 2012-03-15 Murdoch Childrens Research Institute Assay for detection and monitoring of cancer
JP2013545439A (ja) * 2010-09-17 2013-12-26 プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ 多能性幹細胞の有用性および安全性の特徴決定を行うための機能的ゲノミクスアッセイ
EP2665834A1 (en) 2011-01-20 2013-11-27 Université Libre de Bruxelles Epigenetic portraits of human breast cancers
GB201102014D0 (en) 2011-02-04 2011-03-23 Ucl Business Plc Method for predicting risk of developing cancer
US20140094380A1 (en) 2011-04-04 2014-04-03 The Board Of Trustees Of The Leland Stanford Junior University Methylation Biomarkers for Diagnosis of Prostate Cancer
WO2012149171A1 (en) 2011-04-27 2012-11-01 The Regents Of The University Of California Designing padlock probes for targeted genomic sequencing
CA2845179A1 (en) 2011-08-31 2013-03-07 Genentech, Inc. Diagnostic markers
US8846316B2 (en) 2012-04-30 2014-09-30 Industrial Technology Research Institute Biomarker for human liver cancer
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
WO2015013654A1 (en) * 2013-07-26 2015-01-29 Integrated Diagnostics, Inc. Compositions, methods and kits for diagnosis of lung cancer
WO2018009696A1 (en) 2016-07-06 2018-01-11 Youhealth Biotech, Limited Colon cancer methylation markers and uses thereof
US10093986B2 (en) 2016-07-06 2018-10-09 Youhealth Biotech, Limited Leukemia methylation markers and uses thereof
EP3481941A4 (en) 2016-07-06 2020-04-15 Youhealth Biotech, Limited BREAST AND OVARY CANCER METHYLATION MARKERS AND USES THEREOF
EP3481953A4 (en) * 2016-07-06 2020-04-15 Youhealth Biotech, Limited SPECIFIC METHYLATION MARKERS OF LIVER CANCER AND USES THEREOF
EP3481403B1 (en) 2016-07-06 2022-02-09 Youhealth Biotech, Limited Solid tumor methylation markers and uses thereof
WO2018009709A1 (en) 2016-07-06 2018-01-11 Youhealth Biotech, Limited Lung cancer methylation markers and uses thereof
CN106947830B (zh) 2017-05-16 2019-10-08 中山大学附属肿瘤医院 用于诊断、预测肝癌疗效和预后的基因甲基化面板

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014082067A1 (en) * 2012-11-26 2014-05-30 The Johns Hopkins University Methods and compositions for diagnosing and treating gastric cancer
US20160210403A1 (en) * 2015-01-18 2016-07-21 The Regents Of The University Of California Method and system for determining cancer status
CN108064314A (zh) * 2015-01-18 2018-05-22 加利福尼亚大学董事会 判定癌症状态之方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
MIN-AE SONG等: "Elucidating the Landscape of Aberrant DNA Methylation in Hepatocellular Carcinoma" *
PENGJUN ZHANG等: "Methylation profiling of serum DNA from hepatocellular carcinoma patients using an Infinium Human Methylation 450 BeadChip" *
WAY-CHAMP MAH等: "DNA methylation: potential biomarker in Hepatocellular Carcinoma" *
YANGXING ZHAO等: "Genome-wide methylation profiling of the different stages of hepatitis B virus-related hepatocellular carcinoma development in plasma cell-free DNA reveals potential biomarkers for early detection and high-risk monitoring of hepatocellular carcinoma" *
丁浩等: "血浆中多基因联合甲基化检测在肺癌诊断中的应用" *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112662764A (zh) * 2020-03-17 2021-04-16 博尔诚(北京)科技有限公司 一种检测11种癌症的探针组合物
WO2021185274A1 (zh) * 2020-03-17 2021-09-23 博尔诚(北京)科技有限公司 一种检测6种中国高发癌症的探针组合物
CN112410425A (zh) * 2020-11-09 2021-02-26 天津脉络生物科技有限公司 用于肝癌早期筛查的基因甲基化数字pcr试剂盒及其应用
CN112280865A (zh) * 2020-11-17 2021-01-29 圣湘生物科技股份有限公司 一种用于检测肝癌的试剂组合,试剂盒及其用途
CN112397150A (zh) * 2021-01-20 2021-02-23 臻和(北京)生物科技有限公司 基于目标区域捕获测序的ctDNA甲基化水平预测装置及方法
CN112899359A (zh) * 2021-01-27 2021-06-04 广州市基准医疗有限责任公司 用于肺结节良恶性检测的甲基化标记物或其组合及应用
CN112908477A (zh) * 2021-01-28 2021-06-04 黑龙江省医院 一种用于胃癌患者的预后风险评估系统
CN113637759A (zh) * 2021-09-23 2021-11-12 南京求臻基因科技有限公司 一种用于肺癌早期筛查的组合物及试剂盒、以及肺癌早期ctDNA甲基化的检测方法
CN113621691A (zh) * 2021-09-27 2021-11-09 广东省妇幼保健院 基于一代测序技术直接检测KLF1基因启动子区CpG甲基化的方法和试剂盒
CN115578307A (zh) * 2022-05-25 2023-01-06 广州市基准医疗有限责任公司 一种肺结节良恶性分类方法及相关产品
CN115578307B (zh) * 2022-05-25 2023-09-15 广州市基准医疗有限责任公司 一种肺结节良恶性分类方法及相关产品
CN116083581A (zh) * 2022-12-27 2023-05-09 广州优泽生物技术有限公司 一种用于检测早期消化道肿瘤的试剂盒
CN116083581B (zh) * 2022-12-27 2023-12-08 广州优泽生物技术有限公司 一种用于检测早期消化道肿瘤的试剂盒
CN116092680A (zh) * 2023-03-08 2023-05-09 成都工业学院 基于随机森林算法的腹主动脉瘤早期预测方法及系统
CN116092680B (zh) * 2023-03-08 2023-06-09 成都工业学院 基于随机森林算法的腹主动脉瘤早期预测方法及系统
CN117327708A (zh) * 2023-11-14 2024-01-02 北京大学 Ppfia1在肝细胞癌治疗、诊断以及预后评估中的应用

Also Published As

Publication number Publication date
US20180274039A1 (en) 2018-09-27
CN110603329B (zh) 2023-12-05
US20200263256A1 (en) 2020-08-20
US10513739B2 (en) 2019-12-24
EP3589371A4 (en) 2020-11-25
US20230348992A1 (en) 2023-11-02
EP3589371A1 (en) 2020-01-08
WO2018161031A1 (en) 2018-09-07
BR112019018272A2 (pt) 2020-07-28

Similar Documents

Publication Publication Date Title
CN110603329B (zh) 用于诊断肝细胞癌和肺癌的甲基化标志物
CN111742062B (zh) 用于诊断癌症的甲基化标志物
EP3245604B1 (en) Method and system for determining cancer status
US10544467B2 (en) Solid tumor methylation markers and uses thereof
US11396678B2 (en) Breast and ovarian cancer methylation markers and uses thereof
US20190300964A1 (en) Colon cancer methylation markers and uses thereof
US20190345560A1 (en) Lung cancer methylation markers and uses thereof
US20190300965A1 (en) Liver cancer methylation markers and uses thereof
US20210115518A1 (en) Leukemia methylation markers and uses thereof
WO2022226231A1 (en) Liver cancer methylation and protein markers and their uses

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant