CN107326065B - 一种基因标识物的筛选方法及其应用 - Google Patents
一种基因标识物的筛选方法及其应用 Download PDFInfo
- Publication number
- CN107326065B CN107326065B CN201610280833.7A CN201610280833A CN107326065B CN 107326065 B CN107326065 B CN 107326065B CN 201610280833 A CN201610280833 A CN 201610280833A CN 107326065 B CN107326065 B CN 107326065B
- Authority
- CN
- China
- Prior art keywords
- cancer
- tissue
- index
- methylation
- gene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Abstract
本发明提供了一种甲基化基因标识物的筛选方法,所述方法包括:1)选取特定组织,并筛选在所述特定组织中与其它组织相比具有统计学显著性的差异甲基化的甲基化基因标识物;2)在由步骤1)筛选出的甲基化基因标识物中,进一步筛选在其它组织中具有较低甲基化水平的甲基化基因标识物;3)在由步骤2)筛选出的甲基化基因标识物中,进一步筛选在外周血白细胞中具有较低甲基化水平的甲基化基因标识物;4)经过步骤3)筛选出的甲基化基因或其片段即为所述特定组织的特异性甲基化基因标识物;其中,所述特定组织选自健康组织和/或癌症组织。本发明可用于多种癌症的平行筛查,提高筛查效率,降低筛查成本。
Description
技术领域
本发明涉及基因检测,尤其涉及基因标识物的筛选、基因标识物的组合应用和将该基因标识物组合用于疾病的体外诊断。
背景技术
癌症是一类严重危及公共健康的疾病。世界卫生组织下属的国际癌症研究机构公布的有关全球癌症状况的最新数据(GLOBOCAN2012)显示:2012年全球新增约1410万例癌症病例,癌症死亡人数达820万;与2008年的数据相比,2012年新增癌症病例增加11%,癌症死亡人数增加8.3%。该机构根据现有数据预计,由于人口增长和老龄化,到2025年前,全球每年新增癌症病例数将高达1930万例。近年来由于人口结构和人们生活方式的改变,我国癌症发病率与死亡率呈持续上升趋势。2013年全国肿瘤登记中心发布的《2012中国肿瘤登记年报》的数据显示:中国每年新发癌症病例约350万,因癌症死亡约250万,全国每6分钟就有1人被确诊为癌症,每天有8550人成为癌症患者,每7到8人中就有1人死于癌症。未来10年,中国的癌症发病率与死亡率仍将继续攀升;预计到2020年,中国每年的癌症死亡总数将达300万左右,患病总数将达660万。
癌症死亡率高,治愈率低。这一临床特征的一个重要原因是早期癌症的确诊率低。由于早期癌症缺乏明显和特异性的症状,同时目前缺乏灵敏、准确、无创、方便的早期癌症检测和筛查技术,导致绝大部分患者确诊时,癌症已经发展至中晚期,部分甚至已经发生病灶转移;癌症进入这个阶段后,大部分治疗手段的有效性已经显著下降。临床研究发现,多数癌症从病灶开始形成,到患者出现临床症状的过程平均需要数年时间,这为发现早期癌症、提高早期癌症的确诊率提供了一个有效的窗口期。因此,充分利用这个窗口期,研发灵敏、准确、无创、方便的早期癌症的检测和筛查技术,提高早期癌症的发现率,是改善癌症治疗效果、降低癌症死亡率的重要途径。
现有癌症筛查和检测技术主要包括影像学(如:X-光、CT、MRI等)和血清学检测(如:CEA、CA125、CA199、PSA等)。这些传统方法由于技术的限制,难以广泛用于早期癌症的检测和筛查:1)灵敏性和特异性低(如:多数血清学标识物的准确性偏低,且对早期癌症不灵敏;低剂量螺旋CT检测肺癌的假阳性率高,显著提高了过度治疗的风险);2)操作复杂、侵入性强(如:肠镜、胃镜等);3)检测成本高(如:CT、MRI需要昂贵的设备,和专业培训的技术人员);4)检测方法通常是对单一癌症进行检测,不适用于多种癌症的早期筛查。
国内外多年研究证明:表观遗传学在癌症的发生和发展中起着极其重要的作用。作为表观遗传学的一种重要机制,基因甲基化在多种癌症(如:肠癌、胃癌、和肺癌等)中的调控得到了深入的研究。大量研究显示:基因甲基化的调控与染色质结构和基因表达调控等生物学机制相关联;细胞基因甲基化异常出现在癌症发生的早期,并贯穿癌症的发生和发展过程;抑癌基因的甲基化是癌前病变组织转化为恶性肿瘤细胞的重要分子机制。不同癌症细胞的基因组DNA发生的甲基化既具有一定的共性,也存在不同种类癌症的特异性,这些癌症特异性甲基化DNA(基因)与相应癌症的发生、发展密切相关,成为相应癌症的标识物。
癌症细胞在其形成、生长和演化过程中,由于死亡、凋亡以及其他机制,会将其基因组DNA释放进入外周血中;这些基因组DNA承载着癌症甲基化基因标识物;通过灵敏、准确的方法检测这些外周血游离甲基化基因标识物,可以实现癌症细胞的液相活检。这种方法具有多种优点:1)灵敏性、特异性高;2)操作方便、快捷;3)检测成本低;4)可用于多种癌症的平行筛查,提高筛查效率,降低筛查成本。
发明内容
基于上述背景技术,本发明的目的在于提供一种通过综合分析基因甲基化谱(methylome)数据,筛选适用于液相活检的癌症甲基化基因标识物的方法。
本发明提供了一种甲基化基因标识物的筛选方法,所述方法包括:
1)选取特定组织,并筛选在所述特定组织中与其它组织相比具有统计学显著性差异的甲基化的甲基化基因标识物;
2)在由步骤1)筛选出的甲基化基因标识物中,进一步筛选在其它组织中具有较低甲基化水平的甲基化基因标识物;
3)在由步骤2)筛选出的甲基化基因标识物中,进一步筛选在外周血白细胞中具有较低甲基化水平的甲基化基因标识物;
4)经过步骤3)筛选出的甲基化基因或所述甲基化基因的片段即为所述特定组织的特异性甲基化基因标识物;
其中,所述特定组织选自健康组织和/或癌症组织。
在根据本发明的一个实施方案中,当所述特定组织为癌症组织时,步骤1)所述的其它组织为癌旁组织。
在根据本发明的一个实施方案中,当所述特定组织为癌症组织时,所述方法还包括在步骤3)筛选出的甲基化基因标识物中进一步筛选在该种癌症组织中与其它癌症组织相比具有统计学显著差异的甲基化的甲基化基因标识物,即为癌症特异性甲基化基因标识物。
在根据本发明的一个实施方案中,所述健康组织选自乳腺组织、膀胱组织、肠组织、食道组织、肾组织、肝组织、肺组织、前列腺组织、子宫组织或胃组织。
在根据本发明的一个实施方案中,所述癌症组织选自乳腺癌组织、膀胱癌组织、肠癌组织、食道癌组织、肾癌组织、肝癌组织、肺癌组织、前列腺癌组织、子宫癌组织或胃癌组织。
本发明还提供了一种由上述的方法筛选得到的基因标识物;
优选地,其中乳腺癌组织的基因标识物的核苷酸序列为SEQ ID NO:1~5;
优选地,其中膀胱癌组织的基因标识物的核苷酸序列为SEQ ID NO:6~10;
优选地,其中肠癌组织的基因标识物的核苷酸序列为SEQ ID NO:11~16;
优选地,其中食道癌组织的基因标识物的核苷酸序列为SEQ ID NO:17~21;
优选地,其中肾癌组织的基因标识物的核苷酸序列为SEQ ID NO:22~24;
优选地,其中肝癌组织的基因标识物的核苷酸序列为SEQ ID NO:25~29;
优选地,其中肺癌组织的基因标识物的核苷酸序列为SEQ ID NO:30~34;
优选地,其中前列腺癌组织的基因标识物的核苷酸序列为SEQ ID NO:35~40;
优选地,子宫癌组织的基因标识物的核苷酸序列为SEQ ID NO:41~45;
优选地,其中胃癌组织的基因标识物的核苷酸序列为SEQ ID NO:46;
优选地,其中乳腺组织的基因标识物的核苷酸序列为SEQ ID NO:47~51;
优选地,其中膀胱组织的基因标识物的核苷酸序列为SEQ ID NO:52~56;
优选地,其中肠组织的基因标识物的核苷酸序列为SEQ ID NO:57~61;
优选地,其中食道组织的基因标识物的核苷酸序列为SEQ ID NO:62~66;
优选地,其中肾组织的基因标识物的核苷酸序列为SEQ ID NO:67~71;
优选地,其中肝组织的基因标识物的核苷酸序列为SEQ ID NO:72~76;
优选地,其中肺组织的基因标识物的核苷酸序列为SEQ ID NO:77~80;
优选地,其中前列腺组织的基因标识物的核苷酸序列为SEQ ID NO:81~85;
优选地,其中子宫组织的基因标识物的核苷酸序列为SEQ ID NO:86~90。
本发明进一步提供了根据上述方法获得的基因标识物或上述基因标识物在制备癌症诊断试剂中的应用。
在根据本发明的一个实施方案中,所述应用为利用分子生物学检测方法,将特定癌症的癌症特异性甲基化基因标识物的甲基化水平整合为癌症指标,和/或将相应的健康组织的组织特异性甲基化基因标识物的甲基化水平整合为组织指标;建立数学模型,基于所述癌症指标和组织指标对检测样本的检测结果进行判读。
在根据本发明的一个实施方案中,所述判读的方法为:
a)癌症指标+/组织指标+,癌症指标显示癌变,组织指标确认组织来源,判读为癌症;
b)癌症指标-/组织指标-:癌症指标未显示癌变,组织指标未确认组织来源,判读为正常;
c)癌症指标+/组织指标-:癌症指标显示癌变,组织指标未确认组织来源,判读为癌症指标非特异,存在其他部位癌变的可能,分析其他癌症指标和组织指标组合;
d)癌症指标-/组织指标+:癌症指标未显示癌变,组织指标确认组织来源,判读为该组织发生非恶性病变,应坚持随访,降低患癌风险。
本发明进一步提供了一种用于癌症诊断或筛查的试剂盒,所述试剂盒包括上述的筛选方法获得的基因标识物中的一种或多种,或检测上述的筛选方法获得的基因标识物中的一种或多种的试剂。
另一方面,本发明具有以下有益效果:
本发明通过灵敏、准确的方法检测甲基化基因标识物,可以实现癌症细胞的液相活检。本发明的方法具有多种优点:1)灵敏性、特异性高;2)操作方便、快捷;3)检测成本低;4)可用于多种癌症的平行筛查,提高筛查效率,降低筛查成本。
附图说明
图1.适用于液相活检的癌症甲基化基因标识物筛选流程。该流程包括综合分析癌、癌旁和外周血白细胞基因甲基化谱数据,利用多种筛选条件,筛选癌症特异性甲基化基因标识物和组织特异性甲基化基因标识物。
图2.多种癌症甲基化基因标识物应用于多种癌症液相活检的方法。利用癌症特异性和组织特异性甲基化标识物建立数学模型,评估癌症指标和组织指标,并设定指标的判读条件;通过检测这些甲基化基因标识物的甲基化水平,对癌症指标和组织指标综合分析,实现对样本的诊断。
图3.肝癌指标。利用表3中所列的肝癌特异性甲基化基因标识物建立肝癌指标的数学模型,并通过ROC曲线分析其灵敏性和特异性。
图4.肝组织指标。利用表3中所列的肝组织特异性甲基化基因标识物建立肝组织指标的数学模型,并通过ROC曲线分析其灵敏性和特异性。
图5.乳腺癌指标。利用表4中所列的乳腺癌特异性甲基化基因标识物建立乳腺癌指标的数学模型,并通过ROC曲线分析其灵敏性和特异性。
图6.乳腺组织指标。利用表4中所列的乳腺组织特异性甲基化基因标识物建立乳腺组织指标的数学模型,并通过ROC曲线分析其灵敏性和特异性。
具体实施方式
下面结合实施例进一步说明本发明,应当理解,实施例仅用于进一步说明和阐释本发明,并非用于限制本发明。
除非特别指明,本发明所使用的试剂和材料均可通过商业途径获得。
一、通过综合分析基因甲基化谱(methylome)数据,筛选适用于液相活检的癌症甲基化基因标识物的方法
基因甲基化谱数据是指基于基因芯片、高通量测序、和其他用于研究基因甲基化的高通量检测技术而生成的数据。基因甲基化谱数据是对在基因组水平,对DNA序列中CpG位点的甲基化水平进行定量检测的数据,通常是以DNA序列中CpG位点的甲基化率(β=甲基化CpG水平/(甲基化CpG水平+非甲基化CpG水平))来衡量。
本方法提供的通过综合分析基因甲基化谱数据,筛选适用于液相活检的癌症甲基化基因标识物的方法包括两个主要部分(图1)。
第一部分是用于筛选适用于液相活检的癌症特异性甲基化基因标识物。
第二部分是用于筛选适用于液相活检的组织特异性甲基化基因标识物。
基因甲基化不仅在癌症的发生和发展中扮演重要角色,基因甲基化与细胞和组织的生长和分化过程也有密切联系。组织特异性的基因甲基化是组织生长和分化过程中调节基因表达的重要机制。癌症细胞在其形成、生长和演化过程中,由于死亡、凋亡以及其他机制,会将其基因组DNA释放进入外周血中;这部分基因组DNA即包括了在第一部分中描述的癌症特异性甲基化基因标识物,也包括组织特异性甲基化基因标识物。在液相活检过程中,组织特异性甲基化基因标识物可用于辅助第一部分描述的癌症特异性甲基化基因标识物,通过发挥其组织特异的特点,提高癌症特异性甲基化基因标识物在多种癌症液相活检中的组织特异性。
(一)第一部分筛选适用于液相活检的癌症特异性甲基化基因标识物
1)筛选在癌症组织中具有统计学显著性的差异甲基化的甲基化基因标识物。通过分析比较癌症组织和癌旁组织的基因甲基化谱数据,筛选癌症组织中平均甲基化率显著高于癌旁组织平均甲基化率[β(癌症)-β(癌旁)>0.20],且具有统计学显著性(t检验,p<0.05)的甲基化基因标识物。
2)在由步骤1)筛选出的癌症甲基化基因标识物中,进一步筛选在癌旁组织中具有较低甲基化水平的甲基化基因标识物。由于在某些非癌病变(如:急性炎症)过程中,细胞和组织也有可能将其基因组DNA释放进入外周血中,癌旁组织中具有较高甲基化水平的癌症甲基化基因表识物有可能导致液相活检的假阳性结果。因此,有必要排除这些高背景的癌症甲基化标识物。通过分析癌旁组织基因甲基化谱的数据,筛除癌旁组织中的甲基化水平较高[β(癌旁)≧0.10]的癌症甲基化标识物。
3)在由步骤2)筛选出的癌症甲基化基因标识物中,进一步筛选在外周血白细胞中具有较低甲基化水平的甲基化基因标识物。外周血白细胞是外周血游离DNA的重要来源;由于生理和病理因素,外周血白细胞可将其基因组DNA释放进入外周血中。外周血白细胞中具有较高甲基化水平的癌症甲基化基因标识物有可能导致液相活检的假阳性结果,因此有必要排除这些高背景的癌症甲基化基因标识物。通过分析外周血白细胞基因甲基化谱的数据,筛除外周血白细胞中的甲基化水平较高[β(白细胞)≧0.10]的癌症甲基化基因标识物。
4)在由步骤3)筛选出的癌症甲基化基因标识物中,进一步筛选在多种癌症中特异性最强的甲基化基因标识物。由于基因甲基化是癌症发生和发展过程中的一种普遍现象,因此经1)-3)步骤筛选的某一种癌症的甲基化基因标识物在其他癌症中也有可能表现出一定的甲基化异常。为了提高癌症甲基化基因标识物对该种癌症的特异性,需要筛选该种癌症中特异性最强的甲基化基因标识物。通过分析、比较该种癌症组织和其他癌症组织的基因甲基化谱数据,筛选该种癌症组织中的甲基化水平显著高于其他癌症组织中的甲基化水平[β(该种癌症)-β(其它癌症)>0.20],且具有统计学显著性(t检验,p<0.05)的甲基化基因标识物。
5)经过步骤1)-4)筛选出的甲基化基因标识物定义为该种癌症的癌症特异性甲基化基因标识物。
(二)第二部分筛选适用于液相活检的组织特异性甲基化基因标识物
1)筛选在组织中具有统计学显著性的差异甲基化的甲基化基因标识物。通过分析比较某一种组织(包括癌症和癌旁组织)和其它组织(包括癌症和癌旁组织)的基因甲基化谱数据,筛选该种组织中平均甲基化率显著高于其它组织平均甲基化率[β(组织)-β(其它组织)>0.20],且具有统计学显著性(t检验,p<0.05)的甲基化基因标识物。
2)在由步骤1)筛选出的组织甲基化基因标识物中,进一步筛选在其它组织中具有较低甲基化水平的甲基化基因标识物。由于在某些非癌病变(如:急性炎症)过程中,细胞和组织也有可能将其基因组DNA释放进入外周血中,其它组织中具有较高甲基化水平的组织甲基化基因表识物有可能导致液相活检的假阳性结果。因此,有必要排除这些高背景的组织甲基化标识物。通过分析其它组织基因甲基化谱的数据,筛除其它组织中的甲基化水平较高[β(其它组织)≧0.10]的组织甲基化基因标识物。
3)在由步骤2)筛选出的组织甲基化基因标识物中,进一步筛选在外周血白细胞中具有较低甲基化水平的基因。外周血白细胞是外周血游离DNA的重要来源;由于生理和病理因素,外周血白细胞可将其基因组DNA释放进入外周血中。外周血白细胞中具有较高甲基化水平的组织甲基化基因标识物有可能导致液相活检的假阳性结果,因此有必要排除这些高背景的组织甲基化基因标识物。通过分析外周血白细胞基因甲基化谱的数据,筛除外周血白细胞中的甲基化水平较高[β(白细胞)≧0.10]的组织甲基化基因标识物。经过步骤1)-3)筛选出的甲基化基因标识物定义为该种组织的组织特异性甲基化基因标识物。
二、九种癌症的甲基化基因标识物
对应每种癌症的甲基化基因标识物由癌症特异性甲基化基因标识物和组织特异性甲基化基因标识物组成(表1)。利用本发明提出的甲基化基因标识物筛选流程,对9种癌、癌旁和外周血白细胞基因甲基化谱数据进行综合分析,确定的最显著的癌症特异性甲基化基因标识物和组织特异性甲基化基因和相应甲基化DNA序列。
将上述的数据分析方法应用于九种癌症的基因甲基化谱数据。表2对相关数据进行了总结。经过数据分析,确定了这九种癌症甲基化基因标识物组合,包括癌症特异性甲基化基因标识物和组织特异性甲基化基因标识物。在这些标识物中,针对每种癌症,进一步筛选了癌症特异性和组织特异性最显著的五个基因(当基因数量少于5个时,可以选用全部基因),作为每种癌症的甲基化基因标识物组合。另外,还添加了几种已知癌症基因甲基化标识物:SHOX2(肺癌)、SEPT9(肠癌)、和RNF180(胃癌)。
三、将多种癌症甲基化基因标识物应用于多种癌症液相活检的方法
利用分子生物学检测手段,包括链式聚合酶反应(PCR)、基因芯片、和DNA测序技术,可以对外周血游离DNA中这组多种癌症甲基化基因标识物的甲基化水平进行测定;通过大量临床样本的检测结果,可以利用数学模型(如:logistic回归分析)将以上其中一种癌症特异的甲基化基因标识物的甲基化水平检测结果整合为一个癌症指标,同时根据临床样本的检测结果设定合理阈值,进行癌症的判读;相似的,通过大量临床样本的检测结果,可以利用数学模型(如:logistic回归分析)将以上其中一种组织特异的甲基化基因标识物的甲基化水平检测结果整合为一个组织指标,同时利用数学模型(如:ROC曲线)根据临床样本的检测结果设定合理阈值,进行组织的判读。流程如图2所示。基于癌症指标和组织指标的结果,对一例未知样本的检测有四种可能的结果:
1)癌症指标+/组织指标+,癌症指标显示癌变,组织指标确认组织来源,判读为癌症;
2)癌症指标-/组织指标-:癌症指标未显示癌变,组织指标未确认组织来源,判读为正常;
3)癌症指标+/组织指标-:癌症指标显示癌变,组织指标未确认组织来源,判读为癌症指标非特异,存在其他部位癌变的可能,分析其他癌症指标和组织指标组合;
癌症指标-/组织指标+:癌症指标未显示癌变,组织指标确认组织来源,判读为该组织发生非恶性病变,应坚持随访,降低患癌风险。
表1 多种癌症组织和健康组织的甲基化基因标识物组合
表2 九种癌、癌旁组织和外周血白细胞甲基化谱数据的总结。
以上数据为9种不同的癌症和相应癌旁组织以及外周血白细胞基因组DNA的甲基化谱。利用Illumina公司生产的甲基化谱芯片HumanMethylation450,对以上样本基因组DNA进行检测生成。
实施例1 通过综合分析基因甲基化谱数据,筛选肝癌甲基化基因标识物及其应用
1)收集、整理九种癌症、相应癌旁和外周血白细胞的基因甲基化谱数据(表2)。
2)首先筛选肝癌特异性甲基化基因标识物:1)筛选肝癌组织中甲基化水平显著高于癌旁组织甲基化水平(β肝癌-β癌旁>0.20),且具有统计学显著性(t检验,p<0.05)的甲基化基因标识物;2)在由步骤1)筛选出的肝癌甲基化基因标识物中,进一步筛选在癌旁组织中具有较低甲基化水平的甲基化基因标识物,通过分析癌旁组织基因甲基化谱的数据,筛选癌旁组织中的甲基化水平较低(β癌旁<0.10)的肝癌甲基化基因标识物;3)在由步骤2)筛选出的肝癌甲基化基因标识物中,进一步筛选在外周血白细胞中具有较低甲基化水平的甲基化基因标识物,通过分析外周血白细胞基因甲基化谱的数据,筛选外周血白细胞中的甲基化水平较低(β白细胞<0.10)的肝癌甲基化基因标识物;4)在由步骤3)筛选出的肝癌甲基化基因标识物中,进一步筛选肝癌特异性最强的甲基化基因标识物,通过分析、比较肝癌组织和其他8种癌症组织的基因甲基化谱数据,筛选在其他癌症组织中的甲基化水平较低(β其它癌症<0.10),在肝癌组织中的甲基化水平显著高于其他癌症组织中的甲基化水平(β肝癌-β其它癌症>0.20),且具有统计学显著性(t检验,p<0.05)的甲基化基因标识物。
3)接下来筛选肝组织特异性甲基化基因标识物:1)筛选在肝组织中具有统计学显著性的差异甲基化的甲基化基因标识物,通过分析比较肝组织(包括肝癌和癌旁组织)和其它组织(包括癌症和癌旁组织)的基因甲基化谱数据,筛选肝组织中甲基化水平显著高于其它组织甲基化水平(β肝组织-β其它组织>0.20),且具有统计学显著性(t检验,p<0.05)的甲基化基因标识物;2)在由步骤1)筛选出的肝组织甲基化基因标识物中,进一步筛选在其它组织中具有较低甲基化水平的甲基化基因标识物,通过分析其它组织基因甲基化谱的数据,筛选其它组织中的甲基化水平较低(β其它组织<0.20)的组织甲基化基因标识物;3)在由步骤2)筛选出的肝组织甲基化基因标识物中,进一步筛选在外周血白细胞中具有较低甲基化水平的基因,通过分析外周血白细胞基因甲基化谱的数据,筛选外周血白细胞中的甲基化水平较低(β白细胞<0.10)的肝组织甲基化基因标识物。
4)在这些标识物中,筛选肝癌特异性和肝组织特异性最显著的五个基因(表1)进行进一步分析。对这组肝癌甲基化标识物的分析结果总结在表3。
5)利用这组肝癌甲基化基因标识物,对表1所列样本进行了分析。首先,利用肝癌(n=42)和癌旁组织(n=42)数据,通过使用SigmaPlot软件的logistic回归分析功能对5个肝癌特异性甲基化基因标识物进行整合,建立了肝癌指标的数学模型(肝癌指标=-6.121+26.391*βRNF135+10.982*βEFNB2-9.589*βTRIL+8.333*βLDHB+5.197*βIGF1R),并通过使用SigmaPlot软件的ROC曲线分析功能,利用这组数据建立了肝癌判读条件(肝癌指标≧1.9524,为肝癌;肝癌指标<1.016,非肝癌);在此判读条件下,肝癌指标的线下曲线面积(AUC)为0.99,对肝癌的灵敏性和特异性达到95%和100%(图3)。接下来,利用肝组织(n=84)和其他组织(n=648)数据,通过使用SigmaPlot软件的logistic回归分析功能对5个肝组织特异性甲基化基因标识物进行整合,建立了肝组织指标的数学模型(肝组织指标=-29.162+18.403*βPROC-7.618*βPLIN1+33.257*βPAK1+18.267*βTFR2+9.766*βTLX1NB),并通过使用SigmaPlot软件的ROC曲线分析功能,利用这组数据建立了肝组织判读条件(肝组织指标≧-1.8,为肝组织;肝组织指标<-1.8,非肝组织);在此判读条件下,肝组织指标的线下曲线面积(AUC)为1,对肝组织检测的灵敏性和特异性达到100%和100%(图4)。
以上结果显示,本发明提出的适用于液相活检的多种癌症甲基化基因标识物的筛选方法可以用于发现高灵敏和高特异的癌症甲基化标识物。
表3 最显著的肝癌特异性甲基化基因标识物和肝组织特异性甲基化基因标识物
实施例2 通过综合分析基因甲基化谱数据,筛选乳腺癌甲基化基因标识物及其应用
1)收集、整理九种癌症和外周血白细胞的基因甲基化谱数据(表2)。
2)首先筛选乳腺癌特异性甲基化基因标识物:1)筛选乳腺癌组织中平均甲基化率显著高于癌旁组织平均甲基化率[β(乳腺癌)-β(癌旁)>0.20],且具有统计学显著性(t检验,p<0.05)的甲基化基因标识物;2)在由步骤1)筛选出的乳腺癌甲基化基因标识物中,进一步筛选在癌旁组织中具有较低甲基化水平的基甲基化基因标识物,通过分析癌旁组织基因甲基化谱的数据,筛除癌旁组织中的甲基化水平较高[β(癌旁)≧0.10]的乳腺癌甲基化标识物;3)在由步骤2)筛选出的乳腺癌甲基化基因标识物中,进一步筛选在外周血白细胞中具有较低甲基化水平的甲基化基因标识物,通过分析外周血白细胞基因甲基化谱的数据,筛除外周血白细胞中的甲基化水平较高[β(白细胞)≧0.10]的乳腺癌甲基化基因标识物;4)在由步骤3)筛选出的乳腺癌甲基化基因标识物中,进一步筛选乳腺癌特异性最强的甲基化基因标识物,通过分析、比较乳腺癌组织和其他8种癌症组织的基因甲基化谱数据,筛选在其他癌症组织中的甲基化水平较低[β(其它癌症)<0.10],同时在乳腺癌组织中的甲基化水平显著高于其他癌症组织中的甲基化水平[β(乳腺癌)-β(其它癌症)>0.20],且具有统计学显著性(t检验,p<0.05)的甲基化基因标识物。
3)接下来筛选乳腺组织特异性甲基化基因标识物:1)筛选在乳腺组织中具有统计学显著性的差异甲基化的甲基化基因标识物,通过分析比较某一种组织(包括癌症和癌旁组织)和其它组织(包括癌症和癌旁组织)的基因甲基化谱数据,筛选乳腺组织中平均甲基化率显著高于其它组织平均甲基化率[β(乳腺组织)-β(其它组织)>0.20],且具有统计学显著性(t检验,p<0.05)的甲基化基因标识物;2)在由步骤1)筛选出的乳腺组织甲基化基因标识物中,进一步筛选在其它组织中具有较低甲基化水平的甲基化基因标识物,通过分析其它组织基因甲基化谱的数据,筛除其它组织中的甲基化水平较高[β(其它组织)≧0.10]的组织甲基化基因标识物;在由步骤2)筛选出的乳腺组织甲基化基因标识物中,进一步筛选在外周血白细胞中具有较低甲基化水平的基因,通过分析外周血白细胞基因甲基化谱的数据,筛除外周血白细胞中的甲基化水平较高[β(白细胞)≧0.10]的乳腺组织甲基化基因标识物。
4)在这些标识物中,筛选乳腺癌特异性和乳腺组织特异性最显著的五个基因(表1)进行进一步分析。对这组乳腺癌甲基化标识物的分析结果总结在表4。
5)利用这组乳腺癌甲基化基因标识物,对表1所列样本进行了分析。首先,利用乳腺癌(n=47)和癌旁(n=47)组织数据,通过使用SigmaPlot软件的logistic回归分析功能对5个乳腺癌特异性甲基化基因标识物进行整合,建立了乳腺癌指标的数学模型(乳腺癌指标=-4.531-2.897*βGNG4+10.580*βMIAT+3.339*βDNM3-3.624*βCHST2+14.995*βHOXA9),并通过使用SigmaPlot软件的ROC曲线分析功能,利用这组数据建立了乳腺癌判读条件(乳腺癌指标≧1.016,为乳腺癌;乳腺癌指标<1.016,非乳腺癌);在此判读条件下,乳腺癌指标的线下曲线面积(AUC)为0.97,对乳腺癌的灵敏性和特异性达到89%和100%(图5)。接下来,利用乳腺组织(n=94)和其他组织(n=638)数据,通过使用SigmaPlot软件的logistic回归分析功能对5个乳腺组织特异性甲基化基因标识物进行整合,建立乳腺组织指标的数学模型(乳腺组织指标=-5.607+2.939*βC7orf51+3.265*βID3+5.763*βVWCE+0.545*βCRYGN+6.367*βC10orf41),并通过使用SigmaPlot软件的ROC曲线分析功能,利用这组数据建立了乳腺组织判读条件(乳腺组织指标≧-2.126,为乳腺组织;乳腺组织指标<-2.126,非乳腺组织);在此判读条件下,乳腺组织指标的线下曲线面积(AUC)为0.97,对乳腺组织检测的灵敏性和特异性达到95%和93%(图6)。
表4 最显著的乳腺癌特异性甲基化基因标识物和乳腺组织特异性甲基化基因标识物
使用这两个指标对表1中的所有样本进行分析发现(表5):1)乳腺癌指标对所有非癌症样本检测的阳性率很低,对乳腺癌样本检测的阳性率(89%)高于其他8种癌症样本,但是乳腺癌指标对几种癌症(如:食道癌、肝癌、肺癌和子宫癌)检测的阳性率也偏高,因此单独使用乳腺癌指标可以很好地判读乳腺癌,但有可能会对其他癌症造成误判;2)乳腺组织指标对所有乳腺样本(乳腺癌和癌旁)检测的阳性率很高,对非乳腺组织的阳性率很低,具有非常好的准确性,可以发挥组织特异性的指向性作用;3)结合使用乳腺癌指标和乳腺组织指标,当两个指标均为阳性时判读乳腺癌,发现检测乳腺癌的灵敏性没有发生显著变化,而特异性(尤其是对其他癌症样本的误判)有显著性改善。
表5 综合利用乳腺癌指标和乳腺组织指标对多种癌症进行判读
尽管本发明已进行了一定程度的描述,明显地,在不脱离本发明的精神和范围的条件下,可进行各个条件的适当变化。可以理解,本发明不限于所述实施方案,而归于权利要求的范围,其包括所述每个因素的等同替换。
Claims (4)
1.一种用于乳腺癌诊断的基因标识物,其特征在于,由乳腺癌的基因标识物和乳腺组织的基因标识物组成,
其中,所述乳腺癌的基因标识物由SEQ ID NO:1~5所示的核苷酸序列组成,所述乳腺组织的基因标识物由SEQ ID NO:47~51所示的核苷酸序列组成。
2.用于检测如权利要求1所述的用于乳腺癌诊断的基因标识物的试剂在制备用于诊断乳腺癌的试剂中的应用。
3.如权利要求2所述的应用,其特征在于,所述诊断为利用分子生物学检测方法,将所述乳腺癌的基因标识物的甲基化水平作为癌症指标,将所述乳腺组织的基因标识物的甲基化水平作为组织指标;建立数学模型,基于所述癌症指标和组织指标对检测样本的检测结果进行判读。
4.如权利要求3所述的应用,其特征在于,所述判读的方法为:
a)癌症指标+/组织指标+,癌症指标显示癌变,组织指标确认组织来源,判读为癌症;
b)癌症指标-/组织指标-:癌症指标未显示癌变,组织指标未确认组织来源,判读为正常;
c)癌症指标+/组织指标-:癌症指标显示癌变,组织指标未确认组织来源,判读为癌症指标非特异,存在其他部位癌变的可能,分析其他癌症指标和组织指标组合;
d)癌症指标-/组织指标+:癌症指标未显示癌变,组织指标确认组织来源,判读为该组织发生非恶性病变,应坚持随访,降低患癌风险。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610280833.7A CN107326065B (zh) | 2016-04-29 | 2016-04-29 | 一种基因标识物的筛选方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610280833.7A CN107326065B (zh) | 2016-04-29 | 2016-04-29 | 一种基因标识物的筛选方法及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107326065A CN107326065A (zh) | 2017-11-07 |
CN107326065B true CN107326065B (zh) | 2022-07-29 |
Family
ID=60193377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610280833.7A Active CN107326065B (zh) | 2016-04-29 | 2016-04-29 | 一种基因标识物的筛选方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107326065B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200105661A (ko) * | 2017-11-30 | 2020-09-08 | 메이오 파운데이션 포 메디칼 에쥬케이션 앤드 리써치 | 유방암 검출방법 |
CN110511997A (zh) * | 2018-05-22 | 2019-11-29 | 广州市康立明生物科技有限责任公司 | 肿瘤标志物、甲基化试剂、试剂盒及其应用 |
CN109686414A (zh) * | 2018-12-28 | 2019-04-26 | 陈洪亮 | 仅用于肝癌筛查的特异甲基化检测位点组合的选取方法 |
CN109616198A (zh) * | 2018-12-28 | 2019-04-12 | 陈洪亮 | 仅用于肝癌单一癌种筛查的特异甲基化检测位点组合的选取方法 |
CN110033864A (zh) * | 2019-05-29 | 2019-07-19 | 曹卓 | 一种肺癌早期预警模型的创建方法 |
WO2021227950A1 (zh) * | 2020-05-09 | 2021-11-18 | 广州燃石医学检验所有限公司 | 癌症预后方法 |
CN114075605A (zh) * | 2022-01-19 | 2022-02-22 | 博尔诚(北京)科技有限公司 | 基于甲基化增强基因表达(mege)的癌症标志物筛选方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101124340A (zh) * | 2005-02-18 | 2008-02-13 | 美国政府健康及人类服务部 | 血液淋巴细胞中子宫内膜异位症的分子诊断标志物的鉴定 |
CN101356532A (zh) * | 2005-05-13 | 2009-01-28 | 布鲁塞尔自由大学 | 基于基因的算法型癌症预后 |
CN101906414A (zh) * | 2009-06-03 | 2010-12-08 | 博尔诚(北京)科技有限公司 | 甲基化dna的浓缩方法和检测方法以及试剂盒 |
WO2011038507A1 (en) * | 2009-10-02 | 2011-04-07 | Centre For Addiction And Mental Health | Method for analysis of dna methylation profiles of cell-free circulating dna in bodily fluids |
CN102209899A (zh) * | 2008-11-12 | 2011-10-05 | 霍夫曼-拉罗奇有限公司 | 作为癌症的标记物的pacap |
CN102321745A (zh) * | 2010-10-14 | 2012-01-18 | 博尔诚(北京)科技有限公司 | 一种定量检测dna特定位点甲基化程度的方法及试剂盒 |
CN102414565A (zh) * | 2009-05-04 | 2012-04-11 | 霍夫曼-拉罗奇有限公司 | 作为癌症的标记物的DPPIV/Seprase的用途 |
CN102481340A (zh) * | 2009-05-28 | 2012-05-30 | 葛兰素集团有限公司 | 干细胞靶向 |
CN103993015A (zh) * | 2014-05-23 | 2014-08-20 | 山西医科大学 | 人类子痫前期发生相关的外周血白细胞miRNA标志物及其应用 |
CN104251906A (zh) * | 2013-06-27 | 2014-12-31 | 清华大学 | 一种肿瘤标志物 |
CN104745681A (zh) * | 2014-08-08 | 2015-07-01 | 博尔诚(北京)科技有限公司 | 多元基因组合物及其用途 |
WO2015184107A1 (en) * | 2014-05-28 | 2015-12-03 | Georgetown University | Genetic markers for memory loss |
-
2016
- 2016-04-29 CN CN201610280833.7A patent/CN107326065B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101124340A (zh) * | 2005-02-18 | 2008-02-13 | 美国政府健康及人类服务部 | 血液淋巴细胞中子宫内膜异位症的分子诊断标志物的鉴定 |
CN101356532A (zh) * | 2005-05-13 | 2009-01-28 | 布鲁塞尔自由大学 | 基于基因的算法型癌症预后 |
CN102209899A (zh) * | 2008-11-12 | 2011-10-05 | 霍夫曼-拉罗奇有限公司 | 作为癌症的标记物的pacap |
CN102414565A (zh) * | 2009-05-04 | 2012-04-11 | 霍夫曼-拉罗奇有限公司 | 作为癌症的标记物的DPPIV/Seprase的用途 |
CN102481340A (zh) * | 2009-05-28 | 2012-05-30 | 葛兰素集团有限公司 | 干细胞靶向 |
CN101906414A (zh) * | 2009-06-03 | 2010-12-08 | 博尔诚(北京)科技有限公司 | 甲基化dna的浓缩方法和检测方法以及试剂盒 |
WO2011038507A1 (en) * | 2009-10-02 | 2011-04-07 | Centre For Addiction And Mental Health | Method for analysis of dna methylation profiles of cell-free circulating dna in bodily fluids |
CN102321745A (zh) * | 2010-10-14 | 2012-01-18 | 博尔诚(北京)科技有限公司 | 一种定量检测dna特定位点甲基化程度的方法及试剂盒 |
CN104251906A (zh) * | 2013-06-27 | 2014-12-31 | 清华大学 | 一种肿瘤标志物 |
CN103993015A (zh) * | 2014-05-23 | 2014-08-20 | 山西医科大学 | 人类子痫前期发生相关的外周血白细胞miRNA标志物及其应用 |
WO2015184107A1 (en) * | 2014-05-28 | 2015-12-03 | Georgetown University | Genetic markers for memory loss |
CN104745681A (zh) * | 2014-08-08 | 2015-07-01 | 博尔诚(北京)科技有限公司 | 多元基因组合物及其用途 |
Non-Patent Citations (1)
Title |
---|
外周血白细胞DNA甲基化与肿瘤发病相关性Meta分析;李培等;《中华肿瘤防治杂志》;20141231;第21卷(第24期);1997-2004 * |
Also Published As
Publication number | Publication date |
---|---|
CN107326065A (zh) | 2017-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107326065B (zh) | 一种基因标识物的筛选方法及其应用 | |
US20080206756A1 (en) | Biomarker panel for colorectal cancer | |
CN101985651B (zh) | 胃肠肿瘤诊断和预示的新分子标记 | |
AU2019269679A1 (en) | Cell-free DNA for assessing and/or treating cancer | |
AU2019301959B2 (en) | DNA methylation markers for noninvasive detection of cancer and uses thereof | |
US20120178093A1 (en) | Methods of assessing a risk of cancer progression | |
CN112322736A (zh) | 一种用于检测肝癌的试剂组合,试剂盒及其用途 | |
WO2009037090A1 (en) | Molecular markers for tumor cell content in tissue samples | |
CN112501293A (zh) | 一种用于检测肝癌的试剂组合,试剂盒及其用途 | |
CN107435062B (zh) | 甄别肺部微小结节良恶性的外周血基因标志物及其用途 | |
CN104031915A (zh) | 用于结直肠癌预后的基因片段及其应用 | |
CN112280865A (zh) | 一种用于检测肝癌的试剂组合,试剂盒及其用途 | |
CN111583993A (zh) | 构建体外检测癌症的数学模型的方法及其应用 | |
US20120201750A1 (en) | Serum biomarkers for melanoma metastasis | |
CN108624692B (zh) | 用于肺部微小结节良恶性甄别的基因标志物及其用途 | |
CN101519686B (zh) | 用于胃癌和胃癌组织转移的分子检测方法和试剂盒 | |
CN116287252B (zh) | 长链非编码rna apcdd1l-dt在制备检测胰腺癌的产品中的应用 | |
WO2022105774A1 (zh) | 一种用于检测肝癌的试剂组合,试剂盒及其用途 | |
CN114672554A (zh) | 一种检测肿瘤相关基因谱表达量的方法及其用途 | |
CN109182520B (zh) | 一种宫颈癌及其癌前病变检测试剂盒及其应用 | |
US11807908B2 (en) | Genetic markers used for identifying benign and malignant pulmonary micro-nodules and the application thereof | |
Alenzi et al. | The Potential Of Liquid Biopsies For Early Cancer Detection And Monitoring Treatment Response | |
AU2022254718A1 (en) | Method of detecting cancer using genome-wide cfdna fragmentation profiles | |
CN116287266A (zh) | Dna复制晚期区域在泛癌种诊断中的应用 | |
WO2023111329A1 (en) | Prostate cancer clinical status markers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210415 Address after: 10 / F, building 3, yard 18, Hongda South Road, Daxing District, Beijing Applicant after: BIOCHAIN (BEIJING) SCIENCE & TECHNOLOGY Co.,Ltd. Address before: 100176 10th floor, building 3, No.18 yard, Hongda South Road, Beijing Economic and Technological Development Zone, Daxing District, Beijing Applicant before: BIOCHAIN (BEIJING) SCIENCE & TECHNOLOGY Co.,Ltd. Applicant before: BIOCHAIN INSTITUTE, Inc. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |