CN110257524A - 一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型及其构建方法 - Google Patents

一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型及其构建方法 Download PDF

Info

Publication number
CN110257524A
CN110257524A CN201910707722.3A CN201910707722A CN110257524A CN 110257524 A CN110257524 A CN 110257524A CN 201910707722 A CN201910707722 A CN 201910707722A CN 110257524 A CN110257524 A CN 110257524A
Authority
CN
China
Prior art keywords
methylation
colorectal cancer
cpg
normal tissue
cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910707722.3A
Other languages
English (en)
Inventor
朱益民
来茂德
孙晓慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910707722.3A priority Critical patent/CN110257524A/zh
Publication of CN110257524A publication Critical patent/CN110257524A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型的构建方法,该方法包括以下步骤:选出107个与结直肠癌相关的、在基因的启动子区存在甲基化差异的基因;利用TCGA数据库中包括同时具有甲基化和基因表达数据的患者,对107个基因的表达及启动子区的甲基化水平进行了验证,共36个基因验证成功,其中有371个CpG位点位于其启动子区上;利用TCGA数据库中的数据对371个CpG位点进行筛选;共筛选出78个CpG位点;对78个CpG位点,基于TCGA数据库中的数据,利用弹性网络算法,构建结直肠癌判别模型。本发明为日后血液筛查结直肠癌提供了理论基础和依据。

Description

一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别 模型及其构建方法
技术领域
本发明属于基因工程技术领域,具体地说,涉及一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型及其构建方法。
背景技术
结直肠癌是消化道常见的恶性肿瘤,据世界卫生组织国际癌症研究中心资料显示,2012年全世界约有136万结直肠癌新发病例,居恶性肿瘤第3位,位于肺癌、乳腺癌之后;死亡约69万例,位于肺癌、肝癌和胃癌之后,居恶性肿瘤第4位。我国居民随着饮食结构和生活方式的改变,结直肠癌的发病率和死亡率呈不断上升趋势,2013年结直肠癌的发病率居恶性肿瘤第三位,死亡率居于第四。结直肠癌已经严重威胁到我国民居的健康生活,并逐步成为我国的社会、卫生负担。结直肠癌起病隐匿,早期无特异症状结,因此早期有效的筛检技术的实施是提高结直肠癌患者生存率的关键。前肠镜仍是结直肠癌筛查最准确的方法,但是由于该检查操作程序较复杂及存在一定的并发症,患者依从性欠佳。尽管大便潜血检查价格便宜且操作简单,但灵敏性和特异性相对较低。而近年来,由于对遗传和表观遗传标志物研究的不断深入,通过筛选肿瘤组织高特异性的、多水平的肿瘤标志物,对于大规模人群的早期无创筛查成为可能。
表观遗传学是在不涉及DNA序列改变的情况下,基因的表达与功能发生改变并产生可遗传的表型。DNA甲基化则是表观遗传遗传学的主要的一部分,是指在DNA甲基转移酶的催化下,将作为甲基供体的S-腺苷甲硫氨酸结合到胞嘧啶5位碳原子上,生成5-甲基胞嘧啶的过程。DNA甲基化是最重要的表观遗传学修饰,人体中DNA的甲基化主要发生在CpG岛。CpG岛存在于40%~60%的肿瘤抑制基因的启动子区域,是一段长约200~2000bp,具有超过50%的GC含量的序列,可以参与基因表达的调节。在人类的正常基因组中,70%~90%的CpG是被甲基化修饰的,而CpG岛通常未甲基化。但是这一现象在肿瘤中则相反,大量研究发现在CRC中DNA甲基化异常,表现为全基因组或一些关键基因的异常低甲基化和抑癌基因及相关癌基因的CpG岛区域性的异常高甲基化。目前随着测序技术的日臻完善,越来越多的基于甲基化的CRC分子标志物被发现。
DNA的高甲基化可使得抑癌基因发生异常沉默,而全基因组的低甲基化可以引起基因组不稳定性,研究表明,与正常的结直肠黏膜相比,CRC的基因组DNA呈现低甲基化状态。LINE-1和短分散核酸元件(SINE)序列是目前为止研究最为透彻的在CRC中呈现异常低甲基化的基因。许多研究证明LINE-的低甲基化程度越高,患者存活率越低。但是,目前为止,低甲基化和基因表达的关系并不明确。因此,DNA低甲基化分子标志物的发现有待进一步的研究。
除了以上基于全基因组甲基化状态所发现的分子标志物外,越来越多的肿瘤相关基因的启动子异常甲基化被发现。研究显示,SLC5A8、SFRP1、SFRP2、CDH13、CRBP1和RUNX3存在于正常结肠上皮组织到异常肠隐窝病灶阶段;其他一些基因(p14、HLTF、ITGA4、CDKN2A/p16、CDH1和ESR1)常发现于从异常肠隐窝病灶到息肉或腺瘤的阶段;而TIMP3、CXCL12、ID4和IRF8基因可出现在息肉到癌变组织的阶段;DNA修复基因MGMT和hMLH1甲基化在从息肉到癌变的过程亦起着重要的作用。基质细胞中编码SPARC基因的甲基化与结直肠癌的淋巴管浸润转移相关。
结直肠癌是一种具有高死亡率但癌前阶段时间较长的恶性肿瘤,如果能够在高危人群中进行大规模的筛查,就可以得到早期的诊断和治疗。有研究显示,如果处于结直肠癌早期阶段的患者得到诊断与治疗,患者5生存率将超过90%,明显高于已发生转移的晚期结直肠癌患者的11%。目前为止,结直肠癌的筛选方法常见的为两种:基于组织结构上的检查和基于粪便或外周血采血标本的检测。前者如肠镜检查,是一种侵入性的检测方法,虽可以检测早期癌变和腺瘤息肉,但是患者的依从性较差;基于粪便或外周血样的检测包括粪便潜血试验、免疫活血检测和脱落细胞DNA检测,虽然是无创性的检测收单,但是具有较低的灵敏性。因此,越来越多的研究致力于发现粪便或外周血结直肠早期诊断的分子标志物。通过对CRC患者的粪便标本中的SFRP、SFRP5、PGR、CALCA和IGFBP2进行测定,鉴定出甲基化的SFRP2可以作为发现CRC的诊断生物标记物,灵敏度高达70%~90%,特异性达到77%。之后的研究表明SFRP2还可以用作识别癌前结肠息肉患者的标志物。甲基化的波形蛋白(VIM)也是一种已经得到验证的CRC早期检测标记物,它特异性的发生在腺瘤和CRC组织中,具有相当高的灵敏性(46%)和特异性(90%)。迄今为止,已经鉴定出了大量可用于CRC早期诊断的基于粪便的甲基化生物标志物,包括APC、ATM、BMP3、CDKN2A、SFRP2、GATA4、GSTP1、HLTF、MLH1、MGMT、NDRG4、RASSF2A、TFPI2和WIF1。
SEPT9基因启动子甲基化是近年来发现的比较特异的结直肠癌的血液标志物。血浆或粪便中检测SEPT9基因启动子甲基化对结直肠癌的敏感度可到达70%以上,特异度在83%~94%。除此之外,VIM基因也被认为是结直肠癌特异性的分子标志物,其灵敏度和特异度可以达到80%左右。研究发现TMEFF2基因、表皮生长因子受体基因和ZDHHC22基因可以作为CRC的诊断标志物,具有较高的特异性。目前,已鉴定出了多种可用于结直肠癌诊断的基于血液的甲基化生物标志物,其中包括了ALX4、APC、CDKN2A、HLTF、HPP1、MLH1、MGMT、NEUROG1、NGFR、RASSF2A、SFRP2、VIM和WIF1。此外,检测血清中hMMLH1启动子甲基化状态,可用于微卫星不稳定型结直肠癌的早期诊断;p16启动子的甲基化检测可有助于结直肠癌术后复发的早期诊断。而HPP1和HLTF的DNA甲基化被发现可以作为结直肠癌预后的分子标志物。
现有技术主要存在以下几个问题。首先,目前已发现的分子标志物阳性率不高,很多无法达到结直肠癌早期诊断的标准;其次,在不同的研究中,分子标志物的重复性较低,这与不同研究对象,标本采集、检测手段不同相关。
发明内容
有鉴于此,本发明针对上述的问题,提供了一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型及其构建方法,根据结直肠癌组织及癌旁正常组织中的差异DNA甲基化位点构建鉴别模型,为日后结直肠癌的血液标志物提供理论依据,以期实现结直肠癌的早期筛查、早期诊断及早期治疗。
为了解决上述技术问题,本发明公开了一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型的构建方法,包括以下步骤:
步骤1、选出107个与结直肠癌相关的、在基因的启动子区存在甲基化差异的基因;
步骤2、利用TCGA数据库中包括同时具有甲基化和基因表达数据的患者,对107个基因的表达及启动子区的甲基化水平进行了验证,共36个基因验证成功,其中有371个CpG位点位于其启动子区上;
步骤3、利用TCGA数据库中的数据对371个CpG位点进行筛选;共筛选出78个CpG位点;
步骤4、根据CpG位点所对应的估计值对甲基化水平进行加权,得出甲基化风险指数,即为结直肠癌判别模型;当甲基化风险指数高于0.58时,为结直肠癌肿瘤组织标本,当指数低于0.58时,组织标本为正常组织标本。
可选地,所述步骤2中的验证原则是:①肿瘤与癌旁的正常组织间mRNA表达存在统计学差异FDR<0.05;②肿瘤与癌旁的正常组织间DNA甲基化水平存在统计学差异FDR<0.05;③mRNA表达和DNA甲基化水平呈现负相关。
可选地,所述步骤3中的筛选原则是:①肿瘤与癌旁的正常组织间DNA甲基化水平差异倍数>4或<0.25;②mRNA表达和CpG位点的DNA甲基化水平呈现负相关;③单因素logistic回归FDR<0.05。
可选地,所述步骤4中的甲基化风险指数的计算公式如下:
甲基化风险指数(MRS)=(cg00577935×-0.02)+(cg08571859×-0.50)+(cg14479889×-0.17)+(cg16970232×0.03)+(cg21634602×0.47)+(cg05374412×1.43)+(cg08747377×-0.32)+(cg00256785×0.58)+(cg02667335×0.05)+(cg04774496×-0.01)+(cg07951978×0.48)+(cg10223066×-0.34)+(cg12551582×-0.23)+(cg15063355×-0.15)+(cg18533833×-0.39)+(cg19027571×0.13)+(cg19313015×-0.13)+(cg19852344×0.14)+(cg21273703×-0.04)+(cg21645164×-0.12)+(cg22202031×0.69)+(cg24727133×0.21)+(cg26394825×-0.02)+(cg26410484×0.17)+(cg26832509×-0.58)+(cg27040423×-0.09)+(cg27084026×-0.84)+(cg27382164×-0.92)+(cg23407507×-0.01)+(cg26267854×-0.09)+(cg02526522×0.27)+(cg06172475×0.57)+(cg08590601×-0.83)+(cg09037089×0.83)+(cg18142615×-0.44)+(cg19897940×0.16)+(cg27028555×-0.87)+(cg08050235×0.24)+(cg23003534×-0.44)+(cg02150867×0.00)+(cg10160975×0.64)+(cg26967167×-0.22)+(cg06668300×-0.01)+(cg07224914×-0.73)+(cg22403344×0.52)+(cg00687686×0.32)+(cg01466678×-0.01)+(cg04190807×-0.06)+(cg04942472×0.22)+(cg11306587×-0.32)+(cg13031432×-0.67)+(cg01101510×0.74)+(cg03202804×0.51)+(cg04965141×-0.23)+(cg05874561×-0.49)+(cg11354906×-0.16)+(cg14330641×-0.09)+(cg18255353×0.85)+(cg25645268×-0.30)+(cg05937453×-0.65)+(cg06576393×-0.73)+(cg07834955×0.13)+(cg09874752×-0.27)+(cg10914555×0.34)+(cg17820890×-0.19)+(cg22831607×1.00)+(cg13281139×0.16)+(cg07136998×-0.30)+(cg11732619×1.48)+(cg15637465×-0.14)+(cg24928391×0.43)+(cg13929566×-0.47)+(cg15773137×-0.29)+(cg19342109×-0.63)+(cg23353893×1.20)+(cg25977958×0.62)+(cg01808545×0.03)+(cg02288301×-0.14)(1)
公式(1)为相应CpG位点的甲基化水平与其所对应的参数估计值的乘积加和,其中CpG位点的甲基化水平为甲基化和非甲基化位点的荧光信号比例,即Beta值=M/(M+UM),M为甲基化信号,UM为未甲基化的信号。
与现有技术相比,本发明可以获得包括以下技术效果:
DNA的甲基化常发生在癌前病变和癌变早期,且发生频率较高,因此,是结直肠癌早期诊断的理想标志物。本发明通过对结直肠癌及其癌旁正常组织中差异DNA甲基化位点进行筛选和验证,利用弹性网络算法,构建了基于78个甲基化位点的结直肠癌组织判别模型,为日后血液筛查结直肠癌提供了理论基础和依据。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明区分结直肠癌的癌组织及癌旁正常组织的筛检模型的构建方法的流程图。
具体实施方式
以下将配合实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本发明公开了一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型的构建方法,包括以下步骤:
步骤1、选出107个与结直肠癌相关的、在基因的启动子区存在甲基化差异的基因,如表1所示。
表1 107个与结直肠癌相关的、在基因的启动子区存在甲基化差异的基因
步骤2、从TCGA数据网站(https://genome-cancer.ucsc.edu/)下载IlluminaInfinium人甲基化k450BeadChip数据以及632位CRC患者的RNA-seq数据和临床记录。其中,来自395名患者的443个样本(包含45个配对的肿瘤正常样本)甲基化的数据和来自398个患者的433个样本(包含32个配对的肿瘤正常样本)的RNA-seq数据可用。在本发明利用TCGA数据库中包括373名同时具有甲基化和基因表达数据的患者,对107个基因的表达及启动子区的甲基化水平进行了验证,依据原则:①肿瘤与癌旁的正常组织间mRNA表达存在统计学差异FDR<0.05;②肿瘤与癌旁的正常组织间DNA甲基化水平存在统计学差异FDR<0.05;③mRNA表达和DNA甲基化水平呈现负相关。共36个基因验证成功(如表2所示),其中有371个CpG位点位于其启动子区上。
表2 验证成功的36个基因
步骤3、利用TCGA数据库中的数据对371个CpG位点按照以下原则进行筛选:①肿瘤与癌旁的正常组织间DNA甲基化水平差异倍数>4或<0.25;②mRNA表达和CpG位点的DNA甲基化水平呈现负相关;③单因素logistic回归FDR<0.05。共筛选出78个CpG位点。
步骤4、随后,对78个CpG位点,基于TCGA数据库中的数据,利用弹性网络算法,构建结直肠癌判别模型,如公式(1)所示。弹性网络(Elastic Net)算法是Lasso和Ridge回归技术的混合体,它使用L1来训练并且L2优先作为正则化矩阵。该方法可自动进行特征变量的选择,同时,表现出较好的稳定性。
甲基化风险指数(MRS)=(cg00577935×-0.02)+(cg08571859×-0.50)+(cg14479889×-0.17)+(cg16970232×0.03)+(cg21634602×0.47)+(cg05374412×1.43)+(cg08747377×-0.32)+(cg00256785×0.58)+(cg02667335×0.05)+(cg04774496×-0.01)+(cg07951978×0.48)+(cg10223066×-0.34)+(cg12551582×-0.23)+(cg15063355×-0.15)+(cg18533833×-0.39)+(cg19027571×0.13)+(cg19313015×-0.13)+(cg19852344×0.14)+(cg21273703×-0.04)+(cg21645164×-0.12)+(cg22202031×0.69)+(cg24727133×0.21)+(cg26394825×-0.02)+(cg26410484×0.17)+(cg26832509×-0.58)+(cg27040423×-0.09)+(cg27084026×-0.84)+(cg27382164×-0.92)+(cg23407507×-0.01)+(cg26267854×-0.09)+(cg02526522×0.27)+(cg06172475×0.57)+(cg08590601×-0.83)+(cg09037089×0.83)+(cg18142615×-0.44)+(cg19897940×0.16)+(cg27028555×-0.87)+(cg08050235×0.24)+(cg23003534×-0.44)+(cg02150867×0.00)+(cg10160975×0.64)+(cg26967167×-0.22)+(cg06668300×-0.01)+(cg07224914×-0.73)+(cg22403344×0.52)+(cg00687686×0.32)+(cg01466678×-0.01)+(cg04190807×-0.06)+(cg04942472×0.22)+(cg11306587×-0.32)+(cg13031432×-0.67)+(cg01101510×0.74)+(cg03202804×0.51)+(cg04965141×-0.23)+(cg05874561×-0.49)+(cg11354906×-0.16)+(cg14330641×-0.09)+(cg18255353×0.85)+(cg25645268×-0.30)+(cg05937453×-0.65)+(cg06576393×-0.73)+(cg07834955×0.13)+(cg09874752×-0.27)+(cg10914555×0.34)+(cg17820890×-0.19)+(cg22831607×1.00)+(cg13281139×0.16)+(cg07136998×-0.30)+(cg11732619×1.48)+(cg15637465×-0.14)+(cg24928391×0.43)+(cg13929566×-0.47)+(cg15773137×-0.29)+(cg19342109×-0.63)+(cg23353893×1.20)+(cg25977958×0.62)+(cg01808545×0.03)+(cg02288301×-0.14)(1)
公式中为相应CpG位点的甲基化水平与其所对应的参数估计值的乘积加和。其中CpG位点的甲基化水平为甲基化和非甲基化位点的荧光信号比例(Beta值=M/(M+UM),M为甲基化信号,UM为未甲基化的信号)。
本发明采用弹性网络算法对78个位点进行模型的构建,由于弹性网络算法所得出的参数估计值可表示自变量对因变量的影响,因此根据各CpG位点所对应的参数估计值对甲基化水平进行加权,最终用加和模型得出甲基化风险指数(Methylation Risk Score,MRS),组织标本基于计算所得的风险指数,当甲基化风险指数高于0.58时,为结直肠癌肿瘤组织标本,当指数低于0.58时,组织标本为正常组织标本,以此可对组织标本的病理来源进行评判。具体的系数及相应位点如表3。
表3 78个甲基化位点的基本情况及对应的系数
实施例1
在TCGA数据中90对结直肠癌组织标本和配对的癌旁正常组织标本中,依据表3中所列出的CpG位点的甲基化水平及所对应的系数,加和后得出每例组织标本的甲基化风险指数,发现肿瘤组织标本的甲基化风险指数的中位数为1.06(1.03,1.07),正常组织标本的甲基化风险指数为0.62(0.02,0.11),两组差异具有统计学意义(P=2.41*10-54);通过受试者特征曲线(ROC曲线)分析发现,甲基化风险指数的ROC曲线下面积高达1;在截断值0.583时,灵敏度和特异度均为1。
上述说明示出并描述了发明的若干优选实施例,但如前所述,应当理解发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离发明的精神和范围,则都应在发明所附权利要求的保护范围内。

Claims (4)

1.一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型的构建方法,其特征在于,包括以下步骤:
步骤1、选出107个与结直肠癌相关的、在基因的启动子区存在甲基化差异的基因;
步骤2、利用TCGA数据库中包括同时具有甲基化和基因表达数据的患者,对107个基因的表达及启动子区的甲基化水平进行了验证,共36个基因验证成功,其中有371个CpG位点位于其启动子区上;
步骤3、利用TCGA数据库中的数据对371个CpG位点进行筛选;共筛选出78个CpG位点;
步骤4、根据CpG位点所对应的估计值对甲基化水平进行加权,得出甲基化风险指数,即为结直肠癌判别模型;当甲基化风险指数高于0.58时,为结直肠癌肿瘤组织标本,当指数低于0.58时,组织标本为正常组织标本。
2.根据权利要求1所述的构建方法,其特征在于,所述步骤2中的验证原则是:①肿瘤与癌旁的正常组织间mRNA表达存在统计学差异FDR<0.05;②肿瘤与癌旁的正常组织间DNA甲基化水平存在统计学差异FDR<0.05;③mRNA表达和DNA甲基化水平呈现负相关。
3.根据权利要求1所述的构建方法,其特征在于,所述步骤3中的筛选原则是:①肿瘤与癌旁的正常组织间DNA甲基化水平差异倍数>4或<0.25;②mRNA表达和CpG位点的DNA甲基化水平呈现负相关;③单因素logistic回归FDR<0.05。
4.根据权利要求1所述的构建方法,其特征在于,所述步骤4中的甲基化风险指数的计算公式如下:
甲基化风险指数(MRS)=(cg00577935×-0.02)+(cg08571859×-0.50)+(cg14479889×-0.17)+(cg16970232×0.03)+(cg21634602×0.47)+(cg05374412×1.43)+(cg08747377×-0.32)+(cg00256785×0.58)+(cg02667335×0.05)+(cg04774496×-0.01)+(cg07951978×0.48)+(cg10223066×-0.34)+(cg12551582×-0.23)+(cg15063355×-0.15)+(cg18533833×-0.39)+(cg19027571×0.13)+(cg19313015×-0.13)+(cg19852344×0.14)+(cg21273703×-0.04)+(cg21645164×-0.12)+(cg22202031×0.69)+(cg24727133×0.21)+(cg26394825×-0.02)+(cg26410484×0.17)+(cg26832509×-0.58)+(cg27040423×-0.09)+(cg27084026×-0.84)+(cg27382164×-0.92)+(cg23407507×-0.01)+(cg26267854×-0.09)+(cg02526522×0.27)+(cg06172475×0.57)+(cg08590601×-0.83)+(cg09037089×0.83)+(cg18142615×-0.44)+(cg19897940×0.16)+(cg27028555×-0.87)+(cg08050235×0.24)+(cg23003534×-0.44)+(cg02150867×0.00)+(cg10160975×0.64)+(cg26967167×-0.22)+(cg06668300×-0.01)+(cg07224914×-0.73)+(cg22403344×0.52)+(cg00687686×0.32)+(cg01466678×-0.01)+(cg04190807×-0.06)+(cg04942472×0.22)+(cg11306587×-0.32)+(cg13031432×-0.67)+(cg01101510×0.74)+(cg03202804×0.51)+(cg04965141×-0.23)+(cg05874561×-0.49)+(cg11354906×-0.16)+(cg14330641×-0.09)+(cg18255353×0.85)+(cg25645268×-0.30)+(cg05937453×-0.65)+(cg06576393×-0.73)+(cg07834955×0.13)+(cg09874752×-0.27)+(cg10914555×0.34)+(cg17820890×-0.19)+(cg22831607×1.00)+(cg13281139×0.16)+(cg07136998×-0.30)+(cg11732619×1.48)+(cg15637465×-0.14)+(cg24928391×0.43)+(cg13929566×-0.47)+(cg15773137×-0.29)+(cg19342109×-0.63)+(cg23353893×1.20)+(cg25977958×0.62)+(cg01808545×0.03)+(cg02288301×-0.14) (1)
公式(1)为相应CpG位点的甲基化水平与其所对应的参数估计值的乘积加和,其中CpG位点的甲基化水平为甲基化和非甲基化位点的荧光信号比例,即Beta值=M/(M+UM),M为甲基化信号,UM为未甲基化的信号。
CN201910707722.3A 2019-08-01 2019-08-01 一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型及其构建方法 Pending CN110257524A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910707722.3A CN110257524A (zh) 2019-08-01 2019-08-01 一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型及其构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910707722.3A CN110257524A (zh) 2019-08-01 2019-08-01 一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型及其构建方法

Publications (1)

Publication Number Publication Date
CN110257524A true CN110257524A (zh) 2019-09-20

Family

ID=67912731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910707722.3A Pending CN110257524A (zh) 2019-08-01 2019-08-01 一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型及其构建方法

Country Status (1)

Country Link
CN (1) CN110257524A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109797218A (zh) * 2017-11-17 2019-05-24 河北医科大学第一医院 整合素β4在区分结肠癌和直肠癌中的应用
CN113234825A (zh) * 2020-05-09 2021-08-10 广州燃石医学检验所有限公司 癌症预后方法
CN114373502A (zh) * 2022-01-07 2022-04-19 吉林大学第一医院 一种基于甲基化的肿瘤数据分析系统
CN114708916A (zh) * 2022-03-15 2022-07-05 至本医疗科技(上海)有限公司 微卫星稳定性的检测方法、检测装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729718A (zh) * 2017-10-17 2018-02-23 北京工业大学 一种乳腺癌发生相关特征基因筛选方法
WO2018158589A1 (en) * 2017-03-02 2018-09-07 Ucl Business Plc Diagnostic and prognostic methods
CN109616198A (zh) * 2018-12-28 2019-04-12 陈洪亮 仅用于肝癌单一癌种筛查的特异甲基化检测位点组合的选取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018158589A1 (en) * 2017-03-02 2018-09-07 Ucl Business Plc Diagnostic and prognostic methods
CN107729718A (zh) * 2017-10-17 2018-02-23 北京工业大学 一种乳腺癌发生相关特征基因筛选方法
CN109616198A (zh) * 2018-12-28 2019-04-12 陈洪亮 仅用于肝癌单一癌种筛查的特异甲基化检测位点组合的选取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HOJOON LEE等: "Systematic genomic identification of colorectal cancer genes delineating advanced from early clinical stage and metastasis", 《BMC MEDICAL GENOMICS》 *
XIAOHUI SUN等: "A novel discriminating colorectal cancer model for differentiating normal and tumor tissues", 《EPIGENOMICS》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109797218A (zh) * 2017-11-17 2019-05-24 河北医科大学第一医院 整合素β4在区分结肠癌和直肠癌中的应用
CN109797218B (zh) * 2017-11-17 2022-04-29 河北医科大学第一医院 整合素β4在制备区分结肠癌和直肠癌试剂或药中的应用
CN113234825A (zh) * 2020-05-09 2021-08-10 广州燃石医学检验所有限公司 癌症预后方法
CN114373502A (zh) * 2022-01-07 2022-04-19 吉林大学第一医院 一种基于甲基化的肿瘤数据分析系统
CN114373502B (zh) * 2022-01-07 2022-12-06 吉林大学第一医院 一种基于甲基化的肿瘤数据分析系统
CN114708916A (zh) * 2022-03-15 2022-07-05 至本医疗科技(上海)有限公司 微卫星稳定性的检测方法、检测装置、计算机设备及存储介质
CN114708916B (zh) * 2022-03-15 2023-11-10 至本医疗科技(上海)有限公司 微卫星稳定性的检测方法、检测装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN110257524A (zh) 一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型及其构建方法
Müller et al. DNA methylation-based diagnostic, prognostic, and predictive biomarkers in colorectal cancer
Aust et al. Serrated polyps of the colon and rectum (hyperplastic polyps, sessile serrated adenomas, traditional serrated adenomas, and mixed polyps)—proposal for diagnostic criteria
CN101353695B (zh) 尿沉淀dna甲基化谱式分析诊断膀胱癌的方法和试剂盒
Carmona et al. DNA methylation biomarkers for noninvasive diagnosis of colorectal cancer
Hughes et al. The CpG island methylator phenotype in colorectal cancer: progress and problems
Tsou et al. Identification of a panel of sensitive and specific DNA methylation markers for lung adenocarcinoma
Kim et al. DNA methylation markers in colorectal cancer
CN105408494B (zh) 预测肾细胞癌的预后的方法
House et al. Tumor suppressor gene hypermethylation as a predictor of gastric stromal tumor behavior
CN108977543A (zh) 一种基于联合检测sdc2和sfrp2基因甲基化水平的结直肠癌早期诊断试剂
CN109072310A (zh) 在尿液中检测癌症
CN108410980A (zh) 筛选甲基化pcr检测的目标区域的方法、试剂盒及应用
CN110438228A (zh) 结直肠癌dna甲基化标志物
Poage et al. Identification of an epigenetic profile classifier that is associated with survival in head and neck cancer
CN102292458A (zh) 大肠肿瘤的检测方法
CN113278693A (zh) 早期结直肠癌和腺瘤的dna甲基化标志物、检测其的方法及其应用
TWI408235B (zh) 用於檢測口腔癌之基因標記及方法
JP2023527868A (ja) 遺伝子マーカー組成物及びその使用
CN110257525A (zh) 对肿瘤诊断具有显著性的标志物及其用途
CN107326065A (zh) 一种基因标识物的筛选方法及其应用
CN108866196A (zh) 一种用于人结直肠肿瘤特异性甲基化检测的引物和探针、试剂盒及其应用
Russo et al. Highly sensitive, non-invasive detection of colorectal cancer mutations using single molecule, third generation sequencing
CN109652541A (zh) 基于甲基化修饰的肿瘤标记物stamp-ep6
CN110408706A (zh) 一种评估鼻咽癌复发的生物标志物及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190920