CN114075605A - 基于甲基化增强基因表达(mege)的癌症标志物筛选方法 - Google Patents

基于甲基化增强基因表达(mege)的癌症标志物筛选方法 Download PDF

Info

Publication number
CN114075605A
CN114075605A CN202210058822.XA CN202210058822A CN114075605A CN 114075605 A CN114075605 A CN 114075605A CN 202210058822 A CN202210058822 A CN 202210058822A CN 114075605 A CN114075605 A CN 114075605A
Authority
CN
China
Prior art keywords
cancer
gene expression
screening
methylation
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210058822.XA
Other languages
English (en)
Inventor
聂海珍
吴振
朱真毓
应彬欣
韩晓亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biochain Beijing Science and Technology Inc
Original Assignee
Biochain Beijing Science and Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biochain Beijing Science and Technology Inc filed Critical Biochain Beijing Science and Technology Inc
Priority to CN202210058822.XA priority Critical patent/CN114075605A/zh
Publication of CN114075605A publication Critical patent/CN114075605A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种癌症标志物筛选方法,包括以下步骤:基于目标癌症与其他癌症组织基因表达水平差异、与正常组织基因表达水平差异和甲基化水平差异来筛选癌症标志物;在目标癌症和其他癌症组织中的基因表达水平差异是指标志物在目标癌症中的基因表达水平显著高于在其他癌症组织中的基因表达水平;在目标癌症和正常组织中的基因表达水平差异是指标志物在目标癌症中的基因表达水平显著高于正常组织中的基因表达水平;在目标癌症和正常组织中的甲基化水平差异是指标志物在目标癌症中的甲基化水平显著高于在正常组织中的甲基化水平。本发明的方法有望与常规甲基化标志物存在互补,更好的提高癌症的检出率,具有精准、快速、高通量的优点。

Description

基于甲基化增强基因表达(MEGE)的癌症标志物筛选方法
技术领域
本发明属于生物医药领域,具体涉及一种基于甲基化增强基因表达(MEGE)的癌症标志物筛选方法。
背景技术
癌症已成为人类的主要杀手。癌症的早期检测可以显著提高治愈率,并降低患者及其家人和医疗保健系统的可怕的个人和财务费用。由于现有标记物灵敏度差,许多癌症患者诊断时往往已是中晚期,丧失了根治切除的机会。
主流理论认为,在癌症细胞中,部分基因启动子区超甲基化,会引起基因表达的下调,从而引起癌症。因此这些超甲基化的片段,可以作为癌症筛查的标志物。根据最新的理论,部分基因内部位点的甲基化,会引起基因表达的上调,即MEGE(Methylation EnhancedGene Expression),也会引起癌症。
发明内容
针对现有技术存在的上述问题,本发明提供一种基于甲基化增强基因表达(MEGE)的癌症标志物筛选方法。
具体来说,本发明涉及如下方面:
1.一种基于甲基化增强基因表达(MEGE)的癌症标志物筛选方法,其中,所述方法包括以下步骤:
基于目标癌症与其他癌症组织基因表达水平差异、与正常组织基因表达水平差异和甲基化水平差异来筛选癌症标志物;
在所述目标癌症和其他癌症组织中的基因表达水平差异是指所述标志物在目标癌症中的基因表达水平显著高于在其他癌症的患癌组织中的基因表达水平;
在所述目标癌症和正常组织中的基因表达水平差异是指所述标志物在癌症患者的患有目标癌症的组织中的基因表达水平显著高于未患有目标癌症时在该组织中的基因表达水平;
在所述目标癌症和正常组织中的甲基化水平差异是指所述标志物在癌症患者的患有目标癌症的组织中的甲基化水平显著高于在未患有目标癌症时在该组织中的甲基化水平。
2. 根据项1所述的方法,其中,基因表达水平差异通过标志物的转录水平差异和/或蛋白表达水平差异来体现。
3. 根据项1所述的方法,其中,
在基于标志物在所述目标癌症与其他癌症组织的基因表达水平差异、正常组织基因表达水平差异和甲基化水平差异来筛选癌症标志物之后还包括:
针对所述筛选出的癌症标志物,根据其针对目标癌症的检测特异性和灵敏度进一步筛选获得癌症标志物。
4. 根据项1所述的方法,其中,
基于目标癌症与其他癌症组织基因表达水平差异、与正常组织基因表达水平差异和甲基化水平差异来筛选癌症标志物包括以下步骤:
基于目标癌症与其他癌症组织基因表达水平差异来进行筛选以获得第一候选基因;
基于所述第一候选基因在目标癌症和正常组织中的基因表达水平差异来进行筛选以获得第二候选基因;
基于所述第二候选基因在目标癌症和正常组织中的甲基化水平差异来进行筛选以获得第三候选基因。
5. 根据项4所述的方法,其中,
基于标志物在所述目标癌症和其他癌症组织中的基因表达水平差异来进行筛选以获得第一候选基因是指基于第一数据库确认到在目标癌症中的平均基因表达水平显著高于其他癌症组织中的平均基因表达水平(P<0.01)的基因作为第一候选基因。
6. 根据项4所述的方法,其中,
基于所述第一候选基因在目标癌症和正常组织中的基因表达水平差异来进行筛选以获得第二候选基因是指基于第二数据库确认到在目标癌症中的平均基因表达水平显著高于正常组织中的平均基因表达水平(P<0.01)的基因作为第二候选基因。
7. 根据项4所述的方法,其中,
基于所述第二候选基因在目标癌症和正常组织中的甲基化水平差异来进行筛选以获得第三候选基因是指基于第三数据库确认到的在目标癌症中的平均甲基化水平显著高于正常组织中的平均甲基化水平(P<0.01)的基因作为第三候选基因。
8. 根据项5所述的方法,其中,所述第一数据库为Human Protein Atalas数据库。
9.根据项6所述的方法,其中,所述第二数据库为GENT2 数据库。
10、根据项7所述的筛选方法,其中,所述第三数据库为MethHC2.0数据库。
11、根据项3所述的筛选方法,其特征在于,针对所述筛选出的癌症标志物,根据其针对目标癌症的检测特异性和灵敏度进一步筛选获得癌症标志物的筛选标准为,特异性大于或等于90%,并且灵敏性大于或等于74%。
12、一种根据项1~11中任一项所述的方法筛选得到的甲基化标志物。
本发明的癌症标志物筛选方法基于基因内部位点的甲基化,来进行的生物标志物筛选,通过该方法,可拓展目前该领域用于癌症诊断甲基化标志物筛选范围,并且由于与启动子区域甲基化导致癌症的机理不同,该方法也有望与常规甲基化标志物存在互补,更好的提高癌症的检出率,具有精准、快速、高通量的优点。
具体实施方式
下面结合实施例进一步说明本发明,应当理解,实施例仅用于进一步说明和阐释本发明,并非用于限制本发明。
除非另外定义,本说明书中有关技术的和科学的术语与本领域内的技术人员所通常理解的意思相同。虽然在实验或实际应用中可以应用与此间所述相似或相同的方法和材料,本文还是在下文中对材料和方法做了描述。在相冲突的情况下,以本说明书包括其中定义为准,另外,材料、方法和例子仅供说明,而不具限制性。以下结合具体实施例对本发明作进一步的说明,但不用来限制本发明的范围。
定义
除非在本文的其他地方具体限定,否则本文使用的所有其他技术和科学术语具有本申请所属领域的普通技术人员通常理解的含义。
甲基化
甲基化是蛋白质和核酸的一种重要的修饰,调节基因的表达和关闭,与癌症、衰老、老年痴呆等许多疾病密切相关,是表观遗传学的重要研究内容之一。 最常见的甲基化修饰有DNA甲基化和组蛋白甲基化。
DNA甲基化是指发生在CpG二核苷酸中胞嘧啶上第5位碳原子的甲基化过程,作为一种相对稳定的修饰状态,在DNA甲基转移酶的作用下,可随DNA的复制过程遗传给新生的子代DNA,是一种重要的表观遗传机制,DNA甲基化时,基因启动子区的甲基化可导致抑癌基因转录沉寂,因此它与肿瘤的发生关系密切。异常甲基化包括抑癌基因和DNA修复基因的高甲基化、重复序列DNA的低甲基化、某些基因的印记丢失,其与多种肿瘤的发生有关。
甲基化增强基因表达
甲基化增强基因表达(Methylation Enhanced Gene Expression,MEGE)是指由于基因内部某些位点发生甲基化而增加了该基因表达。原理上,由于该基因的过表达会导致相应癌症的发生。在本专利中,MEGE指的是,基因内部甲基化标志物的筛选方法,该方法旨在筛选癌症组织中基因内部相应位点发生甲基化的序列片段,通过检测该片段的甲基化状态,即可提示癌症的发生。
目标癌症
目标癌症是指待检测的癌症,即使用本发明筛选出的标志物进行检测的癌症。该目标癌症可以是任何癌症,例如肝癌、肺癌、胰腺癌、乳腺癌、宫颈癌、子宫内膜癌、大肠癌、胃癌、肺癌、鼻咽癌、卵巢癌、前列腺癌症等。
正常组织
正常组织是指癌旁组织,比如在筛选肺癌标志物时,正常组织是指肺中的正常组织。癌旁组织是指癌症组织周围经过病理鉴定,在形态、异型性、组织学分型等方面区别于癌症组织的组织;在某些情况下,由于数据库中癌症组织与癌旁组织的数据信息并非一一对应,因此也可以使用正常组织来替代相应的癌旁组织。比如在筛选肺癌标志物时,癌旁组织是指肺癌组织中周围的不具有肺癌组织特征的组织或正常的肺组织。
特异性
特异性是指没有特定临床疾病的患者的样本,其检测结果呈阴性的比率。
灵敏度
灵敏度是指患有明确临床疾病的患者的样本,其检测结果呈阳性的比率。
本发明提供一种基于甲基化增强基因表达(MEGE)的癌症标志物筛选方法,所述方法包括以下步骤:
基于目标癌症与其他癌症组织基因表达水平差异,与正常组织基因表达水平差异和甲基化水平差异来筛选癌症标志物;
在所述目标癌症和其他癌症组织中的基因表达水平差异是指所述标志物在目标癌症中的基因表达水平显著高于在其他癌症组织中的基因表达水平;
在所述目标癌症和正常组织中的基因表达水平差异是指所述标志物在目标癌症中的基因表达水平显著高于未患有目标癌症时在该组织中的基因表达水平;
在所述目标癌症和正常组织中的甲基化水平差异是指所述标志物在目标癌症中的甲基化水平显著高于在相应正常组织中的甲基化水平,即未患有目标癌症时在该组织中的基因表达水平。
基于目标癌症与其他癌症组织基因表达水平差异,与正常组织基因表达水平差异和甲基化水平差异来筛选癌症标志物包括三个步骤,分别为筛选在目标癌症中的基因表达水平显著高于在其他癌症组织中的基因表达水平的标志物,筛选在目标癌症中的蛋白水平显著高于正常组织中的基因表达水平的标志物,以及筛选在目标癌症中的甲基化水平显著高于在正常组织中的甲基化水平的标志物。
这三个步骤的执行顺序没有限制,例如可以首先筛选在目标癌症中的基因表达水平显著高于在其他癌症组织中的基因表达水平的标志物,其次筛选在目标癌症中的基因表达水平显著高于正常组织中的基因表达水平的标志物,最后筛选在目标癌症中的甲基化水平显著高于在正常组织中的甲基化水平的标志物。
也可以首先筛选在目标癌症中的基因表达水平显著高于正常组织中的基因表达水平的标志物,其次筛选在目标癌症中的基因表达水平显著高于在其他癌症组织中的基因表达水平的标志物,最后筛选在目标癌症中的甲基化水平显著高于在正常组织中的甲基化水平的标志物。
或者首先筛选在目标癌症中的甲基化水平显著高于在正常组织中的甲基化水平的标志物,其次筛选在目标癌症中的基因表达水平显著高于在其他癌症组织中的基因表达水平的标志物,最后筛选在目标癌症中的基因表达水平显著高于正常组织中的基因表达水平的标志物。
基因表达水平差异可以通过标志物的转录水平差异和/或蛋白表达水平差异来体现。在一个具体的实施方式中,基因表达水平差异通过标志物的转录水平差异来体现。在一个具体的实施方式中,基因表达水平差异通过标志物的蛋白表达水平差异来体现。
其中所述标志物在目标癌症中的基因表达水平显著高于在其他癌症组织中的基因表达水平,指的是P<0.01。
所述标志物在目标癌症中的基因表达水平显著高于正常组织中的基因表达水平指的是P<0.01。
所述标志物在目标癌症中的甲基化水平显著高于在正常组织中的甲基化水平指的是P<0.01。
在基于所述标志物在所述目标癌症与其他癌症组织的基因表达水平差异、正常组织基因表达水平差异和甲基化水平差异来筛选癌症标志物之后,本发明的癌症标志物筛选方法还可以包括:针对所述筛选出的癌症标志物,根据其针对目标癌症的检测特异性和灵敏度进一步筛选获得癌症标志物。
在一个具体的实施方式中,针对目标癌症的检测特异性和灵敏度进一步筛选获得癌症标志物的筛选标准为,特异性大于或等于90%,例如可以为90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%,并且灵敏性大于或等于74%。例如可以为74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。
基于目标癌症与其他癌症组织基因表达水平差异、与正常组织基因表达水平差异和甲基化水平差异来筛选癌症标志物的步骤,进一步可以包括以下步骤:
基于目标癌症与其他癌症组织基因表达水平差异来进行筛选以获得第一候选基因;
基于所述第一候选基因在目标癌症和相应正常组织中的基因表达水平差异来进行筛选以获得第二候选基因;
基于所述第二候选基因在目标癌症和相应正常组织中的甲基化水平差异来进行筛选以获得第三候选基因。
其中基于标志物在所述目标癌症和其他癌症组织中的基因表达水平差异来进行筛选以获得第一候选基因是指基于第一数据库确认到在目标癌症中的平均基因表达水平显著高于其他癌症组织中的平均基因表达水平(P<0.01)的基因作为第一候选基因。
在一个具体的实施方式中,所述第一数据库为记载有肿瘤相关基因表达同时进行特定癌症病种与其他癌症病种比较的数据库,例如Human Protein Atalas数据库。基于所述第一候选基因在目标癌症和正常组织中的基因表达水平差异来进行筛选以获得第二候选基因是指基于第二数据库确认到在目标癌症中的平均基因表达水平显著高于正常组织中的平均基因表达水平(P<0.01)的基因作为第二候选基因。
在一个具体的实施方式中,所述第二数据库为记载有肿瘤相关基因表达水平同时进行癌症组织与正常组织比较的数据库,例如GENT2 数据库。基于所述第二候选基因在目标癌症和正常组织中的甲基化水平差异来进行筛选以获得第三候选基因是指基于第三数据库确认到的在目标癌症中的平均甲基化水平显著高于正常组织中的平均甲基化水平(P<0.01)的基因作为第三候选基因。
在一个具体的实施方式中,所述第三数据库为记载有肿瘤DNA甲基化的数据库,例如MethHC2.0数据库。
在一个具体的实施方式中,本发明的基于甲基化增强基因表达(MEGE)的癌症标志物筛选方法包括以下步骤:
基于目标癌症与其他癌症组织基因表达水平差异来进行筛选以获得第一候选基因;
基于所述第一候选基因在目标癌症和正常组织中的基因表达水平差异来进行筛选以获得第二候选基因;
基于所述第二候选基因在目标癌症和正常组织中的甲基化水平差异来进行筛选以获得第三候选基因作为癌症标志物。
在一个具体的实施方式中,本发明的基于甲基化增强基因表达(MEGE)的癌症标志物筛选方法包括以下步骤:
基于目标癌症与其他癌症组织基因表达水平差异来进行筛选以获得第一候选基因;
基于所述第一候选基因在目标癌症和正常组织中的基因表达水平差异来进行筛选以获得第二候选基因;
基于所述第二候选基因在目标癌症和正常组织中的甲基化水平差异来进行筛选以获得第三候选基因;
基于所述第三候选基因针对目标癌症的检测特异性和灵敏度进一步筛选获得癌症标志物,其中筛选标准为,特异性大于或等于90%,并且灵敏性大于或等于74%。
在一个更具体的实施方式中,本发明的基于甲基化增强基因表达(MEGE)的癌症标志物筛选方法包括以下步骤:
基于目标癌症与其他癌症组织转录水平差异来进行筛选以获得第一候选基因;
基于所述第一候选基因在目标癌症和正常组织中的蛋白表达水平差异来进行筛选以获得第二候选基因;
基于所述第二候选基因在目标癌症和正常组织中的甲基化水平差异来进行筛选以获得第三候选基因;
基于所述第三候选基因针对目标癌症的检测特异性和灵敏度进一步筛选获得癌症标志物,其中筛选标准为,特异性大于或等于90%,并且灵敏性大于或等于74%。
DNA甲基化几乎在所有癌症中均有发现,并且发生在癌前或者癌症早期阶段,因而近年来甲基化是癌症早期诊断的理想标志物已经逐渐得到行业共识。但是如何找到目标癌症特异性同时检测灵敏度高的甲基化标志物是业内难题。
目前通过生物信息学的数据库,尤其是肿瘤相关的数据库来发掘相应的甲基化基因,是寻找标志物的一种方法。现有的思路通常是搜集数据库中目标癌症组织样本和癌旁组织样本甲基化显著差异位点,即在癌症组织中甲基化水平高,在正常样本中甲基化水平低(癌症样本的均值或者中位数减去正常样本的均值或者中位数的差值大于0.25)的位点。逻辑单一,筛选出的位点可能多达成百上千,无法继续浓缩,后续若使用临床样本进行验证,工作量巨大,无法转化为用几个基因检测的产品。
而本发明的方法是基于位于基因内部的甲基化水平升高会引起基因表达水平升高,进而导致癌症发生这一原理,会通过不同数据库进行甲基化水平的评估,会进行基因表达水平的评估,会进行目标癌症与其他癌症的对比,会进行目标癌症与正常组织的对比,因此筛选出的标志物癌间特异性有保证,正常对照组的特异性也有保证。
本发明基于癌症发生时部分基因会引起甲基化水平的显著提高来筛选癌症标志物,并结合标志物在其他癌症组织基因表达水平差异、与正常组织基因表达水平差异作为筛选标准,构建了一种标志物筛选的方法,可以准确快速的筛选到目标癌症的标志物。同时拓展了甲基化标志物的筛选思路,理论上来讲,通过本发明的方法筛选出的标志物与传统启动子区域高甲基化标志物会存在互补,联合检测的灵敏度进一步提升。
本发明还提供上述方法筛选到的甲基化标志物。所述甲基化标志物可以是针对各种癌症的标志物。
实施例
本实施例以肺癌标志物为例,具有包括以下步骤:
(1)获得第一候选基因
通过Human Protein Atalas数据库,筛选在肺癌和其他癌症组织中转录水平差异较大的基因,即在肺癌组织中的转录水平显著高于其他癌症组织的基因(P< 0.01),作为第一候选基因。
具体操作如下:
进入Human Protein Atalas https://www.proteinatlas.org/网站,点击“MENU”,选择“THE HUMAN PROTEOME”标签下的“THE PATGOLOGY ATALAS”,点击进入;
选择在肺癌组织中表达量较高的基因,即点击指示到肺的图标进入;
根据转录组信息,相较于其他癌症,选择在肺癌组织中转录水平升高的基因,共97个基因(未详细列出)。
根据在17种癌症组织中的分布,将上一步骤中筛选到的97个基因分为4组,选择前2组,即只在肺癌组织中转录(1个基因)和在肺癌及其他一些癌症组织中转录(42个基因),得到TFAP2D、SFTA3、SFTPC、NKX2-1、SFTPA1、ADH7、CSN3、B3GNT6、SERPINB12、STATH、ROS1、AGTR2、BRDT、FAM216B、PRB4、SCGB3A2、UGT1A7、C12orf54、PGLYRP4、TMPRSS11A、GGTLC1、SOST、CAPN14、TEKT1、TMPRSS11F、UMODL1、ACOXL、CDH26、COL4A3、IL37、PAX7、SNTN、SPINK13、ACP7、FAM92B、HTR7、PHACTR3、SPINK2、CHIA、INSL4、LGSN、SLC46A2、WFDC10B共43个基因,即第一候选基因。
(2)获得第二候选基因
利用GENT2数据库,筛选第一候选基因中,与正常组织相比,肺癌组织中表达水平显著提高的基因,作为第二候选基因。
具体操作如下:
进入http://gent2.appex.kr/gent2/网站,点击“Gene Profile”搜索;
在搜索框中,将类型Type选为组织Tissue,将第一候选基因集中的43个基因逐个输入Keyword框中进行搜索;
结果输出界面显示检索的基因在不同组织及其相应癌症组织中表达量的对比;点击显著性检验结果,显示不同组织中,检索的基因在癌症组织和相应正常组织中表达量的差异变化,筛选43个第一候选基因中P < 0.01且Log2FC > 0(代表癌症组织中的表达量显著高于相应正常组织,Log2FC中的FC即fold change,表示两样品(组)间表达量的差异倍数,对其取以2为底的对数之后即为Log2FC。一般国内公司默认取Log2FC绝对值大于1为差异基因的筛选标准。)的基因,包括NKX2-1、B3GNT6、BRDT、UGT1A7、PGLYRP4、SOST、WFDC10B、TFAP2D、CAPN14、UMODL1、IL37、PAX7、SPINK13、SPINK2、INSL4、LGSN共16个,即为第二候选基因。
(3)获得第三候选基因
使用MethHC2.0数据库,筛选第二候选基因中在肺癌组织中的甲基化水平显著高于正常组织的基因(P< 0.01),作为第三候选基因。具体操作如下:
进入https://awi.cuhk.edu.cn/~MethHC/methhc_2020/php/index.php网站,点击“GENE METHYLATION”进入;
“Search by”框中选择“gene”;
癌症类型选择luad: Lung Adenocarcinoma和lusc: Lung Squamous CellCarcinoma;
“Select a gene region”框中选择“gene body”;
在搜索框中输入第二候选基因中的16个基因,以“;”分隔,点击搜索;
在结果显示界面筛选出肺癌组织中甲基化水平显著高于正常组织的基因,即第三候选基因,包括NKX2-1、SOST、TFAP2D、PAX7、SPINK2、LGSN共6个基因。
(4)获得肺癌标志物
根据第三候选基因针对目标癌症的检测特异性和灵敏度进一步筛选获得癌症标志物。
具体的操作步骤为:
将6个第三候选基因用于20份肺癌血浆(表1)和41份正常人血浆的检测,血浆处理试剂盒可使用博尔诚(北京)科技有限公司的核酸提取试剂(京经械备20140053号,PCR反应液可以使用天根生化科技有限公司PCR反应Mix进行配制,货号:FP208-01),所有操作步骤均基于试剂盒的说明书来检测。其中以标志物的特异性大于92%,且灵敏性大于85%为进一步的筛选标准,得到2个肺癌标志物,即PAX7和SPINK2。
表1 肺癌血浆信息
Figure 727780DEST_PATH_IMAGE001
其中,两个标志物的检测结果如表2和表3所示。
表2 标志物1的检测灵敏度和特异性
Figure 276573DEST_PATH_IMAGE002
表3标志物2的检测灵敏度和特异性
Figure 833456DEST_PATH_IMAGE003
尽管以上对本发明的实施方案进行了描述,但本发明并不局限于上述的具体实施方案和应用领域,上述的具体实施方案仅仅是示意性的、指导性的,而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下,还可以做出很多种的形式,这些均属于本发明保护之列。

Claims (12)

1.一种基于甲基化增强基因表达(MEGE)的癌症标志物筛选方法,其中,所述方法包括以下步骤:
基于目标癌症与其他癌症组织基因表达水平差异、与正常组织基因表达水平差异和甲基化水平差异来筛选癌症标志物;
在所述目标癌症和其他癌症组织中的基因表达水平差异是指所述标志物在目标癌症中的基因表达水平显著高于在其他癌症的患癌组织中的基因表达水平;
在所述目标癌症和正常组织中的基因表达水平差异是指所述标志物在癌症患者的患有目标癌症的组织中的基因表达水平显著高于未患有目标癌症时在该组织中的基因表达水平;
在所述目标癌症和正常组织中的甲基化水平差异是指所述标志物在癌症患者的患有目标癌症的组织中的甲基化水平显著高于在未患有目标癌症时在该组织中的甲基化水平。
2.根据权利要求1所述的方法,其中,基因表达水平差异通过标志物的转录水平差异和/或蛋白表达水平差异来体现。
3.根据权利要求1所述的方法,其中,
在基于标志物在所述目标癌症与其他癌症组织的基因表达水平差异、正常组织基因表达水平差异和甲基化水平差异来筛选癌症标志物之后还包括:
针对所述筛选出的癌症标志物,根据其针对目标癌症的检测特异性和灵敏度进一步筛选获得癌症标志物。
4.根据权利要求1所述的方法,其中,
基于目标癌症与其他癌症组织基因表达水平差异、与正常组织基因表达水平差异和甲基化水平差异来筛选癌症标志物包括以下步骤:
基于目标癌症与其他癌症组织基因表达水平差异来进行筛选以获得第一候选基因;
基于所述第一候选基因在目标癌症和正常组织中的基因表达水平差异来进行筛选以获得第二候选基因;
基于所述第二候选基因在目标癌症和正常组织中的甲基化水平差异来进行筛选以获得第三候选基因。
5.根据权利要求4所述的方法,其中,
基于标志物在所述目标癌症和其他癌症组织中的基因表达水平差异来进行筛选以获得第一候选基因是指基于第一数据库确认到在目标癌症中的平均基因表达水平显著高于其他癌症组织中的平均基因表达水平(P<0.01)的基因作为第一候选基因。
6.根据权利要求4所述的方法,其中,
基于所述第一候选基因在目标癌症和正常组织中的基因表达水平差异来进行筛选以获得第二候选基因是指基于第二数据库确认到在目标癌症中的平均基因表达水平显著高于正常组织中的平均基因表达水平(P<0.01)的基因作为第二候选基因。
7.根据权利要求4所述的方法,其中,
基于所述第二候选基因在目标癌症和正常组织中的甲基化水平差异来进行筛选以获得第三候选基因是指基于第三数据库确认到的在目标癌症中的平均甲基化水平显著高于正常组织中的平均甲基化水平(P<0.01)的基因作为第三候选基因。
8.根据权利要求5所述的方法,其中,所述第一数据库为Human Protein Atalas数据库。
9.根据权利要求6所述的方法,其中,所述第二数据库为GENT2 数据库。
10.根据权利要求7所述的筛选方法,其中,所述第三数据库为MethHC2.0数据库。
11.根据权利要求3所述的筛选方法,其特征在于,针对所述筛选出的癌症标志物,根据其针对目标癌症的检测特异性和灵敏度进一步筛选获得癌症标志物的筛选标准为,特异性大于或等于90%,并且灵敏性大于或等于74%。
12.一种根据权利要求1~11中任一项所述的方法筛选得到的甲基化标志物。
CN202210058822.XA 2022-01-19 2022-01-19 基于甲基化增强基因表达(mege)的癌症标志物筛选方法 Pending CN114075605A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210058822.XA CN114075605A (zh) 2022-01-19 2022-01-19 基于甲基化增强基因表达(mege)的癌症标志物筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210058822.XA CN114075605A (zh) 2022-01-19 2022-01-19 基于甲基化增强基因表达(mege)的癌症标志物筛选方法

Publications (1)

Publication Number Publication Date
CN114075605A true CN114075605A (zh) 2022-02-22

Family

ID=80284697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210058822.XA Pending CN114075605A (zh) 2022-01-19 2022-01-19 基于甲基化增强基因表达(mege)的癌症标志物筛选方法

Country Status (1)

Country Link
CN (1) CN114075605A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150141262A1 (en) * 2012-06-13 2015-05-21 King Abdullah University Of Science And Technology Methylation biomarkers for breast cancer
CN107326065A (zh) * 2016-04-29 2017-11-07 博尔诚(北京)科技有限公司 一种基因标识物的筛选方法及其应用
CN109616198A (zh) * 2018-12-28 2019-04-12 陈洪亮 仅用于肝癌单一癌种筛查的特异甲基化检测位点组合的选取方法
CN111402949A (zh) * 2020-04-17 2020-07-10 北京恩瑞尼生物科技股份有限公司 一种肝细胞肝癌患者诊断、预后和复发统一模型的构建方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150141262A1 (en) * 2012-06-13 2015-05-21 King Abdullah University Of Science And Technology Methylation biomarkers for breast cancer
CN107326065A (zh) * 2016-04-29 2017-11-07 博尔诚(北京)科技有限公司 一种基因标识物的筛选方法及其应用
CN109616198A (zh) * 2018-12-28 2019-04-12 陈洪亮 仅用于肝癌单一癌种筛查的特异甲基化检测位点组合的选取方法
CN111402949A (zh) * 2020-04-17 2020-07-10 北京恩瑞尼生物科技股份有限公司 一种肝细胞肝癌患者诊断、预后和复发统一模型的构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIM SMITH等: "Promoter DNA Hypermethylation and Paradoxical Gene Activation", 《TRENDS CANCER》 *
骆红波等: "DNA甲基化驱动的转录表达特征作为肝癌预后预测标志物的价值", 《遗传》 *

Similar Documents

Publication Publication Date Title
Liang et al. Non-invasive diagnosis of early-stage lung cancer using high-throughput targeted DNA methylation sequencing of circulating tumor DNA (ctDNA)
Chakraborty et al. Onco‐multi‐OMICS approach: a new frontier in cancer research
Mao et al. CanDrA: cancer-specific driver missense mutation annotation with optimized features
Vrba et al. A suite of DNA methylation markers that can detect most common human cancers
Strausberg The Cancer Genome Anatomy Project: new resources for reading the molecular signatures of cancer
Wei et al. Integrative analysis of MicroRNA and gene interactions for revealing candidate signatures in prostate cancer
Li et al. Specific DNA methylation markers in the diagnosis and prognosis of esophageal cancer
Phan et al. Multiscale integration of-omic, imaging, and clinical data in biomedical informatics
Fan et al. Methods for genome-wide DNA methylation analysis in human cancer
Gnanapragasam Unlocking the molecular archive: the emerging use of formalin‐fixed paraffin‐embedded tissue for biomarker research in urological cancer
CN110004226B (zh) 一种基于直肠癌转录组基因及甲基化联合分析预测预后的方法及模型应用
Wang et al. A microRNA panel to discriminate carcinomas from high-grade intraepithelial neoplasms in colonoscopy biopsy tissue
Gao et al. Unintrusive multi-cancer detection by circulating cell-free DNA methylation sequencing (THUNDER): development and independent validation studies
JP2024001068A (ja) がんの非侵襲的検出のためのdnaメチル化マーカーとその使用
WO2020034543A1 (zh) 用于乳腺癌诊断的标记物及其筛选方法
CN109830264A (zh) 肿瘤患者基于甲基化位点进行分类的方法
Zhao et al. Identification of differentially expressed metastatic genes and their signatures to predict the overall survival of uveal melanoma patients by bioinformatics analysis
Sun et al. Stratification of follicular thyroid tumours using data‐independent acquisition proteomics and a comprehensive thyroid tissue spectral library
Zhang et al. Integrative analysis identifies key mRNA biomarkers for diagnosis, prognosis, and therapeutic targets of HCV-associated hepatocellular carcinoma
Ibrahim et al. Genome‐wide DNA methylation profiling and identification of potential pan‐cancer and tumor‐specific biomarkers
Jones et al. Stromal composition predicts recurrence of early rectal cancer after local excision
Wu et al. DNA-methylation signature accurately differentiates pancreatic cancer from chronic pancreatitis in tissue and plasma
Mirzaei et al. Evaluation of methylation status in the 5'UTR promoter region of the DBC2 gene as a biomarker in sporadic breast cancer
Quackenbush Extracting meaning from functional genomics experiments
CN114075605A (zh) 基于甲基化增强基因表达(mege)的癌症标志物筛选方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination