CN112941180A - 一组肺癌dna甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用 - Google Patents

一组肺癌dna甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用 Download PDF

Info

Publication number
CN112941180A
CN112941180A CN202110213621.8A CN202110213621A CN112941180A CN 112941180 A CN112941180 A CN 112941180A CN 202110213621 A CN202110213621 A CN 202110213621A CN 112941180 A CN112941180 A CN 112941180A
Authority
CN
China
Prior art keywords
methylation
lung cancer
sequencing
dna
genes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110213621.8A
Other languages
English (en)
Inventor
陆燕
孙喜伟
周莉媛
刘鹏渊
陈恩国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Womens Hospital of Zhejiang University School of Medicine
Original Assignee
Womens Hospital of Zhejiang University School of Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Womens Hospital of Zhejiang University School of Medicine filed Critical Womens Hospital of Zhejiang University School of Medicine
Priority to CN202110213621.8A priority Critical patent/CN112941180A/zh
Publication of CN112941180A publication Critical patent/CN112941180A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Evolutionary Biology (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Physiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Public Health (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一组肺癌的DNA甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用。所述标志物是20个基因CDO1,SOX17,TCF21,TRIM58,ITGA9,CYYR1,CLEC14A,SLIT2,ZNF677,IRX2,ACVRL1,OSR1,ADCY8,GALNT13,HSPB6,IRX1,ITGA5,PCDH17,TBX5和TCTEX1D1序列的甲基化。其中8个是在肺癌中新发现的甲基化指纹基因,包括ADCY8,GALNT13,HSPB6,IRX1,ITGA5,PCDH17,TBX5和TCTEX1D1。以本发明标志物为基础,构建肺癌诊断的数学模型;该模型灵敏度高,特异性好,AUC可高达0.998,诊断效果良好。本发明还公开了检测所述DNA甲基化标志物的方法。本发明公开的DNA甲基化分子标志物具有良好的诊断指标特性,可以有效用于肺癌诊断,具有较高的临床使用和推广价值。

Description

一组肺癌DNA甲基化分子标志物及其在制备用于肺癌早期诊 断试剂盒中的应用
技术领域
本发明涉及生物检测技术领域,具体涉及一组肺癌的DNA甲基化分子标志物及其在制备用于肺癌诊断试剂盒中的应用。
背景技术
肺癌是威胁人群健康和生命的最大的恶性肿瘤之一,2020年全球约有180万人死于肺癌,死亡率远超其他类型癌症,位居第一;也是我国发病率和死亡率最高的肿瘤。肺癌主要分成两类:非小细胞肺癌(NSCLC)和小细胞肺癌。NSCLC是最主要类型,占总肺癌80%以上。NSCLC主要包括两个亚型即腺癌和鳞状细胞癌。腺癌占所有肺癌类型的40%,约占NSCLC的55%左右。非小细胞肺癌增殖、侵袭速度较慢,因此更不容易被发现和诊断。大部分非小细胞肺癌患者被确诊时,都已经发展为肿瘤的中晚期,错过绝佳的治疗时间。在我国,肺癌的早期诊断率只有15%,但是这些肺癌病人5年生存率可达到50%~60%,显著高于平均水平15%。因此,在肺癌发生早期进行鉴别诊断,并开展针对性治疗是解决肺癌这一重大难题的重要途径。
生物标志物是指能将机体的生理和疾病状态区分开来的生物分子,筛选到可用于疾病早期发现、早期诊断的生物标志物可大大提高患者的临床治疗效果。近年来,随着研究的深入,研究者发现DNA序列变异之外的调控机制,例如DNA甲基化调控机制,在肿瘤发生发展过程中扮演重要角色。DNA甲基化是一种重要的表观遗传学修饰,同时也是一种被广泛研究的表观遗传学标记;其作为标记物非常稳定,可通过荧光定量PCR进行非常灵敏的检测,因而有望成为继血清蛋白后新一代的分子标志物。
本研究团队通过对18对非小细胞肺癌样本(肿瘤和匹配的癌旁组织)进行全基因组简化甲基化测序(RRBS)和转录组测序(RNA-seq),对两个组学的数据进行整合分析,构建了肺癌DNA差异甲基化区域图谱,挖掘异常甲基化基因,并进一步通过机器学习方法筛选出了肺癌诊断的20个DNA甲基化的基因指纹(gene signature)。利用这20个基因的DNA甲基化指纹能非常有效区分公共数据集TCGA肺腺癌和肺鳞癌中的肿瘤和正常组织,这些标志物将有望成为肺癌诊断筛查的重要手段。
发明内容
本发明的目的在于通过高通量甲基化测序数据和RNA-seq测序数据的整合分析,进一步结合机器学习方法,提供一组肺癌DNA甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用。
本发明的目的是通过以下技术方案来实现的,一组肺癌DNA甲基化分子标志物,所述标志物包括如下20个基因至少一个的甲基化:CDO1,SOX17,TCF21,TRIM58,ITGA9,CYYR1,CLEC14A,SLIT2,ZNF677,IRX2,ACVRL1,OSR1,ADCY8,GALNT13,HSPB6,IRX1,ITGA5,PCDH17,TBX5和TCTEX1D1。
进一步地,所示分子标志物通过以下方法获取:
(1)RRBS和RNA-seq测序文库构建及测序:首先分别分离出每个病人肺肿瘤组织及其相邻正常肺组织样品中的总DNA,用MspI对基因组进行酶切;对产生的DNA片段进行末端修复;在末端修复后的3’末端添加碱基A;将DNA片段粘性末端A上连接甲基化接头。然后,选择40-220bp大小的DNA片段;将选择的片段进行重亚硫酸盐处理,使DNA片段中非甲基化的胞嘧啶转化为胸腺嘧啶,经PCR扩增后转变为尿嘧啶;将经过转换的目的片段进行PCR扩增;分离纯化扩增产物,即得到RRBS测序文库。利用标准Illumina测序试剂进行RNA-Seq文库构建。测序文库质检合格之后上机进行双端测序,得到测序原始数据。
(2)测序数据分析:对步骤(1)得到的测序原始数据进行质检。将经过质检的RRBS读段和RNA-seq读段分别用bismark和hisat2工具比对到人类参考基因组上,获得全基因组上的甲基化图谱和表达水平信息。
(3)检测差异甲基化区域(DMR)和差异表达基因(DEG):对步骤(2)得到的甲基化数据进行聚类分析,然后使用metilene,利用二元分割算法,从肿瘤组织和正常组织中筛选鉴别出差异甲基化区域(DMRs),最后,采用Wilcoxon秩和检验方法对候选的DMRs进行统计检验。对于转录本数据,用DESeq、edgeR等R程序包鉴定肿瘤组织和正常组织之间的差异表达基因(DEG)。
(4)挖掘肺癌候选甲基化驱动基因:首先将DMRs数据根据基因组信息注释到基因的功能区间,进行注释分类;然后提取启动子区域(TSS上游或者下游2kb区域范围)的DMR和相应转录起始位点对应DEG的表达数据进行相关性分析,选择负相关关系统计显著的基因作为异常甲基化驱动候选基因。
(5)机器学习筛选肺癌诊断的DNA甲基化基因指纹:从TCGA公共数据库中下载肺腺癌(LUAD)和肺鳞癌(LUSC)患者的甲基化和表达谱数据,利用这两个数据集对步骤(4)筛选出的甲基化驱动基因的甲基化和表达之间的关联性进行独立验证,进一步筛选出可靠的甲基化驱动基因。
本发明还提供了一种上述DNA甲基化分子标志物在制备用于肺癌早期诊断试剂盒中的应用。
进一步地,以筛选出的20个基因的DNA甲基化指纹为基础,采用随机森林(RF)方法构建肺癌诊断的数学模型,使用ROC曲线及曲线下面积(AUC)来评价筛选效果。
本发明的有益效果是:以本发明标记物为基础,构建肺癌诊断的数学模型;该模型灵敏度高,特异性好,AUC可高达0.998,诊断效果良好。综上所述,本发明公开的DNA甲基化分子标志物具有良好的诊断指标特性,可以有效用于肺癌诊断,具有较高的临床应用和推广价值。
附图说明
图1是本发明的一个实施例流程图。
图2是肺癌组织与癌旁组织的甲基化图谱特征(A)肺癌组织和癌旁组织中全基因组CpG位点聚类分析图。(B)肺癌组织和癌旁组织中全基因组CpG位点主成分分析图。
图3是20个基因DNA甲基化指纹的甲基化和表达图谱特征及其在鉴别TCGA中肺肿瘤组织和癌旁正常组织中的表现。(A)18对非小细胞肺癌及其癌旁组织的甲基化和mRNA表达谱;(B)TCGA肺腺癌中ROC分析;(C)TCGA肺鳞癌中ROC分析。20基因的甲基化指纹能准确区分肿瘤和正常组织。
具体实施方式
下面通过具体实施例子对本发明作进一步阐述,应该说明的是,下述说明仅是为了解释本发明,并不对其内容进行限定。
如图1所示,本发明分子标志物的获取方法如下:
1、测序文库构建及高通量测序:收集18个I期非小细胞肺癌样本,分别分离出每个病人肺肿瘤组织及其相邻正常肺组织样品中的总DNA,用MspI对基因组进行酶切;然后对产生的DNA片段进行末端修复;在末端修复后的3’末端添加碱基A;将DNA片段粘性末端A上连接甲基化接头;然后选择40-220bp大小的DNA片段;将选择的片段进行重亚硫酸盐处理,这样可以将DNA片段中非甲基化的胞嘧啶转化为胸腺嘧啶,经PCR扩增后转变为尿嘧啶;将经过转换的目的片段进行PCR扩增;分离纯化扩增产物,即得到RRBS测序文库。利用标准Illumina测序试剂进行RNA-Seq文库构建。测序文库质检合格之后上机进行高通量双端测序,通过检测荧光信号来确定测得的碱基及顺序,得到FASTQ文件。FASTQ文件包含了读段的全部信息,包括测序仪器的基本信息、碱基排列,以及读段中碱基的质量得分等。
2、测序数据分析:针对测序的质量控制,将使用FastQC等软件提供的测试方法来评估读段质量。我们采用专门处理RRBS数据的整合软件trim_galore,去除RRBS测序数据中低质量的读段或对读段进行剪裁。完成质量控制后,我们使用Bismark,把每个片段序列转换处理后比对到参考基因组(hg19),得到每个样本全基因组单个CpG位点的甲基化水平。我们只保留测序深度大于5并且至少在10对样本中都存在的CpG位点,这样共得到2574098个CpG位点,然后去除与SNP重合的位点(SNP 142)和X,Y染色体上的位点后,结果剩下2166853个CpG位点。利用K-nearest算法推断CpG位点的甲基化缺失值。然后,对36个样本的CpG位点进行样本聚类分析和主成分分析。从构建的系统树图看,这些CpG位点可以把非小细胞肺癌和正常组织分成不同两类(图2A)。主成分分析也观察到非小细胞肺癌和正常组织之间明显地分离(图2B),这些结果表明非小细胞肺癌和正常组织间有不同的甲基化模式。另外,与正常组织比较,非小细胞肺癌样本之间有较大的变异(图2B),显示不同肿瘤样本之间存在异质性的甲基化模式。对于转录本数据,我们使用hisat2工具比对到人类参考基因组上,并使用StringTie把联配后序列组装构建一个精简的转录本集合;然后进一步量化转录本的表达水平。
3、差异甲基化区域(DMR)和差异表达基因(DEG)鉴定:我们使用metilene软件鉴别肿瘤组织中候选的差异甲基化区域DMR。Metilene整合了二元分割算法,能够快速,高效在多个样本中鉴别出差异甲基化区域。然后,我们采用配对的wilcoxon秩和检验对这些候选的DMR进行统计检验,运用Benjamini-Hochberg方法控制多重检验的假阳性(FDR,falsediscovery rate),选择甲基化差异大于0.1且FDR<0.05的区域作为进一步分析的DMR。最终,我们在全基因组水平共鉴定9234个DMRs,其中非小细胞肺癌中高甲基化DMRs 4410个(包含97594个CpG位点),低甲基化DMRs 4824个(包含65009个CpG位点);与低甲基化DMRs相比,高甲基化DMRs的长度较短,但包括更多的CpG位点。对于转录本数据,我们使用DESeq、edgeR等R程序包鉴定肿瘤组织和正常组织之间的差异表达基因(DEG)。
4、挖掘肺癌候选甲基化驱动基因:首先将DMRs数据根据基因组信息注释到基因的功能区间,进行注释分类;然后提取启动子区域(TSS上游或者下游2kb区域范围)的DMR和相应转录起始位点对应DEG的表达数据进行相关性分析,选择负相关关系统计显著的基因作为异常甲基化驱动候选基因。该过程共鉴定出190个基因的表达与其启动子区域DMRs呈显著负相关,其中106个高甲基化基因的mRNA表达下降。对上述筛选出来的基因集进行GO生物过程富集分析,明确候选基因相关的生物学功能,细胞组成,生物学过程;以及利用KEGG数据库进行信号通路富集分析,确定相关基因参与的最主要生化代谢途径和信号转导途径。
5、机器学习筛选肺癌诊断的DNA甲基化基因指纹:我们从TCGA数据库中下载肺腺癌(LUAD)和肺鳞癌(LUSC)患者的甲基化和表达谱数据,验证鉴定的190个候选甲基化驱动基因的甲基化和表达之间是否具有关联性,进一步筛选出可靠的甲基化驱动基因。我们从TCGA中提取了其中133个基因的甲基化和表达谱数据(另外57个基因没有Infinium 450K芯片探针覆盖),分析了他们之间的相关性,结果发现其中81(60.9%)个基因的甲基化和表达间也有显著负相关,显示较好的一致性。这其中,31个基因是同时在LUAD和LUSC数据集中都有的,包括20个高甲基化低表达基因和11个低甲基化高表达基因。由于高甲基化抑制基因表达是经典的调控范式,我们选取了20个高甲基化低表达的基因作为最终的肺癌甲基化诊断指纹(表1,图3A)。筛选差异甲基化基因后,我使用ROC曲线及曲线下面积(AUC)来评价筛选效果。针对TCGA中的LUAD(Tumor:460;Normal:32)和LUSC(Tumor:371;Normal:41)两个数据集,我们分别各自将它们随机分成等量的训练组(50%)和检验组(50%),采用随机森林(RF)方法构建肺癌诊断的数学模型;结果显示这20个基因的DNA甲基化指纹能非常有效区分TCGA中LUAD(图3B,AUC为0.998)和LUSC(图3C,AUC为0.992)与正常组织。其中12个基因已在肺癌中报道,另外8个是肺癌中新的异常甲基化驱动基因,包括ADCY8,GALNT13,HSPB6,IRX1,ITGA5,PCDH17,TBX5和TCTEX1D1;我们采用焦磷酸测序的方法在另外独立的23对非小细胞肺癌与癌旁组织样本中验证了它们甲基化水平的差异,且这8个新鉴定的基因的甲基化指纹能有效区分该独立数据集的癌和癌旁,AUC值高达0.965。这些结果表明我们提供的这组DNA甲基化分子标志物是一种非常有潜力的肺肿瘤诊断标志物。
表1 DNA甲基化指纹中的20个基因的DMR信息
Figure BDA0002952075490000051
Figure BDA0002952075490000061
本发明筛选的分子标志物在制备用于早期肺癌诊断的试剂盒中的应用,以筛选出的20个基因的DNA甲基化指纹为基础,利用焦磷酸甲基化测序或者捕获二代测序分析肿瘤组织样本、气管镜活检样本或血液样本,采用随机森林(RF)方法构建肺癌诊断的数学模型,使用ROC曲线及曲线下面积(AUC)来评价筛选效果;该模型灵敏度高,特异性好,AUC可高达0.998,诊断效果良好。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (4)

1.一组肺癌DNA甲基化分子标志物,其特征在于,所述标志物包括如下20个基因至少一个的甲基化:CDO1,SOX17,TCF21,TRIM58,ITGA9,CYYR1,CLEC14A,SLIT2,ZNF677,IRX2,ACVRL1,OSR1,ADCY8,GALNT13,HSPB6,IRX1,ITGA5,PCDH17,TBX5和TCTEX1D1。
2.根据权利要求1所述一组肺癌DNA甲基化分子标志物,其特征在于,所述标志物通过以下方法获取:
(1)RRBS和RNA-seq测序文库构建及测序:首先分别分离出每个病人肺肿瘤组织及其相邻正常肺组织样品中的总DNA,用MspI对基因组进行酶切;对产生的DNA片段进行末端修复;在末端修复后的3’末端添加碱基A;将DNA片段粘性末端A上连接甲基化接头。然后,选择40-220bp大小的DNA片段;将选择的片段进行重亚硫酸盐处理,使DNA片段中非甲基化的胞嘧啶转化为胸腺嘧啶,经PCR扩增后转变为尿嘧啶;将经过转换的目的片段进行PCR扩增;分离纯化扩增产物,即得到RRBS测序文库。利用标准Illumina测序试剂进行RNA-Seq文库构建。测序文库质检合格之后上机进行双端测序,得到测序原始数据。
(2)测序数据分析:对步骤(1)得到的测序原始数据进行质检。将经过质检的RRBS读段和RNA-seq读段分别用bismark和hisat2工具比对到人类参考基因组上,获得全基因组上的甲基化图谱和表达水平信息。
(3)检测差异甲基化区域(DMR)和差异表达基因(DEG):对步骤(2)得到的甲基化数据进行聚类分析,然后使用metilene,利用二元分割算法,从肿瘤组织和正常组织中筛选鉴别出差异甲基化区域(DMRs),最后,采用Wilcoxon秩和检验方法对候选的DMRs进行统计检验。对于转录本数据,用DESeq、edgeR等R程序包鉴定肿瘤组织和正常组织之间的差异表达基因(DEG)。
(4)挖掘肺癌候选甲基化驱动基因:首先将DMRs数据根据基因组信息注释到基因的功能区间,进行注释分类;然后提取启动子区域(TSS上游或者下游2kb区域范围)的DMR和相应转录起始位点对应DEG的表达数据进行相关性分析,选择负相关关系统计显著的基因作为异常甲基化驱动候选基因。
(5)机器学习筛选肺癌诊断的DNA甲基化基因指纹:从TCGA公共数据库中下载肺腺癌(LUAD)和肺鳞癌(LUSC)患者的甲基化和表达谱数据,利用这两个数据集对步骤(4)筛选出的甲基化驱动基因的甲基化和表达之间的关联性进行独立验证,进一步筛选出可靠的甲基化驱动基因。
3.一种权利要求1所述分子标志物在制备用于肺癌早期诊断的试剂盒中的应用。
4.根据权利要求3所述应用,其特征在于,以筛选出的20个基因的DNA甲基化指纹为基础,利用焦磷酸甲基化测序或者捕获二代测序分析肿瘤组织样本、气管镜活检样本或血液样本,采用随机森林(RF)方法构建肺癌诊断的数学模型,使用ROC曲线及曲线下面积(AUC)来评价效果。
CN202110213621.8A 2021-02-25 2021-02-25 一组肺癌dna甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用 Pending CN112941180A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110213621.8A CN112941180A (zh) 2021-02-25 2021-02-25 一组肺癌dna甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110213621.8A CN112941180A (zh) 2021-02-25 2021-02-25 一组肺癌dna甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用

Publications (1)

Publication Number Publication Date
CN112941180A true CN112941180A (zh) 2021-06-11

Family

ID=76246232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110213621.8A Pending CN112941180A (zh) 2021-02-25 2021-02-25 一组肺癌dna甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用

Country Status (1)

Country Link
CN (1) CN112941180A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113436741A (zh) * 2021-07-16 2021-09-24 四川大学华西医院 基于组织特异增强子区域dna甲基化的肺癌复发预测方法
CN113584168A (zh) * 2021-07-19 2021-11-02 深圳泰莱生物科技有限公司 基于甲基化免疫沉淀高通量测序技术的肺癌检测方法
CN114736968A (zh) * 2022-06-13 2022-07-12 南京世和医疗器械有限公司 血浆游离dna甲基化标志物在肺癌早筛中的用途以及肺癌早筛装置
CN115094142A (zh) * 2022-07-19 2022-09-23 中国医学科学院肿瘤医院 用于诊断肺肠型腺癌的甲基化标志物
CN115772565A (zh) * 2021-09-08 2023-03-10 广州市基准医疗有限责任公司 用于辅助检测肺癌体细胞egfr基因突变的甲基化位点及其应用
CN116555426A (zh) * 2023-05-04 2023-08-08 杭州圣庭医疗科技有限公司 一种鉴定肿瘤组织来源的试剂盒及数据分析方法
CN116884491A (zh) * 2023-09-07 2023-10-13 迈杰转化医学研究(苏州)有限公司 一种高通量筛选甲基化位点集合的方法、试剂盒及其应用

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106399506A (zh) * 2009-10-26 2017-02-15 雅培分子公司 用于测定非小细胞肺癌预后的诊断方法
CN106399476A (zh) * 2016-08-26 2017-02-15 深圳市圣必智科技开发有限公司 用于检测非小细胞肺癌的甲基化抑癌基因标志物及其检测方法
CN108753688A (zh) * 2018-07-02 2018-11-06 广州赛琅生物技术有限公司 一种在低氧条件下体外扩增人血管内皮祖细胞的方法
CN109022567A (zh) * 2018-08-06 2018-12-18 北京艾克伦医疗科技有限公司 用于鉴定肺结节和/或肺癌状态的试剂盒及其应用
CN109680060A (zh) * 2017-10-17 2019-04-26 华东师范大学 甲基化标志物及其在肿瘤诊断、分类中的应用
CN110438228A (zh) * 2019-07-31 2019-11-12 南通大学附属医院 结直肠癌dna甲基化标志物
CN110499364A (zh) * 2019-07-30 2019-11-26 北京凯昂医学诊断技术有限公司 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用
WO2019229259A1 (en) * 2018-05-31 2019-12-05 The Institute Of Cancer Research: Royal Cancer Hospital Materials and methods for monitoring the development of resistance of cancers to treatment

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106399506A (zh) * 2009-10-26 2017-02-15 雅培分子公司 用于测定非小细胞肺癌预后的诊断方法
CN106399476A (zh) * 2016-08-26 2017-02-15 深圳市圣必智科技开发有限公司 用于检测非小细胞肺癌的甲基化抑癌基因标志物及其检测方法
CN109680060A (zh) * 2017-10-17 2019-04-26 华东师范大学 甲基化标志物及其在肿瘤诊断、分类中的应用
WO2019229259A1 (en) * 2018-05-31 2019-12-05 The Institute Of Cancer Research: Royal Cancer Hospital Materials and methods for monitoring the development of resistance of cancers to treatment
CN108753688A (zh) * 2018-07-02 2018-11-06 广州赛琅生物技术有限公司 一种在低氧条件下体外扩增人血管内皮祖细胞的方法
CN109022567A (zh) * 2018-08-06 2018-12-18 北京艾克伦医疗科技有限公司 用于鉴定肺结节和/或肺癌状态的试剂盒及其应用
CN110499364A (zh) * 2019-07-30 2019-11-26 北京凯昂医学诊断技术有限公司 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用
CN110438228A (zh) * 2019-07-31 2019-11-12 南通大学附属医院 结直肠癌dna甲基化标志物

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIWEI SUN等: "An integrated epigenomic-transcriptomic landscape of lung cancer reveals novel methylation driver genes of diagnostic and therapeutic relevance", 《THERANOSTICS》 *
孙喜伟: "深度挖掘肿瘤相关的DNA甲基化和tRNA来源小片段的分子特征", 《中国优秀博硕士学位论文全文数据库(博士) 医药卫生科技辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113436741A (zh) * 2021-07-16 2021-09-24 四川大学华西医院 基于组织特异增强子区域dna甲基化的肺癌复发预测方法
CN113584168A (zh) * 2021-07-19 2021-11-02 深圳泰莱生物科技有限公司 基于甲基化免疫沉淀高通量测序技术的肺癌检测方法
CN115772565A (zh) * 2021-09-08 2023-03-10 广州市基准医疗有限责任公司 用于辅助检测肺癌体细胞egfr基因突变的甲基化位点及其应用
CN115772565B (zh) * 2021-09-08 2023-09-05 广州市基准医疗有限责任公司 用于辅助检测肺癌体细胞egfr基因突变的甲基化位点及其应用
CN114736968A (zh) * 2022-06-13 2022-07-12 南京世和医疗器械有限公司 血浆游离dna甲基化标志物在肺癌早筛中的用途以及肺癌早筛装置
CN115094142A (zh) * 2022-07-19 2022-09-23 中国医学科学院肿瘤医院 用于诊断肺肠型腺癌的甲基化标志物
CN115094142B (zh) * 2022-07-19 2024-05-28 中国医学科学院肿瘤医院 用于诊断肺肠型腺癌的甲基化标志物
CN116555426A (zh) * 2023-05-04 2023-08-08 杭州圣庭医疗科技有限公司 一种鉴定肿瘤组织来源的试剂盒及数据分析方法
CN116884491A (zh) * 2023-09-07 2023-10-13 迈杰转化医学研究(苏州)有限公司 一种高通量筛选甲基化位点集合的方法、试剂盒及其应用
CN116884491B (zh) * 2023-09-07 2023-12-12 迈杰转化医学研究(苏州)有限公司 一种高通量筛选甲基化位点集合的方法、试剂盒及其应用

Similar Documents

Publication Publication Date Title
CN112941180A (zh) 一组肺癌dna甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用
CN110760579B (zh) 扩增游离dna的试剂以及扩增方法
US11581062B2 (en) Systems and methods for classifying patients with respect to multiple cancer classes
EP3658684B1 (en) Enhancement of cancer screening using cell-free viral nucleic acids
CN109830264B (zh) 肿瘤患者基于甲基化位点进行分类的方法
CN113257350A (zh) 基于液体活检的ctDNA突变程度分析方法和装置、ctDNA性能分析装置
JP2014519319A (ja) エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物
WO2022253288A1 (zh) 一种甲基化测序方法和装置
CN115094142B (zh) 用于诊断肺肠型腺癌的甲基化标志物
CN115820860A (zh) 基于增强子甲基化差异的非小细胞肺癌标志物筛选方法及其标志物和应用
CN115087745A (zh) 无细胞样品中的双末端dna片段类型及其用途
US20230203590A1 (en) Methods and means for diagnosing lung cancer
CN115341031A (zh) 一种泛癌甲基化生物标志物的筛选方法、生物标志物及应用
WO2019149093A1 (zh) 一种用于检测食管癌的基因标志物及其用途和检测方法
WO2022262831A1 (zh) 用于评估肿瘤的物质及其方法
CN113667757B (zh) 用于前列腺癌早期筛查的生物标志物组合、试剂盒及应用
CN113817822B (zh) 一种基于甲基化检测的肿瘤诊断试剂盒及其应用
CN114507738A (zh) 甲基化位点、检测甲基化水平的产品的用途及试剂盒
CN109979534B (zh) 一种c位点提取方法及装置
CN116042820B (zh) 一组结肠癌dna甲基化分子标志物及其在制备用于结肠癌早期诊断试剂盒中的应用
WO2022255944A2 (en) Method for detection and quantification of methylated dna
TW202330938A (zh) 用於評估腫瘤的物質及其方法
CN116403719A (zh) 一种乳腺结节恶性鉴别诊断模型的构建方法
CN116790755A (zh) 一种神经胶质瘤检测的标志物及其应用
WO2022190752A1 (ja) がん検査試薬セット、がん検査試薬セットの製造方法及びがん検査方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210611