CN111128299B - 一种结直肠癌预后显著相关ceRNA调控网络的构建方法 - Google Patents

一种结直肠癌预后显著相关ceRNA调控网络的构建方法 Download PDF

Info

Publication number
CN111128299B
CN111128299B CN201911290283.7A CN201911290283A CN111128299B CN 111128299 B CN111128299 B CN 111128299B CN 201911290283 A CN201911290283 A CN 201911290283A CN 111128299 B CN111128299 B CN 111128299B
Authority
CN
China
Prior art keywords
colorectal cancer
mirna
genes
gene
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911290283.7A
Other languages
English (en)
Other versions
CN111128299A (zh
Inventor
郭丽
杨国伟
康一浩
李孙静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201911290283.7A priority Critical patent/CN111128299B/zh
Publication of CN111128299A publication Critical patent/CN111128299A/zh
Application granted granted Critical
Publication of CN111128299B publication Critical patent/CN111128299B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种结直肠癌预后显著相关ceRNA调控网络的构建方法,基于高通量测序数据通过生物信息学整合分析筛选得到,包括:对收集的4个结直肠癌基因表达数据集进行差异基因表达分析,筛选共有的差异表达基因;通过String和Cytoscape软件,构建蛋白质‑蛋白质相互作用网络,结合相应基因的生存分析筛选得到关键基因,根据关键基因对上游miRNA进行预测分析,对上游miRNA进行结直肠癌病人生存分析,筛选出与预后显著相关的miRNA。基于miRNA进行相互作用的lncRNA筛选分析,筛选出与预后显著相关的lncRNA。将得到的关键基因(hub gene),miRNA,lncRNA通过其相互作用关系构建ceRNA网络,并根据lncRNA,miRNA和hub gene在COAD中的表达趋势进行评估,得到与COAD预后显著相关的ceRNA调控网络。

Description

一种结直肠癌预后显著相关ceRNA调控网络的构建方法
技术领域
本发明属于医药技术领域,具体涉及一种结直肠癌预后显著相关ceRNA调 控网络的构建方法。
背景技术
结肠癌是世界上最常见的恶性肿瘤之一。结直肠癌(COAD)在全球男性和 女性估计病例和死亡排名中都能到达前三名,并且结肠癌的发病率和死亡率迅速 上升。约20%-25%的结直肠癌患者在诊断时出现转移性疾病,20%-25%的患者在 诊断后出现转移,总体死亡率相对较高,为40%-45%。在中国结直肠癌的发病率 和死亡率仍然在所有癌症中排名靠前。
众所周知,癌症的治疗一直都是现代医学领域难以攻克的难点,传统的治疗 手段由于癌细胞随血液扩散导致很难彻底杀死癌细胞。结肠癌是一种多分子突变 的异质性疾病。它很少单独归因于一个或几个基因组突变。到目前为止,还没有 单一的基因“驱动”被报道在评估侵袭性疾病方面有优势。因此,识别有效的预后 标志物对于个体化治疗至关重要。此外,探索生物标志物的潜在调控网络对于开 发有效的治疗至关重要。
近几年来,越来越多的证据揭示了mRNA-miRNA-lncRNA调控网络在多种 人类癌症中具有重要的调控作用。许多研究指出,ceRNA网络可能是结直肠癌预 后的一个标志。因此利用mRNA-miRNA-lncRNA相互作用关系为疾病的早期诊 断,设计靶向药物进行精准治疗,对癌症的靶向治疗及个体化精准医疗有重要的 意义。
尽管,越来越多的证据揭示mRNA-miRNA-lncRNA调控网络在多种人类癌 症中发挥重要作用。然而,在癌症预后相关的mRNA-miRNA-lncRNA调控网络 研究仍然缺乏,特别是基于大数据的研究方法。
发明内容
目的:为了克服现有技术中存在的不足,本发明提供一种结直肠癌预后显著 相关ceRNA调控网络的构建方法。
技术方案:为解决上述技术问题,本发明采用的技术方案为:
一种结直肠癌(COAD)预后显著相关ceRNA(内源竞争RNA)调控网络 的构建方法,包括:
步骤1)从NCBI GEO数据库中筛选出3个符合条件的结直肠癌基因表达数 据集,下载TCGA数据库中结直肠癌的基因表达数据、miRNA表达数据和结直 肠癌的临床信息;
步骤2)分别对GEO的3个结直肠癌基因表达数据集、TCGA数据库中结直 肠癌的基因表达数据进行差异基因表达分析,得到4组差异表达基因;取4组差 异表达基因的交集,得到共有的差异表达基因;
步骤3)根据步骤2)得到的共有的差异表达基因,构建蛋白质-蛋白质相互 作用网络(PPI网络);根据PPI网络中的重要模块和基因的连接度(degree)并 结合单基因生存分析,筛选出关键基因(hub gene);
步骤4)根据步骤3)得到的关键基因(hub gene),进行预测得到关键基因 (hubgene)的上游miRNA,并基于上游miRNA表达数据和结直肠癌的临床信 息进行生存分析,筛选出与结直肠癌预后显著相关的miRNA;
步骤5)根据步骤4)得到的miRNA,进行预测得到与结直肠癌预后显著相 关的miRNA的上游lncRNA,并基于上游lncRNA表达数据和结直肠癌的临床信 息进行生存分析,筛选出与结直肠癌预后显著相关的lncRNA;
步骤6)基于得到的关键基因(hub gene)、与结直肠癌预后显著相关的miRNA、lncRNA,根据其相互作用关系构建ceRNA网络;
步骤7)基于步骤6)得到的ceRNA网络,并根据与结直肠癌预后显著相关 的lncRNA、miRNA和关键基因(hub gene)在结直肠癌中的表达趋势进行评估, 得到最终的结直肠癌预后显著相关的ceRNA调控网络。
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤1)中,所述的结直肠癌基因表达数据集,是从GEO数据库中搜索的数 据集,经过条件筛选得到,筛选条件为:同时包含结直肠癌的癌组患者和对照组 患者;每个数据集为一个数据矩阵,行名为基因名称,列名为样本名称。
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤2)中,分别对GEO的3个结直肠癌基因表达数据集、TCGA-COAD 的基因表达数据进行差异基因表达分析,得到4组差异表达基因,包括:
对于GEO的3个结直肠癌基因表达数据集,利用GEO在线差异表达分析工 具GEO2R分别进行差异基因表达分析,得到3组差异表达基因;
对于TCGA-COAD的基因表达数据,利用R软件limma包进行差异基因表 达分析得到1组差异表达基因;
上述差异基因表达分析的阈值条件均设置为:|log2FC|>1,且FDR<0.05; FC为(fold change)差异倍数,FDR(False discovery rate)伪发现率;满足阈值条 件的基因为差异表达基因。
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤3)根据步骤2)得到的共有的差异表达基因,构建蛋白质-蛋白质相互 作用网络(PPI网络);根据PPI网络中的重要模块和基因的连接度(degree)并 结合单基因生存分析,筛选出关键基因(hub gene);包括:
基于共有的差异表达基因,通过STRING数据库(https://string-db.org/),分 别构建共有的上调基因的蛋白质-蛋白质相互作用网络(PPI网络)和下调基因的 蛋白质-蛋白质相互作用网络(PPI网络),即PPI网络;
将通过STRING数据库得到的上调基因和下调基因PPI网络分别导入 Cytoscape软件,使用Cytoscape软件中的MCODE插件对上调基因的PPI网络进 行重要模块的识别,得到上调基因的PPI网络中两个重要模块;使用Cytoscape 软件中的CytoHubba插件根据连接度(degree)对下调基因的PPI网络进行分析, 得到下调基因PPI网络中排名靠前的100个基因;把上调基因的PPI网络中两个 重要模块的基因和下调基因PPI网络中排名靠前的100个基因,作为预生存分析 的基因;
使用TCGA数据库中结直肠癌的基因表达数据,利用R软件中survival和survminer包,使用Kaplan-Meier法,对上述得到的预生存分析的基因进行生存 分析,以时序检验Logrank p<0.05作为筛选标准,得到关键基因(hub gene)。
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤4)根据步骤3)得到的关键基因(hub gene),进行预测得到关键基因 (hub gene)的上游miRNA,并对上游miRNA进行生存分析,筛选出与结直肠 癌预后显著相关的miRNA;包括:
利用starBase数据预测关键基因的上游miRNA;
使用TCGA数据库中结直肠癌的miRNA表达数据,利用R软件中survival 和survminer包,使用Kaplan-Meier法,对上游miRNA进行生存分析,以Logrank p<0.05作为筛选标准,得到与结直肠癌预后显著相关的miRNA。
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤5)包括:
利用miRNet数据库预测得到与结直肠癌预后显著相关的miRNA的上游 lncRNA,利用GEPIA在线数据库,对预测得到的lncRNA进行生存分析,以 Logrank p<0.05作为筛选标准,得到与结直肠癌预后显著相关的lncRNA。
在一些实施例中,步骤6)基于得到的关键基因(hub gene)、与结直肠癌预 后显著相关的miRNA、lncRNA,根据其相互作用关系构建ceRNA网络;包括:
基于得到的关键基因(hub gene)、与结直肠癌预后显著相关的miRNA、 lncRNA,根据lncRNA-miRNA、miRNA-mRNA相互作用关系,构建得到基于与 结直肠癌预后显著相关lncRNA-miRNA-mRNA的ceRNA网络;
进一步的,使用R软件的networkD3包对构建的ceRNA网络进行可视化。
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤7)基于步骤6)得到的ceRNA网络,并根据与结直肠癌预后显著相关 的lncRNA、miRNA和关键基因(hub gene)在结直肠癌中的表达趋势进行评估, 根据表达量差异进行筛选得到最终的结直肠癌预后显著相关ceRNA调控网络。
有益效果:本发明提供的结直肠癌预后显著相关ceRNA调控网络的构建方 法,基于高通量测序数据通过生物信息学整合分析筛选得到,从结直肠癌预后层 面研究mRNA-miRNA-lncRNA调控网络在人类癌症中的作用,并深入探索其在 肿瘤中具体的调控机制和具体的靶基因,为结直肠癌的早期诊断、基因靶点治疗 和预后提供新的思路和研究方向。
附图说明
图1是本发明实施例的方法流程图;
图2是本发明实施例的根据结直肠癌预后显著相关lncRNA、miRNA和 mRNA相互作用关系构建的ceRNA网络。
具体实施方式
下面结合附图和实施例对本发明作进一步描述。以下实施例仅用于更加清楚 地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例1
如图1所示,一种结直肠癌预后显著相关ceRNA调控网络的构建方法,包 括:
步骤1)从NCBI GEO数据库中筛选出3个符合条件的结直肠癌基因表达数 据集,下载TCGA(the cancer genome atlas)数据库中结直肠癌的基因表达数据、 miRNA表达数据和结直肠癌的临床信息;
步骤2)分别对GEO的3个结直肠癌基因表达数据集、TCGA数据库中结直 肠癌的基因表达数据进行差异基因表达分析,得到4组差异表达基因;取4组差 异表达基因的交集,得到共有的差异表达基因;
步骤3)根据步骤2)得到的共有的差异表达基因,构建蛋白质-蛋白质相互 作用网络(PPI网络);根据PPI网络中的重要模块和基因的连接度(degree)并 结合单基因生存分析,筛选出关键基因(hub gene);
步骤4)根据步骤3)得到的关键基因(hub gene),进行预测得到关键基因 (hubgene)的上游miRNA,并基于上游miRNA表达数据和结直肠癌的临床信 息进行生存分析,筛选出与结直肠癌预后显著相关的miRNA;
步骤5)根据步骤4)得到的miRNA,进行预测得到与结直肠癌预后显著相 关的miRNA的上游lncRNA,并基于上游lncRNA表达数据和结直肠癌的临床信 息进行生存分析,筛选出与结直肠癌预后显著相关的lncRNA;
步骤6)基于得到的关键基因(hub gene)、与结直肠癌预后显著相关的miRNA、lncRNA,根据其相互作用关系构建ceRNA网络;
步骤7)基于步骤6)得到的ceRNA网络,并根据与结直肠癌预后显著相关 的lncRNA、miRNA和关键基因(hub gene)在结直肠癌中的表达趋势进行评估, 得到最终的结直肠癌预后显著相关的ceRNA调控网络。
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤1)中,所述的结直肠癌基因表达数据集,是从GEO数据库中搜索的数 据集,经过条件筛选得到,筛选条件为:同时包含结直肠癌的癌组患者和对照组 患者;每个数据集为一个数据矩阵,行名为基因名称,列名为样本名称。
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤2)中,分别对GEO的3个结直肠癌基因表达数据集、TCGA-COAD 的基因表达数据进行差异基因表达分析,得到4组差异表达基因,包括:
对于GEO的3个结直肠癌基因表达数据集,利用GEO在线差异表达分析工 具GEO2R分别进行差异基因表达分析,得到3组差异表达基因;
对于TCGA-COAD的基因表达数据,利用R软件limma包进行差异基因表 达分析得到1组差异表达基因;
上述差异基因表达分析的阈值条件均设置为:|log2FC|>1,且FDR<0.05; FC为(fold change)差异倍数,FDR(False discovery rate)伪发现率;满足阈值条 件的基因为差异表达基因。
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤3)中,对步骤2)得到的共有的差异表达基因进行基因富集分析,得 到基因富集分析结果;包括:
利用DAVID在线分析数据库,对共有的差异表达基因进行GO和KEGG通 路富集分析,得到差异表达基因在不同信号通道中的分类信息;并下载富集分析 结果,取FDR<0.05的数据为有效数据。
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤3)根据步骤2)得到的共有的差异表达基因,构建蛋白质-蛋白质相互 作用网络(PPI网络);根据PPI网络中的重要模块和基因的连接度(degree)并 结合单基因生存分析,筛选出关键基因(hub gene);包括:
基于共有的差异表达基因,通过STRING数据库(https://string-db.org/),分 别构建共有的上调基因的蛋白质-蛋白质相互作用网络(PPI网络)和下调基因的 蛋白质-蛋白质相互作用网络(PPI网络),即PPI网络;
将通过STRING数据库得到的上调基因和下调基因PPI网络分别导入 Cytoscape软件,使用Cytoscape软件中的MCODE插件对上调基因的PPI网络进 行重要模块的识别,得到上调基因的PPI网络中两个重要模块;使用Cytoscape 软件中的CytoHubba插件根据连接度(degree)对下调基因的PPI网络进行分析, 得到下调基因PPI网络中排名靠前的100个基因(表1),
表1:下调基因PPI网络中degree算法得到的前100个基因。
Figure BDA0002318841650000081
Figure BDA0002318841650000091
Figure BDA0002318841650000101
Figure BDA0002318841650000111
Figure BDA0002318841650000121
Figure BDA0002318841650000131
把上调基因的PPI网络中两个重要模块的基因和下调基因PPI网络中排名靠 前的100个基因,作为预生存分析的基因;
使用TCGA数据库中结直肠癌的基因表达数据,利用R软件中survival和survminer包,使用Kaplan-Meier法,对上述得到的预生存分析的基因进行生存 分析,以时序检验Logrank p<0.05作为筛选标准,得到关键基因(hub gene)(表 2)。
表2:COAD中的hub gene。
Figure BDA0002318841650000132
Figure BDA0002318841650000141
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤4)根据步骤3)得到的关键基因(hub gene),进行预测得到关键基因 (hub gene)的上游miRNA,并对上游miRNA进行生存分析,筛选出与结直肠 癌预后显著相关的miRNA;包括:
利用starBase数据预测关键基因的上游miRNA;
使用TCGA数据库中结直肠癌的miRNA表达数据,利用R软件中survival 和survminer包,使用Kaplan-Meier法,对上游miRNA进行生存分析,以Logrank p<0.05作为筛选标准,得到与结直肠癌预后显著相关的miRNA(表3)。
表3:COAD中具有显著生存分析的miRNA。
Figure BDA0002318841650000142
Figure BDA0002318841650000151
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤5)包括:
利用miRNet数据库预测得到与结直肠癌预后显著相关的miRNA的上游 lncRNA,利用GEPIA在线数据库,对预测得到的lncRNA进行生存分析,以 Logrank p<0.05作为筛选标准,得到与结直肠癌预后显著相关的lncRNA(表4)。
表4:COAD中具有显著生存分析的lncRNA。
lncRNA Logrank p
UBXN8 0.0048
POLDIP2 0.016
CWC15 0.0016
SNHG7 0.013
AC074117.10 0.04
AC093627.10 0.049
RP11-449D8.1 0.011
NUTM2A-AS1 0.011
AC005154.6 0.017
RP11-429J17.7 0.025
在一些实施例中,步骤6)基于得到的关键基因(hub gene)、与结直肠癌预 后显著相关的miRNA、lncRNA,根据其相互作用关系构建ceRNA网络;包括:
基于得到的关键基因(hub gene)、与结直肠癌预后显著相关的miRNA、 lncRNA,根据lncRNA-miRNA、miRNA-mRNA相互作用关系,构建得到基于与 结直肠癌预后显著相关lncRNA-miRNA-mRNA的ceRNA网络;如图2是本发明 实施例的根据结直肠癌预后显著相关lncRNA、miRNA和mRNA相互作用关系 构建的ceRNA网络。
进一步的,使用R软件的networkD3包对构建的ceRNA网络进行可视化。
在一些实施例中,所述的结直肠癌预后显著相关ceRNA调控网络的构建方 法,步骤7)基于步骤6)得到的ceRNA网络,并根据与结直肠癌预后显著相关 的lncRNA、miRNA和关键基因(hub gene)在结直肠癌中的表达趋势进行评估, 根据表达量差异进行筛选得到最终的结直肠癌预后显著相关ceRNA调控网络(表 5)。
表5:根据ceRNA网络中的hubgene,miRNA,lncRNA的表达趋势构建的 结直肠癌预后显著相关ceRNA调控网络
lncRNA miRNA mRNA
AC005154.6 miR-200b-3p MFAP5
在一些实际应用中,例如用于基因深度分析,还包括对得到的共有的差异表 达基因进行基因富集分析,得到基因富集分析结果;具体包括:
利用DAVID在线分析数据库,对共有的差异表达基因进行GO和KEGG通 路富集分析,得到差异表达基因在不同信号通道中的分类信息;并下载富集分析 结果,取FDR<0.05的数据为有效数据。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技 术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些 改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种结直肠癌预后显著相关ceRNA调控网络的构建方法,其特征在于,包括:
步骤1)从NCBI GEO数据库中筛选出3个符合条件的结直肠癌基因表达数据集,下载TCGA数据库中结直肠癌的基因表达数据、miRNA表达数据和结直肠癌的临床信息;
步骤2)分别对GEO的3个结直肠癌基因表达数据集、TCGA数据库中结直肠癌的基因表达数据进行差异基因表达分析,得到4组差异表达基因;取4组差异表达基因的交集,得到共有的差异表达基因;
步骤3)根据步骤2)得到的共有的差异表达基因,构建蛋白质-蛋白质相互作用网络,即PPI网络;根据PPI网络中的重要模块和基因的连接度并结合单基因生存分析,筛选出关键基因hub gene;包括:
基于共有的差异表达基因,通过STRING数据库,分别构建共有的上调基因的蛋白质-蛋白质相互作用网络和下调基因的蛋白质-蛋白质相互作用网络,即PPI网络;
将通过STRING数据库得到的上调基因和下调基因PPI网络分别导入Cytoscape软件,使用Cytoscape软件中的MCODE插件对上调基因的PPI网络进行重要模块的识别,得到上调基因的PPI网络中两个重要模块;使用Cytoscape软件中的CytoHubba插件根据连接度对下调基因的PPI网络进行分析,得到下调基因PPI网络中排名靠前的100个基因;把上调基因的PPI网络中两个重要模块的基因和下调基因PPI网络中排名靠前的100个基因,作为预生存分析的基因;
使用TCGA数据库中结直肠癌的基因表达数据,利用R软件中survival和survminer包,使用Kaplan-Meier法,对上述得到的预生存分析的基因进行生存分析,以时序检验Logrankp< 0.05作为筛选标准,得到关键基因;
步骤4)根据步骤3)得到的关键基因,进行预测得到关键基因的上游miRNA,并基于上游miRNA表达数据和结直肠癌的临床信息进行生存分析,筛选出与结直肠癌预后显著相关的miRNA;
步骤5)根据步骤4)得到的miRNA,进行预测得到与结直肠癌预后显著相关的miRNA的上游lncRNA,并基于上游lncRNA表达数据和结直肠癌的临床信息进行生存分析,筛选出与结直肠癌预后显著相关的lncRNA;
步骤6)基于得到的关键基因、与结直肠癌预后显著相关的miRNA、lncRNA,根据其相互作用关系构建ceRNA网络;
步骤7)基于步骤6)得到的ceRNA网络,并根据与结直肠癌预后显著相关的lncRNA、miRNA和关键基因在结直肠癌中的表达趋势进行评估,得到最终的结直肠癌预后显著相关的ceRNA调控网络。
2.根据权利要求1所述的结直肠癌预后显著相关ceRNA调控网络的构建方法,其特征在于,步骤1)中,所述的结直肠癌基因表达数据集,是从GEO数据库中搜索的数据集,经过条件筛选得到,筛选条件为:同时包含结直肠癌的癌组患者和对照组患者;每个数据集为一个数据矩阵,行名为基因名称,列名为样本名称。
3.根据权利要求1所述的结直肠癌预后显著相关ceRNA调控网络的构建方法,其特征在于,步骤2)中,分别对GEO的3个结直肠癌基因表达数据集、TCGA-COAD的基因表达数据进行差异基因表达分析,得到4组差异表达基因,包括:
对于GEO的3个结直肠癌基因表达数据集,利用GEO在线差异表达分析工具GEO2R分别进行差异基因表达分析,得到3组差异表达基因;
对于TCGA-COAD的基因表达数据,利用R软件limma包进行差异基因表达分析得到1组差异表达基因;
上述差异基因表达分析的阈值条件均设置为:| log2FC |>1,且FDR <0.05;FC为差异倍数,FDR伪发现率;满足阈值条件的基因为差异表达基因。
4.根据权利要求1所述的结直肠癌预后显著相关ceRNA调控网络的构建方法,其特征在于,步骤4)根据步骤3)得到的关键基因,进行预测得到关键基因的上游miRNA,并对上游miRNA进行生存分析,筛选出与结直肠癌预后显著相关的miRNA;包括:
利用starBase数据预测关键基因的上游miRNA;
使用TCGA数据库中结直肠癌的miRNA表达数据,利用R软件中survival和survminer包,使用Kaplan-Meier法,对上游miRNA进行生存分析,以Logrank p< 0.05作为筛选标准,得到与结直肠癌预后显著相关的miRNA。
5.根据权利要求1所述的结直肠癌预后显著相关ceRNA调控网络的构建方法,其特征在于,步骤5)包括:
利用miRNet数据库预测得到与结直肠癌预后显著相关的miRNA的上游lncRNA,利用GEPIA在线数据库,对预测得到的lncRNA进行生存分析,以Logrank p< 0.05作为筛选标准,得到与结直肠癌预后显著相关的lncRNA。
6.根据权利要求1所述的结直肠癌预后显著相关ceRNA调控网络的构建方法,其特征在于,步骤6)基于得到的关键基因、与结直肠癌预后显著相关的miRNA、lncRNA,根据其相互作用关系构建ceRNA网络;包括:
基于得到的关键基因、与结直肠癌预后显著相关的miRNA、lncRNA,根据lncRNA-miRNA、miRNA-mRNA相互作用关系,构建得到基于与结直肠癌预后显著相关lncRNA-miRNA- mRNA的ceRNA网络。
7.根据权利要求1或6所述的结直肠癌预后显著相关ceRNA调控网络的构建方法,其特征在于,使用R软件的networkD3包对构建的ceRNA网络进行可视化。
8.根据权利要求1所述的结直肠癌预后显著相关ceRNA调控网络的构建方法,其特征在于,步骤7)基于步骤6)得到的ceRNA网络,并根据与结直肠癌预后显著相关的lncRNA、miRNA和关键基因在结直肠癌中的表达趋势进行评估,根据表达量差异进行筛选得到最终的结直肠癌预后显著相关ceRNA调控网络。
CN201911290283.7A 2019-12-16 2019-12-16 一种结直肠癌预后显著相关ceRNA调控网络的构建方法 Active CN111128299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911290283.7A CN111128299B (zh) 2019-12-16 2019-12-16 一种结直肠癌预后显著相关ceRNA调控网络的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911290283.7A CN111128299B (zh) 2019-12-16 2019-12-16 一种结直肠癌预后显著相关ceRNA调控网络的构建方法

Publications (2)

Publication Number Publication Date
CN111128299A CN111128299A (zh) 2020-05-08
CN111128299B true CN111128299B (zh) 2022-08-30

Family

ID=70498991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911290283.7A Active CN111128299B (zh) 2019-12-16 2019-12-16 一种结直肠癌预后显著相关ceRNA调控网络的构建方法

Country Status (1)

Country Link
CN (1) CN111128299B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111816251A (zh) * 2020-07-13 2020-10-23 西北工业大学 一种基于功能模块网络的癌变演化过程分析方法
CN111899882B (zh) * 2020-08-07 2021-06-18 北京科技大学 一种预测癌症的方法及系统
CN112309496B (zh) * 2020-11-10 2021-11-23 西北工业大学 一种基于rna表达值和二级结构的相关性融合方法
CN112562785A (zh) * 2020-12-10 2021-03-26 哈尔滨医科大学附属第一医院 基于atac测序数据筛选子宫内膜癌关键基因的方法及应用
CN112837744B (zh) * 2021-02-07 2023-07-28 南京邮电大学 一种前列腺癌预后显著相关ceRNA调控网络的构建方法
CN113053453B (zh) * 2021-03-15 2022-01-04 中国农业科学院农业质量标准与检测技术研究所 应用转录组学筛选全氟辛烷磺酸毒性枢纽基因和关键信号通路的方法
CN113429464B (zh) * 2021-06-22 2022-02-18 皖南医学院第一附属医院(皖南医学院弋矶山医院) 一种基于泛癌表达谱筛选出的新型微肽及其应用
CN114550815A (zh) * 2022-03-16 2022-05-27 皖南医学院第一附属医院(皖南医学院弋矶山医院) 一种胶质母细胞瘤lncRNA编码微肽的功能预测与筛选方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101785795B1 (ko) * 2015-10-30 2017-10-13 가톨릭대학교 산학협력단 두경부암 예후 예측용 바이오마커 마이크로 rna
CN107516021B (zh) * 2017-08-03 2019-11-19 北京百迈客生物科技有限公司 一种基于高通量测序的数据分析方法
CN109637588B (zh) * 2018-12-29 2022-07-15 北京百迈客生物科技有限公司 一种基于全转录组高通量测序构建基因调控网络的方法
CN110415764A (zh) * 2019-07-25 2019-11-05 东南大学 利用多数据平台发现长链非编码RNA分子标志物运用ceRNA机制的方法及系统和应用

Also Published As

Publication number Publication date
CN111128299A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN111128299B (zh) 一种结直肠癌预后显著相关ceRNA调控网络的构建方法
JP7368483B2 (ja) 相同組換え欠損を推定するための統合された機械学習フレームワーク
Zhou et al. Relapse-related long non-coding RNA signature to improve prognosis prediction of lung adenocarcinoma
JP2021521536A (ja) 生体試料の多検体アッセイのための機械学習実装
US20230114581A1 (en) Systems and methods for predicting homologous recombination deficiency status of a specimen
Zhang et al. Gene correlation network analysis to identify regulatory factors in sepsis
Milanez-Almeida et al. Cancer prognosis with shallow tumor RNA sequencing
CN112391470A (zh) 胰腺癌miRNA预后模型的确立及靶向基因的筛选方法
US20140040264A1 (en) Method for estimation of information flow in biological networks
CN109055562B (zh) 一种生物标志物、预测肾细胞癌的复发和死亡风险的方法
US8030060B2 (en) Gene signature for diagnosis and prognosis of breast cancer and ovarian cancer
Zhao et al. Twenty-gene-based prognostic model predicts lung adenocarcinoma survival
Yang et al. Identification of hub genes and outcome in colon cancer based on bioinformatics analysis
Wang et al. Identification and validation of a prognostic 9-genes expression signature for gastric cancer
CN105986034A (zh) 一组胃癌基因的应用
CN112837744A (zh) 一种前列腺癌预后显著相关ceRNA调控网络的构建方法
Liang et al. Detecting and profiling tissue-selective genes
KR20230017206A (ko) 결장 세포 증식성 장애를 식별하기 위한 rna 마커 및 방법
Li et al. Secreted phosphoprotein 1 (SPP1) and fibronectin 1 (FN1) are associated with progression and prognosis of esophageal cancer as identified by integrated expression profiles analysis
CN106381342A (zh) 用于胰腺癌诊断或预后的生物标记
EP2625639A2 (en) Identification of multi-modal associations between biomedical markers
Xia et al. Identifying TME signatures for cervical cancer prognosis based on GEO and TCGA databases
CN112746108B (zh) 用于肿瘤预后分层评估的基因标志物、评估方法及应用
Parihar et al. Identification of biomarkers associated with cancer using integrated bioinformatic analysis
Shin et al. TC-VGC: a tumor classification system using variations in genes’ correlation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant