CN112837744A - 一种前列腺癌预后显著相关ceRNA调控网络的构建方法 - Google Patents

一种前列腺癌预后显著相关ceRNA调控网络的构建方法 Download PDF

Info

Publication number
CN112837744A
CN112837744A CN202110174715.9A CN202110174715A CN112837744A CN 112837744 A CN112837744 A CN 112837744A CN 202110174715 A CN202110174715 A CN 202110174715A CN 112837744 A CN112837744 A CN 112837744A
Authority
CN
China
Prior art keywords
prostate cancer
gene
expression
mirna
genes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110174715.9A
Other languages
English (en)
Other versions
CN112837744B (zh
Inventor
郭丽
康一浩
窦宇阳
熊依琪
颜小强
夏道良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202110174715.9A priority Critical patent/CN112837744B/zh
Publication of CN112837744A publication Critical patent/CN112837744A/zh
Application granted granted Critical
Publication of CN112837744B publication Critical patent/CN112837744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种前列腺癌预后显著相关ceRNA调控网络的构建方法,整合TCGA和GTEx数据库的前列腺癌基因表达数据集,分别进行差异基因表达分析和加权基因共表达网络分析,筛选差异表达的关键模块基因;通过WGCNA分析和Cox比例风险回归分析得到关键基因,将得到的关键基因,miRNA,lncRNA通过其相互作用关系构建ceRNA网络,并根据lncRNA,miRNA和hub gene在PRAD中的表达趋势进行评估,结合生存分析得到与PRAD预后显著相关的ceRNA调控网,便于进行疾病的早期诊断,设计靶向药物的精准治疗。

Description

一种前列腺癌预后显著相关ceRNA调控网络的构建方法
技术领域
本发明具体涉及一种前列腺癌预后显著相关ceRNA调控网络的构建方法,属于医药技术领域。
背景技术
前列腺癌是男性泌尿生殖系较为普遍的恶性肿瘤之一。在欧美等国家前列腺癌是男性发病率最高的恶性肿瘤,占癌症死亡率的第三位。从全球范围来看,发达国家的前列腺癌发病率高于发展中国家,目前美英法德日占据总发患者数的70%。我国的前列腺癌发病率虽低于欧美国家,但随着国家经济高速增长,近年来也呈明显上升趋势。目前,前列腺癌已成为中国男性泌尿生殖系肿瘤中排名第一位、所有肿瘤疾病中排名第五位的恶性肿瘤,是威胁老年男性健康的一个重要因素。
众所周知,癌症的治疗一直都是现代医学领域难以攻克的难点,传统的治疗手段由于癌细胞随血液扩散导致很难彻底杀死癌细胞。研究前列腺癌生物学特性,寻求有价值的特异性生物标记物对前列腺癌早期诊断、靶向治疗和判断预后具有重要意义。
探索生物标志物的潜在调控网络对于开发有效的治疗至关重要。近几年来,越来越多的证据揭示了mRNA-miRNA-lncRNA调控网络在多种人类癌症中具有重要的调控作用。许多研究指出,ceRNA网络可能是前列腺癌预后的一个标志。因此利用mRNA-miRNA-lncRNA相互作用关系为疾病的早期诊断,设计靶向药物进行精准治疗,对癌症的靶向治疗及个体化精准医疗有重要的意义。
尽管,越来越多的证据揭示mRNA-miRNA-lncRNA调控网络在多种人类癌症中发挥重要作用。然而,在癌症预后相关的mRNA-miRNA-lncRNA调控网络研究仍然缺乏。
发明内容
本发明的目的在于克服现有背景技术中的不足,提供一种前列腺癌预后显著相关ceRNA调控网络的构建方法。
为达到上述目的,本发明是采用下述技术方案实现的:
提供一种前列腺癌预后显著相关ceRNA调控网络的构建方法,包括以下步骤:
步骤1:从UCSC数据库中整合TCGA和GTEx前列腺癌归一化基因表达数据集,从TCGA数据库中下载前列腺癌的基因表达数据及mRNA、miRNA表达数据、lncRNA表达数据和前列腺癌病人的临床信息;
步骤2:对TCGA和GTEx数据库前列腺癌归一化基因表达数据集进行差异基因表达分析,得到前列腺癌差异表达基因;
步骤3:对TCGA和GTEx数据库前列腺癌归一化基因表达数据集进行加权基因共表达网络分析,将前列腺癌基因划分为高度相关的多个特征模块,并将特征模块与前列腺癌病人样本建立关联,找到发挥关键功能模块;取关键功能模块与前列腺癌差异表达基因的交集,得到差异表达的关键模块基因;
步骤4:对关键模块基因进行Cox单因素回归分析,得到潜在预后基因;对潜在预后基因进行Cox多因素回归分析,筛选出关键基因;
步骤5:根据关键基因预测得到关键基因的上游miRNA,基于前列腺癌的miRNA表达数据进行差异表达分析,筛选出差异表达的相关miRNA;
步骤6:根据差异表达的相关miRNA进行预测,得到前列腺癌差异表达miRNA的上游lncRNA,基于前列腺癌的lncRNA表达数据进行差异表达分析,筛选出差异表达的相关lncRNA;
步骤7:基于得到的关键基因、差异表达的相关miRNA、差异表达的相关lncRNA,根据其相互作用关系构建ceRNA网络;
步骤8:基于ceRNA网络,并根据差异表达的相关lncRNA、差异表达的相关miRNA和关键基因在前列腺癌中的表达趋势进行评估,结合生存分析得到最终的前列腺癌预后显著相关的ceRNA调控网络。
进一步的,所述步骤2中对TCGA和GTEx数据库前列腺癌归一化基因表达数据集,利用R软件Deseq2包进行差异基因表达分析得到1组差异表达基因;
差异表达基因分析的阈值条件设置为:|log2FC|>1.5,且FDR<0.05;FC为差异倍数,FDR伪发现率;满足阈值条件的基因为差异表达基因。
进一步的,所述步骤3包括,
基于TCGA和GTEx数据库前列腺癌归一化基因表达数据集,利用R软件WGCNA包进行加权基因共表达网络分析,根据基因的共表达相似性模式,将基因划分为不同的聚类树,继续根据聚类树中所示模块间相似程度,定义高度阈值为0.25,将聚类树中高度低于该值的模块进一步合并,划分出几个更为明显的基因共表达模块;
将基因共表达模块与TCGA前列腺癌病人样本进行相关性分析,使用R软件中的cor函数计算共表达模块与前列腺癌病人之间的相关系数和相关系数的p值,得到p<0.05且相关系数排名靠前的两个共表达模块作为关键功能模块。
进一步的,所述步骤4包括,
使用TCGA数据库中前列腺癌的基因表达数据和临床信息,利用R软件中survival包对差异表达的关键模块基因进行Cox单因素回归分析,以Wald检验p<0.05作为筛选标准,得到潜在的预后基因;
使用TCGA数据库中前列腺癌的基因表达数据和临床数据,利用R软件中survival包对预后基因进行Cox多因素回归分析,对比多个Cox模型的AIC值,选取AIC值最小的模型为最优模型,所述最优模型模型里的基因为关键基因。
进一步的,所述步骤4还包括,基于关键基因根据以下公式计算预后风险评分,构建风险评估预后模型,
Figure BDA0002940265310000041
其中N代表预后关键基因的数量,Expi代表该基因的表达数据,Ci代表通过Cox多因素回归分析得到的关键基因估计回归系数。
进一步的,所述步骤5包括:
根据关键基因,利用starBase数据库预测关键基因的上游miRNA;
使用TCGA数据库中前列腺癌的miRNA表达数据,利用R软件中Deseq2包,对前列腺癌的miRNA表达数据进行差异表达分析,以|log2FC|>1,且FDR<0.05作为筛选标准,得到前列腺癌的差异表达miRNA;取关键基因的上游miRNA与前列腺癌的差异表达miRNA的交集,得到关键基因的差异表达的相关miRNA。
进一步的,所述步骤6包括:
对差异表达的相关miRNA,利用starBase数据库进行预测得到前列腺癌差异表达的相关miRNA的上游lncRNA;
利用R软件中Deseq2包,对前列腺癌的lncRNA表达数据进行差异表达分析,以|log2FC|>1,且FDR<0.05作为筛选标准,得到前列腺癌的差异表达lncRNA;取差异表达的相关miRNA的上游lncRNA与前列腺癌的差异表达lncRNA的交集,得到差异表达的相关lncRNA。
进一步的,所述步骤7包括:根据lncRNA-miRNA、miRNA-mRNA生物学关系,构建前列腺癌的潜在预后lncRNA-miRNA-mRNA的ceRNA网络。
进一步的,所述关键基因、差异表达的相关miRNA、lncRNA和lncRNA-miRNA、miRNA-mRNA相互作用关系分别导入Cytoscape软件,使用Cytoscape软件的可视化功能对构建的ceRNA网络进行可视化处理。
进一步的,所述步骤8包括,利用R软件中survival和survminer包,使用Kaplan-Meier法,对差异表达的相关lncRNA、差异表达的相关miRNA和关键基因进行生存分析,以时序检验Logrankp<0.05作为筛选标准,得到与前列腺癌预后显著相关的mRNA、miRNA和lncRNA,结合表达趋势进行筛选得到最终的前列腺癌预后显著相关ceRNA调控网络。
与现有技术相比,本发明所达到的有益效果:
本发明提出的一种前列腺癌预后显著相关ceRNA调控网络的构建方法,基于高通量测序数据通过生物信息学进行整合分析筛选,对TCGA和GTEx表达数据集进行整合归一化后再进行差异表达分析,解决样本数量不平衡,便于挖掘稳健、准确的潜在生物学标志物;
本发明通过WGCNA分析和Cox比例风险回归分析筛选关键基因,能够描述多个基因和生存之间的关系,使得相关系数分布更加符合无尺度网络分析,调控精确,对疾病早期诊断,设计靶向药物精准治疗具有重要作用。
附图说明
图1为本发明实施例一种前列腺癌预后显著相关ceRNA调控网络的构建方法流程图;
图2是本发明实施例根据前列腺癌预后显著相关lncRNA、miRNA和mRNA相互作用关系构建的ceRNA网络。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,为本发明实施例一种前列腺癌预后显著相关ceRNA调控网络的构建方法流程图,包括如下步骤:
步骤1)从UCSC数据库中下载TCGA和GTEx前列腺癌归一化基因表达数据集,下载TCGA(the cancergenome atlas)数据库中前列腺癌的基因表达数据及mRNA、miRNA表达数据、lncRNA表达数据和前列腺癌的临床信息;
步骤2)对TCGA和GTEx数据库前列腺癌归一化基因表达数据进行差异基因表达分析,得到前列腺癌差异表达基因;
步骤3)对TCGA和GTEx数据库前列腺癌归一化基因表达数据进行加权基因共表达网络分析(WGCNA),将前列腺癌基因划分为高度相关的几个特征模块,并将模块与前列腺癌病人样本建立关联,从而找到发挥关键功能的基因;取关键模块的基因与步骤2)得到的差异表达基因作交集,得到差异表达的关键模块基因;
步骤4)根据步骤3)得到的差异表达的关键模块基因,进行Cox单因素回归分析,得到潜在预后基因;对潜在预后基因进一步进行Cox多因素回归分析,筛选出关键基因(hubgene),并由关键基因(hub gene)构建风险评估预后模型;
步骤5)根据步骤4)得到的关键基因(hub gene),进行预测得到关键基因(hubgene)的上游miRNA,基于TCGA-PRAD的miRNA表达数据进行差异表达分析,筛选出差异表达的相关miRNA;
步骤6)根据步骤5)得到的miRNA,进行预测得到前列腺癌差异表达miRNA的上游lncRNA,基于TCGA-PRAD的lncRNA表达数据进行差异表达分析,筛选出差异表达的相关lncRNA;
步骤7)基于得到的关键基因(hub gene)、差异表达的相关miRNA、lncRNA,根据其相互作用关系构建ceRNA网络;
步骤8)基于步骤7)得到的ceRNA网络,并根据差异表达的相关lncRNA、miRNA和关键基因(hub gene)在前列腺癌中的表达趋势进行评估,结合生存分析得到最终的前列腺癌预后显著相关的ceRNA调控网络。
图2是本发明实施例根据前列腺癌预后显著相关lncRNA、miRNA和mRNA相互作用关系构建的ceRNA网络。
在实施例中,前列腺癌预后显著相关ceRNA调控网络的构建方法,步骤2)中,对TCGA和GTEx数据库前列腺癌归一化基因表达数据,利用R软件Deseq2包进行差异基因表达分析得到1组差异表达基因;
上述差异基因表达分析的阈值条件设置为:|log2FC|>1.5,且FDR<0.05;FC为差异倍数,FDR伪发现率;满足阈值条件的基因为差异表达基因。
在实施例中,前列腺癌预后显著相关ceRNA调控网络的构建方法,步骤3)中,对步骤2)得到的差异表达基因进行基因富集分析,得到基因富集分析结果;包括:
利用DAVID在线分析数据库,对差异表达基因进行GO和KEGG通路富集分析,得到差异表达基因在不同信号通道中的分类信息;并下载富集分析结果,取FDR<0.05的数据为有效数据。
实施例中,前列腺癌预后显著相关ceRNA调控网络的构建方法,步骤3)中,对TCGA和GTEx数据库前列腺癌归一化基因表达数据进行加权基因共表达网络分析(WGCNA),将前列腺癌基因划分为高度相关的几个特征模块,并将模块与前列腺癌病人样本建立关联,从而找到发挥关键功能的基因。
取关键模块的基因与步骤2)得到的差异表达基因作交集,得到差异表达的关键模块基因,包括:
基于TCGA和GTEx数据库前列腺癌归一化基因表达数据,利用R软件WGCNA包进行加权基因共表达网络分析(WGCNA),根据基因的共表达相似性模式,将基因划分为不同的聚类树,继续根据聚类树中所示模块间相似程度,定义高度阈值为0.25,将聚类树中高度低于该值的模块进一步合并,划分出几个更为明显的共表达模块。
将通过加权基因共表达网络分析(WGCNA)得到的基因共表达模块与TCGA前列腺癌病人样本进行相关性分析,使用R软件中的cor函数计算共表达模块与前列腺癌病人之间的相关系数和相关系数的p值,得到p<0.05且相关系数排名靠前的两个共表达模块作为关键模块,把两个关键模块内的基因与步骤2)得到的差异表达基因取交集,得到差异表达的关键模块基因。
实施例中,前列腺癌预后显著相关ceRNA调控网络的构建方法,步骤4)根据步骤3)得到的差异表达的关键模块基因,进行Cox单因素回归分析,得到潜在预后基因;对潜在预后基因进一步进行Cox多因素回归分析,筛选出关键基因(hub gene)。
由关键基因构建风险评估预后模型,包括:使用TCGA数据库中前列腺癌的基因表达数据和临床数据,利用R软件中survival包对差异表达的关键模块基因进行Cox单因素回归分析,以Wald检验(Wald test)p<0.05作为筛选标准,得到潜在的预后基因(如表1所示)。
表1:关键模块基因进行Cox单因素回归分析得到的潜在预后基因
gene beta HR(95%CI) wald.test pvalue
PKMYT1 0.5865 1.7976(1.344-2.4044) 15.62 0.0001
TK1 0.0622 1.0642(1.0307-1.0988) 14.52 0.0001
PLAGL1 0.5572 1.7457(1.1778-2.5875) 7.7 0.0055
NLGN2 0.3167 1.3726(1.0563-1.7836) 5.61 0.0178
RPL22L1 0.0261 1.0265(1.0043-1.0491) 5.48 0.0193
NME2 0.0558 1.0574(1.0088-1.1084) 5.4 0.0201
TMEM132A 0.0696 1.0721(1.0071-1.1412) 4.76 0.0291
SLC12A8 0.3203 1.3775(1.019-1.8623) 4.34 0.0373
DBNDD1 0.1366 1.1464(1.0054-1.3072) 4.16 0.0414
PYCR1 0.025 1.0253(1.0002-1.051) 3.91 0.0479
使用TCGA数据库中前列腺癌的基因表达数据和临床数据,利用R软件中survival包对上述得到的潜在预后基因进行Cox多因素回归分析,对比多个Cox模型的AIC值(Akaike信息准则),选取AIC值最小的模型为最优模型,模型里的基因为关键基因(hub gene)(如表2所示)。
表2:PRAD中的hub gene
Figure BDA0002940265310000091
Figure BDA0002940265310000101
根据以下公式计算基于关键基因(hub gene)的预后风险评分(Risk score),构建风险评估预后模型。
Figure BDA0002940265310000102
其中N代表预后关键基因的数量,Expi代表该基因的表达数据,Ci代表通过Cox多因素回归分析得到的关键基因(hub gene)估计回归系数。预后风险评分为:Risk score=PLAGL1*0.32859+DBNDD1*0.11770+PKMYT1*(-0.30405)+NME2*0.02629+TK1*0.03934+RPL22L1*0.02846+NLGN2*0.40079+SLC12A8*0.31790。
实施例中,前列腺癌预后显著相关ceRNA调控网络的构建方法,步骤5)根据步骤4)得到的关键基因(hub gene),进行预测得到关键基因(hub gene)的上游miRNA,基于TCGA-PRAD的miRNA表达数据进行差异表达分析,筛选出差异表达的相关miRNA,包括:
利用starBase数据库预测关键基因的上游miRNA;
使用TCGA数据库中前列腺癌的miRNA表达数据,利用R软件中Deseq2包,对miRNA进行差异表达分析,以|log2FC|>1,且FDR<0.05作为筛选标准,得到前列腺癌的差异表达miRNA;取关键基因的上游miRNA与前列腺癌的差异表达miRNA的交集,得到差异表达的关键基因上游miRNA(如表3所示)。
表3:PRAD中差异表达的相关miRNA
Figure BDA0002940265310000103
Figure BDA0002940265310000111
实施例中,前列腺癌预后显著相关ceRNA调控网络的构建方法,步骤6)根据步骤5)得到的miRNA,进行预测得到前列腺癌差异表达miRNA的上游lncRNA,基于TCGA-PRAD的lncRNA表达数据进行差异表达分析,筛选出差异表达的相关lncRNA,包括:
利用starBase数据库预测得到差异表达的相关miRNA的上游lncRNA;
使用TCGA数据库中前列腺癌的lncRNA表达数据,利用R软件中Deseq2包,对lncRNA进行差异表达分析,以|log2FC|>1,且FDR<0.05作为筛选标准,得到前列腺癌的差异表达lncRNA;取差异表达的相关miRNA的上游lncRNA与前列腺癌的差异表达lncRNA的交集,得到差异表达的相关lncRNA(如表4所示)。
表4:PRAD中差异表达的相关lncRNA
Figure BDA0002940265310000121
Figure BDA0002940265310000131
Figure BDA0002940265310000141
Figure BDA0002940265310000151
实施例中,步骤7)基于得到的关键基因(hub gene)、差异表达的相关miRNA、lncRNA,根据其相互作用关系构建ceRNA网络,包括:
基于得到的关键基因(hub gene)、差异表达的相关miRNA、lncRNA,根据lncRNA-miRNA、miRNA-mRNA相互作用关系,构建得到前列腺癌潜在预后lncRNA-miRNA-mRNA的ceRNA网络;
进一步的,将关键基因(hub gene)、差异表达的相关miRNA、lncRNA和lncRNA-miRNA、miRNA-mRNA相互作用关系分别导入Cytoscape软件,使用Cytoscape软件的可视化功能对构建的ceRNA网络进行可视化。
实施例中,前列腺癌预后显著相关ceRNA调控网络的构建方法,步骤8)基于步骤7)得到的潜在预后ceRNA网络,利用R软件中survival和survminer包,使用Kaplan-Meier法,对ceRNA网络中的关键基因(hub gene)、差异表达的相关miRNA、lncRNA进行生存分析,以时序检验Logrankp<0.05作为筛选标准,得到与前列腺癌预后显著相关的关键基因(hubgene)、miRNA和lncRNA,并根据与前列腺癌预后显著相关的lncRNA、miRNA和关键基因(hubgene)在前列腺癌中的表达趋势进行评估,根据表达量差异进行筛选得到最终的前列腺癌预后显著相关ceRNA调控网络(如表5所示)。
表5:构建的前列腺癌预后显著相关ceRNA调控网络
lncRNA miRNA mRNA
SNHG3 miR-222-3p TK1
结合图2和表5可知:
由8个关键基因(hub gene)构建的风险评估预后模型能够有效预测前列腺癌患者未来的生存概率,可以作为一项独立的预后因素,并且基于这8个关键基因(hub gene),15个差异表达的相关miRNAs和113个差异表达的相关lncRNAs构建了前列腺癌ceRNA网络。然后,进一步分析了这些基因在前列腺癌中的生存情况和表达模式,发现SNHG3与TK1具有一致的表达模式(在前列腺癌中显著上调),并且两者都具有与中位miRNAmiR-222-3p相反的表达模式。因此,最终获得了TK1-miR-222-3p-SNHG3作为前列腺癌的潜在预后标志物。它们在前列腺癌中都具有潜在的预后价值,并且TK1和SNHG3具有一致的趋势。
在实际应用中,例如用于基因深度分析,还包括对得到的共有的差异表达基因进行基因富集分析,得到基因富集分析结果;具体包括:
利用DAVID在线分析数据库,对共有的差异表达基因进行GO和KEGG通路富集分析,得到差异表达基因在不同信号通道中的分类信息;并下载富集分析结果,取FDR<0.05的数据为有效数据。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (10)

1.一种前列腺癌预后显著相关ceRNA调控网络的构建方法,其特征在于,包括以下步骤:
步骤1:从UCSC数据库中整合TCGA和GTEx前列腺癌归一化基因表达数据集,从TCGA数据库中下载前列腺癌的基因表达数据及mRNA、miRNA表达数据、lncRNA表达数据和前列腺癌病人的临床信息;
步骤2:对TCGA和GTEx数据库前列腺癌归一化基因表达数据集进行差异基因表达分析,得到前列腺癌差异表达基因;
步骤3:对TCGA和GTEx数据库前列腺癌归一化基因表达数据集进行加权基因共表达网络分析,将前列腺癌基因划分为高度相关的多个特征模块,并将特征模块与前列腺癌病人样本建立关联,找到发挥关键功能模块;取关键功能模块与前列腺癌差异表达基因的交集,得到差异表达的关键模块基因;
步骤4:对关键模块基因进行Cox单因素回归分析,得到潜在预后基因;对潜在预后基因进行Cox多因素回归分析,筛选出关键基因;
步骤5:根据关键基因预测得到关键基因的上游miRNA,基于前列腺癌的miRNA表达数据进行差异表达分析,筛选出差异表达的相关miRNA;
步骤6:根据差异表达的相关miRNA进行预测,得到前列腺癌差异表达miRNA的上游lncRNA,基于前列腺癌的lncRNA表达数据进行差异表达分析,筛选出差异表达的相关lncRNA;
步骤7:基于得到的关键基因、差异表达的相关miRNA、差异表达的相关lncRNA,根据其相互作用关系构建ceRNA网络;
步骤8:基于ceRNA网络,并根据差异表达的相关lncRNA、差异表达的相关miRNA和关键基因在前列腺癌中的表达趋势进行评估,结合生存分析得到最终的前列腺癌预后显著相关的ceRNA调控网络。
2.根据权利要求1所述的一种前列腺癌预后显著相关ceRNA调控网络的构建方法,其特征在于,所述步骤2中对TCGA和GTEx数据库前列腺癌归一化基因表达数据集,利用R软件Deseq2包进行差异基因表达分析得到1组差异表达基因;
差异表达基因分析的阈值条件设置为:| log2FC |>1.5,且FDR <0.05;FC为差异倍数,FDR伪发现率;满足阈值条件的基因为差异表达基因。
3.根据权利要求1所述的一种前列腺癌预后显著相关ceRNA调控网络的构建方法,其特征在于,所述步骤3包括,
基于TCGA和GTEx数据库前列腺癌归一化基因表达数据集,利用R软件WGCNA包进行加权基因共表达网络分析,根据基因的共表达相似性模式,将基因划分为不同的聚类树,继续根据聚类树中所示模块间相似程度,定义高度阈值为0.25,将聚类树中高度低于该值的模块进一步合并,划分出几个更为明显的基因共表达模块;
将基因共表达模块与TCGA前列腺癌病人样本进行相关性分析,使用R软件中的cor函数计算共表达模块与前列腺癌病人之间的相关系数和相关系数的p值,得到p<0.05且相关系数排名靠前的两个共表达模块作为关键功能模块。
4.根据权利要求1所述的一种前列腺癌预后显著相关ceRNA调控网络的构建方法,其特征在于,所述步骤4包括,
使用TCGA数据库中前列腺癌的基因表达数据和临床信息,利用R软件中survival包对差异表达的关键模块基因进行Cox单因素回归分析,以Wald检验p< 0.05作为筛选标准,得到潜在的预后基因;
使用TCGA数据库中前列腺癌的基因表达数据和临床数据,利用R软件中survival包对预后基因进行Cox多因素回归分析,对比多个Cox模型的AIC值,选取AIC值最小的模型为最优模型,所述最优模型模型里的基因为关键基因。
5.根据权利要求4所述的一种前列腺癌预后显著相关ceRNA调控网络的构建方法,其特征在于,所述步骤4还包括,基于关键基因根据以下公式计算预后风险评分,构建风险评估预后模型,
Risk score =
Figure 756446DEST_PATH_IMAGE002
其中N代表预后关键基因的数量,Expi代表该基因的表达数据,Ci代表通过Cox多因素回归分析得到的关键基因估计回归系数。
6.根据权利要求1所述的一种前列腺癌预后显著相关ceRNA调控网络的构建方法,其特征在于,所述步骤5包括:
根据关键基因,利用starBase数据库预测关键基因的上游miRNA;
使用TCGA数据库中前列腺癌的miRNA表达数据,利用R软件中Deseq2包,对前列腺癌的miRNA表达数据进行差异表达分析,以| log2FC |>1,且FDR <0.05作为筛选标准,得到前列腺癌的差异表达miRNA;取关键基因的上游miRNA与前列腺癌的差异表达miRNA的交集,得到关键基因的差异表达的相关miRNA。
7.根据权利要求1所述的一种前列腺癌预后显著相关ceRNA调控网络的构建方法,其特征在于,所述步骤6包括:
对差异表达的相关miRNA,利用starBase数据库进行预测得到前列腺癌差异表达的相关miRNA的上游lncRNA;
利用R软件中Deseq2包,对前列腺癌的lncRNA表达数据进行差异表达分析,以| log2FC|>1,且FDR <0.05作为筛选标准,得到前列腺癌的差异表达lncRNA;前列腺癌差异表达的相关miRNA的上游lncRNA与前列腺癌的差异表达lncRNA的交集,得到差异表达的相关lncRNA。
8.根据权利要求1所述的一种前列腺癌预后显著相关ceRNA调控网络的构建方法,其特征在于,所述步骤7包括:根据lncRNA-miRNA、miRNA-mRNA生物学关系,构建前列腺癌的潜在预后lncRNA-miRNA- mRNA的ceRNA网络。
9.根据权利要求8所述的一种前列腺癌预后显著相关ceRNA调控网络的构建方法,其特征在于,所述关键基因、差异表达的相关miRNA、lncRNA和lncRNA-miRNA、miRNA-mRNA相互作用关系分别导入Cytoscape软件,使用Cytoscape软件的可视化功能对构建的ceRNA网络进行可视化处理。
10.根据权利要求1所述的一种前列腺癌预后显著相关ceRNA调控网络的构建方法,其特征在于,所述步骤8包括,利用R软件中survival和survminer包,使用Kaplan-Meier法,对差异表达的相关lncRNA、差异表达的相关miRNA和关键基因进行生存分析,以时序检验Logrank p< 0.05作为筛选标准,得到与前列腺癌预后显著相关的mRNA、miRNA和lncRNA,结合表达趋势进行筛选得到最终的前列腺癌预后显著相关ceRNA调控网络。
CN202110174715.9A 2021-02-07 2021-02-07 一种前列腺癌预后显著相关ceRNA调控网络的构建方法 Active CN112837744B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110174715.9A CN112837744B (zh) 2021-02-07 2021-02-07 一种前列腺癌预后显著相关ceRNA调控网络的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110174715.9A CN112837744B (zh) 2021-02-07 2021-02-07 一种前列腺癌预后显著相关ceRNA调控网络的构建方法

Publications (2)

Publication Number Publication Date
CN112837744A true CN112837744A (zh) 2021-05-25
CN112837744B CN112837744B (zh) 2023-07-28

Family

ID=75932918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110174715.9A Active CN112837744B (zh) 2021-02-07 2021-02-07 一种前列腺癌预后显著相关ceRNA调控网络的构建方法

Country Status (1)

Country Link
CN (1) CN112837744B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113889180A (zh) * 2021-09-30 2022-01-04 山东大学 一种基于动态网络熵的生物标记物识别方法与系统
CN114373502A (zh) * 2022-01-07 2022-04-19 吉林大学第一医院 一种基于甲基化的肿瘤数据分析系统
CN114496066A (zh) * 2022-04-13 2022-05-13 南京墨宁医疗科技有限公司 一种三阴性乳腺癌预后的基因模型的构建方法及其应用
CN114566222A (zh) * 2022-02-28 2022-05-31 青海师范大学 一种检测高血压相关基因及基因功能分析的系统
CN117409962A (zh) * 2023-12-14 2024-01-16 北京科技大学 一种基于基因调控网络的微生物标记物的筛选方法
CN113889180B (zh) * 2021-09-30 2024-05-24 山东大学 一种基于动态网络熵的生物标记物识别方法与系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180320237A1 (en) * 2017-01-12 2018-11-08 The Regents Of The University Of California Novel 12-Gene Prognostic Signature For Breast Cancer Survival
CN109872772A (zh) * 2019-02-14 2019-06-11 辽宁省肿瘤医院 利用权重基因共表达网络挖掘结直肠癌放疗特异性基因的方法
CN111128299A (zh) * 2019-12-16 2020-05-08 南京邮电大学 一种结直肠癌预后显著相关ceRNA调控网络的构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180320237A1 (en) * 2017-01-12 2018-11-08 The Regents Of The University Of California Novel 12-Gene Prognostic Signature For Breast Cancer Survival
CN109872772A (zh) * 2019-02-14 2019-06-11 辽宁省肿瘤医院 利用权重基因共表达网络挖掘结直肠癌放疗特异性基因的方法
CN111128299A (zh) * 2019-12-16 2020-05-08 南京邮电大学 一种结直肠癌预后显著相关ceRNA调控网络的构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
侯敏;蒋琳;詹红梅;皈燕;赵妍丽;马代远;谭榜宪;: "乳腺癌相关lncRNA-miRNA-mRNA共表达及关键基因网络构建预测", 中华肿瘤防治杂志, no. 01 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113889180A (zh) * 2021-09-30 2022-01-04 山东大学 一种基于动态网络熵的生物标记物识别方法与系统
CN113889180B (zh) * 2021-09-30 2024-05-24 山东大学 一种基于动态网络熵的生物标记物识别方法与系统
CN114373502A (zh) * 2022-01-07 2022-04-19 吉林大学第一医院 一种基于甲基化的肿瘤数据分析系统
CN114373502B (zh) * 2022-01-07 2022-12-06 吉林大学第一医院 一种基于甲基化的肿瘤数据分析系统
CN114566222A (zh) * 2022-02-28 2022-05-31 青海师范大学 一种检测高血压相关基因及基因功能分析的系统
CN114496066A (zh) * 2022-04-13 2022-05-13 南京墨宁医疗科技有限公司 一种三阴性乳腺癌预后的基因模型的构建方法及其应用
CN117409962A (zh) * 2023-12-14 2024-01-16 北京科技大学 一种基于基因调控网络的微生物标记物的筛选方法
CN117409962B (zh) * 2023-12-14 2024-03-29 北京科技大学 一种基于基因调控网络的微生物标记物的筛选方法

Also Published As

Publication number Publication date
CN112837744B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN111128299B (zh) 一种结直肠癌预后显著相关ceRNA调控网络的构建方法
Bai et al. Identification of cancer stem cell characteristics in liver hepatocellular carcinoma by WGCNA analysis of transcriptome stemness index
JP7368483B2 (ja) 相同組換え欠損を推定するための統合された機械学習フレームワーク
CN109072309B (zh) 癌症进化检测和诊断
CN112837744A (zh) 一种前列腺癌预后显著相关ceRNA调控网络的构建方法
US11164655B2 (en) Systems and methods for predicting homologous recombination deficiency status of a specimen
Zhou et al. Relapse-related long non-coding RNA signature to improve prognosis prediction of lung adenocarcinoma
CN112391470A (zh) 胰腺癌miRNA预后模型的确立及靶向基因的筛选方法
Wang et al. Identification and validation of a prognostic 9-genes expression signature for gastric cancer
Zhao et al. Identification of pan-cancer prognostic biomarkers through integration of multi-omics data
CN110273003A (zh) 一种乳头状肾细胞癌患者预后复发检测标志工具及其风险评估模型的建立
KR20230017206A (ko) 결장 세포 증식성 장애를 식별하기 위한 rna 마커 및 방법
Canberk et al. Analyzing the role of DICER1 germline variations in papillary thyroid carcinoma
Ye et al. Machine learning identifies 10 feature miRNAs for lung squamous cell carcinoma
CN109859796B (zh) 一种关于胃癌的dna甲基化谱的降维分析方法
Bhuvaneswari et al. Investigating the Lung Adenocarcinoma Stem Cell Biomarker Expressions Using Machine Learning Approaches
CN114913919A (zh) 一种单基因病遗传变异智能解读及报告的方法、系统及服务器
CN114203256A (zh) 基于微生物丰度的mibc分型及预后预测模型构建方法
CN109712717A (zh) 一种基于miRNA-基因调控模块的癌症相关MicroRNA识别方法
Guo et al. Identification of prognostic markers and potential therapeutic targets in gastric adenocarcinoma by machine learning based on mRNAsi index
EP2625639A2 (en) Identification of multi-modal associations between biomedical markers
Xia et al. Identifying TME signatures for cervical cancer prognosis based on GEO and TCGA databases
Dong et al. Identification of signature genes and construction of an artificial neural network model of prostate cancer
Nassani et al. Molecular signature to predict quality of life and survival with glioblastoma using Multiview omics model
Xia et al. Identification of molecular subtyping system and four-gene prognostic signature with immune-related genes for uveal melanoma

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant