CN116525005A - 巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型 - Google Patents

巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型 Download PDF

Info

Publication number
CN116525005A
CN116525005A CN202310323816.7A CN202310323816A CN116525005A CN 116525005 A CN116525005 A CN 116525005A CN 202310323816 A CN202310323816 A CN 202310323816A CN 116525005 A CN116525005 A CN 116525005A
Authority
CN
China
Prior art keywords
prognosis
liver cancer
gene
marker gene
macrophage marker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310323816.7A
Other languages
English (en)
Inventor
苏元帅
薛晨
李兰娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Zhejiang University School of Medicine
Original Assignee
First Affiliated Hospital of Zhejiang University School of Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Zhejiang University School of Medicine filed Critical First Affiliated Hospital of Zhejiang University School of Medicine
Priority to CN202310323816.7A priority Critical patent/CN116525005A/zh
Publication of CN116525005A publication Critical patent/CN116525005A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Physiology (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及肝癌领域,尤其是涉及一种巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型。巨噬细胞标记基因在肝癌预后中的应用,该巨噬细胞标记基因包括TPP1、FTL、CXCL8、CD68、ATP6V1F、CSTB、YBX1、LGALS3和APLP2。本申请基于TAM相关标记基因确定了3种分子亚型后,发现三种亚型之间的预后生存率和免疫特征存在着显著性差异。随后,9个基因风险预测模型(TPP1、FTL、CXCL8、CD68、ATP6V1F、CSTB、YBX1、LGALS3和APLP2)被确定为HCC患者的独立预后因素。与风险评分低的患者相比,风险评分高的患者生存率较低,免疫治疗获益较少。本申请构建了一个TAM相关的风险评估模型,该风险评估模型在预测HCC患者的预后生存率和免疫治疗反应方面具有极好的效果。

Description

巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型
技术领域
本发明涉及肝癌领域,尤其是涉及一种巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型。
背景技术
原发性肝癌是一种高度恶性的难治性肿瘤,是全球肿瘤相关死亡的主要原因。据统计数据显示,在2020年,新增肝癌确诊病例905677例,新增死亡病例930180人,这给全球卫生系统带来了沉重负担。肝细胞癌(HCC)约占所有病例的80%,是原发性肝癌中最常见的组织病理学亚型,其具有侵袭性高、治疗反应差和预后不良的特点。
由于目前缺乏可靠的诊断和治疗措施,大多数HCC患者被诊断时都处于晚期,治疗后的五年生存率极低。另外,由于缺乏有效手段评估肝癌治疗的预后情况,导致肝癌的临床治疗方案具有一定的盲目性,无法针对肝癌患者进行个性化治疗,也无法有效分析治疗数据,为优化肝癌临床治疗方案提供数据支持,进一步探索和构建新的策略来监测和干预肝癌患者十分迫切。
肿瘤免疫微环境(TIME)主要由癌症细胞、炎症细胞、免疫细胞和细胞外基质所组成。各种免疫细胞和参与免疫调节的活性因子的相互作用在肿瘤发生、转移和治疗反应中发挥着重要作用。肿瘤相关巨噬细胞(TAM)在一种在TIME中大量浸润的免疫细胞,是肿瘤相关炎症的关键因素,并通过分泌各种细胞因子和影响其他免疫细胞来调节癌症的发展。研究显示,巨噬细胞通过分泌各种因子和影响其他免疫细胞,不仅在慢性炎症中发挥作用,而且还能启动、促进或抑制癌症的发展。鸟氨酸、血管内皮生长因子、表皮生长因子和TGF-β是来自巨噬细胞的促肿瘤因子,而巨噬细胞中诱导一氧化氮合酶产生的一氧化氮可以抑制肿瘤生长。巨噬细胞已被证明直接或间接地参与恶性肿瘤的几个关键特征,包括血管生成、侵袭、转移、肿瘤微环境的调节和治疗耐药性。
鉴于TAM是肿瘤相关炎症的关键因素,因此,需要构建能够预测HCC预后和免疫治疗反应的基于巨噬细胞风险预后模型。
发明内容
本发明目的之一在于提供一种巨噬细胞标记基因在肝癌预后中的应用。
为实现上述目的,本发明巨噬细胞标记基因在肝癌预后中的应用采取下述技术方案:
巨噬细胞标记基因在肝癌预后中的应用,所述巨噬细胞标记基因包括TPP1、FTL、CXCL8、CD68、ATP6V1F、CSTB、YBX1、LGALS3和APLP2。
优选地,所述TPP1、FTL、CXCL8、CD68、ATP6V1F、CSTB、YBX1、LGALS3和APLP2的Z评分与不良预后呈正相关关系。
优选地,所述评估包括预后特征、临床表型、免疫细胞的相对丰度和浸润程度、免疫逃逸的可能性、免疫相关基因集差异表达、对免疫疗法的反应程度、功能性基因通路富集差异性。
本发明目的之二在于提供一种巨噬细胞标记基因在肝癌预后中的风险评估模型。
为实现上述目的,本发明巨噬细胞标记基因在肝癌预后中的风险评估模型采取下述技术方案:
一种如上述巨噬细胞标记基因在肝癌预后中的风险评估模型,基于公式(1)计算风险评估模型的风险指数;根据阈值“0”划分RiskScore高低风险组,即Riskscore大于零为高风险组,小于零为低风险组,采用Kaplan-Meier法绘制生存曲线,
RiskScore=Σβi×Expi 公式(1);
其中,i代表基于巨噬细胞标记基因与肝癌预后显著相关的第i个基因,β为基因表达水平的Cox回归系数,Exp为基因的表达水平。
优选地,所述RiskScore与晚期肿瘤分期和高肿瘤分级均呈正相关关系。
优选地,所述RiskScore与患者生存率呈负相关关系。
优选地,所述RiskScore与TIDE免疫逃逸预测评分呈正相关关系。
优选地,所述高风险组的免疫评分低于低风险组的免疫评分。
有益效果:
本申请从GSE149614数据集中获得了16个亚群和165个TAM相关标记基因。基于TAM相关标记基因确定了3种分子亚型后,发现三种亚型之间的预后生存率和免疫特征存在着显著性差异。随后,9个基因风险预测模型(TPP1、FTL、CXCL8、CD68、ATP6V1F、CSTB、YBX1、LGALS3和APLP2)被确定为HCC患者的独立预后因素。与风险评分低的患者相比,风险评分高的患者生存率较低,免疫治疗获益较少。本申请构建了一个TAM相关的风险评估模型,该风险评估模型在预测HCC患者的预后生存率和免疫治疗反应方面具有极好的效果。
本发明确认了巨噬细胞标记基因相关的9个关键基因,构建了肝癌临床预后的风险评估模型,该风险评估模型对于肝癌患者的预后及靶向治疗具有重要的意义。
附图说明
图1中:A为过滤前后细胞数统计的柱状图,B为过滤后的数据进行PCA降维绘制的前50个PC的锚点,C为剔除批次前,所有样本UMAP分布图,D为剔除批次后,所有样本UMAP分布图;
图2为marker基因表达的小提琴图;
图3中:A为聚类后各个亚群分布的UMAP图,B为注释后细胞分布的UMAP图,C为各个细胞top5基因表达的气泡图,D为各个细胞KEGG富集分析气泡图展示;
图4中:A为TCGA 队列样本CDF曲线图,B为TCGA队列样本CDF Delta area曲线图,C为consensus k=3时样本聚类热图,D为TCGA三个亚型预后的关系KM曲线图,E为在GSE76427队列中三个亚型的预后的KM曲线图;
图5中:A为TCGA数据集中分子亚型之间不同临床特征的分布比较图,B为TCGA数据分子亚型与临床特征之间分布的桑基图;
图6中:A为ClusterA亚型表达上调和下调的基因KEGG富集分析的气泡图,B其ClusterB亚型表达上调和下调的基因KEGG富集分析的气泡图,C为ClusterC亚型表达上调和下调的基因KEGG富集分析的气泡图,D为肿瘤相关的10个通路在亚型之间的比较图;
图7中:A为免疫评分在三个亚型之间的比较图,B为22个免疫评分在三个亚型之间的比较图,C为28个免疫评分在三个亚型之间的比较图,D为13个免疫相关基因集评分在三个亚型之间的比较图,E为TIDE评分在三个亚型之间的比较图;
图8中:A为每个自变量随λ变化的轨迹,B为λ下的置信区间图,C为TCGA数据集9个基因表达分布的热图,D为TCGA数据集风险得分的ROC曲线图,E为TCGA数据集9个基因构建的风险组KM曲线图;
图9中:A为TCGA队列中不同临床病理分组之间的RiskScore之间的差异图,B为随着风险得分的增加,样本临床特征的分布图;
图10中:A为HALLMARK数据库中高风险组显著富集的前5个通路的富集结果,B为KEGG数据库中高低风险组显著富集的前5个通路的富集结果,C为风险得分与免疫评分的相关性分析,D为高低风险组在22种免疫细胞评分的比较,E为高低风险组在28种免疫细胞评分的富集得分比较的热图;
图11中:A为RiskScore和临床特征的单因素cox分析,B为RiskScore和临床特征的多因素Cox分析,C为列线图模型,D为列线图的1、3、5年的校准曲线,E为列线图的决策曲线。
具体实施方式
下面将对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
材料和方法
1.数据收集和预处理
从GEO数据库下载scRNA-seq数据集GSE149614,其中包含21个HCC样本的信息数据,根据注释文件将探针转换为Symbol。根据每个基因在3个以上细胞中表达,并且每个细胞中表达的基因数量少于6000个且多于100个的标准,过滤scRNA-seq数据。PercentageFeatureSet函数用于计算rRNA和线粒体之间的比率,以确保线粒体的含量低于10%。此外,每个细胞的UMI数至少为100,小于50000。最后,从原始数据中获得了64424个细胞。
从TCGA和HCCDB数据库的肝癌队列中获得了具有临床表型信息数据的基因表达谱和突变数据。移除没有预后随访信息的样本,并使用了具有多个基因探针的表达数据的平均值。经过筛选,确定了TCGA数据库的365个LIHC队列样本和来自HCCDB的389个LIHC样本。
2.单细胞测序数据的聚类降维
使用对数归一以标准化scRNA-seq数据,并使用FindVariableFeatures函数发现了高变基因。然后,又通过FindIntegrationAnchors函数使用CCA方法删除了一批样本,并使用IntegrateData方法整合了21个样本。通过ScaleData函数进一步缩小基因数目后,进行PCA降维以找到锚点。再通过FindNeighbors和FindClusters函数对细胞进行聚类并使用RunUMAP函数对所有细胞进行了UMAP降维。最后,使用特异性标记基因注释所有细胞亚群。
3.ConsensusClusterPlus和累积分布函数(CDF)
TAM标记基因通过ConsensusClusterPlus R包统一聚类。此外,使用pam算法和“pearson”来评估测量距离。TCGA数据库肝癌队列中的365个HCC样本进行聚类,计算一致性矩阵和一致性CDF确定最佳聚类分类。通过监测CDF面积曲线的分布,确定了相对稳定的聚类结果。
4.通过估计RNA转录物的相对亚群来鉴定细胞类型(CIBERSORT)
CIBERSORT是一种基于转录谱输入矩阵表征多组分组织中细胞亚群组成的有效评估方法,有助于探索新的细胞生物标志物。本申请使用CIBERSORT算法计算了22个免疫细胞的得分。进行Kruskal试验以确定免疫浸润与分子亚型和风险评分之间的相关性。
5.肿瘤免疫功能障碍和排斥(TIDE)评估
在线工具TIDE可用于预测不同HCC分子亚型和风险组的潜在临床治疗效果。通过使用TIME工具,可以较为准确地预测癌症患者的免疫治疗反应或耐药性。高预测TIDE评分表明肿瘤免疫逃逸的发生率较高,表明患者从免疫治疗中获益的程度较低。
6.风险评估模型的识别和验证
为了筛选与预后相关的TAM相关标记基因,使用R包进行单变量Cox回归分析。为了进一步压缩风险模型中关键基因的数量,本申请使用Glmnet R包进行LASSO分析。λ值是在模型最佳时确定的。最后,通过多元Cox回归分析计算了这些目标基因的系数。
接下来,为了验证风险模型的稳定性,使用以下公式分别对训练数据集(TCGA-LIHC、HCCDB-LIHC和GSE76427)中的每个患者进行计算:RiskScore=∑系数mRNAn*表达水平mRNAn。此外,本申请使用timeROC R包进行了受试者操作特征(ROC)分析,并评估了风险模型在1年、3年和5年生存预测中的预后分类性能。
7.功能富集分析
通过Limma R包筛选了不同亚型之间的差异表达基因(DEG),再通过WebGestaltRR包进行京都基因和基因组百科全书(KEGG)功能途径富集分析。为了探索风险模型可能调控的信号通路,又从基因集富集分析(GSEA)官方网站下载了HALLMARK和KEGG相关基因数据集,并通过ClusterProfiler和fgsea R包对高风险和低风险人群进行了功能性基因富集分析。
8.细胞培养和逆转录定量PCR(RT-qPCR)
使用人肝癌细胞系Hep-G2和正常对照细胞系LO-2来检测基因的相对表达水平。ABI7500快速PCR仪进行RT-qPCR。GAPDH用于标准化。
9.统计分析
在本申请中,R语言(v 4.0.3)用于统计分析和信息可视化。进行无监督Cox回归分析,以确定风险模型的预测性能。分别通过Wilcoxon和t检验比较各组间的分类变量和连续变量。P值<0.05被认为具有统计学意义。
结果与分析
1.细胞亚群的聚类降维和功能富集分析
通过柱状图展示过滤前后细胞数据的统计,如图1A所示。PCA降维后,绘制前50个PC的锚点图(图1B),剔除批次前后样本的UMAP分布,如图1C和1D所示。选择dim=30进行UMAP降维,共获得16个细胞亚群。
使用marker来注释这些细胞亚群,如图2所示,其中,亚群2、3、5和12为特异性表达CD2、CD3D、CD3E和CD3G基因的T cell;亚群11为特异表达CD79A和MS4A1基因的B细胞。亚群9为特异性表达CD79A和JSRP1基因的浆细胞;亚群15为特异性表达TPSAB1、CPA3基因的Mastcell;亚群10为特异性表达ACTA2、PDGFRB和NOTCH3基因的FB细胞;亚群6为特异性表达PECAM1基因的上皮内细胞;亚群0为特异性表达GPC3、CD24和MDK基因的肝癌细胞;亚群1、4、13和14为特异性表达CD163和CD68基因的巨噬细胞;亚群8为特异性表达MKI67基因的Proliferating cell;亚群7为特异性表达KLRD1、KLRC1基因的NK cell。肥大细胞、增殖细胞和NK细胞也通过标记基因鉴定。
聚类后细胞亚群分布如图3A所示,注释的细胞亚群以UMAP的形式显示(图3B);通过FindAllMarkers函数通过logfc=0.5(差异倍数),Minpct=0.5(差异基因最小的表达比例)筛选10个亚群的marker基因,并以校正后的p<0.05进行筛选,共获得了10个细胞亚群(即B细胞、内皮细胞、成纤维细胞、HCC、巨噬细胞、肥大细胞、NK细胞、浆细胞、增殖细胞和T细胞),其中,每个亚群中前五个显著标记基因的表达特征如图3C所示。图3D提供了基于每个细胞群体的标记基因的KEGG功能富集分析结果。
2.基于TAM相关标记基因的分子亚型构建
针对165个(共有171个marker基因,在TCGA数据集中仅有165个)巨噬细胞的marker基因进行一致性聚类,并进行了500次bootstraps,每个bootstraps过程包括80%的训练集患者。设定聚类数为2到10,通过计算一致性矩阵和一致性累积分布函数来确定最佳分类。
面积曲线表明,当聚类数=3时,聚类结果相对稳定,如图4A和4B所示。因此,选择k=3来定义三种分子亚型(图4C)。进一步分析了这三种亚型的预后特征,并发现分子亚型之间的预后生存率显著不同(图4D)。Cluster C预后最差,Cluster B次之,Cluster A预后最好。为了进一步验证,使用相同的方法分析了独立数据集GSE76427,并发现了相似的结果(图4E)。
3.不同分子亚型的临床表型差异
接下来,探索了三种亚型中多种临床表型的分布特征(卡方检验),发现三种亚型之间的临床特征(包括肿瘤分期、分级和生存状态)存在显著差异(图5A)。Cluster C患者的肿瘤分级较高,生存率较低。使用Sangi图(图5B)可视化了这些临床特征和分子亚型之间的关系,表明分子亚型可以为预测HCC的进展和结果提供新的视角。
4.分子亚型的功能富集分析
接着研究亚型之间的功能,首先通过limma包进行差异分析,这里以|log2(FoldChange)|>log2(1.5),FDR<0.05筛选差异基因,其中,Cluster A、Cluster B和ClusterC表达上调的基因分别有612、396和1659个,而表达下调的基因分别有330、1271和785个。
通过WebGestaltR包对表达上调和下调基因进行KEGG富集分析,通过FDR<0.001进行筛选,其中Cluster A表达上调的基因富集到10个通路,表达下调的基因富集到2个,如图6A所示。Cluster B表达上调的基因富集到14个通路,表达下调的基因富集到37个,如图6B所示。Cluster C表达上调的基因富集到20个通路,表达下调的基因富集到31个,如图6C所示。通过先前研究获取肿瘤相关的10个通路的特征基因(pmid:29625050),通过ssGSEA的方法计算每一个患者关于这10个通路的评分,基于kruskal.test检验,发现肿瘤相关的10个通路有8个在亚型之间存在显著性差异(图6D),表明分子亚型与肿瘤驱动因素之间存在密切关系。
5.三种分子亚型的免疫特征差异
为了描述HCC中的免疫特征,计算了TCGA数据库肝癌队列中患者的免疫浸润分数。结果表明,Cluster A患者预后最好,免疫浸润水平最高;Cluster C患者的免疫评分高于Cluster B患者,而ClusterB患者的预后优于Cluster C患者,如图7A所示。通过CIBERSORT算法评估22种初级免疫细胞的浸润,显示分子亚型中大多数免疫细胞的免疫浸润分数显著不同(图7B)。为了进一步验证,从先前的研究(pmid:28052254;28428277)中获得了28个免疫细胞的特征基因和13个免疫相关基因集,并通过ssGSEA计算了免疫得分。同样,三种亚型之间的免疫细胞浸润状态和免疫相关基因集存在显著差异(图7C和7D)。此外,使用TIDE软件评估免疫疗法的潜在治疗反应。结果表明,Cluster C的预测得分高于Cluster B或Cluster A(P<0.0001)(图7E);因此,Cluster C更容易发生免疫逃逸,患者从免疫治疗中获益的可能性较小。
6.基于TAM相关标记基因的风险模型的建立
使用生存R包对165个TAMs标记基因进行单变量Cox分析,确定了58个与预后相关的基因(P<0.05)。使用LASSO回归分析压缩了这58个关键基因。图8A显示了参数的变化轨迹,随着λ值增加,接近0的参数系数的数量逐渐增加。每个λ值的置信区间如图8B所示,结果显示,风险模型优化为λ=0.0343。最后,9个基因被鉴定为靶基因:TPP1、FTL、CXCL8、CD68、ATP6V1F、CSTB、YBX1、LGALS3和APLP2。最后,通过多元Cox回归分析计算了这9个基因的系数,并确定了最终计算公式:
RiskScore=0.108*TPP1+0.133*FTL+0.059*CXCL8+0.072*CD68+0.108*ATP6V1F+0.072*CSTB+0.488*YBX1+0.055*LGALS3+0.166*APLP2。
以TCGA数据作为训练数据集,分别计算每个样本的风险得分,如图8C所示,RiskScore高的患者生存率明显低于RiskScore低的患者;还进行了Z评分分析,将评分大于零的样本分为高风险组;其他样本被分为低风险组,9个基因表达的Z评分与不良预后呈正相关。
使用R软件包timeROC对RiskScore进行预后分类的ROC分析(图8D),分别分析了1,3,5年的预后预测分类效率,同时对Riskscore进行zscore,并绘制 KM 曲线,结果发现他们存在极显著的差异 p<0.0001(图8E),表明具有良好的预测性能。
7.风险模型对HCC临床表型的评估效力
为了探讨RiskScore与HCC患者的临床病理表型之间的关系,分析了TCGA LIHC队列中不同临床表型之间RiskScores的差异。结果表明,RiskScore的增加与晚期肿瘤分期、患者死亡率的增加和高肿瘤分级呈极显著正相关(图9A)。此外,聚类C在三种分子亚型中具有最高的RiskScore。图9B描述了RiskScore增加的不同表型特征的分布图。
8.风险模型的功能富集分析和免疫表征
从公开的GSEA网站下载了HALLMARK和KEGG相关的基因集。通过ClusterProfilerR包对HALLMARK数据集进行了GSEA基因富集分析,并通过p<0.05进行筛选,结果发现在高危组中,37条功能通路显著富集;相反,在低风险组中没有富集到功能性通路。选择前五条最重要的通路进行了可视化分析(图10A)。重要的是,细胞凋亡和上皮间充质转化(EMT)等丰富的途径在肿瘤的发生和发展中发挥着重要作用。同时基于KEGG数据库中的基因集,使用fgsea包的进行富集分析,选择最显著的前5个通路进行可视化,如图10B所示。
使用ESTIMATE和Spearman分析评估肿瘤免疫状态与风险模型之间的相关性。结果显示RiskScore与免疫评分之间呈正相关(R值=0.237。P值<0.001)(图10C)。通过CIBERSORT算法计算22个初级免疫细胞的免疫浸润分数,大多数免疫细胞的浸润水平在高风险组和低风险组之间有所不同(图10D)。值得注意的是,高风险组的B细胞、CD4+T细胞和NK细胞的免疫评分显著低于低风险组,但Tregs的免疫评分更高。图10E中的热图显示了28个初级免疫细胞富集分数在不同分类特征组中的分布。重要的是,低风险组中分布的B类亚型样本较多,TIDE评分较低,而高风险组中则分布的C类亚型的样本较多,且TIDE评分较高。综上,肿瘤免疫逃逸更容易发生在聚类C中。上述结果表明风险模型对肿瘤免疫评估具有有利价值。
9.风险评分结合临床表型进一步改善预后模型的生存预测效力
通过具有多种临床特征的Cox回归分析,RiskScore被证明是一个显著的独立预后因素(图11A和11B)。为了量化HCC患者的预后,将其与其他临床病理特征相结合以构建列线图(图11C)。从构建的模型来看,RiskScore是患者生存率的最大预测因子。然后,进一步利用校准曲线以评估模型的预测性能,如图11D所示,预测的校准曲线在三个校准点(1年、3年和5年)接近标准曲线,表明列线图具有良好的预测能力。最后,利用决策曲线验证了模型的稳定性。结果表明,风险评分和列线图的预测效益显著优于极端曲线(图11E),显示出最强的生存预测能力。

Claims (8)

1.巨噬细胞标记基因在肝癌预后中的应用,其特征在于,所述巨噬细胞标记基因包括TPP1、FTL、CXCL8、CD68、ATP6V1F、CSTB、YBX1、LGALS3和APLP2。
2.根据权利要求1所述的巨噬细胞标记基因在肝癌预后中的应用,其特征在于,所述TPP1、FTL、CXCL8、CD68、ATP6V1F、CSTB、YBX1、LGALS3和APLP2的Z评分与不良预后呈正相关关系。
3.根据权利要求1所述的巨噬细胞标记基因在肝癌预后中的应用,其特征在于,所述评估包括预后特征、临床表型、免疫细胞的相对丰度和浸润程度、免疫逃逸的可能性、免疫相关基因集差异表达、对免疫疗法的反应程度、功能性基因通路富集差异性。
4.一种如权利要求1所述的巨噬细胞标记基因在肝癌预后中的风险评估模型,其特征在于,基于公式(1)计算风险评估模型的风险指数;根据阈值“0”划分RiskScore高低风险组,即Riskscore大于零为高风险组,小于零为低风险组,采用Kaplan-Meier法绘制生存曲线,
RiskScore=Σβi×Expi 公式(1);
其中,i代表基于巨噬细胞标记基因与肝癌预后显著相关的第i个基因,β为基因表达水平的Cox回归系数,Exp为基因的表达水平。
5.根据权利要求4所述的巨噬细胞标记基因在肝癌预后中的风险评估模型,其特征在于,所述RiskScore与晚期肿瘤分期和高肿瘤分级均呈正相关关系。
6.根据权利要求4所述的巨噬细胞标记基因在肝癌预后中的风险评估模型,其特征在于,所述RiskScore与患者生存率呈负相关关系。
7.根据权利要求4所述的巨噬细胞标记基因在肝癌预后中的风险评估模型,其特征在于,所述RiskScore与TIDE免疫逃逸预测评分呈正相关关系。
8.根据权利要求4或7所述的巨噬细胞标记基因在肝癌预后中的风险评估模型,其特征在于,所述高风险组的免疫评分低于低风险组的免疫评分。
CN202310323816.7A 2023-03-30 2023-03-30 巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型 Pending CN116525005A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310323816.7A CN116525005A (zh) 2023-03-30 2023-03-30 巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310323816.7A CN116525005A (zh) 2023-03-30 2023-03-30 巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型

Publications (1)

Publication Number Publication Date
CN116525005A true CN116525005A (zh) 2023-08-01

Family

ID=87396655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310323816.7A Pending CN116525005A (zh) 2023-03-30 2023-03-30 巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型

Country Status (1)

Country Link
CN (1) CN116525005A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117153241A (zh) * 2023-09-21 2023-12-01 浙江省肿瘤医院 三阴性乳腺癌预后效果的预测模型及其应用

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117153241A (zh) * 2023-09-21 2023-12-01 浙江省肿瘤医院 三阴性乳腺癌预后效果的预测模型及其应用

Similar Documents

Publication Publication Date Title
JP7228896B2 (ja) 乳がん患者の予後の予測方法
US8030060B2 (en) Gene signature for diagnosis and prognosis of breast cancer and ovarian cancer
CN111394456B (zh) 早期肺腺癌患者预后评估系统及其应用
CN113096739A (zh) 一种卵巢癌的免疫预后诊断标志物组合的分析方法
CN107881234A (zh) 一组肺腺癌相关基因标签及其应用
CN110305964A (zh) 一种前列腺癌患者预后复发风险预测标志工具及其风险评估模型的建立
CN113355419B (zh) 一种乳腺癌预后风险预测标志组合物及应用
CN109859796B (zh) 一种关于胃癌的dna甲基化谱的降维分析方法
Wang et al. A three-lncRNA expression signature predicts survival in head and neck squamous cell carcinoma (HNSCC)
CN110423816A (zh) 乳腺癌预后量化评估系统及应用
CN116525005A (zh) 巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型
CN114203256B (zh) 基于微生物丰度的mibc分型及预后预测模型构建方法
CN113658696B (zh) 一种基于患者年龄、营养指标、肿瘤分期和肿瘤标志物联合预测胃癌预后的预测系统
CN116206681A (zh) 一种免疫浸润细胞模型的预后基因对价值评价方法
Zhou et al. Characterization of aging cancer-associated fibroblasts draws implications in prognosis and immunotherapy response in low-grade gliomas
CN115798703A (zh) 基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质
CN113782087B (zh) 一种慢性淋巴细胞白血病sscr风险模型及其建立方法和应用
CN116153387A (zh) 一种肺鳞癌患者总体生存率预后模型及应用
CN115807089A (zh) 肝细胞肝癌预后生物标志物及应用
Xie et al. Comprehensive analysis revealed the potential implications of m6A regulators in lung adenocarcinoma
CN113774135A (zh) 一组用于预测高级别浆液性卵巢癌预后的标志物及其应用
Feng et al. Comprehensive genomics analysis of aging related gene signature to predict the prognosis and drug resistance of colon adenocarcinoma
Lei et al. Prognostic and predictive value of immune-related gene pair signature in primary lower-grade glioma patients
CN115472294B (zh) 预测小细胞转化肺腺癌患者转化速度的模型及其构建方法
WO2024007205A1 (zh) 评估组织微环境的恶性程度的指标的建立与使用方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination