CN115083605A - 妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用 - Google Patents

妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用 Download PDF

Info

Publication number
CN115083605A
CN115083605A CN202210689929.4A CN202210689929A CN115083605A CN 115083605 A CN115083605 A CN 115083605A CN 202210689929 A CN202210689929 A CN 202210689929A CN 115083605 A CN115083605 A CN 115083605A
Authority
CN
China
Prior art keywords
gynecological tumor
model
data set
iron death
genes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210689929.4A
Other languages
English (en)
Inventor
卢磊磊
张丽文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhiben Medical Laboratory Co ltd
Origimed Technology Shanghai Co ltd
Original Assignee
Shanghai Zhiben Medical Laboratory Co ltd
Origimed Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhiben Medical Laboratory Co ltd, Origimed Technology Shanghai Co ltd filed Critical Shanghai Zhiben Medical Laboratory Co ltd
Priority to CN202210689929.4A priority Critical patent/CN115083605A/zh
Publication of CN115083605A publication Critical patent/CN115083605A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种妇科肿瘤预后模型构建方法、装置和应用,构建方法首先筛选与妇科肿瘤预后显著相关的基因,从而从与妇科肿瘤预后显著相关的基因中过滤共线性特征得到妇科肿瘤预后基因集,结合AIC信息准则筛选妇科肿瘤预后基因集中用于构建最优风险评分模型的目标铁死亡调控基因,进而构建更精简的妇科肿瘤预后模型,减少模型的过拟合程度,提高预测妇科肿瘤患者生存率准确度,同时还能预测妇科肿瘤患者的免疫疗效和药物敏感性,为患者的个性化治疗提供指导。

Description

妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用
技术领域
本发明涉及人工智能应用技术领域,具体而言,涉及一种妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用。
背景技术
女性生殖系统肿瘤又称妇科肿瘤,宫颈癌、子宫内膜癌和卵巢癌是妇科肿瘤中最常见的三大恶性肿瘤。
宫颈癌患病的高峰年龄为40-60岁,近年来大量研究表明,宫颈癌的发病年龄呈年轻化趋势,是妇科肿瘤中发生频率最高的恶性肿瘤,治疗预后差、易复发和转移、总生存率低。
子宫内膜癌是发生于子宫内膜的上皮性恶性肿瘤,又称子宫体癌。子宫内膜癌是一种高度异质性的肿瘤。根据其临床病理特征,建立了多种预后系统来指导治疗,包括PORTEC-1(子宫内膜癌术后放射治疗)、GOG-99(妇科肿瘤组-99)、SEPAL(主动脉旁淋巴结清扫术的生存效应)、ESMO(欧洲肿瘤内科学会)。然而,以病理诊断为基础的ESMO风险分层对判断预后和指导治疗不够精准,易导致部分内膜癌患者的过度治疗或治疗不足。
卵巢癌死亡率位于女性生殖道恶性肿瘤之首,是严重威胁女性健康的恶性肿瘤。卵巢恶性肿瘤包括多种病理类型,其中最常见的是上皮性癌,约占卵巢恶性肿瘤的70%,其次是恶性生殖细胞肿瘤和性索间质肿瘤,各约占20%和5%。卵巢深处盆腔,当卵巢病变处于早期时常无特异临床症状,当因出现症状而就诊时,70%的患者已处于晚期。晚期卵巢癌患者往往预后不佳,且卵巢癌患者初诊时即为晚期的情形较多,5年生存率不足30%。
目前,如何提高预测妇科肿瘤预后的准确度是研究妇科肿瘤的难点。
发明内容
为了解决上述问题,提高预测妇科肿瘤预后的准确度,本发明的第一目的在于提供一种妇科肿瘤预后模型构建方法,构建方法具体包括:
获取第一预设数据集,第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
Figure BDA0003701226180000011
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
本发明的一种实现方式中,妇科肿瘤包括宫颈癌、卵巢癌、子宫内膜癌和子宫肉瘤中的至少一种。
本发明的一种实现方式中,目标铁死亡调控基因包括ACSF2、IFNG、ANO6、SLC1A4、XBP1、VEGFA、GDF15、DRD4、NNMT、AURKA和PLIN2基因中的至少一种。
本发明的一种实现方式中,获取第一预设数据集之前还包括:
获取多个妇科肿瘤患者的基因表达数据和临床生存预后数据;
对多个妇科肿瘤患者的基因表达数据和临床生存预后数据进行预处理及合并后筛选出第一预设数据集。
本发明的一种实现方式中,第一预设数据集按照预设比例分成训练数据集和测试数据集。
本发明的一种实现方式中,根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集具体包括:
将第一预设数据集按照预设比例划分成训练数据集和测试数据集;
根据第一预设数据集中的训练数据集,采用单基因COX分析在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因;
通过LASSO COX回归分析在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集。
本发明的一种实现方式中,方法还包括使用第一预设数据集评估妇科肿瘤预后模型的预测性能。
本发明的一种实现方式中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能具体包括:
基于妇科肿瘤预后模型计算训练数据集中的各受试者的铁死亡风险评分;
使用训练数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能;
和/或
基于妇科肿瘤预后模型计算验证数据集中的各受试者的铁死亡风险评分;
使用验证数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能。
本发明的一种实现方式中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能还包括:
依据第一预设数据集的时间依赖的受试者工作特征曲线分析确定分组截断值,并根据分组截断值将第一预设数据集中的受试者分为高风险组与低风险组;
分析高风险组或低风险组与不同免疫细胞或免疫功能的相关性;和/或
根据第一预设数据集的Kaplan-Meier曲线分析高风险组或低风险组与受试者生存率的相关性。
本发明的一种实现方式中,方法还包括:
获取第二预设数据集,第二预设数据集包括癌症细胞系基因表达数据及相应的药物敏感性数据;
根据第二预设数据集计算第一预设数据集中受试者的药物敏感性值,根据各受试者的药物敏感性值分析高风险组或低风险组与药物敏感性的相关性。
本发明的一种实现方式中,预设准则为AIC信息准则。
本发明的第二目的在于公开一种妇科肿瘤预后模型构建装置,包括:
数据获取模块:用于获取第一预设数据集,第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
目标铁死亡调控基因筛选模块:用于根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
妇科肿瘤预后模型构建模块:用于根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
Figure BDA0003701226180000031
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
本发明的第三目的在于公开一种妇科肿瘤预后模型,采用目标铁死亡调控基因构建而成:
Figure BDA0003701226180000032
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数;
目标铁死亡调控基因包括ACSF2、IFNG、ANO6、SLC1A4、XBP1、VEGFA、GDF15、DRD4、NNMT、AURKA和PLIN2基因中的至少一种。
本发明的一种实现方式中,各目标铁死亡调控基因及其对应的权重系数如下所示:
序号 基因 权重系数
1 ACSF2 0.19946
2 IFNG -0.11271
3 ANO6 0.46576
4 SLC1A4 -0.16209
5 XBP1 -0.11555
6 VEGFA 0.14278
7 GDF15 -0.11816
8 DRD4 0.09123
9 NNMT 0.05716
10 AURKA 0.14564
11 PLIN2 0.18353
本发明的第四目的在于公开一种根据上述妇科肿瘤预后模型在预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种的应用。
本发明的第五目的在于公开一种妇科肿瘤预后模型的应用方法,应用方法包括:
获取待测妇科肿瘤患者目标铁死亡调控基因的表达数据;
将待测妇科肿瘤患者目标铁死亡调控基因的表达数据输入上述构建方法构建的妇科肿瘤预后模型或者上述妇科肿瘤预后模型,计算待测妇科肿瘤患者的铁死亡风险评分。
本发明的一种实现方式中,还包括:
根据妇科肿瘤患者的铁死亡风险评分预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种。
本发明还涉及一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,其特征在于,处理器执行计算机程序时实现上述应用方法的步骤。
本发明还涉及一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时实现上述应用方法的步骤。
本发明还涉及一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求上述应用方法的步骤。
本发明提供了一种妇科肿瘤预后模型的构建方法,首先筛选与妇科肿瘤预后显著相关的基因,从而从与妇科肿瘤预后显著相关的基因中过滤共线性特征得到妇科肿瘤预后基因集,结合AIC信息准则筛选妇科肿瘤预后基因集中用于构建最优风险评分模型的目标铁死亡调控基因,进而构建更精简的妇科肿瘤预后模型,减少模型的过拟合程度,提高预测妇科肿瘤患者生存率准确度,同时还能预测妇科肿瘤患者的免疫疗效和药物敏感性,为患者的个性化治疗提供指导。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种妇科肿瘤预后模型构建方法的流程图;
图2为本发明提供的一种妇科肿瘤预后模型构建装置的结构框图;
图3为本发明实施例提供的计算机设备的内部结构图;
图4为本发明实施例1构建的妇科肿瘤预后模型在妇瘤队列的训练数据集中建模的ROC曲线图,其中,横坐标表示真正率,纵坐标表示假正率;
图5为本发明实施例1中妇科肿瘤预后模型在妇瘤队列的测试数据集中建模的ROC曲线图,横坐标表示真正率,纵坐标表示假正率;
图6为本发明实施例2中妇科肿瘤预后模型在妇瘤队列的测试数据集中建模的混淆矩阵,Actual表示真实分类,Predicted表示预测分类,sensitivity表示敏感度,Specificity表示特异度,Precision表示精确度,Recall表示召回率,Accurancy表示准确度,f1表示f1分数,Kappa表示Kappa系数;
图7为本发明实施例2中妇科肿瘤预后模型在妇瘤队列的测试数据集中建模的ROC曲线图,横坐标表示真正率,纵坐标表示假正率;
图8为本发明实施例3中妇瘤患者铁死亡高低风险组的PCA示意图;
图9为本发明实施例3中妇瘤患者铁死亡高低风险组与不同免疫功能的相关性评价示意图,横坐标表示不同免疫功能,纵坐标表示不同免疫功能的免疫打分;
图10~14为本发明实施例3中不同免疫功能的生存分析示意图,横坐标表示生存时间(月),纵坐标Survival probability表示生存率,图10中Check-point high/low表示免疫检查点的免疫评分高低分组,图11~图14以此类推,表示不同免疫细胞或免疫功能的免疫评分高低分组;
图15为本发明实施例4中铁死亡风险评分与药物半数最大抑制浓度的相关性示意图,横坐标表示不同药物,纵坐标表示预估的IC50值;
图16为本发明实施例5中不同细胞系中目标铁死亡调控基因与药物半数最大抑制浓度的spearman相关性分析示意图,每个spearman相关性分析图的横坐标表示目标铁死亡调控基因的表达水平,纵坐标表示药物半数最大抑制浓度;
图17为本发明实施例6中妇科肿瘤预后模型用于以OS为结局的妇瘤患者生存分析曲线图,横坐标表示生存时间(月),纵坐标Survival probability表示生存率,Strara表示分组;
图18为本发明实施例6中妇科肿瘤预后模型用于以PFS为结局的妇瘤患者生存分析曲线图,横坐标表示生存时间(月),纵坐标Survival probability表示生存率,Strara表示分组;
图19为本发明实施例6中妇科肿瘤预后模型对以OS为结局的妇瘤患者生存评价的ROC曲线,横坐标表示真正率,纵坐标表示假正率;
图20为本发明实施例6中妇科肿瘤预后模型对以PFS为结局的妇瘤患者生存评价的ROC曲线,横坐标表示真正率,纵坐标表示假正率。
具体实施方式
现将详细地提供本发明实施方式的参考,其一个或多个实例描述于下文。提供每一实例作为解释而非限制本发明。实际上,对本领域技术人员而言,显而易见的是,可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。
因此,旨在本发明覆盖落入所附权利要求的范围及其等同范围中的此类修改和变化。本发明的其它对象、特征和方面公开于以下详细描述中或从中是显而易见的。本领域普通技术人员应理解本讨论仅是示例性实施方式的描述,而非意在限制本发明更广阔的方面。
研究表明,铁死亡与代谢、神经退行性疾病和肿瘤等多种疾病密切相关,并且可以通过激活或抑制铁死亡来干预疾病的发展。铁死亡(Ferroptosis)是一种铁依赖性的,区别于细胞凋亡、细胞坏死、细胞自噬的新型的细胞程序性死亡方式。铁死亡是一个复杂的生物学过程,受到多种分子的调控,而调控分子之间也存在着相互作用。因此,铁死亡调控分子表达模式的差异决定了不同肿瘤组织的铁死亡状态,进而造成了肿瘤生物学行为的差异。
目前,尚未有报道提出利用铁死亡调控分子的相关消息研究妇科肿瘤预后。
此外,传统方法采用构建妇科肿瘤预后模型的方式研究其他类型癌症的预后,但也存在模型易出现过拟合,进而导致模型预测能力不佳的问题。
为了至少部分解决上述技术问题,本发明的第一方面提供了一种妇科肿瘤预后模型构建方法,构建方法具体包括:
S10:获取第一预设数据集,第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
具体地,妇科肿瘤包括宫颈癌(CESC)、卵巢癌(OV)、子宫内膜癌(UCEC)和子宫肉瘤(UCS)中的至少一种。
铁死亡调控基因是指参与铁死亡调控机制的基因,铁死亡调控基因的表达数据集可以从患者的基因表达数据中根据已知报道的铁死亡调控基因筛选。
一些实施方案中,获取第一预设数据集之前还包括:
获取多个妇科肿瘤患者的基因表达数据和临床生存预后数据;
对多个妇科肿瘤患者的基因表达数据和临床生存预后数据进行预处理及合并后筛选出第一预设数据集。
一些具体实施方案中,妇科肿瘤患者的基因表达数据和临床生存预后数据来自于TCGA数据库,用于筛选妇科肿瘤预后基因集,以构建妇科肿瘤预后模型。
具体地,预处理筛选既有临床信息又有对应的基因表达数据的患者样本,通过“sva”(R包)的“combat”算法去除队列之间的批次效应,进而将数据合并,根据已报道的259个铁死亡调控基因,具体见表1,从合并数据中筛选出铁死亡调控基因的表达数据集,以及表达数据集对应患者的预后数据集。
表1
Figure BDA0003701226180000061
Figure BDA0003701226180000071
Figure BDA0003701226180000081
一些实施方案中,第一预设数据集按照预设比例随机分为训练数据集和测试数据集,训练数据集或测试数据集分别包括一定比例的妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集,用于后续步骤筛选妇科肿瘤预后基因集。
S20:根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
具体地,Cox比例风险模型(proportional hazards model,简称Cox模型),是由英国统计学家D.R.Cox(1972)年提出的一种半参数回归模型。该模型以生存结局和生存时间为应变量,可同时分析单因素或者多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。
本发明通过单基因Cox回归分析,根据妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集,可以筛选出与妇科肿瘤患者预后显著相关的基因。
LASSO回归是一种处理具有复共线性数据的有偏估计,通过构造一个惩罚系数,强制系数绝对值之和小于某个固定值,同时可以设定一些回归系数为零,保留子集收缩的优点,实现对自变量特征中共线性因素的过滤。
本发明采用LASSO COX回归对与妇科肿瘤预后显著相关的基因进行筛选,从而过滤与妇科肿瘤预后显著相关的基因中的共线性基因,进而获得更精简的妇科肿瘤预后模型,能够减少模型的过拟合程度,提高妇科肿瘤预后预测的准确度,进一步还能预测妇科肿瘤免疫疗效和药物敏感性,为患者的个性化治疗提供指导。
因此,根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集具体包括:
S201:根据第一预设数据集中的训练数据集,采用单基因COX分析在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因;
S202:通过LASSO COX回归分析在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;具体地,本发明采用单基因COX分析在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因过程中,筛选标准为pvalue<0.05。
进一步,通过LASSO COX回归分析,过滤与妇科肿瘤预后显著相关的基因集中的共线性特征,进而结合AIC信息准则筛选最优风险评分模型作为妇科肿瘤预后模型,以获得更精简的妇科肿瘤预后模型,减少模型的过拟合程度,提高预测妇科肿瘤患者的生存率,进一步还能预测妇科肿瘤免疫疗效和药物敏感性,为患者的个性化治疗提供指导。
S30:根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
Figure BDA0003701226180000091
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数,即n=11。其中,各目标铁死亡调控基因及其对应的权重系数如表2所示。
表2
序号 基因 权重系数
1 ACSF2 0.19946
2 IFNG -0.11271
3 ANO6 0.46576
4 SLC1A4 -0.16209
5 XBP1 -0.11555
6 VEGFA 0.14278
7 GDF15 -0.11816
8 DRD4 0.09123
9 NNMT 0.05716
10 AURKA 0.14564
11 PLIN2 0.18353
具体地,目标铁死亡调控基因用于构建妇科肿瘤预后模型的铁死亡调控基因,可根据基于妇科肿瘤预后基因集中的基因构建的风险评分模型,通过AIC信息准则筛选最优风险评分模型而确定。
AIC信息准则即Akaike information criterion,是衡量统计模型拟合优良的一种标准,又称赤池信息量准则。本发明中,AIC可以表示为:
AIC=(2k-2L)/n,其中:n是样本量,k是拟合模型中参数的数量,L是对数似然值。
根据AIC信息准则寻找可以最好地解释数据但包含最少自由参数的模型,从而进一步精简模型,减少模型的过拟合程度。具体地,按照AIC信息准筛选最优风险评分模型则是指找出最小AIC值相对应的模型作为最优模型。
当对妇科肿瘤患者进行分析时,首先获取妇科肿瘤患者的目标铁死亡调控基因,并统计基因的表达量,采用上述铁死亡风险评分计算公式计算铁死亡风险评分。
一些实施方案中,方法还包括:
S40:使用第一预设数据集评估妇科肿瘤预后模型的预测性能。
具体地,可以使用第一预设数据集的时间依赖的ROC曲线(receiver operatingcharacteristic curve,受试者工作特征曲线)分析评估妇科肿瘤预后模型的预测性能。例如,可以使用ROC曲线下面积(area under curve,AUC)这个指标评估风险评分模型的预测性能,AUC值的取值范围在0.5和1之间,AUC值越接近于1.0,风险评分模型的可靠性越高,模型的预测性能越好;AUC值越接近于0.5时,风险评分模型的可靠性越低,模型的预测性能则越差。
因此,一些实施方案中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能具体包括:
S401:基于妇科肿瘤预后模型计算训练数据集中的各受试者的铁死亡风险评分;
使用训练数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能;
和/或
S402:基于妇科肿瘤预后模型计算验证数据集中的各受试者的铁死亡风险评分;
使用验证数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能;
具体地,若验证数据集的时间依赖的受试者工作特征曲线的预测性能和训练数据集趋于一致,则能够说明风险评分模型的可靠性较高,模型的预测性能较好。
一些实施方案中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能还包括:
S403:依据训练数据集或者验证数据集的时间依赖的受试者工作特征曲线分析确定分组截断值,并根据分组截断值将相应数据集中的受试者分为高风险组与低风险组;
S404:分析高风险组或低风险组与不同免疫细胞或免疫功能的相关性;和/或
S405:根据第一预设数据集的Kaplan-Meier曲线分析高风险组或低风险组与受试者生存率的相关性。
具体地,通过训练数据集或者验证数据集的时间依赖的受试者工作特征曲线分析确定分组截断值,可以将训练数据集中的受试者分为铁死亡高风险组和铁死亡低风险组,或者将验证数据集中的受试者分为铁死亡高风险组和铁死亡低风险组,或者将预设数据集中所有受试者分为铁死亡高风险组和铁死亡低风险组。
进一步,对铁死亡高低风险组与不同免疫细胞或免疫功能的相关性进行分析,可以根据铁死亡高风险组或铁死亡低风险组和免疫细胞或免疫功能的相关性预测患者的生存率。研究表明免疫检查点的高表达及相关通路高度活化是预测免疫治疗疗效的重要指标,进而根据铁死亡高低风险组和免疫检查点分子的相关性预测高风险组或者低风险组的免疫检查点分子的免疫疗效。
具体地,Kaplan-Meier曲线(生存曲线)以生存时间为横轴,生存率S(tk)为纵轴,绘制而成的连续型的阶梯形曲线,用以说明生存时间与生存率之间的关系。根据高风险组或低风险组的生存率曲线是否存在显著差异可以评估妇科肿瘤预后模型的预测性能。若根据高风险组或低风险组的生存率曲线存在显著差异,则说明铁死亡风险评分对妇科肿瘤预后有很好的预测能力。
一些实施方案中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能还包括还包括:
S407:获取第二预设数据集,第二预设数据集包括癌症细胞系基因表达数据及相应的药物敏感性数据;
S408:根据第二预设数据集计算第一预设数据集中各受试者的药物敏感性值;
S409:根据各受试者的药物敏感性值分析高风险组或低风险组与药物敏感性的相关性。
具体地,第二预设数据集可以从GDSC数据库中获取,具体获取方式不作限制。药物敏感性值是指衡量药物敏感性高低的度量,例如,可以是药物半数最大抑制浓度IC50,IC50越低,则表明药物敏感性越高。
一些具体实施方案中,第二预设数据集作为pRRopheticPredict函数的训练数据集,通过回归分析,实现根据受试者的基因表达数据预测受试者的药物敏感性值。
一些实施方案中,方法还包括:
S410:获取第三预设数据集,第三预设数据集包括癌症细胞系基因表达数据及相应的药物敏感性数据;
S411:计算第三预设数据集中癌症细胞系的目标铁死亡调控基因的表达水平和药物敏感性值的spearman相关系数;
S412:根据spearman相关系数判断目标铁死亡调控基因的表达水平和药物敏感性的相关性。
具体地,第三预设数据集可以从CellMiner数据库中获取,具体获取方式不作限制。在统计学中,以查尔斯·爱德华·斯皮尔曼命名的斯皮尔曼等级相关系数,即spearman相关系数。经常用希腊字母ρ表示。它是衡量两个变量的依赖性的非参数指标。它利用单调方程评价两个统计变量的相关性。如果数据中没有重复值,并且当两个变量完全单调相关时,斯皮尔曼相关系数则为+1或-1。根据CellMiner数据库可以分析目标铁死亡基因的表达水平和药物敏感性的相关性,进一步可以根据患者对药物的敏感性对患者的个性化治疗提供相应指导。
本发明的第二方面提供了一种妇科肿瘤预后模型构建装置,包括:
数据获取模块100:用于获取预设数据集,预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
目标铁死亡调控基因筛选模块200:用于根据预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
妇科肿瘤预后模型构建模块300:用于根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
Figure BDA0003701226180000111
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
本发明的第三方面提供了一种妇科肿瘤预后模型,采用目标铁死亡调控基因构建而成:
Figure BDA0003701226180000112
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数;
目标铁死亡调控基因包括ACSF2、IFNG、ANO6、SLC1A4、XBP1、VEGFA、GDF15、DRD4、NNMT、AURKA和PLIN2基因中的至少一种。
一些实施方案中,各目标铁死亡调控基因及其对应的权重系数如下所示:
序号 基因 权重系数
1 ACSF2 0.19946
2 IFNG -0.11271
3 ANO6 0.46576
4 SLC1A4 -0.16209
5 XBP1 -0.11555
6 VEGFA 0.14278
7 GDF15 -0.11816
8 DRD4 0.09123
9 NNMT 0.05716
10 AURKA 0.14564
11 PLIN2 0.18353
本发明的第四方面提供了上述妇科肿瘤预后模型在预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种的应用。
本发明的第五方面公开了一种妇科肿瘤预后模型的应用方法,应用方法包括:
获取待测妇科肿瘤患者目标铁死亡调控基因的表达数据;
将待测妇科肿瘤患者目标铁死亡调控基因的表达数据输入上述构建方法构建的妇科肿瘤预后模型或者上述妇科肿瘤预后模型,计算待测妇科肿瘤患者的铁死亡风险评分。
一些实施方案中,还包括:
根据妇科肿瘤患者的铁死亡风险评分预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种。
如本文,术语“免疫治疗(immunotherapy)”是指针对机体低下或亢进的免疫状态,人为地增强或抑制机体的免疫功能以达到治疗疾病目的的治疗方法。免疫治疗的方法有很多,适用于多种疾病的治疗。肿瘤的免疫治疗旨在激活患者的免疫系统,依靠自身免疫机能杀灭癌细胞和肿瘤组织。与以往的手术、化疗、放疗和靶向治疗不同的是,免疫治疗针对的靶标不是肿瘤细胞和组织,而是患者自身的免疫系统。
本发明的免疫疗法包括使用免疫检查点抑制剂的免疫疗法。
如本文所用,术语“免疫检查点”是指免疫系统中存在的一些抑制性信号通路。机体在正常情况下,免疫检查点可以通过调节自身免疫反应的强度来维持免疫耐受,然而机体在受到肿瘤侵袭时,免疫检查点的激活会抑制自身免疫,有利于肿瘤细胞的生长和逃逸。通过使用免疫检查点抑制剂,可以恢复机体正常的抗肿瘤免疫反应,从而控制和清除肿瘤。本领域已知多种可用于肿瘤治疗的免疫检查点抑制剂。例如,本发明免疫检查点抑制剂包括但不限于PD1抑制剂或PD-L1抑制剂,例如国内的特瑞普利单抗、信迪利单抗、卡瑞利珠单抗,以及派姆单抗、纳武单抗、阿特珠单抗、Avelumab以及Durvalumab。
关于妇科肿瘤预后模型构建装置的具体限定可以参见上文中对于妇科肿瘤预后模型构建方法的限定,在此不再赘述。上述妇科肿瘤预后模型构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一些实施方案中,提供了一种计算机设备,该计算机设备可以是服务器104,也可以是终端102,其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器和通信接口。当该计算机设备为终端时,还包括与系统总线连接的显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种表情识别模型的处理方法和图像处理方法中的至少一种。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本申请还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述妇科肿瘤预后模型构建方法的步骤。
本申请还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述妇科肿瘤预后模型构建方法的步骤。
本申请还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述妇科肿瘤预后模型构建方法的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(DynamicRandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
下面将结合实施例对本发明的实施方案进行详细描述。
实施例1
获取TCGA数据库中宫颈癌(CESC)、卵巢癌(OV)、子宫内膜癌(UCEC)和子宫肉瘤(UCS)的妇瘤队列的基因表达数据和临床信息数据并进行预处理后合并,获得合并队列数据包含共计1116例妇瘤患者的基因表达数据和对应的生存预后数据;并从合并队列数据中筛选出259个铁死亡相关调控分子的表达矩阵和预后信息集作为模型构建的输入文件。将上述合并队列1116例妇瘤患者的基因表达数据和临床信息数据按照预设比例随机拆分为训练集和测试集,在训练数据集中建立妇科肿瘤预后模型,并在测试集中进行验证,最后通过ROC曲线对模型的预测性能进行综合评价,其中,在妇瘤队列的训练集建模评价的ROC曲线图如图4所示(AUC:0.77),在妇瘤队列的测试集建模评价的ROC曲线图如图5所示(AUC:0.70)。本实施例构建的妇科肿瘤预后模型:
Figure BDA0003701226180000141
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数,即n=11。其中,各基因及其对应的权重系数如表2所示。
实施例2
本实施例基于上述测试集,利用现有的单因素或LASSO算法建模,得到相应的模型评价,发现根据混淆矩阵和受试者工作特征曲线(ROC)评估现有算法建模可靠性较差,准确性为0.599,具体如图6所示,AUC为0.65,具体如图7所示,远低于新算法建模的AUC水平。
实施例3
本实施例建立了铁死亡高低风险组妇科肿瘤患者铁死亡高低风险组在免疫检查点和免疫细胞中的相关性评估,在主成分分析PCA中发现铁死亡高低风险组铁死亡高低风险组可以很好的对妇瘤患者进行风险分层,具体如图8所示。
进一步,对高风险组和低风险组中免疫功能的差异进行研究,利用铁死亡高低风险组可以实现在1116例妇瘤患者的妇瘤队列中,采用ssGSEA对多种免疫细胞或者免疫功能相关的基因集进行富集评分,分析结果如图9所示。其中,巨噬细胞(Macrophages)、中心粒细胞(Neutrophil)、Th1细胞、瘤浸润淋巴细胞(TIL)、调节性T细胞(Treg)、趋化因子受体(CCR)、检查点(Checking point)、炎症促进(Inflammation-promoting)和副炎症(Parainflammation)的免疫评分在铁死亡高低风险组中存在显著差异。不同免疫评分分组的妇瘤患者生存分析结果如图10~14所示,结合图9可知,在低风险组中肿瘤浸润淋巴细胞(TIL)、检查点、炎症促进和副炎症免疫评分显著高于高风险组,铁死亡低风险组患者具有更好的生存率;在低风险组中中性粒细胞免疫评分显著高于高风险组,铁死亡低风险组患者具有更高的存活率。这些结果表明,铁死亡高低风险组和免疫功能的相关性有助于评估患者的预后并辅助指导个体化免疫治疗。
实施例4
在本实施例中,从GDSC数据库中下载癌症细胞系芯片表达数据及相应的药物敏感性数据。使用pRRopheticPredict函数预测常见抗癌药物治疗实施例1中妇科肿瘤患者的药物敏感性值,即IC50,以分析预估的抗癌药物IC50值与铁死亡高低风险组的相关性,具体结果如图15所示,图15中的纵坐标IC50是指使用pRRopheticPredict函数预估的IC50。其中有90种药物的IC50与铁死亡高低风险组显著相关,不同药物在铁死亡高低风险组中表现出不同的敏感性。当铁死亡高风险组的药物敏感性值(IC50)小于铁死亡低风险分组时,表明高风险组对该药物的敏感性越强,当铁死亡高风险组的药物敏感性值(IC50)大于铁死亡低风险组时,表明铁死亡低风险组对该药物的敏感性越强,反之则相反。根据图15可知,本实施例中30种药物在妇科肿瘤患者铁死亡高风险组中表现更高的敏感性,60种药物在妇科肿瘤患者铁死亡低风险组中表现更高的敏感性。
实施例5
在本实施例中,从CellMiner数据库中下载癌症细胞系基因表达数据及相应的药物敏感性数据,根据上述数据计算实施例1中构建模型使用的目标铁死亡调控基因在细胞系的表达水平与细胞系的药物敏感性值(IC50)的spearman相关系数,具体如图16所示。本实施例中,当|spearman相关系数|≥0.4和p<0.001,被认为该种药物的抑瘤效果与目标铁死亡调控基因的表达水平相关。当相关系数小于0时,该药物的IC50值随目标铁死亡调控基因表达水平的增加而降低,说明铁死亡调控基因高表达的患者对该药物更敏感,反之则相反。本实施例中相关性分析结果显示,总共有25种药物的抑瘤效果与铁死亡调控基因的表达水平相关,铁死亡调控基因高表达的患者对图16中包括它莫西芬、长春碱等在内的15种药物更敏感,铁死亡调控基因低表达的患者对图16中包括异维A酸等在内的10种药物更敏感。
实施例6
本实施例通过生存曲线(Kaplan-Meier)分析,分别以OS和PFS为结局在妇瘤数据集中建立了铁死亡生存分析曲线,具体如图17和图18所示。进一步,通过时间依赖性的ROC曲线来判断铁死亡风险模型对妇瘤患者生存的预测价值。本实施例构建的妇瘤患者的妇科肿瘤预后模型的分数用于预测患者3年、5年、8年和10年的以OS为结局的总体生存情况的效率为0.71、0.76、0.80、0.78,具体如图19所示,用于预测患者3年、5年、8年和10年的以PFS为结局的总体生存情况的效率为0.77、0.77、0.80、0.80,具体如图20所示,该结果表明铁死亡风险评分可以很好的预测妇瘤患者总体生存率。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (20)

1.一种妇科肿瘤预后模型的构建方法,其特征在于,所述构建方法具体包括:
获取第一预设数据集,所述第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,所述最优风险评分模型即为妇科肿瘤预后模型:
Figure FDA0003701226170000011
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
2.根据权利要求1所述的妇科肿瘤预后模型的构建方法,其特征在于,所述妇科肿瘤包括宫颈癌、卵巢癌、子宫内膜癌和子宫肉瘤中的至少一种。
3.根据权利要求1所述的妇科肿瘤预后模型构建方法,其特征在于,所述目标铁死亡调控基因包括ACSF2、IFNG、ANO6、SLC1A4、XBP1、VEGFA、GDF15、DRD4、NNMT、AURKA和PLIN2基因中的至少一种。
4.根据权利要求1所述的妇科肿瘤预后模型构建方法,其特征在于,所述各目标铁死亡调控基因及其对应的权重系数如下所示:
序号 基因 权重系数 1 ACSF2 0.19946 2 IFNG -0.11271 3 ANO6 0.46576 4 SLC1A4 -0.16209 5 XBP1 -0.11555 6 VEGFA 0.14278 7 GDF15 -0.11816 8 DRD4 0.09123 9 NNMT 0.05716 10 AURKA 0.14564 11 PLIN2 0.18353
5.根据权利要求1所述的妇科肿瘤预后模型的构建方法,其特征在于,所述获取第一预设数据集之前还包括:
获取多个妇科肿瘤患者的基因表达数据和临床生存预后数据;
对多个妇科肿瘤患者的基因表达数据和临床生存预后数据进行预处理及合并后筛选出所述第一预设数据集。
6.根据权利要求1所述的妇科肿瘤预后模型的构建方法,其特征在于,所述根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集具体包括:
将所述第一预设数据集按照预设比例划分成训练数据集和测试数据集;
根据第一预设数据集中的训练数据集,采用单基因COX分析在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因;
通过LASSOCOX回归分析在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集。
7.根据权利要求6所述的妇科肿瘤预后模型构建方法,其特征在于,所述方法还包括使用所述第一预设数据集评估所述妇科肿瘤预后模型的预测性能。
8.根据权利要求7所述的妇科肿瘤预后模型的构建方法,其特征在于,使用所述第一预设数据集评估所述妇科肿瘤预后模型的预测性能具体包括:
基于所述妇科肿瘤预后模型计算所述训练数据集中的各受试者的铁死亡风险评分;
使用所述训练数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能;
和/或
基于所述妇科肿瘤预后模型计算所述验证数据集中的各受试者的铁死亡风险评分;
使用所述验证数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能。
9.根据权利要求7所述的妇科肿瘤预后模型的构建方法,其特征在于,所述使用所述第一预设数据集评估所述妇科肿瘤预后模型的预测性能还包括:
基于所述妇科肿瘤预后模型计算所述第一预设数据集中的各受试者的铁死亡风险评分;
依据所述第一预设数据集的时间依赖的受试者工作特征曲线分析确定分组截断值,并根据所述分组截断值将所述第一预设数据集中的受试者分为高风险组与低风险组;
分析高风险组或低风险组与不同免疫细胞或免疫功能的相关性;和/或
根据第一预设数据集的Kaplan-Meier曲线分析高风险组或低风险组与受试者生存率的相关性。
10.根据权利要求1所述的妇科肿瘤预后模型的构建方法,其特征在于,所述方法还包括:
获取第二预设数据集,所述第二预设数据集包括癌症细胞系的基因表达数据及相应的药物敏感性数据;
根据第二预设数据集计算第一预设数据集中各受试者的药物敏感性值,根据各受试者的药物敏感性值分析高风险组或低风险组与药物敏感性的相关性。
11.根据权利要求1所述的妇科肿瘤预后模型的构建方法,其特征在于,所述预设准则为AIC信息准则。
12.一种妇科肿瘤预后模型的构建装置,其特征在于,包括:
数据获取模块:用于获取第一预设数据集,所述第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
目标铁死亡调控基因筛选模块:用于根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
妇科肿瘤预后模型构建模块:用于根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,所述最优风险评分模型即为妇科肿瘤预后模型:
Figure FDA0003701226170000031
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
13.一种妇科肿瘤预后模型,其特征在于,采用目标铁死亡调控基因构建而成:
Figure FDA0003701226170000032
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数;
所述目标铁死亡调控基因包括ACSF2、IFNG、ANO6、SLC1A4、XBP1、VEGFA、GDF15、DRD4、NNMT、AURKA和PLIN2基因中的至少一种。
14.根据权利要求13所述的妇科肿瘤预后模型,其特征在于,所述各目标铁死亡调控基因及其对应的权重系数如下所示:
序号 基因 权重系数 1 ACSF2 0.19946 2 IFNG -0.11271 3 ANO6 0.46576 4 SLC1A4 -0.16209 5 XBP1 -0.11555 6 VEGFA 0.14278 7 GDF15 -0.11816 8 DRD4 0.09123 9 NNMT 0.05716 10 AURKA 0.14564 11 PLIN2 0.18353
15.根据权利要求14所述的妇科肿瘤预后模型在预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种的应用。
16.一种妇科肿瘤预后模型的应用方法,其特征在于,所述应用方法包括:
获取待测妇科肿瘤患者目标铁死亡调控基因的表达数据;
将待测妇科肿瘤患者目标铁死亡调控基因的表达数据输入权利要求1~12任一项所述的构建方法构建的妇科肿瘤预后模型或者权利要求14或15所述的妇科肿瘤预后模型,计算所述待测妇科肿瘤患者的铁死亡风险评分。
17.根据权利要求16所述的应用方法,其特征在于,还包括:
根据妇科肿瘤患者的铁死亡风险评分预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种。
18.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求16或17所述的方法的步骤。
19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求16或17所述的方法的步骤。
20.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现16或17所述的方法的步骤。
CN202210689929.4A 2022-06-17 2022-06-17 妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用 Pending CN115083605A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210689929.4A CN115083605A (zh) 2022-06-17 2022-06-17 妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210689929.4A CN115083605A (zh) 2022-06-17 2022-06-17 妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用

Publications (1)

Publication Number Publication Date
CN115083605A true CN115083605A (zh) 2022-09-20

Family

ID=83253279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210689929.4A Pending CN115083605A (zh) 2022-06-17 2022-06-17 妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用

Country Status (1)

Country Link
CN (1) CN115083605A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112011616A (zh) * 2020-09-02 2020-12-01 复旦大学附属中山医院 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型
CN113782090A (zh) * 2021-09-18 2021-12-10 中南大学湘雅三医院 铁死亡模型构建方法与应用
CN114107515A (zh) * 2022-01-28 2022-03-01 中国医学科学院北京协和医院 早期胃癌预后差异基因与复发预测模型

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112011616A (zh) * 2020-09-02 2020-12-01 复旦大学附属中山医院 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型
CN113782090A (zh) * 2021-09-18 2021-12-10 中南大学湘雅三医院 铁死亡模型构建方法与应用
CN114107515A (zh) * 2022-01-28 2022-03-01 中国医学科学院北京协和医院 早期胃癌预后差异基因与复发预测模型

Similar Documents

Publication Publication Date Title
Ma et al. Immune-related lncRNAs as predictors of survival in breast cancer: a prognostic signature
Askew et al. Mapping FACT-melanoma quality-of-life scores to EQ-5D health utility weights
US11649488B2 (en) Determination of JAK-STAT1/2 pathway activity using unique combination of target genes
US20170147743A1 (en) Rapid identification of pharmacological targets and anti-targets for drug discovery and repurposing
CN116030880A (zh) 用于结直肠癌预后风险预测的生物标志物、模型及其应用
EP4064288A1 (en) System for evaluating anticancer drug sensitivity and computer-readable medium storing program executing evaluation method
CN112201346A (zh) 癌症生存期预测方法、装置、计算设备及计算机可读存储介质
CN116779162A (zh) 一种癌症分类设备及系统
CN112626218A (zh) 一种用于预测胰腺癌转移风险的基因表达分类器、体外诊断试剂盒
Cao et al. Dynamic prediction of outcome for patients with ovarian cancer: application of a joint model for longitudinal cancer antigen 125 values
KR101941011B1 (ko) 유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법
Guo et al. Construction and identification of a novel 5-gene signature for predicting the prognosis in breast cancer
Wei et al. Construction of a ferroptosis-related signature based on seven lncRNAs for prognosis and immune landscape in clear cell renal cell carcinoma
Li et al. Placenta autophagy is closely associated with preeclampsia
Bao et al. A diagnostic model for Parkinson’s disease based on anoikis-related genes
CN115083605A (zh) 妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用
Lu et al. Multicellular biomarkers of drug resistance as promising targets for glioma precision medicine and predictors of patient survival
Houri et al. Prediction of endometrial cancer recurrence by using a novel machine learning algorithm: An Israeli gynecologic oncology group study
Chen et al. The heat shock protein DNAJB2 as a novel biomarker for essential thrombocythemia diagnosis associated with immune infiltration
Pașca et al. Meta-analyses reveal serum or plasma Interleukin-6 as a biomarker for malignant ovarian neoplasia
Masson-Lecomte et al. CD8+ cytotoxic immune infiltrate in non-muscle invasive bladder cancer: a standardized methodology to study association with clinico-pathological features and prognosis
CN114242157A (zh) 基于bGMS预测非小细胞肺癌免疫治疗疗效
Zhou et al. Unfolded protein response signature unveils novel insights into breast cancer prognosis and tumor microenvironment
CN114354931B (zh) 脾肿大在确定肿瘤患者免疫检查点抑制剂治疗疗效中的应用
Chaichian et al. Factors affecting endometriosis in women of reproductive age: the differences between the results of neural network and logistic regression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220920