CN115083605A - 妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用 - Google Patents
妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用 Download PDFInfo
- Publication number
- CN115083605A CN115083605A CN202210689929.4A CN202210689929A CN115083605A CN 115083605 A CN115083605 A CN 115083605A CN 202210689929 A CN202210689929 A CN 202210689929A CN 115083605 A CN115083605 A CN 115083605A
- Authority
- CN
- China
- Prior art keywords
- gynecological tumor
- model
- data set
- iron death
- genes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000009849 Female Genital Neoplasms Diseases 0.000 title claims abstract description 231
- 238000004393 prognosis Methods 0.000 title claims abstract description 177
- 238000010276 construction Methods 0.000 title claims abstract description 16
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 claims abstract description 342
- 229910052742 iron Inorganic materials 0.000 claims abstract description 171
- 230000034994 death Effects 0.000 claims abstract description 165
- 231100000517 death Toxicity 0.000 claims abstract description 165
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 110
- 230000004083 survival effect Effects 0.000 claims abstract description 56
- 229940079593 drug Drugs 0.000 claims abstract description 54
- 239000003814 drug Substances 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 45
- 230000035945 sensitivity Effects 0.000 claims abstract description 44
- 238000012216 screening Methods 0.000 claims abstract description 33
- 238000001914 filtration Methods 0.000 claims abstract description 16
- 230000033228 biological regulation Effects 0.000 claims abstract description 8
- 108700005075 Regulator Genes Proteins 0.000 claims description 75
- 230000014509 gene expression Effects 0.000 claims description 64
- 230000000875 corresponding effect Effects 0.000 claims description 30
- 206010028980 Neoplasm Diseases 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 17
- 201000011510 cancer Diseases 0.000 claims description 14
- 230000036737 immune function Effects 0.000 claims description 14
- 230000036962 time dependent Effects 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 12
- 210000004027 cell Anatomy 0.000 claims description 11
- 102100036523 Anoctamin-6 Human genes 0.000 claims description 10
- 102000004000 Aurora Kinase A Human genes 0.000 claims description 10
- 108090000461 Aurora Kinase A Proteins 0.000 claims description 10
- 102100029815 D(4) dopamine receptor Human genes 0.000 claims description 10
- 102100040896 Growth/differentiation factor 15 Human genes 0.000 claims description 10
- 101000928362 Homo sapiens Anoctamin-6 Proteins 0.000 claims description 10
- 101000865206 Homo sapiens D(4) dopamine receptor Proteins 0.000 claims description 10
- 101000893549 Homo sapiens Growth/differentiation factor 15 Proteins 0.000 claims description 10
- 101000599940 Homo sapiens Interferon gamma Proteins 0.000 claims description 10
- 101000834125 Homo sapiens Medium-chain acyl-CoA ligase ACSF2, mitochondrial Proteins 0.000 claims description 10
- 101000603202 Homo sapiens Nicotinamide N-methyltransferase Proteins 0.000 claims description 10
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 claims description 10
- 101000666295 Homo sapiens X-box-binding protein 1 Proteins 0.000 claims description 10
- 102100037850 Interferon gamma Human genes 0.000 claims description 10
- 102100026674 Medium-chain acyl-CoA ligase ACSF2, mitochondrial Human genes 0.000 claims description 10
- 102100038951 Nicotinamide N-methyltransferase Human genes 0.000 claims description 10
- 206010033128 Ovarian cancer Diseases 0.000 claims description 10
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 10
- 108010067163 Perilipin-2 Proteins 0.000 claims description 10
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 claims description 10
- 102100038151 X-box-binding protein 1 Human genes 0.000 claims description 10
- 230000001276 controlling effect Effects 0.000 claims description 10
- NJHLGKJQFKUSEA-UHFFFAOYSA-N n-[2-(4-hydroxyphenyl)ethyl]-n-methylnitrous amide Chemical compound O=NN(C)CCC1=CC=C(O)C=C1 NJHLGKJQFKUSEA-UHFFFAOYSA-N 0.000 claims description 10
- 206010008342 Cervix carcinoma Diseases 0.000 claims description 9
- 101000655246 Homo sapiens Neutral amino acid transporter A Proteins 0.000 claims description 9
- 102000012978 SLC1A4 Human genes 0.000 claims description 9
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 claims description 9
- 201000010881 cervical cancer Diseases 0.000 claims description 9
- 210000002865 immune cell Anatomy 0.000 claims description 8
- 230000001105 regulatory effect Effects 0.000 claims description 8
- 238000010200 validation analysis Methods 0.000 claims description 7
- 238000013211 curve analysis Methods 0.000 claims description 6
- 238000000611 regression analysis Methods 0.000 claims description 6
- 102000017794 Perilipin-2 Human genes 0.000 claims description 5
- 230000002596 correlated effect Effects 0.000 claims description 4
- 208000037965 uterine sarcoma Diseases 0.000 claims description 4
- 230000006907 apoptotic process Effects 0.000 claims description 2
- 201000004228 ovarian endometrial cancer Diseases 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 10
- 108091008036 Immune checkpoint proteins Proteins 0.000 description 8
- 102000037982 Immune checkpoint proteins Human genes 0.000 description 8
- 238000009169 immunotherapy Methods 0.000 description 8
- 206010014733 Endometrial cancer Diseases 0.000 description 7
- 206010014759 Endometrial neoplasm Diseases 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000002401 inhibitory effect Effects 0.000 description 6
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 4
- 206010061218 Inflammation Diseases 0.000 description 4
- 108091008026 Inhibitory immune checkpoint proteins Proteins 0.000 description 4
- 102000037984 Inhibitory immune checkpoint proteins Human genes 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 210000003171 tumor-infiltrating lymphocyte Anatomy 0.000 description 4
- 210000000987 immune system Anatomy 0.000 description 3
- 230000004054 inflammatory process Effects 0.000 description 3
- 230000036210 malignancy Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000002611 ovarian Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 102000009410 Chemokine receptor Human genes 0.000 description 2
- 108050000299 Chemokine receptor Proteins 0.000 description 2
- 238000012352 Spearman correlation analysis Methods 0.000 description 2
- NKANXQFJJICGDU-QPLCGJKRSA-N Tamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 NKANXQFJJICGDU-QPLCGJKRSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000002246 antineoplastic agent Substances 0.000 description 2
- 229940041181 antineoplastic drug Drugs 0.000 description 2
- 230000001363 autoimmune Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 208000028149 female reproductive system neoplasm Diseases 0.000 description 2
- 229940126546 immune checkpoint molecule Drugs 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000001959 radiotherapy Methods 0.000 description 2
- 210000003289 regulatory T cell Anatomy 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 230000005760 tumorsuppression Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- SHGAZHPCJJPHSC-NUEINMDLSA-N Isotretinoin Chemical compound OC(=O)C=C(C)/C=C/C=C(C)C=CC1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-NUEINMDLSA-N 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 239000012270 PD-1 inhibitor Substances 0.000 description 1
- 239000012668 PD-1-inhibitor Substances 0.000 description 1
- 239000012271 PD-L1 inhibitor Substances 0.000 description 1
- -1 SLC1a4 Proteins 0.000 description 1
- 208000002669 Sex Cord-Gonadal Stromal Tumors Diseases 0.000 description 1
- 210000000447 Th1 cell Anatomy 0.000 description 1
- JXLYSJRDGCGARV-WWYNWVTFSA-N Vinblastine Natural products O=C(O[C@H]1[C@](O)(C(=O)OC)[C@@H]2N(C)c3c(cc(c(OC)c3)[C@]3(C(=O)OC)c4[nH]c5c(c4CCN4C[C@](O)(CC)C[C@H](C3)C4)cccc5)[C@@]32[C@H]2[C@@]1(CC)C=CCN2CC3)C JXLYSJRDGCGARV-WWYNWVTFSA-N 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 229960000548 alemtuzumab Drugs 0.000 description 1
- 230000005975 antitumor immune response Effects 0.000 description 1
- 238000003782 apoptosis assay Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005784 autoimmunity Effects 0.000 description 1
- 230000004900 autophagic degradation Effects 0.000 description 1
- 229950002916 avelumab Drugs 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004791 biological behavior Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 229960003115 certolizumab pegol Drugs 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002224 dissection Methods 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 229950009791 durvalumab Drugs 0.000 description 1
- 210000004696 endometrium Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 210000005002 female reproductive tract Anatomy 0.000 description 1
- 230000004806 ferroptosis Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006058 immune tolerance Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229960005280 isotretinoin Drugs 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 208000016848 malignant germ cell tumor Diseases 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 229960003301 nivolumab Drugs 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 238000010827 pathological analysis Methods 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 229940121655 pd-1 inhibitor Drugs 0.000 description 1
- 229940121656 pd-l1 inhibitor Drugs 0.000 description 1
- 229960002621 pembrolizumab Drugs 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000005522 programmed cell death Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 229960001603 tamoxifen Drugs 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 229960003048 vinblastine Drugs 0.000 description 1
- JXLYSJRDGCGARV-XQKSVPLYSA-N vincaleukoblastine Chemical compound C([C@@H](C[C@]1(C(=O)OC)C=2C(=CC3=C([C@]45[C@H]([C@@]([C@H](OC(C)=O)[C@]6(CC)C=CCN([C@H]56)CC4)(O)C(=O)OC)N3C)C=2)OC)C[C@@](C2)(O)CC)N2CCC2=C1NC1=CC=CC=C21 JXLYSJRDGCGARV-XQKSVPLYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/20—Screening of libraries
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Molecular Biology (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Epidemiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种妇科肿瘤预后模型构建方法、装置和应用,构建方法首先筛选与妇科肿瘤预后显著相关的基因,从而从与妇科肿瘤预后显著相关的基因中过滤共线性特征得到妇科肿瘤预后基因集,结合AIC信息准则筛选妇科肿瘤预后基因集中用于构建最优风险评分模型的目标铁死亡调控基因,进而构建更精简的妇科肿瘤预后模型,减少模型的过拟合程度,提高预测妇科肿瘤患者生存率准确度,同时还能预测妇科肿瘤患者的免疫疗效和药物敏感性,为患者的个性化治疗提供指导。
Description
技术领域
本发明涉及人工智能应用技术领域,具体而言,涉及一种妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用。
背景技术
女性生殖系统肿瘤又称妇科肿瘤,宫颈癌、子宫内膜癌和卵巢癌是妇科肿瘤中最常见的三大恶性肿瘤。
宫颈癌患病的高峰年龄为40-60岁,近年来大量研究表明,宫颈癌的发病年龄呈年轻化趋势,是妇科肿瘤中发生频率最高的恶性肿瘤,治疗预后差、易复发和转移、总生存率低。
子宫内膜癌是发生于子宫内膜的上皮性恶性肿瘤,又称子宫体癌。子宫内膜癌是一种高度异质性的肿瘤。根据其临床病理特征,建立了多种预后系统来指导治疗,包括PORTEC-1(子宫内膜癌术后放射治疗)、GOG-99(妇科肿瘤组-99)、SEPAL(主动脉旁淋巴结清扫术的生存效应)、ESMO(欧洲肿瘤内科学会)。然而,以病理诊断为基础的ESMO风险分层对判断预后和指导治疗不够精准,易导致部分内膜癌患者的过度治疗或治疗不足。
卵巢癌死亡率位于女性生殖道恶性肿瘤之首,是严重威胁女性健康的恶性肿瘤。卵巢恶性肿瘤包括多种病理类型,其中最常见的是上皮性癌,约占卵巢恶性肿瘤的70%,其次是恶性生殖细胞肿瘤和性索间质肿瘤,各约占20%和5%。卵巢深处盆腔,当卵巢病变处于早期时常无特异临床症状,当因出现症状而就诊时,70%的患者已处于晚期。晚期卵巢癌患者往往预后不佳,且卵巢癌患者初诊时即为晚期的情形较多,5年生存率不足30%。
目前,如何提高预测妇科肿瘤预后的准确度是研究妇科肿瘤的难点。
发明内容
为了解决上述问题,提高预测妇科肿瘤预后的准确度,本发明的第一目的在于提供一种妇科肿瘤预后模型构建方法,构建方法具体包括:
获取第一预设数据集,第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
本发明的一种实现方式中,妇科肿瘤包括宫颈癌、卵巢癌、子宫内膜癌和子宫肉瘤中的至少一种。
本发明的一种实现方式中,目标铁死亡调控基因包括ACSF2、IFNG、ANO6、SLC1A4、XBP1、VEGFA、GDF15、DRD4、NNMT、AURKA和PLIN2基因中的至少一种。
本发明的一种实现方式中,获取第一预设数据集之前还包括:
获取多个妇科肿瘤患者的基因表达数据和临床生存预后数据;
对多个妇科肿瘤患者的基因表达数据和临床生存预后数据进行预处理及合并后筛选出第一预设数据集。
本发明的一种实现方式中,第一预设数据集按照预设比例分成训练数据集和测试数据集。
本发明的一种实现方式中,根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集具体包括:
将第一预设数据集按照预设比例划分成训练数据集和测试数据集;
根据第一预设数据集中的训练数据集,采用单基因COX分析在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因;
通过LASSO COX回归分析在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集。
本发明的一种实现方式中,方法还包括使用第一预设数据集评估妇科肿瘤预后模型的预测性能。
本发明的一种实现方式中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能具体包括:
基于妇科肿瘤预后模型计算训练数据集中的各受试者的铁死亡风险评分;
使用训练数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能;
和/或
基于妇科肿瘤预后模型计算验证数据集中的各受试者的铁死亡风险评分;
使用验证数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能。
本发明的一种实现方式中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能还包括:
依据第一预设数据集的时间依赖的受试者工作特征曲线分析确定分组截断值,并根据分组截断值将第一预设数据集中的受试者分为高风险组与低风险组;
分析高风险组或低风险组与不同免疫细胞或免疫功能的相关性;和/或
根据第一预设数据集的Kaplan-Meier曲线分析高风险组或低风险组与受试者生存率的相关性。
本发明的一种实现方式中,方法还包括:
获取第二预设数据集,第二预设数据集包括癌症细胞系基因表达数据及相应的药物敏感性数据;
根据第二预设数据集计算第一预设数据集中受试者的药物敏感性值,根据各受试者的药物敏感性值分析高风险组或低风险组与药物敏感性的相关性。
本发明的一种实现方式中,预设准则为AIC信息准则。
本发明的第二目的在于公开一种妇科肿瘤预后模型构建装置,包括:
数据获取模块:用于获取第一预设数据集,第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
目标铁死亡调控基因筛选模块:用于根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
妇科肿瘤预后模型构建模块:用于根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
本发明的第三目的在于公开一种妇科肿瘤预后模型,采用目标铁死亡调控基因构建而成:
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数;
目标铁死亡调控基因包括ACSF2、IFNG、ANO6、SLC1A4、XBP1、VEGFA、GDF15、DRD4、NNMT、AURKA和PLIN2基因中的至少一种。
本发明的一种实现方式中,各目标铁死亡调控基因及其对应的权重系数如下所示:
序号 | 基因 | 权重系数 |
1 | ACSF2 | 0.19946 |
2 | IFNG | -0.11271 |
3 | ANO6 | 0.46576 |
4 | SLC1A4 | -0.16209 |
5 | XBP1 | -0.11555 |
6 | VEGFA | 0.14278 |
7 | GDF15 | -0.11816 |
8 | DRD4 | 0.09123 |
9 | NNMT | 0.05716 |
10 | AURKA | 0.14564 |
11 | PLIN2 | 0.18353 |
本发明的第四目的在于公开一种根据上述妇科肿瘤预后模型在预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种的应用。
本发明的第五目的在于公开一种妇科肿瘤预后模型的应用方法,应用方法包括:
获取待测妇科肿瘤患者目标铁死亡调控基因的表达数据;
将待测妇科肿瘤患者目标铁死亡调控基因的表达数据输入上述构建方法构建的妇科肿瘤预后模型或者上述妇科肿瘤预后模型,计算待测妇科肿瘤患者的铁死亡风险评分。
本发明的一种实现方式中,还包括:
根据妇科肿瘤患者的铁死亡风险评分预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种。
本发明还涉及一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,其特征在于,处理器执行计算机程序时实现上述应用方法的步骤。
本发明还涉及一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时实现上述应用方法的步骤。
本发明还涉及一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求上述应用方法的步骤。
本发明提供了一种妇科肿瘤预后模型的构建方法,首先筛选与妇科肿瘤预后显著相关的基因,从而从与妇科肿瘤预后显著相关的基因中过滤共线性特征得到妇科肿瘤预后基因集,结合AIC信息准则筛选妇科肿瘤预后基因集中用于构建最优风险评分模型的目标铁死亡调控基因,进而构建更精简的妇科肿瘤预后模型,减少模型的过拟合程度,提高预测妇科肿瘤患者生存率准确度,同时还能预测妇科肿瘤患者的免疫疗效和药物敏感性,为患者的个性化治疗提供指导。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种妇科肿瘤预后模型构建方法的流程图;
图2为本发明提供的一种妇科肿瘤预后模型构建装置的结构框图;
图3为本发明实施例提供的计算机设备的内部结构图;
图4为本发明实施例1构建的妇科肿瘤预后模型在妇瘤队列的训练数据集中建模的ROC曲线图,其中,横坐标表示真正率,纵坐标表示假正率;
图5为本发明实施例1中妇科肿瘤预后模型在妇瘤队列的测试数据集中建模的ROC曲线图,横坐标表示真正率,纵坐标表示假正率;
图6为本发明实施例2中妇科肿瘤预后模型在妇瘤队列的测试数据集中建模的混淆矩阵,Actual表示真实分类,Predicted表示预测分类,sensitivity表示敏感度,Specificity表示特异度,Precision表示精确度,Recall表示召回率,Accurancy表示准确度,f1表示f1分数,Kappa表示Kappa系数;
图7为本发明实施例2中妇科肿瘤预后模型在妇瘤队列的测试数据集中建模的ROC曲线图,横坐标表示真正率,纵坐标表示假正率;
图8为本发明实施例3中妇瘤患者铁死亡高低风险组的PCA示意图;
图9为本发明实施例3中妇瘤患者铁死亡高低风险组与不同免疫功能的相关性评价示意图,横坐标表示不同免疫功能,纵坐标表示不同免疫功能的免疫打分;
图10~14为本发明实施例3中不同免疫功能的生存分析示意图,横坐标表示生存时间(月),纵坐标Survival probability表示生存率,图10中Check-point high/low表示免疫检查点的免疫评分高低分组,图11~图14以此类推,表示不同免疫细胞或免疫功能的免疫评分高低分组;
图15为本发明实施例4中铁死亡风险评分与药物半数最大抑制浓度的相关性示意图,横坐标表示不同药物,纵坐标表示预估的IC50值;
图16为本发明实施例5中不同细胞系中目标铁死亡调控基因与药物半数最大抑制浓度的spearman相关性分析示意图,每个spearman相关性分析图的横坐标表示目标铁死亡调控基因的表达水平,纵坐标表示药物半数最大抑制浓度;
图17为本发明实施例6中妇科肿瘤预后模型用于以OS为结局的妇瘤患者生存分析曲线图,横坐标表示生存时间(月),纵坐标Survival probability表示生存率,Strara表示分组;
图18为本发明实施例6中妇科肿瘤预后模型用于以PFS为结局的妇瘤患者生存分析曲线图,横坐标表示生存时间(月),纵坐标Survival probability表示生存率,Strara表示分组;
图19为本发明实施例6中妇科肿瘤预后模型对以OS为结局的妇瘤患者生存评价的ROC曲线,横坐标表示真正率,纵坐标表示假正率;
图20为本发明实施例6中妇科肿瘤预后模型对以PFS为结局的妇瘤患者生存评价的ROC曲线,横坐标表示真正率,纵坐标表示假正率。
具体实施方式
现将详细地提供本发明实施方式的参考,其一个或多个实例描述于下文。提供每一实例作为解释而非限制本发明。实际上,对本领域技术人员而言,显而易见的是,可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。
因此,旨在本发明覆盖落入所附权利要求的范围及其等同范围中的此类修改和变化。本发明的其它对象、特征和方面公开于以下详细描述中或从中是显而易见的。本领域普通技术人员应理解本讨论仅是示例性实施方式的描述,而非意在限制本发明更广阔的方面。
研究表明,铁死亡与代谢、神经退行性疾病和肿瘤等多种疾病密切相关,并且可以通过激活或抑制铁死亡来干预疾病的发展。铁死亡(Ferroptosis)是一种铁依赖性的,区别于细胞凋亡、细胞坏死、细胞自噬的新型的细胞程序性死亡方式。铁死亡是一个复杂的生物学过程,受到多种分子的调控,而调控分子之间也存在着相互作用。因此,铁死亡调控分子表达模式的差异决定了不同肿瘤组织的铁死亡状态,进而造成了肿瘤生物学行为的差异。
目前,尚未有报道提出利用铁死亡调控分子的相关消息研究妇科肿瘤预后。
此外,传统方法采用构建妇科肿瘤预后模型的方式研究其他类型癌症的预后,但也存在模型易出现过拟合,进而导致模型预测能力不佳的问题。
为了至少部分解决上述技术问题,本发明的第一方面提供了一种妇科肿瘤预后模型构建方法,构建方法具体包括:
S10:获取第一预设数据集,第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
具体地,妇科肿瘤包括宫颈癌(CESC)、卵巢癌(OV)、子宫内膜癌(UCEC)和子宫肉瘤(UCS)中的至少一种。
铁死亡调控基因是指参与铁死亡调控机制的基因,铁死亡调控基因的表达数据集可以从患者的基因表达数据中根据已知报道的铁死亡调控基因筛选。
一些实施方案中,获取第一预设数据集之前还包括:
获取多个妇科肿瘤患者的基因表达数据和临床生存预后数据;
对多个妇科肿瘤患者的基因表达数据和临床生存预后数据进行预处理及合并后筛选出第一预设数据集。
一些具体实施方案中,妇科肿瘤患者的基因表达数据和临床生存预后数据来自于TCGA数据库,用于筛选妇科肿瘤预后基因集,以构建妇科肿瘤预后模型。
具体地,预处理筛选既有临床信息又有对应的基因表达数据的患者样本,通过“sva”(R包)的“combat”算法去除队列之间的批次效应,进而将数据合并,根据已报道的259个铁死亡调控基因,具体见表1,从合并数据中筛选出铁死亡调控基因的表达数据集,以及表达数据集对应患者的预后数据集。
表1
一些实施方案中,第一预设数据集按照预设比例随机分为训练数据集和测试数据集,训练数据集或测试数据集分别包括一定比例的妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集,用于后续步骤筛选妇科肿瘤预后基因集。
S20:根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
具体地,Cox比例风险模型(proportional hazards model,简称Cox模型),是由英国统计学家D.R.Cox(1972)年提出的一种半参数回归模型。该模型以生存结局和生存时间为应变量,可同时分析单因素或者多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。
本发明通过单基因Cox回归分析,根据妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集,可以筛选出与妇科肿瘤患者预后显著相关的基因。
LASSO回归是一种处理具有复共线性数据的有偏估计,通过构造一个惩罚系数,强制系数绝对值之和小于某个固定值,同时可以设定一些回归系数为零,保留子集收缩的优点,实现对自变量特征中共线性因素的过滤。
本发明采用LASSO COX回归对与妇科肿瘤预后显著相关的基因进行筛选,从而过滤与妇科肿瘤预后显著相关的基因中的共线性基因,进而获得更精简的妇科肿瘤预后模型,能够减少模型的过拟合程度,提高妇科肿瘤预后预测的准确度,进一步还能预测妇科肿瘤免疫疗效和药物敏感性,为患者的个性化治疗提供指导。
因此,根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集具体包括:
S201:根据第一预设数据集中的训练数据集,采用单基因COX分析在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因;
S202:通过LASSO COX回归分析在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;具体地,本发明采用单基因COX分析在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因过程中,筛选标准为pvalue<0.05。
进一步,通过LASSO COX回归分析,过滤与妇科肿瘤预后显著相关的基因集中的共线性特征,进而结合AIC信息准则筛选最优风险评分模型作为妇科肿瘤预后模型,以获得更精简的妇科肿瘤预后模型,减少模型的过拟合程度,提高预测妇科肿瘤患者的生存率,进一步还能预测妇科肿瘤免疫疗效和药物敏感性,为患者的个性化治疗提供指导。
S30:根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数,即n=11。其中,各目标铁死亡调控基因及其对应的权重系数如表2所示。
表2
序号 | 基因 | 权重系数 |
1 | ACSF2 | 0.19946 |
2 | IFNG | -0.11271 |
3 | ANO6 | 0.46576 |
4 | SLC1A4 | -0.16209 |
5 | XBP1 | -0.11555 |
6 | VEGFA | 0.14278 |
7 | GDF15 | -0.11816 |
8 | DRD4 | 0.09123 |
9 | NNMT | 0.05716 |
10 | AURKA | 0.14564 |
11 | PLIN2 | 0.18353 |
具体地,目标铁死亡调控基因用于构建妇科肿瘤预后模型的铁死亡调控基因,可根据基于妇科肿瘤预后基因集中的基因构建的风险评分模型,通过AIC信息准则筛选最优风险评分模型而确定。
AIC信息准则即Akaike information criterion,是衡量统计模型拟合优良的一种标准,又称赤池信息量准则。本发明中,AIC可以表示为:
AIC=(2k-2L)/n,其中:n是样本量,k是拟合模型中参数的数量,L是对数似然值。
根据AIC信息准则寻找可以最好地解释数据但包含最少自由参数的模型,从而进一步精简模型,减少模型的过拟合程度。具体地,按照AIC信息准筛选最优风险评分模型则是指找出最小AIC值相对应的模型作为最优模型。
当对妇科肿瘤患者进行分析时,首先获取妇科肿瘤患者的目标铁死亡调控基因,并统计基因的表达量,采用上述铁死亡风险评分计算公式计算铁死亡风险评分。
一些实施方案中,方法还包括:
S40:使用第一预设数据集评估妇科肿瘤预后模型的预测性能。
具体地,可以使用第一预设数据集的时间依赖的ROC曲线(receiver operatingcharacteristic curve,受试者工作特征曲线)分析评估妇科肿瘤预后模型的预测性能。例如,可以使用ROC曲线下面积(area under curve,AUC)这个指标评估风险评分模型的预测性能,AUC值的取值范围在0.5和1之间,AUC值越接近于1.0,风险评分模型的可靠性越高,模型的预测性能越好;AUC值越接近于0.5时,风险评分模型的可靠性越低,模型的预测性能则越差。
因此,一些实施方案中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能具体包括:
S401:基于妇科肿瘤预后模型计算训练数据集中的各受试者的铁死亡风险评分;
使用训练数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能;
和/或
S402:基于妇科肿瘤预后模型计算验证数据集中的各受试者的铁死亡风险评分;
使用验证数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能;
具体地,若验证数据集的时间依赖的受试者工作特征曲线的预测性能和训练数据集趋于一致,则能够说明风险评分模型的可靠性较高,模型的预测性能较好。
一些实施方案中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能还包括:
S403:依据训练数据集或者验证数据集的时间依赖的受试者工作特征曲线分析确定分组截断值,并根据分组截断值将相应数据集中的受试者分为高风险组与低风险组;
S404:分析高风险组或低风险组与不同免疫细胞或免疫功能的相关性;和/或
S405:根据第一预设数据集的Kaplan-Meier曲线分析高风险组或低风险组与受试者生存率的相关性。
具体地,通过训练数据集或者验证数据集的时间依赖的受试者工作特征曲线分析确定分组截断值,可以将训练数据集中的受试者分为铁死亡高风险组和铁死亡低风险组,或者将验证数据集中的受试者分为铁死亡高风险组和铁死亡低风险组,或者将预设数据集中所有受试者分为铁死亡高风险组和铁死亡低风险组。
进一步,对铁死亡高低风险组与不同免疫细胞或免疫功能的相关性进行分析,可以根据铁死亡高风险组或铁死亡低风险组和免疫细胞或免疫功能的相关性预测患者的生存率。研究表明免疫检查点的高表达及相关通路高度活化是预测免疫治疗疗效的重要指标,进而根据铁死亡高低风险组和免疫检查点分子的相关性预测高风险组或者低风险组的免疫检查点分子的免疫疗效。
具体地,Kaplan-Meier曲线(生存曲线)以生存时间为横轴,生存率S(tk)为纵轴,绘制而成的连续型的阶梯形曲线,用以说明生存时间与生存率之间的关系。根据高风险组或低风险组的生存率曲线是否存在显著差异可以评估妇科肿瘤预后模型的预测性能。若根据高风险组或低风险组的生存率曲线存在显著差异,则说明铁死亡风险评分对妇科肿瘤预后有很好的预测能力。
一些实施方案中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能还包括还包括:
S407:获取第二预设数据集,第二预设数据集包括癌症细胞系基因表达数据及相应的药物敏感性数据;
S408:根据第二预设数据集计算第一预设数据集中各受试者的药物敏感性值;
S409:根据各受试者的药物敏感性值分析高风险组或低风险组与药物敏感性的相关性。
具体地,第二预设数据集可以从GDSC数据库中获取,具体获取方式不作限制。药物敏感性值是指衡量药物敏感性高低的度量,例如,可以是药物半数最大抑制浓度IC50,IC50越低,则表明药物敏感性越高。
一些具体实施方案中,第二预设数据集作为pRRopheticPredict函数的训练数据集,通过回归分析,实现根据受试者的基因表达数据预测受试者的药物敏感性值。
一些实施方案中,方法还包括:
S410:获取第三预设数据集,第三预设数据集包括癌症细胞系基因表达数据及相应的药物敏感性数据;
S411:计算第三预设数据集中癌症细胞系的目标铁死亡调控基因的表达水平和药物敏感性值的spearman相关系数;
S412:根据spearman相关系数判断目标铁死亡调控基因的表达水平和药物敏感性的相关性。
具体地,第三预设数据集可以从CellMiner数据库中获取,具体获取方式不作限制。在统计学中,以查尔斯·爱德华·斯皮尔曼命名的斯皮尔曼等级相关系数,即spearman相关系数。经常用希腊字母ρ表示。它是衡量两个变量的依赖性的非参数指标。它利用单调方程评价两个统计变量的相关性。如果数据中没有重复值,并且当两个变量完全单调相关时,斯皮尔曼相关系数则为+1或-1。根据CellMiner数据库可以分析目标铁死亡基因的表达水平和药物敏感性的相关性,进一步可以根据患者对药物的敏感性对患者的个性化治疗提供相应指导。
本发明的第二方面提供了一种妇科肿瘤预后模型构建装置,包括:
数据获取模块100:用于获取预设数据集,预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
目标铁死亡调控基因筛选模块200:用于根据预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
妇科肿瘤预后模型构建模块300:用于根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
本发明的第三方面提供了一种妇科肿瘤预后模型,采用目标铁死亡调控基因构建而成:
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数;
目标铁死亡调控基因包括ACSF2、IFNG、ANO6、SLC1A4、XBP1、VEGFA、GDF15、DRD4、NNMT、AURKA和PLIN2基因中的至少一种。
一些实施方案中,各目标铁死亡调控基因及其对应的权重系数如下所示:
序号 | 基因 | 权重系数 |
1 | ACSF2 | 0.19946 |
2 | IFNG | -0.11271 |
3 | ANO6 | 0.46576 |
4 | SLC1A4 | -0.16209 |
5 | XBP1 | -0.11555 |
6 | VEGFA | 0.14278 |
7 | GDF15 | -0.11816 |
8 | DRD4 | 0.09123 |
9 | NNMT | 0.05716 |
10 | AURKA | 0.14564 |
11 | PLIN2 | 0.18353 |
本发明的第四方面提供了上述妇科肿瘤预后模型在预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种的应用。
本发明的第五方面公开了一种妇科肿瘤预后模型的应用方法,应用方法包括:
获取待测妇科肿瘤患者目标铁死亡调控基因的表达数据;
将待测妇科肿瘤患者目标铁死亡调控基因的表达数据输入上述构建方法构建的妇科肿瘤预后模型或者上述妇科肿瘤预后模型,计算待测妇科肿瘤患者的铁死亡风险评分。
一些实施方案中,还包括:
根据妇科肿瘤患者的铁死亡风险评分预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种。
如本文,术语“免疫治疗(immunotherapy)”是指针对机体低下或亢进的免疫状态,人为地增强或抑制机体的免疫功能以达到治疗疾病目的的治疗方法。免疫治疗的方法有很多,适用于多种疾病的治疗。肿瘤的免疫治疗旨在激活患者的免疫系统,依靠自身免疫机能杀灭癌细胞和肿瘤组织。与以往的手术、化疗、放疗和靶向治疗不同的是,免疫治疗针对的靶标不是肿瘤细胞和组织,而是患者自身的免疫系统。
本发明的免疫疗法包括使用免疫检查点抑制剂的免疫疗法。
如本文所用,术语“免疫检查点”是指免疫系统中存在的一些抑制性信号通路。机体在正常情况下,免疫检查点可以通过调节自身免疫反应的强度来维持免疫耐受,然而机体在受到肿瘤侵袭时,免疫检查点的激活会抑制自身免疫,有利于肿瘤细胞的生长和逃逸。通过使用免疫检查点抑制剂,可以恢复机体正常的抗肿瘤免疫反应,从而控制和清除肿瘤。本领域已知多种可用于肿瘤治疗的免疫检查点抑制剂。例如,本发明免疫检查点抑制剂包括但不限于PD1抑制剂或PD-L1抑制剂,例如国内的特瑞普利单抗、信迪利单抗、卡瑞利珠单抗,以及派姆单抗、纳武单抗、阿特珠单抗、Avelumab以及Durvalumab。
关于妇科肿瘤预后模型构建装置的具体限定可以参见上文中对于妇科肿瘤预后模型构建方法的限定,在此不再赘述。上述妇科肿瘤预后模型构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一些实施方案中,提供了一种计算机设备,该计算机设备可以是服务器104,也可以是终端102,其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器和通信接口。当该计算机设备为终端时,还包括与系统总线连接的显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种表情识别模型的处理方法和图像处理方法中的至少一种。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本申请还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述妇科肿瘤预后模型构建方法的步骤。
本申请还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述妇科肿瘤预后模型构建方法的步骤。
本申请还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述妇科肿瘤预后模型构建方法的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(DynamicRandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
下面将结合实施例对本发明的实施方案进行详细描述。
实施例1
获取TCGA数据库中宫颈癌(CESC)、卵巢癌(OV)、子宫内膜癌(UCEC)和子宫肉瘤(UCS)的妇瘤队列的基因表达数据和临床信息数据并进行预处理后合并,获得合并队列数据包含共计1116例妇瘤患者的基因表达数据和对应的生存预后数据;并从合并队列数据中筛选出259个铁死亡相关调控分子的表达矩阵和预后信息集作为模型构建的输入文件。将上述合并队列1116例妇瘤患者的基因表达数据和临床信息数据按照预设比例随机拆分为训练集和测试集,在训练数据集中建立妇科肿瘤预后模型,并在测试集中进行验证,最后通过ROC曲线对模型的预测性能进行综合评价,其中,在妇瘤队列的训练集建模评价的ROC曲线图如图4所示(AUC:0.77),在妇瘤队列的测试集建模评价的ROC曲线图如图5所示(AUC:0.70)。本实施例构建的妇科肿瘤预后模型:
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数,即n=11。其中,各基因及其对应的权重系数如表2所示。
实施例2
本实施例基于上述测试集,利用现有的单因素或LASSO算法建模,得到相应的模型评价,发现根据混淆矩阵和受试者工作特征曲线(ROC)评估现有算法建模可靠性较差,准确性为0.599,具体如图6所示,AUC为0.65,具体如图7所示,远低于新算法建模的AUC水平。
实施例3
本实施例建立了铁死亡高低风险组妇科肿瘤患者铁死亡高低风险组在免疫检查点和免疫细胞中的相关性评估,在主成分分析PCA中发现铁死亡高低风险组铁死亡高低风险组可以很好的对妇瘤患者进行风险分层,具体如图8所示。
进一步,对高风险组和低风险组中免疫功能的差异进行研究,利用铁死亡高低风险组可以实现在1116例妇瘤患者的妇瘤队列中,采用ssGSEA对多种免疫细胞或者免疫功能相关的基因集进行富集评分,分析结果如图9所示。其中,巨噬细胞(Macrophages)、中心粒细胞(Neutrophil)、Th1细胞、瘤浸润淋巴细胞(TIL)、调节性T细胞(Treg)、趋化因子受体(CCR)、检查点(Checking point)、炎症促进(Inflammation-promoting)和副炎症(Parainflammation)的免疫评分在铁死亡高低风险组中存在显著差异。不同免疫评分分组的妇瘤患者生存分析结果如图10~14所示,结合图9可知,在低风险组中肿瘤浸润淋巴细胞(TIL)、检查点、炎症促进和副炎症免疫评分显著高于高风险组,铁死亡低风险组患者具有更好的生存率;在低风险组中中性粒细胞免疫评分显著高于高风险组,铁死亡低风险组患者具有更高的存活率。这些结果表明,铁死亡高低风险组和免疫功能的相关性有助于评估患者的预后并辅助指导个体化免疫治疗。
实施例4
在本实施例中,从GDSC数据库中下载癌症细胞系芯片表达数据及相应的药物敏感性数据。使用pRRopheticPredict函数预测常见抗癌药物治疗实施例1中妇科肿瘤患者的药物敏感性值,即IC50,以分析预估的抗癌药物IC50值与铁死亡高低风险组的相关性,具体结果如图15所示,图15中的纵坐标IC50是指使用pRRopheticPredict函数预估的IC50。其中有90种药物的IC50与铁死亡高低风险组显著相关,不同药物在铁死亡高低风险组中表现出不同的敏感性。当铁死亡高风险组的药物敏感性值(IC50)小于铁死亡低风险分组时,表明高风险组对该药物的敏感性越强,当铁死亡高风险组的药物敏感性值(IC50)大于铁死亡低风险组时,表明铁死亡低风险组对该药物的敏感性越强,反之则相反。根据图15可知,本实施例中30种药物在妇科肿瘤患者铁死亡高风险组中表现更高的敏感性,60种药物在妇科肿瘤患者铁死亡低风险组中表现更高的敏感性。
实施例5
在本实施例中,从CellMiner数据库中下载癌症细胞系基因表达数据及相应的药物敏感性数据,根据上述数据计算实施例1中构建模型使用的目标铁死亡调控基因在细胞系的表达水平与细胞系的药物敏感性值(IC50)的spearman相关系数,具体如图16所示。本实施例中,当|spearman相关系数|≥0.4和p<0.001,被认为该种药物的抑瘤效果与目标铁死亡调控基因的表达水平相关。当相关系数小于0时,该药物的IC50值随目标铁死亡调控基因表达水平的增加而降低,说明铁死亡调控基因高表达的患者对该药物更敏感,反之则相反。本实施例中相关性分析结果显示,总共有25种药物的抑瘤效果与铁死亡调控基因的表达水平相关,铁死亡调控基因高表达的患者对图16中包括它莫西芬、长春碱等在内的15种药物更敏感,铁死亡调控基因低表达的患者对图16中包括异维A酸等在内的10种药物更敏感。
实施例6
本实施例通过生存曲线(Kaplan-Meier)分析,分别以OS和PFS为结局在妇瘤数据集中建立了铁死亡生存分析曲线,具体如图17和图18所示。进一步,通过时间依赖性的ROC曲线来判断铁死亡风险模型对妇瘤患者生存的预测价值。本实施例构建的妇瘤患者的妇科肿瘤预后模型的分数用于预测患者3年、5年、8年和10年的以OS为结局的总体生存情况的效率为0.71、0.76、0.80、0.78,具体如图19所示,用于预测患者3年、5年、8年和10年的以PFS为结局的总体生存情况的效率为0.77、0.77、0.80、0.80,具体如图20所示,该结果表明铁死亡风险评分可以很好的预测妇瘤患者总体生存率。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (20)
1.一种妇科肿瘤预后模型的构建方法,其特征在于,所述构建方法具体包括:
获取第一预设数据集,所述第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,所述最优风险评分模型即为妇科肿瘤预后模型:
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
2.根据权利要求1所述的妇科肿瘤预后模型的构建方法,其特征在于,所述妇科肿瘤包括宫颈癌、卵巢癌、子宫内膜癌和子宫肉瘤中的至少一种。
3.根据权利要求1所述的妇科肿瘤预后模型构建方法,其特征在于,所述目标铁死亡调控基因包括ACSF2、IFNG、ANO6、SLC1A4、XBP1、VEGFA、GDF15、DRD4、NNMT、AURKA和PLIN2基因中的至少一种。
4.根据权利要求1所述的妇科肿瘤预后模型构建方法,其特征在于,所述各目标铁死亡调控基因及其对应的权重系数如下所示:
5.根据权利要求1所述的妇科肿瘤预后模型的构建方法,其特征在于,所述获取第一预设数据集之前还包括:
获取多个妇科肿瘤患者的基因表达数据和临床生存预后数据;
对多个妇科肿瘤患者的基因表达数据和临床生存预后数据进行预处理及合并后筛选出所述第一预设数据集。
6.根据权利要求1所述的妇科肿瘤预后模型的构建方法,其特征在于,所述根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集具体包括:
将所述第一预设数据集按照预设比例划分成训练数据集和测试数据集;
根据第一预设数据集中的训练数据集,采用单基因COX分析在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因;
通过LASSOCOX回归分析在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集。
7.根据权利要求6所述的妇科肿瘤预后模型构建方法,其特征在于,所述方法还包括使用所述第一预设数据集评估所述妇科肿瘤预后模型的预测性能。
8.根据权利要求7所述的妇科肿瘤预后模型的构建方法,其特征在于,使用所述第一预设数据集评估所述妇科肿瘤预后模型的预测性能具体包括:
基于所述妇科肿瘤预后模型计算所述训练数据集中的各受试者的铁死亡风险评分;
使用所述训练数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能;
和/或
基于所述妇科肿瘤预后模型计算所述验证数据集中的各受试者的铁死亡风险评分;
使用所述验证数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能。
9.根据权利要求7所述的妇科肿瘤预后模型的构建方法,其特征在于,所述使用所述第一预设数据集评估所述妇科肿瘤预后模型的预测性能还包括:
基于所述妇科肿瘤预后模型计算所述第一预设数据集中的各受试者的铁死亡风险评分;
依据所述第一预设数据集的时间依赖的受试者工作特征曲线分析确定分组截断值,并根据所述分组截断值将所述第一预设数据集中的受试者分为高风险组与低风险组;
分析高风险组或低风险组与不同免疫细胞或免疫功能的相关性;和/或
根据第一预设数据集的Kaplan-Meier曲线分析高风险组或低风险组与受试者生存率的相关性。
10.根据权利要求1所述的妇科肿瘤预后模型的构建方法,其特征在于,所述方法还包括:
获取第二预设数据集,所述第二预设数据集包括癌症细胞系的基因表达数据及相应的药物敏感性数据;
根据第二预设数据集计算第一预设数据集中各受试者的药物敏感性值,根据各受试者的药物敏感性值分析高风险组或低风险组与药物敏感性的相关性。
11.根据权利要求1所述的妇科肿瘤预后模型的构建方法,其特征在于,所述预设准则为AIC信息准则。
12.一种妇科肿瘤预后模型的构建装置,其特征在于,包括:
数据获取模块:用于获取第一预设数据集,所述第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
目标铁死亡调控基因筛选模块:用于根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
妇科肿瘤预后模型构建模块:用于根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,所述最优风险评分模型即为妇科肿瘤预后模型:
其中,RS表示铁死亡风险评分,Ei为各目标铁死亡调控基因的表达量,Coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
14.根据权利要求13所述的妇科肿瘤预后模型,其特征在于,所述各目标铁死亡调控基因及其对应的权重系数如下所示:
15.根据权利要求14所述的妇科肿瘤预后模型在预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种的应用。
16.一种妇科肿瘤预后模型的应用方法,其特征在于,所述应用方法包括:
获取待测妇科肿瘤患者目标铁死亡调控基因的表达数据;
将待测妇科肿瘤患者目标铁死亡调控基因的表达数据输入权利要求1~12任一项所述的构建方法构建的妇科肿瘤预后模型或者权利要求14或15所述的妇科肿瘤预后模型,计算所述待测妇科肿瘤患者的铁死亡风险评分。
17.根据权利要求16所述的应用方法,其特征在于,还包括:
根据妇科肿瘤患者的铁死亡风险评分预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种。
18.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求16或17所述的方法的步骤。
19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求16或17所述的方法的步骤。
20.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现16或17所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210689929.4A CN115083605A (zh) | 2022-06-17 | 2022-06-17 | 妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210689929.4A CN115083605A (zh) | 2022-06-17 | 2022-06-17 | 妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115083605A true CN115083605A (zh) | 2022-09-20 |
Family
ID=83253279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210689929.4A Pending CN115083605A (zh) | 2022-06-17 | 2022-06-17 | 妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115083605A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
CN113782090A (zh) * | 2021-09-18 | 2021-12-10 | 中南大学湘雅三医院 | 铁死亡模型构建方法与应用 |
CN114107515A (zh) * | 2022-01-28 | 2022-03-01 | 中国医学科学院北京协和医院 | 早期胃癌预后差异基因与复发预测模型 |
-
2022
- 2022-06-17 CN CN202210689929.4A patent/CN115083605A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
CN113782090A (zh) * | 2021-09-18 | 2021-12-10 | 中南大学湘雅三医院 | 铁死亡模型构建方法与应用 |
CN114107515A (zh) * | 2022-01-28 | 2022-03-01 | 中国医学科学院北京协和医院 | 早期胃癌预后差异基因与复发预测模型 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ma et al. | Immune-related lncRNAs as predictors of survival in breast cancer: a prognostic signature | |
Askew et al. | Mapping FACT-melanoma quality-of-life scores to EQ-5D health utility weights | |
US11649488B2 (en) | Determination of JAK-STAT1/2 pathway activity using unique combination of target genes | |
US20170147743A1 (en) | Rapid identification of pharmacological targets and anti-targets for drug discovery and repurposing | |
CN116030880A (zh) | 用于结直肠癌预后风险预测的生物标志物、模型及其应用 | |
EP4064288A1 (en) | System for evaluating anticancer drug sensitivity and computer-readable medium storing program executing evaluation method | |
CN112201346A (zh) | 癌症生存期预测方法、装置、计算设备及计算机可读存储介质 | |
CN116779162A (zh) | 一种癌症分类设备及系统 | |
CN112626218A (zh) | 一种用于预测胰腺癌转移风险的基因表达分类器、体外诊断试剂盒 | |
Cao et al. | Dynamic prediction of outcome for patients with ovarian cancer: application of a joint model for longitudinal cancer antigen 125 values | |
KR101941011B1 (ko) | 유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법 | |
Guo et al. | Construction and identification of a novel 5-gene signature for predicting the prognosis in breast cancer | |
Wei et al. | Construction of a ferroptosis-related signature based on seven lncRNAs for prognosis and immune landscape in clear cell renal cell carcinoma | |
Li et al. | Placenta autophagy is closely associated with preeclampsia | |
Bao et al. | A diagnostic model for Parkinson’s disease based on anoikis-related genes | |
CN115083605A (zh) | 妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用 | |
Lu et al. | Multicellular biomarkers of drug resistance as promising targets for glioma precision medicine and predictors of patient survival | |
Houri et al. | Prediction of endometrial cancer recurrence by using a novel machine learning algorithm: An Israeli gynecologic oncology group study | |
Chen et al. | The heat shock protein DNAJB2 as a novel biomarker for essential thrombocythemia diagnosis associated with immune infiltration | |
Pașca et al. | Meta-analyses reveal serum or plasma Interleukin-6 as a biomarker for malignant ovarian neoplasia | |
Masson-Lecomte et al. | CD8+ cytotoxic immune infiltrate in non-muscle invasive bladder cancer: a standardized methodology to study association with clinico-pathological features and prognosis | |
CN114242157A (zh) | 基于bGMS预测非小细胞肺癌免疫治疗疗效 | |
Zhou et al. | Unfolded protein response signature unveils novel insights into breast cancer prognosis and tumor microenvironment | |
CN114354931B (zh) | 脾肿大在确定肿瘤患者免疫检查点抑制剂治疗疗效中的应用 | |
Chaichian et al. | Factors affecting endometriosis in women of reproductive age: the differences between the results of neural network and logistic regression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220920 |