CN115798703A - 基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质 - Google Patents
基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质 Download PDFInfo
- Publication number
- CN115798703A CN115798703A CN202211221442.XA CN202211221442A CN115798703A CN 115798703 A CN115798703 A CN 115798703A CN 202211221442 A CN202211221442 A CN 202211221442A CN 115798703 A CN115798703 A CN 115798703A
- Authority
- CN
- China
- Prior art keywords
- gene
- cell carcinoma
- patient
- clear cell
- tested
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000030808 Clear cell renal carcinoma Diseases 0.000 title claims abstract description 173
- 206010073251 clear cell renal cell carcinoma Diseases 0.000 title claims abstract description 172
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 117
- 238000004393 prognosis Methods 0.000 title claims abstract description 59
- 238000003860 storage Methods 0.000 title claims abstract description 33
- 230000004129 fatty acid metabolism Effects 0.000 title abstract description 68
- 230000014509 gene expression Effects 0.000 claims description 136
- 208000006265 Renal cell carcinoma Diseases 0.000 claims description 108
- 201000011330 nonpapillary renal cell carcinoma Diseases 0.000 claims description 105
- 230000004083 survival effect Effects 0.000 claims description 72
- 206010028980 Neoplasm Diseases 0.000 claims description 66
- 238000001514 detection method Methods 0.000 claims description 29
- 102100026105 3-ketoacyl-CoA thiolase, mitochondrial Human genes 0.000 claims description 26
- 101000835276 Homo sapiens 3-ketoacyl-CoA thiolase, mitochondrial Proteins 0.000 claims description 26
- 102100036201 Oxygen-dependent coproporphyrinogen-III oxidase, mitochondrial Human genes 0.000 claims description 18
- 101150032323 ALDH3A2 gene Proteins 0.000 claims description 17
- 101150054866 Acadl gene Proteins 0.000 claims description 17
- 102100026608 Aldehyde dehydrogenase family 3 member A2 Human genes 0.000 claims description 17
- 101150104923 CPOX gene Proteins 0.000 claims description 17
- 102100024853 Carnitine O-palmitoyltransferase 2, mitochondrial Human genes 0.000 claims description 17
- 101150039979 ENO3 gene Proteins 0.000 claims description 17
- 102100028652 Gamma-enolase Human genes 0.000 claims description 17
- 101150024938 HPGD gene Proteins 0.000 claims description 17
- 101000717967 Homo sapiens Aldehyde dehydrogenase family 3 member A2 Proteins 0.000 claims description 17
- 101000909313 Homo sapiens Carnitine O-palmitoyltransferase 2, mitochondrial Proteins 0.000 claims description 17
- 101001058231 Homo sapiens Gamma-enolase Proteins 0.000 claims description 17
- 101000677545 Homo sapiens Long-chain specific acyl-CoA dehydrogenase, mitochondrial Proteins 0.000 claims description 17
- 101001021103 Homo sapiens Oxygen-dependent coproporphyrinogen-III oxidase, mitochondrial Proteins 0.000 claims description 17
- 101000892398 Homo sapiens Tryptophan 2,3-dioxygenase Proteins 0.000 claims description 17
- 102100021644 Long-chain specific acyl-CoA dehydrogenase, mitochondrial Human genes 0.000 claims description 17
- 101150112321 Ptprg gene Proteins 0.000 claims description 17
- 101150064021 TDO2 gene Proteins 0.000 claims description 17
- 102100040653 Tryptophan 2,3-dioxygenase Human genes 0.000 claims description 17
- 101150043789 cpt2 gene Proteins 0.000 claims description 17
- 101150104041 eno2 gene Proteins 0.000 claims description 17
- 102100035388 Beta-enolase Human genes 0.000 claims description 16
- 101000877537 Homo sapiens Beta-enolase Proteins 0.000 claims description 16
- 101000606548 Homo sapiens Receptor-type tyrosine-protein phosphatase gamma Proteins 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 12
- 201000010099 disease Diseases 0.000 claims description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 12
- 238000011529 RT qPCR Methods 0.000 claims description 10
- 239000002299 complementary DNA Substances 0.000 claims description 10
- 238000003753 real-time PCR Methods 0.000 claims description 9
- 101150057674 Acaa2 gene Proteins 0.000 claims description 8
- 208000009060 clear cell adenocarcinoma Diseases 0.000 claims description 4
- 210000003734 kidney Anatomy 0.000 claims description 2
- 238000003762 quantitative reverse transcription PCR Methods 0.000 claims 8
- 238000000034 method Methods 0.000 abstract description 6
- 230000005856 abnormality Effects 0.000 abstract description 3
- 238000005457 optimization Methods 0.000 abstract description 2
- 238000013517 stratification Methods 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 30
- 238000010200 validation analysis Methods 0.000 description 27
- 210000001519 tissue Anatomy 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 14
- 201000011510 cancer Diseases 0.000 description 14
- 230000037361 pathway Effects 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 102100030489 15-hydroxyprostaglandin dehydrogenase [NAD(+)] Human genes 0.000 description 7
- 101001126430 Homo sapiens 15-hydroxyprostaglandin dehydrogenase [NAD(+)] Proteins 0.000 description 7
- 102100039661 Receptor-type tyrosine-protein phosphatase gamma Human genes 0.000 description 7
- 230000036962 time dependent Effects 0.000 description 7
- 230000002596 correlated effect Effects 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 235000014113 dietary fatty acids Nutrition 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 229930195729 fatty acid Natural products 0.000 description 5
- 239000000194 fatty acid Substances 0.000 description 5
- 150000004665 fatty acids Chemical class 0.000 description 5
- 238000010199 gene set enrichment analysis Methods 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000013211 curve analysis Methods 0.000 description 4
- 238000007254 oxidation reaction Methods 0.000 description 4
- 238000000611 regression analysis Methods 0.000 description 4
- TVZRAEYQIKYCPH-UHFFFAOYSA-N 3-(trimethylsilyl)propane-1-sulfonic acid Chemical compound C[Si](C)(C)CCCS(O)(=O)=O TVZRAEYQIKYCPH-UHFFFAOYSA-N 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 210000002865 immune cell Anatomy 0.000 description 3
- 230000001506 immunosuppresive effect Effects 0.000 description 3
- 230000008595 infiltration Effects 0.000 description 3
- 238000001764 infiltration Methods 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000011088 calibration curve Methods 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010201 enrichment analysis Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000010837 poor prognosis Methods 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 230000004102 tricarboxylic acid cycle Effects 0.000 description 2
- 230000002407 ATP formation Effects 0.000 description 1
- 238000001353 Chip-sequencing Methods 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- -1 HGPD Proteins 0.000 description 1
- 238000010824 Kaplan-Meier survival analysis Methods 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 238000012313 Kruskal-Wallis test Methods 0.000 description 1
- 102000003820 Lipoxygenases Human genes 0.000 description 1
- 108090000128 Lipoxygenases Proteins 0.000 description 1
- 101710200437 Oxygen-dependent coproporphyrinogen-III oxidase, mitochondrial Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 208000006593 Urologic Neoplasms Diseases 0.000 description 1
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000005773 cancer-related death Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000012820 cell cycle checkpoint Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000008482 dysregulation Effects 0.000 description 1
- 230000037149 energy metabolism Effects 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 230000004136 fatty acid synthesis Effects 0.000 description 1
- 238000005755 formation reaction Methods 0.000 description 1
- 230000004547 gene signature Effects 0.000 description 1
- 230000004153 glucose metabolism Effects 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- 150000003278 haem Chemical class 0.000 description 1
- 239000012642 immune effector Substances 0.000 description 1
- 229940121354 immunomodulator Drugs 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000013190 lipid storage Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000003071 memory t lymphocyte Anatomy 0.000 description 1
- 230000004066 metabolic change Effects 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 238000011227 neoadjuvant chemotherapy Methods 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000092 prognostic biomarker Substances 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 210000003289 regulatory T cell Anatomy 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 210000005084 renal tissue Anatomy 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000005748 tumor development Effects 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质。本发明发现脂肪酸代谢异常在肾透明细胞癌患者中的重要价值,然后结合多种方法建立新型脂肪酸代谢基因预后模型,并基于此模型预测肾透明细胞癌患者预后的装置。本发明在独立的肾透明细胞癌队列和临床队列中成功验证了该模型和装置对于肾透明细胞癌患者预后具有很好的预测价值。可以在临床应用中改善肾透明细胞癌患者的风险分层优化和个性化管理。
Description
技术领域
本发明属于生物技术领域,具体涉及基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质。
背景技术
肾细胞癌是泌尿系统肿瘤的第二大死因,约占每年成年男性所有新发病例的5%,占成年女性所有新发病例的3%。肾脏透明细胞癌是肾细胞癌最流行和最具侵略性的亚型,是大多数肾脏癌症相关死亡的原因。但由于缺乏有用的生物标志物,肾透明细胞癌在晚期阶段的治疗效果不佳。因此,准确和及时的预后生物标志物对肾透明细胞癌患者至关重要,在临床实践中非常需要。
脂肪酸是细胞膜形成、能量储存、信号分子产生等生物过程所必需的成分。脂肪酸代谢的增加是对癌症病人癌细胞高代谢需求的反应并且与多个细胞过程密切相关,如细胞生长、细胞转化、肿瘤发展和疾病进展。近年来,研究显示能量代谢重编程是癌细胞共有的特征,其可以参与维持细胞生长、分裂和生存所需的ATP和大分子的产生。除糖代谢外,近年来对脂肪酸代谢的失调也有了更多的了解和认识。与正常肾脏组织相比,肾透明细胞癌患者的肿瘤组织中的脂质储存增加。然而,肾透明细胞癌中脂肪酸代谢途径的具体调节机制目前还未被阐明。因此,建立脂肪酸代谢基因模型可为探索肾透明细胞癌的病理机制和治疗开辟新的途径。
发明内容
本发明所要解决的技术问题是如何预测肾透明细胞癌患者的预后。
为了解决上述技术问题,本发明首先提供了预测待测肾透明细胞癌患者预后的装置,其特征在于:所述装置可为装置M或装置N。所述装置M可包括如下模块:
M1)基因表达量获取模块:用于获取待测肾透明细胞癌患者肿瘤组织中的10个基因的表达量数据;
M2)预后风险评分计算模块:用于基于式Ⅰ和所述表达量数据计算获得待测肾透明细胞癌患者的预后风险评分;
风险评分=(-0.2219×CPT2基因表达量)+(-0.0416×ACADL基因表达量)+(-0.2152×PTPRG基因表达量)+(0.0897×CPOX基因表达量)+(0.0429×TDO2基因表达量)+-0.0428×HPGD基因表达量)+(0.0104×ENO2基因表达量)+(0.0944×ENO3基因表达量)+(-0.0298×ALDH3A2的基因表达量)+(-0.0536×ACAA2)的基因表达量)式Ⅰ;
M3)预后结果输出模块:用于基于所述预后风险评分输出待测肾透明细胞癌患者的预后结果;
所述装置N可包括如下模块:
N1)基因数据获取模块:用于获取待测肾透明细胞癌患者肿瘤组织中10个基因的RNA反转录成cDNA后在进行实时定量聚合酶链反应的标准化阈值数据;
N2)预后风险分数计算模块:用于基于式Ⅱ和所述标准化阈值数据计算获得待测肾透明细胞癌患者的预后风险分数;
平均RT-qPCR检测Ct值(ACAA2、ACADL、ALDH3A2、CPT2、HGPD和PTPRG基因)-平均RT-qPCR检测Ct值(CPOX、ENO2、ENO3和TDO2)式Ⅱ;
N3)预后结果输出模块:用于基于所述预后风险分数输出待测肾透明细胞癌患者的预后结果。
所述10个基因为人类基因组中的CPT2基因、ACAA2基因、HPGD基因、ALDH3A2基因、ENO2基因、ENO3基因、TDO2基因、CPOX基因、ACADL基因和PTPRG基因。
所述基因的表达量可为基因在mRNA水平的表达量。所述基因的表达量可为待测肾透明细胞癌患者肿瘤组织中基因的表达量。
式Ⅱ中,所述平均RT-qPCR检测Ct值可为RT-qPCR检测基因的标准化阈值(Ct值)的平均值。
所述10个基因可分别为人基因组中的CPT2(HGNC ID:HGNC:2330,相关网站https://www.genenames.org,即NCBI Reference Sequence:NM_000098.3(14-AUG-2022))、ACAA2(HGNC ID:HGNC:83,NCBI Reference Sequence:NM_006111.3(01-JUN-2022))、HPGD(HGNC ID:HGNC:5154,NCBI Reference Sequence:NM_000860.6(24-JUL-2022))、ALDH3A2(HGNC ID:HGNC:403,NCBI Reference Sequence:NM_000382.3(14-AUG-2022))、ENO2(HGNC ID:HGNC:3353,NCBI Reference Sequence:NM_001975.3(21-AUG-2022))、ENO3(HGNC ID:HGNC:3354,NCBI Reference Sequence:NM_053013.4(16-SEP-2022))、TDO2(HGNC ID:HGNC:11708,NCBI Reference Sequence:NM_005651.4(14-AUG-2022))、CPOX(HGNC ID:HGNC:2321,NCBI Reference Sequence:NM_000097.7(11-AUG-2022))、ACADL(HGNC ID:HGNC:88,NCBI Reference Sequence:NM_001608.4(14-AUG-2022))和PTPRG(HGNC ID:HGNC:9671,NCBI Reference Sequence:NM_002841.4(02-OCT-2022))。
所述预后结果可为高风险和低风险。所述高风险患者的预后差于所述低风险的预后。所述高风险可为将肾透明细胞癌患者群体的风险分数按照由高到底的顺序排序,待测肾透明细胞癌患者排序为肾透明细胞癌患者群体的风险分数前1/3的样本被划分为高风险,排序为后2/3的样本被划分为低风险。所述高风险和低风险可根据肾透明细胞癌患者群体的样本数量按照1:2的比例划分。
上述装置中,所述预后可为待测肾透明细胞癌患者的总体生存期、疾病特异性生存期和/或无进展生存期。
所述预后具体可为待测肾透明细胞癌患者1年、3年或5年总体生存期。
为了解决上述技术问题,本发明还提供了预测待测肾透明细胞癌患者预后的装置。所述装置为装置A或装置B。所述装置A可包括如下模块:
A1)数据获取模块:用于获取待测肾透明细胞癌患者肿瘤组织的10个基因的表达量数据、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据;
A2)预后风险评分计算模块:用于基于式Ⅰ和所述表达量数据计算获得待测肾透明细胞癌患者的预后风险评分;
风险评分=(-0.2219×CPT2基因表达量)+(-0.0416×ACADL基因表达量)+(-0.2152×PTPRG基因表达量)+(0.0897×CPOX基因表达量)+(0.0429×TDO2基因表达量)+-0.0428×HPGD基因表达量)+(0.0104×ENO2基因表达量)+(0.0944×ENO3基因表达量)+(-0.0298×ALDH3A2的基因表达量)+(-0.0536×ACAA2)的基因表达量)式Ⅰ;
A3)预后结果输出模块:用于基于所述预后风险评分、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据输出预后结果。
所述装置B可包括如下模块:
B1)基因数据获取模块:用于获取待测肾透明细胞癌患者肿瘤组织中10个基因的RNA反转录成cDNA后在进行实时定量聚合酶链反应的标准化阈值数据、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据;
B2)预后风险分数计算模块:用于基于式Ⅱ和所述标准化阈值数据计算获得待测肾透明细胞癌患者的预后风险分数;
平均RT-qPCR检测Ct值(ACAA2、ACADL、ALDH3A2、CPT2、HGPD和PTPRG基因)-平均RT-qPCR检测Ct值(CPOX、ENO2、ENO3和TDO2)式Ⅱ;
B3)预后结果输出模块:用于基于所述预后风险分数、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据输出预后结果。
所述10个基因为人类基因组中的CPT2基因、ACAA2基因、HPGD基因、ALDH3A2基因、ENO2基因、ENO3基因、TDO2基因、CPOX基因、ACADL基因和PTPRG基因。
所述基因的表达量可为基因在mRNA水平的表达量。所述基因的表达量可为待测肾透明细胞癌患者肿瘤组织中基因的表达量。
式Ⅱ中,所述平均RT-qPCR检测Ct值可为RT-qPCR检测基因的标准化阈值(Ct值)的平均值。
所述10个基因可分别为人基因组中的CPT2(HGNC ID:HGNC:2330,相关网站https://www.genenames.org,即NCBI Reference Sequence:NM_000098.3(14-AUG-2022))、ACAA2(HGNC ID:HGNC:83,NCBI Reference Sequence:NM_006111.3(01-JUN-2022))、HPGD(HGNC ID:HGNC:5154,NCBI Reference Sequence:NM_000860.6(24-JUL-2022))、ALDH3A2(HGNC ID:HGNC:403,NCBI Reference Sequence:NM_000382.3(14-AUG-2022))、ENO2(HGNC ID:HGNC:3353,NCBI Reference Sequence:NM_001975.3(21-AUG-2022))、ENO3(HGNC ID:HGNC:3354,NCBI Reference Sequence:NM_053013.4(16-SEP-2022))、TDO2(HGNC ID:HGNC:11708,NCBI Reference Sequence:NM_005651.4(14-AUG-2022))、CPOX(HGNC ID:HGNC:2321,NCBI Reference Sequence:NM_000097.7(11-AUG-2022))、ACADL(HGNC ID:HGNC:88,NCBI Reference Sequence:NM_001608.4(14-AUG-2022))和PTPRG(HGNC ID:HGNC:9671,NCBI Reference Sequence:NM_002841.4(02-OCT-2022))。
上述装置中,所述临床数据可为待测肾透明细胞癌患者的AJCC分期和/或肿瘤分级。
所述预后结果可为高风险和低风险。所述高风险患者的预后差于所述低风险的预后。所述高风险可为将肾透明细胞癌患者群体的风险分数按照由高到底的顺序排序,待测肾透明细胞癌患者排序为肾透明细胞癌患者群体的风险分数前1/3的样本、待测肾透明细胞癌患者年龄大于等于60岁、AJCC分期为3或4期、且肿瘤分级为3或4级的待测肾透明细胞癌患者被划分为高风险;所述高风险可为将肾透明细胞癌患者群体的风险分数按照由高到底的顺序排序,待测肾透明细胞癌患者排序为肾透明细胞癌患者群体的风险分数后2/3的样本、待测肾透明细胞癌患者年龄小于60岁、AJCC分期为1或2期、且肿瘤分级为1或2级的待测肾透明细胞癌患者被划分为低风险。5.根据权利要求3或4所述的装置,其特征在于:所述预后为待测肾透明细胞癌患者的总体生存期、疾病特异性生存期和/或无进展生存期。
所述预后具体可为待测肾透明细胞癌患者1年、3年或5年总体生存期。
为了解决上述技术问题,本发明还提供了预测待测肾透明细胞癌患者预后的计算机可读存储介质。所述计算机可读存储介质可为计算机可读存储介质C或计算机可读存储介质D。所述计算机可读存储介质C可计算机运行如下步骤:
C1)获取待测肾透明细胞癌患者肿瘤组织中的10个基因的表达量数据;
C2)基于式Ⅰ和所述表达量数据计算获得待测肾透明细胞癌患者的预后风险评分;
风险评分=(-0.2219×CPT2基因表达量)+(-0.0416×ACADL基因表达量)+(-0.2152×PTPRG基因表达量)+(0.0897×CPOX基因表达量)+(0.0429×TDO2基因表达量)+-0.0428×HPGD基因表达量)+(0.0104×ENO2基因表达量)+(0.0944×ENO3基因表达量)+(-0.0298×ALDH3A2的基因表达量)+(-0.0536×ACAA2)的基因表达量)式Ⅰ;
C3)基于所述预后风险评分输出待测肾透明细胞癌患者的预后结果;
所述计算机可读存储介质D可使计算机运行如下步骤:
D1)获取待测肾透明细胞癌患者肿瘤组织中10个基因的RNA反转录成cDNA后在进行实时定量聚合酶链反应的标准化阈值数据;
D2)基于式Ⅱ和所述标准化阈值数据计算获得待测肾透明细胞癌患者的预后风险分数;
平均RT-qPCR检测Ct值(ACAA2、ACADL、ALDH3A2、CPT2、HGPD和PTPRG基因)-平均RT-qPCR检测Ct值(CPOX、ENO2、ENO3和TDO2)式Ⅱ;
D3)基于所述预后风险分数输出待测肾透明细胞癌患者的预后结果;
所述10个基因为人类基因组中的CPT2基因、ACAA2基因、HPGD基因、ALDH3A2基因、ENO2基因、ENO3基因、TDO2基因、CPOX基因、ACADL基因和PTPRG基因。
所述基因的表达量可为基因在mRNA水平的表达量。所述基因的表达量可为待测肾透明细胞癌患者肿瘤组织中基因的表达量。
式Ⅱ中,所述平均RT-qPCR检测Ct值可为RT-qPCR检测基因的标准化阈值(Ct值)的平均值。
所述10个基因可分别为人基因组中的CPT2(HGNC ID:HGNC:2330,相关网站https://www.genenames.org,即NCBI Reference Sequence:NM_000098.3(14-AUG-2022))、ACAA2(HGNC ID:HGNC:83,NCBI Reference Sequence:NM_006111.3(01-JUN-2022))、HPGD(HGNC ID:HGNC:5154,NCBI Reference Sequence:NM_000860.6(24-JUL-2022))、ALDH3A2(HGNC ID:HGNC:403,NCBI Reference Sequence:NM_000382.3(14-AUG-2022))、ENO2(HGNC ID:HGNC:3353,NCBI Reference Sequence:NM_001975.3(21-AUG-2022))、ENO3(HGNC ID:HGNC:3354,NCBI Reference Sequence:NM_053013.4(16-SEP-2022))、TDO2(HGNC ID:HGNC:11708,NCBI Reference Sequence:NM_005651.4(14-AUG-2022))、CPOX(HGNC ID:HGNC:2321,NCBI Reference Sequence:NM_000097.7(11-AUG-2022))、ACADL(HGNC ID:HGNC:88,NCBI Reference Sequence:NM_001608.4(14-AUG-2022))和PTPRG(HGNC ID:HGNC:9671,NCBI Reference Sequence:NM_002841.4(02-OCT-2022))。
所述预后结果可为高风险和低风险。所述高风险患者的预后差于所述低风险的预后。所述高风险可为将肾透明细胞癌患者群体的风险分数按照由高到底的顺序排序,待测肾透明细胞癌患者排序为肾透明细胞癌患者群体的风险分数前1/3的样本被划分为高风险,排序为后2/3的样本被划分为低风险。所述高风险和低风险可根据肾透明细胞癌患者群体的样本数量按照1:2的比例划分。
上述计算机可读存储介质中所述预后可为待测肾透明细胞癌患者的总体生存期、疾病特异性生存期和/或无进展生存期。
所述预后具体可为待测肾透明细胞癌患者1年、3年或5年总体生存期。
为了解决上述技术问题,本发明还提供了预测待测肾透明细胞癌患者预后的计算机可读存储介质。所述计算机可读存储介质可为计算机可读存储介质E或计算机可读存储介质F。所述计算机可读存储介质E可使计算机运行如下步骤:
E1)获取待测肾透明细胞癌患者肿瘤组织的10个基因的表达量数据、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据;
E2)预后风险评分计算模块:用于基于式Ⅰ和所述表达量数据计算获得待测肾透明细胞癌患者的预后风险评分;
风险评分=(-0.2219×CPT2基因表达量)+(-0.0416×ACADL基因表达量)+(-0.2152×PTPRG基因表达量)+(0.0897×CPOX基因表达量)+(0.0429×TDO2基因表达量)+-0.0428×HPGD基因表达量)+(0.0104×ENO2基因表达量)+(0.0944×ENO3基因表达量)+(-0.0298×ALDH3A2的基因表达量)+(-0.0536×ACAA2)的基因表达量)式Ⅰ;
E3)预后结果输出模块:用于基于所述预后风险评分、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据输出预后结果。
所述计算机可读存储介质F可使计算机运行如下步骤:
F1)获取待测肾透明细胞癌患者肿瘤组织中10个基因的RNA反转录成cDNA后在进行实时定量聚合酶链反应的标准化阈值数据、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据;
F2)基于式Ⅱ和所述标准化阈值数据计算获得待测肾透明细胞癌患者的预后风险分数;
平均RT-qPCR检测Ct值(ACAA2、ACADL、ALDH3A2、CPT2、HGPD和PTPRG基因)-平均RT-qPCR检测Ct值(CPOX、ENO2、ENO3和TDO2)式Ⅱ;
F3)基于所述预后风险分数、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据输出预后结果;
所述10个基因为人类基因组中的CPT2基因、ACAA2基因、HPGD基因、ALDH3A2基因、ENO2基因、ENO3基因、TDO2基因、CPOX基因、ACADL基因和PTPRG基因。
所述基因的表达量可为基因在mRNA水平的表达量。所述基因的表达量可为待测肾透明细胞癌患者肿瘤组织中基因的表达量。
式Ⅱ中,所述平均RT-qPCR检测Ct值可为RT-qPCR检测基因的标准化阈值(Ct值)的平均值。
所述10个基因可分别为人基因组中的CPT2(HGNC ID:HGNC:2330,相关网站https://www.genenames.org,即NCBI Reference Sequence:NM_000098.3(14-AUG-2022))、ACAA2(HGNC ID:HGNC:83,NCBI Reference Sequence:NM_006111.3(01-JUN-2022))、HPGD(HGNC ID:HGNC:5154,NCBI Reference Sequence:NM_000860.6(24-JUL-2022))、ALDH3A2(HGNC ID:HGNC:403,NCBI Reference Sequence:NM_000382.3(14-AUG-2022))、ENO2(HGNC ID:HGNC:3353,NCBI Reference Sequence:NM_001975.3(21-AUG-2022))、ENO3(HGNC ID:HGNC:3354,NCBI Reference Sequence:NM_053013.4(16-SEP-2022))、TDO2(HGNC ID:HGNC:11708,NCBI Reference Sequence:NM_005651.4(14-AUG-2022))、CPOX(HGNC ID:HGNC:2321,NCBI Reference Sequence:NM_000097.7(11-AUG-2022))、ACADL(HGNC ID:HGNC:88,NCBI Reference Sequence:NM_001608.4(14-AUG-2022))和PTPRG(HGNC ID:HGNC:9671,NCBI Reference Sequence:NM_002841.4(02-OCT-2022))。
上述计算机可读存储介质中,所述临床数据可为待测肾透明细胞癌患者的AJCC分期和/或肿瘤分级。
所述预后结果可为高风险和低风险。所述高风险患者的预后差于所述低风险的预后。所述高风险可为将肾透明细胞癌患者群体的风险分数按照由高到底的顺序排序,待测肾透明细胞癌患者排序为肾透明细胞癌患者群体的风险分数前1/3的样本、待测肾透明细胞癌患者年龄大于等于60岁、AJCC分期为3或4期、且肿瘤分级为3或4级的待测肾透明细胞癌患者被划分为高风险;所述高风险可为将肾透明细胞癌患者群体的风险分数按照由高到底的顺序排序,待测肾透明细胞癌患者排序为肾透明细胞癌患者群体的风险分数后2/3的样本、待测肾透明细胞癌患者年龄小于60岁、AJCC分期为1或2期、且肿瘤分级为1或2级的待测肾透明细胞癌患者被划分为低风险。
上述计算机可读存储介质中,所述预后可为待测肾透明细胞癌患者的总体生存期、疾病特异性生存期和/或无进展生存期。
所述预后具体可为待测肾透明细胞癌患者1年、3年或5年总体生存期。
本发明首先阐明了脂肪酸代谢异常在肾透明细胞癌患者中的重要价值,并结合多种方法建立了一个新型脂肪酸代谢基因预后模型。重要的是,本发明在独立的肾透明细胞癌队列和临床队列中成功验证了其对于预后的预测价值。最后,利用脂肪酸代谢基因模型和临床病理特征,本发明构建并验证了一个列线图,提高了预测能力并且便于临床应用。
本发明旨在探讨脂肪酸代谢异常在肾透明细胞癌中的作用,并构建了一个新的脂肪酸代谢相关基因基因模型以用于预后诊断。应用三个彼此独立的肾透明细胞癌队列,包括TCGA数据库队列,EMTAB队列和本发明研究中心的临床队列(包括RNA-seq,microarray和RT-qPCR数据)作为训练和两个独立的验证集。首先,本发明发现脂肪酸代谢水平在肾透明细胞癌中明显下降并与癌症的恶性程度相关,证实了脂肪酸代谢在肾透明细胞癌中的关键作用。应用LASSO和cox回归,本发明建立了一个新的总生存率的脂肪酸代谢基因模型(FAMGS)。脂肪酸代谢基因模型在训练队列中将患者分为低风险或高风险组,并在EMTAB队列和本发明的临床验证队列中得到成功验证。此外,通过多因素cox回归证实脂肪酸代谢基因模型是肾透明细胞癌的一个独立风险因素。ImmuCellAI算法和基因组变异分析的结果显示,高风险组的患者相较于低风险组,存在多个途径的代谢障碍,包括脂质、氨基酸和三羧酸循环相关途径,以及免疫抑制性肿瘤微环境。综上,本发明的研究构建并验证了一个全新的脂肪酸代谢基因模型,它可以改善肾透明细胞癌患者的风险分层优化和个性化管理。
本发明证实了脂肪酸代谢异常是肾透明细胞癌患者不良预后的主要危险因素之一。接下来,结合单变量Cox和LASSO回归建立总体生存期(OS)的脂肪酸代谢基因模型(FAMGS)。随后,本发明评估了验证队列中脂肪酸代谢基因模型的预后价值。此外,在训练队列和两个独立验证队列中进行了临床模型的分层分析。功能富集和免疫细胞分析被用于进一步探索该基因模型的潜在分子机制和免疫相关性。随后,本发明总结了一个肾透明细胞癌中脂肪酸代谢的潜在机制图。最后,本发明分别在TCGA训练队列和EMTAB验证队列中构造并验证了基于脂肪酸代谢基因模型的列线图。
附图说明
图1为肾透明细胞癌患者脂肪酸代谢途径的临床相关性。蜂群图比较了正常、肿瘤组织(A、B)和不同肿瘤分级(D)、AJCC分期(E)和性别(F)的单样本基因集富集分析得分。(C)Kaplan–Meier分析表明,脂肪酸代谢ssGSEA评分较低的患者表现出较差的总体生存率。HR:危险比;CI:置信区间。p值小于0.05被认为具有统计学意义。ns:无显著性;***p<0.001。
图2为脂肪酸代谢相关预后模型的构建和验证。TCGA队列中总体生存率(A)、DSS(E)和PFS(G)的Kaplan-Meier生存曲线。TCGA队列中总体生存率、DSS和PFS的1-(B)、3-(F)和5-(H)年依赖性ROC曲线。EMTAB(C)和临床队列(J)中总体生存率的Kaplan–Meier生存曲线。(D)EMTAB队列中总体生存率的1年、3年和5年依赖性ROC曲线。(一)柱状图显示了通过RT-PCR在21个肾透明细胞癌样本和成对的相邻正常样本中评估的10个基因在FAMG中的表达。蜂群图比较了不同肿瘤分级(K)、AJCC分期(L)和性别(M)的FAMGS风险评分。总体生存率:OS;DSS:疾病特异性生存率;PFS:无进展生存;TCGA:癌症基因组图谱;EMTAB:E-MTAB-1980;ROC:受试者操作特征曲线;FAMGS:脂肪酸代谢基因模型;RT-PCR:逆转录聚合酶链反应;HR:危险比;CI:置信区间。p值小于0.05被认为具有统计学意义。ns:无显著性;**p<0.01,***p<0.001。
图3为肾透明细胞癌的脂肪酸代谢机制图。FAM:脂肪酸代谢;肾透明细胞癌。
图4为肾透明细胞癌患者总体生存率列线图的构建和验证。(A)预测肾透明细胞癌患者1年、3年和5年总体生存期概率的列线图。TCGA训练队列(B)和EMTAB验证队列(F)中列线图、FAMG、年龄、肿瘤分级和AJCC分期的时间依赖性ROC曲线。预测TCGA训练队列(C-E)和EMTAB验证队列(G-I)中1年、3年和5年总体生存概率的列线图校准图。
图5为蜂群图、LASSO模型构建、KM曲线和ROC曲线。(A)蜂群图比较了ssGSEA年龄得分。(B,C)LASSO-Cox回归模型用于识别最稳健的模型,最佳λ值为0.0617。(D)脂肪酸代谢相关基因特征的LASSO系数分布。(E)TCGA队列中DFI的Kaplan–Meier生存曲线。(F)TCGA队列中DFI的1年、3年和5年时间依赖性ROC曲线。ssGSEA:单样本基因集富集分析;DFI:无病间期;TCGA:癌症基因组图谱;ROC:受试者操作特征曲线;HR:危险比;CI:置信区间。p值小于0.05被认为具有统计学意义。
图6为脂肪酸代谢基因模型的分层分析。蜂群图比较了TCGA训练队列(A)和EMTAB验证队列(E)中年龄段的FAMGS风险评分。蜂群图比较了TCGA训练队列(B-D)和EMTAB验证队列(F-H)中不同肿瘤分级、AJCC分期和性别的FAMGS风险评分。FAMGS:脂肪酸代谢基因模型;TCGA:癌症基因组图谱;EMTAB:E-MTAB-1980;美国癌症联合委员会。p值小于0.05被认为具有统计学意义。ns:无显著性;*p<0.05,***p<0.001。
图7为ROC和DCA曲线。TCGA训练队列(A-C)和EMTAB验证队列(D-F)中列线图预测的1年、3年和5年总体生存率的ROC曲线。在TCGA训练队列(G-I)和EMTAB验证队列(J-L)中,预测1年、3年和5年总体生存率概率的列线图、FAMG和临床特征的DCA图。ROC:接收机工作特性;DCA:决策曲线分析;TCGA:癌症基因组图谱;EMTAB:E-MTAB-1980;FAMGS:脂肪酸代谢基因模型。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
本发明实施例中生物信息学和统计分析方法如下:
R统计软件(版本4.1.2)用于处理数据。本发明根据R包“survival”测量的最佳临界风险评分,将TCGA训练队列中的患者分为低风险组和高风险组,其余验证队列按训练队列的高低分线组比例分配。采用R包“survival”进行单变量和多变量cox分析。R包“survivalROC”用于评估Kaplan-Meier(K-M)曲线和时间依赖性接受者操作特征曲线的预后作用。使用R包“glmnet”进行LASSO回归分析。此外,根据不同亚组的临床模型进行分层分析。运用基因集文件(msigdb.v7.4.entrez.gmt)进行基因集变异分析,使用脂肪酸代谢基因模型风险评分来探索潜在的生物学功能。使用网页工具ImmuCellAI分析每个患者的肿瘤免疫状态。R包“pheatmap”用于生成相关热图。R包“rms”用于绘制列线图和校准曲线。R包“ggDCA”进行决策曲线分析,以衡量列线图与其他指标的临床效益。分类变量表示为计数(百分比),而连续变量表示为四分位数范围的中值。Kruskal-Wallis和Wilcoxon检验用于分析各组之间的差异。本发明认为p<0.05具有统计学意义。
实施例1、预测肾透明细胞癌预后的新型脂肪酸代谢相关基因模型的建立和验证
1.数据来源和处理
从TCGA数据库获得的530名肾透明细胞癌患者的RNA二代测序数据(下载网址:https://portal.gdc.cancer.gov)被用作训练队列。从ArrayExpress数据库获得的101名肾透明细胞癌患者的基因芯片测序数据的E-MTAB-1980(EMTAB)队列(下载网址:https://www.ebi.ac.uk/arrayexpress/experiments/E-MTAB-1980/)用作外部验证队列。在本发明研究中心的临床队列中,使用以下标准选择21对肾透明细胞癌和相邻正常样本:(1)在北京朝阳医院接受手术治疗的患者;(2)没有接受任何新辅助化疗和其他特殊治疗的患者;(3)患者在北京朝阳医院进行的是首次癌症手术。两名病理医生确定了样本的最终诊断。此外,从GEO数据库获取的队列GSE73731用作亚组分析(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE73731)。TCGA队列、EMTAB队列和临床队列的临床队列数据如表1所示。
表1.TCGA训练队列、EMTAB验证队列和朝阳临床验证队列中患者的临床特征
TCGA训练队列中位总体生存时间为1181(520-1912)天,其中357(67.36%)例死亡;EMTAB验证队列包含101名患者,他们的中位总体生存时间为1530(1020-2430)天,死亡23(22.77%)例;在临床验证队列(临床队列)中,中位总体生存时间为848(712-916)天,死亡18(85.71%)例。此外,本发明收集了临床队列所有患者的临床病理数据,包括年龄、性别、肿瘤分级和AJCC分期数据。
2.脂肪酸代谢为肾透明细胞癌的关键因素
为了确定脂肪酸代谢异常在肾透明细胞癌中的作用,本发明从GSEA数据库v7.4(https://www.gsea-msigdb.org/gsea/index.jsp)中提取了包含158个基因的脂肪酸代谢相关基因集(HALLMARK_FATTY_ACID_METABOLISM)。单样本基因集富集分析用于计算训练队列中脂肪酸代谢相关基因集的富集分数。首先,在TCGA训练队列中,对530个癌(肿瘤)组织样本和72个癌旁正常组织样本计算了脂肪酸代谢途径的单样本基因集富集分析富集分数。结果显示,与肾正常组织相比,配对和非配对肿瘤组织的脂肪酸代谢富集分数均显著降低(p<0.0001;图1中A和B)。
然后,本发明使用单样本基因集富集分析的富集评分的中位数将肿瘤样本分为两组。蜂群图结果表明,具有不同临床特征(包括肿瘤分级(图1中D)、AJCC分期和状态(图1中E)、性别(图1中F))的患者具有显著不同的单样本基因集富集分析富集分数(p<0.001;图1中D-F),但不同年龄的患者没有显著差异(p=0.33;图5中A)。更值得注意的是,K-M生存分析表明,与较高的脂肪酸代谢富集分数(图1中C的高评分代表)相比,较低的脂肪酸代谢富集分数患者(图1中C的低评分代表)具有较差的风险比[HR;95%置信区间(CI)]=2.41(1.76-3.29),p<0.0001(图1中C)。
因此,脂肪酸代谢异常是肾透明细胞癌患者不良预后的主要危险因素之一。
3.预测肾透明细胞癌预后的新型脂肪酸代谢相关基因模型(FAMGS)的建立和验证
本发明结合单变量Cox和LASSO回归建立总体生存期(OS)的脂肪酸代谢基因模型(FAMGS模型)。然后评估了验证队列中FAMGS模型的预后价值;此外,还在训练队列和两个独立验证队列(EMTAB队列和临床队列)中进行了临床模型的分层分析。
3.1候选基因选择和模型建立
单变量Cox比例风险回归分析用于识别训练队列中p<0.05的预后基因。然后,LASSO和比例风险回归模型(COX)回归分析进一步确定最佳脂肪酸代谢基因模型。通过使用LASSO回归系数和基因的标准化表达水平推导出模型的风险评分公式:
脂肪酸代谢基因模型风险评分=Σ系数ni(mRNAi)×表达量(mRNAi)。
根据单变量Cox分析,确定了88个候选脂肪酸代谢相关预后基因(p<0.05)。随后,采用单变量Cox比例风险回归分析筛选肾透明细胞癌的预后基因。根据十倍交叉验证的结果,选择λ值为0.0501的模型来克服过度拟合(图5中B和C)。最后,使用LASSO-Cox算法整合10个基因以建立脂肪酸代谢基因模型FAMGS。
其中的10个基因分别为人基因组中的CPT2(HGNC ID:HGNC:2330,相关网站https://www.genenames.org,即NCBI Reference Sequence:NM_000098.3(14-AUG-2022))、ACAA2(HGNC ID:HGNC:83,NCBI Reference Sequence:NM_006111.3(01-JUN-2022))、HPGD(HGNC ID:HGNC:5154,NCBI Reference Sequence:NM_000860.6(24-JUL-2022))、ALDH3A2(HGNC ID:HGNC:403,NCBI Reference Sequence:NM_000382.3(14-AUG-2022))、ENO2(HGNC ID:HGNC:3353,NCBI Reference Sequence:NM_001975.3(21-AUG-2022))、ENO3(HGNC ID:HGNC:3354,NCBI Reference Sequence:NM_053013.4(16-SEP-2022))、TDO2(HGNC ID:HGNC:11708,NCBI Reference Sequence:NM_005651.4(14-AUG-2022))、CPOX(HGNC ID:HGNC:2321,NCBI Reference Sequence:NM_000097.7(11-AUG-2022))、ACADL(HGNC ID:HGNC:88,NCBI Reference Sequence:NM_001608.4(14-AUG-2022))和PTPRG(HGNC ID:HGNC:9671,NCBI Reference Sequence:NM_002841.4(02-OCT-2022))。
FAMGS模型中每个患者的风险评分计算公式如下:
风险评分=(-0.2219×CPT2基因表达量)+(-0.0416×ACADL基因表达量)+(-0.2152×PTPRG基因表达量)+(0.0897×CPOX基因表达量)+(0.0429×TDO2基因表达量)+-0.0428×HPGD基因表达量)+(0.0104×ENO2基因表达量)+(0.0944×ENO3基因表达量)+(-0.0298×ALDH3A2的基因表达量)+(-0.0536×ACAA2)的基因表达量)式Ⅰ。
式Ⅰ中基因的表达量为肿瘤组织中的基因在mRNA水平的表达量。
脂肪酸代谢基因模型的LASSO回归得到的系数如图5中D所示。
3.2风险分组
根据脂肪酸代谢基因模型风险评分,将每一个队列样本的风险评分按照由高到底的顺序排序,排序为前1/3的样本被划分为高风险,排序为后2/3的样本被划分为低风险,即高风险和低风险根据每一个队列的样本数量按照1:2的比例划分。
K-M生存图显示,在TCGA训练队列中,脂肪酸代谢基因模型风险评分较高的患者(图2中高风险组代表)与风险评分较低的患者(图2中低风险组代表)相比,表现出较差的总体生存期、疾病特异性生存期和无进展生存期(HR=3.82,95%CI=2.82-5.18,p<0.0001;HR=5.97,95%CI=3.63-9.81,p<0.0001;HR=3.52,95%CI=2.48-4.99,p<0.0001;图2中A、E和G)。随后在EMTAB验证队列(HR=4.27,95%CI=1.81-10.07,p=0.00032;图2中C)和临床验证队列(HR=10.54,95%CI=1.067-104.2,p=0.044;图2中J)中验证脂肪酸代谢基因模型对总体生存期的预后价值,结果均显示风险评分较高的患者与风险评分较低的患者相比,表现出较差的总体生存期。
3.3 FAMGS模型中基因的差异表达检测
为了研究肿瘤组织和正常组织中的差异表达,采用实时定量聚合酶链反应(RT-qPCR)分析了临床验证队列中样本的21对肾透明细胞癌和相邻正常组织中10个脂肪酸代谢基因模型基因的表达。结果显示以下基因显著下调:CPT2、ACAA2、HPGD和ALDH3A2,而ENO2、TDO2、CPOX、ACADL和PTPRG在肿瘤组织中的表达显著上调(p<0.01;图2中I)。
临床队列的定量RT-qPCR实验方法和风险分数计算方法如下:
提取临床队列样本患者肿瘤组织的总RNA,使用HiScript III RT SuperMix试剂盒(R32301,Vazyme,中国)将总RNA反向转录为cDNA。通过ABI 7500(美国加利福尼亚州福斯特市应用生物系统公司)使用AceQ qPCR SYBR Green Master混合物(R323-01,Vazyme,中国)和表2中的引物,以cDNA为模板进行RT-qPCR测定FAMGS模型中10个基因(ACAA2、ACADL、ALDH3A2、CPT2、HGPD、PTPRG、CPOX、ENO2、ENO3和TDO2)在进行RT-qPCR实验的标准化阈值(Ct)。根据FAMGS模型,使用基于以下公式的标准化阈值(Ct)计算临床队列中每个肾透明细胞癌患者预后的风险分数:
平均RT-qPCR检测Ct值(ACAA2、ACADL、ALDH3A2、CPT2、HGPD和PTPRG基因)-平均RT-qPCR检测Ct值(CPOX、ENO2、ENO3和TDO2)式Ⅱ。
式Ⅱ中,平均RT-qPCR检测Ct值为RT-qPCR检测基因的Ct值的平均值结果。根据脂肪酸代谢基因模型,将每一个队列样本的风险分数按照由高到底的顺序排序,排序为前1/3的样本被划分为高风险,排序为后2/3的样本被划分为低风险,即高风险和低风险根据每一个队列的样本数量按照1:2的比例划分。
表2.qRT-PCR检测引物列表
3.4模型验证
时间依赖性接受者操作特征曲线分析进一步验证了脂肪酸代谢基因模型的预后价值(图2中B、F和H)。对脂肪酸代谢基因模型的曲线下面积(AUC)进行评估,图2中B显示了TCGA训练队列的1年(AUC=0.763)、3年(AUC=0.736)和5年(AUC=0.749)总体生存期结果;图2中F显示了TCGA训练队列1年(AUC=0.788)、3年(AUC=0.775)和5年(AUC=0.807)疾病特异性生存期结果;图2中H显示了TCGA训练队列1年(AUC=0.712)、3年(AUC=0.736)和5年(AUC=0.766)的无进展生存期结果。此外,本发明验证了EMTAB队列中的AUC包括1年(AUC=0.716)、3年(AUC=0.744)和5年(AUC=0.739)总体生存期结果。上述结果都证明了模型的高预测精度。而TCGA训练队列中无病间期的K-M生存分析(HR=1.09,95%CI=0.39-3.07,p=0.87;图5中E)和时间依赖性接受者操作特征曲线分析(1年AUC=0.571,3年AUC=0.511,5年AUC=0.505;图5中F)显示无差异。
为了确定脂肪酸代谢基因模型的预后价值,本发明进行了分层分析。根据四个临床特征(年龄、性别、肿瘤分级和AJCC分期),将TCGA队列、EMTAB队列和GSE73731队列中的患者分为两组。在三个队列中,脂肪酸代谢基因模型在肿瘤分级(图2中K,图6中B和F)、AJCC分期(图2中L,图6中C和G)和性别(图2中M,图6中D和H)的亚组中对肾透明细胞癌患者保持高度一致的预测能力。同时,年龄分组的结果在TCGA队列(p=0.27;图6中A)和EMTAB队列(p=0.7;图6中E)中未显示出显著差异。
3.5.富集分析和免疫浸润分析
首先,进行基因集变异分析以更好地了解可能影响预后的生物学过程。在TCGA训练队列和EMTAB验证队列中,对每个途径的基因集变异分析得分和脂肪酸代谢基因模型基因进行相关分析。在训练队列中结果显示高水平的脂肪酸代谢基因模型风险评分和风险基因表达与代谢抑制(包括脂肪酸代谢、脂肪酸β氧化、脂质氧化、三羧酸循环和细胞氨基酸代谢过程相关通路)和细胞增殖(包括细胞周期检查点和DNA复制相关通路)显著相关。在EMTAB验证队列中,也得出了类似的结果。
根据ImmuCellAI计算得到24个免疫细胞的浸润水平,然后利用浸润分数、风险评分和基因表达进行相关分析。TCGA训练队列和EMTAB验证队列数据集的结果均表明,风险评分与调节性T细胞和耗竭性T细胞显著正相关,而与主要免疫效应细胞(包括B细胞、中性粒细胞和中央记忆T细胞)呈负相关。根据上述观察,FAMGS模型高风险评分表明肿瘤环境的免疫抑制状态。图3总结并展示了包含脂肪酸代谢相关异常代谢改变和免疫细胞聚集的推测机制图。包括ENO2、ENO3、TDO2和CPOX在内的FAMGS模型中的风险基因在高脂肪酸代谢相关基因评分组中具有高表达水平,并分别促进糖酵解、乙酰辅酶A合成和血红素生物合成,从而导致肿瘤组织中脂肪酸合成和免疫抑制微环境的增加。相反,包括ACAA2、ACADL、CPT2、ALDH3A2和HPGD在内的保护基因在低脂肪酸代谢相关基因评分组中具有高表达水平。脂肪酸的减少是由于α-氧化、β-氧化和脂氧合酶途径中的降解增加。
3.6根据脂肪酸代谢基因模型建立和验证列线图模型
为了研究TCGA训练队列中总体生存期的预后因素,在TCGA训练队列中进行单变量和多变量Cox回归分析。分析得到脂肪酸代谢基因模型(FAMGS模型)和三个临床因素(包括年龄、AJCC分期和肿瘤分级)均被筛选为肾透明细胞癌预后的独立预测因子(p<0.05)(表3)。其中,FAMGS模型预测获得的高风险组肾透明细胞癌患者的预后差于低风险组肾透明细胞癌患者的预后(高风险组与低风险组根据每一个队列的样本数量按照1:2的比例划分);年龄高的肾透明细胞癌患者的预后差于年龄低的肾透明细胞癌患者的预后(年龄高与低的划分阈值为60岁);AJCC分期为3期和4期的肾透明细胞癌患者的预后差于AJCC分期为1期和2期的肾透明细胞癌患者的预后;肿瘤分级为3级和4级的肾透明细胞癌患者的预后差于肿瘤分级为1级和2级的肾透明细胞癌患者的预后。
通过整合四种独立的临床预后因素,本发明构建了一个列线图模型,允许肾透明细胞癌患者评估(图4中A)。如受试者操作特性曲线所示,列线图模型在预测方面比单因素更准确(图4中B)。之后,1年、3年和5年总体生存期的时间依赖性接受者操作特征曲线曲线也表明预测结果更准确(图7中A-C)。此外,一年、三年和五年总体生存期的校准图显示了观测值和列线图模型预测值之间的良好一致性。(图4中C-E)。最后,临床决策曲线表明,本发明的列线图具有广泛的临床实用性(图7中G-I)。
然后,利用EMTAB队列验证列线图的预测能力。进行单变量和多变量Cox回归分析,以验证脂肪酸代谢基因模型的预测能力。结果表明,该列线图模型可独立预测肾透明细胞癌患者的预后。基于训练队列的列线图公式,本发明计算了列线图模型和每个预后预测因子的得分。受试者操作特性曲线显示,开发的列线图模型仍然具有良好的预测性能(图4中F)。此外,在总体生存期的1年、3年和5年校准曲线的结果中发现了良好的一致性(图4中G-I)。此外,1、3、5年生存期的时间依赖性接受者操作特征曲线(图7中D-F)和预测1、3和5年生存率的DCA曲线(图中J-L)表明,列线图模型显示出比其他独立预测因子更好的性能。
表3.预测TCGA训练队列和EMTAB验证队列中总体生存率的单变量和多变量Cox回归分析
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
Claims (10)
1.预测待测肾透明细胞癌患者预后的装置,其特征在于:所述装置为装置M或装置N,所述装置M包括如下模块:
M1)基因表达量获取模块:用于获取待测肾透明细胞癌患者肿瘤组织中的10个基因的表达量数据;
M2)预后风险评分计算模块:用于基于式Ⅰ和所述表达量数据计算获得待测肾透明细胞癌患者的预后风险评分;
风险评分=(-0.2219×CPT2基因表达量)+(-0.0416×ACADL基因表达量)+(-0.2152×PTPRG基因表达量)+(0.0897×CPOX基因表达量)+(0.0429×TDO2基因表达量)+-0.0428×HPGD基因表达量)+(0.0104×ENO2基因表达量)+(0.0944×ENO3基因表达量)+(-0.0298×ALDH3A2的基因表达量)+(-0.0536×ACAA2)的基因表达量)式Ⅰ;
M3)预后结果输出模块:用于基于所述预后风险评分输出待测肾透明细胞癌患者的预后结果;
所述装置N包括如下模块:
N1)基因数据获取模块:用于获取待测肾透明细胞癌患者肿瘤组织中10个基因的RNA反转录成cDNA后在进行实时定量聚合酶链反应的标准化阈值数据;
N2)预后风险分数计算模块:用于基于式Ⅱ和所述标准化阈值数据计算获得待测肾透明细胞癌患者的预后风险分数;
平均RT-qPCR检测Ct值(ACAA2、ACADL、ALDH3A2、CPT2、HGPD和PTPRG基因)-平均RT-qPCR检测Ct值(CPOX、ENO2、ENO3和TDO2)式Ⅱ;
N3)预后结果输出模块:用于基于所述预后风险分数输出待测肾透明细胞癌患者的预后结果;
所述10个基因为人类基因组中的CPT2基因、ACAA2基因、HPGD基因、ALDH3A2基因、ENO2基因、ENO3基因、TDO2基因、CPOX基因、ACADL基因和PTPRG基因。
2.根据权利要求1所述的装置,其特征在于:所述预后为待测肾透明细胞癌患者的总体生存期、疾病特异性生存期和/或无进展生存期。
3.预测待测肾透明细胞癌患者预后的装置,其特征在于:所述装置为装置A或装置B;所述装置A包括如下模块:
A1)数据获取模块:用于获取待测肾透明细胞癌患者肿瘤组织的10个基因的表达量数据、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据;
A2)预后风险评分计算模块:用于基于式Ⅰ和所述表达量数据计算获得待测肾透明细胞癌患者的预后风险评分;
风险评分=(-0.2219×CPT2基因表达量)+(-0.0416×ACADL基因表达量)+(-0.2152×PTPRG基因表达量)+(0.0897×CPOX基因表达量)+(0.0429×TDO2基因表达量)+-0.0428×HPGD基因表达量)+(0.0104×ENO2基因表达量)+(0.0944×ENO3基因表达量)+(-0.0298×ALDH3A2的基因表达量)+(-0.0536×ACAA2)的基因表达量)式Ⅰ;
A3)预后结果输出模块:用于基于所述预后风险评分、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据输出预后结果;
所述装置B包括如下模块:
B1)基因数据获取模块:用于获取待测肾透明细胞癌患者肿瘤组织中10个基因的RNA反转录成cDNA后在进行实时定量聚合酶链反应的标准化阈值数据、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据;
B2)预后风险分数计算模块:用于基于式Ⅱ和所述标准化阈值数据计算获得待测肾透明细胞癌患者的预后风险分数;
平均RT-qPCR检测Ct值(ACAA2、ACADL、ALDH3A2、CPT2、HGPD和PTPRG基因)-平均RT-qPCR检测Ct值(CPOX、ENO2、ENO3和TDO2)式Ⅱ;
B3)预后结果输出模块:用于基于所述预后风险分数、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据输出预后结果;
所述10个基因为人类基因组中的CPT2基因、ACAA2基因、HPGD基因、ALDH3A2基因、ENO2基因、ENO3基因、TDO2基因、CPOX基因、ACADL基因和PTPRG基因。
4.根据权利要求3所述的装置,其特征在于:所述临床数据为待测肾透明细胞癌患者的AJCC分期和/或肿瘤分级。
5.根据权利要求3或4所述的装置,其特征在于:所述预后为待测肾透明细胞癌患者的总体生存期、疾病特异性生存期和/或无进展生存期。
6.预测待测肾透明细胞癌患者预后的计算机可读存储介质,其特征在于:所述计算机可读存储介质为计算机可读存储介质C或计算机可读存储介质D;所述计算机可读存储介质C使计算机运行如下步骤:
C1)获取待测肾透明细胞癌患者肿瘤组织中的10个基因的表达量数据;
C2)基于式Ⅰ和所述表达量数据计算获得待测肾透明细胞癌患者的预后风险评分;
风险评分=(-0.2219×CPT2基因表达量)+(-0.0416×ACADL基因表达量)+(-0.2152×PTPRG基因表达量)+(0.0897×CPOX基因表达量)+(0.0429×TDO2基因表达量)+-0.0428×HPGD基因表达量)+(0.0104×ENO2基因表达量)+(0.0944×ENO3基因表达量)+(-0.0298×ALDH3A2的基因表达量)+(-0.0536×ACAA2)的基因表达量)式Ⅰ;
C3)基于所述预后风险评分输出待测肾透明细胞癌患者的预后结果;
所述计算机可读存储介质D使计算机运行如下步骤:
D1)获取待测肾透明细胞癌患者肿瘤组织中10个基因的RNA反转录成cDNA后在进行实时定量聚合酶链反应的标准化阈值数据;
D2)基于式Ⅱ和所述标准化阈值数据计算获得待测肾透明细胞癌患者的预后风险分数;
平均RT-qPCR检测Ct值(ACAA2、ACADL、ALDH3A2、CPT2、HGPD和PTPRG基因)-平均RT-qPCR检测Ct值(CPOX、ENO2、ENO3和TDO2)式Ⅱ;
D3)基于所述预后风险分数输出待测肾透明细胞癌患者的预后结果;
所述10个基因为人类基因组中的CPT2基因、ACAA2基因、HPGD基因、ALDH3A2基因、ENO2基因、ENO3基因、TDO2基因、CPOX基因、ACADL基因和PTPRG基因。
7.根据权利要求6所述的计算机可读存储介质,其特征在于:所述预后为待测肾透明细胞癌患者的总体生存期、疾病特异性生存期和/或无进展生存期。
8.预测待测肾透明细胞癌患者预后的计算机可读存储介质,其特征在于:所述计算机可读存储介质为计算机可读存储介质E或计算机可读存储介质F;所述计算机可读存储介质E使计算机运行如下步骤:
E1)获取待测肾透明细胞癌患者肿瘤组织的10个基因的表达量数据、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据;
E2)预后风险评分计算模块:用于基于式Ⅰ和所述表达量数据计算获得待测肾透明细胞癌患者的预后风险评分;
风险评分=(-0.2219×CPT2基因表达量)+(-0.0416×ACADL基因表达量)+(-0.2152×PTPRG基因表达量)+(0.0897×CPOX基因表达量)+(0.0429×TDO2基因表达量)+-0.0428×HPGD基因表达量)+(0.0104×ENO2基因表达量)+(0.0944×ENO3基因表达量)+(-0.0298×ALDH3A2的基因表达量)+(-0.0536×ACAA2)的基因表达量)式Ⅰ;
E3)预后结果输出模块:用于基于所述预后风险评分、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据输出预后结果;
所述计算机可读存储介质F使计算机运行如下步骤:
F1)获取待测肾透明细胞癌患者肿瘤组织中10个基因的RNA反转录成cDNA后在进行实时定量聚合酶链反应的标准化阈值数据、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据;
F2)基于式Ⅱ和所述标准化阈值数据计算获得待测肾透明细胞癌患者的预后风险分数;
平均RT-qPCR检测Ct值(ACAA2、ACADL、ALDH3A2、CPT2、HGPD和PTPRG基因)-平均RT-qPCR检测Ct值(CPOX、ENO2、ENO3和TDO2)式Ⅱ;
F3)基于所述预后风险分数、待测肾透明细胞癌患者的年龄和待测肾透明细胞癌患者的临床数据输出预后结果;
所述10个基因为人类基因组中的CPT2基因、ACAA2基因、HPGD基因、ALDH3A2基因、ENO2基因、ENO3基因、TDO2基因、CPOX基因、ACADL基因和PTPRG基因。
9.根据权利要求8所述的计算机可读存储介质,其特征在于:所述临床数据为待测肾透明细胞癌患者的AJCC分期和/或肿瘤分级。
10.根据权利要求8或9所述的计算机可读存储介质,其特征在于:所述预后为待测肾透明细胞癌患者的总体生存期、疾病特异性生存期和/或无进展生存期。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211221442.XA CN115798703A (zh) | 2022-10-08 | 2022-10-08 | 基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211221442.XA CN115798703A (zh) | 2022-10-08 | 2022-10-08 | 基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115798703A true CN115798703A (zh) | 2023-03-14 |
Family
ID=85432573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211221442.XA Pending CN115798703A (zh) | 2022-10-08 | 2022-10-08 | 基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115798703A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117238369A (zh) * | 2023-09-19 | 2023-12-15 | 华中科技大学同济医学院附属同济医院 | 一种基于去透明细胞分化相关基因的肾透明细胞癌患者预后及药物敏感性评估模型 |
-
2022
- 2022-10-08 CN CN202211221442.XA patent/CN115798703A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117238369A (zh) * | 2023-09-19 | 2023-12-15 | 华中科技大学同济医学院附属同济医院 | 一种基于去透明细胞分化相关基因的肾透明细胞癌患者预后及药物敏感性评估模型 |
CN117238369B (zh) * | 2023-09-19 | 2024-04-09 | 华中科技大学同济医学院附属同济医院 | 一种基于去透明细胞分化相关基因的肾透明细胞癌患者预后及药物敏感性评估模型 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liang et al. | A lncRNA signature associated with tumor immune heterogeneity predicts distant metastasis in locoregionally advanced nasopharyngeal carcinoma | |
CN111394456B (zh) | 早期肺腺癌患者预后评估系统及其应用 | |
Gantt et al. | Gene expression profile is associated with chemoradiation resistance in rectal cancer | |
JP2015536667A (ja) | 癌のための分子診断検査 | |
US20090239229A1 (en) | DNA Repair Proteins Associated With Triple Negative Breast Cancers and Methods of Use Thereof | |
JP2017506506A (ja) | 抗血管新生薬への応答およびがんの予後の予測のための分子診断試験 | |
Chen et al. | A co-expression network for differentially expressed genes in bladder cancer and a risk score model for predicting survival | |
Zhang et al. | An immune-related gene pairs signature predicts overall survival in serous ovarian carcinoma | |
JP2015535176A (ja) | 肝細胞癌における全生存期間および無再発生存期間の新規な予測方法 | |
Guo et al. | Mining TCGA data for key biomarkers related to immune microenvironment in endometrial cancer by immune score and weighted correlation network analysis | |
CN113066585A (zh) | 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法 | |
Liu et al. | Using mRNAsi to identify prognostic-related genes in endometrial carcinoma based on WGCNA | |
Shang et al. | Identification of lung adenocarcinoma specific dysregulated genes with diagnostic and prognostic value across 27 TCGA cancer types | |
Topno et al. | Integrated bioinformatic analysis identifies UBE2Q1 as a potential prognostic marker for high grade serous ovarian cancer | |
Huang et al. | Phosphoglucose isomerase gene expression as a prognostic biomarker of gastric cancer | |
Zhao et al. | Construction and verification of a hypoxia-related 4-lncRNA model for prediction of breast cancer | |
CN117747098A (zh) | 用于前列腺癌rp后bcr预测的模型、其构建方法和应用 | |
Kong et al. | Identification of cuproptosis-related lncRNA for predicting prognosis and immunotherapeutic response in cervical cancer | |
Geva et al. | Urine cell-free microRNA as biomarkers for transitional cell carcinoma | |
Wang et al. | Single cell sequencing analysis and transcriptome analysis constructed the liquid-liquid phase separation (LLPS)-related prognostic model for endometrial cancer | |
CN115798703A (zh) | 基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质 | |
CN115472217A (zh) | 用于预测胰腺癌患者预后系统 | |
Wang et al. | A Novel Four‐Gene Prognostic Signature as a Risk Biomarker in Cervical Cancer | |
CN111763740B (zh) | 基于lncRNA分子模型预测食管鳞癌患者新辅助放化疗的疗效和预后的系统 | |
Zhong et al. | Overexpression of MAL2 correlates with immune infiltration and poor prognosis in breast cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |