CN117409855B - 一种肝细胞癌患者错配修复相关预后模型及其构建、验证方法和应用 - Google Patents
一种肝细胞癌患者错配修复相关预后模型及其构建、验证方法和应用 Download PDFInfo
- Publication number
- CN117409855B CN117409855B CN202311392146.0A CN202311392146A CN117409855B CN 117409855 B CN117409855 B CN 117409855B CN 202311392146 A CN202311392146 A CN 202311392146A CN 117409855 B CN117409855 B CN 117409855B
- Authority
- CN
- China
- Prior art keywords
- mismatch repair
- risk
- model
- genes
- immune
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000033607 mismatch repair Effects 0.000 title claims abstract description 114
- 206010073071 hepatocellular carcinoma Diseases 0.000 title claims abstract description 46
- 238000004393 prognosis Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000010276 construction Methods 0.000 title claims abstract description 12
- 238000012795 verification Methods 0.000 title claims abstract description 11
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 112
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 66
- 201000007270 liver cancer Diseases 0.000 claims abstract description 46
- 208000014018 liver neoplasm Diseases 0.000 claims abstract description 46
- 231100000844 hepatocellular carcinoma Toxicity 0.000 claims abstract description 25
- 201000011510 cancer Diseases 0.000 claims abstract description 20
- 102100032282 26S proteasome non-ATPase regulatory subunit 14 Human genes 0.000 claims abstract description 12
- 101000590281 Homo sapiens 26S proteasome non-ATPase regulatory subunit 14 Proteins 0.000 claims abstract description 12
- 102100036342 Interleukin-1 receptor-associated kinase 1 Human genes 0.000 claims abstract description 12
- 101000995932 Homo sapiens Nucleolar protein 58 Proteins 0.000 claims abstract description 11
- 102100035692 Importin subunit alpha-1 Human genes 0.000 claims abstract description 11
- 102100034532 Nucleolar protein 58 Human genes 0.000 claims abstract description 11
- 108010011989 karyopherin alpha 2 Proteins 0.000 claims abstract description 11
- 102100032412 Basigin Human genes 0.000 claims abstract description 10
- 101000798441 Homo sapiens Basigin Proteins 0.000 claims abstract description 10
- 101001081176 Homo sapiens Hyaluronan mediated motility receptor Proteins 0.000 claims abstract description 10
- 102100027735 Hyaluronan mediated motility receptor Human genes 0.000 claims abstract description 10
- 102100027160 RuvB-like 1 Human genes 0.000 claims abstract description 9
- 101710169742 RuvB-like protein 1 Proteins 0.000 claims abstract description 9
- 101000852483 Homo sapiens Interleukin-1 receptor-associated kinase 1 Proteins 0.000 claims abstract description 8
- 210000005229 liver cell Anatomy 0.000 claims abstract description 6
- 230000037361 pathway Effects 0.000 claims description 52
- 230000014509 gene expression Effects 0.000 claims description 47
- 230000004083 survival effect Effects 0.000 claims description 37
- 238000004458 analytical method Methods 0.000 claims description 33
- 210000002865 immune cell Anatomy 0.000 claims description 22
- 238000009169 immunotherapy Methods 0.000 claims description 16
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 15
- 201000010099 disease Diseases 0.000 claims description 14
- 238000000611 regression analysis Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 9
- 108010074708 B7-H1 Antigen Proteins 0.000 claims description 7
- 102000008096 B7-H1 Antigen Human genes 0.000 claims description 7
- 102000037982 Immune checkpoint proteins Human genes 0.000 claims description 7
- 108091008036 Immune checkpoint proteins Proteins 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000002560 therapeutic procedure Methods 0.000 claims description 7
- 102000033021 YBX1 Human genes 0.000 claims description 5
- 108091002437 YBX1 Proteins 0.000 claims description 5
- 230000000903 blocking effect Effects 0.000 claims description 5
- 230000035515 penetration Effects 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 238000010200 validation analysis Methods 0.000 claims description 5
- 230000029663 wound healing Effects 0.000 claims description 5
- 210000004698 lymphocyte Anatomy 0.000 claims description 4
- 206010061818 Disease progression Diseases 0.000 claims description 3
- 102000008070 Interferon-gamma Human genes 0.000 claims description 3
- 108010074328 Interferon-gamma Proteins 0.000 claims description 3
- 102000004887 Transforming Growth Factor beta Human genes 0.000 claims description 3
- 108090001012 Transforming Growth Factor beta Proteins 0.000 claims description 3
- 230000005750 disease progression Effects 0.000 claims description 3
- 230000002757 inflammatory effect Effects 0.000 claims description 3
- 229960003130 interferon gamma Drugs 0.000 claims description 3
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 claims description 3
- 230000008602 contraction Effects 0.000 claims 1
- 238000011156 evaluation Methods 0.000 abstract description 4
- 238000007405 data analysis Methods 0.000 abstract description 3
- -1 YBX Proteins 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 19
- 102000004169 proteins and genes Human genes 0.000 description 10
- 230000002596 correlated effect Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 230000031018 biological processes and functions Effects 0.000 description 7
- 101000611936 Homo sapiens Programmed cell death protein 1 Proteins 0.000 description 5
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 description 5
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 238000007621 cluster analysis Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000008595 infiltration Effects 0.000 description 5
- 238000001764 infiltration Methods 0.000 description 5
- 210000004881 tumor cell Anatomy 0.000 description 5
- 230000004543 DNA replication Effects 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000004547 gene signature Effects 0.000 description 4
- 230000028993 immune response Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000009545 invasion Effects 0.000 description 4
- 230000035755 proliferation Effects 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 101150044182 8 gene Proteins 0.000 description 3
- MLDQJTXFUGDVEO-UHFFFAOYSA-N BAY-43-9006 Chemical compound C1=NC(C(=O)NC)=CC(OC=2C=CC(NC(=O)NC=3C=C(C(Cl)=CC=3)C(F)(F)F)=CC=2)=C1 MLDQJTXFUGDVEO-UHFFFAOYSA-N 0.000 description 3
- 208000031448 Genomic Instability Diseases 0.000 description 3
- 208000032612 Glial tumor Diseases 0.000 description 3
- 206010018338 Glioma Diseases 0.000 description 3
- 102000014150 Interferons Human genes 0.000 description 3
- 108010050904 Interferons Proteins 0.000 description 3
- 101710199015 Interleukin-1 receptor-associated kinase 1 Proteins 0.000 description 3
- 239000005511 L01XE05 - Sorafenib Substances 0.000 description 3
- 206010027476 Metastases Diseases 0.000 description 3
- 210000001744 T-lymphocyte Anatomy 0.000 description 3
- 230000022131 cell cycle Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000010201 enrichment analysis Methods 0.000 description 3
- 210000003979 eosinophil Anatomy 0.000 description 3
- 230000002440 hepatic effect Effects 0.000 description 3
- 230000001506 immunosuppresive effect Effects 0.000 description 3
- 229940079322 interferon Drugs 0.000 description 3
- 230000009401 metastasis Effects 0.000 description 3
- 210000000440 neutrophil Anatomy 0.000 description 3
- 230000025308 nuclear transport Effects 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 229960003787 sorafenib Drugs 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 108010078791 Carrier Proteins Proteins 0.000 description 2
- 230000005778 DNA damage Effects 0.000 description 2
- 231100000277 DNA damage Toxicity 0.000 description 2
- 102100028843 DNA mismatch repair protein Mlh1 Human genes 0.000 description 2
- 102100034157 DNA mismatch repair protein Msh2 Human genes 0.000 description 2
- 102100021147 DNA mismatch repair protein Msh6 Human genes 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- 101001134036 Homo sapiens DNA mismatch repair protein Msh2 Proteins 0.000 description 2
- 101000968658 Homo sapiens DNA mismatch repair protein Msh6 Proteins 0.000 description 2
- 101001125496 Homo sapiens Pre-mRNA-processing factor 19 Proteins 0.000 description 2
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 2
- 102000037984 Inhibitory immune checkpoint proteins Human genes 0.000 description 2
- 108091008026 Inhibitory immune checkpoint proteins Proteins 0.000 description 2
- 229910015837 MSH2 Inorganic materials 0.000 description 2
- 208000032818 Microsatellite Instability Diseases 0.000 description 2
- 108010074346 Mismatch Repair Endonuclease PMS2 Proteins 0.000 description 2
- 102100037480 Mismatch repair endonuclease PMS2 Human genes 0.000 description 2
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 2
- 108700005081 Overlapping Genes Proteins 0.000 description 2
- 238000010220 Pearson correlation analysis Methods 0.000 description 2
- 102100029522 Pre-mRNA-processing factor 19 Human genes 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 238000013103 analytical ultracentrifugation Methods 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000002443 helper t lymphocyte Anatomy 0.000 description 2
- 230000005746 immune checkpoint blockade Effects 0.000 description 2
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000001024 immunotherapeutic effect Effects 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000004054 inflammatory process Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000036210 malignancy Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000021121 meiosis Effects 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000011278 mitosis Effects 0.000 description 2
- 108091008819 oncoproteins Proteins 0.000 description 2
- 102000027450 oncoproteins Human genes 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 238000010837 poor prognosis Methods 0.000 description 2
- 230000006916 protein interaction Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000005748 tumor development Effects 0.000 description 2
- 230000004614 tumor growth Effects 0.000 description 2
- 230000005751 tumor progression Effects 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 208000022309 Alcoholic Liver disease Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 108091028075 Circular RNA Proteins 0.000 description 1
- 108010060385 Cyclin B1 Proteins 0.000 description 1
- 108010058546 Cyclin D1 Proteins 0.000 description 1
- 102000003909 Cyclin E Human genes 0.000 description 1
- 108090000257 Cyclin E Proteins 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 102100024165 G1/S-specific cyclin-D1 Human genes 0.000 description 1
- 230000020172 G2/M transition checkpoint Effects 0.000 description 1
- 102100032340 G2/mitotic-specific cyclin-B1 Human genes 0.000 description 1
- 102100033067 Growth factor receptor-bound protein 2 Human genes 0.000 description 1
- 101000871017 Homo sapiens Growth factor receptor-bound protein 2 Proteins 0.000 description 1
- 101100233051 Homo sapiens KPNA2 gene Proteins 0.000 description 1
- 101000693993 Homo sapiens Sodium channel protein type 4 subunit alpha Proteins 0.000 description 1
- 101001017904 Homo sapiens U6 snRNA-associated Sm-like protein LSm2 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 206010060378 Hyperinsulinaemia Diseases 0.000 description 1
- 101150046106 IRAK1 gene Proteins 0.000 description 1
- 206010062016 Immunosuppression Diseases 0.000 description 1
- 206010022489 Insulin Resistance Diseases 0.000 description 1
- 101150068669 KPNA2 gene Proteins 0.000 description 1
- 238000010824 Kaplan-Meier survival analysis Methods 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 102100038280 Prostaglandin G/H synthase 2 Human genes 0.000 description 1
- 108050003267 Prostaglandin G/H synthase 2 Proteins 0.000 description 1
- 108091006744 SLC22A1 Proteins 0.000 description 1
- 102100027195 Sodium channel protein type 4 subunit alpha Human genes 0.000 description 1
- 102100032416 Solute carrier family 22 member 1 Human genes 0.000 description 1
- 238000012352 Spearman correlation analysis Methods 0.000 description 1
- 210000004241 Th2 cell Anatomy 0.000 description 1
- 108010078184 Trefoil Factor-3 Proteins 0.000 description 1
- 102100039145 Trefoil factor 3 Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 1
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 238000010317 ablation therapy Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000001348 anti-glioma Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000004709 cell invasion Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000035572 chemosensitivity Effects 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 230000007882 cirrhosis Effects 0.000 description 1
- 208000019425 cirrhosis of liver Diseases 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 230000010102 embolization Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 230000004110 gluconeogenesis Effects 0.000 description 1
- 230000004153 glucose metabolism Effects 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 201000001421 hyperglycemia Diseases 0.000 description 1
- 230000003451 hyperinsulinaemic effect Effects 0.000 description 1
- 201000008980 hyperinsulinism Diseases 0.000 description 1
- 230000006607 hypermethylation Effects 0.000 description 1
- 230000008629 immune suppression Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000006058 immune tolerance Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000002434 immunopotentiative effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 101150044508 key gene Proteins 0.000 description 1
- 230000003908 liver function Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 208000022499 mismatch repair cancer syndrome Diseases 0.000 description 1
- 230000004879 molecular function Effects 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 229920003986 novolac Polymers 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 229960002621 pembrolizumab Drugs 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000032361 posttranscriptional gene silencing Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 208000012584 pre-descemet corneal dystrophy Diseases 0.000 description 1
- 230000004557 prognostic gene signature Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 210000003289 regulatory T cell Anatomy 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000028617 response to DNA damage stimulus Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000002536 stromal cell Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 206010044412 transitional cell carcinoma Diseases 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000005740 tumor formation Effects 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- 238000012315 univariate regression analysis Methods 0.000 description 1
- 230000009790 vascular invasion Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Bioethics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Genetics & Genomics (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于生物医学技术领域,具体涉及一种肝细胞癌患者错配修复相关预后模型及其构建、验证方法和应用。肝细胞癌患者错配修复相关预后模型基于八种错配修复相关基因进行构建,所述八种错配修复相关基因为YBX1、PSMD14、NOP58、RUVBL1、HMMR、KPNA2、BSG和IRAK1。本发明通过全面的基因组数据分析来提高对肝癌预后的预测,构建的错配修复相关预后特征在预测效能方面优于该方向的其他模型。具体来说,错配修复相关预后特征的区分度相较于其他模型高,模型评价指标完善(从区分度和校准度两方面来评价模型的预测效能),模型泛化能力强。
Description
技术领域
本发明属于生物医学技术领域,具体涉及一种肝细胞癌患者错配修复相关预后模型及其构建、验证方法和应用。
背景技术
肝细胞癌(Hepatocellular carcinoma,HCC)是肝脏最常见的原发恶性肿瘤,主要的潜在危险因素是肝硬变,慢性病毒感染(乙肝或丙型肝炎)或酒精性肝病。肝细胞癌患者有多种治疗方案可供选择,包括肝移植、手术切除、经皮消融和放射治疗,以及经动脉和全身治疗。因此,临床决策需要根据患者的肿瘤分期、肝功能和表现状况纵向调整个体化治疗策略。大多数患者将被诊断为早期或中期疾病,并通过手术达到治疗目的,或接受局部消融或使用栓塞术进行动脉定向治疗。尽管近年来取得了重大进展,但肝细胞癌的预后仍然很差。因此,迫切需要寻找新的策略来指导肝细胞癌的诊断和治疗。
错配修复(mismatch repair genes,MMR)作为一种重要的DNA修复机制,是识别和修复在DNA复制或重组过程中,可能产生碱基的错误插入、缺失和错配以及修复某些形式的DNA损伤的系统。MMR是维持基因组稳定性的重要途径,当MMR中的相关基因由于启动子超甲基化或基因突变等原因出现故障,DNA复制错误无法被修复,一些微卫星位点重复单元的重复次数发生波动,进而发生微卫星不稳定(microsatellite instability,MSI),从而触发新抗原的产生,损害肿瘤的生长,针对MMR的免疫治疗可以增加肿瘤细胞中新抗原的负担。MSI被认为是以免疫治疗为基础的策略的敏感性和耐药性的重要预测指标,其检测对于肿瘤的早期诊断、预后判断、化疗敏感性判断以及高危人群的圈定等具有重要意义。针对基因组不稳定性的不同方法已被证明在来自不同组织的恶性肿瘤中是有前景的,潜在的MMR缺陷相关的免疫原性对于提高免疫治疗的疗效是重要的,MMR是维持基因组稳定性的重要途径。
有研究表明,错配修复(MMR)与免疫检查点阻断(ICB)治疗的疗效有关,MMR检测可用于指导用药方案及预测疾病预后,以dMMR作为免疫治疗疗效评价的生物标志物,可筛选出能从免疫检查点抑制剂治疗中获益的人群。
基于上述研究现状,本发明的目的是构建一个新的基于错配修复相关特征来预测HCC患者的总生存期,并探索风险系数在免疫治疗方向的可能性。
发明内容
本发明的目的是提供一种肝细胞癌患者错配修复相关预后模型及其构建、验证方法和应用,通过全面的基因组数据分析来提高对肝癌预后的预测,构建的错配修复相关预后特征在预测效能方面优于该方向的其他模型。
为实现上述目的,本发明提供了如下方案:
本发明提供一种肝细胞癌患者错配修复相关预后模型,肝细胞癌患者错配修复相关预后模型基于八种错配修复相关基因进行构建,所述八种错配修复相关基因为YBX1、PSMD14、NOP58、RUVBL1、HMMR、KPNA2、BSG和IRAK1。
本发明还提供了一种肝细胞癌患者错配修复相关预后模型的构建方法,包括以下步骤:
(1)从癌症基因组图谱和国际癌症基因组联盟中收集构建肝细胞癌患者错配修复相关预后模型的训练集和验证集;
(2)从GeneCards数据库搜集相关性分数≥0.3错配修复相关基因进行单因素COX回归和KM分析,对基因集进行初步筛选获得初步hub基因集;
(3)基于所选MMR相关基因的表达水平的线性积分,建立最优的MMR相关风险特征,风险评分计算如下:
其中,EXPI为错配修复通路相关基因的表达值,CoefI为LASSO Cox回归分析中与错配修复通路相关基因相应回归系数。
进一步的,在步骤(2)中,所述单因素COX回归和KM分析选择P值小于0.05用于最小绝对收缩和选择算子COX回归和多变量COX比例风险回归分析。
本发明还提供了一种肝细胞癌患者错配修复相关预后模型的验证方法,包括以下内容:
(1)利用ROC曲线、风险聚类图、诺莫图校准图评估所述肝细胞癌患者错配修复相关预后模型的预测效能;
(2)利用构建的风险系数中位数将患者分为高危组和低危组并比较两组之间的生存差异;
(3)利用ICGC数据集进行外部验证,后使用随机生存森林方法拟合模型;
(4)利用GSVA软件包中的ssGSEA方法对肝细胞癌患者中免疫细胞成分进行鉴定,通过单个肿瘤样本的基因表达水平来评价免疫细胞在肿瘤微环境中的浓缩程度;
(5)利用“ImmuneSubtypeClassifier”R包,根据肿瘤中的免疫细胞基因表达情况进行肿瘤免疫亚型分类,将两个队列中样本分为六种不同免疫亚型;
(6)利用CIBERSORT算法应用于TCGA-LIHC队列的转录组,评估了肝癌患者的免疫细胞渗透水平;
(7)利用IMvigor210队列来验证模型构建的signature对免疫检查点阻断治疗的临床反应能力,不同抗PD-L1临床应答状态分类结合模型风险分类预测PD-L1免疫疗法可行性。
进一步的,所述(2)中六种不同免疫亚型分别为创伤愈合,干扰素-γ占优势,炎症性,淋巴细胞耗竭,免疫平静及转化生长因子-β占优势。
进一步的,所述(7)中不同抗PD-L1临床应答状态分别为完全缓解、部分缓解、病情稳定及疾病进展。
本发明还提供了一种所述的肝细胞癌患者错配修复相关预后模型在肝癌预后中的应用。
本发明公开了以下技术效果:
本发明旨在构建一种基于错配修复(MMR)相关基因的具有强大预测能力的预后模型,通过全面的基因组数据分析来提高对肝癌预后的预测,构建的错配修复相关预后特征在预测效能方面优于该方向的其他模型。具体来说,错配修复相关预后特征的区分度相较于其他模型高,模型评价指标完善(从区分度和校准度两方面来评价模型的预测效能),模型泛化能力强。能够达到上述效果主要依据模型区分度高源于基因筛选的策略:与传统通过差异基因进行lasso筛选的方法相比,根据基因在肝细胞癌中的总生存期先行选择hub基因的方法,在基因的聚类选择上具有优势。从多个维度来评价模型的预测效能。利用ROC曲线、风险聚类图、诺莫图来评估模型的区分度和校准度。同时,根据线性预测值的中位数将患者分为高危组和低危组,并比较两组之间的生存差异。利用样本数量充足的TCGA-LIHC队列的转录组样本作为训练集内部验证,独立外部验证数据集对模型进行验证(LIRI-JP队列)。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为基于错配修复途径相关基因的HCC基因分型分析图,其中(A)TCGA和ICGC数据库中与HCC病相关的交换基因,(B)参与错配修复途径的67个基因的PPI网络图,(C)k=2-5的CDF曲线,(D)CDF曲线下面积的相对变化(k=2-5),(E)k=2时样品一致性的热图,(F)基于t-SNE的不同HCC患者组中特征基因的表达谱,以验证聚类效应,(G)聚类中总存活率的Kaplan-Meier曲线;
图2为识别预后基因以建立风险模型图,其中,(A)在套索模型中选择最佳参数(λ),(B)TCGA数据集中67个基因的套索系数曲线,(C)选择八个基因作为预后标记,(D)肝癌中YBX1、PSMD14、NOP58、RUVBL1、HMMR、KPNA2、BSG和IRAK1的蛋白表达水平图,其中*P<0.05;**P<0.01;*P<0.001;
图3为所选择的基因表达分析图,其中,(A)基于TCGA数据库的低风险组和高风险组中8个所得基因的表达和临床特征的热图,(B)基于ICGC数据库的低风险和高风险组中8个结果基因的表达和临床特征的热图,(C)八个所得基因的PPI网络,(D)TCGA数据库中8个结果基因的相关基因的突变状态,(E)突变基因之间的一致和排他性关联;
图4为评估来自参与错配修复途径的基因的风险信号的预后预测能力图,其中,A和B分别为:(A)TCGA和(B)ICGC队列中8个基因签名的ROC曲线,C和D分别为:(C)TCGA和(D)ICGC队列中预后标记的Km曲线(成对检验),E和F分别为:(E)TCGA和(F)ICGC队列中风险分值的分布;
图5为特征丰富的风险特征分析图,其中,A和B分别为:在(A)TCGA和(B)ICGC的不同组之间错配修复标记的差异表达(Wilcoxon检验),C和D分别为:丰富(C)TCGA队列高危人群中前20个KEGG途径和(D)前30个生物学过程,E-H分别为:基因本体差异表达基因的功能富集分析,其中,(E)细胞成分的浓度。(F)差异表达基因的KEGG途径富集分析,(G)生物浓度,(H)丰富分子功能;
图6为诺谟图的建立和评价图,其中,(A)用于TCGA群组多变量Cox回归分析的森林地块,(B)基于TCGA数据的诺模图校准图,(C)根据TCGA数据预测病人死亡率的列线图,(D)用于TCGA群组多变量Cox回归分析的森林地块,(E)基于TCGA数据的诺模图校准图,(F)根据TCGA数据预测病人死亡率的列线图;
图7为错配修复途径风险评分与相关性分析图,其中,(A)免疫亚型的分布,(B和C)TCGA队列中错配修复途径风险评分与(B)PDCD1和(C)CD274表达的相关性(Pearson相关分析),(D)PDCD1和CD274在TCGA数据集的不同组中的表达(Wilcoxon检验),(E和F)ICGC队列中错配修复途径风险评分与(E)PDCD1和(F)CD274表达的相关性(Pearson相关分析),(G)PDCD1和CD274在ICGC数据集的不同组中的表达(Wilcoxon检验);
图8为肝癌中免疫细胞的侵袭图,其中,(A)肿瘤浸润细胞的免疫丰度分布,(B)在TCGA数据库中,低风险组和高风险组之间的24个侵袭性细胞的数量差异,具有统计学意义(P<0.001),(C)在ICGC数据库中,低风险组和高风险组之间的24个侵袭性细胞的数量,具有统计学意义(P<0.001),(D)乳腺癌中的免疫细胞侵袭;
图9为(A)使用MaxStat R软件包确定RiskScore划分高、低组的最佳分界点。最佳分界点为0.01。(B)对抗pd-l1免疫治疗队列中高危组和低危组进行评分的Kaplan-Meier曲线生存分析。(C)不同抗PD-L1临床反应组的RiskScore差异分析。(D)高风险或低风险组患者对PD-L1阻断有反应的比例。
具体实施方式
实施例1
1方法与步骤
1.1GeneCards(https://www.genec ards.org/)为一个可搜索基因的综合数据库(全名为GeneCards Version 3:the human gene integrator),在这里可以获取到几乎所有的已知的人类基因的信息。从GeneCards中提取MMR错配修复通路相关基因,并选择相关性分数为≥0.3的基因。
从癌症基因组图谱(TCGA)(https://portal.gdc.cancer.gov/repos itory/)数据库下载包括374例肿瘤样本和35例正常样本的肝癌患者的RNA序列(RNA-seq)数据和相应的临床信息。国际癌症基因组联盟(ICGC)portal(https://dcc.icgc.org/proje cts/LIRI-JP/)上的243个肿瘤样本的RNA序列数据也被下载。对两个数据库下载的样本中基因进行单因素COX回归和KM分析。总结这两个队列中的肝癌患者的临床特征。
发现在TCGA和ICGC数据集中,分别有125和114个基因与肝癌患者的OS显著相关(图1A)。重叠的错配修复通路的67个相关基因被纳入套索回归分析,以避免风险特征中的过度拟合问题(图1B)。
通过使用字符串网站(https://cn.string-db.org/)进行蛋白质-蛋白质相互作用网络分析,以进一步探讨这些错配修复相关基因之间的相互作用。构建67个错配修复通路相关基因蛋白质相互作用。然后利用Cytoscape中的Analyze Network工具计算蛋白间的相关分数degree,并按照degree分数填充各模块颜色,分数越大,颜色越深。
1.2错配修复通路相关基因共识聚类分析
根据错配修复通路相关基因的表达水平,利用R包“ConensusClusterPlus”对LIHC样本进行K-Means共识聚类分析。采用双抽样方案,每次抽取80%的样本,重复1000次。当聚类数K为2时,可以得到稳定的结果。之后,R包“factoExtra”(https://cran.r-project.Org/web/Packages/factoExtra/index.html)对与错配修复相关基因进行t-SNE降维分析,以验证聚类效果。最后,R包“survival”(https://cran.r-project.org/web/packages/survival/index.html)软件绘制生存曲线,两组生存时间比较采用对数等级检验。
1.3错配修复通路相关风险信号的构建与验证
首先利用生存R软件包进行单因素Cox回归和Kaplan-Meier(KM)分析,从TCGA和ICGC数据集中筛选与患者总生存时间(OS)相关的MMR错配修复通路相关基因。选取两种分析方式下p值≤0.05具有统计学意义的结果纳入下一步基因筛选。利用TCGA数据库中的“glmnet”R软件包,对上述2个数据集中与OS相关的交叉基因进行最小绝对收缩和选择算子(LASSO)回归模型分析,基于多元Cox回归分析得到的回归系数与所选MMR相关基因的表达水平的线性积分,建立最优的MMR相关风险特征。风险评分计算如下:
EXPI为错配修复通路相关基因的表达值,CoefI为LASSO Cox回归分析中与错配修复通路相关基因相应回归系数。TCGA数据作为训练集,ICGC数据用于验证队列。
OS是在最后一次随访中,通过手术日期除以死亡或审查日期来确定的。用R包MAFTOOLS(v1.0-2)对体细胞突变的景观进行评估和可视化。
1.4生存分析
根据中位风险评分将LIHC患者分为高风险组和低风险组,Kaplan-Meier生存分析使用R中的生存包和Survminer包来比较不同组别的肝癌瘤患者的OS。用R包“survivalROC”建立时间依赖的受试者工作特征(ROC)曲线,以ROC曲线下面积(AUC)来评估两个数据集预测模型在1年,3年和5年的准确性。用Pheatmap R程序包绘制风险图,进行了单变量和多变量COX回归分析,显示样本在不同危险组中的生存状态分布,检验风险评分及协变量是否具有LIHC患者OS的独立预后因素。
1.5功能富集分析
GSVA(Gene Set Variation Analysis)是GSEA的一个算法(GSVA:gene setvariation analysis for microarray and RNA-seq data),也可以从基因表达量和多个通路信息出发,根据通路活性变化情况,对样本进行无监督分类。
使用GSVA软件包评估每个样本中评估不同的代谢通路在不同样品间是否富集,根据风险评分的中位数将患者分为低风险组和高风险组,根据组间得分差异,识别出高风险组和低风险组富含的不同生物过程。使用R中的LIMMA软件包对不同组间的基因进行筛选。最后使用R中的ClusterProfiler程序包对筛选的基因进行GO生物学过程和KEGG途径浓缩分析,热图由R中的Pheatmap程序包绘制。
1.6免疫细胞比例和免疫亚型的评估
肿瘤细胞和肿瘤微环境之间的持续相互作用在肿瘤的发生、发展、转移和对治疗的反应中起决定性作用(Tumor microenvironment as a therapeutic target incancer)。(Immunotherapy for Hepatocellular Carcinoma:A 2021 Update)VéSteinnThorsson和他的同事们将肿瘤分为六种免疫亚型(The Immune Landscape of Cancer),C1(创伤愈合),C2(干扰素-γ占优势),C3(炎症性),C4(淋巴细胞耗竭),C5(免疫平静),C6(转化生长因子-β占优势)。C4亚型主要包含肝细胞癌(LIHC)。
1.7风险信号的独立预后作用
为了确定MMR相关风险信号是否为独立的预后参数并验证其独立预后价值,从TCGA和ICGC数据库对临床病理因素(包括年龄、性别、肿瘤分级等)进行单因素和多因素Cox回归分析来预测患者的OS。独立预测因素分析的结果用森林图形式显示。
1.8诺谟图的开发和评估
诺模图通过简单的统计预测模型图表示临床事件发生的概率,形成个性化的预测模型。将年龄、性别、肿瘤分级和错配修复通路相关风险评分结合在一起,使用R包生存和RMS建立正常图。采用校正曲线评价诺模图预测肝癌患者1、3、5年生存率的准确性。校正曲线中预测曲线与实际曲线重合率越高,表示诺模图具有较高的预测能力。
1.9肿瘤浸润性免疫细胞的估计
采用Cibersort算法(Profiling Tumor Infiltrating Immune Cells withCIBERSORT)计算不同肿瘤浸润性免疫细胞的比例,基于LM22基因签名和1,000种排列,p值<0.05对样本进行过滤,根据CiberSort产生的结果进行了分析。
单样本基因集浓缩分析(SSGSEA)根据Charoentong和Finotello的研究(Pan-cancer Immunogenomic Analyses Reveal Genotype-Immunophenotype Relationshipsand Predictors ofResponse to Checkpoint Blockade)获得的基因组,对每种TME细胞渗透的丰度进行了量化。为了控制肿瘤纯度造成的偏差,我们通过使用估计算法计算肿瘤纯度来调整每个TME细胞亚型的浓缩分数(Inferring tumourpurity and stromal andimmune cell admixture from expression data)。通过ssGSEA分析计算的调整后的富集度分数被用来表示每个TME渗透单元的丰度。我们总共评估了28种人类TME细胞亚型。
1.10免疫治疗队列信息收集
在系统检索公共数据库后,我们将具有转录组数据和完整临床信息的IMvigor210免疫治疗队列纳入我们的研究(TGFβattenuates tumour response to PD-L1 blockadeby contributing to exclusion of T cells)。IMvigor210队列研究了抗pd-L1抗体(pembrolizumab)在晚期尿路上皮癌患者中的疗效。我们从http://research-pub.Gene.com/imvigor210corebiologies下载了样本信息及对应临床信息。DEseq2 R包进行归一化统计。
1.11统计分析
R软件(版本4.2.1)作为本研究的数据整合分析工具。定量数据以平均值(SEM)或标准差(SD)的平均值±标准误差表示。高低组间统计分析采用Wilcoxon检验,多组间统计分析采用Kruskal-Wallis H检验。P<0.05判定为具有统计学意义。可视化图片用R软件绘制。
2结论
2.1基于错配修复通路相关基因的共识聚类分析
从GeneCards database中提取了542个相关性分数≥0.3的错配修复通路相关基因,以生成预后基因签名(表S4)。对这些基因进行单因素COX回归和KM分析。在TCGA和ICGC数据集中,分别有125和114个基因与肝癌患者的OS显著相关(图1A)。重叠的基因(67个基因)绘制PPI网络图。基因筛选结果中LSM2,SCN4A,SLC22A1三个基因与其他基因无蛋白互作关系,其余64个基因通过PPI网络的构建揭示了基因间在蛋白质水平上的密切关系,根据Cytoscape软件计算的基因蛋白相关系数degree由大到小指代每个基因模块颜色深浅。
基于TCGA数据集中374个样本的错配修复相关表达谱进行非监督共识聚类分析。根据累积分布函数(CDF)(图1C)和CDF曲线下面积的相对变化(图1D),当样本被分为2个组时,共识聚类是稳定的(图1E)。错配修复通路相关基因的部分表达水平在两组间存在差异(图1F),且组2的肝癌患者的预后比组1的患者差(P=0.0035)(图1G)。
2.2确定了8个错配修复通路相关基因以建立风险模型
错配修复相关基因图谱的构建根据LIHC患者的基因表达数据和临床资料,我们对67重叠的基因进行了Lasso-Cox回归分析,以避免风险特征中的过度拟合问题(图2A,B),并获得了8个基因来建立TCGA队列中MMR的预后模型预测肝癌患者预后的最低标准。构建包含8个基因(YBX1、PSMD14、NOP58、RUVBL1、HMMR、KPNA2、BSG和IRAK1)的最优模型(图2C),这些基因都是影响肝癌生存的危险因素,危险比(HRs)>1,没有基因HRs<1,无保护因素。
此外,我们利用人蛋白图谱(https://www.prote inatl as.org/)检索了肝癌中YBX1、PSMD14、NOP58、RUVBL1、HMMR、KPNA2、BSG和IRAK1的蛋白表达水平。这些基因都是肝癌中危险因子,其高级别的表达水平高于低级别肝癌(图2D)。
2.3筛选错配修复通路相关基因表达分析
我们测试了临床病理特征和分组之间的关联,热图(图3A和3B)显示了在TCGA和ICGC数据库高表达组和低表达组之间的基因表达和患者临床信息(肿瘤分级、TNM分期、年龄、性别、riskscore)的差异,结果发现高表达组的患者更可能患有较高级别的肿瘤,较高的T期,并且转移的频率明显更高。LASSO选定的基因绘制PPI网络图(图3C),PPI网络的构建揭示了5个基因(PSMD14、NOP58、RUVBL1、HMMR和KPNA2)之间在蛋白质水平上的密切关系,其余三个基因(YBX1、BSG和IRAK1)没有蛋白水平上的关系。然后,我们研究了肝癌中关键分子的突变情况。在TCGA数据库374个样本中,3.56%的患者至少经历了一个关键分子的突变。结果发现,在LIHC样本中,HMMR的突变频率最高,其次是IRAK1,KPNA2,而YBX1,NOP58和RUVBL1未发现任何突变。瀑布图呈现了8个关键分子的突变图景。我们注意到了专注于错配修复的不同类型的关键分子(图3D)。我们得到了关键基因突变之间的相关性热图,颜色代表了相应的P值,并对P<0.05和P<0.1的进行了标记,IRAK1和KPNA2基因突变之间的相关性具有显著性。
2.4错配修复通路相关风险信号的建立和评估
利用肿瘤基因组图谱数据构建风险信号。时间依赖的ROC曲线被用来评估错配修复通路相关风险信号的预后预测的有效性。如图4A所示,在TCGA数据集中,1年、3年和5年运营的AUC分别为0.780、0.700和0.720。在ICGC数据集中预测1年、3年和5年OS的AUC分别为0.790、0.750和0.370(图4B)。
然后,TCGA和ICGC队列中的样本根据每个队列中的中位风险得分被分为低风险组和高风险组。KM分析显示,低风险组的患者比高风险组的患者有更有利的结果(图2C-D)。图4E和图4F显示了TCGA和ICGC数据集中与OS相关的患者预测模型分布。这些结果表明,错配修复通路相关风险信号在预测肝癌患者预后方面的准确性。
2.5风险签名的功能注解
MMR系统主要由4个基因及其编码的蛋白质MLH1、MSH2、MSH6、PMS2组成,在DNA损伤反应信号网络中识别并修复碱基错配、插入、缺失,维持细胞中DNA结构完整性和稳定性。许多关于错配修复通路的研究都使用细胞内相关蛋白如MLH1、MSH2、MSH6和PMS2的表达水平作为指标来检测样本中错配修复强度。为了探讨不同肝癌组的错配修复状态,我们测量了这些标志物在TCGA和ICGC数据集中的表达水平。多数在高危组中表达水平较高,表明该组的错配修复强度明显高于低危组(图5A-B)。
我们使用GSVA程序包探索TCGA数据集中与风险签名相关的KEGG通路和GO生物学过程。以P<0.05为指标,通过检验TCGA和ICGC数据集中的logFC值选择前20个KEGG途径和前30个GO生物过程进行分析。在高危人群中,大多数KEGG途径和GO生物学过程与细胞周期和错配修复过程以及有丝分裂,减数分裂,DNA复制合成有关(图5C-D)。为了证实这些结果,选择LASSO回归筛选的基因使用TCGA数据集中R包ClusterProfiler进行GO和KEGG分析(图5E-H)。这一结果与GSVA分析结果相似。
2.6基于错配修复相关基因特征和临床因素的诺模图
作为预后模型的直观表示,建立了包括性别,疾病分级,年龄,TNM分期、疾病分期和风险评分的诺模图,以更直观地说明所有患者的生存(图6A)。诺模图显示风险评分对肝癌患者的1年、3年和5年生存率的影响最大,其次是TNM分期。
在TCGA训练队列中,多因素COX回归分析显示,错配修复通路相关风险特征、疾病分级和TNM分期与OS显著相关(图7A)。这些结果在ICGC数据集中得到了进一步证实(图7D)。这些发现表明,使用TCGA数据集构建的错配修复通路相关风险信号是肝癌患者的独立预后因素。
通过整合错配修复通路风险特征性别,疾病分级,年龄,TNM分期和疾病分期,我们在TCGA数据集中建立了预测1、3和5年OS的诺模图。校准曲线表明,在TCGA队列中1、3和5年OS率方面,预测生存时间和实际生存时间之间具有显著的一致性(图7B)。在诺模图中,每个签名根据其对操作系统的风险贡献被分配分数(图7C)。这些结果在ICGC数据集中同样得到证实(图7E-F)。
2.7错配修复通路相关风险得分显示出免疫抑制特征
肿瘤免疫治疗主要通过调控机体免疫系统来实现抗肿瘤作用,肿瘤微环境为特殊的肿瘤细胞提供不同于普通细胞生长所需要的各种信号以帮助肿瘤细胞可以增殖和侵略。为揭示高危和低危人群肝癌免疫微环境的特点,ImmuneSubtypeClassifier将两个队列中样本分为不同免疫亚型。在高风险组和低风险组中,主要亚型都是C2(干扰素)、C3(炎症)和C4(淋巴细胞耗尽),但高风险组的C1(伤口愈合),C2(干扰素)亚型比低风险组多得多,低风险组的C3亚型比高风险组多得多(图8A)。C1(伤口愈合),C2(干扰素)免疫亚型在肿瘤中的预后比C3(炎症)免疫亚型差(The Immune Landscape of Cancer),这与高危和低危肝癌患者的预后一致。这进一步证实了错配修复通路相关风险信号在预测肝癌免疫亚型和预后方面的准确性。
在肿瘤的发生、发展过程中,免疫检查点成为免疫耐受的主要原因之一。高风险组和低风险组免疫检查点的表达比较显示,在TCGA和ICGC队列中,高危组免疫检查点表达上调(图7D,图7G)。考虑到PD1(PDCD1)和PD-L1(CD274)在肿瘤免疫抑制和免疫治疗中的关键作用,我们分别研究了它们的表达水平与错配修复通路相关风险评分的关系。我们发现PDCD1和CD274的表达水平与风险评分呈显著正相关(图6B-C,图E-F)。结果显示,错配修复通路相关风险特征可以预测肝癌的免疫特征。
2.8不同风险人群中HCC患者的免疫状态
探索由基因特征建立的诺模图与免疫之间的关联,通过将CiberSort算法应用于TCGA-LIHC队列的转录组(图8A),评估了肝癌患者的免疫细胞渗透水平。总结了肝细胞癌患者免疫细胞浸润的结果,肿瘤浸润性免疫细胞在高危组和低危组之间的比例有显著差异,免疫细胞的比例在每个样本中都是不同的。
为了进一步探索低危组和高危组之间TME细胞浸润的差异,评估28例TME细胞在低危组和高危组标本中的浸润情况。如图8B所示,在TCGA数据库中,activated CD4T cell,eosinophil,type 2T helper cell,Neutrophil存在明显的表达差异,在ICGC数据库中,eosinophil,Neutrophil,Natural killer cell,Type 1T helper cell,activated CD4 Tcell存在显著的表达差异(图8C)。
为了探讨关键分子与TME浸润性细胞的关系,我们将关键分子与TME浸润性细胞进行了关联。Spearman相关分析显示这些分子与TME浸润性细胞呈显著相关性。七个关键分子与Activated CD4 T cell渗透呈显著的正相关(图5D)。
2.9MMR评分模型对治疗反应预测能力的鉴定
研究影响ICB反应和毒性的宿主内在和外在因素十分重要。我们研究了riskScore签名预测患者对免疫检查点阻断治疗的临床反应能力。在接受抗PD-L1免疫治疗的IMLIGN210队列中,低风险患者显示出显著的临床益处和明显的延长生存时间(9A-B)。抗PD-L1免疫治疗反应的结果分为完全反应(CR),部分反应(PR),稳定疾病(SD)和疾病进展(PD)。完全缓解或部分缓解的患者风险相较于稳定疾病患者较低(图9C)。我们观察到低风险患者对PD-L1阻断治疗的临床反应显著高于高风险患者(40%比28%,图9D)。
在本发明中,为了更好地评估肝癌患者的生存状况,我们使用机器学习分析了大量肝癌患者的数据,并基于从GeneCard网站检索并下载的243个与错配修复通路相关基因和临床特征通过筛选后建立预后模型。我们对初步筛选的67个错配修复相关基因进行了共识聚类分析,然后该模型通过TCGA和GEO数据库进行系统分析的基础上,进行单变量回归分析,Lasso回归分析和多因素Cox回归分析,确定8个OS相关基因(YBX1、PSMD14、NOP58、RUVBL1、HMMR、KPNA2、BSG和IRAK1)构建OS相关预测模型,并确定了潜在的分子亚型,以更好地预测肝癌的预后,8个基因的表达水平与预后呈负相关。此外,我们通过生存分析、突变相关性分析和独立预后分析来评估该签名的性能。在预测生存方面表现出良好的区分性和校正性。最后,该模型与免疫之间的联系作为其机制基础得到了部分证实。
在8个OS相关基因中,表达均为上调,促进肿瘤进展。此外,YBX1,circRNA-SORE(一种在索拉非尼耐药HCC细胞中上调的环状RNA)在细胞质中结合致癌蛋白YBX1,这阻止了YBX1与E3泛素连接酶PRP19的核相互作用,从而阻断了PRP19介导的YBX1降解。通过靶向circRNA-SORE或YBX1来克服HCC患者索拉非尼耐药性的潜在策略提供了概念验证。(CircRNA-SORE mediates sorafenib resistance in hepatocellular carcinomabystabilizingYBX1)我们发现PSMD14在HCC组织中显著上调。PSMD14的过表达与HCC患者的血管侵犯、肿瘤数量、肿瘤复发、无瘤生存率和总生存率相关。敲除和过表达实验表明,PSMD14在体外促进HCC细胞的增殖、迁移和侵袭,在体内促进肿瘤的生长和转移。从机理上讲,我们鉴定PSMD14是GRB2的一种新的翻译后调节因子。PSMD14通过去泛素化HCC细胞中的这种癌蛋白来抑制GRB2的降解。NOP58表达与辅助性T细胞2型(Th2)细胞浸润程度呈正相关,NOP58的过度表达与肝细胞癌患者的总生存期呈负相关,RUVBL1单倍体不足本身会强烈改变肝脏的葡萄糖代谢,导致高血糖、肝脏糖异生增加、高胰岛素血症和肝脏胰岛素抵抗。HMMR促进HCC细胞增殖在试管内通过激活G1/S和G2/M检查点转换,伴随着阳性细胞周期调节因子(包括细胞周期蛋白D1、细胞周期蛋白E和细胞周期蛋白B1)的显著增加。核转运蛋白α2(KPNA2,也称为importinα-1)是核转运蛋白家族的成员,参与多种肿瘤相关蛋白的核质转运途径。最近的研究发现,KPNA2在各种癌症中过度表达,与预后不良有关。此外,已表明它通过参与细胞分化、增殖、凋亡、免疫反应和病毒感染来促进肿瘤的形成和发展。表明KPNA2在肿瘤的诊断、治疗和预后中也起着重要的作用。BSG(CD147)是一种膜蛋白,被鉴定为TFF3的结合伴侣。通过与CD147结合,TFF3增强CD147-CD44s相互作用,导致信号转导和转录激活因子3(STAT3)激活和前列腺素G/H合酶2(PTGS2)表达,这对于TFF3诱导的迁移、增殖和侵袭是不可或缺的。IRAK1的高表达与总生存期和无病生存期的缩短有关,IRAK1的表达与TP53突变呈正相关。因此,所确定的8个基因中的大多数直接或间接影响肝癌肿瘤的发生与发展,与肝癌的预后具有相关性,这也提示了错配修复通路相关蛋白可能调节抗肝癌的免疫反应。
风险评分是开发有意义签名的常用方法。利用错配修复通路相关风险评分建立的模型不仅能准确预测肝癌患者的预后,还能区分不同的肝癌分子亚型。ROC分析表明,在TCGA和ICGC数据集中,8个基因特征在预测肝癌患者的短期(1年和3年)和长期(5年)生存方面表现良好。KM分析证实,该模型准确预测了肝癌患者的生存时间。
考虑到这种风险信号在肝癌中的强大作用,我们进一步评估了这些影响的机制。功能分析表明,细胞周期和错配修复过程的生物学过程以及有丝分裂,减数分裂,DNA复制合成在高危组中丰富,提示错配修复通路相关与肝癌免疫反应之间存在相互作用,8个相关基因功能富集结果与高危组GSVA功能分析相统一。
与低危组相比,高危组肿瘤免疫周期抑制物和免疫检查点的高表达以及肿瘤免疫抑制细胞的丰富,表明该模型成功地区分了胶质瘤的免疫类型。提示内质网应激可调节胶质瘤免疫微环境,从而影响胶质瘤患者的预后。这也证实了我们关于内质网应激和抗胶质瘤免疫反应之间关系的假设是正确的。
为了充分利用风险模型的潜力,我们开发了一个包含性别,疾病分级,年龄,TNM分期、疾病分期和错配修复通路信号的诺模图。TNM分期是目前癌症患者分期的重要标准,被广泛认为是预测大多数实体瘤预后的标准方法。基于TCGA和ICGC数据库的校准图显示了诺模图良好的预测性能。因此,我们的8基因错配修复通路相关风险信号可以预测肝癌患者的OS,并有助于选择最佳治疗方法。
免疫治疗已成为最有希望的癌症治疗方法,但免疫治疗的效果与免疫渗透密切相关。尽管对肝细胞癌DNA损伤的发病机制已有广泛研究,但错配修复相关基因与肿瘤免疫之间的关系尚不清楚。我们推测,这可能与不同亚组之间存活率的差异密切相关。为了对这解释这一关系,我们比较了高危组和低危组之间的免疫细胞组成。结果表明,高危组肿瘤相关中性粒细胞、嗜酸性粒细胞和Treg细胞更为丰富,提示肝癌患者预后较差可能与免疫细胞的浸润有关,错配修复相关基因可能通过免疫细胞作用于肿瘤细胞。此外,PD1和PD-L1免疫检查点在高危肝癌患者中的表达明显高于低危肝癌患者,提示患者总体生存率较低可能与免疫抑制微环境有关。这些结果表明,该模型可以进一步发展用于评估免疫检查点抑制剂在肝癌患者中的疗效。未来需要纳入更多的案例进行确认和验证。
这项研究的一个重要发现是,基于错配修复基因相关风险分数构建的诺模图可以准确预测肝癌患者的预后。虽然一些预后模型已经被用来预测肝癌患者的总体生存,但很少有基于错配修复相关基因的诺模图的报道。本发明结合了大量肝癌患者的数据,并已在多个数据库中得到验证,在预测生存方面表现出令人满意的性能。此外,筛选出的8个错配修复相关基因可作为预测肝癌患者生存的生物标志物。
综上所述,我们的研究定义了一个基于8个错配修复相关基因的新的预后模型。通过对多个数据库中多个肝癌患者的数据进行分析,表明该模型具有良好的判别和校正能力并为评价肝细胞癌患者的预后提供了新的视角。
在构建模型的过程中,本发明选择了两个常用样本数据集构建模型。在实践过程中这些数据集的选择具有可替代性。这种可替代可以是其他组学方向的模型,也可以是临床变量构建的预测模型。本方案使用随机生存森林方法用于最终拟合模型,也可以使用其他的机器学习算法替代。总之,我们根据错配修复相关基因的表达和免疫细胞的渗透水平建立了风险特征,这可能为开发新的肝细胞癌免疫疗法提供更深层次的理解和新的见解。
虽然本发明以较佳实施例揭露如上,但并非用以限定本发明的实施范围。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (4)
1.一种肝细胞癌患者错配修复相关预后模型,其特征在于,肝细胞癌患者错配修复相关预后模型基于八种错配修复相关基因进行构建,所述八种错配修复相关基因为YBX1、PSMD14、NOP58、RUVBL1、HMMR、KPNA2、BSG和IRAK1;
所述肝细胞癌患者错配修复相关预后模型的构建方法,包括以下步骤:
(1.1)从癌症基因组图谱和国际癌症基因组联盟中收集构建肝细胞癌患者错配修复相关预后模型的训练集和验证集;
(1.2)从GeneCards数据库搜集相关性分数≥0.3错配修复相关基因进行单因素COX回归和KM分析,对基因集进行初步筛选获得初步hub基因集;
(1.3)基于所选错配修复相关基因的表达水平的线性积分,建立最优的MMR相关风险特征,风险评分计算如下:
其中,Expri为错配修复通路相关基因的表达值,Coefi为LASSOCox回归分析中与错配修复通路相关基因相应回归系数;
所述肝细胞癌患者错配修复相关预后模型的的验证方法,包括以下内容:
(2.1)利用ROC曲线、风险聚类图和诺莫图校准图评估所述肝细胞癌患者错配修复相关预后模型的预测效能;
(2.2)利用构建的风险系数中位数将患者分为高危组和低危组并比较两组之间的生存差异;
(2.3)利用ICGC数据集进行外部验证,后使用随机生存森林方法拟合模型;
(2.4)利用GSVA软件包中的ssGSEA方法对肝细胞癌患者中免疫细胞成分进行鉴定,通过单个肿瘤样本的基因表达水平来评价免疫细胞在肿瘤微环境中的浓缩程度;
(2.5)利用“ImmuneSubtypeClassifier”R包,根据肿瘤中的免疫细胞基因表达情况进行肿瘤免疫亚型分类,将两个队列中样本分为六种不同免疫亚型;
(2.6)利用CIBERSORT算法应用于TCGA-LIHC队列的转录组,评估了肝癌患者的免疫细胞渗透水平;
(2.7)利用IMvigor210队列来验证模型构建的signature对免疫检查点阻断治疗的临床反应能力,不同抗PD-L1临床应答状态分类结合模型风险分类预测PD-L1免疫疗法可行性。
2.根据权利要求1所述的肝细胞癌患者错配修复相关预后模型,其特征在于,在步骤(1.2)中,所述单因素COX回归和KM分析选择P值小于0.05用于最小绝对收缩和选择算子COX回归和多变量COX比例风险回归分析。
3.根据权利要求1所述的肝细胞癌患者错配修复相关预后模型,其特征在于,所述(2.2)中六种不同免疫亚型分别为创伤愈合,干扰素-γ占优势,炎症性,淋巴细胞耗竭,免疫平静及转化生长因子-β占优势。
4.根据权利要求1所述的肝细胞癌患者错配修复相关预后模型,其特征在于,所述(2.7)中不同抗PD-L1临床应答状态分别为完全缓解、部分缓解、病情稳定及疾病进展。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311392146.0A CN117409855B (zh) | 2023-10-25 | 2023-10-25 | 一种肝细胞癌患者错配修复相关预后模型及其构建、验证方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311392146.0A CN117409855B (zh) | 2023-10-25 | 2023-10-25 | 一种肝细胞癌患者错配修复相关预后模型及其构建、验证方法和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117409855A CN117409855A (zh) | 2024-01-16 |
CN117409855B true CN117409855B (zh) | 2024-04-26 |
Family
ID=89497580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311392146.0A Active CN117409855B (zh) | 2023-10-25 | 2023-10-25 | 一种肝细胞癌患者错配修复相关预后模型及其构建、验证方法和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117409855B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110580956A (zh) * | 2019-09-19 | 2019-12-17 | 青岛市市立医院 | 一组肝癌预后标志物及其应用 |
CN112687342A (zh) * | 2020-11-16 | 2021-04-20 | 徐同鹏 | 基于tcga数据库鉴定的一组免疫相关分子标志物在食管癌预后预测中的应用 |
CN115019880A (zh) * | 2022-05-05 | 2022-09-06 | 中山大学附属第一医院 | 一种基于ddr和icd基因表达的肝癌预后模型及其构建方法和应用 |
CN115410713A (zh) * | 2022-08-31 | 2022-11-29 | 广西壮族自治区肿瘤防治研究所 | 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建 |
CN115798723A (zh) * | 2023-01-18 | 2023-03-14 | 北京泽桥医疗科技股份有限公司 | 一种癌症复发风险预测模型构建方法 |
CN116564421A (zh) * | 2023-06-08 | 2023-08-08 | 苏州卫生职业技术学院 | 一种急性髓系白血病患者铜死亡相关预后模型构建方法 |
CN116798632A (zh) * | 2023-07-13 | 2023-09-22 | 山东第一医科大学附属省立医院(山东省立医院) | 一种基于代谢基因的胃癌分子分型及预后预测模型构建方法及应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8954283B2 (en) * | 2001-11-07 | 2015-02-10 | John D. Shaughnessy, JR. | Diagnosis, prognosis and identification of potential therapeutic targets of multiple myeloma based on gene expression profiling |
MX2015001068A (es) * | 2012-07-26 | 2015-04-08 | Univ California | Analisis, diagnostico y pronostico de autismo y otros trastornos del desarrollo. |
CA2904441A1 (en) * | 2013-03-15 | 2014-09-18 | Metamark Genetics, Inc. | Compositions and methods for cancer prognosis |
US20210254056A1 (en) * | 2017-05-05 | 2021-08-19 | Camp4 Therapeutics Corporation | Identification and targeted modulation of gene signaling networks |
US20230313299A1 (en) * | 2020-03-02 | 2023-10-05 | Université De Strasbourg | Method for diagnosis and/or prognosis of liver disease progression and risk of hepatocellular carcinoma and discovery of therapeutic compounds and targets to treat liver disease and cancer |
-
2023
- 2023-10-25 CN CN202311392146.0A patent/CN117409855B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110580956A (zh) * | 2019-09-19 | 2019-12-17 | 青岛市市立医院 | 一组肝癌预后标志物及其应用 |
CN112687342A (zh) * | 2020-11-16 | 2021-04-20 | 徐同鹏 | 基于tcga数据库鉴定的一组免疫相关分子标志物在食管癌预后预测中的应用 |
CN115019880A (zh) * | 2022-05-05 | 2022-09-06 | 中山大学附属第一医院 | 一种基于ddr和icd基因表达的肝癌预后模型及其构建方法和应用 |
CN115410713A (zh) * | 2022-08-31 | 2022-11-29 | 广西壮族自治区肿瘤防治研究所 | 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建 |
CN115798723A (zh) * | 2023-01-18 | 2023-03-14 | 北京泽桥医疗科技股份有限公司 | 一种癌症复发风险预测模型构建方法 |
CN116564421A (zh) * | 2023-06-08 | 2023-08-08 | 苏州卫生职业技术学院 | 一种急性髓系白血病患者铜死亡相关预后模型构建方法 |
CN116798632A (zh) * | 2023-07-13 | 2023-09-22 | 山东第一医科大学附属省立医院(山东省立医院) | 一种基于代谢基因的胃癌分子分型及预后预测模型构建方法及应用 |
Non-Patent Citations (4)
Title |
---|
Identification of a DNA Damage Response and Repair-Related Gene-Pair Signature for Prognosis Stratification Analysis in Hepatocellular Carcinoma;Yi Chen等;《Frontiers in Pharmacology》;20220405;第13卷;第1-17页 * |
Mismatch repair genes as prognosis biomarkers for hepatocellular carcinoma;Chen Yang等;《Research Square》;20231028;第1-25页 * |
基因组不稳定性风险指数预测透明细胞肾癌的预后和免疫疗法反应;吴莎;《中国优秀硕士学位论文全文数据库 医药卫生科技辑》;20230115(第1期);第E067-79页 * |
错配修复状态对低级别胶质瘤患者的放疗预后影响;王思亓;《中国优秀硕士学位论文全文数据库 医药卫生科技辑》;20230215(第2期);第E070-964页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117409855A (zh) | 2024-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Biswas et al. | A clonal expression biomarker associates with lung cancer mortality | |
Thennavan et al. | Molecular analysis of TCGA breast cancer histologic types | |
CN112063720A (zh) | 骨肉瘤预后标志物及预后评估模型 | |
Dai et al. | Identification of an immune-related gene signature to improve prognosis prediction in colorectal cancer patients | |
Ren et al. | Identifying the role of transient receptor potential channels (TRPs) in kidney renal clear cell carcinoma and their potential therapeutic significances using genomic and transcriptome analyses | |
Song et al. | A model of seven immune checkpoint-related genes predicting overall survival for head and neck squamous cell carcinoma | |
Zhao et al. | Systematic profiling of alternative splicing signature reveals prognostic predictor for prostate cancer | |
Wang et al. | A prognostic nomogram for lung adenocarcinoma based on immune-infiltrating Treg-related genes: from bench to bedside | |
Zhan et al. | Development and validation of a prognostic gene signature in clear cell renal cell carcinoma | |
Zhang et al. | Identification of a survival-related signature for sarcoma patients through integrated transcriptomic and proteomic profiling analyses | |
Zhou et al. | Increased blood-based intratumor heterogeneity (bITH) is associated with unfavorable outcomes of immune checkpoint inhibitors plus chemotherapy in non-small cell lung cancer | |
Zhang et al. | DNA repair and replication‐related gene signature based on tumor mutation burden reveals prognostic and immunotherapy response in gastric cancer | |
Wang et al. | Identification of hub genes in bladder cancer based on weighted gene co‐expression network analysis from TCGA database | |
Che et al. | The clinical prediction value of the ubiquitination model reflecting the immune traits in LUAD | |
Geng et al. | A tumor microenvironment-related risk model for predicting the prognosis and tumor immunity of breast cancer patients | |
Peng et al. | Identification of disulfidptosis-related subtypes and development of a prognosis model based on stacking framework in renal clear cell carcinoma | |
CN117409855B (zh) | 一种肝细胞癌患者错配修复相关预后模型及其构建、验证方法和应用 | |
Liu et al. | Mutational and transcriptional characterization establishes prognostic models for resectable lung squamous cell carcinoma | |
Cabrero-de Las Heras et al. | Changes in serum CXCL13 levels are associated with outcomes of Colorectal Cancer Patients Undergoing First-Line Oxaliplatin-Based Treatment | |
Lv et al. | A WGCNA-based cancer-associated fibroblast risk signature in colorectal cancer for prognosis and immunotherapy response | |
Liu et al. | Identification and validation of a novel tumor driver gene signature for diagnosis and prognosis of head and neck squamous cell carcinoma | |
Ding et al. | Comprehensive analysis of mTORC1 signaling pathway–related genes in the prognosis of HNSCC and the response to chemotherapy and immunotherapy | |
Xu et al. | Integration of multi-omics and clinical treatment data reveals bladder cancer therapeutic vulnerability gene combinations and prognostic risks | |
Zhang et al. | Systematic analyses to explore immune gene sets-based signature in hepatocellular carcinoma, in which IGF2BP3 contributes to tumor progression | |
Zhang et al. | A high epigenetic risk score shapes the non-inflamed tumor microenvironment in breast cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |