CN113192560A - 一种基于铁死亡进程的肝细胞癌分型体系的构建方法 - Google Patents
一种基于铁死亡进程的肝细胞癌分型体系的构建方法 Download PDFInfo
- Publication number
- CN113192560A CN113192560A CN202110231772.6A CN202110231772A CN113192560A CN 113192560 A CN113192560 A CN 113192560A CN 202110231772 A CN202110231772 A CN 202110231772A CN 113192560 A CN113192560 A CN 113192560A
- Authority
- CN
- China
- Prior art keywords
- subtypes
- expression
- frgs
- frrs
- cells
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 title claims abstract description 154
- 206010073071 hepatocellular carcinoma Diseases 0.000 title claims abstract description 108
- 231100000844 hepatocellular carcinoma Toxicity 0.000 title claims abstract description 87
- 230000034994 death Effects 0.000 title claims abstract description 80
- 229910052742 iron Inorganic materials 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000008569 process Effects 0.000 title claims abstract description 45
- 238000010276 construction Methods 0.000 title claims abstract description 8
- 230000014509 gene expression Effects 0.000 claims abstract description 96
- 238000009169 immunotherapy Methods 0.000 claims abstract description 68
- 238000004393 prognosis Methods 0.000 claims abstract description 26
- 230000000694 effects Effects 0.000 claims abstract description 22
- 108090000623 proteins and genes Proteins 0.000 claims description 98
- 239000000523 sample Substances 0.000 claims description 40
- 238000004458 analytical method Methods 0.000 claims description 34
- 206010028980 Neoplasm Diseases 0.000 claims description 29
- 230000008595 infiltration Effects 0.000 claims description 29
- 238000001764 infiltration Methods 0.000 claims description 29
- 230000035772 mutation Effects 0.000 claims description 27
- 239000000090 biomarker Substances 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 21
- 238000000611 regression analysis Methods 0.000 claims description 19
- 238000011160 research Methods 0.000 claims description 19
- 210000004027 cell Anatomy 0.000 claims description 18
- 238000011282 treatment Methods 0.000 claims description 18
- 210000002865 immune cell Anatomy 0.000 claims description 17
- 230000004083 survival effect Effects 0.000 claims description 17
- MLDQJTXFUGDVEO-UHFFFAOYSA-N BAY-43-9006 Chemical compound C1=NC(C(=O)NC)=CC(OC=2C=CC(NC(=O)NC=3C=C(C(Cl)=CC=3)C(F)(F)F)=CC=2)=C1 MLDQJTXFUGDVEO-UHFFFAOYSA-N 0.000 claims description 16
- 239000005511 L01XE05 - Sorafenib Substances 0.000 claims description 16
- 229960003787 sorafenib Drugs 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 238000010200 validation analysis Methods 0.000 claims description 13
- 206010061218 Inflammation Diseases 0.000 claims description 12
- 230000000875 corresponding effect Effects 0.000 claims description 12
- 230000001024 immunotherapeutic effect Effects 0.000 claims description 12
- 230000004054 inflammatory process Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 12
- 230000037361 pathway Effects 0.000 claims description 12
- 230000007067 DNA methylation Effects 0.000 claims description 11
- 101000799318 Homo sapiens Long-chain-fatty-acid-CoA ligase 1 Proteins 0.000 claims description 10
- 102100033995 Long-chain-fatty-acid-CoA ligase 1 Human genes 0.000 claims description 10
- 230000033228 biological regulation Effects 0.000 claims description 10
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 claims description 9
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 claims description 9
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 9
- 230000001973 epigenetic effect Effects 0.000 claims description 9
- 230000011987 methylation Effects 0.000 claims description 9
- 238000007069 methylation reaction Methods 0.000 claims description 9
- 230000035945 sensitivity Effects 0.000 claims description 9
- 102100040678 Programmed cell death protein 1 Human genes 0.000 claims description 8
- 238000012217 deletion Methods 0.000 claims description 8
- 230000037430 deletion Effects 0.000 claims description 8
- 230000008901 benefit Effects 0.000 claims description 7
- 238000010824 Kaplan-Meier survival analysis Methods 0.000 claims description 6
- 238000003559 RNA-seq method Methods 0.000 claims description 6
- 239000000427 antigen Substances 0.000 claims description 6
- 108091007433 antigens Proteins 0.000 claims description 6
- 102000036639 antigens Human genes 0.000 claims description 6
- 210000004443 dendritic cell Anatomy 0.000 claims description 6
- 230000004060 metabolic process Effects 0.000 claims description 6
- 238000001565 modulated differential scanning calorimetry Methods 0.000 claims description 6
- 210000004985 myeloid-derived suppressor cell Anatomy 0.000 claims description 6
- 210000000822 natural killer cell Anatomy 0.000 claims description 6
- 230000001681 protective effect Effects 0.000 claims description 6
- 210000003289 regulatory T cell Anatomy 0.000 claims description 6
- 238000006467 substitution reaction Methods 0.000 claims description 6
- 102100021977 Ectonucleotide pyrophosphatase/phosphodiesterase family member 2 Human genes 0.000 claims description 5
- 102100037249 Egl nine homolog 1 Human genes 0.000 claims description 5
- 101000897035 Homo sapiens Ectonucleotide pyrophosphatase/phosphodiesterase family member 2 Proteins 0.000 claims description 5
- 101000881648 Homo sapiens Egl nine homolog 1 Proteins 0.000 claims description 5
- 101000780205 Homo sapiens Long-chain-fatty-acid-CoA ligase 5 Proteins 0.000 claims description 5
- 101001133056 Homo sapiens Mucin-1 Proteins 0.000 claims description 5
- 101001064853 Homo sapiens Polyunsaturated fatty acid lipoxygenase ALOX15 Proteins 0.000 claims description 5
- 101000611936 Homo sapiens Programmed cell death protein 1 Proteins 0.000 claims description 5
- 101000713288 Homo sapiens Solute carrier family 22 member 5 Proteins 0.000 claims description 5
- 101000631826 Homo sapiens Stearoyl-CoA desaturase Proteins 0.000 claims description 5
- 102100034318 Long-chain-fatty-acid-CoA ligase 5 Human genes 0.000 claims description 5
- 102100034256 Mucin-1 Human genes 0.000 claims description 5
- 102100031950 Polyunsaturated fatty acid lipoxygenase ALOX15 Human genes 0.000 claims description 5
- 102100028897 Stearoyl-CoA desaturase Human genes 0.000 claims description 5
- 230000003321 amplification Effects 0.000 claims description 5
- 230000036438 mutation frequency Effects 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 230000001225 therapeutic effect Effects 0.000 claims description 5
- 230000008827 biological function Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 201000011510 cancer Diseases 0.000 claims description 4
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 4
- 238000011161 development Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 230000002401 inhibitory effect Effects 0.000 claims description 4
- HSINOMROUCMIEA-FGVHQWLLSA-N (2s,4r)-4-[(3r,5s,6r,7r,8s,9s,10s,13r,14s,17r)-6-ethyl-3,7-dihydroxy-10,13-dimethyl-2,3,4,5,6,7,8,9,11,12,14,15,16,17-tetradecahydro-1h-cyclopenta[a]phenanthren-17-yl]-2-methylpentanoic acid Chemical compound C([C@@]12C)C[C@@H](O)C[C@H]1[C@@H](CC)[C@@H](O)[C@@H]1[C@@H]2CC[C@]2(C)[C@@H]([C@H](C)C[C@H](C)C(O)=O)CC[C@H]21 HSINOMROUCMIEA-FGVHQWLLSA-N 0.000 claims description 3
- 101150028074 2 gene Proteins 0.000 claims description 3
- 101150033839 4 gene Proteins 0.000 claims description 3
- 108010074708 B7-H1 Antigen Proteins 0.000 claims description 3
- 108010021064 CTLA-4 Antigen Proteins 0.000 claims description 3
- 229940045513 CTLA4 antagonist Drugs 0.000 claims description 3
- 108091029430 CpG site Proteins 0.000 claims description 3
- 101150027068 DEGS1 gene Proteins 0.000 claims description 3
- 206010061818 Disease progression Diseases 0.000 claims description 3
- 108010007707 Hepatitis A Virus Cellular Receptor 2 Proteins 0.000 claims description 3
- 102000007346 Hepatitis A Virus Cellular Receptor 2 Human genes 0.000 claims description 3
- 101000855412 Homo sapiens Carbamoyl-phosphate synthase [ammonia], mitochondrial Proteins 0.000 claims description 3
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 claims description 3
- 101000983292 Homo sapiens N-fatty-acyl-amino acid synthase/hydrolase PM20D1 Proteins 0.000 claims description 3
- 101000861263 Homo sapiens Steroid 21-hydroxylase Proteins 0.000 claims description 3
- 102000037982 Immune checkpoint proteins Human genes 0.000 claims description 3
- 108091008036 Immune checkpoint proteins Proteins 0.000 claims description 3
- 102100032280 Metal cation symporter ZIP14 Human genes 0.000 claims description 3
- 206010027476 Metastases Diseases 0.000 claims description 3
- 206010027480 Metastatic malignant melanoma Diseases 0.000 claims description 3
- 208000032818 Microsatellite Instability Diseases 0.000 claims description 3
- 102100026873 N-fatty-acyl-amino acid synthase/hydrolase PM20D1 Human genes 0.000 claims description 3
- 238000010220 Pearson correlation analysis Methods 0.000 claims description 3
- 101710089372 Programmed cell death protein 1 Proteins 0.000 claims description 3
- 108091006944 SLC39A14 Proteins 0.000 claims description 3
- 108091008874 T cell receptors Proteins 0.000 claims description 3
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 3
- 210000000447 Th1 cell Anatomy 0.000 claims description 3
- 210000000068 Th17 cell Anatomy 0.000 claims description 3
- 210000004241 Th2 cell Anatomy 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 230000002411 adverse Effects 0.000 claims description 3
- 230000037354 amino acid metabolism Effects 0.000 claims description 3
- 230000033115 angiogenesis Effects 0.000 claims description 3
- 229960003852 atezolizumab Drugs 0.000 claims description 3
- 210000003719 b-lymphocyte Anatomy 0.000 claims description 3
- 239000003613 bile acid Substances 0.000 claims description 3
- 238000002659 cell therapy Methods 0.000 claims description 3
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 201000010099 disease Diseases 0.000 claims description 3
- 230000005750 disease progression Effects 0.000 claims description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 210000002889 endothelial cell Anatomy 0.000 claims description 3
- 238000010201 enrichment analysis Methods 0.000 claims description 3
- 210000003979 eosinophil Anatomy 0.000 claims description 3
- 230000004129 fatty acid metabolism Effects 0.000 claims description 3
- 230000004806 ferroptosis Effects 0.000 claims description 3
- 210000002950 fibroblast Anatomy 0.000 claims description 3
- 230000003325 follicular Effects 0.000 claims description 3
- 210000004475 gamma-delta t lymphocyte Anatomy 0.000 claims description 3
- 210000002443 helper t lymphocyte Anatomy 0.000 claims description 3
- 210000003630 histaminocyte Anatomy 0.000 claims description 3
- 230000000521 hyperimmunizing effect Effects 0.000 claims description 3
- 230000003166 hypermetabolic effect Effects 0.000 claims description 3
- 230000002806 hypometabolic effect Effects 0.000 claims description 3
- 210000003297 immature b lymphocyte Anatomy 0.000 claims description 3
- 229940126546 immune checkpoint molecule Drugs 0.000 claims description 3
- 210000005008 immunosuppressive cell Anatomy 0.000 claims description 3
- 230000006698 induction Effects 0.000 claims description 3
- 238000003780 insertion Methods 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 230000009545 invasion Effects 0.000 claims description 3
- 210000002540 macrophage Anatomy 0.000 claims description 3
- 201000001441 melanoma Diseases 0.000 claims description 3
- 230000002503 metabolic effect Effects 0.000 claims description 3
- 230000009401 metastasis Effects 0.000 claims description 3
- 208000021039 metastatic melanoma Diseases 0.000 claims description 3
- 210000001616 monocyte Anatomy 0.000 claims description 3
- 238000007837 multiplex assay Methods 0.000 claims description 3
- 210000000581 natural killer T-cell Anatomy 0.000 claims description 3
- 210000000440 neutrophil Anatomy 0.000 claims description 3
- 239000002773 nucleotide Substances 0.000 claims description 3
- 125000003729 nucleotide group Chemical group 0.000 claims description 3
- 230000010627 oxidative phosphorylation Effects 0.000 claims description 3
- 230000036961 partial effect Effects 0.000 claims description 3
- 229960002621 pembrolizumab Drugs 0.000 claims description 3
- 210000005134 plasmacytoid dendritic cell Anatomy 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 230000004043 responsiveness Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000019491 signal transduction Effects 0.000 claims description 3
- 230000006641 stabilisation Effects 0.000 claims description 3
- 238000011105 stabilization Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 210000001550 testis Anatomy 0.000 claims description 3
- 238000002560 therapeutic procedure Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 206010044412 transitional cell carcinoma Diseases 0.000 claims description 3
- 230000037455 tumor specific immune response Effects 0.000 claims description 3
- 230000002792 vascular Effects 0.000 claims description 3
- 230000009790 vascular invasion Effects 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000010230 functional analysis Methods 0.000 claims description 2
- 238000010199 gene set enrichment analysis Methods 0.000 claims description 2
- 210000001082 somatic cell Anatomy 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims description 2
- 108700026220 vif Genes Proteins 0.000 claims description 2
- 102100033763 Transducin-like enhancer protein 4 Human genes 0.000 claims 3
- 210000003969 blast cell Anatomy 0.000 claims 1
- 230000003053 immunization Effects 0.000 claims 1
- 238000002649 immunization Methods 0.000 claims 1
- 239000003550 marker Substances 0.000 claims 1
- 201000007270 liver cancer Diseases 0.000 abstract description 13
- 208000014018 liver neoplasm Diseases 0.000 abstract description 10
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 2
- 108091008026 Inhibitory immune checkpoint proteins Proteins 0.000 description 2
- 102000037984 Inhibitory immune checkpoint proteins Human genes 0.000 description 2
- 101100494360 Mus musculus C1galt1c1 gene Proteins 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 2
- LNEPOXFFQSENCJ-UHFFFAOYSA-N haloperidol Chemical compound C1CC(O)(C=2C=CC(Cl)=CC=2)CCN1CCCC(=O)C1=CC=C(F)C=C1 LNEPOXFFQSENCJ-UHFFFAOYSA-N 0.000 description 2
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 2
- 238000011337 individualized treatment Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 238000002626 targeted therapy Methods 0.000 description 2
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 208000028017 Psychotic disease Diseases 0.000 description 1
- 238000010317 ablation therapy Methods 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 238000003782 apoptosis assay Methods 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000004900 autophagic degradation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004791 biological behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000010109 chemoembolization Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229960003878 haloperidol Drugs 0.000 description 1
- 210000002767 hepatic artery Anatomy 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000010438 iron metabolism Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000037356 lipid metabolism Effects 0.000 description 1
- 230000003859 lipid peroxidation Effects 0.000 description 1
- 229940124303 multikinase inhibitor Drugs 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000005522 programmed cell death Effects 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 238000011277 treatment modality Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Pure & Applied Mathematics (AREA)
- Wood Science & Technology (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Genetics & Genomics (AREA)
- Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Hospice & Palliative Care (AREA)
- Epidemiology (AREA)
- Oncology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
Abstract
本发明公开了一种基于铁死亡进程的肝细胞癌分型体系的构建方法,包括如下步骤:步骤一、探索FRGs在HCC中的表达情况:首先分别纳入来自于GEO,TCGA和ICGC数据库的32个数据集共3933个肝细胞癌样本。本发明通过探索FRGs在HCC中的表达情况、异质性铁死亡亚型的识别和验证、两亚型的临床状态、评估FRRS在预测预后和免疫治疗疗效上的表现以及HCCS程序包的开发的步骤配合,共纳入了32个数据集的3933个肝癌样本进行分析,分为低铁死亡亚型和高铁死亡亚型,并显示出了特异的功能特征和临床结局,此外,基于铁死亡分型,还提出了一个铁死亡相关风险评分(FRRS),FRRS在预测预后和免疫治疗来疗效中都展示了较好的效果,可为铁死亡在肝癌中的研究奠定了基础。
Description
技术领域
本发明涉及原发性肝癌技术领域,具体为一种基于铁死亡进程的肝细胞癌分型体系的构建方法。
背景技术
原发性肝癌(primary liver cancer)是世界上第五常见的恶性肿瘤,在肿瘤相关死亡的原因中位列第四,每年约有84万的新发病例,其中,肝细胞癌(hepatocellularcarcinoma,HCC)是其重要是组织学类型(占其75%-85%),具有高侵袭性和高致死率的特点,早期肝癌多采取手术切除,但肝癌切除术后5年复发率仍高达70%,且大多数患者于术后2年内复发,不可切除的肝细胞癌(HCC)患者通常接受多激酶抑制剂索拉非尼或轮伐替尼,然而药物耐药及不良反应使得患者的生存获益受限,近年来,以免疫检查点抑制剂(ICIs) 为代表的免疫治疗取得了很大进展,然而HCC生物学行为的异质性导致仅有25%的患者产生持久的治疗反应,尽管其他治疗方式如消融治疗、经导管肝动脉化疗栓塞术(TACE)也取得了很大进展,但高的复发率使得HCC患者5年生存率仅有18%。
铁死亡是一种新发现的,以铁依赖性脂质过氧化和活性氧诱导的程序性细胞死亡为特征,区别于典型的细胞凋亡、自噬和程序性坏死等的新型细胞死亡方式,索拉菲尼既是晚期HCC的一线用药,也可通过抑制system Xc-进而导致GSH耗竭诱导铁死亡来治疗肝细胞癌,已有研究证实在索拉非尼诱导细胞死亡的过程中,治疗精神病的药物氟哌啶醇可以增强索拉非尼诱导的HCC的铁死亡,除铁代谢外,脂质代谢也在肝细胞癌的铁死亡中起重要作用,然后目前对 HCC铁死亡的研究大多还停留在细胞和动物水平,缺乏大样本、多组学的系统化深入研究。
因此亟需设计一种基于铁死亡进程的肝细胞癌分型体系的构建方法来解决上述问题。
发明内容
本发明的目的在于提供一种基于铁死亡进程的肝细胞癌分型体系的构建方法,以解决上述背景技术中提出的现有HCC铁死亡的研究大多还停留在细胞和动物水平,缺乏大样本、多组学的系统化深入研究的问题。
为实现上述目的,本发明提供如下技术方案:一种基于铁死亡进程的肝细胞癌分型体系的构建方法,包括如下步骤:
步骤一、探索FRGs在HCC中的表达情况:首先分别纳入来自于 GEO,TCGA和ICGC数据库的32个数据集共3933个肝细胞癌样本,且32个数据集分别为GSE102079,GSE107170,GSE109211, GSE112790,GSE116174,GSE121248,GSE14323,NCI,GSE16757, GSE19977,GSE20017,GSE25097,GSE36376,GSE36411, GSE39791,GSE43619,GSE45436,GSE46444,GSE50579, GSE54236,GSE57957,GSE62043,GSE62232,GSE63898, GSE64041,GSE76297,GSE76427,GSE84005,GSE87630,GSE9843, TCGA-LIHC和ICGC-LIRI-JP,其中NCI TCGA-LIHC和ICHC-LIRI-JP 具有完整的表达信息和临床预后信息;
然后再采用affy软件包中的rma函数对来自Affymetrix平台的原始数据进行标准化,来自其他平台的数据直接下载标准化过的矩阵文件,之后再使用SVA包中的combat算法进行批次矫正, TCGA-LIHC队列的RNA-seq数据从UCSC-Xena数据库获得,并进一步转化为log2(TPM+1),ICGC-LIRI-JP数据集的RNA-seq数据直接从ICGC数据门户网站获得,随后,再对训练集和验证集的表达数据均转化为z-scoring,相应的临床和样本信息从GEO,UCSC和ICGC 数据库中获得,对于TCGA-LIHC中的体细胞突变数据、拷贝数变异数据和DNA甲基化数据均从TCGA门户网站下载,此外,从Thorsson 等人的研究中计算或招募了肿瘤突变负荷、单核苷酸变异和插入缺失新抗原负荷、微卫星不稳定性、癌睾丸抗原评分和TCR/BCR多样性等进行后续研究;
步骤二、异质性铁死亡亚型的识别和验证:接着再将来自于30 个GEO发现队列的共3327个样本作为发现队列,并通过 ConsensusClusterPlus软件包进一步分为k组(k=2~9),根据共识得分的CDF曲线,我们发现k=2是最优选择,之后,再应用 PAC和NbClust两种方法进行验证并得到了相同的结果,基于74个 FRGs的表达,这两个亚型的样本在二维主成分图上显著分离,为了确保GEO发现队列聚类结果的可靠性和稳定性,进一步在TCGA和ICGC 两个验证队列进行了IGP分析,结果显示,TCGA队列中C1的IGP值为90.3%,C2的IGP值为92.9%,而ICGC队列中C1的IGP值为88.4%和91.7%(所有p<0.001),与此一致的是NbClust也表明,在两个队列中分为两个亚型是最理想的,因此,根据聚类结果,最终将肝细胞癌样本分为C1和C2两种亚型;
过程中发现多数FRGs在C2明显上调,而C1则相反,从而铁死亡可以诱导肿瘤特异性免疫反应,增强免疫治疗的效果,进一步的相关性分析也提示HCC中74个FRGs的表达和TME细胞的浸润丰度之间存在强烈的相关性,进一步探索了TME细胞在两种亚型的浸润差异,结果显示C1的总体浸润水平较高,除了丰富的免疫激活细胞, C1还显示出更高丰度的免疫抑制细胞;
为进一步明确两种亚型的生物学特征,分别利用Hallmark和 KEGG基因集进行GSVA富集分析,C1明显富集在炎症相关通路中,如同种异体移植排斥反应、炎症反应和T细胞受体信号通路;而C2 主要与代谢相关通路密切相关,包括氧化磷酸化、脂肪酸代谢、胆汁酸代谢和氨基酸代谢,之后从TCGA和ICGC两个验证队列也获得了相似的结果,综合以上结果,我们定义两种分子亚型如下:1)高免疫低代谢型(C1):低水平的FRGs表达和炎症相关通路的富集以及高丰度的免疫细胞浸润;2)高代谢低免疫型(C2):高水平的FRGs 表达和代谢相关通路富集以及低丰度的免疫细胞浸润;
步骤三、两亚型的临床状态:然后再用Kaplan-Meier对两亚型样本进行生存分析,结果显示C2的OS和RFS优于C1,研究表明,案例可以通过抑制Xc-系统诱导铁死亡,使用pRRophetic软件包预测了两种亚型对索拉非尼的敏感性,结果提示C2更有可能从索拉非尼的治疗中获益,此外,之前的分析显示C1具有较丰富的免疫细胞浸润,免疫检查点分子(如PD-L1和CTLA-4)也在C1中过度表达,结果均表明C1可能对免疫治疗更敏感,因此,再进一步评估了免疫治疗对两种亚型的有效性,使用TIDE网页工具,C1的反应高于C2,在TCGA和ICGC两个验证队列中也获得了相似的结果,同时还利用 GenePattern平台的Submap算法来评估两种亚型和47例接受全面免疫治疗的患者的表达谱的相似性,结果表明C1与抗PD-1治疗有效的患者显著相关,之后我们在两个验证队列中也获得了相似的结果,此外,我们还观察到C1亚型患者与年龄小于65岁、女性、较晚的AJCC 分期、较高的肿瘤分级以及血管侵犯显著相关,两种亚型之间的BMI 没有显著差异;
步骤四、评估FRRS在预测预后和免疫治疗疗效上的表现:在 DEGs、SMGs、CAGs和ESGs四个不同来源的显著基因中,再挑选至少 2/4来源的33个基因进行进一步研究,单因素COX回归分析表明,6 个基因具有显著的预后意义(p<0.05),接下来,再纳入了这6 个基因(p<0.05)进行多因素COX回归分析,采用逐步回归替代法,基于最小的AIC值,确定最佳模型:FRRS=0.348*Expression (SLC16A3)-0.151*Expression(CPS1),生存分析显示高FRRS患者的预后更差,一致性指数分析也证实,FRRS在TCGA、ICGC和NCI 的三个独立队列中具有较高的准确性,结合临床因素,我们通过多因素Cox回归分析观察到FRRS是HCC的独立预后因素;
探索与免疫治疗反应有关的FRRS的生物学特征后,发现FRRS 与HAVCR2、CTLA4和PDCD1等ICP分子的表达,以及Treg细胞和MDSC 的浸润模式呈显著正相关,因此,再纳入了3个免疫治疗队列,以进一步研究FRRS是否可以预测患者对免疫治疗的反应性,与上述一致,高FRRS患者在这三个队列中均显示出了不利的生存期,此外,临床上对免疫治疗起反应的患者也展现出更低的FRRS,表明FRRS 较低的患者更有可能从免疫治疗中获益,采用ROC曲线的曲线下面积(AUC)评估FRRS预测免疫治疗反应的准确性,这些结果强烈提示FRRS是一个可靠的生物标志物,然后,再计算7种广泛使用的免疫治疗生物标志物,包括TMB、TIDE、MSI评分、Merck18、IFGN、 CD8和CD274,在所有三个队列中,FRRS在预测免疫治疗方面提供了更高的准确性,值得注意的是,虽然在FRRS在GSE78220队列中的预测能力比TIDE略低,但TIDE在预测IMvigor210队列和GSE100797 队列对免疫治疗的反应方面表现更差,综上,研究强有力地证实了 FRRS可用来评估肿瘤的免疫治疗反应和预测患者的预后,并且优于当前广泛使用的生物标记物;
步骤五、HCCS程序包的开发:基于质心法和皮尔森关联性分析,开发了名为HCCS的R程序包,HCCS中的ferroptosis_phenotype 可以将数据中的HCC样本划分到对应的铁死亡亚型C1或C2,并计算每个样本的FRRS,进一步可以预测患者的预后和评估患者的免疫治疗疗效,从而更好地服务于临床。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,基于铁死亡相关基因的HCC亚型的构建的过程中,共找到74个铁死亡相关基因,利用Consensus Cluster Plus软件包对GEO发现队列进行基于FRGs表达的共识聚类,且聚类方法采用基于欧氏距离的Kmeans算法,过程中进行1000次迭代,每次迭代取80%的样本,聚类数量设定为2~9个,通过共识评分的累积分布函数(CDF)和模糊聚类比例(PAC)确定最佳聚类数,之后应用NbClust包进一步验证最佳聚类数,最后再采用主成分分析在二维空间中区分不同亚型的信息。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,铁死亡相关亚型的验证过程中,使用clusterRepro软件包中的 in-group proportion(IGP)方法对TCGA和ICGC验证队列中的数据进行分析,IGP被定义为某一亚型样本的最近的邻居也被分配到同一亚型中的比例,为了测量IGP,首先计算了GEO发现队列中每种亚型的质心,再将TCGA和ICGC验证队列中的每份样本分配至质心和样本之间Pearson相关系数最高的特定亚型,用P值,即零分布IGP 比实际聚类IGP多出的部分,来评估聚类质量,如果两个队列之间的聚类足够相似,则IGP接近100%,反之接近0%,clusterRepro 包中的排列设置为2000。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,功能分析和免疫浸润评估过程中,对两种亚型的HCC样本进行了基因集变异分析(GSVA),从Molecular SignaturesDatabase下载了 Hallmark和KEGG基因集,并使用GSVA软件包进一步将基因表达矩阵转化为基因集矩阵,之后再使用limma软件包对C1和C2两种亚型进行基因集差异分析,筛选阈值设定为|logFC|>0.2,校正过的 P值<0.05,校正过的P值从Benjamini–Hochberg多重检验获得,且获得了23种免疫细胞的标记物,包括:固有免疫细胞(活化的树突状细胞,CD56+自然杀伤细胞,CD56-自然杀伤细胞,嗜酸性粒细胞,未成熟的树突状细胞,巨噬细胞,肥大细胞,MDSC,单核细胞,自然杀伤细胞,中性粒细胞,和浆细胞样树突状细胞)和适应性免疫细胞(活化B细胞、活化CD4+ T细胞、活化CD8+ T细胞、γδT 细胞、未成熟B细胞、自然杀伤T细胞、Treg细胞、滤泡辅助性T 细胞、Th1细胞、Th2细胞和Th17细胞),此外,内皮细胞和成纤维细胞也是TME的重要组成部分,在肿瘤炎症、血管生成、侵袭和转移中起着至关重要的作用,基于这些标记,应用单样本基因集富集分析(ssGSEA)算法评价25个TME细胞的浸润丰度。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,分型的临床特征、预后情况以及临床治疗反应预测过程中,比较两种亚型在年龄、性别、BMI、AJCC分期、分级和血管浸润方面的差异,并通过Kaplan-Meier生存分析估计了无复发生存期和总生存期,之后,应用pRRophetic软件包预测GEO发现队列和TCGA、ICGC验证队列对索拉菲尼的敏感性,通过岭回归估算样本的半数抑制浓度(IC50), IC50越小说明亚型对索拉菲尼的治疗越敏感,此外,还利用了TIDE 网页工具预测两种亚型对免疫治疗的敏感性,Submap算法被用来评价两种亚型和免疫治疗敏感/不敏感人群之间基因表达模式的相似度。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,两种亚型的基因组变异景观分析过程中,利用MutSigCV 1.41软件鉴定了两种亚型中的显著突变基因(SMGs),保留q值<0.05的基因进一步分析,MutationalPatterns软件包被用来提取各亚型的突变特征,非负矩阵分解(NMF)被用来确定突变特征的最佳数量,最终提示3个最佳,然后,再计算提取的突变特征与COSMIC数据库中已有的30个突变特征之间的余弦相似度,并以最相似的COSMIC特征对提取的特征进行命名,GenePattern中的GISTIC 2.0软件被用来识别显著扩增或缺失的体细胞拷贝数变异情况,再由以下程序来鉴定表观遗传学沉默基因(ESGs):(1)排除正常组织中甲基化的CpG 位点(平均β值>0.2);(2)以截断值(β值=0.3)为界将数据分为甲基化组和未甲基化组,并进一步去除甲基化组中甲基化频率少于10%肿瘤样本的探针;(3)对于每个探针,如果非甲基化组与甲基化组中对应基因的平均表达差值>1.64个未甲基化组的标准差,该探针将被标记为表观遗传学沉默;(4)当多个探针被分配到同一基因时,具有一半以上的相应探针的基因被标记为表观遗传沉默,则该基因被识别为ESG。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,构建铁死亡相关基因风险评分过程中,应用limma软件包来识别两种亚型之间的差异表达基因,校正后的P值从Benjamini–Hochberg多重检验活动并设置阈值:|log FC|>1和校正后的P值<0.05后,利用MutSigCV 1.41软件识别了两亚型的显著突变基因,利用GISTIC2.0软件包识别了两种亚型的显著拷贝数变异相关基因,利用 Venn图说明4个基因集之间的关系,然后选择至少存在于2个基因集中的基因进行进一步分析,单因素Cox回归分析被用来发现这些基因的预后价值,将具有显著统计学意义(p<0.05)的基因纳入多变量Cox回归分析中,之后,再利用逐步回归替代法构建了铁死亡相关风险评分(FRRS),并在AIC评分最小时选择最优模型,该最佳模型如下:
risk score=∑Expression(gene)*coef(gene);
其中expression(gene)表示基因的表达水平,coef(gene) 表示其回归系数,最后再根据survminer软件包确定的最佳临界值将HCC样本分为高FRRS组和低FRRS组,在三个独立队列(TCGA、 ICGC和NCI)中对FRRS进行了Kaplan-Meier分析,并进一步使用一致性指数(C指数)评估了模型的预测准确性。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,免疫治疗队列和治疗生物标志物的收集过程中,收集了公开的、有表达数据和完整临床信息的免疫治疗队列,以下3个队列最终被纳入研究中:(1)接受抗PD-L1抗体atezolizumab干预的晚期尿路上皮癌患者(IMvigor210队列);(2)接受抗PD-1抗体pembrolizumab 治疗的转移性黑色素瘤患者(GSE78220队列);(3)接受过继性T 细胞治疗的黑色素瘤患者(GSE100797队列),之后,再根据RECIST v1.1标准,排除治疗有效性无法评估的患者,在研究中完全缓解和部分缓解被视为免疫治疗缓解,与此同时疾病稳定和疾病进展则被视为免疫治疗无应答,将标准化表达数据进一步转化为z-scoring,在三个免疫治疗队列中评价了FRRS的预测性能,并将FRRS与其他7 种已知生物标志物进行了比较,包括TMB、TIDE、MSI评分、Merck18、 IFGN、CD8和CD274,应用受试者工作者曲线(ROC)和ROC曲线下面积(AUC)来评估不同生物标志物对免疫治疗反应的预测准确性。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,肝细胞癌中铁死亡相关基因的基因组变异景观过程中,根据收集到的74 个FRGs在TCGA-LIHC队列中的表达情况,总结出了FRGs的多组学变异情况,根据这些基因,明显地将肿瘤组织与正常组织区分开,大部多数FRGs在肿瘤和正常组织中表现出了显著的表达差异,进一步的研究发现,FRGs的突变频率很低,但拷贝数变异(CNVs)广泛存在,这表明相对于突变,CNVs可能在FRGs的调节中起主导作用,其中EGLN1、ENPP2和MUC1集中在拷贝数的扩增上,而SLC39A14、 ALOX15和ACSL1有很高的缺失频率,此外,DNA甲基化对FRGs(如 ACSL1、ACSL5和SCD等)也表现出广泛的调节作用,单因素Cox回归分析进一步证明大部分FRGs对HCC起保护作用,符合FRGs的保护生物学功能,上述的分析结果表明DNA甲基化和拷贝数变异而不是突变在HCC的铁死亡过程中发挥着重要作用。
与现有技术相比,本发明的有益效果是:
1、该基于铁死亡进程的肝细胞癌分型体系的构建方法通过探索FRGs在HCC中的表达情况、异质性铁死亡亚型的识别和验证、两亚型的临床状态、评估FRRS在预测预后和免疫治疗疗效上的表现以及HCCS程序包的开发的步骤配合,共纳入了32个数据集的3933个肝癌样本进行分析,分为低铁死亡亚型和高铁死亡亚型,并显示出了特异的功能特征和临床结局,此外,基于铁死亡分型,还提出了一个铁死亡相关风险评分(FRRS),FRRS在预测预后和免疫治疗来疗效中都展示了较好的效果,可为铁死亡在肝癌中的研究奠定了基础,以及为肝癌的临床管理和靶向治疗提供了依据和参考,且根据收集到的74个FRGs在TCGA-LIHC队列中的表达情况,可以明显地将肿瘤组织与正常组织区分开,大部多数FRGs在肿瘤和正常组织中表现出了显著的表达差异,且FRGs的突变频率很低,但拷贝数变异 (CNVs)广泛存在,这表明相对于突变,CNVs可能在FRGs的调节中起主导作用,其中EGLN1、ENPP2和MUC1集中在拷贝数的扩增上,而SLC39A14、ALOX15和ACSL1有很高的缺失频率。此外,DNA甲基化对FRGs(如ACSL1、ACSL5和SCD等)也表现出广泛的调节作用,单因素Cox回归分析进一步证明大部分FRGs对HCC起保护作用,符合FRGs的保护生物学功能,基于铁死亡过程的HCC分型模式,并找到一种新的肝细胞癌生物标志物:FRRS,其在预测HCC的预后和免疫治疗疗效上具有极佳的性能,且开发了一个R程序包:HCCS,可以方便地将HCC患者划分到不同的铁死亡亚型,为实现HCC患者的早期诊断、个体化治疗和全程管理带来了曙光。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供的一种实施例:
一种基于铁死亡进程的肝细胞癌分型体系的构建方法,包括如下步骤:
步骤一、探索FRGs在HCC中的表达情况:首先分别纳入来自于 GEO,TCGA和ICGC数据库的32个数据集共3933个肝细胞癌样本,且32个数据集分别为GSE102079,GSE107170,GSE109211, GSE112790,GSE116174,GSE121248,GSE14323,NCI,GSE16757, GSE19977,GSE20017,GSE25097,GSE36376,GSE36411, GSE39791,GSE43619,GSE45436,GSE46444,GSE50579, GSE54236,GSE57957,GSE62043,GSE62232,GSE63898, GSE64041,GSE76297,GSE76427,GSE84005,GSE87630,GSE9843, TCGA-LIHC和ICGC-LIRI-JP,其中NCI TCGA-LIHC和ICHC-LIRI-JP 具有完整的表达信息和临床预后信息;
然后再采用affy软件包中的rma函数对来自Affymetrix平台的原始数据进行标准化,来自其他平台的数据直接下载标准化过的矩阵文件,之后再使用SVA包中的combat算法进行批次矫正, TCGA-LIHC队列的RNA-seq数据从UCSC-Xena数据库获得,并进一步转化为log2(TPM+1),ICGC-LIRI-JP数据集的RNA-seq数据直接从ICGC数据门户网站获得,随后,再对训练集和验证集的表达数据均转化为z-scoring,相应的临床和样本信息从GEO,UCSC和ICGC 数据库中获得,对于TCGA-LIHC中的体细胞突变数据、拷贝数变异数据和DNA甲基化数据均从TCGA门户网站下载,此外,从Thorsson 等人的研究中计算或招募了肿瘤突变负荷、单核苷酸变异和插入缺失新抗原负荷、微卫星不稳定性、癌睾丸抗原评分和TCR/BCR多样性等进行后续研究;
步骤二、异质性铁死亡亚型的识别和验证:接着再将来自于30 个GEO发现队列的共3327个样本作为发现队列,并通过 ConsensusClusterPlus软件包进一步分为k组(k=2~9),根据共识得分的CDF曲线,我们发现k=2是最优选择,之后,再应用 PAC和NbClust两种方法进行验证并得到了相同的结果,基于74个 FRGs的表达,这两个亚型的样本在二维主成分图上显著分离,为了确保GEO发现队列聚类结果的可靠性和稳定性,进一步在TCGA和ICGC 两个验证队列进行了IGP分析,结果显示,TCGA队列中C1的IGP值为90.3%,C2的IGP值为92.9%,而ICGC队列中C1的IGP值为88.4%和91.7%(所有p<0.001),与此一致的是NbClust也表明,在两个队列中分为两个亚型是最理想的,因此,根据聚类结果,最终将肝细胞癌样本分为C1和C2两种亚型;
过程中发现多数FRGs在C2明显上调,而C1则相反,从而铁死亡可以诱导肿瘤特异性免疫反应,增强免疫治疗的效果,进一步的相关性分析也提示HCC中74个FRGs的表达和TME细胞的浸润丰度之间存在强烈的相关性,进一步探索了TME细胞在两种亚型的浸润差异,结果显示C1的总体浸润水平较高,除了丰富的免疫激活细胞, C1还显示出更高丰度的免疫抑制细胞;
为进一步明确两种亚型的生物学特征,分别利用Hallmark和 KEGG基因集进行GSVA富集分析,C1明显富集在炎症相关通路中,如同种异体移植排斥反应、炎症反应和T细胞受体信号通路;而C2 主要与代谢相关通路密切相关,包括氧化磷酸化、脂肪酸代谢、胆汁酸代谢和氨基酸代谢,之后从TCGA和ICGC两个验证队列也获得了相似的结果,综合以上结果,我们定义两种分子亚型如下:1)高免疫低代谢型(C1):低水平的FRGs表达和炎症相关通路的富集以及高丰度的免疫细胞浸润;2)高代谢低免疫型(C2):高水平的FRGs 表达和代谢相关通路富集以及低丰度的免疫细胞浸润;
步骤三、两亚型的临床状态:然后再用Kaplan-Meier对两亚型样本进行生存分析,结果显示C2的OS和RFS优于C1,研究表明,案例可以通过抑制Xc-系统诱导铁死亡,使用pRRophetic软件包预测了两种亚型对索拉非尼的敏感性,结果提示C2更有可能从索拉非尼的治疗中获益,此外,之前的分析显示C1具有较丰富的免疫细胞浸润,免疫检查点分子(如PD-L1和CTLA-4)也在C1中过度表达,结果均表明C1可能对免疫治疗更敏感,因此,再进一步评估了免疫治疗对两种亚型的有效性,使用TIDE网页工具,C1的反应高于C2,在TCGA和ICGC两个验证队列中也获得了相似的结果,同时还利用 GenePattern平台的Submap算法来评估两种亚型和47例接受全面免疫治疗的患者的表达谱的相似性,结果表明C1与抗PD-1治疗有效的患者显著相关,之后我们在两个验证队列中也获得了相似的结果,此外,我们还观察到C1亚型患者与年龄小于65岁、女性、较晚的AJCC 分期、较高的肿瘤分级以及血管侵犯显著相关,两种亚型之间的BMI 没有显著差异;
步骤四、评估FRRS在预测预后和免疫治疗疗效上的表现:在 DEGs、SMGs、CAGs和ESGs四个不同来源的显著基因中,再挑选至少 2/4来源的33个基因进行进一步研究,单因素COX回归分析表明,6 个基因具有显著的预后意义(p<0.05),接下来,再纳入了这6 个基因(p<0.05)进行多因素COX回归分析,采用逐步回归替代法,基于最小的AIC值,确定最佳模型:FRRS=0.348*Expression (SLC16A3)-0.151*Expression(CPS1),生存分析显示高FRRS患者的预后更差,一致性指数分析也证实,FRRS在TCGA、ICGC和NCI 的三个独立队列中具有较高的准确性,结合临床因素,我们通过多因素Cox回归分析观察到FRRS是HCC的独立预后因素;
探索与免疫治疗反应有关的FRRS的生物学特征后,发现FRRS 与HAVCR2、CTLA4和PDCD1等ICP分子的表达,以及Treg细胞和MDSC 的浸润模式呈显著正相关,因此,再纳入了3个免疫治疗队列,以进一步研究FRRS是否可以预测患者对免疫治疗的反应性,与上述一致,高FRRS患者在这三个队列中均显示出了不利的生存期,此外,临床上对免疫治疗起反应的患者也展现出更低的FRRS,表明FRRS 较低的患者更有可能从免疫治疗中获益,采用ROC曲线的曲线下面积(AUC)评估FRRS预测免疫治疗反应的准确性,这些结果强烈提示FRRS是一个可靠的生物标志物,然后,再计算7种广泛使用的免疫治疗生物标志物,包括TMB、TIDE、MSI评分、Merck18、IFGN、 CD8和CD274,在所有三个队列中,FRRS在预测免疫治疗方面提供了更高的准确性,值得注意的是,虽然在FRRS在GSE78220队列中的预测能力比TIDE略低,但TIDE在预测IMvigor210队列和GSE100797 队列对免疫治疗的反应方面表现更差,综上,研究强有力地证实了 FRRS可用来评估肿瘤的免疫治疗反应和预测患者的预后,并且优于当前广泛使用的生物标记物;
步骤五、HCCS程序包的开发:基于质心法和皮尔森关联性分析,开发了名为HCCS的R程序包,HCCS中的ferroptosis_phenotype 可以将数据中的HCC样本划分到对应的铁死亡亚型C1或C2,并计算每个样本的FRRS,进一步可以预测患者的预后和评估患者的免疫治疗疗效,从而更好地服务于临床,通过探索FRGs在HCC中的表达情况、异质性铁死亡亚型的识别和验证、两亚型的临床状态、评估FRRS 在预测预后和免疫治疗疗效上的表现以及HCCS程序包的开发的步骤配合,共纳入了32个数据集的3933个肝癌样本进行分析,分为低铁死亡亚型和高铁死亡亚型,并显示出了特异的功能特征和临床结局,此外,基于铁死亡分型,还提出了一个铁死亡相关风险评分 (FRRS),FRRS在预测预后和免疫治疗来疗效中都展示了较好的效果,可为铁死亡在肝癌中的研究奠定了基础,以及为肝癌的临床管理和靶向治疗提供了依据和参考,且根据收集到的74个FRGs在 TCGA-LIHC队列中的表达情况,可以明显地将肿瘤组织与正常组织区分开,大部多数FRGs在肿瘤和正常组织中表现出了显著的表达差异,且FRGs的突变频率很低,但拷贝数变异(CNVs)广泛存在,这表明相对于突变,CNVs可能在FRGs的调节中起主导作用,其中EGLN1、 ENPP2和MUC1集中在拷贝数的扩增上,而SLC39A14、ALOX15和ACSL1 有很高的缺失频率,此外,DNA甲基化对FRGs(如ACSL1、ACSL5和SCD等)也表现出广泛的调节作用,单因素Cox回归分析进一步证明大部分FRGs对HCC起保护作用,符合FRGs的保护生物学功能,基于铁死亡过程的HCC分型模式,并找到一种新的肝细胞癌生物标志物:FRRS,其在预测HCC的预后和免疫治疗疗效上具有极佳的性能,且开发了一个R程序包:HCCS,可以方便地将HCC患者划分到不同的铁死亡亚型,为实现HCC患者的早期诊断、个体化治疗和全程管理带来了曙光。
在步骤一探索FRGs在HCC中的表达情况时,基于铁死亡相关基因的HCC亚型的构建的过程中,共找到74个铁死亡相关基因,利用 Consensus Cluster Plus软件包对GEO发现队列进行基于FRGs表达的共识聚类,且聚类方法采用基于欧氏距离的Kmeans算法,过程中进行1000次迭代,每次迭代取80%的样本,聚类数量设定为2~9 个,通过共识评分的累积分布函数(CDF)和模糊聚类比例(PAC) 确定最佳聚类数,之后应用NbClust包进一步验证最佳聚类数,最后再采用主成分分析在二维空间中区分不同亚型的信息,精准分析 74个铁死亡相关基因的不同亚型信息,提高74个铁死亡相关基因的信息精准率。
在步骤一探索FRGs在HCC中的表达情况时,铁死亡相关亚型的验证过程中,使用clusterRepro软件包中的in-group proportion (IGP)方法对TCGA和ICGC验证队列中的数据进行分析,IGP被定义为某一亚型样本的最近的邻居也被分配到同一亚型中的比例,为了测量IGP,首先计算了GEO发现队列中每种亚型的质心,再将TCGA 和ICGC验证队列中的每份样本分配至质心和样本之间Pearson相关系数最高的特定亚型,用P值,即零分布IGP比实际聚类IGP多出的部分,来评估聚类质量,如果两个队列之间的聚类足够相似,则 IGP接近100%,反之接近0%,clusterRepro包中的排列设置为2000,增强铁死亡相关亚型的验证效果,避免铁死亡相关亚型的验证出现错误,给研究人员造成误判走入误区。
在步骤一探索FRGs在HCC中的表达情况时,功能分析和免疫浸润评估过程中,对两种亚型的HCC样本进行了基因集变异分析 (GSVA),从Molecular Signatures Database下载了Hallmark和 KEGG基因集,并使用GSVA软件包进一步将基因表达矩阵转化为基因集矩阵,之后再使用limma软件包对C1和C2两种亚型进行基因集差异分析,筛选阈值设定为|logFC|>0.2,校正过的P值<0.05。校正过的P值从Benjamini–Hochberg多重检验获得,且获得了23 种免疫细胞的标记物,包括:固有免疫细胞(活化的树突状细胞,CD56+自然杀伤细胞,CD56-自然杀伤细胞,嗜酸性粒细胞,未成熟的树突状细胞,巨噬细胞,肥大细胞,MDSC,单核细胞,自然杀伤细胞,中性粒细胞,和浆细胞样树突状细胞)和适应性免疫细胞(活化B细胞、活化CD4+ T细胞、活化CD8+ T细胞、γδT细胞、未成熟B细胞、自然杀伤T细胞、Treg细胞、滤泡辅助性T细胞、Th1 细胞、Th2细胞和Th17细胞),此外,内皮细胞和成纤维细胞也是TME的重要组成部分,在肿瘤炎症、血管生成、侵袭和转移中起着至关重要的作用,基于这些标记,应用单样本基因集富集分析(ssGSEA) 算法评价25个TME细胞的浸润丰度,对各基因集进行精准功能分析和免疫浸润评估,且提升各基因集的全面性。
在步骤一探索FRGs在HCC中的表达情况时,分型的临床特征、预后情况以及临床治疗反应预测过程中,比较两种亚型在年龄、性别、BMI、AJCC分期、分级和血管浸润方面的差异,并通过 Kaplan-Meier生存分析估计了无复发生存期和总生存期,之后,应用pRRophetic软件包预测GEO发现队列和TCGA、ICGC验证队列对索拉菲尼的敏感性,通过岭回归估算样本的半数抑制浓度(IC50), IC50越小说明亚型对索拉菲尼的治疗越敏感,此外,还利用了TIDE 网页工具预测两种亚型对免疫治疗的敏感性,Submap算法被用来评价两种亚型和免疫治疗敏感/不敏感人群之间基因表达模式的相似度,对分型的临床特征、预后情况以及临床治疗反应进行准确预测,为研究人员提供辅助参考依据。
在步骤一探索FRGs在HCC中的表达情况时,两种亚型的基因组变异景观分析过程中,利用MutSigCV 1.41软件鉴定了两种亚型中的显著突变基因(SMGs),保留q值<0.05的基因进一步分析, MutationalPatterns软件包被用来提取各亚型的突变特征,非负矩阵分解(NMF)被用来确定突变特征的最佳数量,最终提示3个最佳,然后,再计算提取的突变特征与COSMIC数据库中已有的30个突变特征之间的余弦相似度,并以最相似的COSMIC特征对提取的特征进行命名,GenePattern中的GISTIC 2.0软件被用来识别显著扩增或缺失的体细胞拷贝数变异情况,再由以下程序来鉴定表观遗传学沉默基因(ESGs):(1)排除正常组织中甲基化的CpG位点(平均β值>0.2);(2)以截断值(β值=0.3)为界将数据分为甲基化组和未甲基化组,并进一步去除甲基化组中甲基化频率少于10%肿瘤样本的探针;(3)对于每个探针,如果非甲基化组与甲基化组中对应基因的平均表达差值>1.64个未甲基化组的标准差,该探针将被标记为表观遗传学沉默;(4)当多个探针被分配到同一基因时,具有一半以上的相应探针的基因被标记为表观遗传沉默,则该基因被识别为ESG,提高两种亚型的基因组变异景观的分析精确度,以便研究人员快速且精准的对两种亚型的基因组变异景观进行分析。
在步骤一探索FRGs在HCC中的表达情况时,构建铁死亡相关基因风险评分过程中,应用limma软件包来识别两种亚型之间的差异表达基因,校正后的P值从Benjamini–Hochberg多重检验活动并设置阈值:|log FC|>1和校正后的P值<0.05后,利用MutSigCV1.41软件识别了两亚型的显著突变基因,利用GISTIC2.0软件包识别了两种亚型的显著拷贝数变异相关基因,利用Venn图说明4个基因集之间的关系,然后选择至少存在于2个基因集中的基因进行进一步分析,单因素Cox回归分析被用来发现这些基因的预后价值,将具有显著统计学意义(p<0.05)的基因纳入多变量Cox回归分析中,之后,再利用逐步回归替代法构建了铁死亡相关风险评分 (FRRS),并在AIC评分最小时选择最优模型,该最佳模型如下:
risk score=∑Expression(gene)*coef(gene);
其中expression(gene)表示基因的表达水平,coef(gene) 表示其回归系数,最后再根据survminer软件包确定的最佳临界值将HCC样本分为高FRRS组和低FRRS组,在三个独立队列(TCGA、 ICGC和NCI)中对FRRS进行了Kaplan-Meier分析,并进一步使用一致性指数(C指数)评估了模型的预测准确性,采用公式计算,模型展示的方式对构建铁死亡相关基因进行风险评分,提高构建铁死亡相关基因风险的直观性和准确性。
在步骤一探索FRGs在HCC中的表达情况时,免疫治疗队列和治疗生物标志物的收集过程中,收集了公开的、有表达数据和完整临床信息的免疫治疗队列,以下3个队列最终被纳入研究中:(1)接受抗PD-L1抗体atezolizumab干预的晚期尿路上皮癌患者(IMvigor210队列);(2)接受抗PD-1抗体pembrolizumab治疗的转移性黑色素瘤患者(GSE78220队列);(3)接受过继性T细胞治疗的黑色素瘤患者(GSE100797队列),之后,再根据RECIST v1.1 标准,排除治疗有效性无法评估的患者,在研究中完全缓解和部分缓解被视为免疫治疗缓解,与此同时疾病稳定和疾病进展则被视为免疫治疗无应答,将标准化表达数据进一步转化为z-scoring,在三个免疫治疗队列中评价了FRRS的预测性能,并将FRRS与其他7种已知生物标志物进行了比较,包括TMB、TIDE、MSI评分、Merck18、 IFGN、CD8和CD274,应用受试者工作者曲线(ROC)和ROC曲线下面积(AUC)来评估不同生物标志物对免疫治疗反应的预测准确性,扩大了免疫治疗队列和治疗生物标志物的收集范围,提高免疫治疗队列和治疗生物标志物的收集全面性。
在步骤一探索FRGs在HCC中的表达情况时,肝细胞癌中铁死亡相关基因的基因组变异景观过程中,根据收集到的74个FRGs在 TCGA-LIHC队列中的表达情况,总结出了FRGs的多组学变异情况,根据这些基因,明显地将肿瘤组织与正常组织区分开,大部多数FRGs在肿瘤和正常组织中表现出了显著的表达差异,进一步的研究发现, FRGs的突变频率很低,但拷贝数变异(CNVs)广泛存在,这表明相对于突变,CNVs可能在FRGs的调节中起主导作用,其中EGLN1、ENPP2 和MUC1集中在拷贝数的扩增上,而SLC39A14、ALOX15和ACSL1有很高的缺失频率,此外,DNA甲基化对FRGs(如ACSL1、ACSL5和SCD 等)也表现出广泛的调节作用,单因素Cox回归分析进一步证明大部分FRGs对HCC起保护作用,符合FRGs的保护生物学功能,上述的分析结果表明DNA甲基化和拷贝数变异而不是突变在HCC的铁死亡过程中发挥着重要作用,从而直接披露出肝细胞癌中铁死亡相关基因的基因组变异景观信息,为研究人员提供参考方向。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (9)
1.一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:包括如下步骤:
步骤一、探索FRGs在HCC中的表达情况:首先分别纳入来自于GEO,TCGA和ICGC数据库的32个数据集共3933个肝细胞癌样本,且32个数据集分别为GSE102079,GSE107170,GSE109211,GSE112790,GSE116174,GSE121248,GSE14323,NCI,GSE16757,GSE19977,GSE20017,GSE25097,GSE36376,GSE36411,GSE39791,GSE43619,GSE45436,GSE46444,GSE50579,GSE54236,GSE57957,GSE62043,GSE62232,GSE63898,GSE64041,GSE76297,GSE76427,GSE84005,GSE87630,GSE9843,TCGA-LIHC和ICGC-LIRI-JP,其中NCI TCGA-LIHC和ICHC-LIRI-JP具有完整的表达信息和临床预后信息;
然后再采用affy软件包中的rma函数对来自Affymetrix平台的原始数据进行标准化,来自其他平台的数据直接下载标准化过的矩阵文件,之后再使用SVA包中的combat算法进行批次矫正,TCGA-LIHC队列的RNA-seq数据从UCSC-Xena数据库获得,并进一步转化为log2(TPM+1),ICGC-LIRI-JP数据集的RNA-seq数据直接从ICGC数据门户网站获得,随后,再对训练集和验证集的表达数据均转化为z-scoring,相应的临床和样本信息从GEO,UCSC和ICGC数据库中获得,对于TCGA-LIHC中的体细胞突变数据、拷贝数变异数据和DNA甲基化数据均从TCGA门户网站下载,此外,从Thorsson等人的研究中计算或招募了肿瘤突变负荷、单核苷酸变异和插入缺失新抗原负荷、微卫星不稳定性、癌睾丸抗原评分和TCR/BCR多样性等进行后续研究;
步骤二、异质性铁死亡亚型的识别和验证:接着再将来自于30个GEO发现队列的共3327个样本作为发现队列,并通过ConsensusClusterPlus软件包进一步分为k组(k=2~9),根据共识得分的CDF曲线,我们发现k=2是最优选择,之后,再应用PAC和NbClust两种方法进行验证并得到了相同的结果,基于74个FRGs的表达,这两个亚型的样本在二维主成分图上显著分离,为了确保GEO发现队列聚类结果的可靠性和稳定性,进一步在TCGA和ICGC两个验证队列进行了IGP分析,结果显示,TCGA队列中C1的IGP值为90.3%,C2的IGP值为92.9%,而ICGC队列中C1的IGP值为88.4%和91.7%(所有p<0.001),与此一致的是NbClust也表明,在两个队列中分为两个亚型是最理想的,因此,根据聚类结果,最终将肝细胞癌样本分为C1和C2两种亚型;
过程中发现多数FRGs在C2明显上调,而C1则相反,从而铁死亡可以诱导肿瘤特异性免疫反应,增强免疫治疗的效果,进一步的相关性分析也提示HCC中74个FRGs的表达和TME细胞的浸润丰度之间存在强烈的相关性,进一步探索了TME细胞在两种亚型的浸润差异,结果显示C1的总体浸润水平较高,除了丰富的免疫激活细胞,C1还显示出更高丰度的免疫抑制细胞;
为进一步明确两种亚型的生物学特征,分别利用Hallmark和KEGG基因集进行GSVA富集分析,C1明显富集在炎症相关通路中,如同种异体移植排斥反应、炎症反应和T细胞受体信号通路;而C2主要与代谢相关通路密切相关,包括氧化磷酸化、脂肪酸代谢、胆汁酸代谢和氨基酸代谢,之后从TCGA和ICGC两个验证队列也获得了相似的结果,综合以上结果,我们定义两种分子亚型如下:1)高免疫低代谢型(C1):低水平的FRGs表达和炎症相关通路的富集以及高丰度的免疫细胞浸润;2)高代谢低免疫型(C2):高水平的FRGs表达和代谢相关通路富集以及低丰度的免疫细胞浸润;
步骤三、两亚型的临床状态:然后再用Kaplan-Meier对两亚型样本进行生存分析,结果显示C2的OS和RFS优于C1,研究表明,案例可以通过抑制Xc-系统诱导铁死亡,使用pRRophetic软件包预测了两种亚型对索拉非尼的敏感性,结果提示C2更有可能从索拉非尼的治疗中获益,此外,之前的分析显示C1具有较丰富的免疫细胞浸润,免疫检查点分子(如PD-L1和CTLA-4)也在C1中过度表达,结果均表明C1可能对免疫治疗更敏感,因此,再进一步评估了免疫治疗对两种亚型的有效性,使用TIDE网页工具,C1的反应高于C2,在TCGA和ICGC两个验证队列中也获得了相似的结果,同时还利用GenePattern平台的Submap算法来评估两种亚型和47例接受全面免疫治疗的患者的表达谱的相似性,结果表明C1与抗PD-1治疗有效的患者显著相关,之后我们在两个验证队列中也获得了相似的结果,此外,我们还观察到C1亚型患者与年龄小于65岁、女性、较晚的AJCC分期、较高的肿瘤分级以及血管侵犯显著相关,两种亚型之间的BMI没有显著差异;
步骤四、评估FRRS在预测预后和免疫治疗疗效上的表现:在DEGs、SMGs、CAGs和ESGs四个不同来源的显著基因中,再挑选至少2/4来源的33个基因进行进一步研究,单因素COX回归分析表明,6个基因具有显著的预后意义(p<0.05),接下来,再纳入了这6个基因(p<0.05)进行多因素COX回归分析,采用逐步回归替代法,基于最小的AIC值,确定最佳模型:FRRS=0.348*Expression(SLC16A3)-0.151*Expression(CPS1),生存分析显示高FRRS患者的预后更差,一致性指数分析也证实,FRRS在TCGA、ICGC和NCI的三个独立队列中具有较高的准确性,结合临床因素,我们通过多因素Cox回归分析观察到FRRS是HCC的独立预后因素;
探索与免疫治疗反应有关的FRRS的生物学特征后,发现FRRS与HAVCR2、CTLA4和PDCD1等ICP分子的表达,以及Treg细胞和MDSC的浸润模式呈显著正相关,因此,再纳入了3个免疫治疗队列,以进一步研究FRRS是否可以预测患者对免疫治疗的反应性,与上述一致,高FRRS患者在这三个队列中均显示出了不利的生存期,此外,临床上对免疫治疗起反应的患者也展现出更低的FRRS,表明FRRS较低的患者更有可能从免疫治疗中获益,采用ROC曲线的曲线下面积(AUC)评估FRRS预测免疫治疗反应的准确性,这些结果强烈提示FRRS是一个可靠的生物标志物,然后,再计算7种广泛使用的免疫治疗生物标志物,包括TMB、TIDE、MSI评分、Merck18、IFGN、CD8和CD274,在所有三个队列中,FRRS在预测免疫治疗方面提供了更高的准确性,值得注意的是,虽然在FRRS在GSE78220队列中的预测能力比TIDE略低,但TIDE在预测IMvigor210队列和GSE100797队列对免疫治疗的反应方面表现更差,综上,研究强有力地证实了FRRS可用来评估肿瘤的免疫治疗反应和预测患者的预后,并且优于当前广泛使用的生物标记物;
步骤五、HCCS程序包的开发:基于质心法和皮尔森关联性分析,开发了名为HCCS的R程序包,HCCS中的ferroptosis_phenotype可以将数据中的HCC样本划分到对应的铁死亡亚型C1或C2,并计算每个样本的FRRS,进一步可以预测患者的预后和评估患者的免疫治疗疗效,从而更好地服务于临床。
2.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,基于铁死亡相关基因的HCC亚型的构建的过程中,共找到74个铁死亡相关基因,利用Consensus Cluster Plus软件包对GEO发现队列进行基于FRGs表达的共识聚类,且聚类方法采用基于欧氏距离的Kmeans算法,过程中进行1000次迭代,每次迭代取80%的样本,聚类数量设定为2~9个,通过共识评分的累积分布函数(CDF)和模糊聚类比例(PAC)确定最佳聚类数,之后应用NbClust 包进一步验证最佳聚类数,最后再采用主成分分析在二维空间中区分不同亚型的信息。
3.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,铁死亡相关亚型的验证过程中,使用clusterRepro软件包中的in-groupproportion(IGP)方法对TCGA和ICGC验证队列中的数据进行分析,IGP被定义为某一亚型样本的最近的邻居也被分配到同一亚型中的比例,为了测量IGP,首先计算了GEO发现队列中每种亚型的质心,再将TCGA和ICGC验证队列中的每份样本分配至质心和样本之间Pearson相关系数最高的特定亚型,用P值,即零分布IGP比实际聚类IGP多出的部分,来评估聚类质量,如果两个队列之间的聚类足够相似,则IGP接近100%,反之接近0%,clusterRepro包中的排列设置为2000。
4.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,功能分析和免疫浸润评估过程中,对两种亚型的HCC样本进行了基因集变异分析(GSVA),从Molecular Signatures Database下载了Hallmark和KEGG基因集,并使用GSVA软件包进一步将基因表达矩阵转化为基因集矩阵,之后再使用limma软件包对C1和C2两种亚型进行基因集差异分析,筛选阈值设定为|logFC|>0.2,校正过的P值<0.05,校正过的P值从Benjamini–Hochberg多重检验获得,且获得了23种免疫细胞的标记物,包括:固有免疫细胞(活化的树突状细胞,CD56+自然杀伤细胞,CD56-自然杀伤细胞,嗜酸性粒细胞,未成熟的树突状细胞,巨噬细胞,肥大细胞,MDSC,单核细胞,自然杀伤细胞,中性粒细胞,和浆细胞样树突状细胞)和适应性免疫细胞(活化B细胞、活化CD4+T细胞、活化CD8+T细胞、γδT细胞、未成熟B细胞、自然杀伤T细胞、Treg细胞、滤泡辅助性T细胞、Th1细胞、Th2细胞和Th17细胞),此外,内皮细胞和成纤维细胞也是TME的重要组成部分,在肿瘤炎症、血管生成、侵袭和转移中起着至关重要的作用,基于这些标记,应用单样本基因集富集分析(ssGSEA)算法评价25个TME细胞的浸润丰度。
5.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,分型的临床特征、预后情况以及临床治疗反应预测过程中,比较两种亚型在年龄、性别、BMI、AJCC分期、分级和血管浸润方面的差异,并通过Kaplan-Meier生存分析估计了无复发生存期和总生存期,之后,应用pRRophetic软件包预测GEO发现队列和TCGA、ICGC验证队列对索拉菲尼的敏感性,通过岭回归估算样本的半数抑制浓度(IC50),IC50越小说明亚型对索拉菲尼的治疗越敏感,此外,还利用了TIDE网页工具预测两种亚型对免疫治疗的敏感性,Submap算法被用来评价两种亚型和免疫治疗敏感/不敏感人群之间基因表达模式的相似度。
6.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,两种亚型的基因组变异景观分析过程中,利用MutSigCV 1.41软件鉴定了两种亚型中的显著突变基因(SMGs),保留q值<0.05的基因进一步分析,MutationalPatterns软件包被用来提取各亚型的突变特征,非负矩阵分解(NMF)被用来确定突变特征的最佳数量,最终提示3个最佳,然后,再计算提取的突变特征与COSMIC数据库中已有的30个突变特征之间的余弦相似度,并以最相似的COSMIC特征对提取的特征进行命名,GenePattern中的GISTIC 2.0软件被用来识别显著扩增或缺失的体细胞拷贝数变异情况,再由以下程序来鉴定表观遗传学沉默基因(ESGs):(1)排除正常组织中甲基化的CpG位点(平均β值>0.2);(2)以截断值(β值=0.3)为界将数据分为甲基化组和未甲基化组,并进一步去除甲基化组中甲基化频率少于10%肿瘤样本的探针;(3)对于每个探针,如果非甲基化组与甲基化组中对应基因的平均表达差值>1.64个未甲基化组的标准差,该探针将被标记为表观遗传学沉默;(4)当多个探针被分配到同一基因时,具有一半以上的相应探针的基因被标记为表观遗传沉默,则该基因被识别为ESG。
7.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,构建铁死亡相关基因风险评分过程中,应用limma软件包来识别两种亚型之间的差异表达基因,校正后的P值从Benjamini–Hochberg多重检验活动并设置阈值:|log FC|>1和校正后的P值<0.05后,利用MutSigCV1.41软件识别了两亚型的显著突变基因,利用GISTIC2.0软件包识别了两种亚型的显著拷贝数变异相关基因,利用Venn图说明4个基因集之间的关系,然后选择至少存在于2个基因集中的基因进行进一步分析,单因素Cox回归分析被用来发现这些基因的预后价值,将具有显著统计学意义(p<0.05)的基因纳入多变量Cox回归分析中,之后,再利用逐步回归替代法构建了铁死亡相关风险评分(FRRS),并在AIC评分最小时选择最优模型,该最佳模型如下:
risk score=∑Expression(gene)*coef(gene);
其中expression(gene)表示基因的表达水平,coef(gene)表示其回归系数,最后再根据survminer软件包确定的最佳临界值将HCC样本分为高FRRS组和低FRRS组,在三个独立队列(TCGA、ICGC和NCI)中对FRRS进行了Kaplan-Meier分析,并进一步使用一致性指数(C指数)评估了模型的预测准确性。
8.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,免疫治疗队列和治疗生物标志物的收集过程中,收集了公开的、有表达数据和完整临床信息的免疫治疗队列,以下3个队列最终被纳入研究中:(1)接受抗PD-L1抗体atezolizumab干预的晚期尿路上皮癌患者(IMvigor210队列);(2)接受抗PD-1抗体pembrolizumab治疗的转移性黑色素瘤患者(GSE78220队列);(3)接受过继性T细胞治疗的黑色素瘤患者(GSE100797队列),之后,再根据RECIST v1.1标准,排除治疗有效性无法评估的患者,在研究中完全缓解和部分缓解被视为免疫治疗缓解,与此同时疾病稳定和疾病进展则被视为免疫治疗无应答,将标准化表达数据进一步转化为z-scoring,在三个免疫治疗队列中评价了FRRS的预测性能,并将FRRS与其他7种已知生物标志物进行了比较,包括TMB、TIDE、MSI评分、Merck18、IFGN、CD8和CD274,应用受试者工作者曲线(ROC)和ROC曲线下面积(AUC)来评估不同生物标志物对免疫治疗反应的预测准确性。
9.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,肝细胞癌中铁死亡相关基因的基因组变异景观过程中,根据收集到的74个FRGs在TCGA-LIHC队列中的表达情况,总结出了FRGs的多组学变异情况,根据这些基因,明显地将肿瘤组织与正常组织区分开,大部多数FRGs在肿瘤和正常组织中表现出了显著的表达差异,进一步的研究发现,FRGs的突变频率很低,但拷贝数变异(CNVs)广泛存在,这表明相对于突变,CNVs可能在FRGs的调节中起主导作用,其中EGLN1、ENPP2和MUC1集中在拷贝数的扩增上,而SLC39A14、ALOX15和ACSL1有很高的缺失频率,此外,DNA甲基化对FRGs(如ACSL1、ACSL5和SCD等)也表现出广泛的调节作用,单因素Cox回归分析进一步证明大部分FRGs对HCC起保护作用,符合FRGs的保护生物学功能,上述的分析结果表明DNA甲基化和拷贝数变异而不是突变在HCC的铁死亡过程中发挥着重要作用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110231772.6A CN113192560A (zh) | 2021-03-02 | 2021-03-02 | 一种基于铁死亡进程的肝细胞癌分型体系的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110231772.6A CN113192560A (zh) | 2021-03-02 | 2021-03-02 | 一种基于铁死亡进程的肝细胞癌分型体系的构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113192560A true CN113192560A (zh) | 2021-07-30 |
Family
ID=76973046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110231772.6A Pending CN113192560A (zh) | 2021-03-02 | 2021-03-02 | 一种基于铁死亡进程的肝细胞癌分型体系的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113192560A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113782090A (zh) * | 2021-09-18 | 2021-12-10 | 中南大学湘雅三医院 | 铁死亡模型构建方法与应用 |
CN114045339A (zh) * | 2021-11-05 | 2022-02-15 | 山东第一医科大学附属省立医院(山东省立医院) | 铁死亡相关基因在弥漫大b细胞淋巴瘤预后评估中的应用 |
CN114386530A (zh) * | 2022-01-19 | 2022-04-22 | 复旦大学附属华山医院 | 基于深度学习的溃疡性结肠炎免疫分型的分类方法和系统 |
CN114480644A (zh) * | 2022-01-07 | 2022-05-13 | 深圳市龙华区人民医院 | 肺腺癌基于代谢基因的分子分型 |
CN114672569A (zh) * | 2022-05-24 | 2022-06-28 | 浙江大学医学院附属第一医院 | 基于色氨酸代谢基因的肝癌预后评估方法 |
CN115148287A (zh) * | 2022-09-01 | 2022-10-04 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 基因焦点扩增分型模型的构建方法及肿瘤样本的分型方法 |
CN115188415A (zh) * | 2022-07-12 | 2022-10-14 | 复旦大学附属肿瘤医院 | 一种基于免疫特征的肠癌分子分型方法和装置 |
CN116129998A (zh) * | 2023-01-19 | 2023-05-16 | 中国医学科学院肿瘤医院 | 一种食管鳞状细胞癌数据的处理方法及其系统 |
CN116386903A (zh) * | 2023-06-06 | 2023-07-04 | 中国医学科学院肿瘤医院 | 一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法 |
CN117741148A (zh) * | 2024-02-19 | 2024-03-22 | 苏州颐坤生物科技有限公司 | 一种用于免疫治疗疗效预测的标志物组合及模型构建方法和应用 |
CN118018531A (zh) * | 2024-04-09 | 2024-05-10 | 深圳市鸿普森科技股份有限公司 | 一种针对物业场景下的数字人一体机 |
-
2021
- 2021-03-02 CN CN202110231772.6A patent/CN113192560A/zh active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113782090A (zh) * | 2021-09-18 | 2021-12-10 | 中南大学湘雅三医院 | 铁死亡模型构建方法与应用 |
CN114045339A (zh) * | 2021-11-05 | 2022-02-15 | 山东第一医科大学附属省立医院(山东省立医院) | 铁死亡相关基因在弥漫大b细胞淋巴瘤预后评估中的应用 |
CN114480644A (zh) * | 2022-01-07 | 2022-05-13 | 深圳市龙华区人民医院 | 肺腺癌基于代谢基因的分子分型 |
CN114386530A (zh) * | 2022-01-19 | 2022-04-22 | 复旦大学附属华山医院 | 基于深度学习的溃疡性结肠炎免疫分型的分类方法和系统 |
CN114386530B (zh) * | 2022-01-19 | 2024-08-13 | 复旦大学附属华山医院 | 基于深度学习的溃疡性结肠炎免疫分型的分类方法和系统 |
CN114672569A (zh) * | 2022-05-24 | 2022-06-28 | 浙江大学医学院附属第一医院 | 基于色氨酸代谢基因的肝癌预后评估方法 |
CN115188415A (zh) * | 2022-07-12 | 2022-10-14 | 复旦大学附属肿瘤医院 | 一种基于免疫特征的肠癌分子分型方法和装置 |
CN115148287B (zh) * | 2022-09-01 | 2024-05-31 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 基因焦点扩增分型模型的构建方法及肿瘤样本的分型方法 |
CN115148287A (zh) * | 2022-09-01 | 2022-10-04 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 基因焦点扩增分型模型的构建方法及肿瘤样本的分型方法 |
CN116129998A (zh) * | 2023-01-19 | 2023-05-16 | 中国医学科学院肿瘤医院 | 一种食管鳞状细胞癌数据的处理方法及其系统 |
CN116129998B (zh) * | 2023-01-19 | 2024-06-11 | 中国医学科学院肿瘤医院 | 一种食管鳞状细胞癌数据的处理方法及其系统 |
CN116386903A (zh) * | 2023-06-06 | 2023-07-04 | 中国医学科学院肿瘤医院 | 一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法 |
CN116386903B (zh) * | 2023-06-06 | 2023-11-10 | 中国医学科学院肿瘤医院 | 一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法 |
CN117741148A (zh) * | 2024-02-19 | 2024-03-22 | 苏州颐坤生物科技有限公司 | 一种用于免疫治疗疗效预测的标志物组合及模型构建方法和应用 |
CN118018531A (zh) * | 2024-04-09 | 2024-05-10 | 深圳市鸿普森科技股份有限公司 | 一种针对物业场景下的数字人一体机 |
CN118018531B (zh) * | 2024-04-09 | 2024-06-25 | 深圳市鸿普森科技股份有限公司 | 一种针对物业场景下的数字人一体机 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113192560A (zh) | 一种基于铁死亡进程的肝细胞癌分型体系的构建方法 | |
Chen et al. | Co-expression network analysis identified FCER1G in association with progression and prognosis in human clear cell renal cell carcinoma | |
Sivendran et al. | Dissection of immune gene networks in primary melanoma tumors critical for antitumor surveillance of patients with stage II–III resectable disease | |
CN111394456B (zh) | 早期肺腺癌患者预后评估系统及其应用 | |
CN111564214B (zh) | 一种基于7个特殊基因的乳腺癌预后评估模型的建立与验证方法 | |
Lin et al. | Identification of an immune-related nine-lncRNA signature predictive of overall survival in colon cancer | |
CN111676288B (zh) | 用于预测肺腺癌患者预后的系统及其应用 | |
CN103502473A (zh) | 胃肠胰神经内分泌肿瘤(gep-nen)的预测 | |
CN113228190A (zh) | 基于预测的肿瘤突变负荷的肿瘤分类 | |
CN101960022A (zh) | Ⅱ期和ⅲ期结肠癌的分子分期和预后 | |
Wang et al. | Identification of a six-gene signature associated with tumor mutation burden for predicting prognosis in patients with invasive breast carcinoma | |
Dong et al. | Identification of a Pyroptosis‐Related Gene Signature for Prediction of Overall Survival in Lung Adenocarcinoma | |
CN115410713A (zh) | 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建 | |
CN112088220A (zh) | 替代标志物及用于肿瘤突变负荷测定的方法 | |
CN113430266A (zh) | G6pc及其所在基因组在制备肾透明细胞癌诊断或预后评估系统中的应用 | |
Liu et al. | Immune landscape refines the classification of colorectal cancer with heterogeneous prognosis, tumor microenvironment and distinct sensitivity to frontline therapies | |
Jinjia et al. | The use of DNA repair genes as prognostic indicators of gastric cancer | |
Peng et al. | Identification of a novel prognostic signature of genome instability-related LncRNAs in early stage lung adenocarcinoma | |
Yu et al. | Identification of N6-methyladenosine-associated long non-coding RNAs for immunotherapeutic response and prognosis in patients with pancreatic cancer | |
Zhang et al. | Hallmark guided identification and characterization of a novel immune-relevant signature for prognostication of recurrence in stage I–III lung adenocarcinoma | |
CN112908406A (zh) | Pink1作为诊断标志物在构建肺鳞癌预后预测模型中的应用 | |
CN114480644A (zh) | 肺腺癌基于代谢基因的分子分型 | |
Wang et al. | Construction and validation of a novel prognostic model using the cellular senescence-associated long non-coding RNA in gastric cancer: A biological analysis | |
Dong et al. | Identification of distinct molecular patterns and a four-gene signature in colon cancer based on invasion-related genes | |
Zhou et al. | Identification of basement membrane-related signatures for estimating prognosis, immune infiltration landscape and drug candidates in pancreatic adenocarcinoma |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |