CN117385040A - 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 - Google Patents
用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 Download PDFInfo
- Publication number
- CN117385040A CN117385040A CN202311514765.2A CN202311514765A CN117385040A CN 117385040 A CN117385040 A CN 117385040A CN 202311514765 A CN202311514765 A CN 202311514765A CN 117385040 A CN117385040 A CN 117385040A
- Authority
- CN
- China
- Prior art keywords
- gene
- prognosis
- marker combination
- tumor progression
- expression level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 117
- 238000004393 prognosis Methods 0.000 title claims abstract description 48
- 239000003550 marker Substances 0.000 title claims abstract description 41
- 206010061309 Neoplasm progression Diseases 0.000 title claims description 44
- 230000005751 tumor progression Effects 0.000 title claims description 44
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 40
- 102000000802 Galectin 3 Human genes 0.000 claims abstract description 10
- 108010001517 Galectin 3 Proteins 0.000 claims abstract description 10
- 102100034798 CCAAT/enhancer-binding protein beta Human genes 0.000 claims abstract description 9
- 102100035888 Caveolin-1 Human genes 0.000 claims abstract description 9
- 101000715467 Homo sapiens Caveolin-1 Proteins 0.000 claims abstract description 9
- 101000836383 Homo sapiens Serpin H1 Proteins 0.000 claims abstract description 9
- 102100027287 Serpin H1 Human genes 0.000 claims abstract description 9
- 102100032912 CD44 antigen Human genes 0.000 claims abstract description 8
- 108010001498 Galectin 1 Proteins 0.000 claims abstract description 8
- 102100021736 Galectin-1 Human genes 0.000 claims abstract description 8
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 claims abstract description 8
- 102100023582 Cyclic AMP-dependent transcription factor ATF-5 Human genes 0.000 claims abstract description 7
- 101150096607 Fosl2 gene Proteins 0.000 claims abstract 4
- 101000945963 Homo sapiens CCAAT/enhancer-binding protein beta Proteins 0.000 claims abstract 2
- 101000905746 Homo sapiens Cyclic AMP-dependent transcription factor ATF-5 Proteins 0.000 claims abstract 2
- 101000803403 Homo sapiens Vimentin Proteins 0.000 claims abstract 2
- 101710168942 Sphingosine-1-phosphate phosphatase 1 Proteins 0.000 claims abstract 2
- 102100030684 Sphingosine-1-phosphate phosphatase 1 Human genes 0.000 claims abstract 2
- 102100035071 Vimentin Human genes 0.000 claims abstract 2
- 230000014509 gene expression Effects 0.000 claims description 47
- 239000000523 sample Substances 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 25
- 238000012163 sequencing technique Methods 0.000 claims description 21
- 239000003153 chemical reaction reagent Substances 0.000 claims description 8
- 238000010199 gene set enrichment analysis Methods 0.000 claims description 8
- 239000013614 RNA sample Substances 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 6
- 238000011529 RT qPCR Methods 0.000 claims description 5
- 101150077199 S100a10 gene Proteins 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 2
- 102100029796 Protein S100-A10 Human genes 0.000 abstract 1
- 108010015695 S100 calcium binding protein A10 Proteins 0.000 abstract 1
- 208000005017 glioblastoma Diseases 0.000 description 32
- 230000003902 lesion Effects 0.000 description 10
- 102000004264 Osteopontin Human genes 0.000 description 9
- 108010081689 Osteopontin Proteins 0.000 description 9
- 102000004145 Annexin A1 Human genes 0.000 description 8
- 108090000663 Annexin A1 Proteins 0.000 description 8
- 102100028121 Fos-related antigen 2 Human genes 0.000 description 8
- 101001059934 Homo sapiens Fos-related antigen 2 Proteins 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 8
- 108010064535 CCAAT-Enhancer-Binding Protein-beta Proteins 0.000 description 7
- 102000013127 Vimentin Human genes 0.000 description 7
- 108010065472 Vimentin Proteins 0.000 description 7
- 210000005259 peripheral blood Anatomy 0.000 description 7
- 239000011886 peripheral blood Substances 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 239000002299 complementary DNA Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 210000004881 tumor cell Anatomy 0.000 description 6
- 101710182028 Cyclic AMP-dependent transcription factor ATF-5 Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000012165 high-throughput sequencing Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 210000005048 vimentin Anatomy 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 206010018338 Glioma Diseases 0.000 description 4
- 238000002123 RNA extraction Methods 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 208000030173 low grade glioma Diseases 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012049 whole transcriptome sequencing Methods 0.000 description 4
- 206010009944 Colon cancer Diseases 0.000 description 3
- 208000032612 Glial tumor Diseases 0.000 description 3
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000012472 biological sample Substances 0.000 description 3
- 210000001124 body fluid Anatomy 0.000 description 3
- 239000010839 body fluid Substances 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 210000000805 cytoplasm Anatomy 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 3
- 201000002528 pancreatic cancer Diseases 0.000 description 3
- 208000008443 pancreatic carcinoma Diseases 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000004083 survival effect Effects 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 201000009030 Carcinoma Diseases 0.000 description 2
- 102000008186 Collagen Human genes 0.000 description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 2
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 2
- 102000007563 Galectins Human genes 0.000 description 2
- 108010046569 Galectins Proteins 0.000 description 2
- 208000017604 Hodgkin disease Diseases 0.000 description 2
- 101000861454 Homo sapiens Protein c-Fos Proteins 0.000 description 2
- 238000000585 Mann–Whitney U test Methods 0.000 description 2
- 102000002274 Matrix Metalloproteinases Human genes 0.000 description 2
- 108010000684 Matrix Metalloproteinases Proteins 0.000 description 2
- 206010029260 Neuroblastoma Diseases 0.000 description 2
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 102100020847 Protein FosB Human genes 0.000 description 2
- 102100027584 Protein c-Fos Human genes 0.000 description 2
- 102000009572 RNA Polymerase II Human genes 0.000 description 2
- 108010009460 RNA Polymerase II Proteins 0.000 description 2
- 206010039491 Sarcoma Diseases 0.000 description 2
- 208000005718 Stomach Neoplasms Diseases 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- 208000009956 adenocarcinoma Diseases 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 102000023852 carbohydrate binding proteins Human genes 0.000 description 2
- 108091008400 carbohydrate binding proteins Proteins 0.000 description 2
- 230000006369 cell cycle progression Effects 0.000 description 2
- 230000024245 cell differentiation Effects 0.000 description 2
- 230000003915 cell function Effects 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 230000004663 cell proliferation Effects 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 229920001436 collagen Polymers 0.000 description 2
- 201000004101 esophageal cancer Diseases 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 206010017758 gastric cancer Diseases 0.000 description 2
- 229920002674 hyaluronan Polymers 0.000 description 2
- 229960003160 hyaluronic acid Drugs 0.000 description 2
- 102000006495 integrins Human genes 0.000 description 2
- 108010044426 integrins Proteins 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 201000007270 liver cancer Diseases 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 210000002997 osteoclast Anatomy 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000012174 single-cell RNA sequencing Methods 0.000 description 2
- 201000011549 stomach cancer Diseases 0.000 description 2
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 2
- 201000005112 urinary bladder cancer Diseases 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 201000003076 Angiosarcoma Diseases 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 206010004146 Basal cell carcinoma Diseases 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 101150104494 CAV1 gene Proteins 0.000 description 1
- 101710186200 CCAAT/enhancer-binding protein Proteins 0.000 description 1
- 102000005701 Calcium-Binding Proteins Human genes 0.000 description 1
- 108010045403 Calcium-Binding Proteins Proteins 0.000 description 1
- 101710149080 Calcium-binding protein A Proteins 0.000 description 1
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 1
- 102000003727 Caveolin 1 Human genes 0.000 description 1
- 108090000026 Caveolin 1 Proteins 0.000 description 1
- 102100038909 Caveolin-2 Human genes 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 208000005243 Chondrosarcoma Diseases 0.000 description 1
- 201000009047 Chordoma Diseases 0.000 description 1
- 208000006332 Choriocarcinoma Diseases 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 108060005980 Collagenase Proteins 0.000 description 1
- 102100026398 Cyclic AMP-responsive element-binding protein 3 Human genes 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 201000009051 Embryonal Carcinoma Diseases 0.000 description 1
- 206010014967 Ependymoma Diseases 0.000 description 1
- 208000006168 Ewing Sarcoma Diseases 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 201000008808 Fibrosarcoma Diseases 0.000 description 1
- 108090000123 Fos-related antigen 1 Proteins 0.000 description 1
- 102000003817 Fos-related antigen 1 Human genes 0.000 description 1
- 208000001258 Hemangiosarcoma Diseases 0.000 description 1
- 101000740981 Homo sapiens Caveolin-2 Proteins 0.000 description 1
- 101000855520 Homo sapiens Cyclic AMP-responsive element-binding protein 3 Proteins 0.000 description 1
- 101000589316 Homo sapiens N-cym protein Proteins 0.000 description 1
- 101000931462 Homo sapiens Protein FosB Proteins 0.000 description 1
- 102100022337 Integrin alpha-V Human genes 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000013462 Interleukin-12 Human genes 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 102000012411 Intermediate Filament Proteins Human genes 0.000 description 1
- 102000039537 Jun family Human genes 0.000 description 1
- 108091067369 Jun family Proteins 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 208000018142 Leiomyosarcoma Diseases 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010025219 Lymphangioma Diseases 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 208000007054 Medullary Carcinoma Diseases 0.000 description 1
- 208000000172 Medulloblastoma Diseases 0.000 description 1
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 1
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 1
- 206010027406 Mesothelioma Diseases 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 102000029749 Microtubule Human genes 0.000 description 1
- 108091022875 Microtubule Proteins 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 101000715282 Mus musculus Coiled-coil domain-containing protein 40 Proteins 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 208000005927 Myosarcoma Diseases 0.000 description 1
- 102100032847 N-cym protein Human genes 0.000 description 1
- 208000005890 Neuroma Diseases 0.000 description 1
- 201000010133 Oligodendroglioma Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 102100026918 Phospholipase A2 Human genes 0.000 description 1
- 108010058864 Phospholipases A2 Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- 208000005107 Premature Birth Diseases 0.000 description 1
- 206010036590 Premature baby Diseases 0.000 description 1
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 1
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 102000013674 S-100 Human genes 0.000 description 1
- 108700021018 S100 Proteins 0.000 description 1
- -1 SERPINH1VIM Proteins 0.000 description 1
- 101710204410 Scaffold protein Proteins 0.000 description 1
- 201000010208 Seminoma Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 101150018337 Serpinh1 gene Proteins 0.000 description 1
- 206010041067 Small cell lung cancer Diseases 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010066901 Treatment failure Diseases 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 101710158352 Type III intermediate filament Proteins 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 108010048673 Vitronectin Receptors Proteins 0.000 description 1
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- 208000017733 acquired polycythemia vera Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- 230000003305 autocrine Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000002805 bone matrix Anatomy 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 208000003362 bronchogenic carcinoma Diseases 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 102000014823 calbindin Human genes 0.000 description 1
- 108060001061 calbindin Proteins 0.000 description 1
- 125000000837 carbohydrate group Chemical group 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 230000009134 cell regulation Effects 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 230000017455 cell-cell adhesion Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 208000024207 chronic leukemia Diseases 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000036570 collagen biosynthesis Effects 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000003436 cytoskeletal effect Effects 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 230000003511 endothelial effect Effects 0.000 description 1
- 208000037828 epithelial carcinoma Diseases 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 210000002219 extraembryonic membrane Anatomy 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 108700025906 fos Genes Proteins 0.000 description 1
- 101150078861 fos gene Proteins 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 208000025750 heavy chain disease Diseases 0.000 description 1
- 230000011132 hemopoiesis Effects 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 229910052588 hydroxylapatite Inorganic materials 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008611 intercellular interaction Effects 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 229940117681 interleukin-12 Drugs 0.000 description 1
- 210000003963 intermediate filament Anatomy 0.000 description 1
- 208000022013 kidney Wilms tumor Diseases 0.000 description 1
- 206010024627 liposarcoma Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000004880 lymph fluid Anatomy 0.000 description 1
- 208000015534 lymphangioendothelioma Diseases 0.000 description 1
- 208000012804 lymphangiosarcoma Diseases 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 208000023356 medullary thyroid gland carcinoma Diseases 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 206010027191 meningioma Diseases 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 210000003632 microfilament Anatomy 0.000 description 1
- 210000004688 microtubule Anatomy 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 239000003226 mitogen Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 201000002077 muscle cancer Diseases 0.000 description 1
- 208000025189 neoplasm of testis Diseases 0.000 description 1
- 201000008026 nephroblastoma Diseases 0.000 description 1
- 230000004766 neurogenesis Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 208000004019 papillary adenocarcinoma Diseases 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- XYJRXVWERLGGKC-UHFFFAOYSA-D pentacalcium;hydroxide;triphosphate Chemical compound [OH-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O XYJRXVWERLGGKC-UHFFFAOYSA-D 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 208000037244 polycythemia vera Diseases 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000022855 regulation of cell cycle process Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 201000008407 sebaceous adenocarcinoma Diseases 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000003001 serine protease inhibitor Substances 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 208000000587 small cell lung carcinoma Diseases 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000011272 standard treatment Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 201000010965 sweat gland carcinoma Diseases 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 201000008753 synovium neoplasm Diseases 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 210000005042 type III intermediate filament Anatomy 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000007482 whole exome sequencing Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Abstract
本发明公开了用于预测肿瘤进展及预后的基因标志物组合,属于医学分子生物学领域。所述基因标志物组合包括FOSL2基因,或包括FOSL2基因及S100A10、SPP1、CAV1、VIM、CD44、SERPINH1、LGALS3、CEBPB、ATF5和LGALS1中的至少一个基因。本发明还公开了基于所述基因标志物组合的试剂盒及系统。利用本发明,可以预测多种肿瘤的进展及预后,具有非常大的临床应用价值。
Description
相关专利
本申请是申请号为2022110946885,申请日为2022年09月03日,发明名称为“用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统”的中国发明专利申请的分案申请。
技术领域
本发明属于医学分子生物学领域,具体地,涉及用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统。
背景技术
胶质母细胞瘤(Glioblastoma,GBM)是成人中最常见的侵入性脑肿瘤。由于肿瘤的恶性进展,改善GBM的预后具有巨大的挑战性。标准治疗方案下,GBM患者的中位生存期约为15个月,然而,大多数患者在初次治疗后会在十个月内快速复发。
当前,已有技术构建了几种方法模型来探索GBM的发病和进展。例如,Ozawa等人分析了人类GBM数据,发现染色体改变可能是GBM的起因(Ozawa,Tatsuya,et al."Most humannon-GCIMP glioblastoma subtypes evolve from a common proneural-like precursorglioma."Cancer cell 26.2(2014):288-300.)。还有一些技术研究在纵向样本模型上探索了GBM的时空变化。GBM的进展是从成对的原发性和复发性样本中预测的,以上技术显示了由治疗驱动的GBM患者的基因组特征。
尽管已有技术加深了本领域对GBM进展的认知,增进了对治疗失败的理解,但其主要基于治疗后的基因组变化。总体来讲,目前仍缺少预测自然疾病进展过程中肿瘤细胞如何进展的合适模型和方法。
发明内容
为了解决上述技术问题中的至少一个,本发明通过获得肿瘤组织的RNA样本,通过全转录组高通量测序获得转录组测序数据,对下机数据进行预处理后,将数据对比至人类参考基因组上,进行表达定量分析,获得表达谱信息。进一步利用表达谱数据获得了能够用于预测肿瘤进展和/或预后的基因标志物组合。通过对多种肿瘤样本进行同样的分析,意外地获得了适用于多种肿瘤进展和/或预后的基因标志物组合,从而完成了本发明。
在本发明中,所述高通量全转录组测序(whole transcriptome resequencing)指一次对几十万到几百万条RNA分子进行序列测定。转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,主要包括mRNA和非编码RNA。转录组研究是基因功能及结构研究的基础和出发点,通过新一代高通量测序,能够全面快速地获得某一物种特定组织或器官在某一状态下的几乎所有转录本序列信息,已广泛应用于基础研究、临床诊断和药物研发等领域。
在本发明中,所述基因表达谱(gene expression profile)指构建处于某一特定状态下的细胞或组织的非偏性cDNA文库,通过大规模的cDNA测序,收集cDNA序列片段、定性、定量分析其mRNA群体组成,从而描绘该特定细胞或组织在特定状态下的基因表达种类和丰度信息,这样编制成的数据表就称为基因表达谱。
在本发明中,高通量测序获得的reads都是300-500bp的序列片段,无法直接进行下游分析。因此,需要将mRNA测序得到的reads与人类参考基因组进行比较,由此确定mRNA的序列片段来源于参考基因组上的哪个基因。
在本发明中,所述人类参考基因组是指2001年2月12日,由6国的科学家共同参与的国际人类基因组公布了人类基因组图谱及初步分析结果。目前,参考序列可以是人类基因组hg38、hg19或其它版本的序列。在本发明的实施方案中,所述人类参考基因组是指hg19。
本发明的采用的技术方案如下:
本发明第一方面提供一种基因标志物组合,所述基因标志物组合包括S100A10、FOSL2、SPP1、CAV1、ANXA1、VIM、CD44、SERPINH1、LGALS3、CEBPB、ATF5和LGALS1中的至少一个基因。
在本发明中,术语“基因标志物”、“基因标记”和“特征分子”具有等同的含义,均指与肿瘤进展和/或预后有关的基因。
S100A10(S100 Calcium Binding Protein A10,S100A10)基因编码的蛋白质是含有2个EF手钙结合基序的S100蛋白质家族的成员之一。S100钙结合蛋白位于多种细胞的细胞质和/或细胞核中,并参与许多细胞过程的调节,例如细胞周期进程和分化。S100基因包括至少13个成员,它们以簇的形式位于染色体1q21上。
FOSL2(FOS Like 2,AP-1Transcription Factor Subunit,FOSL2)是Fos基因家族成员,其余成员包括:FOS、FOSB和FOSL1。这些基因编码的亮氨酸拉链蛋白可以与JUN家族的蛋白质二聚化,从而形成转录因子复合物AP-1。因此,FOS蛋白被认为是细胞增殖、分化和转化的调节剂。
SPP1(Secreted Phosphoprotein 1)基因编码的蛋白质参与破骨细胞与矿化骨基质的附着。SPP1蛋白被分泌并以高亲和力结合羟基磷灰石。破骨细胞玻连蛋白受体存在于细胞膜中,可能参与与SPP1蛋白的结合。SPP1蛋白也是一种上调干扰素-γ和白细胞介素-12表达的细胞因子。
CAV1(Caveolin 1)基因编码的支架蛋白是在大多数细胞类型中发现的细胞膜穴样膜的主要成分。CAV1蛋白将整合素亚基与酪氨酸激酶FYN连接起来,这是将整合素与Ras-ERK途径偶联并促进细胞周期进程的起始步骤。CAV1基因是肿瘤抑制基因候选者和Ras-p42/44丝裂原活化激酶级联的负调节剂。CAV1和CAV2在7号染色体上彼此相邻,并表达形成稳定异源寡聚体复合物的共定位蛋白。
ANXA1(Annexin A1)基因编码一种与磷脂结合的膜定位蛋白。ANXA1蛋白抑制磷脂酶A2并具有抗炎活性。
VIM(Vimentin)基因编码一种III型中间丝蛋白。中间丝与微管和肌动蛋白微丝一起构成细胞骨架。VIM蛋白负责维持细胞形状和细胞质的完整性,并稳定细胞骨架相互作用。VIM蛋白参与神经发生和胆固醇转运,并作为许多其他关键蛋白质的组织者发挥作用,这些蛋白质参与细胞附着、迁移和信号传导。
CD44(CD44 Molecule)基因编码的蛋白质是一种细胞表面糖蛋白,参与细胞间相互作用、细胞粘附和迁移。CD44蛋白是透明质酸(HA)的受体,还可以与其他配体相互作用,例如骨桥蛋白、胶原蛋白和基质金属蛋白酶(MMP)。CD44蛋白参与多种细胞功能,包括淋巴细胞活化、再循环和归巢、造血和肿瘤转移。
SERPINH1(Serpin Family H Member 1)基因编码丝氨酸蛋白酶抑制剂中丝氨酸超家族的成员之一。SERPINH1蛋白定位于内质网,并作为胶原蛋白特异性分子伴侣在胶原蛋白生物合成中发挥作用。SERPINH1基因的核苷酸多态性可能与胎膜早破引起的早产有关,该基因的假基因位于9号染色体的短臂上。
LGALS3(Galectin 3)基因编码碳水化合物结合蛋白的半乳凝素家族成员之一。该蛋白质家族的成员对β-半乳糖苷具有亲和力。LGALS3蛋白的特征在于N末端富含脯氨酸的串联重复结构域和单个C末端碳水化合物识别结构域。LGALS3蛋白可以通过N端结构域自缔合,使其与多价糖配体结合。LGALS3蛋白定位于细胞外基质、细胞质和细胞核,在许多细胞功能中发挥作用,包括细胞凋亡、先天免疫、细胞粘附和T细胞调节。
CEBPB(CCAAT Enhancer Binding Protein Beta)是一种无内含子的基因,其编码的转录因子包含一个基本的亮氨酸拉链(bZIP)结构域。CEBPB蛋白作为同型二聚体发挥作用,但也可以与CCAAT/增强子结合蛋白α、δ和γ形成异二聚体。CEBPB蛋白的活性在调节涉及免疫和炎症反应的基因以及其他过程中很重要。
ATF5(Activating Transcription Factor 5)基因启用多种功能,包括DNA结合转录激活剂活性、RNA聚合酶II特异性;RNA聚合酶II转录调控区序列特异性DNA结合活性和微管蛋白结合活性。并且参与多个过程,包括脂肪细胞分化;细胞周期过程的调节和转录调控。
LGALS1(Galectin 1)基因编码碳水化合物结合蛋白的半乳凝素家族成员之一。LGALS1蛋白可以作为调节细胞增殖的自分泌负生长因子。
上述基因标志物组合中的各基因在预测肿瘤进展和/或预后中均具有一定的价值,本领域技术人员可以选择任一组合,例如其中任意1个基因、任意2个基因、任意3个基因、任意4个基因、任意5个基因、……、任意10个基因、任意11个基因进行预测。尽管本发明实施例仅示例性给出单个基因和部分组合预测肿瘤进展的结果,但实际上上述任一组合均可以取得良好的预测效果。
在本发明的一些实施方案中,所述基因标志物组合包括FOSL2、ANXA1和SERPINH1。在本发明的另一些实施方案中,所述基因标志物组合包括FOSL2、ANXA1、SERPINH1VIM和CAV1。在本发明的又一些实施方案中,所述基因标志物组合包括S100A10、FOSL2、SPP1、CAV1、ANXA1、VIM、CD44、SERPINH1、LGALS3、CEBPB、ATF5和LGALS1。
本发明的第二方面提供本发明第一方面所述的基因标志物组合的表达水平检测试剂在制备用于预测肿瘤进展和/或预后的试剂盒中的应用。
在本发明中,获得所述基因标志物组合的表达水平是指获得所述基因标志物组合中各基因的表达水平。在本发明一些实施方案中,所述表达水平为相对表达水平,即相对于内参基因的表达水平。所述内参基因可以是本领域公知或通用的任意内参基因。所述内参基因的表达水平可以是一个内参基因的表达水平,也可以是多个内参基因的表达水平的平均值、众值或中位值。
在本发明的一些实施方案中,所述基因标志物组合的表达水平检测试剂为引物和/或探针。进一步地,利用包括全转录组测序、捕获测序和qRT-PCR的组中的至少一种方法获得所述基因标志物组合的表达水平。例如,本领域技术人员可以针对所述基因标志物组合中各基因设计探针,并将探针制备成基因芯片,利用基因芯片进行捕获测序。再如,可以针对所述基因标志物组合中各基因设计引物,进行PCR扩增后进行测序。又如,可以针对所述基因标志物组合中各基因设计引物和探针,利用qRT-PCR方法检测各基因的表达水平。特别地,也可以直接进行全转录组高通量测序,获得测序数据后,与人类参考基因组进行比较,并进行表达定量,获得表达谱信息。当然,本领域技术人员也可以利用其他任意方法获得所述基因标志物组合中各基因的表达水平。
在本发明中,所述表达水平基于RNA样本进行检测。具体地,可以在获得生物样本后,提取RNA样本进行检测,例如通过全转录组测序、捕获测序或qRT-PCR进行检测。在本发明的另一些实施方案中,也可以利用单细胞RNA测序(scRNA-seq)获得单个肿瘤细胞中所述各基因的表达水平。
在本发明的一些实施方案中,所述生物样本为组织、器官或体液。所述体液包括但不限定血液、血清、血浆、组织液、淋巴液、胸膜腔液、腹腔液、脑脊液、尿液、唾液、泪液、精液、阴道液。值得说明的是,对于不同的肿瘤,适用的组织或者体液可能不同,例如对于GBM,可以选择血液、脑脊液和脑组织的任意一种;对于本领域技术人员可能通过实践选择最适合的样本,但都落入本发明的保护范围。本发明第三方面提供一种预测肿瘤进展和/或预后的试剂盒,所述试剂盒包括权利要求1所述的基因标志物组合的表达水平检测试剂。
在本发明的一些实施方案中,还包括RNA提取试剂。
本发明的第四方面提供一种预测肿瘤进展和/或预后的系统,包括:
数据输入模块,用于获得本发明第一方面所述的基因标志物组合中各基因的表达水平;
预测模块,与所述数据输入模块连接,用于根据所述各基因的表达水平,利用单样本基因集富集分析方法预测肿瘤进展和/预后。
在本发明的一些实施方案中,所述预测模块中,利用单样本基因集富集分析方法获得所述基因标志物组合的富集分数,富集分数越高,肿瘤进展越晚期;肿瘤进展越晚期,对包括手术、化疗、放疗等治疗手段更容易产生抗性,也就意味着其预后越差。一般来说,
所述单样本基因集富集分析(single sample gene set enrichment analysis,ssGSEA)是GSEA方法的扩展,主要是针对单个样本无法做GSEA而设计。
在本发明的一些实施方案中,所述各基因的表达水平是基于RNA样本通过选自包括全转录组测序、捕获测序和qRT-PCR的组中的至少一种方法获得的。
在本发明的一些实施方案中,还包括参数存储模块,与所述预测模块连接,用于存储所述富集分数参考值。所述富集分数参考值是多个区间数值范围,落入某个区间数值范围内,意味着肿瘤处于某个进展期。例如,对于GBM,可分为早期(younger)、中期(middle)和晚期(older)三个进展期,对应三个区间数值范围:第一区间、第二区间、第三区间。当预测模块得到样本的富集分数后,与所述参数存储模块中的富集分数参考值进行比较,若富集分数落入第一区间,则表示来源肿瘤样本处于早期,预后良好;若富集分数落入第二区间,则表示来源肿瘤样本处于中期,预后一般;若富集分数落入第三区间,则表示来源肿瘤样本处于晚期,预后较差。
在本发明的一些具体实施方案中,所述富集分数参考值是利用群体样本得到的。在本发明的一些优选实施方案中,所述群体样本包括20个以上样本,例如30个、50个、80个、100个、150个、200个、300个、500个或更多。
在本发明的一些实施方案中,所述参数存储模块中的富集分数参考值根据所述预测模块中的预测结果进行更新。具体地,将富集分数和实际进展和/或预后数据与群体数据一起作为训练集,重新训练得到富集分数参考值。
在本发明中,所述肿瘤包括但不限于人肉瘤和癌,如纤维肉瘤、肌肉瘤、脂肪肉瘤、软骨肉瘤、成骨肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、淋巴管肉瘤、淋巴管内皮肉瘤、滑膜瘤、间皮瘤、尤因瘤、平滑肌肉瘤、横纹肌肉瘤、结肠癌、胰腺癌、前列腺癌、鳞状细胞癌、基底细胞癌、腺癌、汗腺癌、皮脂腺癌、乳头状癌、乳头腺癌、囊腺癌、髓样癌、支气管癌、肝细胞瘤、胆管癌、绒毛膜癌、精原细胞瘤、胚胎癌、肾母细胞瘤、宫颈癌、睾丸瘤、肺癌、小细胞肺癌、上皮癌、胶质瘤、星形细胞瘤、髓母细胞瘤、颅咽管瘤、室管膜瘤、松果体瘤、成血管细胞瘤、听神经瘤、少突神经胶质瘤、脑膜瘤、黑素瘤、神经母细胞瘤、胶质母细胞瘤、视网膜母细胞瘤;白血病,如急性淋巴细胞性白血病和急性成髓细胞性白血病(成髓细胞、前髓细胞、髓单核细胞、单核细胞和红细胞白血病);慢性白血病(慢性髓细胞(粒细胞)白血病和慢性淋巴细胞性白血病);和真性红细胞增多、淋巴瘤(霍奇金病和非霍奇金病)、多发性骨髓瘤、瓦尔登斯特伦巨球蛋白血症和重链病。
在本发明的一些实施方案中,肿瘤为胶质母细胞瘤、膀胱癌、结直肠癌、食管癌、卵巢癌、胃癌、非小细胞肺癌、乳腺癌、肝癌或胰腺癌。
本发明的有益效果
相对于现有技术,本发明具有以下有益效果:
本发明利用转录组测序研发GBM,获得了GBM肿瘤的进展和预测的基因标志物组合,实现了肿瘤自然进化过程的前所未有的高分辨率表征。
利用本发明的基因标志物组合、试剂盒或系统,能够对包括GBM在内的多种肿瘤的进展和/或预后进行预测,普适性强,准确性高,具有非常在的临床应用价值。
利用本发明的基因标志物组合、试剂盒或系统,不仅能够利用肿瘤样本进行检测,还能够利用如外周血在内的其他生物样本进行检测,应用前景广泛。
附图说明
图1示出了12个基因在不同肿瘤细胞簇中的表达分布。其中,肿瘤细胞簇根据进展状态被分为早期(younger)、中期(intermediated)和晚期(older)三组。
图2示出了本发明肿瘤进展及预后预测系统的富集评分与患者预后的相关性。
图3示出了利用本发明肿瘤进展及预后预测系统基于术前外周血样本的预测结果。preGBM代表高级别GBM的术前外周血样本,preLGG代表低级别LGG术前外周血样本。
具体实施方式
除非另有说明、从上下文暗示或属于现有技术的惯例,否则本申请中所有的份数和百分比都基于重量,且所用的测试和表征方法都是与本申请的提交日期同步的。在适用的情况下,本申请中涉及的任何专利、专利申请或公开的内容全部结合于此作为参考,且其等价的同族专利也引入作为参考,特别这些文献所披露的关于本领域中的相关术语的定义。如果现有技术中披露的具体术语的定义与本申请中提供的任何定义不一致,则以本申请中提供的术语定义为准。
本申请中的数字范围是近似值,因此除非另有说明,否则其可包括范围以外的数值。数值范围包括以1个单位增加的从下限值到上限值的所有数值,条件是在任意较低值与任意较高值之间存在至少2个单位的间隔。
术语“包含”,“包括”,“具有”以及它们的派生词不排除任何其它的组分、步骤或过程的存在,且与这些其它的组分、步骤或过程是否在本申请中披露无关。
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。
实施例
以下例子在此用于示范本发明的优选实施方案。本领域内的技术人员会明白,下述例子中披露的技术代表发明人发现的可以用于实施本发明的技术,因此可以视为实施本发明的优选方案。但是本领域内的技术人员根据本说明书应该明白,这里所公开的特定实施例可以做很多修改,仍然能得到相同的或者类似的结果,而非背离本发明的精神或范围。
除非另有定义,所有在此使用的技术和科学的术语,和本发明所属领域内的技术人员所通常理解的意思相同,在此公开引用及他们引用的材料都将以引用的方式被并入。
那些本领域内的技术人员将意识到或者通过常规试验就能了解许多这里所描述的发明的特定实施方案的许多等同技术。这些等同将被包含在权利要求书中。
下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的仪器设备,如无特殊说明,均为实验室常规仪器设备;下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。
实施例1基于转录组测序获得GBM肿瘤进展特征分子
本实施例首先对原发性GBM肿瘤样本进行RNA提取,然后进行全转录组测序,进一步对下机测序数据进行预处理,接着进行序列比对和基因表达定量,最终获得基因表达谱。具体步骤如下:
1.RNA提取及转录组测序
对每个肿瘤样本进行RNA提取,获取总RNA:每个肿瘤样本先分别获得第一病灶和第二病灶(影像上看相互隔离的病灶)的总RNA样本。
将RNA逆转录成cDNA;通过超声破碎将cDNA片段过于大的样本打断至200-350碱基对;对片段化的cDNA分子执行末端修复、添加嘌呤、连接文库接头等操作;在高通量测序仪上进行测序。
2.下机数据预处理
获得相应的高通量测序数据后,采用本领域通用方法对数据进行预处理,以过滤掉接头序列及不合格序列。
3.序列比对和基因表达定量
首先通过STAR内置函数genomeGenerate算法对要比对的参考基因组建立索引,然后通过STAR对样本进行比对,生成BAM文件。通过HTseq工具对BAM文件进行处理,得到样本基因表达矩阵。最后,通过FPKM算法对表达矩阵进行标准化。
4.肿瘤进展特征分子的鉴定
为了剖析与GBM肿瘤进展相关的分子特征,也即GBM肿瘤进展相关的基因标志物或叫基因标记物,发明人鉴定了肿瘤样本中第一病灶和第二病灶的肿瘤细胞中差异表达基因,保留在第一病灶和第二病灶的肿瘤细胞之间表达的绝对差异大于5%的基因。为了便于后续描述,第一病灶和第二病灶的差异表达基因分别表示为oDEG和yDEG。
为了识别进展较老和较年轻的肿瘤簇,发明人首先使用以下公式计算每个肿瘤簇的潜进展状态(称为PE):
其中Oi和Yi分别表示在肿瘤簇i中oDEG和yDEG的百分比。PE表示肿瘤进展情况,PE越高,表示肿瘤簇较老,即肿瘤进展到越晚期。
发明人进一步通过PE得分对每个肿瘤簇进行从高到低排序,选择前20%和后20%分别作为较老簇和较年轻簇。
发明人利用第一个病灶的较老簇和第二个病灶的较年轻簇建立表达谱,并基于该表达谱进行差异表达分析。差异表达分析使用的标准包括:
(1)差异倍数(Fold Change,FC)≥1.5;
(2)Wilcoxon秩和检验矫正p值<10-3;
(3)每组中表达的基因百分比≥10%。
由此,得到6083个基因,可作为潜在的肿瘤进展候选特征分子。
为确保肿瘤进展特征分子(基因)适用各种GBM,发明人在每个病灶以及另外4个GBM患者的样本中进行验证。同样用以下标准鉴定出显著的差异表达基因:
(1)FC≥1.5;
(2)Wilcoxon秩和检验矫正p值<10-3;
(3)每组中表达的基因百分比≥10%。
将所有分析中获得的差异表达基因取交集,得到12个基因,这12个基因都称为肿瘤进展特征分子,也称为肿瘤进展预测基因标志物。12个基因分别是:S100A10、FOSL2、SPP1、CAV1、ANXA1、VIM、CD44、SERPINH1、LGALS3、CEBPB、ATF5和LGALS1,其在不同进展期的表达如图1所示。利用上述基因标志物组合或其子集,可用于预测肿瘤进展情况,进一步,由于肿瘤进展与预后密不可分,利用上述基因标志物组合或其子集还可用于预测肿瘤预后。
为了验证上述基因标志物组合的子集也能够用于肿瘤进展及预后的预测,发明人针对单个基因及少于31个基因的组合对GBM进行预测,结果如表1所示:
表1肿瘤进展预测基因标志物组合子集预测结果
由此可见,本实施例筛选鉴定的基因标志物组合中任一子集也可用于肿瘤进展和预后的预测,并且均具有非常高的准确率。
实施例2肿瘤进展或预后预测系统
本实施例建立一种预测肿瘤进展或预后的计算机系统,包括数据输入模块和预测模块。数据输入模块可获得实施例1获得的基因标志物组合中各基因的表达水平,预测模块使用单样本基因集富集分析(single sample gene set enrichment analysis,ssGSEA)方法(Barbie,D.,Tamayo,P.,Boehm,J.et al.Systematic RNA interference reveals thatoncogenic KRAS-driven cancers require TBK1.Nature 462,108-112(2009).)预测肿瘤进展或预后。
ssGSEA算法概括来说就是首先对给定样本的基因表达值进行秩次标准化,然后利用经验累积分布函数计算富集分数(ES)。R语言GSVA包可实现ssGSEA分析,GSVA包发布在Bioconductor上。
具体地,利用ssGSEA获得基因标志物组合的富集分数来预测肿瘤进展或预后,富集分数越高,肿瘤进展越晚期,预后越差。
对于GBM预后的预测如图2所示,从图2中可以看出,通过The Cancer GenomeAtlas(TCGA)、Gravendeel等人(Gravendeel,Lonneke AM,et al."Intrinsic geneexpression profiles of gliomas are a better predictor of survival thanhistology."Cancer research 69.23(2009):9065-9072.)、以及Chinese Glioma GenomeAtlas(CGGA)的数据分析表明,该系统能够有效预测GBM患者预后,富集分数高的患者生存时间更短。
实施例3肿瘤进展或预后预测系统的应用
为了验证实施例2系统的准确性和可靠性,以及对除GBM外的其他肿瘤的适用性,发明人收集了TCGA、International Cancer Genome Consortium(ICGC)数据库全基因组测序(whole exome sequencing,WES)的公共数据以及公开文献中多种样本测序数据。通过实施例2的系统计算每个样本的肿瘤进展得分并预测其预后。
结果如表2所示:
表2肿瘤进展或预后预测系统在多种肿瘤样本中的应用
从结果来看,本发明肿瘤进展及预后预测系统在多种肿瘤样本中均取得了较高的准确度。其中,对膀胱癌、结直肠癌、食管癌、卵巢癌进展及预后的预测,AUC都超过90%,准确度非常高。对胃癌和非小细胞肺癌进展的预测,AUC均超过80%,准确度也相对非常高;对乳腺癌、肝癌以及胰腺癌进展及预后的预测,AUC也都超过了75%,具有显著的临床价值。
实施例4肿瘤进展或预后预测系统的在基于外周血的应用
为了进一步验证实施例2系统可用于除肿瘤组织外的其他样本进行预测。发明人获得术前GBM和低级别胶质瘤(low-grade glioma,LGG)的外周血样本,分别进行预测。结果如图3所示。可以看到,无论在初发组(Primary)中还是复发组(Recurrence)中,GBM的富集分数均显著高于LGG,表示实施例2系统基于外周血样本也可以很好的预测肿瘤进展。进一步拓宽了实施例2系统应用前景。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
Claims (10)
1.一种基因标志物组合,其特征在于,所述基因标志物组合包括FOSL2基因,或包括FOSL2基因及S100A10、SPP1、CAV1、VIM、CD44、SERPINH1、LGALS3、CEBPB、ATF5和LGALS1中的至少一个基因。
2.权利要求1所述的基因标志物组合的表达水平检测试剂在制备用于预测肿瘤进展和/或预后的试剂盒中的应用。
3.根据权利要求2所述的应用,其特征在于,所述基因标志物组合的表达水平检测试剂为引物和/或探针。
4.一种预测肿瘤进展和/或预后的试剂盒,其特征在于,所述试剂盒包括权利要求1所述的基因标志物组合的表达水平检测试剂。
5.一种预测肿瘤进展和/或预后的系统,其特征在于,包括:
数据输入模块,用于获得权利要求1所述基因标志物组合中各基因的表达水平;
预测模块,与所述数据输入模块连接,用于根据所述各基因的表达水平预测肿瘤进展和/预后。
6.根据权利要求5所述的系统,其特征在于,所述预测模块利用单样本基因集富集分析方法预测肿瘤进展和/或预后。
7.根据权利要求5所述的系统,其特征在于,所述预测模块中,利用单样本基因集富集分析方法获得所述基因标志物组合的富集分数,富集分数越高,肿瘤进展越晚期,预后越差。
8.根据权利要求6所述的系统,其特征在于,所述各基因的表达水平是基于RNA样本通过选自包括转录组测序、捕获测序和qRT-PCR的组中的至少一种方法获得的。
9.根据权利要求6所述的系统,其特征在于,还包括参数存储模块,与所述预测模块连接,用于存储所述富集分数参考值,所述富集分数参考值是利用群体样本得到的。
10.根据权利要求9所述的系统,其特征在于,所述参数存储模块中的富集分数参考值根据所述预测模块中的预测结果进行更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311514765.2A CN117385040A (zh) | 2022-09-03 | 2022-09-03 | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311514765.2A CN117385040A (zh) | 2022-09-03 | 2022-09-03 | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 |
CN202211094688.5A CN115747329B (zh) | 2022-09-03 | 2022-09-03 | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211094688.5A Division CN115747329B (zh) | 2022-09-03 | 2022-09-03 | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117385040A true CN117385040A (zh) | 2024-01-12 |
Family
ID=85349657
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211094688.5A Active CN115747329B (zh) | 2022-09-03 | 2022-09-03 | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 |
CN202311514772.2A Pending CN117385041A (zh) | 2022-09-03 | 2022-09-03 | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 |
CN202311514765.2A Pending CN117385040A (zh) | 2022-09-03 | 2022-09-03 | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 |
CN202311515115.XA Pending CN117385042A (zh) | 2022-09-03 | 2022-09-03 | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211094688.5A Active CN115747329B (zh) | 2022-09-03 | 2022-09-03 | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 |
CN202311514772.2A Pending CN117385041A (zh) | 2022-09-03 | 2022-09-03 | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311515115.XA Pending CN117385042A (zh) | 2022-09-03 | 2022-09-03 | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 |
Country Status (1)
Country | Link |
---|---|
CN (4) | CN115747329B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116844638A (zh) * | 2023-06-08 | 2023-10-03 | 上海信诺佰世医学检验有限公司 | 一种基于高通量转录组测序的儿童急性白血病分型系统及方法 |
CN116656829B (zh) * | 2023-08-01 | 2024-04-12 | 昂凯生命科技(苏州)有限公司 | 一种预测胃癌不良预后的基因标志物组合、试剂盒及系统 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060019256A1 (en) * | 2003-06-09 | 2006-01-26 | The Regents Of The University Of Michigan | Compositions and methods for treating and diagnosing cancer |
WO2008109423A1 (en) * | 2007-03-02 | 2008-09-12 | Board Of Regents, The University Of Texas System | Multigene assay to predict outcome in an individual with glioblastoma |
JP5461959B2 (ja) * | 2008-10-31 | 2014-04-02 | 株式会社Dnaチップ研究所 | 神経膠腫予後予測方法、およびそれに用いるキット |
WO2012031008A2 (en) * | 2010-08-31 | 2012-03-08 | The General Hospital Corporation | Cancer-related biological materials in microvesicles |
WO2012126542A2 (en) * | 2011-03-23 | 2012-09-27 | Universite De Rennes 1 | Biomarkers and methods for the prognosis of glioblastoma |
GB201616912D0 (en) * | 2016-10-05 | 2016-11-16 | University Of East Anglia | Classification of cancer |
CN107034305A (zh) * | 2017-06-19 | 2017-08-11 | 上海市第十人民医院 | 恶性胶质瘤的一种诊断标志物 |
CN107058596A (zh) * | 2017-06-19 | 2017-08-18 | 上海市第十人民医院 | 一种与恶性胶质瘤诊断相关的标志物及其应用 |
KR102156282B1 (ko) * | 2018-06-20 | 2020-09-15 | 연세대학교 산학협력단 | 뇌 종양의 예후 예측 방법 |
CN108949982B (zh) * | 2018-07-09 | 2021-10-26 | 中国医科大学附属第一医院 | 一种利用免疫共刺激分子评价胶质瘤临床预后的方法 |
CN112002372A (zh) * | 2020-08-03 | 2020-11-27 | 李里 | 人胶质母细胞瘤的预后靶点基因的筛选方法及应用 |
CN112980952B (zh) * | 2021-02-05 | 2022-11-29 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 用于预测异柠檬酸脱氢酶1基因野生型胶质瘤预后与抗pd1治疗疗效的标志物及其应用 |
CN113481298A (zh) * | 2021-06-18 | 2021-10-08 | 广东中科清紫医疗科技有限公司 | 免疫相关基因在预测弥漫性胶质瘤预后的试剂盒和系统中的应用 |
CN114512184A (zh) * | 2021-10-11 | 2022-05-17 | 上海市胸科医院 | 一种用于预测癌症疗效和预后的方法及其装置和应用 |
-
2022
- 2022-09-03 CN CN202211094688.5A patent/CN115747329B/zh active Active
- 2022-09-03 CN CN202311514772.2A patent/CN117385041A/zh active Pending
- 2022-09-03 CN CN202311514765.2A patent/CN117385040A/zh active Pending
- 2022-09-03 CN CN202311515115.XA patent/CN117385042A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN115747329B (zh) | 2023-10-17 |
CN117385041A (zh) | 2024-01-12 |
CN115747329A (zh) | 2023-03-07 |
CN117385042A (zh) | 2024-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115747329B (zh) | 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统 | |
US20090298082A1 (en) | Biomarker panels for predicting prostate cancer outcomes | |
KR102069043B1 (ko) | 진행성 위암 환자의 수술 후 예후 또는 항암제 적합성 예측 시스템 | |
WO2011109830A2 (en) | Protein biomarkers and therapeutic targets for renal disorders | |
WO2015017537A2 (en) | Colorectal cancer recurrence gene expression signature | |
WO2006005054A2 (en) | System and methods for the management and treatment of vascular graft disease | |
US20180312926A9 (en) | Biomarker panels for predicting prostate cancer outcomes | |
CN110418850A (zh) | 鉴定和使用小rna预测因子的方法 | |
CN107574247A (zh) | 一种基于clcf1基因的胶质母细胞瘤辅助诊断、预后评价试剂盒及其使用方法 | |
CN113493829B (zh) | 生物标志物在肺动脉高压诊疗中的应用 | |
KR102156282B1 (ko) | 뇌 종양의 예후 예측 방법 | |
KR101992787B1 (ko) | Bzrap1-as1 유전자의 메틸화 수준을 이용한 고혈압의 예측 또는 진단을 위한 정보제공방법 및 이를 위한 조성물 | |
US20090297506A1 (en) | Classification of cancer | |
KR101064561B1 (ko) | 폐선암 수술 후 초기 재발 예측용 바이오마커 | |
CN110592219B (zh) | 一种用于乳腺癌的lncRNA诊治标志物 | |
KR102085663B1 (ko) | Wrb 유전자의 메틸화 수준을 이용한 소혈관폐색증의 예측 또는 진단을 위한 정보제공방법 및 이를 위한 조성물 | |
JP2011500070A (ja) | 母性体液からの胎性細胞、胚性細胞及び核酸の分離・検出方法及び手段 | |
EP2459748B1 (en) | Determination of the risk of distant metastases in surgically treated patients with non-small cell lung cancer in stage i-iiia | |
CN110747275A (zh) | 肿瘤细胞标记分子及其应用 | |
KR102546810B1 (ko) | 자궁경부암의 급성 종양 반응 진단용 조성물 | |
US20100092958A1 (en) | Methods for Determining Collateral Artery Development in Coronary Artery Disease | |
US20220228218A1 (en) | Clinical and Molecular Prognostic Markers for Liver Transplantation | |
KR20190052397A (ko) | 다발성 골수종 환자에서 레날리도마이드 및 덱사메타손의 치료에 대한 예후 예측용 바이오 마커 | |
CN105950714A (zh) | 一种诊断骨关节炎的产品及其应用 | |
EP2818546B1 (en) | Method for determining rheumatoid arthritis activity indicator, and biomarker used therein |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |