CN117004729B - 生物标志物及其在预测和/或诊断utuc进展时间中的应用 - Google Patents
生物标志物及其在预测和/或诊断utuc进展时间中的应用 Download PDFInfo
- Publication number
- CN117004729B CN117004729B CN202311050108.7A CN202311050108A CN117004729B CN 117004729 B CN117004729 B CN 117004729B CN 202311050108 A CN202311050108 A CN 202311050108A CN 117004729 B CN117004729 B CN 117004729B
- Authority
- CN
- China
- Prior art keywords
- utuc
- data
- protein expression
- protein
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000031128 Upper tract urothelial carcinoma Diseases 0.000 title claims abstract description 109
- 239000000090 biomarker Substances 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 36
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 17
- 108090000623 proteins and genes Proteins 0.000 claims description 138
- 102000004169 proteins and genes Human genes 0.000 claims description 137
- 101001047746 Homo sapiens Lamina-associated polypeptide 2, isoform alpha Proteins 0.000 claims description 26
- 101001047731 Homo sapiens Lamina-associated polypeptide 2, isoforms beta/gamma Proteins 0.000 claims description 26
- 102100023981 Lamina-associated polypeptide 2, isoform alpha Human genes 0.000 claims description 26
- 238000001514 detection method Methods 0.000 claims description 26
- WVLBCYQITXONBZ-UHFFFAOYSA-N trimethyl phosphate Chemical compound COP(=O)(OC)OC WVLBCYQITXONBZ-UHFFFAOYSA-N 0.000 claims description 26
- 238000011002 quantification Methods 0.000 claims description 24
- 101000597417 Homo sapiens Nuclear RNA export factor 1 Proteins 0.000 claims description 23
- 102100035402 Nuclear RNA export factor 1 Human genes 0.000 claims description 23
- 102100038509 E3 ubiquitin-protein ligase ARIH1 Human genes 0.000 claims description 22
- 101000808922 Homo sapiens E3 ubiquitin-protein ligase ARIH1 Proteins 0.000 claims description 22
- 101001034846 Homo sapiens Interferon-induced transmembrane protein 3 Proteins 0.000 claims description 22
- 102100040035 Interferon-induced transmembrane protein 3 Human genes 0.000 claims description 22
- 102100026765 Eukaryotic translation initiation factor 4H Human genes 0.000 claims description 21
- 101001054360 Homo sapiens Eukaryotic translation initiation factor 4H Proteins 0.000 claims description 21
- 101000620653 Homo sapiens Serine/threonine-protein phosphatase 5 Proteins 0.000 claims description 21
- 101000657845 Homo sapiens Small nuclear ribonucleoprotein-associated proteins B and B' Proteins 0.000 claims description 21
- 102100022346 Serine/threonine-protein phosphatase 5 Human genes 0.000 claims description 21
- 102100034683 Small nuclear ribonucleoprotein-associated proteins B and B' Human genes 0.000 claims description 21
- 101000783723 Homo sapiens Leucine-rich alpha-2-glycoprotein Proteins 0.000 claims description 20
- 102100035987 Leucine-rich alpha-2-glycoprotein Human genes 0.000 claims description 20
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 20
- 102000007079 Peptide Fragments Human genes 0.000 claims description 14
- 108010033276 Peptide Fragments Proteins 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000005516 engineering process Methods 0.000 claims description 9
- 241001412224 Firmiana Species 0.000 claims description 8
- -1 NDUFAF Proteins 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 8
- 108090000144 Human Proteins Proteins 0.000 claims description 7
- 102000003839 Human Proteins Human genes 0.000 claims description 7
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 claims description 6
- 239000003795 chemical substances by application Substances 0.000 claims description 5
- 238000002360 preparation method Methods 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 4
- 238000002512 chemotherapy Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 claims description 2
- 230000035945 sensitivity Effects 0.000 abstract description 6
- 239000000523 sample Substances 0.000 description 31
- 210000002381 plasma Anatomy 0.000 description 28
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 18
- 101001023544 Homo sapiens NADH dehydrogenase [ubiquinone] 1 alpha subcomplex assembly factor 3 Proteins 0.000 description 14
- 102100035385 NADH dehydrogenase [ubiquinone] 1 alpha subcomplex assembly factor 3 Human genes 0.000 description 14
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 11
- 230000004083 survival effect Effects 0.000 description 11
- 238000003556 assay Methods 0.000 description 10
- 102000004196 processed proteins & peptides Human genes 0.000 description 9
- 230000008685 targeting Effects 0.000 description 9
- 238000010200 validation analysis Methods 0.000 description 8
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 7
- 235000019253 formic acid Nutrition 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 6
- 206010044412 transitional cell carcinoma Diseases 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 5
- 238000002820 assay format Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 208000023747 urothelial carcinoma Diseases 0.000 description 4
- 108010026552 Proteome Proteins 0.000 description 3
- 238000013103 analytical ultracentrifugation Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 210000001635 urinary tract Anatomy 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 101150081494 TMPO gene Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 102100022031 39S ribosomal protein L23, mitochondrial Human genes 0.000 description 1
- 102100039769 39S ribosomal protein L28, mitochondrial Human genes 0.000 description 1
- 102100039822 39S ribosomal protein L55, mitochondrial Human genes 0.000 description 1
- 102100033051 40S ribosomal protein S19 Human genes 0.000 description 1
- 102100026926 60S ribosomal protein L4 Human genes 0.000 description 1
- 102100039646 ADP-ribosylation factor-like protein 3 Human genes 0.000 description 1
- 102100032533 ADP/ATP translocase 1 Human genes 0.000 description 1
- 102100038820 Actin-related protein 2/3 complex subunit 1B Human genes 0.000 description 1
- 108090001079 Adenine Nucleotide Translocator 1 Proteins 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- 229910000013 Ammonium bicarbonate Inorganic materials 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 102100030942 Apolipoprotein A-II Human genes 0.000 description 1
- 102100030760 Apolipoprotein F Human genes 0.000 description 1
- 102100023943 Arylsulfatase L Human genes 0.000 description 1
- 102100034321 Beta-centractin Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 102100025905 C-Jun-amino-terminal kinase-interacting protein 4 Human genes 0.000 description 1
- 102100037084 C4b-binding protein alpha chain Human genes 0.000 description 1
- 102100024155 Cadherin-11 Human genes 0.000 description 1
- 102000018755 Calgranulin B Human genes 0.000 description 1
- 108010052495 Calgranulin B Proteins 0.000 description 1
- 102100027943 Carnitine O-palmitoyltransferase 1, liver isoform Human genes 0.000 description 1
- 102100024491 Cdc42 effector protein 5 Human genes 0.000 description 1
- 102100029172 Choline-phosphate cytidylyltransferase A Human genes 0.000 description 1
- 102100032404 Cholinesterase Human genes 0.000 description 1
- 102100031552 Coactosin-like protein Human genes 0.000 description 1
- 102100029057 Coagulation factor XIII A chain Human genes 0.000 description 1
- 102100029385 Copine-9 Human genes 0.000 description 1
- 102100032903 Copper chaperone for superoxide dismutase Human genes 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 102100031051 Cysteine and glycine-rich protein 1 Human genes 0.000 description 1
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 1
- 102100033711 DNA replication licensing factor MCM7 Human genes 0.000 description 1
- 101100054330 Dictyostelium discoideum abhd gene Proteins 0.000 description 1
- 102100033482 Enolase-phosphatase E1 Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 102100039950 Eukaryotic initiation factor 4A-I Human genes 0.000 description 1
- 102100029956 F-actin-capping protein subunit beta Human genes 0.000 description 1
- 102100024520 Ficolin-3 Human genes 0.000 description 1
- 208000002513 Flank pain Diseases 0.000 description 1
- 102100030125 GDP-fucose protein O-fucosyltransferase 2 Human genes 0.000 description 1
- 102100033366 Glutathione hydrolase 1 proenzyme Human genes 0.000 description 1
- 108010000445 Glycerate dehydrogenase Proteins 0.000 description 1
- 102100025334 Guanine nucleotide-binding protein G(q) subunit alpha Human genes 0.000 description 1
- 101150085568 HSPB6 gene Proteins 0.000 description 1
- 102100027772 Haptoglobin-related protein Human genes 0.000 description 1
- 102100039170 Heat shock protein beta-6 Human genes 0.000 description 1
- 101800000637 Hemokinin Proteins 0.000 description 1
- 102100028818 Heterogeneous nuclear ribonucleoprotein L Human genes 0.000 description 1
- 101001107433 Homo sapiens 39S ribosomal protein L23, mitochondrial Proteins 0.000 description 1
- 101000667524 Homo sapiens 39S ribosomal protein L28, mitochondrial Proteins 0.000 description 1
- 101000667530 Homo sapiens 39S ribosomal protein L55, mitochondrial Proteins 0.000 description 1
- 101000733040 Homo sapiens 40S ribosomal protein S19 Proteins 0.000 description 1
- 101000691203 Homo sapiens 60S ribosomal protein L4 Proteins 0.000 description 1
- 101000886004 Homo sapiens ADP-ribosylation factor-like protein 3 Proteins 0.000 description 1
- 101000809459 Homo sapiens Actin-related protein 2/3 complex subunit 1B Proteins 0.000 description 1
- 101000793406 Homo sapiens Apolipoprotein A-II Proteins 0.000 description 1
- 101000793431 Homo sapiens Apolipoprotein F Proteins 0.000 description 1
- 101000975827 Homo sapiens Arylsulfatase L Proteins 0.000 description 1
- 101000780230 Homo sapiens Beta-centractin Proteins 0.000 description 1
- 101001076862 Homo sapiens C-Jun-amino-terminal kinase-interacting protein 4 Proteins 0.000 description 1
- 101000740685 Homo sapiens C4b-binding protein alpha chain Proteins 0.000 description 1
- 101000762236 Homo sapiens Cadherin-11 Proteins 0.000 description 1
- 101000859570 Homo sapiens Carnitine O-palmitoyltransferase 1, liver isoform Proteins 0.000 description 1
- 101000762416 Homo sapiens Cdc42 effector protein 5 Proteins 0.000 description 1
- 101000988444 Homo sapiens Choline-phosphate cytidylyltransferase A Proteins 0.000 description 1
- 101000943274 Homo sapiens Cholinesterase Proteins 0.000 description 1
- 101000940352 Homo sapiens Coactosin-like protein Proteins 0.000 description 1
- 101000918352 Homo sapiens Coagulation factor XIII A chain Proteins 0.000 description 1
- 101000919218 Homo sapiens Copine-9 Proteins 0.000 description 1
- 101000868241 Homo sapiens Copper chaperone for superoxide dismutase Proteins 0.000 description 1
- 101001018431 Homo sapiens DNA replication licensing factor MCM7 Proteins 0.000 description 1
- 101000850450 Homo sapiens Enolase-phosphatase E1 Proteins 0.000 description 1
- 101000959666 Homo sapiens Eukaryotic initiation factor 4A-I Proteins 0.000 description 1
- 101000793778 Homo sapiens F-actin-capping protein subunit beta Proteins 0.000 description 1
- 101001052749 Homo sapiens Ficolin-3 Proteins 0.000 description 1
- 101000585708 Homo sapiens GDP-fucose protein O-fucosyltransferase 2 Proteins 0.000 description 1
- 101000997558 Homo sapiens Glutathione hydrolase 1 proenzyme Proteins 0.000 description 1
- 101000857888 Homo sapiens Guanine nucleotide-binding protein G(q) subunit alpha Proteins 0.000 description 1
- 101000839078 Homo sapiens Heterogeneous nuclear ribonucleoprotein L Proteins 0.000 description 1
- 101000926208 Homo sapiens Inactive glutathione hydrolase 2 Proteins 0.000 description 1
- 101000975474 Homo sapiens Keratin, type I cytoskeletal 10 Proteins 0.000 description 1
- 101001023330 Homo sapiens LIM and SH3 domain protein 1 Proteins 0.000 description 1
- 101000620359 Homo sapiens Melanocyte protein PMEL Proteins 0.000 description 1
- 101000578830 Homo sapiens Methionine aminopeptidase 1 Proteins 0.000 description 1
- 101001003205 Homo sapiens Methylosome subunit pICln Proteins 0.000 description 1
- 101000578920 Homo sapiens Microtubule-actin cross-linking factor 1, isoforms 1/2/3/5 Proteins 0.000 description 1
- 101001013832 Homo sapiens Mitochondrial peptide methionine sulfoxide reductase Proteins 0.000 description 1
- 101000603399 Homo sapiens Neuronal PAS domain-containing protein 4 Proteins 0.000 description 1
- 101001098352 Homo sapiens OX-2 membrane glycoprotein Proteins 0.000 description 1
- 101001125854 Homo sapiens Peptidase inhibitor 16 Proteins 0.000 description 1
- 101000833892 Homo sapiens Peroxisomal acyl-coenzyme A oxidase 1 Proteins 0.000 description 1
- 101000596046 Homo sapiens Plastin-2 Proteins 0.000 description 1
- 101000872867 Homo sapiens Probable E3 ubiquitin-protein ligase HECTD4 Proteins 0.000 description 1
- 101000630267 Homo sapiens Probable glutamate-tRNA ligase, mitochondrial Proteins 0.000 description 1
- 101000945496 Homo sapiens Proliferation marker protein Ki-67 Proteins 0.000 description 1
- 101000577704 Homo sapiens Proline-rich transmembrane protein 3 Proteins 0.000 description 1
- 101000577964 Homo sapiens Protein MIX23 Proteins 0.000 description 1
- 101001068628 Homo sapiens Protein PRRC2C Proteins 0.000 description 1
- 101001072202 Homo sapiens Protein disulfide-isomerase Proteins 0.000 description 1
- 101000824299 Homo sapiens Protocadherin Fat 2 Proteins 0.000 description 1
- 101000926206 Homo sapiens Putative glutathione hydrolase 3 proenzyme Proteins 0.000 description 1
- 101000714026 Homo sapiens RUN and FYVE domain-containing protein 1 Proteins 0.000 description 1
- 101001078093 Homo sapiens Reticulocalbin-1 Proteins 0.000 description 1
- 101000802948 Homo sapiens Serine/threonine-protein phosphatase 2A 55 kDa regulatory subunit B alpha isoform Proteins 0.000 description 1
- 101000642456 Homo sapiens Serpin A11 Proteins 0.000 description 1
- 101000869480 Homo sapiens Serum amyloid A-1 protein Proteins 0.000 description 1
- 101000637835 Homo sapiens Serum amyloid A-4 protein Proteins 0.000 description 1
- 101000760716 Homo sapiens Short-chain specific acyl-CoA dehydrogenase, mitochondrial Proteins 0.000 description 1
- 101000836906 Homo sapiens Signal-induced proliferation-associated protein 1 Proteins 0.000 description 1
- 101000873843 Homo sapiens Sorting and assembly machinery component 50 homolog Proteins 0.000 description 1
- 101001108753 Homo sapiens Sphingomyelin phosphodiesterase 4 Proteins 0.000 description 1
- 101000820478 Homo sapiens Syntaxin-binding protein 2 Proteins 0.000 description 1
- 101000653567 Homo sapiens T-complex protein 1 subunit delta Proteins 0.000 description 1
- 101000762938 Homo sapiens TOX high mobility group box family member 4 Proteins 0.000 description 1
- 101000662997 Homo sapiens TRAF2 and NCK-interacting protein kinase Proteins 0.000 description 1
- 101000835634 Homo sapiens Tubulin-folding cofactor B Proteins 0.000 description 1
- 101000795921 Homo sapiens Twinfilin-2 Proteins 0.000 description 1
- 101001026790 Homo sapiens Tyrosine-protein kinase Fes/Fps Proteins 0.000 description 1
- 101000662020 Homo sapiens Ubiquitin-like modifier-activating enzyme 6 Proteins 0.000 description 1
- 101000807820 Homo sapiens V-type proton ATPase subunit S1 Proteins 0.000 description 1
- 102100034061 Inactive glutathione hydrolase 2 Human genes 0.000 description 1
- 102100023970 Keratin, type I cytoskeletal 10 Human genes 0.000 description 1
- 102100035118 LIM and SH3 domain protein 1 Human genes 0.000 description 1
- 102100020983 Lysosome membrane protein 2 Human genes 0.000 description 1
- 102100022430 Melanocyte protein PMEL Human genes 0.000 description 1
- 102100028379 Methionine aminopeptidase 1 Human genes 0.000 description 1
- 102100020846 Methylosome subunit pICln Human genes 0.000 description 1
- 102100028322 Microtubule-actin cross-linking factor 1, isoforms 1/2/3/5 Human genes 0.000 description 1
- 102100031767 Mitochondrial peptide methionine sulfoxide reductase Human genes 0.000 description 1
- 102100038877 Neuronal PAS domain-containing protein 4 Human genes 0.000 description 1
- 102100037589 OX-2 membrane glycoprotein Human genes 0.000 description 1
- 102100029324 Peptidase inhibitor 16 Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 102100026798 Peroxisomal acyl-coenzyme A oxidase 1 Human genes 0.000 description 1
- 102100037170 Phosphate carrier protein, mitochondrial Human genes 0.000 description 1
- 102100034679 Probable E3 ubiquitin-protein ligase HECTD4 Human genes 0.000 description 1
- 102100026125 Probable glutamate-tRNA ligase, mitochondrial Human genes 0.000 description 1
- 102100034836 Proliferation marker protein Ki-67 Human genes 0.000 description 1
- 102100028835 Proline-rich transmembrane protein 3 Human genes 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 102100023602 Protein Hook homolog 1 Human genes 0.000 description 1
- 102100028174 Protein MIX23 Human genes 0.000 description 1
- 102100033952 Protein PRRC2C Human genes 0.000 description 1
- 102100036352 Protein disulfide-isomerase Human genes 0.000 description 1
- 102100022093 Protocadherin Fat 2 Human genes 0.000 description 1
- 102100034060 Putative glutathione hydrolase 3 proenzyme Human genes 0.000 description 1
- 102100036446 RUN and FYVE domain-containing protein 1 Human genes 0.000 description 1
- 102100025335 Reticulocalbin-1 Human genes 0.000 description 1
- 108091005488 SCARB2 Proteins 0.000 description 1
- 108091006710 SLC25A3 Proteins 0.000 description 1
- 108091006716 SLC25A4 Proteins 0.000 description 1
- 102100035728 Serine/threonine-protein phosphatase 2A 55 kDa regulatory subunit B alpha isoform Human genes 0.000 description 1
- 102100030420 Serpin A9 Human genes 0.000 description 1
- 102100032277 Serum amyloid A-1 protein Human genes 0.000 description 1
- 102100032007 Serum amyloid A-2 protein Human genes 0.000 description 1
- 101710083332 Serum amyloid A-2 protein Proteins 0.000 description 1
- 102100032016 Serum amyloid A-4 protein Human genes 0.000 description 1
- 102100024639 Short-chain specific acyl-CoA dehydrogenase, mitochondrial Human genes 0.000 description 1
- 102100027163 Signal-induced proliferation-associated protein 1 Human genes 0.000 description 1
- 102100034803 Small nuclear ribonucleoprotein-associated protein N Human genes 0.000 description 1
- 102100035853 Sorting and assembly machinery component 50 homolog Human genes 0.000 description 1
- 102100021460 Sphingomyelin phosphodiesterase 4 Human genes 0.000 description 1
- 102100021680 Syntaxin-binding protein 2 Human genes 0.000 description 1
- 102100029958 T-complex protein 1 subunit delta Human genes 0.000 description 1
- 102100026749 TOX high mobility group box family member 4 Human genes 0.000 description 1
- 102100037671 TRAF2 and NCK-interacting protein kinase Human genes 0.000 description 1
- 102100026482 Tubulin-folding cofactor B Human genes 0.000 description 1
- 102100031721 Twinfilin-2 Human genes 0.000 description 1
- 102100037333 Tyrosine-protein kinase Fes/Fps Human genes 0.000 description 1
- 102100037939 Ubiquitin-like modifier-activating enzyme 6 Human genes 0.000 description 1
- 102100037090 V-type proton ATPase subunit S1 Human genes 0.000 description 1
- 125000000218 acetic acid group Chemical group C(C)(=O)* 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 235000011114 ammonium hydroxide Nutrition 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000002429 anti-coagulating effect Effects 0.000 description 1
- 230000002924 anti-infective effect Effects 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 108091006374 cAMP receptor proteins Proteins 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 208000006750 hematuria Diseases 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 102000008371 intracellularly ATP-gated chloride channel activity proteins Human genes 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000002632 myometrial effect Effects 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 229920002791 poly-4-hydroxybutyrate Polymers 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000002540 product ion scan Methods 0.000 description 1
- 239000012474 protein marker Substances 0.000 description 1
- 201000007444 renal pelvis carcinoma Diseases 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 108010039827 snRNP Core Proteins Proteins 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 201000007433 ureter carcinoma Diseases 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000007487 urography Methods 0.000 description 1
- 210000003741 urothelium Anatomy 0.000 description 1
- 238000001291 vacuum drying Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57407—Specifically defined cancers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57484—Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Analytical Chemistry (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Wood Science & Technology (AREA)
- Food Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- General Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供了生物标志物及其在预测和/或诊断UTUC进展时间中的应用,具体涉及一种构建UTUC进展时间预测模型的方法、UTUC进展时间预测模型、样本是否为UTUC进展时间的预测方法、用于预测UTUC进展时间的系统、生物标志物在制备预测和/或诊断UTUC进展时间的试剂盒中的应用、用于检测生物标志物的试剂、用于检测生物标志物的试剂在制备预测和/或诊断UTUC进展时间的试剂盒中的应用及一种生物标志物组合。所述生物标志物与UTUC进展时间存在较高的相关性,所述UTUC进展时间预测模型在检测UTUC进展时间方面具有较高的准确率、灵敏度和特异性。
Description
技术领域
本发明属于生物医药技术和诊断领域,具体涉及一种构建UTUC进展时间预测模型的方法、UTUC进展时间预测模型、用于预测UTUC进展时间的系统、生物标志物在制备预测和/或诊断UTUC进展时间的试剂盒中的应用、用于检测生物标志物的试剂、用于检测生物标志物的试剂在制备预测和/或诊断UTUC进展时间的试剂盒中的应用及一种生物标志物组合。
背景技术
上尿路尿路上皮癌(Upper tract urothelial carcinoma,UTUC)包括输尿管和肾盂癌,相对不常见,仅占尿路上皮癌(UC)的5%~10%。约75%的UTUC患者表现为血尿(肉眼或镜下),较少见的症状是侧腹疼痛或可触及肿块。55%~59%的UTUC患者在诊断时有肌肉侵犯,肌层浸润性UTUC(MI-UTUC)预后极差。肿瘤分期为pT2/pT3的UTUC患者的5年特异性生存率为小于50%,pT4的小于10%。疑似UTUC的患者需要接受侵入性检查,如计算机断层扫描(CT)尿路造影、逆行肾盂造影或输尿管镜检查,以明确诊断。但这些方法很难在疾病的早期发现。尿细胞学是一种无创性检测方法,但其诊断UTUC或MI-UTUC的灵敏度和特异性均较低。因此,寻找可靠的生物标志物来诊断UTUC是否肌肉浸润是改善临床管理和患者预后的关键任务。
血浆样本易于获得且是无创的,血浆蛋白是血浆的主要功能成分,在信号传导、转运和抗感染等多种生物学过程中发挥关键作用。目前,血浆蛋白质组学技术已被广泛应用于各种疾病的研究,如前列腺癌、新型冠状病毒、以及酒精相关性肝病等。蛋白质组学肿瘤诊断具有灵敏度高、特异性强、背景机理明确的优点,近年来被越来越多地运用于肿瘤检测。而且,这些肿瘤标志物的研究往往是基于一定量的实验数据,所涉及的癌症种类和样本量都相对有限。因此,通过收集血浆蛋白质组数据,利用大数据分析方法,建立预测模型,有助于更好地诊断和监测UTUC患者的病程进展,对于帮助指导UTUC患者的咨询、随访安排、辅助治疗、临床决策等具有重要意义。
发明内容
针对现有技术中缺少便捷且准确的诊断UTUC(Upper tract urothelialcarcinoma,上尿路尿路上皮癌)是否肌肉浸润的技术的缺陷,基于高灵敏度、高分辨率、高精准的现代质谱技术,结合生物信息学分析及机器学习,本发明提供了一种构建UTUC进展时间预测模型的方法、UTUC进展时间预测模型、样本是否为UTUC进展时间的预测方法、用于预测UTUC进展时间的系统、生物标志物在制备预测和/或诊断UTUC进展时间的试剂盒中的应用、用于检测生物标志物的试剂、用于检测生物标志物的试剂在制备预测和/或诊断UTUC进展时间的试剂盒中的应用及一种生物标志物组合。所述生物标志物与UTUC进展时间存在较高的相关性,所述UTUC进展时间预测模型在检测UTUC进展时间方面具有较高的准确率、灵敏度和特异性。
为解决上述技术问题,本发明提供的一个技术方案为:一种生物标志物在制备预测和/或诊断UTUC进展时间的试剂盒中的应用;其中,所述生物标志物包括以下一种或多种蛋白质:TMPO、NXF1和ARIH1。
在本发明一较佳实施方案中,所述生物标志物还包括EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于检测生物标志物的试剂,所述生物标志物包括以下一种或多种蛋白质:TMPO、NXF1和ARIH1。
在本发明一较佳实施方案中,所述生物标志物还包括EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3。
在本发明一较佳实施方案中,所述试剂用于检测所述生物标志物的表达水平;所述表达水平为蛋白表达水平和/或mRNA转录水平。
在本发明一较佳实施方案中,所述试剂为用于转录组和/或蛋白质组测序的试剂。
在本发明一较佳实施方案中,所述试剂为与所述生物标志物特异性结合,或者与编码所述生物标志物的核酸特异性杂交的生物分子试剂。
在本发明一较佳实施方案中,所述生物分子试剂选自引物、探针和抗体。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于检测生物标志物的试剂在制备预测和/或诊断UTUC进展时间的试剂盒中的应用;所述生物标志物包括以下一种或多种蛋白质:TMPO、NXF1和ARIH1。
在本发明一较佳实施方案中,所述生物标志物还包括EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3。
在本发明一较佳实施方案中,所述试剂如本发明前文所述。
为解决上述技术问题,本发明提供的一个技术方案为:一种生物标志物组合,所述生物标志物组合包括以下一种或多种蛋白质:TMPO、NXF1和ARIH1。
在本发明一较佳实施方案中,所述生物标志物还包括EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3。
为解决上述技术问题,本发明提供的一个技术方案为:一种试剂盒,所述试剂盒包含如发明所述的试剂和如本发明所述的生物标志物组合。
为解决上述技术问题,本发明提供的一个技术方案为:一种检测UTUC进展时间的方法,所述方法包括检测待测血浆样本中的生物标志物的表达水平;所述生物标志物包括以下一种或多种蛋白质:TMPO、NXF1和ARIH1。
在本发明一较佳实施方案中,所述生物标志物还包括EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3。
在本发明一较佳实施方案中,所述表达水平为蛋白表达水平和/或mRNA转录水平。
在本发明一较佳实施方案中,所述检测UTUC进展时间的方法为非诊断目的的。
本发明中,所述“非诊断目的”是指出于科学研究、病理数据统计的目的,适用场景包括验证动物模型是否成功构建、体外药效实验、肿瘤的流行病学统计等。
为解决上述技术问题,本发明提供的一个技术方案为:一种UTUC进展时间预测模型的构建方法,所述构建方法包括:
将蛋白质表达量数据库中的蛋白质表达量数据LASSO-Cox进行机器学习,构建得到所述UTUC进展时间预测模型;所述蛋白质表达量数据库中蛋白质表达量数据的来源包含未行术前化疗的UTUC患者的血浆样本(具有不同的UTUC进展时间,例如进展时间为12个月、72个月和60个月,12个月、72个月和60个月的血浆样本的比例例如为21%、36%和44%,也可为18%、27%和32%);所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据TMPO、NXF1和ARIH1。
在本发明一较佳实施方案中,所述生物标志物还包括EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3。
在本发明一较佳实施方案中,所述不同UTUC患者进展时间是按患者进展时间将UTUC患者样本分为1年、3年和5年三组。
在本发明一较佳实施方案中,所述蛋白质表达量数据通过LC-MS技术得到,使用DIA(data-independent acquisition,数据非依赖性)检测方式或PRM(parallel reactionmonitoring,平行反应检测)检测方式采集。
在本发明一更佳实施方案中,所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配。优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ(Intensity-based absolute-protein-quantification,无标签的基于强度的绝对定量)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ值除以样品中所有已鉴定蛋白质的总iBAQ值),并将各蛋白的FOT作为蛋白质表达量数据输入LASSO-Cox模型。
在本发明一更佳实施方案中,所述PRM检测方式可参考PMID:36347856和PMID:27958391。优选地,PRM原始数据由Skyline-daily(4.2.1.19004,华盛顿大学,美国)搜索,并用Skyline-daily报道的片段总面积对蛋白质进行量化;选择多肽,并在样本中测试其信号的稳定性和峰的形状,以供最终量化,并参考skyline提供的排名。例如所述PRM检测方式中使用的靶向肽段如表1中的SEQ ID NO:1-6所示。
在本发明一较佳实施方案中,所述蛋白质表达量数据输入LASSO-Cox模型前,先将所述蛋白质表达量数据分为发现队列和验证队列。优选地,所述发现队列和验证队列的比例为2:1-8:1,更优选为4:1。
在本发明一较佳实施方案中,输入LASSO-Cox模型的蛋白质满足:UTUC患者进展时间与该患者的蛋白表达量有显著相关性,即Spearman P<0.05。
在本发明一较佳实施方案中,所述LASSO-Cox模型为先将蛋白质的FOT输入Cox回归模型的R包,再将筛选得到的蛋白质的FOT输入LASSO模型的R包。
在本发明一更佳实施方案中,Cox回归模型的R包为:
library(survival)
library(survminer)
data=read.csv("UTUC OS 365.csv")
survival_dat=data
my.surv<-Surv(survival_dat$Time,survival_dat$Status)
cox_results<-apply(survival_dat[,5:length(survival_dat)],2,function(values1){
group=ifelse(values1>median(values1),'xHigh','Low')#mean median
survival_dat<-data.frame(group=group,stringsAsFactors=F)
m=coxph(my.surv~group,data=survival_dat)
beta<-coef(m)
se<-sqrt(diag(vcov(m)))
HR<-exp(beta)
HRse<-HR*se
#summary(m)
tmp<-round(cbind(coef=beta,se=se,z=beta/se,p=1-pchisq((beta/se)^2,1),HR=HR,HRse=HRse,HRz=(HR-1)/HRse,HRp=1-pchisq(((HR-1)/HRse)^2,1),HRCILL=exp(beta-qnorm(.95,0,1)*se),HRCIUL=exp(beta+qnorm(.95,0,1)*se)),3)
return(tmp['groupxHigh',])
})
(df=cox_results[,cox_results[4,]<1.5])
df_surv=data.frame(t(cox_results))
write.csv(df_surv,'all new351xx OSmedian c.csv')。
在本发明一更佳实施方案中,所述LASSO模型的R包为:library(glmnet)
library(foreign)
rm=(list=ls())
x=read.csv("UTUC21gene.csv",header=T,row.names=1)
y=read.csv("UTUCPFS.csv",header=T,row.names=1)
x=t(as.matrix(x))
y=t(as.matrix(y))
f1=glmnet(x,y,family="gaussian",nlambda=100,alpha=1)
#f1=glmnet(x,y,family="binomial",nlambda=100,alpha=1)print(f1)
plot(f1,xvar="lambda",label=TRUE)
cvfit=cv.glmnet(x,y)
plot(cvfit)
cvfit$lambda.min
cvfit$lambda.1se
l.coef2<-coef(cvfit$glmnet.fit,s=cvfit$lambda.min,exact=F)
l.coef2@x
data=l.coef2@x
dataName=l.coef2@Dimnames[[1]]
dataIndex=l.coef2@i+1
dataName2=dataName[dataIndex]
data=data.frame(dataName2,data)
write.csv(data,"genenewlianxu21.csv")
mod=glm(y~x[,'ARIH1']+x[,'EIF4H']+x[,'PPP5C']+x[,'NDUFAF3']+x[,'LRG1']+x[,'NXF1']+x[,'SNRPB']+x[,'AK2']+x[,'TMPO']+x[,'IFITM3'],family="gaussian")
summary(mod)
p=predict(mod,as.data.frame(x))
p
p=as.data.frame(p)。
为解决上述技术问题,本发明提供的一个技术方案为:一种UTUC进展时间预测模型,所述UTUC进展时间预测模型由如本发明所述的UTUC进展时间预测模型的构建方法建构得到。
在本发明一较佳实施方案中,所述构建方法中输入LASSO-Cox模型的蛋白质由TMPO、NXF1和ARIH1构成。
在本发明一较佳实施方案中,所述生物标志物由SPAG9、HNRNPL、ATP6AP1、TWF2、EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3构成。
在本发明一较佳实施方案中,所述UTUC进展时间预测模型为如下计算公式:Predicted PFS=53.557609+AK2×0.0634408+IFITM3×0.1816506-LRG1×0.020376-NDUFAF3×0.341377-PPP5C×0.052722-SNRPB×0.159858-NXF1×0.039298–ARIH1×0.82372+TMPO×1.5458147-EIF4H×0.845486,所述Predicted PFS的数值即为UTUC进展时间,所述Predicted PFS的数值的单位为月。
为解决上述技术问题,本发明提供的一个技术方案为:一种样本UTUC进展时间的预测方法,所述预测方法包括将样本的蛋白质表达量数据输入如本发明所述的UTUC进展时间预测模型,得到样本的UTUC进展时间的预测结果;所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:TMPO、NXF1和ARIH1。
在本发明一较佳实施方案中,所述生物标志物还包括EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3。
优选地,所述预测方法为非诊断目的的。
在本发明一较佳实施方案中,所述蛋白质表达量数据通过LC-MS技术得到,使用DIA(data-independent acquisition,数据非依赖性)检测方式或PRM(parallel reactionmonitoring,平行反应检测)检测方式采集。
在本发明一更佳实施方案中,所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配。优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ(Intensity-based absolute-protein-quantification,无标签的基于强度的绝对定量)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ值除以样品中所有已鉴定蛋白质的总iBAQ值),并将各蛋白的FOT作为蛋白质表达量数据输入LASSO-Cox模型。
在本发明一更佳实施方案中,所述PRM检测方式可参考PMID:36347856和PMID:27958391。优选地,PRM原始数据由Skyline-daily(4.2.1.19004,华盛顿大学,美国)搜索,并用Skyline-daily报道的片段总面积对蛋白质进行量化;选择多肽,并在样本中测试其信号的稳定性和峰的形状,以供最终量化,并参考skyline提供的排名。例如所述PRM检测方式中使用的靶向肽段如表1中的SEQ ID NO:1-6所示。
在本发明一较佳实施方案中,所述预测结果为Predicted PFS的数值,所述Predicted PFS的数值通过以下公式计算得到:Predicted PFS=53.557609+AK2×0.0634408+IFITM3×0.1816506-LRG1×0.020376-NDUFAF3×0.341377-PPP5C×0.052722-SNRPB×0.159858-NXF1×0.039298–ARIH1×0.82372+TMPO×1.5458147-EIF4H×0.845486。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于预测UTUC进展时间的系统,所述系统包括:
数据接收模块,用于接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:TMPO、NXF1和ARIH1;
判断并输出模块,用于在所述接收或输入完成后,通过如本发明所述的UTUC进展时间预测模型,输出对所述血浆样本的个体UTUC进展时间的预测结果。
在本发明一较佳实施方案中,所述生物标志物还包括EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3。
在本发明一较佳实施方案中,所述系统还包括数据处理模块,用于采集血浆样本中的蛋白质表达量数据。优选地,所述蛋白质表达量数据通过LC-MS技术得到,使用DIA(data-independent acquisition,数据非依赖性)检测方式或PRM(parallel reactionmonitoring,平行反应检测)检测方式采集。
在本发明一更佳实施方案中,所述DIA或PRM检测方式采集的数据经Firmiana软件进行肽段匹配。更优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ(Intensity-basedabsolute-protein-quantification,无标签的基于强度的绝对定量)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ值除以样品中所有已鉴定蛋白质的总iBAQ值),并将各蛋白的FOT作为蛋白质表达量数据输入LASSO-Cox模型。
在本发明一更佳实施方案中,所述PRM检测方式为对蛋白质表达量数据通过各蛋白质的2-3种靶向肽进行PRM。优选地,所述PRM检测方式可参考PMID:36347856和PMID:27958391。更优选地,PRM原始数据由Skyline-daily(4.2.1.19004,华盛顿大学,美国)搜索,并用Skyline-daily报道的片段总面积对蛋白质进行量化;选择多肽,并在样本中测试其信号的稳定性和峰的形状,以供最终量化,并参考skyline提供的排名。例如所述PRM检测方式中使用的靶向肽段如表1中的SEQ ID NO:1-6所示。
为解决上述技术问题,本发明提供的一个技术方案为:一种计算机辅助的UTUC进展时间预测方法,所述UTUC进展时间预测方法包括以下步骤:
步骤1:接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:TMPO、NXF1和ARIH1;
步骤2:将步骤1接收或输入的蛋白质表达量数据输入如本发明所述的UTUC进展时间预测模型,输出对所述血浆样本的个体UTUC进展时间的预测结果。
在本发明一较佳实施方案中,所述UTUC进展时间预测方法还包括步骤0:采集血浆样本中的蛋白质表达量数据。优选地,所述蛋白质表达量数据通过LC-MS技术得到,使用DIA(data-independent acquisition,数据非依赖性)检测方式或PRM(parallel reactionmonitoring,平行反应检测)检测方式采集。
在本发明一更佳实施方案中,所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配。优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ(Intensity-based absolute-protein-quantification,无标签的基于强度的绝对定量)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ值除以样品中所有已鉴定蛋白质的总iBAQ值),并将各蛋白的FOT作为蛋白质表达量数据输入LASSO-Cox模型。
在本发明一更佳实施方案中,所述PRM检测方式为对蛋白质表达量数据通过各蛋白质的2-3种靶向肽进行PRM。优选地,所述PRM检测方式可参考PMID:36347856和PMID:27958391。更优选地,PRM原始数据由Skyline-daily(4.2.1.19004,华盛顿大学,美国)搜索,并用Skyline-daily报道的片段总面积对蛋白质进行量化;选择多肽,并在样本中测试其信号的稳定性和峰的形状,以供最终量化,并参考skyline提供的排名。例如所述PRM检测方式中使用的靶向肽段如表1中的SEQ ID NO:1-6所示。
在本发明一较佳实施方案中,所述生物标志物还包括EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3。
为解决上述技术问题,本发明提供的一个技术方案为:一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时,可实现如本发明所述的系统的功能,或实现如本发明所述的UTUC进展时间预测方法的步骤。
本发明中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现如本发明所述的系统的功能,或实现如本发明所述的UTUC进展时间预测方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
为解决上述技术问题,本发明提供的一个技术方案为:一种电子设备,其包括存储器和处理器,所述存储器存储有计算机程序,所述处理器用于执行所述计算机程序以实现如本发明所述的系统的功能,或实现如本发明所述的UTUC进展时间预测方法的步骤。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明所用试剂和原料均市售可得。
本发明的积极进步效果在于:
本发明提供的UTUC进展时间预测模型和生物标志物可以检测UTUC的病程进展程度,具有高灵敏度和高特异性的优点,并且随着UTUC进展时间边长,模型的预测效率逐渐提高。具有广泛的科研价值并为个体提供个性化的UTUC进展时间检测,有利支持了UTUC进展时间的检测,对治疗UTUC患者的临床决策具有重要意义。
具有广泛的科研价值并为上尿路尿路上皮癌患者提供个性化预测,对于帮助指导UTUC患者的咨询、随访安排、辅助治疗、临床决策等具有重要意义。
附图说明
图1为本发明所述检测UTUC进展的血浆生物标志物组合在发现队列的受试者工作特征曲线(ROC)图。
图2为本发明所述检测UTUC进展的血浆生物标志物组合在验证队列的受试者工作特征曲线(ROC)图。
图3为鉴定蛋白的累计曲线图。
图4为检测UTUC进展的系统的结构示意图。
图5为电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
实施例中所需的确诊为上尿路尿路上皮癌患者的术前血浆样本的451例,其中362例为发现队列(通过随访记录患者的无进展生存期PFS,1年、3年和5年发生进展比例分别是21%、36%和44%),89例为独立验证队列(通过随访记录患者的无进展生存期PFS,1年、3年和5年发生进展比例分别是18%、27%和32%)。本研究的设计和实施由医学伦理委员会通过伦理投票批准和监督。已获得所有患者的书面知情同意。
实施例1上尿路尿路上皮癌术前的血浆临床样本的预处理
临床样本为术前血浆样本。样品预处理:收集新鲜血液加入到盛有抗凝剂的管中,颠倒混匀,充分抗凝,1000-2000×g离心10min,取上层淡黄色透明液体即为血浆,存至离心管中,-80冻存备用。
实施例2临床样本的蛋白质及肽段提取
2μL血浆样品与100μL 50mM碳酸氢铵缓冲液混合,混合液在95℃金属浴5min后冷却至室温,在37℃恒温箱中,酶蛋白质量比为1:25的条件下用胰蛋白酶(Promega,Catalog:V528A)消化17小时。然后在每个管中加入5μL的氨水,旋涡混匀,终止酶解。在60℃真空干燥器(SpeedVac,Eppendorf)中进行抽干。抽干后,取100μL 0.1%甲酸复溶,并漩涡震荡3min,离心5min(12000g),取上清进行脱盐。脱盐前需要制备并活化柱子(2片3M C18膜),活化顺序为:90μL 100%乙腈2次,90μL 50%乙腈和80%乙腈依次1次,90μL 50%乙腈1次。90μL0.1%甲酸平衡柱2次后,将管上清装入柱2次,90μL 0.1%甲酸脱盐2次。最后,加入90μL洗脱缓冲液(0.1%甲酸,50%乙腈)2次,收集洗脱液。60℃真空抽干,获得用于质谱检测所需的肽段。
实施例3临床样本的质谱检测
用Q-Exactive HF-X混合四极轨道阱质谱仪(Thermo Fisher Scientific,Rockford,IL,USA)和高效液相色谱系统(EASY nLC 1200,Thermo Fisher)进行检测,并得到该肽样品对应的质谱数据。具体操作为:
抽干的肽样品重新溶解在溶剂A(0.1%甲酸的水溶液)中,60℃,150μm I.D.×8cm色谱柱上分离(C18,1.9μm,Dr.Maisch GmbH)。流动相A和B分别为99.9/0.1%水/甲酸(v/v)和80/20/0.1%乙腈/水/甲酸(v/v/v)。质谱条件设置为数据非依赖性(data-independent acquisition,DIA)或平行反应检测(parallel reaction monitoring,PRM)。
DIA采集的循环模式为1个一级全扫描+30个可变窗口DIA扫描;一级扫描范围为300-1400m/z;一级检测:轨道阱质量分析器,分辨率:60k(@200m/z);离子选择模式:四级杆;AGC:4.0e5;二级碎裂模式:高能碰撞解离;碰撞能量:30%;二级检测:轨道阱质量分析器;分辨率:15k@200m/z;30个可变窗口具体为:300-346m/z,346-414m/z,414-453.5m/z,453.5-484.5m/z,484.5-512.5m/z,512.5-541.5m/z,541.5-570.5m/z,570.5-597m/z,597-621m/z,621-645m/z,645-668m/z,668-691m/z,691-714.5m/z,714.5-738m/z,738-762.5m/z,762.5-787m/z,787-809.5m/z,809.5-832m/z,832-856.5m/z,856.5-881.5m/z,881.5-908m/z,908-936m/z,936-963.5m/z,963.5-993.5m/z,993.5-1027.5m/z,1027.5-1062.5m/z,1062.5-1104m/z,1104-1157m/z,1157-1224.5m/z,1224.5-1331.5m/z。液相色谱串联质谱系统使用Xcalibur软件(Thermo Scientific)控制进行数据采集。
在验证队列中,选择血浆生物标志物的2-3种靶向肽进行平行反应检测(parallelreaction monitoring,PRM)。在PRM模式下,离子选择模式为四极杆,碎裂模式为高能碰撞解离。流动相与DIA方法中提到的相同。一级检测:分辨率为60,000,AGC为3E6,最大IT为20MS,扫描范围为300~1400m/z。然后通过1.2Th的m/z窗口分离目标前体,随后在27%归一化碰撞能量下碎裂。产物离子扫描分辨率为15,000,AGC为1E6,最大注入时间为25ms。
实施例4质谱数据的收集和处理
所有DIA数据均使用Firmiana(V1.0)进行处理。Firmiana是一个基于Galaxy系统的工作流,由用户登录界面、原数据、识别与量化、数据分析和知识挖掘等多个功能模块组成。使用FragPipe(v12.1)和MSFragger(2.2)(DIA数据)和Mascot搜索引擎(DDA数据)在UniProt人类蛋白质数据库(更新于2019.12.17,20406项)中搜索数据。选择胰蛋白酶作为蛋白水解酶,最大允许两个漏切位点,固定修饰为carbamidomethyl(C),动态修饰为protein acetyl(protein N-term),oxidation(M)。第一个搜索质量耐受性为20ppm,主要搜索肽耐受性为0.5da。数据根据诱饵数据库进行搜索,蛋白质鉴定以1%的错误发现率(FDR)被接受。利用SpectraST软件将DDA数据的结果合并到谱图库中。共有327个库作为参考谱图库。
DIA数据采用DIA-NN(v1.7.0)进行分析。DIA-NN采用默认设置(前驱体FDR:5%,Log lev:1,质量精度:20ppm,MS1精度:10ppm,扫描窗口:30,隐式蛋白组:基因,定量策略:稳健LC(高精度))。通过所有参考谱图库的色谱片段离子峰面积的平均值来计算识别肽的定量。使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量。计算了峰面积值作为相应蛋白质的一部分。总分数(FOT)用于表示样品中特定蛋白质的标准化丰度。FOT定义为特定蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ。
PRM原始数据由Skyline-daily(4.2.1.19004,华盛顿大学,美国)搜索。用Skyline-daily报道的片段总面积对蛋白质进行量化。选择多肽,并在样本中测试其信号的稳定性和峰的形状,以供最终量化,并参考skyline提供的排名。
实施例5筛选蛋白质标记物
分析蛋白质标记物的表达量,选取有效鉴定蛋白。
在发现队列的362例样本中,鉴定的蛋白质数目在1586-2257之间。如图3所示的累计曲线图,在362个样本中,总共鉴定到8890种蛋白质。本发明以每种蛋白质在特定样本中的表达量占该样本中所有蛋白质表达量的比例(fraction of total,FOT)作为其归一化的表达量,再将FOT值乘以1e5作为最终的输入值。
实施例6建立预测模型
将上述451例UTUC患者的血浆样本分为包括362例的发现队列和89例的验证队列。
首先,通过Spearman P<0.05,筛选出842种与患者PFS显著相关的蛋白质。然后再通过多因素Cox回归模型筛选出P<0.05的93种蛋白质,分别为:ACTR1B,AK2,APOA2,APOF,ARPC1B,BCHE,C4BPA,C9,CCS,COTL1,CPT1A,CRP,F13A1,F9,FCN3,GGT1,GGT2,GGT3P,HK1,HPR,IFITM3,KRT10,LASP1,LCP1,LRG1,METAP1,NDUFAF3,P4HB,PI16,PPP5C,RCN1,S100A9,SAA1,SAA2,SAA4,SCARB2,SNRPB,SNRPN,ABHD11,ACADS,CAPZB,CDH11,EIF4A1,GNAQ,MACF1,MCM7,MKI67,MRPL23,MYL4,MYL6,NXF1,PCYT1A,SERPINA11,SLC25A3,UBA6,ARIH1,CCT4,CD200,PPP2R2A,PRRC2C,SIPA1,CDC42EP5,EARS2,ENOPH1,SLC25A4,STXBP2,TMPO,ARL3,EIF4H,HECTD4,SMPD4,FAT2,FES,HSPB6,ARSL,EPS8L2,PMEL,SAMM50,TNIK,PRRT3,RUFY1,TBCB,CLNS1A,RPL4,MSRA,CFTR,RPS19,ACOX1,MRPL28,MRPL55,CPNE9,CCDC58,POFUT2进一步进行LASSO回归模型,最后筛选出10种蛋白质作为候选标志物,分别为ARIH1,EIF4H,PPP5C,NDUFAF3,LRG1,NXF1,SNRPB,AK2,TMPO,IFITM3。
上述筛选和建立预测UTUC进展时间的模型的具体操作如下:
将与UTUC患者PFS显著相关的蛋白质的FOT值输入如下所示的Cox回归模型的R包进行处理:
library(survival)
library(survminer)
data=read.csv("UTUC OS 365.csv")
survival_dat=data
my.surv<-Surv(survival_dat$Time,survival_dat$Status)
cox_results<-apply(survival_dat[,5:length(survival_dat)],2,function(values1){
group=ifelse(values1>median(values1),'xHigh','Low')#mean median
survival_dat<-data.frame(group=group,stringsAsFactors=F)
m=coxph(my.surv~group,data=survival_dat)
beta<-coef(m)
se<-sqrt(diag(vcov(m)))
HR<-exp(beta)
HRse<-HR*se
#summary(m)
tmp<-round(cbind(coef=beta,se=se,z=beta/se,p=1-
pchisq((beta/se)^2,1),HR=HR,HRse=HRse,
HRz=(HR-1)/HRse,HRp=1-pchisq(((HR-1)/HRse)^2,1),
HRCILL=exp(beta-qnorm(.95,0,1)*se),
HRCIUL=exp(beta+qnorm(.95,0,1)*se)),3)
return(tmp['groupxHigh',])
})
(df=cox_results[,cox_results[4,]<1.5])
df_surv=data.frame(t(cox_results))
write.csv(df_surv,'all new351xx OSmedian c.csv')
再将上一步所筛的93种蛋白质输入如下所示的LASSO模型的R包进行建模:
library(glmnet)
library(foreign)
rm=(list=ls())
x=read.csv("UTUC21gene.csv",header=T,row.names=1)
y=read.csv("UTUCPFS.csv",header=T,row.names=1)
x=t(as.matrix(x))
y=t(as.matrix(y))
f1=glmnet(x,y,family="gaussian",nlambda=100,alpha=1)
#f1=glmnet(x,y,family="binomial",nlambda=100,alpha=1)
print(f1)
plot(f1,xvar="lambda",label=TRUE)
cvfit=cv.glmnet(x,y)
plot(cvfit)
cvfit$lambda.min
cvfit$lambda.1se
l.coef2<-coef(cvfit$glmnet.fit,s=cvfit$lambda.min,exact=F)
l.coef2@x
data=l.coef2@x
dataName=l.coef2@Dimnames[[1]]
dataIndex=l.coef2@i+1
dataName2=dataName[dataIndex]
data=data.frame(dataName2,data)
write.csv(data,"genenewlianxu21.csv")
mod=glm(y~x[,'ARIH1']+x[,'EIF4H']+x[,'PPP5C']+x[,'NDUFAF3']+x[,'LRG1']+x[,'NXF1']+x[,'SNRPB']+x[,'AK2']+x[,'TMPO']+x[,'IFITM3'],family="gaussian")
summary(mod)
p=predict(mod,as.data.frame(x))
p
p=as.data.frame(p)
得到蛋白质生物标志物对于UTUC患者进展时间的计算公式:Predicted PFS=53.557609+AK2×0.0634408+IFITM3×0.1816506-LRG1×0.020376-NDUFAF3×0.341377-PPP5C×0.052722-SNRPB×0.159858-NXF1×0.039298–ARIH1×0.82372+TMPO×1.5458147-EIF4H×0.845486。
在发现队列中,最终在建立的DIA数据库中筛选得到UTUC患者血浆样本的10种蛋白质分子生物标志物(ARIH1、EIF4H、PPP5C、NDUFAF3、LRG1、NXF1、SNRPB、AK2、TMPO和IFITM3)相对表达水平计算其预测准确度,灵敏度及特异性。362例发现队列中,上述模型在对进展时间为1年、3年和5年的预测ROC-AUC分别为0.742、0.816和0.877(见图1);89例验证队列,在1年、3年和5年ROC-AUC为0.812、0.880和0.905(见图2)。可见随着UTUC进展时间边长,模型的预测效率逐渐提高。
由上述结果可知,上述血浆生物标志物可用于预测UTUC进展时间。
实施例7 PRM数据的独立验证
在验证队列中通过PRM数据筛选出UTUC不同进展时间患者血浆样本的3种蛋白质分子生物标志物(TMPO、NXF1和ARIH1,每个标志物选取2-3种靶向肽,肽段信息见表1的SEQID NO:1-6所示),89例验证队列中,上述模型对进展时间为1年、3年和5年的预测ROC-AUC分别为0.812、0.880和0.905(见图2)。对于UTUC患者,上述3中蛋白质分子生物标志物可以用来预测样本的UTUC进展时间。
表1靶向肽信息
组别 | 蛋白 | 肽段 | SEQ ID NO: | 质荷比[Da] |
无进展生存期预测模型 | TMPO | KVHTSKGDLPR | 1 | 619.36285 |
无进展生存期预测模型 | TMPO | QLPSLACKYPVSSR | 2 | 803.43314 |
无进展生存期预测模型 | NXF1 | HTRLNVVAFLNELPK | 3 | 876.00063 |
无进展生存期预测模型 | NXF1 | SCMAATLR | 4 | 455.2134 |
无进展生存期预测模型 | ARIH1 | EKLMERYFDGNLEK | 5 | 596.6157 |
无进展生存期预测模型 | ARIH1 | LMERYFDGNLEK | 6 | 510.90713 |
实施例8检测UTUC进展时间的系统
检测UTUC进展时间的系统61:数据接收模块52和判断并输出模块53,优选还包括数据处理模块51(见图4)。
数据处理模块51用于采集血浆样本中的蛋白质表达量数据,并将其传输给数据接收模块。
数据接收模块52用于将接收或输入血浆样本中的蛋白质表达量数据输入判断并输出模块53。其中,所述蛋白质表达量数据可通过数据处理模块51进行收集,亦可从其他来源获取所述蛋白质表达量数据。
判断并输出模块53用于在所述接收或输入完成后,通过如实施例6所述的UTUC进展时间预测模型,输出对血浆样本的个体的UTUC进展时间的预测结果。
实施例9电子设备
本实施例提供了一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现本发明实施例6中检测UTUC进展时间的方法。
图5示出了本实施例的硬件结构示意图,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例4的数据分析方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例10计算机可读存储介质
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现本发明实施例6中检测UTUC进展时间的方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现本发明实施例4中检测UTUC进展时间的方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
最后,上述具体实施方法仅用以说明本发明的技术方案,而非对其限制。
Claims (10)
1.一种用于检测生物标志物的试剂在制备预测和/或诊断UTUC进展时间的试剂盒中的应用;其特征在于,所述生物标志物由以下蛋白质组成:TMPO、NXF1、ARIH1、EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3;
所述试剂用于检测所述生物标志物的蛋白表达水平。
2.一种用于检测生物标志物的试剂,其特征在于,所述生物标志物由以下蛋白质组成:TMPO、NXF1、ARIH1、EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3;所述试剂用于检测所述生物标志物的蛋白表达水平。
3.一种生物标志物组合,其特征在于,所述生物标志物组合由以下蛋白质组成:TMPO、NXF1、ARIH1、EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3。
4.一种试剂盒,其特征在于,所述试剂盒包含如权利要求2所述的试剂和如权利要求3所述的生物标志物组合。
5.一种UTUC进展时间预测模型的构建方法,其特征在于,所述构建方法包括:
将蛋白质表达量数据库中的蛋白质表达量数据LASSO-Cox进行机器学习,构建得到所述UTUC进展时间预测模型;所述蛋白质表达量数据库中蛋白质表达量数据的来源包含未行术前化疗的UTUC患者的血浆样本,所述未行术前化疗的UTUC患者具有不同的UTUC进展时间;所述蛋白质表达量数据由以下生物标志物的蛋白质表达量数据组成:TMPO、NXF1、ARIH1、EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3;
所述蛋白质表达量数据通过LC-MS技术得到,使用DIA检测方式或PRM检测方式采集;所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配;所述肽段匹配的数据库为UniProt人类蛋白质数据库;采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ方法进行蛋白质定量,计算各蛋白质的FOT,并将各蛋白的FOT作为蛋白质表达量数据输入LASSO-Cox模型;
所述蛋白质表达量数据输入LASSO-Cox模型前,先将所述蛋白质表达量数据分为发现队列和验证队列,所述发现队列和验证队列的比例为2:1-8:1;输入LASSO-Cox模型的蛋白质满足:UTUC患者进展时间与该患者的蛋白表达量有显著相关性,即Spearman P < 0.05。
6. 如权利要求5所述的构建方法,其特征在于,所述UTUC进展时间预测模型为如下计算公式:Predicted PFS = 53.557609 + AK2×0.0634408 + IFITM3× 0.1816506 - LRG1× 0.020376 - NDUFAF3 × 0.341377 - PPP5C×0.052722-SNRPB×0.159858- NXF1×0.039298 – ARIH1×0.82372 + TMPO×1.5458147- EIF4H×0.845486,所述PredictedPFS的数值即为UTUC进展时间。
7.一种用于预测UTUC进展时间的系统,其特征在于,所述系统包括:
数据接收模块,用于接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据由以下生物标志物的蛋白质表达量数据组成:TMPO、NXF1、ARIH1、EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3;
判断并输出模块,用于在所述接收或输入完成后,通过如权利要求5或6所述的构建方法构建得到的UTUC进展时间预测模型,输出对所述血浆样本的个体UTUC进展时间的预测结果;
所述系统还包括数据处理模块,用于采集血浆样本中的蛋白质表达量数据;所述蛋白质表达量数据通过LC-MS技术得到,使用DIA检测方式或PRM检测方式采集;所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配;所述肽段匹配的数据库为UniProt人类蛋白质数据库;采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ方法进行蛋白质定量,计算各蛋白质的FOT,并将各蛋白的FOT作为蛋白质表达量数据输入LASSO-Cox模型。
8.一种计算机辅助的UTUC进展时间预测方法,其特征在于所述UTUC进展时间预测方法包括以下步骤:
步骤1:接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据由以下生物标志物的蛋白质表达量数据组成:TMPO、NXF1、ARIH1、EIF4H、PPP5C、NDUFAF3、LRG1、SNRPB、AK2和IFITM3;
步骤2:将步骤1接收或输入的蛋白质表达量数据输入如权利要求5或6所述的构建方法构建得到的UTUC进展时间预测模型,输出对所述血浆样本的个体UTUC进展时间的预测结果。
9.一种计算机可读存储介质,其存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,可实现如权利要求7所述的系统的功能。
10.一种电子设备,其包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器用于执行所述计算机程序以实现如权利要求7所述的系统的功能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311050108.7A CN117004729B (zh) | 2023-08-18 | 2023-08-18 | 生物标志物及其在预测和/或诊断utuc进展时间中的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311050108.7A CN117004729B (zh) | 2023-08-18 | 2023-08-18 | 生物标志物及其在预测和/或诊断utuc进展时间中的应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117004729A CN117004729A (zh) | 2023-11-07 |
CN117004729B true CN117004729B (zh) | 2024-03-15 |
Family
ID=88570950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311050108.7A Active CN117004729B (zh) | 2023-08-18 | 2023-08-18 | 生物标志物及其在预测和/或诊断utuc进展时间中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117004729B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111868260A (zh) * | 2017-08-07 | 2020-10-30 | 约翰斯霍普金斯大学 | 用于评估和治疗癌症的方法和材料 |
-
2023
- 2023-08-18 CN CN202311050108.7A patent/CN117004729B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111868260A (zh) * | 2017-08-07 | 2020-10-30 | 约翰斯霍普金斯大学 | 用于评估和治疗癌症的方法和材料 |
Non-Patent Citations (3)
Title |
---|
Kaiwei Yang 等.Comparison of Genomic Characterization in Upper Tract Urothelial Carcinoma and Urothelial Carcinoma of the Bladder.《Research Suqare》.2021,第1-24页. * |
Łukasz Nowak 等.The impact of diagnostic ureteroscopy prior to radical nephroureterectomy on oncological outcomes in patients with upper tract urothelial carcinoma: a comprehensive systematic review and meta-analysis.《Preprints》.2021,第1-23页. * |
Marco Cosentino 等.Upper urinary tract urothelial cell carcinoma: location as a predictive factor for concomitant bladder carcinoma.《World J Urol》.2012,第31卷第141-145页. * |
Also Published As
Publication number | Publication date |
---|---|
CN117004729A (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guo et al. | Rapid mass spectrometric conversion of tissue biopsy samples into permanent quantitative digital proteome maps | |
US20040153249A1 (en) | System, software and methods for biomarker identification | |
KR20110063753A (ko) | 폐암 바이오마커 및 그것들의 용도 | |
CN117079710B (zh) | 生物标志物及其在预测和/或诊断utuc肌肉浸润中的应用 | |
CN115612738A (zh) | 生物标志物组合及其在预测胃癌治疗效果中的应用 | |
WO2013028807A2 (en) | Renal cell carcinoma biomarkers and uses thereof | |
CN116732164A (zh) | 生物标志物组合及其在预测asd疾病中的应用 | |
CN117051113B (zh) | 生物标志物组合在制备预测结直肠癌的试剂盒中的应用 | |
CN117074679B (zh) | 生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用 | |
Jimenez et al. | High-throughput and targeted in-depth mass spectrometry-based approaches for biofluid profiling and biomarker discovery | |
CN117004729B (zh) | 生物标志物及其在预测和/或诊断utuc进展时间中的应用 | |
WO2012122094A2 (en) | Biomarkers of cardiac ischemia | |
CN117187385B (zh) | 生物标志物在制备预测和/或诊断utuc的试剂盒中的应用 | |
CN115678995A (zh) | 生物标志物组合及其在预测药物治疗胃癌效果中的应用 | |
EP2674758A1 (en) | A computational method for mapping peptides to proteins using sequencing data | |
CN115678993A (zh) | 一种生物标志物组合、含其的试剂及其应用 | |
US20180356419A1 (en) | Biomarkers for detection of tuberculosis risk | |
CN117089621B (zh) | 生物标志物组合及其在预测结直肠癌疗效中的应用 | |
CN117070635B (zh) | 生物标志物组合在制备预测透明性肾细胞癌的试剂盒中的应用 | |
CN118534004A (zh) | Tlr3在预估bcg化疗对nmibc患者有效性中的应用 | |
Sun et al. | A comprehensive mass spectral library for human thyroid tissues | |
CN117587128A (zh) | 生物标志物组合及其在预测和/或诊断结直肠癌中的应用 | |
WO2023211769A1 (en) | Methods for sample quality assessment | |
Keller et al. | Applications of high-throughput methods to cancer metastases | |
AlZaabi et al. | Differential Serum Peptidomics Reveal Multi-Marker Models That Predict Breast Cancer Progression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |