CN116312778B - 成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质 - Google Patents
成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116312778B CN116312778B CN202310077993.1A CN202310077993A CN116312778B CN 116312778 B CN116312778 B CN 116312778B CN 202310077993 A CN202310077993 A CN 202310077993A CN 116312778 B CN116312778 B CN 116312778B
- Authority
- CN
- China
- Prior art keywords
- mature
- data
- model
- cell tumor
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 165
- 210000003519 mature b lymphocyte Anatomy 0.000 title claims abstract description 130
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 129
- 238000000034 method Methods 0.000 title claims abstract description 58
- 239000003550 marker Substances 0.000 claims abstract description 77
- 102000003729 Neprilysin Human genes 0.000 claims abstract description 38
- 108090000028 Neprilysin Proteins 0.000 claims abstract description 38
- 210000004881 tumor cell Anatomy 0.000 claims abstract description 32
- 238000001514 detection method Methods 0.000 claims abstract description 29
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 27
- 230000006870 function Effects 0.000 claims description 35
- 238000012549 training Methods 0.000 claims description 31
- 238000012360 testing method Methods 0.000 claims description 24
- 239000011159 matrix material Substances 0.000 claims description 20
- 201000000638 mature B-cell neoplasm Diseases 0.000 claims description 16
- 208000010915 neoplasm of mature B-cells Diseases 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 11
- 230000000007 visual effect Effects 0.000 claims description 8
- 238000012800 visualization Methods 0.000 claims description 8
- 201000004085 CLL/SLL Diseases 0.000 claims description 7
- 208000023738 chronic lymphocytic leukemia/small lymphocytic lymphoma Diseases 0.000 claims description 7
- 238000002790 cross-validation Methods 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 7
- 230000037430 deletion Effects 0.000 claims description 7
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000012905 input function Methods 0.000 claims description 6
- 230000035772 mutation Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 239000000427 antigen Substances 0.000 claims description 4
- 108091007433 antigens Proteins 0.000 claims description 4
- 102000036639 antigens Human genes 0.000 claims description 4
- 238000001574 biopsy Methods 0.000 claims description 4
- 238000000684 flow cytometry Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 210000001185 bone marrow Anatomy 0.000 claims description 2
- 210000000349 chromosome Anatomy 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 230000001502 supplementing effect Effects 0.000 claims description 2
- 210000001519 tissue Anatomy 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 claims description 2
- 238000004393 prognosis Methods 0.000 claims 1
- 238000010801 machine learning Methods 0.000 abstract description 8
- 238000011161 development Methods 0.000 abstract description 6
- 238000012163 sequencing technique Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 5
- 102100033350 ATP-dependent translocase ABCB1 Human genes 0.000 description 2
- 102100027205 B-cell antigen receptor complex-associated protein alpha chain Human genes 0.000 description 2
- 108700020463 BRCA1 Proteins 0.000 description 2
- 101150072950 BRCA1 gene Proteins 0.000 description 2
- 102100025401 Breast cancer type 1 susceptibility protein Human genes 0.000 description 2
- 102100031690 Erythroid transcription factor Human genes 0.000 description 2
- 101000914489 Homo sapiens B-cell antigen receptor complex-associated protein alpha chain Proteins 0.000 description 2
- 101001066268 Homo sapiens Erythroid transcription factor Proteins 0.000 description 2
- 101000631899 Homo sapiens Ribosome maturation protein SBDS Proteins 0.000 description 2
- -1 KIT Proteins 0.000 description 2
- 108010018650 MEF2 Transcription Factors Proteins 0.000 description 2
- 102000055120 MEF2 Transcription Factors Human genes 0.000 description 2
- 108010047230 Member 1 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 2
- 102100028750 Ribosome maturation protein SBDS Human genes 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 102100026210 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase gamma-2 Human genes 0.000 description 1
- 102100034580 AT-rich interactive domain-containing protein 1A Human genes 0.000 description 1
- 102100034571 AT-rich interactive domain-containing protein 1B Human genes 0.000 description 1
- 102100023157 AT-rich interactive domain-containing protein 2 Human genes 0.000 description 1
- 102000000872 ATM Human genes 0.000 description 1
- 101150020330 ATRX gene Proteins 0.000 description 1
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 1
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 1
- 102100034280 Ankyrin repeat domain-containing protein 26 Human genes 0.000 description 1
- 102100021569 Apoptosis regulator Bcl-2 Human genes 0.000 description 1
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 description 1
- 102100023610 Autophagy-related protein 2 homolog B Human genes 0.000 description 1
- 108700024832 B-Cell CLL-Lymphoma 10 Proteins 0.000 description 1
- 102100027203 B-cell antigen receptor complex-associated protein beta chain Human genes 0.000 description 1
- 102100021631 B-cell lymphoma 6 protein Human genes 0.000 description 1
- 102100037598 B-cell lymphoma/leukemia 10 Human genes 0.000 description 1
- 102100021247 BCL-6 corepressor Human genes 0.000 description 1
- 102100021256 BCL-6 corepressor-like protein 1 Human genes 0.000 description 1
- 101150074953 BCL10 gene Proteins 0.000 description 1
- 108091012583 BCL2 Proteins 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 102000052609 BRCA2 Human genes 0.000 description 1
- 108700003785 Baculoviral IAP Repeat-Containing 3 Proteins 0.000 description 1
- 102100021662 Baculoviral IAP repeat-containing protein 3 Human genes 0.000 description 1
- 102100027314 Beta-2-microglobulin Human genes 0.000 description 1
- 101150104237 Birc3 gene Proteins 0.000 description 1
- 102100036200 Bisphosphoglycerate mutase Human genes 0.000 description 1
- 108010029692 Bisphosphoglycerate mutase Proteins 0.000 description 1
- 102100035631 Bloom syndrome protein Human genes 0.000 description 1
- 108091009167 Bloom syndrome protein Proteins 0.000 description 1
- 101000964894 Bos taurus 14-3-3 protein zeta/delta Proteins 0.000 description 1
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 1
- 102100034808 CCAAT/enhancer-binding protein alpha Human genes 0.000 description 1
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 1
- 102100021975 CREB-binding protein Human genes 0.000 description 1
- 102100029968 Calreticulin Human genes 0.000 description 1
- 102100024965 Caspase recruitment domain-containing protein 11 Human genes 0.000 description 1
- 102100038165 Chromodomain-helicase-DNA-binding protein 8 Human genes 0.000 description 1
- 102100035595 Cohesin subunit SA-2 Human genes 0.000 description 1
- 108010043471 Core Binding Factor Alpha 2 Subunit Proteins 0.000 description 1
- 108010058546 Cyclin D1 Proteins 0.000 description 1
- 102000009512 Cyclin-Dependent Kinase Inhibitor p15 Human genes 0.000 description 1
- 108010009356 Cyclin-Dependent Kinase Inhibitor p15 Proteins 0.000 description 1
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 1
- 108010016788 Cyclin-Dependent Kinase Inhibitor p21 Proteins 0.000 description 1
- 102100033270 Cyclin-dependent kinase inhibitor 1 Human genes 0.000 description 1
- 102100024458 Cyclin-dependent kinase inhibitor 2A Human genes 0.000 description 1
- 108010076010 Cystathionine beta-lyase Proteins 0.000 description 1
- 102100038497 Cytokine receptor-like factor 2 Human genes 0.000 description 1
- 102100028712 Cytosolic purine 5'-nucleotidase Human genes 0.000 description 1
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 1
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 1
- 102100037799 DNA-binding protein Ikaros Human genes 0.000 description 1
- 102100039436 DNA-binding protein inhibitor ID-3 Human genes 0.000 description 1
- 102100022204 DNA-dependent protein kinase catalytic subunit Human genes 0.000 description 1
- 102100029952 Double-strand-break repair protein rad21 homolog Human genes 0.000 description 1
- 102100031480 Dual specificity mitogen-activated protein kinase kinase 1 Human genes 0.000 description 1
- 108010044191 Dynamin II Proteins 0.000 description 1
- 102100021238 Dynamin-2 Human genes 0.000 description 1
- 102100035813 E3 ubiquitin-protein ligase CBL Human genes 0.000 description 1
- 102100035273 E3 ubiquitin-protein ligase CBL-B Human genes 0.000 description 1
- 102100035275 E3 ubiquitin-protein ligase CBL-C Human genes 0.000 description 1
- 102100037249 Egl nine homolog 1 Human genes 0.000 description 1
- 102100031785 Endothelial transcription factor GATA-2 Human genes 0.000 description 1
- 102100021606 Ephrin type-A receptor 7 Human genes 0.000 description 1
- 102100024359 Exosome complex exonuclease RRP44 Human genes 0.000 description 1
- 102100029095 Exportin-1 Human genes 0.000 description 1
- 102100038578 F-box only protein 11 Human genes 0.000 description 1
- 101710105178 F-box/WD repeat-containing protein 7 Proteins 0.000 description 1
- 102100028138 F-box/WD repeat-containing protein 7 Human genes 0.000 description 1
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 description 1
- 108010009306 Forkhead Box Protein O1 Proteins 0.000 description 1
- 102100035427 Forkhead box protein O1 Human genes 0.000 description 1
- 102100024165 G1/S-specific cyclin-D1 Human genes 0.000 description 1
- 102100037859 G1/S-specific cyclin-D3 Human genes 0.000 description 1
- 101710185062 GSK3-beta interaction protein Proteins 0.000 description 1
- 102100038107 GSK3B-interacting protein Human genes 0.000 description 1
- 101710149581 GSK3B-interacting protein Proteins 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 102100030708 GTPase KRas Human genes 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 102100039622 Granulocyte colony-stimulating factor receptor Human genes 0.000 description 1
- 102100035354 Guanine nucleotide-binding protein G(I)/G(S)/G(T) subunit beta-1 Human genes 0.000 description 1
- 102100034154 Guanine nucleotide-binding protein G(i) subunit alpha-2 Human genes 0.000 description 1
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 1
- 102100036703 Guanine nucleotide-binding protein subunit alpha-13 Human genes 0.000 description 1
- 102100031249 H/ACA ribonucleoprotein complex subunit DKC1 Human genes 0.000 description 1
- 102100034445 HCLS1-associated protein X-1 Human genes 0.000 description 1
- 102100038885 Histone acetyltransferase p300 Human genes 0.000 description 1
- 102100022103 Histone-lysine N-methyltransferase 2A Human genes 0.000 description 1
- 102100027755 Histone-lysine N-methyltransferase 2C Human genes 0.000 description 1
- 102100027768 Histone-lysine N-methyltransferase 2D Human genes 0.000 description 1
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 description 1
- 102100029234 Histone-lysine N-methyltransferase NSD2 Human genes 0.000 description 1
- 102100032742 Histone-lysine N-methyltransferase SETD2 Human genes 0.000 description 1
- 102100023696 Histone-lysine N-methyltransferase SETDB1 Human genes 0.000 description 1
- 102100030234 Homeobox protein cut-like 1 Human genes 0.000 description 1
- 101000691589 Homo sapiens 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase gamma-2 Proteins 0.000 description 1
- 101000924266 Homo sapiens AT-rich interactive domain-containing protein 1A Proteins 0.000 description 1
- 101000924255 Homo sapiens AT-rich interactive domain-containing protein 1B Proteins 0.000 description 1
- 101000685261 Homo sapiens AT-rich interactive domain-containing protein 2 Proteins 0.000 description 1
- 101000824278 Homo sapiens Acyl-[acyl-carrier-protein] hydrolase Proteins 0.000 description 1
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 1
- 101000780116 Homo sapiens Ankyrin repeat domain-containing protein 26 Proteins 0.000 description 1
- 101000905703 Homo sapiens Autophagy-related protein 2 homolog B Proteins 0.000 description 1
- 101000914491 Homo sapiens B-cell antigen receptor complex-associated protein beta chain Proteins 0.000 description 1
- 101000971234 Homo sapiens B-cell lymphoma 6 protein Proteins 0.000 description 1
- 101000894688 Homo sapiens BCL-6 corepressor-like protein 1 Proteins 0.000 description 1
- 101100165236 Homo sapiens BCOR gene Proteins 0.000 description 1
- 101000937544 Homo sapiens Beta-2-microglobulin Proteins 0.000 description 1
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 1
- 101000945515 Homo sapiens CCAAT/enhancer-binding protein alpha Proteins 0.000 description 1
- 101100382122 Homo sapiens CIITA gene Proteins 0.000 description 1
- 101000896987 Homo sapiens CREB-binding protein Proteins 0.000 description 1
- 101000793651 Homo sapiens Calreticulin Proteins 0.000 description 1
- 101000761179 Homo sapiens Caspase recruitment domain-containing protein 11 Proteins 0.000 description 1
- 101000883545 Homo sapiens Chromodomain-helicase-DNA-binding protein 8 Proteins 0.000 description 1
- 101000642968 Homo sapiens Cohesin subunit SA-2 Proteins 0.000 description 1
- 101000956427 Homo sapiens Cytokine receptor-like factor 2 Proteins 0.000 description 1
- 101000915162 Homo sapiens Cytosolic purine 5'-nucleotidase Proteins 0.000 description 1
- 101000599038 Homo sapiens DNA-binding protein Ikaros Proteins 0.000 description 1
- 101001036287 Homo sapiens DNA-binding protein inhibitor ID-3 Proteins 0.000 description 1
- 101000619536 Homo sapiens DNA-dependent protein kinase catalytic subunit Proteins 0.000 description 1
- 101000584942 Homo sapiens Double-strand-break repair protein rad21 homolog Proteins 0.000 description 1
- 101000737265 Homo sapiens E3 ubiquitin-protein ligase CBL-B Proteins 0.000 description 1
- 101000737269 Homo sapiens E3 ubiquitin-protein ligase CBL-C Proteins 0.000 description 1
- 101000881648 Homo sapiens Egl nine homolog 1 Proteins 0.000 description 1
- 101001066265 Homo sapiens Endothelial transcription factor GATA-2 Proteins 0.000 description 1
- 101000898708 Homo sapiens Ephrin type-A receptor 7 Proteins 0.000 description 1
- 101000627103 Homo sapiens Exosome complex exonuclease RRP44 Proteins 0.000 description 1
- 101001030683 Homo sapiens F-box only protein 11 Proteins 0.000 description 1
- 101000738559 Homo sapiens G1/S-specific cyclin-D3 Proteins 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101000746364 Homo sapiens Granulocyte colony-stimulating factor receptor Proteins 0.000 description 1
- 101001024316 Homo sapiens Guanine nucleotide-binding protein G(I)/G(S)/G(T) subunit beta-1 Proteins 0.000 description 1
- 101001070508 Homo sapiens Guanine nucleotide-binding protein G(i) subunit alpha-2 Proteins 0.000 description 1
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 1
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 1
- 101001072481 Homo sapiens Guanine nucleotide-binding protein subunit alpha-13 Proteins 0.000 description 1
- 101000844866 Homo sapiens H/ACA ribonucleoprotein complex subunit DKC1 Proteins 0.000 description 1
- 101001068173 Homo sapiens HCLS1-associated protein X-1 Proteins 0.000 description 1
- 101000882390 Homo sapiens Histone acetyltransferase p300 Proteins 0.000 description 1
- 101001045846 Homo sapiens Histone-lysine N-methyltransferase 2A Proteins 0.000 description 1
- 101001008892 Homo sapiens Histone-lysine N-methyltransferase 2C Proteins 0.000 description 1
- 101001008894 Homo sapiens Histone-lysine N-methyltransferase 2D Proteins 0.000 description 1
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 description 1
- 101000634048 Homo sapiens Histone-lysine N-methyltransferase NSD2 Proteins 0.000 description 1
- 101000654725 Homo sapiens Histone-lysine N-methyltransferase SETD2 Proteins 0.000 description 1
- 101000684609 Homo sapiens Histone-lysine N-methyltransferase SETDB1 Proteins 0.000 description 1
- 101000726740 Homo sapiens Homeobox protein cut-like 1 Proteins 0.000 description 1
- 101001056180 Homo sapiens Induced myeloid leukemia cell differentiation protein Mcl-1 Proteins 0.000 description 1
- 101000852593 Homo sapiens Inositol-trisphosphate 3-kinase B Proteins 0.000 description 1
- 101001011441 Homo sapiens Interferon regulatory factor 4 Proteins 0.000 description 1
- 101001032345 Homo sapiens Interferon regulatory factor 8 Proteins 0.000 description 1
- 101001043809 Homo sapiens Interleukin-7 receptor subunit alpha Proteins 0.000 description 1
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 1
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 101000994460 Homo sapiens Keratin, type I cytoskeletal 20 Proteins 0.000 description 1
- 101001064870 Homo sapiens Lon protease homolog, mitochondrial Proteins 0.000 description 1
- 101001063392 Homo sapiens Lymphocyte function-associated antigen 3 Proteins 0.000 description 1
- 101001025967 Homo sapiens Lysine-specific demethylase 6A Proteins 0.000 description 1
- 101000916644 Homo sapiens Macrophage colony-stimulating factor 1 receptor Proteins 0.000 description 1
- 101001034310 Homo sapiens Malignant fibrous histiocytoma-amplified sequence 1 Proteins 0.000 description 1
- 101000653374 Homo sapiens Methylcytosine dioxygenase TET2 Proteins 0.000 description 1
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 1
- 101000589015 Homo sapiens Myomesin-2 Proteins 0.000 description 1
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 1
- 101001109719 Homo sapiens Nucleophosmin Proteins 0.000 description 1
- 101000692980 Homo sapiens PHD finger protein 6 Proteins 0.000 description 1
- 101000601724 Homo sapiens Paired box protein Pax-5 Proteins 0.000 description 1
- 101000987581 Homo sapiens Perforin-1 Proteins 0.000 description 1
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 1
- 101000595746 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit delta isoform Proteins 0.000 description 1
- 101000595489 Homo sapiens Phosphatidylinositol N-acetylglucosaminyltransferase subunit A Proteins 0.000 description 1
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 1
- 101000728236 Homo sapiens Polycomb group protein ASXL1 Proteins 0.000 description 1
- 101000866766 Homo sapiens Polycomb protein EED Proteins 0.000 description 1
- 101000584499 Homo sapiens Polycomb protein SUZ12 Proteins 0.000 description 1
- 101001105683 Homo sapiens Pre-mRNA-processing-splicing factor 8 Proteins 0.000 description 1
- 101000874165 Homo sapiens Probable ATP-dependent RNA helicase DDX41 Proteins 0.000 description 1
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 1
- 101000933601 Homo sapiens Protein BTG1 Proteins 0.000 description 1
- 101000761460 Homo sapiens Protein CASP Proteins 0.000 description 1
- 101000742054 Homo sapiens Protein phosphatase 1D Proteins 0.000 description 1
- 101000824318 Homo sapiens Protocadherin Fat 1 Proteins 0.000 description 1
- 101000932478 Homo sapiens Receptor-type tyrosine-protein kinase FLT3 Proteins 0.000 description 1
- 101001111742 Homo sapiens Rhombotin-2 Proteins 0.000 description 1
- 101000654718 Homo sapiens SET-binding protein Proteins 0.000 description 1
- 101000616523 Homo sapiens SH2B adapter protein 3 Proteins 0.000 description 1
- 101000587430 Homo sapiens Serine/arginine-rich splicing factor 2 Proteins 0.000 description 1
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 1
- 101000864800 Homo sapiens Serine/threonine-protein kinase Sgk1 Proteins 0.000 description 1
- 101000595531 Homo sapiens Serine/threonine-protein kinase pim-1 Proteins 0.000 description 1
- 101000707567 Homo sapiens Splicing factor 3B subunit 1 Proteins 0.000 description 1
- 101000808799 Homo sapiens Splicing factor U2AF 35 kDa subunit Proteins 0.000 description 1
- 101000633429 Homo sapiens Structural maintenance of chromosomes protein 1A Proteins 0.000 description 1
- 101000708766 Homo sapiens Structural maintenance of chromosomes protein 3 Proteins 0.000 description 1
- 101000891113 Homo sapiens T-cell acute lymphocytic leukemia protein 1 Proteins 0.000 description 1
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 1
- 101000666429 Homo sapiens Terminal nucleotidyltransferase 5C Proteins 0.000 description 1
- 101000799388 Homo sapiens Thiopurine S-methyltransferase Proteins 0.000 description 1
- 101000799466 Homo sapiens Thrombopoietin receptor Proteins 0.000 description 1
- 101000596772 Homo sapiens Transcription factor 7-like 1 Proteins 0.000 description 1
- 101000666382 Homo sapiens Transcription factor E2-alpha Proteins 0.000 description 1
- 101000813738 Homo sapiens Transcription factor ETV6 Proteins 0.000 description 1
- 101000648507 Homo sapiens Tumor necrosis factor receptor superfamily member 14 Proteins 0.000 description 1
- 101000611023 Homo sapiens Tumor necrosis factor receptor superfamily member 6 Proteins 0.000 description 1
- 101000823316 Homo sapiens Tyrosine-protein kinase ABL1 Proteins 0.000 description 1
- 101000864342 Homo sapiens Tyrosine-protein kinase BTK Proteins 0.000 description 1
- 101000997835 Homo sapiens Tyrosine-protein kinase JAK1 Proteins 0.000 description 1
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 description 1
- 101000934996 Homo sapiens Tyrosine-protein kinase JAK3 Proteins 0.000 description 1
- 101001054878 Homo sapiens Tyrosine-protein kinase Lyn Proteins 0.000 description 1
- 101000604583 Homo sapiens Tyrosine-protein kinase SYK Proteins 0.000 description 1
- 101000818543 Homo sapiens Tyrosine-protein kinase ZAP-70 Proteins 0.000 description 1
- 101001087416 Homo sapiens Tyrosine-protein phosphatase non-receptor type 11 Proteins 0.000 description 1
- 101000658084 Homo sapiens U2 small nuclear ribonucleoprotein auxiliary factor 35 kDa subunit-related protein 2 Proteins 0.000 description 1
- 101000599042 Homo sapiens Zinc finger protein Aiolos Proteins 0.000 description 1
- 101001059220 Homo sapiens Zinc finger protein Gfi-1 Proteins 0.000 description 1
- 101000599037 Homo sapiens Zinc finger protein Helios Proteins 0.000 description 1
- 102100026539 Induced myeloid leukemia cell differentiation protein Mcl-1 Human genes 0.000 description 1
- 102100036404 Inositol-trisphosphate 3-kinase B Human genes 0.000 description 1
- 102100030126 Interferon regulatory factor 4 Human genes 0.000 description 1
- 102100038069 Interferon regulatory factor 8 Human genes 0.000 description 1
- 102100021593 Interleukin-7 receptor subunit alpha Human genes 0.000 description 1
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 1
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 1
- 102100032700 Keratin, type I cytoskeletal 20 Human genes 0.000 description 1
- 102100030984 Lymphocyte function-associated antigen 3 Human genes 0.000 description 1
- 102100037462 Lysine-specific demethylase 6A Human genes 0.000 description 1
- 108010068342 MAP Kinase Kinase 1 Proteins 0.000 description 1
- 102100026371 MHC class II transactivator Human genes 0.000 description 1
- 108700002010 MHC class II transactivator Proteins 0.000 description 1
- 101150053046 MYD88 gene Proteins 0.000 description 1
- 102100028198 Macrophage colony-stimulating factor 1 receptor Human genes 0.000 description 1
- 102100039668 Malignant fibrous histiocytoma-amplified sequence 1 Human genes 0.000 description 1
- 102100030803 Methylcytosine dioxygenase TET2 Human genes 0.000 description 1
- 101150097381 Mtor gene Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 102100024134 Myeloid differentiation primary response protein MyD88 Human genes 0.000 description 1
- 102100032965 Myomesin-2 Human genes 0.000 description 1
- 102000007530 Neurofibromin 1 Human genes 0.000 description 1
- 108010085793 Neurofibromin 1 Proteins 0.000 description 1
- 102000001759 Notch1 Receptor Human genes 0.000 description 1
- 108010029755 Notch1 Receptor Proteins 0.000 description 1
- 102000001756 Notch2 Receptor Human genes 0.000 description 1
- 108010029751 Notch2 Receptor Proteins 0.000 description 1
- 102100022678 Nucleophosmin Human genes 0.000 description 1
- 102100026365 PHD finger protein 6 Human genes 0.000 description 1
- 102100024894 PR domain zinc finger protein 1 Human genes 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 1
- 102100037504 Paired box protein Pax-5 Human genes 0.000 description 1
- 102100040884 Partner and localizer of BRCA2 Human genes 0.000 description 1
- 102100028467 Perforin-1 Human genes 0.000 description 1
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 1
- 102100036056 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit delta isoform Human genes 0.000 description 1
- 102100036050 Phosphatidylinositol N-acetylglucosaminyltransferase subunit A Human genes 0.000 description 1
- 108010051742 Platelet-Derived Growth Factor beta Receptor Proteins 0.000 description 1
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 1
- 102100026547 Platelet-derived growth factor receptor beta Human genes 0.000 description 1
- 102100029799 Polycomb group protein ASXL1 Human genes 0.000 description 1
- 102100031338 Polycomb protein EED Human genes 0.000 description 1
- 102100030702 Polycomb protein SUZ12 Human genes 0.000 description 1
- 108010009975 Positive Regulatory Domain I-Binding Factor 1 Proteins 0.000 description 1
- 102100021231 Pre-mRNA-processing-splicing factor 8 Human genes 0.000 description 1
- 102100035727 Probable ATP-dependent RNA helicase DDX41 Human genes 0.000 description 1
- 102100026036 Protein BTG1 Human genes 0.000 description 1
- 102100038675 Protein phosphatase 1D Human genes 0.000 description 1
- 102100022095 Protocadherin Fat 1 Human genes 0.000 description 1
- 101150111584 RHOA gene Proteins 0.000 description 1
- 102100020718 Receptor-type tyrosine-protein kinase FLT3 Human genes 0.000 description 1
- 102000043322 Reelin Human genes 0.000 description 1
- 108700038365 Reelin Proteins 0.000 description 1
- 101150057388 Reln gene Proteins 0.000 description 1
- 102100023876 Rhombotin-2 Human genes 0.000 description 1
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 1
- 102100032741 SET-binding protein Human genes 0.000 description 1
- 102100021778 SH2B adapter protein 3 Human genes 0.000 description 1
- 108010017324 STAT3 Transcription Factor Proteins 0.000 description 1
- 101150063267 STAT5B gene Proteins 0.000 description 1
- 108010011005 STAT6 Transcription Factor Proteins 0.000 description 1
- 101100379220 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) API2 gene Proteins 0.000 description 1
- 101100485284 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CRM1 gene Proteins 0.000 description 1
- 101000702553 Schistosoma mansoni Antigen Sm21.7 Proteins 0.000 description 1
- 101000714192 Schistosoma mansoni Tegument antigen Proteins 0.000 description 1
- 102100029666 Serine/arginine-rich splicing factor 2 Human genes 0.000 description 1
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 1
- 102100030070 Serine/threonine-protein kinase Sgk1 Human genes 0.000 description 1
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 description 1
- 102100036077 Serine/threonine-protein kinase pim-1 Human genes 0.000 description 1
- 102100027315 Signal recognition particle subunit SRP72 Human genes 0.000 description 1
- 101710132545 Signal recognition particle subunit SRP72 Proteins 0.000 description 1
- 102100024040 Signal transducer and activator of transcription 3 Human genes 0.000 description 1
- 102100024474 Signal transducer and activator of transcription 5B Human genes 0.000 description 1
- 102100023980 Signal transducer and activator of transcription 6 Human genes 0.000 description 1
- 101150045565 Socs1 gene Proteins 0.000 description 1
- 102100031711 Splicing factor 3B subunit 1 Human genes 0.000 description 1
- 102100038501 Splicing factor U2AF 35 kDa subunit Human genes 0.000 description 1
- 102100029538 Structural maintenance of chromosomes protein 1A Human genes 0.000 description 1
- 102100032723 Structural maintenance of chromosomes protein 3 Human genes 0.000 description 1
- 108700027336 Suppressor of Cytokine Signaling 1 Proteins 0.000 description 1
- 102100024779 Suppressor of cytokine signaling 1 Human genes 0.000 description 1
- 102100040365 T-cell acute lymphocytic leukemia protein 1 Human genes 0.000 description 1
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 1
- 102000004399 TNF receptor-associated factor 3 Human genes 0.000 description 1
- 108090000922 TNF receptor-associated factor 3 Proteins 0.000 description 1
- 102100038305 Terminal nucleotidyltransferase 5C Human genes 0.000 description 1
- 102100034162 Thiopurine S-methyltransferase Human genes 0.000 description 1
- 102100034196 Thrombopoietin receptor Human genes 0.000 description 1
- 102100038313 Transcription factor E2-alpha Human genes 0.000 description 1
- 102100039580 Transcription factor ETV6 Human genes 0.000 description 1
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 1
- 102100022387 Transforming protein RhoA Human genes 0.000 description 1
- 108010047933 Tumor Necrosis Factor alpha-Induced Protein 3 Proteins 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 102100024596 Tumor necrosis factor alpha-induced protein 3 Human genes 0.000 description 1
- 102100028785 Tumor necrosis factor receptor superfamily member 14 Human genes 0.000 description 1
- 102100022596 Tyrosine-protein kinase ABL1 Human genes 0.000 description 1
- 102100029823 Tyrosine-protein kinase BTK Human genes 0.000 description 1
- 102100033438 Tyrosine-protein kinase JAK1 Human genes 0.000 description 1
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 description 1
- 102100025387 Tyrosine-protein kinase JAK3 Human genes 0.000 description 1
- 102100026857 Tyrosine-protein kinase Lyn Human genes 0.000 description 1
- 102100038183 Tyrosine-protein kinase SYK Human genes 0.000 description 1
- 102100021125 Tyrosine-protein kinase ZAP-70 Human genes 0.000 description 1
- 102100033019 Tyrosine-protein phosphatase non-receptor type 11 Human genes 0.000 description 1
- 102100035036 U2 small nuclear ribonucleoprotein auxiliary factor 35 kDa subunit-related protein 2 Human genes 0.000 description 1
- 102000040856 WT1 Human genes 0.000 description 1
- 108700020467 WT1 Proteins 0.000 description 1
- 101150084041 WT1 gene Proteins 0.000 description 1
- 102000056014 X-linked Nuclear Human genes 0.000 description 1
- 108700042462 X-linked Nuclear Proteins 0.000 description 1
- 101150094313 XPO1 gene Proteins 0.000 description 1
- 102100037798 Zinc finger protein Aiolos Human genes 0.000 description 1
- 102100029004 Zinc finger protein Gfi-1 Human genes 0.000 description 1
- 102100037796 Zinc finger protein Helios Human genes 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003748 differential diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 108700002148 exportin 1 Proteins 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- PORWMNRCUJJQNO-UHFFFAOYSA-N tellurium atom Chemical compound [Te] PORWMNRCUJJQNO-UHFFFAOYSA-N 0.000 description 1
- 108010057210 telomerase RNA Proteins 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Data Mining & Analysis (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供的成熟B细胞肿瘤的辅助诊断预测方法、装置、设备及介质,综合形态学、免疫学、遗传学及分子生物学多个平台的检测结果,通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。
Description
技术领域
本发明涉及医疗数据处理技术领域,特别是涉及成熟B细胞肿瘤的辅助诊断预测方法、装置、设备及介质。
背景技术
成熟B细胞肿瘤是一种异质性的起源与B细胞的单克隆增值性疾病,成熟B细胞肿瘤可分为40余种,各亚型间临床表现复杂,许多疑难病例的出现使成熟B细胞肿瘤亚型鉴别诊断成为临床工作中的重点和难点。
现有的基于形态学、免疫学、遗传学及分子生物学多个平台检测是诊断成熟B细胞肿瘤亚型的方法,且主要基于分子生物学中的二代测序(NGS)结合机器学习来建立辅助诊断模型,未结合多个平台检测方法建立辅助诊断模型。现有的成熟B细胞肿瘤诊断模型对于亚型的鉴别未结合多平台的检测结果进行辅助诊断,由于各亚型间临床表现复杂,亚型鉴别较为困难,造成一定的误诊率和漏诊率,且诊断较为主观,客观性不足。并且,基于分子生物学中的二代测序(NGS)建立的辅助诊断模型使用起来较为复杂,同时由于临床医生普遍缺乏相关计算机知识,对于模型使用具有一定的门槛,进一步地,具体而言,现有的辅助模型在使用时需要在其开发的计算机语言环境下使用,在相应的计算机语言中加载模型,并加载相应的检测数据并运行才能得到预测结果,使用模型效率不高,且许多临床医生不会使用计算机语言,本身构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。
因此,寻找一种适配的成熟B细胞肿瘤的辅助诊断预测方法,是本领域技术人员亟待解决的技术问题。
发明内容
针对上述现有技术中成熟B细胞肿瘤亚型的判断客观性不足造成一定的误诊和漏诊且使用模型门槛高的问题,本发明的目的在于提供成熟B细胞肿瘤的辅助诊断预测方法、装置、设备及介质,能够提升临床医生使用诊断模型的便捷性、提升成熟B细胞肿瘤亚型的准确率,缓解临床医生过强的诊断主观性。
第一方面,本发明提供成熟B细胞肿瘤的辅助诊断预测方法,所述方法包括:
获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
基于R语言将所述预测结果通过网页进行可视化展示。
第二方面,本发明提供成熟B细胞肿瘤的辅助诊断预测装置,所述装置包括:
获取模块,用于获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
输入模块,用于将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
输出模块,用于将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
可视化模块,用于基于R语言将所述预测结果通过网页进行可视化展示。
第三方面,本发明提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述任一项所述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
第四方面,本发明提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述任一项所述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
根据本发明提供的成熟B细胞肿瘤的辅助诊断预测方法、装置、设备及介质,综合形态学、免疫学、遗传学及分子生物学多个平台的检测结果,通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中成熟B细胞肿瘤的辅助诊断方法的流程示意图;
图2为一个实施例中成熟B细胞肿瘤的辅助诊断方法的流程示意图;
图3为一个实施例中成熟B细胞肿瘤的辅助诊断模型可视化于临床应用的示意图;
图4为一个实施例中影响成熟B细胞肿瘤的辅助诊断模型中预测因子重要程度的示意图;
图5为一个实施例中成熟B细胞肿瘤的辅助诊断装置的系统示意图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本领域的技术人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”、“若干个”的含义是两个或两个以上,除非另有明确具体的限定。
须知,本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本申请可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本申请所能产生的功效及所能达成的目的下,均应仍落在本申请所揭示的技术内容得能涵盖的范围内。
实施例一
参阅图1及图2所示,本发明提供一种成熟B细胞肿瘤的辅助诊断预测方法,所述方法包括:
步骤101:获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
步骤102:将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
步骤103:将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
步骤104:基于R语言将所述预测结果通过网页进行可视化展示。
需要说明的是,本实施例主要针对成熟B细胞肿瘤的辅助诊断预测的步骤。
在步骤101中,获取待预测数据中的标志物CD5,需要先判断标志物CD5为阳性还是阳性,若标志物CD5为阳性输出为1,若标志物CD5为阴性输出为0;同样的,判断标志物CD10为阳性还是阴性。肿瘤细胞大小数据中,小到中等大小肿瘤细胞定义为小细胞(Small cellsize),中到大等肿瘤细胞定义为大细胞(Large cell size)。突变基因数据包括175个与血液肿瘤相关基因作为NGSpanel检测。
需要说明的是,所述突变基因数据包括:ABCB1,CD79A,GATA1,MEF2B,SBDS,ABL1,CD79B,GATA2,MFHAS1,SETBP1,ANKRD26,CDKN1A,GFI1,MPL,SETD2,APC,CDKN2A,GNA13,MTOR,SETDB1,ARID1A,CDKN2B,GNAI2,MYC,SF3B1,ARID1B,CEBPA,GNAS,MYD88,SGK1,ARID2,CHD8,GNB1,MYOM2,SH2B3,ASXL1,CIITA,GSKIP,NF1,SMC1A,ATG2B,CREBBP,HAX1,NOTCH1,SMC3,ATM,CRLF2,HRAS,NOTCH2,SOCS1,ATRX,CSF1R,ID3,NPM1,SRP72,B2M,CSF3R,IDH1,NRAS,SRSF2,BCL10,CTCF,IDH2,NSD2,STAG2,BCL2,CUX1,IKZF1,NT5C2,STAT3,BCL6,CXCR4,IKZF2,PALB2,STAT5B,BCOR,DDX41,IKZF3,PAX5,STAT6,BCORL1,DIS3,IL7R,PDGFRA,SUZ12,BIRC3,DKC1,IRF4,PDGFRB,SYK,BLM,DNM2,IRF8,PHF6,TAL1,BPGM,DNMT3A,ITPKB,PIGA,TCF3,BRAF,EED,JAK1,PIK3CA,TENT5C,BRCA1,EGFR,JAK2,PIK3CD,TERC,BRCA2,EGLN1,JAK3,PIM1,TERT,BRIP1,ELANE,KDM6A,PLCG2,TET2,BTG1,EP300,KIT,PPM1D,TNFAIP3,BTK,EPHA7,KMT2A,PRDM1,TNFRSF14,CALR,EPOR,KMT2B,PRF1,TP53,CARD11,ETV6,KMT2C,PRKDC,TPMT,CBL,EZH2,KMT2D,PRPF8,TRAF3,CBLB,FAS,KRAS,PTEN,U2AF1,CBLC,FAT1,KRT20,PTPN11,VHL,CCND1,FBXO11,LMO2,RAD21,WT1,CCND3,FBXW7,LYN,RELN,XPO1,CD28,FLT3,MAP2K1,RHOA,ZAP70,CD58,FOXO1,MCL1,RUNX1,ZRSR2。
在步骤102中,本实施例示例性给出了成熟B细胞肿瘤亚型结果,给出了八种亚型,与本申请同一发明构思的方法可适用的场景不限于这八种亚型。
在步骤103中,将标志物CD5阴/阳性数据、标志物CD10阴/阳性数据、肿瘤细胞大小数据、NGS175panel检测的突变基因纳入辅助诊断模型作为预测因子来构建模型,由于纳入模型的预测因子不同,所对应输出的成熟B细胞肿瘤亚型的预测结果也不同,主要在于预测因子对应的权重值影响输出的预测结果。
在步骤104中,参阅图3所示,将成熟B细胞肿瘤辅助诊断模型的输入连接基于R语言嵌入网页,临床医生可以直接在网页前端页面点选输入待预测数据,示例性的,输入一组待预测数据:标志物CD5阴性、标志物CD10阴性、肿瘤细胞大小数据为小细胞、突变基因数据为BRCA1,通过后台运行的成熟B细胞肿瘤辅助诊断模型计算后,针对这组数据的预测结果为:亚型为MZBL的预估值为0.998及亚型为FL的预估值为0.002,需要说明的是,亚型的预估值越接近1则属于该亚型的可能性越大。将预测结果通过直方图进行可视化显示在网页前端。
本实施例所要解决的问题是,现有技术中成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊的技术问题,各亚型的临床表现复杂,亚型鉴别较为困难,现有的辅助诊断模型尚未结合多平台(形态学、免疫学、遗传学及分子生物学)综合诊断,多是基于分子生物学中的二代测序(NGS)构建模型,诊断准确性不高。进一步地,由于基于分子生物学中的二代测序(NGS)建立的辅助诊断模型使用起来较为复杂,需要在构建该模型的计算机语言环境下使用该模型来进行预测,首先需要在相应的计算机语言中加载模型,使用相应的计算机语言来输入待预测数据,并运行才能得到预测结果,使用模型的效率不高,使用门槛较高;再者,由于大多数临床医生的不会使用计算机语言,使用模型来进行初诊预测较为困难,构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。也就是说,本申请旨在解决上述的成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊、模型使用方法复杂、模型使用门槛高的技术问题。
根据本实施例所提出的方案,综合形态学、免疫学、遗传学及分子生物学多个平台的检测结果,比如,形态学中肿瘤细胞大小数据,分子生物学中NGSpanel检测,遗传学中的标志物CD5及标志物CD10。本申请综合了多平台的检测结果来构建模型。通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。
实施例二
本实施例提供进一步的方案。实施例一给出了预测成熟B细胞肿瘤亚型并进行可视化的步骤,本实施例在实施例一的基础上,给出了成熟B细胞肿辅助诊断模型的训练过程如下:
获取初诊成熟B细胞肿瘤患者数据,将所述患者数据进行预处理得到初始样本数据,将初始样本数据随机划分为训练集和测试集,所述训练集占比为80%,所述测试集占比为20%;通过adasyn函数对训练集进行自适应综合过采样方法的数据类不平衡处理;基于train函数和训练集进行五次十折交叉验证来构建成熟B细胞肿瘤辅助诊断模型,基于训练集对成熟B细胞肿瘤辅助诊断模型进行训练,并获取训练后的成熟B细胞肿瘤辅助诊断模型;通过测试集对训练后的诊断模型进行测试并获取通过测试的最终成熟B细胞肿瘤辅助诊断模型。
需要说明的是,本申请基于train函数和训练集进行十折交叉验证来构建成熟B细胞肿瘤辅助诊断模型,优选的,进行五次十折交叉验证,提升模型的准确性来构建性能更佳的成熟B细胞肿瘤辅助诊断模型。
需要说明的是,初诊成熟B细胞肿瘤患者数据从NGS175panel检测项目、流式细胞术、骨髓活检项目、组织活检项目、染色体核型检测项目、FISH检测项目中获取的,初诊成熟B细胞肿瘤患者数据包括NGSpanel检测的175个突变基因、流式细胞术中获取的抗原标志物CD5、抗原标志物CD10、肿瘤细胞大小数据。
需要说明的是,从初始样本数据中划分出占比80%的训练集用于对模型的训练,将训练集利用五次十折交叉验证,将训练集随机划分为10份子集,第一子集用于train函数中交叉验证的测试子集,其余9份子集轮流作为训练数据,期间,利用第一子集进行验证,每次试验都会得出相应的正确率,再求其平均值。
值得注意的是,对于部分患者可能缺失流失细胞术标志物CD5及标志物CD10的检测数据,不同的标志物缺失情况不同(缺失值占比在5%~94.4%),经过试验和进一步的比较,最后选择标志物CD5和标志物CD10这两个缺失值较少的标志物纳入模型作为其中的预测因子,但是由于标志物CD5和标志物CD10是流式的结果,存在一定的缺失值,因此需要对标志物CD5及标志物CD10进行缺失值填充,缺失值填充也是将数据进行预处理的步骤之一。
下面给出了缺失值填充的步骤。
在本实施例中,获取初诊成熟B细胞肿瘤患者数据,将所述患者数据进行预处理得到初始样本数据,将初始样本数据随机划分为训练集和测试集,所述训练集占比为80%,所述测试集占比为20%的步骤,包括:
所述将所述患者数据进行预处理得到初始样本数据,包括:
获取患者数据中标志物CD5及标志物CD10,基于runif函数分别对标志物CD5和标志物CD10进行缺失值填充;
所述缺失值填充的步骤,包括:
分别筛选标志物CD5及标志物CD10中缺失值位置,对缺失值位置纳入随机数进行补充;
或,获取缺失值位置前或后的数值,将所述前或后的数值纳入相应的缺失值位置;
或,获取标志物CD5中出现频率最高的特征数值,将出现频率最高的特征数值纳入标志物CD5中缺失值位置,获取标志物CD10中出现频率最高的特征数值,将出现频率最高的特征数值纳入标志物CD10中缺失值位置。
需要说明的是,经过对标志物CD5、标志物CD10进行缺失值填充后,得到完整序列的标志物CD5及标志物CD10。
根据本实施例提供的方案,对数据进行预处理进行缺失值填充及过采样处理,得到完整均衡的初始样本数据集,主要由于获取到的初诊患者数据可能会偏向与某一种亚型,某种亚型的数据较多,训练时,模型可能会偏向与某种目标亚型输出预测结果,进而需要进行过采样处理,使得模型更客观地进行预测。本申请提供一种成熟B细胞肿瘤辅助诊断方法,采用机器学习的方法辅助临床医生诊断患者成熟B细胞肿瘤的亚型,一定程度上克服了诊断对临床医生经验的依赖。
实施例三
本实施例提供进一步的方案。在实施例二中给出的成熟B细胞肿瘤辅助诊断模型的训练过程,在实施例二的基础上给出的模型的验证过程。
根据confusionMatrix函数构建混淆矩阵,所述混淆矩阵包括模型准确度指标、置信区间指标、无信息率指标、检验准确度指标、衡量分类精度指标,所述混淆矩阵中的各个指标用于评析成熟B细胞肿瘤辅助诊断模型的性能。
需要说明的是,根据R语言中的caret包中的confusionMatrix函数构建混淆矩阵,
表1.模型性能具体信息
Accuracy:0.8434 |
95%CI:(0.7922,0.8862) |
No Information Rate:0.6104 |
P-Value[Acc>NIR]:8.74e-16 |
Kappa:0.721 |
表2.模型预测各亚型性能具体信息
BL | CLL/SLL | DLBCL | FL | HCL | LPL/WM | MCL | MZBL | |
Sensitivity | 1.000 | 0.954 | 1.000 | 0.833 | 1.000 | 0.708 | 0.267 | 0.684 |
Specificity | 1.000 | 0.825 | 1.000 | 1.000 | 1.000 | 0.970 | 0.970 | 0.961 |
Pos Pred Value | 1.000 | 0.895 | 1.000 | 1.000 | 1.000 | 0.850 | 0.364 | 0.591 |
Neg Pred Value | 1.000 | 0.920 | 1.000 | 0.996 | 1.000 | 0.933 | 0.954 | 0.974 |
Prevalence | 0.008 | 0.610 | 0.024 | 0.024 | 0.004 | 0.193 | 0.060 | 0.076 |
Detection Rate | 0.008 | 0.582 | 0.024 | 0.020 | 0.004 | 0.137 | 0.016 | 0.052 |
Detection Prevalence | 0.008 | 0.651 | 0.024 | 0.020 | 0.004 | 0.161 | 0.044 | 0.088 |
Balanced Accuracy | 1.000 | 0.889 | 1.000 | 0.917 | 1.000 | 0.839 | 0.618 | 0.823 |
获取训练后的成熟B细胞肿瘤辅助诊断模型,通过测试集对训练后的诊断模型进行测试,基于varImp函数评析对于待预测数据对成熟B细胞肿瘤辅助诊断模型的预测结果的权重值。
需要说明的是,对于鉴别成熟B细胞肿瘤不同亚型时不同变量的重要程度,参阅图4所示,给出了模型中权重值前20的预测因子。
根据本实施例所提供的方案,提供了一种成熟B细胞肿瘤辅助诊断方法,结合多平台的预测结果,对数据进行预处理,并构建成熟B细胞肿瘤辅助模型来预测成熟B细胞肿瘤的亚型,能够从多个指标评析出模型的性能,提升了预测成熟B细胞肿瘤亚型的准确率,为临床医生提供了一种客观的诊断方式进行初诊,一定程度上克服了对临床医生临床经验依赖。同时,将模型镶嵌在网页,使用网站可视化模型,可以使没有计算机基础的临床医生快速使用模型进行辅助诊断,拓展了模型的应用场景。而且,对临床上一些无法通过现有检测结果进行初步亚型诊断考虑方向的疑难病例,本申请提供了辅助诊断思路。
实施例四
本实施例提供进一步的方案,
所述基于R语言将所述预测结果通过网页进行可视化展示的步骤,在处理基因突变数据时,并没有现有的方案可供参考,原因在于本方案涉及的突变基因数据,包括ABCB1,CD79A,GATA1,MEF2B,SBDS,属于基因类型数据包格式的数据,在将基因类型数据包格式数据时,通过selectInput函数进行输入端构建,具有函数调用更加简单高效的特点,且selectInput函数在调用突变基因数据时,对突变基因数据的识别调用误差很小,相对其他函数更加稳定。
S1:基于load函数加载存储有成熟B细胞肿瘤辅助诊断模型的数据库,通过odbcConnect函数与在后台运行的诊断模型建立连接;
S2:通过fluidPage函数构建诊断模型的前端可视化界面,在fluidPage函数设置元素,所述元素包括标题、侧边栏、主面板,所述侧边栏用于展示待预测数据的输入端,所述主面板用于展示预测结果;
S3:根据selectInput函数构建待预测数据的输入端,所述输入端与所述数据库连接,所述待预测数据的输入端包括用于输入标志物CD5阳/阴性数据的第一端口、用于标志物CD10阳/阴性数据的第二端口、用于输入肿瘤细胞大小数据的第三端口、用于输入突变基因数据的第四端口;
需要说明的是,根据fluidPage函数设置的标题、侧边栏、主面板,参阅图3所示,侧边栏设置有输入待预测数据的控件,根据selectInput函数在侧边栏中构建待预测数据的输入端,比如标志物CD5的阴性/阳性输入端,其中所述用于输入肿瘤细胞大小数据的第三端口还细分为大肿瘤细胞数据的输入端口及小肿瘤细胞数据的输入端口,是大肿瘤细胞则点选输入“Ye”,非大肿瘤细胞则点选输入“No”,同理输入小肿瘤细胞数据。所述主面板显示经成熟B细胞肿瘤辅助诊断模型计算得到的预测结果,预测结果包括对应的亚型相对应的预估概率值,通过直方图展示出来。
S4:获取所述输入端输入的待预测数据,采用ifelse函数将输入的待预测数据整合成矩阵输入到后台运行的诊断模型,根据诊断模型计算矩阵中的待预测数据并输出待预测数据相应的成熟B细胞肿瘤的亚型。
通过4个函数构建预测模型的输入、构架搭建和输出可视化,整体运行稳定,误操作bug少,对使用者具有操作简单,输入结果可视的优点。
需要说明的是,将待预测数据整合成矩阵输入到后台运行的诊断模型,识别待预测数据分别对应的预测因子的权重值,基于权重值计算出对应的亚型。其中一定侧边栏的输入控件,利用selectInput函数构建下拉菜单,提供输入待预测数据的端口,下拉菜单选择标志物CD5为阳性还是阴性,阳性对应标记“+”,阴性对应标记为“-”,同理,选择标志物CD10。
本实施例通过上述输入数据的第一端口、第二端口、第三端口来替代传统的需要相应计算机语言输入的方式,提升了使用模型的效率,为成熟B细胞辅助诊断模型的临床应用提供了便利,模型使用门槛不高,不需要加载相应的计算机语言,也不需要临床医生使用相应的计算机语言来输入待预测数据,通过镶嵌在网页的模型,通过点选输入的方式即可快速便捷的将模型用于临床应用。
在本实施例中,所述基于R语言将所述预测结果通过网页进行可视化展示的步骤,还包括:
获取根据诊断模型计算矩阵中的待预测数据的亚型及亚型对应的预测概率,将待预测数据的亚型、亚型对应的预测概率建立映射关系;
基于ggplot2函数展示待预测数据的亚型、亚型对应的预测概率建立映射关系;
将根据成熟B细胞肿瘤辅助诊断模型整合的可视化脚本置于托管服务并生成网页链接。
需要说明的是,使用R语言的eventReactive函数构建网站server端,将待预测数据整合成矩阵进行后台模型的计算,将计算得到的亚型及亚型对应的预测概率输出,根据映射关系利用R语言的ggplot2函数将待预测数据对应的预测结果利用直方图进行展示。
本实施例所要解决的问题是,现有的医疗预测诊断模型中,使用时需要在其开发的计算机语言环境下使用,在相应的计算机语言中加载医疗预测诊断模型模型,并加载相应的检测数据并运行才能得到预测结果,使用模型效率不高,且许多临床医生不会使用计算机语言,构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。进一步地,本方案是通过将模型通过网页可视化的方式进行临床应用,通过在网页点选的方式直接后台运行后输出结果,临床医生不需要使用计算机语言就能够利用本申请的成熟B细胞肿瘤辅助诊断模型进行初诊,虽然也有通过网页点选后输出预测结果的模型,但本申请的改进点在于应用于医疗数据处理,医疗数据较为复杂,现有的可视化方案不适用于本申请,需要寻找一种相适配的可视化方案。
根据本实施例所提供的方案,基于R语言load函数加载存储有成熟B细胞肿瘤辅助诊断模型,根据fluidPage函数构建诊断模型的前端可视化界面,构建将待预测数据的输入端口,不需要使用的计算机语言来输入,极大方便不会使用计算机语言的临床用于使用模型进行初诊。
实施例五
参阅图5所示,本实施例提供一种成熟B细胞肿瘤的辅助诊断预测装置,所述装置包括:
获取模块10,用于获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
输入模块20,用于将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
输出模块30,用于将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
可视化模块40,用于基于R语言将所述预测结果通过网页进行可视化展示。
本实施例所要解决的问题是,现有技术中成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊的技术问题,各亚型的临床表现复杂,亚型鉴别较为困难,现有的辅助诊断模型尚未结合多平台(形态学、免疫学、遗传学及分子生物学)综合诊断,多是基于分子生物学中的二代测序(NGS)构建模型,诊断准确性不高。进一步地,由于基于分子生物学中的二代测序(NGS)建立的辅助诊断模型使用起来较为复杂,需要在构建该模型的计算机语言环境下使用该模型来进行预测,首先需要在相应的计算机语言中加载模型,使用相应的计算机语言来输入待预测数据,并运行才能得到预测结果,使用模型的效率不高,使用门槛较高;再者,由于大多数临床医生的不会使用计算机语言,使用模型来进行初诊预测较为困难,构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。也就是说,本申请旨在解决上述的成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊、模型使用方法复杂、模型使用门槛高的技术问题。
根据本实施例所提出的方案,综合形态学、免疫学及分子生物学多个平台的检测结果,比如,形态学中肿瘤细胞大小数据,分子生物学中NGSpanel检测,免疫学中的标志物CD5及标志物CD10。本申请综合了多平台的检测结果来构建模型。通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。
实施例六
本实施例提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
图6示出了一个实施例中计算机设备的内部结构图,如图6所示,该计算机设备包括通过终端总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质有存储操作终端,还可有存储计算机程序,该计算机程序被处理器执行时,可使得处理器实现上述的成熟B细胞肿瘤的辅助诊断预测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行上述的成熟B细胞肿瘤的辅助诊断预测方法。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施例所要解决的问题是,现有技术中成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊的技术问题,各亚型的临床表现复杂,亚型鉴别较为困难,现有的辅助诊断模型尚未结合多平台(形态学、免疫学、遗传学及分子生物学)综合诊断,多是基于分子生物学中的二代测序(NGS)构建模型,诊断准确性不高。进一步地,由于基于分子生物学中的二代测序(NGS)建立的辅助诊断模型使用起来较为复杂,需要在构建该模型的计算机语言环境下使用该模型来进行预测,首先需要在相应的计算机语言中加载模型,使用相应的计算机语言来输入待预测数据,并运行才能得到预测结果,使用模型的效率不高,使用门槛较高;再者,由于大多数临床医生的不会使用计算机语言,使用模型来进行初诊预测较为困难,构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。也就是说,本申请旨在解决上述的成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊、模型使用方法复杂、模型使用门槛高的技术问题。
根据本实施例所提出的方案,综合形态学、免疫学、遗传学及分子生物学多个平台的检测结果,比如,形态学中肿瘤细胞大小数据,分子生物学中NGSpanel检测,免疫学中的标志物CD5及标志物CD10。本申请综合了多平台的检测结果来构建模型。通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。
实施例七
本实施例提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
本实施例所要解决的问题是,现有技术中成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊的技术问题,各亚型的临床表现复杂,亚型鉴别较为困难,现有的辅助诊断模型尚未结合多平台(形态学、免疫学、遗传学及分子生物学)综合诊断,多是基于分子生物学中的二代测序(NGS)构建模型,诊断准确性不高。进一步地,由于基于分子生物学中的二代测序(NGS)建立的辅助诊断模型使用起来较为复杂,需要在构建该模型的计算机语言环境下使用该模型来进行预测,首先需要在相应的计算机语言中加载模型,使用相应的计算机语言来输入待预测数据,并运行才能得到预测结果,使用模型的效率不高,使用门槛较高;再者,由于大多数临床医生的不会使用计算机语言,使用模型来进行初诊预测较为困难,构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。也就是说,本申请旨在解决上述的成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊、模型使用方法复杂、模型使用门槛高的技术问题。
根据本实施例所提出的方案,综合形态学、免疫学、遗传学及分子生物学多个平台的检测结果,比如,形态学中肿瘤细胞大小数据,分子生物学中NGSpanel检测,免疫学中的标志物CD5及标志物CD10。本申请综合了多平台的检测结果来构建模型。通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。
可以理解的是,上述成熟B细胞肿瘤的辅助诊断预测方法、装置、计算机设备及存储介质属于一个总的发明构思,实施例可相互适用。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (7)
1.成熟B细胞肿瘤的辅助诊断预测方法,其特征在于,所述方法包括:
获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
基于R语言将所述预测结果通过网页进行可视化展示;
所述基于R语言将所述预测结果通过网页进行可视化展示的步骤,包括:
基于load函数加载存储有成熟B细胞肿瘤辅助诊断模型的数据库,通过odbcConnect函数与在后台运行的诊断模型建立连接;
通过fluidPage函数构建诊断模型的前端可视化界面,在fluidPage函数设置元素,所述元素包括标题、侧边栏、主面板,所述侧边栏用于展示待预测数据的输入端,所述主面板用于展示预测结果;
根据selectInput函数构建待预测数据的输入端,所述输入端与所述数据库连接,所述待预测数据的输入端包括用于输入标志物CD5阳/阴性数据的第一端口、用于标志物CD10阳/阴性数据的第二端口、用于输入肿瘤细胞大小数据的第三端口、用于输入突变基因数据的第四端口;
获取所述输入端输入的待预测数据,采用ifelse函数将输入的待预测数据整合成矩阵输入到后台运行的诊断模型,根据诊断模型计算矩阵中的待预测数据并输出待预测数据相应的成熟B细胞肿瘤的亚型;
其中,所述成熟B细胞肿瘤辅助诊断模型的训练过程如下:
获取初诊成熟B细胞肿瘤患者数据,将所述患者数据进行预处理得到初始样本数据,将初始样本数据随机划分为训练集和测试集,所述训练集占比为80%,所述测试集占比为20%;
通过adasyn函数对训练集进行自适应综合过采样方法的数据类不平衡处理;
基于train函数和训练集进行十折交叉验证来构建成熟B细胞肿瘤辅助诊断模型,基于训练集对成熟B细胞肿瘤辅助诊断模型进行训练,并获取训练后的成熟B细胞肿瘤辅助诊断模型;
通过测试集对训练后的诊断模型进行测试并获取通过测试的最终成熟B细胞肿瘤辅助诊断模型;
获取初诊成熟B细胞肿瘤患者数据,将所述患者数据进行预处理得到初始样本数据,将初始样本数据随机划分为训练集和测试集,所述训练集占比为80%,所述测试集占比为20%的步骤,包括:
所述将所述患者数据进行预处理得到初始样本数据,包括:
获取患者数据中标志物CD5及标志物CD10,基于runif函数分别对标志物CD5和标志物CD10进行缺失值填充;
所述缺失值填充的步骤,包括:
分别筛选标志物CD5及标志物CD10中缺失值位置,对缺失值位置纳入随机数进行补充;
或,获取缺失值位置前或后的数值,将所述前或后的数值纳入相应的缺失值位置;
或,获取标志物CD5中出现频率最高的特征数值,将出现频率最高的特征数值纳入标志物CD5中缺失值位置,获取标志物CD10中出现频率最高的特征数值,将出现频率最高的特征数值纳入标志物CD10中缺失值位置;
初诊成熟B细胞肿瘤患者数据从NGS175panel检测项目、流式细胞术、骨髓活检项目、组织活检项目、染色体核型检测项目、FISH检测项目中获取的,初诊成熟B细胞肿瘤患者数据包括NGSpanel检测的175个突变基因、流式细胞术中获取的抗原标志物CD5、抗原标志物CD10、肿瘤细胞大小数据;
从初始样本数据中划分出占比80%的训练集用于对模型的训练,将训练集利用五次十折交叉验证,将训练集随机划分为10份子集,第一子集用于train函数中交叉验证的测试子集,其余9份子集轮流作为训练数据,期间,利用第一子集进行验证,每次试验都会得出相应的正确率,再求其平均值。
2.根据权利要求1所述的方法,其特征在于,所述成熟B细胞肿瘤辅助诊断模型的验证,包括:
根据confusionMatrix函数构建混淆矩阵,所述混淆矩阵包括模型准确度指标、置信区间指标、无信息率指标、检验准确度指标、衡量分类精度指标,所述混淆矩阵中的各个指标用于评析成熟B细胞肿瘤辅助诊断模型的性能。
3.根据权利要求2所述的方法,其特征在于,所述成熟B细胞肿瘤辅助诊断模型的验证,还包括:
获取训练后的成熟B细胞肿瘤辅助诊断模型,通过测试集对训练后的诊断模型进行测试,基于varImp函数评析对于待预测数据对成熟B细胞肿瘤辅助诊断模型的预测结果的权重值。
4.根据权利要求1所述的方法,其特征在于,所述基于R语言将所述预测结果通过网页进行可视化展示的步骤,还包括:
获取根据诊断模型计算矩阵中的待预测数据的亚型及亚型对应的预测概率,将待预测数据的亚型、亚型对应的预测概率建立映射关系;
基于ggplot2函数展示待预测数据的亚型、亚型对应的预测概率建立映射关系;
将根据成熟B细胞肿瘤辅助诊断模型整合的可视化脚本置于托管服务并生成网页链接。
5.成熟B细胞肿瘤的辅助诊断预测装置,其特征在于,用于应用权利要求1至4中任一项所述的方法,所述装置包括:
获取模块,用于获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
输入模块,用于将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
输出模块,用于将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
可视化模块,用于基于R语言将所述预测结果通过网页进行可视化展示。
6.计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至4中任一项所述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
7.计算机设备,包括存储器和处理器,其特征在于,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至4中任一项所述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310077993.1A CN116312778B (zh) | 2023-01-19 | 2023-01-19 | 成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310077993.1A CN116312778B (zh) | 2023-01-19 | 2023-01-19 | 成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116312778A CN116312778A (zh) | 2023-06-23 |
CN116312778B true CN116312778B (zh) | 2024-02-13 |
Family
ID=86815876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310077993.1A Active CN116312778B (zh) | 2023-01-19 | 2023-01-19 | 成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116312778B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118448056A (zh) * | 2024-05-20 | 2024-08-06 | 暨南大学附属第一医院(广州华侨医院) | 一种基于网络搜索机器学习的颅脑肿瘤可视化模型构建系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106460036A (zh) * | 2014-03-04 | 2017-02-22 | 免疫医疗有限责任公司 | 用于对响应b细胞消耗疗法的b细胞恶性肿瘤进行鉴定的组合物和方法 |
CN110031624A (zh) * | 2019-02-28 | 2019-07-19 | 中国科学院上海高等研究院 | 基于多神经网络分类器的肿瘤标志物检测系统、方法、终端、介质 |
CN113913518A (zh) * | 2021-08-31 | 2022-01-11 | 广州市金域转化医学研究院有限公司 | 成熟b细胞肿瘤的分型标志物及其应用 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8131475B2 (en) * | 2003-09-03 | 2012-03-06 | The United States Of America As Represented By The Secretary, Department Of Health And Human Services | Methods for identifying, diagnosing, and predicting survival of lymphomas |
US8557747B2 (en) * | 2009-12-29 | 2013-10-15 | Cancer Genetics, Inc. | Tool for diagnosis and prognosis of mature B-cell neoplasms |
-
2023
- 2023-01-19 CN CN202310077993.1A patent/CN116312778B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106460036A (zh) * | 2014-03-04 | 2017-02-22 | 免疫医疗有限责任公司 | 用于对响应b细胞消耗疗法的b细胞恶性肿瘤进行鉴定的组合物和方法 |
CN110031624A (zh) * | 2019-02-28 | 2019-07-19 | 中国科学院上海高等研究院 | 基于多神经网络分类器的肿瘤标志物检测系统、方法、终端、介质 |
CN113913518A (zh) * | 2021-08-31 | 2022-01-11 | 广州市金域转化医学研究院有限公司 | 成熟b细胞肿瘤的分型标志物及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN116312778A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Reitsma et al. | Assessing methodological quality | |
CN116312778B (zh) | 成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质 | |
Kalmin et al. | Conventional versus Rosemont endoscopic ultrasound criteria for chronic pancreatitis: comparing interobserver reliability and intertest agreement | |
Wright et al. | Pathologic separation of idiopathic pulmonary fibrosis from fibrotic hypersensitivity pneumonitis | |
CN107103207B (zh) | 基于病例多组学变异特征的精准医学知识搜索系统及实现方法 | |
Stewart et al. | Validation of the EuroClonality-NGS DNA capture panel as an integrated genomic tool for lymphoproliferative disorders | |
CN111508603A (zh) | 一种基于机器学习的出生缺陷预测及风险评估方法、系统及电子设备 | |
Bock et al. | Association mapping in biomedical time series via statistically significant shapelet mining | |
CN110299185A (zh) | 一种基于新一代测序数据的插入变异检测方法及系统 | |
CN107292129A (zh) | 易感基因型检测方法 | |
CN116230081A (zh) | 一种用于肺腺癌预后预测的生物标志物、应用及模型构建方法 | |
Frame et al. | Evaluation of mixture modeling with count data using NONMEM | |
Meng et al. | The application of machine learning techniques in clinical drug therapy | |
WO2022027714A1 (zh) | 诊断模型的诊断能力的评估方法、系统、设备和存储介质 | |
CN115274118A (zh) | 一种构建睾丸肿瘤诊断和术后复发风险预测模型的方法 | |
CN116543867A (zh) | 基于预测模型指导t2dm患者mtm模式的方法及装置 | |
CN109949866A (zh) | 病原体操作组的检测方法、装置、计算机设备和存储介质 | |
KR20220086458A (ko) | 유전자 데이터 공유를 위한 차세대 염기 서열 분석 방법, 차세대 염기 서열 분석 장치 및 차세데 염기 서열 분석 프로그램 | |
Mauguen et al. | Estimating the probability of clonal relatedness of pairs of tumors in cancer patients | |
CN114613498B (zh) | 一种基于机器学习的辅助mdt临床决策方法、系统及设备 | |
CN113913518B (zh) | 成熟b细胞肿瘤的分型标志物及其应用 | |
Hudgens et al. | Development of the bleeding and pelvic discomfort scale for use in women with heavy menstrual bleeding associated with uterine fibroids | |
CN109492690B (zh) | 一种基于卷积神经网络检测ct图像的方法 | |
Zheng et al. | SVsearcher: A more accurate structural variation detection method in long read data | |
CN116246701B (zh) | 基于表型术语和变异基因的数据分析装置、介质和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |