JP2021529954A - 癌分類子モデル、機械学習システム、および使用方法 - Google Patents
癌分類子モデル、機械学習システム、および使用方法 Download PDFInfo
- Publication number
- JP2021529954A JP2021529954A JP2020573269A JP2020573269A JP2021529954A JP 2021529954 A JP2021529954 A JP 2021529954A JP 2020573269 A JP2020573269 A JP 2020573269A JP 2020573269 A JP2020573269 A JP 2020573269A JP 2021529954 A JP2021529954 A JP 2021529954A
- Authority
- JP
- Japan
- Prior art keywords
- cancer
- patient
- classifier model
- panel
- biomarkers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 382
- 201000011510 cancer Diseases 0.000 title claims abstract description 347
- 238000010801 machine learning Methods 0.000 title claims abstract description 127
- 238000000034 method Methods 0.000 claims abstract description 158
- 210000004789 organ system Anatomy 0.000 claims abstract description 70
- 239000000090 biomarker Substances 0.000 claims description 241
- 238000012549 training Methods 0.000 claims description 86
- 238000012360 testing method Methods 0.000 claims description 71
- 238000005259 measurement Methods 0.000 claims description 56
- 230000035945 sensitivity Effects 0.000 claims description 49
- 108010036226 antigen CYFRA21.1 Proteins 0.000 claims description 31
- 238000013528 artificial neural network Methods 0.000 claims description 28
- 238000004422 calculation algorithm Methods 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 27
- 101000623901 Homo sapiens Mucin-16 Proteins 0.000 claims description 26
- 102100023123 Mucin-16 Human genes 0.000 claims description 26
- 101001024605 Homo sapiens Next to BRCA1 gene 1 protein Proteins 0.000 claims description 25
- 238000002405 diagnostic procedure Methods 0.000 claims description 23
- 238000012216 screening Methods 0.000 claims description 21
- 210000001519 tissue Anatomy 0.000 claims description 17
- 210000004369 blood Anatomy 0.000 claims description 16
- 239000008280 blood Substances 0.000 claims description 16
- 238000012706 support-vector machine Methods 0.000 claims description 16
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 14
- 201000005202 lung cancer Diseases 0.000 claims description 14
- 208000020816 lung neoplasm Diseases 0.000 claims description 14
- 238000003066 decision tree Methods 0.000 claims description 13
- 238000001574 biopsy Methods 0.000 claims description 12
- 238000007477 logistic regression Methods 0.000 claims description 12
- 230000036210 malignancy Effects 0.000 claims description 12
- 238000007637 random forest analysis Methods 0.000 claims description 10
- 238000013135 deep learning Methods 0.000 claims description 9
- 206010073071 hepatocellular carcinoma Diseases 0.000 claims description 9
- 206010006187 Breast cancer Diseases 0.000 claims description 8
- 208000026310 Breast neoplasm Diseases 0.000 claims description 8
- 206010009944 Colon cancer Diseases 0.000 claims description 7
- 210000000056 organ Anatomy 0.000 claims description 7
- 206010008342 Cervix carcinoma Diseases 0.000 claims description 5
- 208000000453 Skin Neoplasms Diseases 0.000 claims description 5
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 claims description 5
- 201000010881 cervical cancer Diseases 0.000 claims description 5
- 208000029742 colonic neoplasm Diseases 0.000 claims description 5
- 231100000844 hepatocellular carcinoma Toxicity 0.000 claims description 5
- 201000001441 melanoma Diseases 0.000 claims description 5
- 206010004593 Bile duct cancer Diseases 0.000 claims description 4
- 206010005949 Bone cancer Diseases 0.000 claims description 4
- 208000018084 Bone neoplasm Diseases 0.000 claims description 4
- 208000010667 Carcinoma of liver and intrahepatic biliary tract Diseases 0.000 claims description 4
- 206010073069 Hepatic cancer Diseases 0.000 claims description 4
- 208000008839 Kidney Neoplasms Diseases 0.000 claims description 4
- 206010033128 Ovarian cancer Diseases 0.000 claims description 4
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 4
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 4
- 206010038389 Renal cancer Diseases 0.000 claims description 4
- 208000024313 Testicular Neoplasms Diseases 0.000 claims description 4
- 206010057644 Testis cancer Diseases 0.000 claims description 4
- 210000000941 bile Anatomy 0.000 claims description 4
- 208000026900 bile duct neoplasm Diseases 0.000 claims description 4
- 208000006990 cholangiocarcinoma Diseases 0.000 claims description 4
- 201000010982 kidney cancer Diseases 0.000 claims description 4
- 210000004185 liver Anatomy 0.000 claims description 4
- 201000002250 liver carcinoma Diseases 0.000 claims description 4
- 210000004072 lung Anatomy 0.000 claims description 4
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 4
- 201000002528 pancreatic cancer Diseases 0.000 claims description 4
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 4
- 201000000849 skin cancer Diseases 0.000 claims description 4
- 201000003120 testicular cancer Diseases 0.000 claims description 4
- 208000015634 Rectal Neoplasms Diseases 0.000 claims description 3
- 230000000112 colonic effect Effects 0.000 claims description 3
- 210000002307 prostate Anatomy 0.000 claims description 3
- 206010038038 rectal cancer Diseases 0.000 claims description 3
- 201000001275 rectum cancer Diseases 0.000 claims description 3
- 238000012958 reprocessing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000002485 urinary effect Effects 0.000 claims description 3
- 210000002249 digestive system Anatomy 0.000 claims description 2
- 210000000653 nervous system Anatomy 0.000 claims description 2
- 230000001172 regenerating effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 abstract 1
- 239000000523 sample Substances 0.000 description 51
- 239000003550 marker Substances 0.000 description 31
- 239000000427 antigen Substances 0.000 description 27
- 102000007066 Prostate-Specific Antigen Human genes 0.000 description 25
- 108010072866 Prostate-Specific Antigen Proteins 0.000 description 25
- 102000036639 antigens Human genes 0.000 description 25
- 108091007433 antigens Proteins 0.000 description 25
- 210000002966 serum Anatomy 0.000 description 20
- 238000003018 immunoassay Methods 0.000 description 15
- 108090000623 proteins and genes Proteins 0.000 description 14
- 201000010099 disease Diseases 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 238000001514 detection method Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 10
- 230000036541 health Effects 0.000 description 10
- 102000004169 proteins and genes Human genes 0.000 description 10
- 238000003860 storage Methods 0.000 description 10
- 230000000391 smoking effect Effects 0.000 description 9
- 238000003556 assay Methods 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 8
- 238000011161 development Methods 0.000 description 8
- 230000018109 developmental process Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- 230000003068 static effect Effects 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 7
- 238000003909 pattern recognition Methods 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000009534 blood test Methods 0.000 description 5
- 210000001124 body fluid Anatomy 0.000 description 5
- 239000010839 body fluid Substances 0.000 description 5
- 210000002381 plasma Anatomy 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- 206010060862 Prostate cancer Diseases 0.000 description 4
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 238000002601 radiography Methods 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 102000055006 Calcitonin Human genes 0.000 description 3
- 108060001064 Calcitonin Proteins 0.000 description 3
- 101000914324 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 5 Proteins 0.000 description 3
- 101000914321 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 7 Proteins 0.000 description 3
- 101000617725 Homo sapiens Pregnancy-specific beta-1-glycoprotein 2 Proteins 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 238000001994 activation Methods 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 230000000454 anti-cipatory effect Effects 0.000 description 3
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 3
- 229960004015 calcitonin Drugs 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000002496 gastric effect Effects 0.000 description 3
- 201000007270 liver cancer Diseases 0.000 description 3
- 208000014018 liver neoplasm Diseases 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 239000000439 tumor marker Substances 0.000 description 3
- 108090000663 Annexin A1 Proteins 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 2
- 101100314454 Caenorhabditis elegans tra-1 gene Proteins 0.000 description 2
- 102100025570 Cancer/testis antigen 1 Human genes 0.000 description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 2
- 101000856237 Homo sapiens Cancer/testis antigen 1 Proteins 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 102100022019 Pregnancy-specific beta-1-glycoprotein 2 Human genes 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- 208000022362 bacterial infectious disease Diseases 0.000 description 2
- 239000013060 biological fluid Substances 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 230000003054 hormonal effect Effects 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 210000002751 lymph Anatomy 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 238000009607 mammography Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000035935 pregnancy Effects 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- -1 serum Substances 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 210000004243 sweat Anatomy 0.000 description 2
- 201000005112 urinary bladder cancer Diseases 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 102000000872 ATM Human genes 0.000 description 1
- 102000004145 Annexin A1 Human genes 0.000 description 1
- 102100040006 Annexin A1 Human genes 0.000 description 1
- 102000004149 Annexin A2 Human genes 0.000 description 1
- 108090000668 Annexin A2 Proteins 0.000 description 1
- 101710081722 Antitrypsin Proteins 0.000 description 1
- 102100024003 Arf-GAP with SH3 domain, ANK repeat and PH domain-containing protein 1 Human genes 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 102000052609 BRCA2 Human genes 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 108010029692 Bisphosphoglycerate mutase Proteins 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 206010006458 Bronchitis chronic Diseases 0.000 description 1
- 108091007854 Cdh1/Fizzy-related Proteins 0.000 description 1
- 102000038594 Cdh1/Fizzy-related Human genes 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 1
- 208000000668 Chronic Pancreatitis Diseases 0.000 description 1
- 206010009900 Colitis ulcerative Diseases 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 208000011231 Crohn disease Diseases 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 206010014561 Emphysema Diseases 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000687905 Homo sapiens Transcription factor SOX-2 Proteins 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 102100033420 Keratin, type I cytoskeletal 19 Human genes 0.000 description 1
- 102100023972 Keratin, type II cytoskeletal 8 Human genes 0.000 description 1
- 108010066327 Keratin-18 Proteins 0.000 description 1
- 102000018329 Keratin-18 Human genes 0.000 description 1
- 108010066302 Keratin-19 Proteins 0.000 description 1
- 108010070511 Keratin-8 Proteins 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010033649 Pancreatitis chronic Diseases 0.000 description 1
- 102100040884 Partner and localizer of BRCA2 Human genes 0.000 description 1
- 102000011025 Phosphoglycerate Mutase Human genes 0.000 description 1
- 208000006994 Precancerous Conditions Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 238000010240 RT-PCR analysis Methods 0.000 description 1
- 102000054727 Serum Amyloid A Human genes 0.000 description 1
- 108700028909 Serum Amyloid A Proteins 0.000 description 1
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 102100024270 Transcription factor SOX-2 Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 101710082053 Ubiquilin Proteins 0.000 description 1
- 201000006704 Ulcerative Colitis Diseases 0.000 description 1
- 208000006593 Urologic Neoplasms Diseases 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 230000001475 anti-trypsic effect Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000002820 assay format Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 206010006451 bronchitis Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 210000000038 chest Anatomy 0.000 description 1
- 208000007451 chronic bronchitis Diseases 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 238000002052 colonoscopy Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000003433 contraceptive agent Substances 0.000 description 1
- 230000002254 contraceptive effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000009223 counseling Methods 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004836 empirical method Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 238000011223 gene expression profiling Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 238000011885 in vitro diagnostic (IVD) kits Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000002175 menstrual effect Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000005305 organ development Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000027758 ovulation cycle Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 208000022131 polyp of large intestine Diseases 0.000 description 1
- 108040000983 polyphosphate:AMP phosphotransferase activity proteins Proteins 0.000 description 1
- 238000009597 pregnancy test Methods 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000002579 sigmoidoscopy Methods 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 230000005586 smoking cessation Effects 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 108010088201 squamous cell carcinoma-related antigen Proteins 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 239000000107 tumor biomarker Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Abstract
Description
本出願は、2018年6月30日に出願された米国仮特許出願第62/692,683号の利益を主張し、その内容は、参照によりその全体が本明細書に組み込まれる。
a)患者からの試料中のバイオマーカーのパネルの測定値を取得する工程であって、バイオマーカーの値が、試料中のバイオマーカーのレベルに対応する、取得する工程と、
b)少なくとも年齢および性別を含む、患者から臨床パラメータを取得する工程と、
c)癌分類子モデルを使用して、患者を臓器系クラス所属に分類する工程であって、癌分類子モデルが、患者集団の少なくとも2つのバイオマーカーのパネルからの値、年齢、および診断指標を含む訓練データを使用して機械学習システムによって生成され、
癌分類子モデルが、年齢の入力変数および患者からのバイオマーカーのパネルの測定値を使用して、臓器系クラス所属を割り当てる、分類する工程と、
d)患者が臓器系に基づく悪性腫瘍を有すると予測されたときに、患者の診断検査のためにユーザに通知を提供する工程と、を含む、方法が開示される。
a)患者からの試料中のバイオマーカーのパネルの測定値を取得する工程であって、バイオマーカーの値が、試料中のバイオマーカーのレベルに対応する、取得する工程と、
b)少なくとも年齢および性別を含む、患者に対応する臨床パラメータを取得する工程と、
c)第1の分類子モデルを使用して、患者を癌を有するかまたは癌を発症するリスクカテゴリに分類する工程であって、第1の分類子モデルが、患者集団の少なくとも2つのバイオマーカーのパネルの値、年齢、および診断指標を含む第1の訓練データを使用して機械学習システムによって生成され、
第1の分類子モデルは、第1の分類子モデルの出力が閾値を超えるときに、年齢の入力変数および患者からのバイオマーカーのパネルの測定値を使用して、患者をリスク増加カテゴリに分類する、分類する工程と、
d)第2の分類子モデルを使用して、患者を臓器系クラス所属に分類する工程であって、第2の分類子モデルが、患者集団の少なくとも2つのバイオマーカーのパネルからの値、年齢、および診断指標を含む訓練データを使用して機械学習システムによって生成され、
癌分類子モデルが、年齢の入力変数および患者からのバイオマーカーのパネルの測定値を使用して、臓器系クラス所属を割り当てる、分類する工程と、
e)患者が臓器系に基づく悪性腫瘍を有すると予測されたときに、患者の診断検査のためにユーザに通知を提供する工程と、を含む、方法が提供される。
a)患者からの試料中のバイオマーカーのパネルの測定値を取得することであって、バイオマーカーの値が、試料中のバイオマーカーのレベルに対応する、取得することと、
b)年齢および性別を含む、患者から臨床パラメータを取得することと、
c)機械学習システムによって第1の分類子モデルを生成して、患者を癌を有するかまたは癌を発症するリスクカテゴリに分類することであって、
第1の分類子モデルは、第1の分類子モデルの出力が閾値より大きいときに、患者をリスク増加カテゴリに分類し、
第1の分類子モデルが、患者集団の少なくとも6つのバイオマーカー、年齢、性別、および診断指標のパネルからの値を含む訓練データを使用して機械学習システムによって生成される、分類することと、
d)機械学習システムによって第2の分類子モデルを生成して、患者を臓器系クラス所属に分類することであって、
癌分類子モデルが、年齢の入力変数および患者からのバイオマーカーのパネルの測定値を使用して、臓器系クラス所属を割り当て、
第2の分類子モデルが、患者集団の少なくとも2つのバイオマーカーのパネルからの値、年齢、および診断指標を含む訓練データを使用して機械学習システムによって生成される、分類することと、
e)患者の診断検査のために、ユーザに通知を提供することと、を行うように構成されている、機械学習が提供される。
分類子モデルが本明細書で開示され、腫瘍および/または潜伏癌の早期予測のための癌に関して無症候性患者と共に使用される。分類子モデルは、患者集団の、少なくとも2つのバイオマーカーのパネルの値、年齢、および診断指標を含む訓練データを使用して、機械学習システムによって生成された。本発明の分類子モデルをバイオマーカーで訓練し、患者が診断を受ける前に少なくとも3ヶ月間、それ以上でない場合は3ヶ月間測定した。実施形態では、訓練データは、試料を提供して3ヶ月以上後に、癌診断を受けていない患者の群からのデータの群を含む。実施形態では、訓練データは、試料を提供して3ヶ月以上後に、癌診断を受けた患者の群からのデータの群を含む。実施例1Aを参照されたい。
本明細書で使用される場合、「a」または「an」という用語は、特許文献で一般的であるように、「少なくとも1つ」または「1つ以上」の任意の他の例または使用法とは無関係に、1つまたは1つ超を含むように使用される。
無症候性患者を、癌を有するかまたは癌を発症するリスクカテゴリに分類するための分類子モデル、コンピュータ実装システム、機械学習システム、およびその方法、ならびに/あるいは、癌を有するリスクまたは癌を発症するリスクが増加した患者を、臓器系に基づく悪性腫瘍クラス所属および/または特定の癌クラス所属に分類するための分類子モデル、コンピュータ実装システム、機械学習システム、およびその方法が、本明細書で開示される。
本発明の方法の一部として、無症候性ヒト対象からのマーカーのパネルを測定することができる。遺伝子発現(例えば、mRNA)または得られる遺伝子産物(例えば、ポリペプチドまたはタンパク質)のいずれかを測定するための多くの方法が当業者に既知である。これらは、本発明の方法で使用することができ、当業者に既知である。しかしながら、少なくとも20〜30年間、腫瘍抗原(例えば、CEA、CA−125、PSAなど)は、世界中で癌検出のために最も広く利用されたバイオマーカーであり、本発明の好ましい腫瘍マーカーの種類である。
癌を発症するリスクが増加している無症候性患者を特定するためのマルチマーカー分類子モデルおよび方法が本明細書に提供される。当該リスクは、癌を発症するための「低リスク」、「中リスク/中程度のリスク」または「高リスク」として分類することができ、これらのカテゴリの範囲は、例えば、6ヶ月〜1年以内に癌を発症する確率に基づいてもよく、その確率は、不均質集団における癌のベースラインレベルに対して測定される。当該技術分野において、癌の発生率は、一般集団において約1%であることが理解される。汎癌検査を開発するために使用されるコホートにおける癌の罹患率は、約1.5%であった。検査および確率値の使用の詳細については、以下の例を参照されたい。分類子モデルの開発、およびマーカー(血液および臨床パラメータの両方)の選択は、分類子モデルの性能の尺度を提供する精度、曲線下面積(AUC)、感度、特異度値、および/またはユーデン指数(感度+特異度−1)の組み合わせに基づいてもよい。
無症候性患者を癌を有するか、または癌を発症するかについて分類するための改善されたマルチマーカーモデルが本明細書で開示される。測定されたバイオマーカーのパネルのみを使用する上記分類子モデルは、男性コホートに対する受信者動作特性(ROC)曲線の性能が非常に低く、感度値が0.515、特異度値が0.851であったことが以前に公開された。女性コホートは、感度値0.345および特異度値0.880を有するROC曲線のより低い性能を有した。Wang H.Y.,Hsieh C.H.,Wen C.N.,Wen Y.H.,Chen C.H.and Lu J.J.,“Cancers Screening in an Asymptomatic Population by Using Multiple Tumour Markers”PLoS One,June 29,2016の表7および8を参照されたい。換言すると、測定された血清バイオマーカーのみを使用する以前の分類子モデルは、特異度値が少なくとも0.8の患者の癌のリスクを除外するために許容された。しかしながら、以前の分類子モデルは、癌の予測に関しては男性に関しては50%にすぎず、女性に関してはさらに50%より劣った。当該モデルの性能は、分類子モデルが、生検または放射線撮影スクリーニングなどの他の診断手段と比較して、癌を有するリスクまたは癌を発症するリスクのある無症候性患者を特定する必要がある臨床環境では使用不可能である。以前に公開されたように、測定された血清バイオマーカーのみを使用する分類子モデルでは、125〜200人の男性に1人が助けられたのに対し、4〜7人に1人が害を受け(誤診断)、また、200〜333人の女性に1人が助けられたのに対し、3〜8人の女性に1人が害を受けた。
実施例1に特定されたように癌を有するリスクが増加した患者のために臓器系に基づく悪性腫瘍を予測するための技術が本明細書で提供される。当該情報は、より侵襲的な診断検査のために患者を専門医に紹介するために使用され得る。
癌を有するリスクが増加した患者の臓器系に基づく悪性腫瘍を予測するための方法が、本明細書で提供され、実施例1のコホートから訓練されたモデルが、測定されたバイオマーカーのパネル、ならびに年齢および性別の臨床学的因子に適用され、癌を有するリスクまたは癌を発症するリスクが増加した患者を特定する。すなわち汎癌検査である。次に、中程度のリスクまたは高リスクに分類される癌を有するリスクまたは癌を発症するリスクが増加した可能性がある0.5(50%)の患者について、実施例2のコホートを使用して訓練されたモデルを、測定されたバイオマーカーのパネル、ならびに年齢および性別の臨床学的因子に適用して、癌に関与する可能性が最も高いクラス所属(例えば、臓器系(または上位2つもしくは3つの臓器系))を提供する。すなわち臓器系に基づく悪性腫瘍検査である。
一般情報(年齢、性別、身長、体重、人種、民族、現在の健康状態、フィットネスレベル)
健康歴(高血圧、糖尿病、慢性膵炎、大腸ポリープ、クローン病、潰瘍性大腸炎、COPD、慢性気管支炎、肺気腫など))
喫煙歴(喫煙箱数・年数、喫煙期間、禁煙年齢)
アルコール使用量(1週間あたりの摂取量、期間)
女性専用:出産および授乳情報、月経状況、避妊薬の履歴、BRCA1、BRCA2、または他の高リスク遺伝子変異(例えば、TP53、PALB2、CDH1、もしくはATM)
癌スクリーニング履歴(結腸内視鏡検査、S状結腸鏡検査、マンモグラフィ、肺癌のX線またはCTスキャン、PAP/HPV検査)
癌家族歴(いずれかの癌と診断された近親者)
低リスク;0〜0.57
中程度のリスク;0.58〜0.79
高リスク;0.8〜1
低リスク;0〜0.56倍
中程度のリスク;0.57〜0.79
高リスク;0.8〜1
本発明の男性分類子モデルが、実施例1で開発したように、同じ対象からの個々のバイオマーカーのパネルの測定よりも、1年以内の癌発症を予測するのに著しく優れていることの実証が、本明細書で提供される。従来の方法では、同じマーカーのパネルを測定しても、いずれか1つの測定されたバイオマーカーが「高い」場合に、患者が癌を発症するリスクの増加を予測するか、または患者が増加したと見なす場合があるが、本発明の方法および分類子モデルは、バイオマーカー測定値および年齢などの臨床学的因子を集約して患者の癌リスクを予測する。換言すると、臨床的に関連すると見なされる閾値を上回る任意の1つのバイオマーカーがあれば、癌を発症するリスクの増加について陽性検査を示すことになる。例えば、以下の表8は、十分に検証された腫瘍マーカーの正常範囲を提供し、所与のマーカーの正常範囲を超える測定は、癌を発症する可能性の増加を示す。実施例1に従い、実施例3で使用される本発明の男性分類子モデルは、「任意マーカー高」方法と比較して、癌を予測するための感度および特異度の著しい改善が提供されている。図5を参照されたい。
本発明の女性分類子モデルが、実施例1で開発したように、同じ対象からの個々のバイオマーカーのパネルの測定よりも、1年以内の癌発症を予測するのに著しく優れているという実証が、本明細書で提供される。特に、本発明の女性分類子モデルは、個々のバイオマーカー「単一閾値」法を改善するものであり、感度は、単一閾値法と比較して4倍の増加を表す。換言すると、本発明の女性分類子モデルは、「任意マーカー高」の従来の方法と比較して、女性患者において4倍以上の癌を特定する。図7を参照されたい。
無症候性患者の癌を有するリスクまたは癌を発症するリスクの増加を予測するための方法が、本明細書で提供され、実施例1のコホートから訓練されたモデルが、測定されたバイオマーカーのパネル、ならびに年齢および性別の臨床学的因子に適用され、癌を有するリスクまたは癌を発症するリスクが増加した患者を特定する。すなわち汎癌検査である。実施形態では、当該方法および本発明の分類子モデルは、正常臨床範囲内にある測定されたバイオマーカーの入力変数を使用するものであり、汎癌分類子モデルは、第1の分類子モデルの出力が閾値を超えるときに、年齢の入力変数および患者からのバイオマーカーのパネルの測定値を使用して、患者をリスク増加カテゴリに分類する。
Claims (39)
- 少なくとも1つのプロセッサおよび少なくとも1つのメモリを含むコンピュータ実装システムにおける方法であって、前記少なくとも1つのメモリが、前記少なくとも1つのプロセッサによって実行されて、前記少なくとも1つのプロセッサに、無症候性患者に対して、癌を有するリスクまたは癌を発症するリスクの増加を予測するための1つ以上の分類子モデルを実装させる命令を含み、前記方法が、
a)前記患者からの試料中のバイオマーカーのパネルの測定値を取得する工程であって、バイオマーカーの値が、前記試料中の前記バイオマーカーのレベルに対応する、取得する工程と、
b)少なくとも年齢および性別を含む、前記患者に対応する臨床パラメータを取得する工程と、
c)第1の分類子モデルを使用して、前記患者を癌を有するかまたは癌を発症するリスクカテゴリに分類する工程であって、前記第1の分類子モデルが、患者集団の少なくとも2つのバイオマーカーのパネルの値、年齢、および診断指標を含む第1の訓練データを使用して機械学習システムによって生成され、
前記第1の分類子モデルは、前記第1の分類子モデルの出力が閾値を超えるときに、年齢の入力変数および前記患者からのバイオマーカーのパネルの前記測定値を使用して、前記患者をリスク増加カテゴリに分類する、分類する工程と、
d)前記患者が前記リスク増加カテゴリに分類されたときに、前記患者の診断検査のためにユーザに通知を提供する工程と、を含む、方法。 - 前記第1の分類子モデルが、少なくとも0.8の感度値および少なくとも0.8の特異度値を有する受信者動作特性(ROC)曲線の性能を有する、請求項1に記載の方法。
- 前記第1の訓練データが、少なくとも6つのバイオマーカーのパネルからの値を含む、請求項1に記載の方法。
- 前記入力変数が、少なくとも6つのバイオマーカーのパネルからの測定値を含む、請求項1に記載の方法。
- 前記バイオマーカーのパネルが、AFP、CEA、CA125、CA19−9、CA15−3、CYFRA21−1、PSA、およびSCCから選択される、請求項3に記載の方法。
- 前記バイオマーカーのパネルが、AFP、CEA、CA125、CA19−9、CA15−3、CYFRA21−1、PSA、およびSCCから選択される、請求項4に記載の方法。
- 男性患者の前記バイオマーカーのパネルが、AFP、CEA、CA19−9、CYFRA21−1、PSA、およびSCCから選択される、請求項1に記載の方法。
- 女性患者の前記バイオマーカーのパネルが、AFP、CEA、CA125、CA19−9、CA15−3、CYFRA21−1、およびSCCから選択される、請求項1に記載の方法。
- 前記機械学習システムが、前記第1の分類子モデルの前記性能を改善するために、前記第1の分類子モデルを、新しい訓練データで訓練することによって、前記第1の分類子モデルを反復的に再生成する工程をさらに含む、請求項1に記載の方法。
- 前記第1の分類子モデルが、少なくとも0.85の感度値および少なくとも0.8の特異度値を有する受信者動作特性(ROC)曲線の改善された性能を有する、請求項9に記載の方法。
- 前記リスクカテゴリが、低リスク、中程度のリスク、または高リスクを含む、請求項1に記載の方法。
- 前記リスク増加カテゴリが、中程度のリスクまたは高リスクを含む、請求項1に記載の方法。
- 前記診断検査が、放射線スクリーニングまたは組織生検である、請求項1に記載の方法。
- (1)前記患者の癌の存在を確認または否定する、前記診断検査からの1つ以上の検査結果を取得する工程と、
(2)前記機械学習システムの前記第1の分類子モデルのさらなる訓練のために、前記1つ以上の検査結果を前記第1の訓練データに組み込む工程と、
(3)前記機械学習システムによって改善された第1の分類子モデルを生成する工程と、をさらに含む、請求項1に記載の方法。 - 前記第1の分類子モデルが、サポートベクターマシン、決定木、ランダムフォレスト、ニューラルネットワーク、深層学習ニューラルネットワーク、またはロジスティック回帰アルゴリズムを含む、請求項1に記載の方法。
- 前記癌が、乳癌、胆管癌、骨癌、子宮頸癌、大腸癌、結腸直腸癌、胆嚢癌、腎臓癌、肝臓または肝細胞癌、小葉癌、肺癌、黒色腫、卵巣癌、膵臓癌、前立腺癌、皮膚癌、および精巣癌からなる群から選択される、請求項1に記載の方法。
- 前記第1の訓練データが、試料を提供して3ヶ月以上後に、癌診断を受けていない患者の群からのデータの群を含む、請求項1に記載の方法。
- 前記第1の訓練データが、試料を提供して3ヶ月以上後に、癌診断を受けた患者の群からのデータの群を含む、請求項1に記載の方法。
- 前記閾値が、0.5の確率値である、請求項1に記載の方法。
- 前記第1の訓練データには、癌を有する患者よりも多くの癌を有していない患者が含まれ、
陰性試料の選択を改善するために階層化サンプリング技術を使用することによって、前記第1の訓練データを再処理する工程をさらに含む、請求項1に記載の方法。 - 前記第1の分類子モデルによって前記リスク増加カテゴリに分類された患者が、第2の分類子モデルを使用してさらに分類され、前記第2の分類子モデルが、少なくとも2つのバイオマーカーのパネルの値および患者集団からの診断指標を含む第2の訓練データを使用して、前記機械学習システムによって生成され、前記第2の分類子モデルが、前記患者からの前記バイオマーカーのパネルの前記測定値の入力変数を使用して、最も可能性の高い臓器系悪性腫瘍に対応するクラス所属を割り当てることによって、当該患者について少なくとも1つの前記最も可能性の高い臓器系悪性腫瘍を予測する、請求項1に記載の方法。
- 訓練データが、前記患者集団からの年齢の値をさらに含む、請求項21に記載の方法。
- 前記入力変数が、年齢をさらに含む、請求項21に記載の方法。
- 少なくとも1つのプロセッサおよび少なくとも1つのメモリを含むコンピュータ実装システムにおける方法であって、前記少なくとも1つのメモリが、前記少なくとも1つのプロセッサによって実行されて、前記少なくとも1つのプロセッサに、癌を有するリスクまたは癌を発症するリスクが増加した患者の臓器系に基づく悪性腫瘍を予測するための1つ以上の分類子モデルを実装させる命令を含み、前記方法が、
a)前記患者からの試料中のバイオマーカーのパネルの測定値を取得する工程であって、バイオマーカーの値が、前記試料中の前記バイオマーカーのレベルに対応する、取得する工程と、
b)少なくとも年齢および性別を含む、前記患者から臨床パラメータを取得する工程と、
c)癌分類子モデルを使用して、前記患者を臓器系クラス所属に分類する工程であって、前記癌分類子モデルが、患者集団の少なくとも2つのバイオマーカーのパネルからの値、年齢、および診断指標を含む訓練データを使用して機械学習システムによって生成され、
前記癌分類子モデルが、年齢の入力変数および前記患者からの前記バイオマーカーのパネルの前記測定値を使用して、前記臓器系クラス所属を割り当てる、分類する工程と、
d)前記患者が前記臓器系に基づく悪性腫瘍を有すると予測されたときに、前記患者の診断検査のためにユーザに通知を提供する工程と、を含む、方法。 - 前記癌分類子モデルが、少なくとも0.8の感度値および少なくとも0.7の特異度値を有する受信者動作特性(ROC)曲線の性能を有する、請求項24に記載の方法。
- 前記臓器系クラス所属が、泌尿器系(GU)、消化器系(GI)、肺系、皮膚系、血液系、神経系、婦人科系、または一般系から選択される、請求項24に記載の方法。
- 前記訓練データが、少なくとも6つのバイオマーカーのパネルからの値を含む、請求項24に記載の方法。
- 前記入力変数が、少なくとも6つのバイオマーカーのパネルからの測定値を含む、請求項24に記載の方法。
- 前記バイオマーカーのパネルが、AFP、CEA、CA125、CA19−9、CA15−3、CYFRA21−1、PSA、およびSCCから選択される、請求項27に記載の方法。
- 前記バイオマーカーのパネルが、AFP、CEA、CA125、CA19−9、CA15−3、CYFRA21−1、PSA、およびSCCから選択される、請求項28に記載の方法。
- 男性患者の前記バイオマーカーのパネルが、AFP、CEA、CA19−9、CYFRA21−1、PSA、およびSCCから選択される、請求項24に記載の方法。
- 女性患者の前記バイオマーカーのパネルが、AFP、CEA、CA125、CA19−9、CA15−3、CYFRA21−1、およびSCCから選択される、請求項24に記載の方法。
- 前記機械学習システムが、前記癌分類子モデルの前記性能を改善するために、前記癌分類子モデルを、新しい訓練データで訓練することによって、前記癌分類子モデルを反復的に再生成する工程をさらに含む、請求項24に記載の方法。
- 前記診断検査が、放射線スクリーニングまたは組織生検である、請求項24に記載の方法。
- (1)前記患者の癌の存在を確認または否定する、前記診断検査からの1つ以上の検査結果を取得する工程と、
(2)前記機械学習システムの前記癌分類子モデルのさらなる訓練のために、前記1つ以上の検査結果を前記第2の訓練データに組み込む工程と、
(3)前記機械学習システムによって改善された癌分類子モデルを生成する工程と、をさらに含む、請求項24に記載の方法。 - 前記訓練データが、試料を提供して3ヶ月以上後に、癌診断を受けていない患者の群からのデータの群を含む、請求項24に記載の方法。
- 前記訓練データが、試料を提供して3ヶ月以上後に、癌診断を受けた患者の群からのデータの群を含む、請求項24に記載の方法。
- 少なくとも1つのプロセッサおよび少なくとも1つのメモリを含むコンピュータ実装システムにおける方法であって、前記少なくとも1つのメモリが、前記少なくとも1つのプロセッサによって実行されて、前記少なくとも1つのプロセッサに、癌を有するリスクまたは癌を発症するリスクが増加した患者の臓器系に基づく悪性腫瘍を予測するための1つ以上の分類子モデルを実装させる命令を含み、前記方法が、
a)前記患者からの試料中のバイオマーカーのパネルの測定値を取得する工程であって、バイオマーカーの値が、前記試料中の前記バイオマーカーのレベルに対応する、取得する工程と、
b)少なくとも年齢および性別を含む、前記患者に対応する臨床パラメータを取得する工程と、
c)第1の分類子モデルを使用して、前記患者を癌を有するかまたは癌を発症するリスクカテゴリに分類する工程であって、前記第1の分類子モデルが、患者集団の少なくとも2つのバイオマーカーのパネルの値、年齢、および診断指標を含む第1の訓練データを使用して機械学習システムによって生成され、
前記第1の分類子モデルは、前記第1の分類子モデルの出力が閾値を超えるときに、年齢の入力変数および前記患者からのバイオマーカーのパネルの前記測定値を使用して、前記患者をリスク増加カテゴリに分類する、分類する工程と、
d)第2の分類子モデルを使用して、前記患者を臓器系クラス所属に分類する工程であって、前記第2の分類子モデルが、患者集団の少なくとも2つのバイオマーカーのパネルからの値、年齢、および診断指標を含む訓練データを使用して機械学習システムによって生成され、
前記癌分類子モデルが、年齢の入力変数および前記患者からの前記バイオマーカーのパネルの前記測定値を使用して、前記臓器系クラス所属を割り当てる、分類する工程と、
e)前記患者が前記臓器系に基づく悪性腫瘍を有すると予測されたときに、前記患者の診断検査のためにユーザに通知を提供する工程と、を含む、方法。 - 癌を有するリスクまたは癌を発症するリスクが増加した患者の臓器系に基づく悪性腫瘍を予測するための少なくとも1つのプロセッサを含む機械学習システムであって、前記プロセッサが、
a)前記患者からの試料中のバイオマーカーのパネルの測定値を取得することであって、バイオマーカーの値が、前記試料中の前記バイオマーカーのレベルに対応する、取得することと、
b)年齢および性別を含む、前記患者から臨床パラメータを取得することと、
c)前記機械学習システムによって第1の分類子モデルを生成して、前記患者を癌を有するかまたは癌を発症するリスクカテゴリに分類することであって、
前記第1の分類子モデルは、前記第1の分類子モデルの出力が閾値より大きいときに、患者をリスク増加カテゴリに分類し、
前記第1の分類子モデルが、患者集団の少なくとも6つのバイオマーカーのパネルからの値、年齢、性別、および診断指標を含む訓練データを使用して前記機械学習システムによって生成される、分類することと、
d)前記機械学習システムによって第2の分類子モデルを生成して、前記患者を臓器系クラス所属に分類することであって、
前記癌分類子モデルが、年齢の入力変数および前記患者からの前記バイオマーカーのパネルの前記測定値を使用して、前記臓器系クラス所属を割り当て、
前記第2の分類子モデルが、患者集団の少なくとも2つのバイオマーカーのパネルからの値、年齢、および診断指標を含む訓練データを使用して機械学習システムによって生成される、分類することと、
e)前記患者の診断検査のために、ユーザに通知を提供することと、を行うように構成されている、機械学習システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862692683P | 2018-06-30 | 2018-06-30 | |
US62/692,683 | 2018-06-30 | ||
PCT/US2019/040075 WO2020006547A1 (en) | 2018-06-30 | 2019-07-01 | Cancer classifier models, machine learning systems and methods of use |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021529954A true JP2021529954A (ja) | 2021-11-04 |
JPWO2020006547A5 JPWO2020006547A5 (ja) | 2022-07-06 |
JP7431760B2 JP7431760B2 (ja) | 2024-02-15 |
Family
ID=68987635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020573269A Active JP7431760B2 (ja) | 2018-06-30 | 2019-07-01 | 癌分類子モデル、機械学習システム、および使用方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200005901A1 (ja) |
JP (1) | JP7431760B2 (ja) |
CN (1) | CN112970067A (ja) |
WO (1) | WO2020006547A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112888459B (zh) | 2018-06-01 | 2023-05-23 | 格里尔公司 | 卷积神经网络系统及数据分类方法 |
US20210345925A1 (en) * | 2018-09-21 | 2021-11-11 | Carnegie Mellon University | A data processing system for detecting health risks and causing treatment responsive to the detection |
US11581062B2 (en) * | 2018-12-10 | 2023-02-14 | Grail, Llc | Systems and methods for classifying patients with respect to multiple cancer classes |
US10990470B2 (en) * | 2018-12-11 | 2021-04-27 | Rovi Guides, Inc. | Entity resolution framework for data matching |
US11475302B2 (en) * | 2019-04-05 | 2022-10-18 | Koninklijke Philips N.V. | Multilayer perceptron based network to identify baseline illness risk |
US20220084632A1 (en) * | 2019-06-27 | 2022-03-17 | Veracyte, Inc. | Clinical classfiers and genomic classifiers and uses thereof |
US11810669B2 (en) * | 2019-08-22 | 2023-11-07 | Kenneth Neumann | Methods and systems for generating a descriptor trail using artificial intelligence |
US11581094B2 (en) * | 2019-08-22 | 2023-02-14 | Kpn Innovations, Llc. | Methods and systems for generating a descriptor trail using artificial intelligence |
US11817214B1 (en) | 2019-09-23 | 2023-11-14 | FOXO Labs Inc. | Machine learning model trained to determine a biochemical state and/or medical condition using DNA epigenetic data |
US20210241046A1 (en) * | 2019-11-26 | 2021-08-05 | University Of North Texas | Compositions and methods for cancer detection and classification using neural networks |
CN111222575B (zh) * | 2020-01-07 | 2023-11-17 | 北京联合大学 | 一种基于hrrp目标识别的klxs多模型融合方法及系统 |
CN111276243A (zh) * | 2020-01-22 | 2020-06-12 | 首都医科大学附属北京佑安医院 | 一种基于生物标志物的多变量分类系统和方法 |
CN111584064A (zh) * | 2020-03-27 | 2020-08-25 | 湖州市中心医院 | 一种结、直肠癌转移预测系统及其使用方法 |
US20210307700A1 (en) * | 2020-04-06 | 2021-10-07 | General Genomics, Inc. | Predicting susceptibility of living organisms to medical conditions using machine learning models |
CN111583993A (zh) * | 2020-05-29 | 2020-08-25 | 杭州广科安德生物科技有限公司 | 构建体外检测癌症的数学模型的方法及其应用 |
US20230223145A1 (en) * | 2020-06-01 | 2023-07-13 | 20/20 GeneSystems | Methods and software systems to optimize and personalize the frequency of cancer screening blood tests |
WO2022015700A1 (en) * | 2020-07-13 | 2022-01-20 | 20/20 GeneSystems | Universal pan cancer classifier models, machine learning systems and methods of use |
EP4226153A1 (en) * | 2020-10-05 | 2023-08-16 | Freenome Holdings, Inc. | Markers for the early detection of colon cell proliferative disorders |
CN112259221A (zh) * | 2020-10-21 | 2021-01-22 | 北京大学第一医院 | 基于多种机器学习算法的肺癌诊断系统 |
TWI818203B (zh) * | 2020-10-23 | 2023-10-11 | 國立臺灣大學醫學院附設醫院 | 基於病患病情的分類模型建立方法 |
CN112652361B (zh) * | 2020-12-29 | 2023-09-05 | 中国医科大学附属盛京医院 | 一种基于gbdt模型的骨髓瘤高风险筛查方法及其应用 |
EP4337910A2 (en) * | 2021-05-13 | 2024-03-20 | Arizona Board of Regents on behalf of The University of Arizona | Method of targeted multi-panel approach and tiered a.i. use for differential diagnosis and prognosis |
WO2022251633A1 (en) * | 2021-05-28 | 2022-12-01 | University Of Southern California | A radiomic-based machine learing algorithm to reliably differentiate benign renal masses from renal carcinoma |
CN113539493A (zh) * | 2021-06-23 | 2021-10-22 | 吾征智能技术(北京)有限公司 | 一种利用多模态风险因素推断癌症风险概率的系统 |
CN113913518B (zh) * | 2021-08-31 | 2022-08-16 | 广州市金域转化医学研究院有限公司 | 成熟b细胞肿瘤的分型标志物及其应用 |
US20230207128A1 (en) * | 2021-12-29 | 2023-06-29 | AiOnco, Inc. | Processing encrypted data for artificial intelligence-based analysis |
CN114974589A (zh) * | 2022-06-10 | 2022-08-30 | 燕山大学 | 一种宫颈癌预测方法 |
CN116259414B (zh) * | 2023-05-09 | 2023-08-18 | 南京诺源医疗器械有限公司 | 转移性淋巴结区分模型、构建方法及应用 |
CN116779179B (zh) * | 2023-08-22 | 2023-11-10 | 聊城市第二人民医院 | 一种基于支持向量机的肾细胞瘤背景信息分析系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5983211A (en) * | 1996-01-24 | 1999-11-09 | Heseltine; Gary L. | Method and apparatus for the diagnosis of colorectal cancer |
US20090061422A1 (en) * | 2005-04-19 | 2009-03-05 | Linke Steven P | Diagnostic markers of breast cancer treatment and progression and methods of use thereof |
KR101401561B1 (ko) * | 2010-12-30 | 2014-06-11 | 주식회사 바이오인프라 | 복합 바이오마커를 활용한 암 진단 정보 생성 방법, 및 암 진단 예측 시스템 장치 |
CN110444287B (zh) | 2011-04-29 | 2024-02-06 | 癌症预防和治疗有限公司 | 使用分类系统及其试剂盒识别和诊断肺部疾病的方法 |
US9753043B2 (en) | 2011-12-18 | 2017-09-05 | 20/20 Genesystems, Inc. | Methods and algorithms for aiding in the detection of cancer |
US9753037B2 (en) * | 2013-03-15 | 2017-09-05 | Rush University Medical Center | Biomarker panel for detecting lung cancer |
WO2015066564A1 (en) * | 2013-10-31 | 2015-05-07 | Cancer Prevention And Cure, Ltd. | Methods of identification and diagnosis of lung diseases using classification systems and kits thereof |
DK3071973T3 (da) * | 2013-11-21 | 2021-01-11 | Pacific Edge Ltd | Triage af patienter med asymptomatisk hæmaturi ved hjælp af genotype- og fænotypebiomarkører |
WO2016094330A2 (en) * | 2014-12-08 | 2016-06-16 | 20/20 Genesystems, Inc | Methods and machine learning systems for predicting the liklihood or risk of having cancer |
TWI630501B (zh) * | 2016-07-29 | 2018-07-21 | 長庚醫療財團法人林口長庚紀念醫院 | Establishment of a cancer prediction model and a method for analyzing cancer detection results in combination with a tumor marker set |
-
2019
- 2019-07-01 WO PCT/US2019/040075 patent/WO2020006547A1/en active Application Filing
- 2019-07-01 CN CN201980056329.0A patent/CN112970067A/zh active Pending
- 2019-07-01 US US16/458,589 patent/US20200005901A1/en active Pending
- 2019-07-01 JP JP2020573269A patent/JP7431760B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP7431760B2 (ja) | 2024-02-15 |
CN112970067A (zh) | 2021-06-15 |
US20200005901A1 (en) | 2020-01-02 |
WO2020006547A1 (en) | 2020-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7431760B2 (ja) | 癌分類子モデル、機械学習システム、および使用方法 | |
US20240112811A1 (en) | Methods and machine learning systems for predicting the likelihood or risk of having cancer | |
Akazawa et al. | Artificial intelligence in gynecologic cancers: Current status and future challenges–A systematic review | |
US20230263477A1 (en) | Universal pan cancer classifier models, machine learning systems and methods of use | |
Bird et al. | Alpha-fetoprotein detection of hepatocellular carcinoma leads to a standardized analysis of dynamic AFP to improve screening based detection | |
Tsai et al. | Histopathology images predict multi-omics aberrations and prognoses in colorectal cancer patients | |
Breen et al. | A holistic comparative analysis of diagnostic tests for urothelial carcinoma: a study of Cxbladder Detect, UroVysion® FISH, NMP22® and cytology based on imputation of multiple datasets | |
JP2020522690A (ja) | 肺疾病の特定又はモニタリング方法及びシステム | |
Raghu et al. | Implications of cardiovascular disease risk assessment using the WHO/ISH risk prediction charts in rural India | |
Kiessling | The changing face of cancer diagnosis: from computational image analysis to systems biology | |
US20230243830A1 (en) | Markers for the early detection of colon cell proliferative disorders | |
US20230176058A1 (en) | Markers for the early detection of colon cell proliferative disorders | |
Islam et al. | Machine learning models of breast cancer risk prediction | |
Wang et al. | Survival risk prediction model for ESCC based on relief feature selection and CNN | |
Karar et al. | Automated classification of urine biomarkers to diagnose pancreatic cancer using 1-D convolutional neural networks | |
US20230223145A1 (en) | Methods and software systems to optimize and personalize the frequency of cancer screening blood tests | |
De Grandi et al. | Highly Elevated Plasma γ‐Glutamyltransferase Elevations: A Trait Caused by γ‐Glutamyltransferase 1 Transmembrane Mutations | |
CA3220786A1 (en) | Diagnostic data feedback loop and methods of use thereof | |
Tao et al. | Early breast cancer risk detection: a novel framework leveraging polygenic risk scores and machine learning | |
Thaker et al. | The Role of Artificial Intelligence in Early Cancer Detection: Exploring Early Clinical Applications | |
Wu et al. | Development and validation of a clinical prediction model for glioma grade using machine learning | |
Lei et al. | Using Nomogram and Machine Learning Models to Predict Non-Small Cell Lung Cancer Prognosis | |
WO2023235878A2 (en) | Markers for the early detection of colon cell proliferative disorders | |
Pandey et al. | 10 A Comparative Analysis of Machine Learning Approaches | |
CN117831690A (zh) | 检测待测血样异常信号定量的计算机实施方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220628 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220628 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7431760 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |