JP2024505333A - 結腸細胞増殖障害の早期検出のためのマーカー - Google Patents
結腸細胞増殖障害の早期検出のためのマーカー Download PDFInfo
- Publication number
- JP2024505333A JP2024505333A JP2023537479A JP2023537479A JP2024505333A JP 2024505333 A JP2024505333 A JP 2024505333A JP 2023537479 A JP2023537479 A JP 2023537479A JP 2023537479 A JP2023537479 A JP 2023537479A JP 2024505333 A JP2024505333 A JP 2024505333A
- Authority
- JP
- Japan
- Prior art keywords
- complement component
- subject
- panel
- flt3l
- colon
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 210000001072 colon Anatomy 0.000 title claims abstract description 118
- 238000001514 detection method Methods 0.000 title abstract description 27
- 208000035269 cancer or benign tumor Diseases 0.000 title description 5
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 425
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 425
- 206010009944 Colon cancer Diseases 0.000 claims abstract description 250
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 232
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims abstract description 183
- 238000000034 method Methods 0.000 claims abstract description 157
- 230000002062 proliferating effect Effects 0.000 claims abstract description 154
- 239000012472 biological sample Substances 0.000 claims abstract description 118
- 208000035475 disorder Diseases 0.000 claims description 191
- 210000004027 cell Anatomy 0.000 claims description 120
- 102100025475 Carcinoembryonic antigen-related cell adhesion molecule 5 Human genes 0.000 claims description 116
- 101000914324 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 5 Proteins 0.000 claims description 116
- 102100020715 Fms-related tyrosine kinase 3 ligand protein Human genes 0.000 claims description 105
- 101710162577 Fms-related tyrosine kinase 3 ligand protein Proteins 0.000 claims description 105
- -1 IL-1a Proteins 0.000 claims description 90
- 102000007000 Tenascin Human genes 0.000 claims description 87
- 108010008125 Tenascin Proteins 0.000 claims description 87
- 108090001007 Interleukin-8 Proteins 0.000 claims description 85
- 102000004890 Interleukin-8 Human genes 0.000 claims description 85
- 208000029742 colonic neoplasm Diseases 0.000 claims description 77
- 230000000295 complement effect Effects 0.000 claims description 76
- 208000003200 Adenoma Diseases 0.000 claims description 66
- 101000623901 Homo sapiens Mucin-16 Proteins 0.000 claims description 65
- 102100023123 Mucin-16 Human genes 0.000 claims description 65
- 102100037792 Interleukin-6 receptor subunit alpha Human genes 0.000 claims description 59
- 101710185757 Interleukin-6 receptor subunit alpha Proteins 0.000 claims description 59
- 238000010801 machine learning Methods 0.000 claims description 57
- 108010041834 Growth Differentiation Factor 15 Proteins 0.000 claims description 54
- 102100026017 Interleukin-1 receptor type 2 Human genes 0.000 claims description 54
- 101710149731 Interleukin-1 receptor type 2 Proteins 0.000 claims description 54
- 239000000523 sample Substances 0.000 claims description 52
- 108090000569 Fibroblast Growth Factor-23 Proteins 0.000 claims description 51
- 102100024802 Fibroblast growth factor 23 Human genes 0.000 claims description 51
- 210000002381 plasma Anatomy 0.000 claims description 50
- 206010001233 Adenoma benign Diseases 0.000 claims description 46
- 102000009024 Epidermal Growth Factor Human genes 0.000 claims description 46
- 101710098940 Pro-epidermal growth factor Proteins 0.000 claims description 46
- 102100036848 C-C motif chemokine 20 Human genes 0.000 claims description 45
- 101000713099 Homo sapiens C-C motif chemokine 20 Proteins 0.000 claims description 45
- 108090001005 Interleukin-6 Proteins 0.000 claims description 45
- 102000004889 Interleukin-6 Human genes 0.000 claims description 45
- 101150054149 ANGPTL4 gene Proteins 0.000 claims description 43
- 102000054930 Agouti-Related Human genes 0.000 claims description 43
- 102000045205 Angiopoietin-Like Protein 4 Human genes 0.000 claims description 43
- 108700042530 Angiopoietin-Like Protein 4 Proteins 0.000 claims description 43
- 101000680845 Luffa aegyptiaca Ribosome-inactivating protein luffin P1 Proteins 0.000 claims description 43
- 238000012549 training Methods 0.000 claims description 40
- 102100029529 Thrombospondin-2 Human genes 0.000 claims description 39
- 108010060887 thrombospondin 2 Proteins 0.000 claims description 39
- 102100022623 Hepatocyte growth factor receptor Human genes 0.000 claims description 37
- 101000972946 Homo sapiens Hepatocyte growth factor receptor Proteins 0.000 claims description 37
- 101001024605 Homo sapiens Next to BRCA1 gene 1 protein Proteins 0.000 claims description 37
- 101000936262 Homo sapiens ATP synthase subunit alpha, mitochondrial Proteins 0.000 claims description 36
- 238000004422 calculation algorithm Methods 0.000 claims description 36
- 102100027573 ATP synthase subunit alpha, mitochondrial Human genes 0.000 claims description 35
- 102100034256 Mucin-1 Human genes 0.000 claims description 35
- 108010008707 Mucin-1 Proteins 0.000 claims description 35
- 206010048832 Colon adenoma Diseases 0.000 claims description 32
- 102100022133 Complement C3 Human genes 0.000 claims description 32
- 102000016550 Complement Factor H Human genes 0.000 claims description 32
- 108010053085 Complement Factor H Proteins 0.000 claims description 32
- 101000901154 Homo sapiens Complement C3 Proteins 0.000 claims description 32
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 claims description 32
- 102000014447 Complement C1q Human genes 0.000 claims description 31
- 108010078043 Complement C1q Proteins 0.000 claims description 31
- 108090000955 Complement C2 Proteins 0.000 claims description 31
- 102000004381 Complement C2 Human genes 0.000 claims description 31
- 108010028780 Complement C3 Proteins 0.000 claims description 31
- 102000016918 Complement C3 Human genes 0.000 claims description 31
- 102100026802 72 kDa type IV collagenase Human genes 0.000 claims description 29
- 101710151806 72 kDa type IV collagenase Proteins 0.000 claims description 29
- 102100034608 Angiopoietin-2 Human genes 0.000 claims description 29
- 108010048036 Angiopoietin-2 Proteins 0.000 claims description 29
- 102000005666 Apolipoprotein A-I Human genes 0.000 claims description 29
- 108010059886 Apolipoprotein A-I Proteins 0.000 claims description 29
- 102100032912 CD44 antigen Human genes 0.000 claims description 29
- 108010078239 Chemokine CX3CL1 Proteins 0.000 claims description 29
- 102000018651 Epithelial Cell Adhesion Molecule Human genes 0.000 claims description 29
- 108010066687 Epithelial Cell Adhesion Molecule Proteins 0.000 claims description 29
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 claims description 29
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 claims description 29
- 108090000376 Fibroblast growth factor 21 Proteins 0.000 claims description 29
- 102000003973 Fibroblast growth factor 21 Human genes 0.000 claims description 29
- 102000013818 Fractalkine Human genes 0.000 claims description 29
- 108010090290 Growth Differentiation Factor 2 Proteins 0.000 claims description 29
- 102100034221 Growth-regulated alpha protein Human genes 0.000 claims description 29
- 102100040892 Growth/differentiation factor 2 Human genes 0.000 claims description 29
- 102100021866 Hepatocyte growth factor Human genes 0.000 claims description 29
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 claims description 29
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 claims description 29
- 101000898034 Homo sapiens Hepatocyte growth factor Proteins 0.000 claims description 29
- 101001076408 Homo sapiens Interleukin-6 Proteins 0.000 claims description 29
- 101000868152 Homo sapiens Son of sevenless homolog 1 Proteins 0.000 claims description 29
- 101000955067 Homo sapiens WAP four-disulfide core domain protein 2 Proteins 0.000 claims description 29
- 108010002350 Interleukin-2 Proteins 0.000 claims description 29
- 102000000588 Interleukin-2 Human genes 0.000 claims description 29
- 102100034866 Kallikrein-6 Human genes 0.000 claims description 29
- 101710176224 Kallikrein-6 Proteins 0.000 claims description 29
- 102100027998 Macrophage metalloelastase Human genes 0.000 claims description 29
- 101710187853 Macrophage metalloelastase Proteins 0.000 claims description 29
- 102100026553 Mannose-binding protein C Human genes 0.000 claims description 29
- 101710110798 Mannose-binding protein C Proteins 0.000 claims description 29
- 102000003735 Mesothelin Human genes 0.000 claims description 29
- 108090000015 Mesothelin Proteins 0.000 claims description 29
- 102000009890 Osteonectin Human genes 0.000 claims description 29
- 108010077077 Osteonectin Proteins 0.000 claims description 29
- 102100037765 Periostin Human genes 0.000 claims description 29
- 101710199268 Periostin Proteins 0.000 claims description 29
- 102100038567 Properdin Human genes 0.000 claims description 29
- 108010005642 Properdin Proteins 0.000 claims description 29
- 102000012005 alpha-2-HS-Glycoprotein Human genes 0.000 claims description 29
- 108010075843 alpha-2-HS-Glycoprotein Proteins 0.000 claims description 29
- 108010036226 antigen CYFRA21.1 Proteins 0.000 claims description 29
- 230000015654 memory Effects 0.000 claims description 29
- 102000009816 urokinase plasminogen activator receptor activity proteins Human genes 0.000 claims description 29
- 108040001269 urokinase plasminogen activator receptor activity proteins Proteins 0.000 claims description 29
- 108010092694 L-Selectin Proteins 0.000 claims description 28
- 102000016551 L-selectin Human genes 0.000 claims description 28
- 210000004369 blood Anatomy 0.000 claims description 28
- 239000008280 blood Substances 0.000 claims description 28
- 101000613820 Homo sapiens Osteopontin Proteins 0.000 claims description 27
- 102100040557 Osteopontin Human genes 0.000 claims description 27
- 102000003712 Complement factor B Human genes 0.000 claims description 26
- 108090000056 Complement factor B Proteins 0.000 claims description 26
- 238000004458 analytical method Methods 0.000 claims description 24
- 230000014509 gene expression Effects 0.000 claims description 24
- 201000002758 colorectal adenoma Diseases 0.000 claims description 21
- 208000004804 Adenomatous Polyps Diseases 0.000 claims description 15
- 206010058314 Dysplasia Diseases 0.000 claims description 15
- 102100022460 Alpha-1-acid glycoprotein 2 Human genes 0.000 claims description 14
- 206010007275 Carcinoid tumour Diseases 0.000 claims description 14
- 206010007279 Carcinoid tumour of the gastrointestinal tract Diseases 0.000 claims description 14
- 102000014702 Haptoglobin Human genes 0.000 claims description 14
- 108050005077 Haptoglobin Proteins 0.000 claims description 14
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 claims description 14
- 206010051922 Hereditary non-polyposis colorectal cancer syndrome Diseases 0.000 claims description 14
- 101000678191 Homo sapiens Alpha-1-acid glycoprotein 2 Proteins 0.000 claims description 14
- 206010025323 Lymphomas Diseases 0.000 claims description 14
- 201000005027 Lynch syndrome Diseases 0.000 claims description 14
- 208000015634 Rectal Neoplasms Diseases 0.000 claims description 14
- 206010039491 Sarcoma Diseases 0.000 claims description 14
- 208000002458 carcinoid tumor Diseases 0.000 claims description 14
- 201000010897 colon adenocarcinoma Diseases 0.000 claims description 14
- 201000004528 gastrointestinal lymphoma Diseases 0.000 claims description 14
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 claims description 14
- 208000015768 polyposis Diseases 0.000 claims description 14
- 206010038038 rectal cancer Diseases 0.000 claims description 14
- 201000001275 rectum cancer Diseases 0.000 claims description 14
- 210000002966 serum Anatomy 0.000 claims description 14
- 238000012706 support-vector machine Methods 0.000 claims description 14
- 238000005259 measurement Methods 0.000 claims description 12
- 230000000750 progressive effect Effects 0.000 claims description 12
- 101000914321 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 7 Proteins 0.000 claims description 11
- 101000617725 Homo sapiens Pregnancy-specific beta-1-glycoprotein 2 Proteins 0.000 claims description 11
- 238000001356 surgical procedure Methods 0.000 claims description 11
- 230000000112 colonic effect Effects 0.000 claims description 10
- 238000007637 random forest analysis Methods 0.000 claims description 10
- 210000001124 body fluid Anatomy 0.000 claims description 9
- 239000010839 body fluid Substances 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 9
- 210000002700 urine Anatomy 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 210000000601 blood cell Anatomy 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 6
- 238000013179 statistical model Methods 0.000 claims description 6
- 208000014081 polyp of colon Diseases 0.000 claims description 5
- 238000001574 biopsy Methods 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 claims description 3
- 210000003608 fece Anatomy 0.000 claims description 3
- 229940124597 therapeutic agent Drugs 0.000 claims description 3
- 101100346932 Mus musculus Muc1 gene Proteins 0.000 claims description 2
- 208000027418 Wounds and injury Diseases 0.000 claims description 2
- 230000006378 damage Effects 0.000 claims description 2
- 208000014674 injury Diseases 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims description 2
- 102100040896 Growth/differentiation factor 15 Human genes 0.000 claims 10
- 101100504181 Arabidopsis thaliana GCS1 gene Proteins 0.000 claims 1
- 239000000090 biomarker Substances 0.000 abstract description 22
- 239000000203 mixture Substances 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 abstract 1
- 206010028980 Neoplasm Diseases 0.000 description 113
- 201000011510 cancer Diseases 0.000 description 73
- 238000011282 treatment Methods 0.000 description 58
- 102000000597 Growth Differentiation Factor 15 Human genes 0.000 description 44
- 238000012360 testing method Methods 0.000 description 40
- 201000010099 disease Diseases 0.000 description 39
- 238000003556 assay Methods 0.000 description 33
- 230000035945 sensitivity Effects 0.000 description 32
- 238000003860 storage Methods 0.000 description 29
- 238000012545 processing Methods 0.000 description 27
- 238000003745 diagnosis Methods 0.000 description 26
- 238000012544 monitoring process Methods 0.000 description 26
- 238000002591 computed tomography Methods 0.000 description 20
- 238000012216 screening Methods 0.000 description 19
- 208000007660 Residual Neoplasm Diseases 0.000 description 14
- 230000001225 therapeutic effect Effects 0.000 description 13
- 230000009471 action Effects 0.000 description 11
- 238000009169 immunotherapy Methods 0.000 description 10
- 230000003902 lesion Effects 0.000 description 10
- 238000001959 radiotherapy Methods 0.000 description 10
- 230000004044 response Effects 0.000 description 10
- 238000002512 chemotherapy Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 9
- 108020004414 DNA Proteins 0.000 description 8
- 238000007477 logistic regression Methods 0.000 description 8
- 238000002604 ultrasonography Methods 0.000 description 8
- 238000013459 approach Methods 0.000 description 7
- 238000009534 blood test Methods 0.000 description 7
- 238000002052 colonoscopy Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 230000002980 postoperative effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004393 prognosis Methods 0.000 description 7
- 238000011976 chest X-ray Methods 0.000 description 6
- 230000008984 colonic lesion Effects 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 6
- 238000003384 imaging method Methods 0.000 description 6
- 238000002595 magnetic resonance imaging Methods 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 150000007523 nucleic acids Chemical class 0.000 description 6
- 238000002600 positron emission tomography Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000002790 cross-validation Methods 0.000 description 5
- 238000002493 microarray Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 102000004506 Blood Proteins Human genes 0.000 description 4
- 108010017384 Blood Proteins Proteins 0.000 description 4
- 206010061818 Disease progression Diseases 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000034994 death Effects 0.000 description 4
- 231100000517 death Toxicity 0.000 description 4
- 238000002405 diagnostic procedure Methods 0.000 description 4
- 230000005750 disease progression Effects 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 238000002731 protein assay Methods 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 238000012800 visualization Methods 0.000 description 4
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 239000012491 analyte Substances 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 231100000504 carcinogenesis Toxicity 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 230000002550 fecal effect Effects 0.000 description 3
- 238000011528 liquid biopsy Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000004949 mass spectrometry Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 2
- 206010061045 Colon neoplasm Diseases 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 238000000018 DNA microarray Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 208000002193 Pain Diseases 0.000 description 2
- 208000037062 Polyps Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 108091092259 cell-free RNA Proteins 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000013079 data visualisation Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000000869 mutational effect Effects 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 239000012474 protein marker Substances 0.000 description 2
- 210000000664 rectum Anatomy 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000002271 resection Methods 0.000 description 2
- 229920002477 rna polymer Polymers 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000002579 sigmoidoscopy Methods 0.000 description 2
- 239000010454 slate Substances 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 102100023635 Alpha-fetoprotein Human genes 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102000000989 Complement System Proteins Human genes 0.000 description 1
- 108010069112 Complement System Proteins Proteins 0.000 description 1
- 102000008929 Complement component C9 Human genes 0.000 description 1
- 108050000891 Complement component C9 Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 206010072082 Environmental exposure Diseases 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- 206010018429 Glucose tolerance impaired Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 101710123134 Ice-binding protein Proteins 0.000 description 1
- 101710082837 Ice-structuring protein Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 108010063954 Mucins Proteins 0.000 description 1
- 102000015728 Mucins Human genes 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 206010033307 Overweight Diseases 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 208000001280 Prediabetic State Diseases 0.000 description 1
- 206010065918 Prehypertension Diseases 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 101710107540 Type-2 ice-structuring protein Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 210000001815 ascending colon Anatomy 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 210000004534 cecum Anatomy 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000024203 complement activation Effects 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 210000001731 descending colon Anatomy 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 239000000104 diagnostic biomarker Substances 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000001085 differential centrifugation Methods 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000000416 exudates and transudate Anatomy 0.000 description 1
- 206010016256 fatigue Diseases 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 208000017819 hyperplastic polyp Diseases 0.000 description 1
- 229940127121 immunoconjugate Drugs 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000003116 impacting effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000002429 large intestine Anatomy 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000013332 literature search Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012083 mass cytometry Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 239000011325 microbead Substances 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 229940051875 mucins Drugs 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 230000009826 neoplastic cell growth Effects 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 230000036407 pain Effects 0.000 description 1
- 238000010238 partial least squares regression Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 201000007271 pre-malignant neoplasm Diseases 0.000 description 1
- 201000009104 prediabetes syndrome Diseases 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012628 principal component regression Methods 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 238000003498 protein array Methods 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 208000012201 sexual and gender identity disease Diseases 0.000 description 1
- 208000015891 sexual disease Diseases 0.000 description 1
- 210000001599 sigmoid colon Anatomy 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000013106 supervised machine learning method Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 210000003384 transverse colon Anatomy 0.000 description 1
- 208000022271 tubular adenoma Diseases 0.000 description 1
- 208000022158 tubulovillous adenoma Diseases 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 238000013107 unsupervised machine learning method Methods 0.000 description 1
- 208000009540 villous adenoma Diseases 0.000 description 1
- 208000016261 weight loss Diseases 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57407—Specifically defined cancers
- G01N33/57419—Specifically defined cancers of colon
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/435—Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
- G01N2333/52—Assays involving cytokines
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/82—Translation products from oncogenes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/60—Complex ways of combining multiple protein biomarkers for diagnosis
Abstract
本明細書に開示されるシステム、媒体、組成物、方法、およびキットは、大腸癌を含む結腸細胞増殖性障害の早期検出のためのタンパク質バイオマーカーのパネルに関する。本明細書に記載されるタンパク質パネルのための生体試料中のタンパク質の存在またはレベルは、分類器生成に、結腸細胞増殖性障害の検出のために集団中の対象を分類するのに有益な機械学習モデルにおいて、および入力として使用され得る。【選択図】図1
Description
関連出願への相互参照
本出願は、2020年12月21日に出願された米国仮特許出願第63/128,545号の利益を主張し、参照によってその全体が本明細書中に援用される。
本出願は、2020年12月21日に出願された米国仮特許出願第63/128,545号の利益を主張し、参照によってその全体が本明細書中に援用される。
本開示は、進行性腺腫および大腸癌を含む結腸細胞増殖障害の早期検出のためのバイオマーカーおよび方法に関する。
大腸癌(CRC)は、西洋諸国における癌関連の死亡率の主因である。CRCは最も特徴付けられた固形腫瘍のうちの1つであるが、CRCは、診断に至る遅さゆえに先進国における主死因のうちの1つである。他の理由のうち、患者の診断が遅いのは結腸内視鏡検査などの診断検査の実施が遅すぎるという事実によるものである。CRCによる死亡は、有効かつ早期のスクリーニングによって予防することができる。
本開示は、CRC検出および疾患進行に関連した生体試料のタンパク質プロファイリングに向けられた方法およびシステムを提供する。本明細書に記載される研究は、結腸細胞増殖性障害を検出する可能性のある結腸細胞増殖性障害の特定のバイオマーカーの存在を示すCRCの特異タンパク質シグネチャーの存在の決定を可能にし、患者集団を層別化し、および結腸細胞増殖性障害を有する対象からの血漿を使用して、高特異度および高感度で集団を分類する。
一態様では、本開示は、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII(IL1R2)、HGFR、IL-6ra、OPN、テネイシンC(TNC)、トロンボスポンジン-2(THBS2)、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む結腸細胞増殖性障害に特徴的な予め定められたタンパク質パネルを提供する。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6RA、ORM、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、HGFR、THBS2、CA125(MUC-16)、CA19-9、CA15-3(MUC-1)、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、パネルは総PSAを含む。
いくつかの実施形態では、パネルは、健康な対象、良性結腸ポリープを有する対象、進行性腺腫を有する対象、または大腸癌を有する対象を区別するように構成される。
いくつかの実施形態では、パネルは進行性腺腫を示すように構成され、かつ1)FLT3L、CEACAM5、IL-6RA、およびORM、2)FLT3L、CEACAM5、IL-6RA、CEA、ORM、IL-8、AGP、IL-1RT2、TNC、およびGDF-15、あるいは3)FLT3L、CEACAM5、IL-6RA、CEA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、p00738、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは大腸癌を示すように構成され、かつ1)FLT3L、CEACAM5、およびIL-6RA、2)FLT3L、CEACAM5、IL-6RA、IL-8、IL-1RT2、TNC、およびそれらの組合せ、または3)FLT3L、CEACAM5、IL-6RA、IL-8、AFP、IL-1RT2、TNC、MUC-16、EGF、およびそれらの組合せからなる群から選択されるタンパク質を含む。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
別の態様では、本開示は、健康な対象の集団を、結腸細胞増殖性障害を有する対象と区別するように構成された分類器であって、結腸細胞増殖性障害に特徴的な予め定められたタンパク質パネルからのタンパク質を表す測定値のセットを含み、測定値のセットは、健康な対象の試料および結腸細胞増殖性障害を有する対象の試料のタンパク質発現データから取得され、測定値のセットは、タンパク質発現データの特性に対応する特徴のセットを生成するために使用され、特徴のセットは、機械学習モデルまたは統計モデルを使用してコンピュータ処理され、機械学習モデルまたは統計モデルは、健康な対象の集団を結腸細胞増殖性障害を有する対象と区別することができる分類器として有用な特徴ベクトルを提供する、分類器を提供する。
いくつかの実施形態では、予め定められたタンパク質パネルは、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6RA、ORM、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、HGFR、THBS2、CA125(MUC-16)、CA19-9、CA15-3(MUC-1)、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは総PSAを含む。
いくつかの実施形態では、分類器は、健康な対象、良性結腸ポリープを有する対象、進行性腺腫を有する対象、または大腸癌を有する対象を区別するように構成される。
いくつかの実施形態では、パネルは進行性腺腫を示すように構成され、かつ1)FLT3L、CEACAM5、IL-6RA、ORM、またはそれらの組合せから選択されるタンパク質、2)FLT3L、CEACAM5、IL-6RA、CEA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、またはそれらの組合せ、あるいは3)FLT3L、CEACAM5、IL-6RA、CEA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、p00738、またはそれらの組合せから選択されるタンパク質を含む。
いくつかの実施形態では、パネルは大腸癌を示すように構成され、かつ1)FLT3L、CEACAM5、IL-6RA、およびそれらの組合せ、2)FLT3L、CEACAM5、IL-6RA、IL-8、IL-1RT2、TNC、または3)FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、MUC-16、EGF、およびそれらの組合せから選択されるタンパク質を含む。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
別の態様では、本開示は、予め定められたタンパク質パネルに基づいて、対象を分類するのに操作可能な分類器を含むコンピュータ可読媒体と、コンピュータ可読媒体上に記憶される指示を実行するための1つ以上のプロセッサとを含む、結腸細胞増殖性傷害を検出するための機械学習モデル分類器を含む、システムを提供する。
いくつかの実施形態では、システムは、健康な対象の集団を、結腸細胞増殖性障害を有する対象と区別するように構成された分類器であって、結腸細胞増殖性障害に特徴的な予め定められたタンパク質パネルからのタンパク質を表す測定値のセットを含み、測定値のセットは、健康な対象の試料および結腸細胞増殖性障害を有する対象の試料のタンパク質発現データから取得され、測定値は、タンパク質発現データの特性に対応する特徴のセットを生成するために使用され、特徴のセットは、機械学習モデルまたは統計モデルを使用してコンピュータ処理され、機械学習モデルまたは統計モデルは、健康な対象の集団を結腸細胞増殖性障害を有する対象と区別することができる分類器として有用な特徴ベクトルを提供する、分類器を含む。
いくつかの実施形態では、パネルは、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む。
いくつかの実施形態では、機械学習モデルは訓練用生体試料から得られた訓練データを使用して訓練され、訓練用生体試料の第1のサブセットは、結腸細胞増殖性障害を有する対象に対応すると同定され、訓練用生体試料の第2のサブセットは、結腸細胞増殖性障害を有していない対象に対応すると同定される。
[0001]いくつかの実施形態では、分類器は、a)タンパク質シグネチャーパネルに基づいて、対象を分類するのに操作可能な分類器を含むコンピュータ可読媒体と、b)コンピュータ可読媒体上に記憶される指示を実行するための1つ以上のプロセッサとを含む結腸細胞増殖性障害を検出するためのシステム中で提供される。
いくつかの実施形態では、システムは、ディープラーニング分類器、ニューラルネットワーク分類器、線形判別分析(LDA)分類器、二次判別分析(QDA)分類器、サポートベクターマシン(SVM)分類器、ランダムフォレスト(RF)分類器、K近傍法、線形カーネルサポートベクターマシン分類器、一次または二次多項式カーネルサポートベクターマシン分類器、リッジ回帰分類器、弾性ネットアルゴリズム分類器、逐次最小問題最適化アルゴリズム分類器、ナイーブベイズアルゴリズム分類器、および主成分分析分類器からなる群から選択される機械学習分類器として構成される分類回路を含む。
別の態様では、本開示は、対象のタンパク質を含有している生体試料のタンパク質プロファイルを決定する方法であって、
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含むタンパク質の予め定められたパネルからのタンパク質の量を測定する工程であって、これにより前記対象のタンパク質プロファイルを提供する、測定する工程と
を含む方法を提供する。
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含むタンパク質の予め定められたパネルからのタンパク質の量を測定する工程であって、これにより前記対象のタンパク質プロファイルを提供する、測定する工程と
を含む方法を提供する。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、またはそれらの組合せを含む。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、またはそれらの組合せを含む。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、HGFR、THBS2、CA125(MUC-16)、CA19-9、CA15-3(MUC-1)、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは総PSAを含む。
いくつかの実施形態では、タンパク質プロファイルは、結腸細胞増殖性障害と関連し、結腸細胞増殖性障害を有する対象の分類を提供する。
いくつかの実施形態では、対象の生体試料は、体液、便、結腸排出物、尿、血漿、血清、全血、単離された血液細胞、血液から単離された細胞、組織生検、およびそれらの組合せからなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、方法は、対象のタンパク質プロファイルに基づいた外科手術および/または治療剤を用いて対象を処置する工程をさらに含む。
別の態様では、本開示は、対象中の結腸細胞増殖性障害を検出する方法であって、
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む予め定められたタンパク質パネルからのタンパク質の量を測定する工程であって、これにより対象のタンパク質プロファイルを提供する、測定する工程と、
c)結腸細胞増殖性障害の有無に関連した出力値を提供するために、タンパク質プロファイルを、健康な対象と結腸細胞増殖性障害を有する対象とを区別できるように訓練された機械学習モデルへとコンピュータ処理する工程であって、これにより対象中の結腸細胞増殖性障害の有無を示す、コンピュータ処理する工程と
を含む方法を提供する。
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む予め定められたタンパク質パネルからのタンパク質の量を測定する工程であって、これにより対象のタンパク質プロファイルを提供する、測定する工程と、
c)結腸細胞増殖性障害の有無に関連した出力値を提供するために、タンパク質プロファイルを、健康な対象と結腸細胞増殖性障害を有する対象とを区別できるように訓練された機械学習モデルへとコンピュータ処理する工程であって、これにより対象中の結腸細胞増殖性障害の有無を示す、コンピュータ処理する工程と
を含む方法を提供する。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、またはそれらの組合せを含む。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、またはそれらの組合せを含む。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、HGFR、THBS2、CA125(MUC-16)、CA19-9、CA15-3(MUC-1)、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは総PSAを含む。
いくつかの実施形態では、タンパク質プロファイルは、結腸細胞増殖性障害と関連し、結腸細胞増殖性障害を有する対象の分類を提供する。
いくつかの実施形態では、対象の生体試料は、体液、便、結腸排出物、尿、血漿、血清、全血、単離された血液細胞、血液から単離された細胞、組織生検、およびそれらの組合せからなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、方法は、検出された結腸細胞増殖性障害に基づいて対象に処置を行う工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または外科手術を含む。
[0002]別の態様では、方法は、過去に疾患を処置した対象中の微小残存病変をモニタリングするために提供され、上記方法は、
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより対象中の微小残存病変の変化を検出する、決定する工程と
を含む。
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより対象中の微小残存病変の変化を検出する、決定する工程と
を含む。
いくつかの実施形態では、微小残存病変は、処置に対する応答、腫瘍負荷、術後残存腫瘍、再発、二次スクリーニング、一次スクリーニング、および癌進行からなる群から選択される。いくつかの実施形態では、方法は、対象中の微小残存病変中の検出された変化に基づいて対象に処置を行う工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または外科手術を含む。処置は、(例えば、複数個の可能な処置の選択肢の中から)選択されてもよく、対象のタンパク質プロファイルおよび/または対象の一連の生物学的形質に少なくとも部分的に基づいて対象に投与されてもよい。生物学的形質は、(例えば、訓練された機械学習分類器を使用して決定された)測定、診断、予後、または予測であってもよい。
[0003]いくつかの実施形態では、生物学的形質は悪性腫瘍を含む。[0004]いくつかの実施形態では、生物学的形質は癌タイプを含む。いくつかの実施形態では、生物学的形質は癌ステージを含む。いくつかの実施形態では、生物学的形質は癌分類を含む。いくつかの実施形態では、癌分類は癌等級を含む。いくつかの実施形態では、癌分類は組織学的分類を含む。いくつかの実施形態では、生物学的形質は代謝プロファイルを含む。いくつかの実施形態では、生物学的形質は変異を含む。いくつかの実施形態では、変異は疾患関連の変異である。いくつかの実施形態では、生物学的形質は臨床転帰を含む。いくつかの実施形態では、生物学的形質は薬物応答を含む。
[0005]別の態様では、方法は、処置に対する対象の応答を決定するために提供され、上記方法は、
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより処置に対する対象の応答を決定する、決定する工程と
を含む。
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより処置に対する対象の応答を決定する、決定する工程と
を含む。
いくつかの実施形態では、方法は、処置に対する対象の決定された応答に基づいて対象に処置を行う工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または外科手術を含む。
[0006]別の態様では、方法は、対象の腫瘍負荷をモニタリングするために提供され、上記方法は、
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより対象の腫瘍負荷をモニタリングする、決定する工程と
を含む。
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより対象の腫瘍負荷をモニタリングする、決定する工程と
を含む。
いくつかの実施形態では、方法は、対象の腫瘍負荷に基づいて対象に処置を行う工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または外科手術を含む。
別の態様では、方法は、対象の術後残存腫瘍を検出するために提供され、上記方法は、
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより対象の術後残存腫瘍を検出する、決定する工程と
を含む。
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより対象の術後残存腫瘍を検出する、決定する工程と
を含む。
いくつかの実施形態では、方法は、対象の検出された術後残存腫瘍に基づいて対象に処置を行う工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または外科手術を含む。
別の態様では、方法は、対象の再発を検出するために提供され、上記方法は、
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより対象の再発を検出する、決定する工程と
を含む。
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより対象の再発を検出する、決定する工程と
を含む。
いくつかの実施形態では、方法は、対象の検出された再発に基づいて対象に処置を行う工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または外科手術を含む。
別の態様では、方法は、対象のタンパク質プロファイルに少なくとも部分的に基づいて二次スクリーンを実行するために提供される。
別の態様では、方法は、対象のタンパク質プロファイルに少なくとも部分的に基づいて一次スクリーンを実行するために提供される。
別の態様では、方法は、対象の癌進行をモニタリングするために提供され、上記方法は、
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより対象の癌進行をモニタリングする、決定する工程と
を含む。
a)EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質のパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、
b)ベースラインのタンパク質状態の生成後の1つ以上の時点で対象から得られた生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成する、決定する工程と、
c)ベースラインのタンパク質状態と現在のタンパク質状態との間の差を決定する工程であって、これにより対象の癌進行をモニタリングする、決定する工程と
を含む。
いくつかの実施形態では、方法は、対象のモニタリングされた癌進行に基づいて対象に処置を行う工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または外科手術を含む。
いくつかの実施形態では、タンパク質プロファイルは少なくとも約25%の感度で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは少なくとも約30%の感度で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは少なくとも約35%の感度で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは少なくとも約40%の感度で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは少なくとも約50%の感度で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは少なくとも約60%の感度で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは少なくとも約70%の感度で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは少なくとも約80%の感度で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは少なくとも約90%の感度で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは少なくとも約95%の感度で大腸癌の存在または感受性を示す。
いくつかの実施形態では、タンパク質プロファイルは、少なくとも約5%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約10%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約15%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約20%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約25%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約30%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約40%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約50%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約60%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約70%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約80%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約90%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約95%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約99%の陽性的中率(PPV)で大腸癌の存在または感受性を示す。
いくつかの実施形態では、タンパク質プロファイルは、少なくとも約40%の陰性的中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約50%の陰性的中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約60%の陰性的中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約70%の陰性的中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約80%の陰性的中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約90%の陰性的中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約95%の陰性的中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、タンパク質プロファイルは、少なくとも約99%の陰性的中率(NPV)で大腸癌の存在または感受性を示す。
いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.50の曲線下面積(AUC)を用いて対象の大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.60の曲線下面積(AUC)を用いて対象の大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.70の曲線下面積(AUC)を用いて対象の大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.80の曲線下面積(AUC)を用いて対象の大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.90の曲線下面積(AUC)を用いて対象の大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.95の曲線下面積(AUC)を用いて対象の大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.99の曲線下面積(AUC)を用いて対象の大腸癌の存在または感受性を決定する。
いくつかの実施形態では、方法は、ユーザの電子デバイスまたはレポートを提示する工程をさらに含む。いくつかの実施形態では、ユーザは、対象、個体、または患者である。
いくつかの実施形態では、方法は、対象、個体、または患者における大腸癌の存在または感受性の可能性を決定する工程をさらに含む。
いくつかの実施形態では、訓練されたアルゴリズム(例えば、機械学習モデルまたは分類器)は、教師あり機械学習アルゴリズムまたは半教師あり機械学習アルゴリズムを含む。いくつかの実施形態では、教師あり機械学習アルゴリズムは、ディープラーニングアルゴリズム、サポートベクターマシン(SVM)、ニューラルネットワーク、またはランダムフォレストを含む。
いくつかの実施形態では、方法は、対象に治療的介入を提供する工程、またはタンパク質プロファイルもしくは分析に少なくとも部分的に基づいて、大腸癌を有する患者を処置するための治療的介入(例えば、化学療法、放射線療法、免疫療法、または外科手術)などの処置を対象に行うさらに含む。
いくつかの実施形態では、方法は、大腸癌の存在または感受性をモニタリングする工程であって、複数の時点で対象の大腸癌の存在または感受性を評価することを含む、モニタリングする工程をさらに含み、評価することは、複数の時点のそれぞれで決定された大腸癌の存在または感受性に少なくとも部分的に基づいている。
いくつかの実施形態では、複数の時点における対象の大腸癌の存在または感受性の評価の差は、(i)対象の大腸癌の存在または感受性の診断、(ii)対象の大腸癌の存在または感受性の予後、および(iii)対象の大腸癌の存在または感受性を処置するための処置の方針の有効性もしくは非有効性からなる群から選択される1つ以上の臨床的適応を示す。
いくつかの実施形態では、方法は、大腸癌の複数の明確なサブタイプまたはステージの中から対象の大腸癌のサブタイプを決定する、訓練されたアルゴリズムを使用することによって、対象の大腸癌を層別化する工程をさらに含む。
本開示の別の態様は、1つ以上のコンピュータプロセッサによる実行に際し、上記または本明細書のいずれかに記載の方法のいずれかを実装する、機械実行可能なコードを含む非一時的なコンピュータ可読媒体を提供する。
本開示の別の態様は、1つ以上のコンピュータプロセッサ、およびそれに接続されたコンピュータメモリを含む、システムを提供する。このコンピュータメモリは、1つ以上のコンピュータプロセッサによる実行に際して、上記または本明細書中の他の場所に記載される方法のいずれかを実装する機械実行可能コードを含む。
本開示の別の態様は、a)機械学習モデルを使用した、タンパク質シグネチャーパネルに基づいて結腸細胞増殖性障害を有する対象の集団を、結腸細胞増殖性障害を有していない対象と区別するための分類器を含むコンピュータ可読媒体と、b)コンピュータ可読媒体上に記憶される指示を実行するための1つ以上のプロセッサとを含むシステムを提供する。
本開示のさらなる態様および利点は、以下の詳細な記載から当業者に容易に明白となり、ここでは、本開示の例示的な実施形態のみが示され、記載されている。以下の記載から分かるように、本開示は他の実施形態および異なる実施形態であってもよく、そのいくつかの詳細は、本開示から逸脱することなく、様々な明白な点においてすべて修正が可能である。したがって、図面と記述は、本質的に例示的とみなされ、限定的とは見なされない。
参照による援用
本明細書で言及されるすべての刊行物、特許、および特許出願は、あたかも個々の刊行物、特許、または特許出願がそれぞれ参照により本明細書に具体的かつ個別に援用されるのと同じ程度にまで、参照により本明細書に援用される。参照により援用される出版物および特許または特許出願が、本明細書に含まれる開示に矛盾する程度まで、本明細書は、そのような矛盾のある題材に取って代わること、および/または、上記題材よりも優先することが意図されている。
本明細書で言及されるすべての刊行物、特許、および特許出願は、あたかも個々の刊行物、特許、または特許出願がそれぞれ参照により本明細書に具体的かつ個別に援用されるのと同じ程度にまで、参照により本明細書に援用される。参照により援用される出版物および特許または特許出願が、本明細書に含まれる開示に矛盾する程度まで、本明細書は、そのような矛盾のある題材に取って代わること、および/または、上記題材よりも優先することが意図されている。
本開示の例は、添付の図面を参照してほんの一例として記載されている。本発明の新規な特徴は、とりわけ添付の特許請求の範囲とともに説明される。本発明の特徴と利点は、本発明の原理が用いられる例示的な実施形態を説明する以下の詳細な説明と、以下の添付図面(本明細書では「図(“Figure”および“FIG.”)」とも称される)とを参照することにより、より良く理解されるであろう。
本発明の様々な実施形態が本明細書中で示され、記載されているが、このような実施形態はほんの一例として提供されるものであることは、当業者に明らかであろう。多くの変更、変化、および置換は、本発明から逸脱することなく当業者に理解され得る。本明細書に記載される本発明の実施形態の様々な代案が利用され得ることを理解されたい。
CRCは、西洋諸国における癌関連の死亡率の主因である。CRCは最も特徴付けられた固形腫瘍のうちの1つであるが、CRCは、診断に至る遅さゆえに先進国における主死因のうちの1つである。他の理由のうち、患者診断が遅いのは結腸内視鏡検査などの診断テストの実施が遅すぎるという事実による。CRCによる死亡は、有効なスクリーニングによって予防することができる。現在、臨床的意思決定を方向付けることに有用な普遍的な特定のスクリーニング検査もパネルもない。早期検出によって癌を成長と転移の前に排除できるため、癌のスクリーニングおよびモニタリングは生存転帰を改善する。CRCでは、例えば、結腸内視鏡検査は早期検診を改善する際に役割を果たす。残念ながら、患者の遵守率は低く、またスクリーニングは、手順の侵襲性のために推奨される規則性を下回って行われる。大腸新生物の早期検出を可能にする非侵襲的かつより単純な診断方法の実施は、血清または血漿中で検出可能なタンパク質を同定することに基づき得る。非侵襲的アプローチは、大腸新生物に対するより適合した早期のスクリーニング試験の基礎であり得る。
近年の研究は、癌を有する患者における腫瘍関連抗原の存在を支持する。腫瘍形成が腫瘍細胞中の自己タンパク質の構造または発現の変化と関連しているので、これらの変化は癌の潜在的な免疫学的マーカーとして役立ち得る。
ヒト中の癌および腫瘍の存在も、癌を有する患者の血清中のタンパク質の存在と関連している。他の技術によって癌が検出され得る前であっても、タンパク質をその疾患の初期段階で検出することができ、その疾患のバイオマーカーとしてのこれらのタンパク質の可能性を示す。これらのタンパク質は、発現レベルの変化、単離された変異によって影響を受ける場合があるか、異常なフォールディング、過剰発現、異常なグリコシル化が起こる場合があるか、切断される、または異常な分解を受ける場合があるかのいずれかであり得る。
したがって、タンパク質バイオマーカーは、簡易で、有効、かつ非侵襲性の方法によって、結腸新生物の診断、様々な段階(腺腫または腫瘍進行など)の結腸新生物の分類、疾患の進行の予後、処置に対する疾患応答の評価、および再発または結腸新生物の播種の検出を可能に得る。結腸新生物に関連したタンパク質の診断可能性は、結腸新生物の早期検出、診断、および予後に役立ち得る。
本開示は、概して癌検出および疾患のモニタリングに関する。特に、本開示は、初期の大腸癌など結腸細胞増殖性障害における癌関連タンパク質の検出および疾患のモニタリングに関する。具体的には、循環タンパク質シグネチャーパネルおよびその使用は、大腸癌(CRC)および/もしくは大腸腺腫(CA)、例えば、進行性大腸腺腫(AA)などの結腸細胞増殖性障害を有するまたは発症するリスクがあるヒト対象を同定するために提供される。例えば、対象が大腸病変を有する場合、結腸細胞増殖性障害の存在または発症するリスクが高いことを示す、ヒト対象中の腫瘍関連タンパク質がさらに本明細書に開示される。
本開示のいくつかの実施形態は、結腸細胞増殖性障害を有していない、または結腸細胞増殖性障害を発症するリスクが低い対象の対応する試料と比較して、結腸細胞増殖性障害を有するまたは結腸細胞増殖性障害を発症するリスクが高い対象の試料中の特異的に豊富なタンパク質を提供する。いくつかの実施形態では、結腸細胞増殖性障害を発症するリスクが高い対象および結腸細胞増殖性障害を発症するリスクが低い対象のそれぞれは、大腸粘膜内に生じる非侵襲性の前駆病変(以下、大腸病変)を有する。健康な対象および結腸細胞増殖性障害を有する対象の試料中に様々な存在量で存在するタンパク質は、結腸細胞増殖性障害の診断、処置、および/または予防のためのバイオマーカーとして使用することができる。
いくつかの実施形態では、方法は、対象の生体試料のタンパク質プロファイルを、健康な対象からの参照タンパク質プロファイルのデータベースと比較する工程と、参照タンパク質プロファイルに対するタンパク質発現レベルにおける少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、または少なくとも50%の変化の測定に少なくとも部分的に基づいて、対象が結腸細胞増殖性障害を有するリスクの増加を有することを決定する工程とをさらに含む。
機械学習アプローチは、生体試料由来のタンパク質データを特徴付けて、有益なタンパク質のパネルを同定するために使用され得る。結腸細胞増殖性障害に有益なタンパク質の同定されたパネルは、健康な対象の試料を、結腸細胞増殖性障害を有する対象の試料と区別するのに有用な分類器モデルを訓練するのに有用であり得る。
本明細書に記載される方法および分類器に有益なタンパク質を同定するために、結腸細胞増殖性障害を有する対象の血漿、および結腸細胞増殖性障害を有していない対象の血漿(対照血漿または参照血漿)を、結腸細胞増殖性障害に応答して結腸細胞増殖性障害を有する患者によって産生される、またはその患者内で特異的に発現されるタンパク質のシグネチャーパネルを同定することを目的として調べた。そのために、結腸細胞増殖性障害を有する患者の血漿および対照血漿を、タンパク質発現についてアッセイして、バイオマーカーを同定した。
本明細書で同定されるタンパク質は、結腸細胞増殖性障害を有する対象を、結腸細胞増殖性障害を有していない対象と区別するために同定すること、結腸細胞増殖性障害を発症するリスクが高い対象を、結腸細胞増殖性障害を発症するリスクが低い対象と区別するために同定すること、または結腸細胞増殖性障害の前駆病変を有する対象を同定することに使用できる。したがって、これらのタンパク質は、結腸細胞増殖性障害のモニタリング、処置、および管理に関する決定を導くための補助的なツールとして使用できる。
本開示の他の特定の実施形態は、健康な対象の血漿試料および結腸細胞増殖性障害を有する対象の血漿試料において発現される、本明細書に記載されるタンパク質に対して訓練された機械学習モデル分類器を提供する。機械学習モデルを訓練することは、健康な対象または結腸細胞増殖性障害を有する対象を分類するのに有用な予め定められたタンパク質バイオマーカーのセット(「タンパク質パネル」または「シグネチャーパネル」)を備える分類器を提供する。一例では、組織学的重症度を評価するために大腸病変を有する対象に使用することができる血液ベースの最小侵襲性タンパク質アッセイのための方法が提供される。別の実施形態では、結腸細胞増殖性障害を示すタンパク質は、対象の無細胞試料中で検出される。全血、血漿、または血清などの対象の体液試料は、タンパク質などの無細胞分子を含有している。したがって、結腸細胞増殖性障害の有無や、外科的切除、免疫療法、放射線両方、もしくは化学療法などの処置を必要とする高リスクまたは低リスクの大腸病変を区別するために、そしてモニタリングできる低リスク大腸病変を同定するために使用することができるタンパク質が本明細書で提供される。結腸細胞増殖性障害または病変の存在のモニタリングおよび確認は、例えば、結腸内視鏡検査、超音波、MM、またはCTスキャンによって実行できる。
いくつかの実施形態では、結腸細胞増殖性障害の早期検出およびCRCの早期検出に関することに使用される予め定められた血漿タンパク質バイオマーカーのパネルが本明細書に開示される。予め定められたタンパク質パネルは、進行性腺腫または大腸癌などの細胞増殖性障害を示す分類器において使用することができる。
他の実施形態では、検出、診断、および処置に関連した方法が本明細書に開示される。患者の血漿は、大腸の増殖性障害の指標として予め定められたパネルのタンパク質についてスクリーニングされ得る。
結腸細胞増殖性障害に罹患している対象においてアップレギュレートまたは過剰発現されるタンパク質の発現プロファイルまたは存在量に基づいて、結腸細胞増殖性障害を有するまたは有するリスクがある対象をスクリーニングまたは同定するための方法が本明細書に記載される。対象、例えば、ヒト対象における結腸細胞増殖性障害の診断に有用なデータを得るための方法が本明細書にさらに記載される。
結腸細胞増殖性障害は、任意の腫瘍ステージ(例えば、TX、TO、Tis、T1、T2、T3、T4)、任意の局所リンパ節もしくは遠隔転移のステージ(例えば、NX、N0、N1、M0、M1)、任意のステージ(例えばステージ0(Tis、N0、M0)、ステージIA(T1、N0、M0)、ステージIIA(T3、N0、M0)、ステージIIB(T1-3、N1、M0)、ステージIII(T4、任意のN、M0)、またはステージIV(任意のT、任意のN、M1))、切除可能、局所進行性(切除不能)、あるいは転移性のものであってもよい。
現在のスクリーニングツールは、偽陽性および偽陰性の結果、ならびに特異度および感度に起因する課題に直面し得る。理想的な癌スクリーニングツールは、高い陽性的中率(PPV)を有し得、これは、不必要な調査を最小限にする(低い偽陽性)が、大多数の癌を検出する(低い偽陰性)。別の重要な妥協点は、「検出感度」であり、サイズに基づく腫瘍の検出の下限である試験感度とは異なる。循環腫瘍マーカーを検出可能なレベルで放出するのに十分な大きさまで腫瘍を増殖させることは、癌進行の早期検出および予防の目的を無効化する。したがって、本開示は、大腸癌の早期診断のための高感度かつ有効な血液ベースのスクリーニングの必要性に対処する。
「リキッドパイオプシー」とも称される、循環腫瘍DNAの検出は、非侵襲的な方法での腫瘍の検出および有益な調査を可能にする。これらの液体生検における腫瘍特異的変異の同定は、例えば、結腸癌、乳癌、および前立腺癌を診断することに使用され得る。しかしながら、循環中に存在する正常な(すなわち、非腫瘍由来の)DNAのバックグラウンドの高さに起因して、これらの技術は感度において制限され得る。したがって、リスク集団の再発スクリーニングおよび一次スクリーニングのための早期または低腫瘍負荷の大腸癌腫瘍マーカーを検出するためのより高感度かつ特異的なスクリーニングツールのニーズが依然として存在する。腫瘍関連抗原に対する循環タンパク質は、本明細書に記載される機械学習モデルにおいて使用され得る液体生検試料中の有益なバイオマーカーの別の供給源を提供する。
本開示は、結腸細胞増殖性障害およびその進行、例えば、大腸癌に関連する循環タンパク質のプロファイリングを対象とする方法およびシステムを提供する。結腸細胞増殖性障害の存在または結腸細胞増殖性障害を発症するリスクが高いことを示すタンパク質は、結腸細胞増殖性障害の進行を可能な限り早期に診断、処置、または予防するために、例えば、対象が大腸病変のみを有する場合に使用され得る。特に対象が大腸病変を有する場合に、対象において結腸細胞増殖性障害を診断、または結腸細胞増殖性障害を発症するリスクを評価するためのキットおよび方法が本明細書にさらに提供される。
一態様では、疾患状態に基づいて対象の試料を区別するのに有用なタンパク質のパネルを使用する方法が本明細書で提供される。他の態様では、タンパク質のパネルを使用して結腸細胞増殖性障害を検出、区別、かつ区別することを対象とする方法、アッセイ、およびキットが本明細書で提供される。結腸細胞増殖性障害の非限定的な例としては、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫が挙げられる。
いくつかの実施形態では、方法は、結腸細胞増殖性障害の差別化、検出、および区別のためのマーカーとして選択される1つ以上のタンパク質の使用を含む。
定義
本明細書および特許請求の範囲で使用されるとき、単数形の「a」、「an」および「the」は、文脈上明確に指示されない限り、複数の参照を含む。例えば、「核酸」という用語は複数の核酸を含み、その混合物も含む。
本明細書および特許請求の範囲で使用されるとき、単数形の「a」、「an」および「the」は、文脈上明確に指示されない限り、複数の参照を含む。例えば、「核酸」という用語は複数の核酸を含み、その混合物も含む。
本明細書で使用されるとき、用語「対象」は通常試験可能か検出できる遺伝子情報がある実体または媒体を指す。対象は、人、個体、または患者であり得る。対象は、脊椎動物、例えば、哺乳動物などであり得る。哺乳動物の非限定的な例としては、ヒト、サル、家畜動物、競技用動物、げっ歯類、およびペットが挙げられる。対象は、癌を有するか、または癌を有する疑いがある人であり得る。対象は、対象の健康、生理学的状態、または疾病、例えば、対象の癌または他の疾患、障害、もしくは疾病を示す症状を示し得る。代替案として、対象は、そのような健康または生理学的状態または疾病に関して無症状であり得る。
本明細書で使用されるとき、「試料」という用語は一般に、1人以上の対象から得られた、または対象に由来する生体試料を指す。生体試料は、無細胞の生体試料または実質的に無細胞の生体試料であってもよく、あるいは無細胞の生体試料を生成するために処理または分画されてもよい。例えば、無細胞の生体試料は、無細胞リボ核酸(cfRNA)、無細胞デオキシリボ核酸(cfDNA)、無細胞胎児DNA(cffDNA)、タンパク質、抗体、血漿、血清、尿、唾液、羊水、およびその誘導体を含み得る。無細胞の生体試料は、エチレンジアミン四酢酸(EDTA)採取管、無細胞のRNA採取管(例えば、Streck(登録商標)Complete BCT(登録商標))、または無細胞のDNA採取管(例えば、Streck(登録商標)Cell-Free DNABCT(登録商標))を用いて、対象から入手されるか、または誘導されることがある。無細胞の生体試料は、分画によって(例えば、分画遠心分離によって)全血試料に由来してもよい。生体試料またはその誘導体は、細胞を含んでいてもよい。例えば、生体試料は、血液試料またはその誘導体(例えば、採取管よって採取された血液または血液滴)であり得る。
本明細書で使用されるとき、「無細胞試料」という用語は一般に、無傷細胞を実質的に欠く生体試料を指す。無細胞試料は、それ自体が実質的に細胞を欠いている生体試料に由来してもよく、または細胞が除去された試料に由来してもよい。無細胞試料の非限定的な例としては、血液、血清、血漿、尿、精液、痰、糞便、乳管滲出液(ductal exudate)、リンパ液、および回収済洗浄液(recovered lavage)に由来するものが挙げられる。
本明細書で使用されるとき、「結腸細胞増殖性障害」という用語は一般に、結腸または直腸における細胞の無秩序なまたは異常な増殖を含む障害または疾患を指す。結腸細胞増殖性障害の非限定的な例としては、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫が挙げられる。本明細書で使用されるとき、「CRC」という略語は、大腸癌と診断された対象の生体試料を同定するために使用される。本明細書で使用されるとき、「AA」という略語は、少なくとも1つの進行性腺腫と診断された対象の試料を同定するために使用される。本明細書で使用されるとき、「NAA」という略語は、良性であり、進行性腺腫または大腸癌ではない大腸腫瘍と診断された対象の試料を同定するために使用される。
本明細書で使用されるとき、「大腸癌」という用語は、一般に小腸の下の腸管(すなわち、大腸(結腸)、例えば、盲腸、上行結腸、横行結腸、下行結腸、S状結腸、および直腸)の細胞の癌を特徴とする医学的状態である。
本明細書で使用されるとき、「大腸腺腫」という用語は一般に、大腸癌の良性かつ前癌段階である腺腫性ポリープとも称される結腸の腺腫を指す。大腸腺腫は、大腸癌への進行のリスクが高いことを示し得る。
本明細書で使用されるとき、「進行性大腸腺腫」という用語は一般に、少なくとも10mmの大きさであるか、または高度異形成もしくは20%より高い絨毛成分を組織学的に有する腺腫を指す。
本明細書で使用されるとき、「結腸細胞増殖性障害を発症するリスクがある」または「結腸細胞増殖性障害を発症するリスクが高い」という用語は一般に、結腸細胞増殖性障害を有していない対象または近い将来に結腸細胞増殖性障害を発症するリスクが低い対象と比較して、近い将来に結腸細胞増殖性障害を発症するリスクが高い対象を指す。本明細書で使用されるとき、「近い将来」という用語は、約1ヶ月~約2年、約6ヶ月~約18ヶ月、または約1年の期間を指す。
本明細書で使用されるとき、癌の「タイプ」および「サブタイプ」という用語は一般に、乳癌などの癌の1つの「タイプ」が、例えば、ステージ、形態学、組織学、遺伝子発現、受容体プロファイル、変異プロファイル、攻撃性、予後、および悪性の特徴に基づく「サブタイプ」であり得るように、本明細書で相対的に使用される。同様に、「タイプ」および「サブタイプ」は、例えば、1つの組織学的「タイプ」を、例えば、変異プロファイルまたは遺伝子発現に従って定義される「サブタイプ」に区別するために、より細かいレベルで適用され得る。癌「ステージ」も、疾患進行に関連する組織学的および病理学的特徴に基づく癌タイプの分類を指すために使用される。
「新生物」という用語は一般に、組織の任意の新たなかつ異常な成長を指す。したがって、新生物は、前悪性新生物または悪性新生物である場合がある。「新生物特異的マーカー」という用語は、新生物の存在を示すために使用することができる任意の生体物質を指す。生体物質の例としては、限定されないが、核酸、ポリペプチド、炭水化物、脂肪酸、細胞成分(例えば、細胞膜およびミトコンドリア)、および全細胞が挙げられる。「大腸新生物特異的マーカー」という用語は、大腸新生物(例えば、前悪性大腸新生物または悪性大腸新生物)の存在を示すために使用することができる任意の生体物質を指す。
本明細書で使用されるとき、「健康な」という用語は一般に、大腸細胞増殖性障害を有していない対象を指す。健康は動的な状態であるが、本明細書で使用するとき、この用語は、特定の記述において参照されている疾患状態を欠く対象の病理学的状態を指す。一例では、大腸癌を有する対象を分類することができるシグネチャーパネルに言及する場合、健康な個体、健康な試料、または健康な個体の試料は、大腸癌(CRC)、進行性腺腫(AA)、または良性腺腫(NAA)を欠く個体を指す。本明細書で使用されるとき、「NAA」という略語は、大腸腫瘍について陰性であると評価された個体からの試料を同定するために使用され、したがって、いくつかの実施形態では、NAAとして同定された試料は、健康な試料群に含まれる。本明細書で使用されるとき、他の疾患または健康状態がその対象に存在し得るが、「健康」という用語は、論じられている疾患状態を有する対象と欠いている対象との間の比較または分類の目的で、述べられている疾患の欠如を示す。
「微小残存病変」または「MRD」という用語は一般に、癌処置後の対象の体内の少数の癌細胞を指す。MRD試験は、癌処置の有効性を決定しさらなる処置計画を導くために実施され得る。
本明細書で使用されるとき、「スクリーニング」という用語は一般に、健康な対象を、未診断の大腸癌または大腸腺腫に罹患している対象または上記適応症に罹患するリスクが高い対象と識別する目的で、大腸癌または大腸腺腫に罹患するリスクがある対象の集団の検査または試験を指す。
本明細書で使用されるとき、「最小侵襲性生体試料」または「非侵襲性試料」という用語は一般に、対象から血液を得るために使用される細針以外の器具を必要とせずに、患者の身体から採取される任意の試料を指す。いくつかの実施形態では、最小侵襲性生体試料は、血液、血清、または血漿試料を含む。
本明細書で使用されるとき、「アップレギュレートされた」または「過剰発現された」という用語は一般に、所与の「閾値」または「カットオフ値」に対する発現レベルの少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも110%、少なくとも120%、少なくとも130%、少なくとも140%、少なくとも150%、または150%より大きい増加を指す。
本明細書で使用されるとき、「閾値」または「カットオフ値」という用語は、発現レベルを指す場合、一般に、対象の発現レベルが上記閾値またはカットオフまたは参照レベルを上回る場合、対象が所与の感度および特異度で大腸癌または大腸腺腫に罹患している可能性が高いことを示す参照発現レベルを指す。
本明細書で使用されるとき、「キット」という用語は、任意の特定のデバイスに限定されず、本開示のシステムおよび方法を実装するのに好適な任意のデバイス、例えば、マイクロアレイ、バイオアレイ、バイオチップ、バイオチップアレイ、またはビーズベースのアッセイを含むが、これらに限定されない。
試料のアッセイ
無細胞の生体試料は、ヒト対象から得られてもよく、またはヒト対象に由来してもよい。無細胞の生体試料は、処理前に、異なる温度(例えば、室温で、冷蔵、または冷凍条件下で、例えば、25℃で、4℃で、-18℃で、-20℃で、もしくは-80℃で)または異なる懸濁液(例えば、EDTA採取管、無細胞RNA採取管、または無細胞DNA採取管)などの様々な貯蔵条件で貯蔵され得る。
無細胞の生体試料は、ヒト対象から得られてもよく、またはヒト対象に由来してもよい。無細胞の生体試料は、処理前に、異なる温度(例えば、室温で、冷蔵、または冷凍条件下で、例えば、25℃で、4℃で、-18℃で、-20℃で、もしくは-80℃で)または異なる懸濁液(例えば、EDTA採取管、無細胞RNA採取管、または無細胞DNA採取管)などの様々な貯蔵条件で貯蔵され得る。
無細胞の生体試料は、癌を有する対象、癌を有する疑いがある対象、または癌を有していないもしくは有する疑いのない対象からのものであり得る。
無細胞の生体試料は、癌を有する対象の処置の前および/または後に得られ得る。無細胞の生体試料は、処置または処置レジメン中の対象からのものであり得る。多数の無細胞の生体試料は、経時的に処置の効果をモニタリングするために対象から得られ得る。無細胞の生体試料は、臨床試験を介して決定的な陽性または陰性の診断が利用可能でない癌を有することが知られているまたは疑いのある対象から採取され得る。試料は、癌を有する疑いのある対象から採取され得る。無細胞の生体試料は、疲労、吐き気、体重減少、痛みおよび疼痛、衰弱、または出血などの原因不明の症状を経験している対象から採取され得る。無細胞の生体試料は、説明された症状を有する対象から採取され得る。無細胞の生体試料は、家族歴、年齢、高血圧もしくは前高血圧、糖尿病もしくは前糖尿病、過体重もしくは肥満、環境曝露、生活習慣のリスク因子(例えば、喫煙、アルコール摂取、または薬物使用)、または他のリスク因子の存在などの因子に起因して癌を発症するリスクがある対象から採取され得る。
無細胞の生体試料は、トランスクリプトームデータを生成するためのアッセイに適した無細胞リボ核酸(cfRNA)分子、ゲノムデータを生成するためのアッセイに適した無細胞デオキシリボ核酸(cfDNA)分子、プロテオオームデータを生成するためのアッセイに適したタンパク質分子、またはそれらの混合物もしくは組合せなど、アッセイすることができる1つ以上の分析物を含有し得る。
対象から無細胞の生体試料を得た後、無細胞の生体試料を処理して、対象の結腸細胞増殖性障害を示すデータセットが生成され得る。例えば、タンパク質のパネルにおける無細胞の生体試料のタンパク質分子の存在、非存在、または定量評価である。対象の無細胞の生体試料を処理する工程は、(i)無細胞の生体試料を、複数のタンパク質を単離、濃縮、または抽出するのに十分な条件にさらすこと、および(ii)データセットを生成するために複数のタンパク質分子をアッセイすることを含み得る。
生体試料は、試料のタンパク質プロファイルを生成するために、1つ以上のタンパク質を検出するためのアッセイに直接使用され得る。いくつかの実施形態では、生体試料は、アッセイ(例えば、タンパク質コンジュゲートマイクロビーズを使用する)前にタンパク質が濃縮され得る。いくつかの実施形態では、生体試料は血漿試料であり、タンパク質濃縮されている。生体試料は、生体試料中の1つ以上のタンパク質の存在および/または濃度またはレベルを決定するために、種々の実験室的方法論を用いてアッセイされ得る。いくつかの実施形態では、そのようなアプローチは、限定されないが、質量分析、タンパク質マイクロアレイ、高密度タンパク質マイクロアレイ、例えば、CDIプロテオームアレイ、ELISA、メソスケールディスカバリー(Meso Scale Discovery)(例えば、Pacific Biolabs)、ビーズベースのイムノアッセイ(例えば、Luminex(登録商標)磁気ビーズベース捕捉アッセイ)、二次蛍光抗体アッセイ、DNA-抗体コンジュゲートまたは抗体-金属コンジュゲート(例えば、マスサイトメトリー、CyTOF)、HD-X(商標)およびSR-X(商標)Ultra-Sensitive Biomarker Detection Systems(例えば、Quanterix(登録商標))、アプタマーベースのオリゴハイブリダイゼーションMEMS(例えば、Somalogic)、フローサイトメトリー、FirePlex(登録商標)粒子技術(例えば、Abcam(登録商標))、またはそれらの組合せを含み得、対象の生体試料のタンパク質プロファイルを決定する。
シグネチャーパネル
本開示は、生体試料を分析して、結腸細胞増殖性障害の発症に関連する試料中で同定されたタンパク質分子の組合せから測定可能な特徴を得るための方法およびシステムを提供する。本明細書に記載される同定されたタンパク質分子の採取は、結腸細胞増殖性障害またはそのステージの検出のための分類器の作成およびそのモデルにおいて有益な価値を有する。同定されたタンパク質分子はそれぞれ有益かつ有用であり得る一方で、該タンパク質分子は、シグネチャーが結腸細胞増殖性障害またはそのステージの特徴であるシグネチャーパネルを形成するために、本明細書に記載される組合せで使用され得る。シグネチャーパネルの特徴は、結腸細胞増殖性障害を有する対象の集団を層別化するように構成された分類器を作成するために、訓練されたアルゴリズム(例えば、機械学習モデル)を使用して処理され得る。方法は、シグネチャーパネルに記載される1つ以上のタンパク質の使用により特徴付けられる。いくつかの実施形態では、少なくとも3つのタンパク質のシグネチャーパネルは本明細書に記載される分類器と方法に有用である。
本開示は、生体試料を分析して、結腸細胞増殖性障害の発症に関連する試料中で同定されたタンパク質分子の組合せから測定可能な特徴を得るための方法およびシステムを提供する。本明細書に記載される同定されたタンパク質分子の採取は、結腸細胞増殖性障害またはそのステージの検出のための分類器の作成およびそのモデルにおいて有益な価値を有する。同定されたタンパク質分子はそれぞれ有益かつ有用であり得る一方で、該タンパク質分子は、シグネチャーが結腸細胞増殖性障害またはそのステージの特徴であるシグネチャーパネルを形成するために、本明細書に記載される組合せで使用され得る。シグネチャーパネルの特徴は、結腸細胞増殖性障害を有する対象の集団を層別化するように構成された分類器を作成するために、訓練されたアルゴリズム(例えば、機械学習モデル)を使用して処理され得る。方法は、シグネチャーパネルに記載される1つ以上のタンパク質の使用により特徴付けられる。いくつかの実施形態では、少なくとも3つのタンパク質のシグネチャーパネルは本明細書に記載される分類器と方法に有用である。
本明細書に記載されるタンパク質シグネチャーパネルは、結腸細胞増殖性障害に関連する特定のタンパク質の迅速かつ具体的な分析を可能にする。本明細書中の方法に記載され、使用されるようなシグネチャーパネルは、結腸細胞増殖性障害の改善された診断、予後、処置選択、およびモニタリング(例えば処置モニタリング)に使用されてもよい。
シグネチャーパネルおよび方法は、全血、血漿、または血清などの体液試料から初期段階の結腸細胞増殖性障害を検出するための現在のアプローチに対して著しい改善を提供する。結腸細胞増殖性障害を検出および診断するために使用される現在の方法には、結腸内視鏡検査、S状結腸鏡検査、および便潜血結腸癌が含まれる。これらの方法と比較して、本明細書で提供される方法は、結腸内視鏡検査よりも侵襲性がはるかに低く、S状結腸鏡検査、免疫学的便潜血検査(FIT)、および便潜血検査(FOBT)よりも感度が高くないとしても同等であり得る。本明細書で提供される方法は、タンパク質パネルと高感度アッセイ技術との有利な使用の組合せによって、感度および特異性に関して有意な利点を提供し得る。
本開示は、結腸細胞増殖性障害および疾患進行と関連したタンパク質のフロファイリングを対象とする方法およびシステムを提供する。本明細書に記載される方法および分類器に有益なタンパク質を同定するために、結腸細胞増殖性障害を有する患者からの血漿および結腸細胞増殖性障害を有していない対象の血漿(対照血漿または参照血漿)を調べて、結腸細胞増殖性障害およびそれぞれの反応性タンパク質に応答して結腸細胞増殖性障害を有する患者によって産生されるタンパク質のシグネチャーパネルを同定した。そのために、結腸細胞増殖性障害を有する患者からの血漿および対照血漿は、高密度抗体マイクロアレイを使用して試験され得る。抗体マイクロアレイは、i)アレイにプリントされたタンパク質は事前に知られており、それによって、その後の同定を防止し、ミモトープの可能な選択を排除すること、ii)タンパク質はすべて同様の濃度でプリントされるので、いかなるタンパク質も選択する傾向はないことというタンパク質を同定するために使用される他のアプローチに関して一連の利点を提供し、この因子の組合せは、バイオマーカーを同定するための高い感度を提供する。
本明細書で同定されるタンパク質は、結腸細胞増殖性障害を有する対象を、結腸細胞増殖性障害を有していない対象と区別するために同定すること、または結腸細胞増殖性障害を発症するリスクが高い対象を、結腸細胞増殖性障害を発症するリスクが低い対象と区別するために同定すること、または結腸細胞増殖性障害の前駆病変を有する対象を同定することに使用できる。したがって、これらのタンパク質は、結腸細胞増殖性障害のモニタリング、処置、および管理に関する決定を導くための補助的なツールとして使用できる。
いくつかの実施形態では、大腸の増殖性障害の早期検出および大腸癌の早期検出に関することに有用な血漿タンパク質バイオマーカーのパネルが本明細書に開示される。
他の実施形態では、検出、診断、および処置に関連した方法が本明細書に開示される。患者の血漿は、大腸の増殖性障害の兆候として腫瘍関連タンパク質または腫瘍由来のタンパク質についてスクリーニングされる。
一態様では、本開示は、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む結腸細胞増殖性障害に特徴的なタンパク質パネルを提供する。
いくつかの実施形態では、パネルは、結腸細胞増殖性障害を有する対象の試料を示すのに有用であり、補体成分C2、補体成分C9、D因子、I因子、補体成分C1q、補体成分C3、補体成分C3b、B因子、およびH因子からなる群から選択される少なくとも3つのタンパク質を含む。
いくつかの実施形態では、タンパク質パネルは、FLT3L、CEACAM5、IL-6RA、CEA、ORM、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、タンパク質パネルは、FLT3L、CEACAM5、IL-6RA、CEA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、タンパク質パネルは、FLT3L、CEACAM5、IL-6RA、CEA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、p00738、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、HGFR、THBS2、CA125(MUC-16)、CA19-9、CA15-3(MUC-1)、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、パネルは総PSAを含む。
いくつかの実施形態では、タンパク質シグネチャーパネルは、健康な対象、良性結腸ポリープを有する対象、進行性腺腫を有する対象、または大腸癌を有する対象を区別するのに有用である。
いくつかの実施形態では、パネルは、進行性腺腫を示すのに有用であり、かつEGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む。
いくつかの実施形態では、パネルは、進行性腺腫を有する対象の試料示すのに有用であり、かつ補体成分C2、補体成分C9、D因子、I因子、補体成分C1q、補体成分C3、補体成分C3b、B因子、およびH因子からなる群から選択される少なくとも3つのタンパク質を含む。
いくつかの実施形態では、パネルは、大腸癌を示すのに有用であり、かつEGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む。
いくつかの実施形態では、パネルは、大腸癌を有する対象の試料示すのに有用であり、かつ補体成分C2、補体成分C9、D因子、I因子、補体成分C1q、補体成分C3、補体成分C3b、B因子、およびH因子からなる群から選択される少なくとも3つのタンパク質を含む。
いくつかの実施形態では、タンパク質の予め定められたセットは、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、少なくとも50、少なくとも51、少なくとも52、少なくとも53、少なくとも54、少なくとも55、少なくとも56、少なくとも57、少なくとも58、少なくとも59、少なくとも60、またはそれ以上のタンパク質、例えば本明細書に記載されるタンパク質を含有している。いくつかの実施形態では、タンパク質の予め定められたセットは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、またはそれ以上のタンパク質、例えば本明細書に記載されるタンパク質を含有している。いくつかの実施形態では、タンパク質の予め定められたセットは、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択されるタンパク質を含有している。いくつかの実施形態では、タンパク質の予め定められたセットは、表2に列挙される群から選択されるタンパク質を含有している。
いくつかの実施形態では、予め定められたパネル中のタンパク質は、インターロイキン、補体経路メディエーター、補体タンパク質、ケモカイン、成長因子、サイトカイン、グロブリンタンパク質、ムチン、およびプロテイナーゼなどの機能クラスのタンパク質を含む。
分類器、機械学習モデル、およびシステム
機械学習アプローチは、対象の生体試料由来のタンパク質データを特徴付けて、有益なタンパク質のパネルを同定するために使用される。結腸細胞増殖性障害に有益なタンパク質の同定されたパネルは、健康な対象の試料を、結腸細胞増殖性障害を有する対象の試料と区別するのに有用な分類器モデルを訓練するのに有用である。
機械学習アプローチは、対象の生体試料由来のタンパク質データを特徴付けて、有益なタンパク質のパネルを同定するために使用される。結腸細胞増殖性障害に有益なタンパク質の同定されたパネルは、健康な対象の試料を、結腸細胞増殖性障害を有する対象の試料と区別するのに有用な分類器モデルを訓練するのに有用である。
健康な対象の血漿試料および結腸細胞増殖性障害を有する対象の血漿試料において発現される、本明細書に記載されるタンパク質に対して訓練された機械学習モデル分類器が、さらに本明細書に記載される。機械学習モデルを訓練することは、健康な対象または結腸細胞増殖性障害を有する対象を分類するのに有用な所定のタンパク質バイオマーカーのセット(「タンパク質パネル」または「シグネチャーパネル」)を備える分類器を提供する。一例では、組織学的重症度を評価するために大腸病変を有する対象に使用することができる血液ベースの最小侵襲性タンパク質アッセイのための方法が提供される。別の実施形態では、結腸細胞増殖性障害を示すタンパク質は、対象の無細胞試料、例えば、全血、血漿、または血清などの対象の体液試料中で検出される。したがって、本明細書で開示されるタンパク質は、結腸細胞増殖性障害の有無や、外科的切除、免疫療法、放射線療法、もしくは化学療法などの処置を必要とする高リスクの大腸病変または低リスクの大腸病変を区別するために、そして低リスクの大腸病変をモニタリングするために使用することができる。結腸細胞増殖性障害または病変の存在のモニタリングおよび確認は、例えば、結腸内視鏡検査、超音波、MM、またはCTスキャンによって行うことができる。
いくつかの例では、タンパク質特徴は、タンパク質プロファイルと対象群(例えば、患者群)との間の相関を見出すために、訓練されたアルゴリズム(例えば、機械学習モデルまたは分類器)への入力データセットとして使用される。そのような患者群の例としては、疾患または疾病の有無、疾患または疾病のリスクの上昇または非上昇、疾患または疾病のステージ、疾患または疾病のサブタイプ、処置に対する応答者対処置に対する非応答者、および進行者対非進行者が挙げられる。いくつかの例では、既知の疾病または特徴を有する対象の試料を比較するために、特性マトリックス(feature matrices)が生成される。いくつかの実施形態では、試料は、健康な対象または既知の適応症のいずれも有さない対象からのものと、癌を有することが知られている患者の試料である。
本明細書で使用されるとき、機械学習およびパターン認識に関連するため、「特徴(feature)」という用語は一般に、観察される現象の個々の測定可能な特性または特徴を指す。「特徴」の概念は、例えば、限定されないが、線形回帰およびロジスティック回帰などの統計的手法で使用される説明変数の概念と関連している。特徴は、数値またはカテゴリ(例えば、文字列やグラフなどの構造的特徴が構文パターン認識に用いられる)であり得る。
本明細書で使用されるとき、「入力特徴」(または「特徴」)という用語は一般に、試料の出力分類(ラベル)、例えば、条件、タンパク質同一性、タンパク質配列内容(例えば、変異)、提案されるデータ収集操作、または提案される処置を予測するために、訓練されたアルゴリズム(例えば、機械学習モデルまたは分類器)によって使用される変数を指す。変数の値は、試料のために決定され得、分類を決定するために使用され得る。
複数のアッセイについては、システムは、訓練されたアルゴリズム(例えば、機械学習モデルまたは分類器)に入力する特徴セットを同定する。システムは、各生体試料に対してアッセイを実施し、その測定値から特徴ベクトルを形成する。システムは、機械学習モデルへと特徴ベクトルを入力し、生物試料が特定の特性を有するかどうかの出力分類を取得する。
いくつかの実施形態では、機械学習モデルは、集団の対象または特徴の集団における対象または特徴の2つ以上の群もしくはクラスを区別することができる分類器を出力する。いくつかの実施形態では、分類器は訓練された機械学習分類器である。
いくつかの実施形態では、癌組織内のバイオマーカーの有益な遺伝子座または特徴は、プロファイルを形成するためにアッセイされる。受信者動作特性(ROC)曲線は、2つの集団(例えば、治療剤に応答する対象および応答しない対象)を区別する際に特定の特徴(例えば、本明細書に記載される任意のバイオマーカーおよび/または追加の生物医学的情報の任意の項目)の性能をプロットすることによって生成され得る。いくつかの実施形態では、集団全体(例えば、症例および対照)にわたる特徴データは、単一の特徴の値に基づいて昇順でソートされる。
様々な例では、特定の特性は、健康対癌、疾患のリスクの上昇対非上昇、疾患サブタイプ、疾患ステージ、進行対非進行、および応答者対非応答者からなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
A.データ解析
いくつかの例では、本開示は、ソフトウェアアプリケーション、コンピューティングハードウェア、またはその両方で実現されるデータ解析を有するシステム、方法、またはキットを提供する。いくつかの例では、解析アプリケーションまたはシステムは、少なくとも、データ受信モジュール、データ前処理モジュール、データ解析モジュール(これは、1つ以上のタイプのタンパク質データ上で動作することができる)、データ解釈モジュール、またはデータ可視化モジュールを含む。いくつかの実施形態では、データ受信モジュールは、実験室のハードウェアまたは器具類を実験室のデータを処理するコンピュータシステムに接続するコンピュータシステムを含む。いくつかの実施形態では、データ前処理モジュールは、解析に備えてデータに対する操作を行うハードウェアシステムまたはコンピュータソフトウェアを含む。前処理モジュールでデータに適用され得る操作の例としては、アフィン変換、ノイズ除去操作、データクリーニング、再フォーマット、またはサブサンプリングが挙げられる。データ解析モジュールは、1つ以上のゲノム材料からのゲノムデータの解析に特化され得、例えば、組み立てられたゲノム配列を取り込んで、確率的および統計的な解析を行うことで、疾患、病理、状態、リスク、条件、または表現型に関連する異常なパターンを特定することができる。データ解釈モジュールは、特定された異常パターンと健康状態、機能状態、予後、またはリスクとの間の関連性の理解を裏付けるために、例えば、統計学、数学、または生物学から得られた解析方法を使用することができる。データ可視化モジュールは、数学的モデリング、コンピュータグラフィックス、またはレンダリングの方法を使用して、結果の理解または解釈を容易にすることができるデータの視覚的表現を作成することができる。
いくつかの例では、本開示は、ソフトウェアアプリケーション、コンピューティングハードウェア、またはその両方で実現されるデータ解析を有するシステム、方法、またはキットを提供する。いくつかの例では、解析アプリケーションまたはシステムは、少なくとも、データ受信モジュール、データ前処理モジュール、データ解析モジュール(これは、1つ以上のタイプのタンパク質データ上で動作することができる)、データ解釈モジュール、またはデータ可視化モジュールを含む。いくつかの実施形態では、データ受信モジュールは、実験室のハードウェアまたは器具類を実験室のデータを処理するコンピュータシステムに接続するコンピュータシステムを含む。いくつかの実施形態では、データ前処理モジュールは、解析に備えてデータに対する操作を行うハードウェアシステムまたはコンピュータソフトウェアを含む。前処理モジュールでデータに適用され得る操作の例としては、アフィン変換、ノイズ除去操作、データクリーニング、再フォーマット、またはサブサンプリングが挙げられる。データ解析モジュールは、1つ以上のゲノム材料からのゲノムデータの解析に特化され得、例えば、組み立てられたゲノム配列を取り込んで、確率的および統計的な解析を行うことで、疾患、病理、状態、リスク、条件、または表現型に関連する異常なパターンを特定することができる。データ解釈モジュールは、特定された異常パターンと健康状態、機能状態、予後、またはリスクとの間の関連性の理解を裏付けるために、例えば、統計学、数学、または生物学から得られた解析方法を使用することができる。データ可視化モジュールは、数学的モデリング、コンピュータグラフィックス、またはレンダリングの方法を使用して、結果の理解または解釈を容易にすることができるデータの視覚的表現を作成することができる。
いくつかの例では、機械学習方法は、試料の集団中の試料を区別するために適用される。いくつかの実施形態では、機械学習方法は、健康な試料と進行性疾患(例えば、腺腫)の試料とを区別するために適用される。
いくつかの実施形態では、予測エンジンを訓練するために使用される1つ以上の機械学習動作は、一般化線形モデル、一般化加法モデル、ノンパラメトリック回帰演算、ランダムフォレスト分類器、空間回帰演算、ベイジアン回帰モデル、時系列分析、ベイジアンネットワーク、ガウスネットワーク、決定木学習演算、人工ニューラルネットワーク、リカレントニューラルネットワーク、強化学習演算、線形または非線形回帰演算、サポートベクターマシン、クラスタリング操作、および遺伝的アルゴリズム演算のうちの1つ以上を含む。
いくつかの例では、コンピュータ処理方法は、ロジスティック回帰、多重線形回帰(MLR)、次元削減、部分的最小二乗(PLS)回帰、主成分回帰、オートエンコーダ、変分オートエンコーダ、特異値分解、フーリエ基底、ウェーブレット、判別分析、サポートベクターマシン、決定木、分類木と回帰木(CART)、ツリーベースの方法、ランダムフォレスト、勾配ブーストツリー、ロジスティック回帰、行列分解、多次元スケーリング(MDS)、次元削減方法、t分布型確率的近傍埋め込み法(t-SNE)、多層パーセプトロン(MLP)、ネットワーククラスタリング、ニューロファジィ、および人工ニューラルネットワークからなる群から選択される。
いくつかの例では、本明細書に開示される方法は、対象からの、または複数の対象からの試料の核酸配列データに対する計算分析を含むことができる。
B.分類器生成
一態様では、本明細書に開示されるシステムおよび方法は、タンパク質を含有している生体試料からのタンパク質分析に由来した特徴情報に基づいて生成される分類器を提供する。分類器は、タンパク質などの生体試料で特定された特徴に基づいて、集団内の群を区別するための予測エンジンの一部を形成する。生体試料中のタンパク質情報の集合的表現は、タンパク質プロファイルと称され得る。
一態様では、本明細書に開示されるシステムおよび方法は、タンパク質を含有している生体試料からのタンパク質分析に由来した特徴情報に基づいて生成される分類器を提供する。分類器は、タンパク質などの生体試料で特定された特徴に基づいて、集団内の群を区別するための予測エンジンの一部を形成する。生体試料中のタンパク質情報の集合的表現は、タンパク質プロファイルと称され得る。
いくつかの実施形態では、分類器は、タンパク質情報の類似部分を統一されたフォーマットおよび統一されたスケールにフォーマットすることによりタンパク質情報を正規化すること、正規化されたタンパク質情報を列指向データベース(columnar database)に格納すること、格納された正規化されたタンパク質情報に1つ以上の機械学習操作を適用することにより予測エンジンを訓練することによって作成され、予測エンジンは、特定の集団について、1つ以上の特徴の組合せをマッピングして、少なくとも2つの分類グループを定義する。
いくつかの実施形態では、分類器は、タンパク質情報の類似部分を統一されたフォーマットおよび統一されたスケールにフォーマットすることによりタンパク質情報を正規化すること、正規化されたタンパク質情報を列指向データベース(columnar database)に格納すること、少なくとも2つの分類群を定義するために、格納された正規化されたタンパク質情報の特徴に1つ以上の機械学習操作を適用することにより予測エンジンを訓練することによって、作成される。
いくつかの実施形態では、予測エンジンは、正規化されたタンパク質特徴が得られ、かつ集団中の各対象と関連付けられる対象の集団に適用され、予測エンジンの出力は、グループと関連付けられる対象を特定し、対象を分類群に分類するために評価される。
特異度とは、本明細書で使用されるとき、一般に「疾患がない人々の中での陰性試験の確率」を指す。特異度は、陰性と試験された無病者の数を無病対象の総数で割ることによって計算され得る。
いくつかの例では、モデル、分類器、または予測試験は、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の特異度を有する。
感度は、本明細書で使用されるとき、一般に「疾患を有する人々の中での陽性試験の確率」を指す。感度は、陽性と試験された罹患者の数を罹患対象の総数で割ることによって計算され得る。
いくつかの例では、モデル、分類器、または予測試験は、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の感度を有する。
C.デジタル処理デバイス
いくつかの例では、デジタル処理デバイスまたはその使用が本明細書に記載される。いくつかの例では、デジタル処理デバイスは、デバイスの機能を実行する、1つ以上のハードウェア中央処理装置(CPU)、グラフィック処理ユニット(GPU)、またはテンソル処理ユニット(TPU)を含み得る。いくつかの例では、デジタル処理デバイスは、実行可能な命令を実行するように構成されたオペレーティングシステムを含み得る。
いくつかの例では、デジタル処理デバイスまたはその使用が本明細書に記載される。いくつかの例では、デジタル処理デバイスは、デバイスの機能を実行する、1つ以上のハードウェア中央処理装置(CPU)、グラフィック処理ユニット(GPU)、またはテンソル処理ユニット(TPU)を含み得る。いくつかの例では、デジタル処理デバイスは、実行可能な命令を実行するように構成されたオペレーティングシステムを含み得る。
いくつかの例では、デジタル処理デバイスは、任意選択でコンピュータネットワークに接続することができる。いくつかの例では、デジタル処理デバイスは、任意選択でインターネットに接続され得る。いくつかの例では、デジタル処理デバイスは、任意選択でクラウドコンピューティングインフラストラクチャに接続され得る。いくつかの例では、デジタル処理デバイスは、任意選択でイントラネットに接続され得る。いくつかの例では、デジタル処理デバイスは、任意選択でデータ記憶デバイスに接続され得る。
適切なデジタル処理デバイスの非限定的な例としては、サーバーコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、サブノートブックコンピュータ、ネットブックコンピュータ、ネットパッドコンピュータ、セットトップコンピュータ、ハンドヘルドコンピュータ、インターネットアプライアンス、モバイルスマートフォン、およびタブレットコンピュータが挙げられる。適切なタブレットコンピュータは、例えば、ブックレット、スレート、および転換可能な構成を含むことができる。
いくつかの例では、デジタル処理デバイスは、実行可能な命令を実行するように構成されたオペレーティングシステムを含むことができる。例えば、オペレーティングシステムは、デバイスのハードウェアを管理し、かつアプリケーションの実行のためのサービスを提供する、プログラムとデータを含むソフトウェアを含むことができる。オペレーティングシステムの非限定的な例としては、Ubuntu、FreeBSD、OpenBSD、NetBSD(登録商標)、Linux、Apple(登録商標)Mac OS X Server(登録商標)、Oracle(登録商標)Solaris(登録商標)、Windows Server(登録商標)、およびNovell(登録商標)NetWare(登録商標)が挙げられる。適切なパーソナルコンピュータオペレーティングシステムの非限定的な例としては、Microsoft(登録商標)Windows(登録商標)、Apple(登録商標)Mac OS X(登録商標)、UNIX(登録商標)、およびUNIXのようなオペレーティングシステム、例えば、GNU/Linux(登録商標)が挙げられる。いくつかの例では、オペレーティングシステムは、クラウドコンピューティングによって提供され得、クラウドコンピューティングリソースは、1つ以上のサービスプロバイダによって提供され得る。
いくつかの例では、デバイスは記憶デバイスおよび/またはメモリデバイスを含み得る。記憶デバイスおよび/またはメモリデバイスは、データまたはプログラムを一時的もしくは恒久的に記憶するために使用される1つ以上の物理的な装置であり得る。いくつかの例では、デバイスは揮発性メモリであり得、記憶した情報を維持するための電力を必要とし得る。いくつかの例では、デバイスは不揮発性メモリであり得、デジタル処理デバイスに電力が供給されないときに記憶した情報を保持し得る。いくつかの実施形態では、不揮発性メモリはフラッシュメモリを含むことができる。いくつかの例では、不揮発性メモリは、ダイナミックランダムアクセスメモリ(DRAM)を含むことができる。いくつかの例では、不揮発性メモリは、強誘電体ランダムアクセスメモリ(FRAM)を含むことができる。いくつかの例では、不揮発性メモリは、相変化ランダムアクセスメモリ(PRAM)を含むことができる。
いくつかの例では、デバイスは、例えば、CD-ROM、DVD、フラッシュメモリデバイス、磁気ディスクドライブ、磁気テープドライブ、光ディスクドライブ、およびクラウドコンピューティングベースの記憶域を含む、記憶デバイスであり得る。いくつかの例では、記憶デバイスおよび/またはメモリデバイスは、本明細書で開示されるようなデバイスの組合せであり得る。いくつかの例では、デジタル処理デバイスは、ユーザに視覚情報を送信するためのディスプレイを含むことができる。いくつかの例では、ディスプレイは陰極線管(CRT)であり得る。いくつかの例では、ディスプレイは液晶ディスプレイ(LCD)であり得る。いくつかの例では、ディスプレイは、薄膜トランジスタ液晶ディスプレイ(TFT-LCD)であり得る。いくつかの例では、ディスプレイは、有機発光ダイオード(OLED)ディスプレイであり得る。いくつかの例では、OLEDディスプレイは、パッシブマトリックスOLED(PMOLED)またはアクティブマトリックスOLED(AMOLED)のディスプレイであり得る。いくつかの例では、ディスプレイはプラズマディスプレイであり得る。いくつかの例では、ディスプレイはビデオプロジェクタであり得る。いくつかの例では、ディスプレイは本明細書で開示されるようなデバイスの組合せであり得る。
いくつかの例では、デジタル処理デバイスは、ユーザから情報を受け取るための入力デバイスを含むことができる。いくつかの例では、入力デバイスはキーボードであり得る。いくつかの例では、入力デバイスは、例えば、マウス、トラックボール、トラックパッド、ジョイスティック、ゲームコントローラ、またはスタイラスを含むポインティングデバイスであり得る。いくつかの例では、入力デバイスはタッチスクリーンまたはマルチタッチスクリーンであり得る。いくつかの例では、入力デバイスは、声または他の音声入力をキャプチャするマイクロホンであり得る。いくつかの例では、入力デバイスは、動きまたは視覚入力をキャプチャするビデオカメラであり得る。いくつかの例では、入力デバイスは、本明細書で開示されるようなデバイスの組合せであり得る。
D.非一時的なコンピュータ可読記憶媒体
いくつかの例では、本明細書で開示される主題は、任意選択でネットワーク接続されたデジタル処理デバイスのオペレーティングシステムによって実行可能な命令を含むプログラムで符号化された1つ以上の非一時的なコンピュータ可読記憶媒体を含むことができる。いくつかの例では、コンピュータ可読記憶媒体は、デジタル処理デバイスの有形の構成要素であり得る。いくつかの例では、コンピュータ可読記憶媒体は、デジタル処理デバイスから任意選択で取り外し可能であり得る。いくつかの例では、コンピュータ可読記憶媒体は、例えば、CD-ROM、DVD、フラッシュメモリデバイス、固体メモリ、磁気ディスクドライブ、磁気テープドライブ、光ディスクドライブ、クラウドコンピューティングシステム、およびサービスなどを含むことができる。いくつかの例では、プログラムおよび命令は、永続的に、ほぼ永続的に、半永続的に、または非一時的に、媒体上で符号化され得る。
いくつかの例では、本明細書で開示される主題は、任意選択でネットワーク接続されたデジタル処理デバイスのオペレーティングシステムによって実行可能な命令を含むプログラムで符号化された1つ以上の非一時的なコンピュータ可読記憶媒体を含むことができる。いくつかの例では、コンピュータ可読記憶媒体は、デジタル処理デバイスの有形の構成要素であり得る。いくつかの例では、コンピュータ可読記憶媒体は、デジタル処理デバイスから任意選択で取り外し可能であり得る。いくつかの例では、コンピュータ可読記憶媒体は、例えば、CD-ROM、DVD、フラッシュメモリデバイス、固体メモリ、磁気ディスクドライブ、磁気テープドライブ、光ディスクドライブ、クラウドコンピューティングシステム、およびサービスなどを含むことができる。いくつかの例では、プログラムおよび命令は、永続的に、ほぼ永続的に、半永続的に、または非一時的に、媒体上で符号化され得る。
E.コンピュータシステム
本開示は、本明細書に記載される方法を実装するようにプログラムされたコンピュータシステムを提供する。図1は、患者データ、生物学的データ、生物学的配列、参照配列、およびタンパク質プロファイルを記憶、処理、同定、または解釈するようにプログラムされるか、またはその他の方法で構成されるコンピュータシステム(101)を示す。コンピュータシステム(101)は、本開示の患者データ、生物学的データ、生物学的配列、参照配列、およびタンパク質プロファイルの様々な態様を処理することができる。コンピュータシステム(101)は、ユーザの電子デバイスまたは電子デバイスに対して遠隔に位置付けられるコンピュータシステムであり得る。電子デバイスはモバイル電子デバイスであり得る。
本開示は、本明細書に記載される方法を実装するようにプログラムされたコンピュータシステムを提供する。図1は、患者データ、生物学的データ、生物学的配列、参照配列、およびタンパク質プロファイルを記憶、処理、同定、または解釈するようにプログラムされるか、またはその他の方法で構成されるコンピュータシステム(101)を示す。コンピュータシステム(101)は、本開示の患者データ、生物学的データ、生物学的配列、参照配列、およびタンパク質プロファイルの様々な態様を処理することができる。コンピュータシステム(101)は、ユーザの電子デバイスまたは電子デバイスに対して遠隔に位置付けられるコンピュータシステムであり得る。電子デバイスはモバイル電子デバイスであり得る。
コンピュータシステム(101)は、中央処理装置(CPU、本明細書では「プロセッサ」および「コンピュータプロセッサ」とも称される)(105)を含み、これは、シングルコアまたはマルチコアのプロセッサ、あるいは並行処理のための複数のプロセッサであり得る。コンピュータシステム(101)は、メモリまたはメモリ位置(110)(例えば、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ)、電子記憶装置(115)(例えば、ハードディスク)、1つ以上の他のシステムと通信するための通信インターフェース(120)(例えば、ネットワークアダプタ)、ならびに周辺機器(125)、例えば、キャッシュ、他のメモリ、データ記憶装置、および/もしくは電子ディスプレイアダプタも含む。メモリ(110)、記憶装置(115)、インターフェース(120)、および周辺機器(125)は、マザーボードなどの通信バス(実線)を通じて、CPU(105)と通信する。記憶装置(115)は、データを記憶するためのデータ記憶装置(またはデータレポジトリ)であり得る。コンピュータシステム(101)は、通信インターフェース(120)の支援によってコンピュータネットワーク(「ネットワーク」)(130)に動作可能に接続され得る。ネットワーク(130)は、インターネット、インターネットおよび/またはエクストラネット、あるいはインターネットと通信状態にあるイントラネットおよび/またはエクストラネットであり得る。ネットワーク(130)は、いくつかの例では、電気通信および/またはデータネットワークである。ネットワーク(130)は1つ以上のコンピュータサーバを含むことができ、このコンピュータサーバは、クラウドコンピューティングなどの分散コンピューティングを可能にし得る。ネットワーク(130)は、いくつかの例では、コンピュータシステム(101)の支援により、ピアツーピアネットワークを実装することができ、これにより、コンピュータシステム(101)に連結されたデバイスが、クライアントまたはサーバとして動くことを可能にし得る。
CPU(105)は、プログラムまたはソフトウェアで具現化され得る一連の機械可読命令を実行することができる。この命令は、メモリ(110)などのメモリ位置に記憶され得る。この命令は、CPU(105)に向けられてもよく、これはその後、本開示の方法を実装するようにCPU(105)をプログラムするか、またはその他の方法で構成することできる。CPU(105)により実行される動作の例としては、フェッチ、デコード、実行、およびライトバックが挙げられる。
CPU(105)は、集積回路など回路の一部であり得る。システム(101)の1つ以上の他の構成要素が、回路に含まれ得る。いくつかの例では、回路は特定用途向け集積回路(ASIC)である。
記憶装置(115)は、ドライバ、ライブラリ、およびセーブされたプログラムなどのファイルを保持することができる。記憶装置(115)は、ユーザデータ、例えば、ユーザの個別設定およびユーザのプログラムを保持することができる。コンピュータシステム(101)は、いくつかの例では、イントラネットまたはインターネットを介してコンピュータシステム(101)と通信状態にあるリモートサーバ上に位置付けられるなどした、コンピュータシステム(101)の外部にある1つ以上の追加のデータ記憶装置を含むことができる。
コンピュータシステム(101)は、ネットワーク(130)を介して1つ以上のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム(101)は、ユーザのリモートコンピュータシステムと通信できる。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、持ち運び可能なPC)、スレートまたはタブレットPC(例えば、Apple(登録商標)iPad、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone、Android対応デバイス、Blackberry(登録商標))、または携帯情報端末が挙げられる。ユーザは、ネットワーク(130)を介してコンピュータシステム(101)にアクセスすることができる。
本明細書に記載されるような方法は、例えば、メモリ(110)または電子記憶装置(115)上などの、コンピュータシステム(101)の電子メモリ位置に記憶された機械(例えば、コンピュータプロセッサ)実行可能コードによって実装可能であり得る。機械実行可能コードまたは機械可読コードは、ソフトウェアの形態で提供され得る。使用中、コードはプロセッサ(105)により実行され得る。いくつかの例では、コードは、記憶装置(115)から検索され、プロセッサ(105)による容易なアクセスのためにメモリ(110)上に記憶され得る。いくつかの例では、電子記憶装置(115)は除外されてもよく、機械実行可能命令がメモリ(110)に記憶される。
コードは、コードを実行するのに適したプロセッサを有する機械で使用されるようにあらかじめコンパイルされかつ構成され得るか、または、実行時間中に解釈もしくはコンパイルされ得る。コードは、あらかじめコンパイルされた、解釈された、またはアズコンパイルされた(as-compiled)様式でコードを実行できるように選択され得る、プログラミング言語で供給され得る。
コンピュータシステム(101)などの本明細書で提供されるシステムおよび方法の態様は、プログラミングの際に具現化され得る。この技術の様々な態様は、典型的に一種の機械可読媒体上で運ばれるまたはそれに具現化される機械(またはプロセッサ)実行可能コードおよび/または関連データの形で、「製品」または「製造用品」として考慮され得る。機械実行可能コードは、メモリ(例えば、読み取り専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に記憶され得る。「記憶装置」型の媒体は、様々な半導体メモリ、テープドライブ、ディスクドライブなどの、コンピュータやプロセッサの有形メモリ、あるいはその関連するモジュールのいずれかまたは全てを含むことができ、これらは、ソフトウェアのプログラミングのためにいかなる時も非一時的な記録媒体を提供し得る。ソフトウェアの全てまたは一部は、時にインターネットまたは様々な他の電気通信ネットワークを介して通信される。そのような通信は、例えば、あるコンピュータまたはプロセッサから別のコンピュータまたはプロセッサへの、例えば、管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへの、ソフトウェアのローディングを可能にし得る。そのように、ソフトウェア要素を受け渡す別のタイプの媒体は、有線および光地上通信のネットワークおよび様々なエアリンクを介した、ローカル装置間の物理インターフェースにわたって使用されるものなどの、光波、電波、および電磁波を含む。有線または無線リンク、光リンクなどの、そのような波を運ぶ物理要素も、ソフトウェアを受け渡す媒体と考えてよい。本明細書で使用されるとき、非一時的で有形の「記憶装置」媒体に制限されない限り、コンピュータまたは機械「可読媒体」などの用語は一般に、実行のためにプロセッサに命令を提供することに関与する媒体を指す。
したがって、コンピュータ実行可能コードなどの機械可読媒体は、有形記憶媒体、キャリア波媒体、または物理送信媒体を含むがこれらに限定されない多くの形態をとってもよい。不揮発性記憶媒体には、例えば、本明細書に記載されるデータベースを実装するために使用され得るような、あらゆるコンピュータなどにおける記憶デバイスのいずれかといった、例えば、光学ディスクまたは磁気ディスクが含まれる。揮発性記憶媒体には、ダイナミックメモリ、例えば、本明細書に記載されるコンピュータプラットフォームのメインメモリが含まれる。有形送信媒体は、同軸ケーブル、コンピュータシステム内のバスを含むワイヤを含む、銅線および光ファイバーを含んでいる。搬送波送信媒体は、無線周波(RF)および赤外線(IR)データ通信中に生成されたものなどの、電気信号または電磁気信号、あるいは音波または光波の形態をとり得る。それゆえ、コンピュータ可読媒体の共通の形態としては、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、他の光学媒体、パンチカード、紙テープ、穴のパターンを有する他の物理的な記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、他のメモリチップもしくはカートリッジ、データもしくは命令を運ぶ搬送波、そのような搬送波を伝達するケーブルもしくはリンク、またはコンピュータがプログラミングのコードおよび/またはデータを読み取り得る他の媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、実行のためにプロセッサに1つ以上の命令の1つ以上のシーケンスを運ぶことに関与し得る。
コンピュータシステム(101)は、例えば、核酸配列、濃縮核酸試料データ、タンパク質プロファイル、発現プロファイル、およびRNA発現プロファイルの分析を提供するためのユーザインターフェース(UI)(140)を含む電子ディスプレイ(135)を含むか、またはそれと通信することができる。UIの例は、限定されないが、グラフィカルユーザインターフェース(GUI)およびウェブベースのユーザインターフェースを含む。
本開示の方法およびシステムは、1つ以上のアルゴリズムによって実装され得る。アルゴリズムは、中央処理装置(105)による実行の後にソフトウェアによって実装され得る。アルゴリズムは、例えば、患者データ、生物学的データ、生物学的配列、参照配列、およびタンパク質プロファイルを記憶、処理、同定、または解釈することができる。
いくつかの例では、本明細書に開示される主題は、少なくとも1つのコンピュータプログラムまたはその使用を含むことができる。コンピュータプログラムは、指定されたタスクを実施するために書かれた、デジタル処理デバイスのCPU、GPU、またはTPUにおいて実行可能な一連の命令である可能性がある。コンピュータ可読命令は、特定のタスクを行うか、または特定の抽出データタイプを実装する、機能、オブジェクト、アプリケーションプログラミングインターフェース(API)、データ構造などのプログラムモジュールとして実装され得る。本明細書に提供される開示に照らして、コンピュータプログラムは様々な言語の様々なバージョンで書かれ得る。
コンピュータ可読命令の機能性は、様々な環境において必要に応じて組み合わせられ、または分配されてもよい。いくつかの例では、コンピュータプログラムは命令の1つのシーケンスを含むことができる。いくつかの例では、コンピュータプログラムは命令の複数のシーケンスを含むことができる。いくつかの例では、コンピュータプログラムは1つの位置から提供され得る。いくつかの例では、コンピュータプログラムは複数の位置から提供され得る。いくつかの例では、コンピュータプログラムは、1つ以上のソフトウェアモジュールを含むことができる。いくつかの例では、コンピュータプログラムは、部分的にまたは全体的に、1つ以上のウェブアプリケーション、1つ以上のモバイルアプリケーション、1つ以上のスタンドアロンアプリケーション、1つ以上のウェブブラウザプラグイン、拡張、アドイン、またはアドオン、あるいはそれらの組合せを含むことができる。
いくつかの例では、コンピュータ処理は、統計学、数学、生物学、またはそれらのあらゆる組合せの方法であり得る。いくつかの例では、コンピュータ処理方法は、例えば、ロジスティック回帰、次元削減、主成分分析、オートエンコーダ、特異値分解、フーリエ基底、特異値分解、ウェーブレット、判別分析、サポートベクターマシン、ツリーベースの方法、ランダムフォレスト、勾配ブーストツリー、ロジスティック回帰、行列分解、ネットワーククラスタリング、およびニューラルネットワークを含む次元削減方法を含む。
いくつかの例では、コンピュータ処理方法は、例えば、回帰、サポートベクターマシン、ツリーベースの方法、およびネットワークを含む、教師あり機械学習法である。
いくつかの例では、コンピュータ処理方法は、例えば、クラスタリング、ネットワーク、主成分分析、および行列分解を含む教師なし機械学習法である。
F.データベース
いくつかの例では、本明細書に開示される主題は、患者データ、生物学的データ、生物学的配列、参照配列、もしくはタンパク質プロファイルを記憶するための1つ以上のデータベース、またはその使用を含むことができる。参照配列はデータベースから抽出され得る。本明細書に提供される開示を考慮すると、多くのデータベースが、配列情報の保持および検索に好適であり得る。いくつかの例では、好適なデータベースは、例えば、リレーショナルデータベース、非リレーショナルデータベース、オブジェクト指向データベース、オブジェクトデータベース、実体関連モデルデータベース、連想データベース、およびXMLデータベースを含むことができる。いくつかの例では、データベースはインターネットベースであり得る。いくつかの例では、データベースはウェブベースであり得る。いくつかの例では、データベースはクラウドコンピューティングベースであり得る。いくつかの例では、データベースは1つ以上のローカルコンピュータ記憶デバイスに基づき得る。
いくつかの例では、本明細書に開示される主題は、患者データ、生物学的データ、生物学的配列、参照配列、もしくはタンパク質プロファイルを記憶するための1つ以上のデータベース、またはその使用を含むことができる。参照配列はデータベースから抽出され得る。本明細書に提供される開示を考慮すると、多くのデータベースが、配列情報の保持および検索に好適であり得る。いくつかの例では、好適なデータベースは、例えば、リレーショナルデータベース、非リレーショナルデータベース、オブジェクト指向データベース、オブジェクトデータベース、実体関連モデルデータベース、連想データベース、およびXMLデータベースを含むことができる。いくつかの例では、データベースはインターネットベースであり得る。いくつかの例では、データベースはウェブベースであり得る。いくつかの例では、データベースはクラウドコンピューティングベースであり得る。いくつかの例では、データベースは1つ以上のローカルコンピュータ記憶デバイスに基づき得る。
一態様では、本開示は、本明細書に開示される方法を実行するようにプロセッサに指示する命令を備える、非一時的なコンピュータ可読媒体を提供する。
一態様では、本開示は、コンピュータ可読媒体を含むコンピューティングデバイスを提供する。
別の態様では、本開示は、生体試料の分類を実施するためのシステムであって、
a)複数の訓練試料を受信する受信機であって、複数の訓練試料のそれぞれが複数の分子クラスを有し、複数の訓練試料のそれぞれが1つ以上の既知のラベルを含む、受信機と、
b)複数の訓練試料のそれぞれについて機械学習モデルを使用してコンピュータ処理されるように動作可能であるアッセイに対応する特徴のセットを識別する特徴モジュールであって、ここで、複数の訓練試料のそれぞれについて、特徴のセットは、複数の訓練試料中の分子の特性に対応し、ここで、上記システムは、訓練試料中の分子の複数のクラスを複数の異なるアッセイに供して測定値のセットを取得するように動作可能であり、ここで、測定値の各セットは、訓練試料中の分子のクラスに適用される1つのアッセイからであり、複数の測定値のセットは、上記複数の訓練試料について得られる、特徴モジュールと、
c)測定値のセットを分析して訓練試料についての訓練ベクトルを取得するための分析モジュールであって、訓練ベクトルは、対応するアッセイのNセットの特徴の特徴値を含み、各特徴値は、特徴に対応し、1つ以上の測定値を含み、訓練ベクトルは、複数の異なるアッセイの第1のサブセットに対応する特徴のN個のセットのうちの少なくとも2つからの少なくとも1つの特徴を使用して形成される、分析モジュールと、
d)複数の訓練試料の出力ラベルを取得するために機械学習モデルのパラメータを使用して訓練ベクトルについてシステムに通知するラベリングモジュールと、
e)出力ラベルを訓練試料の既知のラベルと比較する比較モジュールと、
f)出力ラベルと訓練試料の既知のラベルとの比較に基づいて、機械学習モデルの訓練の一部としてパラメータの最適値を反復的に探索する訓練モジュールと、
g)機械学習モデルのパラメータおよび機械学習モデルの特徴のセットを提供する出力モジュールと
を含むシステムを提供する。
a)複数の訓練試料を受信する受信機であって、複数の訓練試料のそれぞれが複数の分子クラスを有し、複数の訓練試料のそれぞれが1つ以上の既知のラベルを含む、受信機と、
b)複数の訓練試料のそれぞれについて機械学習モデルを使用してコンピュータ処理されるように動作可能であるアッセイに対応する特徴のセットを識別する特徴モジュールであって、ここで、複数の訓練試料のそれぞれについて、特徴のセットは、複数の訓練試料中の分子の特性に対応し、ここで、上記システムは、訓練試料中の分子の複数のクラスを複数の異なるアッセイに供して測定値のセットを取得するように動作可能であり、ここで、測定値の各セットは、訓練試料中の分子のクラスに適用される1つのアッセイからであり、複数の測定値のセットは、上記複数の訓練試料について得られる、特徴モジュールと、
c)測定値のセットを分析して訓練試料についての訓練ベクトルを取得するための分析モジュールであって、訓練ベクトルは、対応するアッセイのNセットの特徴の特徴値を含み、各特徴値は、特徴に対応し、1つ以上の測定値を含み、訓練ベクトルは、複数の異なるアッセイの第1のサブセットに対応する特徴のN個のセットのうちの少なくとも2つからの少なくとも1つの特徴を使用して形成される、分析モジュールと、
d)複数の訓練試料の出力ラベルを取得するために機械学習モデルのパラメータを使用して訓練ベクトルについてシステムに通知するラベリングモジュールと、
e)出力ラベルを訓練試料の既知のラベルと比較する比較モジュールと、
f)出力ラベルと訓練試料の既知のラベルとの比較に基づいて、機械学習モデルの訓練の一部としてパラメータの最適値を反復的に探索する訓練モジュールと、
g)機械学習モデルのパラメータおよび機械学習モデルの特徴のセットを提供する出力モジュールと
を含むシステムを提供する。
集団中の対象を分類する方法
開示される方法は、対象において発現されるタンパク質の分析を介して結腸細胞増殖性障害に関連するタンパク質発現のパラメータを確認することを対象とする。方法は、結腸細胞増殖性障害の、より具体的には、上記障害のステージまたはサブクラスおよび上記障害に対する遺伝的素因の特定、およびそれらの識別の改善を可能にすることによって改善された診断、処置、およびモニタリングにおいて使用するためのものである。
開示される方法は、対象において発現されるタンパク質の分析を介して結腸細胞増殖性障害に関連するタンパク質発現のパラメータを確認することを対象とする。方法は、結腸細胞増殖性障害の、より具体的には、上記障害のステージまたはサブクラスおよび上記障害に対する遺伝的素因の特定、およびそれらの識別の改善を可能にすることによって改善された診断、処置、およびモニタリングにおいて使用するためのものである。
いくつかの実施形態では、方法は、集団中の対象の生体試料におけるタンパク質の差次的な発現を分析する工程を含む。
本開示は、無細胞試料に適用され得る結腸細胞増殖性障害を検出するための方法、例えば、結腸細胞増殖性障害を有する対象と有していない対象との間、または異なる結腸細胞増殖性障害間のタンパク質の存在および特徴を検出するための方法を提供する。この方法は、結腸細胞増殖性障害を有してない健康な対象と比較して、結腸細胞増殖性障害の基本的な「陽性」または「陰性」シグナルとしてのタンパク質の検出を利用する。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
一態様では、本開示は、対象のタンパク質を含有している生体試料のタンパク質プロファイルを決定する方法であって、
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、対象のタンパク質プロファイルを提供する、測定する工程と
を含む方法を提供する。
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、対象のタンパク質プロファイルを提供する、測定する工程と
を含む方法を提供する。
いくつかの実施形態では、タンパク質プロファイルは、結腸細胞増殖性障害と関連し、結腸細胞増殖性障害を有する対象の分類を提供する。
いくつかの実施形態では、対象の生体試料は、体液、便、結腸排出物、尿、血漿、血清、全血、単離された血液細胞、血液から単離された細胞、およびそれらの組合せからなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、ステージ1の大腸癌、ステージ2の大腸癌、ステージ3の大腸癌、およびステージ4の大腸癌からなる群から選択される。
いくつかの実施形態では、進行性腺腫は、管状腺腫、管状絨毛腺腫、絨毛腺腫、腺癌、または過形成性ポリープである。
別の態様では、本開示は、対象中の結腸細胞増殖性障害を検出する方法であって、
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、対象のタンパク質プロファイルを提供する、測定する工程と、
c)結腸細胞増殖性障害の有無に関連した出力値を提供するために、タンパク質プロファイルを、健康な対象と結腸細胞増殖性障害を有する対象とを区別できるように訓練された機械学習モデルへとコンピュータ処理する工程であって、これにより対象中の結腸細胞増殖性障害の有無を示す、コンピュータ処理する工程と
を含む方法を提供する。
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、対象のタンパク質プロファイルを提供する、測定する工程と、
c)結腸細胞増殖性障害の有無に関連した出力値を提供するために、タンパク質プロファイルを、健康な対象と結腸細胞増殖性障害を有する対象とを区別できるように訓練された機械学習モデルへとコンピュータ処理する工程であって、これにより対象中の結腸細胞増殖性障害の有無を示す、コンピュータ処理する工程と
を含む方法を提供する。
いくつかの実施形態では、対象の生体試料は、体液、便、結腸排出物、尿、血漿、血清、全血、単離された血液細胞、血液から単離された細胞、およびそれらの組合せからなる群から選択される。
別の態様では、試料中のタンパク質プロファイルを生成するために、タンパク質を検出する方法が本明細書に開示され、上記方法は、
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、生体試料のタンパク質プロファイルを提供する、測定する工程と
を含む。
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、生体試料のタンパク質プロファイルを提供する、測定する工程と
を含む。
別の態様では、少なくとも6つのタンパク質を検出する工程、また、必要に応じて、試料中の上記少なくとも6つのタンパク質のレベルを決定する工程を含む、対象の生体試料中のデータを得る方法が本明細書に開示され、上記少なくとも6つのタンパク質は、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、ステージ1の大腸癌、ステージ2の大腸癌、ステージ3の大腸癌、およびステージ4の大腸癌からなる群から選択される。
別の態様では、本開示は、対象のタンパク質プロファイルを提供するために、
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、これにより対象のタンパク質プロファイルを決定する、測定する工程と
を含む対象からのタンパク質を含有している生体試料のタンパク質プロファイルを決定する方法を提供する。
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、これにより対象のタンパク質プロファイルを決定する、測定する工程と
を含む対象からのタンパク質を含有している生体試料のタンパク質プロファイルを決定する方法を提供する。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、HGFR、THBS2、CA125(MUC-16)、CA19-9、CA15-3(MUC-1)、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは総PSAを含む。
別の態様では、本開示は、対象中の結腸細胞増殖性障害を検出する方法であって、
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、対象のタンパク質プロファイルを提供する、測定する工程と、
c)結腸細胞増殖性障害を有していない対象と結腸細胞増殖性障害を有する対象とを区別するように訓練された機械学習モデルへと対象のタンパク質プロファイルをコンピュータ処理する工程と、
d)タンパク質プロファイルに基づいて、機械学習モデルにより結腸細胞増殖性障害を有する対象に関連する値を出力する工程であって、これにより対象中の結腸細胞増殖性障害を検出する、出力する工程と
を含む対象中の結腸細胞増殖性障害を検出する方法を提供する。
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、対象のタンパク質プロファイルを提供する、測定する工程と、
c)結腸細胞増殖性障害を有していない対象と結腸細胞増殖性障害を有する対象とを区別するように訓練された機械学習モデルへと対象のタンパク質プロファイルをコンピュータ処理する工程と、
d)タンパク質プロファイルに基づいて、機械学習モデルにより結腸細胞増殖性障害を有する対象に関連する値を出力する工程であって、これにより対象中の結腸細胞増殖性障害を検出する、出力する工程と
を含む対象中の結腸細胞増殖性障害を検出する方法を提供する。
別の態様では、本開示は、疾患について以前に処置された対象において微小残存病変をモニタリングするための方法であって、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択されるタンパク質の予め定められたパネルを使用する対象の生体試料のタンパク質プロファイルを決定する工程であって、これによりベースラインのタンパク質状態を生成する、決定する工程と、ベースラインタンパク質状態の生成後の1つ以上の時点で対象の生体試料のタンパク質プロファイルを決定する工程であって、これにより現在のタンパク質状態を生成し、ベースラインタンパク質状態と現在のタンパク質状態との間の変化は、対象における微小残存病変の変化を示す、決定する工程とを含む、方法を提供する。
いくつかの実施形態では、微小残存病変は、処置に対する応答、腫瘍負荷、術後残存腫瘍、再発、二次スクリーニング、一次スクリーニング、および癌進行からなる群から選択される。
本明細書に記載される訓練された機械学習方法、モデル、および識別分類器は、癌検出、診断、および処置応答性を含む、種々の医療用途に適用され得る。モデルは、対象メタデータおよび分析物由来の特徴を用いて訓練され得るため、適用は、集団内の対象を層別化し、それに応じて処置決定を導くように調整され得る。
診断
本明細書に提供される方法およびシステムは、癌(例えば、大腸癌)を有する対象の診断の出力を生成するために、人工知能ベースのアプローチを使用して予測分析を実施して、対象(患者)から取得されたデータを分析し得る。例えば、癌を有する対象の診断を生成するために、アプリケーションは取得したデータに予測アルゴリズムを適用してもよい。予測アルゴリズムは、癌を有する対象の診断を生成するために取得したデータを処理するよう構成された、機械学習ベースの予測器などの人工知能ベースの予測器を含み得る。
本明細書に提供される方法およびシステムは、癌(例えば、大腸癌)を有する対象の診断の出力を生成するために、人工知能ベースのアプローチを使用して予測分析を実施して、対象(患者)から取得されたデータを分析し得る。例えば、癌を有する対象の診断を生成するために、アプリケーションは取得したデータに予測アルゴリズムを適用してもよい。予測アルゴリズムは、癌を有する対象の診断を生成するために取得したデータを処理するよう構成された、機械学習ベースの予測器などの人工知能ベースの予測器を含み得る。
機械学習予測器は、データセット、例えば、本明細書に記載されるシグネチャーパネルを使用して、癌を有する患者のコホートの1つ以上のセットからの対象の生体試料に対してタンパク質アッセイを実施することによって生成されるデータセットを機械学習予測器への入力として、および対象の既知の診断(例えば、ステージングおよび/または腫瘍分画)結果を出力として使用して訓練され得る。
訓練データセット(例えば、対象の生体試料に対して本明細書に記載されるシグネチャーパネルを使用するアッセイを実施することによって生成されるデータセット)は、例えば、共通の特徴(特徴)および結果(ラベル)を有する対象の1つ以上のセットから生成されてもよい。訓練データセットは診断に関する特徴に対応する特徴のセットおよびラベルを含み得る。特徴は、例えば、健康な対象および罹患対象の生体試料中の1つ以上のタンパク質の存在または特徴などのタンパク質アッセイ測定値の特定の範囲またはカテゴリといった特徴を含み得る。例えば、所与の時点において所与の対象から収集された特徴のセットは、所与の時点における対象の同定された癌を示し得る診断シグネチャーとして集合的に役立ち得る。また、特徴は、例えば1つ以上の癌についての対象の診断結果を示すラベルを含み得る。
ラベルは、例えば、対象の既知の診断(例えば、ステージングおよび/または腫瘍分画)結果などの結果を含んでもよい。結果は、対象中の癌に関連した特徴を含んでもよい。例えば、特徴は1つ以上の癌を有する対象を示し得る。
訓練セット(例えば、訓練データセット)は、対象の1つ以上のセット(例えば、1つ以上の癌を有するまたは有していな患者の遡及的および/または前向きコホート)に対応するデータのセットの無作為抽出によって選択されてもよい。あるいは、訓練セット(例えば、訓練データセット)は、対象の1つ以上のセット(例えば、1つ以上の癌を有するまたは有していな患者の遡及的および/または前向きコホート)に対応するデータのセットの比例抽出によって選択されてもよい。訓練セットは、対象(例えば、様々な臨床現場または治験の患者)の1つ以上のセットに対応するデータのセットにわたって平衡を保たれ得る。機械学習予測器は、診断精度の尺度に対応する最小の所望の値を有するなど、精度または性能に関する特定の所定条件が満たされるまで訓練され得る。例えば、診断精度の尺度は、対象中の1つ以上の癌の診断、ステージング、または腫瘍分画の予測に対応し得る。
診断精度の尺度の例としては、感度、特異度、陽性予測値(PPV)、陰性予測値(NPV)、精度、および癌(例えば、大腸癌)を検出または予測する診断精度に対応する受信者動作特性(ROC)曲線の曲線下面積(AUC)が挙げられ得る。
一態様では、本開示は、対象の集団を区別することができる分類器の使用方法であって、
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、これにより対象のタンパク質プロファイルを提供する、測定する工程と、
c)2つ以上の集団中で区別するように訓練された機械学習モデルへと対象のタンパク質プロファイルをコンピュータ処理する工程と、
d)タンパク質プロファイルに基づいて、機械学習モデルにより集団と関連する値を出力する工程であって、これにより対象の集団を区別する、出力する工程と
を含む、方法を提供する。
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、これにより対象のタンパク質プロファイルを提供する、測定する工程と、
c)2つ以上の集団中で区別するように訓練された機械学習モデルへと対象のタンパク質プロファイルをコンピュータ処理する工程と、
d)タンパク質プロファイルに基づいて、機械学習モデルにより集団と関連する値を出力する工程であって、これにより対象の集団を区別する、出力する工程と
を含む、方法を提供する。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、HGFR、THBS2、CA125(MUC-16)、CA19-9、CA15-3(MUC-1)、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは総PSAを含む。
別の態様では、本開示は、対象中の癌を同定する方法であって、
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、これにより対象のタンパク質プロファイルを提供する、測定する工程と、
c)結腸細胞増殖性障害の有無に関連した出力値を提供するために、タンパク質プロファイルを、健康な対象と結腸細胞増殖性障害を有する対象とを区別できるように訓練された機械学習モデルへとコンピュータ処理する工程であって、これにより対象中の結腸細胞増殖性障害の有無を示して上記対象が上記癌を有する可能性を生成する、コンピュータ処理する工程と
を含む方法を提供する。
a)対象からタンパク質を含有している生体試料を得る工程と、
b)生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質の予め定められたパネルの存在および量を測定する工程であって、これにより対象のタンパク質プロファイルを提供する、測定する工程と、
c)結腸細胞増殖性障害の有無に関連した出力値を提供するために、タンパク質プロファイルを、健康な対象と結腸細胞増殖性障害を有する対象とを区別できるように訓練された機械学習モデルへとコンピュータ処理する工程であって、これにより対象中の結腸細胞増殖性障害の有無を示して上記対象が上記癌を有する可能性を生成する、コンピュータ処理する工程と
を含む方法を提供する。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、またはそれらのあらゆる組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは、FLT3L、CEACAM5、IL-6、IL-8、MIP-3a、IL-1RT2、TNC、HGFR、THBS2、CA125(MUC-16)、CA19-9、CA15-3(MUC-1)、またはそれらの組合せを含む。
いくつかの実施形態では、パネルは総PSAを含む。
発現の閾値またはカットオフレベルを確立するための様々な統計的および数学的方法が使用され得る。特定のバイオマーカーについての閾値またはカットオフ発現レベルは、例えば、本明細書に開示される実施例および図面に記載されるように、受信者動作特性(ROC)プロットからのデータに基づいて選択され得る。当業者は、これらの閾値またはカットオフ発現レベルを、例えば、特定のバイオマーカーまたはその組合せについてのROCプロットに沿って移動することによって変化させて、感度または特異度について異なる値を得ることができ、それによって全体的なアッセイ性能に影響を及ぼすことを理解するであろう。例えば、目的が臨床的観点からロバストな診断方法を有することである場合、高い感度が優先されるべきである。しかしながら、目的が費用対効果の高い方法を有することである場合には、高い特異度が優先されるべきである。最良のカットオフは、最良の感度および特異度を生じる特定のバイオマーカーについてのROCプロットから得られる値を指す。感度および特異度の値は、閾値(カットオフ)の範囲にわたって計算される。したがって、閾値またはカットオフ値は、アッセイされた患者集団の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、または少なくとも80%において、感度および/または特異度が少なくとも約50%であるように選択することができ、また、例えば、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも100%であり得る。
したがって、本開示のいくつかの実施形態は、診断またはスクリーニングされる対象の単離された最小侵襲性の試料中の少なくとも先に引用されたタンパク質の存在および/またはレベル決定すること、ならびにタンパク質の存在および/またはレベルを予め定められた閾値あるいはカットオフ値と比較することにより実行され、予め定められた閾値あるいはカットオフ値は、大腸癌または大腸腺腫に罹患するリスクがある患者集団において決定されたタンパク質の発現レベルに基づいて計算されたROC曲線における所望の感度での最も高い特異度と相関する上記タンパク質の発現レベルに対応し、上記予め定められたカットオフ値に対する上記タンパク質の少なくとも1つの過剰発現は、大腸癌または大腸腺腫に罹患している対象を上記所望の感度で示す。
別の例として、そのような所定の条件は、結腸細胞増殖性障害を予測する特異度が、例えば、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の値を含むことであり得る。
別の例として、そのような所定の条件は、結腸細胞増殖性障害を予測する陽性的中率(PPV)が、例えば、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の値を含むことであり得る。
別の例として、そのような所定の条件は、結腸細胞増殖性障害を予測する陰性的中率(NPV)が、例えば、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の値を含むことであり得る。
別の例として、そのような所定の条件は、結腸細胞増殖性障害を予測する受信者動作特性(ROC)の曲線下面積(AUC)が、少なくとも約0.50、少なくとも約0.55、少なくとも約0.60、少なくとも約0.65、少なくとも約0.70、少なくとも約0.75、少なくとも約0.80、少なくとも約0.85、少なくとも約0.90、少なくとも約0.95、少なくとも約0.96、少なくとも約0.97、少なくとも約0.98、または少なくとも約0.99の値を含むことであり得る。
大腸癌のモニタリング
データセットを処理するために訓練されたアルゴリズムを使用した後、大腸癌は対象において同定またはモニタリングされることがある。同定は、大腸癌関連タンパク質のパネルのデータセットのタンパク質の定量的尺度に少なくとも部分的に基づき得る。例えば、モニタリングは、それぞれのまたは2つ以上の異なる時点で対象の大腸癌を評価することを含み得る。
データセットを処理するために訓練されたアルゴリズムを使用した後、大腸癌は対象において同定またはモニタリングされることがある。同定は、大腸癌関連タンパク質のパネルのデータセットのタンパク質の定量的尺度に少なくとも部分的に基づき得る。例えば、モニタリングは、それぞれのまたは2つ以上の異なる時点で対象の大腸癌を評価することを含み得る。
いくつかの実施形態では、本明細書に開示される方法は、腫瘍負荷をモニタリングおよび/または予測することに適用されてもよい。
いくつかの実施形態では、本明細書に開示される方法は、術後残存腫瘍を検出および/または予測することに適用されてもよい。
いくつかの実施形態では、本明細書に開示される方法は、術後の微小残存病変を検出および/または予測することに適用されてもよい。
いくつかの実施形態では、本明細書に開示される方法は、再発を検出および/または予測することに適用されてもよい。
一態様では、本明細書に開示される方法は、二次スクリーニングとして適用されてもよい。
一態様では、本明細書に開示される方法は、一次スクリーニングとして適用されてもよい。
一態様では、本明細書に開示される方法は、癌の発症をモニタリングすることに適用されてもよい。
一態様では、本明細書に開示される方法は、癌リスクをモニタリングおよび/または予測することに適用されてもよい。
大腸癌は、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の精度で対象において同定され得る。訓練されたアルゴリズムによって大腸癌を同定する精度は、大腸癌を有するまたは有していないと正確に同定あるいは分類される独立した試験試料(例えば、大腸癌を有することが知られている対象または大腸癌の臨床試験結果が陰性である対象)の割合として計算され得る。
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の陽性的中率(PPV)で、対象において同定され得る。訓練されたアルゴリズムを使用して大腸癌を同定するPPVは、真に大腸癌を有する対象に相当する、大腸癌を有すると同定または分類された無細胞の生体試料の割合として計算され得る。
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の陰性的中率(NPV)で、対象において同定され得る。訓練されたアルゴリズムを使用して大腸癌を同定するNPVは、真に大腸癌を有していない対象に相当する、大腸癌を有していないと同定または分類された無細胞の生体試料の割合として計算され得る。
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれ以上の臨床的感度で対象において同定され得る。訓練されたアルゴリズムを使用して大腸癌を同定する臨床的感度は、大腸癌を有すると正確に同定または分類される、大腸癌の存在に関連する独立した試験試料(例えば、大腸癌を有することが知られている対象)の割合として計算され得る。
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれ以上の臨床的特異度で対象において同定され得る。訓練されたアルゴリズムを使用して大腸癌を同定する臨床的特異度は、大腸癌を有していないと正確に同定または分類される、大腸癌の非存在に関連する独立した試験試料(例えば、大腸癌の臨床試験結果が陰性である対象)の割合として計算され得る。
いくつかの実施形態では、訓練されたアルゴリズムは、対象には少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の大腸癌のリスクがあると決定し得る。
訓練されたアルゴリズムは、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれ以上の精度で対象に大腸癌のリスクがあると決定し得る。
対象が大腸癌を有すると同定されると、対象は任意選択で、治療的介入(例えば、対象の大腸癌を処置するための適切な処置過程を処方すること)を提供され得る。治療的介入は、薬物の有効用量の処方、大腸癌のさらなる試験もしくは評価、大腸癌のさらなるモニタリング、またはそれらの組合せを含み得る。対象が現在、処置過程で大腸癌の処置を受けている場合、治療的介入はその後の異なる処置過程(例えば、現在の処置過程の非有効性に起因して処置有効性を増大させること)を含み得る。
治療的介入は、大腸癌の診断を確認するための二次臨床試験を対象に推奨することを含み得る。この二次臨床試験は、画像化試験、血液試験、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生物学的細胞診、FIT試験、FOBT試験、またはそれらのあらゆる組合せを含み得る。
対象の大腸癌を処置するための処置過程をモニタリングすることによって、対象の大腸癌はモニタリングされ得る。モニタリングは、2つ以上の時点で対象の大腸癌を評価することを含み得る。評価は、2つ以上の時点のそれぞれにおいて決定された大腸癌関連タンパク質のパネルの定量的尺度を含む、大腸癌関連タンパク質のパネルのデータセットのタンパク質の定量的尺度に少なくとも基づき得る。
いくつかの実施形態では、2つ以上の時点の間で決定された大腸癌関連タンパク質のパネルの定量的尺度を含む大腸癌関連タンパク質のパネルのデータセットのタンパク質の定量的尺度における差は、(i)対象の大腸癌の診断、(ii)対象の大腸癌の予後、(iii)対象の大腸癌のリスクの増加、(iv)対象の大腸癌のリスクの減少、(v)対象の大腸癌を処置するための処置過程の有効性、および(vi)対象の大腸癌を処置するための処置過程の非有効性などの1つ以上の臨床的指標を示し得る。
いくつかの実施形態では、2つ以上の時点の間で決定された大腸癌関連タンパク質のパネルの定量的尺度を含むタンパク質の定量的尺度における差は、対象の大腸癌の診断を示し得る。例えば、大腸癌が、より早い時点では対象において検出されなかったが、より遅い時点で対象において検出された場合、その差は対象の大腸癌の診断を示す。対象の大腸癌の診断のこの指標に基づいて、例えば、対象に対して新たな治療的介入を処方することなどの臨床行為または臨床決定がなされ得る。臨床行為または臨床決定は、大腸癌の診断を確認するために二次臨床試験を対象に推奨することを含み得る。この二次臨床試験は、画像化試験、血液試験、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生物学的細胞診、FIT試験、FOBT試験、またはそれらのあらゆる組合せを含み得る。
いくつかの実施形態では、2つ以上の時点の間で決定された大腸癌関連タンパク質のパネルの定量的尺度を含む大腸癌関連タンパク質のパネルにおけるデータセットのタンパク質の定量的尺度における差は、対象の大腸癌の予後を示し得る。
いくつかの実施形態では、2つ以上の時点の間で決定された大腸癌関連タンパク質のパネルの定量的尺度を含む大腸癌関連タンパク質のパネルにおけるデータセットのタンパク質の定量的尺度における差は、大腸癌のリスクの増加を有する対象を示し得る。例えば、大腸癌が、より早い時点とより遅い時点の両方で対象において検出された場合、また、差がプラスの差(例えば、大腸癌関連タンパク質のパネルにおけるデータセットのタンパク質の定量的尺度が、より早い時点からより遅い時点まで増加した)である場合、その差は、対象が大腸癌の増加したリスクを有することを示し得る。大腸癌のリスクの増加のこの指標に基づいて、例えば、対象に対する新たな治療的介入の処方または治療的介入の切り替え(例えば、現在の処置を終了し、新たな処置を処方すること)などの臨床行為または臨床決定がなされ得る。臨床行為または臨床決定は、大腸癌のリスクの増加を確認するために二次臨床試験を対象に推奨することを含み得る。この二次臨床試験は、画像化試験、血液試験、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生物学的細胞診、FIT試験、FOBT試験、またはそれらのあらゆる組合せを含み得る。
いくつかの実施形態では、2つ以上の時点の間で決定された大腸癌関連タンパク質のパネルの定量的尺度を含む大腸癌関連タンパク質のパネルにおけるデータセットのタンパク質の定量的尺度における差は、大腸癌のリスクの減少を有する対象を示し得る。例えば、大腸癌が、より早い時点とより遅い時点の両方で対象において検出された場合、また、差がマイナスの差(例えば、大腸癌関連タンパク質のパネルの定量的尺度を含む大腸癌関連タンパク質のパネルにおけるデータセットのタンパク質の定量的尺度が、より早い時点からより遅い時点まで減少した)である場合、その差は、対象が大腸癌の減少したリスクを有することを示し得る。臨床行為または臨床決定は、大腸癌の減少したリスクのこの指標に基づいて、対象に対してなされ得る(例えば、現在の治療的介入を継続または終了させる)。臨床行為または臨床決定は、大腸癌のリスクの減少を確認するための二次臨床試験を対象に推奨することを含み得る。この二次臨床試験は、画像化試験、血液試験、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生物学的細胞診、FIT試験、FOBT試験、またはそれらのあらゆる組合せを含み得る。
いくつかの実施形態では、2つ以上の時点の間で決定された大腸癌関連タンパク質のパネルの定量的尺度を含む大腸癌関連タンパク質のパネルにおけるデータセットのタンパク質の定量的尺度における差は、対象の大腸癌を処置するための処置過程の有効性を示し得る。例えば、大腸癌が、より早い時点では対象において検出されたが、より遅い時点で対象において検出されなかった場合、その差は対象の大腸癌を処置するための処置過程の有効性を示し得る。対象の大腸癌を処置するための処置過程の有効性のこの指標に基づいて、例えば、現在の治療的介入を継続または終了させることなどの臨床行為または臨床決定がなされ得る。臨床行為または臨床決定は、大腸癌を処置するために処置過程の有効性を確認するための二次臨床試験を対象に推奨することを含み得る。この二次臨床試験は、画像化試験、血液試験、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生物学的細胞診、FIT試験、FOBT試験、またはそれらのあらゆる組合せを含み得る。
いくつかの実施形態では、2つ以上の時点の間で決定された大腸癌関連タンパク質のパネルの定量的尺度を含む大腸癌関連タンパク質のパネルにおけるデータセットのタンパク質の定量的尺度における差は、対象の大腸癌を処置するための処置過程の非有効性を示し得る。例えば、大腸癌が、より早い時点とより遅い時点の両方で対象において検出された場合、また、差がプラスまたはゼロの差(例えば、大腸癌関連タンパク質のパネルの定量的尺度を含む大腸癌関連タンパク質のパネルにおけるデータセットのタンパク質の定量的尺度が、より早い時点からより遅い時点まで増加または一定のレベルのままであった)である場合、および有効な処置がより早い時点で示された場合、その差は、対象の大腸癌を処置するための処置過程の非有効性を示し得る。対象の大腸癌を処置するための処置過程の非有効性のこの指標に基づいて、例えば、対象に対する現在の治療的介入を終了すること、および/または異なる新たな治療介入に切り替えること(例えば、処方すること)などの臨床行為または臨床決定がなされ得る。臨床行為または臨床決定は、大腸癌を処置するための処置過程の非有効性を確認するために二次臨床試験を対象に推奨することを含み得る。この二次臨床試験は、画像化試験、血液試験、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生物学的細胞診、FIT試験、FOBT試験、またはそれらのあらゆる組合せを含み得る。
キット
本開示は、対象の癌を同定またはモニタリングするためのキットを提供する。キットは、対象の無細胞の生体試料中の複数の癌関連タンパク質のそれぞれにおけるタンパク質の定量的尺度(例えば、存在、非存在、または相対量を示す)を同定するための抗体、プローブ、またはプライマーを含み得る。無細胞の生体試料中のタンパク質のパネルの定量的尺度(例えば、存在、非存在、または相対量を示す)は、1つ以上の癌を示し得る。プローブは、無細胞の生体試料中のタンパク質に対して選択的であり得る。キットは、プローブを使用して無細胞の生体試料を処理して、対象の無細胞の生体試料中のタンパク質の定量的尺度(例えば、存在、非存在、または相対量を示す)を示すデータセットを生成するための指示書を含み得る。
本開示は、対象の癌を同定またはモニタリングするためのキットを提供する。キットは、対象の無細胞の生体試料中の複数の癌関連タンパク質のそれぞれにおけるタンパク質の定量的尺度(例えば、存在、非存在、または相対量を示す)を同定するための抗体、プローブ、またはプライマーを含み得る。無細胞の生体試料中のタンパク質のパネルの定量的尺度(例えば、存在、非存在、または相対量を示す)は、1つ以上の癌を示し得る。プローブは、無細胞の生体試料中のタンパク質に対して選択的であり得る。キットは、プローブを使用して無細胞の生体試料を処理して、対象の無細胞の生体試料中のタンパク質の定量的尺度(例えば、存在、非存在、または相対量を示す)を示すデータセットを生成するための指示書を含み得る。
キット中のプローブは、無細胞の生体試料中の複数の癌関連タンパク質におけるタンパク質またはタンパク質をコードする配列に対して選択的であり得る。キット中のプローブは、複数の癌関連タンパク質に対応するタンパク質分子を選択的に濃縮するように構成され得る。キット中のプローブは、タンパク質によって認識され、生体試料中のタンパク質への結合後に単離を可能にするようにタグ付けされた抗体であり得る。
キット中の指示書は、無細胞の生体試料中の癌関連タンパク質に対して選択的であるプロープを使用して、無細胞の生体試料をアッセイするという指示を含み得る。無細胞の生体試料中の複数の癌関連タンパク質のそれぞれにおけるタンパク質またはタンパク質をコードする配列の定量的尺度(例えば、存在、非存在、または相対量を示す)は、1つ以上の癌を示し得る。
キット中の指示書は、アッセイ読み出しを測定および解釈するための指示書を含み得、これは、無細胞の生体試料中の複数の癌関連タンパク質のそれぞれにおけるタンパク質またはタンパク質をコードする配列の定量的尺度(例えば、存在、非存在、または相対量を示す)を示すデータセットを生成するために、複数の癌関連タンパク質のうちの1つ以上において定量化され得る。
実施例1:患者血漿試料中のタンパク質分析
癌において、タンパク質は、癌のネオアンチゲンであろうとカノニカルタンパク質であろうと、大腸癌の潜在的な早期診断バイオマーカーの供給源である。タンパク質の特徴は、癌患者におけるタンパク質の過剰発現、枯渇、または変異を評価することにより血漿から決定することができる。いくつかのタンパク質は、乳癌、前立腺癌、大腸癌、肺癌、および卵巣癌に関連することが同定されている。
本明細書に記載される方法および分類器に有益なタンパク質を同定するために、結腸細胞増殖性障害を有する患者からの血漿および結腸細胞増殖性障害を有していない対象の血漿(対照血漿または参照血漿)を調べて、結腸細胞増殖性障害に応答して結腸細胞増殖性障害を有する患者によって産生されるタンパク質およびそれぞれの反応性タンパク質のシグネチャーパネルを同定した。そのために、結腸細胞増殖性障害を有する患者の血漿および対照血漿を、質量分析に基づくプロテオミクスおよび免疫親和性アッセイの両方を使用してプロファイリングし、循環血漿タンパク質を同定および定量化した。血漿は、特徴付けの前に高存在量タンパク質(例えば、アルブミン、免疫グロブリン)を枯渇させてもしなくてもよい。
この分析によって同定されたタンパク質パネルにより、結腸細胞増殖性障害を有する対象の血漿と健康な対象の血漿との間の分化が可能となった。
方法
試料の分類
血漿試料中のタンパク質を検出するために、イムノアッセイおよび質量分析アッセイを、大腸癌(CRC)、進行性腺腫(AA)、良性ポリープ(NAA)、またはこれらのいずれも有さない(NEG)と後に同定された対象から採取した血漿を用いて行った。
試料の分類
血漿試料中のタンパク質を検出するために、イムノアッセイおよび質量分析アッセイを、大腸癌(CRC)、進行性腺腫(AA)、良性ポリープ(NAA)、またはこれらのいずれも有さない(NEG)と後に同定された対象から採取した血漿を用いて行った。
標準化された血液採取および処理プロトコルを使用して血漿を得た後、使用するまで-80℃で保存した。書面による同意を、治験審査委員会の承認下で全ての対象から得た。
研究コホートの説明が表1に提供され、これは、(性別および年齢による)分類モデルにおけるCRC実験のために使用した健康試料および癌試料の数を示す。
本研究の主な目標は、大腸癌を進行性腺腫、良性疾患、および健康対照と区別する血清タンパク質バイオマーカーを同定して、現在のバイオマーカーの感度を改善し、臨床決定を導くことであった。
NEG、CRC、AA、およびNAA対象集団を表す対象試料から血漿を単離し、タンパク質アレイ上でスクリーニングした。合計1,472の特徴を、NEG、CRC、AA、およびNAA対象集団間で同定し、結腸細胞増殖性障害を有する対象の血漿および健康な対象の血漿における差次的発現について調べた。
全てのタンパク質定量化データを正規化し、相対スケールまたは絶対スケールのいずれかで報告した。
フィルタリング特徴値
各タンパク質が特定の状態を有する患者および有していない患者を識別する能力を、識別のための3つの群についてのメトリックを計算することによって評価した。識別群は、疾患陰性対大腸癌(NEG対CRC)、疾患陰性対進行性腺腫(NEG対AA)、ならびに疾患陰性対進行性腺腫および非進行性腺腫(NEG対AA+NAA)であった。この比較のために計算されたメトリックは、Hedges’G効果量メトリック、Wasserstein距離メトリック、弾性ネット正則化を伴う単一アッセイ線形ロジスティック回帰における特徴重み、単一アッセイ非線形ランダムフォレストにおける特徴重要度、およびマルチアッセイロジスティック回帰モデルにおける特徴重みを含んでいた。
各タンパク質について、全タンパク質にわたるメトリック分布毎におけるタンパク質のパーセンタイルを計算した。タンパク質を、メトリック分布毎におけるパーセンタイルによってランク付けした。タンパク質が、
A)タンパク質のみの分析から、95以上の最大値メトリックパーセンタイルを有し、90以上の中央値メトリックパーセンタイルを有していた
B)最大値メトリックパーセンタイルまたは中央値メトリックパーセンタイルについて上位25にランク付けされた、および
C)マルチアッセイロジスティック回帰モデルにおける特徴重みによって上位25にランク付けされた
という基準の少なくとも1つを満たす場合、さらなる検討のためにタンパク質を保持した。
A)タンパク質のみの分析から、95以上の最大値メトリックパーセンタイルを有し、90以上の中央値メトリックパーセンタイルを有していた
B)最大値メトリックパーセンタイルまたは中央値メトリックパーセンタイルについて上位25にランク付けされた、および
C)マルチアッセイロジスティック回帰モデルにおける特徴重みによって上位25にランク付けされた
という基準の少なくとも1つを満たす場合、さらなる検討のためにタンパク質を保持した。
いくつかの文献由来の特徴もまた、広範な文献検索に基づく検討のために含まれていた。文献由来の特徴を含む上記の基準を満たしている特徴を、試薬の入手可能性についてさらに調査し、そのうちそれら特徴を選択した。
図2は、タンパク質マーカーデータセット中の全ての利用可能な標的について単一の分析物タンパク質データ上で計算されたタンパク質あたりのパーセンタイルの可視化を提供する。
図3は、単一アッセイタンパク質分析(左パネル)およびマルチアッセイ分析(右パネル)からのメトリックの可視化を提供する。2.1リストは、最大値および中央値パーセンタイルメトリック分布を閾値化するときに見出され、かつそのリストを、相加性によって定義される使用頻度および性能閾値に合格するリストと交差させたタンパク質の交差からなる。2.2リストは、最大値および中央値パーセンタイルメトリックについて上位25個のタンパク質をランク別にとったときに見出されるタンパク質の交差からなる。
結果
NEG、NAA、AA、CRC
表2は、CRC識別のためのタンパク質バイオマーカーパネルの同定されたタンパク質のリストを提供する。
NEG、NAA、AA、CRC
表2は、CRC識別のためのタンパク質バイオマーカーパネルの同定されたタンパク質のリストを提供する。
ROC交差検証試験の倍数平均メトリック。全てのデータを特徴選択に使用した発見データの20倍にわたって平均性能メトリックを決定したが、モデル重みは交差検証内で定義した。
「標的0.9特異度」メトリックについては、予測確率(スコア)およびラベルに基づいて予測を行った。わずかに0.9を超える特異度を達成しながら感度を最大化する閾値を選択した。「経験的」メトリックについては、分類器からのデフォルトの予測閾値を使用し、いかなる特定の特異性も標的としないことによって、または試験試料に基づかないで予測を行った。信頼区間は、角括弧で報告され、1倍当たりの信頼区間の平均である。
表3は、すべてのデータを特徴選択に使用したがモデルの重みは交差検証内で定義された、発見データに対するCRC対NEGの53個の特徴の分類性能仕様を提供する(この性能において真のホールドアウトはなかった)。
表4は、すべてのデータを特徴選択に使用したがモデルの重みは交差検証内で定義された、発見データに対するAA対NEGの53個の特徴の分類性能仕様を提供する(この性能において真のホールドアウトはなかった)。
本発明の好ましい実施形態が本明細書中で示され、記載されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。本発明が本明細書内で提供された特定の実施例により限定されることは、意図されていない。本発明は前述の明細書に関して記載されているが、本明細書中の実施形態の記載および例示は、限定的な意味で解釈されることを意味するものではない。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。さらに、本発明のすべての態様は、様々な条件および変数に依存する、本明細書で説明された特定の描写、構成、または相対的な比率に限定されないことが理解されよう。本明細書に記載される本発明の実施形態の様々な代案が、本開示の発明の実施に際して利用され得ることを理解されたい。したがって、本発明は、任意のそのような代替案、修正、変形、または同等物にも及ぶことが考えられる。以下の特許請求の範囲は本発明の範囲を定義するものであり、この特許請求の範囲とその等価物の範囲内の方法と構造はそれにより包含されることが、意図されている。
Claims (37)
- EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII(IL1R2)、HGFR、IL-6ra、OPN、テネイシンC(TNC)、トロンボスポンジン-2(THBS2)、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125(MUC-16)、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む結腸細胞増殖性障害に特徴的な予め定められたタンパク質パネル。
- 前記パネルは、FLT3L、CEACAM5、IL-6RA、またはそれらの組合せを含む、請求項1に記載のパネル。
- 前記パネルは、FLT3L、CEACAM5、IL-6RA、IL-8、IL-1RT2、TNC、またはそれらの組合せを含む、請求項1に記載のパネル。
- 前記パネルは、FLT3L、CEACAM5、IL-6RA、IL-8、IL-1RT2、TNC、MUC-16、EGF、またはそれらの組合せを含む、請求項1に記載のパネル。
- 前記パネルは、健康な対象、良性結腸ポリープを有する対象、進行性腺腫を有する対象、または大腸癌を有する対象を区別するように構成される、請求項1に記載のパネル。
- 前記パネルは、進行性腺腫を示すように構成され、かつ1)FLT3L、CEACAM5、およびIL-6RA、2)FLT3L、CEACAM5、IL-6RA、CEA、IL-8、AGP、IL-1RT2、TNC、およびGDF-15、または3)FLT3L、CEACAM5、IL-6RA、CEA、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、およびp00738を含む、請求項1に記載のパネル。
- 前記パネルは、大腸癌を示すように構成され、かつFLT3L、CEACAM5、およびIL-6RA、2)FLT3L、CEACAM5、IL-6RA、IL-8、IL-1RT2、およびTNCから選択されるタンパク質、または3)FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、およびEGFを含む、請求項1に記載のパネル。
- 前記結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項1に記載のパネル。
- 健康な対象の集団を、結腸細胞増殖性障害を有する対象と区別するように構成された分類器であって、
前記結腸細胞増殖性障害に特徴的な予め定められたタンパク質パネルからのタンパク質を表す測定値のセットを含み、
前記測定値のセットは、健康な対象の試料および結腸細胞増殖性障害を有する対象の試料のタンパク質発現データから取得され、
前記測定値は、前記タンパク質発現データの特性に対応する特徴のセットを生成するために使用され、前記特徴のセットは、機械学習モデルまたは統計モデルを使用してコンピュータ処理され、
前記機械学習モデルまたは統計モデルは、健康な対象の集団を、結腸細胞増殖性障害を有する対象と区別することができる分類器として有用な特徴ベクトルを提供する、分類器。 - 前記予め定められたタンパク質パネルは、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む、請求項9に記載の分類器。
- 前記パネルは、FLT3L、CEACAM5、IL-6RA、またはそれらの組合せを含む、請求項9に記載の分類器。
- 前記パネルは、FLT3L、CEACAM5、IL-6RA、IL-8、IL-1RT2、TNC、またはそれらの組合せを含む、請求項9に記載の分類器。
- 前記パネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、MUC-16、EGF、またはそれらの組合せを含む、請求項9に記載の分類器。
- 前記分類器は、健康な対象、良性結腸ポリープを有する対象、進行性腺腫を有する対象、または大腸癌を有する対象を区別するように構成される、請求項9に記載の分類器。
- 前記パネルは、進行性腺腫を示すように構成され、かつFLT3L、CEACAM5、およびIL-6RA、2)FLT3L、CEACAM5、IL-6RA、CEA、IL-8、AGP、IL-1RT2、TNC、およびGDF-15、または3)FLT3L、CEACAM5、IL-6RA、CEA、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、EGF、およびp00738を含む、請求項9に記載の分類器。
- 前記パネルは、大腸癌を示すように構成され、かつ1)FLT3L、CEACAM5、およびIL-6RA、2)FLT3L、CEACAM5、IL-6RA、IL-8、IL-1RT2、およびTNC、または3)FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、GDF-15、AGRP、ハプトグロビン、ANGPTL4、FGF-23、補体成分C2、ORM2、FGF-23、MUC-16、およびEGFを含む、請求項9に記載の分類器。
- 前記結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項9に記載の分類器。
- 予め定められたタンパク質パネルに基づいて、対象を分類するのに操作可能な分類器を含むコンピュータ可読媒体と、
コンピュータ可読媒体上に記憶される指示を実行するための1つ以上のプロセッサと
を含む、結腸細胞増殖性傷害を検出するための機械学習モデル分類器を含む、システム。 - コンピュータシステムのメモリにロードされる請求項9に記載の分類器を含む請求項18に記載のシステムであって、前記機械学習モデルは、訓練用生体試料から得られる訓練データを使用して訓練され、前記訓練用生体試料の第1のサブセットは、結腸細胞増殖性障害を有する対象に対応すると同定され、前記訓練用生体試料の第2のサブセットは、結腸細胞増殖性障害を有していない対象に対応すると同定される、請求項18に記載のシステム。
- 前記パネルは、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む、請求項18に記載のシステム。
- 前記システムは、ディープラーニング分類器、ニューラルネットワーク分類器、線形判別分析(LDA)分類器、二次判別分析(QDA)分類器、サポートベクターマシン(SVM)分類器、ランダムフォレスト(RF)分類器、K近傍法、線形カーネルサポートベクターマシン分類器、一次または二次多項式カーネルサポートベクターマシン分類器、リッジ回帰分類器、弾性ネットアルゴリズム分類器、逐次最小問題最適化アルゴリズム分類器、ナイーブベイズアルゴリズム分類器、および主成分分析分類器からなる群から選択される機械学習分類器として構成される分類回路を含む、請求項18に記載のシステム。
- 対象の生体試料のタンパク質プロファイルを決定する方法であって、前記方法は、
a)前記対象からタンパク質を含有している前記生体試料を得る工程と、
b)前記生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含むタンパク質の予め定められたパネルからのタンパク質の量を測定する工程であって、これにより前記対象のタンパク質プロファイルを提供する、測定する工程と
を含む方法。 - 前記タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、またはそれらの組合せを含む、請求項22に記載の方法。
- 前記タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、IL-8、IL-1RT2、TNC、またはそれらの組合せを含む、請求項22に記載の方法。
- 前記タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、MUC-16、EGF、またはそれらの組合せを含む、請求項22に記載の方法。
- 前記タンパク質プロファイルは、結腸細胞増殖性障害と関連し、前記結腸細胞増殖性障害を有する前記対象の分類を提供する、請求項22に記載の方法。
- 前記対象の生体試料は、体液、便、結腸排出物、尿、血漿、血清、全血、単離された血液細胞、血液から単離された細胞、組織生検、およびそれらの組合せからなる群から選択される、請求項22に記載の方法。
- 前記結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項22に記載の方法。
- c)前記対象の前記タンパク質プロファイルに基づいた外科手術および/または治療剤を用いて前記対象を処置する工程をさらに含む、請求項22に記載の方法。
- 対象中の結腸細胞増殖性障害を検出する方法であって、前記方法は、
a)前記対象からタンパク質を含有している生体試料を得る工程と、
b)前記生体試料中の、EGF、FGF-2、FLT3L、フラクタルカイン、IL-1a、IL-2、IL-6、IL-8、GROa、MIP-3a、補体成分C2、補体成分C9、D因子、I因子、MBL、MMP-2、GDF-15、オステオネクチン、ペリオスチン、ANGPTL4、FGF-21、FGF-23、HGF、アンジオポエチン-2、BMP-9、IL-1RII、HGFR、IL-6ra、OPN、テネイシンC、トロンボスポンジン-2、uPAR、CD44、カリクレイン6、メソテリン、EpCAM、Apo A1、AGP、A2MB、フェチュインA、HP、L-セレクチン、補体成分C1q、補体成分C3、補体成分C3b、B因子、H因子、プロパージン、AGRP、MMP-12、CYFRA21-1、HE4、総PSA、MIF、AFP、CA125、CA19-9、CA15-3(MUC-1)、およびCEAからなる群から選択される少なくとも6つのタンパク質を含む予め定められたタンパク質パネルからのタンパク質の量を測定する工程であって、これにより前記対象のタンパク質プロファイルを提供する、測定する工程と、
c)結腸細胞増殖性障害の有無に関連した出力値を提供するために、前記タンパク質プロファイルを、健康な対象と結腸細胞増殖性障害を有する対象とを区別できるように訓練された機械学習モデルへとコンピュータ処理する工程であって、これにより前記対象中の結腸細胞増殖性障害の有無を示す、コンピュータ処理する工程と
を含む方法。 - タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、またはそれらの組合せを含む、請求項30に記載の方法。
- 前記タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、IL-8、IL-1RT2、TNC、またはそれらの組合せを含む、請求項30に記載の方法。
- 前記タンパク質の予め定められたパネルは、FLT3L、CEACAM5、IL-6RA、ORM、IL-8、AGP、IL-1RT2、TNC、MUC-16、EGF、またはそれらの組合せを含む、請求項30に記載の方法。
- 前記タンパク質プロファイルは、結腸細胞増殖性障害と関連し、前記結腸細胞増殖性障害を有する前記対象の分類を提供する、請求項30に記載の方法。
- 前記対象の生体試料は、体液、便、結腸排出物、尿、血漿、血清、全血、単離された血液細胞、血液から単離された細胞、組織生検、およびそれらの組合せからなる群から選択される、請求項30に記載の方法。
- 前記結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、ポリポーシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項30に記載の方法。
- d)前記対象の前記タンパク質プロファイルに基づいた外科手術および/または治療剤を用いて前記対象を処置する工程をさらに含む、請求項30に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063128545P | 2020-12-21 | 2020-12-21 | |
US63/128,545 | 2020-12-21 | ||
PCT/US2021/063337 WO2022140116A1 (en) | 2020-12-21 | 2021-12-14 | Markers for the early detection of colon cell proliferative disorders |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024505333A true JP2024505333A (ja) | 2024-02-06 |
Family
ID=82157028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023537479A Pending JP2024505333A (ja) | 2020-12-21 | 2021-12-14 | 結腸細胞増殖障害の早期検出のためのマーカー |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230176058A1 (ja) |
EP (1) | EP4264270A1 (ja) |
JP (1) | JP2024505333A (ja) |
KR (1) | KR20230124038A (ja) |
CN (1) | CN117083525A (ja) |
AU (1) | AU2021409465A1 (ja) |
CA (1) | CA3202255A1 (ja) |
WO (1) | WO2022140116A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019060716A1 (en) | 2017-09-25 | 2019-03-28 | Freenome Holdings, Inc. | SAMPLE EXTRACTION METHODS AND SYSTEMS |
CN116519954B (zh) * | 2023-06-28 | 2023-10-27 | 杭州广科安德生物科技有限公司 | 一种结直肠癌检测模型构建方法、系统及生物标志物 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120143805A1 (en) * | 2008-09-09 | 2012-06-07 | Somalogic, Inc. | Cancer Biomarkers and Uses Thereof |
GB201319264D0 (en) * | 2013-10-31 | 2013-12-18 | Univ Cape Town The | Method for diagnosing sexually transmitted infections and bacterial vaginosis in women |
US11014987B2 (en) * | 2013-12-24 | 2021-05-25 | Janssen Pharmaceutics Nv | Anti-vista antibodies and fragments, uses thereof, and methods of identifying same |
EP3481951A4 (en) * | 2016-07-06 | 2020-08-05 | Youhealth Biotech, Limited | METHYLATION MARKERS FOR COLON CARCINOMA AND USES THEREOF |
AU2018342007A1 (en) * | 2017-08-07 | 2020-02-27 | Board Of Regents, The University Of Texas Systems | Methods and materials for assessing and treating cancer |
EP3776381A4 (en) * | 2018-04-13 | 2022-01-05 | Freenome Holdings, Inc. | IMPLEMENTATION OF MACHINE LEARNING FOR MULTI-ANALYTE TESTS OF BIOLOGICAL SAMPLES |
-
2021
- 2021-12-14 JP JP2023537479A patent/JP2024505333A/ja active Pending
- 2021-12-14 KR KR1020237024786A patent/KR20230124038A/ko unknown
- 2021-12-14 CA CA3202255A patent/CA3202255A1/en active Pending
- 2021-12-14 AU AU2021409465A patent/AU2021409465A1/en active Pending
- 2021-12-14 CN CN202180094185.5A patent/CN117083525A/zh active Pending
- 2021-12-14 WO PCT/US2021/063337 patent/WO2022140116A1/en active Application Filing
- 2021-12-14 EP EP21911901.3A patent/EP4264270A1/en active Pending
-
2023
- 2023-02-01 US US18/163,169 patent/US20230176058A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN117083525A (zh) | 2023-11-17 |
CA3202255A1 (en) | 2022-06-30 |
AU2021409465A1 (en) | 2023-08-03 |
WO2022140116A1 (en) | 2022-06-30 |
EP4264270A1 (en) | 2023-10-25 |
US20230176058A1 (en) | 2023-06-08 |
KR20230124038A (ko) | 2023-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7431760B2 (ja) | 癌分類子モデル、機械学習システム、および使用方法 | |
Kidd et al. | Blood and tissue neuroendocrine tumor gene cluster analysis correlate, define hallmarks and predict disease status | |
Farshidfar et al. | Serum metabolomic profile as a means to distinguish stage of colorectal cancer | |
JP7250693B2 (ja) | 初期ステージの肺がん診断のための血漿ベースのタンパク質プロファイリング | |
Wang et al. | Clinical evaluation and therapeutic monitoring value of serum tumor markers in lung cancer | |
Pesch et al. | Biomarker research with prospective study designs for the early detection of cancer | |
US20230176058A1 (en) | Markers for the early detection of colon cell proliferative disorders | |
US20230243830A1 (en) | Markers for the early detection of colon cell proliferative disorders | |
US20230263477A1 (en) | Universal pan cancer classifier models, machine learning systems and methods of use | |
BR112020021779B1 (pt) | Método de identificação de uma assinatura de câncer de próstata clinicamente significativo usando citometria de microfluxo | |
Behrens et al. | A practical guide to epidemiological practice and standards in the identification and validation of diagnostic markers using a bladder cancer example | |
WO2022072471A1 (en) | Methods for the detection and treatment of lung cancer | |
Zhang et al. | Multiple biomarker panels for early detection of breast cancer in peripheral blood | |
US20230223145A1 (en) | Methods and software systems to optimize and personalize the frequency of cancer screening blood tests | |
WO2023235878A2 (en) | Markers for the early detection of colon cell proliferative disorders | |
Firpo et al. | Multianalyte serum biomarker panel for early detection of pancreatic adenocarcinoma | |
Piedimonte et al. | Evaluating the use of machine learning in endometrial cancer: A systematic review | |
US20150310169A1 (en) | Metabolic profiling in tissue and serum is indicative of tumor differentiation in prostate cancer | |
Lisson et al. | Machine Learning Classifiers for Predictive Biomarkers Combining Clinical and Radiomic Data in Testicular Cancer | |
Flory et al. | Clinical validation of a blood-based liquid biopsy test integrating cell-free DNA quantification and next-generation sequencing for cancer screening in dogs | |
Yang et al. | Development and validation of peritoneal metastasis in gastric cancer based on simplified clinicopathological features and serum tumour markers | |
Santiago et al. | Mixed-Integer Programming Model for Profiling Disease Biomarkers from Gene Expression Studies | |
WO2023230617A9 (en) | Bladder cancer biomarkers and methods of use | |
McGuire et al. | BIOMEDICAL ANALYTICS AND MORPHOPROTEOMICS: AN INTEGRATIVE APPROACH FOR MEDICAL DECISION MAKING FOR RECURRENT OR REFRACTORY | |
Baron et al. | Early cancer diagnosis: present and future: advanced imaging techniques, molecular and protein biomarkers, and multimodal approaches are at the forefront of promising strategies for detecting and diagnosing cancer at its earliest, most treatable stages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231003 |