JP2020028278A - 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 - Google Patents
被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 Download PDFInfo
- Publication number
- JP2020028278A JP2020028278A JP2018157870A JP2018157870A JP2020028278A JP 2020028278 A JP2020028278 A JP 2020028278A JP 2018157870 A JP2018157870 A JP 2018157870A JP 2018157870 A JP2018157870 A JP 2018157870A JP 2020028278 A JP2020028278 A JP 2020028278A
- Authority
- JP
- Japan
- Prior art keywords
- biomarker
- patient
- discriminator
- classifier
- survival rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000000034 method Methods 0.000 title claims abstract description 147
- 239000000090 biomarker Substances 0.000 claims abstract description 183
- 238000005259 measurement Methods 0.000 claims abstract description 25
- 238000013135 deep learning Methods 0.000 claims abstract description 15
- 238000007619 statistical method Methods 0.000 claims abstract description 10
- 230000004083 survival effect Effects 0.000 claims description 132
- 108090000623 proteins and genes Proteins 0.000 claims description 127
- 206010006187 Breast cancer Diseases 0.000 claims description 90
- 208000026310 Breast neoplasm Diseases 0.000 claims description 90
- 206010028980 Neoplasm Diseases 0.000 claims description 72
- 201000011510 cancer Diseases 0.000 claims description 72
- 238000012545 processing Methods 0.000 claims description 72
- 238000004590 computer program Methods 0.000 claims description 29
- 201000010099 disease Diseases 0.000 claims description 29
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 29
- 238000012360 testing method Methods 0.000 claims description 21
- 102100033393 Anillin Human genes 0.000 claims description 20
- 102100039524 DNA endonuclease RBBP8 Human genes 0.000 claims description 20
- 108010008599 Forkhead Box Protein M1 Proteins 0.000 claims description 20
- 102100023374 Forkhead box protein M1 Human genes 0.000 claims description 20
- 101000732632 Homo sapiens Anillin Proteins 0.000 claims description 20
- 101000746134 Homo sapiens DNA endonuclease RBBP8 Proteins 0.000 claims description 20
- 108020004999 messenger RNA Proteins 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 16
- 102000004169 proteins and genes Human genes 0.000 claims description 15
- 238000010801 machine learning Methods 0.000 claims description 13
- 238000013517 stratification Methods 0.000 claims description 12
- 239000003153 chemical reaction reagent Substances 0.000 claims description 10
- 238000010197 meta-analysis Methods 0.000 claims description 10
- 239000000523 sample Substances 0.000 claims description 9
- 102100027783 ADP-ribose glycohydrolase OARD1 Human genes 0.000 claims description 8
- 102100022890 ATP synthase subunit beta, mitochondrial Human genes 0.000 claims description 8
- 102100027943 Carnitine O-palmitoyltransferase 1, liver isoform Human genes 0.000 claims description 8
- 102100023774 Cold-inducible RNA-binding protein Human genes 0.000 claims description 8
- 102100039623 Epithelial splicing regulatory protein 1 Human genes 0.000 claims description 8
- 102100020903 Ezrin Human genes 0.000 claims description 8
- 102100034227 Grainyhead-like protein 2 homolog Human genes 0.000 claims description 8
- 102100022130 High mobility group protein B3 Human genes 0.000 claims description 8
- 101001008861 Homo sapiens ADP-ribose glycohydrolase OARD1 Proteins 0.000 claims description 8
- 101000903027 Homo sapiens ATP synthase subunit beta, mitochondrial Proteins 0.000 claims description 8
- 101000859570 Homo sapiens Carnitine O-palmitoyltransferase 1, liver isoform Proteins 0.000 claims description 8
- 101000906744 Homo sapiens Cold-inducible RNA-binding protein Proteins 0.000 claims description 8
- 101000814084 Homo sapiens Epithelial splicing regulatory protein 1 Proteins 0.000 claims description 8
- 101000854648 Homo sapiens Ezrin Proteins 0.000 claims description 8
- 101001069929 Homo sapiens Grainyhead-like protein 2 homolog Proteins 0.000 claims description 8
- 101001045794 Homo sapiens High mobility group protein B3 Proteins 0.000 claims description 8
- 101001013046 Homo sapiens MICOS complex subunit MIC27 Proteins 0.000 claims description 8
- 101001117517 Homo sapiens Prostaglandin E2 receptor EP3 subtype Proteins 0.000 claims description 8
- 101000895030 Homo sapiens Transmembrane ascorbate-dependent reductase CYB561 Proteins 0.000 claims description 8
- 101000749534 Homo sapiens rRNA-processing protein UTP23 homolog Proteins 0.000 claims description 8
- 102100022743 Laminin subunit alpha-4 Human genes 0.000 claims description 8
- 102100029628 MICOS complex subunit MIC27 Human genes 0.000 claims description 8
- 102100024447 Prostaglandin E2 receptor EP3 subtype Human genes 0.000 claims description 8
- 102100021338 Transmembrane ascorbate-dependent reductase CYB561 Human genes 0.000 claims description 8
- 108010008094 laminin alpha 3 Proteins 0.000 claims description 8
- 102100040585 rRNA-processing protein UTP23 homolog Human genes 0.000 claims description 8
- 238000007637 random forest analysis Methods 0.000 claims description 8
- 238000011478 gradient descent method Methods 0.000 claims description 6
- 102100036589 Glycine-tRNA ligase Human genes 0.000 claims description 4
- 101000602479 Homo sapiens Methionine-tRNA ligase, cytoplasmic Proteins 0.000 claims description 4
- 101000689224 Homo sapiens Src-like-adapter 2 Proteins 0.000 claims description 4
- 108010064209 Phosphoribosylglycinamide formyltransferase Proteins 0.000 claims description 4
- 241000252141 Semionotiformes Species 0.000 claims description 4
- 102100024510 Src-like-adapter 2 Human genes 0.000 claims description 4
- 108010034343 phosphoribosylamine-glycine ligase Proteins 0.000 claims description 4
- 102100034277 Ankyrin repeat domain-containing protein 29 Human genes 0.000 claims description 2
- 102100021717 Early growth response protein 3 Human genes 0.000 claims description 2
- 102100037948 GTP-binding protein Di-Ras3 Human genes 0.000 claims description 2
- 101000780130 Homo sapiens Ankyrin repeat domain-containing protein 29 Proteins 0.000 claims description 2
- 101000896450 Homo sapiens Early growth response protein 3 Proteins 0.000 claims description 2
- 101000951235 Homo sapiens GTP-binding protein Di-Ras3 Proteins 0.000 claims description 2
- 101001011619 Homo sapiens MIT domain-containing protein 1 Proteins 0.000 claims description 2
- 102100024629 Laminin subunit beta-3 Human genes 0.000 claims description 2
- 102100030158 MIT domain-containing protein 1 Human genes 0.000 claims description 2
- 108010028309 kalinin Proteins 0.000 claims description 2
- 210000001519 tissue Anatomy 0.000 description 18
- 238000004891 communication Methods 0.000 description 15
- 238000012549 training Methods 0.000 description 15
- 238000010200 validation analysis Methods 0.000 description 14
- 206010073095 invasive ductal breast carcinoma Diseases 0.000 description 10
- 201000010985 invasive ductal carcinoma Diseases 0.000 description 10
- 206010073096 invasive lobular breast carcinoma Diseases 0.000 description 10
- 238000001325 log-rank test Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000002790 cross-validation Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 7
- 230000036210 malignancy Effects 0.000 description 7
- 238000004393 prognosis Methods 0.000 description 7
- 101000851406 Homo sapiens Transmembrane protein 65 Proteins 0.000 description 6
- 238000003559 RNA-seq method Methods 0.000 description 6
- 102100036854 Transmembrane protein 65 Human genes 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 6
- 239000000091 biomarker candidate Substances 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 238000010837 poor prognosis Methods 0.000 description 6
- 238000011282 treatment Methods 0.000 description 6
- 101000877521 Homo sapiens Mitochondrial enolase superfamily member 1 Proteins 0.000 description 5
- 102100035387 Mitochondrial enolase superfamily member 1 Human genes 0.000 description 5
- 210000004027 cell Anatomy 0.000 description 5
- 102000015694 estrogen receptors Human genes 0.000 description 5
- 108010038795 estrogen receptors Proteins 0.000 description 5
- 238000007689 inspection Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 239000004065 semiconductor Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 206010003445 Ascites Diseases 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000003757 reverse transcription PCR Methods 0.000 description 4
- 102100021621 BEN domain-containing protein 5 Human genes 0.000 description 3
- 101000971247 Homo sapiens BEN domain-containing protein 5 Proteins 0.000 description 3
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 3
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 3
- KJWZYMMLVHIVSU-IYCNHOCDSA-N PGK1 Chemical compound CCCCC[C@H](O)\C=C\[C@@H]1[C@@H](CCCCCCC(O)=O)C(=O)CC1=O KJWZYMMLVHIVSU-IYCNHOCDSA-N 0.000 description 3
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 3
- 208000002151 Pleural effusion Diseases 0.000 description 3
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 230000003902 lesion Effects 0.000 description 3
- 239000002207 metabolite Substances 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 210000002381 plasma Anatomy 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 210000002700 urine Anatomy 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 101100493541 Arabidopsis thaliana ATR gene Proteins 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 101000662026 Homo sapiens Ubiquitin-like modifier-activating enzyme 7 Proteins 0.000 description 2
- 101000873828 Homo sapiens dCTP pyrophosphatase 1 Proteins 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 101150087255 RAD3 gene Proteins 0.000 description 2
- -1 RAK3 Proteins 0.000 description 2
- 102100037938 Ubiquitin-like modifier-activating enzyme 7 Human genes 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 102100035852 dCTP pyrophosphatase 1 Human genes 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 201000007270 liver cancer Diseases 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 208000026535 luminal A breast carcinoma Diseases 0.000 description 2
- 208000026534 luminal B breast carcinoma Diseases 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 230000000241 respiratory effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010006199 Breast cancer stage I Diseases 0.000 description 1
- 206010006200 Breast cancer stage II Diseases 0.000 description 1
- 206010006201 Breast cancer stage III Diseases 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102000002029 Claudin Human genes 0.000 description 1
- 108050009302 Claudin Proteins 0.000 description 1
- 238000000949 Cochran's Q test Methods 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 206010061825 Duodenal neoplasm Diseases 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000512668 Eunectes Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001089243 Homo sapiens RILP-like protein 2 Proteins 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- 238000012313 Kruskal-Wallis test Methods 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 208000007433 Lymphatic Metastasis Diseases 0.000 description 1
- 238000008149 MammaPrint Methods 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010027459 Metastases to lymph nodes Diseases 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 102100033758 RILP-like protein 2 Human genes 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 208000009125 Sigmoid Neoplasms Diseases 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 206010054184 Small intestine carcinoma Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 206010066901 Treatment failure Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000011394 anticancer treatment Methods 0.000 description 1
- 210000000436 anus Anatomy 0.000 description 1
- 210000001815 ascending colon Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000004534 cecum Anatomy 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 210000001198 duodenum Anatomy 0.000 description 1
- 201000000312 duodenum cancer Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- 238000009261 endocrine therapy Methods 0.000 description 1
- 229940034984 endocrine therapy antineoplastic and immunomodulating agent Drugs 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 210000004392 genitalia Anatomy 0.000 description 1
- 238000001794 hormone therapy Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 210000003016 hypothalamus Anatomy 0.000 description 1
- 210000003405 ileum Anatomy 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 208000030776 invasive breast carcinoma Diseases 0.000 description 1
- 210000001630 jejunum Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 208000003849 large cell carcinoma Diseases 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 208000029691 metastatic malignant neoplasm in the lymph nodes Diseases 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 210000001989 nasopharynx Anatomy 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 238000001543 one-way ANOVA Methods 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 210000003101 oviduct Anatomy 0.000 description 1
- 210000002990 parathyroid gland Anatomy 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 150000008442 polyphenolic compounds Chemical class 0.000 description 1
- 235000013824 polyphenols Nutrition 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 210000001599 sigmoid colon Anatomy 0.000 description 1
- 201000003825 sigmoid colon cancer Diseases 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 208000000649 small cell carcinoma Diseases 0.000 description 1
- 210000004872 soft tissue Anatomy 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 210000003437 trachea Anatomy 0.000 description 1
- 210000003384 transverse colon Anatomy 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/52—Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
Abstract
Description
本開示は、以下の態様を含む。
項1.
被検体に由来するバイオマーカーの母集団について、各バイオマーカーの測定値に基づいて各バイオマーカーが前記被検体の体に生じるイベントと関連して変動するか否かを統計学的手法により判定し、変動すると判定されたバイオマーカー群を第1の亜集団として抽出する工程1と、
第1の亜集団に属する各バイオマーカーを検証し、前記体に生じるイベントとの関連性がより強いと統計学的に予測されるバイオマーカー群を第2の亜集団として抽出する工程2と、
第2の亜集団に属する各バイオマーカーの重みを深層学習法により算出する工程3と、
を含む、判別器の生成方法であって、
前記判別器は、第2の亜集団に属する各バイオマーカーの測定値から得られるスコアと工程3で算出された各バイオマーカーの重みを用いて、第2の亜集団に属するバイオマーカーのスコアの重み付け和を算出する、
前記判別器の生成方法。
項2.
被検体に由来するバイオマーカーの母集団について、各バイオマーカーの測定値に基づいて各バイオマーカーが前記被検体の体に生じるイベントと関連して変動するか否かを統計学的手法により判定し、変動すると判定されたバイオマーカー群を第1の亜集団として抽出する工程Aと、
第1の亜集団に属する各バイオマーカーを検証し、前記体に生じるイベントとの関連性がより強いと統計学的に予測されるバイオマーカー群を第2の亜集団として抽出する工程Bと、
第2の亜集団に属するバイオマーカーから、機械学習法により、前記体に生じるイベントとの関連性がさらに強いと統計学的に予測されるバイオマーカー群を第3の亜集団として抽出する工程Cと、
第3の亜集団に属する各バイオマーカーの重みを深層学習法により算出する工程Dと、
を含む、判別器の生成方法であって、
前記判別器は、第3の亜集団に属する各バイオマーカーの測定値から得られるスコアと工程Dで算出された各バイオマーカーの重みを用いて、第3の亜集団に属するバイオマーカーのスコアの重み付け和を算出する、
前記判別器の生成方法。
項3.
前記機械学習法がランダムフォレストである、項1又は2に記載の判別器の生成方法。
項4.
前記深層学習法が勾配降下法である、項1〜3のいずれか一項に記載の判別器の生成方法。
項5.
前記検証がメタアナリシスである、項1〜4のいずれか一項に記載の判別器の生成方法。
項6.
前記体に生じるイベントが患者における所定期間内、又は所定期間後の生存率である、項1〜5のいずれか一項に記載の判別器の生成方法。
項7.
前記患者が罹患している疾患ががんである、項6に記載の判別器の生成方法。
項8.
前記バイオマーカーが遺伝子であり、前記バイオマーカーの測定値が、遺伝子に由来するmRNA、又はタンパク質の発現量である、項1〜7のいずれか一項に記載の判別器の生成方法。
項9.
処理部を備え、前記処理部が、項1〜8のいずれか一項に記載の判別器の生成方法を実行する、判別器生成装置。
項10.
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を、患者の所定期間内、又は所定期間後の生存率の予測のために使用する、使用方法。
項11.
前記患者ががん患者である、項10に記載の使用方法。
項12.
がんが乳がんである、項11に記載の使用方法。
項13.
患者について、項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど小さな値を示す場合であって、前記患者の重み付け和が基準値以下であるときに、前記患者の生存率が良好であると決定する工程を含む、患者の生存率の予測方法。
項14.
患者について、項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど小さな値を示す場合であって、前記患者の重み付け和が基準値よりも大きいときに、前記患者の生存率が不良であると決定する工程を含む、患者の生存率の予測方法。
項15.
患者について、項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど大きな値を示す場合であって、前記患者の重み付け和が基準値以上であるときに、前記患者の生存率が良好であると決定する工程を含む、患者の生存率の予測方法。
項16.
患者について、項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど大きな値を示す場合であって、前記患者の重み付け和が基準値よりも小さいときに、前記患者の生存率が不良であると決定する工程を含む、患者の生存率の予測方法。
項17.
前記患者ががん患者である、項13〜16のいずれか一項に記載の予測方法。
項18.
がんが乳がんである、項17に記載の予測方法。
項19.
判別器を生成する際に第2の亜集団として抽出されるバイオマーカーが、下記表1−1、及び表1−2に示される遺伝子を含み、前記バイオマーカーの測定値が遺伝子に由来するmRNA、又はタンパク質の発現量である、項18に記載の予測方法。
項20.
判別器を生成する際に第3の亜集団として抽出されるバイオマーカーが、FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3を含み、前記バイオマーカーの測定値が遺伝子に由来するmRNA、又はタンパク質の発現量である、項18に記載の予測方法。
項21.
処理部を備え、前記処理部が、項13〜20のいずれか一項に記載の予測方法を実行するための、患者の生存率予測装置。
項22.
患者について、項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を、対応する基準範囲と比較する工程と、
前記患者の重み付け和が属する基準範囲の分位を決定する工程と、
を含む、患者を生存率に応じて層別化することを補助する方法。
項23.
前記患者ががん患者である、項22に記載の方法。
項24.
前記基準範囲が、がんの臨床ステージクラス分類、がんの組織型、臨床ステージ毎、病理組織グレード毎、又は年齢層毎のカテゴリーに応じて決定されており、
前記方法が、さらに、前記カテゴリーに応じて、被検体のがんの臨床ステージクラス分類、がんの組織型、臨床ステージ、病理組織グレード、及び年齢層の情報を取得する工程を含む、項22又は23に記載の方法。
項25.
下記表1−1、及び表1−2に示される遺伝子から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)の、乳がん患者の生存率を予測するためのバイオマーカーとしての使用。
項26.
FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる遺伝子群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)の、乳がん患者の生存率を予測するためのバイオマーカーとしての使用。
項27.
下記表1−1、及び表1−2に示される遺伝子から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)に由来するmRNA、又はタンパク質の発現量を検出するためのプローブ、プライマー、又は抗体を含む、乳がん患者の生存率を予測するために使用される検査試薬。
項28.
FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる遺伝子群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)に由来するmRNA、又はタンパク質の発現量を検出するためのプローブ、プライマー、又は抗体を含む、乳がん患者の生存率を予測するために使用される検査試薬。
項29.
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器。
項30.
項29に記載の判別器を記憶した記憶媒体。
項31.
コンピュータに実行させたときに、項1〜8のいずれか一項に記載の判別器の生成方法を実行する、判別器を生成するためのコンピュータプログラム。
項32.
コンピュータに実行させたときに、項13〜20のいずれか一項に記載の予測方法を実行する、患者の生存率を予測するためのコンピュータプログラム。
判別器は、複数のバイオマーカーの測定値に基づいて生成される。はじめに、バイオマーカーの母集団について、バイオマーカーの測定値に基づいて、被検体の体に生じるイベントと関連して変動しうる複数のバイオマーカーを決定する。判別器は、抽出された複数のバイオマーカーについて、各バイオマーカーの測定値に基づいて決定されるスコアと統計学的手法により算出された各バイオマーカーの重みから生成される。
より具体的には、判別器は、後述する判別器の生成装置の処理部101が、例えば、図1に示す各ステップを実行することにより生成される。
各ステップについてより詳細に説明する。
また、各ステップの典型例を、図7に示すが、本開示は、図7に限定して解釈されるものではない。
ステップ1は、被検体の体に生じるイベントと関連して変動しうるバイオマーカー群を決定する工程である。
疾患が悪性腫瘍である場合、被検体において悪性腫瘍の転移が認められないことが好ましい。
本開示において、被検体の体に生じるイベントの最も典型的な例は、10年後又は20年後の乳がん患者の生存である。
ステップS2において、処理部101は、ステップS1において、有意差検定により「差がある」と決定された第1の亜集団に対して、バリデーションコホートを使用し候補バイオマーカーとしての正しさを検証する。検証は、第1の亜集団として抽出した全てのバイオマーカーに対して網羅的に行い、候補バイオマーカーとしての正しいと判定されたバイオマーカーを第2の亜集団として抽出する。
処理部101は、機械学習と検証により第2の亜集団から第3の亜集団を抽出する。
機械学習法は、特徴量を抽出できる限り制限されない。機械学習法として例えば、ランダムフォレスト、決定木、サポートベクターリグレッション、サポートベクターマシーン、ロジスティック解析、スパースロジスティック解析、深層学習等を挙げることができる。好ましくは、ランダムフォレストである。機械学習は、例えばPythonベースのscikit−learnライブラリ等を使用して行うことができる。
図7に示す典型例で抽出された遺伝子は、図11−1aに示す23遺伝子である。
ステップ4では、第3の亜集団に属するバイオマーカーについて、訓練データをニューラルネットワークに入力し、深層学習法により第3の亜集団に属する各バイオマーカーの重み(「Weight」又は「wi」で表すことがある。iは各バイオマーカーを示す。)を算出する。
前記判別器を使用した重み付け和を分子予後予測スコア(molecular prognostic score:mPS)とよぶ。
ステップ5は、任意のステップである。ステップ5では、ステップ4で生成した判別器が、コホートの種類、疾患のサブタイプ、被検体の年齢等によって群分けされたコホートを問わず適用可能であるか、検証するステップである。
本開示は、判別器を生成するための装置10(判別器生成装置10とも呼ぶ)に関する。判別器生成装置10は、少なくとも処理部101を備え、前記処理部101は、上記1.、図1又は図2に記載のステップにしたがって、上記1.で述べた判別器を生成する。
本開示のある実施形態は、判別器を生成するためのコンピュータプログラムに関する。
前記コンピュータプログラムは、図1に記載のステップS1、ステップS2及びステップS4、好ましくはステップS1〜S5及び図2に記載のステップS31〜S34を処理部101に実行させる。
本開示のある実施形態は、患者の生存率の予測方法に関する。本実施形態においては、上記1.の方法にて生成された判別器を用いて、患者の所定期間後の生存率を予測する。患者が罹患している疾患は、特に制限されないが、好ましくは、がんであり、より好ましくは、乳がんである。
本実施形態において、判別器、患者、がん、生存率、所定期間、mPS等、上記1.において使用されている用語については、上記1.の説明をここに援用する。
本開示は、患者の生存率を予測するための装置20(生存率予測装置20とも呼ぶ)に関する。生存率予測装置20は、少なくとも処理部201を備える。生存率予測装置20の構成は、判別器生成装置10と同じであるため、上記2.の説明、図3及び図4は、ここに援用する。
本開示のある実施形態は、がん患者の生存率を予測するためのコンピュータプログラムに関する。
本開示のある実施形態は、生存率に基づいて、がん患者の層別化を補助する方法に関する。
本開示は、患者を層別化するための装置30(層別化装置30とも呼ぶ)に関する。層別化装置30は、少なくとも処理部301を備える。層別化装置30の構成は、判別器生成装置10と同じであるため、上記2.の説明、図3及び図4は、ここに援用する。
図6を用いて、層別化装置30の動作について説明する。
本開示のある実施形態は、がん患者を層別化するためのコンピュータプログラムに関する。
本開示のある実施形態は、表1−1及び表1−2に記載の遺伝子から選択される少なくとも一種の遺伝子を、乳がん患者における生存率を予測するためのバイオマーカーとして使用することに関する。好ましくは、前記バイオマーカーには、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない。より好ましくは、FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)を、乳がんの生存率を予測するためのバイオマーカーとして使用する。前記遺伝子群から選択される少なくとも一種の遺伝子に由来するmRNA及び/又はタンパク質の発現量をバイオマーカーとして使用する。
本開示のある実施形態は、表1−1及び表1−2に記載の遺伝子から選択される少なくとも一種の遺伝子に由来するmRNA、又はタンパク質の発現量を検出するためのプローブ、プライマー、又は抗体を含む、乳がん患者の生存率を予測するために使用される検査試薬に関する。好ましくは、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない。より好ましくは、FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)である。本検査試薬は、RT−PCR法、マイクロアレイ法、RNA−Seq法、ELISA法、ウエスタンブロッティング法等に使用できる限り制限されない。
<コホート>
判別器を生成するため、複数の公知の乳がんコホートを使用した。今回の検討に使用するコホートからは転移のある患者はほとんどいなかった。
ヒト遺伝子のリストは、HUGO Gene Nomenclature Committee (HGNC)から取得した。
cBioPortalからのデータのダウンロードには、cBioPortalが提供するCGDS-R package及びWeb APIsを使用した。機械学習のランダムフォレストアプローチには、n_estimators(= 500)、max_depth(= 10)を除いて、パラメータをデフォルトとしたPythonベースのscikit-learnライブラリを使用した。ニューラルネットワーク解析にも、PythonベースのTensorFlowライブラリを使用した。他の解析は、Anaconda distributionにおいて構築された、カスタムスクリプトで書かれたPython(3.6.2)を使用した。
Kaplan-Meier plotsはR (survival package)を使用して作成し、Python (lifelines package)を使用してバリデーションを行った。各遺伝子の低発現群と高発現群を分けるカットオフ値には中央値を使用した。本実施例において、低発現を上付文字 “low”、高発現を上付文字 “high”で表すことがある。分子予測スコア[molecular prognostic score (mPS)]のバリデーションは、特に断りのない限り、10年後まででデータを打ち切った。図8eに示すmeta-analysisを除き、いずれの場合も、生存期間は、診断日から死亡日までとした。生存率の比較はLog-rank検定で行った。meta-analysis は、R survival package を使用し、Cox回帰を用いたハザード比(HR)とその95%信頼区間(CIs)を推定した。
有意差の有無は、ディスカバリコホート(図8)を除いて両側検定のp値0.05で決定され、候補遺伝子数を減らすためのカットオフは0.01とした。
図7に、複数のコホートから、がんの予後を予測するための判別器を生成するまでの概要を示す。
ステップ1:候補遺伝子の抽出
ステップ2:候補遺伝子の検証
ステップ3:機械学習による特徴量抽出
ステップ4:深層学習による判別器の構築
ステップ5:判別器の検証
各ステップについて説明する。
ステップ1では、TCGAコホートをダウンロードし、このRNAのリード数(発現量)に基づいて、乳がん患者における10年後の生存率と関連する遺伝子の候補の探索を行った。このディスカバリコホートの年齢の中央値は、59歳(IQR 49-68)であった。
ステップ2では、Log-rank検定によりピックアップされた286遺伝子について、バリデーションコホートとして、multicenterコホートを使用してmeta-analysisによるバリデーションを行い、184遺伝子をさらに候補遺伝子として抽出した(図8e)。抽出された遺伝子の中で、TMEM65、及び RILPL2は、multicenterコホートの中で、それぞれの発現量が最も高いHR(図9−1a)と、最も低いHR(図9−1b)を示し、乳がんの予後と最も関連性が強いと考えられる遺伝子であった。これらの遺伝子は、これまで、基礎的ながん研究でも臨床的ながん研究でも取り上げられていない遺伝子であった。
ステップ3では、ランダムフォレストにより、ステップ2で抽出された184遺伝子について特徴量抽出を行い、さらに乳がんの生存率と関連性の高い遺伝子を抽出した。訓練データとして、METABRIC コホートからランダムに抽出したn=952のコホートを使用した。ランダムフォレストによって得られた結果をクロスバリデーションにより検証した。このようにして、乳がんの10年後の生存率を予測するための予測遺伝子として、図11−1aに示す23遺伝子を選別した。23遺伝子のうちの13遺伝子は、発現が中央値より高い場合に予後が不良となる可能性があり、10遺伝子は、発現が中央値より低い場合に予後が不良となる可能性がある。
ステップ4では、ニューラルネットワークを使って、ステップ3で抽出された23遺伝子の重みを算出した。訓練データとして、ステップ3でも使用した、METABRIC コホートからランダムに抽出したn=952のコホートを使用した。前記訓練データを使ったニューラルネットワークによる深層学習により、各遺伝子の交差エントロピーによる損失関数を規定し、各遺伝子の重み“Gene_Weight”を勾配降下法により算出した[図12: Kourou, K., et al.Computational and structural biotechnology journal 13, 8-17,doi:10.1016/j.csbj.2014.11.005 (2015)]。
図11−2cに、乳がんのステージ分類と、mPS=0〜50までの範囲を6段階で分位した各分位におけるコホートの分布を示す。分位は第1分位がmPS=0〜5(以下、図面において符号「1st」で表す)、第2分位がmPS=5〜11(以下、図面において符号「2nd」で表す)、第3分位がmPS=11〜25(以下、図面において符号 「3rd」で表す)、第4分位がmPS=25〜36(以下、図面において符号「4th」で表す)、第5分位がmPS=36〜45(以下、図面において符号「5th」で表す)、第6分位がmPS=45〜50(以下、図面において符号「6th」で表す)である。また、図11−2cにおいて、符号S1は乳がんステージIを、符号S2は乳がんステージIIを、符号S3は乳がんステージIIIを示す。
図11−2cに示すように、mPSは、臨床ステージと良好な相関を示した。
前記判別器(数3)が、どのような乳がんのサブセットに適用可能であるか検証するため、以下の検討を行った。
そこで、TNM分類とmPSがどのような関係になるか検討した。
したがって、mPSは、ステージとも相関を示すことが証明された。
Claims (32)
- 被検体に由来するバイオマーカーの母集団について、各バイオマーカーの測定値に基づいて各バイオマーカーが前記被検体の体に生じるイベントと関連して変動するか否かを統計学的手法により判定し、変動すると判定されたバイオマーカー群を第1の亜集団として抽出する工程1と、
第1の亜集団に属する各バイオマーカーを検証し、前記体に生じるイベントとの関連性がより強いと統計学的に予測されるバイオマーカー群を第2の亜集団として抽出する工程2と、
第2の亜集団に属する各バイオマーカーの重みを深層学習法により算出する工程3と、
を含む、判別器の生成方法であって、
前記判別器は、第2の亜集団に属する各バイオマーカーの測定値から得られるスコアと工程3で算出された各バイオマーカーの重みを用いて、第2の亜集団に属するバイオマーカーのスコアの重み付け和を算出する、
前記判別器の生成方法。 - 被検体に由来するバイオマーカーの母集団について、各バイオマーカーの測定値に基づいて各バイオマーカーが前記被検体の体に生じるイベントと関連して変動するか否かを統計学的手法により判定し、変動すると判定されたバイオマーカー群を第1の亜集団として抽出する工程Aと、
第1の亜集団に属する各バイオマーカーを検証し、前記体に生じるイベントとの関連性がより強いと統計学的に予測されるバイオマーカー群を第2の亜集団として抽出する工程Bと、
第2の亜集団に属するバイオマーカーから、機械学習法により、前記体に生じるイベントとの関連性がさらに強いと統計学的に予測されるバイオマーカー群を第3の亜集団として抽出する工程Cと、
第3の亜集団に属する各バイオマーカーの重みを深層学習法により算出する工程Dと、
を含む、判別器の生成方法であって、
前記判別器は、第3の亜集団に属する各バイオマーカーの測定値から得られるスコアと工程Dで算出された各バイオマーカーの重みを用いて、第3の亜集団に属するバイオマーカーのスコアの重み付け和を算出する、
前記判別器の生成方法。 - 前記機械学習法がランダムフォレストである、請求項1又は2に記載の判別器の生成方法。
- 前記深層学習法が勾配降下法である、請求項1〜3のいずれか一項に記載の判別器の生成方法。
- 前記検証がメタアナリシスである、請求項1〜4のいずれか一項に記載の判別器の生成方法。
- 前記体に生じるイベントが患者における所定期間内、又は所定期間後の生存率である、請求項1〜5のいずれか一項に記載の判別器の生成方法。
- 前記患者が罹患している疾患ががんである、請求項6に記載の判別器の生成方法。
- 前記バイオマーカーが遺伝子であり、前記バイオマーカーの測定値が、遺伝子に由来するmRNA、又はタンパク質の発現量である、請求項1〜7のいずれか一項に記載の判別器の生成方法。
- 処理部を備え、前記処理部が、請求項1〜8のいずれか一項に記載の判別器の生成方法を実行する、判別器生成装置。
- 請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を、患者の所定期間内、又は所定期間後の生存率の予測のために使用する、使用方法。
- 前記患者ががん患者である、請求項10に記載の使用方法。
- がんが乳がんである、請求項11に記載の使用方法。
- 患者について、請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど小さな値を示す場合であって、前記患者の重み付け和が基準値以下であるときに、前記患者の生存率が良好であると決定する工程を含む、患者の生存率の予測方法。 - 患者について、請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど小さな値を示す場合であって、前記患者の重み付け和が基準値よりも大きいときに、前記患者の生存率が不良であると決定する工程を含む、患者の生存率の予測方法。 - 患者について、請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど大きな値を示す場合であって、前記患者の重み付け和が基準値以上であるときに、前記患者の生存率が良好であると決定する工程を含む、患者の生存率の予測方法。 - 患者について、請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど大きな値を示す場合であって、前記患者の重み付け和が基準値よりも小さいときに、前記患者の生存率が不良であると決定する工程を含む、患者の生存率の予測方法。 - 前記患者ががん患者である、請求項13〜16のいずれか一項に記載の予測方法。
- がんが乳がんである、請求項17に記載の予測方法。
- 判別器を生成する際に第2の亜集団として抽出されるバイオマーカーが、下記表1−1、及び表1−2に示される遺伝子を含み、前記バイオマーカーの測定値が遺伝子に由来するmRNA、又はタンパク質の発現量である、請求項18に記載の予測方法;
- 判別器を生成する際に第3の亜集団として抽出されるバイオマーカーが、FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3を含み、前記バイオマーカーの測定値が遺伝子に由来するmRNA、又はタンパク質の発現量である、請求項18に記載の予測方法。
- 処理部を備え、前記処理部が、請求項13〜20のいずれか一項に記載の予測方法を実行するための、患者の生存率予測装置。
- 患者について、請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を、対応する基準範囲と比較する工程と、
前記患者の重み付け和が属する基準範囲の分位を決定する工程と、
を含む、患者を生存率に応じて層別化することを補助する方法。 - 前記患者ががん患者である、請求項22に記載の方法。
- 前記基準範囲が、がんの臨床ステージクラス分類、がんの組織型、臨床ステージ毎、病理組織グレード毎、又は年齢層毎のカテゴリーに応じて決定されており、
前記方法が、さらに、前記カテゴリーに応じて、被検体のがんの臨床ステージクラス分類、がんの組織型、臨床ステージ、病理組織グレード、及び年齢層の情報を取得する工程を含む、請求項22又は23に記載の方法。 - 下記表2−1、及び表2−2に示される遺伝子から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)の、乳がん患者の生存率を予測するためのバイオマーカーとしての使用;
- FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる遺伝子群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)の、乳がん患者の生存率を予測するためのバイオマーカーとしての使用。
- 下記表3−1、及び表3−2に示される遺伝子から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)に由来するmRNA、又はタンパク質の発現量を検出するためのプローブ、プライマー、又は抗体を含む、乳がん患者の生存率を予測するために使用される検査試薬;
- FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる遺伝子群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)に由来するmRNA、又はタンパク質の発現量を検出するためのプローブ、プライマー、又は抗体を含む、乳がん患者の生存率を予測するために使用される検査試薬。
- 請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器。
- 請求項29に記載の判別器を記憶した記憶媒体。
- コンピュータに実行させたときに、請求項1〜8のいずれか一項に記載の判別器の生成方法を実行する、判別器を生成するためのコンピュータプログラム。
- コンピュータに実行させたときに、請求項13〜20のいずれか一項に記載の予測方法を実行する、患者の生存率を予測するためのコンピュータプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018157870A JP2020028278A (ja) | 2018-08-24 | 2018-08-24 | 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 |
PCT/JP2019/033085 WO2020040300A1 (ja) | 2018-08-24 | 2019-08-23 | 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 |
EP19852485.2A EP3842540A4 (en) | 2018-08-24 | 2019-08-23 | METHOD FOR PRODUCING A CLASSIFIER FOR USE IN PREDICTING AN EVENT OCCURRING IN A SUBJECT, AND METHOD FOR STRATIFYING SUBJECTS USING SUCH CLASSIFIER |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018157870A JP2020028278A (ja) | 2018-08-24 | 2018-08-24 | 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020028278A true JP2020028278A (ja) | 2020-02-27 |
Family
ID=69593239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018157870A Ceased JP2020028278A (ja) | 2018-08-24 | 2018-08-24 | 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP3842540A4 (ja) |
JP (1) | JP2020028278A (ja) |
WO (1) | WO2020040300A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021245850A1 (ja) | 2020-06-03 | 2021-12-09 | 富士通株式会社 | 診断支援プログラム、装置、及び方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014072349A (ja) * | 2012-09-28 | 2014-04-21 | Sanken Electric Co Ltd | 半導体装置 |
JP2014532428A (ja) * | 2011-11-08 | 2014-12-08 | ジェノミック ヘルス, インコーポレイテッド | 乳癌の予後を予測する方法 |
JP2018500276A (ja) * | 2014-10-09 | 2018-01-11 | デイナ ファーバー キャンサー インスティチュート,インコーポレイテッド | 免疫障害を処置するための複数の可変il−2用量レジメン |
JP2018520366A (ja) * | 2015-07-22 | 2018-07-26 | ミノミック インターナショナル リミティド | 前立腺疾患のためのバイオマーカーの組み合わせ |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3884767A (en) | 1973-09-21 | 1975-05-20 | Jr John E Pottharst | Multi-effect flash evaporator |
WO2007041238A2 (en) * | 2005-09-29 | 2007-04-12 | Stratagene California | Methods of identification and use of gene signatures |
WO2008058384A1 (en) * | 2006-11-15 | 2008-05-22 | University Health Network | Materials and methods for prognosing lung cancer survival |
PL2845911T3 (pl) * | 2010-03-31 | 2017-01-31 | Sividon Diagnostics Gmbh | Sposób przewidywania nawrotu raka sutka podczas leczenia endokrynologicznego |
MX2013008367A (es) * | 2011-01-25 | 2013-08-12 | Almac Diagnostics Ltd | Firmas de esxpresion genetica de cancer de colon y metodos de uso. |
SG194710A1 (en) * | 2011-05-10 | 2013-12-30 | Nestec Sa | Methods of disease activity profiling for personalized therapy management |
WO2016094330A2 (en) * | 2014-12-08 | 2016-06-16 | 20/20 Genesystems, Inc | Methods and machine learning systems for predicting the liklihood or risk of having cancer |
-
2018
- 2018-08-24 JP JP2018157870A patent/JP2020028278A/ja not_active Ceased
-
2019
- 2019-08-23 WO PCT/JP2019/033085 patent/WO2020040300A1/ja unknown
- 2019-08-23 EP EP19852485.2A patent/EP3842540A4/en not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014532428A (ja) * | 2011-11-08 | 2014-12-08 | ジェノミック ヘルス, インコーポレイテッド | 乳癌の予後を予測する方法 |
JP2014072349A (ja) * | 2012-09-28 | 2014-04-21 | Sanken Electric Co Ltd | 半導体装置 |
JP2018500276A (ja) * | 2014-10-09 | 2018-01-11 | デイナ ファーバー キャンサー インスティチュート,インコーポレイテッド | 免疫障害を処置するための複数の可変il−2用量レジメン |
JP2018520366A (ja) * | 2015-07-22 | 2018-07-26 | ミノミック インターナショナル リミティド | 前立腺疾患のためのバイオマーカーの組み合わせ |
Non-Patent Citations (3)
Title |
---|
N. ENGL. J. MED., vol. 351, no. 27, JPN6019035519, 2004, pages 2817 - 2826, ISSN: 0004964405 * |
NATURE, vol. 415, JPN6019044609, 2002, pages 530 - 536, ISSN: 0004964406 * |
PROC. NATL. ACAD. SCI. U.S.A., vol. 98, no. 19, JPN7019003689, 2001, pages 10869 - 10874, ISSN: 0004964407 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021245850A1 (ja) | 2020-06-03 | 2021-12-09 | 富士通株式会社 | 診断支援プログラム、装置、及び方法 |
JP7444252B2 (ja) | 2020-06-03 | 2024-03-06 | 富士通株式会社 | 診断支援プログラム、装置、及び方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3842540A4 (en) | 2022-10-05 |
WO2020040300A1 (ja) | 2020-02-27 |
EP3842540A1 (en) | 2021-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tseng et al. | Predicting breast cancer metastasis by using serum biomarkers and clinicopathological data with machine learning technologies | |
CN109036571B (zh) | 用于预测患有癌症的可能性或风险的方法和机器学习系统 | |
US20230393150A1 (en) | Methods and algorithms for aiding in the detection of cancer | |
Chen et al. | Prognostic fifteen-gene signature for early stage pancreatic ductal adenocarcinoma | |
Kristiansen | Markers of clinical utility in the differential diagnosis and prognosis of prostate cancer | |
US20090275057A1 (en) | Diagnostic markers predictive of outcomes in colorectal cancer treatment and progression and methods of use thereof | |
Zhu et al. | Three immunomarker support vector machines–based prognostic classifiers for stage IB non–small-cell lung cancer | |
US20120101002A1 (en) | Lung Cancer Biomarkers and Uses Thereof | |
US20140073522A1 (en) | Pancreatic Cancer Biomarkers and Uses Thereof | |
EP2386854A1 (en) | Diagnostic markers of breast cancer treatment and progression and methods of use thereof | |
ES2821300T3 (es) | Predicción de pronóstico para el melanoma de cáncer | |
US20090061422A1 (en) | Diagnostic markers of breast cancer treatment and progression and methods of use thereof | |
JP2011523049A (ja) | 頭頚部癌の同定、モニタリングおよび治療のためのバイオマーカー | |
WO2019197624A2 (en) | Improved classification and prognosis of prostate cancer | |
KR101378919B1 (ko) | 혈액으로부터 직접 폐암 진단 및 폐암의 서브타입 진단이 가능한 마커를 선별하는 시스템 생물학적 방법 및 이로부터 선별된 혈액으로부터 직접 폐암 진단 및 폐암 서브타입 진단이 가능한 마커 | |
WO2017203444A1 (en) | Method of prognosing and predicting breast cancer recurrence, markers employed therein and kit thereof | |
KR20230124038A (ko) | 결장 세포 증식 장애의 조기 검출을 위한 마커 | |
EP4222287A1 (en) | Methods for the detection and treatment of lung cancer | |
WO2020040300A1 (ja) | 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 | |
Ramirez et al. | Discovery and validation of ovarian cancer biomarkers utilizing high density antibody microarrays | |
Schummer et al. | Breast cancer genomics: normal tissue and cancer markers | |
US20220065872A1 (en) | Lung Cancer Biomarkers and Uses Thereof | |
CN113234823B (zh) | 胰腺癌预后风险评估模型及其应用 | |
WO2017185165A1 (en) | Gene signature for prostate cancer prognosis | |
Tian et al. | A predictive model with a risk-classification system for cancer-specific survival in patients with primary osteosarcoma of long bone |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210603 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220607 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220805 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221005 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230117 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230320 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230517 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230808 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20231220 |