JP2022135180A - 疾患予測システム、保険料算出システム及び疾患予測方法 - Google Patents
疾患予測システム、保険料算出システム及び疾患予測方法 Download PDFInfo
- Publication number
- JP2022135180A JP2022135180A JP2021034812A JP2021034812A JP2022135180A JP 2022135180 A JP2022135180 A JP 2022135180A JP 2021034812 A JP2021034812 A JP 2021034812A JP 2021034812 A JP2021034812 A JP 2021034812A JP 2022135180 A JP2022135180 A JP 2022135180A
- Authority
- JP
- Japan
- Prior art keywords
- data
- disease
- occupancy
- diversity
- animal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 176
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 176
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000004364 calculation method Methods 0.000 title claims description 19
- 241001465754 Metazoa Species 0.000 claims abstract description 104
- 244000005709 gut microbiome Species 0.000 claims abstract description 55
- 230000000968 intestinal effect Effects 0.000 claims description 44
- 241000282412 Homo Species 0.000 claims description 14
- 241001657523 Coriobacteriaceae Species 0.000 claims description 11
- 241000588921 Enterobacteriaceae Species 0.000 claims description 11
- 241001112692 Peptostreptococcaceae Species 0.000 claims description 11
- 241000692844 Prevotellaceae Species 0.000 claims description 11
- 241000095588 Ruminococcaceae Species 0.000 claims description 11
- 241001430332 Bifidobacteriaceae Species 0.000 claims description 10
- 241001430149 Clostridiaceae Species 0.000 claims description 10
- 241000609971 Erysipelotrichaceae Species 0.000 claims description 10
- 241001183186 Fusobacteriaceae Species 0.000 claims description 10
- 241001112693 Lachnospiraceae Species 0.000 claims description 10
- 241001430183 Veillonellaceae Species 0.000 claims description 10
- 241000589013 Alcaligenaceae Species 0.000 claims description 9
- 241000244332 Flavobacteriaceae Species 0.000 claims description 8
- 238000013473 artificial intelligence Methods 0.000 claims description 8
- 241001248433 Campylobacteraceae Species 0.000 claims description 7
- 241001248432 Helicobacteraceae Species 0.000 claims description 7
- 241000194017 Streptococcus Species 0.000 claims description 7
- 241000692843 Porphyromonadaceae Species 0.000 claims description 6
- 241001648303 Succinivibrionaceae Species 0.000 claims description 6
- 241000606126 Bacteroidaceae Species 0.000 claims description 5
- 241001467894 Desulfovibrionaceae Species 0.000 claims description 5
- 241001029952 Odoribacteraceae Species 0.000 claims description 5
- 241001112694 Peptococcaceae Species 0.000 claims description 3
- 241000206591 Peptococcus Species 0.000 claims description 3
- 241000194033 Enterococcus Species 0.000 claims description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 33
- 241000282326 Felis catus Species 0.000 description 25
- 241000894006 Bacteria Species 0.000 description 14
- 241000894007 species Species 0.000 description 14
- 238000010801 machine learning Methods 0.000 description 12
- 230000002550 fecal effect Effects 0.000 description 11
- 241000605059 Bacteroidetes Species 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 10
- 230000001580 bacterial effect Effects 0.000 description 10
- 241001609975 Enterococcaceae Species 0.000 description 9
- 241000193403 Clostridium Species 0.000 description 8
- 108020004465 16S ribosomal RNA Proteins 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 235000005911 diet Nutrition 0.000 description 6
- 208000010643 digestive system disease Diseases 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 235000012054 meals Nutrition 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 239000011324 bead Substances 0.000 description 5
- 235000013361 beverage Nutrition 0.000 description 5
- 230000037213 diet Effects 0.000 description 5
- 208000014951 hematologic disease Diseases 0.000 description 5
- 208000018706 hematopoietic system disease Diseases 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 208000017520 skin disease Diseases 0.000 description 5
- 239000013589 supplement Substances 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 208000024172 Cardiovascular disease Diseases 0.000 description 4
- 208000023178 Musculoskeletal disease Diseases 0.000 description 4
- 208000012902 Nervous system disease Diseases 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 208000030172 endocrine system disease Diseases 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 208000023504 respiratory system disease Diseases 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000009885 systemic effect Effects 0.000 description 4
- 208000014001 urinary system disease Diseases 0.000 description 4
- 241000589876 Campylobacter Species 0.000 description 3
- 241001443882 Coprobacillus Species 0.000 description 3
- 238000007400 DNA extraction Methods 0.000 description 3
- 241000282324 Felis Species 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- 208000016222 Pancreatic disease Diseases 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 208000032625 disorder of ear Diseases 0.000 description 3
- 230000002538 fungal effect Effects 0.000 description 3
- 208000024691 pancreas disease Diseases 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 208000017443 reproductive system disease Diseases 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 241000607534 Aeromonas Species 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 241000186000 Bifidobacterium Species 0.000 description 2
- 208000019838 Blood disease Diseases 0.000 description 2
- 208000017701 Endocrine disease Diseases 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 2
- 241001148568 Epsilonproteobacteria Species 0.000 description 2
- 241000589565 Flavobacterium Species 0.000 description 2
- 241000605909 Fusobacterium Species 0.000 description 2
- 241000192128 Gammaproteobacteria Species 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 208000025966 Neurological disease Diseases 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 241001459584 Pelosinus Species 0.000 description 2
- 241001656788 Propionispira Species 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008602 contraction Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000006806 disease prevention Effects 0.000 description 2
- 208000022602 disease susceptibility Diseases 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000003505 heat denaturation Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 235000014659 low sodium diet Nutrition 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 241001420322 Acetanaerobacterium Species 0.000 description 1
- 241000204396 Acetonema Species 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 241001015283 Acutalibacter Species 0.000 description 1
- 241000588986 Alcaligenes Species 0.000 description 1
- 241001258698 Allisonella Species 0.000 description 1
- 241000731710 Allobaculum Species 0.000 description 1
- 241001629573 Anaeroarcus Species 0.000 description 1
- 241001655514 Anaerobacterium Species 0.000 description 1
- 241000722955 Anaerobiospirillum Species 0.000 description 1
- 241000511612 Anaerofilum Species 0.000 description 1
- 241000025430 Anaeroglobus Species 0.000 description 1
- 241001621847 Anaeromusa Species 0.000 description 1
- 241001629581 Anaerosinus Species 0.000 description 1
- 241001012894 Anaerospora Species 0.000 description 1
- 241001013579 Anaerotruncus Species 0.000 description 1
- 241001633962 Anaerovibrio Species 0.000 description 1
- 208000031295 Animal disease Diseases 0.000 description 1
- 241000607469 Arsenophonus Species 0.000 description 1
- 241000193818 Atopobium Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000606125 Bacteroides Species 0.000 description 1
- 208000015163 Biliary Tract disease Diseases 0.000 description 1
- 241001167516 Biostraticola Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241001236205 Brenneria Species 0.000 description 1
- 241001057145 Breznakia Species 0.000 description 1
- 241001453698 Buchnera <proteobacteria> Species 0.000 description 1
- 241001622845 Budvicia Species 0.000 description 1
- 241000249959 Bulleidia Species 0.000 description 1
- 241001453380 Burkholderia Species 0.000 description 1
- 241001622847 Buttiauxella Species 0.000 description 1
- SKGURMFKEAFAGD-CSYZDTNESA-N C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 SKGURMFKEAFAGD-CSYZDTNESA-N 0.000 description 1
- 206010007027 Calculus urinary Diseases 0.000 description 1
- 241001181033 Candidatus Blochmannia Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 208000031229 Cardiomyopathies Diseases 0.000 description 1
- 208000002177 Cataract Diseases 0.000 description 1
- 241000946390 Catenibacterium Species 0.000 description 1
- 241000420678 Catenisphaera Species 0.000 description 1
- 241000046135 Cedecea Species 0.000 description 1
- 241001633683 Centipeda <firmicute> Species 0.000 description 1
- 206010008635 Cholestasis Diseases 0.000 description 1
- 241000588923 Citrobacter Species 0.000 description 1
- 241001112696 Clostridia Species 0.000 description 1
- 241001112695 Clostridiales Species 0.000 description 1
- 206010010741 Conjunctivitis Diseases 0.000 description 1
- 206010010904 Convulsion Diseases 0.000 description 1
- 241001467496 Coriobacterium Species 0.000 description 1
- 206010011013 Corneal erosion Diseases 0.000 description 1
- 241000805495 Cosenzaea Species 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 241000989055 Cronobacter Species 0.000 description 1
- 241001135761 Deltaproteobacteria Species 0.000 description 1
- 241001313301 Dendrosporobacter Species 0.000 description 1
- 201000004624 Dermatitis Diseases 0.000 description 1
- 206010012438 Dermatitis atopic Diseases 0.000 description 1
- 241001136144 Desulfosporomusa Species 0.000 description 1
- 241000605716 Desulfovibrio Species 0.000 description 1
- 241001535083 Dialister Species 0.000 description 1
- 241001187099 Dickeya Species 0.000 description 1
- 241001263137 Dielma Species 0.000 description 1
- 241000076839 Dubosiella Species 0.000 description 1
- 241000607473 Edwardsiella <enterobacteria> Species 0.000 description 1
- 241000256552 Eggerthia Species 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 208000004232 Enteritis Diseases 0.000 description 1
- 241000305071 Enterobacterales Species 0.000 description 1
- 241000909851 Epiphora Species 0.000 description 1
- 241001303962 Ercella Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000186811 Erysipelothrix Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001350695 Ethanoligenens Species 0.000 description 1
- 241001608234 Faecalibacterium Species 0.000 description 1
- 241000306836 Faecalibaculum Species 0.000 description 1
- 241000661429 Fastidiosipila Species 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 208000007882 Gastritis Diseases 0.000 description 1
- 208000022555 Genital disease Diseases 0.000 description 1
- 208000010412 Glaucoma Diseases 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 241000862469 Holdemania Species 0.000 description 1
- 241000339806 Hydrogenoanaerobacterium Species 0.000 description 1
- 241000148146 Ileibacterium <Mailhe et al. 2017> Species 0.000 description 1
- 208000003618 Intervertebral Disc Displacement Diseases 0.000 description 1
- 206010050296 Intervertebral disc protrusion Diseases 0.000 description 1
- 206010023204 Joint dislocation Diseases 0.000 description 1
- 241000256560 Kandleria Species 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241001134638 Lachnospira Species 0.000 description 1
- 241001112724 Lactobacillales Species 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- 206010024264 Lethargy Diseases 0.000 description 1
- 241001015936 Longicatena Species 0.000 description 1
- 241000043362 Megamonas Species 0.000 description 1
- 241000604449 Megasphaera Species 0.000 description 1
- 241001468189 Melissococcus Species 0.000 description 1
- 241000736262 Microbiota Species 0.000 description 1
- 241000509624 Mitsuokella Species 0.000 description 1
- 241000282339 Mustela Species 0.000 description 1
- 241000785902 Odoribacter Species 0.000 description 1
- 241000927544 Olsenella Species 0.000 description 1
- 241000843248 Oscillibacter Species 0.000 description 1
- 241000266824 Oscillospira Species 0.000 description 1
- 206010033078 Otitis media Diseases 0.000 description 1
- 241000566145 Otus Species 0.000 description 1
- 241001446614 Papillibacter Species 0.000 description 1
- 241001267970 Paraprevotella Species 0.000 description 1
- 241000606012 Pectinatus Species 0.000 description 1
- 241000191992 Peptostreptococcus Species 0.000 description 1
- 241001464921 Phascolarctobacterium Species 0.000 description 1
- 241000398992 Pilibacter Species 0.000 description 1
- 241000605861 Prevotella Species 0.000 description 1
- 241000169380 Propionispora Species 0.000 description 1
- 241000192142 Proteobacteria Species 0.000 description 1
- 241001655512 Pseudobacteroides Species 0.000 description 1
- 241000481844 Psychrosinus Species 0.000 description 1
- 208000006311 Pyoderma Diseases 0.000 description 1
- 241000186549 Quinella Species 0.000 description 1
- 241000192031 Ruminococcus Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000543650 Schwartzia <Bacteria> Species 0.000 description 1
- 241000605036 Selenomonas Species 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241000549372 Solobacterium Species 0.000 description 1
- 241000168515 Sporobacter Species 0.000 description 1
- 241001136694 Subdoligranulum Species 0.000 description 1
- 241000124839 Succiniclasticum Species 0.000 description 1
- 241001310973 Succinispira Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241000500334 Tetragenococcus Species 0.000 description 1
- 241000035670 Thermosinus Species 0.000 description 1
- 241001425419 Turicibacter Species 0.000 description 1
- 208000012931 Urologic disease Diseases 0.000 description 1
- 241000207194 Vagococcus Species 0.000 description 1
- 241001148134 Veillonella Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 241000450066 Youngiibacter Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 201000008937 atopic dermatitis Diseases 0.000 description 1
- 208000002479 balanitis Diseases 0.000 description 1
- 210000003445 biliary tract Anatomy 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 208000015606 cardiovascular system disease Diseases 0.000 description 1
- 230000007870 cholestasis Effects 0.000 description 1
- 231100000359 cholestasis Toxicity 0.000 description 1
- 208000020832 chronic kidney disease Diseases 0.000 description 1
- 208000022831 chronic renal failure syndrome Diseases 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 201000007717 corneal ulcer Diseases 0.000 description 1
- 201000003146 cystitis Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 235000015872 dietary supplement Nutrition 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 206010015037 epilepsy Diseases 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 230000002989 hypothyroidism Effects 0.000 description 1
- 208000003532 hypothyroidism Diseases 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 206010023332 keratitis Diseases 0.000 description 1
- 208000016747 lacrimal apparatus disease Diseases 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 210000003563 lymphoid tissue Anatomy 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 208000017445 musculoskeletal system disease Diseases 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 206010033072 otitis externa Diseases 0.000 description 1
- 208000028169 periodontal disease Diseases 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 206010039083 rhinitis Diseases 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 208000003265 stomatitis Diseases 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 206010043554 thrombocytopenia Diseases 0.000 description 1
- 208000008281 urolithiasis Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Epidemiology (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Pathology (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
【課題】簡易な方法で、動物が将来疾患に罹患する可能性を予測する疾患予測システム、学習済みモデルの生成方法及び疾患予測方法を提供する。
【解決手段】疾患予測システムは、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを受け付ける受付手段31と、学習済みモデルを用いて、受付手段31に入力された動物の腸内細菌叢の占有率データ及び多様性データからその動物が疾患に罹患するかを予測判定する判定手段11とを備える。判定手段は、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする。
【選択図】図1
【解決手段】疾患予測システムは、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを受け付ける受付手段31と、学習済みモデルを用いて、受付手段31に入力された動物の腸内細菌叢の占有率データ及び多様性データからその動物が疾患に罹患するかを予測判定する判定手段11とを備える。判定手段は、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする。
【選択図】図1
Description
本発明は、疾患予測システム、保険料算出システム及び疾患予測方法に関し、詳しくは、動物の腸内細菌叢に関するデータから、動物の将来の疾患罹患可能性に関する情報を提供する疾患予測システム、保険料算出システム及び疾患予測方法に関する。
犬や猫、ウサギを始めとする愛玩動物、牛や豚を始めとする家畜は、人間にとってかけがえのない存在である。近年、人間が飼育する動物の平均寿命が大幅に伸びた一方で、動物がその一生の中で何らかの疾患に罹患することが多くなり、飼育者が負担する医療費の増大が問題となっている。
動物の健康を維持するためには、日頃の食事、運動などを通じた体調管理や不調への素早い対応が重要となるが、動物は、自己の言葉で体の不調を訴えることができないため、症状が進行して、外形的に観察可能な何らかの徴候が生じたときに飼育者が初めて動物の疾患の罹患に気付くのが実情である。
そのため、簡易な方法で、動物が将来疾患に罹患する可能性があるのかを知る手段が求められている。特に、疾患に罹患していない状態、症状が何ら現れていない状態において、将来の疾患罹患の可能性を知ることができれば、疾患の予防に向けた措置を具体的にとることが可能となるため、有用である。
特許文献1には、腸内細菌叢中、バクテロイデス門(Bacteroidetes)の細菌を増殖させ、ファーミキューテス門(Firmicutes)の細菌を減少させることによって、腸内細菌叢を有効に調整又は改善する効果を有する腸内細菌叢調整又は改善組成物が開示されているが、動物の腸内細菌叢に関するデータから当該動物が病気になるかどうかを予測する方法については開示されていない。
そこで、本発明は、簡易な方法で、動物が将来疾患に罹患する可能性を予測する疾患予測システム等を提供することを目的とする。
本発明者は、ペット保険に加入している動物の腸内細菌叢に関するデータと、当該動物の保険請求の有無、すなわち疾患罹患の有無についての膨大なデータを分析、検討した結果、動物の腸内細菌叢のデータを用いて当該動物が将来疾患に罹患するかどうかを予測することが可能になることを見出し、本発明を完成するに至った。
すなわち、本発明は以下の[1]~[11]である。
[1]ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを受け付ける受付手段と、学習済みモデルを用いて、前記受付手段に入力された動物の腸内細菌叢の占有率データ及び多様性データからその動物が疾患に罹患するかを予測判定する判定手段と、を備える疾患予測システム。
[2]前記学習済みモデルが、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする学習済みモデルである[1]の疾患予測システム。
[3]前記占有率データが、科ごとの占有率又は科ごとの占有率に基づいて設定されたラベルを含む[2]の疾患予測システム。
[4]前記占有率データが、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、及び、ベイノレラ科(Veillonellaceae)からなる群から選ばれる1つ以上の科の占有率又は当該占有率に基づいて設定されたラベルを含む[3]の疾患予測システム。
[5]前記占有率データが、さらに、ストレプトコッカス科(Streptococcaceae)の占有率又は当該占有率に基づいて設定されたラベルを含む[4]の疾患予測システム。
[6]前記占有率データが、さらに、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)からなる群から選ばれる1つ以上の科の占有率又は当該占有率に基づいて設定されたラベルを含む[4]の疾患予測システム。
[7]前記多様性データが、多様性指数または多様性指数に基づいて設定されたラベルを含む[1]~[6]のいずれかの疾患予測システム。
[8]保険の対象となる動物の腸内細菌叢の占有率データ及び多様性データを、[1]~[7]のいずれか一項記載の疾患予測システムに入力し、出力された疾患罹患の予測に応じて当該動物の保険料を決定する保険料算出システム。
[9]ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データからその動物が所定期間内に疾患に罹患するかどうかの予測をする学習済みモデルの生成方法であって、教師データとして、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データと、その動物の腸内細菌叢の占有率データと多様性データを取得した時から所定期間内の疾患への罹患の有無とを人工知能を含むコンピュータに入力し、人工知能に学習させることを特徴とする学習済みモデルの生成方法。
[10]ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを取得するステップと、前記占有率データ及び多様性データを学習済みモデルに入力し、コンピュータが前記学習済みモデルを用いて、入力された占有率データ及び多様性データから所定期間内に当該動物が疾患に罹患するかどうかの予測を出力するステップと、を有する疾患予測方法。
[11]前記学習済みモデルが、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする学習済みモデルである[10]の疾患予測方法。
[1]ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを受け付ける受付手段と、学習済みモデルを用いて、前記受付手段に入力された動物の腸内細菌叢の占有率データ及び多様性データからその動物が疾患に罹患するかを予測判定する判定手段と、を備える疾患予測システム。
[2]前記学習済みモデルが、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする学習済みモデルである[1]の疾患予測システム。
[3]前記占有率データが、科ごとの占有率又は科ごとの占有率に基づいて設定されたラベルを含む[2]の疾患予測システム。
[4]前記占有率データが、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、及び、ベイノレラ科(Veillonellaceae)からなる群から選ばれる1つ以上の科の占有率又は当該占有率に基づいて設定されたラベルを含む[3]の疾患予測システム。
[5]前記占有率データが、さらに、ストレプトコッカス科(Streptococcaceae)の占有率又は当該占有率に基づいて設定されたラベルを含む[4]の疾患予測システム。
[6]前記占有率データが、さらに、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)からなる群から選ばれる1つ以上の科の占有率又は当該占有率に基づいて設定されたラベルを含む[4]の疾患予測システム。
[7]前記多様性データが、多様性指数または多様性指数に基づいて設定されたラベルを含む[1]~[6]のいずれかの疾患予測システム。
[8]保険の対象となる動物の腸内細菌叢の占有率データ及び多様性データを、[1]~[7]のいずれか一項記載の疾患予測システムに入力し、出力された疾患罹患の予測に応じて当該動物の保険料を決定する保険料算出システム。
[9]ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データからその動物が所定期間内に疾患に罹患するかどうかの予測をする学習済みモデルの生成方法であって、教師データとして、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データと、その動物の腸内細菌叢の占有率データと多様性データを取得した時から所定期間内の疾患への罹患の有無とを人工知能を含むコンピュータに入力し、人工知能に学習させることを特徴とする学習済みモデルの生成方法。
[10]ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを取得するステップと、前記占有率データ及び多様性データを学習済みモデルに入力し、コンピュータが前記学習済みモデルを用いて、入力された占有率データ及び多様性データから所定期間内に当該動物が疾患に罹患するかどうかの予測を出力するステップと、を有する疾患予測方法。
[11]前記学習済みモデルが、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする学習済みモデルである[10]の疾患予測方法。
本発明により、動物が将来疾患に罹患する可能性を予測する疾患予測システム、保険料算出システム、学習済みモデルの生成方法及び、疾患予測方法を提供することが可能となる。
[疾患予測システム]
本発明の疾患予測システムは、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データの入力を受け付ける受付手段と、学習済みモデルを用いて、前記受付手段に入力された動物の腸内細菌叢の占有率データ及び多様性データからその動物の疾患罹患の予測を判定し出力する判定手段と、を備える。
本発明の疾患予測システムは、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データの入力を受け付ける受付手段と、学習済みモデルを用いて、前記受付手段に入力された動物の腸内細菌叢の占有率データ及び多様性データからその動物の疾患罹患の予測を判定し出力する判定手段と、を備える。
[受付手段]
本発明の受付手段は、疾患への罹患を予測したい動物の腸内細菌叢の占有率データ及び多様性データの入力を受け付ける手段である。動物としては、犬、猫、鳥、ウサギ、フェレット等が挙げられる。占有率データ及び多様性データの受付方法は、端末へのデータの入力、送信などいずれの方法であってもよい。
本発明の受付手段は、疾患への罹患を予測したい動物の腸内細菌叢の占有率データ及び多様性データの入力を受け付ける手段である。動物としては、犬、猫、鳥、ウサギ、フェレット等が挙げられる。占有率データ及び多様性データの受付方法は、端末へのデータの入力、送信などいずれの方法であってもよい。
[占有率データ]
占有率データとは、動物の腸内細菌叢に含まれる各菌の占有率に関連するデータである。占有率とは、腸内細菌叢に占める各菌種の存在比(検出比率)であり、例えば、NGSなどのシーケンサーを用いたアンプリコンシーケンスなどの公知のメタゲノム解析法での検出結果「hit rate」として測定することができる。本発明では、占有率データとして、腸内細菌叢の占有率又は占有率に基づいて設定されたラベルを用いることができる。
占有率データとは、動物の腸内細菌叢に含まれる各菌の占有率に関連するデータである。占有率とは、腸内細菌叢に占める各菌種の存在比(検出比率)であり、例えば、NGSなどのシーケンサーを用いたアンプリコンシーケンスなどの公知のメタゲノム解析法での検出結果「hit rate」として測定することができる。本発明では、占有率データとして、腸内細菌叢の占有率又は占有率に基づいて設定されたラベルを用いることができる。
占有率としては、菌の門、綱、目、科、属、種のいずれのレベルにおける占有率であってもよいが、菌の科ごとの占有率が好ましい。科ごとの占有率とは、ある科に属する菌全体についての占有率である。つまり、科ごとの占有率を算定する場合には、腸内細菌叢における各菌種について、ある科に属する菌種の占有率を合計して、当該科の占有率を算定する。種レベルや属レベルまでの同定を行って、科ごとに合計してもよいし、種レベルや属レベルまでの同定を行わずに、科レベルでの同定を行って科の占有率を算定してもよい。
占有率に基づいて設定されたラベルとは、占有率の数値の大小に応じて適宜設定されたラベルである。例えば、占有率の数値に応じて、「大」、「中」、「小」或いは「多」、「中」、「少」という3段階のラベルを設定することができる。また、ラベルの段階数は任意に設定することができ、例えば、「0」、「1」、「2」、「3」、・・・「20」といった多段階のラベルを付すこともできる。
ラベルを用いる場合は、腸内細菌叢中の占有率を測定し、入力手段に数値を入力する前に、当該測定された占有率に応じて、予め定めておいた対応表から特定のラベルを割当てて、そのラベルを受付手段に入力することができる。
ラベルを用いる場合は、腸内細菌叢中の占有率を測定し、入力手段に数値を入力する前に、当該測定された占有率に応じて、予め定めておいた対応表から特定のラベルを割当てて、そのラベルを受付手段に入力することができる。
[多様性データ]
多様性データとは、動物の腸内細菌叢の菌の多様性に関連するデータである。腸内細菌叢の多様性が大きいということは、当該腸内細菌叢に様々な種類の菌が幅広く含まれるということである。多様性を表す指標、いわゆる多様性指数には幾つかの種類があるが、本発明では公知のいずれのものであってもよい。多様性指数としては、例えば、シャノン・ウィーナーの多様度指数、シンプソンの多様度指数が挙げられる。
多様性データとは、動物の腸内細菌叢の菌の多様性に関連するデータである。腸内細菌叢の多様性が大きいということは、当該腸内細菌叢に様々な種類の菌が幅広く含まれるということである。多様性を表す指標、いわゆる多様性指数には幾つかの種類があるが、本発明では公知のいずれのものであってもよい。多様性指数としては、例えば、シャノン・ウィーナーの多様度指数、シンプソンの多様度指数が挙げられる。
[占有率データや多様性データの測定]
腸内細菌叢の占有率データや多様性データの測定は、NGSなどのシーケンサーを用いたアンプリコンシーケンスなどの公知のメタゲノム解析法や細菌叢の解析方法を用いることができる。例えば、動物から糞便などの試料を採取し、試料中に含まれるあらゆる生物のDNAやRNAの塩基配列情報を次世代シーケンサーを用いて解析することによって、当該試料中に含まれる生物を同定する方法が挙げられる。好ましくは、試料中に含まれる16SrRNA遺伝子の全部又は一部を、必要に応じて増幅して、シーケンスを行い、得られた配列をソフトウェアを用いて解析し、試料中の細菌の組成データを得る方法が挙げられる。試料中の細菌の組成データを、ソフトウェアで処理すること、あるいは、Genbank、Greengenes、SILVA databaseといった遺伝子データベースを参照することによって、試料中に含まれる細菌の菌種の帰属を決定し、当該動物の腸内細菌叢の占有率データや多様性データを測定することができる。
腸内細菌叢の占有率データや多様性データの測定は、NGSなどのシーケンサーを用いたアンプリコンシーケンスなどの公知のメタゲノム解析法や細菌叢の解析方法を用いることができる。例えば、動物から糞便などの試料を採取し、試料中に含まれるあらゆる生物のDNAやRNAの塩基配列情報を次世代シーケンサーを用いて解析することによって、当該試料中に含まれる生物を同定する方法が挙げられる。好ましくは、試料中に含まれる16SrRNA遺伝子の全部又は一部を、必要に応じて増幅して、シーケンスを行い、得られた配列をソフトウェアを用いて解析し、試料中の細菌の組成データを得る方法が挙げられる。試料中の細菌の組成データを、ソフトウェアで処理すること、あるいは、Genbank、Greengenes、SILVA databaseといった遺伝子データベースを参照することによって、試料中に含まれる細菌の菌種の帰属を決定し、当該動物の腸内細菌叢の占有率データや多様性データを測定することができる。
NGS(次世代シーケンサー)を利用した16SrRNA遺伝子のアンプリコン解析(菌叢解析)の一例を具体的に説明する。まず、DNA抽出試薬を用いて糞便などの試料よりDNAを抽出し、抽出したDNAからPCRによって16SrRNA遺伝子を増幅する。その後、増幅したDNA断片についてNGSを用いて網羅的に塩基配列を決定し、低クオリティリードやキメラ配列の除去を行った後、配列同士をクラスタリングしてOTU(Operational Taxonomic Unit)解析を行う。OTUとは、ある一定以上の類似性(例えば、96~97%以上の相同性)を持つ配列同士を一つの菌種のように扱うための操作上の分類単位である。従って、OTU数は菌叢を構成する菌種の数を表し、同一のOTUに属するリードの数はその種の相対的な存在量を表していると考えられる。また、各OTUに属するリード数の中から代表的な配列を選び、データベース検索により科名や属種名の同定が可能となる。このようにして、特定の科に属する菌についての占有率や腸内細菌叢の多様度指数を測定することができる。
[判定手段]
本発明の判定手段は、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データと、その動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の事実とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患する予測とする学習済みモデルを含む。腸内細菌叢の占有率データ及び多様性データの取得時については、占有率データや多様性データを測定によって得るための測定対象となる試料の取得時を、腸内細菌叢の占有率データ及び多様性データの取得時としてもよい。すなわち、本明細書においては、「腸内細菌叢の占有率データ及び多様性データの取得時」といった場合、腸内細菌叢の占有率データ及び多様性データの取得時、又は、占有率データや多様性データを測定によって得るための測定対象となる試料の取得時のいずれも含み得る。
本発明の判定手段は、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データと、その動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の事実とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患する予測とする学習済みモデルを含む。腸内細菌叢の占有率データ及び多様性データの取得時については、占有率データや多様性データを測定によって得るための測定対象となる試料の取得時を、腸内細菌叢の占有率データ及び多様性データの取得時としてもよい。すなわち、本明細書においては、「腸内細菌叢の占有率データ及び多様性データの取得時」といった場合、腸内細菌叢の占有率データ及び多様性データの取得時、又は、占有率データや多様性データを測定によって得るための測定対象となる試料の取得時のいずれも含み得る。
前記学習済みモデルとしては、人工知能(AI)が好ましい。人工知能(AI)とは、人間の脳が行っている知的な作業をコンピュータで模倣したソフトウェアやシステムであり、具体的には、人間の使う自然言語を理解したり、論理的な推論を行ったり、経験から学習したりするコンピュータプログラムなどのことをいう。人工知能としては、汎用型、特化型のいずれであってもよく、ディープニューラルネットワーク、畳み込みニューラルネットワーク等のいずれであってもよく、公開されているソフトウェアを使用することができる。
学習済みモデルを生成するために、人工知能に教師データを用いて学習させる。学習としては、機械学習とデイープラーニング(深層学習)のいずれであってもよいが、機械学習が好ましい。ディープラーニングは、機械学習を発展させたものであり、特徴量を自動的に見つけ出す点に特徴がある。本発明では、特徴量として、腸内細菌叢の占有率データ及び多様性データを用いる。
学習済みモデルを生成するための学習方法としては、特に制限されず、公開されているソフトウェアを用いることができる。例えば、NVIDIAが公開しているDIGITS (the Deep Learning GPU Training System)を用いることができる。その他、例えば、「サポートベクターマシン入門」(共立出版)等において公開されている公知のサポートベクターマシン法(Support Vector Machine法)等によって学習させてもよい。
機械学習としては、教師無し学習及び教師あり学習のいずれでもあり得るが、教師あり学習が好ましい。教師あり学習の手法としては特に限定されず、例えば、決定木(ディシジョン・ツリー)、アンサンブル学習、勾配ブースティング等を挙げることができる。公開されている機械学習のアルゴリズムとしては、例えば、XGBoost、CatBoostやLightGBMが挙げられる。
学習のための教師データは、動物の腸内細菌叢の占有率データ及び多様性データと、その動物が腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内に、好ましくは3年以内、より好ましくは2年以内、さらに好ましくは1年以内、特に好ましくは180日以内に疾患に罹患したか、罹患しなかったかという疾患罹患の有無である。疾患に罹患したかしなかったかは、ダミー変数に置き換えることができる。教師データとしての動物の腸内細菌叢の占有率データ及び多様性データは、上記受付方法で説明した腸内細菌叢の占有率データ及び多様性データと同様である。当該動物が疾患に罹患したかどうかの情報は、例えば、保険請求の事実(「事故」ともいう)として、動物病院あるいは保険をかけた飼い主等から入手可能である。つまり、当該動物がペット保険をかけられた動物である場合、当該動物が病院にかかり疾患に罹患したとの診断を受ければ、動物病院あるいは飼い主(ペット保険の契約者)が、保険会社に対して疾患への罹患の事実とともに保険金支払いを請求するので、保険会社は当該動物が疾患に罹患したことを知ることができる。他方、腸内細菌叢の占有率データ及び多様性データの取得時から所定時間経過までに保険金の請求がなければ、保険をかけられた当該動物はその期間疾患に罹患しなかったと判断することができる。
学習済みモデルは、個々の疾患ごとに生成してもよく、複数の疾患をまとめて生成してもよい。個々の疾患ごとに学習済みモデルを生成する場合には、特定の疾患に罹患した動物について、当該疾患への罹患から所定期間前に取得された腸内細菌叢の占有率データ及び多様性データと、当該疾患に罹患したこと、比較対象として腸内細菌叢の占有率データ及び多様性データ取得時から所定期間疾患に罹患しなかった動物の腸内細菌叢の占有率データ及び多様性データと、所定期間疾患に罹患しなかったことを教師データとして学習を行う。複数の疾患をまとめて学習させる場合には、教師データとして、ある疾患に罹患した動物とその罹患から所定期間経過前に取得された腸内細菌叢の占有率データ及び多様性データ、その疾患とは別の疾患に罹患した動物とその罹患から所定期間前に取得された腸内細菌叢の占有率データ及び多様性データ、さらに別の疾患に罹患した動物とその罹患から所定期間経過前に取得された腸内細菌叢の占有率データ及び多様性データ、というように、複数の種類の教師データを用意すればよい。
[疾患]
本発明において対象となる疾患の種類は特に限定されず、例えば、皮膚系疾患、耳科系疾患、筋骨格系疾患、眼科系疾患、消化器系疾患、全身性疾患、泌尿器系疾患、肝・胆道系及び膵臓系疾患、循環器系疾患、神経系疾患、呼吸器系疾患、歯及び口腔系疾患、内分泌系疾患、生殖器系疾患、血液及び造血器系疾患が挙げられる。
皮膚系疾患としては、例えば、皮膚炎、アトピー性皮膚炎、膿皮症が挙げられる。
耳科系疾患としては、例えば、外耳炎、中耳炎が挙げられる。
筋骨格系疾患としては、例えば、膝蓋骨脱臼、椎間板ヘルニアが挙げられる。
眼科系疾患としては、例えば、結膜炎、目やに、角膜炎、角膜潰瘍/びらん、流涙症、白内障、緑内障が挙げられる。
消化器系疾患としては、例えば、胃炎、腸炎が挙げられる
全身性疾患としては、例えば、元気喪失、虚脱が挙げられる。
泌尿器系疾患としては、例えば、膀胱炎、尿石症が挙げられる。
肝・胆道系及び膵臓系疾患としては、例えば、胆泥症、慢性腎不全が挙げられる。
循環器系疾患としては、例えば、弁膜症、心筋症が挙げられる。
神経系疾患としては、例えば、てんかん、痙攣発作が挙げられる。
呼吸器系疾患としては、例えば、発咳、鼻炎、気管虚脱、気管支狭窄が挙げられる。
歯及び口腔系疾患としては、例えば、歯周病、口内炎が挙げられる。
内分泌系疾患としては、例えば、甲状腺機能低下症、糖尿病が挙げられる。
生殖器系疾患としては、例えば、乳腺腫瘍、亀頭炎が挙げられる。
血液及び造血器系疾患としては、例えば、リンパ組織の腫瘍、血小板減少症が挙げられる。
本発明において対象となる疾患の種類は特に限定されず、例えば、皮膚系疾患、耳科系疾患、筋骨格系疾患、眼科系疾患、消化器系疾患、全身性疾患、泌尿器系疾患、肝・胆道系及び膵臓系疾患、循環器系疾患、神経系疾患、呼吸器系疾患、歯及び口腔系疾患、内分泌系疾患、生殖器系疾患、血液及び造血器系疾患が挙げられる。
皮膚系疾患としては、例えば、皮膚炎、アトピー性皮膚炎、膿皮症が挙げられる。
耳科系疾患としては、例えば、外耳炎、中耳炎が挙げられる。
筋骨格系疾患としては、例えば、膝蓋骨脱臼、椎間板ヘルニアが挙げられる。
眼科系疾患としては、例えば、結膜炎、目やに、角膜炎、角膜潰瘍/びらん、流涙症、白内障、緑内障が挙げられる。
消化器系疾患としては、例えば、胃炎、腸炎が挙げられる
全身性疾患としては、例えば、元気喪失、虚脱が挙げられる。
泌尿器系疾患としては、例えば、膀胱炎、尿石症が挙げられる。
肝・胆道系及び膵臓系疾患としては、例えば、胆泥症、慢性腎不全が挙げられる。
循環器系疾患としては、例えば、弁膜症、心筋症が挙げられる。
神経系疾患としては、例えば、てんかん、痙攣発作が挙げられる。
呼吸器系疾患としては、例えば、発咳、鼻炎、気管虚脱、気管支狭窄が挙げられる。
歯及び口腔系疾患としては、例えば、歯周病、口内炎が挙げられる。
内分泌系疾患としては、例えば、甲状腺機能低下症、糖尿病が挙げられる。
生殖器系疾患としては、例えば、乳腺腫瘍、亀頭炎が挙げられる。
血液及び造血器系疾患としては、例えば、リンパ組織の腫瘍、血小板減少症が挙げられる。
[出力]
本発明の判定手段は、入力情報として、動物の腸内細菌叢の占有率データ及び多様性データを受け付けると、上記学習済みモデルによって、当該動物が腸内細菌叢の占有率データ及び多様性データ取得時から所定期間内、好ましくは3年以内、より好ましくは2年以内、さらに好ましくは1年以内に疾患に罹患するかどうかの予測判定を行う。
出力の形式は特に限定されず、例えば、パソコンの画面上において、「今後1年以内に疾患に罹患する可能性あり」、あるいは、「今後1年以内に疾患に罹患する可能性は低い」といった表示をすることで予測判定を出力することができる。
個々の疾患に特定した学習済みモデルを生成した場合には、腸内細菌叢の占有率データ及び多様性データ受付後所定期間内に当該疾患に罹患するかどうかの予測判定を行う。複数の疾患を含めて学習済みモデルを生成した場合には、腸内細菌叢の占有率データ及び多様性データ受付後所定期間内に、教師データに含まれていた疾患のうちの特定の疾患に罹患するかどうかの予測判定を行う。
本発明の疾患予測システムは、判定手段から判定結果を受信し、判定結果を出力する出力手段を別途有していてもよい。
本発明の判定手段は、入力情報として、動物の腸内細菌叢の占有率データ及び多様性データを受け付けると、上記学習済みモデルによって、当該動物が腸内細菌叢の占有率データ及び多様性データ取得時から所定期間内、好ましくは3年以内、より好ましくは2年以内、さらに好ましくは1年以内に疾患に罹患するかどうかの予測判定を行う。
出力の形式は特に限定されず、例えば、パソコンの画面上において、「今後1年以内に疾患に罹患する可能性あり」、あるいは、「今後1年以内に疾患に罹患する可能性は低い」といった表示をすることで予測判定を出力することができる。
個々の疾患に特定した学習済みモデルを生成した場合には、腸内細菌叢の占有率データ及び多様性データ受付後所定期間内に当該疾患に罹患するかどうかの予測判定を行う。複数の疾患を含めて学習済みモデルを生成した場合には、腸内細菌叢の占有率データ及び多様性データ受付後所定期間内に、教師データに含まれていた疾患のうちの特定の疾患に罹患するかどうかの予測判定を行う。
本発明の疾患予測システムは、判定手段から判定結果を受信し、判定結果を出力する出力手段を別途有していてもよい。
本発明の疾患予測システムは、さらに、判定手段から出力される予測結果を、別途入力された当該動物の遺伝子検査の結果に基づいて修正する判断手段を備えていてもよい。遺伝子検査の結果は、例えば、疾患を引き起こす可能性の高い遺伝子変異、SNPの検出結果である。遺伝子検査の結果が入力手段を通じて疾患予測システムに入力されると、疾患予測システムは、判断手段において、遺伝子検査の結果を、判定手段から出力される予測結果と組み合わせて最終的な予測結果を出力することができる。遺伝子検査の結果と組み合わせることによって、高い精度で疾患予測をすることができる。
本発明の疾患予測システムは、さらに、疾患の予測結果に応じて、生活改善方法を提案する提案手段を備えていてもよい。例えば、提案手段は、判定手段から出力される予測結果を受け取り、予測結果に応じて、予測される疾患ごとに疾患を予防するための食事、疾患になりにくい細菌を含むサプリ、低塩分、低カロリーの食事、低糖質の食事、ダイエットメニュー等を提案したり、推奨することができる。提案手段は、学習済みモデルを有していてもよい。
また、本発明の疾患の予測システム又は疾患の予測方法が出力する予測結果に応じて、疾患を防止するための飲料、食事、サプリメントを製造あるいはカスタマイズすることもできる。疾患予防に関するサービスとして、本発明の疾患の予測システム又は疾患の予測方法による予測、予測結果の提供、予測結果に応じた飲料、食事、サプリメントを製造あるいはカスタマイズ、当該飲料、食事、サプリメントの提案、推奨という形態もとり得る。また、このようなサービスを提供した後に、さらに本発明の疾患の予測方法を実施し、疾患への罹患傾向が改善したのかどうかを提示するといった方法も可能である。上記飲料、食事、サプリメントには、食餌療法用飲料、ダイエット食品、栄養補助用添加物等が含まれる。
このように、予測結果に応じた食事やフードの提案、製造、カスタマイズをすることによって、発症を遅らせたり、病状の改善、軽減が期待される。
このように、予測結果に応じた食事やフードの提案、製造、カスタマイズをすることによって、発症を遅らせたり、病状の改善、軽減が期待される。
[保険料算出システム]
本発明の保険料算出システムは、保険の対象となる動物の腸内細菌叢の占有率データ及び多様性データを上記の疾患予測システムに入力し、出力された疾患罹患の予測に応じて当該動物の保険料を決定するものである。保険料の決定には、疾患罹患の予測のほか、当該動物の顔画像、種類、品種、年齢、性別、体重、既往歴等の情報を用いてもよい。
以下、本発明の保険料算出システムの一実施態様について、図1を参照しながら説明する。
本発明の保険料算出システムは、保険の対象となる動物の腸内細菌叢の占有率データ及び多様性データを上記の疾患予測システムに入力し、出力された疾患罹患の予測に応じて当該動物の保険料を決定するものである。保険料の決定には、疾患罹患の予測のほか、当該動物の顔画像、種類、品種、年齢、性別、体重、既往歴等の情報を用いてもよい。
以下、本発明の保険料算出システムの一実施態様について、図1を参照しながら説明する。
図1中、端末40は、保険契約者(ユーザ)が利用する端末である。端末40は、例えばパーソナルコンピュータやタブレット端末などが挙げられる。端末40は、CPUなどの処理部、ハードディスク、ROMあるいはRAMなどの記憶部、液晶パネルなどの表示部、マウス、キーボード、タッチパネルなどの入力部、ネットワークアダプタなどの通信部などを含んで構成される。
保険契約者は、端末40から、サーバにアクセスし、保険の対象となる動物の腸内細菌叢の占有率データ及び多様性データ、顔画像(写真)、及び、当該動物の種類、品種、写真撮影時の年齢、体重、既往歴などの情報を入力、送信する。
また、保険契約者は、端末40がサーバにアクセスすることによって、サーバにおける疾患予測結果や保険料算出結果を受信することができる。
保険契約者は、端末40から、サーバにアクセスし、保険の対象となる動物の腸内細菌叢の占有率データ及び多様性データ、顔画像(写真)、及び、当該動物の種類、品種、写真撮影時の年齢、体重、既往歴などの情報を入力、送信する。
また、保険契約者は、端末40がサーバにアクセスすることによって、サーバにおける疾患予測結果や保険料算出結果を受信することができる。
また、保険契約者は、加入対象となるペットの腸内細菌叢を調べるための糞便サンプル採取キットの送付を受け、糞便サンプルを腸内細菌叢の測定を行う業者に送付する(図示しない)。当該業者は、当該ペットの腸内細菌叢の測定を行い、腸内細菌叢の占有率データ及び多様性データを取得する。そして、当該業者が、直接、自らの端末を経由してサーバの受付手段31に当該ペットの腸内細菌叢の占有率データ及び多様性データを入力、送信してもよいし、当該業者が別途郵便やメール等で当該ペットの腸内細菌叢の占有率データや多様性データを保険契約者に送付し、保険契約者が端末40を通じて、受付手段31に腸内細菌叢の占有率データ及び多様性データを入力、送信してもよい。
本実施形態においては、サーバはコンピュータによって構成されるが、本発明にかかる機能を有する限りにおいて、どのような装置であってもよい。
記憶部10は、例えばROM、RAMあるいはハードディスクなどから構成される。記憶部10には、サーバの各部を動作させるための情報処理プログラムが記憶され、特に、判定手段(学習済みモデル)11と、必要に応じて保険料算出手段12が記憶される。保険料の算出を目的とせず、単に疾患への罹患の予測を出力する疾患予測システムとして構成する場合には保険料算出手段12は無くてもよい。
記憶部10は、例えばROM、RAMあるいはハードディスクなどから構成される。記憶部10には、サーバの各部を動作させるための情報処理プログラムが記憶され、特に、判定手段(学習済みモデル)11と、必要に応じて保険料算出手段12が記憶される。保険料の算出を目的とせず、単に疾患への罹患の予測を出力する疾患予測システムとして構成する場合には保険料算出手段12は無くてもよい。
判定手段(学習済みモデル)11は、上記のように、保険契約者又は腸内細菌叢の測定を行った業者が入力した保険対象となる動物の腸内細菌叢の占有率データ及び多様性データを入力とし、当該動物が腸内細菌叢の占有率データ及び多様性データ取得時又は腸内細菌叢の占有率データ及び多様性データ入力時から所定期間内(例えば、半年以内)に特定の疾患に罹患するかどうかの予測を出力するものである。本実施形態における判定手段(学習済みモデル)11は、例えば、XGBoost、CatBoost、LightGBM、或いは、ディープニューラルネットワーク又は畳み込みニューラルネットワークを含んで構成される。
保険料算出手段12は、上記判定手段11が出力した疾患の罹患の予測と、保険契約者が入力した当該動物の種類、品種、腸内細菌叢の占有率データ及び多様性データ取得時の年齢、体重、既往歴などの情報から、当該動物の保険料を算出するソフトウェアである。例えば、ソフトウェアは、当該動物の種類、品種、腸内細菌叢の占有率データ及び多様性データ取得時の年齢、体重、既往歴等に応じて、保険料の等級分けを行い、最後に、上記判定手段11が出力した疾患の罹患の予測を加味して当該等級を修正し、最終的な保険料を算出するためのソフトウェアである。
保険料算出手段12と判定手段(学習済みモデル)11は一つのソフトウェアであってもよい。
保険料算出手段12と判定手段(学習済みモデル)11は一つのソフトウェアであってもよい。
処理演算部20は、記憶部に記憶された判定手段(学習済みモデル)11や保険料算出手段12を用いて、疾患の罹患の予測や保険料を算出する。
インターフェース部(通信部)30は、受付手段31と出力手段32を備え、保険契約者の端末から、動物の腸内細菌叢の占有率データ及び多様性データやその他の情報を受け付け、保険契約者の端末に対して、疾患の罹患の予測や保険料の算出結果を出力する。
本実施形態の保険料算出システムにより、保険契約者は、ペット保険の申し込みに加えて、動物の糞便サンプル等の試料を送付することで、ペット保険に加入していることを表すカード(ペット用の健康保険証)などが作成されると同時に、ペットの保険料や将来の疾患の罹患の予測結果を得ることができる。
[菌種数]
本発明の疾患予測システムは、教師データや入力データとして、腸内細菌叢の占有率データ及び多様性データに加えて、各科ごとの菌種数データを用いてもよい。
本発明の疾患予測システムは、教師データや入力データとして、腸内細菌叢の占有率データ及び多様性データに加えて、各科ごとの菌種数データを用いてもよい。
[好適な科]
上記のように、本発明の占有率データにおける占有率は、菌の門、綱、目、科、属、種のいずれのレベルにおける占有率であってもよいが、菌の科ごとの占有率が好ましい。そして、科としては、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、及び、ベイノレラ科(Veillonellaceae)からなる群から選ばれる1つ以上の科が好ましい。
上記のように、本発明の占有率データにおける占有率は、菌の門、綱、目、科、属、種のいずれのレベルにおける占有率であってもよいが、菌の科ごとの占有率が好ましい。そして、科としては、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、及び、ベイノレラ科(Veillonellaceae)からなる群から選ばれる1つ以上の科が好ましい。
また、本発明では、科として、上記に加えてストレプトコッカス科(Streptococcaceae)が好ましい。すなわち、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)及びストレプトコッカス科(Streptococcaceae)からなる群から選ばれる1つ以上の科が好ましい。
また、本発明では、科として、上記に加えてさらに、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)からなる群から選ばれる1つ以上の科が好ましい。すなわち、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、エンテロコッカス科(Enterococcaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)からなる群から選ばれる1つ以上の科が好ましい。
[アルカリゲネス科(Alcaligenaceae)]
アルカリゲネス科は、ブルクホルデリア目に属する科であり、アルカリゲネス属を含む。
アルカリゲネス科は、ブルクホルデリア目に属する科であり、アルカリゲネス属を含む。
[バクテロイデス科(Bacteroidaceae)]
バクテロイデス科は、バクテロイデス門バクテロイデス綱バクテロイデス目に属する科であり、バクテロイデス属を含む。
バクテロイデス科は、バクテロイデス門バクテロイデス綱バクテロイデス目に属する科であり、バクテロイデス属を含む。
[ビフィドバクテリウム科(Bifidobacteriaceae)]
ビフィドバクテリウム科は、ビフィドバクテリウム目に含まれる科であり、ビフィドバクテリウム属を含む。
ビフィドバクテリウム科は、ビフィドバクテリウム目に含まれる科であり、ビフィドバクテリウム属を含む。
[クロストリジウム科(Clostridiaceae)]
クロストリジウム科は、クロストリジウム目の科であり、クロストリジウム属を含む。
クロストリジウム科は、クロストリジウム目の科であり、クロストリジウム属を含む。
[コプロバチルス科(Coprobacillaceae)]
コプロバチルス科は、エリュシペロトリクス目に属する科であり、コプロバチルス属(Coprobacillus)を含む。
コプロバチルス科は、エリュシペロトリクス目に属する科であり、コプロバチルス属(Coprobacillus)を含む。
[コリオバクテリウム科(Coriobacteriaceae)]
コリオバクテリウム科は、コリオバクテリウム目に属する科であり、属として、コリンセラ属、コリオバクテリウム属、Atopobium、Olsenellaが含まれる。
コリオバクテリウム科は、コリオバクテリウム目に属する科であり、属として、コリンセラ属、コリオバクテリウム属、Atopobium、Olsenellaが含まれる。
[エンテロバクター科(Enterobacteriaceae)]
エンテロバクタ-科は、プロテオバクテリア門ガンマプロテオバクテリア綱エンテロバクター目に属する科である。エンテロバクター科には、属として、例えば、エンテロバクター属、エシェリキア属、クレブシエラ属、サルモネラ属、セラチア属、エルシニア属、Arsenophonus、Biostraticola、Candidatus、 Blochmannia、Brenneria、Buchnera、Budvicia、Buttiauxella、Cedecea、Citrobacter、Cosenzaea、Cronobacter、Dickeya、Edwardsiella、Erwiniaなどが含まれる。
エンテロバクタ-科は、プロテオバクテリア門ガンマプロテオバクテリア綱エンテロバクター目に属する科である。エンテロバクター科には、属として、例えば、エンテロバクター属、エシェリキア属、クレブシエラ属、サルモネラ属、セラチア属、エルシニア属、Arsenophonus、Biostraticola、Candidatus、 Blochmannia、Brenneria、Buchnera、Budvicia、Buttiauxella、Cedecea、Citrobacter、Cosenzaea、Cronobacter、Dickeya、Edwardsiella、Erwiniaなどが含まれる。
[エンテロコッカス科(Enterococcaceae)]
エンテロコッカス科は、ラクトバシラス目に属するグラム陽性の真正細菌の科である。 代表的な属として、エンテロコッカス属(Enterococcus)、Melissococcus、Pilibacter、テトラジェノコッカス属(Tetragenococcus)及びVagococcusが含まれる。
エンテロコッカス科は、ラクトバシラス目に属するグラム陽性の真正細菌の科である。 代表的な属として、エンテロコッカス属(Enterococcus)、Melissococcus、Pilibacter、テトラジェノコッカス属(Tetragenococcus)及びVagococcusが含まれる。
[エリュシペロトリクス科(Erysipelotrichaceae)]
エリュシペロトリクス科は、エリュシペロトリクス目に属する科であり、属として、Allobaculum、Breznakia、Bulleidia、Catenibacterium、Catenisphaera、 Coprobacillus、Dielma、Dubosiella、Eggerthia、Erysipelothrix、Faecalibaculum、Holdemania、Ileibacterium、Kandleria、Longicatena、Solobacterium Turicibacterが含まれる。
エリュシペロトリクス科は、エリュシペロトリクス目に属する科であり、属として、Allobaculum、Breznakia、Bulleidia、Catenibacterium、Catenisphaera、 Coprobacillus、Dielma、Dubosiella、Eggerthia、Erysipelothrix、Faecalibaculum、Holdemania、Ileibacterium、Kandleria、Longicatena、Solobacterium Turicibacterが含まれる。
[フソバクテリウム科(Fusobacteriaceae)]
フソバクテリウム科は、フソバクテリウム目に属する科であり、フソバクテリウム属を含む。
フソバクテリウム科は、フソバクテリウム目に属する科であり、フソバクテリウム属を含む。
[ラクノスピラ科(Lachnospiraceae)]
ラクノスピラ科は、クロストリジウム綱クロストリジウム目に含まれる科であり、ラクノスピラ属を含む。
ラクノスピラ科は、クロストリジウム綱クロストリジウム目に含まれる科であり、ラクノスピラ属を含む。
[ペプトストレプトコッカス科(Peptostreptococcaceae)]
ペプトストレプトコッカス科は、クロストリジウム綱クロストリジウム目に含まれる科である。ペプトストレプトコッカス属を含む。
ペプトストレプトコッカス科は、クロストリジウム綱クロストリジウム目に含まれる科である。ペプトストレプトコッカス属を含む。
[プレボテラ科(Prevotellaceae)]
プレボテラ科は、バクテロイデス目に属する科であり、プレボテラ属を含む。
プレボテラ科は、バクテロイデス目に属する科であり、プレボテラ属を含む。
[ルミノコッカス科(Ruminococcaceae)]
ルミノコッカス科は、クロストリジウム綱クロストリジウム目に属する細菌の科である。ルミノコッカス属のほか、属として、Acetanaerobacterium、Acutalibacter、
Anaerobacterium、Anaerofilum、Anaerotruncus、Dysosmobacter、Ercella、Ethanoligenens、Faecalibacterium、Fastidiosipila、Hydrogenoanaerobacterium、
Oscillibacter、Oscillospira、Papillibacter、Pseudobacteroides、Sporobacter、
Subdoligranulum、Youngiibacterが含まれる。
ルミノコッカス科は、クロストリジウム綱クロストリジウム目に属する細菌の科である。ルミノコッカス属のほか、属として、Acetanaerobacterium、Acutalibacter、
Anaerobacterium、Anaerofilum、Anaerotruncus、Dysosmobacter、Ercella、Ethanoligenens、Faecalibacterium、Fastidiosipila、Hydrogenoanaerobacterium、
Oscillibacter、Oscillospira、Papillibacter、Pseudobacteroides、Sporobacter、
Subdoligranulum、Youngiibacterが含まれる。
[ベイロネラ科(Veillonellaceae)]
ベイロネラ科は、Clostridiales目に属する科であり、属として、Acetonema、
Acidaminococcus、Allisonella、Anaeroarcus、Anaeroglobus、Anaeromusa、
Anaerosinus、Anaerospora、Anaerovibrio、Centipeda、Dendrosporobacter、
Desulfosporomusa、Dialister、Megamonas、Megasphaera、Mitsuokella、Pectinatus、
Pelosinus、Phascolarctobacterium、Propionispira、Propionispora、Psychrosinus、
Quinella、Schwartzia、Selenomonas、Sporomusa、Sporotalea、Succiniclasticum、
Succinispira、Thermosinus、Veillonella、Zymophilusを含む。
ベイロネラ科は、Clostridiales目に属する科であり、属として、Acetonema、
Acidaminococcus、Allisonella、Anaeroarcus、Anaeroglobus、Anaeromusa、
Anaerosinus、Anaerospora、Anaerovibrio、Centipeda、Dendrosporobacter、
Desulfosporomusa、Dialister、Megamonas、Megasphaera、Mitsuokella、Pectinatus、
Pelosinus、Phascolarctobacterium、Propionispira、Propionispora、Psychrosinus、
Quinella、Schwartzia、Selenomonas、Sporomusa、Sporotalea、Succiniclasticum、
Succinispira、Thermosinus、Veillonella、Zymophilusを含む。
[ストレプトコッカス科(Streptococcaceae)]
ストレプトコッカス科は、ラクトバシラス目の中に置かれ、ラクトコッカス属、ラクトウム属、ストレプトコッカス属を含む。
ストレプトコッカス科は、ラクトバシラス目の中に置かれ、ラクトコッカス属、ラクトウム属、ストレプトコッカス属を含む。
[カンピロバクター科(Campylobacteraceae)]
カンピロバクター科は、イプシロンプロテオバクテリア綱カンピロバクター目に属する科であり、カンピロバクター属を含む。
カンピロバクター科は、イプシロンプロテオバクテリア綱カンピロバクター目に属する科であり、カンピロバクター属を含む。
[デスルフォビブリオ科(Desulfovibrionaceae)]
デスルフォビブリオ科は、デルタプロテオバクテリア綱デスルフォビブリオ目に属する科であり、デスルフォビブリオ属を含む。
デスルフォビブリオ科は、デルタプロテオバクテリア綱デスルフォビブリオ目に属する科であり、デスルフォビブリオ属を含む。
[フラボバクテリウム科(Flavobacteriaceae)]
フラボバクテリウム科は、フラボバクテリウム綱フラボバクテリウム目に属する科であり、フラボバクテリウム属を含む。
フラボバクテリウム科は、フラボバクテリウム綱フラボバクテリウム目に属する科であり、フラボバクテリウム属を含む。
[ヘリコバクター科(Helicobacteraceae)]
ヘリコバクター科は、イプシロンプロテオバクテリア綱カンピロバクター目に属する科であり、ヘリコバクター属を含む。
ヘリコバクター科は、イプシロンプロテオバクテリア綱カンピロバクター目に属する科であり、ヘリコバクター属を含む。
[オドリバクター科(Odoribacteraceae)]
オドリバクター科は、バクテロイデス綱バクテロイデス目に属する科である。オドリバクター属を含む。
オドリバクター科は、バクテロイデス綱バクテロイデス目に属する科である。オドリバクター属を含む。
[パラプレボテラ科(Paraprevotellaceae)]
パラプレボテラ科は、バクテロイデス目に属する科であり、パラプレボテラ属を含む。また、パラプレボラ科を独立した科とせずに、パラプレボテラ属をプレボテラ科に含める分類方法もある。
パラプレボテラ科は、バクテロイデス目に属する科であり、パラプレボテラ属を含む。また、パラプレボラ科を独立した科とせずに、パラプレボテラ属をプレボテラ科に含める分類方法もある。
[ペプトコッカス科(Peptococcaceae)]
ペプトコッカス科は、クロストリジウム目に属する科であり、ペプトコッカス属を含む。
ペプトコッカス科は、クロストリジウム目に属する科であり、ペプトコッカス属を含む。
[ポルフィロモナス科(Porphyromonadaceae)]
ポルフィノモナス科は、バクテロイデス綱バクテロイデス目に属する科であり、ポルフィノモナス属を含む。
ポルフィノモナス科は、バクテロイデス綱バクテロイデス目に属する科であり、ポルフィノモナス属を含む。
[サクシニビブリオ科(Succinivibrionaceae)]
サクシニビブリオ科は、ガンマプロテオバクテリア綱エアロモナス目に属する科であり、エアロモナス属、アナエロビオスピリルム属を含む。
サクシニビブリオ科は、ガンマプロテオバクテリア綱エアロモナス目に属する科であり、エアロモナス属、アナエロビオスピリルム属を含む。
以下本発明の実施例を示す。本発明は以下の実施例に限定されるものではない。
[実施例1]
(糞便試料からのDNA抽出)
以下のようにして、各犬から糞便試料を採取し、DNAを抽出した。
犬の飼育者が糞便の採取キットを用いて、犬の糞便試料を採取した。当該糞便試料を受領し、水に懸濁した。
次に、糞便懸濁液200μLとLysis buffer(224μg/mLのProtenaseKを含む)810μLをビーズチューブに添加し、ビーズ式ホモジナイザーにてビーズ破砕(6,000rpm、破砕20秒、インターバル30秒、破砕20秒)を行った。その後、検体を70℃のヒートブロック上にて10分間静置することでProtenaseKによる処理を行い、続いて95℃のヒートブロック上にて5分間静置することでProtenaseKを不活化した。溶菌処理を行った検体はchemagic360(PerkinElmer)を用い、chemagicキットstool用プロトコルにてDNAの自動抽出を行い、100μLのDNA抽出液を得た。
[実施例1]
(糞便試料からのDNA抽出)
以下のようにして、各犬から糞便試料を採取し、DNAを抽出した。
犬の飼育者が糞便の採取キットを用いて、犬の糞便試料を採取した。当該糞便試料を受領し、水に懸濁した。
次に、糞便懸濁液200μLとLysis buffer(224μg/mLのProtenaseKを含む)810μLをビーズチューブに添加し、ビーズ式ホモジナイザーにてビーズ破砕(6,000rpm、破砕20秒、インターバル30秒、破砕20秒)を行った。その後、検体を70℃のヒートブロック上にて10分間静置することでProtenaseKによる処理を行い、続いて95℃のヒートブロック上にて5分間静置することでProtenaseKを不活化した。溶菌処理を行った検体はchemagic360(PerkinElmer)を用い、chemagicキットstool用プロトコルにてDNAの自動抽出を行い、100μLのDNA抽出液を得た。
(メタ16SRNA遺伝子シーケンス解析)
メタ16Sシーケンス解析はillumina 16S Metagenomic Sequencing Library Preparation(バージョン15044223 B)を改変して行った。まず、16SrRNA遺伝子の可変領域V3-V4を含む460bpの領域をユニバーサルプライマー(Illumina_16S_341FおよびIllumina_16S_805RPCR)を用いたPCRで増幅した。PCR反応液は10μLのDNA抽出液、0.05μLの各プライマー(100μM)、12.5μLの2xKAPA HiFi Hot-Start ReadyMix(F.Hoffmann-LaRoche、Switzerland)、2.4μLのPCRgrade waterを混合して調製した。PCRには95℃3分間の熱変性後、95℃30秒、55℃30秒、72℃30秒のサイクルを30回繰り返し、最後に72℃5分の伸長反応を行った。増幅産物は磁気ビーズを用いて精製し、50μLのBufferEB(QIAGEN、Germany)で溶出した。精製後の増幅産物はNextera XT Index Kit v2(illumina、CA、US)を用いてPCRを行い、インデックスを付加した。PCR反応液は2.5μLの増幅産物、2.5μLの各プライマー、12.5μLの2x KAPA HiFi Hot-Start ReadyMix、5μLのPCRgrade waterを混合して調製した。PCRには95℃3分間の熱変性後、95℃30秒、55℃30秒、72℃30秒のサイクルを12回繰り返し、最後に72℃5分の伸長反応を行った。インデックス付加を行った増幅産物は磁気ビーズを用いて精製し、80-105μLのBufferEBで溶出した。各増幅産物の濃度はNanoPhotometer(Implen、CA、US)で測定し、1.4nMに調製した後、等量ずつ混合し、これをシーケンス用ライブラリーとした。シーケンス用ライブラリーのDNA濃度および増幅産物のサイズを電気泳動にて確認し、これをMiSeqにより解析した。解析にはMiSeq Reagent Kit V3を用い、2×300bpのペアエンドシーケンスを行った。得られた配列はMiSeq Reporterにて解析し、細菌の組成データを得た。
上記で用いたユニバーサルプライマーの配列は以下のとおりである。このユニバーサルプライマーは市販されているものを購入することができる。
Illumina_16S_341F
5′-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCCTACGGGNGGCWGCAG- 3’
llumina_16S_805R
5′-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGACTACHVGGGTATCTAATCC- 3’
メタ16Sシーケンス解析はillumina 16S Metagenomic Sequencing Library Preparation(バージョン15044223 B)を改変して行った。まず、16SrRNA遺伝子の可変領域V3-V4を含む460bpの領域をユニバーサルプライマー(Illumina_16S_341FおよびIllumina_16S_805RPCR)を用いたPCRで増幅した。PCR反応液は10μLのDNA抽出液、0.05μLの各プライマー(100μM)、12.5μLの2xKAPA HiFi Hot-Start ReadyMix(F.Hoffmann-LaRoche、Switzerland)、2.4μLのPCRgrade waterを混合して調製した。PCRには95℃3分間の熱変性後、95℃30秒、55℃30秒、72℃30秒のサイクルを30回繰り返し、最後に72℃5分の伸長反応を行った。増幅産物は磁気ビーズを用いて精製し、50μLのBufferEB(QIAGEN、Germany)で溶出した。精製後の増幅産物はNextera XT Index Kit v2(illumina、CA、US)を用いてPCRを行い、インデックスを付加した。PCR反応液は2.5μLの増幅産物、2.5μLの各プライマー、12.5μLの2x KAPA HiFi Hot-Start ReadyMix、5μLのPCRgrade waterを混合して調製した。PCRには95℃3分間の熱変性後、95℃30秒、55℃30秒、72℃30秒のサイクルを12回繰り返し、最後に72℃5分の伸長反応を行った。インデックス付加を行った増幅産物は磁気ビーズを用いて精製し、80-105μLのBufferEBで溶出した。各増幅産物の濃度はNanoPhotometer(Implen、CA、US)で測定し、1.4nMに調製した後、等量ずつ混合し、これをシーケンス用ライブラリーとした。シーケンス用ライブラリーのDNA濃度および増幅産物のサイズを電気泳動にて確認し、これをMiSeqにより解析した。解析にはMiSeq Reagent Kit V3を用い、2×300bpのペアエンドシーケンスを行った。得られた配列はMiSeq Reporterにて解析し、細菌の組成データを得た。
上記で用いたユニバーサルプライマーの配列は以下のとおりである。このユニバーサルプライマーは市販されているものを購入することができる。
Illumina_16S_341F
5′-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCCTACGGGNGGCWGCAG- 3’
llumina_16S_805R
5′-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGACTACHVGGGTATCTAATCC- 3’
上記方法に従って、0歳以上の165040個体の全犬種について、腸内細菌叢の組成データを得て、科ごとの占有率及び多様度指数の測定を行った。
科ごとの占有率は、当該科に分類される菌のヒットレートとして算出した。
シャノン・ウィナーの多様度指数及びシンプソンの多様度指数は、QIIME2を用いて算出した。
科ごとの占有率は、当該科に分類される菌のヒットレートとして算出した。
シャノン・ウィナーの多様度指数及びシンプソンの多様度指数は、QIIME2を用いて算出した。
(疾患の罹患の有無の調査)
上記全犬種について、それぞれ糞便サンプル採取後180日以内に疾患に罹患したかを調査した。疾患への罹患の有無は、ペット保険の保険金請求記録を用い、糞便採取を行った各個体の糞便採取日後180日以内に保険金支払請求があったか否かで調査した。なお、疾患への罹患に関わらず、糞便採取日前90日以内に保険金支払請求のない契約で調査した。糞便採取日前90日以内に保険支払請求がなかったということは、糞便採取前は、疾患に罹患していなかったことが推定される。
上記全犬種について、それぞれ糞便サンプル採取後180日以内に疾患に罹患したかを調査した。疾患への罹患の有無は、ペット保険の保険金請求記録を用い、糞便採取を行った各個体の糞便採取日後180日以内に保険金支払請求があったか否かで調査した。なお、疾患への罹患に関わらず、糞便採取日前90日以内に保険金支払請求のない契約で調査した。糞便採取日前90日以内に保険支払請求がなかったということは、糞便採取前は、疾患に罹患していなかったことが推定される。
(学習済みモデルの生成)
上記で得られた全犬種の腸内細菌叢の占有率のうち、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)及びストレプトコッカス科(Streptococcaceae)のそれぞれの占有率を、値の大きさに応じて、「0」、「1」、「2」・・・「19」というようにラベル付けして占有率データに関する特徴量とした。また、シャノン・ウィーナーの多様度指数及びシンプソンの多様度指数についても、ラベル付けして多様性データに関する特徴量とした。上記科を選んだ理由は、犬の腸内細菌叢に含まれることが知られている300種ほどの科のうち、全犬(165040匹)の80%以上の犬の腸内細菌叢において、ヒットレートが0になっている科を排除し、残った科として選んだものである。
一方、疾患罹患の有無については、ダミー変数に置き換えて特徴量とした。
上記で得られた全犬種の腸内細菌叢の占有率のうち、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)及びストレプトコッカス科(Streptococcaceae)のそれぞれの占有率を、値の大きさに応じて、「0」、「1」、「2」・・・「19」というようにラベル付けして占有率データに関する特徴量とした。また、シャノン・ウィーナーの多様度指数及びシンプソンの多様度指数についても、ラベル付けして多様性データに関する特徴量とした。上記科を選んだ理由は、犬の腸内細菌叢に含まれることが知られている300種ほどの科のうち、全犬(165040匹)の80%以上の犬の腸内細菌叢において、ヒットレートが0になっている科を排除し、残った科として選んだものである。
一方、疾患罹患の有無については、ダミー変数に置き換えて特徴量とした。
上記の占有率データ及び多様性データと、疾患罹患の有無とを教師データとして用いて機械学習を行い、学習済みモデルを生成した。
決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークであるLightGBMを用いて学習を行った。
各疾患の教師データのサンプル数は以下の表1及び表2に記載のとおりであった。
決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークであるLightGBMを用いて学習を行った。
各疾患の教師データのサンプル数は以下の表1及び表2に記載のとおりであった。
(学習済みモデルを用いた疾患罹患の予測)
上記で生成した学習済みモデルを用いて、犬について疾患罹患の予測を行った。
上記機械学習に用いた犬とは別の犬300~700匹の糞便サンプルからの腸内細菌叢の測定を行い、占有率データ及び多様性データを得た。これらの占有率データ及び多様性データを学習済みモデルに入力し、疾患罹患の予測を行った。
予測結果の正解不正解は、糞便サンプル採取後180日以内の疾患罹患の有無によった。予測性能は、主にAUC(Area Under the ROC Curve)によって評価した。予測性能確認に用いたデータでのAUCが85%以上のときに「A」、75%以上85%未満のときに「B」、75%未満のときに「C」と評価した。結果を表3に示す。
上記で生成した学習済みモデルを用いて、犬について疾患罹患の予測を行った。
上記機械学習に用いた犬とは別の犬300~700匹の糞便サンプルからの腸内細菌叢の測定を行い、占有率データ及び多様性データを得た。これらの占有率データ及び多様性データを学習済みモデルに入力し、疾患罹患の予測を行った。
予測結果の正解不正解は、糞便サンプル採取後180日以内の疾患罹患の有無によった。予測性能は、主にAUC(Area Under the ROC Curve)によって評価した。予測性能確認に用いたデータでのAUCが85%以上のときに「A」、75%以上85%未満のときに「B」、75%未満のときに「C」と評価した。結果を表3に示す。
表3から明らかなように、本発明の学習済みモデルを含む疾患予測システムは、様々な疾患について高い予測性能を示した。
なお、各疾患に予測に重要であった特徴量をそれぞれ図2~図16に示す。図2~図16は、予測に用いている特徴量を重要度順に並べて、ビジュアル化したグラフである。グラフに記載されている値は、最終的に完成されたモデルにおいて、その特徴量が平均的にどれだけ予測モデルの中で評価基準を改善させることができたかを表すものであり、値自体はそれほど重要ではなく、相対値としての意味を持つものと理解できる。図2~図16から、上記の科全てが予測に必須ではなく、上記科のうち一部を特徴量として用いても疾患の予測が可能であることが示唆される。なお、「Others F」とは、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)及びストレプトコッカス科(Streptococcaceae)以外の科である。「Other_F」はヒットレートの総和が1にならないときの調整項である。
[実施例2]
(糞便試料からのDNA抽出)
上記犬の例と同様にして猫から糞便試料を採取し、DNAを抽出した。
(糞便試料からのDNA抽出)
上記犬の例と同様にして猫から糞便試料を採取し、DNAを抽出した。
(メタ16SRNA遺伝子シーケンス解析)
上記犬の例と同様にして猫の糞便試料についてメタ16Sシーケンス解析を行い、腸内細菌叢の細菌の組成データを得た。
上記犬の例と同様にして猫の糞便試料についてメタ16Sシーケンス解析を行い、腸内細菌叢の細菌の組成データを得た。
上記犬の例と同様にして、0歳以上の31040個体の全猫種について、腸内細菌叢の組成データを得て、科ごとの占有率及び多様度指数の測定を行った。
科ごとの占有率は、当該科に分類される菌のヒットレートとして算出した。
シャノン・ウィナーの多様度指数及びシンプソンの多様度指数は、QIIME2を用いて算出した。
科ごとの占有率は、当該科に分類される菌のヒットレートとして算出した。
シャノン・ウィナーの多様度指数及びシンプソンの多様度指数は、QIIME2を用いて算出した。
(疾患の罹患の有無の調査)
上記猫について、それぞれ糞便サンプル採取後180日以内に疾患に罹患したかを調査した。疾患への罹患の有無は、ペット保険の保険金請求記録を用い、糞便採取を行った各個体の糞便採取日後180日以内に保険金支払請求があったか否かで調査した。なお、疾患への罹患に関わらず、糞便採取日前90日以内に保険金支払請求のない契約で調査した。糞便採取日前90日以内に保険支払請求がなかったということは、糞便採取前は、疾患に罹患していなかったことが推定される。
上記猫について、それぞれ糞便サンプル採取後180日以内に疾患に罹患したかを調査した。疾患への罹患の有無は、ペット保険の保険金請求記録を用い、糞便採取を行った各個体の糞便採取日後180日以内に保険金支払請求があったか否かで調査した。なお、疾患への罹患に関わらず、糞便採取日前90日以内に保険金支払請求のない契約で調査した。糞便採取日前90日以内に保険支払請求がなかったということは、糞便採取前は、疾患に罹患していなかったことが推定される。
(学習済みモデルの生成)
上記で得られた猫の腸内細菌叢の占有率のうち、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)のそれぞれの占有率を、値の大きさに応じて、「0」、「1」、「2」・・・「19」というようにラベル付けして占有率データに関する特徴量とした。また、シャノン・ウィーナーの多様度指数及びシンプソンの多様度指数についても、ラベル付けして多様性データに関する特徴量とした。上記科を選んだ理由は、猫の腸内細菌叢に含まれることが知られている300種ほどの科のうち、全猫(31040匹)の80%以上の猫の腸内細菌叢において、ヒットレートが0になっている科を排除し、残った科として選んだものである。
一方、疾患罹患の有無については、ダミー変数に置き換えて特徴量とした。
上記で得られた猫の腸内細菌叢の占有率のうち、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)のそれぞれの占有率を、値の大きさに応じて、「0」、「1」、「2」・・・「19」というようにラベル付けして占有率データに関する特徴量とした。また、シャノン・ウィーナーの多様度指数及びシンプソンの多様度指数についても、ラベル付けして多様性データに関する特徴量とした。上記科を選んだ理由は、猫の腸内細菌叢に含まれることが知られている300種ほどの科のうち、全猫(31040匹)の80%以上の猫の腸内細菌叢において、ヒットレートが0になっている科を排除し、残った科として選んだものである。
一方、疾患罹患の有無については、ダミー変数に置き換えて特徴量とした。
上記の占有率データ及び多様性データと、疾患罹患の有無とを教師データとして用いて機械学習を行い、学習済みモデルを生成した。
機械学習は上記犬の例と同様である。
各疾患の教師データのサンプル数は以下の表4及び表5に記載のとおりであった。
機械学習は上記犬の例と同様である。
各疾患の教師データのサンプル数は以下の表4及び表5に記載のとおりであった。
(学習済みモデルを用いた疾患罹患の予測)
上記で生成した学習済みモデルを用いて、猫について疾患罹患の予測を行った。
上記機械学習に用いた猫とは別の猫150~3350匹の糞便サンプルからの腸内細菌叢の測定を行い、占有率データ及び多様性データを得た。これらの占有率データ及び多様性データを学習済みモデルに入力し、疾患罹患の予測を行った。
予測結果の正解不正解は、糞便サンプル採取後180日以内の疾患罹患の有無によった。予測性能は、主にAUC(Area Under the ROC Curve)によって評価した。予測性能確認に用いたデータでのAUCが85%以上のときに「A」、75%以上85%未満のときに「B」、75%未満のときに「C」と評価した。結果を表6に示す。
また、各疾患に予測に重要であった特徴量をそれぞれ図17~図31に示す。図17~図31は、図2~図16と同様に、予測に用いている特徴量を重要度順に並べて、ビジュアル化したグラフである。
上記で生成した学習済みモデルを用いて、猫について疾患罹患の予測を行った。
上記機械学習に用いた猫とは別の猫150~3350匹の糞便サンプルからの腸内細菌叢の測定を行い、占有率データ及び多様性データを得た。これらの占有率データ及び多様性データを学習済みモデルに入力し、疾患罹患の予測を行った。
予測結果の正解不正解は、糞便サンプル採取後180日以内の疾患罹患の有無によった。予測性能は、主にAUC(Area Under the ROC Curve)によって評価した。予測性能確認に用いたデータでのAUCが85%以上のときに「A」、75%以上85%未満のときに「B」、75%未満のときに「C」と評価した。結果を表6に示す。
また、各疾患に予測に重要であった特徴量をそれぞれ図17~図31に示す。図17~図31は、図2~図16と同様に、予測に用いている特徴量を重要度順に並べて、ビジュアル化したグラフである。
表6から明らかなように、本発明の学習済みモデルを含む疾患予測システムは、様々な疾患について高い予測性能を示した。
[実施例3]
上記と同じ方法で得られた犬の占有率データ及び多様性データの各特徴量について、以下の表7に記載された特徴量を用いて機械学習を行い、学習モデルを生成した。なお、対象疾患は皮膚疾患とした。
上記と同じ方法で得られた犬の占有率データ及び多様性データの各特徴量について、以下の表7に記載された特徴量を用いて機械学習を行い、学習モデルを生成した。なお、対象疾患は皮膚疾患とした。
上記表7のAUCから明らかなように、菌科として、10種類、7種類、3種類を用いた場合であっても、なお高い精度での疾患の予測が可能であった。
Claims (11)
- ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを受け付ける受付手段と、学習済みモデルを用いて、前記受付手段に入力された動物の腸内細菌叢の占有率データ及び多様性データからその動物が疾患に罹患するかを予測判定する判定手段と、を備える疾患予測システム。
- 前記学習済みモデルが、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする学習済みモデルである請求項1記載の疾患予測システム。
- 前記占有率データが、科ごとの占有率又は科ごとの占有率に基づいて設定されたラベルを含む請求項2記載の疾患予測システム。
- 前記占有率データが、
アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、及び、ベイノレラ科(Veillonellaceae)からなる群から選ばれる1つ以上の科の占有率又は当該占有率に基づいて設定されたラベルを含む請求項3記載の疾患予測システム。 - 前記占有率データが、さらに、ストレプトコッカス科(Streptococcaceae)の占有率又は当該占有率に基づいて設定されたラベルを含む請求項4記載の疾患予測システム。
- 前記占有率データが、さらに、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)からなる群から選ばれる1つ以上の科の占有率又は当該占有率に基づいて設定されたラベルを含む請求項4記載の疾患予測システム。
- 前記多様性データが、多様性指数または多様性指数に基づいて設定されたラベルを含む請求項1~6のいずれか一項記載の疾患予測システム。
- 保険の対象となる動物の腸内細菌叢の占有率データ及び多様性データを、請求項1~7のいずれか一項記載の疾患予測システムに入力し、出力された疾患罹患の予測に応じて当該動物の保険料を決定する保険料算出システム。
- ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データからその動物が所定期間内に疾患に罹患するかどうかの予測をする学習済みモデルの生成方法であって、教師データとして、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データと、その動物の腸内細菌叢の占有率データと多様性データを取得した時から所定期間内の疾患への罹患の有無とを人工知能を含むコンピュータに入力し、人工知能に学習させることを特徴とする学習済みモデルの生成方法。
- ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを取得するステップと、
前記占有率データ及び多様性データを学習済みモデルに入力し、コンピュータが前記学習済みモデルを用いて、入力された占有率データ及び多様性データから所定期間内に当該動物が疾患に罹患するかどうかの予測を出力するステップと、を有する疾患予測方法。 - 前記学習済みモデルが、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする学習済みモデルである請求項10記載の疾患予測方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021034812A JP2022135180A (ja) | 2021-03-04 | 2021-03-04 | 疾患予測システム、保険料算出システム及び疾患予測方法 |
EP22763277.5A EP4303804A1 (en) | 2021-03-04 | 2022-03-01 | Disease predicting system, insurance premium calculating system, and disease predicting method |
PCT/JP2022/008666 WO2022186223A1 (ja) | 2021-03-04 | 2022-03-01 | 疾患予測システム、保険料算出システム及び疾患予測方法 |
CN202280018443.6A CN116964683A (zh) | 2021-03-04 | 2022-03-01 | 疾病预测系统、保险费计算系统以及疾病预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021034812A JP2022135180A (ja) | 2021-03-04 | 2021-03-04 | 疾患予測システム、保険料算出システム及び疾患予測方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022135180A true JP2022135180A (ja) | 2022-09-15 |
Family
ID=83154465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021034812A Pending JP2022135180A (ja) | 2021-03-04 | 2021-03-04 | 疾患予測システム、保険料算出システム及び疾患予測方法 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4303804A1 (ja) |
JP (1) | JP2022135180A (ja) |
CN (1) | CN116964683A (ja) |
WO (1) | WO2022186223A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7326574B1 (ja) | 2022-07-29 | 2023-08-15 | アニコム ホールディングス株式会社 | 美容レベル推定システム、美容レベル推定方法、及び総合健康度推定システム及び総合健康度推定方法 |
US20230301765A1 (en) * | 2021-08-31 | 2023-09-28 | Anicom Holdings, Inc. | Prediction apparatus, prediction system and prediction method |
WO2024024795A1 (ja) * | 2022-07-29 | 2024-02-01 | アニコム ホールディングス株式会社 | 保険料算出システム、美容レベル推定システム、及び総合健康度推定システム |
WO2024142989A1 (ja) * | 2022-12-26 | 2024-07-04 | サントリーホールディングス株式会社 | 情報処理装置、情報処理方法及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012165716A (ja) * | 2011-02-16 | 2012-09-06 | Infocom Corp | 腸内常在菌解析情報を基にした食事支援システム |
JP6403901B2 (ja) | 2015-12-03 | 2018-10-10 | エムジーファーマ株式会社 | 健康肥満維持剤 |
JP6734457B1 (ja) * | 2019-10-28 | 2020-08-05 | アニコム ホールディングス株式会社 | 疾患予測システム、保険料算出システム及び疾患予測方法 |
-
2021
- 2021-03-04 JP JP2021034812A patent/JP2022135180A/ja active Pending
-
2022
- 2022-03-01 CN CN202280018443.6A patent/CN116964683A/zh active Pending
- 2022-03-01 WO PCT/JP2022/008666 patent/WO2022186223A1/ja active Application Filing
- 2022-03-01 EP EP22763277.5A patent/EP4303804A1/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230301765A1 (en) * | 2021-08-31 | 2023-09-28 | Anicom Holdings, Inc. | Prediction apparatus, prediction system and prediction method |
JP7326574B1 (ja) | 2022-07-29 | 2023-08-15 | アニコム ホールディングス株式会社 | 美容レベル推定システム、美容レベル推定方法、及び総合健康度推定システム及び総合健康度推定方法 |
WO2024024795A1 (ja) * | 2022-07-29 | 2024-02-01 | アニコム ホールディングス株式会社 | 保険料算出システム、美容レベル推定システム、及び総合健康度推定システム |
JP2024018856A (ja) * | 2022-07-29 | 2024-02-08 | アニコム ホールディングス株式会社 | 美容レベル推定システム、美容レベル推定方法、及び総合健康度推定システム及び総合健康度推定方法 |
WO2024142989A1 (ja) * | 2022-12-26 | 2024-07-04 | サントリーホールディングス株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN116964683A (zh) | 2023-10-27 |
WO2022186223A1 (ja) | 2022-09-09 |
EP4303804A1 (en) | 2024-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022186223A1 (ja) | 疾患予測システム、保険料算出システム及び疾患予測方法 | |
Maltecca et al. | Predicting growth and carcass traits in swine using microbiome data and machine learning algorithms | |
US11621055B2 (en) | Microorganism-related significance index metrics | |
WO2023276476A1 (ja) | 疾患罹患予測システム、保険料算出システム、疾患罹患予測方法及び保険料算出方法 | |
JP2020528285A (ja) | 微生物に関連する虫垂関連コンディションの特性評価のための方法及びシステム | |
JP2020532995A (ja) | 鼻マイクロバイオームに関連する鼻関連特徴解析 | |
JP2022079646A (ja) | 微生物ゲノム薬理学のための方法およびシステム | |
Garber et al. | Abrupt dietary changes between grass and hay alter faecal microbiota of ponies | |
WO2020084536A1 (en) | Aging markers of human microbiome and microbiomic aging clock | |
CN116472582A (zh) | 使用机器学习的动物诊断 | |
Lemay et al. | Quantitative trait loci (QTL) study identifies novel genomic regions associated to Chiari-like malformation in Griffon Bruxellois dogs | |
Reed et al. | The pelvic flexure separates distinct microbial communities in the equine hindgut | |
WO2023276475A1 (ja) | 死亡予測システム及び死亡予測方法 | |
WO2022163824A1 (ja) | 肥満の予測方法 | |
JP7326574B1 (ja) | 美容レベル推定システム、美容レベル推定方法、及び総合健康度推定システム及び総合健康度推定方法 | |
US20240318223A1 (en) | Method for predicting obesity | |
JP2022117397A (ja) | 肥満の予測方法 | |
WO2024024795A1 (ja) | 保険料算出システム、美容レベル推定システム、及び総合健康度推定システム | |
JP2024092723A (ja) | 保険料算出システム、及び保険料算出方法 | |
WO2023204162A1 (ja) | フード提案システム及びフード提案方法 | |
CN116802317A (zh) | 肥胖的预测方法 | |
JP7199486B1 (ja) | 予測装置、予測システム及び予測方法 | |
US20230048974A1 (en) | Systems and methods for improving livestock health and performance | |
Bornbusch et al. | Markers of fertility in reproductive microbiomes of male and female endangered black-footed ferrets (Mustela nigripes) | |
Wester et al. | Dysbiosis not observed in Canadian horse with free fecal liquid (FFL) using 16S rRNA sequencing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240130 |