JP2022135180A - 疾患予測システム、保険料算出システム及び疾患予測方法 - Google Patents

疾患予測システム、保険料算出システム及び疾患予測方法 Download PDF

Info

Publication number
JP2022135180A
JP2022135180A JP2021034812A JP2021034812A JP2022135180A JP 2022135180 A JP2022135180 A JP 2022135180A JP 2021034812 A JP2021034812 A JP 2021034812A JP 2021034812 A JP2021034812 A JP 2021034812A JP 2022135180 A JP2022135180 A JP 2022135180A
Authority
JP
Japan
Prior art keywords
data
disease
occupancy
diversity
animal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021034812A
Other languages
English (en)
Inventor
亮人 小泉
Akihito KOIZUMI
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anicom Holdings Inc
Original Assignee
Anicom Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anicom Holdings Inc filed Critical Anicom Holdings Inc
Priority to JP2021034812A priority Critical patent/JP2022135180A/ja
Priority to EP22763277.5A priority patent/EP4303804A1/en
Priority to PCT/JP2022/008666 priority patent/WO2022186223A1/ja
Priority to CN202280018443.6A priority patent/CN116964683A/zh
Publication of JP2022135180A publication Critical patent/JP2022135180A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Epidemiology (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

Figure 2022135180000001
【課題】簡易な方法で、動物が将来疾患に罹患する可能性を予測する疾患予測システム、学習済みモデルの生成方法及び疾患予測方法を提供する。
【解決手段】疾患予測システムは、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを受け付ける受付手段31と、学習済みモデルを用いて、受付手段31に入力された動物の腸内細菌叢の占有率データ及び多様性データからその動物が疾患に罹患するかを予測判定する判定手段11とを備える。判定手段は、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする。
【選択図】図1

Description

本発明は、疾患予測システム、保険料算出システム及び疾患予測方法に関し、詳しくは、動物の腸内細菌叢に関するデータから、動物の将来の疾患罹患可能性に関する情報を提供する疾患予測システム、保険料算出システム及び疾患予測方法に関する。
犬や猫、ウサギを始めとする愛玩動物、牛や豚を始めとする家畜は、人間にとってかけがえのない存在である。近年、人間が飼育する動物の平均寿命が大幅に伸びた一方で、動物がその一生の中で何らかの疾患に罹患することが多くなり、飼育者が負担する医療費の増大が問題となっている。
動物の健康を維持するためには、日頃の食事、運動などを通じた体調管理や不調への素早い対応が重要となるが、動物は、自己の言葉で体の不調を訴えることができないため、症状が進行して、外形的に観察可能な何らかの徴候が生じたときに飼育者が初めて動物の疾患の罹患に気付くのが実情である。
そのため、簡易な方法で、動物が将来疾患に罹患する可能性があるのかを知る手段が求められている。特に、疾患に罹患していない状態、症状が何ら現れていない状態において、将来の疾患罹患の可能性を知ることができれば、疾患の予防に向けた措置を具体的にとることが可能となるため、有用である。
特許文献1には、腸内細菌叢中、バクテロイデス門(Bacteroidetes)の細菌を増殖させ、ファーミキューテス門(Firmicutes)の細菌を減少させることによって、腸内細菌叢を有効に調整又は改善する効果を有する腸内細菌叢調整又は改善組成物が開示されているが、動物の腸内細菌叢に関するデータから当該動物が病気になるかどうかを予測する方法については開示されていない。
国際公開2017/094892号パンフレット
そこで、本発明は、簡易な方法で、動物が将来疾患に罹患する可能性を予測する疾患予測システム等を提供することを目的とする。
本発明者は、ペット保険に加入している動物の腸内細菌叢に関するデータと、当該動物の保険請求の有無、すなわち疾患罹患の有無についての膨大なデータを分析、検討した結果、動物の腸内細菌叢のデータを用いて当該動物が将来疾患に罹患するかどうかを予測することが可能になることを見出し、本発明を完成するに至った。
すなわち、本発明は以下の[1]~[11]である。
[1]ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを受け付ける受付手段と、学習済みモデルを用いて、前記受付手段に入力された動物の腸内細菌叢の占有率データ及び多様性データからその動物が疾患に罹患するかを予測判定する判定手段と、を備える疾患予測システム。
[2]前記学習済みモデルが、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする学習済みモデルである[1]の疾患予測システム。
[3]前記占有率データが、科ごとの占有率又は科ごとの占有率に基づいて設定されたラベルを含む[2]の疾患予測システム。
[4]前記占有率データが、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、及び、ベイノレラ科(Veillonellaceae)からなる群から選ばれる1つ以上の科の占有率又は当該占有率に基づいて設定されたラベルを含む[3]の疾患予測システム。
[5]前記占有率データが、さらに、ストレプトコッカス科(Streptococcaceae)の占有率又は当該占有率に基づいて設定されたラベルを含む[4]の疾患予測システム。
[6]前記占有率データが、さらに、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)からなる群から選ばれる1つ以上の科の占有率又は当該占有率に基づいて設定されたラベルを含む[4]の疾患予測システム。
[7]前記多様性データが、多様性指数または多様性指数に基づいて設定されたラベルを含む[1]~[6]のいずれかの疾患予測システム。
[8]保険の対象となる動物の腸内細菌叢の占有率データ及び多様性データを、[1]~[7]のいずれか一項記載の疾患予測システムに入力し、出力された疾患罹患の予測に応じて当該動物の保険料を決定する保険料算出システム。
[9]ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データからその動物が所定期間内に疾患に罹患するかどうかの予測をする学習済みモデルの生成方法であって、教師データとして、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データと、その動物の腸内細菌叢の占有率データと多様性データを取得した時から所定期間内の疾患への罹患の有無とを人工知能を含むコンピュータに入力し、人工知能に学習させることを特徴とする学習済みモデルの生成方法。
[10]ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを取得するステップと、前記占有率データ及び多様性データを学習済みモデルに入力し、コンピュータが前記学習済みモデルを用いて、入力された占有率データ及び多様性データから所定期間内に当該動物が疾患に罹患するかどうかの予測を出力するステップと、を有する疾患予測方法。
[11]前記学習済みモデルが、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする学習済みモデルである[10]の疾患予測方法。
本発明により、動物が将来疾患に罹患する可能性を予測する疾患予測システム、保険料算出システム、学習済みモデルの生成方法及び、疾患予測方法を提供することが可能となる。
保険料の算出システムの模式図である。 実施例1の結果を示すグラフ図であり、犬の循環器疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の呼吸器疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の消化器疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の肝・胆道及び膵疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例の結果を示すグラフ図であり、犬の泌尿器疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の生殖器疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の神経疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の眼および付属器の疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の耳の疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の歯及び口腔の疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の筋骨格疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の皮膚疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の血液及び造血器の疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の内分泌疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例1の結果を示すグラフ図であり、犬の全身性疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の循環器疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の呼吸器疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の消化器疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の肝・胆道系及び膵系疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の泌尿器疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の生殖器疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の神経疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の眼及び付属器の疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の耳の疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の歯及び口腔の疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の筋骨格疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の皮膚疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の血液及び造血器の疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の内分泌疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。 実施例2の結果を示すグラフ図であり、猫の全身性疾患罹患の予測をするのに重要であった特徴量を示すグラフ図である。
[疾患予測システム]
本発明の疾患予測システムは、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データの入力を受け付ける受付手段と、学習済みモデルを用いて、前記受付手段に入力された動物の腸内細菌叢の占有率データ及び多様性データからその動物の疾患罹患の予測を判定し出力する判定手段と、を備える。
[受付手段]
本発明の受付手段は、疾患への罹患を予測したい動物の腸内細菌叢の占有率データ及び多様性データの入力を受け付ける手段である。動物としては、犬、猫、鳥、ウサギ、フェレット等が挙げられる。占有率データ及び多様性データの受付方法は、端末へのデータの入力、送信などいずれの方法であってもよい。
[占有率データ]
占有率データとは、動物の腸内細菌叢に含まれる各菌の占有率に関連するデータである。占有率とは、腸内細菌叢に占める各菌種の存在比(検出比率)であり、例えば、NGSなどのシーケンサーを用いたアンプリコンシーケンスなどの公知のメタゲノム解析法での検出結果「hit rate」として測定することができる。本発明では、占有率データとして、腸内細菌叢の占有率又は占有率に基づいて設定されたラベルを用いることができる。
占有率としては、菌の門、綱、目、科、属、種のいずれのレベルにおける占有率であってもよいが、菌の科ごとの占有率が好ましい。科ごとの占有率とは、ある科に属する菌全体についての占有率である。つまり、科ごとの占有率を算定する場合には、腸内細菌叢における各菌種について、ある科に属する菌種の占有率を合計して、当該科の占有率を算定する。種レベルや属レベルまでの同定を行って、科ごとに合計してもよいし、種レベルや属レベルまでの同定を行わずに、科レベルでの同定を行って科の占有率を算定してもよい。
占有率に基づいて設定されたラベルとは、占有率の数値の大小に応じて適宜設定されたラベルである。例えば、占有率の数値に応じて、「大」、「中」、「小」或いは「多」、「中」、「少」という3段階のラベルを設定することができる。また、ラベルの段階数は任意に設定することができ、例えば、「0」、「1」、「2」、「3」、・・・「20」といった多段階のラベルを付すこともできる。
ラベルを用いる場合は、腸内細菌叢中の占有率を測定し、入力手段に数値を入力する前に、当該測定された占有率に応じて、予め定めておいた対応表から特定のラベルを割当てて、そのラベルを受付手段に入力することができる。
[多様性データ]
多様性データとは、動物の腸内細菌叢の菌の多様性に関連するデータである。腸内細菌叢の多様性が大きいということは、当該腸内細菌叢に様々な種類の菌が幅広く含まれるということである。多様性を表す指標、いわゆる多様性指数には幾つかの種類があるが、本発明では公知のいずれのものであってもよい。多様性指数としては、例えば、シャノン・ウィーナーの多様度指数、シンプソンの多様度指数が挙げられる。
[占有率データや多様性データの測定]
腸内細菌叢の占有率データや多様性データの測定は、NGSなどのシーケンサーを用いたアンプリコンシーケンスなどの公知のメタゲノム解析法や細菌叢の解析方法を用いることができる。例えば、動物から糞便などの試料を採取し、試料中に含まれるあらゆる生物のDNAやRNAの塩基配列情報を次世代シーケンサーを用いて解析することによって、当該試料中に含まれる生物を同定する方法が挙げられる。好ましくは、試料中に含まれる16SrRNA遺伝子の全部又は一部を、必要に応じて増幅して、シーケンスを行い、得られた配列をソフトウェアを用いて解析し、試料中の細菌の組成データを得る方法が挙げられる。試料中の細菌の組成データを、ソフトウェアで処理すること、あるいは、Genbank、Greengenes、SILVA databaseといった遺伝子データベースを参照することによって、試料中に含まれる細菌の菌種の帰属を決定し、当該動物の腸内細菌叢の占有率データや多様性データを測定することができる。
NGS(次世代シーケンサー)を利用した16SrRNA遺伝子のアンプリコン解析(菌叢解析)の一例を具体的に説明する。まず、DNA抽出試薬を用いて糞便などの試料よりDNAを抽出し、抽出したDNAからPCRによって16SrRNA遺伝子を増幅する。その後、増幅したDNA断片についてNGSを用いて網羅的に塩基配列を決定し、低クオリティリードやキメラ配列の除去を行った後、配列同士をクラスタリングしてOTU(Operational Taxonomic Unit)解析を行う。OTUとは、ある一定以上の類似性(例えば、96~97%以上の相同性)を持つ配列同士を一つの菌種のように扱うための操作上の分類単位である。従って、OTU数は菌叢を構成する菌種の数を表し、同一のOTUに属するリードの数はその種の相対的な存在量を表していると考えられる。また、各OTUに属するリード数の中から代表的な配列を選び、データベース検索により科名や属種名の同定が可能となる。このようにして、特定の科に属する菌についての占有率や腸内細菌叢の多様度指数を測定することができる。
[判定手段]
本発明の判定手段は、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データと、その動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の事実とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患する予測とする学習済みモデルを含む。腸内細菌叢の占有率データ及び多様性データの取得時については、占有率データや多様性データを測定によって得るための測定対象となる試料の取得時を、腸内細菌叢の占有率データ及び多様性データの取得時としてもよい。すなわち、本明細書においては、「腸内細菌叢の占有率データ及び多様性データの取得時」といった場合、腸内細菌叢の占有率データ及び多様性データの取得時、又は、占有率データや多様性データを測定によって得るための測定対象となる試料の取得時のいずれも含み得る。
前記学習済みモデルとしては、人工知能(AI)が好ましい。人工知能(AI)とは、人間の脳が行っている知的な作業をコンピュータで模倣したソフトウェアやシステムであり、具体的には、人間の使う自然言語を理解したり、論理的な推論を行ったり、経験から学習したりするコンピュータプログラムなどのことをいう。人工知能としては、汎用型、特化型のいずれであってもよく、ディープニューラルネットワーク、畳み込みニューラルネットワーク等のいずれであってもよく、公開されているソフトウェアを使用することができる。
学習済みモデルを生成するために、人工知能に教師データを用いて学習させる。学習としては、機械学習とデイープラーニング(深層学習)のいずれであってもよいが、機械学習が好ましい。ディープラーニングは、機械学習を発展させたものであり、特徴量を自動的に見つけ出す点に特徴がある。本発明では、特徴量として、腸内細菌叢の占有率データ及び多様性データを用いる。
学習済みモデルを生成するための学習方法としては、特に制限されず、公開されているソフトウェアを用いることができる。例えば、NVIDIAが公開しているDIGITS (the Deep Learning GPU Training System)を用いることができる。その他、例えば、「サポートベクターマシン入門」(共立出版)等において公開されている公知のサポートベクターマシン法(Support Vector Machine法)等によって学習させてもよい。
機械学習としては、教師無し学習及び教師あり学習のいずれでもあり得るが、教師あり学習が好ましい。教師あり学習の手法としては特に限定されず、例えば、決定木(ディシジョン・ツリー)、アンサンブル学習、勾配ブースティング等を挙げることができる。公開されている機械学習のアルゴリズムとしては、例えば、XGBoost、CatBoostやLightGBMが挙げられる。
学習のための教師データは、動物の腸内細菌叢の占有率データ及び多様性データと、その動物が腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内に、好ましくは3年以内、より好ましくは2年以内、さらに好ましくは1年以内、特に好ましくは180日以内に疾患に罹患したか、罹患しなかったかという疾患罹患の有無である。疾患に罹患したかしなかったかは、ダミー変数に置き換えることができる。教師データとしての動物の腸内細菌叢の占有率データ及び多様性データは、上記受付方法で説明した腸内細菌叢の占有率データ及び多様性データと同様である。当該動物が疾患に罹患したかどうかの情報は、例えば、保険請求の事実(「事故」ともいう)として、動物病院あるいは保険をかけた飼い主等から入手可能である。つまり、当該動物がペット保険をかけられた動物である場合、当該動物が病院にかかり疾患に罹患したとの診断を受ければ、動物病院あるいは飼い主(ペット保険の契約者)が、保険会社に対して疾患への罹患の事実とともに保険金支払いを請求するので、保険会社は当該動物が疾患に罹患したことを知ることができる。他方、腸内細菌叢の占有率データ及び多様性データの取得時から所定時間経過までに保険金の請求がなければ、保険をかけられた当該動物はその期間疾患に罹患しなかったと判断することができる。
学習済みモデルは、個々の疾患ごとに生成してもよく、複数の疾患をまとめて生成してもよい。個々の疾患ごとに学習済みモデルを生成する場合には、特定の疾患に罹患した動物について、当該疾患への罹患から所定期間前に取得された腸内細菌叢の占有率データ及び多様性データと、当該疾患に罹患したこと、比較対象として腸内細菌叢の占有率データ及び多様性データ取得時から所定期間疾患に罹患しなかった動物の腸内細菌叢の占有率データ及び多様性データと、所定期間疾患に罹患しなかったことを教師データとして学習を行う。複数の疾患をまとめて学習させる場合には、教師データとして、ある疾患に罹患した動物とその罹患から所定期間経過前に取得された腸内細菌叢の占有率データ及び多様性データ、その疾患とは別の疾患に罹患した動物とその罹患から所定期間前に取得された腸内細菌叢の占有率データ及び多様性データ、さらに別の疾患に罹患した動物とその罹患から所定期間経過前に取得された腸内細菌叢の占有率データ及び多様性データ、というように、複数の種類の教師データを用意すればよい。
[疾患]
本発明において対象となる疾患の種類は特に限定されず、例えば、皮膚系疾患、耳科系疾患、筋骨格系疾患、眼科系疾患、消化器系疾患、全身性疾患、泌尿器系疾患、肝・胆道系及び膵臓系疾患、循環器系疾患、神経系疾患、呼吸器系疾患、歯及び口腔系疾患、内分泌系疾患、生殖器系疾患、血液及び造血器系疾患が挙げられる。
皮膚系疾患としては、例えば、皮膚炎、アトピー性皮膚炎、膿皮症が挙げられる。
耳科系疾患としては、例えば、外耳炎、中耳炎が挙げられる。
筋骨格系疾患としては、例えば、膝蓋骨脱臼、椎間板ヘルニアが挙げられる。
眼科系疾患としては、例えば、結膜炎、目やに、角膜炎、角膜潰瘍/びらん、流涙症、白内障、緑内障が挙げられる。
消化器系疾患としては、例えば、胃炎、腸炎が挙げられる
全身性疾患としては、例えば、元気喪失、虚脱が挙げられる。
泌尿器系疾患としては、例えば、膀胱炎、尿石症が挙げられる。
肝・胆道系及び膵臓系疾患としては、例えば、胆泥症、慢性腎不全が挙げられる。
循環器系疾患としては、例えば、弁膜症、心筋症が挙げられる。
神経系疾患としては、例えば、てんかん、痙攣発作が挙げられる。
呼吸器系疾患としては、例えば、発咳、鼻炎、気管虚脱、気管支狭窄が挙げられる。
歯及び口腔系疾患としては、例えば、歯周病、口内炎が挙げられる。
内分泌系疾患としては、例えば、甲状腺機能低下症、糖尿病が挙げられる。
生殖器系疾患としては、例えば、乳腺腫瘍、亀頭炎が挙げられる。
血液及び造血器系疾患としては、例えば、リンパ組織の腫瘍、血小板減少症が挙げられる。
[出力]
本発明の判定手段は、入力情報として、動物の腸内細菌叢の占有率データ及び多様性データを受け付けると、上記学習済みモデルによって、当該動物が腸内細菌叢の占有率データ及び多様性データ取得時から所定期間内、好ましくは3年以内、より好ましくは2年以内、さらに好ましくは1年以内に疾患に罹患するかどうかの予測判定を行う。
出力の形式は特に限定されず、例えば、パソコンの画面上において、「今後1年以内に疾患に罹患する可能性あり」、あるいは、「今後1年以内に疾患に罹患する可能性は低い」といった表示をすることで予測判定を出力することができる。
個々の疾患に特定した学習済みモデルを生成した場合には、腸内細菌叢の占有率データ及び多様性データ受付後所定期間内に当該疾患に罹患するかどうかの予測判定を行う。複数の疾患を含めて学習済みモデルを生成した場合には、腸内細菌叢の占有率データ及び多様性データ受付後所定期間内に、教師データに含まれていた疾患のうちの特定の疾患に罹患するかどうかの予測判定を行う。
本発明の疾患予測システムは、判定手段から判定結果を受信し、判定結果を出力する出力手段を別途有していてもよい。
本発明の疾患予測システムは、さらに、判定手段から出力される予測結果を、別途入力された当該動物の遺伝子検査の結果に基づいて修正する判断手段を備えていてもよい。遺伝子検査の結果は、例えば、疾患を引き起こす可能性の高い遺伝子変異、SNPの検出結果である。遺伝子検査の結果が入力手段を通じて疾患予測システムに入力されると、疾患予測システムは、判断手段において、遺伝子検査の結果を、判定手段から出力される予測結果と組み合わせて最終的な予測結果を出力することができる。遺伝子検査の結果と組み合わせることによって、高い精度で疾患予測をすることができる。
本発明の疾患予測システムは、さらに、疾患の予測結果に応じて、生活改善方法を提案する提案手段を備えていてもよい。例えば、提案手段は、判定手段から出力される予測結果を受け取り、予測結果に応じて、予測される疾患ごとに疾患を予防するための食事、疾患になりにくい細菌を含むサプリ、低塩分、低カロリーの食事、低糖質の食事、ダイエットメニュー等を提案したり、推奨することができる。提案手段は、学習済みモデルを有していてもよい。
また、本発明の疾患の予測システム又は疾患の予測方法が出力する予測結果に応じて、疾患を防止するための飲料、食事、サプリメントを製造あるいはカスタマイズすることもできる。疾患予防に関するサービスとして、本発明の疾患の予測システム又は疾患の予測方法による予測、予測結果の提供、予測結果に応じた飲料、食事、サプリメントを製造あるいはカスタマイズ、当該飲料、食事、サプリメントの提案、推奨という形態もとり得る。また、このようなサービスを提供した後に、さらに本発明の疾患の予測方法を実施し、疾患への罹患傾向が改善したのかどうかを提示するといった方法も可能である。上記飲料、食事、サプリメントには、食餌療法用飲料、ダイエット食品、栄養補助用添加物等が含まれる。
このように、予測結果に応じた食事やフードの提案、製造、カスタマイズをすることによって、発症を遅らせたり、病状の改善、軽減が期待される。
[保険料算出システム]
本発明の保険料算出システムは、保険の対象となる動物の腸内細菌叢の占有率データ及び多様性データを上記の疾患予測システムに入力し、出力された疾患罹患の予測に応じて当該動物の保険料を決定するものである。保険料の決定には、疾患罹患の予測のほか、当該動物の顔画像、種類、品種、年齢、性別、体重、既往歴等の情報を用いてもよい。
以下、本発明の保険料算出システムの一実施態様について、図1を参照しながら説明する。
図1中、端末40は、保険契約者(ユーザ)が利用する端末である。端末40は、例えばパーソナルコンピュータやタブレット端末などが挙げられる。端末40は、CPUなどの処理部、ハードディスク、ROMあるいはRAMなどの記憶部、液晶パネルなどの表示部、マウス、キーボード、タッチパネルなどの入力部、ネットワークアダプタなどの通信部などを含んで構成される。
保険契約者は、端末40から、サーバにアクセスし、保険の対象となる動物の腸内細菌叢の占有率データ及び多様性データ、顔画像(写真)、及び、当該動物の種類、品種、写真撮影時の年齢、体重、既往歴などの情報を入力、送信する。
また、保険契約者は、端末40がサーバにアクセスすることによって、サーバにおける疾患予測結果や保険料算出結果を受信することができる。
また、保険契約者は、加入対象となるペットの腸内細菌叢を調べるための糞便サンプル採取キットの送付を受け、糞便サンプルを腸内細菌叢の測定を行う業者に送付する(図示しない)。当該業者は、当該ペットの腸内細菌叢の測定を行い、腸内細菌叢の占有率データ及び多様性データを取得する。そして、当該業者が、直接、自らの端末を経由してサーバの受付手段31に当該ペットの腸内細菌叢の占有率データ及び多様性データを入力、送信してもよいし、当該業者が別途郵便やメール等で当該ペットの腸内細菌叢の占有率データや多様性データを保険契約者に送付し、保険契約者が端末40を通じて、受付手段31に腸内細菌叢の占有率データ及び多様性データを入力、送信してもよい。
本実施形態においては、サーバはコンピュータによって構成されるが、本発明にかかる機能を有する限りにおいて、どのような装置であってもよい。
記憶部10は、例えばROM、RAMあるいはハードディスクなどから構成される。記憶部10には、サーバの各部を動作させるための情報処理プログラムが記憶され、特に、判定手段(学習済みモデル)11と、必要に応じて保険料算出手段12が記憶される。保険料の算出を目的とせず、単に疾患への罹患の予測を出力する疾患予測システムとして構成する場合には保険料算出手段12は無くてもよい。
判定手段(学習済みモデル)11は、上記のように、保険契約者又は腸内細菌叢の測定を行った業者が入力した保険対象となる動物の腸内細菌叢の占有率データ及び多様性データを入力とし、当該動物が腸内細菌叢の占有率データ及び多様性データ取得時又は腸内細菌叢の占有率データ及び多様性データ入力時から所定期間内(例えば、半年以内)に特定の疾患に罹患するかどうかの予測を出力するものである。本実施形態における判定手段(学習済みモデル)11は、例えば、XGBoost、CatBoost、LightGBM、或いは、ディープニューラルネットワーク又は畳み込みニューラルネットワークを含んで構成される。
保険料算出手段12は、上記判定手段11が出力した疾患の罹患の予測と、保険契約者が入力した当該動物の種類、品種、腸内細菌叢の占有率データ及び多様性データ取得時の年齢、体重、既往歴などの情報から、当該動物の保険料を算出するソフトウェアである。例えば、ソフトウェアは、当該動物の種類、品種、腸内細菌叢の占有率データ及び多様性データ取得時の年齢、体重、既往歴等に応じて、保険料の等級分けを行い、最後に、上記判定手段11が出力した疾患の罹患の予測を加味して当該等級を修正し、最終的な保険料を算出するためのソフトウェアである。
保険料算出手段12と判定手段(学習済みモデル)11は一つのソフトウェアであってもよい。
処理演算部20は、記憶部に記憶された判定手段(学習済みモデル)11や保険料算出手段12を用いて、疾患の罹患の予測や保険料を算出する。
インターフェース部(通信部)30は、受付手段31と出力手段32を備え、保険契約者の端末から、動物の腸内細菌叢の占有率データ及び多様性データやその他の情報を受け付け、保険契約者の端末に対して、疾患の罹患の予測や保険料の算出結果を出力する。
本実施形態の保険料算出システムにより、保険契約者は、ペット保険の申し込みに加えて、動物の糞便サンプル等の試料を送付することで、ペット保険に加入していることを表すカード(ペット用の健康保険証)などが作成されると同時に、ペットの保険料や将来の疾患の罹患の予測結果を得ることができる。
[菌種数]
本発明の疾患予測システムは、教師データや入力データとして、腸内細菌叢の占有率データ及び多様性データに加えて、各科ごとの菌種数データを用いてもよい。
[好適な科]
上記のように、本発明の占有率データにおける占有率は、菌の門、綱、目、科、属、種のいずれのレベルにおける占有率であってもよいが、菌の科ごとの占有率が好ましい。そして、科としては、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、及び、ベイノレラ科(Veillonellaceae)からなる群から選ばれる1つ以上の科が好ましい。
また、本発明では、科として、上記に加えてストレプトコッカス科(Streptococcaceae)が好ましい。すなわち、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)及びストレプトコッカス科(Streptococcaceae)からなる群から選ばれる1つ以上の科が好ましい。
また、本発明では、科として、上記に加えてさらに、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)からなる群から選ばれる1つ以上の科が好ましい。すなわち、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、エンテロコッカス科(Enterococcaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)からなる群から選ばれる1つ以上の科が好ましい。
[アルカリゲネス科(Alcaligenaceae)]
アルカリゲネス科は、ブルクホルデリア目に属する科であり、アルカリゲネス属を含む。
[バクテロイデス科(Bacteroidaceae)]
バクテロイデス科は、バクテロイデス門バクテロイデス綱バクテロイデス目に属する科であり、バクテロイデス属を含む。
[ビフィドバクテリウム科(Bifidobacteriaceae)]
ビフィドバクテリウム科は、ビフィドバクテリウム目に含まれる科であり、ビフィドバクテリウム属を含む。
[クロストリジウム科(Clostridiaceae)]
クロストリジウム科は、クロストリジウム目の科であり、クロストリジウム属を含む。
[コプロバチルス科(Coprobacillaceae)]
コプロバチルス科は、エリュシペロトリクス目に属する科であり、コプロバチルス属(Coprobacillus)を含む。
[コリオバクテリウム科(Coriobacteriaceae)]
コリオバクテリウム科は、コリオバクテリウム目に属する科であり、属として、コリンセラ属、コリオバクテリウム属、Atopobium、Olsenellaが含まれる。
[エンテロバクター科(Enterobacteriaceae)]
エンテロバクタ-科は、プロテオバクテリア門ガンマプロテオバクテリア綱エンテロバクター目に属する科である。エンテロバクター科には、属として、例えば、エンテロバクター属、エシェリキア属、クレブシエラ属、サルモネラ属、セラチア属、エルシニア属、Arsenophonus、Biostraticola、Candidatus、 Blochmannia、Brenneria、Buchnera、Budvicia、Buttiauxella、Cedecea、Citrobacter、Cosenzaea、Cronobacter、Dickeya、Edwardsiella、Erwiniaなどが含まれる。
[エンテロコッカス科(Enterococcaceae)]
エンテロコッカス科は、ラクトバシラス目に属するグラム陽性の真正細菌の科である。 代表的な属として、エンテロコッカス属(Enterococcus)、Melissococcus、Pilibacter、テトラジェノコッカス属(Tetragenococcus)及びVagococcusが含まれる。
[エリュシペロトリクス科(Erysipelotrichaceae)]
エリュシペロトリクス科は、エリュシペロトリクス目に属する科であり、属として、Allobaculum、Breznakia、Bulleidia、Catenibacterium、Catenisphaera、 Coprobacillus、Dielma、Dubosiella、Eggerthia、Erysipelothrix、Faecalibaculum、Holdemania、Ileibacterium、Kandleria、Longicatena、Solobacterium Turicibacterが含まれる。
[フソバクテリウム科(Fusobacteriaceae)]
フソバクテリウム科は、フソバクテリウム目に属する科であり、フソバクテリウム属を含む。
[ラクノスピラ科(Lachnospiraceae)]
ラクノスピラ科は、クロストリジウム綱クロストリジウム目に含まれる科であり、ラクノスピラ属を含む。
[ペプトストレプトコッカス科(Peptostreptococcaceae)]
ペプトストレプトコッカス科は、クロストリジウム綱クロストリジウム目に含まれる科である。ペプトストレプトコッカス属を含む。
[プレボテラ科(Prevotellaceae)]
プレボテラ科は、バクテロイデス目に属する科であり、プレボテラ属を含む。
[ルミノコッカス科(Ruminococcaceae)]
ルミノコッカス科は、クロストリジウム綱クロストリジウム目に属する細菌の科である。ルミノコッカス属のほか、属として、Acetanaerobacterium、Acutalibacter、
Anaerobacterium、Anaerofilum、Anaerotruncus、Dysosmobacter、Ercella、Ethanoligenens、Faecalibacterium、Fastidiosipila、Hydrogenoanaerobacterium、
Oscillibacter、Oscillospira、Papillibacter、Pseudobacteroides、Sporobacter、
Subdoligranulum、Youngiibacterが含まれる。
[ベイロネラ科(Veillonellaceae)]
ベイロネラ科は、Clostridiales目に属する科であり、属として、Acetonema、
Acidaminococcus、Allisonella、Anaeroarcus、Anaeroglobus、Anaeromusa、
Anaerosinus、Anaerospora、Anaerovibrio、Centipeda、Dendrosporobacter、
Desulfosporomusa、Dialister、Megamonas、Megasphaera、Mitsuokella、Pectinatus、
Pelosinus、Phascolarctobacterium、Propionispira、Propionispora、Psychrosinus、
Quinella、Schwartzia、Selenomonas、Sporomusa、Sporotalea、Succiniclasticum、
Succinispira、Thermosinus、Veillonella、Zymophilusを含む。
[ストレプトコッカス科(Streptococcaceae)]
ストレプトコッカス科は、ラクトバシラス目の中に置かれ、ラクトコッカス属、ラクトウム属、ストレプトコッカス属を含む。
[カンピロバクター科(Campylobacteraceae)]
カンピロバクター科は、イプシロンプロテオバクテリア綱カンピロバクター目に属する科であり、カンピロバクター属を含む。
[デスルフォビブリオ科(Desulfovibrionaceae)]
デスルフォビブリオ科は、デルタプロテオバクテリア綱デスルフォビブリオ目に属する科であり、デスルフォビブリオ属を含む。
[フラボバクテリウム科(Flavobacteriaceae)]
フラボバクテリウム科は、フラボバクテリウム綱フラボバクテリウム目に属する科であり、フラボバクテリウム属を含む。
[ヘリコバクター科(Helicobacteraceae)]
ヘリコバクター科は、イプシロンプロテオバクテリア綱カンピロバクター目に属する科であり、ヘリコバクター属を含む。
[オドリバクター科(Odoribacteraceae)]
オドリバクター科は、バクテロイデス綱バクテロイデス目に属する科である。オドリバクター属を含む。
[パラプレボテラ科(Paraprevotellaceae)]
パラプレボテラ科は、バクテロイデス目に属する科であり、パラプレボテラ属を含む。また、パラプレボラ科を独立した科とせずに、パラプレボテラ属をプレボテラ科に含める分類方法もある。
[ペプトコッカス科(Peptococcaceae)]
ペプトコッカス科は、クロストリジウム目に属する科であり、ペプトコッカス属を含む。
[ポルフィロモナス科(Porphyromonadaceae)]
ポルフィノモナス科は、バクテロイデス綱バクテロイデス目に属する科であり、ポルフィノモナス属を含む。
[サクシニビブリオ科(Succinivibrionaceae)]
サクシニビブリオ科は、ガンマプロテオバクテリア綱エアロモナス目に属する科であり、エアロモナス属、アナエロビオスピリルム属を含む。
以下本発明の実施例を示す。本発明は以下の実施例に限定されるものではない。
[実施例1]
(糞便試料からのDNA抽出)
以下のようにして、各犬から糞便試料を採取し、DNAを抽出した。
犬の飼育者が糞便の採取キットを用いて、犬の糞便試料を採取した。当該糞便試料を受領し、水に懸濁した。
次に、糞便懸濁液200μLとLysis buffer(224μg/mLのProtenaseKを含む)810μLをビーズチューブに添加し、ビーズ式ホモジナイザーにてビーズ破砕(6,000rpm、破砕20秒、インターバル30秒、破砕20秒)を行った。その後、検体を70℃のヒートブロック上にて10分間静置することでProtenaseKによる処理を行い、続いて95℃のヒートブロック上にて5分間静置することでProtenaseKを不活化した。溶菌処理を行った検体はchemagic360(PerkinElmer)を用い、chemagicキットstool用プロトコルにてDNAの自動抽出を行い、100μLのDNA抽出液を得た。
(メタ16SRNA遺伝子シーケンス解析)
メタ16Sシーケンス解析はillumina 16S Metagenomic Sequencing Library Preparation(バージョン15044223 B)を改変して行った。まず、16SrRNA遺伝子の可変領域V3-V4を含む460bpの領域をユニバーサルプライマー(Illumina_16S_341FおよびIllumina_16S_805RPCR)を用いたPCRで増幅した。PCR反応液は10μLのDNA抽出液、0.05μLの各プライマー(100μM)、12.5μLの2xKAPA HiFi Hot-Start ReadyMix(F.Hoffmann-LaRoche、Switzerland)、2.4μLのPCRgrade waterを混合して調製した。PCRには95℃3分間の熱変性後、95℃30秒、55℃30秒、72℃30秒のサイクルを30回繰り返し、最後に72℃5分の伸長反応を行った。増幅産物は磁気ビーズを用いて精製し、50μLのBufferEB(QIAGEN、Germany)で溶出した。精製後の増幅産物はNextera XT Index Kit v2(illumina、CA、US)を用いてPCRを行い、インデックスを付加した。PCR反応液は2.5μLの増幅産物、2.5μLの各プライマー、12.5μLの2x KAPA HiFi Hot-Start ReadyMix、5μLのPCRgrade waterを混合して調製した。PCRには95℃3分間の熱変性後、95℃30秒、55℃30秒、72℃30秒のサイクルを12回繰り返し、最後に72℃5分の伸長反応を行った。インデックス付加を行った増幅産物は磁気ビーズを用いて精製し、80-105μLのBufferEBで溶出した。各増幅産物の濃度はNanoPhotometer(Implen、CA、US)で測定し、1.4nMに調製した後、等量ずつ混合し、これをシーケンス用ライブラリーとした。シーケンス用ライブラリーのDNA濃度および増幅産物のサイズを電気泳動にて確認し、これをMiSeqにより解析した。解析にはMiSeq Reagent Kit V3を用い、2×300bpのペアエンドシーケンスを行った。得られた配列はMiSeq Reporterにて解析し、細菌の組成データを得た。
上記で用いたユニバーサルプライマーの配列は以下のとおりである。このユニバーサルプライマーは市販されているものを購入することができる。
Illumina_16S_341F
5′-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCCTACGGGNGGCWGCAG- 3’

llumina_16S_805R
5′-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGACTACHVGGGTATCTAATCC- 3’
上記方法に従って、0歳以上の165040個体の全犬種について、腸内細菌叢の組成データを得て、科ごとの占有率及び多様度指数の測定を行った。
科ごとの占有率は、当該科に分類される菌のヒットレートとして算出した。
シャノン・ウィナーの多様度指数及びシンプソンの多様度指数は、QIIME2を用いて算出した。
(疾患の罹患の有無の調査)
上記全犬種について、それぞれ糞便サンプル採取後180日以内に疾患に罹患したかを調査した。疾患への罹患の有無は、ペット保険の保険金請求記録を用い、糞便採取を行った各個体の糞便採取日後180日以内に保険金支払請求があったか否かで調査した。なお、疾患への罹患に関わらず、糞便採取日前90日以内に保険金支払請求のない契約で調査した。糞便採取日前90日以内に保険支払請求がなかったということは、糞便採取前は、疾患に罹患していなかったことが推定される。
(学習済みモデルの生成)
上記で得られた全犬種の腸内細菌叢の占有率のうち、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)及びストレプトコッカス科(Streptococcaceae)のそれぞれの占有率を、値の大きさに応じて、「0」、「1」、「2」・・・「19」というようにラベル付けして占有率データに関する特徴量とした。また、シャノン・ウィーナーの多様度指数及びシンプソンの多様度指数についても、ラベル付けして多様性データに関する特徴量とした。上記科を選んだ理由は、犬の腸内細菌叢に含まれることが知られている300種ほどの科のうち、全犬(165040匹)の80%以上の犬の腸内細菌叢において、ヒットレートが0になっている科を排除し、残った科として選んだものである。
一方、疾患罹患の有無については、ダミー変数に置き換えて特徴量とした。
上記の占有率データ及び多様性データと、疾患罹患の有無とを教師データとして用いて機械学習を行い、学習済みモデルを生成した。
決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークであるLightGBMを用いて学習を行った。
各疾患の教師データのサンプル数は以下の表1及び表2に記載のとおりであった。
Figure 2022135180000002
Figure 2022135180000003
(学習済みモデルを用いた疾患罹患の予測)
上記で生成した学習済みモデルを用いて、犬について疾患罹患の予測を行った。
上記機械学習に用いた犬とは別の犬300~700匹の糞便サンプルからの腸内細菌叢の測定を行い、占有率データ及び多様性データを得た。これらの占有率データ及び多様性データを学習済みモデルに入力し、疾患罹患の予測を行った。
予測結果の正解不正解は、糞便サンプル採取後180日以内の疾患罹患の有無によった。予測性能は、主にAUC(Area Under the ROC Curve)によって評価した。予測性能確認に用いたデータでのAUCが85%以上のときに「A」、75%以上85%未満のときに「B」、75%未満のときに「C」と評価した。結果を表3に示す。
Figure 2022135180000004
表3から明らかなように、本発明の学習済みモデルを含む疾患予測システムは、様々な疾患について高い予測性能を示した。
なお、各疾患に予測に重要であった特徴量をそれぞれ図2~図16に示す。図2~図16は、予測に用いている特徴量を重要度順に並べて、ビジュアル化したグラフである。グラフに記載されている値は、最終的に完成されたモデルにおいて、その特徴量が平均的にどれだけ予測モデルの中で評価基準を改善させることができたかを表すものであり、値自体はそれほど重要ではなく、相対値としての意味を持つものと理解できる。図2~図16から、上記の科全てが予測に必須ではなく、上記科のうち一部を特徴量として用いても疾患の予測が可能であることが示唆される。なお、「Others F」とは、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)及びストレプトコッカス科(Streptococcaceae)以外の科である。「Other_F」はヒットレートの総和が1にならないときの調整項である。
[実施例2]
(糞便試料からのDNA抽出)
上記犬の例と同様にして猫から糞便試料を採取し、DNAを抽出した。
(メタ16SRNA遺伝子シーケンス解析)
上記犬の例と同様にして猫の糞便試料についてメタ16Sシーケンス解析を行い、腸内細菌叢の細菌の組成データを得た。
上記犬の例と同様にして、0歳以上の31040個体の全猫種について、腸内細菌叢の組成データを得て、科ごとの占有率及び多様度指数の測定を行った。
科ごとの占有率は、当該科に分類される菌のヒットレートとして算出した。
シャノン・ウィナーの多様度指数及びシンプソンの多様度指数は、QIIME2を用いて算出した。
(疾患の罹患の有無の調査)
上記猫について、それぞれ糞便サンプル採取後180日以内に疾患に罹患したかを調査した。疾患への罹患の有無は、ペット保険の保険金請求記録を用い、糞便採取を行った各個体の糞便採取日後180日以内に保険金支払請求があったか否かで調査した。なお、疾患への罹患に関わらず、糞便採取日前90日以内に保険金支払請求のない契約で調査した。糞便採取日前90日以内に保険支払請求がなかったということは、糞便採取前は、疾患に罹患していなかったことが推定される。
(学習済みモデルの生成)
上記で得られた猫の腸内細菌叢の占有率のうち、アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、ベイノレラ科(Veillonellaceae)、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)のそれぞれの占有率を、値の大きさに応じて、「0」、「1」、「2」・・・「19」というようにラベル付けして占有率データに関する特徴量とした。また、シャノン・ウィーナーの多様度指数及びシンプソンの多様度指数についても、ラベル付けして多様性データに関する特徴量とした。上記科を選んだ理由は、猫の腸内細菌叢に含まれることが知られている300種ほどの科のうち、全猫(31040匹)の80%以上の猫の腸内細菌叢において、ヒットレートが0になっている科を排除し、残った科として選んだものである。
一方、疾患罹患の有無については、ダミー変数に置き換えて特徴量とした。
上記の占有率データ及び多様性データと、疾患罹患の有無とを教師データとして用いて機械学習を行い、学習済みモデルを生成した。
機械学習は上記犬の例と同様である。
各疾患の教師データのサンプル数は以下の表4及び表5に記載のとおりであった。
Figure 2022135180000005
Figure 2022135180000006
(学習済みモデルを用いた疾患罹患の予測)
上記で生成した学習済みモデルを用いて、猫について疾患罹患の予測を行った。
上記機械学習に用いた猫とは別の猫150~3350匹の糞便サンプルからの腸内細菌叢の測定を行い、占有率データ及び多様性データを得た。これらの占有率データ及び多様性データを学習済みモデルに入力し、疾患罹患の予測を行った。
予測結果の正解不正解は、糞便サンプル採取後180日以内の疾患罹患の有無によった。予測性能は、主にAUC(Area Under the ROC Curve)によって評価した。予測性能確認に用いたデータでのAUCが85%以上のときに「A」、75%以上85%未満のときに「B」、75%未満のときに「C」と評価した。結果を表6に示す。
また、各疾患に予測に重要であった特徴量をそれぞれ図17~図31に示す。図17~図31は、図2~図16と同様に、予測に用いている特徴量を重要度順に並べて、ビジュアル化したグラフである。
Figure 2022135180000007
表6から明らかなように、本発明の学習済みモデルを含む疾患予測システムは、様々な疾患について高い予測性能を示した。
[実施例3]
上記と同じ方法で得られた犬の占有率データ及び多様性データの各特徴量について、以下の表7に記載された特徴量を用いて機械学習を行い、学習モデルを生成した。なお、対象疾患は皮膚疾患とした。
Figure 2022135180000008
上記表7のAUCから明らかなように、菌科として、10種類、7種類、3種類を用いた場合であっても、なお高い精度での疾患の予測が可能であった。


Claims (11)

  1. ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを受け付ける受付手段と、学習済みモデルを用いて、前記受付手段に入力された動物の腸内細菌叢の占有率データ及び多様性データからその動物が疾患に罹患するかを予測判定する判定手段と、を備える疾患予測システム。
  2. 前記学習済みモデルが、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする学習済みモデルである請求項1記載の疾患予測システム。
  3. 前記占有率データが、科ごとの占有率又は科ごとの占有率に基づいて設定されたラベルを含む請求項2記載の疾患予測システム。
  4. 前記占有率データが、
    アルカリゲネス科(Alcaligenaceae)、バクテロイデス科(Bacteroidaceae)、ビフィドバクテリウム科(Bifidobacteriaceae)、クロストリジウム科(Clostridiaceae)、コプロバチルス科(Coprobacillaceae)、コリオバクテリウム科(Coriobacteriaceae)、エンテロバクター科(Enterobacteriaceae)、エンテロコッカス科(Enterococcaceae)、エリュシペロトリクス科(Erysipelotrichaceae)、フソバクテリウム科(Fusobacteriaceae)、ラクノスピラ科(Lachnospiraceae)、ペプトストレプトコッカス科(Peptostreptococcaceae)、プレボテラ科(Prevotellaceae)、ルミノコッカス科(Ruminococcaceae)、及び、ベイノレラ科(Veillonellaceae)からなる群から選ばれる1つ以上の科の占有率又は当該占有率に基づいて設定されたラベルを含む請求項3記載の疾患予測システム。
  5. 前記占有率データが、さらに、ストレプトコッカス科(Streptococcaceae)の占有率又は当該占有率に基づいて設定されたラベルを含む請求項4記載の疾患予測システム。
  6. 前記占有率データが、さらに、カンピロバクター科(Campylobacteraceae)、デスルフォビブリオ科(Desulfovibrionaceae)、フラボバクテリウム科(Flavobacteriaceae)、ヘリコバクター科(Helicobacteraceae)、オドリバクター科(Odoribacteraceae)、パラプレボテラ科(Paraprevotellaceae)、ペプトコッカス科(Peptococcaceae)、ポルフィロモナス科(Porphyromonadaceae)及びサクシニビブリオ科(Succinivibrionaceae)からなる群から選ばれる1つ以上の科の占有率又は当該占有率に基づいて設定されたラベルを含む請求項4記載の疾患予測システム。
  7. 前記多様性データが、多様性指数または多様性指数に基づいて設定されたラベルを含む請求項1~6のいずれか一項記載の疾患予測システム。
  8. 保険の対象となる動物の腸内細菌叢の占有率データ及び多様性データを、請求項1~7のいずれか一項記載の疾患予測システムに入力し、出力された疾患罹患の予測に応じて当該動物の保険料を決定する保険料算出システム。
  9. ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データからその動物が所定期間内に疾患に罹患するかどうかの予測をする学習済みモデルの生成方法であって、教師データとして、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データと、その動物の腸内細菌叢の占有率データと多様性データを取得した時から所定期間内の疾患への罹患の有無とを人工知能を含むコンピュータに入力し、人工知能に学習させることを特徴とする学習済みモデルの生成方法。
  10. ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データを取得するステップと、
    前記占有率データ及び多様性データを学習済みモデルに入力し、コンピュータが前記学習済みモデルを用いて、入力された占有率データ及び多様性データから所定期間内に当該動物が疾患に罹患するかどうかの予測を出力するステップと、を有する疾患予測方法。
  11. 前記学習済みモデルが、ヒトを除く動物の腸内細菌叢の占有率データ及び多様性データとその動物の腸内細菌叢の占有率データ及び多様性データの取得時から所定期間内の疾患罹患の有無とを教師データとして用いて学習を行い、入力を動物の腸内細菌叢の占有率データ及び多様性データとし、出力をその動物が疾患に罹患するかどうかの予測判定とする学習済みモデルである請求項10記載の疾患予測方法。





JP2021034812A 2021-03-04 2021-03-04 疾患予測システム、保険料算出システム及び疾患予測方法 Pending JP2022135180A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2021034812A JP2022135180A (ja) 2021-03-04 2021-03-04 疾患予測システム、保険料算出システム及び疾患予測方法
EP22763277.5A EP4303804A1 (en) 2021-03-04 2022-03-01 Disease predicting system, insurance premium calculating system, and disease predicting method
PCT/JP2022/008666 WO2022186223A1 (ja) 2021-03-04 2022-03-01 疾患予測システム、保険料算出システム及び疾患予測方法
CN202280018443.6A CN116964683A (zh) 2021-03-04 2022-03-01 疾病预测系统、保险费计算系统以及疾病预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021034812A JP2022135180A (ja) 2021-03-04 2021-03-04 疾患予測システム、保険料算出システム及び疾患予測方法

Publications (1)

Publication Number Publication Date
JP2022135180A true JP2022135180A (ja) 2022-09-15

Family

ID=83154465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021034812A Pending JP2022135180A (ja) 2021-03-04 2021-03-04 疾患予測システム、保険料算出システム及び疾患予測方法

Country Status (4)

Country Link
EP (1) EP4303804A1 (ja)
JP (1) JP2022135180A (ja)
CN (1) CN116964683A (ja)
WO (1) WO2022186223A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7326574B1 (ja) 2022-07-29 2023-08-15 アニコム ホールディングス株式会社 美容レベル推定システム、美容レベル推定方法、及び総合健康度推定システム及び総合健康度推定方法
US20230301765A1 (en) * 2021-08-31 2023-09-28 Anicom Holdings, Inc. Prediction apparatus, prediction system and prediction method
WO2024024795A1 (ja) * 2022-07-29 2024-02-01 アニコム ホールディングス株式会社 保険料算出システム、美容レベル推定システム、及び総合健康度推定システム
WO2024142989A1 (ja) * 2022-12-26 2024-07-04 サントリーホールディングス株式会社 情報処理装置、情報処理方法及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012165716A (ja) * 2011-02-16 2012-09-06 Infocom Corp 腸内常在菌解析情報を基にした食事支援システム
JP6403901B2 (ja) 2015-12-03 2018-10-10 エムジーファーマ株式会社 健康肥満維持剤
JP6734457B1 (ja) * 2019-10-28 2020-08-05 アニコム ホールディングス株式会社 疾患予測システム、保険料算出システム及び疾患予測方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230301765A1 (en) * 2021-08-31 2023-09-28 Anicom Holdings, Inc. Prediction apparatus, prediction system and prediction method
JP7326574B1 (ja) 2022-07-29 2023-08-15 アニコム ホールディングス株式会社 美容レベル推定システム、美容レベル推定方法、及び総合健康度推定システム及び総合健康度推定方法
WO2024024795A1 (ja) * 2022-07-29 2024-02-01 アニコム ホールディングス株式会社 保険料算出システム、美容レベル推定システム、及び総合健康度推定システム
JP2024018856A (ja) * 2022-07-29 2024-02-08 アニコム ホールディングス株式会社 美容レベル推定システム、美容レベル推定方法、及び総合健康度推定システム及び総合健康度推定方法
WO2024142989A1 (ja) * 2022-12-26 2024-07-04 サントリーホールディングス株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
CN116964683A (zh) 2023-10-27
WO2022186223A1 (ja) 2022-09-09
EP4303804A1 (en) 2024-01-10

Similar Documents

Publication Publication Date Title
WO2022186223A1 (ja) 疾患予測システム、保険料算出システム及び疾患予測方法
Maltecca et al. Predicting growth and carcass traits in swine using microbiome data and machine learning algorithms
US11621055B2 (en) Microorganism-related significance index metrics
WO2023276476A1 (ja) 疾患罹患予測システム、保険料算出システム、疾患罹患予測方法及び保険料算出方法
JP2020528285A (ja) 微生物に関連する虫垂関連コンディションの特性評価のための方法及びシステム
JP2020532995A (ja) 鼻マイクロバイオームに関連する鼻関連特徴解析
JP2022079646A (ja) 微生物ゲノム薬理学のための方法およびシステム
Garber et al. Abrupt dietary changes between grass and hay alter faecal microbiota of ponies
WO2020084536A1 (en) Aging markers of human microbiome and microbiomic aging clock
CN116472582A (zh) 使用机器学习的动物诊断
Lemay et al. Quantitative trait loci (QTL) study identifies novel genomic regions associated to Chiari-like malformation in Griffon Bruxellois dogs
Reed et al. The pelvic flexure separates distinct microbial communities in the equine hindgut
WO2023276475A1 (ja) 死亡予測システム及び死亡予測方法
WO2022163824A1 (ja) 肥満の予測方法
JP7326574B1 (ja) 美容レベル推定システム、美容レベル推定方法、及び総合健康度推定システム及び総合健康度推定方法
US20240318223A1 (en) Method for predicting obesity
JP2022117397A (ja) 肥満の予測方法
WO2024024795A1 (ja) 保険料算出システム、美容レベル推定システム、及び総合健康度推定システム
JP2024092723A (ja) 保険料算出システム、及び保険料算出方法
WO2023204162A1 (ja) フード提案システム及びフード提案方法
CN116802317A (zh) 肥胖的预测方法
JP7199486B1 (ja) 予測装置、予測システム及び予測方法
US20230048974A1 (en) Systems and methods for improving livestock health and performance
Bornbusch et al. Markers of fertility in reproductive microbiomes of male and female endangered black-footed ferrets (Mustela nigripes)
Wester et al. Dysbiosis not observed in Canadian horse with free fecal liquid (FFL) using 16S rRNA sequencing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240130