JP6301853B2 - 経年変化予測システム - Google Patents

経年変化予測システム Download PDF

Info

Publication number
JP6301853B2
JP6301853B2 JP2015029911A JP2015029911A JP6301853B2 JP 6301853 B2 JP6301853 B2 JP 6301853B2 JP 2015029911 A JP2015029911 A JP 2015029911A JP 2015029911 A JP2015029911 A JP 2015029911A JP 6301853 B2 JP6301853 B2 JP 6301853B2
Authority
JP
Japan
Prior art keywords
probability distribution
random variable
state
graphical model
evidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015029911A
Other languages
English (en)
Other versions
JP2016151959A (ja
JP2016151959A5 (ja
Inventor
桂一 廣木
桂一 廣木
利昇 三好
利昇 三好
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2015029911A priority Critical patent/JP6301853B2/ja
Priority to US15/040,419 priority patent/US20160239757A1/en
Priority to CN201610084432.4A priority patent/CN105912832A/zh
Priority to EP16155652.7A priority patent/EP3059686A3/en
Publication of JP2016151959A publication Critical patent/JP2016151959A/ja
Publication of JP2016151959A5 publication Critical patent/JP2016151959A5/ja
Application granted granted Critical
Publication of JP6301853B2 publication Critical patent/JP6301853B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Software Systems (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Complex Calculations (AREA)

Description

本発明は、経年変化予測システムに関する。
保険事業の運営を支援する背景技術として、特開2014−225176号公報(特許文献1)がある。この公報には、「病態を表す確率変数に対応するノードと病態の変化に影響を与える因子を表す確率変数に対応するノードとの間の確率的依存性が有向辺又は無向辺によって定義されたグラフ構造を作成する因果・遷移構造算出部と、前記確率変数の事象空間を作成するノード生成部と、前記グラフ構造の条件付確率を算出する確率テーブル算出部と、指定された確率変数からなるグラフ構造、事象空間及び条件付確率によってモデルを再構成するモデル再構築部と、病態遷移確率及び医療費を予測する病態遷移・医療費予測部と、保健指導の対象者及び保健指導内容を選定する保健指導支援部と、を備える。」と記載されている。
特開2014−225176号公報
特許文献1に記載の技術は、例えば、ある年とその翌年のデータを用いて、1年後の有病率や医療費を予測するベイジアンネットワークを構築している。なお、ベイジアンネットワーク等のグラフィカルモデルに入力されるエビデンスには、確率変数の確定状態をエビデンスとするハードエビデンスと、確率変数の状態が1つに確定していないが当該確率変数が従う確率分布が判明している場合における、当該確率分布をエビデンスとするソフトエビデンスと、がある。
特許文献1に記載の技術は、現在の状態をハードエビデンスとしてベイジアンネットワークに入力し、1年後の状態の予測を行う。従って、現在の状態に、(確率変数の確定状態が判明していない)確率分布が含まれている場合、特許文献1に記載の技術を用いて予測を行うためには、当該確率分布を確定状態に変換する必要がある。
確率分布から確定状態への変換方法として、例えば、確率分布上もっとも確率の高くなる状態、即ち最頻値を選択する方法や、確率分布をもとに期待値を計算して該当する状態を選択する方法等がある。しかし、確率分布から変換された確定状態が入力される場合、当該確率分布が入力される場合と比較して、予測精度が低下する。
特に、例えば、グラフィカルモデルにおける出力結果を当該グラフィカルモデルにおける次の入力とする予測、を繰り返す場合には、実情と反する結果が得られる可能性が高い。例えば、有病率や医療費は一般的に年齢とともに上昇していく傾向があるが、医療費や有病率の確率分布を確定状態に変換して経年変化予測を行うと、年々医療費や有病率が減少するという予測結果が得られてしまう。
これは、確率分布に偏りがあることが原因である。一般的に、ある病気にかかっている人は、かかっていない人よりも圧倒的に少ないため、当該病気にかかっているか否かについての確率分布を確定状態に変換すると、当該病気にかかってないという状態が選択されてしまう。その結果、翌年の予測を繰り返すごとにほぼ全員が病気でない健康な状態に収束してしまう。
また、グラフィカルモデルにソフトエビデンスが入力される場合、例えば、確率変数の状態数等に応じて計算コストが増大する。そこで本発明の一態様は、エビデンス群に含まれる確率分布から、当該確率分布から当該確率分布に対応する確率変数の確定状態への変換を行う確率分布を適切に選択することで、高精度かつ低計算コストで予測を行うことができる、経年変化予測システムを提供する。
上記課題を解決するため、本発明の一態様は、例えば、以下の構成を採用する。プロセッサと記憶装置とを含み、グラフィカルモデルを用いて、確率変数の状態を予測する経年変化予測システムであって、前記記憶装置は、前記グラフィカルモデルを保持し、前記グラフィカルモデルは、第1時点におけるエビデンス群を入力として、前記確率変数の前記第1時点から第1期間経過後の状態を示す情報を出力とし、前記エビデンス群のエビデンスは、前記確率変数が従う確率分布又は前記確率変数の確定状態であり、前記プロセッサは、前記グラフィカルモデルを使用して予測処理を実行し、前記予測処理において、前記第1時点におけるエビデンス群を取得し、前記取得したエビデンス群に含まれる確率分布について、当該確率分布から算出される特徴量及び/又は前記グラフィカルモデルにおいて定義された当該確率分布に対応する確率変数の特徴量、に基づいて、当該確率分布から当該確率分布に対応する確率変数の確定状態への変換を行うか否かを決定し、前記変換の対象に決定した確率分布を、当該確率分布に対応する確率変数の確定状態に変換し、前記変換後の前記第1時点におけるエビデンス群を前記グラフィカルモデルに入力し、前記確率変数の前記第1時点から前記第1期間経過後の状態を示す情報を出力する、経年変化予測システム。
本発明の一態様によれば、一定期間後の確率変数の状態を予測するグラフィカルモデルを用いて、高精度かつ計算コストを抑えた予測を行うことができる。
また、上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
疾病発症予測装置の構成例を示すブロック図である。 確率変数テーブルのデータ構造の一例である。 リンクテーブルのデータ構造の一例である。 確率テーブルのデータ構造の一例である。 出力用変数の確率分布テーブルのデータ構造の一例である。 S/H選択テーブルのデータ構造の一例である。 混合エビデンステーブルのデータ構造の一例である。 疾病発症予測処理の一例を示すフローチャートである。 S/H選択決定処理の一例を示すフローチャートである。 S/H選択条件設定部の設定用インタフェースの例である。 確率的に従属な変数の集合に分割されたベイジアンネットワークの例である。 経路が遮断されるパターンの例である。 経路が遮断されないパターンの例である。 将来の疾病発症予測と医療費予測のための入出力例である。 生活習慣からの将来の測定値予測のための入出力例である。 生活習慣の推定のための入出力例である。 疾病発症予測装置の出力を表示するインタフェースの例である。 疾病発症予測装置の出力を表示するインタフェースの例である。
以下、添付図面を参照して本発明の実施形態を説明する。本実施形態は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。各図において共通の構成については同一の参照符号が付されている。
本実施形態の経年予測システムは、確率変数が従う確率分布を入力として確率推論を行うソフトエビデンス推論を用いることで、翌年の予測モデルを使った経年変化予測を実現する。経年予測システムは、確率分布を予測モデルに入力した場合、確率変数が従う確率分布を確率変数の確定状態へ変換する必要がないため、高精度に予測を行うことができる。ひいては、経年変化予測システムは、出力された確率分布を再度予測モデルに入力する予測、を繰り返す場合における、確率変数がとる値が収束する問題を回避できる。
一方、ソフトエビデンスを用いた確率推論処理の特徴として、ソフトエビデンスが入力される全ての確率変数の状態数等に応じて計算コストが増大する、という問題点がある。従って、経年変化予測システムが、例えば、全ての入力用確率変数に対してソフトエビデンスを入力する場合、計算コストが肥大化してしまう。
そこで、本実施形態の経年変化予測システムは、各入力用確率変数に対して、例えば、各入力確率変数の特徴量及び/又は各入力用変数に対応する出力用確率変数が従う確率分布の特徴量、に従って、ソフトエビデンスかハードエビデンスのどちらを入力するかを選択する。さらに、本実施形態の経年変化予測システムは、ソフトエビデンスからハードエビデンスへの変換方法を、例えば、各入力用確率変数の特徴量に従って決定してもよい。本実施形態の経年変化予測システムは、上記処理により、予測精度を向上しつつ、計算量を抑えた予測を実現する。
本実施例は、経年変化予測システムの一例として、健診結果、問診結果、病歴、及び診療記録などといった医療データを基に、分析対象者の疾病発生確率の所定期間ごとの経年変化を予測する疾病発症予測装置の例を説明する。本実施例では当該所定期間を1年として説明する。
医療データは、例えば、対象者毎の診療記録や検査値など、個人毎の医療及び健康に関する情報を含むデータである。また、例えば、医療データは、身長、体重、BMI、血圧、コレステロール値、及び血糖値などの健康診断や問診時に測定される検査値などを含んでもよい。また、例えば、医療データは、喫煙の有無、日常の汗運動の有無、飲酒の有無、及び睡眠の状態などの生活習慣に関するデータを含んでもよい。さらに、例えば、医療データは、病歴、すなわち、医療機関を受診した際の傷病名の履歴などのデータを含んでもよい。また、例えば、医療データは、処方された医薬品、実施された診療行為、及び医療費などの診療記録に関するデータを含んでもよい。
図1は、本実施例の疾病発症予測装置の構成例を示す。疾病発症予測装置100は、入力部111と、出力部112と、演算装置113と、メモリ114と、記憶媒体115と、を含む。入力部111は、例えば、マウス、キーボードなどのヒューマンインターフェースであり、ユーザからデータ等の入力を受け付ける。出力部112は、例えば、ディスプレイやプリンタなどであり、疾病発症予測装置100による演算結果を出力する。記憶媒体115は、例えば、疾病発症予測装置100による処理を実現する各種プログラム、及び処理結果等の各種データを格納する。
演算装置113は、例えば、CPU、GPUなどである。演算装置113は、例えば、プログラムに従って動作するプロセッサ及び/又は論理回路を含み、データの入力/出力、読み込み/書き込みを行い、さらに各プログラムを実行する。以下に説明する処理及び演算は、演算装置113が実行する。
メモリ114は、例えば、演算装置113が実行する各種プログラム、及びデータを一時的にロードして記憶する。記憶媒体115が保持するプログラム及びデータの、一部又は全部は、メモリ114に格納されていてもよい。なお、各種プログラムは、例えば、CD−ROM等のコンピュータ読み取り可能な可搬性の非一時的記憶媒体に格納されていてもよく、当該非一時的記憶媒体を扱う外部記憶装置を介して、必要に応じて、当該非一時的記憶媒体からメモリ114にロードされてもよい。
記憶媒体115は、プログラムである、単年予測実行部101、S/H選択決定部103、S/H変換部105、再帰予測実行部106、予測結果出力部107、及びエビデンス入力部109を含む。また、記憶媒体115は、データ等を格納する領域である、年次予測結果記憶部102、医療知識記憶部203、S/H選択条件記憶部208、S/H選択テーブル記憶部104、及び単年予測モデル記憶部108を含む。
プログラムは演算装置113によって実行されることで、定められた処理を記憶装置及び通信ポート(通信デバイス)を用いながら行う。従って、本実施形態においてプログラムを主語とする説明は、演算装置113を主語とした説明でもよい。若しくは、プログラムが実行する処理は、そのプログラムが動作する計算機及び計算機システムが行う処理である。
演算装置113は、プログラムに従って動作することによって、所定の機能を実現する機能部(手段)として動作する。例えば、演算装置113は、単年予測実行部101に従って動作することで単年予測実行部(単年予測実行手段)として機能し、S/H選択決定部103に従って動作することでS/H選択決定部(S/H選択決定手段)として機能する。他のプログラムについても同様である。さらに、演算装置113は、各プログラムが実行する複数の処理のそれぞれを実現する機能部(手段)としても動作する。計算機及び計算機システムは、これらの機能部(手段)を含む装置及びシステムである。
単年予測モデル記憶部108は、例えば、ユーザ等によって予め入力された、ある時点の状態を表す医療データを基に当該ある時点から1年後の状態を予測するベイジアンネットワークの情報、を保持する。以下、このベイジアンネットワークを単年予測モデルとも呼ぶ。単年予測モデル記憶部108は、後述する確率変数テーブル、リンクテーブル、及び確率テーブルを保持する。単年予測モデルは、過去の医療データから統計的に構築され、医療データ内の各項目同士の統計確率的な因果関係について記述している。
各項目同士の因果関係は、例えば、疾病と当該疾病に対して処方される医薬品との関係、検査値の異常と当該異常が示す疾病の兆候との関係、疾病と当該疾病発症によりもたらされる増加医療費との関係等である。
また、単年予測モデルは少なくとも2種類の確率変数を含み、当該少なくとも2種類の確率変数は、ある時点の状態を表す入力用確率変数と、1年後の当該状態を表す出力用確率変数と、を含む。例えば、単年予測モデルは、ある時点で疾病Aが発症しているかという入力用確率変数を含む場合、当該ある時点から1年後に疾病Aが発しているかという当該入力用確率変数に対応する出力用確率変数を含む。
単年予測実行部101は、単年予測モデル記憶部108が保持する単年予測モデルを用いて、ある時点の状態を表す医療データ等を入力とし、当該ある時点から1年後の状態を出力とする予測処理を行う。ここで、入力となる、ある時点の状態を表す医療データ等をエビデンスと呼ぶ。エビデンスは入力用確率変数に入力される。
エビデンスにはハードエビデンスとソフトエビデンスの2種類が存在する。ハードエビデンスは、ある確率変数の状態が1つに確定しているときの、その確定状態を示す情報である。「疾病Aが発症している」という状態を示す情報は、ハードエビデンスの一例である。また、例えば、「血糖値が80mg/dl〜100mg/dlである」という状態を示す情報のように、測定値が、予め定められた複数段階の範囲のうちの特定の1つの範囲に含まれることが確定している状態を示す情報も、ハードエビデンスの一例である。
ソフトエビデンスは、ある確率変数の状態は1つに確定していないが、当該確率変数が従う確率分布が判明しているときの、当該確率分布を示す情報である。「疾病Aが15%の確率で発症している」、「血糖値が80mg/dl以下の確率が10%、80mg/dl〜100mg/dlの確率が50%、100mg/dl以上の確率が40%である」、等の情報はソフトエビデンスの例である。
年次予測結果記憶部102は、単年予測実行部101により出力された予測結果、即ち出力用確率変数それぞれの確率分布を示す確率分布テーブルを記憶する。確率分布テーブルのデータ構造については後述する。疾病発症予測装置100が経年推移の予測を行う場合、年次予測結果記憶部102は、例えば年次ごとの予測結果を別々に記憶する。
S/H選択決定部103は、単年予測モデル記憶部108が保持する単年予測モデル内の入力用確率変数それぞれに、ソフトエビデンスを入力するかハードエビデンスを入力するかを選択し、当該選択の結果を示すS/H選択テーブルを作成する。S/H選択テーブルのデータ構造については後述する。さらに、S/H選択決定部103は、ハードエビデンスの入力を選択した場合、ソフトエビデンス或いは確率分布を、ハードエビデンスへ変換する変換方式を決定してもよい。
また、S/H選択決定部103は、予測モデル入力部201と、確率分布入力部202と、予測計算コスト評価部204と、S/H判定部205と、S/H選択テーブル出力部206と、S/H選択条件設定部207と、を含む。
予測モデル入力部201は、単年予測モデル記憶部108から、単年予測モデルの入力を受け付ける。確率分布入力部202は、年次予測結果記憶部102から、入力用確率変数の確率分布の入力を受け付ける。予測計算コスト評価部204は、単年予測モデルとS/H選択テーブルとに基づき、単年の予測に必要となる計算コストを評価する。S/H判定部205は、単年予測モデル内の入力用確率変数それぞれについてソフトエビデンスを入力するかハードエビデンスを入力するかを判定し、S/H選択テーブルを作成する。S/H選択テーブル出力部206は、例えば、作成されたS/H選択テーブルを、出力部112に出力する。S/H選択条件設定部207は、S/H判定部205が判定を行うための条件の設定を、例えば入力部111を介してユーザ等から受け付ける。
医療知識記憶部203は、例えば、予めユーザ等によって入力された、単年予測モデル内の確率変数同士の関係性を示す情報を保持する。例えば、当該関係性を示す情報は、単年予測モデルに含まれる関係性を示す情報と異なる情報を含んでもよい。また、例えば、確率変数間の相関係数等は、当該関係性の一例である。また、各確率変数間の関係の有無等も、当該関係性の一例である。医療知識記憶部203は、入力用確率変数同士の関係性、出力用変数同士の関係性を示す情報を保持していてもよい。
S/H選択条件記憶部208は、S/H選択条件設定部207が受け付けた選択条件を保持する。S/H選択テーブル記憶部104は、S/H選択決定部103により作成されたS/H選択テーブルを記憶する。
S/H変換部105は、S/H選択テーブル記憶部104が保持するS/H選択テーブルに基づき、年次予測結果記憶部102が保持する予測結果をハードエビデンスに変換する。変換されなかった予測結果は確率分布の形式のままソフトエビデンスとして扱われる。変換されたハードエビデンスとソフトエビデンスは、次に単年予測実行部101が予測処理を行う際の入力となる。
再帰予測実行部106は、例えば、単年予測実行部101、年次予測結果記憶部102、S/H選択決定部103、S/H選択テーブル記憶部104、S/H変換部105、予測結果出力部107、及び単年予測モデル記憶部108等を用いて再帰的な経年推移予測を行う。予測結果出力部107は、年次予測結果記憶部102に記録された年次ごとの予測結果を出力部112に出力する。エビデンス入力部109は、例えば、単年予測実行部101による初回予測のためのエビデンスの入力を、入力部111を介して、ユーザ等から受け付ける。
次に、疾病発症予測装置100が保持する各テーブルの構造例を説明する。図2A、図2B、図2Cは単年予測モデル、即ちベイジアンネットワークのデータ構造を示す。ベイジアンネットワークは、例えば、単年予測モデル記憶部108が保持する、確率変数テーブル900、リンクテーブル910、及び確率テーブル920の3つの要素から特定される。
図2Aは、確率変数テーブル900のデータ構造の一例を示す。確率変数テーブル900は、ベイジアンネットワークに含まれるノードである各確率変数の特徴を示す。確率変数テーブル900は、例えば、確率変数901、状態数902、状態903、順序性904、及び入力/出力905、及び対応変数906を含む。
確率変数901は、ベイジアンネットワークに含まれるノードである確率変数を示す。状態数902は、確率変数901に格納された確率変数の取り得る値のパターン数を示す。状態9は当該確率変数が取り得る状態の内容を示す。順序性904は、当該確率変数の状態が順序性を持つか否かを示す。
入力/出力905は、当該確率変数が入力用確率であるか、出力用確率変数であるかを示す。対応変数906は、当該確率変数が入力用確率変数であれば当該確率変数に対応する出力用確率変数を、当該確率変数が出力用確率変数であれば当該確率変数に対応する入力用確率変数を示す。当該確率変数に対応する入力用/出力用変数が存在しない場合、対応変数906は、例えば、Null値や、「なし」という値、等を保持する。
図2Bは、リンクテーブル910のデータ構造の一例を示す。リンクテーブル910は、ベイジアンネットワークに含まれる確率変数同士の因果関係を示す。リンクテーブル910は、例えば、リンク911、始点912、及び終点913を含む。リンク911は、始点912に格納された確率変数と終点913に格納された確率変数との間に因果関係があることを示す。なお、2つの確率変数間の関係性において、始点となる確率変数を親変数、終点となる確率変数を子変数と呼ぶ。
図2Cは、確率テーブル920のデータ構造の一例を示す。確率テーブル920は、ベイジアンネットワークに含まれる確率変数における、当該確率変数の親変数の状態に応じた、確率分布を示す。確率テーブル920は、例えば、テーブル921、子変数922、親変数923、及び確率分布924を含む。テーブル921は、確率テーブル920の各レコードを識別する情報を示す。子変数922は子変数を示す。親変数923は親変数を示す。
確率分布924は、親変数923に格納された親変数の状態それぞれに応じた、子変数922に格納された子変数が従う確率分布それぞれ、を行とする行列を示す。親変数923に「なし」が格納されている場合、確率分布924は子変数が従う事前分布を示す。なお、子変数に対応する親変数の数は、0個であってもよいし、2個以上存在してもよい。
図3は、予測結果出力部107が出力する、出力用変数の確率分布テーブルのデータ構造の一例を示す。確率分布テーブル1000は、例えば、確率変数1001、及び確率分布1002を含む。確率変数1001は、出力用確率変数を示す。確率分布1002は、当該出力用確率変数が従う確率分布を示す。
図4は、S/H選択テーブルのデータ構造の一例を示す。S/H選択テーブル1100は、例えば、確率変数1101、S/H選択1102、及び変換方法1103を含む。確率変数1101は、入力用確率変数を示す。S/H選択1102は、当該入力用確率変数に、ソフトエビデンスとハードエビデンスのどちらが入力されるかを示す。なお、「ソフト」はソフトエビデンスを、「ハード」はハードエビデンスを、それぞれ示す。変換方法1103は、S/H選択1102が「ハード」を格納する場合における、確率分布からハードエビデンスへの変換方法かを示す。
図5は、混合エビデンステーブルのデータ構造の一例を示す。混合エビデンステーブル1200は、例えば、確率変数1201、S/H選択1202、状態1203、及び確率分布1204を含む。確率変数1201は、入力用確率変数を示す。S/H選択1202は、当該入力用確率変数にソフトエビデンスとハードエビデンスのどちらが入力されるかを示す。
状態1203は、S/H選択1202が「ハード」を格納する場合における、当該入力用確率変数の確定状態を示す。S/H選択1202が「ソフト」を保持する場合、状態1203は「なし」を保持する。確率分布1204は、S/H選択1202が「ソフト」を保持する場合、当該入力用確率変数が従う確率分布を示す。S/H選択1202が「ハード」を保持する場合、確率分布1204は「なし」を保持する。
次に、疾病発症予測装置100の動作例を説明する。図6は、疾病発症予測装置100によるN年後までの疾病発生率の経年変化の予測処理の一例を示す。疾病発症予測装置100は、単年予測モデルを繰り返し使うことでN年後の予測を行う。また、疾病発症予測装置100は、単年予測モデル内の確率変数の特徴量に基づき、ソフトエビデンスとハードエビデンスを使い分けることで計算量の増大を抑えながら予測精度を向上する。ひいては、疾病発症予測装置100は、予測処理を繰り返すことによる、予測結果の間違った値への収束、を防ぐ。
まずステップS301において、予測モデル入力部201が、単年予測モデルの情報、即ち確率変数テーブル900、リンクテーブル910、及び確率テーブル920の情報の入力を受け付ける。次に、ステップS302において、エビデンス入力部109が、予測の初期入力である、予測対象者0年目の、1以上の確率変数の確定状態からなる集合H(0)の入力を受け付ける。H(0)の各要素はハードエビデンスであるとする。
次に、ステップS303において、単年予測実行部101が単年予測モデルを用いて1回目の予測を行う。1回目の予測における入力はH(0)であり、得られる出力は1年後の予測結果を示す1以上の確率分布からなる集合S(1)である。S(1)に含まれる確率分布それぞれは確率分布テーブル1000に格納される。また、ステップS304において、単年予測実行部101は、単年予測モデルの入力用確率変数に対して、入力がない状態で予測を行い、1以上の事前分布からなる集合Spを出力として得る。
ステップS305において、再帰予測実行部106が、経過年数yをy=1と設定し、再帰的な予測を開始する。ステップS306において、S/H選択決定部103が単年予測モデル、S(y)、Spに基づきS/H選択テーブル1100を作成する。S/H選択テーブル1100の具体的な作成処理については、後述する。
ステップS307において、S/H変換部105がS/H選択テーブル1100に基づき、y年目の予測結果であるS(y)を、y年目の混合エビデンスM(y)へと変換する。混合エビデンスM(y)は入力用確率変数それぞれに対して入力される、ソフトエビデンスまたはハードエビデンスの集合であり、M(y)の情報は混合エビデンステーブル1200に格納される。
具体的には、ステップS307において、S/H変換部105は、S/H選択テーブル1100の確率変数1101及びS/H選択1102を、混合エビデンステーブル1200の確率変数1201、及びS/H選択1202にそれぞれ格納する。
S/H変換部105は、S/H選択1202が「ソフト」である入力用確率変数それぞれについて、混合エビデンステーブル1200の、状態1203に「なし」を、確率分布1204にS(y)の当該入力用確率数が従う確率分布を、それぞれ格納する。
S/H変換部105は、S/H選択1202が「ハード」である入力用確率変数それぞれについて、S(y)の当該入力用確率変数が従う確率分布を、変換方法1103で指定された方法によって確定状態に変換する。S/H変換部105は、S/H選択1202が「ハード」である入力用確率変数それぞれについて、混合エビデンステーブル1200の、状態1203に当該確定状態を、確率分布1204に「なし」を、それぞれ格納する。
ステップS308において、単年予測実行部101は、混合エビデンスM(y)を入力とし、y+1年目の予測を行う。ステップS309において、再帰予測実行部106は、y+1=Nであるか否かを判定する。再帰予測実行部106がy+1<Nであると判定した場合(S309:NO)、ステップS310に進む。ステップS310において、再帰予測実行部106は、yに1を加えて再度ステップS306に戻って処理を継続する。
ステップS309において、再帰予測実行部106がy+1=Nであると判定した場合(S309:YES)、即ち目的のN年目の予測結果が得られた場合、ステップS311に進む。ステップS311において、予測結果出力部107が予測結果S(1)、S(2)、…、S(N)を出力し、疾病発症予測装置100による疾病発生予測処理は終了する。 なお、ステップS302において、H(0)の各要素は全てハードエビデンスであるとしたが、確率変数が従う確率分布、即ちソフトエビデンスがH(0)に含まれていてもよい。このとき、S/H選択決定部103は、H(0)に含まれるソフトエビデンスそれぞれを、ハードエビデンスに変換するか否かを判定し、当該判定結果に基づいてS/H変換を行ってもよい。
次に、S/H選択決定部103の動作例を説明する。図7は、S/H選択決定部103の動作例を示す。ステップS401において、予測モデル入力部201が、単年予測モデル記憶部108から単年予測モデル、即ち確率変数テーブル900、リンクテーブル910、及び確率テーブル920の情報を受け取る。ステップS402において、確率分布入力部202が、年次予測結果記憶部102からS(y)に含まれる確率分布、即ち確率分布テーブル1000の情報を受け取る。
ステップS403において、S/H判定部205は、S/H選択条件記憶部208が保持するS/H選択条件を読み込む。S/H選択条件は、例えば、予めユーザにより設定されたS/H選択テーブル1100作成のための条件である。S/H選択条件は、例えば、1回の予測にかかる計算コストの上限、特に精度よく予測したい出力用確率変数等の、ソフトエビデンスを選択する優先度を定めるためのルールを含む。
図8は、S/H選択条件設定部207がS/H選択条件の設定を受け付けるためのユーザインタフェースの例である。設定用ユーザインタフェース600は、例えば、入力受付領域601〜602、チェックボックス603、及び確定ボタン604を含む。入力受付領域601は、推論速度の入力を受け付ける。当該推論速度は、ステップS306〜ステップS310の1回のループ処理における推論速度を示してもよいし、ステップS301〜ステップS311の処理における推論速度を示してもよい。
入力受付領域602は、出力用確率変数のうち、特に精度よく予測したい項目の入力を受け付ける。チェックボックス603は、検査値を全てハードエビデンスに変換するためのチェックボックスである。確定ボタン604は、入力受付領域601〜602、及びチェックボックス603に入力されたS/H選択条件を確定するためのボタンである。
図7の説明に戻る。ステップS404において、S/H判定部205は、確率変数テーブル900に含まれる入力用確率変数それぞれをS/H選択テーブル1100の確率変数1101に格納し、例えば、S/H選択1102の全ての値を「ハード」に設定する。また、S/H判定部205は、確率変数テーブル900を参照し、入力用確率変数に対応する出力用確率分布が従う確率分布をS(y)から特定する。
S/H判定部205は、確率変数テーブル900を参照し、確率変数1101に格納された確率変数それぞれの特徴に従って、変換方法1103それぞれを決定する。例えば、当該確率変数の状態が順序性を有する場合、S/H判定部205は、変換方法1103を期待値に決定する。なお、変換方法1103が期待値である場合、S/H変換部105は、確率分布を、当該確率分布の期待値に最も近い状態に変換する。
また、当該確率変数の状態が順序性を有する場合、例えば、S/H判定部205は、当該順序性が示す順序関係において、隣接する値同士の差を全て算出してもよい。このとき、当該差の分散が所定以上である、又は最大の当該差から最小の当該差を引いた差が所定以上であれば、当該確率変数の状態が順序性を有する場合であっても、S/H判定部205は、変換方法1103を最頻値に決定してもよい。
また、例えば、当該確率変数の状態が順序性を有しない場合、S/H判定部205は、変換方法1103を最頻値に決定する。S/H判定部205が上述のように変換方法を決定することにより、予測精度が向上する。なお、入力用確率変数のハードエビデンスへの変換方法は、例えば、確率変数テーブル900上に予め定められていてもよく、S/H判定部205は当該予め定められた変換方法を変換方法1103に格納してもよい。
ステップS405において、S/H判定部205は、例えば、選択済み確率変数のリストとして、空のリストを作成する。ステップS406において、S/H判定部205は、例えば、単年予測モデル、S(y)に含まれる確率分布、及びS/H選択条件に基づき、選択済み確率変数のリストに含まれない入力用確率変数から、ソフトエビデンスを入力する優先度の高い入力用確率変数を選択する。S/H判定部205は、S/H選択テーブル1100の、当該選択した入力用確率変数に対応するS/H選択1102の値を「ソフト」に設定する。この時点でS/H選択1102の値が「ハード」である確率変数が従う確率分布は、変換候補確率分布である。なお、優先度の最も高い複数の入力用確率変数が存在する場合、S/H判定部205は、例えば、当該複数の入力用確率変数からランダムに1つ入力用確率変数を選択すればよい。
なお、S/H判定部205は、例えば、入力用確率変数の状態数、入力用確率変数が従う事前分布の偏り、及び入力用確率変数の状態の順序性等の、入力用確率変数の特徴量に基づいて、当該優先度を定める。また、S/H判定部205は、入力用確率変数の平均情報量等の入力用確率変数に対応する確率分布の特徴量に基づいて、当該優先度を定めてもよい。S/H判定部205は、例えば、入力用確率変数の状態数が小さいほど、当該優先度を高くすることで、計算コストの増加量が小さいソフトエビデンスを選択することができる。
また、S/H判定部205は、例えば、入力用確率変数の平均情報量、又は当該入力用確率変数が従う事前分布の偏りが大きいほど、当該入力用確率変数の状態に順序性がない場合に、当該優先度を高く定めることにより、予測精度向上への寄与率が高いソフトエビデンスを選択することができる。
なお、S/H判定部205は、例えば、入力用確率変数の状態数、及び入力用確率変数の状態の順序性等の特徴量を確率変数テーブル900から取得する。また、S/H判定部205は、例えば、確率テーブル920から取得した確率分布から、入力用確率変数の事前分布の偏りを算出する。また、S/H判定部205は、確率分布テーブル1000から出力用確率変数の確率分布を取得し、当該確率分布の平均情報量を算出し、当該算出した平均情報量を、当該出力用確率変数に対応する入力用確率用変数の平均情報量とすればよい。
例えば、薬Aの投薬の有無という確率変数Xと、検査値Bの値という確率変数Yと、があった場合、S/H判定部205は、確率変数Xの優先度を高くする。確率変数Xの状態数は「あり」、「なし」の2つと少なく、さらに「あり」の確率が極端に小さいため平均情報量が大きい。
これに対して、確率変数Yは、数値データであるため状態数が多く、さらに確率分布の偏りもそれほど極端ではなく平均情報量が小さい。さらに確率変数Yの状態には順序性があるため、期待値を計算することができる。従って、S/H判定部205は、確率変数Xの優先度を確率変数Yの優先度より高くすることにより、予測精度低下を抑制することができ、かつ計算コストを低下させることができると見込めるからである。
なお、S/H判定部205は、複数の特徴量を用いて優先度を定める場合、例えば、当該複数の特徴量それぞれを変数とする所定の関数によって算出された値が大きい順に優先度を高く設定すればよい。当該複数の特徴量が状態数、平均情報量、及び順序性の有無からなる場合、当該所定の関数は、例えば、状態数、及び順序性の有無(例えば順序性ありを1、順序性なしを0とする)の減少関数、かつ平均情報量の増加関数であればよい。
また、S/H判定部205は、複数の特徴量を用いて優先度を定める場合、例えば、当該複数の特徴量間における所定の優先順位に基づき、当該複数の特徴量をキーとして入力用確率変数をソートすることにより、優先度を定めてもよい。当該複数の特徴量が状態数、平均情報量、及び順序性の有無からなり、特徴量間の優先順位が高い順に状態数、平均情報量、及び順序性の有無である場合を考える。このとき、S/H判定部205は、例えば、状態数を第1キーとする昇順、平均情報量を第2キーとする降順、順序性の有無を第3キーとする昇順で、入力用確率変数をソートし、当該ソート後の順番を優先度とする。
また、S/H選択条件に特に精度よく予測したい項目が指定されている場合、S/H判定部205は、例えば、当該項目に対応する確率変数、及び/又は医療知識記憶部203に格納された情報が示す当該項目に関連する項目に対応する確率変数の優先度を上げてもよい。具体的には、S/H判定部205は、例えば、優先度を上げる対象として選択された確率変数の優先度を最も高くしてもよいし、また上述の所定の関数の値によって優先度を算出する場合、当該確率変数においては関数から算出された値に所定値を加えてもよい。S/H判定部205は、医療知識記憶部203に格納された情報を使用することにより、ベイジアンネットワークが示す関係性と異なる関係性を用いることができるため、予測精度が向上する。
ステップS407において、予測計算コスト評価部204は、単年予測モデルとその時点でのS/H選択テーブル1100に基づき、予測処理を行うための計算コストを評価する。ステップS408において、予測計算コスト評価部204は、評価した計算コストがS/H選択条件で定められた計算コストの上限以内か否かを判定する。
予測計算コスト評価部204が、評価した計算コストが当該上限以内でないと判定した場合(S408:NO)、ステップS409において、S/H判定部205は、S/H選択テーブル1100においてステップS406で選択した入力用確率変数のS/H選択1102を「ハード」に戻す処理を行い、ステップS410に遷移する。また、予測計算コスト評価部204が、評価した計算コストが当該上限以内でないと判定した場合(S408:YES)、ステップS411に遷移する。
次にステップS410において、S/H判定部205は、ステップS406で選択した入力用確率変数を選択済み確率変数のリストに加える。ステップS411において、S/H判定部205は、選択済み確率変数のリストに含まれない入力用確率変数があるか否かを判定する。
S/H判定部205が、選択済み確率変数のリストに含まれない入力用確率変数があると判定した場合(S411:YES)は、ステップS406に戻り処理を継続する。S/H判定部205が、選択済み確率変数のリストに含まれない入力用確率変数がないと判定した場合(S411:NO)、ステップS413において、S/H選択テーブル出力部206は、S/H選択テーブル1100をS/H選択テーブル記憶部104に出力し、S/H選択決定部103の処理を終了する。
なお、S/H選択決定部103は、全ての予測年次について、S/H選択テーブル1100を作成しなくてもよい。例えば、S/H選択決定部103は、M年目(Mは1≦M<Nを満たす自然数)までのS/H選択テーブル1100を作成し、S/H変換部105はM年目のS/H選択テーブル1100を用いてM+1年目以降のS/H変換を行ってもよい。
また、特に状態数、事前確率分布の偏り、順序性の有無は、どの年次においても不変である。従って、S/H判定部205は、これらの特徴量から選択した1以上の特徴量に基づいて、S/H選択テーブル1100を作成する場合、1年目のみS/H選択テーブル1100を作成してもよい。また、S/H選択決定部103は、予測年次ごとに、S/H選択テーブル1100のS/H選択1102及び変換方法1103の決定方法を変更してもよい。
以下、予測処理を行う場合の計算コストを評価するステップS408の処理の一例について説明する。図9Aは、確率的に従属な変数の集合に分割されたベイジアンネットワークの例を示す。なお、図9A、並びに後述する図9B及び図9Cにおいて、各円はノードを、各矢印は各ノード間の因果関係を、各円がドットで塗りつぶされているか否かは各ノードに入力されるエビデンスの種類を示す。ドットで塗りつぶされていないノードは、ソフトエビデンスが入力されるノード、又はエビデンスが入力されない第1種ノードを示し、ドットで塗りつぶされたノードはハードエビデンスが入力される第2種ノードを示す。
ベイジアンネットワーク501は、リンクテーブル910で定義された構造を持ち、現時点でのS/H選択テーブル1100に従って、各ノードに入力されるエビデンスの種類が特定されている、ベイジアンネットワークの一例である。予測計算コスト評価部204は、各ノードの種類、及び各ノードを結ぶ経路に従って、ベイジアンネットワーク501に含まれる確率変数(ハードエビデンス以外が入力されるノード)であって、確率的に従属な確率変数、からなる集合である確率変数集合502それぞれを特定する。確率変数集合502の特定方法は後述する。
予測計算コスト評価部204は、例えば、確率変数集合502それぞれに対して、ソフトエビデンスが入力される変数の状態数の積を算出し、当該積を当該確率変数集合502の計算コストとする。予測計算コスト評価部204は、例えば、算出した確率変数集合502の計算コストの総和を、全ての確率変数を推論するための計算コスト、即ちステップS408における計算コストとする。
以下、確率変数集合を特定する方法を説明する。ベイジアンネットワーク503は、リンクの経路で結ばれた確率変数504と確率変数505とを含む。ベイジアンネットワークは、上述した経路のみを含むため、確率変数504と確率変数505は、その他の確率変数に対して互いに独立である。従って、予測計算コスト評価部204は、ベイジアンネットワーク503を、確率変数504と確率変数505からなる集合を確率変数集合として特定する。
つまり、予測計算コスト評価部204は、経路で結ばれた確率変数からなる集合を確率変数集合として特定する作業を繰り返す。但し、確率変数間の経路が存在する場合であっても、経路中のハードエビデンスが入力されるノードの有無と、グラフの構造と、によっては、当該経路が遮断される場合がある。確率変数間の経路が遮断されている場合は、当該確率変数は互いに独立である。
図9Bは、経路が遮断されるパターンの例を示す。パターン511〜513は、いずれも破線部分で経路が遮断される。パターン511はtail−to−tailと呼ばれる、親ノードから複数の子ノードへの経路を含むパターンである。パターン511における親ノードは第2種ノード、子ノードは第1種ノードである。
パターン512は、head−to−tailと呼ばれる、親ノードから子ノード、及び子ノードから孫ノードへの経路を含むパターンである。パターン512における親ノードは第1種ノード、子ノードは第2種ノード、孫ノードは第1種ノードである。パターン513は、head−to−headと呼ばれる、複数の親ノードから子ノードへの経路を含むパターンである。パターン513における親ノード及び子ノードは、第1種ノードである。
図9Cは、経路が遮断されないパターンの例を示す。tail−to−tailのパターン521における親ノード及び子ノードは第1種ノードである。head−to−tailのパターン522における、親ノード、子ノード、及び孫ノードは第1種ノードである。head−to−headのパターン523及びパターン524は、第1種ノードである親ノード、子孫ノードに第2種ノードを含む。パターン523及びパターン524のように、head−to−headのパターンであって、子ノード又は子ノードの子孫ノードのいずれかが第2種ノードであるパターンにおいては、遮断が解かれる。
次に、本実施例の疾病発症予測装置100における入出力例を説明する。図10Aは、将来の疾病発症予測と医療費予測に本実施例の疾病発症予測装置100を適用した場合の入出力例を示す。疾病発症予測装置100は、例えば、体重、身長等の現在の測定値、生活習慣、及び病歴等を入力として、各疾病の将来の発症確率などの確率、及び医療費の期待値などを出力してもよい。
図10Bは、生活習慣からの将来の測定値予測に本実施例の疾病発症予測装置100を適用した場合の入出力例を示す。疾病発症予測装置100は、例えば、体重、身長等の現在の測定値、及び生活習慣を入力として、体重、血圧等の将来の予測値を出力してもよい。なお、疾病発症予測装置100は、体重、血圧などの測定値の予測値を、具体的な数値でなく、複数段階で分割された測定値の範囲として出力してもよい。
図10Cは、生活習慣の推定に本実施例の疾病発症予測装置100を適用した場合の入出力例を示す。疾病発症予測装置100は、例えば、体重、身長等の現在の測定値、及び病歴を入力として、現在の生活習慣を出力してもよい。
図11Aは、予測結果出力部107によって出力部112に表示させた個人における予測結果出力画面の例である。予測結果出力画面700は、例えば、タブ701、及び表示領域702〜708を含む。表示領域702〜708それぞれは、タブ701で指定された年次の値を表示する。表示領域702は、当該個人の年間医療費の期待値を表示する。表示領域703〜708それぞれは、当該個人の各疾病の発生率を表示する。
図11Bは、複数人の団体の予測結果出力画面の例である。予測結果出力画面800は、例えば、タブ801、及び表示領域802〜808を含む。表示領域802〜808それぞれは、タブ801で指定された年次の値を表示する。表示領域702は、当該団体の年間医療費の期待値を表示する。表示領域703〜708それぞれは、当該団体の各疾病の発生予測人数を表示する。
また、出力内容は、確率推論による予測の情報に限定されず、S/H選択テーブル1100の情報、ソフトエビデンスを入力する優先度が高いが計算コストの制限によりソフトエビデンスが入力されなかった確率変数の情報なども出力部112に表示してもよい。
上述したように、本実施例の疾病発症予測装置100は、分析対象者に関する既知の医療データを入力し、ベイジアンネットワークである単年予測モデル上での確率推論によって1年後の医療データの状態を予測する。疾病発症予測装置100は、予測された1年後の状態を入力として再度単年予測モデルにより2年後の医療データの状態を予測し、さらに再帰的にN回の予測を行うことでN年後までの医療データの年次推移を予測することができる。
その際、疾病発症予測装置100は、確率変数の特徴量に基づいて、入力用確率変数それぞれにソフトエビデンス又はハードエビデンスのいずれか入力するかを選択することで、小さい計算コストで、高精度に予測を行うことができる。特に、疾病発症予測装置100は、確率分布に偏りがある医療データの値が予測処理の繰り返しによって収束してしまうことを回避することができる。
なお、本実施例の疾病発症予測装置100は、ベイジアンネットワークを用いた予測処理を行っているが、ベイジアンネットワークの代わりに、例えば、マルコフネットワーク等の他のグラフィカルモデルを用いて同様の予測処理を行ってもよい。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることも可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
100 疾病発症予測装置、101 単年予測実行部、102 年次予測結果記憶部、103 S/H選択決定部、104 S/H選択テーブル記憶部、105 S/H変換部、108 単年予測モデル記憶部、113 演算装置、114 メモリ、115 記憶媒体、201 予測モデル入力部、202 確率分布入力部、203 医療知識記憶部、204 予測計算コスト評価部、205 S/H判定部、206 S/H選択テーブル出力部

Claims (12)

  1. プロセッサと記憶装置とを含み、
    グラフィカルモデルを用いて、確率変数の状態を予測する経年変化予測システムであって、
    前記記憶装置は、前記グラフィカルモデルを保持し、
    前記グラフィカルモデルは、第1時点におけるエビデンス群を入力として、前記確率変数の前記第1時点から第1期間経過後の状態を示す情報を出力とし、
    前記エビデンス群のエビデンスは、前記確率変数が従う確率分布又は前記確率変数の確定状態であり、
    前記プロセッサは、前記グラフィカルモデルを使用して予測処理を実行し、
    前記予測処理において、
    前記第1時点におけるエビデンス群を取得し、
    前記取得したエビデンス群に含まれる確率分布について、当該確率分布から算出される特徴量及び/又は前記グラフィカルモデルにおいて定義された当該確率分布に対応する確率変数の特徴量、に基づいて、当該確率分布から当該確率分布に対応する確率変数の確定状態への変換を行うか否かを決定し、
    前記変換の対象に決定した確率分布を、当該確率分布に対応する確率変数の確定状態に変換し、
    前記変換後の前記第1時点におけるエビデンス群を前記グラフィカルモデルに入力し、 前記確率変数の前記第1時点から前記第1期間経過後の状態を示す情報を出力する、経年変化予測システム。
  2. 請求項1に記載の経年変化予測システムであって、
    前記プロセッサは、
    前記予測処理を繰り返し、
    2回目以降の予測処理において、前回の予測処理における前記第1期間経過後の状態を示す情報を前記第1時点におけるエビデンス群として取得する、経年変化予測システム。
  3. 請求項1に記載の経年変化予測システムであって、
    前記グラフィカルモデルにおいて定義された当該確率分布に対応する確率変数の特徴量は、当該確率変数の状態数である、経年変化予測システム。
  4. 請求項1に記載の経年変化予測システムであって、
    前記グラフィカルモデルにおいて定義された当該確率分布に対応する確率変数の特徴量は、当該確率変数の状態の順序性の有無である、経年変化予測システム。
  5. 請求項1に記載の経年変化予測システムであって、
    前記グラフィカルモデルにおいて定義された当該確率分布に対応する確率変数の特徴量は、当該確率変数が従う事前分布の偏りである、経年変化予測システム。
  6. 請求項1に記載の経年変化予測システムであって、
    当該確率分布から算出される特徴量は、当該確率分布に対応する確率変数の平均情報量である、経年変化予測システム。
  7. 請求項1に記載の経年変化予測システムであって、
    前記プロセッサは、
    前記予測処理において、
    前記確率分布から算出される特徴量及び/又は前記グラフィカルモデルにおいて定義された前記確率分布に対応する確率変数の特徴量、に基づいて、前記取得したエビデンス群から前記変換の対象となる確率分布の候補を示す変換候補確率分布を選択し、
    前記変換候補確率分布に対して前記変換を行った場合において、前記変換後の前記第1時点におけるエビデンス群を前記グラフィカルモデルに入力し前記第1時点から前記第1期間経過後における前記確率変数の状態を示す情報を出力する、場合の計算コストを、
    前記グラフィカルモデルにおいて定義された前記確率変数間の関係性と、前記取得したエビデンス群に含まれ、前記変換候補確率分布と異なる確率分布、に対応する確率変数の前記グラフィカルモデルにおいて定義された状態数と、に基づいて、算出し、
    前記計算コストが閾値を超える場合、前記変換候補確率分布を再選択し、
    前記計算コストが前記閾値以下である場合、前記変換候補確率分布を前記変換の対象として決定する、経年変化予測システム。
  8. 請求項1に記載の経年変化予測システムであって、
    前記プロセッサは、
    前記予測処理において、
    前記変換の対象に決定した確率分布に対応する確率変数における、前記グラフィカルモデルにおいて定義された状態の順序性の有無、に基づいて、前記変換の対象に決定した確率分布を、当該確率分布に対応する確率変数の確定状態に変換する方法を決定し、
    前記変換の対象に決定した確率分布を、前記決定した方法で当該確率分布に対応する確率変数の確定状態に変換する、経年変化予測システム。
  9. 請求項8に記載の経年変化予測システムであって、
    前記プロセッサは、
    前記予測処理において、
    前記変換の対象に決定した確率分布であって、対応する確率変数の状態が順序性を有する確率分布に対して、
    前記グラフィカルモデルにおいて定義された当該確率変数が取り得る状態に含まれ、前記順序性が示す順序関係において互いに隣接する状態、の間隔を算出し、
    前記算出した間隔に基づいて、前記変換の対象に決定した確率分布を、当該確率分布に対応する確率変数の確定状態に変換する方法を決定する、経年変化予測システム。
  10. 請求項1に記載の経年変化予測システムであって、
    前記グラフィカルモデルにおいて、前記確率変数間の関係性が定義され、
    前記記憶装置は、前記定義された関係性と異なる前記確率変数間の関係性を示す関係性情報を保持し、
    前記プロセッサは、
    前記予測処理において、
    前記関係性情報に含まれる確率変数の指定を受け付け、
    前記取得したエビデンス群に含まれる確率分布について、当該確率分布に対応する確率変数と前記指定された確率変数との前記関係性情報が示す関係性に基づいて、当該確率分布から当該確率分布に対応する確率変数の確定状態への変換を行うか否かを決定する、経年変化予測システム。
  11. 経年変化予測システムが、グラフィカルモデルを用いて、確率変数の状態を予測する方法であって、
    前記経年変化予測システムは、前記グラフィカルモデルを保持し、
    前記グラフィカルモデルは、第1時点におけるエビデンス群を入力として、前記確率変数の前記第1時点から第1期間経過後の状態を示す情報を出力とし、
    前記エビデンス群のエビデンスは、前記確率変数が従う確率分布又は前記確率変数の確定状態であり、
    前記方法は、
    前記経年変化予測システムが、前記グラフィカルモデルを使用して予測処理を実行し、
    前記予測処理において、
    前記第1時点におけるエビデンス群を取得し、
    前記取得したエビデンス群に含まれる確率分布について、当該確率分布から算出される特徴量及び/又は前記グラフィカルモデルにおいて定義された当該確率分布に対応する確率変数の特徴量、に基づいて、当該確率分布から当該確率分布に対応する確率変数の確定状態への変換を行うか否かを決定し、
    前記変換の対象に決定した確率分布を、当該確率分布に対応する確率変数の確定状態に変換し、
    前記変換後の前記第1時点におけるエビデンス群を前記グラフィカルモデルに入力し、 前記確率変数の前記第1時点から前記第1期間経過後の状態を示す情報を出力する、方法。
  12. 経年変化予測システムに、グラフィカルモデルを用いた確率変数の状態を予測させるプログラムであって、
    前記経年変化予測システムは、前記グラフィカルモデルを保持し、
    前記グラフィカルモデルは、第1時点におけるエビデンス群を入力として、前記確率変数の前記第1時点から第1期間経過後の状態を示す情報を出力とし、
    前記エビデンス群のエビデンスは、前記確率変数が従う確率分布又は前記確率変数の確定状態であり、
    前記プログラムは、前記グラフィカルモデルを使用した予測処理を実行させ、
    前記予測処理において、
    前記第1時点におけるエビデンス群を取得する手順と、
    前記取得したエビデンス群に含まれる確率分布について、当該確率分布から算出される特徴量及び/又は前記グラフィカルモデルにおいて定義された当該確率分布に対応する確率変数の特徴量、に基づいて、当該確率分布から当該確率分布に対応する確率変数の確定状態への変換を行うか否かを決定する手順と、
    前記変換の対象に決定した確率分布を、当該確率分布に対応する確率変数の確定状態に変換する手順と、
    前記変換後の前記第1時点におけるエビデンス群を前記グラフィカルモデルに入力する手順と、
    前記確率変数の前記第1時点から前記第1期間経過後の状態を示す情報を出力する手順と、を含む手順を実行させるプログラム。
JP2015029911A 2015-02-18 2015-02-18 経年変化予測システム Expired - Fee Related JP6301853B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015029911A JP6301853B2 (ja) 2015-02-18 2015-02-18 経年変化予測システム
US15/040,419 US20160239757A1 (en) 2015-02-18 2016-02-10 Chronological change prediction system
CN201610084432.4A CN105912832A (zh) 2015-02-18 2016-02-14 经年变化预测系统以及经年变化预测方法
EP16155652.7A EP3059686A3 (en) 2015-02-18 2016-02-15 Chronological change prediction system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015029911A JP6301853B2 (ja) 2015-02-18 2015-02-18 経年変化予測システム

Publications (3)

Publication Number Publication Date
JP2016151959A JP2016151959A (ja) 2016-08-22
JP2016151959A5 JP2016151959A5 (ja) 2017-04-27
JP6301853B2 true JP6301853B2 (ja) 2018-03-28

Family

ID=55443072

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015029911A Expired - Fee Related JP6301853B2 (ja) 2015-02-18 2015-02-18 経年変化予測システム

Country Status (4)

Country Link
US (1) US20160239757A1 (ja)
EP (1) EP3059686A3 (ja)
JP (1) JP6301853B2 (ja)
CN (1) CN105912832A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109616218A (zh) * 2018-12-04 2019-04-12 泰康保险集团股份有限公司 数据处理方法、装置、介质及电子设备
JP7402645B2 (ja) 2019-09-20 2023-12-21 キヤノンメディカルシステムズ株式会社 医用情報処理装置及びプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0505748D0 (en) * 2005-03-18 2005-04-27 Sec Dep For The Home Departmen Improvements in and relating to investigations
US8078566B2 (en) * 2007-01-30 2011-12-13 Charles River Analytics, Inc. Methods and systems for constructing Bayesian belief networks
US7792598B2 (en) * 2007-04-13 2010-09-07 Raytheon Company Sparse sampling planner for sensor resource management
WO2008144908A1 (en) * 2007-05-29 2008-12-04 Christopher Mott Methods and systems for circadian physiology predictions
JP5332514B2 (ja) * 2008-10-29 2013-11-06 富士通株式会社 確率推論システム及び確率推論方法
US8630971B2 (en) * 2009-11-20 2014-01-14 Indian Institute Of Science System and method of using Multi Pattern Viterbi Algorithm for joint decoding of multiple patterns
US9043261B2 (en) * 2012-05-31 2015-05-26 Nec Corporation Latent variable model estimation apparatus, and method
GB201215944D0 (en) * 2012-09-06 2012-10-24 Univ Manchester Image processing apparatus and method for fittng a deformable shape model to an image using random forests
US20140267076A1 (en) * 2013-03-15 2014-09-18 Immersion Corporation Systems and Methods for Parameter Modification of Haptic Effects
JP6066826B2 (ja) * 2013-05-17 2017-01-25 株式会社日立製作所 分析システム及び保健事業支援方法
US11205103B2 (en) * 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis

Also Published As

Publication number Publication date
US20160239757A1 (en) 2016-08-18
JP2016151959A (ja) 2016-08-22
EP3059686A2 (en) 2016-08-24
CN105912832A (zh) 2016-08-31
EP3059686A3 (en) 2017-09-06

Similar Documents

Publication Publication Date Title
US9715657B2 (en) Information processing apparatus, generating method, medical diagnosis support apparatus, and medical diagnosis support method
Stone et al. A systematic review of the prediction of hospital length of stay: Towards a unified framework
JP6066826B2 (ja) 分析システム及び保健事業支援方法
AU2012245343B2 (en) Predictive modeling
Simpson et al. Multiple self-controlled case series for large-scale longitudinal observational databases
US20140136225A1 (en) Discharge readiness index
JP6282783B2 (ja) 分析システム及び分析方法
Islam et al. HGSORF: Henry Gas Solubility Optimization-based Random Forest for C-Section prediction and XAI-based cause analysis
Hilbert et al. Using decision trees to manage hospital readmission risk for acute myocardial infarction, heart failure, and pneumonia
JP6301853B2 (ja) 経年変化予測システム
Hans et al. Boosting distributional copula regression
WO2015173917A1 (ja) 分析システム
JP6422512B2 (ja) 計算機システム及びグラフィカルモデルの管理方法
JP6436855B2 (ja) 分析システム、及び、分析方法
Tashakkori et al. The prediction of NICU admission and identifying influential factors in four different categories leveraging machine learning approaches
WO2015145555A1 (ja) 確率推論システム
JP6425743B2 (ja) 計算機システム及びグラフィカルモデルの補正方法
Zhou et al. Emerging Methods for Oncology Clinical Trials
US20220188951A1 (en) Information Processing System and Selection Support Method
Moore Yet Another Local Learner (YALL): a localized machine learning algorithm with applications to precision medicine
US20220359082A1 (en) Health state prediction system including ensemble prediction model and operation method thereof
Sun et al. Predictive modeling of care demand and transition
Sushrith A Case Study on Hospital Readmission Prediction Using Deep Learning Algorithms on EHRs
Khaniyev et al. A prescriptive optimization approach to identification of minimal barriers for surgical patients
Keyser et al. John P. Hilbert, Scott Zasadil, Donna

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170317

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180301

R150 Certificate of patent or registration of utility model

Ref document number: 6301853

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees