JP2017146635A

JP2017146635A - 推論モデル構築システム及び推論モデル構築方法

Info

Publication number: JP2017146635A
Application number: JP2016025460A
Authority: JP
Inventors: 信二垂水; Shinji Tarumi
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2016-02-15
Filing date: 2016-02-15
Publication date: 2017-08-24
Anticipated expiration: 2036-02-15
Also published as: JP6557613B2

Abstract

【課題】従来はノードを削除して確率構造そのものを変える一方、確率構造を変えずに、過去のモデルに含まれる有用な情報を、新規データに対して適切に活用して新たな確率的依存量を計算することで新たなモデルを構築することは出来なかった。【解決手段】第一のデータに基づいて生成される第一の確率的依存構造と第一の確率的依存量とを含む第一のグラフ確率モデルが格納されるグラフィカルモデルデータベースと、第二のデータに基づく第二の確率的依存量の入力を受け付けるデータ入力部と、第一の確率的依存構造と第一の確率的依存量と第二の確率的依存量と、に基づいて第三の確率的依存量を生成する確率的依存量生成部と、第一の確率的依存構造と第三の確率的依存量とに基づいて、第二のグラフ確率モデルを生成するグラフ確率モデル生成部と、を含むことを特徴とする推論モデル構築システムの提供。【選択図】図６

Description

本発明は、推論モデル構築技術に関し、特に、データを分析し推論モデルを構築する情報処理システムに関する。

情報技術が急速に発展し、その適用領域が人々の日常生活にまで拡大された結果、社会活動でやり取りされる多種多様な情報が、膨大なデータとして蓄積されるようになった。近年、これら蓄積されたデータを分析し、新たな知見や価値を創出するデータ利活用に対する期待が高まっている。例えば、異なるサービスの利用情報を一元管理し、横断的に分析することで、サービス利用者間の類似性やサービス間の利用度合いの関連など、従来は把握できなかった知見を見出すことができると期待される。さらに、これら知見に基づいてデータの特徴をモデル化し、将来のサービス利用者数の予測や、新サービスの推薦方法の決定など、将来の予測や推定を行う試みも実施されている。

従来、データの特徴をモデル化するためには、データが内包する関連性や関連の強さをデータ毎に分析し、データ毎に適切なモデルを構築する必要があった。しかし、モデル化する対象のデータが常にその質および量を担保しているとは限らない。そこで、過去に構築済のモデルを活用し、新規のモデルを構築する技術として、これまでに以下のような方法が示されている。

例えば、特許文献１では、過去に構築したグラフィカルモデルからノードを削除し、新たなモデルの構造を構築する技術が示されている。

特開２００７−６６２６０号公報

従来技術はノードを削除して確率構造そのものを変える一方、確率構造を変えずに、過去のモデルに含まれる有用な情報を、新規データに対して適切に活用して新たな確率的依存量を計算することで新たなモデルを構築することは出来なかった。

本願において開示される発明の代表的な一例を示せば以下に示す通りである。

第一のデータに基づいて生成される第一の確率的依存構造と第一の確率的依存量とを含む第一のグラフ確率モデルが格納されるグラフィカルモデルデータベースと、第二のデータに基づく第二の確率的依存量の入力を受け付けるデータ入力部と、第一の確率的依存構造と第一の確率的依存量と第二の確率的依存量と、に基づいて第三の確率的依存量を生成する確率的依存量生成部と、第一の確率的依存構造と第三の確率的依存量とに基づいて、第二のグラフ確率モデルを生成するグラフ確率モデル生成部と、を備えることを特徴とする推論モデル構築システム。

過去のモデルに含まれる有用な情報を新規データに対して適切に活用して、確率構造を変えずに新たな確率的依存量を計算することで新たなモデルを構築することができる。

第１の実施例の推論モデル構築システムの構成を示すブロック図である。第１の実施例のモデル構築用情報の例を説明する図である。２つの確率変数によって構成されるモデル及び確率変数を説明する図である。４つの確率変数によって構成されるモデル及び確率変数を説明する図である。第１の実施例の確率信頼度情報を説明する図である。第１の実施例のグラフィカルモデル更新処理のフローチャートである。第１の実施例のモデル更新用情報を説明する図である。第１の実施例の確率テーブル計算処理のフローチャートである。第１の実施例の確率テーブル計算処理で処理した確率テーブルの例を説明する図である。第１の実施例の確率距離情報を説明する図である。第１の実施例のグラフィカルモデル更新処理を説明する図である。第１の実施例のグラフィカルモデル更新処理を説明する図である。第１の実施例の操作画面の例を説明する図である。第１の実施例の推論モデル構築システムの別の構成を示すブロック図である。第１の実施例のグラフィカルモデル記憶情報を説明する図である。第２の実施例の推論モデル構築システムの構成を示すブロック図である。第２の実施例のグラフィカルモデル評価処理のフローチャートである。第２の実施例の推論条件情報を説明する図である。第２の実施例の評価項目情報を説明する図である。第２の実施例の推論結果情報を説明する図である。第２の実施例の評価結果情報を説明する図である。第２の実施例のグラフィカルモデル共有処理のフローチャットである。第２の実施例の推論結果共有情報を説明する図である。第２の実施例のグラフィカルモデル更新処理のフローチャートである。第２の実施例の推論モデル構築システムの別の構成を示すブロック図である。第２の実施例の操作画面のひとつ目の例を説明する図である。第２の実施例の操作画面のふたつ目の例を説明する図である。

以下、発明を実施するための実施例を、図面を用いて説明する。

＜実施例１＞
第１の実施例では、データ項目間の確率的依存構造と確率的依存量を表現した推論モデルに含まれる確率的依存量を、新規データに基づき更新し、新たな推論モデルを構築する推論モデル構築システムの例を説明する。

第１の実施例の推論モデル構築システムは、推論モデルに含まれる確率的依存量を、新規データに基づき更新することで、新規データに対し推論性能の高い推論モデルを構築できる。

以下、第１の実施例の推論モデル構築システムの構成について説明する。図１は、第１の実施例の推論モデル構築システムの構成を示すブロック図である。第１の実施例の推論モデル構築システムは、データ分析部１０１およびデータベース１２０を有する。データ分析部１０１は、入力部１０２、出力部１０３、演算装置１０４、メモリ１０５および記憶媒体１０６を有する。

入力部１０２は、マウス、キーボードなどのヒューマンインターフェースであり、データ分析部１０１への入力を受け付ける。出力部１０３は、推論モデル構築システムによる演算結果を出力するディスプレイやプリンタである。記憶媒体１０６は、データ分析部１０１によるデータ分析処理を実現する各種プログラム、及びデータ分析処理の実行結果等を格納する記憶装置であり、例えば、不揮発性記憶媒体（磁気ディスクドライブ、不揮発性メモリ等）である。メモリ１０５には、記憶媒体１０６に格納されているプログラムが展開される。演算装置１０４は、メモリ１０５にロードされたプログラムを実行する演算装置であり、例えば、ＣＰＵ、ＧＰＵなどである。以下に説明する処理及び演算は、演算装置１０４が実行する。

第１の実施例の推論モデル構築システムは、一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、同一の計算機上で別個のスレッドで動作してもよく、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。

演算装置１０４によって実行されるプログラムは、リムーバブルメディア（ＣＤ−ＲＯＭ、フラッシュメモリなど）又はネットワークを介して各サーバに提供され、非一時的記憶媒体である不揮発性記憶装置に格納される。このため、計算機システムは、リムーバブルメディアを読み込むインターフェースを備えていてもよい。

以下、第１の実施例で扱うデータの種類について説明する。本実施例では、推論モデルを構築および更新するデータとして、ヒトの健康に関する情報が個人毎にまとめられた情報を含むデータを用い、推論モデルとして、ヒトの健康に関する一部の情報に基づきヒトの健康に関する他の情報を推論する推論モデルの構築システムの例を説明するが、扱うデータの種類および推論モデルはこれに限定されない。例えば、ある装置に取り付けられた複数のセンサから取得された情報が、装置の動作状況と併せて取得時期毎にまとめられたデータを用いることで、センサの情報から装置の動作状況を推論する推論モデルを構築および更新することができる。

以下、第１の実施例において推論モデル構築に用いるデータの一例を説明する。図２は、推論モデルの構築に用いるデータの一例を説明する図である。本例では、モデル構築用情報２０１は、個人と個人毎の健康に関する情報の対応関係を保持する情報を含み、個人ＩＤ２０２、空腹時血糖２０３、収縮期血圧２０４、糖尿病有病２０５、高血圧症有病２０６を含む。本例では、空腹時血糖２０３は、「１００以上」または「１００未満」の２つの状態を有するデータ項目として説明しているが、ここに含まれるデータはより細かな階層でもよい。また連続値を適切に離散化したデータ項目でも良い。収縮期血圧２０４は「１３０以上」または「１３０未満」の２つの状態を有するデータ項目として説明しているが、ここに含まれるデータはより細かな階層でもよい。また連続値を適切に離散化したデータ項目でも良い。糖尿病有病２０５は「あり」または「なし」の２つの状態を有するデータ項目として説明しているが、ここに含まれるデータはより細かな階層でもよい。高血圧症有病２０６は「あり」または「なし」の２つの状態を有するデータ項目として説明しているが、ここに含まれるデータはより細かな階層でもよい。モデル構築用情報は、入力部１０２や、ネットワークなどを介して入力され、データ記憶部１２１に記憶される。別途取得手段で入手され、事前にデータ記憶部１２１に記憶されていたものでも良い。

以下、推論モデルを構築するための情報から推論モデルを構築する処理を実施するグラフィカルモデル作成部１０７について説明する。グラフィカルモデル作成部１０７では、データ記憶部１２１に記憶されたモデル構築用情報の各項目を確率変数とし、確率変数をノード、確率変数間の条件付き依存関係をエッジとして表現したグラフ及び条件付き確率テーブルよりなるモデルを作成する。ただし、エッジは有向、無向の２種類がある。ノードの集合をＶ、エッジの集合をＥ、グラフをＧ＝（Ｖ、Ｅ）とおくことにする。グラフィカルモデル作成部１０７では、モデルとして、ベイジアンネットワークやマルコフネットワークなどのグラフィカルモデルを作成する。

以下ではグラフィカルモデルについて、例を挙げて説明する。

図３（Ａ）は、２つの確率変数Ｘ１とＸ２から成る単純なモデルである。それぞれの確率変数を表すノードを、ｖ１、ｖ２とすると、図３（Ａ）のグラフは、ｖ１、ｖ２、およびｖ１からｖ２への有向エッジｅ１より成る。Ｖ＝（ｖ１、ｖ２）、Ｅ＝（ｅ１）とおくと、図３（Ａ）のグラフはＧ＝（Ｖ、Ｅ）となる。

次に確率テーブルについて説明する。ノードｖ１、ｖ２が表す確率変数ｘ１とｘ２について、図３（Ａ）で示されるグラフＧ３０１は、ｘ１とｘ２の同時分布ｐ（ｘ１、ｘ２）がｐ（ｘ１、ｘ２）＝ｐ（ｘ２｜ｘ１）ｐ（ｘ１）により与えられることを示している。つまり、ｘ２の確率分布は、ｘ１の値に依存し、ｘ１に関する条件付き確率ｐ（ｘ２｜ｘ１）により与えられる。確率変数ｘ１には親ノードがないため、ｘ１の確率分布はｐ（ｘ１）となる。確率テーブルは、ｐ（ｘ１）とｐ（ｘ２｜ｘ１）の値である。ｐ（ｘ１）の確率テーブルは、ｘ１の各値に対する確率値である。図３（Ｂ）の３０２に例を示した。表３０２は、例えば、ｐ（ｘ１＝１）＝ａ１はｘ１＝１となる確率がａ１であることを示す。ｐ（ｘ１）は確率分布であるので、Σｐ（ｘ１）＝１となる。ここで、和はｘ１の全ての値に対してとる。ｐ（ｘ２｜ｘ１）の確率テーブルは、ｘ１、ｘ２の各値に対して、ｐ（ｘ２｜ｘ１）を求めることで得られる。図３（Ｃ）の３０３に例を示した。例えば、ｐ（ｘ２＝２｜ｘ１＝１）は、ｘ１＝１となる事例のうち、ｘ２＝２となっている事例の割合を計算することで得られる。この計算により、確率テーブルが得られる。

図３（Ａ）、図３（Ｂ）、図３（Ｃ）の例の場合には、図３（Ａ）に示すグラフＧと図３（Ｂ）と図３（Ｃ）に示す確率テーブルがグラフィカルモデルとなる。

図３（Ｄ）に示す構造３０４では、二つの確率変数Ｘ１及びＸ２が無向辺によって結ばれている。無向辺は、確率変数間が独立でないことを示す。確率変数Ｘ１とＸ２とが独立であるとは、Ｘ１とＸ２の同時分布Ｐ（Ｘ１，Ｘ２）がＰ（Ｘ１，Ｘ２）＝Ｐ（Ｘ１）Ｐ（Ｘ２）に分解できることである。確率テーブル３０２は、Ｐ（Ｘ１，Ｘ２）≠Ｐ（Ｘ１）Ｐ（Ｘ２）である状況を示している。但し、確率変数Ｘ１とＸ２が独立であるか不明である場合、確率変数間に依存性がある可能性を考慮して、構造３０４のように表現する場合がある。この確率分布は、確率テーブル３０５によって表される（図３（Ｅ）参照）。ｂｉｊは０以上１以下の実数値であり、Σｂｉｊ＝１（Σはｉとｊの両方に関する和）である。

これによって、確率変数間の依存関係を表現することができる。

上記で説明した小規模なモデルの場合には、確率分布が何に依存しているか、経験や知識に基づいて定義することも可能であるが、規模が大きくなると困難となる。その場合には、確率的依存関係（エッジ）をデータに基づいて自動的に作成してもよい。また、作成時に、経験や知識に基づく依存関係によりエッジの有無や有向、無向を制限してもよい。確率的依存関係の作成には、例えばベイジアンネットワークの構造学習技術などを用いることができる。

以上により、作成したグラフィカルモデルは記憶部１２２に記憶しておく。具体的には、グラフィカルモデルに含まれるグラフ構造Ｇを依存構造記憶部１２３に、確率テーブルは依存量記憶部１２４に記憶しておく。

図４は図２で示したモデル構築用情報２０１から構築した有向辺を有するグラフィカルモデルの一例を説明する図である。図４（Ａ）に示すグラフ構造４０１は、血糖と血圧と糖尿病と高血圧症の４つの確率変数が楕円形状によって示される。さらに、その間の有向辺が矢印によって示される。有向辺は、確率変数「糖尿病」が各状態をとる確率が、確率変数「血糖」および確率変数「血圧」に依存していることを示している。さらに、確率変数「高血圧症」が各状態をとる確率が、確率変数「血糖」および確率変数「血圧」に依存していることを示す。確率変数「血糖」の確率分布Ｐ（血糖）、確率変数「血圧」の確率分布Ｐ（血圧）、確率変数「糖尿病」の確率分布Ｐ（糖尿病｜血糖，血圧）、確率変数「高血圧」の確率分布Ｐ（高血圧症｜血糖、血圧）は、それぞれ、確率テーブル４０２、４０３、４０４、４０５によって表される（図４（Ｂ）、図４（Ｃ）、図４（Ｄ）、図４（Ｅ）参照）。

以下、第１の実施例において、推論モデルを新規データに基づき更新するための情報である信頼度を計算する確率信頼度計算部１１１と、推論モデルを新規データに基づき更新する処理を実施するグラフィカルモデル更新部１０８について説明する。

まず、確率信頼度計算部１１１について説明する。確率信頼度計算部１１１は依存量記憶部１２４に記憶された確率テーブルに含まれる確率分布の信頼度を表す指標を、確率テーブル毎かつ事前確率変数によって定められる事象毎に、確率分布の計算に用いた情報を用いて計算する。ここで信頼度とは、確率分布を示す確率値がどの程度のエビデンスにより計算されたかを示す定量的な指標であり、確率テーブルの事前確率変数群の事象空間に含まれる事象毎に計算される値である。信頼度としては例えば、各事象の事例数を用いることができる。

以下、信頼度の計算方法の例を、図４（Ｄ）に示した「血糖」、「血圧」、「糖尿病」の３つの確率変数に関するグラフィカルモデル由来の確率テーブル４０４を用いて説明する。この確率テーブルの事前確率変数群の事象空間には、（血糖，血圧）＝｛（ａ１，ｂ１），（ａ２，ｂ１），（ａ１，ｂ２），（ａ２，ｂ２）｝の４つの事象が存在するため、事象毎に４つの信頼度をそれぞれ計算する。例えば、（血糖，血圧）＝（ａ１，ｂ１）の事象における信頼度は、確率テーブル４０４の糖尿病の確率分布（なし，あり）＝（Ｃ１１１，Ｃ１１２）の値を計算したデータから、該当する事例数を求め、その値を信頼度として格納する。図５は、確率テーブル４０４に関して、事象毎に信頼度を求めた一例を示す信頼度情報である。例えば、信頼度Ｂ１１は、モデル構築用の情報の中で、「血糖」がａ１で、「血圧」がｂ１である事象の事例数として計算することができる。計算した信頼度の情報はグラフィカルモデルおよびグラフィカルモデルに含まれる確率テーブルと対応付けて、確率信頼度記憶部１２６に記憶する。

次にグラフィカルモデル更新部１０８について説明する。グラフィカル更新部１０８は、グラフィカルモデル記憶部１２２に記憶されたグラフィカルモデルを、新規データを用いて更新し、新規データに対して推論性能の高いモデルを構築する。

図６はグラフィカルモデル更新部１０８で行う処理のフローチャートを示す図である。

以下、各ステップの処理について説明する。

グラフィカルモデル取得ステップ６０１では、グラフィカルモデル記憶部１２２に記憶されるグラフィカルモデルに関する情報を取得し、メモリ１０５または記憶媒体１０６に記憶する。

モデル更新用データ取得ステップ６０２では、データ記憶部１２１に記憶された新規データを取得し、メモリ１０５または記憶媒体１０６に記憶する。なお、新規データは、データ記憶部１２１に記憶されているものだけに限定されず、入力部やその他手段を用いて新しく入力された情報を用いて良い。

図７は新規データに含まれるモデル更新用情報の一例を説明する図である。モデル更新用情報７０１は、個人ＩＤ７０２、空腹時血糖７０３、収縮期血圧７０４、糖尿病有病７０５、高血圧症有病７０６を含む。これらの項目はそれぞれ、モデル構築用情報２０１に含まれる個人ＩＤ２０２、空腹時血糖２０３、収縮期血圧２０４、糖尿病有病２０５、高血圧症有病２０６と同じ種類の情報を含む。なお、モデル更新用情報７０１に含まれるデータ項目は、モデル構築用情報２０１およびグラフィカルモデル取得部１０８で取得したグラフィカルモデルに含まれるノードの項目と必ずしも全て一致する必要はない。例えば、グラフィカルモデルに含まれる複数の確率表のうち、少なくとも一つの確率表に含まれる確率変数群を、データ項目として含んでいれば良い。

確率テーブル計算ステップ６０３では、グラフィカルモデル取得ステップ６０１で取得したグラフィカルモデルの確率テーブルに基づき、モデル更新用データ取得ステップ６０２で取得した新規データを用いて新たな確率情報を含む確率テーブルを作成する。

図８は、確率テーブル計算ステップ６０３で実施する処理のフローチャートである。以下、各ステップの処理について説明する。

ステップ８０１では、更新する対象のグラフィカルモデルに含まれる確率テーブルと、新規データに含まれるデータ項目を比較し、新規データから計算可能な確率テーブルが存在するかを判定する。例えば、図４（Ｂ）で示した確率テーブルは、確率変数「血糖」のみで定義された確率情報を含むため、新規データに「血糖」が項目として含まれていれば、計算可能な確率テーブルとして判定される。例えば、図４（Ｄ）に示した確率テーブルは、確率変数として「血糖」、「血圧」、「糖尿病」の３つの確率変数により定義された確率情報を含むため、新規データに「血糖」、「血圧」、「糖尿病」の３つの項目が含まれていれば、計算可能な確率テーブルとして判定される。計算可能な確率テーブルが存在すると判定した場合は、当該の確率テーブルをひとつ選択し、確率テーブル作成ステップ８０２に進む。計算可能な確率テーブルが存在しないと判定した場合は、終了に進み、確率距離計算ステップ６０３を終了する。

確率表作成ステップ８０２では、ステップ８０１で計算可能と判定された確率テーブルに対して、新規データを用いて、確率値を計算する。確率値の計算はグラフィカルモデル作成部で確率テーブルの確率値計算に用いた方法と同様の方法を用いて実施する。また、他の手法を用いることもできる。

図９は、図７のモデル更新用情報７０１から計算した確率テーブルの一例を説明する図である。表９０１は、「血糖」と「血圧」と「糖尿病」の３つの確率変数間の確率的な依存量を示す確率テーブルであり、図４の表４０４で示す確率テーブルに、図７のモデル更新用データ７０１から計算した確率値を格納したテーブルである。本処理ステップで作成した確率テーブルはメモリ１０５または記憶媒体１０６に記憶する。

以下、図６のグラフィカルモデル更新処理フローの説明に戻る。

確率距離計算ステップ６０４では、グラフィカルモデル取得ステップ６０１で取得したグラフィカルモデルの確率テーブルと、確率テーブル計算ステップ６０３で計算した確率テーブルとの間の確率的な距離を計算する。確率的な距離は、確率表毎かつ事前確率変数によって定められる事象ごとに計算する。ここで確率的な距離とは、２つの確率分布の間の差異を表現する定量的な指標であり、確率テーブルの事前確率変数群の事象空間に含まれる事象毎に計算される値である。

以下、確率的な距離の計算方法の例を、図４（Ｄ）に示した「血糖」、「血圧」、「糖尿病」の３つの確率変数に関するグラフィカルモデル由来の確率テーブル４０４と、図９に示した「血糖」、「血圧」、「糖尿病」の３つの確率変数に関する新規データ由来の確率テーブル９０１の、２つの確率テーブルを用いて説明する。これらの確率テーブルの事前確率変数群の事象空間には、（血糖，血圧）＝｛（ａ１，ｂ１），（ａ２，ｂ１），（ａ１，ｂ２），（ａ２，ｂ２）｝の４つの事象が存在するため、事象毎に関して４つの距離をそれぞれ計算する。例えば、（血糖，血圧）＝（ａ１，ｂ１）の事象における距離は、確率テーブル４０４の糖尿病の確率分布（なし，あり）＝（Ｃ１１１，Ｃ１１２）と確率テーブル９０１の糖尿病の確率分布（なし，あり）＝（ｃ１１１´、Ｃ１１２´）の２つの確率分布を用いて計算する。

距離の計算方法の１つ目の例を説明する。確率分布を、確率変数が取りうる状態数の次元を有する空間内の座標を示すベクトルとして表現し、２つの確率分布の距離を、それらベクトルの内積より定義される値で計算する。例えば、例えば、（血糖，血圧）＝（ａ１，ｂ１）の事象における確率距離は、確率テーブル４０４の糖尿病の確率分布（なし，あり）＝（Ｃ１１１，Ｃ１１２）と確率テーブル９０１の糖尿病の確率分布（なし，あり）＝（ｃ１１１´、Ｃ１１２´）の２つの確率分布を用いて、（Ｃ１１１×Ｃ１１１´＋Ｃ１１２×Ｃ１１２´）÷（√（Ｃ１１１×Ｃ１１１＋Ｃ１１２×Ｃ１１２）×√（Ｃ１１１´×Ｃ１１１´＋Ｃ１１２´×Ｃ１１２´））で表されるコサイン類似度を用いて計算することができる。

距離の計算方法の２つ目の例を説明する。２つの確率分布から計算されるカルバック・ライブラー・ダイバージェンスに基づき計算した値を、距離として用いる。例えば、（血糖，血圧）＝（ａ１，ｂ１）の事象における距離は、確率テーブル４０４の糖尿病の確率分布（なし，あり）＝（Ｃ１１１，Ｃ１１２）と確率テーブル９０１の糖尿病の確率分布（なし，あり）＝（ｃ１１１´、Ｃ１１２´）の２つの確率分布を用いて、Ｃ１１１×ｌоｇ（ｃ１１１÷ｃ１１１´）＋Ｃ１１２×ｌоｇ（ｃ１１２÷ｃ１１２´）で表されるカルバック・ライブラー・ダイバージェンスを用いることができる。また、ジェンセン・シャノン・ダイバージェンスなどの指標を確率距離として用いても良い。

事象毎に計算した距離は事象空間と対応づけられた確率距離情報テーブルとして、確率距離記憶部１２５に記憶される。

図１０は、確率距離計算ステップ７０３で作成した確率距離と事象空間とが対応付けられた確率距離情報テーブルの一例である。糖尿病確率距離の項目には、事象毎に確率距離計算ステップで計算された距離の情報が格納される。

確率信頼度計算ステップ６０５では、確率テーブル計算ステップ６０３で計算した確率テーブルに含まれる確率分布の信頼度を示す情報を、モデル更新用データ取得ステップ６０２で取得した新規データに基づき、確率信頼度計算部１１１を用いて計算する。計算した信頼度の情報は確率テーブルと対応付けて、確率信頼度記憶部１２６に記憶する。

確率テーブル更新ステップ６０６では、更新する対象のグラフィカルモデルに含まれる確率テーブルの確率情報と、新規データから計算した確率テーブルの確率情報の２つの確率情報から、更新後のモデルの確率テーブルの確率情報を計算し、確率テーブルを更新する。確率テーブルの更新には、確率信頼度記憶部１２６に記憶された、グラフィカルモデルに含まれる確率テーブルの確率情報の信頼度と、新規データから計算した確率テーブルの確率情報の信頼度と、確率距離記憶部１２５に記憶された２つの確率情報の距離情報と、を用いる。

このようにして、過去のグラフィカルモデルに含まれる有用な情報を新規データに対して適切に活用して、確率構造を変えずに新たな確率的依存量を計算することで新たなグラフィカルモデルを構築することができる。

以下、更新方法の例を詳細に説明する。以下の説明では、対象のグラフィカルモデルに含まれる、ある確率テーブルをＴとし、Ｔに基づき新規データから計算した確率テーブルをＴ´とする。さらに、ＴおよびＴ´に共通に含まれる、ある事象Ｅに関する確率情報を更新する場合における、Ｔに含まれる事象Ｅに関する確率分布をＰ（Ｅ）、Ｔ´に含まれる事象Ｅに関する確率分布をＰ（Ｅ）´、Ｐ（Ｅ）の信頼度をＢ（Ｅ）、Ｐ（Ｅ）´の信頼度をＢ（Ｅ）´、Ｐ（Ｅ）とＰ（Ｅ）´との確率的な距離をＤ（Ｅ）、として更新方法の例を説明する。また、更新処理によって新たに作成する事象Ｅに関する確率分布をＰ（Ｅ）´´とする。

更新方法の１つ目の例を説明する。事象Ｅに関する更新後の確率分布Ｐ（Ｅ）´´の値は、Ｂ（Ｅ）とＢ（Ｅ）´とＤ（Ｅ）の３つの変数に基づいて一意に定められるパラメータに対する閾値判定によって、Ｐ（Ｅ）またはＰ（Ｅ）´のいずれかの値を採用する。本処理を、図１１を用いて説明する。

図１１は、Ｂ（Ｅ）´とＢ（Ｅ）の比率と、Ｄ（Ｅ）の２つの値によって定義される二次元空間上における確率分布の選択境界線の一例を示す図である。直線１１０１は、事象Ｅに関する信頼度Ｂ（Ｅ）´と信頼度Ｂ（Ｅ）の比率の値に関する軸である。直線１１０２は、事象空間Ｅに関する距離Ｄ（Ｅ）の値に関する軸である。曲線１１０３は、信頼度Ｂ（Ｅ）´と信頼度Ｂ（Ｅ）の比率と、距離Ｄ（Ｅ）との２つの値によって定義される確率分布の選択境界線を示す。選択境界線は，例えば，Ｄ（Ｅ）＝ｔ／（Ｂ（Ｅ）´／Ｂ（Ｅ））のように，Ｄ（Ｅ）とＢ（Ｅ）´／Ｂ（Ｅ）の２つの指標の関連を示す曲線の数式として定義することができる。ここでｔは定数である。本例では、Ｄ（Ｅ）と、信頼度Ｂ（Ｅ）´と信頼度Ｂ（Ｅ）の比率の２つの値で決定する二次元空間上の座標位置が選択境界線よりも上側に存在する場合、Ｐ（Ｅ）´´の値にＰ（Ｅ）´の値を採用する。このとき、Ｄ（Ｅ）およびＢ（Ｅ）´／Ｂ（Ｅ）は、判定式Ｄ（Ｅ）＞ｔ／（Ｂ（Ｅ）´／Ｂ（Ｅ））を満たす。信頼度Ｂ（Ｅ）´と信頼度Ｂ（Ｅ）の比率の２つの値で決定する二次元空間上の座標位置が選択境界線よりも下側に存在する場合は、Ｐ（Ｅ）´´の値にＰ（Ｅ）の値を採用する。このとき、Ｄ（Ｅ）およびＢ（Ｅ）´／Ｂ（Ｅ）は、判定式Ｄ（Ｅ）＜ｔ／（Ｂ（Ｅ）´／Ｂ（Ｅ））を満たす。Ｄ（Ｅ）と、信頼度Ｂ（Ｅ）´と信頼度Ｂ（Ｅ）の比率の２つの値で決定する二次元空間上の座標位置が選択境界線上に存在する場合は、事前に決めたルールに従い、Ｐ（Ｅ）´またはＰ（Ｅ）の値を採用する。更新方法の１つ目の例の効果を説明する。

信頼度に基づき更新する効果を説明する。Ｂ（Ｅ）´がＢ（Ｅ）に比べて大きい場合、更新対象のグラフィカルモデルに含まれる確率テーブルＴの元々の確率情報Ｐ（Ｅ）よりも、新規データから計算した確率テーブルＴ´の確率情報Ｐ（Ｅ）´の方が、より信頼できる情報であるため、Ｐ（Ｅ）´を採用することで、新規データに対する推論性能向上に繋がる。一方、Ｂ（Ｅ）がＢ（Ｅ）´に比べて大きい場合、新規データから計算した確率テーブルＴ´の確率情報Ｐ（Ｅ）´よりも、更新対象のグラフィカルモデルに含まれる確率テーブルＴの元々の確率情報Ｐ（Ｅ）の方が、より信頼できる情報であるため、Ｐ（Ｅ）を採用することで、新規データに対する推論性能向上に繋がる。

距離に基づき更新する効果を説明する。Ｐ（Ｅ）とＰ（Ｅ）´の距離Ｄ（Ｅ）が大きい場合、グラフィカルモデルに含まれる確率テーブルＴの元々の確率情報Ｐ（Ｅ）と新規データから計算した確率テーブルＴ´の確率情報Ｐ（Ｅ）´は大きく異なることを示す。このとき、Ｐ（Ｅ）´は、元のＰ（Ｅ）とは異なる新規データの特徴に関する情報を含む確率分布であるため、Ｐ（Ｅ）´を採用することで、新規データに対する推論性能向上に繋がる。一方、距離Ｄ（Ｅ）が小さい場合は、確率表としてＰ（Ｅ）を採用することが、推論性能に与える影響は小さくなる。

信頼度と距離の両方に基づき更新する効果を説明する。信頼度だけを考慮して更新する場合、常に信頼度の高い確率テーブルが採用される。しかし、例えば、信頼度Ｂ（Ｅ）´がＢ（Ｅ）と比べて小さい場合でも、Ｄ（Ｅ）が大きい、つまりＰ（Ｅ）´とＰ（Ｅ）が異なる確率分布である場合は、信頼度が小さくても、新規データ由来の確率分布Ｐ（Ｅ）を採用することで、新規データに対する推論性能は向上する。このように、信頼度と距離の両方の指標に基づき更新することで、新規データの特長を捉えつつ、推論性能の高いモデルを構築できる。

更新方法の２つ目の例を説明する。事象Ｅに関する更新後の確率分布Ｐ（Ｅ）´´は、Ｂ（Ｅ）とＢ（Ｅ）´とＤ（Ｅ）の３つの変数に基づいて一意に定められるパラメータｋの値に基づき、Ｐ（Ｅ）とＰ（Ｅ）´を混合して計算した確率分布の値とする。

図１２を用いて説明する。図１２は、Ｂ（Ｅ）´とＢ（Ｅ）の比率と、Ｄ（Ｅ）の２つの値によって定義される二次元空間上において一意に定められる確率分布混合パラメータおよびパラメータ値間の境界線を示す図である。直線１２０１は、事象Ｅに関する信頼度Ｂ（Ｅ）´と信頼度Ｂ（Ｅ）の比率の値に関する軸である。直線１２０２は、事象空間Ｅに関する距離Ｄ（Ｅ）の値に関する軸である。曲線１２０３と曲線１２０４は、信頼度Ｂ（Ｅ）´と信頼度Ｂ（Ｅ）の比率と、距離Ｄ（Ｅ）との２つの値によって定義される確率分布混合パラメータ値の境界線を示す。選択境界線は，例えば，Ｄ（Ｅ）＝ｔ／（Ｂ（Ｅ）´／Ｂ（Ｅ））のように，Ｄ（Ｅ）とＢ（Ｅ）´／Ｂ（Ｅ）の２つの指標の関連を示す曲線の数式として定義することができる。ここでｔは定数であり、曲線ごとに異なる値を用いることができる。本例では例えば事象Ｅから計算した距離Ｄ（Ｅ）および信頼度の比率Ｂ（Ｅ）´／Ｂ（Ｅ）によって計算される座標が曲線１２０３と１２０４の間に存在する場合、パラメータｋの値は０．５となる。パラメータｋはＰ（Ｅ）とＰ（Ｅ）´の情報の混合度合いを調整するためのパラメータであって、値が大きいほどＰ（Ｅ）の情報を、値が小さいほどＰ（Ｅ）´の情報を、より多く用いて、Ｐ（Ｅ）´´を計算する。

次に混合パラメータｋに基づき、パラメータを混合する方法について説明する。

混合方法の１つ目の例を説明する。確率分布Ｐ（Ｅ）と確率分布Ｐ（Ｅ）´をベクトルと捉えて、これらをｋにより重みづけ加算したベクトルを、Ｐ（Ｅ）´´の確率値とする。例えばｋが０以上１以下の値であるとき、Ｐ（Ｅ）´´の確率変数を表すベクトルを、Ｐ（Ｅ）×ｋ＋Ｐ（Ｅ）´×（１−ｋ）で計算されたベクトルとする。

混合方法の２つ目の例を説明する。Ｐ（Ｅ）´´をベイズ推定する際の事前分布のハイパーパラメータとしてｋを利用する。以下、まずベイズ推定の概要について説明した後、詳細な計算例を説明する。ベイズ推定では、事象をモデル化した事前確率分布と、事象に基づく新たな観測データと、が存在する場合に、データ観測後の事後確率分布を「事後確率∝尤度関数×事前確率」として定式化し、推定することができる。例えば、あるモデルパラメータμを有する事前確率分布Ｐ（μ）と、新たなデータＤが観測された場合、データ観測後の事後確率Ｐ（μ｜Ｄ）は、Ｐ（μ｜Ｄ）∝Ｐ（Ｄ｜μ）×Ｐ（μ）として定式化できる。ここで、Ｐ（Ｄ｜μ）は、パラメータμに関し、観測データがどのくらい発生しやすいかを表現する尤度関数である。Ｐ（ｕ）は、パラメータμに関する事前確率分布である。ここで、Ｐ（ｕ）が、モデルパラメータμの分布を制御する更なるパラメータであるハイパーパラメータαを有する場合を考える。このとき、事前分布はＰ（μ｜α）と表現できる。ハイパーパラメータαは、モデルパラメータμに関する事前分布の精度を表すパラメータであり、事前分布と観測データＤのそれぞれが、事後分布に与える影響を調整する性能を有する。例えば事前分布の精度が高い場合は、新たなデータＤが観測されても、元々の事前分布がより支配的に事後分布を決定する。逆に事前分布の精度が低い場合には、新たなデータＤがより支配的に事後分布を決定する。このように、ハイパーパラメータの値を調整することで、事前分布の情報と、新たな情報とを所望の配分で混合した確率分布を生成することが可能になる。以下、詳細な計算例について説明する。例えば、推定対象であるＰ（Ｅ）´´を、パラメータμにより規定される多項分布Ｍｕｌｔｉ（μ）とし、新規データＤに関するパラメータμの尤度関数を、条件付き多項分布Ｍｕｌｔｉ（Ｄ｜μ）とし、Ｐ（Ｅ）を事前確率として、ハイパーパラメータαを有するディリクレ分布Ｄｉｒ（μ|α）とした場合、確率分布Ｐ（Ｅ）´´は、Ｐ（Ｅ）´´＝Ｍｕｌｔｉ（μ）∝Ｍｕｌｔｉ（Ｄ｜μ）Ｄｉｒ（μ|α）と定式化できる。ここで、Ｄｉｒ（μ|α）は、Ｐ（Ｅ）とＢ（Ｅ）を用いて式化可能な事前確率分布である。Ｍｕｌｔｉ（Ｄ｜μ）におけるＤは新規データであり、Ｍｕｌｔｉ（Ｄ｜μ）はＰ（Ｅ）とＢ（Ｅ）を用いて式化可能な尤度関数である。ここで、混合パラメータｋを用いて、事前分布のパラメータαを調整する。例えば、Ｍｕｌｔｉ（μ）∝Ｍｕｌｔｉ（Ｄ｜μ）Ｄｉｒ（μ|α×ｋ）とし、ｋの値に応じて、ハイパーパラメータの値も変化するように設定する。Ｐ（Ｅ）´´は例えば、最大事後確率推定法などの方法を用いて計算する。

更新方法の２つ目の例の効果を説明する。ハイパーパラメータは事前分布の分布形状を調整し、事後分布であるＰ（Ｅ）´´に与える影響の強さを調整する。例えば、前述の例では、ｋが大きくなると、事前分布の影響が大きくなるため、更新元のグラフィカルモデルに含まれる確率テーブルの情報が優位に影響を与えて混合される。ｋが小さくなると、事前分布の影響が小さくなるため、新規データの確率テーブルの情報が優位に影響を与えて混合される。これにより、新規データの特長を捉え、かつ信頼度の高いモデルを構築する際に、新規データの情報と、元のモデルの情報のいずれかを選択するのではなく、両方の情報を適切に混合でき、より推論性能の高いモデルを構築できる。
更新した確率テーブルは、モデル構造と併せて、グラフィカルモデル記憶部１２２に記憶する。

図１５は、グラフィカルモデル記憶部１２２が記憶する、構築または更新したグラフィカルモデルに関する記憶情報の例を説明する図である。本例では、グラフィカルモデル記憶情報１５０１は、構築または更新したグラフィカルモデルに関する情報を含み、モデルＩＤ１５０２、モデル構造ＩＤ１５０３、確率表ＩＤ１５０４、構築元データ１５０５、更新元データ１５０６、を含む。モデルＩＤ１５０２は、グラフィカルモデル毎に固有のＩＤであって、グラフィカルモデルを一意に識別するための識別情報である。モデル構造ＩＤ１５０３は、当該のグラフィカルモデルが有する構造を示すＩＤであり、依存構造記憶部１２３に記憶されたグラフＧ＝（Ｖ、Ｅ）のひとつに対応づけられた識別情報である。確率表ＩＤ１５０４は、当該のグラフィカルモデルが有する確率表を示すＩＤであり、依存量記憶部１２４に記憶された確率表のなかで、対象のグラフィカルモデルに関する確率表に対応付けられた識別情報である。構造元データＩＤ１５０５は、当該のグラフィカルモデルを構築する元となったデータを示すＩＤであり、データ記憶部１２１に記憶されたモデル構築用データに対応付けられた識別情報である。更新元モデルＩＤ１５０６は、当該のグラフィカルモデルの更新元のグラフィカルモデルを示すＩＤであり、グラフィカルモデル記憶部１２０に記憶されたグラフィカルモデルに対応付けられたモデルＩＤである。更新元データＩＤ１５０７は、当該のグラフィカルモデルの更新に用いたデータを示すＩＤであり、データ記憶部１２１に記憶された新規データに対応付けられた識別情報である。確率信頼度ＩＤ１５０８は、当該のモデルに含まれる確率テーブルに関し計算した確率信頼度に対応付けられたＩＤであり、確率信頼度記憶部１２６に記憶された確率信頼度に対応付けられた識別情報である。グラフィカルモデル記憶部情報１５０１を用いることで、これまでに構築したモデルの構造、確率表、構築元のデータ、更新元のモデル、更新に用いたデータ、確率信頼度に関する情報にアクセスすることが可能になる。なお、情報が存在しない箇所は、その旨をデータとして記録する。例えば、更新して構築したモデルでない場合、更新元データＩＤ１５０７には、当該のデータが存在しない旨を示す「―」などの記号を格納する。

図１３は本実施例を実現する形態の一例を示すユーザインターフェイスの画面例である。ここでは、構築済みのグラフィカルモデルの確率テーブルに含まれる情報を、新規データを用いて更新するための画面の例を示す。１３０１は、確率情報を更新する対象のグラフィカルモデルを選択するためのボタンである。１３０２は、グラフィカルモデルを更新するための新規データを選択するためのボタンである。１３０３は、新規データを用いて確率表を計算する処理を実行するボタンである。１３０４は、確率表の事象毎の確率情報の信頼度を計算する処理を実行するボタンである。１３０５は、グラフィカルモデルに含まれる確率テーブルと新規データから計算した確率テーブルの、事象毎の確率分布の距離を計算する処理を実行するボタンである。１３０６は、確率情報の信頼度と距離の情報に基づき、事象毎の確率分布の混合度合いを決定する混合係数を計算する処理を実行するボタンである。１３０７は、計算した混合係数に基づきグラフィカルモデルに含まれる確率テーブルと新規データから計算した確率テーブルから新たな確率表の情報を作成する処理を実行するボタンである。１３０８は、確率表更新処理を実行した後の新しいグラフィカルモデルを保存する処理を実行するボタンである。１３０９は、確率情報を更新する対象として選択したグラフィカルモデルの構造を表示する画面である。本例では、糖尿病と高血圧症と血糖値と血圧の４つの確率変数から構成されるグラフィカルモデルが表示されている。１３１０は、選択した新規データのデータ項目と各項目の値を示す表である。１３１１は、選択したグラフィカルモデルの中の確率表に含まれる確率情報と、当該の確率表の確率情報を新規データから計算し作成した確率表に含まれる確率情報と、事象毎の確率情報の信頼度と、２つの確率テーブルの事象毎の確率的な距離と、２つの信頼度と距離とから計算した混合係数を表示する表である。本例では、１３１１で表示対象とする確率テーブルは、１３０９の画面で選択した確率変数に関する確率テーブルとする例を示しており、ここでは糖尿病に関する確率テーブルが選択されている。１３１２は、グラフィカルモデルに含まれる確率情報と、新規データに含まれる確率情報と混合係数に基づき、更新した後の確率表に含まれる確率情報を表示する表である。

ユーザは本例で示す画面を用いることにより、更新対象のグラフィカルモデルの構造と確率テーブルに関する情報を把握できる。新規データに含まれるデータ項目とデータの値を把握できる。新規データから既存のグラフィカルモデルに含まれる確率テーブルの確率値を計算でき、その値を把握できる。グラフィカルモデルに含まれる確率テーブルの確率情報と、新規データから計算した確率テーブルの確率情報の信頼度を計算でき、その値を把握できる。グラフィカルモデルに含まれる確率テーブルと、新規データから計算した確率テーブルとの確率的な距離を計算でき、その値を把握できる。確率情報の信頼度と距離に基づき、２つの確率テーブルを混合するための混合パラメータを計算でき、その値を把握できる。グラフィカルモデルに含まれる確率テーブルを、新規データで更新でき、更新した後の確率テーブルに含まれる確率情報を把握できる。

以下、第１の実施例の変形例について説明する。

第１の実施例では、グラフィカルモデル作成部１０７を備え、モデル構築用データからグラフィカルモデルを構築し、構築したグラフィカルモデルを新規データを用いて更新する推論モデル構築システムの例を説明したが、新規データを用いて更新する推論モデルは、必ずしも本システムで構築する必要はなく、予め作成されたグラフィカルモデルを用いても良い。例えば、別のシステムで構築されたグラフィカルモデルを記憶したデータベースにアクセス可能であっても良い。

図１４に、グラフィカルモデル構築部１０７を備えない、推論モデル構築システムの例を示す。グラフィカル記憶部１２２は、予め作成されたグラフィカルモデルを記憶しておくことで、グラフィカルモデル更新部１０８により、推論モデル更新処理を実施することができる。このような推論モデル構築システムは、事前に他の手段で構築されたグラフィカルモデルに対し、更新処理を実施することが可能である。

第１の実施例では、グラフィカルモデル更新部１０８の処理において、確率テーブルに含まれる事前確率変数の事象毎に計算された信頼度と距離とに基づき、確率テーブルの値を更新する推論モデル構築システムの例を説明したが、信頼度と距離とは両方の指標を用いる必要はなく、片方の指標だけを用いて、確率テーブルを更新しても良い。また、指標を計算しない場合、指標を計算および保存する部位を有しなくて良い。例えば、信頼度を確率テーブルの更新に用いない場合、確率信頼度計算部１１１および確率信頼度記憶部１２６は、必ずしも備えなくて良い。また、距離を確率テーブルの更新に用いない場合、確率距離計算部１０９および確率距離記憶部１２５を必ずしも備えなくてよい。このような推論モデル構築システムは、確率情報の更新処理をより高速に実施することが可能となる。

第１の実施例では、グラフィカルモデル更新部１０８の処理において、確率テーブルに含まれる事前確率変数の事象毎に計算された信頼度と距離とに基づき定められた確率分布混合パラメータに基づいて、確率テーブルを更新する推論モデル構築システムの例を説明したが、識別分布選択境界線または確率分布混合パラメータの定義方法は、第１の実施例で説明した方法に限定されない。例えば、確率分布混合パラメータは、信頼度と距離とによってグリッド上に分割された空間の、分割領域ごとに、その分割領域が対応する確率分布混合パラメータを対応づけて定義しても良い。この場合、分割領域の境界を表す境界線は、信頼度のパラメータまたは距離のいずれかによって表現される。例えば、距離をＤ（Ｅ）とするとき、グリッドを構成する境界線の中で、信頼度を表す軸と平行な境界線は、Ｄ（Ｅ）＝ｔ、という式で表現することができる。ここでtは境界線の位置を示す定数である。

以上のように、本実施例に係る推論モデル構築システムは、データ項目間の確率的な依存関係として依存構造と依存量を表現する推論モデルの依存量を、新規データを用いて更新し、新たな推論モデルを構築することができる。

＜実施例２＞
第１の実施例では、データ項目間の確率的依存構造と確率的依存量を表現した推論モデルに含まれる確率的依存量を、新規データに基づき更新し、新たな推論モデルを構築する推論モデル構築システムの例を説明した。第２の実施例では、新規データが存在し、過去に構築済みの推論モデルが少なくともひとつ以上存在する場合に、推論目的に応じた推論モデルを選択し、新たな推論モデルを構築する推論モデル構築システムの例を説明する。

第２の実施例の推論モデル構築システムは、推論目的に応じた推論モデルを候補の中から選択することで、推論目的に応じた推論モデルを構築することができる。

以下、第２の実施例の推論モデル構築システムの構成について説明する。図１６は、第２の実施例の推論モデル構築システムの構成を示すブロック図である。第２の実施例の推論モデル構築システムは、構成や処理などは、グラフィカルモデル更新部１０８、グラフィカルモデル評価部１６０１、グラフィカルモデル活用部１６０２、推論条件記憶部１６０３、評価項目記憶部１６０４、推論結果記憶部１６０５、評価結果記憶部１６０６、共有情報記憶部１６０７を除き、実施例１と同様であるため、説明を省略する。

以下、グラフィカルモデル評価部１６０１で行う処理について説明する。グラフィカルモデル評価部１６０１では、グラフィカルモデルの推論性能を評価用のデータを用いて評価する。

図１７は、グラフィカルモデル評価部１６０１で行う処理のフローチャートを示す図である。以下、各ステップの処理について説明する。なお、以下で説明する処理ステップのうち、ステップ１７０１とステップ１７０２は、処理の順番に任意性を有する。ステップ１７０３とステップ１７０４は、処理の順番に任意性を有する。

グラフィカルモデル取得ステップ１７０１では、グラフィカルモデル記憶部１２２に記憶されるグラフィカルモデルから、評価する対象のグラフィカルモデルをひとつ取得する。取得したグラフィカルモデルはメモリ１０５または記憶媒体１０６に記憶する。

評価用データ取得ステップ１７０２では、データ記憶部１２１に記憶されるデータから、グラフィカルモデルの評価に用いるデータを取得する。取得したデータはメモリ１０５または記憶媒体１０６に記憶する。なお評価に用いるデータは、入力部１０２から入力されたデータでも良い。

推論条件設定ステップ１７０３では、グラフィカルモデルを用いて推論する処理における推論条件を指定する。推論条件については後に説明する。

グラフィカルモデルを用いた推論について説明する。グラフィカルモデルは、グラフィカルモデルに含まれるノードに関し、エビデンスとなる情報を与えることで、他のノードに関する確率分布を推論できる。確率分布の推論の例を、図３を用いて説明する。図３（Ａ）で示したグラフィカルモデルは、確率変数「Ｘ１」に関するエビデンスが取得できれば、図３（Ｃ）で示す確率テーブルに基づき確率変数「Ｘ２」に関する確率分布を推論できる。例えば、「Ｘ１＝１」という情報を取得できれば、図３（Ｃ）で示した確率テーブルより、確率分布「Ｘ２＝１」となる確率は「ａ１１」であることが分かる。このように、親となるノードに関するエビデンスを取得できれば、子となるノードの確率分布を推論できる。また、子となるノードに関するエビデンスに基づき、親となるノードの確率分布を推論することもできる。これら、エビデンスに基づくノードの確率分布の推論は、ジャクション・ツリーアルゴリズムなどの方法を用いることで実現できる。

推論条件設定ステップ１７０３では、推論に用いる確率変数と、推論する対象の確率変数に関する情報を設定する。図１８は、推論条件ステップ１７０３で設定する推論条件情報の一例を説明する図である。推論条件情報１８０１は、推論条件ＩＤ１８０２、項目種類１８０３、項目１８０４をデータ項目として有する。推論条件ＩＤ１８０２は、複数の推論条件を一意にまとめるための識別情報である。項目種類１８０３は、各レコードで指定する条件が、推論にエビデンスとして用いる確率変数に関するものか、または、推論する対象となる確率変数に関するものか、を指定する情報である。例えば、「観測」という情報が含まれるレコードは、観測するエビデンスの確率変数を指定するレコードである。例えば、「推論」という情報が含まれるレコードは、推論する対象の確率変数を指定するレコードである。項目１８０４は、各レコードで条件を指定した確率変数の項目名である。本例では、推論条件ＩＤが「ＩＣ０００１」である推論条件は、観測する確率変数として、「血糖」と「血圧」の２つの確率変数を指定し、推論対象の確率変数として「糖尿病重症度」の１つの確率変数を指定していることが示されている。

推論条件設定ステップ１７０３では、グラフィカルモデル取得ステップ１７０１で取得したグラフィカルモデルと、評価用データ取得ステップ１７０２で取得した評価用データを用いて推論を行うための条件を指定する。そのため、当該のグラフィカルモデルに含まれない確率変数、および、当該の評価用データに含まれない項目に関する確率変数は設定しなくてもよい。推論条件情報１８０１の設定は、例えば入力部１０２で入力された情報に基づき実施する。

推論条件設定ステップ１７０３で設定した推論条件は、推論条件記憶部１６０３に記憶する。

評価項目設定ステップ１７０４では、推論する対象の項目に関し、評価項目を設定する。図１９は、評価項目設定ステップ１７０４で設定する評価項目情報の一例を説明する図である。評価項目情報１９０１は、評価項目ＩＤ１９０２と評価項目１９０３を項目として含む。評価項目ＩＤ１９０２は各評価項目を一意に識別するための識別情報である。評価項目１９０３は、評価項目の名称を示す。評価項目情報１９０１の設定は、例えば入力部１０２で入力された情報に基づき実施する。評価項目としては、例えば、推論誤差やＣ統計量などの統計的な指標などを広く用いることができる。評価項目設定ステップ１７０４で設定可能な評価項目は、評価項目として用いる指標の計算方法と併せて、評価項目記憶部１６０４にあらかじめ記憶されている。

推論処理ステップ１７０５では、推論条件設定ステップ１７０３で指定した推論条件に基づき、評価用データ取得ステップ１７０２で取得した評価用データをエビデンスとして、推論を実施する。具体的には、評価用データの１レコードごとに、推論条件情報で観測対象として指定した確率変数に対応する項目の値をグラフィカルモデルにエビデンスとして与えて、推論条件情報で推論対象として指定した確率変数の確率分布を推論する。推論結果は、推論結果記憶部１６０５に記憶する。推論した結果は、確率分布として各状態の確率値として記憶しても良いし、確率分布に基づく統計値を計算して記憶しても良い。例えば、確率変数ごとに中央値や期待値などの値を計算して記憶しても良い。

図２０は、推論結果記憶部１６０５に記憶される推論結果の一例を説明する図である。ここでは、図１８で示した推論条件情報のうち、推論条件ＩＤが「ＩＣ０００１」で示した推論条件で推論した場合の推論結果情報の例を示す。本例では、推論結果情報２００１は項目として、個人ＩＤ２００２、糖尿病有病２００３を含む。個人ＩＤ２００２は、個人を一意に識別するための識別情報である。匿名化された上で識別子を付与してもよい。糖尿病有病２００３は、確率変数「糖尿病有病」の確率を予測した結果である。本例では、確率分布より計算した統計値が格納されている例を示す。

推論結果評価ステップ１７０６では、設定ステップ１７０４で設定した評価項目に基づき、推論処理ステップ１７０５で推論した推論結果の情報を評価する。推論結果評価ステップ１７０６は、評価項目設定ステップ１７０４で設定した評価項目の評価条件ＩＤに基づき、評価項目記憶部１６０４に記憶された、予め定められた評価手続きを経て、推論結果を評価する。評価手続きとしては、推論誤差やＣ統計量などの統計的な指標を計算し、求めることができる。評価手続きを経て評価した結果は、評価結果記憶部１６０６に記憶する。

図２１は、評価結果記憶部１６０６に記憶される評価結果の一例を説明する図である。評価結果情報２１０１は項目として、推論ＩＤ２１０２、モデルＩＤ２１０３、推論条件２１０４、推論項目２１０５、評価項目２１０６、評価結果２１０７、評価データＩＤ２１０８を有する。推論ＩＤ２１０２は、推論結果を一意に識別するためのＩＤであり、推論結果記憶部１６０４に記憶された推論結果情報に一意に対応付けられた識別情報である。モデルＩＤ２１０３は、推論に用いたグラフィカルモデルを一意に識別するためのＩＤであり、グラフィカルモデル記憶部１２２に記憶されたグラフィカルモデルに一意に対応付けられた識別情報である。推論条件ＩＤ２１０４は、推論条件を一意に識別するためのＩＤであり、推論条件記憶部１６０３に記憶された推論条件に一意に対応付けられた識別情報である。推論項目２１０５は、推論対象の項目を示す情報である。評価項目ＩＤ２１０６は、評価項目を一意に識別するためのＩＤであり、評価項目記憶部１６０４に記憶された評価項目に一意に対応付けられた識別情報である。評価結果２１０７は、本ステップで計算した評価項目の値である。この例では推論ＩＤが「ＩＲ０００１」である情報の、評価結果２１０７の値５％とは、糖尿病の有病者数の予測結果に関する推論誤差をあらわす評価項目の値を意味する。推論ＩＤが「ＩＲ０００２」である情報の、評価結果２１０７の値０．８とは、高血圧症の有病の予測に関し、評価用データから計算したＣ統計量の値を意味する。

評価データＩＤ２１０８は、評価用データ取得ステップ１７０２で取得した評価用データを一意に識別するためのＩＤあり、データ記憶部１２１に記憶されたデータに一意に対応付けられた識別情報である。

以下、グラフィカルモデル共有部１６０２で行う処理について説明する。グラフィカルモデル共有部１６０２では、グラフィカルモデル評価部で評価したグラフィカルモデルおよび評価結果について、その情報の一部を絞込み、モデル更新に必要となる情報だけを共有する。

図２２は、グラフィカルモデル共有部１６０２で行う処理のフローチャートを示す図である。以下、各ステップの処理について説明する。

評価結果情報取得ステップ２２０１では、評価結果記憶部１６０６に記憶された評価結果情報を取得する。取得した情報はメモリ１０５または記憶媒体１０６に記憶する。

グラフィカルモデル取得ステップ２２０２では、評価結果情報取得ステップ２２０１で取得した評価結果情報に含まれるモデルＩＤに基づき、グラフィカルモデル記憶部１２２に記憶される当該のグラフィカルモデルを取得する。取得したグラフィカルモデルはメモリ１０５または記憶媒体１０６に記憶する。

グラフィカルモデル情報修正ステップ２２０３では、グラフィカルモデルに含まれる情報のうちの一部を修正する。例えば、グラフィカルモデルに含まれる確率テーブルの確率情報の一部の情報を削除する。修正したグラフィカルモデルの情報はグラフィカルモデル記憶部１２２に記憶する。

共有情報作成ステップ２２０４では、グラフィカルモデル情報修正ステップ２２０３で修正したグラフィカルモデルと、評価結果情報取得ステップ２２０１で取得した評価結果情報とに基づき、推論結果共有情報を作成する。推論結果共有情報は、グラフィカルモデルと、グラフィカルモデルを用いて推論した評価結果とを合わせた情報であって、モデル更新時に、利用するグラフィカルモデルを決定するために用いる情報である。

図２３は、共有情報作成ステップ２２０４で作成する推論結果共有情報の一例を説明する図である。

推論結果共有情報２３０１は、項目として、モデルＩＤ２３０２、推論条件２３０３、項目種類２３０４、評価項目ＩＤ２３０５、評価結果２３０６、評価データＩＤ２３０７を含む。

モデルＩＤ２３０２は、推論に用いたグラフィカルモデルを一意に識別するためのＩＤであり、グラフィカルモデル記憶部１２２に記憶されたグラフィカルモデルに一意に対応付けられた識別情報である。推論条件ＩＤ２３０３は、推論条件を一意に識別するためのＩＤであり、推論条件記憶部１６０３に記憶された推論条件に一意に対応付けられた識別情報である。推論項目２３０４は、推論対象の項目を示す情報である。評価項目ＩＤ２３０５は、評価項目を一意に識別するためのＩＤであり、評価項目記憶部１６０４に記憶された評価項目に一意に対応付けられた識別情報である。評価結果２３０６は、評価項目に関する評価項目の値である。評価データＩＤ２３０７は、評価用データ取得ステップ１７０２で取得した評価用データを一意に識別するためのＩＤあり、データ記憶部１２１に記憶されたデータに一意に対応付けられた識別情報である。なお、評価対象のデータを共有しない場合は、ＩＤの情報を削除して良い。また、データの代わりにデータから取得可能な統計量を評価データに関する情報として加えて良い。例えば、データのサンプル数などの情報を加えることができる。

作成した評価結果共有情報は、共有情報記憶部１６０７に記憶する。

以下、グラフィカルモデル更新部１０８で行う処理について説明する。グラフィカルモデル更新部１０８では、共有情報記憶部１６０７に記憶された評価結果共有情報に基づき、対象の新規データから更新するグラフィカルモデルを選択する。

図２４は、グラフィカルモデル更新部１０８で行う処理のフローチャートである。本処理のステップは、ステップ２４０１とステップ２４０２を除き、実施例１で説明したグラフィカルモデル更新部１０８で行う処理のフローチャートと同様なので、説明を省略する。

モデル条件決定ステップ２４０１では、構築したグラフィカルモデルで実施する推論の推論条件を決定する。推論条件は、例えば、グラフィカルモデルで推論する際にエビデンスとして値を格納する確率変数と、推論対象の確率変数の組として表現される。推論条件は例えば、入力部１０２により入力された情報に基づき決定する。決定した推論条件は、推論条件記憶部１６０３に記憶する。

グラフィカルモデル取得ステップ２４０２では、推論条件決定ステップ２４０１で決定した推論条件に基づき、共有情報記憶部１６０７に記憶された推論結果共有情報から、適切なグラフィカルモデルに関する情報を取得する。推論条件決定ステップ２４０１で決定した推論条件に含まれる推論対象の確率変数と、共有情報記憶部１６０７に記憶された推論結果共有情報の推論項目とを比較し、同一の推論項目を有するレコードを共有情報記憶部１６０７から選択する。このとき、評価項目や評価結果に条件または閾値を設定し、レコードを絞り込んでも良い。また、選択は一意に絞り込まず、候補を複数選択し、その中から一意に絞り込むための情報を入力部１０２から受付け、その情報に基づき、絞り込んでも良い。

グラフィカルモデル取得ステップ２４０２で取得したグラフィカルモデルを、ステップ６０３、６０４，６０５，６０６の処理で更新し、新規データ向けのグラフィカルモデルを構築する。

以下、第２の実施例の効果の例について説明する。

一般に推論を実施する場合、推論対象のデータ項目と、エビデンスとなるデータ項目の両方を決定する必要がある。このとき、エビデンスに用いる項目は、推論に大きく貢献する項目であることが望ましい。例えば、グラフ上で、推論対象とエビデンス項目が直接繋がっている場合、このエビデンスは推論に大きく貢献すると期待される。一方、エビデンス項目がふたつ存在し、ひとつ目のエビデンスが、ふたつ目のエビデンス項目と推論対象をグラフ内で繋ぐ唯一の経路上に存在する場合、ふたつ目のエビデンスは、推論に貢献していない可能性がある。このように、グラフィカルモデルでは、エビデンスと推論対象の組に対し、エビデンスが推論に活用されているか否かが、その構造に依存して変化する。そのため、グラフの構造によっては、推論の性能が低下してしまう可能性がある。本実施例では、過去に構築済みのグラフィカルモデルと、その推論条件と、推論評価結果とを対応付けて管理し、新規データに対する新たなグラフィカルモデルの作成時に、管理するグラフィカルモデルの中から、推論条件および推論結果評価結果に基づき選択したグラフィカルモデルを、新規データを用いて更新して新たなグラフィカルモデルを作成することで、推論目的にあったグラフィカルモデルを構築することができる。

以下、第２の実施例の変形例について説明する。

第２の実施例では、グラフィカルモデル共有部で作成した推論結果共有情報を、元々のグラフィカルモデルを記憶していたデータベースと同じデータベースに保存する例を説明したが、これらデータベースは別々のデータベースとして実現することができ、さらに、推論結果共有情報を保存する側のデータベースを、他の推論モデル構築システムからアクセス可能なデータベースとして実現することができる。

図２５は、第２の実施例の推論モデル構築システムの別の構成例を示す図である。データベース２５００は、グラフィカルモデル記憶部２５０１、依存構造記憶部２５０２、依存量記憶部２５０３、確率信頼度記憶部２５０４、推論条件記憶部２５０５、評価項目記憶部２５０６、共有情報記憶部２５０７を有する。グラフィカルモデル記憶部２５０１、依存構造記憶部２５０２、依存量記憶部２５０３は、グラフィカルモデル共有部１６０２のグラフィカルモデル情報修正処理を実施し作成したグラフィカルモデルに関する情報を記憶する。確率信頼度記憶部２５０４は、当該のグラフィカルモデルに対応する確率信頼度情報を記憶する。共有情報記憶部２５０７は、グラフィカルモデル共有部１６０２の共有情報作成ステップで作成した共有情報を記憶する。推論条件記憶部２５０５と評価項目記憶部２５０６は、共有情報記憶部２５０７に記憶される共有情報に含まれる推論条件および評価項目に対応する情報をそれぞれ記憶する。共有する情報を別々のデータベースに保存し、他の推論モデル構築システムからアクセス可能なデータベースとして実現することで、推論モデル構築に必要な情報だけを、複数の推論モデル構築システムで共有できる。これにより例えば、自分以外のユーザが、自分以外のユーザの有するデータから構築した推論モデルの情報に基づき、自分のデータに対して推論性能の高い推論モデルを構築することが可能となる。

図２６は、第２の実施例を実現する形態の一例を示すユーザインターフェイスの画面例である。ここでは、図１７で示した、グラフィカルモデル評価部１６０１で実行するグラフィカルモデル評価処理フロー、および、図２２で示した、グラフィカルモデル共有部１６０２で実行するグラフィカルモデル共有処理フローを実行するための画面の例を示す。２６０１は、評価する対象のグラフィカルモデルを選択するためのボタンである。２６０２は、グラフィカルモデルの評価を実施するための用いるデータを選択するためのボタンである。２６０３は、グラフィカルモデル評価処理を実行するためのボタンである。２６０４はグラフィカルに含まれる情報の修正を実行するためのボタンである。２６０５は、グラフィカルモデル共有処理を実行するためのボタンである。

２６０６は、評価するグラフィカルモデルの構造と、グラフィカルモデルに含まれる確率表の情報を表示する画面である。２６０７は、評価に用いるデータのデータ項目と各項目の値を示す表である。２６０８は、評価に用いる推論条件を入力する表であり、項目種類と項目をプルダウンで入力可能である。２６０９は、評価項目を入力する表であり、項目毎に、評価項目をプルダウンで入力可能である。２６１０は、推論結果を評価した結果を示す表である。２６１１は、推論結果を評価した結果を示す表である。

ユーザは本例で示す画面を用いることにより、評価対象のグラフィカルモデルの構造と確率テーブルに関する情報を把握できる。評価用データに含まれるデータ項目とデータの値を把握できる。評価に用いる推論条件と評価項目を決定できる。決定した推論条件に基づき、推論した結果を把握できる。決定した評価項目に基づき評価した結果を把握できる。グラフィカルモデルに含まれる情報を修正できる。修正したグラフィカルモデルと評価結果を共有可能な形式に変換し、共有できる。

図２７は、第２の実施例を実現する形態の一例を示すユーザインターフェイスの画面例である。ここでは、図２４で示した、第２の実施例のグラフィカルモデル更新部１０８で実行するグラフィカルモデル更新処理フローを実行するための画面の例を示す。２７０１は、グラフィカルモデルを更新するために用いるデータを選択するボタンである。２７０２は、グラフィカルモデル更新処理を実行するためのボタンである。２７０３は、グラフィカルモデルの更新に用いるデータのデータ項目と各項目の値を示す表である。２７０４は、更新に用いるグラフィカルモデルを選択するために入力する推論条件を入力する表であり、項目種類と項目をプルダウンで入力可能である。２７０５は、評価項目を入力する表であり、評価対象の項目毎に、評価項目をプルダウンで入力可能である。２７０６は、入力した推論条件を満たす推論結果共有情報を選択した結果を表示する表である。

ユーザは本例で示す画面を用いることにより、更新用データに含まれるデータ項目とデータの値を把握できる。更新に用いるグラフィカルモデルを選択するための推論条件と評価項目を入力できる。入力した推論条件と評価項目に一致する推論結果共有情報を把握でき、推論結果共有情報に対応付けられたグラフィカルモデルと更新用データを用いて、グラフィカルモデルを更新し、推論条件および評価項目に適した新たなグラフィカルモデルを構築できる。

以上のように本実施例にかかる推論モデル構築システムは、新規データが存在し、過去に構築済みの推論モデルが少なくともひとつ以上存在する場合に、推論目的に応じた推論モデルを選択し、新たな推論モデルを構築する。

本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。上記実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることもできる。また、ある実施例の構成に他の実施例の構成を加えることもできる。また、各実施例の構成の一部について、他の構成を追加・削除・置換することもできる。

１０１データ分析部
１０２入力部
１０３出力部
１０４演算装置
１０５メモリ
１０６記憶媒体
１０７グラフィカルモデル作成部
１０８グラフィカルモデル更新部
１０９確率距離計算部
１１１確率信頼度計算部
１２０データベース
１２１データ記憶部
１２２グラフィカルモデル記憶部
１２３依存構造記憶部
１２４依存量記憶部
１２５確率距離記憶部
１２６確率信頼度記憶部
１６０１グラフィカルモデル評価部
１６０２グラフィカルモデル共有部
１６０３推論条件記憶部
１６０４評価項目記憶部
１６０５推論結果記憶部
１６０６評価結果記憶部
１６０７共有情報記憶部

Claims

第一のデータに基づいて生成される第一の確率的依存構造と第一の確率的依存量とを含む第一のグラフ確率モデルが格納されるデータベースと、
第二のデータに基づく第二の確率的依存量の入力を受け付けるデータ入力部と、
前記第一の確率的依存構造と前記第一の確率的依存量と前記第二の確率的依存量と、に基づいて第三の確率的依存量を生成する確率的依存量生成部と、
前記第一の確率的依存構造と前記第三の確率的依存量とに基づいて、第二のグラフ確率モデルを生成するグラフ確率モデル生成部と、
を備えることを特徴とする推論モデル構築システム。
請求項１に記載の推論モデル構築システムであって、
前記第一の確率的依存量は第一の確率信頼度を有し、
前記第二の確率的依存量は第二の確率信頼度を有し、
前記確率的依存量生成部は、前記第一の確率信頼度と前記第二の信頼度に基づいて、前記第三の確率的依存量を生成することを特徴とする推論モデル構築システム。
請求項１に記載の推論モデル構築システムであって、
前記確率的依存量生成部は、前記第一の確率的依存量と前記第二の確率的依存量との確率距離を計算し、前記確率距離に基づいて前記第三の確率的依存量を生成することを特徴とする推論モデル構築システム。
請求項２に記載の推論モデル構築システムであって、
前記確率的依存量生成部は、前記確率的依存量生成部は、前記第一の確率的依存量と前記第二の確率的依存量との確率距離を計算し、前記確率距離と前記第一の確率信頼度と前記第二の確率信頼度と、に基づいて前記第三の確率的依存量を生成することを特徴とする推論モデル構築システム。
請求項１に記載の推論モデル構築システムであって、
前記確率的依存量生成部は、前記第一の確率的依存量と前記第二の確率的依存量とを混合する混合係数を計算し、前記混合係数に基づいて前記第三の確率的依存量を生成することを特徴とする推論モデル構築システム。
請求項１に記載の推論モデル構築システムであって、
前記第一の確率的依存構造と前記第三の確率的依存量とを画面に出力する出力部をさらに有することを特徴とする推論モデル構築システム。
請求項１に記載の推論モデル構築システムであって、
前記グラフィカルモデルデータベースは、前記グラフ確率モデルと推論結果共有情報とをそれぞれ関連付けて複数格納し、
前記推論結果共有情報の選択を受け付ける条件選択部と、
前記選択された推論結果共有情報に関連付けられたグラフ確率モデルを前記第一のグラフ確率モデルとして選択するモデル選択部と、
をさらに備えることを特徴とする推論モデル構築システム。
請求項７に記載の推論モデル構築システムであって、
前記推論結果共有情報は、推論条件、推論項目、評価項目、評価結果または評価用データの何れか一つまたは複数を含むことを特徴とする推論モデル構築システム。
第一のデータに基づいて生成される第一の確率的依存構造と第一の確率的依存量とを含む第一のグラフ確率モデルが格納されるデータベースを用いる推論モデル構築方法であって、
データ入力部によって、第二のデータに基づく第二の確率的依存量の入力を受け付けるデータ入力ステップと、
確率的依存量生成部によって、前記第一の確率的依存構造と前記第一の確率的依存量と前記第二の確率的依存量と、に基づいて第三の確率的依存量を生成する確率的依存量生成ステップと、
グラフ確率モデル生成部によって、前記第一の確率的依存構造と前記第三の確率的依存量とに基づいて、第二のグラフ確率モデルを生成するグラフ確率モデル生成ステップと、
を含むことを特徴とする推論モデル構築方法。