JP2013206016A

JP2013206016A - 情報処理装置および方法、並びにプログラム

Info

Publication number: JP2013206016A
Application number: JP2012072789A
Authority: JP
Inventors: Takashi Isozaki; 隆司磯崎
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2012-03-28
Filing date: 2012-03-28
Publication date: 2013-10-07
Anticipated expiration: 2032-03-28
Also published as: JP5854274B2; US9311729B2; CN103365829A; US20130257873A1

Abstract

【課題】多変数間の因果関係の推定結果の信頼性をより高める。
【解決手段】検定実行部は、グラフィカルモデルにおいて少なくとも独立ではない２変数間の経路上に、２変数間の独立性の条件となる条件変数がある場合、２変数間の条件付き独立性検定を実行し、実行判定部は、２変数の経路上で、独立である第１および第２の変数がそれぞれ、第３の変数に対して独立でないグラフ構造であるＶ字構造の有無を判定する。検定実行部は、Ｖ字構造を有すると判定された経路上にのみ、条件変数がある場合には、２変数間の条件付き独立性検定を実行しない。本技術は、変数間の因果関係を推定する情報処理装置に適用することができる。
【選択図】図３

Description

本技術は、情報処理装置および方法、並びにプログラムに関し、特に、多変数間の因果関係の推定結果の信頼性をより高めることができるようにする情報処理装置および方法、並びにプログラムに関する。

従来、多変量確率変数における観察データからの統計的因果関係の推定は、情報量規準や罰則付き最尤法またはベイズ法による推定結果をスコアとしてこれを最大化する方法と、変数間の条件付き独立性の統計的検定によって推定する方法とに大別される。その結果としての変数間の因果関係を、グラフィカルモデル（非循環モデル）として表現することは、その結果の可読性の良さからしばしば行われている。

図１は、変数Ｘと変数Ｙとの因果関係を表す３つのグラフィカルモデルの例を示している。

図１上段に示されるグラフィカルモデルは、変数Ｘと変数Ｙとの因果関係が不明な場合のモデルであり、変数Ｘと変数Ｙとを頂点として、それぞれが、方向のない辺（無向辺）で結ばれている。また、図１中段に示されるグラフィカルモデルは、変数Ｘと変数Ｙとの因果関係として、変数Ｘが原因、変数Ｙが結果である場合のモデルであり、変数Ｘと変数Ｙとを頂点として、それぞれが、原因から結果への方向を示す辺（有向辺）で結ばれている。そして、図１下段に示されるグラフィカルモデルは、変数Ｘと変数Ｙとを頂点として、それぞれが、３つの変数とそれぞれを結ぶ辺で結ばれている。図１下段に示されるグラフィカルモデルにおいて、３つの変数とそれぞれを結ぶ辺は、変数Ｘと変数Ｙとの間の経路であり、その一部に、方向のある有向辺を含むようにできる。

さて、変数間の条件付き独立性の統計的検定によって変数間の因果関係を推定する方法は、潜在的な共通原因変数の存在を推測できる可能性があることと、有向辺の方向付けの理由に物理学的な背景を有することから、重要な方法とされている。しかしながら、一方では、統計的検定の検出力不足のため、推定結果の信頼性が低いことが長年にわたり解決されていない。

この方法における初期の試みでは、ｎ変数確率変数における２変数間の条件付き独立性検定を行うには、その条件となる条件変数の組として、(n-2)個の変数から、最小で０個、最大で(n-2)個の変数の組み合わせを全て取り出して、総当たりで検定を行うことが考えられた。しかしながら、この場合、変数の組み合わせ数が指数関数的に増大するため、計算機による計算は現実的ではなかった。

その後、非循環有向グラフにより、変数間の条件付き独立性が一意に表現されると仮定すると、ある２変数を条件付き独立にする条件変数の組は一意に定まることと、条件変数は着目する変数と条件付き独立ではないという条件の下で、条件変数の組の数を昇順に増加させて検定を行い、独立性が棄却されない場合には直ちに２変数間の辺をはずすことで、検定に要する計算量を大幅に削減するアルゴリズムが開示されている（非特許文献１参照）。しかしながら、このアルゴリズムにおいても、検定の試行回数が依然として多いために、検定エラーが頻発してしまう。

これに対して、非特許文献１には、上述のアルゴリズムを改良し、条件変数は着目する２変数間の経路上にあるという条件により、さらに計算量を削減することも開示されている。しかしながら、アルゴリズムの実行途中では、のちに独立と判定されるはずの辺が残っているために長い経路を辿ることが許され、検定の試行回数が実効的には大きく削減されなかった。

また、グラフ全体を小さなサブグラフに再帰的に分割することで、大きい組の数の条件変数による独立性検定の試行回数を削減するようにしたアルゴリズムがある（非特許文献２参照）。しかしながら、このアルゴリズムでは、小さい組の数の条件変数による独立性検定において、本来独立でないはずが独立であると検定される検定エラーの発生を抑えることはできなかった。

さらに、非特許文献３には、非特許文献２とは異なる方法で再帰的な処理を行うことが開示されているが、この方法は、独立性検定に大きい数の条件変数を必要とするため、計算の安定性に欠けていた。

P. Spirtes, C. Glymour, R. Scheines, "Causation, Prediction, and Search", MIT Press, second edition, 2000. R. Yehezkel, B. Lerner, "Bayesian Network Structure Learning by Recursive Autonomy Identification", Journal of Machine Learning Research, Vol. 10, pp. 1527-1570, 2009. X. Xie, Z. Geng, "A Recursive Method for Structural Learning of Directed Acyclic Graphs", Journal of Machine Learning Research, Vol. 9, pp. 459-483, 2008.

このように、条件付き独立性検定による多変数間の因果関係の推定は信頼性が低いことに対して、十分な改善を図る方法はなかった。

本技術は、このような状況に鑑みてなされたものであり、多変数間の因果関係の推定結果の信頼性をより高めることができるようにするものである。

本技術の一側面の情報処理装置は、多変数間の独立性を検定する情報処理装置であって、グラフィカルモデルにおいて少なくとも独立ではない２変数間の経路上に、前記２変数間の独立性の条件となる条件変数がある場合、前記２変数間の条件付き独立性検定を実行する実行部と、前記２変数の経路上で、独立である第１および第２の変数がそれぞれ、第３の変数に対して独立でないグラフ構造であるＶ字構造の有無を判定する判定部とを備え、前記実行部は、前記Ｖ字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記２変数間の条件付き独立性検定を実行しない。

前記実行部には、前記条件変数が、前記Ｖ字構造における前記第３の変数である場合には、前記２変数間の条件付き独立性検定を実行させないようにすることができる。

前記実行部には、条件付き独立性検定を実行するより前に、前記第１および第２の変数間の条件のない独立性検定を実行させ、前記第１および第２の変数が条件のない独立であり、かつ、前記第１および第２の変数がそれぞれ前記第３の変数に対して独立でないグラフ構造を前記Ｖ字構造として探索するＶ字構造探索部をさらに設けることができる。

前記Ｖ字構造探索部には、前記第１および第２の変数が、前記第３の変数以外の変数を条件として条件付き独立であり、かつ、前記第１および第２の変数がそれぞれ前記第３の変数に対して独立でないグラフ構造を前記Ｖ字構造として探索させることができる。

前記Ｖ字構造探索部には、インクリメントされる前記条件変数の組の数が所定の数を超えた場合、前記Ｖ字構造を探索させないようにすることができる。

前記判定部には、インクリメントされる前記条件変数の組の数に応じた数の前記２変数間の経路について、前記Ｖ字構造の有無を判定させ、前記実行部には、前記Ｖ字構造を有すると判定された経路のうちのいずれかに、前記条件変数のいずれかがある場合には、前記２変数間の条件付き独立性検定を実行させないようにすることができる。

複数の前記Ｖ字構造において、矛盾する有向辺を検出し、前記有向辺の一部または全部を無向辺にすることで、前記矛盾を解消する矛盾検出部をさらに設けることができる。

前記矛盾検出部には、複数の前記Ｖ字構造における前記第１および第２の変数間の独立性検定に用いられる指標を用いて、より独立性の弱い前記第１および第２の変数を有する前記Ｖ字構造の有向辺を無向辺にさせることができる。

変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第１のＶ字構造、および、変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第２のＶ字構造において、変数Ｘと変数Ｗとが独立でない場合、前記矛盾検出部には、前記第１のＶ字構造における変数Ｘから変数Ｚへの有向辺、および、前記第２のＶ字構造における変数Ｗから変数Ｚへの有向辺を無向辺にさせることができる。

変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第１のＶ字構造、および、変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第２のＶ字構造において、変数Ｘと変数Ｗとが独立でない場合、前記矛盾検出部には、前記第１および第２のＶ字構造における有向辺の全部を無向辺にさせることができる。

変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第１のＶ字構造、および、変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第２のＶ字構造において、変数Ｘと変数Ｗとが独立でない場合、前記矛盾検出部には、２変数間の独立性検定に用いられる指標を用いて、変数Ｘおよび変数Ｙ間の独立性と、変数Ｗおよび変数Ｙ間の独立性とで、より独立性の弱い２変数を有する前記Ｖ字構造の有向辺を無向辺にさせることができる。

本技術の一側面の情報処理方法は、多変数間の独立性を検定する情報処理装置の情報処理方法であって、グラフィカルモデルにおいて少なくとも独立ではない２変数間の経路上に、前記２変数間の独立性の条件となる条件変数がある場合、前記２変数間の条件付き独立性検定を実行する実行ステップと、前記２変数の経路上で、独立である第１および第２の変数がそれぞれ、第３の変数に対して独立でないグラフ構造であるＶ字構造の有無を判定する判定ステップとを含み、前記実行ステップは、前記Ｖ字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記２変数間の条件付き独立性検定を実行しない。

本技術の一側面のプログラムは、多変数間の独立性を検定する処理をコンピュータに実行させるプログラムであって、グラフィカルモデルにおいて少なくとも独立ではない２変数間の経路上に、前記２変数間の独立性の条件となる条件変数がある場合、前記２変数間の条件付き独立性検定を実行する実行ステップと、前記２変数の経路上で、独立である第１および第２の変数がそれぞれ、第３の変数に対して独立でないグラフ構造であるＶ字構造の有無を判定する判定ステップとを含む処理をコンピュータに実行させ、前記実行ステップは、前記Ｖ字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記２変数間の条件付き独立性検定を実行しない。

本技術の一側面においては、グラフィカルモデルにおいて少なくとも独立ではない２変数間の経路上に、２変数間の独立性の条件となる条件変数がある場合、２変数間の条件付き独立性検定が実行され、２変数の経路上で、独立である第１および第２の変数がそれぞれ、第３の変数に対して独立でないグラフ構造であるＶ字構造の有無が判定され、Ｖ字構造を有すると判定された経路上にのみ、条件変数がある場合には、２変数間の条件付き独立性検定が実行されない。

本技術の一側面によれば、多変数間の因果関係の推定結果の信頼性をより高めることが可能となる。

グラフィカルモデルの例を示す図である。本技術を適用した情報処理装置のハードウェア構成例を示すブロック図である。本技術を適用した情報処理装置の機能構成例を示すブロック図である。Ｖ字構造について説明する図である。独立性検定処理について説明するフローチャートである。独立性検定処理について説明するフローチャートである。Ｖ字構造の探索について説明する図である。２変数間の経路について説明する図である。２変数間の経路について説明する図である。矛盾解消処理について説明するフローチャートである。矛盾解消処理の具体例について説明する図である。矛盾解消処理の具体例について説明する図である。矛盾解消処理の具体例について説明する図である。矛盾解消処理の具体例について説明する図である。

以下、本技術の実施の形態について図を参照して説明する。

［情報処理装置のハードウェア構成例］
図２は、本技術を適用した情報処理装置１１のハードウェア構成例を示している。

情報処理装置１１は、離散多変数確率変数間の独立性または条件付き独立性を検定し、その結果をグラフィカルモデルの１つであるベイジアンネットワークとして出力する。

情報処理装置１１は、例えば、パーソナルコンピュータで構成することができ、その構成は、パーソナルコンピュータと同様な構成とすることができる。

情報処理装置１１は、CPU（Central Processing Unit）２１、ROM（Read Only Memory）２２、RAM（Random Access Memory）２３、バス２４、入出力インタフェース２５、入力部２６、出力部２７、記憶部２８、通信部２９、およびドライブ３０を含む構成とされている。

情報処理装置１１において、CPU２１、ROM２２、およびRAM２３は、バス２４により相互に接続されている。バス２４には、さらに、入出力インタフェース２５が接続されている。入出力インタフェース２５には、キーボード、マウス、タッチパネルなどよりなる入力部２６、ディスプレイ、スピーカなどよりなる出力部２７、ハードディスクや不揮発性のメモリなどよりなる記憶部２８、ネットワークインタフェースなどよりなる通信部２９が接続されている。

入出力インタフェース２５にはまた、必要に応じてドライブ３０が接続され、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどよりなるリムーバブルメディア３１が適宜装着され、それらから読み出されたプログラムが、必要に応じて記憶部２８にインストールされる。

また、プログラムは、有線または無線の伝送媒体を介して、通信部２９で受信し、記憶部２８にインストールすることができる。その他、プログラムは、ROM２２や記憶部２８に、あらかじめインストールしておくことができる。

なお、情報処理装置１１が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われる処理であっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

［情報処理装置の機能構成例］
図３は、情報処理装置１１の本技術に係る部分の機能構成例を示している。

図３の情報処理装置１１は、入力部５１、制御部５２、記憶部５３、および出力部５４から構成される。

入力部５１は、図２の入力部２６に対応し、Ｎ個の離散確率変数のうちの、独立性検定の対象となる２変数を指定するための引数や、条件付き独立性の条件となる条件変数の変数セット等の入力を受け付け、その内容に対応する情報を制御部５２に供給する。

制御部５２は、図２のCPU２１に対応し、記憶部５３に格納されているプログラムに従って動作し、図２の記憶部２８に対応する記憶部５３に記憶されている各種の情報を用いて、着目している２変数間の独立性検定を実行する。

出力部５４は、図２の出力部２７に対応し、制御部５２の制御の下、独立性検定の検定結果を、グラフィカルモデルとして出力する。

また、図３において、制御部５２は、経路探索部７１、実行判定部７２、検定実行部７３、Ｖ字構造探索部７４、および矛盾検出部７５を備え、記憶部５３は、変数対記憶部８１、Ｖ字構造記憶部８２、分離変数組記憶部８３を備えている。

経路探索部７１は、着目している２変数間の経路を、例えば、深さ優先探索等の一般的なアルゴリズムを用いて探索する。

実行判定部７２は、着目している２変数について、独立性検定を実行する必要があるか否かを判定する。

検定実行部７３は、着目している２変数について、独立性検定を実行する。ただし、実行判定部７２により独立性検定を実行する必要がないと判定された場合、検定実行部７３は、独立性検定を実行しない。

Ｖ字構造探索部７４は、独立であると検定された２変数について、Ｖ字構造を探索する。Ｖ字構造は、図４に示されるように、例えば、ある変数Ｘと変数Ｙとが独立であり、かつ変数Ｘと変数Ｚ、変数Ｙと変数Ｚがそれぞれ独立でないグラフ構造である。

矛盾検出部７５は、Ｖ字構造探索部７４により探索されたＶ字構造から、互いに矛盾する関係を有するＶ字構造を検出し、その矛盾を解消する。

変数対記憶部８１には、独立でないか、または独立性の検定が行われていない２変数が辺で結ばれた変数対が記憶されている。

Ｖ字構造記憶部８２には、Ｖ字構造探索部７４によって探索されたＶ字構造が記憶される。なお、実行判定部７２は、着目している２変数について、その２変数間の経路上に、Ｖ字構造記憶部８２に記憶されているＶ字構造と一致するグラフ構造があるか否かによって、独立性検定を実行する必要があるか否かを判定する。

分離変数組記憶部８３には、検定実行部７３によって実行される独立性検定により、条件付き独立であると検定された２変数間の経路上にある条件変数が、その２変数を分離する分離変数組として記憶される。

［情報処理装置による独立性検定処理］
次に、図５および図６のフローチャートを参照して、情報処理装置１１による独立性検定処理について説明する。記憶部５３には、確率変数（以下、単に変数ともいう）の数Ｎと、それぞれの変数のとりうる２値以上の内部状態数が予め記憶されており、この変数全てについての状態が記述されたＭ個のデータが、入力部５１により入力されると、独立性検定処理が開始される。

なお、初期状態として、変数対記憶部８１には、Ｎ個の変数がそれぞれ異なる(N-1)個の変数と対になった（辺で結ばれた）変数対が記憶されており、Ｖ字構造記憶部８２および分離変数組記憶部８３には何も記憶されていない。

ステップＳ１１において、制御部５２は、条件変数（以下、条件付き変数ともいう）の組の数ｉを０、すなわち、条件付き変数の組を空集合とする。

ステップＳ１２において、制御部５２は、変数対記憶部８１に記憶されている変数対から、１つの変数対を選択する。

ステップＳ１３において、検定実行部７３は、独立性検定を実行するのに用いられる値であるＧ^２統計量を計算する。Ｇ^２統計量は、以下の式（１）で示される。

・・・（１）

式（１）において、Ｍはデータ数を示している。また、＾（ハット）の付されたP(x,y,z)（以下、ハットP(x,y,z)などという）、ハットP(x|y,z)、ハットP(x|z)はそれぞれ、変数Ｘ，Ｙおよび変数の組Ｚについてのある状態ｘ，ｙ，ｚの推定される結合確率、状態ｙ，ｚを条件とした場合の状態ｘの推定される条件付き確率、状態ｚを条件とした場合の状態ｘの推定される条件付き確率を表す。これらは、Ｍ個のデータを用いて推定される。なお、ステップＳ１３においては、変数の組Ｚは空集合であるので、状態ｚは考慮されない。

ここでは、上述したＧ^２統計量とχ^２分布とを用いて導き出される、独立性検定の指標となるｐ値と、所定の閾値Th（例えば５％（0.05））とが比較されることで、選択された変数対の２変数の独立性が検定される。

すなわち、ステップＳ１４において、検定実行部７３は、ｐ値が閾値Thより大きいか否かを判定する。

ステップＳ１４において、ｐ値が閾値Thより大きいと判定された場合、処理はステップＳ１５に進み、検定実行部７３は、選択された変数対の２変数の独立性を採択する。

そして、ステップＳ１６において、検定実行部７３は、選択された変数対を、変数対記憶部８１から削除する。

一方、ステップＳ１４において、ｐ値が閾値Thより大きくないと判定された場合、処理はステップＳ１７に進み、検定実行部７３は、選択された変数対の２変数の独立性を棄却する。

なお、上述した説明では、独立性検定の指標としてｐ値を用いるものとしたが、以下の式（２）で示される条件付き相互情報量MIを、独立性検定の指標として用いるようにしてもよい。

・・・（２）

この場合、条件付き相互情報量MIと所定の閾値（例えば0.05）が比較され、条件付き相互情報量MIが閾値より小さいと判定された場合に、２変数の独立性が採択されるようになる。

さて、ステップＳ１６またはステップＳ１７の後、ステップＳ１８において、制御部５２は、変数対記憶部８１に記憶されている全ての変数対について、ステップＳ１２乃至ステップＳ１７の処理、すなわち条件のない独立性検定を実行したか否かを判定する。

ステップＳ１８において、全ての変数対について処理されていないと判定された場合、処理はステップＳ１２に戻り、新たに選択される変数対について、ステップＳ１２乃至ステップＳ１７の処理が繰り返される。

一方、ステップＳ１８において、全ての変数対について処理されたと判定された場合、処理はステップＳ１９に進む。このとき、変数対記憶部８１は、独立性が棄却された（独立でない）２変数の変数対のみが記憶された状態となる。

ステップＳ１９において、制御部５２は、上述した処理において、独立な２変数があったか否かを判定する。

ステップＳ１９において、独立な２変数が１組でもあったと判定された場合、処理はステップＳ２０に進み、Ｖ字構造探索部７４は、その独立な２変数について、Ｖ字構造を探索する。具体的には、Ｖ字構造探索部７４は、図４で示されたように、ある１組の変数Ｘ，Ｙが独立であり、それぞれが変数Ｚに対して独立ではない場合、つまり、変数Ｘ，Ｙが、２つの辺と変数Ｚからなる経路（Ｘ−Ｚ−Ｙ）を有し、かつ変数Ｚが変数Ｘ，Ｙの独立性に条件変数として寄与していない場合、このグラフ構造をＶ字構造（以下、Ｘ→Ｚ←Ｙ等と表す）として、Ｖ字構造記憶部８２に記憶させる。

一方、ステップＳ１９において、独立な２変数が１組もなかったと判定された場合、ステップＳ２０はスキップされる。

その後、処理は図６のステップＳ２１に進み、制御部５２は、条件付き変数（条件変数）の組の数ｉを１インクリメントする。すなわち、条件付き変数の組の数が１となる。

ステップＳ２２において、制御部５２は、変数対記憶部８１に記憶されている変数対、すなわち、独立でない２変数の変数対から、１つの変数対を選択する。ここでは、変数Ｓと変数Ｔの変数対が選択されたこととする。

ステップＳ２３において、制御部５２は、選択された変数対の２変数の独立性の条件となりうる条件付き変数を選択する。具体的には、制御部５２は、変数対記憶部８１に記憶されている変数対を参照することで、選択された変数対の２変数のうちのいずれか（例えば変数Ｓ）と対になっている変数を、条件付き変数として１つ選択する。ここでは、変数Ｗが選択されたこととする。

ステップＳ２４において、経路探索部７１は、選択された変数対の２変数間の経路を探索し、条件付き変数がその経路上にあるか否かを判定する。

ステップＳ２４において、例えば、変数Ｗが、変数Ｓと変数Ｔとの間の経路上にあると判定された場合、処理はステップＳ２５に進み、実行判定部７２は、変数Ｓと変数Ｔとの間の経路上に、Ｖ字構造記憶部８２に記憶されているＶ字構造と一致するグラフ構造があるか否かを判定する。

ステップＳ２５において、一致するＶ字構造があると判定された場合、その経路では、変数Ｗは変数Ｓ，Ｔの独立性の条件変数になりえないので、ステップＳ２６において、経路探索部７１は、別の経路を探索する。

ステップＳ２７において、別の経路があるか否かが判定され、別の経路が見つかった場合、処理はステップＳ２４に戻り、ステップＳ２４，Ｓ２５の処理が再度行われる。なお、ステップＳ２４において、変数Ｗが、変数Ｓと変数Ｔとの間の経路上にないと判定された場合、処理はステップＳ２３に戻り、別の条件付き変数が選択される。

一方、ステップＳ２５において、一致するＶ字構造がないと判定された場合、その経路で、変数Ｗは変数Ｓ，Ｔの独立性の条件変数になりうるとされ、処理はステップＳ２８に進む。

なお、ステップＳ２８乃至ステップＳ３１およびステップＳ３３の処理は、上述したステップＳ１３乃至ステップＳ１７の処理とそれぞれ同一であるので、その説明は省略するが、ここでは、例えば、変数Ｗを条件とした変数Ｓ，Ｔの条件付き独立性の検定が実行される。変数Ｗを条件とした変数Ｓ，Ｔの条件付き独立性が採択された場合には、変数Ｓ，Ｔの変数対が、変数対記憶部８１から削除される。

そして、ステップＳ３２において、検定実行部７３は、条件付き変数（変数Ｗ）を、分離変数組として分離変数組記憶部８３に記憶させる。

ところで、ステップＳ２７において、別の経路があるか否かが判定され、別の経路が見つからなかった場合、すなわち、Ｖ字構造があると判定された経路上にのみ、条件変数がある場合、ステップＳ２８乃至ステップＳ３３の処理はスキップされる。つまり、この場合、例えば、変数Ｗを条件とした変数Ｓ，Ｔの条件付き独立性の検定は実行されず、変数Ｓ，Ｔは、変数対のまま（辺で結ばれたまま）となる。

ここで、仮に、変数Ｓ，Ｔが条件付き独立であるならば、条件のない独立性検定（ステップＳ１３乃至ステップＳ１７の処理）において、すでに独立であると判定されているはずである。これは、非特許文献１で開示されているd-separationとfaithfulnessという理論に基づいている。また、この場合、変数Ｗは変数Ｓ，Ｔの独立性の条件変数になりえない。したがって、変数Ｓ，Ｔは条件付き独立でないことは明らかであるので、変数Ｓ，Ｔの条件付き独立性の検定は実行されない。

さて、ステップＳ３２、ステップＳ３３、またはステップＳ２７の後、ステップＳ３４において、制御部５２は、変数対記憶部８１に記憶されている全ての変数対について、ステップＳ２２乃至ステップＳ３３の処理、すなわち条件付き独立性検定を実行したか否かを判定する。

ステップＳ３４において、全ての変数対について処理されていないと判定された場合、処理はステップＳ２２に戻り、新たに選択される変数対について、ステップＳ２２乃至ステップＳ３３の処理が繰り返される。

一方、ステップＳ３４において、全ての変数対について処理されたと判定された場合、処理はステップＳ３５に進む。このとき、変数対記憶部８１は、独立性が棄却された（独立でない）か、または、条件付き独立性検定が実行されなかった２変数の変数対のみが記憶された状態となる。

ステップＳ３５において、制御部５２は、上述した処理において、独立（条件付き独立）な２変数があったか否かを判定する。

ステップＳ３５において、独立（条件付き独立）な２変数が１組でもあったと判定された場合、処理はステップＳ３６に進み、Ｖ字構造探索部７４は、その独立な２変数について、Ｖ字構造を探索する。具体的には、Ｖ字構造探索部７４は、例えば図７で示されるように、ある１組の変数Ｘ，Ｙが変数Ｗを条件として条件付き独立であり、それぞれが変数Ｚに対して独立ではない場合、かつ、変数Ｚが変数Ｘ，Ｙの条件変数（分離変数組）として分離変数組記憶部８３に記憶されていない場合、このグラフ構造をＶ字構造として、Ｖ字構造記憶部８２に記憶させる。

ただし、独立性検定に誤りが生じれば、ここでのＶ字構造も誤った構造となり、また、後述するように、条件付き変数の組の数が大きくなるほど、検定の誤りも生じやすくなるため、ここで得られたＶ字構造が検定の対象となる２変数間の経路上にあったとしても検定を実行させるようにしてもよい。

一方、ステップＳ３５において、独立（条件付き独立）な２変数が１組もなかったと判定された場合、ステップＳ３６はスキップされる。

ステップＳ３７において、制御部５２は、条件付き変数（条件変数）の組の数ｉが、最大の数（変数セットに含まれる全ての組の数）imax（ｉ＝imax）であるか否かを判定する。

ステップＳ３７において、ｉ＝imaxでないと判定された場合、処理はステップＳ２１に戻り、条件付き変数（条件変数）の組の数ｉが１インクリメントされて、これ以降の処理が行われる。

例えば、ｉ＝２となった場合、２個の条件付き変数それぞれについて、ｉ＝１の場合と同様の処理が行われ、２個の条件付き変数がともに１個の場合と同じ条件を満たす場合にのみ、条件付き独立性検定が実行される。すなわち、Ｖ字構造がある経路のいずれかに、条件付き変数のいずれかがある場合には、条件付き独立性検定は実行されない。これにより、不要な条件付き独立性検定の実行が回避され、エラーの生じる回数を削減することができる。

そして、ステップＳ３７において、ｉ＝imaxであると判定された場合、処理は終了する。このようにして、実行可能な全ての検定が終了すると、変数対記憶部８１には、検定により独立ではないと判定され続けたか、または、検定されずに独立ではないとされた２変数の変数対が残る。また、Ｖ字構造記憶部８２には、Ｖ字構造となる変数の組が記憶されるようになり、分離変数組記憶部８３には、独立である２変数についての条件変数の組が記憶されるようになる。

なお、記憶部５３に記憶されている内容は、制御部５２の制御の下、出力部５４に出力される。具体的には、有向辺と無向辺とが混在した部分有向非循環グラフ（ベイジアンネットワーク）が出力され、変数間の依存関係や因果関係の推定が行われるようになる。

以上の処理によれば、２変数間の経路のうち、Ｖ字構造を有する経路にのみ、条件変数がある場合には、２変数間の条件付き独立性検定は実行されなくなる。

例えば、変数Ｘと変数Ｙとの間の経路として、図８に示される経路１のみが探索され、その経路１にはＶ字構造があり、かつ、経路１上に条件変数Ｚがある場合には、変数Ｘと変数Ｙとの間の条件付き独立性検定は実行されない。ただし、変数Ｘと変数Ｙとの間の経路として、Ｖ字構造がなく条件付き変数Ｚがある経路２が探索された場合には、条件付き独立性検定は実行される。

また、変数Ｘと変数Ｙとの間の経路として、図９に示される経路のみが探索され、その経路にはＶ字構造があり、かつ、そのＶ字構造における独立な２変数それぞれに対して独立でない変数が条件変数Ｚである場合にも、変数Ｘと変数Ｙとの間の条件付き独立性検定は実行されない。

このように、以上の処理によれば、条件付き独立性検定の実行回数を削減することができるので、検定エラーの発生の頻度を低くすることができ、ひいては、変数間の因果関係の推定結果の信頼性をより高めることが可能となる。

なお、以上においては、離散値としての変数について独立性検定を実行する処理について説明してきたが、変数が連続値である場合には、条件付き独立性の指標としての偏相関係数と、フィッシャーのＺ変換とを用いることで、独立性検定を実行することができる。また、統計的なパターン認識に用いられる手法であるカーネル法を用いることで、独立性検定を実行するようにしてもよい。

また、上述した独立性検定処理において、条件変数の組の数が大きくなれば、条件付き独立性検定の信頼性の低下は避けられず、したがって、Ｖ字構造の探索の精度も悪化し、結果として、変数間の因果関係の推定結果の信頼性を低下させる恐れがある。

そこで、インクリメントされる条件付き変数（条件変数）の組の数ｉが、所定の数の超えた場合には、ステップＳ３５において条件付き独立な２変数があったと判定されたとしても、ステップＳ３６の処理（Ｖ字構造の探索）をスキップするようにしてもよい。

これにより、条件付き独立性検定の信頼性の低下による、精度の悪いＶ字構造の探索は行われなくなり、変数間の因果関係の推定結果の信頼性の低下を避けることができる。なお、スキップされたＶ字構造の探索は、全ての条件付き独立性検定が終わった後に実行されるものとする。

ところで、上述した独立性検定処理により、Ｖ字構造記憶部８２には、探索されたＶ字構造が記憶されるようになるが、独立性検定処理は、それぞれの２変数間について独立して実行されるため、検定のエラーが生じた場合、互いに矛盾した関係を有するＶ字構造が記憶される恐れがある。

［矛盾解消処理について］
そこで、図１０のフローチャートを参照して、Ｖ字構造の矛盾を解消する矛盾解消処理について説明する。

ステップＳ５１において、矛盾検出部７５は、Ｖ字構造記憶部８２に記憶されているＶ字構造の中から、矛盾のあるＶ字構造を検出する。

ステップＳ５２において、矛盾検出部７５は、所定の基準にしたがって、検出したＶ字構造の矛盾を解消する。

［矛盾解消処理の具体例１］
図１１は、互いに矛盾した関係を有するＶ字構造に対する矛盾解消処理の具体例について説明する図である。

図１１上側には、独立である変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でないＶ字構造（Ｘ→Ｚ←Ｙ）と、独立である変数Ｗおよび変数Ｚがそれぞれ、変数Ｘに対して独立でないＶ字構造（Ｗ→Ｘ←Ｚ）とが示されている。

この場合、一方ではＸ→Ｚとなる関係があり、他方ではＸ←Ｚとなる関係があるという矛盾が生じている。

これに対して、矛盾検出部７５は、それぞれのＶ字構造において独立である２変数についての独立性検定に用いられた条件付き独立性の指標、具体的には、ｐ値や条件付き相互情報量MIを用いて、条件付き独立性の弱い２変数を有するＶ字構造の有向辺を無向辺にする。

具体的には、変数Ｘおよび変数Ｙ、変数Ｗおよび変数Ｚのそれぞれについてのｐ値が比較されることで、いずれの２変数間の条件付き独立性が弱いかが判定される。例えば、変数Ｘおよび変数Ｙについてのｐ値が0.50であり、変数Ｗおよび変数Ｚについてのｐ値が0.20であった場合には、変数Ｘおよび変数Ｙを有するＸ→Ｚ←ＹのＶ字構造が採用され、図１１下側に示されるように、変数Ｚを原因とし、変数Ｘを結果とした因果関係（以下、Ｚ→Ｘの関係などと表す）を表す有向辺が無向化される。また、Ｖ字構造記憶部８２からはＷ→Ｘ←ＺのＶ字構造が削除される。

［矛盾解消処理の具体例２］
図１２は、互いに矛盾した関係を有するＶ字構造に対する矛盾解消処理の他の具体例について説明する図である。

図１２上側には、独立である変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でないＶ字構造（Ｘ→Ｚ←Ｙ）と、独立である変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でないＶ字構造（Ｗ→Ｚ←Ｙ）とが示されている。また、図１２において、変数Ｘと変数Ｗとは独立でない。

この場合、変数Ｘと変数Ｗとは、本来は、変数Ｚ以外の変数を条件変数として条件付き独立である必要があるという矛盾が生じている。

これに対して、矛盾検出部７５は、図１２下側に示されるように、Ｘ→Ｚ←ＹのＶ字構造におけるＸ→Ｚ、および、Ｗ→Ｚ←ＹのＶ字構造におけるＷ→Ｚの関係を表す有向辺を無向辺にするとともに、それぞれのＶ字構造を、Ｖ字構造記憶部８２から削除する。

［矛盾解消処理の具体例３］
図１３は、互いに矛盾した関係を有するＶ字構造に対する矛盾解消処理のさらに他の具体例について説明する図である。

図１３上側には、図１２と同様、独立である変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でないＶ字構造（Ｘ→Ｚ←Ｙ）と、独立である変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でないＶ字構造（Ｗ→Ｚ←Ｙ）とが示されている。また、図１３においても、変数Ｘと変数Ｗとは独立でない。

この場合も、変数Ｘと変数Ｗとは、本来は、変数Ｚ以外の変数を条件変数として条件付き独立である必要があるという矛盾が生じている。

これに対して、矛盾検出部７５は、図１３下側に示されるように、Ｘ→Ｚ←ＹのＶ字構造、および、Ｗ→Ｚ←ＹのＶ字構造における全ての有向辺を無向辺にするとともに、それぞれのＶ字構造を、Ｖ字構造記憶部８２から削除する。

［矛盾解消処理の具体例４］
図１４は、互いに矛盾した関係を有するＶ字構造に対する矛盾解消処理のさらに他の具体例について説明する図である。

図１４上側には、図１２と同様、独立である変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でないＶ字構造（Ｘ→Ｚ←Ｙ）と、独立である変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でないＶ字構造（Ｗ→Ｚ←Ｙ）とが示されている。また、図１４においても、変数Ｘと変数Ｗとは独立でない。

これに対して、矛盾検出部７５は、それぞれのＶ字構造において独立である２変数についての独立性検定に用いられた条件付き独立性の指標、具体的には、ｐ値や条件付き相互情報量MIを用いて、条件付き独立性の弱い２変数を有するＶ字構造において、他方のＶ字構造に共有されない有向辺を無向辺にする。

具体的には、変数Ｘおよび変数Ｙ、変数Ｗおよび変数Ｙのそれぞれについてのｐ値が比較され、いずれの２変数間の条件付き独立性が弱いかが判定される。例えば、変数Ｘおよび変数Ｙについてのｐ値が0.50であり、変数Ｗおよび変数Ｚについてのｐ値が0.30であった場合には、変数Ｘおよび変数Ｙを有するＸ→Ｚ←ＹのＶ字構造が採用され、図１４下側に示されるように、Ｗ→Ｚ←ＹのＶ字構造において、Ｘ→Ｚ←ＹのＶ字構造に共有されないＷ→Ｚの関係を表す有向辺が無向化される。また、Ｖ字構造記憶部８２からはＷ→Ｚ←ＹのＶ字構造が削除される。

以上の処理によれば、Ｖ字構造において、矛盾するＶ字構造が検出され、その矛盾が解消される。したがって、矛盾解消処理を、独立性検定処理と並行して実行することで、誤ったＶ字構造を用いた条件付き独立性検定によるエラーの発生する可能性を低減することができ、ひいては、変数間の因果関係の推定結果の信頼性をより高めることが可能となる。

［本技術の適用例］
なお、本技術は、以下に挙げるような例に適用することが可能である。

（１）統計的因果関係推定装置
多変量確率変数における観察データからの統計的因果関係を推定する因果関係推定処理に、本技術の独立性検定処理を適用する。なお、離散値または連続値である多変数確率変数はユーザによって定義され、データセットも予め用意されているものとする。これにより、有向辺と無向辺の混在したグラフィカルモデルが、出力部５４としてのモニタ等に画像として出力されるようになる。このとき、条件付き独立性を考慮して有向辺の向きを定めるオリエンテーション・ルールにしたがって、グラフィカルモデルにおける無向辺を、できる限り有向辺に置き換えるようにしてもよい。また、グラフィカルモデルが、同等の関係を表すテキストデータとして、モニタ等に出力されるようにしてもよい。

（２）医療診断支援装置
病気と症状との間の因果関係を推定する因果関係推定処理に、本技術の独立性検定処理を適用する。なお、確率変数として、｛結核Ｔ，肺がんＬ、気管支炎Ｂ、胸部Ｘ線検査結果Ｘ、呼吸困難Ｄ，および喫煙状況Ｓ｝が定義され、それぞれの内部状態数がデータとして用意されているものとする。これにより、Ｖ字構造や無向辺を有する変数対が判明し、有向辺と無向辺の混在したグラフィカルモデルが、出力部５４としてのモニタ等に画像として出力されるようになる。また、条件付き独立性を考慮して有向辺の向きを定めるオリエンテーション・ルールにしたがって、グラフィカルモデルにおける無向辺を、できる限り有向辺に置き換えるようにしてもよい。この例では、変数間の因果関係として、例えば、｛Ｓ−Ｌ｝，｛Ｓ−Ｂ｝，｛Ｌ→Ｄ｝，｛Ｂ→Ｄ｝，｛Ｌ→Ｘ｝，｛Ｔ→Ｘ｝等が出力される。

（３）生産管理装置
工場における様々な測定項目と歩留りとの間の因果関係を推定する因果関係推定処理に、本技術の独立性検定処理を適用する。なお、確率変数として、｛良品か否かＹ，工場内温度Ｔ、工場内湿度Ｍ、測定項目１Ａ、測定項目２Ｂ，および測定項目３Ｃ｝が定義されているものとする。ここで、変数Ｙは、良品であるか、良品でないかの２値を有する離散値であるが、他の変数は全て連続値であるものとする。そこで、離散値である変数Ｙを基準の変数として、他の変数（連続値）を全て離散化する既知の手法を用いることで、全ての変数を離散化する。これにより、有向辺と無向辺の混在したグラフィカルモデルが、出力部５４としてのモニタ等に画像として出力されるようになる。

（４）文書分類装置
入力された文書をユーザにより予め定義されたカテゴリに分類する文書分類装置における文書分類の学習処理に、本技術の独立性検定処理を適用する。この文書分類装置は、予め分類された、または分類タグが付された文書が入力されると、その文書を、形態素解析等により品詞に分解する。これで、カテゴリを表す変数Ｃと、品詞の出現頻度を表す変数Ｓが用意されたことになる。ここで、変数Ｃは離散値であるが、変数Ｓは連続値であるので、変数Ｃを基準として変数Ｓを離散化（カテゴライズ）する。そして、離散値である変数Ｓについて、本技術の独立性検定処理を実行することで、有向辺と無向辺の混在したグラフィカルモデルが得られる。このとき、情報量規準を用いて、無向辺を有向辺に置き換えるようにしてもよい。さらに、全ての変数Ｓとカテゴリを表す変数Ｃとを有向辺で結ぶことで、条件付き確率分布の積がベイジアンネットワークとして表現されるようになる。これにより、同じデータを用いて条件付き確率分布を推定することで、文書分類の学習処理が行われる。このようにして、品詞間の依存関係を推定（学習）することで、未知の文書の分類に対して、精度の高い分類器が生成されるようになる。

この文書分類装置に、分類されていない新しい文書が入力されると品詞に分解され、分解された品詞の頻度情報が、分類器における変数Ｓの頻度情報カテゴリにマッピングされることで、入力された文書に、品詞それぞれの出現確率を表す変数Ｓが証拠として与えられる。そして、証拠の与えられていないカテゴリの確率値が、変数Ｓを周辺化することで計算され、最大となる確率値が計算されたカテゴリに、入力された文書が分類されるようになる。

（５）画像識別装置
入力された画像をユーザにより予め定義されたカテゴリに分類する画像識別装置における画像分類の学習処理に、本技術の独立性検定処理を適用する。この画像識別装置は、予め分類された、または分類タグが付された画像（学習用画像）が複数入力されると、これらの画像をクラスタ化する。さらに、画像識別装置は、クラスタ化された画像それぞれのRGB値の平均値を用いて、これらの画像を教師なしでさらにクラスタ化する。これで、カテゴリを表す変数Ｃと、RGB値の平均値を表す変数Ｖが用意されたことになる。ここで、変数Ｃは離散値であるが、変数Ｖは連続値であるので、変数Ｃを基準として変数Ｖを離散化（カテゴライズ）する。そして、離散値である変数Ｖについて、本技術の独立性検定処理を実行することで、有向辺と無向辺の混在したグラフィカルモデルが得られる。このとき、情報量規準を用いて、無向辺を有向辺に置き換えるようにしてもよい。さらに、全ての変数Ｖとカテゴリを表す変数Ｃとを有向辺で結ぶことで、条件付き確率分布の積がベイジアンネットワークとして表現されるようになる。これにより、同じデータを用いて条件付き確率分布を推定することで、画像分類の学習処理が行われる。このようにして、RGB値間の依存関係を推定（学習）することで、未知の画像の分類に対して、精度の高い分類器が生成されるようになる。

この画像識別装置に、分類されていない新しい画像が入力されるとRGB値の平均値が算出され、その画像のRGB値の平均値が、分類器における変数ＶのRGB値カテゴリにマッピングされることで、入力された画像に、変数Ｖが証拠として与えられる。そして、証拠の与えられていないカテゴリの確率値が、変数Ｖを周辺化することで計算され、最大となる確率値が計算されたカテゴリに、入力された画像が分類されるようになる。

なお、本技術は、上述した例の他にも、ユーザの選択行為を支援する意思決定支援装置、遺伝子解析や心理学解析等の社会科学分析を行う分析装置、センサからの入力情報の解析を行う解析装置、ユーザの嗜好等に応じた推薦を行う推薦装置、その他のエージェントシステム等に適用することができる。

なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

また、本技術は以下のような構成をとることができる。
（１）
多変数間の独立性を検定する情報処理装置において、
グラフィカルモデルにおいて少なくとも独立ではない２変数間の経路上に、前記２変数間の独立性の条件となる条件変数がある場合、前記２変数間の条件付き独立性検定を実行する実行部と、
前記２変数の経路上で、独立である第１および第２の変数がそれぞれ、第３の変数に対して独立でないグラフ構造であるＶ字構造の有無を判定する判定部と
を備え、
前記実行部は、前記Ｖ字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記２変数間の条件付き独立性検定を実行しない
情報処理装置。
（２）
前記実行部は、前記条件変数が、前記Ｖ字構造における前記第３の変数である場合には、前記２変数間の条件付き独立性検定を実行しない
（１）に記載の情報処理装置。
（３）
前記実行部は、条件付き独立性検定を実行するより前に、前記第１および第２の変数間の条件のない独立性検定を実行し、
前記第１および第２の変数が条件のない独立であり、かつ、前記第１および第２の変数がそれぞれ前記第３の変数に対して独立でないグラフ構造を前記Ｖ字構造として探索するＶ字構造探索部をさらに備える
（１）または（２）に記載の情報処理装置。
（４）
前記Ｖ字構造探索部は、前記第１および第２の変数が、前記第３の変数以外の変数を条件として条件付き独立であり、かつ、前記第１および第２の変数がそれぞれ前記第３の変数に対して独立でないグラフ構造を前記Ｖ字構造として探索する
（３）に記載の情報処理装置。
（５）
前記Ｖ字構造探索部は、インクリメントされる前記条件変数の組の数が所定の数を超えた場合、前記Ｖ字構造を探索しない
（４）に記載の情報処理装置。
（６）
前記判定部は、インクリメントされる前記条件変数の組の数に応じた数の前記２変数間の経路について、前記Ｖ字構造の有無を判定し、
前記実行部は、前記Ｖ字構造を有すると判定された経路のうちのいずれかに、前記条件変数のいずれかがある場合には、前記２変数間の条件付き独立性検定を実行しない
（１）乃至（５）のいずれかに記載の情報処理装置。
（７）
複数の前記Ｖ字構造において、矛盾する有向辺を検出し、前記有向辺の一部または全部を無向辺にすることで、前記矛盾を解消する矛盾検出部をさらに備える
（１）乃至（６）のいずれかに記載の情報処理装置。
（８）
前記矛盾検出部は、複数の前記Ｖ字構造における前記第１および第２の変数間の独立性検定に用いられる指標を用いて、より独立性の弱い前記第１および第２の変数を有する前記Ｖ字構造の有向辺を無向辺にする
（７）に記載の情報処理装置。
（９）
変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第１のＶ字構造、および、変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第２のＶ字構造において、変数Ｘと変数Ｗとが独立でない場合、前記矛盾検出部は、前記第１のＶ字構造における変数Ｘから変数Ｚへの有向辺、および、前記第２のＶ字構造における変数Ｗから変数Ｚへの有向辺を無向辺にする
（７）に記載の情報処理装置。
（１０）
変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第１のＶ字構造、および、変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第２のＶ字構造において、変数Ｘと変数Ｗとが独立でない場合、前記矛盾検出部は、前記第１および第２のＶ字構造における有向辺の全部を無向辺にする
（７）に記載の情報処理装置。
（１１）
変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第１のＶ字構造、および、変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第２のＶ字構造において、変数Ｘと変数Ｗとが独立でない場合、前記矛盾検出部は、２変数間の独立性検定に用いられる指標を用いて、変数Ｘおよび変数Ｙ間の独立性と、変数Ｗおよび変数Ｙ間の独立性とで、より独立性の弱い２変数を有する前記Ｖ字構造の有向辺を無向辺にする
（７）に記載の情報処理装置。
（１２）
多変数間の独立性を検定する情報処理装置の情報処理方法において、
グラフィカルモデルにおいて少なくとも独立ではない２変数間の経路上に、前記２変数間の独立性の条件となる条件変数がある場合、前記２変数間の条件付き独立性検定を実行する実行ステップと、
前記２変数の経路上で、独立である第１および第２の変数がそれぞれ、第３の変数に対して独立でないグラフ構造であるＶ字構造の有無を判定する判定ステップと
を含み、
前記実行ステップは、前記Ｖ字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記２変数間の条件付き独立性検定を実行しない
情報処理方法。
（１３）
多変数間の独立性を検定する処理をコンピュータに実行させるプログラムにおいて、
グラフィカルモデルにおいて少なくとも独立ではない２変数間の経路上に、前記２変数間の独立性の条件となる条件変数がある場合、前記２変数間の条件付き独立性検定を実行する実行ステップと、
前記２変数の経路上で、独立である第１および第２の変数がそれぞれ、第３の変数に対して独立でないグラフ構造であるＶ字構造の有無を判定する判定ステップと
を含む処理をコンピュータに実行させ、
前記実行ステップは、前記Ｖ字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記２変数間の条件付き独立性検定を実行しない
プログラム。

１１情報処理装置，５１入力部，５２制御部，５３記憶部，５４出力部，７１経路探索部，７２実行判定部，７３検定実行部，７４Ｖ字構造探索部，７５矛盾検出部，８１変数対記憶部，８２Ｖ字構造記憶部，８３分離変数組記憶部

Claims

多変数間の独立性を検定する情報処理装置において、
グラフィカルモデルにおいて少なくとも独立ではない２変数間の経路上に、前記２変数間の独立性の条件となる条件変数がある場合、前記２変数間の条件付き独立性検定を実行する実行部と、
前記２変数の経路上で、独立である第１および第２の変数がそれぞれ、第３の変数に対して独立でないグラフ構造であるＶ字構造の有無を判定する判定部と
を備え、
前記実行部は、前記Ｖ字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記２変数間の条件付き独立性検定を実行しない
情報処理装置。
前記実行部は、前記条件変数が、前記Ｖ字構造における前記第３の変数である場合には、前記２変数間の条件付き独立性検定を実行しない
請求項１に記載の情報処理装置。
前記実行部は、条件付き独立性検定を実行するより前に、前記第１および第２の変数間の条件のない独立性検定を実行し、
前記第１および第２の変数が条件のない独立であり、かつ、前記第１および第２の変数がそれぞれ前記第３の変数に対して独立でないグラフ構造を前記Ｖ字構造として探索するＶ字構造探索部をさらに備える
請求項１に記載の情報処理装置。
前記Ｖ字構造探索部は、前記第１および第２の変数が、前記第３の変数以外の変数を条件として条件付き独立であり、かつ、前記第１および第２の変数がそれぞれ前記第３の変数に対して独立でないグラフ構造を前記Ｖ字構造として探索する
請求項３に記載の情報処理装置。
前記Ｖ字構造探索部は、インクリメントされる前記条件変数の組の数が所定の数を超えた場合、前記Ｖ字構造を探索しない
請求項４に記載の情報処理装置。
前記判定部は、インクリメントされる前記条件変数の組の数に応じた数の前記２変数間の経路について、前記Ｖ字構造の有無を判定し、
前記実行部は、前記Ｖ字構造を有すると判定された経路のうちのいずれかに、前記条件変数のいずれかがある場合には、前記２変数間の条件付き独立性検定を実行しない
請求項１に記載の情報処理装置。
複数の前記Ｖ字構造において、矛盾する有向辺を検出し、前記有向辺の一部または全部を無向辺にすることで、前記矛盾を解消する矛盾検出部をさらに備える
請求項１に記載の情報処理装置。
前記矛盾検出部は、複数の前記Ｖ字構造における前記第１および第２の変数間の独立性検定に用いられる指標を用いて、より独立性の弱い前記第１および第２の変数を有する前記Ｖ字構造の有向辺を無向辺にする
請求項７に記載の情報処理装置。
変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第１のＶ字構造、および、変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第２のＶ字構造において、変数Ｘと変数Ｗとが独立でない場合、前記矛盾検出部は、前記第１のＶ字構造における変数Ｘから変数Ｚへの有向辺、および、前記第２のＶ字構造における変数Ｗから変数Ｚへの有向辺を無向辺にする
請求項７に記載の情報処理装置。
変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第１のＶ字構造、および、変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第２のＶ字構造において、変数Ｘと変数Ｗとが独立でない場合、前記矛盾検出部は、前記第１および第２のＶ字構造における有向辺の全部を無向辺にする
請求項７に記載の情報処理装置。
変数Ｘおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第１のＶ字構造、および、変数Ｗおよび変数Ｙがそれぞれ、変数Ｚに対して独立でない第２のＶ字構造において、変数Ｘと変数Ｗとが独立でない場合、前記矛盾検出部は、２変数間の独立性検定に用いられる指標を用いて、変数Ｘおよび変数Ｙ間の独立性と、変数Ｗおよび変数Ｙ間の独立性とで、より独立性の弱い２変数を有する前記Ｖ字構造の有向辺を無向辺にする
請求項７に記載の情報処理装置。
多変数間の独立性を検定する情報処理装置の情報処理方法において、
グラフィカルモデルにおいて少なくとも独立ではない２変数間の経路上に、前記２変数間の独立性の条件となる条件変数がある場合、前記２変数間の条件付き独立性検定を実行する実行ステップと、
前記２変数の経路上で、独立である第１および第２の変数がそれぞれ、第３の変数に対して独立でないグラフ構造であるＶ字構造の有無を判定する判定ステップと
を含み、
前記実行ステップは、前記Ｖ字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記２変数間の条件付き独立性検定を実行しない
情報処理方法。
多変数間の独立性を検定する処理をコンピュータに実行させるプログラムにおいて、
グラフィカルモデルにおいて少なくとも独立ではない２変数間の経路上に、前記２変数間の独立性の条件となる条件変数がある場合、前記２変数間の条件付き独立性検定を実行する実行ステップと、
前記２変数の経路上で、独立である第１および第２の変数がそれぞれ、第３の変数に対して独立でないグラフ構造であるＶ字構造の有無を判定する判定ステップと
を含む処理をコンピュータに実行させ、
前記実行ステップは、前記Ｖ字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記２変数間の条件付き独立性検定を実行しない
プログラム。