JP2013206016A - 情報処理装置および方法、並びにプログラム - Google Patents

情報処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JP2013206016A
JP2013206016A JP2012072789A JP2012072789A JP2013206016A JP 2013206016 A JP2013206016 A JP 2013206016A JP 2012072789 A JP2012072789 A JP 2012072789A JP 2012072789 A JP2012072789 A JP 2012072789A JP 2013206016 A JP2013206016 A JP 2013206016A
Authority
JP
Japan
Prior art keywords
variable
variables
shaped structure
independent
conditional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012072789A
Other languages
English (en)
Other versions
JP5854274B2 (ja
JP2013206016A5 (ja
Inventor
Takashi Isozaki
隆司 磯崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2012072789A priority Critical patent/JP5854274B2/ja
Priority to US13/845,626 priority patent/US9311729B2/en
Priority to CN2013100925027A priority patent/CN103365829A/zh
Publication of JP2013206016A publication Critical patent/JP2013206016A/ja
Publication of JP2013206016A5 publication Critical patent/JP2013206016A5/ja
Application granted granted Critical
Publication of JP5854274B2 publication Critical patent/JP5854274B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】多変数間の因果関係の推定結果の信頼性をより高める。
【解決手段】検定実行部は、グラフィカルモデルにおいて少なくとも独立ではない2変数間の経路上に、2変数間の独立性の条件となる条件変数がある場合、2変数間の条件付き独立性検定を実行し、実行判定部は、2変数の経路上で、独立である第1および第2の変数がそれぞれ、第3の変数に対して独立でないグラフ構造であるV字構造の有無を判定する。検定実行部は、V字構造を有すると判定された経路上にのみ、条件変数がある場合には、2変数間の条件付き独立性検定を実行しない。本技術は、変数間の因果関係を推定する情報処理装置に適用することができる。
【選択図】図3

Description

本技術は、情報処理装置および方法、並びにプログラムに関し、特に、多変数間の因果関係の推定結果の信頼性をより高めることができるようにする情報処理装置および方法、並びにプログラムに関する。
従来、多変量確率変数における観察データからの統計的因果関係の推定は、情報量規準や罰則付き最尤法またはベイズ法による推定結果をスコアとしてこれを最大化する方法と、変数間の条件付き独立性の統計的検定によって推定する方法とに大別される。その結果としての変数間の因果関係を、グラフィカルモデル(非循環モデル)として表現することは、その結果の可読性の良さからしばしば行われている。
図1は、変数Xと変数Yとの因果関係を表す3つのグラフィカルモデルの例を示している。
図1上段に示されるグラフィカルモデルは、変数Xと変数Yとの因果関係が不明な場合のモデルであり、変数Xと変数Yとを頂点として、それぞれが、方向のない辺(無向辺)で結ばれている。また、図1中段に示されるグラフィカルモデルは、変数Xと変数Yとの因果関係として、変数Xが原因、変数Yが結果である場合のモデルであり、変数Xと変数Yとを頂点として、それぞれが、原因から結果への方向を示す辺(有向辺)で結ばれている。そして、図1下段に示されるグラフィカルモデルは、変数Xと変数Yとを頂点として、それぞれが、3つの変数とそれぞれを結ぶ辺で結ばれている。図1下段に示されるグラフィカルモデルにおいて、3つの変数とそれぞれを結ぶ辺は、変数Xと変数Yとの間の経路であり、その一部に、方向のある有向辺を含むようにできる。
さて、変数間の条件付き独立性の統計的検定によって変数間の因果関係を推定する方法は、潜在的な共通原因変数の存在を推測できる可能性があることと、有向辺の方向付けの理由に物理学的な背景を有することから、重要な方法とされている。しかしながら、一方では、統計的検定の検出力不足のため、推定結果の信頼性が低いことが長年にわたり解決されていない。
この方法における初期の試みでは、n変数確率変数における2変数間の条件付き独立性検定を行うには、その条件となる条件変数の組として、(n-2)個の変数から、最小で0個、最大で(n-2)個の変数の組み合わせを全て取り出して、総当たりで検定を行うことが考えられた。しかしながら、この場合、変数の組み合わせ数が指数関数的に増大するため、計算機による計算は現実的ではなかった。
その後、非循環有向グラフにより、変数間の条件付き独立性が一意に表現されると仮定すると、ある2変数を条件付き独立にする条件変数の組は一意に定まることと、条件変数は着目する変数と条件付き独立ではないという条件の下で、条件変数の組の数を昇順に増加させて検定を行い、独立性が棄却されない場合には直ちに2変数間の辺をはずすことで、検定に要する計算量を大幅に削減するアルゴリズムが開示されている(非特許文献1参照)。しかしながら、このアルゴリズムにおいても、検定の試行回数が依然として多いために、検定エラーが頻発してしまう。
これに対して、非特許文献1には、上述のアルゴリズムを改良し、条件変数は着目する2変数間の経路上にあるという条件により、さらに計算量を削減することも開示されている。しかしながら、アルゴリズムの実行途中では、のちに独立と判定されるはずの辺が残っているために長い経路を辿ることが許され、検定の試行回数が実効的には大きく削減されなかった。
また、グラフ全体を小さなサブグラフに再帰的に分割することで、大きい組の数の条件変数による独立性検定の試行回数を削減するようにしたアルゴリズムがある(非特許文献2参照)。しかしながら、このアルゴリズムでは、小さい組の数の条件変数による独立性検定において、本来独立でないはずが独立であると検定される検定エラーの発生を抑えることはできなかった。
さらに、非特許文献3には、非特許文献2とは異なる方法で再帰的な処理を行うことが開示されているが、この方法は、独立性検定に大きい数の条件変数を必要とするため、計算の安定性に欠けていた。
P. Spirtes, C. Glymour, R. Scheines, "Causation, Prediction, and Search", MIT Press, second edition, 2000. R. Yehezkel, B. Lerner, "Bayesian Network Structure Learning by Recursive Autonomy Identification", Journal of Machine Learning Research, Vol. 10, pp. 1527-1570, 2009. X. Xie, Z. Geng, "A Recursive Method for Structural Learning of Directed Acyclic Graphs", Journal of Machine Learning Research, Vol. 9, pp. 459-483, 2008.
このように、条件付き独立性検定による多変数間の因果関係の推定は信頼性が低いことに対して、十分な改善を図る方法はなかった。
本技術は、このような状況に鑑みてなされたものであり、多変数間の因果関係の推定結果の信頼性をより高めることができるようにするものである。
本技術の一側面の情報処理装置は、多変数間の独立性を検定する情報処理装置であって、グラフィカルモデルにおいて少なくとも独立ではない2変数間の経路上に、前記2変数間の独立性の条件となる条件変数がある場合、前記2変数間の条件付き独立性検定を実行する実行部と、前記2変数の経路上で、独立である第1および第2の変数がそれぞれ、第3の変数に対して独立でないグラフ構造であるV字構造の有無を判定する判定部とを備え、前記実行部は、前記V字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記2変数間の条件付き独立性検定を実行しない。
前記実行部には、前記条件変数が、前記V字構造における前記第3の変数である場合には、前記2変数間の条件付き独立性検定を実行させないようにすることができる。
前記実行部には、条件付き独立性検定を実行するより前に、前記第1および第2の変数間の条件のない独立性検定を実行させ、前記第1および第2の変数が条件のない独立であり、かつ、前記第1および第2の変数がそれぞれ前記第3の変数に対して独立でないグラフ構造を前記V字構造として探索するV字構造探索部をさらに設けることができる。
前記V字構造探索部には、前記第1および第2の変数が、前記第3の変数以外の変数を条件として条件付き独立であり、かつ、前記第1および第2の変数がそれぞれ前記第3の変数に対して独立でないグラフ構造を前記V字構造として探索させることができる。
前記V字構造探索部には、インクリメントされる前記条件変数の組の数が所定の数を超えた場合、前記V字構造を探索させないようにすることができる。
前記判定部には、インクリメントされる前記条件変数の組の数に応じた数の前記2変数間の経路について、前記V字構造の有無を判定させ、前記実行部には、前記V字構造を有すると判定された経路のうちのいずれかに、前記条件変数のいずれかがある場合には、前記2変数間の条件付き独立性検定を実行させないようにすることができる。
複数の前記V字構造において、矛盾する有向辺を検出し、前記有向辺の一部または全部を無向辺にすることで、前記矛盾を解消する矛盾検出部をさらに設けることができる。
前記矛盾検出部には、複数の前記V字構造における前記第1および第2の変数間の独立性検定に用いられる指標を用いて、より独立性の弱い前記第1および第2の変数を有する前記V字構造の有向辺を無向辺にさせることができる。
変数Xおよび変数Yがそれぞれ、変数Zに対して独立でない第1のV字構造、および、変数Wおよび変数Yがそれぞれ、変数Zに対して独立でない第2のV字構造において、変数Xと変数Wとが独立でない場合、前記矛盾検出部には、前記第1のV字構造における変数Xから変数Zへの有向辺、および、前記第2のV字構造における変数Wから変数Zへの有向辺を無向辺にさせることができる。
変数Xおよび変数Yがそれぞれ、変数Zに対して独立でない第1のV字構造、および、変数Wおよび変数Yがそれぞれ、変数Zに対して独立でない第2のV字構造において、変数Xと変数Wとが独立でない場合、前記矛盾検出部には、前記第1および第2のV字構造における有向辺の全部を無向辺にさせることができる。
変数Xおよび変数Yがそれぞれ、変数Zに対して独立でない第1のV字構造、および、変数Wおよび変数Yがそれぞれ、変数Zに対して独立でない第2のV字構造において、変数Xと変数Wとが独立でない場合、前記矛盾検出部には、2変数間の独立性検定に用いられる指標を用いて、変数Xおよび変数Y間の独立性と、変数Wおよび変数Y間の独立性とで、より独立性の弱い2変数を有する前記V字構造の有向辺を無向辺にさせることができる。
本技術の一側面の情報処理方法は、多変数間の独立性を検定する情報処理装置の情報処理方法であって、グラフィカルモデルにおいて少なくとも独立ではない2変数間の経路上に、前記2変数間の独立性の条件となる条件変数がある場合、前記2変数間の条件付き独立性検定を実行する実行ステップと、前記2変数の経路上で、独立である第1および第2の変数がそれぞれ、第3の変数に対して独立でないグラフ構造であるV字構造の有無を判定する判定ステップとを含み、前記実行ステップは、前記V字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記2変数間の条件付き独立性検定を実行しない。
本技術の一側面のプログラムは、多変数間の独立性を検定する処理をコンピュータに実行させるプログラムであって、グラフィカルモデルにおいて少なくとも独立ではない2変数間の経路上に、前記2変数間の独立性の条件となる条件変数がある場合、前記2変数間の条件付き独立性検定を実行する実行ステップと、前記2変数の経路上で、独立である第1および第2の変数がそれぞれ、第3の変数に対して独立でないグラフ構造であるV字構造の有無を判定する判定ステップとを含む処理をコンピュータに実行させ、前記実行ステップは、前記V字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記2変数間の条件付き独立性検定を実行しない。
本技術の一側面においては、グラフィカルモデルにおいて少なくとも独立ではない2変数間の経路上に、2変数間の独立性の条件となる条件変数がある場合、2変数間の条件付き独立性検定が実行され、2変数の経路上で、独立である第1および第2の変数がそれぞれ、第3の変数に対して独立でないグラフ構造であるV字構造の有無が判定され、V字構造を有すると判定された経路上にのみ、条件変数がある場合には、2変数間の条件付き独立性検定が実行されない。
本技術の一側面によれば、多変数間の因果関係の推定結果の信頼性をより高めることが可能となる。
グラフィカルモデルの例を示す図である。 本技術を適用した情報処理装置のハードウェア構成例を示すブロック図である。 本技術を適用した情報処理装置の機能構成例を示すブロック図である。 V字構造について説明する図である。 独立性検定処理について説明するフローチャートである。 独立性検定処理について説明するフローチャートである。 V字構造の探索について説明する図である。 2変数間の経路について説明する図である。 2変数間の経路について説明する図である。 矛盾解消処理について説明するフローチャートである。 矛盾解消処理の具体例について説明する図である。 矛盾解消処理の具体例について説明する図である。 矛盾解消処理の具体例について説明する図である。 矛盾解消処理の具体例について説明する図である。
以下、本技術の実施の形態について図を参照して説明する。
[情報処理装置のハードウェア構成例]
図2は、本技術を適用した情報処理装置11のハードウェア構成例を示している。
情報処理装置11は、離散多変数確率変数間の独立性または条件付き独立性を検定し、その結果をグラフィカルモデルの1つであるベイジアンネットワークとして出力する。
情報処理装置11は、例えば、パーソナルコンピュータで構成することができ、その構成は、パーソナルコンピュータと同様な構成とすることができる。
情報処理装置11は、CPU(Central Processing Unit)21、ROM(Read Only Memory)22、RAM(Random Access Memory)23、バス24、入出力インタフェース25、入力部26、出力部27、記憶部28、通信部29、およびドライブ30を含む構成とされている。
情報処理装置11において、CPU21、ROM22、およびRAM23は、バス24により相互に接続されている。バス24には、さらに、入出力インタフェース25が接続されている。入出力インタフェース25には、キーボード、マウス、タッチパネルなどよりなる入力部26、ディスプレイ、スピーカなどよりなる出力部27、ハードディスクや不揮発性のメモリなどよりなる記憶部28、ネットワークインタフェースなどよりなる通信部29が接続されている。
入出力インタフェース25にはまた、必要に応じてドライブ30が接続され、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどよりなるリムーバブルメディア31が適宜装着され、それらから読み出されたプログラムが、必要に応じて記憶部28にインストールされる。
また、プログラムは、有線または無線の伝送媒体を介して、通信部29で受信し、記憶部28にインストールすることができる。その他、プログラムは、ROM22や記憶部28に、あらかじめインストールしておくことができる。
なお、情報処理装置11が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われる処理であっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
[情報処理装置の機能構成例]
図3は、情報処理装置11の本技術に係る部分の機能構成例を示している。
図3の情報処理装置11は、入力部51、制御部52、記憶部53、および出力部54から構成される。
入力部51は、図2の入力部26に対応し、N個の離散確率変数のうちの、独立性検定の対象となる2変数を指定するための引数や、条件付き独立性の条件となる条件変数の変数セット等の入力を受け付け、その内容に対応する情報を制御部52に供給する。
制御部52は、図2のCPU21に対応し、記憶部53に格納されているプログラムに従って動作し、図2の記憶部28に対応する記憶部53に記憶されている各種の情報を用いて、着目している2変数間の独立性検定を実行する。
出力部54は、図2の出力部27に対応し、制御部52の制御の下、独立性検定の検定結果を、グラフィカルモデルとして出力する。
また、図3において、制御部52は、経路探索部71、実行判定部72、検定実行部73、V字構造探索部74、および矛盾検出部75を備え、記憶部53は、変数対記憶部81、V字構造記憶部82、分離変数組記憶部83を備えている。
経路探索部71は、着目している2変数間の経路を、例えば、深さ優先探索等の一般的なアルゴリズムを用いて探索する。
実行判定部72は、着目している2変数について、独立性検定を実行する必要があるか否かを判定する。
検定実行部73は、着目している2変数について、独立性検定を実行する。ただし、実行判定部72により独立性検定を実行する必要がないと判定された場合、検定実行部73は、独立性検定を実行しない。
V字構造探索部74は、独立であると検定された2変数について、V字構造を探索する。V字構造は、図4に示されるように、例えば、ある変数Xと変数Yとが独立であり、かつ変数Xと変数Z、変数Yと変数Zがそれぞれ独立でないグラフ構造である。
矛盾検出部75は、V字構造探索部74により探索されたV字構造から、互いに矛盾する関係を有するV字構造を検出し、その矛盾を解消する。
変数対記憶部81には、独立でないか、または独立性の検定が行われていない2変数が辺で結ばれた変数対が記憶されている。
V字構造記憶部82には、V字構造探索部74によって探索されたV字構造が記憶される。なお、実行判定部72は、着目している2変数について、その2変数間の経路上に、V字構造記憶部82に記憶されているV字構造と一致するグラフ構造があるか否かによって、独立性検定を実行する必要があるか否かを判定する。
分離変数組記憶部83には、検定実行部73によって実行される独立性検定により、条件付き独立であると検定された2変数間の経路上にある条件変数が、その2変数を分離する分離変数組として記憶される。
[情報処理装置による独立性検定処理]
次に、図5および図6のフローチャートを参照して、情報処理装置11による独立性検定処理について説明する。記憶部53には、確率変数(以下、単に変数ともいう)の数Nと、それぞれの変数のとりうる2値以上の内部状態数が予め記憶されており、この変数全てについての状態が記述されたM個のデータが、入力部51により入力されると、独立性検定処理が開始される。
なお、初期状態として、変数対記憶部81には、N個の変数がそれぞれ異なる(N-1)個の変数と対になった(辺で結ばれた)変数対が記憶されており、V字構造記憶部82および分離変数組記憶部83には何も記憶されていない。
ステップS11において、制御部52は、条件変数(以下、条件付き変数ともいう)の組の数iを0、すなわち、条件付き変数の組を空集合とする。
ステップS12において、制御部52は、変数対記憶部81に記憶されている変数対から、1つの変数対を選択する。
ステップS13において、検定実行部73は、独立性検定を実行するのに用いられる値であるG統計量を計算する。G統計量は、以下の式(1)で示される。
Figure 2013206016
・・・(1)
式(1)において、Mはデータ数を示している。また、^(ハット)の付されたP(x,y,z)(以下、ハットP(x,y,z)などという)、ハットP(x|y,z)、ハットP(x|z)はそれぞれ、変数X,Yおよび変数の組Zについてのある状態x,y,zの推定される結合確率、状態y,zを条件とした場合の状態xの推定される条件付き確率、状態zを条件とした場合の状態xの推定される条件付き確率を表す。これらは、M個のデータを用いて推定される。なお、ステップS13においては、変数の組Zは空集合であるので、状態zは考慮されない。
ここでは、上述したG統計量とχ分布とを用いて導き出される、独立性検定の指標となるp値と、所定の閾値Th(例えば5%(0.05))とが比較されることで、選択された変数対の2変数の独立性が検定される。
すなわち、ステップS14において、検定実行部73は、p値が閾値Thより大きいか否かを判定する。
ステップS14において、p値が閾値Thより大きいと判定された場合、処理はステップS15に進み、検定実行部73は、選択された変数対の2変数の独立性を採択する。
そして、ステップS16において、検定実行部73は、選択された変数対を、変数対記憶部81から削除する。
一方、ステップS14において、p値が閾値Thより大きくないと判定された場合、処理はステップS17に進み、検定実行部73は、選択された変数対の2変数の独立性を棄却する。
なお、上述した説明では、独立性検定の指標としてp値を用いるものとしたが、以下の式(2)で示される条件付き相互情報量MIを、独立性検定の指標として用いるようにしてもよい。
Figure 2013206016
・・・(2)
この場合、条件付き相互情報量MIと所定の閾値(例えば0.05)が比較され、条件付き相互情報量MIが閾値より小さいと判定された場合に、2変数の独立性が採択されるようになる。
さて、ステップS16またはステップS17の後、ステップS18において、制御部52は、変数対記憶部81に記憶されている全ての変数対について、ステップS12乃至ステップS17の処理、すなわち条件のない独立性検定を実行したか否かを判定する。
ステップS18において、全ての変数対について処理されていないと判定された場合、処理はステップS12に戻り、新たに選択される変数対について、ステップS12乃至ステップS17の処理が繰り返される。
一方、ステップS18において、全ての変数対について処理されたと判定された場合、処理はステップS19に進む。このとき、変数対記憶部81は、独立性が棄却された(独立でない)2変数の変数対のみが記憶された状態となる。
ステップS19において、制御部52は、上述した処理において、独立な2変数があったか否かを判定する。
ステップS19において、独立な2変数が1組でもあったと判定された場合、処理はステップS20に進み、V字構造探索部74は、その独立な2変数について、V字構造を探索する。具体的には、V字構造探索部74は、図4で示されたように、ある1組の変数X,Yが独立であり、それぞれが変数Zに対して独立ではない場合、つまり、変数X,Yが、2つの辺と変数Zからなる経路(X−Z−Y)を有し、かつ変数Zが変数X,Yの独立性に条件変数として寄与していない場合、このグラフ構造をV字構造(以下、X→Z←Y等と表す)として、V字構造記憶部82に記憶させる。
一方、ステップS19において、独立な2変数が1組もなかったと判定された場合、ステップS20はスキップされる。
その後、処理は図6のステップS21に進み、制御部52は、条件付き変数(条件変数)の組の数iを1インクリメントする。すなわち、条件付き変数の組の数が1となる。
ステップS22において、制御部52は、変数対記憶部81に記憶されている変数対、すなわち、独立でない2変数の変数対から、1つの変数対を選択する。ここでは、変数Sと変数Tの変数対が選択されたこととする。
ステップS23において、制御部52は、選択された変数対の2変数の独立性の条件となりうる条件付き変数を選択する。具体的には、制御部52は、変数対記憶部81に記憶されている変数対を参照することで、選択された変数対の2変数のうちのいずれか(例えば変数S)と対になっている変数を、条件付き変数として1つ選択する。ここでは、変数Wが選択されたこととする。
ステップS24において、経路探索部71は、選択された変数対の2変数間の経路を探索し、条件付き変数がその経路上にあるか否かを判定する。
ステップS24において、例えば、変数Wが、変数Sと変数Tとの間の経路上にあると判定された場合、処理はステップS25に進み、実行判定部72は、変数Sと変数Tとの間の経路上に、V字構造記憶部82に記憶されているV字構造と一致するグラフ構造があるか否かを判定する。
ステップS25において、一致するV字構造があると判定された場合、その経路では、変数Wは変数S,Tの独立性の条件変数になりえないので、ステップS26において、経路探索部71は、別の経路を探索する。
ステップS27において、別の経路があるか否かが判定され、別の経路が見つかった場合、処理はステップS24に戻り、ステップS24,S25の処理が再度行われる。なお、ステップS24において、変数Wが、変数Sと変数Tとの間の経路上にないと判定された場合、処理はステップS23に戻り、別の条件付き変数が選択される。
一方、ステップS25において、一致するV字構造がないと判定された場合、その経路で、変数Wは変数S,Tの独立性の条件変数になりうるとされ、処理はステップS28に進む。
なお、ステップS28乃至ステップS31およびステップS33の処理は、上述したステップS13乃至ステップS17の処理とそれぞれ同一であるので、その説明は省略するが、ここでは、例えば、変数Wを条件とした変数S,Tの条件付き独立性の検定が実行される。変数Wを条件とした変数S,Tの条件付き独立性が採択された場合には、変数S,Tの変数対が、変数対記憶部81から削除される。
そして、ステップS32において、検定実行部73は、条件付き変数(変数W)を、分離変数組として分離変数組記憶部83に記憶させる。
ところで、ステップS27において、別の経路があるか否かが判定され、別の経路が見つからなかった場合、すなわち、V字構造があると判定された経路上にのみ、条件変数がある場合、ステップS28乃至ステップS33の処理はスキップされる。つまり、この場合、例えば、変数Wを条件とした変数S,Tの条件付き独立性の検定は実行されず、変数S,Tは、変数対のまま(辺で結ばれたまま)となる。
ここで、仮に、変数S,Tが条件付き独立であるならば、条件のない独立性検定(ステップS13乃至ステップS17の処理)において、すでに独立であると判定されているはずである。これは、非特許文献1で開示されているd-separationとfaithfulnessという理論に基づいている。また、この場合、変数Wは変数S,Tの独立性の条件変数になりえない。したがって、変数S,Tは条件付き独立でないことは明らかであるので、変数S,Tの条件付き独立性の検定は実行されない。
さて、ステップS32、ステップS33、またはステップS27の後、ステップS34において、制御部52は、変数対記憶部81に記憶されている全ての変数対について、ステップS22乃至ステップS33の処理、すなわち条件付き独立性検定を実行したか否かを判定する。
ステップS34において、全ての変数対について処理されていないと判定された場合、処理はステップS22に戻り、新たに選択される変数対について、ステップS22乃至ステップS33の処理が繰り返される。
一方、ステップS34において、全ての変数対について処理されたと判定された場合、処理はステップS35に進む。このとき、変数対記憶部81は、独立性が棄却された(独立でない)か、または、条件付き独立性検定が実行されなかった2変数の変数対のみが記憶された状態となる。
ステップS35において、制御部52は、上述した処理において、独立(条件付き独立)な2変数があったか否かを判定する。
ステップS35において、独立(条件付き独立)な2変数が1組でもあったと判定された場合、処理はステップS36に進み、V字構造探索部74は、その独立な2変数について、V字構造を探索する。具体的には、V字構造探索部74は、例えば図7で示されるように、ある1組の変数X,Yが変数Wを条件として条件付き独立であり、それぞれが変数Zに対して独立ではない場合、かつ、変数Zが変数X,Yの条件変数(分離変数組)として分離変数組記憶部83に記憶されていない場合、このグラフ構造をV字構造として、V字構造記憶部82に記憶させる。
ただし、独立性検定に誤りが生じれば、ここでのV字構造も誤った構造となり、また、後述するように、条件付き変数の組の数が大きくなるほど、検定の誤りも生じやすくなるため、ここで得られたV字構造が検定の対象となる2変数間の経路上にあったとしても検定を実行させるようにしてもよい。
一方、ステップS35において、独立(条件付き独立)な2変数が1組もなかったと判定された場合、ステップS36はスキップされる。
ステップS37において、制御部52は、条件付き変数(条件変数)の組の数iが、最大の数(変数セットに含まれる全ての組の数)imax(i=imax)であるか否かを判定する。
ステップS37において、i=imaxでないと判定された場合、処理はステップS21に戻り、条件付き変数(条件変数)の組の数iが1インクリメントされて、これ以降の処理が行われる。
例えば、i=2となった場合、2個の条件付き変数それぞれについて、i=1の場合と同様の処理が行われ、2個の条件付き変数がともに1個の場合と同じ条件を満たす場合にのみ、条件付き独立性検定が実行される。すなわち、V字構造がある経路のいずれかに、条件付き変数のいずれかがある場合には、条件付き独立性検定は実行されない。これにより、不要な条件付き独立性検定の実行が回避され、エラーの生じる回数を削減することができる。
そして、ステップS37において、i=imaxであると判定された場合、処理は終了する。このようにして、実行可能な全ての検定が終了すると、変数対記憶部81には、検定により独立ではないと判定され続けたか、または、検定されずに独立ではないとされた2変数の変数対が残る。また、V字構造記憶部82には、V字構造となる変数の組が記憶されるようになり、分離変数組記憶部83には、独立である2変数についての条件変数の組が記憶されるようになる。
なお、記憶部53に記憶されている内容は、制御部52の制御の下、出力部54に出力される。具体的には、有向辺と無向辺とが混在した部分有向非循環グラフ(ベイジアンネットワーク)が出力され、変数間の依存関係や因果関係の推定が行われるようになる。
以上の処理によれば、2変数間の経路のうち、V字構造を有する経路にのみ、条件変数がある場合には、2変数間の条件付き独立性検定は実行されなくなる。
例えば、変数Xと変数Yとの間の経路として、図8に示される経路1のみが探索され、その経路1にはV字構造があり、かつ、経路1上に条件変数Zがある場合には、変数Xと変数Yとの間の条件付き独立性検定は実行されない。ただし、変数Xと変数Yとの間の経路として、V字構造がなく条件付き変数Zがある経路2が探索された場合には、条件付き独立性検定は実行される。
また、変数Xと変数Yとの間の経路として、図9に示される経路のみが探索され、その経路にはV字構造があり、かつ、そのV字構造における独立な2変数それぞれに対して独立でない変数が条件変数Zである場合にも、変数Xと変数Yとの間の条件付き独立性検定は実行されない。
このように、以上の処理によれば、条件付き独立性検定の実行回数を削減することができるので、検定エラーの発生の頻度を低くすることができ、ひいては、変数間の因果関係の推定結果の信頼性をより高めることが可能となる。
なお、以上においては、離散値としての変数について独立性検定を実行する処理について説明してきたが、変数が連続値である場合には、条件付き独立性の指標としての偏相関係数と、フィッシャーのZ変換とを用いることで、独立性検定を実行することができる。また、統計的なパターン認識に用いられる手法であるカーネル法を用いることで、独立性検定を実行するようにしてもよい。
また、上述した独立性検定処理において、条件変数の組の数が大きくなれば、条件付き独立性検定の信頼性の低下は避けられず、したがって、V字構造の探索の精度も悪化し、結果として、変数間の因果関係の推定結果の信頼性を低下させる恐れがある。
そこで、インクリメントされる条件付き変数(条件変数)の組の数iが、所定の数の超えた場合には、ステップS35において条件付き独立な2変数があったと判定されたとしても、ステップS36の処理(V字構造の探索)をスキップするようにしてもよい。
これにより、条件付き独立性検定の信頼性の低下による、精度の悪いV字構造の探索は行われなくなり、変数間の因果関係の推定結果の信頼性の低下を避けることができる。なお、スキップされたV字構造の探索は、全ての条件付き独立性検定が終わった後に実行されるものとする。
ところで、上述した独立性検定処理により、V字構造記憶部82には、探索されたV字構造が記憶されるようになるが、独立性検定処理は、それぞれの2変数間について独立して実行されるため、検定のエラーが生じた場合、互いに矛盾した関係を有するV字構造が記憶される恐れがある。
[矛盾解消処理について]
そこで、図10のフローチャートを参照して、V字構造の矛盾を解消する矛盾解消処理について説明する。
ステップS51において、矛盾検出部75は、V字構造記憶部82に記憶されているV字構造の中から、矛盾のあるV字構造を検出する。
ステップS52において、矛盾検出部75は、所定の基準にしたがって、検出したV字構造の矛盾を解消する。
[矛盾解消処理の具体例1]
図11は、互いに矛盾した関係を有するV字構造に対する矛盾解消処理の具体例について説明する図である。
図11上側には、独立である変数Xおよび変数Yがそれぞれ、変数Zに対して独立でないV字構造(X→Z←Y)と、独立である変数Wおよび変数Zがそれぞれ、変数Xに対して独立でないV字構造(W→X←Z)とが示されている。
この場合、一方ではX→Zとなる関係があり、他方ではX←Zとなる関係があるという矛盾が生じている。
これに対して、矛盾検出部75は、それぞれのV字構造において独立である2変数についての独立性検定に用いられた条件付き独立性の指標、具体的には、p値や条件付き相互情報量MIを用いて、条件付き独立性の弱い2変数を有するV字構造の有向辺を無向辺にする。
具体的には、変数Xおよび変数Y、変数Wおよび変数Zのそれぞれについてのp値が比較されることで、いずれの2変数間の条件付き独立性が弱いかが判定される。例えば、変数Xおよび変数Yについてのp値が0.50であり、変数Wおよび変数Zについてのp値が0.20であった場合には、変数Xおよび変数Yを有するX→Z←YのV字構造が採用され、図11下側に示されるように、変数Zを原因とし、変数Xを結果とした因果関係(以下、Z→Xの関係などと表す)を表す有向辺が無向化される。また、V字構造記憶部82からはW→X←ZのV字構造が削除される。
[矛盾解消処理の具体例2]
図12は、互いに矛盾した関係を有するV字構造に対する矛盾解消処理の他の具体例について説明する図である。
図12上側には、独立である変数Xおよび変数Yがそれぞれ、変数Zに対して独立でないV字構造(X→Z←Y)と、独立である変数Wおよび変数Yがそれぞれ、変数Zに対して独立でないV字構造(W→Z←Y)とが示されている。また、図12において、変数Xと変数Wとは独立でない。
この場合、変数Xと変数Wとは、本来は、変数Z以外の変数を条件変数として条件付き独立である必要があるという矛盾が生じている。
これに対して、矛盾検出部75は、図12下側に示されるように、X→Z←YのV字構造におけるX→Z、および、W→Z←YのV字構造におけるW→Zの関係を表す有向辺を無向辺にするとともに、それぞれのV字構造を、V字構造記憶部82から削除する。
[矛盾解消処理の具体例3]
図13は、互いに矛盾した関係を有するV字構造に対する矛盾解消処理のさらに他の具体例について説明する図である。
図13上側には、図12と同様、独立である変数Xおよび変数Yがそれぞれ、変数Zに対して独立でないV字構造(X→Z←Y)と、独立である変数Wおよび変数Yがそれぞれ、変数Zに対して独立でないV字構造(W→Z←Y)とが示されている。また、図13においても、変数Xと変数Wとは独立でない。
この場合も、変数Xと変数Wとは、本来は、変数Z以外の変数を条件変数として条件付き独立である必要があるという矛盾が生じている。
これに対して、矛盾検出部75は、図13下側に示されるように、X→Z←YのV字構造、および、W→Z←YのV字構造における全ての有向辺を無向辺にするとともに、それぞれのV字構造を、V字構造記憶部82から削除する。
[矛盾解消処理の具体例4]
図14は、互いに矛盾した関係を有するV字構造に対する矛盾解消処理のさらに他の具体例について説明する図である。
図14上側には、図12と同様、独立である変数Xおよび変数Yがそれぞれ、変数Zに対して独立でないV字構造(X→Z←Y)と、独立である変数Wおよび変数Yがそれぞれ、変数Zに対して独立でないV字構造(W→Z←Y)とが示されている。また、図14においても、変数Xと変数Wとは独立でない。
この場合も、変数Xと変数Wとは、本来は、変数Z以外の変数を条件変数として条件付き独立である必要があるという矛盾が生じている。
これに対して、矛盾検出部75は、それぞれのV字構造において独立である2変数についての独立性検定に用いられた条件付き独立性の指標、具体的には、p値や条件付き相互情報量MIを用いて、条件付き独立性の弱い2変数を有するV字構造において、他方のV字構造に共有されない有向辺を無向辺にする。
具体的には、変数Xおよび変数Y、変数Wおよび変数Yのそれぞれについてのp値が比較され、いずれの2変数間の条件付き独立性が弱いかが判定される。例えば、変数Xおよび変数Yについてのp値が0.50であり、変数Wおよび変数Zについてのp値が0.30であった場合には、変数Xおよび変数Yを有するX→Z←YのV字構造が採用され、図14下側に示されるように、W→Z←YのV字構造において、X→Z←YのV字構造に共有されないW→Zの関係を表す有向辺が無向化される。また、V字構造記憶部82からはW→Z←YのV字構造が削除される。
以上の処理によれば、V字構造において、矛盾するV字構造が検出され、その矛盾が解消される。したがって、矛盾解消処理を、独立性検定処理と並行して実行することで、誤ったV字構造を用いた条件付き独立性検定によるエラーの発生する可能性を低減することができ、ひいては、変数間の因果関係の推定結果の信頼性をより高めることが可能となる。
[本技術の適用例]
なお、本技術は、以下に挙げるような例に適用することが可能である。
(1)統計的因果関係推定装置
多変量確率変数における観察データからの統計的因果関係を推定する因果関係推定処理に、本技術の独立性検定処理を適用する。なお、離散値または連続値である多変数確率変数はユーザによって定義され、データセットも予め用意されているものとする。これにより、有向辺と無向辺の混在したグラフィカルモデルが、出力部54としてのモニタ等に画像として出力されるようになる。このとき、条件付き独立性を考慮して有向辺の向きを定めるオリエンテーション・ルールにしたがって、グラフィカルモデルにおける無向辺を、できる限り有向辺に置き換えるようにしてもよい。また、グラフィカルモデルが、同等の関係を表すテキストデータとして、モニタ等に出力されるようにしてもよい。
(2)医療診断支援装置
病気と症状との間の因果関係を推定する因果関係推定処理に、本技術の独立性検定処理を適用する。なお、確率変数として、{結核T,肺がんL、気管支炎B、胸部X線検査結果X、呼吸困難D,および喫煙状況S}が定義され、それぞれの内部状態数がデータとして用意されているものとする。これにより、V字構造や無向辺を有する変数対が判明し、有向辺と無向辺の混在したグラフィカルモデルが、出力部54としてのモニタ等に画像として出力されるようになる。また、条件付き独立性を考慮して有向辺の向きを定めるオリエンテーション・ルールにしたがって、グラフィカルモデルにおける無向辺を、できる限り有向辺に置き換えるようにしてもよい。この例では、変数間の因果関係として、例えば、{S−L},{S−B},{L→D},{B→D},{L→X},{T→X}等が出力される。
(3)生産管理装置
工場における様々な測定項目と歩留りとの間の因果関係を推定する因果関係推定処理に、本技術の独立性検定処理を適用する。なお、確率変数として、{良品か否かY,工場内温度T、工場内湿度M、測定項目1A、測定項目2B,および測定項目3C}が定義されているものとする。ここで、変数Yは、良品であるか、良品でないかの2値を有する離散値であるが、他の変数は全て連続値であるものとする。そこで、離散値である変数Yを基準の変数として、他の変数(連続値)を全て離散化する既知の手法を用いることで、全ての変数を離散化する。これにより、有向辺と無向辺の混在したグラフィカルモデルが、出力部54としてのモニタ等に画像として出力されるようになる。
(4)文書分類装置
入力された文書をユーザにより予め定義されたカテゴリに分類する文書分類装置における文書分類の学習処理に、本技術の独立性検定処理を適用する。この文書分類装置は、予め分類された、または分類タグが付された文書が入力されると、その文書を、形態素解析等により品詞に分解する。これで、カテゴリを表す変数Cと、品詞の出現頻度を表す変数Sが用意されたことになる。ここで、変数Cは離散値であるが、変数Sは連続値であるので、変数Cを基準として変数Sを離散化(カテゴライズ)する。そして、離散値である変数Sについて、本技術の独立性検定処理を実行することで、有向辺と無向辺の混在したグラフィカルモデルが得られる。このとき、情報量規準を用いて、無向辺を有向辺に置き換えるようにしてもよい。さらに、全ての変数Sとカテゴリを表す変数Cとを有向辺で結ぶことで、条件付き確率分布の積がベイジアンネットワークとして表現されるようになる。これにより、同じデータを用いて条件付き確率分布を推定することで、文書分類の学習処理が行われる。このようにして、品詞間の依存関係を推定(学習)することで、未知の文書の分類に対して、精度の高い分類器が生成されるようになる。
この文書分類装置に、分類されていない新しい文書が入力されると品詞に分解され、分解された品詞の頻度情報が、分類器における変数Sの頻度情報カテゴリにマッピングされることで、入力された文書に、品詞それぞれの出現確率を表す変数Sが証拠として与えられる。そして、証拠の与えられていないカテゴリの確率値が、変数Sを周辺化することで計算され、最大となる確率値が計算されたカテゴリに、入力された文書が分類されるようになる。
(5)画像識別装置
入力された画像をユーザにより予め定義されたカテゴリに分類する画像識別装置における画像分類の学習処理に、本技術の独立性検定処理を適用する。この画像識別装置は、予め分類された、または分類タグが付された画像(学習用画像)が複数入力されると、これらの画像をクラスタ化する。さらに、画像識別装置は、クラスタ化された画像それぞれのRGB値の平均値を用いて、これらの画像を教師なしでさらにクラスタ化する。これで、カテゴリを表す変数Cと、RGB値の平均値を表す変数Vが用意されたことになる。ここで、変数Cは離散値であるが、変数Vは連続値であるので、変数Cを基準として変数Vを離散化(カテゴライズ)する。そして、離散値である変数Vについて、本技術の独立性検定処理を実行することで、有向辺と無向辺の混在したグラフィカルモデルが得られる。このとき、情報量規準を用いて、無向辺を有向辺に置き換えるようにしてもよい。さらに、全ての変数Vとカテゴリを表す変数Cとを有向辺で結ぶことで、条件付き確率分布の積がベイジアンネットワークとして表現されるようになる。これにより、同じデータを用いて条件付き確率分布を推定することで、画像分類の学習処理が行われる。このようにして、RGB値間の依存関係を推定(学習)することで、未知の画像の分類に対して、精度の高い分類器が生成されるようになる。
この画像識別装置に、分類されていない新しい画像が入力されるとRGB値の平均値が算出され、その画像のRGB値の平均値が、分類器における変数VのRGB値カテゴリにマッピングされることで、入力された画像に、変数Vが証拠として与えられる。そして、証拠の与えられていないカテゴリの確率値が、変数Vを周辺化することで計算され、最大となる確率値が計算されたカテゴリに、入力された画像が分類されるようになる。
なお、本技術は、上述した例の他にも、ユーザの選択行為を支援する意思決定支援装置、遺伝子解析や心理学解析等の社会科学分析を行う分析装置、センサからの入力情報の解析を行う解析装置、ユーザの嗜好等に応じた推薦を行う推薦装置、その他のエージェントシステム等に適用することができる。
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
また、本技術は以下のような構成をとることができる。
(1)
多変数間の独立性を検定する情報処理装置において、
グラフィカルモデルにおいて少なくとも独立ではない2変数間の経路上に、前記2変数間の独立性の条件となる条件変数がある場合、前記2変数間の条件付き独立性検定を実行する実行部と、
前記2変数の経路上で、独立である第1および第2の変数がそれぞれ、第3の変数に対して独立でないグラフ構造であるV字構造の有無を判定する判定部と
を備え、
前記実行部は、前記V字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記2変数間の条件付き独立性検定を実行しない
情報処理装置。
(2)
前記実行部は、前記条件変数が、前記V字構造における前記第3の変数である場合には、前記2変数間の条件付き独立性検定を実行しない
(1)に記載の情報処理装置。
(3)
前記実行部は、条件付き独立性検定を実行するより前に、前記第1および第2の変数間の条件のない独立性検定を実行し、
前記第1および第2の変数が条件のない独立であり、かつ、前記第1および第2の変数がそれぞれ前記第3の変数に対して独立でないグラフ構造を前記V字構造として探索するV字構造探索部をさらに備える
(1)または(2)に記載の情報処理装置。
(4)
前記V字構造探索部は、前記第1および第2の変数が、前記第3の変数以外の変数を条件として条件付き独立であり、かつ、前記第1および第2の変数がそれぞれ前記第3の変数に対して独立でないグラフ構造を前記V字構造として探索する
(3)に記載の情報処理装置。
(5)
前記V字構造探索部は、インクリメントされる前記条件変数の組の数が所定の数を超えた場合、前記V字構造を探索しない
(4)に記載の情報処理装置。
(6)
前記判定部は、インクリメントされる前記条件変数の組の数に応じた数の前記2変数間の経路について、前記V字構造の有無を判定し、
前記実行部は、前記V字構造を有すると判定された経路のうちのいずれかに、前記条件変数のいずれかがある場合には、前記2変数間の条件付き独立性検定を実行しない
(1)乃至(5)のいずれかに記載の情報処理装置。
(7)
複数の前記V字構造において、矛盾する有向辺を検出し、前記有向辺の一部または全部を無向辺にすることで、前記矛盾を解消する矛盾検出部をさらに備える
(1)乃至(6)のいずれかに記載の情報処理装置。
(8)
前記矛盾検出部は、複数の前記V字構造における前記第1および第2の変数間の独立性検定に用いられる指標を用いて、より独立性の弱い前記第1および第2の変数を有する前記V字構造の有向辺を無向辺にする
(7)に記載の情報処理装置。
(9)
変数Xおよび変数Yがそれぞれ、変数Zに対して独立でない第1のV字構造、および、変数Wおよび変数Yがそれぞれ、変数Zに対して独立でない第2のV字構造において、変数Xと変数Wとが独立でない場合、前記矛盾検出部は、前記第1のV字構造における変数Xから変数Zへの有向辺、および、前記第2のV字構造における変数Wから変数Zへの有向辺を無向辺にする
(7)に記載の情報処理装置。
(10)
変数Xおよび変数Yがそれぞれ、変数Zに対して独立でない第1のV字構造、および、変数Wおよび変数Yがそれぞれ、変数Zに対して独立でない第2のV字構造において、変数Xと変数Wとが独立でない場合、前記矛盾検出部は、前記第1および第2のV字構造における有向辺の全部を無向辺にする
(7)に記載の情報処理装置。
(11)
変数Xおよび変数Yがそれぞれ、変数Zに対して独立でない第1のV字構造、および、変数Wおよび変数Yがそれぞれ、変数Zに対して独立でない第2のV字構造において、変数Xと変数Wとが独立でない場合、前記矛盾検出部は、2変数間の独立性検定に用いられる指標を用いて、変数Xおよび変数Y間の独立性と、変数Wおよび変数Y間の独立性とで、より独立性の弱い2変数を有する前記V字構造の有向辺を無向辺にする
(7)に記載の情報処理装置。
(12)
多変数間の独立性を検定する情報処理装置の情報処理方法において、
グラフィカルモデルにおいて少なくとも独立ではない2変数間の経路上に、前記2変数間の独立性の条件となる条件変数がある場合、前記2変数間の条件付き独立性検定を実行する実行ステップと、
前記2変数の経路上で、独立である第1および第2の変数がそれぞれ、第3の変数に対して独立でないグラフ構造であるV字構造の有無を判定する判定ステップと
を含み、
前記実行ステップは、前記V字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記2変数間の条件付き独立性検定を実行しない
情報処理方法。
(13)
多変数間の独立性を検定する処理をコンピュータに実行させるプログラムにおいて、
グラフィカルモデルにおいて少なくとも独立ではない2変数間の経路上に、前記2変数間の独立性の条件となる条件変数がある場合、前記2変数間の条件付き独立性検定を実行する実行ステップと、
前記2変数の経路上で、独立である第1および第2の変数がそれぞれ、第3の変数に対して独立でないグラフ構造であるV字構造の有無を判定する判定ステップと
を含む処理をコンピュータに実行させ、
前記実行ステップは、前記V字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記2変数間の条件付き独立性検定を実行しない
プログラム。
11 情報処理装置, 51 入力部, 52 制御部, 53 記憶部, 54 出力部, 71 経路探索部, 72 実行判定部, 73 検定実行部, 74 V字構造探索部, 75 矛盾検出部, 81 変数対記憶部, 82 V字構造記憶部, 83 分離変数組記憶部

Claims (13)

  1. 多変数間の独立性を検定する情報処理装置において、
    グラフィカルモデルにおいて少なくとも独立ではない2変数間の経路上に、前記2変数間の独立性の条件となる条件変数がある場合、前記2変数間の条件付き独立性検定を実行する実行部と、
    前記2変数の経路上で、独立である第1および第2の変数がそれぞれ、第3の変数に対して独立でないグラフ構造であるV字構造の有無を判定する判定部と
    を備え、
    前記実行部は、前記V字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記2変数間の条件付き独立性検定を実行しない
    情報処理装置。
  2. 前記実行部は、前記条件変数が、前記V字構造における前記第3の変数である場合には、前記2変数間の条件付き独立性検定を実行しない
    請求項1に記載の情報処理装置。
  3. 前記実行部は、条件付き独立性検定を実行するより前に、前記第1および第2の変数間の条件のない独立性検定を実行し、
    前記第1および第2の変数が条件のない独立であり、かつ、前記第1および第2の変数がそれぞれ前記第3の変数に対して独立でないグラフ構造を前記V字構造として探索するV字構造探索部をさらに備える
    請求項1に記載の情報処理装置。
  4. 前記V字構造探索部は、前記第1および第2の変数が、前記第3の変数以外の変数を条件として条件付き独立であり、かつ、前記第1および第2の変数がそれぞれ前記第3の変数に対して独立でないグラフ構造を前記V字構造として探索する
    請求項3に記載の情報処理装置。
  5. 前記V字構造探索部は、インクリメントされる前記条件変数の組の数が所定の数を超えた場合、前記V字構造を探索しない
    請求項4に記載の情報処理装置。
  6. 前記判定部は、インクリメントされる前記条件変数の組の数に応じた数の前記2変数間の経路について、前記V字構造の有無を判定し、
    前記実行部は、前記V字構造を有すると判定された経路のうちのいずれかに、前記条件変数のいずれかがある場合には、前記2変数間の条件付き独立性検定を実行しない
    請求項1に記載の情報処理装置。
  7. 複数の前記V字構造において、矛盾する有向辺を検出し、前記有向辺の一部または全部を無向辺にすることで、前記矛盾を解消する矛盾検出部をさらに備える
    請求項1に記載の情報処理装置。
  8. 前記矛盾検出部は、複数の前記V字構造における前記第1および第2の変数間の独立性検定に用いられる指標を用いて、より独立性の弱い前記第1および第2の変数を有する前記V字構造の有向辺を無向辺にする
    請求項7に記載の情報処理装置。
  9. 変数Xおよび変数Yがそれぞれ、変数Zに対して独立でない第1のV字構造、および、変数Wおよび変数Yがそれぞれ、変数Zに対して独立でない第2のV字構造において、変数Xと変数Wとが独立でない場合、前記矛盾検出部は、前記第1のV字構造における変数Xから変数Zへの有向辺、および、前記第2のV字構造における変数Wから変数Zへの有向辺を無向辺にする
    請求項7に記載の情報処理装置。
  10. 変数Xおよび変数Yがそれぞれ、変数Zに対して独立でない第1のV字構造、および、変数Wおよび変数Yがそれぞれ、変数Zに対して独立でない第2のV字構造において、変数Xと変数Wとが独立でない場合、前記矛盾検出部は、前記第1および第2のV字構造における有向辺の全部を無向辺にする
    請求項7に記載の情報処理装置。
  11. 変数Xおよび変数Yがそれぞれ、変数Zに対して独立でない第1のV字構造、および、変数Wおよび変数Yがそれぞれ、変数Zに対して独立でない第2のV字構造において、変数Xと変数Wとが独立でない場合、前記矛盾検出部は、2変数間の独立性検定に用いられる指標を用いて、変数Xおよび変数Y間の独立性と、変数Wおよび変数Y間の独立性とで、より独立性の弱い2変数を有する前記V字構造の有向辺を無向辺にする
    請求項7に記載の情報処理装置。
  12. 多変数間の独立性を検定する情報処理装置の情報処理方法において、
    グラフィカルモデルにおいて少なくとも独立ではない2変数間の経路上に、前記2変数間の独立性の条件となる条件変数がある場合、前記2変数間の条件付き独立性検定を実行する実行ステップと、
    前記2変数の経路上で、独立である第1および第2の変数がそれぞれ、第3の変数に対して独立でないグラフ構造であるV字構造の有無を判定する判定ステップと
    を含み、
    前記実行ステップは、前記V字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記2変数間の条件付き独立性検定を実行しない
    情報処理方法。
  13. 多変数間の独立性を検定する処理をコンピュータに実行させるプログラムにおいて、
    グラフィカルモデルにおいて少なくとも独立ではない2変数間の経路上に、前記2変数間の独立性の条件となる条件変数がある場合、前記2変数間の条件付き独立性検定を実行する実行ステップと、
    前記2変数の経路上で、独立である第1および第2の変数がそれぞれ、第3の変数に対して独立でないグラフ構造であるV字構造の有無を判定する判定ステップと
    を含む処理をコンピュータに実行させ、
    前記実行ステップは、前記V字構造を有すると判定された経路上にのみ、前記条件変数がある場合には、前記2変数間の条件付き独立性検定を実行しない
    プログラム。
JP2012072789A 2012-03-28 2012-03-28 情報処理装置および方法、並びにプログラム Active JP5854274B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012072789A JP5854274B2 (ja) 2012-03-28 2012-03-28 情報処理装置および方法、並びにプログラム
US13/845,626 US9311729B2 (en) 2012-03-28 2013-03-18 Information processing apparatus, information processing method, and program
CN2013100925027A CN103365829A (zh) 2012-03-28 2013-03-21 信息处理装置、信息处理方法和程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012072789A JP5854274B2 (ja) 2012-03-28 2012-03-28 情報処理装置および方法、並びにプログラム

Publications (3)

Publication Number Publication Date
JP2013206016A true JP2013206016A (ja) 2013-10-07
JP2013206016A5 JP2013206016A5 (ja) 2015-02-19
JP5854274B2 JP5854274B2 (ja) 2016-02-09

Family

ID=49234322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012072789A Active JP5854274B2 (ja) 2012-03-28 2012-03-28 情報処理装置および方法、並びにプログラム

Country Status (3)

Country Link
US (1) US9311729B2 (ja)
JP (1) JP5854274B2 (ja)
CN (1) CN103365829A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015045091A1 (ja) * 2013-09-27 2015-04-02 株式会社シーエーシー ベイジアンネットワークの構造学習におけるスーパーストラクチャ抽出のための方法及びプログラム
WO2017221444A1 (ja) * 2016-06-21 2017-12-28 国立研究開発法人物質・材料研究機構 探索システム、探索方法および物性データベース管理装置
WO2018167826A1 (ja) * 2017-03-13 2018-09-20 三菱電機株式会社 因果関係評価装置、因果関係評価システムおよび因果関係評価方法
JP2020149303A (ja) * 2019-03-13 2020-09-17 オムロン株式会社 解析装置、解析方法、及び解析プログラム

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5845630B2 (ja) * 2011-05-24 2016-01-20 ソニー株式会社 情報処理装置、情報処理方法、並びにプログラム
JP2014228991A (ja) * 2013-05-21 2014-12-08 ソニー株式会社 情報処理装置および方法、並びにプログラム
WO2015114830A1 (ja) * 2014-02-03 2015-08-06 株式会社日立製作所 計算機及びグラフデータ生成方法
US11094015B2 (en) 2014-07-11 2021-08-17 BMLL Technologies, Ltd. Data access and processing system
US11475310B1 (en) * 2016-11-29 2022-10-18 Perceive Corporation Training network to minimize worst-case error
CN110555047B (zh) * 2018-03-29 2024-03-15 日本电气株式会社 数据处理方法和电子设备
US11017572B2 (en) * 2019-02-28 2021-05-25 Babylon Partners Limited Generating a probabilistic graphical model with causal information
US10706104B1 (en) * 2019-07-25 2020-07-07 Babylon Partners Limited System and method for generating a graphical model
CN115827453B (zh) * 2022-12-01 2023-09-08 中国兵器工业信息中心 网络化软件系统可靠性测试剖面构造和测试用例生成方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060047616A1 (en) * 2004-08-25 2006-03-02 Jie Cheng System and method for biological data analysis using a bayesian network combined with a support vector machine
JP2007066260A (ja) * 2005-09-02 2007-03-15 Ntt Docomo Inc ネットワーク変換システム、ネットワーク変換方法
JP2011048435A (ja) * 2009-08-25 2011-03-10 Nippon Telegr & Teleph Corp <Ntt> 推定論理構築支援システム、ユーザ行動推定装置、ユーザ行動推定方法およびユーザ行動推定プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7117185B1 (en) * 2002-05-15 2006-10-03 Vanderbilt University Method, system, and apparatus for casual discovery and variable selection for classification
JP2007207101A (ja) * 2006-02-03 2007-08-16 Infocom Corp グラフ生成方法、グラフ生成プログラム並びにデータマイニングシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060047616A1 (en) * 2004-08-25 2006-03-02 Jie Cheng System and method for biological data analysis using a bayesian network combined with a support vector machine
JP2007066260A (ja) * 2005-09-02 2007-03-15 Ntt Docomo Inc ネットワーク変換システム、ネットワーク変換方法
JP2011048435A (ja) * 2009-08-25 2011-03-10 Nippon Telegr & Teleph Corp <Ntt> 推定論理構築支援システム、ユーザ行動推定装置、ユーザ行動推定方法およびユーザ行動推定プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6015033352; 磯崎 隆司: 'ベイジアンネットワークにおける因果発見' 人工知能学会誌 第25巻 第6号, 20101101, p.811-818, (社)人工知能学会 *
JPN6015033353; 森下 民平: 'Fast Constraint-based Learning of Bayesian Network using Frequent Itemset Mining' 第75回 人工知能基本問題研究会資料 (SIG-FPAI-A902) , 20091106, p.5-11, 社団法人人工知能学会 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015045091A1 (ja) * 2013-09-27 2015-04-02 株式会社シーエーシー ベイジアンネットワークの構造学習におけるスーパーストラクチャ抽出のための方法及びプログラム
WO2017221444A1 (ja) * 2016-06-21 2017-12-28 国立研究開発法人物質・材料研究機構 探索システム、探索方法および物性データベース管理装置
JPWO2017221444A1 (ja) * 2016-06-21 2019-03-22 国立研究開発法人物質・材料研究機構 探索システム、探索方法および物性データベース管理装置
WO2018167826A1 (ja) * 2017-03-13 2018-09-20 三菱電機株式会社 因果関係評価装置、因果関係評価システムおよび因果関係評価方法
JPWO2018167826A1 (ja) * 2017-03-13 2019-03-28 三菱電機株式会社 因果関係評価装置、因果関係評価システムおよび因果関係評価方法
JP2020149303A (ja) * 2019-03-13 2020-09-17 オムロン株式会社 解析装置、解析方法、及び解析プログラム
JP7070478B2 (ja) 2019-03-13 2022-05-18 オムロン株式会社 解析装置、解析方法、及び解析プログラム

Also Published As

Publication number Publication date
JP5854274B2 (ja) 2016-02-09
US9311729B2 (en) 2016-04-12
CN103365829A (zh) 2013-10-23
US20130257873A1 (en) 2013-10-03

Similar Documents

Publication Publication Date Title
JP5854274B2 (ja) 情報処理装置および方法、並びにプログラム
WO2018121690A1 (zh) 对象属性检测、神经网络训练、区域检测方法和装置
US9852378B2 (en) Information processing apparatus and information processing method to estimate cause-effect relationship between variables
WO2019129060A1 (zh) 自动生成机器学习样本的特征的方法及系统
Patel et al. Graph‐Based Link Prediction between Human Phenotypes and Genes
JP7304384B2 (ja) モデルを生成するための方法、装置、電子機器、記憶媒体、及びコンピュータプログラム製品
US9189750B1 (en) Methods and systems for sequential feature selection based on significance testing
US20170227584A1 (en) Time-series data waveform analysis device, method therefor and non-transitory computer readable medium
CN110096938B (zh) 一种视频中的动作行为的处理方法和装置
JP2012058972A (ja) 評価予測装置、評価予測方法、及びプログラム
US11580425B2 (en) Managing defects in a model training pipeline using synthetic data sets associated with defect types
JP6950504B2 (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
US11620579B2 (en) Generalized metric for machine learning model evaluation for unsupervised classification
US11847446B2 (en) Predictive build quality assessment
JP6699753B2 (ja) 分析プログラム、情報処理装置および分析方法
US11550707B2 (en) Systems and methods for generating and executing a test case plan for a software product
JP6631540B2 (ja) 情報処理システム、変化点検出方法、およびプログラム
CN108470194B (zh) 一种特征筛选方法及装置
CN113537630A (zh) 业务预测模型的训练方法及装置
CN114692778B (zh) 用于智能巡检的多模态样本集生成方法、训练方法及装置
CN112420125A (zh) 分子属性预测方法、装置、智能设备和终端
US20200279148A1 (en) Material structure analysis method and material structure analyzer
CN111126566B (zh) 基于gan模型的异常家具布局数据检测方法
Shim et al. Active inspection for cost-effective fault prediction in manufacturing process
CN110879821A (zh) 评分卡模型衍生标签生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141226

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151006

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151125

R151 Written notification of patent or utility model registration

Ref document number: 5854274

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250