JPWO2019220653A1 - 因果関係推定装置、因果関係推定方法および因果関係推定プログラム - Google Patents

因果関係推定装置、因果関係推定方法および因果関係推定プログラム Download PDF

Info

Publication number
JPWO2019220653A1
JPWO2019220653A1 JP2020518947A JP2020518947A JPWO2019220653A1 JP WO2019220653 A1 JPWO2019220653 A1 JP WO2019220653A1 JP 2020518947 A JP2020518947 A JP 2020518947A JP 2020518947 A JP2020518947 A JP 2020518947A JP WO2019220653 A1 JPWO2019220653 A1 JP WO2019220653A1
Authority
JP
Japan
Prior art keywords
query
causal relationship
causal
intervention
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020518947A
Other languages
English (en)
Other versions
JP6977877B2 (ja
Inventor
泰弘 十河
泰弘 十河
顕大 矢部
顕大 矢部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019220653A1 publication Critical patent/JPWO2019220653A1/ja
Application granted granted Critical
Publication of JP6977877B2 publication Critical patent/JP6977877B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

クエリ特定部81は、因果関係に対して介入操作が行われる変数と、その変数の値との組み合わせであるクエリを特定する。介入データ生成部82は、クエリに基づく介入操作により取得される対象変数の値とそのクエリとを含む介入データを生成する。因果関係更新部83は、生成された介入データを用いて、因果関係を更新する。その際、クエリ特定部81は、クエリによる対象変数の推定誤差を表す期待損失に基づいて特定されるクエリのうち、更新により期待損失を最小化するクエリを特定する。

Description

本発明は、因果関係を推定する因果関係推定装置、因果関係推定方法および因果関係推定プログラムに関する。
二つ以上のものの間の関係性として、因果関係および相関関係が知られている。因果関係は、二つ以上のものの間に原因と結果の関係があることを意味し、相関関係は、二つ以上のものの間の関連性を意味する。
図5は、変数同士の関連性の例を示す説明図である。図5に示す例では、因果関係を有する変数同士について、原因に対する結果を矢印の向きで表している。例えば、変数xの変化に伴ってxが変化するため、xとxとの間には因果関係があると言える。一方、変数xの変化に伴ってxおよびxがそれぞれ変化するため、xとxとの間には相関関係があると言える。ただし、xとxとついて、xまたはxのいずれか一方を直接操作しても、他方の変数は変化しないため、xとxとの間に因果関係はない。
複数の変数の相関関係を考慮して予測を行うことが一般に行われている。ただし、予測をするためのモデルを用いても、目的変数を適切に制御できない場合がある。具体的には、相関を測るモデルを用いて相関のある変数を変化させても、目的変数が変化しない場合がある。一方、世の中には、因果関係を把握し、その影響の度合いを測ることで解決可能な様々な問題も存在する。このような問題として、例えば、携帯電話の契約を解約した原因を追究して新施策を立案することや、設備の故障の原因を追究して対策をとることなどが挙げられる。
因果効果を正しく推定する方法として、統計的因果推論が知られている。統計因果推論は、変数間の因果構造Gおよび因果パラメータθをデータから推定する技術である。因果構造Gは、変数x間の影響関係を有向辺で表現するグラフであり、因果パラメータθは、変数x間の影響関係の強さに関するパラメータである。
統計的因果推論では、変数に関する分布を仮定しない場合、マルコフ同値クラスまでは推定可能であるとしても、因果構造Gおよび因果パラメータθを、一意に同定することはできない。例えば、各変数についての非正規分布を仮定し、変数間の線形性を仮定することで、因果構造Gおよび因果パラメータθを一意に同定できるようになる。
一方、任意の変数に特定の値を割り当てる介入操作により、因果構造を推定することが可能である。介入操作を行うことで、その上位の影響を無視した場合の変数に関する介入データを取得することができる。このデータを使用することで、一意に因果構造を推定することが可能になる。図6は、介入操作の例を示す説明図である。例えば、図6に例示する変数xに対して、値Cを割り当てる介入操作を行うことで、変数xの影響を無視した場合の介入データにより因果構造を推定することも可能になる。
なお、非特許文献1には、因果構造Gの推定を効率的に行う介入方法が記載されている。また、非特許文献2には、因果パラメータθを効率的に行う介入方法が記載されている。
Simon Tong, Daphne Koller, "Active Learning for Structure in Bayesian Networks", IJCAI'01 Proceedings of the 17th international joint conference on Artificial intelligence, Volume 2, p.863 - 869, 2001. Simon Tong, Daphne Koller, "Active Learning for Parameter Estimation in Bayesian Networks", Advances in Neural Information Processing Systems 13 (NIPS 2000), 2000.
因果構造全体の推定を行うためには、多くの介入実験を行う必要がある。具体的には、因果構造Gを知らない状態で、ある介入操作可能な変数qを変化させたときの、特定の変数yの影響度合いを、できるだけ少ない介入操作で把握できることが好ましい。
非特許文献1および非特許文献2は、因果全体に対する構造またはパラメータの推定を効率的に行うための介入方法を開示する。しかし、実際の場面において、必ずしも全体の因果関係を推定できなくても、特定の変数yの値が観測できればよい場合もある。
すなわち、全変数間の因果構造Gではなく、着目したい特定の変数yへの影響についてのみ観測できればよい場合も存在する。例えば、図5に示す例において、xを介入変数とし、xを変化させたときのyへの影響を観測できればよい場合、x〜xおよびyの関係を厳密に考慮せずに、モデル化できることが好ましい。
そこで、本発明は、着目する変数に対する因果関係を効率的に推定できる因果関係推定装置、因果関係推定方法および因果関係推定プログラムを提供することを目的とする。
本発明による因果関係推定装置は、因果関係を推定する因果関係推定装置であって、因果関係に対して介入操作が行われる変数と、その変数の値との組み合わせであるクエリを特定するクエリ特定部と、クエリに基づく介入操作により取得される対象変数の値とそのクエリとを含む介入データを生成する介入データ生成部と、生成された介入データを用いて、因果関係を更新する因果関係更新部とを備え、クエリ特定部が、クエリによる対象変数の推定誤差を表す期待損失に基づいて特定されるクエリのうち、更新により期待損失を最小化するクエリを特定することを特徴とする。
本発明による因果関係推定方法は、因果関係を推定する因果関係推定方法であって、コンピュータが、因果関係に対して介入操作が行われる変数と、その変数の値との組み合わせであるクエリを特定し、コンピュータが、クエリに基づく介入操作により取得される対象変数の値とそのクエリとを含む介入データを生成し、コンピュータが、生成された介入データを用いて、因果関係を更新し、クエリを特定する際、そのクエリによる対象変数の推定誤差を表す期待損失に基づいて特定されるクエリのうち、更新により期待損失を最小化するクエリを特定することを特徴とする。
本発明による因果関係推定プログラムは、因果関係を推定するコンピュータに適用される因果関係推定プログラムであって、コンピュータに、因果関係に対して介入操作が行われる変数と、その変数の値との組み合わせであるクエリを特定するクエリ特定処理、クエリに基づく介入操作により取得される対象変数の値とそのクエリとを含む介入データを生成する介入データ生成処理、および、生成された介入データを用いて、因果関係を更新する因果関係更新処理を実行させ、クエリ特定処理で、クエリによる対象変数の推定誤差を表す期待損失に基づいて特定されるクエリのうち、更新により期待損失を最小化するクエリを特定させることを特徴とする。
本発明によれば、着目する変数に対する因果関係を効率的に推定できる。
本発明による因果関係推定装置の一実施形態を示すブロック図である。 因果関係推定装置の動作例を示すフローチャートである。 本発明による因果関係推定装置の概要を示すブロック図である。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。 変数同士の関連性の例を示す説明図である。 介入操作の例を示す説明図である。
以下、本発明の実施形態を図面を参照して説明する。
図1は、本発明による因果関係推定装置の一実施形態を示すブロック図である。本実施形態の因果関係推定装置100は、入力部10と、因果関係推定部20と、クエリ特定部30と、介入データ生成部40と、因果関係更新部50と、出力部60と、記憶部70とを備えている。
記憶部70は、因果関係に基づいて観測されたデータ(以下、観測データと記す。)Dを記憶する。また、記憶部70は、後述する処理で推定および更新される因果関係(因果モデル)を記憶してもよい。記憶部70は、例えば、磁気ディスク等により実現される。なお、記憶部70が、因果関係推定装置100の外部に設けられていてもよい。
入力部10は、記憶部70に記憶された観測データDを読み取り、因果関係推定部20に入力する。
因果関係推定部20は、入力された観測データDを用いて、因果関係を表すモデル(以下、因果モデルと記す。)を推定する。本実施形態では、因果モデルは、因果構造G、および、因果モデルのパラメータ(因果パラメータ)θによる同時分布P(θ,G)で表される。
因果関係推定部20が因果モデルを推定する方法は任意である。因果関係推定部20は、例えば、観測データDを用いて、以下の式1に示すP(G)およびP(θ|G)のベイズ更新を行うことにより、因果モデルを推定してもよい。
Figure 2019220653
また、P(θ|D,G)について、以下に示す式2が成り立つ。
Figure 2019220653
式2において、P(D|θ,G)は、因果パラメータθおよび因果構造Gを用いた尤度である。二項分布およびベータ事前分布では、θの各パラメータは0と1の間の値をとり、θの積分は明示的に計算できる。なお、推定の際に用いられる分布は、上記分布に限定されず、他の分布が用いられてもよい。他の分布が用いられた場合でも、整数を数値で近似することが可能である。
以下の説明では、観測データDの観測後に更新された(G,θ)の分布をP(G,θ)=P(G,θ|D)と表わす。
なお、因果関係推定部20は、観測データDのみに基づいて因果関係を推定するため、上述するように、因果構造Gおよび因果パラメータθを、一意に同定することはできない。そのため、因果関係推定部20によって推定される因果関係は、曖昧性を残す因果関係であると言える。
クエリ特定部30は、因果関係に対して介入操作が行われる変数と、その変数の値との組み合わせ(以下、クエリと記す。)を特定する。すなわち、クエリ特定部30は、介入操作に用いられる変数およびその値を特定する。
本実施形態のクエリ特定部30は、特定の変数y(以下、対象変数yと記す。)への影響度合いを、できるだけ少ない介入操作で把握できるようにするため、介入操作と対象変数yとの曖昧性((言い換えると、介入操作と対象変数yの推定の誤り易さ)に着目して、クエリを特定する。
以下、適宜、具体例と対応させながら、クエリ特定部30の処理を説明する。以下の具体的な説明において、Xは、d次元の二項確率ベクトルであり、yはXにおける二項確率変数である。上述するように、yは対象変数であり、間接的に制御される変数である。Qは、Xにおける二項変数であり、クエリを用いて直接操作可能な(すなわち、介入可能な)変数である。
P(X,y|θ)は、パラメータθのもとでの(d次元の)同時分布である。θxi|pa(xi)は、xの条件付きパラメータであり、i=1,…,d+1である。また、P(θxi|pa(xi)|G)は、xについての条件付きベータ事前分布である。P(θ|G)は、P(θxi|pa(xi)|G)の総乗、すなわち、以下に例示する式3で表される。
Figure 2019220653
P(G)は、離散的に均一な事前分布である。Dは、(X,y)において観測されるN個のデータであり、D={(y,x),…,(y,x)}である。
クエリ特定部30は、ある介入操作を行った時のクエリ「qチルダ」(以下、qと記す。)と返却される対象変数yを用いて因果モデルを更新した場合に、クエリqと対象変数yとの関係がどれくらい曖昧かを評価する。具体的には、クエリ特定部30は、クエリqと対象変数yの推定を誤ることによって実現される期待損失を評価する。期待損失の定義は任意であり、例えば、期待不確実性(uncertainty )や、統計的な不確実性(エントロピー)が用いられる。クエリqによる期待損失は、例えば、以下に示す式4で表される。
Figure 2019220653
式4において、G,θは、現状の因果関係を表わし、qは、最終的に決定すべきクエリを表わす。また、Ea〜P(a)[f(a)]は、分布P(a)のもとでの、aに関する関数f(a)の期待値を表す。なお、P(G,θ|Q:=q,y,x)を因果関係推定部20の処理で例示したベイズ更新することにより、損失を計算することが可能である。
なお、クエリ特定部30は、言い換えると、クエリqを実行してみたときに返却されるyおよびXで因果モデルを更新したときの曖昧さを評価しており、また、現在の因果モデルのパラメータの分布から、返却されそうなyとXの期待値を算出しているとも言える。
なお、上記式4で表されるモデルを評価する場合、クエリ特定部30は、例えば、以下の式5で例示する関係式を用いて期待損失を算出してもよい。
Figure 2019220653
クエリ特定部30は、期待損失に基づいて特定されるクエリのうち、期待損失を最小化するようなクエリを特定する。期待損失が大きいほど、クエリと対象変数との関係が曖昧である(すなわち、クエリと対象変数yとの間の推定誤差が高くなる)と言える。そこで、クエリ特定部30は、期待損失が最も大きいクエリの中から、更新により期待損失を最小化できるクエリを特定する。
例えば、期待損失として、上記の式4で示す期待不確実性が用いられる場合、クエリ特定部30は、以下に例示する式6を用いて、クエリを特定してもよい。式6では、ある介入操作を行った時に、最も期待損失が大きくなりそうなクエリqのうち、その期待損失を最も小さくするために用いられるクエリqを決定していることを示す。
Figure 2019220653
なお、上記説明では、max関数を用いて、期待損失が最も大きいクエリを選択する場合を例示している。ただし、クエリを選択する方法は、期待損失が最も大きいクエリを選択する方法に限定されない。例えば、クエリqによって更新された際の期待損失の平均や分散に基づいて、クエリを選択してもよい。
以上に示すように、クエリ特定部30は、クエリによる対象変数の推定誤差を表す期待損失に基づいて特定されるクエリのうち、期待損失を最小化するクエリを特定する。このようにすることで、対象変数yに関する因果関係をより明確にすることが可能になる。なお、期待損失に基づいてクエリを特定する際、更新による期待損失が最も大きいクエリを特定することが、より好ましい。
すなわち、本実施形態では、因果関係全体に対する評価基準を適用するのではなく、対象変数yに着目した評価を行っている。上述する損失は、介入する変数と対象変数yとの関係にのみ焦点を当てているため、特定されるクエリを用いて因果モデルを更新することにより、少ない介入操作で、対象変数yに対する因果関係を明確にすることが可能になる。
介入データ生成部40は、特定されたクエリに基づく介入操作により、対象変数yの値を取得する。そして、介入データ生成部40は、取得した対象変数yとクエリとを含むデータ(以下、介入データと記す。)を生成する。介入データ生成部40は、例えば、推定する因果関係の系に対して介入操作を行った結果を、対象変数yの値として取得すればよい。
因果関係更新部50は、生成された介入データを用いて因果関係を更新する。具体的には、因果関係更新部50は、因果モデルの分布P(G,θ)をP(θ|G)P(G)で更新する。本実施形態では、クエリに基づいて対象変数yが観測される、すなわち、他のxは観測されない、という条件の下で更新が行われる。
因果関係更新部50が因果モデルを更新する方法は任意であり、例えば、不完全データ間におけるベイズ更新が用いられてもよい。以下、算出方法の具体的な一例を説明するが、因果モデルの更新方法は、以下に例示する方法に限定されない。
まず、因果関係更新部50は、ベイズ規則を用いて、パラメータの分布を更新する。具体的には、因果関係更新部50は、以下に例示する式7に基づいて、パラメータの分布を更新する。なお、介入操作だけでは事前分布は更新されないことから、式7において、P(θ|G)=P(θ|Q:=q,G)が成り立つ。
Figure 2019220653
次に、因果関係更新部50は、同様にベイズ規則を用いて、以下に例示する式8に基づき、グラフ構造Gにおける分布を(q,y)で更新する。
Figure 2019220653
なお、式8におけるP(y|Q:=q,G)およびP(y|Q:=q)について、それぞれ、以下に示す式9および式10が成り立つ。
Figure 2019220653
上述するように、介入操作だけでは事前分布は更新されないことから、式8において、P(G)=P(G|Q:=q)が成り立つ。
因果関係更新部50は、算出されたモデル分布でもとの分布を置き換える。すなわち、P(θ|G)=P(θ,G|Q:=q,y)である。
そして、因果関係更新部50は、任意の方法を用いて、因果関係の更新処理を繰り返すか否か判断する。因果関係更新部50は、例えば、予め定めた更新回数を超えているか否か判断してもよいし、期待損失(不確実性)に対して設けられた閾値を下回るか否か判断してもよい。因果関係の更新処理を繰り返すと判断された場合(例えば、予め定めた更新回数を超えていない場合、期待損失が閾値を超えている場合)、クエリ特定部30、介入データ生成部40および因果関係更新部50は、上述する処理を繰り返す。
出力部60は、因果関係の更新結果を出力する。例えば、更新処理がt回繰り返された場合、出力部60は、因果モデルとして、P(θ,G)を出力する。以上の処理からも明らかなように、ここで出力される因果モデルは、Qとyの関係に焦点を当てたX間の因果関係の構造およびパラメータをエンコードしたものと言える。
入力部10と、因果関係推定部20と、クエリ特定部30と、介入データ生成部40と、因果関係更新部50と、出力部60とは、プログラム(因果関係推定プログラム)に従って動作するコンピュータのプロセッサ(例えば、CPU(Central Processing Unit )、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array ))によって実現される。
例えば、プログラムは、記憶部70に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、入力部10、因果関係推定部20、クエリ特定部30、介入データ生成部40、因果関係更新部50および出力部60として動作してもよい。また、因果関係推定装置の機能がSaaS(Software as a Service )形式で提供されてもよい。
入力部10と、因果関係推定部20と、クエリ特定部30と、介入データ生成部40と、因果関係更新部50と、出力部60とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
また、因果関係推定装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
次に、本実施形態の因果関係推定装置の動作を説明する。図2は、本実施形態の因果関係推定装置の動作例を示すフローチャートである。入力部10は、観測データDを入力する(ステップS11)。因果関係推定部20は、入力された観測データDを用いて、基準とする因果モデルを推定する(ステップS12)。
クエリ特定部30は、介入操作を行うためのクエリを特定する(ステップS13)。具体的には、クエリ特定部30は、期待損失に基づいて特定されるクエリのうち、更新により期待損失を最小化できるクエリを特定する。介入データ生成部40は、特定されたクエリで取得される対象変数の値と、そのクエリとを含む介入データを生成する(ステップS14)。因果関係更新部50は、生成された介入データを用いて因果モデルを更新する(ステップS15)。
因果関係更新部50は、因果モデルの更新処理を繰り返すか否か判断する(ステップS16)。繰り返すと判断された場合(ステップS16におけるYes)、ステップS13以降の処理が繰り返される。一方、繰り返さないと判断された場合(ステップS16におけるNo)、出力部60は、更新された因果モデルを出力する(ステップS17)。
以上のように、本実施形態では、クエリ特定部30が、因果関係に対して介入操作が行われる変数と、その変数の値との組み合わせであるクエリを特定し、介入データ生成部40が、クエリに基づく介入操作により取得される対象変数の値とそのクエリとを含む介入データを生成する。そして、因果関係更新部50が、生成された介入データを用いて、因果関係を更新する。その際、クエリ特定部30が、クエリによる対象変数の推定誤差を表す期待損失に基づいて特定されるクエリのうち、更新により期待損失を最小化するクエリを特定する。よって、着目する変数に対する因果関係を、効率的に推定することが可能になる。
すなわち、本実施形態では、クエリqと対象変数yとの関係で最も不確実な部分に対する介入操作を実施することによって、その不確実性を効率的に軽減できるため、因果関係を表わすモデリング精度を効率的に向上させることが可能になる。
以下、本実施形態の因果関係推定装置の応用例を説明する。一例として、アンケート調査による回答から因果関係を推定する事案に対して、本実施形態の因果関係推定装置を利用することが可能である。この場合、各アンケート調査の内容をxに、回答の内容に応じた結果をyに、それぞれ対応付けることができる。例えば、携帯電話(キャリア)の利用者に対するアンケートとして、「通信速度が遅く、月額料金が安い場合に契約するか」という調査を行ったとする。この場合、「通信速度」や「月額料金」という調査をxに、実際の契約の有無をyに対応付けることができる。このような調査から、通信速度や月額料金を変化させる(すなわち、介入操作を行う)ことでの因果関係(影響度)を推定することができる。
また、他にも、小売りの分野において消費者の嗜好を調査するようなマーケティング調査から因果関係を推定する事案に対して、本実施形態の因果関係推定装置を利用することが可能である。例えば、消費者に対して、「あるカレーの味が辛かったら購入するか」というマーケティング調査を行ったとする。この場合、「カレーの辛さ」という調査をxに、購入の有無をyに対応付けることができる。このような調査から、辛さを変化させる(すなわち、介入操作を行う)ことでの因果関係(影響度)を推定することができる。
上記具体例において、より一般的には、質問内容または調査内容xの一部または全部がqの候補になる。例えば、xの間でも因果関係があり、ある質問内容xでその回答を無理矢理固定したとする。この場合、xに対応する反応yが現在の因果モデルにおいて最も不確実になるような、質問内容とその回答を決定すればよい。そして、反応yを推定することに重きを置いたサンプル(q,y)を取得し、そのサンプルを用いて因果モデルを更新することで、反応yに着目したモデリング精度を向上できる。
このように、反応yに着目した情報を収集すればよいため、介入データを収集するコストを低減できるとともに、有効な施策を効率的に発見できるようになる。また、因果関係を推定する際に用いられるコンピュータも、不要な処理を抑制できるため、コンピュータの処理性能も向上させることが可能になる。
次に、本発明の概要を説明する。図3は、本発明による因果関係推定装置の概要を示すブロック図である。本発明による因果関係推定装置80は、因果関係を推定する因果関係推定装置(例えば、因果関係推定装置100)であって、因果関係に対して介入操作が行われる変数(例えば、X)と、その変数の値との組み合わせであるクエリを特定するクエリ特定部81(例えば、クエリ特定部30)と、クエリに基づく介入操作により取得される対象変数(例えば、y)の値とそのクエリ(例えば、q)とを含む介入データを生成する介入データ生成部82(例えば、介入データ生成部40)と、生成された介入データを用いて、因果関係を更新する因果関係更新部83(例えば、因果関係更新部50)とを備えている。
クエリ特定部81は、クエリによる対象変数の推定誤差を表す期待損失(例えば、期待不確実性など)に基づいて特定されるクエリ(例えば、クエリq)のうち、更新により期待損失を最小化するクエリ(例えば、q)を特定する。
そのような構成により、着目する変数(対象変数)に対する因果関係を効率的に推定できる。
また、クエリ特定部81は、期待損失が最大(すなわち、max)になるクエリのうち、更新によりその期待損失を最小化するクエリを特定してもよい。
また、クエリ特定部81は、クエリによる対象変数の期待不確実性(例えば、上記式4に示す期待不確実性)に基づいて特定される候補クエリのうち、その期待不確実性を最小化するクエリを特定してもよい。
また、因果関係推定装置80は、因果関係に基づく観測データ(例えば、観測データD)を用いて、その因果関係を表わすモデルである因果モデル(例えば、P(θ,G))を推定する因果関係推定部(例えば、因果関係推定部20)を備えていてもよい。そして、因果関係更新部83は、介入データを用いて、因果モデルを更新してもよい。
また、クエリ特定部81は、調査項目(例えば、「通信速度」)とその調査項目の回答(例えば、「通信速度が遅い」など)の組合せをクエリとして特定する際、その調査項目に対する反応(例えば、「契約の有無」)が現在の因果関係において最も不確実になるような調査項目および回答を特定してもよい。そして、介入データ生成部82は、クエリに応じた反応とそのクエリとを含む介入データを生成し、因果関係更新部83は、生成された介入データを用いて、因果関係を更新してもよい。そのような構成によれば、介入データの収集コストを低減できるとともに、有効な施策を効率的に発見できる。
図4は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ1000は、プロセッサ1001、主記憶装置1002、補助記憶装置1003、インタフェース1004を備える。
上述の因果関係推定装置は、コンピュータ1000に実装される。そして、上述した各処理部の動作は、プログラム(因果関係推定プログラム)の形式で補助記憶装置1003に記憶されている。プロセッサ1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、当該プログラムに従って上記処理を実行する。
なお、少なくとも1つの実施形態において、補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD−ROM(Compact Disc Read-only memory )、DVD−ROM(Read-only memory)、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000が当該プログラムを主記憶装置1002に展開し、上記処理を実行しても良い。
また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であっても良い。
10 入力部
20 因果関係推定部
30 クエリ特定部
40 介入データ生成部
50 因果関係更新部
60 出力部
70 記憶部
100 因果関係推定装置

Claims (9)

  1. 因果関係を推定する因果関係推定装置であって、
    前記因果関係に対して介入操作が行われる変数と、当該変数の値との組み合わせであるクエリを特定するクエリ特定部と、
    前記クエリに基づく介入操作により取得される対象変数の値と当該クエリとを含む介入データを生成する介入データ生成部と、
    生成された前記介入データを用いて、前記因果関係を更新する因果関係更新部とを備え、
    前記クエリ特定部は、前記クエリによる前記対象変数の推定誤差を表す期待損失に基づいて特定されるクエリのうち、更新により前記期待損失を最小化するクエリを特定する
    ことを特徴とする因果関係推定装置。
  2. クエリ特定部は、期待損失が最大になるクエリのうち、更新により当該期待損失を最小化するクエリを特定する
    請求項1記載の因果関係推定装置。
  3. クエリ特定部は、クエリによる対象変数の期待不確実性に基づいて特定される候補クエリのうち、当該期待不確実性を最小化するクエリを特定する
    請求項1または請求項2記載の因果関係推定装置。
  4. 因果関係に基づく観測データを用いて、当該因果関係を表わすモデルである因果モデルを推定する因果関係推定部を備え、
    因果関係更新部は、介入データを用いて、前記因果モデルを更新する
    請求項1から請求項3のうちのいずれか1項に記載の因果関係推定装置。
  5. クエリ特定部は、調査項目と当該調査項目の回答の組合せをクエリとして特定する際、当該調査項目に対する反応が現在の因果関係において最も不確実になるような調査項目および回答を特定し、
    介入データ生成部は、前記クエリに応じた反応と当該クエリとを含む介入データを生成し、
    因果関係更新部は、生成された前記介入データを用いて、前記因果関係を更新する
    請求項1から請求項4のうちのいずれか1項に記載の因果関係推定装置。
  6. 因果関係を推定する因果関係推定方法であって、
    コンピュータが、前記因果関係に対して介入操作が行われる変数と、当該変数の値との組み合わせであるクエリを特定し、
    前記コンピュータが、前記クエリに基づく介入操作により取得される対象変数の値と当該クエリとを含む介入データを生成し、
    前記コンピュータが、生成された前記介入データを用いて、前記因果関係を更新し、
    前記クエリを特定する際、当該クエリによる前記対象変数の推定誤差を表す期待損失に基づいて特定されるクエリのうち、更新により前記期待損失を最小化するクエリを特定する
    ことを特徴とする因果関係推定方法。
  7. 期待損失が最大になるクエリのうち、更新により当該期待損失を最小化するクエリを特定する
    請求項6記載の因果関係推定方法。
  8. 因果関係を推定するコンピュータに適用される因果関係推定プログラムであって、
    前記コンピュータに、
    前記因果関係に対して介入操作が行われる変数と、当該変数の値との組み合わせであるクエリを特定するクエリ特定処理、
    前記クエリに基づく介入操作により取得される対象変数の値と当該クエリとを含む介入データを生成する介入データ生成処理、および、
    生成された前記介入データを用いて、前記因果関係を更新する因果関係更新処理を実行させ、
    前記クエリ特定処理で、前記クエリによる前記対象変数の推定誤差を表す期待損失に基づいて特定されるクエリのうち、更新により前記期待損失を最小化するクエリを特定させる
    ための因果関係推定プログラム。
  9. コンピュータに、
    クエリ特定処理で、期待損失が最大になるクエリのうち、更新により当該期待損失を最小化するクエリを特定させる
    請求項8記載の因果関係推定プログラム。
JP2020518947A 2018-05-16 2018-07-25 因果関係推定装置、因果関係推定方法および因果関係推定プログラム Active JP6977877B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862672088P 2018-05-16 2018-05-16
US62/672,088 2018-05-16
PCT/JP2018/027920 WO2019220653A1 (ja) 2018-05-16 2018-07-25 因果関係推定装置、因果関係推定方法および因果関係推定プログラム

Publications (2)

Publication Number Publication Date
JPWO2019220653A1 true JPWO2019220653A1 (ja) 2021-03-18
JP6977877B2 JP6977877B2 (ja) 2021-12-08

Family

ID=68540638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020518947A Active JP6977877B2 (ja) 2018-05-16 2018-07-25 因果関係推定装置、因果関係推定方法および因果関係推定プログラム

Country Status (3)

Country Link
US (1) US20210056449A1 (ja)
JP (1) JP6977877B2 (ja)
WO (1) WO2019220653A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023238503A1 (ja) * 2022-06-07 2023-12-14 ソニーグループ株式会社 情報処理装置及び情報処理方法、並びにコンピュータプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6144838A (en) * 1997-12-19 2000-11-07 Educational Testing Services Tree-based approach to proficiency scaling and diagnostic assessment
US20050102248A1 (en) * 2002-10-02 2005-05-12 Gunnar Backman A method and system for design, management and evaluation of complex initiatives
US9053430B2 (en) * 2012-11-19 2015-06-09 Qualcomm Incorporated Method and apparatus for inferring logical dependencies between random processes
US20180121817A1 (en) * 2016-10-28 2018-05-03 Carnegie Mellon University System and method for assisting in the provision of algorithmic transparency
CN109598346A (zh) * 2017-09-30 2019-04-09 日本电气株式会社 用于估计观测变量之间的因果关系的方法、装置和系统
CN110390396B (zh) * 2018-04-16 2024-03-19 日本电气株式会社 用于估计观测变量之间的因果关系的方法、装置和系统

Also Published As

Publication number Publication date
WO2019220653A1 (ja) 2019-11-21
US20210056449A1 (en) 2021-02-25
JP6977877B2 (ja) 2021-12-08

Similar Documents

Publication Publication Date Title
US20190377984A1 (en) Detecting suitability of machine learning models for datasets
Abo-Hammour et al. A genetic algorithm approach for prediction of linear dynamical systems
US20190236479A1 (en) Method and apparatus for providing efficient testing of systems by using artificial intelligence tools
Huang et al. Forecasting container throughput of Qingdao port with a hybrid model
WO2018157752A1 (en) Approximate random number generator by empirical cumulative distribution function
Rady et al. Time series forecasting using tree based methods
Moniz et al. Smoteboost for regression: Improving the prediction of extreme values
KR102293791B1 (ko) 반도체 소자의 시뮬레이션을 위한 전자 장치, 방법, 및 컴퓨터 판독가능 매체
US20140317034A1 (en) Data classification
CN111369344B (zh) 一种动态生成预警规则的方法和装置
Mendonça et al. Approximating network centrality measures using node embedding and machine learning
Chen et al. Generative inverse deep reinforcement learning for online recommendation
CN111368973A (zh) 用于训练超网络的方法和装置
US20230196406A1 (en) Siamese neural network model
CN113536097A (zh) 基于自动特征分组的推荐方法及装置
Jabeen et al. An improved software reliability prediction model by using high precision error iterative analysis method
Dekhovich et al. Continual prune-and-select: class-incremental learning with specialized subnetworks
CN115296984A (zh) 异常网络节点的检测方法及装置、设备、存储介质
US20240095529A1 (en) Neural Network Optimization Method and Apparatus
JP6977877B2 (ja) 因果関係推定装置、因果関係推定方法および因果関係推定プログラム
KR20200092989A (ko) 아웃라이어 감지를 위한 비지도 파라미터 러닝을 이용한 생산용 유기체 식별
US20200380446A1 (en) Artificial Intelligence Based Job Wages Benchmarks
CN110796170A (zh) 客户动支模型生成方法、装置及电子设备
US11295229B1 (en) Scalable generation of multidimensional features for machine learning
CN110087230B (zh) 数据处理方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200929

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211012

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211025

R150 Certificate of patent or registration of utility model

Ref document number: 6977877

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150