WO2022149372A1

WO2022149372A1 - 情報処理装置、情報処理方法及びプログラム

Info

Publication number: WO2022149372A1
Application number: PCT/JP2021/043733
Authority: WO
Inventors: 隆司磯崎; 眞大山本; 淳史野田
Original assignee: ソニーグループ株式会社
Priority date: 2021-01-08
Filing date: 2021-11-30
Publication date: 2022-07-14
Also published as: EP4276704A4; WO2022149480A1; EP4276704A1; CN116710938A; JPWO2022149480A1; US20240070486A1

Abstract

情報処理装置（１００）は、制御部（１３０）を備える。制御部（１３０）は、機械学習を用いた予測モデルにおける複数の入力変数と予測結果との因果関係に関する因果モデルに基づいて、予測結果に影響を与える入力変数を説明変数として選択する。制御部（１３０）は、選択された説明変数を出力する。

Description

情報処理装置、情報処理方法及びプログラム

　本開示は、情報処理装置、情報処理方法及びプログラムに関する。

　近年、ビッグデータ等のデータから有用な情報を抽出するための、データ分析技術の向上が求められている。分析結果は、すでに起きた現象の理解、将来の予測、制御又は介入などのために用いられる。例えば、予測モデルの分析を行い、予測結果に対して貢献度の大きい変数を出力する技術が知られている。

M.T.Ribeiro,　S.Singh,　C.Guestrin,　"Why　should　I　trust　you?　Explaining　the　Predictions　of　Any　Classifier",　the　22nd　ACM　SIGKDD　International　Conference　on　Knowledge　Discovery　and　Data　Mining,　pp.1135-1144,　2016. S.M.Lundberg　and　S.I.Lee，"A　Unified　Approach　to　Interpreting　Model　Predictions",　Advances　in　Neural　Information　Processing　Systems　30",　pp.4765-4774,　2017.

　上記技術では、予測結果と変数との関係が線形であると仮定し、分析を行っている。また、上記技術では、複数の変数の貢献度を加算することで、予測結果にいたる複合的な理由として、複数の変数を出力する。

　上記技術は、理由として適した変数を出力するという点で改善の余地がある。特に、上記技術では、複合的な理由を出力する場合に、複数の変数の貢献度を加算するに過ぎず、複数の変数同士のカテゴリの組み合わせパターンに対する依存関係について考慮されていなかった。例えば、「性別」という変数に「男性」、「女性」のカテゴリが含まれ、「年齢」という変数に「１０代」、「２０代」、「３０代」、「４０代」、「５０代以上」というカテゴリが含まれるものとする。変数同士のカテゴリの組み合わせ、例えば、「１０代」の「女性」と、「３０代」の「男性」とでは、予測への寄与度が大きく異なることがあり得る。このように、複数の変数同士のカテゴリの組み合わせパターンの予測への寄与度を考慮して、予測結果に対してより適切である複合的な理由を出力することが望まれる。

　そこで、本開示では、予測結果に対する複合的な理由を出力する場合に、より理由として適した変数を出力することができる情報処理装置、情報処理方法及びプログラムを提案する。

　なお、上記課題又は目的は、本明細書に開示される複数の実施形態が解決し得、又は達成し得る複数の課題又は目的の１つに過ぎない。

　本開示によれば、情報処理装置が提供される。情報処理装置は、制御部を備える。制御部は、機械学習を用いた予測モデルにおける複数の入力変数と予測結果との因果関係に関する因果モデルに基づいて、前記予測結果に影響を与える前記入力変数を説明変数として選択する。制御部は、選択された前記説明変数を出力する。

本開示の実施形態に係る情報処理装置の論理的な構成の一例を示すブロック図である。本開示の実施形態に係る因果モデル推定部が取得する予測モデルの一例を説明するための図である。本開示の実施形態に係る因果モデル推定部が推定する因果モデルの一例を説明するための図である。本開示の実施形態に係る情報処理装置が実行する予測モデルの分析処理の流れを示すフローチャートである。本開示の実施形態の適用例に係る情報処理装置が推定する因果モデルの一例について説明するための図である。本開示の実施形態の適用例に係る情報処理装置により出力されるＵＩ画面の一例を示す図である。本開示の実施形態の適用例に係る情報処理装置により出力されるＵＩ画面の一例を示す図である。本開示の実施形態の適用例に係る情報処理装置により出力されるＵＩ画面の一例を示す図である。本開示の実施形態の適用例に係る情報処理装置により出力されるＵＩ画面の一例を示す図である。再犯判断システムの予測モデルの因果関係を説明するための図である。本開示の実施形態に係る情報処理装置が算出する最近接ノードのレベルの条件付き確率を示す図表である。本実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。

　以下に添付図面を参照しながら、本開示の実施形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　以下に説明される１又は複数の実施形態（実施例、変形例を含む）は、各々が独立に実施されることが可能である。一方で、以下に説明される複数の実施形態は少なくとも一部が他の実施形態の少なくとも一部と適宜組み合わせて実施されてもよい。これら複数の実施形態は、互いに異なる新規な特徴を含み得る。したがって、これら複数の実施形態は、互いに異なる目的又は課題を解決することに寄与し得、互いに異なる効果を奏し得る。

　なお、説明は以下の順序で行うものとする。
　　１．提案技術の概要
　　２．情報処理装置の構成例
　　３．分析処理
　　４．適用例
　　　４．１．製造系データ分析システムへの適用例
　　　４．２．再犯判断システムへの適用例
　　５．その他の実施形態
　　６．ハードウェア構成例
　　７．まとめ

　＜＜１．提案技術の概要＞＞
　近年、機械学習の性能向上により、様々な場面で機械学習による予測モデル（予測器）が利用されるようになってきた。その一方、予測モデルが出力する予測結果に対して、根拠が与えられない場合が多く、利用者が利用しにくいと感じることがある。そのため、予測モデルの利用が限定された範囲に滞ってしまう恐れがある。

　このように、予測モデルの利用を促進するためにも、予測器が、予測結果とともに、その根拠（理由）を提示することが望まれる。

　この要望に対して、例えば、予測モデルの入力変数のうち予測の理由として重要と考えられる入力変数（以下、重要変数と記載する）を自動的に出力する技術が数多く提案されてきている。

　しかしながら、上記技術は、予測結果である出力変数との相関的なパターンに基づいて算出された重要変数を出力するものであり、因果的な観点が考慮されていない。そのため、予測の理由として出力される重要変数と出力変数とが疑似相関である可能性が排除されておらず、適切な理由が出力されているとは言えなかった。

　出力される理由（重要変数）が適切でない場合、理由に基づいて介入、施策等を行っても予測結果が改善されない可能性がある。また、人間は、相関関係を因果的な解釈で捉えてしまう傾向があるため、相関関係に基づいて提示された理由をユーザが因果と捉えてしまい、誤った知識を学んでしまう恐れがある。そのため、予測結果の理由として、より適切な変数を出力することができる技術が望まれる。

　そこで、本開示の技術では、情報処理装置が疑似相関であるか否かという情報に基づいて、予測結果の理由となる入力変数（重要変数）を出力する。例えば、本開示の技術に係る情報処理装置は、機械学習によって生成された予測モデルの入力変数と出力変数との疑似相関の関係に基づき、入力変数から疑似相関の関係にない入力変数を、予測モデルの予測結果の理由とする重要変数として選択する。情報処理装置は、選択した重要変数を出力する。

　上記の選択のために、例えば、情報処理装置は、各入力変数が出力変数に対して条件付き独立であるか否かを判定し、条件付き独立でないと判定した入力変数を重要変数として選択する。

　より具体的には、情報処理装置は、着目変数（例えば、出力変数、又は、後述するニューラルネットワークにおいては出力変数の１つ手前の隠れ層のノード）を目的変数とし、入力変数を説明変数とする因果モデルを構築する。

　情報処理装置は、構築した因果モデルに含まれる入力変数から重要変数を選択することで、条件付き独立でないと判定した入力変数を重要変数として選択する。

　これにより、情報処理装置は、因果、特に疑似相関を考慮して重要変数を選択することができ、予測結果の理由としてより適切な重要変数をユーザに提示することができるようになる。

　＜＜２．情報処理装置の構成例＞＞
　図１は、本開示の実施形態に係る情報処理装置１００の論理的な構成の一例を示すブロック図である。図１に示すように、本実施形態に係る情報処理装置１００は、入力部１１０、出力部１２０及び制御部１３０を含む。

　［入力部１１０］
　入力部１１０は、様々な情報の入力を受け付ける機能を有する。入力部１１０は、入力された情報を制御部１３０に出力する。

　入力部１１０は、分析対象となる予測モデルの入力を受け付ける。ここでの予測モデルは、機械学習によって生成される機械学習器であり、例えばニューラルネットワークやランダムフォレストなどが挙げられる。

　入力部１１０は、分析のための各種入力を受け付ける。例えば、入力部１１０は、後述する説明変数の組み合わせに含まれる説明変数の数ｎ等の入力を受け付ける。入力部１１０は、タッチパネル、キーボード又はマウス等の任意の入力装置を含んでいてもよく、かかる入力装置へのユーザ操作によりこれらの情報の入力を受け付ける。また、入力部１１０は、マイク等の音声入力部を含んでいてもよい。

　［出力部１２０］
　出力部１２０は、様々な情報の出力を行う機能を有する。出力部１２０は、制御部１３０による制御に基づいて、各種情報を出力する。出力部１２０は、表示装置を含み、例えば分析結果を示すＵＩ画面を出力してもよい。出力部１２０は、音声出力装置を含み、例えばユーザの音声入力を促すための音声を出力してもよい。出力部１２０は、任意の通信規格に準拠した通信装置を含み、例えば他の情報処理装置又は記憶装置に分析結果を示す情報を出力してもよい。出力部１２０は、印刷装置を含み、例えば分析結果を示すレポートを印刷してもよい。

　［制御部１３０］
　制御部１３０は、情報処理装置１００全体の動作を制御する機能を有する。図１に示すように、制御部１３０は、入出力制御部１３１、因果モデル推定部１３２、選択部１３３、評価部１３４、及び、介入効果算出部１３５を含む。制御部１３０は、これらの構成要素以外の構成要素を含んでいてもよい。

　（入出力制御部１３１）
　入出力制御部１３１は、入力部１１０及び出力部１２０と、制御部１３０に含まれる他の構成要素（因果モデル推定部１３２、選択部１３３、評価部１３４、及び、介入効果算出部１３５）とのインターフェースである。入出力制御部１３１は、入力部１１０により入力された情報を当該情報に対応する他の構成要素に出力し、他の構成要素から出力された情報を出力部１２０により出力させる。例えば、入出力制御部１３１は、入力部１１０により入力された予測モデルを因果モデル推定部１３２に出力する。また、入出力制御部１３１は、分析結果を示すＵＩ画面を生成して出力部１２０により出力させ、入力部１１０により入力された当該ＵＩ画面へのユーザ操作を示す情報を、当該ユーザ操作に対応する他の構成要素に出力する。

　（因果モデル推定部１３２）
　因果モデル推定部１３２は、入出力制御部１３１を介して取得した予測モデルに含まれる着目変数を目的変数とした因果モデルを生成する。

　予測モデルは、例えば記憶装置（図示省略）から取得してもよく、情報処理装置１００の記憶部（図示省略）から取得してもよい。あるいは、情報処理装置１００が予測モデルを生成するようにしてもよい。予測モデルは、例えば機械学習に基づいて生成される学習器である。予測モデルは、入力変数に対して所定の演算を行い、予測結果である出力変数を出力するものであればよい。予測モデルとして、例えば、ニューラルネットワークやランダムフォレストなどが挙げられるが、以下では、特に断りのない限り、情報処理装置１００が予測モデルとしてニューラルネットワークを取得したものとして説明する。

　ニューラルネットワークでは、入力変数群の情報を複雑に組み合わせることで、予測や識別、分類等の出力が行われる。ニューラルネットワークの隠れ層では、入力変数群の情報が様々に組み合わされて、パターンが形成されているが、このパターンが複雑であるため、出力変数がどのようにして決まったかユーザが理解することは難しい。

　そこで、本開示の技術では、出力層（出力変数）に最も近い隠れ層（以下、最近接層とも記載する）に着目し、情報処理装置１００は、このノード（以下、最近接ノードとも記載する）群がどのような入力変数群の組み合わせで構成されるかを示す情報をユーザに提示する。換言すると、情報処理装置１００は、出力層の１つ手前の最近接層に着目し、最近接ノードそれぞれを入力変数群で説明するための情報を生成する。

　そのために、まず、因果モデル推定部１３２は、最近接ノードそれぞれについて、学習により獲得した特徴量を説明するための因果モデルを推定する。かかる点について、図２及び図３を用いて説明する。

　図２は、本開示の実施形態に係る因果モデル推定部１３２が取得する予測モデルの一例を説明するための図である。

　図２に示すように、因果モデル推定部１３２は、予測モデルとして、入力層と、２つの隠れ層ＨＬ１、ＨＬ２と、出力層と、で構成されるニューラルネットワークを取得する。ここでは、ニューラルネットワークが入力変数群｛Ｘ_１、Ｘ_２、Ｘ_３、Ｘ_４｝に対して１つの出力変数Ｙを出力し、各隠れ層ＨＬ１、ＨＬ２が５つの隠れノードを有するものとする。また、最近接層である隠れ層ＨＬ２は、最近接ノードである隠れノードＬ_１～Ｌ_５を有するものとする。

　因果モデル推定部１３２は、予測モデルに含まれる着目変数（ここでは、最近接ノードＬ_１～Ｌ_５）を目的変数とし、入力変数群｛Ｘ_１、Ｘ_２、Ｘ_３、Ｘ_４、・・・｝を説明変数とする因果モデルを、着目変数ごとに推定する。

　例えば、因果モデル推定部１３２は、Ｍ個の最近接ノードＬ_ｍ（図２ではｍ＝１～５）それぞれに対してＮ個の入力変数Ｘ_ｎ（図２ではｎ＝１～４）で因果モデルを推定する。つまり、因果モデル推定部１３２は、Ｍ個の因果モデルを生成する。

　因果モデル推定部１３２は、最近接ノードＬ_ｍ及び各入力変数Ｘ_ｎの因果関係の指標である因果情報を計算することで、各変数間の因果関係の有無及び強さを検出する。因果情報は、例えば２変数間の因果関係を示す統計量である。因果モデル推定部１３２は、独立成分分析による方法、罰則付き最尤法若しくはベイズ法による推定結果をスコアとしてこれを最大化する方法、又は変数間の条件付き独立性の統計的検定によって推定する方法などにより、２変数間の因果関係の有無及び強さを検出する。因果モデル推定部１３２は、例えばニューラルネットワークの生成に使用した学習データ等を用いて因果情報を算出する。

　図３は、本開示の実施形態に係る因果モデル推定部１３２が推定する因果モデルの一例を説明するための図である。

　図３では、因果モデル推定部１３２が推定した因果モデルを、複数の変数間における因果関係を示した因果情報、いわゆる因果グラフとして示している。図３に示すように、因果グラフは、目的変数である隠れノードＬ_１～Ｌ_５ごとに推定される。図３では、隠れノードＬ_１、Ｌ_５、説明変数であるＸ_ｎについて、変換の因果の向きを矢印（原因→結果）で示している。すなわち、図３に示す因果グラフは、有向グラフである。また、図３に示す因果情報は、言い換えれば、確率・統計的な原因及び結果の変数を矢印でつないだ確率分布を伴うグラフィカルモデルの情報である。

　なお、図３に示す因果グラフは、因果情報の一例であり、因果情報は、変数間の因果関係を一覧にした情報であってもよく、複数の変数間における因果関係が把握できる情報であればよい。

　因果モデル推定部１３２が推定する因果モデルに含まれる入力変数のうち、目的変数である隠れノードＬ_ｍへ到達するまでのパス（矢印の数）が少なく、隠れノードＬ_ｍとの距離が近い入力変数ほど、目的変数との因果関係が強い。隠れノードＬ_ｍと直接グラフ上で繋がった変数は、Ｌ_ｍに対して間接的な原因ではなく直接的な影響を与える原因の変数であるため、重要変数として優先的に抽出されるようにしてもよい。

　例えば、図３に示す隠れノードＬ_１の因果モデルでは、入力変数Ｘ_１０から隠れノードＬ_１へと向かう矢印がなく、入力変数Ｘ_１０は、隠れノードＬ_１に対して因果関係がなく、条件付き独立の関係にあることがわかり、疑似相関の関係にあることがわかる。なお、入力変数Ｘ_１０の、従来の方法により算出した寄与度や相関は、大きくなることがあるため、従来の方法のように寄与度や相関の大きさから疑似相関を判断することは困難である。また、入力変数Ｘ_３は、隠れノードＬ_１と１つの矢印で接続される。すなわち、入力変数Ｘ_３は、隠れノードＬ_１に直接接続している。一方、入力変数Ｘ_１は、隠れノードＬ_１と入力変数Ｘ_４を介して２つの矢印で接続される。すなわち、入力変数Ｘ_１は、隠れノードＬ_１と直接接続していない。このことは、入力変数Ｘ_３の方が入力変数Ｘ_１より隠れノードＬ_１との直接的な因果関係が強いことを示している。そこで、例えば、情報処理装置１００は、入力変数Ｘ_１を抽出せず、入力変数Ｘ_３を重要変数として優先的に抽出することができる。これによって、後述するように、冗長な説明変数を排除して重要変数同士の組み合わせ数を絞り計算効率をあげることや、似たような説明変数の種類を減らして予測の理由づけをユーザに分かりやすく提示することが可能になる。

　なお、因果モデル推定部１３２が推定する因果モデルには、隠れノードＬ_ｍと因果関係にある入力変数が含まれるようにしてもよい。換言すると、隠れノードＬ_ｍに対して条件付き独立でない入力変数が、因果モデルに含まれ、条件付き独立である入力変数は因果モデルには含まれない。このように、因果モデル推定部１３２は、疑似相関のない入力変数で、隠れノードＬ_ｍの因果モデルを生成し得る。

　（選択部１３３）
　図１に戻る。選択部１３３は、因果モデル推定部１３２が推定した因果モデルに基づき、入力変数の中から隠れノードＬｍを説明するための変数を選択する。かかる変数は、隠れノードＬｍにおける演算結果に対する貢献度が高く、演算結果に寄与する変数であると言える。そのため、かかる変数を、重要変数とも記載する。

　選択部１３３は、各隠れノードＬ_ｍの因果モデルから、隠れノードＬ_ｍに因果モデルのネットワークで直接つながっている因子（入力変数）群｛Ｘ_ｍｊ｝を抽出する。Ｘ_ｍｊは、式（１）に示すように、変数群ＤＩ（Ｌ_ｍ）の部分集合であり、隠れノードＬ_ｍの因果モデルに属する入力変数Ｘ_ｊを示している。

　なお、選択部１３３は、隠れノードＬｍに直接つながる全ての因子を重要変数として選択してもよく、一部の因子を選択するようにしてもよい。例えば、選択部１３３は、隠れノードＬｍに直接つながる因子群（重要変数候補）｛Ｘ_ｍｊ｝の数がしきい値ＴＨ１以下であれば、全ての因子群を重要変数として選択する。一方、因子群｛Ｘ_ｍｊ｝の数がしきい値ＴＨ１より多ければ、選択部１３３は、重要変数候補と、目的変数との関係性の強さに応じて、重要変数候補の中からＳ個の入力変数を重要変数として選択する。

　あるいは、選択部１３３は、因子群｛Ｘ_ｍｊ｝のうちのＰ個の入力変数の組み合わせ候補と、目的変数との関係性の強さに応じてＰ個の入力変数の組み合わせをＳ個選択するようにしてもよい。選択部１３３は、Ｐ個の入力変数及び目的変数の関係性の強さを示す第１の情報を計算し、第１の情報が大きいＳ個の組み合わせに含まれる各入力変数を重要変数として選択する。

　第１の情報は、重要変数候補の組み合わせと、目的変数との関係性の強さを示す指標である。第１の情報は、エントロピー、相互情報量、相関係数、偏相関係数、検定のp値、その他の独立性、若しくは条件付き独立性の統計的尺度、又はそれらの組み合わせに基づいて計算される、関係性の強さを示す値である。かかる値により、結合効果が定量化される。かかる値が大きいことは結合効果が大きいことを意味し、小さいことは結合効果が小さいことを意味する。

　ここで、複数の入力変数が、入力変数単体での影響とは異なる影響を、ひとつのある着目変数に与え得る。ある着目変数とは、分析対象として着目される変数であり、ここでは隠れノードＬ_ｍを指す。このような効果を、結合効果と称する。

　以下では、第１の情報を、結合効果の第１の指標Ｊとも称する。目的変数（着目変数）をＬ、重要変数候補をＸ_ｎ１、Ｘ_ｎ２（換言するとＰ＝２）とすると、Ｘ_ｎ１、Ｘ_ｎ２及びＬにおける第１の指標Ｊは、式（３）のように計算され得る。

　　Ｊ＝Ｈ（Ｌ｜Ｘ_ｎ１）－Ｈ（Ｌ｜Ｘ_ｎ１，Ｘ_ｎ２）
　　　＝Ｉ（Ｌ；Ｘ_ｎ２｜Ｘ_ｎ１）　　　　　　　…（３）

　ここで、Ｈは情報理論における情報エントロピーであり、Ｉは情報エントロピーを基礎として定義される相互情報量である。上記数式（３）におけるＨ（Ｌ｜Ｘ_ｎ１）は、Ｘ_ｎ１を条件とするＬの条件付き情報エントロピーであり、Ｈ（Ｌ｜Ｘ_ｎ１，Ｘ_ｎ２）は、同様にＸ_ｎ１とＸ_ｎ２を条件とするＬの条件付き情報エントロピーである。また、Ｉ（Ｌ；Ｘ_ｎ２｜Ｘ_ｎ１）は、Ｘ_ｎ１を条件とするＬとＸ_ｎ２の相互情報量であり、上記数式（３）は恒等的に成立する（以下では情報エントロピーを単にエントロピーと記す）。上記数式（３）によれば、結合効果の第１の指標Ｊは、着目変数Ｌと説明変数Ｘ_ｎ１との２変数間の相関値と比較して、新たに加わった説明変数Ｘ_ｎ２によってどれだけ情報量が増えたかを示す指標である。上記数式（３）に示すように、２個の重要変数候補の組み合わせの場合、結合効果の第１の指標Ｊは条件付き相互情報量となっている。

　第１の指標Ｊは、式（４）のように計算されてもよい。

　　Ｊ＝Ｉ（Ｌ；Ｘ_ｎ２｜Ｘ_ｎ１）－Ｉ（Ｌ；Ｘ_ｎ２）　　…（４）

　上記数式（４）によれば、結合効果の第１の指標Ｊは、上記数式（３）に示した値から、着目変数Ｌと新たに加わった説明変数Ｘ_ｎ２との２変数間の相関量が減算された値である。

　第１の情報は、第１の指標Ｊの代わりに第２の指標ＡＣＭＩ（Averaged　conditional　mutual　information）として、式（５）～式（７）のように計算されてもよい。

　上述したように、Ｉ（Ｌ；Ｘ_ｎ２｜Ｘ_ｎ１）は、Ｘ_ｎ１を条件とするＬとＸ_ｎ２の相互情報量である。また、Ｉ（Ｌ；Ｘ_ｎ１｜Ｘ_ｎ２）は、Ｘ_ｎ２を条件とするＬとＸ_ｎ１の相互情報量である。第２の指標ＡＣＭＩは、これら条件付き相互情報量の平均値である。

　なお、第２の指標ＡＣＭＩは、着目変数Ｌに対する重要変数候補Ｘ_ｎ１、Ｘ_ｎ２の平均的な寄与を示している。インスタンスごとの寄与は、式（８）に示す第３の指標ＣＥで表され得る。

　３個の重要変数候補Ｘ_ｎ１、Ｘ_ｎ２、Ｘ_ｎ３の組み合わせ、及び、目的変数Ｌにおける結合効果の第２の指標ＡＣＭＩは、式（９）～式（１２）のように計算され得る。

　選択部１３３は、算出した第１の情報（例えば第２の指標ＡＣＭＩ）が大きい順に、Ｓ個の組み合わせに含まれる重要変数候補を、重要変数として選択する。

　なお、選択部１３３は、上述したように、隠れノードＬ_ｍに因果モデルのネットワークで直接つながっている因子（入力変数）群｛Ｘ_ｍｊ｝を重要変数候補として第１の情報を算出する。

　これは、式（１３）で表されるエントロピーの性質、及び、因果モデル（グラフィカルモデル）の条件付き独立という特性に基づくものである。すなわち、隠れノードＬ_ｍに因果モデルのネットワークで直接つながっていない因子群の組み合わせから算出される第１の情報が、因子群｛Ｘ_ｍｊ｝の組み合わせから算出される第１の情報より小さくなることが明らかであるためである。

　そのため、情報処理装置１００は、隠れノードＬ_ｍに因果モデルのネットワークで直接つながっている因子（入力変数）群｛Ｘ_ｍｊ｝を重要変数候補として第１の情報を算出すればよく、第１の情報を算出する変数の数を低減することができる。

　（評価部１３４）
　評価部１３４は、選択部１３３が選択した重要変数が目的変数（着目変数）に与える影響度を評価する。着目変数が隠れノードＬ_ｍの場合、評価部１３４は、隠れノードＬ_ｍに与える重要変数の影響度を算出し得る。あるいは、評価部１３４は、隠れノードＬ_ｍと直接接続する出力変数Ｙに与える重要変数の影響度を算出し得る。かかる影響度は、着目変数と重要変数との関係性の強さを示す強度情報の一例である。

　隠れノードＬ_ｍに直接つながっている因子群｛Ｘ_ｍｊ｝を数値変数として扱うとすると、隠れノードＬ_ｍは、偏相関を考慮した因果的回帰式（構造式）として式（１４）に示すように表現され得る。

　なお、α_ｍｊは、回帰係数として計算される。また、β_ｍは、隠れノードＬ_ｍにおける定数である。

　あるいは、因子群｛Ｘ_ｍｊ｝をカテゴリ変数として扱うとすると、隠れノードＬ_ｍは、条件付き確率分布として式（１５）に示すように表現され得る。なお、ω_ｍｌ_ｍは、ニューロンの重みを表している。

　なお、出力変数Ｙは、式（１６）、式（１７）に基づいて算出される。なお、フィルター関数は内部に含まれるものとする。また、ここでは因子群｛Ｘ_ｍｊ｝を数値変数としている。

　重要変数Ｘ_ｊの影響度は、重要変数Ｘ_ｊに対する重みとして算出され得る。重要変数Ｘ_ｊに対する重みは、以下の式（１８）に示すように表現され得る。なお、上述したように、α_ｍｊは、回帰係数として計算される。

　ここで、評価部１３４は、複合的な影響度を算出し得る。複合的な影響度は、上述した結合効果に相当する。例えば、評価部１３４は、以下の式（１９）に基づいて重要変数Ｘ_ｎ１、Ｘ_ｎ２の複合的な影響度を算出する。

　ここで、ＣＥ（ｘ_ｎ１、ｘ_ｎ２）は、式（８）に示す第３の指標ＣＥであり、ｎ_ｍ（ｘ）は、ニューラルネットワークの隠れノードＬ_ｍの値であり、入力変数全体で決まる値である。また、ｎ_０は定数である。式（１９）では、図２に示すニューラルネットワーク、すなわちｍ＝１～５の場合を例に示している。

　なお、上述した影響度以外にも、評価部１３４は、重要変数と着目変数とが疑似相関でない根拠として、重要変数と着目変数との偏相関の度合いを評価するようにしてもよい。例えば、評価部１３４は、重要変数と着目変数の偏相関の度合いとして条件付き独立性検定のｐ値を算出することで偏相関を調べ得る。すなわち、評価部１３４は、上述した強度情報としてｐ値を算出し得る。

　あるいは、評価部１３４は、最近接ノード群それぞれの重要変数の条件付き確率をインスタンスごとに算出し得る。これは、例えば、出力（予測）結果に対する理由としてより、ニューラルネットワークそのものの分析結果としてユーザに提示され得る。かかる点については、適用例にて後述する。

　選択部１３３が選択した重要変数及び評価部１３４が算出した影響度は、例えば、入出力制御部１３１によって、ユーザに提示される。例えば、入出力制御部１３１は、選択した重要変数と影響度とを組み合わせてユーザに提示する。重要変数が複数ある場合、入出力制御部１３１は、例えば影響度の大きい順にリストとしてユーザに提示する。また、予測結果の理由として、複数の重要変数の組み合わせをユーザに提示する場合、入出力制御部１３１は、複数の重要変数の組み合わせと、当該組み合わせにおける複合的な影響度と、を対応付けてユーザに表示する。なお、具体的な提示例については、適用例にて後述する。

　（介入効果算出部１３５）
　介入効果算出部１３５は、選択部１３３が選択した重要変数に介入することで目的変数に生じる介入効果の計算を行う。ここでの目的変数は、最近接ノード群でもよく、出力変数でもよい。介入効果算出部１３５は、最近接ノード群及び出力変数の少なくとも一方の介入効果を計算し得る。

　介入効果算出部１３５は、重要変数の値を意図的に変化させる（重要変数に介入する）ことで、目的変数が受ける因果的な影響を計算する。

　入出力制御部１３１は、例えば、介入効果算出部１３５が算出した介入効果を、介入した重要変数と対応付けてユーザに提示する。入出力制御部１３１は、評価部１３４の評価結果とともに介入効果をユーザに提示する。あるいは、入出力制御部１３１が、ユーザからの指示に応じて介入効果をユーザに提示するようにしてもよい。この場合、例えば、入出力制御部１３１が提示した重要変数をユーザが選択することで、介入効果算出部１３５が選択した重要変数の介入効果を算出し、入出力制御部１３１が算出結果を提示する。

　なお、ここでは、情報処理装置１００の介入効果算出部１３５が重要変数の介入効果を算出するとしたが、これに限定されない。例えば、情報処理装置１００が、重要変数の選択及び当該重要変数の提示を行い、介入効果の算出を他の装置が行うようにしてもよい。このように、情報処理装置１００が介入効果の算出を行わない場合、図１に示す介入効果算出部１３５は省略され得る。

　＜＜３．分析処理＞＞
　図４は、本開示の実施形態に係る情報処理装置１００が実行する予測モデルの分析処理の流れを示すフローチャートである。

　図４に示すように、情報処理装置１００の因果モデル推定部１３２は、分析を行う予測モデルを取得する（ステップＳ１０１）。

　次に、因果モデル推定部１３２は、最近接ノード群の各ノードについて因果モデルを推定する（ステップＳ１０２）。

　選択部１３３は、因果モデル推定部１３２が推定した各因果モデルの着目変数に最も近接する、換言するとネットワークにおいて直接接続する入力変数から重要変数を選択する（ステップＳ１０３）。

　評価部１３４は、選択部１３３が選択した重要変数について、着目変数に対する当該重要変数の影響度を評価する（ステップＳ１０４）。このとき、評価部１３４は、複数の重要変数の組み合わせについて、着目変数に対する当該組み合わせによる複合的な影響度（結合効果）を評価し得る。

　入出力制御部１３１は、選択部１３３が選択した重要変数に関する情報を出力する（ステップＳ１０５）。このとき、入出力制御部１３１は、当該重要変数に関する情報に、評価部１３４が評価した影響度に関する情報、及び、重要変数に介入した場合の介入効果に関する情報を対応付けて出力してもよい。なお、介入効果は、介入効果算出部１３５によって算出される。

　＜＜４．適用例＞＞
　＜４．１．製造系データ分析システムへの適用例＞
　ある製品の製造工場では、多数の測定器及びセンサにより情報が取得されている。例えば、製造工場の外気温、室温及び湿度、装置が使われた際の状態を示す電圧、電流、電力及び振動波形など、様々な物理量が測定され、時刻と紐付けられて例えばデータベースに格納される。このように、多数の測定器及びセンサは、機器の動作環境又は動作状態に関する情報を取得する。

　また、製造工場での異常発生の有無は記憶されており、当該異常発生の有無を教師とし、取得した情報を入力データとして製造工場での異常発生を予測する予測モデルが例えばニューラルネットワークとして構築されているものとする。データ分析システムにおいて、当該予測モデルによる異常発生の予測が行われている。従来のデータ分析システムでは、予測モデルによる予測結果を表示するに過ぎず、ユーザは予測結果の理由を知ることが難しい。

　そこで、データ分析システムに、提案技術に係る情報処理装置１００を適用することで、データ分析システムが、予測結果に対して予測の理由をユーザに提示できるようにする。

　まず、情報処理装置１００は、既に構築されている予測モデルに対して因果モデルを生成する。ここでは、異常発生の有無を示す出力変数に対して因果モデルを生成するものとする。

　図５は、本開示の実施形態の適用例に係る情報処理装置１００が推定する因果モデルの一例について説明するための図である。

　例えば、情報処理装置１００の因果モデル推定部１３２は、過去一日の最大電圧のレベルを示す測定量Ａと、装置Ａのリセットからの経過時間と、振動発生頻度を示す測定量Ｂの３つが、出力である異常発生の有無と直接的に因果関係があると推定する。

　ここで、測定量Ｂが異常発生有無に対して単独の原因となるものとする。なお、測定量Ａは単独では原因とならず、最大電圧レベルが３つのレベル（ｈｉｇｈ、ｍｉｄｄｌｅ、ｌｏｗ）のうち、ｈｉｇｈレベルにあり、かつリセットからの経過時間がＹＹ時間以上になる場合に限って異常が発生するものとする。

　また、測定量Ａ、Ｂは湿度に依存して変化する。なお、工場内では、湿度の影響を取り除く措置がとられておらず、データ分析システムは、湿度の影響を受ける測定量Ｃ、Ｄに関する情報も取得するが、測定量Ｃ、Ｄは、出力（異常発生の有無）に対して影響を与えないものとする。

　また、データ分析システムは、測定量Ｆと、測定量Ｆ及び測定量Ａの影響を受けて変動する測定量Ｅに関する情報を取得する。

　図５に示すように、因果モデル推定部１３２が、予測モデルの因果関係を推定すると、異常発生の有無に対して単独の原因となる測定量Ａ、Ｂ、装置Ａのリセットからの経過時間に加え、湿度や測定量Ｃ、Ｄ、Ｅについても、出力に対して相関があると推定する。

　そのため、例えば、相関関係に基づいて予測結果の理由を出力するシステムでは、異常発生の有無に対して因果関係の低い湿度や測定量Ｃ、Ｄ、Ｅを出力結果に対する理由として提示する恐れがある。

　例えば、ユーザが、提示された情報に基づいて湿度や測定量Ｃ、Ｄ、Ｅに対して介入を行ったとしても、介入の効果が得られない恐れがある。あるいは、ユーザが介入を行わなくても、提示された情報が異常発生の原因であるという誤った知識を蓄積してしまう恐れがあり、ユーザによる製造工程の把握を阻害してしまう恐れがある。

　一方、提案技術では、情報処理装置１００は、目的変数（ここでは出力）に対して、真に近いと推定した原因（入力変数）を用いて理由をユーザに提示する。そのため、情報処理装置１００は、より適切な入力変数を理由として提示することができる。これにより、情報処理装置１００は、介入効果のより高い理由をユーザに提示することができ、ユーザによる誤った知識の蓄積を抑制することができる。

　また、提案技術では、情報処理装置１００は、複数の入力変数を組み合わせて、目的変数に対する理由（複合的な効果）としてユーザに提示することができる。情報処理装置１００は、入力変数単独の効果を加算して、複数の入力変数の効果を算出するのではなく、組み合わせによる結合状態に応じて効果（結合効果）を算出する。そのため、情報処理装置１００は、予測結果に対する理由としてより適切な入力変数の組み合わせをユーザに提示することができる。

　以下、図６～図８を用いて、本開示の実施形態の適用例に係るデータ分析システムによる分析処理の一例を説明する。

　なお、予測結果に対する理由は、予測結果と同時にユーザに提示することができる。そこで、ここでは、データ分析システムが予測結果を提示すると同時に、例えばポップアップ等を用いて情報処理装置１００が、当該予測に対する理由をユーザに提示するものとする。

　なお、予測モデルによる予測は、例えばデータ分析システムに含まれる予測装置（図示省略）によって行われ、予測結果は、当該予測装置によって表示装置（図示省略）に表示されてもよい。このとき、情報処理装置１００は、予測結果の理由として選択した入力変数に関する情報を、ユーザが予測結果及び当該理由の両方を確認できるように提示することができる。

　上述したように、情報処理装置１００が理由として提示する入力変数は、複数であってもよい。このとき、情報処理装置１００は、あらかじめ決められた数の入力変数を組み合わせて結合効果を算出してもよく、ユーザから組み合わせる入力変数の数を受け付けてもよい。

　図６は、本開示の実施形態の適用例に係る情報処理装置１００により出力されるＵＩ画面の一例を示す図である。

　情報処理装置１００は、例えば、図６に示すＵＩ画面を表示することで、組み合わせる入力変数の数の候補をユーザに提示する。図６では、ユーザが選択し得る変数の数を１変数から３変数としているが、組み合わせとして選択し得る変数の数は４以上であってもよい。

　例えば、ユーザは、ＵＩ画面の該当箇所をクリックすることで、組み合わせる入力変数の数を選択する。このように、情報処理装置１００は、入力変数の組み合わせを決定するためのＵＩ画面（インターフェース）を出力し、ユーザはＵＩ画面（インターフェース）に対応する操作を行う。情報処理装置１００は、当該操作に基づき、ユーザが選択した数の入力変数の組み合わせを決定する。情報処理装置１００は、決定した組み合わせに対する理由の表示を選択し、当該組み合わせの影響度を算出する。情報処理装置１００は、選択した入力変数の組み合わせと影響度とを組み合わせて、予測結果とともにユーザに提示する。

　まず、ユーザが１変数を選択した場合について説明する。

　情報処理装置１００は、例えば、推定した因果モデル（図５参照）において、出力変数である異常発生有無に直接接続する３つの入力変数（過去一日の最大電圧のレベルを示す測定量Ａと、装置Ａのリセットからの経過時間と、振動発生頻度を示す測定量Ｂ）を重要変数として選択し、影響度を算出する。

　情報処理装置１００は、重要変数に関する情報と、算出した影響度と、を対応付けてユーザに提示する。

　図７は、本開示の実施形態の適用例に係る情報処理装置１００により出力されるＵＩ画面の一例を示す図である。図７では、ユーザが１変数を選択した場合に、情報処理装置１００が出力するＵＩ画面の一例を示している。なお、図７で示す重要度は、上述した影響度に相当する。

　情報処理装置１００は、例えば重要度が大きい順にソートして重要変数に関する情報をユーザに提示する。図７の例では、情報処理装置１００は、重要度が一番大きい「０．２１」である測定量Ａを「最大電圧のレベル」とし、重要度が二番目に大きい「０．１６」である測定量Ｂを「振動発生頻度」として表示する。また、情報処理装置１００は、重要度が三番目に大きい「０．１４」である装置Ａのリセットからの経過時間を「リセットからの経過時間」として表示する。

　このように、情報処理装置１００が、重要変数と重要度とを対応付けて、重要度の大きい順に一覧にして表示することで、予測結果の理由をわかりやすくユーザに提示することができる。このとき、情報処理装置１００は、出力変数との因果関係の強さを、重要度のような定量的指標を用いてユーザに提示することで、より説得力のある理由をユーザに提示することができる。

　なお、図７に示すように、情報処理装置１００は、重要度の大きさ（絶対値）に応じて、表の背景色を変更して一覧を表示するようにしてもよい。例えば、情報処理装置１００は、重要度が大きい程、濃い背景色を選択して一覧を表示する。このように、情報処理装置１００が重要度に対応する表示画面上の順序及び色を決定することで、ユーザがより容易に重要変数の重要度を認識できるようになる。なお、これは、後述する図８及び図９でも同様である。

　まず、ユーザが２変数を選択した場合について説明する。

　情報処理装置１００は、例えば、推定した因果モデル（図５参照）において、出力変数である異常発生有無に直接接続する３つの入力変数（過去一日の最大電圧のレベルを示す測定量Ａと、装置Ａのリセットからの経過時間と、振動発生頻度を示す測定量Ｂ）から２つを選んだ組み合わせを重要変数の組み合わせとして選択する。

　情報処理装置１００は、選択した重要変数の組み合わせによる複合的な影響度を算出する。情報処理装置１００は、重要変数の組み合わせに関する情報と、算出した複合的な影響度と、を対応付けてユーザに提示する。

　図８は、本開示の実施形態の適用例に係る情報処理装置１００により出力されるＵＩ画面の一例を示す図である。図８では、ユーザが２変数を選択した場合に、情報処理装置１００が出力するＵＩ画面の一例を示している。なお、図８で示す重要度は、上述した複合的な影響度に相当する。

　情報処理装置１００は、例えば重要度が大きい順にソートして重要変数に関する情報をユーザに提示する。図８の例では、測定量Ａ、Ｂの組み合わせの重要度が一番大きく「０．７３」であるため、情報処理装置１００は、測定量Ａ、Ｂの組み合わせに関する情報「最大電圧レベル」及び「振動発生頻度」を予測結果の理由とし、重要度と対応付けて表示する。

　また、測定量Ａ及び装置Ａのリセットからの経過時間の組み合わせの重要度が二番目に大きい「０．０４」である。そこで、情報処理装置１００は、測定量Ａ及び装置Ａのリセットからの経過時間の組み合わせに関する情報「最大電圧レベル」及び「リセットからの経過時間」を予測結果の理由とし、重要度と対応付けて表示する。

　また、測定量Ｂ及び装置Ａのリセットからの経過時間の組み合わせの重要度が三番目に大きい「０．０１」である。そこで、情報処理装置１００は、測定量Ｂ及び装置Ａのリセットからの経過時間の組み合わせに関する情報「振動発生頻度」及び「リセットからの経過時間」を予測結果の理由とし、重要度と対応付けて表示する。

　このとき、情報処理装置１００は、１変数の場合の重要度を単に加算して複合的な重要度を算出するのではなく、疑似相関を考慮して複合的な重要度を算出する。そのため、情報処理装置１００は、理由として２変数を組み合わせる場合でもより適切な重要度をユーザに提示することができる。

　なお、ここでは、出力変数と因果グラフにおいて直接接続する入力変数の数が３つであるとし、情報処理装置１００が３つの入力変数全てを重要変数として選択するとしたが、これに限定されない。例えば、目的変数と因果グラフにおいて直接接続する入力変数の数が多い場合、情報処理装置１００は、上述した第１の情報等を用いて重要変数として選択する入力変数の数や、重要変数の組み合わせとして選択する入力変数の数を限定するようにしてもよい。

　また、上述した例では、情報処理装置１００が、固定数の変数の組み合わせを理由としてユーザに提示する場合について説明したが、これに限定されない。例えば、統一的な指標として相対的な比較を行える複合的な影響度を新たに定義することで、情報処理装置１００が、異なる個数の変数を組み合わせた場合の複合的な影響度を相対的に比較し得る。これにより、情報処理装置１００は、異なる個数の変数の組み合わせを理由としてユーザに提示できるようになる。

　例えば、情報処理装置１００は、組み合わせる変数の数によらない統一的な第１の情報として、式（８）の第３の指標ＣＥに変えて、第４の指標ＣＥ_ｐとして、以下の式（２０）～式（２２）を算出する。なお、ｐは、組み合わせに含まれる変数の個数を、ｌは、目的変数のインスタンス、ｘ_ｎ１～ｘ_ｎ３は、組み合わせに含まれる入力変数のインスタンスのカテゴリ値を表している。

　また、この場合、情報処理装置１００は、組み合わせる変数の数によらない統一的な第１の情報として、式（７）の第２の指標ＡＮＣＩに変えて、第５の指標ＡＮＣＩ_ｐとして、以下の式（２３）～式（２５）を算出し得る。

　なお、ｐは、組み合わせに含まれる変数の個数を、Ｌは、目的変数、Ｘ_ｎ１～Ｘ_ｎ３は、組み合わせに含まれる入力変数を表している。

　なお、ここでは、組み合わせる変数の数ＰがＰ＝１～３個の場合の第４の指標ＣＥ_ｐ及び第５の指標ＡＮＣＩ_ｐの一例を示しているが、組み合わせる変数の数は１～３個に限定されず、４個以上であってもよい。

　このように、情報処理装置１００が、組み合わせる変数によらない統一的な指標を用いることで、所定数以下の変数の組み合わせを理由としてユーザに提示できるようになる。

　この点について、上記データ分析システムの例で説明する。ここでは、情報処理装置１００が３個以下の入力変数の組み合わせを理由として提示する場合について説明する。なお、組み合わせる入力変数の最大値は、ユーザが指定してもよく、情報処理装置１００が決定してもよい。

　情報処理装置１００は、例えば、推定した因果モデル（図５参照）において、出力変数である異常発生有無に直接接続する３つの入力変数（過去一日の最大電圧のレベルを示す測定量Ａと、装置Ａのリセットからの経過時間と、振動発生頻度を示す測定量Ｂ）から１～３つを選択し、選択した入力変数の組み合わせを重要変数の組み合わせとする。

　情報処理装置１００は、上記式（２０）～式（２２）を用いて選択した重要変数の組み合わせによる複合的な影響度を算出する。情報処理装置１００は、重要変数の組み合わせに関する情報と、算出した複合的な影響度と、を対応付けてユーザに提示する。

　図９は、本開示の実施形態の適用例に係る情報処理装置１００により出力されるＵＩ画面の一例を示す図である。図９では、３個以下の変数を組み合わせた場合に、情報処理装置１００が出力するＵＩ画面の一例を示している。なお、図９で示す重要度は、上述した複合的な影響度に相当する。

　情報処理装置１００は、例えば重要度が大きい順にソートして重要変数に関する情報をユーザに提示する。図９の例では、測定量Ａ、Ｂの組み合わせの重要度が一番大きく「０．７３」であるため、情報処理装置１００は、測定量Ａ、Ｂの組み合わせに関する情報「最大電圧レベル」及び「振動発生頻度」を予測結果の理由とし、重要度と対応付けて表示する。また、情報処理装置１００は、組み合わせに含まれる重要変数の数をセット数としてユーザに提示する。

　また、測定量Ａの重要度が二番目に大きい「０．２１」である。そこで、情報処理装置１００は、測定量Ａに関する情報「最大電圧レベル」を予測結果の理由とし、組み合わせに含まれる重要変数の数（セット数）「１」及び重要度「０．２１」と対応付けて表示する。

　図９に示すように、測定量Ａ、Ｂ及び装置Ａのリセットからの経過時間の組み合わせの重要度は、「０．０１」である。そこで、情報処理装置１００は、測定量Ａ、Ｂ及び装置Ａのリセットからの経過時間の組み合わせに関する情報「最大電圧レベル」、「振動発生頻度」及び「リセットからの経過時間」を予測結果の理由とし、セット数「３」及び重要度と対応付けて表示する。

　このように、情報処理装置１００は、組み合わせに含まれる重要変数の数によらず統一的に比較が可能な指標を第１の情報とすることで、異なる個数の重要変数を含む組み合わせを理由としてユーザに提示することができる。

　なお、組み合わせに含める重要変数の数を可変とすると、重要度（影響度）を算出する組み合わせの数が増え、情報処理装置１００の処理負荷が増加してしまう恐れがある。その場合、情報処理装置１００は、上述した式（２３）～（２５）に基づいて、組み合わせる重要変数の数を選択することで、処理負荷の増加を抑制することができる。

　上述したように、本開示の実施形態に係る情報処理装置１００は、介入効果算出部１３５（図１参照）を備え、介入効果を算出する機能を有する。

　そのため、例えば、ユーザが提示された理由の１つを一覧から選択することで、情報処理装置１００が、選択した理由に含まれる入力変数に介入した場合の効果を算出し、ユーザに提示するようにしてもよい。この場合、例えば、ユーザが選択した入力変数に対する具体的な介入パターンを指示できるようにしてもよい。

　例えば、上述したデータ分析システムにおいて、予測結果の理由として、装置Ａのリセットからの経過時間が挙げられたものとする。これにより、ユーザは、装置Ａをリセットしてからの経過時間が長いため、異常が発生する可能性が高いと予測されたと理解し得る。そこで、ユーザは、当該経過時間に介入することで、どのくらいの介入効果が得られるか、情報処理装置１００の介入効果を算出する機能を用いて知ることができる。このとき、ユーザは、例えば、装置Ａをリセットする時間間隔を１５分短くすることで、どれくらいの介入効果、すなわち異常発生確率が減少するかを、情報処理装置１００に算出させることができる。

　このように、情報処理装置１００が、予測結果の理由をユーザに提示することで、ユーザが具体的な介入パターンを検討することができる。また、情報処理装置１００が、ユーザが検討した介入パターンの効果を算出することで、ユーザは、介入効果と、介入の実行にかかるコストとの兼ね合いを検討して、介入を実行するか否かを判定することができる。

　＜４．２．再犯判断システムへの適用例＞
　例えば、ある人物のデータに基づき、当該人物が再犯を行うか否かを判定する再犯判断システムに、提案技術を適用する場合について説明する。

　再犯判断システムでは、例えば、人物の年齢、経歴（例えば、犯罪歴（数）、及び、勾留期間など）を入力として、当該人物が再犯を行うか否かを判定する。

　図１０は、再犯判断システムの予測モデルの因果関係を説明するための図である。ある人物が犯罪の再犯を起こすか否かは、図１０に示すような因果関係を有する可能性がある。

　図１０に示すように、再犯するかどうか（以下、再犯有無とも記載する）に対して、年齢と再犯有無とは負の相関関係にあると考えられる。すなわち、年齢が高いほど再犯の可能性が低く、年齢が低いほど再犯の可能性が高いと考えられる。

　また、犯罪履歴（犯罪数）と再犯有無とは正の相関関係にあると考えられる。すなわち、犯罪履歴が多いほど、再犯の可能性が高いと考えられる。

　犯罪履歴と年齢とは正の相関関係にあると考えられる。すなわち、年齢が高いほど、犯罪履歴が多くなると考えられる。

　そのため、年齢は、交絡と呼ばれる役割となっており、バイアスを発生させている。そのため、再犯の有無と犯罪履歴とは、疑似相関の関係にある可能性があるため、再犯の有無と犯罪履歴との相関関係は、年齢の影響を取り除いて推定することが望ましい。この年齢の影響は、偏相関の大きさ、あるいは条件付き相互情報量で表現される。例えば、偏相関係数がゼロとみなせるのか統計的検定のｐ値を用いて指標とすることで、情報処理装置１００は、疑似相関を排除した因果モデルを生成し得る。すなわち、情報処理装置１００は、出力変数に対して、偏相関係数がゼロでない、あるいは、条件付き独立でない入力変数を、出力変数と因果関係にある入力変数として因果モデルを生成する。

　ここで、上述した再犯判断システムが有する予測モデルが、最近接ノード群を５つ（Ｌ_１～Ｌ_５）とするニューラルネットワークとして構築されているものとする。

　情報処理装置１００は、当該予測モデルの最近接ノードＬ_１～Ｌ_５のそれぞれについて因果モデルを推定する。情報処理装置１００は、年齢、犯罪履歴（数）、勾留期間などと、各最近接ノードＬ_１～Ｌ_５とが紐付いた因果モデルを推定する。

　情報処理装置１００は、推定した因果モデルに基づき、再犯の予測結果とともに理由を提示する。

　また、情報処理装置１００が、最近接ノードの因果モデルを用いて理由を推定する場合に、最近接ノードＬ_１～Ｌ_５のレベルの確率を算出し、ユーザに提示するようにしてもよい。

　図１１は、本開示の実施形態に係る情報処理装置１００が算出する最近接ノードＬ_１のレベルの条件付き確率を示す図表である。

　図１１では、情報処理装置１００は、犯罪履歴を、３件をしきい値として２つに分け、年齢を、２７歳と３７歳とをしきい値として３つに分けて条件付き確率を算出している。また、情報処理装置１００は、Ｌ_１のレベルを、０．３７と１．５７８とをしきい値として３つのレベル（ｈｉｇｈ、ｍｉｄｄｌｅ、ｌｏｗ）に分けて条件付き確率を算出している。

　例えば、再犯判断システムが、ある人物（インスタンス）で、再犯の有無の可能性を予測モデルで予測するとする。予測する人物の犯罪履歴が５件であった場合、犯罪履歴が３件以上で、最近接ノードＬ_１がｈｉｇｈレベルとなる確率の平均は、３０．４％となる。この確率は、年齢によって３．９％から３９．７％までの分布をとり、年齢によって確率に差がでる。予測する人物の年齢が６１歳であった場合、最近接ノードＬ_１がｈｉｇｈレベルとなる確率は３９．７％となる。一方、年齢だけに着目すると、６１歳で最近接ノードＬ_１がｈｉｇｈレベルとなる確率の平均は、１３％となる。このように、年齢だけに着目すると最近接ノードＬ_１がｈｉｇｈレベルとなる確率は、再犯履歴を考慮した場合と比較して大きく低下してしまう。

　このように、複数の入力変数が複合的に目的変数（ここでは最近接ノード）に影響を与える。情報処理装置１００は、これら複数の入力変数を目的変数に影響を与える理由としてユーザに提示することができる。

　特に、入力変数と目的変数との間に非線形関係がある場合や、特定の入力変数の組み合わせが目的変数に大きな影響を与える場合などにおいて、情報処理装置１００が複合的な影響度を算出することで、より適切な理由をユーザに提示することができるようになる。

　上述したように、情報処理装置１００が最近接ノードＬ_１～Ｌ_５のレベルの確率を算出し、ユーザに提示することで、ユーザは、最近接ノードＬ_１～Ｌ_５に影響を与える入力変数を確認することができる。これにより、ユーザは、予測モデルの分析をより容易に行うことができるようになる。

　上述した犯罪履歴のように、入力変数には、出力変数に対して正の相関を有する、すなわち、最終的な予測結果の出力をサポートする正の理由となる変数が含まれ得る。また、上述した年齢のように、入力変数には、出力変数に対して負の相関を有する、すなわち、最終的な予測結果の出力をサポートする負の理由となる変数が含まれ得る。

　そこで、情報処理装置１００が、予測結果の理由として、正の理由となる重要変数と、負の理由となる重要変数と、を分けてユーザに提示するようにしてもよい。すなわち、情報処理装置１００が、出力変数（又は、目的変数）に対して正の相関を有する入力変数の組み合わせによる複合的な影響度と、負の相関を有する入力変数の組み合わせによる複合的な影響度と、をそれぞれ算出するようにしてもよい。

　より具体的に、例えば予測モデルが二値分類・識別を行うニューラルネットワークである場合、各ノード（ニューロン）の重みｗに正負の数値が与えられる。正の数値は、二値のうちの一方を、負の数値は他方を選ぶように、それぞれ発火して引き寄せるニューロンがあらかじめ学習により決定される。

　具体的な１回の予測に対して、各ニューロンは、出力を正の方向へ引き寄せるニューロンと、負の方向へ引き寄せるニューロンとに分けられる。そのため、情報処理装置１００は、正負それぞれに分けて理由の重み付けを算出し得る。例えば、最終出力Ｙが出力する二値を「１」、「０」とする。上記再犯判断システムの場合、例えば「再犯有」が「１」、「再犯無」が「０」にそれぞれ対応し得る。この場合、情報処理装置１００は、Ｙ＝１側に引く、すなわち、最終出力Ｙが１となる入力変数の重みを、式（２６）を用いて算出する。また、情報処理装置１００は、Ｙ＝０側に引く、すなわち、最終出力Ｙが０となる入力変数の重みを、式（２７）を用いて算出する。

　なお、式（２６）に示すＰｏｓは、正の重みｗを持つ最近接ノード（最終層ニューロン）の集合を表し、式（２７）に示すＮｅｇは、負の重みｗを持つ最近接ノードの集合を表す。情報処理装置１００は、正の方向へ引き寄せる理由の変数もしくはその組み合わせを評価するために式（２６）を用い得る。情報処理装置１００は、負の方向についても同様に式（２７）を用い得る。

　情報処理装置１００は、式（２８）に示すように、式（２６）、式（２７）の和を影響度ＥＰとして算出することで、重要変数又は重要変数の組み合わせの理由としての重みを定量化して評価し得る。

　影響度ＥＰは、正の値又は負の値として算出され得る。そのため、情報処理装置１００は、最終出力Ｙを正の方向に引き寄せる理由（重要変数）及び負の方向に引き寄せる理由（重要変数）のそれぞれをユーザに対して提示することができる。

　＜＜５．その他の実施形態＞＞
　上述した実施形態では、予測モデルがニューラルネットワークである場合について説明したが、これに限定されない。情報処理装置１００が理由付けを行う予測モデルは、ニューラルネットワーク以外の機械学習器であってもよい。

　例えば、予測モデルがランダムフォレストの場合、情報処理装置１００は、出力変数を説明する入力変数を探すために、出力変数の原因となる因果モデルを１つ推定する。すなわち、情報処理装置１００は、出力変数を目的変数として因果モデルを推定し、重要変数を選択する。なお、出力変数を目的変数とする以外、情報処理装置１００が行う処理は、図４に示す処理と同じである。

　このように、情報処理装置１００は、ニューラルネットワークに限らず、機械学習によって生成される予測モデルの予測結果に対する理由をユーザに提示することができる。

　また、上述した実施形態では、情報処理装置１００が、影響度の高い重要変数をユーザに提示するとしたが、これに限定されない。例えば、情報処理装置１００が、影響度の低い重要変数をユーザに提示するようにしてもよい。情報処理装置１００は、着目変数と疑似相関にある入力変数を着目変数に影響を与えない入力変数として出力する。あるいは、情報処理装置１００は、着目変数に対して条件付き独立である入力変数を出力するようにしてもよい。

　このように、情報処理装置１００が、着目変数に対して影響度の低い、例えば着目変数と疑似相関の関係にある入力変数をユーザに提示することで、ユーザは、予測結果に影響を与えない入力変数を知ることができる。

　＜＜６．ハードウェア構成例＞＞
　最後に、図１２を参照して、本実施形態に係る情報処理装置のハードウェア構成について説明する。図１２は、本実施形態に係る情報処理装置９００のハードウェア構成の一例を示すブロック図である。なお、図１２に示す情報処理装置９００は、例えば、図１に示した情報処理装置１００を実現し得る。本実施形態に係る情報処理装置１００による情報処理は、ソフトウェアと、以下に説明するハードウェアとの協働により実現される。

　図１２に示すように、情報処理装置９００は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）９０１、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）９０２、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）９０３及びホストバス９０４ａを備える。また、情報処理装置９００は、ブリッジ９０４、外部バス９０４ｂ、インターフェース９０５、入力装置９０６、出力装置９０７、ストレージ装置９０８、ドライブ９０９、接続ポート９１１及び通信装置９１３を備える。情報処理装置９００は、ＣＰＵ９０１に代えて、又はこれとともに、電気回路、ＤＳＰ若しくはＡＳＩＣ等の処理回路を有してもよい。

　ＣＰＵ９０１は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置９００内の動作全般を制御する。また、ＣＰＵ９０１は、マイクロプロセッサであってもよい。ＲＯＭ９０２は、ＣＰＵ９０１が使用するプログラムや演算パラメータ等を記憶する。ＲＡＭ９０３は、ＣＰＵ９０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。ＣＰＵ９０１は、例えば、図１に示す制御部１３０を形成し得る。

　ＣＰＵ９０１、ＲＯＭ９０２及びＲＡＭ９０３は、ＣＰＵバスなどを含むホストバス９０４ａにより相互に接続されている。ホストバス９０４ａは、ブリッジ９０４を介して、ＰＣＩ（Ｐｅｒｉｐｈｅｒａｌ　Ｃｏｍｐｏｎｅｎｔ　Ｉｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バスなどの外部バス９０４ｂに接続されている。なお、必ずしもホストバス９０４ａ、ブリッジ９０４および外部バス９０４ｂを分離構成する必要はなく、１つのバスにこれらの機能を実装してもよい。

　入力装置９０６は、例えば、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチ及びレバー等、ユーザによって情報が入力される装置によって実現される。また、入力装置９０６は、例えば、赤外線やその他の電波を利用したリモートコントロール装置であってもよいし、情報処理装置９００の操作に対応した携帯電話やＰＤＡ等の外部接続機器であってもよい。さらに、入力装置９０６は、例えば、上記の入力手段を用いてユーザにより入力された情報に基づいて入力信号を生成し、ＣＰＵ９０１に出力する入力制御回路などを含んでいてもよい。情報処理装置９００のユーザは、この入力装置９０６を操作することにより、情報処理装置９００に対して各種のデータを入力したり処理動作を指示したりすることができる。入力装置９０６は、例えば、図１に示す入力部１１０を形成し得る。

　出力装置９０７は、取得した情報をユーザに対して視覚的又は聴覚的に通知することが可能な装置で形成される。このような装置として、ＣＲＴディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、ＥＬディスプレイ装置、レーザープロジェクタ、ＬＥＤプロジェクタ及びランプ等の表示装置や、スピーカ及びヘッドホン等の音声出力装置や、プリンタ装置等がある。出力装置９０７は、例えば、情報処理装置９００が行った各種処理により得られた結果を出力する。具体的には、表示装置は、情報処理装置９００が行った各種処理により得られた結果を、テキスト、イメージ、表、グラフ等、様々な形式で視覚的に表示する。他方、音声出力装置は、再生された音声データや音響データ等からなるオーディオ信号をアナログ信号に変換して聴覚的に出力する。出力装置９０７は、例えば、図１に示す出力部１２０を形成し得る。

　ストレージ装置９０８は、情報処理装置９００の記憶部の一例として形成されたデータ格納用の装置である。ストレージ装置９０８は、例えば、ＨＤＤ等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等により実現される。ストレージ装置９０８は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。このストレージ装置９０８は、ＣＰＵ９０１が実行するプログラムや各種データ及び外部から取得した各種のデータ等を格納する。ストレージ装置９０８は、例えば、制御部１３０により作成されたレポートや、分析処理の途中結果及び最終的な結果等を記憶し得る。

　ドライブ９０９は、記憶媒体用リーダライタであり、情報処理装置９００に内蔵、あるいは外付けされる。ドライブ９０９は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体に記録されている情報を読み出して、ＲＡＭ９０３に出力する。また、ドライブ９０９は、リムーバブル記憶媒体に情報を書き込むこともできる。

　接続ポート９１１は、外部機器と接続されるインターフェースであって、例えばＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）などによりデータ伝送可能な外部機器との接続口である。

　通信装置９１３は、例えば、ネットワーク９２０に接続するための通信デバイス等で形成された通信インターフェースである。通信装置９１３は、例えば、有線若しくは無線ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＬＴＥ（Ｌｏｎｇ　Ｔｅｒｍ　Ｅｖｏｌｕｔｉｏｎ）、Ｂｌｕｅｔｏｏｔｈ（登録商標）又はＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信カード等である。また、通信装置９１３は、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ又は各種通信用のモデム等であってもよい。この通信装置９１３は、例えば、インターネットや他の通信機器との間で、例えばＴＣＰ／ＩＰ等の所定のプロトコルに則して信号等を送受信することができる。本実施形態では、通信装置９１３は、入力部１１０及び／又は出力部１２０として機能し、制御部１３０に入力される情報を受信したり、制御部１３０から出力される情報を送信したりし得る。

　なお、ネットワーク９２０は、ネットワーク９２０に接続されている装置から送信される情報の有線、または無線の伝送路である。例えば、ネットワーク９２０は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）などを含んでもよい。また、ネットワーク９２０は、ＩＰ－ＶＰＮ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ－Ｖｉｒｔｕａｌ　Ｐｒｉｖａｔｅ　Ｎｅｔｗｏｒｋ）などの専用回線網を含んでもよい。

　以上、本実施形態に係る情報処理装置９００の機能を実現可能なハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて実現されていてもよいし、各構成要素の機能に特化したハードウェアにより実現されていてもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜、利用するハードウェア構成を変更することが可能である。

　なお、上述のような本実施形態に係る情報処理装置９００の各機能を実現するためのコンピュータプログラムを作製し、ＰＣ等に実装することが可能である。また、このようなコンピュータプログラムが格納された、コンピュータで読み取り可能な記録媒体も提供することができる。記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリ等である。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信されてもよい。

　＜＜７．まとめ＞＞
　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　なお、本明細書において説明した各装置は、単独の装置として実現されてもよく、一部または全部が別々の装置として実現されても良い。例えば、図１に示した情報処理装置１００の機能構成例のうち、制御部１３０が、入力部１１０及び出力部１２０とネットワーク等で接続されたサーバ等の装置に備えられていても良い。

　また、本明細書においてフローチャート及びシーケンス図を用いて説明した処理は、必ずしも図示された順序で実行されなくてもよい。いくつかの処理ステップは、並列的に実行されてもよい。また、追加的な処理ステップが採用されてもよく、一部の処理ステップが省略されてもよい。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　機械学習を用いて生成された予測モデルであって、複数の入力変数を用いて予測結果を出力する前記予測モデルにおいて、前記入力変数と前記予測結果との疑似相関に基づき、複数の前記入力変数から、前記予測結果の理由となる前記入力変数を選択し、
　選択した前記入力変数に関する情報を出力する、制御部、
　を備える情報処理装置。
（２）
　前記制御部は、前記予測結果と疑似相関の関係にない前記入力変数を前記理由となる前記入力変数として選択する、（１）に記載の情報処理装置。
（３）
　前記制御部は、前記予測結果に対して条件付き独立にならない前記入力変数を前記理由となる前記入力変数として選択する、（１）又は（２）に記載の情報処理装置。
（４）
　前記制御部は、前記理由として選択した前記入力変数と、前記予測結果と、の関係性の強さを示す強度情報を、選択した前記入力変数と対応付けて出力する、（１）～（３）のいずれか１つに記載の情報処理装置。
（５）
　前記制御部は、前記予測結果の前記理由として、少なくとも２つの前記入力変数の組み合わせを選択する、（１）～（４）のいずれか１つに記載の情報処理装置。
（６）
　前記制御部は、前記組み合わせに含まれる少なくとも２つの前記入力変数と、前記予測結果と、の関係性の強さを示す強度情報を、前記組み合わせに関する情報と対応付けて出力する、（５）に記載の情報処理装置。
（７）
　前記制御部は、前記予測結果を示す出力変数を目的変数とし、複数の前記入力変数を説明変数として因果グラフを推定し、前記目的変数と直接因果関係にある前記説明変数から前記理由とする前記入力変数を選択する、（１）～（６）のいずれか１つに記載の情報処理装置。
（８）
　前記制御部は、前記予測モデルに最も近い隠れ層に含まれる最近接ノードを目的変数とし、複数の前記入力変数を説明変数として、前記最近接ノードに関する因果グラフを推定し、前記目的変数と直接因果関係にある前記説明変数から前記理由とする前記入力変数を選択する、（１）～（６）のいずれか１つに記載の情報処理装置。
（９）
　前記制御部は、前記最近接ノードのうち正の重みを有する前記最近接ノードに関する前記因果グラフに基づいて正の前記理由とする前記入力変数を選択し、前記最近接ノードのうち負の重みを有する前記最近接ノードに関する前記因果グラフに基づいて負の前記理由とする前記入力変数を選択する、（８）に記載の情報処理装置。
（１０）
　前記制御部は、前記理由として選択した前記入力変数に介入した場合の介入効果を算出する、（１）～（９）のいずれか１つに記載の情報処理装置。
（１１）
　機械学習を用いて生成された予測モデルであって、複数の入力変数を用いて予測結果を出力する前記予測モデルにおいて、前記入力変数と前記予測結果との疑似相関に基づき、複数の前記入力変数から、前記予測結果の理由となる前記入力変数を選択し、
　選択した前記入力変数に関する情報を出力する、
　情報処理方法。
（１２）
　コンピュータを、
　機械学習を用いて生成された予測モデルであって、複数の入力変数を用いて予測結果を出力する前記予測モデルにおいて、前記入力変数と前記予測結果との疑似相関に基づき、複数の前記入力変数から、前記予測結果の理由となる前記入力変数を選択し、
　選択した前記入力変数に関する情報を出力する、制御部、
　として機能させるためのプログラム。

　１００　情報処理装置
　１１０　入力部
　１２０　出力部
　１３０　制御部
　１３１　入出力制御部
　１３２　因果モデル推定部
　１３３　選択部
　１３４　評価部
　１３５　介入効果算出部

Claims

　機械学習を用いた予測モデルにおける複数の入力変数と予測結果との因果関係に関する因果モデルに基づいて、前記予測結果に影響を与える前記入力変数を説明変数として選択し、
　選択された前記説明変数を出力する、
　制御部を備える情報処理装置。
　前記制御部は、機械学習を用いて生成された前記予測モデルにおいて、前記入力変数と前記予測結果とが疑似相関であるか否かの情報に基づき、複数の前記入力変数から、前記予測結果の理由として前記説明変数を選択し、
　選択した前記説明変数に関する情報を出力する、
　請求項１に記載の情報処理装置。
　前記制御部は、前記予測結果と疑似相関の関係にない前記入力変数を前記説明変数として選択する、請求項２に記載の情報処理装置。
　前記制御部は、前記予測結果に対して条件付き独立にならない前記入力変数を前記説明変数として選択する、請求項２に記載の情報処理装置。
　前記制御部は、前記理由として選択した前記説明変数と前記予測結果との関係性の強さを示す強度情報を出力する、請求項２に記載の情報処理装置。
　前記制御部は、前記予測結果の前記理由として、少なくとも２つの前記入力変数の組み合わせを選択する、請求項２に記載の情報処理装置。
　前記制御部は、前記組み合わせに含まれる少なくとも２つの前記入力変数と、前記予測結果と、の関係性の強さを示す強度情報を、前記組み合わせに関する情報と対応付けて出力する、請求項６に記載の情報処理装置。
　前記制御部は、複数の前記入力変数について、前記予測結果を示す出力変数を目的変数として因果グラフを推定し、前記目的変数と直接因果関係にある前記入力変数から前記理由とする前記説明変数を選択する、請求項２に記載の情報処理装置。
　前記制御部は、複数の前記入力変数について、前記予測モデルに最も近い隠れ層に含まれる最近接ノードを目的変数として、前記最近接ノードに関する因果グラフを推定し、前記目的変数と直接因果関係にある前記入力変数から前記理由とする前記説明変数を選択する、請求項２に記載の情報処理装置。
　前記制御部は、前記最近接ノードのうち正の重みを有する前記最近接ノードに関する前記因果グラフに基づいて正の前記理由とする前記説明変数を選択し、前記最近接ノードのうち負の重みを有する前記最近接ノードに関する前記因果グラフに基づいて負の前記理由とする前記説明変数を選択する、請求項９に記載の情報処理装置。
　前記制御部は、前記理由として選択した前記説明変数に介入した場合の介入効果を算出する、請求項２に記載の情報処理装置。
　前記入力変数は、センサで取得された情報を含む、
　請求項１に記載の情報処理装置。
　前記入力変数は、センサで取得された機器の動作環境または動作状態に関する情報を含む、
　請求項１２に記載の情報処理装置。
　前記入力変数は、センサで取得された気温、湿度、電圧、電流、電力または振動に関する情報を含み、
　前記制御部は、前記センサで取得された気温、湿度、電圧、電流、電力または振動に関する情報のうち少なくとも一つを前記説明変数として選択する、
　請求項１３に記載の情報処理装置。
　前記入力変数は、人間の年齢または経歴に関する情報を含む、
　請求項１に記載の情報処理装置。
　前記制御部は、前記強度情報に基づいて、前記説明変数に対応する表示画面上の順序および色を決定し、
　前記表示画面を出力する、
　請求項５に記載の情報処理装置。
　前記制御部は、前記入力変数の組み合わせを決定するためのインターフェースを出力し、
　前記インターフェースに対応する操作に基づいて、前記入力変数の組み合わせを決定する、
　請求項６に記載の情報処理装置。
　前記制御部は、出力された前記説明変数に対する選択操作を取得し、
前記選択操作によって選択された前記説明変数に対する介入効果を算出する、
　請求項１１に記載の情報処理装置。
　機械学習を用いた予測モデルにおける複数の入力変数と予測結果との因果関係に関する因果モデルに基づいて、前記予測結果に影響を与える前記入力変数を説明変数として選択し、
　選択された前記説明変数を出力する、
　情報処理方法。
　コンピュータを、
　機械学習を用いた予測モデルにおける複数の入力変数と予測結果との因果関係に関する因果モデルに基づいて、前記予測結果に影響を与える前記入力変数を説明変数として選択し、
　選択された前記説明変数を出力する、
　ように機能させるためのプログラム。