JP2021140396A - 推測根拠分析装置及び推測根拠分析方法 - Google Patents

推測根拠分析装置及び推測根拠分析方法 Download PDF

Info

Publication number
JP2021140396A
JP2021140396A JP2020036725A JP2020036725A JP2021140396A JP 2021140396 A JP2021140396 A JP 2021140396A JP 2020036725 A JP2020036725 A JP 2020036725A JP 2020036725 A JP2020036725 A JP 2020036725A JP 2021140396 A JP2021140396 A JP 2021140396A
Authority
JP
Japan
Prior art keywords
guessing
basis
model
guess
external
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020036725A
Other languages
English (en)
Other versions
JP7256766B2 (ja
Inventor
良介 土屋
Ryosuke Tsuchiya
良介 土屋
周平 野尻
Shuhei Nojiri
周平 野尻
良太 三部
Ryota Sambe
良太 三部
太郎 向坂
Taro Kosaka
太郎 向坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020036725A priority Critical patent/JP7256766B2/ja
Priority to US17/015,283 priority patent/US11544600B2/en
Publication of JP2021140396A publication Critical patent/JP2021140396A/ja
Application granted granted Critical
Publication of JP7256766B2 publication Critical patent/JP7256766B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】同一の入力データに対して推測活動をした2以上の推測手段の間における推測根拠の差異を分析する。【解決手段】推測根拠分析装置は、共通の問題を解く目的で設計または訓練された複数の推測モデルを記憶する推測モデル記憶部と、推測対象の情報を受け付け、推測対象の推測を各複数の推測モデルに基づいて実行し、モデル推測結果を導出する推測実行部と、推測対象に対する外部推測結果と同一または近似のモデル推測結果を導出した推測モデルの集合を特定し、当該集合に含まれる推測モデルの間の共通的な属性を外部推測結果に対応する推測根拠として推定する推測根拠分析部と、任意の推測モデルの属性と外部推測結果に対応する推測根拠とを比較することによって、推測モデルと外部推測の間の推測根拠の差異を表す推測根拠差異を導出し、推測根拠差異に基づく情報を出力する推測根拠差異分析部と、を備える。【選択図】図1

Description

本発明は、推測根拠分析装置及び推測根拠分析方法に関し、推測活動において推測根拠を分析する推測根拠分析装置及び推測根拠分析方法に適用して好適なものである。
従来、特許文献1、非特許文献1、及び非特許文献2に開示されるように、機械学習に基づく推測モデルの推測根拠を分析する技術が知られている。
特許文献1には、「機械学習で生成した推論モデルを用いた推論によって、入力された情報が所定のクラスのいずれに属するかを推論する推論装置(1)であって、情報を入力する入力部(10)と、前記推論モデルを用いた推論過程において、頻出する特徴量を頻出特徴量として、クラスごとに記憶した頻出特徴量データベース(16)と、入力された情報がどのクラスに属するかを、前記推論モデルを用いて推論する推論部(11)と、前記推論部(11)における推論過程で現れた特徴量を抽出し、前記特徴量の中で所定の条件を満たす特徴量を代表特徴量として抽出する代表特徴量抽出部(13)と、前記頻出特徴量データベース(16)から、推論されたクラスに対応する頻出特徴量を読み出し、前記頻出特徴量と前記代表特徴量とに基づいて1または複数の根拠特徴量を抽出する根拠特徴量算出部(14)と、推論されたクラスと共に前記根拠特徴量を出力する出力部(12)と、を備える推論装置」が記載されている。
また、非特許文献1に記載のLIME(Local Interpretation Model-agnostic Explanation)という技術は、個々の推測において、入力データの特徴量の中から、推測結果への寄与が大きい特徴量を抽出する。当該技術は、入力データに近傍する複数の摂動データに基づき局所近似する推測モデルを生成することで、大局的な推測根拠でなく、個々の入力データにとっての局所的な推測根拠を抽出する。
また、非特許文献2に記載のInfluence Functionという関数は、個々の推測において、入力データの推測結果に対する、訓練データ一つ一つの影響度を算出する。当該関数は、一つ一つの訓練データの有無や摂動が推測結果に与える変化を影響度として算出する。
特開2019−082883号公報
Marco Tulio Ribeiro他2名著、「"Why Should I Trust You?": Explaining the Predictions ofAny Classifier」、Proceedings of the 22nd ACM SIGKDD International Conference onKnowledge Discovery and Data Mining、Pages 1135-1144、(2016) Pang Wei Koh他1名著、「"Understanding black-box predictions via influence functions」、Proceedings of the34th International Conference on Machine Learning - Volume 70、Pages 1885-18944、(2017)
上述した特許文献1、非特許文献1、及び非特許文献2に記載された推測根拠を分析する技術によれば、推測モデルの推測根拠を人間が解釈可能な形で抽出することができる。しかし、複数の推測モデル間、または推測モデルと人間との間における、推測根拠の差異の分析については言及されていない。特に、人間と推測モデルの間において推測結果が異なった場合に、推測結果に差異が生じた原因を判断したり、推測結果の優劣を判断したりするためには、両者の推測根拠の差異を分析することが重要と考えられる。
本発明は、上記のような事情に鑑みてなされたものであり、同一の入力データに対して推測活動をした2以上の推測手段(推測者または推測モデル)の間における推測根拠の差異を分析することが可能な推測根拠分析装置及び推測根拠分析方法を提案しようとするものである。
かかる課題を解決するため本発明においては、推測活動の推測根拠を分析する推測根拠分析装置であって、共通の問題を解く目的で設計または訓練された複数の推測モデルを記憶する推測モデル記憶部と、推測対象の情報を受け付け、前記推測対象の推測を各前記複数の推測モデルに基づいて実行し、当該推測の結果を表すモデル推測結果を導出する推測実行部と、前記推測対象に対する外部の手段による外部推測の結果を表す外部推測結果を受け付け、前記推測実行部による前記推測対象の推測において前記外部推測結果と同一または近似の前記モデル推測結果を導出した前記推測モデルの集合を特定し、当該集合に含まれる前記推測モデルの間の共通的な属性を前記外部推測結果に対応する推測根拠として推定する推測根拠分析部と、前記推測モデル記憶部が記憶する任意の前記推測モデルの属性と、前記推測根拠分析部が推定した前記外部推測結果に対応する推測根拠とを比較することによって、推測モデルと外部推測の間の推測根拠の差異を表す推測根拠差異を導出し、前記推測根拠差異に基づく情報を出力する推測根拠差異分析部と、を備える推測根拠分析装置が提供される。
また、かかる課題を解決するため本発明においては、推測活動の推測根拠を分析する推測根拠分析装置であって、共通の問題を解く目的で設計または訓練され、推測対象に対する推測を行った場合に当該推測の推測結果及び推測根拠を導出する、複数の推測モデルを記憶する推測モデル記憶部と、推測対象の情報を受け付け、前記推測対象の推測を各前記複数の推測モデルに基づいて実行し、当該推測の結果を表すモデル推測結果と当該推測の根拠を表すモデル推測根拠とを導出する推測実行部と、前記推測対象に対する外部の手段による外部推測の結果を表す外部推測結果を受け付け、前記推測実行部による前記推測対象の推測において前記外部推測結果と同一または近似の前記モデル推測結果を導出した前記推測モデルの集合を特定し、当該集合に含まれる前記推測モデルの間の共通的な前記モデル推測根拠を、前記外部推測結果に対応する推測根拠として推定する推測根拠分析部と、前記推測モデル記憶部が記憶する任意の前記推測モデルによる推測の前記モデル推測根拠と、前記推測根拠分析部が推定した前記外部推測結果に対応する推測根拠とを比較することによって、推測モデルと外部推測の間の推測根拠の差異を表す推測根拠差異を導出し、前記推測根拠差異に基づく情報を出力する推測根拠差異分析部と、を備える推測根拠分析装置が提供される。
また、かかる課題を解決するため本発明においては、推測活動の推測根拠を分析する推測根拠分析装置による推測根拠分析方法であって、前記推測根拠分析装置が、共通の問題を解く目的で設計または訓練された複数の推測モデルを記憶する推測モデル記憶部を有し、推測対象の情報を受け付け、前記推測対象の推測を前記推測モデル記憶部が記憶する各前記複数の推測モデルに基づいて実行し、当該推測の結果を表すモデル推測結果を導出する推測実行ステップと、前記推測対象に対する外部の手段による外部推測の結果を表す外部推測結果を受け付け、前記推測実行ステップによる前記推測対象の推測において前記外部推測結果と同一または近似の前記モデル推測結果を導出した前記推測モデルの集合を特定し、当該集合に含まれる前記推測モデルの間の共通的な属性を前記外部推測結果に対応する推測根拠として推定する推測根拠分析ステップと、前記推測モデル記憶部が記憶する任意の前記推測モデルの属性と、前記推測根拠分析ステップで推定した前記外部推測結果に対応する推測根拠とを比較することによって、推測モデルと外部推測の間の推測根拠の差異を表す推測根拠差異を導出し、前記推測根拠差異に基づく情報を出力する推測根拠差異分析ステップと、を備える推測根拠分析方法が提供される。
本発明によれば、同一の入力データに対して推測活動をした2以上の推測手段の間における推測根拠の差異を分析することができる。
第1の実施形態に係る推測根拠分析装置100の構成例を示すブロック図である。 推測モデル200の一例を示す図である。 入力情報300の一例を示す図である。 推測実行部120による処理例を説明するための図である。 推測根拠分析部130による処理例を説明するための図である。 推測根拠差異分析部140による処理例を説明するための図である。 出力情報700の一例を示す図である。 第2の実施形態に係る推測根拠分析装置800の構成例を示すブロック図である。 推測根拠分析部830による処理例を説明するための図である。 推測根拠差異分析部840による処理例を説明するための図である。
以下、図面を参照して、本発明の実施形態を詳述する。
(1)第1の実施形態
本発明の第1の実施形態に係る推測根拠分析装置100について説明する。
(1−1)推測根拠分析装置100の構成
図1は、第1の実施形態に係る推測根拠分析装置100の構成例を示すブロック図である。推測根拠分析装置100は、例えば、演算装置、記憶装置、及び各種インタフェース等を有する計算機であって、機能的構成として、推測モデル記憶部110、推測実行部120、推測根拠分析部130、及び推測根拠差異分析部140を備える。なお、図1では、推測根拠分析装置100が外部の入力装置150及び出力装置160に接続される構成を例示しているが、推測根拠分析装置100は、内部に入力装置150または出力装置160を備える構成であってもよい。
推測モデル記憶部110は、共通の推測活動に関する問題を解く目的において設計または訓練された2以上の推測モデル200を記憶する。ここで、推測活動に関する問題とは、入力データが属するクラスを推測する分類問題や、入力データに基づいて目的とする連続値を推測する回帰問題等を指す。詳細は図2を参照して後述するが、推測モデル200は、例えば、モデルID210、モデル属性220、及び推測実行体230を含んで構成される。推測モデル記憶部110は、RAM(Random Access Memory)やROM(Read Only Memory)等の揮発性記憶素子や、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の不揮発性記憶素子からなる記憶装置で構成される。
推測実行部120は、推測根拠分析装置100に記憶された全ての推測モデル200に基づいて、外部から入力されるテストデータを対象とする推測を実行する機能を有する。詳しく述べると、推測実行部120は、入力装置150から推測根拠分析装置100に入力される入力情報300(図3を参照)のうち、推測対象であるテストデータ310を入力として受け付け、推測モデル記憶部110が記憶する全ての推測モデル200に基づいて、テストデータ310を対象とした推測を実行し、推測モデル200ごとにモデル推測結果411を含むモデル推測結果情報410(図4を参照)を導出する。推測実行部120は、上記機能のアルゴリズムを記憶する記憶装置と、上記機能を制御するCPU(Central Processing Unit)等の演算装置とで構成される。
推測根拠分析部130は、テストデータ310を対象とする外部手段による推測の結果(外部推測結果)について、推測実行部120によって実行された同一のテストデータ310を対象とする全ての推測モデル200による個々の推測の結果(モデル推測結果情報)に基づいて、外部推測結果の推測根拠を推定する機能を有する。詳しく述べると、推測根拠分析部130は、入力装置150から推測根拠分析装置100に入力される入力情報300のうち、推測根拠分析装置100の外部の任意の手段に基づいてテストデータ310に対する推測を実施した結果である外部推測結果320を入力として受け付け、外部推測結果320と同一または近似するモデル推測結果411を導出した推測モデル200の集合を表す外部推測近似モデル集合510を特定し、外部推測近似モデル集合510に含まれる推測モデル200間の共通的なモデル属性220である近似モデル集合共通属性520を特定し、これを外部推測結果320に対応する推測根拠として推定する。推測根拠分析部130は、上記機能のアルゴリズムを記憶する記憶装置と、上記機能を制御するCPU等の演算装置とで構成される。
推測根拠差異分析部140は、推測根拠分析部130が推定した外部推測結果320の推測根拠と、任意の推測モデル200のモデル属性220とに基づいて、外部推測と推測モデルとの間の推測根拠の差異(推測根拠差異)を分析する機能を有する。詳しく述べると、推測根拠差異分析部140は、推測モデル記憶部110が記憶する任意の推測モデル200のモデル属性220と、推測根拠分析部130が特定した近似モデル集合共通属性520とを比較することによって、当該推測モデル200と外部推測との間の推測根拠差異610を導出し、導出結果に基づく出力情報700を出力装置160に出力させる。推測根拠差異分析部140は、上記機能のアルゴリズムを記憶する記憶装置と、上記機能を制御するCPU等の演算装置とで構成される。
なお、推測実行部120、推測根拠分析部130、及び推測根拠差異分析部140を構成する記憶装置は、推測モデル記憶部110を構成する記憶装置と同一でもよいし、別物であってもよい。
入力装置150は、例えばキーボードやマウス等の入力装置であって、推測根拠分析装置100に対して入力情報300を入力する。詳細は図3を参照して後述するが、入力情報300は、例えば、テストデータ310や外部推測結果320を含んで構成される。また、入力装置150は、推測モデル200の機械学習に基づく訓練に使用される訓練データも推測根拠分析装置100に入力することができる。
出力装置160は、例えばディスプレイやプリンタ等の出力装置であって、推測根拠分析装置100による演算結果に基づく出力情報700を画面表示や帳票印刷等によって出力する。詳細は図7を参照して後述するが、出力情報700は、例えば、推測根拠差異610や推測根拠差異対応ガイドライン710を含んで構成される。
(1−2)推測モデル200
図2は、推測モデル200の一例を示す図である。図2に例示した推測モデル200は、モデルの識別子を示すモデルID210と、モデルの特徴や性質を表すモデル属性220と、モデル属性220に基づいて設計及び訓練され、テストデータ310の入力に対して推測を実行してモデル推測結果情報410を出力する推測実行体230と、を有する。
モデルID210は、例えば図2に示した「A001」のように、文字列で表される。但し、本実施形態におけるモデルID210の表記方法はこれに限定されるものではなく、任意の表記方法を採用してよい。
モデル属性220は、モデルの特徴や性質を表す要素(情報)の集合によって表される。図2には、モデル属性220に含まれる要素の具体例として、訓練データ使用情報221、機械学習アルゴリズム種別情報222、ハイパーパラメータ情報223、及び説明変数使用情報224が示されている。
訓練データ使用情報221は、機械学習で使用する訓練データを表す情報である。具体的には例えば、訓練データ使用情報221は、機械学習に基づく推測実行体230の訓練時に使用した訓練データに対して「1」を設定し、使用しなかった訓練データに対して「0」を設定することによって表現できる。図2の推測モデル200においては、訓練データA,B,Dが使用され、訓練データCが使用されていないことを表している。また、訓練データ使用情報221の表示は、単なる使用/不使用の情報を表すことに限定されるものではなく、各訓練データに対して特定の前処理を行ったか否か、といった他の情報を含めて表すとしてもよい。
機械学習アルゴリズム種別情報222は、機械学習に基づく推測実行体230の訓練時に採用したアルゴリズムの種別を表す情報である。具体的には例えば、機械学習アルゴリズム種別情報222は、機械学習に基づく推測実行体230の訓練時に採用したアルゴリズムに対して「1」を設定し、採用しなかったアルゴリズムに対して「0」を設定することによって表現できる。図2の推測モデル200においては、アルゴリズムWが採用されていることを表している。機械学習アルゴリズム種別情報222の表示対象となり得る機械学習アルゴリズムの具体的な種別としては、例えば、サポートベクターマシーン、ベイズ、決定木、ランダムフォレスト、及びニューラルネットワーク等が代表的なものとして知られている。
ハイパーパラメータ情報223は、機械学習時(訓練前)に予め設定しておく必要があるパラメータ(ハイパーパラメータ)を表す情報である。具体的には例えば、ハイパーパラメータ情報223は、パラメータ項目とパラメータ値との組み合わせによって表現できる。ハイパーパラメータは、採用される機械学習アルゴリズムごとに異なるものであり、例えば「木の深さ」等が代表的なパラメータ項目として知られている。
説明変数使用情報224は、機械学習で使用する説明変数を表す情報である。具体的には例えば、説明変数使用情報224は、機械学習に基づく推測実行体230の訓練時に使用した説明変数に対して「1」を設定し、使用しなかった説明変数に対して「0」を設定することによって表現できる。図2の推測モデル200においては、説明変数L,N,Oが使用され、説明変数Mが使用されていないことを表している。また、説明変数使用情報224の表示は、単なる使用/不使用の情報を表すことに限定されるものではなく、推測実行体230の訓練の結果として決定した、各説明変数の重み付けの情報等を含んで表すとしてもよい。
なお、説明変数は、入力となる訓練データやテストデータから、予め定めた任意の手段によって抽出した情報を用いることができる。入力データがテキスト情報であるとすると、単語ごとの出現頻度を説明変数として抽出することができる。また、ニューラルネットワークの一種であるオートエンコーダによって機械的に獲得した特徴量を、説明変数使用情報224に含めて表すようにしてもよい。
推測実行体230は、モデル属性220に含まれる前提条件に基づいて設計及び訓練され、テストデータ310を入力すると推測を実行し、その推測結果(モデル推測結果411)を含むモデル推測結果情報410を出力する機能を有するアルゴリズムである。具体的には例えば、プログラミング言語Pythonにおける機械学習ライブラリであるscikit-learnが提供するモデルをモデル属性220に含まれる前提条件に基づいて設計及び訓練することにより得られるプログラムを、推測実行体230とみなすことができる。
(1−3)入力情報300
図3は、入力情報300の一例を示す図である。図3に例示した入力情報300は、推測対象であるテストデータ310と、推測根拠分析装置100の外部の任意の手段に基づいてテストデータ310に対して推測を実施した結果である外部推測結果320と、を含んで構成される。例えば、人間が推測した結果や、推測モデル記憶部110に記憶されていない推測モデル200が推測した結果を、外部推測結果320としてよい。
テストデータ310は、例えば、テキストデータや、画像や映像等のメディアデータ、等の要素で構成される。図3では一例として、SNS(Social Networking Service)の投稿データから投稿者の年齢層を推測する推測活動を想定しており、投稿者のハンドルネームやSNSの過去の投稿データを推測時のテストデータ310としている。図3のテストデータ310においては、投稿者のハンドルネームは「taro」であり、当該投稿者によるSNSの過去の投稿データについては、推測根拠分析装置100または外部のパーソナルコンピュータやストレージにおけるデータの格納パスを想定した「C:\data\taro\sns_data」が入力されている。
なお、推測モデル200の推測実行体230(図2参照)は、テストデータ310を入力として受け付けた際、訓練時の訓練データと同じ方法に基づいて、説明変数となる情報を抽出する。例えば、ハンドルネームはそのままの形でカテゴリカルな説明変数として抽出してもよいし、ハンドルネームをテキスト情報とみなした上で、ハンドルネーム内に含まれる単語や文字の出現頻度を説明変数として抽出してもよい。
外部推測結果320は、例えば、推測活動が分類問題である場合にはカテゴリカルな値となり、推測活動が回帰問題である場合には連続的な値となる。図3の外部推測結果320においては、SNSの投稿データから投稿者の年齢層を推測する推測活動を想定しており、SNS投稿者の年齢層を「10代」と予測した結果が入力されている。
(1−4)推測実行処理
図4は、推測実行部120による処理例を説明するための図である。推測実行部120は、推測モデル200に基づいてテストデータ310を対象とした推測を行う推測実行処理を実行する。
図4に示したように、推測実行処理において推測実行部120は、入力情報300に含まれる、推測対象であるテストデータ310を入力として受け付けると、推測モデル記憶部110が記憶する全ての推測モデル200を読み込み、読み込んだ個々の推測モデル200を用いて、テストデータ310を対象とした推測を実行する。この結果、推測実行部120は、推測モデル200ごとのモデル推測結果情報410を導出する。
モデル推測結果情報410は、例えば、推測に用いた推測モデル200のモデルID210と、テストデータ310を対象とした当該推測の結果を示すモデル推測結果411との組み合わせによって表される。具体的には、図4のモデル推測結果情報410においては、「A001」のモデルID210を有する推測モデル200に対応するモデル推測結果411は「50代」と出力され、「A002」のモデルID210を有する推測モデル200に対応するモデル推測結果411は「10代」と出力され、「A003」のモデルID210を有する推測モデル200に対応するモデル推測結果411は「20代」と出力されている。
(1−5)推測根拠分析処理
図5は、推測根拠分析部130による処理例を説明するための図である。推測根拠分析部130は、外部推測結果320に近似するモデル推測結果411を導出する推測モデル200を分析し、外部推測結果320の推測根拠を推定する処理(推測根拠分析処理)を実行する。図5に例示した推測根拠分析部130は、外部推測近似モデル集合特定部530と、近似モデル集合共通属性特定部540とを有して構成される。
推測根拠分析処理では、まず、外部推測近似モデル集合特定部530が、入力情報300に含まれる外部推測結果320を入力として受け付け、推測実行部120が推測モデル200ごとに導出したモデル推測結果情報410に含まれるモデル推測結果411のうち、外部推測結果320と同一または近似するモデル推測結果411に基づいて、当該モデル推測結果411を導出した推測モデル200の集合を表す外部推測近似モデル集合510を特定する。
なお、本例では、外部推測近似モデル集合510は、外部推測近似モデル集合特定部530が特定する推測モデル200について、対応するモデルID210の集合を保持することによって「間接的に」推測モデル200の集合を表すようにしている。但し、簡略のため、以降の説明では、原則として「外部推測近似モデル集合510に含まれる推測モデル200」といった表記を行う。また、モデル集合に関するこのような表記は、後述する外部推測非近似モデル集合550等でも同様とする。
例えば図5の場合、外部推測結果320は「10代」となっている。また、推測実行部120で導出された4つのモデル推測結果情報410のうち、「A002」のモデルID210を有するモデル推測結果情報410、及び「A004」のモデルID210を有するモデル推測結果情報410の2つにおいてモデル推測結果411が「10代」となっており、外部推測結果320と同一の推測結果が導出されている。そこで、外部推測結果320を入力として受け付けた外部推測近似モデル集合特定部530は、「A002」及び「A004」のモデルID210を、外部推測近似モデル集合510の要素として特定する。
なお、図5では簡略のために、両推測結果(外部推測結果320とモデル推測結果411)が同一であるケースを扱っているが、本実施形態に係る外部推測近似モデル集合特定部530は、両推測結果が近似であるケースにおいても同様に、外部推測近似モデル集合510を特定することができる。両推測結果が近似であるか否かを判断する方法としては、例えば、推測結果が連続値である場合には、両推測結果を近似とみなすことができる誤差の範囲を、任意の閾値として予め設定しておけばよい。また、推測結果がカテゴリカルな値である場合には、訓練データにおいて同一カテゴリに属するデータ群の重心を導出し、各カテゴリの重心間の距離を数値化しておくことで、推定結果が連続値である場合と同様の方法によって両推測結果の近似を判断することができる。
また、外部推測近似モデル集合特定部530は、推測実行部120によるモデル推測結果情報410の導出に用いられた推測モデル200のうち、外部推測近似モデル集合510に含まれなかった推測モデル200の集合(本例では、モデルID210の集合)を、別途、外部推測非近似モデル集合550として特定するようにしてもよい。
次に、推測根拠分析処理では、外部推測近似モデル集合特定部530が外部推測近似モデル集合510を特定した後、近似モデル集合共通属性特定部540が、推測モデル記憶部110から、外部推測近似モデル集合510に含まれる推測モデル200のモデル属性220(本例の場合、モデルID210に対応するモデル属性220)を読み込み、外部推測近似モデル集合510に含まれる推測モデル200の間で共通的に現れるモデル属性220を、近似モデル集合共通属性520として特定する。
ここで、近似モデル集合共通属性特定部540は、近似モデル集合共通属性520を特定するために様々な特定方法を採用可能であり、以下に例示する。
第1の特定方法として、近似モデル集合共通属性特定部540は、外部推測近似モデル集合510に含まれる全ての推測モデル200の間に共通するモデル属性220のみを集め、近似モデル集合共通属性520として特定する。
第2の特定方法として、近似モデル集合共通属性特定部540は、外部推測近似モデル集合510に含まれる推測モデル200について、各モデル属性220の出現頻度を数え上げ、出現頻度が予め設定した任意の閾値を超えたモデル属性220を集め、近似モデル集合共通属性520として特定する。
第3の特定方法は、外部推測近似モデル集合特定部530が、外部推測近似モデル集合510だけでなく外部推測非近似モデル集合550も特定している場合に採用可能な方法である。第3の特定方法において、近似モデル集合共通属性特定部540は、外部推測近似モデル集合510に含まれる推測モデル200について、各モデル属性220の出現頻度を数え上げるとともに、外部推測非近似モデル集合550に含まれる推測モデル200についても、各モデル属性220の出現頻度を数え上げ、両モデル集合における出現頻度に基づいて各モデル属性220の重要度を算出し、算出した重要度が予め設定した任意の閾値を超えたモデル属性220を集めて、近似モデル集合共通属性520として特定する。
なお、第3の特定方法における重要度の算出方法としては、例えば、外部推測近似モデル集合510における出現頻度から外部推測非近似モデル集合550における出現頻度を減算することで重要度を算出する。または、外部推測近似モデル集合510における出現頻度を、外部推測非近似モデル集合550における出現頻度に1を加えた値で除算することで重要度を算出する、としてもよい。
第4の特定方法としては、近似モデル集合共通属性特定部540は、第1〜第3の特定方法で述べたモデル属性220の出現頻度または重要度に基づいて、それらの値の高い順(低い順でもよい)に近似モデル集合共通属性520に整列させることで、出現頻度または重要度を算出した全てのモデル属性220が順序付けされた近似モデル集合共通属性520を生成する。
(1−6)推測根拠差異分析処理
図6は、推測根拠差異分析部140による処理例を説明するための図である。推測根拠差異分析部140は、外部推測と推測モデルとの間の推測根拠の差異を分析する推測根拠差異分析処理を実行する。図6に示したように、推測根拠差異分析部140は、推測根拠差異導出部620を有して構成される。
図6に示したように、推測根拠差異分析処理において、まず、推測根拠差異分析部140は、推測根拠分析部130から近似モデル集合共通属性520の入力を受け付け、推測モデル記憶部110から任意の推測モデル200(メイン推測モデル)を選択し、選択した推測モデル200のモデル属性220のうち、近似モデル集合共通属性520と同項目の属性情報を、推測モデル属性630として読み込む。次に、推測根拠差異導出部620が、近似モデル集合共通属性520と推測モデル属性630との差異を、推測根拠差異610として導出する。そして、推測根拠差異分析部140は、導出した推測根拠差異610に基づいて、推測根拠差異610を含む出力情報700(詳細は図7参照)を出力装置160に送信し、任意の出力形式(表示や印刷等)で出力装置160から出力情報700を出力させる。
推測根拠差異610の導出について具体的に説明すると、例えば図6の場合、外部推測結果320の推測根拠として推定された近似モデル集合共通属性520には、モデル属性220として訓練データ使用情報221及び説明変数使用情報224の一部が示されているが、このうち、訓練データCが「0」、すなわち訓練データCを使用しない属性値となっており、説明変数Lが「1」、すなわち説明変数Lを使用する属性値となっている。一方、推測モデル属性630では、訓練データCが「1」、すなわち訓練データCを使用する属性値となっており、説明変数Lが「0」、すなわち説明変数Lを使用しない属性値となっている。したがって、推測根拠差異導出部620は、外部推測と推測モデル200との間の推測根拠の差異として、推測根拠差異610に、訓練データC及び説明変数Lについて、近似モデル集合共通属性520及び推測モデル属性630のそれぞれの属性値を出力する。
なお、本実施形態では、推測根拠差異610を導出する際の対象モデル(メイン推測モデル)を、推測モデル記憶部110に記憶されている複数の推測モデル200から任意に選択できるため、様々な基準(例えばモデルの向き不向き等)に基づいてメイン推測モデルを選択し、外部推測との推測根拠の差異を比較することができる。
また、推測精度に着目する際には、例えば、推測モデル記憶部110に記憶される推測モデル200のうち、訓練データに対する推測精度が最も高い「最優良モデル」をメイン推測モデルに選択するようにしてもよい。この場合、機械学習による推測精度が最も高い推測モデル200と外部推測との間の推測根拠差異610が導出されることから、推測根拠差異610に基づく出力情報700の出力を受けてユーザが推測活動の改善を検討する際に、影響度合いの高い推測根拠の差異を提示することに期待できる。
また、本実施形態では、推測モデル記憶部110に記憶する複数の推測モデル200は、上記の最優良モデルと、最優良モデルのモデル属性220の一部に少しずつ変更を加えた1以上の亜種推測モデルとからなる集合としてもよい。亜種推測モデルは、例えば、最優良モデルのモデル属性220の属性項目のうち、任意の一つの属性項目を変更したモデルとしてもよいし、全ての属性項目に対して最優良モデルからの変更の有無の組み合わせを全て網羅したモデルの集合としてもよい。具体的には例えば、モデル属性220の訓練データ使用情報221において属性項目が訓練データA〜Dの4つであった場合に、全ての属性項目に対して変更の有無の組み合わせを全て網羅すると、最大で2の4乗から1(最優良モデルの分)を引いた数、すなわち15の亜種推測モデルを作成することができる。さらに、変更の有無だけでなく、変更内容のバリエーションまで加味して組み合わせを網羅する場合には、さらに多数の亜種推測モデルの作成が考えられる。
上記のように推測モデル記憶部110に最優良モデルと1以上の亜種推測モデルとが記憶される場合、推測根拠差異分析部140は、最優良モデルをメイン推測モデルに選択して推測根拠差異610を導出するだけでなく、亜種推測モデルをメイン推測モデルに選択した場合の推測根拠差異610も導出するようにしてもよい。この結果、推測根拠差異610に基づく出力情報700の出力を受けてユーザが推測活動の改善を検討する際に、最優良モデルと外部推測との推測根拠の差異を比較できるだけでなく、最優良モデルを少しずつ変更した亜種推測モデルと外部推測との推測根拠の差異も比較できるようになるため、どこで差異が生じているかを詳細に検討可能な情報をすることができ、より精度の高い改善検討を支援することができる。
(1−7)出力情報700
図7は、出力情報700の一例を示す図である。図7には、出力装置160の表示画面に表示された出力情報700の一例が示されており、図7に例示した出力情報700は、推測根拠差異分析部140で導出された推測根拠差異610と、推測根拠差異610をユーザが解釈し推測活動の改善に役立てるための指針例である推測根拠差異対応ガイドライン710と、を含んで構成されている。
推測根拠差異対応ガイドライン710の出力内容は、推測根拠差異610の内容に基づいて決定される。例えば、推測根拠差異610において訓練データの使用の有無が導出された場合には、図7の推測根拠差異対応ガイドライン710のように、「訓練データCとテストデータを比較する」ことを推奨する旨のメッセージ等を表示することができる。さらに、推測モデル記憶部110に対象の訓練データ(訓練データC)を記憶している場合は、出力装置160において出力情報700の当該メッセージが選択される操作(例えばクリック)がなされた場合に、推測根拠分析装置100が、当該メッセージで言及されているデータ(具体的には訓練データC及びテストデータ)を並べて表示するといった機能を有するようにしてもよい。
また例えば、推測根拠差異610において説明変数の使用の有無や、説明変数の重み付け情報等が導出された場合には、図7の推測根拠差異対応ガイドライン710のように、「説明変数Lと、外部推測結果、モデル推測結果の相関を確認する」ことを推奨する旨のメッセージを表示することができる。さらに、推測モデル記憶部110に対象の説明変数と目的変数との間の相関データを記憶している場合は、出力装置160において出力情報700の当該メッセージが選択される操作(例えばクリック)がなされた場合に、推測根拠分析装置100が、当該メッセージで言及されているデータ(具体的には説明変数Lに関わる相関データ)を表示するといった機能を有するようにしてもよい。
以上のように、第1の実施形態に係る推測根拠分析装置100によれば、同一の入力データに対して推測活動をした2以上の推測手段(推測者を含む外部推測手段と推測モデル)の間における推測根拠の差異を分析し、推測根拠差異610を特定することができる。具体的には例えば、人による外部推測の結果が誤っており、最優良モデルによる推測の結果が正しいとき、外部推測に対応する推測根拠(推測根拠分析部130によって推定された推測根拠)と、メイン推測モデル(最優良モデル)による推測根拠との差異が特定されることにより、人が推測する際に正しい推測結果を導出するために考慮すべき推測根拠を、最優良モデルの推測根拠によって提示することができる。
さらに、第1の実施形態に係る推測根拠分析装置100は、特定した推測根拠差異610に基づいて出力情報700を出力することにより、推測活動を行った推測手段(外部推測と推測モデル)のそれぞれにおける、推測根拠の過不足、推測能力の優劣、または得意とする入力データの傾向等を比較検討するための検討材料を提供することができる。
(2)第2の実施形態
本発明の第2の実施形態に係る推測根拠分析装置800について説明する。以下の第2の実施形態の説明では、第1の実施形態から変更または追加される点を中心に説明し、第1の実施形態に係る推測根拠分析装置100と同じ構成や入出力情報に関しては説明を省略する。
図8は、第2の実施形態に係る推測根拠分析装置800の構成例を示すブロック図である。推測根拠分析装置800は、第1の実施形態に係る推測根拠分析装置100と同様に、例えば、演算装置、記憶装置、及び各種インタフェース等を有する計算機である。推測根拠分析装置800は、機能的構成として、推測モデル記憶部810、推測実行部820、推測根拠分析部830、及び推測根拠差異分析部840を備える。
推測モデル記憶部810は、第1の実施形態における推測モデル記憶部110と同様に、共通の推測活動に関する問題を解く目的において設計または訓練された2以上の推測モデル200を記憶し、各推測モデル200は、例えば、モデルID210、モデル属性220、及び推測実行体230を含んで構成される。
第2の実施形態における推測実行体230は、モデル属性220に含まれる前提条件に基づいて設計及び訓練され、テストデータ310を入力すると推測を実行する機能を有するアルゴリズムである。但し、第2の実施形態における推測実行体230は、テストデータ310に対する推測を実行するとき、その推測結果(モデル推測結果)を導出するだけでなく、モデル推測結果を推測した根拠(モデル推測根拠)を導出する機能が追加され、さらに、モデル推測結果及びモデル推測根拠を含む構成でモデル推測結果情報を導出する機能が追加される。
この結果、具体的には後述する図9に示すように、第2の実施形態のモデル推測結果情報910は、推測に用いた推測モデル200のモデルID210と、テストデータ310を対象とした当該推測の結果を示すモデル推測結果411と、当該推測においてモデル推測結果411を推測する根拠となったモデル推測根拠911との組み合わせによって表される。なお、第2の実施形態における推測実行体230によるモデル推測根拠911の導出方法としては、例えば、特許文献1、非特許文献1、または非特許文献2に開示された従来技術等を用いることができる。
推測実行部820は、推測対象であるテストデータ310を入力として受け付け、推測モデル記憶部810が記憶する全ての推測モデル200に基づいて、テストデータ310を対象とした推測を実行し、推測モデル200ごとのモデル推測結果情報910を導出する。
推測根拠分析部830は、テストデータ310を対象とする外部手段による推測の結果(外部推測結果320)について、同一のテストデータ310を対象とする推測実行部820によるモデル推測結果情報910に基づいて、より詳しく言えば、上記モデル推測結果情報910において外部推測結果320に近似するモデル推測結果411を導出した推測モデル200に関するモデル推測根拠911を分析することによって、外部推測結果320の推測根拠を推定する機能を有する。
図9は、推測根拠分析部830による処理例を説明するための図である。図9に示したように、推測根拠分析部830は、外部推測近似モデル集合特定部530と、近似モデル集合共通推測根拠特定部920とを有して構成される。図9を参照しながら、推測根拠分析部830による処理を説明する。
まず、推測根拠分析部830は、外部推測結果320を入力として受け付ける。次に、外部推測近似モデル集合特定部530が、外部推測結果320と同一または近似するモデル推測結果411を導出した推測モデル200の集合である外部推測近似モデル集合510を特定する。また、外部推測近似モデル集合特定部530は、推測実行部820によるモデル推測結果情報910の導出に用いられた推測モデル200のうち、外部推測近似モデル集合510に含まれなかった推測モデル200の集合(本例では、モデルID210の集合)を、別途、外部推測非近似モデル集合550として特定するようにしてもよい。第2の実施形態において外部推測近似モデル集合特定部530が外部推測近似モデル集合510(及び外部推測非近似モデル集合550)を特定する処理は、第1の実施形態と同様である。
次に、外部推測近似モデル集合特定部530が外部推測近似モデル集合510(及び外部推測非近似モデル集合550)を特定した後、近似モデル集合共通推測根拠特定部920が、推測実行部820から出力されたモデル推測結果情報910のうちから、外部推測近似モデル集合510に含まれる各推測モデル200(外部推測近似モデル集合510のモデルID210に対応する推測モデル200)に対応するモデル推測根拠911を読み込み、読み込んだモデル推測根拠911の間で共通的に現れる推測根拠を、近似モデル集合共通推測根拠930として特定する。
なお、第2の実施形態において近似モデル集合共通推測根拠特定部920が近似モデル集合共通推測根拠930を特定する方法は、第1の実施形態において近似モデル集合共通属性特定部540が近似モデル集合共通属性520を特定する方法(第1〜第4の特定方法)に準拠するとしてよい。
例えば、図9には、第2の特定方法を準用する場合に導出される近似モデル集合共通推測根拠930の具体例が示されている。この具体例は、モデル推測根拠911にSNSの投稿データから抽出された単語が示され、これらの単語のうち、外部推測近似モデル集合510に含まれる各推測モデル200に対応するモデル推測根拠911のなかで「バイト」及び「部活」という単語(推測根拠)が共通して現れた、というケースに基づくものであり、このとき近似モデル集合共通推測根拠930では、「バイト」及び「部活」が共通する推測根拠として特定されるとともに、各単語(推測根拠)の出現回数が導出される。
また例えば、第4の特定方法を準用する場合には、近似モデル集合共通推測根拠特定部920は、外部推測近似モデル集合510に含まれる各推測モデル200に対応するモデル推測根拠911を、共通的に現れる推測根拠の出現頻度または重要度に基づいて、それらの値の高い順(低い順でもよい)に近似モデル集合共通推測根拠930に整列させることで、順序付けされた近似モデル集合共通推測根拠930を生成することができる。
推測根拠差異分析部840は、推測根拠分析部830が推定した外部推測結果320の推測根拠と、任意の推測モデル200によるモデル推測結果情報910の推測根拠とに基づいて、外部推測と推測モデルとの間の推測根拠の差異(推測根拠差異)を分析する機能を有する。
図10は、推測根拠差異分析部840による処理例を説明するための図である。図10に例示した推測根拠差異分析部840は、推測根拠差異導出部950を有して構成される。図10を参照しながら、推測根拠差異分析部840による処理を説明する。
まず、推測根拠差異分析部840は、推測根拠分析部830が推定した外部推測結果320の推測根拠(近似モデル集合共通推測根拠930)と、推測モデル記憶部810が記憶する任意の推測モデル200(メイン推測モデル)によるモデル推測結果情報910に含まれるモデル推測根拠911(メインモデル推測根拠940)と、の入力を受け付ける。
次に、推測根拠差異導出部950が、入力された推測根拠を比較し、それらの差異を推測根拠差異960として導出する。近似モデル集合共通推測根拠930は、外部推測結果320に近似するモデル推測結果411を導出する推測モデル200から推定された「外部推測の推測根拠」であるから、推測根拠差異導出部950は、近似モデル集合共通推測根拠930をメイン推測モデルに対応するメインモデル推測根拠940と比較して差異を抽出することにより、外部推測とメイン推測モデルとの間の推測根拠の差異を分析・特定することができる。
なお、推測根拠差異960の構成は、特定の構成に限定されない。例えば図10に例示したように、近似モデル集合共通推測根拠930が有し、メインモデル推測根拠940が有さない推測根拠を「外部推測にユニーク」な根拠として表し、近似モデル集合共通推測根拠930が有さず、メインモデル推測根拠940が有する推測根拠を「推測モデルにユニーク」な根拠として表す、といった構成が考えられる。また、図10にも例示したように、推測根拠差異960は、差異となる推測根拠を表すだけでなく、その出現頻度等を併せて表すようにすることで、推測活動の分析のために有用な情報量を増やすことができる。
そして、推測根拠差異分析部840は、導出した推測根拠差異960に基づいて、推測根拠差異960を含む出力情報700を出力装置160に送信し、任意の出力形式(表示や印刷等)で出力装置160から出力情報700を出力させる。この出力情報700の内容や出力方法等については、第1の実施形態と同様に考えればよいため、詳細な説明を省略する。
以上のように、第2の実施形態に係る推測根拠分析装置800によれば、同一の入力データに対して推測活動をした2以上の推測手段(推測者を含む外部推測手段と推測モデル)の間における推測根拠の差異を分析し、推測根拠差異960を特定することができる。そして、第2の実施形態に係る推測根拠分析装置800は、特定した推測根拠差異960に基づいて出力情報700を出力することにより、推測活動を行った推測手段(外部推測と推測モデル)のそれぞれにおける、推測根拠の過不足、推測能力の優劣、または得意とする入力データの傾向等を比較検討するための検討材料を提供することができる。特に、第2の実施形態では、推測根拠差異960において、差異となる推測根拠が具体的な態様(例えば単語とその出現頻度)で表されるため、モデル属性220の属性項目で表される第1の実施形態に比べて、ユーザにとって、より具体的かつ分かり易く、外部推測と推測モデルの推測根拠の差異を提示することができる。
以上、本発明の実施形態について具体的に説明したが、本発明は上記した実施形態に限定されるものではなく、その要旨を逸脱しない範囲で変更可能であり、様々な変形例が含まれる。例えば、上記した実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることが可能であり、また、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
例えば、第1または第2の実施形態の何れにおいても、推測根拠分析装置100,800は、テストデータ310に対応する外部推測結果320として、テストデータ310に対する複数の外部推測の結果を受け付けるようにしてもよい。さらにこの場合、推測根拠分析装置100,800は、それぞれの外部推測結果320に対して、推測根拠分析部130,830によって近似モデル集合共通属性520または近似モデル集合共通推測根拠930を導出し、推測根拠差異分析部140,840(推測根拠差異導出部620,950)によって根拠差異の差異を分析する、としてもよい。このように構成された推測根拠分析装置100,800によれば、例えば複数人によってテストデータ310に対する推測が行われたようなケースにおいても、それぞれの外部推測根拠について、モデル推測根拠との差異を特定し提示することができ、推測活動の改善検討を細やかに支援することができる。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、図面において制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実施には殆ど全ての構成が相互に接続されていると考えてもよい。
100 推測根拠分析装置
110 推測モデル記憶部
120 推測実行部
130 推測根拠分析部
140 推測根拠差異分析部
150 入力装置
160 出力装置
200 推測モデル
210 モデルID
220 モデル属性
221 訓練データ使用情報
222 機械学習アルゴリズム種別情報
223 ハイパーパラメータ情報
224 説明変数使用情報
230 推測実行体
300 入力情報
310 テストデータ
320 外部推測結果
410 モデル推測結果情報
411 モデル推測結果
510 外部推測近似モデル集合
520 近似モデル集合共通属性
530 外部推測近似モデル集合特定部
540 近似モデル集合共通属性特定部
550 外部推測非近似モデル集合
610 推測根拠差異
620 推測根拠差異導出部
630 推測モデル属性
700 出力情報
710 推測根拠差異対応ガイドライン
800 推測根拠分析装置
810 推測モデル記憶部
820 推測実行部
830 推測根拠分析部
840 推測根拠差異分析部
910 モデル推測結果情報
911 モデル推測根拠
920 近似モデル集合共通推測根拠特定部
930 近似モデル集合共通推測根拠
940 メインモデル推測根拠
950 推測根拠差異導出部
960 推測根拠差異

Claims (11)

  1. 推測活動の推測根拠を分析する推測根拠分析装置であって、
    共通の問題を解く目的で設計または訓練された複数の推測モデルを記憶する推測モデル記憶部と、
    推測対象の情報を受け付け、前記推測対象の推測を各前記複数の推測モデルに基づいて実行し、当該推測の結果を表すモデル推測結果を導出する推測実行部と、
    前記推測対象に対する外部の手段による外部推測の結果を表す外部推測結果を受け付け、前記推測実行部による前記推測対象の推測において前記外部推測結果と同一または近似の前記モデル推測結果を導出した前記推測モデルの集合を特定し、当該集合に含まれる前記推測モデルの間の共通的な属性を前記外部推測結果に対応する推測根拠として推定する推測根拠分析部と、
    前記推測モデル記憶部が記憶する任意の前記推測モデルの属性と、前記推測根拠分析部が推定した前記外部推測結果に対応する推測根拠とを比較することによって、推測モデルと外部推測の間の推測根拠の差異を表す推測根拠差異を導出し、前記推測根拠差異に基づく情報を出力する推測根拠差異分析部と、
    を備えることを特徴とする推測根拠分析装置。
  2. 前記推測モデルは、機械学習に基づいて訓練されており、
    前記推測モデルの属性には、前記訓練に用いた訓練データが含まれる
    ことを特徴とする請求項1に記載の推測根拠分析装置。
  3. 前記推測モデルは、機械学習に基づいて訓練されており、
    前記推測モデルの属性には、前記訓練に用いた説明変数が含まれる
    ことを特徴とする請求項1に記載の推測根拠分析装置。
  4. 前記推測モデル記憶部は、前記複数の推測モデルとして、任意のメイン推測モデルと、前記メイン推測モデルの属性の一部に変更を加えた1以上の亜種推測モデルと、を記憶する
    ことを特徴とする請求項1に記載の推測根拠分析装置。
  5. 前記推測根拠分析部は、
    前記推測モデルの集合を特定した上で、
    前記集合に含まれる前記推測モデルの各属性の出現頻度を算出し、
    前記算出した出現頻度が予め設定した閾値を超える前記属性の集合を、前記外部推測結果に対応する推測根拠として推定する
    ことを特徴とする請求項1に記載の推測根拠分析装置。
  6. 前記推測根拠分析部は、
    前記推測モデルの集合を特定した上で、
    前記推測モデル記憶部が記憶する全ての前記推測モデルの属性に対して、前記集合に含まれる前記推測モデルにおける各属性の出現頻度と、前記集合に含まれない前記推測モデルにおける各属性の出現頻度とに基づいて、各属性の重要度を算出し、
    前記算出した重要度の順に整列した順序付きの前記各属性の集合を、前記外部推測結果に対応する推測根拠として推定する
    ことを特徴とする請求項1に記載の推測根拠分析装置。
  7. 前記推測根拠差異分析部は、前記推測根拠差異に基づく情報として、前記導出した前記推測根拠差異と、前記推測活動の改善を支援するための前記推測根拠差異に基づく指針例と、を出力する
    ことを特徴とする請求項1に記載の推測根拠分析装置。
  8. 推測活動の推測根拠を分析する推測根拠分析装置であって、
    共通の問題を解く目的で設計または訓練され、推測対象に対する推測を行った場合に当該推測の推測結果及び推測根拠を導出する、複数の推測モデルを記憶する推測モデル記憶部と、
    推測対象の情報を受け付け、前記推測対象の推測を各前記複数の推測モデルに基づいて実行し、当該推測の結果を表すモデル推測結果と当該推測の根拠を表すモデル推測根拠とを導出する推測実行部と、
    前記推測対象に対する外部の手段による外部推測の結果を表す外部推測結果を受け付け、前記推測実行部による前記推測対象の推測において前記外部推測結果と同一または近似の前記モデル推測結果を導出した前記推測モデルの集合を特定し、当該集合に含まれる前記推測モデルの間の共通的な前記モデル推測根拠を、前記外部推測結果に対応する推測根拠として推定する推測根拠分析部と、
    前記推測モデル記憶部が記憶する任意の前記推測モデルによる推測の前記モデル推測根拠と、前記推測根拠分析部が推定した前記外部推測結果に対応する推測根拠とを比較することによって、推測モデルと外部推測の間の推測根拠の差異を表す推測根拠差異を導出し、前記推測根拠差異に基づく情報を出力する推測根拠差異分析部と、
    を備えることを特徴とする推測根拠分析装置。
  9. 前記推測根拠分析部は、
    前記推測モデルの集合を特定した上で、
    前記集合に含まれる前記推測モデルが導出した各前記モデル推測根拠の出現頻度を算出し、
    前記算出した出現頻度が予め設定した閾値を超える前記モデル推測根拠の集合を、前記外部推測結果に対応する推測根拠として推定する
    ことを特徴とする請求項8に記載の推測根拠分析装置。
  10. 前記推測根拠分析部は、
    前記推測モデルの集合を特定した上で、
    前記推測モデル記憶部が記憶する全ての前記推測モデルが導出した前記モデル推測根拠に対して、前記集合に含まれる前記推測モデルが導出した各前記モデル推測根拠の出現頻度と、前記集合に含まれない前記推測モデルが導出した各前記モデル推測根拠の出現頻度とに基づいて、各前記モデル推測根拠の重要度を算出し、
    前記算出した重要度の順に整列した順序付きの前記モデル推測根拠の集合を、前記外部推測結果に対応する推測根拠として推定する
    ことを特徴とする請求項8に記載の推測根拠分析装置。
  11. 推測活動の推測根拠を分析する推測根拠分析装置による推測根拠分析方法であって、
    前記推測根拠分析装置が、共通の問題を解く目的で設計または訓練された複数の推測モデルを記憶する推測モデル記憶部を有し、
    推測対象の情報を受け付け、前記推測対象の推測を前記推測モデル記憶部が記憶する各前記複数の推測モデルに基づいて実行し、当該推測の結果を表すモデル推測結果を導出する推測実行ステップと、
    前記推測対象に対する外部の手段による外部推測の結果を表す外部推測結果を受け付け、前記推測実行ステップによる前記推測対象の推測において前記外部推測結果と同一または近似の前記モデル推測結果を導出した前記推測モデルの集合を特定し、当該集合に含まれる前記推測モデルの間の共通的な属性を前記外部推測結果に対応する推測根拠として推定する推測根拠分析ステップと、
    前記推測モデル記憶部が記憶する任意の前記推測モデルの属性と、前記推測根拠分析ステップで推定した前記外部推測結果に対応する推測根拠とを比較することによって、推測モデルと外部推測の間の推測根拠の差異を表す推測根拠差異を導出し、前記推測根拠差異に基づく情報を出力する推測根拠差異分析ステップと、
    を備えることを特徴とする推測根拠分析方法。
JP2020036725A 2020-03-04 2020-03-04 推測根拠分析装置及び推測根拠分析方法 Active JP7256766B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020036725A JP7256766B2 (ja) 2020-03-04 2020-03-04 推測根拠分析装置及び推測根拠分析方法
US17/015,283 US11544600B2 (en) 2020-03-04 2020-09-09 Prediction rationale analysis apparatus and prediction rationale analysis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020036725A JP7256766B2 (ja) 2020-03-04 2020-03-04 推測根拠分析装置及び推測根拠分析方法

Publications (2)

Publication Number Publication Date
JP2021140396A true JP2021140396A (ja) 2021-09-16
JP7256766B2 JP7256766B2 (ja) 2023-04-12

Family

ID=77556263

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020036725A Active JP7256766B2 (ja) 2020-03-04 2020-03-04 推測根拠分析装置及び推測根拠分析方法

Country Status (2)

Country Link
US (1) US11544600B2 (ja)
JP (1) JP7256766B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220156635A1 (en) * 2020-11-19 2022-05-19 Sap Se Machine Learning Prediction For Recruiting Posting
US20220366133A1 (en) * 2021-05-14 2022-11-17 Microsoft Technology Licensing, Llc Training a Model in a Data-Scarce Environment Using Added Parameter Information

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110004582A1 (en) * 2009-07-03 2011-01-06 Nankai University Method of constructing the intelligent computer systems based on information reasoning
JP2019082883A (ja) * 2017-10-31 2019-05-30 株式会社デンソー 推論装置、推論方法及びプログラム
JP2020017197A (ja) * 2018-07-27 2020-01-30 株式会社日立製作所 計算機システム及び予測器が出力した予測値の根拠に関連する情報の提示方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6669075B2 (ja) * 2014-10-28 2020-03-18 日本電気株式会社 領域線形モデル最適化システム、方法およびプログラム
CN104993522B (zh) * 2015-06-30 2018-01-19 中国电力科学研究院 一种基于mpc的主动配电网多时间尺度协调优化调度方法
US20180284746A1 (en) * 2016-05-09 2018-10-04 StrongForce IoT Portfolio 2016, LLC Methods and systems for data collection optimization in an industrial internet of things environment
WO2019028269A2 (en) * 2017-08-02 2019-02-07 Strong Force Iot Portfolio 2016, Llc METHODS AND SYSTEMS FOR DETECTION IN AN INDUSTRIAL ENVIRONMENT OF COLLECTING INTERNET DATA FROM OBJECTS WITH LARGE DATA SETS
US11327475B2 (en) * 2016-05-09 2022-05-10 Strong Force Iot Portfolio 2016, Llc Methods and systems for intelligent collection and analysis of vehicle data
US11232473B2 (en) * 2016-09-16 2022-01-25 Adap.Tv, Inc. Demographic prediction using aggregated labeled data
US10921801B2 (en) * 2017-08-02 2021-02-16 Strong Force loT Portfolio 2016, LLC Data collection systems and methods for updating sensed parameter groups based on pattern recognition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110004582A1 (en) * 2009-07-03 2011-01-06 Nankai University Method of constructing the intelligent computer systems based on information reasoning
JP2019082883A (ja) * 2017-10-31 2019-05-30 株式会社デンソー 推論装置、推論方法及びプログラム
JP2020017197A (ja) * 2018-07-27 2020-01-30 株式会社日立製作所 計算機システム及び予測器が出力した予測値の根拠に関連する情報の提示方法

Also Published As

Publication number Publication date
US11544600B2 (en) 2023-01-03
JP7256766B2 (ja) 2023-04-12
US20210279608A1 (en) 2021-09-09

Similar Documents

Publication Publication Date Title
US11734566B2 (en) Systems and processes for bias removal in a predictive performance model
Fenton et al. Software metrics: a rigorous and practical approach
Bazhenova et al. Discovering decision models from event logs
JP6144427B2 (ja) データ分析システムおよびデータ分析方法並びにデータ分析プログラム
US11562262B2 (en) Model variable candidate generation device and method
Harring et al. Fitting correlated residual error structures in nonlinear mixed-effects models using SAS PROC NLMIXED
Sharma et al. Data mining classification techniques to assign individual personality type and predict job profile
Vasquez Verdugo et al. Faired: A systematic fairness analysis approach applied in a higher educational context
JP7256766B2 (ja) 推測根拠分析装置及び推測根拠分析方法
Lee et al. Detecting fake reviews with supervised machine learning algorithms
Town et al. Data analytics tools: A user perspective
JP5905651B1 (ja) 実績評価装置、実績評価装置の制御方法、および実績評価装置の制御プログラム
Stefana et al. ProMetaUS: A proactive meta-learning uncertainty-based framework to select models for Dynamic Risk Management
Aksu et al. Automated prediction of relevant key performance indicators for organizations
Marshall et al. Number and quality of diagrams in scholarly publications is associated with number of citations
Farzadnia et al. Using Non-Negative Matrix Factorization to Identify the Factors Affecting the Performance of Bank Employees in Australia
US20220129792A1 (en) Method and apparatus for presenting determination result
JP2017054230A (ja) 集計分析装置、集計分析方法、及びプログラム
CN113468477B (zh) 一种敏感数据调查分析方法、存储介质及设备
Romeu On operations research and statistics techniques: Keys to quantitative data mining
Tarnowska et al. Visual analysis of relevant features in customer loyalty improvement recommendation
Nasution et al. Implementation of Delone and Mclean Model in Public Sector Institutions in Indonesia: 10.2478/bjlp-2022-001107
Kuznietsova et al. Business Intelligence Techniques for Missing Data Imputations
Samah et al. Aspect-Based Classification and Visualization of Twitter Sentiment Analysis Towards Online Food Delivery Services in Malaysia
JP2021018466A (ja) ルール抽出装置、情報処理装置、ルール抽出方法及びルール抽出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220509

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230331

R150 Certificate of patent or registration of utility model

Ref document number: 7256766

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150