JP7145059B2 - モデルの予測根拠提示システム及びモデルの予測根拠提示方法 - Google Patents

モデルの予測根拠提示システム及びモデルの予測根拠提示方法 Download PDF

Info

Publication number
JP7145059B2
JP7145059B2 JP2018231752A JP2018231752A JP7145059B2 JP 7145059 B2 JP7145059 B2 JP 7145059B2 JP 2018231752 A JP2018231752 A JP 2018231752A JP 2018231752 A JP2018231752 A JP 2018231752A JP 7145059 B2 JP7145059 B2 JP 7145059B2
Authority
JP
Japan
Prior art keywords
explanatory variables
data
prediction
prediction basis
influence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018231752A
Other languages
English (en)
Other versions
JP2020095398A (ja
Inventor
大輔 田代
剛 田中
聡 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018231752A priority Critical patent/JP7145059B2/ja
Publication of JP2020095398A publication Critical patent/JP2020095398A/ja
Application granted granted Critical
Publication of JP7145059B2 publication Critical patent/JP7145059B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、機械学習によって生成されたモデルを用いた予測の根拠を説明するための技術に関する。
学習データを用いた機械学習によって、目的変数及び説明変数の関係を数理的に表現するモデルを生成し、当該モデルを用いて未知の対象の説明変数の値から目的変数の値を予測する技術は、様々な分野で広く用いられている。
例えば、融資審査において、融資の申込者の貸倒れのリスクを予測する場合に、前述の技術が利用されている。この場合、融資の申込者の年齢及び年収等を説明変数とし、貸倒れのリスクを目的変数とするモデルが用いられる。モデルは、過去の融資実績データを用いた機械学習によって生成される。
近年の機械学習技術の高度化によって、生成されるモデルは複雑な構造となっている。このようなモデルのブラックボックス化によって、モデルが出力する予測結果の根拠の解釈及び説明が困難となっている。例えば、融資審査において、モデルが貸倒れのリスクがあると予測した根拠を説明できないという問題が生じる。
前述の問題に対して、非特許文献1には、モデルに入力されたデータに含まれる各説明変数の値が予測結果に与えた影響を示す影響度(重要度)を予測結果の根拠を示す情報として算出する方法が記載されている。
しかし、一つの特徴(予測結果の要因)に関連する説明変数が複数ある場合、多重共線性の問題により、予測結果に対する一つの特徴の影響は、関連する複数の説明変数の影響度として出力される。そのため、説明変数の影響度の比較だけでは、予測根拠の解釈及び説明が困難となる。
特許文献1には、目的時系列データに影響する説明時系列データを特定する場合、類似性に基づいて説明時系列データをグループ化し、グループの代表時系列データを用いて分析を行うことにより、多重共線性の問題を解決する方法が記載されている。
国際公開第2018/096683号
LUNDBERG, Scott M.; LEE, Su-In. A unified approach to interpreting model predictions. In: Advances in Neural Information Processing Systems. 2017. p. 4768-4777.
しかし、特許文献1に記載の方法では、独立でない説明変数のグループが存在する場合、当該グループがモデル内でどのように使われているかを把握できない。そのため、独立でないという理由でいずれかの説明変数を除いた場合、モデルの予測精度が低下する可能性がある。
また、予測根拠の解釈及び説明を容易に行うために、独立した説明変数を用いた新たなモデルを生成することも考えられる。しかし、外部から提供されたモデルを用いている場合、又は、新たなモデルの生成に要するコストが高い場合、当該方法は採用できない。
本発明は、独立でない説明変数を含む入力データをモデルに入力することによって得られた予測結果に対して、理解が容易な予測根拠を提示するシステム及び方法を提供する。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、複数の説明変数の値から構成される入力データを入力することによって、任意の事象の予測を行うモデルの予測根拠提示システムであって、プロセッサ及び前記プロセッサに接続されるメモリを有する少なくとも一つの計算機を備え、前記モデルに基づく演算処理によって出力された予測結果に対して、前記入力データを構成する前記複数の説明変数の値の影響を示す影響度を算出し、前記複数の説明変数の影響度から構成される予測根拠データを生成する予測根拠出力部と、集約可能な説明変数を特定する集約変数決定部と、前記予測根拠データを表示するための表示情報を出力する結果出力部と、前記入力データの履歴及び前記予測根拠データの履歴を格納する記憶部と、を備え、前記集約変数決定部は、複数の前記入力データの履歴及び複数の前記予測根拠データの履歴を用いて、前記説明変数の値間の関連性を分析する第1の分析処理、及び前記説明変数の影響度間の関連性を分析する第2の分析処理を実行し、前記第1の分析処理及び前記第2の分析処理の結果に基づいて、前記集約可能な説明変数を特定し、前記結果出力部は、前記集約可能な説明変数からグループを生成し、前記グループに含まれる前記複数の説明変数の影響度から集約影響度を算出し、前記予測根拠データを、集約されていない説明変数の影響度及び前記グループの集約影響度を対応づけたデータから構成される集約予測根拠データに変換し、前記集約予測根拠データに基づいて前記表示情報を生成する。
本発明の一形態によれば、理解が容易な予測根拠を提示することができる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
実施例1の予測根拠提示システムの構成の一例を示す図である。 実施例1の予測対象データ記憶部に格納されるデータの一例を示す図である。 実施例1の予測根拠データ記憶部に格納されるデータの一例を示す図である。 実施例1の関連指標記憶部に格納されるデータの一例を示す図である。 実施例1の集約変数記憶部に格納されるデータの一例を示す図である。 実施例1の予測根拠提示システムが実行する処理の概要の一例を説明するフローチャートである。 実施例1の端末を介してユーザに提示される情報の一例を示す図である。 実施例1の端末を介してユーザに提示される情報の一例を示す図である。 実施例1の関連指標算出部が実行する関連指標算出処理の一例を説明するフローチャートである。 実施例1の関連指標記憶部が実行する関連指標データ登録処理の一例を説明するフローチャートである。 実施例1の関連指標受付部が端末を介してユーザに提示する操作画面の一例を示す図である。 実施例1の関連指標受付部が端末を介してユーザに提示する操作画面の一例を示す図である。 実施例1の集約変数決定部が実行する集約変数決定処理を説明するフローチャートである。
以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施例の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。
以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。
本明細書等における「第1」、「第2」、「第3」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。
図1は、実施例1の予測根拠提示システム100の構成の一例を示す図である。
予測根拠提示システム100は、少なくとも一つの計算機(図示省略)から構成され、また、予測根拠提示システム100には、端末150が接続される。
計算機は、プロセッサ、メモリ、記憶装置、ネットワークインタフェース、及びI/Oインタフェースを有する。記憶装置は、HDD(Hard Disk Drive)及びSSD(Solid State Drive)等である。メモリには、機能部を実現するプログラムが格納される。また、メモリは、機能部が使用するワークエリアを含む。プロセッサは、プログラムにしたがって処理を実行することによって、前述の機能部として動作する。以下の説明では、機能部を主語に処理を説明する場合、プロセッサが機能部を実現するプログラムを実行していることを示す。
予測根拠提示システム100は、端末150から、複数の説明変数Xiの値から構成される予測対象データを受信し、当該予測対象データに対して、任意の事象を予測するためのモデルに基づく処理を実行することによって予測結果を出力する。添字iは1からnまでの整数であり、また、nは1より大きい整数である。予測対象データは、説明変数の値以外にデータの識別情報及びタイムスタンプ等を含んでもよい。
また、予測根拠提示システム100は、出力された予測結果の根拠を示す予測根拠データを生成する。実施例1では、予測結果に対する各説明変数の値の影響の大きさを評価する値、すなわち、各説明変数の影響度から構成されるデータが予測根拠データとして生成される。
さらに、予測根拠提示システム100は、説明変数の関連性を分析することによって集約する説明変数を特定し、特定された説明変数の影響度を集約する。予測根拠提示システム100は、予測根拠データを、集約されていない影響度及び集約された影響度から構成される集約予測根拠データに変換し、予測結果及び集約予測根拠データ等をユーザに提示するための表示情報を生成し、端末150に対して表示情報を送信する。
実施例1の予測根拠提示システム100は、前述した処理を実現するための機能構成として、データ受付部101、関連指標受付部102、予測実行部103、予測根拠出力部104、実行管理部105、関連指標算出部106、集約変数決定部107、結果出力部108、モデル記憶部110、予測対象データ記憶部111、予測根拠データ記憶部112、関連指標記憶部113、及び集約変数記憶部114を有する。
モデル記憶部110はモデルの情報を記憶する。モデルは、図示しない機械学習を実行するモデル生成部によって生成される。モデル生成部は、予測根拠提示システム100に含まれてもよいし、また、予測根拠提示システム100とは異なる外部のシステムに含まれてもよい。なお、実施例1のモデルは、予測根拠を示すデータが生成可能なモデルであればよい。
予測対象データ記憶部111は、予測対象データを記憶し、管理する。予測対象データ記憶部111によって管理されるデータの詳細は図2を用いて説明する。
予測根拠データ記憶部112は、予測根拠データを記憶し、管理する。予測根拠データ記憶部112によって管理されるデータの詳細は図3を用いて説明する。
関連指標記憶部113は、関連指標算出部106によって算出される関連指標に関するデータ(関連指標データ)を記憶し、管理する。ここで、関連指標は、対象間の関連性を示す指標である。関連指標記憶部113によって管理されるデータの詳細は図4を用いて説明する。
集約変数記憶部114は、集約変数決定部107によって決定された説明変数の組合せ(グループ)に関するデータ(グループデータ)を記憶し、管理する。集約変数記憶部114によって管理されるデータの詳細は図5を用いて説明する。
データ受付部101は、端末150から予測対象データを受信し、予測実行部103及び予測対象データ記憶部111に予測対象データを送信する。
関連指標受付部102は、端末150から関連指標に対する操作に関するデータ(操作データ)を受信し、関連指標記憶部113に送信する。
予測実行部103は、モデル記憶部110に記憶されたモデルの情報を取得し、予測対象データに対してモデルに基づく処理を実行することによって予測結果を出力する。また、予測実行部103は、結果出力部108に予測結果を送信する。
予測根拠出力部104は、予測結果に対する各説明変数の影響度を算出し、複数の説明変数の影響度を含む予測根拠データを生成する。例えば、非特許文献1に記載の算出方法に基づいて影響度が算出される。また、予測根拠出力部104は、結果出力部108及び予測根拠データ記憶部112に予測根拠データを送信する。
実行管理部105は、関連指標算出部106及び集約変数決定部107の実行タイミングを制御する。例えば、実行管理部105は、予測対象データ記憶部111及び予測根拠データ記憶部112に格納されるデータの数が閾値より大きい場合、実行周期を経過した場合、端末150からの実行指示を受信した場合、関連指標算出部106及び集約変数決定部107に処理の実行を指示する。
関連指標算出部106は、予測対象データ及び予測根拠データを用いて関連指標を算出する。関連指標算出部106は、算出された関連指標を含む関連指標データを生成し、当該関連指標データを関連指標記憶部113に送信する。関連指標算出部106は、例えば、回帰分析から算出される相関係数の絶対値を関連指標として算出する。
集約変数決定部107は、関連指標記憶部113が管理する関連指標データに基づいて集約する説明変数を決定し、決定された説明変数から生成されるグループのグループデータを生成する。集約変数決定部107は、グループデータを集約変数記憶部114に出力する。
結果出力部108は、予測根拠データ及びグループデータに基づいて、集約する説明変数の影響度を集約することによって集約予測根拠データを生成する。結果出力部108は、予測結果及び集約予測根拠データに基づいて表示情報を生成し、表示情報を端末150に送信する。例えば、予測結果と、説明変数の影響度及びグループの影響度を表す棒グラフとを表示するための表示情報が生成される。
なお、予測根拠提示システム100が有する機能部については、複数の機能部を一つの機能部にまとめてもよいし、一つの機能部を機能毎に複数の機能部に分けてもよい。例えば、結果出力部108に、実行管理部105、関連指標算出部106、及び集約変数決定部107の機能を含めてもよい。また、予測対象データ記憶部111及び予測根拠データ記憶部112を一つの履歴データ記憶部としてもよい。
ここで、モデルの一例として、二つのクラス(クラス0及びクラス1)の分類を行うモデルを考える。当該モデルからは、クラス1である確率を示す値が予測結果として出力されるものとする。なお、確率の値の範囲は0以上かつ1以下の実数である。
予測結果の値をYとし、基準値をY0とし、予測結果に対する説明変数Xiの影響度をYiとした場合、非特許文献1によれば、影響度Yiは式(1)を満たすように算出される。
Figure 0007145059000001
影響度Yiは正又は負の実数である。正の値は「クラス1」となる予測への影響を示し、負の値は「クラス1」とならない予測への影響を示す。また、影響度の絶対値の大きいは、予測に対する説明変数の影響の大きさを示す。
相関関係等の関連性が存在する説明変数が含まれる場合、すなわち、一つの要因に関連する説明変数が複数存在する場合、予測結果に対する当該要因の影響は、複数の説明変数の影響度として算出される。そのため、予測根拠となる説明変数を特定することが困難になる。そこで、実施例1の予測根拠提示システム100は、説明変数の関連性を分析して、関連性がある説明変数の組合せを特定し、当該説明変数の組合せに基づいて影響度を集約する。これによって、ユーザの理解が容易な予測根拠を提示することができる。
図2は、実施例1の予測対象データ記憶部111に格納されるデータの一例を示す図である。
予測対象データ記憶部111は、受信した予測対象データを履歴情報200として管理する。履歴情報200は、ID201及び値202から構成されるレコードを一つ以上格納する。一つのレコードが一つの予測対象データに対応する。
ID201は、予測対象データの識別情報を格納するフィールドである。値202は、予測対象データに含まれる複数の説明変数の各々の値を格納するフィールド群である。
図3は、実施例1の予測根拠データ記憶部112に格納されるデータの一例を示す図である。
予測根拠データ記憶部112は、受信した予測根拠データを履歴情報300として管理する。履歴情報300は、ID301及び影響度302から構成されるレコードを一つ以上格納する。一つのレコードが一つの予測根拠データに対応する。
ID301はID201と同一のフィールドである。すなわち、一つの予測対象データを用いて行われた予測の予測根拠には、当該予測対象データと同一の識別情報が付与される。影響度302は、予測結果に対する各説明変数の影響度を格納するフィールド群である。
図4は、実施例1の関連指標記憶部113に格納されるデータの一例を示す図である。
関連指標記憶部113は、受信した関連指標データ及び操作データを分析情報400として管理する。分析情報400は、第1説明変数401、第2説明変数402、データ関連指標403、影響度関連指標404、入力データ関連指標405、及び入力影響度関連指標406から構成されるレコードを一つ以上格納する。一つの関連指標データに対して一つの分析情報400が生成される。また、分析情報400には、一つの説明変数のペアに対して一つのレコードが存在する。
第1説明変数401及び第2説明変数402は、ペアを組む説明変数の識別情報を格納するフィールドである。
データ関連指標403は、ペアを組む説明変数の値の間の関連性を示す指標(データ関連指標)を格納するフィールドである。影響度関連指標404は、ペアを組む説明変数の影響度の間の関連性を示す指標(影響度関連指標)を格納するフィールドである。データ関連指標403及び影響度関連指標404には、関連指標データに含まれる値が設定される。
入力データ関連指標405は、端末150を介して入力されたデータ関連指標を格納するフィールドである。入力影響度関連指標406は、端末150を介して入力された影響度関連指標を格納するフィールドである。入力データ関連指標405及び入力影響度関連指標406には、操作データに含まれる値が設定される。なお、対応するペアのデータ関連指標又は影響度関連指標が入力されていない場合、当該レコードの入力データ関連指標405又は入力影響度関連指標406は空欄となる。
図5は、実施例1の集約変数記憶部114に格納されるデータの一例を示す図である。
集約変数記憶部114は、受信したグループデータを集約説明変数情報500として管理する。
集約説明変数情報500は、グループ501及び要素説明変数502から構成されるレコードを一つ以上格納する。集約説明変数情報500には、一つのグループに対して一つのレコードが存在する。
グループ501は、グループの識別情報を格納するフィールドである。要素説明変数502は、グループに含まれる説明変数の識別情報を格納するフィールドである。
図5の集約説明変数情報500には、説明変数X4及び説明変数X6から構成されるグループと、説明変数X8及び説明変数X9から構成されるグループとが記憶されている。
図6は、実施例1の予測根拠提示システム100が実行する処理の概要の一例を説明するフローチャートである。図7A及び図7Bは、実施例1の端末150を介してユーザに提示される情報の一例を示す図である。
データ受付部101は、端末150から予測対象データを受信する(ステップS601)。データ受付部101は、予測実行部103、予測根拠出力部104、及び予測対象データ記憶部111に受信した予測対象データを送信する。
予測対象データ記憶部111は、履歴情報200に、受信した予測対象データに対応するレコードを追加する。
予測実行部103は、予測対象データを受信した場合、モデル記憶部110からモデルの情報を取得し、予測対象データに対してモデルに基づく処理を実行し、予測結果を出力する(ステップS602)。予測実行部103は、予測根拠出力部104及び結果出力部108に予測結果を送信する。
予測根拠出力部104は、予測対象データを受信した場合、予測結果に対する説明変数の影響度を算出する(ステップS603)。予測根拠出力部104は、予測根拠データ記憶部112及び結果出力部108に、算出された影響度を含む予測根拠データを送信する。
具体的には、予測根拠出力部104は、モデル記憶部110からモデルの情報を取得し、数理的手法により、予測結果に対する予測対象データの各説明変数の影響度を算出する。
予測根拠データ記憶部112は、履歴情報300に、受信した予測根拠データに対応するレコードを追加する。
結果出力部108は、集約変数記憶部114が管理する集約説明変数情報500を参照し、ターゲットレコードを選択する(ステップS604)。
なお、この時点で集約説明変数情報500が生成されていない場合、結果出力部108は、実行管理部105に実行要求を出力する。実行管理部105は、実行要求を受け付けた場合、関連指標算出部106及び集約変数決定部107に実行指示を出力する。実行管理部105は、関連指標算出部106及び集約変数決定部107の処理の完了を確認した後、結果出力部108に処理の完了を通知する。
結果出力部108は、ターゲットレコードに基づいて、集約する説明変数の影響度を集約する(ステップS605)。
具体的には、結果出力部108は、予測根拠データを参照し、ターゲットレコードの要素説明変数502に対応する説明変数の影響度を取得し、取得した影響度を合計する。結果出力部108は、ターゲットレコードの要素説明変数502に対応する説明変数の影響度のフィールドを予測根拠データから削除し、グループのフィールドを予測根拠データに追加する。さらに、結果出力部108は、グループのフィールドに影響度の合計値を設定する。全てのグループに対して同様の処理が実行されることによって、予測根拠データが集約予測根拠データに変換される。
結果出力部108は、集約説明変数情報500の全てのレコードについて処理が完了したか否かを判定する(ステップS606)。
集約説明変数情報500の全てのレコードについて処理が完了していないと判定された場合、結果出力部108は、ステップS604に戻り、同様の処理を実行する。
集約説明変数情報500の全てのレコードについて処理が完了したと判定された場合、結果出力部108は、図7A又は図7Bに示すような予測根拠情報700、710を提示するための表示情報を生成し、端末150に表示情報を送信する(ステップS607)。
図7Aの予測根拠情報700は、説明変数701、影響度702、及び値703から構成されるレコードを一つ以上含む。一つのレコードは、一つの説明変数又は一つのグループに対応する。予測根拠情報700のレコードは影響度の絶対値が大きい順にソートされている。
説明変数701は、説明変数又はグループの識別情報を格納するフィールドである。影響度702は、説明変数又はグループの影響度を格納するフィールドである。値703は、説明変数の値、又は、グループに含まれる説明変数の値を格納するフィールドである。
図7Bの予測根拠情報700は、説明変数711、影響度712、値713、要素説明変数714、要素値715、及び要素影響度716から構成されるレコードを一つ以上含む。一つのレコードは、一つの説明変数又は一つの集約説明変数に対応する。
説明変数711及び影響度712は、説明変数701及び影響度702と同一のフィールドである。値713は、一つの説明変数の値を格納する。グループに対応するレコードの場合、値713は空欄となる。
要素説明変数714は、グループに含まれる説明変数の識別情報を格納するフィールドである。要素値715は、グループに含まれる説明変数の値を格納するフィールドである。要素影響度716は、グループに含まれる説明変数の影響度を格納するフィールドである。説明変数に対応するレコードの場合、要素説明変数714、要素値715、及び要素影響度716は空欄となる。
図7A及び図7Bの予測根拠情報700、710には、説明変数X4及び説明変数X7から構成されるグループのレコードが含まれる。当該レコードの影響度702、712には、各説明変数の影響度の合計値が格納される。
このように、関連性がある説明変数を集約することによって生成されたグループの影響度を提示することによって、影響度の比較が容易となる。例えば、説明変数X4及び説明変数X7の個別の影響度は、説明変数X6の影響度より小さく、関連する要因の影響が正しく評価できない。一方、グループの影響度を提示することによって、予測結果に影響を与える要因を評価できる。
次に、関連指標算出部106が実行する関連指標算出処理、関連指標記憶部113が実行する関連指標データ登録処理、及び集約変数決定部107が実行する集約変数決定処理について説明する。
図8は、実施例1の関連指標算出部106が実行する関連指標算出処理の一例を説明するフローチャートである。
関連指標算出部106は、実行管理部105から実行指示を受け付けた場合、関連指標算出処理を開始する。
関連指標算出部106は説明変数の組合せのリストを生成する(ステップS801)。具体的には、関連指標算出部106は説明変数のペアを生成し、当該ペアのリストを生成する。
関連指標算出部106は、リストからターゲットペアを選択する(ステップS802)。
関連指標算出部106は、予測対象データ記憶部111が管理する履歴情報200の各レコードから、ターゲットペアを組む説明変数の値を取得する(ステップS803)。関連指標算出部106は、ターゲットペアを組む説明変数の値から構成される第1の一時レコード群を生成する。履歴情報200一つのレコードに対して一つの第1の一時レコードが生成される。
関連指標算出部106は、第1の一時レコード群を用いた統計分析を実行することによって、データ関連指標を算出する(ステップS804)。例えば、関連指標算出部106は、各説明変数の値の相関を示す相関係数を、データ関連指標として算出する。
関連指標算出部106は、予測根拠データ記憶部112が管理する履歴情報300の各レコードから、ターゲットペアを組む説明変数の影響度を取得する(ステップS805)。関連指標算出部106は、ターゲットペアを組む説明変数の影響度から構成される第2の一時レコード群を生成する。履歴情報300の一つのレコードに対して一つの第2の一時レコードが生成される。
関連指標算出部106は、第2の一時レコード群を用いた統計分析を実行することによって、影響度関連指標を算出する(ステップS806)。例えば、関連指標算出部106は、各説明変数の影響度の相関を示す相関係数を、影響度関連指標として算出する。このとき、関連指標算出部106は、ターゲットペアを組む説明変数の識別情報、データ関連指標、及び影響度関連指標から構成される登録レコードを生成する。
関連指標算出部106は、リストに登録された全てのペアに対して処理が完了したか否かを判定する(ステップS807)。
リストに登録された全てのペアに対して処理が完了していないと判定された場合、関連指標算出部106は、ステップS802に戻り、同様の処理を実行する。
リストに登録された全てのペアに対して処理が完了したと判定された場合、関連指標算出部106は、各ペアの登録レコードを関連指標記憶部113に送信する(ステップS808)。その後、関連指標算出部106は関連指標算出処理を終了する。
関連指標記憶部113は登録レコード群を受信した場合、以下のような処理を実行する。
(処理1)関連指標記憶部113は、ターゲット登録レコードを選択する。
(処理2)関連指標記憶部113は、分析情報400を参照し、第1説明変数401及び第2説明変数402の組合せが、ターゲット登録レコードの説明変数の組合せと一致するレコードが存在するか否かを判定する。
(処理3)条件を満たすレコードが存在する場合、関連指標記憶部113は、当該レコードのデータ関連指標403及び影響度関連指標404に、ターゲット登録レコードのデータ関連指標及び影響度関連指標を設定する。
(処理4)条件を満たすレコードが存在しない場合、関連指標記憶部113は、分析情報400にレコードを追加し、追加されたレコードの第1説明変数401及び第2説明変数402にターゲット登録レコードの説明変数の組合せを設定する。また、関連指標記憶部113は、追加されたレコードのデータ関連指標403及び影響度関連指標404に、ターゲット登録レコードのデータ関連指標及び影響度関連指標を設定する。
(処理5)関連指標記憶部113は、全ての登録レコードについて処理が完了したか否かを判定する。
全ての登録レコードについて処理が完了していない場合、関連指標記憶部113は、(処理1)から(処理5)までの処理を再度実行する。全ての登録レコードについて処理が完了した場合、関連指標記憶部113は処理を終了する。
図9は、実施例1の関連指標記憶部113が実行する関連指標データ登録処理の一例を説明するフローチャートである。図10A及び図10Bは、実施例1の関連指標受付部102が端末150を介してユーザに提示する操作画面1000の一例を示す図である。
関連指標受付部102は、端末150から関連指標の設定要求を受信した場合、端末150を介して図10Aに示す操作画面1000を提示する。ここで、操作画面1000の構成について説明する。
操作画面1000は、分析情報操作欄1010、外部設定値比較ボタン1020、及び設定ボタン1030を含む。
分析情報操作欄1010は、分析情報400と同一のデータ構造のテーブルを表示する欄である。
分析情報操作欄1010のフィールド名には、レコードを並び替えるためのソートボタンが設けられる。分析情報操作欄1010に格納されるレコードの入力データ関連指標フィールド及び入力影響度関連指標フィールドは、ユーザからの操作を受け付けるように制御される。
ユーザは、擬似相関により関連指標が高く算出されたペアが集約されないように制御するため、又は、関連指標が低く算出されたペアが集約されるように制御するため、当該フィールドに値を設定する。例えば、図10Aでは、説明変数X8及び説明変数X10から構成されるペアのデータ関連指標、説明変数X1及び説明変数X9から構成されるペアのデータ関連指標、及び説明変数X5及び説明変数X7から構成されるペアの影響度関連指標が修正される。
外部設定値比較ボタン1020が操作された場合、関連指標受付部102は、入力データ関連指標フィールド及び入力影響度関連指標フィールドのいずれかに値が設定されたレコードについて、算出された関連指標と入力された関連指標との間の比較結果を表示する。
例えば、図10Bに示すような比較表1050が比較結果として表示される。比較表1050は、算出されたデータ関連指標及び入力されたデータ関連指標の差分と、算出された影響度関連指標及び入力されたた影響度関連指標の差分とを格納するフィールドを含む。
ユーザが設定ボタン1030を操作した場合、関連指標受付部102は、分析情報操作欄1010を更新情報として関連指標記憶部113に出力する。
以上が操作画面1000の説明である。図9の説明に戻る。
関連指標記憶部113は、操作画面1000を介して、更新情報を受信する(ステップS901)。
関連指標記憶部113は、分析情報操作欄1010からターゲットレコードを選択する(ステップS902)。
関連指標記憶部113は、分析情報400を参照し、ターゲットレコードに対応するレコードを検索し(ステップS903)、ターゲットレコードに基づいて、検索されたレコードを更新する(ステップS904)。なお、関連指標記憶部113は、ターゲットレコード及び検索されたレコードの値を比較し、変更された値が存在しない場合、ステップS904の処理を省略する。
関連指標記憶部113は、分析情報操作欄1010の全てのレコードについて処理が完了したか否かを判定する(ステップS905)。
分析情報操作欄1010の全てのレコードについて処理が完了していないと判定された場合、関連指標記憶部113は、ステップS902に戻り、同様の処理を実行する。
分析情報操作欄1010の全てのレコードについて処理が完了したと判定された場合、関連指標記憶部113は関連指標データ登録処理を終了する。
統計分析において、偶発的に、関連指標の値が大きくなる場合がある。また、説明変数間の関係が複雑なため、統計分析からは関連指標を算出できない場合がある。そのため、予測根拠提示システム100は、ユーザの知識等を反映するために、関連指標を外部から入力する機能を提供する。
図11は、実施例1の集約変数決定部107が実行する集約変数決定処理を説明するフローチャートである。
集約変数決定部107は、集約変数記憶部114に初期化指示を出力する(ステップS1101)。集約変数記憶部114は、初期化指示を受け付けた場合、集約説明変数情報500を初期化する。
集約変数決定部107は、関連指標記憶部113が管理する分析情報400からターゲットレコードを選択する(ステップS1102)。
集約変数決定部107は、ターゲットレコードの入力データ関連指標405が空欄であるか否かを判定する(ステップS1103)。
ターゲットレコードの入力データ関連指標405が空欄であると判定された場合、集約変数決定部107は、ターゲットレコードのデータ関連指標403の値が第1の閾値より大きいか否かを判定する(ステップS1104)。第1の閾値は予め設定されているものとする。ただし、第1の閾値は任意のタイミングで更新できる。
ターゲットレコードのデータ関連指標403の値が第1の閾値以下であると判定された場合、集約変数決定部107はステップS1110に進む。
ターゲットレコードのデータ関連指標403の値が第1の閾値より大きいと判定された場合、集約変数決定部107はステップS1106に進む。
ステップS1103において、ターゲットレコードの入力データ関連指標405が空欄でないと判定された場合、集約変数決定部107は、ターゲットレコードの入力データ関連指標405の値が第2の閾値より大きいか否かを判定する(ステップS1105)。第2の閾値は予め設定されているものとする。ただし、第2の閾値は任意のタイミングで更新できる。
ターゲットレコードの入力データ関連指標405の値が第2の閾値以下であると判定された場合、集約変数決定部107はステップS1110に進む。
ターゲットレコードの入力データ関連指標405の値が第2の閾値より大きいと判定された場合、集約変数決定部107はステップS1106に進む。
ステップS1104又はステップS1105の判定結果がYESである場合、集約変数決定部107は、ターゲットレコードの入力影響度関連指標406が空欄であるか否かを判定する(ステップS1106)。
ターゲットレコードの入力影響度関連指標406が空欄であると判定された場合、集約変数決定部107は、ターゲットレコードの影響度関連指標404の値が第3の閾値より大きいか否かを判定する(ステップS1107)。第3の閾値は予め設定されているものとする。ただし、第3の閾値は任意のタイミングで更新できる。
ターゲットレコードの影響度関連指標404の値が第3の閾値以下であると判定された場合、集約変数決定部107はステップS1110に進む。
ターゲットレコードの影響度関連指標404の値が第3の閾値より大きいと判定された場合、集約変数決定部107はステップS1109に進む。
ステップS1106において、ターゲットレコードの入力影響度関連指標406が空欄でないと判定された場合、集約変数決定部107は、ターゲットレコードの入力影響度関連指標406の値が第4の閾値より大きいか否かを判定する(ステップS1108)。第4の閾値は予め設定されているものとする。ただし、第4の閾値は任意のタイミングで更新できる。
ターゲットレコードの入力影響度関連指標406の値が第4の閾値以下であると判定された場合、集約変数決定部107はステップS1110に進む。
ターゲットレコードの入力影響度関連指標406の値が第4の閾値より大きいと判定された場合、集約変数決定部107はステップS1109に進む。
ステップS1107又はステップS1108の判定結果がYESである場合、集約変数決定部107は、ターゲットレコードに対応する説明変数のペアに関するグループデータを生成し、集約変数記憶部114に当該グループデータを送信する(ステップS1109)。
ステップS1104、ステップS1105、ステップS1107、若しくはステップS1108の判定結果がNOである場合、又は、ステップS1109の処理が実行された後、集約変数決定部107は、分析情報400の全レコードの処理が完了したか否かを判定する(ステップS1110)。
分析情報400の全レコードの処理が完了していないと判定された場合、集約変数決定部107は、ステップS1102に戻り、同様の処理を実行する。
分析情報400の全レコードの処理が完了したと判定された場合、集約変数決定部107は集約変数決定処理を終了する。
ステップS1104及びステップS1105は、ペアを組む説明変数の値の間に関連性が存在するか否かを判定するための処理である。データ関連指標403の値が第1の閾値より大きい場合、又は、入力データ関連指標405の値が第2の閾値より大きい場合、ペアを組む説明変数の値の間に関連性が存在すると判定される。
ステップS1106及びステップS1108は、ペアを組む説明変数の影響度の間に関連性が存在するか否かを判定するための処理である。影響度関連指標404の値が第3の閾値より大きい場合、又は、入力影響度関連指標406の値が第4の閾値より大きい場合、ペアを組む説明変数の影響度の間に関連性が存在すると判定される。
実施例1では、ペアを組む説明変数の値の間に関連性が存在し、かつ、ペアを組む説明変数の影響度の間に関連性が存在する場合、集約変数決定部107は、ペアを組む説明変数の間には関連性が存在するため集約できると判定する。
なお、ステップS1110の判定結果がYESである場合、集約変数決定部107は、集約説明変数情報500を参照し、推移律に基づいて、複数のペアを集約してもよい。これによって、三つ以上の説明変数から構成されるグループを生成できる。例えば、説明変数X1及び説明変数X2から構成されるグループと、説明変数X2及び説明変数X3から構成されるグループが存在する場合、集約変数決定部107は、説明変数X1、説明変数X2、及び説明変数X3から構成されるグループを生成する。
なお、第1の閾値、第2の閾値、第3の閾値、及び第4の閾値は、それぞれ、独立して決定することができる。
ここで、図4の分析情報400を例に、集約変数決定処理の具体的な処理について説明する。第1の閾値、第2の閾値、第3の閾値、及び第4の閾値は「0.9」に設定されているものとする。
説明変数X4及び説明変数X6のペアは、データ関連指標403が「0.9」より大きく、かつ、影響度関連指標404が「0.9」より大きいため、当該ペアに関するレコードが集約説明変数情報500に追加される。一方、説明変数X1及び説明変数X3のペアは、データ関連指標403は「0.9」より大きいが、入力影響度関連指標406は「0.9」以下である。したがって、当該ペアは集約する説明変数の組合せとして選択されない。
以上のように、実施例1によれば、任意のモデルを用いて行われた事象の予測の根拠を示す情報を提示する場合に、集約可能な複数の説明変数を決定し、複数の説明変数からグループを生成し、グループ単位で集約された影響度を提示できる。これによって、影響度の比較による予測根拠の理解が容易となる。
(変形例)
実施例1では、予測根拠提示システム100は、関連指標及び閾値の比較結果に基づいて、説明変数間の関連性の有無を判定していた。しかし、説明変数間の関連性の有無を判定する方法はこれに限定されない。例えば、説明変数の値の関連性及び説明変数の影響度の関連性を示す関数の有無に基づいて、説明変数間の関連性の有無を判定してもよい。この場合、以下のように構成及び処理を変更すればよい。
分析情報400は、関連指標を格納するフィールドの代わりに、関数を格納するフィールドを含む。
関連指標算出処理では、関連指標算出部106は、ステップS804において、説明変数の値の関連性を示す関数を生成するための統計分析を実行し、ステップS806において、説明変数の影響度の関連性を示す関数を生成するための統計分析を実行する。
集約変数決定処理では、集約変数決定部107は、説明変数の値の関連性を示す関数及び説明変数の影響度の関連性を示す関数が存在する説明変数のグループを、集約説明変数情報500に登録する。
なお、集約変数決定処理では、関数の次数に基づいて、説明変数の値及び説明変数の影響度の関連性の有無を判定してもよい。例えば、説明変数の値の関連性を示す関数が存在し、かつ、関数の最高次数が2以下の場合、集約変数決定部107は、説明変数の値の間に関連性があると判定する。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD-ROM、DVD-ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD-R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Python、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD-RW、CD-R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
100 予測根拠提示システム
101 データ受付部
102 関連指標受付部
103 予測実行部
104 予測根拠出力部
105 実行管理部
106 関連指標算出部
107 集約変数決定部
108 結果出力部
110 モデル記憶部
111 予測対象データ記憶部
112 予測根拠データ記憶部
113 関連指標記憶部
114 集約変数記憶部
150 端末
200、300 履歴情報
400 分析情報
500 集約説明変数情報
700 表示情報
1000 操作画面
1010 分析情報操作欄
1020 外部設定値比較ボタン
1030 設定ボタン
1050 比較表

Claims (8)

  1. 複数の説明変数の値から構成される入力データを入力することによって、任意の事象の予測を行うモデルの予測根拠提示システムであって、
    プロセッサ及び前記プロセッサに接続されるメモリを有する少なくとも一つの計算機を備え、
    前記モデルに基づく演算処理によって出力された予測結果に対して、前記入力データを構成する前記複数の説明変数の値の影響を示す影響度を算出し、前記複数の説明変数の影響度から構成される予測根拠データを生成する予測根拠出力部と、
    集約可能な説明変数を特定する集約変数決定部と、
    前記予測根拠データを表示するための表示情報を出力する結果出力部と、
    前記入力データの履歴及び前記予測根拠データの履歴を格納する記憶部と、
    を備え、
    前記集約変数決定部は、
    複数の前記入力データの履歴及び複数の前記予測根拠データの履歴を用いて、前記説明変数の値間の関連性を分析する第1の分析処理、及び前記説明変数の影響度間の関連性を分析する第2の分析処理を実行し、
    前記第1の分析処理及び前記第2の分析処理の結果に基づいて、前記集約可能な説明変数を特定し、
    前記結果出力部は、
    前記集約可能な説明変数からグループを生成し、
    前記グループに含まれる前記複数の説明変数の影響度から集約影響度を算出し、
    前記予測根拠データを、集約されていない説明変数の影響度及び前記グループの集約影響度を対応づけたデータから構成される集約予測根拠データに変換し、
    前記集約予測根拠データに基づいて前記表示情報を生成することを特徴とするモデルの予測根拠提示システム。
  2. 請求項1に記載のモデルの予測根拠提示システムであって、
    前記集約変数決定部は、
    前記第1の分析処理において、前記説明変数の値間の相関を示す第1の相関係数を算出し、
    前記第2の分析処理において、前記説明変数の影響度間の相関を示す第2の相関係数を算出し、
    前記第1の相関係数及び第1の閾値を比較する第1の比較処理を実行し、
    前記第2の相関係数及び第2の閾値を比較する第2の比較処理を実行し、
    前記第1の相関係数及び第1の閾値の比較結果、並びに、前記第2の相関係数及び第2の閾値の比較結果に基づいて、前記集約可能な説明変数を特定することを特徴とするモデルの予測根拠提示システム。
  3. 請求項1に記載のモデルの予測根拠提示システムであって、
    前記説明変数の値間の関連性を示す第1の外部入力及び前記説明変数の影響度間の関連性を示す第2の外部入力を設定するためのインタフェースを提供する受付部を有し、
    前記受付部を介して設定された前記第1の外部入力及び前記第2の外部入力、前記第1の分析処理及び前記第2の分析処理の結果に基づいて、前記集約可能な説明変数を特定することを特徴とするモデルの予測根拠提示システム。
  4. 請求項1に記載のモデルの予測根拠提示システムであって、
    前記表示情報は、前記グループに含まれる前記複数の説明変数の影響度を含むことを特徴とするモデルの予測根拠提示システム。
  5. 計算機システムが実行する、複数の説明変数の値から構成される入力データを入力することによって任意の事象の予測を行うモデルの予測根拠提示方法であって、
    前記計算機システムは、プロセッサ及び前記プロセッサに接続されるメモリを有する少なくとも一つの計算機から構成され、
    前記モデルの予測根拠提示方法は、
    前記プロセッサが、前記モデルに基づく演算処理によって出力された予測結果に対して、前記入力データを構成する前記複数の説明変数の値の影響を示す影響度を算出し、前記複数の説明変数の影響度から構成される予測根拠データを生成する第1のステップと、
    前記プロセッサが、集約可能な説明変数を特定する第2のステップと、
    前記プロセッサが、前記予測根拠データを表示するための表示情報を出力する第3のステップと、
    前記プロセッサが、前記入力データの履歴及び前記予測根拠データの履歴を前記メモリに格納する第4のステップと、を含み、
    前記第2のステップは、
    前記プロセッサが、複数の前記入力データの履歴及び複数の前記予測根拠データの履歴を用いて、前記説明変数の値間の関連性を分析する第1の分析処理、及び前記説明変数の影響度間の関連性を分析する第2の分析処理を実行する第5のステップと、
    前記プロセッサが、前記第1の分析処理及び前記第2の分析処理の結果に基づいて、前記集約可能な説明変数を特定する第6のステップと、を含み、
    前記第3のステップは、
    前記プロセッサが、前記集約可能な説明変数からグループを生成するステップと、
    前記プロセッサが、前記グループに含まれる前記複数の説明変数の影響度から集約影響度を算出するステップと、
    前記プロセッサが、前記予測根拠データを、集約されていない説明変数の影響度及び前記グループの集約影響度を対応づけたデータから構成される集約予測根拠データに変換するステップと、
    前記プロセッサが、前記集約予測根拠データに基づいて前記表示情報を生成するステップと、を含むことを特徴とするモデルの予測根拠提示方法。
  6. 請求項5に記載のモデルの予測根拠提示方法であって、
    前記第5のステップは、
    前記プロセッサが、前記説明変数の値間の相関を示す第1の相関係数を算出する前記第1の分析処理を実行するステップと、
    前記プロセッサが、前記説明変数の影響度間の相関を示す第2の相関係数を算出する前記第2の分析処理を実行するステップと、を含み、
    前記第6のステップは、
    前記プロセッサが、前記第1の相関係数及び第1の閾値を比較する第1の比較処理を実行するステップと、
    前記プロセッサが、前記第2の相関係数及び第2の閾値を比較する第2の比較処理を実行するステップと、
    前記プロセッサが、前記第1の相関係数及び第1の閾値の比較結果、並びに、前記第2の相関係数及び第2の閾値の比較結果に基づいて、前記集約可能な説明変数を特定するステップと、を含むことを特徴とするモデルの予測根拠提示方法。
  7. 請求項5に記載のモデルの予測根拠提示方法であって、
    前記説明変数の値間の関連性を示す第1の外部入力及び前記説明変数の影響度間の関連性を示す第2の外部入力を設定するためのインタフェースを提供するステップを含み、
    前記第6のステップは、前記プロセッサが、前記インタフェースを介して設定された前記第1の外部入力及び前記第2の外部入力、前記第1の分析処理及び前記第2の分析処理の結果に基づいて、前記集約可能な説明変数を特定するステップを含むことを特徴とするモデルの予測根拠提示方法。
  8. 請求項5に記載のモデルの予測根拠提示方法であって、
    前記表示情報は、前記グループに含まれる前記複数の説明変数の影響度を含むことを特徴とするモデルの予測根拠提示方法。
JP2018231752A 2018-12-11 2018-12-11 モデルの予測根拠提示システム及びモデルの予測根拠提示方法 Active JP7145059B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018231752A JP7145059B2 (ja) 2018-12-11 2018-12-11 モデルの予測根拠提示システム及びモデルの予測根拠提示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018231752A JP7145059B2 (ja) 2018-12-11 2018-12-11 モデルの予測根拠提示システム及びモデルの予測根拠提示方法

Publications (2)

Publication Number Publication Date
JP2020095398A JP2020095398A (ja) 2020-06-18
JP7145059B2 true JP7145059B2 (ja) 2022-09-30

Family

ID=71084945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018231752A Active JP7145059B2 (ja) 2018-12-11 2018-12-11 モデルの予測根拠提示システム及びモデルの予測根拠提示方法

Country Status (1)

Country Link
JP (1) JP7145059B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7350601B2 (ja) * 2019-10-04 2023-09-26 エヌ・ティ・ティ・コミュニケーションズ株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP7481181B2 (ja) 2020-07-02 2024-05-10 株式会社日立製作所 計算機システムおよび貢献度計算方法
JP7453895B2 (ja) 2020-11-11 2024-03-21 株式会社日立製作所 探索条件提示装置、探索条件提示方法、及び探索条件提示プログラム
WO2022149372A1 (ja) * 2021-01-08 2022-07-14 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018096683A1 (ja) 2016-11-28 2018-05-31 日本電気株式会社 要因分析方法、要因分析装置および要因分析プログラム
JP2018151883A (ja) 2017-03-13 2018-09-27 株式会社東芝 解析装置、解析方法、及び、プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018096683A1 (ja) 2016-11-28 2018-05-31 日本電気株式会社 要因分析方法、要因分析装置および要因分析プログラム
JP2018151883A (ja) 2017-03-13 2018-09-27 株式会社東芝 解析装置、解析方法、及び、プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GUIDOTTI, R., et al.,A Survey Of Methods For Explaining Black Box Models,arXiv [online],2018年06月21日,[retrieved on 2022-05-23], Retrieved from the Internet: <URL: https://arxiv.org/abs/1802.01933v3>
LOU, Y., et al.,Intelligible models for classification and regression,Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD '12) [online],2012年08月12日,pp. 150-158,[retrieved on 2022-05-23], Retrieved from the Internet: <URL: https://dl.acm.org/doi/10.1145/2339530.2339556>,<DOI: 10.1145/2339530.2339556>

Also Published As

Publication number Publication date
JP2020095398A (ja) 2020-06-18

Similar Documents

Publication Publication Date Title
JP7145059B2 (ja) モデルの予測根拠提示システム及びモデルの予測根拠提示方法
US11574011B2 (en) Merging feature subsets using graphical representation
CN104516879B (zh) 用于管理含有具有缺失值的记录的数据库的方法和系统
JP2020522794A (ja) ニューラルネットワーク分類
JP7000766B2 (ja) 学習データ選択プログラム、学習データ選択方法、および、学習データ選択装置
JP6975692B2 (ja) 計算機システム及び予測器が出力した予測値の根拠に関連する情報の提示方法
JP2017224184A (ja) 機械学習装置
JP2023537879A (ja) 動的属性モデル化による次のバスケット推薦のためのシステムと方法
JP7057761B2 (ja) 計算機システム及び情報の提示方法
JP2020144493A (ja) 学習モデル生成支援装置、及び学習モデル生成支援方法
JP7006616B2 (ja) 予測モデル生成システム、方法およびプログラム
JP7141371B2 (ja) 学習データの精練方法及び計算機システム
JPWO2017203672A1 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
Mohr et al. LCDB 1.0: An extensive learning curves database for classification tasks
JP6743942B2 (ja) 語彙テーブルの選択方法、装置およびコンピュータ読み取り可能な記憶媒体
CN115862842A (zh) 慢性病的风险预测方法及相关设备
JP7059151B2 (ja) 時系列データ分析装置、時系列データ分析方法、および時系列データ分析プログラム
CN111489003B (zh) 生命周期的预测方法及装置
JP2014164385A (ja) 要件検出装置及び要件検出プログラム
KR20210048818A (ko) 핀테크를 이용한 인공지능 기반 거래 장치 및 거래 방법
JP7292235B2 (ja) 分析支援装置及び分析支援方法
WO2022167904A1 (en) A machine learning approach to multi-domain process automation and user feedback integration
CN115769194A (zh) 跨数据集的自动数据链接
JP6988817B2 (ja) 予測モデル生成システム、方法およびプログラム
KR20220093567A (ko) Bim 기반 설계 업무 체계의 효율성 평가 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210624

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220913

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220916

R150 Certificate of patent or registration of utility model

Ref document number: 7145059

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150