WO2023181230A1

WO2023181230A1 - モデル分析装置、モデル分析方法、及び、記録媒体

Info

Publication number: WO2023181230A1
Application number: PCT/JP2022/013813
Authority: WO
Inventors: 啓太佐久間; 智哉坂井; 竜太松野; 義男亀田
Original assignee: 日本電気株式会社
Priority date: 2022-03-24
Filing date: 2022-03-24
Publication date: 2023-09-28

Abstract

モデル分析装置において、取得手段は、入力データに対するモデルの予測結果を取得する。判定手段は、入力データ及び予測結果を用いて、モデルの予測ミス要因を判定する。抽出手段は、入力データ及び予測ミス要因の少なくとも一方に基づいて、モデルによる予測の対象期間から複数の比較期間を抽出する。要因出力手段は、抽出された複数の比較期間における予測ミス要因の分布を出力する。

Description

モデル分析装置、モデル分析方法、及び、記録媒体

　本開示は、機械学習モデルの分析に関する。

　近年、様々な分野において、機械学習により得られた予測モデルが利用されている。特許文献１は、予測モデルを用いて電力需要の予測を行う手法を記載している。

特開２０１９－０３２８０７号公報

　作成した予測モデルの精度が十分でない場合や、当初のモデル作成から時間が経過し、使用するデータの傾向が変化した場合などは、予測モデルの再学習が必要となる。予測モデルに予測のミスが生じた場合、予測ミスの要因を分析し、対策を講じることが必要となる。

　本開示の１つの目的は、予測モデルの予測ミス要因を分析し、可視化することが可能なモデル分析装置を提供することにある。

　本開示の一つの観点では、モデル分析装置は、
　入力データに対するモデルの予測結果を取得する取得手段と、
　前記入力データ及び前記予測結果を用いて、前記モデルの予測ミス要因を判定する判定手段と、
　前記入力データ及び前記予測ミス要因の少なくとも一方に基づいて、前記モデルによる予測の対象期間から複数の比較期間を抽出する抽出手段と、
　抽出された複数の比較期間における前記予測ミス要因の分布を出力する要因出力手段と、
　を備える。

　本開示の他の観点では、モデル分析方法は、
　入力データに対するモデルの予測結果を取得し、
　前記入力データ及び前記予測結果を用いて、前記モデルの予測ミス要因を判定し、
　前記入力データ及び前記予測ミス要因の少なくとも一方に基づいて、前記モデルによる予測の対象期間から複数の比較期間を抽出し、
　抽出された複数の比較期間における前記予測ミス要因の分布を出力する。

　本開示のさらに他の観点では、記録媒体は、
　入力データに対するモデルの予測結果を取得し、
　前記入力データ及び前記予測結果を用いて、前記モデルの予測ミス要因を判定し、
　前記入力データ及び前記予測ミス要因の少なくとも一方に基づいて、前記モデルによる予測の対象期間から複数の比較期間を抽出し、
　抽出された複数の比較期間における前記予測ミス要因の分布を出力する処理をコンピュータに実行させるプログラムを記録する。

　本開示によれば、予測モデルの予測ミス要因を分析し、可視化することが可能となる。

第１実施形態に係るモデル生成システムの全体構成を示すブロック図である。モデル生成装置のハードウェア構成を示すブロック図である。第１実施形態のモデル生成装置の機能構成を示すブロック図である。評価情報の第１の表示例を示す。評価情報の第２の表示例を示す。評価情報の第３の表示例を示す。評価情報の第４の表示例を示す。モデル分析処理のフローチャートである。予測ミス分析部の機能構成を示すブロック図である。要因特定部が用いる要因決定規則の一例を示す。変形例１の手法を概念的に示す図である。サーバと端末装置を用いたモデル生成システムの概略構成を示すブロック図である。第２実施形態のモデル分析装置の機能構成を示すブロック図である。第２実施形態のモデル分析装置による処理のフローチャートである。

　以下、図面を参照して、本開示の好適な実施形態について説明する。
　＜第１実施形態＞
　［全体構成］
　図１は、第１実施形態に係るモデル生成システムの全体構成を示すブロック図である。モデル生成システム１は、モデル生成装置１００と、表示装置２と、入力装置３とを備える。モデル生成装置１００は、本開示のモデル分析装置を適用したものであり、例えばパーソナルコンピュータ（ＰＣ）などのコンピュータにより構成される。表示装置２は、例えば液晶表示装置などであり、モデル生成装置１００が生成した評価情報を表示する。入力装置３は、例えばマウス、キーボードなどであり、ユーザがモデルの修正時や評価情報の表示時に必要な指示、入力を行うために使用される。

　まず、モデル生成システム１の動作を概略的に説明する。モデル生成装置１００は、予め用意された訓練データを用いて、機械学習モデル（以下、単に「モデル」と呼ぶ。）を生成する。また、モデル生成装置１００は、生成したモデルの評価を行う。具体的には、評価用データなどを用いてモデルによる予測を行い、予測結果に基づいてモデルの予測ミス要因を分析する。そして、モデル生成装置１００は、得られた予測ミス要因に基づいて、予測の対象期間から複数の比較期間を抽出し、比較期間毎に予測ミス要因の分布を作成し、評価情報として表示装置２へ表示する。これにより、ユーザは、予測ミス要因の特徴に基づいて抽出された期間毎に予測ミス要因の分布を見ることができ、予測ミスに対する対策を検討することができる。なお、ユーザは、入力装置３を操作して、予測ミス要因の分布を表示するための比較期間を指定してもよい。また、ユーザは、入力装置３を操作してモデルの修正のための修正情報を入力する。

　ここで、「モデル」とは、説明変数と目的変数の関係を表す情報である。モデルは、例えば、説明変数に基づいて目的とする変数を算出することにより推定対象の結果を推定するためのコンポーネントである。モデルは、既に目的変数の値が得られている学習用データと任意のパラメータとを入力として、学習アルゴリズムを実行することにより生成される。モデルは例えば、入力ｘを正解ｙに写像する関数ｃにより表されてもよい。モデルは、推定対象の数値を推定するものであってもよいし、推定対象のラベルを推定するものであってもよい。モデルは、目的変数の確率分布を記述する変数を出力してもよい。モデルは、「学習モデル」、「分析モデル」、「ＡＩ（Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ）モデル」または「予測式」などと記載されることもある。

　［ハードウェア構成］
　図２は、モデル生成装置１００のハードウェア構成を示すブロック図である。図示のように、モデル生成装置１００は、インタフェース（Ｉ／Ｆ）１１１と、プロセッサ１１２と、メモリ１１３と、記録媒体１１４と、データベース（ＤＢ）１１５と、を備える。

　Ｉ／Ｆ１１１は、外部装置との間でデータの入出力を行う。具体的に、モデルの生成に使用する訓練データ、評価用データ、及び、ユーザが入力装置３を用いて入力した指示や入力は、Ｉ／Ｆ１１１を通じてモデル生成装置１００に入力される。また、モデル生成装置１００が生成したモデルの評価情報は、Ｉ／Ｆ１１１を通じて表示装置２へ出力される。

　プロセッサ１１２は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などのコンピュータであり、予め用意されたプログラムを実行することによりモデル生成装置１００の全体を制御する。なお、プロセッサ１１２は、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）またはＦＰＧＡ（Ｆｉｅｌｄ－Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）であってもよい。プロセッサ１１２は、後述するモデル分析処理を実行する。

　メモリ１１３は、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などにより構成される。メモリ１１３は、プロセッサ１１２による各種の処理の実行中に作業メモリとしても使用される。

　記録媒体１１４は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、モデル生成装置１００に対して着脱可能に構成される。記録媒体１１４は、プロセッサ１１２が実行する各種のプログラムを記録している。モデル生成装置１００が各種の処理を実行する際には、記録媒体１１４に記録されているプログラムがメモリ１１３にロードされ、プロセッサ１１２により実行される。

　ＤＢ１１５は、モデル生成装置１００が生成したモデル（以下、「既存モデル」と呼ぶ。）、及び、再訓練による修正後のモデル（以下、「修正後モデル」と呼ぶ。）に関する情報を記憶する。また、ＤＢ１１５は、必要に応じて、Ｉ／Ｆ１１１を通じて入力された訓練データ、評価用データ、ユーザが入力した修正情報、予測ミス要因に関する評価情報などを記憶する。

　（機能構成）
　図３は、第１実施形態のモデル生成装置１００の機能構成を示すブロック図である。モデル生成装置１００は、機能的には、訓練データＤＢ１２１と、モデル訓練部１２２と、モデルＤＢ１２３と、評価用データＤＢ１２４と、予測ミス分析部１２５と、評価情報出力部１２６とを備える。

　訓練データＤＢ１２１は、モデルの生成に用いられる訓練データを記憶する。訓練データＤ１は、モデル訓練部１２２に入力される。なお、訓練データＤ１は、入力データと、その入力データに対する正解ラベル（教師ラベル）との複数の組み合わせにより構成される。

　モデル訓練部１２２は、訓練データＤ１を用いてモデルの訓練を行い、モデルを生成する。モデル訓練部１２２は、生成したモデルに対応するモデルデータＭをモデルＤＢ１２３及び予測ミス分析部１２５へ出力する。なお、モデルデータＭは、モデルを構成する複数のパラメータ情報を含む。パラメータ情報は、例えば、モデルの入力として用いられる説明変数（または、特徴量）の情報、各説明変数に対する重みの情報、入力データを構成する各サンプルに対する重みの情報などを含む。

　また、モデル訓練部１２２は、既存モデルを再訓練して修正後モデルを生成する。この場合、モデル訓練部１２２は、ユーザが入力装置３を用いて入力した修正情報Ｄ３に基づいて、モデルを構成するパラメータを修正し、必要に応じて再訓練用の訓練データを用いてモデルの再訓練を行う。モデル訓練部１２２は、再訓練により得られた修正後モデルのモデルデータＭをモデルＤＢ１２３へ記憶するとともに、予測ミス分析部１２５へ出力する。

　評価用データＤＢ１２４は、生成されたモデルの評価に使用する評価用データを記憶する。評価用データは、モデルの評価に使用できる各種のデータを含む。評価用データは、基本的には入力データと、その入力データに対する正解ラベル（教師ラベル）との複数の組み合わせにより構成される。評価用データの例としては、以下のようなものが挙げられる。
（１）バリデーションデータやテストデータと呼ばれる「モデルの生成に使用しなかったデータ」
　この場合、評価用データは、基本に入力データと正解ラベルのセットとなる。
（２）運用データなどの「モデルの生成後に新たに収集されたデータ」
　なお、ラベリングが即時で行われない場合、評価用データは入力のみのデータとなる可能性もある。
（３）「何らかの方法で生成された、モデルにとって未知のデータ」
　例えば、入力データ内の特徴量が、（曜日、祝日、天気）だった場合、カレンダー情報や天気予報を用いて疑似的に未来のデータを作ることができる。
（４）「訓練データと同一のデータ」
　モデルの生成に使用した訓練データを、評価用データとして使用することができる。この場合、訓練データと同一のデータを評価用データとして評価用データＤＢ１２４に記憶しておけばよい。

　予測ミス分析部１２５は、評価用データを用いて既存モデルの予測ミスを分析する。具体的に、予測ミス分析部１２５は、評価用データの入力データを既存モデルに入力して予測を行い、予測結果を取得する。そして、予測ミス分析部１２５は、使用した評価用データと予測結果とに基づいて、既存モデルが起こした予測ミスの要因（以下、「予測ミス要因」と呼ぶ。）を分析する。具体的に、予測ミス分析部１２５は、既存モデルが予め決められた複数の予測ミス要因に該当する程度を推定し、予測ミス要因の分析結果として評価情報出力部１２６へ出力する。なお、予測ミス要因の分析方法については、後に詳しく説明する。予測ミス分析部１２５は、取得手段及び判定手段の一例である。

　評価情報出力部１２６は、予測ミス要因の分析結果に基づいて、既存モデルを評価するための評価情報Ｄ２を生成する。評価情報Ｄ２は、既存モデルによる予測結果（予測値）と実測値との関係と、所定の比較期間における予測ミス要因の分布とを含む。そして、評価情報出力部１２６は、生成した評価情報Ｄ２を表示装置２へ出力する。評価情報出力部１２６は、抽出手段及び要因出力手段の一例である。

　表示装置２は、評価情報出力部１２６が出力した評価情報Ｄ２を表示装置２に表示する。これにより、ユーザは、既存モデルによる予測値と実測値との関係、及び、比較期間における予測ミス要因の分布を参照し、既存モデルの性能を評価することができる。また、ユーザは、必要に応じて、修正情報Ｄ３を入力装置３に入力する。モデル訓練部１２２は、入力された修正情報Ｄ３を用いてモデルの再訓練を行うことにより、モデルの修正を行う。

　［評価情報の表示例］
　次に、表示装置２に表示される評価情報の表示例を説明する。
　（第１の表示例）
　図４は、評価情報の第１の表示例を示す。第１の表示例４０は、グラフＧと、予測ミス要因（以下、単に「要因」とも呼ぶ。）の分布図Ｒ１、Ｒ２とを含む。グラフＧは、既存モデルによる予測値と、実測値との関係を示すグラフである。図４の例では、既存モデルは、商品の売り上げを予測するモデルとする。グラフＧの横軸は所定の基準日からの日数を示し、縦軸は売り上げを示す。グラフＧは、売り上げの実測値と、既存モデルによる予測値とを示している。

　評価情報としては、最初にグラフＧが表示される。ユーザは、グラフＧにおける所定の期間を比較期間として指定する。「比較期間」とは、ユーザによる比較のために、予測ミス要因の分布を表示させる期間である。図４の例では、ユーザは、入力装置３を操作して、比較期間Ｔ１とＴ２を指定している。ユーザによる比較期間の指定は、入力装置３から評価情報出力部１２６へ送られる。これに対し、予測ミス分析部１２５は、ユーザが指定した比較期間Ｔ１における予測ミス要因を分析し、分析結果を評価情報出力部１２６へ出力する。評価情報出力部１２６は、分析結果に基づき、予測ミス要因の分布図Ｒ１を作成し、表示装置２に表示する。分布図Ｒ１は、６個の予測ミス要因Ａ～Ｆの分布を示す。具体的に、分布図Ｒ１は、予測ミス要因Ａ～Ｆの程度を示す棒グラフ５１と、レーダーチャート５２とを含む。ユーザは、棒グラフ５１により各予測ミス要因の大きさを比べることができ、レーダーチャート５２により複数の予測ミス要因のバランスを見ることができる。

　同様に、予測ミス分析部１２５は、ユーザが指定した比較期間Ｔ２における予測ミス要因を分析し、分析結果を評価情報出力部１２６へ出力する。評価情報出力部１２６は、分析結果に基づいて予測ミス要因の分布図Ｒ２を作成し、表示装置２に表示する。第１の表示例では、ユーザは、自分で指定した任意の比較期間Ｔ１とＴ２の分布図Ｒ１とＲ２を並べて表示させることができる。

　（第２の表示例）
　図５は、評価情報の第２の表示例を示す。第２の表示例４１は、グラフＧと、予測ミス要因の分布図Ｒ３、Ｒ４を含む。第１の表示例と同様に、グラフＧは、既存モデルによる予測値と、実測値との関係を示すグラフである。

　第１の表示例では、比較期間をユーザが指定している。これに対して、第２の表示例では、評価情報出力部１２６は、予測ミス要因の分布の変化点を検出し、その変化点を境にして比較期間を設定し、表示する。具体的には、評価情報出力部１２６は、要因Ａ～Ｆの分布に変化が生じた点を変化点として検出する。図５の例では、評価情報出力部１２６は、予測ミス要因Ａ～Ｆの分布が変化した点を変化点Ｐ１として検出し、比較期間Ｔ３とＴ４を設定して表示している。具体的に、評価情報出力部１２６は、変化点Ｐ１より前において予測ミス要因の分布が共通している期間を比較期間Ｔ３とし、変化点Ｐ１より後において予測ミス要因の分布が共通している期間を比較期間Ｔ４と設定している。

　さらに、評価情報出力部１２６は、設定した比較期間毎に、予測ミス要因の分布を示す分布図を作成する。図５の例では、評価情報出力部１２６は、比較期間Ｔ３について予測ミス要因の分布図Ｒ３を作成するとともに、比較期間Ｔ４について予測ミス要因の分布図Ｒ４を作成している。なお、分布図Ｒ３、Ｒ４が、棒グラフ５１とレーダーチャート５２を含む点は、第１の表示例と同様である。そして、評価情報出力部１２６は、比較期間Ｔ３及びＴ４を含むグラフＧと、分布図Ｒ３及びＲ４とを含む評価情報を表示装置２に表示する。

　第２の表示例では、ユーザは、予測ミス要因の分布の変化点を境に、変化前後の比較期間について予測ミス要因の分布を見ることができる。

　（第３の表示例）
　図６は、評価情報の第３の表示例を示す。第３の表示例４２は、グラフＧと、予測ミス要因の分布図Ｒ５～Ｒ７を含む。第１の表示例と同様に、グラフＧは、既存モデルによる予測値と、実測値との関係を示すグラフである。

　第３の表示例では、評価情報出力部１２６は、主要な予測ミス要因の変化点を検出し、その変化点を境にして比較期間を設定し、表示する。具体的には、評価情報出力部１２６は、要因Ａ～Ｆのうち最大の要因が変化した点を変化点として検出する。図６の例では、評価情報出力部１２６は、予測ミス要因Ａ～Ｆのうち最大の要因が要因Ａから要因Ｃに変化した点を変化点Ｐ２として検出し、最大の要因が要因Ｃから要因Ｅに変化した点を変化点Ｐ３として検出している。そして、評価情報出力部１２６は、変化点Ｐ２より前に比較期間Ｔ５を設定し、変化点Ｐ２とＰ３の間を比較期間Ｔ６とし、変化点Ｐより後に比較期間Ｔ７を設定している。なお、最大の要因が変化した点の代わりに、全要因のうちの大部分（例えば８割以上）を占める複数の要因の組み合わせが変化した点などを変化点としてもよい。

　さらに、評価情報出力部１２６は、設定した比較期間毎に、予測ミス要因の分布を示す分布図を作成する。図６の例では、評価情報出力部１２６は、比較期間Ｔ５～Ｔ７について、予測ミス要因の分布図Ｒ５～Ｒ７を作成している。即ち、分布図Ｒ５は要因Ａが多い比較期間Ｔ５に対応し、分布図Ｒ６は要因Ｃが多い比較期間Ｔ６に対応し、分布図Ｒ７は要因Ｅが多い比較期間Ｔ７に対応している。なお、分布図Ｒ５～Ｒ７が、棒グラフ５１とレーダーチャート５２を含む点は、第１の表示例と同様である。そして、評価情報出力部１２６は、比較期間Ｔ５～Ｔ７を含むグラフＧと、分布図Ｒ５～７とを含む評価情報を表示装置２に表示する。

　第３の表示例では、ユーザは、主要な予測ミス要因が変化した点を境に、変化前後の比較期間について予測ミス要因の分布を見ることができる。

　（第４の表示例）
　図７は、評価情報の第４の表示例を示す。第４の表示例４３は、グラフＧと、予測ミス要因の分布図Ｒ８、Ｒ９を含む。第１の表示例と同様に、グラフＧは、既存モデルによる予測値と、実測値との関係を示すグラフである。

　第４の表示例では、評価情報出力部１２６は、既存モデルに入力された入力データの変化点、具体的には、説明変数の分布の変化点を検出し、その変化点を境にして比較期間を設定する。具体的には、評価情報出力部１２６は、入力データに含まれる複数の説明変数の分布を分析し、説明変数の分布が変化した点を変化点として検出する。図７の例では、評価情報出力部１２６は、入力データに含まれる複数の説明変数の分布が変化点Ｐ４で変化したことを検出し、変化点Ｐ４の前後に比較期間Ｔ８、Ｔ９を設定している。例えば、既存モデルが来客の性別を説明変数として売り上げを予測するものと仮定する。この場合、評価情報出力部１２６は、来客の性別の分布、即ち、男女の割合を分析し、ある時点までは女性客の方が多かったのに、その時点より後は男性客の方が多くなったというような場合、その時点を変化点として検出する。

　さらに、評価情報出力部１２６は、設定した比較期間毎に、予測ミス要因の分布を示す分布図を作成する。図７の例では、評価情報出力部１２６は、比較期間Ｔ８、Ｔ９について、予測ミス要因の分布図Ｒ８、Ｒ９を作成している。なお、分布図Ｒ８、Ｒ９が、棒グラフ５１とレーダーチャート５２を含む点は、第１の表示例と同様である。そして、評価情報出力部１２６は、比較期間Ｔ８、Ｔ９を含むグラフＧと、分布図Ｒ８、Ｒ９とを含む評価情報を表示装置２に表示する。

　第４の表示例では、ユーザは、説明変数の分布、即ち、入力データの傾向が変化した時点を境に、変化前後の比較期間について予測ミス要因の分布を見ることができる。なお、上記の例では、評価情報出力部１２６は、入力データのうちの説明変数の分布の変化点を用いて比較期間を設定しているが、その代わりに、目的変数の変化点を用いて比較期間を設定してもよい。例えば、評価情報出力部１２６は、売り上げの実測値が急に倍増した日を変化点とし、その前後に比較期間を設定してもよい。また、評価情報出力部１２６は、説明変数と目的変数の両方に基づいて変化点を検出してもよい。上記の例では、例えば説明変数として来客の男女割合が変化し、かつ、売り上げが所定値以上変化した日を変化点として検出してもよい。

　なお、上記の第１～第４の表示例において、既存モデルによる予測値と実測値の関係を示すグラフＧや、棒グラフ及びレーダーチャートを含む分布図Ｒ１～Ｒ９などはいずれも一例であり、他の各種のグラフやチャートなどを用いて評価情報を図示してもよい。

　［モデル分析処理］
　次に、モデル生成装置１００によるモデル分析処理について説明する。図８は、モデル生成装置１００によるモデル分析処理のフローチャートである。モデル分析処理は、モデル訓練部１２２により生成された既存モデルの予測ミス要因を分析し、表示装置２に表示する処理である。この処理は、図２に示すプロセッサ１１２が予め用意されたプログラムを実行し、図３に示す要素として動作することにより実現される。

　まず、予測ミス分析部１２５は、評価用データを既存モデルに入力し、既存モデルによる予測値を取得する（ステップＳ１０）。次に、予測ミス分析部１２５は、評価用データに含まれる実測値と、既存モデルによる予測値とを用いて、既存モデルの予測ミス要因を分析する（ステップＳ１１）。予測ミス分析部１２５は、予測ミス要因の分析結果を評価情報出力部１２６へ出力する。

　次に、評価情報出力部１２６は、比較期間を設定する（ステップＳ１３）。具体的に、上記の第１の表示例の場合には、評価情報出力部１２６はユーザの入力に従って比較期間を設定する。一方、第２～第４の表示例の場合、評価情報出力部１２６は、予測ミス要因の分布の変化点、最大の予測ミス要因の変化点、又は、入力データの分布の変化点に基づいて、比較期間を設定する。

　次に、評価情報出力部１２６は、設定された比較期間毎に、予測ミス要因の分布図を作成する（ステップＳ１３）。これにより、図４～７に例示する分布図Ｒ１～Ｒ８などが作成される。そして、評価情報出力部１２６は、実測値と既存モデルの予測値との関係を示すグラフ、及び、比較期間毎の予測ミス要因の分布図を含む評価情報を生成し（ステップＳ１４）、表示装置２へ出力する（ステップＳ１５）。こうして、図４～７に例示するように、評価情報が表示装置２に表示される。そして、処理は終了する。

　［予測ミス要因の分析方法］
　次に、予測ミス要因の分析方法について詳しく説明する。図９は、予測ミス分析部１２５の機能構成を示す。図示のように、予測ミス分析部１２５は、指標評価部１３１と、要因特定部１３２とを備える。

　概略的には、指標評価部１３１は、予測モデル、予測モデルで用いられる説明変数のデータ、又は、予測モデルで用いられる目的変数のデータについての指標を複数種類算出する。次に、指標評価部１３１は、算出した複数種類の指標のそれぞれを評価する。そして、要因特定部１３２は、複数種類の指標のそれぞれの指標評価部１３１による評価結果の組み合わせに応じて、予測モデルによる予測のミスの要因を特定する。要因特定部１３２は、例えば、評価結果の組み合わせと要因とを対応付ける予め定められた規則を用いて、要因を特定する。

　具体的に、指標評価部１３１は、予測ミス要因の分析に必要な複数の指標について、指標の計算と、指標の計算結果に対する判定を行う。例えば、指標評価部１３１は、訓練データ又は評価用データに対する予測ミスサンプルの説明変数の異常度を計算し、計算された異常度を評価する。この場合、指標評価部１３１は、計算された異常度の値が、予測ミスサンプルが異常なサンプルであると認定される値であるかを判定することにより、指標を評価する。すなわち、この場合、指標評価部１３１は、計算された異常度を用いて、予測ミスサンプルが異常なサンプルであるかを判定する。別の例として、指標評価部１３１は、訓練データと運用データとの間の分布間距離（以下、「データ分布変化量」とも呼ぶ。）を計算し、計算された分布間距離を評価する。この場合、指標評価部１３１は、計算された分布間距離の値が、訓練時と運用時とでデータの分布に変化があると認定される値であるかを判定することにより、指標を評価する。すなわち、この場合、指標評価部１３１は、計算された分布間距離を用いて、訓練時と運用時とでデータの分布の変化が発生しているか否かを判定する。なお、これらは、例に過ぎず、指標評価部１３１は、様々な種類の指標について算出及び評価を実行することができる。このように、指標評価部１３１は、指標に対する評価として、指標に対して所定の判定を行う。それぞれの指標に対する判定は、例えば、予め決められ、記憶された閾値を用いて行われる。なお、閾値自体の代わりに、閾値を特定するためのパラメータが記憶されていてもよい。

　要因特定部１３２は、指標評価部１３１による複数種類の指標のそれぞれの評価結果の組み合わせに応じて、予測ミス要因を特定する。要因特定部１３２は、指標毎の所定の判定の判定結果の組み合わせに応じて、予測ミス要因を特定する。具体的には、要因特定部１３２は、複数の判定結果の組み合わせに予測ミス要因を対応させる所定の規則（以下、「要因決定規則」と呼ぶ。）を用いることで予測ミス要因を特定する。なお、要因特定部１３２が用いる要因決定規則の内容は任意である。また、要因決定規則は、予め記憶部などに記憶されている。

　図１０は、要因特定部１３２が用いる表形式の要因決定規則の一例を示す。この例では、指標評価部１３１は、３種類の異なる指標に対応する３つの問Ｑ１、Ｑ２、Ｑ３についてＹｅｓまたはＮｏの判定結果を生成する。問Ｑ１では、訓練データに対する予測ミスサンプルの説明変数の異常度から、予測ミスサンプル２５が正常なサンプルであるかを判定している。問Ｑ２では、近傍訓練サンプルと、予測モデルとを用いて平均二乗誤差などの評価指標を計算することで、訓練データに対する既存モデルの近傍領域での当てはまりの良さを判定している。ここで、近傍訓練サンプルとは、近傍領域内に位置する、訓練データにおけるサンプルをいう。また、近傍領域とは、予測ミスサンプルの説明変数の値に近いと判断される説明変数の値の範囲をいう。このとき、近傍領域の具体的な定義方法は任意であり、例えば、説明変数の値を用いて計算される予測ミスサンプルからの距離（ユークリッド距離等）が所定の距離以下である領域を近傍領域としてもよい。問Ｑ３では、訓練データの説明変数の分布と運用データの説明変数の分布とのデータ分布変化量を用いて、訓練時と運用時でデータの分布が変化しているかを判定している。

　要因特定部１３２は、指標評価部１３１による判定結果と図１０の要因決定規則を用いて予測ミス要因を特定する。３種類の判定結果の組み合わせは８種類あり、表形式の要因決定規則では、この８種類のそれぞれに対して予測ミス要因を割り当てている。図１０の場合、８種類の組み合わせを４種類の予測ミス要因に割り当てている。図１０の例では、予測ミス要因として、「予測モデル及びデータ以外のエラー」、「局所的なエラー」、「データ分布の変化」、「説明変数の異常」が得られている。

　以上の予測ミス要因の分析方法は、国際出願ＰＣＴ／ＪＰ２０２１／００７１９１に記載されており、その全記載をここに参照により取り込む。なお、本実施形態における予測ミス要因の分析方法は、上記のものには限定されず、他の方法を採用することもできる。

　［変形例］
　（変形例１）
　上記の実施形態では、評価情報出力部１２６は、実測値と既存モデルの予測値との関係を示すグラフ、及び、比較期間毎の予測ミス要因の分布図を含む評価情報を出力している。これに加えて、評価情報出力部１２６は、予測ミス要因に対する対策案を出力してもよい。

　図１１は、変形例１の手法を概念的に示す図である。上記のように、比較期間毎に予測ミス要因が提示されると、ユーザは、その予測ミス要因に対する対策を検討することになる。例えば、「データセットにおけるラベルの偏り」が予測ミス要因と判定された場合に、ユーザが対策として「アンダーサンプリング」を行い、予測ミスが改善されたとする。この場合、予測ミス要因「データセットにおけるラベルの偏り」と、その対策「アンダーサンプリング」とを対応付けて履歴データとして蓄積してゆく。多数のユーザが各種の予測ミス要因に対して行った対策を収集することにより、各種の予測ミス要因に対して有効な対策の情報が得られる。なお、対策の情報としては、ユーザが入力装置３を用いて入力した修正情報を用いてもよい。

　そして、収集された履歴データを用いて、予測ミス要因から、それに対して有効な対策を予測する対策予測モデルを作成する。なお、対策予測モデルは、当初はルールベースでもよく、ある程度のデータ数が蓄積された状態で学習モデルとして作成してもよい。

　そして、評価情報出力部１２６は、評価情報に含まれる予測ミス要因について、対策予測モデルを用いて対策を予測し、推奨対策を含む評価情報を出力する。これにより、ユーザは、比較期間毎の予測ミス要因に加えて、その予測ミス要因に対する推奨対策の提示を受けることができる。

　（変形例２）
　上記の実施形態では、モデル生成装置１００をＰＣなどの独立した装置として構成しているが、その代わりに、モデル生成装置をサーバと端末装置により構成してもよい。図１２は、サーバと端末装置を用いたモデル生成システム１ｘの概略構成を示すブロック図である。図１２において、サーバ１００ｘは、図３に示すモデル生成装置１００の構成を備える。また、ユーザが使用する端末装置７の表示装置２ｘ及び入力装置３ｘを、図３に示す表示装置２及び入力装置３として使用する。この構成では、複数のユーザが入力した対策などを容易にサーバ１００ｘに集め、共有することが可能となる。

　＜第２実施形態＞
　図１３は、第２実施形態のモデル分析装置の機能構成を示すブロック図である。モデル分析装置７０は、取得手段７１と、判定手段７２と、抽出手段７３と、要因出力手段７４と、を備える。

　図１４は、第２実施形態のモデル分析装置による処理のフローチャートである。まず、取得手段７１は、入力データに対するモデルの予測結果を取得する（ステップＳ７１）。判定手段７２は、入力データ及び予測結果を用いて、モデルの予測ミス要因を判定する（ステップＳ７２）。抽出手段７３は、入力データ及び予測ミス要因の少なくとも一方に基づいて、モデルによる予測の対象期間から複数の比較期間を抽出する（ステップＳ７３）。要因出力手段７４は、抽出された複数の比較期間における予測ミス要因の分布を出力する（ステップＳ７４）。

　第２実施形態のモデル分析装置７０によれば、予測モデルの予測ミス要因を分析し、複数の期間毎に可視化することが可能となる。

　上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

　（付記１）
　入力データに対するモデルの予測結果を取得する取得手段と、
　前記入力データ及び前記予測結果を用いて、前記モデルの予測ミス要因を判定する判定手段と、
　前記入力データ及び前記予測ミス要因の少なくとも一方に基づいて、前記モデルによる予測の対象期間から複数の比較期間を抽出する抽出手段と、
　抽出された複数の比較期間における前記予測ミス要因の分布を出力する要因出力手段と、
　を備えるモデル分析装置。

　（付記２）
　前記抽出手段は、複数の予測ミス要因の分布に基づいて前記比較期間を抽出する付記１に記載のモデル分析装置。

　（付記３）
　前記抽出手段は、前記複数の予測ミス要因の分布の変化点に基づいて、前記比較期間を抽出する付記２に記載のモデル分析装置。

　（付記４）
　前記抽出手段は、前記複数の予測ミス要因のうち、主要な予測ミス要因の変化点に基づいて、前記比較期間を抽出する付記２に記載のモデル分析装置。

　（付記５）
　前記抽出手段は、前記入力データの分布の変化点に基づいて、前記比較期間を抽出する付記１に記載のモデル分析装置。

　（付記６）
　前記要因出力手段は、前記予測ミス要因に対する対策を出力する付記１乃至５に記載のモデル分析装置。

　（付記７）
　前記要因出力手段は、複数の予測ミス要因と、各予測ミス要因に対する対策との関係を学習した対策予測モデルを用いて前記対策を出力する付記６に記載のモデル分析装置。

　（付記８）
　複数の予測ミス要因と、各予測ミス要因に対する対策とを関連付けて記憶する記憶手段を備える付記６に記載のモデル分析装置。

　（付記９）
　入力データに対するモデルの予測結果を取得し、
　前記入力データ及び前記予測結果を用いて、前記モデルの予測ミス要因を判定し、
　前記入力データ及び前記予測ミス要因の少なくとも一方に基づいて、前記モデルによる予測の対象期間から複数の比較期間を抽出し、
　抽出された複数の比較期間における前記予測ミス要因の分布を出力するモデル分析方法。

　（付記１０）
　入力データに対するモデルの予測結果を取得し、
　前記入力データ及び前記予測結果を用いて、前記モデルの予測ミス要因を判定し、
　前記入力データ及び前記予測ミス要因の少なくとも一方に基づいて、前記モデルによる予測の対象期間から複数の比較期間を抽出し、
　抽出された複数の比較期間における前記予測ミス要因の分布を出力する処理をコンピュータに実行させるプログラムを記録した記録媒体。

　以上、実施形態及び実施例を参照して本開示を説明したが、本開示は上記実施形態及び実施例に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。

　１、１ｘ　モデル生成システム
　２、２ｘ　表示装置
　３、３ｘ　入力装置
　７　端末装置
　１００　モデル生成装置
　１１２　プロセッサ
　１２１　訓練データＤＢ
　１２２　モデル訓練部
　１２３　モデルＤＢ
　１２４　評価用データＤＢ
　１２５　予測ミス分析部
　１２６　評価情報出力部

Claims

　入力データに対するモデルの予測結果を取得する取得手段と、
　前記入力データ及び前記予測結果を用いて、前記モデルの予測ミス要因を判定する判定手段と、
　前記入力データ及び前記予測ミス要因の少なくとも一方に基づいて、前記モデルによる予測の対象期間から複数の比較期間を抽出する抽出手段と、
　抽出された複数の比較期間における前記予測ミス要因の分布を出力する要因出力手段と、
　を備えるモデル分析装置。
　前記抽出手段は、複数の予測ミス要因の分布に基づいて前記比較期間を抽出する請求項１に記載のモデル分析装置。
　前記抽出手段は、前記複数の予測ミス要因の分布の変化点に基づいて、前記比較期間を抽出する請求項２に記載のモデル分析装置。
　前記抽出手段は、前記複数の予測ミス要因のうち、主要な予測ミス要因の変化点に基づいて、前記比較期間を抽出する請求項２に記載のモデル分析装置。
　前記抽出手段は、前記入力データの分布の変化点に基づいて、前記比較期間を抽出する請求項１に記載のモデル分析装置。
　前記要因出力手段は、前記予測ミス要因に対する対策を出力する請求項１乃至５のいずれか一項に記載のモデル分析装置。
　前記要因出力手段は、複数の予測ミス要因と、各予測ミス要因に対する対策との関係を学習した対策予測モデルを用いて前記対策を出力する請求項６に記載のモデル分析装置。
　複数の予測ミス要因と、各予測ミス要因に対する対策とを関連付けて記憶する記憶手段を備える請求項６に記載のモデル分析装置。
　入力データに対するモデルの予測結果を取得し、
　前記入力データ及び前記予測結果を用いて、前記モデルの予測ミス要因を判定し、
　前記入力データ及び前記予測ミス要因の少なくとも一方に基づいて、前記モデルによる予測の対象期間から複数の比較期間を抽出し、
　抽出された複数の比較期間における前記予測ミス要因の分布を出力するモデル分析方法。
　入力データに対するモデルの予測結果を取得し、
　前記入力データ及び前記予測結果を用いて、前記モデルの予測ミス要因を判定し、
　前記入力データ及び前記予測ミス要因の少なくとも一方に基づいて、前記モデルによる予測の対象期間から複数の比較期間を抽出し、
　抽出された複数の比較期間における前記予測ミス要因の分布を出力する処理をコンピュータに実行させるプログラムを記録した記録媒体。