JP2020030500A - 施策探索装置、方法およびプログラム - Google Patents

施策探索装置、方法およびプログラム Download PDF

Info

Publication number
JP2020030500A
JP2020030500A JP2018154382A JP2018154382A JP2020030500A JP 2020030500 A JP2020030500 A JP 2020030500A JP 2018154382 A JP2018154382 A JP 2018154382A JP 2018154382 A JP2018154382 A JP 2018154382A JP 2020030500 A JP2020030500 A JP 2020030500A
Authority
JP
Japan
Prior art keywords
value
uncertainty
estimation model
index
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018154382A
Other languages
English (en)
Other versions
JP6995717B2 (ja
Inventor
やえみ 寺本
Yaemi Teramoto
やえみ 寺本
俊宏 鯨井
Toshihiro Kujirai
俊宏 鯨井
正啓 間瀬
Tadakei Mase
正啓 間瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018154382A priority Critical patent/JP6995717B2/ja
Publication of JP2020030500A publication Critical patent/JP2020030500A/ja
Application granted granted Critical
Publication of JP6995717B2 publication Critical patent/JP6995717B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】不確実性を考慮しながら所望の指標を向上する施策を提示する。【解決手段】推定モデルを用いて入力変数から算出される第1の指標の推定値を向上させる入力変数の値を探索する施策探索装置であって、推定モデルと、入力変数の値に応じた第1指標の推定値の不確実性を算出する評価関数とを生成するKPI推定モデル生成モジュール107と、第1指標の推定における不確実性の許容に関する指定を受け付けるデータ入出力モジュール108と、推定モデルを用いて入力変数から第1の指標の推定値を算出し、評価関数による不確実性が指定を満たし、かつ、第1指標の推定値が向上する入力変数の値を探索する施策探索モジュール106とを有する。【選択図】図2

Description

本発明は、所望の指標を向上させる施策を探索する技術に関する。
様々な分野で機械学習を利用し、向上させたい指標(以下、「KPI」ともいう)を推定し、KPIの推定値が高くなる施策(入力変数の値)を探索し、提示する技術が注目されている。非特許文献1,2には、各種の機械学習や探索のアルゴリズムが記載されている。KPIは、Key Performance Indicatorの略である。
特許文献1には、最適化計算を用いて最適解を探索する際に、入力側の変数に誤差があることを考慮し、誤差の範囲内で入力値がぶれたとしても目的変数が最適になるような解を探索する方法に関する技術が開示されている。
国際公開第2017/135322号
Bishop, Christopher M. "Pattern recognition and machine learning (information science and statistics)." (2006). 伊庭斉志. 進化論的計算手法. オーム社, 2005.
一つまたは複数の変数によって表現できる施策について、高いKPIの値を実現することが見込める施策を探索したいという状況は多くある。例えば、ある商品の色、大きさ、および値段をどのように設定するのが、その商品が最も良く売れるかを探索したいという状況がある。また、複数のKPIを同時に向上する施策を探索したいという状況も多くある。例えば、ある商品の色、大きさ、および値段をどのように設定すれば、その商品が良く売れ、かつ長く使われるか、という複数のKPIを同時に向上したいという状況がある。これらのような状況に対し、ある施策を取るとKPIがいくつになるかを推定するモデルを用いて探索を行うことが考えられる。
しかし、例えば機械学習を用いてデータから生成されたモデルでKPIを推定する場合、入力変数におけるある特定の領域(施策の領域)では推定値の不確実性が高く、他の特定の領域では不確実性が低い、というように、入力変数の領域により推定値の不確実性が異なることがあり得る。不確実性とは、KPIの推定値がどの程度の誤差を含みうるかに関する指標である。実際に適用する施策を決定するときにはKPIの値だけでなくKPIの推定値の誤差も重要な要素となる。
本発明の目的は、不確実性を考慮しながら所望の指標を向上する施策を提示する技術を提供することである。
ひとつの態様による施策探索装置は、推定モデルを用いて入力変数から算出される第1の指標の推定値を向上させる前記入力変数の値を探索する施策探索装置であって、前記推定モデルと、前記入力変数の値に応じた前記第1指標の推定値の不確実性を算出する評価関数とを生成する推定モデル生成処理部と、前記第1指標の推定における不確実性の許容に関する指定を受け付ける入出力部と、前記推定モデルを用いて入力変数から前記第1の指標の推定値を算出し、前記評価関数による前記不確実性が前記指定を満たし、かつ、前記第1指標の推定値が向上する前記入力変数の値を探索する施策探索処理部と、を有する。
ひとつの態様によれば、不確実性を考慮しながら所望の指標を向上する施策を提示することができる。
本実施形態による施策探索装置を示すブロック図である。 図1の示した施策探索装置の処理構成図である。 図1に示した施策探索モジュールが不確実性考慮施策探索プログラムを用いて実行する処理を説明するためのフローチャートである。 図1に示したKPI推定モデル生成モジュールがKPI推定モデル生成プログラムを用いて実行する処理を説明するためのフローチャートである。 図1に示したデータ記憶装置内のデータベースに記憶されたKPI推定モデルの一例を示す図である。 図1に示したKPI推定モデル生成モジュールが不確実性評価モデル生成プログラムを用いて実行する処理の一例を説明するためのフローチャートである。 図1に示したデータベースに保存されたテーブルの一例を示す図である。 図1に示したKPI推定モデル生成モジュールが不確実性評価モデル生成プログラムを用いて実行する処理の他の例を説明するためのフローチャートである。 図1に示したデータベースに保存されたテーブルの一例を示す図である。 図1に示したKPI推定モデル生成モジュールが不確実性評価モデル生成プログラムを用いて実行する処理の他の例を説明するためのフローチャートである。 図1に示したデータベースに保存されたテーブルの一例を示す図である。 図1に示したデータ入出力モジュールによって表示されるユーザ入力画面の一例を示す図である。 図1に示したデータ入出力モジュールによって表示される施策探索結果提示画面の一例を示す図である。
以下に、ある実施形態の施策探索装置について図面を参照して説明する。
本実施形態による施策探索装置は、KPIの推定モデルを探索する対象として、ユーザの望む確実さを担保しながらKPIを高くする施策を探索し、ユーザに提示するものである。施策は、KPIを高くするためにユーザが選択すべき設定や行動を表す値である。
図1は、本実施形態による施策探索装置を示すブロック図である。図2は、図1の示した施策探索装置10の処理構成図である。
本実施形態における施策探索装置は図1に示すように、CPU(Central Processing Unit)101と、メモリ102と、通信装置103と、プログラム記憶装置104と、データ記憶装置105とを有している。
プログラム記憶装置104は、書込みおよび読み出しが可能にデータを記憶する装置であり、施策探索モジュール106と、KPI推定モデル生成モジュール107と、データ入出力モジュール108とを記憶している。施策探索モジュール106、KPI推定モデル生成モジュール107、およびデータ入出力モジュール108はそれぞれソフトウェアモジュールである。ソフトウェアモジュールは、1つ以上のソフトウェアプログラムからなり、あるまとまりのある機能を実現するソフトウェア部品である。すなわち、以下に説明する処理は、施策探索装置10をコンピュータとして実行させるプログラムとして構成される。
なお、本実施形態に示すソフトウェアモジュールの構成や、ソフトウェアモジュールのソフトウェアプログラムの構成は一例である。装置全体として所望の機能を提供するものであれば、装置内部で、ソフトウェアモジュールおよびソフトウェアプログラムをどのような機能分担で設計してもよい。
施策探索モジュール106(施策探索処理部)は、図2に示す施策探索処理201を実行するソフトウェアモジュールであり、不確実性考慮施策探索プログラム109を含んでいる。不確実性考慮施策探索プログラム109はソフトウェアプログラムである。ソフトウェアモジュールおよび各ソフトウェアプログラムの処理は後述する。
KPI推定モデル生成モジュール107(推定モデル生成処理部)は、図2に示すKPI推定モデル生成処理202を実行するソフトウェアモジュールであり、ソフトウェアプログラムであるKPI推定モデル生成プログラム110と不確実性評価モデル生成プログラム111とを含んでいる。ソフトウェアモジュールおよび各ソフトウェアプログラムの処理は後述する。
データ入出力モジュール108(入出力部)は、図2に示すデータ入出力処理203を実行するものである。
データ記憶装置105は、書込みおよび読み出し可能にデータをデータベース112として記憶する装置である。
なお、ここではプログラム記憶装置104とデータ記憶装置105とを別個の装置とする例を示したが、この構成に限定されることはない。プログラム記憶装置104とデータ記憶装置105とは同一装置が兼ねてもよい。
CPU101は、メインメモリであるメモリ102をワークエリアとして利用し、データ記憶装置105にデータベース112として記憶されたデータを読み出し、また演算過程あるいは演算結果のデータをデータ記憶装置105に書き込みながら、プログラム記憶装置104に記憶された各ソフトウェアを実行するプロセッサである。
通信装置103は、CPU101にて処理された情報を有線もしくは無線、またはそれら両方を含む通信ネットワークを介して送信し、また通信ネットワークを介して受信した情報をCPU101に伝達する。これにより、例えば、施策探索装置10を外部の端末から利用可能とする。
上述したように、本実施形態における施策探索装置10は、1つまたは複数のKPIに対して不確実性を許容するか否かをユーザから指定されると、施策探索処理201により、KPIの推定の不確実性を考慮しつつ、KPIが向上する施策を探索し提示する。施策探索処理201は、KPI推定モデル生成処理202が出力するKPI推定モデルと不確実性評価モデルを使用する。これにより、ユーザの指定に応じた不確実性を担保する施策を探索することが可能となる。
施策探索処理201は、施策探索モジュール106が実行する処理であり、一般的な探索アルゴリズムを用いることが考えられる。一般的な探索アルゴリズムとは、ランダムサーチ、グリッドサーチ、局所探索法、遺伝的アルゴリズム、対象とする関数が連続な場合は勾配法などである。強化学習を想定してもよい。いずれの手法を用いた場合であっても、施策探索処理201では、CPU101は、ランダムに初期の入力値を決定し、KPI推定モデル生成モジュール107にて生成されたKPI推定モデルを用いて入力値に対する第1の指標となるKPIの推定値を算出し、また、KPI推定モデル生成モジュール107にて生成された評価関数となる不確実性評価モデルを用いて推定値の不確実性を算出し、推定値の不確実性がユーザの指定した許容する不確実性の範囲内であるか否かを判断し、判断結果に応じて現在の入力値を採用するか否かを決定する。探索の終了条件を満たさない間は、次の入力値を生成して探索を繰り返す。終了条件を満たした場合は、探索を終了し、KPIが最も高くなる入力値を出力する。
KPI推定モデル生成処理202は、KPI推定モデル生成モジュール107が実行する処理であり、KPI推定モデルの生成と、KPI推定の不確実性評価モデルの生成を行う。KPI推定モデルは、例えば、入力値とKPIの組みのデータ群に対して一般的な機械学習の手法を用いて、入力値からKPIを推定するモデルを生成する。一般的な機械学習の手法とは、ランダムフォレスト、サポートベクタ回帰、重回帰、ニューラルネットワークなどである。不確実性評価モデルの生成については後述する。
データ入出力処理203は、データ入出力モジュール108が実行する処理であり、ユーザが操作する端末装置20と施策探索装置10とのデータの入出力を行う処理である。例えば、データ入出力処理203では、CPU101は、KPIに対して許容する不確実性の指定を受け付け、施策探索モジュール106に渡す。
このように、本実施形態における施策探索装置10においては、KPIに対して許容する不確実性が指定された場合に、不確実性を評価する評価関数による不確実さが指定を満たし、かつ、推定モデルを用いて算出される第1指標が向上する入力変数の値を探索するので、ユーザの必要性に応じた不確実性を考慮しながら所望の指標を向上する施策を取得することができる。
以下に、上述した各ソフトウェアモジュールおよびソフトウェアプログラムの処理について説明する。
まず、施策探索モジュール106が不確実性考慮施策探索プログラム109を用いて実行する処理について説明する。
図3は、図1に示した施策探索モジュール106が不確実性考慮施策探索プログラム109を用いて実行する処理を説明するためのフローチャートである。
図1に示した施策探索装置10における施策探索処理201においては、まず、CPU101は、ユーザの入力したKPIと不確実性許容との指定の組をデータ入出力モジュール108を介して取得する(ステップS301)。なお、この組はユーザの入力により複数指定されていてもよい。また、不確実性許容との指定とは、不確実であることを許容する程度の選択によるものが考えられる。
次に、CPU101は、ランダムな初期入力値xを生成する(ステップS302)。
次に、CPU101は、入力値xに対するKPI推定値を算出する(ステップS303)。この際、KPI推定値の算出には、KPI推定モデル生成プログラム106が生成したKPI推定モデルを使用する。なお、KPI推定モデルは、施策探索モジュール106がKPI推定モジュール107から直接取得してもよいし、KPI推定モデル生成プログラム106が生成したKPI推定モデルがデータベース112に記憶されており、施策探索モジュール106はデータベース112からKPI推定モデルを取得してもよい。KPI推定モデルの生成処理については後述する。なお、ステップS301において取得したユーザの入力が複数のKPIを指定していた場合は、複数のKPIについて推定値を算出する。
次に、CPU101は、算出したKPI推定値が、既にデータベース112に保存されたKPI推定値よりも高いかどうかを確認する(ステップS304)。KPI推定値が複数ある場合は、どれかが高い、全てが高い、高いものが過半数、など任意の判断基準を設定する。現在の推定値が高い場合は、ステップS305に進む。そうでない場合はS308進む。保存されたKPI推定値がない場合は、ステップS305に進む。
次に、CPU101は、入力値xに対する第2の指標となる不確実性(uc(x))を算出する(ステップS305)。不確実性の算出は、KPI推定モデル生成モジュール107が不確実性評価モデル生成プログラム108を用いて生成した不確実性評価モデルを用いて行う。不確実性評価モデルを生成する処理については後述する。不確実性評価モデルは複数存在する場合もあるので、その際は全ての不確実性を算出する。なお、図3のステップS305の不確実性ucの添え字のiはn個の不確実性評価モデルに対応する各々の不確実性ucを表す。不確実性ucの値は、連続値の場合もあるし、離散値の場合もある。
次に、CPU101は、不確実性ucの値に基づき、入力値xがユーザの指定したKPIの推定値の不確実性を満たすか否かを評価する(ステップS306)。例えば、算出された不確実性ucの値が、ユーザが指定したあるKPIの不確実性(複数ある場合はその和)の程度に応じた閾値を超えているか否かによって、ユーザの指定する不確実性を満たすことを判断できる。ユーザの指定した全てのKPIについて、ユーザの指定した確実性を満たす場合は、入力値xを採用すると判断し、ステップS307に進む。そうでない場合は、入力値xを不採用とすると判断し、ステップS308に進む。このように、算出された不確実性ucの値が、ユーザが指定したあるKPIの不確実性の程度に応じた閾値を超えているか否かによって、ユーザの指定する不確実性を満たすことを判断することで、指定が満たされるか否かを容易に判定することができる。
次に、CPU101は、入力値xとこれに対応するKPI推定値の組をデータベース112に保存する(ステップS307)。ユーザの指定したKPIが複数ある場合は、全てのKPIの推定値をデータベース112に保存する。なお、入力値xとこれに対応するKPI推定値の組をデータベース112に保存する際に、既にデータベース112に保存されている入力値xとKPI推定値の組を消去してもよいし、何らかの基準をもって消去せず残してもよい。例えばKPI推定値の上位n件を残してもよい。このように、新たに算出した推定値が既に算出された推定値よりも大きな場合にかぎり不確実性の指定が満たされるか否か判定するので、不確実性の判定の処理を無駄に実行することがない。
次に、CPU101は、施策探索処理の終了条件が満たされたか否か判定する(ステップS308)。例えば、探索の繰り返し回数の上限値に達した場合に、終了と判定してもよい。または、連続してn回、保存された入力値xとKPI推定値の組が更新されなかった場合に終了と判定してもよい。終了条件が満たされていなければ、CPU101はステップS309に進む。終了条件が満たされていれば、CPU101は探索処理を終了する。
ステップS308において終了条件が満たされていなかった場合、CPU101は、次の入力値xを選定し、ステップS303に戻って探索処理を繰り返す(ステップS309)。次の入力値xの選定方法は、例えば、現在の入力値xの近傍から選定してもよいし、ランダムに選定してもよい。用いている探索アルゴリズムに従った方法で選定してもよい。
このように、不確実性ucの値により不確実性の指定が満たされるか否か判定しながら、指定が満たされ、かつKPIが向上する入力変数の値を探索するので、不確実性が指定を満たすように所望の指標を向上する施策を取得することができる。
次に、KPI推定モデル生成モジュール107がKPI推定モデル生成プログラム110を用いて実行する処理について説明する。
図4は、図1に示したKPI推定モデル生成モジュール107がKPI推定モデル生成プログラム110を用いて実行する処理を説明するためのフローチャートである。
図1に示した施策探索装置10におけるKPI推定モデル生成処理202においては、まず、CPU101は、まず、モデル生成用データ(入力値xと出力値yの組)を入力する(ステップS401)。モデル生成用データは、データ記憶装置105に格納してあるものを読み込んでもよいし、外部の端末にあるファイルを、通信装置103を介して読み込んでもよい。
次に、CPU101は、任意の機械学習の手法を用いて、入力値xからKPI(出力値y)を推定するモデルを生成する(ステップS402)。上述したように、任意の機械学習の手法とは、ランダムフォレスト、サポートベクタ回帰、重回帰、ニューラルネットワークなどであり、これらの手法を用いて、入力値xから出力値yを推定するモデルを生成する。なお、出力値y(KPI)が複数ある場合、それらを同時に推定するモデルを生成してもよい。例えば、ニューラルネットワークの手法を利用すれば、入力値xから複数の出力値yを推定するモデルを学習することが可能である。
次に、CPU101は、学習結果のKPI推定モデルを、KPIの種類と紐づけてデータベース112に保存する(ステップS403)。
図5は、図1に示したデータ記憶装置105内のデータベース112に記憶されたKPI推定モデルの一例を示す図である。
図5に示すように、図1に示したデータ記憶装置105内のデータベース112には、KPI推定モデルを識別するためにKPI推定モデルに付与されたモデルIDと、KPIの種類と、KPI推定モデルを生成する際に使用された機械学習手法と、KPI推定モデルのパラメータとが対応づけて記録されている。機械学習手法が固定であれば、記録されていなくてもよい。KPI推定モデルパラメータは、例えば重回帰の手法によるモデルであれば、重み係数や切片である。
次に、KPI推定モデル生成モジュール107が不確実性評価モデル生成プログラム111を用いて実行する処理についていくつか例を挙げて説明する。
図6は、図1に示したKPI推定モデル生成モジュール107が不確実性評価モデル生成プログラム111を用いて実行する処理の一例を説明するためのフローチャートであり、学習データの有無に基づく不確実性評価モデル生成処理を示す。
図1に示した施策探索装置10における不確実性評価モデル生成処理においては、まず、CPU101は、KPI推定モデルの学習に使用したデータを入力する(ステップS501)。これは、ステップS401に入力されたデータと同じものである。データは、データ記憶装置105に格納してあるものを読み込んでもよいし、外部の端末にあるファイルを、通信装置103を介して読み込んでもよい。
次に、CPU101は、入力値xの空間をグリッドに分割する(ステップS502)。さらに、CPU102は、各グリッドの中心から、最近傍n点の入力値xまでの距離の最大値を取得し、データベース112に保存する。この値は、最近傍n点を含む円の半径を表す。この値が大きいほど、そのグリッド付近に入力値xのデータが少ないことを表す。学習用のデータが少ない入力空間の範囲では、KPI推定モデルの不確実性が高いと判断できる。すなわち、KPI推定モデル生成モジュール107においては、KPI推定モデルの学習に用いたデータを用い、入力値xの存在密度に基づいて不確実性を評価する不確実性評価モデルを生成し、KPI推定モデルの学習に用いたデータにおいて最も近い方から所定個数の入力値までの距離の最大値を不確実性とする。これにより、学習データにおいて入力値が多い領域か入力値が少ない領域かにより推定モデルによる推定の不確実性を評価することができるとともに、学習データの入力値から単純な演算で不確実性を算出することができる。
図7は、図1に示したデータベース112に保存されたテーブルの一例を示す図であり、入力値xがx1,x2の二次元のベクトルである場合の例を示す。
図7に示すように、データベース112に保存されたテーブルには、x1の値の範囲、x2の値の範囲によりグリッドが示されており、該当グリッドの最近傍n点の入力xまでの距離の最大値が記録されている。なお、x1の値の範囲やx2の値の範囲は、等間隔でなくてもよい。また、学習用データの少ない入力範囲の特定方法は、ここに記載した方法に限るものではない。例えば、グリッド内の学習データ数によっても、各グリッドの学習データの量を判断することが可能である。また、不確実性評価モデルは、図7に示すようなテーブルの形式でもよいし、値xの入力に対し、xと最近傍n点の学習データまでの距離の最大値を算出して出力するのでもよい。
このように、KPI推定モデル生成モジュール107は、推定モデルの入力変数により示される領域を複数のグリッドに分割し、グリッド毎に不確実性の評価値を予め算出しておくことになる。そして、施策探索モジュール104において、入力変数の値が属するグリッドの評価値を用いて、不確実性についてユーザの指定が満たされるか否か判定することになる。これにより、施策探索時に、入力変数の値に応じて不確実性の指定が満たされるか否かを容易に算出することができる。
図8は、図1に示したKPI推定モデル生成モジュール107が不確実性評価モデル生成プログラム111を用いて実行する処理の他の例を説明するためのフローチャートであり、KPI推定モデルの誤差に基づく不確実性評価モデル生成処理を示す。
図1に示した施策探索装置10における不確実性評価モデル生成処理においては、まず、CPU101は、入力値xと出力値yの推定誤差eの組のデータを入力する(ステップS601)。推定誤差eとは、例えば、出力値yの正解値(学習データの値)と、KPI推定モデルに入力値xを入力した際の出力である推定値との差の絶対値で表される。
次に、CPU101は、任意の機械学習の手法を用いて、入力値xに対して推定誤差eを推定するモデルを生成する(ステップS602)。
次に、CPU101は、ステップS602で出力された誤差推定モデルを、データベース112に保存する(ステップS603)。
図9は、図1に示したデータベース112に保存されたテーブルの一例を示す図である。
図9に示すように、図1に示したデータベース112には、誤差モデルを識別するために誤差モデルに付与された誤差推定モデルIDと、KPI推定モデルを識別するためにKPI推定モデルに付与されたKPI推定モデルIDと、KPIの種類と、誤差モデルを生成する際に使用された機械学習手法と、誤差モデルのパラメータとが対応づけて記録されている。なお、KPI推定モデルIDは、図5に示したモデルIDに対応づけられている。機械学習手法は、固定であれば記録されていなくてもよい。
KPI推定生成モジュール107においては、データベース112に記録された誤差推定モデルにより、入力値xに対して、KPI推定誤差の量を出力することができる。推定誤差の量が大きいほど不確実性が高いと判断できる。そして、この誤差に基づく前記不確実性を算出する推定モデルを生成することになる。
このように、KPI推定生成モジュール107において、KPI推定モデルの学習に用いたデータにおける入力変数の値およびKPIの値と、KPI推定モデルにより推定されるKPIの推定値とを学習することにより、入力変数に応じて推定値の誤差に基づく不確実性を算出する評価モデルを生成するので、誤差に基づく不確実性の評価が可能となる。
図10は、図1に示したKPI推定モデル生成モジュール107が不確実性評価モデル生成プログラム111を用いて実行する処理の他の例を説明するためのフローチャートであり、入力値xに対してKPI推定誤差を見積もる別の方法を示す。
図1に示した施策探索装置10における不確実性評価モデル生成処理においては、まず、CPU101は、入力値xと出力値yの推定誤差eの組のデータを入力する(ステップS701)。これは、ステップステップS601と同じ処理である。
次に、CPU101は、入力値xの空間をグリッドに分割する(ステップS702)。さらに、各グリッドの入力値xに対する推定誤差eの平均値と分散を算出し、データベース112に保存する(ステップS703)。
図11は、図1に示したデータベース112に保存されたテーブルの一例を示す図であり、入力値xがx1,x2の二次元である場合の例を示す。
図11に示すように、データベース112に保存されたテーブルには、x1の値の範囲と、x2の値の範囲と、該当グリッド内の入力値xに対する推定誤差の平均と、推定誤差の分散とが対応づけて記録されている。なお、グリッド内の入力値xに対する推定誤差の平均と、推定誤差の分散とのいずれか一方が記録された構成としてもよい。図11に示すテーブル1つに対して、図5に示したモデルIDとKPI種類の組が対応づけられている。図11に示すテーブルを用いて、入力値xの空間のどのグリッドではKPI推定誤差の平均値、分散が大きく、すなわち不確実性が大きいかを判断することができる。このように、KPI推定モデル生成モジュール107においては、KPI推定モデルの学習に用いたデータにおける入力変数の値およびKPIの値と、KPI推定モデルにより推定されるKPIの推定値とを用い、入力変数により示される領域を複数に分割した各グリッドにおける、KPI推定値の誤差の平均値と分散の少なくとも一方を算出することになる。そして、施策探索モジュール104において、入力変数の値が属するグリッドの平均値と分散の少なくとも一方を用いて、不確実性に関するユーザの指定が満たされるか否か判定することになる。これにより、施策探索時に、入力変数の値に応じて不確実性の指定が満たされるか否かを容易に算出することができる。
以下に、データ入出力モジュール108によって表示されるユーザ入力画面について説明する。
図12は、図1に示したデータ入出力モジュール108によって表示されるユーザ入力画面の一例を示す図である。
図1に示したデータ入出力モジュール108は、図12に示すような、ユーザが各KPIに対して不確実性を許容するかしないかを指定するためのユーザ入力画面80を表示する。
図12に示すように、データ入出力モジュール108によって表示されるユーザ入力画面80には、KPIの一覧がKPI欄801に表示されている。ユーザ入力画面80には更に、確実性の重視を指定するための確実性重視欄802と、不確実性の許容を指定するための不確実性許容欄803と、施策探索を開始するための施策探索ボタン804とが表示されている。
KPI欄801では探索対象のKPIがひとつまたは複数表示される。確実性重視欄802では確実性を重視したいKPIの選択欄がある。不確実性許容欄803ではKPIの推定が不確実性のある範囲も探索対象とすることを選択する欄がある。図12に示す例では、「売上量」と「使用期間」の二つのKPIが表示されている。これは、例えば、ある商品の仕様を決める際に、色、大きさ、値段の3つの値(入力値x)をいくつにするのが「売上量」と「購買後の使用期間」というKPIを高くできるか、ということを探索する問題を例示している。図12に示す選択状態では、「売上量」は確実に高いところを狙いたく、「使用期間」は、できれば長く使ってほしいが不確実性も許容できる、という例である。確実性重視、不確実性許容、の選択によって、探索時にどれだけ不確実性を許容するかを調整する。例えば、図3のステップS306において入力値xを採用するか否かを決める閾値を変更する。
このように、データ入出力モジュール108においては、ユーザ入力画面80によって、向上すべき複数のKPIと、KPIのそれぞれについての不確実性の許容に関する指定とを受け付けることになる。そして、施策探索モジュール106において、複数のKPIに関する不確実性がユーザによる不確実性に関する指定を満たし、かつ、複数のKPIが向上する入力変数の値を探索することになる。これにより、複数のKPIのそれぞれについて不確実性の指定を満たすように施策を探索することができる。
以下に、データ入出力モジュール108によって表示される施策探索結果提示画面について説明する。
図13は、図1に示したデータ入出力モジュール108によって表示される施策探索結果提示画面の一例を示す図である。
図1に示したデータ入出力モジュール108は、図13に示すような、施策探索の結果をユーザに提示するための施策探索結果提示画面90を表示する。
図13に示すように、データ入出力モジュール108によって表示される施策探索結果提示画面90には、施策901と、KPI評価結果902,903が提示される。図13に示す施策探索結果提示画面90は、図12に示したユーザ入力画面80の選択状態から施策探索ボタン804が操作された場合に表示される例が示されている。施策901には、色、大きさ、値段の3つの値をいくつにするかが示されている。KPI評価結果902には、図12に示したユーザ入力画面80にて確実性を重視すると指定した「売上量」のKPIが示されている。KPI評価結果903には、図12に示したユーザ入力画面80にて不確実性を許容すると指定した「使用期間」のKPIが示されている。KPI評価結果902,903に示されたドットは、不確実性を表すものである。例えば、図8にて示した処理にて計算される誤差の推定値や、図10にて示した処理にて計算される、グリッド単位の誤差の平均値を表示すればよい。
本実施形態では、1つまたは複数のKPIに対し、KPIを推定するモデルを用いてKPIを高くするような施策(入力値x)を探索する際に、KPIの推定の不確実性を許容するか否かを指定した上で、施策を探索することができる。不確実性評価モデルを用いて、探索の際の各入力値xに対して、各KPIの推定値の不確実性の高低を評価し、入力値xを探索対象とするか否かを選択しながら探索を進めればよい。
図13に示した例では、出力されている施策は1通りだが、図3に示した不確実性考慮施策探索プログラムの処理において、複数の入力値xが保存されている場合は、複数の施策とそのKPI評価結果を表示してもよい。
なお、本実施形態では、施策探索装置10がKPIの不確実性を受け入れるか否かの2パターンのいずれかの指定を受け付け、指定に対して好適な施策を提示するものとしたが、不確実性の指定の条件はこれに限らない。例えば、ユーザがKPIに対して許容する不確実性の段階を指定し、その指定に応じて好適な施策を提示することも可能である。その場合、データ入出力モジュール108は、更に、KPIの不確実性の許容の段階を提示し、ユーザの段階の指定を受け付ける。施策探索モジュール106は、選択された段階に応じた不確実性までの入力値xを探索範囲としながら探索を行えばよい。ユーザは段階的にKPIの不確実性の許容を指定して、より嗜好に合った施策を探索することが可能となる。
上述した本発明の実施形態は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本発明の範囲を逸脱することなしに、他の様々な態様で本発明を実施することができる。
10…施策探索装置、20…端末装置、80…ユーザ入力画面、90…施策探索結果提示画面、101…CPU、102…メモリ、103…通信装置、104…プログラム記憶装置、105…データ記憶装置、106…施策探索モジュール、107…KPI推定モデル生成モジュール、108…データ入出力モジュール、109…不確実性考慮施策探索プログラム、110…KPI推定モデル生成プログラム、111…不確実性評価モデル生成プログラム、112…データベース、201…施策探索処理、202…KPI推定モデル生成処理、203…データ入出力処理、801…KPI欄、802…確実性重視欄、803…不確実性許容欄、804…施策探索ボタン、901…施策、902…KPI評価結果、903…KPI評価結果

Claims (12)

  1. 推定モデルを用いて入力変数から算出される第1の指標の推定値を向上させる前記入力変数の値を探索する施策探索装置であって、
    前記推定モデルと、前記入力変数の値に応じた前記第1指標の推定値の不確実性を算出する評価関数とを生成する推定モデル生成処理部と、
    前記第1指標の推定における不確実性の許容に関する指定を受け付ける入出力部と、
    前記推定モデルを用いて入力変数から前記第1の指標の推定値を算出し、前記評価関数による前記不確実性が前記指定を満たし、かつ、前記第1指標の推定値が向上する前記入力変数の値を探索する施策探索処理部と、
    を有する施策探索装置。
  2. 前記評価関数は、前記入力変数の値に応じて、前記第1指標の推定値の不確実性を示す第2指標を算出する評価関数であり、
    前記施策探索処理部は、前記第2指標に基づいて前記指定が満たされるか否か判定する、
    請求項1に記載の施策探索装置。
  3. 前記不確実性の指定は、不確実であることを許容する程度の選択であり、
    前記施策探索処理部は、前記第2指標が前記程度に応じた閾値を超えるか否かにより、前記指定が満たされるか否かを判定する、
    請求項2に記載の施策探索装置。
  4. 前記施策探索処理部は、前記推定モデルを用いて新たに算出した推定値が既に保存されている推定値よりも高いとき、前記評価関数により前記指定が満たされるか否か判定し、前記指定が満たされる場合に前記新たに算出した推定値を保存する、
    請求項1に記載の施策探索装置。
  5. 前記推定モデル生成処理部は、前記推定モデルの入力変数により示される領域を複数のグリッドに分割し、前記グリッド毎に前記不確実性の評価値を予め算出し、
    前記施策探索処理部は、入力変数の値が属するグリッドの評価値を用いて、前記不確実性の前記指定が満たされるか否か判定する、
    請求項1に記載の施策探索装置。
  6. 前記推定モデル生成処理部は、前記推定モデルの学習に用いたデータを用い、入力値の存在密度に基づいて前記不確実性を評価する評価関数を生成する、請求項1に記載の施策探索装置。
  7. 前記推定モデル生成処理部は、前記推定モデルの学習に用いたデータにおいて最も近い方から所定個数の入力値までの距離の最大値を前記第2指標とする、請求項2に記載の施策探索装置。
  8. 前記推定モデル生成処理部は、前記推定モデルの学習に用いたデータにおける前記入力変数の値および前記第1指標の値と、前記推定モデルにより推定される前記第1指標の推定値とを学習することにより、前記入力変数に応じて前記推定値の誤差に基づく前記不確実性を算出する推定モデルを生成する、
    請求項1に記載の施策探索装置。
  9. 前記推定モデル生成処理部は、前記推定モデルの学習に用いたデータにおける前記入力変数の値および前記第1指標の値と、前記推定モデルにより推定される前記第1指標の推定値とを用い、前記入力変数により示される領域を複数に分割した各グリッドにおける、前記推定値の誤差の平均値と分散の少なくとも一方を算出し、
    前記施策探索処理部は、入力変数の値が属するグリッドの前記平均値と前記分散の少なくとも一方を用いて、前記不確実性の前記指定が満たされるか否か判定する、
    請求項1に記載の施策探索装置。
  10. 前記入出力部は、向上すべき複数の第1指標と、前記第1指標のそれぞれについての不確実性の許容に関する指定とを受け付け、
    前記施策探索処理部は、前記複数の第1指標に関する前記不確実性が前記指定を満たし、かつ、前記複数の第1指標が向上する前記入力変数の値を探索する、
    請求項1に記載の施策探索装置。
  11. 推定モデルを用いて入力変数から算出される第1の指標の推定値を向上させる前記入力変数の値を探索する施策探索方法であって、
    前記第1指標の推定における不確実性の許容に関する指定を受け付ける入出力処理と、
    前記推定モデルと、前記入力変数の値に応じた前記第1指標の推定値の不確実性を算出する評価関数とを生成する推定モデル生成処理と、
    前記推定モデルを用いて入力変数から前記第1の指標の推定値を算出し、前記評価関数による前記不確実性が前記指定を満たし、かつ、前記第1指標の推定値が向上する前記入力変数の値を探索する施策探索処理と、
    をコンピュータが実行する施策探索方法。
  12. コンピュータに、
    推定モデルを用いて入力変数から算出される第1指標の推定における不確実性の許容に関する指定を受け付ける入出力手順と、
    前記推定モデルと、前記入力変数の値に応じた前記第1指標の推定値の不確実性を算出する評価関数とを生成する推定モデル生成処理手順と、
    前記推定モデルを用いて入力変数から前記第1の指標の推定値を算出し、前記評価関数による前記不確実性が前記指定を満たし、かつ、前記第1指標の推定値が向上する前記入力変数の値を探索する施策探索手順と、
    を実行させるためのプログラム。
JP2018154382A 2018-08-21 2018-08-21 施策探索装置、方法およびプログラム Active JP6995717B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018154382A JP6995717B2 (ja) 2018-08-21 2018-08-21 施策探索装置、方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018154382A JP6995717B2 (ja) 2018-08-21 2018-08-21 施策探索装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2020030500A true JP2020030500A (ja) 2020-02-27
JP6995717B2 JP6995717B2 (ja) 2022-01-17

Family

ID=69622515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018154382A Active JP6995717B2 (ja) 2018-08-21 2018-08-21 施策探索装置、方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6995717B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022059252A1 (ja) * 2020-09-17 2022-03-24 株式会社日立製作所 バリューチェーン計画連携方法、バリューチェーン計画連携装置およびバリューチェーン計画連携システム
JP7301239B1 (ja) * 2022-03-17 2023-06-30 株式会社日立製作所 生成装置、生成方法、および生成プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0765168A (ja) * 1993-08-31 1995-03-10 Hitachi Ltd 関数近似装置及び方法
WO2017135322A1 (ja) * 2016-02-03 2017-08-10 日本電気株式会社 最適化システム、最適化方法、及び、記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0765168A (ja) * 1993-08-31 1995-03-10 Hitachi Ltd 関数近似装置及び方法
WO2017135322A1 (ja) * 2016-02-03 2017-08-10 日本電気株式会社 最適化システム、最適化方法、及び、記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022059252A1 (ja) * 2020-09-17 2022-03-24 株式会社日立製作所 バリューチェーン計画連携方法、バリューチェーン計画連携装置およびバリューチェーン計画連携システム
JP7489878B2 (ja) 2020-09-17 2024-05-24 株式会社日立製作所 バリューチェーン計画連携方法、バリューチェーン計画連携装置およびバリューチェーン計画連携システム
JP7301239B1 (ja) * 2022-03-17 2023-06-30 株式会社日立製作所 生成装置、生成方法、および生成プログラム
WO2023175871A1 (ja) * 2022-03-17 2023-09-21 株式会社日立製作所 生成装置、生成方法、および生成プログラム

Also Published As

Publication number Publication date
JP6995717B2 (ja) 2022-01-17

Similar Documents

Publication Publication Date Title
van Rijn et al. Fast algorithm selection using learning curves
CN110705709B (zh) 训练图神经网络模型的方法和装置
Miettinen Some methods for nonlinear multi-objective optimization
US20180365557A1 (en) Information processing method and information processing apparatus
Thiele et al. A preference-based evolutionary algorithm for multi-objective optimization
JP6093792B2 (ja) 測位装置、測位方法、測位プログラム、および、測位システム
US11645562B2 (en) Search point determining method and search point determining apparatus
JP6176979B2 (ja) プロジェクト管理支援システム
KR101544457B1 (ko) 최적 설계 파라미터 탐색을 위한 최적화 방법
KR102251807B1 (ko) 하이퍼파라미터 최적화 알고리즘 추천 방법 및 최적화 알고리즘 추천 시스템
JP2009265730A (ja) 情報処理装置および方法、並びにプログラム
US20200133998A1 (en) Estimation method, estimation apparatus, and computer-readable recording medium
CN110222838B (zh) 文档排序方法、装置、电子设备及存储介质
CN110633802A (zh) 策略搜索装置、方法及记录介质
JP6995717B2 (ja) 施策探索装置、方法およびプログラム
WO2016151620A1 (ja) シミュレートシステム、シミュレート方法およびシミュレート用プログラム
JP2005519394A (ja) 実験の自動計画方法およびそのシステム
US11126695B2 (en) Polymer design device, polymer design method, and non-transitory recording medium
CN109255389B (zh) 一种装备评价方法、装置、设备及可读存储介质
JP2007310860A (ja) 学習装置及び方法
JP6721484B2 (ja) 情報管理装置、方法、及びコンピュータプログラム
CN104462093A (zh) 个人推荐方案
CN111400150A (zh) 一种芯片性能验证方法、系统、设备及计算机存储介质
US20200272772A1 (en) Indicator calculation device, indicator calculation method, and non-transitory recording medium
JP2009265729A (ja) 推定装置および方法、並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211215

R150 Certificate of patent or registration of utility model

Ref document number: 6995717

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150