JP6828830B2 - 評価システム、評価方法および評価用プログラム - Google Patents

評価システム、評価方法および評価用プログラム Download PDF

Info

Publication number
JP6828830B2
JP6828830B2 JP2019549880A JP2019549880A JP6828830B2 JP 6828830 B2 JP6828830 B2 JP 6828830B2 JP 2019549880 A JP2019549880 A JP 2019549880A JP 2019549880 A JP2019549880 A JP 2019549880A JP 6828830 B2 JP6828830 B2 JP 6828830B2
Authority
JP
Japan
Prior art keywords
optimization
objective function
evaluation
learning
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019549880A
Other languages
English (en)
Other versions
JPWO2019087526A1 (ja
Inventor
伸志 伊藤
伸志 伊藤
遼平 藤巻
遼平 藤巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019087526A1 publication Critical patent/JPWO2019087526A1/ja
Application granted granted Critical
Publication of JP6828830B2 publication Critical patent/JP6828830B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、予測に基づく最適化の結果を評価する評価システム、評価方法および評価用プログラムに関する。
近年、データ駆動型の意思決定は、大きな注目を集めており、多くの実用的なアプリケーションで使用されている。最も有望なアプローチの1つが、機械学習によって生成される予測モデルに基づく数理最適化である。近年の機械学習の進歩により、正確な予測モデルを作成することが容易になり、予測結果が数理最適化の問題を構築するために使用されている。以下の説明では、このような問題を、予測型数理最適化、または単に予測最適化と記す。
これらのアプローチは、頻繁な試行錯誤プロセスが実用的とは言えない水分配最適化、エネルギー生成計画、小売価格最適化、サプライチェーン管理、ポートフォリオ最適化などのアプリケーションで使用される。
予測最適化の重要な特徴の1つは、標準的な最適化とは異なり、目的関数が機械学習によって推定されることである。例えば、予測に基づく価格最適化では、将来の収益は本来未知であるため、収益を予測するための関数は製品価格の関数として、需要の回帰式により推定される。
特許文献1には、商品の発注計画を決定する発注計画決定装置が記載されている。特許文献1記載の発注計画決定装置は、価格ごとの商品の需要を予測し、予測された需要を用いて価格と発注量とを入力とし且つ利益を出力とする目的関数の最適化問題を解くことにより、利益が最大となる商品の価格と発注量の組み合わせを算出する。
なお、非特許文献1には、与えられたシャープ・レシオに対して適切な割引を決定する方法が記載されている。
特開2016−110591号公報
Harvey, Campbell R and Liu, Yan, "Backtesting", SSRN Electronic Journal, 2015
予測に基づいて戦略を決める具体的な方法として、特許文献1に記載されているように、観測されたデータを元に予測モデルを作成し、予測モデルをもとに最適な戦略を計算するという手段が挙げられる。このとき最適化した結果の効果を見積もることが重要である。効果の単純な評価方法の一つは、最適化に用いた予測モデルを用いて最適解による効果を見積もるという方法である。
ここで、現実そのものを表す(真の)目的関数f(z,θ)に対して推定された目的関数f(z,θ^)を想定する。なお、本明細書において、上付き^を、記号に併記して記すこともある。例えば、θの上付き^を、θ^と記すこともある。
zとθは、決定変数であり、それぞれfのパラメータである。また、推定された最適戦略をz^とする。すなわち、
Figure 0006828830

である。ここで、Zはzの動き得る範囲である。
予測最適化において、f(z^,θ)を観測するには、現実の環境において戦略z^を実行することが必要なため困難である。そのため、z^の特性を評価するため、一般にf(z^,θ^)によってf(z^,θ)が推定される。
しかし、非特許文献1に記載されているように、アルゴリズム投資やポートフォリオ最適化において、f(z^,θ^)は、非常に楽観的になる傾向がある。言い換えると、推定に基づく最適値は、一般的に楽観的な方向に偏ってしまう。
非特許文献1の記載によれば、トレーディング戦略を評価する際の一般的な方法は、推定目標を50%割り引くという単純な発見的方法である。すなわち、非特許文献1では、0.5f(z^,θ^)をf(z,θ)の推定器とみなしている。また、最近の研究では、統計的に分析され、問題を緩和するアルゴリズムが提案されている。
しかし、これらのアルゴリズムは、特定のアプリケーション(例えば、アルゴリズム投資)に限定されている。さらに、一般的な予測最適化問題において、f(z,θ)のバイアスのない推定器のための原理的なアルゴリズムは存在しない。
そこで、本発明は、予測最適化における楽観的なバイアスを抑制した評価を行うことができる評価システム、評価方法および評価システムを提供することを目的とする。
本発明による評価システムは、学習に用いるサンプルから複数のサンプル群を生成し、生成されたサンプル群のうち学習に用いるサンプル群が重複しないように複数の予測モデルを生成する学習部と、予測モデルにより予測される被説明変数および最適化の制約条件に基づいて目的関数を生成し、生成された目的関数を最適化する最適化部と、最適化の結果を、その最適化の対象とした目的関数の生成に用いた予測モデルの学習で用いなかったサンプル群を用いて評価する評価部とを備えたことを特徴とする。
本発明による評価方法は、学習に用いるサンプルから複数のサンプル群を生成し、生成されたサンプル群のうち学習に用いるサンプル群が重複しないように複数の予測モデルを生成し、予測モデルにより予測される被説明変数および最適化の制約条件に基づいて目的関数を生成し、生成された目的関数を最適化し、最適化の結果を、その最適化の対象とした目的関数の生成に用いた予測モデルの学習で用いなかったサンプル群を用いて評価することを特徴とする。
本発明による評価用プログラムは、コンピュータに、学習に用いるサンプルから複数のサンプル群を生成し、生成されたサンプル群のうち学習に用いるサンプル群が重複しないように複数の予測モデルを生成する学習処理、予測モデルにより予測される被説明変数および最適化の制約条件に基づいて目的関数を生成し、生成された目的関数を最適化する最適化処理、および、最適化の結果を、その最適化の対象とした目的関数の生成に用いた予測モデルの学習で用いなかったサンプル群を用いて評価する評価処理を実行させることを特徴とする。
本発明によれば、予測最適化における楽観的なバイアスを抑制した評価を行うことができる。
本発明による評価システムの一実施形態の構成例を示すブロック図である。 学習データの例を示す説明図である。 外部要因データの例を示す説明図である。 制約条件の例を示す説明図である。 予測モデルの例を示す説明図である。 総利益を最大化するための最適化問題の例を示す説明図である。 評価結果を出力する例を示す説明図である。 評価結果を出力する例を示す説明図である。 評価システムの動作例を示すフローチャートである。 推定器を生成するアルゴリズムの例を示すフローチャートである。 本発明による評価システムの概要を示すブロック図である。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
まず初めに、最適値における楽観的なバイアスについて具体例を用いて説明する。ここでは、説明を簡易化するために、コイントスゲームにおける儲けの期待値を見積もる場合について説明する。ここで説明するコイントスゲームは、コインを投げた時に表(H)または裏(T)のどちらが出るかを予想するものであり、予想が的中した場合に1ドル得られ、予想が外れた時には何も得られないものとする。
ここで、3回試行した場合、(1)3回とも表(HHH)、(2)2回は表で1回は裏(HHT)、(3)1回は表で2回は裏(HTT)、(4)3回とも裏(TTT)の4パターンが存在する。この4パターンにおいて、表の出る確率は、それぞれ、(1)1、(2)2/3、(3)1/3、(4)0、と推定される。
それぞれのパターンで表の出る確率を考慮すると、(1)および(2)のパターンでは、表に賭けるのが最適と考えられ、(3)(4)のパターンでは裏に賭けるのが最適と考えられる。このように賭けた場合、(1)のパターンでの予想儲けは、1×1ドル=1ドル、(2)のパターンでの予想儲けは、2/3×1ドル=0.67ドル、(3)のパターンでの予想儲けは、(1−1/3)×1ドル=0.67ドル、(4)のパターンでの予想儲けは、(1−0)×1ドル=1ドルと算出される。表の確率が1/2ならば、これらのパターン(1)、(2)、(3)、(4)が観測される確率は、それぞれ1/8、3/8、3/8、1/8となるから、この4パターンの最適解を考慮した場合の予想儲けの期待値は1×1/8+0.67×3/8+0.67×3/8+1×1/8=0.75ドルと算出される。これが、予測に基づいて最適解を選択した場合の儲けの推定値の期待値である。
しかし、コインを投げた場合に表(または裏)の確率は1/2である。したがって、予想儲けは1/2×1ドル=0.5ドルになるはずである。すなわち、予測に基づいて最適解を選択した場合の儲けの推定値の期待値(0.75ドル)が、実際に想定される儲けの期待値(0.5ドル)よりも、楽観的なバイアスを含んでしまっていることが分かる。
次に、θ^がθの適切な推定器であったとしても、f(z^,θ^)がf(z^,θ)の適切な推定器とは言えない理由を説明する。
目的関数f(z,θ^)は、真の目的関数f(z,θ)の不偏推定量である、すなわち、以下に示す式1が成り立つとする。
Figure 0006828830
上記式1の等号関係から、E[f(z^,θ^)]とf(z^,θ^)が、それぞれE[f(z^,θ)]とf(z^,θ)の推定量であるとも考えられる。しかし、以下の定理が存在する。
すなわち、式1を満たし、z^およびzがそれぞれ以下を満たすとする。
Figure 0006828830

この場合、以下に示す式2が成り立つ。また、z^が、真の目的関数f(z,θ)に関して最適でない場合が起こりうるとき、式2における右の不等式が不等号で成り立つ。
Figure 0006828830
この定理は、たとえ、推定された目的関数f(z,θ^)が真の目的関数の不偏推定量だとしても、推定された最適値f(z^,θ^)は、f(z^,θ)の不偏推定量ではないことを意味する。
この楽観的なバイアスは、ポートフォリオ最適化の文脈で経験的に知られている。この問題に対し、統計的検定に基づくバイアス補正方法が提案されているが、これは、目的関数がシャープ・レシオである場合にのみ適用可能である。しかし、これらの方法は、一般的な予測最適化問題に適用可能であるが、バイアスのない推定器を得ることは示されていない。
この問題に対し、本発明者は、経験的リスク最小化(ERM:Empirical Risk Minimization )での交差検証に基づく解決方法を見出した。具体的には、本発明者は、機械学習のオーバーフィッティングの解決法を利用して楽観的なバイアスの問題を解決する方法を見出した。
教師あり機械学習では、学習器は、経験的誤差を最小化することによって予測ルールh^∈Hを決定する。すなわち、以下に示す式3が成り立つ。
Figure 0006828830
式3におけるxは、分布Dから生成される観測データであり、lは損失関数である。以下の式4に示す経験的エラー
Figure 0006828830

は、任意の決まった予測ルールhにおける汎化誤差
Figure 0006828830

のバイアスのない推定器である。すなわち、任意の決まったhについて、以下に示す式5が成り立つ。
Figure 0006828830
上記式5にも関わらず、計算されたパラメータh^の経験的誤差は、ほとんどの場合、h^の汎化誤差よりも小さい。これは、良く知られているように、h^が観測されたサンプルに過剰適合するためである。
この状況に対し、発明者は、楽観的なバイアスおよび機械学習における過剰適合の問題の原因が、目的関数の評価および客観的価値の評価において、データセットを再利用することであることを見出した。
表1に、経験的リスク最小化(ERM)と予測最適化との比較を示す。
Figure 0006828830
表1に示すように、予測最適化のバイアスに関する問題は、経験的リスクを最小化する問題と同様の構造を有する。機械学習における汎化誤差を推定する典型的な方法は、交差検証と、AIC(Akaike Information Criterion Akaike :赤池情報量規準)のような漸近的なバイアス補正である。
以上を考慮し、本実施形態では、計算された戦略における真の目的関数の値f(z^,θ)に対するバイアスのない推定器を生成する。すなわち、本実施形態では、以下に示す式6を満たす推定器ρ(X→R)を生成する。なお、本実施形態では、θのバイアスのない推定器をθ^と想定する。
Figure 0006828830
以上の想定のもと、本発明の実施形態を図面を参照して説明する。以下では、予測に基づく価格最適化について具体例を挙げながら説明する。予測に基づく価格最適化の例では、予測利益が評価結果に対応する。
図1は、本発明による評価システムの一実施形態の構成例を示すブロック図である。本実施形態の評価システム100は、記憶部10と、学習部20と、最適化部30と、評価部40と、出力部50とを備えている。
記憶部10は、後述する学習部20が学習に用いる学習データ(以下、サンプルと記すこともある。)を記憶する。価格最適化の例の場合、学習データとして、過去の売上データや価格、売上に影響する因子を表すデータ(以下、外部要因データと記すこともある。)を記憶する。
図2は、学習データの例を示す説明図である。図2に例示する学習データは、各商品の定価および実際に設定した売価、並びに各商品の売上数量を日付ごとに記憶している例を示す。
また、図3は、外部要因データの例を示す説明図である。図3に例示する外部要因データは、日付ごとのカレンダ情報を記憶している例を示す。また、図3に例示するように、外部要因データが、気象予報などのデータを含んでいてもよい。
また、記憶部10は、後述する最適化部30が最適化処理を行う際の制約条件を記憶する。図4は、制約条件の例を示す説明図である。図4に例示する制約条件は、各商品の定価に対する割引率に応じて、取り得る売価が定められることを示す。記憶部10は、例えば、磁気ディスク等により実現される。
学習部20は、最適化の算出に用いられる変数を予測する予測モデルを生成する。例えば、総売上を最大にするための価格を最適化する問題の場合、売上は価格と売上数量の積で算出されることから、学習部20は、売上数量を予測する予測モデルを生成してもよい。以下の説明では、説明変数とは、予測対象に影響を与え得る変数を意味する。例えば、予測対象が売上数量の場合、過去の商品の売価や売上数量、カレンダ情報などが説明変数に該当する。
予測対象は、機械学習の分野では、「目的変数」とも呼ばれる。なお、後述する最適化処理で一般的に用いられる「目的変数」との混同を避けるため、以下の説明では、予測対象を表す変数を被説明変数と記す。したがって、予測モデルは、被説明変数を1つ以上の説明変数を用いて表したモデルということができる。
具体的には、学習部20は、学習に用いるサンプルを分割して、複数のサンプル群を生成する。以下、説明を簡略化するため、サンプルを2つのサンプル群(以下、第1のサンプル群と第2のサンプル群と記す。)に分割する場合について説明する。ただし、生成するサンプル群の数は2つに限定されず、3つ以上であってもよい。
学習部20は、生成したサンプル群を用いて予測モデルを生成する。このとき、学習部20は、生成されたサンプル群のうち学習に用いるサンプル群が重複しないように複数の予測モデルを生成する。例えば、2つのサンプル群が生成された場合、学習部20は、第1のサンプル群を用いて、商品の売上数量を予測する第1の予測モデルを生成し、第2のサンプル群を用いて、商品の売上数量を予測する第2の予測モデルを生成する。
学習部20が予測モデルを生成する方法は任意である。学習部20は、FAB(Factorized Asymptotic Bayesian inference)などの機械学習エンジンを用いて予測モデルを生成してもよい。図5は、予測モデルの例を示す説明図である。図5に例示する予測モデルは、各商品の売上数量を予測する予測モデルであり、説明変数の内容に応じて予測式が選択される。
最適化部30は、生成した予測モデルにより予測される被説明変数および最適化の制約条件に基づいて目的関数を生成する。そして、最適化部30は、生成された目的関数を最適化する。例えば、2つの予測モデルが生成された場合、最適化部30は、第1の予測モデルにより予測される被説明変数に基づいて第1の目的関数を生成し、第2の予測モデルにより予測される被説明変数に基づいて第2の目的関数を生成する。そして、最適化部30は、生成された第1の目的関数および第2の目的関数を最適化する。
なお、最適化部30が最適化処理を行う方法は任意である。例えば、期待される総売上を最大化する問題の場合、最適化部30は、予測モデルに基づいて予測される売上数量と図4に例示するような制約条件に基づく商品の価格との積の総和を目的関数として生成する。そして、最適化部30は、生成された目的関数を最適化して総売上を最大にする商品の価格を特定してもよい。
なお、最適化対象を総売上ではなく総利益としてもよい。図6は、総利益を最大化するための最適化問題の例を示す説明図である。図6に例示する目的関数は、商品売価と原価との差に、予測される売上数量を乗じた総和を純利益として算出するための関数である。具体的には、売上数量は、学習部20により学習された予測モデルで予測される。そして、最適化部30は、図6に例示する価格の候補を示す制約条件に基づいて総利益を最大化するように目的関数を最適化する。
評価部40は、最適化部30による最適化の結果を評価する。具体的には、評価部40は、最適化の対象とした目的関数を生成するために用いた予測モデルの学習において、その予測モデルの学習に用いられなかったサンプル群を特定する。そして、評価部40は、特定したサンプル群を用いて最適化の結果を評価する。
例えば、最適化部30が、第1のサンプル群を用いて学習された第1の予測モデルを用いて第1の目的関数を生成したとする。このとき、評価部40は、第2のサンプル群を用いて最適化の結果を評価する。同様に、最適化部30が、第2のサンプル群を用いて学習された第2の予測モデルを用いて第2の目的関数を生成したとする。このとき、評価部40は、第1のサンプル群を用いて最適化の結果を評価する。例えば、価格最適化の問題の場合、評価部40は、特定した価格に基づいて利益を算出することにより、最適化の結果を評価してもよい。
さらに、評価部40は、最適化の結果を、各目的関数による最適化の結果を集計して評価してもよい。具体的には、評価部40は、最適化の結果として、各目的関数による最適化の結果の平均を算出してもよい。
出力部50は、最適化した結果を出力する。出力部50は、最適化した結果とその結果に対する評価を出力してもよい。出力部50は、最適化結果をディスプレイ装置(図示せず)に表示してもよいし、記憶部10に記憶してもよい。
図7および図8は、評価結果を出力する例を示す説明図である。図7に例示するように、出力部50は、最適化結果に基づいて、商品別の売上額や総売上額をグラフ形式で表示してもよい。また、出力部50は、図8に例示するように、設定した売価に対する売上予測を表形式で表示してもよい。その際、出力部50は、定価と割引後の売価とを区別しうる態様で表示してもよい。
学習部20と、最適化部30と、評価部40と、出力部50とは、プログラム(評価プログラム)に従って動作するコンピュータのプロセッサ(例えば、CPU(Central Processing Unit )、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array ))によって実現される。
上記プログラムは、例えば、記憶部10に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、学習部20、最適化部30、評価部40および出力部50として動作してもよい。また、評価システムの機能がSaaS(Software as a Service )形式で提供されてもよい。
学習部20と、最適化部30と、評価部40と、出力部50とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
また、評価システムの各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
次に、本実施形態の評価システムの動作を説明する。図9は、本実施形態の評価システムの動作例を示すフローチャートである。
学習部20は、学習に用いるサンプルから複数のサンプル群を生成する(ステップS11)。そして、学習部20は、生成されたサンプル群のうち学習に用いるサンプル群が重複しないように複数の予測モデルを生成する(ステップS12)。最適化部30は、予測モデルにより予測される被説明変数および最適化の制約条件に基づいて目的関数を生成する(ステップS13)。そして、最適化部30は、生成された目的関数を最適化する(ステップS14)。評価部40は、最適化の結果を予測モデルの学習で用いなかったサンプル群を用いて評価する(ステップS15)。
以上のように、本実施形態では、学習部20が複数のサンプル群を生成し、学習に用いるサンプル群が重複しないように複数の予測モデルを生成する。また、最適化部30が、予測モデルにより予測される被説明変数(予測対象)と最適化の制約条件に基づいて目的関数を生成し、最適化する。そして、評価部40が、最適化の結果を予測モデルの学習で用いなかったサンプル群を用いて評価する。よって、予測最適化における楽観的なバイアスを抑制した評価を行うことができる。
以下、本実施形態の推定システムによって、バイアスのない推定器が生成される理由を説明する。アルゴリズム投資における文脈では、ホールドアウト法と呼ばれる方法が知られている。以下の説明は、本質的には一般的な予測最適化問題に対するホールドアウト法の拡張とも言える。
値f(z^,θ^)にバイアスが含まれる理由の1つは、z^およびθ^が、従属する確率変数のためである。実際、z^およびθ^が独立の場合、以下に示す式7の関係は、θ^がバイアスのないθの推定器であるという想定から直接的に成り立つ。
Figure 0006828830
(機械学習における標準的な交差検証としての)交差検証法の主たるアイデアは、データx∈Xを2つの部分x∈XN1、x∈XN2(ただし、N+N=N)に分割することである。なお、xおよびxにおける各要素は、独立してpに従うため、xおよびxは、独立した確率変数である。以下、xに基づく推定器をθ^と記し、xに基づく推定器をθ^と記す。
また、各推定器に基づく最適戦略を、以下に示す式8で表す。
Figure 0006828830
このとき、z^とθ^は独立であり、また、z^とθ^も独立である。したがって、以下に示す式9が成り立つ。
Figure 0006828830
さらに、Nが十分大きい場合、
Figure 0006828830


Figure 0006828830

に近くなる。この考えは、データxをK個の部分に分割するk−交差検証に拡張可能である。
は、{x,...,x}\{x}から計算され、θ^は、xから計算される。このとき、以下の式10に示す値CVは、以下に示す式11を満たす。式11におけるz〜は、(K−1)N´個のサンプルから計算された戦略を表す。
Figure 0006828830
図10は、推定器f(z〜,θ)を生成するアルゴリズムの例を示すフローチャートである。まず、学習部20は、データx∈XをK個(ただし、K≧2)の部分x,...xに分割する(ステップS21)。次に、学習部20は、x−kをxを除くxの全てのサンプルと定義したとき、分割した各部分kについて、xおよびx−kからθ^およびθ を計算する(ステップS22)。最適化部30は、以下の式12に示す最適化問題を解く(ステップS23)。
Figure 0006828830
そして、評価部40は、以下に示す式13を計算することで、最適化結果を評価し(ステップS24)、出力部50は、評価結果を出力する(ステップS25)。
Figure 0006828830
すなわち、図10に例示するアルゴリズムにより、以下に示す式14が算出される。これは、上記式6に対応する。
Figure 0006828830
次に、本発明の概要を説明する。図11は、本発明による評価システムの概要を示すブロック図である。本発明による評価システム80は、学習に用いるサンプルから複数のサンプル群を生成し、生成されたサンプル群のうち学習に用いるサンプル群が重複しないように複数の予測モデルを生成する学習部81(例えば、学習部20)と、予測モデルにより予測される被説明変数および最適化の制約条件に基づいて目的関数を生成し、生成された目的関数を最適化する最適化部82(例えば、最適化部30)と、最適化の結果を、その最適化の対象とした目的関数の生成に用いた予測モデルの学習で用いなかったサンプル群を用いて評価する評価部83(例えば、評価部40)とを備えている。
そのような構成により、予測最適化における楽観的なバイアスを抑制した評価を行うことができる。
また、最適化部82は、生成された各予測モデルに基づいて目的関数を生成し、生成した各目的関数を最適化してもよい。そして、評価部83は、最適化の結果を、各目的関数による最適化の結果を集計して評価してもよい。
具体的には、評価部83は、最適化の結果として、各目的関数による最適化の結果の平均を算出してもよい。
また、学習部81は、学習に用いるサンプルから2つのサンプル群を生成し、第1のサンプル群を用いて第1の予測モデルを生成し、第2のサンプル群を用いて第2の予測モデルを生成してもよい。また、最適化部82は、第1の予測モデルにより予測される被説明変数に基づいて第1の目的関数を生成し、第2の予測モデルにより予測される被説明変数に基づいて第2の目的関数を生成し、生成された第1の目的関数および第2の目的関数を最適化してもよい。そして、評価部83は、第1の目的関数の最適化の結果を第2のサンプル群を用いて評価し、第2の目的関数の最適化の結果を第1のサンプル群を用いて評価してもよい。
具体的には、学習部81は、商品の売上数量を予測する予測モデルを複数生成してもよい。また、最適化部82は、予測モデルに基づく売上数量と商品の売価に基づいて売上を算出する目的関数を生成し、生成された目的関数を最適化して総売上を最大にする商品の価格を特定してもよい。そして、評価部83は、特定した価格に基づいて利益を算出することにより、最適化の結果を評価してもよい。
その際、最適化部82は、各商品の取り得る売価を制約条件とする目的関数を生成してもよい。
図12は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ1000は、プロセッサ1001、主記憶装置1002、補助記憶装置1003、インタフェース1004を備える。
上述の評価システムは、コンピュータ1000に実装される。そして、上述した各処理部の動作は、プログラム(評価プログラム)の形式で補助記憶装置1003に記憶されている。プロセッサ1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、当該プログラムに従って上記処理を実行する。
なお、少なくとも1つの実施形態において、補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000が当該プログラムを主記憶装置1002に展開し、上記処理を実行しても良い。
また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であっても良い。
以上、実施形態及び実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2017年11月2日に出願された米国仮出願第62/580,672号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10 記憶部
20 学習部
30 最適化部
40 評価部
50 出力部

Claims (10)

  1. 学習に用いるサンプルから複数のサンプル群を生成し、生成されたサンプル群のうち学習に用いるサンプル群が重複しないように複数の予測モデルを生成する学習部と、
    前記予測モデルにより予測される被説明変数および最適化の制約条件に基づいて目的関数を生成し、生成された目的関数を最適化する最適化部と、
    前記最適化の結果を、当該最適化の対象とした目的関数の生成に用いた予測モデルの学習で用いなかったサンプル群を用いて評価する評価部とを備えた
    ことを特徴とする評価システム。
  2. 最適化部は、生成された各予測モデルに基づいて目的関数を生成し、生成した各目的関数を最適化し、
    評価部は、最適化の結果を、各目的関数による最適化の結果を集計して評価する
    請求項1記載の評価システム。
  3. 評価部は、最適化の結果として、各目的関数による最適化の結果の平均を算出する
    請求項2記載の評価システム。
  4. 学習部は、学習に用いるサンプルから2つのサンプル群を生成し、第1のサンプル群を用いて第1の予測モデルを生成し、第2のサンプル群を用いて第2の予測モデルを生成し、
    最適化部は、前記第1の予測モデルにより予測される被説明変数に基づいて第1の目的関数を生成し、前記第2の予測モデルにより予測される被説明変数に基づいて第2の目的関数を生成し、生成された前記第1の目的関数および前記第2の目的関数を最適化し、
    評価部は、前記第1の目的関数の最適化の結果を前記第2のサンプル群を用いて評価し、前記第2の目的関数の最適化の結果を前記第1のサンプル群を用いて評価する
    請求項1から請求項3のうちのいずれか1項に記載の評価システム。
  5. 学習部は、商品の売上数量を予測する予測モデルを複数生成し、
    最適化部は、前記予測モデルに基づく売上数量と商品の売価に基づいて売上を算出する目的関数を生成し、生成された目的関数を最適化して総売上を最大にする商品の価格を特定し、
    評価部は、特定した価格に基づいて利益を算出することにより、前記最適化の結果を評価する
    請求項1から請求項4のうちのいずれか1項に記載の評価システム。
  6. 最適化部は、各商品の取り得る売価を制約条件とする目的関数を生成する
    請求項5記載の評価システム。
  7. 学習に用いるサンプルから複数のサンプル群を生成し、
    生成されたサンプル群のうち学習に用いるサンプル群が重複しないように複数の予測モデルを生成し、
    前記予測モデルにより予測される被説明変数および最適化の制約条件に基づいて目的関数を生成し、
    生成された目的関数を最適化し、
    前記最適化の結果を、当該最適化の対象とした目的関数の生成に用いた予測モデルの学習で用いなかったサンプル群を用いて評価する
    ことを特徴とする評価方法。
  8. 生成された各予測モデルに基づいて目的関数を生成し、生成した各目的関数を最適化し、
    最適化の結果を、各目的関数による最適化の結果を集計して評価する
    請求項7記載の評価方法。
  9. コンピュータに、
    学習に用いるサンプルから複数のサンプル群を生成し、生成されたサンプル群のうち学習に用いるサンプル群が重複しないように複数の予測モデルを生成する学習処理、
    前記予測モデルにより予測される被説明変数および最適化の制約条件に基づいて目的関数を生成し、生成された目的関数を最適化する最適化処理、および、
    前記最適化の結果を、当該最適化の対象とした目的関数の生成に用いた予測モデルの学習で用いなかったサンプル群を用いて評価する評価処理
    を実行させるための評価プログラム。
  10. コンピュータに、
    最適化処理で、生成された各予測モデルに基づいて目的関数を生成させ、生成した各目的関数を最適化させ、
    評価処理で、最適化の結果を、各目的関数による最適化の結果を集計して評価させる
    請求項9記載の評価プログラム。
JP2019549880A 2017-11-02 2018-08-17 評価システム、評価方法および評価用プログラム Active JP6828830B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762580672P 2017-11-02 2017-11-02
US62/580,672 2017-11-02
PCT/JP2018/030543 WO2019087526A1 (ja) 2017-11-02 2018-08-17 評価システム、評価方法および評価用プログラム

Publications (2)

Publication Number Publication Date
JPWO2019087526A1 JPWO2019087526A1 (ja) 2020-11-12
JP6828830B2 true JP6828830B2 (ja) 2021-02-10

Family

ID=66331542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019549880A Active JP6828830B2 (ja) 2017-11-02 2018-08-17 評価システム、評価方法および評価用プログラム

Country Status (3)

Country Link
US (1) US11586951B2 (ja)
JP (1) JP6828830B2 (ja)
WO (1) WO2019087526A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7168095B2 (ja) * 2019-08-29 2022-11-09 富士通株式会社 パターン抽出プログラム、装置、及び方法
CN117015750A (zh) * 2021-05-28 2023-11-07 村田机械株式会社 预测装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7379890B2 (en) * 2003-10-17 2008-05-27 Makor Issues And Rights Ltd. System and method for profit maximization in retail industry
US7908164B1 (en) * 2005-08-09 2011-03-15 SignalDemand, Inc. Spot market profit optimization system
US8577815B2 (en) * 2009-10-23 2013-11-05 GM Global Technology Operations LLC Method and system for concurrent event forecasting
JP5720299B2 (ja) * 2011-02-24 2015-05-20 Jfeスチール株式会社 コークス炉の操業方法
US8782683B2 (en) * 2012-10-12 2014-07-15 At&T Intellectual Property I, Lp Method and apparatus for managing advertising
US9652722B1 (en) * 2013-12-05 2017-05-16 The Mathworks, Inc. Methods and systems for robust supervised machine learning
US10318882B2 (en) * 2014-09-11 2019-06-11 Amazon Technologies, Inc. Optimized training of linear machine learning models
WO2016004075A1 (en) * 2014-06-30 2016-01-07 Amazon Technologies, Inc. Interactive interfaces for machine learning model evaluations
JP6536028B2 (ja) 2014-12-10 2019-07-03 富士通株式会社 発注計画決定装置、発注計画決定方法および発注計画決定プログラム
US20170061284A1 (en) * 2015-08-31 2017-03-02 International Business Machines Corporation Optimization of predictor variables
WO2017094207A1 (ja) * 2015-11-30 2017-06-08 日本電気株式会社 情報処理システム、情報処理方法および情報処理用プログラム
JP7114900B2 (ja) * 2016-02-03 2022-08-09 日本電気株式会社 情報処理装置、情報処理方法、及び、プログラム
US20190026660A1 (en) * 2016-02-03 2019-01-24 Nec Corporation Optimization system, optimization method, and recording medium

Also Published As

Publication number Publication date
US11586951B2 (en) 2023-02-21
US20210182702A1 (en) 2021-06-17
JPWO2019087526A1 (ja) 2020-11-12
WO2019087526A1 (ja) 2019-05-09

Similar Documents

Publication Publication Date Title
Islam et al. Prediction of probable backorder scenarios in the supply chain using Distributed Random Forest and Gradient Boosting Machine learning techniques
KR20210116435A (ko) 재고 관리 및 최적화를 위한 시스템 및 방법
JP7044153B2 (ja) 評価システム、評価方法および評価用プログラム
Abolghasemi et al. Machine learning applications in time series hierarchical forecasting
Herasymovych et al. Using reinforcement learning to optimize the acceptance threshold of a credit scoring model
JP6828830B2 (ja) 評価システム、評価方法および評価用プログラム
JP2018060547A (ja) 指示分析のためのシステムおよび方法
Tavakkoli et al. A novel forecasting model based on support vector regression and bat meta-heuristic (Bat–SVR): case study in printed circuit board industry
WO2016205153A1 (en) Incremental estimation for probabilistic forecaster
US20230267007A1 (en) System and method to simulate demand and optimize control parameters for a technology platform
Kaplarević-Mališić et al. Identifying optimal architectures of physics-informed neural networks by evolutionary strategy
US20230342664A1 (en) Method and system for detection and mitigation of concept drift
Oliveira et al. Cross-Learning-Based Sales Forecasting Using Deep Learning via Partial Pooling from Multi-level Data
US12033097B2 (en) Utilizing machine learning and predictive modeling to manage and determine a predicted success rate of new product development
JP6947229B2 (ja) 最適化装置、最適化方法および最適化プログラム
JP7464115B2 (ja) 学習装置、学習方法および学習プログラム
JP7212231B2 (ja) 情報処理装置、方法及びプログラム
Yin et al. A discrete constraint-based method for pipeline build-up aware services sales forecasting
US20240320694A1 (en) Systems and methods for generating a trend forecast and an explanation
Varshney et al. Optimal management strategies of renewable energy systems with hyperexponential service provisioning: an economic investigation
JP6534028B2 (ja) 先見2次ロジック流動数管理システム、プログラム及び方法
Wang et al. Combining diffusion and grey models based on evolutionary optimization algorithms to forecast motherboard shipments
US11900365B1 (en) Predicting attributes for recipients
JP6183359B2 (ja) 設計支援装置、設計支援方法及びプログラム
JPWO2019053828A1 (ja) 情報分析装置、情報分析方法および情報分析プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210104

R150 Certificate of patent or registration of utility model

Ref document number: 6828830

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150