JP7006612B2 - 評価システム、評価方法および評価用プログラム - Google Patents

評価システム、評価方法および評価用プログラム Download PDF

Info

Publication number
JP7006612B2
JP7006612B2 JP2018547595A JP2018547595A JP7006612B2 JP 7006612 B2 JP7006612 B2 JP 7006612B2 JP 2018547595 A JP2018547595 A JP 2018547595A JP 2018547595 A JP2018547595 A JP 2018547595A JP 7006612 B2 JP7006612 B2 JP 7006612B2
Authority
JP
Japan
Prior art keywords
evaluation
model
prediction model
true
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018547595A
Other languages
English (en)
Other versions
JPWO2018079366A1 (ja
Inventor
伸志 伊藤
顕大 矢部
遼平 藤巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2018079366A1 publication Critical patent/JPWO2018079366A1/ja
Application granted granted Critical
Publication of JP7006612B2 publication Critical patent/JP7006612B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2115Selection of the most significant subset of features by evaluating different subsets according to an optimisation criterion, e.g. class separability, forward selection or backward elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors

Description

本発明は、予測モデルに基づいて決定された内容を評価する評価システム、評価方法および評価用プログラムに関する。
一般に、真のモデルは不明であるため、真のモデルから生成されるデータを基に予測モデルを推定することが行われている。予測モデルが推定できれば、そのモデルに基づいて、将来の状態を予測することが可能になり、その状態に基づいて様々な戦略を立てることも可能になる。
特許文献1には、商品の発注計画を決定する発注計画決定装置が記載されている。特許文献1記載の発注計画決定装置は、価格ごとの商品の需要を予測し、予測された需要を用いて価格と発注量とを入力とし且つ利益を出力とする目的関数の最適化問題を解くことにより、利益が最大となる商品の価格と発注量の組み合わせを算出する
特開2016-110591号公報
予測に基づく戦略の一つとして、予測に基づいて最適化した結果の効果を見積もることが挙げられる。具体的には、不明である真のモデルから生成されるデータを基に予測モデルを推定し、推定された予測モデルをもとに最適解を計算する。そして、その最適解を予測モデルを用いて評価することで、その最適解による効果を見積もる。
しかし、本発明者は、真のモデルから生成されるデータを基に予測モデルを生成し、その予測モデルをもとに最適解を計算して、その結果を予測モデルで評価すると、実際の評価結果よりも良い方向へのバイアスが生じてしまうことを発見した。
例えば、予測結果に基づいて価格を決定する場面では、期待利益を予測モデルに基づいて単純に見積もると、真の利益との間に差が生じてしまうという現象である。特に、この場合には、平均値の観点で、より儲かりがちな期待利益が算出されてしまう。このことを、以下、具体的に説明する。
今、M個の製品が存在するものとし、そのインデックスをm∈{1,…,M}で表す。価格p∈Rにおける販売数量q∈Rは、例えば、以下の式1で示すモデルで算出される。
Figure 0007006612000001
式1において、{ψ:R→R d=1は、固定された基底関数であり、{θ }⊆Rは、真の係数である。θ=[θ ,…,θ ∈Rとし、ψ(p)=[ψ(p),…,ψ(p)]とすると、総売上は、以下の式2で表される。
Figure 0007006612000002
式2の期待値をf(p,θ)とすると、期待値は、例えば、以下の式3で表される。
Figure 0007006612000003
このとき、p∈Pの制約の元、期待される総売上を最大化する問題は、以下の式4で表される。
Figure 0007006612000004
しかし、実際の状況では、真の係数θを知ることはできない。そのため、一般に、推定値θハット(θに上付き^)によって、θが置き換えられ、以下の式5で示す最適な戦略が計算される。
Figure 0007006612000005
θハットがバイアスのない評価器である場合、f(p,θハット)は、全てのp∈Pについて、f(p,θ)のバイアスのない評価器である。そのため、最適値f(p(θハット),θハット)もまた、バイアスのない期待される真の総売上f(p(θハット),θ)の評価器とも考えられる。しかし、実際にはそうでなく、以下の式6に示す関係が成り立つ。
Figure 0007006612000006
式6の意味するところは、たとえθハットにバイアスがなかったとしても、f(p(θハット),θハット)は、バイアスのないf(p(θハット),θ)の評価器ではないかもしれない、ということである。バイアスのないf(p(θハット),θ)を構築するためには、以下の式7で示すバイアス項を評価する必要があると言える。
Figure 0007006612000007
そこで、本発明は、予測に基づく最適解を、理論的にバイアスを生じさせることなく評価できる評価システム、評価方法および評価用プログラムを提供することを目的とする。
本発明による評価システムは、真のモデルから生成されたデータを用いて推定される予測モデルが存在するときに、その予測モデルを基に計算される最適解を、予測モデルに基づく評価と真のモデルに基づく評価との間に生ずるバイアスを考慮して評価する評価部を備えたことを特徴とする。
本発明による評価方法は、真のモデルから生成されたデータを用いて推定される予測モデルが存在するときに、その予測モデルを基に計算される最適解を、予測モデルに基づく評価と真のモデルに基づく評価との間に生ずるバイアスを考慮して評価することを特徴とする。
本発明による評価用プログラムは、コンピュータに、真のモデルから生成されたデータを用いて推定される予測モデルが存在するときに、その予測モデルを基に計算される最適解を、予測モデルに基づく評価と真のモデルに基づく評価との間に生ずるバイアスを考慮して評価する評価処理を実行させることを特徴とする。
本発明によれば、予測に基づく最適解を、理論的にバイアスを生じさせることなく評価できる。
本発明による評価システムの第1の実施形態の構成例を示すブロック図である。 第1の実施形態の評価システムの動作例を示すフローチャートである。 第1の実施形態の変形例における評価システムの動作例を示すフローチャートである。 第2の実施形態の評価システムの動作例を示すフローチャートである。 第2の実施形態の評価システムの他の動作例を示すフローチャートである。 本発明による評価システムの概要を示すブロック図である。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
まず、以下の説明で用いる記号を説明する。θ∈Rは、パラメータである。Zは、実現可能な解決策の集合である。f:Z×R→Rは、目的関数である。z(θ)は、目的関数f(z,θ)の最適解であり、
Figure 0007006612000008
である。
θは、真の係数であり、θハットは、推定されるパラメータ(ランダム値)である。また、Θは、z(θ)が一意に決定されるθ∈Rの集合であり、
Figure 0007006612000009
である。
次に、本発明における問題設定を説明する。本発明では、推定された最適解に基づく真の目的関数の値f(z(θハット),θ)を知りたいものとする。ただし、推定された最適解に基づく推定された目的関数の値f(z(θハット),θハット)は、f(z(θハット),θ)の適切な評価器ではない。すなわち、以下の式8に示すようなバイアスを有する。
Figure 0007006612000010
そこで、本発明では、以下の式9を満たすf(z(θハット),θ)の評価器ρ(θハット)を構築することを目標とする。
Figure 0007006612000011
実施形態1.
まず、本発明の第1の実施形態を説明する。本実施形態では、以下の内容を想定する。まず、本実施形態において、最適解z(θ)は、ほぼ全てのθについて一意に決定されるものとする。例えば、μがRにおけるルベーグ測度の場合、μ(Rp\Θ)=0である。
Zは、有限集合であるか、Rのコンパクト部分集合であるとする。また、
Figure 0007006612000012
は、連続性のある単射である。以上の想定のもと、本発明の実施形態を図面を参照して説明する。
図1は、本発明による評価システムの第1の実施形態の構成例を示すブロック図である。本実施形態の評価システム100は、入力部10と、評価部20と、出力部30と、記憶部40とを備えている。
入力部10は、評価部20が評価に使用する各種データの入力を受け付ける。記憶部40は、入力部10から入力されたデータや、各種パラメータを記憶する。記憶部40は、例えば、磁気ディスク等により実現される。
評価部20は、予測に基づいて導出される最適解を、その予測を行う予測モデルで想定する真のモデルに基づいて評価する。
具体的には、評価部20は、想定される真のモデルθから生成されたデータを用いて、θハットを推定し、推定されたθハットに基づくモデルから再びデータを生成して、θハットハットを推定する。以下、このデータ生成プロセスが繰り返される。すなわち、評価部20は、バイアスの算出を繰り返すことで、実際のバイアスを見積もる。
本実施形態では、ブートストラップ法を用いて、バイアスなく評価する方法を説明する。また、本実施形態では、評価の具体例として、売上最適化の例を説明する。
例えば、Xを価格ベクトルの集合とし、Yを売上数量のベクトルの集合とする。そして、価格および売上数量は、X×Yの確率分布Fに従うと想定する。値xからyを予測する回帰モデル{r(・;θ):X→Y|θ∈Θ}の中から、損失関数l:X×Y×Yに関する最善のモデルは、以下の式10で与えられる。
Figure 0007006612000013
回帰モデル{r(・;θ):X→Y|θ∈Θ}が真のモデルを含み、それがθで表記される場合、所定の想定のもとで上記式10が成り立つ。しかし、実際の場面では、真の分布Fを知ることができないため、θの評価器θハットを計算するために、データによって定義される経験的な分布Fハット(Fに上付き^)が通常使用される。この場合、θハットは、以下の式11のように計算される。
Figure 0007006612000014
例えば、(x,y)~Fが、y~N(w*Tx,σI)で与えられる場合、所定の想定のもとで、以下の式12が成り立つ。
Figure 0007006612000015
Fから生成されるサンプル{(x,y)} j=1からwを推定する場合、評価部20は、以下の式13に示すwハット(wに上付き^)を計算する。式13において、Fハットは、{(x,y)} j=1によって定義される経験的な分布である。
Figure 0007006612000016
また、X×Yの任意の確率分布F´について以下の式14に示すT(F´)を定義することにより、評価部20は、θ=T(F)およびθハット=T(Fハット)を得る。
Figure 0007006612000017
模範的な価格最適化によって獲得される実益は、f(z(T(Fハット)),T(F))と表現できる。したがって、知りたいことは、以下の式15で示す分布である。式15において、ε(F)は、Fから生成される独立したN個のサンプルによって与えられた経験的分布の確率分布である。
Figure 0007006612000018
ここで、“Fハット~ε(F)”がN→∞のとき、Fに向かって収束することに注目する。具体的には、Fハットの分布関数は、点ごとにFの分布関数にほぼ確実に収束する。Fは不明なため、上述する式15の分布を直接推定することは困難である。そこで、上記式15の分布の代わりに、以下の式16に示す分布を考慮する。
Figure 0007006612000019
式16は、以下の式17のように近似できる。
Figure 0007006612000020
上記式17に示す分布は、いくつかの正則性条件のもとで、上記式16に示す分布に収束する。したがって、十分に大きなNのもとで、以下に示す式18が期待される。
Figure 0007006612000021
なお、TがFにおいて二次コンパクト微分可能であるとし、全てのz∈Zにおいて、f(z,θ)がθに関して連続であるとする。この場合、上記式16に示す分布関数は、Fの分布関数に向けて、
Figure 0007006612000022
のオーダで収束する。すなわち、任意のα∈Rについて、以下の式19が成り立つ。
Figure 0007006612000023
そして、TがFにおいて二次コンパクト微分可能であるとし、全てのz∈Zにおいて、f(z,θ)がθに関して連続であるとした場合、以下の式20が得られる。
Figure 0007006612000024
なお、確率変数の順序{X}の場合、X=O(a)は、以下に示す式21を意味する。
Figure 0007006612000025
出力部30は、評価結果を出力する。具体的には、出力部30は、上記式18の右側の式により算出される評価結果を出力する。
入力部10と、評価部20と、出力部30とは、プログラム(評価用プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、記憶部40に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、入力部10、評価部20および出力部30として動作してもよい。
また、入力部10と、評価部20と、出力部30とは、それぞれが専用のハードウェアで実現されていてもよい。また、記憶部40は、例えば、磁気ディスク等により実現される。
次に、本実施形態の評価システムの動作を説明する。図2は、本実施形態の評価システムの動作例を示すフローチャートである。
まず、入力部10は、N個のサンプルX={x,…,x}と、M∈{1,2,…}を入力する(ステップS11)。ここで、j=1,…,Mについて、ブートストラップ法に基づくXをXからのN個のランダムサンプルであるとする。
評価部20は、Xから漸近正規性をもつ推定値θハットを計算する(ステップS12)。評価部20は、XからN個のランダム復元抽出を行い、Xとする。これを、j=1,2,…,Mに対して行う(ステップS13)。また、同様に、評価部20は、Xからθハットを計算する(ステップS14)。そして、評価部20は、以下の式22に示すzを計算する(ステップS15)。すなわち、評価部20は、zの計算をM回繰り返す。
Figure 0007006612000026
出力部30は、以下の式23で示すρを出力する(ステップS16)。
Figure 0007006612000027
なお、図2に例示する動作の理論的保証は、上記の式20に示されている。
以上のように、本実施形態では、評価部20が、予測モデルを基に計算される最適解を、予測モデルに基づく評価と真のモデルに基づく評価との間に生ずるバイアスを考慮して評価する。よって、予測に基づく最適解を、理論的にバイアスを生じさせることなく評価できる。
具体的には、評価部20は、上記式22に示すようなzを算出し、f(z,θハット)とf(z,θハット)の差分(具体的には、差分の総和の平均)を、真のモデルと予測モデルとの評価値のバイアスとして算出する。よって、両者の間に生ずるバイアスを理論的に生じさせなくすることが可能になる。
次に、本実施形態の変形例を説明する。本変形例では、出力部30は、評価値の信頼区間を出力する。Gを式16の分布関数であるとする。このとき、α∈(0,1)について、以下に示す式24が成り立つ。
Figure 0007006612000028
式17に示す分布が式16に示す分布に収束するとの観測のもと、f(z(θハット),θ)の評価信頼区間を以下の式25に示すようにみなすことができる。式25において、Gハット(Gに上付き^)は、式17における分布関数である。
Figure 0007006612000029
実際、上記に示す式20は、左側の部分が、
Figure 0007006612000030
のオーダでαに収束することを保証する。これらのことは、図3に示すアルゴリズムに要約できる。図3は、本変形例の評価システムの動作例を示すフローチャートである。
まず、入力部10は、N個のサンプルX={x,…,x}と、M∈{1,2,…}と、α∈(0,1)を入力する(ステップS21)。また、第1の実施形態と同様、j=1,…,Mについて、XをXからのN個のランダム(ブートストラップ)サンプルであるとする。
評価部20は、Xから漸近正規性をもつ推定値θハットを計算する(ステップS22)。評価部20は、XからN個のランダム復元抽出を行い、Xとする。これを、j=1,2,…,Mに対して行う(ステップS23)。また、評価部20は、Xからθハットを計算する(ステップS24)。そして、評価部20は、以下の式26に示すzを計算する(ステップS25)。すなわち、評価部20は、zの計算をM回繰り返す。
Figure 0007006612000031
次に、評価部20は、以下のM個の値を昇順に並べる(ステップS26)。
Figure 0007006612000032
そして、評価部20は、aをceil(M(1-α)/2)番目に小さい値とし、bをceil(M(1-α)/2)番目に大きい値とする(ステップS27)。なお、ceil()は、天井関数である。
出力部30は、f(z(θハット),θ)の100α%の信頼区間[l,r]を出力する(ステップS28)。lおよびrは、以下の式27で表される。
Figure 0007006612000033
このように、評価部20が、評価差分の順序を決定し、指定された範囲に応じた順序に含まれる評価差分の最小値および最大値(ceil(M(1-α)/2)番目の最小値および最大値)を評価区間として出力することで、より信頼性の高い評価結果を得ることが可能になる。
実施形態2.
次に、本発明の評価システムの第2の実施形態を説明する。本実施形態では、第1の実施形態の想定に加え、以下の内容を想定する。まず、本実施形態において、f(z,θ)は、θについてのアフィン変換であり、例えば、以下の式28が成り立つとする。
Figure 0007006612000034
評価器θハットが“θハット~N(θ,Σ)”を満足するようなΣが存在するとし、任意のγ>1について、“θハットハット~N(θ,γΣ)”(ただし、θハットハットは、θに上付き^が2つ)を観測可能であるとする。
ここで、θハットが漸近正規性をもつ推定値である場合、例えば、以下の式29に示すようなVが存在する。
Figure 0007006612000035
式29において、Nは、サンプル数であり、→は、分布における収束を表わす。そのため、この想定は、漸近的な意味において成り立つ。以上の想定のもと、本発明の実施形態を図面を参照して説明する。なお、本実施形態の評価システムの構成は、第1の実施形態と同様である。
まず、γ≧0について、φ(γ)およびη(γ)を、以下の式30及び式31のように定義する。式30および式31において、δ~N(0,Σ)である。本実施形態の目的は、η(1)を推定することである。
Figure 0007006612000036
ここで、全てのγ>0について、φ(γ)は微分可能であり、その導関数φ´(γ)は、以下の式32を満たす。
Figure 0007006612000037
上記式32より、あるランダムサンプルθハット~N(θ,Σ)が得られ、さらに、θハット~N(θ,(1+h)Σ)が得られた場合、以下に示す式33の値が、η(1)の評価器である。
Figure 0007006612000038
ここで、θハット~N(θ,Σ)とし、θハット~N(θ,(1+h)Σ)とする。このとき、以下の式34が成り立つ。
Figure 0007006612000039
以下、2種類の状況を想定する。第1の想定(ノイズ付加法)として、あるランダムサンプルθハット~N(θ,Σ)が得られるとする。もしΣが既知である場合、N(0,Σ)からδをサンプリングし、
Figure 0007006612000040
を構築することによって、評価部20は、N(0,(1+h)Σ)に従うθハットを得ることができる。
以下、第1の想定に基づいてρを算出する動作を説明する。図4は、本実施形態において、第1の想定をした場合における評価システムの動作例を示すフローチャートである。
まず、入力部10は、0より大きいθハット、Σハット(Σに上付き^)およびh、並びにM∈{1,2,…}を入力する(ステップS31)。評価部20は、N(0,Σハット)から独立にδ,…,δを生成する(ステップS32)。そして、評価部20は、以下の式35に示すfを計算する(ステップS33)。すなわち、評価部20は、fの計算をM回繰り返す。
Figure 0007006612000041
出力部30は、以下の式36で示すρを出力する(ステップS34)。
Figure 0007006612000042
以上に示すように、評価部20が、予測モデルにノイズを付加したモデルを生成し、そのモデルを基に計算される評価値の平均を真のモデルと予測モデルとの評価値のバイアスとして算出する。このような構成によっても、予測に基づく最適解を、理論的にバイアスを生じさせることなく評価できる。
次に、第2の想定を説明する。第2の想定(リサンプリングに基づく方法)として、θハットが、N個のサンプルから計算される最尤推定(MLE:maximum likelihood estimation )であるとする。θハットが、[N/(1+h)Σ]個のサンプルから計算されるMLEであるとする。このとき、θハットおよびθハットは、それぞれ漸近的に、N(θ,I(θ-1/N)およびN(θ,(1+h)I(θ-1/N)に向かっていく。
以下、第2の想定に基づいてρを算出する動作を説明する。図5は、本実施形態において、第2の想定をした場合における評価システムの動作例を示すフローチャートである。
まず、入力部10は、N個のサンプルX={x,…,x}、h(>0)およびM∈{1,2,…}を入力する(ステップS41)。ここで、j=1,…,Mについて、Xを、Xからの[N/(1+h)]個のランダムサンプルであるとする。
評価部20は、Xから漸近正規性をもつ推定値θハットを計算する(ステップS42)。評価部20は、Xから[N/(1+h)]個のランダム抽出を行い、Xとする。これを、j=1,2,…,Mに対して行う(ステップS43)。また、評価部20は、Xからθハットを計算する(ステップS44)。そして、評価部20は、以下の式37に示すfを計算する(ステップS45)。すなわち、評価部20は、fの計算をM回繰り返す。
Figure 0007006612000043
出力部30は、以下の式38で示すρを出力する(ステップS46)。
Figure 0007006612000044
以上に示すように、評価部20が、θハットを基に計算される評価値の最大値とθハットを基に計算される評価値の最大値(具体的には最大値の総和の平均)との線形和に基づいて、真のモデルに基づく評価を行う。このような構成によっても、予測に基づく最適解を、理論的にバイアスを生じさせることなく評価できる。
次に、本発明の概要を説明する。図6は、本発明による評価システムの概要を示すブロック図である。本発明による評価システム80(例えば、評価システム100)は、真のモデル(例えば、θ)から生成されたデータを用いて推定される予測モデル(例えば、θハット)が存在するときに、その予測モデルを基に計算される最適解を、予測モデルに基づく評価と真のモデルに基づく評価との間に生ずるバイアス(例えば、上記式8に示すバイアス)を考慮して評価する評価部81(例えば、評価部20)を備えている。
そのような構成により、予測に基づく最適解を、理論的にバイアスを生じさせることなく評価できる。
すなわち、本発明では、真のモデルから生成されるデータを基に予測モデルを生成し、その予測モデルをもとに最適解を計算して、その結果を予測モデルで評価したときにバイアスが生じることという事象を、上記式6に示すような抽象的なモデルにしたうえで、評価部81が最適解を評価する。したがって、予測モデルで評価される最適解と真のモデルで評価される最適解との間のバイアスを理論的に生じさせなくすることが可能になる。
また、評価部81は、ブートストラップ法に基づいて予測モデルの生成に用いたデータを選択し、選択されたデータを用いて第一のモデル(例えば、θハット)を推定し、第一のモデルを基に計算される最適解をその第一のモデルで評価した第一の評価(例えば、f(z,θハット))と、最適解を予測モデルで評価した第二の評価(例えば、f(z,θハット))との差分である評価差分を、真のモデルと予測モデルとの評価値のバイアスとして算出してもよい。
また、評価部81は、第一のモデルを複数推定し、推定された第一のモデルを基に計算される各最適解をその第一のモデルで評価した各第一の評価と、各最適解を予測モデルで評価した第二の評価との差分である評価差分の総和の平均を、真のモデルと予測を行うモデルとの評価値のバイアスとして算出してもよい。
また、評価部81は、第一のモデルを推定するごとに算出される評価差分を並び替えてその評価差分の順序を決定し、指定された範囲に応じた順序に含まれる評価差分の最小値および最大値を評価区間として出力してもよい。
また、評価部81は、予測モデルにノイズを付加した第二のモデル(例えば、第2の実施形態の第1の想定におけるθハット)を生成し、第二のモデルを基に計算される評価値の最大値と、予測モデルを基に計算される評価値の最大値との線形和に基づいて、真のモデルに基づく評価を行ってもよい。
また、評価部81は、予測モデルの生成に用いたデータの少なくとも一部を用いて第三のモデル(例えば、第2の実施形態の第2の想定におけるθハット)を推定し、予測モデルを基に計算される評価値の最大値と、第三のモデルを基に計算される評価値の最大値との線形和に基づいて、真のモデルに基づく評価を行ってもよい。
このとき、評価部81は、第三のモデルを複数推定し、予測モデルを基に計算される評価値の最大値と、第三のモデルを基に計算される各評価値の最大値の総和の平均との線形和に基づいて、真のモデルに基づく評価を行ってもよい。
図7は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ1000は、CPU1001、主記憶装置1002、補助記憶装置1003、インタフェース1004を備えている。
上述のモデル推定装置は、それぞれコンピュータ1000に実装される。そして、上述した各処理部の動作は、プログラム(評価用プログラム)の形式で補助記憶装置1003に記憶されている。CPU1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、当該プログラムに従って上記処理を実行する。
なお、少なくとも1つの実施形態において、補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000が当該プログラムを主記憶装置1002に展開し、上記処理を実行してもよい。
また、当該プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、当該プログラムは、前述した機能を補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、実施形態及び実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2016年10月28日に出願された日本特許出願2016-211438を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10 入力部
20 評価部
30 出力部

Claims (10)

  1. 真のモデルから生成されたデータを用いて推定される予測モデルが存在するときに、当該予測モデルを基に計算される最適解を、前記予測モデルに基づく評価と前記真のモデルに基づく評価との間に生ずるバイアスを考慮して評価する評価部を備えた
    ことを特徴とする評価システム。
  2. 評価部は、ブートストラップ法に基づいて予測モデルの生成に用いたデータを選択し、選択されたデータを用いて第一のモデルを推定し、前記第一のモデルを基に計算される最適解を当該第一のモデルで評価した第一の評価と、前記最適解を予測モデルで評価した第二の評価との差分である評価差分を、真のモデルと予測モデルとの評価値のバイアスとして算出する
    請求項1記載の評価システム。
  3. 評価部は、第一のモデルを複数推定し、推定された第一のモデルを基に計算される各最適解を当該第一のモデルで評価した各第一の評価と、前記各最適解を予測モデルで評価した第二の評価との差分である評価差分の総和の平均を、真のモデルと予測を行うモデルとの評価値のバイアスとして算出する
    請求項2記載の評価システム。
  4. 評価部は、第一のモデルを推定するごとに算出される評価差分を並び替えて当該評価差分の順序を決定し、指定された範囲に応じた順序に含まれる評価差分の最小値および最大値を評価区間として出力する
    請求項3記載の評価システム。
  5. 評価部は、予測モデルにノイズを付加した第二のモデルを生成し、前記第二のモデルを基に計算される評価値の最大値と、予測モデルを基に計算される評価値の最大値との線形和に基づいて、真のモデルに基づく評価を行う
    請求項1記載の評価システム。
  6. 評価部は、予測モデルの生成に用いたデータの少なくとも一部を用いて第三のモデルを推定し、予測モデルを基に計算される評価値の最大値と、前記第三のモデルを基に計算される評価値の最大値との線形和に基づいて、真のモデルに基づく評価を行う
    請求項1記載の評価システム。
  7. 評価部は、第三のモデルを複数推定し、予測モデルを基に計算される評価値の最大値と、前記第三のモデルを基に計算される各評価値の最大値の総和の平均との線形和に基づいて、真のモデルに基づく評価を行う
    請求項6記載の評価システム。
  8. 真のモデルから生成されたデータを用いて推定される予測モデルが存在するときに、当該予測モデルを基に計算される最適解を、前記予測モデルに基づく評価と前記真のモデルに基づく評価との間に生ずるバイアスを考慮して評価する
    ことを特徴とする評価方法。
  9. ブートストラップ法に基づいて予測モデルの生成に用いたデータを選択し、
    選択されたデータを用いて第一のモデルを推定し、
    前記第一のモデルを基に計算される最適解を当該第一のモデルで評価した第一の評価と、前記最適解を予測モデルで評価した第二の評価との差分である評価差分を、真のモデルと予測モデルとの評価値のバイアスとして算出する
    請求項8記載の評価方法。
  10. コンピュータに、
    真のモデルから生成されたデータを用いて推定される予測モデルが存在するときに、当該予測モデルを基に計算される最適解を、前記予測モデルに基づく評価と前記真のモデルに基づく評価との間に生ずるバイアスを考慮して評価する評価処理を実行させる
    ための評価用プログラム。
JP2018547595A 2016-10-28 2017-10-18 評価システム、評価方法および評価用プログラム Active JP7006612B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016211438 2016-10-28
JP2016211438 2016-10-28
PCT/JP2017/037666 WO2018079366A1 (ja) 2016-10-28 2017-10-18 評価システム、評価方法および評価用プログラム

Publications (2)

Publication Number Publication Date
JPWO2018079366A1 JPWO2018079366A1 (ja) 2019-09-12
JP7006612B2 true JP7006612B2 (ja) 2022-01-24

Family

ID=62024755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018547595A Active JP7006612B2 (ja) 2016-10-28 2017-10-18 評価システム、評価方法および評価用プログラム

Country Status (3)

Country Link
US (1) US20190311222A1 (ja)
JP (1) JP7006612B2 (ja)
WO (1) WO2018079366A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115375171A (zh) * 2022-09-06 2022-11-22 杭州凯智莆电子有限公司 一种基于数据采集的电阻产品生产用质量检测系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MACKINNON, James G. et al.,Approximate bias correction in econometrics,Journal of Econometrics,Volume 85/Issue 2,1998年08月,pp.205-230,http://aida.wss.yale.edu/smith/sdarticle8.pdf
竹澤邦夫 ほか,リモートセンシングデータによる回帰におけるブートストラップ法の利用,システム農学,第24巻第3号,2008年07月,pp.167-173,https://www.jstage.jst.go.jp/article/jass/24/3/24_167/_pdf

Also Published As

Publication number Publication date
JPWO2018079366A1 (ja) 2019-09-12
US20190311222A1 (en) 2019-10-10
WO2018079366A1 (ja) 2018-05-03

Similar Documents

Publication Publication Date Title
JP6513015B2 (ja) 機械の動作を制御する方法、および機械の動作を反復的に制御する制御システム
US9286573B2 (en) Cost-aware non-stationary online learning
CN110824587B (zh) 图像预测方法、装置、计算机设备和存储介质
JP2014206870A (ja) プラントモデル管理装置及び方法
US10635078B2 (en) Simulation system, simulation method, and simulation program
JP7006612B2 (ja) 評価システム、評価方法および評価用プログラム
JP6828830B2 (ja) 評価システム、評価方法および評価用プログラム
JP5868104B2 (ja) 周期性を有するマルコフ決定過程を用いて最適施策を決定する方法、装置及びコンピュータプログラム
JP7044153B2 (ja) 評価システム、評価方法および評価用プログラム
Nakao et al. A dp-based heuristic algorithm for the discrete split delivery vehicle routing problem
US11651282B2 (en) Learning method for learning action of agent using model-based reinforcement learning
JP7196933B2 (ja) 学習装置および学習方法
JP6660248B2 (ja) 目的変数予測装置、方法及びプログラム
JP6720637B2 (ja) 相関因子抽出方法、相関因子抽出装置および相関因子抽出プログラム
US20210142414A1 (en) Measure determination system, measure determination method, and measure determination program
JP2020024621A (ja) 情報処理装置、方法及びプログラム
CN110852444A (zh) 用于确定机器学习模型的衍生变量的方法及装置
Singh The Nonstochastic Control Problem
US11481606B2 (en) Method of updating parameters and information processing apparatus
JP7063319B2 (ja) 最適化装置、最適化方法および最適化プログラム
JP2005242580A (ja) パラメータ推定方法、データ予測方法、パラメータ推定装置、データ予測装置、及びコンピュータプログラム
JP2004295638A (ja) パラメータ推定方法、データ予測方法、パラメータ推定装置、データ予測装置、コンピュータプログラム、及び記録媒体
JP6849084B2 (ja) 情報分析装置、情報分析方法および情報分析プログラム
WO2018066442A1 (ja) モデル学習システム、モデル学習方法およびモデル学習プログラム
JP2004302690A (ja) パラメータ推定方法、データ予測方法、パラメータ推定装置、データ予測装置、コンピュータプログラム、及び記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190418

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211005

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211220