WO2020071430A1

WO2020071430A1 - 情報処理装置、情報処理システム、情報処理方法及びプログラムが格納された非一時的なコンピュータ可読媒体

Info

Publication number: WO2020071430A1
Application number: PCT/JP2019/038940
Authority: WO
Inventors: 慶一木佐森; 山崎　啓介
Original assignee: 日本電気株式会社; 国立研究開発法人産業技術総合研究所
Priority date: 2018-10-03
Filing date: 2019-10-02
Publication date: 2020-04-09
Also published as: US20210389502A1; JP7198439B2; JPWO2020071430A1

Abstract

効率的にパラメータを算出する。情報処理装置（１）は、観測対象に入力を与えた場合に観測される複数の観測情報と、前記観測対象をパラメータのサンプルに基づきシミュレーションするシミュレータが複数の前記サンプル及び前記入力を表す第１種類のデータに対して作成した第２種類のデータとの差異と、前記複数の観測情報における各観測情報の寄与度とに応じて、各前記サンプルの重要度を決定し、前記パラメータの分布に対応するデータを算出する対応データ算出部（２）と、前記パラメータの分布に対応するデータを用いて、所定の処理に従い、前記パラメータの新たなサンプルを生成する新規パラメータサンプル生成部（３）とを備える。

Description

情報処理装置、情報処理システム、情報処理方法及びプログラムが格納された非一時的なコンピュータ可読媒体

　本発明は情報処理装置、情報処理方法、及びプログラムに関する。

　予測モデルを用いた数値予測、および、この予測モデルの学習に関連して幾つかの技術が提案されている。
　例えば、特許文献１には、気象予測モデルを用いて定期的に気象予測を行う気象予測システムが記載されている。この気象予測システムは、気象予測モデルに観測データを同化して気象予測を行い、気象予測の演算に用いる演算パラメータを予測時刻に応じて変更する。

　また、特許文献２に記載の予測装置は、複数の予測モデルを作成し、予測モデルそれぞれに対して残差を予測する残差予測モデルを作成する。そして、この予測装置は、予測モデル毎の予測値に対して、残差予測モデルによる残差予測値を合成して、予測装置としての予測値を算出する。

特開２００８－００８７７２号公報特開２００５－１３５２８７号公報

　しかし、特許文献１に開示されたシステム、及び、特許文献２に開示された装置を用いたとしても、高精度な予測を効率的に実行することはできない。この理由は、予測モデルにおけるパラメータを効率的に決めることができないからである。

　そこで、本明細書に開示される実施形態が達成しようとする目的の１つは、効率的にパラメータを算出することができる情報処理装置等を提供することにある。

　第１の態様にかかる情報処理装置は、
　観測対象に入力を与えた場合に観測される複数の観測情報と、前記観測対象をパラメータのサンプルに基づきシミュレーションするシミュレータが複数の前記サンプル及び前記入力を表す第１種類のデータに対して作成した第２種類のデータとの差異と、前記複数の観測情報における各観測情報の寄与度とに応じて、各前記サンプルの重要度を決定し、前記パラメータの分布に対応するデータを算出する対応データ算出手段と、
　前記パラメータの分布に対応するデータを用いて、所定の処理に従い、前記パラメータの新たなサンプルを生成する新規パラメータサンプル生成手段と
　を備える。

　第２の態様にかかる情報処理方法は、
　情報処理装置によって、
　観測対象に入力を与えた場合に観測される複数の観測情報と、前記観測対象をパラメータのサンプルに基づきシミュレーションするシミュレータが複数の前記サンプル及び前記入力を表す第１種類のデータに対して作成した第２種類のデータとの差異と、前記複数の観測情報における各観測情報の寄与度とに応じて、各前記サンプルの重要度を決定し、前記パラメータの分布に対応するデータを算出し、
　前記パラメータの分布に対応するデータを用いて、所定の処理に従い、前記パラメータの新たなサンプルを生成する。

　第３の態様にかかるプログラムは、
　観測対象に入力を与えた場合に観測される複数の観測情報と、前記観測対象をパラメータのサンプルに基づきシミュレーションするシミュレータが複数の前記サンプル及び前記入力を表す第１種類のデータに対して作成した第２種類のデータとの差異と、前記複数の観測情報における各観測情報の寄与度とに応じて、各前記サンプルの重要度を決定し、前記パラメータの分布に対応するデータを算出する対応データ算出ステップと、
　前記パラメータの分布に対応するデータを用いて、所定の処理に従い、前記パラメータの新たなサンプルを生成する新規パラメータサンプル生成ステップと
　をコンピュータに実行させる。

　上述の態様によれば、効率的にパラメータを算出することができる情報処理装置等を提供することができる。

実施形態に係る情報処理システムの構成の一例を示すブロック図である。実施形態に係る情報量規準算出装置のハードウェア構成の一例を示すブロック図である。実施の形態１にかかる情報量規準算出装置の機能構成の一例を示すブロック図である。実施の形態１にかかる情報量規準算出装置の動作の一例を示すフローチャートである。実施の形態２にかかる情報量規準算出装置の機能構成の一例を示すブロック図である。実施の形態２にかかる情報量規準算出装置の動作の一例を示すフローチャートである。その他の実施の形態にかかる情報処理装置の機能構成の一例を示すブロック図である。

　以下の各実施形態においては、理解しやすさのため数学的な用語を用いて説明するが、各用語は必ずしも数学的に定義されている値でなくてもよい。たとえば、距離は、ユークリッドノルムや、１ノルム等、数学的に定義することができる。しかし、距離は、そのような値に１を足したような値であってもよい。すなわち、以下の実施形態にて用いられる用語は、数学的に定義されている用語でなくてもよい。

＜実施の形態１＞
　以下、図面を参照して本発明の実施の形態について説明する。
　図１は、実施形態に係る情報処理システム１０の構成の一例を示すブロック図である。図１に示すように、情報処理システム１０は、情報量規準算出装置１００とシミュレータサーバ（シミュレータ）２００とを備える。なお、情報量規準算出装置１００は情報処理装置と称されることがある。

　シミュレータサーバ２００は、第１種類のデータの入力を受けて第２種類のデータを出力するシミュレータである。すなわち、シミュレータサーバ２００は、パラメータθにより規定されるモデルに従って、第１種類のデータから、第２種類のデータを予測するシミュレーション処理を行なう。たとえば、シミュレータサーバ２００は、パラメータθのサンプルに基づき、観測対象における処理（動作）をシミュレーションする処理を実行する。サンプルは、パラメータθの値を表す。したがって、複数のサンプルは、当該パラメータθの値として設定される複数の例（データ）を表している。

　以下では、第１種類のデータをデータＸと称し、第２種類のデータをデータＹと称する。また、観測データの個数をｎ（ｎは正の整数）として、データＸの観測データ（第１種類の観測データ）を観測データＸ^ｎと表記し、データＹの観測データ（第２種類の観測データ）を観測データＹ^ｎと表記する。また、観測データＸ^ｎの要素をＸ_１、・・・、Ｘ_ｎと表記し、観測データＹ^ｎの要素をＹ_１、・・・、Ｙ_ｎと表記する。情報量規準算出装置１００は、データＸ_ｉ（ｉは、１≦ｉ≦ｎの整数）とデータＹ_ｉとが一対一に対応付けられた観測データ（従って、Ｘ－Ｙ平面にプロット可能な観測データ）を取得する。

　以降においては、観測データを観測情報と表すこともある。また、観測データＹ^ｎを複数の観測情報と表すこともある。この場合に、また、各要素Ｙ_１、・・・、Ｙ_ｎを、それぞれ、観測情報と表すこともある。

　観測データＸ^ｎおよびＹ^ｎは特定の種類のデータに限定されず、実測されたいろいろなデータとすることができる。観測データを得るための実測方法は特定の方法に限定されず、ユーザなど人による計数または測定、あるいはセンサを用いたセンシングなど、いろいろな方法を採用可能である。
　例えば、観測データＸ^ｎの要素は、観測対象を構成している構成要素の状態を表すものであってもよい。観測データＹ^ｎの要素は、センサ等を用いて観測対象に関して観測された状態を表すものであってもよい。例えばユーザが、製造工場の生産性を分析したい場合、観測データＸ^ｎは、当該製造工場における各設備の稼働状況を表すものであってもよい。観測データＹ^ｎは、複数の設備によって構成されるラインにて製造される製品の個数を表すものであってもよい。また、観測データＸ^ｎは、製造工場において製品の原材料となる素材を表していてもよい。この場合に、観測データＸ^ｎによって表されている素材は、１つ以上の加工工程を経て製品に加工される。当該製品は、１種類の製品であるとは限らず、複数の製品（たとえば、製品Ａ、製品Ｂ、副産物Ｃ）であってもよい。観測データＹ^ｎは、たとえば、製品Ａの個数、製品Ｂの個数、及び、副産物Ｃの個数（または、生産量等）を表している。
　観測対象、および、観測データは、上述した例に限定されず、たとえば、加工工場における設備であってもよいし、ある施設を建設する場合における建設システムであってもよい。

　ここで、観測データＸ^ｎおよびＹ^ｎは、独立に同一の真の分布ｑ（ｘ，ｙ）＝ｑ（ｘ）ｑ（ｙ｜ｘ）に従って生じる。真のモデルｑ（ｙ｜ｘ）を推測するための統計モデルは、ｐ（ｙ｜ｘ，θ）と表せる。ｑ（ｙ｜ｘ）は、事象ｘが生じたときに、事象ｙが生じる確率を表している。また、「ｑ（ｘ）ｑ（ｙ｜ｘ）」は、「ｑ（ｘ）×ｑ（ｙ｜ｘ）」を表している。以降においては、説明の便宜上、数学的な慣習に倣い、掛け算を表す演算子「×」を省略して表す。

　シミュレータサーバ２００が用いる回帰モデルｒ（ｘ，θ）は、パラメータθの値の設定、および、変数ｘへのデータＸの値の入力を受けて、データＹの値を出力する。たとえば、シミュレータサーバ２００は、データＸ（ｘの値）に対して、パラメータθのサンプルを含む演算を施すことにより、データＹの値を出力する。なお、モデルには、必ずしも微分可能な関数が用いられなくてもよい。シミュレータサーバ２００は、観測対象における処理又は動作をシミュレーションする。

　たとえば、観測対象が製造工場である場合に、シミュレータサーバ２００は、データＸの値に対して、パラメータθが表す値に従った演算を施すことによってデータＹを算出することによって、製造工場における各プロセスをシミュレーションする。この場合に、パラメータθは、たとえば、各プロセスにおける入出力間の関係性を表している。パラメータθは、プロセスにおける状態を表しているともいうことができる。パラメータθは、１つであるとは限らず、複数であってもよい。すなわち、回帰モデルｒ（ｘ，θ）は、シミュレータサーバ２００が実行している全体の処理を、符号ｒを用いて総称的に表しているということもできる。

　ところで、モデルの良さを評価する規準として、ＷＢＩＣ（Widely Applicable Bayesian Information Criterion）が知られている。例えば、複数のモデルの中から適切なモデルを選択する際に、各モデルのＷＢＩＣを算出することにより、どのモデルが適切であるかを調べることができる。ＷＢＩＣは、ベイズ自由エネルギー（Bayes free energy）を用いた情報量規準の一種である。統計モデルが特異モデル（singular model）である場合、ＷＢＩＣは、ベイズ自由エネルギー事象を漸近的に近似し、統計モデルが正則モデル(regular model)である場合、ＢＩＣ（Bayesian Information Criterion）に一致する。ベイズ自由エネルギーは、以下の式（１）で定義される。なお、π（θ）は、パラメータθについての事前分布である。

＜式（１）＞

　ここで、ベイズの統計的推論における表記について定義する。マイナス対数尤度関数(minus log likelihood function)Ｌ_ｎ（θ）は以下の式（２）のように定義される。

＜式（２）＞

　回帰問題がガウスノイズを伴う回帰関数でモデル化される場合、統計モデル（尤度関数）ｐ（ｙ｜ｘ，θ）は、以下の式（３）のように表される。統計モデルｐ（ｙ｜ｘ，θ）は、回帰モデルｒ（ｘ，θ）についての統計的な性質を示すモデルである。ただし、この回帰モデルｒ（ｘ，θ）は、必ずしも、数学的な式を用いて明示的に表されているとは限らず、たとえば、ｘと、θとを入力として、ｒ（ｘ，θ）を出力とするシミュレーション等の処理を表していてもよい。一般的に、回帰モデルでは、与えられたデータに合うように数式の係数が決められる。しかし、本実施形態における回帰モデルｒ（ｘ，θ）は、そのような数式が与えられていない場合であってもよい。すなわち、本実施形態における回帰モデルｒ（ｘ，θ）は、入力ｘ及びθと、出力ｒ（ｘ，θ）とが関連付けされた情報を表していればよい。

＜式（３）＞

　ここで、σ（ただし、σ＞０）は、ガウスノイズの標準偏差である。すなわち、σはガウスノイズを伴う回帰関数で定義されるモデルにおける当該ガウスノイズの標準偏差である。また、ｒ（ｘ，θ）は、シミュレータサーバ２００が、回帰モデルによって表す処理に従い算出する値である。ｄはＸの次元数（すなわち、上述した観測データの個数）である。ｅｘｐは、ネイピア数を底とする指数関数を表す。｜｜は、ノルムを算出することを表す。πは、円周率を表す。

　ＷＢＩＣは、以下の式（４）のように定義される。ここで、

は、θの事後分布の期待値である。β（ただし、β＞０）は、逆温度と呼ばれるパラメータである。

＜式（４）＞

　任意の積分可能な関数Ｇ（θ）に対し、θの事後分布の期待値は、以下の式（５）のように表すことができる。

＜式（５）＞

　したがって、式（５）において、Ｇ（θ）に、ｎＬ_ｎ（θ）を代入した上で、式（５）の右辺を計算すれば、ＷＢＩＣを算出可能である。しかしながら、尤度関数ｐ（ｙ｜ｘ，θ）が解析的に数式として表現できない場合、すなわち尤度関数ｐ（ｙ｜ｘ，θ）が微分できない場合、式（５）の右辺は算出できない。

　ところで、以下の式（６）に示されるＷＢＩＣの漸近的な特性が知られている。

＜式（６）＞

　式（６）、統計モデルが特異モデルであるか正則モデルであるかにかかわらず、成り立つ。なお、

は、ランダウの記号である。したがって、ｎが十分大きければ、ラウダウの記号で示される項は、無視することができる。つまり、ベイズ自由エネルギーは、ＷＢＩＣで近似される。

　式（６）が成り立つことを説明する。まず、以下の式（７）で表される関数Ｆ_ｎ（β）を定義する。
＜式（７）＞

　Ｆ_ｎ（β）を上記のように定義すると、ベイズ自由エネルギーは以下の式（８）のように表すことができる。

＜式（８）＞

　したがって、式（７）は、逆温度を含むようにベイズ自由エネルギーの定義式を拡張した数式である。
　また、Ｆ_ｎ（β）をβについて微分することにより得られる関数Ｆ’_ｎ（β）は、以下の式（９）のように表すことができる。

＜式（９）＞

　したがって、式（４）及び式（９）から、Ｆ’_ｎ（β）＝ＷＢＩＣが成り立つことがわかる。また、ＷＢＩＣの定義式を漸近展開した式として、以下の式（１０）が知られている。

＜式（１０）＞

　なお、式（１０）において、β＝β_０／ｌｏｇｎである。ただし、β_０は、正定数である。また、λは、実対数閾値（ＲＬＣＴ：real log canonical threshold）である。そして、θ_０は、統計モデルの真のパラメータ、すなわち、ｑ（ｙ｜ｘ）＝ｐ（ｙ｜ｘ，θ_０）を満たすパラメータである。

　一方、ベイズ自由エネルギーの定義式を漸近展開した式として、以下の式（１１）が知られている。

＜式（１１）＞

　よって、これらの式から、式（６）が成り立つことが示される。
　また、式（７）の定義と式（６）とから、以下の式（１２）が成り立つ。なお、式（１２）において、β＝１／ｌｏｇｎである。

＜式（１２）＞

　次に、ＷＢＩＣの算出について説明する。
　上述の通り、尤度関数ｐ（ｙ｜ｘ，θ）が解析的に数式として表現できない場合、すなわち尤度関数ｐ（ｙ｜ｘ，θ）が微分できない場合、式（５）の右辺は算出できない。そのような場合には、第２種類のデータを予測するモデルのパラメータθの事後分布に従うサンプルデータを用いて、以下の式（１３）を計算することによりＷＢＩＣを算出できることが知られている。なお、式（１３）において、事後分布に従うサンプルデータは、

と表されている。また、ｊは、1≦ｊ≦ｍを満たす整数であり、ｍは、事後分布に従うサンプルデータの数である。

＜式（１３）＞

　一般的に事後分布は不明である。このため、事後分布に従うサンプルを取得する所定の技術を利用することが求められる。事後分布に従うサンプルを取得する代表的な方法として、メトロポリス・ヘイスティングスアルゴリズムなどのＭＣＭＣ（Markov Chain Monte Carlo method：マルコフ連鎖モンテカルロ法）を用いた方法が知られている。この方法では、ＭＣＭＣによりパラメータθの事後分布ｐ（θ｜Ｘ^ｎ，Ｙ^ｎ）∝ｅｘｐ（－βｎＬ_ｎ（θ）＋ｌｏｇπ（θ））に従う、パラメータθのｍ個のサンプルデータを取得する。「∝」は、比例関係を表している。

　しかしながら、ＭＣＭＣを用いたサンプルの取得の場合、ｍ個のθのサンプルデータを得るために、その数倍のシミュレーション（すなわち、モデルによる第２種類のデータの予測）を行なわなければならない。このため、多くの計算コストを要することとなる。

　これに対し、本実施の形態では、カーネルＡＢＣ（Kernel Approximate Bayesian Computation）及び所定の処理（カーネルハーディング（Kernel Herding）等）を用いてパラメータθのサンプルデータを取得する。

　カーネルＡＢＣは、カーネル平均を算出することにより、事後分布を推定するアルゴリズムである。カーネルＡＢＣでは、ｍ個のサンプルデータに基づきシミュレーションを行い、ｍ個のパラメータのサンプルデータの重み（重要度）を、観測対象に対して観測された観測データに基づき決定することで事後分布が得られる。たとえば、シミュレーション結果が観測データに類似しているほど、当該シミュレーション結果に用いられたパラメータを重視する重みを算出する。逆に、シミュレーション結果が観測データに類似していないほど、当該シミュレーション結果に用いられたパラメータを軽視する重みを算出する。

　カーネルハーディング（所定の処理の一例）は、事後分布を示すカーネル平均から事後分布に従ったサンプルを取得するアルゴリズムである。カーネルハーディングは、求めたカーネル平均に最も近くなる場合のサンプルを逐次的に決めていく。本実施形態においては、カーネルＡＢＣ、及び、カーネルハーディングにおける処理によって、ｍ個のサンプルに対して、新たにｍ個のサンプルが算出されるため、サンプルの値を調整しているともいうことができる。

　カーネルハーディングは、サンプルを逐次的に決めていく方法であるが、事後分布（本実施形態では、推定された事後分布）に従ったサンプルを取得する所定の処理は、カーネルハーディングに限定されない。すなわち、所定の処理は、事後分布（本実施形態では、推定された事後分布）に従ったサンプルを作成する方法であればよい。

　カーネルＡＢＣ及び上記所定の処理（例えばカーネルハーディング）を用いてパラメータθのサンプルデータを取得する場合、ｍ個のθのサンプルデータを得るために、ｍ回のシミュレーション（すなわち、モデルによる第２種類のデータの予測）を行なえばよい。このため、計算コストを抑制することができる。特に、本実施の形態では、逆温度βが含まれる事後分布に従ったパラメータθのサンプルデータをカーネルＡＢＣ及びカーネルハーディングを用いて取得し、そのサンプルデータに基づいてＷＢＩＣを算出する情報量規準算出装置１００について示す。

　逆温度βは、事後分布を推定する処理において、各サンプルに基づき算出される分布が当該推定される分布に与える影響を平準化するレベルを表している値を表しているということもできる。この場合に、逆温度βが高い値であるほど、平準化するレベルは低い。言い換えると、逆温度βが高い値であるほど、推定される分布は、個々の分布の影響を受けやすくなる。これに対して、逆温度βが低い値であるほど、平準化するレベルは高い。言い換えると、逆温度βが低い値であるほど、推定される分布は、一部の分布の影響を受けにくくなる。

　以下、情報量規準算出装置１００について具体的に説明する。
　図２は、情報量規準算出装置１００のハードウェア構成の一例を示すブロック図である。情報量規準算出装置１００は、入出力インタフェース１０１、メモリ１０２、及びプロセッサ１０３を含む。

　入出力インタフェース１０１は、データの入出力を行うインタフェースである。例えば、入出力インタフェース１０１は、他の装置と通信するために使用される。この場合、例えば、入出力インタフェース１０１は、シミュレータサーバ２００と通信するために使用される。入出力インタフェース１０１は、観測データＸ^ｎ又は観測データＹ^ｎを出力するセンサ装置などの外部装置と通信するために使用されてもよい。また、入出力インタフェース１０１は、さらに、キーボード及びマウスなどの入力デバイスと接続するインタフェースを含んでもよい。この場合、入出力インタフェース１０１は、ユーザの操作により入力されたデータを取得する。また、入出力インタフェース１０１は、さらに、ディスプレイと接続するインタフェースを含んでもよい。この場合、例えば、入出力インタフェース１０１を介して、ディスプレイに、情報量規準算出装置１００の演算結果などが表示される。

　メモリ１０２は、例えば、揮発性メモリ及び不揮発性メモリの組み合わせによって構成される。メモリ１０２は、情報量規準算出装置１００の処理に用いられる各種データの他、プロセッサ１０３により実行される、１以上の命令を含むソフトウェア（コンピュータプログラム）などを格納するために使用される。

　プロセッサ１０３は、メモリ１０２からソフトウェア（コンピュータプログラム）を読み出して実行することで、後述する図３に示される各構成の処理を行う。プロセッサ１０３は、例えば、マイクロプロセッサ、ＭＰＵ(Micro Processor Unit)、又はＣＰＵ(Central Processing Unit)などであってもよい。プロセッサ１０３は、複数のプロセッサを含んでもよい。
　また、上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（ｔａｎｇｉｂｌｅ　ｓｔｏｒａｇｅ　ｍｅｄｉｕｍ）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Ｐｒｏｇｒａｍｍａｂｌｅ　ＲＯＭ）、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　ＰＲＯＭ）、フラッシュＲＯＭ、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　図３は、情報量規準算出装置１００の機能構成の一例を示すブロック図である。情報量規準算出装置１００は、第１のパラメータサンプル生成部１１０と、第２種類サンプルデータ取得部１１２と、カーネル平均算出部１１４と、第２のパラメータサンプル生成部１１６と、情報量規準算出部１１８とを有する。なお、第１のパラメータサンプル生成部１１０は、事前パラメータサンプル生成部とも称され、カーネル平均算出部１１４は対応データ算出部とも称され、第２のパラメータサンプル生成部１１６は、新規パラメータサンプル生成部とも称される。

　第１のパラメータサンプル生成部１１０は、第１種類のデータ（データＸ）の入力を受けて第２種類のデータ（データＹ）を出力する回帰モデルｒ（ｘ，θ）のパラメータθの事前分布π（θ）に基づいて、パラメータθのサンプルデータを生成する。事前分布π（θ）は、たとえば、一様分布である。一様分布である場合には、θの値が定義されている定義域からランダムにサンプルデータが選ばれる。ある程度事後分布に近いと推定される分布が得られている場合には、当該分布を事前分布π（θ）に設定してもよい。この場合には、当該定義域から、事前分布π（θ）に従いサンプルデータが選ばれる。事前分布π（θ）は、上述した例に限定されず、また、陽に与えられているとも限らない。事前分布π（θ）が陽に与えられていない場合には、事前分布π（θ）を、たとえば、一様分布に設定する。また、後述するように、事前分布π（θ）をユーザが設定してもよい。

　すなわち、第１のパラメータサンプル生成部１１０が生成するサンプルデータの数をｍ（ｍは正の整数）とし、ｊを１≦ｊ≦ｍの整数とすると、パラメータθのサンプルデータは、以下の式（１４）のように表される。ここで、ｄ_θは、パラメータの次元数（すなわち、パラメータθの種類の個数）を示す。すなわち、式（１４）は、ｄ_θ種類のパラメータを含むセットが、ｍ個であること表す。Ｒは、実数を示す。
　式（１４）に示されるように、パラメータθのサンプルデータは、ｄ_θ次元の実数として示され、事前分布π（θ）に従う。なお、事前分布π（θ）は、予めメモリ１０２に記憶されている。事前分布π（θ）は、例えば、ユーザが、シミュレーション対象に関して有する知識に応じた精度で予め設定されている。

＜式（１４）＞

　第２種類サンプルデータ取得部１１２は、第１のパラメータサンプル生成部１１０が生成したパラメータθを受け取り、受け取ったｍ個のパラメータθを第１種類のデータの観測データ（観測データＸ^ｎ）と供にシミュレータサーバ２００に入力する。シミュレータサーバ２００には、当該ｍ個のパラメータθと、第１種類のデータの観測データ（観測データＸ^ｎ）とが入力される。

　シミュレータサーバ２００は、入力された当該ｍ個のパラメータθのそれぞれに関して、第１種類のデータの観測データ（観測データＸ^ｎ）に基づき、シミュレーション計算を実行する。すなわち、シミュレータサーバ２００は、入力した当該ｍ個のパラメータθに応じて、観測対象に関するｍ種類のシミュレーション計算を実行する。シミュレータサーバ２００は、ｍ種類のシミュレーション計算を実行することによって、ｍ種類のシミュレーション結果（

）を算出する。

　第２種類サンプルデータ取得部１１２は、シミュレータサーバ２００からｍ種類のシミュレーション結果を、第２種類のサンプルデータとして取得する。上述した処理を数学的に表せば、以下のように表すことができる。

　第２種類サンプルデータ取得部１１２は、パラメータのサンプルデータ毎に、ｎ個（観測データＸ^ｎの要素数と同数）の要素を有する、式（１５）のように表されるサンプルデータを、モデル（シミュレータサーバ２００）から取得する。

＜式（１５）＞

　式（１５）に示されるように、第２種類サンプルデータ取得部１１２が取得するサンプルデータは、ｎ次元の実数として示され、回帰モデルｒ（ｘ，θ）の尤度関数ｐ（ｙ｜θ）に、パラメータのサンプルデータを入力した分布に従う。

　カーネル平均算出部１１４は、カーネルＡＢＣに従い、パラメータの事後分布を示すカーネル平均を推定する。すなわち、カーネル平均算出部１１４は、パラメータのサンプルデータと第２種類のサンプルデータとに基づいて、パラメータの事後分布を示すカーネル平均を算出する。特に、カーネル平均算出部１１４は、逆温度が含まれるカーネル関数を用いてカーネル平均を算出する。

　ここで、カーネルＡＢＣについて説明する。式（１４）で示されるサンプルデータと、式（１５）で示されるサンプルデータを用いて、カーネルＡＢＣでは、以下の式（１６）で示されるカーネル平均を算出する。カーネル平均は、事後分布をカーネル平均埋め込み（Kernel Mean Embeddings）により再生核ヒルベルト空間（Reproducing Kernel Hilbert Space；ＲＫＨＳ）上で表現したものに該当する。カーネル平均は、パラメータの分布（事後分布）に対応するデータの一例である。

＜式（１６）＞

　ここで、重みｗ_ｊは、以下の式（１７）のように示される。Ｈは、再生核ヒルベルト空間を示す。すなわち、重み（重要度）ｗ_ｊが大きな値であるほど、サンプル

に関するカーネルが平均に与える影響が強いことを表す。重みｗ_ｊが小さな値であるほど、サンプル

に関するカーネルが平均に与える影響が弱いことを表す。

＜式（１７）＞

　なお、上付きのＴは、行列またはベクトルの転置を示す。また、Ｉは、単位行列を示し、δ（ただし、δ＞０）は、正則化定数（regularization constant）である。また，ベクトルｋ_ｙ（Ｙ^ｎ）及びグラム行列（Gramm Matrix）Ｇは、実数の要素からなるデータベクトルＹ^ｎに対するカーネルｋ_ｙにより、以下の式（１８）、式（１９）のように示される。ｋ_ｙ（Ｙ^ｎ）は、観測データＹ^ｎと、当該観測データＹ^ｎに対応する式（１５）のサンプルデータの近さ（ノルム）、すなわち類似度を算出する関数である。言い換えると、式（１８）により、観測データ（観測データＸ^ｎ）に対してシミュレータサーバ２００が出力したｍ種類のシミュレーション結果のそれぞれと、当該観測データに対して観測対象が実際に出力した観測データとの類似度が算出される。カーネル平均は、算出された類似度を用いて各パラメータの重みを決定し、式（１６）に示す処理に従い算出される重み付き平均である。

＜式（１８）＞

＜式（１９）＞

　式（１８）は、観測対象に入力を与えた場合に観測される複数の観測情報と、シミュレータサーバ２００が複数のサンプル及び入力を表す第１種類のデータに対して作成した第２種類のデータとの差異を算出しているともいえる。また、式（１６）は、ｍ種類のシミュレーション結果のうち、観測対象に関して実際に観測された観測データに対して類似しているデータに対しては、大きい重みを算出する処理を表しているということもできる。同様に、ｍ種類のシミュレーション結果のうち、観測対象に関して実際に観測された観測データに対して類似していないデータに対しては、小さい重みを算出する処理を表しているということもできる。すなわち、式（１８）を用いて算出される式（１７）は、シミュレーション結果と、観測データとが類似している程度に応じた重みを算出する処理を表しているということもできる。これは、共変量シフトを用いた処理であるともいうことができる。

　共変量シフト（Covariate Shift）に対するカーネルＡＢＣでは、訓練データセット｛Ｘ^ｎ，Ｙ^ｎ｝が従う分布ｑ_０（ｘ）は、テスト又は予測用のデータセットが従う分布ｑ_１（ｘ）と異なるが、真の関数関係ｐ（ｙ｜ｘ）は同じである。すなわち、共変量シフトは、与えられたｘに対してｙを算出する処理自体は、複数のｘに対しても一定であるものの、入力である分布が、訓練時とテスト時とでは異なっていることを表している。ここで、確率密度ｑ_０（ｘ）及びｑ_１（ｘ）が既知、もしくはそれらの比ｑ_０（ｘ）／ｑ_１（ｘ）が既知であるとする。この場合に、当該比が１に近いほど、訓練時のｑ_０（ｘ）と、テスト時のｑ_１（ｘ）とは同じような確率で生じることを表す。当該比が１よりも大きな値であるほど、テスト時よりも訓練時の確率が高いことを表す。また、当該比が１よりも小さな値であるほど、訓練時よりもテスト時の確率が高いことを表す。すなわち、当該比は、データｘが訓練時の分布と、テスト時の分布とのいずれに近いかを表す指標である。当該指標は、比に限定されず、たとえば両分布の差といった、訓練時の分布と、テスト時の分布との差異を表す指標であればよい。確率密度ｑ_０（ｘ）及びｑ_１（ｘ）が既知、もしくはそれらの比ｑ_０（ｘ）／ｑ_１（ｘ）が既知である場合、上記式（１８）及び式（１９）の右辺におけるカーネル関数ｋ_ｙは、以下の式（２０）のように表すことができる。式（２０）は逆温度が訓練データ（観測データ）に依存しているか否かという点での違いを除き、後述する式（２５）に対応している。

＜式（２０）＞

　なお、式（２０）の左辺における（Ｙ^ｎ，Ｙ^ｎ’）は、カーネル関数が、ｎ次元ベクトル（要素数がｎである（すなわち、ｎ個の要素を含む）データセット）で表された第２種類のデータについての２変数関数であることを示している。すなわち、左辺におけるＹ^ｎは、２変数関数における第１の変数を示し、左辺におけるＹ^ｎ’は、２変数関数における第２の変数を示している。そして、右辺のＹ_ｉは、第１の変数として２変数関数に入力されたｎ次元ベクトルのｉ番目の要素を示している。また、右辺のＹ_ｉ’は、第２の変数として２変数関数に入力されたｎ次元ベクトルのｉ番目の要素を示している。

　式（２０）において、σは第２種類のデータについてのガウスノイズの標準偏差である。より、詳細には、式（２０）において、σは、式（２０）を算出するために用いられる第２種類のデータの観測データ全体からなる分布の標準偏差である。特に、式（２０）におけるσの意味としては、第２種類の観測データの分布と第２種類のサンプルデータの分布の類似度を測るためのスケールを示す値ということができる。また、ｎは第２種類のデータのデータ数であり、β_ｉは逆温度であり、Ｙ_ｉ及びＹ_ｉ’は第２種類のデータの値である。すなわち、式（２０）においては、第２種類のデータセットに含まれている要素（たとえば、観測データの種類）ごとにβ_ｉなる逆温度にて重み付けされている。言い換えると、当該逆温度であるβ_ｉを適切に設定することによって、第２種類のデータの種類ごとに優先度をつけることが可能である。

　式（２０）において、β_ｉは、訓練データ（観測データ）｛Ｘ_ｉ，Ｙ_ｉ｝に依存した逆温度である。すなわち、データ毎に逆温度の値が相互に異なるよう設定することができる。すなわち、観測データの種類（すなわち、Ｙ^ｎに含まれている要素）ごとに、逆温度β_ｉを設定することができる。たとえば、重要度が高い観測データの種類に関しては逆温度に、より大きな値を設定し、重要度が低い観測データに対しては逆温度に小さな値を設定する。したがって、β_ｉは、観測データの種類（すなわち、Ｙ^ｎに含まれている要素）の重要度を表す寄与度とも表すことができる。つまり、逆温度は、複数の観測情報における各観測情報の寄与度といえる。

　本実施の形態では、訓練データ（観測データ）｛Ｘ_ｉ，Ｙ_ｉ｝に依存しない一定の逆温度について、カーネル平均を算出する。具体的には、カーネル平均算出部１１４は以下の式（２１）で示されるカーネル平均を算出する。

＜式（２１）＞

　ここで、重み

は、以下の式（２２）のように示される。

＜式（２２）＞

　ベクトル

及びグラム行列

は、実数の要素からなるデータベクトルＹ^ｎに対するカーネル

により、以下の式（２３）、式（２４）のように示される。

＜式（２３）＞

＜式（２４）＞

　ここで、式（２３）及び式（２４）における右辺のカーネル関数

は、以下の式（２５）のように表すことができる。

＜式（２５）＞

　なお、式（２５）の左辺における（Ｙ^ｎ，Ｙ^ｎ’）は、カーネル関数が、ｎ次元ベクトル（要素数がｎである（すなわち、ｎ個の要素を含む）データセット）で表された第２種類のデータについての２変数関数であることを示している。すなわち、左辺におけるＹ^ｎは、２変数関数における第１の変数を示し、左辺におけるＹ^ｎ’は、２変数関数における第２の変数を示している。そして、右辺のＹ_ｉは、第１の変数として２変数関数に入力されたｎ次元ベクトルのｉ番目の要素を示している。また、右辺のＹ_ｉ’は、第２の変数として２変数関数に入力されたｎ次元ベクトルのｉ番目の要素を示している。

　式（２０）に示された処理と、式（２５）に示された処理とを比較すると、式（２０）においては、第２種類のデータセットに含まれている要素（たとえば、観測データの種類）ごとにβ_ｉなる逆温度にて重み付けされている。これに対して、式（２５）においては、第２種類のデータセットに含まれている要素（たとえば、観測データの種類）に、一定の逆温度にて重み付けされている。すなわち、式（２５）に示された処理においては、第２種類のデータセットに含まれている要素の寄与度が一定であることを表している。この例において寄与度は一定であるとしたが、数学的に定義される一定に限定されず、略一定であればよい。略一定は、たとえば、平均値aに、平均０標準偏差ｓのノイズを加えることによって算出されるような値を表している。この場合に、標準偏差sは、たとえば、aの大きさの0％乃至10%程度の値である。

　式（２５）において、σは第２種類のデータについてのガウスノイズの標準偏差である。より、詳細には、式（２５）において、σは、式（２５）を算出するために用いられる第２種類のデータの観測データ全体からなる分布の標準偏差である。特に、式（２５）におけるσの意味としては、第２種類の観測データの分布と第２種類のサンプルデータの分布の類似度を測るためのスケールを示す値ということができる。また、ｎは第２種類のデータのデータ数であり、βは逆温度であり、Ｙ_ｉ及びＹ_ｉ’は第２種類のデータの値である。ここで、βは、観測データに依存しない定数である。

　第２のパラメータサンプル生成部１１６は、カーネル平均算出部１１４が算出したカーネル平均に基づいて、逆温度を用いて定義される事後分布に従ったパラメータのサンプルデータを生成する。ここで、逆温度を用いて定義される事後分布とは、事前分布と、逆温度により制御される尤度関数とにより、ベイズの定理に基づいて定義される事後分布である。したがって、事後分布は、ｅｘｐ（－βｎＬ_ｎ（θ）＋ｌｏｇπ（θ））に従う分布である。

　具体的には、第２のパラメータサンプル生成部１１６は、カーネルハーディングを用いて、事後分布に従ったパラメータのサンプルデータを生成する。カーネルハーディングでは、以下の式（２６）及び式（２７）に示す更新式により、事後分布に従うｍ個のサンプルデータθ_１，・・・，θ_ｍを生成する。

＜式（２６）＞

＜式（２７）＞

　ここで、ｊ＝０，・・・，ｍ－１である。また、ａｒｇｍａｘ_θｈ_ｊ（θ）は、ｈ_ｊ（θ）の値を最大にするθの値を示す。ｈ_ｊは、式（２７）により逐次的に示される。ｈ_ｊの初期値ｈ_０及びμには、式（２１）に示された処理に従い算出されたカーネル平均の値が使われる。すなわち、第２のパラメータサンプル生成部１１６は、カーネル平均算出部１１４が算出したカーネル平均を用いて、カーネルハーディング等の所定の処理により、当該カーネル平均を表すのに適したｍ個のサンプルデータθ_１，・・・，θ_ｍを生成する。言い換えると、情報量規準算出装置１００は、事前分布に従ったｍ個のサンプルデータに対して、推定された事後分布に従ったｍ個のサンプルデータを算出する処理を実行する。したがって、情報量規準算出装置１００における処理は、ｍ個のサンプルデータの値を調整している処理であるともいうことができる。

　情報量規準算出部１１８は、第２のパラメータサンプル生成部１１６により生成されたパラメータのサンプルデータに基づいて、モデルについてのＷＢＩＣを算出する。具体的には、情報量規準算出部１１８は、第２のパラメータサンプル生成部１１６により生成されたパラメータのサンプルデータと式（１３）を用いて、ＷＢＩＣを算出する。

　次に、情報量規準算出装置１００の動作についてフローチャートに基づいて説明する。図４は、情報量規準算出装置１００の動作の一例を示すフローチャートである。以下、図４に沿って、動作を説明する。

　ステップＳ１００において、第１のパラメータサンプル生成部１１０が、事前分布π（θ）に基づいて、パラメータθのサンプルデータを生成する。第１のパラメータサンプル生成部１１０が生成したサンプルデータは、シミュレータサーバ２００に入力される。本実施の形態では、生成したサンプルデータは、一例として、第２種類サンプルデータ取得部１１２によりシミュレータサーバ２００に入力される。

　次に、ステップＳ１０１において、第２種類サンプルデータ取得部１１２が、ステップＳ１００で生成されたサンプルデータがパラメータとして設定されたモデルに従いシミュレータサーバ２００によって算出された第２種類のサンプルデータを取得する。すなわち、第２種類サンプルデータ取得部１１２は、予め取得されている訓練データセット｛Ｘ^ｎ，Ｙ^ｎ｝のうち、第１種類のデータであるＸ^ｎをモデルに入力し、モデルからの出力を取得する。訓練データセット｛Ｘ^ｎ，Ｙ^ｎ｝は、第１種類のデータであるＸ^ｎと第２種類のデータであるＹ^ｎとが関連付けされた情報である。この場合に、第２種類のデータであるＹ^ｎは、たとえば、第１種類のデータであるＸ^ｎに対して観測対象が実際に処理（動作）を施すことによって、観測対象に関して観測された情報を表す。

　上述したように、シミュレータサーバ２００は、パラメータθが表す値に従った演算をデータＸの値に対して施すことによってデータＹを算出する。これによって、観測対象における処理（動作）をシミュレーションする。この場合に、パラメータθは、たとえば、各処理（動作）における入出力間の関係性を表している。

　ステップＳ１０１では、シミュレータサーバ２００は、観測対象に対して与えられた入力を表す第１種類のデータであるＸ^ｎを入力として受け付け、入力されたパラメータθに従った処理を第１種類のデータであるＸ^ｎに対して施すことによって当該観測対象をシミュレーションする。この結果、シミュレータサーバ２００は、当該シミュレーションした結果を表すシミュレーション結果（

）を作成する。

　シミュレータサーバ２００における処理は、あらかじめ実行されていてもよい。この場合に、第２種類サンプルデータ取得部１１２は、パラメータθのサンプルデータと、当該サンプルデータが設定された場合に算出されたシミュレーション結果とが関連付けされた情報を読み取る。

　次に、ステップＳ１０２において、カーネル平均算出部１１４は、カーネルＡＢＣにより、ステップＳ１００及びステップＳ１０１で得られたサンプルデータを用いて、パラメータの事後分布を示すカーネル平均を算出する。なお、この事後分布は、上述の通り、逆温度を用いて定義される事後分布である。カーネル平均算出部１１４は、式（２５）で示される逆温度が含まれるカーネル関数を用いてカーネル平均を算出する。言い換えると、カーネル平均算出部１１４は、第２種類のデータについての観測データとサンプルデータとの差異と、各観測データの寄与度とに応じて、パラメータの各サンプルの重要度を決定することにより、パラメータの分布に対応するデータを算出する。

　次に、ステップＳ１０３において、第２のパラメータサンプル生成部１１６が、ステップＳ１０２で算出されたカーネル平均に基づいて、逆温度を用いて定義される事後分布に従ったパラメータのサンプルデータを生成する。

　次に、ステップＳ１０４において、情報量規準算出部１１８が、ステップＳ１０３で生成されたパラメータのサンプルデータに基づいて、式（１３）を用いて、モデルについてのＷＢＩＣを算出する。

　以上、実施の形態１について説明した。本実施の形態では、逆温度を用いて定義される事後分布に対応するカーネル平均をカーネル平均算出部１１４が算出する。このため、逆温度の値として１以外の値が設定される場合であっても、カーネルＡＢＣ及びカーネルハーディング等の手法を用いて、事後分布のサンプルデータを取得することができる。カーネルＡＢＣ及びカーネルハーディング等の手法を用いた方法では、第２種類サンプルデータ取得部１１２は、パラメータのサンプルデータ毎に、式（１５）のように表されるサンプルデータをモデル（シミュレータサーバ２００）から取得するだけでよい。すなわち、ＭＣＭＣを用いた方法により事後分布のサンプルデータを取得する場合に比べて、シミュレーションの実行回数を抑制することができる。すなわち、本実施の形態によれば、効率的にパラメータを算出することができる。また、このため、効率的にＷＢＩＣを算出することができる。

　なお、図４に示したフローチャートでは、ステップＳ１０３にて生成したサンプルデータをＷＢＩＣの算出にのみ用いているが、シミュレータサーバ２００によるシミュレーションに用いてもよい。すなわち、情報量規準算出装置１００は、ステップＳ１０３にて生成したサンプルデータ（すなわち、パラメータθのサンプルデータ）をシミュレータサーバ２００に入力してもよい。この場合に、シミュレータサーバ２００は、ｍ個の当該サンプルデータを受け取り、受け取った当該サンプルデータに基づき、観測対象に関するシミュレーション計算を実行する。具体的には、シミュレータサーバ２００は、所与の第１種類のデータであるＸ^ｎに対して、当該サンプルデータに従ったｍ種類のシミュレーション処理を実行する。この結果、シミュレータサーバ２００は、所与の第１種類のデータであるＸ^ｎに対してｍ種類のシミュレーション結果を算出する。ｍ種類のシミュレーション結果は、必ずしも相互に異なっているとは限らず、同じ結果を含んでいてもよい。

　その後、情報量規準算出装置１００は、ｍ種類のシミュレーション結果を受け取る。そして、情報量規準算出装置１００は、ｍ種類のシミュレーション結果を総合したシミュレーション結果を算出する。たとえば、情報量規準算出装置１００は、ｍ種類のシミュレーション結果の平均を算出する。すなわち、情報量規準算出装置１００は、所与の第１種類のデータであるＸ^ｎに対するシミュレーション結果を算出する。情報量規準算出装置１００は、たとえば、ｍ種類のシミュレーション結果の重み付き平均を算出することによって、所与の第１種類のデータであるＸ^ｎに対するシミュレーション結果を算出してもよい。

　情報量規準算出装置１００は、図４を参照しながら上述した処理を実行することによって、シミュレータサーバ２００が算出するシミュレーション結果と、観測情報Ｙ^ｎとが合う（適合する）ように、パラメータθのサンプルデータを算出する。算出されたサンプルデータは、事後分布に従ったデータであるので、情報量規準算出装置１００が算出する上述したシミュレーション結果は、事後分布に従ったサンプルデータに従ったシミュレーション結果である。言い換えると、情報量規準算出装置１００は、シミュレータサーバ２００によって作成されるシミュレーション結果に基づき、観測情報に合うようなシミュレーション結果を算出することができる。よって、シミュレータサーバ２００に対して与えるパラメータθのサンプルデータに関して、観測情報に合うような値を作成することによって、情報量規準算出装置１００は、当該観測情報に適合したシミュレーション結果を算出することができる。

＜実施の形態２＞
　次に、実施の形態２について説明する。カーネルＡＢＣの特性により、実施の形態１で示したＷＢＩＣの算出方法は、ＭＣＭＣ法を用いたＷＢＩＣの算出とは異なる結果となることがある。これは、以下のような理由によるものと考えられる。

　カーネルＡＢＣアルゴリズムの実用上の制約は、データＹ^ｎとＹ^ｎ’の類似度を測るためのカーネルｋ_ｙ（Ｙ^ｎ，Ｙ^ｎ’）の幅であるハイパーパラメータσとして、調整された値を用いる必要があるということである。区間［０，１］の全ての領域に対するｋ_ｙ（Ｙ^ｎ，Ｙ^ｎ’）の分布を示すためには、式（２５）の正確な計算が求められる。調整されたハイパーパラメータσ_ｋよりもσがはるかに小さい場合、ｋ_ｙ（Ｙ^ｎ，Ｙ^ｎ’）の値の分布は、小さな値（例えば、０．１未満）にまとまってしまい、式（２５）の計算結果が不正確になってしまうこともある。この理由は、データの類似度を測るためのスケールがデータＹ^ｎのスケールに比較して小さすぎることにある。

　一方、σは、式（３）においては、ガウスノイズの標準偏差のハイパーパラメータである。そして、ｎＬ_ｎ（θ）は、このハイパーパラメータを用いて計算される。しかしながら、上述したハイパーパラメータσ_ｋは、ガウスノイズの真の標準偏差値σ_０よりも大きいことがある。σ_０とσ_ｋの差に起因して、カーネルＡＢＣを用いて算出するＷＢＩＣの値は、ＭＣＭＣ法などのように尤度関数を直接利用して算出するＷＢＩＣの値と異なってしまう。

　つまり、ＷＢＩＣを算出する場合に、式（２５）において、σの具体的な値として、σ_０ではなく、σ_ｋが用いられるため、実施の形態１では正確なＷＢＩＣの値を算出できない恐れがある。ここで、モデルは、ガウスノイズを伴う回帰関数によりモデル化されているとする。σ_０は、回帰関数に対する当該ガウスノイズの標準偏差の値と言うことができる。また、σ_ｋは、第２種類の観測データの分布と第２種類のサンプルデータの分布の類似度を測るためのスケールを示す値と言うことができる。

　本実施の形態では、実施の形態１で示したＷＢＩＣの算出方法よりも正確にＷＢＩＣを算出する方法について示す。なお、本実施の形態において、ガウスノイズの標準偏差σ_０は既知であるとする。すなわち、以下で述べる補正を行なう前に、ガウスノイズの標準偏差σ_０は、公知の方法により推定されており、既知である。

　以下の説明では、モデルのハイパーパラメータσを明示的に表現するために、式（７）をＦ_ｎ（β）ではなく、Ｆ_ｎ（β，σ）と表すこととする。また、β、σは、変数を意味している。β_１などのように、βに下付き文字が付与されている符号は、具体的な定数を示している。同様に、σ_０などのように、σに下付き文字が付与されている符号は、具体的な定数を示している。本実施の形態の目的は、ＷＢＩＣ＝Ｆ_ｎ（１，σ_０）＝Ｆ’_ｎ（β，σ_０）を、Ｆ_ｎ（１，σ_ｋ）＝Ｆ’_ｎ（β，σ_ｋ）から算出することである。なぜならば、実施の形態１の情報量規準算出装置１００では、ＷＢＩＣとして、Ｆ’_ｎ（β，σ_ｋ）を算出しているからである。

　実施の形態２では、情報処理システム１０において、情報量規準算出装置１００の代わりに情報量規準算出装置３００が用いられる。図５は、実施の形態２にかかる情報量規準算出装置３００の機能構成の一例を示すブロック図である。情報量規準算出装置３００は、補正部１２０をさらに有する点で、実施の形態１にかかる情報量規準算出装置１００と異なる。なお、情報量規準算出装置３００も、情報量規準算出装置１００と同様、図２に示すようなハードウェア構成を備えており、プロセッサ１０３が、メモリ１０２からソフトウェアを読み出して実行することで、図５に示される各構成の処理を行う。

　補正部１２０は、情報量規準算出部１１８が算出したＷＢＩＣを補正する。補正部１２０は、式（７）と式（３）とから導かれる関係式において、異なるσが異なる逆温度βにより表されることを用いて、補正を行なう。異なるσ及びβ間のＦ_ｎ（β，σ）の関係は、以下の式（２８）により表される。

＜式（２８）＞

　なお、式（２８）において、Ｃ_ｋ及びβ_ｋは以下の式（２９）及び式（３０）に示されるように定義されている。
＜式（２９）＞

＜式（３０）＞

　式（２８）は、式（７）おける逆温度の値を１とし且つ標準偏差の値をσ_ｋとした場合のＷＢＩＣと、式（７）における逆温度の値を１以外の所定の値β_ｋとし且つ標準偏差の値をσ_０とした場合のＷＢＩＣとの関係を示している。なお、式（７）は、上述の通り、逆温度を含むようにベイズ自由エネルギーの定義式を拡張した数式である。補正部１２０は、式（２８）で示される関係を用いて、情報量規準算出部１１８が算出したＷＢＩＣを補正する。
　具体的には、補正部１２０は、以下に説明する２つの補正方法のいずれかにより、補正を行なう。ここで、２つの補正方法を説明するために、Ｆ_ｎ（β，σ）、すなわち式（７）の数式について漸近展開された数式を示す。以下の式（３１）は、Ｆ_ｎ（β，σ）について漸近展開された数式である。

＜式（３１）＞

＜第１の補正方法＞
　この場合、補正部１２０は、式（３１）に異なるβの値を設定した２つの数式から得られる、実対数閾値λを除外して表された関係と、式（２８）で示される関係とを用いることで、情報量規準算出部１１８が算出したＷＢＩＣを補正する。実対数閾値λが除外された関係を用いているため、第１の方法では、一般的に計算が困難である実対数閾値λの計算をすることなく、補正することができる。

　２つの数式は、具体的には、逆温度β＝１が設定された数式（以下の式（３２））と、逆温度β＝β_１（ただし、β_１は１以外の定数）が設定された数式（以下の式（３３））である。１及びβ_１は、β_ｋに相当する。なお、いずれの式においても、σ＝σ_０である。実対数閾値λを除外して表された関係を示す関係式は、式（３２）及び式（３３）からなる連立方程式において、実対数閾値λの項を削除することで得られる。

＜式（３２）＞

＜式（３３）＞

　ここで、エントロピー(マイナス対数尤度関数)Ｌ_ｎ（θ_０）が、

（ただし、

は、事後分布に従ったパラメータのサンプルデータから算出される平均（事後平均：posterior mean）である）によって、十分に近似できる場合、以下の式（３４）が成り立つ。なお、式（３４）は、実対数閾値λを除外して表された関係を示す関係式と、式（２８）で示される関係式により得られる。

＜式（３４）＞

　式（３４）において、上記σ_ｋに相当するσ_１は、カーネルの幅についてのハイパーパラメータである。また、β_１＝σ_０ ^２／σ_１ ^２である（式（３０）参照）。ここで、Ｆ_ｎ（１，σ_ｋ）は、情報量規準算出部１１８が算出したＷＢＩＣに相当する。したがって、補正部１２０は、式（３４）を演算することにより、情報量規準算出部１１８が算出した補正前のＷＢＩＣから、補正後のＷＢＩＣを生成する。言い換えれば、補正部１２０は、推定された事後分布に従うパラメータセットに関して、第１種類のデータ（すなわち、観測対象に対する入力）と、第１種類のデータの場合に観測対象に関して観測された観測情報とについての尤度（尤もらしさの程度）ともいえるマイナス対数尤度関数Ｌ_ｎ（θ_０）を算出する。そして、補正部１２０は、算出した尤度と、上記の幅の比とを用いて補正量を算出する。そして、補正部１２０は、情報量規準算出部１１８が算出した補正前のＷＢＩＣに、当該補正量を加える補正を行なう。

＜第２の補正方法＞
　Ｌ_ｎ（θ_０）の近似による算出が可能である場合、補正部１２０は上述した第１の補正方法により補正を行なえばよい。しかしながら、Ｌ_ｎ（θ_０）の近似による算出ができない場合、第１の補正方法は用いることができない。この場合、補正部１２０は、第２の補正方法により補正を行なえばよい。

　第２の補正方法では、補正部１２０は、式（３１）に異なるβの値を設定した３つの数式から得られる、実対数閾値及びエントロピーを除外して表された関係と、式（２８）で示される関係とを用いることで、情報量規準算出部１１８が算出したＷＢＩＣを補正する。実対数閾値のみならず、エントロピーが除外された関係を用いているため、第２の補正方法では、Ｌ_ｎ（θ_０）の近似による算出ができない場合であっても、補正することができる。

　３つの数式は、具体的には、逆温度β＝１が設定された数式（以下の式（３５））と、逆温度β＝β_１が設定された数式（以下の式（３６））と、逆温度β＝β_２が設定された数式（以下の式（３７））とである。１、β_１、及びβ_２は、β_ｋに相当する。なお、いずれの式においても、σ＝σ_０である。
　なお、β_１は１以外の定数であり、β_２はβ_１以外かつ１以外の定数である。具体的には、β_１＝σ_０ ^２／σ_１ ^２であり、β_２＝σ_０ ^２／σ_２ ^２である。ただし、σ_２≠σ_１である。

＜式（３５）＞

＜式（３６）＞

＜式（３７）＞

　式（３５）、式（３６）、及び式（３７）からなる連立方程式において、実対数閾値λの項及びエントロピーＬ_ｎ（θ_０）の項を削除することで、実対数閾値及びエントロピーを除外して表された関係を示す関係式として、以下の式（３８）が得られる。

＜式（３８）＞

　よって、補正部１２０は、補正後のＷＢＩＣであるＦ_ｎ（１，σ_０）を算出できる。なぜならば、Ｆ_ｎ（β_１，σ_０）の値は、Ｆ_ｎ（１，σ_１）の値として算出可能であり、Ｆ_ｎ（β_２，σ_０）の値は、Ｆ_ｎ（１，σ_２）の値として算出可能であるからである（式（２８）参照）。すなわち、Ｆ_ｎ（β_１，σ_０）及びＦ_ｎ（β_２，σ_０）は、情報量規準算出部１１８によって算出される２つの補正前のＷＢＩＣである。具体的には、一方は、カーネル平均算出部１１４が式（２５）のσとしてσ_１を用いた場合に算出されるＷＢＩＣであり、他方は、カーネル平均算出部１１４が式（２５）のσとしてσ_２を用いて算出されるＷＢＩＣである。よって、補正部１２０は、式（３８）を演算することにより、情報量規準算出部１１８が算出したＷＢＩＣから、補正後のＷＢＩＣを生成する。言い換えると、式（３８）には、情報量規準算出部１１８が、２つの異なる寄与度（逆温度）に対して、それぞれ、ＷＢＩＣを算出し、補正部１２０が、情報量規準算出部１１８によって算出されたＷＢＩＣに関して、当該寄与度（逆温度）に従った加重平均を算出する処理が記載されているとも言える。

　次に、情報量規準算出装置３００の動作についてフローチャートに基づいて説明する。図６は、情報量規準算出装置３００の動作の一例を示すフローチャートである。以下、図６に沿って、動作を説明する。図６に示したフローチャートは、ステップＳ１０５がステップＳ１０４の後に追加されている点で、図４に示したフローチャートと異なる。以下、図４に示したフローチャートと異なる点について説明する。

　本実施の形態では、ステップＳ１０４の後、処理はステップＳ１０５へ移行する。ステップＳ１０５では、補正部１２０が、上述した第１の補正方法又は第２の補正方法に従って、ステップＳ１０４で算出された補正前のＷＢＩＣを補正する。

　ただし、第２の補正方法により補正が行なわれる場合には、ステップＳ１０２において、２種類のカーネル平均が算出される。一方は、カーネル平均算出部１１４が式（２５）のσとしてσ_１を用いることにより算出されるカーネル平均であり、他方は、カーネル平均算出部１１４が式（２５）のσとしてσ_２を用いることにより算出されるカーネル平均である。また、第２の補正方法により補正が行なわれる場合には、ステップＳ１０３において、２種類のカーネル平均のそれぞれに対し、パラメータのサンプルデータが生成される。また、第２の補正方法により補正が行なわれる場合には、ステップＳ１０４において、ステップＳ１０３で生成された２セットのサンプルデータを用いて、２つのＷＢＩＣを算出する。

　以上、実施の形態２について説明した。本実施の形態では、補正部１２０によりＷＢＩＣの補正が行なわれる。したがって、より正確なＷＢＩＣの値を得ることができる。

　なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。たとえば、次のような情報処理装置１も実施の形態の一つである。図７は、情報処理装置１の構成を示すブロック図である。情報処理装置１は、対応データ算出部２と、新規パラメータサンプル生成部３とを有する。

　対応データ算出部２は、観測対象に入力（Ｘ^ｎ）を与えた場合に観測される複数の観測情報（Ｙ^ｎ）と、第２種類のデータ（

）との差異と、当該複数の観測情報における各観測情報の寄与度（β）とに応じて、パラメータの各サンプルの重要度を決定する。なお、第２種類のデータとは、観測対象をパラメータのサンプルに基づきシミュレーションするシミュレータが複数のサンプル及び前記入力を表す第１種類のデータに対して作成したデータである。そして、対応データ算出部２は、パラメータの分布に対応するデータを算出する。
　新規パラメータサンプル生成部３は、対応データ算出部２が算出したパラメータの分布に対応するデータを用いて、所定の処理（たとえば、カーネルハーディングなど）に従い、パラメータの新たなサンプルを生成する。
　このような構成によれば、情報処理装置１は、効率的にパラメータを算出することができる。

　また、上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

（付記１）
　観測対象に入力を与えた場合に観測される複数の観測情報と、前記観測対象をパラメータのサンプルに基づきシミュレーションするシミュレータが複数の前記サンプル及び前記入力を表す第１種類のデータに対して作成した第２種類のデータとの差異と、前記複数の観測情報における各観測情報の寄与度とに応じて、各前記サンプルの重要度を決定し、前記パラメータの分布に対応するデータを算出する対応データ算出手段と、
　前記パラメータの分布に対応するデータを用いて、所定の処理に従い、前記パラメータの新たなサンプルを生成する新規パラメータサンプル生成手段と
　を備える情報処理装置。
（付記２）
　前記新規パラメータサンプル生成手段により生成された前記パラメータのサンプルに基づいて、前記シミュレータにおけるモデルについてのＷＢＩＣ（Widely Applicable Bayesian Information Criterion）を算出する情報量規準算出手段を
　さらに備える付記１に記載の情報処理装置。
（付記３）
　前記各観測情報の寄与度は、一定、または、略一定である
　付記２に記載の情報処理装置。
（付記４）
　前記パラメータの事前分布に従う前記複数のサンプルを生成する事前パラメータサンプル生成手段と、
　前記事前パラメータサンプル生成手段によって生成された前記複数のサンプルに基づき、前記シミュレータが作成した前記第２種類のデータを取得する第２種類サンプルデータ取得手段と
　をさらに備える付記１乃至付記３のいずれか１項に記載の情報処理装置。
（付記５）
　前記パラメータの分布に対応するデータは、カーネル平均であり、
　前記対応データ算出手段は、前記寄与度を逆温度として含むカーネル関数を用いて、前記カーネル平均を算出し、
　前記新規パラメータサンプル生成手段は、前記対応データ算出手段によって算出された前記カーネル平均を用いて前記サンプルを生成する
　付記１乃至付記３のいずれか１項に記載の情報処理装置。
（付記６）
　前記対応データ算出手段は、下記の式で示される前記カーネル関数を用いたカーネルＡＢＣ（Kernel Approximate Bayesian Computation）により、前記カーネル平均を算出する
　付記５に記載の情報処理装置。
　ただし、下記の式において、σは前記第２種類のデータについてのガウスノイズの標準偏差であり、ｎは前記第２種類のデータの要素数であり、βは前記逆温度であり、Ｙ_ｉ及びＹ_ｉ’は前記第２種類のデータの値である。

（付記７）
　逆温度を含むようにベイズ自由エネルギーの定義式を拡張した数式である第１の数式における前記逆温度の値を１とし且つ標準偏差の値を第１の標準偏差値とした場合のＷＢＩＣと、前記第１の数式における前記逆温度の値を１以外の所定の値とし且つ標準偏差の値を第２の標準偏差値とした場合のＷＢＩＣとの関係である第１の関係を用いて、前記情報量規準算出手段が算出した前記ＷＢＩＣを補正する補正手段をさらに有し、
　前記モデルは、ガウスノイズを伴う回帰関数によりモデル化されており、
　前記第１の標準偏差値は、前記観測情報の分布と前記第２種類のデータの分布の類似度を測るためのスケールを示す値であり、
　前記第２の標準偏差値は、前記回帰関数に対する前記ガウスノイズの標準偏差の値である
　付記２に記載の情報処理装置。
（付記８）
　前記補正手段は、前記第１の数式について漸近展開された数式である第２の数式に異なる逆温度の値を設定した２つの数式から得られる、実対数閾値を除外して表された関係である第２の関係と、前記第１の関係とを用いることで、前記情報量規準算出手段が算出した前記ＷＢＩＣを補正する
　付記７に記載の情報処理装置。
（付記９）
　前記補正手段は、前記第１の数式について漸近展開された数式である第２の数式に異なる逆温度の値を設定した３つの数式から得られる、実対数閾値及びエントロピーを除外して表された関係である第３の関係と、前記第１の関係とを用いることで、前記情報量規準算出手段が算出した前記ＷＢＩＣを補正する
　付記７に記載の情報処理装置。
（付記１０）
　前記入力と、前記入力を与えた場合の前記観測情報とを用いて、前記新規パラメータサンプル生成手段によって算出された前記新たなサンプルに関する尤度を算出し、算出した前記尤度に基づき前記ＷＢＩＣを補正する補正手段
　をさらに有する付記３に記載の情報処理装置。
（付記１１）
　前記ＷＢＩＣを補正する補正手段
　をさらに有し、
　前記情報量規準算出手段は、２つの異なる寄与度に対して、それぞれ、前記ＷＢＩＣを算出し
　前記補正手段は、前記情報量規準算出手段によって算出された前記ＷＢＩＣに関して、前記寄与度に従った加重平均を算出する
　付記３に記載の情報処理装置。
（付記１２）
　付記１乃至付記１１のいずれか１項に記載の情報処理装置と
　前記シミュレータと
　を備え、
　前記シミュレータは、前記新規パラメータサンプル生成手段が生成した前記サンプルに基づき処理を実行する
　情報処理システム。
（付記１３）
　情報処理装置によって、
　観測対象に入力を与えた場合に観測される複数の観測情報と、前記観測対象をパラメータのサンプルに基づきシミュレーションするシミュレータが複数の前記サンプル及び前記入力を表す第１種類のデータに対して作成した第２種類のデータとの差異と、前記複数の観測情報における各観測情報の寄与度とに応じて、各前記サンプルの重要度を決定し、前記パラメータの分布に対応するデータを算出し、
　前記パラメータの分布に対応するデータを用いて、所定の処理に従い、前記パラメータの新たなサンプルを生成する
　情報処理方法。
（付記１４）
　観測対象に入力を与えた場合に観測される複数の観測情報と、前記観測対象をパラメータのサンプルに基づきシミュレーションするシミュレータが複数の前記サンプル及び前記入力を表す第１種類のデータに対して作成した第２種類のデータとの差異と、前記複数の観測情報における各観測情報の寄与度とに応じて、各前記サンプルの重要度を決定し、前記パラメータの分布に対応するデータを算出する対応データ算出ステップと、
　前記パラメータの分布に対応するデータを用いて、所定の処理に従い、前記パラメータの新たなサンプルを生成する新規パラメータサンプル生成ステップと
　をコンピュータに実行させる
　プログラムが格納された非一時的なコンピュータ可読媒体。

　以上、実施の形態を参照して本願発明を説明したが、本願発明は上記によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２０１８年１０月３日に出願された日本出願特願２０１８－１８８１９０を基礎とする優先権を主張し、その開示の全てをここに取り込む。

１　　情報処理装置
２　　対応データ算出部
３　　新規パラメータサンプル生成部
１０　　情報処理システム
１００　　情報量規準算出装置
１０１　　入出力インタフェース
１０２　　メモリ
１０３　　プロセッサ
１１０　　第１のパラメータサンプル生成部
１１２　　第２種類サンプルデータ取得部
１１４　　カーネル平均算出部
１１６　　第２のパラメータサンプル生成部
１１８　　情報量規準算出部
１２０　　補正部
２００　　シミュレータサーバ
３００　　情報量規準算出装置

Claims

　観測対象に入力を与えた場合に観測される複数の観測情報と、前記観測対象をパラメータのサンプルに基づきシミュレーションするシミュレータが複数の前記サンプル及び前記入力を表す第１種類のデータに対して作成した第２種類のデータとの差異と、前記複数の観測情報における各観測情報の寄与度とに応じて、各前記サンプルの重要度を決定し、前記パラメータの分布に対応するデータを算出する対応データ算出手段と、
　前記パラメータの分布に対応するデータを用いて、所定の処理に従い、前記パラメータの新たなサンプルを生成する新規パラメータサンプル生成手段と
　を備える情報処理装置。
　前記新規パラメータサンプル生成手段により生成された前記パラメータのサンプルに基づいて、前記シミュレータにおけるモデルについてのＷＢＩＣ（Widely Applicable Bayesian Information Criterion）を算出する情報量規準算出手段を
　さらに備える請求項１に記載の情報処理装置。
　前記各観測情報の寄与度は、一定、または、略一定である
　請求項２に記載の情報処理装置。
　前記パラメータの事前分布に従う前記複数のサンプルを生成する事前パラメータサンプル生成手段と、
　前記事前パラメータサンプル生成手段によって生成された前記複数のサンプルに基づき、前記シミュレータが作成した前記第２種類のデータを取得する第２種類サンプルデータ取得手段と
　をさらに備える請求項１乃至請求項３のいずれか１項に記載の情報処理装置。
　前記パラメータの分布に対応するデータは、カーネル平均であり、
　前記対応データ算出手段は、前記寄与度を逆温度として含むカーネル関数を用いて、前記カーネル平均を算出し、
　前記新規パラメータサンプル生成手段は、前記対応データ算出手段によって算出された前記カーネル平均を用いて前記サンプルを生成する
　請求項１乃至請求項３のいずれか１項に記載の情報処理装置。
　前記対応データ算出手段は、下記の式で示される前記カーネル関数を用いたカーネルＡＢＣ（Kernel Approximate Bayesian Computation）により、前記カーネル平均を算出する
　請求項５に記載の情報処理装置。
　ただし、下記の式において、σは前記第２種類のデータについてのガウスノイズの標準偏差であり、ｎは前記第２種類のデータの要素数であり、βは前記逆温度であり、Ｙ_ｉ及びＹ_ｉ’は前記第２種類のデータの値である。
　逆温度を含むようにベイズ自由エネルギーの定義式を拡張した数式である第１の数式における前記逆温度の値を１とし且つ標準偏差の値を第１の標準偏差値とした場合のＷＢＩＣと、前記第１の数式における前記逆温度の値を１以外の所定の値とし且つ標準偏差の値を第２の標準偏差値とした場合のＷＢＩＣとの関係である第１の関係を用いて、前記情報量規準算出手段が算出した前記ＷＢＩＣを補正する補正手段をさらに有し、
　前記モデルは、ガウスノイズを伴う回帰関数によりモデル化されており、
　前記第１の標準偏差値は、前記観測情報の分布と前記第２種類のデータの分布の類似度を測るためのスケールを示す値であり、
　前記第２の標準偏差値は、前記回帰関数に対する前記ガウスノイズの標準偏差の値である
　請求項２に記載の情報処理装置。
　前記補正手段は、前記第１の数式について漸近展開された数式である第２の数式に異なる逆温度の値を設定した２つの数式から得られる、実対数閾値を除外して表された関係である第２の関係と、前記第１の関係とを用いることで、前記情報量規準算出手段が算出した前記ＷＢＩＣを補正する
　請求項７に記載の情報処理装置。
　前記補正手段は、前記第１の数式について漸近展開された数式である第２の数式に異なる逆温度の値を設定した３つの数式から得られる、実対数閾値及びエントロピーを除外して表された関係である第３の関係と、前記第１の関係とを用いることで、前記情報量規準算出手段が算出した前記ＷＢＩＣを補正する
　請求項７に記載の情報処理装置。
　前記入力と、前記入力を与えた場合の前記観測情報とを用いて、前記新規パラメータサンプル生成手段によって算出された前記新たなサンプルに関する尤度を算出し、算出した前記尤度に基づき前記ＷＢＩＣを補正する補正手段
　をさらに有する請求項３に記載の情報処理装置。
　前記ＷＢＩＣを補正する補正手段
　をさらに有し、
　前記情報量規準算出手段は、２つの異なる寄与度に対して、それぞれ、前記ＷＢＩＣを算出し
　前記補正手段は、前記情報量規準算出手段によって算出された前記ＷＢＩＣに関して、前記寄与度に従った加重平均を算出する
　請求項３に記載の情報処理装置。
　請求項１乃至請求項１１のいずれか１項に記載の情報処理装置と
　前記シミュレータと
　を備え、
　前記シミュレータは、前記新規パラメータサンプル生成手段が生成した前記サンプルに基づき処理を実行する
　情報処理システム。
　情報処理装置によって、
　観測対象に入力を与えた場合に観測される複数の観測情報と、前記観測対象をパラメータのサンプルに基づきシミュレーションするシミュレータが複数の前記サンプル及び前記入力を表す第１種類のデータに対して作成した第２種類のデータとの差異と、前記複数の観測情報における各観測情報の寄与度とに応じて、各前記サンプルの重要度を決定し、前記パラメータの分布に対応するデータを算出し、
　前記パラメータの分布に対応するデータを用いて、所定の処理に従い、前記パラメータの新たなサンプルを生成する
　情報処理方法。
　観測対象に入力を与えた場合に観測される複数の観測情報と、前記観測対象をパラメータのサンプルに基づきシミュレーションするシミュレータが複数の前記サンプル及び前記入力を表す第１種類のデータに対して作成した第２種類のデータとの差異と、前記複数の観測情報における各観測情報の寄与度とに応じて、各前記サンプルの重要度を決定し、前記パラメータの分布に対応するデータを算出する対応データ算出ステップと、
　前記パラメータの分布に対応するデータを用いて、所定の処理に従い、前記パラメータの新たなサンプルを生成する新規パラメータサンプル生成ステップと
　をコンピュータに実行させる
　プログラムが格納された非一時的なコンピュータ可読媒体。