WO2020090821A1

WO2020090821A1 - 解析装置、機械学習装置、解析システム、解析方法および記録媒体

Info

Publication number: WO2020090821A1
Application number: PCT/JP2019/042388
Authority: WO
Inventors: 慶一木佐森; 雄斗小森; 鷲尾　隆; 義男亀田
Original assignee: 日本電気株式会社; 国立研究開発法人産業技術総合研究所
Priority date: 2018-10-30
Filing date: 2019-10-29
Publication date: 2020-05-07
Also published as: US20210383157A1; JPWO2020090821A1; JP7117686B2

Abstract

解析装置は、更新パラメータ値に応じて設定される更新後パラメータ値の複数の候補の各々について、前記更新対象パラメータ値とその候補とを複数の機械学習結果に適用して、前記更新対象パラメータ値の場合の評価対象値に対する、その候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得する相違情報取得手段と、前記候補毎、かつ、前記機械学習結果毎に、前記評価対象値の相違の程度と、前記更新対象パラメータ値の場合の前記評価対象値とに基づいて、その候補の場合の評価対象値を算出する評価対象値算出手段と、前記候補毎に、前記機械学習結果毎の前記評価対象値のばらつきを用いて選択指標値を算出し、前記複数の候補各々の前記選択指標値を比較し、前記比較の結果に基づき前記複数の候補から候補を選択し、前記更新対象パラメータ値、前記更新対象パラメータ値の場合の評価対象値を、それぞれ、前記選択した候補、前記選択した候補の場合の評価対象値に更新する、更新後パラメータ値選択手段とを備える。

Description

解析装置、機械学習装置、解析システム、解析方法および記録媒体

　本発明は、解析装置、機械学習装置、解析システム、解析方法および記録媒体に関する。

　シミュレーションを用いた解析技術など幾つかの解析技術が提案されている。
　例えば、特許文献１には、シミュレーションの複数の試行の中から分析対象の試行を抽出するための抽出方法が記載されている。この抽出方法では、店舗のレジの待ち時間を短縮したい等の主題（検討課題）に対し、レジの台数およびレイアウト等の施策（主題に対する対策）、および、来店客の行動等の不確実性を有する要素に基づく環境要素を変えてシミュレーションを複数回実行する。特許文献１では、個々のシミュレーションの実行を試行と呼んでいる。特許文献１に記載の抽出方法では、他の試行と評価値が乖離している試行を分析対象の試行として抽出する。

　また、特許文献２には、プラントで発生するイベントを解析するためのイベント解析装置が記載されている。このイベント解析装置は、イベント毎に発生の有無を時系列で示すイベントマトリクスに基づいてイベントをグルーピングし、得られた関連イベントグループについて、イベントマトリックスに基づいてベイジアンネットワークによる確率付き因果関係モデルを構築する。このイベント解析装置は、イベント毎の確率付きモデルのうち、設定された改善候補パターンのいずれかに合致する確率付き因果関係モデルを抽出する。

　また、特許文献３には、セクタアンテナを用いたマイクロダイバーシティにおける基地局の配置場所とセルの配置パターンを決定するための、配置場所および配置パターン計算装置が記載されている。この配置場所および配置パターン計算装置は、セルを示す凸多角形が所定の二次元平面上に重複及び隙間がないように配置されるという条件のもとで、基地局の配置およびセルの配置パターンを決定する。

　また、特許文献４には、画像検索の精度を向上させるための判定装置が記載されている。この判定装置は、関連性の判定対象となる３つの画像を距離空間上に対応付け、３つの画像が有する関連性を、距離空間上で３つの画像により定義付けられる角度として判定する。

日本国特開２０１６－１５７１７３号公報日本国特開２０１６－０９９９３０号公報日本国特開２０１６－０９１４００号公報日本国特開２０１７－１６７９８７号公報

　解析装置が解としてのパラメータ値の探索を行う場合、局所解に陥る可能性があり、なるべく評価の高い解を検出できることが好ましい。解析装置が評価対象値を算出して解の探索を行う場合、評価対象値を評価する指標を得られれば、評価の高い解の検出に役立てることができる。特に、評価対象値のばらつきをパラメータ値（解）の評価に反映させることができれば、評価対象値が大きい（評価が高い）探索領域を検知できると期待される。

　本発明の目的の一例は、上述の課題を解決することのできる解析装置、機械学習装置、解析システム、解析方法および記録媒体を提供することである。

　本発明の第１の態様によれば、解析装置は、更新パラメータ値に応じて設定される更新後パラメータ値の複数の候補の各々について、前記更新対象パラメータ値とその候補とを複数の機械学習結果に適用して、前記更新対象パラメータ値の場合の評価対象値に対する、その候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得する相違情報取得手段と、前記候補毎、かつ、前記機械学習結果毎に、前記評価対象値の相違の程度と、前記更新対象パラメータ値の場合の前記評価対象値とに基づいて、その候補の場合の評価対象値を算出する評価対象値算出手段と、前記候補毎に、前記機械学習結果毎の前記評価対象値のばらつきを用いて選択指標値を算出し、前記複数の候補各々の前記選択指標値を比較し、前記比較の結果に基づき前記複数の候補から候補を選択し、前記更新対象パラメータ値、前記更新対象パラメータ値の場合の評価対象値を、それぞれ、前記選択した候補、前記選択した候補の場合の評価対象値に更新する、更新後パラメータ値選択手段と、を備える。

　本発明の第２の態様によれば、機械学習装置は、更新対象パラメータ値および更新後パラメータ値とのセットを複数取得するパラメータ値取得手段と、前記複数のセット毎に、前記更新対象パラメータ値の場合の評価対象値と、前記更新後パラメータ値の場合の評価対象値とをシミュレーションで算出するシミュレーション実行手段と、前記複数のセット毎に、前記更新対象パラメータ値の場合の評価対象値に対する、前記更新後パラメータ値の場合の評価対象値の相違の程度を算出する相違算出手段と、前記複数のセットの前記更新対象パラメータ値、前記更新後パラメータ値、および、前記評価対象値の相違の程度を用いて、前記更新対象パラメータ値および前記更新後パラメータ値と、前記評価対象値の相違の程度との関係の機械学習結果を複数取得する機械学習処理手段と、を備える。

　本発明の第３の態様によれば、解析システムは、機械学習装置と解析装置とを備える。前記機械学習装置は、更新対象パラメータ値および更新後パラメータ値とのセットを複数取得するパラメータ値取得手段と、前記複数のセット毎に、前記更新対象パラメータ値の場合の評価対象値と、前記更新後パラメータ値の場合の評価対象値とをシミュレーションで算出するシミュレーション実行手段と、前記複数のセット毎に、前記更新対象パラメータ値の場合の評価対象値に対する、前記更新後パラメータ値の場合の評価対象値の相違の程度を算出する相違算出手段と、前記複数のセットの前記更新対象パラメータ値、前記更新後パラメータ値、および、前記評価対象値の相違の程度を用いて、前記更新対象パラメータ値および前記更新後パラメータ値と、前記評価対象値の相違の程度との関係の機械学習結果を複数取得する機械学習処理手段と、を備える。前記解析装置は、更新パラメータ値に応じて設定される更新後パラメータ値の複数の候補の各々について、前記更新対象パラメータ値とその候補とを複数の機械学習結果に適用して、前記更新対象パラメータ値の場合の評価対象値に対する、その候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得する相違情報取得手段と、前記候補毎、かつ、前記機械学習結果毎に、前記評価対象値の相違の程度と、前記更新対象パラメータ値の場合の前記評価対象値とに基づいて、その候補の場合の評価対象値を算出する評価対象値算出手段と、前記候補毎に、前記機械学習結果毎の前記評価対象値のばらつきを用いて選択指標値を算出し、前記複数の候補各々の前記選択指標値を比較し、前記比較の結果に基づき前記複数の候補から候補を選択し、前記更新対象パラメータ値、前記更新対象パラメータ値の場合の評価対象値を、それぞれ、前記選択した候補、前記選択した候補の場合の評価対象値に更新する、更新後パラメータ値選択手段と、を備える。

　本発明の第４の態様によれば、解析方法は、コンピュータによって実施され、更新パラメータ値に応じて設定される更新後パラメータ値の複数の候補の各々について、前記更新対象パラメータ値とその候補とを複数の機械学習結果に適用して、前記更新対象パラメータ値の場合の評価対象値に対する、その候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得し、前記候補毎、かつ、前記機械学習結果毎に、前記評価対象値の相違の程度と、前記更新対象パラメータ値の場合の前記評価対象値とに基づいて、その候補の場合の評価対象値を算出し、前記候補毎に、前記機械学習結果毎の前記評価対象値のばらつきを用いて選択指標値を算出し、前記複数の候補各々の前記選択指標値を比較し、前記比較の結果に基づき前記複数の候補から候補を選択し、前記更新対象パラメータ値、前記更新対象パラメータ値の場合の評価対象値を、それぞれ、前記選択した候補、前記選択した候補の場合の評価対象値に更新する、ことを含む。

　本発明の第５の態様によれば、記録媒体は、コンピュータに、更新パラメータ値に応じて設定される更新後パラメータ値の複数の候補の各々について、前記更新対象パラメータ値とその候補とを複数の機械学習結果に適用して、前記更新対象パラメータ値の場合の評価対象値に対する、その候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得し、前記候補毎、かつ、前記機械学習結果毎に、前記評価対象値の相違の程度と、前記更新対象パラメータ値の場合の前記評価対象値とに基づいて、その候補の場合の評価対象値を算出し、前記候補毎に、前記機械学習結果毎の前記評価対象値のばらつきを用いて選択指標値を算出し、前記複数の候補各々の前記選択指標値を比較し、前記比較の結果に基づき前記複数の候補から候補を選択し、前記更新対象パラメータ値、前記更新対象パラメータ値の場合の評価対象値を、それぞれ、前記選択した候補、前記選択した候補の場合の評価対象値に更新する、ことを実行させるためのプログラムを記憶する。

　この発明の実施形態によれば、評価対象値のばらつきをパラメータ値の評価に反映させることができる。

第１実施形態に係る解析システムの装置構成の例を示す概略構成図である。第１実施形態に係る解析システムによる解析の対象の例を示す図である。第１実施形態に係る解析システムによる解析の対象におけるパラメータの設定例を示す図である。第１実施形態に係る解析システムにおけるパラメータ値の更新の例を示す図である。第１実施形態に係る解析装置によるパラメータ値の探索の例を示す図である。第１実施形態に係る機械学習装置の機能構成の例を示す概略ブロック図である。第１実施形態に係る解析装置の機能構成の例を示す概略ブロック図である。第１実施形態に係る機械学習装置が更新前後のパラメータ値と評価対象値の差分の割合Ｙとの関係を学習する処理手順の例を示すフローチャートである。第１実施形態に係る機械学習装置が訓練データを生成する処理手順の例を示すフローチャートである。第１実施形態に係る解析装置がパラメータ値を検索する処理手順の例を示すフローチャートである。第２実施形態に係る更新後パラメータ値選択部による更新後パラメータ値の候補の選択の例を示す図である。第２実施形態に係る機械学習装置が更新前後のパラメータ値と評価対象値の差分の割合との関係を学習する処理手順の例を示すフローチャートである。第２実施形態に係る解析装置がパラメータ値を検索する処理手順の例を示すフローチャートである。第３実施形態に係る解析装置の構成の例を示す図である。第４実施形態に係る機械学習装置の構成の例を示す図である。第５実施形態に係る解析システムの構成の例を示す図である。

　以下、本発明の実施形態を説明するが、以下の実施形態は請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

＜第１実施形態＞
　図１は、第１実施形態に係る解析システム１の装置構成の例を示す概略構成図である。図１に示す構成で、解析システム１は、機械学習装置１００と、解析装置２００とを備える。
　解析システム１は、パラメータを用いて表されている解析対象（例えば、設計対象）と、パラメータ値に応じて定まる評価対象値との関係を機械学習し、評価対象値が所定の条件を満たすためのパラメータ値を探索する。ここでいう評価対象値は、解析装置２００が探索にて取得するパラメータ値を、探索の解として評価するために用いられる値である。言い換えると、評価対象値は、解析対象に関して生じる事象のうち、注目している事象（注目事象）が定量的に評価された値を表す。また、パラメータは、例えば、解析対象に関する状態、または、解析対象における状態を表す情報である。解析対象は、例えば、図２に示すような流速問題である。注目している事象は、例えば、領域Ａ１２における流速である。図２の例の詳細については、後述する。

　機械学習装置１００は、解析対象のパラメータ値と評価対象値との関係を機械学習する。機械学習装置１００は、解析対象のパラメータ値の入力を受けて評価対象値を出力するシミュレータを用いて訓練データ（Training Data）を取得して機械学習を行う。
　解析装置２００は、機械学習にて得られた解析対象のパラメータ値と評価対象値との関係を用いて、評価対象値が所定の条件を満たすためのパラメータ値を探索する。所定の条件は、例えば、解析対象（例えば、設計対象）に関する所望の条件を定量的に表した数値である。解析装置２００を設計に適用する場合、所定の条件は、設計対象に関して所望の設計を行う場合に、注目している事象が定量的に評価された指標が満たしている条件を表す。
　機械学習装置１００及び解析装置２００は、いずれも、例えばパソコン（Personal Computer；ＰＣ）またはワークステーション（Workstation）等のコンピュータ（情報処理装置）を用いて構成される。機械学習装置１００と解析装置２００とが同一の装置として構成されていてもよいし、別々の装置として構成されていてもよい。

　図２は、解析システム１による解析の対象の例を示す図である。図２は、円柱Ｃ１１の配置を決定する設計問題を示している。
　図２に示す設計問題では、領域Ａ１１内に所定数（例えば、６個）の円柱Ｃ１１を配置する。この設計問題では、矢印Ｂ１１で示すように流体が流れており、領域Ａ１１の背後の領域Ａ１２における流体の平均流速が最大となるような円柱Ｃ１１の配置を決定する。すなわち、この例では、所望の設計は、領域Ａ１２における流体の平均流速が最大となる場合における円柱の配置を求める設計である。

　図３は、解析システム１による解析の対象におけるパラメータの設定例を示す図である。図２の領域Ａ１１内に格子を設定し、図３に示すように格子点に円柱Ｃ１１を配置する。格子点毎にバイナリ（Binary、「１」または「０」の２値）のパラメータ変数を設定し、このパラメータ変数を用いて格子点毎に円柱Ｃ１１の有無を示すことで、円柱Ｃ１１の配置を示すことができる。この例では、「１」は、格子点に円柱が配置されていることを表す。また、「０」は、格子点に円柱が配置されていないことを表す。

　図２及び図３に示す設計問題を解くために、領域Ａ１１内における円柱Ｃ１１の配置を決定した場合の、領域Ａ１２における流体の平均流速を算出するシミュレータを使用可能であるとする。
　この場合、設計問題を解く方法の１つとして、円柱Ｃ１１の全ての配置それぞれについて、領域Ａ１２における流体の平均流速をシミュレータで算出して、平均流速が最大となる配置を求める、いわば全解探索法が考えられる。しかしながらこの方法では、格子点の数が増えるにつれて、いわゆる組み合わせ爆発が生じてシミュレーションの実行回数が膨大になり、現実的な時間内に設計問題を解けないことが考えられる。

　そこで、解析システム１では、機械学習装置１００が、シミュレーションにおける入力と出力との関係を機械学習する。解析装置２００が、機械学習装置１００による学習結果（学習モデル、スコア関数等）を用いることで、解析装置２００の処理実行時にはシミュレーションの実行が不要となる。これにより、解析システム１全体の処理時間を短縮することができる。学習結果（学習モデル、スコア関数等）は、シミュレーションにおける入力と出力との関係性を表す。たとえば、学習結果（学習モデル、スコア関数等）は、あらかじめ、シミュレーションにおける入力と、シミュレーションにおける出力とに対して機械学習アルゴリズムを適用することによって、作成される。機械学習アルゴリズムとして、たとえば、ニューラルネットワーク、サポートベクターマシン等の手法を用いることができる。
　解析システム１は、パラメータで表現可能、かつ、シミュレーションの実行を機械学習可能ないろいろな問題を扱うことができ、この点で、解析システム１の処理対象が広い。上記の設計問題のように、解析システム１を設計に用いることができるが、これに限定されない。

　図４は、解析システム１におけるパラメータ値の更新の例を示す図である。
　上記のように所定の個数の円柱Ｃ１１を格子点に配置した状態で、円柱Ｃ１１の配置変更の１ステップでは、１つの円柱Ｃ１１の配置を変更する。この変更は、図４において、矢印Ｂ１２によって表されている。この１ステップは、格子点毎のパラメータのうち、円柱Ｃ１１が配置されていた格子点のパラメータ値を「１」から「０」に変更し、円柱Ｃ１１が新たに配置される格子点のパラメータ値を「０」から「１」に変更することで示される。

　図５は、解析装置２００によるパラメータ値の探索の例を示す図である。
　図５における丸の各々は、パラメータ値によって示される解析対象の状態を示している。パラメータ値によって示される解析対象の状態を、単に状態と称する。パラメータ値と状態とは一対一に対応付けられる。図５では、状態ｓ１～ｓ１３が示されている。
　解析装置２００は、初期設定において、所定の個数の円柱Ｃ１１を格子点に例えばランダムに配置する。図５では、この初期設定における状態を状態ｓ１で示している。

　解析装置２００は、上述した円柱Ｃ１１の配置変更の１ステップの条件を満たすように円柱Ｃ１１の配置をランダムに変更して、更新後の状態の候補を複数生成する。更新後の状態の候補は、更新後のパラメータ値の候補と一対一に対応付けられる。以下では、更新後の状態の候補と更新後のパラメータ値の候補とを同一視し、単に候補とも称する。
　図５では、解析装置２００が更新後の状態の候補を３つずつ生成する場合の例を示している。解析装置２００は、状態ｓ１からの更新の候補として、状態ｓ２、ｓ３、ｓ４の３つの状態を生成している。

　解析装置２００は、生成した候補の各々について、機械学習装置１００による機械学習結果を用いて評価対象値を算出し、得られた評価対象値を選択指標値として用いて、候補のうち何れか１つを選択する。ここでいう選択指標値は、解析装置２００が候補のうち何れか１つを選択するために用いられる値である。解析装置２００は、候補毎に選択指標値を算出する。図５の例では、解析装置２００は、状態ｓ２、ｓ３、ｓ４のうち状態ｓ２を選択している。
　第１実施形態では、解析装置２００は、生成した候補のうち選択指標値での評価が最も高い候補を選択する。上記の設計問題の場合、領域Ａ１２における流体の平均流速が評価対象値となっている。この例では、選択指標値が評価対象値であるため、解析装置２００は、この平均流速が最も速い候補を選択する。

　解析装置２００は、更新後の状態の候補の生成および選択を繰り返すことでパラメータ値の探索を行う。解析装置２００は更新後の状態の候補の生成および選択を、所定の終了条件が成立するまで繰り返す。例えば上記の設計問題で、解析装置２００は、領域Ａ１２における流体の平均流速が所定の閾値以上になるまで更新後の状態の候補の生成および選択を繰り返す。
　図５の例では、状態ｓ１１において終了条件が成立しており、解析装置２００は、状態ｓ１１におけるパラメータ値を処理結果として取得している。

　図６は、機械学習装置１００の機能構成の例を示す概略ブロック図である。図６に示す構成で、機械学習装置１００は、学習側通信部１１０と、学習側記憶部１８０と、学習側制御部１９０とを備える。学習側制御部１９０は、パラメータ値取得部１９１と、シミュレーション実行部１９２と、相違算出部１９３と、機械学習処理部１９４とを備える。

　学習側通信部１１０は、他の装置と通信を行う。学習側通信部１１０が、機械学習装置１００による学習結果を、解析装置２００へ送信するようにしてもよい。
　学習側記憶部１８０は、各種データを記憶する。学習側記憶部１８０は、機械学習装置１００が備える記憶デバイスを用いて構成される。
　学習側制御部１９０は、機械学習装置１００の各部を制御して各種処理を行う。学習側制御部１９０の機能は、機械学習装置１００が備えるＣＰＵ（Central Processing Unit、中央処理装置）が、学習側記憶部１８０からプログラムを読み出して実行することで実行可能になる。

　パラメータ値取得部１９１は、更新対象パラメータ値および更新後パラメータ値を取得する。更新対象パラメータ値、更新後パラメータ値の何れも、解析装置２００が対象としている問題におけるパラメータが取り得る値である。更新対象パラメータ値および更新後パラメータ値は、機械学習装置１００が機械学習を行うための訓練データの一部となる。
　パラメータ値取得部１９１が、パラメータ値設定の条件に従って更新対象パラメータ値をランダムに設定するようにしてもよい。また、パラメータ値取得部１９１が、パラメータ値更新の条件に従って、更新対象パラメータ値をランダムに更新して更新後パラメータ値を生成するようにしてもよい。

　あるいは、パラメータ値取得部１９１が、予め定められている更新対象パラメータ値及び更新後パラメータ値を取得するようにしてもよい。例えば、学習側記憶部１８０が、ユーザ設定による更新対象パラメータ値及び更新後パラメータ値を記憶しておき、パラメータ値取得部１９１が、学習側記憶部１８０から更新対象パラメータ値及び更新後パラメータ値を読み出すようにしてもよい。

　シミュレーション実行部１９２は、更新対象パラメータ値、更新後パラメータ値それぞれの場合の評価対象値をシミュレーションで算出する。この場合、評価対象値はシミュレーション出力（シミュレーションによる予測結果）として得られる。
　相違算出部１９３は、更新対象パラメータ値の場合の評価対象値に対する、更新後パラメータ値の場合の評価対象値の相違（差異）の程度を算出する。具体的には、相違算出部１９３は、例えば、更新後パラメータ値の場合の評価対象値から更新対象パラメータ値の場合の評価対象値を減算した差分を算出する。さらに、相違算出部１９３は、算出した差分を、更新対象パラメータ値の場合の評価対象値で除算することで正規化（normalization、規格化）を行う。正規化後の値を、評価対象値の差分の割合と称する。

　機械学習処理部１９４は、更新対象パラメータ値および更新後パラメータ値と、評価対象値の相違の程度との関係を機械学習する。具体的には、機械学習処理部１９４は、更新対象パラメータ値および更新後パラメータ値と、評価対象値の差分の割合との関係を機械学習する。
　機械学習処理部１９４が用いる機械学習手法は、特定の手法に限定されない。例えば、機械学習処理部１９４が、いわゆる深層学習（Deep Learning）等の手法によって機械学習を行うようにしてもよいが、これに限定されない。

　図７は、解析装置２００の機能構成の例を示す概略ブロック図である。図７に示す構成で、解析装置２００は、解析側通信部２１０と、解析側記憶部２８０と、解析側制御部２９０とを備える。解析側制御部２９０は、初期値取得部２９１と、更新後候補設定部２９２と、相違情報取得部２９３と、評価対象値算出部２９４と、更新後パラメータ値選択部２９５と、終了条件判定部２９６とを備える。

　解析側通信部２１０は、他の装置と通信を行う。解析側通信部２１０が、学習側通信部１１０が送信する機械学習装置１００による学習結果を受信するようにしてもよい。
　解析側記憶部２８０は、各種データを記憶する。解析側記憶部２８０は、解析装置２００が備える記憶デバイスを用いて構成される。
　解析側制御部２９０の機能は、解析装置２００の各部を制御して各種処理を行う。解析側制御部２９０は、解析装置２００が備えるＣＰＵが、解析側記憶部２８０からプログラムを読み出して実行することで実行可能になる。

　初期値取得部２９１は、更新対象パラメータ値と、その更新対象パラメータ値の場合の評価対象値とを取得する。初期値取得部２９１が取得する更新対象パラメータ値は、解析装置２００がパラメータ値を探索する際の、パラメータの初期値として用いられる。初期値取得部２９１が取得する更新対象パラメータ値の場合の評価対象値は、機械学習装置１００による学習結果から得られる評価対象値の差分の割合を評価対象値に換算するために用いられる。初期値取得部２９１は、例えば、機械学習装置１００のシミュレーション実行部１９２によるシミュレーションを利用して、更新対象パラメータ値の場合の評価対象値を取得する。

　初期値取得部２９１が、更新対象パラメータ値と、その更新対象パラメータ値の場合の評価対象値との組み合わせを複数取得するようにしてもよい。
　解析装置２００が、これら複数の更新対象パラメータ値の各々について、その更新対象パラメータ値をパラメータの初期値としてパラメータ値の探索を行うことで、一部の探索で局所解に陥った場合でも、他の探索で、評価対象値による評価がより高い解（パラメータ値）を得られると期待される。

　更新後候補設定部２９２は、更新後パラメータ値の候補を複数設定する。更新後候補設定部２９２は、パラメータ値更新の条件に従い、例えば、更新対象パラメータ値をランダムに更新して更新後パラメータ値の候補を設定する。
　相違情報取得部２９３は、更新後パラメータ値の候補毎に、更新対象パラメータ値とその更新後パラメータ値の候補とを機械学習装置１００による機械学習結果に適用して、更新対象パラメータ値の場合の評価対象値に対する、その更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報を取得する。具体的には、相違情報取得部２９３は、例えば、評価対象値の差分の割合を取得する。但し、ここでの評価対象値の相違の程度は、評価対象値の差分の割合に限定されない。例えば、相違情報取得部２９３が、評価対象値の相違の程度を示す情報として、更新後パラメータ値の候補の場合の評価対象値から、更新対象パラメータ値の候補の場合の評価値を減算した差分を示す情報を取得するようにしてもよい。あるいは、相違情報取得部２９３が、評価対象値の相違の程度を示す情報として、更新後パラメータ値の候補の場合の評価対象値を、更新対象パラメータ値の候補の場合の評価値で除算した比を示す情報を取得するようにしてもよい。
　更新対象パラメータ値の場合の評価対象値に対する、更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報を、相違情報と称する。

　評価対象値算出部２９４は、更新後パラメータ値の候補毎に、評価対象値の差分の割合と、更新対象パラメータ値の場合の評価対象値とに基づいて、その更新後パラメータ値の候補の場合の評価対象値を算出する。
　更新後パラメータ値選択部２９５は、更新後パラメータ値の候補のうち、評価対象値が目標に最も合致する候補を選択し、更新対象パラメータ値、更新対象パラメータ値の場合の評価対象値を、それぞれ、選択した候補、選択した候補の場合の評価対象値に更新する。言い換えると、更新後パラメータ値選択部２９５は、候補に関して算出した評価対象値を比較し、比較結果に基づき候補を選択し、更新対象パラメータ値、更新対象パラメータ値の場合の評価対象値を、それぞれ、選択した候補、選択した候補の場合の評価対象値に更新する。

　終了条件判定部２９６は、更新対象パラメータ値の場合の評価対象値が所定の終了条件を満たすか否かを判定する。
　解析側制御部２９０は、繰り返し制御部の例に該当し、更新対象パラメータ値の場合の評価対象値が所定の終了条件を満たさないと終了条件判定部２９６が判定した場合、更新後候補設定部２９２の処理およびそれ以降の処理を繰り返し行わせる。

　ここでいう更新後候補設定部２９２の処理およびそれ以降の処理は、図１０を参照して後述するように、以下の処理（１Ａ）～（６Ａ）を含む。
（１Ａ）更新後候補設定部２９２が、更新後パラメータ値の候補を複数設定する。
（２Ａ）相違情報取得部２９３が、更新後パラメータ値の候補毎に、更新対象パラメータ値と、その更新後パラメータ値の候補とを機械学習結果に適用して、更新対象パラメータ値の場合の評価対象値に対する、その更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報を取得する。
（３Ａ）評価対象値算出部２９４が、更新後パラメータ値の候補毎に、評価対象値の相違の程度と、更新対象パラメータ値の場合の評価対象値とに基づいて、その更新後パラメータ値の候補の場合の評価対象値を算出する。
（４Ａ）更新後パラメータ値選択部２９５が、更新後パラメータ値の候補のうち、選択指標値（この例では、評価対象値）が目標に最も合致する候補を選択し、更新対象パラメータ値、更新対象パラメータ値の場合の評価対象値を、それぞれ、選択した更新後パラメータ値の候補、選択した更新後パラメータ値の候補の場合の評価対象値に更新する。
（５Ａ）終了条件判定部２９６が、更新対象パラメータ値の場合の評価対象値が所定の終了条件を満たすか否かを判定する。
（６Ａ）解析側制御部２９０が、上記（５Ａ）で終了条件判定部２９６が、更新対象パラメータ値の場合の評価対象値が所定の終了条件を満たすと判定するまで（１Ａ）～（６Ａ）の処理を繰り返し行わせる。

　ここで、解析システム１が行う処理を定式化する。
　解析対象が有するパラメータの値をＸで示す。パラメータ値Ｘは複数のパラメータ値の組み合わせであってもよく、ベクトルで示される。パラメータ値Ｘの要素、すなわち、個々のパラメータ値をｂ_１、ｂ_２、・・・、ｂ_ｎ（ｎは、パラメータの個数を示す正の整数）と表記する。パラメータ値Ｘは、式（１）のようにベクトルで示される。

　シミュレーション実行部１９２のシミュレータにパラメータ値Ｘを入力した場合のシミュレーション出力をＹ_ｓｉｍと表記する。シミュレーション出力Ｙ_ｓｉｍは、式（２）のように示される。

　Ｆ_ｓｉｍは、シミュレーション実行部１９２が実行するシミュレーションを関数として模式的に表したものである。
　パラメータ値Ｘを更新したパラメータ値をパラメータ値Ｘ’と表記する。パラメータ値Ｘは、更新対象パラメータ値に該当する。パラメータ値Ｘ’は、更新後パラメータ値に該当する。パラメータ値Ｘ’は、パラメータ値の更新について予め定められている更新の条件（制約条件）に従って、パラメータ値Ｘを更新して得られる。
　パラメータ値Ｘ’は、パラメータ値Ｘの場合と同様、ベクトルで示される。パラメータ値Ｘ’の要素、すなわち、個々のパラメータ値をｂ’_１、ｂ’_２、・・・、ｂ’_ｎ（ｎは、パラメータの個数を示す正の整数）と表記する。パラメータ値Ｘ’は、式（３）のようにベクトルで示される。

　シミュレーション実行部１９２のシミュレータにパラメータ値Ｘ’を入力した場合のシミュレーション出力をＹ’_ｓｉｍと表記する。シミュレーション出力Ｙ’_ｓｉｍは、式（４）のように示される。

　シミュレーション出力Ｙ_ｓｉｍに対するシミュレーション出力Ｙ’_ｓｉｍの差分は、例えば、Ｙ’_ｓｉｍ－Ｙ_ｓｉｍと表される。
　この差分をＹ_ｓｉｍで除算することで正規化した値を、評価対象値の差分の割合Ｙと表記する。評価対象値の差分の割合Ｙは、式（５）のように示される。

　機械学習処理部１９４が行う学習結果に基づく予測値をμ_ｓｕｒと表記する。μ_ｓｕｒは、式（６）のように示される。予測値μ_ｓｕｒとして、評価対象値の差分の割合が得られる。

　Ｆ_ｓｕｒは、相違情報取得部２９３が用いる学習結果を関数として表したものである。式（６）は、パラメータ値Ｘ及び更新後のパラメータ値Ｘ’を学習結果（学習モデル、スコア関数）に入力して、予測値μ_ｓｕｒを得られることを示している。

　以上の定式化を用いて、図３～図５の設計問題の例を式で示す。
　上記のように、この場合のパラメータ値Ｘの要素（個々のパラメータ値ｂ_ｉ）としてバイナリを用いる。「１≦ｉ≦ｎ（ｎはパラメータの個数を示す正の整数）」として、個々のパラメータ値ｂ_ｉは、式（７）のように示される。

　個々のパラメータ値ｂ_ｉは、「ｉ」で示される位置（この例では格子点）における円筒の有無を示す。ｂ_ｉの値が０である場合（ｂ_ｉ＝０）、「ｉ」で示される位置に円筒が配置されていないことを示す。ｂ_ｉの値が１である場合（ｂ_ｉ＝１）、「ｉ」で示される位置に円筒が配置されていることを示す。
　「ｉ」で示される位置を、ｉの位置と表記する。
　円筒の個数が一定であるとの制約条件は、式（８）のように示される。

　Ｍは、円筒の個数を示す正の整数定数である。
　ここでは、パラメータ値を更新する際の制約条件は、円筒のうちいずれか１つを移動させることである。ｉの位置の円筒をｊの位置に移動させた場合、更新後のパラメータ値Ｘ’は、式（９）のように示される。

　式（１）と、式（９）とを比較すると、ｂ_ｉとｂ_ｊとが、この移動に応じて入れ換えられている。このように設計問題など解析対象を、パラメータを用いて表すことで、解析システム１が解析を行うことができる。
　次に、図８～図１０を参照して、解析システム１の動作について説明する。
　図８は、機械学習装置１００が更新前後のパラメータ値と評価対象値の差分の割合Ｙとの関係を学習する処理手順の例を示すフローチャートである。
　図８の処理で、学習側制御部１９０は、予め定められている訓練データの個数の分だけ処理を繰り返すループＬ１１を開始する（ステップＳ１１１）。

　ループＬ１１の処理で、学習側制御部１９０は、訓練データを生成する（ステップＳ１１２）。
　ステップＳ１１２の後、学習側制御部１９０は、ループＬ１１の終端処理を行う（ステップＳ１１３）。具体的には、学習側制御部１９０は、ループＬ１１の処理の繰り返し回数が、予め定められている訓練データの個数分に到達したか否かを判定する。繰り返し回数が訓練データの個数分に到達していないと判定した場合、学習側制御部１９０は、引き続きループＬ１１の処理を繰り返す。一方、繰り返し回数が訓練データの個数分に到達したと判定した場合、学習側制御部１９０は、ループＬ１１を終了する。

　ループＬ１１を終了した場合、学習側制御部１９０は、訓練データの個数の分だけ処理を繰り返すループＬ１２を開始する（ステップＳ１１４）。
　ループＬ１２の処理で、機械学習処理部１９４は、得られた訓練データを用いて機械学習を行う（ステップＳ１１５）。
　ステップＳ１１５の後、学習側制御部１９０は、ループＬ１２の終端処理を行う（ステップＳ１１６）。具体的には、学習側制御部１９０は、ループＬ１２の処理の繰り返し回数が、予め定められている訓練データの個数分に到達したか否かを判定する。繰り返し回数が訓練データの個数分に到達していないと判定した場合、学習側制御部１９０は、引き続きループＬ１２の処理を繰り返す。一方、繰り返し回数が訓練データの個数分に到達したと判定した場合、学習側制御部１９０は、ループＬ１２を終了する。
　ループＬ１２の処理の終了後、機械学習装置１００は、図８の処理を終了する。

　図９は、機械学習装置１００が訓練データを生成する処理手順の例を示すフローチャートである。機械学習装置１００は、図８のステップＳ１１２で図９の処理を行う。
　図９の処理で、パラメータ値取得部１９１は、パラメータ値Ｘを取得する（ステップＳ２１１）。パラメータ値取得部１９１が、パラメータ値Ｘをランダムに設定するなど、パラメータ値Ｘを自動生成するようにしてもよい。あるいは、パラメータ値Ｘを入力するユーザ操作に基づいて、パラメータ値取得部１９１がパラメータ値Ｘを生成するようにしてもよい。あるいは、パラメータ値取得部１９１が、学習側通信部１１０を介して他の装置からパラメータ値Ｘを取得するようにしてもよい。

　次に、パラメータ値取得部１９１は、パラメータ値Ｘ’を取得する（ステップＳ２１２）。パラメータ値取得部１９１が、パラメータ値の更新の条件の範囲内でパラメータ値Ｘをランダムに更新するなど、パラメータ値Ｘ’を自動生成するようにしてもよい。あるいは、パラメータ値Ｘ’を入力するユーザ操作に基づいて、パラメータ値取得部１９１がパラメータ値Ｘ’を生成するようにしてもよい。あるいは、パラメータ値取得部１９１が、学習側通信部１１０を介して他の装置からパラメータ値Ｘ’を取得するようにしてもよい。

　次に、シミュレーション実行部１９２は、パラメータ値Ｘを用いてシミュレーションを実行する（ステップＳ２１３）。具体的には、シミュレーション実行部１９２は、シミュレーション実行部１９２自らが有するシミュレータにパラメータ値Ｘを入力してシミュレーションを実行し、パラメータ値Ｘの場合のシミュレーション出力Ｙ_ｓｉｍを算出する。
　さらに、シミュレーション実行部１９２は、パラメータ値Ｘ’を用いてシミュレーションを実行する（ステップＳ２１４）。具体的には、シミュレーション実行部１９２は、シミュレーション実行部１９２自らが有するシミュレータにパラメータ値Ｘ’を入力してシミュレーションを実行し、パラメータ値Ｘ’の場合のシミュレーション出力Ｙ’_ｓｉｍを算出する。

　次に、相違算出部１９３は、評価対象値の差分の割合Ｙを算出する（ステップＳ２１５）。具体的には、相違算出部１９３は、シミュレーション出力Ｙ_ｓｉｍ及びシミュレーション出力Ｙ’_ｓｉｍを用いて上記の式（５）の演算を行って、評価対象値の差分の割合Ｙを算出する。
　そして、学習側制御部１９０は、パラメータ値Ｘ、パラメータ値Ｘ’、及び評価対象値の差分の割合Ｙを１つに纏めた訓練データを生成する（ステップＳ２１６）。
　ステップＳ２１６の後、機械学習装置１００は、図９の処理を終了し、図８の処理へ戻る。

　図１０は、解析装置２００がパラメータ値を検索する処理手順の例を示すフローチャートである。
　図１０の処理で、初期値取得部２９１は、パラメータの初期値を設定する（ステップＳ３１１）。初期値取得部２９１は、例えばパラメータの初期値をランダムに設定するなど、パラメータの初期値を自動設定する。あるいは、パラメータの初期値を入力するユーザ操作に基づいて、初期値取得部２９１がパラメータの初期値を設定するようにしてもよい。あるいは、初期値取得部２９１が、解析側通信部２１０を介して他の装置からパラメータの初期値を取得するようにしてもよい。
　パラメータの初期値は、更新対象パラメータ値として用いられる。

　次に、更新後候補設定部２９２は、更新後パラメータ値の候補を複数設定する（ステップＳ３１２）。更新後候補設定部２９２は、パラメータ値の更新の条件の範囲内で更新対象パラメータ値をランダムに更新するなど、更新後パラメータ値の候補を自動生成する。
　次に、解析側制御部２９０は、更新後パラメータ値の候補毎に処理を行うループＬ３１を開始する（ステップＳ３１３）。

　ループＬ３１の処理で、相違情報取得部２９３は、更新対象パラメータ値の場合の評価対象値に対する、更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報を取得する（ステップＳ３１４）。具体的には、相違情報取得部２９３は、更新対象パラメータ値と更新後パラメータ値の候補とを機械学習結果に適用して、評価対象値の差分の割合を取得する。
　さらに評価対象値算出部２９４は、得られた評価対象値の差分の割合と、更新対象パラメータ値の場合の評価対象値とに基づいて、更新後パラメータ値の候補の場合の評価対象値を算出する（ステップＳ３１５）。

　次に、解析側制御部２９０は、ループＬ３１の終端処理を行う（ステップＳ３１６）。具体的には、解析側制御部２９０は、更新後パラメータ値の候補全てに対してループＬ３１の処理を行ったか否かを判定する。未処理の候補があると判定した場合、解析側制御部２９０は、引き続きループＬ３１の処理を繰り返す。一方、全ての候補に対してループＬ３１の処理を実行済であると判定した場合、解析側制御部２９０は、ループＬ３１を終了する。

　ループＬ３１を終了した場合、更新後パラメータ値選択部２９５は、更新後パラメータ値の候補のうちいずれかを選択する（ステップＳ３１７）。例えば、更新後パラメータ値選択部２９５は、相違情報取得部２９３が更新後パラメータ値の候補毎に算出した評価対象値（この例では、選択指標値）に基づいて、評価対象値（この例では、選択指標値）が予め定められた目標値を満たす候補、または、評価対象値が目標値に最も近い候補を１つ選択する。

　次に、終了条件判定部２９６は、パラメータ値の探索の終了条件が成立しているか否かを判定する（ステップＳ３１８）。例えば、終了条件判定部２９６は、ステップＳ３１７で選択されたパラメータ値の場合の評価対象値が目標値を満たすか否かを判定し、目標値を満たすと判定した場合に、パラメータ値の探索の終了条件が成立していると判定する。
　パラメータ値の探索の終了条件が成立していないと終了条件判定部２９６が判定した場合（ステップＳ３１８：ＮＯ）、処理がステップＳ３１２へ遷移する。

　一方、パラメータ値の探索の終了条件が成立していると終了条件判定部２９６が判定した場合（ステップＳ３１８：ＹＥＳ）、解析装置２００は、処理結果を出力する（ステップＳ３１９）。具体的には、解析装置２００は、目標値を満たす評価対象値と、そのときのパラメータ値とを処理結果としてユーザに提示する。
　解析装置２００が処理結果を出力する方法は、特定の方法に限定されない。例えば、解析装置２００が表示装置を備えて、処理結果を表示するようにしてもよい。あるいは解析側通信部２１０が、処理結果を他の装置へ送信するようにしてもよい。
　ステップＳ３１９の後、解析装置２００は、図１０の処理を終了する。

　以上のように、相違情報取得部２９３は、更新対象パラメータ値に応じて設定される複数の更新後パラメータ値の候補の各々について、更新対象パラメータ値とその更新後パラメータ値の候補とを機械学習結果に適用して、更新対象パラメータ値の場合の評価対象値に対する、その更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報を取得する。評価対象値算出部２９４は、更新後パラメータ値の候補毎に、評価対象値の相違の程度と、更新対象パラメータ値の場合の評価対象値とに基づいて、その候補の場合の評価対象値を算出する。更新後パラメータ値選択部２９５は、更新後パラメータ値の候補のうち、評価対象値（この例では、評価対象値を選択指標値として用いる）が目標に最も合致する候補を選択し、更新対象パラメータ値、更新対象パラメータ値の場合の評価対象値を、それぞれ、選択した候補、選択した候補の場合の評価対象値に更新する。言い換えると、更新後パラメータ値選択部２９５は、更新後パラメータ値の候補に関して算出された評価対象値を比較し、比較結果に基づき候補を選択し、更新対象パラメータ値、更新対象パラメータ値の場合の評価対象値を、それぞれ、選択した候補、選択した候補の場合の評価対象値に更新する。

　このように、解析装置２００によれば、パラメータ値の設定による複数のパターンの中から評価の高いものを選択する場合に機械学習結果を用いて候補の選択を行うことで、候補の選択の際にシミュレーションを実行する必要がない。解析装置２００によれば、この点で、複数のパターンの中から評価の高いものを選択する解析を、効率的に行うことができる。特に、解析装置２００が機械学習結果を用いて評価対象値を取得する点で、シミュレーションを実行する場合よりも処理時間が短くて済む。
　また、解析装置２００は、パラメータ値の更新前後における評価対象値の相違の程度を示す情報を機械学習結果から取得する。解析装置２００は、パラメータを有するいろいろな解析対象に対して解析を行うことができ、汎用性が比較的高い。また、解析装置２００が、評価対象値の相違の程度という相対的な値を機械学習結果から取得する点で、更新後パラメータ値の候補の場合の評価対象値を算出する際に、更新対象パラメータ値の場合の評価対象値を反映させることができる。パラメータ値の更新前後の評価対象値の相違の程度には比較的強い関係性（例えば、相関性）があると考えられ、解析装置２００によれば、この点で、評価対象値をより高精度に算出することができ、解析をより高精度に行うことができる。

　また、相違情報取得部２９３は、評価対象値の相違の程度を示す情報として、更新対象パラメータ値の場合の評価対象値に対する更新後パラメータ値の候補の場合の評価対象値の差分を、更新対象パラメータ値の場合の評価対象値で除算する正規化を行った値を取得する。
　解析装置２００が、正規化された評価対象値の差分を用いて更新後パラメータ値の候補の場合の評価対象値を算出することで、正規化されていないデータを用いる場合よりも、更新対象パラメータ値の場合の評価対象値の大きさを、更新後パラメータ値の候補の場合の評価対象値の大きさに、より強く反映させることができる。パラメータ値の更新前後の評価対象値には比較的強い関係性（例えば、相関性）があると考えられ、解析装置２００によれば、この点で、評価対象値をより高精度に算出することができる。

　但し、解析システム１が、更新対象パラメータ値の場合の評価対象値に対する、更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報として、更新対象パラメータ値の場合の評価対象値に対する更新後パラメータ値の候補の場合の評価対象値の差分を、更新対象パラメータ値の場合の評価対象値で除算する正規化を行った値以外の値を用いるようにしてもよい。
　例えば、解析システム１が、更新対象パラメータ値の場合の評価対象値に対する、更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報として、更新対象パラメータ値の場合の評価対象値と、更新後パラメータ値の候補の場合の評価対象値との比を用いるようにしてもよい。
　あるいは、解析システム１が、更新対象パラメータ値の場合の評価対象値に対する、更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報として、更新対象パラメータ値の場合の評価対象値と、更新後パラメータ値の候補の場合の評価対象値との差分を用いるようにしてもよい。

　また、パラメータ値取得部１９１は、更新対象パラメータ値および更新後パラメータ値を取得する。シミュレーション実行部１９２は、更新対象パラメータ値、更新後パラメータ値それぞれの場合の評価対象値をシミュレーションで算出する。相違算出部１９３は、更新対象パラメータ値の場合の評価対象値に対する、更新後パラメータ値の場合の評価対象値の相違の程度を算出する。機械学習処理部１９４は、更新対象パラメータ値および更新後パラメータ値と、評価対象値の相違の程度との関係を機械学習する。
　このように機械学習装置１００が、評価対象値の相違の程度について機械学習を行うことで、評価対象値の相違の程度を出力する機械学習結果を解析装置２００に提供できる。
解析装置２００は、この機械学習結果を用いて、上記のように解析を行うことができる。

＜第２実施形態＞
　第２実施形態における解析システム１、機械学習装置１００、解析装置２００の各々の構成は第１実施形態の場合と同様である。
　第２実施形態では、解析装置２００の更新後パラメータ値選択部２９５が、更新後パラメータ値の候補のうち何れか１つを選択する方法が第１実施形態の場合と異なる。第２実施形態に係る更新後パラメータ値選択部２９５は、更新後パラメータ値の候補毎に評価対象値のばらつきを算出し、得られたばらつきを用いて選択指標値を算出して候補の選択を行う。以下では、更新後パラメータ値選択部２９５が、評価対象値のばらつきとして分散を用いる場合を例に説明するが、これに限定されない。例えば、更新後パラメータ値選択部２９５が、評価対象値のばらつきとして標準偏差を用いるようにしてもよい。

　更新後パラメータ値選択部２９５による候補の選択方法を実現するために、機械学習装置１００は、複数の学習モデルを生成する。
　ここでいう学習モデルは、機械学習の結果である。機械学習装置１００が生成する学習モデルの各々が、更新前のパラメータ値および更新後パラメータ値の入力を受けて、評価対象値の差分の割合を出力する。
　また、更新後パラメータ値選択部２９５による候補の選択方法を実現するために、相違情報取得部２９３は、機械学習装置１００が生成した学習モデル毎に評価対象値の差分の割合を取得する。
　それ以外の点では、第２実施形態に係る解析システム１は、第１実施形態の場合と同様である。

　機械学習装置１００は、複数の学習モデルを生成するために、異なる訓練データセットを生成する。ここでいう訓練データセットは、１つの学習モデルに用いられる訓練データの一纏まりである。機械学習装置１００が、１つの訓練データセットに関して、相互に異なる複数の学習モデルを作成するようにしてもよい。このような機械学習装置１００は、例えば、与えられた訓練データセットから訓練サンプルをランダムに複数選び出し、選び出した複数の訓練サンプルについて学習モデルを作成するという処理を複数回繰り返すことによって実現することができる。
　訓練データセットに含まれる個々の訓練データは、訓練データセット毎に異なる。これにより、機械学習装置１００が生成する複数の学習モデルは、同じ値の入力を受けて学習モデル毎に異なる値を出力する。これにより学習モデルの出力の分散を算出することができ、この分散を更新後パラメータ値の候補から何れかを選択するために用いることができる。
　機械学習装置１００が生成する訓練データの数は、学習モデル毎に異なっていてもよい。あるいは、機械学習装置１００が、全ての学習モデル用に同数の訓練データを生成するようにしてもよい。

　図１１は、第２実施形態に係る更新後パラメータ値選択部２９５による更新後パラメータ値の候補の選択の例を示す図である。
　図１１において、ｉは、パラメータ値の更新回数にて探索の進行を示す。パラメータの更新回数をＬ（）で示す。例えば、ｉ回目のパラメータ値の更新を「Ｌ（ｉ）」と表記する。
　図１１において、ｊは、同じパラメータ値の更新回数における状態を識別するためのインデックスである。上述したように状態の各々は、パラメータ値が設定された状態であり、パラメータ値と対応付けられる。

　図１１は、状態ｓ_{ｉ－１，１}におけるパラメータ値から、状態ｓ_ｉ，１におけるパラメータ値および状態ｓ_ｉ，２におけるパラメータ値のうち何れかに更新する場合の例を示している。
　また、図１１は、パラメータ値の更新の先読みを行って、Ｌ（ｉ）における状態の選択を、Ｌ（ｉ＋２）における状態の情報に基づいて行う場合の例を示している。
　以下では、状態選択対象となるパラメータ値の更新回数を深さＬ（ｉ）と表記する。従って、パラメータ値の更新前における更新回数は深さＬ（ｉ－１）と示される。また、先読みの対象となるパラメータ値の更新回数を深さＬ（Ｎ）で表す。図１１の例では、「Ｌ（Ｎ）＝Ｌ（ｉ＋２）」である。

　第２実施形態では、相違情報取得部２９３は、１つの状態におけるパラメータ値について、複数の学習モデルを用いて学習モデルの個数分だけ評価対象値の差分の割合を算出する。先読み先の状態が複数ある場合、相違情報取得部２９３は、「状態数×学習モデル」の個数の評価対象値の差分の割合を算出する。
　評価対象値算出部２９４は、相違情報取得部２９３が算出する評価対象値の差分の割合毎に、評価対象値を算出する。評価対象値算出部２９４は、評価対象値の差分の割合に、親ノードに相当する状態における評価対象値を乗算することで、差分の割合を差分に換算する。そして、評価対象値算出部２９４は、得られた差分を親ノードに相当する状態における評価対象値に加算することで、評価対象値を算出する。ここでいう親ノードに相当する状態は、深さ方向（ｉの方向）における直前の状態である。
　相違情報取得部２９３が差分の割合を算出する場合に、評価対象値算出部２９４が評価対象値を算出する処理は、式（１０）のように示される。

　Ｇ（Ｓ_ｉ，ｊ）は、算出対象の評価対象値（例えば、更新後パラメータ値の候補の場合の評価対象値）を示す。Ｇ（Ｓ_{ｉ－１，Ｌ}）は、評価対象値算出対象の状態の親ノードに相当する状態における評価対象値（例えば、更新対象パラメータ値の場合の評価対象値）を示す。Ｌは、何らかの定数を示す。
　μ_ｓｕｒ（ｓ_{ｉ－１，Ｌ}，Ｓ_ｉ，ｊ）は、評価対象値の差分の割合を示す。
　評価対象値算出部２９４が評価対象値を算出する処理は、相違情報取得部２９３における処理に依存して決定される。例えば、相違情報取得部２９３が差分によって相違情報を作成する場合、評価対象値算出部２９４は、その相違情報と、親ノードに相当する状態における評価対象値との和を算出する。例えば、相違情報取得部２９３が比によって相違情報を作成する場合、評価対象値算出部２９４は、その相違情報と、親ノードに相当する状態における評価対象値との積を算出する。

　更新後パラメータ値選択部２９５は、評価対象値算出部２９４が算出した評価対象値について、更新後パラメータ値の候補毎に、先読み対象の状態のうち子孫に相当する状態における評価対象値の平均値および分散を算出する。図１１の例の場合、更新後パラメータ値選択部２９５は、状態ｓ_ｉ，１における選択指標値の算出のために、状態ｓ_{ｉ＋２，１}、ｓ_{ｉ＋２，２}、および、ｓ_{ｉ＋２，３}で得られる全ての評価対象値の平均及び分散を算出する。また、更新後パラメータ値選択部２９５は、状態ｓ_ｉ，２における選択指標値の算出のために、状態ｓ_{ｉ＋２，４}および、ｓ_{ｉ＋２，５}で得られる全ての評価対象値の平均及び分散を算出する。

　先読みを行わない場合は、更新後パラメータ値選択部２９５は、更新後パラメータ値の候補自らにおける全ての評価対象値の平均及び分散を算出する。上記のように、学習モデルを複数用いることで、１つの更新後パラメータ値の候補について複数の評価対象値が得られる。
　更新後パラメータ値選択部２９５は、式（１１）を用いて更新後パラメータ値の候補の各々の選択指標値を算出し、選択指標値が最も大きい候補を１つ選択する。

　μ_ｉ，ｊは、深さＬ（Ｎ）における状態のうち、状態ｓ_ｉ，ｊの子孫に相当する状態における評価対象値の平均値を示す。上記のように、深さＬ（Ｎ）は先読み対象の深さである。状態ｓ_ｉ，ｊは、更新後の状態の候補（更新後パラメータ値の候補）である。状態ｓ_ｉ，ｊの子孫の状態とは、状態ｓ_ｉ，ｊからパラメータ値の更新回数が増加する方向に辿っていって到達可能なノードである。
　δ_ｉ，ｊ ^２は、深さＬ（Ｎ）における状態のうち、状態ｓ_ｉ，ｊの子孫に相当する状態における評価対象値の分散を示す。

　ｎ_Ｎ ^ｉ，ｊは、先読み対象の深さである深さＬ（Ｎ）で展開されている状態の数（状態ｓ_ｉ，ｊの子孫に相当する状態の数）を示す。図１１の例では、「ｎ_Ｎ ^ｉ，１＝３」、「ｎ_Ｎ ^ｉ，２＝２」である。
　ｋは、更新後パラメータ値の候補の数を示す。従って、ｋは、深さＬ（ｉ）における状態の数を示す。図１１の例では、「ｋ＝２」である。
　式（１１）の値（式（１１）の演算の結果得られる値）が、選択指標値の例に該当する。

　更新後パラメータ値選択部２９５は、更新後パラメータ値の候補のうち、式（１１）の値が最大となる候補を選択する。
　更新後パラメータ値の候補の子孫に相当する状態の数ｎ_Ｎ ^ｉ，ｊが少ないほど（値が小さいほど）、式（１１）の値が大きくなる。更新後パラメータ値の候補の子孫に相当する状態の数ｎ_Ｎ ^ｉ，ｊが少ない場合、この候補からの先読みが十分に行われていない可能性があり、さらに探索を行えば、好適な状態（評価対象値による評価が高い状態）に到達できる可能性があると考えらえる。式（１１）によれば、この場合の更新後パラメータ値の候補が比較的選ばれ易くなる。

　また、分散δ_ｉ，ｊ ^２の値が大きいほど、式（１１）の値が大きくなる。分散δ_ｉ，ｊ ^２の値が大きい場合、先読み先の状態毎に評価対象値が大きく異なっているか、あるいは、機械学習結果による評価対象値の誤差が比較的大きいことが考えられる。何れの場合も、さらに探索を行えば、好適な状態に到達できる可能性があると考えらえる。式（１１）によれば、この場合の更新後パラメータ値の候補が比較的選ばれ易くなる。

　あるいは、更新後パラメータ値選択部２９５が、式（１１）に代えて式（１２）を用いて更新後パラメータ値の候補の各々の選択指標値を算出し、選択指標値が最も大きい候補を１つ選択するようにしてもよい。

　Ｖ_{ｋ，Ｔｋ（ｔ－１）}は、式（１１）のδ_ｉ，ｊ ^２と同様の分散を示す。
　ε_{Ｔｋ（ｔ－１），ｔ}は、式（１１）のΣ_{ｊ＝１，ｋ}（ｎ_Ｎ ^ｉ，ｊ）と同様、先読み対象の深さであるＬ（Ｎ）における状態の数を示す。
　Ｔ_ｋ（ｔ－１）は、式（１１）のｎ_Ｎ ^ｉ，ｊと同様、更新後パラメータ値の候補の子孫に相当する状態の数を示す。
　ｃは、第３項に対する重み付けを行うハイパーパラメータを示す。
　ｂは、予測幅を示す。ここでいう予測幅は、評価対象値の平均値μ_ｉ，ｊの値域の大きさである。

　なお、初期値取得部２９１が、更新対象パラメータ値と、その更新対象パラメータ値の場合の評価対象値との組み合わせを複数取得するようにしてもよい点も、第１実施形態の場合と同様である。
　解析装置２００が、これら複数の更新対象パラメータ値の各々について、その更新対象パラメータ値をパラメータの初期値としてパラメータ値の探索を行うことで、一部の探索で局所解に陥った場合でも、他の探索で、評価対象値による評価がより高い解を得られると期待される。

　次に、図１２～図１３を参照して第２実施形態に係る解析システム１の動作について説明する。
　図１２は、機械学習装置１００が更新前後のパラメータ値と評価対象値の差分の割合との関係を学習する処理手順の例を示すフローチャートである。
　図１２の処理で、学習側制御部１９０は、生成する学習モデルの個数分だけ処理を繰り返すループＬ４１を開始する（ステップＳ４１１）。

　ステップＳ４１２～ステップＳ４１４は、図８のステップＳ１１１～ステップＳ１１３と同様である。ステップＳ４１３において、機械学習装置１００は、図９の処理を行う。
　ステップＳ４１２～ステップＳ４１４で、機械学習装置１００は、学習モデル毎の訓練データを生成する。すなわち、第２実施形態に係る機械学習装置１００が学習モデル毎の訓練データを生成する処理手順は、第１実施形態に係る機械学習装置１００が訓練データを生成する処理手順と同様である。

　ステップＳ４１４の後、学習側制御部１９０は、ループＬ４１の終端処理を行う。具体的には、学習側制御部１９０は、生成する学習モデルの個数分だけ訓練データセットを生成したか否かを判定する。生成した訓練データセットの個数が学習モデルの個数より少ないと判定した場合、学習側制御部１９０は、引き続きループＬ４１の処理を繰り返す。一方、生成する学習モデルの個数分だけ訓練データセットを生成したと判定した場合、解析側制御部２９０は、ループＬ４１を終了する。

　ループＬ４１を終了した場合、学習側制御部１９０は、生成する学習モデルの個数分だけ処理を繰り返すループＬ４３を開始する（ステップＳ４１６）。

　ステップＳ４１７～ステップＳ４１９は、図８のステップＳ１１４～ステップＳ１１６と同様である。ステップＳ４１７～ステップＳ４１９で、機械学習装置１００は、学習モデルを生成する。すなわち、第２実施形態に係る機械学習装置１００が個々の学習モデルを生成する処理手順は、第１実施形態に係る機械学習装置１００が学習モデルを生成する処理手順と同様である。

　ステップＳ４１９の後、学習側制御部１９０は、ループＬ４３の終端処理を行う。具体的には、学習側制御部１９０は、生成予定の個数分の学習モデルを生成したか否かを判定する。生成した学習モデルの個数が生成予定の個数より少ないと判定した場合、学習側制御部１９０は、引き続きループＬ４３の処理を繰り返す。一方、生成予定の個数分の学習モデルを生成したと判定した場合、解析側制御部２９０は、ループＬ４３を終了する。
　ループＬ４３を終了した場合、機械学習装置１００は、図１２の処理を終了する。

　図１３は、解析装置２００がパラメータ値を検索する処理手順の例を示すフローチャートである。
　ステップＳ５１１～Ｓ５１３は、図１０のステップＳ３１１～Ｓ３１３と同様である。
　ステップＳ５１３で開始するループＬ５１の処理で、解析側制御部２９０は、学習モデル毎に処理を行うループＬ５２を開始する（ステップＳ５１４）。
　ループＬ５２の処理で、相違情報取得部２９３は、更新対象パラメータ値の場合の評価対象値に対する、更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報を取得する（ステップＳ５１５）。
　さらに評価対象値算出部２９４は、得られた評価対象値の差分の割合と、更新対象パラメータ値の場合の評価対象値とに基づいて、更新後パラメータ値の候補の評価対象値を算出する（ステップＳ５１６）。
　ステップＳ５１５およびＳ５１６は、図１０のステップＳ３１４およびＳ３１５と同様である。すなわち、第２実施形態に係る相違情報取得部２９３および評価対象値算出部２９４が、個々の学習モデルについて評価対象値を求める処理は、第１実施形態に係る相違情報取得部２９３および評価対象値算出部２９４が評価対象値を求める処理と同様である。
　なお、先読み先の状態が複数ある場合、ステップＳ５１５で相違情報取得部２９３は、先読み先の状態毎に、更新対象パラメータ値の場合の評価対象値に対する、先読み先の状態における更新後パラメータ値の場合の評価対象値の相違の程度を示す情報を取得する。そして、ステップＳ５１６で評価対象値算出部２９４は、先読み先の状態毎に評価対象値を算出する。

　ステップＳ５１６の後、解析側制御部２９０は、ループＬ５２の終端処理を行う（ステップＳ５１７）。具体的には、解析側制御部２９０は、全ての学習モデルについてループＬ５２の処理を行ったか否かを判定する。未処理の学習モデルがある判定した場合、解析側制御部２９０は、引き続きループＬ５２の処理を繰り返す。一方、全ての学習モデルについてループＬ３２の処理を実行済であると判定した場合、解析側制御部２９０は、ループＬ５２を終了する。

　ループＬ５２の処理を終了した場合、更新後パラメータ値選択部２９５は、更新後パラメータ値の候補毎に、評価対象値の平均値及び分散を算出する（ステップＳ５１８）。
　次に、解析側制御部２９０は、ループＬ５１の終端処理を行う（ステップＳ５１９）。具体的には、解析側制御部２９０は、更新後パラメータ値の候補全てに対してループＬ５１の処理を行ったか否かを判定する。未処理の候補があると判定した場合、解析側制御部２９０は、引き続きループＬ５１の処理を繰り返す。一方、全ての候補に対してループＬ５１の処理を実行済であると判定した場合、解析側制御部２９０は、ループＬ５１を終了する。ステップＳ５１９は、図１０のステップＳ３１６と同様である。

　ループＬ５１を終了した場合、更新後パラメータ値選択部２９５は、更新後パラメータ値の候補のうちいずれかを選択する（ステップＳ５２０）。具体的には、更新後パラメータ値選択部２９５は、更新後パラメータ値の候補毎に算出した評価対象値の平均および分散を用いて、上述した式（１１）の値が最も大きい候補を１つ選択する。上記のように、式（１１）の値は選択指標値の例に該当し、更新後パラメータ値選択部２９５は、選択指標値が最も大きい候補を選択する。

　次に、終了条件判定部２９６は、パラメータ値の探索の終了条件が成立しているか否かを判定する（ステップＳ５２１）。例えば、解析側制御部２９０が、第１実施形態の場合と同様、選択されたパラメータ値の場合の評価対象値を算出しておく。終了条件判定部２９６は、選択されたパラメータ値の場合の評価対象値が目標値を満たすか否かを判定し、目標値を満たすと判定した場合に、パラメータ値の探索の終了条件が成立していると判定する。
　パラメータ値の探索の終了条件が成立していないと終了条件判定部２９６が判定した場合（ステップＳ５２１：ＮＯ）、処理がステップＳ５１２へ遷移する。一方、パラメータ値の探索の終了条件が成立していると終了条件判定部２９６が判定した場合（ステップＳ５２１：ＹＥＳ）、解析装置２００は、処理結果を出力する（ステップＳ５２２）。ステップＳ５２２は、図１０のステップＳ３１９と同様である。
　ステップＳ５２２の後、解析装置２００は、図１３の処理を終了する。

　以上のように、相違情報取得部２９３は、更新パラメータ値に応じて設定される複数の更新後パラメータ値の候補の各々について、更新対象パラメータ値とその更新後パラメータ値の候補とを複数の機械学習結果に適用して、更新対象パラメータ値の場合の評価対象値に対する、その更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得する。評価対象値算出部２９４は、更新後パラメータ値の候補毎、かつ、機械学習結果毎に、評価対象値の相違の程度と、更新対象パラメータ値の場合の評価対象値とに基づいて、その候補の場合の評価対象値を算出する。更新後パラメータ値選択部２９５は、更新対象パラメータ値の候補毎に複数の評価対象値のばらつきを用いて算出される選択指標値が、所定の選択条件に最も適合する候補を選択し、更新対象パラメータ値、更新対象パラメータ値の場合の評価対象値を、それぞれ、選択した候補、選択した候補の場合の評価対象値に更新する。言い換えると、更新後パラメータ値選択部２９５は、更新対象パラメータ値の候補毎に複数の評価対象値のばらつきを用いて算出される選択指標値を比較し、比較結果に基づいて候補を選択し、更新対象パラメータ値、更新対象パラメータ値の場合の評価対象値を、それぞれ、選択した候補、選択した候補の場合の評価対象値に更新する。

　このように、解析装置２００は、複数の機械学習結果を用いて機械学習結果毎に、更新後パラメータ値の候補の場合の評価対象値を算出する。これにより、解析装置２００は、１つの更新後パラメータ値の候補について複数の評価対象値を得ることができ、評価値のばらつきを用いた評価が可能になる。
　上記のように、解析システム１が評価対象値のばらつきを示す指標として用いる値は、評価対象値の分散に限定されない。例えば、解析システム１が評価対象値のばらつきを示す指標として標準偏差を用いるなど、分散以外の値を用いるようにしてもよい。

　また、解析装置２００は、パラメータ値の更新時における評価対象値の相違の程度を示す情報を機械学習結果から取得する。解析装置２００が、評価対象値の相違の程度という相対的な値を機械学習結果から取得する点で、更新後パラメータ値の候補の場合の評価対象値を算出する際に、更新対象パラメータ値の場合の評価対象値を反映させることができる。パラメータ値の更新前後の評価対象値には比較的強い関係性（例えば、相関性）があると考えられ、解析装置２００によれば、この点で、評価対象値をより高精度に算出することができる。

　第２実施形態では、更新後候補設定部２９２の処理およびそれ以降の処理は、以下の処理（１Ｂ）～（６Ｂ）を含む。
（１Ｂ）更新後候補設定部２９２が、更新後パラメータ値の候補を複数設定する。
（２Ｂ）相違情報取得部２９３が、更新後パラメータ値の候補毎に、更新対象パラメータ値と、その更新後パラメータ値の候補とを複数の機械学習結果に適用して、更新対象パラメータ値の場合の評価対象値に対する、その更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得する。
（３Ｂ）評価対象値算出部２９４が、更新後パラメータ値の候補毎、かつ、機械学習結果毎に、評価対象値の相違の程度と、更新対象パラメータ値の場合の評価対象値とに基づいて、その更新後パラメータ値の候補の場合の評価対象値を算出する。
（４Ｂ）更新後パラメータ値選択部２９５が、更新後パラメータ値の候補の各々に対する、評価対象値の平均値および分散（選択指標値の一例）を用いた評価にて、評価が最も良い候補を選択し、更新対象パラメータ値、更新対象パラメータ値の場合の評価対象値を、それぞれ、選択した候補、選択した候補の場合の評価対象値に更新する。
（５Ｂ）終了条件判定部２９６が、更新対象パラメータ値の場合の評価対象値が所定の終了条件を満たすか否かを判定する。
（６Ｂ）解析側制御部２９０が、上記（５Ｂ）で終了条件判定部２９６が、更新対象パラメータ値の場合の評価対象値が所定の終了条件を満たすと判定するまで（１Ｂ）～（６Ｂ）の処理を繰り返し行わせる。

　また、更新後パラメータ値選択部２９５は、評価対象値のばらつき（例えば、分散）が大きい候補ほど評価を高い評価とする。
　評価対象値のばらつきが大きい場合、先読み先の状態毎に評価対象値が大きく異なっているか、あるいは、機械学習結果による評価対象値の誤差が比較的大きいことが考えられる。何れの場合も、さらに探索を行えば、好適な状態に到達できる可能性があると考えらえる。解析装置２００によれば、この場合の更新後パラメータ値の候補が比較的選ばれ易くなる。

　また、更新後パラメータ値選択部２９５は、評価対象値のばらつきに加えて評価対象値の平均値を用いて算出される選択指標値が、所定の選択条件に最も適合する候補を選択する。
　更新後パラメータ値選択部２９５が、評価対象値の平均値に基づく選択指標値を用いることで、評価対象値の平均値を候補の選択に反映させることができる。更新後パラメータ値選択部２９５が、この選択指標値を用いて評価対象値の平均値が大きい候補を優先的に選択することで、選択された候補について得られる評価対象値が大きくなる（評価が高くなる）ことが期待される。

　また、更新後パラメータ値選択部２９５は、パラメータ値の更新について先読みを行い、先読みされたパラメータ値が少ない候補ほど評価を高い評価とする。
　先読みされたパラメータ値が少ない候補については、先読みによる評価が十分に行われていない可能性があり、さらに探索を行えば、好適な状態に到達できる可能性があると考えらえる。解析装置２００によれば、この場合の更新後パラメータ値の候補が比較的選ばれ易くなる。

　また、パラメータ値取得部１９１は、更新対象パラメータ値および更新後パラメータ値を取得する。シミュレーション実行部１９２は、更新対象パラメータ値、更新後パラメータ値それぞれの場合の評価対象値をシミュレーションで算出する。相違算出部１９３は、更新対象パラメータ値の場合の評価対象値に対する、更新後パラメータ値の場合の評価対象値の相違の程度を算出する。機械学習処理部１９４は、更新対象パラメータ値、更新後パラメータ値、および、評価対象値の相違の程度を、例えば、複数セット分用いて、更新対象パラメータ値および更新後パラメータ値と、評価対象値の相違の程度との関係の機械学習結果を複数取得する。

　このように機械学習装置１００が、評価対象値の相違の程度について機械学習を行うことで、評価対象値の相違の程度を出力する機械学習結果を解析装置２００に提供できる。
解析装置２００は、この機械学習結果を用いて、上記のように解析を行うことができる。
さらに、機械学習装置１００複数の機械学習結果を取得することで、解析装置２００は、これら複数の機械学習結果を用いて評価対象値を複数取得することができ、評価対象値の分散など、評価対象値のばらつきの大きさを示す指標を取得できる。解析装置２００は、評価対象値のばらつきの大きさを示す指標を用いてパラメータ値の評価を行うことができ、評価対象値が大きい（評価が高い）探索領域を検知できると期待される。

　機械学習装置１００による機械学習にベイジアンニューラルネットワーク（Bayesian Neural Network）を用いるようにしてもよい。ベイジアンニューラルネットワークは、確率分布による出力を行う。解析装置２００は、ベイジアンニューラルネットワークの出力から評価対象値の平均値及び分散を得られ、これら平均値及び分散を別途算出する必要がない。

　ベイジアンニューラルネットワークについて、式を用いて説明する。
　訓練データの数をＭ個（Ｍは、正の整数）とし、個々の訓練データをξ^ｉ（ｉは、１≦ｉ≦Ｍの整数）として、訓練データセットを式（１３）のように表す。

　式（１３）では、訓練データを適用する順番を考慮して、訓練データセットをベクトルで表している。
　ｋ番目の訓練データξ^ｋは、式（１４）のように示される。

　ｙ^ｋは、ｋ番目の訓練データξ^ｋにおけるニューラルネットワークの出力値を示す。ｘ^ｋは、ｋ番目の訓練データξ^ｋにおけるニューラルネットワークへの入力値を示す。
　ｘ^ｋにおける特徴量(feature)の数（要素の数）をｎ個として、個々の特徴量をｘ_ｉ ^ｋ（ｉは、１≦ｉ≦ｎの整数）と表記すると、ｘ^ｋは式（１５）のように示される。

　また、尤度関数をＬで表して、尤度が式（１６）のように示されるものとする。

　Ｌは、尤度関数を示す。θは、ハイパーパラメータであり、式（１７）のように分布π（θ）に従うものとする。

　π（θ）は、事前確率密度関数を示す。
　新たな予測（学習データ以外の予測）を、入力値ｘ^Ｍ＋１から出力値ｙ^Ｍ＋１の予測と表記して、ベイズの定理より、式（１８）のように示される。

　ｐ、ρは、何れも条件付き確率密度分布（尤度関数）を示す。π（θ｜ξ）は、事後確率密度関数を示す。
　ｐ（ｙ^Ｍ＋１｜ｘ^Ｍ＋１，θ）をニューラルネットワークモデルとして扱う。ハイパーパラメータθは、式（１９）に従うものとする。

　π（β）として正規分布Ｎ（β_ｐ’，σ_ｐ’）を仮定し、π（σ_ｐ）に無情報事前分布を仮定する。β_ｐ’，σ_ｐ’は、それぞれ、ある値（実数定数）を示す。
　ベイズの定理より、式（２０）のように示される。

　「∝」は比例を示す。
　メトロポリスヘイスティングス法（Metropolis-Hastings Algorithm）を用いて得られるパラメータ集合θ（ｉ）＝（β^（ｉ），σ^２（ｉ））から、事後分布π（θ｜ξ^１，・・・，ξ^Ｍ）を近似する。上付きの「（ｉ）」は、サンプリングタイムを示すインデックスである。
　つまり、（メトロポリスヘイスティングス法の収束仮定の部分を除き）θ^（ｉ）＝（β^（ｉ），σ^２（ｉ））を得て離散近似する。
　また、ｐ（ｙ^Ｍ＋１｜ｘ^Ｍ＋１，θ）についても同様に、θ^（ｉ）により離散近似する。
　式（１６）に戻り、上記のようにｐ（ｙ^Ｍ＋１｜ｘ^Ｍ＋１，θ）をニューラルネットワークモデルとして扱うことで、予測値の確率分布（の近似）を得られる。

　ここで、第２実施形態に係る解析システム１による処理時間は、式（２１）のように示される。

　Ｔ_ｓｉｍは、シミュレーション実行の１回あたりの計算時間を示す。
　Ｎ_ｄａｔａは、機械学習装置１００が機械学習のための、シミュレータへの入力データ数（従って、シミュレーションの実行回数）を示す。
　データ生成に要する時間は、Ｔ_ｓｉｍ×Ｎ_ｄａｔａとなる。
　Ｔ_Ｌｒｎは、機械学習装置１００が機械学習を行うのに要する時間を示す。機械学習装置１００が機械学習を行うのに要する時間は、データ生成に要する時間に比例する。Ｔ_Ｌｒｎ∝Ｔ_ｓｉｍ×Ｎ_ｄａｔａである。
　Ｄは、解析装置２００が行う先読みの深さを示す。
　Ｔ_ｓｕｒは、状態１つあたり、かつ、学習モデル１つあたりの計算時間を示す。
　Ｎ_{ｍｏｄｅｌ}は、解析装置２００が用いる学習モデルの数を示す。
　Ｎ_ｐｌａｙは、先読みの最大深さに達した時点での子孫に相当する状態の数（プレイアウト数）を示す。
　Ｌは、最終的な深さを示す。

　機械学習を行わずにシミュレーションの実行にて同様の処理を行う場合の計算時間は、式（２２）のように示される。

　同じように先読みし、機械学習を行わずにシミュレーションの実行にて同様の処理を行い、かつ探索する場合の計算時間は式（２３）のように示される。

　Ｎ_ｎｏｄｅ ^Ｄは、先読みの深さでの、次の配置場所の候補の数を示す。
　例えば、Ｔ_ｓｉｍ＝２．０［秒］、Ｎ_ｄａｔａ＝３０００、Ｎ_ｎｏｄｅ ^Ｄ＝３９０、Ｔ_ｓｉｍ×Ｎ_ｄａｔａ＝６１１２．５［秒］、Ｔ_Ｌｒｎ＝２０．０［秒］、Ｎ_{ｍｏｄｅｌ}＝１０、Ｔ_ｓｕｒ＝０．００３７［秒］、Ｄ＝３、Ｎ_ｐｌａｙ＝３９００、Ｌ＝１５とする。この場合、それぞれの場合に要する計算時間は、
（ａ）第２実施形態に係る解析システム１の場合（式（２１））：約２０９．５分（ｂ）機械学習を行わずにシミュレーションの実行にて同様の処理を行う場合（式（２２））：約５９５９．７分（（ａ）の場合の約２８．５倍）（ｃ）同じように先読みし、機械学習を行わずにシミュレーションの実行にて同様の処理を行い、かつ探索する場合（式（２３））：約２０９８３．１日（（ａ）の約１４４２５６倍）
となる。
（ｂ）の場合の処理では、解析装置２００は、（ａ）の場合と同様の処理によって複数の候補のうち何れか１つに絞り込みながら探索を進めていく。これに対し、（ｃ）の場合の処理では、解析装置２００は、１つの候補までの絞り込みは行わず、Ｎ_ｎｏｄｅ ^Ｄまでの数の候補を残す。
　これら（ａ）～（ｃ）の計算時間を比較すると、第２実施形態に係る解析システム１の場合、計算時間が短くて済む。

＜第３実施形態＞
　第３実施形態では、解析装置の構成の例について説明する。
　図１４は、第３実施形態に係る解析装置の構成の例を示す図である。図１４に示す解析装置３１０は、相違情報取得部３１１と、評価対象値算出部３１２と、更新後パラメータ値選択部３１３と、を備える。
　かかる構成にて、相違情報取得部３１１は、更新パラメータ値に応じて設定される複数の更新後パラメータ値の候補の各々について、更新対象パラメータ値とその更新後パラメータ値の候補とを複数の機械学習結果に適用して、更新対象パラメータ値の場合の評価対象値に対する、その更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得する。評価対象値算出部３１２は、更新後パラメータ値の候補毎、かつ、機械学習結果毎に、評価対象値の相違の程度と、更新対象パラメータ値の場合の評価対象値とに基づいて、その候補の場合の評価対象値を算出する。更新後パラメータ値選択部３１３は、更新後パラメータ値の候補毎に複数の評価対象値のばらつきを用いて算出される選択指標値を比較し、比較結果に基づき候補を選択し、更新対象パラメータ値、更新対象パラメータ値の場合の評価対象値を、それぞれ、選択した候補、選択した候補の場合の評価対象値に更新する。

　このように、解析装置３１０は、複数の機械学習結果を用いて機械学習結果毎に、更新後パラメータ値の候補の場合の評価対象値を算出する。これにより、解析装置３１０は、１つの更新後パラメータ値の候補について複数の評価対象値を得ることができ、評価対象値のばらつきを示す指標（例えば、分散）を用いた評価が可能になる。
　また、解析装置３１０は、パラメータ値の更新時における評価対象値の相違の程度を示す情報を機械学習結果から取得する。解析装置３１０が、評価対象値の相違の程度という相対的な値を機械学習結果から取得する点で、更新後パラメータ値の候補の場合の評価対象値を算出する際に、更新対象パラメータ値の場合の評価対象値を反映させることができる。パラメータ値の更新前後の評価対象値には比較的強い関係性（例えば、相関性）があると考えられ、解析装置３１０によれば、この点で、評価対象値をより高精度に算出することができる。

＜第４実施形態＞
　第４実施形態では、機械学習装置の構成の例について説明する。
　図１５は、第４実施形態に係る機械学習装置の構成の例を示す図である。図１５に示す機械学習装置３２０は、パラメータ値取得部３２１と、シミュレーション実行部３２２と、相違算出部３２３と、機械学習処理部３２４と、を備える。
　かかる構成にて、パラメータ値取得部３２１は、更新対象パラメータ値および更新後パラメータ値を取得する。シミュレーション実行部３２２は、更新対象パラメータ値、更新後パラメータ値それぞれの場合の評価対象値をシミュレーションで算出する。相違算出部３２３は、更新対象パラメータ値の場合の評価対象値に対する、更新後パラメータ値の場合の評価対象値の相違の程度を算出する。機械学習処理部３２４は、更新対象パラメータ値および更新後パラメータ値と、評価対象値の相違の程度との関係を機械学習する。
　このように機械学習装置３２０が、評価対象値の相違の程度について機械学習を行うことで、評価対象値の相違の程度を出力する機械学習結果を解析装置に提供できる。解析装置は、この機械学習結果を用いて解析を行うことができる。

＜第５実施形態＞
　第５実施形態では、解析システムの構成の例について説明する。
　図１６は、第５実施形態に係る解析システムの構成の例を示す図である。図１６に示す解析システム３３０は、機械学習装置３４０と、解析装置３５０とを備える。機械学習装置３４０は、パラメータ値取得部３４１と、シミュレーション実行部３４２と、相違算出部３４３と、機械学習処理部３４４と、を備える。解析装置３５０は、相違情報取得部３５１と、評価対象値算出部３５２と、更新後パラメータ値選択部３５３と、を備える。

　かかる構成にて、パラメータ値取得部３４１は、更新対象パラメータ値および更新後パラメータ値を取得する。シミュレーション実行部３４２は、更新対象パラメータ値、更新後パラメータ値それぞれの場合の評価対象値をシミュレーションで算出する。相違算出部３４３は、更新対象パラメータ値の場合の評価対象値に対する、更新後パラメータ値の場合の評価対象値の相違の程度を算出する。機械学習処理部３４４は、更新対象パラメータ値、更新後パラメータ値、および、評価対象値の相違の程度を複数セット分用いて、更新対象パラメータ値および更新後パラメータ値と、評価対象値の相違の程度との関係の機械学習結果を複数取得する。

　また、相違情報取得部３５１は、更新パラメータ値に応じて設定される複数の更新後パラメータ値の候補の各々について、更新対象パラメータ値とその更新後パラメータ値の候補とを複数の機械学習結果に適用して、更新対象パラメータ値の場合の評価対象値に対する、その更新後パラメータ値の候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得する。評価対象値算出部３５２は、更新後パラメータ値の候補毎、かつ、機械学習結果毎に、評価対象値の相違の程度と、更新対象パラメータ値の場合の評価対象値とに基づいて、その候補の場合の評価対象値を算出する。更新後パラメータ値選択部３５３は、更新後パラメータ値の候補毎に複数の評価対象値のばらつきを用いて算出される選択指標値を比較し、比較結果に基づき候補を選択し、更新対象パラメータ値、更新対象パラメータ値の場合の評価対象値を、それぞれ、選択した候補、選択した候補の場合の評価対象値に更新する。

　このように機械学習装置３４０が、評価対象値の相違の程度について機械学習を行うことで、評価対象値の相違の程度を出力する機械学習結果を解析装置３５０に提供できる。
解析装置３５０は、この機械学習結果を用いて解析を行うことができる。さらに、機械学習装置３４０が複数の機械学習結果を取得することで、解析装置３５０は、これら複数の機械学習結果を用いて評価対象値を複数取得することができ、評価対象値の分散など、評価対象値のばらつきの大きさを示す指標を取得できる。解析装置３５０は、評価対象値のばらつきの大きさを示す指標を用いてパラメータ値の評価を行うことができ、評価対象値が大きい（評価が高い）探索領域を検知できると期待される。
　解析装置３５０は、複数の機械学習結果を用いて機械学習結果毎に、更新後パラメータ値の候補の場合の評価対象値を算出する。これにより、解析装置３５０は、１つの更新後パラメータ値の候補について複数の評価対象値を得ることができ、評価対象値のばらつきを示す指標（例えば、分散）を用いた評価が可能になる。
　また、解析装置３５０は、パラメータ値の更新時における評価対象値の相違の程度を示す情報を機械学習結果から取得する。解析装置３５０が、評価対象値の相違の程度という相対的な値を機械学習結果から取得する点で、更新後パラメータ値の候補の場合の評価対象値を算出する際に、更新対象パラメータ値の場合の評価対象値を反映させることができる。パラメータ値の更新前後の評価対象値には比較的強い関係性（例えば、相関性）があると考えられ、解析装置３５０によれば、この点で、評価対象値をより高精度に算出することができる。

　なお、学習側制御部１９０、および、探索側制御部２９０が行う処理の全部または一部を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。
　また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。

　以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

　この出願は、２０１８年１０月３０日に出願された日本国特願２０１８－２０４０１５を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　本発明は、解析装置、機械学習装置、解析システム、解析方法および記録媒体に適用してもよい。

　１、３３０　解析システム
　１００、３２０、３４０　機械学習装置
　１１０　学習側通信部
　１８０　学習側記憶部
　１９０　学習側制御部
　１９１、３２１、３４１　パラメータ値取得部
　１９２、３２２、３４２　シミュレーション実行部
　１９３、３２３、３４３　相違算出部
　１９４、３２４、３４４　機械学習処理部
　２００、３１０、３５０　解析装置
　２１０　解析側通信部
　２８０　解析側記憶部
　２９０　解析側制御部
　２９１　初期値取得部
　２９２　更新後候補設定部
　２９３、３１１、３５１　相違情報取得部
　２９４、３１２、３５２　評価対象値算出部
　２９５、３１３、３５３　更新後パラメータ値選択部
　２９６　終了条件判定部

Claims

　更新パラメータ値に応じて設定される更新後パラメータ値の複数の候補の各々について、前記更新対象パラメータ値とその候補とを複数の機械学習結果に適用して、前記更新対象パラメータ値の場合の評価対象値に対する、その候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得する相違情報取得手段と、
　前記候補毎、かつ、前記機械学習結果毎に、前記評価対象値の相違の程度と、前記更新対象パラメータ値の場合の前記評価対象値とに基づいて、その候補の場合の評価対象値を算出する評価対象値算出手段と、
　前記候補毎に、前記機械学習結果毎の前記評価対象値のばらつきを用いて選択指標値を算出し、前記複数の候補各々の前記選択指標値を比較し、前記比較の結果に基づき前記複数の候補から候補を選択し、前記更新対象パラメータ値、前記更新対象パラメータ値の場合の評価対象値を、それぞれ、前記選択した候補、前記選択した候補の場合の評価対象値に更新する、更新後パラメータ値選択手段と、
　を備える解析装置。
　前記更新後パラメータ値選択手段は、前記ばらつきが大きいほど前記選択指標値をより高い値とし、前記複数の候補から、前記選択指標値が最も高い値の候補を選択する
　請求項１に記載の解析装置。
　前記更新後パラメータ値選択手段は、前記候補毎に、前記機械学習結果毎の前記ばらつきと前記複数の候補各々の前記評価対象値の平均値とを用いて、選択指標値を算出する、
　請求項１または請求項２に記載の解析装置。
　前記更新後パラメータ値選択手段は、前記パラメータ値の更新について先読みを行い、先読みされたパラメータ値が数が少ない候補ほど選択指標値をより高い値とし、前記複数の候補から、前記選択指標値が最も高い値の候補を選択する
　請求項１から３の何れか一項に記載の解析装置。
　前記相違情報取得手段は、前記評価対象値の相違の程度を示す情報として、前記複数の候補の各々について、前記更新対象パラメータ値の場合の評価対象値に対する前記候補の場合の評価対象値の差分を、前記更新対象パラメータ値の場合の評価対象値で除算する正規化を行った値を取得する、
　請求項１から４の何れか一項に記載の解析装置。
　更新対象パラメータ値および更新後パラメータ値とのセットを複数取得するパラメータ値取得手段と、
　前記複数のセット毎に、前記更新対象パラメータ値の場合の評価対象値と、前記更新後パラメータ値の場合の評価対象値とをシミュレーションで算出するシミュレーション実行手段と、
　前記複数のセット毎に、前記更新対象パラメータ値の場合の評価対象値に対する、前記更新後パラメータ値の場合の評価対象値の相違の程度を算出する相違算出手段と、
　前記複数のセットの前記更新対象パラメータ値、前記更新後パラメータ値、および、前記評価対象値の相違の程度を用いて、前記更新対象パラメータ値および前記更新後パラメータ値と、前記評価対象値の相違の程度との関係の機械学習結果を複数取得する機械学習処理手段と、
　を備える機械学習装置。
　機械学習装置と解析装置とを備え、
　前記機械学習装置は、
　更新対象パラメータ値および更新後パラメータ値とのセットを複数取得するパラメータ値取得手段と、
　前記複数のセット毎に、前記更新対象パラメータ値の場合の評価対象値と、前記更新後パラメータ値の場合の評価対象値とをシミュレーションで算出するシミュレーション実行手段と、
　前記複数のセット毎に、前記更新対象パラメータ値の場合の評価対象値に対する、前記更新後パラメータ値の場合の評価対象値の相違の程度を算出する相違算出手段と、
　前記複数のセットの前記更新対象パラメータ値、前記更新後パラメータ値、および、前記評価対象値の相違の程度を用いて、前記更新対象パラメータ値および前記更新後パラメータ値と、前記評価対象値の相違の程度との関係の機械学習結果を複数取得する機械学習処理手段と、
　を備え、
　前記解析装置は、
　更新パラメータ値に応じて設定される更新後パラメータ値の複数の候補の各々について、前記更新対象パラメータ値とその候補とを複数の機械学習結果に適用して、前記更新対象パラメータ値の場合の評価対象値に対する、その候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得する相違情報取得手段と、
　前記候補毎、かつ、前記機械学習結果毎に、前記評価対象値の相違の程度と、前記更新対象パラメータ値の場合の前記評価対象値とに基づいて、その候補の場合の評価対象値を算出する評価対象値算出手段と、
　前記候補毎に、前記機械学習結果毎の前記評価対象値のばらつきを用いて選択指標値を算出し、前記複数の候補各々の前記選択指標値を比較し、前記比較の結果に基づき前記複数の候補から候補を選択し、前記更新対象パラメータ値、前記更新対象パラメータ値の場合の評価対象値を、それぞれ、前記選択した候補、前記選択した候補の場合の評価対象値に更新する、更新後パラメータ値選択手段と、
　を備える、
　解析システム。
　コンピュータによって実施される解析方法であって、
　更新パラメータ値に応じて設定される更新後パラメータ値の複数の候補の各々について、前記更新対象パラメータ値とその候補とを複数の機械学習結果に適用して、前記更新対象パラメータ値の場合の評価対象値に対する、その候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得し、
　前記候補毎、かつ、前記機械学習結果毎に、前記評価対象値の相違の程度と、前記更新対象パラメータ値の場合の前記評価対象値とに基づいて、その候補の場合の評価対象値を算出し、
　前記候補毎に、前記機械学習結果毎の前記評価対象値のばらつきを用いて選択指標値を算出し、前記複数の候補各々の前記選択指標値を比較し、
　前記比較の結果に基づき前記複数の候補から候補を選択し、
　前記更新対象パラメータ値、前記更新対象パラメータ値の場合の評価対象値を、それぞれ、前記選択した候補、前記選択した候補の場合の評価対象値に更新する、
　ことを含む解析方法。
　コンピュータに、
　更新パラメータ値に応じて設定される更新後パラメータ値の複数の候補の各々について、前記更新対象パラメータ値とその候補とを複数の機械学習結果に適用して、前記更新対象パラメータ値の場合の評価対象値に対する、その候補の場合の評価対象値の相違の程度を示す情報を機械学習結果毎に取得し、
　前記候補毎、かつ、前記機械学習結果毎に、前記評価対象値の相違の程度と、前記更新対象パラメータ値の場合の前記評価対象値とに基づいて、その候補の場合の評価対象値を算出し、
　前記候補毎に、前記機械学習結果毎の前記評価対象値のばらつきを用いて選択指標値を算出し、前記複数の候補各々の前記選択指標値を比較し、
　前記比較の結果に基づき前記複数の候補から候補を選択し、
　前記更新対象パラメータ値、前記更新対象パラメータ値の場合の評価対象値を、それぞれ、前記選択した候補、前記選択した候補の場合の評価対象値に更新する、
　ことを実行させるためのプログラムを記憶した記録媒体。