JP2023017358A

JP2023017358A - 実験計画装置、実験計画方法および実験計画システム

Info

Publication number: JP2023017358A
Application number: JP2021121584A
Authority: JP
Inventors: 建瑠須藤; Takeru SUTO; 知夏末松; Chika Suematsu
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2021-07-26
Filing date: 2021-07-26
Publication date: 2023-02-07
Also published as: WO2023007899A1

Abstract

【課題】複数の候補点の分散化を図ること。【解決手段】実験装置に関する入力設計パラメータを入力した場合に実験装置を評価する推論モデルに対し入力設計パラメータを入力した結果出力されるコストに基づいて、入力設計パラメータに誤差逆伝播することにより入力設計パラメータを修正し、修正後の入力設計パラメータに基づいて設計パラメータ候補を決定する実験計画装置は、第１入力設計パラメータを受け付け、第１入力設計パラメータと設計パラメータ候補との距離に関する第１距離コストを算出し、第１距離コストと、第１入力設計パラメータを推論モデルに入力した結果推論モデルから出力される第１コストと、を加算し、加算結果に基づいて第１入力設計パラメータに誤差逆伝播することにより第１入力設計パラメータを修正し、修正後の第１入力設計パラメータに基づいて第１設計パラメータ候補を決定する。【選択図】図３

Description

本発明は、実験装置による実験を計画する実験計画装置、実験計画方法および実験計画システムに関する。

ニューラルネットワークを用いた推論モデルが盛んに作られており、これらの推論モデルを活用して実験計画を行うことで、複雑な製品を低コストで設計することが可能と考えられる。この実験計画用途では、実験候補点は以下の要件（１）～（３）を満たす必要がある。

（１）出力される候補点は、最終採用すべき一点のみの解だけではなく、実験すべき複数の候補解を出力する必要がある。
（２）複数の候補点同士は、実験上優位な差が期待される必要がある。ほぼ同じ条件や同じ結果の点ばかりで実験していたら意味のあるデータが得られない。
（３）候補点の持つ性質を、直観的に制御しやすい。

また、ニューラルネットワークを用いた技術として下記特許文献１および２がある。下記特許文献１は、ニューラルネットワークの１または複数のノード間に情報要素を備えるニューラルネットワークを開示する。情報要素は、１または複数の第１入力ノードを有する第１入力部と、１または複数の第１出力ノードを有する第１出力部と、第１入力部および第１出力部の間に設けられ、入力側および出力側の接続に重み係数が設定される複数の第１隠れノードとを有し、第１入力部が受け取る第１入力データと、第１入力データに応じて第１出力部が出力する第１出力データとが一致し、重み係数は、ニューラルネットワークの学習とは関連のない伝達情報に基づく値を含む。

下記特許文献２は、分散深層学習を高速に行う分散深層学習システムを開示する。この分散深層学習システムでは、各学習ノードは、学習対象のニューラルネットワークに学習データを入力した出力結果から損失関数の勾配を計算し、複数の勾配成分の値をパケット化してコンピューティングインタコネクト装置に送信する。コンピューティングインタコネクト装置は、各学習ノードから送信されたパケットに格納された複数の勾配成分の値を取得し、ニューラルネットワークの同一の構成パラメータに対する勾配成分の値を入力とする計算処理を、複数の勾配の成分の値各々について並列に行い、計算結果をパケット化して各学習ノードに送信する。各学習ノードは、コンピューティングインタコネクト装置から送信されたパケットに格納された値に基づいてニューラルネットワークの構成パラメータを更新する。

特開２０２０－０５２８１３号公報特開２０１９－１６８８９５号公報

勾配降下法は、推論モデルの出力の偏微分により、所定の出力を実現するように入力を調整する。しかしながら、勾配降下法では、出力解が局所最適解の近傍に集中し、差異が小さく実験的に意味が薄い少数の候補解しか得られない。したがって、勾配降下法は、上記（１）および（２）を充足しない。

また、ベイズ最適化は、候補解を１点出力するごとに、そこから離間した点を選択しやすいようにカーネル関数によりコストを増大させ、実験的に意味のある複数の候補解を得る手法である。しかしながら、ベイズ最適化の場合、ニューラルネットワークの推論モデルを最適化する制御が困難である。

本発明は、複数の候補点の分散化を図ることを目的とする。

本願において開示される発明の一側面となる管理装置、管理システム、および管理方法は、実験装置に関する入力設計パラメータを入力した場合に前記実験装置を評価する推論モデルに対し前記入力設計パラメータを入力した結果出力されるコストに基づいて、前記入力設計パラメータに誤差逆伝播することにより前記入力設計パラメータを修正し、修正後の入力設計パラメータに基づいて設計パラメータ候補を決定する実験計画装置であって、第１入力設計パラメータを受け付ける入力部と、前記第１入力設計パラメータと前記設計パラメータ候補との距離に関する第１距離コストを算出する第１距離コスト算出部と、前記第１距離コスト算出部によって算出された第１距離コストと、前記第１入力設計パラメータを前記推論モデルに入力した結果前記推論モデルから出力される第１コストと、を加算するコスト加算部と、前記コスト加算部による加算結果に基づいて前記第１入力設計パラメータに誤差逆伝播することにより前記第１入力設計パラメータを修正する修正部と、前記修正部による修正後の前記第１入力設計パラメータに基づいて第１設計パラメータ候補を決定する決定部と、を有することを特徴とする。

本発明の代表的な実施の形態によれば、複数の候補点の分散化を図ることができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

図１は、実験計画システムのシステム構成例を示す説明図である。図２は、コンピュータのハードウェア構成例を示すブロック図である。図３は、実施例１にかかる実験計画装置の機能的なグラフ構造例を示すブロック図である。図４は、実施例１にかかる勾配降下による候補点生成処理手順例を示すフローチャートである。図５は、実施例１にかかる勾配降下による候補点生成例を示す説明図である。図６は、実施例１にかかる勾配降下の推移を示すグラフである。図７は、設計パラメータの修正例を示す説明図である。図８は、実施例１にかかる距離コストノードの具体的な構造例を示す説明図である。図９は、距離コストノードの追加例を示す説明図である。図１０は、実施例２にかかる距離コストノードの追加例を示す説明図である。図１１は、実施例３にかかる勾配降下による候補点生成例を示す説明図である。図１２は、実施例３にかかる距離コストノードによる勾配の可視化例１を示す説明図である。図１３は、実施例３にかかる距離コストノードによる勾配の可視化例２を示す説明図である。図１４は、実施例３にかかる距離コストノードの一例を示す説明図である。図１５は、実施例４にかかるグリッド探索例を示す説明図である。図１６は、実施例４にかかる勾配降下による候補点生成処理手順例を示すフローチャートである。図１７は、実施例５にかかる距離コストノードの一例を示す説明図である。図１８は、実施例５にかかる距離コストノードによる勾配の可視化例を示す説明図である。図１９は、実施例５にかかるグラフ構造例を示す説明図である。図２０は、コスト調整層の一例を示す説明図である。図２１は、コスト入出力関係を示すグラフの一例を示す説明図である。図２２は、コスト調整層の他の例を示す説明図である。図２３は、コスト入出力関係を示すグラフの他の例を示す説明図である。

＜実験計画システム＞
図１は、実験計画システムのシステム構成例を示す説明図である。実験計画システム１００は、実験計画装置１０１と、学習装置１０２と、実験装置１０３と、を有する。実験計画装置１０１、学習装置１０２、および実験装置１０３は、インターネット、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）などのネットワーク１０４を介して相互に通信可能である。

実験計画システム１００は、学習装置１０２によって作成された推論モデルを用いて、実験計画装置１０１が設計パラメータを設定可能な範囲でかつ候補点同士が互いに十分離間するようにサンプリングして、たとえば、実験装置１０３の製造ばらつきを抑制する実験条件を最適な設計パラメータとして、実験装置に提供するシステムである。

学習装置は、実験装置の設計パラメータと目的変数とを学習データセットとして推論モデルを作成する。実験装置は、たとえば、半導体製造装置である。実験装置は、実験計画装置から得られたあらたな設計パラメータで実験を行い、実験結果を得る。そして、実験装置は、あらたな設計パラメータとその実験結果とを学習装置に出力する。学習装置は、あらたな設計パラメータとその実験結果とを学習データセットに追加して、推論モデルを再学習する。

＜コンピュータ（実験計画装置および学習装置）のハードウェア構成＞
図２は、コンピュータのハードウェア構成例を示すブロック図である。コンピュータ２００は、プロセッサ２０１と、記憶デバイス２０２と、入力デバイス２０３と、出力デバイス２０４と、通信インターフェース（通信ＩＦ）２０５と、を有する。プロセッサ２０１、記憶デバイス２０２、入力デバイス２０３、出力デバイス２０４、および通信ＩＦ２０５は、バス２０６により接続される。プロセッサ２０１は、コンピュータ２００を制御する。記憶デバイス２０２は、プロセッサ２０１の作業エリアとなる。また、記憶デバイス２０２は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス２０２としては、たとえば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、フラッシュメモリがある。入力デバイス２０３は、データを入力する。入力デバイス２０３としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナ、マイクがある。出力デバイス２０４は、データを出力する。出力デバイス２０４としては、たとえば、ディスプレイ、プリンタ、スピーカがある。通信ＩＦ２０５は、ネットワーク１０４と接続し、データを送受信する。

以下、上記実験計画システムを用いた実験計画例を実施例ごとに説明する。

実施例１は、勾配降下による候補点生成例１を示す。実験計画装置１０１において、後述するグラフ構造を構成する各ノードは、具体的には、たとえば、図２に示した記憶デバイス２０２に記憶されたプログラムをプロセッサ２０１に実行させることにより実現される。

図３は、実施例１にかかる実験計画装置１０１の機能的なグラフ構造例を示すブロック図である。入力ノード３００は、設計パラメータｘ［ｉ］の入力を受け付ける。設計パラメータｘ［ｉ］は、設計パラメータｘｉ１，ｘｉ２，…，ｘｉｊ，…，ｘｉｎ（ｎは整数）の集合であり、推論モデル３０１および距離コストノード群３０２への入力ベクトルである。ｉは、実験計画装置１０１により探索したい候補点Ｐｉの番号を示すイタレーションである。初期値はｉ＝０である。

設計パラメータｘ［ｉ］は、実験装置１０３への初期の入力ベクトルまたは設計パラメータｘ［ｉ－１］が勾配降下されたことにより修正された入力ベクトルである。ｊは、設計パラメータｘ［ｉ］内の要素ｘｉ１，ｘｉ２，…，ｘｉｊ，…，ｘｉｎを特定する番号である（軸ｊと称することもある）。

推論モデル３０１は、実験装置１０３に関する出力を推論するニューラルネットワークであり、回帰でも識別でもよいが、推論結果を評価する評価値をコストＣ１ｉとして出力する。コストＣ１ｉは、たとえば、実験装置１０３に設計パラメータｘ［ｉ］を適用した場合の性能の悪さを示す指標値（値が高いほど性能が悪いことを示す。たとえば、故障率や値段。）である。実験計画装置１０１は、当該性能が良くなるように設計パラメータｘ［ｉ］を修正することになる。

また、実験計画装置１０１が、未学習のニューラルネットワークを有し、学習装置１０２から推論モデル３０１を構成する学習パラメータ（重み、バイアス、ハイパーパラメータ）を取得して、未学習のニューラルネットワークに設定してもよい。なお、図３では、推論モデル３０１を１つとしたが複数でもよい。これにより、複数の推論モデル３０１に共通して適用可能な設計パラメータｘ［ｉ］を生成することができる。

距離コストノード群３０２は、０個以上の距離コストノード３０２－１，３０２－２，…，３０２－ｉの集合である。距離コストノード３０２－ｉは、設計パラメータｘ［ｉ］から離間距離ｔｈｉ離れた設計パラメータ空間上の新たな位置での距離コストＣ２ｉを軸ｊごとに算出する。離間距離ｔｈｉ離すことにより、出力解が局所最適解の近傍に集中するのを抑制する。距離コストＣ２ｉは、設計パラメータｘｉｊについて算出された距離コストＣ２ｉｊの集合である。

コスト加算ノード３０３は、設計パラメータｘ［ｉ］が推論モデル３０１および距離コストノード３０２－１～距離コストノード３０２－ｉに入力された場合の、推論モデル３０１からのコストＣ１ｉと、距離コストノード３０２－１～距離コストノード３０２－ｉまでの距離コストＣ２１～距離コストＣ２ｉと、を加算する。コスト加算ノード３０３は、加算結果であるコストＣ３ｉ（＝Ｃ１ｉ＋Ｃ２１＋…＋Ｃ２ｉ）を損失関数出力ノード３０４に出力する。

損失関数出力ノード３０４は、コストＣ３ｉを入力して、コストＣ３ｉを微分して勾配降下することにより、設計パラメータｘ［ｉ］への誤差逆伝播による修正を繰り返す。コストＣ３ｉの微分値をΔＣ３ｉとする。具体的には、たとえば、損失関数出力ノード３０４は、この微分値ΔＣ３ｉが所定のしきい値（後述する図６の終了判定基準値）以下となるまで、修正後の設計パラメータｘ［ｉ］から得られたコストＣ３ｉによる勾配降下と当該修正後の設計パラメータｘ［ｉ］の修正とを繰り返す。

図４は、実施例１にかかる勾配降下による候補点生成処理手順例を示すフローチャートである。図５は、実施例１にかかる勾配降下による候補点生成例を示す説明図である。図６は、実施例１にかかる勾配降下の推移を示すグラフである。図５では、説明を単純化するため、設計パラメータｘ［ｉ］を２つ（ｎ＝２）の設計パラメータｘｉ１，ｘｉ２とする。

実験計画装置１０１は、入力初期化を実行する（ステップＳ４０１）。具体的には、たとえば、図５の（Ａ）に示したように、イタレーションｉにおいて入力初期化された設計パラメータｘ［ｉ］をｘｉｓと表記する。図５の（Ａ）では、ｉ＝０であるため、実験計画装置１０１は、設計パラメータｘｉｓ＝ｘ０ｓ＝｛ｘ０１、ｘ０２｝を設定する。ｉ＝０においては、距離コストノード３０２－ｉは１つも接続されていない。

つぎに、実験計画装置１０１は、候補点出力条件を充足しているか否かを判断する（ステップＳ４０２）。候補点出力条件とは、コストＣ３ｉの微分による勾配降下により、ΔＣ３ｉが図６に示した勾配降下の終了判定基準値以下になること、または、イタレーションｉにおける勾配降下回数が所定回数（図６の例では７５回）に到達したことである。コストＣ３ｉの微分による勾配降下により候補点出力条件を充足したときの設計パラメータｘ［ｉ］を設計パラメータｘｉｅと表記する。

ΔＣ３ｉが勾配降下の終了判定基準値以下になれば（ステップＳ４０２：Ｙｅｓ）、勾配降下によるコスト最小化が実現されたことになり、実験計画装置１０１は、その時の修正で得られた設計パラメータｘｉｅの位置を候補点Ｐｉに決定し、候補点出力リストに追加することになる（ステップＳ４０４）。

また、ΔＣ３ｉが勾配降下の終了判定基準値以下でなくても、ステップＳ４０３の実行回数が所定回数以上になれば、ステップＳ４０３の実行回数を初期化し、実験計画装置１０１は、その時の修正で得られた設計パラメータｘ［ｉ］の位置を候補点Ｐｉに決定することになる（ステップＳ４０４）。実験計画装置１０１は、候補点出力条件を充足していなければ（ステップＳ４０２：Ｎｏ）、ステップＳ４０３を繰り返し実行する。

ステップＳ４０２：Ｎｏの場合、実験計画装置１０１は、推論モデル３０１および距離コストノード３０２－１～３０２－ｉでのコスト計算と、コスト加算ノード３０３による加算と、に基づいて、勾配降下によるコスト最小化を実行する（ステップＳ４０３）。具体的には、たとえば、実験計画装置１０１は、設計パラメータｘｉｓを推論モデル３０１および距離コストノード３０２－１～３０２－ｉに入力し、推論モデル３０１から、出力となるコストＣ１ｉを取得するとともに、距離コストノード３０２－１から距離コストノード３０２－ｉまでの距離コストＣ２１～Ｃ２ｉを取得する。そして、実験計画装置１０１は、コスト加算ノード３０３によりコストＣ１ｉと距離コストＣ２１～Ｃ２ｉとを加算して、加算結果であるコストＣ３ｉを損失関数出力ノード３０４に出力する。

ｉ＝０においては、実験計画装置１０１は、距離コストノード３０２－ｉは１つも接続されていないため、設計パラメータｘ０ｓを推論モデル３０１に入力し、推論モデル３０１から、出力となるコストＣ１０を取得し（ステップＳ４０３－０）、加算結果であるコストＣ３０（＝Ｃ１０）を損失関数出力ノード３０４に出力する。

そして、損失関数出力ノード３０４は、コスト加算ノード３０３からのコストＣ３ｉが入力されると、勾配降下によるコスト最小化を実行する。具体的には、たとえば、損失関数出力ノード３０４は、コストＣ３ｉを微分して損失としてΔＣ３ｉを算出し、設計パラメータｘ［ｉ］を修正する。

そして、実験計画装置１０１は、損失関数出力ノード３０４からのΔＣ３ｉが候補点出力条件を充足するか否かを判断する（ステップＳ４０２）。ΔＣ３ｉが候補点出力条件を充足した場合（ステップＳ４０２：Ｙｅｓ）、実験計画装置１０１は、その時の設計パラメータｘｉｅを候補点Ｐｉとして候補点出力リストを追加する（ステップＳ４０４）。ｉ＝０の場合、図５の（Ａ）に示すように、実験計画装置１０１は、その時の設計パラメータｘ０ｅを候補点Ｐ０として候補点出力リストに追加する（ステップＳ４０４－０）。

そして、実験計画装置１０１は、イタレーションｉをインクリメントし（ステップＳ４０５）、候補点出力リストに登録された候補点数が所定数Ｎ（Ｎは１以上の整数。）を超えたか否か、すなわち、ｉがＮを超えたか否かを判断する（ステップＳ４０６）。

候補点数が所定数Ｎを超えていない場合（ステップＳ４０６：Ｎｏ）、実験計画装置１０１は、ステップＳ４０４であらたに追加された候補点Ｐ（ｉ－１）を設計パラメータｘｉｓとして、設計パラメータｘｉｓに対する距離コストノード３０２－ｉを距離コストノード群３０２に追加してＲｅＬＵ場Ａｉを発生させ（ステップＳ４０７）、ステップＳ４０２に移行する。

具体的には、たとえば、図５の（Ｂ）に示したように、実験計画装置１０１は、（Ａ）の候補点Ｐ０を設計パラメータｘ１ｓとし、ＲｅＬＵ場Ａ１を発生させる（ステップＳ４０７－１）。そして、ステップＳ４０２に移行する。

ステップＳ４０２に戻ると、実験計画装置１０１は、設計パラメータｘ１ｓが候補点出力条件の充足判定を実行し（ステップＳ４０２）、充足していなければ（ステップＳ４０２：Ｎｏ）、図５の（Ｂ）および図６に示したように、勾配降下によるコスト最小化を実行する（ステップＳ４０３－１）。ｉ＝１においては、実験計画装置１０１は、設計パラメータｘ１ｓを推論モデル３０１および距離コストノード３０２－１に入力し、推論モデル３０１および距離コストノード３０２－１の各々から、出力となるコストＣ１１および距離コストＣ２１を取得する。

実験計画装置１０１は、ｉ＝１においては、コスト加算ノード３０３により、加算結果であるコストＣ３１（＝Ｃ１１＋Ｃ２１）を損失関数出力ノード３０４に出力する。そして、損失関数出力ノード３０４は、コスト加算ノード３０３からのコストＣ３１が入力されると、勾配降下によるコスト最小化を実行する。具体的には、たとえば、損失関数出力ノード３０４は、コストＣ３１を微分して損失関数としてΔＣ３１を算出し、設計パラメータｘ［１］を修正する。

そして、実験計画装置１０１は、損失関数出力ノード３０４からのΔＣ３ｉが候補点出力条件を充足するか否かを判断する（ステップＳ４０２）。ｉ＝１では、図６に示したように、勾配降下回数が所定回数に到達する前にΔＣ３１が勾配降下の終了判定基準値以下になる（ステップＳ４０２：Ｙｅｓ）。したがって、実験計画装置１０１は、図５の（Ｂ）に示すように、その時の設計パラメータｘ１ｅを候補点Ｐ１として候補点出力リストを追加する（ステップＳ４０４－１）。

そして、実験計画装置１０１は、イタレーションｉをインクリメントし（ステップＳ４０５）、候補点出力リストに登録された候補点数が所定数Ｎを超えたか否か、すなわち、ｉがＮを超えたか否かを判断する（ステップＳ４０６）。

候補点数が所定数Ｎを超えていない場合（ステップＳ４０６：Ｎｏ）、実験計画装置１０１は、ステップＳ４０４であらたに追加された候補点Ｐ１を設計パラメータｘ２ｓとして、設計パラメータｘ２ｓに対する距離コストノード３０２－２を距離コストノード群３０２に追加してＲｅＬＵ場Ａ２を発生させ（ステップＳ４０７－２）、ステップＳ４０２に移行する。

ステップＳ４０２に戻ると、実験計画装置１０１は、設計パラメータｘ２ｓが候補点出力条件の充足判定を実行し（ステップＳ４０２）、充足していなければ（ステップＳ４０２：Ｎｏ）、図５の（Ｃ）および図６に示したように、勾配降下によるコスト最小化を実行する（ステップＳ４０３－２）。ｉ＝２においては、設計パラメータｘ２ｓを推論モデル３０１、距離コストノード３０２－１および距離コストノード３０２－２に入力し、推論モデル３０１、距離コストノード３０２－１および距離コストノード３０２－２の各々から、出力となるコストＣ１２および距離コストＣ２１，Ｃ２２を取得する。

そして、実験計画装置１０１は、ｉ＝２においては、距離コストノード３０２－１，３０２－２が接続されているため、コスト加算ノード３０３により、加算結果であるコストＣ３２（Ｃ１２＋Ｃ２１＋Ｃ２２）を損失関数出力ノード３０４に出力する。そして、損失関数出力ノード３０４は、コスト加算ノード３０３からのコストＣ３１が入力されると、勾配降下によるコスト最小化を実行する。具体的には、たとえば、損失関数出力ノード３０４は、コストＣ３１を微分して損失関数としてΔＣ３２を算出し、設計パラメータｘ［２］を修正する。

図７は、設計パラメータｘ［２］の修正例を示す説明図である。設計パラメータｘ［２］の修正量は、推論モデル３０１の勾配による修正力と、候補点Ｐ０からの修正力と、候補点Ｐ１からの修正力と、の合成により、ＲｅＬＵ場Ａ１，Ａ２を回避するように決定される。

図４に戻り、実験計画装置１０１は、ΔＣ３ｉが候補点出力条件を充足するか否かを判断する（ステップＳ４０２）。ｉ＝２では、図６に示したように、勾配降下回数が所定回数に到達する前にΔＣ３２が勾配降下の終了判定基準値以下になる（ステップＳ４０２：Ｙｅｓ）。したがって、実験計画装置１０１は、図５の（Ｃ）に示すように、その時の設計パラメータｘ２ｅを候補点Ｐ２として候補点出力リストを追加する（ステップＳ４０４－２）。

ここで、候補点数が所定数Ｎを超えたとすると（ステップＳ４０６：Ｙｅｓ）、実験計画装置１０１は、勾配降下による候補点生成処理を終了する。

このあと、実験計画装置１０１は、候補点Ｐ０～Ｐ２を含む候補点出力リストを実験装置１０３に送信する。実験装置１０３は、候補点Ｐ０～Ｐ２の各々をあらたな設計パラメータｘ［ｉ］として実験を行う。実験装置１０３は、当該あらたな設計パラメータｘ［ｉ］とその実験結果とを学習装置１０２に送信する。学習装置１０２は、あらたな設計パラメータｘ［ｉ］とその実験結果とを学習データセットに追加して、推論モデル３０１を再学習する。

＜距離コストノードの具体的な構造例＞
図８は、実施例１にかかる距離コストノード３０２－ｉの具体的な構造例を示す説明図である。距離コストノード３０２－ｉにおいて、入力ノード３００には設計パラメータｘ［ｉ］として、（ｘｉ１，ｘｉ２，…，ｘｉｎ）が入力される。ｘｉ１，ｘｉ２，…，ｘｉｎを区別しない場合、単に設計パラメータｘｉと表記する。

設計パラメータｘ［ｉ］は、ｎ個の軸で張られる設計パラメータ空間５００内のベクトルである。入力ノード３００は、設計パラメータｘ［ｉ］の入力を受け付けて、推論モデル３０１および距離コストノード３０２－ｉに出力する。推論モデル３０１は、推論結果であるコストＣ１ｉをコスト加算ノード３０３に出力する。

距離コストノード３０２－ｉは、距離ノード８１０とコストノード８２０とを有する。距離ノード８１０は、１つ以上前のイタレーション（ｉ－ｋ）で生成された候補点Ｐ（ｉ－ｋ）（以降、Ｐａと表記する場合あり）であるイタレーションｉの設計パラメータｘｉｓと設計パラメータｘｉｓから開始された勾配降下後の設計パラメータｘ［ｉ］との距離を算出するノードであり、第１減算処理８１１と絶対値処理８１２とを実行する。ただし、ｋは１以上ｉ以下の整数である。第１減算処理８１１は、入力ノード３００の設計パラメータｘ［ｉ］を候補点Ｐａ（ａ１，ａ２，…，ａｎ）で減算し、第１減算結果８１１０を出力する処理である。

絶対値処理８１２は、第１減算処理８１１の第１減算結果８１１０を絶対値ベクトル８１２０にする処理である。すなわち、距離ノード８１０は、設計パラメータｘ［ｉ］と候補点Ｐａとの差分の絶対値ベクトル８１２０、すなわち、設計パラメータｘ［ｉ］と候補点Ｐａとの間の距離を求める。

コストノード８２０は、第２減算処理８２１と、ＲｅＬＵ活性化処理８２２と、重み付け処理８２３と、を実行する。第２減算処理８２１は、絶対値処理８１２の絶対値ベクトル８１２０の各軸ｊの要素について、離間距離ｔｈとの差分をとり、第２減算結果８２１０を出力する処理である。離間距離ｔｈは軸ｊごとに任意に設定可能なハイパーパラメータである。これにより、離間距離ｔｈ以上に離間された候補点Ｐｉのセットが取得される。この時点での出力は、離間が不十分な軸ｊに対して正であり、十分な軸ｊに対して負である。

ＲｅＬＵ活性化処理８２２は、第２減算処理８２１からの第２減算結果８２１０を、ＲｅＬＵ関数に入力して活性化する。具体的には、たとえば、ＲｅＬＵ活性化処理８２２は、負の値（離間が十分な軸ｊの値）が入力されると、勾配０、正の値（離間が不十分な軸ｊの値）が入力されると勾配１となる出力を生成する。つまり、ＲｅＬＵ活性化処理８２２は、離間距離ｔｈが不十分な軸ｊに対して勾配を発生させ、候補点Ｐａから離間させるように入力にフィードバックする。

重み付け処理８２３は、ＲｅＬＵ活性化処理８２２からの出力値の各々を適当な結合により重み付けし、コスト加算ノード３０３に出力する処理である。具体的には、たとえば、重み付け処理８２３は、ＲｅＬＵ活性化処理８２２からの出力値の集合から最小出力値を抽出してもよく、出力値の集合の和を算出してもよい。重み付け処理８２３は、結合時の重みを変更することにより、離間の優先度を調整することができる。

ここで、コスト加算ノード３０３からの出力をＦ（ｘ）とすると、下記式（１），（２）により、損失関数出力ノード３０４は、設計パラメータｘ［ｉ］を修正する。なお、ηは学習率（０＜η≦１）であり、「←」は代入を表し、Ｌ（Ｆ（ｘ））は損失関数出力ノード３０４の出力である。損失関数は、一般には目標値との誤差について評価するが、Ｆ（ｘ）＞０となるように各ノードを設計していれば、目標値は常に０としてよい。つまり、実験計画装置１０１は関数Ｆ（ｘ）を単純に最小化させる動作を行う。

ｄ｛Ｌ（Ｆ（ｘ）－０）｝／ｄｘ＝ｄＬ／ｄＦ×ｄＦ／ｄｘ・・・（１）
ｘ［ｉ］←ｘ［ｉ］－η×ｄＬ／ｄＦ×ｄＦ／ｄｘ・・・・・（２）

なお、上記式（１），（２）による誤差逆伝播において、下記式（３）に示すように、重みづけ処理８２３に用いるＷを軸ｊごとに変化させることで、距離コストノード３０３の入力修正への寄与、つまり学習率ηを軸ｊごとに変化させることができる。なお、ｓｉｇｎ（ｘ）はｘが負の時に－１を、正の時に１を、０の時に０を返す関数である。Ｃ１ｉは推論モデルの出力値であり、重みＷに影響されない。

ｄＦ（ｘ）／ｄｘｊ＝ｄＣ１ｉ／ｄｘｊ＋ｄＣ２ｉ／ｄｘｊ
＝ｄＣ１ｉ／ｄｘｊ－ｓｉｇｎ（ｘｊ－ａｊ）×Ｗｊ
（ただし、ｔｈｊ＜｜ｘｊ－ａｊ｜）・・・・（３）

図９は、距離コストノード３０２－ｉの追加例を示す説明図である。図９では、図４に示したステップＳ４０４により新たな候補点Ｐ１が候補点出力リストに出力された場合に、当該候補点Ｐ１が設定される距離コストノード３０２－２を追加する例である。このようなグラフ構造の変更により、候補点Ｐ（ｉ―１）が追加される都度、距離コストノード３０２－ｉが接続される。

なお、距離コストノード３０２－１が接続され、距離コストノード３０２－２が未接続状態、すなわち、候補点がＰ０のみである場合、距離コストノード３０２－１は、設計パラメータｘ［１］と候補点Ｐ０との入力により距離コストＣ２１を算出する。また、距離コストノード３０２－２が接続されると、距離コストノード３０２－１は、設計パラメータｘ［２］と候補点Ｐ０との入力により距離コストＣ２１を算出する。

このように、ｉ－１番目までの距離コストノード３０２－（ｉ－１）は、距離コストノード３０２－ｉが追加される都度、入力される設計パラメータｘ［ｉ］が変わる。したがって、ｋ（ｋ＝１～ｉ）番目の距離コストノード３０２－ｋが、設計パラメータｘ［ｉ］と候補点Ｐ（ｋ－１）との入力により算出する距離コストＣ２ｋを、Ｃ２ｋ（ｉ，ｋ－１）と表記する。

上記の例では、前者の距離コストＣ２１は、Ｃ２１（１，０）となり、後者の距離コストＣ２１は、Ｃ２１（２，０）となる。距離コストＣ２１（１，０）と距離コストＣ２１（２，０）とは異なる距離コストである。

このように、実施例１によれば、離間距離ｔｈによって直観的に離間の程度を定めることができるため、実験的に使いやすい離散化された候補点Ｐｉ群を得ることができる。また、重み付け処理８２３において重みＷによって離間の優先度を決めることができる。単純に最小値や和を取ってもよく、その場合ハイパーパラメータが少なく使いやすい。また、距離コストの計算は単純な加減積算のみであるため、距離コストノード３０２－ｉにおいて勾配消失を生じず、勾配降下の収束に悪影響を与えない。また、離間が十分ならば、推論モデル３０１の最適化に影響を与えない。

つぎに、実施例２について説明する。実施例２では、実施例１との相違点を中心に説明するため、実施例１との共通部分については説明を省略する。実施例１では、候補点Ｐ（ｉ－１）が新たに出力されると、距離コストノード３０２－ｉが新たに追加された。実施例２では、実験計画装置１０１は、あらかじめ、グラフ構造において、複数の距離コストノード３０２－１，３０２－２，…，３０２－ｉを接続しておく。距離コストノード３０２－ｉの各々の候補点Ｐａの各値ｘａｊは、候補点Ｐａとして取りえない値ｉｎｆに設定しておく。すなわち、ｉｎｆは、距離コストノード３０２－ｉに入力されると、距離コストノード３０２－ｉが０を出力するような値である。

そして、図４に示したステップＳ４０４により新たな候補点Ｐａが出力された場合に、実験計画装置１０１は、未選択の距離コストノード３０２－ｉを選択し、選択した距離コストノード３０２－ｉの候補点Ｐａの軸ｊごとの値ｉｎｆを、新たに出力された候補点Ｐａの値ａｊに置換する。

図１０は、実施例２にかかる距離コストノード３０２－ｉの追加例を示す説明図である。説明を単純化するため、図１０では、あらかじめ用意された距離コストノード３０２－ｉの総数を３とするが、２または４以上でもよい。（Ａ）はグラフ構造の初期状態を示し、（Ｂ）は１個目の候補点Ｐ０の取得後のグラフ構造を示し、（Ｃ）は２個目の候補点Ｐ１の取得後のグラフ構造を示す。

未選択の距離コストノード３０２－ｉに設定される候補点Ｐａの値ｉｎｆは、距離コストノード３０２－ｉのＲｅＬＵ関数に入力されると、勾配０を出力するような値である（ＲｅＬＵ（ｔｈ－｜ｉｎｆ－ｘ｜）＝０）。

（Ａ）グラフ構造の初期状態において、実験計画装置１０１は、図４および図５（Ａ）に示したように、候補点出力条件を充足するまで（ステップＳ４０２：Ｎｏ）、勾配降下によるコスト最小化、すなわち、ΔＣ３０の算出と設計パラメータｘ［０］の修正とを繰り返す。このとき、推論モデル３０１はコストＣ１０をコスト加算ノード３０３に出力し、距離コストノード３０２－１～３０２－３は距離コストとして０を出力する。

候補点出力条件を充足すると（ステップＳ４０２：Ｙｅｓ）、実験計画装置１０１は、図４および図５（Ａ）に示したように、候補点Ｐ０を候補点出力リストに追加する（ステップＳ４０４－０）。これにより、（Ｂ）に示すように、距離コストノード３０２－１に入力される値ｉｎｆは候補点Ｐ０の値ｘ０ｊに置換される。したがって、距離コストノード３０２－１は、設計パラメータｘ［１］が入力されると、距離コストＣ２１（１，０）を出力するようになる。

（Ｂ）１個目の候補点Ｐ０取得後のグラフ構造において、実験計画装置１０１は、図４および図５（Ａ）に示したように、候補点出力条件を充足するまで（ステップＳ４０２：Ｎｏ）、勾配降下によるコスト最小化、すなわち、ΔＣ３１の算出と設計パラメータｘ［１］の修正とを繰り返す。このとき、推論モデル３０１はコストＣ１１をコスト加算ノード３０３に出力し、距離コストノード３０２－１は距離コストＣ２１（１，０）を出力し、距離コストノード３０２－２，３０２－３は距離コストとして０を出力する。

候補点出力条件を充足すると（ステップＳ４０２：Ｙｅｓ）、実験計画装置１０１は、図４および図５（Ａ）に示したように、候補点Ｐ１を候補点出力リストに追加する（ステップＳ４０４－１）。これにより、（Ｃ）に示すように、距離コストノード３０２－２に入力される値ｉｎｆは候補点Ｐ１の値ｘ１ｊに置換される。したがって、距離コストノード３０２－２は、設計パラメータｘ［２］が入力されると、距離コストＣ２２（２，１）を出力するようになる。

（Ｃ）２個目の候補点Ｐ１取得後のグラフ構造において、実験計画装置１０１は、図４および図５（Ａ）に示したように、候補点出力条件を充足するまで（ステップＳ４０２：Ｎｏ）、勾配降下によるコスト最小化、すなわち、ΔＣ３２の算出と設計パラメータｘ［２］の修正とを繰り返す。このとき、推論モデル３０１はコストＣ１２をコスト加算ノード３０３に出力し、距離コストノード３０２－１は距離コストＣ２１（２，１）を出力し、距離コストノード３０２－２は距離コストＣ２２（２，１）を出力し、距離コストノード３０２－３は距離コストとして０を出力する。

候補点出力条件を充足すると（ステップＳ４０２：Ｙｅｓ）、実験計画装置１０１は、図４および図５（Ａ）に示したように、候補点Ｐ２を候補点出力リストに追加することになる（ステップＳ４０４－２）。

このように、勾配降下による候補点Ｐａ生成前に、候補点Ｐａの値ｉｎｆが設定された複数の距離コストノード３０２－ｉを入力ノード３００およびコスト加算ノード３０３間に接続しておくことで、候補点Ｐａが追加される都度、候補点Ｐａの値ｉｎｆを書き換えるだけで、距離コストノード３０２－１～３０２－ｉでの演算を実行することができる。このように、実行開始時からグラフ構造が固定されるため、静的なグラフ構造となりスループットも向上する。

つぎに、実施例３について説明する。実施例３では、実施例１および実施例２との相違点を中心に説明するため、実施例１および実施例２との共通部分については説明を省略する。

図１１は、実施例３にかかる勾配降下による候補点生成例を示す説明図である。図１２は、実施例３にかかる距離コストノードによる勾配の可視化例１を示す説明図である。図１３は、実施例３にかかる距離コストノードによる勾配の可視化例２を示す説明図である。図１２は、図１１の（Ｂ）におけるＲｅＬＵ場Ｂ１を示しており、図１３は、図１１の（Ｂ）におけるＲｅＬＵ場Ｂ１，Ｂ２を示している。

図５との相違点は、ＲｅＬＵ場の形状が異なる点である。距離コストノード３０２－ｉの計算が実施例１とは異なるため、ＲｅＬＵ場Ｂｉは、候補点Ｐ（ｉ－１）（設計パラメータｘｉｓ）を頂点とする四角錐形状（いわゆるピラミッド形状）となる。すなわち、ＲｅＬＵ場Ａｉと異なり、ＲｅＬＵ場Ｂｉでは、ＲｅＬＵ場Ｂｉの設計パラメータｘｉの各軸ｊの値ｘｉ１，ｘｉ２の範囲が制限される。

図１３において、ＲｅＬＵ場Ｂ１，Ｂ２の重複領域ＯＬＢは平坦面になるため、実施例１のＲｅＬＵ場Ａ１，Ａ２の十字型の重複領域ＯＬＡと比較して、多峰性問題が緩和される。つぎに、上述したＲｅＬＵ場Ｂ１，Ｂ２を生成する距離コストノード３０２－ｉの具体例について説明する。

図１４は、実施例３にかかる距離コストノード３０２－ｉの一例を示す説明図である。ここでは、例として、距離コストノード３０２－１を例に挙げて説明する。実施例３にかかる距離コストノードのうち、距離ノード８１０は実施例１と同一構成である。実施例３にかかるコストノード８２０は、第２減算処理８２１とＲｅＬＵ活性化処理８２２との間で、１／ｔｈ乗算処理１４２１と最小値選択処理１４２２とを実行し、重み付け処理８２３は実行されない。

１／ｔｈ乗算処理１４２１は、第２減算処理８２１からの第２減算結果８２１０に、離間距離ｔｈの逆数ベクトル（１／ｔｈ１，…，１／ｔｈｊ，…，１／ｔｈｎ）を乗じ、乗算結果１４２１０を出力する処理である。これにより、ＲｅＬＵ場Ｂｉの各軸ｊの範囲が１／ｔｈｊに制限される。

最小値選択処理１４２２は、１／ｔｈ乗算処理１４２１の乗算結果１４２１０から最小値を選択する処理である。したがって、ＲｅＬＵ活性化処理８２２では、最小値選択処理１４２２によって選択された最小値をＲｅＬＵ関数に入力して活性化する。設計パラメータｘ［ｉ］は、ＲｅＬＵ場Ｂｉの最小値選択処理１４２２によって選択された最小値の軸ｊ方向のみに修正力を受ける。つまり、図５と図１１の比較により明らかなように、ＲｅＬＵ場により選択不能になる領域が小さい。したがって、候補点として選択可能な解の多様性に優れる。

このように、設計パラメータｘ［ｉ］は、最小値選択処理１４２２で離間距離が最小化された軸ｊの勾配降下する、すなわち、最短で離間可能な軸ｊにより設計パラメータｘ［ｉ］をＲｅＬＵ場Ｂｉの頂点である候補点Ｐａから離間させる。このように、常に注目した軸ｊについて取り扱うので、直観的で管理しやすい。

また、ＲｅＬＵ場Ｂ１，Ｂ２の重複領域ＯＬＢでは、勾配が打ち消しあうため単純な場になりやすく、損失関数Ｌによりコストの山が複数生じて複雑化するという多鋒性の問題が緩和される。特にグリッド探索の場合は有効である。

つぎに、実施例４について説明する。実施例４では、実施例１～実施例３との相違点を中心に説明するため、実施例１～実施例３との共通部分については説明を省略する。実施例４は、実験計画装置１０１が、設計パラメータ空間５００をグリッド分割し、設計パラメータｘ［ｉ］を格子点に量子化して候補点を生成する例である。

図１５は、実施例４にかかるグリッド探索例を示す説明図である。図１６は、実施例４にかかる勾配降下による候補点生成処理手順例を示すフローチャートである。図４との相違は、ステップＳ４０２：ＹｅｓとステップＳ４０４との間に量子化（ステップＳ１６００）が追加された点である。

図１５において、設計パラメータ空間５００は、グリッド状に分割されている。縦横のグリッド線ｇｌｖ、ｇｌｈで囲まれた領域をグリッドと称す。図１５では、例としてグリッドＧ１～Ｇ４を示す。縦のグリッド線ｇｌｖと横のグリッド線ｇｌｈとの交点を格子点と称す。隣接する格子点の間隔をｄとする。なお、ｄは軸ｊごとに異なる値を取ってもよい。設計パラメータｘ［ｉ］は、格子点上に位置しない場合には量子化により最も近い格子点に量子化される。

また、図１５は、図１１の（Ｂ）の状態を示している。ここでは、説明を単純化するため、ＲｅＬＵ場Ｂ１の底面を正方形とし、その辺の長さを離間距離ｔｈの２倍（２×ｔｈ）とする。なお、離間距離ｔｈｊは軸ｊごとに異なる距離となるが、ここでは、説明を単純化するため、ｔｈ１＝ｔｈ２＝ｔｈとする。

図１６において、ステップＳ４０２：Ｙｅｓのあと、実験計画装置１０１は、候補点出力条件を充足した設計パラメータｘ［ｉ］を量子化する（ステップＳ１６００）。具体的には、たとえば、実験計画装置１０１は、図１５において、設計パラメータｘ［ｉ］を最短距離（ユークリッド距離でもマンハッタン距離でもよい）の格子点に移動させる。量子化後の設計パラメータｘ［ｉ］をＱ（ｘ［ｉ］）とする。

たとえば、ｘ［１］＝（０．１，１．３）が候補点出力条件を充足する勾配降下の収束値だった場合、Ｑ（ｘ［１］）＝（０，１）が候補点として追加される（ステップＳ４０４）。また、図１５において、ＲｅＬＵ場Ｂ１はＱ（ｘ［１］）が位置する格子点を中心に発生する（ステップＳ４０７）。

軸ｊ＝１方向に勾配降下する場合、勾配降下により、格子点上のＱ（ｘ［ｉ］）は右隣の格子点に移動する。すなわち、２×ｔｈ＞ｄを満たせば、ＲｅＬＵ場Ｂ１内の格子点上のＱ（ｘ［ｉ］）はＲｅＬＵ場Ｂ１外の格子点に移動する。したがって、勾配降下によりＱ（ｘ［ｉ］）が同じ格子点にとどまらず、異なる格子点に勾配降下することにある。

また、設計パラメータｘ［２］の勾配降下では、設計パラメータｘ［２］は、ＲｅＬＵ場Ｂ１の範囲内に収束することはないため、設計パラメータｘ［２］が候補点出力条件を充足すると（ステップＳ４０２：Ｙｅｓ）、量子化後の設計パラメータＱ（ｘ［２］）は、自動的にＲｅＬＵ場Ｂ１の範囲外の格子点に収束する（ステップＳ１６００）。これにより、Ｑ（ｘ［ｉ］）同士が同じ格子点に落ちたかどうかの判定が不要になる。

このように、実施例４では、グリッド化された設計パラメータ空間５００において、設計パラメータｘ［ｉ］を量子化することにより、設計パラメータＱ（ｘ［ｉ］）が同一格子点上に集中するのを回避することができ、設計パラメータＱ（ｘ［ｉ］）の効率的な離散化を図ることができる。

つぎに、実施例５について説明する。実施例５では、実施例１～実施例４との相違点を中心に説明するため、実施例１～実施例４との共通部分については説明を省略する。実施例５は、ユークリッド距離をコストにする例である。

たとえば、設計パラメータｘｉ１がエネルギーであり、設計パラメータｘｉ２が位置であるとすると、設計パラメータｘｉ１の次元数と設計パラメータｘｉ２の次元数は、異なる。したがって、設計パラメータｘｉ１，ｘｉ２間で和や差を取るのは定性的に危険であり、実施例３で示したようなピラミッド型のＲｅＬＵ場Ｂ１，Ｂ２で離間した方がよい。

一方、設計パラメータｘｉ１，ｘｉ２の次元数が、たとえば、エネルギーのように同一である場合、ユークリッド距離を用いることができる。この場合、実験計画装置１０１は、同じ離間距離ｔｈでも、実施例３のピラミッド型と比べて同一の空間体積の中でより多くの候補点を探索することができる。

図１７は、実施例５にかかる距離コストノード３０２－ｉの一例を示す説明図である。図１８は、実施例５にかかる距離コストノード３０２－ｉによる勾配の可視化例を示す説明図である。図１７において、距離ノード８１０は、第１減算処理８１１と、乗算処理１７１２と、を実行する。乗算処理１７１２は、第１減算結果８１１０に設計パラメータｘ［ｉ］および（１／ｔｈ０^２，１／ｔｈ１^２，…，１／ｔｈｎ^２）を乗算し、乗算結果１７１２０を出力する処理である。

また、コストノード８２０は、加算処理１７２１と、第３減算処理１７２２と、ＲｅＬＵ活性化処理８２２と、を実行する。加算処理１７２１は、乗算結果１７１２０の各軸ｊの要素を加算し、加算結果１７２１０を出力する処理である。第３減算処理は、加算結果１７２１０を１から減算し、第３減算結果１７２２０を出力する処理である。

ＲｅＬＵ活性化処理８２２は、第３減算結果１７２２０をＲｅＬＵ関数に入力して活性化し、距離コストＣ２ｉを出力する。具体的には、たとえば、ＲｅＬＵ活性化処理８２２は、第３減算結果１７２２０が０以下であれば勾配０を出力する。一方、ＲｅＬＵ活性化処理８２２は、第３減算結果１７２２０が０より大きければ、勾配１を出力する。たとえば、図１１の（Ｂ）の状態において、勾配降下先の点が、図１８に示したような半楕円体形状のＲｅＬＵ場Ｂ１の中にある場合は勾配１を出力する。

実施例５によれば、ユークリッド距離をコストに用いることにより、最短で離間可能なようにすべての軸ｊを使って勾配ベクトルが発生する。したがって、各軸ｊの設計パラメータｘ［ｉ］の次元数が同じ場合に有用である。また、図１７に示したＲｅＬＵ場Ｂ１は半楕円体形状となるため、実施例３のような四角錘に比べて、パラメータ空間へ射影した体積（面積）が小さい。パラメータ空間においてＲｅＬＵ場が発生すると、その射影体積分だけ選択できる領域が狭まる。したがって、実施例５によれば、より多くの候補点を探索することができる。

つぎに、実施例６について説明する。実施例６では、実施例１～実施例５との相違点を中心に説明するため、実施例１～実施例５との共通部分については説明を省略する。実施例６は、グラフ構造において、推論モデル３０１とコスト加算ノード３０３との間に、コスト調整層を接続した例である。

図１９は、実施例５にかかるグラフ構造例を示す説明図である。実施例５では、２つの推論モデル３０１ａ，３０１ｂがあるが、推論モデル３０１は１つでもよい。推論モデル３０１ａ，３０１ｂを区別しない場合は、単に推論モデル３０１と表記する。出力されるコストＣ１ｉａ，Ｃ１ｉｂ，ＡＤ（Ｃ１ｉａ），ＡＤ（Ｃ１ｉｂ）も同様に末尾のａ，ｂを省略する。また、図１８では、例として、距離コストノード３０２－１，３０２－２が接続された状態を示している。

推論モデル３０１ａ，３０１ｂとコスト加算ノード３０３との間には、コスト調整層１９００ａ，１９００ｂが接続されている。コスト調整層１９００ａ，１９００ｂを区別しない場合には、単にコスト調整層１９００と表記する。コスト調整層１９００は、推論モデル３０１から出力されるコストＣ１ｉを調整してＡＤ（Ｃ１ｉ）をコスト加算ノード３０３に出力する。

図２０は、コスト調整層１９００の一例を示す説明図である。コスト調整層１９００は、減算部２００１と、ＲｅＬＵ活性化部２００２と、乗算部２００３と、加算部２００４と、合計部２００５と、を有する。減算部２００１、ＲｅＬＵ活性化部２００２、乗算部２００３、および加算部２００４はそれぞれ、ｊ個のブロックを有し、ｊ番目のブロックが直列接続されている。図１９では、ｊ＝５の例を示している。減算部２００１、ＲｅＬＵ活性化部２００２、乗算部２００３、および加算部２００４のｊ番目のブロックをそれぞれ、２００１－ｊ～２００４－ｊと表記する。

推論モデル３０１からのコストＣ１ｉの軸ｊの要素であるＣ１ｉｊは、減算部２００１のｊ番目の減算ブロック２００１－ｊに入力される。合計部２００５は、加算ブロック２００４－ｊからの加算結果を加算して、コスト調整結果ＡＤ（Ｃ１ｉ）としてコスト加算ノード３０３に出力する。コストＣ１ｉをｘとし、コスト調整結果ＡＤ（Ｃ１ｉ）をｙとすると、コスト調整層１９００は、下記式（４）によって表現される。

図２１は、コスト入出力関係を示すグラフの一例を示す説明図である。具体的には、たとえば、減算部２００１は、入力ｘに対し制御点ｐ［０］，…ｐ［Ｎ］のｘ軸を減算して（ｘ－ｐ[ｉ]．ｘ）を計算する。つぎに、ＲｅＬＵ活性化部２００２は、減算した値（ｘ－ｐ[ｉ]．ｘ）に対してＲｅＬＵを取りＲｅＬＵ（ｘ－ｐ［ｉ］．ｘ）を計算する。つぎに、乗算部２００３は、ｘ軸方向に隣接する制御点間に対応する各領域の傾きｇｒａｄをかけ、ｇｒａｄ［ｉ］×（ＲｅＬＵ（ｘ＞ｐ［ｉ］．ｘ））を計算する。

つぎに、加算部２００４は、ｘ軸方向に隣接する制御点間に対応する各領域のｏｆｆｓｅｔを足し、｜ｇｒａｄ［ｉ］×（ＲｅＬＵ（ｘ＞ｐ［ｉ］．ｘ））＋ｏｆｆｓｅｔ［ｉ］｜を計算する。最後に、合計部２００５は、和を取って出力する。

図２２は、コスト調整層１９００他の例を示す説明図である。図２３は、コスト入出力関係を示すグラフの他の例を示す説明図である。図２２において、傾きｇｒａｄ［Ｎ］がｇｒａｄ［Ｎ］＝０になっている。これにより、右端の制御点より右側の領域、つまり（ｍａｘ（ｐ．ｘ）＜ｘとなる領域に勾配を延長することが可能である。また、減算部２００１とＲｅＬＵ活性化部２００２との間に、ｘ－ｐ［０］．ｘのノードを反転させた枝２２００が追加されている。これにより、左端の制御点より左側の領域、つまり（ｍｉｎ（ｐ．ｘ）＞ｘとなる領域に勾配を延長することが可能である。枝２２００においては、乗算ノードの値は－ｇｒａｄ［０］に、オフセット値は０になる。

このように、コスト調整層を採用することで、候補点Ｐｉの指向の細かい調整が可能である。また、候補点Ｐｉを得る繰り返しの途中で、コスト調整層を変更してもよい。この操作により、前半に候補点出力リストに追加する５個についてはコストＣ３ｉがある値から低くなるように調整し、後半に候補点出力リストに追加する５個についてはコストＣ３ｉが当該ある値以上となるように調整することも可能である。これにより、複数の戦略を取り入れた候補点群を取得することができる。

また、コスト調整層の構造は入力と出力の次元が等しい限りにおいて自由だが、ＲｅＬＵ活性化部２００２および合計部２００５を含む構成で実装すると制御点が現れるため直観的に制御しやすく有用である。

このように、上述した実施例１～実施例６によれば、距離コストノードを追加接続したグラフ構造により、探索された候補点同士を離間し、実験的に意味のある複数の解を得ることができる。また、ニューラルネットワークの一部として実装されるため、学習済みの推論モデル３０１を用いて効率的に候補点Ｐｉを探索することができる。また、離間距離ｔｈや終了判定基準、勾配降下回数の上限回数、グリッドの格子間隔ｄ、コスト調整層１９００によりカスタマイズが容易で、候補解の性向を調整しやすく実験計画に好適である。

なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。たとえば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。

また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、たとえば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。

各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記憶装置、又は、ＩＣ（ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）カード、ＳＤカード、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）の記録媒体に格納することができる。

また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。

１００実験計画システム
１０１実験計画装置
１０２学習装置
１０３実験装置
３０１推論モデル
３００入力ノード（入力部）
３０２－ｉ距離コストノード（距離コスト算出部（ステップＳ４０３）、量子化部（ステップＳ１６００））
３０３コスト加算ノード（コスト加算部（ステップＳ４０３））
３０４損失関数出力ノード（修正部（ステップＳ４０３）、決定部（ステップＳ４０４）、設定部（ステップＳ４０７））
５００設計パラメータ空間
１９００コスト調整層

Claims

実験装置に関する入力設計パラメータを入力した場合に前記実験装置を評価する推論モデルに対し前記入力設計パラメータを入力した結果出力されるコストに基づいて、前記入力設計パラメータに誤差逆伝播することにより前記入力設計パラメータを修正し、修正後の入力設計パラメータに基づいて設計パラメータ候補を決定する実験計画装置であって、
第１入力設計パラメータを受け付ける入力部と、
前記第１入力設計パラメータと前記設計パラメータ候補との距離に関する第１距離コストを算出する第１距離コスト算出部と、
前記第１距離コスト算出部によって算出された第１距離コストと、前記第１入力設計パラメータを前記推論モデルに入力した結果前記推論モデルから出力される第１コストと、を加算するコスト加算部と、
前記コスト加算部による加算結果に基づいて前記第１入力設計パラメータに誤差逆伝播することにより前記第１入力設計パラメータを修正する修正部と、
前記修正部による修正後の前記第１入力設計パラメータに基づいて第１設計パラメータ候補を決定する決定部と、
を有することを特徴とする実験計画装置。
請求項１に記載の実験計画装置であって、
前記入力部は、前記修正後の第１入力設計パラメータを受け付け、
前記第１距離コスト算出部は、前記修正後の第１入力設計パラメータと前記設計パラメータ候補との距離に関する前記第１距離コストを算出する、
ことを特徴とする実験計画装置。
請求項１に記載の実験計画装置であって、
前記修正部は、前記第１入力設計パラメータを勾配降下することにより前記第１入力設計パラメータに誤差逆伝播し、前記第１入力設計パラメータを修正する、
ことを特徴とする実験計画装置。
請求項３に記載の実験計画装置であって、
前記第１入力設計パラメータの勾配降下に関するコストが、所定の条件を充足するか否かを判定する判定部を有し、
前記修正部は、前記判定部により前記条件を充足すると判定された場合、前記修正後の第１入力設計パラメータを前記第１設計パラメータ候補として出力する、
ことを特徴とする実験計画装置。
請求項４に記載の実験計画装置であって、
前記条件は、前記勾配降下に関するコストのしきい値により規定され、
前記決定部は、前記判定部により前記勾配降下に関するコストが前記しきい値以下となったと判定された場合、前記修正後の第１入力設計パラメータを前記第１設計パラメータ候補に決定する、
ことを特徴とする実験計画装置。
請求項１に記載の実験計画装置であって、
前記第１設計パラメータ候補が出力されると、前記第１設計パラメータ候補を用いて第２距離コストを算出する第２距離コスト算出部を追加する設定部を有し、
前記入力部は、前記第１設計パラメータ候補が出力されたときの前記修正後の第１入力設計パラメータを第２入力設計パラメータとして受け付け、
前記第１距離コスト算出部は、前記第２入力設計パラメータと、前記設計パラメータ候補と、の距離に関する前記第１距離コストを算出し、
前記第２距離コスト算出部は、前記第２入力設計パラメータと、前記第１設計パラメータ候補と、の距離に関する第２距離コストを算出し、
前記コスト加算部は、前記第２入力設計パラメータを前記推論モデルに入力した場合に前記推論モデルから出力される第２コストと、前記第１距離コストと、前記第２距離コストと、を加算し、
前記修正部は、前記コスト加算部による加算結果に基づいて前記第２入力設計パラメータに誤差逆伝播することにより前記第２入力設計パラメータを修正し、
前記決定部は、前記修正部による修正後の前記第２入力設計パラメータに基づいて第２設計パラメータ候補を決定する、
ことを特徴とする実験計画装置。
請求項１に記載の実験計画装置であって、
前記第１距離コスト算出部は、前記設計パラメータ候補に替えて前記第１距離コストの値が０になるような特定の値が設定されており、前記設計パラメータ候補が決定されると、前記特定の値を前記設計パラメータ候補に置換して、前記第１入力設計パラメータと前記設計パラメータ候補との距離に関する前記第１距離コストを算出する、
ことを特徴とする実験計画装置。
請求項７に記載の実験計画装置であって、
前記特定の値が設定された第２距離コスト算出部を有し、
前記入力部は、前記第１設計パラメータ候補が出力されたときの前記修正後の第１入力設計パラメータを第２入力設計パラメータとして受け付け、
前記第２距離コスト算出部は、前記決定部によって前記第１設計パラメータ候補が決定されると、前記特定の値を前記第１設計パラメータ候補に置換して、前記第２入力設計パラメータと、前記第１設計パラメータ候補と、の距離に関する第２距離コストを算出し、
前記コスト加算部は、前記第２入力設計パラメータを前記推論モデルに入力した場合に前記推論モデルから出力される第２コストと、前記第１距離コストと、前記第２距離コストと、を加算し、
前記修正部は、前記コスト加算部による加算結果に基づいて前記第２入力設計パラメータに誤差逆伝播することにより前記第２入力設計パラメータを修正し、
前記決定部は、前記修正部による修正後の前記第２入力設計パラメータに基づいて第２設計パラメータ候補を決定する、
ことを特徴とする実験計画装置。
請求項１に記載の実験計画装置であって、
前記第１距離コスト算出部は、前記距離と所定の離間距離との差に基づいて、第１距離コストを算出する、
ことを特徴とする実験計画装置。
請求項１に記載の実験計画装置であって、
前記第１入力設計パラメータが存在するグリッド化された設計パラメータ空間において、前記設計パラメータ空間内の前記第１入力設計パラメータから最短距離の格子点に前記第１入力設計パラメータを量子化する量子化部を有し、
前記修正部は、前記コスト加算部による加算結果に基づいて、前記量子化部によって量子化された第１入力設計パラメータに誤差逆伝播することにより、前記量子化された第１入力設計パラメータを、前記格子点とは異なる他の格子点に位置するように修正する、
ことを特徴とする実験計画装置。
請求項１に記載の実験計画装置であって、
前記第１距離コスト算出部は、前記第１入力設計パラメータと前記設計パラメータ候補とのユークリッド距離に関する前記第１距離コストを算出する、
ことを特徴とする実験計画装置。
請求項１に記載の実験計画装置であって、
前記推論モデルから出力される前記第１コストを調整し、調整後の第１コストを前記コスト加算部に出力する調整部を有する、
ことを特徴とする実験計画装置。
請求項１２に記載の実験計画装置であって、
前記調整部は、外部からの設定により、前記コスト加算部からの加算結果を増減するように調整可能な制御点を有する、
ことを特徴とする実験計画装置。
実験装置に関する入力設計パラメータを入力した場合に前記実験装置を評価する推論モデルに対し前記入力設計パラメータを入力した結果出力されるコストに基づいて、前記入力設計パラメータに誤差逆伝播することにより前記入力設計パラメータを修正し、修正後の入力設計パラメータに基づいて設計パラメータ候補を決定する実験計画装置による実験計画方法であって、
前記実験計画装置は、
第１入力設計パラメータを受け付ける入力処理と、
前記第１入力設計パラメータと前記設計パラメータ候補との距離に関する第１距離コストを算出する第１距離コスト算出処理と、
前記第１距離コスト算出処理によって算出された第１距離コストと、前記第１入力設計パラメータを前記推論モデルに入力した結果前記推論モデルから出力される第１コストと、を加算するコスト加算処理と、
前記コスト加算処理による加算結果に基づいて前記第１入力設計パラメータに誤差逆伝播することにより前記第１入力設計パラメータを修正する修正処理と、
前記修正処理による修正後の前記第１入力設計パラメータに基づいて第１設計パラメータ候補を決定する決定処理と、
を実行することを特徴とする実験計画方法。
入力設定パラメータが入力される実験装置と、前記実験装置に関する入力設計パラメータを入力した場合に前記実験装置を評価する推論モデルに対し前記入力設計パラメータを入力した結果出力されるコストに基づいて、前記入力設計パラメータに誤差逆伝播することにより前記入力設計パラメータを修正し、修正後の入力設計パラメータに基づいて設計パラメータ候補を決定する実験計画装置と、を有する実験計画システムであって、
実験計画装置は、
前記実験装置に関する第１入力設計パラメータを受け付ける入力部と、
前記第１入力設計パラメータと前記設計パラメータ候補との距離に関する第１距離コストを算出する第１距離コスト算出部と、
前記第１距離コスト算出部によって算出された第１距離コストと、前記第１入力設計パラメータを前記推論モデルに入力した結果前記推論モデルから出力される第１コストと、を加算するコスト加算部と、
前記コスト加算部による加算結果に基づいて前記第１入力設計パラメータに誤差逆伝播することにより前記第１入力設計パラメータを修正する修正部と、
前記修正部による修正後の前記第１入力設計パラメータに基づいて、前記実験装置に入力させる第１設計パラメータ候補を決定する決定部と、
を有することを特徴とする実験計画システム。