JP2021192139A

JP2021192139A - 情報処理装置、情報処理方法、プログラム及び情報処理システム

Info

Publication number: JP2021192139A
Application number: JP2020098271A
Authority: JP
Inventors: マチューパリジ; Matthew Parisi; 崇之柴▲崎▼; Takayuki Shibazaki
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-06-05
Filing date: 2020-06-05
Publication date: 2021-12-16
Anticipated expiration: 2040-06-05
Also published as: US20210382960A1; EP3920054A1; CN113761783A

Abstract

【課題】最適解に到達する可能性を高める。【解決手段】処理部１２は、探索部２０に第１ステート及び第２ステートを設定する。処理部１２は、第１ステート及び第２ステートをそれぞれ始点とする探索であって、目的関数の値の増減に影響する所定の外部パラメータの値を、目的関数の値の増加を促す方向に変化させる探索を探索部２０に実行させる。処理部１２は、当該探索の過程で第１ステートに基づいて得られた第１ステート群及び第２ステートに基づいて得られた第２ステート群を取得する。処理部１２は、第１ステート群及び第２ステート群に基づいて、未探索のステートのうち第３ステートを決定する。処理部１２は、第３ステートを始点として探索部２０に探索を実行させる。【選択図】図１

Description

本発明は情報処理装置、情報処理方法、プログラム及び情報処理システムに関する。

ノイマン型コンピュータが不得意とする多変数の最適化問題を、磁性体のスピンの振る舞いを表すモデルであるイジングモデルに置き換えて計算する情報処理システムがある。情報処理システムは、例えばシミュレーテッド・アニーリング（ＳＡ：Simulated Annealing）法やレプリカ交換法などのマルコフ連鎖モンテカルロ法により、問題に対応する目的関数の値が最小となる基底状態を探索する。目的関数は、エネルギー関数や評価関数などと呼ばれることもある。また、基底状態は最適化問題の最適解に対応する。

例えば、プラント機器の配置計画などのように、複数の局所最適解をもつ可能性のある非線形計画問題を対話的に解くための対話型計画装置の提案がある。提案の対話型計画装置は、既に発見された局所最適解と探索出発点との距離を基に、その探索出発点からの最適化を実行するか否かを判定することで、無駄な局所最適化の回数を減らす。

また、探索ステップごとに、探索範囲に影響する所定の水準幅を最適値のトレンドに基づいて変化させる最適値探索装置の提案もある。

特開昭６２−６１１０１号公報特開２００６−２９３４７８号公報

上記のように、ＳＡ法やレプリカ交換法などによる探索で得られた解は、局所解であるが最適解でない可能性がある。すなわち、全探索空間のうちの未探索の部分に最適解が存在する可能性がある。

１つの側面では、本発明は、最適解に到達する可能性を高める情報処理装置、情報処理方法、プログラム及び情報処理システムを提供することを目的とする。

１つの態様では、情報処理装置が提供される。この情報処理装置は、通信部と処理部とを有する。通信部は、目的関数に含まれる複数の状態変数の値により表されるステートを変化させることで目的関数の値を最小にする解の探索を行う探索部と通信する。処理部は、通信部を介して探索部に第１ステート及び第２ステートを設定し、第１ステート及び第２ステートをそれぞれ始点とする探索であって、目的関数の値の増減に影響する所定の外部パラメータの値を、目的関数の値の増加を促す方向に変化させる探索を探索部に実行させ、当該探索の過程で第１ステートに基づいて得られた第１ステート群及び第２ステートに基づいて得られた第２ステート群を取得し、第１ステート群及び第２ステート群に基づいて、未探索のステートのうち第３ステートを決定し、第３ステートを始点として探索部に探索を実行させる。

また、１つの態様では、情報処理方法が提供される。
また、１つの態様では、プログラムが提供される。
また、１つの態様では、情報処理システムが提供される。

１つの側面では、最適解に到達する可能性を高めることができる。

第１の実施の形態の情報処理システムの処理例を説明する図である。第２の実施の形態の情報処理システムのハードウェア例を示す図である。情報処理装置の機能例を示す図である。近傍ステートテーブルの例を示す図である。ステートのマッピングの第１の例を示す図である。ステートのマッピングの第２の例を示す図である。始点候補ステートの計算例を示す図である。情報処理システムの全体制御例を示すフローチャートである。強化フェーズの例を示すフローチャートである。多様化フェーズの例を示すフローチャートである。始点候補ステートの計算例を示すフローチャートである。局所解近傍のステートのエネルギー値の例を示す図である。

以下、本実施の形態について図面を参照して説明する。
［第１の実施の形態］
第１の実施の形態を説明する。

図１は、第１の実施の形態の情報処理システムの処理例を説明する図である。
情報処理システム１は、組合せ最適化問題の解を探索し、解を出力する。情報処理システム１は、情報処理装置１０及び探索部２０を有する。情報処理装置１０は、探索部２０に接続される。

探索部２０は、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）などの半導体集積回路により実現される。また、探索部２０は、ＲＡＭ（Random Access Memory）やレジスタなどの記憶部を含み得る。例えば、ＦＰＧＡなどの集積回路を用いて実現される探索回路が、探索部２０として機能してもよい。なお、探索部２０は、複数のサブ探索部を含んでもよく、複数のサブ探索部を並列に用いて解の探索を行ってもよい。その場合、複数のサブ探索部は複数の装置に分散して配置されてもよい。

探索部２０は、組合せ最適化問題を定式化したイジング型の目的関数に基づいて、目的関数に含まれる複数の状態変数の値により表されるステート（State）を変化させることで、目的関数の値を最小にする解、すなわち、最適解の探索を行う。解の探索には、例えば、ＳＡ法やレプリカ交換法などのマルコフ連鎖モンテカルロ法が用いられる。

ここで、ステートは、複数の状態変数の値により表されるイジングモデルの状態である。状態変数は「０」または「１」の値を取るバイナリ変数である。目的関数は、ステートに対応するエネルギー値を表す。目的関数は、エネルギー関数、評価関数あるいはハミルトニアンなどとも呼ばれる。目的関数の値は、エネルギー値や評価値などと呼ばれてもよい。

上記のように、組合せ最適化問題は、目的関数の値を最小化する解を求める問題として定式化される。この場合、目的関数の値を最小化する解は、イジングモデルの基底状態を表し、組合せ最適化問題の最適解に相当する。イジング型の目的関数Ｅ（ｘ）は、例えば、式（１）で表される。

状態ベクトルｘは、複数の状態変数を要素とし、イジングモデルのステートを表す。目的関数の値を最大化する問題の場合には、目的関数の符号を逆にすればよい。
式（１）の右辺第１項は、全状態変数から選択可能な２つの状態変数の全組合せについて、漏れと重複なく、２つの状態変数の値と重み係数との積を積算したものである。ｘ_ｉは、ｉ番目の状態変数である。ｘ_ｊは、ｊ番目の状態変数である。Ｗ_ｉｊは、ｉ番目の状態変数とｊ番目の状態変数との間の重み、または、結合の強さを示す重み係数である。

式（１）の右辺第２項は、全状態変数の各々のバイアス係数と状態変数の値との積の総和を求めたものである。ｂ_ｉは、ｉ番目の状態変数に対するバイアス係数を示している。
例えば、イジングモデルにおけるスピンの「−１」は、状態変数の値「０」に対応する。イジングモデルにおけるスピンの「＋１」は、状態変数の値「１」に対応する。このため、状態変数を０または１の値をとるビットと呼ぶこともできる。

探索部２０には情報処理装置１０により組合せ最適化問題に対応する目的関数の情報を含む問題データが入力される。まず、探索部２０は、問題データに基づいて、第１の探索方法での探索を異なる初期ステートを用いてｍ（ｍは２以上の整数）回実行することで基底状態の探索を行い、その結果としてｍ個の局所解を得る。探索部がサブ探索部を複数個含む場合、複数のサブ探索部により並列に探索を実行させることで処理を高速化できる。サブ探索部はレプリカと呼ばれることがある。

ここで、第１の探索方法では、目的関数の値の増減に影響する所定の外部パラメータの値を漸減させることで基底状態の探索が行われる。外部パラメータは、組合せ最適化問題を表す問題データとは別に、探索部２０に対して与えられるパラメータである。外部パラメータは、例えばイジングモデルに作用する外部環境の所定の物理量を示すパラメータまたは当該物理量を模したパラメータであることがある。あるいは、外部パラメータは、イジングモデルに作用する当該物理量の影響の強さを調整するパラメータであることもある。外部パラメータとしてどのようなパラメータを用いるかは探索方法に応じて異なる。

第１の探索方法の例としては、ＳＡ法、レプリカ交換法などが挙げられる。また、第１の探索方法の例としては、後述されるように、量子アニーリング（ＱＡ：Quantum Annealing）法やシミュレーテッド量子アニーリング（ＳＱＡ：Simulated Quantum Annealing）法も挙げられる。

例えば、ＳＡ法やレプリカ交換法では、外部パラメータとして、温度値が用いられる。ＳＡ法を用いる場合、探索部２０は、情報処理装置１０から与えられた温度スケジュールに基づき基底状態を探索する。例えば、ＳＡ法では、探索過程で、探索に用いられる温度値が最高温度値から最低温度値へ徐々に下がるようにスケジューリングされる。

基底状態の探索では、ある状態変数、すなわち、ビットを変化させることによる状態遷移が繰り返し実行される。ＳＡ法やレプリカ交換法では、あるビットを変化させることによる、あるステートから次のステートへの遷移確率の決定に、メトロポリス法やギブス法が用いられる。探索部２０は、複数のビットの何れかのビットを変化させたときの目的関数の値の変化量と、ノイズ値との比較結果に基づいて、ビットの変化を許容するか否かを判定する。探索部２０は、許容すると判定した場合、該当のビットの値を変えることで、状態遷移を発生させる。ノイズ値は、温度値や乱数に基づいて求められる。温度値が大きい程、ノイズ値の振幅が大きくなる。ノイズ値の振幅が大きい程、目的関数の値の増加量が大きい状態遷移が許容されやすくなる。このため、温度値が大きい程、目的関数の値の増加が促される。すなわち、目的関数の値が比較的大きく増加する状態遷移が生じ易くなる。

探索部２０は、第１の探索方法による探索の結果として得られたｍ個の局所解を情報処理装置１０に出力する。局所解は、第１の探索方法による探索で到達した解のうちの目的関数の値を最小にする解である。当該探索をｍ（ｍは２以上の整数）回実行することで、ｍ個の局所解が得られる。

ここで、探索部２０は、複数の状態変数により表される全てのステート、すなわち、全探索空間を探索して解を出力するわけではない。このため、探索部２０により出力される解は、局所的に最良の解、すなわち局所解である。一方、局所解は、必ずしも大域的に最良の解、すなわち最適解であるとは限らない。そこで、情報処理装置１０は、探索部２０により当該局所解を基に再探索を行わせることで、最適解を得られる可能性を高める機能を提供する。

情報処理装置１０は、通信部１１及び処理部１２を有する。
通信部１１は、探索部２０と通信する。通信部１１は、探索部２０が備えるメモリまたは探索部２０が参照する情報処理装置１０内のメモリに対するＩＯ（Input/Output）を行うＩＯインタフェースにより実現される。探索部２０がネットワークを介して接続された他の装置により実現される場合、通信部１１は、ネットワークと接続されるＮＩＣ（Network Interface Card）などの通信インタフェースにより実現されてもよい。

処理部１２は、ＣＰＵ、ＤＳＰ、ＡＳＩＣ、ＦＰＧＡなどの集積回路を含み得る。処理部１２はプログラムを実行するプロセッサであってもよい。ここでいう「プロセッサ」には、複数のプロセッサの集合（マルチプロセッサ）も含まれ得る。処理部１２は、通信部１１を介して探索部２０と通信する。

また、図示を省略しているが、情報処理装置１０は、処理部１２の処理に用いられるステートなどのデータを記憶するＲＡＭやＨＤＤなどの記憶部を備える。
処理部１２は、通信部１１を介して、探索部２０に第１ステート及び第２ステートを設定する。例えば、処理部１２は、第１ステート及び第２ステートを順に設定し、第１ステート及び第２ステートのそれぞれを始点とする第２の探索方法による探索を探索部２０に実行させる。あるいは、探索部２０が複数のサブ探索部を有する場合、複数のサブ探索部のうちの２つに第１ステート及び第２ステートを一斉に設定することもできる。第１ステート及び第２ステートそれぞれは、第１の探索方法による探索が終了した直後の段階では、第１の探索方法による探索で得られた２つの局所解である。

第２の探索方法による探索は、上記の外部パラメータの値を、目的関数の値の増加を促す方向に変化させる探索である。例えば、外部パラメータは、外部パラメータが取り得る最小値を初期値とする。処理部１２は、ステートの所定回数の変化、あるいは、所定期間の経過ごとに、外部パラメータの値を増加するように探索部２０に指示する。外部パラメータの１回当たりの増加幅は一定幅でもよいし、０．１，１，１０，１００，１０００，…のような対数幅で徐々に増やしてもよい。なお、前述のように、外部パラメータは、例えば温度値である。また、探索部２０が複数のサブ探索部を含み、第１の探索方法としてレプリカ交換法が用いられる場合であっても、第２の探索方法による探索ではサブ探索部間でのレプリカ交換、すなわち、温度値やステートの交換を行わず、サブ探索部ごとに独立した探索を行う。

第２の探索方法による探索は、始点の近傍のステートを探索するものである。例えば、上記のように、一定回数の状態遷移ごとに温度値を最低温度値から段階的に大きくしながら状態遷移を進めて、近傍のステートをサンプリングする。例えば、始点からのハミング距離が一定値未満であるステート、あるいは、最低温度値からの温度値の増加量が一定値未満のときにサンプリングされたステートが、該当の始点に対する近傍のステートとなる。

処理部１２は、第２の探索方法による探索の過程で第１ステートに基づいて得られた第１ステート群及び第２ステートに基づいて得られた第２ステート群を取得する。例えば、３個の局所解を始点とした場合、処理部１２は、３個のステート群｛ｓ１｝，｛ｓ２｝，｛ｓ３｝を探索部２０から取得する。処理部１２は、ステート群｛ｓ１｝，｛ｓ２｝，｛ｓ３｝を、ステート群｛ｓ１｝，｛ｓ２｝，｛ｓ３｝それぞれの始点のステートに対応付けて、情報処理装置１０の記憶部に格納する。ステート群｛ｓ１｝，｛ｓ２｝，｛ｓ３｝が、始点のステートを含んでもよい。例えば、ステート群｛ｓ１｝を第１ステート群の一例と考えてもよく、ステート群｛ｓ２｝を第２ステート群の一例と考えてもよい。

処理部１２は、取得した第１ステート群及び第２ステート群に基づいて、未探索のステートのうち新たな始点とする第３ステートを決定する。具体的には次の通りである。
まず、処理部１２は、第１ステート群及び第２ステート群のそれぞれに含まれるステート間の関係を示すマップ情報を生成する。マップ情報は、例えば、サンプリングされたステート群（始点を含む）について、ステート間の関係をｎ（ｎは２以上の整数）次元の座標系にマッピングした情報である。ステート間の関係は、２つのステートの類似の度合い、すなわち、類似度を表す。例えば、類似度は、２つのステート間のハミング距離により表される。この場合、ハミング距離が小さいほど、２つのステートの類似度は高い。または、類似度は、一方のステートにより表される、組合せ最適化問題における複数の第１パラメータ値ｐ_１１，ｐ_１２，…と他方のステートにより表される複数の第２パラメータ値ｐ_２１，ｐ_２２，…との距離｛Σ（ｐ_２ｉ−ｐ_１ｉ）＾２｝＾（１／２）でもよい。この場合、当該距離が小さいほど、２つのステートの類似度は高い。ステート間の類似度は、これらの例とは別の尺度で評価されてもよい。

処理部１２は、ステートの次元数、すなわち、複数の状態変数の数よりも小さい次元数をもつマップ情報を生成してもよい。その場合、任意の２つのステート間の類似度が維持されるように、当該マップ情報が生成される。このようなマップ情報の生成方法として、多次元尺度構成法（ＭＤＳ：Multi-Dimensional Scaling）を用いることができる。ＭＤＳには次の文献１を参考にできる。

文献１：J.B.Kruskal,“Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis,” Psychometrika. 29 (1), 1964, p.1-27.
マップ情報３０は、一例として、２次元の座標系によりステート間の関係を表す場合を示している。当該座標系は、ｘ軸及びｙ軸を有する。マップ情報３０は、始点のステートや当該始点に対してサンプリングされたステートに対応するｘｙ座標の情報を含む。２つのステート間の類似の関係は、当該座標系にプロットされた一方のステートに対応する座標と、他方のステートに対応する座標との間の距離により表される。

例えば、マップ情報３０は、座標ａ０〜ａ５，ｂ０〜ｂ４，ｃ０〜ｃ３を含む。
座標ａ０は、第２の探索方法による探索の第１の始点に対応する。座標ａ１〜ａ５それぞれは、ステート群｛ｓ１｝に含まれる何れかのステートに対応する。

座標ｂ０は、第２の探索方法による探索の第２の始点に対応する。座標ｂ１〜ｂ４それぞれは、ステート群｛ｓ２｝に含まれる何れかのステートに対応する。
座標ｃ０は、第２の探索方法による探索の第３の始点に対応する。座標ｃ１〜ｃ３それぞれは、ステート群｛ｓ３｝に含まれる何れかのステートに対応する。

処理部１２は、始点とステート群との対応関係及びマップ情報に基づいて、未探索のステートのうち第３ステートを決定する。
例えば、処理部１２は、第１の始点に対応する座標ａ０及び第１の始点から探索されたステート群｛ｓ１｝に対応する座標ａ１〜ａ５を特定する。そして、処理部１２は、第１の始点及びステート群｛ｓ１｝に対応する各座標を囲う図形を求める。当該図形は、例えば、座標ａ０〜ａ５を囲う最小バウンディングポリゴン（Minimum Bounding Polygon）や最小バウンディングレクタングル（Minimum Bounding Rectangle）でもよい。図形Ｒ１は、第１の始点を含むステート群｛ｓ１｝に対応する各座標を囲う図形の一例である。

また、処理部１２は、第２の始点に対応する座標ｂ０及び第２の始点から探索されたステート群｛ｓ２｝に対応する座標ｂ１〜ｂ４を特定する。そして、処理部１２は、始点となった第２の始点及びステート群｛ｓ２｝に対応する各座標を囲う図形Ｒ２を求める。

更に、処理部１２は、第３の始点に対応する座標ｃ０及び第３の始点を始点として探索されたステート群｛ｓ３｝に対応する座標ｃ１〜ｃ３を特定する。そして、処理部１２は、始点となった第３の始点及びステート群｛ｓ３｝に対応する各座標を囲う図形Ｒ３を求める。

この場合、図形Ｒ１，Ｒ２，Ｒ３は、全探索空間のうちの探索済の部分空間に対応する領域であると推定される。このため、既に得られている解以外に最適解があるとすれば、全探索空間のうち、当該領域の外に対応する未探索の部分空間に存在する可能性が高いと推定される。そこで、処理部１２は、図形Ｒ１，Ｒ２，Ｒ３それぞれに属するステートに基づいて、図形Ｒ１，Ｒ２，Ｒ３に属さない第３ステートを求める。

例えば、処理部１２は、下記の方法により、図形Ｒ１，Ｒ２，Ｒ３に対応する探索済の部分空間からの距離が適度に離れた第３ステートを求めることができる。
処理部１２は、図形Ｒ１に対応する始点のステートを含むステート群｛ｓ１｝の各ステートを比較して、ステート群｛ｓ１｝の各ステートの同位置のビットを、常に１のビット、常に０のビット、及び、１または０のビットに分類する。ステート群｛ｓ１｝に対する分類結果を第１のビットパターンと称する。

処理部１２は、図形Ｒ２に対応する始点のステートを含むステート群｛ｓ２｝の各ステートを比較して、ステート群｛ｓ２｝の各ステートの同位置のビットを、常に１のビット、常に０のビット、及び、１または０のビットに分類する。ステート群｛ｓ２｝に対する分類結果を第２のビットパターンと称する。

処理部１２は、図形Ｒ３に対応する始点のステートを含むステート群｛ｓ３｝の各ステートを比較して、ステート群｛ｓ３｝の各ステートの同位置のビットを、常に１のビット、常に０のビット、及び、１または０のビットに分類する。ステート群｛ｓ３｝に対する分類結果を第３のビットパターンと称する。

例えば、処理部１２は、２つのステート群｛ｓ１｝，｛ｓ２｝に対して、次のように第３ステートの候補となる候補ステートを生成する。第１に、処理部１２は、第１及び第２のビットパターンの両方で常に１または常に０で共通であるビットについては、当該ビットに対応する候補ステートのビットも同じ値とする。第２に、処理部１２は、第１及び第２のビットパターンの一方で常に１であり、他方で常に０であるビットについては、当該ビットに対応する候補ステートのビットで１及び０が半々に含まれるようにする。第３に、処理部１２は、上記の第１，第２の基準の何れにも当てはまらない場合、候補ステートの該当のビットを、１または０にランダムに決定する。処理部１２は、こうして求めた候補ステートを、マップ情報３０にマッピングし、候補ステートに対応する座標が、図形Ｒ１，Ｒ２，Ｒ３の何れにも属さない場合、当該候補ステートを第３ステートとして確定する。

マップ情報３０には、図形Ｒ１，Ｒ２，Ｒ３の何れにも属さない座標ｄ０，ｅ０，ｆ０が例示されている。座標ｄ０は、ステート群｛ｓ１｝，｛ｓ２｝に対して求められたステートｓｄに対応する座標である。座標ｅ０は、ステート群｛ｓ２｝，｛ｓ３｝に対して求められたステートｓｅに対応する座標である。座標ｆ０は、ステート群｛ｓ３｝，｛ｓ１｝に対して求められたステートｓｆに対応する座標である。ステートｓｄ，ｓｅ，ｓｆそれぞれは、第３ステートの一例である。

処理部１２は、第３ステートを始点として探索部２０に探索を実行させる。例えば、処理部１２は、ステートｓｄを探索部２０に出力し、ステートｓｄを始点、すなわち、始点ステートとして、第２の探索方法による探索を探索部２０に実行させ、当該探索により得られたステートを取得する。また、処理部１２は、ステートｓｅを探索部２０に出力し、ステートｓｅを始点として、第２の探索方法による探索を探索部２０に実行させ、当該探索により得られたステートを取得する。更に、処理部１２は、ステートｓｆを探索部２０に出力し、ステートｓｆを始点として、第２の探索方法による探索を探索部２０に実行させ、当該探索により得られたステートを取得する。

処理部１２は、探索部２０による再探索の結果、既に得られているよりも良いステート、すなわち既存の解よりも目的関数の値が小さい解が得られた場合には、新たに得られた解を採用し、最終的に得られた最良の解を外部に出力する。なお、処理部１２は、新たに得られたステート群を始点ごとに探索部２０から取得し、当該ステート群を基に上記の手順を一定時間または一定回数だけ繰り返し実行することで、探索部２０に更に良い解を探索させてもよい。

上記の例では、第３ステートとして、３個のステートｓｄ，ｓｅ，ｓｆを示したが、第３ステートの数は、１個でもよいし、２個または４個以上でもよい。例えば、処理部１２は、第１ステート群に対応する図形Ｒ１および第２ステート群に対応する図形Ｒ２に基づいて、１つのステートｓｄを第３ステートとして求めてもよい。

情報処理システム１によれば、第１ステート及び第２ステートのそれぞれを始点とする探索であって、目的関数の値の増減に影響する所定の外部パラメータの値を、目的関数の値の増加を促す方向に変化させる探索が実行される。当該探索の過程で第１ステートに基づいて得られた第１ステート群及び第２ステートに基づいて得られた第２ステート群が取得される。第１ステート群及び第２ステート群に基づいて、未探索のステートのうち第３ステートが決定される。第３ステートを始点として探索が実行される。

これにより、最適解に到達する可能性を高めることができる。また、全探索空間のうちの未探索の部分に絞って効率的に解の探索を行うことができ、短時間で最適解を得ることができる。こうして、組合せ最適化問題に対する求解性能を向上できる。

なお、探索部２０は、デジタル回路を用いてＳＡ法やレプリカ交換法などを実行するハードウェアにより実現されてもよいし、ＱＡ法を実行するハードウェアにより実現されてもよい。ＳＡ法、レプリカ交換法またはＱＡ法などを実行するハードウェアは最適化装置と呼ばれることがある。また、ＳＡ法、レプリカ交換法またはＳＱＡ法を実行する探索部２０は、情報処理装置１０が有するＣＰＵなどのプロセッサにより実現されてもよい。

ＱＡ法やＳＱＡ法では、目的関数に対応するハミルトニアンに横磁場項が付加される。例えば、横磁場項を含むハミルトニアンＨ（ｔ）は、Ｈ（ｔ）＝Ｈ_０＋Γ（ｔ）Ｈ_１と表される。

ここで、ｔは時間である。Ｈ_０は、イジングモデルのハミルトニアンである。Ｈ_１は横磁場を表すハミルトニアンである。Γ（ｔ）Ｈ_１は横磁場項である。横磁場項Γ（ｔ）Ｈ_１におけるΓ（ｔ）は、目的関数における横磁場の影響の強さを表す係数である。Γ（ｔ）は、横磁場の強さを表す係数であると言われることもある。

ＱＡ法やＳＱＡ法では、時間経過とともに横磁場項における当該係数Γ（ｔ）を小さくすることで、イジングモデルに対する横磁場の影響が小さくなるように制御される。すなわち、ＱＡ法やＳＱＡ法では、外部パラメータとして、横磁場項に含まれる係数Γ（ｔ）が用いられる。したがって、第１の探索方法としてＱＡ法やＳＱＡ法を用いる場合、第２の探索方法では、係数Γ（ｔ）の値を比較的小さい値から時間経過とともに漸増させることで、横磁場の影響が徐々に強くなるように制御して、探索部２０に探索を実行させることが考えられる。

［第２の実施の形態］
次に、第２の実施の形態を説明する。
図２は、第２の実施の形態の情報処理システムのハードウェア例を示す図である。

情報処理システム２は、情報処理装置１００及び最適化装置２００を有する。
情報処理装置１００は、ＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ（Hard Disk Drive）１０３、ＩＯインタフェース１０４、画像信号処理部１０５、入力信号処理部１０６、媒体リーダ１０７及びＮＩＣ１０８を有する。ＣＰＵ１０１は、第１の実施の形態の処理部１２の一例である。ＩＯインタフェース１０４は、第１の実施の形態の通信部１１の一例である。

ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。なお、ＣＰＵ１０１は複数のプロセッサコアを含んでもよい。また、情報処理装置１００は複数のプロセッサを有してもよい。複数のプロセッサの集合を「マルチプロセッサ」または単に「プロセッサ」と言うことがある。

ＲＡＭ１０２は、ＣＰＵ１０１が実行するプログラムやＣＰＵ１０１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、情報処理装置１００は、ＲＡＭ以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ１０３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、及び、データを記憶する不揮発性の記憶装置である。なお、情報処理装置１００は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

ＩＯインタフェース１０４は、最適化装置２００と接続され、ＣＰＵ１０１からの命令に従って、最適化装置２００に対するデータの入出力を行う。例えば、ＩＯインタフェース１０４は、ＣＰＵ１０１の命令に応じて、ＲＡＭ１０２のデータを最適化装置２００のレジスタまたはメモリに書き込んだり、最適化装置２００からデータを読み出して、ＲＡＭ１０２に書き込んだりする。ＩＯインタフェース１０４としては、例えば、ＰＣＩ−ｅ（Peripheral Component Interconnect - Express）などが用いられる。

画像信号処理部１０５は、ＣＰＵ１０１からの命令に従って、情報処理装置１００に接続されたディスプレイ１１１に画像を出力する。ディスプレイ１１１としては、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイなど、任意の種類のディスプレイを用いることができる。

入力信号処理部１０６は、情報処理装置１００に接続された入力デバイス１１２から入力信号を取得し、ＣＰＵ１０１に出力する。入力デバイス１１２としては、マウス・タッチパネル・タッチパッド・トラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、情報処理装置１００に、複数の種類の入力デバイスが接続されていてもよい。

媒体リーダ１０７は、記録媒体１１３に記録されたプログラムやデータを読み取る読み取り装置である。記録媒体１１３として、例えば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）が含まれる。

媒体リーダ１０７は、例えば、記録媒体１１３から読み取ったプログラムやデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、例えば、ＣＰＵ１０１によって実行される。なお、記録媒体１１３は可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体１１３やＨＤＤ１０３を、コンピュータ読み取り可能な記録媒体と言うことがある。

ＮＩＣ１０８は、ネットワーク４０に接続され、ネットワーク４０を介して他のコンピュータと通信を行うインタフェースである。ＮＩＣ１０８は、例えば、ネットワーク４０に含まれるスイッチやルータなどの通信装置とケーブルで接続される。

最適化装置２００は、組合せ最適化問題を定式化した目的関数に基づいて、ＳＡ法やレプリカ交換法による基底状態探索をハードウェアにより行うアクセラレータである。最適化装置２００は、例えば、ＦＰＧＡなどの集積回路により実現される。最適化装置２００は、ボルツマンマシン、イジングマシンまたはイジング最適化装置などと呼ばれることもある。第２の実施の形態では、目的関数をエネルギー関数と称し、目的関数の値をエネルギー値と称することがある。

最適化装置２００は、探索部２１０を有する。探索部２１０は、ＳＡ法やレプリカ交換法などを用いて基底状態の探索を行う。
探索部２１０には、ＣＰＵ１０１によって、探索に用いられる温度値が設定される。例えば、探索部２１０は、ＣＰＵ１０１により設定された温度スケジュールに従って、ＳＡ法による基底状態の探索を行える。また、探索部２１０は、ＳＡ法に代えて、複数の温度値を用いてレプリカ交換法による基底状態の探索を行ってもよい。更に、探索部２１０は、後述されるように、ＣＰＵ１０１により設定された固定温度での探索を行うこともできる。

なお、ＣＰＵ１０１またはネットワーク４０に接続された他の情報処理装置のＣＰＵが所定のソフトウェアを実行することで、ＳＡ法やレプリカ交換法などを実行する探索部２１０の機能を実現してもよい。また、情報処理装置１００は、コンピュータでもよい。

図３は、情報処理装置の機能例を示す図である。
情報処理装置１００は、記憶部１２０、制御部１３０及びステート取得部１４０を有する。記憶部１２０には、ＲＡＭ１０２やＨＤＤ１０３の記憶領域を用いることができる。制御部１３０及びステート取得部１４０は、ＲＡＭ１０２に記憶されたプログラムがＣＰＵ１０１により実行されることで実現される。

記憶部１２０は、近傍ステートテーブルを記憶する。近傍ステートテーブルは、あるステートを始点として再探索された、当該始点の近傍のステートである。近傍とは、例えば始点となったステートに対するハミング距離が一定値未満であることを意味する。再探索とは、ＳＡ法やレプリカ交換法で探索された局所解を基にして、更に探索を行う段階を意味する。

また、記憶部１２０は、探索部２１０の探索で得られたステートをエネルギー値とともに保持する。更に、記憶部１２０は、得られたステートのうち、エネルギー値が最小のステートをベスト解として保持する。

制御部１３０は、組合せ最適化問題の問題データを探索部２１０に設定する。また、制御部１３０は、ＳＡ法やレプリカ交換法による探索の初期ステートや温度スケジュール、再探索の始点ステートや温度値、再探索におけるステートのサンプリングレートなどを探索部２１０に設定する。ここで、温度値は、第１の実施の形態の外部パラメータの値の一例である。

制御部１３０は、探索部２１０に対して、まずはＳＡ法またはレプリカ交換法による解の探索を実行させる。制御部１３０は、ＳＡ法やレプリカ交換法により、複数の局所解が取得されると、複数の局所解を用いた再探索を探索部２１０に実行させる。再探索では、制御部１３０は、温度値が低い方から高い方へ徐々に上がるように探索部２１０を制御する。

再探索は、強化フェーズ（Intensification phase）及び多様化フェーズ（Diversification phase）と呼ばれる２つの処理段階を含む。強化フェーズでは、始点ステートから近傍ステートをサンプリングする処理が行われる。多様化フェーズでは、サンプリングした近傍ステートを基に、新たな始点ステートを生成する処理が行われる。強化フェーズ及び多様化フェーズについては次の文献２を参考にできる。

文献２：M.Morita, H.Ochiai, K.Tamura and K.Yasuda,“Multi-point Search Combinatorial Optimization Method Based on Neighborhood Search Using Evaluation of Big Valley Structure,” 2015 IEEE International Conference on Systems, Man, and Cybernetics, Kowloon, 2015, p.2835-2840.
ステート取得部１４０は、探索部２１０により得られたステート及び当該ステートに対応するエネルギー値を取得し、制御部１３０に供給する。ステート取得部１４０は、取得したステートとエネルギー値とを記憶部１２０に格納してもよい。ステート取得部１４０は、得られたステート及びエネルギー値に基づいて、記憶部１２０に保存されているベスト解を更新する。

ここで、探索部２１０は、サブ探索部２１１，２１２，２１３，…を有する。サブ探索部２１１，２１２，２１３，…それぞれは、前述の式（１）で示されるエネルギー関数に基づいて、同一の組合せ最適化問題についてＳＡ法やレプリカ交換法などによる基底状態の探索を行う。サブ探索部２１１，２１２，２１３，…それぞれは、レプリカやレプリカ回路などと呼ばれてもよい。また、サブ探索部２１１，２１２，２１３，…は、複数の装置に分散して配置されてもよい。例えば、サブ探索部２１１，２１２，２１３，…それぞれが個別のイジングマシンにより実現されてもよい。サブ探索部２１１，２１２，２１３，…それぞれは、自身の探索により得られたステートやエネルギー値などを保持するメモリまたはレジスタを有する。

ここで、式（１）における状態変数ｘ_ｉの値が変化して１−ｘ_ｉとなると、状態変数ｘ_ｉの増加分は、δｘ_ｉ＝（１−ｘ_ｉ）−ｘ_ｉ＝１−２ｘ_ｉと表せる。したがって、エネルギー関数Ｅ（ｘ）に対して、状態変数ｘ_ｉの変化に伴うエネルギー値の変化量ΔＥ_ｉは、式（２）で表される。

ｈ_ｉは局所場（ローカルフィールド）と呼ばれ、式（３）で表される。

状態変数ｘ_ｊが変化したときの局所場ｈ_ｉの変化分δｈ_ｉ ^（ｊ）は、式（４）で表される。

サブ探索部２１１，２１２，２１３，…それぞれは、自身が備えるメモリやレジスタに局所場ｈ_ｉを保持し、状態変数ｘ_ｊの値が変化したときに変化分δｈ_ｉ ^（ｊ）をｈ_ｉに加算することで、ビット反転後の状態に対応するｈ_ｉを得る。

ここで、エネルギー値を最小化する基底状態の探索に、例えば最急降下法を用いることが考えられる。しかし、最急降下法では、一旦、局所解に陥ると脱出できなくなる。
そこで、サブ探索部２１１，２１２，２１３，…では、基底状態の探索において、エネルギー値の変化量がΔＥ_ｉとなる状態遷移（状態変数ｘ_ｉの値の変化）を許容するか否かを決定するためにメトロポリス法やギブス法が用いられる。すなわち、サブ探索部２１１，２１２，２１３，…は、ある状態から当該状態よりもエネルギー値の低い他の状態への遷移を探索する近傍探索において、エネルギー値が下がる状態だけでなく、エネルギー値が上がる状態への遷移を確率的に許容する。例えば、エネルギー値の変化量ΔＥの状態変数の値の変化を受け入れる確率Ａ（ΔＥ）は、式（５）で表される。

逆温度βは温度値Ｔ（Ｔ＞０）の逆数（β＝１／Ｔ）である。ｍｉｎ演算子は、引数のうちの最小値を取ることを示す。したがって、例えば、メトロポリス法を用いる場合、一様乱数ｕ（０＜ｕ≦１）に対して、エネルギー値の変化量ΔＥが式（６）を満たす場合に、該当の状態変数の値の変化が許容される。

制御部１３０は、サブ探索部２１１，２１２，２１３，…を並列に用いて、ＳＡ法やレプリカ交換法による探索を行わせることができる。
ただし、サブ探索部２１１，２１２，２１３，…によりレプリカ交換法を用いて局所解を探索させた場合、再探索ではサブ探索部間でのレプリカ交換、すなわち、温度値やステートの交換は行われず、サブ探索部ごとに独立して探索が行われる。

図４は、近傍ステートテーブルの例を示す図である。
近傍ステートテーブル１２１は、記憶部１２０に記憶される。近傍ステートテーブル１２１は、始点と当該始点からの探索により得られたステート群との対応関係を示す。近傍ステートテーブル１２１は、始点及び近傍ステートの項目を含む。

始点の項目には、始点のステートが登録される。近傍ステートの項目には、再探索における強化フェーズで、当該始点からの探索によりサンプリングされた近傍ステートが登録される。

例えば、近傍ステートテーブル１２１には、始点「ｓｔａｒｔ１」、近傍ステート「ｓｔａｒｔ１＿ｓｔａｔｅ１」、「ｓｔａｒｔ１＿ｓｔａｔｅ２」、…のレコードが登録される。当該レコードは、「ｓｔａｒｔ１」で示される始点のステートに対し、近傍ステートとしてステート群｛「ｓｔａｒｔ１＿ｓｔａｔｅ１」、「ｓｔａｒｔ１＿ｓｔａｔｅ２」、…｝がサンプリングされたことを示す。

近傍ステートテーブル１２１には、他の始点及び当該他の始点に対応する近傍ステートを示すレコードも登録される。
図５は、ステートのマッピングの第１の例を示す図である。

近傍ステートテーブル１２１に記録された各ステートは、前述のＭＤＳの方法を用いて所定の座標系における座標にマッピングされる。マッピング先の座標系の次元数は、ステートの次元数と異なってもよい。例えば、マッピング先の座標系の次元数がステートの次元数よりも小さい場合、ステートの次元が、マッピング先の次元に圧縮されることになる。マッピング先の座標系の次元数は２以上とすることができる。

座標系５０は、ＭＤＳによるマッピング先の２次元の座標系の例である。座標系５０は、例えば、直交するｘ軸及びｙ軸を有する。座標系５０における２つの（ｘ，ｙ）座標の間の距離（ＭＤＳＤｉｓｔａｎｃｅ）には所定の尺度で評価された、当該２つの座標に対応する２つのステートの類似度が反映される。類似度の評価の尺度には、例えば、２つのステートの間のハミング距離や、２つのステートで表される、組合せ最適化問題における２つのパラメータ群の間の距離を用いることができる。ただし、ステート間の類似度の評価には、他の尺度が用いられてもよい。座標系５０における各ステートに対応する座標の情報は、第１の実施の形態のマップ情報３０の一例である。

このように、各ステートをＭＤＳにより座標系５０にマッピングすることで、各ステート間がどの程度離れているか、あるステートから他のステートにどの程度到達し難いかを、座標間の距離により簡便に評価可能になる。なお、座標系５０に更にｚ軸を加え、当該ｚ軸をエネルギー値として表してもよい。

座標系５０には、座標を表す印が示されている。プラス（＋）印（例えば、座標Ａ１上の印）は、再探索における前の始点ステートに対応する座標を示す。丸（〇）印（例えば、座標Ｂ１上の印）は、再探索により得られた近傍ステートに対応する座標を示す。クロス（Ｘ）印（座標Ｃ１〜Ｃ４上の印）は、再探索における次の始点ステートに対応する座標を示す。

座標系５０には、更に、ポリゴン５１，５２，５３，５４が示されている。ポリゴン５１，５２，５３，５４それぞれは、前の始点ステートと当該始点ステートに対して再探索により探索された近傍ステートとを囲う、３以上の頂点をもつ図形である。ポリゴン５１，５２，５３，５４それぞれは、最小バウンディングポリゴンや最小バウンディングレクタングル（矩形）でもよい。最小バウンディングレクタングルについては、ＵＲＬ「ｈｔｔｐｓ：／／ｅｎ．ｗｉｋｉｐｅｄｉａ．ｏｒｇ／ｗｉｋｉ／Ｍｉｎｉｍｕｍ＿ｂｏｕｎｄｉｇ＿ｒｅｃｔａｎｇｌｅ」（２０２０年５月２１日検索）を参考にできる。「ＷＩＫＩＰＥＤＩＡ」は登録商標である。

例えば、ポリゴン５１，５２のように複数の図形の一部分が重なることもある。
ポリゴン５１，５２，５３，５４は、全探索空間のうちの探索済みの部分空間に対応する領域であると推定される。このため、既に得られている解以外に最適解があるとすれば、全探索空間のうち、当該領域の外に対応する未探索の部分空間に存在する可能性が高いと推定される。そこで、制御部１３０は、ポリゴン５１，５２，５３，５４それぞれに属するステートに基づいて、ポリゴン５１，５２，５３，５４に属さない次の始点ステートを求める。

例えば、制御部１３０は、ポリゴン５１，５２に対して、座標Ｃ１に対応する次の始点ステートを求める。制御部１３０は、ポリゴン５２，５４に対して、座標Ｃ２に対応する次の始点ステートを求める。制御部１３０は、ポリゴン５３，５４に対して、座標Ｃ３に対応する次の始点ステートを求める。制御部１３０は、ポリゴン５４及び図示されていない他のポリゴンに対して、座標Ｃ４に対応する次の始点ステートを求める。

図６は、ステートのマッピングの第２の例を示す図である。
座標系５０ａでは、座標系５０に対して、ポリゴン５５，５６，５７，５８が追加されている。ポリゴン５５，５６，５７，５８は、それぞれ座標Ｃ１，Ｃ２，Ｃ３，Ｃ４に対応する次の始点ステートから再探索を行ってサンプリングされたステート群を囲うポリゴンである。座標系５０ａにおける星形印は、最適解に対応する座標Ｄ１を示す。

なお、制御部１３０は、座標系５０，５０ａや座標系５０，５０ａにｚ軸のエネルギー値を加えた図５，６のような画像をディスプレイ１１１に表示したり、ネットワーク４０を介して他の装置に表示させたりしてもよい。これにより、ユーザによる探索状況のモニタリングを可能にすることもできる。

図７は、始点候補ステートの計算例を示す図である。
図７では、ポリゴン５１に属する座標群に対応するステート群、及び、ポリゴン５２に属する座標群に対応するステート群に対して、始点候補ステートを計算する例を示す。

まず、制御部１３０は、ポリゴン５１に属する座標群に対応する各ステートにおける同じ位置のビット同士を比較して、ビットパターン６１を生成する。ビットパターン６１では、各位置について、当該位置のビットが常に１である場合、当該位置が同等ビット（１）に分類され、当該位置のビットが常に０である場合、当該位置が同等ビット（０）に分類される。また、当該位置のビットが１であることもあるし、０であることもある場合、差異ビット（図中の「ｄｏｎ’ｔｃａｒｅ」）に分類される。

例えば、ビットパターン６１は、ポリゴン５１に対応する各ステートについて、０〜９番目の位置（ｂｉｔ０〜ｂｉｔ９）の各ビットを次のように分類することを示す。０，２，４，６番目のビットは同等ビット（１）である。１，３，５番目のビットは同等ビット（０）である。７，８，９番目のビットは、差異ビットである。

同様に、制御部１３０は、ポリゴン５２に対して、ビットパターン６２を生成する。例えば、ビットパターン６２は、ポリゴン５２に対応する各ステートについて、０〜９番目の位置（ｂｉｔ０〜ｂｉｔ９）の各ビットを次のように分類することを示す。０，２，４，５番目のビットは同等ビット（１）である。１，６，７番目のビットは同等ビット（０）である。３，８，９番目のビットは差異ビットである。

そして、制御部１３０は、ビットパターン６１，６２に基づき、次のように始点候補ステートを生成することで、未探索区間の中央を狙い易くする。
制御部１３０は、ビットパターン６１，６２の同じ位置のビットが両方とも同等ビット（１）、または両方とも同等ビット（０）の場合、始点候補ステートの当該位置のビットの属性を「キープ（keep）」とする。ビットパターン６１，６２の例では、０，１，２，４番目のビットで、両方とも同等ビット（１）、または両方とも同等ビット（０）なので、属性はキープとなる。

また、制御部１３０は、ビットパターン６１，６２の同じ位置のビットについて、一方が同等ビット（１）であり、かつ、他方が同等ビット（０）の場合、始点候補ステートの当該位置のビットの属性を「優先リリンキング（relinking）対象」とする。図７では、優先リリンキング対象を、「優先」と略記している。ビットパターン６１，６２の例では、５，６番目のビットで、一方が同等ビット（１）かつ他方が同等ビット（０）なので、属性は優先リリンキング対象となる。

更に、制御部１３０は、ビットパターン６１，６２の同じ位置のビットについて、少なくとも一方が差異ビットの場合、始点候補ステートの当該位置のビットの属性を「非優先リリンキング対象」とする。図７では、非優先リリンキング対象を、「非優先」と略記している。ビットパターン６１，６２の例では、３，７，８，９番目のビットで、少なくとも一方が差異ビットなので、属性は非優先リリンキング対象となる。

制御部１３０は、始点候補ステートの各位置のビットの属性に応じて、当該位置のビットの値を決定する。具体的には、制御部１３０は、属性がキープの場合、始点候補ステートの該当位置のビットを、ビットパターン６１，６２の同じ位置のビットと同じ値にする。例えば、制御部１３０は、ビットパターン６１，６２に対して、始点候補ステートの０，２，４番目のビットを１とし、１番目のビットを０とする。

また、制御部１３０は、属性が優先リリンキング対象の場合、優先リリンキング対象の複数のビットで、１及び０がほぼ同じ数だけ含まれるように、始点候補ステートの該当位置のビットの値を決める。すなわち、優先リリンキング対象のビットのみに注目したとき、ビットパターン６１と始点候補ステートとのハミング距離及びビットパターン６２と始点候補ステートとのハミング距離は同等となる。例えば、ビットパターン６１，６２の例では、制御部１３０は、始点候補ステートの５番目のビットを１とするとき、６番目のビットを０とする。あるいは、制御部１３０は、始点候補ステートの５番目のビットを０とするとき、６番目のビットを１とする。

更に、制御部１３０は、属性が非優先リリンキング対象の場合、始点候補ステートの該当位置のビットを、１または０にランダム（random）に決定する。例えば、制御部１３０は、ビットパターン６１，６２に対して、始点候補ステートの３，７，８，９番目のビットの値を１または０にランダムに決定する。

制御部１３０は、生成された始点候補ステートを座標系５０にプロットする。すなわち、制御部１３０は、当該始点候補ステートに対応する、座標系５０における座標をＭＤＳの方法により求める。そして、制御部１３０は、プロットした当該始点候補ステートに対応する座標が何れのポリゴンにも含まれない場合に、当該始点候補ステートを、次の始点ステートとして確定する。

このようにして次の始点ステートを生成することで、全探索空間のうちの未探索部分について、探索済部分から適度に離れた始点ステートが生成され易くなる。
次に、情報処理システム２の処理手順を説明する。

図８は、情報処理システムの全体制御例を示すフローチャートである。
（Ｓ１０）制御部１３０は、サブ探索部２１１，２１２，２１３，…を並列に用いて、互いに異なる初期ステートからＳＡ法やレプリカ交換法による、組合せ最適化問題に対する解の探索を実行させる。サブ探索部２１１，２１２，２１３，…は、それぞれ探索により得られたエネルギー値が最小の解、すなわち、局所解を情報処理装置１００に出力する。ステート取得部１４０は、サブ探索部２１１，２１２，２１３，…により出力された複数の局所解を取得する。複数の局所解それぞれは、強化フェーズにおける最初の始点ステートとなる。

（Ｓ１１）制御部１３０は、強化フェーズの処理を実行する。強化フェーズでは、始点ステートの近傍ステートがサンプリングされる。ステート取得部１４０は、当該近傍ステートを取得し、取得した近傍ステートを始点ステートに対応付けて近傍ステートテーブル１２１に記録する。強化フェーズの詳細は後述される。

（Ｓ１２）制御部１３０は、複数の始点ステート及び複数の始点ステートそれぞれに対してサンプリングされた近傍ステート群に基づいてＭＤＳ計算を実行する。制御部１３０は、ＭＤＳ計算を実行することで、複数の始点ステート及びサンプリングされた複数の近傍ステートを、ステート間の類似度を表す距離を維持して、例えば座標系５０にマッピングする。

（Ｓ１３）制御部１３０は、強化フェーズで得た近傍ステートを、始点ステートで区別する。すなわち、制御部１３０は、近傍ステートテーブル１２１に基づいて、座標系５０における始点ステート及び当該始点ステートに対応する座標群を、始点ステートごとに特定する。

（Ｓ１４）制御部１３０は、多様化フェーズの処理を実行する。多様化フェーズでは、次の強化フェーズにおける新たな始点ステートの生成が行われる。多様化フェーズの詳細は後述される。

（Ｓ１５）制御部１３０は、所定の終了条件を充足したか否かを判定する。終了条件を充足した場合、制御部１３０は、ステップＳ１６に処理を進める。終了条件を充足していない場合、制御部１３０は、ステップＳ１１に処理を進める。当該終了条件は、例えば、ステップＳ１１〜Ｓ１４の手順が一定回数実行されたこと、あるいは、全体制御の開始から一定時間が経過したことなどである。

（Ｓ１６）制御部１３０は、ベスト解を出力する。すなわち、制御部１３０は、全体制御の過程で取得されたステートのうち、最も良いステート、すなわち、エネルギー関数の値を最小にするステートを最終的な解として出力する。例えば、制御部１３０は、ディスプレイ１１１に解を表す画像を表示させてもよいし、ネットワーク４０を介して、他のコンピュータに解の情報を送信してもよい。そして、全体制御の処理が終了する。

図９は、強化フェーズの例を示すフローチャートである。
強化フェーズは、ステップＳ１１に相当する。
（Ｓ２０）制御部１３０は、サブ探索部２１１，２１２，２１３，…それぞれに、互いに異なる始点ステートを設定する。

（Ｓ２１）制御部１３０は、各サブ探索部による初期温度値での探索を並列に開始させる。ここで、初期温度値は、例えば、温度値として取り得る最小の温度値である。ただし、当該最小の温度値よりも大きい温度値を初期温度値としてもよい。

（Ｓ２２）サブ探索部２１１，２１２，２１３，…それぞれは、現在の温度値を用いて、式（６）に基づく１ビット分のビット変化を、現在保持するステートに対して実行する。例えば、サブ探索部２１１は、各ビットの変化、すなわち各状態変数の値の変化を許容するか否かを式（６）に基づいて判定し、変化が許容されたビットを乱数を用いてランダムに１つ選択し、選択したビットについて１ビット分のビット変化を実行してもよい。サブ探索部２１２，２１３，…もサブ探索部２１１と同様にビット変化を実行する。

（Ｓ２３）サブ探索部２１１，２１２，２１３，…は、制御部１３０により予め設定されたイタレーション数に達したか否かを判定する。設定されたイタレーション数に達した場合、サブ探索部２１１，２１２，２１３，…は、現ステートを情報処理装置１００に出力して、ステップＳ２４に処理を進める。設定されたイタレーション数に達していない場合、サブ探索部２１１，２１２，２１３，…は、ステップＳ２２に処理を進める。ここで、イタレーション数は、現在の温度値でのステップＳ２２の実行回数に相当する。

（Ｓ２４）制御部１３０は、始点ステートと現ステートとの距離が一定値未満であるか否かを、始点ステートと当該始点ステートに対応する現ステートとの組ごとに判定する。始点ステートと現ステートとの距離が一定値未満の場合、該当の組についてステップＳ２５に処理を進める。始点ステートと現ステートとの距離が一定値以上の場合、該当の組について、該当のサブ探索部から今回得られた現ステートを破棄して、該当のサブ探索部に対する強化フェーズの処理を終了する。強化フェーズが終了したサブ探索部は他のサブ探索部の強化フェーズが完了するまで待機する。ここで、始点ステートと現ステートの距離は、例えばハミング距離によって評価される。判定に用いられる一定値は、ユーザによって情報処理装置１００に予め設定される。

（Ｓ２５）制御部１３０は、該当のサブ探索部から今回得られた現ステートを始点ステートに対応付けて、近傍ステートテーブル１２１の近傍ステートの項目に記録する。
（Ｓ２６）制御部１３０は、該当のサブ探索部の温度値をインクリメントする。すなわち、制御部１３０は、該当のサブ探索部の探索に用いられる温度値を増加させる。温度値の増加幅は、ユーザによって情報処理装置１００に予め設定される。温度値の増加幅は、一定幅でもよいし、０．１，１，１０，１００，１０００，…のような対数幅で徐々に増やしてもよい。そして、制御部１３０は、ステップＳ２２に処理を進める。

このようにして、始点ステートに対する近傍ステートがサンプリングされる。
図１０は、多様化フェーズの例を示すフローチャートである。
多様化フェーズは、ステップＳ１４に相当する。

（Ｓ３０）制御部１３０は、強化フェーズで得られた近傍ステート群を始点ステートごとに取得する。
（Ｓ３１）制御部１３０は、始点ステート及び近傍ステート群のＭＤＳ座標を囲うポリゴンを始点ステートごとに計算する。当該ポリゴンは、最小バウンディングポリゴンあるいは最小バウンディングレクタングルと呼ばれるものでもよい。

（Ｓ３２）制御部１３０は、ポリゴンのペアに対して始点候補ステートを計算する。始点候補ステートの計算の処理の詳細は後述される。
（Ｓ３３）制御部１３０は、計算した始点候補ステートに対応するＭＤＳ座標が、ステップＳ３１で求めた何れかのポリゴンの中にあるか否かを判定する。当該ＭＤＳ座標が何れかのポリゴンの中にある場合、制御部１３０は、ステップＳ３４に処理を進める。当該ＭＤＳ座標が何れのポリゴンの中にもない場合、制御部１３０は、ステップＳ３５に処理を進める。

（Ｓ３４）制御部１３０は、該当の始点候補ステートを破棄する。そして、制御部１３０は、ステップＳ３６に処理を進める。
（Ｓ３５）制御部１３０は、該当の始点候補ステートを次の強化フェーズの始点ステートとして確定する。そして、制御部１３０は、ステップＳ３６に処理を進める。

（Ｓ３６）制御部１３０は、ポリゴンの全ペアに対してステップＳ３２を処理済であるか否かを判定する。ポリゴンの全ペアを処理済の場合、制御部１３０は、多様化フェーズの処理を終了する。ポリゴンの全ペアを処理済でない場合、制御部１３０は、ステップＳ３２に処理を進める。

図１１は、始点候補ステートの計算例を示すフローチャートである。
始点候補ステートの計算は、ステップＳ３２に相当する。
（Ｓ４０）制御部１３０は、各ポリゴンの所属点のステート情報を取得する。ここで、ステート情報の取得対象となるポリゴンは、始点候補ステートの計算の用いる２つのポリゴンである。

（Ｓ４１）制御部１３０は、ポリゴンごとに、当該ポリゴンに対応する各ステートについて同等ビットと、差異ビットとを抽出し、ポリゴンごとに、同等ビット及び差異ビットのビットパターンを生成する。同等ビット及び差異ビットの抽出及びビットパターンの生成には、図７で例示した方法を用いることができる。

（Ｓ４２）制御部１３０は、ステップＳ４１を未処理のポリゴンがあるか否かを判定する。未処理のポリゴンがある場合、制御部１３０は、ステップＳ４１に処理を進める。未処理のポリゴンがない場合、制御部１３０は、ステップＳ４３に処理を進める。ここで、ステップＳ４１の処理は、各ポリゴンに対して１回実行されればよい。このため、始点候補ステートの計算対象となるポリゴンに対して、ビットパターンを生成済の場合、当該ポリゴンについては、ステップＳ４１をスキップしてよい。

（Ｓ４３）制御部１３０は、ペアのポリゴンの各ビットパターンにおける同位置のビットを順に抽出する。
（Ｓ４４）制御部１３０は、両ビットが同等ビットかつ同じ値であるか否かを判定する。両ビットが同等ビットかつ同じ値である場合、制御部１３０は、ステップＳ４５に処理を進める。両ビットが同等ビットかつ同じ値でない場合、制御部１３０は、ステップＳ４６に処理を進める。

（Ｓ４５）制御部１３０は、始点候補ステートの該当位置のビットの値の属性をキープとし、当該ビットの値を、各ビットパターンにおける同位置の両ビットと同じ値に決定する。そして、制御部１３０は、ステップＳ４９に処理を進める。

（Ｓ４６）制御部１３０は、両ビットが同等ビットかつ異なる値であるか否かを判定する。両ビットが同等ビットかつ異なる値である場合、制御部１３０は、ステップＳ４７に処理を進める。それ以外の場合、制御部１３０は、ステップＳ４８に処理を進める。

（Ｓ４７）制御部１３０は、始点候補ステートの該当位置のビットの属性を優先リリンキング対象とする。そして、制御部１３０は、ステップＳ４９に処理を進める。
（Ｓ４８）制御部１３０は、始点候補ステートの該当位置のビットの属性を非優先リリンキング対象とする。そして、制御部１３０は、ステップＳ４９に処理を進める。

（Ｓ４９）制御部１３０は、全位置のビットを処理済であるか否かを判定する。全位置のビットを処理済の場合、制御部１３０は、ステップＳ５０に処理を進める。全位置のビットを処理済でない場合、制御部１３０は、ステップＳ４３に処理を進める。

（Ｓ５０）制御部１３０は、始点候補ステートの各位置のビットの値を、当該ビットの属性に応じて決定する。なお、始点候補ステートのビットの中には、ステップＳ４５により既に１または０の何れかに決定されているものもあり得る。図７で例示したように、制御部１３０は、優先リリンキング対象の複数のビットについて、１及び０が均等になるように設定する。ただし、優先リリンキング対象のビットが１つしかない場合には、１または０をランダムに設定してよい。また、制御部１３０は、非優先リリンキング対象のビットについては、１または０をランダムに設定する。そして、制御部１３０は、始点候補ステートの計算の処理を終了する。

このようにして、始点候補ステートを効率的に生成することができる。
以上で説明したように、第２の実施の形態の情報処理装置１００によれば、最適解に到達する可能性を高めることができる。また、全探索空間のうちの未探索の部分に絞って効率的に解の探索を行うことができ、短時間で最適解を得られる可能性を高められる。こうして、組合せ最適化問題に対する求解性能を向上できる。

例えば、上記の多様化フェーズの手順によれば、次の始点ステートとして、「未探索の部分に対応するポリゴンの中央」を狙い易くなる。「未探索の部分に対応するポリゴンの中央」のステートとは便宜的な表現であり、当該ステートは全探索空間の探索済の各部分から、ハミング距離などの所定の尺度で評価される距離が適度に離れているステートを意味する。このため、探索済のステートが重複して探索される可能性を減らせ、解の探索を一層効率化できる。また、短時間で最適解を得られる可能性を一層高められる。

ここで、ＳＡ法やレプリカ交換法などのメタヒューリスティック手法を用いる探索部２１０のような最適化ソルバーでは、組合せ最適化問題を解く際に、解の探索空間が近傍ベースで探索される。しかし、解こうとする問題の種類によっては最適解に到達し難くなる。そのような問題の例として、二次割り当て問題やナップザック問題が挙げられる。

最適解に到達し難くなる原因としては、例えば、ＳＡ法やレプリカ交換法において比較的高い温度値では変化し易いが比較的低い温度値では変化し難い特定のビット、あるいは特定のビットの組で表される特定の変数があることが挙げられる。一方、比較的高い温度値では、全てのビットが変化し易いため、当該特定のビットまたは特定のビットの組が最適解の値に揃い難くなる。このため、局所解に陥り易くなり、最適解に到達するのが難しくなることがある。

情報処理装置１００は、探索部２１０によりＳＡ法やレプリカ交換法などの第１の探索方法だけでは探索され難い区間に的を絞って探索させることで、早く最適解に到達する可能性を高められる。

図１２は、局所解近傍のステートのエネルギー値の例を示す図である。
グラフ７０は、横軸をステートとし、縦軸をエネルギー値Ｅとして、ステートに対するエネルギー値を表したものである。ただし、グラフ７０では、探索空間における各ステートを便宜的に一次元で表している。

上記のように、ＳＡ法やレプリカ交換法では、局所解Ｌ１，Ｌ２に陥り易いことがある。また、局所解Ｌ１の近傍の比較的高いエネルギー障壁のエネルギー値Ｅ１と、局所解Ｌ２の近傍の比較的高いエネルギー障壁のエネルギー値Ｅ２との差が極めて小さくなることがある。この場合、局所解Ｌ１または局所解Ｌ２に到達した後、到達した局所解Ｌ１または局所解Ｌ２を脱出して最適解へ到達するためには、極めて精密に温度値が設定される必要があり、最適解へ到達することが難しい。

一方、情報処理装置１００によれば、例えば、強化フェーズで局所解Ｌ１，Ｌ２それぞれの近傍ステート群を特定し、多様化フェーズで特定した近傍ステート群から適度に離れた次の始点ステートを求めて再探索を行える。このため、局所解Ｌ１，Ｌ２の近傍を避けて効率的に探索を行うことができ、より早く最適解へ到達できるようになる。

サブ探索部２１１，２１２，２１３，…の各々が用いる第１の探索方法としては、上記で例示したＳＡ法やレプリカ交換法の他にも、ＱＡ法やＳＱＡ法が考えられる。
局所解を求めるための第１の探索方法として、ＱＡ法やＳＱＡ法を用いる場合、前述のように、外部パラメータとして、横磁場の影響の強さを表す係数Γ（ｔ）が用いられる。その場合、強化フェーズに対応する第２の探索方法では、組合せ最適化問題を定式化したハミルトニアンに含まれる係数Γ（ｔ）の値を比較的小さい値（例えば、０）から時間経過とともに漸増させることで、近傍ステートの探索を行うことが考えられる。

以上をまとめると、第２の実施の形態の情報処理装置１００は、例えば、次の機能を有する。
制御部１３０は、探索部２１０に第１ステート及び第２ステートを設定する。制御部１３０は、第１ステート及び第２ステートをそれぞれ始点とする探索であって、目的関数の値の増減に影響する所定の外部パラメータの値を、目的関数の値の増加を促す方向に変化させる探索を探索部２１０に実行させる。ステート取得部１４０は、当該探索の過程で第１ステートに基づいて得られた第１ステート群及び第２ステートに基づいて得られた第２ステート群を取得する。制御部１３０は、第１ステート群及び第２ステート群に基づいて、未探索のステートのうち第３ステートを決定する。制御部１３０は、第３ステートを始点として探索部２１０に探索を実行させる。

これにより、最適解に到達する可能性を高めることができる。また、全探索空間のうちの未探索の部分に絞って効率的に解の探索を行うことができ、短時間で最適解を得られる可能性を高められる。こうして、組合せ最適化問題に対する求解性能を向上できる。

例えば、再探索を最初に行う前に求める局所解をＳＡ法やレプリカ交換法で求める場合、外部パラメータは、温度値を示すパラメータである。あるいは、当該局所解をＱＡ法やＳＱＡ法で求める場合、外部パラメータは、目的関数における横磁場の影響の強さを示すパラメータである。

強化フェーズでは、当該温度値または横磁場の影響の強さを示す外部パラメータの値を時間経過とともに徐々に増加させる、すなわち漸増させることで、始点のステートに対する近傍のステートを適切にサンプリングできる。

また、制御部１３０は、第１ステート及び第２ステートをそれぞれ始点とする探索では、探索部２１０によりステートの変化が所定回数行われるたびに、または、所定期間が経過するたびに、外部パラメータの値を増加させる。

これにより、始点のステートに対する近傍のステートを適切にサンプリングできる。
また、制御部１３０は、第１ステートを始点とする探索では、探索部２１０で得られたステートと第１ステートとの間の距離が一定値を超えると、第１ステートに基づく探索を終了させる。制御部１３０は、第２ステートを始点とする探索では、探索部２１０で得られたステートと第２ステートとの間の距離が一定値を超えると、第２ステートに基づく探索を終了させる。距離は、前述のようにハミング距離でもよいし、他の所定の尺度で評価された距離でもよい。

これにより、始点のステートに対する近傍のステートを適切にサンプリングできる。
また、例えば、第１ステート及び第２ステートはそれぞれ、外部パラメータの値を、目的関数の値の増加を抑制する方向に変化させて行われる探索を探索部２１０が実行することで得られた局所解である。目的関数の値の増加を抑制する方向に変化させることは、例えば、外部パラメータの値を、時間経過とともに徐々に小さくすることである。

これにより、例えば、初回の再探索で、局所解の近傍のステートを特定でき、当該局所解の近傍の探索空間を、次の始点のステートの抽出候補から除外できる。このため、当該局所解の近傍が再探索される可能性を減らせ、効率的に解を探索できる。

多様化フェーズでは、制御部１３０は、強化フェーズでサンプリングされた複数のステート群に含まれるステート間の関係を示すマップ情報を生成する。マップ情報は、例えば、座標系５０における各ステートに対応する座標の情報を含む。制御部１３０は、第１ステートと第１ステート群との対応関係、第２ステートと第２ステート群との対応関係及びマップ情報に基づいて、第３ステートを決定する。

これにより、全探索空間のうちの未探索の部分から新たな始点のステートを抽出する処理を簡便に行える。
また、制御部１３０は、第１ステートと第１ステート群との対応関係及び第２ステートと第２ステート群との対応関係のそれぞれに基づいて、マップ情報における複数の座標それぞれを第１ステート及び第２ステートに対応付ける。制御部１３０は、第１ステート及び第２ステートのそれぞれに対応する座標群を包含する第１図形及び第２図形を特定し、第１図形及び第２図形の外部の座標に対応するステートを、第３ステートとして決定する。

これにより、全探索空間のうちの未探索の部分から新たな始点のステートを適切に抽出できる。
制御部１３０は、第１ステート群に属する各ステートを、対応する状態変数ごとに比較することで、第１ステート群に属する各ステートの状態変数の値の第１のパターンを特定する。制御部１３０は、第２ステート群に属する各ステートを、対応する状態変数ごとに比較することで、第２ステート群に属する各ステートの状態変数の値の第２のパターンを特定する。前述のビットパターン６１，６２は、第１及び第２のパターンの一例である。制御部１３０は、第１のパターン及び第２のパターンに基づいて、第３ステートの候補である候補ステートを生成し、候補ステートに対応する、マップ情報における座標が、第１図形及び第２図形の外部の座標である場合、候補ステートを第３ステートとして決定する。

これにより、全探索空間のうちの未探索の部分から新たな始点のステートを適切に抽出できる。
第１のパターン及び第２のパターンそれぞれは、第１の値または第２の値のまま変化がない状態変数、及び、値の変化がある状態変数を示す。

制御部１３０は、第１のパターン及び第２のパターンの両方において同一の値で、かつ、当該同一の値のまま変化がない状態変数に対応する、候補ステートの状態変数を当該同一の値に設定する。また、制御部１３０は、第１のパターン及び第２のパターンの一方で第１の値のまま変化がなく、他方で第２の値のまま変化がない１以上の状態変数に対応する、候補ステートの１以上の状態変数に対して、当該１以上の状態変数の中で第１の値の数及び第２の値の数の差が小さくなるように、第１の値及び第２の値を設定する。更に、制御部１３０は、第１のパターン及び第２のパターンの両方において値の変化がある状態変数に対応する、候補ステートの状態変数に対して、第１の値または第２の値をランダムに設定する。

これにより、全探索空間のうちの探索済の部分から適度に離れた候補ステートを生成できる。このため、当該候補ステートを始点とすることで全探索空間のうちの探索済の部分が重複して探索される可能性を減らせ、探索を効率的に行えるようになる。

例えば、マップ情報の座標を表す次元の数は、複数の状態変数の数よりも小さい。
これにより、マップ情報を基に、全探索空間のうちの未探索の部分から次の始点のステートを決定する処理を比較的少ない演算量により容易に行える。例えば、複数の状態変数の数は、１０２４や８１９２などであることがある。マップ情報の次元の数は２以上とすることができる。

また、探索部２１０は、それぞれが解の探索を行う複数のサブ探索部（例えば、サブ探索部２１１，２１２，２１３，…）を含む。探索部２１０は、複数のサブ探索部により、第１ステート及び第２ステートをそれぞれ始点とする探索を並列に実行する。

これにより、１つのサブ探索部を用いて直列に解の探索を行うよりも、探索を高速化できる。ただし、探索部２１０は、１つのサブ探索部を用いて直列に解の探索を行ってもよい。

更に、制御部１３０は、探索部２１０により得られたステートのうち、目的関数の値を最小にするステートを、最終的な解として出力する。
これにより、探索の過程で得られたベスト解を、最終的な解として適切に取得できる。

なお、第１の実施の形態の情報処理は、処理部１２にプログラムを実行させることで実現できる。また、第２の実施の形態の情報処理は、ＣＰＵ１０１にプログラムを実行させることで実現できる。プログラムは、コンピュータ読み取り可能な記録媒体１１３に記録できる。

例えば、プログラムを記録した記録媒体１１３を配布することで、プログラムを流通させることができる。また、プログラムを他のコンピュータに格納しておき、ネットワーク経由でプログラムを配布してもよい。コンピュータは、例えば、記録媒体１１３に記録されたプログラムまたは他のコンピュータから受信したプログラムを、ＲＡＭ１０２やＨＤＤ１０３などの記憶装置に格納し（インストールし）、当該記憶装置からプログラムを読み込んで実行してもよい。

１情報処理システム
１０情報処理装置
１１通信部
１２処理部
２０探索部
３０マップ情報
Ｒ１，Ｒ２，Ｒ３図形
ａ０〜ａ５，ｂ０〜ｂ４，ｃ０〜ｃ３，ｄ０，ｅ０，ｆ０座標

Claims

目的関数に含まれる複数の状態変数の値により表されるステートを変化させることで前記目的関数の値を最小にする解の探索を行う探索部と通信する通信部と、
前記通信部を介して前記探索部に第１ステート及び第２ステートを設定し、前記第１ステート及び前記第２ステートをそれぞれ始点とする前記探索であって、前記目的関数の値の増減に影響する所定の外部パラメータの値を、前記目的関数の値の増加を促す方向に変化させる前記探索を前記探索部に実行させ、当該探索の過程で前記第１ステートに基づいて得られた第１ステート群及び前記第２ステートに基づいて得られた第２ステート群を取得し、前記第１ステート群及び前記第２ステート群に基づいて、未探索のステートのうち第３ステートを決定し、前記第３ステートを始点として前記探索部に前記探索を実行させる処理部と、
を有する情報処理装置。
前記外部パラメータは、温度値を示すパラメータまたは前記目的関数における横磁場の影響の強さを示すパラメータである、
請求項１記載の情報処理装置。
前記処理部は、前記第１ステート及び前記第２ステートをそれぞれ始点とする前記探索では、前記探索部により前記ステートの変化が所定回数行われるたびに、または、所定期間が経過するたびに、前記外部パラメータの値を変化させる、
請求項１記載の情報処理装置。
前記処理部は、前記第１ステートを始点とする前記探索では、前記探索部で得られた前記ステートと前記第１ステートとの間の距離が一定値を超えると、前記第１ステートに基づく前記探索を終了させ、前記第２ステートを始点とする前記探索では、前記探索部で得られた前記ステートと前記第２ステートとの間の距離が前記一定値を超えると、前記第２ステートに基づく前記探索を終了させる、
請求項１記載の情報処理装置。
前記第１ステート及び前記第２ステートはそれぞれ、前記外部パラメータの値を、前記目的関数の値の増加を抑制する方向に変化させて行われる前記探索を前記探索部が実行することで得られた局所解である、
請求項１記載の情報処理装置。
前記処理部は、前記第１ステート群及び前記第２ステート群に含まれるステート間の関係を示すマップ情報を生成し、前記第１ステートと前記第１ステート群との対応関係、前記第２ステートと前記第２ステート群との対応関係及び前記マップ情報に基づいて、前記第３ステートを決定する、
請求項１記載の情報処理装置。
前記マップ情報は、前記第１ステート群及び前記第２ステート群に含まれる複数の前記ステートに対応する複数の座標を含み、
前記処理部は、前記第１ステートと前記第１ステート群との前記対応関係及び前記第２ステートと前記第２ステート群との前記対応関係のそれぞれに基づいて前記複数の座標それぞれを前記第１ステート及び前記第２ステートに対応付け、前記第１ステート及び前記第２ステートのそれぞれに対応する座標群を包含する第１図形及び第２図形を特定し、前記第１図形及び前記第２図形の外部の座標に対応する前記ステートを、前記第３ステートとして決定する、
請求項６記載の情報処理装置。
前記処理部は、
前記第１ステート群に属する各ステートを、対応する状態変数ごとに比較することで、前記第１ステート群に属する各ステートの状態変数の値の第１のパターンを特定し、
前記第２ステート群に属する各ステートを、対応する状態変数ごとに比較することで、前記第２ステート群に属する各ステートの状態変数の値の第２のパターンを特定し、
前記第１のパターン及び前記第２のパターンに基づいて、前記第３ステートの候補である候補ステートを生成し、前記候補ステートに対応する、前記マップ情報における座標が、前記第１図形及び前記第２図形の外部の座標である場合、前記候補ステートを前記第３ステートとして決定する、
請求項７記載の情報処理装置。
前記第１のパターン及び前記第２のパターンそれぞれは、第１の値または第２の値のまま変化がない状態変数、及び、値の変化がある状態変数を示し、
前記処理部は、
前記第１のパターン及び前記第２のパターンの両方において同一の値で、かつ、当該同一の値のまま変化がない状態変数に対応する、前記候補ステートの状態変数を当該同一の値に設定し、
前記第１のパターン及び前記第２のパターンの一方で前記第１の値のまま変化がなく、他方で前記第２の値のまま変化がない１以上の状態変数に対応する、前記候補ステートの１以上の状態変数に対して、当該１以上の状態変数の中で前記第１の値の数及び前記第２の値の数の差が小さくなるように、前記第１の値及び前記第２の値を設定し、
前記第１のパターン及び前記第２のパターンの両方において値の変化がある状態変数に対応する、前記候補ステートの状態変数に対して、前記第１の値または前記第２の値をランダムに設定する、
請求項８記載の情報処理装置。
前記マップ情報の座標を表す次元の数は、前記複数の状態変数の数よりも小さい、
請求項７記載の情報処理装置。
前記探索部は、それぞれが前記探索を行う複数のサブ探索部を含み、前記複数のサブ探索部により、前記第１ステート及び前記第２ステートをそれぞれ始点とする前記探索を並列に実行する、
請求項１記載の情報処理装置。
前記処理部は、前記探索部により得られた前記ステートのうち、前記目的関数の値を最小にする前記ステートを、前記解として出力する、
請求項１記載の情報処理装置。
コンピュータが、
目的関数に含まれる複数の状態変数の値により表されるステートを変化させることで前記目的関数の値を最小にする解の探索を行う探索部に第１ステート及び第２ステートを設定し、
前記第１ステート及び前記第２ステートをそれぞれ始点とする前記探索であって、前記目的関数の値の増減に影響する所定の外部パラメータの値を、前記目的関数の値の増加を促す方向に変化させる前記探索を前記探索部に実行させ、
当該探索の過程で前記第１ステートに基づいて得られた第１ステート群及び前記第２ステートに基づいて得られた第２ステート群を取得し、前記第１ステート群及び前記第２ステート群に基づいて、未探索のステートのうち第３ステートを決定し、
前記第３ステートを始点として前記探索部に前記探索を実行させる、
情報処理方法。
コンピュータに、
目的関数に含まれる複数の状態変数の値により表されるステートを変化させることで前記目的関数の値を最小にする解の探索を行う探索部に第１ステート及び第２ステートを設定し、
前記第１ステート及び前記第２ステートをそれぞれ始点とする前記探索であって、前記目的関数の値の増減に影響する所定の外部パラメータの値を、前記目的関数の値の増加を促す方向に変化させる前記探索を前記探索部に実行させ、
当該探索の過程で前記第１ステートに基づいて得られた第１ステート群及び前記第２ステートに基づいて得られた第２ステート群を取得し、前記第１ステート群及び前記第２ステート群に基づいて、未探索のステートのうち第３ステートを決定し、
前記第３ステートを始点として前記探索部に前記探索を実行させる、
処理を実行させるプログラム。
目的関数に含まれる複数の状態変数の値により表されるステートを変化させることで前記目的関数の値を最小にする解の探索を行う探索部と、
前記探索部に第１ステート及び第２ステートを設定し、前記第１ステート及び前記第２ステートをそれぞれ始点とする前記探索であって、前記目的関数の値の増減に影響する所定の外部パラメータの値を、前記目的関数の値の増加を促す方向に変化させる前記探索を前記探索部に実行させ、当該探索の過程で前記第１ステートに基づいて得られた第１ステート群及び前記第２ステートに基づいて得られた第２ステート群を取得し、前記第１ステート群及び前記第２ステート群に基づいて、未探索のステートのうち第３ステートを決定し、前記第３ステートを始点として前記探索部に前記探索を実行させる処理部と、
を有する情報処理システム。