JP2021144443A

JP2021144443A - 情報処理システム、情報処理方法およびプログラム

Info

Publication number: JP2021144443A
Application number: JP2020042328A
Authority: JP
Inventors: 昇米岡; Noboru Yoneoka
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-03-11
Filing date: 2020-03-11
Publication date: 2021-09-24
Anticipated expiration: 2040-03-11
Also published as: US20210286328A1; CN113391841A; JP7513868B2; EP3879417A1

Abstract

【課題】求解性能を向上すること。【解決手段】情報処理システム１０は、各々がエネルギー関数に含まれる複数の状態変数の値により表される解を探索する探索部１１，１２，１３を有する。探索部１１，１２，１３の各々は、探索部１１，１２，１３により得られた複数の解の中から、複数の解に対応する複数のエネルギー関数の値のうちの最良の値に対応する第１の解を取得する。探索部１１，１２，１３の各々は、第１の解に基づいて第１状態変数列を生成する。探索部１１，１２，１３の各々は、第１状態変数列を始状態として解を探索する。【選択図】図１

Description

本発明は情報処理システム、情報処理方法およびプログラムに関する。

ノイマン型コンピュータが不得意とする多変数の組合せ最適化問題を、磁性体のスピンの振る舞いを表すモデルであるイジングモデルに置き換えて計算する情報処理装置がある。イジングモデルに置き換えられた問題を実用的な時間で解く手法には、シミュレーテッドアニーリング（ＳＡ：Simulated Annealing）などの種々の探索アルゴリズムがある。

例えば、拡張アンサンブル法を用いて組合せ最適化問題の解を探索する情報処理装置の提案がある。また、複数の空間展開型計算機で独立して基底状態探索を繰り返し行い、結果を順次時間展開型計算機に蓄積して、最終的に最良の解を選択する情報処理システムの提案もある。

特開２０１９−７１１１９号公報国際公開第２０１７／０３３２６３号

上記のように、単に、複数の計算機により独立して基底状態探索を行い、得られた解の中から最良の解を選択する方法では、最適解を得られる可能性が低かったり、最適解を得るまでに時間がかかったりして、十分な求解性能を得られないことがある。

１つの側面では、本発明は、求解性能を向上できる情報処理システム、情報処理方法およびプログラムを提供することを目的とする。

１つの態様では、情報処理システムが提供される。この情報処理システムは、複数の探索部を有する。複数の探索部は、各々がエネルギー関数に含まれる複数の状態変数の値により表される解を探索する。複数の探索部の各々は、複数の探索部により得られた複数の解の中から、複数の解に対応する複数のエネルギー関数の値のうちの最良の値に対応する第１の解を取得し、第１の解に基づいて第１状態変数列を生成し、第１状態変数列を始状態として解を探索する。

また、１つの態様では、情報処理方法が提供される。
また、１つの態様では、プログラムが提供される。

１つの側面では、求解性能を向上できる。

第１の実施の形態の情報処理システムの例を示す図である。第２の実施の形態の情報処理システムの例を示す図である。ノードのハードウェア例を示す図である。ノードの機能例を示す図である。解プールの例を示す図である。新たな解の生成方法の例を示す図である。探索部の処理例を示すフローチャートである。解伝播部の解バッファの更新例を示すフローチャートである。解伝播部の解出力例を示すフローチャートである。第３の実施の形態の情報処理システムの例を示す図である。ノードの機能例を示す図である。通信部の処理例を示すフローチャートである。複数の探索手法を用いる情報処理システムの例を示す図である。探索手法ごとの状態遷移の特性の例を示す図である。

以下、本実施の形態について図面を参照して説明する。
［第１の実施の形態］
第１の実施の形態を説明する。

図１は、第１の実施の形態の情報処理システムの例を示す図である。
情報処理システム１０は、組合せ最適化問題の解を求め、求めた解を出力する。情報処理システム１０は、探索部１１，１２，１３を有する。探索部１１，１２，１３の各々は、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）などの半導体集積回路により実現される。また、探索部１１，１２，１３の各々は、ＲＡＭ（Random Access Memory）やレジスタなどの記憶部を含み得る。例えば、ＦＰＧＡなどの半導体集積回路を用いて実現される複数の探索回路が、探索部１１，１２，１３としてそれぞれ機能してもよい。情報処理システム１０に含まれる探索部の数は、２つでもよいし、４つ以上でもよい。

探索部１１，１２，１３の各々は、例えば図示を省略している共有の記憶装置を介して、探索部１１，１２，１３の各々が保持する少なくとも一部の情報を他の探索部と共有可能である。あるいは、探索部１１，１２，１３の各々は、他の探索部と通信する通信機能を備えて、他の探索部と情報を送受信してもよい。

探索部１１，１２，１３は、各々がエネルギー関数に含まれる複数の状態変数の値により表される解を探索する。状態変数は、「０」または「１」の値を取るバイナリ変数である。探索部１１，１２，１３の各々は、組合せ最適化問題を定式化したイジング型のエネルギー関数に基づいて、エネルギー関数に含まれる複数の状態変数の値により表される最適解の探索を行う。エネルギー関数は、評価関数や目的関数とも呼ばれる。エネルギー関数の値は、複数の変数の値により表されるイジングモデルの状態に対応するエネルギー値を表す。エネルギー値は、評価値と呼ばれてもよい。例えば、組合せ最適化問題は、エネルギー値を最小化する解を求める問題として定式化される。この場合、エネルギー値を最小化する解は、イジングモデルの基底状態を表し、組合せ最適化問題の最適解に相当する。イジング型のエネルギー関数Ｅ（ｘ）は、例えば、式（１）で表される。

状態ベクトルｘは、複数の状態変数を要素とし、イジングモデルの状態を表す。エネルギー値を最大化する問題の場合には、エネルギー関数の符号を逆にすればよい。
式（１）の右辺第１項は、全状態変数から選択可能な２つの状態変数の全組合せについて、漏れと重複なく、２つの状態変数の値と重み係数との積を積算したものである。ｘ_ｉは、ｉ番目の状態変数である。ｘ_ｊは、ｊ番目の状態変数である。Ｗ_ｉｊは、ｉ番目の状態変数とｊ番目の状態変数との間の重み、または、結合の強さを示す重み係数である。

式（１）の右辺第２項は、全状態変数の各々のバイアス係数と状態変数の値との積の総和を求めたものである。ｂ_ｉは、ｉ番目の状態変数に対するバイアス係数を示している。
例えば、イジングモデルにおけるスピンの「−１」は、状態変数の値「０」に対応する。イジングモデルにおけるスピンの「＋１」は、状態変数の値「１」に対応する。このため、状態変数を０または１の値をとるビットと呼ぶこともできる。

探索部１１，１２，１３には同一の問題を示す問題データが入力される。探索部１１，１２，１３には、探索部１１，１２，１３の各々における最初の探索開始時点の初期状態として、例えば互いに異なる状態ベクトルが外部から与えられる。

探索部１１，１２，１３の各々は、所定の探索手法により、同じ組合せ最適化問題の最適解を探索する。探索手法としては、ＳＡ、遺伝的アルゴリズム（ＧＡ：Genetic Algorithm）、シミュレーテッド量子アニーリング（ＳＱＡ：Simulated Quantum Annealing）、タブー探索（Tabu Search）などがある。探索部１１，１２，１３の各々が用いる探索手法は、同じでもよいし、異なっていてもよい。また、探索手法は例示したものに限らず、他の探索手法でもよい。

探索部１１，１２，１３の各々は、探索部１１，１２，１３により得られた複数の解の中から、複数の解に対応する複数のエネルギー関数の値、すなわち、複数のエネルギー値のうちの最良のエネルギー値に対応する第１の解を取得する。例えば、探索部１１，１２，１３の各々は、自身が探索により得た解のうちのエネルギー値が良いものを優先して所定数保持する。探索部１１，１２，１３は、自身が保持する最良のエネルギー値に対応する解を他の探索部に供給し、また、他の探索部が保持する最良のエネルギー値に対応する解を他の探索部から取得する。最良のエネルギー値とは、例えばエネルギー値を最小化する問題では、探索部１１，１２，１３が保持する複数の解に対応する複数のエネルギー値のうちの最小のエネルギー値である。この場合、最良の解は、探索部１１，１２，１３が保持する解のうちの最小のエネルギー値に対応する解である。

探索部１１，１２，１３の各々は、他の探索部から取得した解のエネルギー値と、自身が保持する最良の解のエネルギー値とを比較する。探索部１１，１２，１３の各々は、他の探索部から取得した解のエネルギー値が、自身が保持する最良の解のエネルギー値よりも良い場合、他の探索部から取得した解を第１の解として取得する。探索部１１，１２，１３の各々は、他の探索部から取得した解のエネルギー値が、自身が保持する最良の解のエネルギー値よりも悪いか、両エネルギー値が同じ場合、自身が保持する最良の解を第１の解として取得する。

なお、第１の解を取得する機能は、探索部１１，１２，１３の外部に、例えば、図示を省略している解伝播部として設けられてもよい。この場合、解伝播部は、探索部１１，１２，１３から、各々の探索部が保持する最良の解を収集し、収集した解の中から第１の解を選択し、探索部１１，１２，１３に第１の解を供給する。

探索部１１，１２，１３の各々は、取得した第１の解に基づいて新たな状態変数列である第１状態変数列を生成する。例えば、探索部１１は、第１の解に含まれる一部の状態変数の値を変化させた、第１の解の近傍解を、第１状態変数列として生成する。近傍解の生成は、第１の解と、探索部１１で得られている任意の解とに基づいて生成されてもよい。また、第１状態変数列は第１の解の状態変数列と同じでもよい。探索部１２，１３の各々も、探索部１１と同様に第１状態変数列を生成する。

探索部１１，１２，１３の各々は、生成した第１状態変数列を始状態として解を探索する。すなわち、探索部１１，１２，１３の各々は、当該始状態を起点として探索を開始する。そして、ある探索部での探索の結果として得られた解が、当該探索部で得られている最良のエネルギー値を更新する場合、他の探索部と当該解が共有され、上記の処理が繰り返される。あるいは、上記の解伝播部を用いる場合、ある探索部での探索の結果として得られた解が、全探索部で得られている最良のエネルギー値を更新する場合、他の探索部と当該解が共有され、上記の処理が繰り返される。

探索部１１，１２，１３の各々において、所定の終了条件が満たされると、探索部１１，１２，１３による解の探索が終了する。終了条件は、例えば最初の探索開始時点から一定時間が経過したことである。情報処理システム１０は、終了時点で探索部１１，１２，１３が保持する複数の解、あるいは、当該複数の解のうちの最も良いエネルギー値に対応する解を最終的な解として出力する。

なお、探索部１１，１２，１３の各々による第１の解の取得、および、第１の解に基づく第１状態変数列の生成、および、第１状態変数列を始状態とする解の探索は、探索部１１，１２，１３の各々により同期して行われてもよいし、非同期に行われてもよい。

情報処理システム１０によれば、探索部１１，１２，１３の各々により得られた複数の解のうちの最良のエネルギー値に対応する第１の解が取得される。探索部１１，１２，１３の各々により、第１の解に基づいて第１状態変数列が生成される。探索部１１，１２，１３の各々により、生成された第１状態変数列を始状態として解が探索される。

これにより、求解性能を向上できる。
ここで、比較例として、複数の計算機により独立して基底状態探索を行い、得られた解の中から最良の解を選択する方法が考えられる。しかし、単純に、複数の計算機により独立して基底状態探索を行い、得られた解の中から最良の解を選択するだけでは、一定時間内に最適解を得られる可能性が低かったり、最適解を得るまでに時間がかかったりして、求解性能を十分に向上できない。このため、求解性能を向上させる方法が問題となる。

そこで、情報処理システム１０では、探索部１１，１２，１３の各々は、探索部１１，１２，１３で得られている複数の解のうちの最良の解に基づいて、次の探索の始状態を決定する。より良い解の近傍に、最適解が存在する可能性が高いと推定されるからである。これにより、探索部１１，１２，１３の何れかで最適解が得られる可能性を向上できる。例えば、探索部１１，１２，１３の何れかで一定時間内に最適解が得られる可能性が高まることで、最適解が得られるまでの時間を短縮できる。こうして、情報処理システム１０による組合せ最適化問題に対する求解性能を向上できる。

なお、探索部１１，１２，１３は同一の情報処理装置に設けられてもよい。その場合、探索部１１，１２，１３の各々は、情報処理装置のバスに接続される。探索部１１，１２，１３は、例えば、バスに接続された共有メモリを介して解を共有する。探索部１１，１２，１３から解を収集し、各探索部１１，１２，１３に解を供給する機能は、バスに接続されたＣＰＵなどの処理部により提供されてもよい。

あるいは、探索部１１，１２，１３は複数の情報処理装置に分散して設けられてもよい。その場合、当該複数の情報処理装置はネットワークに接続される。異なる情報処理装置に設けられた探索部間での解の送受信は、各情報処理装置のＣＰＵの制御により、各情報処理装置が備える通信インタフェースにより実行される。

［第２の実施の形態］
次に、第２の実施の形態を説明する。
図２は、第２の実施の形態の情報処理システムの例を示す図である。

第２の実施の形態の情報処理システムは、ノード１００、外部記憶装置２００および端末装置３００を含む。ノード１００、外部記憶装置２００および端末装置３００は、ネットワーク５０に接続されている。ネットワーク５０は、例えばＬＡＮ（Local Area Network）である。ネットワーク５０は、ＷＡＮ（Wide Area Network）やインターネットでもよい。

ノード１００は、各々が組合せ最適化問題の解を探索する複数のアクセラレータを有するサーバコンピュータである。アクセラレータは、式（１）で表されるイジング型のエネルギー関数Ｅ（ｘ）を最小化する複数の状態変数の値を解として求めるハードウェアである。ただし、ノード１００が提供する解探索機能は、ソフトウェアにより実装されてもよい。

ノード１００における複数のアクセラレータの各々は、互いに異なる探索手法、すなわち、探索アルゴリズムを用いて解の探索を行う。ただし、複数のアクセラレータの少なくとも２つが同じ探索手法を用いて解の探索を行ってもよい。探索手法には、例えば、ＳＡ、ＧＡ、ＳＱＡ、タブー探索などがある。探索手法は例示したものに限らず、他の探索手法でもよい。

外部記憶装置２００は、ノード１００に入力される組合せ最適化問題の問題データやノード１００が出力する組合せ最適化問題の解を記憶するストレージである。問題データは、例えば、式（１）の重み係数｛Ｗ_ｉｊ｝やバイアス係数｛ｂ_ｉ｝を含む。例えば、外部記憶装置２００は、ＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）などを複数備える。

端末装置３００は、ユーザが操作するクライアントコンピュータである。端末装置３００は、ノード１００に対するデータの入力を行う。端末装置３００がノード１００に入力するデータには、外部記憶装置２００に記憶された問題データが含まれる。また、端末装置３００は、外部記憶装置２００に記憶された組合せ最適化問題の解の内容を、端末装置３００が備えるディスプレイに表示することで、ユーザに提示する。

ここで、第２の実施の形態の情報処理システムは、第１の実施の形態の情報処理システム１０の一例である。ノード１００が、第１の実施の形態の情報処理システム１０の一例であると考えてもよい。

図３は、ノードのハードウェア例を示す図である。
ノード１００は、ＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ１０３、媒体リーダ１０４、アクセラレータカード１０５，１０５ａ，…、ＮＩＣ（Network Interface Card）１０６およびバス１０７を有する。

ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。なお、ＣＰＵ１０１は複数のプロセッサコアを含んでもよい。また、ノード１００は複数のプロセッサを有してもよい。以下で説明する処理は複数のプロセッサまたはプロセッサコアを用いて並列に実行されてもよい。また、複数のプロセッサの集合を「マルチプロセッサ」または単に「プロセッサ」と言うことがある。

ＲＡＭ１０２は、ＣＰＵ１０１が実行するプログラムやＣＰＵ１０１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、ノード１００は、ＲＡＭ以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ１０３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、および、データを記憶する不揮発性の記憶装置である。なお、ノード１００は、フラッシュメモリやＳＳＤなどの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

媒体リーダ１０４は、記録媒体５１に記録されたプログラムやデータを読み取る読み取り装置である。記録媒体５１として、例えば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）が含まれる。

媒体リーダ１０４は、例えば、記録媒体５１から読み取ったプログラムやデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、例えば、ＣＰＵ１０１によって実行される。なお、記録媒体５１は可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体５１やＨＤＤ１０３を、コンピュータ読み取り可能な記録媒体と言うことがある。

アクセラレータカード１０５，１０５ａ，…は、各々が組合せ最適化問題の解を探索するハードウェアアクセラレータである。アクセラレータカード１０５，１０５ａ，…の各々における探索機能は、ＦＰＧＡ、ＧＰＵ、ＡＳＩＣなどの半導体集積回路により実現される。また、アクセラレータカード１０５，１０５ａ，…の各々は、探索された解を保持するＲＡＭを有する。例えば、アクセラレータカード１０５は、ＦＰＧＡ１１１およびＲＡＭ１１２を有する。また、アクセラレータカード１０５ａは、ＧＰＵ１２１およびＲＡＭ１２２を有する。このように、ノード１００には、ＦＰＧＡ、ＧＰＵ、ＡＳＩＣなど、異なる種類の半導体集積回路が搭載されたアクセラレータカードが混載されてもよい。

アクセラレータカード１０５，１０５ａ，…のように組合せ最適化問題の解を探索するハードウェアアクセラレータは、イジングマシンやボルツマンマシンなどと呼ばれることがある。例えば、ＳＡを実行するアクセラレータカードとして、特許第６４６５２２３号における最適化装置がある。

ＮＩＣ１０６は、ネットワーク５０に接続され、ネットワーク５０を介して他のコンピュータと通信を行う通信インタフェースである。ＮＩＣ１０６は、ネットワーク５０を介して外部記憶装置２００にデータを送信したり、端末装置３００からデータを受信したりする。ＮＩＣ１０６は、例えばネットワーク５０に属するスイッチやルータなどの通信装置とケーブルで接続される。

バス１０７は、ノード１００の内部バスである。ＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ１０３、媒体リーダ１０４、アクセラレータカード１０５，１０５ａ，…およびＮＩＣ１０６は、バス１０７に接続される。バス１０７には、例えば、ＰＣＩｅ（Peripheral Component Interconnect express）が用いられる。

図４は、ノードの機能例を示す図である。
ノード１００は、制御部１３０、探索部１４０，１５０，１６０，１７０および解伝播部１８０を有する。制御部１３０および解伝播部１８０は、ＣＰＵ１０１により実現される。１つの探索部は、１つのアクセラレータカードにより実現される。図４の例では、ノード１００が４つの探索部を有することが示されているが、ノード１００は、４以外の複数の探索部を有してもよい。また、前述のように、少なくとも一部の探索部の機能は、所定のソフトウェアを実行するＣＰＵ１０１により発揮されてもよい。

制御部１３０は、組合せ最適化問題の問題データを端末装置３００から取得する。制御部１３０は、探索部１４０，１５０，１６０，１７０に問題データや初期状態変数列を入力し、解の探索を実行させる。探索部１４０，１５０，１６０，１７０に入力される問題データは同一である。初期状態変数列は、探索部１４０，１５０，１６０，１７０の各々における最初の探索開始時点の初期状態である。各探索部では、初期状態変数列を起点として、状態変数の値が変更されることで、最初の探索が行われる。制御部１３０は、探索部１４０，１５０，１６０，１７０に互いに異なる初期状態変数列を入力してもよい。

また、制御部１３０は、探索部１４０，１５０，１６０，１７０の各々の探索の結果として得られた解を取得する。制御部１３０は、取得した解を外部記憶装置２００に出力する。

探索部１４０，１５０，１６０，１７０の各々は、組合せ最適化問題に対応するイジング型のエネルギー関数を最小化する複数の状態変数の組、すなわち、イジングモデルの基底状態を探索することで、当該組合せ最適化問題の解を探索する。

探索部１４０，１５０，１６０，１７０の各々は、互いに異なる探索手法を用いる。例えば、探索部１４０は、ＳＱＡを用いる。探索部１５０は、タブー探索を用いる。探索部１６０は、ＳＡを用いる。探索部１７０は、ＧＡを用いる。ただし、探索部１４０，１５０，１６０，１７０のうちの少なくとも２つの探索部が同じ探索手法を用いてもよい。また、探索部１４０，１５０，１６０，１７０の全てが同じ探索手法を用いてもよい。

探索部１４０，１５０，１６０，１７０は、それぞれ解プール１４１，１５１，１６１，１７１を有する。解プール１４１，１５１，１６１，１７１には、それぞれ探索部１４０，１５０，１６０，１７０に対応するアクセラレータカード上のＲＡＭの記憶領域が用いられる。また、探索部１４０，１５０，１６０，１７０は、それぞれアクセラレータ１４２，１５２，１６２，１７２を有する。アクセラレータ１４２，１５２，１６２，１７２は、それぞれ探索部１４０，１５０，１６０，１７０に対応するアクセラレータカード上のＦＰＧＡ１１１やＧＰＵ１２１などにより実現される。

探索部１４０，１５０，１６０，１７０は、それぞれアクセラレータ１４２，１５２，１６２，１７２を用いて解の探索を行う。探索部１４０，１５０，１６０，１７０は、現時点までに得られた解のうちのエネルギー値の小さい解を優先して、所定数だけ、それぞれ解プール１４１，１５１，１６１，１７１に保持する。

探索部１４０，１５０，１６０，１７０は、それぞれ解プール１４１，１５１，１６１，１７１に保持されているエネルギー値が最小の解、すなわち、ｂｅｓｔ解を解伝播部１８０に供給する。探索部１４０，１５０，１６０，１７０は、それぞれ解プール１４１，１５１，１６１，１７１に保持されているｂｅｓｔ解を、解伝播部１８０より供給される解に置換することがある。

探索部１４０，１５０，１６０，１７０は、それぞれ解プール１４１，１５１，１６１，１７１に保持されている解に基づいて、アクセラレータ１４２，１５２，１６２，１７２による次の探索の始状態とする新たな解、すなわち、初期解を生成する。探索部１４０，１５０，１６０，１７０の各々は、生成した初期解を用いて各探索部のアクセラレータによる次の探索を行う。

解伝播部１８０は、探索部１４０，１５０，１６０，１７０に対する解の伝播を行う。解伝播部１８０は、解バッファ１８１を有する。解バッファ１８１には、ＲＡＭ１０２の記憶領域が用いられる。解バッファ１８１は、解伝播部１８０により選択された１つ以上の解を記憶する。

解伝播部１８０は、探索部１４０，１５０，１６０，１７０の各々から供給された解、すなわち、探索部１４０，１５０，１６０，１７０でのｂｅｓｔ解のうち、エネルギー値の小さい解を優先して所定数だけ、解バッファ１８１に記録する。

解伝播部１８０は、解バッファ１８１に保持されている解のうちのエネルギー値が最小の解、すなわち、解バッファ１８１におけるｂｅｓｔ解を、探索部１４０，１５０，１６０，１７０に供給する。

図５は、解プールの例を示す図である。
図５では、解プール１４１を例示するが、解プール１５１，１６１，１７１も同様のデータ構造をもつ。

解プール１４１における１つのレコードは、ステートおよびエネルギー値のフィールドを有する。なお、図５では、レコードを識別する番号（＃）が図示されている。解プール１４１は、ｋ個のレコードを保持する。ステートは、アクセラレータ１４２により得られた解であり、複数の状態変数の値の組で表される。ステートは、状態ベクトルや状態ビット列とも呼ばれる。エネルギー値は、ステートｘに対応するエネルギー関数Ｅ（ｘ）の値である。例えば、解プール１４１の０番目のレコードは、ステート「Ｘ０」であり、エネルギー値「Ｅ（Ｘ０）」である。

なお、解バッファ１８１も、解プール１４１と同様のデータ構造をもつ。一例では、解プール１４１，１５１，１６１，１７１でｋ＝１６であり、解バッファ１８１でｋ＝４である。

図６は、新たな解の生成方法の例を示す図である。
前述のように、探索部１４０は、解プール１４１に保持されている解をランダムに取得して、アクセラレータ１４２による次の探索の始状態とする新たな解を生成する。

例えば、探索部１４０は、解プール１４１からステートＡ，Ｂ、すなわち、解Ａ，Ｂを取得する。探索部１４０は、解Ａ，Ｂに基づいて、新たな解Ｃを生成する。
具体的には、探索部１４０は、解Ａ，Ｂで値が同一であるビットに対応する解Ｃのビットを、解Ａ，Ｂの当該ビットと同じ値にする。また、探索部１４０は、解Ａ，Ｂで値が異なるビットに対応する解Ｃのビットの値を、「０」または「１」にランダムに選択する。解Ｃは、第１の実施の形態における「第１状態変数列」の一例である。

図６の生成方法は、比較的エネルギー値の良い解同士には、何らかの類似性が存在し、それらの解の近傍に最適解が存在し得るという最適化戦略に基づく処理である。当該生成方法には、次の文献を参考にすることができる。

文献：Y.Wang et al, Path relinking for unconstrained binary quadratic programming, European Journal of Operational Research 223, 2012, p.595-604.
なお、解プール１４１に１つの解しか格納されていない場合、探索部１４０は、当該１つの解から次の探索の始状態とする新たな解を生成してもよい。例えば、探索部１４０は、当該１つの解に含まれる一部の状態変数の値を変化させることで当該新たな解を生成することも考えられる。

探索部１５０，１６０，１７０も、探索部１４０と同様の方法により新たな解を生成する。
次に、ノード１００の処理手順を説明する。

まず、探索部１４０，１５０，１６０，１７０の処理手順を説明する。
制御部１３０は、探索部１４０，１５０，１６０，１７０に、初期状態変数列および同一の問題データを入力し、解の探索を開始させる。最初の段階では解プール１４１，１５１，１６１，１７１に解が格納されていない。そのため、探索部１４０，１５０，１６０，１７０はそれぞれ解プール１４１，１５１，１６１，１７１に対して、全て初期状態変数列の解で埋める処理を行う。あるいは、探索部１４０，１５０，１６０，１７０は、ランダムにビット０／１を選択して生成した解を用いてそれぞれ解プール１４１，１５１，１６１，１７１を埋めても良い。

以下では、探索部１４０を主に例示して説明するが、探索部１５０，１６０，１７０も同様の処理手順を実行する。
図７は、探索部の処理例を示すフローチャートである。

（Ｓ１０）探索部１４０は、解プール１４１から２つの解Ａ，Ｂを選択する。
（Ｓ１１）探索部１４０は、解Ａ，Ｂから解Ｃを生成する。解Ｃの生成方法には、図６で例示した方法を用いることができる。

（Ｓ１２）探索部１４０は、アクセラレータ１４２に解Ｃを入力し、解Ｃを初期解、すなわち、始状態として、アクセラレータ１４２を用いた解の探索を行う。
（Ｓ１３）探索部１４０は、アクセラレータ１４２による所定期間の探索が終了すると、アクセラレータ１４２から改良された解Ｄおよび解Ｄのエネルギー値を取得する。

（Ｓ１４）探索部１４０は、解プール１４１から、エネルギー値が最大の解、すなわち、ｗｏｒｓｔ解Ｅを選択する。
（Ｓ１５）探索部１４０は、解Ｄのエネルギー値が解Ｅのエネルギー値よりも小さいか否かを判定する。解Ｄのエネルギー値が解Ｅのエネルギー値よりも小さい場合、探索部１４０は、ステップＳ１６に処理を進める。解Ｄのエネルギー値が解Ｅのエネルギー値以上の場合、探索部１４０は、ステップＳ１７に処理を進める。

（Ｓ１６）探索部１４０は、解プール１４１の解Ｅを解Ｄに変更する。
（Ｓ１７）探索部１４０は、解プール１４１から、エネルギー値が最小の解、すなわち、ｂｅｓｔ解Ｆを選択する。

（Ｓ１８）探索部１４０は、解伝播部１８０へ解Ｆおよび解Ｆのエネルギー値を送信する。
（Ｓ１９）探索部１４０は、解伝播部１８０から、解伝播部１８０が保持するエネルギー値が最小の解、すなわち、ｂｅｓｔ解Ｇを受信する。このとき、探索部１４０は、解Ｇとともに、解Ｇのエネルギー値を解伝播部１８０から受信する。

（Ｓ２０）探索部１４０は、解Ｇのエネルギー値が解Ｆのエネルギー値よりも小さいか否かを判定する。解Ｇのエネルギー値が解Ｆのエネルギー値よりも小さい場合、探索部１４０は、ステップＳ２１に処理を進める。解Ｇのエネルギー値が解Ｆのエネルギー値以上の場合、探索部１４０は、ステップＳ２２に処理を進める。

（Ｓ２１）探索部１４０は、解プール１４１の解Ｆを解Ｇに変更する。
（Ｓ２２）探索部１４０は、終了条件を満たすか否かを判定する。終了条件を満たす場合、探索部１４０は処理を終了する。終了条件を満たさない場合、探索部１４０は、ステップＳ１０に処理を進める。

ここで、ステップＳ２２の終了条件は、制御部１３０により与えられる。例えば、探索部１４０は、アクセラレータカードのＲＡＭに終了フラグを保持する。終了フラグの初期値は「ｆａｌｓｅ」である。探索部１４０は、制御部１３０から終了信号を受け付けると、終了フラグを「ｔｒｕｅ」に変更する。終了フラグが「ｆａｌｓｅ」の場合、終了条件を満たさない。終了フラグが「ｔｒｕｅ」の場合、終了条件を満たす。例えば、制御部１３０は、探索部１４０に図７の手順による探索を開始させてから一定期間が経過すると、終了信号を探索部１４０に出力する。制御部１３０は、探索部１４０，１５０，１６０，１７０の各々による探索期間を異なる長さにすることができる。

また、探索部１４０，１５０，１６０，１７０の各々は、図７の手順を非同期に実行する。
なお、探索部１４０は、終了条件が満たされて探索を終了すると、最終的に得られたエネルギー値の最も小さい解を制御部１３０に出力する。制御部１３０は、探索部１４０，１５０，１６０，１７０の全てで探索が終了すると、探索部１４０，１５０，１６０，１７０の各々から出力された解、あるいは、それらの解のうちのエネルギー値の最も小さい解を、外部記憶装置２００に出力する。

次に、解伝播部１８０の解バッファ１８１の更新処理の手順を説明する。
解伝播部１８０は、探索部１４０，１５０，１６０，１７０の何れかから、入力解Ａを受け付けると下記の手順を実行する。

図８は、解伝播部の解バッファの更新例を示すフローチャートである。
（Ｓ３０）解伝播部１８０は、探索部１４０，１５０，１６０，１７０の何れかから、入力解Ａおよび入力解Ａのエネルギー値を受け付けると、解バッファ１８１に、入力解Ａと同じ解Ａが存在するか否かを判定する。解バッファ１８１に解Ａが存在する場合、解伝播部１８０は、処理を終了する。解バッファ１８１に解Ａが存在しない場合、解伝播部１８０は、ステップＳ３１に処理を進める。

（Ｓ３１）解伝播部１８０は、解バッファ１８１からエネルギー値が最大の解、すなわちｗｏｒｓｔ解Ｂを選択する。
（Ｓ３２）解伝播部１８０は、解Ａのエネルギー値が解Ｂのエネルギー値よりも小さいか否かを判定する。解Ａのエネルギー値が解Ｂのエネルギー値よりも小さい場合、解伝播部１８０はステップＳ３３に処理を進める。解Ａのエネルギー値が解Ｂのエネルギー値以上の場合、解伝播部１８０は解バッファ１８１の更新処理を終了する。

（Ｓ３３）解伝播部１８０は、解バッファ１８１の解Ｂを解Ａに変更する。そして、解伝播部１８０は解バッファ１８１の更新処理を終了する。
なお、解伝播部１８０は、解の多様性を確保するため、ステートに相当する状態ビット列は異なるが、エネルギー値が同値である２つ以上の解を保持してもよい。

次に、解伝播部１８０の解出力処理の手順を説明する。
図９は、解伝播部の解出力例を示すフローチャートである。
（Ｓ４０）解伝播部１８０は、解バッファ１８１からエネルギー値が最小の解、すなわちｂｅｓｔ解Ａを選択する。

（Ｓ４１）解伝播部１８０は、探索部１４０，１５０，１６０，１７０の各々に解Ａおよび解Ａのエネルギー値を出力する。そして、解伝播部１８０は、解出力処理を終了する。

なお、ステップＳ４０において、エネルギー値が最小のステートが異なる複数の解が解バッファ１８１に存在する場合、解伝播部１８０は、当該複数の解のうちの１つをランダムに選択する。

また、解伝播部１８０は、ある探索部から図８における入力解Ａが供給されると図８の手順が終了した後に、入力解Ａの供給元の探索部に対して、図９の手順を実行してもよい。探索部１４０，１５０，１６０，１７０の各々は、非同期に、解伝播部１８０から解バッファ１８１におけるｂｅｓｔ解を取得する。

第２の実施の形態のノード１００によれば、複数のアクセラレータを並列に動作させ、探索期間中に、アクセラレータ間で各々のアクセラレータでのｂｅｓｔ解を相互に更新する。すなわち、探索動作中に、各探索部の解プールには、全探索部におけるｂｅｓｔ解が解伝播部１８０を介して反映される。このため、各探索部の解プールから選択された当該ｂｅｓｔ解に基づいて、当該探索部の次の探索の始状態が生成されることで、あるタイミングでの全探索部におけるｂｅｓｔ解が当該探索部の次の探索の始状態に反映される。

前述のように、比較的エネルギー値の良い解同士には、何らかの類似性が存在し、それらの解の近傍に最適解が存在し得ると推定される。したがって、ノード１００の上記処理手順により、何れかの探索部で最適解に到達する可能性を高められ、独立して各々のアクセラレータを動作させる場合に比べて求解性能が向上する。

ここで、１つの問題においても、ある局所解から他の解への遷移のし易さは、探索手法に応じて異なることがある。例えば、ある局所解に陥った場合に、第１の探索手法では当該局所解から他の解へ遷移することが比較的困難であっても、第２の探索手法では当該局所解から他の解へ遷移することが比較的容易なことがある。

そこで、第２の実施の形態では、各アクセラレータで異なる探索手法を用いる。ノード１００では、各アクセラレータに伝播されるｂｅｓｔ解により各アクセラレータでｂｅｓｔ解近傍の近傍解を生成し、近傍解を始状態として当該アクセラレータでの探索が行われる。これにより、例えば、ある要所における局所解から複数の探索手法を用いて次の局所解を探索することと同様の動作を実現でき、最適解に到達する可能性を高められる。あるいは、一定時間内に最適解に到達する可能性が高まるので、最適解を得るまでにかかる時間を短縮できる。こうして、求解性能を一層向上させることができる。

また、探索部１４０，１５０，１６０，１７０は、解伝播部１８０を介して解をやり取りすることで、アクセラレータ１４２，１５２，１６２，１７２を用いた探索を非同期に実行することができる。これにより、各アクセラレータの実行時間が大きく異なる場合でも、解をやり取りするための待ち合わせの時間が発生しないため、効率良く解を探索することが可能となる。

［第３の実施の形態］
次に、第３の実施の形態を説明する。前述の第２の実施の形態と相違する事項を主に説明し、共通する事項の説明を省略する。

第２の実施の形態では、情報処理システムが１つのノード１００を含む例を示した。
第３の実施の形態では、情報処理システムが複数のノードを含む例を説明する。第３の実施の形態の説明では、第２の実施の形態と同一のハードウェアおよび機能には同一の符号を付し、その説明を省略することがある。

図１０は、第３の実施の形態の情報処理システムの例を示す図である。
第３の実施の形態の情報処理システムは、ノード１００ａ，１００ｂ，…、外部記憶装置２００および端末装置３００を含む。ノード１００ａ，１００ｂ，…、外部記憶装置２００および端末装置３００は、ネットワーク５０に接続されている。ノード１００ａ，１００ｂ，…は、第２の実施の形態のノード１００と同様のハードウェアにより実現される。

第３の実施の形態の情報処理システムは、第１の実施の形態の情報処理システム１０の一例である。ノード１００ａ，１００ｂ，…を含むシステムが、第１の実施の形態の情報処理システム１０の一例であると考えてもよい。

第３の実施の形態におけるノード１００ａ，１００ｂ，…の各々は、１つ以上の探索部を有する。ノード１００ａ，１００ｂ，…は、次の機能を有する点が第２の実施の形態のノード１００と異なる。以下ではノード１００ａを主に挙げて説明するが、ノード１００ｂ，…も同様の機能を有する。

図１１は、ノードの機能例を示す図である。
ノード１００ａは、制御部１３０、探索部１４０，１５０，…、解伝播部１８０ａおよび通信部１９０を有する。制御部１３０および探索部１４０，１５０，…は、第２の実施の形態における同名の機能に相当する。解伝播部１８０ａおよび通信部１９０は、ＣＰＵ１０１により実現される。

解伝播部１８０ａは、解バッファ１８１を有し、探索部１４０，１５０，…に対しては第２の実施の形態の解伝播部１８０と同様に機能する。
解伝播部１８０ａは、通信部１９０から解を受け付け、通信部１９０から供給された解により解バッファ１８１の解を更新することがある。

すなわち、解伝播部１８０ａは、入力解として、探索部１４０，１５０，…から供給される解を用いるだけでなく、通信部１９０から供給される解を用いて、図８の解バッファ１８１の更新の手順を実行する。

より具体的には、解伝播部１８０ａは、探索部１４０，１５０，…の何れか、または、通信部１９０から供給される入力解が解バッファ１８１に含まれる場合、入力解を破棄して解バッファ１８１の更新をスキップする。解伝播部１８０ａは、入力解が解バッファ１８１に含まれない場合、解バッファ１８１におけるエネルギー値が最大の解の当該エネルギー値と入力解のエネルギー値とを比較する。解伝播部１８０ａは、入力解のエネルギー値が解バッファ１８１における最大のエネルギー値より小さければ、解バッファ１８１の最大のエネルギー値の解を、入力解に置き換える。解伝播部１８０ａは、入力解のエネルギー値が解バッファ１８１における最大のエネルギー値以上であれば、解バッファ１８１の更新を行わずに、入力解を破棄する。

更に、解伝播部１８０ａは、解バッファ１８１におけるエネルギー値が最小の解、すなわちｂｅｓｔ解および当該ｂｅｓｔ解のエネルギー値を、探索部１４０，１５０，…および通信部１９０に出力する。

通信部１９０は、ネットワーク５０を介して、ノード１００ｂ，…に、現時点でのノード１００ａでのｂｅｓｔ解および当該ｂｅｓｔ解のエネルギー値を送信する。通信部１９０は、ノード１００ｂ，…の各々から、ノード１００ｂ，…の各々において現時点で得られているｂｅｓｔ解および当該ｂｅｓｔ解のエネルギー値を受信する。

通信部１９０は、他の全てのノードから受信した解と、ノード１００ａでの現時点でのｂｅｓｔ解とでエネルギー値を比較し、エネルギー値が最小の解Ｍｍｉｎを選択する。エネルギー値が最小で状態ビット列が異なる複数の解が存在する場合、通信部１９０は、当該複数の解からランダムで１つを選択する。

通信部１９０は、選択した解Ｍｍｉｎおよび解Ｍｍｉｎのエネルギー値を解伝播部１８０ａに出力する。解Ｍｍｉｎが解バッファ１８１に格納されるか否かは、解伝播部１８０ａの前述の動作に依存する。

通信部１９０は、解Ｍｍｉｎを解伝播部１８０ａに出力すると、一定時間停止し、一定時間が経過すると上記の動作を繰り返し実行する。
なお、通信部１９０には、ＯｐｅｎＭＰＩ（Message Passing Interface）などの並列コンピューティング環境を用いることができる。例えば、通信部１９０は他の全てのノードにおける他の通信部との全対全通信により各ノードで得られているｂｅｓｔ解を収集する。

次に、通信部１９０の処理手順を説明する。
図１２は、通信部の処理例を示すフローチャートである。
（Ｓ５０）通信部１９０は、解伝播部１８０ａから解Ｍ［ｉ］および解Ｍ［ｉ］のエネルギー値を取得する。解Ｍ［ｉ］は、解バッファ１８１に保持されている解のうちの、エネルギー値が最小の解である。ｉは、ノードの識別番号であり、０から（ノード数−１）の値を取る。ステップＳ５０のｉは、ノード１００の識別番号に相当する。

（Ｓ５１）通信部１９０は、全ノードの解Ｍ［ｉ］および解Ｍ［ｉ］のエネルギー値を集約する。これにより、通信部１９０は、ノード数分の解Ｍ［ｉ］を得る。
（Ｓ５２）通信部１９０は、解Ｍ［ｉ］のうち、エネルギー最小の解Ｍｍｉｎを選択する。エネルギー最小の複数の解が存在する場合、通信部１９０は、当該複数の解のうちの１つをランダムに選択し、解Ｍｍｉｎとする。

（Ｓ５３）通信部１９０は、解Ｍｍｉｎおよび解Ｍｍｉｎのエネルギー値を解伝播部１８０ａに入力する。
（Ｓ５４）通信部１９０は、一定時間待機する。

（Ｓ５５）通信部１９０は、終了条件を満たすか否かを判定する。終了条件を満たす場合、通信部１９０は処理を終了する。終了条件を満たさない場合、通信部１９０は、ステップＳ５０に処理を進める。

ここで、ステップＳ５５の終了条件は、制御部１３０により与えられる。例えば、通信部１９０は、ＲＡＭ１０２に終了フラグを保持する。終了フラグの初期値は「ｆａｌｓｅ」である。通信部１９０は、制御部１３０から終了信号を受け付けると、終了フラグを「ｔｒｕｅ」に変更する。終了フラグが「ｆａｌｓｅ」の場合、終了条件を満たさない。終了フラグが「ｔｒｕｅ」の場合、終了条件を満たす。例えば、制御部１３０は、探索部１４０に図７の手順による探索を開始させてから一定期間が経過すると、終了信号を探索部１４０および通信部１９０に出力する。

第３の実施の形態のノード１００ａ，１００ｂ，…によれば、ノード１００ａ，１００ｂ，…の各々に搭載された複数のアクセラレータを並列に動作させ、探索期間中に、アクセラレータ間で各々のアクセラレータでのｂｅｓｔ解を相互に更新する。すなわち、探索動作中に、各々の探索部の解プールには、全探索部におけるｂｅｓｔ解が解伝播部１８０ａおよび通信部１９０を介して反映される。このため、各探索部の解プールから選択された当該ｂｅｓｔ解に基づいて、当該探索部の次の探索の始状態が生成されることで、あるタイミングでの全探索部におけるｂｅｓｔ解が当該探索部の次の探索の始状態に反映される。

これにより、何れかの探索部で最適解に到達する可能性を高められ、個々のアクセラレータを独立して動作させる場合に比べて求解性能が向上する。
ノード１００ａ，１００ｂ，…の各々における各探索部は、解伝播部１８０および通信部１９０を介して解をやり取りすることで、各ノード上の探索部による探索を探索部間で非同期に実行することができる。これにより、各アクセラレータの実行時間が大きく異なる場合でも、解をやり取りするための待ち合わせの時間が発生しないため、効率良く解を探索することが可能となる。

また、第２の実施の形態の各探索部と同様に、第３の実施の形態でも、各探索部で異なる探索手法を用いることができる。
図１３は、複数の探索手法を用いる情報処理システムの例を示す図である。

例えば、第３の実施の形態の情報処理システムは、ノード１００ａ，１００ｂ，１００ｃ，１００ｄを含むとする。ノード１００ａ，１００ｂ，１００ｃ，１００ｄはネットワーク５０に接続される。例えば、ノード１００ａの探索部は、ＳＱＡを用いる。ノード１００ｂの探索部は、タブー探索（Ｔａｂｕ）を用いる。ノード１００ｃの探索部は、ＳＡを用いる。ノード１００ｄの探索部は、ＧＡを用いる。

図１３で例示されるように、ノード単位に探索手法が異なってもよいし、１つのノードに複数の探索手法を用いる複数のアクセラレータが混載されてもよい。アクセラレータは、前述のように、ＦＰＧＡ、ＧＰＵ、ＡＳＩＣなどにより実現される。第２の実施の形態で例示したように、１つのノードにＦＰＧＡ、ＧＰＵ、ＡＳＩＣなどのうちの少なくとも２種類の半導体集積回路が混載されてもよい。

図１４は、探索手法ごとの状態遷移の特性の例を示す図である。
グラフ７１は、ある組合せ最適化問題における、探索空間上の各ステート（ｘ）に対するエネルギー値Ｅ（ｘ）を示す。グラフ７１の横軸は探索空間を示す。グラフ７１の縦軸はエネルギー値Ｅ（ｘ）を示す。エネルギー値Ｅ（ｘ）の極小値を与えるステートｘａ，ｘｂ，ｘｃ，ｘｄ，ｘｅの各々が局所解である。このうち、ステートｘｅは、最適解であるとする。

前述のように、ある組合せ最適化問題の解の探索過程において、最適解に至るために有効な探索手法が局所解などの要所ごとに異なる場合がある。
表７２は、探索手法１〜４におけるステート間の遷移のし易さを示す。ステートｘａからステートｘｅに到達するためのステートの遷移順の１つの例として、ｘａ，ｘｂ，ｘｃ，ｘｄ，ｘｅと順番に辿ることを考える。表７２は、遷移の欄に記載されたステート間の遷移のし易さを、探索手法１〜４の各々に対して表している。表７２のチェックマークが付された箇所は、該当の探索手法において該当のステート間の遷移が比較的起こり易いことを示す。表７２のハイフンマーク（「−」）が付された箇所は、該当の探索手法において該当のステート間の遷移が比較的起こり難いことを示す。

例えば、探索手法１では、ステートｘａからステートｘｂ，ｘｃを介してステートｘｄに到達する可能性は高いが、ステートｘｄからステートｘｅに到達する可能性は低い。
探索手法２では、ステートｘａからステートｘｂを介してステートｘｃに到達する可能性は高いが、ステートｘｃからステートｘｄを介してステートｘｅに到達する可能性は低い。

探索手法３では、ステートｘａからステートｘｂに到達する可能性、および、ステートｘｃからステートｘｄを介してステートｘｅに到達する可能性は高いが、ステートｘｂからステートｘｃに到達する可能性は低い。

探索手法４では、ステートｘａからステートｘｂに到達する可能性、および、ステートｘｃからステートｘｄに到達する可能性は高いが、ステートｘｂからステートｘｃに到達する可能性、および、ステートｘｄからステートｘｅに到達する可能性は低い。

このように、探索手法１〜４の何れを用いても、ステートｘａからステートｘｅに至る途中のステート間の遷移が起こり難くなることがある。
この場合、例えば、複数の探索手法を用いるアクセラレータを単純に独立して動作させ、各アクセラレータで得られた解のうちの最良の解を取得する方法では、最適解に到達しない。

そこで、第２の実施の形態のノード１００および第３の実施の形態のノード１００ａ，１００ｂ，…では、各探索部に伝播されるｂｅｓｔ解により各探索部でｂｅｓｔ解近傍の近傍解を生成し、近傍解を始状態として当該探索部での探索が行われる。これにより、例えば、ある要所における局所解から複数の探索手法を用いて次の局所解を探索することと同様の動作を実現でき、最適解に到達する可能性を高められる。あるいは、一定時間内に最適解に到達する可能性が高まるので、最適解を得るまでにかかる時間を短縮できる。こうして、求解性能を向上させることができる。

以上をまとめると第２，第３の情報処理システムは、例えば、次の機能を有する。
ノード１００またはノード１００ａ，１００ｂ，…の複数の探索部の各々は、複数の探索部により得られた複数の解の中から、複数の解に対応する複数のエネルギー関数の値のうちの最良の値に対応する第１の解を取得し、第１の解に基づいて第１状態変数列を生成し、生成した第１状態変数列を始状態として解を探索する。これにより、単に各探索部を独立に動作させて得られた解のうちの最良の解を取得するよりも、最適解に到達する可能性を高めることができ、求解性能を向上させることができる。

例えば、複数の探索部のうちの少なくとも２つの探索部は、異なる探索アルゴリズムを用いて解を探索する。異なる探索アルゴリズムを組み合わせることで、前述のように、単一の探索アルゴリズムでは脱出が困難な局所解からも脱出できる可能性を高められ、最適解に到達する可能性を高めることができる。

また、ノード１００は、複数の探索部の各々から第２の解を非同期に取得し、取得した複数の第２の解の中から第１の解を決定し、決定した第１の解を複数の探索部の各々に非同期に出力する解伝播部１８０を有する。

これにより、複数の探索部は、解伝播部１８０を介して非同期に解をやり取りできる。したがって、各探索部の実行時間が異なる場合でも、解をやり取りするための待ち合わせ時間が発生しないため、効率よく解を探索することが可能となる。特に、互いに異なる探索アルゴリズムを用いる探索部間では探索の実行時間が大きく異なることがある。このため、解伝播部１８０の機能は、少なくとも２つの探索部で異なる探索アルゴリズムが用いられる場合に特に有用である。

なお、解伝播部１８０の機能は、前述のようにＣＰＵ１０１により実現され得る。解伝播部１８０の機能は、ＦＰＧＡやＡＳＩＣなどの半導体集積回路により実現されてもよい。この場合、半導体集積回路を用いて実現される解伝播回路が解伝播部１８０として機能する。

例えば、複数の探索部の各々は、自探索部が解プールに保持する最良のエネルギー関数の値に対応する第２の解を解伝播部１８０に出力し、解伝播部１８０から第１の解を取得する。複数の探索部の各々は、第１の解が第２の解と異なる場合、自探索部が保持する第２の解を解伝播部１８０から取得した第１の解に置き換える。これにより、複数の探索部で得られている最良の解、すなわち、第１の解が、各探索部に適切に反映される。

ここで、例えば、第１の解と第１状態変数列とは次のような関係となる。
第１の例では、第１の解が有する状態変数列は、第１状態変数列と同一の状態変数列である。これにより、第１の解そのものを次の探索の始状態とすることができる。

第２の例では、第１の解が有する状態変数列は、第１状態変数列に含まれる複数の状態変数の一部が変更された状態変数列である。これにより、第１の解の近傍解を、次の探索の始状態とすることができる。

第１の例および第２の例の何れを用いても、求解性能を向上させることができる。
例えば、複数の探索部の各々は、自探索部により得られた複数の解を含む解プール、または第２の解を第１の解に置き換えることによって得られる複数の解を含む解プールを保持し、解プールから選択された２以上の解に基づいて、第１状態変数列を生成する。

これにより、上記の第２の例が情報処理システムに実装され、求解性能を向上させることができる。すなわち、解プールから選択された２以上の解に第１の解が含まれる可能性があり、その場合に第１の解の近傍解を次の探索の始状態とすることができる。

また、第３の実施の形態の情報処理システムは、各々が複数の探索部のうちの１以上の探索部を備える複数の装置を有する。ノード１００ａ，１００ｂ，…は、当該複数の装置の一例である。当該装置は、例えば情報処理装置と呼ばれてもよい。複数の装置の各々は、自装置が備える１以上の探索部で得られたエネルギー関数の第１の最良候補値に対応する第３の解を複数の装置のうちの他の装置に送信し、他の装置で得られたエネルギー関数の第２の最良候補値に対応する第４の解を他の装置から受信する。また、複数の装置の各々は、第１の最良候補値と第２の最良候補値との比較に基づいて第１の解を決定する。ここで、第１の最良候補値および第２の最良候補値は、各装置において得られた複数の解に対応する複数のエネルギー関数の値のうちの最良の値の候補となる値である。

これにより、複数の探索部が複数の装置に分散して配置される場合にも、複数の探索部の各々で第１の解を適切に決定して各探索部に供給でき、情報処理システム全体としての求解性能を向上させることができる。

より具体的には、複数の装置の各々は、通信部（例えば、通信部１９０）と、解伝播部（例えば、解伝播部１８０ａ）とを有する。
複数の装置の各々の通信部は、他の装置に第３の解を送信し、他の装置から第４の解を受信し、エネルギー値の第１の最良候補値とエネルギー値の第２の最良候補値との比較により、第３の解と第４の解のうちの第１の解の候補である候補解を出力する。

複数の装置の各々の解伝播部は、自装置が備える１以上の探索部で得られた第５の解および自装置の通信部により出力された候補解のうちのエネルギー値が良い解を優先して所定数保持する。複数の装置の各々の解伝播部は、保持している所定数の解のうちの最良のエネルギー値の解を第１の解として決定し、決定した第１の解を自装置が備える１以上の探索部に出力する。

これにより、各装置で非同期に得られた最良の解が、他の装置と共有され、各装置上の１以上の探索部で当該装置における第１の解を適切に取得でき、情報処理システム全体としての求解性能を向上させることができる。

なお、通信部１９０を含む各装置上の通信部の機能は、前述のようにＣＰＵ１０１により実現され得る。ただし、当該通信部の機能は、ＦＰＧＡやＡＳＩＣなどの半導体集積回路により実現されてもよい。また、解伝播部１８０ａを含む各装置上の解伝播部の機能は、前述のようにＣＰＵ１０１により実現され得る。当該解伝播部の機能は、ＦＰＧＡやＡＳＩＣなどの半導体集積回路により実現されてもよい。例えば、ノード１００ａ，１００ｂ，…に相当する各装置が複数のプロセッサまたは複数のプロセッサコアを含む場合も考えられる。その場合、第１のプロセッサまたは第１のプロセッサコアが通信部１９０の機能を実行し、第２のプロセッサまたは第２のプロセッサコアが解伝播部１８０ａの機能を実行してもよい。あるいは、ＦＰＧＡなどの半導体集積回路を用いて実現される通信回路および解伝播回路が、通信部１９０および解伝播部１８０ａとしてそれぞれ機能してもよい。

更に、複数の装置の各々が２以上の探索部を備える場合、複数の装置の各々の解伝播部は、自装置が備える２以上の探索部の各々から第５の解を非同期に取得し、また、選択した第１の解を当該２以上の探索部の各々に非同期に出力する。

これにより、複数の装置上の複数の探索部は、各装置上の解伝播部（例えば、解伝播部１８０ａ）を介して非同期に解をやり取りできる。したがって、各探索部の実行時間が異なる場合でも、解をやり取りするための待ち合わせ時間が発生しないため、効率よく解を探索することが可能となる。特に、互いに異なる探索アルゴリズムを用いる探索部間では探索の実行時間が大きく異なることがある。このため、解伝播部１８０ａを含む各装置上の解伝播部の機能は、同じ装置上の少なくとも２つの探索部で異なる探索アルゴリズムが用いられる場合に特に有用である。

また、複数の探索部の各々は、第１の解に含まれる一部の状態変数の値を変化させることで、第１状態変数列を生成する。当該生成方法として、例えば、図６の方法を用いることができる。最適解は、現状得られている解のうち、より良い解の近傍に存在する可能性が高いと推定される。したがって、第１の解の近傍解を次の探索の始状態とすることで、最適解に到達する可能性を高められ、求解性能を向上できる。

なお、第１の実施の形態の情報処理は、探索部１１，１２，１３の機能を実現するＣＰＵなどのプロセッサにプログラムを実行させることで実現されてもよい。また、第２，第３の実施の形態の情報処理は、ＣＰＵ１０１にプログラムを実行させることで実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体５１に記録できる。

例えば、プログラムを記録した記録媒体５１を配布することで、プログラムを流通させることができる。また、プログラムを他のコンピュータに格納しておき、ネットワーク経由でプログラムを配布してもよい。コンピュータは、例えば、記録媒体５１に記録されたプログラムまたは他のコンピュータから受信したプログラムを、ＲＡＭ１０２やＨＤＤ１０３などの記憶装置に格納し（インストールし）、当該記憶装置からプログラムを読み込んで実行してもよい。

１０情報処理システム
１１，１２，１３探索部

Claims

各々がエネルギー関数に含まれる複数の状態変数の値により表される解を探索する複数の探索部を有し、
前記複数の探索部の各々は、前記複数の探索部により得られた複数の解の中から、前記複数の解に対応する複数の前記エネルギー関数の値のうちの最良の値に対応する第１の解を取得し、前記第１の解に基づいて第１状態変数列を生成し、前記第１状態変数列を始状態として前記解を探索する、
情報処理システム。
前記複数の探索部のうちの少なくとも２つの探索部は、異なる探索アルゴリズムを用いて前記解を探索する、
請求項１記載の情報処理システム。
前記複数の探索部の各々から第２の解を非同期に取得し、取得した複数の前記第２の解の中から前記第１の解を決定し、決定した前記第１の解を前記複数の探索部の各々に非同期に出力する解伝播部、
を更に有する請求項１または２記載の情報処理システム。
前記複数の探索部の各々は、自探索部が保持する最良の前記エネルギー関数の値に対応する前記第２の解を前記解伝播部に出力し、前記解伝播部から前記第１の解を取得し、前記第１の解が前記第２の解と異なる場合、前記自探索部が保持する前記第２の解を前記解伝播部から取得した前記第１の解に置き換える、
請求項３記載の情報処理システム。
前記第１の解が有する状態変数列は、前記第１状態変数列と同一の状態変数列である、
請求項１乃至３の何れか１項に記載の情報処理システム。
前記第１の解が有する状態変数列は、前記第１状態変数列に含まれる前記複数の状態変数の一部が変更された状態変数列である、
請求項１乃至３の何れか１項に記載の情報処理システム。
前記複数の探索部の各々は、自探索部により得られた前記複数の解を含む解プール、または前記第２の解を前記第１の解に置き換えることによって得られる複数の解を含む解プールを保持し、前記解プールから選択された２以上の解に基づいて、前記第１状態変数列を生成する、
請求項３記載の情報処理システム。
各々が前記複数の探索部のうちの１以上の探索部を備える複数の装置を有し、
前記複数の装置の各々は、自装置が備える前記１以上の探索部で得られた前記エネルギー関数の第１の最良候補値に対応する第３の解を前記複数の装置のうちの他の装置に送信し、前記他の装置で得られた前記エネルギー関数の第２の最良候補値に対応する第４の解を前記他の装置から受信し、前記第１の最良候補値と前記第２の最良候補値との比較に基づいて前記第１の解を決定する、
請求項１または２記載の情報処理システム。
前記複数の装置の各々は、
前記他の装置に前記第３の解を送信し、前記他の装置から前記第４の解を受信し、前記第１の最良候補値と前記第２の最良候補値との前記比較により、前記第３の解および前記第４の解のうちの前記第１の解の候補である候補解を出力する通信部と、
前記自装置が備える前記１以上の探索部で得られた第５の解および前記通信部により出力された前記候補解のうちの前記エネルギー関数の値が良い前記解を優先して所定数保持し、前記所定数の前記解のうちの最良の前記エネルギー関数の値に対応する前記解を前記第１の解として決定し、決定した前記第１の解を前記自装置が備える前記１以上の探索部に出力する解伝播部と、
を有する請求項８記載の情報処理システム。
前記複数の装置の各々は２以上の探索部を備え、
前記複数の装置の各々の前記解伝播部は、前記自装置が備える前記２以上の探索部の各々から前記第５の解を非同期に取得し、選択した前記第１の解を当該２以上の探索部の各々に非同期に出力する、
請求項９記載の情報処理システム。
前記複数の探索部の各々は、前記第１の解に含まれる一部の状態変数の値を変化させることで、前記第１状態変数列を生成する、
請求項１記載の情報処理システム。
情報処理システムに含まれる複数の探索部の各々が、
エネルギー関数に含まれる複数の状態変数の値により表される解を探索し、
前記複数の探索部により得られた複数の解の中から、前記複数の解に対応する複数の前記エネルギー関数の値のうちの最良の値に対応する第１の解を取得し、
前記第１の解に基づいて第１状態変数列を生成し、
前記第１状態変数列を始状態として前記解を探索する、
情報処理方法。
コンピュータに、
各々がエネルギー関数に含まれる複数の状態変数の値により表される解を探索する複数の探索部に前記解を探索させ、
前記複数の探索部により得られた複数の解の中から、前記複数の解に対応する複数の前記エネルギー関数の値のうちの最良の値に対応する第１の解を取得し、
前記第１の解に基づいて第１状態変数列を前記複数の探索部の各々に対して生成し、
前記第１状態変数列を始状態として前記複数の探索部の各々に前記解を探索させる、
処理を実行させるプログラム。