WO2020196866A1

WO2020196866A1 - 情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム

Info

Publication number: WO2020196866A1
Application number: PCT/JP2020/014164
Authority: WO
Inventors: 鈴木　賢; 隼人後藤; 光介辰村
Original assignee: 株式会社東芝; 東芝デジタルソリューションズ株式会社
Priority date: 2019-03-28
Filing date: 2020-03-27
Publication date: 2020-10-01
Also published as: CA3135137A1; CN113646782A; JPWO2020196866A1; JP7502269B2; CA3135137C; US20220012307A1

Abstract

［課題］組合せ最適化問題の解を実用的な時間内で計算する情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムを提供する。［解決手段］本発明の実施形態としての情報処理装置は、記憶部と、処理回路とを備え、第１変数を要素とする第１ベクトルおよび第２変数を要素とする第２ベクトルを繰り返し更新する。前記処理回路は、前記第１変数に対応する前記第２変数を重み付け加算することによって前記第１ベクトルを更新し、更新された前記第１ベクトルを探索済ベクトルとして前記記憶部に保存し、前記第１変数を更新回数に応じて単調増加する第１係数で重み付けし対応する前記第２変数に加算し、複数の前記第１変数を用いて問題項を計算し、前記問題項を前記第２変数に加算し、更新対象の前記第１ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算し、前記補正項を前記第２変数に加算することによって前記第２ベクトルを更新する。

Description

情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム

　本発明の実施形態は、情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムに関する。

　組合せ最適化問題とは、複数の組合せの中から目的に最も適した組合せを選ぶ問題である。組合せ最適化問題は、数学的には、「目的関数」と呼ばれる、複数の離散変数を有する関数を最大化させる問題、または、当該関数を最小化させる問題に帰着される。組合せ最適化問題は、金融、物流、交通、設計、製造、生命科学など各種の分野において普遍的な問題であるが、組合せ数が問題サイズの指数関数のオーダーで増える、いわゆる「組合せ爆発」のため、必ず最適解を求めることができるとは限らない。また、最適解に近い近似解を得ることすら難しい場合が多い。

　各分野における問題を解決し、社会のイノベーションおよび科学技術の進歩を促進するために、組合せ最適化問題の解を実用的な時間内で計算する技術の開発が求められている。

特開２０１７－７３１０６号公報

H. Goto, K. Tatsumura, A. R. Dixon, Sci. Adv. 5, eaav2372 (2019). H. Goto, Sci. Rep. 6, 21686 (2016). 土屋、西山、辻田：分岐特性を用いた組合せ最適化問題の近似解法URL:http://www.ynl.t.u-tokyo.ac.jp/project/RobotBrainCREST/publications/pdf/tsuchiya/4_01.pdf 土屋、西山、辻田：決定論的アニーリングアルゴリズムの解析URL:http://www.ynl.t.u-tokyo.ac.jp/project/RobotBrainCREST/publications/pdf/tsuchiya/4_02.pdf

　本発明の実施形態は、組合せ最適化問題の解を実用的な時間内で計算する情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムを提供する。

　本発明の実施形態としての情報処理装置は、第１変数を要素とする第１ベクトルおよび前記第１変数に対応する第２変数を要素とする第２ベクトルを繰り返し更新するように構成されている。情報処理装置は、記憶部と、処理回路とを備える。前記処理回路は、前記第１変数に対応する前記第２変数を重み付け加算することによって前記第１ベクトルを更新し、更新された前記第１ベクトルを探索済ベクトルとして前記記憶部に保存し、前記第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する前記第２変数に加算し、前記第１変数間の問題項を計算し、前記問題項を前記第２変数に加算し、前記記憶部より前記探索済ベクトルを読み出し、更新対象の前記第１ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算し、前記補正項を前記第２変数に加算することによって前記第２ベクトルを更新するように構成されている。

情報処理システムの構成例を示した図。管理サーバの構成例を示したブロック図。管理サーバの記憶部に保存されるデータの例を示す図。計算サーバの構成例を示したブロック図。計算サーバのストレージに保存されるデータの例を示す図。時間発展によってシミュレーテッド分岐アルゴリズムの解を計算する場合における処理の例を示したフローチャート。補正項を含むアルゴリズムを使って求解を行う場合における処理の例を示したフローチャート。他の計算ノードで計算された第１ベクトルを使って効率的に求解を行う場合における処理の例を示したフローチャート。複数の計算ノードにおいて効率的にシミュレーテッド分岐アルゴリズムで求解を行う場合における処理の例を示したフローチャート。複数の計算ノードにおいて効率的にシミュレーテッド分岐アルゴリズムで求解を行う場合における処理の例を示したフローチャート。複数の計算ノードを含む情報処理システムの例を概念的に示した図。各計算ノードにおける拡張ハミルトニアンの値の変化の例を概念的に示した図。各計算ノードにおける拡張ハミルトニアンの値の変化の例を概念的に示した図。各計算ノードにおける拡張ハミルトニアンの値の変化の例を概念的に示した図。複数の計算方法において、最適解を得られるまでに必要な計算回数を示したヒストグラム。マルチプロセッサ構成の例を概略的に示した図。ＧＰＵを使った構成の例を概略的に示した図。組合せ最適化問題を解くために実行される全体的な処理の例を示したフローチャート。

　以下、図面を参照しながら、本発明の実施形態について説明する。また、図面において同一の構成要素は、同じ番号を付し、説明は、適宜省略する。

　図１は、情報処理システム１００の構成例を示したブロック図である。図１の情報処理システム１００は、管理サーバ１と、ネットワーク２と、計算サーバ（情報処理装置）３ａ～３ｃと、ケーブル４ａ～４ｃと、スイッチ５と、記憶装置７を備えている。また、図１には、情報処理システム１００と通信可能なクライアント端末６が示されている。管理サーバ１、計算サーバ３ａ～３ｃ、クライアント端末６および記憶装置７は、ネットワーク２を介して互いにデータ通信をすることができる。例えば、計算サーバ３ａ～３ｃは、記憶装置７にデータを保存したり、記憶装置７よりデータを読み出したりすることができる。ネットワーク２は、例えば、複数のコンピュータネットワークが相互に接続されたインターネットである。ネットワーク２は、通信媒体として有線、無線、または、これらの組合せを用いることができる。また、ネットワーク２で使われる通信プロトコルの例としては、ＴＣＰ／ＩＰがあるが、通信プロトコルの種類については特に問わない。

　また、計算サーバ３ａ～３ｃは、それぞれケーブル４ａ～４ｃを介してスイッチ５に接続されている。ケーブル４ａ～４ｃおよびスイッチ５は、計算サーバ間のインターコネクトを形成している。計算サーバ３ａ～３ｃは、当該インターコネクトを介して互いにデータ通信をすることも可能である。スイッチ５は、例えば、Ｉｎｆｉｎｉｂａｎｄのスイッチである。ケーブル４ａ～４ｃは、例えば、Ｉｎｆｉｎｉｂａｎｄのケーブルである。ただし、Ｉｎｆｉｎｉｂａｎｄのスイッチ／ケーブルの代わりに、有線ＬＡＮのスイッチ／ケーブルを使ってもよい。ケーブル４ａ～４ｃおよびスイッチ５で使われる通信規格および通信プロトコルについては、特に問わない。クライアント端末６の例としては、ノートＰＣ、デスクトップＰＣ、スマートフォン、タブレット、車載端末などが挙げられる。

　組合せ最適化問題の求解では、処理の並列化および／または処理の分散化を行うことができる。したがって、計算サーバ３ａ～３ｃおよび／または計算サーバ３ａ～３ｃのプロセッサは、計算処理の一部のステップを分担して実行してもよいし、異なる変数について同様の計算処理を並列的に実行してもよい。管理サーバ１は、例えば、ユーザによって入力された組合せ最適化問題を各計算サーバが処理可能な形式に変換し、計算サーバを制御する。そして、管理サーバ１は、各計算サーバから計算結果を取得し、集約した計算結果を組合せ最適化問題の解に変換する。こうして、ユーザは、組合せ最適化問題の解を得ることができる。組合せ最適化問題の解は、最適解と、最適解に近い近似解とを含むものとする。

　図１には、３台の計算サーバが示されている。ただし、情報処理システムに含まれる計算サーバの台数を限定するものではない。また、組合せ最適化問題の求解に使われる計算サーバの台数についても特に問わない。例えば、情報処理システムに含まれる計算サーバは１台であってもよい。また、情報処理システムに含まれる複数の計算サーバのうち、いずれかの計算サーバを使って組合せ最適化問題の求解を行ってもよい。また、情報処理システムに、数百台以上の計算サーバが含まれていてもよい。計算サーバは、データセンターに設置されたサーバであってもよいし、オフィスに設置されたデスクトップＰＣであってもよい。また、計算サーバは異なるロケーションに設置された複数の種類のコンピュータであってもよい。計算サーバとして使われる情報処理装置の種類については特に問わない。例えば、計算サーバは、汎用的なコンピュータであってもよいし、専用の電子回路または、これらの組合せであってもよい。

　図２は、管理サーバ１の構成例を示したブロック図である。図２の管理サーバ１は、例えば、中央演算処理装置（ＣＰＵ）とメモリとを含むコンピュータである。管理サーバ１は、プロセッサ１０と、記憶部１４と、通信回路１５と、入力回路１６と、出力回路１７とを備えている。プロセッサ１０、記憶部１４、通信回路１５、入力回路１６および出力回路１７は、互いにバス２０を介して接続されているものとする。プロセッサ１０は、内部の構成要素として、管理部１１と、変換部１２と、制御部１３とを含んでいる。

　プロセッサ１０は、演算を実行し、管理サーバ１の制御を行う電子回路である。プロセッサ１０は、処理回路の一例である。プロセッサ１０として、例えば、ＣＰＵ、マイクロプロセッサ、ＡＳＩＣ、ＦＰＧＡ、ＰＬＤまたはこれらの組合せを用いることができる。管理部１１は、ユーザのクライアント端末６を介して管理サーバ１の操作を行うためのインタフェースを提供する。管理部１１が提供するインタフェースの例としては、ＡＰＩ、ＣＬＩ、ウェブページなどが挙げられる。例えば、ユーザは、管理部１１を介して組合せ最適化問題の情報の入力を行ったり、計算された組合せ最適化問題の解の閲覧および／またはダウンロードを行ったりすることができる。変換部１２は、組合せ最適化問題を各計算サーバが処理可能な形式に変換する。制御部１３は、各計算サーバに制御指令を送信する。制御部１３が各計算サーバから計算結果を取得した後、変換部１２は、複数の計算結果を集約し、組合せ最適化問題の解に変換する。また、制御部１３は、各計算サーバまたは各サーバ内のプロセッサが実行する処理内容を指定してもよい。

　記憶部１４は、管理サーバ１のプログラム、プログラムの実行に必要なデータ、およびプログラムによって生成されたデータを含む各種のデータを記憶する。ここで、プログラムは、ＯＳとアプリケーションの両方を含むものとする。記憶部１４は、揮発性メモリ、不揮発性メモリ、またはこれらの組合せであってもよい。揮発性メモリの例としては、ＤＲＡＭ、ＳＲＡＭなどがある。不揮発性メモリの例としては、ＮＡＮＤフラッシュメモリ、ＮＯＲフラッシュメモリ、ＲｅＲＡＭ、またはＭＲＡＭが挙げられる。また、記憶部１４として、ハードディスク、光ディスク、磁気テープまたは外部の記憶装置を使ってもよい。

　通信回路１５は、ネットワーク２に接続された各装置との間でデータの送受信を行う。通信回路１５は、例えば、有線ＬＡＮのＮＩＣ（Ｎｅｔｗｏｒｋ　Ｉｎｔｅｒｆａｃｅ　Ｃａｒｄ）である。ただし、通信回路１５は、無線ＬＡＮなど、その他の種類の通信回路であってもよい。入力回路１６は、管理サーバ１へのデータ入力を実現する。入力回路１６は、外部ポートとして、例えば、ＵＳＢ、ＰＣＩ－Ｅｘｐｒｅｓｓなどを備えているものとする。図２の例では、操作装置１８が入力回路１６に接続されている。操作装置１８は、管理サーバ１に情報を入力するための装置である。操作装置１８は、例えば、キーボード、マウス、タッチパネル、音声認識装置などであるが、これに限られない。出力回路１７は、管理サーバ１からのデータ出力を実現する。出力回路１７は、外部ポートとしてＨＤＭＩ、ＤｉｓｐｌａｙＰｏｒｔなどを備えているものとする。図２の例では、表示装置１９が出力回路１７に接続されている。表示装置１９の例としては、ＬＣＤ（液晶ディスプレイ）、有機ＥＬ（有機エレクトロルミネッセンス）ディスプレイ、またはプロジェクタがあるが、これに限られない。

　管理サーバ１の管理者は、操作装置１８および表示装置１９を使って、管理サーバ１のメンテナンスを行うことができる。なお、操作装置１８および表示装置１９は、管理サーバ１に組み込まれたものであってもよい。また、管理サーバ１に必ず操作装置１８および表示装置１９が接続されていなくてもよい。例えば、管理者は、ネットワーク２と通信可能な情報端末を用いて管理サーバ１のメンテナンスを行ってもよい。

　図３は、管理サーバ１の記憶部１４に保存されるデータの例を示している。図３の記憶部１４には、問題データ１４Ａと、計算データ１４Ｂと、管理プログラム１４Ｃと、変換プログラム１４Ｄと、制御プログラム１４Ｅとが保存されている。例えば、問題データ１４Ａは、組合せ最適化問題のデータを含む。例えば、計算データ１４Ｂは、各計算サーバから収集された計算結果を含む。例えば、管理プログラム１４Ｃは、上述の管理部１１の機能を実現するプログラムである。例えば、変換プログラム１４Ｄは、上述の変換部１２の機能を実現するプログラムである。例えば、制御プログラム１４Ｅは、上述の制御部１３の機能を実現するプログラムである。

　図４は、計算サーバの構成例を示したブロックである。図４の計算サーバは、例えば、第１ベクトルおよび第２ベクトルの計算を単独で、または、他の計算サーバと分担して実行する情報処理装置である。

　図４には、例示的に計算サーバ３ａの構成が示されている。他の計算サーバは、計算サーバ３ａと同様の構成であってもよいし、計算サーバ３ａと異なる構成であってもよい。

　計算サーバ３ａは、例えば、通信回路３１と、共有メモリ３２と、プロセッサ３３Ａ～３３Ｄと、ストレージ３４と、ホストバスアダプタ３５とを備えている。通信回路３１、共有メモリ３２、プロセッサ３３Ａ～３３Ｄ、ストレージ３４およびホストバスアダプタ３５は、バス３６を介して互いに接続されているものとする。

　通信回路３１は、ネットワーク２に接続された各装置との間でデータの送受信を行う。通信回路３１は、例えば、有線ＬＡＮのＮＩＣ（Ｎｅｔｗｏｒｋ　Ｉｎｔｅｒｆａｃｅ　Ｃａｒｄ）である。ただし、通信回路３１は、無線ＬＡＮなど、その他の種類の通信回路であってもよい。共有メモリ３２は、プロセッサ３３Ａ～３３Ｄからアクセス可能なメモリである。共有メモリ３２の例としては、ＤＲＡＭ、ＳＲＡＭなどの揮発性メモリが挙げられる。ただし、共有メモリ３２として、不揮発性メモリなどその他の種類のメモリが使われてもよい。共有メモリ３２は、例えば、第１ベクトルおよび第２ベクトルを記憶するように構成されていてもよい。プロセッサ３３Ａ～３３Ｄは、共有メモリ３２を介してデータの共有を行うことができる。なお、必ず計算サーバ３ａのすべてのメモリが共有メモリとして構成されていなくてもよい。例えば、計算サーバ３ａの一部のメモリは、いずれかのプロセッサのみからアクセスできるローカルメモリとして構成されていてもよい。なお、共有メモリ３２および後述するストレージ３４は、情報処理装置の記憶部の一例である。

　プロセッサ３３Ａ～３３Ｄは、計算処理を実行する電子回路である。プロセッサは、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ－Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）、またはＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）のいずれであってもよいし、これらの組合せであってもよい。また、プロセッサは、ＣＰＵコアまたはＣＰＵスレッドであってもよい。プロセッサがＣＰＵである場合、計算サーバ３ａが備えるソケット数については、特に問わない。また、プロセッサは、ＰＣＩ　ｅｘｐｒｅｓｓなどのバスを介して計算サーバ３ａのその他の構成要素に接続されていてもよい。

　図４の例では、計算サーバが４つのプロセッサを備えている。ただし、１台の計算サーバが備えているプロセッサの数はこれとは異なっていてもよい。例えば、計算サーバによって実装されているプロセッサの数および／または種類が異なっていてもよい。ここで、プロセッサは、情報処理装置の処理回路の一例である。情報処理装置は、複数の処理回路を備えていてもよい。

　情報処理装置は、例えば、第１変数ｘ_ｉ（ｉ＝１、２、・・・、Ｎ）を要素とする第１ベクトルおよび第１変数に対応する第２変数ｙ_ｉ（ｉ＝１、２、・・・、Ｎ）を要素とする第２ベクトルを繰り返し更新するように構成されている。

　例えば、情報処理装置の処理回路は、第１変数に第２変数を重み付け加算することによって第１ベクトルを更新し、更新された第１ベクトルを探索済ベクトルとして記憶部に保存し、第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する第２変数に加算し、複数の第１変数を用いて問題項を計算し、問題項を第２変数に加算し、記憶部より探索済ベクトルを読み出し、更新対象の第１ベクトルと探索済ベクトルとの間の距離の逆数を含む補正項を計算し、補正項を第２変数に加算することによって第２ベクトルを更新するように構成されていてもよい。問題項は、イジングモデルに基づいて計算されるものであってもよい。ここで、第１変数は、必ず単調増加または単調減少しなくてもよい。例えば、（１）第１係数の値がしきい値Ｔ_１（例えば、Ｔ_１＝１）より大きくなったときに組合せ最適化問題の解（解ベクトル）を求め、（２）その後、第１係数の値をしきい値Ｔ_２（例えば、Ｔ_２＝２）より小さく設定した後に第１係数の値を再びしきい値Ｔ_１より大きく設定し、組合せ最適化問題の解（解ベクトル）を求めることを繰り返してもよい。なお、問題項は、多体相互作用を含むものであってもよい。第１係数、問題項、探索済ベクトル、補正項、イジングモデル、多体相互作用の詳細については、後述する。

　情報処理装置では、例えば、プロセッサ単位で処理内容（タスク）の割り当てを行うことができる。ただし、処理内容の割り当てが行われる計算資源の単位を限定するものではない。例えば、計算機単位で処理内容の割り当てを行ってもよいし、プロセッサ上で動作するプロセス単位またはＣＰＵスレッド単位で処理内容の割り当てを行ってもよい。

　以下では、再び図４を参照し、計算サーバの構成要素を説明する。

　ストレージ３４は、計算サーバ３ａのプログラム、プログラムの実行に必要なデータ、およびプログラムによって生成されたデータを含む各種のデータを記憶する。ここで、プログラムは、ＯＳとアプリケーションの両方を含むものとする。ストレージ３４は、例えば、第１ベクトルおよび第２ベクトルを記憶するように構成されていてもよい。ストレージ３４は、揮発性メモリ、不揮発性メモリ、またはこれらの組合せであってもよい。揮発性メモリの例としては、ＤＲＡＭ、またはＳＲＡＭなどがある。不揮発性メモリの例としては、ＮＡＮＤフラッシュメモリ、ＮＯＲフラッシュメモリ、ＲｅＲＡＭ、またはＭＲＡＭが挙げられる。また、ストレージ３４として、ハードディスク、光ディスク、磁気テープまたは外部の記憶装置が使われてもよい。

　ホストバスアダプタ３５は、計算サーバ間のデータ通信を実現する。ホストバスアダプタ３５は、ケーブル４ａを介してスイッチ５に接続されている。ホストバスアダプタ３５は、例えば、ＨＣＡ（Ｈｏｓｔ　Ｃｈａｎｎｅｌ　Ａｄａｐｔｏｒ）である。ホストバスアダプタ３５、ケーブル４ａ、およびスイッチ５を使って高スループットを実現可能なインターコネクトを形成することにより、並列的な計算処理の速度を向上させることができる。

　図５は、計算サーバのストレージに保存されるデータの例を示している。図５のストレージ３４には、計算データ３４Ａと、計算プログラム３４Ｂと、制御プログラム３４Ｃとが保存されている。計算データ３４Ａは、計算サーバ３ａの計算途中のデータまたは計算結果を含んでいる。なお、計算データ３４Ａの少なくとも一部は、共有メモリ３２、プロセッサのキャッシュ、またはプロセッサのレジスタなど、異なる記憶階層に保存されていてもよい。計算プログラム３４Ｂは、所定のアルゴリズムに基づき、各プロセッサにおける計算処理および、共有メモリ３２およびストレージ３４へのデータの保存処理を実現するプログラムである。制御プログラム３４Ｃは、管理サーバ１の制御部１３から送信された指令に基づき、計算サーバ３ａを制御し、計算サーバ３ａの計算結果を管理サーバ１に送信するプログラムである。

　次に、組合せ最適化問題の求解に関連する技術について説明する。組合せ最適化問題を解くために使われる情報処理装置の一例として、イジングマシンが挙げられる。イジングマシンとは、イジングモデルの基底状態のエネルギーを計算する情報処理装置のことをいう。これまで、イジングモデルは、主に強磁性体や相転移現象のモデルとして使われることが多かった。しかし、近年、イジングモデルは、組合せ最適化問題を解くためのモデルとしての利用が増えている。下記の式（１）は、イジングモデルのエネルギーを示している。

ここで、ｓ_ｉ、ｓ_ｊはスピンである、スピンは、＋１または－１のいずれかの値をとる２値変数である。Ｎは、スピンの数である。ｈ_ｉは、各スピンに作用する局所磁場である。Ｊは、スピン間における結合係数の行列である。行列Ｊは、対角成分が０である実対称行列となっている。したがって、Ｊ_ｉｊは行列Ｊのｉ行ｊ列の要素を示している。なお、式（１）のイジングモデルは、スピンについての２次式となっているが、後述するように、スピンの３次以上の項を含む拡張されたイジングモデル（多体相互作用を有するイジングモデル）を使ってもよい。

　式（１）のイジングモデルを使うと、エネルギーＥ_{Ｉｓｉｎｇ}を目的関数とし、エネルギーＥ_{Ｉｓｉｎｇ}を可能な限り小さくする解を計算することができる。イジングモデルの解は、スピンのベクトル（ｓ_１、ｓ_２、・・・、ｓ_Ｎ）の形式で表される。このベクトルを解ベクトルとよぶものとする。特に、エネルギーＥ_{Ｉｓｉｎｇ}が最小値となるベクトル（ｓ_１、ｓ_２、・・・、ｓ_Ｎ）は、最適解とよばれる。ただし、計算されるイジングモデルの解は、必ず厳密な最適解でなくてもよい。以降では、イジングモデルを使ってエネルギーＥ_{Ｉｓｉｎｇ}が可能な限り小さくなる近似解（すなわち、目的関数の値が可能な限り最適値に近くなる近似解）を求める問題をイジング問題とよぶものとする。

　式（１）のスピンｓ_ｉは２値変数であるため、式（１＋ｓ_ｉ）／２を使うことにより、組合せ最適化問題で使われる離散変数（ビット）との変換を容易に行うことができる。したがって、組合せ最適化問題をイジング問題に変換し、イジングマシンに計算を行わせることにより、組合せ最適化問題の解を求めることが可能である。０または１のいずれかの値をとる離散変数（ビット）を変数とする２次の目的関数を最小化する解を求める問題は、ＱＵＢＯ（Ｑｕａｄｒａｔｉｃ　Ｕｎｃｏｎｓｔｒａｉｎｅｄ　Ｂｉｎａｒｙ　Ｏｐｔｉｍｉｚａｔｉｏｎ、制約なし２値変数２次最適化）問題とよばれる。式（１）で表されるイジング問題は、ＱＵＢＯ問題と等価であるといえる。

　例えば、量子アニーラ、コヒーレントイジングマシン、または量子分岐マシンなどがイジングマシンのハードウェア実装として提案されている。量子アニーラは、超伝導回路を使って量子アニーリングを実現する。コヒーレントイジングマシンは、光パラメトリック発振器で形成されたネットワークの発振現象を利用する。量子分岐マシンは、カー効果を有するパラメトリック発振器のネットワークにおける量子力学的な分岐現象を利用する。これらのハードウェア実装は、計算時間の大幅な短縮を実現する可能性がある一方、大規模化や安定的な運用が難しいという課題もある。

　そこで、広く普及しているデジタルコンピュータを使ってイジング問題の求解を行うことも可能である。デジタルコンピュータは、上述の物理的現象を使ったハードウェア実装と比べ、大規模化と安定運用が容易である。デジタルコンピュータでイジング問題の求解を行うためのアルゴリズムの一例として、シミュレーテッドアニーリング（ＳＡ）が挙げられる。シミュレーテッドアニーリングをより高速に実行する技術の開発が行われている。ただし、一般のシミュレーテッドアニーリングはそれぞれの変数が逐次更新される逐次更新アルゴリズムであるため、並列化による計算処理の高速化は難しい。

　上述の課題を踏まえ、デジタルコンピュータにおける並列的な計算によって、規模の大きい組合せ最適化問題の求解を高速に行うことが可能なシミュレーテッド分岐アルゴリズムが提案されている。以降では、シミュレーテッド分岐アルゴリズムを使って組合せ最適化問題を解く情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムについて説明する。

　はじめに、シミュレーテッド分岐アルゴリズムの概要について述べる。

　シミュレーテッド分岐アルゴリズムでは、それぞれＮ個ある２つの変数ｘ_ｉ，ｙ_ｉ（ｉ＝１、２、・・・、Ｎ）について、下記の（２）の連立常微分方程式を数値的に解く。Ｎ個の変数ｘ_ｉのそれぞれは、イジングモデルのスピンｓ_ｉに対応している。一方、Ｎ個の変数ｙ_ｉのそれぞれは、運動量に相当している。変数ｘ_ｉ，ｙ_ｉは、いずれも連続変数であるものとする。以下では、変数ｘ_ｉ（ｉ＝１、２、・・・、Ｎ）を要素とするベクトルを第１ベクトル、変数ｙ_ｉ（ｉ＝１、２、・・・、Ｎ）を要素とするベクトルを第２ベクトルとそれぞれよぶものとする。

　ここで、Ｈは、下記の式（３）のハミルトニアンである。

　なお、（２）では、式（３）のハミルトニアンＨに代わり、下記の式（４）に示した、項Ｇ(ｘ_１、ｘ_２、・・・ｘ_Ｎ）を含めたハミルトニアンＨ´を使ってもよい。ハミルトニアンＨだけでなく項Ｇ(ｘ_１、ｘ_２、・・・ｘ_Ｎ）も含む関数を拡張ハミルトニアンとよび、もとのハミルトニアンＨと区別するものとする。

　以下では、項Ｇ(ｘ_１、ｘ_２、・・・ｘ_Ｎ）が補正項である場合を例に処理を説明する。ただし、項Ｇ(ｘ_１、ｘ_２、・・・ｘ_Ｎ）は、組合せ最適化問題の制約条件より導かれるものであってもよい。ただし、項Ｇ(ｘ_１、ｘ_２、・・・ｘ_Ｎ）の導出方法と種類を限定するものではない。また、式（４）では、もとのハミルトニアンＨに項Ｇ(ｘ_１、ｘ_２、・・・ｘ_Ｎ）が加算されている。ただし、項Ｇ(ｘ_１、ｘ_２、・・・ｘ_Ｎ）は、これとは異なる方法で拡張ハミルトニアンに組み込まれていてもよい。

　式（３）のハミルトニアンおよび（４）の拡張ハミルトニアンを参照すると、それぞれの項が第１ベクトルの要素ｘ_ｉまたは第２ベクトルの要素ｙ_ｉのいずれかの項になっている。下記の式（５）に示すように、第１ベクトルの要素ｘ_ｉの項Ｕと、第２ベクトルの要素ｙ_ｉの項Ｖに分けることが可能な拡張ハミルトニアンを使ってもよい。

　シミュレーテッド分岐アルゴリズムの時間発展の計算では、変数ｘ_ｉ，ｙ_ｉ（ｉ＝１、２、・・・、Ｎ）の値が繰り返し更新される。そして、所定の条件が満たされたときに変数ｘ_ｉを変換することによってイジングモデルのスピンｓ_ｉ（ｉ＝１、２、・・・、Ｎ）を求めることができる。以下では、時間発展の計算が行われる場合を想定して処理の説明を行う。ただし、シミュレーテッド分岐アルゴリズムの計算は、時間発展以外の方式で行われてもよい。

　（２）および（３）において、係数Ｄは、離調（ｄｅｔｕｎｉｎｇ）に相当する。係数ｐ（ｔ）は、上述の第１係数に相当し、ポンピング振幅（ｐｕｍｐｉｎｇ　ａｍｐｌｉｔｕｄｅ）ともよばれる。時間発展の計算において、係数ｐ（ｔ）の値を更新回数に応じて単調増加させることができる。係数ｐ（ｔ）の初期値は０に設定されていてもよい。

　なお、以下では、第１係数ｐ（ｔ）が正値であり、更新回数に応じて第１係数ｐ（ｔ）の値が大きくなる場合を例に説明する。ただし、以下で提示するアルゴリズムの符号を反転し、負値の第１係数ｐ（ｔ）を使ってもよい。この場合、更新回数に応じて第１係数ｐ（ｔ）の値が単調減少する。ただし、いずれの場合においても、更新回数に応じて第１係数ｐ（ｔ）の絶対値が単調増加する。

　係数Ｋは、正のカー係数（Ｋｅｒｒ　ｃｏｅｆｆｉｃｉｅｎｔ）に相当する。係数ｃとして、定数係数を使うことができる。例えば、係数ｃの値を、シミュレーテッド分岐アルゴリズムによる計算の実行前に決めてもよい。例えば、係数ｃをＪ^（２）行列の最大固有値の逆数に近い値に設定することができる。例えば、ｃ＝０．５Ｄ√（Ｎ／２ｎ）という値を使うことができる。ここで、ｎは、組合せ最適化問題に係るグラフのエッジ数である。また、ａ（ｔ）は、時間発展の計算時においてｐ（ｔ）とともに増加する係数である。例えば、ａ（ｔ）として、√（ｐ（ｔ）／Ｋ）を使うことができる。なお、（３）および（４）における局所磁場のベクトルｈ_ｉは、省略すること可能である。

　例えば、係数ｐ（ｔ）の値が所定の値を超えた時に、第１ベクトルにおいて、正値である変数ｘ_ｉを＋１、負値である変数ｘ_ｉを－１にそれぞれ変換すると、スピンｓ_ｉを要素とする解ベクトルを得ることができる。この解ベクトルは、イジング問題の解に相当する。なお、情報処理装置は、第１ベクトルおよび第２ベクトルの更新回数に基づき、上述の変換処理を実行し、解ベクトルを求めるか否かを判定してもよい。

　シミュレーテッド分岐アルゴリズムの計算を行う場合、シンプレクティック・オイラー法を使い、上述の（２）を離散的な漸化式に変換し、求解を行うことができる。下記の（６）は、漸化式に変換後のシミュレーテッド分岐アルゴリズムの例を示している。

　ここで、ｔは、時刻であり、Δｔは、時間ステップ（時間刻み幅）である。なお、（６）では、微分方程式との対応関係を示すために、時刻ｔおよび時間ステップΔｔが使われている。ただし、実際にアルゴリズムをソフトウェアまたはハードウェアに実装する際に必ず時刻ｔおよび時間ステップΔｔが明示的なパラメータとして含まれていなくてもよい。例えば、時間ステップΔｔを１とすれば、実装時のアルゴリズムから時間ステップΔｔを除去することが可能である。アルゴリズムを実装する際に、明示的なパラメータとして時間ｔを含めない場合には、（４）において、ｘ_ｉ（ｔ＋Δｔ）をｘ_ｉ（ｔ）の更新後の値であると解釈すればよい。すなわち、上述の（４）における“ｔ”は、更新前の変数の値、“ｔ＋Δｔ”は、更新後の変数の値を示すものとする。

　シミュレーテッド分岐アルゴリズムの時間発展を計算する場合、ｐ（ｔ）の値を初期値（例えば、０）から所定の値まで増加させた後における変数ｘ_ｉの符号に基づき、スピンｓ_ｉの値を求めることができる。例えば、ｘ_ｉ＞０のときｓｇｎ（ｘ_ｉ）＝＋１、ｘ_ｉ＜０のときｓｇｎ（ｘ_ｉ）＝－１となる符号関数を使うと、ｐ（ｔ）の値が所定の値まで増加したとき、変数ｘ_ｉを符号関数で変換することによってスピンｓ_ｉの値を求めることができる。符号関数として、例えば、ｘ_ｉ≠０のときに、ｓｇｎ（ｘ_ｉ）＝ｘ_ｉ／｜ｘ_ｉ｜、ｘ_ｉ＝０のときにｓｇｎ（ｘ_ｉ）＝＋１または－１になる関数を使うことができる。組合せ最適化問題の解（例えば、イジングモデルのスピンｓ_ｉ）を求めるタイミングについては、特に問わない。例えば、第１ベクトルおよび第２ベクトルの更新回数、第１係数ｐの値または目的関数の値がしきい値より大きくなったときに組合せ最適化問題の解（解ベクトル）を求めてもよい。

　図６のフローチャートは、時間発展によってシミュレーテッド分岐アルゴリズムの解を計算する場合における処理の例を示している。以下では、図６を参照しながら処理を説明する。

　はじめに、計算サーバは、管理サーバ１より問題に対応する行列Ｊ_ｉｊおよびベクトルｈ_ｉを取得する（ステップＳ１０１）。そして、計算サーバは、係数ｐ（ｔ）およびａ（ｔ）を初期化する（ステップＳ１０２）。例えば、ステップＳ１０２で係数ｐおよびａの値を０にすることができるが、係数ｐおよびａの初期値を限定するものではない。次に、計算サーバは、第１変数ｘ_ｉおよび第２変数ｙ_ｉを初期化する（ステップＳ１０３）。ここで、第１変数ｘ_ｉは、第１ベクトルの要素である。また、第２変数ｙ_ｉは、第２ベクトルの要素である。ステップＳ１０３で計算サーバは、例えば、擬似乱数によってｘ_ｉおよびｙ_ｉを初期化してもよい。ただし、ｘ_ｉおよびｙ_ｉの初期化の方法を限定するものではない。また、これとは異なるタイミングに変数の初期化を行ってもよいし、少なくともいずれかの変数を複数回初期化してもよい。

　次に、計算サーバは、第１ベクトルの要素ｘ_ｉに対応する第２ベクトルの要素ｙ_ｉを重み付け加算することによって第１ベクトルを更新する（ステップＳ１０４）。例えば、ステップＳ１０４では、変数ｘ_ｉにΔｔ×Ｄ×ｙ_ｉを加算することができる。そして、計算サーバは、第２ベクトルの要素ｙ_ｉを更新する（ステップＳ１０５およびＳ１０６）。例えば、ステップＳ１０５では、変数ｙ_ｉにΔｔ×［（ｐ－Ｄ－Ｋ×ｘ_ｉ×ｘ_ｉ）×ｘ_ｉ］を加算することができる。ステップＳ１０６では、さらに変数ｙ_ｉに－Δｔ×ｃ×ｈ_ｉ×ａ－Δｔ×ｃ×ΣＪ_ｉｊ×ｘ_ｊを加算することができる。

　次に、計算サーバは、係数ｐおよびａの値を更新する（ステップＳ１０７）。例えば、係数ｐに一定の値（Δｐ）を加算し、係数ａを更新後の係数ｐの正の平方根に設定することができる。ただし、後述するように、これは係数ｐおよびａの値の更新方法の一例にしかすぎない。そして、計算サーバは、第１ベクトルおよび第２ベクトルの更新回数がしきい値未満であるか否かを判定する（ステップＳ１０８）。更新回数がしきい値未満である場合（ステップＳ１０８のＹＥＳ）、計算サーバは、ステップＳ１０４～Ｓ１０７の処理を再度実行する。更新回数がしきい値以上である場合（ステップＳ１０８のＮＯ）、第１ベクトルの要素ｘ_ｉに基づいて解ベクトルの要素であるスピンｓ_ｉを求める（ステップＳ１０９）。ステップＳ１０９では、例えば、第１ベクトルにおいて、正値である変数ｘ_ｉを＋１、負値である変数ｘ_ｉを－１にそれぞれ変換し、解ベクトルを得ることができる。

　なお、ステップＳ１０８の判定において、更新回数がしきい値未満である場合（ステップＳ１０８のＹＥＳ）に第１ベクトルに基づきハミルトニアンの値を計算し、第１ベクトルおよびハミルトニアンの値を記憶してもよい。これにより、ユーザは、複数の第１ベクトルより最適解に最も近い近似解を選択することが可能となる。

　なお、図６のフローチャートに示した少なくともいずれかの処理を並列的に実行してもよい。例えば、第１ベクトルおよび第２ベクトルのそれぞれが有するＮ個の要素の少なくとも一部が並列的に更新されるよう、ステップＳ１０４～Ｓ１０６の処理を並列的に実行してもよい。例えば、複数台の計算サーバを使って処理を並列化してもよい。複数のプロセッサによって処理を並列化してもよい。ただし、処理の並列化を実現するための実装および処理の並列化の態様を限定するものではない。

　上述のステップＳ１０５～Ｓ１０６に示した変数ｘ_ｉおよびｙ_ｉの更新処理の実行順序は、一例にしかすぎない。したがって、これとは異なる順序で変数ｘ_ｉおよびｙ_ｉの更新処理を実行してもよい。例えば、変数ｘ_ｉの更新処理と変数ｙ_ｉの更新処理が実行される順序が入れ替わっていてもよい。また、各変数の更新処理に含まれるサブ処理の順序も限定しない。例えば、変数ｙ_ｉの更新処理に含まれる加算処理の実行順序が図６の例とは異なっていてもよい。各変数の更新処理を実行するための前提となる処理の実行順序およびタイミングも特に限定しない。例えば、問題項の計算処理が、変数ｘ_ｉの更新処理を含むその他の処理と並行で実行されていてもよい。変数ｘ_ｉおよびｙ_ｉの更新処理、各変数の更新処理に含まれるサブ処理および問題項の計算処理が実行される順序およびタイミングが限定されない点は、以降に示す各フローチャートの処理についても、同様である。

［効率的な解の探索］
　シミュレーテッド分岐アルゴリズムを含む最適化問題の計算では、最適解またはそれに近い近似解（実用的な解という）を得ることが望ましい。ただし、計算処理（例えば、図６の処理）の各試行で必ず実用的な解が得られるとは限らない。例えば、計算処理の試行後に得られる解が実用的な解ではなく局所解である可能性もある。また、問題に複数の局所解が存在している可能性もある。実用的な解が見つける確率を高めるために、複数の計算ノードのそれぞれに計算処理を実行させることが考えられる。また、計算ノードが繰り返し計算処理を実行し、複数回にわたって解を探索することも可能である。さらに、前者と後者の方法とを組み合わせてもよい。

　ここで、計算ノードは、例えば、計算サーバ（情報処理装置）、プロセッサ（ＣＰＵ）、ＧＰＵ、半導体回路、仮想計算機（ＶＭ）、仮想プロセッサ、ＣＰＵスレッド、プロセスである。計算ノードは、計算処理の実行主体となりうる何らかの計算資源であればよく、その粒度、ハードウェア／ソフトウェアの区別を限定するものではない。

　ただし、それぞれの計算ノードが独立的に計算処理を実行した場合、複数の計算ノードが解空間の重複した領域を探索してしまう可能性がある。また、計算処理が繰り返される場合、計算ノードが複数の試行において解空間の同じ領域を探索することもありうる。このため、複数の計算ノードで同じ局所解が計算されたり、繰り返し同じ局所解が計算されたりする。計算処理において解空間のすべての局所解を探索し、各局所解を評価することによって最適解を見つけることが理想的である。一方、解空間に局所解が多数存在しうることを考慮すると、情報処理装置／情報処理システムが効率的な求解処理を実行し、現実的な計算時間および計算量の範囲内で実用的な解を得ることが望まれる。

　例えば、計算ノードは、計算処理の途中において、計算した第１ベクトルを記憶部に保存することができる。以降の計算処理において、計算ノードは、記憶部より以前に計算した第１ベクトルｘ^（ｍ）を読み出す。ここで、ｍは、第１ベクトルの要素が得られたタイミングを示す番号である。例えば、初回に得られた第１ベクトルは、ｍ＝１に、２回目に得られた第１ベクトルは、ｍ＝２になる。そして、計算ノードは、以前に計算した第１ベクトルｘ^（ｍ）に基づく補正処理を実行する。これにより、解空間の重複する領域を探索することを避けることができ、同じ計算時間および計算量で解空間のより広い領域を探索することが可能となる。以下では、以前に計算された第１ベクトルを探索済みベクトルとよび、更新対象の第１ベクトルと区別するものとする。

　以下では、効率的な解の探索を行うための処理の詳細について説明する。

　例えば、上述の補正項Ｇ(ｘ_１、ｘ_２、・・・ｘ_Ｎ）を使って補正処理を行うことができる。下記の式（７）は、第１ベクトルと探索済みベクトルとの間の距離の一例である。

式（７）は、Ｑ乗ノルムとよばれる。式（７）において、Ｑは任意の正値をとることができる。

　下記の式（８）は、式（７）のＱを無限大にしたものであり、無限乗ノルムとよばれる。

以下では、距離として二乗ノルムが使われている場合を例に説明する。ただし、計算で使用される距離の種類を限定するものではない。

　例えば、下記の式（９）に示すように、補正項Ｇ(ｘ_１、ｘ_２、・・・ｘ_Ｎ）に第１ベクトルと探索済みベクトルとの間の距離の逆数を含めてもよい。

この場合、計算途中の第１ベクトルが探索済みベクトルに接近すると、補正項Ｇ(ｘ_１、ｘ_２、・・・ｘ_Ｎ）の値が大きくなる。これにより、探索済みベクトル近傍の領域を避けるように第１ベクトルの更新処理を実行することが可能となる。（９）は、計算に使うことができる補正項の一例にしかすぎない。したがって、計算では、（９）とは異なる形式の補正項が使われてもよい。

　下記の式（１０）は、補正項を含む拡張ハミルトニアンＨ´の一例である。

例えば、式（１０）の係数ｃ_Ａとして任意の正値を使うことができる。また、ｋ_Ａについても、任意の正値を使うことができる。（１０）の補正項は、これまでに得られたそれぞれの探索済みベクトルを使って計算した距離の逆数の和を含んでいる。すなわち、情報処理装置の処理回路は、複数の探索済ベクトルのそれぞれを用いて距離の逆数を計算し、複数の逆数を加算することによって補正項を計算するように構成されていてもよい。これにより、これまでに得られた複数の探索済みベクトル近傍の領域を避けるように第１ベクトルの更新処理を実行することできる。

　式（１０）の拡張ハミルトニアンを使った場合、下記の（１１）に示した連立常微分方程式をそれぞれＮ個ある２つの変数ｘ_ｉ，ｙ_ｉ（ｉ＝１、２、・・・、Ｎ）について、数値的に解く処理を実行することが可能である。

　下記の（１２）は、（１０）をｘ_ｉについて偏微分したものを示している

（１０）の補正項の分母が二乗ノルムである場合、（１２）の分母の計算では、平方根の計算が不要であるため、計算量を抑制することができる。例えば、第１ベクトルの要素数がＮ、記憶部が保持している探索済みベクトルの数がＭである場合、Ｎ×Ｍの定数倍の計算量で補正項を求めることが可能である。

　シンプレクティック・オイラー法を使い、上述の（１１）を離散的な漸化式に変換し、シミュレーテッド分岐アルゴリズムの計算を行うことができる。下記の（１３）は、漸化式に変換後のシミュレーテッド分岐アルゴリズムの例を示している。

（１３）のアルゴリズムを使うと、探索済みベクトルに応じて適応的に第１ベクトルを更新することができる。

　（１３）のうち、下記の（１４）の項は、イジングエネルギーに由来する。この項の形式は、解きたい問題に応じて決まるため、問題項（ｐｒｏｂｌｅｍ　ｔｅｒｍ）とよぶものとする。

後述するように、問題項は、（１４）とは異なっていてもよい。

　図７のフローチャートは、補正項を含むアルゴリズムを使って求解を行う場合における処理の例を示している。以下では、図７を参照しながら処理を説明する。

　はじめに、計算サーバは、係数ｐ（ｔ）、ａ（ｔ）および変数ｍを初期化する（ステップＳ１１１）。例えば、ステップＳ１１１で係数ｐおよびａの値を０にすることができるが、係数ｐおよびａの初期値を限定するものではない。例えば、ステップＳ１１１で変数ｍを１に設定することができる。なお、図示されていないが、計算サーバは、図７のフローチャートの処理が開始する前に管理サーバ１より問題に対応する行列Ｊ_ｉｊおよびベクトルｈ_ｉを取得しているものとする。次に、計算サーバは、第１変数ｘ_ｉおよび第２変数ｙ_ｉを初期化する（ステップＳ１１２）。ここで、第１変数ｘ_ｉは、第１ベクトルの要素である。また、第２変数ｙ_ｉは、第２ベクトルの要素である。ステップＳ１１２で計算サーバは、例えば、擬似乱数によってｘ_ｉおよびｙ_ｉを初期化してもよい。ただし、ｘ_ｉおよびｙ_ｉの初期化の方法を限定するものではない。

　そして、計算サーバは、第１変数ｘ_ｉに対応する第２変数ｙ_ｉを重み付け加算することによって第１ベクトルを更新する（ステップＳ１１３）。例えば、ステップＳ１１３では、変数ｘ_ｉにΔｔ×Ｄ×ｙ_ｉを加算することができる。次に、計算サーバは、第２変数ｙ_ｉを更新する（ステップＳ１１４～Ｓ１１６）。例えば、ステップＳ１１４では、ｙ_ｉにΔｔ×［（ｐ－Ｄ－Ｋ×ｘ_ｉ×ｘ_ｉ）×ｘ_ｉ］を加算することができる。ステップＳ１１５では、さらにｙ_ｉに－Δｔ×ｃ×ｈ_ｉ×ａ－Δｔ×ｃ×ΣＪ_ｉｊ×ｘ_ｊを加算することができる。ステップＳ１１５は、第２変数ｙ_ｉへの問題項の加算処理に相当する。ステップＳ１１６では、ｙ_ｉに（１２）の補正項を加算することができる。補正項は、例えば、記憶部に保存されている探索済ベクトルおよび第１ベクトルに基づいて計算することが可能である。

　次に、計算サーバは、係数ｐ（第１係数）およびａの値を更新する（ステップＳ１１７）。例えば、係数ｐに一定の値（Δｐ）を加算し、係数ａを更新後の係数ｐの正の平方根に設定することができる。ただし、後述するように、これは係数ｐおよびａの値を更新方法の一例にしかすぎない。また、ループを継続するか否かの判定に変数ｔが使われる場合、変数ｔにΔｔを加算してもよい。そして、計算サーバは、第１ベクトルおよび第２ベクトルの更新回数がしきい値未満であるか否かを判定する（ステップＳ１１８）。例えば、変数ｔの値をＴと比較することによってステップＳ１１８の判定を行うことができる。ただし、その他の方法で判定を行ってもよい。

　更新回数がしきい値未満である場合（ステップＳ１１８のＹＥＳ）、計算サーバは、ステップＳ１１３～Ｓ１１７の処理を再度実行する。更新回数がしきい値以上である場合（ステップＳ１１８のＮＯ）、第１ベクトルを探索済ベクトルとして記憶部に保存し、ｍをインクリメントする（ステップＳ１１９）。そして、記憶部に保存された探索済ベクトルの数がしきい値Ｍｔｈ以上である場合、いずれかのｍについて記憶部の探索済ベクトルを削除する（ステップＳ１２０）。なお、第１ベクトルを探索済ベクトルとして記憶部に保存する処理は、ステップＳ１１３の実行後からステップＳ１１７までの間の任意のタイミングに実行されてもよい。

　次に、計算サーバは、第１ベクトルおよび第２ベクトルを上述の式（６）のハミルトニアンに代入し、ハミルトニアンの値Ｅを計算する。そして、計算サーバは、ハミルトニアンの値Ｅがしきい値Ｅ_０未満であるか否かを判定する（ステップＳ１２１）。ハミルトニアンの値Ｅがしきい値Ｅ_０未満である場合（ステップＳ１２１のＹＥＳ）、計算サーバは、第１変数ｘ_ｉに基づいて解ベクトルの要素であるスピンｓ_ｉを求めることができる（図示せず）。例えば、第１ベクトルにおいて、正値である第１変数ｘ_ｉを＋１、負値である第１変数ｘ_ｉを－１にそれぞれ変換し、解ベクトルを得ることができる。

　ステップＳ１２１の判定において、ハミルトニアンの値Ｅがしきい値Ｅ_０未満でない場合（ステップＳ１２１のＮＯ）、計算サーバは、ステップＳ１１１以降の処理を再度実行する。このように、ステップＳ１２１の判定では、最適解またはそれに近い近似解が得られたか否かの確認が行われている。このように、情報処理装置の処理回路は、ハミルトニアン（目的関数）の値に基づいて第１ベクトルおよび第２ベクトルの更新を停止するか否かを判定するように構成されていてもよい。

　ユーザは、問題の定式化で使われている符号および求解で求められている精度に応じてしきい値Ｅ_０の値を決めることができる。定式化で使われる符号によってハミルトニアンの値が極小値をとる第１ベクトルが最適解となる場合があれば、ハミルトニアンの値が極大値をとる第１ベクトルが最適解となる場合もありうる。例えば、上述の（１０）の拡張ハミルトニアンでは、値が極小値をとる第１ベクトルが最適解となる。

　なお、計算サーバは、任意のタイミングでハミルトニアンの値を計算してもよい。計算サーバは、ハミルトニアンの値ならびに、計算に使った第１ベクトルおよび第２ベクトルを記憶部に保存することができる。情報処理装置の処理回路は、更新された第２ベクトルを第３ベクトルとして記憶部に保存するように構成されていてもよい。また、処理回路は、記憶部より探索済ベクトルと同一のイタレーションに更新された第３ベクトルを読み出し、探索済ベクトルおよび第３ベクトルに基づいてハミルトニアン（目的関数）の値を計算するように構成されていてもよい。

　ユーザは、利用可能な記憶領域および計算資源の量に応じて、ハミルトニアンの値を計算する頻度を決めることができる。また、ステップＳ１１８のタイミングにおいて、記憶部に保存された第１ベクトル、第２ベクトルおよびハミルトニアンの値の組合せの数がしきい値を超えているか否かに基づきループ処理を継続するか否かの判定を行ってもよい。こうして、ユーザは、記憶部に保存された複数の探索済ベクトルより、最適解に最も近い探索済ベクトルを選択し、解ベクトルを計算することができる。

　情報処理装置の処理回路は、ハミルトニアン（目的関数）の値に基づき記憶部に保存された複数の探索済ベクトルよりいずれかの探索済ベクトルを選択し、選択した探索済ベクトルの正値である第１変数を第１値に変換し、負値である第１変数を第１値より小さい第２値に変換することによって解ベクトルを計算するように構成されていてもよい。ここで、第１値は、例えば、＋１である。第２値は、例えば、－１である。ただし、第１値および第２値は、その他の値であってもよい。

　なお、図７のフローチャートに示した少なくともいずれかの処理を並列的に実行してもよい。例えば、第１ベクトルおよび第２ベクトルがそれぞれ有するＮ個の要素の少なくとも一部が並列的に更新されるよう、ステップＳ１１３～Ｓ１１６の処理を並列的に実行してもよい。例えば、複数台の計算サーバを使って処理を並列化してもよい。複数のプロセッサによって処理を並列化してもよい。ただし、処理の並列化を実現するための実装および処理の並列化の態様を限定するものではない。

　図７のステップＳ１２０では、記憶部に保存されているいずれかの探索済ベクトルを削除する処理が実行されていた。ステップＳ１２０において、削除する探索済ベクトルをランダムに選択することができる。例えば、使用可能な記憶領域に制限がある場合、当該制限に基づき上述のしきい値Ｍｔｈを決めることができる。また、使用可能な記憶領域の制限に関わらず、記憶部で保持する探索済ベクトルの数に上限を設けることにより、ステップＳ１１６（補正項の計算）における計算量を抑制することができる。具体的には、補正項の計算処理をＮ×Ｍｔｈの定数倍の計算量以下で実行することが可能となる。

　ただし、計算サーバは、必ずステップＳ１２０の処理をスキップしてもよいし、ステップＳ１２０のタイミングでその他の処理が実行されてもよい。例えば、探索済ベクトルを別のストレージに移動させてもよい。また、計算資源が充分にある場合には、探索済ベクトルの削除処理を行わなくてもよい。

　ここでは、情報処理方法、記憶媒体およびプログラムの例について述べる。

　情報処理方法の第１の例では、記憶部と、複数の処理回路とを使って第１変数を要素とする第１ベクトルおよび第１変数に対応する第２変数を要素とする第２ベクトルを繰り返し更新する。この場合、情報処理方法は、複数の処理回路が第１変数に対応する第２変数を重み付け加算することによって第１ベクトルを更新するステップと、複数の処理回路が更新された第１ベクトルを探索済ベクトルとして記憶部に保存するステップと、複数の処理回路が第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する第２変数に加算するステップと、複数の処理回路が複数の第１変数を用いて問題項を計算し、問題項を第２変数に加算するステップと、複数の処理回路が記憶部より探索済ベクトルを読み出すステップと、複数の処理回路が更新対象の第１ベクトルと探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、複数の処理回路が補正項を第２変数に加算するステップとを含んでいてもよい。

　情報処理方法の第２の例では、記憶装置と、複数の情報処理装置とを使って第１変数を要素とする第１ベクトルおよび第１変数に対応する第２変数を要素とする第２ベクトルを繰り返し更新する。この場合、情報処理方法は、複数の情報処理装置が第１変数に対応する第２変数を重み付け加算することによって第１ベクトルを更新するステップと、複数の情報処理装置が更新された第１ベクトルを探索済ベクトルとして記憶装置に保存するステップと、複数の情報処理装置が第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する第２変数に加算するステップと、複数の情報処理装置が複数の第１変数を用いて問題項を計算し、問題項を第２変数に加算するステップと、複数の情報処理装置が記憶装置より探索済ベクトルを読み出すステップと、複数の情報処理装置が更新対象の第１ベクトルと探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、複数の情報処理装置が補正項を第２変数に加算するステップとを含んでいてもよい。

　プログラムは、例えば、第１変数を要素とする第１ベクトルおよび第１変数に対応する第２変数を要素とする第２ベクトルを繰り返し更新する。この場合、プログラムは、第１変数に対応する第２変数を重み付け加算することによって第１ベクトルを更新するステップと、更新された第１ベクトルを探索済ベクトルとして記憶部に保存するステップと、第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する第２変数に加算するステップと、複数の第１変数を用いて問題項を計算し、問題項を第２変数に加算するステップと、記憶部より探索済ベクトルを読み出すステップと、更新対象の第１ベクトルと探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、補正項を第２変数に加算するステップとをコンピュータに実行させるものであってもよい。また、記憶媒体は、上述のプログラムを格納した非一時的なコンピュータ可読な記憶媒体であってもよい。

［並列システムにおける効率的な解の探索］
　複数の計算ノードが並列的にシミュレーテッド分岐アルゴリズムを実行する場合にも上述の適応的な探索を適用することが可能である。ここで、計算ノードが計算処理の実行主体となりうる何らかの計算資源であればよく、粒度およびハードウェア／ソフトウェアの区別を限定しない点は、上述と同様である。複数の計算ノードに第１ベクトルおよび第２ベクトルの同じペアの更新処理を分担して実行させてもよい。この場合、複数の計算ノードは、同一の解ベクトルを計算するひとつのグループを形成しているといえる。また、複数の計算ノードが第１ベクトルおよび第２ベクトルの異なるペアの更新処理を実行するグループに分けられていてもよい。この場合、複数の計算ノードは、それぞれが異なる解ベクトルを計算する複数のグループに分けられているといえる。

　情報処理装置は、複数の処理回路を備えていてもよい。この場合、それぞれの処理回路は、第１ベクトルおよび第２ベクトルの異なるペアの更新処理を実行する、複数のグループに分けられていてもよい。それぞれの処理回路は、他の処理回路が記憶部に保存した探索済ベクトルを読み出すように構成されていてもよい。

　また、記憶装置７と、複数の情報処理装置とを含む情報処理システムによって第１変数を要素とする第１ベクトルおよび第１変数に対応する第２変数を要素とする第２ベクトルを繰り返し更新してもよい。この場合、それぞれの情報処理装置は、第１変数に対応する第２変数を重み付け加算することによって第１ベクトルを更新し、更新された第１ベクトルを探索済ベクトルとして記憶装置７に保存し、第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する第２変数に加算し、複数の第１変数を用いて問題項を計算し、問題項を第２変数に加算し、記憶装置７より探索済ベクトルを読み出し、更新対象の第１ベクトルと探索済ベクトルとの間の距離の逆数を含む補正項を計算し、補正項を第２変数に加算することによって第２ベクトルを更新するように構成されていてもよい。

　情報処理システムが複数の情報処理装置を含む場合、それぞれの情報処理装置は、第１ベクトルおよび第２ベクトルの異なるペアの更新処理を実行する、複数のグループに分けられていてもよい。それぞれの情報処理装置は、他の情報処理装置が記憶部に保存した探索済ベクトルを読み出すように構成されていてもよい。

　以下では、複数の計算ノードのそれぞれがシミュレーテッド分岐アルゴリズムを実行した場合に、効率的な解の探索が可能な処理の例について説明する。

　下記の式（１５）は、補正項を含まないハミルトニアンの一例である。

　例えば、それぞれの計算ノードに上述の式（１５）のハミルトニアンを使った解の計算を独立的に実行させると、複数の計算ノードが解空間の重複する領域を探索したり、複数の計算ノードが同一の局所解を得たりする可能性がある。

　そこで、異なる計算ノードが解空間の重複する領域を探索してしまうことを避けるために、下記の（１６）のような補正項を使うことができる。

（１５）および（１６）において、ｍ１は、それぞれの計算ノードの計算で使われている変数または値を示している。一方、ｍ２は、それぞれの計算ノードからみた他の計算ノードが計算で使っている変数を示している。例えば、（１６）のベクトルｘ^（ｍ１）は、自計算ノードで計算されている第１ベクトルである。一方、ベクトルｘ^（ｍ２）は、その他の計算ノードで計算された第１ベクトルである。すなわち、（１６）の補正項を使う場合、探索済ベクトルとして、その他の計算ノードで計算された第１ベクトルが使われる。また、（１６）のｃ_Ｇおよびｋ_Ｇに任意の正値を設定することができる。ｃ_Ｇとｋ_Ｇの値は、異なっていてもよい。

　例えば、（１６）の補正項を式（１５）に加算すると、下記の式（１７）の拡張ハミルトニアンが得られる。

ベクトルｘ^（ｍ１）が解空間においてベクトルｘ^（ｍ２）と近接すると、（１６）および（１７）に示した各補正項において分母の値が小さくなる。したがって、（１６）の値が大きくなり、それぞれの計算ノードでは、ベクトルｘ^（ｍ２）近傍の領域を避けるように第１ベクトルｘ^（ｍ１）の更新処理が実行されるようになる。

　式（１７）の拡張ハミルトニアンを使った場合、下記の（１８）に示した連立常微分方程式をそれぞれＮ個ある２つの変数ｘ_ｉ，ｙ_ｉ（ｉ＝１、２、・・・、Ｎ）について、数値的に解く処理を実行することができる。

　下記の（１９）は、（１７）の補正項をｘ_ｉについて偏微分したものである。

（１６）の補正項の分母が二乗ノルムである場合、（１９）の分母の計算では、平方根の計算が不要であるため、計算量を抑制することができる。（１９）の補正項は、Ｎを第１ベクトルの要素数、Ｍを他の計算ノードによる探索済ベクトルの数とすると、Ｎ×Ｍの定数倍の計算量で計算することが可能である。

　シンプレクティック・オイラー法を使い、上述の（１８）を離散的な漸化式に変換し、シミュレーテッド分岐アルゴリズムの計算を行うことができる。下記の（２０）は、漸化式に変換後のシミュレーテッド分岐アルゴリズムの例を示している。

（２０）のアルゴリズムも、上述の（１４）の問題項を含んでいる。後述するように、（２０）とは異なる形式の問題項を使ってもよい。

　例えば、情報処理装置は、複数の処理回路を備えていてもよい。それぞれの処理回路は、更新した第１ベクトルを記憶部に保存するように構成されていてもよい。これにより、各処理回路は、他の処理回路が計算した探索済ベクトルを使って補正項を計算することができる。また、それぞれの処理回路は、更新した第１ベクトルを他の処理回路に転送し、探索済ベクトルに代わり他の処理回路より受信した第１ベクトルを使って補正項を計算するように構成されていてもよい。

　図８のフローチャートは、他の計算ノードで計算された第１ベクトルを使って効率的に求解を行う場合における処理の例を示している。以下では、図８を参照しながら処理を説明する。

　はじめに、計算サーバは、管理サーバ１より問題に対応する行列Ｊ_ｉｊおよびベクトルｈ_ｉを取得し、係数ｐ（ｔ）、ａ（ｔ）および変数ｔを初期化する（ステップＳ１３１）。例えば、ステップＳ１３１でｐ、ａおよびｔの値を０にすることができる。ただし、ｐ、ａおよびｔの初期値を限定するものではない。次に、計算サーバは、ｍ１＝１～Ｍについて第１変数ｘ_ｉ ^（ｍ１）および第２変数ｙ_ｉ ^（ｍ１）を初期化する（ステップＳ１３２）。ここで、第１変数ｘ_ｉ ^（ｍ１）は、第１ベクトルの要素である。第２変数ｙ_ｉ ^（ｍ１）は、第２ベクトルの要素である。例えば、擬似乱数によってｘ_ｉ ^（ｍ１）およびｙ_ｉ ^（ｍ１）を初期化してもよい。ただし、ｘ_ｉ ^（ｍ１）およびｙ_ｉ ^（ｍ１）の初期化の方法を限定するものではない。そして、計算サーバは、カウンタ変数ｍ１に１を代入する（ステップＳ１３３）。ここで、カウンタ変数ｍ１は、計算ノードを指定する変数である。ステップＳ１３３の処理により、計算処理を行う計算ノード＃１が特定される。なお、ステップＳ１３１～Ｓ１３３の処理は、管理サーバ１など計算サーバ以外のコンピュータによって実行されてもよい。

　次に、計算ノード＃（ｍ１）は、第１変数ｘ_ｉ ^（ｍ１）に対応する第２変数ｙ_ｉ ^（ｍ１）を重み付け加算することによって第１ベクトルを更新し、更新された第１ベクトルを他の計算ノードと共有された記憶領域に保存する（ステップＳ１３４）。例えば、ステップＳ１３４では、ｘ_ｉ ^（ｍ１）にΔｔ×Ｄ×ｙ_ｉ ^（ｍ１）を加算することができる。例えば、他の計算ノードが他のプロセッサまたは他のプロセッサ上のスレッドである場合、共有メモリ３２またはストレージ３４に更新された第１ベクトルを保存することができる。また、他の計算ノードが計算サーバである場合、共有された外部ストレージに第１ベクトルを保存してもよい。他の計算ノードは、共有された記憶領域に保存された第１ベクトルを探索済ベクトルとして利用することができる。なお、ステップＳ１３４では、他の計算ノードに更新された第１ベクトルを転送してもよい。

　次に、計算ノード＃（ｍ１）は、第２変数ｙ_ｉ ^（ｍ１）を更新する（ステップＳ１３５～Ｓ１３７）。例えば、ステップＳ１３５では、ｙ_ｉ ^（ｍ１）にΔｔ×［（ｐ－Ｄ－Ｋ×ｘ_ｉ ^（ｍ１）×ｘ_ｉ ^（ｍ１））×ｘ_ｉ ^（ｍ１）］を加算することができる。ステップＳ１３６では、さらにｙ_ｉ ^（ｍ１）に－Δｔ×ｃ×ｈ_ｉ×ａ－Δｔ×ｃ×ΣＪ_ｉｊ×ｘ_ｊ ^（ｍ１）を加算することができる。ステップＳ１３６は、第２変数ｙ_ｉへの問題項の加算処理に相当する。そして、ステップＳ１３７では、変数ｙ_ｉに（１９）の補正項を加算することができる。補正項は、例えば、第１ベクトルおよび共有された記憶領域に保存されている探索済ベクトルに基づいて計算される。そして、計算サーバは、カウンタ変数ｍ１をインクリメントする（ステップＳ１３８）。

　次に、計算サーバは、カウンタ変数１がＭ以下であるか否かを判定する（ステップＳ１３９）。カウンタ変数ｍ１がＭ以下である場合（ステップＳ１３９のＹＥＳ）、ステップＳ１３４～ステップＳ１３８の処理を再び実行する。一方、カウンタ変数ｍ１がＭより大きい場合（ステップＳ１３９のＮＯ）、計算サーバは、ｐ、ａおよびｔの値を更新する（ステップＳ１４０）。例えば、ｐに一定の値（Δｐ）を加算し、ａを更新後の係数ｐの正の平方根に設定し、ｔにΔｔを加算することができる。ただし、後述するように、これはｐ、ａおよびｔの値の更新方法の一例にしかすぎない。そして、計算サーバは、第１ベクトルおよび第２ベクトルの更新回数がしきい値未満であるか否かを判定する（ステップＳ１４１）。例えば、変数ｔの値をＴと比較することによってステップＳ１４１の判定を行うことができる。ただし、その他の方法で判定を行ってもよい。

　更新回数がしきい値未満である場合（ステップＳ１４１のＹＥＳ）、計算サーバは、ステップＳ１３３の処理を実行し、指定された計算ノードがさらにステップＳ１３４以降の処理を実行する。更新回数がしきい値以上である場合（ステップＳ１４１のＮＯ）、計算サーバまたは管理サーバ１は、第１変数ｘ_ｉに基づいて解ベクトルの要素であるスピンｓ_ｉを求めることができる（図示せず）。例えば、第１ベクトルにおいて、正値である第１変数ｘ_ｉを＋１、負値である第１変数ｘ_ｉを－１にそれぞれ変換し、解ベクトルを得ることができる。

　図８のフローチャートでは、計算ノード＃１～計算ノード＃Ｍがループによって逐次第１ベクトルおよび第２ベクトルの要素の更新処理を実行している。ただし、図８のフローチャートにおけるステップＳ１３３、Ｓ１３８およびＳ１３９の処理をスキップし、代わりに複数の計算ノードにステップＳ１３４～Ｓ１３７の処理を並列的に実行させてもよい。この場合、複数の計算ノードを管理する構成要素（例えば、管理サーバ１の制御部１３またはいずれかの計算サーバ）がステップＳ１４０およびＳ１４１の処理を実行することができる。これにより、全般的な計算処理を高速化させることができる。

　ステップＳ１３４～Ｓ１３７の処理を並列的に実行する複数の計算ノードの数Ｍを限定するものではない。例えば、計算ノードの数Ｍは、第１ベクトルおよび第２ベクトルがそれぞれ有する要素数（変数の数）Ｎに等しくてもよい。この場合、Ｍ個の計算ノードを使うことによってひとつの解ベクトルを得ることができる。

　また、計算ノードの数Ｍは、第１ベクトルおよび第２ベクトルがそれぞれ有する要素数Ｎと異なる数であってもよい。例えば、計算ノードの数Ｍは、第１ベクトルおよび第２ベクトルがそれぞれ有する要素数Ｎの正の整数倍であってもよい。この場合、複数の計算ノードを使うことによってＭ／Ｎ個の解ベクトルを得ることができる。そして、複数の計算ノードは、計算対象の解ベクトルごとにグループ分けされる。このように、それぞれ異なる解ベクトルの計算を行うようにグループ化されている計算ノードどうしで、探索済ベクトルを共有し、さらに効率的な計算処理を実現してもよい。すなわちベクトルｘ^（ｍ２）は、同じグループに属する計算ノードが計算した第１ベクトルであってもよい。また、ベクトルｘ^（ｍ２）は、異なるグループに属する計算ノードが計算した第１ベクトルであってもよい。なお、異なるグループに属する計算ノード間では、処理を同期させなくてもよい。

　なお、第１ベクトルおよび第２ベクトルがそれぞれ有するＮ個の要素の少なくとも一部が並列的に更新されるよう、ステップＳ１３４～Ｓ１３７の処理を並列的に実行してもよい。ここで、処理の並列化の実装および態様を限定するものではない。

　なお、計算ノードは、任意のタイミングで第１ベクトルおよび第２ベクトルに基づいてハミルトニアンの値を計算してもよい。ハミルトニアンは、（１５）のハミルトニアンであってもよいし、（１７）の補正項を含む拡張ハミルトニアンであってもよい。また、前者と後者の両方を計算してもよい。計算ノードは、第１ベクトル、第２ベクトルおよびハミルトニアンの値を記憶部に保存することができる。これらの処理は、ステップＳ１４１の判定が肯定的である場合、毎回実行されてもよい。また、ステップＳ１４１の判定が肯定的となったタイミングのうち、一部のタイミングで実行されてもよい。さらに、上述の処理は、その他のタイミングで実行されてもよい。ユーザは、利用可能な記憶領域および計算資源の量に応じて、ハミルトニアンの値を計算する頻度を決めることができる。ステップＳ１４１のタイミングにおいて、記憶部に保存された第１ベクトル、第２ベクトルおよびハミルトニアンの値の組合せの数がしきい値を超えているか否かに基づきループ処理を継続するか否かの判定を行ってもよい。こうして、ユーザは、記憶部に保存された複数の第１ベクトル（局所解）より、最適解に最も近い第１ベクトルを選択し、解ベクトルを計算することが可能となる。

［スナップショットの利用］
　以下では、第１ベクトルおよび第２ベクトルの異なるペアの計算を行っている計算ノードのグループを跨って探索済ベクトルの共有を行うときにも適用可能な処理のその他の例について説明する。計算ノードが計算処理の実行主体となりうる何らかの計算資源であればよい。このため、計算ノードの粒度およびハードウェア／ソフトウェアの区別を限定するものではない。

　図９および図１０のフローチャートは、複数の計算ノードにおいて効率的にシミュレーテッド分岐アルゴリズムで求解を行う場合における処理の例を示している。以下では、図９および図１０を参照しながら処理を説明する。

　はじめに、計算サーバは、管理サーバ１より問題に対応する行列Ｊ_ｉｊおよびベクトルｈ_ｉを取得し、各計算ノードにこれらのデータを転送する（ステップＳ１５０）。ステップＳ１５０では、管理サーバ１が直接各計算ノードに問題に対応する行列Ｊ_ｉｊおよびベクトルｈ_ｉを転送してもよい。次に、計算サーバは、カウンタ変数ｍ１に１を代入する（ステップＳ１５１）。なお、ステップＳ１５１をスキップしてもよい。この場合、複数の計算ノードでｍ１＝１～Ｍについて並列的に後述するステップＳ１５２～Ｓ１６０の処理を実行してもよい。

　ループ処理の有無に関わらず、変数ｍ１は、情報処理システム内のそれぞれの計算ノードの番号を示すものとする。また、ｍ２は、それぞれの計算ノードからみたその他の計算ノードの番号を示しているものとする。計算ノードの数Ｍは、第１ベクトルおよび第２ベクトルがそれぞれ有する要素数Ｎに等しくてもよい。また、計算ノードの数Ｍは、第１ベクトルおよび第２ベクトルがそれぞれ有する要素数Ｎと異なる数であってもよい。さらに、計算ノードの数Ｍは、第１ベクトルおよび第２ベクトルがそれぞれ有する要素数Ｎの正の整数倍であってもよい。

　そして、各計算ノードは、変数ｔ^（ｍ１）および係数ｐ^（ｍ１）、ａ^（ｍ１）を初期化する（ステップＳ１５２）。例えば、ステップＳ１３１でｐ^（ｍ１）、ａ^（ｍ１）およびｔ^（ｍ１）の値を０にすることができる。ただし、ｐ^（ｍ１）、ａ^（ｍ１）およびｔ^（ｍ１）の初期値を限定するものではない。次に、各計算ノードは、第１変数ｘ_ｉ ^（ｍ１）および第２変数ｙ_ｉ ^（ｍ１）を初期化する（ステップＳ１５３）。ここで、第１変数ｘ_ｉ ^（ｍ１）は、第１ベクトルの要素である。第２変数ｙ_ｉ ^（ｍ１）は、第２ベクトルの要素である。ステップＳ１５３で計算サーバは、例えば、擬似乱数によってｘ_ｉ ^（ｍ１）およびｙ_ｉ ^（ｍ１）を初期化してもよい。ただし、ｘ_ｉ ^（ｍ１）およびｙ_ｉ ^（ｍ１）の初期化の方法を限定するものではない。

　そして、各計算ノードは、第１変数ｘ_ｉ ^（ｍ１）に対応する第２変数ｙ_ｉ ^（ｍ１）を重み付け加算することによって第１ベクトルを更新する（ステップＳ１５４）。例えば、ステップＳ１５４では、ｘ_ｉ ^（ｍ１）にΔｔ×Ｄ×ｙ_ｉ ^（ｍ１）を加算することができる。次に、各計算ノードは、第２変数ｙ_ｉ ^（ｍ１）を更新する（ステップＳ１５５～Ｓ１５７）。例えば、ステップＳ１５５では、ｙ_ｉ ^（ｍ１）にΔｔ×［（ｐ－Ｄ－Ｋ×ｘ_ｉ ^（ｍ１）×ｘ_ｉ ^（ｍ１））×ｘ_ｉ ^（ｍ１）］を加算することができる。ステップＳ１５６では、さらにｙ_ｉ ^（ｍ１）に－Δｔ×ｃ×ｈ_ｉ×ａ－Δｔ×ｃ×ΣＪ_ｉｊ×ｘ_ｊ ^（ｍ１）を加算することができる。ステップＳ１５６は、第２変数ｙ_ｉへの問題項の加算処理に相当する。そして、ステップＳ１５７では、第２変数ｙ_ｉに（１９）の補正項を加算することができる。各計算ノードは、例えば、第１ベクトルおよび共有された記憶領域３００に保存されている探索済ベクトルに基づいて補正項を計算する。ここで、探索済ベクトルは、異なる解ベクトルの計算を行っている計算ノードが保存したものであってもよい。また、探索済ベクトルは、同一の解ベクトルの計算を行っている計算ノードが保存したものであってもよい。

　次に、各計算ノードは、ｔ^（ｍ１）、ｐ^（ｍ１）およびａ^（ｍ１）の値を更新する（ステップＳ１５８）。例えば、ｔ^（ｍ１）にΔｔを加算し、ｐ^（ｍ１）に一定の値（Δｐ）を加算し、ａ^（ｍ１）を更新後の係数ｐの正の平方根に設定することができる。ただし、これはｐ^（ｍ１）、ａ^（ｍ１）およびｔ^（ｍ１）の値の更新方法の一例にしかすぎない。そして、各計算ノードは、記憶領域３００に第１ベクトルのスナップショットを保存する（ステップＳ１５９）。ここで、スナップショットとは、ステップＳ１５９が実行されるタイミングにおける第１ベクトルの各要素ｘ_ｉ ^（ｍ１）の値を含むデータのことをいうものとする。記憶領域３００として、複数の計算ノードからアクセス可能な記憶領域を使うことができる。また、記憶領域３００として、例えば、共有メモリ３２、ストレージ３４または外部ストレージ内の記憶領域を使うことができる。ただし、記憶領域３００を提供するメモリまたはストレージの種類を限定するものではない。記憶領域３００は、複数の種類のメモリまたはストレージの組合せであってもよい。なお、ステップＳ１５９で第１ベクトルと同じイタレーションで更新された第２ベクトルを記憶領域３００に保存してもよい。

　次に、各計算ノードは、第１ベクトルおよび第２ベクトルの更新回数がしきい値未満であるか否かを判定する（ステップＳ１６０）。例えば、変数ｔ^（ｍ１）の値をＴと比較することによってステップＳ１６０の判定を行うことができる。ただし、その他の方法で判定を行ってもよい。

　更新回数がしきい値未満である場合（ステップＳ１６０のＹＥＳ）、計算ノードは、ステップＳ１５４以降の処理を実行する。更新回数がしきい値以上である場合（ステップＳ１６０のＮＯ）、計算サーバは、カウンタ変数ｍ１をインクリメントする（ステップＳ１６１）。なお、ステップＳ１６１をスキップしてもよい。そして、計算サーバまたは管理サーバ１は、記憶領域３００に保存された少なくともいずれかの探索済ベクトルをハミルトニアンの値に基づき選択し、解ベクトルを計算することができる（ステップＳ１６２）。ハミルトニアンは、（１５）のハミルトニアンであってもよいし、（１７）の補正項を含む目的関数であってもよい。また、前者と後者の両方を計算してもよい。なお、ハミルトニアンの値は、ステップＳ１６２とは異なるタイミングに計算されてもよい。その場合、計算ノードは、ハミルトニアンの値を第１ベクトルおよび第２ベクトルとともに記憶領域３００に保存することができる。

　なお、ステップＳ１５９において、必ず毎回変数のスナップショットを記憶領域３００に保存しなくてもよい。例えば、ステップＳ１５４～Ｓ１５９のループ処理の一部の回において、変数のスナップショットを記憶領域３００に保存してもよい。これにより、記憶領域の消費を抑制することができる。

　いずれかの計算ノードで障害が発生し、計算処理が異常停止した場合、記憶領域３００に保存された第１ベクトルおよび第２ベクトルのスナップショットを使ってデータを復旧し、計算処理を再開することが可能である。記憶領域３００に第１ベクトルおよび第２ベクトルのデータを保存することは、情報処理システムの耐障害性および可用性の向上に寄与する。

　情報処理システムに複数の計算ノードが任意のタイミングで第１ベクトルの要素（および第２ベクトルの要素）を保存可能な記憶領域３００を用意することにより、各計算ノードは、タイミングを問わずステップＳ１５７において（１９）の補正項の計算および当該補正項の変数ｙ_ｉへの加算を行うことができる。（１９）の補正項の計算では、ループ処理の異なるイタレーションに計算された第１ベクトルが混在していてもよい。このため、ある計算ノードが第１ベクトルを更新中である場合、他の計算ノードは、更新前の第１ベクトルを使って補正項の計算を行うことができる。これにより、複数の計算ノード間で処理の同期処理の頻度を減らしつつ、効率的に比較的短時間で組合せ最適化問題の求解を行うことが可能となる。

　図１１は、複数の計算ノードを含む情報処理システムの例を概念的に示している。図１１には、計算ノード＃１、計算ノード＃２および計算ノード＃３が示されている。計算ノード＃１と計算ノード＃２との間で互いに探索済の第１ベクトルに関する情報が交換されている。同様に、計算ノード＃２と計算ノード＃３との間においても互いに探索済の第１ベクトルに関する情報が交換されている。なお、図示されていないものの、計算ノード＃１と計算ノード＃３との間においても互いに探索済の第１ベクトルに関する情報を交換してもよい。計算ノード＃１と計算ノード＃３との間のデータ転送は、直接行われてもよいし、計算ノード＃２を介して間接的に行われてもよい。これにより、複数の計算ノードにおいて重複した解空間における探索を行うことを避けることができる。

　図１１には、３つの計算ノードが示されている。ただし、情報処理装置または情報処理システムが備える計算ノードの数は、これとは異なっていてもよい。また、計算ノード間の接続トポロジおよび計算ノード間でデータ転送が行われる経路を限定するものではない。例えば、計算ノードがプロセッサである場合、プロセッサ間通信または共有メモリ３２を介してデータ転送を行ってもよい。また、計算ノードが計算サーバである場合、スイッチ５を含む計算サーバ間のインターコネクトを介してデータ転送を行ってもよい。なお、図１１の各計算ノードは、並行して図９および図１０のフローチャートで説明した記憶領域３００への第１ベクトルのスナップショットの保存処理を実行してもよい。

　図１２～図１４は、各計算ノードにおける拡張ハミルトニアンの値の変化の例を概念的に示している。図１２には、計算ノード＃１が計算した第１ベクトルｘ^（ｍ１）と、計算ノード＃２が計算した第１ベクトルｘ^（ｍ２）と、拡張ハミルトニアンＨ´の値とが示されている。

　例えば、計算ノード＃１が計算ノード＃２より第１ベクトルｘ^（ｍ２）のデータを取得したとする。この場合、計算ノード＃１は、取得した第１ベクトルｘ^（ｍ２）を使って（１９）の補正項を計算し、第１ベクトルおよび第２ベクトルを更新することができる。その結果、図１３に示したように、計算ノード＃１において計算ノード＃２の第１ベクトルｘ^（ｍ２）近傍において拡張ハミルトニアンの値が大きくなる。これにより、計算ノード＃１において更新される第１ベクトルｘ^（ｍ１）が解空間において計算ノード＃２の第１ベクトルｘ^（ｍ２）より離れた領域に向かう確率が高まる。

　また、計算ノード＃２が計算ノード＃１より第１ベクトルｘ^（ｍ１）のデータを取得したとする。この場合、計算ノード＃２は、取得した第１ベクトルｘ^（ｍ１）を使って（１９）の補正項を計算し、第１ベクトルおよび第２ベクトルを更新することができる。その結果、図１４に示したように、計算ノード＃２において計算ノード＃１の第１ベクトルｘ^（ｍ１）近傍において拡張ハミルトニアンの値が大きくなる。これにより、計算ノード＃２において更新される第１ベクトルｘ^（ｍ２）が解空間において計算ノード＃１の第１ベクトルｘ^（ｍ１）より離れた領域に向かう確率が高まる。

　上述のように各計算ノードにおける第１ベクトルの更新状況に応じて拡張ハミルトニアンの値を調整することにより、複数の計算ノードで解空間の重複した領域の探索を避けることができる。このため、効率的に組合せ最適化問題の解を探索することが可能となる。

　図１５のヒストグラムは、複数の計算方法において、最適解を得られるまでに必要な計算回数を示している。図１５では、４８ノード９６エッジのハミルトン閉路問題を解いた場合におけるデータが使われている。図１５の縦軸は、最適解が得られた頻度を示している。一方、図１５の横軸は、試行回数を示している。図１５において、“ＤＥＦＡＵＬＴ”は、式（３）のハミルトニアンを使って図６のフローチャートの処理を実行した場合における結果に相当する。また、“ＡＤＡＰＴＩＶＥ”は、式（１０）の拡張ハミルトニアンを使って図８のフローチャートの処理を実行した場合における結果に相当する。さらに、“ＧＲＯＵＰ”は、式（１０）の拡張ハミルトニアンを使って図９および図１０のフローチャートの処理を実行した場合における結果に相当する。

　図１５の縦軸には、異なる行列Ｊ_ｉｊおよびベクトルｈ_ｉの組合せを１０００セット用意したときに、所定の計算回数内で最適解が得られた頻度が示されている。“ＤＥＦＡＵＬＴ”の場合、計算回数は、図６のフローチャートの処理の実行回数に相当する。一方、“ＡＤＡＰＴＩＶＥ”および“ＧＲＯＵＰ”の場合、計算回数は、式（１０）における探索済ベクトルの数Ｍに相当する。図１５の例では、横軸の左側における頻度が高いほど、少ない計算回数で最適解が得られているといえる。例えば、“ＤＥＦＡＵＬＴ”の場合、１０回以下の計算回数で最適解が得られた頻度は、約２６０である。一方、“ＡＤＡＰＴＩＶＥ”の場合、１０回以下の計算回数で最適解が得られた頻度は、約２８０である。さらに、“ＧＲＯＵＰ”の場合、１０回以下の計算回数で最適解が得られた頻度は、約４３０である。したがって、“ＧＲＯＵＰ”の条件の場合には、他の場合と比べて少ない計算回数で最適解が得られる確率が高くなっている。

　本実施形態に係る情報処理装置および情報処理システムでは、探索済のベクトルに関するデータに基づき解空間の重複した領域を探索することを避けることができる。このため、解空間のより広い領域について、解の探索を行い、最適解またはそれに近い近似解が得られる確率を高めることが可能である。また、本実施形態に係る情報処理装置および情報処理システムでは、処理を並列化することが容易であり、それによって計算処理を一層効率的に実行することが可能である。これにより、ユーザに組合せ最適化問題の解を実用的な時間内で計算する情報処理装置または情報処理システムを提供することができる。

［多体相互作用の項を含む計算］
　シミュレーテッド分岐アルゴリズムを使うことにより、３次以上の目的関数を有する組合せ最適化問題を解くことも可能である。２値変数を変数とする３次以上の目的関数を最小化する変数の組合せを求める問題は、ＨＯＢＯ（Ｈｉｇｈｅｒ　Ｏｒｄｅｒ　Ｂｉｎａｒｙ　Ｏｐｔｉｍｉｚａｔｉｏｎ）問題とよばれる。ＨＯＢＯ問題を扱う場合、高次へ拡張されたイジングモデルにおけるエネルギー式として、下記の式（２１）を使うことができる。

ここで、Ｊ^（ｎ）はｎ階テンソルであり、式（１）の局所磁場ｈ_ｉと結合係数の行列Ｊを一般化させたものである。例えば、テンソルＪ^（１）は、局所磁場ｈ_ｉのベクトルに相当する。ｎ階テンソルＪ^（ｎ）では、複数の添え字に同じ値があるとき、要素の値は０となる。式（２１）では、３次の項までが示されているが、それより高次の項も式（２１）と同様に定義することができる。式（２１）は多体相互作用を含むイジングモデルのエネルギーに相当する。

　なお、ＱＵＢＯと、ＨＯＢＯはいずれも、制約なし多項式２値変数最適化（ＰＵＢＯ：Ｐｏｌｙｎｏｍｉａｌ　Ｕｎｃｏｎｓｔｒａｉｎｅｄ　Ｂｉｎａｒｙ　Ｏｐｔｉｍｉｚａｔｉｏｎ）の１種であるといえる。すなわち、ＰＵＢＯのうち、２次の目的関数を有する組合せ最適化問題は、ＱＵＢＯである。また、ＰＵＢＯのうち、３次以上の目的関数を有する組合せ最適化問題は、ＨＯＢＯであるといえる。

　シミュレーテッド分岐アルゴリズムを使ってＨＯＢＯ問題を解く場合、上述の式（３）のハミルトニアンＨを下記の式（２２）のハミルトニアンＨに置き換えればよい。

　また、式（２２）より下記の式（２３）に示した複数の第１変数を用いて問題項が導かれる。

（２３）の問題項ｚ_ｉは、（２２）の２番目の式を、いずれかの変数ｘ_ｉ（第１ベクトルの要素）について偏微分した形式をとっている。偏微分される変数ｘ_ｉは、インデックスｉによって異なる。ここで、変数ｘ_ｉのインデックスｉは、第１ベクトルの要素および第２ベクトルの要素を指定するインデックスに相当する。

　多体相互作用の項を含む計算を行う場合、上述の（２０）の漸化式は、下記の（２４）の漸化式に置き換わる。

　（２４）は、（２０）の漸化式をさらに一般化したものに相当する。同様に、上述の（１３）の漸化式においても、多体相互作用の項を使ってもよい。

　上述に示した問題項は、本実施形態による情報処理装置が使うことができる問題項の例にしかすぎない。したがって、計算で使われる問題項の形式は、これらとは異なるものであってもよい。

［アルゴリズムの変形例］
　ここでは、シミュレーテッド分岐アルゴリズムの変形例について説明する。例えば、誤差の軽減または計算時間の短縮を目的に、上述のシミュレーテッド分岐アルゴリズムに各種の変形を行ってもよい。

　例えば、計算の誤差を軽減するために、第１変数の更新時に追加の処理を実行してもよい。例えば、更新によって第１変数ｘ_ｉの絶対値が１より大きくなったとき、第１変数ｘ_ｉの値をｓｇｎ（ｘ_ｉ）に置き換える。すなわち、更新によってｘ_ｉ＞１となったとき、変数ｘ_ｉの値は１に設定される。また、更新によってｘ_ｉ＜－１となったとき、変数ｘ_ｉの値は－１に設定される。これにより、変数ｘ_ｉを使ってスピンｓ_ｉをより高い精度で近似することが可能となる。このような処理を含めることにより、アルゴリズムは、ｘ_ｉ＝±１の位置に壁があるＮ粒子の物理モデルと等価になる。より一般的に述べると、演算回路は、値が第２値より小さい第１変数を第２値に設定し、値が第１値より大きい第１変数を第１値に設定するように構成されていてもよい。

　さらに、更新によってｘ_ｉ＞１となったとき、変数ｘ_ｉに対応する変数ｙ_ｉに係数ｒｆを乗算してもよい。例えば、－１＜ｒ≦０の係数ｒｆを使うと、上記の壁は、反射係数ｒｆの壁となる。特に、ｒｆ＝０の係数ｒｆを使った場合、アルゴリズムは、ｘ_ｉ＝±１の位置に完全非弾性衝突の起こる壁がある物理モデルと等価になる。より一般的に述べると、演算回路は、値が第１値より小さい第１変数に対応する第２変数、または、第２値より大きい第１変数に対応する第２変数を、もとの第２変数に、第２係数を乗じた値に更新するように構成されていてもよい。例えば、演算回路は、値が－１より小さい第１変数に対応する第２変数、または、値が１より大きい第１変数に対応する第２変数を、もとの第２変数に第２係数を乗じた値に更新するように構成されていてもよい。ここで、第２係数は上述の係数ｒｆに相当する。

　なお、演算回路は、更新によってｘ_ｉ＞１となったとき、変数ｘ_ｉに対応する変数ｙ_ｉの値を擬似乱数に設定してもよい。例えば、［－０．１，０．１］の範囲の乱数を使うことができる。すなわち、演算回路は、値が第２値より小さい第１変数に対応する第２変数の値、または、値が第１値より大きい第１変数に対応する第２変数の値を、擬似乱数に設定するように構成されていてもよい。

　以上のようにして｜ｘ_ｉ｜＞１となることを抑止するように更新処理を実行すれば、（１３）、（２０）および（２４）の非線形項Ｋ×ｘ_ｉ ^２を除去しても、ｘ_ｉの値が発散することはなくなる。したがって、下記の（２５）に示したアルゴリズムを使うことが可能となる。

　（２５）のアルゴリズムでは、問題項において、離散変数ではなく、連続変数ｘが使われている。このため、本来の組合せ最適化問題で使われている離散変数との誤差が生ずる可能性がある。この誤差を軽減するために、下記の（２６）のように、問題項の計算において、連続変数ｘの代わりに、連続変数ｘを符号関数で変換した値ｓｇｎ（ｘ）を使うことができる。

　（２６）において、ｓｇｎ（ｘ）は、スピンｓに相当する。

　（２６）では、問題項の中の１階のテンソルを含む項の係数αを定数（例えば、α＝１）にしてもよい。（２６）のアルゴリズムでは、問題項で現れるスピンどうしの積が必ず－１または１のいずれかの値をとるため、高次の目的関数を有するＨＯＭＯ問題を扱った場合、積演算による誤差の発生を防ぐことができる。上述の（２６）のアルゴリズムのように、計算サーバが計算するデータは、さらに、変数ｓ_ｉ（ｉ＝１、２、・・・、Ｎ）を要素とするスピンのベクトル（ｓ_１，ｓ_２，・・・，ｓ_Ｎ）を含んでいてもよい。第１ベクトルのそれぞれの要素を符号関数で変換することにより、スピンのベクトルを得ることができる。

［変数の更新処理の並列化の例］
　以下では、シミュレーテッド分岐アルゴリズムの計算時における変数の更新処理の並列化の例について説明する。

　はじめに、ＰＣクラスタへシミュレーテッド分岐アルゴリズムを実装した例について説明する。ＰＣクラスタとは、複数台のコンピュータを接続し、１台のコンピュータでは得られない計算性能を実現するシステムである。例えば、図１に示した情報処理システム１００は、複数台の計算サーバおよびプロセッサを含んでおり、ＰＣクラスタとして利用することが可能である。例えば、ＰＣクラスタにおいては、ＭＰＩ（Ｍｅｓｓａｇｅ　Ｐａｓｓｉｎｇ　Ｉｎｔｅｒｆａｃｅ）を使うことにより、情報処理システム１００のような複数の計算サーバにメモリが分散して配置されている構成でも並列的な計算を実行することが可能である。例えば、ＭＰＩを使って管理サーバ１の制御プログラム１４Ｅ、各計算サーバの計算プログラム３４Ｂおよび制御プログラム３４Ｃを実装することができる。

　ＰＣクラスタで利用するプロセッサ数がＱである場合、それぞれのプロセッサに、第１ベクトル（ｘ_１，ｘ_２，・・・，ｘ_Ｎ）に含まれる変数ｘ_ｉのうち、Ｌ個の変数の計算を行わせることができる。同様に、それぞれのプロセッサに、第２ベクトル（ｙ_１，ｙ_２，・・・，ｙ_Ｎ）に含まれる変数ｙ_ｉのうち、Ｌ個の変数の計算を行わせることができる。すなわち、プロセッサ＃ｊ（ｊ＝１，２，・・・，Ｑ）は、変数｛ｘ_ｍ｜ｍ＝（ｊ－１）Ｌ＋１，（ｊ－１）Ｌ＋２，・・・，ｊＬ｝および｛ｙ_ｍ｜ｍ＝（ｊ－１）Ｌ＋１，（ｊ－１）Ｌ＋２，・・・，ｊＬ｝の計算を行う。また、プロセッサ＃ｊによる｛ｙ_ｍ｜ｍ＝（ｊ－１）Ｌ＋１，（ｊ－１）Ｌ＋２，・・・，ｊＬ｝の計算に必要な下記の（２７）に示されたテンソルＪ^（ｎ）は、プロセッサ＃ｊがアクセス可能な記憶領域（例えば、レジスタ、キャッシュ、メモリなど）に保存されるものとする。

　ここでは、それぞれのプロセッサが第１ベクトルおよび第２ベクトルの一定数の変数を計算する場合を説明した。ただし、プロセッサによって、計算対象とする第１ベクトルおよび第２ベクトルの要素（変数）の数が異なっていてもよい。例えば、計算サーバに実装されるプロセッサによって性能差がある場合、プロセッサの性能に応じて計算対象とする変数の数を決めることができる。

　変数ｙ_ｉの値を更新するためには、第１ベクトル（ｘ_１，ｘ_２，・・・，ｘ_Ｎ）のすべての成分の値が必要となる。２値変数への変換は、例えば、符号関数ｓｇｎ（）を使うことによって行うことができる。そこで、Ａｌｌｇａｔｈｅｒ関数を使い、第１ベクトル（ｘ_１，ｘ_２，・・・，ｘ_Ｎ）のすべての成分の値をＱ個のプロセッサに共有させることができる。第１ベクトル（ｘ_１，ｘ_２，・・・，ｘ_Ｎ）については、プロセッサ間での値の共有が必要であるものの、第２ベクトル（ｙ_１，ｙ_２，・・・，ｙ_Ｎ）およびテンソルＪ^（ｎ）については、プロセッサ間での値の共有を行うことは必須ではない。プロセッサ間でのデータの共有は、例えば、プロセッサ間通信を使ったり、共有メモリにデータを保存したりすることによって実現することができる。

　プロセッサ＃ｊは、問題項｛ｚ_ｍ｜ｍ＝（ｊ－１）Ｌ＋１，（ｊ－１）Ｌ＋２，・・・，ｊＬ｝の値を計算する。そして、プロセッサ＃ｊは、計算した問題項｛｛ｚ_ｍ｜ｍ＝（ｊ－１）Ｌ＋１，（ｊ－１）Ｌ＋２，・・・，ｊＬ｝の値に基づき、変数｛ｙ_ｍ｜ｍ＝（ｊ－１）Ｌ＋１，（ｊ－１）Ｌ＋２，・・・，ｊＬ｝を更新する。

　上述の各式に示したように、問題項のベクトル（ｚ_１，ｚ_２，・・・，ｚ_Ｎ）の計算では、テンソルＪ（ｎ）と、ベクトル（ｘ_１，ｘ_２，・・・，ｘ_Ｎ）との積の計算を含む、積和演算が必要である。積和演算は、上述のアルゴリズムにおいて最も計算量の大きい処理であり、計算速度の向上においてボトルネックとなりうる。そこで、ＰＣクラスタの実装では、積和演算を、Ｑ＝Ｎ／Ｌ個のプロセッサに分散して並列的に実行し、計算時間の短縮をはかることができる。

　図１６は、マルチプロセッサ構成の例を概略的に示している。図１６の複数の計算ノードは、例えば、情報処理システム１００の複数の計算サーバに相当する。また、図１６の高速リンクは、例えば、情報処理システム１００のケーブル４ａ～４ｃおよびスイッチ５によって形成された計算サーバ間のインターコネクトに相当する。図１６の共有メモリは、例えば、共有メモリ３２に相当する。図１６のプロセッサは、例えば、各計算サーバのプロセッサ３３Ａ～３３Ｄに相当している。なお、図１６には複数の計算ノードが示されているが、単一計算ノードの構成を用いることを妨げるものではない。

　図１６には、各構成要素に配置されるデータおよび構成要素間で転送されるデータが示されている。各プロセッサでは、変数ｘ_ｉ、ｙ_ｉの値が計算される。また、プロセッサと共有メモリ間では、変数ｘ_ｉが転送される。各計算ノードの共有メモリには、例えば、第１ベクトル（ｘ_１，ｘ_２，・・・，ｘ_Ｎ）、第２ベクトル（ｙ_１，ｙ_２，・・・，ｙ_Ｎ）のＬ個の変数、およびテンソルＪ^（ｎ）の一部が保存される。そして、計算ノード間を接続する高速リンクでは、例えば、第１ベクトル（ｘ_１，ｘ_２，・・・，ｘ_Ｎ）が転送される。Ａｌｌｇａｔｈｅｒ関数を使う場合、各プロセッサで変数ｙ_ｉを更新するために、第１ベクトル（ｘ_１，ｘ_２，・・・，ｘ_Ｎ）の全要素が必要となる。

　なお、図１６に示したデータの配置および転送は一例にしかすぎない。ＰＣクラスタにおけるデータの配置方法、転送方法および並列化の実現方法については、特に問わない。

　また、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）を使ってシミュレーテッド分岐アルゴリズムの計算を行ってもよい。

　図１７は、ＧＰＵを使った構成の例を概略的に示している。図１７には、互いに高速リンクで接続された複数のＧＰＵが示されている。それぞれのＧＰＵには、共有メモリにアクセス可能な複数のコアが搭載されている。また、図１７の構成例では、複数のＧＰＵが高速リンクを介して接続されており、ＧＰＵクラスタを形成している。例えば、ＧＰＵが図１のそれぞれの計算サーバに搭載されている場合、高速リンクは、ケーブル４ａ～４ｃおよびスイッチ５によって形成された計算サーバ間のインターコネクトに相当する。なお、図１７の構成例では、複数のＧＰＵが使われているが、ひとつのＧＰＵを使った場合にも、並列的な計算を実行することが可能である。すなわち、図１７のそれぞれのＧＰＵは、図１６のそれぞれの計算ノードに相当する計算を実行できる。すなわち、情報処理装置（計算サーバ）のプロセッサ（処理回路）は、Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ（ＧＰＵ）のコアであってもよい。

　ＧＰＵにおいて、変数ｘ_ｉおよびｙ_ｉ、ならびにテンソルＪ^（ｎ）はデバイス変数として定義される。ＧＰＵは、変数ｙ_ｉの更新に必要なテンソルＪ^（ｎ）と第１ベクトル（ｘ_１，ｘ_２，・・・，ｘ_Ｎ）の積を、行列ベクトル積関数によって並列的に計算することができる。なお、行列とベクトルの積演算を繰り返し実行することにより、テンソルとベクトルの積を求めることができる。また、第１ベクトル（ｘ_１，ｘ_２，・・・，ｘ_Ｎ）の計算と、第２ベクトル（ｙ_１，ｙ_２，・・・，ｙ_Ｎ）のうち、積和演算以外の部分については、それぞれのスレッドにｉ番目の要素（ｘ_ｉ，ｙ_ｉ）の更新処理を実行させ、処理の並列化を実現することができる。

［組合せ最適化問題を解くための全体的な処理］
　以下では、シミュレーテッド分岐アルゴリズムを用いて組合せ最適化問題を解くために実行される全体的な処理を説明する。

　図１８のフローチャートは、組合せ最適化問題を解くために実行される全体的な処理の例を示している。以下では、図１８を参照しながら、処理を説明する。

　はじめに、組合せ最適化問題を定式化する（ステップＳ２０１）。そして、定式化された組合せ最適化問題をイジング問題（イジングモデルの形式）に変換する（ステップＳ２０２）。次に、イジングマシン（情報処理装置）によってイジング問題の解を計算する（ステップＳ２０３）。そして、計算された解を検証する（ステップＳ２０４）。例えば、ステップＳ２０４では、制約条件が満たされているか否かの確認が行われる。また、ステップＳ２０４で目的関数の値を参照し、得られた解が最適解またはそれに近い近似解であるか否かの確認を行ってもよい。

　そして、ステップＳ２０４における検証結果または計算回数の少なくともいずれかに応じて再計算をするか否かを判定する（ステップＳ２０５）。再計算をすると判定された場合（ステップＳ２０５のＹＥＳ）、ステップＳ２０３およびＳ２０４の処理が再び実行される。一方、再計算をしないと判定された場合（ステップＳ２０５のＮＯ）、解の選択を行う（ステップＳ２０６）。例えば、ステップＳ２０６では、制約条件の充足または目的関数の値の少なくともいずれかに基づき選択を行うことができる。なお、複数の解が計算されていない場合には、ステップＳ２０６の処理をスキップしてもよい。最後に、選択した解を組合せ最適化問題の解に変換し、組合せ最適化問題の解を出力する（ステップＳ２０７）。

　上述で説明した情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムを使うことにより、組合せ最適化問題の解を実用的な時間内で計算することが可能となる。これにより、組合せ最適化問題の求解がより容易となり、社会のイノベーションおよび科学技術の進歩を促進することが可能となる。

　なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組合せてもよい。

１　管理サーバ
２　ネットワーク
３ａ、３ｂ、３ｃ　計算サーバ
４ａ、４ｂ、４ｃ　ケーブル
５　スイッチ
６　クライアント端末
１０　プロセッサ
１１　管理部
１２　変換部
１３　制御部
１４　記憶部
１４Ａ　問題データ
１４Ｂ　計算データ
１４Ｃ　管理プログラム
１４Ｄ　変換プログラム
１４Ｅ、３４Ｃ　制御プログラム
１５、３１　通信回路
１６　入力回路
１７　出力回路
１８　操作装置
１９　表示装置
２０　バス
３２　共有メモリ
３３Ａ、３３Ｂ、３３Ｃ、３３Ｄ　プロセッサ
３４　ストレージ
３４Ａ　計算データ
３４Ｂ　計算プログラム
３５　ホストバスアダプタ

Claims

　第１変数を要素とする第１ベクトルおよび前記第１変数に対応する第２変数を要素とする第２ベクトルを繰り返し更新するように構成された情報処理装置であって、
　記憶部と、
　前記第１変数に対応する前記第２変数を重み付け加算することによって前記第１ベクトルを更新し、
　更新された前記第１ベクトルを探索済ベクトルとして前記記憶部に保存し、
　前記第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する前記第２変数に加算し、複数の前記第１変数を用いて問題項を計算し、前記問題項を前記第２変数に加算し、前記記憶部より前記探索済ベクトルを読み出し、更新対象の前記第１ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算し、前記補正項を前記第２変数に加算することによって前記第２ベクトルを更新するように構成された処理回路とを備える、
　情報処理装置。
　前記処理回路は、複数の前記探索済ベクトルのそれぞれを用いて前記距離の前記逆数を計算し、複数の前記逆数を加算することによって前記補正項を計算するように構成されている、
　請求項１に記載の情報処理装置。
　複数の前記処理回路を備え、
　それぞれの前記処理回路は、他の前記処理回路が前記記憶部に保存した前記探索済ベクトルを読み出すように構成されている、
　請求項１または２に記載の情報処理装置。
　複数の前記処理回路は、それぞれが前記第１ベクトルおよび前記第２ベクトルの異なるペアの更新処理を実行する、複数のグループに分けられている、
　請求項３に記載の情報処理装置。
　複数の前記処理回路を備え、
　それぞれの前記処理回路は、更新した前記第１ベクトルを他の前記処理回路に転送し、前記探索済ベクトルに代わり他の前記処理回路より受信した前記第１ベクトルを使って前記補正項を計算するように構成されている、
　請求項１または２に記載の情報処理装置。
　前記処理回路は、更新された前記第２ベクトルを第３ベクトルとして前記記憶部に保存するように構成されている、
　請求項１ないし５のいずれか一項に記載の情報処理装置。
　前記処理回路は、前記記憶部より前記探索済ベクトルと同一のイタレーションに更新された前記第３ベクトルを読み出し、前記探索済ベクトルおよび前記第３ベクトルに基づいて目的関数の値を計算するように構成されている、
　請求項６に記載の情報処理装置。
　前記処理回路は、前記目的関数の値に基づいて前記第１ベクトルおよび前記第２ベクトルの更新を停止するか否かを判定するように構成されている、
　請求項７に記載の情報処理装置。
　前記処理回路は、前記目的関数の値に基づき前記記憶部に保存された複数の前記探索済ベクトルよりいずれかの前記探索済ベクトルを選択し、選択した前記探索済ベクトルの正値である前記第１変数を第１値に変換し、負値である前記第１変数を前記第１値より小さい第２値に変換することによって解ベクトルを計算するように構成されている、
　請求項８に記載の情報処理装置。
　前記処理回路が計算する前記問題項は、イジングモデルに基づいている、
　請求項１ないし９のいずれか一項に記載の情報処理装置。
　前記処理回路が計算する前記問題項は、多体相互作用を含んでいる、
　請求項１０に記載の情報処理装置。
　第１変数を要素とする第１ベクトルおよび前記第１変数に対応する第２変数を要素とする第２ベクトルを繰り返し更新するように構成された情報処理システムであって、
　記憶装置と、複数の情報処理装置とを備え、
　それぞれの前記情報処理装置は、第１変数に対応する前記第２変数を重み付け加算することによって前記第１ベクトルを更新し、
　更新された前記第１ベクトルを探索済ベクトルとして前記記憶装置に保存し、
　前記第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する前記第２変数に加算し、複数の前記第１変数を用いて問題項を計算し、前記問題項を前記第２変数に加算し、前記記憶装置より前記探索済ベクトルを読み出し、更新対象の前記第１ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算し、前記補正項を前記第２変数に加算することによって前記第２ベクトルを更新するように構成されている、
　情報処理システム。
　前記複数の情報処理装置は、それぞれが前記第１ベクトルおよび前記第２ベクトルの異なるペアの更新処理を実行する、複数のグループに分けられている、
　請求項１２に記載の情報処理システム。
　記憶部と、複数の処理回路とを使って第１変数を要素とする第１ベクトルおよび前記第１変数に対応する第２変数を要素とする第２ベクトルを繰り返し更新する情報処理方法であって、
　前記複数の処理回路が第１変数に対応する前記第２変数を重み付け加算することによって前記第１ベクトルを更新するステップと、
　前記複数の処理回路が更新された前記第１ベクトルを探索済ベクトルとして前記記憶部に保存するステップと、
　前記複数の処理回路が前記第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する前記第２変数に加算するステップと、
　前記複数の処理回路が複数の前記第１変数を用いて問題項を計算し、前記問題項を前記第２変数に加算するステップと、
　前記複数の処理回路が前記記憶部より前記探索済ベクトルを読み出すステップと、
　前記複数の処理回路が更新対象の前記第１ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、
　前記複数の処理回路が前記補正項を前記第２変数に加算するステップとを含む、
　情報処理方法。
　記憶装置と、複数の情報処理装置とを使って第１変数を要素とする第１ベクトルおよび前記第１変数に対応する第２変数を要素とする第２ベクトルを繰り返し更新する情報処理方法であって、
　前記複数の情報処理装置が第１変数に対応する前記第２変数を重み付け加算することによって前記第１ベクトルを更新するステップと、
　前記複数の情報処理装置が更新された前記第１ベクトルを探索済ベクトルとして前記記憶装置に保存するステップと、
　前記複数の情報処理装置が前記第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する前記第２変数に加算するステップと、
　前記複数の情報処理装置が複数の前記第１変数を用いて問題項を計算し、前記問題項を前記第２変数に加算するステップと、
　前記複数の情報処理装置が前記記憶装置より前記探索済ベクトルを読み出すステップと、
　前記複数の情報処理装置が更新対象の前記第１ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、
　前記複数の情報処理装置が前記補正項を前記第２変数に加算するステップとを含む、
　情報処理方法。
　第１変数を要素とする第１ベクトルおよび前記第１変数に対応する第２変数を要素とする第２ベクトルを繰り返し更新するプログラムであって、
　第１変数に対応する前記第２変数を重み付け加算することによって前記第１ベクトルを更新するステップと、
　更新された前記第１ベクトルを探索済ベクトルとして記憶部に保存するステップと、
　前記第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する前記第２変数に加算するステップと、
　複数の前記第１変数を用いて問題項を計算し、前記問題項を前記第２変数に加算するステップと、
　前記記憶部より前記探索済ベクトルを読み出すステップと、
　更新対象の前記第１ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、
　前記補正項を前記第２変数に加算するステップとをコンピュータに実行させるプログラムを格納している、
　非一時的なコンピュータ可読な記憶媒体。
　第１変数を要素とする第１ベクトルおよび前記第１変数に対応する第２変数を要素とする第２ベクトルを繰り返し更新するプログラムであって、
　第１変数に対応する前記第２変数を重み付け加算することによって前記第１ベクトルを更新するステップと、
　更新された前記第１ベクトルを探索済ベクトルとして記憶部に保存するステップと、
　前記第１変数を更新回数に応じて単調増加または単調減少する第１係数で重み付けし対応する前記第２変数に加算するステップと、
　複数の前記第１変数を用いて問題項を計算し、前記問題項を前記第２変数に加算するステップと、
　前記記憶部より前記探索済ベクトルを読み出すステップと、
　更新対象の前記第１ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、
　前記補正項を前記第２変数に加算するステップとをコンピュータに実行させる、
　プログラム。