JP7424493B2

JP7424493B2 - 情報処理装置および情報処理方法

Info

Publication number: JP7424493B2
Application number: JP2022534532A
Authority: JP
Inventors: 基己鈴木
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2020-07-07
Filing date: 2020-07-07
Publication date: 2024-01-30
Anticipated expiration: 2040-07-07
Also published as: US20230267174A1; WO2022009307A1; JPWO2022009307A1

Description

本発明は、所定の空間において確率分布に従うサンプルを得るためのサンプリングの制御を行う情報処理装置および情報処理方法に関する。

磁性体の統計力学的モデルの一つとして、２値を取る変数とその二次形式で与えられるハミルトニアンによって定式化されるイジングモデルがある。イジングモデルは、磁性体のスピンの振る舞いを記述する。イジングモデルは、多くの組合せ最適化問題の評価関数として応用可能である。例えば、イジングモデルに擬似焼きなまし法を適用するによって、汎用的に最適化問題を解くことができる。

例えば、特許文献１に、イジングモデルを用いて組合せ最適化問題を汎用的に解くアプローチが記載されている。また、非特許文献１に、数分割問題、グラフ分割問題、充足可能性問題、巡回セールスマン問題等を含む多種の組合せ最適化問題をイジングモデルまたはそれと等価なモデルに定式化する具体的な方法が記載されている。

ある温度Ｔにおけるイジングモデルの確率分布は、マルコフ連鎖モンテカルロ法（ＭＣＭＣ）によって計算可能である。マルコフ連鎖モンテカルロ法では、スピンが１つ選択され、スピン状態を変更する際のハミルトニアンの変化量が計算される。さらに、温度に対応したボルツマン重みに従った確率によって状態更新を受理または棄却する力学系によって、温度Ｔとハミルトニアンに従った確率分布でスピン状態がサンプリングされる。

以下、素朴な（一般的な）マルコフ連鎖モンテカルロ法をイジングモデルに適用する場合を例にして説明する。まず、記法と用語を説明する。

統計力学では、関数Ｈ（ｘ）をハミルトニアンまたはエネルギー関数と呼ぶ。ハミルトニアンが最小となる状態を基底状態と呼ぶ。

（１）式において、ｘ_ｉはｉ番目の変数である。イジングモデルでは、ｘ_ｉの値は、＋１または－１のいずれかである。統計力学では、それぞれの変数をスピンと呼ぶ。ｘはＮ個の変数全てからなるラベルである。Ｊ_ｉｊは、ｉ番目の変数とｊ番目の変数をつなぐ結合を表す定数である。

最適化の分野では、ハミルトニアンを評価関数またはコスト関数と呼ぶ。（２）式で表される基底状態を最適解と呼ぶ。非特許文献１には、多くの最適化問題に対するハミルトニアンが示されている。例えば、非特許文献１に示される方法によってＪ_ｉｊが得られる。そして、（２）式で示されるような最適解を求める。

マルコフ連鎖モンテカルロ法の目的は、温度Ｔに対して、（３）式で表される確率分布（ボルツマン分布）に従って状態ｘをサンプリングすることである。

サンプリングの動作は、
処理１．初期状態ｘをランダムに決める。
処理２．Ｎ個の変数から１つをランダムに選ぶ。
処理３．選んだ変数を－１倍（フリップ）した状態をｘ’とし、差分Δ（（４）式を参照）を計算する。フリップは、変数が１なら－１にする操作またはその逆の操作を意味する。

Δ＝Ｈ(x')－Ｈ（ｘ）・・・（４）

処理４．下記の（５）式の確率で変数をフリップする。

処理５．受理された場合は状態を更新（ｘ←ｘ’）し、そうでない場合（棄却）は状態を変更しない。
６．処理２から処理４を繰り返す。
の６つの処理からなる。

以上の動作中で、繰り返しの回数を無限回行う極限で、状態ｘの出現確率は目的であった確率分布に収束することが保証されている。

処理１～５は、マルコフ連鎖モンテカルロ法の１つの実施形態である。現在の状態から次の状態を選択する確率分布（処理２～３に相当。この確率分布を提案分布と呼ぶ。）、および処理４に現れる更新を受理する確率の選び方には任意性がある。

しかし、収束先の確率分布が目的としていた確率分布に一致するためには、釣り合いの条件およびエルゴード性の２条件を満たすように提案分布と受理確率を選ぶ必要がある。一般には、この２条件を満たした力学系を構成することは容易ではない。よく知られた手法として、メトロポリス法（上記の処理２～４に相当）または熱浴法が採用される。

マルコフ連鎖モンテカルロ法を用いる解法が使用される場合、対象とするモデルの規模が大きくなるにつれて処理時間が増大する。したがって、マルコフ連鎖モンテカルロ法を用いる解法には、処理時間を短縮させる工夫が求められる。大規模なモデルに対する力学系の処理が大規模計算機を用いて実行されることもある。大規模計算機が用いられる場合でも、処理時間を軽減するには、高い効率で処理を並列化することが重要である。

力学系の状態更新を並列化する技術が記載された文献として、例えば、特許文献２、特許文献３および非特許文献２がある。特許文献２に記載された技術は、上記の処理２に当たる部分で複数個の変数を選択し、それぞれの変数について独立に処理３～４を行う。当該技術は、処理４で受理された変数のうち１つを選択し、その変数のみ状態を更新する。処理３～４は一度の繰り返しで複数回実行されるものの、独立であるため並列化が可能である。

上述した素朴な処理と比較すると、特許文献２に記載された技術によれば、１回の繰り返しで状態が更新される頻度が高くなるので、最適化問題では解の探索効率が改善される。しかし、特許文献２では、力学系は釣り合いの条件を満たさない。よって、収束先の確率分布は不明である。また、特許文献２に記載された技術では、一般のイジングモデルにおいてボトルネックとなる差分計算（処理３）が並列数分実行される。しかし、受理されるのは多くとも１つである。他の計算結果は状態更新には利用されない。

特許文献３に記載された技術は、変数を離散値ではなく実数値とし、ハミルトン力学に基づいて状態更新を行う。ハミルトン力学は、マルコフ連鎖モンテカルロ法とは異なり、微分方程式に従う決定論的な力学系である。当該技術は、原理的に各変数の更新を並列に行うことができる。しかし、この力学系に基づくサンプリングによる状態の確率分布の収束先は不明である。さらに、確率分布の収束性も不明である。したがって、当該技術に対して、組合せ最適化問題に応用した場合としての解法の汎用性が懸念される。

非特許文献２に記載された技術は、特許文献２に記載された技術と同様に、処理２で複数個の変数を選択し、それぞれの変数について独立に処理３～４を行う。並列化されたそれぞれの処理には順序のラベルが与えられる。処理４で受理されたもののうち、最もラベルの若い処理が持つ変数のみ状態が更新され、他の変数については更新されない。すなわち、非特許文献２に記載された技術でも、特許文献２に記載された技術と同様に、差分計算（処理３）が並列に実行されるものの、最終的に受理される最大１つの変数に関する処理結果を除いて処理結果は捨てられる。なお、特許文献２に記載された処理は、複数個の変数に対して状態更新を試み、成功した１つを受理し他を捨てる投機的な方法と考えることができる。

国際公開第２０１９／０７８３５４号特開２０１８－４１３５１号公報特開２０１９－１４５０１０号公報

A. Lucas, "Ising formulations of many NP problems", Frontiers in Physics, 2014, Volume 2, Article 5 J. Knopman and J.S. Aude, "Parallel simulated annealing: an adaptive approach", Proceedings 11th International Parallel Processing Symposium, Genva, Switzerland, 1997, pp. 522-526

マルコフ連鎖モンテカルロ法を並列化する際に、特許文献２および特許文献３に記載されたような方法を用いた場合には、目的となる確率分布への収束性が破れてしまう。また、高い並列化の効率が得られない。

特許文献２および特許文献３では、目的とする確率分布の形状を変更し、最適化問題への手法を特化手法とすることで並列化が実現されている。上述したように、それらの手法では、力学系の収束先および収束性は保証されていない。よって、それらの手法では、目的の確率分布へ収束させるためのサンプリング手法としては不十分である。

また、特許文献２および非特許文献２に記載された技術は、複数個の差分計算を並列に行うことができる。しかし、最終的に受理される多くとも１つの変数以外の結果は捨てられ、このことからも、高い並列化の効率が得られない。

本発明の目的は、確率分布に従うサンプルを得る場合に、力学系の収束性と高い並列化の効率が両立しない問題を解決するサンプリングの処理手法を提供することである。

本発明による情報処理装置は、複数個の変数から選択された変数のそれぞれの状態を変化させたときの評価関数の差分を並列して計算する差分計算手段と、逐次に差分の計算が行われた場合の差分との誤差を解消するように、差分計算手段が計算した差分を修正する差分修正手段とを有する処理手段を含む。

本発明による情報処理方法は、複数個の変数から選択された変数のそれぞれの状態を変化させたときの評価関数の差分を並列して計算し、逐次に差分の計算が行われた場合の差分との誤差を解消するように、計算された差分を修正する。

本発明による情報処理プログラムは、コンピュータに、複数個の変数から選択された変数のそれぞれの状態を変化させたときの評価関数の差分を並列して計算する処理と、逐次に差分の計算が行われた場合の差分との誤差を解消するように、計算された差分を修正する処理とを実行させる。

本発明によれば、確率分布に従うサンプルを得る場合に、力学系の収束性と高い並列化の効率を両立させることができる。

情報処理装置の第１の実施形態の構成例を示すブロック図である。第１の実施形態の情報処理装置の動作を示すフローチャートである。情報処理装置の第２の実施形態の構成例を示すブロック図である。第２の実施形態の情報処理装置における処理装置の構成例を示すブロック図である。第２の実施形態における処理装置の動作を示すフローチャートである。一般的な情報処理装置によるＭＣＭＣの計算の流れを示す説明図である。第２の実施形態の情報処理装置によるＭＣＭＣの計算の流れを示す説明図である。ＣＰＵを有するコンピュータの一例を示すブロック図である。情報処理装置の主要部を示すブロック図である。他の態様の情報処理装置の主要部を示すブロック図である。

以下、本発明の実施形態を図面を参照して説明する。

実施形態１．
［構成の説明］
図１は、情報処理装置の第１の実施形態（実施形態１）の構成例を示すブロック図である。第１の実施形態の情報処理装置１００は、変数選択部１０１、差分計算部１０２、差分記憶部１０３、差分修正部１０４、遷移判定部１０５、状態更新部１０６、更新記憶部１０７、状態記憶部１０８および温度制御部１０９を備えている。差分計算部１０２は、並列動作可能なＬ個の計算部１０２_１～１０２_Ｌを含む。Ｌは、並列数を指定する定数である。Ｌは、情報処理装置１００の演算能力などに基づいてあらかじめ設定される。

以下、＋１または－１をとるＮ個の変数からなるイジングモデルと、並列数を指定する２以上Ｎ以下の定数Ｌとを用いる場合を例にする。上述した処理２で１つの変数が選択されたのに対して、本実施形態では、Ｌ個の変数が選択される。また、以下、状態更新の力学系がマルコフ連鎖モンテカルロ法である場合を例にして説明する。

変数選択部１０１は、Ｎ個の変数のうち、更新する変数をＬ個選択する。差分計算部１０２（具体的には、Ｌ個の計算部１０２_１～１０２_Ｌのそれぞれ。）は、変数選択部１０１が選択したＬ個の変数それぞれについて、変数を－１倍した際の評価関数の差分を独立に計算する。差分計算部１０２は、計算結果を差分記憶部１０３に保存する。

差分記憶部１０３は、差分計算部１０２が計算した各差分を記憶する。差分修正部１０４は、差分記憶部１０３が記憶する差分と更新記憶部１０７が記憶する状態更新部１０６で更新された変数の集合とを基に差分の修正（修正値）を計算する。

遷移判定部１０５は、差分修正部１０４が計算した差分と温度制御部１０９が制御する温度の値とに従って遷移確率を計算する。遷移判定部１０５は、その遷移確率に従って状態更新の受理／棄却を判定する。

状態更新部１０６は、遷移判定部１０５の判定に基づいて状態記憶部１０８の状態を更新する。状態更新部１０６は、更新された変数を更新記憶部１０７に保存する。更新記憶部１０７は、更新された変数を記憶する。

状態記憶部１０８は全体の変数の現在の状態を記憶する。温度制御部１０９は、擬似焼きなまし法を適用するための制御パラメータとしての温度を制御する。

［動作の説明］
次に、図２のフローチャートを参照して本実施形態の動作を説明する。

初期状態が決定されると、初期状態は状態記憶部１０８に格納される（ステップＳ１００）。なお、初期状態は、ランダムに選定される。

本実施形態では、繰り返しの回数をＭとして、以下のステップＳ１０１～ステップＳ１０６の処理がＭ回繰り返される。

まず、変数選択部１０１は、ステップＳ１０１で、状態を更新する変数をＬ個選択する。次に、差分計算部１０２（具体的には、Ｌ個の計算部１０２_１～１０２_Ｌのそれぞれ。）は、ステップＳ１０２で、ステップＳ１０１の処理で選択されたそれぞれの変数を－１倍した際の評価関数の差分を並列に計算する。差分計算部１０２は、計算結果を差分記憶部１０３に保存する。評価関数は、例えば、（６）式のように表される。評価関数の差分は、（７）式で表される。

Ｓは、全変数がとりうる全状態からなる集合である。

例えば、

ｘ_ｉは、スピン変数｛＋１，－１｝である。Ｊ_ｉｊは、スピンｉ，ｊ間の結合を表す実数である。

ｘ_ｉ ^’は、状態ｘ∈Ｓのｉ番目の変数が更新された状態を示す。

次に、ステップＳ１０３～ステップＳ１０６の処理が、ステップＳ１０１の処理で選択されたＬ個の変数（変数ｉで表される。）のそれぞれについて、順番に実行される。ステップＳ１０３～ステップＳ１０６の処理は、上述した素朴なＭＣＭＣと処理とは異なるものの、同一の力学系を再現する。

差分修正部１０４は、ステップＳ１０３で、差分記憶部１０３に記憶された変数ｉの評価関数の差分の値と、更新記憶部１０７に記憶されている、その時点までに変数状態が更新された変数ｊ（１≦ｊ≦Ｎ）の集合とを用いて、差分の修正（（８）式を参照）を、変数ｉについて計算する。この修正によって、並列化しない処理による素朴な力学系で使われる差分の値に復元され、状態更新の力学系は素朴なマルコフ連鎖モンテカルロ法による差分と一致する。

Δ^’ｆ_ｉ（ｘ（ｔ^’），ｘ（ｔ））（８）

ｘ（ｔ^’）は現在の状態を示す。ｘ（ｔ）は、ステップＳ１０２の処理で差分が計算された状態を示す。そして、Δｆ_ｉ（ｘ（ｔ^’））＝Δｆ_ｉ（ｘ（ｔ）＋Δ^’ｆ_ｉ（ｘ（ｔ^’），ｘ（ｔ））を満たすように構成される。

次に、遷移判定部１０５は、ステップＳ１０４で、差分修正部１０４が計算した差分と温度制御部１０９が制御する温度の値に従って遷移確率（（９）式を参照）を計算する。遷移判定部１０５は、ステップＳ１０５で、計算された遷移確率に従って状態更新の受理／棄却を判定する。遷移判定部１０５は、例えば、遷移確率値Ｘとした場合に、乱数生成器（図示せず）が生成した乱数ｒ（０≦ｒ≦１）を用いて、Ｘ≧ｒであるときに受理、そうでない場合に棄却、のように判定する。判定結果が「棄却」であった場合には、ステップＳ１０３に戻る。

（９）式において、Δｆは状態更新の際の評価関数の差分を示す。Ｔは温度を示す。

ステップＳ１０５での判定結果が「受理」であった場合には、ステップＳ１０６で、状態更新部１０６は、状態記憶部１０８の変数の状態を更新する。状態更新部１０６は、更新された変数を更新記憶部１０７に保存する。

Ｌ個の変数に対してステップＳ１０３～Ｓ１０６の処理が実行されたら、ステップＳ１０８に移行する（ステップＳ１０７）。実行回数がＬ未満であれば、ステップＳ１０３に戻る。

情報処理装置１００は、終了条件が成立したら処理を終了する（ステップＳ１０８）。終了条件が成立していない場合には、ステップＳ１０１に戻る。終了条件は、例えば、ステップＳ１０１の処理があらかじめ定められた所定回実行されたことや、評価関数の値があらかじめ定められた所定のしきい値を下回ったことである。ただし、それらは一例であって、他の条件が用いられてもよい。

なお、温度制御部１０９は、ステップＳ１０５の処理で遷移判定部１０５が状態更新の受理／棄却を判定する際の遷移確率における温度値を決定する。温度制御部１０９は、温度値を、例えば定数値とする、状態更新が行われる度に温度値を下げる、状態更新が行われる度に温度値を定数倍するなどの方法で制御する。

次に、本実施形態の効果を説明する。
一般には逐次的に差分計算および状態更新が順に行われるのに対して、本実施形態では、複数個の変数の状態遷移に伴う評価関数の差分が、ステップＳ１０２の処理で同時（並列）に計算される。そのように計算される差分には、状態更新が進むごとに、逐次に差分計算が行われた場合の差分との誤差が積もっていく。本実施形態では、ステップＳ１０３の処理で差分を補正することにより、状態更新の力学系を逐次に差分計算を行う場合と一致させる。差分の補正に要する計算量は、逐次に差分計算が行われる場合の計算量に対して小さい。よって、並列化による効率は高い。また、本実施形態における状態遷移の力学系は、逐次更新の場合と同様である。すなわち、本実施形態の情報処理装置は、釣り合いの条件を破ることなく、逐次に差分計算が行われる場合と同様の計算を並列に行うことができる。

換言すれば、本実施形態でのマルコフ連鎖モンテカルロ法は、力学系の収束性を確保しつつ、高い効率で並列動作する。一般的なマルコフ連鎖モンテカルロ法を用いた場合の逐次更新と同じ状態遷移規則を使いつつ、高い効率で並列化できるためである。また、本実施形態の情報処理装置は、並列化に伴って力学系を変更することなく、逐次更新と同様の状態遷移を行う。よって、並列化の効果が高まる。さらに、本実施形態の情報処理装置は、計算した差分計算の結果を修正して再利用するので、非特許文献２に記載された技術が内包する高い並列化の効率が得られないという課題も解決する。

実施形態２．
以下、第２の実施形態（実施形態２）を図面を参照して説明する。

［構成の説明］
図３は、第２の実施形態の情報処理装置の構成例を示すブロック図である。第２の実施形態の情報処理装置２００は、複数のＭＣＭＣ部２００_１～２００_ｎが環状に連結されて構成される。隣接するＭＣＭＣ部は、有線または無線の通信路で通信可能に接続されている。ＭＣＭＣ部２００_１～２００_ｎのそれぞれを、処理装置３００ともいう。

図４は、処理装置３００すなわち各ＭＣＭＣ部２００_１～２００_ｎの構成例を示すブロック図である。処理装置３００は、第１の実施形態の情報処理装置１００と比較すると、更新記憶部１０７が情報記憶部１１２に置き換えられている。また、受信部１１０と送信部１１１とが追加されている。なお、図４には示されていないが、差分計算部１０２は、並列動作可能なＬ個の計算部１０２_１～１０２_Ｌを含む。

複数のＭＣＭＣ部２００_１～２００_ｎのそれぞれには、自装置が更新を担当する複数の変数が割り当てられている。ＭＣＭＣ部２００_１～２００_ｎにおける変数選択部１０１は、割り当てられた複数の変数から更新する変数を選択する。ＭＣＭＣ部２００_１～２００_ｎのそれぞれには、変数の数をＮとすると、例えば、ＭＣＭＣ部２００_１～２００_ｎに対して、ｉ番目（１≦ｉ＜ｎ）のＭＣＭＣ部（例えば、ＭＣＭＣ部２００_１）には（Ｎ＋ｎ－１）（ｉ－１）／ｎから（Ｎ＋ｎ－１）ｉ／ｎ番目までの変数が割り当てられ、ｎ番目のＭＣＭＣ部（例えば、ＭＣＭＣ部２００_ｎ）には、（Ｎ＋ｎ－１）（ｎ－１）／ｎからＮ番目までの変数が割り当てられる。

ＭＣＭＣ部２００_１～２００_ｎのそれぞれにおいて、上述したように割り当てられた複数の変数のうちの変数選択部１０１は、更新する変数をＬ個選択する。個数Ｌを適切に定めることによって、計算速度の向上を期待できる。例えば、実際に差分計算が実行されたときの計算時間を基に二分探索でＬは最適化される。差分計算部１０２は、変数選択部１０１が選択した変数それぞれについて、状態を変更したときの評価関数の差分を計算する。差分計算部１０２は、評価関数の差分を差分記憶部１０３に保存する。

差分修正部１０４は、差分記憶部１０３に記憶された差分の値と情報記憶部１１２に記憶される他のＭＣＭＣ部が更新した変数の集合を基に差分の修正を計算する。遷移判定部１０５、状態更新部１０６および温度制御部１０９の動作は、第１の実施形態におけるそれらの動作と同じである。状態記憶部１０８は、全体の変数の現在の状態を記憶する。

受信部１１０は、他のＭＣＭＣ部の送信部１１１から送られた情報を受信して情報記憶部１１２に保存する。送信部１１１は、情報記憶部１１２の内容を他のＭＣＭＣの受信部１１０に送信する。

情報記憶部１１２は、他のＭＣＭＣ部に送信するために、遷移した変数を記憶する。また、情報記憶部１１２は、他のＭＣＭＣ部から受信した変数を記憶する。他のＭＣＭＣ部から受信した変数は、差分修正部１０４の計算で使用される。

［動作の説明］
次に、図５のフローチャートを参照して本実施形態の動作を説明する。

本実施形態では、繰り返しの回数をＭとして、以下のステップＳ１０１～ステップ１０６、およびステップＳ２０１～Ｓ２０３の処理がＭ回繰り返される。なお、ステップＳ１０１～Ｓ１０７の処理は、第１の実施形態における処理と同じである。

まず、変数選択部１０１はステップＳ１０１で、状態を更新する変数をＬ個選択する。次に、差分計算部１０２（具体的には、Ｌ個の計算部のそれぞれ。）は、ステップＳ１０２で、ステップＳ１０１の処理で選択されたそれぞれの変数について状態を更新する際の評価関数の差分を計算し、計算結果を差分記憶部１０３に保存する。評価関数は、例えば、上記の（６）式のように表される。評価関数の差分は、例えば、上記の（７）式で表される。

受信部１１０は、ステップＳ２０１で、他のＭＣＭＣ部における送信部１１１から送られる状態更新が行われた変数の集合を情報記憶部１１２に保存する。状態更新部１０６は、ステップＳ２０２で、情報記憶部１１２に記憶されている更新された変数の集合に従って状態記憶部１０８の変数を書き換える。

次に、第１の実施形態の場合と同様に、ステップＳ１０３～ステップＳ１０６の処理が、ステップＳ１０１の処理で選択されたＬ個の変数（変数ｉとする。）のそれぞれについて、順番に実行される。上述したように、ステップＳ１０３～ステップＳ１０６の処理は、背景の項目で記上述した素朴なＭＣＭＣと処理の方法がとは異なるものの、同一の力学系を再現する。

差分修正部１０４は、ステップＳ１０３で、差分記憶部１０３に記憶された変数ｉの評価関数の差分の値と、情報記憶部１１２に記憶された更新が行われた変数ｊの集合を元に差分の修正（上記の（８）式を参照）を、変数ｉについて計算する。この修正によって、並列化しない処理による素朴な力学系で使われる差分の値に復元され、状態更新の力学系は素朴なマルコフ連鎖モンテカルロ法による差分と一致する。

次に、遷移判定部１０５は、ステップＳ１０４で、差分修正部１０４で計算した差分と温度制御部１０９が制御する温度値に従って遷移確率（上記の（９）式を参照）を計算する。遷移判定部１０５は、ステップＳ１０５で、計算された確率に従って状態更新の受理／棄却を判定する。遷移判定部１０５は、例えば、遷移確率値Ｘとした場合に、乱数生成器（図示せず）が生成した乱数ｒ（０≦ｒ≦１）を用いて、Ｘ≧ｒであるときに受理、そうでない場合に棄却、のように判定する。判定結果が「棄却」であった場合には、ステップＳ１０３に戻る。

ステップＳ１０５での判定結果が「受理」であった場合には、ステップＳ１０６で、状態更新部１０６は、状態記憶部１０８の変数の状態を更新する。状態更新部１０６は、状態が更新された変数を情報記憶部１１２に保存する。

第１の実施形態の場合と同様、温度制御部１０９は、ステップＳ１０５の処理で遷移判定部１０５が状態更新の受理／棄却を判定する際の遷移確率における温度値を決定する。温度制御部１０９は、第１の実施形態の場合と同様、温度値を、例えば定数値とする、状態更新が行われる度に温度を下げる、状態更新が行われる度に温度を定数倍するなどの方法で制御する。

次に、送信部１１１は、ステップＳ２０３で、情報記憶部１１２に記憶されている、状態が更新された変数を、連結されているＭＣＭＣ部における受信部１１０に送信する。

情報処理装置１００は、終了条件が成立したら処理を終了する（ステップＳ１０８）。終了条件が成立していない場合には、ステップＳ１０１に戻る。終了条件は第１の実施形態での条件と同様である。

次に、本実施形態の効果を説明する。

図６は、素朴な（一般的な）情報処理装置によるＭＣＭＣの計算の流れを示す説明図である。図６には、情報処理装置における３つのプロセス（図６におけるＭＣＭＣ部＃１～＃３に相当）で素朴な並列化によって力学系を並列化した場合が例示されている。素朴な情報処理装置では、全てのプロセスが参加するリダクション処理における通信によって、全てのプロセスが協調して複数の差分計算を進めることになる。

なお、非特許文献２に記載された手法を用いられる場合には、状態遷移が生じた場合には、結果は破棄される。

図７は、第２の実施形態の情報処理装置によるＭＣＭＣの計算の流れを示す説明図である。図７には、第２の実施形態の情報処理装置における３つのプロセス（図７におけるＭＣＭＣ部＃１～＃３に相当）で力学系を並列化した場合が例示されている。第２の実施形態では、通信がＭＣＭＣ部同士の１対１通信で実行される。あるＭＣＭＣ部におけるステップＳ１０２の処理（差分計算処理）は、他のＭＣＭＣ部におけるステップＳ２０１の処理（受信処理）またはステップＳ２０３の処理（送信処理）と並列実行可能である。すなわち、あるプロセス（ＭＣＭＣ部）は、他のプロセス（ＭＣＭＣ部）が通信を行っているときに、ステップＳ１０２の差分計算処理を行うことができる。その結果、通信のレイテンシが隠蔽される。

第２の実施形態では、差分を修正する処理（ステップＳ１０３の処理）の分だけ計算量が増えるが、計算量の増分は差分計算の演算量に比べて小さい。よって、第２の実施形態の情報処理装置の並列化の効率は、素朴な情報処理装置の並列化の効率よりも高い。なお、第１の実施形態および第２の実施形態の手法では差分計算部１０２の構造は並列化（パイプライン化）されているが、全体の状態遷移自体は、逐次実行のマルコフ連鎖モンテカルロ法の状態遷移と等価である。

なお、第１の実施形態および第２の実施形態は、組合せ最適化問題の求解に好適に適用可能であるが、磁性体のシミュレーション等にも適用可能である。また、第１の実施形態および第２の実施形態では、イジングモデルが用いられ、マルコフ連鎖モンテカルロ法によって、ある空間(集合)の元(状態)がサンプリングされるが、第１の実施形態および第２の実施形態を、状態遷移を用いる他の手法にも適用可能である。

上記の実施形態における各構成要素は、１つのハードウェアで構成可能であるが、１つのソフトウェアでも構成可能である。また、各構成要素は、複数のハードウェアでも構成可能であり、複数のソフトウェアでも構成可能である。また、各構成要素のうちの一部をハードウェアで構成し、他部をソフトウェアで構成することもできる。

上記の実施形態における各機能（各処理）を、ＣＰＵ（Central Processing Unit ）等のプロセッサやメモリ等を有するコンピュータで実現可能である。例えば、記憶装置（記憶媒体）に上記の実施形態における方法（処理）を実施するためのプログラムを格納し、各機能を、記憶装置に格納されたプログラムをＣＰＵで実行することによって実現してもよい。

図８は、ＣＰＵを有するコンピュータの一例を示すブロック図である。コンピュータは、情報処理装置に実装される。ＣＰＵ１０００は、記憶装置１００１に格納されたプログラムに従って処理を実行することによって、上記の実施形態における各機能を実現する。すなわち、図１に示された情報処理装置１００における、変数選択部１０１、差分計算部１０２、差分修正部１０４、遷移判定部１０５、状態更新部１０６、および温度制御部１０９の機能を実現する。

また、ＣＰＵ１０００は、記憶装置１００１に格納されたプログラムに従って処理を実行することによって、図４に示された処理装置３００における、変数選択部１０１、差分計算部１０２、差分修正部１０４、遷移判定部１０５、状態更新部１０６、温度制御部１０９、受信部１１０（通信のためのハードウェア部分を除く）、および送信部１１１（通信のためのハードウェア部分を除く）の機能を実現する。

差分記憶部１０３、更新記憶部１０７、状態記憶部１０８、および情報記憶部１１２は、記憶装置１００１またはメモリ１００２で実現可能である。

記憶装置１００１は、例えば、非一時的なコンピュータ可読媒体（non-transitory computer readable medium ）である。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（tangible storage medium ）を含む。非一時的なコンピュータ可読媒体の具体例として、磁気記録媒体（例えば、ハードディスク）、光磁気記録媒体（例えば、光磁気ディスク）、ＣＤ－ＲＯＭ（Compact Disc-Read Only Memory ）、ＣＤ－Ｒ（Compact Disc-Recordable ）、ＣＤ－Ｒ／Ｗ（Compact Disc-ReWritable ）、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM ）、フラッシュＲＯＭ）がある。

また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium ）に格納されてもよい。一時的なコンピュータ可読媒体には、例えば、有線通信路または無線通信路を介して、すなわち、電気信号、光信号または電磁波を介して、プログラムが供給される。

メモリ１００２は、例えばＲＡＭ（Random Access Memory）で実現され、ＣＰＵ１０００が処理を実行するときに一時的にデータを格納する記憶手段である。メモリ１００２に、記憶装置１００１または一時的なコンピュータ可読媒体が保持するプログラムが転送され、ＣＰＵ１０００がメモリ１００２内のプログラムに基づいて処理を実行するような形態も想定しうる。

図９は、情報処理装置の主要部を示すブロック図である。図９に示す情報処理装置１０は、複数個の変数から選択された変数のそれぞれの状態を変化させたときの評価関数の差分を並列して計算する差分計算部１１（実施形態では、差分計算部１０２で実現される。）と、逐次に差分の計算が行われた場合の差分との誤差を解消するように、差分計算部１１が計算した差分を修正する差分修正部１２（実施形態では、差分修正部１０４で実現される。）とを含む処理部２０を備えている。

図１０は、他の態様の情報処理装置の主要部を示すブロック図である。図１０に示す情報処理装置３０は、複数個の変数から選択された変数のそれぞれの状態を変化させたときの評価関数の差分を並列して計算する差分計算部１１と、逐次に差分の計算が行われた場合の差分との誤差を解消するように、差分計算部１１が計算した差分を修正する差分修正部１２と、状態が更新された変数を他の情報処理装置に送信する送信部１３（実施形態では、送信部１１１で実現される。）と、状態が更新された変数を他の情報処理装置から受信する受信部１４（実施形態では、受信部１１０で実現される。）とを含み、差分修正部１２は、他の情報処理装置から受信された状態が更新された変数の集合を使用して差分を修正する。

以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

１０，３０情報処理装置
１１差分計算部
１２差分修正部
１３送信部
１４受信部
２０処理部
１００情報処理装置
１０１変数選択部
１０２差分計算部
１０２_１～１０２_Ｌ計算部
１０３差分記憶部
１０４差分修正部
１０５遷移判定部
１０６状態更新部
１０７更新記憶部
１０８状態記憶部
１０９温度制御部
１１０受信部
１１１送信部
１１２情報記憶部
２００情報処理装置
２００_１～２００_ｎＭＣＭＣ部
３００処理装置

Claims

複数個の変数から選択された変数のそれぞれの状態を変化させたときの評価関数の差分を並列して計算する差分計算手段と、
逐次に差分の計算が行われた場合の差分との誤差を解消するように、前記差分計算手段が計算した差分を修正する差分修正手段とを含む処理手段
を備えた情報処理装置。
前記処理手段は、
制御パラメータとしての温度を制御する温度制御手段と、
前記温度制御手段が出力する温度と、前記差分修正手段が修正した差分とに基づいて遷移確率を計算し、計算結果に従って変数の状態を更新する遷移制御手段とをさらに含む
請求項１に記載の情報処理装置。
前記差分計算手段は、イジングモデルの変数に関する評価関数の差分を計算し、
前記遷移制御手段は、マルコフ連鎖モンテカルロ法に基づいて変数の状態を更新する
請求項２に記載の情報処理装置。
請求項１から請求項３のうちのいずれかに記載の処理手段を複数備え、
それぞれの前記処理手段は、
状態が更新された変数を他の処理手段に送信する送信手段と、
状態が更新された変数を他の処理手段から受信する受信手段とを含み、
前記差分修正手段は、他の処理手段から受信された状態が更新された変数の集合を使用して差分を修正する
情報処理装置。
各々の処理手段における前記差分計算手段は、複数の変数からあらかじめ割り当てられた数の変数を対象として計算を行う
請求項４に記載の情報処理装置。
複数個の変数から選択された変数のそれぞれの状態を変化させたときの評価関数の差分を並列して計算し、
逐次に差分の計算が行われた場合の差分との誤差を解消するように、計算された差分を修正する
情報処理方法。
パラメータとしての温度と、修正された差分とに基づいて遷移確率を計算し、計算結果に従って変数の状態を更新する
請求項６に記載の情報処理方法。
イジングモデルの変数に関する評価関数の差分を計算し、
マルコフ連鎖モンテカルロ法に基づいて変数の状態を更新する
請求項７に記載の情報処理方法。
コンピュータに、
複数個の変数から選択された変数のそれぞれの状態を変化させたときの評価関数の差分を並列して計算する処理と、
逐次に差分の計算が行われた場合の差分との誤差を解消するように、計算された差分を修正する処理と
を実行させるための情報処理プログラム。
コンピュータに、
パラメータとしての温度と、修正された差分とに基づいて遷移確率を計算させ、
計算結果に従って変数の状態を更新させる
請求項９に記載の情報処理プログラム。