JP2021168096A

JP2021168096A - サンプリング装置、サンプリング方法及びサンプリングプログラム

Info

Publication number: JP2021168096A
Application number: JP2020071934A
Authority: JP
Inventors: 暁土手; Akira Tsuchide; 泰孝田村; Yasutaka Tamura
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-04-13
Filing date: 2020-04-13
Publication date: 2021-10-21
Also published as: US20210319154A1; EP3896622A1; CN113536229A

Abstract

【課題】サンプルの確率分布と目標分布とのずれを抑制する。
【解決手段】状態更新部１１ａは、各試行において状態遷移を発生させる。繰返し回数計算部１１ｂは、各試行において確率的に状態遷移を許容する場合の、温度Ｔが対応付けられた第１の状態変数群と温度Ｔ’が対応付けられた第２の状態変数群のそれぞれにおいて許容される状態遷移の数（Ｎ_ｆ（ｘ；β），Ｎ_ｆ（ｘ’；β’））を計数するとともに、第１の状態変数群に温度Ｔ’を対応付け、第２の状態変数群に温度Ｔを対応付けた場合に各状態変数群において許容される状態遷移の数（Ｎ_ｆ（ｘ；β’），Ｎ_ｆ（ｘ’；β））を計数する。レプリカ交換制御部１２は、計数結果に基づいて、各状態変数群に対応付ける温度Ｔと温度Ｔ’の交換前後の状態遷移の発生確率の比を計算し、その比により補正したレプリカ交換の交換確率にしたがって、温度Ｔと温度Ｔ’とを交換する。
【選択図】図１

Description

本発明は、サンプリング装置、サンプリング方法及びサンプリングプログラムに関する。

ノイマン型コンピュータが不得意とする大規模な離散最適化問題を計算する装置として、イジング型の評価関数（エネルギー関数などとも呼ばれる）を用いたイジング装置（ボルツマンマシンとも呼ばれる）がある。

イジング装置による計算では、計算対象の問題は磁性体のスピンの振る舞いを表すモデルであるイジングモデルに置き換えられる。そして、マルコフ連鎖モンテカルロ法により、イジング型の評価関数の値（イジングモデルのエネルギーに相当する）が最小となる状態の探索が行われる。以下、マルコフ連鎖モンテカルロ法を、ＭＣＭＣ（Markov-Chain Monte Carlo）法と略す。ＭＣＭＣ法では、たとえば、メトロポリス法またはギブス法で規定される状態遷移の受け入れ確率で、その状態遷移が受け入れられる。

ＭＣＭＣ法の一種として、レプリカ交換法（交換モンテカルロ法とも呼ばれる）がある。レプリカ交換法は複数の温度を用いたＭＣＭＣ処理を互いに独立に行い、ある試行回数ごとに、各ＭＣＭＣ処理で得られるエネルギーを比較し、適切な確率で２つの温度に対する状態を交換するという操作を行う方法である。レプリカ交換によれば、温度を徐々に下げていく疑似焼き鈍し法と比べて、局所解に拘束される可能性が抑えられ、全探索空間を効率よく探索できる。

ところで、ＭＣＭＣ法では、平衡状態における各状態の占有確率を示す確率分布は、目標分布（たとえば、ボルツマン分布）となる。そのため、一定温度でのＭＣＭＣ法、あるいは複数温度間で状態を交換するレプリカ交換法により、状態遷移を繰り返す過程で得られた状態または状態に基づいた値をサンプルとして出力することで、目標分布にしたがうサンプルが得られる。発生したサンプルは、たとえば、機械学習などでの期待値の計算に用いられる。

ただ、ＭＣＭＣ法では、上記の受け入れ確率が、温度が低いときの状態遷移や、エネルギーの変化量が正に大きくなる状態遷移については非常に小さくなり、同じ状態が多数回繰り返されるため、サンプリング効率が悪くなる。

従来、試行ごとに異なる状態に遷移するサンプル列を発生させるとともに、ＭＣＭＣ法を適用した場合に各状態に留まる試行回数を算出し、その回数によりサンプルに重み付けを行うことで目標分布を得る手法が提案されている（たとえば、非特許文献１参照）。

また、従来、デジタル回路を用いてレプリカ交換法を実現することで、エネルギーが最小となる状態を高速に探索する最適化装置がある（たとえば、特許文献１参照）。

特開２０１９−７１１１９号公報

Jeffrey S. Rosenthal et al., "Jump Markov Chains and Rejection-Free Metropolis Algorithms", [online], November 4, 2019, arXiv:1910.13316v2 [math.ST], ［令和２年３月１６日検索］，インターネット＜https://arxiv.org/pdf/1910.13316.pdf＞

しかし、上記のように試行ごとに状態を変化させる手法においてレプリカ交換法を適用した場合、サンプルの確率分布と目標分布とのずれが生じる場合がある。つまり、得られるサンプルが目標分布にしたがわなくなる可能性がある。

１つの側面では、本発明は、サンプルの確率分布と目標分布とのずれを抑制可能なサンプリング装置、サンプリング方法及びサンプリングプログラムを提供することを目的とする。

１つの実施態様では、イジングモデルのエネルギーを表す評価関数に含まれる複数の状態変数をそれぞれ含む複数の状態変数群の値を保持し、前記複数の状態変数群のそれぞれに対して異なる値が対応付けられた温度値と、前記複数の状態変数の何れかの値が変化することに伴う前記エネルギーの変化量とに基づいて、各試行において前記複数の状態変数の何れかの値を変えることで状態遷移を発生させる状態更新部と、前記温度値と前記変化量とに基づいて、前記各試行において確率的に前記状態遷移を許容する場合に前記状態遷移が発生するまでの繰返し回数の期待値を計算し、前記複数の状態変数群のうち、第１の温度値が対応付けられた第１の状態変数群と第２の温度値が対応付けられた第２の状態変数群のそれぞれにおいて許容される前記状態遷移の数と、前記第１の状態変数群に前記第２の温度値を対応付け、前記第２の状態変数群に前記第１の温度値を対応付けた場合に前記第１の状態変数群及び前記第２の状態変数群のそれぞれにおいて許容される前記状態遷移の数と、をそれぞれ計数する繰返し回数計算部と、前記繰返し回数計算部が計数した計数結果に基づいて、前記第１の状態変数群と前記第２の状態変数群に対応付ける前記第１の温度値と前記第２の温度値の交換前後の前記状態遷移の発生確率の比を計算し、前記比により補正したレプリカ交換の交換確率にしたがって、前記第１の温度値と前記第２の温度値とを交換する交換制御部と、前記複数の状態変数の値と前記期待値とを、所定の間隔で出力する出力部と、を有するサンプリング装置が提供される。

また、１つの実施態様では、サンプリング方法が提供される。
また、１つの実施態様では、サンプリングプログラムが提供される。

１つの側面では、本発明は、サンプルの確率分布と目標分布とのずれを抑制できる。

第１の実施の形態のサンプリング装置の一例を示す図である。第２の実施の形態のサンプリング装置の一例を示す図である。レプリカ処理部の一例を示す図である。繰返し回数計算部の一例を示す図である。あるレプリカ処理部の動作の一例の流れを示すフローチャートである。レプリカ交換コントローラの動作の一例の流れを示すフローチャートである。情報処理装置のハードウェア例を示すブロック図である。

以下、発明を実施するための形態を、図面を参照しつつ説明する。
なお、以下の例では、ボルツマン分布にしたがうようなサンプルを発生させるサンプリング装置を説明する。つまり、目標分布としてボルツマン分布を用いた場合を説明するが、適用可能な目標分布はボルツマン分布に限られるものではない。

また、サンプリング装置が出力するサンプルは、０または１の値である状態変数群により表される状態であり、ある状態におけるエネルギーは、以下の式（１）で表せるイジング型の評価関数により定義されているものとする。

右辺の１項目は、状態変数群の全状態変数の全組合せについて、漏れと重複なく、２つの状態変数の値（０または１）と重み係数（２つの状態変数の間の相互作用の強さを表す）との積を積算したものである。ｘ_ｉは、識別情報（以下インデックスという）がｉの状態変数、ｘ_ｊは、インデックス＝ｊの状態変数であり、Ｗ_ｉｊは、インデックス＝ｉ，ｊの状態変数間の相互作用の大きさを示す重み係数である。

右辺の２項目は、各インデックスについてのバイアス係数と状態変数との積の総和を求めたものである。ｂ_ｉは、インデックス＝ｉの状態変数についてのバイアス係数を示している。各重み係数やバイアス係数は、サンプリング対象に応じて与えられる。

目標分布であるボルツマン分布は、以下の式（２）で表せる。

式（２）においてｘはある状態（式（１）の状態変数群の値により表される）であり、βは、逆温度（温度の逆数）である。
また、ある状態遷移の受入れ確率として、たとえば、以下の式（３）で表せるメトロポリス法またはギブス法で規定される受入れ確率Ａ（ΔＥ）を用いることができる。

ΔＥは、その状態遷移に伴うエネルギーの変化量を表す。
なお、以下では一度の状態遷移においては、１つの状態変数の値が変化（０から１または１から０への反転）するものとし、各状態遷移をそれぞれ識別するインデックスは、１つの状態変数のインデックスと等しいものとして説明を行う。しかし、状態遷移のインデックスと状態遷移に伴い変化する状態遷移のインデックスが一致する形態に限定されるものではない。たとえば、複数の状態変数が一度に変化することによる状態遷移を扱う形態を除外するものではない。

前述のように、試行ごとに状態を変化させる（状態遷移を発生させる）手法においてレプリカ交換法を適用した場合、各状態の占有確率を示す確率分布が目標分布に収束しなくなる理由として、以下の原因が考えられる。

レプリカ交換法では、複数の温度を用いたＭＣＭＣ処理が互いに独立に行われ、ある試行回数ごとに、各ＭＣＭＣ処理で得られるエネルギーと、各ＭＣＭＣ処理で用いられる温度に基づく交換確率で、２つの温度に対する状態の交換が行われる。以下、各ＭＣＭＣ処理を、レプリカと呼ぶ。なお、レプリカ間での状態の交換と温度の交換とは同じことである。

交換確率（Ａ_{ｓｗａｐ１}）は、上記の式（２）を用いて、以下の式（４）のように表せる。

式（４）において、β，β’はある２つのレプリカにおいて用いられる２つの温度の逆数であり、ｘ，ｘ’は、各レプリカのある試行回数において得られる２つの状態である。Ｅ（ｘ），Ｅ（ｘ’）は、各状態ｘ，ｘ’におけるエネルギーである。交換確率が１より大きくならないように、ｍｉｎ関数が用いられる。

なお、交換確率が小さくなりすぎないように、レプリカ交換の候補となる２つのレプリカは、設定されている温度が近いもの（たとえば、隣接温度が設定されているもの）が選択される。

このようなレプリカ交換法では、上記のように交換確率は、温度差と各状態におけるエネルギー差によって決まる。
一方、試行ごとに状態を変化させる手法では、ＭＣＭＣ法を適用した場合に各状態に留まる試行回数（状態遷移が発生するまでの繰返し回数）の期待値が算出され、その期待値によりサンプルに重み付けが行われる。

上記のような繰返し回数の特性は、各温度間でばらつきがある。たとえば、底が平坦な局所解に状態が存在する場合には、高温の場合でも低温の場合でもエネルギー変化のない状態遷移が高確率で発生するため、繰返し回数は少なくなる。一方、底が平坦ではない局所解に状態が存在する場合には、低温の場合は状態遷移の発生が低確率となるため、繰返し回数は多くなり、高温の場合は状態遷移の発生が低温の場合よりも起こりやすくなるため、繰返し回数は少なくなる。

このため、たとえば、底が平坦な局所解に状態が存在する場合と、底が平坦ではない局所解に状態が存在する場合とで、レプリカ交換により異なる温度が適用された場合の繰返し回数の変化割合が大きく異なる可能性がある。これが、目標分布に収束しなくなる理由として考えられる。

そこで、式（４）に示すような交換確率を以下の式（５）のように補正することが提案されている（たとえば、非特許文献１参照）。

式（５）において、α（ｘ；β）は、逆温度がβであるときに状態ｘから脱出する脱出確率（状態ｘにおける状態遷移の発生確率）であり、以下の式（６）で表せる。

式（６）における分母は全状態変数の数であるＮ、分子は各状態変数の変化の受入れ確率（式（３）で表せる）の総和である。
式（５）のα（ｘ；β’）は、逆温度がβ’であるときに状態ｘから脱出する脱出確率、α（ｘ’；β）は、逆温度がβであるときに状態ｘ’から脱出する脱出確率、α（ｘ’；β’）は、逆温度がβ’であるときに状態ｘ’から脱出する脱出確率である。これらの脱出確率もそれぞれ、式（６）と同様に表せる。

α（ｘ；β’）α（ｘ’；β）／α（ｘ；β）α（ｘ’；β’）は、状態ｘが得られているレプリカに設定されているβをβ’に変え、状態ｘ’が得られているレプリカに設定されているβ’をβに変えたときの脱出確率の比を表す。

たとえば、β＜β’であり状態ｘが前述の例のように、底が平坦ではない局所解に存在する場合、温度が高いほど（逆温度が低いほど）脱出確率が高くなるため、α（ｘ；β’）＜α（ｘ；β）となる。一方、状態ｘ’が前述の例のように、底が平坦な局所解に存在する場合、温度変化後においても脱出確率はほぼ等しくなる。

したがって、このような場合、α（ｘ；β’）α（ｘ’；β）／α（ｘ；β）α（ｘ’；β’）は１以下となり、Ａ_ｓｗａｐはＡ_{ｓｗａｐ１}より小さくなり、交換の発生が抑制される。

このように、異なる温度が適用された場合の繰返し回数の変化割合が大きく異なるような交換の発生する可能性を抑制することで、目標分布への収束性の向上が期待できる。
しかしながら、α（ｘ；β’）α（ｘ’；β）／α（ｘ；β）α（ｘ’；β’）の計算は、式（６）のように、各状態変数の変化の受入れ確率の総和を計算することになるなどの理由により、計算量が多い。

以下に示す第１の実施の形態のサンプリング装置は、この点を考慮して、目標分布にしたがうサンプルを生成できるようにするものである。
（第１の実施の形態）
図１は、第１の実施の形態のサンプリング装置の一例を示す図である。

第１の実施の形態のサンプリング装置１０は、レプリカ処理部１１、レプリカ交換制御部１２を有する。
レプリカ処理部１１は、試行ごとに状態を変化させるＭＣＭＣ処理を実行する。レプリカ処理部１１は、互いに異なる温度が設定される複数のＭＣＭＣ処理（複数のレプリカ）をそれぞれ並列に処理するように複数設けられていてもよいが、第１の実施の形態では、時分割処理または、パイプライン処理により複数のレプリカの処理が行われるものとして説明する。

レプリカ処理部１１は、状態更新部１１ａ、繰返し回数計算部１１ｂ、サンプル出力部１１ｃを有する。
状態更新部１１ａは、式（１）に示すような評価関数に含まれる複数の状態変数をそれぞれ含む複数の状態変数群の値を保持する。各状態変数群の値が、前述の各レプリカの状態に相当する。

状態更新部１１ａは、複数の状態変数群のそれぞれに対して異なる値が対応付けられた温度値（温度または逆温度）と、複数の状態変数の何れかの値が変化することに伴うエネルギーの変化量とに基づいて、各試行において複数の状態変数の何れかの値を変える。すなわち、状態更新部１１ａは、前述の試行ごとに状態遷移を発生させる手法にしたがった処理を行う。

たとえば、状態更新部１１ａは、あるレプリカｒｅｐ１において、複数の状態変数のうちの１つが変化することによるエネルギーの変化量を、複数の状態変数のそれぞれについて計算する。そして、状態更新部１１ａは、各状態変数について、ｍａｘ（０，ΔＥ_ｉ（ｘ））（ｉ＝１〜Ｎ）を計算する。すなわち、エネルギーの変化量（ΔＥ_ｉ（ｘ））が負の場合にはｍａｘ（０，ΔＥ_ｉ（ｘ））＝０となり、ΔＥ_ｉ（ｘ）が正の場合にはｍａｘ（０，ΔＥ_ｉ（ｘ））＝ΔＥ_ｉ（ｘ）となる。そして、状態更新部１１ａは、各状態変数についてのｍａｘ（０，ΔＥ_ｉ（ｘ））のそれぞれに、温度値に応じたそれぞれ独立な乱数値を加算する。状態更新部１１ａは、値が変化したときに、最小値となる加算結果が得られる状態変数を更新対象とする。これにより、各試行において状態遷移が発生する。

なお、状態更新部１１ａは、たとえば、各レプリカの状態、または更新対象の状態変数の値を変化させたときのエネルギーの変化量に基づいて、各レプリカについてのエネルギーを計算する。

繰返し回数計算部１１ｂは、温度値とエネルギーの変化量とに基づいて、各試行において確率的に状態遷移を許容する場合に、状態遷移が発生するまでの繰返し回数の期待値を計算する。あるレプリカｒｅｐ１において、逆温度がβであるときに、状態ｘから遷移するまでの繰返し回数の期待値〈ｍ〉は、式（６）のα（ｘ；β）の逆数で表すことができる。式（６）のα（ｘ；β）は、各状態遷移の受入れ確率の最大値を１にするためのオフセット値として、Ｅ_ｏｆｆ（ｘ）＝ｍｉｎ［ｍａｘ（０，ΔＥ_ｉ（ｘ））］を用いて、以下の式（７）のように近似できる。

式（７）において、Ｎ_ｆ（ｘ；β）は、ある試行において、上記のように確率的に状態遷移を許容する場合に、許容された状態遷移（変化が許容された状態変数）の数（図１では“遷移許容数”と表記されている）である。

繰返し回数計算部１１ｂは、たとえば、以下のようにして、式（７）の逆数である繰返し回数の期待値〈ｍ〉を計算する。
まず、繰返し回数計算部１１ｂは、状態更新部１１ａから、各状態変数についてのｍａｘ（０，ΔＥ_ｉ（ｘ））の集合｛ｍａｘ（０，ΔＥ_ｉ（ｘ））｝を取得する。そして、繰返し回数計算部１１ｂは、その中から最小の値、すなわち上記のＥ_ｏｆｆ（ｘ）＝ｍｉｎ［ｍａｘ（０，ΔＥ_ｉ（ｘ））］を計算する。

さらに繰返し回数計算部１１ｂは、各ｍａｘ（０，ΔＥ_ｉ（ｘ））からＥ_ｏｆｆ（ｘ）を引いた値に対し、温度値に応じて取り得る値の幅が異なる負の乱数値を加えた加算結果が、０以下であるか否かを判定する。加算結果が０以下であるという判定結果は、その加算結果をもたらす状態遷移が許容されることを示し、加算結果が０より大きいという判定結果は、その加算結果をもたらす状態遷移が許容されないことを示す。そして、繰返し回数計算部１１ｂは、許容された状態遷移の数を計数することで、上記のＮ_ｆ（ｘ；β）を得る。

また、繰返し回数計算部１１ｂは、あるレプリカに対して交換先の候補となる別のレプリカの状態ｘ’に対応付けられた温度値を、状態ｘに対応付けた場合に、状態ｘにおいて許容される状態遷移の数についても同様に計数する。たとえば、繰返し回数計算部１１ｂは、交換先の候補として、βに対して隣接温度であるβ’が対応付けられているレプリカｒｅｐ２の状態ｘ’において、許容される状態遷移の数を計数して、Ｎ_ｆ（ｘ；β’）を得る。

繰返し回数計算部１１ｂは、以上のような処理を各レプリカについて、たとえば、時分割処理、またはパイプライン処理で行う。たとえば、レプリカｒｅｐ２についても同様の処理が行われ、繰返し回数の期待値〈ｍ’〉や、Ｎ_ｆ（ｘ’；β’），Ｎ_ｆ（ｘ’；β）が得られる。

サンプル出力部１１ｃは、所定間隔（サンプリング間隔）ごとに、各レプリカについての状態とエネルギーを状態更新部１１ａから取得し、繰返し回数の期待値を繰返し回数計算部１１ｂから取得し、それらを出力する。

図１の例では、サンプル出力部１１ｃは、レプリカｒｅｐ１についての、状態ｘ、エネルギーＥ（ｘ）、繰返し回数の期待値〈ｍ〉、及びレプリカｒｅｐ２についての状態ｘ’、エネルギーＥ（ｘ’）、繰返し回数の期待値〈ｍ’〉を出力している。

レプリカ交換制御部１２は、繰返し回数計算部１１ｂが計数した計数結果に基づいて、ある２つのレプリカのそれぞれの状態変数群に対応付ける温度値を交換した場合の状態遷移の発生確率（前述の脱出確率）の比を計算する。また、レプリカ交換制御部１２は、状態更新部１１ａが計算したエネルギーＥ（ｘ），Ｅ（ｘ’）を取得する。そして、レプリカ交換制御部１２は、上記の比により式（４）に示した交換確率を補正した交換確率にしたがって、それぞれの状態変数群に対応付ける温度値を交換する。

前述のように、式（４）に示した交換確率を補正した交換確率は、式（５）で表せる。式（５）において、脱出確率の比であるα（ｘ；β’）α（ｘ’；β）／α（ｘ；β）α（ｘ’；β’）は、式（７）を用いて、以下の式（８）のように近似できる。

式（８）からわかるように、脱出確率の比は、繰返し回数計算部１１ｂが計数した計数結果、Ｎ_ｆ（ｘ；β），Ｎ_ｆ（ｘ；β’），Ｎ_ｆ（ｘ’；β’），Ｎ_ｆ（ｘ’；β）を用いて近似できる。これにより、式（８）で表されるＮ_ｆ（ｘ；β’）Ｎ_ｆ（ｘ’；β）／Ｎ_ｆ（ｘ；β）Ｎ_ｆ（ｘ’；β’）を補正項として、式（４）に示した交換確率の補正が可能となる。

レプリカ交換制御部１２は、たとえば、レプリカｒｅｐ１，ｒｅｐ２において、上記の交換確率にしたがって温度値の交換を行う。交換が受け入れられたときには、レプリカｒｅｐ１の状態変数群に対して温度値として、温度Ｔ（逆温度β）の代わりに温度Ｔ’（逆温度β’）が対応付けられることになる。一方、レプリカｒｅｐ２の状態変数群に対して温度値として、温度Ｔ’（逆温度β’）の代わりに温度Ｔ（逆温度β）が対応付けられることになる。

なお、レプリカ交換において、２つのレプリカの間で、温度値を交換することと、状態変数群の値（状態）を交換することとは同じである。
上記のようなレプリカ処理部１１や、レプリカ交換制御部１２は、たとえば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの電子回路により実現可能である。または、レプリカ処理部１１や、レプリカ交換制御部１２は、ＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）などのプロセッサがプログラムを実行することで実現されるようにしてもよい。

以上説明したように、第１の実施の形態のサンプリング装置１０では、試行ごとに状態を変化させる手法においてレプリカ交換法が適用されている。試行ごとに状態を変化させるのみでは、サンプリング対象が、格子イジングモデルのように低エネルギーの状態空間が分離しているようにモデル化されている場合には、サンプルの確率分布が目標分布に収束するのに時間がかかる。一方、レプリカ交換法をさらに適用することで、状態が局所解に拘束されることを抑制でき、全探索空間を効率よく探索できるが、式（４）に示すような交換確率を用いた場合、上記の理由により、サンプルが目標分布にしたがわなくなる可能性がある。

第１の実施の形態のサンプリング装置１０は、各試行において確率的に状態遷移を許容する場合に許容される状態遷移の数の計数結果を用いて、交換前後の脱出確率の比を計算し、その比を補正項として式（４）の交換確率を補正した交換確率で交換を実施する。

これにより、前述のようなレプリカ交換法を適用した場合の弊害が是正され、サンプルの確率分布の目標分布に対するずれを抑制できる。つまり、目標分布にしたがうサンプルが生成できる。

さらに、第１の実施の形態のサンプリング装置１０では、交換前後の脱出確率の比を、式（５）のようにα（ｘ；β）などを用いて計算するのではなく、上記のような計数結果を用いて計算するため、計算量が少なくて済む。このため、計算時間を短縮できるとともに、サンプリング装置１０をＡＳＩＣやＦＰＧＡなどの電子回路により実現する場合には、回路面積の増大を抑えることができる。

なお、サンプリング装置１０によって得られるサンプルと繰返し回数の期待値を用いて、たとえば、以下の式（９）により所望の関数ｆ（ｘ）の期待値〈ｆ（ｘ）〉を推定できる。

式（９）において、〈ｍ^（ｉ）〉は、あるレプリカにおいて、ｉ（ｉ＝１〜ｎ）回目のサンプリングで得られた繰返し回数の期待値であり、ｘ^（ｉ）は、そのレプリカにおいて、ｉ回目のサンプリングで得られたサンプル（状態変数群の値）である。

サンプリング装置１０が上記のような期待値〈ｆ（ｘ）〉を計算してもよい。
また、サンプリング装置１０は、最適化問題を計算する最適化装置としても機能させることができる。その場合、最適化問題の制約条件などに応じて式（１）に示した重み係数やバイアス係数が設定される。そして、たとえば、サンプル出力部１１ｃが出力する各レプリカにおけるエネルギーに対応した状態のうち、所定回数の試行を行ったなかで最小のエネルギーに対応した状態が、最適化問題の解として出力される。

（第２の実施の形態）
図２は、第２の実施の形態のサンプリング装置の一例を示す図である。
第２の実施の形態のサンプリング装置２０は、複数のレプリカ処理部（たとえば、レプリカ処理部２１ａ，２１ｂ，２１ｃ，２１ｄ）、レプリカ交換コントローラ２２を有する。

第２の実施の形態のサンプリング装置２０では、図１に示した状態更新部１１ａ、繰返し回数計算部１１ｂ、サンプル出力部１１ｃのそれぞれが、複数のレプリカ処理部に分割して設けられている。

複数のレプリカ処理部のそれぞれは、複数の状態変数群の何れかについて、図１に示したレプリカ処理部１１と同様の処理を行い、この処理は、複数のレプリカ処理部の間で並列に実行される。なお、複数のレプリカ処理部のそれぞれは、レプリカ処理部１１と同様に、複数の状態変数群に対しての処理を、時分割処理またはパイプライン処理で行ってもよい。

レプリカ交換コントローラ２２は、第１の実施の形態のレプリカ交換制御部１２と同様の機能を有する。
図３は、レプリカ処理部の一例を示す図である。図３では、レプリカ処理部２１ａの例を示したが、他のレプリカ処理部についても同様の構成により実現できる。

レプリカ処理部２１ａは、状態更新部３０、繰返し回数計算部３１、サンプル出力部３２を有する。
状態更新部３０は、状態保持部３０ａ、エネルギー変化計算部３０ｂ、ｍａｘ［０，ΔＥ_ｉ］計算部３０ｃ、乱数生成部３０ｄ、加算器３０ｅ１，３０ｅ２，…，３０ｅＮ、更新ビット選択部３０ｆを有する。

状態保持部３０ａは、自身が処理を担当するレプリカの状態変数群の値、すなわち、式（１）に示した評価関数に含まれるＮ個の状態変数（ｘ_１〜ｘ_Ｎ）の値と、エネルギーの値を保持する。また、状態保持部３０ａは、更新ビット選択部３０ｆが出力する更新ビット（更新対象の状態変数）を示すインデックスに基づいて、状態変数の値を変更する機能も有する。さらに、状態保持部３０ａは、更新ビットのインデックスに対応するエネルギーの変化量（ΔＥ_１〜ΔＥ_Ｎの何れか）をエネルギー変化計算部３０ｂから取得し、エネルギーを更新する機能も有する。

エネルギー変化計算部３０ｂは、ある状態変数群において発生しうる複数の状態遷移のそれぞれについて、状態遷移に伴うイジングモデルのエネルギーの変化量を計算する。一度の状態遷移において、１つの状態変数の値が変化するものとした場合、エネルギー変化計算部３０ｂは、ｘ_１〜ｘ_Ｎのうちの１つが変化したときのエネルギーの変化量（ΔＥ_１，ΔＥ_２，…，ΔＥ_Ｎ）を、ｘ_１〜ｘ_Ｎのそれぞれについて計算する。

ｘ_ｉの値が変化することによるエネルギーの変化量であるΔＥ_ｉは以下の式（１０）で表せる。

式（１０）において、ｘ_ｉが１から０に変化するとき、Δｘ_ｉは−１となり、ｘ_ｉが０から１に変化するとき、Δｘ_ｉは１となる。なお、ｈ_ｉはローカルフィールド（局所場）と呼ばれ、Δｘ_ｉに応じてｈ_ｉに符号（＋１または−１）を乗じたものがΔＥ_ｉとなる。

ｈ_ｉは、更新ビットの示すインデックスに基づいて更新される。たとえば、更新ビットのインデックスがｊの場合、ｈ_ｉは、ｈ_ｉ＋Ｗ_ｉｊ・Δｘ_ｊに更新される。Ｗ_ｉｊは、図示しない記憶部に記憶されている。

ｍａｘ［０，ΔＥ_ｉ］計算部３０ｃは、ΔＥ_１〜ΔＥ_Ｎのそれぞれについて、ｍａｘ［０，ΔＥ_ｉ］を計算する。すなわち、ｍａｘ［０，ΔＥ_ｉ］計算部３０ｃは、ΔＥ_１〜ΔＥ_Ｎのうち、０以上のものをそのまま維持し、負であるものを０に更新したＮ個の更新値を出力する。

乱数生成部３０ｄは、レプリカ交換コントローラ２２から供給される温度値に基づいて、Ｎ個の乱数値を生成する。
乱数生成部３０ｄは、たとえば、メルセンヌツイスタなどを用いて、０＜ｒ_ｉ＜１の一様乱数であるｒ_ｉをＮ個生成するとともに、変換テーブルなどを用いて、ｌｏｇ（−ｌｏｇｒ_ｉ）を生成する。なお、ｒ_ｉは、たとえば１クロックサイクルごとに更新される。そして、乱数生成部３０ｄは、たとえば、供給される温度値である温度Ｔを用いて、Ｔ×ｌｏｇ（−ｌｏｇｒ_ｉ）を計算することにより、Ｎ個の乱数値を生成する。

加算器３０ｅ１〜３０ｅＮは、ｍａｘ［０，ΔＥ_ｉ］計算部３０ｃが出力するＮ個の更新値のそれぞれに、Ｎ個の乱数値の何れかを加算することでＮ個の加算結果を計算する。
更新ビット選択部３０ｆは、加算器３０ｅ１〜３０ｅＮが出力するＮ個の加算結果のうち、最小となる加算結果を検出する。そして、更新ビット選択部３０ｆは、値が変化したときに最小となる加算結果をもたらす状態変数のインデックスを更新ビットのインデックスとして出力する。これにより、その加算結果をもたらす状態遷移が発生する。

このような状態更新部３０によって、各試行において状態遷移が発生することになる。
繰返し回数計算部３１は、各試行において確率的に状態遷移を許容する場合に、状態遷移が発生するまでの繰返し回数の期待値〈ｍ〉を計算する。また、繰返し回数計算部３１は、レプリカ処理部２１ａが処理を担当するレプリカの状態ｘにおいて、変化が許容される状態変数の数を計数し、計数値であるＮ_ｆ（ｘ；β）を出力する。

また、繰返し回数計算部３１は、別のレプリカの状態ｘ’に対応付けられた温度値を、状態ｘに対応付けた場合に、状態ｘにおいて変化が許容される状態変数の数についても同様に計数し、計数結果であるＮ_ｆ（ｘ；β’）を出力する。

サンプル出力部３２は、所定間隔（サンプリング間隔）ごとに、レプリカ処理部２１ａが処理を担当するレプリカの状態ｘとエネルギーＥ（ｘ）を状態保持部３０ａから取得し、繰返し回数の期待値〈ｍ〉を繰返し回数計算部３１から取得し、それらを出力する。

ところで、各試行において状態遷移を発生させる手法では、ある試行における状態ａは、次の試行において異なる状態ｂに遷移するが、さらに次の試行においては、状態ａに戻る確率が高い。つまり、状態の変化がたとえば、｛ａ，ｂ，ａ，ｃ，ａ，ｂ，ａ，ｄ…｝（ａ，ｂ，ｃ，ｄは状態を表す）などとなる可能性がある。この場合、偶数の試行回数だけでサンプリングを行う場合、｛ａ，ａ，ａ…｝や｛ｂ，ｃ，ｂ，ｄ…｝などと偏った分布に収束してしまう可能性がある。

これを避けるために、サンプル出力部３２は、サンプリング間隔をサンプリングごとに変えてもよい。たとえば、サンプル出力部３２は、サンプリングごとに、サンプリング間隔を、偶数試行回数とするか奇数試行回数とするかを切り替えてもよいし、ランダムな試行回数としてもよい。

図４は、繰返し回数計算部の一例を示す図である。
繰返し回数計算部３１は、オフセット制御部３１ａ、乱数生成部３１ｂ、加算器３１ｃ１，３１ｃ２，…，３１ｃＮ、比較部３１ｄ、フラグビット計数部３１ｅ、期待値計算部３１ｆを有する。

オフセット制御部３１ａは、ｍａｘ［０，ΔＥ_ｉ］計算部３０ｃの出力である複数の更新値を取得する。そして、オフセット制御部３１ａは、その中から最小の値、すなわちＥ_ｏｆｆ（ｘ）＝ｍｉｎ［ｍａｘ（０，ΔＥ_ｉ（ｘ））］を計算する。さらにオフセット制御部３１ａは、各ｍａｘ（０，ΔＥ_ｉ（ｘ））からＥ_ｏｆｆ（ｘ）を引いた複数の更新値を出力する。

乱数生成部３１ｂは、状態更新部３０の乱数生成部３０ｄと同様に、レプリカ交換コントローラ２２から供給される温度値に基づいて、Ｎ個の乱数値を生成する。
たとえば、乱数生成部３１ｂは、レプリカ交換コントローラ２２から供給される温度値である温度Ｔを用いて、Ｔ×ｌｏｇｒ_ｉ（ｉ＝１〜Ｎ）を計算することにより、Ｎ個の乱数値を生成する。さらに、乱数生成部３１ｂは、レプリカ交換コントローラ２２から、別のレプリカの状態ｘ’に対応付けられた温度値である温度Ｔ’が供給された場合には、Ｔ’×ｌｏｇｒ_ｉ（ｉ＝１〜Ｎ）を計算する。

加算器３１ｃ１〜３１ｃＮは、オフセット制御部３１ａが出力するＮ個の更新値のそれぞれに、Ｎ個の乱数値の何れかを加算したＮ個の加算結果を出力する。
比較部３１ｄは、Ｎ個の加算結果のそれぞれと閾値（以下では０とする）とを比較し、Ｎ個の加算結果のそれぞれについて、０以下である場合には１、０より大きい場合には０であるＮ個のフラグビットを出力する。加算結果が０以下であるという判定結果（フラグビット＝１）は、その加算結果をもたらす状態変数の変化が許容されることを示す。加算結果が０より大きいという判定結果（フラグビット＝０）は、その加算結果をもたらす状態変数の変化が許容されないことを示す。

フラグビット計数部３１ｅは、Ｎ個のフラグビットのうち、値が１であるフラグビットの数を計数した計数値を出力する。フラグビット計数部３１ｅは、繰返し回数計算部３１にレプリカ交換コントローラ２２から温度値として、温度Ｔが供給されている場合、計数値として、Ｎ_ｆ（ｘ；β）を出力し、温度Ｔ’が供給されている場合、計数値として、Ｎ_ｆ（ｘ；β’）を出力する。

期待値計算部３１ｆは、オフセット制御部３１ａが計算したＥ_ｏｆｆ（ｘ）と、フラグビット計数部３１ｅが出力するＮ_ｆ（ｘ；β）と、レプリカ交換コントローラ２２から供給される温度Ｔとに基づいて、式（７）の逆数である期待値〈ｍ〉を計算する。式（７）において、β＝１／Ｔである。

なお、レプリカ処理部２１ａは、状態更新部３０、繰返し回数計算部３１、サンプル出力部３２の動作タイミングを制御する制御部や、レプリカ交換コントローラ２２などとの間で情報の送受信を行う通信部をさらに有しているが、図示が省略されている。

上記のようなレプリカ処理部２１ａや、レプリカ交換コントローラ２２は、たとえば、ＡＳＩＣやＦＰＧＡなどの電子回路により実現可能である。または、レプリカ処理部２１ａや、レプリカ交換コントローラ２２は、ＣＰＵやＧＰＵなどのプロセッサがプログラムを実行することで実現されるようにしてもよい。

以下、第２の実施の形態のサンプリング装置の動作例を説明する。
図５は、あるレプリカ処理部の動作の一例の流れを示すフローチャートである。なお、以下では図３に示したレプリカ処理部２１ａの動作例を示すが、他のレプリカ処理部についても同様の処理が行われる。

まず、初期化やパラメータ設定が行われる（ステップＳ１）。ステップＳ１の処理では、たとえば、状態変数（ｘ_１〜ｘ_Ｎ）の初期値の設定や、設定された状態変数の初期値と重み係数とバイアス係数に基づいたエネルギーＥ（ｘ）の初期値の計算や、ローカルフィールド（ｈ_ｉ）の初期値の計算が行われる。これらの処理は、たとえば、レプリカ交換コントローラ２２の制御のもとに行われてもよいし、レプリカ処理部２１ａ内の図示しない制御部によって行われるようにしてもよい。また、レプリカ処理部２１ａは、サンプリング装置２０の外部の装置によって計算されたこれらの初期値を取得してもよい。

各状態変数の初期値やエネルギーＥ（ｘ）の初期値は、状態保持部３０ａに保持される。さらに、ステップＳ１の処理では、レプリカ交換コントローラ２２による温度Ｔの設定や、サンプリング間隔を示すＮｓ_ｉｎｔ、レプリカ交換間隔を示すＮｒ_ｉｎｔなどのパラメータの設定が行われる。

また、状態更新部３０の図示しないカウンタは、２種類のカウンタ値（Ｎｓ，Ｎｒ）を０にする（ステップＳ２）。
そして、エネルギー変化計算部３０ｂによって、式（１０）に基づいたΔＥ_ｉの計算が行われる（ステップＳ３）。

状態更新部３０は、Ｎｓ≧Ｎｓ_ｉｎｔであるか否かを判定し（ステップＳ４）、Ｎｓ≧Ｎｓ_ｉｎｔであると判定した場合、ステップＳ５の処理が行われる。
ステップＳ５の処理では、繰返し回数計算部３１は、ｍａｘ［０，ΔＥ_ｉ］計算部３０ｃの出力と温度Ｔ（＝１／β）に基づいて、繰返し回数の期待値〈ｍ〉を計算する。なお、期待値〈ｍ〉の計算の途中で得られるＮ_ｆ（ｘ；β）は、たとえば、繰返し回数計算部３１内のレジスタなどの記憶部に記憶される。

さらに、ステップＳ５の処理において、サンプル出力部３２は、レプリカ処理部２１ａが処理を担当するレプリカの状態ｘを状態保持部３０ａから取得し、サンプルとして出力する。また、サンプル出力部３２は、エネルギーＥ（ｘ）を状態保持部３０ａから取得し、繰返し回数の期待値〈ｍ〉を繰返し回数計算部３１から取得し、それらについても出力する。

また、状態更新部３０は、Ｎｓ＝０にリセットする（ステップＳ６）。状態更新部３０は、Ｎｓ≧Ｎｓ_ｉｎｔではないと判定した場合、またはステップＳ６の処理後、ステップＳ７の処理を行う。

なお、ステップＳ５の処理中、状態更新部３０は、繰返し回数計算部３１における処理の終了を待たずに、ステップＳ６以降の処理を実行してもよい。
ステップＳ７の処理では、状態更新部３０は、Ｎｒ≧Ｎｒ_ｉｎｔであるか否かを判定する。状態更新部３０がＮｒ≧Ｎｒ_ｉｎｔであると判定した場合、レプリカ処理部２１ａ内の図示しない通信部によってレプリカ交換コントローラ２２にその旨が通知される。そして、その通信部は、レプリカ処理部２１ａから供給される交換候補の温度Ｔ’を受信する（ステップＳ８）。

繰返し回数計算部３１は、ｍａｘ［０，ΔＥ_ｉ］計算部３０ｃの出力と、Ｔ’＝（１／β’）に基づいて、Ｎ_ｆ（ｘ；β’）を計数する（ステップＳ９）。そして、図示しない通信部は、サンプル出力部３２が出力するエネルギーＥ（ｘ）と、Ｎ_ｆ（ｘ；β），Ｎ_ｆ（ｘ；β’）をレプリカ交換コントローラ２２に送信する（ステップＳ１０）。また、状態更新部３０は、Ｎｒ＝０にリセットする（ステップＳ１１）。

その後、レプリカ交換コントローラ２２によって、レプリカ処理部２１ａに設定されている温度Ｔの更新が行われない場合（ステップＳ１２：ＮＯ）、状態更新部３０の更新ビット選択部３０ｆは、更新ビットの選択を行う（ステップＳ１３）。

ステップＳ１３の処理では、更新ビット選択部３０ｆは、加算器３０ｅ１〜３０ｅＮが出力するＮ個の加算結果に基づいて、更新ビットのインデックスを出力することで、更新ビットの選択を行う。

状態保持部３０ａは、更新ビットのインデックスに基づいて、状態ｘ（状態変数群の値）と、エネルギーＥ（ｘ）を更新する（ステップＳ１４）。そして、状態更新部３０は、Ｎｒ，Ｎｓを１増加させる（ステップＳ１５）。

ステップＳ１５の処理後、または温度Ｔから温度Ｔ’への更新が行われた場合（ステップＳ１２：ＹＥＳ）、レプリカ処理部２１ａの図示しない制御部は、サンプリング処理の終了条件を満たすか否かを判定する（ステップＳ１６）。たとえば、試行回数が所定の最大試行回数に達した場合、サンプリング回数が所定の最大サンプリング回数に達した場合、またはサンプリング装置２０の外部からサンプリングの終了指示があった場合、終了条件が満たされたと判定される。

終了条件が満たされたと判定された場合、レプリカ処理部２１ａにおけるサンプリング処理が終了し、終了条件が満たされていないと判定された場合、ステップＳ３からの処理が繰り返される。

図６は、レプリカ交換コントローラの動作の一例の流れを示すフローチャートである。
レプリカ交換コントローラ２２は、たとえば、サンプリング装置２０に含まれる全レプリカ処理部から、Ｎｒ≧Ｎｒ_ｉｎｔである旨の通知を受けた場合、以下の処理を開始する。なお、レプリカ交換コントローラ２２は、割り込み処理により、所定の割り込みタイミングで、以下の処理を開始してもよい。

レプリカ交換コントローラ２２は、交換候補の温度Ｔ，Ｔ’を設定する（ステップＳ２０）。交換確率が小さくなりすぎないように、レプリカ交換の対象となる２つのレプリカは、設定されている温度が近いもの（たとえば、隣接温度が設定されるもの）が選択される。そして、選択された２つのレプリカに設定されている温度Ｔ，Ｔ’が交換候補として設定される。

以下では、図２に示した複数のレプリカ処理部のうち、レプリカ処理部２１ａが処理を担当するレプリカに温度Ｔが設定されており、レプリカ処理部２１ｂが処理を担当するレプリカに温度Ｔ’が設定されているものとする。

レプリカ交換コントローラ２２は、温度Ｔ’を、レプリカ処理部２１ａに送信し、温度Ｔを、レプリカ処理部２１ｂに送信する（ステップＳ２１）。
そして、レプリカ交換コントローラ２２は、図５に示したような処理により、レプリカ処理部２１ａが送信するエネルギーＥ（ｘ）と、Ｎ_ｆ（ｘ；β），Ｎ_ｆ（ｘ；β’）を受信する。また、レプリカ処理部２１ｂからも同様の処理により、エネルギーＥ（ｘ’）と、Ｎ_ｆ（ｘ’；β’），Ｎ_ｆ（ｘ’；β）を受信する（ステップＳ２２）。

その後、レプリカ交換コントローラ２２は、脱出確率の比を式（８）のように表した補正項を用いて、式（５）の交換確率を計算する（ステップＳ２３）。そして、レプリカ交換コントローラ２２は、計算した交換確率に基づいて、レプリカ処理部２１ａ，２１ｂに設定する温度を交換するか否かを判定する（ステップＳ２４）。

温度を交換すると判定した場合、レプリカ交換コントローラ２２は、レプリカ処理部２１ａに更新温度として温度Ｔ’を送信し、レプリカ処理部２１ｂに更新温度として温度Ｔを送信する（ステップＳ２５）。なお、レプリカ交換コントローラ２２は、更新温度を送信する代わりに、ステップＳ２１で送信した温度を、更新温度として設定するようにレプリカ処理部２１ａ，２１ｂに指示するようにしてもよい。

ステップＳ２４の処理で、温度を交換しないと判定された場合、またはステップＳ２５の処理後、レプリカ処理部２１ａ，２１ｂに対する１回のレプリカ交換処理が終了する。
レプリカ交換コントローラ２２は、レプリカ交換の対象とする複数のレプリカ組に対して、上記と同様の処理を並列に行ってもよい。

なお、図５、図６に示した各処理ステップの順序は上記の例に限定されず、適宜順序を入れ替えてもよい。
以上説明したように、第２の実施の形態のサンプリング装置２０でも第１の実施の形態のサンプリング装置１０と同様に、確率的に状態遷移を許容する場合の許容される状態遷移の数（上記のＮ_ｆ（ｘ；β），Ｎ_ｆ（ｘ；β’））を用いて交換確率を補正する。このため、第１の実施の形態のサンプリング装置１０と同様の効果が得られる。

さらに、第２の実施の形態のサンプリング装置２０では、複数のレプリカ処理部を用いた複数のレプリカについての処理が並列に実行できるため、サンプリング処理を高速化できる。

なお、前述のように、複数のレプリカ処理部やレプリカ交換コントローラ２２は、ＣＰＵやＧＰＵなどのプロセッサがプログラムを実行することでも実現できる。その場合、サンプリング装置２０は、たとえば、以下に示すような情報処理装置（コンピュータ）により実現される。

図７は、情報処理装置のハードウェア例を示すブロック図である。
情報処理装置４０は、ＣＰＵ４１、ＲＡＭ（Random Access Memory）４２、ＨＤＤ（Hard Disk Drive）４３、画像信号処理部４４、入力信号処理部４５、媒体リーダ４６及び通信インタフェース４７を有する。上記ユニットは、バスに接続されている。

ＣＰＵ４１は、プログラムの命令を実行する演算回路を含むプロセッサである。ＣＰＵ４１は、ＨＤＤ４３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ４２にロードし、プログラムを実行する。なお、ＣＰＵ４１は複数のプロセッサコアを備えてもよく、情報処理装置４０は複数のプロセッサを備えてもよく、以下で説明する処理を複数のプロセッサまたはプロセッサコアを用いて並列に実行してもよい。また、複数のプロセッサの集合（マルチプロセッサ）を「プロセッサ」と呼んでもよい。

ＲＡＭ４２は、ＣＰＵ４１が実行するプログラムやＣＰＵ４１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、情報処理装置４０は、ＲＡＭ以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ４３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、及び、データを記憶する不揮発性の記憶装置である。プログラムには、たとえば、前述のようなサンプリング処理を情報処理装置４０に実行させるサンプリングプログラムが含まれる。ＨＤＤ４３は、データとして、たとえば、前述の式（１）に含まれる重み係数やバイアス係数などを記憶する。なお、情報処理装置４０は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

画像信号処理部４４は、ＣＰＵ４１からの命令にしたがって、情報処理装置４０に接続されたディスプレイ４４ａに画像を出力する。ディスプレイ４４ａとしては、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ（ＰＤＰ：Plasma Display Panel）、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイなどを用いることができる。

入力信号処理部４５は、情報処理装置４０に接続された入力デバイス４５ａから入力信号を取得し、ＣＰＵ４１に出力する。入力デバイス４５ａとしては、マウスやタッチパネルやタッチパッドやトラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、情報処理装置４０に、複数の種類の入力デバイスが接続されていてもよい。

媒体リーダ４６は、記録媒体４６ａに記録されたプログラムやデータを読み取る読み取り装置である。記録媒体４６ａとして、たとえば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）が含まれる。

媒体リーダ４６は、たとえば、記録媒体４６ａから読み取ったプログラムやデータを、ＲＡＭ４２やＨＤＤ４３などの他の記録媒体にコピーする。読み取られたプログラムは、たとえば、ＣＰＵ４１によって実行される。なお、記録媒体４６ａは、可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体４６ａやＨＤＤ４３を、コンピュータ読み取り可能な記録媒体ということがある。

通信インタフェース４７は、ネットワーク４７ａに接続され、ネットワーク４７ａを介して他の情報処理装置と通信を行うインタフェースである。通信インタフェース４７は、スイッチなどの通信装置とケーブルで接続される有線通信インタフェースでもよいし、基地局と無線リンクで接続される無線通信インタフェースでもよい。

なお、図２に示したようなレプリカ交換コントローラ２２をＣＰＵ４１などを用いて実現し、複数のレプリカ処理部を複数のＡＳＩＣやＧＰＵなどを用いて実現してもよい。
前述のサンプリング処理は、情報処理装置４０にプログラムを実行させることで実現できる。

プログラムは、コンピュータ読み取り可能な記録媒体（たとえば、記録媒体４６ａ）に記録しておくことができる。記録媒体として、たとえば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどを使用できる。磁気ディスクには、ＦＤ及びＨＤＤが含まれる。光ディスクには、ＣＤ、ＣＤ−Ｒ（Recordable）／ＲＷ（Rewritable）、ＤＶＤ及びＤＶＤ−Ｒ／ＲＷが含まれる。プログラムは、可搬型の記録媒体に記録されて配布されることがある。その場合、可搬型の記録媒体から他の記録媒体（たとえば、ＨＤＤ４３）にプログラムをコピーして実行してもよい。

以上、実施の形態に基づき、本発明のサンプリング装置、サンプリング方法及びサンプリングプログラムの一観点について説明してきたが、これらは一例にすぎず、上記の記載に限定されるものではない。

１０サンプリング装置
１１レプリカ処理部
１１ａ状態更新部
１１ｂ繰返し回数計算部
１１ｃサンプル出力部
１２レプリカ交換制御部

Claims

イジングモデルのエネルギーを表す評価関数に含まれる複数の状態変数をそれぞれ含む複数の状態変数群の値を保持し、前記複数の状態変数群のそれぞれに対して異なる値が対応付けられた温度値と、前記複数の状態変数の何れかの値が変化することに伴う前記エネルギーの変化量とに基づいて、各試行において前記複数の状態変数の何れかの値を変えることで状態遷移を発生させる状態更新部と、
前記温度値と前記変化量とに基づいて、前記各試行において確率的に前記状態遷移を許容する場合に前記状態遷移が発生するまでの繰返し回数の期待値を計算し、前記複数の状態変数群のうち、第１の温度値が対応付けられた第１の状態変数群と第２の温度値が対応付けられた第２の状態変数群のそれぞれにおいて許容される前記状態遷移の数と、前記第１の状態変数群に前記第２の温度値を対応付け、前記第２の状態変数群に前記第１の温度値を対応付けた場合に前記第１の状態変数群及び前記第２の状態変数群のそれぞれにおいて許容される前記状態遷移の数と、をそれぞれ計数する繰返し回数計算部と、
前記繰返し回数計算部が計数した計数結果に基づいて、前記第１の状態変数群と前記第２の状態変数群に対応付ける前記第１の温度値と前記第２の温度値の交換前後の前記状態遷移の発生確率の比を計算し、前記比により補正したレプリカ交換の交換確率にしたがって、前記第１の温度値と前記第２の温度値とを交換する交換制御部と、
前記複数の状態変数の値と前記期待値とを、所定の間隔で出力する出力部と、
を有するサンプリング装置。
前記状態更新部は、
前記第１の状態変数群において発生しうる複数の状態遷移のそれぞれについての前記変化量を計算し、
負である前記変化量を０に更新し、０以上である前記変化量の値を維持した複数の第１の更新値を計算し、
前記複数の第１の更新値のそれぞれに対して、前記第１の温度値に基づいて生成される複数の第１の乱数値の何れかを加算することで複数の第１の加算結果を計算し、
前記複数の第１の加算結果のうち、最小となる第１の加算結果をもたらす前記状態遷移を発生させる、
請求項１に記載のサンプリング装置。
前記繰返し回数計算部は、
前記複数の第１の更新値のうちの最小値であるオフセット値を、前記複数の第１の更新値のそれぞれから引いた複数の第２の更新値を計算し、
前記複数の第２の更新値のそれぞれに対して、前記第１の温度値に基づいて生成される複数の第２の乱数値の何れかを加算することで複数の第２の加算結果を計算し、
前記複数の第２の加算結果のそれぞれと閾値との比較結果に基づいて、前記複数の状態遷移のうち許容される前記状態遷移を決定し、
前記複数の第２の更新値のそれぞれに対して、前記第２の温度値に基づいて生成される複数の第３の乱数値の何れかを加算することで複数の第３の加算結果を計算し、
前記複数の第３の加算結果のそれぞれと前記閾値との比較結果に基づいて、前記複数の状態遷移のうち許容される前記状態遷移を決定する、
請求項２に記載のサンプリング装置。
前記状態更新部と、前記繰返し回数計算部と、前記出力部のそれぞれは、複数のレプリカ処理部に分割して設けられ、
前記複数のレプリカ処理部のそれぞれは、前記複数の状態変数群の何れかについて、前記各試行において前記状態遷移を発生させ、前記期待値を計算し、許容される前記状態遷移の数を計数し、前記複数の状態変数の値と前記期待値とを前記所定の間隔で出力する処理を行い、
前記処理は、前記複数のレプリカ処理部の間で並列に実行される、
請求項１乃至３の何れか一項に記載のサンプリング装置。
状態更新部が、イジングモデルのエネルギーを表す評価関数に含まれる複数の状態変数をそれぞれ含む複数の状態変数群の値を保持し、前記複数の状態変数群のそれぞれに対して異なる値が対応付けられた温度値と、前記複数の状態変数の何れかの値が変化することに伴う前記エネルギーの変化量とに基づいて、各試行において前記複数の状態変数の何れかの値を変えることで状態遷移を発生させ、
繰返し計算部が、前記温度値と前記変化量とに基づいて、前記各試行において確率的に前記状態遷移を許容する場合に前記状態遷移が発生するまでの繰返し回数の期待値を計算し、前記複数の状態変数群のうち、第１の温度値が対応付けられた第１の状態変数群と第２の温度値が対応付けられた第２の状態変数群のそれぞれにおいて許容される前記状態遷移の数と、前記第１の状態変数群に前記第２の温度値を対応付け、前記第２の状態変数群に前記第１の温度値を対応付けた場合に前記第１の状態変数群及び前記第２の状態変数群のそれぞれにおいて許容される前記状態遷移の数と、をそれぞれ計数し、
交換制御部が、前記繰返し回数計算部が計数した計数結果に基づいて、前記第１の状態変数群と前記第２の状態変数群に対応付ける前記第１の温度値と前記第２の温度値の交換前後の前記状態遷移の発生確率の比を計算し、前記比により補正したレプリカ交換の交換確率にしたがって、前記第１の温度値と前記第２の温度値とを交換し、
出力部が、前記複数の状態変数の値と前記期待値とを、所定の間隔で出力する、
サンプリング方法。
イジングモデルのエネルギーを表す評価関数に含まれる複数の状態変数をそれぞれ含む複数の状態変数群の値を保持し、
前記複数の状態変数群のそれぞれに対して異なる値が対応付けられた温度値と、前記複数の状態変数の何れかの値が変化することに伴う前記エネルギーの変化量とに基づいて、各試行において前記複数の状態変数の何れかの値を変えることで状態遷移を発生させ、
前記温度値と前記変化量とに基づいて、前記各試行において確率的に前記状態遷移を許容する場合に前記状態遷移が発生するまでの繰返し回数の期待値を計算し、
前記複数の状態変数群のうち、第１の温度値が対応付けられた第１の状態変数群と第２の温度値が対応付けられた第２の状態変数群のそれぞれにおいて許容される前記状態遷移の数と、前記第１の状態変数群に前記第２の温度値を対応付け、前記第２の状態変数群に前記第１の温度値を対応付けた場合に前記第１の状態変数群及び前記第２の状態変数群のそれぞれにおいて許容される前記状態遷移の数と、をそれぞれ計数し、
計数した計数結果に基づいて、前記第１の状態変数群と前記第２の状態変数群に対応付ける前記第１の温度値と前記第２の温度値の交換前後の前記状態遷移の発生確率の比を計算し、前記比により補正したレプリカ交換の交換確率にしたがって、前記第１の温度値と前記第２の温度値とを交換し、
前記複数の状態変数の値と前記期待値とを、所定の間隔で出力する、
処理をコンピュータに実行させるサンプリングプログラム。