JP2024049202A

JP2024049202A - データ処理装置、プログラム及びデータ処理方法

Info

Publication number: JP2024049202A
Application number: JP2022155524A
Authority: JP
Inventors: シゲンチェン; ジェフリーセスローゼンタール; アリシェイクホレスラミ; 泰孝田村; 暁土手
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2022-09-28
Filing date: 2022-09-28
Publication date: 2024-04-09
Also published as: EP4345696A1; CN117786275A; US20240111833A1

Abstract

【課題】解探索を効率的に行う。【解決手段】第２記憶部１２は、複数の重み係数のうち、評価関数に含まれる複数の状態変数を分割した複数の状態変数群から選択された状態変数群に関する、重み係数群の値を記憶する。探索部１３は、第２記憶部１２から読み出した重み係数群の値を用いて、状態変数群の各状態変数の値を変化させたときの評価関数の値の変化量を計算する処理と、変化量と温度値に基づいて、状態変数群の何れかの状態変数の値を変化させる処理を含む更新処理を繰り返すことで、組合せ最適化問題の解を探索する。処理部１４は、ＭＣＭＣ法を用いて解の探索を行う場合に、状態変数群の値が維持される試行回数である多重度を、上記変化量と温度値に基づいて計算し、多重度の積算値が所定の閾値を超えた場合、他の状態変数群に関する重み係数群の値を用いた上記更新処理を、探索部１３に実行させる。【選択図】図１

Description

本発明は、データ処理装置、プログラム及びデータ処理方法に関する。

組合せ最適化問題の解を探索する際に、組合せ最適化問題を、磁性体のスピンの振る舞いを表すイジングモデルに変換する手法がある。そして、マルコフ連鎖モンテカルロ法により、イジング型の評価関数の値（イジングモデルのエネルギーに相当する）が極小になるイジングモデルの状態の探索が行われる。評価関数の極小値のうちの最小値になる状態が最適解となる。なお、評価関数の符号を変えれば、評価関数の値が極大になる状態を探索することもできる。

以下、マルコフ連鎖モンテカルロ法を、ＭＣＭＣ（Markov-Chain Monte Carlo）法と略す。また、ＭＣＭＣ法による処理をＭＣＭＣ処理と呼ぶ場合もある。ＭＣＭＣ処理では、たとえば、メトロポリス法またはギブス法で規定される状態遷移の受け入れ確率で、その状態遷移が受け入れられる。ＭＣＭＣ法の一種として、疑似焼き鈍し法やレプリカ交換法がある。

なお、ＭＣＭＣ処理の各試行において状態遷移が棄却され続けると状態が遷移しなくなる。これを防止するため、試行ごとに異なる状態に遷移するサンプル列を発生させる手法が提案されている（たとえば、特許文献１、非特許文献１参照）。このような手法は、リジェクションフリー試行とも呼ばれる。

ところで、問題規模（状態変数の数（イジングモデルのスピン数に相当））が大きくなると、問題を定義する係数（各状態変数間の重み係数）の数が増大する。これにより、組合せ最適化問題を計算するデータ処理装置において、高速であるが比較的容量の小さいメモリ（たとえば、オンチップメモリ）に全ての重み係数を保持できなくなる場合がある。この場合、比較的容量の大きいメモリに重み係数が保持されることになるが、アクセスに時間がかかり、処理速度が大幅に制限される可能性がある。

そこで従来、重み係数がメモリに記憶可能なサイズになるように、組合せ最適化問題を複数の部分問題に分割し、部分問題ごとにリジェクションフリー試行による解探索を行う手法が提案されている（たとえば、非特許文献２参照）。部分問題の計算は、全状態変数を複数の状態変数群に分割し、各状態変数の範囲内で近傍状態（たとえば、ハミング距離が１ビットの状態）への状態遷移を発生させることで、解探索を行うものである。このため、部分問題の計算は、部分近傍探索とも呼ばれる。

特開２０２０－１３５７２７号公報

J.S. Rosenthal, "Jump Markov Chains and Rejection-Free Metropolis Algorithms", Computational Statistics 36.4, pp.2789-2811, 2021 Sigeng Chen et al, "Optimization via Rejection-Free Partial Neighbor Search", arXiv:2205.02083, Apr. 15, 2022

しかし、リジェクションフリー試行により部分近傍探索を行う場合、部分近傍（分割した各状態変数群）ごとに解の探索範囲に偏りが生じる可能性がある。この場合、効率的に解探索が行えなくなる可能性があった。

１つの側面では、本発明は、解探索を効率的に行えるデータ処理装置、プログラム及びデータ処理方法を提供することを目的とする。

１つの実施態様では、組合せ最適化問題を変換した評価関数に含まれる複数の重み係数の値を記憶する第１記憶部と、前記複数の重み係数のうち、前記評価関数に含まれる複数の状態変数を分割した複数の状態変数群から選択された状態変数群に関する、重み係数群の値を記憶する第２記憶部と、前記第２記憶部から読み出した前記重み係数群の値を用いて、前記状態変数群の各状態変数の値を変化させたときの前記評価関数の値の変化量を計算する処理と、前記変化量と温度値に基づいて、前記状態変数群の何れかの状態変数の値を変化させる処理とを含む更新処理を繰り返すことで、前記組合せ最適化問題の解を探索する探索部と、マルコフ連鎖モンテカルロ法を用いて前記解の探索を行う場合に、前記状態変数群の値が維持される試行回数である多重度を、前記変化量と前記温度値に基づいて計算し、前記多重度の積算値が所定の閾値を超えた場合、前記複数の状態変数群から選択した他の状態変数群に関する前記重み係数群の値を用いた前記更新処理を、前記探索部に実行させる処理部と、を有するデータ処理装置が提供される。

また、１つの実施態様ではプログラムが提供される。
また、１つの実施態様ではデータ処理方法が提供される。

１つの側面では、本発明は、解探索が効率的に行うことが可能となる。

本実施の形態のデータ処理装置の一例を示す図である。データ処理方法の概略の流れを示すフローチャートである。部分近傍の解探索とサンプリングの処理手順の一例を示すフローチャートである。リジェクションフリー試行により値を変化させる状態変数を選択する回路例を示す図である。エネルギーの更新を説明する図である。処理部の一例を示す図である。脱出確率計算回路の一例を示す図である。部分近傍の切替方法の一例を示す図である。連続変数を用いる場合の部分近傍の解探索の処理手順の一例を示すフローチャートである。データ処理装置のハードウェア例を示す図である。

以下、発明を実施するための形態を、図面を参照しつつ説明する。
図１は、本実施の形態のデータ処理装置の一例を示す図である。
データ処理装置１０は、組合せ最適化問題に対する解を、疑似焼き鈍し法、レプリカ交換法などを利用したリジェクションフリー試行により探索し、探索した解を出力する。

組合せ最適化問題は、たとえば、イジング型の評価関数に変換される。評価関数は、目的関数やエネルギー関数などと呼ばれることもある。評価関数は、複数の状態変数と複数の重み係数を含む。イジング型の評価関数では、状態変数は、０または１の値を取るバイナリ変数である。状態変数はビットと表記されてもよい。組合せ最適化問題の解は、複数の状態変数の値により表される。評価関数の値を最小化する解が、組合せ最適化問題の最適解に対応する。以下、評価関数の値を、エネルギーという。

イジング型の評価関数は、式（１）で表せる。

状態ベクトルｘは、複数の状態変数を要素とし、イジングモデルの状態を表す。式（１）は、ＱＵＢＯ（Quadratic Unconstrained Binary Optimization）形式で定式化された評価関数である。なお、エネルギーを最大化する問題の場合には、評価関数の符号を逆にすればよい。

式（１）の右辺第１項は、全状態変数から選択可能な２つの状態変数の全組合せについて、漏れと重複なく、２つの状態変数の値と重み係数との積を積算したものである。添え字ｉ，ｊは状態変数のインデックスである。ｘ_ｉは、ｉ番目の状態変数である。ｘ_ｊは、ｊ番目の状態変数である。以下では、状態変数の数は、ｎ個であるものとする。Ｗ_ｉｊは、ｉ番目の状態変数とｊ番目の状態変数との間の重み、または、結合の強さを示す重み係数である。Ｗ_ｉｊ＝Ｗ_ｊｉであり、Ｗ_ｉｉ＝０である。状態変数の数がｎ個の場合、Ｗ_ｉｊの数はｎ×ｎ個である。

式（１）の右辺第２項は、全状態変数の各々のバイアスと状態変数の値との積の総和を求めたものである。ｂ_ｉは、ｉ番目の状態変数に対するバイアスを示している。
状態変数ｘ_ｉの値が変化して１－ｘ_ｉとなると、状態変数ｘ_ｉの変化量は、Δｘ_ｉ＝（１－ｘ_ｉ）－ｘ_ｉ＝１－２ｘ_ｉと表せる。したがって、評価関数Ｅ（ｘ）に対して、状態変数ｘ_ｉの変化に伴うエネルギーの変化量（ΔＥ_ｉ）は、以下の式（２）で表せる。

ｈ_ｉは局所場（ＬＦ：Local Field）と呼ばれる。ｘ_ｊの値が変化したときのｈ_ｉの変化量は、Δｈ_ｉ ^（ｊ）＝Ｗ_ｉｊΔｘ_ｊと表される。
解の探索において、エネルギーの変化量がΔＥ_ｉとなる状態遷移、すなわち、状態変数ｘ_ｉの値の変化を受け入れるか否かを決定するためにメトロポリス法やギブス法が用いられる。具体的には、ある状態から当該状態よりもエネルギーの低い他の状態への遷移を探索する近傍探索において、エネルギーが下がる状態だけでなく、エネルギーが上がる状態への遷移が確率的に受け入れられる。たとえば、ΔＥ_ｉを生じさせる状態変数の値の変化を受け入れる受入確率Ａ_ｉは、式（３）で表せる。

βは温度を表すパラメータであるＴ（Ｔ＞０）の逆数（β＝１／Ｔ）であり、逆温度と呼ばれる。以下、βやＴを温度値と呼ぶこともある。ｍｉｎ演算子は、引数のうちの最小値を取ることを示す。式（３）の右辺上側はメトロポリス法に相当する。式（３）の右辺下側はギブス法に相当する。

しかし、全ての近傍を探索するには、ΔＥ_１～ΔＥ_ｎの計算のためにｎ×ｎ個のＷ_ｉｊを用いることになる。問題規模が増大すると、高速であるが比較的容量の小さいメモリ（たとえば、オンチップメモリ）に全てのＷ_ｉｊを保持できなくなる場合がある。この場合、比較的容量の大きいメモリ（たとえば、ＤＲＡＭ（Dynamic Random Access Memory））にＷ_ｉｊを記憶することになる。しかし、たとえば、ＤＲＡＭのアクセス時間はオンチップＲＡＭ（Random Access Memory）に比べて２桁程度大きいため、処理速度が大幅に制限される。

そこで、本実施の形態のデータ処理装置１０は、ｎ個の状態変数を分割した、複数の状態変数群を用いて近傍探索を行う。以下、複数の状態変数群のそれぞれを部分近傍と呼ぶ。

データ処理装置１０は、第１記憶部１１、第２記憶部１２、探索部１３、処理部１４を有する。
第１記憶部１１は、組合せ最適化問題を変換した評価関数に含まれる複数の重み係数の値を記憶する。図１の例では、第１記憶部１１は、複数の部分近傍のそれぞれに関する重み係数群ごとに分けて、複数の重み係数を記憶している。

第１記憶部１１は、たとえば、後述の第２記憶部１２よりも低速だが、第２記憶部１２よりも容量が大きい記憶装置である。このような記憶装置として、たとえば、ＤＲＡＭなどの電子回路である揮発性の記憶装置、または、ＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの電子回路である不揮発性の記憶装置などがある。

複数の部分近傍の生成は、各部分近傍に関する重み係数群が、第２記憶部１２に記憶できるように行われる。複数の部分近傍の生成は、第１記憶部１１または別の記憶装置に記憶されている問題情報（ｎ個の状態変数のインデックスやｎ×ｎ個のＷ_ｉｊを含む）に基づいて、データ処理装置１０の処理部１４が行ってもよい。また、複数の部分近傍の生成は、データ処理装置１０の外部の装置が行ってもよい。

複数の部分近傍は、たとえば、以下の制約を満たすように生成される。（１）各部分近傍はｘ_１～ｘ_ｎの値で表される状態空間のうちの一部（サブセット）の状態空間を表すものである。（２）各部分近傍は全体近傍の一部である。（３）状態Ｙが状態Ｘの部分近傍ならば、ＸはＹの部分近傍でもある。（４）部分近傍内での遷移確率は全体近傍での遷移確率に比例し、部分近傍外への遷移確率は０である。遷移確率は、提案確率と式（２）の受入確率Ａ_ｉとの積で表される。提案確率は、状態が、状態Ｘから状態Ｙに遷移する場合Ｑ（Ｘ，Ｙ）と表される。本実施の形態の例では、部分近傍の要素数がｍ個で、部分近傍内での状態遷移が一様にランダムに行われるものとする。この場合、Ｑ（Ｘ，Ｙ）＝１／ｍと表すことができる。

なお、（３）の制約は、状態Ｙが状態Ｘから複数回の部分近傍への状態遷移を経由して得られる場合にも、状態Ｘが状態Ｙの部分近傍である、という制約であってもよい。
上記の制約を満たすように、たとえば、単純にｘ_１～ｘ_ｎをインデックス順に分割することで、複数の部分近傍を生成することができる。また、各部分近傍に含まれる状態変数の数がおおよそ等しくなるように、ランダムにインデックスを選択してｘ_１～ｘ_ｎを分割することで、複数の部分近傍を生成することもできる。ここで各部分近傍に重複するインデックスがあってもよい。また各部分近傍で全インデックスをカバーしていることが望ましい。なお、複数の部分近傍のそれぞれについて解探索が行われた後、またはそれが複数回繰り返された後に、再度ランダムにインデックスを選択して、複数の部分近傍を生成し、解探索が行われるようにしてもよい。

ただし、複数の部分近傍を生成する方法は、上記のような方法に限られない。たとえば２つのインデックスｉ，ｊの全組合せ（１，１），（１，２），…（１，ｎ），（２，３），（２，４），…（２，ｎ），…（ｎ－１，ｎ）を全近傍とし、それを複数の部分近傍に分けるようにしてもよい。

図１には、ｎ個の状態変数が、Ｉ個の部分近傍（Ｎ_１～Ｎ_Ｉ）に分割された例が示されている。Ｎ_１～Ｎ_Ｉは、１ビット反転の近傍を例にとると、反転する状態変数のインデックスの集合で定義できる。たとえば、Ｎ_１～Ｎ_Ｉは、Ｎ_１＝｛ｊ_１ ^（１），ｊ_２ ^（１），…，ｊ_ｍ ^（１）｝、Ｎ_２＝｛ｊ_１ ^（２），ｊ_２ ^（２），…，ｊ_ｍ ^（２）｝，…，Ｎ_Ｉ＝｛ｊ_１ ^（I），ｊ_２ ^（I），…，ｊ_ｍ ^（I）｝などと定義できる。ｊ_ｉ ^（ｉ）は、Ｎ_ｉに含まれるｍ個の状態変数のインデックスのうち、ｉ番目のインデックスを表す。

なお、図１に示されているように、異なる部分近傍が同じインデックスを含んでいてもよい。つまり、異なる部分近傍の間で、含まれるインデックスの範囲が重なっていてもよい。

上記のようにＮ_１～Ｎ_Ｉが生成された場合、第１記憶部１１には、各部分近傍に関する重み変数（Ｗ_ｉｊ）群が記憶される。たとえば、Ｎ_１のＷ_ｉｊ群は、ｎ個の状態変数のうち、Ｎ_１に含まれる状態変数のそれぞれと、他の状態変数との間の重み係数を含む。Ｎ_２のＷ_ｉｊ群は、ｎ個の状態変数のうち、Ｎ_２に含まれる状態変数のそれぞれと、他の状態変数との間の重み係数を含む。Ｎ_ＩのＷ_ｉｊ群は、ｎ個の状態変数のうち、Ｎ_Ｉに含まれる状態変数のそれぞれと、他の状態変数との間の重み係数を含む。

なお、第１記憶部１１は、データ処理装置１０に、組合せ最適化問題に対する解を探索させるプログラムなど各種のプログラムや、各種のデータを記憶していてもよい。
第２記憶部１２は、評価関数に含まれる複数の重み係数のうち、複数の部分近傍から選択された部分近傍に関する重み係数群を記憶する。第２記憶部１２は、たとえば、前述の第１記憶部１１よりも高速だが、第１記憶部１１よりも容量が小さい記憶装置である。このような記憶装置として、たとえば、ＳＲＡＭ（Static Random Access Memory）などの電子回路である揮発性の記憶装置などがある。第２記憶部１２は、レジスタなどの電子回路を含んでいてもよい。

探索部１３は、部分近傍（前述の部分問題に対応する）ごとに解探索を行う。探索部１３は、第２記憶部１２に記憶されている重み係数群を読み出す。そして、探索部１３は、読み出した重み係数群を用いて、選択された部分近傍の各状態変数の値を変化させたときの評価関数の値の変化量（ΔＥ_ｉ）を計算する。ΔＥ_ｉは、たとえば、式（２）により計算できる。式（２）に含まれる各状態変数の値、局所場、エネルギーなどは、探索部１３内の図示しない記憶部（たとえば、レジスタなどの記憶回路）に記憶される。探索部１３は、選択された部分近傍の各状態変数についてのΔＥ_ｉを、並列に計算できる。探索部１３は、各状態変数についてのΔＥ_ｉと温度値に基づいて、部分近傍の何れかの状態変数の値を変化させる。

探索部１３は、リジェクションフリー試行により解探索を行う。リジェクションフリー試行では、式（３）に示した受入確率Ａ_ｉに基づく以下の式（４）で表せる確率に基づいて、部分近傍に含まれる何れか１つの状態変数が選択され、その値が変化する。

式（４）において、ｍは選択された状態変数群に含まれる状態変数の数である。
式（４）の確率による選択は、以下の式（５）で表せるインデックス＝ｊの状態変数を選択することに相当する。

ａｒｇｍｉｎ_ｉは、引数が最小となるｉを示す。
探索部１３は、状態変数の値を変化させた場合、レジスタなどに記憶されている局所場やエネルギーを更新する。探索部１３は、このようなΔＥ_ｉを計算する処理と、状態変数の値を変化させる処理とを含む更新処理（局所場やエネルギーの更新を含む）を、処理部１４が選択する各部分近傍について繰り返すことで、組合せ最適化問題の解の探索を行う。

以上のような探索部１３は、たとえば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの電子回路を用いて実現できる。また、探索部１３は、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）などのハードウェアであるプロセッサがプログラムを実行することによるソフトウェア処理にて実現することもできる。

処理部１４は、リジェクションフリー試行ではなく通常のＭＣＭＣ法を用いて解探索を行う場合に状態が維持される試行回数である多重度を、選択された状態変数群の各状態変数についてのΔＥ_ｉと温度値に基づいて計算する。

通常のＭＣＭＣ法を用いて解探索を行う場合に得られる状態の時系列は、たとえば、｛Ｘ_ｎ｝＝｛ａ，ｂ，ｂ，ｂ，ａ，ａ，ｃ，ｃ，ｃ，ｃ，ｄ，ｄ，…｝のように表せる。以下、このような通常のＭＣＭＣ法を用いて解探索を行う場合に得られる状態の時系列をオリジナルチェーンと呼ぶ。

通常のＭＣＭＣ法では状態遷移が棄却される場合があるため、連続する複数回の試行において同じ状態が維持されることがある。上記のようなオリジナルチェーン｛Ｘ_ｎ｝では、状態ａの後、状態ｂが試行回数＝３回分維持され、状態ａが試行回数＝２回分維持され、状態ｃが試行回数＝４回分維持され、状態ｄが試行回数＝２回分維持されている。このような｛Ｘ_ｎ｝の多重度の時系列は、｛Ｍ_ｋ｝＝｛１，３，２，４，２，…｝と表せる。

一方、リジェクションフリー試行では同じ状態が繰り返されない。そのため、通常のＭＣＭＣ法において、上記のような状態の時系列｛Ｘ_ｎ｝が得られる場合、リジェクションフリー試行における状態の時系列は、｛Ｊ_ｋ｝＝｛ａ，ｂ，ａ，ｃ，ｄ，…｝となる。

以上のことから、多重度は、リジェクションフリー試行による解探索で得られる１サンプル当たりの、オリジナルチェーンのサンプル数ともいえる。
処理部１４は、多重度（Ｍ）を、以下の式（６）に基づいて計算する。

式（６）において、床関数のパラメータであるｒとＰ_ｅのうち、ｒは０から１の間の一様乱数の値である。Ｐ_ｅは１回の試行で状態が変化する確率を表し脱出確率と呼ばれる。多重度Ｍは、Ｐ_ｅの幾何分布にしたがう確率変数であり、それにしたがう乱数を式（６）で発生することができる。Ｐ_ｅは以下の式（７）で表せる。

式（７）において、Ａ_ｉは、前述の式（３）で表される。
処理部１４は、多重度の積算値が所定の閾値を超えた場合に、複数の部分近傍から選択した他の部分近傍に関する重み係数群を用いた更新処理を、探索部１３に実行させる。たとえば、処理部１４は、多重度の積算値が所定の閾値を超えた場合、複数の部分近傍から未選択の部分近傍を選択し、その部分近傍に関する重み係数群の値を第１記憶部１１から読み出して、第２記憶部１２に記憶する（書き込む）。たとえば、処理部１４は、元の重み係数群の値を、新たに選択した部分近傍に関する重み係数群の値で上書きする。

なお、処理部１４は、探索部１３においてある部分近傍に関する重み係数群の値を用いた更新処理が行われている間に、他の部分近傍を予め選択し、その部分近傍に関する重み係数群の値を第２記憶部１２に記憶してもよい（後述の図８参照）。

このように、処理部１４はデータ処理装置１０の各部を制御するコントローラの機能を有している。
処理部１４は、たとえば、ＡＳＩＣやＦＰＧＡなどの電子回路を用いて実現できる。また、処理部１４は、ＣＰＵ、ＧＰＵ、ＤＳＰなどのハードウェアであるプロセッサがプログラムを実行することによるソフトウェア処理にて実現することもできる。

図１には、上記のようなデータ処理装置１０による解探索例が示されている。
まず、探索部１３は、Ｎ_１の範囲内で、リジェクションフリー試行による解探索を行う。図１の例では、状態Ｘ_０から開始して、状態Ｘ_１，Ｘ_２，…，Ｘ_ｌの順で状態遷移が生じている。

リジェクションフリー試行による解探索では、１試行あたりこのような状態遷移が生じるが、前述のように通常のＭＣＭＣ法による解探索では、棄却が生じるため同じ状態が繰り返される場合がある。図１の例では、状態Ｘ_０が３試行回数分繰り返され、状態Ｘ_１が６試行回数分繰り返され、状態Ｘ_２が３試行回数分繰り返されている。つまり、状態Ｘ_０の多重度（Ｍ_１ ^（１））は３、状態Ｘ_１の多重度（Ｍ_２ ^（１））は６、状態Ｘ_２の多重度（Ｍ_３ ^（１））は３である。

処理部１４は、前述の式（６）に基づいて上記の多重度を計算するとともに、その積算値が所定の閾値を超えるか否かを判定する。図１の例では、状態Ｘ_ｌにおける多重度が３に達した場合に、積算値が閾値（Ｌ_０）を超えている。このため、処理部１４は、他の部分近傍（図１の例ではＮ_２）を選択して、その部分近傍に関する重み係数群の値（Ｎ_２のＷ_ｉｊ群の値）を第１記憶部１１から読み出して、第２記憶部１２に記憶する。

Ｎ_２の範囲内でのリジェクションフリー試行による解探索では、状態Ｘ_ｌから開始される。処理部１４は、再び多重度の計算と、積算値が閾値を超えるか否かの判定を繰り返す。図１の例では、Ｎ_２の範囲内でのｘ_ｌの多重度がＭ_１ ^（２）と表されている。

以上のように、各部分近傍における解探索において、多重度の積算値が閾値を超えた場合に、次の部分近傍の解探索に移ることで、部分近傍ごとに解の探索範囲に偏りが生じることが抑制される。これにより、組合せ最適化問題の解探索を効率的に行うことができる。

なお、データ処理装置１０は、サンプリング装置として機能することもできる。
通常のＭＣＭＣ法では、平衡状態における各状態の占有確率を示す確率分布は、目標分布（たとえば、ボルツマン分布）となる。そのため、状態遷移を繰り返す過程で得られた状態または状態に基づいた値をサンプルとして出力することで、目標分布にしたがうサンプルが得られる。発生したサンプルは、たとえば、機械学習などでの期待値の計算に用いられる。

データ処理装置１０において、探索部１３は更新処理ごとの（リジェクションフリー試行による試行ごとの）、複数の状態変数の値を、たとえば、サンプルとして出力する。また、処理部１４は、複数の状態変数の値ごと（状態ごと）の多重度Ｍを出力する。上記の多重度Ｍによりサンプルに重み付けを行うことで目標分布を得ることができる。データ処理装置１０をサンプリング装置として、機能させた場合にも、上記のように探索範囲の偏りを抑制できることから、正確なサンプリングが可能になる。

次に、データ処理装置１０によるデータ処理方法の一例の処理の流れを、フローチャートを用いて説明する。
図２は、データ処理方法の概略の流れを示すフローチャートである。

まず、組合せ最適化問題の問題情報に基づいて、前述の方法により部分近傍が生成される（ステップＳ１０）。複数の部分近傍の生成は、処理部１４が行ってもよいし、データ処理装置１０の外部の装置が行ってもよい。ステップＳ１０の処理では、さらに、評価関数に含まれる複数の重み係数の値が第１記憶部１１に記憶される。

次に、処理部１４は、解探索の対象とする部分近傍を選択し（ステップＳ１１）、選択した部分近傍に関する重み係数群の値を第２記憶部１２に記憶する（ステップＳ１２）。
探索部１３は、第２記憶部１２に記載されている重み係数群の値を用いて部分近傍の範囲内での解探索を行う（ステップＳ１３）。また、ステップＳ１３の処理では、処理部１４は、多重度Ｍの計算を行う。

処理部１４は、多重度Ｍの積算値が所定の閾値（前述の例ではＬ_０）を超えたか否かを判定する（ステップＳ１４）。処理部１４は、積算値が閾値を超えていないと判定した場合、ステップＳ１３の処理を繰り返す。

処理部１４は、積算値が閾値を超えたと判定した場合、未選択の部分近傍があるか否かを判定する（ステップＳ１５）。処理部１４は、未選択の部分近傍があると判定した場合、ステップＳ１６の処理を行い、未選択の部分近傍がないと判定した場合、ステップＳ１８の処理を行う。

ステップＳ１６の処理では、処理部１４は、未選択の他の部分近傍を選択する。そして、処理部１４は、選択した他の部分近傍に関する重み係数群の値を第２記憶部１２に記憶する（ステップＳ１７）。その後、ステップＳ１３からの処理が繰り返される。

ステップＳ１８の処理では、処理部１４は、解探索の終了条件が満たされているか否かを判定する。解探索の終了条件として、たとえば、試行回数が所定の回数に達したか否か、疑似焼き鈍し法が行われる場合、温度値が最終温度値に達したか否か、などの条件を用いることができる。処理部１４は、終了条件が満たされていないと判定した場合、ステップＳ１１からの処理を繰り返す。

たとえば、図１に示したような部分近傍Ｎ_１が選択され、解探索が繰り返される。なお、終了条件が満たされていないと判定された場合、ステップＳ１０からの処理が繰り返されるようにしてもよい。その場合、たとえば、処理部１４は、前回の方法とは異なる方法で複数の部分近傍を生成してもよい。

処理部１４は、終了条件が満たされたと判定した場合、計算結果を出力し（ステップＳ１９）、処理を終了する。計算結果は、たとえば、更新処理で得られたエネルギーのうち、最低のエネルギーが得られたときの状態（ｘ_１～ｘ_ｎの値）である。

次に、部分近傍の解探索とサンプリングについての、より具体的な処理の手順を説明する。
図３は、部分近傍の解探索とサンプリングの処理手順の一例を示すフローチャートである。

なお、疑似焼き鈍し法が行われる場合、以下の処理は、たとえば、温度値であるＴを、開始値から終了値まで、所定の温度変更スケジュールにしたがって、徐々に小さくしながら行われる。たとえば、一定の試行回数ごとに、Ｔに１より小さい値を乗じることで、Ｔを小さくしていくことができる。逆温度βを温度値として用いる場合は、徐々に大きくしながら以下の処理が行われる。

レプリカ交換法が行われる場合、探索部１３は、それぞれ異なる温度値が設定された複数のレプリカ回路を用いる。各レプリカ回路ではそれぞれ同じ部分近傍を用いて解探索が行われる。そして、各レプリカ回路において、以下の処理が行われる。処理部１４は、試行が所定回数繰り返されるごとに、レプリカ交換を行う。たとえば、処理部１４は、複数のレプリカ回路のうち２つをランダムに選択して、選択された２つのレプリカ回路の間で、レプリカ回路間のエネルギー差や温度値の差に基づいた所定の交換確率で、温度値または状態を交換する。

図３に示されているように、まず、処理部１４は、初期化処理を行う（ステップＳ２０）。初期化処理では、エネルギーや局所場の初期値の設定や、前述の閾値（Ｌ_０）、部分近傍の総数（以下の例ではＫとする）、解探索の終了条件（以下の例では、試行回数の上限値Ｉｔｒである）などの設定が行われる。さらに、疑似焼き鈍し法が行われる場合、たとえば、Ｔ（またはβ）の開始値や終了値、所定の温度変更周期ごとにＴ（またはβ）に乗じる値などの設定が行われる。レプリカ交換法が行われる場合、各レプリカ回路への温度値の設定などが行われる。

そして処理部１４は、部分近傍のインデックスであるｋに１を代入する（ステップＳ２１）。この処理は、ｋ＝１の部分近傍を選択することに相当する。
次に、処理部１４は、変数Ｌに前述の閾値であるＬ_０を代入する（ステップＳ２２）。その後、探索部１３によるｋ＝１の部分近傍におけるΔＥ_ｉの計算と、処理部１４による多重度Ｍの計算が行われる（ステップＳ２３）。このステップＳ２３の処理では、探索部１３は、前述のリジェクションフリー試行により値を変化させる状態変数を選択してよいが、値の変化（状態の更新）は、まだ行わない。

処理部１４は、Ｍ≦Ｌであるか否かを判定する（ステップＳ２４）。ステップＳ２４の処理は、図２に示した、多重度Ｍの積算値が閾値を超えているか否かを判定するステップＳ１４の処理に対応している。処理部１４は、Ｍ≦Ｌであると判定した場合、ステップＳ２５の処理を行い、Ｍ≦Ｌではないと判定した場合、ステップＳ２７の処理を行う。

ステップＳ２５の処理では、処理部１４は、ＬにＬ－Ｍを代入する。その後、処理部１４は、探索部１３に、ステップＳ２３の処理で計算されたΔＥ_ｉと温度値に基づいて、状態を更新させる（ステップＳ２６）。状態の更新は、前述のリジェクションフリー試行により選択された、部分近傍の何れかの状態変数の値を変化させることで行われる。状態の更新に伴って、局所場やエネルギーも更新される。また、探索部１３は、更新されたエネルギーがこれまでで最低である場合には、その値とそのエネルギーを示す状態を保持してもよい。

なお、ステップＳ２６の処理では、処理部１４は、更新前の状態と、その状態の多重度として、計算した多重度Ｍとを出力（または図示しない記憶部に記憶）する。
ステップＳ２６の処理後、ステップＳ２３からの処理が繰り返される。

ステップＳ２７の処理では、処理部１４は、サンプル（ここでは現在の状態と、その状態の多重度としてＬを含む）を出力（または図示しない記憶部に記憶）する。ステップＳ２７の処理では、状態の更新は行われない。

ステップＳ２７の処理後、処理部１４は、ｋ≧Ｋであるか否かを判定する（ステップＳ２８）。処理部１４は、ｋ≧Ｋではないと判定した場合、ステップＳ２９の処理を行い、ｋ≧Ｋであると判定した場合、ステップＳ３０の処理を行う。

ステップＳ２９の処理では、処理部１４は、解探索の対象を次の部分近傍に切り替えるために、ｋにｋ＋１を代入する。その後、ステップＳ２２からの処理が繰り返される。
ステップＳ３０の処理では、処理部１４は、ｉｔｒ＜Ｉｔｒであるか否かを判定する。ｉｔｒは、試行回数を表す変数であり、初期値は１である。処理部１４は、ｉｔｒ＜Ｉｔｒであると判定した場合、ステップＳ３１の処理を行い、ｉｔｒ＜Ｉｔｒではないと判定した場合、ステップＳ３２の処理を行う。

ステップＳ３１の処理では、処理部１４は、ｉｔｒにｉｔｒ＋１を代入する。その後、ステップＳ２１からの処理が繰り返される。ステップＳ３２の処理は、図２に示したステップＳ１９の処理と同様である。

なお、図２、図３に示した処理の順序は一例であり、適宜処理の順序を入れ替えてもよい。
以上のような処理により、部分近傍ごとにリジェクションフリー試行により解探索を行う場合でも、部分近傍間で解の探索範囲に偏りが生じることを抑制できる。また、正確なサンプリングが可能となる。

（リジェクションフリー試行により値を変化させる状態変数を選択する回路例）
図４は、リジェクションフリー試行により値を変化させる状態変数を選択する回路例を示す図である。

探索部１３は、リジェクションフリー試行により値を変化させる状態変数を選択するために、ｋ_ｉ計算回路１３ａ１，１３ａ２，…，１３ａｍと選択回路部１３ｂを有する。
ｋ_ｉ計算回路１３ａ１～１３ａｍは、前述の式（５）に示したｍａｘ（０，ΔＥ_ｉ）＋Ｔｌｎ（－ｌｎ（ｒ_ｉ））を、ｋ_ｉとして計算する。そして、ｋ_ｉ計算回路１３ａ１～１３ａｍは、ｋ_ｉとそのインデックス（ｉ）とを出力する。たとえば、ｋ_ｉ計算回路１３ａ１は、ｋ_１とｉ＝１を出力する。ｋ_ｉ計算回路１３ａ２は、ｋ_２とｉ＝２を出力する。ｋ_ｉ計算回路１３ａｍは、ｋ_ｍとｉ＝ｍを出力する。

選択回路部１３ｂは、ツリー状に複数段、配置された複数の選択回路（選択回路１３ｂ１，１３ｂ２，１３ｂ３，１３ｂ４，１３ｂ５など）を有する。
複数の選択回路のそれぞれは、２つのｋ_ｉのうち、小さい方とそのインデックスを出力する。２つのｋ_ｉの値が等しい場合には、たとえば、インデックスが小さい方と、そのインデックスが出力される。最後段の選択回路１３ｂ５が出力するインデックス（ｊ）が、式（５）のｊであり、値を変化させる状態変数のインデックスである。

（エネルギーの更新について）
図５は、エネルギーの更新を説明する図である。
探索部１３は、図５に示すようなエネルギー更新回路１３ｃを含む。エネルギー更新回路１３ｃは、ｘ_ｋの値が変化した場合、その変化量Δｘ_ｋと、ｘ_ｋの局所場であるｈ_ｋに基づいて、エネルギーを更新する。具体的には、元のエネルギーＥから、Δｘ_ｋｈ_ｋを減じることで、エネルギーＥを更新する。

（処理部１４の構成例）
次に、多重度Ｍを計算する処理部１４の構成例を説明する。
図６は、処理部の一例を示す図である。

処理部１４は、脱出確率計算回路２０、多重度計算回路２１、一様乱数発生回路２２、部分近傍切替判定回路２３を有する。
脱出確率計算回路２０は、探索部１３が出力するΔＥ_１，ΔＥ_２，…，ΔＥ_ｍを受ける。そして、前述の式（７）で表される脱出確率Ｐ_ｅを計算する。

多重度計算回路２１は、脱出確率計算回路２０が計算したＰ_ｅと一様乱数ｒに基づいて、前述の式（６）で表される多重度Ｍを計算する。
一様乱数発生回路２２は、０から１の間の一様乱数ｒを発生する。一様乱数発生回路２２は、たとえば、メルセンヌツイスタ、ＬＦＳＲ（Linear Feedback Shift Register）などを用いて実現できる。

部分近傍切替判定回路２３は、多重度Ｍの積算値が閾値（図１の例ではＬ_０）を超えた場合、探索部１３に解探索させる部分近傍を切り替える。
上記のようにＰ_ｅは、前述の式（７）で表されるが、式（７）は以下の式（８）のように展開できる。

式（８）において、ε_ｉは以下の式（９）で表せる。

式（８）で表せるＰ_ｅは、以下のような脱出確率計算回路により計算できる。
図７は、脱出確率計算回路の一例を示す図である。
脱出確率計算回路２０は、ε_ｉ計算回路２０ａ１，２０ａ２，…，２０ａｍ、Ａ_ｉ計算回路２０ｂ１，２０ｂ２，…，２０ｂｍ、加算回路２０ｃ、レジスタ２０ｄ、乗算回路２０ｅを有する。

ε_ｉ計算回路２０ａ１～２０ａｍのそれぞれは、ΔＥ_ｉとβ（逆温度）に基づいて、式（９）で表されるε_ｉを計算する。たとえば、ε_ｉ計算回路２０ａ１はε_１を計算し、ε_ｉ計算回路２０ａ２はε_２を計算し、ε_ｉ計算回路２０ａｍはε_ｍを計算する。

Ａ_ｉ計算回路２０ｂ１～２０ｂｍのそれぞれは、ΔＥ_ｉのエネルギー変化をもたらす状態変数の値の変化を受け入れる受入確率Ａ_ｉ（＝ｅｘｐ（－ε_ｉ））を計算する。たとえば、Ａ_ｉ計算回路２０ｂ１はｅｘｐ（－ε_１）を計算し、Ａ_ｉ計算回路２０ｂ２はｅｘｐ（－ε_２）を計算し、Ａ_ｉ計算回路２０ｂｍはｅｘｐ（－ε_ｍ）を計算する。

加算回路２０ｃは、ｅｘｐ（－ε_１）～ｅｘｐ（－ε_ｍ）を加算する。
レジスタ２０ｄは、クロック信号に同期して、加算回路２０ｃが出力する加算結果を保持し、出力する。レジスタ２０ｄは、リセット信号が入力された場合に、保持している内容を０に初期化する。

乗算回路２０ｅは、レジスタ２０ｄが出力する値に１／ｍを乗じ、その結果得られる脱出確率Ｐ_ｅを出力する。
なお、脱出確率の計算を、たとえば、２を底とする演算に変換することで、計算を高速に行えるようになる。このような演算を行うため、ε_ｉを、以下の式（１０）のように表せばよい。

式（１０）で表されるε_ｉは、式（９）で表されるε_ｉに、１／ｌｎ２＝１．４３３を乗じた値である。式（１０）で表されるε_ｉを用いた場合、脱出確率Ｐ_ｅは、以下の式（１１）で表せる。

このような演算により脱出確率Ｐ_ｅを計算することとすると、ε_ｉ計算回路２０ａ１～２０ａｍのそれぞれは、ΔＥ_ｉとβ（逆温度）に基づいて、式（１０）で表されるε_ｉを計算する。そして、Ａ_ｉ計算回路２０ｂ１～２０ｂｍのそれぞれは、２の－ε_ｉ乗を計算する。２の－ε_ｉ乗は、シフトレジスタなどを用いたシフト演算により計算できる。このため、ｅｘｐ（－ε_ｉ）を計算する場合よりも高速演算が可能となる。

なお、ε_ｉとして小数点２桁程度の小数表現を用いると、量子化誤差は十分小さくなる。
処理部１４は、近似的に多重度Ｍを求めてもよい。たとえば、値が変化した場合に、－ｌｏｇ（ｒ_ｉ）＞βΔＥ_ｉを満たす状態変数の個数から多重度Ｍを近似的に求めてもよい（たとえば、特許文献１参照）。

（部分近傍の切替方法）
図８は、部分近傍の切替方法の一例を示す図である。
図８の例では、第２記憶部１２は、第１記憶領域１２ａ、第２記憶領域１２ｂ、スイッチ１２ｃ，１２ｄを有している。

第１記憶領域１２ａは、たとえば、奇数のインデックスの部分近傍に関するＷ_ｉｊ群が記憶される記憶領域である。第２記憶領域１２ｂは、たとえば、偶数のインデックスの部分近傍に関するＷ_ｉｊ群が記憶される記憶領域である。つまり、図８の例では、第２記憶部１２は一度に２つの部分近傍に関するＷ_ｉｊ群を記憶できる。

スイッチ１２ｃは、処理部１４から供給されるスイッチ制御信号に基づいて、第１記憶部１１から読み出したＷ_ｉｊ群を、第１記憶領域１２ａに記憶するか第２記憶領域１２ｂに記憶するかを切り替える。

スイッチ１２ｄは、処理部１４から供給されるスイッチ制御信号に基づいて、第１記憶領域１２ａに記憶されているＷ_ｉｊ群と、第２記憶領域１２ｂに記憶されているＷ_ｉｊ群の何れを探索部１３に供給するかを切り替える。

処理部１４は、第１記憶領域１２ａに記憶されているＷ_ｉｊ群を使用した更新処理を探索部１３にさせている場合、スイッチ１２ｄにより第１記憶領域１２ａと探索部１３とを接続させる。第１記憶領域１２ａに記憶されているＷ_ｉｊ群を使用した更新処理が行われている間、処理部１４は、スイッチ１２ｃにより第１記憶部１１と第２記憶領域１２ｂとを接続させる。そして、処理部１４は、次に解探索される部分近傍に関するＷ_ｉｊ群を第１記憶部１１から読み出し、第２記憶領域１２ｂに書き込む。

第１記憶領域１２ａに記憶されているＷ_ｉｊ群を使用した解探索が終了した場合、処理部１４は、スイッチ１２ｄを切り替え、第２記憶領域１２ｂに記憶されているＷ_ｉｊ群を使用した更新処理を、探索部１３に行わせる。

このような構成によって、解探索を行う部分近傍を切り替えるときの、Ｗ_ｉｊ群の読みこみ時間を隠蔽でき、より効率のよい解探索を行うことができる。
（連続変数の適用）
以上の説明では、状態変数は、０または１の値を取るバイナリ変数であるものとしたが、状態変数が連続変数であってもよい。

バイナリ変数を用いた場合の状態遷移は、バイナリ変数の値を反転（Δｘ_ｉ＝１－２ｘ_ｉを元のｘ_ｉに加算）することで発生する。これに対して、連続変数を用いた場合の状態遷移は、元のｘ_ｉに連続値の確率変数Δｘ_ｉを加算（あるいは減算）することで発生する。加算するか減算するかは、確率５０％でランダムに選択される。

探索部１３は、部分近傍の解探索において、部分近傍に含まれる実数の各状態変数に対して、ある確率分布（たとえば、平均値＝０の正規分布）にしたがう確率変数Δｘ_ｉを発生する。

部分近傍の生成方法については、バイナリ変数を用いた場合と同様である。ただし、解探索時において、解探索を行う部分近傍を切り替えるたびに、探索部１３は、部分近傍に対する確率変数Δｘ_ｉを発生しなおす。

連続変数を用いた場合の評価関数は、以下の式（１２）で表せる。

式（１２）においてλ_ｉは、０より大きい値をもつ係数である。
状態変数ｘ_ｉの値が変化してｘ_ｉ＋δ_ｉΔｘ_ｉとなった場合のエネルギーＥの変化量は、以下の式（１３）で表せる。

ここで、δ_ｉはｘ_ｉごとに発生させる、確率５０％で＋１あるいは－１となる乱数である。Δｘ_ｉの値は、ある部分近傍についての解探索を行っている間は、一定で変化しない。式（１３）において、局所場（ｈ_ｉ）は以下の式（１４）で表せる。

式（１４）において、Ｃ_ｉｊは以下の式（１５）で表せる。

なお、式（１５）において、集合Ｅは非ゼロの重み係数ｗ_ｉｊをもつ係数インデックスの集合である。
式（１２）と式（１４）は、エネルギーの初期値と局所場の初期値の計算に用いられ、状態変数の値が変化した場合、エネルギーと局所場は、バイナリ変数を用いた場合と同様に差分計算により更新される。また、状態変数ｘ_ｊの変化が選択されて、ｘ_ｊ→ｘ_ｊ＋δ_ｊΔｘ_ｊと変化したとき、Δｘ_ｊの値はそのまま維持され、δ_ｊの値がランダムに発生しなおされる。

ｘ_ｊの値が、ｘ_ｊ＋δ_ｊΔｘ_ｊに変化した場合、エネルギーＥは、元のエネルギーＥからδ_ｊΔｘ_ｊｈ_ｊを減じることで更新される。局所場ｈ_ｉは、元のｈ_ｉにＣ_ｉｊδ_ｊΔｘ_ｊを加算することで更新される。このとき変化したｘ_ｊに関しては乱数δ_ｊが発生しなおされるため、ｈ_ｉの値はδ_ｊの値の変化による差分更新が行われる。この更新は、元のｈ_ｉからλ_ｊε_ｊ／２を減ずることで更新される。ε_ｊはδ_ｊΔｘ_ｊの変化量であり、以下の式（１６）で表せる。

式（１６）において、δ_ｊ ^{（ｏｌｄ）}は、ｘ_ｊの値を変化させる直前におけるδ_ｊの値であり、δ_ｊは発生しなおされた新しい値である。
なお、連続変数が用いられる場合、解探索を行う部分近傍が、切り替えられたときの局所場は、元のｈ_ｉからλ_ｉε_ｉ／２を減ずることで更新される。ε_ｉは使用される部分近傍に対する確率変数δ_ｉΔｘ_ｉの変化量であり、以下の式（１７）で表せる。

式（１７）において、（δ_ｉΔｘ_ｉ）^{（ｏｌｄ）}は部分近傍を切り替える直前の状態におけるｘ_ｉについての、δ_ｉΔｘ_ｉの値である。
図９は、連続変数を用いる場合の部分近傍の解探索の処理手順の一例を示すフローチャートである。

連続変数を用いた場合の処理手順は、バイナリ変数を用いた場合の処理手順（図３）とほぼ同様である。ステップＳ４０，Ｓ４１の処理は、図３に示したステップＳ２０，Ｓ２１の処理と同様である。

ステップＳ４１の処理後、連続変数を用いた場合、前述のように、探索部１３は、部分近傍に含まれる各状態変数に対して、確率変数Δｘ_ｉを発生する（ステップＳ４２）。以降のステップＳ４４～Ｓ５３の処理は、図３に示したステップＳ２２～Ｓ３２の処理と同様である。

ただし、解探索の対象を次の部分近傍に切り替えるために、ｋにｋ＋１を代入処理（ステップＳ５０）の処理後は、ステップＳ４２からの処理が繰り返される。また、ステップＳ４７の状態更新の際、上記のようにｘ_ｊの値が、ｘ_ｊ＋δ_ｊΔｘ_ｊに変化した場合、エネルギーＥは、元のエネルギーＥからδ_ｊΔｘ_ｊｈ_ｊを減じることで更新される。局所場ｈ_ｉは、元のｈ_ｉにＣ_ｉｊδ_ｊΔｘ_ｊを加算することで更新される。

以上のように、本実施の形態の手法は、状態変数として連続変数を用いた場合にも適用可能である。
（データ処理装置のハードウェア例）
図１０は、データ処理装置のハードウェア例を示す図である。

データ処理装置３０は、たとえば、コンピュータであり、プロセッサ３１、ＲＡＭ３２、ＨＤＤ３３、ＧＰＵ３４、入力インタフェース３５、媒体リーダ３６及び通信インタフェース３７、アクセラレータカード３８を有する。上記ユニットは、バスに接続されている。

プロセッサ３１は、たとえば、図１の処理部１４として機能する。プロセッサ３１は、プログラムの命令を実行する演算回路やキャッシュメモリなどの記憶回路を含む、ＧＰＵやＣＰＵなどのプロセッサである。プロセッサ３１は、ＨＤＤ２３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ３２にロードし、プログラムを実行する。なお、プロセッサ３１は、複数のプロセッサコアを備えてもよい。また、データ処理装置３０は複数のプロセッサを備えてもよい。なお、複数のプロセッサの集合（マルチプロセッサ）を「プロセッサ」と呼んでもよい。

ＲＡＭ３２は、プロセッサ３１が実行するプログラムやプロセッサ３１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、データ処理装置３０は、ＲＡＭ３２以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ３３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、及び、データを記憶する不揮発性の記憶装置である。プログラムには、たとえば、組合せ最適化問題の解を探索する処理をデータ処理装置３０に実行させるプログラムが含まれる。なお、データ処理装置３０は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

ＧＰＵ３４は、プロセッサ３１からの命令にしたがって、データ処理装置３０に接続されたディスプレイ３４ａに画像（たとえば、組合せ最適化問題の計算結果に関する画像）を出力する。ディスプレイ３４ａとしては、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ（ＰＤＰ：Plasma Display Panel）、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイなどを用いることができる。

入力インタフェース３５は、データ処理装置３０に接続された入力デバイス３５ａから入力信号を取得し、プロセッサ３１に出力する。入力デバイス３５ａとしては、マウスやタッチパネルやタッチパッドやトラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、データ処理装置３０に、複数の種類の入力デバイスが接続されていてもよい。

媒体リーダ３６は、記録媒体３６ａに記録されたプログラムやデータを読み取る読み取り装置である。記録媒体３６ａとして、たとえば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）が含まれる。

媒体リーダ３６は、たとえば、記録媒体３６ａから読み取ったプログラムやデータを、ＲＡＭ３２やＨＤＤ３３などの他の記録媒体にコピーする。読み取られたプログラムは、たとえば、プロセッサ３１によって実行される。なお、記録媒体３６ａは、可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体３６ａやＨＤＤ３３を、コンピュータ読み取り可能な記録媒体ということがある。

通信インタフェース３７は、ネットワーク３７ａに接続され、ネットワーク３７ａを介して他の情報処理装置と通信を行うインタフェースである。通信インタフェース３７は、スイッチなどの通信装置とケーブルで接続される有線通信インタフェースでもよいし、基地局と無線リンクで接続される無線通信インタフェースでもよい。

アクセラレータカード３８は、組合せ最適化問題の解を探索するハードウェアアクセラレータである。アクセラレータカード３８は、ＦＰＧＡ３８ａ及びＤＲＡＭ３８ｂを有する。

ＦＰＧＡ３８ａは、たとえば、図１に示した第２記憶部１２と探索部１３の機能を実現する。
ＤＲＡＭ３８ｂは、たとえば、図１に示した第１記憶部１１の機能を実現する。

なお、ＦＰＧＡ３８ａが図１に示した処理部１４の機能を実現してもよい。また、アクセラレータカード３８は、複数あってもよい。
図１に示したデータ処理装置１０を実現するハードウェア構成は、図１０に示したような構成に限られない。たとえば、複数コアを有するＧＰＵなどのプロセッサとプロセッサ内のメモリにより、第２記憶部１２、探索部１３、処理部１４の機能が実現されるようにしてもよい。

本実施の形態のデータ処理装置１０，３０が行う処理内容（たとえば、図２、図３、図９など）は、データ処理装置１０，３０にプログラムを実行させることでソフトウェアにて実現することもできる。

プログラムは、コンピュータ読み取り可能な記録媒体に記録しておくことができる。記録媒体として、たとえば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）及びＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）、ＣＤ－Ｒ（Recordable）／ＲＷ（Rewritable）、ＤＶＤ（Digital Versatile Disc）及びＤＶＤ－Ｒ／ＲＷが含まれる。プログラムは、可搬型の記録媒体に記録されて配布されることがある。その場合、可搬型の記録媒体から他の記録媒体にプログラムをコピーして実行してもよい。

以上、実施の形態に基づき、本発明のデータ処理装置、プログラム及びデータ処理方法の一観点について説明してきたが、これらは一例にすぎず、上記の記載に限定されるものではない。

１０データ処理装置
１１第１記憶部
１２第２記憶部
１３探索部
１４処理部

Claims

組合せ最適化問題を変換した評価関数に含まれる複数の重み係数の値を記憶する第１記憶部と、
前記複数の重み係数のうち、前記評価関数に含まれる複数の状態変数を分割した複数の状態変数群から選択された状態変数群に関する、重み係数群の値を記憶する第２記憶部と、
前記第２記憶部から読み出した前記重み係数群の値を用いて、前記状態変数群の各状態変数の値を変化させたときの前記評価関数の値の変化量を計算する処理と、前記変化量と温度値に基づいて、前記状態変数群の何れかの状態変数の値を変化させる処理とを含む更新処理を繰り返すことで、前記組合せ最適化問題の解を探索する探索部と、
マルコフ連鎖モンテカルロ法を用いて前記解の探索を行う場合に、前記状態変数群の値が維持される試行回数である多重度を、前記変化量と前記温度値に基づいて計算し、前記多重度の積算値が所定の閾値を超えた場合、前記複数の状態変数群から選択した他の状態変数群に関する前記重み係数群の値を用いた前記更新処理を、前記探索部に実行させる処理部と、
を有するデータ処理装置。
前記探索部は、前記更新処理ごとの前記複数の状態変数の値を出力し、前記処理部は、前記複数の状態変数の値ごとの前記多重度を出力する、請求項１に記載のデータ処理装置。
前記処理部は、
前記変化量と前記温度値に基づいて、前記状態変数群の各状態変数について、値の変化を受け入れる確率を計算し、
前記確率の総和を、前記状態変数群に含まれる状態変数の数で割ることで脱出確率を計算し、
前記脱出確率と乱数値に基づいて前記多重度を計算する、
請求項１に記載のデータ処理装置。
前記処理部は、シフト演算により前記確率を計算する請求項３に記載のデータ処理装置。
前記第２記憶部は、第１記憶領域及び第２記憶領域を有し、
前記第１記憶領域に記憶されている前記重み係数群の値を用いて、前記探索部が前記更新処理を行っている間に、前記他の状態変数群に関する前記重み係数群の値が前記第１記憶部から読み出されて、前記第２記憶領域に書き込まれる、
請求項１に記載のデータ処理装置。
組合せ最適化問題を変換した評価関数に含まれる複数の重み係数の値を第１記憶部に記憶し、
前記複数の重み係数のうち、前記評価関数に含まれる複数の状態変数を分割した複数の状態変数群から選択された状態変数群に関する、重み係数群の値を第２記憶部に記憶し、
前記第２記憶部から読み出した前記重み係数群の値を用いて、前記状態変数群の各状態変数の値を変化させたときの前記評価関数の値の変化量を計算する処理と、前記変化量と温度値に基づいて、前記状態変数群の何れかの状態変数の値を変化させる処理とを含む更新処理を繰り返すことで、前記組合せ最適化問題の解を探索し、
マルコフ連鎖モンテカルロ法を用いて前記解の探索を行う場合に、前記状態変数群の値が維持される試行回数である多重度を、前記変化量と前記温度値に基づいて計算し、
前記多重度の積算値が所定の閾値を超えた場合、前記複数の状態変数群から選択した他の状態変数群に関する前記重み係数群の値を用いた前記更新処理を実行する、
処理をコンピュータに実行させるプログラム。
第１記憶部が、組合せ最適化問題を変換した評価関数に含まれる複数の重み係数の値を記憶し、
第２記憶部が、前記複数の重み係数のうち、前記評価関数に含まれる複数の状態変数を分割した複数の状態変数群から選択された状態変数群に関する、重み係数群の値を記憶し、
探索部が、前記第２記憶部から読み出した前記重み係数群の値を用いて、前記状態変数群の各状態変数の値を変化させたときの前記評価関数の値の変化量を計算する処理と、前記変化量と温度値に基づいて、前記状態変数群の何れかの状態変数の値を変化させる処理とを含む更新処理を繰り返すことで、前記組合せ最適化問題の解を探索し、
処理部が、マルコフ連鎖モンテカルロ法を用いて前記解の探索を行う場合に、前記状態変数群の値が維持される試行回数である多重度を、前記変化量と前記温度値に基づいて計算し、前記多重度の積算値が所定の閾値を超えた場合、前記複数の状態変数群から選択した他の状態変数群に関する前記重み係数群の値を用いた前記更新処理を、前記探索部に実行させる、
データ処理方法。