JP2023149726A

JP2023149726A - データ処理装置、プログラム及びデータ処理方法

Info

Publication number: JP2023149726A
Application number: JP2022058462A
Authority: JP
Inventors: 芳印; Kaoru In; 泰孝田村; Yasutaka Tamura
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2023-10-13
Also published as: US20230315943A1; EP4254271A1; CN116894488A

Abstract

【課題】制約条件をもつ離散最適化問題に対する計算時間のオーバーヘッドを削減する。【解決手段】複数の制約条件のそれぞれの違反の有無を表す複数の補助変数を用い、処理部１２は、複数の状態変数のうち第１状態変数の値の変化を許容すると判定した場合、記憶部１１に記憶されている、第１状態変数と複数の補助変数のそれぞれとの間の第２重み値に基づいて複数の補助変数のそれぞれの値が変化する場合の総エネルギーの変化量に比例する値である第２局所場を更新し、第２局所場に基づいて、複数の補助変数のうち第１補助変数の値の変化を許容するか否かを判定し、第１補助変数の値の変化を許容すると判定した場合、第１補助変数の値を更新し、第１補助変数に関する第２重み値に基づいて複数の状態変数のそれぞれの値が変化する場合の総エネルギーの変化量を表す第１局所場を更新する。【選択図】図１

Description

本発明は、データ処理装置、プログラム及びデータ処理方法に関する。

ノイマン型コンピュータが不得意とする大規模な離散最適化問題を計算する装置として、イジング型の評価関数（エネルギー関数などとも呼ばれる）を用いたイジング装置（ボルツマンマシンとも呼ばれる）がある。

イジング装置は、離散最適化問題を磁性体のスピンの振る舞いを表すイジングモデルに変換する。そして、イジング装置は、疑似焼き鈍し法やレプリカ交換法（パラレルテンパリング法などとも呼ばれる）などのマルコフ連鎖モンテカルロ法により、イジング型の評価関数の値（エネルギーに相当する）が極小になるイジングモデルの状態を探索する。評価関数の極小値のうちの最小値になる状態が最適解となる。なお、イジング装置は、評価関数の符号を変えれば、評価関数の値が極大になる状態を探索することもできる。イジングモデルの状態は、複数の状態変数の値の組合せにより表現できる。各状態変数の値として、０または１を用いることができる。

イジング型の評価関数は、たとえば、以下の式（１）のような２次形式の関数で定義される。

右辺の１項目は、イジングモデルのＮ個の状態変数の全組合せについて、漏れと重複なく、２つの状態変数の値（０または１）と重み値（２つの状態変数の間の相互作用の強さを表す）との積を積算したものである。ｘ_ｉは、識別番号がｉの状態変数、ｘ_ｊは、識別番号がｊの状態変数であり、Ｗ_ｉｊは、識別番号がｉとｊの状態変数間の相互作用の大きさを示す重み値である。右辺の２項目は、各識別番号についてのバイアス係数と状態変数との積の総和を求めたものである。ｂ_ｉは、識別番号＝ｉについてのバイアス係数を示している。

また、ｘ_ｉの値の変化に伴うエネルギーの変化量（ΔＥ_ｉ）は、以下の式（２）で表される。

式（２）において、ｘ_ｉが１から０に変化するとき、Δｘ_ｉは－１となり、状態変数ｘ_ｉが０から１に変化するとき、Δｘ_ｉは１となる。なお、ｈ_ｉは局所場と呼ばれ、Δｘ_ｉに応じてｈ_ｉに符号（＋１または－１）を乗じたものがΔＥ_ｉとなる。このため、ｈ_ｉはエネルギーの変化量を表す変数、またはエネルギーの変化量を決める変数ということもできる。

そして、たとえば、ｅｘｐ（－βΔＥ_ｉ）（βは温度を表すパラメータの逆数）と表せる受け入れ確率でｘ_ｉの値を更新することで状態遷移を発生させ、局所場も更新する、という処理が繰り返される。

ところで、離散最適化問題には、解が満たすべき制約条件をもつものがある（たとえば、特許文献１、２参照）。たとえば、離散最適化問題の１つであるナップザック問題では、ナップザックに詰め込める荷物の総容量は、ナップザックの容量以下であるという制約条件をもつ。このような制約条件は、不等式制約と呼ばれ、制約条件の違反の有無に応じた値をもつ制約項により表せる。制約条件として、不等式制約の他にも、等式制約や絶対値制約などがある。

制約項を含む総エネルギー（Ｈ（ｘ））は、以下の式（３）により表すことができる。

式（３）において、右辺の１項目と２項目の和が、式（１）のＥ（ｘ）に相当するエネルギーを表し、右辺の３項目が制約項の全体の大きさ（エネルギー）を表す。また、Ｄは状態変数の識別番号の集合、ｋは制約項の識別番号、Ａは制約項の識別番号の集合を表す。また、λ_ｋは識別番号がｋの制約項についての所定の正の係数である。

制約条件が不等式制約である場合、式（３）のｇ（ｈ_ｋ）は、以下の式（４）で表すことができる。

式（４）において、ｍａｘ［０，ｈ_ｋ］は、０とｈ_ｋのうち大きい値を出力する関数である。また、Ｒ_ｋは、識別番号がｋの制約項の消費量（リソース量とも呼ばれる）、Ｕ_ｋはリソース量の上限を表す。Ｗ_ｋｉは、識別番号がｋの不等式制約におけるｘ_ｉの重みを示す係数（重み値）である。

式（３）において、ｘ_ｊの値の変化に伴うエネルギーの変化量（ΔＨ_ｊ）は、以下の式（５）で表される。

制約条件が不等式制約である場合、ｘ_ｊの値の変化に伴うエネルギーの変化量（ΔＨ_ｊ）は、式（５）の代わりに、以下の式（６）で表すことができる。

式（６）において、ａ_ｉｊは、識別番号がｉの不等式制約におけるｘ_ｊの重みを示す係数であり、上記Ｗ_ｋｉに相当する。Ｃ_ｕｉは、識別番号がｉの不等式制約における上限値であり、上記Ｕ_ｋに相当する。Ｍは、制約項の数を表す。

ｘ_ｊの値の変化を受け入れる受け入れ確率は、Ａ_ｊ＝ｍｉｎ［１，ｅｘｐ（－βΔＨ_ｊ）］と表せる。ｍｉｎ［１，ｅｘｐ（－βΔＨ_ｊ）］は、１とｅｘｐ（－βΔＨ_ｊ）のうち小さい値を出力する関数である。

式（３）は、式（１）のような２次形式の関数ではなく１次形式の不連続関数である。従来、不等式制約をイジング装置で扱えるようにするために、１次形式の不連続関数を２次形式に変換する技術が提案されている。しかし、２次形式に変換した不等式制約の制約項を用いて離散最適化問題を計算する場合、処理が煩雑になるなど、イジング装置で求解を行うことが難しい場合があった。

そこで、従来、上記のような不等式制約の制約項を１次形式のまま用いて、イジング装置で求解を行う技術が提案されている（たとえば、特許文献２参照）。

特開２０２０－２０１５９８号公報特開２０２０－２０４９２８号公報

不等式制約の制約項を１次形式のまま用いて求解を行う従来の技術では、状態変数の値の変化に伴うΔＨ_ｊの計算を行う際に、各制約項に関する係数（上記の式（６）の例ではａ_ｉｊ）を全て用いた計算が行われていた。

各制約項に関する係数は、１０００個以上となる場合もある。従来の技術では、ΔＨ_ｊを計算する際に、全係数をメモリから読み出して加算処理を行うため、計算時間のオーバーヘッドが大きくなってしまう場合がある。

１つの側面では、本発明は、制約条件をもつ離散最適化問題に対する計算時間のオーバーヘッドを削減可能なデータ処理装置、プログラム及びデータ処理方法を提供することを目的とする。

１つの実施態様では、複数の状態変数を含むイジング型の評価関数の値が極小または極大となる前記複数の状態変数の値の組合せを探索するデータ処理装置において、複数の制約条件のそれぞれの違反の有無に応じた値をもつ複数の制約項の値と、前記評価関数の値との和である総エネルギーと、前記複数の状態変数の値と、前記複数の制約条件のそれぞれの違反の有無を表す複数の補助変数の値と、前記複数の状態変数のそれぞれの間の第１重み値と、前記複数の状態変数の何れかと前記複数の補助変数のそれぞれとの間の第２重み値と、前記複数の状態変数のそれぞれの値が変化する場合の前記総エネルギーの変化量を表す第１局所場と、前記複数の補助変数のそれぞれの値が変化する場合の前記総エネルギーの変化量に比例する値である第２局所場と、を記憶する記憶部と、前記複数の状態変数のうち第１状態変数の値の変化を許容するか否かを前記第１局所場に基づいて判定する処理と、前記第１状態変数の値の変化を許容すると判定した場合、前記第１状態変数の値を更新し、前記第１状態変数に関する前記第１重み値に基づいて前記第１局所場を更新し、前記第１状態変数に関する前記第２重み値に基づいて前記第２局所場を更新する処理と、を含む第１処理と、前記複数の補助変数のうち第１補助変数の値の変化を許容するか否かを前記第２局所場に基づいて判定する処理と、前記第１補助変数の値の変化を許容すると判定した場合、前記第１補助変数の値を更新し、前記第１補助変数に関する前記第２重み値に基づいて前記第１局所場を更新する処理と、を含む第２処理を行う処理部と、を有するデータ処理装置が提供される。

また、１つの実施態様では、プログラムが提供される。
また、１つの実施態様では、データ処理方法が提供される。

１つの側面では、本発明は、制約条件をもつ離散最適化問題に対する計算時間のオーバーヘッドを削減できる。

第１の実施の形態のデータ処理装置及びデータ処理方法の一例を示す図である。状態変数と補助変数との間の相互作用の例を示す図である。誤差の補正例を示す図である。比較例のデータ処理装置を示す図である。第２の実施の形態のデータ処理装置のハードウェア例を示すブロック図である。データ処理装置の機能例を示すブロック図である。局所場の更新処理の例を示す図である。データ処理方法の１つ目の例の流れを示すフローチャートである。データ処理方法の２つ目の例の流れを示すフローチャートである。データ処理装置の他の例を示す図である。４値の補助変数を用いた例を示す図である。

以下、発明を実施するための形態を、図面を参照しつつ説明する。
（第１の実施の形態）
図１は、第１の実施の形態のデータ処理装置及びデータ処理方法の一例を示す図である。

第１の実施の形態のデータ処理装置１０は、記憶部１１、処理部１２を有する。
記憶部１１は、たとえば、ＤＲＡＭ（Dynamic Random Access Memory）などの電子回路である揮発性の記憶装置、または、ＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの電子回路である不揮発性の記憶装置である。記憶部１１は、レジスタなどの電子回路を含んでいてもよい。

記憶部１１は、Ｈ（ｘ）、複数（以下Ｎ個）の状態変数（ｘ_ｉ）の値、複数（以下Ｍ個）の補助変数（ｘ_ｋ）の値、Ｎ個のｘ_ｉのそれぞれの間の第１重み値（前述のＷ_ｉｊ）、Ｎ個のｘ_ｉの何れかとＭ個のｘ_ｋのそれぞれとの間の第２重み値（Ｗ_ｋｉ）を記憶する。

ｉは、Ｎ個のｘ_ｉの何れかを表す識別番号であり、ｋは、Ｍ個のｘ_ｋの何れか、またはＭ個の制約項（またはＭ個の制約条件）の何れかを表す識別番号である。
Ｍ個のｘ_ｋは、Ｍ個の制約条件のそれぞれの違反の有無を表す。以下の説明では、ｘ_ｋは、識別番号＝ｋの制約条件を違反している場合に１、制約条件を充足している場合に０の値をもつとして説明するが、これに限定されるわけではない。ｘ_ｋとして－１または＋１の値をもつスピン変数を用いることもできる。また、補助変数は、制約条件違反の場合に、０以外の複数の値をもつものであってもよい（図１１参照）。

さらに、記憶部１１は、Ｎ個のｘ_ｉのそれぞれの値が変化する場合のＨ（ｘ）の変化量を表す第１局所場（ｈ_ｉ）と、Ｍ個のｘ_ｋのそれぞれの値が変化する場合のＨ（ｘ）の変化量に比例する値である第２局所場（ｈ_ｋ）を記憶する。なお、状態変数は、決定変数と呼ぶこともできる。

Ｍ個の不等式制約に対応したＭ個の制約項の全体のエネルギーＰ（ｘ）は、以下の式（７）で表すことができる。

λ_ｋは、識別番号＝ｋの制約項に関する比例係数であり、制約項の重みを表す。λ_ｋは制約項ごとに異なる値であってもよい。Ｕ_ｋは不等式制約においてリソース量（Ｒ_ｋ（ｘ））が満たすべき上限を表す。Ｒ_ｋ（ｘ）は、以下の式（８）で表すことができる。

式（３）、式（４）により表されるＨ（ｘ）は、補助変数（ｘ_ｋ）を用いることで、以下の式（９）で表すことができる。

ｘ_ｋは、Ｍ個の不等式制約の数に対応してＭ個用いられる。以下の例では、ｘ_ｋは、次の式（１０）で表されるものとする。

図１には、状態変数（決定変数）と補助変数とのそれぞれをニューロンとみなした場合の、ニューラルネットワークの例が示されている。ニューラルネットワークは、状態変数によるボルツマンマシンのニューラルネットワークに、制約条件違反を検出する補助変数によるニューロンが追加された構成となっている。

図１の例では、補助変数ｘ_ｐを表すニューロンが、状態変数ｘ_１，ｘ_ｉ，ｘ_ｊを表すニューロンと接続されている。すなわち、ｘ_ｐとｘ_１，ｘ_ｉ，ｘ_ｊのそれぞれとの間の第２重み値が０以外の値をもつ。補助変数ｘ_ｑを表すニューロンは、状態変数ｘ_２，ｘ_ｉなどを表すニューロンと接続されている。各不等式制約に対して、全ての状態変数が影響を与えているわけではないことが多いため、第２重み値は、各不等式制約に対して影響を与える状態変数について記憶されていればよい。

図２は、状態変数と補助変数との間の相互作用の例を示す図である。
Ｎ個の状態変数の間では相互作用の強さは、Ｎ×Ｎ個のＷ_ｉｊで表せる。たとえば、ｘ_１とｘ_ｉの間の相互作用の強さはＷ_１ｉ、ｘ_ｉとｘ_Ｎの間の相互作用の強さはＷ_ｉＮ、ｘ_１とｘ_Ｎの間の相互作用の強さはＷ_１Ｎである。一方、状態変数と補助変数の間の相互作用では、状態変数の値の変化が補助変数に与える影響と、補助変数の変化が状態変数に与える影響とで異なる。たとえば、図２のように、状態変数のｘ_ｉの値の変化が補助変数ｘ_ｋに与える影響は、重み値Ｗ_ｋｉで表せ、補助変数のｘ_ｋの値の変化が状態変数ｘ_ｉに与える影響は、－λ_ｋＷ_ｋｉと表せる。

図１に示した記憶部１１に記憶されるＮ個の第１局所場（ｈ_ｉ）は、以下の式（１１）で表すことができる。

記憶部１１に記憶されるＭ個の第２局所場（ｈ_ｋ）は、以下の式（１２）で表すことができる。

記憶部１１は、さらにバイアス係数（ｂ_ｉ）、比例係数（λ_ｋ）、上限（Ｕ_ｋ）を記憶してもよい。また、記憶部１１は、処理部１２が後述のデータ処理方法を実行する際の計算条件など各種のデータを記憶してもよい。また、処理部１２が、ソフトウェアにより後述のデータ処理方法の一部またはすべての処理を実行する場合には、記憶部１１には、その処理を実行するためのプログラムが記憶される。

図１の処理部１２は、たとえば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）などのハードウェアであるプロセッサにより実現できる。また、処理部１２は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの電子回路により実現されるようにしてもよい。

処理部１２は、たとえば、式（１）に示した評価関数の値（エネルギー）が極小になる状態を探索する。評価関数の極小値のうちの最小値になるときの状態が最適解となる。なお、式（１）に示した評価関数と式（７）に示した制約項の符号を変えれば、処理部１２は、評価関数の値が極大になる状態を探索することもできる（この場合、最大値となるときの状態が最適解となる）。

図１には、処理部１２による処理の一例の流れが示されている。
なお、ここではＨ（ｘ）、ｈ_ｉ、ｈ_ｋ、ｘ_ｋとして、ｘ_１～ｘ_Ｎの初期値に基づいた値が、記憶部１１に記憶されているものとする。

ステップＳ１～Ｓ５が状態変数に関する処理であり、ステップＳ６～Ｓ１０が補助変数に関する処理である。
処理部１２は、Ｎ個の状態変数から、値を変化させる候補（以下フリップ候補という）の状態変数を選択する（ステップＳ１）。処理部１２は、たとえば、ランダムにまたは所定の順序で、フリップ候補の状態変数を選択する。

そして、処理部１２は、選択された状態変数の値が変化する場合のΔＨを計算する（ステップＳ２）。たとえば、ｘ_ｉが選択された場合、ΔＨは、式（１１）に示したｈ_ｉに基づいて、ΔＨ＝－ｈ_ｉΔｘ_ｉという式により計算できる。

次に、処理部１２は、ΔＨと、所定値との比較結果に基づいて、フリップ候補の状態変数の値の変化を許容するか否か（フリップ可か否か）の判定を行う（ステップＳ３）。以下、この判定処理を、フリップ判定処理という。

所定値は、たとえば、乱数と温度パラメータの値とに基づいて得られるノイズ値である。たとえば、０以上１以下の一様乱数（ｒａｎｄ）と温度パラメータ（Ｔ）とに基づいて得られるノイズ値の例であるｌｏｇ（ｒａｎｄ）×Ｔを、所定値として用いることができる。この場合、処理部１２は、－ΔＨ_ｉ≧ｌｏｇ（ｒａｎｄ）×Ｔの場合、フリップ候補の状態変数の値の変化を許容する（フリップ可）と判定する。

処理部１２は、フリップ可と判定した場合、ｈ_ｉ、ｈ_ｋ、Ｈ（ｘ）、ｘ_ｉ（フリップ可と判定された状態変数）の更新を行う（ステップＳ４）。なお、処理部１２は、フリップ可と判定しない場合、ｈ_ｉ、ｈ_ｋ、Ｈ（ｘ）、ｘ_ｉの更新を行わない。

処理部１２は、元のＨ（ｘ）にΔＨを加算することでＨ（ｘ）の更新を行う。また、処理部１２は、たとえば、ｘ_ｊをフリップ可と判定した場合、Ｎ個の状態変数のそれぞれについての元のｈ_ｉに、Δｈ_ｉ＝Ｗ_ｉｊΔｘ_ｊを加えることで、ｈ_ｉの更新を行う。さらに、処理部１２は、ｘ_ｊをフリップ可と判定した場合、Ｍ個の状態変数のそれぞれについての元のｈ_ｋに、Δｈ_ｋ＝Ｗ_ｋｊΔｘ_ｊを加えることで、ｈ_ｋの更新を行う。ｘ_ｊの値を変更した場合に、識別番号＝ｋの制約条件の違反が生じる場合、この更新によってｈ_ｋは正の値になり、後述のステップＳ８の処理により、ｘ_ｋの０から１への変化が許容される。

その後、処理部１２は、以上のような処理がＡ回行われたか否かを判定する（ステップＳ５）。Ａは１以上の整数である。処理部１２は、以上のような処理が、Ａ回行われていないと判定した場合、ステップＳ１からの処理を繰り返す。

処理部１２は、以上のような処理が、Ａ回行われたと判定した場合、Ｍ個の補助変数から、フリップ候補の補助変数を選択する（ステップＳ６）。処理部１２は、たとえば、ランダムにまたは所定の順序で、フリップ候補の補助変数を選択する。

そして、処理部１２は、選択された補助変数の値が変化する場合のΔＨを計算する（ステップＳ７）。たとえば、ｘ_ｋが選択された場合、ΔＨは、式（１２）に示したｈ_ｋを用いて、ΔＨ＝＋λ_ｋｈ_ｋΔｘ_ｋという式により計算できる。

次に、処理部１２は、ΔＨと所定値との比較結果に基づいて、フリップ候補の補助変数の値の変化を許容するか否か（フリップ可か否か）の判定（フリップ判定処理）を行う（ステップＳ８）。

所定値は、ステップＳ３の処理で用いた値と同じであってもよいし、固定値（たとえば、０）であってもよい。所定値として、ｌｏｇ（ｒａｎｄ）×Ｔを用いた場合、処理部１２は、ΔＨ＞ｌｏｇ（ｒａｎｄ）×Ｔの場合、フリップ候補の補助変数をフリップ可と判定する。ステップＳ４の処理による状態変数の値の変化により、制約違反が生じている場合、式（１２）のｈ_ｋは正の値となり、ｘ_ｋの０から１への変化の場合の変化量Δｘ_ｋ＝１であるため、ΔＨは正の値である。また、ｌｏｇ（ｒａｎｄ）×Ｔは負の値である。このため、ΔＨ＞ｌｏｇ（ｒａｎｄ）×Ｔという判定式を用いることで、ｘ_ｋの０から１への変化が許容される。

処理部１２は、フリップ候補のｘ_ｋをフリップ可と判定した場合、ｈ_ｉ、Ｈ（ｘ）、ｘ_ｋ（フリップ可と判定された補助変数）の更新を行う（ステップＳ９）。なお、処理部１２は、フリップ可と判定しない場合、ｈ_ｉ、Ｈ（ｘ）、ｘ_ｋの更新を行わない。

処理部１２は、元のＨ（ｘ）にΔＨを加算することでＨ（ｘ）の更新を行う。また、処理部１２は、たとえば、ｘ_ｋがフリップ可と判定された場合、Ｎ個の状態変数のそれぞれについての元のｈ_ｉに、Δｈ_ｉ＝－λ_ｋＷ_ｋｉΔｘ_ｋを加えることで、ｈ_ｉの更新を行う。

その後、処理部１２は、以上のような処理が、Ｂ回行われたか否かを判定する（ステップＳ１０）。Ｂは１以上の整数である。処理部１２は、以上のような処理が、Ｂ回行われていないと判定した場合、ステップＳ６からの処理を繰り返す。

処理部１２は、以上のような処理が、Ｂ回行われたと判定した場合、再びステップＳ１からの処理を繰り返す。
上記のステップＳ２の処理では、補助変数の値を変えずにΔＨを計算するため、補助変数の値の変化の有無によって誤差が生じる場合があるが、ステップＳ７の処理によって得られるΔＨ＝＋λ_ｋｈ_ｋΔｘ_ｋにより、その誤差を補正できる。

図３は、誤差の補正例を示す図である。縦軸は、識別番号がｋの制約項の大きさを表し、横軸は前述の式（８）で表されるＲ_ｋ（ｘ）（リソース量）を表す。
Ｒ_ｋ（ｘ）がＵ_ｋを超えるまで不等式制約が満たされるため、制約項の大きさも０である。一方、Ｒ_ｋ（ｘ）がＵ_ｋを超えると、λ_ｋｍａｘ［０，Ｒ_ｋ（ｘ）－Ｕ_ｋ］という式にしたがって、制約項は増加する。ただ、上記のようにステップＳ２の処理では、補助変数の値を変えずにΔＨを計算するため、その時点では、ΔＨに誤差が生じる場合がある。

たとえば、図３のＡ点では、Ｒ_ｋ（ｘ）がＵ_ｋを超えている（制約条件違反が生じている）にもかかわらず、ｘ_ｋ＝０であることから制約項の大きさは０であり、λ_ｋｈ_ｋΔｘ_ｋの誤差が生じている。そこで、処理部１２は、ｘ_ｋの値の変化（０から１への変化）を許容し、ステップＳ７の処理により得られるΔＨ＝＋λ_ｋｈ_ｋΔｘ_ｋを用いて、制約項を適切な大きさ（Ｂ点の大きさ）に補正する。

また、たとえば、図３のＣ点では、Ｒ_ｋ（ｘ）がＵ_ｋ以下である（制約条件違反が解消されている）にもかかわらず、ｘ_ｋ＝１であることから制約項の大きさは０ではなく、λ_ｋｈ_ｋΔｘ_ｋの誤差が生じている。そこで、処理部１２は、ｘ_ｋの値の変化（１から０への変化）を許容し、ステップＳ７の処理により得られるΔＨ＝＋λ_ｋｈ_ｋΔｘ_ｋを用いて、制約項を適切な大きさ（Ｄ点の大きさ）に補正する。

なお、図１に示した処理の順序は一例であり、適宜処理の順序を入れ替えてもよい。
また、上記の説明では、Ｎ個の状態変数のうちフリップ候補の状態変数を１つずつ選択して、ステップＳ２～Ｓ３の処理が行われる例を示したが、複数（たとえばＮ個全て）の状態変数について並列にステップＳ２～Ｓ３の処理が行われるようにしてもよい。その場合、処理部１２は、値の変更が許容された状態変数の数が複数あるとき、ランダムに、または所定のルールにしたがって、値を変化させる状態変数を選択する。

同様に、上記の説明では、Ｍ個の状態変数のうちフリップ候補の補助変数を１つずつ選択して、ステップＳ７～Ｓ８の処理が行われる例を示したが、複数（たとえばＭ個全て）の状態変数について並列にステップＳ７～Ｓ８の処理が行われるようにしてもよい。その場合、処理部１２は、値の変更が許容された補助変数の数が複数あるとき、ランダムに、または所定のルールにしたがって、値を変化させる補助変数を選択する。

処理部１２は、疑似焼き鈍し法を行う場合、たとえば、状態変数についてのフリップ判定処理が所定回数、繰り返されるたび、所定の温度パラメータ変更スケジュールにしたがって、前述の温度パラメータ（Ｔ）の値を小さくしていく。そして、処理部１２は、フリップ判定処理が所定の回数繰り返された場合に得られた状態を、離散最適化問題の計算結果として出力する（たとえば、図示しない表示装置に表示する）。なお、処理部１２は、これまでの最小エネルギーとなった場合の総エネルギーと状態とを記憶部１１に保持させておいてもよい。その場合、処理部１２は、フリップ判定処理が所定の回数繰り返された後に記憶されている最小エネルギーに対応する状態を、計算結果として出力してもよい。

処理部１２がレプリカ交換法を行う場合、処理部１２は、それぞれ異なるＴの値が設定された複数のレプリカのそれぞれにおいて、上記のステップＳ１～Ｓ１０の処理を繰り返す。そして、処理部１２は、フリップ判定処理が所定回数繰り返されるごとに、レプリカ交換を行う。たとえば、処理部１２は、隣り合うＴの値をもつレプリカを２つ選択して、選択された２つのレプリカの間で、レプリカ間のエネルギー差やＴの値の差に基づいた所定の交換確率で、各状態変数の値及び各補助変数の値を交換する。なお、２つのレプリカの間で、各状態変数の値及び各補助変数の値の代わりにＴの値が交換されてもよい。または、処理部１２は、これまでの最小エネルギーとなった場合の総エネルギーと状態とを保持する。そして、処理部１２は、各レプリカにおいて上記のフリップ判定処理が所定の回数繰り返された後に記憶されている最小エネルギーのうち、全レプリカにおいて最小のエネルギーに対応する状態を、計算結果として出力する。

レプリカ交換法を用いることで、状態がほとんど変化しない低温側（Ｔの値が小さい側レプリカ）でも状態が変化するようになり良い解を短時間で発見できる可能性が高くなる。

以上のようなデータ処理装置１０及びデータ処理方法によれば、ある制約条件の違反の有無を表す補助変数（ｘ_ｋ）の値の変更が許容された場合に、Ｎ個のＷ_ｋｉに基づいて、ｈ_ｉが更新される。これにより、Ｍ個全ての制約項に関するＷ_ｋｉを読み出さなくてもよくなり、加算処理（元のｈ_ｉにΔｈ_ｉ＝－λ_ｋＷ_ｋｉΔｘ_ｋを加える処理）が行われる回数が抑制され、更新処理にかかる計算時間のオーバーヘッドを削減できる。

図４は、比較例のデータ処理装置を示す図である。
比較例のデータ処理装置２０は、従来のように、状態変数の値の変化に伴うΔＨ_ｊの計算を行う際に、各制約項に関する係数（前述の式（５）の例ではＷ_ｋｊ、式（６）の例ではａ_ｉｊ）を全て用いた計算を行う。

比較例のデータ処理装置２０は、状態保持部２１、ΔＥ計算部２２、ΔＰ加算部２３、遷移可否判定部２４、選択部２５、更新部２６、ΔＰ計算部２７を有する。
状態保持部２１は、状態ｘ（ｘ_１～ｘ_Ｎ）を保持するとともに、ｘを出力する。また、状態保持部２１は、Δｘ_ｊを出力する。

ΔＥ計算部２２は、ｘ_１～ｘ_Ｎのそれぞれが変化する場合の、ΔＥ_ｊ（式（５）の右辺の１項目）を計算する。
ΔＰ加算部２３は、ΔＥ_ｊにΔＰ_ｊ（式（５）の右辺の２項目）を加算する。これにより、式（５）のΔＨ_ｊが計算される。

遷移可否判定部２４は、ΔＨ_ｊと前述の所定値との比較結果に基づいて、ｘ_１～ｘ_Ｎのそれぞれについて、フリップ判定処理を行う。
選択部２５は、フリップ可と判定された状態変数が複数ある場合に、何れか１つの状態変数を選択する。

更新部２６は、フリップ可と判定された状態変数の識別番号を状態保持部２１に送り、その状態変数の値を変更させる。また、更新部２６は、ｈ_ｊの更新や、Ｈの更新を行う。
ΔＰ計算部２７は、ｘ_１～ｘ_Ｎのそれぞれが変化する場合のΔＰ_ｊを計算する。ΔＰ_ｊの計算は、たとえば、以下のように行われる。

ΔＰ計算部２７は、ｈ_ｋを計算する（ステップＳ２０）。図４の例では、ｈ_ｋは、式（４）においてｉの代わりにｊを用いて計算される。
次に、ΔＰ計算部２７は、ｋ＝１、Ｐ＝０とし（ステップＳ２１）、式（５）の右辺の２項目に基づいて、Ｐ＋λ_ｋ（ｇ（ｈ_ｋ＋Ｗ_ｋｊΔｘ_ｊ）－ｇ（ｈ_ｋ））を計算した結果を、新たにＰとする（ステップＳ２２）。

そして、ΔＰ計算部２７は、ｋ＝Ｍであるか否かを判定する（ステップＳ２３）。ΔＰ計算部２７は、ｋ＝Ｍではないと判定した場合、ｋをｋ＋１とし（ステップＳ２４）、ステップＳ２２からの処理を繰り返す。

ΔＰ計算部２７は、ｋ＝Ｍであると判定した場合、ＰをΔＰ_ｊとして出力する。
上記のような処理では、ｘ_１～ｘ_Ｎのそれぞれについて、ΔＰ_ｊを計算するために、ステップＳ２２の処理がＭ回繰り返される。つまり、Ｍ回のＷ_ｋｊの読み出しと加算処理が行われる。このため、Ｎ個のΔＰ_ｊの計算に、Ｎ×Ｍに比例する時間がかかり、計算時間のオーバーヘッドが大きい。また、読み出しのためのデータ転送量が大きい。１つのΔＰ_ｊの計算にあたって、Ｍ個のＷ_ｋｊがシリアルに読み出されるためである。

これに対して、第１の実施の形態のデータ処理装置１０では、Ｍ個の補助変数のうち、値の変化が許容された補助変数について、Δｈ_ｉ＝－λ_ｋＷ_ｋｉΔｘ_ｋによりｈ_ｉを更新するため、Ｎ個のＷ_ｋｉを１回読み出せばよい。これにより、計算時間のオーバーヘッドを削減できるともに、Ｗ_ｋｉの読み出しのためのデータ転送量も小さくすることができる。

（第２の実施の形態）
図５は、第２の実施の形態のデータ処理装置のハードウェア例を示すブロック図である。

データ処理装置３０は、たとえば、コンピュータであり、ＣＰＵ３１、ＲＡＭ３２、ＨＤＤ３３、ＧＰＵ３４、入力インタフェース３５、媒体リーダ３６及び通信インタフェース３７を有する。上記ユニットは、バスに接続されている。

ＣＰＵ３１は、プログラムの命令を実行する演算回路を含むプロセッサである。ＣＰＵ３１は、ＨＤＤ３３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ３２にロードし、プログラムを実行する。なお、ＣＰＵ３１は複数のプロセッサコアを備えてもよく、データ処理装置３０は複数のプロセッサを備えてもよく、以下で説明する処理を複数のプロセッサまたはプロセッサコアを用いて並列に実行してもよい。また、複数のプロセッサの集合（マルチプロセッサ）を「プロセッサ」と呼んでもよい。

ＲＡＭ３２は、ＣＰＵ３１が実行するプログラムやＣＰＵ３１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、データ処理装置３０は、ＲＡＭ３２以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ３３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、及び、データを記憶する不揮発性の記憶装置である。プログラムには、たとえば、離散最適化問題の解を探索する処理をデータ処理装置３０に実行させるプログラムが含まれる。なお、データ処理装置３０は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

ＧＰＵ３４は、ＣＰＵ３１からの命令にしたがって、データ処理装置３０に接続されたディスプレイ３４ａに画像を出力する。ディスプレイ３４ａとしては、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ（ＰＤＰ：Plasma Display Panel）、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイなどを用いることができる。

入力インタフェース３５は、データ処理装置３０に接続された入力デバイス３５ａから入力信号を取得し、ＣＰＵ３１に出力する。入力デバイス３５ａとしては、マウスやタッチパネルやタッチパッドやトラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、データ処理装置３０に、複数の種類の入力デバイスが接続されていてもよい。

媒体リーダ３６は、記録媒体３６ａに記録されたプログラムやデータを読み取る読み取り装置である。記録媒体３６ａとして、たとえば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）が含まれる。

媒体リーダ３６は、たとえば、記録媒体３６ａから読み取ったプログラムやデータを、ＲＡＭ３２やＨＤＤ３３などの他の記録媒体にコピーする。読み取られたプログラムは、たとえば、ＣＰＵ３１によって実行される。なお、記録媒体３６ａは、可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体３６ａやＨＤＤ３３を、コンピュータ読み取り可能な記録媒体ということがある。

通信インタフェース３７は、ネットワーク３７ａに接続され、ネットワーク３７ａを介して他の情報処理装置と通信を行うインタフェースである。通信インタフェース３７は、スイッチなどの通信装置とケーブルで接続される有線通信インタフェースでもよいし、基地局と無線リンクで接続される無線通信インタフェースでもよい。

次に、データ処理装置３０の機能及び処理手順を説明する。
図６は、データ処理装置の機能例を示すブロック図である。
データ処理装置３０は、入力部４１、制御部４２、探索部４３、出力部４４を有する。

入力部４１、制御部４２、探索部４３、出力部４４は、たとえば、ＣＰＵ３１が実行するプログラムモジュールや、ＣＰＵ３１内の記憶領域（レジスタやキャッシュメモリ）を用いて実装できる。なお、探索部４３は、さらに、ＲＡＭ３２またはＨＤＤ３３に確保した記憶領域を用いて実装されるようにしてもよい。

入力部４１は、たとえば、Ｎ個の状態変数の初期値、Ｍ個の補助変数の初期値、問題情報、計算条件の入力を受け付ける。問題情報は、たとえば、式（１）のＷ_ｉｊやｂ_ｉのほか、式（９）のＷ_ｋｉ、Ｕ_ｋ、λ_ｋを含む。計算条件は、たとえば、レプリカ交換法を実行する場合のレプリカ数、レプリカ交換周期、各レプリカに設定する温度パラメータの値、疑似焼き鈍し法を行う場合の温度パラメータ変更スケジュール、計算の終了条件などを含む。

これらの情報は、ユーザによる入力デバイス３５ａの操作により入力されてもよいし、記録媒体３６ａまたはネットワーク３７ａを介して入力されてもよい。
制御部４２は、データ処理装置３０の各部を制御して、後述の処理を実行させる。

探索部４３は、制御部４２の制御のもと、フリップ判定処理や、更新処理を繰り返すことで、評価関数の値（エネルギー）が極小になる状態を探索する。
出力部４４は、探索部４３による探索結果（計算結果）を出力する。

出力部４４は、たとえば、計算結果を、ディスプレイ３４ａに出力して表示させてもよいし、ネットワーク３７ａを介して、他の情報処理装置に送信してもよいし、外部の記憶装置に記憶してもよい。

探索部４３は、変数設定部４３ａ、状態変数保持部４３ｂ、補助変数保持部４３ｃ、重み値保持部４３ｄ、ｈ_ｉ計算部４３ｅ、ｈ_ｋ計算部４３ｆ、ΔＨ計算部４３ｇ，４３ｈ、遷移可否判定部４３ｉ，４３ｊ、選択部４３ｋ、更新部４３ｌを有する。

変数設定部４３ａには、たとえば、フリップ候補の状態変数を選択する順序、フリップ候補の補助変数を選択する順序、状態変数のフリップ判定処理と、補助変数のフリップ判定処理の処理回数（後述の図８のＡ回とＢ回に相当する）が設定される。

状態変数保持部４３ｂは、Ｎ個の状態変数（ｘ_ｉ）を保持する。また、状態変数保持部４３ｂは、フリップ候補のｘ_ｉの変化量（Δｘ_ｉ）を出力する。
補助変数保持部４３ｃは、Ｍ個の補助変数を保持する。

重み値保持部４３ｄは、Ｎ個の状態変数の間の重み値（Ｗ_ｉｊ）と、Ｎ個の状態変数のそれぞれと、Ｍ個の補助変数の間の重み値（Ｗ_ｋｉ）を保持する。Ｗ_ｉｊはＮ行Ｎ列の行列で表すことができ、Ｗ_ｋｉは、Ｍ行Ｎ列の行列で表すことができる。

なお、Ｎ個の状態変数のうちＭ個の補助変数の何れにも影響を与えない状態変数と、Ｍ個の補助変数の間の重み値は、保持しなくてよい。以下、Ｎ個の状態変数のうち、このような状態変数の割合をスパース率ηという。

ｈ_ｉ計算部４３ｅは、Ｎ個のｈ_ｉを保持するとともに、状態変数や補助変数の値の変化に応じてｈ_ｉを更新する。
ｈ_ｋ計算部４３ｆは、Ｍ個のｈ_ｋを保持するとともに、状態変数の値の変化に応じてｈ_ｋを更新する。

ΔＨ計算部４３ｇは、フリップ候補のｘ_ｉについてのｈ_ｉに基づいて、ΔＨ＝－ｈ_ｉΔｘ_ｉを計算する。
ΔＨ計算部４３ｈは、フリップ候補のｘ_ｋについてのｈ_ｋに基づいて、ΔＨ＝＋λ_ｋｈ_ｋΔｘ_ｋを計算する。

遷移可否判定部４３ｉは、ΔＨ計算部４３ｇが出力するΔＨと、所定値との比較結果に基づいて、フリップ候補の状態変数の値の変化を許容するか否かのフリップ判定処理を行う。所定値は、たとえば、乱数と温度パラメータの値とに基づいて得られるノイズ値である。遷移可否判定部４３ｉは、たとえば、－ΔＨ≧ｌｏｇ（ｒａｎｄ）×Ｔの場合、フリップ候補の状態変数の値の変化を許容すると判定する。

遷移可否判定部４３ｊは、ΔＨ計算部４３ｈが出力するΔＨと、所定値との比較結果に基づいて、フリップ候補の補助変数の値の変化を許容するか否かのフリップ判定処理を行う。所定値は、遷移可否判定部４３ｉが用いる値と同じであってもよいし、固定値（たとえば、０）であってもよい。遷移可否判定部４３ｊは、たとえば、ΔＨ＞ｌｏｇ（ｒａｎｄ）×Ｔの場合、フリップ候補の補助変数の値の変化を許容すると判定する。

選択部４３ｋは、状態変数についてのフリップ判定処理を行う場合には、遷移可否判定部４３ｉの判定結果を選択し、補助変数についてのフリップ判定処理を行う場合には、遷移可否判定部４３ｊの判定結果を選択して出力する。

更新部４３ｌは、フリップ可と判定された状態変数の識別番号を状態変数保持部４３ｂに送り、その状態変数の値を変更させる。また、更新部４３ｌは、フリップ可と判定された補助変数の識別番号を補助変数保持部４３ｃに送り、その補助変数の値を変更させる。

さらに、更新部４３ｌは、フリップ候補の状態変数がフリップ可と判定された場合、ｈ_ｉ計算部４３ｅとｈ_ｋ計算部４３ｆにＮ個のｈ_ｉとＭ個のｈ_ｋを更新させる。更新部４３ｌは、フリップ候補の補助変数がフリップ可と判定された場合、ｈ_ｉ計算部４３ｅにＮ個のｈ_ｉを更新させる。また、更新部４３ｌは、Ｈを保持し、フリップ可とされた状態変数または補助変数の値の変化によって生じるΔＨに基づいて、Ｈを更新してもよい。

図７は、局所場の更新処理の例を示す図である。
なお、図７の例では、フリップ候補の状態変数がｘ_ｊであり、フリップ候補の補助変数がｘ_ｋであるものとして説明する。この場合、制御部４２から供給されるクロック信号ｃｌｋ_Ｄに同期して状態変数保持部４３ｂからΔｘ_ｊが出力され、制御部４２から供給されるクロック信号ｃｌｋ_Ａに同期して補助変数保持部４３ｃからΔｘ_ｋが出力される。

また、ｘ_ｊがフリップ可と判定された場合、重み値保持部４３ｄから、ｘ_ｊとＮ個の状態変数のそれぞれとの間の重み値であるＮ個のＷ_ｉｊと、ｘ_ｊとＭ個の補助変数のそれぞれとの間の重み値であるＭ個のＷ_ｋｊが読み出される。また、ｘ_ｋがフリップ可と判定された場合、重み値保持部４３ｄから、ｘ_ｋとＮ個の状態変数のそれぞれとの間の重み値であるＮ個のＷ_ｋｉが読み出される。

ｈ_ｉ計算部４３ｅは、乗算器４３ｅ１，４３ｅ２、ｈ_ｉ更新保持部４３ｅ３を有する。
ｈ_ｋ計算部４３ｆは、乗算器４３ｆ１、ｈ_ｋ更新保持部４３ｆ２を有する。

乗算器４３ｅ１は、Δｘ_ｊとＮ個のＷ_ｉｊとの積を出力する。
乗算器４３ｅ２は、Δｘ_ｋとＮ個のＷ_ｋｉとの積を出力する。
乗算器４３ｆ１は、Δｘ_ｊとＭ個のＷ_ｋｊとの積を出力する。

ｈ_ｉ更新保持部４３ｅ３は、Ｎ個のｈ_ｉを保持している。そして、ｈ_ｉ更新保持部４３ｅ３は、ｘ_ｊがフリップ可と判定された場合、Ｎ個のｈ_ｉのそれぞれに、Δｈ_ｉ＝Ｗ_ｉｊΔｘ_ｊを加えることで、ｈ_ｉを更新する。また、ｈ_ｉ更新保持部４３ｅ３は、ｘ_ｋがフリップ可と判定された場合、Ｎ個のｈ_ｉのそれぞれに、Δｈ_ｉ＝－λ_ｋＷ_ｋｉΔｘ_ｋを加えることで、ｈ_ｉを更新する。

ｈ_ｋ更新保持部４３ｆ２は、Ｍ個のｈ_ｋを保持している。そして、ｈ_ｋ更新保持部４３ｆ２は、ｘ_ｊがフリップ可と判定された場合、Ｍ個のｈ_ｋのそれぞれに、Δｈ_ｋ＝Ｗ_ｋｊΔｘ_ｊを加えることで、ｈ_ｋを更新する。

以下、データ処理装置３０の処理手順（データ処理方法）を２例、説明する。
図８は、データ処理方法の１つ目の例の流れを示すフローチャートである。
ステップＳ３０：入力部４１は、Ｎ個の状態変数の初期値、Ｍ個の補助変数の初期値、問題情報、計算条件の入力を受け付ける。Ｎ個の状態変数の初期値は、状態変数保持部４３ｂに保持され、Ｍ個の補助変数の初期値は、補助変数保持部４３ｃに保持される。また、問題情報に含まれる重み値は、重み値保持部４３ｄに保持される。計算条件は制御部４２に供給される。

ステップＳ３１：制御部４２は、初期化処理を行う。初期化処理では、たとえば、以下の処理が行われる。
制御部４２は、Ｎ個の状態変数の初期値、Ｍ個の補助変数の初期値、問題情報に基づいて、式（１１）に示したｈ_ｉの初期値、式（１２）に示したｈ_ｋの初期値を計算する。計算されたＮ個の状態変数の初期値は、図７に示したｈ_ｉ更新保持部４３ｅ３に保持され、計算されたＭ個の補助変数の初期値は、図７に示したｈ_ｋ更新保持部４３ｆ２に保持される。

また、制御部４２は、Ｎ個の状態変数の初期値、Ｍ個の補助変数の初期値、問題情報に基づいて、たとえば、式（３）に示したＨ（ｘ）の初期値を計算する。計算されたＨ（ｘ）の初期値は、たとえば、更新部４３ｌ内に保持される。

さらに、初期化処理では、変数設定部４３ａに、フリップ候補の状態変数を選択する順序、フリップ候補の補助変数を選択する順序、状態変数についてのフリップ判定処理の処理回数Ａと、補助変数についてのフリップ判定処理の処理回数Ｂが設定される。

ステップＳ３２：制御部４２は、ｒ１＝０とする。
ステップＳ３３：変数設定部４３ａに設定された処理順序（ランダムでもよい）により、フリップ候補の状態変数（ｘ_ｉ）が選択される。フリップ候補の状態変数が選択されると、状態変数保持部４３ｂから、その状態変数の値を変化させたときの変化量（Δｘ_ｉ）が出力される。

ステップＳ３４：探索部４３のΔＨ計算部４３ｇは、ΔＨ＝－ｈ_ｉΔｘ_ｉという式によりΔＨを計算する。
ステップＳ３５：探索部４３の遷移可否判定部４３ｉは、ΔＨと、前述の所定値との比較結果に基づいて、ｘ_ｉについてフリップ判定を行う。ｘ_ｉの変化を許容すると判定した場合（「フリップ可」の場合）、ステップＳ３６の処理が行われ、ｘ_ｉの変化を許容しないと判定した場合（「フリップ否」の場合）、ステップＳ３７の処理が行われる。

ステップＳ３６：探索部４３は、前述の処理により、ｈ_ｉ、ｈ_ｋ、Ｈ（ｘ）、ｘ_ｉの更新を行う。
ステップＳ３７：制御部４２は、処理が所定の終了条件を満たすか否かを判定する。たとえば、制御部４２は、探索部４３がフリップ判定処理を行った回数が、最大フリップ判定回数に達した場合、または、Ｈ（ｘ）が所定の大きさ以下になった場合、終了条件が満たされたと判定する。処理が所定の終了条件を満たすと判定された場合、ステップＳ４８の処理が行われ、処理が所定の終了条件を満たさないと判定された場合、ステップＳ３８の処理が行われる。

ステップＳ３８：制御部４２は、ｒ１＝Ａであるか否かを判定する。ｒ１＝Ａであると判定された場合、ステップＳ４０の処理が行われ、ｒ１＝Ａではないと判定された場合、ステップＳ３９の処理が行われる。

ステップＳ３９：制御部４２は、ｒ１＝ｒ１＋１とする。その後、ステップＳ３３からの処理が繰り返される。
ステップＳ４０：制御部４２は、ｒ２＝０とする。

ステップＳ４１：変数設定部４３ａに設定された処理順序（ランダムでもよい）により、フリップ候補の補助変数（ｘ_ｋ）が選択される。フリップ候補の補助変数が選択されると、補助変数保持部４３ｃから、その補助変数の値を変化させたときの変化量（Δｘ_ｋ）が出力される。

ステップＳ４２：探索部４３のΔＨ計算部４３ｈは、ΔＨ＝＋λ_ｋｈ_ｋΔｘ_ｋという式によりΔＨを計算する。
ステップＳ４３：探索部４３の遷移可否判定部４３ｊは、ΔＨと、たとえば、前述の所定値との比較結果に基づいて、ｘ_ｋについてフリップ判定を行う。ｘ_ｋの変化を許容すると判定した場合（「フリップ可」の場合）、ステップＳ４４の処理が行われ、ｘ_ｋの変化を許容しないと判定した場合（「フリップ否」の場合）、ステップＳ４５の処理が行われる。

ステップＳ４４：探索部４３は、前述の処理により、ｈ_ｉ、Ｈ（ｘ）、ｘ_ｋの更新を行う。
ステップＳ４５：制御部４２は、処理が前述の所定の終了条件を満たすか否かを判定する。処理が所定の終了条件を満たすと判定された場合、ステップＳ４８の処理が行われ、処理が所定の終了条件を満たさないと判定された場合、ステップＳ４６の処理が行われる。

ステップＳ４６：制御部４２は、ｒ２＝Ｂであるか否かを判定する。ｒ２＝Ｂであると判定された場合、ステップＳ３２からの処理が繰り返され、ｒ２＝Ｂではないと判定された場合、ステップＳ４７の処理が行われる。

ステップＳ４７：制御部４２は、ｒ２＝ｒ２＋１とする。その後、ステップＳ４１からの処理が繰り返される。
ステップＳ４８：出力部４４は、計算結果を出力する。これにより、処理が終了する。出力部４４は、たとえば、計算結果を、ディスプレイ３４ａに出力して表示させてもよいし、ネットワーク３７ａを介して、他の情報処理装置に送信してもよいし、外部の記憶装置に記憶してもよい。

なお、疑似焼き鈍し法が行われる場合、たとえば、制御部４２は、状態変数についてのフリップ判定処理が所定回数、繰り返されるたび、所定の温度パラメータ変更スケジュールにしたがって、前述の温度パラメータ（Ｔ）の値を小さくしていく。そして、制御部４２の制御のもと、出力部４４は、フリップ判定処理が所定の回数繰り返された場合に得られた状態を、離散最適化問題の計算結果として出力する。なお、更新部４３ｌは、これまでの最小エネルギーとなった場合の総エネルギーと状態とを保持してもよい。その場合、制御部４２は、フリップ判定処理が所定の回数繰り返された後に保持されている最小エネルギーに対応する状態を、計算結果として出力部４４に出力させてもよい。

レプリカ交換法が行われる場合、それぞれ異なるＴの値が設定された複数のレプリカのそれぞれにおいて、上記のステップＳ３２～Ｓ４７の処理が繰り返される。そして、制御部４２は、フリップ判定処理が所定回数繰り返されるごとに、レプリカ交換を行う。たとえば、制御部４２は、隣り合うＴの値をもつレプリカを２つ選択して、選択された２つのレプリカの間で、レプリカ間のエネルギー差やＴの値の差に基づいた所定の交換確率で、Ｔの値または、各状態変数の値及び各補助変数の値を交換する。たとえば、更新部４３ｌは、これまでの最小エネルギーとなった場合の総エネルギーと状態とを保持する。そして、制御部４２は、各レプリカにおいて上記のフリップ判定処理が所定の回数繰り返された後に保持されている最小エネルギーのうち、全レプリカにおいて最小のエネルギーに対応する状態を、計算結果として出力部４４に出力させる。

上記のようなデータ処理方法によれば、制約条件に影響を与える状態変数の数が比較的少ない場合には、処理回数Ａを大きくし処理回数Ｂを小さくするなど、計算対象の離散最適化問題に応じて、効率よくＨ（ｘ）を補正するための調整を行える。

図９は、データ処理方法の２つ目の例の流れを示すフローチャートである。
ステップＳ５０，Ｓ５１の処理は、図８に示したステップＳ３０，Ｓ３１の処理とほぼ同様であるが、ステップＳ５１の初期化処理では、状態変数についてのフリップ判定処理の処理回数Ａと、補助変数についてのフリップ判定処理の処理回数Ｂの設定は行われない。

ステップＳ５２：制御部４２は、ｉ＝１とする。ｉは状態変数の識別番号に相当する。
ステップＳ５３：フリップ候補の状態変数（ｘ_ｉ）が選択される。フリップ候補の状態変数が選択されると、状態変数保持部４３ｂから、その状態変数の値を変化させたときの変化量（Δｘ_ｉ）が出力される。

ステップＳ５４：探索部４３のΔＨ計算部４３ｇは、ΔＨ＝－ｈ_ｉΔｘ_ｉという式によりΔＨを計算する。
ステップＳ５５：探索部４３の遷移可否判定部４３ｉは、ΔＨと、前述の所定値との比較結果に基づいて、ｘ_ｉについてフリップ判定を行う。ｘ_ｉの変化を許容すると判定した場合（「フリップ可」の場合）、ステップＳ５６の処理が行われ、ｘ_ｉの変化を許容しないと判定した場合（「フリップ否」の場合）、ステップＳ５７の処理が行われる。

ステップＳ５６：探索部４３は、前述の処理により、ｈ_ｉ、ｈ_ｋ、Ｈ（ｘ）、ｘ_ｉの更新を行う。
ステップＳ５７：制御部４２は、ｉ＝Ｎであるか否かを判定する。ｉ＝Ｎであると判定された場合、ステップＳ５２からの処理が繰り返され、ｉ＝Ｎではないと判定された場合、ステップＳ５８の処理が行われる。

ステップＳ５８：制御部４２は、ｉ＝i＋１とする。その後、ステップＳ５３からの処理が繰り返される。
ステップＳ５９：制御部４２は、ｋ＝１とする。

ステップＳ６０：フリップ候補の補助変数（ｘ_ｋ）が選択される。フリップ候補の補助変数が選択されると、補助変数保持部４３ｃから、その補助変数の値を変化させたときの変化量（Δｘ_ｋ）が出力される。

ステップＳ６１：探索部４３のΔＨ計算部４３ｈは、ΔＨ＝＋λ_ｋｈ_ｋΔｘ_ｋという式によりΔＨを計算する。
ステップＳ６２：探索部４３の遷移可否判定部４３ｊは、ΔＨと、たとえば、前述の所定値との比較結果に基づいて、ｘ_ｋについてフリップ判定を行う。ｘ_ｋの変化を許容すると判定した場合（「フリップ可」の場合）、ステップＳ６３の処理が行われ、ｘ_ｋの変化を許容しないと判定した場合（「フリップ否」の場合）、ステップＳ６４の処理が行われる。

ステップＳ６３：探索部４３は、前述の処理により、ｈ_ｉ、Ｈ（ｘ）、ｘ_ｋの更新を行う。
ステップＳ６４：制御部４２は、ｋ＝Ｍであるか否かを判定する。ｋ＝Ｍであると判定された場合、ステップＳ６６の処理が行われ、ｋ＝Ｍではないと判定された場合、ステップＳ６５の処理が行われる。

ステップＳ６５：制御部４２は、ｋ＝ｋ＋１とする。その後、ステップＳ６０からの処理が繰り返される。
ステップＳ６６：制御部４２は、処理が所定の終了条件を満たすか否かを判定する。たとえば、制御部４２は、探索部４３がフリップ判定処理を行った回数が、最大フリップ判定回数に達した場合、または、Ｈ（ｘ）が所定の大きさ以下になった場合、終了条件が満たされたと判定する。処理が所定の終了条件を満たすと判定された場合、ステップＳ６７の処理が行われ、処理が所定の終了条件を満たさないと判定された場合、ステップＳ５７からの処理が繰り返される。

ステップＳ６７：出力部４４は、計算結果を出力する。これにより、処理が終了する。出力部４４は、たとえば、計算結果を、ディスプレイ３４ａに出力して表示させてもよいし、ネットワーク３７ａを介して、他の情報処理装置に送信してもよいし、外部の記憶装置に記憶してもよい。

上記のようなデータ処理方法によれば、状態変数の値の変化を許容すると判定されるたびに、Ｍ個の補助変数についてのフリップ判定が行われるため、制約条件に影響を与える状態変数の数が比較的多い場合は、効率よくＨ（ｘ）の補正が行える。

なお、データ処理方法の１つ目の例と同様に、上記２つ目の例においても、疑似焼き鈍し法やレプリカ交換法を適用できる。
また、２つ目の例では、フリップ候補の状態変数と補助変数が識別番号順に選択されるものとしたが、ランダムに選択されるようにしてもよい。

なお、図８、図９に示した処理の順序は一例であり、適宜処理の順序を入れ替えてもよい。
以上のような第２の実施の形態のデータ処理装置３０及びデータ処理方法によれば、第１の実施の形態のデータ処理装置１０及びデータ処理方法と同様の効果が得られる。すなわち、計算時間のオーバーヘッドを削減できる。また、データ転送量も小さくできる。

たとえば、前述の図４に示した比較例のデータ処理装置２０では、ｘ_１～ｘ_Ｎのそれぞれについて、ΔＰ_ｊを計算するために、図４に示したステップＳ２２の処理がＭ回繰り返される。つまり、Ｍ回のＷ_ｋｊの読み出しと加算処理が行われる。このため、Ｎ個のΔＰ_ｊの計算に、Ｎ×Ｍに比例する時間がかかり、計算時間のオーバーヘッドが大きい。また、読み出しのためのデータ転送量が大きい。１つのΔＰ_ｊの計算にあたって、Ｍ個のＷ_ｋｊがシリアルに読み出されるためである。

これに対して、第２の実施の形態のデータ処理装置３０は、Ｍ個の補助変数のうち、値の変化が許容された補助変数について、Δｈ_ｉ＝－λ_ｋＷ_ｋｉΔｘ_ｋによりｈ_ｉを更新するため、Ｎ個のＷ_ｋｉを１回読み出せばよい。これにより、計算時間のオーバーヘッドを削減できるともに、Ｗ_ｋｉの読み出しのためのデータ転送量も小さくすることができる。

ｈ_ｉの更新は、ｘ_ｊが変化した場合に、Δｈ_ｉ＝Ｗ_ｉｊΔｘ_ｊを加える処理と、ｘ_ｋが変化した場合に、Δｈ_ｉ＝－λ_ｋＷ_ｋｉΔｘ_ｋを加える処理によって行われる。たとえば、フリップ判定処理がＮ個の状態変数について１回行われる場合のｈ_ｉの更新に係るオーバーヘッドは、最大でもＷ_ｉｊΔｘ_ｊをＮ回加える処理と、－λ_ｋＷ_ｋｉΔｘ_ｋをＭｐ（ｐはｘ_ｋが変化する割合）回加える処理によるものとなる。この場合、オーバーヘッドは、Ｎ＋Ｍｐに比例するものとなり、オーバーヘッドがＮ×Ｍに比例する比較例のデータ処理装置２０と比べて小さい。なお、前述のスパース率ηが１より小さい場合、オーバーヘッドは、Ｎ＋ηＭｐに比例するものとなり、さらにオーバーヘッドを削減できる。

なお、前述のように、上記の処理内容は、データ処理装置３０にプログラムを実行させることで実現できる。
プログラムは、コンピュータ読み取り可能な記録媒体（たとえば、記録媒体３６ａ）に記録しておくことができる。記録媒体として、たとえば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどを使用できる。磁気ディスクには、ＦＤ及びＨＤＤが含まれる。光ディスクには、ＣＤ、ＣＤ－Ｒ（Recordable）／ＲＷ（Rewritable）、ＤＶＤ及びＤＶＤ－Ｒ／ＲＷが含まれる。プログラムは、可搬型の記録媒体に記録されて配布されることがある。その場合、可搬型の記録媒体から他の記録媒体（たとえば、ＨＤＤ３３）にプログラムをコピーして実行してもよい。

図１０は、データ処理装置の他の例を示す図である。図１０において、図５に示した要素と同じ要素については同一符号が付されている。
データ処理装置５０は、バスに接続されたアクセラレータカード５１を有する。

アクセラレータカード５１は、離散最適化問題の解を探索するハードウェアアクセラレータである。アクセラレータカード５１は、ＦＰＧＡ５１ａ及びＤＲＡＭ５１ｂを有する。

データ処理装置５０では、ＦＰＧＡ５１ａが、たとえば、図６に示した制御部４２や探索部４３の処理を行う。
また、ＤＲＡＭ５１ｂは、たとえば、図６に示した重み値保持部４３ｄとして機能する。

なお、アクセラレータカード５１は、複数あってもよい。
以上、実施の形態に基づき、本発明のデータ処理装置、プログラム及びデータ処理方法の一観点について説明してきたが、これらは一例にすぎず、上記の記載に限定されるものではない。

上記では、制約条件として、主に不等式制約を用いた場合について説明したが、等式制約など他の制約条件を用いることもできる。
たとえば、等式制約が用いられる場合、総エネルギー（Ｈ（ｘ））は、式（９）の代わりに、以下の式（１３）が用いられる。

ここで、補助変数（ｘ_ｋ）として、－１または１の値をもつスピン変数を用いることができる。その場合、Δｘ_ｋ＝－２ｘ_ｋと表せる。等式制約が満たされない場合（Ｒ_ｋ（ｘ）≠Ｕ_ｋの場合）、ｘ_ｋは－１となり、等式制約が満たされる場合（Ｒ_ｋ（ｘ）＝Ｕ_ｋの場合）、ｘ_ｋは＋１となる。

このような補助変数を用いた場合、ΔＨは、上記の場合と同様にΔＨ＝＋λ_ｋｈ_ｋΔｘ_ｋと表せる。
なお、スピン変数を用いずにバイナリ変数を用いた場合、ΔＨ＝＋λ_ｋｈ_ｋΔｘ_ｋの代わりにΔＨ＝＋２λ_ｋｈ_ｋΔｘ_ｋとすればよい。

また、補助変数は３値以上の値を有していてもよい。
図１１は、４値の補助変数を用いた例を示す図である。縦軸は、識別番号がｋの制約項の大きさを表し、横軸はｈ_ｋを表す。

ｘ_ｋは、０、１、２、３の４つの値をもつ。ｘ_ｋ＝０により、制約条件が充足されている状態が示され、ｘ_ｋ＝１、２、３により、３つの制約条件違反状態が示されている。図１１の例では、（ｈ_１，ｇ_１）から（ｈ_２，ｇ_２）までの制約違反状態と、（ｈ_２，ｇ_２）から（ｈ_３，ｇ_３）までの制約違反状態と、（ｈ_３，ｇ_３）以上の制約違反状態が示されている。

また、前述のλ_ｋとして、ｘ_ｋ＝１の場合はλ_１、ｘ_ｋ＝２の場合はλ_２、ｘ_ｋ＝３の場合はλ_３が用いられる。これにより、ｘ_ｋ＝１、２、３の何れであるかによって、ｈ_ｋの増加にしたがって、異なる傾きで増加する制約項を用いることができる。

上記のような補助変数を用いる場合、（ｈ_ｉ，ｇ_ｉ）から（ｈ_ｊ，ｇ_ｊ）に変化する場合のΔＨ_ｉ→ｊは、ΔＨ_ｉ→ｊ＝［λ_ｊ（ｈ_ｋ－ｈ_ｊ）＋ｇ_ｊ］－［λ_ｉ（ｈ_ｋ－ｈ_ｉ）＋ｇ_ｉ］＝（λ_ｊ－λ_ｉ）ｈ_ｋ＋［（ｇ_ｊ－λ_ｊｈ_ｊ）－（ｇ_ｉ－λ_ｉｈ_ｉ）］と表すことができる。

１０データ処理装置
１１記憶部
１２処理部

Claims

複数の状態変数を含むイジング型の評価関数の値が極小または極大となる前記複数の状態変数の値の組合せを探索するデータ処理装置において、
複数の制約条件のそれぞれの違反の有無に応じた値をもつ複数の制約項の値と、前記評価関数の値との和である総エネルギーと、前記複数の状態変数の値と、前記複数の制約条件のそれぞれの違反の有無を表す複数の補助変数の値と、前記複数の状態変数のそれぞれの間の第１重み値と、前記複数の状態変数の何れかと前記複数の補助変数のそれぞれとの間の第２重み値と、前記複数の状態変数のそれぞれの値が変化する場合の前記総エネルギーの変化量を表す第１局所場と、前記複数の補助変数のそれぞれの値が変化する場合の前記総エネルギーの変化量に比例する値である第２局所場と、を記憶する記憶部と、
前記複数の状態変数のうち第１状態変数の値の変化を許容するか否かを前記第１局所場に基づいて判定する処理と、前記第１状態変数の値の変化を許容すると判定した場合、前記第１状態変数の値を更新し、前記第１状態変数に関する前記第１重み値に基づいて前記第１局所場を更新し、前記第１状態変数に関する前記第２重み値に基づいて前記第２局所場を更新する処理と、を含む第１処理と、前記複数の補助変数のうち第１補助変数の値の変化を許容するか否かを前記第２局所場に基づいて判定する処理と、前記第１補助変数の値の変化を許容すると判定した場合、前記第１補助変数の値を更新し、前記第１補助変数に関する前記第２重み値に基づいて前記第１局所場を更新する処理と、を含む第２処理を行う処理部と、
を有するデータ処理装置。
前記処理部は、前記第１状態変数の値の変化により、前記複数の制約条件のうち第１制約条件の違反が生じる場合、前記第１制約条件に対応する前記第１補助変数の値を、違反があることを表す値に変化させることを許容し、前記総エネルギーを補正する、請求項１に記載のデータ処理装置。
前記処理部は、前記第１状態変数の値の変化により、前記複数の制約条件のうち第１制約条件の違反が解消される場合、前記第１制約条件に対応する前記第１補助変数の値を、違反がないことを表す値に変化させることを許容し、前記総エネルギーを補正する、請求項１に記載のデータ処理装置。
前記処理部は、前記第１処理を第１回数行った後に前記第２処理を第２回数行う処理を繰り返す、請求項１乃至３の何れか一項に記載のデータ処理装置。
前記処理部は、前記第１処理において、前記第１状態変数の値の変化を許容すると判定するたびに、前記第２処理を、前記複数の補助変数の数に対応する回数行う、請求項１乃至３の何れか一項に記載のデータ処理装置。
複数の状態変数を含むイジング型の評価関数の値が極小または極大となる前記複数の状態変数の値の組合せの探索をコンピュータに実行させるプログラムにおいて、
記憶部に記憶されている、複数の制約条件のそれぞれの違反の有無に応じた値をもつ複数の制約項の値と、前記評価関数の値との和である総エネルギーと、前記複数の状態変数の値と、前記複数の制約条件のそれぞれの違反の有無を表す複数の補助変数の値と、前記複数の状態変数のそれぞれの間の第１重み値と、前記複数の状態変数の何れかと前記複数の補助変数のそれぞれとの間の第２重み値と、前記複数の状態変数のそれぞれの値が変化する場合の前記総エネルギーの変化量を表す第１局所場と、前記複数の補助変数のそれぞれの値が変化する場合の前記総エネルギーの変化量に比例する値である第２局所場のうち、
前記第１局所場に基づいて、前記複数の状態変数のうち第１状態変数の値の変化を許容するか否かを判定する処理と、前記第１状態変数の値の変化を許容すると判定した場合、前記第１状態変数の値を更新し、前記記憶部に記憶されている前記第１状態変数に関する前記第１重み値に基づいて前記第１局所場を更新し、前記記憶部に記憶されている前記第１状態変数に関する前記第２重み値に基づいて前記第２局所場を更新する処理と、を含む第１処理を行い、
前記記憶部に記憶されている前記第２局所場に基づいて、前記複数の補助変数のうち第１補助変数の値の変化を許容するか否かを判定する処理と、前記第１補助変数の値の変化を許容すると判定した場合、前記第１補助変数の値を更新し、前記第１補助変数に関する前記第２重み値に基づいて前記第１局所場を更新する処理と、を含む第２処理を行う、
処理をコンピュータに実行させるプログラム。
複数の状態変数を含むイジング型の評価関数の値が極小または極大となる前記複数の状態変数の値の組合せの探索を実行するコンピュータが、
記憶部に記憶されている、複数の制約条件のそれぞれの違反の有無に応じた値をもつ複数の制約項の値と、前記評価関数の値との和である総エネルギーと、前記複数の状態変数の値と、前記複数の制約条件のそれぞれの違反の有無を表す複数の補助変数の値と、前記複数の状態変数のそれぞれの間の第１重み値と、前記複数の状態変数の何れかと前記複数の補助変数のそれぞれとの間の第２重み値と、前記複数の状態変数のそれぞれの値が変化する場合の前記総エネルギーの変化量を表す第１局所場と、前記複数の補助変数のそれぞれの値が変化する場合の前記総エネルギーの変化量に比例する値である第２局所場のうち、
前記第１局所場に基づいて、前記複数の状態変数のうち第１状態変数の値の変化を許容するか否かを判定する処理と、前記第１状態変数の値の変化を許容すると判定した場合、前記第１状態変数の値を更新し、前記記憶部に記憶されている前記第１状態変数に関する前記第１重み値に基づいて前記第１局所場を更新し、前記記憶部に記憶されている前記第１状態変数に関する前記第２重み値に基づいて前記第２局所場を更新する処理と、を含む第１処理を行い、
前記記憶部に記憶されている前記第２局所場に基づいて、前記複数の補助変数のうち第１補助変数の値の変化を許容するか否かを判定する処理と、前記第１補助変数の値の変化を許容すると判定した場合、前記第１補助変数の値を更新し、前記第１補助変数に関する前記第２重み値に基づいて前記第１局所場を更新する処理と、を含む第２処理を行う、
データ処理方法。