JP2023149428A

JP2023149428A - データ処理装置、プログラム及びデータ処理方法

Info

Publication number: JP2023149428A
Application number: JP2022057999A
Authority: JP
Inventors: 康弘渡部; Yasuhiro Watabe; 泰孝田村; Yasutaka Tamura
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2023-10-13
Also published as: US20230315809A1; CN116894487A; EP4258171A1

Abstract

【課題】制約条件をもつ離散最適化問題の計算量を削減する。【解決手段】記憶部１１は、総エネルギーと、複数の状態変数の値と、複数の状態変数のそれぞれの間の第１重み値と、複数の状態変数の何れかと複数の制約条件のそれぞれとの間の第２重み値と、複数の状態変数のそれぞれの値が変化する場合の総エネルギーの第１変化量を表す第１局所場と、複数の制約条件のそれぞれに対する制約違反量の特定に用いられる第２局所場を記憶する。処理部１２は、複数の状態変数のうち第１状態変数の値の変化を許容するか否かを第１局所場に基づいて判定する処理と、第１状態変数の値の変化を許容すると判定した場合、第１重み値に基づいて第１局所場を更新し、第１状態変数との間の第２重み値が非零である制約条件に対応する第２局所場を、第２重み値に基づいて更新し、更新前後の第２局所場に基づいて第１局所場をさらに更新する処理とを繰り返す。【選択図】図１

Description

本発明は、データ処理装置、プログラム及びデータ処理方法に関する。

ノイマン型コンピュータが不得意とする大規模な離散最適化問題を計算する装置として、イジング型の評価関数（エネルギー関数などとも呼ばれる）を用いたイジング装置（ボルツマンマシンとも呼ばれる）がある。

イジング装置は、離散最適化問題を磁性体のスピンの振る舞いを表すイジングモデルに変換する。そして、イジング装置は、疑似焼き鈍し法やレプリカ交換法（パラレルテンパリング法などとも呼ばれる）などのマルコフ連鎖モンテカルロ法により、イジング型の評価関数の値（エネルギーに相当する）が極小になるイジングモデルの状態を探索する。評価関数の極小値のうちの最小値になる状態が最適解となる。なお、イジング装置は、評価関数の符号を変えれば、評価関数の値が極大になる状態を探索することもできる。イジングモデルの状態は、複数の状態変数の値の組合せにより表現できる。各状態変数の値として、０または１を用いることができる。

イジング型の評価関数は、たとえば、以下の式（１）のような２次形式の関数で定義される。

右辺の１項目は、イジングモデルのＮ個の状態変数の全組合せについて、漏れと重複なく、２つの状態変数の値（０または１）と重み値（２つの状態変数の間の相互作用の強さを表す）との積を積算したものである。ｘ_ｉは、識別番号がｉの状態変数、ｘ_ｊは、識別番号がｊの状態変数であり、Ｗ_ｉｊは、識別番号がｉとｊの状態変数間の相互作用の大きさを示す重み値である。右辺の２項目は、各識別番号についてのバイアス係数と状態変数との積の総和を求めたものである。ｂ_ｉは、識別番号がｉについてのバイアス係数を示している。

また、ｘ_ｉの値の変化に伴うエネルギーの変化量（ΔＥ_ｉ）は、以下の式（２）で表される。

式（２）において、ｘ_ｉが１から０に変化するとき、Δｘ_ｉは－１となり、状態変数ｘ_ｉが０から１に変化するとき、Δｘ_ｉは１となる。なお、ｈ_ｉは局所場と呼ばれ、Δｘ_ｉに応じてｈ_ｉに符号（＋１または－１）を乗じたものがΔＥ_ｉとなる。このため、ｈ_ｉはエネルギーの変化量を表す変数、またはエネルギーの変化量を決める変数ということもできる。

そして、たとえば、ｅｘｐ（－βΔＥ_ｉ）（βは温度を表すパラメータの逆数）と表せる受け入れ確率でｘ_ｉの値を更新することで状態遷移を発生させ、局所場も更新する、という処理が繰り返される。

ところで、離散最適化問題には、解が満たすべき制約条件をもつものがある（たとえば、特許文献１、２参照）。たとえば、離散最適化問題の１つであるナップザック問題では、ナップザックに詰め込める荷物の総容量は、ナップザックの容量以下であるという制約条件をもつ。このような制約条件は、不等式制約と呼ばれ、制約条件の違反の有無に応じた値をもつ制約項により表せる。制約条件として、不等式制約の他にも、等式制約や絶対値制約などがある。

制約項を含む総エネルギー（Ｈ（ｘ））は、以下の式（３）により表すことができる。

式（３）において、右辺の１項目と２項目の和が、式（１）のＥ（ｘ）に相当するエネルギーを表し、右辺の３項目が制約項の全体の大きさ（エネルギー）を表す。また、Ｄは状態変数の識別番号の集合、ｋは制約項の識別番号、Ａは制約項の識別番号の集合を表す。また、λ_ｋは識別番号がｋの制約項についての所定の正の係数である。

制約条件が不等式制約である場合、式（３）のｇ（ｈ_ｋ）は、以下の式（４）で表すことができる。

式（４）において、ｍａｘ［０，ｈ_ｋ］は、０とｈ_ｋのうち大きい値を出力する関数である。また、Ｒ_ｋは、識別番号がｋの制約項の消費量（リソース量とも呼ばれる）、Ｕ_ｋはリソース量の上限を表す。Ｗ_ｋｉは、識別番号がｋの不等式制約におけるｘ_ｉの重みを示す係数（重み値）である。

式（３）において、ｘ_ｊの値の変化に伴うエネルギーの変化量（ΔＨ_ｊ）は、以下の式（５）で表される。

制約条件が不等式制約である場合、ｘ_ｊの値の変化に伴うエネルギーの変化量（ΔＨ_ｊ）は、式（５）の代わりに、以下の式（６）で表すことができる。

式（６）において、ａ_ｉｊは、識別番号がｉの不等式制約におけるｘ_ｊの重みを示す係数であり、上記Ｗ_ｋｉに相当する。Ｃ_ｕｉは、識別番号がｉの不等式制約における上限値であり、上記Ｕ_ｋに相当する。Ｍは、制約項の数を表す。

ｘ_ｊの値の変化を受け入れる受け入れ確率は、Ａ_ｊ＝ｍｉｎ［１，ｅｘｐ（－βΔＨ_ｊ）］と表せる。ｍｉｎ［１，ｅｘｐ（－βΔＨ_ｊ）］は、１とｅｘｐ（－βΔＨ_ｊ）のうち小さい値を出力する関数である。

式（３）は、式（１）のような２次形式の関数ではなく１次形式の不連続関数である。従来、不等式制約をイジング装置で扱えるようにするために、１次形式の不連続関数を２次形式に変換する技術が提案されている。しかし、２次形式に変換した不等式制約の制約項を用いて離散最適化問題を計算する場合、処理が煩雑になるなど、イジング装置で求解を行うことが難しい場合があった。

そこで、従来、上記のような不等式制約の制約項を１次形式のまま用いて、イジング装置で求解を行う技術が提案されている（たとえば、特許文献２参照）。

特開２０２０－２０１５９８号公報特開２０２０－２０４９２８号公報

不等式制約の制約項を１次形式のまま用いて求解を行う従来の技術では、状態変数の値の変化に伴うΔＨ_ｊの計算を行う際に、各制約項に関する係数（上記の式（６）の例ではａ_ｉｊ）を全て用いた計算が行われていた。

各制約項に関する係数は、１０００個以上となる場合もある。従来の技術では、ΔＨ_ｊを計算する際に、全係数をメモリから読み出して加算処理を行うため、計算量が大きくなってしまう場合がある。

１つの側面では、本発明は、制約条件をもつ離散最適化問題の計算量を削減可能なデータ処理装置、プログラム及びデータ処理方法を提供することを目的とする。

１つの実施態様では、複数の状態変数を含むイジング型の評価関数の値が極小または極大となる前記複数の状態変数の値の組合せを探索するデータ処理装置において、複数の制約条件のそれぞれの違反の有無に応じた値をもつ複数の制約項と、前記評価関数の値との和である総エネルギーと、前記複数の状態変数の値と、前記複数の状態変数のそれぞれの間の第１重み値と、前記複数の状態変数の何れかと前記複数の制約条件のそれぞれとの間の第２重み値と、前記複数の状態変数のそれぞれの値が変化する場合の前記総エネルギーの第１変化量を表す第１局所場と、前記複数の制約条件のそれぞれに対する制約違反量の特定に用いられる第２局所場と、を記憶する記憶部と、前記複数の状態変数のうち第１状態変数の値の変化を許容するか否かを前記第１局所場に基づいて判定する処理と、前記第１状態変数の値の変化を許容すると判定した場合、前記第１重み値に基づいて前記第１局所場を更新し、前記第１状態変数との間の前記第２重み値が非零である制約条件に対応する前記第２局所場を、前記第２重み値に基づいて更新し、更新前後の前記第２局所場に基づいて前記第１局所場をさらに更新する処理と、を繰り返す処理部と、を有するデータ処理装置が提供される。

また、１つの実施態様では、プログラムが提供される。
また、１つの実施態様では、データ処理方法が提供される。

１つの側面では、本発明は、制約条件をもつ離散最適化問題の計算量を削減できる。

第１の実施の形態のデータ処理装置及びデータ処理方法の一例を示す図である。状態変数の値の変化によるペナルティ関数の値の変化量の例を示す図である。ｘ_ｊの値が変化した場合の局所場の更新例を示す図である。局所場更新の一例の手順を示す図である。比較例１のデータ処理装置を示す図である。比較例２のデータ処理装置を示す図である。比較例２においてｘ_ｋの値が変化した場合の局所場の更新例と、第１の実施の形態においてｈ_ｋの値が変化した場合の局所場の更新例を示す図である。比較例２のデータ処理装置における予測誤差発生例を示す図である。使用可能なペナルティ関数の例を示す図である。制約項の例を示す図である。第２の実施の形態のデータ処理装置のハードウェア例を示すブロック図である。データ処理装置の機能例を示すブロック図である。第２の実施の形態のデータ処理装置の動作例を示す図である。ｈ_ｋ寄与分算出部の回路例を示す図である。 Δｇの１つ目の計算例を示す図である。 Δｇの２つ目の計算例を示す図である。複数のペナルティ関数を組み合わせたΔｇを発生させるΔｇ発生回路の例を示す図である。データ処理方法の一例の流れを示すフローチャートである。局所場の更新処理の一例の流れを示すフローチャートである。データ処理装置の他の例を示す図である。

以下、発明を実施するための形態を、図面を参照しつつ説明する。
（第１の実施の形態）
図１は、第１の実施の形態のデータ処理装置及びデータ処理方法の一例を示す図である。

第１の実施の形態のデータ処理装置１０は、記憶部１１、処理部１２を有する。
記憶部１１は、たとえば、ＤＲＡＭ（Dynamic Random Access Memory）などの電子回路である揮発性の記憶装置、または、ＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの電子回路である不揮発性の記憶装置である。記憶部１１は、ＳＲＡＭ（Static Random Access Memory）レジスタなどの電子回路を含んでいてもよい。

記憶部１１は、Ｈ（ｘ）、複数（以下Ｎ個）の状態変数（ｘ_ｉ）の値、Ｎ個のｘ_ｉのそれぞれの間の第１重み値（前述のＷ_ｉｊ）、Ｎ個のｘ_ｉの何れかとＭ個の制約条件のそれぞれとの間の第２重み値（Ｗ_ｋｉ）を記憶する。なお、記憶部１１は、Ｍ個の制約条件の何れにも影響を与えない状態変数に関する第２重み値（値が０の第２重み値）を記憶しなくてもよい。

ｉは、Ｎ個のｘ_ｉの何れかを表す識別番号であり、ｋは、Ｍ個の制約項（または制約条件）の何れかを表す識別番号である。
さらに、記憶部１１は、Ｎ個のｘ_ｉのそれぞれの値が変化する場合のＨ（ｘ）の変化量（ΔＨ_ｉ）を表す第１局所場（ｈ_ｉ）と、Ｍの制約条件のそれぞれに対する制約違反量の特定に用いられる第２局所場（ｈ_ｋ）を記憶する。なお、状態変数は、決定変数と呼ぶこともできる。各第２局所場は、各制約項に対応しているため、第２重み値は、状態変数と第２局所場との間の重み値ということもできる。

図１には、複数の状態変数（図１の例では、ｘ_１、ｘ_ｉ、ｘ_Ｎ）のそれぞれの間の相互作用と、複数の状態変数のそれぞれと複数の第２局所場（図１の例では、ｈ_ｐ、ｈ_ｋ、ｈ_ｒ）との間の相互作用が矢印にて示されている。これらの相互作用の大きさが第１重み値または第２重み値に相当する。

記憶部１１に記憶されるＨ（ｘ）は、Ｈ（ｘ）＝Ｅ（ｘ）＋Ｐ（ｘ）と表せる。Ｅ（ｘ）は、前述の式（３）の右辺の１項目と２項目の和である。
Ｍ個の制約条件に対応したＭ個の制約項の全体のエネルギーＰ（ｘ）は、以下では、式（７）で表すものとする。

γ_ｋは、識別番号＝ｋの制約項に関する比例係数であり、制約項の重みを表す。γ_ｋは制約項ごとに異なる値であってもよい。ｇ（ｈ_ｋ）は、たとえば、式（４）で表されるようなＭａｘ関数であってもよいし、他の関数（たとえば、ステップ関数など）であってもよい。以下、ｇ（ｈ_ｋ）をペナルティ関数と呼ぶ。

第２局所場（ｈ_ｋ）は、以下の式（８）で表すことができる。

式（８）において、ｂ_ｋは、識別番号＝ｋの制約条件に関する係数である。識別番号＝ｋの制約条件が不等式制約である場合、式（８）の右辺の１項目が、前述の式（４）のＲ_ｋに相当し、＋ｂ_ｋは式（４）の－Ｕ_ｋに相当する。このため、前述のようにｈ_ｋは、Ｒ_ｋとＵ_ｋとの差分、すなわち制約違反量の特定に用いられる変数であるということができる。

なお、ある状態変数（ｘ_ｉ）の値が変化する場合のΔＨ_ｉは、ペナルティ関数を用いて、以下の式（９）で表すことができる。

式（９）におけるｇ（ｈ_ｋ＋Ｗ_ｋｉΔｘ_ｉ）－ｇ（ｈ_ｋ）は、ある状態変数（ｘ_ｉ）の値が変化する場合の、ペナルティ関数の値の変化量（制約項の変化量ということもできる）を表している。

図２は、状態変数の値の変化によるペナルティ関数の値の変化量の例を示す図である。縦軸は、ｇ（ｈ_ｋ）の大きさを表し、横軸はｈ_ｋを表している。
図２ではペナルティ関数の一例としてｇ（ｈ_ｋ）＝ｍａｘ［０，ｈ_ｋ］が用いられている。ｘ_ｉの値の変化に伴い、ｈ_ｋがｈ_ｋ＋Ｗ_ｋｉΔｘ_ｉに変化したとき、ペナルティ関数の値の変化量は、ｇ（ｈ_ｋ＋Ｗ_ｋｉΔｘ_ｉ）－ｇ（ｈ_ｋ）と表される。

本実施の形態のデータ処理装置１０は、第１局所場（ｈ_ｉ）として、ｘ_ｉの値の変化に伴うＥ（ｘ）の変化量だけでなく、Ｐ（ｘ）の変化量も反映させたものを用いる。このようなｈ_ｉは、以下の式（１０）で表すことができる。

式（１０）において、Δｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）は、以下の式（１１）で表され、ｘ_ｉ、ｈ_ｋ、Ｗ_ｋｉから計算できる量である。

式（１０）のようなｈ_ｉを用いることで、ΔＨ_ｉは、ΔＨ_ｉ＝－ｈ_ｉΔｘ_ｉと表される。
記憶部１１は、さらにバイアス係数（ｂ_ｉ）、比例係数（γ_ｋ）、制約条件に関する係数（ｂ_ｋ）を記憶してもよい。また、記憶部１１は、処理部１２が後述のデータ処理方法を実行する際の計算条件など各種のデータを記憶してもよい。また、処理部１２が、ソフトウェアにより後述のデータ処理方法の一部またはすべての処理を実行する場合には、記憶部１１には、その処理を実行するためのプログラムが記憶される。

図１の処理部１２は、たとえば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）などのハードウェアであるプロセッサにより実現できる。また、処理部１２は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの電子回路により実現されるようにしてもよい。

処理部１２は、たとえば、Ｅ（ｘ）が極小になる状態を探索する。Ｅ（ｘ）の極小値のうちの最小値になるときの状態が最適解となる。なお、Ｅ（ｘ）とＰ（ｘ）の符号を変えれば、処理部１２は、Ｅ（ｘ）の値が極大になる状態を探索することもできる（この場合、最大値となるときの状態が最適解となる）。

図１には、処理部１２による処理の一例の流れが示されている。
なお、ここではＨ（ｘ）、ｈ_ｉ、ｈ_ｋ、ｘ_ｋとして、ｘ_１～ｘ_Ｎの初期値に基づいた値が、記憶部１１に記憶されているものとする。

処理部１２は、Ｎ個の状態変数から、値を変化させる候補（以下フリップ候補という）の状態変数を選択する（ステップＳ１）。処理部１２は、たとえば、ランダムにまたは所定の順序で、フリップ候補の状態変数を選択する。

そして、処理部１２は、選択された状態変数の値が変化する場合のΔＨを計算する（ステップＳ２）。たとえば、ｘ_ｉが選択された場合、ΔＨ_ｉは、上記のようにｈ_ｉに基づいて、ΔＨ_ｉ＝－ｈ_ｉΔｘ_ｉという式により計算できる。

次に、処理部１２は、ΔＨと、所定値との比較結果に基づいて、フリップ候補の状態変数の値の変化を許容するか否か（フリップ可か否か）の判定を行う（ステップＳ３）。以下、この判定処理を、フリップ判定処理という。

所定値は、たとえば、乱数と温度パラメータの値とに基づいて得られるノイズ値である。たとえば、０以上１以下の一様乱数（ｒａｎｄ）と温度パラメータ（Ｔ）とに基づいて得られるノイズ値の例であるｌｏｇ（ｒａｎｄ）×Ｔを、所定値として用いることができる。この場合、処理部１２は、－ΔＨ_ｉ≧ｌｏｇ（ｒａｎｄ）×Ｔの場合、フリップ候補の状態変数の値の変化を許容する（フリップ可）と判定する。

処理部１２は、フリップ可と判定した場合、更新処理を行う（ステップＳ４）。
処理部１２は、たとえば、ｘ_ｊをフリップ可と判定した場合、Ｎ個の状態変数のそれぞれについての元のｈ_ｉに、Δｈ_ｉ＝Ｗ_ｉｊΔｘ_ｊを加えることで、ｈ_ｉの更新を行う。なお、ｉ＝ｊの場合、Ｗ_ｉｉ＝０であり、ｈ_ｉは変化しないため更新は不要である。また、処理部１２は、ｘ_ｊをフリップ可と判定した場合、ｘ_ｊとの間の第２重み値（Ｗ_ｋｊ）が非零であるｈ_ｋに対して、Δｈ_ｋ＝Ｗ_ｋｊΔｘ_ｊを加えることで、ｈ_ｋの更新を行う。

図３は、ｘ_ｊの値が変化した場合の局所場の更新例を示す図である。図３の例では、第１局所場（ｈ_ｉ）がｈ_１～ｈ_Ｎにより示されており、第２局所場（ｈ_ｋ）がｈ_Ｎ＋１～ｈ_Ｎ＋Ｍにより示されている。このような計算は、Ｎ＋Ｍの並列度の並列計算により行うことができる。

さらに、処理部１２は、更新前後のｈ_ｋに基づいてｈ_ｉを、以下の式（１２）にしたがって、さらに更新する。

式（１２）において、ｈ_ｋ ^{（ｏｌｄ）}は、更新前のｈ_ｋを表す。なお、ｉ＝ｊの場合、ｈ_ｉは変化しないため更新は不要である。
図４は、局所場更新の一例の手順を示す図である。

ｘ_１、ｘ_ｉ、ｘ_Ｎは、状態変数であり、ｈ_ｐ、ｈ_ｋ、ｈ_ｒは、第２局所場である。
状態変数であるｘ_１、ｘ_ｉ、ｘ_Ｎのうち、ｘ_ｉの値が変化した場合、ｘ_ｉとの間の第１重み値が非零である状態変数に対応する第１局所場、ｘ_ｉとの間の第２重み値が非零である第２局所場が更新される。たとえば、ｘ_ｉとの間の第１重み値（Ｗ_１ｉ）が非零であるｘ_１に対応するｈ_１が、Δｈ_１＝Ｗ_１ｉΔｘ_ｉを加えられることで更新され、ｘ_ｉとの間の第１重み値（Ｗ_ｉＮ）が非零であるｘ_Ｎに対応するｈ_Ｎが、Δｈ_Ｎ＝Ｗ_ｉＮΔｘ_ｉを加えられることで更新される。また、ｘ_ｉとの間の第２重み値（Ｗ_ｐｉ）が非零であるｈ_ｐが、Δｈ_ｐ＝Ｗ_ｐｉΔｘ_ｉを加えられることで更新され、ｘ_ｉとの間の第２重み値（Ｗ_ｒｉ）が非零であるｈ_ｒが、Δｈ_ｒ＝Ｗ_ｒｉΔｘ_ｉを加えられることで更新される。

次に、値が変化した第２局所場との間の第２重み値が非零である状態変数に対応する第１局所場が、式（１２）に基づいて更新される。たとえば、ｈ_ｒとの間の第２重み値（Ｗ_ｒｉ、Ｗ_ｒＮ）が非零であるｘ_ｉ、ｘ_Ｎに対応するｈ_ｉ、ｈ_Ｎが、式（１２）に基づいて更新される。さらに、ｈ_ｐとの間の第２重み値（Ｗ_ｐ１、Ｗ_ｐｉ、Ｗ_ｐＮ）が非零であるｘ_１、ｘ_ｉ、ｘ_Ｎに対応するｈ_１、ｈ_ｉ、ｈ_Ｎが、式（１２）に基づいて更新される。

ステップＳ４の処理では、処理部１２は、さらに、元のＨ（ｘ）にΔＨを加算することでＨ（ｘ）の更新を行うとともに、フリップ可と判定した状態変数（たとえば、ｘ_ｊ）の値を変化（フリップ）させる。

処理部１２は、以上のステップＳ１～Ｓ４の処理を繰り返す。
なお、上記の説明では、Ｎ個の状態変数のうちフリップ候補の状態変数を１つずつ選択して、ステップＳ２～Ｓ４の処理が行われる例を示したが、複数（たとえばＮ個全て）の状態変数について並列にステップＳ２～Ｓ３の処理が行われるようにしてもよい。その場合、処理部１２は、値の変化が許容された状態変数の数が複数あるとき、ランダムに、または所定のルールにしたがって、値を変化させる状態変数を選択する。

処理部１２は、疑似焼き鈍し法を行う場合、たとえば、状態変数についてのフリップ判定処理が所定回数、繰り返されるたび、所定の温度パラメータ変更スケジュールにしたがって、前述の温度パラメータ（Ｔ）の値を小さくしていく。そして、処理部１２は、フリップ判定処理が所定の回数繰り返された場合（または、所定のＴに達した場合）に得られた状態を、離散最適化問題の計算結果として出力する。なお、処理部１２は、これまでの最小エネルギーとなった場合の総エネルギーと状態とを記憶部１１に保持させておいてもよい。その場合、処理部１２は、フリップ判定処理が所定の回数繰り返された後に記憶されている最小エネルギーに対応する状態を、計算結果として出力してもよい。

処理部１２がレプリカ交換法を行う場合、処理部１２は、それぞれ異なるＴの値が設定された複数のレプリカのそれぞれにおいて、上記のステップＳ１～Ｓ４の処理を繰り返す。そして、処理部１２は、フリップ判定処理が所定回数繰り返されるごとに、レプリカ交換を行う。たとえば、処理部１２は、隣り合うＴの値をもつレプリカを２つ選択して、選択された２つのレプリカの間で、レプリカ間のエネルギー差やＴの値の差に基づいた所定の交換確率で、各状態変数の値及び各補助変数の値を交換する。なお、２つのレプリカの間で、各状態変数の値及び各補助変数の値の代わりにＴの値が交換されてもよい。または、処理部１２は、これまでの最小エネルギーとなった場合の総エネルギーと状態とを保持する。そして、処理部１２は、各レプリカにおいて上記のフリップ判定処理が所定の回数繰り返された後に記憶されている最小エネルギーのうち、全レプリカにおいて最小のエネルギーに対応する状態を、計算結果として出力する。

レプリカ交換法を用いることで、状態がほとんど変化しない低温側（Ｔの値が小さい側レプリカ）でも状態が変化するようになり良い解を短時間で発見できる可能性が高くなる。

以上のようなデータ処理装置１０及びデータ処理方法によれば、図３に示したように、Ｎ＋Ｍの並列度でｈ_ｉ、ｈ_ｋを更新できるとともに、値の変化が許容された状態変数との間の第２重み値が０であるｈ_ｋに対しては、更新は行われない。つまり、その状態変数の変化が影響を与える制約条件に対する制約違反量の特定に用いられるｈ_ｋに限って更新される。また、更新が行われないｈ_ｋについては、値が変化しないため、そのｈ_ｋを用いた式（１２）によるｈ_ｉのさらなる更新も行われない（前述の図４参照）。

これにより、更新処理にかかる計算量を削減できる。
また、第１局所場（ｈ_ｉ）として、ｘ_ｉの値の変化に伴うＥ（ｘ）の変化量だけでなく、Ｐ（ｘ）の変化量（図２のｇ（ｈ_ｋ＋Ｗ_ｋｉΔｘ_ｉ）－ｇ（ｈ_ｋ）に相当）も反映させた値が用いられるため、より正確なΔＨに基づいて、フリップ判定が行える。このため、求解性能を向上できる。

（比較例）
以下、２つの比較例のデータ処理装置について説明する。
図５は、比較例１のデータ処理装置を示す図である。

比較例１のデータ処理装置２０は、従来のように、状態変数の値の変化に伴うΔＨの計算を行う際に、各制約項に関する係数（前述の式（５）の例ではＷ_ｋｊ、式（６）の例ではａ_ｉｊ）を全て用いた計算を行う。

比較例のデータ処理装置２０は、状態保持部２１、ΔＥ計算部２２、ΔＰ加算部２３、遷移可否判定部２４、選択部２５、更新部２６、ΔＰ計算部２７を有する。
状態保持部２１は、状態ｘ（ｘ_１～ｘ_Ｎ）を保持するとともに、ｘを出力する。また、状態保持部２１は、Δｘ_ｊを出力する。

ΔＥ計算部２２は、ｘ_１～ｘ_Ｎのそれぞれが変化する場合の、ΔＥ_ｊ（式（５）の右辺の１項目）を計算する。
ΔＰ加算部２３は、ΔＥ_ｊにΔＰ_ｊ（式（５）の右辺の２項目）を加算する。これにより、式（５）のΔＨ_ｊが計算される。

遷移可否判定部２４は、ΔＨ_ｊと前述の所定値との比較結果に基づいて、ｘ_１～ｘ_Ｎのそれぞれについて、フリップ判定処理を行う。
選択部２５は、フリップ可と判定された状態変数が複数ある場合に、何れか１つの状態変数を選択する。

更新部２６は、フリップ可と判定された状態変数の識別番号を状態保持部２１に送り、その状態変数の値を変化させる。また、更新部２６は、ｈ_ｊの更新や、Ｈの更新を行う。
ΔＰ計算部２７は、ｘ_１～ｘ_Ｎのそれぞれが変化する場合のΔＰ_ｊを計算する。ΔＰ_ｊの計算は、たとえば、以下のように行われる。

ΔＰ計算部２７は、ｈ_ｋを計算する（ステップＳ１０）。図５の例では、ｈ_ｋは、式（４）においてｉの代わりにｊを用いて計算される。
次に、ΔＰ計算部２７は、ｋ＝１、Ｐ＝０とし（ステップＳ１１）、式（５）の右辺の２項目に基づいて、Ｐ＋λ_ｋ（ｇ（ｈ_ｋ＋Ｗ_ｋｊΔｘ_ｊ）－ｇ（ｈ_ｋ））を計算した結果を、新たにＰとする（ステップＳ１２）。

そして、ΔＰ計算部２７は、ｋ＝Ｍであるか否かを判定する（ステップＳ１３）。ΔＰ計算部２７は、ｋ＝Ｍではないと判定した場合、ｋをｋ＋１とし（ステップＳ１４）、ステップＳ１２からの処理を繰り返す。

ΔＰ計算部２７は、ｋ＝Ｍであると判定した場合、ＰをΔＰ_ｊとして出力する（ステップＳ１５）。
上記のような処理では、ｘ_１～ｘ_Ｎのそれぞれについて、ΔＰ_ｊを計算するために、ステップＳ１２の処理がＭ回繰り返される。つまり、Ｍ回のＷ_ｋｊの読み出しと加算処理が行われる。このため、Ｎ個のΔＰ_ｊの計算に、Ｎ×Ｍに比例する計算量が必要となり、計算量が大きい。また、読み出しのためのデータ転送量が大きい。１つのΔＰ_ｊの計算にあたって、Ｍ個のＷ_ｋｊがシリアルに読み出されるためである。

計算量を削減するために、以下のようなデータ処理装置を用いることも考えられる。
図６は、比較例２のデータ処理装置を示す図である。
比較例２のデータ処理装置３０は、状態変数保持部３１、補助変数保持部３２、乗算器３３，３４，３５、ｈ_ｉ更新回路３６、ｈ_ｋ更新回路３７、更新状態変数決定部３８、更新補助変数決定部３９を有する。

状態変数保持部３１は、Ｎ個の状態変数（ｘ_ｉ）を保持する。また、状態変数保持部３１は、フリップ候補のｘ_ｊの変化量（Δｘ_ｊ）を出力する。
補助変数保持部３２は、Ｍ個の補助変数（ｘ_ｋ）を保持する。ｘ_ｋは、識別番号＝ｋの制約条件が満たされている場合に０、満たされていない場合に１となる変数である。また、補助変数保持部３２は、フリップ候補のｘ_ｋの変化量（Δｘ_ｋ）を出力する。

このような補助変数を用いた場合、Ｈ（ｘ）は、たとえば、以下の式（１３）で表すことができる。

また、比較例２のデータ処理装置３０では、ｈ_ｉは、以下の式（１４）で表すことができる。

また、ｈ_ｋは、以下の式（１５）で表すことができる。

なお、式（１５）は、－Ｕ_ｋ＝ｂ_ｋとすれば、式（８）と同じである。
乗算器３３は、フリップ候補のｘ_ｊの値が変化した場合の、式（１４）に示したようなｈ_ｉの変化量である、Δｘ_ｊとＷ_ｉｊとの積を出力する。

乗算器３４は、フリップ候補のｘ_ｊの値が変化した場合の、式（１５）に示したようなｈ_ｋの変化量である、Δｘ_ｊとＷ_ｋｊとの積を出力する。
乗算器３５は、フリップ候補のｘ_ｋの値が変化した場合の、式（１４）に示したようなｈ_ｉの変化量である、Δｘ_ｋとＷ_ｋｉとの積を出力する。

ｈ_ｉ更新回路３６は、フリップ候補のｘ_ｊの値が変化した場合、元のｈ_ｉに、Ｗ_ｉｊΔｘ_ｊを加えることで、ｈ_ｉを更新する。また、ｈ_ｉ更新回路３６は、フリップ候補のｘ_ｋの値が変化した場合、元のｈ_ｉに、－λ_ｋＷ_ｋｉΔｘ_ｋを加えることで、ｈ_ｉを更新する。

ｈ_ｋ更新回路３７は、フリップ候補のｘ_ｊの値が変化した場合、元のｈ_ｋに、Ｗ_ｋｊΔｘ_ｊを加えることで、ｈ_ｋを更新する。
更新状態変数決定部３８は、フリップ候補のｘ_ｊについての第１局所場であるｈ_ｊに基づいて、ΔＨ＝－ｈ_ｊΔｘ_ｊを計算する。そして、更新状態変数決定部３８は、ΔＨと、所定値との比較結果に基づいて、ｘ_ｊの値を変化させるか否かを決定し、ｘ_ｊの値を変化させると決定した場合、状態変数保持部３１に保持されているｘ_ｊの値を変化させる。

更新補助変数決定部３９は、フリップ候補のｘ_ｋについての第２局所場であるｈ_ｋに基づいて、ΔＨ＝＋λ_ｋｈ_ｋΔｘ_ｋを計算する。そして、更新補助変数決定部３９は、ΔＨと、所定値との比較結果に基づいて、ｘ_ｋの値を変化させるか否かを決定し、ｘ_ｋの値を変化させると決定した場合、補助変数保持部３２に保持されているｘ_ｋの値を変化させる。

このようなデータ処理装置３０では、ある制約条件の違反の有無を表す補助変数（ｘ_ｋ）の値の変化が許容された場合に、Ｎ個のＷ_ｋｉに基づいて、ｈ_ｉが更新される。これにより、Ｍ個全ての制約項に関するＷ_ｋｉを読み出さなくてもよくなり、加算処理（元のｈ_ｉにΔｈ_ｉ＝－λ_ｋＷ_ｋｉΔｘ_ｋを加える処理）が行われる回数が抑制され、更新処理にかかる計算量を削減できる。

図７は、比較例２においてｘ_ｋの値が変化した場合の局所場の更新例と、第１の実施の形態においてｈ_ｋの値が変化した場合の局所場の更新例を示す図である。
比較例２のデータ処理装置３０では、ｘ_ｋの値が変化した場合、Ｎ個のｈ_ｉ（ｈ_１～ｈ_Ｎ）に、－λ_ｋΔｘ_ｋＷ_ｋｉ（Ｗ_ｋ１～Ｗ_ｋＮ）を加えることで更新が行われる。これに対して、第１の実施の形態のデータ処理装置１０では、ｈ_ｋの値が変化した場合、Ｎ個のｈ_ｉ（ｈ_１～ｈ_Ｎ）に、δｈ_ｉ（δｈ_１～δｈ_Ｎ）を加えることで更新が行われる。δｈ_ｉは、式（１２）の－γ_ｋ［Δｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）－Δｇ（ｈ_ｋ ^{（ｏｌｄ）}，Ｗ_ｋｉΔｘ_ｉ）］である。

比較例２のデータ処理装置３０では、フリップ候補の状態変数の値を変化させるか否かの判定を行う時点では、その変化に伴う制約項の変化量が考慮されていない。このため、補助変数の値の変化に伴い、ΔＨ＝＋λ_ｋｈ_ｋΔｘ_ｋによりＨ（ｘ）が更新されるまで、以下のような予測誤差が生じる可能性がある。

図８は、比較例２のデータ処理装置における予測誤差発生例を示す図である。縦軸は、制約項の大きさを表し、横軸はｈ_ｋを表している。図８には、不等式制約の制約項が、λ_ｋｍａｘ［０，ｈ_ｋ］で表されている。

予測誤差発生ケース１では、不等式制約の充足状態から違反状態に変化する場合に生じる予測誤差が示されている。予測誤差発生ケース２では、不等式制約の違反状態から充足状態に変化する場合に生じる予測誤差が示されている。

いずれのケースについても、図８に示すような予測誤差が生じる可能性がある。
このため、難易度が高い不等式制約問題に対する求解性能を向上させることが難しくなる可能性がある。また、比較例２のデータ処理装置３０では、使用可能なペナルティ関数が、ＲｅＬＵ（Rectified Linear Unit）型の関数に限られる。

これに対して、第１の実施の形態のデータ処理装置１０は、上記の式（１０）のようにｈ_ｉとして、ｘ_ｉの値の変化に伴うＥ（ｘ）の変化量だけでなく、Ｐ（ｘ）の変化量（図２のｇ（ｈ_ｋ＋Ｗ_ｋｉΔｘ_ｉ）－ｇ（ｈ_ｋ）に相当）も反映させた値が用いられる。このため、より正確なΔＨ_ｉに基づいて、フリップ判定が行える。これにより、求解性能を向上できる。

また、第１の実施の形態のデータ処理装置１０で扱えるペナルティ関数は、ＲｅＬＵ型の関数に限定されない。
図９は、使用可能なペナルティ関数の例を示す図である。

例１では、ペナルティ関数ｇ（ｈ_ｋ）として、ＲｅＬＵ型の関数であるｍａｘ［０，ｈ_ｋ］が示されている。
例２では、ペナルティ関数ｇ（ｈ_ｋ）として、ステップ関数ｕ（ｈ_ｋ）が示されている。

また、上記の２つのペナルティ関数をそれぞれ組み合わせた制約項を用いることもできる。
図１０は、制約項の例を示す図である。

図１０では、ステップ関数ｕ（ｈ_ｋ）を比例係数μ_ｋで重み付けした関数と、ｍａｘ［０，ｈ_ｋ］を比例係数λ_ｋで重み付けした関数の和である、γ_ｋｇ（ｈ_ｋ）＝μ_ｋｕ（ｈ_ｋ）＋λ_ｋｍａｘ［０，ｈ_ｋ］が、制約項の例として表されている。

なお、使用可能なペナルティ関数は上記の例に限定されない。ただ、ｈ_ｉの更新の際に、式（１２）の計算が行われるため、ペナルティ関数は計算が比較的容易な関数であることが望ましい。

（第２の実施の形態）
図１１は、第２の実施の形態のデータ処理装置のハードウェア例を示すブロック図である。

データ処理装置４０は、たとえば、コンピュータであり、ＣＰＵ４１、ＲＡＭ４２、ＨＤＤ４３、ＧＰＵ４４、入力インタフェース４５、媒体リーダ４６及び通信インタフェース４７を有する。上記ユニットは、バスに接続されている。

ＣＰＵ４１は、プログラムの命令を実行する演算回路を含むプロセッサである。ＣＰＵ４１は、ＨＤＤ４３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ４２にロードし、プログラムを実行する。なお、ＣＰＵ４１は複数のプロセッサコアを備えてもよく、データ処理装置４０は複数のプロセッサを備えてもよく、以下で説明する処理を複数のプロセッサまたはプロセッサコアを用いて並列に実行してもよい。また、複数のプロセッサの集合（マルチプロセッサ）を「プロセッサ」と呼んでもよい。

ＲＡＭ４２は、ＣＰＵ４１が実行するプログラムやＣＰＵ４１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、データ処理装置４０は、ＲＡＭ４２以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ４３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、及び、データを記憶する不揮発性の記憶装置である。プログラムには、たとえば、離散最適化問題の解を探索する処理をデータ処理装置４０に実行させるプログラムが含まれる。なお、データ処理装置４０は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

ＧＰＵ４４は、ＣＰＵ４１からの命令にしたがって、データ処理装置４０に接続されたディスプレイ４４ａに画像を出力する。ディスプレイ４４ａとしては、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ（ＰＤＰ：Plasma Display Panel）、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイなどを用いることができる。

入力インタフェース４５は、データ処理装置４０に接続された入力デバイス４５ａから入力信号を取得し、ＣＰＵ４１に出力する。入力デバイス４５ａとしては、マウスやタッチパネルやタッチパッドやトラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、データ処理装置３０に、複数の種類の入力デバイスが接続されていてもよい。

媒体リーダ４６は、記録媒体４６ａに記録されたプログラムやデータを読み取る読み取り装置である。記録媒体４６ａとして、たとえば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）が含まれる。

媒体リーダ４６は、たとえば、記録媒体４６ａから読み取ったプログラムやデータを、ＲＡＭ４２やＨＤＤ４３などの他の記録媒体にコピーする。読み取られたプログラムは、たとえば、ＣＰＵ４１によって実行される。なお、記録媒体４６ａは、可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体４６ａやＨＤＤ４３を、コンピュータ読み取り可能な記録媒体ということがある。

通信インタフェース４７は、ネットワーク４７ａに接続され、ネットワーク４７ａを介して他の情報処理装置と通信を行うインタフェースである。通信インタフェース４７は、スイッチなどの通信装置とケーブルで接続される有線通信インタフェースでもよいし、基地局と無線リンクで接続される無線通信インタフェースでもよい。

次に、データ処理装置４０の機能及び処理手順を説明する。
図１２は、データ処理装置の機能例を示すブロック図である。
データ処理装置４０は、入力部５１、制御部５２、探索部５３、出力部５４を有する。

入力部５１、制御部５２、探索部５３、出力部５４は、たとえば、ＣＰＵ４１が実行するプログラムモジュールや、ＣＰＵ４１内の記憶領域（レジスタやキャッシュメモリ）を用いて実装できる。なお、探索部５３は、さらに、ＲＡＭ４２またはＨＤＤ４３に確保した記憶領域を用いて実装されるようにしてもよい。

入力部５１は、たとえば、Ｎ個の状態変数の初期値、問題情報、計算条件の入力を受け付ける。問題情報は、たとえば、式（８）のＷ_ｋｉやｂ_ｋのほか、式（１０）のＷ_ｉｊ、ｂ_ｉ、γ_ｋを含む。計算条件は、たとえば、レプリカ交換法を実行する場合のレプリカ数、レプリカ交換周期、各レプリカに設定する温度パラメータの値、疑似焼き鈍し法を行う場合の温度パラメータ変更スケジュール、計算の終了条件などを含む。

これらの情報は、ユーザによる入力デバイス４５ａの操作により入力されてもよいし、記録媒体４６ａまたはネットワーク４７ａを介して入力されてもよい。
制御部５２は、データ処理装置４０の各部を制御して、後述の処理を実行させる。

探索部５３は、制御部５２の制御のもと、フリップ判定処理や、更新処理を繰り返すことで、評価関数の値（エネルギー）が極小になる状態を探索する。
出力部５４は、探索部５３による探索結果（計算結果）を出力する。

出力部５４は、たとえば、計算結果を、ディスプレイ４４ａに出力して表示させてもよいし、ネットワーク４７ａを介して、他の情報処理装置に送信してもよいし、外部の記憶装置に記憶してもよい。

探索部５３は、重み値保持部５３ａ、状態変数保持部５３ｂ、補助変数保持部５３ｃ、局所場更新部５３ｄ、ｈ_ｋ更新検出部５３ｅ、ｈ_ｋ寄与分算出部５３ｆを有する。さらに探索部５３は、ｈ_ｉ保持部５３ｇ、ｈ_ｋ保持部５３ｈ、ΔＨ計算部５３ｉ、ΔＨ保持部５３ｊ、ＦＦ（フリップフロップ）５３ｋ、フリップ判定処理部５３ｌ、Ｈ保持部５３ｍを有する。

重み値保持部５３ａは、Ｎ×Ｎ個のＷ_ｉｊを保持するとともに、Ｍ×Ｎ個のＷ_ｋｉとＮ×Ｍ個のＷ_ｉｋを保持する。なお、Ｗ_ｋｉ＝Ｗ_ｉｋであるため、重み値保持部５３ａは、Ｎ×Ｍ個のＷ_ｉｋを保持しなくてよい。また、重み値保持部５３ａは、値が０であるＷ_ｋｉについては保持しなくてもよい。

状態変数保持部５３ｂは、Ｎ個の状態変数（ｘ_ｉ）の値を保持する。また、状態変数保持部５３ｂは、Ｎ個の状態変数のうち、フリップ候補の状態変数が指定された場合、その状態変数の値の変化量を出力する。たとえば、ｘ_ｊが指定された場合、Δｘ_ｊ＝１－２ｘ_ｊが出力される。

補助変数保持部５３ｃは、Ｍ個の補助変数（ｘ_ｋ）の値を保持する。ｘ_ｋは、前述の比較例２のデータ処理装置３０で用いられるものと同じであり、たとえば、制約条件が満たされているかを検出するために用いられる。図１２では、ｘ_ｋを更新する構成についての図示が省略されている。図９に示したようにｈ_ｋ＞０の場合、ｇ（ｈ_ｋ）＞０となり制約条件違反が生じているため、たとえば、ｈ_ｋ＞０の場合にはｘ_ｋ＝１、ｈ_ｋ≦０の場合には、ｘ_ｋ＝０とするような構成が設けられる。ただ、本実施の形態のデータ処理装置４０は、ｘ_ｋを用いなくてもよい。その場合、補助変数保持部５３ｃは不要である。

局所場更新部５３ｄは、フリップ候補の状態変数の値の変化が許容された場合（フリップ可とされた場合）、重み値保持部５３ａからその状態変数と他の状態変数との間の重み値を読み出し、その重み値を用いて局所場の更新を行う。たとえば、ｘ_ｊがフリップ可とされた場合、局所場更新部５３ｄは、Ｗ_ｉｊΔｘ_ｊを各ｈ_ｉに加算することでｈ_ｉを更新する。

また、局所場更新部５３ｄは、フリップ候補の状態変数がフリップ可とされた場合、その状態変数とＭ個の局所場（ｈ_ｋ）との間の重み値のうち、値が非零の重み値を読み出し、その重み値を用いてｈ_ｋを更新する。たとえば、ｘ_ｊがフリップ可とされた場合、局所場更新部５３ｄは、Ｗ_ｋｊΔｘ_ｊをｈ_ｋに加算することでｈ_ｋを更新する。

ｈ_ｋ更新検出部５３ｅは、ｈ_ｋの更新を検出する。
ｈ_ｋ寄与分算出部５３ｆは、更新が検出されたｈ_ｋの値の変化によるｈ_ｉの変化分（図７のδｈ_ｉ）を計算するために、重み値保持部５３ａから非零のＷ_ｋｉを読み出す。さらに、ｈ_ｋ寄与分算出部５３ｆは、ｈ_ｋをｈ_ｋ保持部５３ｈから取得し、ｈ_ｋ ^{（ｏｌｄ）}をＦＦ５３ｋから取得する。そして、ｈ_ｋ寄与分算出部５３ｆは、δｈ_ｉを計算し、元のｈ_ｉにδｈ_ｉを加えることでｈ_ｉを更新する。

ｈ_ｉ保持部５３ｇは、Ｎ個のｈ_ｉを保持する。
ｈ_ｋ保持部５３ｈは、Ｍ個のｈ_ｋを保持する。
ΔＨ計算部５３ｉは、フリップ候補の状態変数に対応する局所場に基づいて、ΔＨを計算する。たとえば、フリップ候補がｘ_ｊである場合、ΔＨ計算部５３ｉは、ΔＨ_ｊ＝－ｈ_ｊΔｘ_ｊを計算する。

ΔＨ保持部５３ｊは、ΔＨ計算部５３ｉが計算したΔＨ_ｊを保持する。
ＦＦ５３ｋは、ｈ_ｋを保持し、ｈ_ｋを出力するタイミングを遅延させることで、ｈ_ｋ ^{（ｏｌｄ）}をｈ_ｋ寄与分算出部５３ｆに供給する。

フリップ判定処理部５３ｌは、ΔＨと、所定値との比較結果に基づいて、フリップ候補の状態変数がフリップ可であるか否かのフリップ判定処理を行う。所定値は、たとえば、乱数と温度パラメータの値とに基づいて得られるノイズ値である。フリップ判定処理部５３ｌは、たとえば、－ΔＨ≧ｌｏｇ（ｒａｎｄ）×Ｔの場合、フリップ候補の状態変数の値の変化を許容すると判定する。

また、フリップ判定処理部５３ｌは、フリップ可と判定された状態変数の識別番号を状態変数保持部５３ｂに送り、その状態変数の値を更新させる。
さらに、フリップ判定処理部５３ｌは、フリップ可とされた状態変数の値の変化によって生じるΔＨに基づいて、Ｈ保持部５３ｍに保持されているＨ（ｘ）を更新する。

Ｈ保持部５３ｍは、Ｈ（ｘ）を保持する。なお、Ｈ保持部５３ｍは、これまでの最小エネルギーとなった場合のＨ（ｘ）と状態とを保持してもよい。
次に、第２の実施の形態のデータ処理装置４０の動作例を説明する。

図１３は、第２の実施の形態のデータ処理装置の動作例を示す図である。図１３には、８つのレプリカを用いてパイプライン処理が行われる例が示されている。０～７は、レプリカ番号である。図１３では、レプリカ番号＝０のレプリカについての処理の詳細が示されており、他のレプリカについては簡略的に示されている。

レプリカ番号＝０のレプリカにおいて、フリップ判定処理が行われ（ｔ１）、その結果に応じてｘ_ｉ、ｘ_ｋの更新が行われるとともに、ｈ_ｉ、ｈ_ｋの更新のための重み値の読み出しが行われる（ｔ２）。そして、局所場更新部５３ｄにより、ｈ_ｉ、ｈ_ｋの更新が行われる（ｔ３）。３つのｈ_ｋ（図１３では、０_ｋａ、０_ｋｂ、０_ｋｃと表される）の更新が行われた場合、それらについて、順に、読み出し、ＦＦ５３ｋによるｈ_ｋ ^{（ｏｌｄ）}の出力、ｈ_ｋ更新検出部５３ｅによるｈ_ｋの更新検出が行われる（ｔ４～ｔ５）。

そして、更新検出が終わったｈ_ｋから順に、対応するＷ_ｋｉの読み出しが行われ（ｔ５）、ｈ_ｋ寄与分算出部５３ｆによる、前述のδｈ_ｉに基づくｈ_ｉの更新が行われる（ｔ６）。その後、更新されたｈ_ｉが読み出され（ｔ７）、ΔＨの計算、フリップ判定処理、Ｈ（ｘ）の計算が行われる（ｔ８）。

ところで、図１２に示した探索部５３は、後述のようにＦＰＧＡなどの電子回路を用いて実現することもできる（図２０参照）。たとえば、探索部５３のｈ_ｋ寄与分算出部５３ｆは、以下のような回路で実現できる。

図１４は、ｈ_ｋ寄与分算出部の回路例を示す図である。
ｈ_ｋ寄与分算出部５３ｆは、Δｇ発生回路５３ｆ１，５３ｆ２、加算器５３ｆ３、乗算器５３ｆ４を有する。

Δｇ発生回路５３ｆ１は、式（１１）に基づいて、式（１２）に示したΔｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）を発生させ（計算し）、出力する。
Δｇ発生回路５３ｆ２は、式（１１）に基づいて、式（１２）に示したΔｇ（ｈ_ｋ ^{（ｏｌｄ）}，Ｗ_ｋｉΔｘ_ｉ）を発生させ（計算し）、出力する。

加算器５３ｆ３は、Δｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）－Δｇ（ｈ_ｋ ^{（ｏｌｄ）}，Ｗ_ｋｉΔｘ_ｉ）を計算し、出力する。
乗算器５３ｆ４は、加算器５３ｆ３の出力である、Δｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）－Δｇ（ｈ_ｋ ^{（ｏｌｄ）}，Ｗ_ｋｉΔｘ_ｉ）に－γ_ｋを乗じた値であるδｈ_ｉを出力する。

図１５は、Δｇの１つ目の計算例を示す図である。
図１５では、ｇ（ｈ）がステップ関数（ｕ（ｈ））である場合のΔｇの計算例が示されている。

変化前の値がｘ_ｉ＝０である場合、Δｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）は、ｈ_ｋ≦－Ｗ_ｋｉの場合は０、－Ｗ_ｋｉ＜ｈ_ｋ＜０の場合は１、ｈ_ｋ≧０の場合は０である。
変化前の値がｘ_ｉ＝１である場合、Δｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）は、ｈ_ｋ≦０の場合は０、０＜ｈ_ｋ＜Ｗ_ｋｉの場合は１、ｈ_ｋ≧Ｗ_ｋｉの場合は０である。

図１６は、Δｇの２つ目の計算例を示す図である。
図１６では、ｇ（ｈ）がＭａｘ関数（ｍａｘ［０，ｈ］）である場合のΔｇの計算例が示されている。

変化前の値がｘ_ｉ＝０である場合、Δｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）は、ｈ_ｋ≦－Ｗ_ｋｉの場合は０、－Ｗ_ｋｉ＜ｈ_ｋ＜０の場合はｈ_ｋ＋Ｗ_ｋｉ、ｈ_ｋ≧０の場合はＷ_ｋｉである。
変化前の値がｘ_ｉ＝１である場合、Δｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）は、ｈ_ｋ≦０の場合は０、０＜ｈ_ｋ＜Ｗ_ｋｉの場合はｈ_ｋ、ｈ_ｋ≧Ｗ_ｋｉの場合はＷ_ｋｉである。

なお、図１５と図１６に示されているようなΔｇを組み合わせることも可能である。
図１７は、複数のペナルティ関数を組み合わせたΔｇを発生させるΔｇ発生回路の例を示す図である。

Δｇ発生回路５３ｆ１は、乗算器６０、加算器６１、Δｇ１発生回路６２、Δｇ２発生回路６３、乗算器６４，６５、加算器６６を有する。
乗算器６０は、Ｗ_ｋｉとΔｘ_ｉとの積であるＷ_ｋｉΔｘ_ｉを出力する。

加算器６１は、ｈ_ｋと－Ｗ_ｋｉΔｘ_ｉとの和を出力する。
Δｇ１発生回路６２は、たとえば、図１５に示した、ステップ関数に基づくΔｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）を発生させる。

Δｇ２発生回路６３は、たとえば、図１６に示した、Ｍａｘ関数に基づくΔｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）を発生させる。
乗算器６４は、Δｇ１発生回路６２によって発生されたΔｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）に－μ_ｋを乗じた値を出力する。

乗算器６５は、Δｇ２発生回路６２によって発生されたΔｇ（ｈ_ｋ，Ｗ_ｋｉΔｘ_ｉ）に－λ_ｋを乗じた値を出力する。
加算器６６は、乗算器６４，６５の出力を足し合わせた値を出力する。

以下、第２の実施の形態のデータ処理装置４０の処理手順（データ処理方法）を、フローチャートを用いて説明する。
図１８は、データ処理方法の一例の流れを示すフローチャートである。

なお、以下では、疑似焼き鈍し法による探索が行われる例が示される。
ステップＳ２０：入力部５１は、Ｎ個の状態変数の初期値、問題情報、計算条件（たとえば、後述のパラメータｄ、Ｔｓｔｏｐなど）の入力を受け付ける。Ｎ個の状態変数の初期値は、状態変数保持部５３ｂに保持される。また、問題情報に含まれる重み値は、重み値保持部５３ａに保持される。計算条件は制御部５２に供給される。

ステップＳ２１：制御部５２は、初期化処理を行う。初期化処理では、たとえば、以下の処理が行われる。
制御部５２は、Ｎ個の状態変数の初期値、問題情報に基づいて、式（８）に示したｈ_ｋの初期値、式（１０）に示したｈ_ｉの初期値を計算する。計算されたＮ個のｈ_ｉの初期値は、ｈ_ｉ保持部５３ｇに保持され、計算されたＭ個のｈ_ｋの初期値は、ｈ_ｋ保持部５３ｈに保持される。

また、制御部５２は、Ｎ個の状態変数の初期値、問題情報に基づいて、Ｈ（ｘ）の初期値を計算する。計算されたＨ（ｘ）の初期値は、たとえば、Ｈ保持部５３ｍに保持される。

ステップＳ２２：探索部５３により、フリップ判定処理が行われる。ステップＳ２２の処理では、たとえば、フリップ候補の状態変数が選択され、その状態変数に対応するｈ_ｉに基づいて、ΔＨが計算される。そして、ΔＨと所定値との比較結果に基づいて、フリップ候補の状態変数がフリップ可か否かが判定される。所定値は、乱数と温度パラメータ（Ｔ）の値とに基づいて得られるノイズ値（たとえば、ｌｏｇ（ｒａｎｄ）×Ｔ）である。

ステップＳ２３：探索部５３により、更新処理が行われる。ステップＳ２３の処理では、フリップ可と判定された状態変数の値が更新される。さらに状態変数の値の更新に伴い、ｈ_ｉ、ｈ_ｋ、Ｈ（ｘ）が更新される。局所場（ｈ_ｉとｈ_ｋ）の更新処理の手順の例については後述する。

ステップＳ２４：制御部５２は、Ｔ変更タイミングであるか否かを判定する。たとえば、状態変数の更新が所定回数行われるごとに、Ｔ変更タイミングであると判定される。制御部５２は、Ｔ変更タイミングであると判定した場合、ステップＳ２５の処理を行い、Ｔ変更タイミングではないと判定した場合、ステップＳ２２からの処理が繰り返される。

ステップＳ２５：制御部５２は、ｄ×Ｔを行うことでＴを更新する。ｄは計算条件に含まれるパラメータの１つであり、１より小さい値（たとえば、０．９９など）をもつ。
ステップＳ２６：制御部５２は、Ｔ＜Ｔｓｔｏｐであるか否かを判定する。Ｔｓｔｏｐは計算の終了条件を表すパラメータである。制御部５２がＴ＜Ｔｓｔｏｐであると判定した場合、ステップＳ２７の処理が行われ、制御部５２がＴ＜Ｔｓｔｏｐではないと判定した場合、ステップＳ２２からの処理が繰り返される。

ステップＳ２７：出力部５４は、計算結果を出力する。これにより処理が終了する。計算結果は、たとえば、これまでの最小エネルギーとなった場合の総エネルギーと状態である。

図１９は、局所場の更新処理の一例の流れを示すフローチャートである。
ステップＳ３０：フリップ候補の状態変数がフリップ可と判定された場合、局所場更新部５３ｄは、Ｎ個の状態変数に対応したＮ個の局所場（ｈ_１～ｈ_Ｎ）を更新する。局所場更新部５３ｄは、フリップ候補のｘ_ｊの値の変化が許容された場合（フリップ可とされた場合）、重み値保持部５３ａからＮ個のＷ_ｉｊを読み出し、Ｗ_ｉｊΔｘ_ｊをＮ個のｈ_ｉのそれぞれに加算することでＮ個のｈ_ｉを更新する。

ステップＳ３１：制御部５２は、ループ変数ｓに１を設定する。
ステップＳ３２：制御部５２は、制約項の識別番号であるｋとしてｋ_ｓ ^（ｊ）を設定する。ｋ_ｓ ^（ｊ）は、Ｗ_ｋｊ≠０となる識別番号ｋの昇順リスト｛ｋ_１ ^（ｊ），ｋ_２ ^（ｊ），…，ｋ_ｍ（ｊ） ^（ｊ）｝に含まれる、ｓ番目のｋを表す。なお、ｊは、フリップ可と許容された状態変数の識別番号である。このようなリストは、たとえば、Ｎ個の状態変数のそれぞれについて予め作成され、図示しない記憶部に記憶されている。

ステップＳ３３：局所場更新部５３ｄは、ｈ_ｋの更新を行う。たとえば、ｘ_ｊがフリップ可とされた場合、局所場更新部５３ｄは、Ｗ_ｋｊΔｘ_ｊをｈ_ｋに加算することでｈ_ｋを更新する。

ステップＳ３４：ｈ_ｋ寄与分算出部５３ｆは、ｈ_ｉの更新を行う。ｈ_ｋ寄与分算出部５３ｆは、ｈ_ｋとの間の重み値が非零である状態変数に対応するｈ_iを、式（１２）に基づいて更新する。

ステップＳ３５：制御部５２は、ｓ＜ｍ（ｊ）であるか否かを判定する。制御部５２は、ｓ＜ｍ（ｊ）であると判定した場合、ステップＳ３６の処理を行い、ｓ＜ｍ（ｊ）ではないと判定した場合、更新処理を終了する。

ステップＳ３６：制御部５２は、ｓをｓ＋１とする。その後ステップＳ３２からの処理が繰り返される。
なお、図１８、図１９に示した処理の順序は一例であり、適宜処理の順序を入れ替えてもよい。

以上のような第２の実施の形態のデータ処理装置４０及びデータ処理方法によれば、Ｎ＋Ｍの並列度でｈ_ｉ、ｈ_ｋを更新できるとともに、値の変化が許容された状態変数との間の重み値が０であるｈ_ｋに対しては、更新は行われない（図１９参照）。また、このようなｈ_ｋについては、値が変化しないため、そのｈ_ｋを用いた式（１２）によるｈ_ｉのさらなる更新が行われない。また、値が変化したｈ_ｋとの間の重み値が０である状態変数に対応するｈ_ｉのさらなる更新も行われない。このため、計算量を削減できる。また、データ転送量も小さくできる。

また、第２の実施の形態のデータ処理装置４０及びデータ処理方法によれば、ΔＨの計算に用いられるｈ_ｉが、状態変数の値の変化に伴うＥ（ｘ）の変化量だけでなく、Ｐ（ｘ）の変化量も反映させた値となる。つまり、より正確なΔＨが計算可能である。このため、フリップ候補の状態変数の値を変化させるか否かの判定を行う時点でも、その変化に伴う制約項の変化量に基づいた、フリップ判定が行える。これにより、求解性能を向上できる。

また、使用可能なペナルティ関数もＲｅＬＵ型に限られず、たとえば、図１７に示したような構成を用いることで、複数のペナルティ関数を組合せたようなペナルティ関数を用いることもできる。これにより、守るべき不等式制約（ハード制約）と、Ｅ（ｘ）との比較で違反が許されるソフト制約を使い分けることも可能となる。

なお、前述のように、上記の処理内容は、データ処理装置４０にプログラムを実行させることで実現できる。
プログラムは、コンピュータ読み取り可能な記録媒体（たとえば、記録媒体４６ａ）に記録しておくことができる。記録媒体として、たとえば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどを使用できる。磁気ディスクには、ＦＤ及びＨＤＤが含まれる。光ディスクには、ＣＤ、ＣＤ－Ｒ（Recordable）／ＲＷ（Rewritable）、ＤＶＤ及びＤＶＤ－Ｒ／ＲＷが含まれる。プログラムは、可搬型の記録媒体に記録されて配布されることがある。その場合、可搬型の記録媒体から他の記録媒体（たとえば、ＨＤＤ４３）にプログラムをコピーして実行してもよい。

図２０は、データ処理装置の他の例を示す図である。図２０において、図１１に示した要素と同じ要素については同一符号が付されている。
データ処理装置７０は、バスに接続されたアクセラレータカード７１を有する。

アクセラレータカード７１は、離散最適化問題の解を探索するハードウェアアクセラレータである。アクセラレータカード７１は、ＦＰＧＡ７１ａ及びＤＲＡＭ７１ｂを有する。

データ処理装置７０では、ＦＰＧＡ７１ａが、たとえば、図１２に示した制御部５２や探索部５３の処理を行う。
また、ＤＲＡＭ７１ｂは、たとえば、図１２に示した重み値保持部５３ａとして機能する。

なお、アクセラレータカード７１は、複数あってもよい。
以上、実施の形態に基づき、本発明のデータ処理装置、プログラム及びデータ処理方法の一観点について説明してきたが、これらは一例にすぎず、上記の記載に限定されるものではない。

１０データ処理装置
１１記憶部
１２処理部

Claims

複数の状態変数を含むイジング型の評価関数の値が極小または極大となる前記複数の状態変数の値の組合せを探索するデータ処理装置において、
複数の制約条件のそれぞれの違反の有無に応じた値をもつ複数の制約項と、前記評価関数の値との和である総エネルギーと、前記複数の状態変数の値と、前記複数の状態変数のそれぞれの間の第１重み値と、前記複数の状態変数の何れかと前記複数の制約条件のそれぞれとの間の第２重み値と、前記複数の状態変数のそれぞれの値が変化する場合の前記総エネルギーの第１変化量を表す第１局所場と、前記複数の制約条件のそれぞれに対する制約違反量の特定に用いられる第２局所場と、を記憶する記憶部と、
前記複数の状態変数のうち第１状態変数の値の変化を許容するか否かを前記第１局所場に基づいて判定する処理と、前記第１状態変数の値の変化を許容すると判定した場合、前記第１重み値に基づいて前記第１局所場を更新し、前記第１状態変数との間の前記第２重み値が非零である制約条件に対応する前記第２局所場を、前記第２重み値に基づいて更新し、更新前後の前記第２局所場に基づいて前記第１局所場をさらに更新する処理と、を繰り返す処理部と、
を有するデータ処理装置。
前記第１局所場は、前記複数の状態変数のそれぞれの値が変化する場合の、前記評価関数の値の第２変化量と、前記複数の制約項のそれぞれの第３変化量の総和との差分により表される、請求項１に記載のデータ処理装置。
前記処理部は、前記第１状態変数の値の変化を許容すると判定した場合、更新前の前記第２局所場を用いて計算される前記第３変化量と、更新後の前記第２局所場を用いて計算される前記第３変化量との差分に基づいて、前記第１局所場を更新する、請求項２に記載のデータ処理装置。
前記複数の制約項は、ステップ関数またはＭａｘ関数、または前記ステップ関数と前記Ｍａｘ関数の組合せにより表される、請求項１乃至３の何れか一項に記載のデータ処理装置。
複数の状態変数を含むイジング型の評価関数の値が極小または極大となる前記複数の状態変数の値の組合せの探索をコンピュータに実行させるプログラムにおいて、
記憶部に記憶されている、複数の制約条件のそれぞれの違反の有無に応じた値をもつ複数の制約項と、前記評価関数の値との和である総エネルギーと、前記複数の状態変数の値と、前記複数の状態変数のそれぞれの間の第１重み値と、前記複数の状態変数の何れかと前記複数の制約条件のそれぞれとの間の第２重み値と、前記複数の状態変数のそれぞれの値が変化する場合の前記総エネルギーの第１変化量を表す第１局所場と、前記複数の制約条件のそれぞれに対する制約違反量の特定に用いられる第２局所場と、のうち、
前記第１局所場に基づいて、前記複数の状態変数のうち第１状態変数の値の変化を許容するか否かを判定する処理と、
前記第１状態変数の値の変化を許容すると判定した場合、前記記憶部に記憶されている前記第１重み値に基づいて前記第１局所場を更新し、前記第１状態変数との間の前記第２重み値が非零である制約条件に対応する前記第２局所場を、前記記憶部に記憶されている前記第２重み値に基づいて更新し、更新前後の前記第２局所場に基づいて前記第１局所場をさらに更新する処理と、
を繰り返す処理をコンピュータに実行させるプログラム。
複数の状態変数を含むイジング型の評価関数の値が極小または極大となる前記複数の状態変数の値の組合せの探索を実行するコンピュータが、
記憶部に記憶されている、複数の制約条件のそれぞれの違反の有無に応じた値をもつ複数の制約項と、前記評価関数の値との和である総エネルギーと、前記複数の状態変数の値と、前記複数の状態変数のそれぞれの間の第１重み値と、前記複数の状態変数の何れかと前記複数の制約条件のそれぞれとの間の第２重み値と、前記複数の状態変数のそれぞれの値が変化する場合の前記総エネルギーの第１変化量を表す第１局所場と、前記複数の制約条件のそれぞれに対する制約違反量の特定に用いられる第２局所場と、のうち、
前記第１局所場に基づいて、前記複数の状態変数のうち第１状態変数の値の変化を許容するか否かを判定する処理と、
前記第１状態変数の値の変化を許容すると判定した場合、前記記憶部に記憶されている前記第１重み値に基づいて前記第１局所場を更新し、前記第１状態変数との間の前記第２重み値が非零である制約条件に対応する前記第２局所場を、前記記憶部に記憶されている前記第２重み値に基づいて更新し、更新前後の前記第２局所場に基づいて前記第１局所場をさらに更新する処理と、
を繰り返すデータ処理方法。