JP2024030713A

JP2024030713A - 温度調整プログラム、データ処理装置及びデータ処理方法

Info

Publication number: JP2024030713A
Application number: JP2022133785A
Authority: JP
Inventors: 雄一石田; Yuichi Ishida
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2022-08-25
Filing date: 2022-08-25
Publication date: 2024-03-07
Also published as: CN117634597A; US20240070228A1; EP4336417A1

Abstract

【課題】レプリカ交換法で用いられる最低温度の調整時間を短縮する。【解決手段】探索部１２が、最適化問題を変換したイジングモデルに基づいて、複数のレプリカ回路を用いたレプリカ交換法により最適化問題の解を探索し、処理部１３が、探索部１２から、複数のレプリカ回路のそれぞれにおける、最適化問題の解の探索処理における所定期間の開始時の状態から最も移動した状態までの距離を取得し、複数のレプリカ回路のそれぞれにおける所定期間の距離のうち、最小値を検出し、最小値と所定の閾値との比較結果に基づいて、複数のレプリカ回路のそれぞれに設定される複数の温度値のうちの最小の温度値の大きさを変更し、変更後の最小の温度値を探索部１２に対して設定する。【選択図】図１

Description

本発明は、温度調整プログラム、データ処理装置及びデータ処理方法に関する。

ノイマン型コンピュータが不得意とする大規模な離散最適化問題を計算する装置として、イジング型の評価関数（エネルギー関数などとも呼ばれる）を用いたイジング装置（ボルツマンマシンとも呼ばれる）がある。

イジング装置による計算では、計算対象の問題は磁性体のスピンの振る舞いを表すモデルであるイジングモデルに置き換えられる。そして、マルコフ連鎖モンテカルロ法により、イジング型の評価関数の値（イジングモデルのエネルギーに相当する）が極小になるイジングモデルの状態の探索が行われる。評価関数の極小値のうちの最小値になる状態が最適解となる。なお、イジング装置は、評価関数の符号を変えれば、評価関数の値が極大になる状態を探索することもできる。

以下、マルコフ連鎖モンテカルロ法を、ＭＣＭＣ（Markov-Chain Monte Carlo）法と略す。また、ＭＣＭＣ法による処理をＭＣＭＣ処理と呼ぶ場合もある。ＭＣＭＣ処理では、たとえば、メトロポリス法またはギブス法で規定される状態遷移の受け入れ確率で、その状態遷移が受け入れられる。

ＭＣＭＣ法の一種として、レプリカ交換法（パラレルテンパリング法などとも呼ばれる）がある。レプリカ交換法では、複数の温度値を用いたＭＣＭＣ処理を、イジングモデルの複数のレプリカにより互いに独立に行われる。そして、ある試行回数ごとに、各ＭＣＭＣ処理で得られるエネルギーが比較され、適切な確率で２つの温度値に対する状態が交換される。レプリカ交換法によれば、温度値を徐々に小さくしていく疑似焼き鈍し法と比べて、局所解に拘束される可能性が抑えられ、全解空間（探索空間）を効率よく探索できる。

なお、従来、レプリカ交換法における交換確率の均一性を高めるために、温度変化に応じたエネルギーの変化度合いを示す比熱を利用して、温度値の間隔を調整する手法が提案されている（たとえば、特許文献１参照）。また、従来、ＭＣＭＣ処理によりサンプリングされる状態に対応するパラメータの重心から、レプリカの温度を調整する手法が提案されている（たとえば、特許文献２参照）。

特開２０２１－４３５０３号公報特開２０２０－１８１４６１号公報

レプリカ交換法を用いて最適化問題を解く際、複数の温度値のうちの最小の温度値（以下最低温度と呼ぶ場合もある）が適切に設定されていない場合、解が求まるまでの時間が非常に長くなることがある。たとえば、最低温度が低すぎると、エネルギー上昇を伴う状態遷移がほとんど起こらず、一度局所解にはまった場合に、その局所解から脱出できない可能性がある。

しかし、適切な最低温度を決定するためには、最低温度の調整を何度も繰り返し、最適な値を探索することになり、最低温度の調整には時間がかかるという問題がある。
１つの側面では、本発明は、レプリカ交換法で用いられる最低温度の調整時間を短縮可能な温度調整プログラム、データ処理装置及びデータ処理方法を提供することを目的とする。

１つの実施態様では、最適化問題を変換したイジングモデルに基づいて、複数のレプリカ回路を用いたレプリカ交換法により前記最適化問題の解を探索する探索部から、前記複数のレプリカ回路のそれぞれにおける、前記最適化問題の解の探索処理における所定期間の開始時の状態から最も移動した状態までの距離を取得し、前記複数のレプリカ回路のそれぞれにおける前記所定期間の前記距離のうち、最小値を検出し、前記最小値と所定の第１の閾値との比較結果に基づいて、前記複数のレプリカ回路のそれぞれに設定される複数の温度値のうちの最小の温度値の大きさを変更し、変更後の前記最小の温度値を前記探索部に対して設定する、処理をコンピュータに実行させる温度調整プログラムが提供される。

また、１つの実施態様では、データ処理装置が提供される。
また、１つの実施態様では、データ処理方法が提供される。

１つの側面では、本発明は、レプリカ交換法で用いられる最低温度の調整時間を短縮できる。

第１の実施の形態のデータ処理装置の一例を示す図である。最低温度の調整手順を示すフローチャートである。第２の実施の形態のデータ処理装置の一例を示す図である。温度調整部の一例を示す図である。温度調整部の他の例を示す図である。最低温度の調整手順の一例の流れを示すフローチャートである。データ処理装置の一例であるコンピュータのハードウェア例を示す図である。

以下、発明を実施するための形態を、図面を参照しつつ説明する。
（第１の実施の形態）
図１は、第１の実施の形態のデータ処理装置の一例を示す図である。

データ処理装置１０は、記憶部１１、探索部１２、処理部１３を有する。
記憶部１１は、たとえば、ＤＲＡＭ（Dynamic Random Access Memory）などの電子回路である揮発性の記憶装置、または、ＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの電子回路である不揮発性の記憶装置である。記憶部１１は、ＳＲＡＭ（Static Random Access Memory）レジスタなどの電子回路を含んでいてもよい。

記憶部１１は、たとえば、計算する最適化問題の情報、計算条件などを記憶する。記憶部１１は、温度調整プログラムなど各種のプログラムを記憶していてもよい。
探索部１２は、たとえば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの電子回路を用いて実現できる。また、探索部１２は、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）などのハードウェアであるプロセッサがプログラムを実行することによるソフトウェア処理にて実現することもできる。

探索部１２は、計算対象の最適化問題を変換したイジングモデルに基づいて、それぞれがイジングモデルのレプリカについての処理を行う複数のレプリカ回路を用いたレプリカ交換法により最適化問題の解を探索する。たとえば、イジングモデルのエネルギーが最低の状態（基底状態）が最適解である。

イジングモデルのエネルギーは、たとえば、以下の式（１）に示すようなエネルギー関数Ｅ（ｘ）で定義される。

右辺第１項は、イジングモデルに含まれる全状態変数から選択可能な２つの状態変数の全組合せについて、漏れと重複なく、２つの状態変数の値と重み係数との積を積算したものである。ｘ_ｉは、ｉ番目の状態変数である。ｘ_ｊは、ｊ番目の状態変数である。Ｗ_ｉｊは、ｉ番目の状態変数とｊ番目の状態変数との間の重み（たとえば、結合の強さ）を示す重み係数である。

右辺第２項は、全状態変数のそれぞれのバイアス係数と状態変数の値との積の総和を求めたものである。ｂ_ｉは、ｉ番目の状態変数に対するバイアス係数を示している。
たとえば、イジングモデルにおけるスピンの「－１」は、状態変数の値「０」に対応する。イジングモデルにおけるスピンの「＋１」は、状態変数の値「１」に対応する。このため、状態変数を、０または１の値をとるビットと呼ぶこともできる。

探索部１２は、複数のビットの何れかのビットを変化させたときのエネルギーの変化量と、熱ノイズ値との比較結果に基づいて、そのビットの変化を許容するか否かを判定し、許容すると判定した場合には、ビットの値を変えることで、状態遷移を発生させる。以下、ビットの値を変えることをフリップと呼ぶ。熱ノイズ値は、各レプリカに設定される温度値と乱数値に基づいて求められる。温度値が大きいほど、熱ノイズ値の振幅が大きくなる。

レプリカ交換法が行われる場合、各レプリカに、最高温度と最低温度との間で、互いに異なる温度値が設定される。そして、各レプリカにおいて、上記のビットのフリップを許容するか否かの判定や状態遷移などを行う処理であるＭＣＭＣ処理が繰り返されるとともに、所定の交換確率で、レプリカ間で状態（または温度）の交換が行われる。

探索部１２は、たとえば、各レプリカ回路において状態遷移が行われるたびにエネルギーを更新し、所定回数の繰り返し処理において得られたエネルギーのうち全レプリカで最低のエネルギーが得られたときの状態を解として出力する。

さらに、本実施の形態のデータ処理装置１０の探索部１２は、複数のレプリカ回路のそれぞれにおける、最適化問題の解の探索処理における所定期間の開始時の状態からの移動距離を計算する。移動距離はハミング距離で表すことができる。たとえば、Ｎビットの状態Ｘ^（ａ）と状態Ｘ^（ｂ）のハミング距離は、以下の式（２）で表せる。

ｘ_ｉ ^（ａ）は、状態Ｘ^（ａ）のｉ番目の状態変数を表し、ｘ_ｉ ^（ｂ）は、状態Ｘ^（ｂ）のｉ番目の状態変数を表す。
移動距離は、たとえば、上記ＭＣＭＣ処理が行われるたび、または状態遷移が生じるたびに計算される。

さらに、探索部１２は、複数のレプリカ回路のそれぞれにおいて、上記所定期間におけるエネルギーの平均値（以下、平均エネルギーと呼ぶ）を計算してもよい。
処理部１３は、たとえば、ＣＰＵ、ＧＰＵ、ＤＳＰなどのハードウェアであるプロセッサが、記憶部１１に記憶されている温度調整プログラムなどのプログラムを実行することによるソフトウェア処理にて実現することができる。なお、処理部１３は、ＡＳＩＣやＦＰＧＡなどの電子回路を用いて実現することもできる。

処理部１３は、レプリカ交換法による解探索に用いられる複数の温度値のうちの最小値である最低温度を調整する機能を有する。
図２は、最低温度の調整手順を示すフローチャートである。

ステップＳ１０：処理部１３は、探索部１２から、複数のレプリカ回路のそれぞれにおける、最適化問題の解の探索処理における所定期間（以下、計測期間と呼ぶ）の開始時の状態から最も移動した状態までの距離（以下、最大移動距離と呼ぶ）を取得する。状態間の距離は、たとえば、ＭＣＭＣ処理が行われるたびに取得される。

ステップＳ１１：処理部１３は、複数のレプリカ回路のそれぞれにおける計測期間の移動距離の最大移動距離のうち、最小値を検出する。図２では、最大移動距離がＨ_ｉと表記されており、上記最小値はｍｉｎ（Ｈ_ｉ）と表記されている。

ステップＳ１２：処理部１３は、その最小値と所定の閾値との比較結果に基づいて最低温度を変更する。
ステップＳ１３：処理部１３は、変更後の最低温度を探索部１２に対して設定する。

ステップＳ１２において、所定の閾値は、たとえば、計測期間において要求されている移動距離である。閾値は、計算対象の最適化問題に応じて、たとえば、ユーザにより入力される。閾値の決定方法として、ビット数Ｎの所定の割合で指定する方法が考えられる。たとえば、計測期間において、全ビットの１％が移動してほしい場合、閾値として０．０１Ｎが指定される。

また、処理部１３は、計測期間を表すステップ数Ｍを用いて、閾値ａとして、ａ＝ｌｏｇ_２Ｍを用いてもよい。ステップ数は、ＭＣＭＣ処理の反復回数である。
ａ＝ｌｏｇ_２Ｍは、Ｍステップの間にとる状態が全て異なるようにしたい場合に用いられる。最適化問題の計算では、解探索の効率化のために、一度訪れた状態には戻らない方がよい。ただ、Ｍステップの間の状態のとり方は様々であり、たとえば、異なるＭビットを順番にフリップさせることでもその状況は実現される。

しかし、低温での移動範囲を考えた場合、状態はエネルギーランドスケープの底にある。また、エネルギーランドスケープの底が、異なるＭビットを順番にフリップさせるような形で形成されることは稀で、多くの場合、ある程度集まっている（移動距離が短い）傾向がある。この集まり具合を取り入れることは難しいうえに厳密な考えをしているわけではないため、単純に考えてどの状態も互いに最も近づいている状況になっているとすれば、このときのＭ個の各状態間の距離の最大値のおおよその値が、上記のｌｏｇ_２Ｍである。

図１には、各レプリカの状態がとり得る解空間のイメージ図が示されている。
Ａ_１～Ａ_４は、計測期間における４つのレプリカ（レプリカｉ（ｉ＝１～４））の状態の、解空間上での移動範囲を示している。また、Ｈ_１～Ｈ_４は、４つのレプリカの最大移動距離を示している。最大移動距離のうちの最小値（ｍｉｎ（Ｈ_ｉ））は、図１の例では、ｍｉｎ（Ｈ_ｉ）＝Ｈ_２である。

このため、処理部１３は、ステップＳ１２の処理において、Ｈ_２と閾値ａとの比較結果に基づいて最低温度を変更する。処理部１３は、Ｈ_２＞ａの場合、最低温度を下降（最小の温度値を減少）させ、Ｈ_２＜ａの場合、最低温度を上昇（最小の温度値を増加）させる。なお、処理部１３は、ｍｉｎ（Ｈ_ｉ）＝ａの場合、最低温度を調整しなくてもよい。

処理部１３は、ステップＳ１２の処理において、たとえば、以下の式（３）にしたがって、新たな最低温度を計算する。

式（３）において、Ｔ_{ｍｉｎ，ｎｅｗ}が新たな最低温度であり、Ｔ_{ｍｉｎ，ｏｌｄ}が変更前の最低温度である。式（３）のように、ｍｉｎ（Ｈ_ｉ）と閾値ａとの差分に応じた大きさで、最低温度が調整される。

最低温度が上がるとエネルギー上昇を伴う状態遷移が増えるため、上記計測期間における移動距離が増加すると考えられる。したがってｍｉｎ（Ｈ_ｉ）も増加する。つまり式（３）により新たな最低温度を決定する場合、次の計測期間ではｍｉｎ（Ｈ_ｉ）がａに近づくことが考えられる。

探索部１２が複数のレプリカ回路のそれぞれにおいて、上記計測期間における平均エネルギーを計算する場合、処理部１３は、平均エネルギーを取得する。そして、処理部１３は、たとえば、最低温度が設定されているレプリカ回路（以下最低温度レプリカ回路という）の平均エネルギーとの差が、所定の閾値（たとえば、１）未満となる平均エネルギーをもつレプリカ回路の数ｒを検出する。そして、処理部１３は、以下の式（４）にしたがって、新たな最低温度を計算する。

式（４）においてｎは全レプリカ回路の数である。
平均エネルギーが、最低温度レプリカ回路の平均エネルギーとほとんど変わらないレプリカ回路が多いと、任意の温度で大きな移動距離をとることが可能となるので、最低温度が過剰に下がる可能性がある。そこで、処理部１３は、最低温度レプリカ回路との平均エネルギーの差が所定の閾値未満のレプリカ回路が存在する場合は、複数のレプリカ回路が等エネルギー遷移を繰り返していると判断する。そして処理部１３は、該当するレプリカ回路の数ｒに応じて、最低温度を上記（４）にしたがって上昇させることで、過剰に最低温度が下がることを防ぐことができる。

処理部１３は、ステップＳ１３の処理において、上記のように変更した（新たに生成した）最低温度を探索部１２に設定する。
探索部１２は、各レプリカ回路に対して、最高温度と変更後の最低温度との間で、互いに異なる温度値を設定し、上記のような探索処理を繰り返す。また、探索部１２は、移動距離、平均エネルギーの計算を繰り返してもよい。その場合、処理部１３も、最低温度の調整を繰り返す。

以上のような第１の実施の形態のデータ処理装置１０によれば、処理部１３は、各レプリカ回路の所定期間（計測期間）における解空間内での最大移動距離のうちの最小値と、閾値との比較結果に基づいて最低温度を調整する。これにより、解の探索状況を反映した調整が行えるため、適切な最低温度を得るための調整時間を短縮できる。

（第２の実施の形態）
図３は、第２の実施の形態のデータ処理装置の一例を示す図である。
第２の実施の形態のデータ処理装置２０は、探索部２１、温度調整部２２ａ、全体制御部２３を有する。探索部２１は、図１に示した探索部１２の一例であり、温度調整部２２ａと全体制御部２３は、図１に示した処理部１３の一例である。なお、図１に示した記憶部１１に対応した要素については図示が省略されている。

探索部２１は、たとえば、ＡＳＩＣやＦＰＧＡなどの電子回路を用いて実現できる。また、温度調整部２２ａや全体制御部２３は、たとえば、ＣＰＵなどのプロセッサがプログラムを実行することによるソフトウェア処理にて実現できる。また、これに限らず、探索部２１、温度調整部２２ａ、全体制御部２３のそれぞれの一部またはすべてが、上記のような電子回路を用いて実現されるようにしてもよい。また、探索部２１、温度調整部２２ａ、全体制御部２３のそれぞれの一部またはすべてがソフトウェア処理にて実現されるようにしてもよい。

第２の実施の形態のデータ処理装置２０では、探索部２１は、レプリカ交換法により最適化問題の解を探索する。
探索部２１は、たとえば、図３のように、それぞれがレプリカに対応するレプリカ回路２１ａ１，２１ａ２，…，２１ａｎを有する。さらに、探索部２１は、温度制御部２１ｂを有する。

レプリカ回路２１ａ１～２１ａｎには、互いに異なる温度値（Ｔ_１～Ｔ_ｎ）が設定される。当初のＴ_１～Ｔ_ｎは、たとえば、予め与えられる最高温度（Ｔ_ｍａｘ）及び最低温度（Ｔ_ｍｉｎ）に基づいて以下の式（５）、式（６）に基づいて定められる。

式（５）において、Ｔ_ｉは、レプリカ回路２１ａ１～２１ａｎのうち、ｉ番目のレプリカ回路に設定される温度値である。式（６）において、ｎは、レプリカ回路２１ａ１～２１ａｎの数（レプリカ数）である。

レプリカ回路２１ａ１～２１ａｎのそれぞれは、式（１）で表されるエネルギー関数に基づく解探索を、たとえば、下記のような回路により実現する。以下では、レプリカ回路２１ａ１を主に説明するが、レプリカ回路２１ａ２～２１ａｎも同様の回路構成により実現できる。

レプリカ回路２１ａ１は、ビットフリップ可否判定部３０ａ１，３０ａ２，…，３０ａＮ、セレクタ部３０ｂ、状態保持部３０ｃ、ハミング距離計算部３０ｄ、平均エネルギー計算部３０ｅを有する。

レプリカの状態に含まれる各ビットのフリップの可否を判定し、フリップ可と判定された何れかのビットをフリップする処理が、レプリカ回路２１ａ１によるＭＣＭＣ処理の１回分の処理に相当する。当該１回分の処理は繰り返し実行される。レプリカ回路２１ａ１～２１ａｎにより並列に実行される当該１回分の処理の繰り返し数を、以下ではステップ数ということがある。

ビットフリップ可否判定部３０ａ１～３０ａＮのそれぞれは、自身が担当する１ビットに関するフリップの可否を判定する演算処理回路である。ビットフリップ可否判定部３０ａ１～３０ａＮは並列に、上記の判定処理を行う。

ｉｎｄｅｘ＝ｉのビット（状態変数ｘ_ｉ）の値が変化して１－ｘ_ｉとなる場合、ｘ_ｉの変化量は、δｘ_ｉ＝（１－ｘ_ｉ）－ｘ_ｉ＝１－２ｘ_ｉと表せる。したがって、ｘ_ｉの値の変化に伴うエネルギーの変化量（ΔＥ_ｉ）は、式（１）から以下の式（７）で表せる。

式（７）において、ｈ_ｉは以下の式（８）で表せる。

ビットフリップ可否判定部３０ａ１～３０ａＮのそれぞれは、ｘ_ｉに対するｈ_ｉを保持し、式（７）に基づいて、ｘ_ｉの値を変化させた場合のΔＥ_ｉを、ｈ_ｉから求める。
以下では、主に、ビットフリップ可否判定部３０ａ１を例示して説明する。同名の構成であるビットフリップ可否判定部３０ａ２～３０ａＮも同様の機能を有する。

ここで、ビットフリップ可否判定部３０ａ１が担当するビットを自ビット、ビットフリップ可否判定部３０ａ２～３０ａＮが担当するビットを他ビットと称する。
ビットフリップ可否判定部３０ａ１は、自ビットと他ビットとの間の重み係数（Ｗ_１ｊ（ｊ＝１～Ｎ））を記憶する。Ｗ_１ｊの添え字ｊは、自ビット（ｉｎｄｅｘ＝１のビット）を含む何れかのビットのｉｎｄｅｘを示す。なお、Ｗ_１１＝０である。

ビットフリップ可否判定部３０ａ１は、Ｗ_１ｊを用いて、式（８）に基づくｈ_１を計算する。
ビットフリップ可否判定部３０ａ１はｈ_１を用いて、式（７）に基づき、自ビットをフリップさせた場合に生じるΔＥ_１を生成する。ビットフリップ可否判定部３０ａ１は、たとえば、状態保持部３０ｃから供給される自ビットの現在の値から、自ビットの値が０，１の何れに変化するかを判別してもよい。ビットフリップ可否判定部３０ａ１は、生成したΔＥ_１を平均エネルギー計算部３０ｅに出力する。

そして、ビットフリップ可否判定部３０ａ１は、ΔＥ_１と、熱ノイズ値との比較結果に基づいて、自ビットのフリップの可否を判定する。熱ノイズとして、たとえば、Ｔ_１・ｌｏｇ（ｕ）を用いることができる。Ｔ_１はレプリカ回路２１ａ１に設定された温度値であり、ｕは０から１までの値をとる一様乱数である。ビットフリップ可否判定部３０ａ１は、たとえば、－ΔＥ_１≧Ｔ・ｌｏｇ（ｕ）の場合に、フリップを許可する。

セレクタ部３０ｂはビットフリップ可否判定部３０ａ１～３０ａＮのそれぞれが出力したフリップ可否の判定結果を受け付ける。セレクタ部３０ｂは、フリップ可と判定されたビットが複数ある場合、ランダムにまたは所定のルールにしたがって、そのうちの１つを選択する。セレクタ部３０ｂは、選択したビットのｉｎｄｅｘ＝ｊを、ビットフリップ可否判定部３０ａ１～３０ａｎのそれぞれに出力するとともに、状態保持部３０ｃに、ｉｎｄｅｘ＝ｊとフリップを指示する信号（ｕｐｄａｔｅ）を出力する。

状態保持部３０ｃは、たとえば、レジスタを有し、レプリカ回路２１ａ１におけるレプリカの状態（Ｘ_１（ｘ_１，ｘ_２，…，ｘ_Ｎ））を保持する。また、状態保持部３０ｃは、ｕｐｄａｔｅとｉｎｄｅｘ＝ｊに基づいて、セレクタ部３０ｂが、フリップ可と判定したビットの何れかを選択した場合、そのビットをフリップさせる。また、状態保持部３０ｃは、レプリカ回路２１ａ１における所定回数または所定期間の探索処理の完了時のＸ_１を温度調整部２２ａ及び全体制御部２３に出力する。

ハミング距離計算部３０ｄは、所定の計測期間の開始時の状態Ｘ_１を状態保持部３０ｃから取得して保持する。そして、ハミング距離計算部３０ｄは、計測期間において、ＭＣＭＣ処理が繰り返されるたびに、Ｘ_１を状態保持部３０ｃから取得し、開始時のＸ_１からの移動距離（ハミング距離）ｈ_１，ｍを計算し、温度調整部２２ａに出力する。ハミング距離は、式（２）に基づいて計算できる。

平均エネルギー計算部３０ｅは、平均エネルギーＥ_{１，ａｖｅ}を計算し、温度調整部２２ａに出力する。たとえば、平均エネルギー計算部３０ｅは、計測期間開始時の状態Ｘ_１を状態保持部３０ｃから取得し、式（１）に基づいてエネルギーを計算する。平均エネルギー計算部３０ｅは、ＭＣＭＣ処理が繰り返されるたびに、ビットのフリップによって生じるエネルギーの変化量を、ビットフリップ可否判定部３０ａ１～３０ａＮの何れかから取得し、その変化量を用いて平均エネルギーＥ_{１，ａｖｅ}を更新していく。

温度制御部２１ｂは、Ｔ（Ｔ_１～Ｔ_ｎの何れか）をレプリカ回路２１ａ１～２１ａｎのそれぞれが有するビットフリップ可否判定部に設定する。温度制御部２１ｂは、温度調整部２２ａによってＴ_ｍｉｎが更新された場合、予め設定されているＴ_ｍａｘと、更新後のＴ_ｍｉｎに基づいて、式（５）、式（６）にしたがいＴ_１～Ｔ_ｎを更新し、新たなＴ_１～Ｔ_ｎをレプリカ回路２１ａ１～２１ａｎに設定する。

また、温度制御部２１ｂは、レプリカ回路２１ａ１～２１ａｎにおけるＴの交換（温度交換）を制御する。温度制御部２１ｂは、以下の式（９）で表される交換確率（ｐ_ｉｊ）に基づいて、温度値が隣接するレプリカ回路のペア（２つのレプリカ回路の組）に関し、温度交換を行うか否かをペアごとに判定する。

式（９）において、Ｅ_ｉは、レプリカ回路２１ａ１～２１ａｎのうち、ｉ番目のレプリカ回路の状態に対応するエネルギーである。Ｅ_ｊは、ｊ番目のレプリカ回路の状態に対応するエネルギーである。Ｔ_ｉは、ｉ番目のレプリカ回路に設定されている温度値である。Ｔ_ｊは、ｊ番目のレプリカ回路に設定されている温度値である。ｋは、ボルツマン定数である。

温度制御部２１ｂは、交換後の温度値を、レプリカ回路２１ａ１～２１ａｎのそれぞれに設定する。
なお、上記の説明では探索部２１は、レプリカ回路２１ａ１～２１ａｎの間で温度値を交換するものとしたが、式（９）の確率で、状態を交換するようにしてもよい。ただ、状態を交換するよりも、温度値を交換する方が、送受信する情報量が少なくて済む。

温度調整部２２ａは、レプリカ回路２１ａ１～２１ａｎが出力する移動距離ｈ_１，ｍ，ｈ_２，ｍ，…ｈ_ｎ，ｍと、平均エネルギーＥ_{１，ａｖｅ}，Ｅ_{２，ａｖｅ}，…Ｅ_{ｎ，ａｖｅ}に基づいて、最低温度Ｔ_ｍｉｎを調整する。温度調整部の例については後述する。

全体制御部２３は、データ処理装置２０の全体の動作を制御する。全体制御部２３は、データ処理装置２０の外部から起動信号の入力を受け付けると、温度制御部２１ｂに起動信号を出力し、探索部２１を起動させて、最適化問題の解の探索処理を開始させる。全体制御部２３は、探索部２１による探索処理が終了すると、探索部２１からＸ_１～Ｘ_ｎを取得し、最適化問題に対する解を得る。たとえば、全体制御部２３は、取得したＸ_１～Ｘ_ｎのうち最低エネルギーに対応する状態を解とする。全体制御部２３は、演算の終了を示す終了信号をデータ処理装置２０の外部に出力する。終了信号は、演算により得られた解を示す情報を含み得る。たとえば、全体制御部２３は、データ処理装置２０に接続された図示しない表示装置に、解を示す画像情報を出力し、解を示す画像情報を表示装置により表示させることで、得られた解の内容をユーザに提示してもよい。

なお、全体制御部２３は、図示しない記憶部に記憶されている前述の問題情報（Ｗ_ｉｊやｂ_ｉ）や状態の初期値などを受け付け、探索部２１の各部に設定してもよい。また、全体制御部２３は、Ｔ_ｍｉｎの初期値やＴ_ｍａｘを、データ処理装置２０の外部から受け付け、温度制御部２１ｂに設定してもよい。なお、これらの情報の設定を別の制御部が行ってもよい。

また、全体制御部２３は、データ処理装置２０の外部からリセット信号の入力を受け付けると、探索部２１及び温度調整部２２ａが保持する情報をクリアする。
（温度調整部２２ａの例）
図４は、温度調整部の一例を示す図である。

温度調整部２２ａは、最大移動距離保持部４０、最小値検出部４１、等エネルギー遷移レプリカ数検出部４２、パラメータ取得部４３、最低温度調整部４４を有する。
最大移動距離保持部４０は、レプリカ回路２１ａ１～２１ａｎが出力するｈ_１，ｍ～ｈ_ｎ，ｍから、複数のレプリカのそれぞれにおける計測期間の最大移動距離Ｈ_１～Ｈ_ｎを取得し、保持する。この例では、最大移動距離保持部４０は、レプリカ回路２１ａ１～２１ａｎから、間接的に最大移動距離Ｈ_１～Ｈ_ｎを取得している。なお、レプリカ回路２１ａ１～２１ａｎが、最大移動距離Ｈ_１～Ｈ_ｎを求めてもよく、その場合、最大移動距離保持部４０は、レプリカ回路２１ａ１～２１ａｎから直接、最大移動距離Ｈ_１～Ｈ_ｎを取得する。

最小値検出部４１は、Ｈ_１～Ｈ_ｎのうちの最小値、すなわちｍｉｎ（Ｈ_ｉ）を検出する。
等エネルギー遷移レプリカ数検出部４２は、Ｅ_{１，ａｖｅ}～Ｅ_{ｎ，ａｖｅ}を取得し、最低温度レプリカの平均エネルギーと、平均エネルギーの差が所定の閾値（たとえば、１）未満のレプリカ数ｒを検出する。

パラメータ取得部４３は、たとえば、ユーザから入力される閾値ａと計測期間を表すステップ数Ｍを取得する。
最低温度調整部４４は、閾値ａと、計測期間終了時（ステップ数ＭのＭＣＭＣ処理の終了時）のｍｉｎ（Ｈ_ｉ）及び上記レプリカ数ｒを用いて、式（３）、式（４）にしたがって、Ｔ_ｍｉｎを調整（変更）し、探索部２１に設定する。

図５は、温度調整部の他の例を示す図である。図５において、図４に示した要素と同じ要素については同一符号が付されている。
温度調整部２２ｂは、閾値計算部４５を有している。図５の温度調整部２２ｂにおいて、パラメータ取得部４３は閾値ａを取得せず、閾値計算部４５が、ステップ数Ｍから、前述のようにａ＝ｌｏｇ_２Ｍを計算する。最低温度調整部４４は、閾値計算部４５が計算した閾値ａを用いて、Ｔ_ｍｉｎの調整を行う。

図６は、最低温度の調整手順の一例の流れを示すフローチャートである。
以下の処理は、たとえば、全体制御部２３の制御のもと行われる。
温度調整部２２ａ，２２ｂは、ステップ数Ｍ、閾値ａを取得する（ステップＳ２０）。なお、図５のような温度調整部２２ｂの場合、閾値ａの取得は不要である。

温度調整部２２ａ，２２ｂは、ｉ＝１とし（ステップＳ２１）、ｍ＝１、Ｈ_ｉ＝０と初期化を行う（ステップＳ２２）。その後、ステップＳ２３の処理が行われる。
ステップＳ２３の処理では、探索部２１のレプリカ回路２１ａ１～２１ａｎのうち、ｉ番目のレプリカ（以下、レプリカｉという）の処理を行うレプリカ回路のハミング距離計算部は、Ｘ_ｉ，１として現在のレプリカｉの状態（計測期間開始時の状態）を取得する。さらに、そのレプリカ回路の平均エネルギー計算部は、Ｘ_ｉ，１に基づいてＥ_{ｉ，ａｖｅ}としてレプリカｉのエネルギーを計算する。

その後、探索部２１においてＭＣＭＣ処理が行われる（ステップＳ２４）。これにより各レプリカの状態が、所定の状態遷移の受け入れ確率にしたがって更新される。レプリカｉの処理を行うレプリカ回路のハミング距離計算部は、現在のレプリカｉの状態とＸ_ｉ，１との間の移動距離ｈ_ｉ，ｍを計算する（ステップＳ２５）。温度調整部２２ａ，２２ｂは、ｈ_ｉ，ｍを取得する。

温度調整部２２ａ，２２ｂは、ｈ_ｉ，ｍがレプリカｉについてのｈ_ｉ，ｍの中で最大である場合には、Ｈ_ｉをｈ_ｉ，ｍで更新し保持する（ステップＳ２６）。この処理は、Ｈ_ｉ＝ｍａｘ（Ｈ_ｉ，ｈ_ｉ，ｍ）を計算することに相当する。

また、レプリカｉの処理を行うレプリカ回路の平均エネルギー計算部は、レプリカｉの平均エネルギーを求め、Ｅ_{ｉ，ａｖｅ}を更新する（ステップＳ２７）。
温度調整部２２ａ，２２ｂは、ｍ＝ｍ＋１とし（ステップＳ２８）、ｍ≦Ｍ＋１であるか否かを判定する（ステップＳ２９）。ｍ≦Ｍ＋１であると判定された場合、ステップＳ２４からの処理が繰り返される。

ｍ≦Ｍ＋１ではないと判定された場合、温度調整部２２ａ，２２ｂは、ｉ＝１＋１とし（ステップＳ３０）、ｉ≦ｎ＋１であるか否かを判定する（ステップＳ３１）。ｉ≦ｎ＋１であると判定された場合、ステップＳ２２からの処理が繰り返される。

ｉ≦ｎ＋１ではないと判定された場合、ステップＳ３２の処理が行われる。
ステップＳ３２の処理では、温度調整部２２ａ，２２ｂは、Ｅ_{１，ａｖｅ}～Ｅ_{ｎ，ａｖｅ}を取得し、最低温度レプリカの平均エネルギーと平均エネルギーの差が所定の閾値未満のレプリカ（図６では等エネルギー遷移レプリカと表記している）の数ｒを検出する。

そして、温度調整部２２ａ，２２ｂは、ｒ＞０であるか否かを判定する（ステップＳ３３）。温度調整部２２ａ，２２ｂは、ｒ＞０であると判定した場合、ステップＳ３５の処理を行い、ｒ＞０ではないと判定した場合、ステップＳ３４の処理を行う。

ステップＳ３４の処理では、温度調整部２２ａ，２２ｂは、全レプリカについてのＨ_ｉのうち、最小値ｍｉｎ（Ｈ_ｉ）を検出し、ａ＞ｍｉｎ（Ｈ_ｉ）であるか否かを判定する。温度調整部２２ａ，２２ｂは、ａ＞ｍｉｎ（Ｈ_ｉ）であると判定した場合、ステップＳ３５の処理を行い、ａ＞ｍｉｎ（Ｈ_ｉ）ではないと判定した場合、ステップＳ３６の処理を行う。

ステップＳ３５，Ｓ３６の処理では、温度調整部２２ａ，２２ｂは、最低温度を調整し、新しい最低温度を探索部２１に設定する。なお、ａ＝ｍｉｎ（Ｈ_ｉ）の場合には、最低温度の調整を行わず、現在の最低温度を維持してもよい。

ステップＳ３５の処理における最低温度の調整では、最低温度が上昇し、ステップＳ３６の処理における最低温度の調整では、最低温度が下降する。新しい最低温度は、前述の式（３）にしたがって計算されるが、ｒ＞０の場合におけるステップＳ３５の処理では、前述の式（４）にしたがって新しい最低温度が計算される。

これにより１回の最低温度の調整処理が終了する。上記のようなステップＳ２１～Ｓ３６の処理が繰り返されることで、より適切な最低温度に調整することができる。
なお、上記の処理の順序は一例であり、適宜処理の順序を入れ替えてもよい。

以上のような第２の実施の形態のデータ処理装置２０においても第１の実施の形態のデータ処理装置１０と同様の効果が得られる。すなわち、解の探索状況を反映した調整が行えるため、適切な最低温度を得るための調整時間を短縮できる。

（実験例）
以下、図３に示したようなデータ処理装置２０を用いて、最適化問題の一例である最大カット問題のベンチマーク問題であるＧｓｅｔのＧ２２、Ｇ３９を実行時間５分で求解した結果を説明する。Ｇ２２の最適解のエネルギーは－１３３５９、Ｇ３９の最適解のエネルギーは－１０２９９であることが知られている。

データ処理装置２０を用いて得られた各レプリカにおける最低エネルギーの平均値は、Ｇ２２の場合、－１３３３４．２であり、エネルギーＧ３９の場合、－１３３５２．０であった。

比較例として、最低温度の調整を行わない手法でＧｓｅｔのＧ２２、Ｇ３９を実行時間５分で求解した結果、最低エネルギーの平均値は、Ｇ２２の場合、－１３３２４．８であり、エネルギーＧ３９の場合、－１００３４．４であった。このため、データ処理装置２０は、比較例よりもＧ２２では、９．４、Ｇ３９では１４．６、低いエネルギーが得られ、よりよい解が得られた。つまり、上記のような最低温度の調整による効果が得られていることが分かった。

（コンピュータによる実装例）
図１や図３に示したデータ処理装置１０，２０が行う上記の処理内容（たとえば、図２や図６）は、以下に示すようなコンピュータにプログラムを実行させることでソフトウェアにて実現することもできる。

プログラムは、コンピュータ読み取り可能な記録媒体に記録しておくことができる。記録媒体として、たとえば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）及びＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）、ＣＤ－Ｒ（Recordable）／ＲＷ（Rewritable）、ＤＶＤ（Digital Versatile Disc）及びＤＶＤ－Ｒ／ＲＷが含まれる。プログラムは、可搬型の記録媒体に記録されて配布されることがある。その場合、可搬型の記録媒体から他の記録媒体にプログラムをコピーして実行してもよい。

図７は、データ処理装置の一例であるコンピュータのハードウェア例を示す図である。
コンピュータ５０は、プロセッサ５１、ＲＡＭ５２、ＨＤＤ５３、ＧＰＵ５４、入力インタフェース５５、媒体リーダ５６及び通信インタフェース５７を有する。上記ユニットは、バスに接続されている。

プロセッサ５１は、たとえば、図１の探索部１２、処理部１３、図３の探索部２１、温度調整部２２ａ、全体制御部２３として機能することができる。プロセッサ５１は、プログラムの命令を実行する演算回路やキャッシュメモリなどの記憶回路を含む、ＧＰＵやＣＰＵなどのプロセッサである。プロセッサ５１は、ＨＤＤ５３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ５２にロードし、プログラムを実行する。なお、プロセッサ５１は、たとえば、図３に示したように、レプリカ回路２１ａ１～２１ａｎの機能を並列に実行するために、複数のプロセッサコアを備えてもよい。また、コンピュータ５０は複数のプロセッサを備えてもよい。なお、複数のプロセッサの集合（マルチプロセッサ）を「プロセッサ」と呼んでもよい。

ＲＡＭ５２は、たとえば、図１の記憶部１１として機能する。ＲＡＭ５２は、プロセッサ５１が実行するプログラムやプロセッサ５１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、コンピュータ５０は、ＲＡＭ５２以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ５３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、及び、データを記憶する不揮発性の記憶装置である。プログラムには、たとえば、前述のような最適化問題の解を探索する処理や最低温度の調整処理をコンピュータ５０に実行させるプログラムが含まれる。なお、コンピュータ５０は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

ＧＰＵ５４は、プロセッサ５１からの命令にしたがって、コンピュータ５０に接続されたディスプレイ５４ａに画像（たとえば、最適化問題の解の探索結果などを表す画像）を出力する。ディスプレイ５４ａとしては、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ（ＰＤＰ：Plasma Display Panel）、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイなどを用いることができる。

入力インタフェース５５は、コンピュータ５０に接続された入力デバイス５５ａから入力信号を取得し、プロセッサ５１に出力する。入力デバイス５５ａとしては、マウスやタッチパネルやタッチパッドやトラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、コンピュータ５０に、複数の種類の入力デバイスが接続されていてもよい。

媒体リーダ５６は、記録媒体５６ａに記録されたプログラムやデータを読み取る読み取り装置である。記録媒体５６ａとして、たとえば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、ＦＤやＨＤＤが含まれる。光ディスクには、ＣＤやＤＶＤが含まれる。

媒体リーダ５６は、たとえば、記録媒体５６ａから読み取ったプログラムやデータを、ＲＡＭ５２やＨＤＤ５３などの他の記録媒体にコピーする。読み取られたプログラムは、たとえば、プロセッサ５１によって実行される。なお、記録媒体５６ａは、可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体５６ａやＨＤＤ５３を、コンピュータ読み取り可能な記録媒体ということがある。

通信インタフェース５７は、ネットワーク５７ａに接続され、ネットワーク５７ａを介して他の情報処理装置と通信を行うインタフェースである。通信インタフェース５７は、スイッチなどの通信装置とケーブルで接続される有線通信インタフェースでもよいし、基地局と無線リンクで接続される無線通信インタフェースでもよい。

なお、コンピュータ５０は、ＦＰＧＡやＡＳＩＣなどの電子回路を有するアクセラレータカードをバスに接続していてもよい。そして、探索部１２，２１の処理がそのアクセラレータカードによって実行されるようにしてもよい。

以上、実施の形態に基づき、本発明の温度調整プログラム、データ処理装置及びデータ処理方法の一観点について説明してきたが、これらは一例にすぎず、上記の記載に限定されるものではない。

１０データ処理装置
１１記憶部
１２探索部
１３処理部

Claims

最適化問題を変換したイジングモデルに基づいて、複数のレプリカ回路を用いたレプリカ交換法により前記最適化問題の解を探索する探索部から、前記複数のレプリカ回路のそれぞれにおける、前記最適化問題の解の探索処理における所定期間の開始時の状態から最も移動した状態までの距離を取得し、
前記複数のレプリカ回路のそれぞれにおける前記所定期間の前記距離のうち、最小値を検出し、
前記最小値と所定の第１の閾値との比較結果に基づいて、前記複数のレプリカ回路のそれぞれに設定される複数の温度値のうちの最小の温度値の大きさを変更し、
変更後の前記最小の温度値を前記探索部に対して設定する、
処理をコンピュータに実行させる温度調整プログラム。
前記最小値が、前記第１の閾値よりも大きい場合、前記最小値と前記閾値との差分に応じた大きさで、前記最小の温度値を減少させ、
前記最小値が、前記第１の閾値よりも小さい場合、前記差分に応じた大きさで、前記最小の温度値を増加させる、
処理を前記コンピュータに実行させる請求項１に記載の温度調整プログラム。
前記所定期間における前記複数のレプリカ回路のそれぞれのエネルギーの平均値を取得し、
前記複数のレプリカ回路のうち、前記最小の温度値が設定されているレプリカ回路の前記エネルギーとの差が、所定の第２の閾値未満となる前記エネルギーをもつレプリカ回路の数を検出し、
前記数が０より大きい場合、前記数に基づいて、前記最小の温度値を増加させる、
処理を前記コンピュータに実行させる請求項１に記載の温度調整プログラム。
前記第１の閾値は、前記所定期間を表す値の２進対数である、請求項１に記載の温度調整プログラム。
最適化問題を変換したイジングモデルに基づいて、複数のレプリカ回路を用いたレプリカ交換法により前記最適化問題の解を探索する探索部と、
前記探索部から、前記複数のレプリカ回路のそれぞれにおける、前記最適化問題の解の探索処理における所定期間の開始時の状態から最も移動した状態までの距離を取得し、前記複数のレプリカ回路のそれぞれにおける前記所定期間の前記距離のうち、最小値を検出し、前記最小値と所定の第１の閾値との比較結果に基づいて、前記複数のレプリカ回路のそれぞれに設定される複数の温度値のうちの最小の温度値の大きさを変更し、変更後の前記最小の温度値を前記探索部に対して設定する処理部と、
を有するデータ処理装置。
探索部が、最適化問題を変換したイジングモデルに基づいて、複数のレプリカ回路を用いたレプリカ交換法により前記最適化問題の解を探索し、
処理部が、
前記探索部から、前記複数のレプリカ回路のそれぞれにおける、前記最適化問題の解の探索処理における所定期間の開始時の状態から最も移動した状態までの距離を取得し、
前記複数のレプリカ回路のそれぞれにおける前記所定期間の前記距離のうち、最小値を検出し、前記最小値と所定の第１の閾値との比較結果に基づいて、前記複数のレプリカ回路のそれぞれに設定される複数の温度値のうちの最小の温度値の大きさを変更し、変更後の前記最小の温度値を前記探索部に対して設定する、
データ処理方法。