JP2023179849A

JP2023179849A - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: JP2023179849A
Application number: JP2022092706A
Authority: JP
Inventors: 浩一神田; Koichi Kanda
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2022-06-08
Filing date: 2022-06-08
Publication date: 2023-12-20
Also published as: CN117196021A; EP4290417A1; US20230401279A1

Abstract

【課題】多様な状態を効率的に探索可能にする。【解決手段】記憶部１１は、エネルギー関数に含まれる、イジングモデルの状態を示すＮ（Ｎは３以上の整数）の２乗個の状態変数を記憶する。処理部１２は、Ｎの２乗個の状態変数をＮ行Ｎ列に配列したときの各行に含まれる状態変数の値の和が１であり、かつ各列に含まれる状態変数の値の和が１である制約を満たすように４つの状態変数の値を変化させる状態遷移の繰り返しにより、第１状態から複数の状態を経て第１状態に戻る巡回遷移処理を実行する。処理部１２は、巡回遷移処理により順次得られる複数の状態の中から、第１状態からの状態遷移ごとのエネルギー関数の値の変化量の累積が所定の判定基準を満たす第２状態を特定する。【選択図】図１

Description

本発明は情報処理装置、情報処理方法およびプログラムに関する。

組合せ最適化問題の求解に情報処理装置が用いられることがある。組合せ最適化問題は、磁性体のスピンの振る舞いを表すモデルであるイジングモデルのエネルギー関数に変換される。エネルギー関数は、評価関数や目的関数と言われることもある。

情報処理装置は、例えばエネルギー関数に含まれる状態変数の値の組合せのうち、エネルギー関数の値を最小化する組合せを探索する。この場合、エネルギー関数の値を最小化する状態変数の値の組合せは、状態変数の組により表される基底状態または最適解に相当する。実用的な時間で組合せ最適化問題の近似解を得る手法には、マルコフ連鎖モンテカルロ（ＭＣＭＣ：Markov-Chain Monte Carlo）法に基づく、シミュレーテッドアニーリング（ＳＡ：Simulated Annealing）法やレプリカ交換法などがある。

ところで、組合せ最適化問題には、エネルギー関数に含まれる複数の状態変数のうち値が１となる状態変数の数を１つのみとする制約、すなわち、１－Ｈｏｔ制約をもつものがある。１－Ｈｏｔ制約には、Ｎ^２個の状態変数をＮ行Ｎ列の行列状に並べたときに各行と各列に含まれる状態変数の値の和が１となるものがある。このような１－Ｈｏｔ制約は、２－Ｗａｙ１－Ｈｏｔ制約と言われる。例えば、ｘ_１～ｘ_９を３行３列の行列状に並べたときに、ｘ_１＋ｘ_２＋ｘ_３＝１、ｘ_４＋ｘ_５＋ｘ_６＝１、ｘ_７＋ｘ_８＋ｘ_９＝１、ｘ_１＋ｘ_４＋ｘ_７＝１、ｘ_２＋ｘ_５＋ｘ_８＝１、ｘ_３＋ｘ_６＋ｘ_９＝１とする制約は、２－Ｗａｙ１－Ｈｏｔ制約である。巡回セールスマン問題、配車計画問題、２次割り当て問題および線形順序付け問題などは、２－Ｗａｙ１－Ｈｏｔ制約をもつ。

２－Ｗａｙ１－Ｈｏｔ制約をもつ組合せ最適化問題では、Ｎ行Ｎ列の各状態変数の値は、異なるＮ個の要素の順列で表記可能である。例えば、異なる３つの要素を「１，２，３」とすると、３行３列の各状態変数の値は（１，２，３）や（２，１，３）などのように表記される。例えば、順列の要素の位置は行を示し、順列の要素の値は１である状態変数の列を示す。このように、２－Ｗａｙ１－Ｈｏｔ制約を充足する解は順列で表される。解が順列で表される組合せ最適化問題は順列最適化問題と言われる。

例えば、２－Ｗａｙ１－Ｈｏｔ制約をもつ組合せ最適化問題の求解を行う最適化装置の提案がある。
また、最適化問題において異なる初期状態から解探索を繰り返す場合に、各解探索において用いる初期状態を、過去に求めた解から所定距離以上離れた第１の状態から目的関数値を改善することにより得られた局所解とする最適化装置の提案がある。

また、第１のエネルギー関数の値を最小にする複数の状態変数の値の探索を行う組合せ最適化装置の提案がある。提案の組合せ最適化装置は、第１のエネルギー関数を用いる第１探索と、第１探索の後、第１のエネルギー関数から制約条件を表す項を除去した第２のエネルギー関数を用いる第２探索と、第２探索の後、第１のエネルギー関数を用いる第３探索とを行う。

更に、イジングモデルを用いて解を求めるアニーリングにおいて、瞬間磁場の計算、スピンの更新確率の計算、スピンの更新を全て並列に実行する情報処理装置の提案がある。

特開２０２１－１５７３６１号公報特開２０２１－４３７８７号公報特開２０２１－３３６５７号公報米国特許出願公開第２０２１／００７２９５９号明細書

２－Ｗａｙ１－Ｈｏｔ制約をもつ組合せ最適化問題、すなわち、順列最適化問題の求解を行う上記の最適化装置では、１回の状態遷移の試行では高々４つの状態変数の値が変化される。ところが、現状態に対して高々４つの状態変数の値を変化させた状態の中だけから遷移先の状態を決定していると、例えば局所解に陥った場合に局所解から脱出できなくなることがある。

１つの側面では、本発明は、多様な状態を効率的に探索可能にする情報処理装置、情報処理方法およびプログラムを提供することを目的とする。

１つの態様では、イジングモデルのエネルギー関数で表される順列最適化問題の解を探索する情報処理装置が提供される。情報処理装置は、記憶部および処理部を有する。記憶部は、エネルギー関数に含まれる、イジングモデルの状態を示すＮ（Ｎは３以上の整数）の２乗個の状態変数を記憶する。処理部は、Ｎの２乗個の状態変数をＮ行Ｎ列に配列したときの各行に含まれる状態変数の値の和が１であり、かつ各列に含まれる状態変数の値の和が１である制約を満たすように４つの状態変数の値を変化させる状態遷移の繰り返しにより、第１状態から複数の状態を経て第１状態に戻る巡回遷移処理を実行する。処理部は、巡回遷移処理により順次得られる複数の状態の中から、第１状態からの状態遷移ごとのエネルギー関数の値の変化量の累積が所定の判定基準を満たす第２状態を特定する。

また、１つの態様では、情報処理方法が提供される。また、１つの態様では、プログラムが提供される。

１つの側面では、多様な状態を効率的に探索できる。

第１の実施の形態の情報処理装置を説明する図である。第２の実施の形態の情報処理装置のハードウェア例を示す図である。２－Ｗａｙ１－Ｈｏｔによるビットフリップ制御例を示す図である。イジングモデルの状態と順列との対応関係の例を示す図である。情報処理装置の機能例を示す図である。通常の２Ｗ１Ｈモードおよび巡回遷移モードの動作例を示す図である。情報処理装置の処理例を示すフローチャートである。巡回遷移モードの他の例（その１）を示す図である。巡回遷移モードの他の例（その２）を示す図である。巡回遷移モードの他の例（その３）を示す図である。

以下、本実施の形態について図面を参照して説明する。
［第１の実施の形態］
第１の実施の形態を説明する。

図１は、第１の実施の形態の情報処理装置を説明する図である。
情報処理装置１０は、組合せ最適化問題に対する解を、ＭＣＭＣ法を用いて探索し、探索した解を出力する。例えば、情報処理装置１０は、ＭＣＭＣ法を基にしたＳＡ法などを解の探索に用いる。情報処理装置１０は記憶部１１および処理部１２を有する。

記憶部１１は、例えばＲＡＭ（Random Access Memory）などの揮発性記憶装置である。記憶部１１は、レジスタなどの電子回路を含んでもよい。処理部１２は、ＣＰＵ（Central Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）、ＧＰＵ（Graphics Processing Unit）などの電子回路でもよい。処理部１２はプログラムを実行するプロセッサでもよい。「プロセッサ」は、複数のプロセッサの集合（マルチプロセッサ）を含み得る。

組合せ最適化問題は、イジング型のエネルギー関数により定式化され、例えばエネルギー関数の値を最小化する問題に置き換えられる。エネルギー関数は、目的関数や評価関数などと言われてもよい。エネルギー関数は、複数の状態変数を含む。状態変数は、０または１の値を取るバイナリ変数である。状態変数はビットと言われてもよい。組合せ最適化問題の解は、複数の状態変数の値により表される。エネルギー関数の値を最小化する解は、イジングモデルの基底状態を表し、組合せ最適化問題の最適解に対応する。エネルギー関数の値は、エネルギーと表記される。

イジング型のエネルギー関数は、式（１）で表される。

状態ベクトルｘは、複数の状態変数を要素とし、イジングモデルの状態を表す。式（１）は、ＱＵＢＯ（Quadratic Unconstrained Binary Optimization）形式で定式化されたエネルギー関数である。なお、エネルギーを最大化する問題の場合には、エネルギー関数の符号を逆にすればよい。

式（１）の右辺第１項は、全状態変数から選択可能な２つの状態変数の全組合せについて、漏れと重複なく、２つの状態変数の値と重み係数との積を積算したものである。添え字ｉ，ｊは状態変数のインデックスである。ｘ_ｉは、ｉ番目の状態変数である。ｘ_ｊは、ｊ番目の状態変数である。Ｗ_ｉｊは、ｉ番目の状態変数とｊ番目の状態変数との間の重み、または、結合の強さを示す重み係数である。Ｗ_ｉｊ＝Ｗ_ｊｉであり、Ｗ_ｉｉ＝０である。

式（１）の右辺第２項は、全状態変数の各々のバイアスと状態変数の値との積の総和を求めたものである。ｂ_ｉは、ｉ番目の状態変数に対するバイアスを示している。エネルギー関数に含まれる重み係数やバイアスなどを含む問題データは、記憶部１１に記憶される。式（１）において、状態変数ｘ_ｉの値が変化して１－ｘ_ｉとなると、ｘ_ｉの増加分は、δｘ_ｉ＝（１－ｘ_ｉ）－ｘ_ｉ＝１－２ｘ_ｉと表せる。ｘ_ｉの変化に伴うエネルギーの変化量ΔＥ_ｉは、式（２）で表される。

ｈ_ｉは局所場と呼ばれ、式（３）で表される。局所場は、ローカルフィールド（ＬＦ：Local Field）と言われることもある。

状態変数ｘ_ｊが変化したときの局所場ｈ_ｉの変化分δｈ_ｉ ^（ｊ）は、式（４）で表される。

状態変数ｘ_ｊの値が変化したときに変化分δｈ_ｉ ^（ｊ）をｈ_ｉに加算することで、ｘ_ｊの値の変化後の状態に対応するｈ_ｉが得られる。
基底状態の探索において、エネルギー変化がΔＥ_ｉとなる状態遷移、すなわち、状態変数ｘ_ｉの値の変化を許容するか否かを決定するためにメトロポリス法やギブス法が用いられる。すなわち、ある状態から当該状態よりもエネルギーの低い他の状態への遷移を探索する近傍探索において、エネルギーが下がる状態だけでなく、エネルギーが上がる状態への遷移が確率的に許容される。例えば、エネルギー変化ΔＥの状態変数の値の変化を受け入れる確率Ａは、式（５）で表される。

βは温度値Ｔ（Ｔ＞０）の逆数（β＝１／Ｔ）であり、逆温度と呼ばれる。ｍｉｎ演算子は、引数のうちの最小値を取ることを示す。式（５）の右辺上側はメトロポリス法に相当する。式（５）の右辺下側はギブス法に相当する。処理部１２は、あるインデックスｉに関して０＜ｕ＜１である一様乱数ｕとＡとを比較し、ｕ＜Ａであれば状態変数ｘ_ｉの値の変化を受入れ、状態変数ｘ_ｉの値を変化させる。処理部１２は、ｕ＜Ａでなければ状態変数ｘ_ｉの値の変化を受入れず、状態変数ｘ_ｉの値を変化させない。式（５）によれば、ΔＥが大きい値であるほど、Ａは小さくなる。また、βが小さい、すなわち、Ｔが大きいほど、ΔＥが大きい状態遷移も許容され易くなる。例えば、メトロポリス法の判定基準が用いられる場合、式（５）を変形した式（６）により遷移判定が行われてもよい。

すなわち、一様乱数ｕ（０＜ｕ≦１）に対して、エネルギー変化ΔＥが式（６）を満たす場合に、該当の状態変数の値の変化が許容される。一様乱数ｕに対して、エネルギー変化ΔＥが式（６）を満たさない場合に、該当の状態変数の値の変化が許容されない。ｌｎ（ｕ）・Ｔは熱ノイズに相当する。例えば、ＳＡ法では、最高温度値から最低温度値へ温度値Ｔを徐々に下げながら解を探索する。

ここで、処理部１２は、２－Ｗａｙ１－Ｈｏｔ制約を満たす状態以外の状態の探索を除外することで、２－Ｗａｙ１－Ｈｏｔ制約をもつ組合せ最適化問題、すなわち、順列最適化問題を効率的に解く。順列最適化問題は、Ｎ^２個の状態変数の値で表される順列であって、エネルギー関数の値を最小化、または最大化する順列を求める問題であると言える。順列最適化問題には、例えば、２次割り当て問題（ＱＡＰ：Quadratic Assignment Problem）、巡回セールスマン問題（ＴＳＰ：Travelling Salesman Problem）、配車計画問題（ＶＲＰ：Vehicle Routing Problem）および線形順序付け問題（ＬＯＰ：Linear Ordering Problem）などがある。２－Ｗａｙ１－Ｈｏｔ制約を満たす状態以外の状態の探索を除外する場合、処理部１２は、一度の状態遷移において、４つの状態変数の値を変化させることになる。

以下では、エネルギー関数に含まれるｎ＝Ｎ^２（Ｎは３以上の整数）の状態変数が２－Ｗａｙ１－Ｈｏｔ制約を受けるものとする。これらの状態変数をＮ行Ｎ列に配列したときに各行と各列に含まれる状態変数の値の和が１である制約を満たすように、一度の状態遷移において、４つの状態変数の値を変化させることで、２－Ｗａｙ１－Ｈｏｔ制約を満たす状態以外の状態の探索が除外される。Ｎ^２の状態変数をＮ行Ｎ列に配列する場合、例えば、ｘ_１～ｘ_Ｎが１行目の１列目～Ｎ列目に相当し、ｘ_Ｎ＋１～ｘ_２Ｎが２行目の１列目～Ｎ列目に相当し、以降、同様に、ｘ_{Ｎ＾２－Ｎ＋１}～ｘ_Ｎ＾２がＮ行目の１列目～Ｎ列目に相当する。

なお、２－Ｗａｙ１－Ｈｏｔ制約が満たされている状態で、値が０の状態変数の１つを更新対象候補とした場合、他の３つの更新対象候補の状態変数が決まる。
例えば、インデックス＝ｉ，ｊ，ｋ，ｌ（ｉ＜ｊ＜ｋ＜ｌ）の４つの状態変数（ｘ_ｉ，ｘ_ｊ，ｘ_ｋ，ｘ_ｌ）の値を変化させると仮定する。ｘ_ｉ，ｘ_ｊは同じ行に属する。ｘ_ｉ，ｘ_ｋは同じ列に属する。ｘ_ｋ，ｘ_ｌは同じ行に属する。ｘ_ｊ，ｘ_ｌは同じ列に属する。

値が０の状態変数であるｘ_ｊを更新対象候補とした場合、ｘ_ｊと同じ行および同じ列に含まれる状態変数のうち、値が１の状態変数であるｘ_ｉ，ｘ_ｌが更新対象候補となる。さらに、ｘ_ｉと同じ列、かつ、ｘ_ｌと同じ行である、値が０のｘ_ｋが更新対象候補となる。これら４つの状態変数（ｘ_ｉ，ｘ_ｊ，ｘ_ｋ，ｘ_ｌ）の値の変化は、式（７）のように表せる。

４つの状態変数（ｘ_ｉ，ｘ_ｊ，ｘ_ｋ，ｘ_ｌ）の値を変化させた場合に生じるイジングモデルのエネルギー変化をΔＥ_ｊとすると、ΔＥ_ｊは、以下の式（８）のように表せる。

また、ｘ_ｉ，ｘ_ｊ，ｘ_ｋ，ｘ_ｌが変化することによる局所場の変化分Δｈ_ｍ（ｍ＝１，２，…，ｎ）は、以下の式（９）のように表せる。

このように、順列最適化問題では、式（５）または式（６）のΔＥに式（８）のΔＥ_ｊが用いられる。また、式（４）のδｈ_ｉ ^（ｊ）に代えて、式（９）のΔｈ_ｍが用いられる。記憶部１１は、Ｎ^２個の状態変数の値を保持する。記憶部１１は、Ｎ^２個の状態変数それぞれに対応する局所場ｈ_ｍを保持する。処理部１２は、記憶部１１に保持されるｈ_ｍに基づいて、ΔＥ_ｊを計算する。また、処理部１２は、ΔＥ_ｊと式（５）または式（６）とに基づいて、値の変化が許容される４つの状態変数を判定する。処理部１２は、記憶部１１に保持されるＮ^２個の状態変数のうち、値の変化が許容される４つの状態変数の値を変化させることで、イジングモデルの状態を遷移させる。処理部１２は、４つの状態変数の値の変化に伴い、記憶部１１に保持されるｈ_ｍを、ｈ_ｍ＝ｈ_ｍ＋Δｈ_ｍに更新する。

例えば、処理部１２は、変化候補となる４つの状態変数をシーケンシャルに選択して、ΔＥ_ｊの計算や式（５）または式（６）の判定を行い、値の変化が許容される４つの状態変数の値を変化させる処理を繰り返し行ってもよい。あるいは、処理部１２は、変化候補の４つの状態変数の複数の組に対して、ΔＥ_ｊの計算や式（５）または式（６）の判定を並列に行ってもよい。この場合、処理部１２は、値の変化が許容される組からランダムに１つを選択し、当該組に属する４つの状態変数の値を変化させる処理を繰り返し行う。

このように、処理部１２は、順列最適化問題の求解における１回の状態遷移の試行では高々４つの状態変数の値を変化させる仕組みをもつ。ここで、Ｎ行Ｎ列の各状態変数の値は順列で表せる。例えば、順列の要素の位置は行を示し、順列の要素の値は１である状態変数の列を示す。図１では、Ｎ＝４の場合、すなわち、４行４列の計１６個の状態変数で表される１つの状態２０に対応する順列（１，２，３，４）が示されている。例えば、順列の左からｐ番目の値ｑは、状態２０で示される行列の上からｐ行目かつ左からｑ列目の要素を１とすることを示す。順列の左からｐ番目の値ｑは、状態２０で示される行列の左からｐ列目かつ上からｑ行目の要素を１とすることを示してもよい。

処理部１２による、４つの状態変数の値を変化させる操作は、順列内の任意の２つの要素の位置を交換する操作に相当する。しかし、処理部１２による１回の操作では、元の順列（１，２，３，４）に対して、（１，２，４，３）、（１，４，３，２）、（４，２，３，１）などのように、２つの要素を交換できるだけである。

ところが、このような操作により、次の遷移先の状態を決定していると、例えば局所解に陥った場合に局所解から脱出できなくなり、より良い解を得られなくなることがある。そこで、処理部１２は、下記の処理により、より多様な解の探索を可能にする。

具体的には、処理部１２は、４つの状態変数の値を変化させる状態遷移の繰り返しにより、第１状態から複数の状態を経て第１状態に戻る巡回遷移処理を実行する。そして、処理部１２は、巡回遷移処理により順次得られる状態の中から、第１状態からの状態遷移ごとのエネルギー関数の値の変化量の累積が所定の判定基準を満たす第２状態を特定する。

より具体的には、処理部１２は、次の第１ステップ～第４ステップを含む処理を繰り返し実行することで、第１状態に対して第２状態を取得する。第１状態は、下記の巡回遷移処理の起点の状態である。

第１ステップは、Ｎの２乗個の状態変数のうちの４つの状態変数の値を変化させる場合のエネルギーの変化量を、式（８）に基づいて計算するステップである。なお、次に値を変化させる４つの状態変数の組の選択順序は、予め定められる。

第２ステップは、当該４つの状態変数の値を変化させるステップである。第２ステップでは、処理部１２は、式（９）に基づく局所場ｈ_ｍの更新も行う。
第３ステップは、４つの状態変数の値の変化ごとのエネルギーの変化量の累積が所定の判定基準を満たすか否か判定するステップである。第１状態を起点として前回までに求めたエネルギーの変化量の累積は、記憶部１１に保持される。処理部１２は、今回の第１ステップで求めたエネルギーの変化量を、前回までに求めたエネルギーの変化量の累積に加算することで、今回までのエネルギーの変化量の累積ΔＥ’を求める。累積ΔＥ’は、起点の状態である第１状態のエネルギーと現在の状態とのエネルギーとの差分となる。所定の判定基準としては、例えば、上記のメトロポリス法の判定基準やギブス法の判定基準が用いられる。例えば、処理部１２は、式（５）または式（６）のΔＥを、変化量の累積ΔＥ’として、式（５）または式（６）による判定基準を満たすか否かを判定する。第２ステップと第３ステップとの実行順序は逆でもよい。

第４ステップは、当該変化量の累積が所定の判定基準を満たさない場合に、次に値を変化させる４つの状態変数の組を選択するステップである。処理部１２は、第４ステップの後は、第１ステップに進み、第１ステップから繰り返し処理を実行する。

そして、処理部１２は、第３ステップの判定において、エネルギーの変化量の累積が所定の判定基準を満たす場合に、現在の状態を第１状態に対する第２状態として特定して上記処理の繰り返しを終了する。一方、処理部１２は、第１ステップ～第４ステップを含む上記処理を、第２状態が特定されないまま、複数回繰り返すことで到達する状態を第１状態に一致させる。

テーブル３０，４０は、状態２０を第１状態とする巡回遷移処理の例を示す。テーブル３０は、第２状態が得られる場合である。テーブル４０は、第２状態が得られない場合である。テーブル３０，４０の「回数」は、第１ステップ～第４ステップを含む上記処理の繰り返し回数を示す。テーブル３０，４０の「状態」は、当該繰り返し回数だけ状態遷移を繰り返した時点で到達する状態を示す。テーブル３０，４０の回数「０」のレコードは、第１状態を示す。

例えば、処理部１２は、順列（α，β，γ，δ）の最後尾の要素δに着目して、交換対象（γ，δ）、（β，δ）、（α，δ）を順番に選択して交換を行うという遷移パターンを用いる。この場合、各交換後の順列は、（α，β，δ，γ）、（α，δ，β，γ）、（δ，α，β，γ）となる。処理部１２は、δが順列の先頭に来たら、その状態を新たに順列（α，β，γ，δ）として、同じように交換対象を順番に選択する。これにより、４行４列の状態変数で表される状態の変化を１２回繰り返すことで、元の状態に戻る。

テーブル３０は、巡回遷移処理の途中で判定基準が満たされる場合の例を示す。具体的には、処理部１２は、上記の遷移パターンを、状態２０を起点として４回繰り返した時点で、エネルギーの変化量の累積ΔＥ’が判定基準を満たすと判定したと仮定する。この場合、処理部１２は、順列（４，１，３，２）に対応する状態２１を、状態２０に対する第２状態として特定する。

テーブル４０は、巡回遷移処理の途中で判定基準が満たされない場合の例を示す。具体的には、処理部１２は、上記の遷移パターンを、状態２０を起点として１２回繰り返した時点で、状態２０に到達する。特に、処理部１２は、当該遷移パターンにより状態２０に達するまでに生成する状態を、全て異なる状態とする。上記のように、ある遷移パターンでの置換の繰り返しにより、第１状態から開始して、第１状態に再び戻る手順を、巡回シナリオと言う。

このように、情報処理装置１０によれば、Ｎの２乗個の状態変数をＮ行Ｎ列に配列したときの各行に含まれる状態変数の値の和が１であり、かつ各列に含まれる状態変数の値の和が１である制約を満たすように４つの状態変数の値を変化させる状態遷移が繰り返されることで、第１状態から複数の状態を経て第１状態に戻る巡回遷移処理が実行される。巡回遷移処理により順次得られる複数の状態の中から、第１状態からの状態遷移ごとのエネルギー関数の値の変化量の累積が所定の判定基準を満たす第２状態が特定される。ただし、第２状態が特定された時点で、巡回遷移処理を終了できるので、この場合、情報処理装置１０は、当該巡回遷移処理における、第１状態から第１状態までに戻る全ての状態を得るわけではない。

例えば、情報処理装置１０は、１度に４つの状態変数の値を変化させるという処理部１２の操作を複数回行うことで、第１状態に対する第２状態を探索可能にする。これにより、情報処理装置１０は、例えば、順列（１，２，３，４）で表される第１状態に対して、順列（１，４，２，３）や（４，１，３，２）などで表される、より多様な状態を効率的に探索して第２状態を得られる。ここで、順列（１，４，２，３）や（４，１，３，２）で表される状態は、順列（１，２，３，４）で表される状態に対して４より多い数の状態変数の値が変更された状態である。すなわち、情報処理装置１０は、巡回遷移処理により、第１状態に対して、４より多い数の状態変数の値を変化させるマルチビット遷移を実現していると言える。

ここで、情報処理装置１０は、第１状態に戻らないよう状態遷移を繰り返して、第１状態に対するマルチビット遷移を実現することも考えられる。しかし、この場合、第２状態を得られる保証はないため、情報処理装置１０は、第１状態からの状態遷移を開始するときに、第１状態における各状態変数の値と、各状態変数の局所場ｈ_ｍとの複製を記憶部１１に保持しておくことになる。仮に第２状態を得られなかったときに、第１状態を復元可能にするためである。しかし、第１状態における各状態変数の値と局所場ｈ_ｍの複製とを記憶部１１に保持しておくと、記憶部１１として多くのメモリ容量を要する。特に、第１状態における各状態変数の局所場ｈ_ｍの複製を保持する場合、記憶部１１に要求されるメモリ容量が過大になり得る。

そこで、情報処理装置１０は、巡回遷移処理により始点と終点とを第１状態に一致させることで、例えば第１状態に対応する局所場ｈ_ｍの複製を、記憶部１１に保持しておかなくてもよくなる。巡回遷移処理により第１状態に到達することで、各状態変数の局所場ｈ_ｍも、第１状態に対応する値になるからである。これにより、例えば、情報処理装置１０は、記憶部１１に要求されるメモリ容量の増加を抑えて、すなわち、メモリ容量を効率的に使用して、より多様な状態を探索可能になる。こうして、情報処理装置１０は、多様な状態を効率的に探索できる。

ここで、情報処理装置１０は、巡回遷移処理を、通常の探索処理と組合せて実行してもよい。通常の探索処理とは、現状態に対して、２－Ｗａｙ１－Ｈｏｔ制約を満たすように４つの状態変数の値を変化させる場合のエネルギーの変化量が上記判定基準を満たすか否かにより、現状態に対する遷移先の状態を決定することで解の探索を行う処理である。

例えば、処理部１２は、まずは、通常の探索処理を実行する。そして、処理部１２は、通常の探索処理で局所解に陥った場合に、当該局所解を第１状態として、巡回遷移処理を実行してもよい。局所解に陥った場合とは、通常の探索処理において、現時点の次の遷移先候補の全ての状態が、式（５）または式（６）の判定基準を満たさない場合である。この場合、処理部１２は、巡回遷移処理により第２状態を取得したら、第２状態から、通常の探索処理に復帰してもよい。これにより、情報処理装置１０は、通常の探索処理における局所解から脱出して、より良い解を探索可能になり、求解性能を向上できる。

更に他の例では、情報処理装置１０は、複数の巡回シナリオを含む巡回遷移処理により、解の探索を行ってもよい。例えば、処理部１２は、第１巡回シナリオによる巡回遷移処理で第１状態に戻った場合に、第２巡回シナリオによる巡回遷移処理を継続してもよい。また、処理部１２は、第１巡回シナリオによる巡回遷移処理で第２状態を特定した場合に、特定した第２状態を新たな第１状態として第２巡回シナリオによる巡回遷移処理を継続してもよい。

例えば、処理部１２は、通常の探索処理で局所解に陥った場合に、第１巡回シナリオによる巡回遷移処理に移り、第１巡回シナリオで第２状態を取得する。そして、処理部１２は、当該第２状態を新たな第１状態として第２巡回シナリオによる巡回遷移処理に移り、第２巡回シナリオで第２状態を取得し、当該第２状態から、通常の探索処理に復帰してもよい。更に、処理部１２は、通常の探索処理を用いずに、複数の巡回シナリオによる巡回遷移処理のみによって、解の探索を行ってもよい。

このように、情報処理装置１０は、複数の巡回シナリオを組み合わせて使用することで、１つの巡回シナリオだけでは到達し得ない多様な解を探索可能になり、求解性能を向上できる。

処理部１２は、式（５）または式（６）に用いられる温度値Ｔを定期的に下げながら、巡回遷移処理を含む上記の解の探索を実行する。そして、処理部１２は、最終温度値に達すると、例えばそれまでに得られた解の中で最もエネルギーの低い解を、順列最適化問題に対する最終的な解として出力する。こうして、情報処理装置１０は、順列最適化問題に対する解を効率的に得ることができる。

［第２の実施の形態］
次に、第２の実施の形態を説明する。
図２は、第２の実施の形態の情報処理装置のハードウェア例を示す図である。

情報処理装置１００は、組合せ最適化問題に対する解を、ＭＣＭＣ法を用いて探索し、探索した解を出力する。情報処理装置１００は、ＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ（Hard Disk Drive）１０３、ＧＰＵ１０４、入力インタフェース１０５、媒体リーダ１０６、ＮＩＣ（Network Interface Card）１０７およびアクセラレータカード１０８を有する。

ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。なお、ＣＰＵ１０１は複数のプロセッサコアを含んでもよい。また、情報処理装置１００は複数のプロセッサを有してもよい。以下で説明する処理は複数のプロセッサまたはプロセッサコアを用いて並列に実行されてもよい。また、複数のプロセッサの集合を「マルチプロセッサ」または単に「プロセッサ」と言うことがある。

ＲＡＭ１０２は、ＣＰＵ１０１が実行するプログラムやＣＰＵ１０１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、情報処理装置１００は、ＲＡＭ以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ１０３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、および、データを記憶する不揮発性の記憶装置である。なお、情報処理装置１００は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

ＧＰＵ１０４は、ＣＰＵ１０１からの命令に従って、情報処理装置１００に接続されたディスプレイ５１に画像を出力する。ディスプレイ５１としては、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイなど、任意の種類のディスプレイを用いることができる。

入力インタフェース１０５は、情報処理装置１００に接続された入力デバイス５２から入力信号を取得し、ＣＰＵ１０１に出力する。入力デバイス５２としては、マウス、タッチパネル、タッチパッド、トラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、情報処理装置１００に、複数の種類の入力デバイスが接続されていてもよい。

媒体リーダ１０６は、記録媒体５３に記録されたプログラムやデータを読み取る読み取り装置である。記録媒体５３として、例えば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）が含まれる。

媒体リーダ１０６は、例えば、記録媒体５３から読み取ったプログラムやデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、例えば、ＣＰＵ１０１によって実行される。なお、記録媒体５３は可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体５３やＨＤＤ１０３を、コンピュータ読み取り可能な記録媒体と言うことがある。

ＮＩＣ１０７は、ネットワーク５４に接続され、ネットワーク５４を介して他のコンピュータと通信を行うインタフェースである。ＮＩＣ１０７は、例えば、スイッチやルータなどの通信装置とケーブルで接続される。ＮＩＣ１０７は、無線通信インタフェースでもよい。

アクセラレータカード１０８は、式（１）のイジング型のエネルギー関数で表される問題の解を、ＭＣＭＣ法を用いて探索するハードウェアアクセラレータである。アクセラレータカード１０８は、重み係数やバイアスを含むエネルギー関数の情報を示す問題データをＣＰＵ１０１から受け付け、解の探索を行い、探索した解を出力する。

アクセラレータカード１０８は、一定温度のＭＣＭＣ法または複数温度間でイジングモデルの状態を交換するレプリカ交換法を行うことで、該当温度におけるボルツマン分布に従う状態をサンプリングするサンプラーとして用いることができる。アクセラレータカード１０８は、組合せ最適化問題の求解のためには、レプリカ交換法や温度値を徐々に下げるＳＡ法などのアニーリングの処理を実行する。

ＳＡ法は、各温度値におけるボルツマン分布に従う状態をサンプリングし、サンプリングに用いる温度値を高温から低温に下げる、すなわち、逆温度βを増やすことで、最適解を効率的に発見する方法である。低温側、すなわち、βの大きい場合でもある程度状態が変化することで、温度値を早く下げても良い解を発見できる可能性が高くなる。例えば、ＳＡ法を用いる場合、アクセラレータカード１０８は、一定の温度値での状態遷移の試行を一定回数繰り返した後に温度値を下げる、という動作を繰り返す。

レプリカ交換法は、複数の温度値を用いて独立してＭＣＭＣ法を実行し、各温度値で得られた状態に対して、適宜、温度値を交換する手法である。低温でのＭＣＭＣによって状態空間の狭い範囲を探索し、高温でのＭＣＭＣによって状態空間の広い範囲を探索することで、効率的に良い解を発見することができる。例えば、レプリカ交換法を用いる場合、アクセラレータカード１０８は、複数の温度値の各々での状態遷移の試行を並列して行い、一定回数の試行を行うごとに、各温度値で得られた状態に対して、所定の交換確率で温度値を交換する、という動作を繰り返す。

アクセラレータカード１０８は、ＦＰＧＡ１０９を有する。ＦＰＧＡ１０９は、アクセラレータカード１０８における解探索機能を実現する。解探索機能は、ＧＰＵやＡＳＩＣなどの他の種類の電子回路により実現されてもよい。ＦＰＧＡ１０９は、メモリ１０９ａを有する。メモリ１０９ａは、ＦＰＧＡ１０９での探索に用いられる問題データやＦＰＧＡ１０９により探索された解を保持する。メモリ１０９ａは、例えばＳＲＡＭ（Static Random Access Memory）である。ＦＰＧＡ１０９は、メモリ１０９ａを含む複数のメモリを有してもよい。ＦＰＧＡ１０９は、第１の実施の形態の処理部１２の一例である。メモリ１０９ａは、第１の実施の形態の記憶部１１の一例である。なお、アクセラレータカード１０８は、ＦＰＧＡ１０９の外部にＲＡＭを有してもよく、ＦＰＧＡ１０９の処理に応じて、メモリ１０９ａに格納されたデータを当該ＲＡＭに一時的に退避してもよい。

アクセラレータカード１０８のようにイジング形式の問題の解を探索するハードウェアアクセラレータは、イジングマシンやボルツマンマシンなどと呼ばれることがある。
図３は、２－Ｗａｙ１－Ｈｏｔによるビットフリップ制御例を示す図である。

組合せ最適化問題では、２－Ｗａｙ１－Ｈｏｔ制約と呼ばれる制約条件が課されることがある。２－Ｗａｙ１－Ｈｏｔ制約をもつ組合せ最適化問題は、順列最適化問題と言われる。２－Ｗａｙ１－Ｈｏｔは、２Ｗ１Ｈと略記される。

ここで、１－Ｈｏｔ制約とは、「ある状態変数の組の中で、値が１の変数は１個だけである」という制約である。例えば、図３では、Ｎ^２個（Ｎは３以上の整数）の状態変数ｘ_１，ｘ_２，…が、Ｎ行Ｎ列で示されている。グループｇ１１，ｇ１２は、行に対応する状態変数のグループの例を示す。グループｇ２１，ｇ２２は、列に対応する状態変数のグループの例を示す。各行に対応する状態変数のグループに１－Ｈｏｔ制約を課す場合、各行の状態変数の和は１である。例えば、グループｇ１１に属する状態変数の和は１である。また、グループｇ１２に属する状態変数の和は１である。あるいは、各列に対応する状態変数のグループに１－Ｈｏｔ制約を課す場合、各列の状態変数の和は１である。例えば、グループｇ２１に属する状態変数の和は１である。グループｇ２２に属する状態変数の和は１である。

２Ｗ１Ｈでは、２つの１－Ｈｏｔ制約を満たすように、１度に４つの状態変数の値を変化させる。すなわち、式（７）のような４ビットフリップである。ｉ，ｊ，ｋ，ｌは、フリップさせる状態変数の組を示すインデックスの組である。なお、ｉ＜ｊ＜ｋ＜ｌである。図３では、インデックスｉ，ｊ，ｋ，ｌに対応する状態変数の組の例が示されている。２Ｗ１Ｈでは、状態変数の数がＮ^２であり、Ｎ行の各行およびＮ列の各列でそれぞれ状態変数が、１－Ｈｏｔ制約が課されたグループとしてグループ化される。このときのエネルギー変化ΔＥ_ｊは、式（８）で表される。状態変数ｘ_ｍに対応する局所場の変化Δｈ_ｍは、式（９）で表される。ｍ＝１，２，…，Ｎ^２である。

図４は、イジングモデルの状態と順列との対応関係の例を示す図である。
図４（Ａ）は、Ｎ＝５の場合のイジングモデルの状態６１の例を示す。図４（Ｂ）は、Ｎ＝５の場合のイジングモデルの状態６２を示す。状態６１，６２それぞれは、２５個の状態変数ｘ_１～ｘ_２５で表される。状態６１，６２それぞれで示される行列の１行目は、状態変数ｘ_１～ｘ_５のグループである。２行目は、状態変数ｘ_６～ｘ_１０のグループである。３行目は、状態変数ｘ_１１～ｘ_１５のグループである。４行目は、状態変数ｘ_１６～ｘ_２０のグループである。５行目は、状態変数ｘ_２１～ｘ_２５のグループである。なお、各状態変数は列方向にもグループ化される。

状態６１の例では、行方向の各グループの状態変数の値は次の通りである。｛ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５｝＝｛１，０，０，０，０｝である。｛ｘ_６，ｘ_７，ｘ_８，ｘ_９，ｘ_１０｝＝｛０，１，０，０，０｝である。｛ｘ_１１，ｘ_１２，ｘ_１３，ｘ_１４，ｘ_１５｝＝｛０，０，１，０，０｝である。｛ｘ_１６，ｘ_１７，ｘ_１８，ｘ_１９，ｘ_２０｝＝｛０，０，０，１，０｝である。｛ｘ_２１，ｘ_２２，ｘ_２３，ｘ_２４，ｘ_２５｝＝｛０，０，０，０，１｝である。この場合、状態６１は、順列（１，２，３，４，５）と表される。前述のように、例えば、順列の左からｐ番目の値ｑは、状態６１や状態６２などで示される行列の上からｐ行目かつ左からｑ列目の要素を１とすることを示す。

状態６２の例では、行方向の各グループの状態変数の値は次の通りである。｛ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５｝＝｛０，０，０，１，０｝である。｛ｘ_６，ｘ_７，ｘ_８，ｘ_９，ｘ_１０｝＝｛０，１，０，０，０｝である。｛ｘ_１１，ｘ_１２，ｘ_１３，ｘ_１４，ｘ_１５｝＝｛０，０，１，０，０｝である。｛ｘ_１６，ｘ_１７，ｘ_１８，ｘ_１９，ｘ_２０｝＝｛０，０，０，０，１｝である。｛ｘ_２１，ｘ_２２，ｘ_２３，ｘ_２４，ｘ_２５｝＝｛１，０，０，０，０｝である。この場合、状態６２は、順列（４，２，３，５，１）と表される。

図５は、情報処理装置の機能例を示す図である。
情報処理装置１００は、順列最適化問題の求解を行う。情報処理装置１００は、重み係数保持部１１０、局所場保持部１２０、ΔＥ計算部１３０、判定部１４０、状態保持部１５０、制御部１６０および巡回シナリオ記憶部１７０を有する。重み係数保持部１１０、局所場保持部１２０、ΔＥ計算部１３０、判定部１４０、状態保持部１５０、制御部１６０および巡回シナリオ記憶部１７０は、ＦＰＧＡ１０９により実現される。重み係数保持部１１０、局所場保持部１２０および巡回シナリオ記憶部１７０におけるデータの記憶領域には、メモリ１０９ａが用いられる。

重み係数保持部１１０は、式（１）における重み係数行列Ｗを保持する。重み係数保持部１１０は、判定部１４０から供給されるインデックスｊに基づいて、局所場保持部１２０に重み係数Ｗ_ｍｉ，Ｗ_ｍｊ，Ｗ_ｍｋ，Ｗ_ｍｌを供給する。

局所場保持部１２０は、局所場ｈ_１，ｈ_２，…，ｈ_ｎを保持し、２Ｗ１Ｈによる４つの状態変数ｘ_ｉ，ｘ_ｊ，ｘ_ｋ，ｘ_ｌの値の変化に応じて、重み係数保持部１１０に保持される重み係数Ｗに基づき、式（９）により局所場ｈ_１，ｈ_２，…，ｈ_ｎを更新する。ここで、ｎは、全状態変数の数であり、ｎ＝Ｎ^２である。

ΔＥ計算部１３０は、状態変数ｘ_ｉ，ｘ_ｊ，ｘ_ｋ，ｘ_ｌの値を変化させる場合のエネルギー変化ΔＥ_ｊを、式（８）により計算する。ΔＥ計算部１３０は、変化候補とする複数の状態変数に対して、複数のΔＥを並列に計算してもよい。

判定部１４０は、式（６）に基づいて、４つの状態変数ｘ_ｉ，ｘ_ｊ，ｘ_ｋ，ｘ_ｌの値の変化が許容されるか否かを判定する。判定部１４０は、許容される場合、状態保持部１５０に保持される４つの状態変数ｘ_ｉ，ｘ_ｊ，ｘ_ｋ，ｘ_ｌの値を変化させるとともに、インデックスｉ，ｊ，ｋ，ｌを重み係数保持部１１０に供給する。ΔＥ計算部１３０により複数のΔＥが並列に計算される場合、判定部１４０は、式（６）に基づいて、値の変化が許容される４つの状態変数の複数の組のうち、何れかを選択し、選択した組に属する４つの状態変数の値を変化させる。

状態保持部１５０は、状態変数（ｘ_１，ｘ_２，…，ｘ_ｎ）を保持する。状態保持部１５０は、初期状態のエネルギーに対して状態遷移に応じたΔＥを積算することで、現在の状態に対応するエネルギーを保持してもよい。

制御部１６０は、巡回シナリオ記憶部１７０に保持される巡回シナリオに応じて、局所場保持部１２０およびΔＥ計算部１３０における巡回遷移モードの動作を制御する。巡回遷移モードは、第１の実施の形態の巡回遷移処理を行うモードである。制御部１６０は、巡回遷移モードでは、状態変数（ｘ_１，ｘ_２，…，ｘ_ｎ）のうち、何れの４ビット、すなわち、４つの状態変数の値を変化させるかを指定し、局所場の読み出しと、ΔＥの計算を実行させる。また、制御部１６０は、局所場保持部１２０およびΔＥ計算部１３０を制御して、通常の２Ｗ１Ｈモードでの動作と、巡回遷移モードでの動作との切り替えも行う。

ここで、通常の２Ｗ１Ｈモードとは、例えば状態変数（ｘ_１，ｘ_２，…，ｘ_ｎ）の中から順番に１つをｘ_ｊとして選択して４つの状態変数ｘ_ｉ，ｘ_ｊ，ｘ_ｋ，ｘ_ｌの値を変化させるか否かの試行を行うモードである。通常の２Ｗ１Ｈモードは、第１の実施の形態における通常の探索処理を行うモードである。通常の２Ｗ１Ｈモードでは、複数のｘ_ｊに対して並列に、４つの状態変数ｘ_ｉ，ｘ_ｊ，ｘ_ｋ，ｘ_ｌの値を変化させるか否かの試行が行われてもよい。通常の２Ｗ１Ｈモードで変化される状態変数の数は１回の試行当たり、高々４つである。通常の２Ｗ１Ｈモードには、例えば、特開２０２１－１５７３６１号公報が参考になる。

巡回シナリオ記憶部１７０は、巡回シナリオの情報を記憶する。巡回シナリオ記憶部１７０に記憶される巡回シナリオの情報は、外部から書き換え可能である。
図６は、通常の２Ｗ１Ｈモードおよび巡回遷移モードの動作例を示す図である。

表２００は、情報処理装置１００による通常の２Ｗ１Ｈモードおよび巡回遷移モードの動作例を示す。一例として、Ｎ＝５とする。初期状態は、例えば順列（１，２，３，４，５）で示されるものとする。また、表２００における「置換候補」は、置換候補となる２つの要素それぞれの順列における位置を示す。

この場合、通常の２Ｗ１Ｈモードでは、順列（１，２，３，４，５）の次の状態遷移先候補の状態は、当該順列の２つの要素を置換した状態となる。順列（１，２，３，４，５）に対して、次の状態遷移先候補の数は１０個である。例えば、制御部１６０は、通常の２Ｗ１Ｈモードでのステップ「１」～「１０」により１０通りの状態遷移先候補の何れも式（６）により許容されない場合、局所解に陥ったと判断して、局所場保持部１２０およびΔＥ計算部１３０を巡回遷移モードに移行させる。このとき、巡回遷移モードの起点の状態は、局所解に相当する順列（１，２，３，４，５）の状態となる。

巡回遷移モードでは、例えば、次のような巡回シナリオが用いられる。すなわち、制御部１６０は、まずは順列（１，２，３，４，５）の最後尾の要素「５」を、先頭に向かって１つずつ動かすように、他の要素と置換させる。この場合、４ステップで、要素「５」は先頭に至り、順列（５，１，２，３，４）となる。すると、次に、制御部１６０は、順列（５，１，２，３，４）の最後尾の要素「４」を、先頭に向かって１つずつ動かすように、他の要素と置換させる。上記の動作を繰り返すことで、計２０ステップで、巡回遷移モードの起点の順列（１，２，３，４，５）に戻る。ここで、巡回遷移モードにおいて巡回シナリオにより順次行われる遷移は、仮遷移であると言える。

上記の巡回遷移モードの動作において、ΔＥ計算部１３０は、各ステップで、式（８）のΔＥを計算し、計算したΔＥを累積する。また、局所場保持部１２０は、各ステップにおける４つの状態変数の値の変化に応じて、局所場ｈ_１～ｈ_ｎを更新する。判定部１４０は、各ステップで状態保持部１５０における該当の４つの状態変数の値を更新するとともに、累積されたΔＥが式（６）の判定基準を満たすか否かを判定する。

例えば、ΔＥ計算部１３０は、スタート状態の次の仮遷移先＃１に対するΔＥ１を計算する。この遷移が受け入れられなかったとしても、状態および局所場は更新される。ΔＥ計算部１３０は、この局所場を用いて次の仮遷移先＃２に対するΔＥ１２を求め、ΔＥ１＋ΔＥ１２＝ΔＥ２として、累積のΔＥ＝ΔＥ２を計算する。ΔＥ２は、スタート状態から仮遷移先＃２の状態に遷移した場合のエネルギー差分になる。同様にして、ΔＥ１＋ΔＥ１２＋ΔＥ２３＝ΔＥ３として、仮遷移先＃３に対する累積のΔＥ＝ΔＥ３を求める。判定部１４０は、これらΔＥｉに対し、式（６）により示されるメトロポリスの判定基準を満たすか否かを判定する。

制御部１６０は、式（６）の判定基準が満たされた段階で、その時点における状態を起点として、巡回遷移モードから通常の２Ｗ１Ｈモードへ切り替える。または、制御部１６０は、異なる巡回シナリオで巡回遷移モードを継続する。巡回遷移モードを継続する場合、エネルギー差分の累積加算はリセットされ、その時点から再スタートになる。また、通常の２Ｗ１Ｈモードへ切り替える場合も、巡回遷移モードを継続する場合も、局所場は更新済なので、新たに更新しなくてよい。

一方、式（６）の判定基準が、巡回遷移モードにおける計２０ステップの全てで満たされない場合、状態保持部１５０に保持される状態変数ｘ_１～ｘ_ｎは、順列（１，２，３，４，５）の状態に戻る。また、局所場保持部１２０に保持される局所場ｈ_１～ｈ_ｎも、順列（１，２，３，４，５）の状態に対応する値に戻る。例えば、今回の巡回シナリオで、順列（１，２，３，４，５）で示される元の状態に戻った場合、制御部１６０は、他の巡回シナリオにより、巡回遷移モードを継続してもよい。

次に、情報処理装置１００によりＳＡ法を用いて順列最適化問題の求解を実行する処理手順を説明する。
図７は、情報処理装置の処理例を示すフローチャートである。

（Ｓ１０）制御部１６０は、式（６）に用いられる温度値Ｔを判定部１４０に設定する。なお、ステップＳ１０が初回に実行される場合、制御部１６０は、初期温度値を温度値Ｔに設定する。また、ステップＳ１０が２回目以降に実行される場合、制御部１６０は、温度値Ｔを前回よりも低い値とする。

（Ｓ１１）制御部１６０は、局所場保持部１２０およびΔＥ計算部１３０を通常の２Ｗ１Ｈモードで動作させて、解探索を行わせる。制御部１６０は、２Ｗ１Ｈモードでの動作中、ステップＳ１２，Ｓ１７を実行する。

（Ｓ１２）制御部１６０は、通常の２Ｗ１Ｈモードでの解探索で、局所解に陥ったか否かを判定する。局所解に陥った場合、ステップＳ１３に処理が進む。局所解に陥っていない場合、ステップＳ１１に処理が進む。例えば、制御部１６０は、判定部１４０により次の遷移先候補の状態が全て棄却された場合に、局所解に陥ったと判定する。次の遷移先候補の状態が全て棄却される場合とは、次の遷移先候補に対応するエネルギーの変化量が全て正であり、式（５）または式（６）の判定基準を満たさない場合である。

（Ｓ１３）制御部１６０は、局所場保持部１２０およびΔＥ計算部１３０を巡回遷移モードに移行させる。
（Ｓ１４）制御部１６０は、局所場保持部１２０およびΔＥ計算部１３０に巡回シナリオに沿った動作を実行させる。巡回遷移モードでは遷移が受け入れられない限りは、次の仮遷移におけるΔＥは、前回までの仮遷移におけるΔＥの累積加算分に足し合わせたものとして計算される。

（Ｓ１５）制御部１６０は、巡回遷移モードにおける累積のΔＥが減少したか否かを判定する。累積のΔＥが減少した場合、ステップＳ１６に処理が進む。累積のΔＥが減少していない場合、ステップＳ１４に処理を進める。ここで、累積のΔＥが減少した場合は、累積のΔＥが負になった場合でもよい。ΔＥ＜０の場合、式（６）の判定基準は満たされる。ただし、温度値や乱数値に応じて式（６）の判定基準により、累積のΔＥ＞０の状態遷移が許容されることもある。

（Ｓ１６）制御部１６０は、巡回遷移モードを終了し、局所場保持部１２０およびΔＥ計算部１３０を通常の２Ｗ１Ｈモードに移行させる。そして、ステップＳ１１に処理が進む。

（Ｓ１７）制御部１６０は、通常の２Ｗ１Ｈモードでの解探索において、規定回数だけ変化候補の変数ｘ_ｊを選択したか否かを判定する。規定回数だけ変化候補の変数ｘ_ｊを選択した場合、ステップＳ１８に処理が進む。規定回数だけ変化候補の変数ｘ_ｊを選択していない場合、ステップＳ１１に処理が進む。なお、前述のように、変化候補のｘ_ｊの選択に応じて、変化候補の４つの状態変数ｘ_ｉ，ｘ_ｊ，ｘ_ｋ，ｘ_ｌが特定される。

（Ｓ１８）制御部１６０は、規定回数だけ温度値Ｔを下げたか否かを判定する。規定回数だけ温度値Ｔを下げた場合、制御部１６０は、それまでで得られた最も低いエネルギーの解を出力し、処理を終了する。規定回数だけ温度値Ｔを下げていない場合、ステップＳ１０に処理が進む。

なお、ステップＳ１７，Ｓ１８は、ステップＳ１１の中で実行される処理であると考えてもよい。また、ステップＳ１１の実行中に、ステップＳ１２の判定が実行されることになる。

このように、情報処理装置１００は、通常の２Ｗ１Ｈモードを実行し、通常の２Ｗ１Ｈモードで局所解に陥った場合に、当該局所解を起点の状態として、巡回遷移モードを実行してもよい。この場合、情報処理装置１００は、巡回遷移モードにより起点の状態よりもエネルギーの低い状態を特定したら、特定した状態から、通常の２Ｗ１Ｈモードに復帰してもよい。これにより、情報処理装置１００は、通常の２Ｗ１Ｈモードにおける局所解から脱出して、より良い解を探索可能になり、求解性能を向上できる。

また、巡回遷移モードではなく、仮に、初期状態に返ってこないような遷移パターンを実施する場合、初期状態の局所場を記憶しておく必要がある。この場合、局所場のメモリ領域が２倍必要となる。

これに対し、巡回遷移モードでは、仮に全ての遷移先候補が受け入れられなくても、局所場は巡回遷移モードの開始時点の値に戻る。このため、初期状態の局所場を記憶しておかなくてもよい。よって、情報処理装置１００は、メモリ領域を効率的に使用して、求解性能を向上できる。

また、図７の手順では、ＳＡ法を実行する例を示したが、情報処理装置１００は、レプリカ交換法を実行してもよい。その場合、ステップＳ１０の温度値の設定は、レプリカ間での温度値の交換により行われ得る。また、ステップＳ１８の判定は、例えば規定回数だけ温度値の交換を行ったか否かにより判定され得る。

なお、巡回遷移モードでの巡回シナリオは、図６で示した例以外のものでもよい。次に、巡回遷移モードに用いられる他の巡回シナリオの例を説明する。
図８は、巡回遷移モードの他の例（その１）を示す図である。

巡回シナリオ７１は、順列（１，２，３，４，５）のうち、要素（４，５）を固定する例を示す。巡回シナリオ７１では、初期状態のステップ「１」から要素「３」が１つずつ前に移動するように他の要素と順次置換され、次いで、要素「２」も同様に他の要素と順次置換され、次いで、要素「１」も同様に他の要素と順次置換される。このようにすると、ステップ「７」で到達する順列は、元の順列（１，２，３，４，５）に一致する。

図９は、巡回遷移モードの他の例（その２）を示す図である。
巡回シナリオ７２は、順列（１，２，３，４，５）のうち、要素（３，５）を固定する例を示す。巡回シナリオ７２では、ステップ「１」から要素「４」が、要素「３」を飛ばして１つずつ前に移動するように他の要素と順次置換される。次いで、要素「２」も要素「３」を飛ばして同様に他の要素と順次置換され、次いで、要素「１」も要素「３」を飛ばして同様に他の要素と順次置換される。このようにすると、ステップ「７」で到達する順列は、元の順列（１，２，３，４，５）に一致する。

図１０は、巡回遷移モードの他の例（その３）を示す図である。
巡回シナリオ７３は、順列（１，２，３，４，５）のうち、要素（１，５）をステップ「１」～「４」で固定し、ステップ「５」で要素（１，５）を置換し、ステップ「６」～「９」で要素（１，５）を再度固定する例を示す。巡回シナリオ７３では、ステップ「１」から要素「２」が、１つずつ後ろに移動するように他の要素と順次置換される。ステップ「４」では、要素（３，４）が置換される。そして、ステップ「６」から要素「４」が、１つずつ後ろに移動するように他の要素と順次置換される。ステップ「９」では、要素（１，５）が置換される。このようにすると、ステップ「９」で到達する順列は、元の順列（１，２，３，４，５）に一致する。

このように、情報処理装置１００は、種々の巡回シナリオを使用することができる。情報処理装置１００は、上記のように、ある巡回シナリオによる巡回遷移モードでの探索を行った後に、他の巡回シナリオによる巡回遷移モードでの探索を継続してもよい。例えば、制御部１６０は、巡回シナリオ７１を用いてステップ「７」に達した後に、巡回シナリオ７２を用いてもよい。また、巡回シナリオ７１～７３で例示した順列内の各値は、ステップ「１」における順列内の左側から数えた各要素の位置を表してもよい。この場合、制御部１６０は、例えば巡回シナリオ７１によりステップ「１」からのエネルギー変化の累積がメトロポリス基準を満たす状態を特定したら、特定した状態を起点として、巡回シナリオ７２を用いて巡回遷移モードを継続してもよい。情報処理装置１００は、複数の巡回シナリオを組み合わせることで、より多様な状態を効率的に探索可能になる。

以上説明したように、情報処理装置１００は例えば、次の処理を実行する。
情報処理装置１００は、エネルギー関数に含まれる、イジングモデルの状態を示すＮの２乗個の状態変数を記憶する。情報処理装置１００は、Ｎの２乗個の状態変数をＮ行Ｎ列に配列したときの各行に含まれる状態変数の値の和が１であり、かつ各列に含まれる状態変数の値の和が１である制約を満たすように４つの状態変数の値を変化させる状態遷移の繰り返しにより、第１状態から複数の状態を経て第１状態に戻る巡回遷移処理を実行する。情報処理装置１００は、巡回遷移処理により順次得られる状態の中から、第１状態からの状態遷移ごとのエネルギー関数の値の変化量の累積が所定の判定基準を満たす第２状態を特定する。

これにより、情報処理装置１００は、多様な状態を効率的に探索できる。情報処理装置１００の上記機能は、例えばＦＰＧＡ１０９やＧＰＵなどにより実現される。情報処理装置１００の上記機能は、ＲＡＭ１０２に記憶されたプログラムがＣＰＵ１０１により実行されることで実現されてもよい。ＦＰＧＡ１０９、ＧＰＵおよびＣＰＵ１０１などの演算回路を含むコプロセッサまたはプロセッサは、第１の実施の形態の処理部１２の一例である。例えば、温度値と乱数値とを用いるメトロポリス法に基づく判定基準やギブス法に基づく判定基準は、所定の判定基準の一例である。

例えば、情報処理装置１００は、巡回遷移処理では状態遷移のたびに、第１状態からの状態遷移に応じたエネルギー関数の値の変化量を計算し、状態遷移ごとの変化量の累積が所定の判定基準を満たすか否か判定する。情報処理装置１００は、変化量の累積が所定の判定基準を満たさない場合に、次に値を変化させる４つの状態変数の組を選択し、変化量の累積が所定の判定基準を満たす場合に、今回の状態遷移後の状態を第２状態として取得する。

これにより、情報処理装置１００は、メトロポリス基準などの判定基準を用いて、第２状態を適切に取得できる。
また、情報処理装置１００は、状態遷移に応じたエネルギー関数の値の変化量の計算に用いられる、Ｎの２乗個の状態変数に対応するＮの２乗個の局所場を記憶する。情報処理装置１００は、巡回遷移処理の起点の第１状態に対応するＮの２乗個の局所場と巡回遷移処理の終点の第１状態に対応するＮの２乗個の局所場とを一致させる。

これにより、情報処理装置１００は、巡回遷移処理を行うに当たり、起点となる第１状態に対応する各局所場の複製を保持しておかなくて済み、メモリ容量を効率的に利用して、解探索を効率化できる。

また、情報処理装置１００は、巡回遷移処理において経由する複数の状態それぞれを互いに異なる状態とする。これにより、情報処理装置１００は、多様な状態を効率的に探索できる。

また、情報処理装置１００は、制約を満たすように４つの状態変数の値を変化させる場合のエネルギー関数の値の変化量が所定の判定基準を満たすか否かの判定に応じて４つの状態変数の値の更新を繰り返す通常の探索処理を行ってもよい。情報処理装置１００は、通常の探索処理において局所解に陥った場合に、当該局所解を第１状態として巡回遷移処理を実行してもよい。

こうして、情報処理装置１００は、通常の探索処理における解探索が滞った場合に、巡回遷移処理に切り替えることで、通常の探索処理で陥った局所解から脱出して、解探索を継続でき、求解性能を向上できる。

このとき、情報処理装置１００は、巡回遷移処理により第２状態を特定すると、第２状態から通常の探索処理を再開してもよい。これにより、情報処理装置１００は、巡回遷移処理を用いて、通常の探索処理で陥った局所解から脱出した上で、通常の探索処理を継続でき、求解性能を向上できる。

また、情報処理装置１００は、値を変化させる４つの状態変数の組の第１の選択順序を示す第１巡回シナリオを用いて巡回遷移処理を実行してもよい。情報処理装置１００は、第１巡回シナリオを用いた巡回遷移処理により第２状態が特定されずに第１状態に戻ると、第１の選択順序とは異なる第２の選択順序を示す第２巡回シナリオに切り替えて、巡回遷移処理を実行してもよい。これにより、情報処理装置１００は、より多様な状態を効率的に探索できる。

更に、情報処理装置１００は、第１巡回シナリオを用いた巡回遷移処理により第２状態を特定すると、第１の選択順序とは異なる第２の選択順序を示す第２巡回シナリオに切り替え、特定した第２状態を新たな第１状態として巡回遷移処理を実行してもよい。これにより、情報処理装置１００は、より多様な状態を効率的に探索できる。

情報処理装置１００の上記機能は、ＱＡＰ、ＴＳＰ、ＶＲＰおよびＬＯＰなどの順列最適化問題に適用することができる。
なお、第１の実施の形態の情報処理は、処理部１２にプログラムを実行させることで実現されてもよい。また、第２の実施の形態の情報処理は、ＣＰＵ１０１にプログラムを実行させることで実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体５３に記録できる。

例えば、プログラムを記録した記録媒体５３を配布することで、プログラムを流通させることができる。また、プログラムを他のコンピュータに格納しておき、ネットワーク経由でプログラムを配布してもよい。コンピュータは、例えば、記録媒体５３に記録されたプログラムまたは他のコンピュータから受信したプログラムを、ＲＡＭ１０２やＨＤＤ１０３などの記憶装置に格納し（インストールし）、当該記憶装置からプログラムを読み込んで実行してもよい。

１０情報処理装置
１１記憶部
１２処理部
２０，２１状態
３０，４０テーブル

Claims

イジングモデルのエネルギー関数で表される順列最適化問題の解を探索する情報処理装置において、
前記エネルギー関数に含まれる、前記イジングモデルの状態を示すＮ（Ｎは３以上の整数）の２乗個の状態変数を記憶する記憶部と、
前記Ｎの２乗個の状態変数をＮ行Ｎ列に配列したときの各行に含まれる状態変数の値の和が１であり、かつ各列に含まれる状態変数の値の和が１である制約を満たすように４つの状態変数の値を変化させる状態遷移の繰り返しにより、第１状態から複数の状態を経て前記第１状態に戻る巡回遷移処理を実行し、前記巡回遷移処理により順次得られる前記複数の状態の中から、前記第１状態からの前記状態遷移ごとの前記エネルギー関数の値の変化量の累積が所定の判定基準を満たす第２状態を特定する処理部と、
を有する情報処理装置。
前記処理部は、前記巡回遷移処理では前記状態遷移のたびに、
前記状態遷移に応じた前記エネルギー関数の値の前記変化量を計算し、
前記第１状態からの前記状態遷移ごとの前記変化量の累積が前記所定の判定基準を満たすか否か判定し、
前記変化量の累積が前記所定の判定基準を満たさない場合に、次に値を変化させる前記４つの状態変数の組を選択し、
前記変化量の累積が前記所定の判定基準を満たす場合に、今回の前記状態遷移後の状態を前記第２状態として特定する、
請求項１記載の情報処理装置。
前記記憶部は、前記状態遷移に応じた前記エネルギー関数の値の前記変化量の計算に用いられる、前記Ｎの２乗個の状態変数に対応するＮの２乗個の局所場を記憶し、
前記処理部は、前記巡回遷移処理の起点の前記第１状態に対応する前記Ｎの２乗個の局所場と前記巡回遷移処理の終点の前記第１状態に対応する前記Ｎの２乗個の局所場とを一致させる、
請求項２記載の情報処理装置。
前記処理部は、前記複数の状態それぞれを互いに異なる状態とする、
請求項１記載の情報処理装置。
前記処理部は、前記制約を満たすように前記４つの状態変数の値を変化させる場合の前記エネルギー関数の値の前記変化量が所定の判定基準を満たすか否かの判定に応じて前記４つの状態変数の値の更新を繰り返す探索処理を行い、前記探索処理において局所解に陥った場合に、前記局所解を前記第１状態として前記巡回遷移処理を実行する、
請求項１記載の情報処理装置。
前記処理部は、前記巡回遷移処理により、前記第２状態を特定すると、前記第２状態から前記探索処理を再開する、
請求項５記載の情報処理装置。
前記処理部は、
値を変化させる前記４つの状態変数の組の第１の選択順序を示す第１巡回シナリオを用いて前記巡回遷移処理を実行し、
前記第１巡回シナリオを用いた前記巡回遷移処理により前記第２状態が特定されずに前記第１状態に戻ると、前記第１の選択順序とは異なる第２の選択順序を示す第２巡回シナリオに切り替えて、前記巡回遷移処理を実行する、
請求項１または５記載の情報処理装置。
前記処理部は、
値を変化させる前記４つの状態変数の組の第１の選択順序を示す第１巡回シナリオを用いて前記巡回遷移処理を実行し、
前記第１巡回シナリオを用いた前記巡回遷移処理により前記第２状態を特定すると、前記第１の選択順序とは異なる第２の選択順序を示す第２巡回シナリオに切り替え、特定した前記第２状態を新たな前記第１状態として、前記巡回遷移処理を実行する、
請求項１または５記載の情報処理装置。
イジングモデルのエネルギー関数で表される順列最適化問題の解を探索する情報処理方法において、情報処理装置が、
前記エネルギー関数に含まれる、前記イジングモデルの状態を示すＮ（Ｎは３以上の整数）の２乗個の状態変数をＮ行Ｎ列に配列したときの各行に含まれる状態変数の値の和が１であり、かつ各列に含まれる状態変数の値の和が１である制約を満たすように４つの状態変数の値を変化させる状態遷移の繰り返しにより、第１状態から複数の状態を経て前記第１状態に戻る巡回遷移処理を実行し、
前記巡回遷移処理により順次得られる前記複数の状態の中から、前記第１状態からの前記状態遷移ごとの前記エネルギー関数の値の変化量の累積が所定の判定基準を満たす第２状態を特定する、
情報処理方法。
イジングモデルのエネルギー関数で表される順列最適化問題の解を探索するプログラムにおいて、コンピュータに、
前記エネルギー関数に含まれる、前記イジングモデルの状態を示すＮ（Ｎは３以上の整数）の２乗個の状態変数をＮ行Ｎ列に配列したときの各行に含まれる状態変数の値の和が１であり、かつ各列に含まれる状態変数の値の和が１である制約を満たすように４つの状態変数の値を変化させる状態遷移の繰り返しにより、第１状態から複数の状態を経て前記第１状態に戻る巡回遷移処理を実行し、
前記巡回遷移処理により順次得られる前記複数の状態の中から、前記第１状態からの前記状態遷移ごとの前記エネルギー関数の値の変化量の累積が所定の判定基準を満たす第２状態を特定する、
処理を実行させるプログラム。