JP2023079015A

JP2023079015A - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: JP2023079015A
Application number: JP2021192401A
Authority: JP
Inventors: 典弘覚幸; Norihiro Kakuko; マチューパリジ; Matthew Parisi
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2021-11-26
Filing date: 2021-11-26
Publication date: 2023-06-07
Also published as: US20230169386A1; CN116186343A; EP4187447A1

Abstract

【課題】パラメータ探索を効率化する。【解決手段】処理部１２は、イジングモデルのエネルギー関数に基づく問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および第１候補値を用いた場合の当該探索の結果に応じた第１候補値の評価を繰り返し行い、候補値範囲を第１範囲から第１範囲よりも狭い第２範囲に変更する。処理部１２は、第２範囲からの第２候補値の取得および第２候補値を用いた場合の当該探索の結果に応じた第２候補値の評価を繰り返し行う。処理部１２は、第１候補値を用いた評価により複数の第１候補値に対して算出された複数の評価値のうちの最良の評価値と最良の評価値よりも前の評価で得られた他の評価値との第１差分、および、エネルギー関数に応じた問題の性質を示す指標の少なくとも一方に基づいて、第１範囲から第２範囲に変更するタイミングと、第１範囲と第２範囲との第２差分とを決定する。【選択図】図１

Description

本発明は情報処理装置、情報処理方法およびプログラムに関する。

組合せ最適化問題の求解に情報処理装置が用いられることがある。情報処理装置は、組合せ最適化問題を、磁性体のスピンの振る舞いを表すモデルであるイジングモデルのエネルギー関数に変換し、エネルギー関数に含まれる状態変数の値の組合せのうち、エネルギー関数の値を最小化する組合せを探索する。エネルギー関数の値を最小化する状態変数の値の組合せは、状態変数の組により表される基底状態または最適解に相当する。

実用的な時間で組合せ最適化問題の近似解を得る手法には、マルコフ連鎖モンテカルロ（ＭＣＭＣ：Markov-Chain Monte Carlo）法に基づく、シミュレーテッドアニーリング（ＳＡ：Simulated Annealing）法やレプリカ交換法などがある。ＳＡ法やレプリカ交換法などによる解の探索では、温度値などを表すパラメータが用いられる。そこで、当該パラメータの値を決定する方法が考えられている。

例えば、イジングモデルのエネルギーの分解能と温度パラメータが最低値のときのイジングモデルの状態遷移の許容確率とから、温度パラメータの最低値を決定する最適化装置の提案がある。提案の最適化装置は、イジングモデルに含まれる状態変数の数や状態変数間の重みを示す重み係数から決定したエネルギーの変化分の最大値に基づき、温度パラメータが最高値のときの許容確率から温度パラメータの最高値も決定する。

なお、複数の評価項目を持つ組合せ最適化問題を、ＳＡ法を用いて解決する組合せ最適化方法の提案がある。提案の組合せ最適化方法では、各評価項目の重み係数を温度パラメータの変化とともに動的に変化させる。

また、所定の探索範囲をもつパラメータを用いて遺伝的アルゴリズムにより解を探索する解探索装置の提案もある。提案の解探索装置は、複数のパラメータを持った遺伝子データを記憶する。解探索装置は、入力されたパラメータの探索範囲の少なくとも一部分に対するパラメータ値の対数値が所定の分布になるようなパラメータ値を生成し、当該パラメータ値が設定されたパラメータを用いて遺伝的アルゴリズムにより解を探索する。

特開２０２０－４６７１８号公報特開平９－３４９５１号公報米国特許出願公開第２００６／００１００９１号明細書

ＳＡ法やレプリカ交換法などで用いられるパラメータの値は、情報処理装置の求解性能に影響する。そこで、情報処理装置は、ＳＡ法やレプリカ交換法などで用いられるパラメータの値を決定するために、本番の解の探索の前にパラメータ探索を行うことがある。

パラメータ探索では、情報処理装置は、所定範囲に属する値の中からパラメータの候補値を抽出し、抽出した候補値による解探索の試行の結果により当該候補値を評価する処理を当該所定範囲内の各候補値に対して繰り返し行う。情報処理装置は、各候補値のうち評価の結果が良い候補値を実際に使用するパラメータの値として採用する。

しかし、パラメータ探索では候補値の範囲が広いほど、評価対象の候補値の数が多くなり、パラメータの値の決定に時間がかかる。一方、候補値の範囲を狭めることで評価対象の候補値の数を絞り過ぎると、より良い候補値が当該範囲から外れ、パラメータの値を適切に決定できない可能性がある。

１つの側面では、本発明は、パラメータ探索を効率化する情報処理装置、情報処理方法およびプログラムを提供することを目的とする。

１つの態様では、情報処理装置が提供される。情報処理装置は、記憶部と処理部とを有する。記憶部は、問題に対応する、イジングモデルのエネルギー関数を示す情報を記憶する。処理部は、エネルギー関数に基づく問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および第１候補値をパラメータの値として用いた場合の探索の結果に応じた第１候補値の評価を複数回行い、候補値範囲を、第１範囲から、第１範囲よりも狭い第２範囲に変更し、第２範囲からの第２候補値の取得および第２候補値をパラメータの値として用いた場合の探索の結果に応じた第２候補値の評価を複数回行う処理部と、を有する。処理部は、第１候補値を用いた評価により複数の第１候補値に対して算出された複数の第１評価値のうちの最良の評価値と当該最良の評価値よりも前の評価によって得られた他の評価値との第１差分、および、エネルギー関数に応じた問題の性質を示す指標の少なくとも一方に基づいて、候補値範囲を第１範囲から第２範囲に変更するタイミングと、第１範囲と第２範囲との第２差分とを決定する。

また、１つの態様では、情報処理装置が提供される。情報処理装置は、記憶部と処理部とを有する。記憶部は、問題に対応する、イジングモデルのエネルギー関数を示す情報を記憶する。処理部は、エネルギー関数に基づく問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および第１候補値をパラメータの値として用いた場合の探索の結果に応じた第１候補値の評価を複数回行う第１処理と、候補値範囲を、第１範囲から、第１範囲よりも狭い第２範囲に変更する第２処理と、第２範囲からの第２候補値の取得および第２候補値をパラメータの値として用いた場合の探索の結果に応じた第２候補値の評価を複数回行う第３処理とを含む処理において、候補値範囲を、第１範囲から第２範囲に変更するタイミングと、第１範囲と第２範囲との差分とを、エネルギー関数に応じた問題の性質を示す指標に基づいて決定する。

また、１つの態様では、情報処理方法が提供される。また、１つの態様では、プログラムが提供される。

１つの側面では、パラメータ探索を効率化できる。

第１の実施の形態の情報処理装置を説明する図である。第２の実施の形態の情報処理装置のハードウェア例を示す図である。情報処理装置の機能例を示す図である。パラメータ評価テーブルの例を示す図である。パラメータの候補値の取得対象範囲の制御例を示す図である。情報処理装置の処理例を示すフローチャートである。情報処理装置の他の処理例を示すフローチャートである。パラメータの候補値の取得対象範囲の例を示す図である。

以下、本実施の形態について図面を参照して説明する。
［第１の実施の形態］
第１の実施の形態を説明する。

図１は、第１の実施の形態の情報処理装置を説明する図である。
情報処理装置１０は、組合せ最適化問題に対する解を、ＭＣＭＣ法を用いて探索し、探索した解を出力する。例えば、情報処理装置１０は、ＭＣＭＣ法を基にしたＳＡ法、パラレルテンパリング（ＰＴ：Parallel Tempering）法などを解の探索に用いる。ＰＴ法はレプリカ交換法とも言われる。情報処理装置１０は記憶部１１および処理部１２を有する。

記憶部１１は、ＲＡＭ（Random Access Memory）などの揮発性記憶装置でもよいし、フラッシュメモリなどの不揮発性記憶装置でもよい。記憶部１１は、レジスタなどの電子回路を含んでもよい。処理部１２は、ＣＰＵ（Central Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）、ＧＰＵ（Graphics Processing Unit）などの電子回路でもよい。処理部１２はプログラムを実行するプロセッサでもよい。「プロセッサ」は、複数のプロセッサの集合（マルチプロセッサ）を含み得る。

なお、以下の説明では、処理部１２が解の探索を行う例を示す。ただし、処理部１２以外とは異なるＦＰＧＡやＧＰＵなどで実現される探索部が、処理部１２の指示に応じて解の探索を行い、探索結果を処理部１２に応答してもよい。

組合せ最適化問題は、イジング型のエネルギー関数により定式化され、例えばエネルギー関数の値を最小化する問題に置き換えられる。エネルギー関数は、目的関数や評価関数などと言われてもよい。エネルギー関数は、複数の状態変数を含む。状態変数は、０または１の値を取るバイナリ変数である。状態変数はビットと言われてもよい。組合せ最適化問題の解は、複数の状態変数の値により表される。エネルギー関数の値を最小化する解は、イジングモデルの基底状態を表し、組合せ最適化問題の最適解に対応する。エネルギー関数の値は、エネルギーと表記される。

イジング型のエネルギー関数は、式（１）で表される。

状態ベクトルｘは、複数の状態変数を要素とし、イジングモデルの状態を表す。式（１）は、ＱＵＢＯ（Quadratic Unconstrained Binary Optimization）形式で定式化されたエネルギー関数である。なお、エネルギーを最大化する問題の場合には、エネルギー関数の符号を逆にすればよい。

式（１）の右辺第１項は、全状態変数から選択可能な２つの状態変数の全組合せについて、漏れと重複なく、２つの状態変数の値と重み係数との積を積算したものである。添え字ｉ，ｊは状態変数のインデックスである。ｘ_ｉは、ｉ番目の状態変数である。ｘ_ｊは、ｊ番目の状態変数である。Ｗ_ｉｊは、ｉ番目の状態変数とｊ番目の状態変数との間の重み、または、結合の強さを示す重み係数である。Ｗ_ｉｊ＝Ｗ_ｊｉであり、Ｗ_ｉｉ＝０である。

式（１）の右辺第２項は、全状態変数の各々のバイアスと状態変数の値との積の総和を求めたものである。ｂ_ｉは、ｉ番目の状態変数に対するバイアスを示している。エネルギー関数に含まれる重み係数やバイアスなどを含む問題情報は、記憶部１１に記憶される。状態変数ｘ_ｉの変化に伴うエネルギーの変化量ΔＥ_ｉは、式（２）で表される。

ΔＥ_ｉ＜０となる状態変数ｘ_ｉが変化すると、式（１）のエネルギーＥ（ｘ）が下がる。ただし、ΔＥ_ｉ＞０となる状態変数ｘ_ｉが変化するときに、Ｅ（ｘ）が下がるようにΔＥ_ｉが定義されてもよい。処理部１２は、複数の状態変数のうちの１つの状態変数の値が変化することによるエネルギー関数の値の変化量を、複数の状態変数の各々について計算し、エネルギー関数の値が小さくなる変化が優先される形で確率的に受け入れる。

このとき、最急降下法では、局所解に陥った場合に脱出できなくなる。そこで、処理部１２は、ある状態変数を変化させることによる、イジングモデルのある状態から次の状態への遷移確率の決定に、メトロポリス法やギブス法を用いる。すなわち、処理部１２は、エネルギー関数の値が大きくなる変化についても、エネルギー関数の値の変化量と熱ノイズ値との比較に応じて確率的に許容する。熱ノイズ値は、温度値や乱数に基づいて求められる。温度値が大きい程、熱ノイズ値の振幅が大きくなる。熱ノイズ値の振幅が大きい程、エネルギー関数の値の増加量が大きい状態遷移が許容されやすくなる。

例えば、ＳＡ法では、処理部１２は、最高温度値から最低温度値へと温度値Ｔを徐々に変化させることで熱ノイズ値の振幅を減少させ、イジングモデルの状態を、基底状態へと収束させる。また、レプリカ交換法では、処理部１２は、最高温度値から最低温度値までの複数の温度値を用いて独立してＭＣＭＣ法を実行し、各温度値で得られた状態に対して、所定タイミングで温度値を交換し、最終的に得られた最も良い解を組合せ最適化問題の解とする。

このように、ＳＡ法やレプリカ交換法では、最高温度値や最低温度値などのパラメータが用いられる。パラメータの値は、求解性能に影響する。例えば、パラメータの値が適切でないと、比較的良い解を得られるまでの時間が過大になったり、適切な解を取得できなかったりする。

そこで、処理部１２は、該当の問題に対して使用するパラメータを決定するパラメータ探索を行う。パラメータ探索では、処理部１２は、パラメータの候補値の取得対象の範囲である取得対象範囲から候補値を取得し、取得した候補値を用いた、一定時間の解の探索の結果に応じて、当該候補値を評価する。取得対象範囲は、候補値範囲と言われてもよい。例えば、候補値の取得および当該候補値に対する評価の結果、すなわち、評価値を得るまでが、１回分の評価に相当する。取得対象範囲からの候補値の取得方法には、例えばグリッドサーチのように総当たりで取得する方法や、ランダムサーチのようにランダムに取得する方法がある。パラメータ探索での一定時間の解の探索には、実際に使用するＳＡ法やレプリカ交換法などの手法が用いられる。

候補値の評価では、処理部１２は、例えば、一定時間の解の探索において到達した最小エネルギーや当該最小エネルギーに到達するまでの時間を評価し、候補値に対する評価値を算出する。処理部１２は、到達した最小エネルギーが小さいほど、候補値の評価値を良い評価値とする。また、処理部１２は、最小エネルギーに到達するまでの時間が短いほど、候補値の評価値を良い評価値とする。処理部１２は、各候補値に対して評価値を算出し、評価を行った候補値の中で最良の評価値に対応する候補値を該当のパラメータの値として採用し、本番の解の探索に用いる。

なお、前述のように、解の探索は処理部１２により行われてもよいし、処理部１２以外の探索部により行われてもよい。また、パラメータ探索の対象となるパラメータの数は、複数でもよい。処理部１２は、複数のパラメータの候補値の組に対する評価を行ってもよい。この場合、複数のパラメータそれぞれに対して取得対象範囲が定められる。また、パラメータには、最高温度値および最低温度値の他にも、ＳＡ法における温度値の下げ幅などが含まれてもよい。

パラメータ探索において、処理部１２は、パラメータの候補値に対する取得対象範囲を、あるタイミングで狭める処理を行う。処理部１２は、当該タイミングまでに得られた評価値のうちの最良の評価値に対応する候補値を、取得対象範囲の新たな中心値とし、当該取得対象範囲の幅αを、直前の幅α＝α０よりも狭め、α＝α０－Δαとする。Δαは正の実数である。このとき、処理部１２は、取得対象範囲を狭めるタイミングと、取得対象範囲を狭める量Δαとを、次の第１～第３の方法の何れかにより決定する。

第１の方法では、処理部１２は、現在の取得対象範囲を用いた所定期間の評価により各候補値に対して算出された評価値のうちの最良の評価値と最良の評価値よりも前に得られた他の評価値との差に基づいて、当該タイミングと狭める量Δαとを決定する。この場合、当該タイミングは、上記所定期間が完了した時点からの時間τ１により定められる。時間τ１は、当該時点からのパラメータ評価の回数によって定められてもよい。

例えば、処理部１２は、上記所定期間においてＮ回のパラメータ評価を行いＮ個の評価値を得ている場合に、Ｎ個の評価値のうちの最良の評価値Ｖ１を得る。また、処理部１２は、当該最良の評価値を得た回よりも所定回数ｋだけ前の回の評価で得られた評価値Ｖ２を得る。所定回数ｋは、ユーザにより情報処理装置１０に予め入力される。

Ｖ１－Ｖ２が大きいほど、評価値の収束が進んでいないと推定される。このため、Ｖ１－Ｖ２が大きいほど、現在の取得対象範囲内で比較的良い候補値を得られるまでに比較的長い時間がかかると推定される。よって、処理部１２は、Ｖ１－Ｖ２が大きいほど、取得対象範囲を狭めるタイミングを遅くする。当該タイミングを遅くすることは時間τ１を大きくすることに相当する。また、Ｖ１－Ｖ２が大きいほど、評価値の収束が進んでいないことから、次回の取得対象範囲の絞り込みでは、より広い範囲の候補値を評価した方が良い候補値を発見できる可能性が高いと推定される。よって、処理部１２は、Ｖ１－Ｖ２が大きいほど、取得対象範囲を狭める量Δαを小さくする。ここで、Ｖ１－Ｖ２は第１差分に相当する。Δαは第２差分に相当する。

一方、Ｖ１－Ｖ２が小さいほど、評価値の収束が進んでいると推定される。このため、Ｖ１－Ｖ２が小さいほど、現在の取得対象範囲内でより良い候補値を得られるまでに比較的短い時間で済むと推定される。よって、処理部１２は、Ｖ１－Ｖ２が小さいほど、取得対象範囲を狭めるタイミングを早くする。当該タイミングを早くすることは時間τ１を小さくすることに相当する。また、Ｖ１－Ｖ２が小さいほど、評価値の収束が進んでいることから、次回の取得対象範囲の絞り込みでは、より狭い範囲の候補値を評価対象としても良い候補値を発見できる可能性が高いと推定される。よって、処理部１２は、Ｖ１－Ｖ２が小さいほど、取得対象範囲を狭める量Δαを大きくする。

第２の方法では、第１の方法に代えて、処理部１２は、エネルギー関数に応じた問題の性質を示す指標に基づいて、取得対象範囲を狭めるタイミングと、取得対象範囲を狭める量Δαとを決定する。第２の方法では、処理部１２は、エネルギー関数の情報が情報処理装置１０に入力された段階で、当該エネルギー関数の情報に基づいて、取得対象範囲を狭めるタイミングや狭める量Δαを決定できる。この場合、当該タイミングは、ある取得対象範囲でのパラメータ探索を開始した時点からの時間τ２により定められてもよい。時間τ２は、当該時点からのパラメータ評価の回数によって定められてもよい。

問題の性質を示す指標は、問題の難易度を示す。例えば、当該指標は、エネルギー関数に含まれる状態変数の数、制約の種類および制約の数の少なくとも何れかに対応する指標でもよい。ここで、式（１）のエネルギー関数Ｅには制約項Ｃが含まれ得る。制約項Ｃの種類には、１ｗ１ｈ（１ｗａｙ１ｈｏｔ）制約や２ｗ１ｈ（２ｗａｙ１ｈｏｔ）制約などがある。１ｗ１ｈ制約が用いられる場合、例えば式（３）のＣ＝Ｃ１が式（１）に加えられる。

ここで、ｔ＝０，１，…，Ｔ－１である。Ｔは１ｗ１ｈ制約を示す制約の数に相当する。ｃ_ｔは定数であり、正の実数である。Ｃ１は、状態変数のグループＫ_ｔの中で、１つの状態変数だけが１であり、それ以外の状態変数が０となるときに小さい値となる。グループＫ_ｔは、例えば、Ｋ_ｔ＝｛ｘ_０，ｘ_１，ｘ_２｝、｛ｘ_４，ｘ_５，…，ｘ_１０｝、｛ｘ_１１，ｘ_１５，…，ｘ_２０｝などのように定められる。

２ｗ１ｈ制約が用いられる場合、例えば、ｘ_ｊｋ＝ｘ_{ｊ＊Ｌ＋ｋ}とすると、式（４）のＣ＝Ｃ２が式（１）に加えられる。ただし、ｊ＝０，１，…，Ｌ－１であり、ｋ＝０，１，…，Ｌ－１である。

Ｌは２ｗ１ｈ制約を示す制約の数に相当する。ｃ_ｊは定数であり、正の実数である。Ｃ２は、複数の状態変数をＬ行Ｌ列と捉えて、各行の状態変数のうち１つの状態変数だけが１となり、かつ、各列の状態変数のうちの１つの状態変数だけが１となるときに小さい値となる。

エネルギー関数における状態変数の数が多いほど、問題の難易度は高い。制約の数が多いほど、問題の難易度は高い。また、より厳しい種類の制約の数が多いほど、問題の難易度は高い。例えば、２ｗ１ｈ制約は、１ｗ１ｈ制約よりも厳しい制約の種類である。

処理部１２は、問題の難易度が高いほど、取得対象範囲を狭めるタイミングを遅くし、狭める量Δαを小さくする。一方、処理部１２は、問題の難易度が低いほど、取得対象範囲を狭めるタイミングを早くし、狭める量Δαを大きくする。問題の難易度が高いほど、パラメータの適切な値の決定が難しくなり、より良い候補値を得るには、より多くの候補値の評価を要するためである。なお、当該タイミングを遅くすることは時間τ２を大きくすることに相当し、当該タイミングを早くすることは時間τ２を小さくすることに相当する。

第３の方法では、処理部１２は、第１の方法および第２の方法の両方を用いて、取得対象範囲を狭めるタイミングと、取得対象範囲を狭める量Δαとを決定する。この場合、当該タイミングは、第１の方法における所定期間が完了した時点からの時間τ１により定められる。

処理部１２は、Ｖ１－Ｖ２が大きいほど、取得対象範囲を狭めるタイミングを遅くし、狭める量Δαを小さくする。また、処理部１２は、問題の難易度が高いほど、取得対象範囲を狭めるタイミングを遅くし、狭める量Δαを小さくする。当該タイミングを遅くすることは時間τ１を大きくすることに相当する。

一方、処理部１２は、Ｖ１－Ｖ２が小さいほど、取得対象範囲を狭めるタイミングを早くし、狭める量Δαを大きくする。また、問題の難易度が低いほど、取得対象範囲を狭めるタイミングを早くし、狭める量Δαを大きくする。当該タイミングを早くすることは時間τ１を小さくすることに相当する。

ここで、グラフ２０，２１は、パラメータの候補値、すなわち、パラメータ値と、評価値との関係の例を示す。グラフ２０，２１の横軸はパラメータ値である。グラフ２０，２１の縦軸は評価値である。例えば、評価値が大きいほど、該当の候補値の評価が高い。

グラフ２０は、パラメータ値に対する変更前の取得対象範囲を示す。変更前の取得対象範囲の中心値はＰ１であり、取得対象範囲の幅はα＝α０である。当該変更前の取得対象範囲は、例えば、ユーザにより情報処理装置１０に予め指定される。

グラフ２１は、パラメータ値に対する変更後の取得対象範囲を示す。変更後の取得対象範囲の中心値はＰ２であり、取得対象範囲の幅はα＝α０－Δαである。処理部１２は、上記のように取得対象範囲を狭めるタイミングと狭める量Δαとを決定することで、変更後の取得対象範囲を適切に決定できる。例えば、変更後の取得対象範囲により良い候補値が含まれる可能性を高められる。また、例えば、パラメータ探索に要する時間を短縮できる。

処理部１２は、取得対象範囲を変更した後は、変更後の取得対象範囲から抽出される各候補値の評価値の更新が一定回数ない場合に、パラメータ探索を終了する。ただし、処理部１２は、取得対象範囲を変更した後に、上記の第１～第３の方法により決定されるタイミングや狭める量Δαを用いて、取得対象範囲を更に変更してもよい。すなわち、処理部１２は、取得対象範囲の変更を複数回行うことで、パラメータの値の取得対象範囲を段階的に絞り込んでもよい。

そして、処理部１２は、各候補値に対して得られた評価値のうち、最良の評価値に対応する候補値を解の探索に使用するパラメータの値として決定する。処理部１２は、当該パラメータの値を用いて、解の探索を実行してもよいし、前述の探索部に、決定したパラメータの値を入力して解の探索を実行させてもよい。

以上説明したように、情報処理装置１０によれば、エネルギー関数に基づく問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および第１候補値をパラメータの値として用いた場合の探索の結果に応じた第１候補値の評価が複数回行われる。候補値範囲が、第１範囲から、第１範囲よりも狭い第２範囲に変更される。第２範囲からの第２候補値の取得および第２候補値をパラメータの値として用いた場合の探索の結果に応じた第２候補値の評価が複数回行われる。第２範囲への変更の前に、候補値範囲を第１範囲から第２範囲に変更するタイミングと、第１範囲と第２範囲との第２差分（＝Δα）とが第１の情報および第２の情報の少なくとも一方に基づいて決定される。第１の情報は、第１候補値を用いた評価により複数の第１候補値に対して算出された複数の第１評価値のうちの最良の評価値と当該最良の評価値よりも前の評価によって得られた他の評価値との第１差分である。第２の情報は、エネルギー関数に応じた問題の性質を示す指標である。

これにより、情報処理装置１０は、パラメータ探索を効率化できる。具体的には、情報処理装置１０は、決定したタイミングと第２差分Δαとを用いて、第１範囲を第２範囲に変更することで、第２範囲を適切に決定できる。例えば、情報処理装置１０は、第２範囲により良い候補値が含まれる可能性を高めることができる。また、例えば、情報処理装置１０は、パラメータ探索に要する時間を短縮できる。

更に、情報処理装置１０は、パラメータの値をより良い値に決定する可能性を高められる。このため、情報処理装置１０は、決定したパラメータの値を用いて解の探索を行うことで、求解性能を高めることができる。例えば、情報処理装置１０は、比較的良い解を短時間で得られる可能性を高めることができる。

［第２の実施の形態］
次に、第２の実施の形態を説明する。
図２は、第２の実施の形態の情報処理装置のハードウェア例を示す図である。

情報処理装置１００は、組合せ最適化問題に対する解を、ＭＣＭＣ法を用いて探索し、探索した解を出力する。組合せ最適化問題は、式（１）のイジング型のエネルギー関数によって表される。情報処理装置１００は、本番の解探索を行う前に、パラメータ探索を行い、当該解探索に用いるパラメータの値を決定する。

情報処理装置１００は、ＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ（Hard Disk Drive）１０３、ＧＰＵ１０４、入力インタフェース１０５、媒体リーダ１０６、ＮＩＣ（Network Interface Card）１０７およびアクセラレータカード１０８を有する。

ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。なお、ＣＰＵ１０１は複数のプロセッサコアを含んでもよい。また、情報処理装置１００は複数のプロセッサを有してもよい。以下で説明する処理は複数のプロセッサまたはプロセッサコアを用いて並列に実行されてもよい。また、複数のプロセッサの集合を「マルチプロセッサ」または単に「プロセッサ」と言うことがある。

ＲＡＭ１０２は、ＣＰＵ１０１が実行するプログラムやＣＰＵ１０１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、情報処理装置１００は、ＲＡＭ以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ１０３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラムおよびデータを記憶する不揮発性の記憶装置である。なお、情報処理装置１００は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

ＧＰＵ１０４は、ＣＰＵ１０１からの命令に従って、情報処理装置１００に接続されたディスプレイ３１に画像を出力する。ディスプレイ３１としては、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイなど、任意の種類のディスプレイを用いることができる。

入力インタフェース１０５は、情報処理装置１００に接続された入力デバイス３２から入力信号を取得し、ＣＰＵ１０１に出力する。入力デバイス３２としては、マウス、タッチパネル、タッチパッド、トラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、情報処理装置１００に、複数の種類の入力デバイスが接続されていてもよい。

媒体リーダ１０６は、記録媒体３３に記録されたプログラムやデータを読み取る読み取り装置である。記録媒体３３として、例えば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）が含まれる。

媒体リーダ１０６は、例えば、記録媒体３３から読み取ったプログラムやデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、例えば、ＣＰＵ１０１によって実行される。なお、記録媒体３３は可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体３３やＨＤＤ１０３を、コンピュータ読み取り可能な記録媒体と言うことがある。

ＮＩＣ１０７は、ネットワーク３４に接続され、ネットワーク３４を介して他のコンピュータと通信を行うインタフェースである。ＮＩＣ１０７は、例えば、スイッチやルータなどの通信装置とケーブルで接続される。ＮＩＣ１０７は、無線通信インタフェースでもよい。

アクセラレータカード１０８は、式（１）のイジング型のエネルギー関数で表される問題、すなわち、イジング問題の解を、ＭＣＭＣ法を用いて探索するハードウェアアクセラレータである。アクセラレータカード１０８は、一定温度のＭＣＭＣ法または複数温度間でイジングモデルの状態を交換するレプリカ交換法を行うことで、該当温度におけるボルツマン分布に従う状態をサンプリングするサンプラーとして用いることができる。アクセラレータカード１０８は、イジング問題の求解のためには、レプリカ交換法や温度値を徐々に下げるＳＡ法などのアニーリングの処理を実行する。

ＳＡ法は、各温度値におけるボルツマン分布に従う状態をサンプリングし、サンプリングに用いる温度値を最高温度値から最低温度値に徐々に下げることで、最適解を効率的に発見する手法である。例えば、ＳＡ法を用いる場合、アクセラレータカード１０８は、一定の温度値での状態遷移の試行を一定回数繰り返した後に温度値を下げる、という動作を繰り返す。

レプリカ交換法は、複数の温度値を用いて独立してＭＣＭＣ法を実行し、各温度値で得られた状態に対して、適宜、温度値を交換する手法である。低温でのＭＣＭＣによって状態空間の狭い範囲を探索し、高温でのＭＣＭＣによって状態空間の広い範囲を探索することで、効率的に良い解を発見することができる。例えば、レプリカ交換法を用いる場合、アクセラレータカード１０８は、複数の温度値の各々での状態遷移の試行を並列して行い、一定回数の試行を行うごとに、各温度値で得られた状態に対して、所定の交換確率で温度値を交換する、という動作を繰り返す。

アクセラレータカード１０８は、ＦＰＧＡ１０８ａおよびＲＡＭ１０８ｂを有する。ＦＰＧＡ１０８ａは、アクセラレータカード１０８における探索機能を実現する。当該探索機能は、ＧＰＵやＡＳＩＣなどの他の種類の電子回路により実現されてもよい。ＲＡＭ１０８ｂは、ＦＰＧＡ１０８ａでの探索に用いられる問題情報などのデータやＦＰＧＡ１０８ａにより探索された解を保持する。また、ＦＰＧＡ１０８ａは、内蔵のメモリを有する。ＦＰＧＡ１０８ａは、探索処理に応じて、ＦＰＧＡ１０８ａの内蔵のメモリに格納されたデータをＲＡＭ１０８ｂに書き出すことができる。

アクセラレータカード１０８のようにイジング形式の問題の解を探索するハードウェアアクセラレータは、イジングマシンやボルツマンマシンなどと呼ばれることがある。
以下の説明では、情報処理装置１００は、パラメータ探索により、一例として最高温度値と最低温度値との組を決定するものとする。

図３は、情報処理装置の機能例を示す図である。
情報処理装置１００は、問題情報記憶部１１０、問題入力部１２０、パラメータ評価部１３０、評価結果記憶部１４０、パラメータ取得範囲変更制御部１５０、パラメータ取得範囲変更部１６０、パラメータ取得部１７０、パラメータ探索終了判定部１８０、解探索部１９０および解出力部１９５を有する。

問題情報記憶部１１０や評価結果記憶部１４０には、ＲＡＭ１０２やＨＤＤ１０３の記憶領域が用いられる。問題入力部１２０、パラメータ評価部１３０、パラメータ取得範囲変更制御部１５０、パラメータ取得範囲変更部１６０、パラメータ取得部１７０、パラメータ探索終了判定部１８０および解出力部１９５は、ＲＡＭ１０２に記憶されたプログラムをＣＰＵ１０１が実行することで実現される。解探索部１９０は、アクセラレータカード１０８により実現される。

問題情報記憶部１１０は、イジング問題を示す問題情報を記憶する。問題情報は、エネルギー関数を示す情報を含む。例えば、問題情報は、エネルギー関数に含まれる重み係数やバイアスを含む。問題情報は、エネルギー関数に含まれるビットの数や制約の種類や制約の数を示す情報を含む。問題情報は、イジングモデルの初期状態、初期エネルギーおよびＳＡ法における温度値の下げ幅などを含んでもよい。問題情報は、レプリカ交換法における隣接する温度値の差を含んでもよい。問題情報は、ユーザにより情報処理装置１００に入力され、問題情報記憶部１１０に格納される。

問題入力部１２０は、問題情報記憶部１１０に記憶される問題情報をパラメータ評価部１３０および解探索部１９０に入力する。問題入力部１２０は、エネルギー関数に含まれるビット数、制約の種類および制約の数を示す情報を、パラメータ取得範囲変更制御部１５０に入力する。ここで、問題入力部１２０は、問題情報記憶部１１０に記憶された問題情報に基づいて、式（１）のエネルギー関数に含まれるビット数や、エネルギー関数に含まれる式（３）や式（４）に基づく制約の種類や制約の数を取得する。

パラメータ評価部１３０は、パラメータ取得部１７０からパラメータの候補値を取得する。パラメータの候補値は、一定の取得対象範囲に属する値の中から抽出される。前述のように、本例では、パラメータは、最高温度値および最低温度値である。最高温度値および最低温度値それぞれに対して、取得対象範囲が定められる。このため、下記の説明の「候補値」は、候補値の組または候補値セットと言われてもよい。

パラメータ評価部１３０は、当該候補値をパラメータ探索終了判定部１８０に出力し、解探索部１９０による一定時間の解探索を実行させる。パラメータ評価部１３０は、解探索部１９０による一定時間の解探索の結果に応じて、当該候補値を評価する。パラメータ評価部１３０は、解探索部１９０によるＳＡ法などの解探索を一定時間実行して得られるエネルギーが低く、当該エネルギーに到達した時間が短いほど、該当の候補値を高く評価する。パラメータ評価部１３０は、候補値に対して評価結果を示す評価値を算出する。

例えば、パラメータ評価部１３０は、次の評価式を用いて、該当の候補値に対する評価値を計算する。一例として、評価値が大きいほど、評価が高いことを示すものとする。
例えば、パラメータ評価部１３０は、評価値＝Ｅ＊ｐ＋ｔ＊ｑとする。ここで、Ｅは、パラメータの値を該当の候補値として解探索を行った場合に到達した解の最小エネルギーである。ｔは、当該最小エネルギーの解に到達するまでに要した時間である。ｐ，ｑは、評価値に対するエネルギーおよび時間それぞれの重みを示す係数である。ｐ，ｑは何れも０以下の実数である。

あるいは、パラメータ評価部１３０は、評価値＝１／（Ｅ＊ｐ＋ｔ＊ｑ）としてもよい。この場合、ｐ，ｑは何れも０以上の実数である。なお、ｐ＋ｑ＞０である。すなわち、ｐ＝０かつｑ＝０の場合はない。

パラメータ評価部１３０は、評価した候補値と評価値とを評価結果記憶部１４０に格納する。パラメータ評価部１３０は、パラメータ取得範囲変更制御部１５０およびパラメータ探索終了判定部１８０に評価値を出力する。パラメータ評価部１３０は、現在の最良の評価値に対応する候補値を、パラメータ取得範囲変更部１６０に出力する。

評価結果記憶部１４０は、パラメータ評価部１３０による評価結果を記憶する。評価結果は、候補値と評価値とを含む。
パラメータ取得範囲変更制御部１５０は、イジング問題の性質を示す指標、および、各候補値の評価値に基づいて、パラメータの候補値の取得対象範囲を狭めるタイミングと取得対象範囲を狭める量とを決定する。イジング問題の性質を示す指標は、イジング問題の難易度を示し、例えば、イジング問題のビット数、制約の種類および制約の数に対応する指標である。パラメータ取得範囲変更制御部１５０は、取得対象範囲を狭めるタイミングと取得対象範囲を狭める量とをパラメータ取得範囲変更部１６０に出力する。

パラメータ取得範囲変更部１６０は、現在の最良の評価値に対応する候補値と、入力された、取得対象範囲を狭めるタイミングと取得対象範囲を狭める量とに基づいて、候補値の取得対象範囲の変更をパラメータ取得部１７０に指示する。

パラメータ取得部１７０は、パラメータの候補値の現在の取得対象範囲から、次に評価対象とする候補値を取得し、パラメータ評価部１３０に出力する。パラメータ取得部１７０は、例えばグリッドサーチのように総当たりで候補値を取得してもよいし、ランダムサーチのようにランダムに候補値を取得してもよい。パラメータ探索の開始当初の取得対象範囲は、ユーザにより予め指定される。

パラメータ取得部１７０は、パラメータ取得範囲変更部１６０の指示に応じて、パラメータの候補値の取得対象範囲を変更する。変更後の取得対象範囲は、直前の取得対象範囲よりも狭い範囲である。また、変更後の取得対象範囲の中心値は、直前の取得対象範囲における最良の評価値に対応する候補値である。パラメータが複数の場合、パラメータ取得部１７０は、各パラメータに対して、候補値の取得対象範囲を変更する。

パラメータ探索終了判定部１８０は、パラメータ探索の終了を判定する。具体的には、パラメータ探索終了判定部１８０は、パラメータ評価部１３０より入力されるパラメータの候補値を用いた一定時間の解探索を解探索部１９０に実行させる。また、パラメータ探索終了判定部１８０は、各候補値に対する評価値が一定回数変化しない場合に、解探索部１９０を用いたパラメータ探索を終了する。すると、パラメータ探索終了判定部１８０は、パラメータ探索で得られた最良の評価値に対応するパラメータの値をパラメータ評価部１３０から取得し、当該パラメータの値を解探索部１９０に入力して、本番の解探索を実行させる。

解探索部１９０は、パラメータ探索終了判定部１８０より入力されるパラメータの候補値を用いて、ＳＡ法による解探索を行う。解探索部１９０は、パラメータ探索における解探索の結果を、パラメータ評価部１３０に出力する。ただし、図３では、パラメータ評価部１３０と解探索部１９０との関連線は省略されている。解探索の結果は、解探索により得られたエネルギーを含む。また、解探索部１９０は、パラメータ探索により決定されたパラメータの値を用いて本番の解探索を実行し、当該解探索により最終的に得られた解を解出力部１９５に出力する。本番の解探索は、候補値の評価用の解探索よりも長い時間が用いられる。

解出力部１９５は、解探索部１９０により得られたイジング問題の解を出力する。例えば、解出力部１９５は、ディスプレイ３１に解を示す情報を表示させる。解出力部１９５は、ネットワーク３４を介して他の情報処理装置に解を示す情報を送信してもよい。

図４は、パラメータ評価テーブルの例を示す図である。
パラメータ評価テーブル１４１は、評価結果記憶部１４０に格納される。パラメータ評価テーブル１４１は、パラメータの候補値に対してパラメータ評価部１３０により求められた評価値を保持する。パラメータ評価テーブル１４１は、項番、最高温度値、最低温度値および評価値の項目を含む。

項番の項目には、レコードを識別する番号が登録される。項番は、該当のパラメータに対する評価、すなわち、パラメータ評価が何回目に行われたかを示す。パラメータ評価テーブル１４１の１つのレコードが１回分のパラメータ評価の結果に相当する。最高温度値の項目には、パラメータの１つである最高温度値の候補値が登録される。最低温度値の項目には、パラメータの１つである最低温度値の候補値が登録される。評価値の項目には、最高温度値の候補値と最低温度値の候補値との組に対する評価値が登録される。

例えば、パラメータ評価テーブル１４１は、項番「１」、最高温度値「Ｔｍａｘ１」、最低温度値「Ｔｍｉｎ１」、評価値「Ｖ１１」のレコードを有する。当該レコードは、パラメータ探索における１回目の評価では、（最高温度値，最低温度値）の候補値の組（Ｔｍａｘ１，Ｔｍｉｎ１）が評価され、評価値が「Ｖ１１」であることを示す。

パラメータ評価テーブル１４１には、他のパラメータセットに対する評価値のレコードも登録される。
図５は、パラメータの候補値の取得対象範囲の制御例を示す図である。

パラメータ取得範囲変更制御部１５０は、パラメータ評価テーブル１４１に基づいて、パラメータの候補値の取得対象範囲を狭めるタイミングと取得対象範囲を狭める量とを決定する。具体的には、パラメータ取得範囲変更制御部１５０は、一定の取得対象範囲に対するＮ回の評価で得られた最高の評価値Ｖ_ｎを得る。パラメータ取得範囲変更制御部１５０は、当該最高の評価値を得られた回ｎからｋ回前に得られた評価値Ｖ_ｎ－ｋを得る。ｋは１以上の整数である。Ｖ_ｎ，Ｖ_ｎ－ｋは同一の取得対象範囲から取得された各候補値に対する評価値である。そして、パラメータ取得範囲変更制御部１５０は、Ｖ_ｎ－Ｖ_ｎ－ｋに基づいて、取得対象範囲を狭めるタイミングと取得対象範囲を狭める量とを決定する。なお、Ｎやｋの値は、ユーザにより情報処理装置１００に予め入力される。

グラフ４１，４２それぞれは、Ｎ回の評価で得られた最高の評価値Ｖ_ｎが、Ｖ_ｎ＝Ｖ_Ｎである場合を例示する。グラフ４１，４２の横軸は、何れも評価回数を示す。グラフ４１，４２の縦軸は、何れも評価値を示す。

グラフ４１は、差Ｖ_ｎ－Ｖ_ｎ－ｋ＝Ｖ_Ｎ－Ｖ_Ｎ－ｋが比較的小さい場合を示す。差Ｖ_ｎ－Ｖ_ｎ－ｋ＝Ｖ_Ｎ－Ｖ_Ｎ－ｋが小さい程、パラメータの候補値に対する評価値の収束が進んでいると推定される。当該差が小さいほど、パラメータ取得範囲変更制御部１５０は、取得対象範囲を狭めるタイミングを早くし、取得対象範囲を狭める量を多くする。

グラフ４２は、差Ｖ_ｎ－Ｖ_ｎ－ｋ＝Ｖ_Ｎ－Ｖ_Ｎ－ｋが比較的大きい場合を示す。差Ｖ_ｎ－Ｖ_ｎ－ｋ＝Ｖ_Ｎ－Ｖ_Ｎ－ｋが大きい程、パラメータの候補値に対する評価値の収束が進んでいないと推定される。当該差が大きいほど、パラメータ取得範囲変更制御部１５０は、取得対象範囲を狭めるタイミングを遅くし、取得対象範囲を狭める量を少なくする。

例えば、パラメータ取得範囲変更制御部１５０は、式（５）、（６）を用いて取得対象範囲を狭めるタイミングと、取得対象範囲を狭める量Δαとを計算する。当該タイミングは、Ｎ回の評価が完了した時点からの時間τ１によって表される。τ１は、当該時点以降に行われるパラメータ評価の回数により表されてもよい。

τ１＝ｇ＊（Ｖ_ｎ－Ｖ_ｎ－ｋ）＋ｃ・・・（５）
Δα＝ｇ／（Ｖ_ｎ－Ｖ_ｎ－ｋ）＋ｃ・・・（６）
ｇ，ｃは、何れも正の実数である。式（５）、（６）におけるｇは、互いに異なる値でもよい。式（５）、（６）におけるｃは、互いに異なる値でもよい。

また、パラメータ取得範囲変更制御部１５０は、更に、エネルギー関数に応じたイジング問題の性質を示す指標に基づいて、τ１およびΔαを決定してもよい。イジング問題の性質を示す指標は、式（１）のエネルギー関数におけるビット数Ａ、制約の種類および各種類の制約の数を含む。制約の種類には前述の１ｗ１ｈ制約や２ｗ１ｈ制約などがある。例えば、パラメータ取得範囲変更制御部１５０は、式（７）、（８）を用いてτ１とΔαとを計算してもよい。ここで、エネルギー関数は２つの種類の制約を含むと仮定する。第１の種類の制約の数はＢ１である。第２の種類の制約の数はＢ２である。

τ１＝ａ＊Ａ＋ｂ１＊Ｂ１＋ｂ２＊Ｂ２＋ｇ＊（Ｖ_ｎ－Ｖ_ｎ－ｋ）＋ｃ・・・（７）
Δα＝ａ／Ａ＋ｂ３／Ｂ１＋ｂ４／Ｂ２＋ｇ／（Ｖ_ｎ－Ｖ_ｎ－ｋ）＋ｃ・・・（８）
ａ，ｂ１，ｂ２は、何れも正の実数である。式（７）、（８）におけるａは、互いに異なる値でもよい。式（７）、（８）におけるｇは、互いに異なる値でもよい。式（７）、（８）におけるｃは、互いに異なる値でもよい。式（７）のｂ１，ｂ２は、制約の種類に対応する係数である。複雑な種類の制約であるほど、ｂ１，ｂ２の値を大きくする。式（８）のｂ１，ｂ２は、制約の種類に対応する係数である。複雑な種類の制約であるほど、ｂ３，ｂ４の値を小さくする。なお、エネルギー関数は１つの種類の制約を含んでもよいし、３種類以上の制約を含んでもよい。

また、パラメータ取得範囲変更制御部１５０は、式（９）、（１０）を用いてτ１とΔαとを計算してもよい。
τ１＝ａ＊Ａ＊Ｂ１＊Ｂ２＊（Ｖ_ｎ－Ｖ_ｎ－ｋ）＋ｃ・・・（９）
Δα＝ａ／｛Ａ＊Ｂ１＊Ｂ２＊（Ｖ_ｎ－Ｖ_ｎ－ｋ）｝＋ｃ・・・（１０）
式（９）、（１０）におけるａは、互いに異なる値でもよい。式（９）、（１０）におけるｃは、互いに異なる値でもよい。

ここで、パラメータが複数の場合、パラメータ取得範囲変更制御部１５０は、パラメータごとにΔαを算出してもよい。パラメータ取得範囲変更制御部１５０は、Δαの計算に用いられるａ，ｂ１，ｂ２などの係数として、該当のパラメータに対応する係数を用いてもよい。また、式（５）～（１０）は一例であり、情報処理装置１００は、他の式を用いてτ１やΔαを求めてもよい。

なお、情報処理装置１００は、イジング問題のビット数がｄ以下かつ第１の種類の制約の数がｅ１以下かつ第２の種類の制約の数がｅ２以下かつＶ_ｎ－Ｖ_ｎ－ｋがｆ以下の場合に、τ１＝ｔ、Δα＝ｕとするなどのパターンを示すテーブルを保持してもよい。この場合、当該テーブルは、情報処理装置１００が有するＲＡＭ１０２やＨＤＤ１０３により実現される記憶部に予め格納される。パラメータ取得範囲変更制御部１５０は、当該テーブルを参照して、条件に合うパターンを採用することで、τ１とΔαとを決定してもよい。

次に、情報処理装置１００の処理手順を説明する。
図６は、情報処理装置の処理例を示すフローチャートである。
（Ｓ１０）問題入力部１２０は、問題情報記憶部１１０に記憶されたイジング問題の情報を、パラメータ評価部１３０、パラメータ取得範囲変更制御部１５０および解探索部１９０に入力する。

（Ｓ１１）パラメータ取得部１７０は、パラメータの候補値を一定の取得対象範囲の中から取得し、パラメータ評価部１３０に出力する。当初の取得対象範囲は、情報処理装置１００に予め入力される。パラメータが複数の場合、取得対象範囲はパラメータごとに定められる。例えば、パラメータとして最高温度値と最低温度値とがある場合、パラメータ取得部１７０は、最高温度値の取得対象範囲から最高温度値の候補値を取得し、最低温度値の取得対象範囲から最低温度値の候補値を取得する。そして、パラメータ取得部１７０は、取得した最高温度値の候補値と最低温度値の候補値との組をパラメータ評価部１３０に出力する。

（Ｓ１２）パラメータ評価部１３０は、パラメータの候補値の評価を行う。具体的には、パラメータ評価部１３０は、パラメータの候補値を、パラメータ探索終了判定部１８０を介して解探索部１９０に供給し、当該候補値を用いた一定時間の解探索を実行させる。パラメータ評価部１３０は、解探索部１９０による一定時間の解探索の結果として得られる、到達した最小エネルギーと、最小エネルギーに到達するまでの時間に基づいて、パラメータの候補値に対する評価値を算出する。パラメータ評価部１３０は、パラメータの候補値と評価値とをパラメータ評価テーブル１４１に格納する。

（Ｓ１３）パラメータ取得範囲変更制御部１５０は、ステップＳ１２のパラメータ評価をＮ回実行したか否かを判定する。パラメータ評価をＮ回実行していない場合、パラメータ取得範囲変更制御部１５０は、ステップＳ１１に処理を進める。パラメータ評価をＮ回実行した場合、パラメータ取得範囲変更制御部１５０は、ステップＳ１４に処理を進める。

（Ｓ１４）パラメータ取得範囲変更制御部１５０は、パラメータ取得範囲、すなわち、パラメータの候補値の取得対象範囲を狭めるタイミングおよび取得対象範囲を狭める量Δαを決定する。当該タイミングの計算には、例えば式（５）、（７）、（９）の何れかが用いられる。Δαの計算には、例えば式（６）、（８）、（１０）の何れかが用いられる。パラメータが複数の場合、パラメータ取得範囲変更制御部１５０は、各パラメータに対してΔαを決定する。パラメータ取得範囲変更制御部１５０は、決定したタイミングを示すτ１およびΔαを、パラメータ取得範囲変更部１６０に出力する。

（Ｓ１５）パラメータ取得範囲変更部１６０は、現時点がパラメータの取得対象範囲を狭めるタイミングであるか否かを判定する。現時点が当該タイミングでない場合、パラメータ取得範囲変更部１６０は、ステップＳ１７に処理を進める。現時点が当該タイミングである場合、パラメータ取得範囲変更部１６０は、ステップＳ１６に処理を進める。

例えば、パラメータ取得範囲変更部１６０は、ステップＳ１４の直後からの経過時間がτ１に達した場合に、現時点がパラメータの取得対象範囲を狭めるタイミングであると判定する。あるいは、パラメータ取得範囲変更部１６０は、ステップＳ１４の時点からのパラメータ評価の回数がτ１に達した場合に、現時点がパラメータの取得対象範囲を狭めるタイミングであると判定してもよい。

（Ｓ１６）パラメータ取得範囲変更部１６０は、パラメータ評価部１３０から現時点での最高の評価値に対応するパラメータの候補値を取得する。パラメータ取得範囲変更部１６０は、取得した候補値を新たな取得対象範囲の中心値とする。そして、パラメータ取得範囲変更部１６０は、当該中心値を中心として、取得対象範囲の幅をΔαだけ狭めた範囲を、パラメータの候補値の新たな取得対象範囲とする。例えば、中心値がＰｃ、元の取得対象範囲の幅がα０の場合、新たな取得対象範囲は、Ｐｃ±｛（α０－Δα）／２｝となる。パラメータが複数の場合、パラメータ取得範囲変更部１６０は、各パラメータに対して、新たな取得対象範囲を決定する。そして、パラメータ取得範囲変更部１６０は、ステップＳ１７に処理を進める。

（Ｓ１７）パラメータ取得部１７０は、パラメータの候補値を現在の取得対象範囲の中から取得し、パラメータ評価部１３０に出力する。このとき、パラメータ取得部１７０は、例えばこれまでに未取得の候補値を、現在の取得対象範囲の中から取得する。

（Ｓ１８）パラメータ評価部１３０は、パラメータの候補値の評価を行う。評価の方法は、ステップＳ１２と同様である。パラメータ評価部１３０は、該当の候補値に対する評価値を、パラメータ探索終了判定部１８０に出力する。また、パラメータ評価部１３０は、パラメータの候補値と評価値とをパラメータ評価テーブル１４１に格納する。

（Ｓ１９）パラメータ探索終了判定部１８０は、パラメータ探索を終了するか否かを判定する。パラメータ探索を終了しない場合、パラメータ探索終了判定部１８０は、ステップＳ１５に処理を進める。パラメータ探索を終了する場合、パラメータ探索終了判定部１８０は、ステップＳ２０に処理を進める。例えば、パラメータ探索終了判定部１８０は、各候補値に対する評価値が一定回数変化しない場合に、パラメータ探索を終了すると判定する。

（Ｓ２０）パラメータ評価部１３０は、パラメータ評価テーブル１４１に基づいて、現時点までに得られた最良の評価値に対応するパラメータの値を、パラメータ探索終了判定部１８０を介して解探索部１９０に入力して、本番の解探索を実行させる。解探索部１９０は、最良の評価値に対応するパラメータの値を用いて解探索を実行する。

（Ｓ２１）解出力部１９５は、解探索部１９０による解探索が終了すると、解探索により最終的に得られた解を解探索部１９０から取得し、当該解を出力する。
ここで、図６の手順では、情報処理装置１００がパラメータの候補値の取得対象範囲を１回だけ変更する例を示した。一方、情報処理装置１００は、当該取得対象範囲を複数回変更してもよい。例えば、パラメータ取得範囲変更部１６０は、周期τ１でステップＳ１６を実行して取得対象範囲をΔαずつ狭めることで、当該取得対象範囲を段階的に絞り込んでもよい。

あるいは、パラメータ取得範囲変更部１６０は、変更後の取得対象範囲を用いたパラメータ評価の回数がＮ’回に達すると、当該Ｎ’回のパラメータ評価の結果や問題の性質を基に、現在の取得対象範囲を狭めるタイミングと狭める量とを更に決定してもよい。そして、パラメータ取得範囲変更部１６０は、決定したタイミングと量とに基づいて、現在の取得対象範囲を更に狭める変更を行ってもよい。こうして、パラメータ取得範囲変更部１６０は、パラメータの候補値の取得対象範囲を段階的に絞り込んでもよい。

なお、図６では、Ｎ回のパラメータ評価を行った後に、取得対象範囲を狭めるタイミングや狭める量を決定する例を示した。一方、パラメータ取得範囲変更制御部１５０は、問題の性質を示す指標のみを用いて当該タイミングや狭める量Δαを決定してもよい。一方、当該タイミングは、パラメータ探索の開始時点からの時間τ２によって表されてもよい。τ２は、当該開始時点以降に行われるパラメータ評価の回数により表されてもよい。

τ２＝ａ＊Ａ＋ｂ１＊Ｂ１＋ｂ２＊Ｂ２＋ｃ・・・（１１）
Δα＝ａ／Ａ＋ｂ３／Ｂ１＋ｂ４／Ｂ２＋ｃ・・・（１２）
式（１１）、（１２）におけるａは、互いに異なる値でもよい。式（１１）、（１２）におけるｃは、互いに異なる値でもよい。式（１１）では、複雑な種類の制約であるほど、ｂ１，ｂ２の値を大きくする。式（１２）では、複雑な種類の制約であるほど、ｂ３，ｂ４の値を小さくする。

また、パラメータ取得範囲変更制御部１５０は、式（１３）、（１４）を用いてτ２とΔαとを計算してもよい。
τ２＝ａ＊Ａ＊Ｂ１＊Ｂ２＋ｃ・・・（１３）
Δα＝ａ／｛Ａ＊Ｂ１＊Ｂ２｝＋ｃ・・・（１４）
式（１３）、（１４）におけるａは、互いに異なる値でもよい。式（１３）、（１４）におけるｃは、互いに異なる値でもよい。また、式（１１）～（１４）は一例であり、情報処理装置１００は、他の式を用いてτ２やΔαを求めてもよい。

なお、情報処理装置１００は、イジング問題のビット数がｄ以下かつ第１の種類の制約の数がｅ１以下かつ第２の種類の制約の数がｅ２以下の場合に、τ２＝ｔ、Δα＝ｕとするなどのパターンを示すテーブルを保持してもよい。パラメータ取得範囲変更制御部１５０は、当該テーブルを参照して、条件に合うパターンを採用することで、τ２とΔαとを決定してもよい。

情報処理装置１００は、問題の性質を示す指標のみを用いて取得対象範囲を狭めるタイミングや狭める量Δαを決定する場合、図６の手順に代えて次の手順を実行してもよい。
図７は、情報処理装置の他の処理例を示すフローチャートである。

図７の手順では、ステップＳ１０の直後にステップＳ１０ａを実行し、ステップＳ１０ａの次にステップＳ１５に進む点が、図６の手順と異なる。このため、以下では、ステップＳ１０ａを説明し、他の手順の説明を省略する。

（Ｓ１０ａ）パラメータ取得範囲変更制御部１５０は、パラメータ取得範囲、すなわち、パラメータの候補値の取得対象範囲を狭めるタイミングおよび取得対象範囲を狭める量Δαを決定する。当該タイミングの計算には、例えば式（１１）、（１３）の何れかが用いられる。Δαの計算には、例えば式（１２）、（１４）の何れかが用いられる。パラメータが複数の場合、パラメータ取得範囲変更制御部１５０は、各パラメータに対してΔαを決定する。パラメータ取得範囲変更制御部１５０は、決定したタイミングを示すτ２およびΔαを、パラメータ取得範囲変更部１６０に出力する。なお、当初用いられる一定の取得対象範囲は、情報処理装置１００に予め入力される。

ステップＳ１５では、例えば、パラメータ取得範囲変更部１６０は、ステップＳ１０ａの直後の時点、すなわち、パラメータ探索の開始時点からの経過時間がτ２に達した場合に、現時点がパラメータの取得対象範囲を狭めるタイミングであると判定する。あるいは、パラメータ取得範囲変更部１６０は、当該開始時点からのパラメータ評価の回数がτ２に達した場合に、現時点がパラメータの取得対象範囲を狭めるタイミングであると判定してもよい。

このように、情報処理装置１００は、パラメータの候補値の取得対象範囲を効率的に絞り込むことができる。
なお、図７の手順では、情報処理装置１００がパラメータの候補値の取得対象範囲を１回だけ変更する例を示した。一方、情報処理装置１００は、当該取得対象範囲を複数回変更してもよい。例えば、パラメータ取得範囲変更部１６０は、周期τ２でステップＳ１６を実行して取得対象範囲をΔαずつ狭めることで、当該取得対象範囲を段階的に絞り込んでもよい。

また、パラメータ取得範囲変更制御部１５０は、図６の手順により、狭めるタイミングを示すτ２や量Δαを決定してパラメータ探索を行ってもよい。例えば、上記τ２は、図６の手順のステップＳ１４の直後からの時間として決定されてもよい。

図８は、パラメータの候補値の取得対象範囲の例を示す図である。
図８（Ａ）は、不適切な取得対象範囲を示すグラフ５１を例示する。図８（Ｂ）は、適切な取得対象範囲を示すグラフ５２を例示する。グラフ５１，５２それぞれの横軸はパラメータの候補値、すなわち、パラメータ値である。グラフ５１，５２それぞれの縦軸は評価値である。最も評価の高いパラメータ値、すなわち、ベストパラメータ値は、ｐ５であると仮定する。グラフ５１は、パラメータ値ｐ３を中心値とする幅α１の取得対象範囲を示す。グラフ５２は、パラメータ値ｐ４を中心値とする幅α２の取得対象範囲を示す。

例えば、取得対象範囲を狭めるタイミングや狭める量を、何れも固定値として与えて、取得対象範囲を狭める方法も考えられる。しかし、この場合、グラフ５１で示されるように、ベストパラメータ値ｐ５が、取得対象範囲から除外される可能性がある。

そこで、情報処理装置１００は、パラメータ探索における評価値の収束の度合いおよび問題の性質を示す指標の少なくとも一方を用いて、取得対象範囲を狭めるタイミングや狭める量を決定する。これにより、情報処理装置１００は、パラメータ値ｐ３より良いパラメータ値ｐ４を発見し易くなり、パラメータ値ｐ４を中心値とした適切な幅α２の取得対象範囲を決定できる。その結果、情報処理装置１００は、ベストパラメータ値ｐ５が取得対象範囲から除外される可能性を小さくすることができる。また、情報処理装置１００は、評価値の収束の度合いが速い場合や、問題の性質から比較的難易度の低い問題では、パラメータ探索の時間を抑制できる。

更に、情報処理装置１００は、解探索に使用するパラメータの値を適切に決定できるため、解探索部１９０による本番の解探索における求解性能を向上できる。すなわち、情報処理装置１００は、ベストパラメータ値の見逃しによる求解性能の低下を回避しつつ、パラメータ探索の時間を削減できる可能性を高められる。

なお、パラメータ探索には、ＴＰＥ（Tree-structured Parzen Estimator）の手法もある。ＴＰＥは、既に取得したパラメータ値に対する評価から、評価が高くなると推定されるパラメータ値を取得する手法である。ただし、ＴＰＥを用いたとしても、正確な推定ができるまでには、多くのパラメータ値の評価を要することから、ベストパラメータ値への収束に時間がかかる。一方、情報処理装置１００は、ＴＰＥの手法に比べても、比較的短時間でベストパラメータ値へ収束する可能性を高めることができる。

ここで、実問題５問に対する実験が行われた。実問題５問のうち３問は、比較的小さいビット数（４７７～７５５ビット）であり、制約の数が１５９～２５０程度である。一方、残り２問は、一方のビット数が５０７９ビットであり、他方のビット数が６３２１ビットであり、制約の数がそれぞれ１６９３、２１０７である。

実問題５問に対し、他の情報処理装置を用いて、単純にパラメータ取得および評価を３００回行った後にパラメータの候補値の取得対象範囲を１／４に絞って探索したパラメータの値で求解を行った。これに対し、比較的ビット数の小さい３問では、情報処理装置１００の機能により、パラメータ取得および評価を２００回行った後に当該取得対象範囲を絞って探索したパラメータの値で求解が行われた。両方の求解結果を比較すると次の結果となった。

比較的小さいビット数の３問について、情報処理装置１００により２００回後に取得対象範囲を絞った方が、同程度の求解性能を維持しつつ、求解速度が向上することが確認された。具体的には、比較的小さいビット数の３問に対して、他の情報処理装置の求解で得られたエネルギーはそれぞれ（１９２２２，１４６７０，２５３６２）であり、当該エネルギーに到達するまでの時間はそれぞれ（１８時間，２９時間，２９時間）であった。一方、当該３問に対して、情報処理装置１００の求解で得られたエネルギーはそれぞれ（１９２１５，１４６８６，２５３６２）であり、当該エネルギーに到達するまでの時間はそれぞれ（２１時間，２５時間，１８時間）であった。したがって、この場合、エネルギーで平均０．０２４％の差の求解性能を維持しつつ、平均１９％の速度向上が得られた。

以上説明したように、情報処理装置１００は、次の処理を実行する。
問題情報記憶部１１０は、問題に対応する、イジングモデルのエネルギー関数を示す情報を記憶する。情報処理装置１００は、エネルギー関数に基づく問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および第１候補値をパラメータの値として用いた場合の解の探索の結果に応じた第１候補値の評価を複数回行う。情報処理装置１００は、候補値範囲を、第１範囲から第１範囲よりも狭い第２範囲に変更する。情報処理装置１００は第２範囲からの第２候補値の取得および第２候補値をパラメータの値として用いた場合の解の探索の結果に応じた第２候補値の評価を複数回行う。情報処理装置１００は、第２範囲への変更の前に、第１候補値を用いた評価により複数の第１候補値に対して算出された複数の第１評価値のうちの最良の評価値と最良の評価値よりも前の評価によって得られた他の評価値との第１差分、および、エネルギー関数に応じた問題の性質を示す指標の少なくとも一方に基づいて、候補値範囲を、第１範囲から第２範囲に変更するタイミングと、第１範囲と第２範囲との第２差分とを決定する。

これにより、情報処理装置１００は、パラメータ探索を効率化できる。なお、複数の第１評価値を得る期間は、パラメータの候補値に対する評価の回数により予め定められてもよい。また、パラメータの数は１つでも良いし複数でもよい。パラメータ探索の対象となるパラメータの例には、ＳＡ法やレプリカ交換法における最高温度値や最低温度値が挙げられる。パラメータ探索の対象となるパラメータは、ＳＡ法における温度値の下げ幅や、レプリカ交換法における隣接する温度値の差などの他のパラメータを含んでもよい。レプリカ交換法における隣接する温度値の差に対応するパラメータとして、レプリカの数が用いられてもよい。解の探索は、例えばアクセラレータカード１０８などの探索部により実行される。ただし、解の探索はＣＰＵ１０１により実行されてもよい。

例えば、情報処理装置１００は、第１差分が大きいほど、第１範囲から第２範囲に変更するタイミングを遅くし、第２差分を小さくしてもよい。これにより、情報処理装置１００は、より良いパラメータの値を発見できる可能性を高められる。また、情報処理装置１００は、評価値の収束が比較的進んでいると判断される場合には、パラメータ探索の時間を効率的に削減できる。

また、情報処理装置１００は、第１差分が閾値以下の場合に、第１差分が閾値より大きい場合よりも、第１範囲から第２範囲に変更するタイミングを早くし、第２差分を大きくしてもよい。これにより、情報処理装置１００は、より良いパラメータの値を発見できる可能性を高められる。また、情報処理装置１００は、評価値の収束が比較的進んでいると判断される場合には、パラメータ探索の時間を効率的に削減できる。

また、問題の性質を示す指標は、例えば、問題の難易度を示すものでもよい。情報処理装置１００は、問題の難易度が高いほど、第１範囲から第２範囲に変更するタイミングを遅くし、第２差分を小さくしてもよい。これにより、情報処理装置１００は、より良いパラメータの値を発見できる可能性を高められる。また、情報処理装置１００は、問題の難易度が比較的低いと判断される場合には、パラメータ探索の時間を効率的に削減できる。

例えば、問題の性質を示す指標は、エネルギー関数に含まれる状態変数の数、制約の種類および制約の数の少なくとも何れかを示す指標である。情報処理装置１００は、これらの指標により、問題の難易度を適切に判断できる。

情報処理装置１００は、エネルギー関数に含まれる状態変数の数および制約の数の少なくとも一方が多いほど、第１範囲から第２範囲に変更するタイミングを遅くし、第２差分を小さくしてもよい。これにより、情報処理装置１００は、より良いパラメータの値を発見できる可能性を高められる。また、情報処理装置１００は、問題の難易度が比較的低いと判断される場合には、パラメータ探索の時間を効率的に削減できる。

情報処理装置１００は、候補値範囲を第１範囲から第２範囲に変更する際、第１範囲から取得された第１候補値のうち最良の評価値に対応する第１候補値を、第２範囲の中心値に設定する。これにより、情報処理装置１００は、より良いパラメータの値を発見できる可能性を高められる。

例えば、情報処理装置１００は、第１候補値を用いた場合の一定時間の解の探索により得られたエネルギー関数の最良値、および、最良値に達するまでに要した時間に基づいて第１候補値に対応する最良の評価値を算出してもよい。すなわち、情報処理装置１００は、第１候補値を用いた場合の一定時間の解の探索により得られたエネルギー関数の最良値、および、最良値に達するまでに要した時間に基づいて第１候補値に対応する第１評価値を算出する。そして、情報処理装置１００は、複数の第１候補値に対応する複数の第１評価値から最良の評価値を取得する。

これにより、情報処理装置１００は、パラメータの候補値を適切に評価できる。例えば、エネルギーを最小化する問題の場合、解のエネルギーが低いほど、エネルギー関数の値は良い値となり、該当の候補値の評価は高まる。また、エネルギー関数の当該最良値に達するまでに要した時間が短いほど、該当の候補値の評価は高まる。

情報処理装置１００は、第２範囲から取得された複数の第２候補値に対して得られた複数の第２評価値のうちの最良の評価値に対応する第２候補値をパラメータの値として決定する。情報処理装置１００は、ＣＰＵ１０１により当該パラメータの値を用いて問題に対する解の探索を実行してもよい。または、情報処理装置１００は、ＣＰＵ１０１により決定したパラメータの値を問題の解の探索を行うアクセラレータカード１０８などの探索部に入力して当該探索部に解の探索を実行させてもよい。情報処理装置１００は、パラメータ探索により、より良いパラメータの値を決定できるため、当該パラメータの値により解の探索を行うことで、求解性能を向上できる。なお、探索部は、情報処理装置１００以外の装置が備えるものでもよい。

また、パラメータ探索の対象のパラメータは複数でもよい。情報処理装置１００は、複数のパラメータの候補値それぞれの第１範囲からの候補値の組の取得および当該候補値の組を用いた場合の解の探索の結果に応じた当該候補値の組の評価を複数回行う。候補値取得範囲である第１範囲は、パラメータごとに定められる。情報処理装置１００は、複数のパラメータの候補値それぞれの第１範囲を、第１範囲よりも狭い第２範囲に変更する。情報処理装置１００は、複数のパラメータの候補値それぞれの第２範囲からの候補値の組の取得および当該候補値の組を用いた場合の解の探索の結果に応じた当該候補値の組の評価を複数回行う。そして、情報処理装置１００は、第２範囲への変更の前に、第１範囲を用いた評価により候補値の各組に対して算出された評価値のうちの最良の評価値と最良の評価値よりも前に得られた他の評価値との第１差分、および、エネルギー関数に応じた問題の性質を示す指標の少なくとも一方に基づいて、パラメータごとの候補値取得範囲を、第１範囲から第２範囲に変更するタイミングと、第１範囲と第２範囲との第２差分とを決定する。これにより、情報処理装置１００は、パラメータ探索を効率化できる。

例えば、問題に対する解の探索は、シミュレーテッドアニーリング（ＳＡ）法またはレプリカ交換法によって実行されてもよい。複数のパラメータは、ＳＡ法またはレプリカ交換法に用いられる最高温度値と最低温度値との少なくとも一方を含んでもよい。前述のように、複数のパラメータは、ＳＡ法における温度値の下げ幅や、レプリカ交換法における隣接する温度値の差などの他のパラメータを含んでもよい。これにより、情報処理装置１００は、ＳＡ法やレプリカ交換法に用いられるパラメータに対するパラメータ探索を効率化できる。

更に、情報処理装置１００は、第１処理と第２処理と第３処理と含むパラメータ探索処理に対して次の処理を実行してもよい。ここで、第１処理は、パラメータの候補値範囲である第１範囲からの第１候補値の取得および第１候補値をパラメータの値として用いた場合の解の探索の結果に応じた第１候補値の評価を複数回行う処理である。第２処理は、候補値範囲を、第１範囲から、第１範囲よりも狭い第２範囲に変更する処理である。第３処理は、第２範囲からの第２候補値の取得および第２候補値をパラメータの値として用いた場合の解の探索の結果に応じた第２候補値の評価を繰り返し行う処理である。問題情報記憶部１１０は、問題に対応する、イジングモデルのエネルギー関数を示す情報を記憶する。情報処理装置１００は、第１処理を終了して第２処理を実行するタイミング、すなわち、候補値範囲を第１範囲から第２範囲に変更するタイミングと、第１範囲と第２範囲との差分とを、エネルギー関数に応じた問題の性質を示す指標に基づいて決定する。

これにより、情報処理装置１００は、パラメータ探索を効率化できる。この場合、パラメータ探索処理は、情報処理装置１００により実行されてもよいし、情報処理装置１００以外の装置により実行されてもよい。パラメータ探索処理が情報処理装置１００以外の装置により実行される場合、情報処理装置１００は、決定したタイミングを示す情報と、差分を示す情報とを当該装置に送信する。

なお、第１の実施の形態の情報処理は、処理部１２にプログラムを実行させることで実現できる。また、第２の実施の形態の情報処理は、ＣＰＵ１０１にプログラムを実行させることで実現できる。プログラムは、コンピュータ読み取り可能な記録媒体３３に記録できる。

例えば、プログラムを記録した記録媒体３３を配布することで、プログラムを流通させることができる。また、プログラムを他のコンピュータに格納しておき、ネットワーク経由でプログラムを配布してもよい。コンピュータは、例えば、記録媒体３３に記録されたプログラムまたは他のコンピュータから受信したプログラムを、ＲＡＭ１０２やＨＤＤ１０３などの記憶装置に格納し（インストールし）、当該記憶装置からプログラムを読み込んで実行してもよい。

以上の第１，第２の実施の形態を含む実施形態に関し、更に以下の付記を開示する。
（付記１）問題に対応する、イジングモデルのエネルギー関数を示す情報を記憶する記憶部と、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行い、前記候補値範囲を、第１範囲から、前記第１範囲よりも狭い第２範囲に変更し、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行う処理部と、を有し、
前記処理部は、前記第１候補値を用いた評価により複数の前記第１候補値に対して算出された複数の第１評価値のうちの最良の評価値と当該最良の評価値よりも前の評価によって得られた他の評価値との第１差分、および、前記エネルギー関数に応じた前記問題の性質を示す指標の少なくとも一方に基づいて、前記候補値範囲を前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との第２差分とを決定する、
情報処理装置。

（付記２）前記処理部は、前記第１差分が大きいほど、前記タイミングを遅くし、前記第２差分を小さくする、付記１記載の情報処理装置。
（付記３）前記処理部は、前記第１差分が閾値以下の場合に、前記第１差分が前記閾値より大きい場合よりも前記タイミングを早くし、前記第２差分を大きくする、付記１記載の情報処理装置。

（付記４）前記問題の性質を示す指標は、前記問題の難易度を示し、
前記処理部は、前記難易度が高いほど、前記タイミングを遅くし、前記第２差分を小さくする、付記１記載の情報処理装置。

（付記５）前記問題の性質を示す指標は、前記エネルギー関数に含まれる状態変数の数、制約の種類および制約の数の少なくとも何れかを示す指標である、付記１記載の情報処理装置。

（付記６）前記処理部は、前記エネルギー関数に含まれる状態変数の数および制約の数の少なくとも一方が多いほど、前記タイミングを遅くし、前記第２差分を小さくする、付記５記載の情報処理装置。

（付記７）前記処理部は、前記候補値範囲を前記第１範囲から前記第２範囲に変更する際、前記第１範囲から取得された前記第１候補値のうち、前記最良の評価値に対応する前記第１候補値を、前記第２範囲の中心値に設定する、付記１記載の情報処理装置。

（付記８）前記処理部は、前記第１候補値を用いた場合の一定時間の前記探索により得られた前記エネルギー関数の最良値、および、前記最良値に達するまでに要した時間に基づいて前記第１候補値に対応する前記最良の評価値を算出する、付記１記載の情報処理装置。

（付記９）前記処理部は、
前記第２範囲から取得された複数の前記第２候補値に対して得られた複数の第２評価値のうちの最良の評価値に対応する前記第２候補値を前記パラメータの値として決定し、
決定した前記パラメータの値を用いて前記問題に対する解の前記探索を実行する、または、決定した前記パラメータの値を前記探索を行う探索部に入力して前記探索部に前記探索を実行させる、
付記１記載の情報処理装置。

（付記１０）前記パラメータは複数あり、
前記処理部は、
複数の前記パラメータの候補値それぞれの前記第１範囲からの前記候補値の組の取得および前記候補値の組を用いた場合の前記探索の結果に応じた前記候補値の組の前記評価を複数回行い、複数の前記パラメータの候補値それぞれの前記第１範囲を前記第２範囲に変更し、複数の前記パラメータの候補値それぞれの前記第２範囲からの前記候補値の組の取得および前記候補値の組を用いた場合の前記探索の結果に応じた前記候補値の組の前記評価を複数回行い、
前記第２範囲への変更の前に、前記第１範囲を用いた前記評価により前記候補値の各組に対して算出された評価値のうちの最良の評価値と当該最良の評価値よりも前に得られた他の評価値との前記第１差分、および、前記エネルギー関数に応じた前記問題の性質を示す前記指標の少なくとも一方に基づいて、前記タイミングと前記第２差分とを決定する、
付記１記載の情報処理装置。

（付記１１）前記問題に対する解の前記探索は、シミュレーテッドアニーリング法またはレプリカ交換法によって実行され、
複数の前記パラメータは、前記シミュレーテッドアニーリング法または前記レプリカ交換法に用いられる最高温度値と最低温度値との少なくとも一方を含む、
付記１０記載の情報処理装置。

（付記１２）コンピュータが、
問題に対応する、イジングモデルのエネルギー関数を示す情報を取得し、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行い、前記候補値範囲を、前記第１範囲から、前記第１範囲よりも狭い第２範囲に変更し、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行い、
前記第２範囲への変更の前に、前記第１候補値を用いた評価により複数の前記第１候補値に対して算出された複数の第１評価値のうちの最良の評価値と当該最良の評価値よりも前の評価によって得られた他の評価値との第１差分、および、前記エネルギー関数に応じた前記問題の性質を示す指標の少なくとも一方に基づいて、前記候補値範囲を前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との第２差分とを決定する、
情報処理方法。

（付記１３）コンピュータに、
問題に対応する、イジングモデルのエネルギー関数を示す情報を取得し、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行い、前記候補値範囲を、前記第１範囲から、前記第１範囲よりも狭い第２範囲に変更し、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行い、
前記第２範囲への変更の前に、前記第１候補値を用いた評価により複数の前記第１候補値に対して算出された複数の第１評価値のうちの最良の評価値と当該最良の評価値よりも前の評価によって得られた他の評価値との第１差分、および、前記エネルギー関数に応じた前記問題の性質を示す指標の少なくとも一方に基づいて、前記候補値範囲を前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との第２差分とを決定する、
処理を実行させるプログラム。

（付記１４）問題に対応する、イジングモデルのエネルギー関数を示す情報を記憶する記憶部と、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行う第１処理と、前記候補値範囲を、前記第１範囲から、前記第１範囲よりも狭い第２範囲に変更する第２処理と、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行う第３処理とを含む処理において、前記候補値範囲を、前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との差分とを、前記エネルギー関数に応じた前記問題の性質を示す指標に基づいて決定する処理部と、
を有する情報処理装置。

（付記１５）前記問題の性質を示す指標は、前記問題の難易度を示し、
前記処理部は、前記難易度が高いほど、前記タイミングを遅くし、前記差分を小さくする、付記１４記載の情報処理装置。

（付記１６）前記問題の性質を示す指標は、前記エネルギー関数に含まれる状態変数の数、制約の種類および制約の数の少なくとも何れかを示す指標である、付記１４記載の情報処理装置。

（付記１７）前記処理部は、前記エネルギー関数に含まれる状態変数の数および制約の数の少なくとも一方が多いほど、前記タイミングを遅くし、前記差分を小さくする、付記１６記載の情報処理装置。

（付記１８）コンピュータが、
問題に対応する、イジングモデルのエネルギー関数を示す情報を取得し、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行う第１処理と、前記候補値範囲を、前記第１範囲から、前記第１範囲よりも狭い第２範囲に変更する第２処理と、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行う第３処理とを含む処理において、前記候補値範囲を、前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との差分とを、前記エネルギー関数に応じた前記問題の性質を示す指標に基づいて決定する、
情報処理方法。

（付記１９）コンピュータに、
問題に対応する、イジングモデルのエネルギー関数を示す情報を取得し、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行う第１処理と、前記候補値範囲を、前記第１範囲から、前記第１範囲よりも狭い第２範囲に変更する第２処理と、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行う第３処理とを含む処理において、前記候補値範囲を、前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との差分とを、前記エネルギー関数に応じた前記問題の性質を示す指標に基づいて決定する、
処理を実行させるプログラム。

１０情報処理装置
１１記憶部
１２処理部
２０，２１グラフ

Claims

問題に対応する、イジングモデルのエネルギー関数を示す情報を記憶する記憶部と、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行い、前記候補値範囲を、第１範囲から、前記第１範囲よりも狭い第２範囲に変更し、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行う処理部と、を有し、
前記処理部は、前記第１候補値を用いた評価により複数の前記第１候補値に対して算出された複数の第１評価値のうちの最良の評価値と当該最良の評価値よりも前の評価によって得られた他の評価値との第１差分、および、前記エネルギー関数に応じた前記問題の性質を示す指標の少なくとも一方に基づいて、前記候補値範囲を前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との第２差分とを決定する、
情報処理装置。
前記処理部は、前記第１差分が大きいほど、前記タイミングを遅くし、前記第２差分を小さくする、請求項１記載の情報処理装置。
前記処理部は、前記第１差分が閾値以下の場合に、前記第１差分が前記閾値より大きい場合よりも前記タイミングを早くし、前記第２差分を大きくする、請求項１記載の情報処理装置。
前記問題の性質を示す指標は、前記問題の難易度を示し、
前記処理部は、前記難易度が高いほど、前記タイミングを遅くし、前記第２差分を小さくする、請求項１記載の情報処理装置。
前記問題の性質を示す指標は、前記エネルギー関数に含まれる状態変数の数、制約の種類および制約の数の少なくとも何れかを示す指標である、請求項１記載の情報処理装置。
前記処理部は、前記エネルギー関数に含まれる状態変数の数および制約の数の少なくとも一方が多いほど、前記タイミングを遅くし、前記第２差分を小さくする、請求項５記載の情報処理装置。
前記処理部は、前記候補値範囲を前記第１範囲から前記第２範囲に変更する際、前記第１範囲から取得された前記第１候補値のうち、前記最良の評価値に対応する前記第１候補値を、前記第２範囲の中心値に設定する、請求項１記載の情報処理装置。
前記処理部は、前記第１候補値を用いた場合の一定時間の前記探索により得られた前記エネルギー関数の最良値、および、前記最良値に達するまでに要した時間に基づいて前記第１候補値に対応する前記最良の評価値を算出する、請求項１記載の情報処理装置。
前記処理部は、
前記第２範囲から取得された複数の前記第２候補値に対して得られた複数の第２評価値のうちの最良の評価値に対応する前記第２候補値を前記パラメータの値として決定し、
決定した前記パラメータの値を用いて前記問題に対する解の前記探索を実行する、または、決定した前記パラメータの値を前記探索を行う探索部に入力して前記探索部に前記探索を実行させる、
請求項１記載の情報処理装置。
前記パラメータは複数あり、
前記処理部は、
複数の前記パラメータの候補値それぞれの前記第１範囲からの前記候補値の組の取得および前記候補値の組を用いた場合の前記探索の結果に応じた前記候補値の組の前記評価を複数回行い、複数の前記パラメータの候補値それぞれの前記第１範囲を前記第２範囲に変更し、複数の前記パラメータの候補値それぞれの前記第２範囲からの前記候補値の組の取得および前記候補値の組を用いた場合の前記探索の結果に応じた前記候補値の組の前記評価を複数回行い、
前記第２範囲への変更の前に、前記第１範囲を用いた前記評価により前記候補値の各組に対して算出された評価値のうちの最良の評価値と当該最良の評価値よりも前に得られた他の評価値との前記第１差分、および、前記エネルギー関数に応じた前記問題の性質を示す前記指標の少なくとも一方に基づいて、前記タイミングと前記第２差分とを決定する、
請求項１記載の情報処理装置。
前記問題に対する解の前記探索は、シミュレーテッドアニーリング法またはレプリカ交換法によって実行され、
複数の前記パラメータは、前記シミュレーテッドアニーリング法または前記レプリカ交換法に用いられる最高温度値と最低温度値との少なくとも一方を含む、
請求項１０記載の情報処理装置。
コンピュータが、
問題に対応する、イジングモデルのエネルギー関数を示す情報を取得し、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行い、前記候補値範囲を、前記第１範囲から、前記第１範囲よりも狭い第２範囲に変更し、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行い、
前記第２範囲への変更の前に、前記第１候補値を用いた評価により複数の前記第１候補値に対して算出された複数の第１評価値のうちの最良の評価値と当該最良の評価値よりも前の評価によって得られた他の評価値との第１差分、および、前記エネルギー関数に応じた前記問題の性質を示す指標の少なくとも一方に基づいて、前記候補値範囲を前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との第２差分とを決定する、
情報処理方法。
コンピュータに、
問題に対応する、イジングモデルのエネルギー関数を示す情報を取得し、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行い、前記候補値範囲を、前記第１範囲から、前記第１範囲よりも狭い第２範囲に変更し、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行い、
前記第２範囲への変更の前に、前記第１候補値を用いた評価により複数の前記第１候補値に対して算出された複数の第１評価値のうちの最良の評価値と当該最良の評価値よりも前の評価によって得られた他の評価値との第１差分、および、前記エネルギー関数に応じた前記問題の性質を示す指標の少なくとも一方に基づいて、前記候補値範囲を前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との第２差分とを決定する、
処理を実行させるプログラム。
問題に対応する、イジングモデルのエネルギー関数を示す情報を記憶する記憶部と、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行う第１処理と、前記候補値範囲を、前記第１範囲から、前記第１範囲よりも狭い第２範囲に変更する第２処理と、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行う第３処理とを含む処理において、前記候補値範囲を、前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との差分とを、前記エネルギー関数に応じた前記問題の性質を示す指標に基づいて決定する処理部と、
を有する情報処理装置。
コンピュータが、
問題に対応する、イジングモデルのエネルギー関数を示す情報を取得し、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行う第１処理と、前記候補値範囲を、前記第１範囲から、前記第１範囲よりも狭い第２範囲に変更する第２処理と、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行う第３処理とを含む処理において、前記候補値範囲を、前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との差分とを、前記エネルギー関数に応じた前記問題の性質を示す指標に基づいて決定する、
情報処理方法。
コンピュータに、
問題に対応する、イジングモデルのエネルギー関数を示す情報を取得し、
前記エネルギー関数に基づく前記問題の解の探索に用いられるパラメータの候補値範囲である第１範囲からの第１候補値の取得および前記第１候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第１候補値の評価を複数回行う第１処理と、前記候補値範囲を、前記第１範囲から、前記第１範囲よりも狭い第２範囲に変更する第２処理と、前記第２範囲からの第２候補値の取得および前記第２候補値を前記パラメータの値として用いた場合の前記探索の結果に応じた前記第２候補値の評価を複数回行う第３処理とを含む処理において、前記候補値範囲を、前記第１範囲から前記第２範囲に変更するタイミングと、前記第１範囲と前記第２範囲との差分とを、前記エネルギー関数に応じた前記問題の性質を示す指標に基づいて決定する、
処理を実行させるプログラム。