WO2023248414A1

WO2023248414A1 - 求解装置、求解方法および求解プログラム

Info

Publication number: WO2023248414A1
Application number: PCT/JP2022/025053
Authority: WO
Inventors: 芙美代鷹野
Original assignee: 日本電気株式会社
Priority date: 2022-06-23
Filing date: 2022-06-23
Publication date: 2023-12-28

Abstract

近傍状態生成手段７１は、現在の状態の近傍となる状態を求め、その状態に遷移したとみなし、その後、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す。最良状態選択手段７３は、遷移したとみなされた個々の状態の中から、状態に対応する評価値が最大または最小になる状態を、最良状態として選択する。遷移判定手段７４は、現在の状態から最良状態に遷移させるか否かを判定する。状態遷移手段７５は、現在の状態から最良状態に遷移させると判定された場合に、現在の状態を最良状態に遷移させる。

Description

求解装置、求解方法および求解プログラム

　本発明は、組合せ最適化問題の解を求める求解装置、求解方法および求解プログラムに関する。

　組合せ最適化問題の解を求めるためにシミュレーテッドアニーリングが用いられる場合がある。シミュレーテッドアニーリングでは、評価値が最大または最小となる状態を求め、その状態を解とする。この場合、評価値を求めるための評価値関数が与えられる。評価値が最大となる状態を求めるか、または、評価値が最小となる状態を求めるかは、組合せ最適化問題に依存する。

　また、シミュレーテッドアニーリングを用いて組合せ最適化問題の解を求める場合に、イジングモデルやＱＵＢＯ（Quadratic Unconstrained Binary Optimization ）が利用されることがある。この場合、イジングモデルやＱＵＢＯのエネルギーが上記の評価値に該当し、イジングモデルやＱＵＢＯのエネルギー関数が上記の評価値関数に該当する。本明細書では、文言を統一するために、イジングモデルやＱＵＢＯを用いる場合において、イジングモデルやＱＵＢＯのエネルギーを評価値と記す。また、イジングモデルやＱＵＢＯのエネルギー関数を評価値関数と記す。ただし、イジングモデルやＱＵＢＯを利用してシミュレーテッドアニーリングを行う場合には、評価値（エネルギー）が最小となる状態を解として求める。

　イジングモデルは、個々のスピンによって磁性体の振る舞いを表す統計力学上のモデルであるが、組合せ最適化問題の求解にも適用可能である。イジングモデルでは、個々のスピンの値は、“１”または“－１”で表される。

　イジングモデルにおける評価値関数（エネルギー関数）は、以下の式（１）のように表される。

　式（１）におけるｉ，ｊは、いずれもスピンを表す変数である。また、式（１）におけるｓ_ｉは、スピンｉの値を表す変数であり、ｓ_ｊは、スピンｊの値を表す変数である。スピンｉ，ｊの値は、それぞれ、“１”または“－１”の二値のいずれかである。式（１）におけるｈ_ｉは、スピンｉに対応する定数である。ｉの取り得る値毎に、ｈ_ｉは定数として定められる。式（１）におけるＪ_ｉｊは、スピンｉおよびスピンｊの組合せに対応する定数である。ｉの取り得る値とｊの取り得る値の組合せ毎に、Ｊ_ｉｊは定数として定められる。

　ＱＵＢＯは、個々のスピンの値を“１”または“０”で表すモデルである。

　ＱＵＢＯにおける評価値関数（エネルギー関数）は、以下の式（２）のように表される。

　式（２）におけるｉ，ｊは、いずれもスピンを表す変数である。また、式（２）におけるｓ_ｉは、スピンｉの値を表す変数であり、ｓ_ｊは、スピンｊの値を表す変数である。スピンｉ，ｊの値は、それぞれ、“１”または“０”の二値のいずれかである。式（２）におけるＱ_ｉｊは、スピンｉおよびスピンｊの組合せに対応する定数である。ｉの取り得る値とｊの取り得る値の組合せ毎に、Ｑ_ｉｊは定数として定められる。

　イジングモデルやＱＵＢＯの評価値関数（エネルギー関数）は、シミュレーテッドアニーリングを実行する求解装置に入力される。求解装置は、シミュレーテッドアニーリングによって、組合せ最適化問題の解に該当する各スピンの状態を求める。

　特許文献１には、イジングモデルやＱＵＢＯを用いないシミュレーテッドアニーリングが記載されている。ただし、特許文献１では、エネルギーやエネルギー関数という文言が用いられている。特許文献１に記載された技術では、添え字ｉをインクリメントしながら、状態変数Ｘ＋ΔＸ_ｉのエネルギー関数の値を求める。特許文献１に記載された技術では、エネルギー値が最も小さくなる状態変数Ｘ＋ΔＸ_ｉを選択し、その状態変数に関して遷移判定を行う。

　すなわち、特許文献１に記載された技術は、現在の状態から遷移し得る複数の状態をそれぞれ求め、その中から最もエネルギーが小さい状態に関して、遷移するか否かの判定を行う。

　また、特許文献２には、スピンを選択したときに、そのスピンが属する組が、その組に関して予め定められた制約を満たし、かつ、そのスピンの値を変化させると決定した場合に、その組がその制約を満たした状態を維持するように、そのスピンを含む1つ以上のスピンの値を変化させることが記載されている。

特開平７－２００５１７号公報国際公開第２０２１／０５９３３８号

　前述のように、特許文献１に記載された技術は、現在の状態から遷移し得る複数の状態をそれぞれ求め、その中から最もエネルギーが小さい状態に関して、遷移するか否かの判定を行う。図８は、特許文献１に記載された技術にＱＵＢＯを適用した場合における現在の状態、および、現在の状態から遷移し得る複数の状態の例を示す模式図である。図８に示す例では、スピンの数が４個である。その４個のスピンに対して、「１つのスピンの値だけが１になり、他の全てのスピンの値は０である。」という制約が定められているものとする。以下、この制約をone-hot 制約と記す。図８では、説明を簡単にするために、現在の状態がone-hot 制約を満たしている場合を示している。特許文献１に記載された技術にＱＵＢＯを適用した場合、図８に示すように、現在の状態から遷移し得る複数の状態を求め、その複数の状態の中から、評価値（エネルギー）が最小となる状態を選択する。そして、現在の状態からその選択した状態に遷移するか否かを判定する。しかし、図８に示す例では、現在の状態から遷移し得る各状態は、いずれもone-hot 制約を満たしておらず、各状態の評価値は、現在の評価値より大きい。そのため、局所解から他の局所解に遷移しにくく、その結果、最適解の導出に時間がかかってしまう。

　図９は、特許文献２に記載の技術における、現在の状態と、その状態から遷移し得る次の状態の例を示す模式図である。本例では、４行４列に並ぶ１６個のスピンが存在しているものとする。そして、各行および各列には、それぞれ、one-hot 制約が定められているものとする。さらに、現在の状態では、全ての行および全ての列でone-hot 制約が満たされているものとする（図９参照）。現在の状態における第１行第１列のスピンを選択し、そのスピンの値“１”を“０”に変化させるとする。このとき、そのスピンが属する第１行のスピンの組がone-hot 制約を満たした状態を維持するように、例えば、第１行第３列のスピンの値も“０”から“１”に変化させる。この場合、第１行の２つのスピンの値を変化させることで、第１行のスピンの組では、one-hot 制約を満たした状態が維持される。しかし、第１列のスピンの組、および、第３列のスピンの組では、one-hot 制約が満たされなくなる。よって、現在の状態の次の状態の評価値は、現在の状態の評価値より大きい。そのため、局所解から他の局所解に遷移しにくく、その結果、最適解の導出に時間がかかってしまう。

　そのため、本発明は、組合せ最適化問題の最適解を高速に求めることができる求解装置、求解方法および求解プログラムを提供することを目的とする。

　本発明による求解装置は、シミュレーテッドアニーリングを実行することによって、組合せ最適化問題の解に相当する状態を求める求解装置であって、現在の状態の近傍となる状態を求め、その状態に遷移したとみなし、その後、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す近傍状態生成手段と、遷移したとみなされた個々の状態の中から、状態に対応する評価値が最大または最小になる状態を、最良状態として選択する最良状態選択手段と、現在の状態から最良状態に遷移させるか否かを判定する遷移判定手段と、現在の状態から最良状態に遷移させると判定された場合に、現在の状態を最良状態に遷移させる状態遷移手段とを備えることを特徴とする。

　本発明による求解方法は、コンピュータが、シミュレーテッドアニーリングを実行することによって、組合せ最適化問題の解に相当する状態を求める求解方法であって、コンピュータが、現在の状態の近傍となる状態を求め、その状態に遷移したとみなし、その後、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す近傍状態生成処理を実行し、遷移したとみなされた個々の状態の中から、状態に対応する評価値が最大または最小になる状態を、最良状態として選択する最良状態選択処理を実行し、現在の状態から最良状態に遷移させるか否かを判定する遷移判定処理を実行し、現在の状態から最良状態に遷移させると判定された場合に、現在の状態を最良状態に遷移させる状態遷移処理を実行することを特徴とする。

　本発明による求解プログラムは、コンピュータに、シミュレーテッドアニーリングを実行させることによって、組合せ最適化問題の解に相当する状態を求めさせる求解プログラムであって、コンピュータに、現在の状態の近傍となる状態を求め、その状態に遷移したとみなし、その後、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す近傍状態生成処理、遷移したとみなされた個々の状態の中から、状態に対応する評価値が最大または最小になる状態を、最良状態として選択する最良状態選択処理、現在の状態から最良状態に遷移させるか否かを判定する遷移判定処理、および、現在の状態から最良状態に遷移させると判定された場合に、現在の状態を最良状態に遷移させる状態遷移処理を実行させる。また、本発明は、上記の求解プログラムを記録したコンピュータ読み取り可能な記録媒体であってもよい。

　本発明によれば、組合せ最適化問題の最適解を高速に求めることができる。

本発明の第１の実施形態の求解装置の構成例を示すブロック図である。現在の状態、および、連鎖的に求められた複数の近傍状態の例を示す模式図である。現在の状態、および、連鎖的に求められた複数の近傍状態の他の例を示す模式図である。本発明の第１の実施形態の処理経過の例を示すフローチャートである。第２の実施形態における現在の状態、および、連鎖的に求められた複数の近傍状態の例を示す模式図である。本発明の各実施形態の求解装置に係るコンピュータの構成例を示す概略ブロック図である。本発明の求解装置の概要を示すブロック図である。特許文献１に記載された技術にＱＵＢＯを適用した場合における現在の状態、および、現在の状態から遷移し得る複数の状態の例を示す模式図である。特許文献２に記載の技術における、現在の状態と、その状態から遷移し得る次の状態の例を示す模式図である。

　以下、本発明の実施形態を図面を参照して説明する。

　以下では、シミュレーテッドアニーリングにＱＵＢＯが適用される場合を例にして説明する。この場合、ＱＵＢＯの評価値関数（エネルギー関数）が本発明の求解装置に入力される。そして、本発明の求解装置は、シミュレーテッドアニーリングを実行することによって、組合せ最適化問題の解に相当する状態を求める。

実施形態１．
　図１は、本発明の第１の実施形態の求解装置の構成例を示すブロック図である。第１の実施形態の求解装置１０は、近傍状態生成部１と、評価値計算部２と、最良状態選択部３と、遷移判定部４と、状態遷移部５と、温度制御部６とを備える。

　近傍状態生成部１は、現在の状態の近傍となる状態を求め、その状態に遷移したものとみなす。その後、さらに、近傍状態生成部１は、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す。

　より具体的には、近傍状態生成部１は、現在の状態から一部のスピンの値を変化させることによって、現在の状態の近傍となる状態を求め、その状態に遷移したものとみなす。その後、さらに、近傍状態生成部１は、遷移したとみなした状態から一部のスピンの値を変化させることによってその遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す。

　直前の状態の一部を変化させた状態を、その直前の状態の近傍状態と記す。遷移したとみなした個々の状態はそれぞれ、直前の状態の近傍状態である。

　また、本実施形態では、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す回数が固定値であるものとする。従って、本実施形態では、１番目から所定番目までの近傍状態が得られる。近傍状態生成部１は、１番目から所定番目までの各近傍状態を、連鎖的に求める。

　図２は、現在の状態、および、連鎖的に求められた複数の近傍状態の例を示す模式図である。図２では、４つのスピンで状態が表される場合を例示している。また、その４つのスピンで表される状態には、one-hot 制約が定められているものとする。

　本例では、近傍状態生成部１は、ある状態の近傍状態を求める場合に、１つのスピンの値を変化させている。近傍状態生成部１は、値を変化させるスピンをランダムに選択してよい。また、本例では、近傍状態生成部１は、１番目から４番目までの各近傍状態を、連鎖的に求めている（図２参照）。

　図２に示す例では、現在の状態がone-hot 制約を満たしている場合を例示しているが、現在の状態がone-hot 制約を満たしていなくてもよい。

　また、近傍状態生成部１は、できるだけ定められた制約（本例では、one-hot 制約）を満たすように、値を変化させる１つのスピンを選択してもよい。この場合、最後の近傍状態（本例では、４番目の近傍状態）を求めるまでの過程において、制約が満たされている近傍状態から、制約が満たされていない近傍状態に遷移したとみなすことがあってもよい。図３は、現在の状態、および、連鎖的に求められた複数の近傍状態の他の例を示す模式図である。図３に示す例では、２番目の近傍状態として、one-hot 制約を満たした近傍状態が得られている。そして、３番目の近傍状態では、one-hot 制約が満たされなくなっている。

　図２は、one-hot 制約を満たした近傍状態（４番目の近傍状態）が得られる場合を示している。また、図３も、one-hot 制約を満たした近傍状態（２番目および４番目の近傍状態）が得られる場合を示している。しかし、どの近傍状態も、定められた制約を満たしていないことがあってもよい。

　評価値計算部２は、個々の近傍状態（遷移したとみなした個々の状態）それぞれに関して、近傍状態に対応する評価値（エネルギー）を計算する。評価値計算部２は、与えられたＱＵＢＯの評価値関数（エネルギー関数）に、近傍状態における各スピンの値を代入することによって、評価値を計算すればよい。

　最良状態選択部３は、個々の近傍状態（遷移したとみなした個々の状態）の中から、近傍状態に対応する評価値が最小になる近傍状態を、最良状態として選択する。図２に示す例では、４番目の近傍状態が、one-hot 制約を満たしている。よって、図２に示す４つの近傍状態の中で、４番目の近傍状態のエネルギーが最小になっていると考えられる。そのため、本例では、４番目の近傍状態のエネルギーが最小になっているものとする。この場合、最良状態選択部３は、図２に示す４番目の近傍状態を最良状態として選択する。また、各近傍状態がいずれもone-hot 制約を満たしていない場合においても、最良状態選択部３は、個々の近傍状態の中から、近傍状態に対応する評価値が最小になる近傍状態を、最良状態として選択する。

　遷移判定部４は、現在の状態（図２参照）から、最良状態選択部３によって選択された最良状態に遷移するか否かを判定する。遷移判定部４は、現在の状態の評価値と最良状態の評価値との差分、および、シミュレーテッドアニーリングにおける温度に基づいて、遷移確率を計算する。そして、遷移判定部４は、その遷移確率に基づいて、現在の状態から最良状態に遷移させるか否かを判定する。

　状態遷移部５は、現在の状態から最良状態に遷移させると判定された場合に、現在の状態を最良状態に状態を遷移させる。この動作によって、現在の状態が変化する。

　温度制御部６は、シミュレーテッドアニーリングにおける温度を、シミュレーテッドアニーリングにおけるループ処理の回数に応じて変化させる。より具体的には、温度制御部６は、シミュレーテッドアニーリングにおけるループ処理の回数が増加するほど、温度を低下させる。

　近傍状態生成部１、評価値計算部２、最良状態選択部３、遷移判定部４、状態遷移部５、および、温度制御部６は、例えば、求解プログラムに従って動作するコンピュータのＣＰＵ（Central Processing Unit ）によって実現される。例えば、ＣＰＵが、コンピュータのプログラム記憶装置等のプログラム記録媒体から求解プログラムを読み込み、その求解プログラムに従って、近傍状態生成部１、評価値計算部２、最良状態選択部３、遷移判定部４、状態遷移部５、および、温度制御部６として動作すればよい。

　次に、処理経過について説明する。図４は、本実施形態の処理経過の例を示すフローチャートである。既に説明した事項については、詳細な説明を省略する。ＱＵＢＯの評価値関数（エネルギー関数）は予め求解装置１０に入力されているものとする。また、本例では、図２に例示する場合と同様に、１番目から４番目までの近傍状態を求める場合を例にするが、最後の近傍状態は４番目の近傍状態に限定されない。

　まず、温度制御部６は、シミュレーテッドアニーリングにおける温度を初期値に設定する（ステップＳ１）。

　次に、近傍状態生成部１は、ｋの値を１に初期化する（ステップＳ２）。ｋは、生成される近傍状態が何番目の近傍状態かを示す変数である。

　次に、近傍状態生成部１は、ｋ番目の近傍状態を求め、その近傍状態に遷移したとみなす（ステップＳ３）。最初にステップＳ３を実行するときには、ｋ＝１である。よって、近傍状態生成部１は、現在の状態から一部のスピンの値を変化させることによって、現在の状態の近傍状態（１番目の近傍状態）を求め、その近傍状態に遷移したものとみなす。

　次に、評価値計算部２は、直近のステップＳ３で得られたｋ番目の近傍状態の評価値を計算する（ステップＳ４）。

　そして、近傍状態生成部１は、４番目の近傍状態まで得られたか否かを判定する（ステップＳ５）。

　４番目の近傍状態まで得られていない場合（ステップＳ５のＮｏ）、近傍状態生成部１は、ｋの値を１インクリメントする（ステップＳ６）。

　ステップＳ６の後、ステップＳ３以降の処理を繰り返す。２回目以降のステップＳ３の処理では、ｋ－１番目の近傍状態から一部のスピンの値を変化させることによって、「ｋ－１番目の近傍状態」の近傍状態（ｋ番目の近傍状態）を求め、その近傍状態に遷移したものとみなす。

　４番目の近傍状態まで得られている場合（ステップＳ５のＹｅｓ）、最良状態選択部３は、１番目から４番目までの近傍状態の中から最良状態を選択する（ステップＳ７）。すなわち、最良状態選択部３は、１番目から４番目までの近傍状態の中から、評価値が最小となっている近傍状態を最良状態として選択する。

　ステップＳ７の次に、遷移判定部４は、現在の状態の評価値とステップＳ７で選択された最良状態の評価値の差分、および、シミュレーテッドアニーリングにおける温度に基づいて、遷移確率を計算する（ステップＳ８）。そして、遷移判定部４は、その遷移確率に基づいて、現在の状態から最良状態に遷移させるか否かを判定する（ステップＳ９）。

　現在の状態から最良状態に遷移させると判定された場合（ステップＳ９のＹｅｓ）、状態遷移部５は、現在の状態を最良状態に遷移させる（ステップＳ１０）。ステップＳ１０により、現在の状態が変化する。

　ステップＳ１０の後、ステップＳ１１に移行する。また、現在の状態から最良状態に遷移させないと判定された場合（ステップＳ９のＮｏ）には、ステップＳ１０を実行せずに、ステップＳ１１に移行する。

　ステップＳ１１では、温度制御部６は、シミュレーテッドアニーリングにおける温度を所定値だけ減少させる。

　ステップＳ２～Ｓ１１のループ処理がシミュレーテッドアニーリングにおけるループ処理である。例えば、このループ処理を所定回数実行した時点で得られている状態を、組合せ最適化問題における解に該当する状態としてもよい。

　本実施形態において、近傍状態生成部１は、現在の状態の近傍となる状態を求め、その状態に遷移したものとみなす。その後、近傍状態生成部１は、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す。すなわち、近傍状態生成部１は、現在の状態を起点として、連鎖的に近傍状態を求める。そして、最良状態選択部３は、得られた個々の近傍状態の中から最良状態を選択する。そして、遷移判定部４が、現在の状態から最良状態に遷移させるか否かを判定し、現在の状態から最良状態に遷移させると判定された場合に、状態遷移部５が現在の状態を最良状態に遷移させる。従って、最良状態は、現在の状態の近傍状態だけでなく、現在の状態を起点として、連鎖的に求められた複数の近傍状態の中から選択される。よって、本実施形態では、局所解から他の局所解に遷移しやすく、組合せ最適化問題の最適解を高速に求めることができる。

実施形態２．
　本発明の第２の実施形態の求解装置の構成例は、図１と同様に表すことができる。よって、図１を参照して第２の実施形態を説明する。また、第２の実施形態でも、ＱＵＢＯが適用される場合を例にして説明する。また、第１の実施形態と同様の事項については、説明を省略する。

　第２の実施形態は、特許文献２に類似した技術を適用した実施形態である。

　本実施形態では、スピンの値が４行４列に並んだ状態を例にして説明する。そして、各行のスピンの組にはそれぞれ、one-hot 制約が予め定めされているものとする。同様に、各列のスピンの組にもそれぞれ、one-hot 制約が予め定めされているものとする。すなわち、８個の組に対して、one-hot 制約が定められているものとする。

　第１の実施形態と同様に、近傍状態生成部１は、現在の状態から一部のスピンの値を変化させることによって、現在の状態の近傍となる状態を求め、その状態に遷移したものとみなす。その後、さらに、近傍状態生成部１は、遷移したとみなした状態から一部のスピンの値を変化させることによってその遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す。第１の実施形態と同様に、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す回数が固定値であるものとする。従って、１番目から所定番目までの近傍状態が得られる。

　ただし、近傍状態生成部１は、近傍となる状態を求めるときに、スピンを選択して、そのスピンが属する組を選択する。選択したスピンが属する組が複数存在する場合には、近傍状態生成部１は、その複数の組の中から１つの組を選択する。近傍状態生成部１は、選択した組が予め定められた制約を満たしている場合に、その組がその制約を満たした状態を維持するように、選択したスピンを含む１つ以上のスピンの値を変化させる。

　また、近傍状態生成部１は、近傍となる状態を求めるときに、制約が満たされていないスピンの組が存在する場合には、その組が制約を満たす状態に近づくように、スピンを選択し、そのスピンの値を変化させる。

　図５は、第２の実施形態における現在の状態、および、連鎖的に求められた複数の近傍状態の例を示す模式図である。図５に示す例では、現在の状態が全ての制約（８個のone-hot 制約）を満たしている場合を例示しているが、現在の状態において、一部または全部のone-hot 制約が満たされていなくてもよい。また、図５では、１番目から５番目の近傍状態までを求める場合を例示している。ただし、何番目の近傍状態まで求めるかは、特に限定されない。

　近傍状態生成部１が、現在の状態の近傍状態（１番目の近傍状態）を求めるときに、第１行第１列のスピンを選択し、そのスピンが属する組として、第１行のスピンの組を選択したとする。第１行のスピンの組はone-hot 制約を満たしているので、近傍状態生成部１は、第１行のスピンの組がone-hot 制約を満たした状態を維持するように、第１行第１列のスピンの値、および、第１行第３列のスピンの値をそれぞれ変化させる。この結果、近傍状態生成部１は、１番目の近傍状態を得て、その近傍状態に遷移したものとみなす（図５参照）。

　１番目の近傍状態では、第１列のスピンの組で、one-hot 制約が満たされていない状態になっている。近傍状態生成部１は、第１列のスピンの組がone-hot 制約を満たす状態に近づくように、例えば、第３行第１列のスピンを選択し、そのスピンの値を変化させる。この結果、近傍状態生成部１は、２番目の近傍状態を得て、その近傍状態に遷移したものとみなす（図５参照）。

　２番目の近傍状態では、第３列のスピンの組で、one-hot 制約が満たされていない状態になっている。近傍状態生成部１は、第３列のスピンの組がone-hot 制約を満たす状態に近づくように、例えば、第２行第３列のスピンを選択し、そのスピンの値を変化させる。この結果、近傍状態生成部１は、３番目の近傍状態を得て、その近傍状態に遷移したものとみなす（図５参照）。

　３番目の近傍状態では、第２行のスピンの組で、one-hot 制約が満たされていない状態になっている。近傍状態生成部１は、第２行のスピンの組がone-hot 制約を満たす状態に近づくように、例えば、第２行第２列のスピンを選択し、そのスピンの値を変化させる。この結果、近傍状態生成部１は、４番目の近傍状態を得て、その近傍状態に遷移したものとみなす（図５参照）。

　４番目の近傍状態では、第２列のスピンの組で、one-hot 制約が満たされていない状態になっている。近傍状態生成部１は、第２列のスピンの組がone-hot 制約を満たす状態に近づくように、例えば、第３行第２列のスピンを選択し、そのスピンの値を変化させる。この結果、近傍状態生成部１は、５番目の近傍状態を得て、その近傍状態に遷移したものとみなす（図５参照）。

　５番目の近傍状態では、全ての制約（８個のone-hot 制約）を満たしている。ただし、１番目から５番目までの近傍状態の中に、全ての制約を満たした近傍状態が含まれていなくてもよい。

　また、本例のように、制約が複数存在する場合に、近傍状態生成部１が近傍状態を求めるとする。この場合、近傍状態生成部１は、満たされる制約の数が最も増加するように、値を変化させるスピンを選択してもよい。

　また、最後の近傍状態（本例では、５番目の近傍状態）を求めるまでの過程において、全ての制約が満たされている近傍状態から、少なくとも一部の組において制約が満たされていない近傍状態に遷移したとみなすことがあってもよい。

　評価値計算部２、最良状態選択部３、遷移判定部４、状態遷移部５および温度制御部６の動作は、第１の実施形態における評価値計算部２、最良状態選択部３、遷移判定部４、状態遷移部５および温度制御部６の動作と同様であり、説明を省略する。

　第２の実施形態においても、最良状態は、現在の状態を起点として、連鎖的に求められた複数の近傍状態の中から選択される。よって、本実施形態では、局所解から他の局所解に遷移しやすく、組合せ最適化問題の最適解を高速に求めることができる。

　次に、本発明の各実施形態の変形例を説明する。

　第１の実施形態および第２の実施形態では、ＱＵＢＯが適用される場合を示したが、イジングモデルが適用されてもよい。この場合、イジングモデルの評価値関数（エネルギー関数）が本発明の求解装置１０に入力される。そして、評価値計算部２は、その評価値関数を用いて、個々の近傍状態それぞれに関して、近傍状態に対応する評価値を計算すればよい。

　また、第１の実施形態および第２の実施形態において、ＱＵＢＯやイジングモデルが適用されなくてもよい。この場合、本発明の求解装置１０には、ＱＵＢＯまたはイジングモデルのエネルギー関数以外の評価値関数が入力される。ＱＵＢＯやイジングモデルが適用されない場合、シミュレーテッドアニーリングでは、評価値が最大または最小となる状態が最適解として求められる。前述のように、評価値が最大となる状態を求めるか、または、評価値が最小となる状態を求めるかは、組合せ最適化問題に依存する。

　評価値が最大となる状態を求める場合、最良状態選択部３は、個々の近傍状態（遷移したとみなした個々の状態）の中から、近傍状態に対応する評価値が最大になる近傍状態を、最良状態として選択する。

　また、評価値が最小となる状態を求める場合、最良状態選択部３は、個々の近傍状態（遷移したとみなした個々の状態）の中から、近傍状態に対応する評価値が最小になる近傍状態を、最良状態として選択する。

　また、第１の実施形態および第２の実施形態では、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す回数（以下、繰り返し回数と記す。）が固定値である場合を例にして説明した。シミュレーテッドアニーリングの過程において、近傍状態生成部１は、繰り返し回数を変更してもよい。すなわち、近傍状態生成部１は、１番目から何番目までの近傍状態を求めるのかを、シミュレーテッドアニーリングの過程で変更してよい。

　例えば、近傍状態生成部１は、シミュレーテッドアニーリングにおける温度に基づいて、繰り返し回数を変更してもよい。例えば、近傍状態生成部１は、シミュレーテッドアニーリングにおける温度が閾値（温度と比較される閾値）以下になったときに、繰り返し回数を増加させてもよい。

　また、例えば、近傍状態生成部１は、シミュレーテッドアニーリングにおけるループ処理（例えば、図４に示すステップＳ２～Ｓ１１のループ処理）の回数に基づいて、繰り返し回数を変更してもよい。例えば、近傍状態生成部１は、ループ処理の回数が閾値（ループ処理の回数と比較される閾値）以上になったときに、繰り返し回数を増加させてもよい。

　また、例えば、近傍状態生成部１は、遷移判定部４による判定回数（例えば、ステップＳ９の判定回数）に対する、現在の状態から最良状態に遷移させると判定された回数（例えば、ステップＳ９からステップＳ１０に移行した回数）の割合（以下、受理率と記す。）に基づいて、繰り返し回数を変更してもよい。例えば、近傍状態生成部１は、受理率の回数が閾値（受理率と比較される閾値）以下になったときに、繰り返し回数を増加させてもよい。

　また、第１の実施形態において、近傍状態生成部１は、制約が満たされた近傍状態に遷移したとみなすまで、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなす繰り返し処理を続けてもよい。

　第２の実施形態において、近傍状態生成部１は、複数の全ての制約が満たされた近傍状態に遷移したとみなすまで、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなす繰り返し処理を続けてもよい。

　図６は、本発明の各実施形態の求解装置１０に係るコンピュータの構成例を示す概略ブロック図である。コンピュータ１０００は、ＣＰＵ１００１と、主記憶装置１００２と、補助記憶装置１００３と、インタフェース１００４とを備える。

　本発明の各実施形態の求解装置１０は、コンピュータ１０００によって実現される。求解装置１０の動作は、求解プログラムの形式で補助記憶装置１００３に記憶されている。ＣＰＵ１００１は、その求解プログラムを補助記憶装置１００３から読み出して、主記憶装置１００２に求解プログラムを展開し、その求解プログラムに従って、上記の各実施形態で説明した処理を実行する。

　補助記憶装置１００３は、一時的でない有形の媒体の例である。一時的でない有形の媒体の他の例として、インタフェース１００４を介して接続される磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ（Compact Disk Read Only Memory ）、ＤＶＤ－ＲＯＭ（Digital Versatile Disk Read Only Memory ）、半導体メモリ等が挙げられる。また、プログラムが通信回線によってコンピュータ１０００に配信される場合、配信を受けたコンピュータ１０００がそのプログラムを主記憶装置１００２に展開し、そのプログラムに従って上記の各実施形態で説明した処理を実行してもよい。

　また、各構成要素の一部または全部は、汎用または専用の回路（circuitry ）、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。

　各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

　次に、本発明の概要について説明する。図７は、本発明の求解装置の概要を示すブロック図である。本発明の求解装置は、近傍状態生成手段７１と、最良状態選択手段７３と、遷移判定手段７４と、状態遷移手段７５とを備える。

　近傍状態生成手段７１（例えば、近傍状態生成部１）は、現在の状態の近傍となる状態を求め、その状態に遷移したとみなし、その後、遷移したとみなした状態の近傍となる状態を求め、その遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す。

　最良状態選択手段７３（例えば、最良状態選択部３）は、遷移したとみなされた個々の状態の中から、状態に対応する評価値が最大または最小になる状態を、最良状態として選択する。

　遷移判定手段７４（例えば、遷移判定部４）は、現在の状態から最良状態に遷移させるか否かを判定する。

　状態遷移手段７５（例えば、状態遷移部５）は、現在の状態から最良状態に遷移させると判定された場合に、現在の状態を最良状態に遷移させる。

　そのような構成により、組合せ最適化問題の最適解を高速に求めることができる。

　上記の本発明の各実施形態およびその変形例は、以下の付記のようにも記載され得るが、以下に限定されるわけではない。

（付記１）
　シミュレーテッドアニーリングを実行することによって、組合せ最適化問題の解に相当する状態を求める求解装置であって、
　現在の状態の近傍となる状態を求め、前記状態に遷移したとみなし、その後、遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す近傍状態生成手段と、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最大または最小になる状態を、最良状態として選択する最良状態選択手段と、
　前記現在の状態から前記最良状態に遷移させるか否かを判定する遷移判定手段と、
　前記現在の状態から前記最良状態に遷移させると判定された場合に、前記現在の状態を前記最良状態に遷移させる状態遷移手段とを備える
　ことを特徴とする求解装置。

（付記２）
　イジングモデルの評価値またはＱＵＢＯ（Quadratic Unconstrained Binary Optimization ）の評価値が用いられ、
　前記最良状態選択手段は、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最小になる状態を、最良状態として選択する
　付記１に記載の求解装置。

（付記３）
　前記近傍状態生成手段は、
　現在の状態から一部のスピンの値を変化させることによって前記現在の状態の近傍となる状態を求め、前記状態に遷移したとみなし、その後、遷移したとみなした状態から一部のスピンの値を変化させることによって前記遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す
　付記２に記載の求解装置。

（付記４）
　前記近傍状態生成手段は、
　近傍となる状態を求めるときに、スピンを選択し、前記スピンが属する組を選択し、
　前記組が予め定められた制約を満たしている場合に、前記組が前記制約を満たした状態を維持するように、前記スピンを含む１つ以上のスピンの値を変化させる
　付記３に記載の求解装置。

（付記５）
　前記近傍状態生成手段は、
　近傍となる状態を求めるときに、制約が満たされていないスピンの組が存在する場合には、前記組が制約を満たす状態に近づくように、スピンを選択し、前記スピンの値を変化させる
　付記４に記載の求解装置。

（付記６）
　前記近傍状態生成手段は、
　遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す回数を、シミュレーテッドアニーリングにおける温度に基づいて変更する
　付記１から付記５のうちのいずれかに記載の求解装置。

（付記７）
　前記近傍状態生成手段は、
　遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す回数を、シミュレーテッドアニーリングにおけるループ処理の回数に基づいて変更する
　付記１から付記５のうちのいずれかに記載の求解装置。

（付記８）
　前記近傍状態生成手段は、
　遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す回数を、前記遷移判定手段による判定回数に対する、前記現在の状態から前記最良状態に遷移させると判定された回数の割合に基づいて変更する
　付記１から付記５のうちのいずれかに記載の求解装置。

（付記９）
　コンピュータが、シミュレーテッドアニーリングを実行することによって、組合せ最適化問題の解に相当する状態を求める求解方法であって、
　前記コンピュータが、
　現在の状態の近傍となる状態を求め、前記状態に遷移したとみなし、その後、遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す近傍状態生成処理を実行し、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最大または最小になる状態を、最良状態として選択する最良状態選択処理を実行し、
　前記現在の状態から前記最良状態に遷移させるか否かを判定する遷移判定処理を実行し、
　前記現在の状態から前記最良状態に遷移させると判定された場合に、前記現在の状態を前記最良状態に遷移させる状態遷移処理を実行する
　ことを特徴とする求解方法。

（付記１０）
　イジングモデルの評価値またはＱＵＢＯ（Quadratic Unconstrained Binary Optimization ）の評価値が用いられ、
　前記コンピュータが、前記最良状態選択処理で、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最小になる状態を、最良状態として選択する
　付記９に記載の求解方法。

（付記１１）
　コンピュータに、シミュレーテッドアニーリングを実行させることによって、組合せ最適化問題の解に相当する状態を求めさせる求解プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
　前記コンピュータに、
　現在の状態の近傍となる状態を求め、前記状態に遷移したとみなし、その後、遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す近傍状態生成処理、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最大または最小になる状態を、最良状態として選択する最良状態選択処理、
　前記現在の状態から前記最良状態に遷移させるか否かを判定する遷移判定処理、および、
　前記現在の状態から前記最良状態に遷移させると判定された場合に、前記現在の状態を前記最良状態に遷移させる状態遷移処理
　を実行させるための求解プログラムを記録したコンピュータ読み取り可能な記録媒体。

（付記１２）
　イジングモデルの評価値またはＱＵＢＯ（Quadratic Unconstrained Binary Optimization ）の評価値が用いられ、
　前記コンピュータに
　前記最良状態選択処理で、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最小になる状態を、最良状態として選択させる
　求解プログラムを記録した付記１１に記載のコンピュータ読み取り可能な記録媒体。

　以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

産業上の利用の可能性

　本発明は、組合せ最適化問題の解を求める求解装置に好適に適用される。

　１　近傍状態生成部
　２　評価値計算部
　３　最良状態選択部
　４　遷移判定部
　５　状態遷移部
　６　温度制御部
　１０　求解装置

Claims

　シミュレーテッドアニーリングを実行することによって、組合せ最適化問題の解に相当する状態を求める求解装置であって、
　現在の状態の近傍となる状態を求め、前記状態に遷移したとみなし、その後、遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す近傍状態生成手段と、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最大または最小になる状態を、最良状態として選択する最良状態選択手段と、
　前記現在の状態から前記最良状態に遷移させるか否かを判定する遷移判定手段と、
　前記現在の状態から前記最良状態に遷移させると判定された場合に、前記現在の状態を前記最良状態に遷移させる状態遷移手段とを備える
　ことを特徴とする求解装置。
　イジングモデルの評価値またはＱＵＢＯ（Quadratic Unconstrained Binary Optimization ）の評価値が用いられ、
　前記最良状態選択手段は、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最小になる状態を、最良状態として選択する
　請求項１に記載の求解装置。
　前記近傍状態生成手段は、
　現在の状態から一部のスピンの値を変化させることによって前記現在の状態の近傍となる状態を求め、前記状態に遷移したとみなし、その後、遷移したとみなした状態から一部のスピンの値を変化させることによって前記遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す
　請求項２に記載の求解装置。
　前記近傍状態生成手段は、
　近傍となる状態を求めるときに、スピンを選択し、前記スピンが属する組を選択し、
　前記組が予め定められた制約を満たしている場合に、前記組が前記制約を満たした状態を維持するように、前記スピンを含む１つ以上のスピンの値を変化させる
　請求項３に記載の求解装置。
　前記近傍状態生成手段は、
　近傍となる状態を求めるときに、制約が満たされていないスピンの組が存在する場合には、前記組が制約を満たす状態に近づくように、スピンを選択し、前記スピンの値を変化させる
　請求項４に記載の求解装置。
　前記近傍状態生成手段は、
　遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す回数を、シミュレーテッドアニーリングにおける温度に基づいて変更する
　請求項１から請求項５のうちのいずれか１項に記載の求解装置。
　前記近傍状態生成手段は、
　遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す回数を、シミュレーテッドアニーリングにおけるループ処理の回数に基づいて変更する
　請求項１から請求項５のうちのいずれか１項に記載の求解装置。
　前記近傍状態生成手段は、
　遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す回数を、前記遷移判定手段による判定回数に対する、前記現在の状態から前記最良状態に遷移させると判定された回数の割合に基づいて変更する
　請求項１から請求項５のうちのいずれか１項に記載の求解装置。
　コンピュータが、シミュレーテッドアニーリングを実行することによって、組合せ最適化問題の解に相当する状態を求める求解方法であって、
　前記コンピュータが、
　現在の状態の近傍となる状態を求め、前記状態に遷移したとみなし、その後、遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す近傍状態生成処理を実行し、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最大または最小になる状態を、最良状態として選択する最良状態選択処理を実行し、
　前記現在の状態から前記最良状態に遷移させるか否かを判定する遷移判定処理を実行し、
　前記現在の状態から前記最良状態に遷移させると判定された場合に、前記現在の状態を前記最良状態に遷移させる状態遷移処理を実行する
　ことを特徴とする求解方法。
　イジングモデルの評価値またはＱＵＢＯ（Quadratic Unconstrained Binary Optimization ）の評価値が用いられ、
　前記コンピュータが、前記最良状態選択処理で、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最小になる状態を、最良状態として選択する
　請求項９に記載の求解方法。
　コンピュータに、シミュレーテッドアニーリングを実行させることによって、組合せ最適化問題の解に相当する状態を求めさせる求解プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
　前記コンピュータに、
　現在の状態の近傍となる状態を求め、前記状態に遷移したとみなし、その後、遷移したとみなした状態の近傍となる状態を求め、前記遷移したとみなした状態の近傍となる状態に遷移したとみなすことを繰り返す近傍状態生成処理、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最大または最小になる状態を、最良状態として選択する最良状態選択処理、
　前記現在の状態から前記最良状態に遷移させるか否かを判定する遷移判定処理、および、
　前記現在の状態から前記最良状態に遷移させると判定された場合に、前記現在の状態を前記最良状態に遷移させる状態遷移処理
　を実行させるための求解プログラムを記録したコンピュータ読み取り可能な記録媒体。
　イジングモデルの評価値またはＱＵＢＯ（Quadratic Unconstrained Binary Optimization ）の評価値が用いられ、
　前記コンピュータに
　前記最良状態選択処理で、
　遷移したとみなされた個々の状態の中から、状態に対応する評価値が最小になる状態を、最良状態として選択させる
　請求項１１に記載の求解プログラムを記録したコンピュータ読み取り可能な記録媒体。