JP7319539B2

JP7319539B2 - 組合せ最適化装置、組合せ最適化方法および組合せ最適化プログラム

Info

Publication number: JP7319539B2
Application number: JP2019153418A
Authority: JP
Inventors: 弘敬大島
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-08-26
Filing date: 2019-08-26
Publication date: 2023-08-02
Anticipated expiration: 2039-08-26
Also published as: CN112434398A; US20210065087A1; EP3786815A1; JP2021033657A

Description

本発明は組合せ最適化装置、組合せ最適化方法および組合せ最適化プログラムに関する。

組合せ最適化問題は、現在の社会における様々な分野に存在する。例えば、製造・流通、マーケティングなどの分野では、コストを最小化する要素の組合せが探索される。しかし、組合せ最適化問題は、上記要素に対応する変数の数が増えるにつれて指数関数的に計算時間が増加するため、ノイマン型コンピュータでは解くことが困難な問題として知られている。

このようなノイマン型コンピュータが不得意とする多変数の組合せ最適化問題を解く手法として、計算対象の組合せ最適化問題を、磁性体のスピンの振る舞いを表すモデルであるイジングモデルに置き換えて計算する手法がある。

組合せ最適化問題は、制約条件を含むことがある。例えば、組合せ最適化問題を、最適条件を表すコスト項、および、制約条件を表す制約項の和で定義されるエネルギー関数で表し、シミュレーテッド・アニーリング（疑似焼き鈍し法）などの確率的探索法を用いて解く方法が考えられている。

特開平５－１２０２５２号公報特開２００４－１１０８３１号公報

エネルギー関数が制約項を含む場合、制約違反はエネルギーが増加するように定式化されるため、エネルギー障壁により隣接状態への遷移が滞る。
１つの側面では、本発明は、エネルギー障壁により隣接状態への遷移が滞る状態を解消させる組合せ最適化装置、組合せ最適化方法および組合せ最適化プログラムを提供することを目的とする。

１つの態様では、組合せ最適化装置が提供される。組合せ最適化装置は、記憶部と処理部とを有する。記憶部は、複数の状態変数に対する制約条件を表す項が与えられた第１のエネルギー関数に含まれる複数の状態変数の値を記憶する。処理部は、第１のエネルギー関数の値を最小にする複数の状態変数の値の探索を行う。処理部による探索は、第１のエネルギー関数を用いて行われる第１探索と、第１探索の後、第１のエネルギー関数から制約条件を表す項を除去した第２のエネルギー関数を用いて行われる第２探索と、第２探索の後、第１のエネルギー関数を用いて行われる第３探索とを含む。処理部は、探索における状態遷移の試行で第２探索を実行するか否かを確率的に決定する。

また、１つの態様では、組合せ最適化方法が提供される。
また、１つの態様では、組合せ最適化プログラムが提供される。

１つの側面では、エネルギー障壁により隣接状態への遷移が滞る状態を解消させることができる。

第１の実施の形態の組合せ最適化装置の例を示す図である。第２の実施の形態の組合せ最適化装置のハードウェア例を示す図である。エネルギー関数の例を示す図である。問題の定式化の例を示す図である。問題の定式化の例（続き）を示す図である。組合せ最適化装置の機能例を示す図である。制約条件を表す項の消失例を示す図である。探索の例を示すフローチャートである。探索の例を示す図である。解のエネルギーの例を示す図である。第３の実施の形態の制約条件を表す項の消失例を示す図である。探索の例を示す図である。第４の実施の形態の探索の例を示すフローチャートである。第５の実施の形態の組合せ最適化システムの例を示す図である。組合せ最適化装置の回路構成例を示す図である。探索回路の回路構成例を示す図である。

以下、本実施の形態について図面を参照して説明する。
［第１の実施の形態］
第１の実施の形態を説明する。

図１は、第１の実施の形態の組合せ最適化装置の例を示す図である。
組合せ最適化装置１０は、計算対象の問題を変換したイジングモデルに含まれる複数のスピンに対応する複数の状態変数のそれぞれの値の組合せのうち、エネルギー関数が最小値となるときの各状態変数の値を探索する。エネルギー関数が最小値となるときの各状態変数の値は基底状態に相当する。状態変数は、「バイナリ変数」や「スピンビット」、あるいは、単に「ビット」と呼ばれてもよい。ある効果を最大化する状態を求めたい場合は、エネルギー関数の符号を変えればよい。

ここで、複数の状態変数により表される状態を添え字無しの「ｘ」で表す。イジング型のエネルギー関数Ｅ（ｘ）は、例えば以下の式（１）で定義される。

式（１）で表される二次制約なし二値最適化は、ＱＵＢＯ（Quadratic Unconstraint Binary Optimization）と呼ばれることがある。また、この二次形式は、ＱＵＢＯ形式と呼ばれることがある。

式（１）の右辺第１項は、全状態変数から選択可能な２つの状態変数の全組合せについて、漏れと重複なく、２つの状態変数の値と結合係数との積を積算したものである。ｘ_ｉは、ｉ番目の状態変数である。ｘ_ｊは、ｊ番目の状態変数である。結合係数Ｗ_ｉｊは、ｉ番目の状態変数とｊ番目の状態変数との間の結合の強さ（あるいは、重み）を示す。なお、行列Ｗ＝｛Ｗ_ｉｊ｝について、Ｗ_ｉｊ＝Ｗ_ｊｉ、Ｗ_ｉｉ＝０であることが多い。状態変数ｘ_ｉなどの変数に付加される添え字ｉは、当該変数の識別情報であり、インデックスと呼ばれる。

式（１）の右辺第２項は、全状態変数のそれぞれのバイアス値と状態変数の値との積の総和である。ｂ_ｉは、ｉ番目の状態変数に対するバイアス値を示す。
例えば、イジングモデルにおけるスピンの「－１」は、状態変数の値「０」に対応する。イジングモデルにおけるスピンの「＋１」は、状態変数の値「１」に対応する。

状態変数ｘ_ｉの値が変化して１－ｘ_ｉとなると、状態変数ｘ_ｉの増加分は、δｘ_ｉ＝（１－ｘ_ｉ）－ｘ_ｉ＝１－２ｘ_ｉと表せる。したがって、エネルギー関数Ｅ（ｘ）に対して、状態変数ｘ_ｉのスピン反転に伴うエネルギー変化ΔＥ_ｉは、式（２）で表される。

ｈ_ｉは局所場（ローカルフィールド）と呼ばれ、式（３）で表される。

状態変数ｘ_ｊが変化したときの局所場ｈ_ｉの変化分δｈ_ｉ ^（ｊ）は、式（４）で表される。

組合せ最適化装置１０は、局所場ｈ_ｉを保持し、状態変数ｘ_ｊの値が変化したときに変化分δｈ_ｉ ^（ｊ）をｈ_ｉに加算することで、ビット反転後の状態に対応するｈ_ｉを得る。
組合せ最適化装置１０では、基底状態の探索において、エネルギー変化がΔＥ_ｉとなる状態遷移（状態変数ｘ_ｉの値の変化）を許容するか否かを決定するためにメトロポリス法やギブス法が用いられる。すなわち、組合せ最適化装置１０は、ある状態から当該状態よりもエネルギーの低い他の状態への遷移を探索する近傍探索において、エネルギーが下がる状態だけでなく、エネルギーが上がる状態への遷移を確率的に許容する。例えば、エネルギー変化ΔＥの状態変数の値の変化を受け入れる確率Ａは、式（５）で表される。

ここで、逆温度βは温度Ｔの逆数（β＝１／Ｔ）である。ｍｉｎ演算子は、引数のうちの最小値を取ることを示す。したがって、例えば、メトロポリス法を用いる場合、一様乱数ｕ（０＜ｕ≦１）に対して、エネルギー変化ΔＥが式（６）を満たす場合に、該当の状態変数の値の変化が許容される。

組合せ最適化装置１０は、変化が許容された何れかの状態変数の値を変化させる。組合せ最適化装置１０は、シミュレーテッド・アニーリングなどの確率的探索法により、温度Ｔを初期温度から最低の温度まで下げながら、各温度において状態変数の値を変化させる試行を繰り返し実行することで、組合せ最適化問題に対する解を求める。ある１回の試行において、状態変数の値が変化されないこともある。

組合せ最適化問題は、エネルギー関数はコスト項および制約項の和で定式化されることがある。コスト項は最適化対象の条件を表す。制約項は制約条件を表す。制約項はペナルティ項と呼ばれることもある。一例として、巡回セールスマン問題におけるエネルギー関数Ｅ（ｘ）＝コスト項Ｄ（ｘ）＋制約項Ｃ（ｘ）を考える。１人のセールスマンの移動距離を最小化する。コスト項Ｄ（ｘ）はセールスマンの移動距離を表す。制約項Ｃ（ｘ）は、１人のセールスマンが、１つの時点では１つの都市にしかいないといった制約や、ある都市は１度しか通らないといった制約を表す。コスト項Ｄ（ｘ）および制約項Ｃ（ｘ）は、それぞれ状態変数の二次式で定式化できる。エネルギー関数Ｅ（ｘ）＝Ｄ（ｘ）＋Ｃ（ｘ）は、式（１）のＱＵＢＯ形式で表される。

組合せ最適化装置１０は、制約項Ｃを含むエネルギー関数Ｅを最小化する状態を探索する。組合せ最適化装置１０は、記憶部１１および処理部１２を有する。
記憶部１１は、例えば、レジスタやＲＡＭ（Random Access Memory）などの揮発性記憶装置である。処理部１２は、例えば、プログラムを実行するＣＰＵ（Central Processing Unit）などのプロセッサである。プロセッサには、複数のプロセッサの集合（マルチプロセッサ）が含まれ得る。処理部１２は、ワイヤードロジックにより演算を行うＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの専用の電子回路でもよい。

記憶部１１は、複数の状態変数に対する制約条件を表す項が与えられた第１のエネルギー関数に含まれる複数の状態変数の値を記憶する。制約条件を表す項は、制約項Ｃ（ｘ）自体であると考えてもよい。あるいは、制約項Ｃ（ｘ）は状態変数の間の制約を示す複数の項を含み得る。このため、制約条件を表す項は、例えば制約項Ｃ（ｘ）に含まれる、ある状態変数の他の状態変数に対する制約を表す項であると考えてもよい。

処理部１２は、第１のエネルギー関数の値を最小にする複数の状態変数の値の探索を行う。処理部１２は、探索の過程で、探索に用いるエネルギー関数を、第１のエネルギー関数から制約条件を表す項を除去した第２のエネルギー関数に、一時的に変更する。すなわち、処理部１２による探索は、第１のエネルギー関数を用いて行われる第１探索と、第１探索の後、第１のエネルギー関数から制約条件を表す項を除去した第２のエネルギー関数を用いて行われる第２探索と、第２探索の後、第１のエネルギー関数を用いて行われる第３探索とを含む。このように、処理部１２は、探索に用いるエネルギー関数を、第１のエネルギー関数から第２のエネルギー関数に一旦変更して探索を継続し、その後、第２のエネルギー関数から第１のエネルギー関数に戻して、探索を継続する。

エネルギー関数の変更の前後において、複数の状態変数の値は、記憶部１１に保持される。例えば、処理部１２は、第１のエネルギー関数を用いた探索により、複数の状態変数の値を更新していく。処理部１２は、エネルギー関数の変更直前の複数の状態変数の値を記憶部１１に格納して保持し、変更直後には保持された複数の状態変数の値から、変更後のエネルギー関数で探索を継続する。処理部１２は、複数の状態変数の値に対応するエネルギー値が収束すると、当該複数の状態変数の値を解として出力する。

例えば、第１のエネルギー関数Ｅ１（ｘ）はＥ１（ｘ）＝Ｄ（ｘ）＋Ｃ（ｘ）である。
第１の例として、除去対象の制約条件を表す項は、制約項Ｃ（ｘ）自体（すなわち、制約条件を表す項の全体）でもよい。その場合、第２のエネルギー関数Ｅ２（ｘ）は、Ｅ２（ｘ）＝Ｄ（ｘ）である。制約項Ｃ（ｘ）が除去されることで、探索の一時期において、複数の状態変数に対する制約項Ｃ（ｘ）の充足が不問になる。言い換えれば、探索の一時期において、制約項Ｃ（ｘ）で示される制約条件全体の充足が不問になる。

第２の例として、除去対象の制約条件を表す項は、制約項Ｃ（ｘ）に含まれる、制約条件を表す複数の項のうちの一部の項でもよい。例えば、除去対象の制約条件を表す項は、ある状態変数の他の状態変数に対する制約を表す項でもよい。その場合、上記の第１のエネルギー関数Ｅ１（ｘ）＝Ｄ（ｘ）＋Ｃ（ｘ）に対して、第２のエネルギー関数Ｅ２（ｘ）は、Ｅ２（ｘ）＝Ｄ（ｘ）＋Ｃ_ｅ（ｘ）である。制約項Ｃ_ｅ（ｘ）は、制約項Ｃ（ｘ）から、一部の変数に関する制約を表す項を除去した制約項である。ある変数に関する制約を表す項が除去されることで、探索の一時期において、当該変数に対する当該制約の充足が不問になる。言い換えれば、探索の一時期において、制約条件の一部分の充足が不問になる。

例えば、制約項Ｃ（ｘ）において、除去候補の項の単位で、該当の項の重みを示すパラメータ（制約項パラメータと称する）を予め付与しておくことが考えられる。処理部１２は、通常は除去候補の項に対する制約項パラメータを非ゼロに設定する。処理部１２は、所定のタイミングで、除去候補の項の制約項パラメータをゼロに設定することで、第１のエネルギー関数Ｅ１（ｘ）から該当の項を除去する。当該所定のタイミングは、例えば、確率的に発生するタイミングでもよいし、周期的に発生するタイミングでもよい。

組合せ最適化装置１０によれば、第１のエネルギー関数の値を最小にする複数の状態変数の値の探索が行われ、探索の過程で、探索に用いるエネルギー関数が、第１のエネルギー関数から制約条件を表す項を除去した第２のエネルギー関数に、一時的に変更される。

これにより、エネルギー障壁により隣接状態への遷移が滞る状態を解消させることができる。具体的には次の通りである。
エネルギー関数が制約項を含む場合、制約違反はエネルギーが増加するように定式化されるため、エネルギー障壁により隣接状態への遷移が滞る。

そこで、組合せ最適化装置１０は、エネルギー関数における制約条件を表す項を一時的に消失させることで、該当の項の制約に対応するエネルギー障壁を消失させて、状態遷移を促すことができる。

図１では、一例として、第１のエネルギー関数Ｅ１（ｘ）＝Ｄ（ｘ）＋Ｃ（ｘ）に対し、上記の第１の例のように第２のエネルギー関数Ｅ２をＥ２＝Ｄ（ｘ）とする場合の探索例が示されている。図１の左側から右側へ向かう方向が時間の正方向を示す。例えば、処理部１２は、第１のエネルギー関数Ｅ１（ｘ）で探索を行い、ある時点で、探索に用いるエネルギー関数を第２のエネルギー関数Ｅ２（ｘ）に変更する。すると、制約項Ｃ（ｘ）に対応するエネルギー障壁が消失するため、第１のエネルギー関数Ｅ１（ｘ）のままでは滞っていた状態遷移が進む。その後、処理部１２は、探索に用いるエネルギー関数を、第１のエネルギー関数Ｅ１（ｘ）に戻して、探索を継続する。こうして、状態遷移を促すことで、より低いエネルギー状態に到達する可能性を高められる。

上記の第２の例の場合も、探索に用いるエネルギー関数を第２のエネルギー関数Ｅ２（ｘ）＝Ｄ（ｘ）＋Ｃ_ｅ（ｘ）に変更することで、第１のエネルギー関数Ｅ１（ｘ）におけるエネルギー障壁を部分的に消失させることができる。その結果、状態遷移が促され、より低いエネルギー状態に到達する可能性を高められる。

［第２の実施の形態］
次に、第２の実施の形態を説明する。
図２は、第２の実施の形態の組合せ最適化装置のハードウェア例を示す図である。

組合せ最適化装置１００は、ＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ（Hard Disk Drive）１０３、画像信号処理部１０４、入力信号処理部１０５、媒体リーダ１０６およびＮＩＣ（Network Interface Card）１０７を有する。これらのハードウェアは、組合せ最適化装置１００のバスに接続される。なお、ＣＰＵ１０１は、第１の実施の形態の処理部１２の一例である。ＲＡＭ１０２またはＨＤＤ１０３は、第１の実施の形態の記憶部１１の一例である。組合せ最適化装置１００は、コンピュータと呼ばれてもよい。

ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。なお、ＣＰＵ１０１は複数のプロセッサコアを含んでもよい。また、組合せ最適化装置１００は複数のプロセッサを有してもよい。以下で説明する処理は複数のプロセッサまたはプロセッサコアを用いて並列に実行されてもよい。また、複数のプロセッサの集合を「マルチプロセッサ」または単に「プロセッサ」と言うことがある。

ＲＡＭ１０２は、ＣＰＵ１０１が実行するプログラムやＣＰＵ１０１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、組合せ最適化装置１００は、ＲＡＭ以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ１０３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、および、データを記憶する不揮発性の記憶装置である。なお、組合せ最適化装置１００は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

画像信号処理部１０４は、ＣＰＵ１０１からの命令に従って、組合せ最適化装置１００に接続されたディスプレイ３１に画像を出力する。ディスプレイ３１としては、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイなど、任意の種類のディスプレイを用いることができる。

入力信号処理部１０５は、組合せ最適化装置１００に接続された入力デバイス３２から入力信号を取得し、ＣＰＵ１０１に出力する。入力デバイス３２としては、マウス・タッチパネル・タッチパッド・トラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、組合せ最適化装置１００に、複数の種類の入力デバイスが接続されていてもよい。

媒体リーダ１０６は、記録媒体３３に記録されたプログラムやデータを読み取る読み取り装置である。記録媒体３３として、例えば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）が含まれる。

媒体リーダ１０６は、例えば、記録媒体３３から読み取ったプログラムやデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、例えば、ＣＰＵ１０１によって実行される。なお、記録媒体３３は可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体３３やＨＤＤ１０３を、コンピュータ読み取り可能な記録媒体と言うことがある。

ＮＩＣ１０７は、ネットワーク３４に接続され、ネットワーク３４を介して他のコンピュータと通信を行うインタフェースである。ＮＩＣ１０７は、例えば、スイッチやルータなどの通信装置とケーブルで接続される。ＮＩＣ１０７は、無線通信を行う通信装置と無線リンクで接続されてもよい。

図３は、エネルギー関数の例を示す図である。
組合せ最適化装置１００は、計算対象の最適化問題を変換したイジングモデルに含まれる複数のスピンに対応する複数のビットのそれぞれの値の組合せのうち、エネルギー関数が最小値となるときの各ビットの値を探索する。イジング型のエネルギー関数Ｅ（ｘ）は、前述の式（１）で表される。図３では、グラフ４０が示されている。グラフ４０は、エネルギー関数Ｅ（ｘ）の例を示す。

グラフ４０の横軸は、状態ｘを示す。ただし、図３では、取り得る状態ｘを便宜的に一次元で表している。グラフ４０の縦軸は、エネルギー関数Ｅ（ｘ）の値を示す。
図４は、問題の定式化の例を示す図である。

ここでは、組合せ最適化問題の一例として、巡回セールスマン問題を挙げる。ただし、組合せ最適化装置１００の機能は、配車ルート問題（ＶＲＰ：Vehicle Rooting Problem）、分子類似性問題および最大カット問題などの他の組合せ最適化問題にも適用可能である。

巡回セールスマン問題において１人のセールスマンが複数の都市を訪問するために要する移動距離を最小化することを考える。当該問題は、次のように、ＱＵＢＯ形式で定式化される。

ここで、都市の数を４とする。都市の識別番号をｉ（ｉは０≦ｉ≦３の整数）とする。セールスマンは、各都市を１回ずつ順番に訪問する。都市を訪問する順番をｔ（ｔは０≦ｔ≦３の整数）とする。この場合、状態ベクトルは、４×４＝１６ビットで表される。

ｔ番目に都市ｉにいない場合、ビットｘ_ｔｉ＝０である。
ｔ番目に都市ｉにいる場合、ビットｘ_ｔｉ＝１である。
ここで、図４の表５０では、都市の識別番号ｉと順番ｔの１６通りの組み合わせに対して、各ビットを次のように表している。すなわち、ｘ_００＝ｘ_０，ｘ_１０＝ｘ_１，…，ｘ_０１＝ｘ_４，…，ｘ_１１＝ｘ_５，…である。これらの等式の右辺の添え字は、式（１）の状態変数ｘの添え字ｉ，ｊに相当する。

都市ｉと都市ｊとの距離をｄ_ｉｊとする。例えば、ｄ_０１＝ｄ_１０＝Ｗ_０５＝Ｗ_１６＝Ｗ_２７＝…である。当該等式におけるＷの添え字は、式（１）の結合係数Ｗの添え字ｉ，ｊに相当する。

総距離Ｄは、式（７）で表される。

総距離Ｄは、最小化対象の量を表す関数であり、コスト項の一例である。
図５は、問題の定式化の例（続き）を示す図である。
表５１は、図４の表５０の各ｘ_ｉに、具体的な値を代入した例である。具体的には、ｘ_０＝ｘ_６＝ｘ_９＝ｘ_１５＝１であり、それ以外のビットは０である。これは、マップ５２に示されるように、都市０、都市２、都市１、都市３と順番に訪問し、都市０に戻ることを示す。

ここで、次のような制約条件がある。すなわち、ある時刻において、セールスマンは１都市にしかいない。また、ある都市は１度しか通らない。これらの制約条件は、ワンホット（One-hot）制約と呼ばれることがある。

ある時刻において、セールスマンは１都市にしかいないという制約は、式（８）で表される。

制約に違反した場合に値が増大し、かつ、負数となることを避けるため、式（８）を式（９）のように変形する。

ある時刻において、セールスマンは１都市にしかいないという制約が全ての時刻で成立することを考慮して、式（１０）を得る。

ある都市は１度しか通らないという制約は、式（１１）で表される。

制約に違反した場合に値が増大し、かつ、負数となることを避けるため、式（１１）を式（１２）のように変形する。

ある都市は１度しか通らないという制約が全ての都市で成立することを考慮して、式（１３）を得る。

この場合、制約条件を表す制約項（ペナルティ項）Ｃは、式（１０）の左辺、および、式（１３）の左辺の重み付き和で表される。
したがって、上記の巡回セールスマン問題は、下記のエネルギー関数Ｅを最小化する状態ベクトルを求める問題として定式化される。

ここで、コスト項Ｄは、式（７）で表される。制約項Ｃは、式（１５）で表される。

ここで、係数α，βは、制約項Ｃにおける各項の重みを示す正のパラメータである。
組合せ最適化装置１００は、このように制約条件を表す項（例えば、制約項Ｃ）が与えられたエネルギー関数Ｅを最小化する解の探索を効率的に実行する機能を提供する。

図６は、組合せ最適化装置の機能例を示す図である。
組合せ最適化装置１００は、探索部１１０を有する。例えば、ＣＰＵ１０１は、ＲＡＭ１０２に記憶された組合せ最適化プログラム１２０を実行することで、探索部１１０の機能を発揮する。

探索部１１０は、シミュレーテッド・アニーリングなどの確率的探索法を用いて、組合せ最適化問題に対応するエネルギー関数を最小にする状態（最適解）を探索する。例えば、探索部１１０は、最適解の探索に、レプリカ交換法や交換モンテカルロ法などの拡張アンサンブル法を用いてもよい。

イジングモデルの状態は、ＲＡＭ１０２に記憶された状態ベクトル１２１で表される。状態ベクトル１２１のうちの１ビットを変化させることを、１回の状態遷移とする。また、状態ベクトル１２１のうちの１ビットを変化させるための試行は、基底状態探索の１回の試行に相当し、１イタレーションと呼ばれることがある。なお、１回の試行に対してビット遷移が起こらないこともある。

探索部１１０は、最適解の探索の過程で、ＨＤＤ１０３に記憶された確率ＤＢ１３０に基づいて、エネルギー関数に含まれる、制約条件を表す項を除去する。制約条件を表す項を除去することは、制約条件を表す項を消失させることとも言える。第２の実施の形態の例では、制約条件を表す項は、制約項全体である。すなわち、探索部１１０は、制約項全体を除去対象とする。

ここで、式（１５）は、式（１６）のように表せる。

制約項パラメータＰは、制約項Ｃにおける各項全体の重みを表す。制約項パラメータＰは、非ゼロ（Ｐ≠０）の値、または、ゼロ（Ｐ＝０）をとる。制約項パラメータＰの非ゼロの値は、問題に応じて定められる。最小エネルギーの状態を探索する場合、非ゼロのＰは、Ｐ＞＞０（比較的大きな正の値）である。探索部１１０は、エネルギー関数Ｅを示す式（１４）に対して、制約項Ｃを除去しない場合にはＰ≠０とし、制約項Ｃを除去する場合にはＰ＝０とする。

確率ＤＢ１３０は、探索部１１０により制約条件を表す項を消失させるタイミングを決定するための確率を示す情報である。確率ＤＢ１３０の少なくとも一部のデータは、ＲＡＭ１０２に格納されてもよい。確率ＤＢ１３０は、ユーザにより組合せ最適化装置１００に入力され、ＨＤＤ１０３に予め格納される。

例えば、探索部１１０は、確率ＤＢ１３０に基づいて、ｎ_ｋ回目の試行でＰ＝０とし、それ以外の試行ではＰ＞＞０とする。探索部１１０は、ｎ_ｋ＝ｎ_０，ｎ_１，ｎ_２，…を、確率ＤＢ１３０で示される確率に基づいて、確率的にランダムに求める。例えば、確率ＤＢ１３０が確率１／１００を示す場合、探索部１１０は、１００回の試行のうちの１回程度の頻度でＰ＝０とし、それ以外の試行でＰ≠０とする。

なお、ある回数のうちの所定割合の回数だけ真とし、それ以外の回数では偽とする演算は、例えば、疑似乱数を用いて実行される。一例として、確率１／１００で真と判定する場合を考える。ここでいう「真」は、制約条件を表す項を消失させることを意味する。この場合、探索部１１０は、各試行の直前において、例えば０．０１～１の範囲で、０．０１刻みで疑似乱数を発生させ、発生した疑似乱数が１の場合に真、０．０１～０．９９の場合に偽とすることが考えられる。

図７は、制約条件を表す項の消失例を示す図である。
図７（Ａ）は、制約条件を表す項を消失させない場合を例示する。
系列４１は、組合せ最適化問題に対応する制約項を含む第１のエネルギー関数を示す。系列４２は、当該エネルギー関数から制約項を除去した第２のエネルギー関数を示す。あるタイミングで利用されているエネルギー関数を実線で、利用されていないエネルギー関数を点線で示す（以降の図でも同様に示すことがある）。何れのエネルギー関数に対しても、横軸が状態を示し、縦軸（ただし、図示を省略している）がエネルギー関数の値を示す。なお、横軸では、説明を簡略化するために、２ビットで表される状態を示している。

第１のエネルギー関数では、One-hot制約によって、系列４１で示されるように状態（１，１）や（０，０）に高いエネルギー障壁が存在する。
図７（Ａ）において、ｎ－１回目の試行後には、状態（０，１）に相当する局所解に陥っている。その後、ｎ回目、ｎ＋１回目と状態遷移を試みても、第１のエネルギー関数におけるエネルギー障壁に阻まれて、２ビット先の状態（例えば、より低エネルギーの状態（１，０））に遷移することができず、同じ状態（０，１）に滞留している。このように、制約項を含む第１のエネルギー関数では、局所解から脱出する可能性が低くなることがある。

図７（Ｂ）は、探索部１１０により、制約条件を表す項を消失させる場合を例示する。探索部１１０は、確率ＤＢ１３０に基づくｎ回目のタイミングで、第１のエネルギー関数における制約項を除去する。

図７（Ｂ）において、ｎ－１回目の試行後には、状態（０，１）に相当する局所解に陥っている。探索部１１０は、ｎ回目の試行では、第１のエネルギー関数における制約項を除去した第２のエネルギー関数を用いる。第２のエネルギー関数では、One-hot制約がなくなり、系列４２で示されるように、系列４１で存在していた状態（１，１）や（０，０）における高いエネルギー障壁が消失している。このため、ｎ回目の試行では状態遷移が促され、例えば、状態が、第２のエネルギー関数において、状態（０，１）よりも低エネルギーの状態（０，０）に遷移する。

探索部１１０は、ｎ＋１回目の試行では、探索に利用するエネルギー関数を第１のエネルギー関数に戻す。例えば、ｎ＋１回目の試行後には、状態（０，０）から、第１のエネルギー関数において、状態（０，０）よりも低エネルギーの状態（１，０）に遷移する。このように、探索部１１０は、第１のエネルギー関数から制約項を一時的に除去することで、制約項に応じたエネルギー障壁の先に存在する状態への遷移を促すことができる。

なお、上記の例では、探索部１１０は、１回分の試行において第２のエネルギー関数を用いるものとしたが、連続した複数回の試行において、一時的に第２のエネルギー関数を用いてもよい。

次に、組合せ最適化装置１００の処理手順を説明する。
図８は、探索の例を示すフローチャートである。
（Ｓ１０）探索部１１０は、エネルギー関数Ｅに対する初期値を設定する。例えば、前述の巡回セールスマン問題に対して、都市間の距離ｄの値、制約項パラメータＰの非ゼロの値、状態ベクトルの初期値、温度の初期値を設定する。なお、式（１４）のエネルギー関数は、式（１）の形式とすることが可能である。その場合、都市間の距離ｄや制約項パラメータＰの値は、結合係数Ｗやバイアスｂに反映される。このため、エネルギー関数として式（１）の形式が用いられる場合、探索部１１０は、結合係数Ｗやバイアスｂの値を設定してもよい。各パラメータの値の情報は、ユーザにより、組合せ最適化装置１００に予め入力される。

（Ｓ１１）探索部１１０は、制約条件を表す項を消失させるか否かを判定する。制約条件を表す項を消失させる場合、ステップＳ１２に処理が進む。制約条件を表す項を消失させない場合、ステップＳ１３に処理が進む。前述のように、探索部１１０は、確率ＤＢ１３０に基づいて、今回の試行で制約条件を表す項を消失させるか否かを確率的に決定する。例えば、確率ＤＢ１３０が確率１／１００を示す場合、探索部１１０は、１００回の試行のうち１回程度の頻度で、制約条件を表す項を消失させると判定する。なお、第１のエネルギー関数から制約条件を表す項を消失させることは、探索に用いるエネルギー関数を、第１のエネルギー関数から第２のエネルギー関数に変更することに相当する。したがって、ステップＳ１１の判定は、基底状態の探索における状態遷移の今回の試行で第２のエネルギー関数を用いるか否かを確率的に決定する処理であると言える。

（Ｓ１２）探索部１１０は、制約項パラメータを消失させる。すなわち、探索部１１０は、制約項パラメータＰをＰ＝０に設定することで、式（１４）のエネルギー関数Ｅに含まれる制約項Ｃを消失させる。あるいは、エネルギー関数Ｅが式（１）の形式で表される場合、探索部１１０は、制約項パラメータＰをＰ＝０に設定した場合の結合係数ＷおよびバイアスｂをＲＡＭ１０２に予め格納しておいてもよい。その場合、探索部１１０は、探索に用いる結合係数Ｗおよびバイアスｂを、Ｐ≠０の場合の結合係数Ｗおよびバイアスｂに代えて、Ｐ＝０の場合の結合係数Ｗおよびバイアスｂに変更してもよい。そして、ステップＳ１４に処理が進む。

（Ｓ１３）探索部１１０は、制約項パラメータを非ゼロの値に設定する。すなわち、探索部１１０は、制約項パラメータＰをＰ≠０に設定することで、式（１４）のエネルギー関数Ｅに含まれる制約項Ｃを維持する。あるいは、エネルギー関数Ｅが式（１）の形式で表される場合、探索部１１０は、探索に用いる結合係数Ｗおよびバイアスｂを、当初の（Ｐ≠０の場合の）結合係数Ｗおよびバイアスｂに設定してもよい。なお、ステップＳ１３の直前においてＰ≠０の場合、探索部１１０は、ステップＳ１３をスキップして、ステップＳ１４に進んでもよい。ステップＳ１３の直前においてＰ＝０の場合、ステップＳ１３を実行することで、探索に用いられるエネルギー関数が当初のエネルギー関数に戻されることになる。

（Ｓ１４）探索部１１０は、状態ベクトル１２１に応じたエネルギー値を、式（１４）または式（１）のエネルギー関数に基づいて計算する。ここで、ステップＳ１４で使用されるエネルギー関数は、ステップＳ１２（Ｐ＝０に設定）またはステップＳ１３（Ｐ≠０に設定）の何れを経由したかに応じて異なることになる。

（Ｓ１５）探索部１１０は、エネルギー値が収束したか否かを判定する。エネルギー値が収束した場合、ステップＳ１７に処理が進む。エネルギー値が収束していない場合、ステップＳ１６に処理が進む。例えば、探索部１１０は、ステップＳ１１～Ｓ１６を所定回数だけ繰り返し実行してもステップＳ１４で計算されるエネルギー値が変化しない場合に、エネルギー値が収束したと判定する。

（Ｓ１６）探索部１１０は、式（５）または式（６）に基づいて、状態ベクトル１２１における任意の１ビットの遷移を試行する。そして、ステップＳ１１に処理が進む。ステップＳ１６で使用されるエネルギー関数は、直前のステップＳ１４で用いられたエネルギー関数と同じものとなる。なお、探索部１１０は、状態遷移の判定に用いられる温度を、所定のイタレーション数毎に下げる。

（Ｓ１７）探索部１１０は、状態ベクトル１２１が最適解に到達したと判断して、最終的に得られた状態ベクトル１２１を出力する。例えば、探索部１１０は、状態ベクトル１２１をディスプレイ３１により表示させてもよいし、状態ベクトル１２１を、ネットワーク３４を介して他のコンピュータに送信してもよい。また、探索部１１０は、最適解を示す状態ベクトル１２１を、組合せ最適化問題の解としてユーザに分かり易いデータに変換して、ディスプレイ３１により表示させてもよいし、当該変換後のデータを、ネットワーク３４を介して他のコンピュータに送信してもよい。

なお、ステップＳ１５において、エネルギー値が収束したと判定されるタイミングで使用されているエネルギー関数は、Ｐ≠０のものでもよいし、Ｐ＝０のものでもよい。エネルギー値が最適解において収束する場合には、Ｐ≠０およびＰ＝０に拘わらず、収束すると考えられるためである。

図９は、探索の例を示す図である。
系列６１は、横軸（時間）で表される時刻ｔ１０～ｔ１６の各時刻において探索に用いられるエネルギー関数を例示する。図９の縦軸（図示を省略している）は、エネルギー関数の値を示す。

例えば、時刻ｔ１０，ｔ１１，ｔ１２では、制約項を含む第１のエネルギー関数が用いられる。時刻ｔ１０，ｔ１１，ｔ１２の探索は、第１の実施の形態の第１探索に相当する。時刻ｔ１３では、制約項を除去した第２のエネルギー関数が用いられる。時刻ｔ１３の探索は、第１の実施の形態の第２探索に相当する。時刻ｔ１４，ｔ１５，ｔ１６では、再び、第１のエネルギー関数が用いられる。時刻ｔ１４，ｔ１５，ｔ１６の探索は、第１の実施の形態の第３探索に相当する。

時刻ｔ１３では、第１のエネルギー関数に含まれる制約項に対応するエネルギー障壁が一時的に消失する。このため、当該エネルギー障壁によって阻まれていた状態遷移が促進される。例えば、仮に、時刻ｔ１２において、第１のエネルギー関数における局所解に陥っていたとしても、時刻ｔ１４では、時刻ｔ１２の状態から、エネルギー障壁を疑似的にトンネリングして、２ハミング距離の先にある、別の状態に遷移する可能性を高められる。トンネリングは、エネルギー障壁のすり抜けを意味する。エネルギー障壁を消失させて、疑似的にトンネリングさせることを、図９では「制約トンネリング」と称している。

図１０は、解のエネルギーの例を示す図である。
グラフ７０は、あるナップザック問題における、計算回数と、到達した解のエネルギー値との関係の例を示す。計算回数はイタレーション数に相当する。グラフ７０の横軸は、計算回数の常用対数値を示す。グラフ７０の縦軸は、到達した解のエネルギー値を示す。

ナップザック問題とは、容量制限のあるナップザックに入れる品物の総価値を最大にする品物の組合せを求める問題である。本例におけるナップザック問題の条件は次の通りである。ナップザック数は１である。ナップザックへの投入候補の品物の数は、２０個である。すなわち、ナップザックに入れる品物の組合せの数は２^２０通りである。品物ｉの価値をｖ_ｉとする。ｖ_１～５＝２４である。ｖ_６～１０＝２３である。ｖ_{１１～１５}＝２２である。ｖ_{１６～２０}＝１８である。品物ｉの重さをｗ_ｉとする。ｗ_１～５＝１５である。ｗ_６～１０＝１４である。ｗ_{１１～１５}＝１３である。ｗ_{１６～２０}＝１２である。ナップザックの容量上限Ｃ_ｊ＝７２である。

グラフ７０には、系列７１，７２が示されている。
系列７１は、比較例であり、制約条件を表す項の除去を行わずに、探索を行った結果を示す。

系列７２は、探索部１１０により、制約条件を表す項を、一時的に除去する処理を加えて探索を行った結果を示す。本例では除去対象となる制約条件を表す項は制約項全体である。ここで、制約項パラメータＰ＝０とする確率を、一例として、１／１００としている。

系列７１，７２を比較すると、系列７２では、系列７１の場合よりも早く、状態のエネルギー値が低下している。また、系列７２では、最終的に到達する解のエネルギー値が、系列７２の場合よりも低くなっている。

系列７１の例は、局所解からの遷移が行われず、局所解から脱出できない可能性が高まることを示す。
系列７２の例は、前述の制約トンネリングによって、局所解から脱出できる可能性が高まり、エネルギー値が最小になる解に到達し易くなることを示す。

このように、組合せ最適化装置１００によれば、エネルギー関数Ｅに含まれる制約項Ｃを一時的に消失させることで、滞っていたビット遷移を促して、最適解に到達させることが可能になる。

［第３の実施の形態］
次に、第３の実施の形態を説明する。前述の第２の実施の形態と相違する事項を主に説明し、共通する事項の説明を省略する。

第２の実施の形態では、除去対象となる制約条件を表す項の例として、制約項全体を示した。一方、除去対象となる制約条件を表す項は、制約項に含まれる一部の項でもよい。第３の実施の形態では、除去対象の制約条件を表す項を、制約項に含まれる一部の項とする例を説明する。

なお、第３の実施の形態の組合せ最適化装置１００のハードウェア例および機能例は、図２，図６で示した例と同様であるため、説明を省略する。ただし、第３の実施の形態では、探索部１１０により次のようにして制約条件を表す項を消失させる点が、第２の実施の形態と異なる。

図１１は、第３の実施の形態の制約条件を表す項の消失例を示す図である。
第３の実施の形態では、式（１４）の制約項Ｃを、式（１７）で表す。

制約項パラメータＰ_ｉｊは、変数ｘ_ｉｊに関する制約の重みを表す。ここで、図４，５で示した巡回セールスマン問題の例に対して、式（１７）のｉは図４の訪問順番ｔに相当し、式（１７）のｊは図４の都市の識別番号ｉに相当する（ただし、式（１７）のｉ，ｊと、図４のｔ，ｊとの対応関係は逆でもよい）。探索部１１０は、ｎ_ｉｊｋ回目の試行で、Ｐ_ｉｊ＝０に設定し、それ以外の場合に、Ｐ_ｉｊ＝Ｐ_０＞＞０に設定する。Ｐ_０は、Ｐ_０＞＞０の定数である。Ｐ_ｉｊおよびＰ_０は、問題に応じて定められる。式（１７）の…で示される項も、Ｐ_ｉｊおよびｅ_ｌを含み得る。

制約項パラメータｅ_ｌは、Ｐ_０ｅ_ｌの項におけるＰ_０の有効・無効を制御する。探索部１１０は、ｎ_ｌ回目の試行で、ｅ_ｌ＝０に設定し、それ以外の場合に、ｅ_ｌ＝１に設定する。

探索部１１０は、ｎ_ｉｊｋ＝ｎ_０００，ｎ_００１，…およびｎ_ｌ＝ｎ_０，ｎ_１，…を、確率的にランダムに決定する。例えば、探索部１１０は、Ｐ_ｉｊおよびｅ_ｌをゼロに設定する確率を同じにしてもよいし、異なる確率にしてもよい。当該確率は、頻度とも言える。探索部１１０は、Ｐ_ｉｊをゼロに設定する確率を、ｅ_ｌをゼロに設定する確率よりも高くしてもよい。あるいは、探索部１１０は、ｅ_ｌをゼロに設定する確率を、Ｐ_ｉｊをゼロに設定する確率よりも高くしてもよい。これらの確率は、確率ＤＢ１３０に予め保持される。

全てのｉ，ｊの組に対して、少なくとも１つのＰ_ｉｊがＰ_ｉｊ≠０、かつ、ｅ_ｌ＝０の場合、全ビット０の状態が式（１７）の制約項を満たす唯一の状態となる。この場合、全ビット０の状態への遷移が促される。

また、全てのｉ，ｊの組に対して、Ｐ_ｉｊ＝０、かつ、ｅ_ｌ＝０の場合、制約項を表す全ての項が消失するので、式（１４）のエネルギー関数から式（１７）の制約項は消失する。これは、制約項全体を除去することに相当する。すなわち、第２の実施の形態の例は、第３の実施の形態の例の特別な場合として表すことができる。

ただし、全ビット０の状態を経由する遷移および制約項全体の消失を期待しない場合、式（１７）において、常にｅ_ｌ＝１としてもよい。
式（１７）のΣ_ｊ（Σ_ｉＰ_ｉｊｘ_ｉｊ－Ｐ_０ｅ_ｌ）^２の項は、例えば、図４，図５で示した巡回セールスマン問題における、ある都市は１度しか通らないという制約条件に対応させることができる。また、式（１７）のΣ_ｉ（Σ_ｊＰ_ｉｊｘ_ｉｊ－Ｐ_０ｅ_ｌ）^２の項は、例えば、図４，図５で示した巡回セールス問題における、ある時刻には１都市にしかいないという制約条件に対応させることができる。したがって、Σ_ｊ（Σ_ｉＰ_ｉｊｘ_ｉｊ－Ｐ_０ｅ_ｌ）^２の項およびΣ_ｉ（Σ_ｊＰ_ｉｊｘ_ｉｊ－Ｐ_０ｅ_ｌ）^２の項のうち、Ｐ_ｉｊｘ_ｉｊの項は、これらの制約条件を表す項の１つであると言える。また、Σ_ｊ（Σ_ｉＰ_ｉｊｘ_ｉｊ－Ｐ_０ｅ_ｌ）^２の項およびΣ_ｉ（Σ_ｊＰ_ｉｊｘ_ｉｊ－Ｐ_０ｅ_ｌ）^２の項のうち、Ｐ_０ｅ_ｌの項も、これらの制約条件を表す項の１つであると言える。

図１１（Ａ）は、探索において制約項全体を一時的に消失させる例を示す。
系列４３は、組合せ最適化問題に対応する制約項を含む第１のエネルギー関数を示す。図１１の説明において第１のエネルギー関数をＥ１と表す。系列４４は、第１のエネルギー関数Ｅ１から制約項全体を除去した第２のエネルギー関数を示す。図１１の説明において第１のエネルギー関数Ｅ１から制約項全体を除去した第２のエネルギー関数をＥ２ａと表す。何れのエネルギー関数に対しても、横軸が状態を示し、縦軸（ただし、図示を省略している）がエネルギー関数の値を示す。なお、横軸では、説明を簡略化するために、２ビットで表される状態を示している。

第１のエネルギー関数Ｅ１では、One-hot制約によって、系列４３で示されるように状態（１，１）や（０，０）に高いエネルギー障壁が存在する。
図１１（Ａ）において、ｎ－１回目の試行後には、状態（０，１）に相当する局所解に陥っている。ｎ回目の試行において、第１のエネルギー関数Ｅ１から制約項全体を除去した第２のエネルギー関数Ｅ２ａが用いられるとする。これにより、状態遷移が促される。ただし、系列４４の例で示されるように、状態（０，０）の先に、第１のエネルギー関数Ｅ１における、より低いエネルギーの状態があるにも拘わらず、第２のエネルギー関数Ｅ２ａにおいてエネルギーが低い方の状態（１，１）の側へ遷移することがある。この場合、例えば、第１のエネルギー関数Ｅ１を用いたｎ＋１回目の試行では、状態（０，１）に再び戻ってしまうことがある。

図１１（Ｂ）は、探索において制約項に含まれる一部の項を一時的に消失させる例を示す。図１１（Ｂ）において、ｎ－１回目の試行後には、状態（０，１）に相当する局所解に陥っている。ｎ回目の試行において、探索部１１０は、第１のエネルギー関数Ｅ１から状態（０，０）に対応する制約のみを除去した第２のエネルギー関数を用いる。図１１の説明において第１のエネルギー関数Ｅ１から一部の制約のみを除去した第２のエネルギー関数をＥ２ｂと表す。系列４５は、第２のエネルギー関数Ｅ２ｂを示す。系列４５では、系列４３における状態（０，０）に対応するピーク４３ａのみが、系列４３から除去されている。これにより、第１のエネルギー関数Ｅ１および第２のエネルギー関数Ｅ２ａを用いた場合よりも、状態（０，０）へ遷移する可能性を高められる。例えば、ｎ回目の試行により、状態（０，０）へ遷移する。

探索部１１０は、ｎ＋１回目の試行では、探索に利用するエネルギー関数を第１のエネルギー関数Ｅ１に戻す。例えば、ｎ＋１回目の試行後には、状態（０，０）から、第１のエネルギー関数Ｅ１において、状態（０，０）よりも低エネルギーの状態（１，０）に遷移する。このように、探索部１１０は、第１のエネルギー関数Ｅ１から制約項に含まれる一部の項を一時的に除去することで、当該一部の項に応じたエネルギー障壁の先に存在する状態への遷移を促すことができる。

なお、上記の例では、探索部１１０は、１回分の試行において第２のエネルギー関数Ｅ２ｂを用いるものとしたが、連続した複数回の試行において、第２のエネルギー関数Ｅ２ｂを用いてもよい。

ここで、探索部１１０は、図８と同様の手順によって、第１のエネルギー関数から制約項に含まれる一部の項を一時的に除去する。この場合、例えば、探索部１１０は、図８のステップＳ１１，Ｓ１２，Ｓ１３の処理を、除去候補の項毎に行う。また、式（１７）で示される制約項Ｃを含むエネルギー関数Ｅを、式（１）の形式で表すこともできる。その場合、制約項パラメータＰ_ｉｊ，ｅ_ｌの値が式（１）の結合係数Ｗおよびバイアスｂに反映される。そこで、探索部１１０は、式（１７）における除去候補の項毎に、当該項を除去した場合の結合係数Ｗおよびバイアスｂを予め求めてＲＡＭ１０２に格納しておいてもよい。その場合、ステップＳ１２，Ｓ１３において、探索部１１０は、使用する結合係数Ｗおよびバイアスｂを、除去対象の項に対応するものに切り替えることで、探索に用いるエネルギー関数を変更してもよい。

探索部１１０は、探索に用いるエネルギー関数を一時的に変更する処理を、当該探索の過程で、複数回行い、ある回と他の回とで除去対象の制約条件を表す項を変更する。これにより、第１のエネルギー関数における複数のエネルギー障壁のそれぞれを、個別のタイミングで消失させることができる。

図１２は、探索の例を示す図である。
系列６２は、横軸（時間）で表される時刻ｔ２０～ｔ２６の各時刻において探索に用いられるエネルギー関数を例示する。図１２の縦軸（図示を省略している）は、エネルギー関数の値を示す。

例えば、時刻ｔ２０，ｔ２２，ｔ２４，ｔ２５では、制約項を含む第１のエネルギー関数が用いられる。時刻ｔ２１，ｔ２３，ｔ２６では、制約項に含まれる一部の項を除去した複数種類の第２のエネルギー関数が用いられる。時刻ｔ２１，ｔ２３，ｔ２６の各回の状態遷移の試行において、除去対象の項は異なっている。

なお、時刻ｔ２０，ｔ２２，ｔ２５の探索は、第１の実施の形態の第１探索に相当する。時刻ｔ２１，ｔ２３，ｔ２６の探索は、第１の実施の形態の第２探索に相当する。時刻ｔ２２，ｔ２４の探索は、第１の実施の形態の第３探索に相当する。時刻ｔ２２の探索は、第１の実施の形態の第１探索および第３探索に相当している。

時刻ｔ２１，ｔ２３，ｔ２６では、第１のエネルギー関数に含まれる制約項の一部の項に対応する各エネルギー障壁が一時的に消失する。このため、当該エネルギー障壁によって阻まれていた状態遷移が促進される。例えば、仮に、時刻ｔ２２において、第１のエネルギー関数における局所解に陥っていたとしても、時刻ｔ２４では、時刻ｔ２２の状態から、制約トンネリングによって、２ハミング距離の先にある、別の状態に遷移する可能性を高められる。

このように、探索部１１０は、第１のエネルギー関数に含まれる制約項の一部の項を一時的に除去することで、滞っていたビット遷移を促して、最適解に到達させることが可能になる。

なお、探索部１１０は、問題に応じて、除去候補の項の単位を、制約項全体とするか、制約項に含まれる一部分の項とするかの選択入力を受け付け、当該選択入力に応じて、除去候補の項の単位を切り替えてもよい。これにより、ユーザは、問題に応じて、適切な探索方法を選択可能になる。

［第４の実施の形態］
次に、第４の実施の形態を説明する。前述の第２，第３の実施の形態と相違する事項を主に説明し、共通する事項の説明を省略する。

第４の実施の形態では、制約項を含む第１のエネルギー関数による探索で、局所解に陥った場合に、第２，第３の実施の形態で例示した制約条件を表す項を消失させる機能を提供する。

第４の実施の形態の組合せ最適化装置１００のハードウェア例および機能例は、図２，図６で示した例と同様であるため、説明を省略する。第４の実施の形態では、探索部１１０により次の手順により制約条件を表す項を消失させる点が、第２，第３の実施の形態と異なる。

図１３は、第４の実施の形態の探索の例を示すフローチャートである。
（Ｓ２０）探索部１１０は、エネルギー関数Ｅに対する初期値を設定する。例えば、前述の巡回セールスマン問題に対して、都市間の距離ｄの値、制約項パラメータＰ（あるいはＰ_ｉｊおよび定数Ｐ_０）の非ゼロの値、状態ベクトルの初期値、温度の初期値を設定する。なお、式（１４）のエネルギー関数は、式（１）の形式とすることが可能である。その場合、都市間の距離ｄや制約項パラメータＰ（あるいは、Ｐ_ｉｊおよびＰ_０ｅ_ｌ）の値は、結合係数Ｗやバイアスｂに反映される。このため、エネルギー関数として式（１）の形式が用いられる場合、探索部１１０は、結合係数Ｗやバイアスｂの値を設定してもよい。各パラメータの値の情報は、ユーザにより、組合せ最適化装置１００に予め入力される。

（Ｓ２１）探索部１１０は、状態ベクトル１２１に応じたエネルギー値を、式（１４）または式（１）のエネルギー関数に基づいて計算する。ステップＳ２１で使用されるエネルギー関数は、制約項における何れの制約項パラメータも非ゼロの値である第１のエネルギー関数となる。

（Ｓ２２）探索部１１０は、局所解に留まっているか否かを判定する。局所解に留まっている場合、ステップＳ２４に処理が進む。局所解に留まっていない場合、ステップＳ２３に処理が進む。例えば、探索部１１０は、ステップＳ２１～Ｓ２３を所定回数だけ繰り返し実行してもステップＳ２１で計算されるエネルギー値が変化しない場合に、局所解に留まっていると判定する。

（Ｓ２３）探索部１１０は、式（５）または式（６）に基づいて、状態ベクトル１２１における１ビットの遷移を試行する。そして、ステップＳ２１に処理が進む。ステップＳ２３で使用されるエネルギー関数は、第１のエネルギー関数となる。なお、探索部１１０は、状態遷移の判定に用いられる温度を、所定のイタレーション数毎に下げる。

（Ｓ２４）探索部１１０は、局所解に対応する収束エネルギー値を変数Ｅ１に設定してＲＡＭ１０２上に保持する。
（Ｓ２５）探索部１１０は、制約条件を表す項を消失させるか否かを判定する。制約条件を表す項を消失させる場合、ステップＳ２６に処理が進む。制約条件を表す項を消失させない場合、ステップＳ２７に処理が進む。前述のように、探索部１１０は、確率ＤＢ１３０に基づいて、今回の試行で制約条件を表す項を消失させるか否かを確率的に決定する。第３の実施の形態のように、制約項に含まれる項を部分的に除去する場合、探索部１１０は、ステップＳ２４の判定を除去候補の項毎に実行する。

（Ｓ２６）探索部１１０は、制約項パラメータを消失させる。すなわち、探索部１１０は、制約項パラメータＰ（あるいは、Ｐ_ｉｊまたはｅ_ｌ）をＰ＝０（Ｐ_ｉｊ＝０またはｅ_ｌ＝０）に設定することで、式（１４）のエネルギー関数Ｅに含まれる制約条件を表す項の少なくとも一部を消失させる。あるいは、エネルギー関数Ｅが式（１）の形式で表される場合、探索部１１０は、該当の制約項パラメータ、または、該当の制約項パラメータの組をゼロに設定した場合の結合係数ＷおよびバイアスｂをＲＡＭ１０２に予め格納しておいてもよい。その場合、探索部１１０は、探索に用いる結合係数Ｗおよびバイアスｂを、該当の制約項パラメータ、または、該当の制約項パラメータの組がゼロの場合の結合係数Ｗおよびバイアスｂに変更してもよい。そして、ステップＳ２８に処理が進む。なお、ステップＳ２５～Ｓ２７は、除去候補の項毎に実行されるため、ステップＳ２５において、一度のタイミングで複数の項が除去されることもある。

（Ｓ２７）探索部１１０は、制約項パラメータを非ゼロの値に設定する。すなわち、探索部１１０は、制約項パラメータＰ（あるいは、Ｐ_ｉｊまたはｅ_ｌ）を非ゼロに設定することで、式（１４）のエネルギー関数Ｅに含まれる制約条件を表す項を維持する。あるいは、エネルギー関数Ｅが式（１）の形式で表される場合、探索部１１０は、探索に用いる結合係数Ｗおよびバイアスｂを、制約項パラメータが何れも非ゼロの場合の結合係数Ｗおよびバイアスｂに設定してもよい。なお、ステップＳ２７の直前において全ての制約項パラメータが非ゼロの場合、探索部１１０は、ステップＳ２７をスキップして、ステップＳ２８に進んでもよい。ステップＳ２７の直前において何れかの制約項パラメータがゼロの場合、ステップＳ２７を実行することで、探索に用いられるエネルギー関数が当初のエネルギー関数に戻されることになる。ただし、ステップＳ２５～Ｓ２７は、除去候補の項毎に実行されるため、ゼロに設定されたある制約項パラメータを非ゼロに設定するタイミングで、別の制約項パラメータをゼロに設定することもある。

（Ｓ２８）探索部１１０は、状態ベクトル１２１に応じたエネルギー値を、式（１４）あるいは式（１）のエネルギー関数に基づいて計算する。ここで、ステップＳ２８で使用されるエネルギー関数は、ステップＳ２６またはステップＳ２７の何れを経由したかに応じて異なることになる。

（Ｓ２９）探索部１１０は、新たな局所解に到達したか否かを判定する。新たな局所解に到達した場合、ステップＳ３１に処理が進む。新たな局所解に到達していない場合、ステップＳ３０に処理が進む。例えば、探索部１１０は、ステップＳ２５～Ｓ３０を所定回数だけ繰り返し実行してもステップＳ２８で計算されるエネルギー値が変化しない場合、新たな局所解に到達したと判定する。

（Ｓ３０）探索部１１０は、式（５）または式（６）に基づいて、状態ベクトル１２１における１ビットの遷移を試行する。そして、ステップＳ２５に処理が進む。ステップＳ３０で使用されるエネルギー関数は、直前のステップＳ２８で用いられたエネルギー関数と同じものとなる。なお、探索部１１０は、状態遷移の判定に用いられる温度を、所定のイタレーション数毎に下げる。

（Ｓ３１）探索部１１０は、新たな局所解に対応する収束エネルギー値を変数Ｅ２に設定してＲＡＭ１０２上に保持する。
（Ｓ３２）探索部１１０は、Ｅ１＝Ｅ２であるか否かを判定する。Ｅ１＝Ｅ２の場合、ステップＳ３３に処理が進む。Ｅ１≠Ｅ２の場合、ステップＳ２３に処理が進む。

（Ｓ３３）探索部１１０は、状態ベクトル１２１が最適解に到達したと判断して、最終的に得られた状態ベクトル１２１を出力する。例えば、探索部１１０は、状態ベクトル１２１をディスプレイ３１により表示させてもよいし、状態ベクトル１２１を、ネットワーク３４を介して他のコンピュータに送信してもよい。また、探索部１１０は、最適解を示す状態ベクトル１２１を、組合せ最適化問題の解としてユーザに分かり易いデータに変換して、ディスプレイ３１により表示させてもよいし、当該変換後のデータを、ネットワーク３４を介して他のコンピュータに送信してもよい。

このように、探索部１１０は、局所解に陥っている可能性がない間は、通常の基底状態探索を行う。そして、探索部１１０は、局所解に陥っている可能性がある場合には、予め指定された制約条件を表す項の消失条件に基づいて、当該項の消失制御を適用する。消失制御には、第２の実施の形態の方法または第３の実施の形態の方法を用いることができる。探索部１１０は、消失制御の適用後にも得られるエネルギー値が同じである場合、最適解に収束したものと判断する。

第４の実施の形態で例示したように、第１のエネルギー関数において局所解に陥っていると判断された場合にのみ、第１のエネルギー関数に含まれる制約条件を表す項の除去を許容することで、局所解に陥っていないときの演算負荷を軽減することができる。

［第５の実施の形態］
次に、第５の実施の形態を説明する。前述の第２～第４の実施の形態と相違する事項を主に説明し、共通する事項の説明を省略する。

第２～第４の実施の形態では、組合せ最適化装置１００におけるＣＰＵ１０１が組合せ最適化プログラム１２０を実行することで、探索部１１０の機能を発揮する例を示した。一方、探索部１１０の機能は、ＦＰＧＡなどの半導体集積回路により実現されてもよい。

図１４は、第５の実施の形態の組合せ最適化システムの例を示す図である。
組合せ最適化システム２０は、組合せ最適化装置２００および情報処理装置２５０を有する。

組合せ最適化装置２００は、組合せ最適化問題に対する解の探索をハードウェアにより高速に実行するアクセラレータとして利用される。組合せ最適化装置２００は、プロセッサ２０１、ＳＲＡＭ（Static RAM）２０２、ＤＲＡＭ（Dynamic RAM）２０３および接続ＩＦ（InterFace）２０４を有する。

プロセッサ２０１は、探索部１１０の処理を実行するＦＰＧＡなどの半導体集積回路である。プロセッサ２０１は、第１の実施の形態の処理部１２の一例である。
ＳＲＡＭ２０２は、状態ベクトルに含まれる２つのビットの組に対応する結合係数Ｗやビット毎のバイアスｂであって、現在の探索に用いられている結合係数Ｗおよびバイアスｂを記憶する。

ＤＲＡＭ２０３は、制約項を含む第１のエネルギー関数に対応する結合係数Ｗおよびバイアスｂと、第１のエネルギー関数から制約条件を表す項を除去した第２のエネルギー関数に対応する結合係数Ｗおよびバイアスｂとを記憶する。

接続ＩＦ２０４は、情報処理装置２５０と接続するためのインタフェースである。
情報処理装置２５０は、ＣＰＵ２５１、ＤＲＡＭ２５２、ＨＤＤ２５３および接続ＩＦ２５４を有する。

ＣＰＵ２５１は、情報処理装置２５０の演算装置であり、組合せ最適化装置２００に対する各種パラメータの入力や、演算開始の指示、組合せ最適化装置２００からの演算結果の取得などを行う。

ＤＲＡＭ２５２は、情報処理装置２５０の主記憶装置であり、ＣＰＵ２５１の処理に用いられる各種のプログラムやデータを記憶する。なお、ＤＲＡＭ２５２は、ＤＲＡＭ２０３に格納される情報を記憶してもよく、ＤＲＡＭ２０３の代用とすることもできる。その場合、組合せ最適化装置２００は、ＤＲＡＭ２０３を有していなくてもよい。

ＨＤＤ２５３は、情報処理装置２５０の補助記憶装置であり、ＣＰＵ２５１の処理に用いられる各種のプログラムやデータを記憶する。
接続ＩＦ２５４は、組合せ最適化装置２００と接続するためのインタフェースである。

図１５は、組合せ最適化装置の回路構成例を示す図である。
プロセッサ２０１は、探索回路２１０、制御回路２２０およびレジスタ２３０を有する。

探索回路２１０は、エネルギー関数が式（１）の形式で表されるイジングモデルの基底状態探索を行う。探索回路２１０は、状態ベクトルにおける何れかの状態変数の値が変化する場合に、複数の状態変数の値とＳＲＡＭ２０２に記憶された結合係数とに基づいて、複数の状態変数の値のそれぞれを次の変化候補とする場合のエネルギーの変化値を計算する。１つの状態変数の値は、前述のように１ビットで表される。探索回路２１０は、設定された温度値と乱数値と複数のエネルギーの変化値とに基づいて、複数の状態変数の何れかの値を変化させる。探索回路２１０は、複数の状態変数の値のそれぞれを次の変化候補とする場合のエネルギーの変化値の計算を並列に実行する。

制御回路２２０は、制約項パラメータが全て非ゼロである第１のエネルギー関数に対応する状態変数の組毎の第１の結合係数をＳＲＡＭ２０２に格納する。制御回路２２０は、探索回路２１０に基底状態探索を開始させる。制御回路２２０は、探索回路２１０による探索の過程で、ＳＲＡＭ２０２に格納された第１の結合係数を、制約項パラメータの少なくとも何れかがゼロである第２のエネルギー関数に対応する状態変数の組毎の第２の結合係数に一時的に変更する。

例えば、データｐ０は、探索回路２１０の探索に用いられる状態変数の組毎の結合係数Ｗおよび状態変数毎のバイアスｂを示す。データｐ０は、ＳＲＡＭ２０２に格納される。データｐ１は、制約有りエネルギー関数である第１のエネルギー関数の第１の結合係数Ｗ１および第１のバイアスｂ１を示す。データｐ２は、制約無しエネルギー関数である第２のエネルギー関数の第２の結合係数Ｗ２および第２のバイアスｂ２を示す。データｐ１，ｐ２は、ＣＰＵ２５１によりＤＲＡＭ２０３に予め格納される。制御回路２２０は、ＤＲＡＭ２０３に格納されたデータｐ１，ｐ２に基づいて、ＳＲＡＭ２０２に格納されているデータｐ０を、データｐ１，ｐ２の何れかに入れ替えることで、探索回路２１０が探索に用いるエネルギー関数を変更する。ただし、データｐ０におけるバイアスｂは、探索回路２１０内に設定される状態変数毎の局所場の計算に用いられる。このため、制御回路２２０は、バイアスｂをＳＲＡＭ２０２に格納せずに、局所場の計算結果を、探索回路２１０内の所定のレジスタに格納してもよい。また、除去候補となる項が複数ある場合、ＤＲＡＭ２０３は、除去候補となる項毎に、当該項を除去した場合のエネルギー関数に対応する結合係数Ｗ２およびバイアスｂ２を保持してもよい。

レジスタ２３０は、状態ベクトルを記憶する。例えば、ＳＲＡＭ２０２およびレジスタ２３０は、第１の実施の形態の記憶部１１の一例である。
図１６は、探索回路の回路構成例を示す図である。

探索回路２１０は、ｎビット（ｎは２以上の整数）の状態ベクトルに対する基底状態探索を行う。各ビットを、整数のインデックスｉ（１≦ｉ≦ｎ）で区別する。
探索回路２１０は、ｈ計算部２ａ１，２ａ２，…，２ａｎ、ΔＥ生成部２ｂ１，２ｂ２，…，２ｂｎ、加算器２ｃ１，２ｃ２，…，２ｃｎ、状態遷移判定部２ｄ１，２ｄ２，…，２ｄｎ、セレクタ部２ｅ、オフセット制御部２ｆおよびＥ計算部２ｇを有する。

図１６では、ｈ計算部２ａ１～２ａｎに対し、ｉ番目のビットに対応することが分かり易い様に「ｈ_ｉ」計算部のように添え字ｉを付して名称を表記している。また、図１６では、ΔＥ生成部２ｂ１～２ｂｎに対し、ｉ番目のビットに対応することが分かり易い様に「ΔＥ_ｉ」計算部のように添え字ｉを付して名称を表記している。

ある探索回路において状態ベクトルに含まれる何れかのビットを反転させるかの判定および判定結果に応じた該当ビットの反転が、当該探索回路による基底状態探索の１回分の試行に相当する。ただし、１回の試行により、ビットの反転が起こらないこともある。当該１回分の試行は繰り返し実行される。１回分の試行の繰り返し回数はイタレーション数と呼ばれる。

ｎ個のビットのうち、ｈ計算部２ａ１、ΔＥ生成部２ｂ１、加算器２ｃ１および状態遷移判定部２ｄ１が１番目のビットに関する演算を行う。また、ｈ計算部２ａ２、ΔＥ生成部２ｂ２、加算器２ｃ２および状態遷移判定部２ｄ２が２番目のビットに関する演算を行う。同様に、「２ａ１」、「２ｂ１」などの符号の末尾の数値ｉがｉ番目のビットに対応する演算を行うことを示す。すなわち、１つの探索回路は、ｈ計算部、ΔＥ生成部、加算器および状態遷移判定部のセットを、ｎ個有する。１つのセットは、１スピンビットに関する演算を行う演算処理回路の一単位であり、「ニューロン」と呼ばれることもある。ｎ個のニューロンが並列に、各ニューロンに対応するビットに関する演算を並列に行うことで、演算の高速化が図られる。

ここで、ＳＲＡＭ２０２およびレジスタ２３０（図１６では図示を省略している）に格納される情報について説明する。
ＳＲＡＭ２０２は、状態ベクトルに含まれるビットのペア毎の結合係数Ｗを記憶する。状態ベクトルのビット数がｎのとき、結合係数の総数は、ｎ^２となる。ＳＲＡＭ２０２は、メモリ回路１ａ１，１ａ２，…，１ａｎを有する。

メモリ回路１ａ１は、結合係数Ｗ_１１～Ｗ_１ｎを記憶する。結合係数Ｗ_１１～Ｗ_１ｎは、１番目のビットに対応するニューロンの演算に用いられる。メモリ回路１ａ２は、結合係数Ｗ_２１～Ｗ_２ｎを記憶する。結合係数Ｗ_２１～Ｗ_２ｎは、２番目のビットに対応するニューロンの演算に用いられる。メモリ回路１ａｎは、Ｗ_ｎ１～Ｗ_ｎｎを記憶する。Ｗ_ｎ１～Ｗ_ｎｎは、ｎ番目のニューロンの演算に用いられる。なお、Ｗ_ｉｉ＝０である。

レジスタ２３０は、状態保持部２３１として用いられる。状態保持部２３１は、探索回路２１０における状態ベクトルを保持する。
以下では、主に、１番目のニューロンに対応するｈ計算部２ａ１、ΔＥ生成部２ｂ１、加算器２ｃ１および状態遷移判定部２ｄ１を例示して説明する。同名の構成であるｈ計算部２ａ２～２ａｎ、ΔＥ生成部２ｂ２～２ｂｎ、加算器２ｃ２～２ｃｎおよび状態遷移判定部２ｄ２～２ｄｎも同様の機能である。

また、ｈ計算部２ａ１、ΔＥ生成部２ｂ１、加算器２ｃ１および状態遷移判定部２ｄ１のセットに対応するビットを自スピンビット、探索回路２１０で演算されるそれ以外のビットを他スピンビットと称する。

メモリ回路１ａ１は、セレクタ部２ｅにより供給されるインデックスｊに対応する結合係数Ｗ_１ｊをｈ計算部２ａ１に出力する。
ｈ計算部２ａ１は、メモリ回路１ａ１から供給される結合係数Ｗ_１ｊを用いて、式（３），（４）に基づく局所場ｈ_１を計算する。例えば、ｈ計算部２ａ１は、前回計算された局所場ｈ_１を保持するレジスタを有し、インデックスｊで示されるビットの反転方向に応じたδｈ_１ ^（ｊ）を、ｈ_１に積算することで、当該レジスタに格納されるｈ_１を更新する。インデックスｊで示されるスピンビットの反転方向を示す信号は、セレクタ部１３ｃからｈ計算部１２ｂ１に供給されてもよい。ｈ_１の初期値は、問題に応じたｂ_１に応じて、式（３）により予め計算され、ｈ計算部２ａ１のレジスタに予め設定される。ｈ計算部２ａ１は、計算した局所場ｈ_１をΔＥ生成部２ｂ１およびＥ計算部２ｇに出力する。

ΔＥ生成部２ｂ１は、局所場ｈ_１を用いて、式（２）に基づき、自スピンビットの反転に応じたイジングモデルのエネルギー変化値ΔＥ_１を生成する。ΔＥ生成部２ｂ１は、例えば、状態保持部２３１から供給される自スピンビットの現在の値から、自スピンビットの反転方向を判別してもよい（現在の値が０なら０から１が反転方向となり、現在の値が１なら１から０が反転方向となる）。ΔＥ生成部２ｂ１は、生成したエネルギー変化値ΔＥ_１を、加算器２ｃ１に出力する。ここで、後段の加算器２ｃ１での加算処理および状態遷移判定部２ｄ１での判定処理に応じて、ΔＥ生成部２ｂ１は、エネルギー変化値ΔＥ１の符号を逆転したエネルギー変化値－ΔＥ_１を、加算器２ｃ１に出力してもよい。本例では、ΔＥ生成部２ｂ１は、エネルギー変化値として、－ΔＥ_１を加算器２ｃ１に出力するものとする。

加算器２ｃ１は、ΔＥ生成部２ｂ１から供給される－ΔＥ_１とオフセット制御部２ｆから供給されるオフセット値Ｅ_ｏｆｆとを加算する。オフセット値Ｅ_ｏｆｆは、後述されるように、状態遷移を促すためのパラメータであり、オフセット制御部２ｆにより制御される。本例では、Ｅ_ｏｆｆ≧０である。Ｅ_ｏｆｆの初期値は０である。Ｅ_ｏｆｆは、オフセット制御部２ｆにより、状態遷移の状況に応じて漸増される。加算器２ｃ１は、加算結果（－ΔＥ_１＋Ｅ_ｏｆｆ）を状態遷移判定部２ｄ１に出力する。

状態遷移判定部２ｄ１は、加算器２ｃ１から供給されるエネルギー変化値とオフセットＥ_ｏｆｆとの和（－ΔＥ_１＋Ｅ_ｏｆｆ）に応じて、自スピンビットの反転可否を示すフラグｆ_１をセレクタ部１３ｃに出力する。具体的には、状態遷移判定部２ｄ１は、－ΔＥ_１＋Ｅ_ｏｆｆと温度に応じた熱ノイズとの比較に応じて、自スピンビットの反転可否を判定する。

ここで、状態遷移判定部２ｄ１による判定について説明する。
シミュレーテッド・アニーリングでは、あるエネルギー変化ΔＥを引き起こす状態遷移の許容確率Ａ（ΔＥ，β）＝ｆ（－βΔＥ）を前述の式（５）のようにメトロポリス法またはギブス法により決定する。前述のように、式（５）においてβは、逆温度（１／Ｔ）である。したがって、Ａ（ΔＥ，β）＝Ａ（ΔＥ，Ｔ）＝ｆ（－ΔＥ／Ｔ）である。温度Ｔは、制御回路２２０により状態遷移判定部２ｄ１に設定される。制御回路２２０は、探索回路２１０による所定のイタレーション数毎に、探索回路２１０に設定する温度Ｔを徐々に下げる。

例えば、許容確率Ａ（ΔＥ，β）でエネルギー変化ΔＥを引き起こす状態遷移を許容することを示すフラグ（ｆｌｇ＝１）を出力する回路は、Ａ＝ｆ（－ΔＥ／Ｔ）と、区間［０，１）の値をとる一様乱数ｕとの比較に応じた値を出力する比較器により実現できる。

ただし、次のような変形を行っても同じ機能を実現可能である。２つの数に同じ単調増加関数を作用させても大小関係は変化しない。したがって、比較器の２つの入力に同じ単調増加関数を作用させても比較器の出力は変わらない。例えば、ｆ（－ΔＥ／Ｔ）に作用させる単調増加関数としてｆ（－ΔＥ／Ｔ）の逆関数ｆ^－１（－ΔＥ／Ｔ）、一様乱数ｕに作用させる単調増加関数としてｆ^－１（－ΔＥ／Ｔ）の－ΔＥ／Ｔをｕとしたｆ^－１（ｕ）を用いることができる。その場合、上記の比較器と同様の機能を有する回路は、－ΔＥ／Ｔがｆ^－１（ｕ）より大きいとき１を出力する回路でよい。更に、温度パラメータＴが正であることから、状態遷移判定部２ｄ１は、－ΔＥがＴ・ｆ^－１（ｕ）以上のとき（あるいは、ΔＥが－（Ｔ・ｆ^－１（ｕ））以下のとき）、ｆｌｇ＝１を出力する回路でよい。

状態遷移判定部２ｄ１は、一様乱数ｕを生成し、一様乱数ｕを上記のｆ^－１（ｕ）の値に変換する変換テーブルを用いて、ｆ^－１（ｕ）の値を生成する。メトロポリス法が適用される場合、ｆ^－１（ｕ）＝ｌｎ（ｕ）である。ギブス法が適用される場合、ｆ^－１（ｕ）＝ｌｎ（ｕ／（１－ｕ））である。したがって、メトロポリス法が適用される場合、式（６）を得る。

変換テーブルは、例えば、状態遷移判定部２ｄ１が有するレジスタに記憶される。状態遷移判定部２ｄ１は、温度パラメータＴと、ｆ^－１（ｕ）との積（Ｔ・ｆ^－１（ｕ））を生成し、－ΔＥ_１＋Ｅ_ｏｆｆと比較する。ここで、Ｔ・ｆ^－１（ｕ）は、熱ノイズに相当する。熱ノイズは、物理学における熱励起エネルギーに対応付けられることもある。状態遷移判定部２ｄ１は、（－ΔＥ_１＋Ｅ_ｏｆｆ）≧Ｔ・ｆ^－１（ｕ）の場合にフラグｆ_１＝１（遷移可）をセレクタ部２ｅに出力する。状態遷移判定部２ｄ１は、（－ΔＥ_１＋Ｅ_ｏｆｆ）＜Ｔ・ｆ^－１（ｕ）の場合にフラグｆ_１＝０（遷移不可）をセレクタ部２ｅに出力する。

状態遷移判定部２ｄ１は、（－ΔＥ_１＋Ｅ_ｏｆｆ）≧Ｔ・ｆ^－１（ｕ）を変形して、温度に対応するノイズ値Ｔ・ｆ^－１（ｕ）を（ΔＥ_１－Ｅ_ｏｆｆ）に加算して得られる評価値と閾値（例えば０）との比較に応じて、遷移可否を示すフラグを出力してもよい。

セレクタ部２ｅは、状態遷移判定部２ｄ１～２ｄｎの各々から出力された遷移可否を示すフラグを受け付ける。セレクタ部２ｅは、状態遷移判定部２ｄ１～２ｄｎの各々から出力されたフラグに遷移可を示すフラグがある場合には、遷移可を示す何れか１つのフラグを選択する。セレクタ部２ｅは、状態遷移判定部２ｄ１～２ｄｎの各々から出力されたフラグに遷移可を示すフラグがない場合には、１つの所定のフラグを選択する。

セレクタ部２ｅは、遷移可否を示すフラグと、選択したフラグに対応するビットを示すインデックスｊとを含む更新信号（ｕｐｄａｔｅ）を状態保持部２３１に出力する。それとともに、セレクタ部２ｅは、選択した遷移可否を示すフラグをオフセット制御部２ｆに出力し、選択したフラグに対応するインデックスｊを、メモリ回路１ａ１～１ａｎの各々に出力する。

オフセット制御部２ｆは、セレクタ部２ｅから出力される遷移可否を示すフラグに基づいて、加算器２ｃ１～２ｃｎの各々に供給するオフセット値を制御する。具体的には、オフセット制御部２ｆは、セレクタ部２ｅから出力されるフラグが遷移可を示す場合、オフセット値を０にリセットする。オフセット制御部２ｆは、セレクタ部２ｅから出力されるフラグが遷移不可を示す場合、オフセット値に増分値ΔＥ_ｏｆｆを加算する。当該フラグが連続して遷移不可を示す場合、オフセット制御部２ｆは、ΔＥ_ｏｆｆを積算することで、Ｅ_ｏｆｆをΔＥ_ｏｆｆずつ増加させる。この方法は、ダイナミックオフセット法と呼ばれる。

セレクタ部２ｅから出力されるフラグが遷移不可を示す場合、現在の状態が局所解に陥っていると考えられる。－ΔＥ_１へのオフセット値の加算や加算するオフセット値の漸増により、状態遷移が許容されやすくなり、現在の状態が局所解にある場合、その局所解からの脱出が促進される。

状態保持部２３１は、セレクタ部２ｅから出力されるフラグとインデックスとに基づいて、状態保持部２３１により保持される状態ベクトル（ｘ_１，ｘ_２，…，ｘ_ｎ）を更新する。状態保持部２３１は、現在の状態ベクトルをＥ計算部２ｇに出力する。状態保持部２３１は、探索回路２１０における探索処理の完了時における状態ベクトルを制御回路２２０に出力する。

Ｅ計算部２ｇは、ｈ計算部２ａ１～２ａｎの各々から出力される局所場ｈ_１～ｈ_ｎおよび状態保持部２３１から出力される状態ベクトル（ｘ_１～ｘ_ｎ）に基づいて、探索回路２１０におけるイジングモデルの現在のエネルギー値を計算する。Ｅ計算部２ｇは、式（１）、（３）に基づき、局所場と状態ベクトルとの積和により、エネルギー値を計算することができる。

制御回路２２０は、探索回路２１０の動作を制御する。制御回路２２０は、情報処理装置２５０から起動信号の入力を受け付けると、ＳＲＡＭ２０２および探索回路２１０に初期パラメータを設定し、探索回路２１０を起動させて、基底状態探索の演算を開始させる。

制御回路２２０は、探索回路２１０による探索の過程において、ＳＲＡＭ２０２に保持される結合係数をＤＲＡＭ２０３に保持される他の結合係数に一時的に入れ替える。また、制御回路２２０は、入れ替えタイミングにおいて状態保持部２３１に保持される状態ベクトルに基づいて、式（３）により入れ替え後のエネルギー関数に対応する各ビットの局所場を計算し、探索回路２１０に設定する。これにより、探索回路２１０の探索に用いられるエネルギー関数が変更される。

例えば、制御回路２２０は、探索開始の直前には、制約項パラメータが全て非ゼロである第１のエネルギー関数に対応するＷを、ＳＲＡＭ２０２に設定する。それとともに、探索回路２１０は、第１のエネルギー関数に対応するｂに応じた各ビットの局所場の初期値をｈ計算部２ａ１～２ａｎに設定する。

制御回路２２０は、探索の過程のあるタイミングで、制約条件を表す項を除去した第２のエネルギー関数に対応するＷ，ｂを、ＤＲＡＭ２０３から読み出して、読み出したＷをＳＲＡＭ２０２に設定する。また、制御回路２２０は、当該タイミングにおいて状態保持部２３１に保持される状態ベクトルとＤＲＡＭ２０３から読み出したｂとを基に各ビットの局所場を計算して、ｈ計算部２ａ１～２ａｎに設定する。

そして、制御回路２２０は、第２のエネルギー関数による１回または複数回の状態遷移の試行を探索回路２１０に行わせると、上記と同様の処理により、ＳＲＡＭ２０２の結合係数Ｗおよび探索回路の局所場ｈを第１のエネルギー関数のものに戻す。

制御回路２２０により、探索に用いられるエネルギー関数を第１のエネルギー関数から第２のエネルギー関数に変更するタイミングは、第２，第３の実施の形態で例示したように、確率的なタイミング、例えば、１００回の試行中の１回程度の頻度などでもよい。また、制御回路２２０は、第４の実施の形態で例示したように、局所解に陥っていると判断される場合に、当該タイミングを計り、探索に用いられるエネルギー関数を第１のエネルギー関数から第２のエネルギー関数に変更するようにしてもよい。

制御回路２２０は、探索回路２１０による演算が終了すると、探索回路２１０から状態ベクトルおよびエネルギー値を取得し、情報処理装置２５０に解として出力する。
情報処理装置２５０は、組合せ最適化装置２００で得られた解を、ユーザにとって分かり易いデータに変換して、情報処理装置２５０に接続されたディスプレイなどの表示装置に表示させたり、他のコンピュータに当該データを送信したりする。

このように、組合せ最適化装置２００によれば、エネルギー関数に含まれる制約を表す項を一時的に消失させることで、滞っていたビット遷移を促して、最適解に到達させることが可能になる。

組合せ最適化装置２００では、状態遷移の促進に、ダイナミックオフセット法と制約トンネリングを併用することもできる。例えば、ダイナミックオフセット法を用いても局所解からの脱出が見込めない場合に、制約トンネリングを利用することで、状態遷移が一層促される。

なお、例えば、レプリカ交換法が用いられる場合、ＳＲＡＭ２０２、探索回路２１０および状態保持部２３１のセットを１つのレプリカとして、組合せ最適化装置２００は複数のレプリカを有してもよい。その場合、制御回路２２０は、各レプリカに対して、異なる温度を設定し、所定のタイミングで、隣接する温度のレプリカで温度、または、ステート情報を確率的に交換する。ステート情報は、状態ベクトルおよび局所場に相当する。交換の確率には、例えば、メトロポリス法に基づく確率が用いられる。また、制御回路２２０は、探索の過程において、当該探索に用いるエネルギー関数を、制約条件を表す項が除去されたエネルギー関数に一時的に変更するために、ＳＲＡＭに保持される結合係数や局所場を入れ替える処理を、各レプリカに対して個別に行う。これにより、組合せ最適化装置２００でレプリカ交換法が用いられる場合にも、エネルギー障壁により隣接状態への遷移が滞る状態を解消させることができる。

なお、第１の実施の形態の情報処理は、処理部１２にプログラムを実行させることで実現できる。ただし、第５の実施の形態で例示したように、処理部１２を専用の電子回路で実現することもできる。また、第２～第４の実施の形態の情報処理は、ＣＰＵ１０１に組合せ最適化プログラム１２０を実行させることで実現できる。組合せ最適化プログラム１２０は、コンピュータ読み取り可能な記録媒体３３に記録できる。

例えば、組合せ最適化プログラム１２０などのプログラムを記録した記録媒体３３を配布することで、プログラムを流通させることができる。また、プログラムを他のコンピュータに格納しておき、ネットワーク経由でプログラムを配布してもよい。コンピュータは、例えば、記録媒体３３に記録されたプログラムまたは他のコンピュータから受信したプログラムを、ＲＡＭ１０２やＨＤＤ１０３などの記憶装置にインストールし、当該記憶装置からプログラムを読み込んで実行してもよい。

１０組合せ最適化装置
１１記憶部
１２処理部
Ｅ１第１のエネルギー関数
Ｅ２第２のエネルギー関数

Claims

複数の状態変数に対する制約条件を表す項が与えられた第１のエネルギー関数に含まれる前記複数の状態変数の値を記憶する記憶部と、
前記第１のエネルギー関数の値を最小にする前記複数の状態変数の値の探索を行う処理部と、
を有し、
前記処理部による前記探索は、前記第１のエネルギー関数を用いて行われる第１探索と、前記第１探索の後、前記第１のエネルギー関数から前記制約条件を表す前記項を除去した第２のエネルギー関数を用いて行われる第２探索と、前記第２探索の後、前記第１のエネルギー関数を用いて行われる第３探索とを含み、
前記処理部は、前記探索における状態遷移の試行で前記第２探索を実行するか否かを確率的に決定する、
ことを特徴とする組合せ最適化装置。
前記第１のエネルギー関数は、除去候補の前記項の重みを表すパラメータを含み、
前記処理部は、前記パラメータを非ゼロの値からゼロに設定することで、前記第１のエネルギー関数を前記第２のエネルギー関数に変更し、前記パラメータをゼロから非ゼロの値に戻すことで、前記第２のエネルギー関数を前記第１のエネルギー関数に変更する、
請求項１記載の組合せ最適化装置。
前記第１のエネルギー関数は、前記制約条件を表す前記項を複数含み、
前記第２のエネルギー関数は、前記第１のエネルギー関数から複数の前記項のうちの一部の項を除去した関数である、
請求項１または２記載の組合せ最適化装置。
前記処理部は、前記探索を複数回行い、ある回と他の回とで除去対象の前記項を変更する、
請求項３記載の組合せ最適化装置。
前記第１のエネルギー関数は、前記制約条件を表す前記項を複数含み、
前記第２のエネルギー関数は、前記第１のエネルギー関数から複数の前記項の全てを除去した関数である、
請求項１または２記載の組合せ最適化装置。
前記処理部は、前記第１探索により局所解に陥った場合に、前記第２探索を実行する、
請求項１乃至５の何れか１項に記載の組合せ最適化装置。
前記記憶部は、前記第１のエネルギー関数に対応する状態変数の組毎の第１の結合係数または前記第２のエネルギー関数に対応する状態変数の組毎の第２の結合係数を記憶し、
前記処理部は、
前記複数の状態変数の何れかの値が変化する場合に、前記複数の状態変数の値と前記記憶部に記憶された前記第１の結合係数または前記第２の結合係数とに基づいて、前記複数の状態変数の値のそれぞれを次の変化候補とする場合のエネルギーの変化値を計算し、設定された温度値と乱数値と複数の前記エネルギーの変化値とに基づいて、前記記憶部に記憶される前記複数の状態変数の何れかの値を変化させる探索回路と、
前記第１の結合係数を前記記憶部に格納し、前記探索回路による前記探索の過程で、前記記憶部に格納された前記第１の結合係数を、前記第２の結合係数に変更する制御回路と、
を有する、
請求項１記載の組合せ最適化装置。
前記第２探索を実行するタイミングは、確率的に発生するタイミング、または、周期的に発生するタイミングであることを特徴とする請求項１記載の組合せ最適化装置。
組合せ最適化装置が、
複数の状態変数を含み、前記複数の状態変数に対する制約条件を表す項が与えられた第１のエネルギー関数の値を最小にする前記複数の状態変数の値の探索を行う組合せ最適化方法において、
前記探索は、前記第１のエネルギー関数を用いて行われる第１探索と、前記第１探索の後、前記第１のエネルギー関数から前記制約条件を表す前記項を除去した第２のエネルギー関数を用いて行われる第２探索と、前記第２探索の後、前記第１のエネルギー関数を用いて行われる第３探索とを含み、
前記探索における状態遷移の試行で前記第２探索を実行するか否かを確率的に決定する、
ことを特徴とする組合せ最適化方法。
複数の状態変数を含み、前記複数の状態変数に対する制約条件を表す項が与えられた第１のエネルギー関数の値を最小にする前記複数の状態変数の値の探索を行う処理をコンピュータに実行させる組合せ最適化プログラムにおいて、
前記探索は、前記第１のエネルギー関数を用いて行われる第１探索と、前記第１探索の後、前記第１のエネルギー関数から前記制約条件を表す前記項を除去した第２のエネルギー関数を用いて行われる第２探索と、前記第２探索の後、前記第１のエネルギー関数を用いて行われる第３探索とを含み、
前記探索における状態遷移の試行で前記第２探索を実行するか否かを確率的に決定する、
ことを特徴とする組合せ最適化プログラム。