JP2018063626A

JP2018063626A - 最適化装置及び最適化装置の制御方法

Info

Publication number: JP2018063626A
Application number: JP2016202332A
Authority: JP
Inventors: ▲高▼津　求; 求 ▲高▼津; Motomu Takatsu
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2016-10-14
Filing date: 2016-10-14
Publication date: 2018-04-19
Anticipated expiration: 2036-10-14
Also published as: JP6465092B2; US10209683B2; US20180107172A1

Abstract

【課題】収束性を損なうことなく計算時間を短縮する。【解決手段】遷移制御部２０が、温度値Ｔと、エネルギー変化値｛−ΔＥi｝と、乱数値とに基づいて、エネルギー変化値｛−ΔＥi｝と熱励起エネルギーとの相対関係によって複数の状態遷移の何れかを受け入れるか否かを確率的に決定する際に、エネルギー変化値｛−ΔＥi｝にオフセット値ｙを加えるとともに、エネルギーが極小となる局所解におけるオフセット値ｙを、エネルギーが極小ではない場合と比較して大きくなるように制御する。【選択図】図１

Description

本発明は、最適化装置及び最適化装置の制御方法に関する。

現在の社会ではあらゆる分野で情報処理が行われている。これらの情報処理はコンピュータ等の演算装置を用いて行われており、様々なデータを演算、加工し、意味のある結果を得ることにより、予測、決定、制御等が行われる。これらの情報処理の１つの分野として最適化処理があり重要な分野となっている。例えばある処理を行う場合に必要な資源やコストを最小化したり、その効果を最大化する解を求める問題等である。これらの問題が非常に重要であるのは明らかであろう。

最適化問題の代表的なものとして線形計画問題がある。これは複数の連続変数の線形和で表される評価関数を、線形和で表される制約条件の下で最大化または最小化する変数の値を求めるものであり、製品の生産計画等様々な分野で利用されている。この線形計画問題には単体法や内点法といった優れた解法が知られており、何十万以上の変数を持つ問題でも効率的に解くことができる。

一方最適化問題には、変数が連続値では無く離散的な値を取るものも多く知られている。例えば、複数の都市を順番に回り元に戻るときの最短経路を求める巡回セールスマン問題や、ナップザックに異なる品物を詰めるときその価値の和が最大となるような組み合わせを求めるナップザック問題等が挙げられる。このような問題は、離散最適化問題、組合せ最適化問題等と呼ばれ、最適解を得るのが非常に難しいことが知られている。

離散最適化問題を解くのが難しい最大の原因は、各変数が離散値しか取れないため、評価関数が改善される方向に変数を連続的に変化させることで最適解に到達させるという手法が使えないことである。そして本来の最適値を与える変数の値（最適解、大域解）以外に、局所的に評価関数の極値を与える値（極小（大）解、局所解）が非常に多数存在することである。このため最適解を確実に得るにはしらみつぶしのような方法を取らざるを得ず、計算時間が非常に長くなる。離散最適化問題には計算量理論でＮＰ（Non-deterministic Polynomial）困難問題と呼ばれる、最適解を求めるための計算時間が問題の大きさ（すなわち変数の数）に対して指数的に増加すると予想される問題が多い。上記巡回セールスマン問題やナップザック問題もＮＰ困難問題である。

以上述べたように、離散最適化問題の最適解を確実に求めることは非常に困難である。このため実用上重要な離散最適化問題にはその問題に固有な性質を利用した解法が考え出されている。上記のように多くの離散最適化問題では厳密解を得るには指数関数的に増大する計算時間がかかると予想されているため、実用的な解法の多くは近似解法であり、最適解ではないものの評価関数の値が最適値に近い値となる解を得ることができるものである。

これらの問題に特化した近似解法に対して、問題の性質を用いることなく解くため広範囲な問題を扱える近似解法も知られている。これらはメタヒューリスティックな解法とよばれ、疑似焼き鈍し法（シミュレーテッド・アニーリング法、ＳＡ法）、遺伝的アルゴリズム、ニューラルネットワーク等が挙げられる。これらの方法は、問題の性質をうまく利用した解法よりは効率が悪い可能性があるが、厳密解を得る解法よりは高速に解を得ることが期待できる。

本発明はこのうち疑似焼き鈍し法に関するものである。
疑似焼き鈍し法はモンテカルロ法の一種であり、乱数値を用いて確率的に解を求める方法である。以下では最適化したい評価関数の値を最小化する問題を例に説明し、評価関数の値をエネルギーと呼ぶことにする。最大化の場合は、評価関数の符号を変えればよい。

各変数に離散値の１つを代入した初期状態からはじめ、現在の状態（変数の値の組み合わせ）から、それに近い状態（例えば１つの変数だけ変化させた状態）を選び、その状態遷移を考える。その状態遷移に対するエネルギーの変化を計算し、その値に応じてその状態遷移を採択して状態を変化させるか、採択せずに元の状態を保つかを確率的に決める。エネルギーが下がる場合の採択確率をエネルギーが上がる場合より大きく選ぶと、平均的にはエネルギーが下がる方向に状態変化が起こり、時間の経過とともにより適切な状態へ状態遷移することが期待できる。そして最終的には最適解または最適値に近いエネルギーを与える近似解を得られる可能性がある。もし、これを決定論的にエネルギーが下がる場合に採択、上がる場合に不採択とすれば、エネルギーの変化は時間に対して広義単調減少となるが、局所解に到達したらそれ以上変化が起こらなくなってしまう。上記のように離散最適化問題には非常に多数の局所解が存在するために、状態が、ほとんど確実にあまり最適値に近くない局所解に捕まってしまう。したがって、採択するかどうかを確率的に決定することが重要である。

疑似焼き鈍し法においては、状態遷移の採択（許容）確率を次のように決めれば、時刻（反復回数）無限大の極限で状態が最適解に到達することが証明されている。
（１）状態遷移に伴うエネルギー変化（エネルギー減少）値（−ΔＥ）に対して、その状態遷移の許容確率ｐを次の何れかの関数ｆ（）により決める。

ここでＴは温度値と呼ばれるパラメータで次のように変化させる。
（２）温度値Ｔを次式で表されるように反復回数ｔに対数的に減少させる。

ここでＴ₀は初期温度値であり問題に応じて十分大きくとることが望ましい。
（１）の式で表される許容確率を用いた場合、十分な反復後に定常状態に達したとすると、各状態の占有確率は熱力学における熱平衡状態に対するボルツマン分布にしたがう。そして、高い温度から徐々に下げていくとエネルギーの低い状態の占有確率が増加するため、十分温度が下がるとエネルギーの低い状態が得られるはずである。この様子が材料を焼き鈍したときの状態変化とよく似ているため、この方法は疑似焼き鈍し法と呼ばれるのである。このとき、エネルギーが上がる状態遷移が確率的に起こることは、物理学における熱励起に相当する。

上記のように疑似焼き鈍し法では、反復回数を無限に取れば最適解が得られるが、現実には有限の反復回数で解を得る必要があるため、最適解を確実に求めることはできない。また上の式では温度の下がり方が非常にゆっくりであるため、有限時間では十分に温度が下がらない。したがって実際の疑似焼き鈍し法では対数的な温度変化ではなくより早く温度を下げることが多い。

図１３に疑似焼き鈍し法による最適化装置の概念的構成を示す。ただし、下記説明では、状態遷移の候補を複数発生させる場合についても述べているが、本来の基本的な疑似焼き鈍し法は遷移候補を１つずつ発生させるものである。

最適化装置１０には、まず現在の状態Ｓ（複数の状態変数の値）を保持する状態保持部１１がある。また、複数の状態変数の値の何れかが変化することによる現在の状態Ｓからの状態遷移が起こった場合の、各状態遷移のエネルギー変化値｛−ΔＥ_i｝を計算するエネルギー計算部１２がある。そして、最適化装置１０には、温度値Ｔを制御する温度制御部１３、状態変化を制御するための遷移制御部１４がある。

遷移制御部１４は、温度値Ｔとエネルギー変化値｛−ΔＥ_i｝と乱数値とに基づいて、エネルギー変化値｛−ΔＥ_i｝と熱励起エネルギーとの相対関係によって複数の状態遷移の何れかを受け入れるか否かを確率的に決定するものである。

遷移制御部１４をさらに細分化すると、遷移制御部１４は、状態遷移の候補を発生する候補発生部１４ａ、各候補に対して、そのエネルギー変化値｛−ΔＥ_i｝と温度値Ｔから状態遷移を許可するかどうかを確率的に決定するための可否判定部１４ｂを有する。さらに、可となった候補から採用される候補を決定する遷移決定部１４ｃ、及び、確率変数を発生させるための乱数発生部１４ｄを有する。

一回の反復における動作は次のようなものである。まず、候補発生部１４ａは、状態保持部１１に保持された現在の状態Ｓから次の状態への状態遷移の候補（候補番号｛Ｎｉ｝）を１つまたは複数発生する。エネルギー計算部１２は、現在の状態Ｓと状態遷移の候補を用いて候補に挙げられた各状態遷移に対するエネルギー変化値｛−ΔＥ_i｝を計算する。可否判定部１４ｂは、温度制御部１３で発生した温度値Ｔと乱数発生部１４ｄで生成した確率変数（乱数値）を用い、各状態遷移のエネルギー変化値｛−ΔＥ_i｝に応じて、上記（１）の式の許容確率でその状態遷移を許容する。そして、可否判定部１４ｂは、各状態遷移の可否｛ｆｉ｝を出力する。許容された状態遷移が複数ある場合には、遷移決定部１４ｃは、乱数値を用いてランダムにそのうちの１つを選択する。そして、遷移決定部１４ｃは、選択した状態遷移の遷移番号Ｎと、遷移可否ｆを出力する。許容された状態遷移が存在した場合、採択された状態遷移に応じて状態保持部１１に記憶された状態変数の値が更新される。

初期状態から始めて、温度制御部１３で温度値を下げながら上記反復を繰り返し、一定の反復回数に達したり、エネルギーが一定の値を下回る等の終了判定条件が満たされたとき、動作が終了する。最適化装置１０が出力する答えは終了時の状態である。ただし、実際には有限の反復回数では温度値が０にならないため、終了時においても状態の占有率はボルツマン分布等で表される分布を持っており、必ずしも最適値やよい解になっているとは限らない。したがって、反復の途中でこれまでに得られたエネルギーが最低の状態を保持し、最後にそれを出力するのが現実的な解法となる。

図１４は候補を１つずつ発生させる通常の疑似焼き鈍し法における遷移制御部、特に可否判定部のために必要な演算部分の構成例の回路レベルのブロック図である。
遷移制御部１４は、乱数発生回路１４ｂ１、セレクタ１４ｂ２、ノイズテーブル１４ｂ３、乗算器１４ｂ４、比較器１４ｂ５を有する。

セレクタ１４ｂ２は、各状態遷移の候補に対して計算されたエネルギー変化値｛−ΔＥ_i｝のうち、乱数発生回路１４ｂ１が生成した乱数値である遷移番号Ｎに対応するものを選択して出力する。

ノイズテーブル１４ｂ３の機能については後述する。ノイズテーブル１４ｂ３として、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ等のメモリを用いることができる。

乗算器１４ｂ４は、ノイズテーブル１４ｂ３が出力する値と、温度値Ｔとを乗算した積（前述した熱励起エネルギーに相当する）を出力する。
比較器１４ｂ５は、乗算器１４ｂ４が出力した乗算結果と、セレクタ１４ｂ２が選択したエネルギー変化値である−ΔＥとを比較した比較結果を遷移可否ｆとして出力する。

図１４に示されている遷移制御部１４は、基本的に前述した機能をそのまま実装するものであるが、（１）の式で表される許容確率で状態遷移を許容するメカニズムについてはこれまで説明していないのでこれを補足する。

許容確率ｐで１を、（１−ｐ）で０を出力する回路は、２つの入力Ａ，Ｂを持ち、Ａ＞Ｂのとき１を出力し、Ａ＜Ｂのとき０を出力する比較器の入力Ａに許容確率ｐを、入力Ｂに区間［０，１）の値をとる一様乱数を入力することで実現することができる。したがってこの比較器の入力Ａに、エネルギー変化値と温度値Ｔにより（１）の式を用いて計算される許容確率ｐの値を入力すれば、上記の機能を実現することができる。

すなわちｆを（１）の式で用いる関数、ｕを区間［０，１）の値をとる一様乱数とするとき、ｆ（ΔＥ／Ｔ）がｕより大きいとき１を出力する回路で、上記の機能を実現できる。

このままでもよいのであるが、次のような変形を行っても同じ機能が実現できる。２つの数に同じ単調増加関数を作用させても大小関係は変化しない。したがって比較器の２つの入力に同じ単調増加関数を作用させても出力は変わらない。この単調増加関数としてｆの逆関数ｆ^-1を採用すると、−ΔＥ／Ｔがｆ^-1（ｕ）より大きいとき１を出力する回路でよいことがわかる。さらに温度値Ｔが正であることから−ΔＥがＴｆ^-1（ｕ）より大きいとき１を出力する回路でよい。図１４中のノイズテーブル１４ｂ３はこの逆関数ｆ^-1（ｕ）を実現するための変換テーブルであり、区間［０，１）を離散化した入力に対して次の関数の値を出力するテーブルである。

遷移制御部１４には、判定結果等を保持するラッチやそのタイミングを発生するステートマシン等も存在するが、図１４では図示を簡単にするため省略されている。
図１５は、従来例における遷移制御部１４の動作フローである。動作フローは、１つの状態遷移を候補として選ぶステップ（Ｓ１）、その状態遷移に対するエネルギー変化値と温度値と乱数値の積の比較で状態遷移の可否を決定するステップ（Ｓ２）、状態遷移が可ならばその状態遷移を採用し、否ならば不採用とするステップ（Ｓ３）を有する。

上記の説明からある程度想像できると思われるが、疑似焼き鈍し法は汎用的で非常に魅力的ではあるが、温度をゆっくり下げる必要があるため計算時間が比較的長くなってしまうという問題がある。さらにその温度の下げ方を問題に合わせて適切に調節することが難しいという問題もある。これは図１６を用いて次のように説明することができる。

初期値から最適解や近似解に至る状態遷移の経路には近似度の良くない局所解が多数存在する。これらの局所解から十分早く脱出するには、十分な熱励起が可能な高い温度が必要となる。しかし高い温度ではボルツマン分布におけるエネルギーの広がりが大きいため、最適解やエネルギーの低いよい近似解（以下ではよい解と呼ぶ）と、エネルギーの比較的高い近似度の悪い局所解（以下悪い解と呼ぶ）の占有確率の差が小さい。このため局所解を速く脱出できても行く先は多数ある悪い解に分散されてしまい、よい解にたどり着く確率は非常に小さい。よい解の占有確率を増やすには、悪い解とのエネルギー差に比べ、熱励起のエネルギーが十分に小さくなるような低温が必要である。しかしこの場合熱励起のエネルギーが小さいため、経路の途中のエネルギーの山を越えることができる確率が非常に低くなってしまい、状態変化がほとんど起こらない。したがって、ある程度山を越えることができ、占有確率に少し差のつけられる中間温度をゆっくりと経過させることで、徐々によい解の占有確率を増やしてゆく必要がある。もし温度の下げ方が遅すぎると有限時間ではあまり温度が下がらないため、最終的によい解の占有確率が上がらない。逆に速く下げすぎると、局所解を脱出する前に温度が下がってしまい、悪い解に捕まったままになってしまう。したがって温度が下がるほどその変化の割合を十分小さくし、その温度におけるボルツマン分布に近づくまで十分待たなければならない。

このように本来の疑似焼き鈍し法では、温度による熱励起だけで局所解からの脱出を図っているため、温度をゆっくり下げる必要があるとともに、それを問題に応じて適切に調節する必要があるという問題がある。

この問題に対して局所解に捕まってしまう問題を温度の調節以外の方法により緩和することが考えられる。例えば、特許文献１，２は、温度の制御方式や評価関数を動的に変更することにより、特許文献３は、状態遷移先である近傍の発生方法を動的に変化させることにより、計算の初期には広範囲の検索、末期には狭い範囲で高精度の検索を行い、計算時間の短縮を図るものである。

これらは、複数の関数を動的に取り換えたり、探索の進み方を把握するために統計を取る等の比較的複雑な演算が必要である。できればもっと簡便で汎用的な方法で計算時間の短縮を可能にすることが望ましい。

特開平６−１９５０７号公報特開平９−３４９５１号公報特開平１０−２９３７５６号公報

H.Zhu et.al., "A Boltzmann Machine with Non-rejective Move,"IEICE Trans. Fundamentals vol.E85-A, No.6. pp.1229-1235, June 2002

上記のように局所解の脱出に長い時間がかかってしまうことが疑似焼き鈍し法の計算時間が長くなる大きな要因である。したがって局所解の脱出を促進する方法があれば、計算時間を大幅に短縮することが可能になると期待される。しかし、ただ単に局所解から脱出させるだけでは必ずしも計算時間が早くなるとは限らない。上記のように悪い解が非常に多数存在するため、ある局所解からランダムに放り出したとしても、周りの悪い解にまた捕まってしまうだけである。単に脱出させるだけではなく、よりよい状態に状態遷移するように脱出させることが望ましい。

よい方向に進むように脱出させるためのヒントは、上記の疑似焼き鈍し法の収束定理にある。この定理はメトロポリス法またはギブス法の状態遷移確率にしたがって状態遷移の可否を決定して行けばよい方向へ進むことを示している。

局所解では状態遷移の確率は非常に小さいため遷移候補の選択は何度も行われ、その後の状態遷移の分岐比はメトロポリス法またはギブス法の遷移確率に比例する。したがって、各状態遷移の許容確率の相対比を保ったままその絶対値を増大することができれば、各状態遷移の分岐比が保たれるため、収束性に悪影響を及ぼすことなく局所解での滞在時間を短縮することが可能となり、計算時間の短縮が可能となる。

本発明が解決しようとする課題は、評価関数や状態遷移発生方法等を動的に変化させることなく、収束性を損なうことなく局所解からの脱出を促進するための手段を得ることであり、より具体的には、局所解における各状態遷移の許容確率の相対比を保ったままその絶対値を増大する手段を得ることである。

非特許文献１はこのような手法の１つである。この文献には記述の誤りがあるものの適切な修正を行えば、上記課題を解決することができる。この手法では、全ての状態遷移に対する許容確率を計算し、その値と指数分布を持つ乱数値の比が最大となる許容確率を採用することで、元の許容確率に比例した割合で採択する状態遷移を選ぶことができる。この方法は、許容確率の相対比を保つとともに、元の状態に留まる確率を０にすることができるため、非常に有効である。しかし、許容確率の計算や乱数値の発生における演算量が大きいという問題がある。

本発明はより簡便な方法で同様の効果、すなわち、収束性を損なうことなく計算時間を短縮できるという効果を得ることを目的とする。

１つの実施態様では、最適化装置は、エネルギーを表す評価関数に含まれる複数の状態変数の値をそれぞれ保持する状態保持部と、前記複数の状態変数の値の何れかが変化することに応じて状態遷移が起こる場合、前記エネルギーの変化値を複数の状態遷移のそれぞれに対して計算するエネルギー計算部と、温度を示す温度値を制御する温度制御部と、前記温度値と前記変化値と乱数値とに基づいて、前記変化値と熱励起エネルギーとの相対関係によって前記複数の状態遷移の何れかを受け入れるか否かを確率的に決定する際に、前記変化値にオフセット値を加えるとともに、前記エネルギーが極小となる局所解における前記オフセット値を、前記エネルギーが極小ではない場合と比較して大きくなるように制御する遷移制御部と、を有する。

また、１つの実施形態では、最適化装置の制御方法が提供される。

一つの側面では、本発明は、収束性を損なうことなく計算時間を短縮できる。

本発明における疑似焼き鈍し法の遷移制御部の構成例を示す図である。本発明における遷移制御部の動作フローを示す図である。第１の実施の形態の最適化装置における遷移制御部の回路構成の一例を示す図である。パルス信号の発生の状態遷移の一例を示す状態遷移図である。パルス信号を発生する論理回路の真理値表の一例を示す図である。パルス信号を発生するステートマシンの一例を示す図である。図３の遷移制御部を用いて実現される疑似焼き鈍し法のソフトウェアシミュレーション結果の一例を示す図である。第２の実施の形態の最適化装置における遷移制御部の回路構成の一例を示す図である。図８の遷移制御部を用いて実現される疑似焼き鈍し法のソフトウェアシミュレーション結果の一例を示す図である。図８の遷移制御部を用いた最適化装置の一例を示す図である。第３の実施の形態の最適化装置における遷移制御部の回路構成の一例を示す図である。図１１の遷移制御部を用いて実現される疑似焼き鈍し法のソフトウェアシミュレーション結果の一例を示す図である。疑似焼き鈍し法による最適化装置の概念的構成を示す図である。従来例における遷移制御部、特に可否判定部のために必要な演算部分の構成例の回路レベルのブロック図である。従来例における遷移制御部の動作フローを示す図である。疑似乱数法における状態の占有確率の概念を示す図である。

図１に本発明で提案する局所解からの脱出を促進する機能を備える疑似焼き鈍し法の遷移制御部の構成例を示す。図１４に示した遷移制御部１４と同じ要素については同一符号が付されている。

図１に示されているように、遷移制御部２０は、図１３に示した可否判定部１４ｂの機能を実現する回路部分に追加された、オフセット加算回路２１とオフセット制御回路２２とを有する。その他の部分は図１４に示した遷移制御部１４と同じである。

オフセット加算回路２１は、状態遷移に伴うエネルギー変化値（−ΔＥ）にオフセット値ｙを加えるオフセット加算回路として機能する。図１の回路の例では、オフセット加算回路２１は、減算器２１ａである。このため、図１の例では、エネルギー変化値（−ΔＥ）にオフセット値ｙを加える代わりに、比較対象である温度値Ｔと乱数値の積Ｔｆ^-1（ｕ）（熱励起エネルギーに相当する）からオフセット値ｙを減ずる構成となっているがどちらでも同じである。

オフセット制御回路２２は、局所解（エネルギーが極小となる解）におけるオフセット値ｙを、局所解ではないときに比べて大きくなるように制御する。図１の例では、オフセット制御回路２２は、リセット端子Ｒを有する累算器２２ａである。累算器２２ａは、リセット端子Ｒに入力される遷移可否ｆが、状態遷移を許容することを示すとき（つまり状態遷移が生じるとき）には、オフセット値ｙを０にする。また、累算器２２ａは、入力端子と、クロック端子を有する。累算器２２ａは、遷移可否ｆが、状態遷移を許容しないことを示すとき（つまり状態遷移が生じないとき）には、クロック端子に図示しないパルス信号が入力される度に、オフセット値ｙに入力端子に入力されるオフセット増分値Δｙを加えていく。

なお、図示しないパルス信号は、例えば、後述するステートマシンによって供給される。オフセット増分値Δｙは、例えば、図示しないレジスタに記憶されている。
このような遷移制御部２０は、セレクタ１４ｂ２により選択されたエネルギー変化値（−ΔＥ）に累算器２２ａに保持されているオフセット値ｙを加えた和である−ΔＥ＋ｙが温度値Ｔと乱数値の積Ｔｆ^-1（ｕ）よりも大きいときその状態遷移を許容する。

そして累算器２２ａは、オフセット値ｙを次のように変化する。もし許容された状態遷移が存在し状態遷移が生じたときは、累算器２２ａは、オフセット値ｙを、０にリセットする。もし許容された遷移が存在せず状態遷移が起こらなかったときは、累算器２２ａは、オフセット増分値Δｙだけオフセット値ｙを増加する。

図２にこの状態遷移の可否判定のための動作フローをまとめる。
動作フローは、１つの状態遷移を候補として選ぶステップ（Ｓ１０）、その状態遷移に対するエネルギー変化値（−ΔＥ）とオフセット値ｙとの和と、温度値Ｔと乱数値の積の比較で状態遷移の可否を決定するステップ（Ｓ１１）を有する。さらに、動作フローは、状態遷移が可ならばその状態遷移を採用し、オフセット値ｙをクリアし、否ならば不採用とし、オフセット値ｙを増加するステップ（Ｓ１２）を有する。

このほかの動作は通常の疑似焼き鈍し法と同じでよい。
以下上記のようなオフセット加算回路２１とオフセット制御回路２２を有する遷移制御部２０による効果を説明する。

現在の状態が局所解に捕まってなかなか脱出できない状態にあるとき、全ての状態遷移に対するエネルギー変化値は大きな正の値である。このときの各状態遷移に対する許容確率はメトロポリス法であってもギブス法であっても、以下の式４−１，４−２に示すように、ほぼ指数関数で表される。

全ての状態遷移の可否判定において、エネルギー変化値｛−ΔＥ_i｝にオフセット値ｙを加えて判定を行うとすると、全ての状態遷移の許容確率は以下の式５のようになり、全ての状態遷移の許容確率が同じ倍率ｅ^y/Tで大きくなることがわかる。

前述のように、全ての状態遷移の許容確率の相対比を保ったまま許容確率の絶対値を増大することができれば、その後の状態遷移の分岐比を変化させることなく、局所解での滞在時間を短縮することができる。そのため、オフセット値ｙを用いることで局所解からの脱出促進が期待できる。しかしこのオフセット値ｙを適切に制御しなければ、加速効果が十分ではなかったり、収束性を悪化させてしまったりする可能性がある。

まず、現在の状態が局所解でないときには、エネルギーの下がる状態遷移があるため、遷移確率は指数関数では近似できない。このためオフセット値ｙがあると分岐比を変えてしまう。このため局所解でないときは、オフセット値ｙは０であるか十分小さいことが望ましい。

また現在の状態が局所解であるときのオフセット値ｙが一定の値であると加速効果はあるものの必ずしも十分でない。状態遷移に伴うエネルギーの増加が大きいものばかりであるとオフセット値ｙを与えても遷移確率は非常に小さいままである。オフセット値ｙを与えてもなかなか局所解を脱出できない場合には、さらに大きなオフセット値ｙを用いることが望ましい。

これを解決するため、図１のオフセット制御回路２２は、状態遷移が起こらないときオフセット値ｙを少しずつ増やし、状態遷移が起こった場合に、オフセット値ｙを０にリセットする構成となっている。

状態が局所解に留まっていると次第にオフセット値ｙが大きくなるため、いつかは必ず脱出することができる。また、状態が局所解でないときは状態遷移に伴うリセットが頻繁に起こるためオフセット値ｙは０または小さい値であり、分岐比に大きな影響を及ぼさないようにすることが可能となる。

オフセット増分値Δｙも適切に選ぶことが望ましい。オフセット増分値Δｙを大きくした方が局所解から速く脱出できる。しかしあまり大きくすると、局所解でないときも必ずしも毎回状態遷移が起こるとは限らないためオフセット値ｙの影響を受ける可能性がある。また、局所解においても比較的エネルギーの増加が少なく許容確率が高くなるべき状態遷移が候補に挙がる前にオフセット値ｙが大きくなってしまい、分岐比が正しい値からずれてしまう可能性がある。分岐比に大きな影響を及ぼさないためには、局所解における平均滞在時間が局所解でないときの平均滞在時間の数倍程度になるようにするのがよいと思われる。

以上のことからオフセット増分値Δｙを適切に選べば、収束性に悪影響を及ぼすことなく局所解での滞在時間を短縮することが可能となり、最適化の計算時間の短縮が可能となることがわかる。

この効果のソフトウェアシミュレーションによる検証については、以下に示す実施の形態とともに後述する。
ところで、本発明は上記のように疑似焼き鈍し法を実現する図１３の遷移制御部１４、さらにいえばその中でも可否判定部１４ｂに上記のような新たな機能ブロックを加えることにより、計算時間の短縮を図るものである。その他の部分には何ら変更を加えなくてよい。したがって、現在の状態に対して許されうる状態遷移の集合や、状態遷移に伴うエネルギーの変化を与える関数形やその計算方法等にはまったく依存せずに、本発明を適用することができる。したがって、これらの部分の具体的回路構成法については詳しく説明しない。

ただし、以下で最適化するエネルギーがイジングモデルで表される場合の疑似焼き鈍し法について、また、それとほとんど等価であるボルツマンマシンにおける最適化において、遷移候補の発生及び状態遷移に伴うエネルギーの変化の計算法について簡単に説明する。

イジングモデルは、お互いに相互作用を行うＮ個のスピンからなる系を表すモデルであり、各スピンｓ_iは±１の２値をとる。系のエネルギーは、以下の式６で表される。

式６において、Ｊ_i,jは、スピンｓ_iとスピンｓ_j間の相互作用係数を示し、ｈ_iは、系のバイアス値である外部磁場係数を示す。
現在の状態から次の状態への状態遷移の候補は、１つのスピンの反転であり、Ｎ通り存在する。したがって遷移候補としては反転する１つのスピン番号または複数のスピンの番号の集合を発生させればよい。

そしてｉ番目のスピン反転に伴うエネルギーの変化は、以下の式７で表される。

ここで、以下の式８のＦ_iは、ローカルフィールド（局所場）値と呼ばれ、各スピンの反転によるエネルギー変化の割合を表している。

状態遷移を許容するかどうかはエネルギーの変化で決まるため、基本的にはエネルギーそのものを計算せずにローカルフィールド値からエネルギーの変化を計算すれば十分である。出力として得られた最低エネルギーに対する状態を用いる場合には、ローカルフィールド値からエネルギーの変化を計算しそれを累算してゆくことでエネルギーを求めることができる。

さらに、

であるから、ローカルフィールド値を行列演算により毎回計算し直す必要はなく、状態遷移にともなって反転のあったスピンによる変化分だけ加算すればよい。
また、ニューラルネットワークに用いられるボルツマンマシンは、状態変数が（０，１）の２値をとることを除いてイジングモデルの疑似焼き鈍し法と同じである。このためほとんど同様の構成とすることができる。エネルギー、エネルギーの変化値、ローカルフィールド値を表す式は、以下の式１０、式１１、式１２のようになる。

なお、ボルツマンマシンではイジングモデルのスピンに相当するものをニューロンと呼ぶことが多いが簡単のため以下ではスピンと呼ぶ。
したがって、図１３に示した状態保持部１１は、Ｎ個のスピンの値を保持するＮビットレジスタと加算器、排他的論理和等の比較的簡単な演算回路を用いて構成することができる。

上記のようにイジングモデルを用いた疑似焼き鈍し法とボルツマンマシンを用いた疑似焼き鈍し法は同等であり、お互いに相互変換できるので、以下では論理回路の０、１と対応の付けやすいボルツマンマシンを想定して説明を行う。

なおボルツマンマシン（及びイジングモデルの疑似焼き鈍し）においては、状態遷移に伴い変化する状態変数は１つだけであり、それに対するエネルギー変化値はローカルフィールド値を用いて予め計算しておくことができる。したがって以下の実施の形態では予め計算しておいたエネルギー変化値を遷移候補の発生に応じて選択する形式の実装を例に説明している。しかしながら、ボルツマンマシンでないときは、複数の状態変数が変化する遷移を考える場合もあるため、遷移候補の発生後に必要なエネルギー変化値を計算するような実装が有利になる場合もある。

以下、ボルツマンマシンを想定した最適化装置の３つの実施の形態を説明する。
（第１の実施の形態）
図３は、第１の実施の形態の最適化装置における遷移制御部の回路構成の一例を示す図である。図１に示した遷移制御部２０と同じ要素については同一符号が付されている。図３の遷移制御部２０ａは、基本的に図１の遷移制御部２０と同じであるが、図３では、累算器２２ａの構成について少し具体的に示されている。

累算器２２ａは、加算器２２ａ１、セレクタ２２ａ２、レジスタ２２ａ３を有する。
加算器２２ａ１は、オフセット増分値Δｙと、レジスタ２２ａ３が出力するオフセット値ｙとを加算した和を出力する。

セレクタ２２ａ２は、遷移可否ｆが状態遷移を許容することを示すとき、０を選択して出力し、遷移可否ｆが状態遷移を許容しないことを示すとき、加算器２２ａ１が出力する加算結果を選択して出力する。

レジスタ２２ａ３は、クロック端子に供給されるパルス信号に同期して、セレクタ２２ａ２が出力する値を取り込み、オフセット値ｙとして出力する。
加算器２２ａ１とレジスタ２２ａ３のビット幅は、適切に設定される。ビット幅は、エネルギー変化値（−ΔＥ）のビット幅と同程度でよい。例えば相互作用係数のビット幅を１６、スピン数を１０２４とした場合、エネルギー変化値（−ΔＥ）は最大２７ビットとなるのでこのビット幅を用いれば十分である。実際にはこれより少なくても十分である場合がほとんどである。ノイズテーブル１４ｂ３の出力のビット幅もエネルギー変化値（−ΔＥ）のビット幅と同程度以下でよい。

レジスタ２２ａ３のクロック端子に供給されるパルス信号は、回路動作における反復動作をコントロールするステートマシンより供給され、１回の反復における状態遷移の可否が確定した後に、一度だけアクティブになるように制御される。

可否判定とその後に続く各パラメータの更新に必要なクロック信号のサイクル数は可否判定結果に依存して変化するため、パルス信号もこのサイクル数に合うように発生させる必要がある。

以下では、状態の更新があった場合は５サイクル、なかった場合は１サイクルで次の反復に入る場合を例としてパルス信号の発生方法の説明を行う。
図４は、パルス信号の発生の状態遷移の一例を示す状態遷移図である。

図４に示すように、０〜４の５つの状態間で、遷移が行われる。状態０のとき、遷移可否ｆが０である場合、パルス信号が発生される。この場合、状態０からの遷移は行われない。状態０のとき、遷移可否ｆが１であると、状態１に遷移する。図４において、Ｄ．Ｃ．は、ドントケアを示している。つまり、状態１からは、遷移可否ｆの値によらずクロック信号ＣＬＫに同期して、状態２、状態３、状態４へと遷移し、状態０へと戻る。そして状態４から状態０に戻る際に、パルス信号が発生される。

このような状態遷移を実現するためのステートマシンは、以下の真理値表を満たす回路とすればよい。
図５は、パルス信号を発生する論理回路の真理値表の一例を示す図である。

また、図６は、パルス信号を発生するステートマシンの一例を示す図である。
ステートマシン５０は、３ビットフリップフロップ５１、インクリメント回路５２、ＡＮＤ回路５３、セレクタ５４、ＡＮＤ回路５５，５６を有している。図５の真理値表は、各状態の３ビットフリップフロップ５１の出力値Ｑ１，Ｑ２，Ｑ３と、入力値Ｄ１，Ｄ２，Ｄ３の関係を示すものである。

３ビットフリップフロップ５１には、インクリメント回路５２が出力する３ビットの値のうち、上位２ビット（［ｄ０：ｄ１］）と、セレクタ５４が出力する値が、入力値Ｄ１〜Ｄ３として供給される。３ビットフリップフロップ５１は、クロック信号ＣＬＫに同期したタイミングで、入力値Ｄ１〜Ｄ３を取り込み、出力値Ｑ１〜Ｑ３として出力する。

インクリメント回路５２は、３ビットフリップフロップ５１が出力する３ビットの出力値Ｑ１〜Ｑ３を＋１する。例えば、出力値Ｑ１〜Ｑ３が、“００１”（つまりＱ１＝Ｑ２＝０、Ｑ３＝１）である場合、インクリメント回路５２は、“０１０”を出力する。

ＡＮＤ回路５３は、出力値Ｑ１〜Ｑ３の各ビットの論理レベルを反転した値を入力し、それらの論理積を出力値として出力する。
セレクタ５４の一方の入力端子には、インクリメント回路５２が出力する３ビットの値の最下位ビット（ｄ２）が供給され、他方の入力端子には、遷移可否ｆが供給される。そして、セレクタ５４は、ＡＮＤ回路５３の出力値が１であれば、遷移可否ｆを出力し、ＡＮＤ回路５３の出力値が０であれば、ｄ３を出力する。

ＡＮＤ回路５５は、出力値Ｑ１〜Ｑ３の３ビット（［ｑ１：ｑ３］）の各ビットの論理レベルを反転した値を入力し、それらの論理積を出力値として出力する。
ＡＮＤ回路５６は、クロック信号ＣＬＫと、ＡＮＤ回路５５が出力する出力値との論理積を、パルス信号として出力する。

以上のようなステートマシン５０でパルス信号を生成することができる。
以下第１の実施の形態の最適化装置の動作例を説明する。
乱数発生回路１４ｂ１は、前述した各反復において状態遷移の候補の番号（遷移番号Ｎ）を乱数値により１つずつ発生する。セレクタ１４ｂ２は、その状態遷移に伴うエネルギー変化値（−ΔＥ）を選択して出力する。また、一様乱数である乱数値に基づきノイズテーブル１４ｂ３による変換を行って得られた値に、乗算器１４ｂ４が温度値Ｔを乗算することによりメトロポリス法またはギブス法における熱励起エネルギーを生成する。そして、減算器２１ａは、熱励起エネルギーから累算器２２ａが出力するオフセット値ｙを減ずる。比較器１４ｂ５は、減算器２１ａが出力する減算結果と、セレクタ１４ｂ２が選択して出力したエネルギー変化値（−ΔＥ）とを比較することで状態遷移の可否を決定する。

オフセット値ｙは、累算器２２ａにより、状態遷移が採用されたとき０にリセットされ、状態遷移が採用されず現在の状態に留まるときオフセット増分値Δｙ増分が加算される。これにより、現在の状態における滞在時間に対してオフセット値ｙが単調増加するよう制御される。

オフセット増分値Δｙを決める目安は以下のように与えられる。
前述のように、収束性に悪影響を及ぼすことなく加速効果を得るには、局所解の滞在時間が、局所解でない場合の数倍程度になるようにオフセット増分値Δｙを選ぶのがよいと考えられる。本実施の形態のように各反復において状態遷移の候補が１つ発生する場合、各状態遷移が候補に挙がる確率は、全ての状態遷移の数の逆数となる。このことを考慮すると、オフセット増分値Δｙは、滞在時間が全ての状態遷移の数の数倍程度になったときオフセット値ｙが局所解からの脱出に必要な山の高さのエネルギーになるように定めるのがよいと考えられる。

図７は図３の遷移制御部を用いて実現される疑似焼き鈍し法のソフトウェアシミュレーション結果の一例を示す図である。最適化する問題は３２都市の巡回セールスマン問題をイジングモデル（ボルツマンマシン）により定式化したものである。横軸は反復回数、縦軸は最適解が得られた割合（正答率（％））を表している。結果６０は、図３の遷移制御部２０ａを用いたときの、反復回数と正答率との関係を示し、結果６１は、図１４に示した遷移制御部１４を用いたときの、反復回数と正答率との関係を示す。

図７から第１の実施の形態の遷移制御部２０ａを用いた場合のほうが、遷移制御部１４を用いた場合よりも速く正解に達することがわかる。以下の式１３で表される９９％の確率で正答が得られる反復回数Ｎ₉₉で比べると遷移制御部１４を用いた場合では４．３×１０¹⁰、第１の実施の形態の遷移制御部２０ａを用いた場合では７．７×１０⁹であり、約５倍高速化されていることが示された。

ただし、式１３において、ｎは反復回数で、η（ｎ）はその回数での正答率である。
（第２の実施の形態）
図８は第２の実施の形態の最適化装置における遷移制御部の回路構成の一例を示す図である。なお、図８では、乱数値を発生する回路については図示が省略されている。

以下、図８の遷移制御部２０ｂは各ビット反転（スピンの値の変化）を全て状態遷移の候補とするものとして説明するが、各ビット反転の一部のみを状態遷移の候補とすることも可能である。また、以下の説明では、熱励起のために用いる乱数値を、各遷移候補に対して独立とするが、いくつかの状態遷移の候補に対して共通としてもよい。

遷移制御部２０ｂは、図３の遷移制御部２０ａと同様に累算器２２ａを有している他、熱励起エネルギー生成部７０、減算器７１、比較器７２、セレクタ７３を有する。
熱励起エネルギー生成部７０は、遷移候補ごとに独立の乱数値｛ｕｉ｝を、前述した逆関数ｆ^-1（ｕ）の値に変換するノイズテーブル（記憶部）を有する。さらに熱励起エネルギー生成部７０は、ノイズテーブルが出力する値に温度値Ｔを乗算した積を、メトロポリス法またはギブス法における熱励起エネルギーとして出力する。

減算器７１は、遷移候補ごとに生成された熱励起エネルギーから、累算器２２ａが出力するオフセット値ｙを減ずる。
比較器７２は、減算器７１が出力する各減算結果と、エネルギー変化値｛−ΔＥ_i｝とを比較することで各状態遷移の可否を示す遷移可否｛ｆｉ｝を出力する。なお、この比較器７２の動作は、複数の状態遷移のそれぞれに対して計算されたエネルギー変化値｛−ΔＥ_i｝とオフセット値ｙとの和のそれぞれと、複数の乗算（熱励起エネルギー）とのそれぞれとの比較結果を出力することに相当する。

セレクタ７３は、遷移可否｛ｆｉ｝に基づいて、許容された状態遷移が複数存在するときは、乱数値を用いてその中から１つをランダムに選択する。そして、セレクタ７３は、選択した状態遷移の候補の番号（遷移番号Ｎ）を出力するとともに、遷移可否ｆとして１を出力する。状態遷移が生じないときには、遷移可否ｆは０となる。

以下第２の実施の形態の最適化装置の動作例を説明する。
前述した各反復において、熱励起エネルギー生成部７０は、状態遷移の候補の数と等しい独立な一様乱数である乱数値｛ｕｉ｝を受け、ノイズテーブルを用いて変換を行う。そして熱励起エネルギー生成部７０は、変換で得られた値に共通の温度値Ｔを乗算することにより、メトロポリス法またはギブス法における熱励起エネルギーを生成する。

遷移候補ごとに生成された熱励起エネルギーから、減算器７１によって、累算器２２ａが出力するオフセット値ｙが減ぜられ、比較器７２で、減算器７１が出力する各減算結果と、エネルギー変化値｛−ΔＥ_i｝とが比較される。比較器７２は、比較結果に基づいて、各状態遷移の可否を示す遷移可否｛ｆｉ｝を出力する。許容された状態遷移が複数存在する時は、セレクタ７３は、乱数値を用いてその中から１つをランダムに選択する。

オフセット値ｙは、許容された状態遷移が存在し状態が変化するとき（遷移可否ｆが１のとき）、累算器２２ａによって０にリセットされる。候補となった状態遷移が全て許容されず現在の状態に留まるとき（遷移可否ｆが０のとき）、累算器２２ａは、オフセット値ｙにオフセット増分値Δｙを加算することで、現在の状態における滞在時間に対してオフセット値ｙが単調増加するよう制御する。

全ての状態遷移が候補として挙げられ、局所解でないときほぼ１回の反復で状態遷移が起こることを考慮すると、オフセット増分値Δｙは、滞在時間が数回程度になったとき局所解からの脱出に必要なエネルギーになるように定めるのがよいと考えられる。

図９は図８の遷移制御部を用いて実現される疑似焼き鈍し法のソフトウェアシミュレーション結果の一例を示す図である。最適化する問題は３２都市の巡回セールマン問題をイジングモデル（ボルツマンマシン）により定式化したものである。横軸は反復回数、縦軸は最適解が得られた割合（正答率（％））を表している。結果６０ａは、図８の遷移制御部２０ｂを用いたときの、反復回数と正答率との関係を示し、結果６１ａは、遷移制御部２０ｂから、減算器７１と累算器２２ａを除いたときの、反復回数と正答率との関係を示す。

図９から第２の実施の形態の遷移制御部２０ｂを用いた場合のほうが、減算器７１と累算器２２ａがない場合よりも速く正解に達することがわかる。９９％の確率で正答が得られる反復回数Ｎ₉₉で比べると減算器７１と累算器２２ａがない場合では５．３×１０⁷、第２の実施の形態の遷移制御部２０ｂを用いた場合では１．１×１０⁷であり、約５倍高速化されていることが示された。

以下、図８の遷移制御部２０ｂを用いた最適化装置の一例を説明する。
図１０は、図８の遷移制御部を用いた最適化装置の一例を示す図である。
最適化装置８０は、エネルギー計算部８１ａ１，…，８１ａｉ，…，８１ａｎ、遷移制御部８２、状態更新部８３を有している。

エネルギー計算部８１ａ１〜８１ａｎは、図１３に示したエネルギー計算部１２の一例であり、エネルギー変化値（−ΔＥ₁，…，−ΔＥ_i，…，−ΔＥ_n（前述の｛−ΔＥ_i｝に相当））を計算し、出力する。

例えば、エネルギー計算部８１ａｉは、レジスタ８１ｂ、セレクタ８１ｃ，８１ｄ、乗算器８１ｅ、加算器８１ｆ、レジスタ８１ｇ、セレクタ８１ｈ、乗算器８１ｉを有している。

レジスタ８１ｂは、前述の式１０等における相互作用係数Ｊ_i,1，Ｊ_i,2，…，Ｊ_i,nを格納する。
なお、相互作用係数Ｊ_i,1〜Ｊ_i,nは、例えば、最適化装置８０内の図示しない制御装置または、最適化装置８０の外部の装置により、計算対象の問題に応じて予め計算され、レジスタ８１ｂに格納される。なお、上記のような相互作用係数Ｊ_i,1〜Ｊ_i,nは、ＲＡＭ等のメモリに格納されてもよい。

セレクタ８１ｃは、遷移制御部８２が出力する遷移番号Ｎに基づき、レジスタ８１ｂに格納されている相互作用係数Ｊ_i,1〜Ｊ_i,nのうち１つを選択して出力する。
例えば、Ｎ＝ｎがセレクタ８１ｃに入力されたとき、セレクタ８１ｃは、相互作用係数Ｊ_i,nを選択する。

セレクタ８１ｄは、式１１の１−２ｓ_iの演算を実現するものであり、状態更新部８３が出力する更新後のスピンｓ_Nの値に基づき、１または−１を選択して出力する。更新後の値が０のときには、セレクタ８１ｄは、−１を選択して出力し、更新後の値が１のときには、セレクタ８１ｄは、１を選択して出力する。

乗算器８１ｅは、セレクタ８１ｃが出力する相互作用係数と、セレクタ８１ｄが出力する値とを乗算した積を出力する。
加算器８１ｆは、乗算器８１ｅが出力する乗算結果と、レジスタ８１ｇに格納されている値とを加算した和を出力する。

レジスタ８１ｇは、図示しないクロック信号に同期して、加算器８１ｆが出力する値を取り込む。レジスタ８１ｇは、例えば、フリップフロップである。なお、レジスタ８１ｇに格納される値が、式１２におけるローカルフィールド値Ｆ_iである。

セレクタ８１ｈは、変化後のスピンｓ_iの値が、０のとき１を出力し、１のとき−１を出力する。セレクタ８１ｈの出力は、式１１の１−２ｓ_iに相当する。
乗算器８１ｉは、レジスタ８１ｇが出力するローカルフィールド値Ｆ_iとセレクタ８１ｈが出力する値とを乗算した積をエネルギー変化値（−ΔＥ_i）として出力する。

遷移制御部８２は、回路部８２ａ１，…，８２ａｉ，…，８２ａｎ、セレクタ８２ｂ、オフセット制御回路８２ｃを有している。
回路部８２ａ１〜８２ａｎは、図８に示した遷移制御部２０ｂの熱励起エネルギー生成部７０、減算器７１、比較器７２の機能を、状態遷移の候補ごとに分割して行うものであり、セレクタ８２ｂは、図８に示したセレクタ７３に相当する。また、オフセット制御回路８２ｃは、図８に示した累算器２２ａに相当する。

したがって、遷移制御部８２は、図８に示した遷移制御部２０ｂと同様の動作を行う。
状態更新部８３は、図１３に示した状態保持部１１の機能を有し、遷移制御部１４が出力する遷移可否ｆと遷移番号Ｎに基づき、保持されているスピンｓ₁〜ｓ_nの値を更新して、その値の組み合わせ（Ｓｔａｔｅ）を出力する。また、状態更新部８３は、更新後のスピンの値（図１１の例ではｓ_Nと表記されている）を出力する。

第２の実施の形態の遷移制御部２０ｂ，８２は、上記のような最適化装置８０に適用可能である。
（第３の実施の形態）
図１１は第３の実施の形態の最適化装置における遷移制御部の回路構成の一例を示す図である。なお、図１１では、乱数値を発生する回路については図示が省略されている。また、図８に示した遷移制御部２０ｂと同じ要素については同一符号が付されている。

以下、図１１の遷移制御部２０ｃは各ビット反転（スピンの値の変化）を全て状態遷移の候補とするものとして説明するが、各ビット反転の一部のみを状態遷移の候補とすることも可能である。

遷移制御部２０ｃは、図３の遷移制御部２０ａと同様に累算器２２ａを有している他、熱励起エネルギー生成部７０ａ、減算器７１ａ、比較器７２ａ、セレクタ７３を有する。
熱励起エネルギー生成部７０ａは、各遷移候補に対して共通の乱数値ｕ（一様乱数）を、前述した逆関数ｆ^-1（ｕ）の値に変換するノイズテーブルを有し、その値に温度値Ｔを乗算した積を、メトロポリス法またはギブス法における熱励起エネルギーとして出力する。

減算器７１ａは、熱励起エネルギーから、全ての状態遷移の候補に共通なオフセット値ｙを減ずる。
比較器７２ａは、減算器７１が出力する減算結果と、各状態遷移によるエネルギー変化値｛−ΔＥ_i｝とを比較することで各状態遷移の可否を示す遷移可否｛ｆｉ｝を出力する。

セレクタ７３は、遷移可否｛ｆｉ｝に基づいて、許容された状態遷移が複数存在するときは、乱数を用いてその中から１つをランダムに選択する。そして、セレクタ７３は、選択した状態遷移の候補の番号（遷移番号Ｎ）を出力するとともに、遷移可否ｆとして１を出力する。状態遷移が生じないときには、遷移可否ｆは０となる。

以下第３の実施の形態の最適化装置の動作例を説明する。
前述した各反復において、熱励起エネルギー生成部７０ａは、各ビット反転に共通な一様乱数である乱数値ｕを受け、ノイズテーブルを用いて変換を行う。そして熱励起エネルギー生成部７０ａは、変換で得られた値に温度値Ｔを乗算することにより、メトロポリス法またはギブス法における熱励起エネルギーを生成する。

生成された熱励起エネルギーから、減算器７１ａによって、累算器２２ａが出力するオフセット値ｙが減ぜられ、比較器７２ａで、減算器７１ａが出力する減算結果と、エネルギー変化値｛−ΔＥ_i｝とが比較される。比較器７２ａは、比較結果に基づいて、各状態遷移の状態遷移の可否を示す遷移可否｛ｆｉ｝を出力する。許容された状態遷移が複数存在する時は、セレクタ７３は、乱数値を用いてその中から１つをランダムに選択する。

オフセット値ｙは、第２の実施の形態の遷移制御部２０ｂと同様に制御される。
図１２は図１１の遷移制御部を用いて実現される疑似焼き鈍し法のソフトウェアシミュレーション結果の一例を示す図である。最適化する問題は３２都市の巡回セールマン問題をイジングモデル（ボルツマンマシン）により定式化したものである。横軸は反復回数、縦軸は最適解が得られた割合（正答率（％））を表している。結果６０ｂは、図１１の遷移制御部２０ｃを用いたときの、反復回数と正答率との関係を示し、結果６１ｂは、遷移制御部２０ｃから、減算器７１ａと累算器２２ａを除いたときの、反復回数と正答率との関係を示す。

図１２から第３の実施の形態の遷移制御部２０ｃを用いた場合のほうが、減算器７１ａと累算器２２ａがない場合よりも速く正解に達することがわかる。９９％の確率で正答が得られる反復回数Ｎ₉₉で比べると減算器７１ａと累算器２２ａがない場合では３．４×１０⁷、第３の実施の形態の遷移制御部２０ｃを用いた場合では１．０×１０⁷であり、約３倍高速化されていることが示された。

また、第３の実施の形態の遷移制御部２０ｃでは、各状態遷移で共通の乱数値ｕを用いるため、第２の実施の形態の遷移制御部２０ｂよりも、回路面積を削減できる。
以上、実施の形態に基づき、本発明の最適化装置及び最適化装置の制御方法の一観点について説明してきたが、これらは一例にすぎず、上記の記載に限定されるものではない。

１４ｂ１乱数発生回路
１４ｂ２セレクタ
１４ｂ３ノイズテーブル
１４ｂ４乗算器
１４ｂ５比較器
２０遷移制御部
２１オフセット加算回路
２１ａ減算器
２２オフセット制御回路
２２ａ累算器

Claims

エネルギーを表す評価関数に含まれる複数の状態変数の値をそれぞれ保持する状態保持部と、
前記複数の状態変数の値の何れかが変化することに応じて状態遷移が起こる場合、前記エネルギーの変化値を複数の状態遷移のそれぞれに対して計算するエネルギー計算部と、
温度を示す温度値を制御する温度制御部と、
前記温度値と前記変化値と乱数値とに基づいて、前記変化値と熱励起エネルギーとの相対関係によって前記複数の状態遷移の何れかを受け入れるか否かを確率的に決定する際に、前記変化値にオフセット値を加えるとともに、前記エネルギーが極小となる局所解における前記オフセット値を、前記エネルギーが極小ではない場合と比較して大きくなるように制御する遷移制御部と、
を有することを特徴とする最適化装置。
前記遷移制御部は、オフセット制御回路を有し、
前記オフセット制御回路は、前記複数の状態遷移の何れかを受け入れる場合、前記オフセット値を０にし、前記複数の状態遷移の何れも受け入れない場合、前記オフセット値を第１の期間ごとに増加することで、前記複数の状態変数の値で表される現在の状態の滞在時間に対して前記オフセット値を単調に増加させる、
ことを特徴とする請求項１に記載の最適化装置。
前記オフセット制御回路は、さらにリセット端子を有する累算器を含み、前記累算器は、前記複数の状態遷移の何れかを受け入れる旨を示す第１の信号を受けると前記オフセット値を０にし、前記複数の状態遷移の何れも受け入れない旨を示す第２の信号を受けると前記オフセット値にオフセット増分値を加算する、
ことを特徴とする請求項２に記載の最適化装置。
前記累算器は、さらにクロック端子を有し、前記クロック端子に、ステートマシンからのパルス信号が入力される度、前記オフセット値に前記オフセット増分値を加算する、
ことを特徴とする請求項３に記載の最適化装置。
前記遷移制御部は、
前記複数の状態遷移のそれぞれに対して計算された前記変化値を、前記乱数値に応じて１つ選択するセレクタと、
前記乱数値に応じた、メトロポリス法またはギブス法で表される前記複数の状態遷移の許容確率を示す関数の逆関数の値を出力する記憶部と、
前記逆関数の値と前記温度値とを乗算した積で表される前記熱励起エネルギーを出力する乗算器と、
前記セレクタが選択した前記変化値と前記オフセット値とを加算した和と、前記熱励起エネルギーとの比較結果に相当する値で表される、前記セレクタが選択した前記変化値に対応する状態遷移を受け入れるか否かの判定結果を出力する比較器と、
を有することを特徴とする請求項１乃至４の何れか一項に記載の最適化装置。
前記遷移制御部は、
前記複数の状態遷移のそれぞれに対して互いに独立の前記乱数値に応じた、メトロポリス法またはギブス法で表される前記複数の状態遷移の許容確率を示す関数の逆関数の複数の値を出力する記憶部と、
前記複数の値のそれぞれと前記温度値とを乗算した複数の積で表される前記熱励起エネルギーを出力する乗算器と、
前記複数の状態遷移のそれぞれに対して計算された前記変化値と、前記オフセット値とを加算した複数の和のそれぞれと、前記複数の積のそれぞれとの比較結果に相当する複数の値で表される、前記複数の状態遷移のそれぞれを受け入れるか否かの複数の判定結果を出力する比較器と、
前記複数の判定結果に基づいて、前記複数の状態遷移のうち、受け入れる状態遷移が複数ある場合、何れか１つの状態遷移を選択するセレクタと、
を有することを特徴とする請求項１乃至４の何れか一項に記載の最適化装置。
前記遷移制御部は、
前記複数の状態遷移の全てに対して互いに共通の前記乱数値に応じた、メトロポリス法またはギブス法で表される前記複数の状態遷移の許容確率を示す関数の逆関数の値を出力する記憶部と、
前記逆関数の値と前記温度値とを乗算した積で表される前記熱励起エネルギーを出力する乗算器と、
前記複数の状態遷移のそれぞれに対して計算された前記変化値と、前記オフセット値とを加算した複数の和のそれぞれと、前記積との比較結果に相当する複数の値で表される、前記複数の状態遷移のそれぞれを受け入れるか否かの複数の判定結果を出力する比較器と、
前記複数の判定結果を受け、前記複数の状態遷移のうち、受け入れる状態遷移が複数ある場合、受け入れる前記状態遷移を１つ選択するセレクタと、
を有することを特徴とする請求項１乃至４の何れか一項に記載の最適化装置。
前記遷移制御部は、
前記複数の状態遷移のうちの２以上の状態遷移ごとに共通の前記乱数値に応じた、メトロポリス法またはギブス法で表される前記複数の状態遷移の許容確率を示す関数の逆関数の複数の値を出力する記憶部と、
前記複数の値のそれぞれと前記温度値とを乗算した複数の積で表される前記熱励起エネルギーを出力する乗算器と、
前記複数の状態遷移のそれぞれに対して計算された前記変化値と、前記オフセット値とを加算した複数の和のそれぞれと、前記複数の積のそれぞれとの比較結果に相当する複数の値で表される、前記複数の状態遷移のそれぞれを受け入れるか否かの複数の判定結果を出力する比較器と、
前記複数の判定結果を受け、前記複数の状態遷移のうち、受け入れる状態遷移が複数ある場合、前記受け入れる状態遷移を１つ選択するセレクタと、
を有することを特徴とする請求項１乃至４の何れか一項に記載の最適化装置。
最適化装置の制御方法において、
前記最適化装置が有する状態保持部が、エネルギーを表す評価関数に含まれる複数の状態変数の値をそれぞれ保持し、
前記最適化装置が有するエネルギー計算部が、前記複数の状態変数の値の何れかが変化することに応じて状態遷移が起こる場合、前記エネルギーの変化値を複数の状態遷移のそれぞれに対して計算し、
前記最適化装置が有する温度制御部が、温度を示す温度値を制御し、
前記最適化装置が有する遷移制御部が、前記温度値と前記変化値と乱数値とに基づいて、前記変化値と熱励起エネルギーとの相対関係によって前記複数の状態遷移の何れかを受け入れるか否かを確率的に決定する際に、前記変化値にオフセット値を加えるとともに、前記エネルギーが極小となる局所解における前記オフセット値を、前記エネルギーが極小ではない場合と比較して大きくなるように制御する、
ことを特徴とする最適化装置の制御方法。