JP2023107619A

JP2023107619A - 情報処理装置、情報処理方法及び情報処理プログラム

Info

Publication number: JP2023107619A
Application number: JP2022008901A
Authority: JP
Inventors: 浩一神田; Koichi Kanda
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2022-01-24
Filing date: 2022-01-24
Publication date: 2023-08-03
Also published as: CN116484957A; US20230252105A1; EP4216109A1

Abstract

【課題】２ウェイ１ホット制約にしたがう問題の解を効率的に得る情報処理装置、情報処理方法及び情報処理プログラムを提供する。【解決手段】最適化部２０は、２ウェイ１ホット制約を含む制約条件が与えられた問題の解を、目的関数に基づく第１行列を重み行列として用いて探索する。強制遷移部１８は、最適化部２０による探索が特定の状態に達した場合に、最適化部２０の探索結果である解の一部の値を変更する。重み行列切替部１９は、強制遷移部１８により解の一部の値の変更が行われた場合に、重み行列にペナルティ係数を用いて生成した復帰用行列を重み行列として最適化部２０に探索を行わせ、最適化部２０による探索結果が２ウェイ１ホット制約を満たす状態に達すると、重み行列を第１行列に戻して最適化部２０に探索を行わせる。【選択図】図６

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。

組合せ最適化問題は、現在の社会における様々な分野に存在する。たとえば、製造・流通、マーケティングなどの分野では、コストを最適化もしくは最小化する要素の組合せが探索される。しかし、組合せ最適化問題は、上記要素に対応する変数の数が増えるにつれて指数関数的に計算時間が増加するため、従来のノイマン型コンピュータでは解くことが困難である問題として知られている。

ノイマン型コンピュータが不得意とする多変数の最適化問題を解く方法として、イジング型のエネルギー関数を用いた最適化装置が存在する。このような最適化装置は、イジングマシン又はボルツマンマシンとも呼ばれる。また、エネルギー関数は、コスト関数又は目的関数と呼ばれる場合もある。最適化装置は、計算対象の問題を、磁性体のスピンの振る舞いを表すモデルであるイジングモデルに置き換えて計算する。

イジングモデルを用いた最小値求解問題の計算手法として、イジング型のエネルギー関数の最小値を、マルコフ連鎖モンテカルロ（Markov－Chain Monte Carlo：ＭＣＭＣ）を用いて求解する手法がある。ＭＣＭＣ法では、ボルツマン分布にしたがった遷移確率でエネルギー関数の状態変数の更新である状態遷移を行うことが一般的である。ＭＣＭＣ法では、状態を表すビット列のいずれかのビットを確率的に反転させて探索を行い、現在の状態から近傍状態に移行した場合のエネルギー差に基づいて移行の可否が決定される。イジング型のエネルギーは、バイナリ変数の２次系式のエネルギーである。

このような最適化問題の中には、１ホット（One Hot）制約と呼ばれる制約条件が課される問題が存在する。１ホット制約とは、複数の状態変数が存在する場合に、１つの解において値が１になる状態変数の数が１つに限定される制約である。１ホット制約が現れる最適化問題として、巡回セールスマン問題（ＴＳＰ：Traveling Salesman Problem）や配車計画（ＶＰＲ：Versatile Place and Route）問題といった多くのスケジューリング問題、並びに、ナップサック問題及びビンパッキング問題などがある。

さらに、１ホット制約には、２つの種類が存在する。１つは、１ウェイ１ホット（１Ｗ１Ｈ：One Way One Hot）制約と呼ばれる制約である。この場合、各変数は制約式の組に１度現れる。この制約を有する最適化問題には、交通量最適化問題やビンパッキング問題がある。

もう１つは、２ウェイ１ホット（２Ｗ２Ｈ：Two Way One Hot）制約と呼ばれる制約である。この場合、ｎ^２個の変数をｎ×ｎの正方形状に並べた時に各行の和及び各列の和が全て１になる。この制約は、例えば整数１，２，・・・，ｎといったｎ個の異なる要素の順列を決める場合の制約と等価である。この制約を有する最適化問題には、巡回セールスマン問題や、配車計画問題や、二次割り当て問題（ＱＡＰ：Quadratic Assignment Problem）がある。

このような２ウェイ２ホット問題の解法において、定式化を工夫することで、例えば配車計画問題であれば対象とする拠点数を２０拠点程度から１００拠点程度まで増加させることができた。また、異なるペナルティ係数を有する２つの評価関数のうち一方を最低エネルギー状態の決定処理に使用し、他方を最適化問題の解を探索する処理に使用して、最適化処理を行う技術が提案されている。また、状態変数の値が変化することによる評価関数の値の変化が正に大きいほど、ボルツマン分布よりも遷移確率が大きくなる遷移確率分布に基づいて、マルコフ連鎖モンテカルロ法により状態変数の値を更新する技術が提案されている。

特開２０１９－１２１１３７号公報特開２０２０－２０５０４９号公報

しかしながら、配車計画問題の中でも大規模又は難易度が高い問題では、定式化を工夫した従来の解法では、準局所解から脱出することが非常に難しく、最適な解を得ることが困難となるおそれがある。この理由としては、定式化を工夫した従来の解法では、状態遷移を行う際に、その時点での状態の狭い近傍が探索対象となることが挙げられる。これは、２ウェイ１ホット制約にしたがった状態遷移は、順列に対する操作としては単純な操作であることが原因である。そこで、広い近傍を探索対象とすることで順最適状態を脱出する方法が考えられるが、遷移させる状態変数を増やした場合、探索すべき次の状態の数が爆発的に増えてしまい計算が困難になる。

この点、異なるペナルティ係数を有する２つの評価関数を用いて最適化処理を行う技術では、準局所解からの脱出の確率は高くなるが、広い近傍を探索対象にして２ウェイ１ホット制約にしたがった状態遷移を行う場合の計算量を減らすことは困難である。また、評価関数の値にしたがい遷移確率が大きくなる遷移確率分布に基づいて状態変数の値を更新する技術でも、広い近傍を探索対象にして２ウェイ１ホット制約にしたがった状態遷移を行う場合の計算量を減らすことは困難である。

開示の技術は、上記に鑑みてなされたものであって、２ウェイ１ホット制約にしたがう問題の解を効率的に得る情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。

本願の開示する情報処理装置、情報処理方法及び情報処理プログラムの一つの態様において、探索部は、２ウェイ１ホット制約を含む制約条件が与えられた問題の解を、目的関数に基づく第１行列を重み行列として用いて探索する。遷移部は、前記探索部による探索が特定の状態に達した場合に、前記探索部の探索結果である前記解の一部の値を変更する。重み行列切替部は、前記遷移部により前記解の一部の値の変更が行われた場合に、前記重み行列にペナルティ係数を用いて生成した復帰用行列を前記重み行列として前記探索部に探索を行わせ、前記探索部による探索結果が前記２ウェイ１ホット制約を満たす状態に達すると、前記重み行列を前記第１行列に戻して前記単作部に探索を行わせる。

１つの側面では、本発明は、２ウェイ１ホット制約にしたがう問題の解を効率的に得ることができる。

図１は、２ウェイ１ホット制約を説明するための図である。図２は、実施例に係る最適化装置が有する最適化部の構成図である。図３は、実施例で用いられる重み行列を表す図である。図４は、記憶素子のデータ格納状態の一例を示す図である。図５は、選択回路の一例を示す図である。図６は、実施例に係る最適化装置の制御部の詳細を表すブロック図である。図７は、配車計画問題の一例を示す図である。図８は、行列の要素に与えられるグループ変数の一例を表す図である。図９は、実施例に係る最適化装置による最適化処理のフローチャートである。図１０は、２ウェイ１ホット制約にしたがった最適化処理のフローチャートである。図１１は、２ウェイ１ホット制約を満たす状態に戻すための最適化処理のフローチャートである。

以下に、本願の開示する情報処理装置、情報処理方法及び情報処理プログラムの実施例を図面に基づいて詳細に説明する。なお、以下の実施例により本願の開示する情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。

２ウェイ１ホットイジングモデルに含まれる複数のスピン（スピン数＝Ｎ）に対応するＮ個のビットの値を、状態変数であるｘ_１～ｘ_Ｎで表す場合を考える。以下では、ｘ_ｉと表される状態変数を、状態変数ｘ_ｉ又は単にｘ_ｉと表す場合がある。

この場合、例えば以下の数式（１）の各括弧内のグループで値が１になる状態変数の数が１つのみであるときに１ホット制約が満たされる。

例えば、あるグループ内にｘ_１，ｘ_２，ｘ_３の３つの状態変数がある場合、｛ｘ_１，ｘ_２，ｘ_３｝＝｛１，０，０｝，｛０，１，０｝，｛０，０，１｝という状態は、１ホット制約を満たす。一方、｛ｘ_１，ｘ_２，ｘ_３｝＝｛０，０，０｝，｛１，１，０｝，｛１，０，１｝，｛０，１，１｝，｛１，１，１｝という状態は、１ホット制約を満たさない。

さらに、２ウェイ１ホット制約の場合、２つの条件のグループにおいていずれも１ホット制約を満たす、すなわち各グループで値が１になる状態変数の数が１つとなる。２ウェイ１ホット制約では、例えば２つの条件のグループのいずれもがｎ個の構成要素を有する場合、各グループの構成要をまとめて表す各要素を図１に示すようにｎ×ｎの正方形に並べることができる。この場合、各行の和及び各列の和が全て１となる。図１は、２ウェイ１ホット制約を説明するための図である。図１において、ｍ＝１，２，・・・，Ｎであり、Ｎ＝ｎ^２である。

この場合、２ウェイ１ホット制約を満たすある状態から、２ウェイ１ホット制約を満たす他の状態に遷移させるためには、最適化装置は、１回の状態更新処理において４ビットの値を変化せることになる。例えば、図１において状態変数ｘ_ｊが０の値を有する場合、ｘ_ｊを０から１に遷移させると、ｘ_ｊと同じ行であり値が１である状態変数ｘ_iが１から０に遷移させられる。また、ｘ_ｊと同じ列であり値が１である状態変数ｘ_ｇが１から０に遷移させられる。さらに、ｘ_ｉと同じ列で且つｘ_ｇと同じ行にあるｘ_ｋが０から１に遷移させられる。以下では、ある状態変数の値が０から１又は１から０に遷移させられることを、状態変数の値の反転又はビット反転と呼ぶ。

このように、２ウェイ１ホット制約を満たすある状態から、２ウェイ１ホット制約を満たす他の状態に遷移させるためには、次の数式（２）のように４つの状態変数が遷移する。

この場合の重み値を用いたイジング型のエネルギー関数は、例えば次の数式（３）で定義される。

右辺の１項目は、イジングモデルに含まれる全ビットから選択可能な２つのビットの全組み合わせについて、漏れと重複なく、２つのビットの値（０または１）と重み値との積を積算したものである。ｘ_ｉは、インデックス（ビット識別情報）がｉのビットの値を表す状態変数、ｘ_ｊは、インデックスがｊのビットの値を表す状態変数である。以下では、ｉと表されるインデックスを、インデックスｉ又は単にｉという場合がある。また、Ｗ_ｉｊは、インデックスがｉのビットとｊのビットの相互作用の大きさを示す重み値である。なお、Ｗ_ｉｉ＝０である。また、Ｗ_ｉｊ＝Ｗ_ｊｉであることが多い。

右辺の２項目は、全ビットのそれぞれのバイアス値とビットの値との積の総和を求めたものである。ｂ_ｉは、インデックスｉのビットのバイアス値を示している。

次に、数式（２）において、ｘ_ｉの値が変化して１－ｘ_ｉとなると、ｘ_ｉの増加分は、Δｘ_ｉ＝（１－ｘ_ｉ）－ｘ_ｉ＝１－２ｘ_ｉと表せる。この値の変化に伴うエネルギー変化（ΔＥ_ｉ）は、次の数式（４）で表される。

さらに、前述したように２ウェイ１ホット制約を満たすある状態から２ウェイ１ホット制約を満たす他の状態に遷移するには、４ビットの値を変化させることになる。インデックスのうち数式（２）のようにｉ，ｊ，ｋ，ｇを変化させたとすると、その場合のエネルギー変化は、数式（３）を用いることで次の数式（５）のように求められる。

ｘ_ｉが１から０に変化するとき、Δｘ_ｉは－１となり、ｘ_ｉが０から１に変化するとき、Δｘ_ｉは１となる。なお、ｈ_ｉはローカルフィールド値（局所場）と呼ばれ、Δｘ_ｉに応じてｈ_ｉに符号（＋１または－１）を乗じたものがΔＥ_ｉである。

そして、ｘ_ｊがビット反転した時の局所場ｈ_ｉの変化分δｈ_ｉ ^（ｊ）は次の数式（６）で表される。

すなわち、ｈ_ｉを保存するレジスタを用意してｘ_ｊをビット反転させたときに数式（５）で表される変化分を加算することで正しいｈ_ｉが得られる。

ｘ_ｊが０から１に変化するときのｈ_ｍの変化分は、δｈ_ｍ ^（ｊ）＝＋Ｗ_ｍｊであり、ｘ_ｊが１から０に変化するときのｈ_ｍの変化分は、δｈ_ｍ ^（ｊ）＝－Ｗ_ｍｊである。同様に、ｘ_ｉが変化したときのインデックスがｍであるビットについてのｈ_ｍの変化分は、δｈ_ｍ ^（ｉ）＝Δｘ_ｍＷ_ｍｉと表せる。また、ｘ_ｋが変化したときのインデックスがｍであるビットについてのｈ_ｍの変化分は、δｈ_ｍ ^（ｋ）＝Δｘ_ｍＷ_ｍｋと表せる。また、ｘ_ｇが変化したときのインデックスがｍであるビットについてのｈ_ｍの変化分は、δｈ_ｍ ^（ｋ）＝Δｘ_ｍＷ_ｍｋと表せる。

前述したように、２ウェイ１ホット制約を満たすある状態から２ウェイ１ホット制約を満たす他の状態に遷移するには、４ビットの値を変化させることになる。例えば、状態変数ｘ_ｊが０から１に変化し、状態変数ｘ_ｉが１から０に変化し、状態変数ｘ_ｋが０から１に変化し、状態変数ｘ_ｇが１から０に変化した場合、インデックスがｍである局所場の変化分は次の数式（７）で表される。

ところで、最適化装置が、１回の状態更新処理において４ビットの値を変化させる処理を繰り返して基底状態を探索していく際、各状態更新処理では、エネルギー変化を計算するために、ローカルフィールド値の更新が行われる。例えば、あるグループにおいてインデックスｊ及びインデックスｋのビットの値がともに０から１に変化し、インデックスｉ及びインデックスｇのビットの値がともに１から０に変化する場合、ｎ個のビットについてのｈ_１～ｈ_ｎは、以下の式（８）に基づいて更新される。

数式（８）においてｈ_１’～ｈ_ｎ’は、更新後のローカルフィールド値である。

次に、本実施例に係る最適化装置１の詳細について説明する。図２は、実施例に係る最適化装置が有する最適化部の構成図である。情報処理装置である最適化装置１は、制御部１０及び最適化部２０を有する。最適化部２０は、記憶部２１、局所場生成部２２、エネルギー変化算出部２３、オフセット加算部２４、選択回路２５及び更新部２６を有する。この最適化部２０が、「探索部」の一例にあたる。ここでは、いずれもｎ個の構成要素を有する条件のグループを用いる２ウェイ１ホット制約を有する最適化問題を解く場合で説明する。

記憶部２１は、複数の列の経路を有し、さらに、各列に列数と同数の記憶素子２１０が配置される。例えば、図２では、記憶部２１は、Ｎ個の列の経路を有する。そして、記憶部２１は、各列にＮ個の記憶素子２１０を有する。各列の上から同じ段数に配置された記憶素子２１０は、Ｎ個の要素を有する行にあたる。すなわち、記憶部２１は、Ｎ個のビットのそれぞれの間の相互作用の大きさを示す重み値をＮ×Ｎ行列に並べられた記憶素子２１０により保持する。重み値の行列である重み行列は、初期設定処理時に、制御部１０によって記憶部２１のそれぞれの記憶素子２１０に初期値が格納される。図２では、各行各列それぞれの記憶素子２１０は、行番号がｉで列番号がｊの場合、Ｗ_ｉｊと表される重み値を有する。記憶部２１は、たとえば、レジスタやＳＲＡＭ（Static Random Access Memory）などを用いて実現される。

ここで、記憶部２１の記憶素子２１０に格納される重み行列及び重み値について説明する。図３は、実施例で用いられる重み行列を表す図である。また、図４は、記憶素子のデータ格納状態の一例を示す図である。

本実施例では、重み行列は、状態変数が２ウェイ１ホップ制約を満たしつつ最適化処理を行うための最適化行列３１と、２ウェイ１ホップ制約を満たさない状態変数を２ウェイ１ホップ制約を満たす状態に戻すための復帰用行列３２との２つが用いられる。この最適化行列３１が、「第１行列」の一例にあたる。ここで、最適化行列３１を用いて状態変数が２ウェイ１ホップ制約を満たしつつ最適化処理を行うモードを最適化モードと呼ぶ。また、復帰用行列３２を用いて２ウェイ１ホップ制約を満たさない状態変数を２ウェイ１ホップ制約を満たす状態に戻すモードを復帰モードと呼ぶ。

最適化行列３１は、図３に示すような０行列とディスタンス行列Ｄとを組み合わせた行列である。ディスタンス行列Ｄは、２拠点間の距離に応じたコストを与える行列である。ディスタンス行列Ｄは、例えば、行列３３で表される。行列３３は、最適化行列３１における１行２列目のディスタンス行列Ｄにあたる。

また、復帰用行列３２は、図３に示すように、ペナルティ行列Ｐと修正ディスタンス行列Ｄ’とを組み合わせた行列である。ペナルティ行列Ｐは、２ウェイ１ホット制約における一方の条件に違反する状態変数にペナルティ係数ｐを与える行列であり、行列３５で表される。また、修正ディスタンス行列Ｄ’は、２ウェイ１ホット制約における他方の条件に違反する状態変数にペナルティを与える行列であり、ディスタンス行列Ｄにペナルティ係数ｐを対角成分とする対角行列３４を加算した行列である。例えば、状態変数を行列として並べ、行に並んだ要素で時間経過が表わされ、列に並んだ要素で拠点が表される場合で説明する。この場合、ペナルティ行列Ｐは、時刻Ｔ１に拠点Ｂ１にいて時刻Ｔ１に拠点Ｂ２に移るなど、同時刻に２つ以上の異なる拠点にいてはいけないという条件に違反する状態変数にペナルティを与える行列である。また、修正ディスタンス行列Ｄ’は、時刻Ｔ１及び時刻Ｔ２に拠点Ｂ１にいるなど、１つの拠点に寄る回数は１回という条件に違反する状態変数にペナルティを与え、それ以外には重み値を与える行列である。

さらに、各記憶素子２１０に格納される重み値について説明する。例えば、記憶素子２１０には、図４に示したデータ２１１が格納される。データ２１１には、重み値２１２とフラグ２１３とが含まれる。

ディスタンス行列Ｄのうち対角成分以外の要素にあたる場所に位置する重み値２１２としては、その要素により表される２拠点間の距離に対応したコストを表す値が格納される。これに対して、ディスタンス行列Ｄの対角成分及びペナルティ行列Ｐの対角成分以外の要素にあたる場所に位置する重み値２１２としては、０及びペナルティ係数ｐが格納される。

また、フラグ２１３は、重み値２１２がペナルティ係数ｐであるか２つの拠点間の距離に応じたコストであるかを示す情報が格納される。ここでは、フラグ２１３の値が０の場合に重み値２１２がコストであることを示し、フラグ２１３の値が１の場合に重み値２１２がペナルティ係数であることを示す。すなわち、ディスタンス行列Ｄのうち対角成分以外の要素にあたる場所に位置する重み値２１２には、値が０のフラグ２１３が付加される。これに対して、ディスタンス行列Ｄの対角成分及びペナルティ行列Ｐの対角成分以外の要素にあたる場所に位置する重み値２１２には、値が１のフラグ２１３が付加される。

さらに、記憶素子２１０は、選択回路２１４を有する。選択回路２１４は記憶素子２１０が保持するデータ２１１の入力を受ける。また、選択回路２１４は、最適化装置１の動作モードが最適化モードか復帰モードかを示す情報の入力を制御部１０から受ける。そして、選択回路２１４は、データ２１１のフラグ２１３を確認して重み値２１２がペナルティ係数ｐかコストかを判定する。重み値２１２がコストの場合、選択回路２１４は、重み値２１２の値を常にそのまま出力する。これに対して、重み値２１２がペナルティ係数ｐの場合、選択回路２１４は、最適化装置１が最適化モードで動作する場合には０を出力し、最適化装置１が復帰モードで動作する場合にはペナルティ係数を出力する。

図１に戻って記憶部２１の説明を続ける。選択回路２５により値を反転させる状態変数が選択されると、記憶部２１の各記憶素子２１０に格納された重み値のうち選択された状態変数に対応する重みの値が、反転後の値に書き換えられる。例えば、反転させる状態変数としてｘ_ｊが選択された場合、選択回路２５からインデックスｊが入力され、Ｗ_ｍｊとして表される重み値が書き換えられる。

ここで、２ウェイ１ホット制約を受けて最適化モードで動作する場合は、４ビットまとめて反転させられる。そのため、最適化モードの場合、記憶部２１の各記憶素子２１０に格納された重み値のうち、選択回路２５から指定されたインデックスに対応する他の３つのビットを示すインデックスで識別される記憶素子２１０が保持する重み値も書き換えられる。例えば、図１に示した行列の場合、インデックスｊに対応する他の３つのビットを示すインデックスはｉ，ｋ，ｇである。

局所場生成部２２は、記憶部２１の行列に並べられた記憶素子２１０の各列に対応するように配置された複数の局所場生成回路２２０を有する。各局所場生成回路２２０は、対応する列に並べられた各記憶素子２１０が有する重み値を取得する。そして、各局所場生成回路２２０は、取得した重み値を用いて局所場の値であるローカルフィールド値を生成する。

図１の例では、局所場生成部２２は、Ｎ個のビットのそれぞれについてのローカルフィールド値であるｈ_１，ｈ_２，…，ｈ_Ｎを生成する局所場生成回路２２０を有する。局所場生成回路２２０のそれぞれは、図示を省略しているが保持部（たとえば、レジスタ）を有し、それぞれが保持するローカルフィールド値であるｈ_１～ｈ_Ｎの保持及び更新を行う。

例えば、状態変数ｘ_ｊが更新された場合、各局所場生成回路２２０は、それぞれに対応する重み値Ｗ_ｊ１，Ｗ_ｊ２，～，Ｗ_ｊＮを保持する局所場に加算又は減算することで局所場を更新する。具体的には、ｉ行に対応する局所場生成回路２２０は、状態変数ｘ_ｊが０から１に遷移した場合は、重み値Ｗ_ｊｉを局所場ｈ_ｉに加算し、状態変数ｘ_ｊが１から０に遷移した場合は、重み値Ｗ_ｊｉを局所場ｈ_ｉから減算する。ここで、上述したように２ウェイ１ホットの場合４ビットが反転するので、局所場生成回路２２０は、数式（７）を自己が保持する局所場に加算又は減算することで局所場を更新する。

ｈ_１～ｈ_Ｎの初期値は、例えば、バイアス値ｂ_１～ｂ_Ｎであり、初期設定処理時に、制御部１０により設定される。局所場生成回路２２０は、たとえば、レジスタのほかに、加算器または減算器を用いて実現される。

さらに、局所場生成部２２は、動作モードが最適化モードから復帰モードへ変更された場合、変更時点で局所場であるローカルフィールド値の再計算を各局所場生成回路２２０に行わせる。これは、動作モードが最適化モードから復帰モードへ変更される場合、１の値を有する適当な状態変数が制御部１０により０に強制的に遷移させられるため、２ウェイ１ホット制約の制約違反が発生するとともに、局所場が大きく変化するためである。ただしこの場合、局所場生成部２２は、局所場の計算を始めからやり直させるわけではなく、２ウェイ１ホット制約の制約違反が発生した行及び列に含まれる変数の局所場にペナルティ係数ｐの２倍を足し込ませることで再計算を行わせる。

エネルギー変化算出部２３は、局所場生成部２２が生成したローカルフィールド値に基づいて、エネルギー変化を計算する。図１の例では、エネルギー変化算出部２３は、記憶部２１の記憶素子２１０の列に対応するＮ個のビットのそれぞれが変化する場合のエネルギー変化であるΔＥ_１，ΔＥ_２，…，ΔＥ_Ｎをそれぞれ算出するエネルギー変化算出回路２３０を有する。図２では、一例として、局所場ｈ_ｉを保持する局所場生成回路２２０から各エネルギー変化算出回路２３０へ延びる経路を図示したが、他の局所場生成回路２２０からも全てのエネルギー変化算出回路２３０へ経路が延びる。

エネルギー変化算出回路２３０は、数式（５）を用いてエネルギー変化量を算出する。具体には、ΔＥ_ｊは、数式（２）のように４つの状態変数が遷移した場合のエネルギー変化量である。その後、各エネルギー変化算出回路２３０は、算出したエネルギー変化量を選択回路２５へ出力する。

オフセット加算部２４は、各エネルギー変化算出回路２３０から出力されるエネルギー変化量を監視する。そして、各エネルギー変化算出回路２３０から出力されるエネルギー変化量が全て正の場合、オフセット加算部２４は、各値にオフセットを加算する。オフセットは負の値であり、オフセット加算部２４は、エネルギー変化量が負の値、すなわちエネルギーが下がる場合のエネルギー変化量が現れるように調整する。

選択回路２５は、各エネルギー変化算出回路２３０から出力されるエネルギー変化量の入力を受ける。ここで、エネルギー変化量が全て正だった場合には、選択回路２５は、オフセット加算部２４によりオフセットが加えられた値の入力を受ける。

選択回路２５は、熱励起エネルギーと、複数のエネルギー変化算出回路２３０がそれぞれ出力するエネルギー変化量との大小関係に基づいて、値の更新を許容する１つを識別するインデックスを出力する。熱励起エネルギーは、乱数と、制御部１０から入力される温度パラメータとに基づいて決定される。最適化装置１においてシミュレーテッド・アニーリングが行われる場合、温度パラメータは、例えば、制御部１０によって、イジングモデルの状態を更新する処理が所定回数繰り返される毎に、値が小さくなるように制御される。また、エネルギーの減少する方向への状態変化を選ぶこともできるが、この場合局所最小値で停止する。そこで、エネルギーが増加する変化も確率的に許容する選択が行われる。

図５は、選択回路の一例を示す図である。図５の選択回路２５は、並列指向で更新ビットの候補を選ぶ回路である。入力端子２５１は、エネルギー変化算出回路２３０から出力されたエネルギー変化量に対応するインデックスの値の入力を受ける端子である。各端子は２つずつセレクタ２５２に接続される。さらに、セレクタ２５２からの出力は２つずつ次の段のセレクタ２５２に接続される。

選択回路２５は、エネルギー変化算出回路２３０から入力されたエネルギー変化量は制御部１０から入力される温度パラメータと比較して、状態変数の遷移を受け入れ可能か否かを判定する。例えば、選択回路２５は、エネルギー変化量が温度パラメータから算出される所定値未満の場合に状態変数の遷移を受け入れ可能と判定する。そして、選択回路２５は、状態変数の遷移を受け入れ可能と判定したエネルギー変化に対応するインデックスに対して更新可能フラグを設定する。そして、選択回路２５は、入力端子２５１のそれぞれに各エネルギー変化に対応するインデックスを入力して、セレクタ２５２によりトーナメントを行う。

セレクタ２５２は、例えば、図５の紙面に向かって右側の回路により実現される。この回路を有するセレクタ２５２は、２つのステータス０１及び０２の入力を受け、それぞれからフラグＦ１及びＦ２、並びに、インデックス＃１及び＃２を取得する。そして、セレクタ２５２は、乱数の入力を受けて、更新可能フラグの立ったインデックス０１又は０２のうちいずれか１つを選択する。セレクタ２５２は、選択した方の０又は１を示すエントリ番号をインデックスの上位に付け加える。そして、セレクタ２５２は、選択したインデックスを次の段のセレクタ２５２へ出力する。最終段のセレクタ２５２が選択したインデックスが、選択回路２５により選ばれたビットを示す。この選択回路２５により選択されたインデックスの情報は、更新部２６へ出力されるとともに、記憶部２１に送られる。これにより、インデックスで識別される記憶素子２１０及び対応する他のビットを表すインデックスで識別される記憶素子２１０が保持する重み値が更新される。

更新部２６は、それぞれが状態変数を表すＮ個のビットの値（ｘ_１～ｘ_Ｎ）を保持する記憶部２６０を有する。記憶部２６０は、たとえば、レジスタやＳＲＡＭなどを用いて実現される。更新部２６は、選択回路２５から入力されたインデックスによって識別されるビットの値を０から１に更新する。さらに、更新部２６は、選択回路２５から入力されたインデックスに対応する他の３ビットの値を更新する。例えば、図１に示す状態変数ｘ_ｊを示すインデックスｊが選択回路２５から入力された場合、更新部２６は、インデックスｉ，ｋ，ｇで識別されるビットの値を更新する。この場合、更新部２６は、数式（２）で示すように各値を更新する。

更新部２６は、状態変数の更新完了の通知を制御部１０へ出力する。さらに、更新部２６は、更新後の各状態変数の値も制御部１０へ出力する。

次に、制御部１０について説明する。図６は、実施例に係る最適化装置の制御部の詳細を表すブロック図である。制御部１０は、図６に示すように、上限算出部１１、目的関数生成部１２、初期化実行部１３、候補決定部１４、温度管理部１５、更新制御部１６、通知部１７、強制遷移部１８及び重み行列切替部１９を有する。制御部１０は、例えば、ＦＰＧＡ（Field Programmable Gate Array）により実現される。より具体的には、プログラミングされたＦＰＧＡに含まれる演算器及び記憶部により上限算出部１１、目的関数生成部１２、初期化実行部１３、候補決定部１４、温度管理部１５、更新制御部１６、通知部１７、強制遷移部１８及び重み行列切替部１９の機能が実現される。

ここでは、最適化装置１が配車計画問題（ＣＶＲＰ）を解く場合で説明する。図７は、配車計画問題の一例を示す図である。配車計画問題では、図７に示すように、集積所１０１及び荷物の配送先となる拠点１０２の位置が決められる。また、集積所１０１及び各拠点１０２の相互間の距離及び車の積載上限値が与えられる。さらに、各拠点１０２へ配送する荷物の量にあたる需要量が与えられる。そして、集積所１０１から出発して集積所１０１に帰着する複数台の車で各拠点１０２に物資を運ぶ。以上の条件で、全車が走行した総距離が最小となるルートを求める問題が、配車計画問題である。図５では、４台の車を用いて４つのルートで物資が運ばれる場合の配車計画問題を表す。

初期化実行部１３は、解答する配車計画問題の条件の入力を受ける。この配車計画問題の条件である問題インスタンスは、配送先の拠点１０２の数、集積所１０１及び拠点１０２のそれぞれの間の距離、ルートの数などを含む。この入力された条件に応じた各要素は、いずれのルートに含まれるかという条件のグループを示す構成要件と、どの時点で配送を行う拠点化を示す条件のグループを示す構成要件とを示す行列を用いて表される。いずれのルートに含まれるかという条件のグループを示す構成要件及びどの時点で配送を行う拠点化を示す条件のグループを示す構成要件が、「２つのグループのそれぞれに含まれる所定数の構成要素」の一例にあたる。初期化実行部１３は、配車計画問題の条件を上限算出部１１へ出力する。

その後、初期化実行部１３は、２ウェイ１ホット制約を満たす状態変数の各ビットを表す行列の情報及び目的関数の入力を目的関数生成部１２から受ける。そして、初期化実行部１３は、行列の要素に合わせて記憶部２１の最適化に使用する記憶素子２１０を選択する。次に、初期化実行部１３は、目的関数から各状態変数に対応する重み値を取得して、各記憶素子２１０に対応する重み値を設定する。

次に、初期化実行部１３は、状態変数ｘ_１～ｘ_Ｎを全て０に設定した後に、２ウェイ１ホットの制約を満たすように、状態変数ｘ_１～ｘ_Ｎを表す各ビットを０又は１に設定する。そして、初期化実行部１３は、状態変数ｘ_１～ｘ_Ｎを表す各ビットの値を最適化部２０へ出力する。これにより、更新部２６が有する記憶部２６０に初期状態の各ビットの値が記憶されるとともに、各ビットの状態に応じて、局所場生成部２２により各局所場であるｈ_１～ｈ_Ｎが生成され保持される。

また、図８は、行列の要素に与えられるグループ変数の一例を表す図である。初期化実行部１３は、行列における同じ行の要素を同じ行グループとして行グループ番号を割り当て、同じ列の要素を同じ列グループとして列グループ番号を割り当てる。そして、初期化実行部１３は、各要素を表すインデックスと行グループ番号及び列グループ番号とを対応付ける。

そして、初期化実行部１３は、各要素を表すインデックスに対応付けられたグループ変数の情報を候補決定部１４へ出力する。さらに、初期化実行部１３は、初期温度の設定を温度管理部１５に通知する。

上限算出部１１は、拠点１０２の需要量を小さい順に並べる。次に、上限算出部１１は、Ｍ番目のルートの最大拠点数を算出する際に、並べた需要量の先頭からＭ－１番目までの拠点数を含めた累積需要量を計算する。次に、上限算出部１１は、「Ｍ×車の積載上限値」を越えない最小の拠点数を特定する。そして、上限算出部１１は、特定した拠点数をＭで割った時の商をＮ番目のルートの最大拠点数とする。これは、需要量を小さい順に並べたことにより需要量は対象減少列となり、Ｍ番目のルートが「Ｍ×車の積載上限値」を越えない最小の拠点数をＭで割った数よりも大きくなることは矛盾であることを理由とする。上限算出部１１は、Ｍを１から車の台数の上限まで変化させて１番目から車の台数の上限番目までの各ルートの最大拠点数を求める。その後、上限算出部１１は、各ルートの最大拠点数の情報を目的関数生成部１２へ出力する。

目的関数生成部１２は、各ルートの最大拠点数の情報の入力を上限算出部１１から受ける。次に、目的関数生成部１２は、各ルートの最大拠点数の総和と拠点１０２の数との差分を算出する。そして、目的関数生成部１２は、算出した差分の値を冗長拠点（ダミーデポ）の数とする。次に、目的関数生成部１２は、ルート毎の最大拠点数までを順番に並べた行と、冗長拠点を含む拠点を並べた行とで表現される行列を作成する。すなわち、行が延びる方向を時間経過とすると、この行列はどの時点で実際の拠点１０２に冗長拠点を加えた拡大拠点のうちどの拠点を車が訪れるかを表す。各行がいずれのルートに踏まれる拠点かを示す条件のグループであり、各列がどの時点で配送を行う拠点かを示す条件のグループである。

そして、目的関数生成部１２は、拠点１０２にｉ＝０，１，２，・・・と番号を振り、時刻ｔにインデックスｉの拠点１０２に車がいればｘ_ｉｔを１とし、車がいなければｘ_ｉｔを０として、状態変数を表すビットを設定する。

この行列は、１行目から第１ルートの最大拠点数の行までが第１ルートを走行する車の位置を表し、その次の行から第２ルートの最大拠点数の行までが第２ルートを走行する車の位置を表す。このように順番にルートの番号を増やしていき、この行列の最終行から第Ｎルートの最大拠点数前までが第Ｎルートを走行する車の位置を表す。この行列は、行の数と列の数が一致しており、且つ、「各行、各列の１の数は１個」という２ウェイ１ホットの制約を満たす。

その上で、目的関数生成部１２は、目的関数を次の数式（９）と定義する。

Ｅ（ｘ，ｙ）は、エネルギーを表す。そして、Ｃ（ｘ）は、コストの総和を表す。また、Ｐ_１（ｘ）は、冗長拠点の制約を表す。また、Ｐ_２（ｘ，ｙ）は、スラック変数ｙの不等式制約を表す。

目的関数生成部１２は、生成した行列の情報及びエネルギー関数を初期化実行部１３へ出力する。

温度管理部１５は、初期温度設定の指示を初期化実行部１３から受ける。そして、温度管理部１５は、高い温度である初期温度を温度パラメータとして設定する。そして、温度管理部１５は、温度パラメータを最適化部２０へ通知する。その後、温度管理部１５は、更新制御部１６からの温度低下の指示を受けると、予め指定された温度スケジュールにしたがって温度パラメータの値を小さくしていく。温度管理部１５は、温度パラメータを変更する毎に変更後の温度パラメータを最適化部２０へ通知する。

候補決定部１４は、各インデックスを表すグループ変数の情報の入力を初期化実行部１３から受ける。また、候補決定部１４は、最適化装置１の動作モードの入力を更新制御部１６から受ける。そして、候補決定部１４は、動作モードに合わせて遷移の候補となる反転させる状態変数を表すインデックスを決定して、最適化部２０に通知する。以下に、遷移の候補となる反転させる状態変数の選択方法について説明する。

動作モードが最適化モードの場合について説明する。候補決定部１４は、グループ変数の情報を用いて、値を反転させる状態変数を表すインデックスを選択する。例えば、候補決定部１４は、図１に示した行列における状態変数ｘ_ｊを示すインデックスｊを選択する。そして、候補決定部１４は、選択したインデックスに応じて２ウェイ１ホット制約から決まる他の３つのビットを示すインデックスを特定する。例えば、候補決定部１４は、図１に示した行列における状態変数ｘ_ｊを示すインデックスｊを最初に選択した場合、他の３つのインデックスとして、ｉ，ｋ，ｇを選択する。次に、候補決定部１４は、選択したインデックスに対応する状態変数を、値を反転させる候補とすることを決定する。そして、候補決定部１４は、状態変数の値を反転させる候補とすることを決定したインデックスを最適化部２０に通知する。

候補決定部１４は、１からＮまで１つずつ反転させるインデックスｊを選択することで、全てのインデックスについて、各インデックスにより示される状態変数をビット反転の候補とするか否かを判定して、最適化部２０へ通知する。

次に、動作モードが復帰モードの場合について説明する。この場合、２ウェイ１ホット制約を受けないため、候補決定部１４は、グループ変数の情報を用いて、値を反転させる状態変数を表すインデックスを１から順にＮまで選択する。そして、候補決定部１４は、選択毎に、状態変数の値を反転させる候補とすることを決定したインデックスを最適化部２０に通知する。

その後、候補決定部１４は、次の状態変数ｘの選択の指示を更新制御部１６から受けると、動作モードに合わせて再び１から順にＮまでのインデックスの選択を行い、それぞれの状態変数をビット反転の候補とするか否かを最適化部２０へ通知する。

更新制御部１６は、状態変数の更新完了の通知を最適化部２０から受ける。この時、更新制御部１６は、各状態変数の値の入力も最適化部２０から受ける。そして、更新制御部１６は、更新後の状態変数の値の情報を順次蓄積し、直近の情報を用いて局所解に陥ったか否かを判定する。

局所解に陥っている場合、更新制御部１６は、局所解からの脱出させるために、強制遷移処理の実行を強制遷移部１８に指示する。さらに、更新制御部１６は、動作モードの最適化モードから復帰モードへの変更を候補決定部１４、重み行列切替部１９及び最適化部２０に通知する。

復帰モードへの遷移の後、更新制御部１６は、状態変数の更新完了の通知を最適化部２０から受けるときに、各状態変数の値も最適化部２０から取得する。そして、更新制御部１６は、状態変数の値が２ウェイ１ホット制約を満たす状態か否かを判定する。２ウェイ１ホット制約を満たさない状態であれば、更新制御部１６は、復帰モードでの動作を継続させ、２ウェイ１ホット制約を満たす状態に復旧するための状態遷移を繰り返させる。これに対して、２ウェイ１ホット制約を満たす状態の場合、更新制御部１６は、最適化モードへの復旧を決定する。そして、更新制御部１６は、復帰モードから最適化モードへの変更を候補決定部１４、重み行列切替部１９及び最適化部２０に通知する。

一方、局所解に陥っていなければ、更新制御部１６は、同じ温度設定で規程回数の状態変数の選択を行ったか否かを判定する。同じ温度設定での規程回数の状態変数の選択を行っていない場合、更新制御部１６は、次の状態変数ｘの選択を候補決定部１４に指示する。

これに対して、同じ温度設定での規程回数の状態変数の選択が完了した場合、更新制御部１６は、温度を所定回数下げたか否かを判定する。温度を下げた回数が所定回数に達していない場合、更新制御部１６は、温度低下を温度管理部１５に指示するとともに、次の状態変数ｘの選択を候補決定部１４に指示する。

これに対して、温度を下げた回数が所定回数に達した場合、更新制御部１６は、最適化処理の終了を決定する。そして、更新制御部１６は、最適化部２０の更新部２６が有する記憶部２６０に格納された各状態変数（ｘ_１～ｘ_Ｎ）を表すＮ＝ｎ^２個のビットの値を取得する。そして、更新制御部１６は、取得した各状態変数（ｘ_１～ｘ_Ｎ）を表すＮ＝ｎ^２個のビットの値の中から冗長拠点を表す状態変数のビット値を削除する。そして、更新制御部１６は、実際の拠点１０２を巡回する最適化されたルートを示す情報を通知部１７へ出力する。

ここで、更新制御部１６は、本実施例では局所解に陥った場合に強制遷移処理の実行を決定したが、強制遷移処理の実行の機会はこれに限らない。例えば、更新制御部１６は、１００回に１回や１万回に１回といったように予め決められた回数のイテレーションが終了したときに、強制遷移処理の実行を決定してもよい。また、更新制御部１６は、選択回路２５によりｘ_１～ｘ_Ｎの遷移が全て否決されたときに、強制遷移処理の実行を決定してもよい。他にも、更新制御部１６は、エネルギーの変化が小さい状態が所定回数続いた場合に、強制遷移処理の実行を決定してもよい。

通知部１７は、実際の拠点１０２を巡回する最適化されたルートを示す情報の入力を更新制御部１６から受ける。そして、通知部１７は、取得した実際の拠点１０２を巡回する最適化されたルートを示す情報から最適なルートを求めて、求めた最適なルートを利用者が使用する端末装置（不図示）などに送信することで利用者に通知する。

強制遷移部１８は、局所解に陥った場合に局所解からの脱出のための強制遷移処理の実行の指示を更新制御部１６から受ける。ここで、局所解に陥った場合が、「探索が特定の状態に達した場合」の一例にあたる。そして、強制遷移部１８は、予め決められたアルゴリズムにしたがい値を強制的に遷移させる行グループ及び列グループを選択する。例えば、強制遷移部１８は、各拠点を巡回するルートにおいて、異なるルート同士が接近している場所や重なった場所における拠点の巡回を示す情報を含む行グループ及び列グループを選択する。図７の場合、強制遷移部１８は、領域１２１及び１２２を異なるルート同士が接近している場所や重なった場所として、領域１２１及び１２２における拠点の巡回を示す情報を含む行グループ及び列グループを選択する。

その後、強制遷移部１８は、選択した行グループ及び列グループに含まれる状態変数のうち値が１の状態変数の値を強制的に０に遷移させる。これにより、状態変数は、現在の状態から大きく変化した状態に遷移するとともに、２ウェイ１ホット制約に対して制約違反の状態となる。

ここで、本実施例に係る強制遷移部１８は、所定のアルゴリズムを用いて強制的に状態変数の値を遷移させる行グループ及び列グループを選択したが、選択方法はこれに限らない。例えば、強制遷移部１８は、ランダムに強制的に遷移させる行グループ及び列グループを選択してもよい。さらに、強制遷移部１８は、強制的に遷移させる行グループ及び列グループの指定を図示しない管理者端末などから受けてもよい。また、最適化の段階に応じて強制的に遷移させる行グループ及び列グループを決定することがよい場合も考えられる。その場合、強制遷移部１８は、その時点での状態変数を最適化部２０の更新部２６から取得して外部の装置へ出力し、外部の装置に解析を行わせていずれのビットを変更することが適切かを計算させて、その計算結果に基づいて選択を行ってもよい。この強制遷移部１８が、「遷移部」の一例にあたる。

重み行列切替部１９は、動作モードの最適化モードから復帰モードへの変更の通知を更新制御部１６から受ける。そして、重み行列切替部１９は、最適化装置１の動作が復帰モードであることを示す信号を最適化部２０の記憶部２１及び局所場生成部２２に対して送信する。これにより、記憶部２１の各記憶素子２１０の中でペナルティ係数ｐを保持する記憶素子２１０からペナルティ係数ｐが出力されるようになる。すなわち、図３の復帰用行列３２が局所場の計算に用いられるようになる。また、局所場生成部２２の各局所場生成回路２２０は、局所場を表すローカルフィールド値を再計算する。

その後、状態変数が２ウェイ１ホット制約を満たす状態に達すると、重み行列切替部１９は、動作モードの復帰モードから最適化モードへの変更の通知を更新制御部１６から受ける。そして、重み行列切替部１９は、最適化装置１の動作が最適化モードであることを示す信号を最適化部２０の記憶部２１に対して送信する。これにより、記憶部２１の各記憶素子２１０の中でペナルティ係数ｐを保持する記憶素子２１０は、０を出力する状態に戻る。すなわち、最適化行列３１が局所場の計算に用いられる状態に戻る。

図９は、実施例に係る最適化装置による最適化処理のフローチャートである。次に、図７を参照して、実施例に係る最適化装置１による最適化処理の流を説明する。この最適化処理は、最適化装置１において実行される情報処理プログラムにより実現される。

初期化実行部１３は、配車計画問題の条件の入力を受ける。そして、初期化実行部１３は、取得した配車計画問題の条件を上限算出部１１へ出力する。上限算出部１１は、需要量が小さい順に配送先となる拠点１０２を並べる。次に、上限算出部１１は、需要量が小さい順に並べられた拠点１０２を先頭から順に選択して選択した拠点１０２までの累積需要量と車の積載上限値とを用いて各ルートの最大拠点数を算出する。目的関数生成部１２は、最大拠点数を用いて冗長拠点を設定し、冗長拠点と実際の拠点１０２とを含む拡大拠点について含まれるルートと配送順とを示す行列を生成する。そして、目的関数生成部１２は、生成した行列の各要素を表すビットを与えて、それらのビットを用いて目的関数を生成する。初期化実行部１３は、目的関数生成部１２により生成された行列及び目的関数を取得する。次に、初期化実行部１３は、以下に示すグループインデックスの設定及び初期化プロセスを実行する（ステップＳ１）。

具体的には、初期化実行部１３は、取得した行列の行毎の各要素に各行を示す行グループ番号を与え、且つ、列毎の各要素に各列を示す列グループ番号を与える。そして、初期化実行部１３は、各要素を表すインデックスと行グループ番号及び列グループ番号とを対応付ける。さらに、初期化実行部１３は、各インデックスが冗長拠点への配送を示すか否かにより冗長変数グループに属するか否かを表す情報を設定する。

また、初期化実行部１３は、行列の各要素に応じた最適化部２０の記憶部２１が有する記憶素子２１０を確保し、目的関数から取得したビット毎の重み値を格納させる。さらに、初期化実行部１３は、２ウェイ１ホットを満たすように各ビットの初期値を設定して最適化部２０に通知する。これにより、最適化部２０は、局所場生成部２２は局所場であるｈ_１～ｈ_Ｎを計算して保持するとともに、更新部２６が有する記憶部２６０に各ビットの初期値を格納する。

温度管理部１５は、初期化実行部１３からの温度の設定の指示を受ける。そして、温度管理部１５は、温度設定を未だ行っていない場合、高い温度である初期温度を最適化部２０に通知して初期温度を設定する。また、既に温度設定済みの場合、温度管理部１５は、その時点で設定済みの設定温度から予め指定された温度スケジュールにしたがって温度を下げる。そして、温度管理部１５は、温度を下げた新たな設定温度を最適化部２０に通知して温度を設定する（ステップＳ２）。

制御部１０及び最適化部２０は、２ウェイ１ホット制約にしたがった最適化処理を実行する（ステップＳ３）。

その後、制御部１０の更新制御部１６は、最適化部２０における状態変数及び局所場の更新が完了すると、更新された各状態変数の値を基に局所解に陥ったか否かを判定する（ステップＳ４）。

局所解に陥った場合（ステップＳ４：肯定）、更新制御部１６は、局所解からの脱出のための強制遷移処理の実行を強制遷移部１８に指示する。強制遷移部１８は、決められたアルゴリズムにしたがって強制的に値を遷移させる行グループ及び列グループを選択する。そして、強制遷移部１８は選択した行グループ及び列グループにおける１の値を有する状態変数の値を０に遷移させる（ステップＳ５）。

また、更新制御部１６は、動作モードの復帰モードへの変更を記憶部２１及び局所場生成部２２に通知する。そして、記憶部２１の記憶素子２１０が有する選択回路２１４に復帰モードを示す信号が入力される。選択回路２１４は、フラグ２１３を用いて入力された重み値がペナルティ係数ｐであるか否かを判定し、重み値がペナルティ係数ｐである場合、入力されたペナルティ係数ｐを表す重み値を出力する。この時、重み値がコストである場合も、選択回路２１４は、コストを表す重み値を出力する。これにより、記憶部２１は、使用される重み行列を復帰用行列３２に変更する（ステップＳ６）。

局所場生成部２２は、動作モードの復帰モードへの変更の通知を更新制御部１６から受けて、いくつかの状態変数の値が強制的に１から０に遷移された後の局所場の再計算を各局所場生成回路２２０に行わせる（ステップＳ７）。

そして、制御部１０及び最適化部２０は、２ウェイ１ホット制約を満たす状態に戻すための最適化処理を実行する（ステップＳ８）。

その後、制御部１０の更新制御部１６は、最適化部２０における状態変数及び局所場の更新が完了すると、更新された各状態変数の値を基に２ウェイ１ホット制約を満たす状態に戻ったか否かを判定する（ステップＳ９）。

状態変数が２ウェイ１ホット制約を満たす状態に戻っていない場合（ステップＳ９：否定）、最適化処理は、ステップＳ８を繰り返す。

これに対して、状態変数が２ウェイ１ホット制約を満たす状態に戻った場合（ステップＳ９：肯定）、更新制御部１６は、動作モードの最適化モードへの復旧を記憶部２１に通知する。そして、記憶部２１の記憶素子２１０が有する選択回路２１４に最適化モードを示す信号が入力される。選択回路２１４は、フラグ２１３を用いて入力された重み値がペナルティ係数ｐであるか否かを判定し、重み値がペナルティ係数ｐである場合、重み値として０を出力する。この時、重み値がコストであれば、選択回路２１４は、コストを表す重み値を出力する。これにより、記憶部２１は、使用される重み行列を最適化行列３１に戻す（ステップＳ１０）。その後、最適化処理は、ステップＳ３へ戻る。

一方、局所解に陥っていない場合（ステップＳ４：否定）、更新制御部１６は、状態変数の更新が規程回数終了したか否かを判定する（ステップＳ１１）。状態変数の更新が規程回数に達していない場合（ステップＳ１１：否定）、最適化処理は、ステップＳ３に戻る。

これに対して、状態変数の更新が規程回数終了した場合（ステップＳ１１：肯定）、更新制御部１６は、温度を規程回数下げたか否かを判定する（ステップＳ１２）。

温度を規程回数下げていない場合（ステップＳ１２：否定）、最適化処理は、ステップＳ２へ戻る。これに対して、温度を規程回数下げた場合（ステップＳ１２：肯定）、最適化装置１は、最適化処理を終了する。

図１０は、２ウェイ１ホット制約にしたがった最適化処理のフローチャートである。次に、図１０を参照して、２ウェイ１ホット制約にしたがった最適化処理の流れを説明する。図１０に示した各処理は、図９におけるステップＳ３で実行される処理の一例にあたる。

候補決定部１４は、各状態変数を表すインデックスに対応付けられたグループ変数の情報を初期化実行部１３から取得する。次に、候補決定部１４は、反転させる状態変数を表すインデックスとして図１に示した行列の要素のうちｘ_ｊに対応するインデックスｊを選択する。次に、候補決定部１４は、選択したインデックスｊに応じて２ウェイ１ホット制約から決まる他の３つのビットを示すインデックスとして、図１に示した行列の状態変数ｘ_ｉ，ｘ_ｋ，ｘ_ｇに対応するインデックスであるｉ，ｋ，ｇを特定する（ステップＳ１０１）。候補決定部１４は、インデックスを１からＮまで順番にインデックスｊとして選択する。

候補決定部１４は、インデックスｉ，ｊ，ｋ，ｇを最適化部２０に通知する。最適化部２０は、更新部２６が有する記憶部２６０に保持されたｘ_ｊの値を読み出す。そして、最適化部２０は、ｘ_ｊの値の遷移が０から１か１から０かをエネルギー変化算出部２３に通知する。エネルギー変化算出部２３は、ｊに対応した局所場であるｈ_ｊを読み出し、さらに、ｊに対応するｉ，ｋ，ｇを特定し、ｈ_ｉ，ｈ_ｋ，ｈ_ｇを保持する局所場生成回路２２０のそれぞれからｈ_ｉ，ｈ_ｋ，ｈ_ｇを読み出す（ステップＳ１０２）。

次に、エネルギー変化算出部２３は、各ｊについてエネルギー変化量であるΔＥ（ΔＥ_１，ΔＥ_２，・・・，ΔＥ_Ｎ）を計算する（ステップＳ１０３）。その後、エネルギー変化算出部２３は、算出したエネルギー変化量の情報を出力する。

オフセット加算部２４は、エネルギー変化算出部２３から出力されたエネルギー変化量が全て正の場合、各エネルギー変化量にオフセットを加算する（ステップＳ１０４）。

選択回路２５は、エネルギー変化算出部２３から出力された各エネルギー変化量の情報を取得する。そして、選択回路２５は、制御部１０の温度管理部１５から取得した設定温度と比較して値の反転を受け入れ可能な状態変数を示すインデックスに更新可能フラグを設定する。その後、選択回路２５は、更新可能フラグが付加されたインデックスの中から１つのインデックスｑを選択する（ステップＳ１０５）。

最適化部２０は、各インデックスに割り当てられたグループ変数の情報を制御部１０から取得する。そして、最適化部２０は、選択回路２５により選択されたインデックスｑが示す状態変数ｘ_ｑの値の反転に対応して２ウェイ１ホット制約を満たして値が反転する状態変数ｘ_ｐ，ｘ_ｒ，ｘ_ｓを示すインデックスｐ，ｒ，ｓを特定する。そして、最適化部２０は、インデックスｐ，ｒ，ｓを表すグループ変数を特定する（ステップＳ１０６）。

記憶部２１は値が更新される状態変数を示すインデックスであるｐ、ｑ、ｒ、ｓの情報が入力され、そのインデックスに対応した重み値が局所場生成部２２の各局所場生成回路２２０へ出力される。各局所場生成回路２２０は、ｐ、ｑ、ｒ、ｓの更新に対応した重み値の入力を受けて、保持する局所場を更新する（ステップＳ１０７）。

さらに、記憶部２１は、インデックスｐ、ｑ、ｒ、ｓに対応する記憶素子２１０に格納された重み値を更新する（ステップＳ１０８）。

更新部２６は、値が更新される状態変数を示すインデックスであるｐ、ｑ、ｒ、ｓの情報が入力され、記憶部２６０が保持する状態変数の中から取得したインデックスで示される状態変数であるｘ_ｐ，ｘ_ｑ，ｘ_ｒ，ｘ_ｓを特定する。そして、更新部２６は、特定した状態変数であるｘ_ｐ，ｘ_ｑ，ｘ_ｒ，ｘ_ｓの値を反転させて更新する（ステップＳ１０９）。

その後、更新部２６は、記憶部２６０に更新後の全ての状態変数を書き込む。また、各局所場生成回路２２０は、保持するレジスタに更新後の局所場を書き込む（ステップＳ１１０）。

図１１は、２ウェイ１ホット制約を満たす状態に戻すための最適化処理のフローチャートである。次に、図１１を参照して、２ウェイ１ホット制約を満たす状態に戻すための最適化処理の流れを説明する。図１１に示した各処理は、図９におけるステップＳ８で実行される処理の一例にあたる。

候補決定部１４は、各状態変数を表すインデックスに対応付けられたグループ変数の情報を初期化実行部１３から取得する。次に、候補決定部１４は、反転させる状態変数を表すインデックスとして図１に示した行列の要素のうちｘ_ｊに対応するインデックスｊを選択する（ステップＳ２０１）。候補決定部１４は、インデックス１からインデックスＮまで順番にインデックスｊとして選択する。

候補決定部１４は、インデックスｊを最適化部２０に通知する。最適化部２０は、更新部２６が有する記憶部２６０に保持されたｘ_ｊの値を読み出す。そして、最適化部２０は、ｘ_ｊの値の遷移が０から１か１から０かをエネルギー変化算出部２３に通知する。エネルギー変化算出部２３は、ｊに対応した局所場であるｈ_ｊを読み出す。次に、エネルギー変化算出部２３は、各ｊについてエネルギー変化量であるΔＥ（ΔＥ_１，ΔＥ_２，・・・，ΔＥ_Ｎ）を計算する（ステップＳ２０２）。その後、エネルギー変化算出部２３は、算出したエネルギー変化量の情報を出力する。

オフセット加算部２４は、エネルギー変化算出部２３から出力されたエネルギー変化量が全て正の場合、各エネルギー変化量にオフセットを加算する（ステップＳ２０３）。

選択回路２５は、エネルギー変化算出部２３から出力された各エネルギー変化量の情報を取得する。そして、選択回路２５は、制御部１０の温度管理部１５から取得した設定温度と比較して値の反転を受け入れ可能な状態変数を示すインデックスに更新可能フラグを設定する。その後、選択回路２５は、更新可能フラグが付加されたインデックスの中から１つのインデックスｑを更新するインデックスとして選択する（ステップＳ２０４）。

記憶部２１は値が更新される状態変数を示すインデックスｑの情報が入力され、そのインデックスに対応した重み値が局所場生成部２２の各局所場生成回路２２０へ出力される。各局所場生成回路２２０は、インデックスｑの更新に対応した重み値の入力を受けて、保持する局所場を更新する（ステップＳ２０５）。

さらに、記憶部２１は、インデックスｑに対応する記憶素子２１０に格納された重み値を更新する（ステップＳ２０６）。

更新部２６は、値が更新される状態変数を示すインデックスｑの情報が入力され、記憶部２６０が保持する状態変数の中から取得したインデックスで示される状態変数であるｘ_ｑを特定する。そして、更新部２６は、特定した状態変数であるｘ_ｑの値を反転させて更新する（ステップＳ２０７）。

その後、更新部２６は、記憶部２６０に更新後の全ての状態変数を書き込む。また、各局所場生成回路２２０は、保持するレジスタに更新後の局所場を書き込む（ステップＳ２０８）。

以上に説明したように、本実施例に係る最適化装置は、２ウェイ１ホット制約を有する最適化問題を解く際に、局所解に陥るなど予め決められた状態に達した場合に、いくつかの状態変数の値を強制的に１から０に遷移させる。そして、ペナルティ係数を用いた行列に重み行列を切り替えて、最適化処理を行い２ウェイ１ホット制約を満たす状態に復帰させる。これにより、順最適解に陥った場合に容易に脱出することが可能となり、容易に最適な解を得ることが可能となる。

１最適化装置
１０制御部
１１上限算出部
１２目的関数生成部
１３初期化実行部
１４候補決定部
１５温度管理部
１６更新制御部
１７通知部
１８強制遷移部
１９重み行列切替部
２０最適化部
２１記憶部
２２局所場生成部
２３エネルギー変化算出部
２４オフセット加算部
２５選択回路
２６更新部
２１０記憶素子
２２０局所場生成回路
２３０エネルギー変化算出回路
２６０記憶部

Claims

２ウェイ１ホット制約を含む制約条件が与えられた問題の解を、目的関数に基づく第１行列を重み行列として用いて探索する探索部と、
前記探索部による探索が特定の状態に達した場合に、前記探索部の探索結果である前記解の一部の値を変更する遷移部と、
前記遷移部により前記解に含まれる複数の変数の前記一部の値の変更が行われた場合に、前記重み行列にペナルティ係数を用いて生成した復帰用行列を前記重み行列として前記探索部に探索を行わせ、前記探索部による探索結果が前記２ウェイ１ホット制約を満たす状態に達すると、前記重み行列を前記第１行列に戻して前記探索部に探索を行わせる重み行列切替部と
を備えたことを特徴とする情報処理装置。
前記探索部は、２つのグループのそれぞれに含まれる所定数の構成要素に対して重複を許さずに所定数の状態変数を割り当てることで２ウェイ１ホット制約を満たし、
前記遷移部は、前記解の一部の値を変更することで、前記構成要素に対する前記状態変数の一部の割り当てを解消する
ことを特徴とする請求項１に記載の情報処理装置。
前記遷移部は、前記探索部による探索が局所解に陥った場合に、前記解の一部を他の値に遷移させることを特徴とする請求項１又は２に記載の情報処理装置。
前記探索部に前記第１行列を用いて探索を行わせる場合、前記２ウェイ１ホット制約を満たすように前記目的関数の変数のうち変化させる変数を４つずつ選択して前記探索部に探索を行わせ、前記探索部に前記復帰用行列を用いて探索を行わせる場合、前記目的関数の変数のうち変化させる変数を１つずつ選択して前記探索部に探索を行わせる候補決定部をさらに備えたことを特徴とする請求項１～３のいずれか一つに記載の情報処理装置。
前記探索部は、前記遷移部により前記解の一部の値が変更された場合、局所場を再計算することを特徴とする請求項１～４のいずれか一つに記載の情報処理装置。
前記第１行列は、複数の第１要素に目的関数で使用される値が与えられ、前記第１要素以外の第２要素に０が与えられ、
前記復帰用行列は、前記第１要素に前記第１行列と同じ値が与えられ、前記第２要素に前記ペナルティ係数の値が与えられ、
前記探索部は、前記復帰用行列の各要素を保持する記憶素子を有し、前記復帰用行列を使用する場合には前記第２要素の値が格納された前記記憶素子から前記ペナルティ係数の値を読み出し、前記第１行列を使用する場合には前記第２要素の値が格納された前記記憶素子から０を読み出す
ことを特徴とする請求項１に記載の情報処理装置。
２ウェイ１ホット制約を含む制約条件が与えられた問題の解を、目的関数に基づく第１行列を重み行列として用いて探索し、
探索が特定の状態に達した場合に、探索結果である前記解の一部の値を変更し、
前記解の一部の値の変更を行った場合に、前記重み行列にペナルティ係数を用いて生成した復帰用行列を前記重み行列として前記解の探索を行い、
探索結果が前記２ウェイ１ホット制約を満たす状態に達すると、前記重み行列を前記第１行列に戻して前記解の探索を行う
処理をコンピュータに実行させることを特徴とする情報処理方法。
２ウェイ１ホット制約を含む制約条件が与えられた問題の解を、目的関数に基づく第１行列を重み行列として用いて探索し、
探索が特定の状態に達した場合に、探索結果である前記解の一部の値を変更し、
前記解の一部の値の変更を行った場合に、前記重み行列にペナルティ係数を用いて生成した復帰用行列を前記重み行列として前記解の探索を行い、
探索結果が前記２ウェイ１ホット制約を満たす状態に達すると、前記重み行列を前記第１行列に戻して前記解の探索を行う
処理をコンピュータに実行させることを特徴とする情報処理プログラム。