JP7425210B2

JP7425210B2 - 情報処理システムおよび最適解探索処理方法

Info

Publication number: JP7425210B2
Application number: JP2022544983A
Authority: JP
Inventors: 拓哉奥山; 晶子正木; 雅直山岡
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2020-08-27
Filing date: 2020-08-27
Publication date: 2024-01-30
Anticipated expiration: 2040-08-27
Also published as: AU2020465147B2; AU2020465147A1; WO2022044184A1; JPWO2022044184A1

Description

本発明は、情報処理装置、演算装置、及び情報処理方法等に関し、最適解探索処理を実行する技術に関する。

特許文献１には、「イジングモデルの１つのスピンを３以上の状態で表現する値を記憶する第１のメモリセルと、１つのスピンに相互作用を及ぼす他のスピンからの相互作用を示す相互作用係数を記憶する第２のメモリセルと、他のスピンの状態を表現する値と前記相互作用係数を定数または変数として持つ関数に基づいて、１つのスピンの次状態を決定する論理回路と、を有する単位ユニットを複数備える半導体装置」が開示される。

特許文献２には、任意の結合を持つイジングモデルに対して、マルコフ連鎖モンテカルロ法の要求する理論的背景を満たしつつ、全スピンを同時に確率的更新して最適解探索を実現する方法について記載されている。

特許文献３には、集合分割問題における部分集合の候補の情報である候補情報を取得する取得手段と、前記取得手段により取得された前記候補情報に基づいて、前記集合分割問題に対応するイジングモデルにおけるハミルトニアンの式を生成する生成手段と、が開示される。

特開２０１６－５１３１４号公報ＷＯ２０１９／２１６２７７号公報特開２０１７－１５１８１０号公報

Okuyama, T., Sonobe, T., Kawarabayashi, K. I., & Yamaoka, M. (2019). Binary optimization by momentum annealing. Physical Review E, 100(1), 012111. Botev, Z. I. (2017). The normal law under linear restrictions: simulation and estimation via minimax tilting. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 79(1), 125-148. Neal, R. M. (1998). Suppressing random walks in Markov chain Monte Carlo using ordered overrelaxation. In Learning in graphical models (pp. 205-228). Springer, Dordrecht.

物理現象や社会現象の多くは相互作用モデルで表現可能である。相互作用モデルは、モデルを構成する複数のノードと、ノード間の相互作用、さらに必要であればノード毎に作用する係数で定義される。物理学や社会科学の分野においては、イジングモデルを始めとする種々のモデルが提案されているが、いずれも相互作用モデルの一形態として解釈することができる。

この相互作用モデルに関係づけられた指標を最小化または最大化するノード状態を求めることが社会課題の解決において重要である。例えば、ソーシャルネットワークのクリークを検知する問題や、金融分野のポートフォリオ最適化問題が挙げられる。これらは、オペレーションズ・リサーチの分野では、無制約二値二次計画問題や混合二値二次計画問題に大別される。

巡回セールスマン問題や経路探索問題などを混合二値二次計画問題として、相互作用モデルの基底状態探索問題として解く場合、このエネルギー関数は一般に、制約を表すペナルティー項など複数の項の線形和で表される。各項の重みの最適値は一般には不明であるため、重みを変化させつつ解を探索して、厳密解または良質な近似解を得る。

最適化問題は、解きたい問題をひとたび相互作用モデルで表現できれば、短時間・省電力で計算することが可能となる。しかし、実際に世の中で求められる最適化問題では複雑な制約が課されている場合が多く、これらのペナルティー項を全て相互作用モデルで表現することは困難である。

本発明は上述の背景に鑑みてなされたもので、様々な制約を持つ複雑な最適化問題を、いかにして混合二値二次計画問題で解けるようにするか、その手段を提供することを目的とする。

本発明の好ましい一側面は、演算装置と、前記演算装置を制御する計算機を備える情報処理システムである。前記計算機は、複数の制約を含む最適化問題の解候補を生成し、前記解候補から前記制約の少なくとも一部を満たす解候補を抽出し、抽出された解候補に基づいて混合整数二次計画問題を生成する前処理部と、前記混合整数二次計画問題に基づくデータを前記演算装置に入力して、演算を実行させる相互作用演算実行部と、を備える。前記演算装置は、前記混合整数二次計画問題の変数を更新する演算を行い、目的関数を最大または最小とする前記変数を解として出力するものである。

本発明のさらに好ましい一側面は、演算装置と、前記演算装置を制御する計算機を備える情報処理システムである。前記計算機は、配列の組からなる中間入力データから配列の一部を除外して候補リストを作成し、前記候補リストから混合整数二次計画問題を生成する前処理部と、前記混合整数二次計画問題に基づくデータを前記演算装置に入力して、演算を実行させる相互作用演算実行部と、を備える。前記演算装置は、前記混合整数二次計画問題の変数を更新する演算を行い、目的関数を最大または最小とする前記変数を解として出力するものである。

本発明の好ましい他の一側面は、演算装置と、前記演算装置を制御する計算機で実行する最適解探索処理方法である。この方法は、前記計算機の前処理部が、配列の組からなる中間入力データから配列の一部を除外して候補リストを作成し、前記候補リストから二次計画形式問題データを生成する前処理ステップ、前記計算機の記憶部に、前記二次計画形式問題データと、前記二次計画形式問題データの変数の定義域である定義域データを記憶する第１のステップ、前記計算機のモデル係数設定部が、前記二次計画形式問題データに基づいて、非線形係数メモリに非線形係数Ｊを設定し、線形係数メモリに線形係数ｈの値を設定する第２のステップ、前記計算機の重み設定部が重み信号ＳＷの値を決定する第３のステップ、前記計算機の変数値初期化部が、変数メモリに格納されている各変数の値を初期化する第４のステップ、前記計算機の相互作用演算実行部が、前記非線形係数Ｊ、前記線形係数ｈ、前記重み信号ＳＷを用いて、前記演算装置の状態遷移計算ブロックに前記変数の次状態の計算を実行させる第５のステップ、前記計算機の変数読出部が、前記変数メモリから各変数の値を読み出し、前記定義域データに基づいて変換を行う第６のステップ、を実行する。

本発明によれば、様々な制約を持つ複雑な最適化問題を、混合二値二次計画問題で解けるようにすることができる。上記した以外の課題、構成および効果は、以下の発明を実施するための形態の説明により明らかにされる。

最適化問題の変数配列および目的関数値の関係を示す概念図である。実施例の説明に供する図である。実施例の説明に供する図である。情報処理装置の概略的な構成を示すブロック図である。演算回路のブロック図である。情報処理装置が備える主な機能を示す機能ブロック図である。最適解探索処理を説明するフローチャートである。演算回路の詳細ブロック図である。演算回路を構成するユニットのブロック図である。前処理Ｓ７１０の意味を概念的に説明する図である。候補リスト６２０の一例を示す表図である。

以下、実施の形態を図面に基づいて詳細に説明する。尚、以下の説明において、同一の又は類似する構成に共通の符号を付して重複した説明を省略することがある。また同一あるいは同様の機能を有する要素が複数ある場合に同一の符号に異なる添字を付して説明することがある。また複数の要素を区別する必要がない場合は添字を省略して説明することがある。

本明細書等における「第１」、「第２」、「第３」などの表記は、構成要素を識別するために付するものであり、必ずしも、数、順序、もしくはその内容を限定するものではない。また、構成要素の識別のための番号は文脈毎に用いられ、一つの文脈で用いた番号が、他の文脈で必ずしも同一の構成を示すとは限らない。また、ある番号で識別された構成要素が、他の番号で識別された構成要素の機能を兼ねることを妨げるものではない。

以下で説明される一実施例は、混合整数二次計画問題の変数の状態を示す値を記憶する変数メモリと、前記変数メモリに対応して状態遷移計算ブロックの非線形係数を記憶する非線形係数メモリと、前記変数メモリに対応して状態遷移計算ブロックの線形係数を記憶する線形係数メモリと、状態遷移計算ブロックの重み信号を受信する重み入力線と、状態遷移計算ブロックの温度信号を受信する温度入力線と、前記状態遷移計算ブロックの重み信号と前記状態遷移計算ブロックの非線形係数と前記状態遷移計算ブロックの線形係数を用いて差分計算を計算する差分計算ブロックと、前記状態遷移計算ブロックの重み信号と前記状態遷移計算ブロックの温度信号と前記差分計算ブロックの出力値を用いて、区間制約付きの確率分布からランダムにサンプリングするサンプリングブロックと、前記サンプリングブロックの出力値と前記変数メモリから読み出した値を用いて、変数の次状態を計算する次状態計算ブロックと、を備える演算回路である。

一般に、整数計画問題とは、整数変数を含む最適化問題をいう。また、整数値を取る変数と実数値を取る変数が混在している場合は、混合整数計画問題という。二次計画問題となる混合整数計画問題は，混合整数二次計画問題という。本明細書では、特に２値を取る変数と実数値を取る変数が混在している混合整数二次計画問題を、混合二値二次計画問題と呼ぶことにする。まず、混合二値二次計画問題の意義を説明する。

解きたい最適化問題によっては２値変数と連続変数が混合することがある。例えば、金融分野の問題において、金融商品の購入比率は０％、もしくは１０％～１００％ということがある。購入しないならば当然０％で、購入するならば最低単位の１０％以上とする場合などである。このとき、購入するかしないかを示す２値変数ｘ∈｛－１，１}と連続変数ｙ∈［－１，１]を用いて、購入比率ｒは、
ｒ＝{(１＋ｘ)／２} × {０.１＋０.９×(１＋ｙ))／２}
とすることで表現できる。

連続変数ｙを複数の２値変数で離散的に表現することも可能だが、連続変数を扱えるようにすることで変数の個数が１個で済む。よって、連続変数を計算機システムで扱えるようにすることで、最適化問題の変数の個数を減らせて、計算機資源で扱える問題規模を大きくすることができる。また、ある問題を解くとき、変数の個数が減るため計算時間を短くすることが期待できる。

一方、問題を連続変数のみで扱うことも可能だが、連続変数では、－１または＋１しか値として認めたくない変数に対しても０.３などの値も許してしまうことになる。この場合、「変数ｘは－１または＋１である」という制約をたとえばペナルティー関数(ｘ^２－１)^２として目的関数に足せば、変数ｘを連続変数として扱うことも可能であるが、これでは二次式にならなくなる。また、目的関数が複雑になって最適解を見つけづらいなどの課題がある。よって、二次計画問題を作る際に最初から所定の変数の定義域を２値あるいは離散値とし、計算機で取り扱えるようにする構成のメリットがある。本明細書では以降、最適化問題とのみ称する場合は、混合二値二次計画問題を表すものとする。

最適化問題（ここでは混合二値二次計画問題の意）の変数はｓ_１、…、ｓ_ＮのＮ個存在する。そして各変数の定義域Ｄ_ｉは２値｛－１、＋１｝または連続値［－１、＋１]のいずれかである。どちらであるかは問題毎に決定される。そして、最適化問題の目的関数Ｈは次式１で表される。すなわち、目的関数Ｈが変数ｓの２次式で表される。

式１において、ｓ＝［ｓ_１、…、ｓ_Ｎ］のＮ次元ベクトル、ＪはＮ×Ｎ対称行列、ｈはＮ次元ベクトルである。前述の通り、変数毎に定義域が異なるので、混合二値二次計画問題は次式２の通り表せる。

ここで、添字の集合Λ_ｂ、Λ_ｃを式３の通り定義する。

集合Ｓ_{ｍｉｘｅｄ}＝｛ｓ | ｓ_ｉ ∈ Ｄ_ｉ｝を定義する。これらの表記を用いると、式２は次式４とも表現できる。

以降、すべてのｉ∈Λ_ｂに対して行列Ｊのｉ行ｉ列目の要素は０とする。なぜならば、この変換は式２の最適解を変えないためである。

もしＤ_ｉ＝｛－１、＋１｝ならば、この最適化問題はイジングモデルの基底状態探索問題と呼ばれる組合せ最適化問題である。本実施形態では、イジングモデルの基底状態探索も含む最適化問題において、マルコフ連鎖モンテカルロ法（以降、ＭＣＭＣ（Markov Chain Monte Carlo methods）と称する）を活用したアルゴリズムで最適解もしくは近似解を探索する。

図１は変数配列に対する目的関数値のランドスケープを表す概念図である。グラフの横軸は変数配列ｓ、縦軸は目的関数Ｈ（ｓ）である。ＭＣＭＣは現在の状態ｓから、状態ｓの近傍のある状態ｓ’への確率的な遷移を繰り返す。状態ｓから状態ｓ’に遷移する確率を、遷移確率Ｐ（ｓ，ｓ’）と称する。遷移確率Ｐの例としてメトロポリス法（Metropolis method）や熱浴法（heat-bath algorithm）が挙げられる。

遷移確率は温度と呼ばれるパラメータを有し、これは状態間の遷移のし易さを表す。温度を大きな値から徐々に減少させつつＭＣＭＣを実行するとき、目的関数値が最も低い状態に漸近的に収束する。これを利用して最小化問題の最適解または近似解を求める手法が、シミュレーティッド・アニーリング（以下、ＳＡ（Simulated Annealing）と称する）や非特許文献１で提案されたモメンタム・アニーリング（以下、ＭＡ（Momentum Annealing）と称する）である。

式４に示す最小化問題を解くにあたり、代わりに次式５の最小化問題を解くことを考える。ただし集合Ｓ_{ｒｅｌａｘｅｄ}＝｛ｓ | ｓ_i ∈ ［－１、＋１]｝である。

式５の最適解をｓ^＊＝［ｓ_１ ^＊、…、ｓ_Ｎ ^＊］と表す。証明は割愛するが、次式６で求まるｓ^＋＝［ｓ_１ ^＋、…、ｓ_Ｎ ^＋］は式４の最適解の一つとなる。本出願で示す実施例の目標は式２の最適解探索であるが、式５の最適解ｓ^＊を求解後に式６の変換を得ても、所望の解ｓ^＋を得られるということである。ただし、関数ｓｇｎは引数が０以上ならば＋１、それ以外ならば－１を返す関数である。

ここで、Ｎ次元ベクトルｖ＝［ｖ_１、…、ｖ_Ｎ］を導入して、式７に示す関数Ｈ’を定義する。

ただし、関数Ｖ（ｖ）は式８に記す定義の通りである。

行列Ｗ＝ｄｉａｇ（ｗ_１、…、ｗ_Ｎ）は任意の対角行列で、ｖ_iは［－１、＋１］を動く実数である。式５に示す最小化問題の代わりにＨ’(ｓ、ｖ) の最小化問題である式９を導入する。

２つのＮ次元ベクトルｘ＝s＋ｖ、ｙ＝s－ｖを定義する。本来解きたい最適化問題の目的関数はＨのみだが、ここにＶという関数を導入することで、ＭＣＭＣで並列更新可能な関数を新たに得られるようにしている。すると、関数Ｈ’は式１０と書き直せる。

つまり、式５の最小化問題は式１１の最小化問題と言い換えられる（最大化問題としてあつかってもよい）。

式１１の最適解をｘ^＊、ｙ^＊と表すと、s^＊＝（ｘ^＊＋ｙ^＊）／２なる等式が成り立つ。これらの議論はＷが零行列でも成り立つ。

以上より、式２で表す混合二値二次計画問題の最適解は、式１１に示す制約付き二次計画問題の解から求められる。この解を求めるために、ＭＣＭＣを活用する。

図２は、式１１における目的関数Ｇの各変数どうしの関係を示したグラフィカルモデルである。関数Ｇの各変数どうしの関係は、完全２部グラフで表すことができる。関数Ｇ内で変数ｘ_ｉに乗ぜられる変数は、ｙ_１、…、ｙ_Ｎとｘ_ｉのみである。ＭＣＭＣは変数値を確率的に更新するとき、その変数に係わる変数の値を用いる。つまり、変数ｘ_１の値を更新するときｙ_１、…、ｙ_Ｎおよびｘ_１を求め、それ以外の変数（ここではｘ_２、…、ｘ_Ｎ）を参照しない。これは他の変数、例えばｘ_２の値の更新でも同様である。ゆえに、変数配列ｙの値が一定ならば、配列ｘのそれぞれの値を独立に同時に確率的更新してもＭＣＭＣの理論的要請は破らない。

同様に変数ｙ_ｉに乗ぜられる変数も、ｘ_１、…、ｘ_Ｎとｙ_ｉのみである。ゆえに、変数配列ｘの値が一定の下で、配列ｙのそれぞれの値を独立に同時に確率的更新できる。

以上より、「ｘ_１、…、ｘ_Ｎの同時更新」と「ｙ_１、…、ｙ_Ｎの同時更新」を繰り返す手続きで構成されたＭＣＭＣを実行することで、並列化による高速化という利点を享受しながら関数Ｇを最小化する配列ｘ、ｙを探索できる。

本実施例の議論では、行列Ｊに制約を設けていないことに注意されたい。たとえば行列Ｊの全要素が非零である場合にも、上記の議論が成り立つため、並列更新が可能である。

図３は、全結合グラフの例である。一方で、原問題である式２の最小化問題に対して直接、ＭＣＭＣを適用する場合、変数配列ｓの係わり方が図３に示すように全結合グラフで表現されるため一度に一変数しか確率更新できず、逐次更新に限定される。

ここからは、各変数に対する確率的更新の手続きを述べる。更新対象の変数をｘ_ｉとする。変数ｙ_１、…、ｙ_Ｎの値が一定下では、温度Ｔのボルツマン分布における変数ｘ_ｉの存在確率ｐ（ｘ_ｉ）は式１２を満たす。

ただし、変数Ａ_iは式１３で求める値である。

変数ｘ_ｉとｙ_ｉは｜ｘ_ｉ｜＋｜ｙ_ｉ｜≦２であるため、ｘ_ｉの動ける範囲は－（２－｜ｙ_ｉ｜）以上（２－｜ｙ_ｉ｜）以下である。よって、変数ｘ_ｉは平均Ａ_i／ｗ_i、分散Ｔ／ｗ_iの正規分布で－（２－｜ｙ_ｉ｜）以上（２－｜ｙ_ｉ｜）以下を定義域とする切断正規分布を基に、ｘ_ｉの次状態をサンプリングすれば良い。この方法ではｘ_ｉの現在の状態には依らずに次状態を決めるということである。ｙ_ｉについても同様である。本明細書では、ｘとｙの変数を区別しない場合ｓと表記することがある。

標準正規分布に従う乱数はBox-Muller法で生成可能である。ここでは定義域が限定されるため、非特許文献２で示されたアルゴリズムを用いればよい。

最適解探索は、温度０における平衡状態からのサンプリングと見なせる。そのため、良質な解探索の実現には、平衡状態への短時間での収束が好ましい。平衡状態への収束性を高めるため、ＭＣＭＣでは様々な技術が提案されており、これらを活用も可能である。たとえば、非特許文献３は過剰緩和法を提案している。これは次状態の候補として、温度Ｔのボルツマン分布から１つだけではなく、Ｋ個の状態をサンプリングする。そして計（Ｋ＋１）個の状態を並び替えてｘ_ｃ ^０≦…≦ｘ_ｃ ^r＝ｘ_ｉ≦ｘ_ｃ ^Ｋと表す。つまり、現在の状態は（Ｋ＋１）個の値のうち、小さい方から（ｒ＋１）番目ということである。そしてｘ_ｃ ^{Ｋ＋１－ｒ}を次状態に採用する。この方法では、次状態がｘ_ｉの現在の状態に依存する。

以上を踏まえて、図４～図６で本発明を実現する情報処理装置の構成を示す。

図４は、混合二値二次計画問題の最適解を探索する情報処理装置の一例である。同図に示すように、この情報処理装置１０は、プロセッサ１１、主記憶装置１２、補助記憶装置１３、入力装置１４、出力装置１５、通信装置１６、一つ以上の演算装置２０、及びこれらの装置を通信可能に接続するシステムバス５を備える。情報処理装置１０は、例えば、その一部又は全部がクラウドシステム（Cloud System）により提供されるクラウドサーバ（Cloud Server）のような仮想的な情報処理資源を用いて実現されるものであってもよい。また情報処理装置１０は、例えば、互いに協調して動作する、通信可能に接続された複数の情報処理装置によって実現されるものであってもよい。

プロセッサ１１は、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）を用いて構成されている。主記憶装置１２は、プログラムやデータを記憶する装置であり、例えば、ＲＯＭ（Read Only Memory）、ＳＲＡＭ（Static Random Access Memory）、ＮＶＲＡＭ（Non Volatile RAM）、マスクＲＯＭ（Mask Read Only Memory）、ＰＲＯＭ（Programmable ROM）等）、ＲＡＭ（Random Access Memory）（ＤＲＡＭ（Dynamic Random Access Memory）等）等である。補助記憶装置１３は、ハードディスクドライブ（Hard Disk Drive）、フラッシュメモリ（Flash Memory）、ＳＳＤ（Solid State Drive）、光学式記憶装置（ＣＤ（Compact Disc）、ＤＶＤ(Digital Versatile Disc)等）等である。補助記憶装置１３に格納されているプログラムやデータは、随時、主記憶装置１２に読み込まれる。

入力装置１４は、ユーザから情報の入力を受け付けるユーザインタフェースであり、例えば、キーボード、マウス、カードリーダ、タッチパネル等である。出力装置１５は、ユーザに情報を提供するユーザインタフェースであり、例えば、各種情報を可視化する表示装置（ＬＣＤ（Liquid Crystal Display）、グラフィックカード等）や音声出力装置（スピーカ）、印字装置等である。通信装置１６は、他の装置と通信する通信インタフェースであり、例えば、ＮＩＣ（Network Interface Card）、無線通信モジュール、ＵＳＢ（Universal Serial Interface）モジュール、シリアル通信モジュール等である。

演算装置２０は、混合二値二次計画問題の最適解探索に関する処理を実行する装置である。演算装置２０は、例えば、ＧＰＵ（Graphics Processing Unit）のように、情報処理装置１０に装着する拡張カードの形態を取るものであってもよい。演算装置２０は、例えば、ＣＭＯＳ（Complementary Metal Oxide Semiconductor）回路、ＦＰＧＡ（Field Programmable Gate Array）、ＡＳＩＣ（Application Specific Integrated Circuit）等のハードウェアによって構成される。演算装置２０は、制御装置、記憶装置、システムバス５に接続するためのインタフェース等を含み、システムバス５を介してプロセッサ１１との間でコマンドや情報の送受を行う。演算装置２０は、例えば、通信線を介して他の演算装置２０と通信可能に接続され、他の演算装置２０と協調して動作するものであってもよい。演算装置２０により実現される機能を、例えば、プロセッサ（ＣＰＵ、ＧＰＵ等）にプログラムを実行させることにより実現してもよい。

図４に示される演算装置２０は、後に図５で説明される。演算装置２０は、一つもしくは複数を実装することができる。

図５は、演算装置２０の動作原理を説明する図であり、演算装置２０を構成する回路（以下、演算回路５００と称する。）のブロック図である。演算回路５００は変数配列ｘ_１、…、ｘ_Ｎまたは変数配列ｙ_１、…、ｙ_Ｎを温度Ｔにおけるボルツマン分布（式１２）からサンプリングする機能を実現する。以下、同図とともに演算装置２０の動作原理について説明する。

同図に示すように、演算回路５００は、変数メモリ５１１、非線形係数メモリ５１２、線形係数メモリ５１３、差分計算ブロック５１４、サンプリングブロック５１５、及び次状態決定ブロック５１６を含む。

各演算回路５００の変数メモリ５１１には、前述した変数ｘ_１、…、ｘＮ及びｙ１、…、ｙ_Ｎを示す情報が格納される（図２参照）。

非線形係数メモリ５１２には、行列Ｊを表す情報が格納される。行列Ｊは一般に対称行列であり、この対称性を用いて非線形係数メモリ５１２の使用量を削減することができる。線形係数メモリ５１３には、ベクトルｈを表す情報が格納される。

同図に示すように、演算回路５００には、制御信号ＥＮ、重み信号ＳＷ、及び温度信号ＴＥが入力される。

信号ＥＮは、Ｈ（high）とＬ（low）の値を周期的に繰り返す信号で、変数配列ｘとｙいずれを更新しているかを表す。たとえば、ＥＮがＨのときは変数配列ｘを更新、Ｌのときはｙを更新と定める。この信号ＥＮにより、変数ｘ_１、…、ｘ_Ｎを同時に更新し、また変数ｙ_１、…、ｙ_Ｎを同時に更新する。図５では簡略化のため信号ＥＮはサンプリングブロック５１５のみに入力しているが、変数メモリなど本信号を必要とする他の箇所に対しても同様に印加する。

信号ＳＷは、対角行列Ｗの対角成分を表すＮ要素のベクトルを表す信号である。

差分計算ブロック５１４には、非線形係数メモリ５１２に格納されている行列Ｊの値、線形係数メモリ５１３に格納されているベクトルｈ、信号ＳＷ、および変数メモリ５１１に格納されている変数ｓ（ｘまたはｙ）が入力される。差分計算ブロック５１４は、信号ＥＮがＨのとき（Ｊ＋ｄｉａｇ（ｗ_１、・・・、ｗ_Ｎ））ｙ＋ｈ、ＥＮがＬのとき（Ｊ＋ｄｉａｇ（ｗ_１、・・・、ｗ_Ｎ））ｘ＋ｈを出力する。この出力値は前述のＡ_ｉに相当する。

サンプリングブロック５１５は、差分計算ブロック５１４の出力と信号ＳＷ、温度パラメータの値を保持する信号ＴＷ、信号ＥＮ、および他の変数の値を受けとる。そしてｉ番目の要素として、信号ＥＮがＨのとき－（２－｜ｙ_ｉ｜）以上（２－｜ｙ_ｉ｜）以下、ＥＮがＬのとき－（２－｜ｘ_ｉ｜）以上（２－｜ｘ_ｉ｜）以下を定義域とする、式１２で表される切断正規分布からランダムにサンプリングして出力する。

次状態決定ブロック５１６は、サンプリングブロック５１５から出力される一つないしは複数の値を基に、変数の次状態を決定する。もし、ＭＣＭＣの更新則として単なる熱浴法に定めたならば、次状態決定ブロック５１６はサンプリングブロック５１５の出力値を１つだけ受け取り、それをそのまま変数メモリ５１１に書き込めばよい。また、ＭＣＭＣの更新則として公知の過剰緩和法を用いるならば、次状態決定ブロック５１６はサンプリングブロック５１５から複数の値、そして変数メモリ５１１から更新対象の変数の現在値を受け取り、過剰緩和法に従って１つ選択して、変数メモリ５１１に書き込む。周知のように、過剰緩和法では，直前の状態との相関が負となるように次の状態を決める。

図６に情報処理装置１０が備える主な機能（ソフトウェア構成）を示している。同図に示すように、情報処理装置１０は、記憶部６００、モデル変換部６１１、モデル係数設定部６１２、重み設定部６１３、変数値初期化部６１４、温度設定部６１５、相互作用演算実行部６１６、及び変数値読出部６１７、前処理部６１８を備える。これらの機能は、プロセッサ１１が、主記憶装置１２に格納されているプログラムを読み出して実行することにより、もしくは、演算装置２０が備えるハードウェアにより実現される。尚、情報処理装置１０は、上記の機能に加えて、例えば、オペレーティングシステム、ファイルシステム、デバイスドライバ、ＤＢＭＳ（DataBase Management System）等の他の機能を備えていてもよい。

上記機能のうち記憶部６００は、問題データ６０１、二次計画形式問題データ６０２、定義域データ６０３、及び演算装置制御プログラム６０４、中間入力データ６１９、候補リスト６２０を、主記憶装置１２又は補助記憶装置１３に記憶する。

問題データ６０１は、例えば、最適化問題等を公知の所定の記述形式で記述したデータである。本実施例では、問題データ６０１は前処理部６１８にて、後述の候補リスト６２０から作成される。例えば、ユーザがユーザインタフェース（入力装置、出力装置、通信装置等）を介して入力した分析入力データは、前処理部６１８によって候補の組み合わせからなる中間入力データ６１９に変換される。分析入力データは、例えば人事データや受注データ等の分析対象としたいデータである。人事データは例えば、担当者ID、勤務地、資格、職域などのデータである。受注データは例えば、製品・サービス内容、場所、納期など受注に関するデータである。これらは一例であって、最適化問題の材料として扱えるデータであれば、これに限る必要はない。

中間入力データ６１９は、分析入力データから生成される。上記の例では、例えばどの担当者がどの受注を担当するかを表現する候補の配列の組み合わせを含む。

公知のように列生成法では、解を限定された部分解の重ね合わせで表現した定式で構成する。前処理部６１８はさらに、中間入力データ６１９から制約条件を満たさない所定の候補を除去して候補リスト６２０を生成する。このような前処理により、複雑な制約を相互作用モデルで表現する必要がなくなる。前処理部６１８は候補リスト６２０から、問題データ６０１を生成する。

二次計画形式問題データ６０２は、モデル変換部６１１が、問題データ６０１を式４が示す二次計画問題のフォーマットに合致する形式のデータに変換することにより生成されるデータである。この変換にあたり、与えられた各変数の定義域は、定義域データ６０３に書き込まれる。定義域データは、例えば各変数が２値を取るか実数値を取るかを示している。演算装置制御プログラム６０４は、相互作用演算実行部６１６が演算装置２０を制御する際に実行する、もしくは相互作用演算実行部６１６が個々の演算装置２０にロードして演算装置２０に実行させるプログラムである。

以上のように、モデル変換部６１１は、問題データ６０１を二次計画問題のフォーマットである二次計画形式問題データ６０２に変換する。このために、式１から式１１を導出する機能を、ソフトウェアあるいはハードウェアとしてモデル変換部６１１に実装しておけばよい。モデル変換部６１１の機能は必ずしも情報処理装置１０に実装されていなくてもよく、情報処理装置１０が、他の情報処理装置等で生成された二次計画形式問題データ６０２を入力装置１４や通信装置１６を介して取り込むようにしてもよい。

モデル係数設定部６１２は、二次計画形式問題データ６０２に基づく、式１１の行列Ｊを非線形係数メモリ５１２に、ベクトルｈを線形係数メモリ５１３に設定する。

変数値初期化部６１４は、演算装置２０の変数メモリ５１１に格納されている各変数の値を初期化する。変数値初期化部６１４は、例えば、各変数の値を－１以上＋１以下から一様に、ランダムサンプリングして決めればよい。この際に、変数に関する制約である｜ｘ_ｉ｜＋｜ｙ_ｉ｜≦２を満たすよう注意しなければならない。また、このときの各変数の値は連続値で扱われていることに留意されたい。

温度設定部６１５は、相互作用演算実行部６１６が最適解探索を行う際に用いる温度Ｔを設定する。

相互作用演算実行部６１６は、温度設定部６１５により設定された温度Ｔごとに、式１１で表す関数Ｇを最小化する変数配列ｘおよびｙを探索する演算（以下、相互作用演算と称する。）を演算装置２０に実行させる。相互作用演算に際し、相互作用演算実行部６１６は、例えば、温度Ｔを高いほうから低いほうに向けて変化させる。

変数値読出部６１７は、相互作用演算実行部６１６による最適解探索が終了すると、変数メモリ５１１に格納されている変数配列ｘおよびｙを読み出す。ここで読み出される値は、式１１の解である。上述の議論に従って、Ｎ次元ベクトルｓ^＊＝（ｘ＋ｙ）／２を計算する。そして定義域データ６０３を読み出し、式６で得られるベクトルｓ^＋を最終的な解として出力装置１５や通信装置１６に出力する。つまり、定義域データ６０３にてｉ番目の定義域が｛－１、＋１｝と判明すればｓｇｎ（ｓ^＊ _ｉ）、ｉ番目の定義域が［－１、＋１］ならばｓ_ｉ自体を出力するということである。このようにして、定義された値域に応じた解が求められる。

図７は、最適解探索に際し情報処理装置１０が行う処理（以下、最適解探索処理Ｓ７００と称する。）を説明するフローチャートである。以下、同図とともに最適解探索処理Ｓ７００について説明する。尚、以下において、符号の前に付している「Ｓ」の文字は処理ステップの意味である。最適解探索処理Ｓ７００は、例えば、入力装置１４を介してユーザからの指示等を受け付けることにより開始される。

図７に示すように、最初に前処理部６１８が分析入力データから中間入力データ６１９を生成し、中間入力データ６１９から候補リスト６２０を生成し、候補リスト６２０から問題データ６０１を生成する（Ｓ７１０）。

次にモデル変換部６１１が、問題データ６０１を二次計画形式問題データ６０２に変換する（Ｓ７１１）。二次計画形式問題データは、たとえば式１で表現される関数Ｈにおける行列Ｊ、ベクトルｈを任意の形式で表現する。記憶部６００が既に二次計画形式問題データ６０２を記憶している場合は当該処理Ｓ７１１を省略する。Ｓ７１１の処理と、Ｓ７１２以降の処理とは、夫々を異なる装置で実行するようにしてもよい。またＳ７１１の処理と、Ｓ７１２以降の処理とを異なるタイミングで実行するようにしてもよい（例えば、Ｓ７１１の処理を事前に行っておくことが考えられる。）。

続いて、モデル係数設定部６１２が、非線形係数メモリ５１２および線形係数メモリ５１３に行列Ｊとベクトルｈの値を設定する（Ｓ７１２）。メモリの値は、ユーザインタフェース（例えば、入力装置１４、出力装置１５、通信装置１６等により実現される。）を介してユーザが設定又は編集することもできる。

続いて、重み設定部６１３が信号ＳＷの値を決定する。前述の式８の説明通り、最適解を探索する上で信号ＳＷは任意の値を取ることが許される。そのため、信号値は常に０としても良い。この場合は計算の負荷を軽減することができる。また、特許文献２の式３～式５に示すように行列Ｊの固有値から決定しても良い。あるいは、行列Ｊの行和から決定しても良い。信号ＳＷの値算出の計算は、演算装置２０内またはプロセッサ１１で実行してもよい。あるいはユーザが自分で設定してもよい（Ｓ７１３）。

続いて、変数値初期化部６１４が、変数メモリ５１１に格納されている各変数の値を初期化する（Ｓ７１４）。変数メモリ５１１に格納する値は連続値である。先に述べたように初期値はランダムでよい。以上で、式１１を表現するパラメータが設定されたことになる。

続いて、温度設定部６１５が、最適解探索にて使用する温度パラメータの系列Ｔ_ｋ（k=1,2,3、・・・）を設定する（Ｓ７１５）。尚、上記の添字ｋは設定される温度Ｔの種類を表す。温度Ｔの設定方法については、たとえば特許文献１の方法を採用可能である。

続いて、相互作用演算実行部６１６が、図５に示す演算回路５００の演算により、変数配列の確率的な同時更新を実行する（Ｓ７１６）。

続いて、相互作用演算実行部６１６は、停止条件が成立したか否か（例えば、温度Ｔが予め設定された最低温度に達したか否か）を判定する（Ｓ７１７）。停止条件が成立したと相互作用演算実行部６１６が判定した場合（Ｓ７１７：ＹＥＳ）、処理はＳ７１８に進む。一方、停止条件が成立しないと相互作用演算実行部６１６が判定した場合（Ｓ７１７：ＮＯ）、処理はＳ７１６に戻る。

Ｓ７１８では、変数値読出部６１７が、変数メモリ５１１に格納されている変数の値と定義域データ６０３に格納されている二次計画形式問題データ６０２の各変数の定義域を読みだす。そして、式６に基づいた変換を通じたベクトルを算出して、式２もしくは式４の解として出力する。以上で最適解探索処理Ｓ７００は終了する。

以上、詳細に説明したように、本実施形態の情報処理装置１０によれば、混合二値二次計画問題の最適解探索を効率よく行うことができる。そのため、最適化問題を効率よく解くことができる。尚、情報処理装置１０（演算装置２０を含む）は、シンプルな構成であるので安価かつ容易に製造することができる。

演算回路５００は、既に述べた最適化問題を解く計算を実行する機能を備える限り、ソフトウェアで構成してもよいし、ハードウェアで構成してもよい。具体的には、アニーリング方式において電子回路(デジタル回路など)で実装するハードウェアだけでなく、超伝導回路などで実装する方式でもよい。また、アニーリング方式以外にてイジングモデルを実現するハードウェアでもよい。例えばレーザーネットワーク方式（光パラメトリック発振）、量子ニューラルネットワークなどが知られている。また、一部の考え方が異なるものの、イジングモデルで行う計算をアダマールゲート、回転ゲート、制御ＮＯＴゲートといったゲートで置き換えた量子ゲート方式も、本実施例の構成として採用することができる。

演算回路５００の具体的な実装例として、特許文献１で説明されているＣＭＯＳ（Complementary Metal-Oxide Semiconductor）集積回路や、ＦＰＧＡ(Field Programmable Gate Array)上の論理回路として実装する例を説明する。

特許文献１の技術では、ＳＲＡＭ(Static Random Access Memory)の技術を適用したユニットをアレイ状に配置し、各ユニットに変数を格納するメモリと変数を更新するための回路を配置する。

図８は、ＳＲＡＭの技術を本実施例の演算回路５００に適用した場合の回路構成例を示すブロック図である。複数のユニット８０１がアレイユニット８０２を構成している。このような構成は半導体製造技術を応用して製造可能である。

一つのユニット８０１には、一つの変数ｘ_１、…、ｘＮ及びｙ１、…、ｙ_Ｎのいずれかを記憶する多値メモリ９０１と、多値メモリ９０１の値を更新するための構成が含まれる。すなわち、ユニット８０１は２Ｎ個準備される。

図８の構成例を、一般化されている図５の構成も参照しつつ説明する。非線形係数メモリ５１２と線形係数メモリ５１３に格納されるデータは、モデル係数設定部６１２から設定される。非線形係数メモリ５１２には、Ｎ×Ｎ行列Ｊが格納されるが、これは全てのユニット８０１で共通に用いられる。また、線形係数メモリ５１３にはＮ次元ベクトルｈが格納されるが、これは全てのユニット８０１で共通に用いられる。回路規模を縮小するために、これらのメモリは各ユニット８０１共通のものとした。よって、非線形係数メモリ５１２と線形係数メモリ５１３は、全てのユニット８０１に係数Ｊとｈを供給するが、図８ではそのための信号線は省略している。なお、原理的には非線形係数メモリ５１２と線形係数メモリ５１３を、各ユニット８０１が個々に備えてもよい。

重みメモリ８０３には対角行列Ｗの対角成分を表すＮ要素のベクトル（ｗ_１、…、ｗ_Ｎ）が格納される。このデータは重み設定部６１３で設定されたものである。ｘ_ｉ、ｙ_ｉを記憶するｉ番目のユニットは、ｉ番目の成分ｗ_ｉを使用するので、ユニット８０１毎に信号ＳＷの値を切り替える必要がある。図８ではユニット８０１に信号ＳＷを供給する信号線は省略している。

温度設定部６１５から供給される温度信号ＴＥは、全てのユニット８０１に供給される。温度信号の機能や構成は、従来技術を踏襲するものである。ユニット８０１に信号ＴＥを供給する信号線は省略している。

相互作用ドライバ８０４は、変数ｘの更新を許可する信号と、変数ｙの更新を許可する信号を交互に各ユニット８０１に入力する。これにより、変数ｘ_１～ｘ_Ｎが同時に更新され、変数ｙ_１～ｙ_Ｎが同時に更新される。

ＳＲＡＭインタフェース８０５は、ＳＲＡＭの回路構成を応用して作成されたユニット８０１の変数を格納するメモリに対して書き込みおよび読み出しを行う。演算回路５００での処理終了後に読み出された変数は、変数値読出部６１７に送られる。変数値読出部６１７は、定義域データ６０３に基づいて、読み出した変数を連続値あるいは２値として出力することにより、混合二値二次計画問題の解を得る。

コントローラ８０６は、相互作用演算実行部６１６の指示により、演算回路５００の初期化や処理の終了報告を行う。

図９は、一つのユニット８０１の回路構成例を示す図である。一つのユニットには、連続変数ｘ_１、…、ｘＮ及びｙ１、…、ｙ_Ｎのいずれか一つを記憶する多値メモリ９０１が含まれる。

差分計算回路９０２は、差分計算ブロック５１４の機能を実現する。差分計算回路９０２には、多値メモリ９０１の記憶する変数がｘ_１、…、ｘ_Ｎのいずれかの場合には、（ｙ_１、…、ｙ_Ｎ）のベクトルが入力される。また多値メモリ９０１の記憶する変数がｙ_１、…、ｙ_Ｎのいずれかの場合には、（ｘ_１、…、ｘ_Ｎ）のベクトルが入力される。これらの変数ベクトルは、他のユニット８０１の多値メモリ９０１からＳＲＡＭインタフェース８０５が読み出して生成する。また、係数であるＮ×Ｎ行列ＪとＮ次元ベクトルｈが入力される。また、重みｗ_ｉが入力される。差分計算回路９０２は、これらの入力に対して（Ｊ＋ｄｉａｇ（ｗ_１、・・・、ｗ_Ｎ））ｓ＋ｈ（ｓはｘまたはｙの変数ベクトル）のｉ行目の値Ａ_ｉを出力することになる。

サンプリング回路９０３は、サンプリングブロック５１５の機能を実現する。サンプリング回路９０３には、出力Ａ_ｉ、信号ＥＮ、信号ＳＷ、信号ＴＥ、および、多値メモリ９０１の記憶する変数がｘ_ｉの場合はｙ_ｉが、多値メモリ９０１の記憶する変数がｙ_ｉの場合はｘ_ｉが入力される。そして、式１２に基いて変数ｓ_ｉの存在確率ｐ（ｓ_ｉ）から変数の次状態の候補をサンプリングする。

状態決定回路９０４は、サンプリング回路９０３から出力される一つないしは複数の候補に基づいて、変数の次状態を決定する。状態決定回路９０４では、たとえば、過剰緩和法に従う場合には、サンプリング回路９０３から複数の候補を得ると、多値メモリ９０１の直前の状態との相関が負となる候補を選択して次状態を決定する。決定された次状態は多値メモリ９０１に格納される。

以上では、差分計算ブロック５１４、サンプリングブロック５１５、次状態決定ブロック５１６は、ＦＰＧＡ等のハードウェアを想定したが、例えばユニット内に配置したＧＰＵによりソフトウェア実装が可能である。このようにアレイ状のユニット８０１を備えることにより、並列的な変数の更新が可能となる。

図１０は、図７のフローにおける前処理Ｓ７１０の意味を概念的に説明する図である。最適化問題では、制約条件が複雑化してくる場合、相互作用モデルで全制約を表現することが困難になってくる。そこで、解きたい問題の解候補を事前に汎用計算機で生成し、解候補の集合から条件を満たす集合分割・集合被覆問題に分割する。集合分割・集合被覆問題はイジングモデルを始めとする相互作用モデルで表される目的関数の最小化問題（もしくは最大化問題）と等価であり、量子アニーリングやＣＭＯＳアニーリングをなど相互作用モデルに対するアニーリング技術で解くことが可能である。これにより、アニーリング技術で解ける問題の種類を増やすことが可能となる。

本実施例では、どの担当者がどの案件を処理するかの業務計画を最適化する例で説明する。図１０において、分析入力データ１００１は、候補となる担当者のID、資格、所在地などの人事情報、案件の内容、場所、制限時間、対応に必要なスキルなどの受注情報を含む。また、最適かどうかを判定するための評価パラメータ等を含む。

情報処理装置１０の前処理部６１８は、前処理Ｓ７１０において、中間入力データ成形Ｓ７１０１により、入力された分析入力データ１００１から、例えば表形式の中間入力データ６１９を生成して保存する。

前処理部６１８による前処理Ｓ７１０において、候補リスト生成Ｓ７１０２により、中間入力データ６１９から候補リスト６２０が生成される。

図１１は、候補リスト６２０の一例であり、列生成法と呼ばれる最適化アルゴリズムを説明する表図である。このアルゴリズムの目的は、複数の候補から何個かを選ぶことである。ここで候補となっているのは所定の配列であり、配列の集合から所定の条件により最適な組み合わせを選択する。

図１１の例では、各候補が「一人の担当者の担当案件」を表している。候補１は「担当者１が案件１のみを担当」、候補３は「担当者２が案件３を担当」などである。与えられた集合の各要素（例えば案件）を１つずつ含む部分集合の組み合わせの中で、コストの総和が最小となる組み合わせを求める問題を、集合分割問題という。

変数ｘ_ｉはその候補を選ぶかどうかを表す変数である。たとえばｘ_１＝１ならば候補１を採用するということになる。ｘ_１＝０ならば候補１を採用しないということになる。スキルの有無a_ｉは、その候補の担当者がスキルあるいは資格を有しているかどうかを示すパラメータである。たとえばa_１＝１ならばスキルあり、a_１＝０ならばスキルなしのように表現される。候補の評価値c_iはその候補の評価であり、定め方は任意である。

前処理部６１８は、一般的なプログラムにより分析入力データ１００１のデータを組み合わせて、図１１のような候補の集合を自動的にあるいはオペレータの編集によって作成し、中間入力データ６１９とすることができる。自動的なプログラムのアルゴリズムは機械的なデータの組み合わせ生成である。ただし、列生成法では選択した候補を組み合わせて、問題全体の答えとするため、全体の答えのパーツとなる候補１～ｎがそもそも実行可能でなければならない。

例えば、中間入力データ８１９は、各担当者が１０００個の案件から１～１０００個の案件を担当するあらゆる組み合わせを候補として持つとする。しかし、中間入力データ６１９のなかに、「担当者が案件１と案件１００を担当」があった場合、もしそれぞれの案件が以下の通りならば、一人の担当者が両案件を担当することは不可能である。
案件1：6/25(木) 10-12時に東京で作業
案件100：6/25(木) 10-12時に大阪で作業

そこで、実行可能な候補案を生成するため、候補リスト生成Ｓ７１０２では、中間入力データ６１９に蓄えられた問題設定に基づいて、不適切な候補を除外して候補リスト６２０を生成する。すなわち、前処理Ｓ７１０では、最適化計算ではなく、一般的な情報処理装置による条件検索により、中間入力データ６１９に含まれる候補の選別を行う。かくして、前処理Ｓ７１０は候補リスト６２０の候補群を生成する。そして、候補リスト６２０から最適化計算の問題データ６０１を生成する。

上記は「案件１を担当する者は案件１００を担当できない」という単純な例であるが、例えば、「案件１と案件２を担当する者は、案件４０と案件４１と案件４３を担当できない」など、さらに複雑な制約は多々考えられる。このような条件による候補の選別は、汎用計算機の通常のソフトウェアで処理する方が単純であり、逆に相互作用モデル等を用いた最適化計算の中の制約として扱うことは煩雑である。

また、たとえば、「案件２の巡回にはスキルが必要」という制約条件については、担当者のスキルの有無を示す変数ａ_ｉと、案件２に要求されるスキルの有無を示す変数を比較すれば、スキルを持たない担当者には、案件２を含む候補を作らないことで、直ちに候補を選別することができる。

本実施例では、前処理Ｓ７１０は、前処理Ｓ７１０の問題生成Ｓ７１０３で、候補リスト６２０から問題データ６０１を生成した後、混合二値二次計画問題に対応可能とするため、データ変換Ｓ７１１で問題データ６０１をさらに二次計画形式問題データ６０２に変換して最適化問題の生成を完了する。

問題データ６０１で与えられる制約条件は任意に設定できる。たとえば、一人の担当者は候補を択一的に実行するものとし、複数の候補を割り当てることは不可能であるとする。この条件を満たすためには、例えば担当者１に関しては、候補１か候補２のうちの一つのみを選択するようにしなければならない。選択の場合ｘ_ｉ＝１なので、このために与えられる制約は、
ｘ_１＋ｘ_２＝１
なる等式制約で表現される。
また例えば作業員２に関しては、候補３～候補５のうちの一つのみを選択するようにしなければならない。このために与えられる等式制約は、
ｘ_３＋ｘ_４＋ｘ_５＝１
である。

このような作業員２に関する等式制約の制約項Ｐ_２をペナルティー法で表現すると、

になる。

また、各作業員が場合により担当を行わなくてもよいとすれば、たとえば、図１１で「作業員１は選べる候補が最大一つ」という条件になる。この場合、以下のパターンが考えられる。
・候補１, ２いずれか１つが選ばれる
・候補１, ２いずれも選ばれない
これを数式で表現すると
ｘ_１＋ｘ_２≦１
になる。
このような不等式制約の制約Ｐ_１をペナルティー法で表現するため、０から１の間を動く連続変数ｚを導入してペナルティー項を作成する。

たとえば、ｘ_１＋ｘ_２≦１の制約を表現する際のペナルティー項は、式１５のようになる。

上記の説明では「０から１の間を動く連続変数ｚ」と述べた。ｘ_１＋ｘ_２≦１の場合は「０または１の２値変数ｚ」としても成り立つ。しかし、候補数が増えた場合には連続変数を使用する必要がある。

たとえば、候補１から候補１００のうちから最大２０候補選べる場合、選択される候補数を最適化するため、
ｘ_１＋ｘ_２＋ｘ_３＋…ｘ_１００≦２０
を表現しなければならない。この場合には、単一の２値変数ｚだけでは、この不等式を表現するペナルティー関数Ｐ_ｘが作れない。そのため、連続変数ｚを導入することにより、
Ｐ_ｘ＝（ｘ_１＋ｘ_２＋ｘ_３＋…ｘ_１００－２０ｚ）^２
というように、単一の補助変数のみで表現することが可能になる。特許文献３には、取得された候補情報に基づいて、計算対象の集合分割問題を示すイジングモデルにおけるハミルトニアンを生成することが記載されるが、連続変数を利用しないため、単一の補助変数のみで表現することができない。

以上のように、ｘ_ｉは“１”または“０”の二値変数、変数ｚは０以上１以下の実数を範囲にとる補助変数とする。ペナルティー関数Ｐ_ｉを組み合わせて、式１６の目的関数Ｈを得る。これが最小化すべき関数となる。本実施例では混合二値二次最適化問題を扱うことが可能である。そのため、補助変数ｚとして選択できる値の自由度が大きい。また、ｘ_ｉとして実数値を選択することもでき、適用範囲が広い。なお、上記で場合により“１”は“＋１”に、“０”は“－１”に置き換えることが可能である。

なお、図１１において定数ｃ_ｉは各候補の評価値を表し、この例ではｃ_ｉが大きいほど候補の評価が高い。ｃ_ｉはユーザが任意に設定してよいし、自動的に設定してもよい。例えば担当案件の個数が多い候補ほど評価値を高くするなどである。

図１０に戻ると、二次計画形式問題データ６０２は、既に述べたように最適化演算に適した演算装置２０によってアニーリング計算が行われ、結果データ１００２が読み出される。

後処理Ｓ１００３は、アニーリングで得た答えを列生成の答えとして妥当なものに変換する。例えば、候補３～５のうち１つだけ選択するのが適切なため、式１４のペナルティー関数を加えたものの、アニーリングで得られた解は確率的に得られるためこの制約を破っている可能性がある。このときに、強制的にｘ_３＋ｘ_４＋ｘ_５＝１となるよう解を調整する。これにより、解候補１００４を得る。

解の評価・選定処理Ｓ１００５では、列生成で得た解候補を評価する。もし得られた全体の解候補が期待にそぐわない場合、アニーリングで得られた答えの品質が良くない、候補毎の定めた評価値ｃ_ｉの設定が不適切などの理由が考えられる。そこで、そもそも解の品質は基準に達しているのか、もし達していないならばペナルティー係数の大きさや候補毎の評価値を調整して再計算するなどを判定することをこの処理の中に含める。最終的に得られた解候補１００４から、答え１００６を得る。

問題の制約条件を前処理Ｓ７１０で処理するか、最適化問題の中で処理するかは、特に限定されない。例えば、混合二値二次計画問題内で扱うのが煩雑な部分は、Ｓ７１０で処理するなど、ケースバイケースで考えてよい。

以上、一実施形態について詳述したが、本発明は上記の実施形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。例えば、上記の実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また上記実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。

また上記の各構成、機能部、処理部、処理手段等は、それらの一部または全部を、例えば、集積回路で設計する等によりハードウェアで実現してもよい。また上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、ＳＳＤ（Solid State Drive）等の記録装置、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に置くことができる。

また上記の各図において、制御線や情報線は説明上必要と考えられるものを示しており、必ずしも実装上の全ての制御線や情報線を示しているとは限らない。例えば、実際には殆ど全ての構成が相互に接続されていると考えてもよい。

また以上に説明した情報処理装置１０の各種機能部、各種処理部、各種データベースの配置形態は一例に過ぎない。各種機能部、各種処理部、各種データベースの配置形態は、情報処理装置１０が備えるハードウェアやソフトウェアの性能、処理効率、通信効率等の観点から最適な配置形態に変更し得る。

また前述した各種のデータを格納するデータベースの構成（スキーマ（Schema）等）は、リソースの効率的な利用、処理効率向上、アクセス効率向上、検索効率向上等の観点から柔軟に変更し得る。

情報処理装置、演算装置、情報処理方法等に利用することが可能である。

１０情報処理装置、１１プロセッサ、１２主記憶装置、２０演算装置、５１１変数メモリ、５１２非線形係数メモリ、５１３線形係数メモリ、５１４差分計算ブロック、５１５サンプリングブロック、５１６次状態決定ブロック、６００記憶部、６０１問題データ、６０２二次計画形式問題データ、６０３定義域データ、６０４演算装置制御プログラム、６１１モデル変換部、６１２モデル係数設定部、６１３重み設定部、６１４変数値初期化部、６１５温度設定部、６１６相互作用演算実行部、６１７変数値読出部

Claims

演算装置と、前記演算装置を制御する計算機を備える情報処理システムであって、
前記計算機は、
複数の制約を含む最適化問題の解候補を生成し、前記解候補から前記制約の少なくとも一部を満たす解候補を抽出し、抽出された解候補に基づいて混合整数二次計画問題を生成する前処理部と、
前記混合整数二次計画問題に基づくデータを前記演算装置に入力して、演算を実行させる相互作用演算実行部と、
を備え
前記演算装置は、
前記混合整数二次計画問題の変数を更新する演算を行い、目的関数を最大または最小とする前記変数を解として出力するものであり、
前記前処理部は、
配列の組からなる中間入力データから配列の一部を除外して候補リストを作成し、前記候補リストから混合整数二次計画問題を生成し、
前記演算装置は、
前記混合整数二次計画問題の変数の状態を示す値を記憶する変数メモリと、
前記変数の状態を示す値の次状態を計算する状態遷移計算ブロックと、
前記状態遷移計算ブロックの非線形係数を記憶する非線形係数メモリと、
前記状態遷移計算ブロックの線形係数を記憶する線形係数メモリと、
前記状態遷移計算ブロックの重み信号を受信する重み入力線と、
前記状態遷移計算ブロックの温度信号を受信する温度入力線と、を備え、
前記状態遷移計算ブロックは、
前記重み信号と前記非線形係数と前記線形係数を用いて差分計算を計算する差分計算ブロックと、
前記重み信号と前記温度信号と前記差分計算ブロックの出力値を用いて、区間制約付きの確率分布からランダムにサンプリングするサンプリングブロックと、
前記変数メモリから読み出した値を用いて、変数の次状態を計算する次状態決定ブロックと、を備える、
情報処理システム。
前記変数メモリは、前記変数の状態を示す値ｘ_１、…、ｘ_Ｎおよびｙ_１、…、ｙ_Ｎとして連続値を記憶する、
請求項１記載の情報処理システム。
前記混合整数二次計画問題の変数の定義域を記憶する記憶部と、
前記変数メモリから値を読み出し、前記変数の定義域に基づいて、前記変数メモリに格納されている連続値を２値に変換する変数値読出部と、を備える、
請求項２記載の情報処理システム。
前記非線形係数Ｊは、Ｎ×Ｎ行列であり、
前記線形係数ｈは、Ｎ次元ベクトルであり、
前記重み信号ＳＷは、対角行列Ｗの対角成分ｗ_１、…、ｗ_Ｎを表すＮ要素のベクトルを表す信号である、
請求項２記載の情報処理システム。
前記差分計算ブロックには、前記非線形係数Ｊ、前記線形係数ｈ、前記重み信号ＳＷ、および前記変数メモリに記憶されている値が入力され、（Ｊ＋ｄｉａｇ（ｗ_１、・・・、ｗ_Ｎ））ｓ＋ｈを出力し、
ただし、ｓはＮ次元ベクトル（ｘ_１、…、ｘ_Ｎ）および（ｙ_１、…、ｙ_Ｎ）のいずれかである、
請求項４記載の情報処理システム。
前記非線形係数Ｊは対称行列である、
請求項４記載の情報処理システム。
前記非線形係数Ｊのｉ行ｉ列目の要素は０である、
請求項６記載の情報処理システム。
前記サンプリングブロックには、前記差分計算ブロックの出力Ａ、前記重み信号ＳＷ、前記温度信号ＴＥ、制御信号ＥＮ、および、前記変数メモリに記憶されている値が入力され、
前記制御信号ＥＮが第１の値のとき－（２－｜ｙ_ｉ｜）以上（２－｜ｙ_ｉ｜）以下、前記制御信号ＥＮが第２の値のとき－（２－｜ｘ_ｉ｜）以上（２－｜ｘ_ｉ｜）以下を定義域とする正規分布からランダムに１または複数の値をサンプリングして出力し、
前記正規分布は、前記出力Ａ、前記重み信号ＳＷ、および前記温度信号ＴＥに基づいて形成される、
請求項５記載の情報処理システム。
前記正規分布は、平均Ａ_i／ｗ_i、分散Ｔ／ｗ_iの正規分布であり、
ただし、Ａ_iは前記出力Ａのｉ番目の値、Ｔは前記温度信号ＴＥの値である、
請求項８記載の情報処理システム。
前記変数の状態を示す値ｘ_１、…、ｘ_Ｎおよびｙ_１、…、ｙ_Ｎの一つを記憶する多値メモリを備えるユニットを複数備え、
前記ユニットのそれぞれは、前記差分計算ブロックの一部の機能を実行する差分計算回路と、前記サンプリングブロックの一部の機能を実行するサンプリング回路と、前記次状態決定ブロックの一部の機能を実行する次状態決定回路を備え、
前記変数の状態を示す値ｘ_ｉまたはｙ_ｉの一つを記憶する多値メモリを備えるユニットにおいては、
前記差分計算回路は、前記非線形係数Ｊ、前記線形係数ｈ、対角行列Ｗのｉ番目の対角成分ｗ_ｉ、および自ユニットの多値メモリが記憶する値がｘ_ｉのときはＮ次元ベクトル（ｙ_１、…、ｙ_Ｎ）を、自ユニットの多値メモリが記憶する値がｙ_ｉのときはＮ次元ベクトル（ｘ_１、…、ｘ_Ｎ）を入力とし、
Ａ_ｉ＝ｈ_ｉ＋ｗ_ｉｓ_ｉ＋Σ_ｉｊｓ_ｊ
（ただし、ｈ_ｉは線形係数ｈのｉ番目の要素、ｓは自ユニットの多値メモリが記憶する値がｘ_ｉのときはｙ、自ユニットの多値メモリが記憶する値がｙ_ｉのときはｘを示す）
を出力とする、
請求項５記載の情報処理システム。
前記サンプリング回路は、前記差分計算回路の出力Ａ_ｉ、前記対角成分ｗ_ｉ、前記温度信号ＴＥ、制御信号ＥＮ、および、前記変数メモリに記憶されている値が入力され、
前記制御信号ＥＮが第１の値のとき－（２－｜ｙ_ｉ｜）以上（２－｜ｙ_ｉ｜）以下、前記制御信号ＥＮが第２の値のとき－（２－｜ｘ_ｉ｜）以上（２－｜ｘ_ｉ｜）以下を定義域とする平均Ａ_i／ｗ_i、分散Ｔ／ｗ_iの正規分布からランダムに１または複数の値をサンプリングして出力する、
（ただし、Ｔは前記温度信号ＴＥの値である）
請求項１０記載の情報処理システム。
演算装置と、前記演算装置を制御する計算機で実行する最適解探索処理方法であって、
前記計算機の前処理部が、配列の組からなる中間入力データから配列の一部を除外して候補リストを作成し、前記候補リストから二次計画形式問題データを生成する前処理ステップ、
前記計算機の記憶部に、前記二次計画形式問題データと、前記二次計画形式問題データの変数の定義域である定義域データを記憶する第１のステップ、
前記計算機のモデル係数設定部が、前記二次計画形式問題データに基づいて、非線形係数メモリに非線形係数Ｊを設定し、線形係数メモリに線形係数ｈの値を設定する第２のステップ、
前記計算機の重み設定部が重み信号ＳＷの値を決定する第３のステップ、
前記計算機の変数値初期化部が、変数メモリに格納されている各変数の値を初期化する第４のステップ、
前記計算機の相互作用演算実行部が、前記非線形係数Ｊ、前記線形係数ｈ、前記重み信号ＳＷを用いて、前記演算装置の状態遷移計算ブロックに前記変数の次状態の計算を実行させる第５のステップ、
前記計算機の変数読出部が、前記変数メモリから各変数の値を読み出し、前記定義域データに基づいて変換を行う第６のステップ、
を実行する最適解探索処理方法。