JPWO2017037859A1 - 情報処理装置及び方法 - Google Patents

情報処理装置及び方法 Download PDF

Info

Publication number
JPWO2017037859A1
JPWO2017037859A1 JP2017537115A JP2017537115A JPWO2017037859A1 JP WO2017037859 A1 JPWO2017037859 A1 JP WO2017037859A1 JP 2017537115 A JP2017537115 A JP 2017537115A JP 2017537115 A JP2017537115 A JP 2017537115A JP WO2017037859 A1 JPWO2017037859 A1 JP WO2017037859A1
Authority
JP
Japan
Prior art keywords
data
similarity
interaction model
unit
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017537115A
Other languages
English (en)
Other versions
JP6629864B2 (ja
Inventor
泰幸 工藤
泰幸 工藤
地尋 吉村
地尋 吉村
真人 林
真人 林
純一 宮越
純一 宮越
加藤 猛
猛 加藤
水野 弘之
弘之 水野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2017037859A1 publication Critical patent/JPWO2017037859A1/ja
Application granted granted Critical
Publication of JP6629864B2 publication Critical patent/JP6629864B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】
求解の収束時間を短縮させ得る情報処理装置及び方法を提案する。
【解決手段】
連続して入力され、時々刻々と変化する問題の解を求める情報処理装置及び方法において、相互作用モデルにおける各素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部を情報処理装置に設け、入力される問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成し、生成した問題の係数データに基づいて、前後する問題間の類似度を表す類似度データを生成し、1つ前の問題及び今回の問題の類似度が所定の閾値以下の場合には、問題変換部から与えられた各素子の状態を相互作用モデルの初期状態に設定し、当該類似度が閾値よりも大きい場合には、直前の各素子の状態を今回の問題に対する相互作用モデルの初期状態とするようにした。

Description

本発明は情報処理装置及び方法に関し、例えば、連続して入力され、時々刻々と変化する各問題の解を、それぞれ相互作用モデルの基底状態を探索するようにして求める情報処理装置に適用して好適なものである。
組合せ最適化問題を高速に求解することは計算機における重要課題であり、この課題を解決するための方法として、従来、特許文献1に開示された方法が知られている。この方法は、問題をイジングモデルに変換し、その基底状態を探索することで求解するものであり、特許文献1には計算の実現手段としてレーザを用いた装置が提案されている。
また、計算装置の製造をより容易にする方法として、特許文献2に開示された方法がある。この方法は、イジングモデルの基底状態を求める装置を、CMOS(Complementary Metal-Oxide-Semiconductor)集積回路を用いて実現するものである。
国際公開第2012/118064号 国際公開第2014/192153号
組合せ最適化問題を実社会に応用する場合、時間の経過と共に問題が刻々と変化するケースが考えられる。例えば、巡回セールスマン問題において、渋滞等によって一部の移動コストが変化する場合などはその典型である。しかしながら、特許文献1及び特許文献2では、このようなケースにおける効率的な基底状態の探索、つまりは求解の追従性向上に対しては考慮されていなかった。
本発明は以上の点を考慮してなされたもので、時々刻々と変化する問題に対する求解の追従性を向上させて、求解の収束時間を短縮させ得る情報処理装置及び方法を提案しようとするものである。
かかる課題を解決するため本発明においては、連続して入力され、時々刻々と変化する問題の解を求める情報処理装置において、入力される前記問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成する問題変換部と、前記問題変換部により生成された前記問題の前記係数データに基づいて、前後する前記問題間の類似度を表す類似度データを生成する類似度解析部と、前記相互作用モデルの初期状態を決定し、決定した初期状態に前記相互作用モデルを設定するための設定データを生成する設定データ生成部と、前記相互作用モデルにおける各前記素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部とを設け、前記設定データ生成部が、1つ前の前記問題及び今回の前記問題の類似度が所定の閾値以下の場合には、前記相互作用モデルの状態をリセットすべきことを表す前記設定データを生成し、当該類似度が前記閾値よりも大きい場合には、前記相互作用モデルの状態をリセットしないことを表す前記設定データを生成し、前記演算部が、前記設定データの値が前記相互作用モデルの状態をリセットすべきことを表す値であった場合には、前記問題変換部から与えられた各前記素子の状態を前記相互作用モデルの初期状態に設定し、前記設定データの値が前記相互作用モデルの状態をリセットしないことを表す値であった場合には、直前の各前記素子の状態を前記今回の問題に対する前記相互作用モデルの初期状態とするようにした。
また本発明においては、連続して入力され、時々刻々と変化する問題の解を求める情報処理装置において実行される情報処理方法であって、前記情報処理装置は、前記相互作用モデルにおける各前記素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部を有し、入力される前記問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成する第1のステップと、生成した前記問題の前記係数データに基づいて、前後する前記問題間の類似度を表す類似度データを生成する第2のステップと、前記相互作用モデルの初期状態を決定し、決定した初期状態に前記相互作用モデルを設定するための設定データを生成する第3のステップと、前記演算部が、前記設定データに応じた初期状態から前記演算を開始する第4のステップとを設け、前記第3のステップでは、1つ前の前記問題及び今回の前記問題の類似度が所定の閾値以下の場合には、前記相互作用モデルの状態をリセットすべきことを表す前記設定データを生成し、当該類似度が前記閾値よりも大きい場合には、前記相互作用モデルの状態をリセットしないことを表す前記設定データを生成し、前記第4のステップにおいて、前記演算部が、前記設定データの値が前記相互作用モデルの状態をリセットすべきことを表す値であった場合には、前記問題変換部から与えられた各前記素子の状態を前記相互作用モデルの初期状態に設定し、前記設定データの値が前記相互作用モデルの状態をリセットしないことを表す値であった場合には、直前の各前記素子の状態を前記今回の問題に対する前記相互作用モデルの初期状態とするようにした。
以上の本情報処理装置及び方法によれば、時々刻々と変化する問題に対する求解の追従性を向上させることができる。
本発明によれば、求解の収束時間を短縮させ得る情報処理装置及び方法を実現できる。
第1の実施の形態による情報処理システムの構成を示すブロック図である。 (A)−(G)は、図8の情報処理装置の構成及び動作の説明に供するタイミングチャートである。 (A)−(G)は、応用例の説明に供するタイミングチャートである。 (A)−(G)は、応用例の説明に供するタイミングチャートである。 第2の実施の形態による情報処理システムの構成を示すブロック図である。 第3の実施の形態による情報処理システムの構成を示すブロック図である。 収束率推定部の構成及び動作の説明に供するブロック図である。 収束率推定部の構成及び動作の説明に供するブロック図である。 第3の実施の形態の応用例の説明に供するブロック図である。 第3の実施の形態による情報処理システムの構成を示すブロック図である。
以下図面について、本発明の一実施の形態を詳述する。
(1)第1の実施の形態
本情報処理システムの特徴は、連続して入力される問題の類似度を解析し、その解析結果に応じてイジングモデルの初期設定を調整する点にある。例えば、問題が変化した際の類似度が高い場合は、リセット動作を行わずに直前のスピン値を初期値とし、系の温度をリセット時よりも低く設定して解探索を開始する。これにより、求解の収束時間を短縮することができる。
図1は、本実施の形態による情報処理システム1を示す。この情報処理システム1は、イジングモデルの基底状態を探索することにより最適化問題の解を求める演算処理を実行する情報処理装置2と、情報処理装置2に問題を与える問題出力装置3と、情報処理装置2により得られた問題の解を表示する結果出力装置4とを備えて構成される。
問題出力装置3は、情報処理装置2に対して問題を提供するためのインタフェースであり、ユーザ設定や、センサから出力されるセンサデータ又はインターネットなどから得られる情報に基づき問題のデータ(問題データ)を生成し、生成した問題データを情報処理装置2に出力する。
例えば、巡回セールスマン問題の場合、問題データとして巡回都市と移動コストとに関する情報が必要となるが、問題出力装置3は、前者についてはユーザによる指定、後者については地図情報などから得られる移動距離に基づいて移動コストを算出することにより問題データを生成する。なお、VICS(登録商標)(Vehicle Information and Communication System)などの渋滞情報を移動コストに反映させることにより、時々刻々と変化する問題を生成することができる。
図2(A)は、問題出力装置による問題データの情報処理装置への出力タイミングを示す。図2において、全体動作は設定期間(時刻t0〜時刻t1、時刻t2〜時刻t3、時刻t4〜時刻t5、時刻t6〜時刻t7、時刻t8〜時刻t9)と演算期間(時刻t1〜時刻t2、時刻t3〜時刻t4、時刻t5〜時刻t6、時刻t7〜時刻t8)とからなるサイクルから構成され、個々の問題データ(A1,A2、A3,B1,B2)はそれぞれ異なる設定期間に演算部に出力される。以下においては、問題データが時々刻々と変化しており、図2において同じ英字同士は、類似度が高いデータであることを意味するものとする。
情報処理装置2は、問題変換部10、類似度解析部11、スピン設定部12、焼きなまし設定部13、演算部14及び演算結果取得部15を備えて構成される。
問題変換部10は、問題出力装置3から与えられる問題データをイジングモデルにマッピングし、その結果として得られた図2(B)に示す係数データ(a1,a2,a3,b1,b2,b3)を設定期間に演算部14に出力する。ここでマッピングとは、最適化したい問題のコスト関数を、エネルギ関数の形式に変換することを意味する。この変換によって、イジングモデルの各係数(各スピンの相互作用係数及び外部磁場係数)の値が算出される。
このようなマッピングは公知の技術であり、例えば上述した特許文献2には因数分解をマッピングする方法が開示され、「Lucas, A. “Ising formulations of many NP problems.” Name: Frontiers in Physics 2.5 (2014)」には、幾つかの最適化問題をエネルギ関数の形式に変換する方法が開示されている。
類似度解析部11は、1つ前のサイクルの係数データと、現在の係数データとを比較することによりこれら係数データの類似度を解析し、その結果を類似度データとしてスピン設定部12及び焼きなまし設定部13に出力する。係数データ間の類似度の具体的な解析方法としては、例えば、相互作用係数や外部磁場係数の値が変化したスピンの数をカウントし、スピン総数に対するカウント値の割合から類似度を算出する方法を利用できる。
なお図2(C)に示すように、類似度データも他のデータと同様に設定期間で出力される。ここで、図2(C)において、時刻t2〜時刻t3の「60」という類似度データは、「a1」という係数データと、「a2」という係数データとを比較した結果得られた類似度データであり、時刻t6〜時刻t7の「5」という類似度データは、「a3」という係数データと、「b1」という係数データとを比較した結果得られた類似度データである。類似度データの値は、0〜100の範囲で正規化され、1つ前のサイクルの係数データと、現在の係数データとの類似度が低いほど類似度データが0に近い値となり、かかる類似度が高いほど類似度データが100に近い値となる。
スピン設定部12は、類似度解析部11から与えられた類似度データを予め設定された第1の閾値と比較し、類似度データが第1の閾値よりも大きいときにはリセットを表す値(「1」)、類似度データが第1の閾値以下のときには非リセットを表す値(「0」)となる図2(D)に示すようなスピン設定データを生成し、生成したスピン設定データを演算部14に出力する。なお図2(D)は、閾値を「50」とした場合の例を示している。
また焼きなまし設定部13は、類似度データに基づき、焼きなましスケジュールを決定するための図2(E)に示すような焼きなましデータを生成し、生成した焼きなましデータを演算部に出力する。焼きなましデータの種類は、古典アニーリングの場合には温度、量子アニーリングの場合には横磁場強度となる。
焼なましデータは、スピン設定データと同様に、予め設定された第2の閾値との比較によりその値が設定される。例えば温度スケジュールの場合、類似度データの値が第2の閾値以下のときには「高温から開始」を示す値に設定され(時刻t0〜時刻t1、時刻t6〜時刻t7)、類似度データの値が閾値よりも大きいときには「低温から開始」を示すような値に設定される(時刻t2〜時刻t3、時刻t4〜時刻t5、時刻t8〜時刻t9)。図2(E)においては、第2の閾値が「50」に設定されることにより、2種類の温度スケジュールが生成された例を示す。なお図2(E)に示すように、温度スケジュールは、設定期間では開始温度を維持し、演算期間で徐々に冷却が進むように設定される。
演算部14は、例えばスピンの動作を模擬した回路から構成される。演算部14の具体例として、例えば特許文献2に記載された半導体装置を適用することができる。演算部14は、イジングモデルの基底状態探索を演算期間に実行し、その過程で得られるスピンの状態をスピン配列データとして次の設定期間に出力する。
演算部14において、スピン配列の初期状態はスピン設定データで制御される。スピン設定データの値が「リセット」を表す値であれば、問題変換部10より与えられたスピン配列が設定される。この初期状態のスピン配列は、例えば、乱数でランダムに生成されたスピン配列であり、問題出力装置3より出力されたデータであっても、問題変換部10において生成されたデータであってもよい。スピン設定データの値が「非リセット」を表す値であれば、直前のスピン配列(1つ前の問題に対するイジングモデルの基底状態)をそのまま利用する。また、スピン間の相互作用係数及び外部磁場係数は、問題変換部10より与えられた係数データに従って設定される。
さらに、演算部14は、イジングモデルの基底状態の探索時に必要となるスピンの揺らぎ(例えば、スピン値(+1、−1)の反転確率)を焼なましデータに基づいて制御する。焼なましデータが「高温から開始」であれば、スピンの揺らぎの大きい状態から探索を開始し、「低温から開始」であれば、揺らぎの小さい状態から探索を開始する。
ここで、演算部14から出力されるスピン配列データの一例を、図2(F)に示す。図2(F)において、「R」と記載したスピン配列データはランダムな配列を意味し、「s1」〜「s4」と記載されたスピン配列は基底状態探索によって得られた配列を意味する。なお、図2(F)において、「→」はスピン配列の変化を意味する。
演算結果取得部15は、イジングモデルの基底状態探索の収束時、言い換えれば演算期間の終了時に演算部14から出力されるスピン配列データを取得し、取得したスピン配列データを図2(G)に示すような演算結果データ(S1,S2,S3,……)に変換して出力する。演算結果データへの変換方法は問題によって異なるが、例えば巡回セールスマンの場合は、同じ向きのスピンを順番に辿って行く方法により変換が可能である。
一方、結果出力装置4は、演算結果データを用途に応じて出力するためのインタフェースである。用途としては、例えばモニタを介したユーザへの結果提示や、システムへの出力によるフィードバック制御の実現などが考えられる。
以上の構成を有する本実施の形態による情報処理システム1では、連続して入力される問題の類似度を係数データ間の類似度として解析し、問題が変化した際の係数データの類似度が高い場合は、リセット動作を行わずに直前のスピン値を初期値とし、系の温度をリセット時よりも低く設定して解探索を開始する。
従って、本情報処理システム1によれば、前の問題と類似する次の問題の解をリセット状態から基底状態の探索を開始する場合と比べて短時間で得ることが期待でき、その分、時々刻々と変化する問題に対する求解の追従性を向上させて、求解の収束時間を短縮することができる。
なお、本情報処理システム1では、図2に示すように、各サイクルにおける演算期間を同じ長さとしているが、例えば図3に示すように、前の問題との類似度が高い次の問題の演算期間(例えば、時刻t3´〜時刻t4´、時刻t5´〜時刻t6´、時刻t9´〜時刻t10´)を短く設定した方が、より効率的な求解が可能である。この動作を実現する場合、問題出力装置3との調停処理が必要となる。その実現方法として、類似度データに基づいて解探索の収束時間を予測し、この情報を問題出力装置3に送ることで、次の問題データが出力されるタイミングを決定させる方法が考えられる。あるいは、基底状態探索の収束を検知し、この情報を問題出力装置3に送ることで、次の問題データが出力されるタイミングを決定させても良い。
一方、さらなる求解の効率化を考えた場合、例えば図4に示すように、焼きなまし設定部13(図1)における類似度データに対する第2の閾値を複数設け、「高温から開始」、「中温から開始」及び「低温から開始」などのように温度スケジューリングを多種化し(図4(E)参照)、焼きなましデータの設定値に応じて演算期間をよりきめ細かく制御する方法も有効である。
(2)第2の実施の形態
第1の実施の形態においては、問題の類似性を解析する際、係数データの変化量を判断基準とした。しかし問題によっては、係数データの類似度が高いにもかかわらず、解となるスピン配列が大きく異なるケースも想定され、そのような場合には目的とする効果が十分に得られない可能性もある。そこで本実施の形態においては、係数データの変化量のみならず、元となる問題データの変化量も解析に加えることで、より確度の高い類似性解析を行う。
図1との対応部分に同一符号を付した図5は、このような類似性解析を行い得るようになされた第2の実施の形態による情報処理システム20を示す。この情報処理システム20は、情報処理装置21の類似度解析部22の構成が異なる点と、問題出力装置3から出力された問題データが情報処理装置21の類似度解析部にも与えられる点とを除いて第1の実施の形態による情報処理システム1と同様に構成されている。
実際上、本実施の形態の類似度解析部22は、第1の実施の形態の類似度解析部11(図1)と同様に、問題変換部10から与えられる係数データに基づいて、1つ前のサイクルの係数データと現在の係数データとの比較を行い、その類似度を算出する。加えて、類似度解析部22は、問題出力装置3から与えられる問題データに基づいて、1つ前のサイクルの問題データと現在の問題データとの比較を行い、その類似度についても比較する。
ここで、問題データの類似度を効率的に解析する方法として、問題データの特徴量を抽出し、特徴量データの比較を行うことが考えられる。例えば問題データが画像の場合、色や輝度、輪郭や形状、固有値などを特徴量にすることが可能である。なお、特徴量は複数抽出することが望ましく、各特徴量データの類似度をデータの変化率等を用いて解析し、適当な重みを乗じて合算することで、総合的な類似度を算出することが可能となる。
そして類似度解析部22は、係数データの類似度と、問題データの類似度とに基づいて、1つ前のサイクルの問題と、今回の問題との類似度を算出する。この類似度の算出方法としては、例えば係数データの類似度と、問題データの類似度とを適当な重みを乗じて合算することにより算出する方法を適用することができる。そして類似度解析部22は、このようにして得られた算出結果を類似度データとしてスピン設定部12及び焼きなまし設定部13に出力する。
以上の構成を有する本実施の形態の情報処理システム20によれば、第1の実施の形態の情報処理システム1と比べて問題の類似度の解析精度を向上できるため、さらなる求解の効率化を図り、より一層と求解の収束時間を短縮させることができる。
(3)第3の実施の形態
第1の実施の形態においては、焼なましデータを生成する際、類似度データの値を判断基準とした。さらに、類似度データの値を判断基準に演算時間を予測する方法についても言及した。しかし問題によっては、事前に判断基準を適切に把握することが困難なケースも想定され、そのような場合には目的とする効果が十分に得られない可能性もある。そこで本実施の形態において、ログデータを学習することにより、判断基準を適正化する。
図1との対応部分に同一符号を付して示す図6は、本実施の形態による情報処理システム30を示す。この情報処理システム30は、問題出力装置31の構成、並びに、情報処理装置32のスピン設定部33及び焼きなまし設定部34の構成が異なる点と、情報処理装置32に演算時間設定部35、収束率推定部36及びログ収集部37が設けられている点とを除いて第1の実施の形態の情報処理システム1と同様に構成されている。
この場合、演算時間設定部35は、類似度解析部11から出力される類似度データに基づいて、演算部14における1つの問題の演算時間(演算期間)を設定するための演算時間データを生成し、生成した演算時間データを問題出力装置31及びログ収集部37に出力する。演算時間データは、例えば、類似性が高いほど演算時間が短くなるような関数を利用して算出された数値である。
問題出力装置31は、第1の実施の形態の問題出力装置3(図1)と同様にして問題データを生成する機能に加えて、演算時間設定部35から与えられる演算時間データに従って問題データの出力タイミングを決定する調停機能を備える。具体的に、問題出力装置31は、生成した問題データを演算時間データの値に応じて、演算時間データの値が大きいほど前回の問題データを出力してから今回の問題データを出力するまでの時間が長くなるような(つまり演算部14における演算時間を延長するような)タイミングで問題データを問題変換部10に出力する。
ログ収集部37は、例えばメモリやハードディスク装置等の記憶装置を備えて構成され、情報処理装置32における過去の処理に関する各種情報を収集して保持する機能を有する。具体的に、ログ収集部37は、少なくとも問題変換部10から出力された係数データと、類似度解析部11から出力された類似度データと、スピン設定部33から出力されたスピン配列データと、演算時間設定部35から出力された演算時間データとを問題ごとにそれぞれ収集し、収集したこれらのデータを保持する。
収束率推定部36は、類似度解析部11から与えられる1つ前のサイクルの係数データと現在の係数データとの類似度を表す類似度データと、ログ収集部37が保持する過去の処理の際に取得した係数データ、類似度データ、スピン配列データ及び演算時間データとに基づいて、次の演算期間に演算部14で実行される演算の収束率を推定する。
具体的に、収束率推定部36は、図7及び図8に示すように、エネルギ算出部40、収束率算出部41、収束率学習部42、及び、設定補正部43を備えて構成される。また収束率推定部36は、動作モードとして、学習モード及び実践モードを有している。そして、学習モード時には、図7に示すようにエネルギ算出部40、収束率算出部41及び収束率学習部42のみが動作し、実践モードには、図8に示すように収束率学習部42及び設定補正部43のみが動作する。つまり図7及び図8では、動作する部位については実線で表し、動作しない部位については破線で表している。
学習モードは、過去の動作実績に基づき、1つ前のサイクルの係数データ及び現在の係数データの類似度と、演算部14における演算時間とに対する収束率の関係を学習する動作モードである。
実際上、学習モード時、収束率推定部36では、エネルギ算出部40が、ログ収集部37が保持する過去の係数データ及びスピン配列データからハミルトニアンを算出し、算出結果をエネルギデータとして収束率算出部41に出力する。そして収束率算出部41は、エネルギデータから収束率を解析し、その結果を収束率データとして収束率学習部42に出力する。収束率データの算出方法としては、例えば、エネルギデータが0に近いほど収束率が高くなるような関数を用いて算出する方法を適用することができる。
収束率学習部42は、ログ収集部37が保持する対応する類似度データ及び演算時間データを入力データとし、収束率算出部41から与えられる収束率データを教師データとして、類似度及び演算時間と収束率との関係性の学習を実施する。関係性の学習には幾つかの方法が考えられるが、その一例としてニューラルネットワークを挙げることができる。なお、学習モードは、ログの内容が変化するため、定期的に実施することが望ましい。
一方、実践モードは、現在の類似度データ及び演算時間データに基づいて、現在の問題に対する演算部の演算の収束率を予測する動作モードである。
実際上、実践モード時、収束率推定部36では、類似度解析部11(図6)から出力される現在解くべき問題に関する類似度データと、演算時間設定部35(図6)から出力される演算時間データとが収束率学習部42に与えられる。そして収束率学習部42は、これらのデータに基づいて、現在の問題に対する演算部14の収束率を表す収束率データを生成し、生成した収束率データを設定補正部43に出力する。
設定補正部43は、収束率データを解析し、例えば収束率データの値が当該収束率データについて予め設定された第3の閾値以下の場合には、収束率を向上させる方向に誘導するための補正データを生成し、生成した補正データを図6に示すように演算時間設定部35、スピン設定部33及び焼なまし設定部34に出力する。
演算時間設定部35、スピン設定部33、焼なまし設定部34は、それぞれ補正データに基づき、現在のデータ生成に関するルールを改変する機能を有する。具体的に、演算時間設定部35は、かかる補正データが与えられると、補正データに応じた時間だけ演算期間を延長させるような演算時間データを生成(つまり演算時間データの値を大きく設定)する。またスピン設定部33は、演算部14におけるリセットを促進するよう上述の第1の閾値の値を下げ、焼きなまし設定部34は、演算部14における開始温度を上昇させるよう上述の第2の閾値の値を上げる。
以上の構成を有する本実施の形態の情報処理システム30によれば、連続して入力される問題の類似度を解析し、その解析結果に応じてイジングモデルの初期設定を調整可能である。また本情報処理システム30によれば、第1の実施の形態の情報処理システム1(図1)と比べて初期設定の調整精度を向上できるため、さらなる求解の効率化を図り、より一層と求解の収束時間を短縮させることができる。
なお、ログ収集部37が保持する各データを活用することで、問題の類似度の変化パターンを学習することも可能である。応用例として、例えば図6との対応部分に同一符号を付した図9に示すように、連続して入力する問題同士の類似度を問題先読み部52で予測し、予測結果を演算時間設定部35に与える構成が考えられる。これにより、問題出力装置31との出力タイミングの調停において、より長期に渡る予約が可能となり、求解処理の連続性を向上可能である。さらには、かかる予測結果を問題変換部にも与える構成することで、問題データが入力される前に演算を開始することも可能となる。これにより、さらなる演算時間の短縮が可能である。
(4)第4の実施の形態
先の第1〜第3の実施の形態においては、演算部14に与えるスピン設定データ及び焼なましデータは一種類であった。しかし、これらスピン設定データ及び焼なましデータを多重化し、演算部14においてエリア単位又はスピン単位でスピン配列及びスピンの揺らぎの大きさを設定できれば、より効率的な基底状態の探索が可能となる。
図1との対応部分に同一符号を付して示す図10は、上述のように情報処理装置61の演算部62においてエリア単位でスピン配列及びスピンの揺らぎの大きさを設定可能な本実施の形態による情報処理システム60を示す。この情報処理システム60は、情報処理装置61の類似度解析部63及び演算部62の構成が異なる点と、情報処理装置61のスピン設定部12及び焼きなまし設定部13がそれぞれ複数設けられている点とを除いて第1の実施の形態の情報処理システム1(図1)と同様に構成されている。
実際上、本実施の形態の情報処理システム60の場合、情報処理装置61の演算部62は、複数のエリアARから構成され、スピン配列の初期状態及びスピンの揺らぎの大きさをエリアARごとにそれぞれ個別に設定できるようになされている。エリアARの設定方法としては、例えば、位置座標に相当する情報をスピンに付加し、エリアARごとにほぼ等数のスピンが含まれるように、境界となる座標を設定すれば良い。また情報処理装置61には、演算部62の各エリアARとそれぞれ対応させ、そのエリアARに専用のスピン設定部12及び焼きなまし設定部13が設けられている。
また類似度解析部63は、第1の実施の形態の類似度解析部11(図1)と同様にして、1つ前のサイクルの係数データと現在の係数データとの比較を行い、これら係数データの類似度を表す類似度データを生成する機能を有する。この場合、類似度解析部63は、演算部62のエリアARごとにかかる比較を行い、当該エリアARごとの類似度データをそれぞれ生成する。そして類似度解析部63は、このようにして生成した演算部62のエリアARごとの類似度データを、それぞれそのエリアARと対応付けられたスピン設定部12及び焼きなまし設定部13に出力する。
各スピン設定部12は、類似度解析部63から与えられた類似度データに基づいて、第1の実施の形態について上述した手法によりスピン設定データをそれぞれ生成し、生成したスピン設定データを演算部62に出力する。また各焼きなまし設定部13も、類似度解析部63から与えられた類似度データに基づいて、第1の実施の形態について上述した手法により焼きなましデータをそれぞれ生成し、生成した焼きなましデータを演算部62に出力する。
演算部62は、エリアARごとに、対応するスピン設定部12から与えられるスピン設定データに基づいてスピン配列の初期状態を設定する共に、対応する焼きなまし設定部13から与えられる焼きなましデータに基づいてスピンの揺らぎの大きさを設定する。そして演算部62は、この状態でイジングモデルの基底状態探索を行い、その探索結果を演算結果取得部15に出力する。なお演算部62のエリアARは、必ずしも境界が物理的に接している必要はなく、例えば、複数の半導体チップで構成されていても良い。
ここで、動作の一例として、演算部62のあるエリアARのみ類似度データの値が低く、他のエリアARの類似度データの値が高いケースを考える。このケースにおいては、類似度が低いエリアARのみに“リセット”が適用され、そのエリアARにおけるスピン配列の組合せ探索が重点的に実行される。一般的に、類似度データの値が低いエリアARのスピン配列を積極的に変更した方が、基底状態探索を高速化できるため、本情報処理システム60により演算時間の短縮が可能であると言える。
以上の構成を有する本実施の形態の情報処理システム60によれば、連続して入力される問題の類似度を解析し、その解析結果に応じてイジングモデルの初期設定を調整可能である。さらに、第1〜第3の実施の形態の情報処理システム1,20,30と比べて基底状態探索の性能を向上できるため、さらなる求解の効率化を図り、より一層と求解の収束時間を短縮させることができる。
(5)他の実施の形態
なお上述の第1〜第4の実施の形態においては、それぞれの特徴的構成を別々の情報処理システム1,20,30,50,60に搭載する場合について述べたが、本発明はこれに限らず、これら第1〜第4の実施の形態の特徴的構成の一部又は全部を組み合わせて1つの情報処理システムに搭載するようにしても良い。
また上述の第1〜第4の実施の形態においては、基底状態の探索方法として焼なまし法を前提とする場合について述べたが、本発明はこれに限らず、他の探索アルゴリズムも適応可能である。例えば、遺伝アルゴリズムを適用する場合は、類似度データの算出値に応じて、交叉率や突然変異率の値を適応的に変化させれば良い。また、演算部14,62は様々な形態が考えられるが、その一例を挙げるのであれば、CMOS回路で構成されたSRAM(Static Random Access Memory)ベースの回路である。さらに、例えばSRAMのメモリセルを用いてスピンを構成する共に、メモリセル間に演算回路を追加することで相互作用と外部磁場を形成することが可能である。
さらに上述に第1〜第4の実施の形態においては、相互作用モデルとしてイジングモデルを適用した場合について述べたが、本発明はこれに限らず、この他種々の相互作用モデルを適用することができる。
さらに上述の第1〜第4の実施の形態においては、入力される問題を所定の相互作用モデル(イジングモデル)にマッピングしたときの当該相互作用モデルを構成する各素子(スピン)間の相互作用の強さを決定する係数の値を表す係数データを生成する問題変換部10と、問題変換部10により生成された問題の係数データに基づいて、前後する問題間の類似度を表す類似度データを生成する類似度解析部11,22,63と、相互作用モデルの初期状態を決定し、決定した初期状態に相互作用モデルを設定するための設定データを生成する設定データ生成部としてのスピン設定部33と、相互作用モデルにおける各素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部14となどの情報処理装置2,21,32,51,61の各構成要素をハードウェア構成とするようにした場合について述べたが、本発明はこれに限らず、これらの一部又は全部をソフトウェア構成とするようにしても良い。
本発明は、連続して入力され、時々刻々と変化する問題の解を求める情報処理装置に広く適用することができる。
1,20,30,50,60……情報処理システム、2,21,32,51,61……情報処理装置、3……問題出力装置、4……結果出力装置、10……問題変換部、11,22,63……類似度解析部、12,33……スピン設定部、13,34……焼きなまし設定部、14,62……演算部、15……演算結果取得部、35……演算時間設定部、36……収束率推定部、37……ログ収集部、40……エネルギ算出部、41……収束率算出部、収束率学習部、43……設定補正部、52……問題先読み部、AR……エリア。

Claims (12)

  1. 連続して入力され、時々刻々と変化する問題の解を求める情報処理装置において、
    入力される前記問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成する問題変換部と、
    前記問題変換部により生成された前記問題の前記係数データに基づいて、前後する前記問題間の類似度を表す類似度データを生成する類似度解析部と、
    前記相互作用モデルの初期状態を決定し、決定した初期状態に前記相互作用モデルを設定するための設定データを生成する設定データ生成部と、
    前記相互作用モデルにおける各前記素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部と
    を備え、
    前記設定データ生成部は、
    1つ前の前記問題及び今回の前記問題の類似度が所定の閾値以下の場合には、前記相互作用モデルの状態をリセットすべきことを表す前記設定データを生成し、当該類似度が前記閾値よりも大きい場合には、前記相互作用モデルの状態をリセットしないことを表す前記設定データを生成し、
    前記演算部は、
    前記設定データの値が前記相互作用モデルの状態をリセットすべきことを表す値であった場合には、前記問題変換部から与えられた各前記素子の状態を前記相互作用モデルの初期状態に設定し、前記設定データの値が前記相互作用モデルの状態をリセットしないことを表す値であった場合には、直前の各前記素子の状態を前記今回の問題に対する前記相互作用モデルの初期状態とする
    ことを特徴とする情報処理装置。
  2. 前記類似度データに基づいて、前記素子の揺らぎの大きさを制御する焼きなましデータを生成する焼きなまし設定部を備え、
    前記演算部は、
    前記焼きなましデータの値に応じた前記素子の揺らぎの大きさの状態から、前記相互作用モデルの基底状態の探索を開始する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記類似度解析部は、
    前後する前記問題の前記係数データの類似度と、当該前後する前記問題のデータの類似度とに基づいて、前記類似度データを生成する
    ことを特徴とする請求項1に記載の情報処理装置。
  4. 前記演算部における前記演算の時間を設定するための演算時間データを生成する演算時間設定部と、
    前記演算時間データに基づくタイミングで前記問題変換部に前記問題を出力する問題出力部と、
    過去の前記問題の前記演算時間データ、前記設定データ、前記係数データ及び前記前記類似度データと、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の収束率を推定する収束率推定部と
    をさらに備え、
    前記演算時間設定部は、
    前記収束率推定部により推定された前記収束率に応じた時間に前記演算部における前記演算の時間を設定するように前記演算時間データを生成する
    ことを特徴とする請求項1に記載の情報処理装置。
  5. 過去の前記問題に関する前記係数データ、前記類似度データ、前記設定データ及び前記演算時間を収集して保持するログ収集部をさらに備え、
    前記収束率推定部は、
    前記ログ収集部に保持された前記係数データ、前記類似度データ、前記設定データ及び前記演算時間と、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の前記収束率を推定する
    ことを特徴とする請求項4に記載の情報処理装置。
  6. 前記演算部は、
    前記相互作用モデルの初期状態を、当該相互作用モデルを複数のエリアに分割したエリアごとに設定でき、
    前記類似度解析部は、
    前記相互作用モデルの前記エリアごとの前記類似度データをそれぞれ生成し、
    前記設定データ生成部は、
    前記相互作用モデルの各前記エリアにそれぞれ対応させて設けられ、前記類似度解析部により生成された前記類似度データのうちの対応する前記類似度データに基づいて、前記相互作用モデルの対応する前記エリアの初期状態を決定し、決定した初期状態に前記相互作用モデルの当該エリアを設定するための前記設定データを生成する
    ことを特徴とする請求項1に記載の情報処理装置。
  7. 連続して入力され、時々刻々と変化する問題の解を求める情報処理装置において実行される情報処理方法であって、
    前記情報処理装置は、
    前記相互作用モデルにおける各前記素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部
    を有し、
    入力される前記問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成する第1のステップと、
    生成した前記問題の前記係数データに基づいて、前後する前記問題間の類似度を表す類似度データを生成する第2のステップと、
    前記相互作用モデルの初期状態を決定し、決定した初期状態に前記相互作用モデルを設定するための設定データを生成する第3のステップと、
    前記演算部が、前記設定データに応じた初期状態から前記演算を開始する第4のステップと
    を備え、
    前記第3のステップでは、
    1つ前の前記問題及び今回の前記問題の類似度が所定の閾値以下の場合には、前記相互作用モデルの状態をリセットすべきことを表す前記設定データを生成し、当該類似度が前記閾値よりも大きい場合には、前記相互作用モデルの状態をリセットしないことを表す前記設定データを生成し、
    前記第4のステップにおいて、前記演算部は、
    前記設定データの値が前記相互作用モデルの状態をリセットすべきことを表す値であった場合には、前記問題変換部から与えられた各前記素子の状態を前記相互作用モデルの初期状態に設定し、前記設定データの値が前記相互作用モデルの状態をリセットしないことを表す値であった場合には、直前の各前記素子の状態を前記今回の問題に対する前記相互作用モデルの初期状態とする
    ことを特徴とする情報処理方法。
  8. 前記第3のステップでは、
    前記類似度データに基づいて、前記素子の揺らぎの大きさを制御する焼きなましデータを生成し、
    前記第4のステップでは、
    前記演算部が、前記焼きなましデータの値に応じた前記素子の揺らぎの大きさの状態から、前記相互作用モデルの基底状態の探索を開始する
    ことを特徴とする請求項7に記載の情報処理方法。
  9. 前記第2のステップでは、
    前後する前記問題の前記係数データの類似度と、当該前後する前記問題のデータの類似度とに基づいて、前記類似度データを生成する
    ことを特徴とする請求項7に記載の情報処理方法。
  10. 過去の前記問題の前記演算時間データ、前記設定データ、前記係数データ及び前記前記類似度データと、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の収束率を推定する第5のステップと、
    推定した前記収束率に応じた時間に前記演算部における前記演算の時間を設定するように前記演算時間データを生成する第6のステップと、
    前記演算時間データに基づいて、前記問題を入力するタイミングを制御する第7のステップと
    を備えることを特徴とする請求項7に記載の情報処理方法。
  11. 前記情報処理装置は、
    過去の前記問題に関する前記係数データ、前記類似度データ、前記設定データ及び前記演算時間を収集して保持し、
    前記第5のステップでは、
    保持した前記係数データ、前記類似度データ、前記設定データ及び前記演算時間と、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の前記収束率を推定する
    ことを特徴とする請求項10に記載の情報処理方法。
  12. 前記演算部は、
    前記相互作用モデルの初期状態を、当該相互作用モデルを複数のエリアに分割したエリアごとに設定でき、
    前記第2のステップでは、
    前記相互作用モデルの前記エリアごとの前記類似度データをそれぞれ生成し、
    前記第3のステップでは、
    前記相互作用モデルの前記エリアごとに、対応する前記類似度データに基づいて当該エリアの初期状態を決定し、決定した初期状態に当該エリアをそれぞれ設定するための設定データを生成する
    ことを特徴とする請求項7に記載の情報処理方法。
JP2017537115A 2015-08-31 2015-08-31 情報処理装置及び方法 Expired - Fee Related JP6629864B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/074813 WO2017037859A1 (ja) 2015-08-31 2015-08-31 情報処理装置及び方法

Publications (2)

Publication Number Publication Date
JPWO2017037859A1 true JPWO2017037859A1 (ja) 2018-07-12
JP6629864B2 JP6629864B2 (ja) 2020-01-15

Family

ID=58187247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017537115A Expired - Fee Related JP6629864B2 (ja) 2015-08-31 2015-08-31 情報処理装置及び方法

Country Status (2)

Country Link
JP (1) JP6629864B2 (ja)
WO (1) WO2017037859A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109523029B (zh) * 2018-09-28 2020-11-03 清华大学深圳研究生院 自适应双自驱动深度确定性策略梯度强化学习方法
JP7187972B2 (ja) 2018-10-24 2022-12-13 富士通株式会社 装置、方法およびプログラム
JP7396024B2 (ja) 2019-12-20 2023-12-12 日本電気株式会社 情報処理装置、情報処理方法及びプログラム
JP7491032B2 (ja) 2020-04-13 2024-05-28 富士通株式会社 最適化装置、最適化方法及び最適化プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280059A (ja) * 2006-04-06 2007-10-25 Sony Corp 認識生成装置および認識生成方法、並びにプログラム
JP2013171327A (ja) * 2012-02-17 2013-09-02 Kddi Corp サポートベクトルマシンを構築する方法及び装置
WO2014192153A1 (ja) * 2013-05-31 2014-12-04 株式会社日立製作所 半導体装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280059A (ja) * 2006-04-06 2007-10-25 Sony Corp 認識生成装置および認識生成方法、並びにプログラム
JP2013171327A (ja) * 2012-02-17 2013-09-02 Kddi Corp サポートベクトルマシンを構築する方法及び装置
WO2014192153A1 (ja) * 2013-05-31 2014-12-04 株式会社日立製作所 半導体装置

Also Published As

Publication number Publication date
WO2017037859A1 (ja) 2017-03-09
JP6629864B2 (ja) 2020-01-15

Similar Documents

Publication Publication Date Title
Ding et al. Multimodal safety-critical scenarios generation for decision-making algorithms evaluation
US20230252327A1 (en) Neural architecture search for convolutional neural networks
KR20190069582A (ko) 보조 작업들을 통한 강화 학습
Osorio et al. A simulation-based optimization framework for urban transportation problems
Klemm et al. Global culture: A noise-induced transition in finite systems
JP7335434B2 (ja) 後知恵モデリングを用いた行動選択ニューラルネットワークの訓練
US11551144B2 (en) Dynamic placement of computation sub-graphs
WO2018160267A2 (en) Cloud based robotic control systems and methods
WO2017037859A1 (ja) 情報処理装置及び方法
Tong et al. Optimal sensor placement for mode shapes using improved simulated annealing
TW201539335A (zh) 實現神經網路處理器
US11443219B2 (en) Model estimation system, method, and program
EP3616128A1 (en) Batched reinforcement learning
Yan et al. Efficient selection of a set of good enough designs with complexity preference
Muhsen et al. Enhancing NoC-based MPSoC performance: a predictive approach with ANN and guaranteed convergence arithmetic optimization algorithm
KR102059902B1 (ko) 교통 속도 추정 방법 및 시스템
JP2021036395A (ja) 機械学習装置および機械学習方法
Singh et al. A hybrid surrogate based algorithm (HSBA) to solve computationally expensive optimization problems
Zhao et al. Traffic signal timing via parallel reinforcement learning
WO2020218246A1 (ja) 最適化装置、最適化方法、及びプログラム
Li et al. Prediction for short-term traffic flow based on optimized wavelet neural network model
JP7207531B2 (ja) 経路別交通量推定装置、経路別交通量推定方法、及び経路別交通量推定プログラム
KR20220134627A (ko) 하드웨어-최적화된 신경 아키텍처 검색
Greveling Modelling human driving behaviour using Generative Adversarial Networks
Tréca et al. Fast bootstrapping for reinforcement learning-based traffic signal control systems using queueing theory

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191205

R150 Certificate of patent or registration of utility model

Ref document number: 6629864

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees