JPWO2017037859A1 - 情報処理装置及び方法 - Google Patents
情報処理装置及び方法 Download PDFInfo
- Publication number
- JPWO2017037859A1 JPWO2017037859A1 JP2017537115A JP2017537115A JPWO2017037859A1 JP WO2017037859 A1 JPWO2017037859 A1 JP WO2017037859A1 JP 2017537115 A JP2017537115 A JP 2017537115A JP 2017537115 A JP2017537115 A JP 2017537115A JP WO2017037859 A1 JPWO2017037859 A1 JP WO2017037859A1
- Authority
- JP
- Japan
- Prior art keywords
- data
- similarity
- interaction model
- unit
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title abstract description 31
- 230000003993 interaction Effects 0.000 claims abstract description 90
- 238000006243 chemical reaction Methods 0.000 claims abstract description 26
- 230000005283 ground state Effects 0.000 claims abstract description 25
- 230000008859 change Effects 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims description 117
- 238000000137 annealing Methods 0.000 claims description 37
- 238000004458 analytical method Methods 0.000 claims description 35
- 238000003672 processing method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 abstract description 7
- 230000005366 Ising model Effects 0.000 description 15
- 238000012937 correction Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000010129 solution processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N99/00—Subject matter not provided for in other groups of this subclass
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
求解の収束時間を短縮させ得る情報処理装置及び方法を提案する。
【解決手段】
連続して入力され、時々刻々と変化する問題の解を求める情報処理装置及び方法において、相互作用モデルにおける各素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部を情報処理装置に設け、入力される問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成し、生成した問題の係数データに基づいて、前後する問題間の類似度を表す類似度データを生成し、1つ前の問題及び今回の問題の類似度が所定の閾値以下の場合には、問題変換部から与えられた各素子の状態を相互作用モデルの初期状態に設定し、当該類似度が閾値よりも大きい場合には、直前の各素子の状態を今回の問題に対する相互作用モデルの初期状態とするようにした。
Description
本情報処理システムの特徴は、連続して入力される問題の類似度を解析し、その解析結果に応じてイジングモデルの初期設定を調整する点にある。例えば、問題が変化した際の類似度が高い場合は、リセット動作を行わずに直前のスピン値を初期値とし、系の温度をリセット時よりも低く設定して解探索を開始する。これにより、求解の収束時間を短縮することができる。
第1の実施の形態においては、問題の類似性を解析する際、係数データの変化量を判断基準とした。しかし問題によっては、係数データの類似度が高いにもかかわらず、解となるスピン配列が大きく異なるケースも想定され、そのような場合には目的とする効果が十分に得られない可能性もある。そこで本実施の形態においては、係数データの変化量のみならず、元となる問題データの変化量も解析に加えることで、より確度の高い類似性解析を行う。
第1の実施の形態においては、焼なましデータを生成する際、類似度データの値を判断基準とした。さらに、類似度データの値を判断基準に演算時間を予測する方法についても言及した。しかし問題によっては、事前に判断基準を適切に把握することが困難なケースも想定され、そのような場合には目的とする効果が十分に得られない可能性もある。そこで本実施の形態において、ログデータを学習することにより、判断基準を適正化する。
先の第1〜第3の実施の形態においては、演算部14に与えるスピン設定データ及び焼なましデータは一種類であった。しかし、これらスピン設定データ及び焼なましデータを多重化し、演算部14においてエリア単位又はスピン単位でスピン配列及びスピンの揺らぎの大きさを設定できれば、より効率的な基底状態の探索が可能となる。
なお上述の第1〜第4の実施の形態においては、それぞれの特徴的構成を別々の情報処理システム1,20,30,50,60に搭載する場合について述べたが、本発明はこれに限らず、これら第1〜第4の実施の形態の特徴的構成の一部又は全部を組み合わせて1つの情報処理システムに搭載するようにしても良い。
Claims (12)
- 連続して入力され、時々刻々と変化する問題の解を求める情報処理装置において、
入力される前記問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成する問題変換部と、
前記問題変換部により生成された前記問題の前記係数データに基づいて、前後する前記問題間の類似度を表す類似度データを生成する類似度解析部と、
前記相互作用モデルの初期状態を決定し、決定した初期状態に前記相互作用モデルを設定するための設定データを生成する設定データ生成部と、
前記相互作用モデルにおける各前記素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部と
を備え、
前記設定データ生成部は、
1つ前の前記問題及び今回の前記問題の類似度が所定の閾値以下の場合には、前記相互作用モデルの状態をリセットすべきことを表す前記設定データを生成し、当該類似度が前記閾値よりも大きい場合には、前記相互作用モデルの状態をリセットしないことを表す前記設定データを生成し、
前記演算部は、
前記設定データの値が前記相互作用モデルの状態をリセットすべきことを表す値であった場合には、前記問題変換部から与えられた各前記素子の状態を前記相互作用モデルの初期状態に設定し、前記設定データの値が前記相互作用モデルの状態をリセットしないことを表す値であった場合には、直前の各前記素子の状態を前記今回の問題に対する前記相互作用モデルの初期状態とする
ことを特徴とする情報処理装置。 - 前記類似度データに基づいて、前記素子の揺らぎの大きさを制御する焼きなましデータを生成する焼きなまし設定部を備え、
前記演算部は、
前記焼きなましデータの値に応じた前記素子の揺らぎの大きさの状態から、前記相互作用モデルの基底状態の探索を開始する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記類似度解析部は、
前後する前記問題の前記係数データの類似度と、当該前後する前記問題のデータの類似度とに基づいて、前記類似度データを生成する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記演算部における前記演算の時間を設定するための演算時間データを生成する演算時間設定部と、
前記演算時間データに基づくタイミングで前記問題変換部に前記問題を出力する問題出力部と、
過去の前記問題の前記演算時間データ、前記設定データ、前記係数データ及び前記前記類似度データと、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の収束率を推定する収束率推定部と
をさらに備え、
前記演算時間設定部は、
前記収束率推定部により推定された前記収束率に応じた時間に前記演算部における前記演算の時間を設定するように前記演算時間データを生成する
ことを特徴とする請求項1に記載の情報処理装置。 - 過去の前記問題に関する前記係数データ、前記類似度データ、前記設定データ及び前記演算時間を収集して保持するログ収集部をさらに備え、
前記収束率推定部は、
前記ログ収集部に保持された前記係数データ、前記類似度データ、前記設定データ及び前記演算時間と、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の前記収束率を推定する
ことを特徴とする請求項4に記載の情報処理装置。 - 前記演算部は、
前記相互作用モデルの初期状態を、当該相互作用モデルを複数のエリアに分割したエリアごとに設定でき、
前記類似度解析部は、
前記相互作用モデルの前記エリアごとの前記類似度データをそれぞれ生成し、
前記設定データ生成部は、
前記相互作用モデルの各前記エリアにそれぞれ対応させて設けられ、前記類似度解析部により生成された前記類似度データのうちの対応する前記類似度データに基づいて、前記相互作用モデルの対応する前記エリアの初期状態を決定し、決定した初期状態に前記相互作用モデルの当該エリアを設定するための前記設定データを生成する
ことを特徴とする請求項1に記載の情報処理装置。 - 連続して入力され、時々刻々と変化する問題の解を求める情報処理装置において実行される情報処理方法であって、
前記情報処理装置は、
前記相互作用モデルにおける各前記素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部
を有し、
入力される前記問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成する第1のステップと、
生成した前記問題の前記係数データに基づいて、前後する前記問題間の類似度を表す類似度データを生成する第2のステップと、
前記相互作用モデルの初期状態を決定し、決定した初期状態に前記相互作用モデルを設定するための設定データを生成する第3のステップと、
前記演算部が、前記設定データに応じた初期状態から前記演算を開始する第4のステップと
を備え、
前記第3のステップでは、
1つ前の前記問題及び今回の前記問題の類似度が所定の閾値以下の場合には、前記相互作用モデルの状態をリセットすべきことを表す前記設定データを生成し、当該類似度が前記閾値よりも大きい場合には、前記相互作用モデルの状態をリセットしないことを表す前記設定データを生成し、
前記第4のステップにおいて、前記演算部は、
前記設定データの値が前記相互作用モデルの状態をリセットすべきことを表す値であった場合には、前記問題変換部から与えられた各前記素子の状態を前記相互作用モデルの初期状態に設定し、前記設定データの値が前記相互作用モデルの状態をリセットしないことを表す値であった場合には、直前の各前記素子の状態を前記今回の問題に対する前記相互作用モデルの初期状態とする
ことを特徴とする情報処理方法。 - 前記第3のステップでは、
前記類似度データに基づいて、前記素子の揺らぎの大きさを制御する焼きなましデータを生成し、
前記第4のステップでは、
前記演算部が、前記焼きなましデータの値に応じた前記素子の揺らぎの大きさの状態から、前記相互作用モデルの基底状態の探索を開始する
ことを特徴とする請求項7に記載の情報処理方法。 - 前記第2のステップでは、
前後する前記問題の前記係数データの類似度と、当該前後する前記問題のデータの類似度とに基づいて、前記類似度データを生成する
ことを特徴とする請求項7に記載の情報処理方法。 - 過去の前記問題の前記演算時間データ、前記設定データ、前記係数データ及び前記前記類似度データと、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の収束率を推定する第5のステップと、
推定した前記収束率に応じた時間に前記演算部における前記演算の時間を設定するように前記演算時間データを生成する第6のステップと、
前記演算時間データに基づいて、前記問題を入力するタイミングを制御する第7のステップと
を備えることを特徴とする請求項7に記載の情報処理方法。 - 前記情報処理装置は、
過去の前記問題に関する前記係数データ、前記類似度データ、前記設定データ及び前記演算時間を収集して保持し、
前記第5のステップでは、
保持した前記係数データ、前記類似度データ、前記設定データ及び前記演算時間と、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の前記収束率を推定する
ことを特徴とする請求項10に記載の情報処理方法。 - 前記演算部は、
前記相互作用モデルの初期状態を、当該相互作用モデルを複数のエリアに分割したエリアごとに設定でき、
前記第2のステップでは、
前記相互作用モデルの前記エリアごとの前記類似度データをそれぞれ生成し、
前記第3のステップでは、
前記相互作用モデルの前記エリアごとに、対応する前記類似度データに基づいて当該エリアの初期状態を決定し、決定した初期状態に当該エリアをそれぞれ設定するための設定データを生成する
ことを特徴とする請求項7に記載の情報処理方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/074813 WO2017037859A1 (ja) | 2015-08-31 | 2015-08-31 | 情報処理装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017037859A1 true JPWO2017037859A1 (ja) | 2018-07-12 |
JP6629864B2 JP6629864B2 (ja) | 2020-01-15 |
Family
ID=58187247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017537115A Expired - Fee Related JP6629864B2 (ja) | 2015-08-31 | 2015-08-31 | 情報処理装置及び方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6629864B2 (ja) |
WO (1) | WO2017037859A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109523029B (zh) * | 2018-09-28 | 2020-11-03 | 清华大学深圳研究生院 | 自适应双自驱动深度确定性策略梯度强化学习方法 |
JP7187972B2 (ja) | 2018-10-24 | 2022-12-13 | 富士通株式会社 | 装置、方法およびプログラム |
JP7396024B2 (ja) | 2019-12-20 | 2023-12-12 | 日本電気株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7491032B2 (ja) | 2020-04-13 | 2024-05-28 | 富士通株式会社 | 最適化装置、最適化方法及び最適化プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007280059A (ja) * | 2006-04-06 | 2007-10-25 | Sony Corp | 認識生成装置および認識生成方法、並びにプログラム |
JP2013171327A (ja) * | 2012-02-17 | 2013-09-02 | Kddi Corp | サポートベクトルマシンを構築する方法及び装置 |
WO2014192153A1 (ja) * | 2013-05-31 | 2014-12-04 | 株式会社日立製作所 | 半導体装置 |
-
2015
- 2015-08-31 JP JP2017537115A patent/JP6629864B2/ja not_active Expired - Fee Related
- 2015-08-31 WO PCT/JP2015/074813 patent/WO2017037859A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007280059A (ja) * | 2006-04-06 | 2007-10-25 | Sony Corp | 認識生成装置および認識生成方法、並びにプログラム |
JP2013171327A (ja) * | 2012-02-17 | 2013-09-02 | Kddi Corp | サポートベクトルマシンを構築する方法及び装置 |
WO2014192153A1 (ja) * | 2013-05-31 | 2014-12-04 | 株式会社日立製作所 | 半導体装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2017037859A1 (ja) | 2017-03-09 |
JP6629864B2 (ja) | 2020-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ding et al. | Multimodal safety-critical scenarios generation for decision-making algorithms evaluation | |
US20230252327A1 (en) | Neural architecture search for convolutional neural networks | |
KR20190069582A (ko) | 보조 작업들을 통한 강화 학습 | |
Osorio et al. | A simulation-based optimization framework for urban transportation problems | |
Klemm et al. | Global culture: A noise-induced transition in finite systems | |
JP7335434B2 (ja) | 後知恵モデリングを用いた行動選択ニューラルネットワークの訓練 | |
US11551144B2 (en) | Dynamic placement of computation sub-graphs | |
WO2018160267A2 (en) | Cloud based robotic control systems and methods | |
WO2017037859A1 (ja) | 情報処理装置及び方法 | |
Tong et al. | Optimal sensor placement for mode shapes using improved simulated annealing | |
TW201539335A (zh) | 實現神經網路處理器 | |
US11443219B2 (en) | Model estimation system, method, and program | |
EP3616128A1 (en) | Batched reinforcement learning | |
Yan et al. | Efficient selection of a set of good enough designs with complexity preference | |
Muhsen et al. | Enhancing NoC-based MPSoC performance: a predictive approach with ANN and guaranteed convergence arithmetic optimization algorithm | |
KR102059902B1 (ko) | 교통 속도 추정 방법 및 시스템 | |
JP2021036395A (ja) | 機械学習装置および機械学習方法 | |
Singh et al. | A hybrid surrogate based algorithm (HSBA) to solve computationally expensive optimization problems | |
Zhao et al. | Traffic signal timing via parallel reinforcement learning | |
WO2020218246A1 (ja) | 最適化装置、最適化方法、及びプログラム | |
Li et al. | Prediction for short-term traffic flow based on optimized wavelet neural network model | |
JP7207531B2 (ja) | 経路別交通量推定装置、経路別交通量推定方法、及び経路別交通量推定プログラム | |
KR20220134627A (ko) | 하드웨어-최적화된 신경 아키텍처 검색 | |
Greveling | Modelling human driving behaviour using Generative Adversarial Networks | |
Tréca et al. | Fast bootstrapping for reinforcement learning-based traffic signal control systems using queueing theory |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190416 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6629864 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |