JP6757280B2 - パラメータ出力装置、パラメータ出力方法及びプログラム - Google Patents

パラメータ出力装置、パラメータ出力方法及びプログラム Download PDF

Info

Publication number
JP6757280B2
JP6757280B2 JP2017039148A JP2017039148A JP6757280B2 JP 6757280 B2 JP6757280 B2 JP 6757280B2 JP 2017039148 A JP2017039148 A JP 2017039148A JP 2017039148 A JP2017039148 A JP 2017039148A JP 6757280 B2 JP6757280 B2 JP 6757280B2
Authority
JP
Japan
Prior art keywords
parameter
simulation
parameters
unit
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017039148A
Other languages
English (en)
Other versions
JP2018147075A (ja
Inventor
琢馬 大塚
琢馬 大塚
太 納谷
太 納谷
清水 仁
清水  仁
澤田 宏
宏 澤田
上田 修功
修功 上田
具治 岩田
具治 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017039148A priority Critical patent/JP6757280B2/ja
Publication of JP2018147075A publication Critical patent/JP2018147075A/ja
Application granted granted Critical
Publication of JP6757280B2 publication Critical patent/JP6757280B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、パラメータ出力装置、パラメータ出力方法及びプログラムに関する。
人の流れ(人流)や交通量、雨量等の空間的な広がりを有するオブジェクトをシミュレーションする技術が知られている。近年では、シミュレーションする対象のオブジェクトに応じて様々なシミュレータが開発されている(非特許文献1)。
また、シミュレーションに用いられるパラメータと、シミュレーション結果の評価スコア(以降では、「評価尺度」と表す。)とのペアから次に試行するパラメータを生成する手法が知られている。このような手法として、ベイズ的最適化等が存在する(非特許文献2)。
S. Yoshimura et al.: Development of Multi-Agent Traffic and Environmental Simulator MATES, Japan Society for Simulation Technology 23:3, pp. 228{237, 2004. J. Snoek, H. Larochelle, and R. P. Adams: Practical Bayesian Optimization of Machine Learning Algorithms, Advances in Neural Information Processing Systems 25, pp. 2951{2959, 2012.
しかしながら、パラメータと評価尺度との関係が不明瞭であるという問題があった。すなわち、例えば、シミュレーションがどのようなパラメータを有するかは、シミュレーションする対象となるオブジェクトに依存する上、評価尺度の設計にも依存する。このため、どのようなパラメータが良い評価尺度を与えることができるかは、シミュレーションを実行するまでわからず、このようなわからない中でパラメータ探索をする必要がある。
また、シミュレーションのためのパラメータが高次元又はパラメータの候補が多い場合、どのようなパラメータ(又はパラメータの組み合わせ)が良い評価尺度を与えることができるかを効率的に探索することは困難である。
更に、時間的な広がりを持つシミュレーションに対して、単一のパラメータでシミュレーション全区間に対して良い評価尺度を与えるのは困難である。
本発明の実施の形態は、上記の点に鑑みてなされたもので、シミュレーションに用いられる最適なパラメータを効率的に生成することを目的とする。
上記課題を解決するため、パラメータ出力装置は、所定のパラメータを用いて所定のシミュレーションを実行するシミュレーション部と、前記シミュレーション部によるシミュレーションの評価尺度と、該シミュレーションに用いられたパラメータとに基づいて、前記シミュレーション部によるシミュレーションに未だ用いられていないパラメータの評価尺度を予測する評価尺度予測部と、前記評価尺度予測部が予測した前記評価尺度に基づいて、該評価尺度に対応するパラメータを探索するパラメータ探索部と、前記パラメータ探索部により探索されたパラメータから最適なパラメータを出力する出力部と、を有する。
シミュレーションに用いられる最適なパラメータを効率的に生成することができる。
本発明の実施の形態におけるシミュレーションシステムの全体構成の一例を示す図である。 本発明の実施の形態におけるシミュレーション装置のハードウェア構成の一例を示す図である。 本発明の実施の形態におけるシミュレーションパラメータ生成部の詳細な機能構成の一例を示す図である。 本実施形態におけるシミュレーション処理部により動的にパラメータを生成する処理の一例を示すフローチャートである。 本発明の実施の形態における効果の一例を説明する図である。
以下、本発明の実施の形態について図面を参照しながら説明する。
<シミュレーションシステム1の全体構成>
まず、本発明の実施の形態におけるシミュレーションシステム1の全体の構成について、図1を参照しながら説明する。図1は、本発明の実施の形態におけるシミュレーションシステム1の全体構成の一例を示す図である。
図1に示すシミュレーションシステム1は、シミュレーション装置10と、観測装置20と有する。シミュレーション装置10と観測装置20とは、例えばLAN(Local Area Network)等のネットワークNを介して通信可能に接続されている。ネットワークNは、例えば、電話回線網やインターネット等であっても良い。
シミュレーション装置10は、例えば人流や交通量等のオブジェクトを対象とするシミュレーションを行う1以上のコンピュータである。シミュレーション装置10は、当該シミュレーションに用いられるパラメータの生成と、当該パラメータを用いたシミュレーションと、シミュレーション結果の評価とを行うシミュレーション処理部110を有する。シミュレーション処理部110は、シミュレーション装置10にインストールされた1以上のプログラムが、CPU(Central Processing Unit)に実行させる処理により実現される。
また、シミュレーション処理部110は、シミュレーションパラメータ生成部120と、シミュレーション部130と、シミュレーション評価部140とを有する。
シミュレーション部130は、シミュレーションパラメータ生成部120が生成したパラメータを用いて、空間的な広がりを有するオブジェクト(例えば、人流における人、交通量における車等)の時間経過に伴うシミュレーションを行う。オブジェクトのシミュレーションとは、時間経過に伴って、どのようにオブジェクトが生成、消滅、移動、滞留、密度変化するのか等を計算することである。
例えば、2地点間の人流誘導をシミュレーションする場合、シミュレーション部130は、人(オブジェクト)の集団に含まれるそれぞれの人について、時間の経過に伴ってどのような速さでどこへ移動するかを計算する。この場合、シミュレーション部130は、例えば、道路情報と、人流速度関数とを持つ。道路情報は、例えば、スタート地点とゴール地点との間の2種類の経路(経路A及び経路B)の道幅と道のりとが含まれる。人流速度関数は、例えば、経路の道幅と、当該経路を通行中の人数とに応じて、当該通行中の人の速度を決定する。人流速度関数は、典型的には、経路の道幅が小さく、かつ、当該経路を通行中の人数が多い程、速度(速さ)が下がる。
シミュレーション評価部140は、あるパラメータに従ったシミュレーション結果(すなわち、シミュレーション部130による計算結果)に対して評価尺度を算出する。
例えば、上記と同様の人流誘導をシミュレーションする場合、シミュレーション評価部140は、経路AにX(人数)、経路BにY(人数)とするパラメータを用いたシミュレーションにより人の集団が移動した結果、全員がゴール地点に到達するまでの所要時間Vを評価尺度として算出する。仮に、経路Aと経路Bとの道のりが等しく、かつ、経路Bの方が経路Aよりも道幅が大きい場合、X<Yであるパラメータにおける評価尺度Vは小さくなりやすい。
シミュレーションパラメータ生成部120は、パラメータと、シミュレーション評価部140により算出された評価尺度とのペアに基づいて新たなパラメータを生成する。
例えば、上記と同様の人流誘導をシミュレーションする場合、シミュレーションパラメータ生成部120は、これまで試したパラメータ群(X,Y),(X,Y),・・・,(X,Y)と、これらのパラメータ群にそれぞれ対応する評価尺度V,V,・・・,Vとに基づいて、Vが最小となり得る(X,Y)を生成する。言い換えれば、人の集団が、最も早くゴール地点に辿り着けるパラメータ(X,Y)を生成する。
このとき、例えば、所定の時間毎に、人(オブジェクト)がスタート地点で生成される場合には、適当な時間間隔で最適なパラメータ(X,Y)を生成することで、各時点での経路の混み具合に応じて動的に最適なパラメータを生成することができる。
観測装置20は、オブジェクトを観測するコンピュータ等である。観測装置20は、オブジェクトを観測して、観測結果(例えば、オブジェクトの位置や密度等を示す情報)を作成する観測部150を有する。観測部150による観測結果は、シミュレーション部130に入力される。
観測部150が観測するオブジェクトは、シミュレーション上のオブジェクト(すなわち、シミュレーション部130によるシミュレーション対象のオブジェクト)であっても良いし、実世界におけるオブジェクト(実際の人や車等)であっても良い。以降では、観測部150が観測するオブジェクトは、シミュレーション上のオブジェクトであるものとする。なお、実世界におけるオブジェクトを観測する場合には、観測装置20には、例えば、カメラ装置や各種センサ(例えば人感センサ等)が用いられる。
本実施形態に係るシミュレーション装置10は、シミュレーション処理部110により、時刻tにおけるシミュレーション対象のオブジェクトの観測結果を観測部150から取得した後、以下の(1)〜(4)を所定の時間毎に繰り返すことで、当該時刻tにおける最も評価尺度が良いパラメータ(すなわち、最適なパラメータ)を生成する。
(1)シミュレーションパラメータ生成部120によりパラメータθを生成する。
(2)パラメータθを用いて、シミュレーション部130によりシミュレーションを行う。このとき、シミュレーション部130は、観測部150から取得した観測結果を用いて、時刻tからのシミュレーションを行う。
(3)シミュレーション部130によるシミュレーション結果から、シミュレーション評価部140により評価尺度vを算出する。
(4)パラメータθと、評価尺度vとのペア(θ,v)から、シミュレーションパラメータ生成部120により次のパラメータθn+1を生成する。
例えば、上記の(1)〜(4)がN回繰り返された場合、(θ,v),・・・,(θ,v)が生成される。これらのθ,・・・,θのうち、評価尺度が最も良いθが時刻tにおける最適なパラメータである。
なお、図1に示すシミュレーション装置10は、一例であって、他の構成であっても良い。例えば、シミュレーションパラメータ生成部120と、シミュレーション部130と、シミュレーション評価部140とをそれぞれ異なる装置が有していても良い。また、例えば、シミュレーション装置10と観測装置20とが一体の装置で構成されていても良い。
<シミュレーション装置10のハードウェア構成>
次に、本発明の実施の形態におけるシミュレーション装置10のハードウェア構成について、図2を参照しながら説明する。図2は、本発明の実施の形態におけるシミュレーション装置10のハードウェア構成の一例を示す図である。
図2に示すシミュレーション装置10は、入力装置201と、表示装置202と、外部I/F203と、RAM(Random Access Memory)204と、ROM(Read Only Memory)205と、CPU206と、通信I/F207と、補助記憶装置208とを有する。これら各ハードウェアは、それぞれがバスBを介して通信可能に接続されている。
入力装置201は、例えばキーボードやマウス、タッチパネル等であり、ユーザが各種操作を入力するのに用いられる。表示装置202は、例えばディスプレイ等であり、シミュレーション装置10の処理結果を表示する。
外部I/F203は、外部装置とのインタフェースである。外部装置には、記録媒体203a等がある。シミュレーション装置10は、外部I/F203を介して、記録媒体203a等の読み取りや書き込みを行うことができる。記録媒体203aには、シミュレーション処理部110を実現する1以上のプログラム等が記録されていても良い。
記録媒体203aには、例えば、フレキシブルディスク、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等がある。
RAM204は、プログラムやデータを一時保持する揮発性の半導体メモリである。ROM205は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリである。ROM205には、例えば、OS(Operating System)設定やネットワーク設定等が格納されている。
CPU206は、ROM205や補助記憶装置208等からプログラムやデータをRAM204上に読み出して処理を実行する演算装置である。
通信I/F207は、シミュレーション装置10をネットワークに接続するためのインタフェースである。シミュレーション処理部110を実現する1以上のプログラムは、通信I/F207を介して、所定のサーバ等から取得(ダウンロード)されても良い。
補助記憶装置208は、例えばHDD(Hard Disk Drive)やSSD(Solid State Drive)等であり、プログラムやデータを格納している不揮発性の記憶装置である。補助記憶装置208に格納されているプログラムやデータには、例えば、OS、当該OS上において各種機能を実現するアプリケーションプログラム、シミュレーション処理部110を実現する1以上のプログラム等がある。
本発明の実施の形態におけるシミュレーション装置10は、図2に示すハードウェア構成を有することにより、後述する各種処理を実現することができる。
<シミュレーション部130及びシミュレーション評価部140の実施例>
シミュレーション部130及びシミュレーション評価部140は、従来から知られている手法によりシミュレーション及びシミュレーション結果の評価を行うものを用いることができる。以降では、シミュレーション部130によるシミュレーションとして、人流シミュレーションを一例に挙げて、シミュレーション部130及びシミュレーション評価部140を説明する。
人流シミュレーションでは、シミュレーションの対象は道路上を移動する個々の人である。このとき、個々の人が、予め設定されたスタート地点からゴール地点に到達するまでのシミュレーションにより、人々がより早くゴール地点に到達する誘導をパラメータとして算出する。
シミュレーション部130には、例えば、入力として、道路を表すグラフ(例えば、交差点をノード、道をエッジとする)と、各オブジェクトのスタート地点及びゴール地点とが与えられる。各エッジには、道幅と長さ(道のり)とが設定されている。
このとき、シミュレーション部130は、例えば、各オブジェクトのスタート地点からゴール地点までの経路(通過するノードのリスト)と、各オブジェクトが当該経路に含まれるノード間を移動する際の所要時間とを出力する。
各オブジェクトの経路は、スタート地点(スタートノード)からゴール地点(ゴールノード)に到達するまでのエッジの長さを最小化するものを選び、当該経路はダイクストラ法によって算出すれば良い。また、ノード間を移動する際の所要時間は、シミュレーションの各時刻毎のオブジェクトの現在位置(例えば、ノードN1と、ノードN2とを繋ぐエッジ上における、ノードN1から1mの位置等)と、エッジの道幅から算出される人口密度とを用いて、オブジェクトの速度を計算することで算出すれば良い。
また、各オブジェクトの動きを制御・誘導するためのパラメータとしては、例えば、ノード毎に通過する人流量を分配する割合を用いる。例えば、ノードN1が以下の3つのエッジを持つものとする。
・エッジA:ノードN1とノードN2とを繋ぐエッジ
・エッジB:ノードN1とノードN3とを繋ぐエッジ
・エッジC:ノードN1とノードN4とを繋ぐエッジ
このとき、ノードN1にパラメータを与えていない場合は、ノードN1を通過するオブジェクトはそれぞれのゴール地点に対して最短経路となるエッジを通過する。ここで、パラメータとしては、例えば、[w,w,w]=[0.5,0.3,0.2]のように与える。これは、ノードN1を通過するオブジェクトは、50%の確率でエッジAを、30%の確率でエッジBを、20%の確率でエッジCを通過することを示している。
シミュレーション評価部140は、上記のように各ノードにおけるオブジェクトの通過量の割合がパラメータとして与えられたときのシミュレーションの評価尺度として、オブジェクトがスタート地点からゴール地点に到達するまでの所要時間の合計とする。この評価尺度が小さくなるパラメータを、以降で詳細に説明するシミュレーションパラメータ生成部120により生成する。
<シミュレーションパラメータ生成部120の詳細な機能構成>
次に、シミュレーションパラメータ生成部120の詳細な機能構成について、図3を参照しながら説明する。図3は、本発明の実施の形態におけるシミュレーションパラメータ生成部120の詳細な機能構成の一例を示す図である。
図3に示すシミュレーションパラメータ生成部120は、評価尺度予測部121と、シミュレーションパラメータ探索部122とを有する。
評価尺度予測部121は、ガウス過程を用いて、パラメータと評価尺度との関係をモデル化する。なお、2つの変数(すなわち、パラメータ及び評価尺度)の関係をモデル化する際にガウス過程を用いることは、例えば「J. Snoek, H. Larochelle, and R. P. Adams: Practical Bayesian Optimization of Machine Learning Algorithms, Advances in Neural Information Processing Systems 25, pp. 2951-2959, 2012.」に開示されている。
評価尺度予測部121によるモデル化にガウス過程を用いるのは、ガウス過程では「パラメータの小さい変化に対して評価尺度がなめらかに変化する」という弱い仮定を求めているのに対し、多くのシミュレーションにおいて当該仮定が成り立つと考えられるためである。
評価尺度予測部121は、シミュレーション部130がn回目に試行したパラメータθと、当該θに対応する評価尺度vとのペア(θ,v)が複数与えられたとき(すなわち、試行結果D={(θ,v),(θ,v),・・・,(θ,v)}が与えられたとき)、これまでに試行したことがないパラメータ
Figure 0006757280
がとる評価尺度
Figure 0006757280
を予測する。すなわち、評価尺度予測部121は、シミュレーションを未だ試行していないパラメータに対する評価尺度がどれほどであるかを予測する。
本実施形態では、当該評価尺度を平均μ及び分散σの正規分布に従う確率変数
Figure 0006757280
として、平均μ及び分散σを、ガウス過程を用いてDから算出する。
ガウス過程は、v,・・・,vの同時分布を次の共分散Kを持つ正規分布としてモデル化する。
Figure 0006757280
ここで、Kmnは行列Kのm行n列の要素である。共分散の各要素を構成するk(θ,θ)はカーネルと呼ばれ、θとθとの類似度を示す。すなわち、θとθとが似通った値である場合、Kmnは大きな値となり、その結果vとvとの相関が高まる(似通った値が取りやすい)というモデルである。本実施形態では、カーネル関数として、例えば「J. Snoek, H. Larochelle, and R. P. Adams: Practical Bayesian Optimization of Machine Learning Algorithms, Advances in Neural Information Processing Systems 25, pp. 2951-2959, 2012.」に開示されているARD Matern 5/2カーネルを採用する。すなわち、θ,θがD次元ベクトルの場合、これらに対して、
Figure 0006757280
である。ここで、C,C,・・・,Cはカーネルに与えられるパラメータである。
上記のカーネルk(・,・)と試行結果Dとから計算される数3のμ及びσは次の通りである。
Figure 0006757280
ここで、・はベクトルや行列の転置を意味する。
シミュレーションパラメータ探索部122は、上記の数3で予測される評価尺度に基づいて、パラメータ
Figure 0006757280
を探索する。上記の数6によれば、あるパラメータ
Figure 0006757280
を与えれば、対応するμとσとが求まる。ある
Figure 0006757280
が確率的なゆらぎを含めても良いかどうかを測る尺度(当該尺度が小さい値程、良い評価であるとする)を
Figure 0006757280
とする。ここで、
Figure 0006757280
のばらつきをどの程度重視するかのパラメータはα=0.1とする。
良い評価尺度となりそうなパラメータを探す問題は、上記の数10を小さくする
Figure 0006757280
を探す問題へと帰着する。
ここで、パラメータ
Figure 0006757280
の空間が大きい場合(すなわち、例えば、格子点上の網羅が困難なほど広いパラメータ空間である場合)、上記の数10を対象とする空間すべてで評価することは困難である。そこで、ある提案分布q(θ)を設計し、そこからサンプルされた
Figure 0006757280
について、上記の数10を評価し、
Figure 0006757280
が良いパラメータを採用する。提案分布q(θ)の設計指針は2点ある。1点目は、シミュレーションや評価尺度に依存し、より評価尺度の変化に寄与しそうなパラメータ領域に大きな確率密度を割り当てるという指針である。2点目は、低いf(θ)を取るθの近傍に大きな確率密度を割り当てるという指針である。
上記の2点の指針について、人流シミュレーションを例にして説明する。ここでのパラメータθは、次のように構成される。
Figure 0006757280
ここで、cは交差点のインデックス、Cはパラメータθに含まれる誘導対象の交差点数、wは交差点と接続する道路(エッジ)毎の割合である。提案分布に関する2つの設計指針は次のように用いた。すなわち、1点目としては、「より多くの人が通過する交差点で誘導を行うと、評価尺度である各人のゴール地点までの到達時間に影響を与えやすい」という考えに基づき、交差点cの通過人数Nに比例する確率でcに誘導を行うパラメータを生成する。2点目としては、あるθに対する評価尺度f(θ)がこれまでの評価尺度f(θ),・・・,f(θi−1)と比較して良かったとする。このとき、新しいパラメータθi+1は、θが含む交差点cのうち1つを確率的に削除、又は別の交差点c´について割合wc´を与えるという操作を行う。
<シミュレーション装置10により動的にパラメータを生成する処理>
ここで、シミュレーションの時刻を離散的に区切り、各時刻毎に、動的に最も評価尺度が良いパラメータを生成する処理について、図4を参照しながら説明する。図4は、本実施形態におけるシミュレーション処理部110により動的にパラメータを生成する処理の一例を示すフローチャートである。例えば、シミュレーション全体が2時間程度の人流シミュレーションである場合、誘導の生成の5分毎に行っていることが多い。したがって、この場合、シミュレーションの時刻を5分毎に区切ることで、5分毎に、最も評価尺度が良いパラメータを生成することができる。
まず、シミュレーション処理部110は、シミュレーション時刻tを「1」に初期化する(ステップS11)。
次に、シミュレーション処理部110は、観測部150により観測された時刻tにおける観測結果(すなわち、観測部150により観測された、後述するステップS14におけるシミュレーション結果)を取得する(ステップS12)。より具体的には、1つ前の時刻t−1における最適なパラメータθt−1を用いて、時刻t−1からtまでのシミュレーションがシミュレーション部130により行われた結果(シミュレーション結果)を、観測部150が観測する。そして、シミュレーション処理部110は、当該観測結果を観測部150から取得する。
ただし、これに限られず、観測部150は、時刻tにおける実世界のオブジェクト(実際の人や車等)を観測しても良い。
次に、シミュレーション処理部110は、時刻tからのシミュレーション及び当該シミュレーションの結果の評価、並びにパラメータの生成を、予め設定されたN回試行して、シミュレーション時刻tにおける最適なパラメータθを出力する(ステップS13)。
すなわち、シミュレーション処理部110は、以下の(1)〜(4)を、n=1,・・・,Nまで繰り返して、出力されたパラメータθ,・・・,θの中から、評価尺度が最良のパラメータをθ(すなわち、例えば、評価尺度が最小(又は最大)のパラメータ)として出力する。
(1)シミュレーションパラメータ生成部120によりパラメータθを生成する。
(2)パラメータθを用いて、シミュレーション部130によりシミュレーションを行う。このとき、シミュレーション部130は、上記のステップS12で取得した観測結果を用いて、時刻tから時刻t+τまでのシミュレーションを行う。すなわち、シミュレーション部130は、当該観測結果を時刻tにおけるオブジェクトの状態とした上で、パラメータθを用いて、時刻t+τまでのシミュレーションを行う。なお、τは、予め設定されたパラメータであり、τ≧1である。
(3)シミュレーション部130によるシミュレーション結果から、シミュレーション評価部140により評価尺度vを算出する。
(4)パラメータθと、評価尺度vとのペア(θ,v)から、シミュレーションパラメータ生成部120により次のパラメータθn+1を生成する。
次に、シミュレーション処理部110は、シミュレーション部130により、パラメータθを用いて、時刻tからt+1までのシミュレーションを実施する(ステップS14)。これにより、時刻tからt+1までのシミュレーションが、最適なパラメータθを用いて実施される。
次に、シミュレーション処理部110は、時刻tに「1」を加算する(ステップS15)。
次に、シミュレーション処理部110は、時刻tが、予め設定された時刻T以下であるか否かを判定する(ステップS16)。
ステップS16において、時刻tがT以下である場合、シミュレーション処理部110は、ステップS12の処理に戻る。一方で、ステップS16において、時刻tがT以下でない場合、シミュレーション処理部110は、処理を終了させる。
以上により、本実施形態に係るシミュレーション処理部110は、離散的に区切られた時刻t毎に、各時刻の最適なパラメータθの生成と、当該パラメータθを用いたシミュレーションを行うことができる。
<本発明の実施の形態における効果>
ここで、一例として、東京都新宿区の所定のスタート地点から所定のゴール地点まで、8万人の人(オブジェクト)が移動するシミュレーションにおける効果について、図5を参照しながら説明する。図5は、本発明の実施の形態における効果の一例を説明する図である。
スタート地点としては新国立競技場予定地(2017年2月時点)を設定した。また、ゴール地点としては、オブジェクトに応じて、JR信濃町、JR千駄ヶ谷、都営地下鉄国立競技場、都営地下鉄青山一丁目、東京メトロ外苑前、又は東京メトロ北参道のいずれかの駅を設定した。
また、道路グラフ(ノード数:765、エッジ数2408)の道幅、長さは国土地理院のデータを利用し、シミュレーションのパラメータとしては各ノードにおけるエッジ通過量の割合を採用した。更に、シミュレーション結果の評価尺度としては、各人がゴール地点に到達するまでの所要時間の総和とした。このとき、当該総和が小さくなるようにパラメータを生成し、パラメータはシミュレーションの時刻を5分毎に区切ることで、動的に生成するものとした。
図5に示すように、本発明の実施の形態により生成したパラメータを用いてシミュレーションを行うことで、従来よりも効率よく人を輸送するパラメータを生成するため、より短い時間で多くの人がゴール地点に到達している。具体的には、全ての人がゴール地点に到達するのに、従来のシミュレーションでは約9000秒程度を要しているのに対して、本発明の実施の形態により生成したパラメータを用いたシミュレーションでは、約7000秒程度となる。
<まとめ>
以上のように、本実施形態に係るシミュレーション装置10は、例えば人流シミュレーション等、時空間に広がるオブジェクトのシミュレーションの最適なパラメータ(制御パラメータ)を効率的に生成することができる。また、このようなパラメータの生成を、所定の時間毎に繰り返し行うことで、シミュレーションの全区間を通して最適なパラメータを動的に生成することができる。
更に、本実施形態に係るシミュレーション装置10は、最適なパラメータを動的に生成する際に、離散的に区切られた時刻t毎に、当該時刻tにおける観測結果を用いてシミュレーションを行うことで、最適なパラメータを生成することができる。これにより、各時刻tにおけるオブジェクトの状況に応じた最適なパラメータを動的に生成することができるようになる。例えば、ある時刻t−1からtまでを最適なパラメータでシミュレーションした結果と、時刻tにおける実世界のオブジェクトを観測した結果とに差異があった場合であっても、当該時刻tにおいて当該観測結果に応じた最適なパラメータを生成することができるようになる。
このため、例えば、人流、交通量等のシミュレーションに適用することで、混雑や渋滞を解消する誘導等を効果的に図ることができるようになる。
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
1 シミュレーションシステム
10 シミュレーション装置
20 観測装置
110 シミュレーション処理部
120 シミュレーションパラメータ生成部
121 評価尺度予測部
122 シミュレーションパラメータ探索部
130 シミュレーション部
140 シミュレーション評価部
150 観測部

Claims (7)

  1. 所定のパラメータを用いて所定のシミュレーションを実行するシミュレーション部と、
    前記シミュレーション部によって実行されたn回のシミュレーションの結果をそれぞれ評価したn個の評価尺度と前記n回のシミュレーションにそれぞれ用いられたn個のパラメータとの関係をモデル化したガウス過程を用いて、前記n個の評価尺度と前記n個のパラメータとから平均と分散を算出し、算出した平均及び分散の正規分布に従う確率変数を、前記シミュレーション部によるn回のシミュレーションに未だ用いられていないパラメータの評価尺度として予測する評価尺度予測部と、
    前記平均と、前記分散と、前記評価尺度予測部が予測した評価尺度のばらつきをどの程度重視するかを表すハイパーパラメータとに関する関数fを最小化するパラメータを探索することで、前記評価尺度予測部が予測した評価尺度に対応するパラメータを探索するパラメータ探索部と、
    前記パラメータ探索部により探索されたパラメータから最適なパラメータを出力する出力部と、
    を有し、
    前記パラメータ探索部は、
    前記評価尺度の変化に寄与するパラメータの領域に大きな確率密度を割り当ると共に前記関数fが低い値を取るパラメータの近傍に大きな確率密度を割り当てた確率分布からパラメータをサンプリングし、前記サンプリングされたパラメータを入力とした前記関数fの値を評価することを繰り返すことで、前記評価尺度予測部が予測した評価尺度に対応するパラメータを探索する、パラメータ出力装置。
  2. 前記出力部は、
    前記パラメータ探索部により探索されたパラメータのうち、該パラメータに対応する評価尺度が最小又は最大であるパラメータを出力する、請求項1に記載のパラメータ出力装置。
  3. 前記シミュレーション部は、
    前記パラメータ探索部により探索されたパラメータを用いて前記シミュレーションを実行し、
    前記評価尺度予測部は、
    前記シミュレーション部によって実行されたn+1回のシミュレーションの結果をそれぞれ評価したn+1個の評価尺度と、前記n+1回のシミュレーションにそれぞれ用いられたn+1個のパラメータとの関係をモデル化したガウス過程を用いて、前記n+1個の評価尺度と前記n+1個のパラメータとから平均と分散を算出し、算出した平均及び分散の正規分布に従う確率変数を、前記シミュレーション部によるn+1回のシミュレーションに未だ用いられていないパラメータの評価尺度として予測し、
    前記出力部は、
    前記シミュレーション部による前記シミュレーションが、予め設定されたN回実行された場合、前記パラメータ探索部により探索されたN個のパラメータから最適なパラメータを出力する、請求項1又は2に記載のパラメータ出力装置。
  4. 前記シミュレーションの実行時間を所定の時間毎に区切って、該実行時間を離散的な複数の時刻に分割する分割部を有し、
    前記シミュレーション部は、
    前記時刻において、前記パラメータを用いて前記シミュレーションを実行し、
    前記評価尺度予測部は、
    前記時刻において、前記シミュレーション部によるシミュレーションに未だ用いられていないパラメータの評価尺度を予測し、
    前記パラメータ探索部は、
    前記時刻において、前記評価尺度予測部が予測した評価尺度に対応するパラメータを探索し、
    前記出力部は、
    前記パラメータ探索部により探索されたパラメータから、前記時刻における最適なパラメータを出力する、請求項1乃至3の何れか一項に記載のパラメータ出力装置。
  5. 前記シミュレーション部は、
    前記時刻において、前記パラメータ出力装置と接続される観測装置により前記シミュレーションの対象となるオブジェクトが観測された結果と、前記パラメータとを用いて前記シミュレーションを実行する、請求項4に記載のパラメータ出力装置。
  6. 所定のパラメータを用いて所定のシミュレーションを実行するシミュレーション手順と、
    前記シミュレーション手順によって実行されたn回のシミュレーションの結果をそれぞれ評価したn個の評価尺度と前記n回のシミュレーションにそれぞれ用いられたn個のパラメータとの関係をモデル化したガウス過程を用いて、前記n個の評価尺度と前記n個のパラメータとから平均と分散を算出し、算出した平均及び分散の正規分布に従う確率変数を、前記シミュレーション手順によるn回のシミュレーションに未だ用いられていないパラメータの評価尺度として予測する評価尺度予測手順と、
    前記平均と、前記分散と、前記評価尺度予測手順で予測した評価尺度のばらつきをどの程度重視するかを表すハイパーパラメータとに関する関数fを最小化するパラメータを探索することで、前記評価尺度予測手順で予測した評価尺度に対応するパラメータを探索するパラメータ探索手順と、
    前記パラメータ探索手順により探索されたパラメータから最適なパラメータを出力する出力手順と、
    をコンピュータが実行し、
    前記パラメータ探索手順は、
    前記評価尺度の変化に寄与するパラメータの領域に大きな確率密度を割り当ると共に前記関数fが低い値を取るパラメータの近傍に大きな確率密度を割り当てた確率分布からパラメータをサンプリングし、前記サンプリングされたパラメータを入力とした前記関数fの値を評価することを繰り返すことで、前記評価尺度予測手順で予測した評価尺度に対応するパラメータを探索する、パラメータ出力方法。
  7. 所定のパラメータを用いて所定のシミュレーションを実行するシミュレーション手順と、
    前記シミュレーション手順によって実行されたn回のシミュレーションの結果をそれぞれ評価したn個の評価尺度と前記n回のシミュレーションにそれぞれ用いられたn個のパラメータとの関係をモデル化したガウス過程を用いて、前記n個の評価尺度と前記n個のパラメータとから平均と分散を算出し、算出した平均及び分散の正規分布に従う確率変数を、前記シミュレーション手順によるn回のシミュレーションに未だ用いられていないパラメータの評価尺度として予測する評価尺度予測手順と、
    前記平均と、前記分散と、前記評価尺度予測手順で予測した評価尺度のばらつきをどの程度重視するかを表すハイパーパラメータとに関する関数fを最小化するパラメータを探索することで、前記評価尺度予測手順で予測した評価尺度に対応するパラメータを探索するパラメータ探索手順と、
    前記パラメータ探索手順により探索されたパラメータから最適なパラメータを出力する出力手順と、
    をコンピュータに実行させ
    前記パラメータ探索手順は、
    前記評価尺度の変化に寄与するパラメータの領域に大きな確率密度を割り当ると共に前記関数fが低い値を取るパラメータの近傍に大きな確率密度を割り当てた確率分布からパラメータをサンプリングし、前記サンプリングされたパラメータを入力とした前記関数fの値を評価することを繰り返すことで、前記評価尺度予測手順で予測した評価尺度に対応するパラメータを探索する、プログラム。
JP2017039148A 2017-03-02 2017-03-02 パラメータ出力装置、パラメータ出力方法及びプログラム Active JP6757280B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017039148A JP6757280B2 (ja) 2017-03-02 2017-03-02 パラメータ出力装置、パラメータ出力方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017039148A JP6757280B2 (ja) 2017-03-02 2017-03-02 パラメータ出力装置、パラメータ出力方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2018147075A JP2018147075A (ja) 2018-09-20
JP6757280B2 true JP6757280B2 (ja) 2020-09-16

Family

ID=63591182

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017039148A Active JP6757280B2 (ja) 2017-03-02 2017-03-02 パラメータ出力装置、パラメータ出力方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6757280B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7344149B2 (ja) * 2020-02-07 2023-09-13 キオクシア株式会社 最適化装置及び最適化方法
WO2023281756A1 (ja) * 2021-07-09 2023-01-12 日本電信電話株式会社 交通シミュレーション装置、交通シミュレーション方法および交通シミュレーションプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5109865B2 (ja) * 2008-08-11 2012-12-26 住友電気工業株式会社 交通パラメータ算出装置、コンピュータプログラム、及び交通パラメータ算出方法
JP7061536B2 (ja) * 2018-08-09 2022-04-28 株式会社東芝 最適化装置、シミュレーションシステム及び最適化方法

Also Published As

Publication number Publication date
JP2018147075A (ja) 2018-09-20

Similar Documents

Publication Publication Date Title
Andradóttir An overview of simulation optimization via random search
US20210027379A1 (en) Generative network based probabilistic portfolio management
JP6749282B2 (ja) 人流量予測装置、人流量予測方法、及び人流量予測プログラム
Sarkale et al. Solving Markov decision processes for network-level post-hazard recovery via simulation optimization and rollout
Zhong et al. Automatic model construction for the behavior of human crowds
Barnett et al. Coordinated crowd simulation with topological scene analysis
KR101813805B1 (ko) 머신 러닝을 이용한 사용자의 구매 확률 예측 방법 및 장치
JP6757280B2 (ja) パラメータ出力装置、パラメータ出力方法及びプログラム
Lämmel et al. Getting out of the way: Collision-avoiding pedestrian models compared to the realworld
JP6665071B2 (ja) 人流量予測装置、人流量予測方法、及び人流量予測プログラム
Gutierrez-Milla et al. Crowd evacuations SaaS: an ABM approach
Gutjahr et al. Stochastic search in metaheuristics
Karmakharm et al. Agent-based Large Scale Simulation of Pedestrians With Adaptive Realistic Navigation Vector Fields.
JP7378836B2 (ja) 総和確率的勾配推定方法、装置、およびコンピュータプログラム
JP6853968B2 (ja) パラメータ推定システム、パラメータ推定方法およびパラメータ推定プログラム
JP6807822B2 (ja) 人流量予測装置、方法、及びプログラム
JP2019067224A (ja) 人流パターン推定システム、人流パターン推定方法および人流パターン推定プログラム
EP2660756A1 (en) Method, apparatus and computer program product for simulating the movement of entities in an area
Fu et al. Simultaneous human-robot matching and routing for multi-robot tour guiding under time uncertainty
Wolinski et al. Optimization-based pedestrian model calibration for evaluation
JP6632054B2 (ja) 推定装置、推定方法及びプログラム
JP6992534B2 (ja) データ作成装置、誘導モデル学習装置、誘導推定装置、データ作成方法、誘導モデル学習方法、誘導推定方法及びプログラム
Larach et al. Accelerated decomposition techniques for large discounted Markov decision processes
JP6813527B2 (ja) 推定装置、推定方法及びプログラム
CN111832602B (zh) 基于地图的特征嵌入方法、装置、存储介质和电子设备

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20170313

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200825

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200828

R150 Certificate of patent or registration of utility model

Ref document number: 6757280

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150