JP6853955B2 - People flow pattern estimation system, people flow pattern estimation method and people flow pattern estimation program - Google Patents

People flow pattern estimation system, people flow pattern estimation method and people flow pattern estimation program Download PDF

Info

Publication number
JP6853955B2
JP6853955B2 JP2017193244A JP2017193244A JP6853955B2 JP 6853955 B2 JP6853955 B2 JP 6853955B2 JP 2017193244 A JP2017193244 A JP 2017193244A JP 2017193244 A JP2017193244 A JP 2017193244A JP 6853955 B2 JP6853955 B2 JP 6853955B2
Authority
JP
Japan
Prior art keywords
kernel
sample
flow pattern
human flow
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017193244A
Other languages
Japanese (ja)
Other versions
JP2019067224A (en
Inventor
隆文 梶原
隆文 梶原
山崎 啓介
啓介 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
NEC Corp
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, National Institute of Advanced Industrial Science and Technology AIST filed Critical NEC Corp
Priority to JP2017193244A priority Critical patent/JP6853955B2/en
Publication of JP2019067224A publication Critical patent/JP2019067224A/en
Application granted granted Critical
Publication of JP6853955B2 publication Critical patent/JP6853955B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、任意の地域における人流パターンを推定する人流パターン推定システム、人流パターン推定方法および人流パターン推定プログラムに関する。 The present invention relates to a human flow pattern estimation system for estimating a human flow pattern in an arbitrary area, a human flow pattern estimation method, and a human flow pattern estimation program.

与えられたある地域における人口分布(人流パターン)にもっとも近いデータを生み出す、人流シミュレータのパラメータを求めたいという要望がある。ここで、「パラメータ」とは、その人流パターンの「集団の人数、どこから来たか(出発地点)、何時に来たか(出発時刻)、どこから帰っていくのか(最終到達地点)、どこを経由するのか(経由地)、経由値の滞在時間」から成る。尚、出発地点と最終到達地点とは同じであってもよい。 There is a desire to find parameters for a people flow simulator that will produce data that is closest to the population distribution (people flow pattern) in a given area. Here, the "parameter" is the "number of people in the group, where they came from (departure point), what time they came from (departure time), where they are returning from (final arrival point), and where they go through. It consists of "no (waypoint), staying time of the way value". The starting point and the final reaching point may be the same.

そのようなパラメータを求める手法として、種々の手法が知られている。 Various methods are known as methods for obtaining such parameters.

例えば、近似ベイズ計算法(ABC:Approximate Bayesian Computation)が知られている。ABCとは、モンテカルロ法の一種で、ランダムに選んだパタメータの値から、パフォーマンスの高いパラメータを順次求めていく方法である。例えば、最もシンプルなタイプのABCでは、シミュレータから疑似データを生成し、その擬似データが現実のデータと近ければ、シミュレータに使用されたパラメータを正しいものとして認める。 For example, an approximate Bayesian Computation (ABC) is known. ABC is a type of Monte Carlo method, and is a method of sequentially obtaining parameters with high performance from the values of randomly selected parameters. For example, in the simplest type of ABC, pseudo data is generated from the simulator, and if the pseudo data is close to the actual data, the parameters used in the simulator are recognized as correct.

ABCでは、事前知識に基づいてサンプリングを決めてシミュレーションを行う。そして、ABCでは、結果(擬似データ)が現実のデータにうまく適合するものだけをフィルタリングしている。 At ABC, sampling is determined based on prior knowledge and simulation is performed. Then, in ABC, only those whose results (pseudo data) fit well with the actual data are filtered.

しかしながら、ABCでは、パラメータが高次元であるとなかなか適合しないという問題がある。そのため、ABCでは、多数のサンプルが必要となる。 However, in ABC, there is a problem that it is difficult to match when the parameters are high-dimensional. Therefore, ABC requires a large number of samples.

Kernel ABCは、全サンプルを活用して、適合度で重み付けしたカーネル平均(kernel mean)として事後分布を表現する(非特許文献1参照)。多くの場合、事後分布からサンプリングを行いたいという動機が存在する。しかしながら、事後分布のkernel meanからのサンプリングは容易ではない。 Kernel ABC utilizes all samples and expresses the posterior distribution as a kernel mean weighted by the goodness of fit (see Non-Patent Document 1). In many cases, there is an incentive to sample from the posterior distribution. However, sampling from the kernel mean of the posterior distribution is not easy.

Kernel Herdingは、事後分布のkernel meanからのサンプリングを可能にする。特に、Kernel Herdingによるサンプリングは分布の特徴を少ない数でうまくカバーでき、スーパサンプルと呼ばれる。 Kernel Herding allows sampling from the kernel mean of the posterior distribution. In particular, sampling by Kernel Herding can cover the characteristics of the distribution well with a small number, and is called a super sample.

Automatic Relevance Determination (ARD)は、与えられたパラメータ集合から重要なものを残し、冗長性を取り除く有効なツールである。 Automatic Relevance Determination (ARD) is an effective tool for removing redundancy by leaving important things from a given set of parameters.

一方、人流パターンを推定する方法が種々提案されている。 On the other hand, various methods for estimating the flow pattern have been proposed.

例えば、特許文献1は、都市の効率的な運用を支援する人流分析システムを開示している。特許文献1に開示された人流分析システムは、地域指定部と、人流算出部と、表示制御部とを備える。地域指定部は、地図上の地域を指定する。人流算出部は、時刻および位置の情報を含んだ複数の人流情報に基づき、地域指定部の指定地域に関わる人流を算出する。表示制御部は、表示部に表示された地図上に、人流算出部が算出した主たる人流の動線を表示させる。人流分析システムは、シミュレーション部を備える。シミュレーション部は、人流をシミュレーションによって算出するものであり、例えば、人流データベースに基づき、新たにエージェントを生成した場合の人流を算出する。ここでエージェントとは、環境の変化に基づく人流や交通流の変化を発生させるため、実際の環境の代わりに設定される仮想的な存在であり、例えば居住者の変化や施設の開設や閉鎖などをいう。 For example, Patent Document 1 discloses a human flow analysis system that supports efficient operation of a city. The human flow analysis system disclosed in Patent Document 1 includes a region designation unit, a human flow calculation unit, and a display control unit. The area designation section designates the area on the map. The people flow calculation unit calculates the people flow related to the designated area of the area designation unit based on a plurality of people flow information including time and position information. The display control unit displays the flow line of the main flow of people calculated by the people flow calculation unit on the map displayed on the display unit. The human flow analysis system includes a simulation unit. The simulation unit calculates the human flow by simulation. For example, the simulation unit calculates the human flow when a new agent is generated based on the human flow database. Here, an agent is a virtual entity that is set in place of the actual environment in order to generate changes in the flow of people and traffic due to changes in the environment, such as changes in residents and the opening and closing of facilities. To say.

また特許文献2は、時間的及び空間的相関を持つ時空間変数の値を精度良く予測することができる、時空間変数予測装置を開示している。特許文献2では、時空間変数の時系列データとして、人口分布、人流・交通流の速度・向き、金やダイヤモンドなど鉱物資源の埋蔵量、降水量などの気象データ、土地価格などを想定している。特許文献2では、実施の形態として、人口密度分布の時系列データが観測データとして与えられた条件の下で、未観測地点あるいは未来の時空間変数分布を推定・予測している。 Further, Patent Document 2 discloses a spatiotemporal variable prediction device capable of accurately predicting the value of a spatiotemporal variable having a temporal and spatial correlation. In Patent Document 2, as time-series data of spatiotemporal variables, population distribution, speed / direction of human flow / traffic flow, reserves of mineral resources such as gold and diamond, meteorological data such as precipitation, land price, etc. are assumed. There is. In Patent Document 2, as an embodiment, the distribution of unobserved points or future spatiotemporal variables is estimated and predicted under the condition that the time series data of the population density distribution is given as the observed data.

特許文献2に開示された時空間変数予測装置は学習部を備える。学習部は、人口密度情報記憶部に格納された観測データの集合に基づいて、観察データ同士の類似度を定義する関数であるカーネル関数の各々のハイパーパラメータと、観測データの各々に対する、複数のガウス過程の各々の寄与度を表すパラメータである負担率とを学習する。学習部は、負担率推定部と、ガウス過程パラメータ推定部と、反復判定部とを含む。負担率推定部は、観測データの集合と、複数のガウス過程のカーネル関数の各々のハイパーパラメータとに基づいて、複数のガウス過程からなる複数のユニットの各々の寄与度を表すパラメータであるユニット負担率と、複数のガウス過程の各々の寄与度を表すパラメータである負担率を推定する。ガウスパラメータ推定部は、観測データの集合と、複数のユニットの各々のユニット負担率と、複数のガウス過程の各々の負担率とに基づいて、複数のガウス過程の各々に対し、ガウス過程のカーネル関数の各々のハイパーパラメータを推定する。反復判定部は、予め定められた反復終了条件を満たすまで、負担率推定部による推定、およびガウス過程パラメータ推定部による推定を繰り返す。 The spatiotemporal variable prediction device disclosed in Patent Document 2 includes a learning unit. Based on the set of observation data stored in the population density information storage unit, the learning unit has multiple hyperparameters of the kernel function, which is a function that defines the similarity between observation data, and a plurality of observation data for each of the observation data. Learn the burden rate, which is a parameter representing each contribution of the Gaussian process. The learning unit includes a burden rate estimation unit, a Gaussian process parameter estimation unit, and an iterative determination unit. The burden rate estimation unit is a unit load which is a parameter representing the contribution of each of a plurality of units composed of a plurality of Gaussian processes based on a set of observation data and each hyperparameter of a kernel function of a plurality of Gaussian processes. Estimate the rate and the burden rate, which is a parameter representing the contribution of each of the multiple Gaussian processes. The Gaussian parameter estimator is based on the set of observation data, the unit burden rate of each of the multiple units, and the burden rate of each of the multiple Gaussian processes, and for each of the multiple Gaussian processes, the kernel of the Gaussian process. Estimate each hyperparameter of the function. The repetition determination unit repeats the estimation by the burden rate estimation unit and the estimation by the Gaussian process parameter estimation unit until a predetermined repetition end condition is satisfied.

さらに特許文献3は、大規模な人流分布推定処理をより効率的に実行する人流調査支援システムを開示している。この特許文献3に開示された人流調査支援システムでは、分散処理プラットフォームを利用して人流の変化を表現する人流モデルにもとづく人流分布の仮説を大量生成している。そして、これらの各仮説と計測データとの適合性を評価することにより、計測データと矛盾しない人流分布を算出している。この際、人流モデルにもとづく人流分布の時間発展処理を類似する人流モデルごとに計算することで、計算を並列化しかつ重複計算を排除している。この人流モデル毎の処理並列化によって計測データとの時空間索引によって実測値との評価を高速化している。 Further, Patent Document 3 discloses a human flow survey support system that more efficiently executes a large-scale human flow distribution estimation process. The human flow survey support system disclosed in Patent Document 3 uses a distributed processing platform to generate a large number of hypotheses of human flow distribution based on a human flow model that expresses changes in human flow. Then, by evaluating the compatibility between each of these hypotheses and the measurement data, the human flow distribution that does not contradict the measurement data is calculated. At this time, the time evolution process of the human flow distribution based on the human flow model is calculated for each similar human flow model, so that the calculation is parallelized and duplicate calculation is eliminated. By parallelizing the processing for each human flow model, the evaluation with the measured value is speeded up by the spatiotemporal index with the measurement data.

特許文献3に開示された人流調査支援システムは、複数のコンピュータに計算を分散する分散処理プラットフォームと、人流分布の仮説データから人流分布を推定した人流分布データを配信する機能を持つ人流分布配信システムと、人流のリアルタイムの計測データを計測する人流計測器とを備える。特許文献3において、分散処理プラットフォームは、人流全数調査データのうち現在時刻と一致するもの全体を所定数分複製し、各仮説の各人物の位置をランダムに少しずらし、人流仮説データとしている。 The human flow survey support system disclosed in Patent Document 3 is a human flow distribution distribution system having a distributed processing platform that distributes calculations to a plurality of computers and a function of distributing human flow distribution data that estimates the human flow distribution from hypothetical data of the human flow distribution. And a human flow measuring instrument that measures real-time measurement data of human flow. In Patent Document 3, the distributed processing platform duplicates the entire human flow 100% survey data that matches the current time by a predetermined number of minutes, and randomly shifts the position of each person in each hypothesis to obtain human flow hypothesis data.

また、特許文献4は、実店舗における商品の購入を支援する商品情報提供システムを開示している。特許文献4では、カメラもしくはGPS(Global Positioning System)情報から動線を分析・推定することで、来訪者の興味を把握し、推薦商品を決定している。 Further, Patent Document 4 discloses a product information providing system that supports the purchase of products in a physical store. In Patent Document 4, the flow line is analyzed and estimated from the camera or GPS (Global Positioning System) information to grasp the interest of the visitor and determine the recommended product.

非特許文献2は、モバイル空間統計を活用して、250mメッシュ単位でエリア間での回遊行動を分析する、技術的思想を開示している。 Non-Patent Document 2 discloses a technical idea of analyzing migratory behavior between areas in units of 250 m mesh by utilizing mobile spatial statistics.

非特許文献3は、アンケート情報を基にして、階層的な回遊モデルで立ち寄り場所を確率的に推定する、技術的思想を開示している。 Non-Patent Document 3 discloses a technical idea of probabilistically estimating a stop-by place by a hierarchical migration model based on questionnaire information.

国際公開第2016/067369号International Publication No. 2016/067369 特開2017−033198号公報JP-A-2017-0331198 特開2014−112292号公報Japanese Unexamined Patent Publication No. 2014-11292 特開2015−022354号公報Japanese Unexamined Patent Publication No. 2015-022354

Shigeki Nakagome, Shuhei Mano and Kenji Fukumizu (2013) Kernel Approximate Bayesian Computation in Population Genetic Inferences, Statistical Applications in Genetics and Molecular Biology, Volume 12, Issue 6, Pages 667-678Shigeki Nakagome, Shuhei Mano and Kenji Fukumizu (2013) Kernel Approximate Bayesian Computation in Population Genetic Inferences, Statistical Applications in Genetics and Molecular Biology, Volume 12, Issue 6, Pages 667-678 都心の歩行者回遊分析(その2)〜都心滞在者の属性について〜、名古屋市都市センタ 研究報告書、No. 117 2015.Analysis of pedestrian migration in the city center (Part 2) -Attributes of residents in the city center-, Nagoya City Center Research Report, No. 117 2015. まちなか回遊行動の詳細分析と政策シミュレーションのための予測モデル、土木学会論文集、Vol. 71, No.5 323-335, 2015Predictive model for detailed analysis and policy simulation of migratory behavior in Machinaka, JSCE Proceedings, Vol. 71, No.5 323-335, 2015

先行技術(ABC)には、次に述べるような課題がある。 Prior art (ABC) has the following problems.

第1の課題は、推定すべきシミュレータのパラメータ数が多いと、パラメータの精度が落ちることである。 The first problem is that if the number of simulator parameters to be estimated is large, the accuracy of the parameters will decrease.

また、ABCでは、パラメータ候補について、非効率に探索している。したがって、第2の課題は、あまり意味のないパラメータ候補についてもシミュレーションを行うので、無駄な計算時間がかかってしまうことである。 In addition, ABC is inefficiently searching for parameter candidates. Therefore, the second problem is that it takes a wasteful calculation time because the simulation is performed even for the parameter candidates that are not so meaningful.

さらに、第3の課題は、実際には必要のないパラメータを間違った知識のもとに探索したとき、それを無条件に受け入れてしまうことである。 Furthermore, the third problem is that when a parameter that is not actually needed is searched for with wrong knowledge, it is unconditionally accepted.

前述した先行技術(特許文献1〜4、非特許文献1〜3)には、それぞれ、次に述べるような問題がある。 Each of the above-mentioned prior arts (Patent Documents 1 to 4 and Non-Patent Documents 1 to 3) has the following problems.

特許文献1は、単に、人流データベースに基づき、新たにエージェントを生成した場合の人流を算出する技術的思想を開示しているに過ぎない。従って、特許文献1では、各個人の外出行動を、予め人流データベースに格納しておく必要がある。換言すれば、特許文献1は、そのような予め各個人の外出行動が不明である場合には成り立たない技術的思想である。 Patent Document 1 merely discloses the technical idea of calculating the human flow when a new agent is generated based on the human flow database. Therefore, in Patent Document 1, it is necessary to store each individual's outing behavior in a human flow database in advance. In other words, Patent Document 1 is a technical idea that does not hold when each individual's outing behavior is unknown in advance.

特許文献2は、単に、人口密度分布の時系列データが観測データとして与えられた条件の下で、未観測地点あるいは未来の時空間変数分布を推定・予測する技術的思想を開示しているに過ぎない。また、特許文献2は、時系列データとして人流の速度・向きを対象としたものに適用することができることを記載しているが、具体的にどのように人流の速度・向きに適用するかについては、何ら開示も示唆もしていない。 Patent Document 2 simply discloses the technical idea of estimating and predicting the unobserved point or the future spatiotemporal variable distribution under the condition that the time series data of the population density distribution is given as the observed data. Not too much. Further, Patent Document 2 describes that it can be applied as time-series data targeting the speed and direction of human flow, but specifically how to apply it to the speed and direction of human flow. Does not disclose or suggest anything.

特許文献3では、分散処理プラットフォームは、人流全数調査データのうち現在時刻と一致するもの全体を所定数分複製し、各仮説の各人物の位置をランダムに少しずらし、人流仮説データとしている。そのため、各人物ごとに膨大なデータが必要となる。 In Patent Document 3, the distributed processing platform duplicates the entire human flow 100% survey data that matches the current time by a predetermined number of minutes, and randomly shifts the position of each person in each hypothesis to obtain human flow hypothesis data. Therefore, a huge amount of data is required for each person.

特許文献4では、カメラやGPSの情報を活用しているので、個人の行動軌跡を取得することができる。しかしながら、特許文献4の技術では、個人特定につながるため、プラバシーの侵害に当たる可能性が高い。 In Patent Document 4, since the information of the camera and GPS is utilized, it is possible to acquire the action trajectory of an individual. However, the technique of Patent Document 4 leads to personal identification, and therefore has a high possibility of infringing privacy.

非特許文献1に開示されたKernel ABCでは、前述したように、kernel meanを使って再度サンプリングできないという問題がある。すなわち、漸近手法を完成できない。 As described above, Kernel ABC disclosed in Non-Patent Document 1 has a problem that it cannot be sampled again using kernel mean. That is, the asymptotic method cannot be completed.

非特許文献2では、モバイル空間統計等の人口分布情報を用いているので、プライバシーを保護することが可能である。しかしながら、非特許文献2の開示する方法は、分析粒度が大まかであるため、細かな回遊行動を推定することが困難である。 Since Non-Patent Document 2 uses population distribution information such as mobile spatial statistics, it is possible to protect privacy. However, in the method disclosed in Non-Patent Document 2, it is difficult to estimate fine migratory behavior because the analysis particle size is rough.

非特許文献3に開示された方法では、確率的な行動モデルに基づき、人口分布とアンケート情報を基に回遊行動を分析している。しかしながら、そのような分析方法では、詳細な施設間の関連性を把握することができないため、その分析結果を街作りに活用するには不十分な情報となってしまう。 In the method disclosed in Non-Patent Document 3, migratory behavior is analyzed based on population distribution and questionnaire information based on a probabilistic behavior model. However, such an analysis method cannot grasp the detailed relationship between facilities, and therefore the information is insufficient to utilize the analysis result for town planning.

本発明の目的は、上述した課題を解決する、人流パターン推定システムおよび人流パターン推定方法を提供することにある。 An object of the present invention is to provide a human flow pattern estimation system and a human flow pattern estimation method that solve the above-mentioned problems.

本発明による人流パターン推定システムは、街中における人流グループ単位での動きである人流パターンを推定する人流パターン推定システムであって、前記街中の地図情報および施設情報が組み込まれ、前記人流パターンを規定するパラメータθのサンプルから各地点、各時刻での人口分布データyを出力する人流シミュレータと、前記人流シミュレータに設定する前記パラメータθを、繰り返し学習により決定する機械学習装置と、を備え、前記機械学習装置は、事前分布Pから前記パラメータθのN(Nは2以上の整数)個のサンプルθ(1≦i≦N)を取得する第1のサンプル取得部と;前記N個のサンプルθを順次前記人流シミュレータに供給することで、それぞれ、前記人流シミュレータから各地点、各時刻でのN個の人口分布データyを取得するシミュレーション実行部と;カーネル関数kを用いて、前記N個の人口分布データyと各地点、各時刻での真の人口分布を表す正解データyとの間のN個の類似度wを算出する類似度算出部と;該N個の類似度wと、前記N個のサンプルθと、前記カーネル関数kとから、事後分布のカーネル平均μを構築するカーネル平均構築部と;前記カーネル平均μと前記カーネル関数kとから、パラメータθのT(Tは2以上の整数)個の新たなサンプルθ(1≦t≦T)を取得する第2のサンプル取得部と;該T個の新たなサンプルθから選択した1つのサンプルθを前記人流シミュレータに供給することによって前記人流シミュレータから得られた新たな人口分布データyと前記正解データyとの間の差分||y−y||が、所定の閾値εより小さいか否かを判断するサンプル評価部と;を備え、前記サンプル評価部は、前記差分||y−y||が前記所定の閾値εより小さいと判断した場合に、前記選択したサンプルθを、前記人流パターンを規定するパラメータθとして推定し、出力する。 The person flow pattern estimation system according to the present invention is a person flow pattern estimation system that estimates a person flow pattern that is a movement in a person flow group unit in the city, and defines the person flow pattern by incorporating the map information and facility information in the city. The machine learning is provided with a human flow simulator that outputs population distribution data y at each point and time from a sample of parameter θ, and a machine learning device that determines the parameter θ set in the human flow simulator by iterative learning. The apparatus includes a first sample acquisition unit that acquires N (N is an integer of 2 or more) samples θ i (1 ≦ i ≦ N) of the parameter θ from the prior distribution P; and the N samples θ i. A simulation execution unit that acquires N population distribution data y i at each point and time from the human flow simulator, respectively, by sequentially supplying the N human flow simulators; the N pieces using the kernel function k. population data y i and each point of the similarity calculation unit for calculating a N number of similarities w i between the correct answer data y * representing the true population distribution at each time; the N number of similarities A kernel average construction unit that constructs a kernel average μ of the posterior distribution from w i , the N samples θ i, and the kernel function k; and a parameter θ from the kernel average μ and the kernel function k. A second sample acquisition unit that acquires T (T is an integer of 2 or more) new samples θ t (1 ≦ t ≦ T); and one sample θ selected from the T new samples θ t. difference || y k -y * || between the new population distribution data y k obtained the correct answer data y * from the human flow simulator by supplying k to the pedestrian flow simulator, the predetermined threshold ε a sample evaluation unit to determine a smaller or not; wherein the sample evaluation unit, if the difference || y k -y * || determines that the smaller the predetermined threshold epsilon, said selected The sample θ k is estimated and output as a parameter θ that defines the human flow pattern.

本発明の人流パターン推定方法は、街中における人流グループ単位での動きである人流パターンを推定する人流パターン推定システムにおける、前記街中の地図情報および施設情報が組み込まれ、前記人流パターンを規定するパラメータθのサンプルから各地点、各時刻での人口分布データyを出力する人流シミュレータを用いて、前記人流シミュレータに設定する前記パラメータθを、繰り返し学習により決定する人流パターン推定方法であって、第1のサンプル取得部が、事前分布Pから前記パラメータθのN(Nは2以上の整数)個のサンプルθ(1≦i≦N)を取得し;シミュレーション実行部が、前記N個のサンプルθを順次前記人流シミュレータに供給することで、それぞれ、前記人流シミュレータから各地点、各時刻でのN個の人口分布データyを取得し;類似度算出部が、カーネル関数kを用いて、前記N個の人口分布データyと各地点、各時刻での真の人口分布を表す正解データyとの間のN個の類似度wを算出し;カーネル平均構築部が、前記N個の類似度wと、前記N個のサンプルθと、前記カーネル関数kとから、事後分布のカーネル平均μを構築し;第2のサンプル取得部が、前記カーネル平均μと前記カーネル関数kとから、パラメータθのT(Tは2以上の整数)個の新たなサンプルθ(1≦t≦T)を取得し;サンプル評価部が、前記T個の新たなサンプルθから選択した1つのサンプルθを前記人流シミュレータに供給することによって前記人流シミュレータから得られた新たな人口分布データyと前記正解データyとの間の差分||y−y||が、所定の閾値εより小さいか否かを判断し;前記サンプル評価部は、前記差分||y−y||が前記所定の閾値εより小さいと判断した場合に、前記選択したサンプルθを、前記人流パターンを規定するパラメータθとして推定し、出力する。 The people flow pattern estimation method of the present invention incorporates the map information and facility information in the city in the people flow pattern estimation system that estimates the people flow pattern, which is the movement of the people flow group in the city, and the parameter θ that defines the people flow pattern. This is a first method of estimating a human flow pattern in which the parameter θ set in the human flow simulator is determined by iterative learning using a human flow simulator that outputs population distribution data y at each point and at each time from the sample. The sample acquisition unit acquires N (N is an integer of 2 or more) samples θ i (1 ≦ i ≦ N) of the parameter θ from the prior distribution P; the simulation execution unit obtains the N samples θ i. Are sequentially supplied to the human flow simulator to acquire N population distribution data y i at each point and at each time from the human flow simulator, respectively; the similarity calculation unit uses the kernel function k to obtain the above-mentioned N number of population distribution data y i and each point, the N to calculate the similarity w i between the correct answer data y * representing the true population distribution at each time; the kernel average construction unit, the N a similarity w i of the N number of samples theta i, from said kernel function k, to build a kernel mean μ of the posterior distribution; second sample acquisition unit, the kernel average μ and the kernel function k From the above, T (T is an integer of 2 or more) new samples θ t (1 ≦ t ≦ T) of the parameter θ are obtained; the sample evaluation unit selects from the T new samples θ t. The difference between the new population distribution data y k obtained from the human flow simulator and the correct answer data y * by supplying one sample θ k to the human flow simulator || y k − y * || determining whether a predetermined smaller than the threshold value epsilon; the sample evaluation unit, the difference || y k -y * if || determines that the smaller the predetermined threshold epsilon, the sample theta k of said selected Is estimated as a parameter θ that defines the human flow pattern, and is output.

本発明によれば、人流パターンの高次元のパラメータ推定が可能になり、計算時間を減少することが可能となる。 According to the present invention, it is possible to estimate high-dimensional parameters of the human flow pattern, and it is possible to reduce the calculation time.

本発明の一実施形態に係る人流パターン推定システムの構成を示すブロック図である。It is a block diagram which shows the structure of the person flow pattern estimation system which concerns on one Embodiment of this invention. 正解データを示す人口時間分布データの一例を示す図である。It is a figure which shows an example of the population time distribution data which shows the correct answer data. 図1に示した人流パターン推定システムに使用される、人流シミュレータに組み込まれる(設定される)、地図情報および施設情報(地図/建物データ)の一例を示す図である。It is a figure which shows an example of the map information and facility information (map / building data) incorporated (set) in the person flow simulator used in the person flow pattern estimation system shown in FIG. 1. 人流パターンの一例を示す図である。It is a figure which shows an example of a person flow pattern. 図1に示した人流パターン推定システムに使用される、機械学習装置で実現される主な処理部を示すブロック図である。It is a block diagram which shows the main processing part realized by the machine learning apparatus used in the human flow pattern estimation system shown in FIG. 図5に示した機械学習装置に使用される、データ入力部の動作を説明するための図である。It is a figure for demonstrating the operation of the data input part used in the machine learning apparatus shown in FIG. 図5に示した機械学習装置に使用される、第1のサンプル取得部の動作を説明するための図である。It is a figure for demonstrating the operation of the 1st sample acquisition part used in the machine learning apparatus shown in FIG. 図5に示した機械学習装置に使用される、シミュレーション実行部の動作を説明するための図である。It is a figure for demonstrating the operation of the simulation execution part used in the machine learning apparatus shown in FIG. 図5に示した機械学習装置に使用される、Kernel ABC 実行部(類似度算出部)の動作を説明するための図である。It is a figure for demonstrating the operation of the Kernel ABC execution part (similarity calculation part) used in the machine learning apparatus shown in FIG. 図5に示した機械学習装置に使用される、カーネル平均構築部の動作を説明するための図である。It is a figure for demonstrating the operation of the kernel average construction part used in the machine learning apparatus shown in FIG. 図5に示した機械学習装置に使用される、第2のサンプル取得部の動作を説明するための図である。It is a figure for demonstrating the operation of the 2nd sample acquisition part used in the machine learning apparatus shown in FIG. 図5に示した機械学習装置に使用される、サンプル評価部の動作を説明するための図である。It is a figure for demonstrating the operation of the sample evaluation part used in the machine learning apparatus shown in FIG. 図1に示した人流パターン推定システムの動作の一実施例について説明するためのフローチャートである。It is a flowchart for demonstrating one Example of the operation of the person flow pattern estimation system shown in FIG. 図1に示した人流パターン推定システムを実行した場合の実験に使用した、4meshモデルの一例を示す図である。It is a figure which shows an example of the 4 mesh model used for the experiment when the human flow pattern estimation system shown in FIG. 1 was executed. 図1に示した人流パターン推定システムを実行した場合の実験に設定した、5つのルールの一例を示す図である。It is a figure which shows an example of 5 rules set in the experiment when the person flow pattern estimation system shown in FIG. 1 is executed. 図14に示した4meshモデルの実験結果を示す図である。It is a figure which shows the experimental result of the 4 mesh model shown in FIG.

まず、本発明の理解を容易にするために、本明細書中で使用する用語の意味に関して簡略的に説明する。 First, in order to facilitate the understanding of the present invention, the meanings of the terms used in the present specification will be briefly described.

近似ベイズ計算法(ABC:Approximate Bayesian Computation)とは、モンテカルロ法の一種で、ランダムに選んだパラメータの値から、パフォーマンスの高いパラメータを順次求めていく方法である。例えば、ABCでは、シミュレータから疑似データを生成し、その擬似データが現実のデータと近ければ、シミュレータに使用されたパラメータを正しいものとして認める。 The Approximate Bayesian Computation (ABC) is a type of Monte Carlo method, in which parameters with high performance are sequentially obtained from the values of randomly selected parameters. For example, ABC generates pseudo data from a simulator, and if the pseudo data is close to the actual data, the parameters used in the simulator are recognized as correct.

換言すれば、ABCは、観測データとシミュレートしたデータの差異について拒絶アルゴリズム法を適用する、ベイズ推定のための尤度無しの方法である。 In other words, ABC is a non-likelihood method for Bayesian estimation that applies a rejection algorithm method to the difference between observed and simulated data.

Kernel ABCは、全サンプルを活用して、適合度で重み付けしたカーネル平均(kernel mean)として分布を表現する。 Kernel ABC utilizes all samples and expresses the distribution as a kernel mean weighted by goodness of fit.

カーネル法は、高次元空間への写像を構成する方法論である。カーネル法は、データを高次元の再生核ヒルベルト空間(一般には無限次元)へ写像し、解析しやすいデータに変換する。ヒルベルト空間(Hilbert space)とは、ベクトル空間であり、内積が備わっており、完備であるような集合である。 The kernel method is a methodology for constructing maps to higher dimensional space. The kernel method maps data into a high-dimensional reproducing kernel Hilbert space (generally infinite dimension) and transforms it into data that is easy to analyze. A Hilbert space is a vector space, a set that has an inner product and is complete.

集合Ω上の関数を要素に持つヒルベルト空間Hが再生核ヒルベルト空間(RKHR:reproducing kernel Hilbert space)であるとは、任意のx∈Ωに対してφ∈Hがあって、任意のf∈Hに対し、
<f,φ> = f(x)
が成り立つことをいう。φのことを再生核という。
A Hilbert space H having a function on the set Ω as an element is a reproducing kernel Hilbert space (RKHR), which means that there is φ X ∈ H for any x ∈ Ω and any f ∈. Against H
<F, φ X > = f (x)
Is true. φ X is called a regenerated kernel.

Kernel Herdingは、kernel meanの分布の特徴をうまく利用し、カブリの少ない代表点をスーパサンプルとして選択する。つまり、Kernel Herdingは、少ないサンプル点で、適切な設定の分布を表現する。 Kernel Herding makes good use of the characteristics of the kernel mean distribution and selects a representative point with less fog as a super sample. In other words, Kernel Herding expresses the distribution of appropriate settings with a small number of sample points.

ARDでは、ハイパーパラメータを調整することにより、事前分布からのサンプルでパラメータのほとんどの値が0を取ることで、余分なものを削除している。通常、これはディリクレ分布やベータ分布を事前分布として導入することにより達成される。ディリクレ分布の例で言えば、それに付随するハイパーパラメータの値を小さくとると、分布からのサンプルがほとんど0に近い値を取り、少ないパラメータで現象を説明しようとする力が働く。 In ARD, by adjusting the hyperparameters, most of the values of the parameters take 0 in the sample from the prior distribution, and the extra ones are deleted. This is usually achieved by introducing a Dirichlet or beta distribution as a prior distribution. In the case of the Dirichlet distribution, if the value of the hyperparameter associated with it is made small, the sample from the distribution takes a value close to 0, and the force to explain the phenomenon with a small number of parameters works.

別言すると、パラメータの冗長性をコントロールしたい場合には、パラメータのサンプルをディリクレ分布もしくはベータ分布から取得する。ディリクレ分布、ベータ分布にはパラメータの冗長性をコントロールするハイパーパラメータが存在する。そのハイパーパラメータの値を変更することにより、パラメータのサンプルがもつ冗長性を調整する。例えば、冗長性をなくすようにハイパーパラメータを設定すると、サンプルの要素のごく少数のみが非0の値を取り、多くの要素は0の値を取る。これにより、0の値を取った要素は実質影響を持たない。こうして、得られた事後分布のカーネル平均は冗長性が非常に減少したものとなる。 In other words, if you want to control the redundancy of the parameters, get a sample of the parameters from the Dirichlet distribution or the beta distribution. There are hyperparameters that control parameter redundancy in the Dirichlet distribution and beta distribution. By changing the value of the hyperparameter, the redundancy of the parameter sample is adjusted. For example, if you set hyperparameters to eliminate redundancy, only a few of the sample elements will have non-zero values and many will have zero values. As a result, the element that takes a value of 0 has no substantial effect. Thus, the resulting posterior distribution kernel mean is very redundant.

[関連技術]
本発明の理解を容易にするために、関連技術とその問題点について説明する。
[Related technology]
In order to facilitate the understanding of the present invention, related techniques and their problems will be described.

問題の事実(真実)が与えられたときに、その事実(真実)に十分に近接したデータを生成する、シミュレータのパラメータの集合を知りたいとする。ベイズ規則を適用したいが、尤度関数は評価されえない。しかしながら、シミュレータの尤度p(y|θ)から事前確率π(θ)に基づいて、次の式により、サンプリングは可能である。

Figure 0006853955
Given the fact (truth) of the problem, we want to know a set of simulator parameters that generate data that is close enough to that fact (truth). I want to apply Bayesian rules, but the likelihood function cannot be evaluated. However, sampling is possible by the following equation based on the prior probability π (θ) from the simulator likelihood p (y | θ).
Figure 0006853955

そこで、ABCのフレームワークを使用することが考えられる。表1に、ABCのアルゴリズムを示す。

Figure 0006853955
Therefore, it is conceivable to use the ABC framework. Table 1 shows the ABC algorithm.
Figure 0006853955

しかしながら、ABCには、次のような課題がある。 However, ABC has the following problems.

第1の課題は、データの次元が高いと、パラメータが採択基準(tolerance level)をなかなか満たさず、現実的な時間でアルゴリズムが終了しないことである。 The first problem is that when the dimension of the data is high, the parameters do not easily meet the tolerance level and the algorithm does not finish in a realistic time.

第2の課題は、パラメータの次元が高いと、ABCの性能はすぐに低下することである。 The second problem is that the higher the dimension of the parameter, the sooner the performance of ABC deteriorates.

第3の課題は、シミュレーションを計算するのに時間がかかるので、実行数を省けないことである。 The third problem is that it takes time to calculate the simulation, so the number of executions cannot be omitted.

[本発明に係るアルゴリズムの概要説明]
本発明では、第1および第2の課題を解決するためにKernel ABCを使用し、第3の課題を解決するためにKernel Herdingを使用している。
[Explanation of Outline of Algorithm According to the Present Invention]
In the present invention, Kernel ABC is used to solve the first and second problems, and Kernel Herding is used to solve the third problem.

本発明のアルゴリズムの概要は次の通りである。
A1.事前分布からパラメータの組をN回取り出す。
A2.N個のパラメータの組を使用してシミュレータからデータをN回生成する。
A3.Kernel ABC
・事後分布のカーネル平均を計算することによって、観測データに近接するデータを生成するシミュレータのパラメータを推察する。
A4.Kernel Herding
・次の繰り返しのために事後分布のカーネル平均から有益なサンプルをT回取り出す。
A5.収束するためにA2.から繰り返す。
The outline of the algorithm of the present invention is as follows.
A1. Extract the set of parameters N times from the prior distribution.
A2. Data is generated N times from the simulator using a set of N parameters.
A3. Kernel ABC
-By calculating the kernel mean of the posterior distribution, the parameters of the simulator that generate data close to the observed data are inferred.
A4. Kernel Herding
• Take a useful sample T times from the kernel mean of the posterior distribution for the next iteration.
A5. To converge A2. Repeat from.

次に、Kernel ABCについて説明する。
Kernel ABCは、Kernelベイズ規則に基づいており、ベイズ規則のノンパラメトリックな実現である。
B1.事前分布からパラメータの組をN回取り出す。
B2.パラメータの組をシミュレータにN回入力することによって、N個のシミュレートしたデータを取得する。
B3.真のデータと各シミュレートしたデータとの間の類似度(重み)を計算する。
B4.B1.でのパラメータの組をそれらの類似度(重み)で平均化することによって、下記数式に従って、パラメータ事後分布のカーネル平均を計算する。

Figure 0006853955
Next, Kernel ABC will be described.
Kernel ABC is based on Kernel Bayesian rules and is a nonparametric implementation of Bayesian rules.
B1. Extract the set of parameters N times from the prior distribution.
B2. By inputting a set of parameters into the simulator N times, N simulated data are acquired.
B3. Calculate the similarity (weight) between the true data and each simulated data.
B4. B1. By averaging the set of parameters in the above by their similarity (weight), the kernel average of the parameter posterior distribution is calculated according to the following formula.
Figure 0006853955

次に、カーネル平均について説明する。
Xを測度空間Ω上の値を取るランダム変数とし、kを測度空間Ω上の正定値カーネルであり、Hが正定値カーネルkによって規定された再生核ヒルベルト空間(RKHS:reproducing kernel Hilbert space)であるとする。このとき、カーネル平均は、次式で求められる。

Figure 0006853955
Next, the kernel average will be described.
X is a random variable that takes a value on the measuring space Ω, k is a definite kernel on the measuring space Ω, and H is a reproducing kernel Hilbert space (RKHS) defined by the definite kernel k. Suppose there is. At this time, the kernel average is calculated by the following equation.
Figure 0006853955

特性カーネルによって、確率分布を再生核ヒルベルト空間に一意に埋め込むことができる。特性カーネルは、例えば、ガウスカーネルやラプラスカーネルなどである。 The characteristic kernel allows the probability distribution to be uniquely embedded in the reproducing kernel Hilbert space. The characteristic kernel is, for example, a Gaussian kernel or a Laplace kernel.

次に、カーネル平均とカーネルベイズ規則を使用することの利点について説明する。変数間のパラメトリックモデルや、密度関数を想定することなく、ベイズ規則をノンパラメトリックに適用できる。したがって、確率分布を表すカーネル平均は、データからノンパラメトリックに推定される。 Next, the advantages of using kernel averaging and kernel Bayesian rules will be discussed. Bayesian rules can be applied nonparametrically without assuming a parametric model between variables or a density function. Therefore, the kernel mean representing the probability distribution is estimated nonparametrically from the data.

次に、Kernel Herdingについて説明する。
Kernel ABCの出力は、再生核ヒルベルト空間内の事後分布のカーネル平均であるが、それ自身事後分布ではない。したがって、マルコフ連鎖モンテカルロ法に代表される事後分布からのサンプリング手法を使うことができない。しかし、Kernel Herdingは、事後分布からのサンプルを可能とする。
Next, Kernel Herding will be described.
The output of Kernel ABC is the kernel mean of the posterior distribution in the reproducing kernel Hilbert space, but it is not itself an posterior distribution. Therefore, the sampling method from the posterior distribution represented by the Markov chain Monte Carlo method cannot be used. However, Kernel Herding allows samples from posterior distributions.

更に、Kernel Herdingからのサンプルは、分布の特徴を上手く反映したスーパサンプルと呼ばれる。 Furthermore, the sample from Kernel Herding is called a super sample that well reflects the characteristics of the distribution.

Kernel Herdingは、次の誤差を貪欲に最小化することで、サンプリングを行っていると解釈できる。

Figure 0006853955
Kernel Herding can be interpreted as sampling by greedily minimizing the following error.
Figure 0006853955

Kernel Herdingは、分布において密度が高い領域からサンプルを取る。つまり、分布のモードを探索すると考えられる。また、一度サンプルが取られた領域からは離れて、次のサンプルが取得される。
以上を要約すると、次のようになる。
Kernel Herding takes samples from areas of high density in the distribution. That is, it is considered to search for the mode of distribution. Also, away from the area where the sample was taken once, the next sample is taken.
The above can be summarized as follows.

Kernel ABCは、比較的高い次元のパラメータを処理でき、比較的高い次元のデータ(シミュレートされたデータ/問題の真のデータ)を処理でき、扱いやすい計算的な複雑性を持つ。 Kernel ABC can handle relatively high dimensional parameters, can handle relatively high dimensional data (simulated data / true problem data), and has manageable computational complexity.

Kernel Herdingは、必要とされるシミュレーションの数を削減することができる。 Kernel Herding can reduce the number of simulations required.

[発明の概要の説明]
人流シミュレータへの適用についてそもそも、モバイル空間統計のような、人口分布の時系列に関しての人流シミュレータのデータ同化はこれまで試みられていない。そのときに、以下の課題があり、本発明に係る提案手法ではそれに対処している。
[Explanation of Outline of Invention]
Application to human flow simulator In the first place, data assimilation of human flow simulator regarding time series of population distribution such as mobile spatial statistics has not been attempted so far. At that time, there are the following problems, and the proposed method according to the present invention addresses them.

1)人流シミュレータはマルチエージェントシミュレータであり、多くの場合シミュレーションに非常に計算時間がかかる。 1) The human flow simulator is a multi-agent simulator, and in many cases, the simulation takes a very long time to calculate.

これに対して、本提案手法では、Kernel herding を用いることにより、より少ない回数のシミュレーションでデータ同化を達成できる。これは、kernel herding が効率的により多くの情報を持つ重要なパラメータのサンプルを取得するからである。 On the other hand, in the proposed method, data assimilation can be achieved with a smaller number of simulations by using Kernel herding. This is because kernel herding efficiently obtains samples of important parameters with more information.

また、これについて、O(1/T) で誤差が収束していく。一方、モンテカルロ法などによるパラメータのサンプル取得では、より遅いO(1/√T) である。 In addition, the error converges with O (1 / T). On the other hand, in the parameter sample acquisition by the Monte Carlo method or the like, the slower O (1 / √T) is obtained.

2)人流シミュレータではないが、他のデータ同化に関して、ABCなどを使ったベイズ推定では、パラメータの次元が高次元の際に、上手く働かないことが分かっている。 2) Although it is not a human-style simulator, regarding other data assimilation, it is known that Bayesian estimation using ABC etc. does not work well when the parameter dimension is high.

これに対して、本提案手法では、Kernel ABC が、再生核ヒルベルト空間でベイズ推定を行うことにより、高次元パラメータに対応している。 On the other hand, in the proposed method, Kernel ABC supports high-dimensional parameters by performing Bayesian inference in the reproducing kernel Hilbert space.

3)事前知識が間違っていた場合に、ある地域において存在しない人流パターンを想定して、事前分布を構築してしまうことがある。例えば、銀座において、吉野家で昼食をとり、ロレックスで時計を買い、フェラーリで車を買い、松屋で夜ご飯を食べるなどの人流パターンである。関連技術では、このような存在すると考えにくい人流パターンをアルゴリズムで自動的に削除する仕組みはなかった。 3) If the prior knowledge is wrong, the prior distribution may be constructed by assuming a flow pattern that does not exist in a certain area. For example, in Ginza, there is a popular pattern such as having lunch at the Yoshinoya, buying a watch at Rolex, buying a car at Ferrari, and eating dinner at Matsuya. In the related technology, there was no mechanism to automatically delete such a flow pattern that is unlikely to exist by an algorithm.

これに対して、本提案手法では、ARD により、そういったパターンを削除するスパース性が導入されている。 On the other hand, in the proposed method, ARD introduces sparsity to delete such patterns.

アルゴリズムについて、本提案手法は、尤度関数が評価できない場合に、点推定を行うことを可能としている。 Regarding the algorithm, the proposed method makes it possible to perform point estimation when the likelihood function cannot be evaluated.

関連技術では、尤度関数が評価できない場合にベイズ推定を行うことはできた(ABCなど)。つまり、それによって正しい事後分布を求めることができた。しかしながら、ABCでは、真値が一点ある状況での点推定を、尤度関数が評価できない場合に行うことはできなかった。 In related techniques, Bayesian inference could be performed when the likelihood function could not be evaluated (ABC, etc.). In other words, it was possible to obtain the correct posterior distribution. However, in ABC, point estimation in a situation where there is one true value cannot be performed when the likelihood function cannot be evaluated.

これに対して、本提案手法では、Kernel ABC + Kernel Herding で取得された事後分布からのサンプルを、事前分布からのサンプルとみて、Kernel ABC+ Kernel herding を繰り返し適用することで、点推定を達成している。 On the other hand, in the proposed method, the sample from the posterior distribution acquired by Kernel ABC + Kernel Herding is regarded as the sample from the prior distribution, and point estimation is achieved by repeatedly applying Kernel ABC + Kernel herding. ing.

一度目の適用では以下の数式で表される事後分布がえられる。

Figure 0006853955
In the first application, the posterior distribution expressed by the following formula can be obtained.
Figure 0006853955

このP(θ|y) を事前分布として、二度目の適用をすると、以下の数式が得られる。

Figure 0006853955
これは、
Figure 0006853955
ということであり、N回目の適用では、
Figure 0006853955
となる。つまり、尤度関数l(y|θ) がN乗され、影響が強くなり、一方で事前分布π(θ) の影響が少なくなっている。これを無限回繰り返したあと、P(θ|y)を最大化するθを取得することは、π(θ)の影響が消えているため、l(y|θ)を最大化するθを取得することと一致すると考えられる。つまり、無限回のパラメータに関するベイズ推定を同一のデータに対して繰り返し、P(θ|y)を最大化するθを取得することは点推定の最尤法と一致すると考えることができる。これを踏まえ、尤度関数が評価できないときにベイズ推定を行う手法であるABCを使うことで、尤度関数なしの最尤法を実行できる。これをRecursive ABC-MLEと名づけた。このアルゴリズムの内部でkernel ABCを本明細書では用いているが、尤度関数無しに事後分布を求めることができる手法であればどれでも構わない。また、このアルゴリズム内部でP(θ|y)を最大化するθを取得することは、Kernel Herdingのmode-seeking(最頻値追跡)という特性により可能となっている。しかしながら、取得する手法は、必ずしもKernel Herdingである必要はなく、最頻値をサンプリングする特性のある手法であればよい。 When this P (θ | y) is used as a prior distribution and applied for the second time, the following formula is obtained.
Figure 0006853955
this is,
Figure 0006853955
So, in the Nth application,
Figure 0006853955
Will be. That is, the likelihood function l (y | θ) is raised to the Nth power, and the influence becomes stronger, while the influence of the prior distribution π (θ) becomes smaller. After repeating this infinitely, acquiring θ that maximizes P (θ | y) eliminates the influence of π (θ), so acquiring θ that maximizes l (y | θ). It is considered to be consistent with what you do. That is, it can be considered that the Bayesian estimation for the infinite number of parameters is repeated for the same data to obtain θ that maximizes P (θ | y), which is consistent with the maximum likelihood method of point estimation. Based on this, the maximum likelihood method without the likelihood function can be executed by using ABC, which is a method for performing Bayesian estimation when the likelihood function cannot be evaluated. This was named Recursive ABC-MLE. Although kernel ABC is used in this algorithm inside this algorithm, any method that can obtain the posterior distribution without a likelihood function may be used. Further, it is possible to acquire θ that maximizes P (θ | y) inside this algorithm due to the mode-seeking (mode-seeking) characteristic of Kernel Herding. However, the method to be acquired does not necessarily have to be Kernel Herding, and any method having a characteristic of sampling the mode may be used.

Kernel Herding が、事後分布から効率的により多くの情報を持つ重要なパラメータのサンプルを取得する。これについて、O(1/T ) で誤差が収束していく。 Kernel Herding efficiently obtains a sample of important parameters with more information from the posterior distribution. Regarding this, the error converges with O (1 / T).

一方、上記のベイズ推定の繰り返しを、関連技術の手法のマルコフ連鎖モンテカルロ法などによるパラメータのサンプル取得で行った場合は、より遅いO(1/√T) である。 On the other hand, when the above Bayesian estimation is repeated by acquiring a parameter sample by a Markov chain Monte Carlo method or the like, which is a method of a related technique, the result is slower O (1 / √T).

またこのアルゴリズムの本質は、尤度関数が評価できない場合に最尤法を可能にすることにある。このアルゴリズムの適用先としては、後で詳述する人流パターンを推定することのみでなく、次のものも考えられる。 The essence of this algorithm is to enable maximum likelihood when the likelihood function cannot be evaluated. As the application destination of this algorithm, not only the estimation of the human flow pattern described in detail later but also the following can be considered.

1)株価など金融時系列の価格変動の分散(ボラティリティ)を適切にモデル化するためによく使われるアルファ定常分布のパラメータをデータに合わせて推定すること。 1) Estimate the parameters of the alpha stationary distribution, which is often used to properly model the variance (volatility) of price fluctuations in financial time series such as stock prices, according to the data.

2)ハエなど、生物の個体数の時間発展を記述するモデルのパラメータをデータに合わせて推定すること。 2) Estimate the parameters of the model that describes the time evolution of the population of organisms such as flies according to the data.

3)集団遺伝学において、与えられたデータの遺伝的多様性を実現するようなモデルのパラメータ(突然変異率など)を推定すること。 3) In population genetics, estimate model parameters (mutation rate, etc.) that realize the genetic diversity of given data.

尚、このアルゴリズムは、ソフトウェア関連発明であるとしても、計算時間を減少できる効果を奏するので、コンピュータ関連技術を改善(向上)するものであり、抽象概念には該当しない。 Even if this algorithm is a software-related invention, it has the effect of reducing the calculation time, so that it improves (improves) computer-related technology and does not fall under the abstract concept.

[実施の形態]
図1は、本発明の一実施形態に係る人流パターン推定システム100の構成を示すブロック図である。
[Embodiment]
FIG. 1 is a block diagram showing a configuration of a human flow pattern estimation system 100 according to an embodiment of the present invention.

図示の人流パターン推定システム100は、データを処理するデータ処理装置200と、後述するプログラムやデータを記憶する記憶装置300と、データを入力する入力装置400と、データを出力する出力装置500と、を備えている。 The illustrated human flow pattern estimation system 100 includes a data processing device 200 for processing data, a storage device 300 for storing programs and data described later, an input device 400 for inputting data, and an output device 500 for outputting data. It has.

出力装置500は、LCD(Liquid Crystal Display)やPDP(Plasma Display Panel)などの表示装置やプリンタからなる。出力装置500は、データ処理装置200からの指示に応じて、操作メニューなどの各種情報を表示したり、最終結果を印字出力する機能を有する。 The output device 500 includes a display device such as an LCD (Liquid Crystal Display) or a PDP (Plasma Display Panel) or a printer. The output device 500 has a function of displaying various information such as an operation menu and printing out the final result in response to an instruction from the data processing device 200.

記憶装置300は、ハードディスクやリードオンリメモリ(ROM)およびランダムアクセスメモリ(RAM)などのメモリからなる。記憶装置300は、データ処理装置200における各種処理に必要な処理情報310やプログラム320を記憶する機能を有する。 The storage device 300 includes a memory such as a hard disk, a read-only memory (ROM), and a random access memory (RAM). The storage device 300 has a function of storing processing information 310 and a program 320 required for various processes in the data processing device 200.

データ処理装置200は、MPU(micro processing unit)などのマイクロプロセッサや中央処理装置(CPU)からなる。データ処理装置200は、記憶装置300からプログラム320を読み込んで、プログラム320に従ってデータを処理する各種処理部を実現する機能を有する。 The data processing device 200 includes a microprocessor such as an MPU (micro processing unit) and a central processing unit (CPU). The data processing device 200 has a function of reading the program 320 from the storage device 300 and realizing various processing units that process data according to the program 320.

データ処理装置200は、人流シミュレータ210と機械学習装置220とを備える。 The data processing device 200 includes a human flow simulator 210 and a machine learning device 220.

図示の人流パターン推定システム100において、アルゴリズムに必要なデータや、装置モバイル空間統計のような、人流を推定したい地域、時刻においての人口分布のデータが与えられているものとする。これを正解データyと呼ぶ。 In the illustrated human flow pattern estimation system 100, it is assumed that the data required for the algorithm and the data of the population distribution in the area and time at which the human flow is to be estimated, such as the device mobile spatial statistics, are given. This is called correct answer data y *.

図2は、正解データyを示す人口時間分布データの一例を示す図である。人口時間分布データは、時刻T=・・・、t−1,t、t+1、t+2、・・・ごとの、人口分布を示している。時刻Tは、例えば、30分毎の時刻である。このような人口時間分布データは、例えば、統計情報やSNS(Social Networking Service)で取得することが可能である。ここで、SNSとは、人と人との社会的な繋がりを維持・促進する様々な機能を提供する、会員制のオンラインサービスである。記憶装置300は、処理情報310として正解データyを保存している。 FIG. 2 is a diagram showing an example of population time distribution data showing correct answer data y *. The population time distribution data shows the population distribution for each time T = ..., t-1, t, t + 1, t + 2, .... The time T is, for example, a time every 30 minutes. Such population time distribution data can be acquired by, for example, statistical information or SNS (Social Networking Service). Here, SNS is a membership-based online service that provides various functions for maintaining and promoting social connections between people. The storage device 300 stores the correct answer data y * as the processing information 310.

人流パターン推定システム100は、街中における人流グループ単位での動きである人流パターンを推定するシステムである。 The people flow pattern estimation system 100 is a system that estimates the people flow pattern, which is the movement of each person flow group in the city.

人流シミュレータ210は、人流パターンを、任意の地域、時刻においてシミュレーションすることができる。 The human flow simulator 210 can simulate a human flow pattern in any area and time.

詳述すると、人流シミュレータ210には、各地点、各時刻での人口分布の情報および前記街中の地図情報や施設情報が組み込こまれる。 More specifically, the human flow simulator 210 incorporates information on population distribution at each point and time, as well as map information and facility information in the city.

図3は、人流シミュレータ210に組み込まれる(設定される)、地図情報および施設情報(地図/建物データ)の一例を示す図である。記憶装置300は、処理情報310として地図情報および施設情報を保存している。これら地図情報および施設情報は、後述するように、人流シミュレータ210に設定される。 FIG. 3 is a diagram showing an example of map information and facility information (map / building data) incorporated (set) in the human flow simulator 210. The storage device 300 stores map information and facility information as processing information 310. These map information and facility information are set in the human flow simulator 210 as described later.

人流シミュレータ210は、後述するように機械学習装置220から供給される、人流パターンを規定するパラメータθのサンプルから、各地点、各時刻での人口分布データyを出力する。ここで、人流シミュレータ210から得られた人口分布データyは、通常、正解データyには一致しないことに注意されたい。何故なら、正解データyを満たす人流パターンを誰も知らないからである。 The human flow simulator 210 outputs the population distribution data y at each point and at each time from a sample of the parameter θ that defines the human flow pattern, which is supplied from the machine learning device 220 as described later. Note that the population distribution data y obtained from the human flow simulator 210 usually does not match the correct answer data y *. This is because no one knows the flow pattern that satisfies the correct answer data y *.

図4に、人流パターンの一例を示す。図4に示す人流パターンは、地点A、B、C、D、E、F、Gにおける、時刻9:00以降の人流パターンを示している。 FIG. 4 shows an example of a human flow pattern. The flow pattern shown in FIG. 4 shows the flow pattern after 9:00 time at points A, B, C, D, E, F, and G.

パラメータθは、各集団の、出発点、出発時刻、経由点、滞在時間、目的地、および人数の情報を含む。 The parameter θ includes information on the starting point, departure time, waypoint, staying time, destination, and number of people of each group.

機械学習装置220は、人流シミュレータ210に設定するパラメータθを、後述するように、繰り返し学習により決定する。 The machine learning device 220 determines the parameter θ set in the human flow simulator 210 by iterative learning as described later.

図5は、機械学習装置200で実現される主な処理部を示すブロック図である。 FIG. 5 is a block diagram showing a main processing unit realized by the machine learning device 200.

機械学習装置200は、データ入力部221と、第1のサンプル取得部222と、シミュレーション実行部223と、Kernel ABC実行部224と、カーネル平均構築部225と、第2のサンプル取得部226と、サンプル評価部227とから成る。なお、Kernel ABC実行部224は、後述するように類似度算出部として働く。 The machine learning device 200 includes a data input unit 221, a first sample acquisition unit 222, a simulation execution unit 223, a Kernel ABC execution unit 224, a kernel average construction unit 225, and a second sample acquisition unit 226. It consists of a sample evaluation unit 227. The Kernel ABC execution unit 224 functions as a similarity calculation unit as described later.

次に、図6乃至図12を参照して、各処理部の動作について説明する。 Next, the operation of each processing unit will be described with reference to FIGS. 6 to 12.

図6を参照して、データ入力部221の動作について説明する。 The operation of the data input unit 221 will be described with reference to FIG.

図6に示されるように、データ入力部221は、人流シミュレータ210に人流パターンを推定したい地域の情報を入力する。詳述すると、記憶装置300は、処理情報310に、前述したように、地域の情報として地図情報や施設情報を保存している。データ入力部221は、記憶装置300から地図情報と施設情報とを読み出して、それら情報を人流シミュレータ210に入力(設定)する。 As shown in FIG. 6, the data input unit 221 inputs the information of the area for which the human flow pattern is to be estimated into the human flow simulator 210. More specifically, the storage device 300 stores the map information and the facility information as the area information in the processing information 310 as described above. The data input unit 221 reads map information and facility information from the storage device 300, and inputs (sets) the information to the human flow simulator 210.

尚、本例では、データ入力部221は、記憶装置300に保存されている地図情報および施設情報を読み出して、人流シミュレータ210に設定しているが、入力装置400から供給された地図情報および施設情報を、直接、人流シミュレータ210に設定してもよい。 In this example, the data input unit 221 reads out the map information and the facility information stored in the storage device 300 and sets them in the human flow simulator 210, but the map information and the facility supplied from the input device 400. The information may be set directly in the human flow simulator 210.

図7を参照して、第1のサンプル取得部222の動作について説明する。第1のサンプル取得部222は、「事前分布からのサンプル取得部」とも呼ばれる。この第1のサンプル取得部22には、ARDが関わっている。 The operation of the first sample acquisition unit 222 will be described with reference to FIG. 7. The first sample acquisition unit 222 is also referred to as a "sample acquisition unit from prior distribution". ARD is involved in the first sample acquisition unit 22.

図7に示されるように、記憶装置300には、処理情報310として、事前分布Pと、その事前分布Pのハイパーパラメータηと、事前分布Pからのサンプルの個数Nとが格納されている。事前分布Pは、任意のパラメータサンプルの合計が1となるような、mixture モデル、もしくは解の構造がmixture モデルと同じ場合を反映できる適当な事前分布である。 As shown in FIG. 7, the storage device 300 stores the prior distribution P, the hyperparameter η of the prior distribution P, and the number N of samples from the prior distribution P as the processing information 310. The prior distribution P is an appropriate prior distribution that can reflect the case where the sum of arbitrary parameter samples is 1 and the structure of the mixture model or the solution is the same as that of the mixture model.

この事前分布Pのハイパーパラメータηを調整することにより、このアルゴリズムの最終的な解にスパース性を入れるかどうかが決定される。 By adjusting the hyperparameter η of this prior distribution P, it is determined whether or not sparsity is included in the final solution of this algorithm.

第1のサンプル取得部222は、下記の数式のように、事前分布からサンプルを取り出す。

Figure 0006853955
The first sample acquisition unit 222 extracts a sample from the prior distribution as shown in the following mathematical formula.
Figure 0006853955

したがって、第1のサンプル取得部222は、人流シミュレータ210へのパラメータのN個のサンプル{θ}(i=1〜N)を取得する。この取得したパラメータのN個のサンプル{θ}は、処理情報310として記憶装置300に保存される。 Therefore, the first sample acquisition unit 222 acquires N samples {θ i } (i = 1 to N) of parameters to the human flow simulator 210. The N samples {θ i } of the acquired parameters are stored in the storage device 300 as processing information 310.

図8を参照して、シミュレーション実行部223の動作について説明する。 The operation of the simulation execution unit 223 will be described with reference to FIG.

図8に示されるように、記憶装置300は、前述したサンプルの個数Nと、パラメータのN個のサンプル{θ}と、を処理情報310として保存している。 As shown in FIG. 8, the storage device 300 stores the above-mentioned number N of samples and N sample {θ i } of parameters as processing information 310.

シミュレーション実行部223は、人流シミュレータ310にパラメータのサンプル{θ}をN 回入力して、人流シミュレータ310からN個の人口分布データ{y}(1≦i≦)を得る。この得られたN個の人口分布データ{yi}は、処理情報310として記憶装置300に保存される。 The simulation execution unit 223 inputs the parameter sample {θ i } into the human flow simulator 310 N times, and obtains N population distribution data {y i } (1 ≦ i ≦) from the human flow simulator 310. The obtained N population distribution data {yi} are stored in the storage device 300 as processing information 310.

図9を参照して、Kernel ABC 実行部(類似度算出部)224の動作について説明する。 The operation of the Kernel ABC execution unit (similarity calculation unit) 224 will be described with reference to FIG.

図9に示されるように、記憶装置300は、前述したN個の人口分布データ{y}と、前述した正解データyと、カーネル関数kと、正則化項δと、を処理情報310として保存している。 As shown in FIG. 9, the storage device 300 processes the above-mentioned N population distribution data {y i }, the above-mentioned correct answer data y * , the kernel function k, and the regularization term δ. It is saved as.

Kernel ABC 実行部224は、下記の数式で表される計算を行い、正解データと各シミュレーションされた人口分布データ{y}との類似度{w}(1≦i≦N)を得る。

Figure 0006853955
ここで、Gはグラム行列を示し、Iは単位行列を示す。この得られたN個の類似度{w}は、処理情報310として記憶装置300に保存される。 Kernel ABC execution unit 224 performs the calculation expressed by the following equation, the similarity between the solution data and the simulated population distribution data {y i} {w i} get (1 ≦ i ≦ N).
Figure 0006853955
Here, G represents a Gram matrix and I represents an identity matrix. The resulting N number of similarities {w i} is stored in the storage unit 300 as the processing information 310.

なお、本例では、類似度算出部として、Kernel ABCアルゴリズムにより前記類似度wを算出するKernel ABC 実行部224を用いているが、本発明はこれに限られない。すなわち、類似度算出部で使用するアルゴリズムは、後述する事後分布のカーネル平均が構築できるようにN個の類似度{w}を出力するアルゴリズムなら何でも構わない。 In this example, as the similarity calculation unit, is used a Kernel ABC execution unit 224 for calculating the degree of similarity w i by Kernel ABC algorithm, the present invention is not limited thereto. In other words, the algorithm used by the similarity calculation unit may whatever the N similarity algorithm for outputting a {w i} so build the kernel average of the posterior distribution, which will be described later.

図10を参照して、カーネル平均構築部225の動作について説明する。 The operation of the kernel average construction unit 225 will be described with reference to FIG.

図10に示されるように、記憶装置300は、前述したパラメータのN個のサンプル{θ}と、前述したN個の類似度{w}と、前述したカーネル関数kと、を処理情報310として保存している。 As shown in FIG. 10, the storage device 300 includes a sample {theta i} of N parameters described above, and the N similarities described above {w i}, process information, and a kernel function k described above It is stored as 310.

カーネル平均構築部225は、下記の数式で表される計算を行ない、事後分布のカーネル平均μを得る。

Figure 0006853955
この得られたカーネル平均μは、処理情報310として記憶装置300に保存される。 The kernel average construction unit 225 performs the calculation represented by the following formula to obtain the kernel average μ of the posterior distribution.
Figure 0006853955
The obtained kernel average μ is stored in the storage device 300 as processing information 310.

図11を参照して、第2のサンプル取得部226の動作について説明する。第2のサンプル取得部226は、「事後分布からのサンプル取得部」とも呼ばれる。この第2のサンプル取得部226は、上述したKernel Herdingを実行する。 The operation of the second sample acquisition unit 226 will be described with reference to FIG. The second sample acquisition unit 226 is also referred to as a "sample acquisition unit from the posterior distribution". The second sample acquisition unit 226 executes the above-mentioned Kernel Herding.

図11に示されるように、記憶装置300には、前述したカーネル平均μと、前述したカーネル関数kと、取り出すサンプル数Tと、を処理情報310として保存している。 As shown in FIG. 11, the storage device 300 stores the above-mentioned kernel average μ, the above-mentioned kernel function k, and the number of samples T to be taken out as processing information 310.

第2のサンプル取得部226は、以下の数式で現れる誤差を最小化する計算を行って、新たなパラメータのT個のサンプル{θ}(1≦t≦T)を得る。

Figure 0006853955
この得られた新たなパラメータのT個のサンプル{θ}は、処理情報310として記憶装置300に保存される。 The second sample acquisition unit 226 performs a calculation that minimizes the error appearing in the following mathematical formula to obtain T samples {θ t } (1 ≦ t ≦ T) of new parameters.
Figure 0006853955
The T samples {θ t } of the obtained new parameters are stored in the storage device 300 as processing information 310.

最後に、図12を参照して、サンプル評価部227の動作について説明する。 Finally, the operation of the sample evaluation unit 227 will be described with reference to FIG.

図12に示されるように、記憶装置300には、前述した新たなパラメータのT個のサンプル{θ}と、前述した前述した正解データyと、閾値εと、を処理情報310として保存している。 As shown in FIG. 12, in the storage device 300, T samples {θ t } of the above-mentioned new parameters, the above-mentioned correct answer data y *, and the above-mentioned threshold value ε are stored as processing information 310. doing.

サンプル評価部227は、先ず、新たなパラメータのT個のサンプル{θ}から適当なサンプルθを選び、その選択したサンプルθを人流シミュレータ210へ供給する。それにより、サンプル評価部227は、人流シミュレータ210から新たな人口分布データyを取得する。引き続いて、サンプル評価部22は、下記の式が満たされているか否かを判断する。

Figure 0006853955
すなわち、サンプル評価部227は、新たな人口分布データyと正解データyとの差分||y−y||が、閾値εより小さいか否かを判断する。上記式が満たされていれば、サンプル評価部227は、選択したサンプルθを推定された人流パターンを規定する真のパラメータとして推定し出力し、処理を終了する。 First, the sample evaluation unit 227 selects an appropriate sample θ k from T samples {θ t } with new parameters, and supplies the selected sample θ k to the human flow simulator 210. As a result, the sample evaluation unit 227 acquires new population distribution data y k from the human flow simulator 210. Subsequently, the sample evaluation unit 22 determines whether or not the following equation is satisfied.
Figure 0006853955
That is, the sample evaluation unit 227, the difference || y k -y * || with the new population distribution data y k correct answer data y * is, determines whether the difference is less than a threshold value epsilon. If the above equation is satisfied, the sample evaluation unit 227 estimates and outputs the selected sample θ k as a true parameter that defines the estimated human flow pattern, and ends the process.

一方、上記式が満たされなかった場合、シミュレーション実行部223での動作に戻る。 On the other hand, if the above equation is not satisfied, the operation returns to the operation in the simulation execution unit 223.

もしくは、第1のサンプル取得部222での動作に戻る。このとき、スパース性が十分に入っていなければ、第1のサンプル評価部222の入力であるハイパーパラメータηも変更されるものとする(ARD)。 Alternatively, the operation returns to the operation of the first sample acquisition unit 222. At this time, if the sparsity is not sufficiently contained, the hyperparameter η which is the input of the first sample evaluation unit 222 is also changed (ARD).

次に、図13のフローチャートを参照して、具体例を挙げながら、人流パターン推定システム100の動作の一実施例について説明する。 Next, an embodiment of the operation of the human flow pattern estimation system 100 will be described with reference to the flowchart of FIG. 13 with reference to a specific example.

先ず、データ入力部221は、地図情報と施設情報とを人流シミュレータ210に設定する(ステップS101)。 First, the data input unit 221 sets the map information and the facility information in the human flow simulator 210 (step S101).

具体的には、データ入力部221は、人流シミュレータ210に銀座などのマップを与える。 Specifically, the data input unit 221 gives a map of Ginza or the like to the human flow simulator 210.

次に、第1のサンプル取得部222は、ハイパーパラメータηに基づいて事前分布Pからサンプルを取り出し、人流シミュレータ210へ入力すべきパラメータのN個のサンプル{θ}を取得する(ステップS102)。 Next, the first sample acquisition unit 222 extracts a sample from the prior distribution P based on the hyperparameter η, and acquires N samples {θ i } of the parameters to be input to the human flow simulator 210 (step S102). ..

具体的には、第1のサンプル取得部222は、銀座マップにおいてシミュレーションする人口集団を制御するパラメータθのサンプルを、例えば1000個取ってくる(N=1000)。 Specifically, the first sample acquisition unit 222 fetches, for example, 1000 samples of the parameter θ that controls the population to be simulated in the Ginza map (N = 1000).

例えば、一つのパラメータθは、以下のような要素で構成される。銀座を訪れるサラリーマンの集団を考えると、パラメータθは、集団の人数、彼らが銀座を訪れる時刻、彼らが銀座を出ていく時刻、銀座で立ち寄る店舗の位置情報、その店舗での滞在時間などである。ハイパーパラメータηは、それを調整することによって余分なパラメータを削除することができる。例えば、銀座には、コンビニエンスストアしか立ち寄らない集団は来ないといった推定がこれによってできる。 For example, one parameter θ is composed of the following elements. Considering a group of salaried workers visiting Ginza, the parameter θ is the number of people in the group, the time when they visit Ginza, the time when they leave Ginza, the location information of the store they stop at, the time spent at that store, etc. is there. The hyperparameter η can remove extra parameters by adjusting it. For example, it can be estimated that there will be no group in Ginza that only stops at convenience stores.

引き続いて、シミュレーション実行部223は、パラメータのサンプル{θ}を、人流シミュレータ210にN回入力して、N個の人口分布データ{y}を得る(ステップS103)。 Subsequently, the simulation execution unit 223 inputs the parameter sample {θ i } into the human flow simulator 210 N times to obtain N population distribution data {y i } (step S103).

具体的には、シミュレーション実行部223は、ステップS102で得られた一つ一つのパラメータのサンプルに関して、シミュレーションを行う。あるパラメータ集合のサンプルでは、集団の人数が1000人かもしれず、別のサンプルでは2000人かもしれないといった違いがある。ステップS002 で、1000個のパラメータ集合を取ってきたので、シミュレーション実行部223は1000回のシミュレーションを行う。そして、人流シミュレータ210から、そのシミュレーションされた人口分布データyを取得する。 Specifically, the simulation execution unit 223 performs a simulation with respect to the sample of each parameter obtained in step S102. The difference is that in one sample of the parameter set, the population may be 1000, and in another sample it may be 2000. Since the set of 1000 parameters has been fetched in step S002, the simulation execution unit 223 performs the simulation 1000 times. Then, the simulated population distribution data y i is acquired from the human flow simulator 210.

次に、Kernel ABC 実行部(類似度算出部)224は、上記数10の計算を行い、正解データyと各シミュレーションされた人口分布データ{y}との類似度{w}を得る(ステップS104)。 Next, Kernel ABC execution unit (similarity calculation unit) 224 performs the calculation of Equation 10 to obtain the similarity between the solution data y * and the simulated population distribution data {y i} {w i} (Step S104).

具体的には、Kernel ABC 実行部224は、銀座で1000個の違った形でシミュレーションされたデータyを、銀座の正解データy と比べる。この比較により、正解データyとシミュレーションからのデータyとの類似度wが計算される。Kernel ABC 実行部224は、この類似度wをもとに、シミュレーションされたデータに紐づいているパラメータのサンプルθのもっともらしさを決定する。 Specifically, the Kernel ABC execution unit 224 compares 1000 differently simulated data y i in Ginza with the correct answer data y * in Ginza. This comparison similarity w i of the data y i from the correct answer data y * and the simulation is computed. Kernel ABC execution unit 224, on the basis of this similarity w i, to determine the plausibility of the sample θ i of the parameters that are tied to simulated data.

引き続いて、カーネル平均構築部225は、上記数11に従って、事後分布のカーネル平均μを計算する(ステップS105)。 Subsequently, the kernel average construction unit 225 calculates the kernel average μ of the posterior distribution according to the above equation 11 (step S105).

具体的には、カーネル平均構築部225は、ステップS104で計算された類似度wを元に、パラメータのサンプルθに関して、事後分布のカーネル平均μを構築する。これは、事前分布からのサンプルθを元に、類似度wを使い重みを再調整し、確率分布を再生核ヒルベルト空間上で構築することに相当する。 Specifically, the kernel average construction unit 225, based on the calculated degree of similarity w i at step S104, with respect to samples theta i of parameters to build the kernel average μ of the posterior distribution. This is, on the basis of the sample θ i from the prior distribution, and re-adjust the weights use the similarity w i, equivalent to construct a probability distribution on the reproducing kernel Hilbert space.

次に、第2のサンプル取得部226は、上記数12の誤差を最小化する計算を行なって、新たなパラメータのT個のサンプル{θ}を取得する(ステップS106)。 Next, the second sample acquisition unit 226 acquires T samples {θ t } of new parameters by performing a calculation that minimizes the error of the above equation (12) (step S106).

具体的には、第1のサンプル取得部226は、事後分布のカーネル平均μからのサンプリングを行う。このとき、サンプルされるのは新たなパラメータのサンプルθだが、ステップS102において取得したパラメータのサンプルθとは違い、正解データyを生み出すようなパラメータのサンプルが求められる。 Specifically, the first sample acquisition unit 226 performs sampling from the kernel average μ of the posterior distribution. At this time, a new parameter sample θ t is sampled, but unlike the parameter sample θ i acquired in step S102, a parameter sample that produces correct answer data y * is required.

引き続いて、サンプル評価部227は、新たなパラメータのT個のサンプル{θ}を評価する(ステップS107)。 Subsequently, the sample evaluation unit 227 evaluates T samples {θ t } of the new parameter (step S107).

具体的には、サンプル評価部227は、ステップ106で求められたパラメータ集合{θ}(1≦t≦T)のなかからパラメータθを一つ適当に選び、それを人流シミュレータ210に入力し、データyを獲得する。そして、サンプル評価部227は、獲得したデータyを正解データyと比べることで、パラメータの確からしさを評価する。選択したパラメータθが充分に確からしい場合、サンプル評価部227は、それを銀座における人流推定値とする(ステップS108)。 Specifically, the sample evaluation unit 227 appropriately selects one parameter θ k from the parameter set {θ t } (1 ≦ t ≦ T) obtained in step 106, and inputs it to the human flow simulator 210. And acquire the data y k. Then, the sample evaluation unit 227 evaluates the certainty of the parameters by comparing the acquired data y k with the correct answer data y *. If the selected parameter θ k is sufficiently certain, the sample evaluation unit 227 uses it as the estimated value of human flow in Ginza (step S108).

そのパラメータθには、銀座にどういった集団が、どこから来て、どこに滞在し、どこから帰っていくかという情報が含まれている。パラメータθの確からしさが満足のいくものでない場合(ステップS107のNo)、人流パターン推定システム100は、もう一度、ステップS103もしくはステップS102から動作を繰り返す。 The parameter θ k contains information on what kind of group comes from, where they stay, and where they return from Ginza. If the certainty of the parameter θ k is not satisfactory (No in step S107), the human flow pattern estimation system 100 repeats the operation from step S103 or step S102 once again.

次に、人流パターン推定システム100を実行した場合の実験結果について説明する。 Next, the experimental results when the human flow pattern estimation system 100 is executed will be described.

ここでは、図14に示すように、銀座の4meshモデルの実験を設定した。本例では、(2×2)の4つのメッシュに分割されているが、実際の例では、例えば、5×5=25メッシュに分割されることに注意されたい。図示の例では、4つのメッシュは、(0,0)、(0,1)、(1,0)、および(1,1)の領域から成る。時刻は、900〜17:00で30分間隔とした。 Here, as shown in FIG. 14, an experiment of a 4 mesh model in Ginza was set. In this example, it is divided into 4 meshes (2 × 2), but in the actual example, it should be noted that it is divided into 5 × 5 = 25 meshes, for example. In the illustrated example, the four meshes consist of regions (0,0), (0,1), (1,0), and (1,1). The time was 900 to 17:00 with an interval of 30 minutes.

図15に示すような、5つのルールを設定した。そのため、推定パラメータの次元は、(Start, Goal, Transit×2, Stay×2, T, N)×5ルールで、40次元となる。ここで、Tは集団の出発時刻を示し、Nは集団の人数を示す。なお、この各ルールにおいて、Nはパラメータθのサンプル数Nとは異なり、Tは新たなパラメータのサンプル数Tとは異なることに注意されたい。 Five rules were set as shown in FIG. Therefore, the dimension of the estimation parameter is 40 dimensions according to the (Start, Goal, Transit × 2, Stay × 2, T, N) × 5 rule. Here, T indicates the departure time of the group, and N indicates the number of people in the group. Note that in each of these rules, N is different from the number of samples N of the parameter θ, and T is different from the number of samples T of the new parameter.

図16は、図14に示した銀座の4meshモデルの実験結果を示す。図16において、左側のKernel ABCの図は、シミュレーション実行部223およびKernel ABC 実行部224のみを1回だけ実行した場合の、各メッシュでの人口分布の変化を示している。真ん中のKernel Herding (1st)の図は、シミュレーション実行部223、Kernel ABC 実行部224、カーネル平均構築部225、および第2のサンプル取得部226を1回だけ実行した場合の、各メッシュでの人口分布の変化を示している。右側のKernel Herding (2nd)の図は、シミュレーション実行部223、Kernel ABC 実行部224、カーネル平均構築部225、および第2のサンプル取得部226を2回実行した場合の、各メッシュでの人口分布の変化を示している。 FIG. 16 shows the experimental results of the 4 mesh model of Ginza shown in FIG. In FIG. 16, the figure of Kernel ABC on the left side shows the change in the population distribution in each mesh when only the simulation execution unit 223 and the Kernel ABC execution unit 224 are executed once. The middle Kernel Herding (1 st ) diagram shows each mesh when the simulation execution unit 223, the Kernel ABC execution unit 224, the kernel average construction unit 225, and the second sample acquisition unit 226 are executed only once. It shows changes in population distribution. The figure of Kernel Herding (2nd) on the right shows the population distribution in each mesh when the simulation execution unit 223, Kernel ABC execution unit 224, kernel average construction unit 225, and second sample acquisition unit 226 are executed twice. Shows a change in.

図16から、Kernel ABCだけよりも(Kernel ABC + Kernel Herding)の方が、より正解データに近い人口分布を持つ推定結果が得られることが分かる。また、(Kernel ABC + Kernel Herding)を1回実行するよりも(Kernel ABC + Kernel Herding)を2回実行する方が、より正解データに近い人口分布を持つ推定結果が得られることが分かる。 From FIG. 16, it can be seen that the estimation result with the population distribution closer to the correct answer data can be obtained by (Kernel ABC + Kernel Herding) than by Kernel ABC alone. In addition, it can be seen that the estimation result having the population distribution closer to the correct answer data can be obtained by executing (Kernel ABC + Kernel Herding) twice than by executing (Kernel ABC + Kernel Herding) once.

尚、上記実施の形態において、機械学習装置220の各部は、ハードウェアとソフトウェアとの組み合わせを用いて実現可能である。ハードウェアとソフトウェアとを組み合わせた形態では、プログラムメモリ320に人流パターン推定プログラムが格納され、該人流パターン推定プログラムに基づいて機械学習装置220のハードウェアを動作させることによって、各部を各種手段として実現する。また、該人流パターン推定プログラムは、記録媒体に記録されて頒布されても良い。当該記録媒体に記録された人流パターン推定プログラムは、有線、無線、又は記録媒体そのものを介して、メモリに読込まれ、処理部等を動作させる。尚、記録媒体を例示すれば、オプティカルディスクや磁気ディスク、半導体メモリ装置、ハードディスクなどが挙げられる。 In the above embodiment, each part of the machine learning device 220 can be realized by using a combination of hardware and software. In the form of combining hardware and software, a human flow pattern estimation program is stored in the program memory 320, and each part is realized as various means by operating the hardware of the machine learning device 220 based on the human flow pattern estimation program. To do. Further, the human flow pattern estimation program may be recorded on a recording medium and distributed. The human flow pattern estimation program recorded on the recording medium is read into the memory via wired, wireless, or the recording medium itself, and operates the processing unit or the like. Examples of recording media include optical disks, magnetic disks, semiconductor memory devices, hard disks, and the like.

上記実施の形態を別の表現で説明すれば、機械学習装置220として動作させるコンピュータを、プログラムメモリ320に格納された人流パターン推定プログラムに基づき、データ入力部221、第1のサンプル取得部222、シミュレーション実行部223、Kernel ABC 実行部(類似度算出部)224、カーネル平均構築部225、第2のサンプル取得部226、およびサンプル評価部227として動作させることで実現することが可能である。 To explain the above embodiment in another expression, the computer operated as the machine learning device 220 is based on the human flow pattern estimation program stored in the program memory 320, and the data input unit 221 and the first sample acquisition unit 222. This can be achieved by operating as the simulation execution unit 223, the Kernel ABC execution unit (similarity calculation unit) 224, the kernel average construction unit 225, the second sample acquisition unit 226, and the sample evaluation unit 227.

以上、本発明の実施の形態および実施例を、図面を参照しつつ説明してきたが、当業者であれば、他の類似する実施形態および実施例を使用することができること、また、本発明から逸脱することなく適宜形態の変更又は追加を行うことができることに留意すべきである。 Although embodiments and examples of the present invention have been described above with reference to the drawings, those skilled in the art can use other similar embodiments and examples, and from the present invention. It should be noted that the form can be changed or added as appropriate without deviation.

本発明は、尤度関数が評価できない場合に最尤法によりパラメータを推定する分野に適用可能である。例えば、本発明は、金融時系列の分散を表すモデルのパラメータや、生物の個体数の時間発展を記述するモデルのパラメータ、遺伝的多様性を実現するようなモデルのパラメータを推定する分野にも適用可能である。 The present invention is applicable to the field of estimating parameters by the maximum likelihood method when the likelihood function cannot be evaluated. For example, the present invention is also used in the field of estimating model parameters that represent the variance of financial time series, model parameters that describe the time evolution of an organism's population, and model parameters that realize genetic diversity. Applicable.

100 人流パターン推定システム
200 データ処理装置
210 人流シミュレータ
220 機械学習装置
221 データ入力部
222 第1のサンプル取得部(事前分布からのサンプル取得部)
223 シミュレーション実行部
224 Kernel ABC 実行部(類似度算出部)
225 カーネル平均構築部
226 第2のサンプル取得部(事後分布からのサンプル取得部)
227 サンプル評価部
300 記憶装置
310 処理情報
320 プログラム
400 入力装置
500 出力装置
100 Human flow pattern estimation system 200 Data processing device 210 Human flow simulator 220 Machine learning device 221 Data input unit 222 First sample acquisition unit (sample acquisition unit from prior distribution)
223 Simulation execution unit 224 Kernel ABC execution unit (similarity calculation unit)
225 Kernel average construction part 226 Second sample acquisition part (sample acquisition part from posterior distribution)
227 Sample evaluation unit 300 Storage device 310 Processing information 320 Program 400 Input device 500 Output device

Claims (11)

街中における人流グループ単位での動きである人流パターンを推定する人流パターン推定システムであって、
前記街中の地図情報および施設情報が組み込まれ、前記人流パターンを規定するパラメータθのサンプルから各地点、各時刻での人口分布データyを出力する人流シミュレータと、
前記人流シミュレータに設定する前記パラメータθを、繰り返し学習により決定する機械学習装置と、
を備え、
前記機械学習装置は、
事前分布Pから前記パラメータθのN(Nは2以上の整数)個のサンプルθ(1≦i≦N)を取得する第1のサンプル取得部と、
前記N個のサンプルθを順次前記人流シミュレータに供給することで、それぞれ、前記人流シミュレータから各地点、各時刻でのN個の人口分布データyを取得するシミュレーション実行部と、
カーネル関数kを用いて、前記N個の人口分布データyと各地点、各時刻での真の人口分布を表す正解データyとの間のN個の類似度wを算出する類似度算出部と、
該N個の類似度wと、前記N個のサンプルθと、前記カーネル関数kとから、事後分布のカーネル平均μを構築するカーネル平均構築部と、
前記カーネル平均μと前記カーネル関数kとから、パラメータθのT(Tは2以上の整数)個の新たなサンプルθ(1≦t≦T)を取得する第2のサンプル取得部と、
該T個の新たなサンプルθから選択した1つのサンプルθを前記人流シミュレータに供給することによって前記人流シミュレータから得られた新たな人口分布データyと前記正解データyとの間の差分||y−y||が、所定の閾値εより小さいか否かを判断するサンプル評価部と、
を備え、
前記サンプル評価部は、前記差分||y−y||が前記所定の閾値εより小さいと判断した場合に、前記選択したサンプルθを、前記人流パターンを規定するパラメータθとして推定し、出力することを特徴とする人流パターン推定システム。
It is a people flow pattern estimation system that estimates the people flow pattern, which is the movement of each person flow group in the city.
A people flow simulator that incorporates map information and facility information in the city and outputs population distribution data y at each point and time from a sample of the parameter θ that defines the people flow pattern.
A machine learning device that determines the parameter θ set in the human flow simulator by iterative learning, and
With
The machine learning device
A first sample acquisition unit that acquires N (N is an integer of 2 or more) samples θ i (1 ≦ i ≦ N) of the parameter θ from the prior distribution P, and
By sequentially supplying the N samples θ i to the human flow simulator, a simulation execution unit for acquiring N population distribution data y i at each point and time from the human flow simulator, respectively.
Using a kernel function k, said N population distribution data y i and each point, the N similarity calculating the similarity w i between the correct answer data y * representing the true population distribution at each time Calculation part and
The N number of similarities w i, wherein the N samples theta i, from said kernel function k, and the kernel average construction unit for constructing a kernel mean μ of the posterior distribution,
A second sample acquisition unit that acquires T (T is an integer of 2 or more) new samples θ t (1 ≦ t ≦ T) of the parameter θ from the kernel average μ and the kernel function k.
Between the new population distribution data y k obtained from the human flow simulator and the correct answer data y * by supplying one sample θ k selected from the T new samples θ t to the human flow simulator. difference || y k -y * || is, a sample evaluation unit to determine a smaller or not a predetermined threshold epsilon,
With
The sample evaluation unit, if the difference || y k -y * || determines that the smaller a predetermined threshold epsilon, the sample theta k of said selected estimates as a parameter theta defining the pedestrian flow pattern , A human flow pattern estimation system characterized by outputting.
前記第1のサンプル取得部は、前記事前分布Pのハイパーパラメータηを調整しながら、前記N個のサンプルθを取得する、請求項1に記載の人流パターン推定システム。 The human flow pattern estimation system according to claim 1, wherein the first sample acquisition unit acquires the N samples θ i while adjusting the hyperparameter η of the prior distribution P. 前記類似度算出部は、Kernel ABCアルゴリズムにより前記N個の類似度wを算出するKernel ABC 実行部から成る、請求項1又は2に記載の人流パターン推定システム。 The similarity calculation unit consists Kernel ABC execution unit for calculating the N similarities w i by Kernel ABC algorithm, pedestrian flow pattern estimation system according to claim 1 or 2. 前記Kernel ABC 実行部は、前記カーネル関数kと、グラム行列Gと、正規化項δとを用いて、前記N個の人口分布データyと前記正解データyとの間の前記N個の類似度wを算出する、請求項3に記載の人流パターン推定システム。 The Kernel ABC execution unit uses the kernel function k, the Gram matrix G, and the normalization term δ to generate the N numbers between the N population distribution data y i and the correct answer data y *. the similarity is calculated w i, pedestrian flow pattern estimation system according to claim 3. 前記カーネル平均構築部は、前記N個のサンプルθを元に、前記N個の類似度wと前記カーネル関数kとを使い重みを再調整し、確率分布を表す前記カーネル平均μを再生核ヒルベルト空間上で構築する、請求項1乃至4のいずれか1項に記載の人流パターン推定システム。 The kernel average building unit, based on the N samples theta i, reproducing the N readjusting similarity w i of the weight using a kernel function k, the kernel average μ representing a probability distribution The human flow pattern estimation system according to any one of claims 1 to 4, which is constructed on a nuclear Hilbert space. 前記第2のサンプル取得部は、前記カーネル関数k、前記新たなサンプルθおよび前記取り出すサンプル数Tと、前記カーネル平均μとの間で求められる誤差を最小化する計算を行なって、前記新たなサンプルθを取得する、請求項1乃至5のいずれか1項に記載の人流パターン推定システム。 The second sample acquisition unit performs a calculation that minimizes the error obtained between the kernel function k, the new sample θ t, the number of samples T to be taken out, and the kernel average μ, and performs the new calculation. The human flow pattern estimation system according to any one of claims 1 to 5, which obtains a sample θ t. 前記サンプル評価部において、前記差分||y−y||が前記所定の閾値εより大きいと判断された場合に、前記シミュレーション実行部、前記類似度算出部、前記カーネル平均構築部、第2のサンプル取得部、および前記サンプル評価部の動作を繰り返す、請求項1乃至6のいずれか1項に記載の人流パターン推定システム。 In the sample evaluation unit, wherein when the difference || y k -y * || is determined to greater than said predetermined threshold epsilon, the simulation executing unit, the similarity calculation unit, the kernel average construction unit, the The human flow pattern estimation system according to any one of claims 1 to 6, wherein the operations of the sample acquisition unit 2 and the sample evaluation unit are repeated. 前記サンプル評価部において、前記差分||y−y||が前記所定の閾値εより大きいと判断された場合に、前記第1のサンプル取得部、前記シミュレーション実行部、前記類似度算出部、前記カーネル平均構築部、第2のサンプル取得部、および前記サンプル評価部の動作を繰り返す、請求項1乃至6のいずれか1項に記載の人流パターン推定システム。 In the sample evaluation unit, wherein when the difference || y k -y * || is determined to greater than said predetermined threshold epsilon, the first sample acquisition unit, the simulation executing unit, the similarity calculation unit The human flow pattern estimation system according to any one of claims 1 to 6, wherein the operations of the kernel average construction unit, the second sample acquisition unit, and the sample evaluation unit are repeated. 前記繰り返す動作を行なう前に、前記パラメータθの冗長性をコントロールしたい場合、前記第1のサンプル取得部は、前記事前分布Pのハイパーパラメータηを調整する、請求項8に記載の人流パターン推定システム。 The human flow pattern estimation according to claim 8, wherein if it is desired to control the redundancy of the parameter θ before performing the repeating operation, the first sample acquisition unit adjusts the hyperparameter η of the prior distribution P. system. 街中における人流グループ単位での動きである人流パターンを推定する人流パターン推定システムにおける、前記街中の地図情報および施設情報が組み込まれ、前記人流パターンを規定するパラメータθのサンプルから各地点、各時刻での人口分布データyを出力する人流シミュレータを用いて、前記人流シミュレータに設定する前記パラメータθを、繰り返し学習により決定する人流パターン推定方法であって、
第1のサンプル取得部が、事前分布Pから前記パラメータθのN(Nは2以上の整数)個のサンプルθ(1≦i≦N)を取得し、
シミュレーション実行部が、前記N個のサンプルθを順次前記人流シミュレータに供給することで、それぞれ、前記人流シミュレータから各地点、各時刻でのN個の人口分布データyを取得し、
類似度算出部が、カーネル関数kを用いて、前記N個の人口分布データyと各地点、各時刻での真の人口分布を表す正解データyとの間のN個の類似度wを算出し、
カーネル平均構築部が、前記N個の類似度wと、前記N個のサンプルθと、前記カーネル関数kとから、事後分布のカーネル平均μを構築し、
第2のサンプル取得部が、前記カーネル平均μと前記カーネル関数kとから、パラメータθのT(Tは2以上の整数)個の新たなサンプルθ(1≦t≦T)を取得し、
サンプル評価部が、前記T個の新たなサンプルθから選択した1つのサンプルθを前記人流シミュレータに供給することによって前記人流シミュレータから得られた新たな人口分布データyと前記正解データyとの間の差分||y−y||が、所定の閾値εより小さいか否かを判断し、
前記サンプル評価部は、前記差分||y−y||が前記所定の閾値εより小さいと判断した場合に、前記選択したサンプルθを、前記人流パターンを規定するパラメータθとして推定し、出力することを特徴とする人流パターン推定方法。
In the people flow pattern estimation system that estimates the people flow pattern, which is the movement of the people flow group in the city, the map information and facility information in the city are incorporated, and from the sample of the parameter θ that defines the people flow pattern, at each point and at each time. This is a method of estimating a human flow pattern in which the parameter θ set in the human flow simulator is determined by iterative learning using a human flow simulator that outputs the population distribution data y of the above.
The first sample acquisition unit acquires N (N is an integer of 2 or more) samples θ i (1 ≦ i ≦ N) of the parameter θ from the prior distribution P.
The simulation execution unit sequentially supplies the N samples θ i to the human flow simulator, thereby acquiring N population distribution data y i at each point and time from the human flow simulator, respectively.
Using the kernel function k, the similarity calculation unit uses the kernel function k to provide N similarity w between the N population distribution data y i and the correct answer data y * representing the true population distribution at each point and time. Calculate i and
Kernel Mean construction unit is constructed the N number of similarities w i, wherein the N samples theta i, from said kernel function k, the kernel mean μ of the posterior distribution,
The second sample acquisition unit acquires T (T is an integer of 2 or more) of new samples θ t (1 ≦ t ≦ T) of the parameter θ from the kernel average μ and the kernel function k.
The new population distribution data y k and the correct answer data y k obtained from the human flow simulator by the sample evaluation unit supplying one sample θ k selected from the T new samples θ t to the human flow simulator. * difference || y k -y * || between is determined whether smaller or not a predetermined threshold epsilon,
The sample evaluation unit, if the difference || y k -y * || determines that the smaller a predetermined threshold epsilon, the sample theta k of said selected estimates as a parameter theta defining the pedestrian flow pattern , A method for estimating a human flow pattern, which is characterized by outputting.
街中における人流グループ単位での動きである人流パターンを推定する人流パターン推定システムにおいて、前記街中の地図情報および施設情報が組み込まれ、前記人流パターンを規定するパラメータθのサンプルから各地点、各時刻での人口分布データyを出力する人流シミュレータを用いて、コンピュータに、前記人流シミュレータに設定する前記パラメータθを、繰り返し学習により決定させる人流パターン推定プログラムであって、前記コンピュータに、
事前分布Pから前記パラメータθのN(Nは2以上の整数)個のサンプルθ(1≦i≦N)を取得する第1のサンプル取得手順と、
前記N個のサンプルθを順次前記人流シミュレータに供給することで、それぞれ、前記人流シミュレータから各地点、各時刻でのN個の人口分布データyを取得するシミュレーション実行手順と、
カーネル関数kを用いて、前記N個の人口分布データyと各地点、各時刻での真の人口分布を表す正解データyとの間のN個の類似度wを算出する類似度算出手順と、
該N個の類似度wと、前記N個のサンプルθと、前記カーネル関数kとから、事後分布のカーネル平均μを構築するカーネル平均構築手順と、
前記カーネル平均μと前記カーネル関数kとから、パラメータθのT(Tは2以上の整数)個の新たなサンプルθ(1≦t≦T)を取得する第2のサンプル取得手順と、
該T個の新たなサンプルθから選択した1つのサンプルθを前記人流シミュレータに供給することによって前記人流シミュレータから得られた新たな人口分布データyと前記正解データyとの間の差分||y−y||が、所定の閾値εより小さいか否かを判断するサンプル評価手順と、
を実行させ、
前記サンプル評価手順は、前記コンピュータに、前記差分||y−y||が前記所定の閾値εより小さいと判断した場合に、前記選択したサンプルθを、前記人流パターンを規定するパラメータθとして推定させ、出力させることを特徴とする人流パターン推定プログラム。
In the people flow pattern estimation system that estimates the people flow pattern, which is the movement of the people flow group in the city, the map information and facility information in the city are incorporated, and from the sample of the parameter θ that defines the people flow pattern, at each point and at each time. This is a human flow pattern estimation program that causes a computer to determine the parameter θ set in the human flow simulator by iterative learning by using a human flow simulator that outputs the population distribution data y of the above.
The first sample acquisition procedure for acquiring N (N is an integer of 2 or more) samples θ i (1 ≦ i ≦ N) of the parameter θ from the prior distribution P, and
A simulation execution procedure for acquiring N population distribution data y i at each point and time from the human flow simulator by sequentially supplying the N samples θ i to the human flow simulator.
Using a kernel function k, said N population distribution data y i and each point, the N similarity calculating the similarity w i between the correct answer data y * representing the true population distribution at each time Calculation procedure and
The N number of similarities w i, wherein the N samples theta i, from said kernel function k, and kernel average building procedure for building the kernel average μ of the posterior distribution,
A second sample acquisition procedure for acquiring T (T is an integer of 2 or more) new samples θ t (1 ≦ t ≦ T) of the parameter θ from the kernel average μ and the kernel function k.
Between the new population distribution data y k obtained from the human flow simulator and the correct answer data y * by supplying one sample θ k selected from the T new samples θ t to the human flow simulator. difference || y k -y * || is, a sample evaluation procedure to determine a smaller or not a predetermined threshold epsilon,
To execute,
The sample evaluation procedure, the computer, if the difference || y k -y * || determines that the smaller a predetermined threshold epsilon, the sample theta k of said selected, parameters defining the pedestrian flow pattern A human flow pattern estimation program characterized by estimating as θ and outputting it.
JP2017193244A 2017-10-03 2017-10-03 People flow pattern estimation system, people flow pattern estimation method and people flow pattern estimation program Active JP6853955B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017193244A JP6853955B2 (en) 2017-10-03 2017-10-03 People flow pattern estimation system, people flow pattern estimation method and people flow pattern estimation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017193244A JP6853955B2 (en) 2017-10-03 2017-10-03 People flow pattern estimation system, people flow pattern estimation method and people flow pattern estimation program

Publications (2)

Publication Number Publication Date
JP2019067224A JP2019067224A (en) 2019-04-25
JP6853955B2 true JP6853955B2 (en) 2021-04-07

Family

ID=66340645

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017193244A Active JP6853955B2 (en) 2017-10-03 2017-10-03 People flow pattern estimation system, people flow pattern estimation method and people flow pattern estimation program

Country Status (1)

Country Link
JP (1) JP6853955B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111080501B (en) * 2019-12-06 2024-02-09 中国科学院大学 Real crowd density space-time distribution estimation method based on mobile phone signaling data
WO2021161538A1 (en) 2020-02-14 2021-08-19 日本電信電話株式会社 Learning device, learning method, and learning program
CN113191553A (en) * 2021-05-06 2021-07-30 深圳市数字城市工程研究中心 Population space distribution estimation method and system based on building scale
JP7164762B1 (en) 2021-10-15 2022-11-01 楽天グループ株式会社 Information processing device, information processing method, and program

Also Published As

Publication number Publication date
JP2019067224A (en) 2019-04-25

Similar Documents

Publication Publication Date Title
Erickson et al. Comparison of Gaussian process modeling software
Kim et al. Data modeling versus simulation modeling in the big data era: case study of a greenhouse control system
JP6853955B2 (en) People flow pattern estimation system, people flow pattern estimation method and people flow pattern estimation program
Kewlani et al. A polynomial chaos approach to the analysis of vehicle dynamics under uncertainty
US20190019082A1 (en) Cooperative neural network reinforcement learning
US20180268286A1 (en) Neural network cooperation
Farah et al. Bayesian emulation and calibration of a dynamic epidemic model for A/H1N1 influenza
Ajdari et al. An adaptive exploration-exploitation algorithm for constructing metamodels in random simulation using a novel sequential experimental design
EP3716160A1 (en) Learning parameters of a probabilistic model comprising gaussian processes
JP6749282B2 (en) Human flow rate prediction device, human flow rate prediction method, and human flow rate prediction program
JP5071851B2 (en) Prediction device using time information, prediction method, prediction program, and recording medium recording the program
Prado et al. Bayesian additive regression trees with model trees
Clay et al. Towards real-time crowd simulation under uncertainty using an agent-based model and an unscented kalman filter
JP6853968B2 (en) Parameter estimation system, parameter estimation method and parameter estimation program
JP2023507139A (en) Hybrid Algorithm System and Method for Solving Discrete Quadratic Models
Shang et al. Short-term traffic flow prediction model using particle swarm optimization–based combined kernel function-least squares support vector machine combined with chaos theory
Batty Visually-driven urban simulation: Exploring fast and slow change in residential location
Bai et al. Characterization of groundwater contamination: A transformer-based deep learning model
Koduvely Learning Bayesian Models with R
JP6665071B2 (en) Person flow prediction device, person flow prediction method, and person flow prediction program
Griffin Sequential Monte Carlo methods for mixtures with normalized random measures with independent increments priors
JP6807822B2 (en) Human flow predictors, methods, and programs
Prabowo et al. Continually learning out-of-distribution spatiotemporal data for robust energy forecasting
JP2020190959A (en) Model generation device, system, parameter computation device, model generation method, parameter computation method, and program
Poornima et al. Prediction of Water Consumption Using Machine Learning Algorithm

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210225

R150 Certificate of patent or registration of utility model

Ref document number: 6853955

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350