JP2017033198A - 時空間変数予測装置及びプログラム - Google Patents

時空間変数予測装置及びプログラム Download PDF

Info

Publication number
JP2017033198A
JP2017033198A JP2015151299A JP2015151299A JP2017033198A JP 2017033198 A JP2017033198 A JP 2017033198A JP 2015151299 A JP2015151299 A JP 2015151299A JP 2015151299 A JP2015151299 A JP 2015151299A JP 2017033198 A JP2017033198 A JP 2017033198A
Authority
JP
Japan
Prior art keywords
variable
spatiotemporal
gaussian
unit
observation data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015151299A
Other languages
English (en)
Other versions
JP6397380B2 (ja
Inventor
真耶 大川
Maya Okawa
真耶 大川
宏 澤田
Hiroshi Sawada
宏 澤田
修功 上田
Shuko Ueda
修功 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015151299A priority Critical patent/JP6397380B2/ja
Publication of JP2017033198A publication Critical patent/JP2017033198A/ja
Application granted granted Critical
Publication of JP6397380B2 publication Critical patent/JP6397380B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】時間的及び空間的相関を持つ時空間変数の値を精度よく予測することができるようにする。
【解決手段】学習部16が、位置情報及び時間情報を有する入力変数に対する時空間変数の観測値を有する観測データの集合に基づいて、複数のガウス過程を、空間的な広がり及び時間的な広がりに対応する複数の階層で混合した階層混合ガウス過程でモデル化された、入力変数に対する時空間変数の値を予測するためのモデルに含まれる、複数のガウス過程の各々についての、観測データ同士の類似性を定義する関数であるカーネル関数の各々のハイパーパラメータと、観測データの各々に対する、複数のガウス過程の各々の寄与度を表すパラメータである負担率とを学習する。
【選択図】図1

Description

本発明は、時空間変数予測装置及びプログラムに関する。
従来の技術として、時空間変数の時系列データから、クリギングモデルを用いて未観測の時空間変数を推定あるいは予測する手法がある。いま、地理的・時間的広がりを持った空間内のN箇所{x,…,x}でN個の観測値{t,…,t}が得られたとする。クリギングモデルでは、新しい観測地点xにおける予測値tを確率分布として出力する。
クリギングモデルは、入力変数(位置、時間など)が似ているほど近い値を持つという仮定に基づいたモデルである。「似ている」ということの定義は問題設定に応じて任意に決めることができ、セミバリオグラム、コバリオグラムと呼ばれる関数で定義される。各種のモデル化に使用される代表的なセミバリオグラムの例として、ナゲット効果モデル、球形モデル、指数モデル、ガウスモデルなどが挙げられる。予測の前処理として、全データを用いてセミバリオグラム、コバリオグラムの選択とパラメータ推定を行う。モデルの選択とパラメータの推定には、全データの時空間変数のペアの差分について線形和をとった“経験バリオグラム”を用いる。
上記の定義に従ってデータ点から設計した経験バリオグラムに対しセミバリオグラムモデルの当てはめを行い、加重最小二乗法を用いてモデル選択とパラメータ推定を行う。予測に使用されるクリギングモデルとして単純クリギング、普遍クリギング、ブロッククリギングなどが提案されている。予測に用いるモデルは問題設定に応じて任意に決めることができる。これらのモデルは全て“時空間変数の確率場は本質的定常性あるいは本質的定常性に準ずる定常性を持つ"という仮定に基づいている。
本質的定常性とは、(1)時空間変数の平均値が入力変数(時間帯や地域)によらず一定で、かつ(2)任意の時空間変数のペアの分散がそれらの入力変数の類似度にのみ依存するという性質である。単純クリギングは時空間変数の確率場に本質的定常性を仮定したモデルであり、新しい入力変数{x}における時空間変数の予測値tは次式の平均、分散を持つガウス分布に従う。
Figure 2017033198
ここでγはコバリオグラム、Cは要素γ(x,x)+β−1δnmを持つN×Nの共分散行列である。ただしδnmはクロネッカーのデルタ、βは定数である。単純クリギングは、ガウス過程による回帰の一種とみなすことができる。ガウス過程では、コバリオグラムの代わりにカーネル関数が用いられる。定常性条件(2)は、「似ている」ということの定義が一意に決まるという仮定に対応している。
前述の通り、クリギングモデル(あるいはガウス過程による回帰)は、“「似ている」ということの定義が一意に決まる”という仮定に基づいて時空間変数の値を予測するものである。しかし、実際には「似ている」入力変数から時空間変数が受ける影響は、地域、時間帯など入力変数の特性によって異なるはずである。そこで、クリギングモデルの定常性の過程を緩め、局所非定常性を導入した混合ガウス過程が提案された。混合ガウス過程は、単一のガウス過程を複数個混合したモデルであり、複数のガウス過程の重ね合わせで表現される。混合ガウス過程では、新しい入力変数xにおける予測値tは次式の平均、分散を持つガウス分布に従う。
Figure 2017033198
p(z=r|x)はtがr個目の要素から生じた確率であり、負担率と呼ばれる。各入力変数の特性(地域や時間帯など)に応じてデータを複数のクラスタに分類し、クラスタごとにデータを最もよく説明するセミバリオグラムの選択、パラメータ推定を行う。各データ点が属するクラスタと各クラスタのパラメータはEMアルゴリズムを用いて同時に推定される(非特許文献1,非特許文献2参照)。
S. De Iaco, D.E. Myers, and D. Posa."Space-time analysis using a general product-sum model.", Statistics & Probability Letters, 52(1):p.21−28, 2001. Benedikt Gr¨aler, Lydia E. Gerharz, and Edzer J. Pebesma. "Spatio-temporal analysis and interpolation of PM10 measurements in Europe.", Technical report, ETC/ACM, 2012.
前述の通り、従来技術の混合ガウス過程は、入力変数の次元・個々の入力変数の性質の違いを考慮せず、入力データをクラスタに分類するものである。しかし、実際には時空間変数のクラスタは時間的・空間的な相関を持つはずである。従来技術では、時間的・空間的な相関を持つ現実世界の時空間変数分布を正確に予測することができないという問題が存在した。
本発明は、上記の点に鑑みてなされたものであり、時間的及び空間的相関を持つ時空間変数の値を精度よく予測することができる時空間変数予測装置及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明に係る時空間変数予測装置は、位置情報及び時間情報を有する入力変数に対する時空間変数の観測値を有する観測データの集合に基づいて、未観測の位置情報及び時間情報に対する時空間変数の値を予測する時空間変数予測装置であって、前記観測データの集合に基づいて、複数のガウス過程を、空間的な広がり及び時間的な広がりに対応する複数の階層で混合した階層混合ガウス過程でモデル化された、前記入力変数に対する時空間変数の値を予測するためのモデルに含まれる、前記複数のガウス過程の各々についての、前記観測データ同士の類似性を定義する関数であるカーネル関数の各々のハイパーパラメータと、前記観測データの各々に対する、前記複数のガウス過程の各々の寄与度を表すパラメータである負担率とを学習する学習部を含んで構成されている。
また、本発明に係る時空間変数予測装置において、前記学習部は、前記観測データの集合と、前記複数のガウス過程のカーネル関数の各々のハイパーパラメータとに基づいて、前記観測データの各々に対する、複数のガウス過程からなる複数のユニットの各々の寄与度を表すパラメータであるユニット負担率、及び前記観測データの各々に対する、前記複数のガウス過程の各々の寄与度を表すパラメータである負担率を推定する負担率推定部と、前記観測データの集合と、前記負担率推定部によって推定された、前記観測データの各々に対する、前記複数のユニットの各々のユニット負担率、及び前記観測データの各々に対する、前記複数のガウス過程の各々の負担率とに基づいて、前記複数のガウス過程の各々に対し、前記ガウス過程のカーネル関数の各々のハイパーパラメータを推定するガウス過程パラメータ推定部と、予め定められた反復終了条件を満たすまで、前記負担率推定部による推定、及び前記ガウス過程パラメータ推定部による推定を繰り返す反復判定部とを含むようにすることができる。
また、本発明に係る時空間変数予測装置は、入力された未観測の位置情報及び時間情報を有する前記入力変数に基づいて、前記入力変数に対する前記複数のガウス過程の各々の寄与度を表すパラメータである負担率を推定し、前記学習部によって学習された、前記複数のガウス過程の各々についての前記カーネル関数の各々のハイパーパラメータと、推定された前記入力変数に対する前記複数のガウス過程の各々の負担率とに基づいて、前記入力変数に対する時空間変数の値を予測する時空間変数算出部を更に含むようにすることができる。
また、本発明のプログラムは、コンピュータを、上記の時空間変数予測装置を構成する各部として機能させるためのプログラムである。
以上説明したように、本発明の時空間変数予測装置及びプログラムによれば、位置情報及び時間情報を有する入力変数に対する時空間変数の観測値を有する観測データの集合に基づいて、複数のガウス過程を、空間的な広がり及び時間的な広がりに対応する複数の階層で混合した階層混合ガウス過程でモデル化された、入力変数に対する時空間変数の値を予測するためのモデルに含まれる、複数のガウス過程の各々についての、観測データ同士の類似性を定義する関数であるカーネル関数の各々のハイパーパラメータと、観測データの各々に対する、複数のガウス過程の各々の寄与度を表すパラメータである負担率とを学習することにより、時間的及び空間的相関を持つ時空間変数の値を精度よく予測することができる、という効果が得られる。
本発明の実施の形態における時空間変数予測装置のブロック図である。 観測データの集合の一例を示す図である。 入力部と出力部との構成例を示す図である。 本発明の実施の形態における時空間変数予測装置の学習処理ルーチンを示すフローチャートである。 本発明の実施の形態における時空間変数予測装置の時空間変数算出処理ルーチンを示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<概要>
本発明の実施の形態では、混合ガウス過程を拡張した階層混合ガウス過程を提案する。階層混合ガウス過程は、ガウス過程を階層的に混合したモデルである。階層混合ガウス過程では、新しい入力変数xにおける予測値tは次式の平均を持つガウス分布に従う。
Figure 2017033198
p(z’=r’|z=r,x)はtがr’個目のユニットのr番目の要素から生じた確率であり、負担率と呼ばれる。z,z’は入力変数の各クラスタに対応する潜在変数である。各データ点が属するクラスタと各クラスタのパラメータはEMアルゴリズムを用いて同時に推定される。
本発明の実施の形態に係る時空間変数予測装置は、時空間変数の時系列データ(人口分布、人流・交通流の速度・向き、金やダイヤモンドなど鉱物資源の埋蔵量、降水量などの気象データ、土地価格など)を対象としたものであり、観測データに応じて柔軟に適用できるものである。以下では、実施の形態として、人口密度分布の時系列データが観測データとして与えられた条件の下で、未観測地点あるいは未来の時空間変数分布を推定・予測するという場合について説明する。
<本発明の実施の形態に係る時空間変数予測装置の構成>
次に、本発明の実施の形態に係る時空間変数予測装置の構成について説明する。図1に示すように、本発明の実施の形態に係る時空間変数予測装置100は、CPUと、RAMと、後述する各処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。時空間変数予測装置100は、位置情報及び時間情報を有する入力変数に対する時空間変数の観測値を有する観測データの集合に基づいて、未観測の位置情報及び時間情報での時空間変数の値を予測する。この時空間変数予測装置100は、機能的には図1に示すように、操作部10と、人口密度情報記憶部12と、入力部13と、演算部14と、時空間変数算出部26と、出力部28とを備えている。操作部10及び演算部14は、人口密度情報記憶部12と接続されている。
操作部10は、後述する人口密度情報記憶部12に格納されているデータに対するユーザからの各種操作を受け付ける。各種操作とは、人口密度情報記憶部12に格納された情報を登録、修正、削除する操作等である。操作部10の入力手段は、キーボードやマウス、メニュー画面、タッチパネルによるもの等、何でもよい。操作部10は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
人口密度情報記憶部12には、観測データの集合が格納されている。
人口密度情報記憶部12には、後述する演算部14が解析する観測データの集合が格納されており、演算部14からの要求に従って、観測データの集合を読み出し、当該情報を演算部14に送信する。
人口密度情報記憶部12に格納される観測データの集合は、入力変数xと時空間変数tとの組み合わせの集合である。本発明の実施の形態では、入力変数xは位置及び時刻を有し、時空間変数tは人口密度である。ある位置、ある時刻における人口密度は{x,t}と表すことができる。人口密度情報記憶部12はWebページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
図2に、観測データの集合の一例を示す。図2に示すように、例えば、位置ID及び時刻を表す情報が入力変数xとして格納され、人口密度を表す情報が時空間変数tとして格納される。
入力部13は、未観測の位置情報及び時間情報を有する入力変数を受け付ける。
本発明の実施の形態では、入力部13で受け付けられた位置情報及び時間情報に対して、後述する演算部14によって得られた各パラメータに基づいて、時空間変数である人口密度の予測が行われる。
入力部13の入力手段は、キーボードやマウス、メニュー画面、タッチパネルによるもの等、何でもよい。入力部13は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
図3に、本実施の形態における入力部13の構成例を示す。図3の構成例では、入力部13と後述する出力部28とが1つの画面として構成されている場合を示す。
図3に示すように、入力部13は、予測を行う対象となる地点あるいは領域に関する位置情報と、予測を行う時間情報とを含む入力変数を受け付ける。また、出力部28は、後述する時空間変数算出部26によって出力された、入力変数に対する時空間変数の値を予測結果として表示する。
演算部14は、学習部16と、負担率パラメータ格納部22と、ガウス過程パラメータ格納部24とを備える。演算部14では、学習データとして、ガウス過程のハイパーパラメータ、各ガウス過程からの負担率を表すパラメータを算出する。
ここで、本発明の実施の形態における原理について説明する。
人口密度情報記憶部12に、時空間変数データである観測データの集合D={x,t i=1が格納されたとする。ここでxは位置及び時刻など複数の変数を含むベクトル、tは人口密度である。
ここで解くべき問題は、入力部13によって受け付けた、(1)新しい入力変数(未観測の位置及び時間)xにおける人口密度の値tの予測と、(2)未観測地点を含むある領域における人口密度の値の予測である。
本実施の形態では、問題(1)に焦点を当てて説明する。人口密度分布の予測面を求めるには、xを動かしながら問題(1)を繰り返し解けばよい。
時空間変数の予測値tが従うモデルが、R個のガウス過程の混合モデルで記述できると仮定する。この仮定に基づけば、新たな入力変数xに対応する値tの期待値を、以下の式(1)のように書き下すことができる。
Figure 2017033198
ここでXは入力変数xの集合(X={x i=1)、Θ={θrr’R,R’ r,r’=1はr’番目のユニットのr個目のガウス過程のハイパーパラメータ、z,z’は入力変数の特性(地域や時間帯など)によって分類されたクラスに対応する潜在変数である。xがr番目のガウス過程から生じたと仮定すると、予測値tは次式の平均、分散を持つガウス分布に従う。
Figure 2017033198
ここでkはカーネル関数、krr’は要素krr’(x,X)を持つベクトル、Crr’は要素krr’(x,x)+β−1δnm+Ψrr’ nmを持つN×Nの共分散行列である。また、tは、要素をtとするベクトルである。ただしΨrr’は次式で定義される対角行列である。
Figure 2017033198
ここでσは定数である。i番目のデータ点がr番目のガウス過程の寄与を受けないとき、すなわち負担率p(z’=r’,z=r|x)のとき、Crr’は無限大に発散し、(Crr’−1の(i,i)成分は0となる。すなわちtはr’個目のユニットのr番目のガウス過程のパラメータ推定に影響しない。
従来手法では、カーネル関数k(x,x)は予測の前処理段階で一意に決められる。一方、本発明の実施の形態では、カーネル関数を自由に設計し、各々のカーネル関数のパラメータと重みとを自動推定する。本発明の実施の形態では、気象データや環境データなどの時系列地理統計解析で一般的に使われる代表的なコバリオグラムを二つ挙げる。
Figure 2017033198
ここで入力変数xの次元数をnとおくと
Figure 2017033198
である。また、上記のコバリオグラムに対応するカーネル関数は次式のように書き下せる。
Figure 2017033198
本発明の実施の形態では、上記のカーネル関数の線形和で定義した、以下の式で示す新たなカーネル関数を用いる。
Figure 2017033198
ここで推定すべきガウス過程のハイパーパラメータは
Figure 2017033198
である。入力変数の集合X={x i=1、およびガウス過程のハイパーパラメータの集合Θ=(θ11,・・・,θRR’)が与えられた条件の下で、観測データの集合Dの尤度関数は次式のように書き下せる。
Figure 2017033198
ここでt\iはtからi番目の要素を除いたものを表す。
本発明の実施の形態では、上記式の尤度関数を最大化するパラメータΘ,z,z’を推定するため、EMアルゴリズムを用いる。EMアルゴリズムでは、次の手順[1]〜[4]でパラメータ推定を行う。なお、本発明の実施の形態では、負担率の事前分布として以下の式(4)〜(5)に示すSoftmax関数を採用し、後述する時空間変数算出部26による時空間変数の予測で用いられるSoftmax関数のパラメータを算出する。
Figure 2017033198
[1]各パラメータの初期値を選択する。
[2]EMアルゴリズムのEステップにおいて、観測データ集合の各観測データに対し、以下の式に従って、当該観測データの入力変数に対する、r’番目のユニットのr番目のガウス過程の負担率p(z=r|z’=r’,X,t,θrr’)、当該観測データの入力変数に対する、r番目のガウス過程の負担率p(z=r|X,t,θrr’)、当該観測データの入力変数に対する、r’番目のユニットのr番目のガウス過程の同時確率p(z=r,z’=r’|X,t,θrr’)を計算する。
Figure 2017033198
なお、上記式(2)におけるp(t|X,t,θrr’)は、次式に示す平均μ rr’、分散Σ rr’を持つガウス分布で表される。
Figure 2017033198
[3]EMアルゴリズムのMステップにおいて、観測データ集合の各観測データに対して計算された、r’番目のユニットのr番目のガウス過程の負担率p(z=r|z’=r’,X,t,θrr’)、r番目のガウス過程の負担率p(z=r|X,t,θrr’)、r’番目のユニットのr番目のガウス過程の同時確率p(z=r,z’=r’|X,t,θrr’)に基づいて、尤度関数Qを最大化するガウス過程のパラメータΘnewを計算する。ここで尤度関数Qを次式で表されるQで予め近似する。
Figure 2017033198
ここで、π rr’は、
Figure 2017033198
で定義される。
また、目的関数Qのガウス過程のハイパーパラメータθrr’に関する微分は次式で書き下せる。
Figure 2017033198
ここでθrr’ はr番目のガウス過程のj番目のハイパーパラメータである。降下勾配法、準ニュートン法等を用いれば目的関数Qを最大化するガウス過程のパラメータΘを得ることができる。更新式は次式のように書き下せる。
Figure 2017033198
また、負担率を表すSoftmax関数のパラメータv及びvrr’の更新式は次式のように書き下せる。
Figure 2017033198
ここでηは定数である。
[4]EMアルゴリズムの収束条件が満たされているか調べ、満たされていなければ
Figure 2017033198
を実行し、上記手順[2]に戻る。収束条件が満たされていれば、処理を終了する。
従って、学習部16は、人口密度情報記憶部12に格納された観測データの集合に基づいて、観測データ同士の類似性を定義する関数であるカーネル関数の各々のハイパーパラメータと、観測データの各々に対する、複数のガウス過程の各々の寄与度を表すパラメータである負担率とを学習する。
本発明の実施の形態におけるカーネル関数は、複数のガウス過程を、空間的な広がり及び時間的な広がりに対応する複数の階層で混合した階層混合ガウス過程でモデル化される。また、本発明の実施の形態におけるカーネル関数は、入力変数に対する時空間変数の値を予測するためのモデルに含まれる、複数のガウス過程の各々についての、観測データ同士の類似性を定義する関数である。
学習部16は、負担率推定部18と、ガウス過程パラメータ推定部20と、反復判定部21とを備える。
負担率推定部18は、人口密度情報記憶部12に格納された観測データの集合と、複数のガウス過程のカーネル関数の各々のハイパーパラメータの初期値、又はガウス過程パラメータ推定部20による前回推定値とに基づいて、上記式(6)〜(8)に従って、観測データの各々に対する、複数のガウス過程からなる複数のユニットの各々の寄与度を表すパラメータであるユニット負担率、及び観測データの各々に対する、複数のガウス過程の各々の寄与度を表すパラメータである負担率を推定する。
ガウス過程パラメータ推定部20は、人口密度情報記憶部12に格納された観測データの集合と、負担率推定部18によって推定された、観測データの各々に対する、複数のユニットの各々のユニット負担率、及び観測データの各々に対する、複数のガウス過程の各々の負担率とに基づいて、上記式(9)〜(10)、(13)に従って、複数のガウス過程の各々に対し、ガウス過程のカーネル関数の各々のハイパーパラメータを推定する。
また、ガウス過程パラメータ推定部20は、人口密度情報記憶部12に格納された観測データの集合に基づいて、上記式(11)〜(12)に従って、Softmax関数のパラメータv及びvrr’を推定する。
反復判定部21は、予め定められた反復終了条件を満たすまで、負担率推定部18による推定、及びガウス過程パラメータ推定部20による推定を繰り返す。そして、反復判定部21は、予め定められた反復終了条件が満たされた場合には、ガウス過程パラメータ推定部20によって推定されたSoftmax関数のパラメータv及びvrr’を負担率パラメータ格納部22に格納し、ガウス過程パラメータ推定部20によって推定されたハイパーパラメータをガウス過程パラメータ格納部24に格納する。
負担率パラメータ格納部22には、ガウス過程パラメータ推定部20によって推定された、Softmax関数のパラメータv及びvrr’が格納される。
ガウス過程パラメータ格納部24には、ガウス過程パラメータ推定部20によって推定されたガウス過程のカーネル関数の各々のハイパーパラメータが格納される。
時空間変数算出部26は、入力部13によって受け付けた、未観測の位置情報及び時間情報を有する入力変数と、負担率パラメータ格納部22に格納されたSoftmax関数のパラメータとに基づいて、入力変数に対する複数のガウス過程の各々の寄与度を表すパラメータである負担率を推定する。
具体的には、時空間変数算出部26は、入力変数xと、負担率パラメータ格納部22に格納されたSoftmax関数のパラメータv及びvrr’とに基づいて、以下の式(14)〜(15)に従って、入力変数xに対する複数のガウス過程の各々の寄与度を表すパラメータである負担率を推定する。
Figure 2017033198
そして、時空間変数算出部26は、推定した入力変数xに対する負担率と、ガウス過程パラメータ格納部24に格納されたハイパーパラメータに基づいて、上記式(1)〜(3)に従って、入力変数に対する時空間変数の値を予測する。
出力部28は、時空間変数算出部26によって予測された、入力された入力変数に対する時空間変数の値を、結果として出力する。
例えば、出力部28は、上記図3に示すように、予測対象の地点あるいは領域及び時間での時空間変数の予測値である人口密度と、当該人口密度に関連する情報である混雑度とを結果として出力する。
<本発明の実施の形態に係る時空間変数予測装置の作用>
次に、本発明の実施の形態に係る時空間変数予測装置100の作用について説明する。
<学習処理ルーチン>
まず、時空間変数予測装置100は、操作部10より観測データの集合Dが入力されると、観測データの集合Dを人口密度情報記憶部12に格納する。そして、時空間変数予測装置100は、図4に示す学習処理ルーチンを実行する。
まず、ステップS100では、繰り返し変数jと各パラメータとを初期化する。
次に、ステップS102において、反復判定部21は、予め定められた反復終了条件を満たしたか否かを判定する。予め定められた条件として、繰り返し変数jが予め定められた値Niter未満である場合には、ステップS110へ進む。一方、繰り返し変数jがNiter以上である場合には、ステップS104へ進む。
ステップS104において、負担率推定部18は、人口密度情報記憶部12に格納された観測データの集合と、上記ステップS100で設定された、複数のガウス過程のカーネル関数の各々のハイパーパラメータの初期値、又は後述するステップS106で前回推定されたガウス過程のカーネル関数の各々のハイパーパラメータとに基づいて、上記式(6)〜(8)に従って、観測データの各々に対するユニット負担率、及び観測データの各々に対する負担率を推定する。
ステップS106において、ガウス過程パラメータ推定部20は、人口密度情報記憶部12に格納された観測データの集合と、上記ステップS104で推定された、観測データの各々に対するユニット負担率、及び観測データの各々に対する負担率とに基づいて、上記式(9)〜(10)、(13)に従って、複数のガウス過程の各々に対し、ガウス過程のカーネル関数の各々のハイパーパラメータを推定する。また、ガウス過程パラメータ推定部20は、人口密度情報記憶部12に格納された観測データの集合に基づいて、上記式(11)〜(12)に従って、Softmax関数のパラメータを推定する。
ステップS108では、繰り返し変数jを1インクリメントしてステップS102へ戻る。
ステップS110において、反復判定部21は、上記ステップS106で推定されたSoftmax関数のパラメータを負担率パラメータ格納部22に格納し、推定されたガウス過程のハイパーパラメータをガウス過程パラメータ格納部24に格納して、学習処理ルーチンを終了する。
次に、図5に示す時空間変数算出処理ルーチンについて説明する。
学習処理ルーチンが実行され、負担率パラメータ格納部22にSoftmax関数のパラメータvrr’が格納され、ガウス過程パラメータ格納部24にガウス過程のハイパーパラメータが格納され、予測を行う対象となる未観測の位置情報及び時間情報を含む入力変数が入力されると、時空間変数予測装置100は、図5に示す時空間変数算出処理ルーチンを実行する。
<時空間変数算出処理ルーチン>
ステップS200において、入力部13は、未観測の位置情報及び時間情報を含む入力変数を受け付ける。
ステップS202において、時空間変数算出部26は、負担率パラメータ格納部22に格納されたSoftmax関数のパラメータと、ガウス過程パラメータ格納部24に格納されたガウス過程のハイパーパラメータとを読み出す。
ステップS204において、時空間変数算出部26は、上記ステップS200で受け付けた入力変数と、上記ステップS202で読み込まれたSoftmax関数のパラメータとに基づいて、上記式(14)〜(15)に従って、入力変数に対する複数のガウス過程の各々の寄与度を表すパラメータである負担率を推定する。そして、時空間変数算出部26は、推定された入力変数に対する負担率と、上記ステップS202で読み込まれたガウス過程のハイパーパラメータとに基づいて、上記式(1)〜(3)に従って、入力変数に対する時空間変数の値である人口密度を予測する。
出力部28は、時空間変数算出部26によって予測された、入力変数に対する時空間変数の値である人口密度を結果として出力して、時空間変数算出処理ルーチンを終了する。
以上説明したように、本発明の実施の形態に係る時空間変数予測装置によれば、位置情報及び時間情報を有する入力変数に対する時空間変数の観測値を有する観測データの集合に基づいて、複数のガウス過程を、空間的な広がり及び時間的な広がりに対応する複数の階層で混合した階層混合ガウス過程でモデル化された、入力変数に対する時空間変数の値を予測するためのモデルに含まれる、複数のガウス過程の各々についての、観測データ同士の類似性を定義する関数であるカーネル関数の各々のハイパーパラメータと、観測データの各々に対する、複数のガウス過程の各々の寄与度を表すパラメータである負担率とを学習することにより、時間的及び空間的相関を持つ時空間変数の値を精度よく予測することができる。
また、時間的及び空間的相関を持つ時空間変数の値を正確に予測することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記の実施の形態では、人口密度分布の時系列データが観測データとして与えられた条件の下で、未観測地点あるいは未来の時空間変数分布を推定・予測するという場合について説明したが、他の様々な時空間変数の時系列データ(人口分布、人流・交通流の速度・向き、金やダイヤモンドなど鉱物資源の埋蔵量、降水量などの気象データ、土地価格など)を対象として本発明を適用することができる。
また、本発明の実施の形態においては、時空間変数予測装置100によって各パラメータを推定し、推定された各パラメータを用いて、入力変数に対応する時空間変数である人口密度を予測する場合を例に説明したが、これに限定されるものではない。例えば、各パラメータを推定する処理と、推定された各パラメータを用いて時空間変数を予測する処理とを別々の装置として構成してもよい。この場合、各パラメータを推定する装置は、操作部10と、人口密度情報記憶部12と、演算部14とを備え、推定された各パラメータを用いて時空間変数を予測する装置は、入力部13と、時空間変数算出部26と、出力部28とを備える。
また、本発明の実施の形態では、負担率の事前分布としてSoftmax関数を採用し、Softmax関数のパラメータを推定する場合を例に説明したが、これに限定されるものではなく、他の関数を用いてもよい。
また、上述の時空間変数予測装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。
10 操作部
12 人口密度情報記憶部
13 入力部
14 演算部
16 学習部
18 負担率推定部
20 ガウス過程パラメータ推定部
21 反復判定部
22 負担率パラメータ格納部
24 ガウス過程パラメータ格納部
26 時空間変数算出部
28 出力部
100 時空間変数予測装置

Claims (4)

  1. 位置情報及び時間情報を有する入力変数に対する時空間変数の観測値を有する観測データの集合に基づいて、未観測の位置情報及び時間情報に対する時空間変数の値を予測する時空間変数予測装置であって、
    前記観測データの集合に基づいて、複数のガウス過程を、空間的な広がり及び時間的な広がりに対応する複数の階層で混合した階層混合ガウス過程でモデル化された、前記入力変数に対する時空間変数の値を予測するためのモデルに含まれる、前記複数のガウス過程の各々についての、前記観測データ同士の類似性を定義する関数であるカーネル関数の各々のハイパーパラメータと、前記観測データの各々に対する、前記複数のガウス過程の各々の寄与度を表すパラメータである負担率とを学習する学習部
    を含む時空間変数予測装置。
  2. 前記学習部は、
    前記観測データの集合と、前記複数のガウス過程のカーネル関数の各々のハイパーパラメータとに基づいて、前記観測データの各々に対する、複数のガウス過程からなる複数のユニットの各々の寄与度を表すパラメータであるユニット負担率、及び前記観測データの各々に対する、前記複数のガウス過程の各々の寄与度を表すパラメータである負担率を推定する負担率推定部と、
    前記観測データの集合と、前記負担率推定部によって推定された、前記観測データの各々に対する、前記複数のユニットの各々のユニット負担率、及び前記観測データの各々に対する、前記複数のガウス過程の各々の負担率とに基づいて、前記複数のガウス過程の各々に対し、前記ガウス過程のカーネル関数の各々のハイパーパラメータを推定するガウス過程パラメータ推定部と、
    予め定められた反復終了条件を満たすまで、前記負担率推定部による推定、及び前記ガウス過程パラメータ推定部による推定を繰り返す反復判定部とを含む請求項1記載の時空間変数予測装置。
  3. 入力された未観測の位置情報及び時間情報を有する前記入力変数に基づいて、前記入力変数に対する前記複数のガウス過程の各々の寄与度を表すパラメータである負担率を推定し、
    前記学習部によって学習された、前記複数のガウス過程の各々についての前記カーネル関数の各々のハイパーパラメータと、推定された前記入力変数に対する前記複数のガウス過程の各々の負担率とに基づいて、前記入力変数に対する時空間変数の値を予測する時空間変数算出部を更に含む請求項1又は2記載の時空間変数予測装置。
  4. コンピュータを、請求項1〜請求項3のいずれか1項に記載の時空間変数予測装置を構成する各部として機能させるためのプログラム。
JP2015151299A 2015-07-30 2015-07-30 時空間変数予測装置及びプログラム Active JP6397380B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015151299A JP6397380B2 (ja) 2015-07-30 2015-07-30 時空間変数予測装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015151299A JP6397380B2 (ja) 2015-07-30 2015-07-30 時空間変数予測装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2017033198A true JP2017033198A (ja) 2017-02-09
JP6397380B2 JP6397380B2 (ja) 2018-09-26

Family

ID=57988877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015151299A Active JP6397380B2 (ja) 2015-07-30 2015-07-30 時空間変数予測装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6397380B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107515949A (zh) * 2017-09-14 2017-12-26 云南大学 兴趣点预测和推荐中的用户时空相似性度量方法
CN110377942A (zh) * 2019-06-10 2019-10-25 广东工业大学 一种基于有限高斯混合模型的多模型时空建模方法
WO2022123743A1 (ja) * 2020-12-10 2022-06-16 日本電信電話株式会社 パラメータ推定装置、集約データ高解像度化装置、パラメータ推定方法、集約データ高解像度化方法、及びプログラム
WO2023281671A1 (ja) * 2021-07-07 2023-01-12 日本電信電話株式会社 通信品質予測装置および通信品質予測方法ならびに通信品質予測プログラム
US11636399B2 (en) 2017-10-03 2023-04-25 Nec Corporation Parameter estimation system, parameter estimation method, and parameter estimation program recording medium for estimating parameter and kernel functions by incorporating machine learning

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
下坂正倫,外4名: "携帯電話から得られる大規模な位置履歴情報を用いた都市動態モデリング", 2015年度 人工知能学会全国大会(第29回)論文集, JPN6018032182, 2 June 2015 (2015-06-02), JP, pages 1 - 4 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107515949A (zh) * 2017-09-14 2017-12-26 云南大学 兴趣点预测和推荐中的用户时空相似性度量方法
US11636399B2 (en) 2017-10-03 2023-04-25 Nec Corporation Parameter estimation system, parameter estimation method, and parameter estimation program recording medium for estimating parameter and kernel functions by incorporating machine learning
CN110377942A (zh) * 2019-06-10 2019-10-25 广东工业大学 一种基于有限高斯混合模型的多模型时空建模方法
CN110377942B (zh) * 2019-06-10 2023-01-17 广东工业大学 一种基于有限高斯混合模型的多模型时空建模方法
WO2022123743A1 (ja) * 2020-12-10 2022-06-16 日本電信電話株式会社 パラメータ推定装置、集約データ高解像度化装置、パラメータ推定方法、集約データ高解像度化方法、及びプログラム
WO2023281671A1 (ja) * 2021-07-07 2023-01-12 日本電信電話株式会社 通信品質予測装置および通信品質予測方法ならびに通信品質予測プログラム

Also Published As

Publication number Publication date
JP6397380B2 (ja) 2018-09-26

Similar Documents

Publication Publication Date Title
JP6397380B2 (ja) 時空間変数予測装置及びプログラム
Giorgi et al. PrevMap: an R package for prevalence mapping
Goodarzi et al. A decision-making model for flood warning system based on ensemble forecasts
US10073908B2 (en) Functional space-time trajectory clustering
Baldacchino et al. Variational Bayesian mixture of experts models and sensitivity analysis for nonlinear dynamical systems
Barbian et al. Spatial subsemble estimator for large geostatistical data
CN105225541A (zh) 基于空管历史数据挖掘的短时航迹预测方法
Ma et al. Dynamic factor model for network traffic state forecast
Clay et al. Towards real-time crowd simulation under uncertainty using an agent-based model and an unscented Kalman filter
Prajam et al. Applying machine learning approaches for network traffic forecasting
CN117215728B (zh) 一种基于代理模型的仿真模拟方法、装置及电子设备
Apputhurai et al. Spatiotemporal hierarchical modelling of extreme precipitation in Western Australia using anisotropic Gaussian random fields
Kasiviswanathan et al. Quantification of prediction uncertainty in artificial neural network models
KR101703972B1 (ko) 공간정보를 이용한 지하수 부존 지역 예측시스템 및 지하수 부존 지역 예측방법
JP6744767B2 (ja) 人流予測装置、パラメータ推定装置、方法、及びプログラム
JP6665071B2 (ja) 人流量予測装置、人流量予測方法、及び人流量予測プログラム
Kyriacou et al. Bayesian traffic state estimation using extended floating car data
Skobtsov et al. Intelligent telemetry data analysis of small satellites
Ropero et al. Learning and inference methodologies for hybrid dynamic Bayesian networks: a case study for a water reservoir system in Andalusia, Spain
Vu et al. Bus running time prediction using a statistical pattern recognition technique
Tang et al. Spatial-temporal traffic performance collaborative forecast in urban road network based on dynamic factor model
JP2019191936A (ja) 高解像度化装置、高解像度化方法、空間データ高解像度化方法、およびプログラム
JP6927161B2 (ja) 学習装置、予測装置、方法、及びプログラム
JP6877677B2 (ja) 時空間データマイニング装置
Ouessai et al. IMM/EKF filter based classification of real-time freeway video traffic without learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170825

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180828

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180831

R150 Certificate of patent or registration of utility model

Ref document number: 6397380

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150