JP2021015348A - 空間データ高解像度化装置、空間データ高解像度化方法、及び空間データ高解像度化プログラム - Google Patents

空間データ高解像度化装置、空間データ高解像度化方法、及び空間データ高解像度化プログラム Download PDF

Info

Publication number
JP2021015348A
JP2021015348A JP2019128429A JP2019128429A JP2021015348A JP 2021015348 A JP2021015348 A JP 2021015348A JP 2019128429 A JP2019128429 A JP 2019128429A JP 2019128429 A JP2019128429 A JP 2019128429A JP 2021015348 A JP2021015348 A JP 2021015348A
Authority
JP
Japan
Prior art keywords
data
region
parameter
resolution
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019128429A
Other languages
English (en)
Other versions
JP7133175B2 (ja
Inventor
佑典 田中
Sukenori Tanaka
佑典 田中
具治 岩田
Tomoharu Iwata
具治 岩田
倉島 健
Takeshi Kurashima
健 倉島
浩之 戸田
Hiroyuki Toda
浩之 戸田
田中 利幸
Toshiyuki Tanaka
利幸 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyoto University
Nippon Telegraph and Telephone Corp
Original Assignee
Kyoto University
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyoto University, Nippon Telegraph and Telephone Corp filed Critical Kyoto University
Priority to JP2019128429A priority Critical patent/JP7133175B2/ja
Priority to US17/626,027 priority patent/US20220253736A1/en
Priority to PCT/JP2020/027112 priority patent/WO2021006347A1/ja
Publication of JP2021015348A publication Critical patent/JP2021015348A/ja
Application granted granted Critical
Publication of JP7133175B2 publication Critical patent/JP7133175B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/08Computing arrangements based on specific mathematical models using chaos models or non-linear system models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models

Abstract

【課題】領域データを精度よく高解像度化することができるようにする。【解決手段】パラメータ推定部106が、空間を分割した各領域に値が紐付いた領域データであって、分割の粒度が異なる複数の領域データを表すガウス過程モデルであって、領域データ間の相関関数の空間スケールパラメータと、当該相関関数のノイズ分散パラメータとを含むガウス過程モデルに基づいて、領域データの値をガウス過程の領域積分で表した関数が最大となるように、空間スケールパラメータ及びノイズ分散パラメータを推定し、高解像度データ算出部111が、推定された空間スケールパラメータ及びノイズ分散パラメータを含むガウス過程モデルにおいて、高解像度化する対象の領域データの値を、対象の領域データより解像度の高い粒度で当該空間を分割した領域毎に領域積分することにより、当該対象の領域データを高解像度化した高解像度データを算出する。【選択図】図2

Description

開示の技術は、空間データ高解像度化装置、空間データ高解像度化方法、及び空間データ高解像度化プログラムに関する。
近年、政府や企業等の組織が、都市環境や事業の改善を目的として、様々な種類の空間データ(貧困度、大気汚染度、犯罪数、人口、交通量等)を収集し、公開している。空間データとは、位置情報(緯度経度、住所、地域等)とそれに紐づく何らかの値とのペアで与えられるデータを指す。
このような空間データは、収集コストが高く、十分なサンプル数を含むデータを収集することが難しいため、空間を分割する単位を広く取った領域、すなわち粒度のある程度粗い領域(住所や地域等)において、集約されて提供されることが多い。このようなデータを以下では「領域データ」と呼ぶ。
しかし、より効果的な都市環境の改善のためには、できる限り高解像度の領域データが望ましい。例えば、貧困度が高い領域や大気汚染度が高い領域を詳細に絞りこむことで、より適切な介入が可能となる。従って、粗い粒度の領域データを高解像度なデータに変換するという問題は重要である。
従来技術では、ガウス過程を基礎として、ターゲットとする低解像度の領域データとは別に、他の種類の様々な解像度の領域データを用意し、それらを補助データとした回帰モデルを学習することによって、ターゲットとする高解像度データを予測する(非特許文献1)。
また、領域データを対象とした技術ではないが、複数種類のデータを多変量ガウス過程に基づいて同時にモデル化することで、サンプル数の少ないデータに対して高精度な予測が実現されている(非特許文献2)。
Y. Tanaka, T. Iwata, T. Tanaka, T. Kurashima, M. Okawa, and H. Toda. Refining coarse-grained spatial data using auxiliary spatial data sets with various granularities, In AAAI'19. Y. W. Teh, M. Seeger, and M. I. Jordan. Semiparametric latent factor models. In AISTATS'05, 2005, pages 333-340.
しかしながら、非特許文献1の手法では、(1)領域の形が特異な場合(細長い領域等)において、誤った空間相関の評価がなされてしまう、という問題があった。また、(2)低解像度な補助データは信頼度が低いデータであると判断される傾向があり、ターゲットとする高解像度データの予測に有用であるとしても、学習の過程で無視されてしまう、という問題があった。
また、非特許文献2の手法では、点(緯度経度等)に紐づくデータを想定しており、領域データを扱うことができない、という問題があった。
開示の技術は、上記の点に鑑みてなされたものであり、領域データを精度よく高解像度化することができる空間データ高解像度化装置、空間データ高解像度化方法、及び空間データ高解像度化プログラムを提供することを目的とする。
本開示の第1態様は、空間データ高解像度化装置であって、空間を分割した各領域に値が紐付いた領域データであって、分割の粒度が各々異なる複数の領域データを表すガウス過程モデルであって、前記領域データ間の相関関数の空間スケールパラメータと、前記相関関数のノイズ分散パラメータとを含む前記ガウス過程モデルに基づいて、前記領域データの値をガウス過程の領域積分で表した関数が最大となるように、前記空間スケールパラメータ及び前記ノイズ分散パラメータを推定するパラメータ推定部と、高解像度化する対象の領域データと、前記対象の領域データより解像度の高い粒度で空間を分割することを示すターゲット分割の指定を受け付ける検索部と、前記パラメータ推定部により推定された前記空間スケールパラメータ及び前記ノイズ分散パラメータを含む前記ガウス過程モデルにおいて、前記対象の領域データの値を、前記ターゲット分割が示す粒度で前記空間を分割した領域毎に領域積分することにより、前記対象の領域データを高解像度化した高解像度データを算出する高解像度データ算出部と、を含む。
本開示の第2態様は、空間データ高解像度化方法であって、パラメータ推定部が、空間を分割した各領域に値が紐付いた領域データであって、分割の粒度が各々異なる複数の領域データを表すガウス過程モデルであって、前記領域データ間の相関関数の空間スケールパラメータと、前記相関関数のノイズ分散パラメータとを含む前記ガウス過程モデルに基づいて、前記領域データの値をガウス過程の領域積分で表した関数が最大となるように、前記空間スケールパラメータ及び前記ノイズ分散パラメータを推定し、検索部が、高解像度化する対象の領域データと、前記対象の領域データより解像度の高い粒度で空間を分割することを示すターゲット分割の指定を受け付け、高解像度データ算出部が、前記パラメータ推定部により推定された前記空間スケールパラメータ及び前記ノイズ分散パラメータを含む前記ガウス過程モデルにおいて、前記対象の領域データの値を、前記ターゲット分割が示す粒度で前記空間を分割した領域毎に領域積分することにより、前記対象の領域データを高解像度化した高解像度データを算出する。
開示の技術によれば、領域データを精度よく高解像度化することができる。
本実施形態に係る空間データ高解像度化装置として機能するコンピュータの概略構成を示すブロック図である。 本実施形態に係る空間データ高解像度化装置の機能構成の例を示すブロック図である。 本実施形態に係る空間データ高解像度化装置の出力例を示す図である。 本実施形態に係る空間データ高解像度化装置の空間データ高解像度化処理ルーチンを示すフローチャートである。
<本開示の技術の実施形態に係る空間データ高解像度化装置の概要>
まず、本実施形態に係る空間データ高解像度化装置の概要について説明する。
非特許文献1の手法では、ガウス過程を基礎として、複数種類の領域データを補助データとした回帰モデルを学習することによって、ターゲットとする高解像度データを予測する。しかし、非特許文献1の手法には以下の3つの問題点がある。
<<1.領域重心の使用に起因する誤った空間相関の評価>>
非特許文献1の手法では、領域に紐づくデータ値を、その領域の重心に紐づくものとして領域データを扱う。この方法をとることで、ガウス過程に基づく定式化が容易になるという利点がある。しかし、この簡略化は、領域間の空間相関を領域の重心間の空間相関で代用する、ということを意味しており、領域の形が特異な場合(細長い領域等)において、誤った空間相関の評価がなされてしまう、という問題が存在した。
<<2.低解像度の補助データを活用しきれないこと>>
非特許文献1の手法では、補助データとして様々な解像度の領域データを使用することができる。推定の手順は、(1)補助データをガウス過程回帰によって空間補間しターゲットとする解像度に揃え、(2)ターゲットデータの回帰モデルを学習する。非特許文献1のポイントは、空間補間をした際に求められる予測値の信頼度を加味しつつ回帰モデルを学習することである。このとき、低解像度な補助データは信頼度が低いデータであると判断される傾向があり、ターゲットとする高解像度データの予測に有用であるとしても、学習の過程で無視されてしまう、という問題が存在した。
<<3.活用可能な補助データは同一の領域のものに限られること>>
非特許文献1の手法では、補助データは同一の領域のものに限られることを仮定している。例えば、ニューヨーク市における貧困度をターゲットデータとした場合には、同じニューヨーク市における他のデータ(大気汚染度や犯罪数等)を補助データとして活用する。しかし、都市によっては、多くの種類の補助データが利用可能でない場合が想定される。従来技術では、利用可能な補助データが少ない場合に、高解像度データの高精度な予測は難しい、という問題が存在した。
また、非特許文献2の手法では、複数種類のデータを多変量ガウス過程に基づいて同時にモデル化することで、サンプル数の少ないデータに対して高精度な予測が可能である。
しかし、非特許文献2の手法では、点(緯度経度等)に紐づくデータを想定しており、本開示で対象とするような、領域データを扱うことはできない、という問題が存在した。非特許文献1と同様にして、データ値が領域の重心に紐づくものと仮定すれば、素朴な適用は可能であるが、上記の問題点1.で述べた問題が依然として存在する。
そこで、本開示の空間データ高解像度化装置では、(1)複数の領域データを多変量ガウス過程に基づいて同時にモデル化し、(2)領域データの値をガウス過程の領域積分によって表現することによって、複数領域における多種多様な領域データを効果的に活用して、高解像度データの高精度な予測を実現する。このため、以下の手段1及び手段2を開示する。
<<手段1:領域間の空間相関を考慮したガウス過程モデル及びパラメータ推定>>
「空間スケールパラメータ」と、「ノイズ分散パラメータ」とを未知変数とするガウス過程モデルに基づいて、領域データの値をガウス過程の領域積分で表現することによって、領域データから最尤推定を用いてガウス過程モデルの未知変数を推定する。
手段1に対する効果として、領域データの値をガウス過程の領域積分で表現することにより、2つの領域間の空間相関は、それぞれの領域に含まれる無数の点の組み合わせに対して算出された相関関数の値の足し合わせによって表現される。これにより、様々な大きさや形状を持つ領域間の空間相関が正確に評価できるようになり、ガウス過程モデルの未知変数の推定も正確に行えるようになる。よって、領域データを精度よく高解像度化することができる。
<<手段2:領域間の空間相関を考慮した多変量ガウス過程モデル及びパラメータ推定>>
「空間スケールパラメータ」と、「混合係数」と、「残差分散パラメータ」と、「ノイズ分散パラメータ」とを未知変数として、複数の潜在ガウス過程の線形混合で表現された多変量ガウス過程モデルに基づいて、領域データの値をガウス過程の領域積分で表現することにより、領域データから最尤推定を用いてガウス過程モデルの未知変数を推定する。
手段1に対する効果に加え、手段2では、複数の潜在ガウス過程の線形混合で表現された多変量ガウス過程モデルに基づいて、複数の領域データを同時にモデル化することにより、「空間スケールパラメータ」を複数の領域データ間で共有して学習することができる。これにより、低解像度な空間データが存在する場合でも、それらを効果的に活用して高解像度データの予測を行えるようになる。
また、複数の都市における領域データが存在する状況を考えると、複数の潜在ガウス過程の線形混合で表現された多変量ガウス過程モデルに基づいて、複数の領域データを同時にモデル化することにより、「空間スケールパラメータ」と「混合係数」とを複数の都市及び複数の領域データ間で共有して学習することができる。これにより、ある都市における領域データの種類数が少ない場合でも、他の都市の領域データを効果的に活用して高解像度データの予測を行えるようになる。よって、手段1よりも領域データを更に精度よく高解像度化することができる。
<本開示の技術の実施形態に係る空間データ高解像度化装置の構成>
本開示に係る空間データ高解像度化装置10は、任意の空間粒度で集約された空間データ(以下では簡単のため領域データと呼ぶ)全般を対象としたものであり、使用する領域データの種類(貧困度、大気汚染度や交通量等)に依存せず、それらに対して柔軟に適用できる。以下では、実施形態として、一般的な領域データが1つの都市において複数種類与えられた条件の下で、多変量ガウス過程モデルに基づいて、領域データの値をガウス過程の領域積分で表現し、領域データから最尤推定を用いてガウス過程モデルの未知変数を推定することで、領域データの高解像度化を行う場合について説明する。
以下、開示の技術の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一又は等価な構成要素及び部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。
図1は、本実施形態に係る空間データ高解像度化装置10のハードウェア構成を示すブロック図である。図1に示すように、空間データ高解像度化装置10は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、ストレージ14、入力部15、表示部16及び通信インタフェース(I/F)17を有する。各構成は、バス19を介して相互に通信可能に接続されている。
CPU11は、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、CPU11は、ROM12又はストレージ14からプログラムを読み出し、RAM13を作業領域としてプログラムを実行する。CPU11は、ROM12又はストレージ14に記憶されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。本実施形態では、ROM12又はストレージ14には、空間データ高解像度化処理を実行するための空間データ高解像度化プログラムが格納されている。
ROM12は、各種プログラム及び各種データを格納する。RAM13は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ14は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)により構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。
入力部15は、マウス等のポインティングデバイス、及びキーボードを含み、各種の入力を行うために使用される。
表示部16は、例えば、液晶ディスプレイであり、各種の情報を表示する。表示部16は、タッチパネル方式を採用して、入力部15として機能しても良い。
通信インタフェース17は、外部装置(図示しない)等の他の機器と通信するためのインタフェースであり、例えば、イーサネット(登録商標)、FDDI、Wi−Fi(登録商標)等の規格が用いられる。
次に、空間データ高解像度化装置10の機能構成について説明する。
図2は、空間データ高解像度化装置10の機能構成の例を示すブロック図である。図2に示すように、空間データ高解像度化装置10は、機能構成として、領域データ格納部101と、ターゲット分割格納部102と、操作部103と、検索部104と、高解像度化部105と、出力部112とを有する。各機能構成は、CPU11がROM12又はストレージ14に記憶された空間データ高解像度化プログラムを読み出し、RAM13に展開して実行することにより実現される。
領域データ格納部101には、解析対象となる領域データが格納されている。領域データ格納部101は、高解像度化部105からの要求にしたがって、領域データを読み出し、高解像度化部105に渡す。ここで、領域データ格納部101に格納されている領域データについて説明する。空間全体を表す集合をΧとし、下記式で定義する。
そして、x∈Χを入力変数とする。Χは都市全体に対応し、xは緯度経度に対応する。s=1,...,SをS種類の領域データを指し示す引数とし、Pをs番目の領域データに対するΧの分割を表すものとする。ここで、分割とは、例えば住所や地域による都市の分割に対応する。また、|P|は分割Pに含まれる領域の数を表すものとする。領域の引数n=1,...,|P|に対して、n番目の領域をRs,n(Rs,n∈P)とする。s番目の領域データに含まれるn番目の観測を、領域Rs,nと値ys,n(ys,n∈R_(数式中では白抜きのR))の組として(Rs,n,ys,n)と表す。領域データ格納部101に格納される領域データは、{(Rs,n,ys,n)|s=1,...,S,n=1,...,|P|}である。なお、本明細書中において、R_と記載した場合は数式中の“白抜きのR”を示すが、それ以外の場合、Rは領域を示す。
ターゲット分割格納部102には、高解像度化部105によって出力される高解像度データのターゲットとなる粒度で空間を分割したターゲット分割が格納されている。ターゲット分割格納部102は、高解像度化部105からの要求にしたがって、ターゲット分割を読み出し、該当のデータを装置に送信する。ターゲット分割は、対象の領域データより解像度の高い粒度で空間を分割することを示す。以下、PtargetをΧのターゲット分割として表すものとする。ターゲット分割Ptargetに含まれる領域の1つをRtargetと表す。ここで、ターゲット分割Ptargetは、任意のものを使用することが可能である。例えば、住所や地域に基づく分割や使用者が設定した任意のサイズのメッシュ等をターゲット分割Ptargetに使用することが考えられる。ターゲット分割格納部102には、異なる粒度の複数のターゲット分割Ptargetが格納される。
なお、領域データ格納部101及びターゲット分割格納部102は、Webサーバや、データベースを具備するデータベースサーバ等として構成することもできる。
操作部103は、領域データ格納部101及びターゲット分割格納部102に格納されている領域データ及びターゲット分割Ptargetに対するユーザからの各種操作を受け付ける。各種操作とは、領域データ又はターゲット分割Ptargetに関するデータを登録、修正、削除する操作等である。そして、操作部103は、受け付けた各種操作に応じて、領域データ格納部101及びターゲット分割格納部102に格納されている領域データ及びターゲット分割Ptargetに対して操作を行う。領域データ格納部101及びターゲット分割格納部102に格納されている領域データは、ユーザから受け付けた各種操作に基づいて、操作部103により予め格納されたものである。
検索部104は、高解像度化する対象の領域データと、当該対象の領域データより解像度の高い粒度で空間を分割することを示すターゲット分割Ptargetの指定を受け付ける。具体的には、検索部104は、高解像度化を行う対象とする領域データの引数及びターゲット分割Ptargetの指定を受け付ける。そして、検索部104は、受け付けた指定を、高解像度化部105に渡す。
高解像度化部105は、検索部104で指定された領域データ及びターゲット分割に対して、指定された領域データをターゲット分割Ptargetが示す粒度で高解像度化した高解像度データを予測する。具体的には、高解像度化部105は、パラメータ推定部106と、空間スケールパラメータ格納部107と、混合係数格納部108と、残差分散パラメータ格納部109と、ノイズ分散パラメータ格納部110と、高解像度データ算出部111とを有する。
パラメータ推定部106は、空間を分割した各領域に値が紐付いた領域データであって、分割の粒度が各々異なる複数の領域データを表すガウス過程モデルであって、領域データ間の相関関数の空間スケールパラメータと、相関関数のノイズ分散パラメータと、当該ガウス過程と領域データとの混合係数と、当該ガウス過程に対する残差分散パラメータとを含むガウス過程モデルに基づいて、当該領域データの値を当該ガウス過程の領域積分で表した関数が最大となるように、空間スケールパラメータ、ノイズ分散パラメータ、混合係数、及び残差分散パラメータを推定する。
具体的には、パラメータ推定部106は、まず、領域データ格納部101から領域データを取得する。次に、パラメータ推定部106は、取得した領域データに基づいて、空間スケールパラメータ、混合係数、残差分散パラメータ、及びノイズ分散パラメータを未知変数として組み込んだ上で、複数の潜在ガウス過程の線形混合で表現された多変量ガウス過程モデルに基づいて、複数の領域データを同時にモデル化する。そして、パラメータ推定部106は、最尤推定を用いて多変量ガウス過程モデルの未知変数である空間スケールパラメータ、混合係数、残差分散パラメータ、及びノイズ分散パラメータを推定する。以下に、多変量ガウス過程モデル及びパラメータ推定について詳細に説明する。
<<多変量ガウス過程モデル>>
まず、複数の潜在ガウス過程の線形混合で表現された多変量ガウス過程モデルの定式化を行う。L個の独立なガウス過程を下記式(1)とする。
上記式(1)において、γ(x,x′):Χ×Χ→R_は、l(小文字のエル)個目のガウス過程の相関関数であり、任意のものを使用できる。l個目のガウス過程の相関関数としては、例えば下記式(2)を用いることができる。
上記式(2)において、βはl個目の相関関数の空間スケールパラメータである。f(x)をs番目の領域データに対するノイズレスな潜在関数とし、S変量ガウス過程f(x)=(f(x),...,f(x))をL個の独立なガウス過程の線型混合として、下記式(3)と表す。
上記式(3)において、g(x)=(g(x),...,g(x))であり、W(数式中は太字のW)はS×Lの混合行列であり、(s,l)要素であるws,l∈R_は、混合係数である。また、Λ=diag(λ ,...,λ )であり、各要素λ はs番目のガウス過程に対する残差分散パラメータである。g(x)について積分消去を行うことができ、結果としてS変量ガウス過程は下記(4)と書くことができる。
上記式(4)において、K(x,x′):Χ×Χ→RS×Sは相関行列を表し、下記式(5)である。
上記式(5)において、Γ(x,x′)=diag(γ(x,x′),...,γ(x,x′))とした。また、K(x,x′)の(s,s′)要素は、下記式(6)で与えられる。
ここで、δA,B(A、Bは任意の記号)はクロネッカーのデルタであり、A=Bの場合、δA,B=1であり、そうでない場合、δA,B=0である。
次に、領域データの値をガウス過程の領域積分で表現する。s番目のガウス過程から生成される|P|次元の観測ベクトルyを下記式で表す。
そして、S個のガウス過程から生成される観測ベクトルyをまとめて下記式(7)と表す。
観測ベクトルyは、多次元ガウス分布である下記式(8)に従うと仮定する。
上記式(8)において、Nを下記式として、A(x):Χ→R_N×Sであり、A(x)は下記式(9)で表すこととする。
上記式(9)において、a(x)は下記式とし、上記式(9)中の太字の0は、0からなるベクトルとした。
s,n(x)は任意のものを使用することができ、as,n(x)の設定の仕方によって各領域における集約の仕方を変えることができる。ここでは各領域Rs,nにおいて領域平均をした結果、観測が得られる場合を考える。この場合、as,n(x)は下記式(10)と書ける。
ここで、数式中の“白抜きの1”を、明細書中ではQで表す。上記式(10)においてQ(C)(Cは任意の論理式)は指示関数であり、Cが真のときQ(C)=1であり、そうでないときQ(C)=0である。また、上記式(8)において、Σは下記(11)とする。
上記式(11)において、σ は、s番目のガウス過程のノイズ分散パラメータであり、太字のIは単位行列であり、太字のOは0を要素とする行列である。
すなわち、パラメータ推定部106において推定すべきパラメータは、空間スケールパラメータβ={β|l=1,...,L}、混合係数W、残差分散パラメータΛ、及びノイズ分散パラメータΣである。
<<パラメータ推定>>
次に、パラメータ推定部106が、最尤推定を用いて空間スケールパラメータβ、混合係数W、残差分散パラメータΛ、及びノイズ分散パラメータΣを推定する方法について述べる。観測ベクトルyが与えられたとしたとき、周辺尤度p(y)は、f(x)を積分消去して下記式(12)と書くことができる。
ここで、CはS×Sの相関行列であり、下記式(13)、(14)と書くことができる。
更に、Cs,s′は|P|×|Ps′|行列であり、下記式(15)である。
s,s′の(n,n′)要素をCs,s′(n,n′)と書き、s番目の領域データのn番目の領域と、s′番目の領域データのn′番目の領域との相関を表すものとする。上記式(15)における領域積分を解析的に計算することは困難であるため、離散近似を行うことによって計算する。ここで、数式中の“筆記体のG”を、明細書中ではGで表す。離散近似では、入力空間Χを十分に細かいグリッドに分割し、領域Rs,nに含まれるグリッド点の集合をGs,nとする。Gs,nを用いることで、Cs,s′(n,n′)は、下記式(16)〜(18)と近似的に計算が可能である。
上記式(12)で表される周辺尤度p(y)の対数をとって、推定すべきパラメータに関する項のみを取り出すと、下記式(19)となる。
上記式(19)を最大化することにより、空間スケールパラメータβ、混合係数W、残差分散パラメータΛ、及びノイズ分散パラメータΣの最尤推定解を得ることができる。最大化するための最適化問題は、例えばBFGS法(参考文献1)を用いて解くことができる。
[参考文献1]D. C. Liu and J. Nocedal. On the limited memory BFGS method for large scale optimization. Mathematical programming, 1989, 45(1-3):503-528.
ここで、複数都市の領域データが得られた場合のパラメータ推定法について述べる。V種類の都市があるとする。このとき、各都市における領域データは、共通の潜在ガウス過程{g(x)|l=1,...,L}と混合行列Wとが与えられたとしたとき、条件付き独立な確率分布に従うと仮定する。複数都市の領域データが与えられたとしたときの周辺尤度p(y)は、下記式(20)と書くことができる。
上記式(20)において、y(v)はv個目の都市における観測ベクトルであり、C(v)はv個目の都市に対する相関行列である。1つの都市の場合と同様の手順で、上記式(20)を最大化することにより、空間スケールパラメータβ、混合係数W、残差分散パラメータΛ、及びノイズ分散パラメータΣの最尤推定解を得ることができる。
そして、パラメータ推定部106は、推定した空間スケールパラメータβを空間スケールパラメータ格納部107に、混合係数Wを混合係数格納部108に、残差分散パラメータΛを残差分散パラメータ格納部109に、ノイズ分散パラメータΣをノイズ分散パラメータ格納部110に、それぞれ格納する。
空間スケールパラメータ格納部107には、パラメータ推定部106により推定された空間スケールパラメータβが格納されている。混合係数格納部108には、パラメータ推定部106により推定された混合係数Wが格納されている。残差分散パラメータ格納部109には、パラメータ推定部106により推定された残差分散パラメータΛが格納されている。ノイズ分散パラメータ格納部110には、パラメータ推定部106により推定されたノイズ分散パラメータΣが格納されている。空間スケールパラメータ格納部107、混合係数格納部108、残差分散パラメータ格納部109、及びノイズ分散パラメータ格納部110は、格納された推定値が保存され、復元可能なものであればなんでもよい。例えば、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される構成としてもよい。
高解像度データ算出部111は、パラメータ推定部106により推定された空間スケールパラメータβ、ノイズ分散パラメータΣ、混合係数W、及び残差分散パラメータΛを含むガウス過程モデルにおいて、当該対象の領域データの値を、当該ターゲット分割Ptargetが示す粒度で空間を分割した領域毎に領域積分することにより、当該対象の領域データを高解像度化した高解像度データを算出する。
具体的には、高解像度データ算出部111は、複数都市における領域データが与えられた条件の下で、ターゲット分割Ptargetに含まれる各領域についてガウス過程モデルの領域積分を行うことにより、所望の高解像度データを算出する。以下に、高解像度データの算出法について説明する。
まず、高解像度データ算出部111は、パラメータ推定部106により推定された空間スケールパラメータβ、ノイズ分散パラメータΣ、混合係数W、及び残差分散パラメータΛを含むS変量ガウス過程f(x)の事後プロセスf(x)を導出する。事後プロセスf(x)は、下記式(21)と書ける。
上記式(21)において、m(x):Χ→R_は平均ベクトルを表し、K(x,x′):Χ×Χ→R_S×Sは、相関行列を表す。また、H(x):Χ→R_N×Sを、下記式(22)、(23)と置く。
上記式(23)において、hs,s´(x)は、下記式(24)である。
上記式(24)の領域積分は解析的に計算できないため、上記式(18)と同様に、離散近似を行う。グリッド点の集合であるGs,nを用いて、hs,s′(x)のn番目の要素は下記式(25)、(26)と計算できる。
s,s′(x)を用いて、m(x)及びK(x,x′)は、下記式(27)、(28)となる。
算出すべき高解像度データは、事後平均である上記式(27)をターゲット分割Ptargetにおける各領域において積分することによって得られる。検索部104において指定された領域データの引数をsとし、ターゲット分割Ptargetに含まれる領域Rtargetにおける予測値を計算することを考える。このとき、事後平均m(x)のs番目の要素をm (x)とすると、求めたい予測値は、下記式(29)、(30)となる。
ここで、atarget(x)は下記式(31)である。
また、上記式(29)における積分は離散近似を行い、領域Rtargetに含まれるグリッド点の集合をGtargetとした。高解像度データ算出部111は、上記の処理をターゲット分割Ptargetに含まれる各領域について繰り返すことにより、所望の高解像度データを得る。そして、高解像度データ算出部111は、算出した高解像度データを、出力部112に渡す。
出力部112は、高解像度データ算出部111により算出された高解像度データを出力する。図3に出力部112による出力例を示す。図3に示すように、検索部104から対象とする領域データの引数及びターゲット分割を受け取り、それに応じて、高解像度データの可視化結果が表示される。可視化結果における色の濃さは、データ値に比例して決まるものとする。このような出力例を用いて、例えば、貧困度が高い領域や大気汚染度が高い領域を詳細に絞りこみ、より適切な介入を行うための検討に活用することができる。
<本開示の技術の実施形態に係る空間データ高解像度化装置の作用>
次に、空間データ高解像度化装置10の作用について説明する。
図4は、空間データ高解像度化装置10による空間データ高解像度化処理の流れを示すフローチャートである。CPU11がROM12又はストレージ14から空間データ高解像度化プログラムを読み出して、RAM13に展開して実行することにより、空間データ高解像度化処理が行なわれる。
ステップS101において、CPU11は、パラメータ推定部106として、領域データ格納部101から領域データを取得する。
ステップS102において、CPU11は、パラメータ推定部106として、空間を分割した各領域に値が紐付いた領域データであって、分割の粒度が各々異なる複数の領域データを表すガウス過程モデルであって、領域データ間の相関関数の空間スケールパラメータβと、相関関数のノイズ分散パラメータΣと、当該ガウス過程と領域データとの混合係数Wと、当該ガウス過程に対する残差分散パラメータΛとを含むガウス過程モデルに基づいて、当該領域データの値を当該ガウス過程の領域積分で表した関数が最大となるように、空間スケールパラメータβ、ノイズ分散パラメータΣ、混合係数W、及び残差分散パラメータΛを推定する。
ステップS103において、CPU11は、検索部104として、高解像度化する対象の領域データと、当該対象の領域データより解像度の高い粒度で空間を分割することを示すターゲット分割Ptargetの指定を受け付ける。
ステップS104において、CPU11は、高解像度データ算出部111として、上記ステップS102により推定された空間スケールパラメータβ、ノイズ分散パラメータΣ、混合係数W、及び残差分散パラメータΛを含むガウス過程モデルにおいて、当該対象の領域データの値を、上記ステップS103により指定された当該ターゲット分割Ptargetが示す粒度で空間を分割した領域毎に領域積分することにより、当該対象の領域データを高解像度化した高解像度データを算出する。
ステップS105において、CPU11は、出力部112として、上記ステップS104により算出された高解像度データを出力する。
以上説明したように、本開示に係る空間データ高解像度化装置によれば、空間を分割した各領域に値が紐付いた領域データであって、分割の粒度が各々異なる複数の領域データを表すガウス過程モデルであって、領域データ間の相関関数の空間スケールパラメータと、当該相関関数のノイズ分散パラメータとを含むガウス過程モデルに基づいて、領域データの値をガウス過程の領域積分で表した関数が最大となるように、空間スケールパラメータ及びノイズ分散パラメータを推定し、高解像度化する対象の領域データと、当該対象の領域データより解像度の高い粒度で空間を分割することを示すターゲット分割の指定を受け付け、推定された当該空間スケールパラメータ及び当該ノイズ分散パラメータを含む当該ガウス過程モデルにおいて、当該対象の領域データの値を、当該ターゲット分割が示す粒度で当該空間を分割した領域毎に領域積分することにより、当該対象の領域データを高解像度化した高解像度データを算出することにより、様々な大きさや形状を持つ領域間の空間相関が正確に評価できるようになり、領域データを精度よく高解像度化することができる。
また、本開示に係る空間データ高解像度化装置によれば、ガウス過程モデルは、空間スケールパラメータ、ノイズ分散パラメータ、ガウス過程と領域データとの混合係数、及びガウス過程に対する残差分散パラメータとを含み、領域データの値をガウス過程の領域積分で表した関数が最大となるように、空間スケールパラメータ、ノイズ分散パラメータ、混合係数、及び残差分散パラメータを推定し、推定された当該空間スケールパラメータ、当該ノイズ分散パラメータ、当該混合係数、及び当該残差分散パラメータを含む当該ガウス過程モデルにおいて、当該対象の領域データの値を、当該ターゲット分割が示す粒度で当該空間を分割した領域毎に領域積分することにより、当該対象の領域データを高解像度化した高解像度データを算出することにより、領域データをより精度良く高解像度化することができる。
なお、本開示は、上述した実施形態に限定されるものではなく、本開示の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
上記実施形態でCPUがソフトウェア(プログラム)を読み込んで実行した空間データ高解像度化プログラムを、CPU以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、FPGA(Field−Programmable Gate Array)等の製造後に回路構成を変更可能なPLD(Programmable Logic Device)、及びASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、空間データ高解像度化プログラムを、これらの各種のプロセッサのうちの1つで実行してもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGA、及びCPUとFPGAとの組み合わせ等)で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。
また、上記実施形態では、空間データ高解像度化プログラムがストレージ14に予め記憶(インストール)されている態様を説明したが、これに限定されない。プログラムは、CD−ROM(Compact Disk Read Only Memory)、DVD−ROM(Digital Versatile Disk Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の非一時的(non−transitory)記憶媒体に記憶された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
10 空間データ高解像度化装置
11 CPU
12 ROM
13 RAM
14 ストレージ
15 入力部
16 表示部
17 通信インタフェース
19 バス
101 領域データ格納部
102 ターゲット分割格納部
103 操作部
104 検索部
105 高解像度化部
106 パラメータ推定部
107 空間スケールパラメータ格納部
108 混合係数格納部
109 残差分散パラメータ格納部
110 ノイズ分散パラメータ格納部
111 高解像度データ算出部
112 出力部

Claims (4)

  1. 空間を分割した各領域に値が紐付いた領域データであって、分割の粒度が各々異なる複数の領域データを表すガウス過程モデルであって、前記領域データ間の相関関数の空間スケールパラメータと、前記相関関数のノイズ分散パラメータとを含む前記ガウス過程モデルに基づいて、前記領域データの値をガウス過程の領域積分で表した関数が最大となるように、前記空間スケールパラメータ及び前記ノイズ分散パラメータを推定するパラメータ推定部と、
    高解像度化する対象の領域データと、前記対象の領域データより解像度の高い粒度で空間を分割することを示すターゲット分割の指定を受け付ける検索部と、
    前記パラメータ推定部により推定された前記空間スケールパラメータ及び前記ノイズ分散パラメータを含む前記ガウス過程モデルにおいて、前記対象の領域データの値を、前記ターゲット分割が示す粒度で前記空間を分割した領域毎に領域積分することにより、前記対象の領域データを高解像度化した高解像度データを算出する高解像度データ算出部と、
    を含む空間データ高解像度化装置。
  2. 前記ガウス過程モデルは、前記空間スケールパラメータ、前記ノイズ分散パラメータ、前記ガウス過程と前記領域データとの混合係数、及び前記ガウス過程に対する残差分散パラメータを含み、
    前記パラメータ推定部は、前記領域データの値をガウス過程の領域積分で表した関数が最大となるように、前記空間スケールパラメータ、前記ノイズ分散パラメータ、前記混合係数、及び前記残差分散パラメータを推定し、
    前記高解像度データ算出部は、前記パラメータ推定部により推定された前記空間スケールパラメータ、前記ノイズ分散パラメータ、前記混合係数、及び前記残差分散パラメータを含む前記ガウス過程モデルにおいて、前記対象の領域データの値を、前記ターゲット分割が示す粒度で前記空間を分割した領域毎に領域積分することにより、前記対象の領域データを高解像度化した高解像度データを算出する
    請求項1記載の空間データ高解像度化装置。
  3. パラメータ推定部が、空間を分割した各領域に値が紐付いた領域データであって、分割の粒度が各々異なる複数の領域データを表すガウス過程モデルであって、前記領域データ間の相関関数の空間スケールパラメータと、前記相関関数のノイズ分散パラメータとを含む前記ガウス過程モデルに基づいて、前記領域データの値をガウス過程の領域積分で表した関数が最大となるように、前記空間スケールパラメータ及び前記ノイズ分散パラメータを推定し、
    検索部が、高解像度化する対象の領域データと、前記対象の領域データより解像度の高い粒度で空間を分割することを示すターゲット分割の指定を受け付け、
    高解像度データ算出部が、前記パラメータ推定部により推定された前記空間スケールパラメータ及び前記ノイズ分散パラメータを含む前記ガウス過程モデルにおいて、前記対象の領域データの値を、前記ターゲット分割が示す粒度で前記空間を分割した領域毎に領域積分することにより、前記対象の領域データを高解像度化した高解像度データを算出する
    空間データ高解像度化方法。
  4. コンピュータを、請求項1又は請求項2記載の空間データ高解像度化装置の各部として機能させるための空間データ高解像度化プログラム。
JP2019128429A 2019-07-10 2019-07-10 空間データ高解像度化装置、空間データ高解像度化方法、及び空間データ高解像度化プログラム Active JP7133175B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019128429A JP7133175B2 (ja) 2019-07-10 2019-07-10 空間データ高解像度化装置、空間データ高解像度化方法、及び空間データ高解像度化プログラム
US17/626,027 US20220253736A1 (en) 2019-07-10 2020-07-10 Aggregated data resolution enhancement device, aggregated data resolution enhancement method, and aggregated data resolution enhancement program
PCT/JP2020/027112 WO2021006347A1 (ja) 2019-07-10 2020-07-10 集約データ高解像度化装置、集約データ高解像度化方法、及び集約データ高解像度化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019128429A JP7133175B2 (ja) 2019-07-10 2019-07-10 空間データ高解像度化装置、空間データ高解像度化方法、及び空間データ高解像度化プログラム

Publications (2)

Publication Number Publication Date
JP2021015348A true JP2021015348A (ja) 2021-02-12
JP7133175B2 JP7133175B2 (ja) 2022-09-08

Family

ID=74114553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019128429A Active JP7133175B2 (ja) 2019-07-10 2019-07-10 空間データ高解像度化装置、空間データ高解像度化方法、及び空間データ高解像度化プログラム

Country Status (3)

Country Link
US (1) US20220253736A1 (ja)
JP (1) JP7133175B2 (ja)
WO (1) WO2021006347A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010044618A (ja) * 2008-08-13 2010-02-25 Hitachi Ltd 欠落データの補間方法、その実行プログラム、及びデータ収集装置
US20110257949A1 (en) * 2008-09-19 2011-10-20 Shrihari Vasudevan Method and system of data modelling
JP2018049390A (ja) * 2016-09-20 2018-03-29 株式会社東芝 特性値推定装置および特性値推定方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010044618A (ja) * 2008-08-13 2010-02-25 Hitachi Ltd 欠落データの補間方法、その実行プログラム、及びデータ収集装置
US20110257949A1 (en) * 2008-09-19 2011-10-20 Shrihari Vasudevan Method and system of data modelling
JP2018049390A (ja) * 2016-09-20 2018-03-29 株式会社東芝 特性値推定装置および特性値推定方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHRISTOPHER SMITH-CLARKE ET AL.: "Poverty on the Cheap: Estimating Poverty Maps Using Aggregated Mobile Communication Networks", PROCEEDINGS OF THE SIGCHI CONFERENCE ON HUMAN FACTORS IN COMPUTING SYSTEMS, JPN7021002117, 26 April 2014 (2014-04-26), US, pages 511 - 520, XP058608542, ISSN: 0004839696, DOI: 10.1145/2556288.2557358 *
TANAKA, YUSUKE, ET AL.: ""Refining Coarse-grained Spatial Data using Auxiliary Spatial Data Sets with Various Granularities"", ARXIV:1809.07952V1, vol. version v1, JPN6020031556, 21 September 2018 (2018-09-21), pages 1 - 11, ISSN: 0004839694 *
TANAKA, YUSUKE, ET AL.: ""Spatially Aggregated Gaussian Processes with Multivariate Areal Outputs"", ARXIV:1907.08350V2, vol. version v2, JPN6020031559, 7 January 2020 (2020-01-07), pages 1 - 15, XP055953939, ISSN: 0004839695 *
石井那由他、白石 陽、石塚宏紀、戸辺義人: "空間補間による異種解像度センサデータの統合手法", 情報処理学会論文誌, vol. Vol.49,No.SIG7(TOD37), JPN6021021924, 15 March 2008 (2008-03-15), JP, pages 44 - 58, ISSN: 0004839697 *

Also Published As

Publication number Publication date
WO2021006347A1 (ja) 2021-01-14
JP7133175B2 (ja) 2022-09-08
US20220253736A1 (en) 2022-08-11

Similar Documents

Publication Publication Date Title
Sigrist et al. Stochastic partial differential equation based modelling of large space–time data sets
Höge et al. A primer for model selection: The decisive role of model complexity
Chen A new methodology of spatial cross-correlation analysis
Dambon et al. Maximum likelihood estimation of spatially varying coefficient models for large data with an application to real estate price prediction
EP2704065A1 (en) System and method for updating a data structure with sensor measurement data
Waller et al. Estimating correlated observation error statistics using an ensemble transform Kalman filter
Wan et al. A Bayesian approach to multiscale inverse problems using the sequential Monte Carlo method
Sommerfeld et al. Confidence regions for spatial excursion sets from repeated random field observations, with an application to climate
Butusov et al. New technique to quantify chaotic dynamics based on differences between semi-implicit integration schemes
Lyu et al. Data-driven development of three-dimensional subsurface models from sparse measurements using Bayesian compressive sampling: A benchmarking study
Bolin et al. Covariance–based rational approximations of fractional SPDEs for computationally efficient Bayesian inference
WO2020261447A1 (ja) パラメタ推定装置、パラメタ推定方法、及びパラメタ推定プログラム
JP7133175B2 (ja) 空間データ高解像度化装置、空間データ高解像度化方法、及び空間データ高解像度化プログラム
Shen et al. Estimating species pools for a single ecological assemblage
Buccianti Frequency distributions of geochemical data, scaling laws, and properties of compositions
JP2019191936A (ja) 高解像度化装置、高解像度化方法、空間データ高解像度化方法、およびプログラム
JP7283574B2 (ja) 空間データ高解像度化方法、空間データ高解像度化装置及びプログラム
JP7439957B2 (ja) パラメータ推定装置、集約データ高解像度化装置、パラメータ推定方法、集約データ高解像度化方法、及びプログラム
JP2013205848A (ja) コスト推定システム、方法及びプログラム
Ha et al. Simplified nonlinear model for the weight estimation of FPSO plant topside using the statistical method
Fisher et al. Time series modeling of pathogen-specific disease probabilities with subsampled data
Kok The asymptotic behaviour of the maximum likelihood function of Kriging approximations using the Gaussian correlation function
Kang et al. A method of DTM construction based on quadrangular irregular networks and related error analysis
Beer et al. Conceptual comparison of Bayesian approaches and imprecise probabilities
Lin et al. Pseudomartingale estimating equations for modulated renewal process models

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190712

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210813

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220802

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220819

R150 Certificate of patent or registration of utility model

Ref document number: 7133175

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150