JP2004021717A - 空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法 - Google Patents
空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法 Download PDFInfo
- Publication number
- JP2004021717A JP2004021717A JP2002177352A JP2002177352A JP2004021717A JP 2004021717 A JP2004021717 A JP 2004021717A JP 2002177352 A JP2002177352 A JP 2002177352A JP 2002177352 A JP2002177352 A JP 2002177352A JP 2004021717 A JP2004021717 A JP 2004021717A
- Authority
- JP
- Japan
- Prior art keywords
- data
- information
- position information
- dimensional
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】空間内にある分析対象データの空間的な特徴を導出するときに、分析対象データが存在する空間の構造や分析対象データの属性を考慮してデータ分析することができる空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法を提供する。
【解決手段】空間データ分析装置は、i次元(iは2以上の整数)の位置情報を含む複数の分析対象データを記憶する記憶部10と、各々の分析対象データごとに該分析対象データと関係のあるj種類(jは1以上の整数)の関連情報を記憶する記憶部20と、j種類の関連情報の各々に基づいて決定したj個の数値情報とi次元の位置情報とによって(i+j)次元の位置情報を生成し、複数の(i+j)次元の位置情報で示される位置の相互の(i+j)次元の空間距離に基づいて分析対象データを分類するデータ処理演算部30とを備える。
【選択図】 図1
【解決手段】空間データ分析装置は、i次元(iは2以上の整数)の位置情報を含む複数の分析対象データを記憶する記憶部10と、各々の分析対象データごとに該分析対象データと関係のあるj種類(jは1以上の整数)の関連情報を記憶する記憶部20と、j種類の関連情報の各々に基づいて決定したj個の数値情報とi次元の位置情報とによって(i+j)次元の位置情報を生成し、複数の(i+j)次元の位置情報で示される位置の相互の(i+j)次元の空間距離に基づいて分析対象データを分類するデータ処理演算部30とを備える。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法に関する。
【0002】
【従来の技術】
データベース内にある多数の情報の空間的な特徴を導出する空間データ分析方法として空間データマイニング法がある。空間データマイニング法は、2次元または3次元以上の空間座標で示された分析対象データが空間内のどの箇所に密集しているか等の分析対象データの空間的な特徴を発見するために用いられる。
【0003】
図14は、2次元の空間座標で示された分析対象データの一例として道路上の交通事故発生記録データを示した図である。この交通事故発生記録データは、交通事故が発生した場所を記録した分析対象データであり、交通事故が発生した場所を2次元の空間座標で示している。交通事故発生記録データは10件あり、それぞれにD1からD10までの記号が付けられている。
【0004】
図4は、横軸をX座標、縦軸をY座標とした道路地図を示した概念図である。尚、この従来例においては、本発明に係る実施の形態と同じ空間を用いているので、本発明に係る実施の形態において示す図4が引用されている。図4に示した道路地図には、道路1から道路3の3本の道路が示されており、道路1は道路2および道路3の上方を通過している。
【0005】
図5は、図14に示された各交通事故発生記録データを図4に示された道路地図にプロットした図である。尚、図14に示された各交通事故発生記録データを図4にプロットした図と図3に示された各交通事故発生記録データを図4にプロットした図とは同一になるので、この従来例においては、本発明に係る実施の形態において示す図5が引用されている。空間データマイニング法によれば、図5に示された空間において、プロットされている交通事故発生記録データが集中している箇所を発見することができる。空間データマイニング法の一例としてクラスタ分析が知られている。さらに代表的なクラスタ分析の一例としてk平均法が知られている。k平均法により交通事故発生記録データの集中している部分を発見するクラスタ分析を述べる。
【0006】
まず、分析の対象となる交通事故発生記録データから任意のn個のデータを選びそれらをn個のクラスタの重心の位置と仮定する。次に、それぞれの交通事故発生記録データは、最も距離(ユークリッド距離)の近い重心が含まれるクラスタに属するものとして分類される。次に、各クラスタ内の交通事故発生記録データの重心データを求め、それらを新たな重心の位置とする。更に、それぞれの交通事故発生記録データは、最も距離の近い新たな重心が含まれるクラスタに属するものとしてn個のクラスタに再度分類される。重心データと各クラスタに属するデータが変わらなくなるまで重心を求める処理と分類処理が繰り返される。
【0007】
クラスタ分析をより具体的に説明するために、図14に示された交通事故発生記録データを3つのクラスタに分類する。例えば、最初の重心がD2(座標 (65,80))、D5(座標 (40,10))、D9(座標 (80, 65))にあると仮定する。図15は、座標 (65,80))、座標 (40,10))および座標 (80, 65))をそれぞれ重心とするクラスタ1、クラスタ2およびクラスタ3の初期状態を示す図である。
【0008】
交通事故発生記録データとクラスタ1、クラスタ2およびクラスタ3の3つの重心との距離に基づいて、各交通事故発生記録データをいずれのクラスタに分類する。図16は、交通事故発生記録データが各クラスタに分類された状態を示す図である。図16には、各クラスタに含まれている重心データと、各クラスタに分類された交通事故発生記録データとが示されている。
【0009】
次に、各クラスタにおける新しい重心データを計算し、重心データの初期値を更新する。図17は、クラスタ1、クラスタ2およびクラスタ3における新しい重心データを示す図である。新しい重心の座標を(Px,Py)とし、n個の交通事故発生記録データの座標を(Xn,Yn)とした場合、
Px = ΣXn/n (式1)
Py = ΣYn/n (式2)
と表される。ただし、nは自然数である。
【0010】
交通事故発生記録データと新しい重心との距離に基づいて、各交通事故発生記録データをいずれのクラスタに再度分類する。
【0011】
図18は、クラスタ1、クラスタ2およびクラスタ3に交通事故発生記録データを再度分類した状態を示す図である。図18に示された各クラスタに含まれている交通事故発生記録データは、図16に示された各クラスタに含まれている交通事故発生記録データと同じである。従って、クラスタ分析の処理は終了し、結果として、図18に示された3つのクラスタ1、クラスタ2およびクラスタ3が得られる。
【0012】
図19は、クラスタ1、クラスタ2およびクラスタ3を図5の地図に示した図である。各クラスタは破線円により示されている。クラスタは同じクラスタに含まれる交通事故発生記録データが相互に類似することを示す。それにより、交通事故の発生し易い区分が発見できる。
【0013】
【発明が解決しようとする課題】
従来のクラスタ分析によれば、図19に示すように、クラスタ3に含まれるD3およびD4は地図空間においてはD8、D9およびD10と近い位置にある。従って、D3、D4、D8、D9およびD10は、同じクラスタとして分類されている。
【0014】
しかし、道路1と道路2とは立体交差しているので、D3およびD4は、道路1にあるD1およびD2と同じクラスタに分類されることが望ましい場合がある。例えば、交通事故の予測や交通事故の注意喚起を行うために、交通事故が発生する傾向などの特徴を得る場合には、D3およびD4は、道路1にあるD1およびD2と同じクラスタに分類されるべきである。
【0015】
このように従来のクラスタ分析によれば、道路や行政区画などの構造を考慮しつつ地図空間における分析対象データを分析する場合に、有用な分析結果が得られないという問題が生じる。
【0016】
従って、本発明の目的は、空間内にある分析対象データの空間的な特徴を導出するときに、分析対象データが存在する空間の構造や分析対象データの属性を考慮してデータ分析することができる空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法を提供することである。
【0017】
【課題を解決するための手段】
本発明に係る空間データ分析装置に従った実施の形態は、i次元(iは2以上の整数)の位置情報を含む複数の分析対象データを記憶する第1の記憶部と、各々の前記分析対象データごとに該分析対象データと関係のあるj種類(jは1以上の整数)の関連情報を記憶する前記第2の記憶部と、前記j種類の関連情報の各々に基づいて決定したj個の数値情報と前記i次元の位置情報とによって(i+j)次元の位置情報を生成し、複数の前記(i+j)次元の位置情報で示される位置の相互の(i+j)次元の空間距離に基づいて前記分析対象データを分類するデータ処理演算部とを備える。
【0018】
好ましくは、前記データ処理演算部は、任意に選択した前記分析対象データに基づいて、(i+j)次元の空間における複数の重心を設定し、前記分析対象データごとに前記(i+j)次元の位置情報と前記重心と間の(i+j)次元の空間距離における最も近傍の前記重心を求めることによって該分析対象データを分類する。
【0019】
好ましくは、前記関連情報のうちの1種類の関連情報について、該関連情報に基づいて決定された複数の数値情報の差は、一の前記分析対象データの前記i次元の位置情報と他の分析対象データの前記i次元の位置情報との間の距離が示す数値情報のうち最大の数値情報よりも大きい。
【0020】
好ましくは、前記i次元空間は2次元空間であり、前記j種類の区分データは1種類の関連情報であり、前記距離および前記空間距離は全てユークリッド距離である。
【0021】
本発明に係る空間データ分析プログラムに従った実施の形態は、i次元(iは2以上の整数)の位置情報を含む複数の分析対象データを記憶する第1の記憶部と、各々の前記分析対象データごとに該分析対象データと関係のあるj種類(jは1以上の整数)の関連情報を記憶する前記第2の記憶部とから前記分析対象データおよび前記関連情報を読み出すステップと、前記分析対象データを処理するデータ処理演算部に、前記j種類の関連情報の各々に基づいて決定したj個の数値情報と前記i次元の位置情報とによって(i+j)次元の位置情報を生成するステップと、複数の前記(i+j)次元の位置情報で示される位置の相互の(i+j)次元の空間距離に基づいて前記分析対象データを分類するステップとを処理させる。
【0022】
本発明に係る空間データ分析方法に従った実施の形態は、i次元(iは2以上の整数)の位置情報を含む複数の分析対象データを記憶する第1の記憶部と、各々の前記分析対象データごとに該分析対象データと関係のあるj種類(jは1以上の整数)の関連情報を記憶する前記第2の記憶部とから前記分析対象データおよび前記関連情報を読み出すステップと、前記j種類の関連情報の各々に基づいて決定したj個の数値情報と前記i次元の位置情報とによって(i+j)次元の位置情報を生成するステップと、複数の前記(i+j)次元の位置情報で示される位置の相互の(i+j)次元の空間距離に基づいて前記分析対象データを分類するステップとを具備する。
【0023】
【発明の実施の形態】
以下、本発明による実施の形態を説明する。尚、本実施の形態は本発明を限定するものではない。
【0024】
図1は、本発明に係る実施の形態に従った空間データ分析装置100のブロック図である。空間データ分析装置100は、ある情報を空間座標で示した位置情報を含む複数の分析対象データを記憶するデータベース10と、各々の分析対象データごとに該分析対象データと関係のある関連情報を記憶するデータベース20と、分析対象データを処理するデータ処理演算部30とを備える。空間データ分析装置100は、関連情報に基づいて決定した数値情報を分析対象データの位置情報に付加した高次元位置情報を記憶する記憶部40と、分析対象データの高次元位置情報を分析した結果データを記憶する記憶部50をさらに備える。
【0025】
また、データ処理演算部30は、分析対象データがいずれの関連情報に属するかを判定する判定部32と、分析対象データが属する関連情報に基づく数値情報を分析対象データの位置情報に付加して、分析対象データが存在する空間よりも高次元の空間座標で示した高次元位置情報とする高次元データ付加部34と、高次元位置情報で示される位置の相互間の距離を、例えば、k平均法などのクラスタ分析手法を用いて算出し、この距離に基づいてデータ分析を行うデータ分析部36とを有する。
【0026】
分析対象データに含まれた位置情報は、例えば、交通事故や携帯端末の発信等の事象が発生した位置を示す位置情報である。また、分析対象データに含まれた位置情報は、建造物や自然物等が単に存在する位置を示す位置情報であってもよい。分析対象データは、空間的な構造以外に、時間や天気などの概念的な属性を示すデータをさらに含んでいてもよい。
【0027】
分析対象データの位置情報が存在する空間は、1次元以上の空間であり、代表的には、2次元の平面空間および3次元の立体空間である。2次元空間または3次元空間としては、例えば、地図やGIS(Geographic Information System)等で示される空間がある。
【0028】
関連情報は、例えば、地図やGIS等の空間座標を示す構造情報であり、関連情報に基づいて決定された数値情報は、例えば、地図やGIS等の空間の構造情報を数値で示したものである。
【0029】
本実施の形態によれば、分析対象データの位置情報は空間内の建物や道路等の空間的な構造のいずれかに属す。データ処理演算部30は、関連情報に基づいて決定された数値情報を分析対象データの位置情報に付加することによって高次元位置情報を生成し、該高次元位置情報で示される位置の相互の距離に基づいて分析対象データを分類する。
【0030】
データ処理演算部30は、コンピュータのCPUを用いて実現され得る。さらに、空間データ分析装置100は、データベース10、データベース20、データ処理演算部30、記憶部40および記憶部50を一体に組み込んだワークステーションなどでもよい。
【0031】
図2(A)は、図1に示した空間データ分析装置100の構成要素間におけるデータのフローを示す。図2(B)は、本発明に係る第1の実施の形態に従った空間データ分析装置の処理手順を示すフロー図である。本実施の形態の空間データ分析装置100は、交通事故発生記録データを、例えばk平均法などのクラスタ分析手法によりクラスタ分析して、交通事故の発生の傾向を抽出する。図2(A)および図2(B)に示されたフローを図3から図12を参照しつつ説明する。
【0032】
まず、データ処理演算部30が、データベース10から交通事故発生記録データを読み出し、データベース20から道路の構造情報を読み出す(ステップS10)。交通事故発生記録データは分析対象データの一例としてデータベース10に記憶されている。道路の構造情報は、関連情報の一例としてデータベース20に記憶されている。
【0033】
図3は、2次元の空間座標で示された道路上の交通事故発生記録データを示した図である。交通事故発生記録データは、交通事故が発生した位置情報などを記録したデータであり、交通事故が発生した場所の2次元の位置座標、即ち、X座標、Y座標が含まれている。交通事故発生記録データは10件あり、それぞれにD1からD10までの記号が付されている。交通事故発生記録データは、交通事故が発生した場所のX座標、Y座標、その他のデータとして、交通事故が発生した時間、交通事故が発生したときの天気を示すデータをさらに含む。
【0034】
図4は、横軸をX座標、縦軸をY座標とした道路地図を示した概念図である。図4は、X座標およびY座標がともに0から100までの値をとることができる2次元の空間を示す。図4の道路地図には、道路の構造情報として、道路1、道路2および道路3の3つの道路が示されている。道路1は、座標(0,80)付近から座標(90,80)付近を経由して座標(90,0)付近に達している。道路2は、座標(0,75)付近から座標(100,75)付近に達している。道路3は、座標(0,10)付近から座標(100,10)付近に達している。道路の構造情報は、このような道路1、道路2および道路3が2次元の空間内を占める範囲を座標で示した情報でよい。例えば、図4の空間において道路1の幅の数値が±5であるとした場合、道路1の構造情報は、座標(0,75)、(85,75)、(85,0)、(95,0)、(95,85)、(0,85)で囲まれた範囲として表せる。道路2および道路3についても、道路1と同様に座標で表すことができる。
【0035】
道路1は、3次元空間において、道路2および道路3の上方を通過している。即ち、道路1は道路2および道路3と立体交差している。従って、道路1、道路2および道路3は空間内において別々の構造であり、互いに異なる種類の関連情報としてデータベース20に記憶されている。
【0036】
次に、交通事故発生記録データが道路1、道路2または道路3のいずれの道路に属するかの判定処理を実行する(ステップS20)。この判定処理は、判定部32が、各交通事故発生記録データの位置座標が各道路の構造情報に含まれるか否かを判定することにより実現される。
【0037】
図5は、図3に示された各交通事故発生記録データの位置を図4に示された道路地図にプロットした図である。図6は、交通事故発生データに道路1、道路2または道路3いずれかを概念的に付加した図である。本実施の形態によれば、例えば、k平均法により交通事故発生記録データの集中している部分を発見するクラスタ分析手法が用いられている。クラスタは分析対象データからなる群集である。例えば、交通事故発生記録データをより多く含むクラスタのある位置は交通事故が多発している位置であることを示す。このように、クラスタ分析法とは、交通事故発生記録データ等の分析対象データをプロットしたときの、これらの分析対象データが比較的まとまって現れる範囲を分析することによって、交通事故等の事象が発生する傾向を得る方法である。
【0038】
次に、高次元データ付加部34が、構造情報ごとに異なる数値を交通事故発生記録データの位置情報に付加し、高次元位置情報を生成する(ステップS30)。高次元位置情報は、例えば、交通事故発生記録データ等の分析対象データの位置座標に、構造情報等の関連情報に基づいて決定された数値を付加した位置座標である。よって、高次元位置情報は、データベース10において分析対象データが有する位置情報よりも高次元の位置情報である。本実施の形態によれば、この高次元位置情報を用いて交通事故発生記録データをクラスタに分類する。尚、予め、道路の構造情報に基づいて決定された数値が各交通事故発生記録データの位置座標に付加されている場合には、判定処理(ステップS20)は実行されない。
【0039】
交通事故発生記録データの位置情報は地図上の2次元空間における位置座標である。高次元データ付加部34は、この2次元の位置座標に3次元目のデータ成分として数値情報を付加する。数値情報は、構造情報に基づき決定され、構造情報ごとに異なる。ステップS30の処理は、各構造情報に適当な数値を割り付すことにより実現できる。例えば、各構造情報に基づく数値情報は、数値情報の相互の間の差が、複数の交通事故発生記録データの位置情報の間の2次元空間における距離の最大値よりも大きくなるように決定される。本実施の形態によれば、道路1の構造情報に基づく数値情報が1000、道路2の構造情報に基づく数値情報が2000、並びに、道路3の構造情報に基づく数値情報が3000と決定されている。図7に高次元位置情報を含む交通事故発生記録データが示されている。さらに、高次元位置情報は、記憶部40へ記憶され、データ分析部36へ送信される。
【0040】
次に、データ分析部36が、高次元位置情報に基づいて分析対象データをクラスタ分析する(ステップS40からステップS90)。本実施の形態におけるクラスタ分析は、従来例と同様に高次元位置情報間のユークリッド距離に基づくものでよい。
【0041】
まず、データ分析部36は図3のデータから3つのクラスタを生成する(ステップS40)。本実施の形態において、最初の重心の位置座標はD2(座標 (65,80))、D5(座標 (40,10))およびD9(座標 (80,65))であると仮定する。尚、重心とは、各クラスタの重心であり、クラスタ内の分析対象データの位置情報を後述の式1および式2によって平均した位置である。但し、最初の重心は形成するクラスタと同数の重心を任意に選択する。本実施の形態において、最初の重心は高次元位置情報のいずれかである。重心D2、D5およびD9のそれぞれのクラスタはクラスタ1、クラスタ2およびクラスタ3とする。図8に各クラスタの初期状態を示す。初期状態のクラスタ1、クラスタ2およびクラスタ3はデータを含んでいない。
【0042】
次に、データ分析部36は、各高次元位置情報で示された位置と重心D2、D5およびD9の位置とのユークリッド距離を計算する(ステップS50)。さらに、各高次元位置情報は、高次元位置情報に距離(ユークリッド距離)の最も近い重心を含むクラスタに属するものとして分類される(ステップS60)。交通事故発生記録データは、交通事故発生記録データに含まれる高次元位置情報に従って分類される。
【0043】
本実施の形態において、2つの交通事故発生記録データの位置情報が図4に示された2次元空間の対角付近にある場合に、それらの交通事故発生記録データに含まれる位置情報の間の距離が最大の数値となる。即ち、交通事故発生記録データの位置情報の相互間の2次元空間における最大距離は、図4に示された2次元空間の対角距離にほぼ等しく、100*1.41である。一方で、各高次元位置情報に付加された数値情報間の差は1000である。よって、数値情報間の差は、交通事故発生記録データの位置情報間の2次元空間における最大距離の数値情報よりも大きい。それによって、2つの交通事故発生記録データの位置が2次元空間において近距離であっても、それらの構造情報が互いに異なれば、該2つの交通事故発生記録データは異なるクラスタに分類される。
【0044】
図9に高次元位置情報が各クラスタに分類された状態を示す。クラスタ1には、データD1、D2、D3およびD4が含まれる。クラスタ2には、D5、D6およびD7が含まれる。クラスタ3には、D8、D9およびD10が含まれる。本実施の形態によれば、初期状態における重心は構造情報ごとに選択されている。それによって、本実施の形態によれば、各データD1からD10は、構造情報に基づく数値が等しい重心を含むクラスタへ分類される。
【0045】
次に、各クラスタの新しい重心の位置座標が計算され、重心の初期値が変更される(ステップS70)。クラスタの新しい重心の座標(Px,Py)は、クラスタにn個の高次元位置情報が含まれているとし、かつn個の高次元位置情報の座標を (Xn,Yn)としたとき、
Px = ΣXn/n (式1)
Py = ΣYn/n (式2)
と表される。ただし、nは自然数である。図10には、各クラスタの重心の座標を更新した状態が示されている。
【0046】
次に、クラスタの重心が変更されたので、高次元位置情報は新しい重心に基づき再度分類される(ステップS80)。高次元位置情報は、該高次元位置情報から最も距離(ユークリッド距離)の近い重心が含まれるクラスタに属するものとして分類される。図11に更新されたクラスタの状態を示す。
【0047】
さらに、現時点の各クラスタに属する高次元位置情報が、更新前の各クラスタに属する高次元位置情報と等しいかを判定する(ステップS90)。両者が異なる場合には、ステップS70において各クラスタの新しい重心の座標が再度計算され、重心の座標が変更される。両者が等しい場合には、クラスタ分析の処理は終了する。交通事故発生記録データはそれに含まれる高次元位置情報に従って分類され、その分析結果は記憶装置50へ保存される。分析結果を表示させることにより、交通事故発生記録データ等の分析対象データの空間的な傾向を求めることができる。
【0048】
図11においては、各クラスタに属するデータは図9のものと同じである。よって、処理は終了し、図11に示す3つのクラスタが結果として得られる。
【0049】
図12は、クラスタ1、クラスタ2およびクラスタ3を図5に示した図である。各クラスタは破線円により示されている。本実施の形態により、D1、D2、D3およびD4は同じクラスタに分類され、道路1の曲り角付近で事故が多発するという傾向が得られる。図19に示した従来の分析結果と比較すると、本実施の形態においては、図12に示すように道路や行政区画などの空間的な構造を考慮したクラスタ分析が行われる。それにより、交通事故が発生する傾向などの特徴を正確に得ることができる。このように、本実施の形態は、従来と同様にユークリッド距離を用いたクラスタ分析を利用してはいるが、空間的な構造を考慮して分析対象データの空間的な傾向を得ることができる。
【0050】
また、構造情報以外に、交通事故発生データの時刻、天候などの概念的な属性を利用し、そのような属性を有する分析対象データだけをデータベース10から抽出し、データ分析してもよい。それにより、交通事故発生データの他の傾向が発見され得る。例えば、雨の日のみの関連情報をデータベース20から抽出した場合に、雨の日に交通事故が多発する空間位置を発見できる。
【0051】
さらに、本実施の形態においては、道路1、道路2および道路3の構造情報に基づく数値情報を交通事故発生データの位置情報へ付加して高次元位置情報が得られた。しかし、構造情報に代えて、時刻、天候などの属性による関連情報に基づいた数値情報が交通事故発生データの位置情報へ付加されて高次元位置情報を生成してもよい。例えば、昼間と夜とにそれぞれ異なる数値情報が与えられてもよい。また、晴れと雨とにそれぞれ異なる数値情報が与えられてもよい。それによって、時刻、天候などの属性を3次元目のデータ成分として高次元位置情報を生成し、該高次元位置情報に基づいてクラスタ分析が実行され得る。
【0052】
このように、本実施の形態によれば、空間の構造情報またはその他の属性等の関連情報を考慮したデータ分析を行うことができる。データ分析の結果は、例えば、交通事故防止の対策などに利用され得る。
【0053】
図13は、交通事故発生データに上り車線または下り車線の構造情報に基づき、4次元目の数値情報を付加した高次元位置情報を含む交通事故発生データを示す図である。このように、高次元位置情報の4次元目以上の数値情報が付加されてもよい。例えば、同じ道路でも上り車線と下り車線との区別をする場合に、上り車線と下り車線とに異なる数値情報が与えられる。該数値情報が高次元位置情報の4次元目のデータ成分として付加される。
【0054】
本実施の形態において、D1、D3、D5、D7およびD9は上り車線に含まれ、D2、D4、D6、D8およびD10は下り車線に含まれるとする。また、同じ道路の上り車線と下り車線との距離は異なる道路間の距離より小さくする。例えば、道路1、道路2および道路3のそれぞれに1000、2000および3000が3次元目の数値情報として与えられたが、上り車線には4次元目の数値情報として0が、上り車線には4次元目の数値情報として10が与えられる。
【0055】
このように、分析対象データに3次元目に加えた関連情報とは異なる内容を示す関連情報を4次元目に付加した高次元位置情報を用いても、上述の実施の形態と同様に例えば、k平均法などのクラスタ分析を行うことができる。
【0056】
3次元目および4次元目の数値情報と同様に、5次元目以上の数値情報を分析対象データに付加することもできる。例えば、分析対象データを含む空間がi次元(iは2以上の整数)の空間でありかつ関連情報がj種類あるとした場合のデータ分析装置100の動作を図2(B)に示すフローに沿って説明する。
【0057】
ステップS10において、データ処理演算部30が、データベース10からi次元の位置情報を含む交通事故発生記録データを読み出し、データベース20からj種類の関連情報を読み出す。
【0058】
ステップS20において、判定部32は、交通事故発生記録データが関連情報のうちいずれに属するかの判定処理を実行する。関連情報は種類あるので、判定部32は、各種類ごとにいずれの関連情報に属するかを判定する。判定処理は、j種類の関連情報のぞれぞれに関して上記したステップS20と同様の処理を施せばよい。
【0059】
ステップS30において、高次元データ付加部34が、関連情報ごとに異なる数値を交通事故発生記録データの位置情報に付加し、高次元位置情報を生成する。関連情報はj種類あるので、j種類の関連情報に基づくj個の数値情報がi次元の分析対象データに付加され、その結果、(i+j)次元の高次元位置情報が得られる。
【0060】
ステップS40からステップS90において、(i+j)次元の高次元位置情報を用いたクラスタ分析を上述の実施の形態と同様に実行する。クラスタ分析は、上述の実施の形態と同様に高次元位置情報間のユークリッド距離に基づくものでよい。
【0061】
ステップS40において、最初の重心を選択しクラスタを生成する。重心の位置座標は(i+j)次元の高次元位置情報のいずれかである。
【0062】
ステップS50において、データ分析部36は、各高次元位置情報で示された位置と重心の位置とのユークリッド距離を計算する。ここで、高次元位置情報および重心の位置座標は(i+j)次元であるので、ユークリッド距離も(i+j)次元における空間距離である。
【0063】
ステップS60において、各交通事故発生記録データは、高次元位置情報に距離の最も近い重心を含むクラスタに属するものとして分類される。
【0064】
ステップS70において、各クラスタの新しい重心の位置座標が計算され、重心の初期値が変更される。クラスタにn個の高次元位置情報が含まれているとする。クラスタの新しい重心の座標(P1,P2,P3,…Pi + j)は、n個の(i+j)次元の高次元位置情報の座標を (Hn 1,Hn 2,Hn 3, …Hn (i+j))としたときに、
Pk= ΣHn k/n (式3)
と表される。ただし、nは整数である。また、1≦k≦(i+j)である。
【0065】
ステップS80において、クラスタの重心が変更されたので、高次元位置情報は新しい重心に基づき再度分類される。高次元位置情報は、(i+j)次元におけるユークリッド距離において最も近い重心が含まれるクラスタに属するものとして分類される。
【0066】
ステップS90において、現時点の各クラスタに属する高次元位置情報が、更新前の各クラスタに属する高次元位置情報と等しいかを判定する。両者が異なる場合には、ステップS70において各クラスタの新しい重心の座標が再度計算され、重心の座標が変更される。両者が等しい場合には、クラスタ分析の処理は終了する。交通事故発生記録データはそれに含まれる高次元位置情報とともに分類され、その分析結果は記憶装置50へ保存される。分析結果を表示させることにより、交通事故発生記録データ等の分析対象データの空間的な傾向を求めることができる。このように、データ分析装置100は、(i+j)次元の高次元位置情報を用いて分析対象データを分類することができ、様々な関連情報を考慮したクラスタ分析を行うことができる。
【0067】
上述したデータ分析装置は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、データ分析装置の機能を実現するプログラムをフロッピーディスクやCD−ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の携帯可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
【0068】
また、上述したデータ分析装置の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
【0069】
【発明の効果】
本発明に従った空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法により、空間内にある分析対象データの空間的な特徴を導出するときに、分析対象データが存在する空間の構造や分析対象データの属性を考慮してデータ分析することができる。
【図面の簡単な説明】
【図1】本発明に係る実施の形態に従った空間データ分析装置100のブロック図。
【図2】図1に示した空間データ分析装置100の構成要素間におけるデータのフロー図、および、空間データ分析装置100の動作を示すフロー図。
【図3】2次元の空間座標で示された道路上の交通事故発生記録データを示した図。
【図4】道路の区分データを含む横軸をX座標、縦軸をY座標とした道路地図を示した概念図。
【図5】図3に示された各交通事故発生記録データを図4に示された道路地図にプロットした図。
【図6】道路1、道路2または道路3の構造情報が付加された交通事故発生データを示した図。
【図7】高次元位置情報を含む交通事故発生記録データを示す図。
【図8】各クラスタの初期状態を示す図。
【図9】高次元位置情報が各クラスタに分類された状態を示す図。
【図10】各クラスタの重心を更新した状態を示す図。
【図11】クラスタが更新された状態を示す図。
【図12】クラスタ1、クラスタ2およびクラスタ3を図5に示した図。
【図13】本発明に係るデータ分析方法またはデータ分析プログラムの変形例として、交通事故発生データに4次元目の区分データを付加したデータを示す図。
【図14】2次元の空間座標で示された分析対象データの一例として道路上の交通事故発生記録データを示した図。
【図15】クラスタ1、クラスタ2およびクラスタ3の初期状態を示す図。
【図16】従来のデータ分析方法により交通事故発生記録データが各クラスタに分類された状態を示す図。
【図17】クラスタ1、クラスタ2およびクラスタ3における新しい重心データを示す図。
【図18】従来のデータ分析方法によりクラスタ1、クラスタ2およびクラスタ3に交通事故発生記録データが再度分類された状態を示す図。
【図19】従来のデータ分析方法により分類されたクラスタ1、クラスタ2およびクラスタ3を図5の地図に示した図。
【符号の説明】
100 データ分析装置
10、20 データベース
30 データ処理演算部
40、50 記憶部
32 判定部
34 データ付加部
36 データ分析部
【発明の属する技術分野】
本発明は、空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法に関する。
【0002】
【従来の技術】
データベース内にある多数の情報の空間的な特徴を導出する空間データ分析方法として空間データマイニング法がある。空間データマイニング法は、2次元または3次元以上の空間座標で示された分析対象データが空間内のどの箇所に密集しているか等の分析対象データの空間的な特徴を発見するために用いられる。
【0003】
図14は、2次元の空間座標で示された分析対象データの一例として道路上の交通事故発生記録データを示した図である。この交通事故発生記録データは、交通事故が発生した場所を記録した分析対象データであり、交通事故が発生した場所を2次元の空間座標で示している。交通事故発生記録データは10件あり、それぞれにD1からD10までの記号が付けられている。
【0004】
図4は、横軸をX座標、縦軸をY座標とした道路地図を示した概念図である。尚、この従来例においては、本発明に係る実施の形態と同じ空間を用いているので、本発明に係る実施の形態において示す図4が引用されている。図4に示した道路地図には、道路1から道路3の3本の道路が示されており、道路1は道路2および道路3の上方を通過している。
【0005】
図5は、図14に示された各交通事故発生記録データを図4に示された道路地図にプロットした図である。尚、図14に示された各交通事故発生記録データを図4にプロットした図と図3に示された各交通事故発生記録データを図4にプロットした図とは同一になるので、この従来例においては、本発明に係る実施の形態において示す図5が引用されている。空間データマイニング法によれば、図5に示された空間において、プロットされている交通事故発生記録データが集中している箇所を発見することができる。空間データマイニング法の一例としてクラスタ分析が知られている。さらに代表的なクラスタ分析の一例としてk平均法が知られている。k平均法により交通事故発生記録データの集中している部分を発見するクラスタ分析を述べる。
【0006】
まず、分析の対象となる交通事故発生記録データから任意のn個のデータを選びそれらをn個のクラスタの重心の位置と仮定する。次に、それぞれの交通事故発生記録データは、最も距離(ユークリッド距離)の近い重心が含まれるクラスタに属するものとして分類される。次に、各クラスタ内の交通事故発生記録データの重心データを求め、それらを新たな重心の位置とする。更に、それぞれの交通事故発生記録データは、最も距離の近い新たな重心が含まれるクラスタに属するものとしてn個のクラスタに再度分類される。重心データと各クラスタに属するデータが変わらなくなるまで重心を求める処理と分類処理が繰り返される。
【0007】
クラスタ分析をより具体的に説明するために、図14に示された交通事故発生記録データを3つのクラスタに分類する。例えば、最初の重心がD2(座標 (65,80))、D5(座標 (40,10))、D9(座標 (80, 65))にあると仮定する。図15は、座標 (65,80))、座標 (40,10))および座標 (80, 65))をそれぞれ重心とするクラスタ1、クラスタ2およびクラスタ3の初期状態を示す図である。
【0008】
交通事故発生記録データとクラスタ1、クラスタ2およびクラスタ3の3つの重心との距離に基づいて、各交通事故発生記録データをいずれのクラスタに分類する。図16は、交通事故発生記録データが各クラスタに分類された状態を示す図である。図16には、各クラスタに含まれている重心データと、各クラスタに分類された交通事故発生記録データとが示されている。
【0009】
次に、各クラスタにおける新しい重心データを計算し、重心データの初期値を更新する。図17は、クラスタ1、クラスタ2およびクラスタ3における新しい重心データを示す図である。新しい重心の座標を(Px,Py)とし、n個の交通事故発生記録データの座標を(Xn,Yn)とした場合、
Px = ΣXn/n (式1)
Py = ΣYn/n (式2)
と表される。ただし、nは自然数である。
【0010】
交通事故発生記録データと新しい重心との距離に基づいて、各交通事故発生記録データをいずれのクラスタに再度分類する。
【0011】
図18は、クラスタ1、クラスタ2およびクラスタ3に交通事故発生記録データを再度分類した状態を示す図である。図18に示された各クラスタに含まれている交通事故発生記録データは、図16に示された各クラスタに含まれている交通事故発生記録データと同じである。従って、クラスタ分析の処理は終了し、結果として、図18に示された3つのクラスタ1、クラスタ2およびクラスタ3が得られる。
【0012】
図19は、クラスタ1、クラスタ2およびクラスタ3を図5の地図に示した図である。各クラスタは破線円により示されている。クラスタは同じクラスタに含まれる交通事故発生記録データが相互に類似することを示す。それにより、交通事故の発生し易い区分が発見できる。
【0013】
【発明が解決しようとする課題】
従来のクラスタ分析によれば、図19に示すように、クラスタ3に含まれるD3およびD4は地図空間においてはD8、D9およびD10と近い位置にある。従って、D3、D4、D8、D9およびD10は、同じクラスタとして分類されている。
【0014】
しかし、道路1と道路2とは立体交差しているので、D3およびD4は、道路1にあるD1およびD2と同じクラスタに分類されることが望ましい場合がある。例えば、交通事故の予測や交通事故の注意喚起を行うために、交通事故が発生する傾向などの特徴を得る場合には、D3およびD4は、道路1にあるD1およびD2と同じクラスタに分類されるべきである。
【0015】
このように従来のクラスタ分析によれば、道路や行政区画などの構造を考慮しつつ地図空間における分析対象データを分析する場合に、有用な分析結果が得られないという問題が生じる。
【0016】
従って、本発明の目的は、空間内にある分析対象データの空間的な特徴を導出するときに、分析対象データが存在する空間の構造や分析対象データの属性を考慮してデータ分析することができる空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法を提供することである。
【0017】
【課題を解決するための手段】
本発明に係る空間データ分析装置に従った実施の形態は、i次元(iは2以上の整数)の位置情報を含む複数の分析対象データを記憶する第1の記憶部と、各々の前記分析対象データごとに該分析対象データと関係のあるj種類(jは1以上の整数)の関連情報を記憶する前記第2の記憶部と、前記j種類の関連情報の各々に基づいて決定したj個の数値情報と前記i次元の位置情報とによって(i+j)次元の位置情報を生成し、複数の前記(i+j)次元の位置情報で示される位置の相互の(i+j)次元の空間距離に基づいて前記分析対象データを分類するデータ処理演算部とを備える。
【0018】
好ましくは、前記データ処理演算部は、任意に選択した前記分析対象データに基づいて、(i+j)次元の空間における複数の重心を設定し、前記分析対象データごとに前記(i+j)次元の位置情報と前記重心と間の(i+j)次元の空間距離における最も近傍の前記重心を求めることによって該分析対象データを分類する。
【0019】
好ましくは、前記関連情報のうちの1種類の関連情報について、該関連情報に基づいて決定された複数の数値情報の差は、一の前記分析対象データの前記i次元の位置情報と他の分析対象データの前記i次元の位置情報との間の距離が示す数値情報のうち最大の数値情報よりも大きい。
【0020】
好ましくは、前記i次元空間は2次元空間であり、前記j種類の区分データは1種類の関連情報であり、前記距離および前記空間距離は全てユークリッド距離である。
【0021】
本発明に係る空間データ分析プログラムに従った実施の形態は、i次元(iは2以上の整数)の位置情報を含む複数の分析対象データを記憶する第1の記憶部と、各々の前記分析対象データごとに該分析対象データと関係のあるj種類(jは1以上の整数)の関連情報を記憶する前記第2の記憶部とから前記分析対象データおよび前記関連情報を読み出すステップと、前記分析対象データを処理するデータ処理演算部に、前記j種類の関連情報の各々に基づいて決定したj個の数値情報と前記i次元の位置情報とによって(i+j)次元の位置情報を生成するステップと、複数の前記(i+j)次元の位置情報で示される位置の相互の(i+j)次元の空間距離に基づいて前記分析対象データを分類するステップとを処理させる。
【0022】
本発明に係る空間データ分析方法に従った実施の形態は、i次元(iは2以上の整数)の位置情報を含む複数の分析対象データを記憶する第1の記憶部と、各々の前記分析対象データごとに該分析対象データと関係のあるj種類(jは1以上の整数)の関連情報を記憶する前記第2の記憶部とから前記分析対象データおよび前記関連情報を読み出すステップと、前記j種類の関連情報の各々に基づいて決定したj個の数値情報と前記i次元の位置情報とによって(i+j)次元の位置情報を生成するステップと、複数の前記(i+j)次元の位置情報で示される位置の相互の(i+j)次元の空間距離に基づいて前記分析対象データを分類するステップとを具備する。
【0023】
【発明の実施の形態】
以下、本発明による実施の形態を説明する。尚、本実施の形態は本発明を限定するものではない。
【0024】
図1は、本発明に係る実施の形態に従った空間データ分析装置100のブロック図である。空間データ分析装置100は、ある情報を空間座標で示した位置情報を含む複数の分析対象データを記憶するデータベース10と、各々の分析対象データごとに該分析対象データと関係のある関連情報を記憶するデータベース20と、分析対象データを処理するデータ処理演算部30とを備える。空間データ分析装置100は、関連情報に基づいて決定した数値情報を分析対象データの位置情報に付加した高次元位置情報を記憶する記憶部40と、分析対象データの高次元位置情報を分析した結果データを記憶する記憶部50をさらに備える。
【0025】
また、データ処理演算部30は、分析対象データがいずれの関連情報に属するかを判定する判定部32と、分析対象データが属する関連情報に基づく数値情報を分析対象データの位置情報に付加して、分析対象データが存在する空間よりも高次元の空間座標で示した高次元位置情報とする高次元データ付加部34と、高次元位置情報で示される位置の相互間の距離を、例えば、k平均法などのクラスタ分析手法を用いて算出し、この距離に基づいてデータ分析を行うデータ分析部36とを有する。
【0026】
分析対象データに含まれた位置情報は、例えば、交通事故や携帯端末の発信等の事象が発生した位置を示す位置情報である。また、分析対象データに含まれた位置情報は、建造物や自然物等が単に存在する位置を示す位置情報であってもよい。分析対象データは、空間的な構造以外に、時間や天気などの概念的な属性を示すデータをさらに含んでいてもよい。
【0027】
分析対象データの位置情報が存在する空間は、1次元以上の空間であり、代表的には、2次元の平面空間および3次元の立体空間である。2次元空間または3次元空間としては、例えば、地図やGIS(Geographic Information System)等で示される空間がある。
【0028】
関連情報は、例えば、地図やGIS等の空間座標を示す構造情報であり、関連情報に基づいて決定された数値情報は、例えば、地図やGIS等の空間の構造情報を数値で示したものである。
【0029】
本実施の形態によれば、分析対象データの位置情報は空間内の建物や道路等の空間的な構造のいずれかに属す。データ処理演算部30は、関連情報に基づいて決定された数値情報を分析対象データの位置情報に付加することによって高次元位置情報を生成し、該高次元位置情報で示される位置の相互の距離に基づいて分析対象データを分類する。
【0030】
データ処理演算部30は、コンピュータのCPUを用いて実現され得る。さらに、空間データ分析装置100は、データベース10、データベース20、データ処理演算部30、記憶部40および記憶部50を一体に組み込んだワークステーションなどでもよい。
【0031】
図2(A)は、図1に示した空間データ分析装置100の構成要素間におけるデータのフローを示す。図2(B)は、本発明に係る第1の実施の形態に従った空間データ分析装置の処理手順を示すフロー図である。本実施の形態の空間データ分析装置100は、交通事故発生記録データを、例えばk平均法などのクラスタ分析手法によりクラスタ分析して、交通事故の発生の傾向を抽出する。図2(A)および図2(B)に示されたフローを図3から図12を参照しつつ説明する。
【0032】
まず、データ処理演算部30が、データベース10から交通事故発生記録データを読み出し、データベース20から道路の構造情報を読み出す(ステップS10)。交通事故発生記録データは分析対象データの一例としてデータベース10に記憶されている。道路の構造情報は、関連情報の一例としてデータベース20に記憶されている。
【0033】
図3は、2次元の空間座標で示された道路上の交通事故発生記録データを示した図である。交通事故発生記録データは、交通事故が発生した位置情報などを記録したデータであり、交通事故が発生した場所の2次元の位置座標、即ち、X座標、Y座標が含まれている。交通事故発生記録データは10件あり、それぞれにD1からD10までの記号が付されている。交通事故発生記録データは、交通事故が発生した場所のX座標、Y座標、その他のデータとして、交通事故が発生した時間、交通事故が発生したときの天気を示すデータをさらに含む。
【0034】
図4は、横軸をX座標、縦軸をY座標とした道路地図を示した概念図である。図4は、X座標およびY座標がともに0から100までの値をとることができる2次元の空間を示す。図4の道路地図には、道路の構造情報として、道路1、道路2および道路3の3つの道路が示されている。道路1は、座標(0,80)付近から座標(90,80)付近を経由して座標(90,0)付近に達している。道路2は、座標(0,75)付近から座標(100,75)付近に達している。道路3は、座標(0,10)付近から座標(100,10)付近に達している。道路の構造情報は、このような道路1、道路2および道路3が2次元の空間内を占める範囲を座標で示した情報でよい。例えば、図4の空間において道路1の幅の数値が±5であるとした場合、道路1の構造情報は、座標(0,75)、(85,75)、(85,0)、(95,0)、(95,85)、(0,85)で囲まれた範囲として表せる。道路2および道路3についても、道路1と同様に座標で表すことができる。
【0035】
道路1は、3次元空間において、道路2および道路3の上方を通過している。即ち、道路1は道路2および道路3と立体交差している。従って、道路1、道路2および道路3は空間内において別々の構造であり、互いに異なる種類の関連情報としてデータベース20に記憶されている。
【0036】
次に、交通事故発生記録データが道路1、道路2または道路3のいずれの道路に属するかの判定処理を実行する(ステップS20)。この判定処理は、判定部32が、各交通事故発生記録データの位置座標が各道路の構造情報に含まれるか否かを判定することにより実現される。
【0037】
図5は、図3に示された各交通事故発生記録データの位置を図4に示された道路地図にプロットした図である。図6は、交通事故発生データに道路1、道路2または道路3いずれかを概念的に付加した図である。本実施の形態によれば、例えば、k平均法により交通事故発生記録データの集中している部分を発見するクラスタ分析手法が用いられている。クラスタは分析対象データからなる群集である。例えば、交通事故発生記録データをより多く含むクラスタのある位置は交通事故が多発している位置であることを示す。このように、クラスタ分析法とは、交通事故発生記録データ等の分析対象データをプロットしたときの、これらの分析対象データが比較的まとまって現れる範囲を分析することによって、交通事故等の事象が発生する傾向を得る方法である。
【0038】
次に、高次元データ付加部34が、構造情報ごとに異なる数値を交通事故発生記録データの位置情報に付加し、高次元位置情報を生成する(ステップS30)。高次元位置情報は、例えば、交通事故発生記録データ等の分析対象データの位置座標に、構造情報等の関連情報に基づいて決定された数値を付加した位置座標である。よって、高次元位置情報は、データベース10において分析対象データが有する位置情報よりも高次元の位置情報である。本実施の形態によれば、この高次元位置情報を用いて交通事故発生記録データをクラスタに分類する。尚、予め、道路の構造情報に基づいて決定された数値が各交通事故発生記録データの位置座標に付加されている場合には、判定処理(ステップS20)は実行されない。
【0039】
交通事故発生記録データの位置情報は地図上の2次元空間における位置座標である。高次元データ付加部34は、この2次元の位置座標に3次元目のデータ成分として数値情報を付加する。数値情報は、構造情報に基づき決定され、構造情報ごとに異なる。ステップS30の処理は、各構造情報に適当な数値を割り付すことにより実現できる。例えば、各構造情報に基づく数値情報は、数値情報の相互の間の差が、複数の交通事故発生記録データの位置情報の間の2次元空間における距離の最大値よりも大きくなるように決定される。本実施の形態によれば、道路1の構造情報に基づく数値情報が1000、道路2の構造情報に基づく数値情報が2000、並びに、道路3の構造情報に基づく数値情報が3000と決定されている。図7に高次元位置情報を含む交通事故発生記録データが示されている。さらに、高次元位置情報は、記憶部40へ記憶され、データ分析部36へ送信される。
【0040】
次に、データ分析部36が、高次元位置情報に基づいて分析対象データをクラスタ分析する(ステップS40からステップS90)。本実施の形態におけるクラスタ分析は、従来例と同様に高次元位置情報間のユークリッド距離に基づくものでよい。
【0041】
まず、データ分析部36は図3のデータから3つのクラスタを生成する(ステップS40)。本実施の形態において、最初の重心の位置座標はD2(座標 (65,80))、D5(座標 (40,10))およびD9(座標 (80,65))であると仮定する。尚、重心とは、各クラスタの重心であり、クラスタ内の分析対象データの位置情報を後述の式1および式2によって平均した位置である。但し、最初の重心は形成するクラスタと同数の重心を任意に選択する。本実施の形態において、最初の重心は高次元位置情報のいずれかである。重心D2、D5およびD9のそれぞれのクラスタはクラスタ1、クラスタ2およびクラスタ3とする。図8に各クラスタの初期状態を示す。初期状態のクラスタ1、クラスタ2およびクラスタ3はデータを含んでいない。
【0042】
次に、データ分析部36は、各高次元位置情報で示された位置と重心D2、D5およびD9の位置とのユークリッド距離を計算する(ステップS50)。さらに、各高次元位置情報は、高次元位置情報に距離(ユークリッド距離)の最も近い重心を含むクラスタに属するものとして分類される(ステップS60)。交通事故発生記録データは、交通事故発生記録データに含まれる高次元位置情報に従って分類される。
【0043】
本実施の形態において、2つの交通事故発生記録データの位置情報が図4に示された2次元空間の対角付近にある場合に、それらの交通事故発生記録データに含まれる位置情報の間の距離が最大の数値となる。即ち、交通事故発生記録データの位置情報の相互間の2次元空間における最大距離は、図4に示された2次元空間の対角距離にほぼ等しく、100*1.41である。一方で、各高次元位置情報に付加された数値情報間の差は1000である。よって、数値情報間の差は、交通事故発生記録データの位置情報間の2次元空間における最大距離の数値情報よりも大きい。それによって、2つの交通事故発生記録データの位置が2次元空間において近距離であっても、それらの構造情報が互いに異なれば、該2つの交通事故発生記録データは異なるクラスタに分類される。
【0044】
図9に高次元位置情報が各クラスタに分類された状態を示す。クラスタ1には、データD1、D2、D3およびD4が含まれる。クラスタ2には、D5、D6およびD7が含まれる。クラスタ3には、D8、D9およびD10が含まれる。本実施の形態によれば、初期状態における重心は構造情報ごとに選択されている。それによって、本実施の形態によれば、各データD1からD10は、構造情報に基づく数値が等しい重心を含むクラスタへ分類される。
【0045】
次に、各クラスタの新しい重心の位置座標が計算され、重心の初期値が変更される(ステップS70)。クラスタの新しい重心の座標(Px,Py)は、クラスタにn個の高次元位置情報が含まれているとし、かつn個の高次元位置情報の座標を (Xn,Yn)としたとき、
Px = ΣXn/n (式1)
Py = ΣYn/n (式2)
と表される。ただし、nは自然数である。図10には、各クラスタの重心の座標を更新した状態が示されている。
【0046】
次に、クラスタの重心が変更されたので、高次元位置情報は新しい重心に基づき再度分類される(ステップS80)。高次元位置情報は、該高次元位置情報から最も距離(ユークリッド距離)の近い重心が含まれるクラスタに属するものとして分類される。図11に更新されたクラスタの状態を示す。
【0047】
さらに、現時点の各クラスタに属する高次元位置情報が、更新前の各クラスタに属する高次元位置情報と等しいかを判定する(ステップS90)。両者が異なる場合には、ステップS70において各クラスタの新しい重心の座標が再度計算され、重心の座標が変更される。両者が等しい場合には、クラスタ分析の処理は終了する。交通事故発生記録データはそれに含まれる高次元位置情報に従って分類され、その分析結果は記憶装置50へ保存される。分析結果を表示させることにより、交通事故発生記録データ等の分析対象データの空間的な傾向を求めることができる。
【0048】
図11においては、各クラスタに属するデータは図9のものと同じである。よって、処理は終了し、図11に示す3つのクラスタが結果として得られる。
【0049】
図12は、クラスタ1、クラスタ2およびクラスタ3を図5に示した図である。各クラスタは破線円により示されている。本実施の形態により、D1、D2、D3およびD4は同じクラスタに分類され、道路1の曲り角付近で事故が多発するという傾向が得られる。図19に示した従来の分析結果と比較すると、本実施の形態においては、図12に示すように道路や行政区画などの空間的な構造を考慮したクラスタ分析が行われる。それにより、交通事故が発生する傾向などの特徴を正確に得ることができる。このように、本実施の形態は、従来と同様にユークリッド距離を用いたクラスタ分析を利用してはいるが、空間的な構造を考慮して分析対象データの空間的な傾向を得ることができる。
【0050】
また、構造情報以外に、交通事故発生データの時刻、天候などの概念的な属性を利用し、そのような属性を有する分析対象データだけをデータベース10から抽出し、データ分析してもよい。それにより、交通事故発生データの他の傾向が発見され得る。例えば、雨の日のみの関連情報をデータベース20から抽出した場合に、雨の日に交通事故が多発する空間位置を発見できる。
【0051】
さらに、本実施の形態においては、道路1、道路2および道路3の構造情報に基づく数値情報を交通事故発生データの位置情報へ付加して高次元位置情報が得られた。しかし、構造情報に代えて、時刻、天候などの属性による関連情報に基づいた数値情報が交通事故発生データの位置情報へ付加されて高次元位置情報を生成してもよい。例えば、昼間と夜とにそれぞれ異なる数値情報が与えられてもよい。また、晴れと雨とにそれぞれ異なる数値情報が与えられてもよい。それによって、時刻、天候などの属性を3次元目のデータ成分として高次元位置情報を生成し、該高次元位置情報に基づいてクラスタ分析が実行され得る。
【0052】
このように、本実施の形態によれば、空間の構造情報またはその他の属性等の関連情報を考慮したデータ分析を行うことができる。データ分析の結果は、例えば、交通事故防止の対策などに利用され得る。
【0053】
図13は、交通事故発生データに上り車線または下り車線の構造情報に基づき、4次元目の数値情報を付加した高次元位置情報を含む交通事故発生データを示す図である。このように、高次元位置情報の4次元目以上の数値情報が付加されてもよい。例えば、同じ道路でも上り車線と下り車線との区別をする場合に、上り車線と下り車線とに異なる数値情報が与えられる。該数値情報が高次元位置情報の4次元目のデータ成分として付加される。
【0054】
本実施の形態において、D1、D3、D5、D7およびD9は上り車線に含まれ、D2、D4、D6、D8およびD10は下り車線に含まれるとする。また、同じ道路の上り車線と下り車線との距離は異なる道路間の距離より小さくする。例えば、道路1、道路2および道路3のそれぞれに1000、2000および3000が3次元目の数値情報として与えられたが、上り車線には4次元目の数値情報として0が、上り車線には4次元目の数値情報として10が与えられる。
【0055】
このように、分析対象データに3次元目に加えた関連情報とは異なる内容を示す関連情報を4次元目に付加した高次元位置情報を用いても、上述の実施の形態と同様に例えば、k平均法などのクラスタ分析を行うことができる。
【0056】
3次元目および4次元目の数値情報と同様に、5次元目以上の数値情報を分析対象データに付加することもできる。例えば、分析対象データを含む空間がi次元(iは2以上の整数)の空間でありかつ関連情報がj種類あるとした場合のデータ分析装置100の動作を図2(B)に示すフローに沿って説明する。
【0057】
ステップS10において、データ処理演算部30が、データベース10からi次元の位置情報を含む交通事故発生記録データを読み出し、データベース20からj種類の関連情報を読み出す。
【0058】
ステップS20において、判定部32は、交通事故発生記録データが関連情報のうちいずれに属するかの判定処理を実行する。関連情報は種類あるので、判定部32は、各種類ごとにいずれの関連情報に属するかを判定する。判定処理は、j種類の関連情報のぞれぞれに関して上記したステップS20と同様の処理を施せばよい。
【0059】
ステップS30において、高次元データ付加部34が、関連情報ごとに異なる数値を交通事故発生記録データの位置情報に付加し、高次元位置情報を生成する。関連情報はj種類あるので、j種類の関連情報に基づくj個の数値情報がi次元の分析対象データに付加され、その結果、(i+j)次元の高次元位置情報が得られる。
【0060】
ステップS40からステップS90において、(i+j)次元の高次元位置情報を用いたクラスタ分析を上述の実施の形態と同様に実行する。クラスタ分析は、上述の実施の形態と同様に高次元位置情報間のユークリッド距離に基づくものでよい。
【0061】
ステップS40において、最初の重心を選択しクラスタを生成する。重心の位置座標は(i+j)次元の高次元位置情報のいずれかである。
【0062】
ステップS50において、データ分析部36は、各高次元位置情報で示された位置と重心の位置とのユークリッド距離を計算する。ここで、高次元位置情報および重心の位置座標は(i+j)次元であるので、ユークリッド距離も(i+j)次元における空間距離である。
【0063】
ステップS60において、各交通事故発生記録データは、高次元位置情報に距離の最も近い重心を含むクラスタに属するものとして分類される。
【0064】
ステップS70において、各クラスタの新しい重心の位置座標が計算され、重心の初期値が変更される。クラスタにn個の高次元位置情報が含まれているとする。クラスタの新しい重心の座標(P1,P2,P3,…Pi + j)は、n個の(i+j)次元の高次元位置情報の座標を (Hn 1,Hn 2,Hn 3, …Hn (i+j))としたときに、
Pk= ΣHn k/n (式3)
と表される。ただし、nは整数である。また、1≦k≦(i+j)である。
【0065】
ステップS80において、クラスタの重心が変更されたので、高次元位置情報は新しい重心に基づき再度分類される。高次元位置情報は、(i+j)次元におけるユークリッド距離において最も近い重心が含まれるクラスタに属するものとして分類される。
【0066】
ステップS90において、現時点の各クラスタに属する高次元位置情報が、更新前の各クラスタに属する高次元位置情報と等しいかを判定する。両者が異なる場合には、ステップS70において各クラスタの新しい重心の座標が再度計算され、重心の座標が変更される。両者が等しい場合には、クラスタ分析の処理は終了する。交通事故発生記録データはそれに含まれる高次元位置情報とともに分類され、その分析結果は記憶装置50へ保存される。分析結果を表示させることにより、交通事故発生記録データ等の分析対象データの空間的な傾向を求めることができる。このように、データ分析装置100は、(i+j)次元の高次元位置情報を用いて分析対象データを分類することができ、様々な関連情報を考慮したクラスタ分析を行うことができる。
【0067】
上述したデータ分析装置は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、データ分析装置の機能を実現するプログラムをフロッピーディスクやCD−ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の携帯可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
【0068】
また、上述したデータ分析装置の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
【0069】
【発明の効果】
本発明に従った空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法により、空間内にある分析対象データの空間的な特徴を導出するときに、分析対象データが存在する空間の構造や分析対象データの属性を考慮してデータ分析することができる。
【図面の簡単な説明】
【図1】本発明に係る実施の形態に従った空間データ分析装置100のブロック図。
【図2】図1に示した空間データ分析装置100の構成要素間におけるデータのフロー図、および、空間データ分析装置100の動作を示すフロー図。
【図3】2次元の空間座標で示された道路上の交通事故発生記録データを示した図。
【図4】道路の区分データを含む横軸をX座標、縦軸をY座標とした道路地図を示した概念図。
【図5】図3に示された各交通事故発生記録データを図4に示された道路地図にプロットした図。
【図6】道路1、道路2または道路3の構造情報が付加された交通事故発生データを示した図。
【図7】高次元位置情報を含む交通事故発生記録データを示す図。
【図8】各クラスタの初期状態を示す図。
【図9】高次元位置情報が各クラスタに分類された状態を示す図。
【図10】各クラスタの重心を更新した状態を示す図。
【図11】クラスタが更新された状態を示す図。
【図12】クラスタ1、クラスタ2およびクラスタ3を図5に示した図。
【図13】本発明に係るデータ分析方法またはデータ分析プログラムの変形例として、交通事故発生データに4次元目の区分データを付加したデータを示す図。
【図14】2次元の空間座標で示された分析対象データの一例として道路上の交通事故発生記録データを示した図。
【図15】クラスタ1、クラスタ2およびクラスタ3の初期状態を示す図。
【図16】従来のデータ分析方法により交通事故発生記録データが各クラスタに分類された状態を示す図。
【図17】クラスタ1、クラスタ2およびクラスタ3における新しい重心データを示す図。
【図18】従来のデータ分析方法によりクラスタ1、クラスタ2およびクラスタ3に交通事故発生記録データが再度分類された状態を示す図。
【図19】従来のデータ分析方法により分類されたクラスタ1、クラスタ2およびクラスタ3を図5の地図に示した図。
【符号の説明】
100 データ分析装置
10、20 データベース
30 データ処理演算部
40、50 記憶部
32 判定部
34 データ付加部
36 データ分析部
Claims (6)
- i次元(iは2以上の整数)の位置情報を含む複数の分析対象データを記憶する第1の記憶部と、
各々の前記分析対象データごとに該分析対象データと関係のあるj種類(jは1以上の整数)の関連情報を記憶する前記第2の記憶部と、
前記j種類の関連情報の各々に基づいて決定したj個の数値情報と前記i次元の位置情報とによって(i+j)次元の位置情報を生成し、
複数の前記(i+j)次元の位置情報で示される位置の相互の(i+j)次元の空間距離に基づいて前記分析対象データを分類するデータ処理演算部とを備えた空間データ分析装置。 - 前記データ処理演算部は、任意に選択した前記分析対象データに基づいて、(i+j)次元の空間における複数の重心を設定し、
前記分析対象データごとに前記(i+j)次元の位置情報と前記重心と間の(i+j)次元の空間距離における最も近傍の前記重心を求めることによって該分析対象データを分類することを特徴とする請求項1に記載の空間データ分析装置。 - 前記関連情報のうちの1種類の関連情報について、
該関連情報に基づいて決定された複数の数値情報の差は、
一の前記分析対象データの前記i次元の位置情報と他の分析対象データの前記i次元の位置情報との間の距離が示す数値情報のうち最大の数値情報よりも大きいことを特徴とする請求項1または請求項2に記載の空間データ分析装置。 - 前記i次元空間は2次元空間であり、
前記j種類の区分データは1種類の関連情報であり、
前記距離および前記空間距離は全てユークリッド距離であることを特徴とする請求項1から請求項3のいずれかに記載の空間データ分析装置。 - i次元(iは2以上の整数)の位置情報を含む複数の分析対象データを記憶する第1の記憶部と、各々の前記分析対象データごとに該分析対象データと関係のあるj種類(jは1以上の整数)の関連情報を記憶する前記第2の記憶部とから前記分析対象データおよび前記関連情報を読み出すステップと、
前記分析対象データを処理するデータ処理演算部に、
前記j種類の関連情報の各々に基づいて決定したj個の数値情報と前記i次元の位置情報とによって(i+j)次元の位置情報を生成するステップと、
複数の前記(i+j)次元の位置情報で示される位置の相互の(i+j)次元の空間距離に基づいて前記分析対象データを分類するステップとを処理させる空間データ分析プログラム。 - i次元(iは2以上の整数)の位置情報を含む複数の分析対象データを記憶する第1の記憶部と、各々の前記分析対象データごとに該分析対象データと関係のあるj種類(jは1以上の整数)の関連情報を記憶する前記第2の記憶部とから前記分析対象データおよび前記関連情報を読み出すステップと、
前記j種類の関連情報の各々に基づいて決定したj個の数値情報と前記i次元の位置情報とによって(i+j)次元の位置情報を生成するステップと、
複数の前記(i+j)次元の位置情報で示される位置の相互の(i+j)次元の空間距離に基づいて前記分析対象データを分類するステップとを具備する空間データ分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002177352A JP2004021717A (ja) | 2002-06-18 | 2002-06-18 | 空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002177352A JP2004021717A (ja) | 2002-06-18 | 2002-06-18 | 空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004021717A true JP2004021717A (ja) | 2004-01-22 |
Family
ID=31175410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002177352A Pending JP2004021717A (ja) | 2002-06-18 | 2002-06-18 | 空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004021717A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007293823A (ja) * | 2006-03-27 | 2007-11-08 | Denso It Laboratory Inc | 地図表示システムおよび地図表示方法 |
KR20110016936A (ko) * | 2008-05-12 | 2011-02-18 | 구글 인코포레이티드 | 인기 있는 랜드마크의 자동 발견 |
CN102306232A (zh) * | 2011-06-07 | 2012-01-04 | 中国电子科技集团公司第二十八研究所 | 一种针对多类辐射源的电抗特征组合的选择方法 |
US9020247B2 (en) | 2009-05-15 | 2015-04-28 | Google Inc. | Landmarks from digital photo collections |
JP2016503937A (ja) * | 2013-01-18 | 2016-02-08 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 活動領域の検索および決定 |
WO2024014001A1 (ja) * | 2022-07-15 | 2024-01-18 | 日本電信電話株式会社 | 検出装置、検出方法、及び検出プログラム |
-
2002
- 2002-06-18 JP JP2002177352A patent/JP2004021717A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007293823A (ja) * | 2006-03-27 | 2007-11-08 | Denso It Laboratory Inc | 地図表示システムおよび地図表示方法 |
US9483500B2 (en) | 2008-05-12 | 2016-11-01 | Google Inc. | Automatic discovery of popular landmarks |
KR20110016936A (ko) * | 2008-05-12 | 2011-02-18 | 구글 인코포레이티드 | 인기 있는 랜드마크의 자동 발견 |
JP2011520208A (ja) * | 2008-05-12 | 2011-07-14 | グーグル インコーポレイテッド | 人気ランドマークの自動的発見 |
US10289643B2 (en) | 2008-05-12 | 2019-05-14 | Google Llc | Automatic discovery of popular landmarks |
US8676001B2 (en) | 2008-05-12 | 2014-03-18 | Google Inc. | Automatic discovery of popular landmarks |
US9014511B2 (en) | 2008-05-12 | 2015-04-21 | Google Inc. | Automatic discovery of popular landmarks |
KR101579634B1 (ko) | 2008-05-12 | 2016-01-05 | 구글 인코포레이티드 | 인기 있는 랜드마크의 자동 발견 |
US9020247B2 (en) | 2009-05-15 | 2015-04-28 | Google Inc. | Landmarks from digital photo collections |
US9721188B2 (en) | 2009-05-15 | 2017-08-01 | Google Inc. | Landmarks from digital photo collections |
CN102306232A (zh) * | 2011-06-07 | 2012-01-04 | 中国电子科技集团公司第二十八研究所 | 一种针对多类辐射源的电抗特征组合的选择方法 |
CN102306232B (zh) * | 2011-06-07 | 2013-07-17 | 中国电子科技集团公司第二十八研究所 | 一种针对多类辐射源的电抗特征组合的选择方法 |
JP2016503937A (ja) * | 2013-01-18 | 2016-02-08 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 活動領域の検索および決定 |
WO2024014001A1 (ja) * | 2022-07-15 | 2024-01-18 | 日本電信電話株式会社 | 検出装置、検出方法、及び検出プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9934249B2 (en) | Systems and methods for context-aware and personalized access to visualizations of road events | |
Senaratne et al. | Urban mobility analysis with mobile network data: A visual analytics approach | |
JP5980148B2 (ja) | デジタルカメラ画像から駐車場占有状態を測定する方法 | |
CN110019568B (zh) | 基于空间聚类的选址方法、装置、计算机设备及存储介质 | |
US20200082561A1 (en) | Mapping objects detected in images to geographic positions | |
CN109815993B (zh) | 基于gps轨迹的区域特征提取、数据库建立及路口识别方法 | |
CN108052624A (zh) | 点云数据处理方法、装置及计算机可读存储介质 | |
CN111640089A (zh) | 一种基于特征图中心点的缺陷检测方法及装置 | |
JP2010539547A (ja) | 地図作成データを更新するための装置および方法 | |
US11255678B2 (en) | Classifying entities in digital maps using discrete non-trace positioning data | |
CN113593017A (zh) | 露天矿地表三维模型构建方法、装置、设备及存储介质 | |
CN111738225B (zh) | 人群聚集检测方法、装置、设备及存储介质 | |
US20230245002A1 (en) | Stationary Classifier for Geographic Route Trace Data | |
JP2004021717A (ja) | 空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法 | |
CN113436223B (zh) | 点云数据的分割方法、装置、计算机设备和存储介质 | |
Ozdemir et al. | A novel algorithm for regularization of building footprints using raw LiDAR point clouds | |
CN114359231A (zh) | 一种停车位的检测方法、装置、设备及存储介质 | |
JP2003256757A (ja) | 空間データ分析装置、空間データ分析方法、及び空間データ分析プログラム | |
CN112287247A (zh) | 基于Meanshift和K-means聚类的社交网络用户位置特征提取方法和装置 | |
CN113689705B (zh) | 车辆闯红灯检测方法、装置、计算机设备和存储介质 | |
CN115828011A (zh) | 基于大数据的数据分析方法和平台 | |
CN113867371A (zh) | 路径规划方法和电子设备 | |
CN101221596A (zh) | 基于图示符的处理系统及处理基于图示符的数据的方法 | |
JP6324175B2 (ja) | 地図情報表示システム及び方法、プログラム | |
CN109612467B (zh) | 轨迹简化方法、系统及轨迹可视化系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060425 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060615 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070109 |