JP2004126780A - 分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラム - Google Patents
分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラム Download PDFInfo
- Publication number
- JP2004126780A JP2004126780A JP2002287426A JP2002287426A JP2004126780A JP 2004126780 A JP2004126780 A JP 2004126780A JP 2002287426 A JP2002287426 A JP 2002287426A JP 2002287426 A JP2002287426 A JP 2002287426A JP 2004126780 A JP2004126780 A JP 2004126780A
- Authority
- JP
- Japan
- Prior art keywords
- data
- geographic information
- attribute
- analysis
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】観測データに基づいて地理情報データから属性データを抽出し、属性データおよび観測データから地理情報分析用データを作成し、地理情報分析用データをデータ分析して、事象が生じる傾向を導出するデータ分析方法等を提供する。
【解決手段】データ分析装置は、ある地理に関する地理情報データを記憶するデータベース110と、地理内の位置データおよび該位置において生じた事象を示す事象データを含む観測データを表形式で記憶するデータベース120と、地理情報データおよび観測データに基づいて地理情報分析用データを作成するデータ処理部130とを備え、地理内の特徴を示す属性データをデータベース110から抽出し、属性データおよび特徴に該当する度合を示す度合表示データを観測データへ付加して地理情報分析用データを作成し、これを分析する。
【選択図】 図2
【解決手段】データ分析装置は、ある地理に関する地理情報データを記憶するデータベース110と、地理内の位置データおよび該位置において生じた事象を示す事象データを含む観測データを表形式で記憶するデータベース120と、地理情報データおよび観測データに基づいて地理情報分析用データを作成するデータ処理部130とを備え、地理内の特徴を示す属性データをデータベース110から抽出し、属性データおよび特徴に該当する度合を示す度合表示データを観測データへ付加して地理情報分析用データを作成し、これを分析する。
【選択図】 図2
Description
【0001】
【発明の属する技術分野】
本発明は、分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラムに関する。
【0002】
【従来の技術】
データベース内にある多数の情報の空間的な傾向を導出するデータ分析方法として空間データマイニング法や統計分析法がある。空間データマイニング法や統計分析法は、2次元または3次元以上の空間座標で示された分析対象データが空間内のどの箇所に密集しているか等の分析対象データの空間的な傾向を発見するために用いられる。
【0003】
たとえば空間的な傾向を見るために、与えられる地点からみた、目的関数を最適化する距離や方向を分析する方法が知られている(特許文献1を参照)。
【0004】
一般に、広範囲に亘る空間において収集された多くの観測データを分析する場合には、観測点の地理的な特徴が影響することが多い。従って、観測点の地理的な特徴を示す属性データを観測データに付加することによってデータ分析の精度を向上させることができる。
【0005】
例えば、広範囲に亘る道路の損傷度合の傾向をデータ分析によって予測する場合に、その道路が通過する地域の地形、その地域の近傍にある構造物、その地域における降水量またはその道路の交通量等の属性データを道路の点検結果データに付加して分析する。それによって、例えば、道路のうち交通量の多い部分の損傷の度合が激しい等の傾向が得られる。
【0006】
【特許文献1】
特開2001−318938公報
【0007】
【発明が解決しようとする課題】
しかしながら、どのような地理的特徴が属性データとして分析に有効であるのかは、通常、データ分析後に結果的に判明する。従って、正確なデータ分析を担保するためには、広範囲に亘って大量の観測データを収集する必要がある。一方で、不必要な観測データまでをも観測および記録することはコスト高になる。そこで、通常、必要であると判明している箇所の観測データのみを収集することが行われている。しかし、このような場合には、予想外の属性データに関する傾向をデータ分析によって得ることができない。即ち、予め必要と判明している箇所の観測データのみを収集することは、データ分析に限界を与えてしまう。
【0008】
観測データには空間内の観測地点を表す位置データが付加されている場合が多い。そこで、収集された観測データに不足がある場合には、観測データの位置データに基づいて地図データなどの空間データから属性データを検索することが考えられる。
【0009】
上述の通り、大量の観測データを分析する手法としてデータマイニングや統計データ分析が用いられている。データマイニングや統計データ分析は、表形式で表されたデータを分析対象としている。一方で、地図データなどの空間データは電子化されているものの表形式ではないので、データマイニングや統計データ分析を実行するときに、観測データに空間データを直接に適用することができない。即ち、従来においては、空間データと観測データとのフォーマットが異なるので、コンピュータを用いて位置データから属性データを自動検索および自動抽出し、この属性データおよび観測データに基づいてデータ分析を自動的に行うことができなかった。
【0010】
従って、従来から、地図データのような空間データから属性データを抽出する作業は人手によって行われていた。人手による作業は、属性データの見落とし、あるいは、作業者の主観による判断の偏りを発生させる原因となる。
【0011】
そこで、本発明の目的は、観測データに含まれる位置データに基づいて地理情報データから分析に必要な属性データを自動抽出し、この属性データおよび観測データに基づいてデータ分析を自動的に行うことを可能とするデータ分析方法、データ分析装置およびデータ分析プログラムを提供することである。
【0012】
【課題を解決するための手段】
本発明に係る実施の形態に従った分析用データ作成方法は、地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いた分析用データ作成方法であって、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記事象の生じる傾向を導出するために用いられる地理情報分析用データを作成する付加ステップとを具備する。
【0013】
本発明に係る実施の形態に従ったデータ分析方法は、地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いたデータ分析方法であって、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記地理情報分析用データを作成する付加ステップと、前記地理情報分析用データを用いて前記事象が生じる傾向を導出する導出ステップとを具備する。
【0014】
本発明に係る実施の形態に従ったデータ分析装置は、地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置において生じた事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部と、前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出し、前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換して前記観測データへ付加することによって地理情報分析用データを作成するデータ処理部と、前記地理情報分析用データを用いて、前記事象が生じる傾向を導出するデータ分析部とを備えている。
【0015】
好ましくは、前記属性データは前記位置データが示す前記地理上の位置からの距離に関する特徴、若しくは、前記地理におけるある状態の分布に関する特徴を示す。
【0016】
前記データ処理部は、前記位置データの分布に基づいて前記地理内を複数の地域群に分割し、前記観測データを前記地域群と前記位置データとの関係に基づいて前記地域群に分類し、前記地域群を前記属性データとして、並びに、前記位置データが属する前記地域群の名称を前記度合表示データとして前記観測データへ付加するように構成してもよい。
【0017】
前記観測データまたは前記属性データに、前記地理情報データにおける地図上の一点の場所を示す固有データが含まれている場合に、好ましくは、前記データ処理部は、前記固有データを、前記地理情報データから複数検索可能なデータに変換する。
【0018】
前記固有データは固有名称である場合、好ましくは、前記データ処理部は、前記固有名称を、地図情報データから抽出可能な該固有名称が有する特徴またはこれら特徴の組合せに変換する。
【0019】
当該データ分析装置は、予め第1の特徴と第2の特徴とを関連付けて記憶した第3の記憶部と、特徴の表現に含まれる前記第1の特徴の表現を、前記第2の特徴の表現に変換するデータ変換部とをさらに備えていてもよい。
【0020】
本発明に係る実施の形態に従ったデータ作成プログラムは、地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いて、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記事象の生じる傾向を導出するために用いられる地理情報分析用データを作成する付加ステップとを処理する。
【0021】
本発明に係る実施の形態に従ったデータ分析プログラムは、地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いて、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記事象の生じる傾向を導出するために用いられる地理情報分析用データを作成する付加ステップと、前記地理情報分析用データを用いて前記事象が生じる傾向を導出する導出ステップとを処理する。
【0022】
好ましくは、前記属性データは前記位置データが示す前記地理上の位置からの距離に関する特徴、若しくは、前記地理におけるある状態の分布に関する特徴を示す。
【0023】
前記抽出ステップにおいて、前記位置データの分布に基づいて前記地理内を複数の地域群に分割し、該地域群を前記属性データとして抽出し、前記計算機は、前記抽出ステップ後に、前記観測データを前記地域群と前記位置データとの関係に基づいて前記地域群に分類する分類ステップをさらに処理し、前記付加ステップにおいて、前記地域群を前記属性データとして、並びに、前記位置データが属する前記地域群の名称を前記度合表示データとして前記観測データへ付加してもよい。
【0024】
前記観測データまたは前記属性データに、前記地理情報データにおける地図上の一点の場所を表す固有データが含まれている場合に、好ましくは、前記計算機は、前記固有データを、前記固有データに対して付与された前記地理情報データに含まれる地理的特長を示す情報から、該固有データが持つ特徴を求め、該特徴または該特徴の組合せを用いて、該固有データを複数の場所を示すデータに変換する変換ステップをさらに処理する。
【0025】
前記固有データが固有名称である場合、好ましくは、前記変換ステップにおいて、前記固有名称を、地図情報データから抽出可能な該固有名称が有する特徴またはこれら特徴の組合せに変換する。
【0026】
前記計算機は、予め第1の特徴と第2の特徴とを関連付けて記憶した第3の記憶部をさらに備え、前記変換ステップにおいて、特徴の表現に含まれる前記第1の特徴の表現を、前記第2の特徴の表現に変換してもよい。
【0027】
【発明の実施の形態】
以下、本発明による実施の形態を説明する。尚、本実施の形態は本発明を限定するものではない。
【0028】
図1は、本発明に係る実施の形態に従ったデータ分析装置100のブロック図である。データ分析装置100は、ある地理に関する地理情報データを記憶するデータベース110と、観測データを表形式で記憶するデータベース120とを備える。
【0029】
地理情報データは、1次元以上の空間を示すデータであり、代表的には2次元の平面空間および3次元の立体空間をベクタ形式、図形形式等で表したデータである。例えば、地理情報データは地図データまたはGIS(Geographic Information System)データ等である。
【0030】
観測データは地理内の位置座標を示す位置データおよびその位置において生じた事象を示す事象データを表形式で表したデータである。例えば、ある地理内の道路の損傷度を観測した観測データを観測データとする。この場合、位置データは道路の観測地点の座標を示し、事象データはその観測地点における道路の損傷度を示す(図2参照)。
【0031】
図2は観測データの具体例を示す概念図である。この観測データは、道路の損傷度を示す観測データである。本実施形態において、位置データは道路上の座標(X,Y)である。位置データは、地理内の位置座標を示し、位置属性と換言してもよい。事象データは各座標における道路の損傷度(大、中、小)である。事象データはクラス属性と換言してもよい。さらに、道路を建築した業者名および道路を建築した年度が観測データに含まれている。
【0032】
図1を再度参照して、データ分析装置100は、地理情報データおよび観測データに基づいて地理情報分析用データを作成するデータ処理部130と、観測データまたは地理情報分析用データ等のデータを一時的に格納することができるメモリ140と、地理情報分析用データをデータ分析し、事象の生じる傾向を導出するデータ分析器150とをさらに備える。データ分析とは、例えば、空間データマイニング法または統計分析法である。事象の生じる傾向とは、例えば、「交通量の多い道路は損傷が大きい」等のある空間においてある事象の生じる傾向である。
【0033】
データ処理部130は、地理内のある特徴をデータベース110から検索してその特徴を表形式の属性データへ変換する検索・変換器132と、観測データへ属性データを項目として付加する表データ管理器134とを有する。表データ管理器134は、さらに、各位置データごとにその特徴に該当する度合を示す度合表示データを付加する。観測データに属性データおよび度合表示データを付加することによって、地理情報分析用データが作成される(図3参照)。
【0034】
図3は、地理情報分析用データの具体例を示す概念図である。地理情報分析用データは、観測データへ属性データおよび度合表示データを付加して形成された表形式のデータである。地理情報分析用データは、属性データを項目とし、この項目に対して各位置データごとに度合表示データを有する。尚、地理情報分析用データは、分析のために用意された。
【0035】
属性データは地理内のある位置における任意の特徴を表すデータであり、属性名と換言してもよい。例えば、「ある位置の10m以内に交差点がある」、「ある位置の10m以内にカーブがある」、「ある位置の交通量」、「ある位置が含まれる市町村の人口密度」等が属性データとなり得る。
【0036】
度合表示データは、各位置データごとに属性データに該当する度合を示すデータであり、属性値と換言してもよい。即ち、度合表示データは、各位置データにおいて、属性データが示す特徴の有無や数値などの度合を示す。例えば、属性データが「ある位置の10m以内に交差点がある」である場合に、位置データの座標の10m以内に交差点の座標が存在するときには度合表示データは「有」であり、位置データの座標の10m以内に交差点の座標が存在しないときには度合表示データは「無」である。また、属性データが「ある位置の交通量」である場合には、度合表示データは位置データの座標における交通量の数値である。従って、度合表示データは、有または無の2値データであってもよく、交通量などの変数データであってもよい。
【0037】
尚、属性データは複数であってもよい。属性データが複数ある場合には、属性データと同数の項目が観測データへ付加され、属性データと同数の度合表示データが各位置データに対応して観測データへ付加される。
【0038】
観測データは、観測によって収集された属性名(属性データ)およびその属性値(度合表示データ)を意味する。地理情報分析用データは、分析のために用意された属性名(属性データ)およびその属性値(度合表示データ)を意味する。
【0039】
このように、データ分析装置100は、地理情報データに基づく属性データと、属性データに該当する度合を示す度合表示データとを観測データへ付加することによって地理情報分析用データを作成する。
【0040】
地理情報分析用データは、データ分析器150によってデータ分析される。地理情報分析用データを分析することによって、属性データに関する傾向が得られる。例えば、図3に示した地理情報分析用データから「交差点の10m以内に位置する道路の損傷度は大きい」という傾向が得られ得る。
【0041】
データ処理部130およびデータ分析器150はコンピュータのCPUを用いて実現され得る。データ分析装置100は、データベース110、データベース120、データ処理部130、メモリ140およびデータ分析器150を個別に備え、これらを通信可能に接続したシステムであってもよい。一方で、データ分析装置100は、データベース110、データベース120、データ処理部130、メモリ140およびデータ分析器150を一体に組み込んだワークステーションなどであってもよい。
【0042】
図4(A)は、本発明に従ったデータ分析方法の第1の実施形態に係る地理情報データの概念図である。図4(B)は、第1の実施形態に係る地理情報分析用データの概念図である。図5は第1の実施形態によるデータ分析方法のフロー図である。本実施の形態はデータ分析装置100を用いて実行され得る。
【0043】
図4(A)に示す地理情報データはデータベース110に格納されており、図4(B)に示す地理情報分析用データのうち観測データはデータベース120に格納されている。本実施の形態において、地理情報データはある地域の地図データである。この地図データ内に示す観測点1から観測点3において観測が実施され、その測定結果が観測データに示されている。観測データには、観測点1から観測点3のそれぞれの位置データとして座標(X,Y)が示されている。また、観測点1から観測点3に対応した測定結果(○または×)が示されている。
【0044】
例えば、本実施の形態は、観測点1から観測点3のそれぞれの道路の損傷度を観測したデータを示していると仮定する。この場合、損傷度が所定の基準以上である観測点の測定結果を「○」とし、損傷度が所定の基準未満である観測点の測定結果を「×」とする。
【0045】
データ処理部130は、観測データをデータベース120から読み出し、メモリ140へ格納する(S10)。
【0046】
次に、検索・変換器132がデータベース110に格納されている地理情報データからある特徴を検索する(S20)。この検索は、データベース110に格納されている地理情報データから任意の特徴を検索することが好ましい。但し、データ分析の結果として傾向が得られないと判明している属性データは選択しない。例えば、総ての位置データに対応する度合表示データが同じである場合は、データ分析によって傾向を得ることができない。従って、ある特徴に対して度合表示データを判定し、その結果、総ての位置データにおいて同じとなる属性データは選択しない。
【0047】
より詳細には、図4(A)において、属性データが「100m以内に学校がある」である場合には、データ番号1から3のいずれの位置も学校から100m以内に存在しない。よって、総ての位置データにおいて度合表示データが「No」となる。その結果、データ分析器150が地理情報分析用データをデータ分析したとしても何らの傾向も得られない。このように、総ての位置データにおいて度合表示データが同じになるような属性データは選択されない。
【0048】
図4(B)における地理情報分析用データに示されているように、「100m以内に病院がある」という属性データが選択されている。この場合には、度合表示データは、観測点1および観測点2において「Yes」であり、観測点3において「No」である。度合表示データは、例えば、病院が位置する座標と観測点1から観測点3の座標との距離を計算し、その距離が100m以下であるか否かを判別することによって作成され得る。
【0049】
次に、検索・変換器132は、属性データおよび度合表示データを表形式に変換する(S30)。観測データも表形式であるので、属性データおよび度合表示データは、表形式に変換されることによって観測データへ付加され得る。
【0050】
次に、データ処理部130が、メモリ140内に格納された観測データへ属性データおよび度合表示データを付加する(S40)。それによって、地理情報分析用データが完成する。
【0051】
さらに、データ分析器150が、メモリ140に格納された地理情報分析用データをデータ分析する(S50)。その結果、例えば、「100m以内に病院がある道路の損傷度は所定の基準以上である」という傾向が得られる。
【0052】
本実施の形態において、観測点は3つだけであったが、より多くの観測点における測定結果が観測データに含まれていることが好ましい。それによって、地理情報分析用データからより正確な傾向が得られ得る。本実施の形態において、属性データは、位置データが示す地理上の座標から病院までの距離に関する情報であった。
【0053】
位置データが示す位置からの距離に関する属性データの他の具体例として、例えば、「周囲Sm以内にTがある」を属性データとしてもよい。このときSが定数である場合には、度合表示データは、位置データが示す座標のSm以内にTがあるときに「Yes」であり、これに該当しないときに「No」である。即ち、Sが定数である場合には、度合表示データは2値情報になる。一方で、Sが変数である場合には、度合表示データは、位置データが示す座標からTまでの距離を示すデータになる。即ち、Sが変数である場合には、度合表示データは多値情報となる。
【0054】
さらに、例えば、「北側Pm以内にQがある」を属性データとしてもよい。Pが定数である場合またはある範囲を示す場合には、度合表示データは、位置データが示す座標の北側Pm以内にQがあるときに「Yes」であり、これに該当しないときに「No」である。即ち、Pが定数である場合またはある範囲を示す場合には、度合表示データは2値情報になる。一方で、Pが変数である場合には、度合表示データは、位置データが示す座標とQとの距離である。即ち、Pが変数である場合には、度合表示データは多値情報となる。
【0055】
上記の具体例においては、属性データは、位置データが示す地理上の位置からの距離に関するものであった。しかし、このような距離に限らず、属性データは地理上ある状態の分布に関する特徴を示すものであってもよい。
【0056】
例えば、地理情報データが示す地域におけるある状態の分布に関する特徴、具体的には、地理情報データが示す地域の人口密度分布データを予めデ―タベース110に格納しておき、「人口密度がnである」を属性データとしてもよい。nが定数である場合またはある範囲を示す場合には、度合表示データは、位置データが示す座標の人口密度がこの属性データに該当するときに「Yes」であり、これに該当しないときに「No」である。即ち、nが定数である場合またはある範囲を示す場合には、度合表示データは2値情報になる。一方で、nが変数である場合には、度合表示データは、位置データが示す座標の人口密度の数値である。即ち、nが変数である場合には、度合表示データは多値情報となる。
【0057】
また、例えば、「時刻Uの時は交通量がV以上である」を属性データとしてもよい。このときUが定数である場合またはある範囲を示す場合には、度合表示データは、位置データが示す座標の交通量がV以上であるときに「Yes」であり、これに該当しないときに「No」である。即ち、Uが定数である場合には、度合表示データは2値情報になる。一方で、Uが変数である場合には、度合表示データは、位置データが示す座標において交通量がV以上であるときの日時である。即ち、Uが変数である場合には、度合表示データは多値情報となる。
【0058】
勿論、度合表示データは3値以上の離散的な値のいずれかであってもよい。例えば、属性データが「人口密度がnである」であって、nがある範囲を示す場合に、度合表示データは、位置データが示す座標の人口密度がnが示す範囲より高いときに「高」、nが示す範囲に含まれる場合に「中」、nが示す範囲より低いときに「低」とする。これによって、度合表示データを3値情報にすることができる。
【0059】
本実施の形態によれば、位置データに基づいて地理情報データから分析に必要な属性データを抽出し、この属性データおよび度合表示データを表形式へ自動で変換することができる。それによって、データ分析装置100は、属性データおよび度合表示データを分析対象データ(即ち、観測データ)へ付加して地理情報分析用データを作成することができる。データ分析器150が、空間データマイニング法や統計分析法などのデータ分析をこの地理情報分析用データに施すことによって、その地理内において事象が生じる傾向を得ることができる。
【0060】
図6(A)は、本発明によるデータ分析方法の第2の実施形態に係る地理情報データの概念図である。図6(B)は、第2の実施形態に係る地理情報分析用データの概念図である。本実施の形態はデータ分析装置100を用いて実行され得る。本実施の形態のフロー図は、図5に示したフロー図とほぼ同様であるが、ステップS20においてデータ処理部130がクラスタリング処理を併用して属性データおよび度合表示データを観測データへ付加する点で異なる。
【0061】
データ処理部130は、観測データのうち位置データが示す座標を地理情報データ上にプロットし、距離が近い位置データ同士を関連付けることによって複数のクラスタを形成する。本実施の形態によれば、属性データはクラスタであり、度合表示データは各位置データが属するクラスタ名である。
【0062】
例えば、図6(A)に示すように、データ番号1からデータ番号9までの位置データが示す座標(X,Y)を地理情報データへプロットする。これらの位置データをクラスタリング処理することによって、3つのクラスタA、BおよびCが形成される。属性データをクラスタとすれば、度合表示データは各位置データが属するクラスタ名、即ち、クラスタA、BまたはCのいずれかである。これらの処理はデータ処理部130が実行する。尚、クラスタリング処理はデータ分析器150が実行してもよい。
【0063】
図7は、本実施の形態による方法のフロー図である。第1の実施形態におけるステップS20において、属性データとしてクラスタが選択される。その後、データ処理部130が、データ番号1から9の位置データを地理情報データにプロットする(S22)。図6(A)の地図情報データ上に示された1から9の点がステップ22においてプロットされた位置データである。
【0064】
次に、地理情報データにプロットされた位置データをクラスタリングする(S24)。これにより、データ番号1から9の観測データが地理情報データに基づいてクラスタA、BまたはCへクラスタリングされる。
【0065】
次に、クラスタを属性データとして、並びに、各位置データが属するクラスタ名を度合表示データとして表形式に変換する(S30)。
【0066】
次に、これらの属性データおよび度合表示データを観測データへ付加する(S40)。それにより、地理情報分析用データが完成する。このように、本実施の形態により、クラスタリング処理を併用して図6(B)に示す地理情報分析用データを作成することができる。
【0067】
さらに、第1の実施の形態と同様にデータ分析部150がデータ分析を実行する(S50)。データ分析器150が、図6(B)に示す地理情報分析用データを分析することによって、例えば、「クラスタAおよびクラスタA近傍の道路の損傷度が基準を超えている」等の傾向が得られる。
【0068】
本実施の形態によれば、属性データはクラスタであり、度合表示データがクラスタ名である。しかし、クラスタに代えてクラスタが位置する地点の地理的な特徴を属性データおよび度合表示データとして採用してもよい。この地理的な特徴は、同じクラスタに属する位置データが共通に有する特徴である。例えば、属性データを「共通して100m以内にある構造物」として、同じクラスタの総ての位置データから100m以内にある構造物の名称をクラスタA、BまたはCに代えて度合表示データとして観測データへ付加する。これにより、地理情報データ内にある名称を度合表示データとして用いることができる。
【0069】
また、各クラスタの代表点が有する特徴を属性データおよび度合表示データとして採用してもよい。代表点は、例えば、あるクラスタのうちの1つの位置データの座標であってもよく、そのクラスタ内の総ての位置データの座標を平均した座標であってもよい。例えば、属性データを「共通して100m以内にある構造物」とした場合には、クラスタの代表点から100m以内にある構造物の名称をクラスタ名に代えて度合表示データとして観測データへ付加する。
【0070】
1つのクラスタを複数の属性データで置換してもよい。例えば、あるクラスタを、「100m以内にある構造物」と「河川の近傍」との2つの属性データで置換してもよい。この場合は、属性データの項目が2つになる。度合表示データは、クラスタ内の位置データから100m以内にある構造物の名称、および、河川の近傍であるか否かを示す「Yes」または「No」である。これら2つの度合表示データが各項目に対して位置データごとに付加される。
【0071】
図8は、本発明に係る実施の形態に従った他のデータ分析装置200のブロック図である。データ分析装置200は、決定木作成器210をさらに備えている点でデータ分析装置100と異なる。決定木作成器210は、地理情報データにおける地図上の一点の場所を表す固有データ(例えば、固有名称)が含まれている場合に、この固有データを複数検索可能なデータに置換する。
【0072】
図9(A)から図10(C)は、本発明によるデータ分析方法の第3の実施形態に係る概念図である。図9(A)は、属性データが市町村名という固有名称を有する地理情報分析用データの概念図である。図9(B)は、図9(A)に示す地理情報分析用データを決定木作成器210によって処理した後の地理情報分析用データの概念図である。図10(A)から図10(C)は、決定木を作成する過程を示した概念図である。
【0073】
図9(A)に示す地理情報分析用データの属性データは市町村名であり、その度合表示データは具体的な町名である。図9(A)に示す地理情報分析用データをデータ分析した場合には、A町およびB町における測定結果が「○」であり、一方、C町における測定結果が「×」であることがわかる。しかし、A町およびB町に共通する特徴が不明であるので、測定結果が「○」となる原因は依然として不明である。即ち、市町村名はその市町村自体を表す固有名称であるので、データ分析器150が市町村名を含む地理情報分析用データをデータ分析しても、適切な傾向を得ることができない。
【0074】
そこで、図10(A)から図10(C)に示すように、決定木を利用して、図9(A)に示す属性データおよび度合表示データの市町村名を、データベース110から複数の市町村名を検索することが可能な検索可能データ、即ち、一般的な特徴を示す属性データおよび度合表示データへ置換する。
【0075】
図10(A)は、図9(A)に示すデータ番号、属性データおよび度合表示データの関係を示す。データ番号1、2および3のそれぞれの度合表示データはA町、B町およびC町である。
【0076】
図10(B)に示すように、町名を末端ノードに有する決定木を用いて、「人口」および「自動車の普及率」という2つの特徴によってA町、B町およびC町を区別する。町の人口が1万人以上という特徴によって、C町がA町およびB町と区別され、さらに、自動車普及率が60%以上という特徴によってA町とB町とが区別されている。
【0077】
図10(A)に示す属性データに代えて、図10(B)に示す決定木を挿入することによって図10(C)に示す決定木が形成される。図10(C)に示す決定木に基づいて作成された地理情報分析用データが図9(B)に示されている。図9(B)に示す地理情報分析用データをデータ分析器150がデータ分析することによって、適切な傾向を得ることができる。本実施の形態によれば、「人口が1万人以下である場合に測定結果が「○」である」という傾向が得られる。
【0078】
尚、本実施の形態において、データベース110は、地理情報データに対応した人口の分布データおよび自動車の普及率の分布データを予め有し、検索・変換器132がA町、B町およびC町の人口および自動車普及率を抽出する。また、本実施の形態においては、人口および自動車の普及率の2つの特徴の組合せを属性データとして用いたが、1つの特徴または3つ以上の特徴の組合せを属性データとしてもよい。
【0079】
図11は、本実施の形態による方法のフロー図である。本実施の形態のフロー図のステップS10からステップS40までは図5に示すフロー図と同様である。
【0080】
続いて、決定木作成木210が、地理情報分析用データに含まれる固有名称に代わる地理的特徴の組合せを決定するために決定木を作成する(S42)。
【0081】
次に、決定木によって得られた特徴をそれぞれ属性データとして、位置データごとに特徴に該当する度合を度合表示データとして観測データへ付加する(S44)。これにより、地理情報分析用データが完成する。
【0082】
データ分析器150が、地理情報分析用データをデータ分析することによって、事象の生じる傾向が発見される。
【0083】
本実施の形態によれば、固有名称などの地理情報データにおける地図上の一点の場所を表す固有データを検索可能データに置換するので、データ分析器150が地理情報分析用データをデータ分析することによって適切な傾向を得ることができる。
【0084】
第2の実施の形態による方法においてクラスタを属性データとしたが、本実施の形態においては、このクラスタを他の地理的特徴の組合せへ変換してもよい。この場合、図6に示すクラスタAに属する観測データの総てに共通する地理的な特徴を属性データとすればよい。
【0085】
図12は、本発明に係るさらに他の実施の形態に従ったデータ分析装置300のブロック図である。データ分析装置300は、語彙データを格納したデータベース310および語彙編集器320をさらに備えている点でデータ分析装置100と異なる。データベース310は、地理情報データに含まれる項目ではない語彙、即ち、検索不能な語彙およびその語彙に対応する地理情報データの項目と同じ語彙、即ち、自動検索可能な語彙が予め登録されている。語彙編集器320は、語彙検索不能な語彙を自動検索可能な語彙の組合せに変換するように構成されている。
【0086】
図13は、本発明によるデータ分析方法の第4の実施の形態に係る概念図である。本実施の形態はデータ分析装置300によって実行される。本実施の形態は、第3の実施の形態と同様に、地理情報分析用データに含まれている自動検索不能な語彙を自動検索可能な表現で置換する。
【0087】
例えば、属性データが「Yに四方を囲まれている」であった場合には、四方を囲まれている基準がない。よって、このような属性データを含む地理情報分析用データは自動検索することができないのでデータ分析することができない。そこで、「Yに四方を囲まれている」に関連付けて、「北10Km以内にYがある」、「東10Km以内にYがある」、「西10Km以内にYがある」および「南10Km以内にYがある」という4つの語彙をデータベース310に予め登録しておく。語彙編集器320が「Yに四方を囲まれている」という語彙に対してこれら4つの語彙をデータベース310から読み出して組み合わせる。これら4つの語彙の組合せを属性データとして地理情報分析用データを作成する。これによって、地理情報分析用データは、データ分析器150によってデータ分析され得る。
【0088】
図14は、本実施の形態による方法のフロー図である。本実施の形態のフロー図のステップS10からステップS40までは図5に示すフロー図と同様である。
【0089】
続いて、語彙編集器320が自動検索不能な語彙に対して自動検索可能な語彙の組合せをデータベース310から読み出す(S41)。
【0090】
次に、自動検索可能な語彙の組合せを属性データとし、これらの語彙のそれぞれに該当する度合を度合表示データとして観測データへ付加する(S43)。これにより地理情報分析用データが完成する。
【0091】
さらに、データ分析器150が、地理情報分析用データをデータ分析する(S50)。これにより事象の生じる傾向が発見される。
【0092】
本実施の形態によれば、フォーマットの異なる地理情報データを表形式に変換して観測データへ付加し、地理情報分析用データを自動的に作成することができる。地理情報分析用データに空間データマイニング法または統計データ分析法等のデータ分析を施すことによって、事象が生じる傾向を導出することができる。この傾向は、例えば、IF−THEN規則によって表現される。
【0093】
この傾向を応用することによって、データベース110に格納された地理情報データが示す地域(以下、第1の地域という)とは異なる他の地域(以下、第2の地域という)において同じ事象の生じる傾向を予測することができる。
【0094】
例えば、第2の地域においては道路の損傷度の観測が未だ実施されていないとする。この場合、予測の対象となる予測対象データは、位置データを有するものの、図2に示す観測データと異なり、道路の損傷度を示す事象データを有しない。
【0095】
そこで、地理情報分析用データに含まれていた属性データに基づいて、予測対象データの位置データのそれぞれに対応した度合表示データを予測対象データに付加する。例えば、「10m以内に交差点があるか」という属性データおよびこの属性データに該当する場合に「○」該当しない場合に「×」という度合表示データを予測対象データへ付加する。第1の地域の地理情報分析用データを分析することによって得られた傾向を、度合表示データを有する予測対象データに適用する。例えば、「10m以内に交差点がある場合に道路の損傷度が大きい」という傾向を予測対象データへ適用する。それによって、予測対象データに含まれる度合表示データから第2の地域における道路の損傷度が判明する。
【0096】
このようにして、データ分析装置から得た属性データに関する傾向に基づいて、実際に観測されていない事象を予測することができる。この予測による結果データは、例えば、補修工事が必要な道路の位置を予測することに役立つ。
【0097】
上述したデータ分析装置またはデータ分析方法は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、データ分析装置の機能またはデータ分析方法を実現するプログラムをフロッピーディスクやCD−ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の携帯可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
【0098】
また、上述したデータ分析装置の機能またはデータ分析方法を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
【0099】
【発明の効果】
本発明に従った分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラムは、観測データに含まれる位置データに基づいて地理情報データから分析に必要な属性データを自動抽出し、この属性データおよび観測データに基づいてデータ分析を自動的に行うことを可能にする。
【図面の簡単な説明】
【図1】本発明に係る実施の形態に従ったデータ分析装置100のブロック図。
【図2】観測データの具体例を示す概念図。
【図3】地理情報分析用データの具体例を示す概念図。
【図4】本発明によるデータ分析方法の第1の実施形態に係る地理情報データおよび地理情報分析用データの概念図。
【図5】データ分析方法の第1の実施形態のフロー図。
【図6】本発明によるデータ分析方法の第2の実施形態に係る地理情報データおよび地理情報分析用データの概念図。
【図7】第2の実施の形態による方法のフロー図。
【図8】本発明に係る実施の形態に従った他のデータ分析装置200のブロック図。
【図9】本発明によるデータ分析方法の第3の実施形態に係る概念図。
【図10】決定木を作成する過程を示した概念図。
【図11】第3の実施の形態による方法のフロー図。
【図12】本発明に係るさらに他の実施の形態に従ったデータ分析装置300のブロック図。
【図13】本発明によるデータ分析方法の第4の実施の形態に係る概念図。
【図14】第4の実施の形態による方法のフロー図。
【符号の説明】
100、200、300 データ分析装置
110、120、310 データベース
130 データ処理部
132 検索・変換器
134 表データ管理器
140 メモリ
150 データ分析器
210 決定木作成器
320 語彙編集器
【発明の属する技術分野】
本発明は、分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラムに関する。
【0002】
【従来の技術】
データベース内にある多数の情報の空間的な傾向を導出するデータ分析方法として空間データマイニング法や統計分析法がある。空間データマイニング法や統計分析法は、2次元または3次元以上の空間座標で示された分析対象データが空間内のどの箇所に密集しているか等の分析対象データの空間的な傾向を発見するために用いられる。
【0003】
たとえば空間的な傾向を見るために、与えられる地点からみた、目的関数を最適化する距離や方向を分析する方法が知られている(特許文献1を参照)。
【0004】
一般に、広範囲に亘る空間において収集された多くの観測データを分析する場合には、観測点の地理的な特徴が影響することが多い。従って、観測点の地理的な特徴を示す属性データを観測データに付加することによってデータ分析の精度を向上させることができる。
【0005】
例えば、広範囲に亘る道路の損傷度合の傾向をデータ分析によって予測する場合に、その道路が通過する地域の地形、その地域の近傍にある構造物、その地域における降水量またはその道路の交通量等の属性データを道路の点検結果データに付加して分析する。それによって、例えば、道路のうち交通量の多い部分の損傷の度合が激しい等の傾向が得られる。
【0006】
【特許文献1】
特開2001−318938公報
【0007】
【発明が解決しようとする課題】
しかしながら、どのような地理的特徴が属性データとして分析に有効であるのかは、通常、データ分析後に結果的に判明する。従って、正確なデータ分析を担保するためには、広範囲に亘って大量の観測データを収集する必要がある。一方で、不必要な観測データまでをも観測および記録することはコスト高になる。そこで、通常、必要であると判明している箇所の観測データのみを収集することが行われている。しかし、このような場合には、予想外の属性データに関する傾向をデータ分析によって得ることができない。即ち、予め必要と判明している箇所の観測データのみを収集することは、データ分析に限界を与えてしまう。
【0008】
観測データには空間内の観測地点を表す位置データが付加されている場合が多い。そこで、収集された観測データに不足がある場合には、観測データの位置データに基づいて地図データなどの空間データから属性データを検索することが考えられる。
【0009】
上述の通り、大量の観測データを分析する手法としてデータマイニングや統計データ分析が用いられている。データマイニングや統計データ分析は、表形式で表されたデータを分析対象としている。一方で、地図データなどの空間データは電子化されているものの表形式ではないので、データマイニングや統計データ分析を実行するときに、観測データに空間データを直接に適用することができない。即ち、従来においては、空間データと観測データとのフォーマットが異なるので、コンピュータを用いて位置データから属性データを自動検索および自動抽出し、この属性データおよび観測データに基づいてデータ分析を自動的に行うことができなかった。
【0010】
従って、従来から、地図データのような空間データから属性データを抽出する作業は人手によって行われていた。人手による作業は、属性データの見落とし、あるいは、作業者の主観による判断の偏りを発生させる原因となる。
【0011】
そこで、本発明の目的は、観測データに含まれる位置データに基づいて地理情報データから分析に必要な属性データを自動抽出し、この属性データおよび観測データに基づいてデータ分析を自動的に行うことを可能とするデータ分析方法、データ分析装置およびデータ分析プログラムを提供することである。
【0012】
【課題を解決するための手段】
本発明に係る実施の形態に従った分析用データ作成方法は、地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いた分析用データ作成方法であって、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記事象の生じる傾向を導出するために用いられる地理情報分析用データを作成する付加ステップとを具備する。
【0013】
本発明に係る実施の形態に従ったデータ分析方法は、地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いたデータ分析方法であって、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記地理情報分析用データを作成する付加ステップと、前記地理情報分析用データを用いて前記事象が生じる傾向を導出する導出ステップとを具備する。
【0014】
本発明に係る実施の形態に従ったデータ分析装置は、地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置において生じた事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部と、前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出し、前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換して前記観測データへ付加することによって地理情報分析用データを作成するデータ処理部と、前記地理情報分析用データを用いて、前記事象が生じる傾向を導出するデータ分析部とを備えている。
【0015】
好ましくは、前記属性データは前記位置データが示す前記地理上の位置からの距離に関する特徴、若しくは、前記地理におけるある状態の分布に関する特徴を示す。
【0016】
前記データ処理部は、前記位置データの分布に基づいて前記地理内を複数の地域群に分割し、前記観測データを前記地域群と前記位置データとの関係に基づいて前記地域群に分類し、前記地域群を前記属性データとして、並びに、前記位置データが属する前記地域群の名称を前記度合表示データとして前記観測データへ付加するように構成してもよい。
【0017】
前記観測データまたは前記属性データに、前記地理情報データにおける地図上の一点の場所を示す固有データが含まれている場合に、好ましくは、前記データ処理部は、前記固有データを、前記地理情報データから複数検索可能なデータに変換する。
【0018】
前記固有データは固有名称である場合、好ましくは、前記データ処理部は、前記固有名称を、地図情報データから抽出可能な該固有名称が有する特徴またはこれら特徴の組合せに変換する。
【0019】
当該データ分析装置は、予め第1の特徴と第2の特徴とを関連付けて記憶した第3の記憶部と、特徴の表現に含まれる前記第1の特徴の表現を、前記第2の特徴の表現に変換するデータ変換部とをさらに備えていてもよい。
【0020】
本発明に係る実施の形態に従ったデータ作成プログラムは、地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いて、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記事象の生じる傾向を導出するために用いられる地理情報分析用データを作成する付加ステップとを処理する。
【0021】
本発明に係る実施の形態に従ったデータ分析プログラムは、地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いて、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記事象の生じる傾向を導出するために用いられる地理情報分析用データを作成する付加ステップと、前記地理情報分析用データを用いて前記事象が生じる傾向を導出する導出ステップとを処理する。
【0022】
好ましくは、前記属性データは前記位置データが示す前記地理上の位置からの距離に関する特徴、若しくは、前記地理におけるある状態の分布に関する特徴を示す。
【0023】
前記抽出ステップにおいて、前記位置データの分布に基づいて前記地理内を複数の地域群に分割し、該地域群を前記属性データとして抽出し、前記計算機は、前記抽出ステップ後に、前記観測データを前記地域群と前記位置データとの関係に基づいて前記地域群に分類する分類ステップをさらに処理し、前記付加ステップにおいて、前記地域群を前記属性データとして、並びに、前記位置データが属する前記地域群の名称を前記度合表示データとして前記観測データへ付加してもよい。
【0024】
前記観測データまたは前記属性データに、前記地理情報データにおける地図上の一点の場所を表す固有データが含まれている場合に、好ましくは、前記計算機は、前記固有データを、前記固有データに対して付与された前記地理情報データに含まれる地理的特長を示す情報から、該固有データが持つ特徴を求め、該特徴または該特徴の組合せを用いて、該固有データを複数の場所を示すデータに変換する変換ステップをさらに処理する。
【0025】
前記固有データが固有名称である場合、好ましくは、前記変換ステップにおいて、前記固有名称を、地図情報データから抽出可能な該固有名称が有する特徴またはこれら特徴の組合せに変換する。
【0026】
前記計算機は、予め第1の特徴と第2の特徴とを関連付けて記憶した第3の記憶部をさらに備え、前記変換ステップにおいて、特徴の表現に含まれる前記第1の特徴の表現を、前記第2の特徴の表現に変換してもよい。
【0027】
【発明の実施の形態】
以下、本発明による実施の形態を説明する。尚、本実施の形態は本発明を限定するものではない。
【0028】
図1は、本発明に係る実施の形態に従ったデータ分析装置100のブロック図である。データ分析装置100は、ある地理に関する地理情報データを記憶するデータベース110と、観測データを表形式で記憶するデータベース120とを備える。
【0029】
地理情報データは、1次元以上の空間を示すデータであり、代表的には2次元の平面空間および3次元の立体空間をベクタ形式、図形形式等で表したデータである。例えば、地理情報データは地図データまたはGIS(Geographic Information System)データ等である。
【0030】
観測データは地理内の位置座標を示す位置データおよびその位置において生じた事象を示す事象データを表形式で表したデータである。例えば、ある地理内の道路の損傷度を観測した観測データを観測データとする。この場合、位置データは道路の観測地点の座標を示し、事象データはその観測地点における道路の損傷度を示す(図2参照)。
【0031】
図2は観測データの具体例を示す概念図である。この観測データは、道路の損傷度を示す観測データである。本実施形態において、位置データは道路上の座標(X,Y)である。位置データは、地理内の位置座標を示し、位置属性と換言してもよい。事象データは各座標における道路の損傷度(大、中、小)である。事象データはクラス属性と換言してもよい。さらに、道路を建築した業者名および道路を建築した年度が観測データに含まれている。
【0032】
図1を再度参照して、データ分析装置100は、地理情報データおよび観測データに基づいて地理情報分析用データを作成するデータ処理部130と、観測データまたは地理情報分析用データ等のデータを一時的に格納することができるメモリ140と、地理情報分析用データをデータ分析し、事象の生じる傾向を導出するデータ分析器150とをさらに備える。データ分析とは、例えば、空間データマイニング法または統計分析法である。事象の生じる傾向とは、例えば、「交通量の多い道路は損傷が大きい」等のある空間においてある事象の生じる傾向である。
【0033】
データ処理部130は、地理内のある特徴をデータベース110から検索してその特徴を表形式の属性データへ変換する検索・変換器132と、観測データへ属性データを項目として付加する表データ管理器134とを有する。表データ管理器134は、さらに、各位置データごとにその特徴に該当する度合を示す度合表示データを付加する。観測データに属性データおよび度合表示データを付加することによって、地理情報分析用データが作成される(図3参照)。
【0034】
図3は、地理情報分析用データの具体例を示す概念図である。地理情報分析用データは、観測データへ属性データおよび度合表示データを付加して形成された表形式のデータである。地理情報分析用データは、属性データを項目とし、この項目に対して各位置データごとに度合表示データを有する。尚、地理情報分析用データは、分析のために用意された。
【0035】
属性データは地理内のある位置における任意の特徴を表すデータであり、属性名と換言してもよい。例えば、「ある位置の10m以内に交差点がある」、「ある位置の10m以内にカーブがある」、「ある位置の交通量」、「ある位置が含まれる市町村の人口密度」等が属性データとなり得る。
【0036】
度合表示データは、各位置データごとに属性データに該当する度合を示すデータであり、属性値と換言してもよい。即ち、度合表示データは、各位置データにおいて、属性データが示す特徴の有無や数値などの度合を示す。例えば、属性データが「ある位置の10m以内に交差点がある」である場合に、位置データの座標の10m以内に交差点の座標が存在するときには度合表示データは「有」であり、位置データの座標の10m以内に交差点の座標が存在しないときには度合表示データは「無」である。また、属性データが「ある位置の交通量」である場合には、度合表示データは位置データの座標における交通量の数値である。従って、度合表示データは、有または無の2値データであってもよく、交通量などの変数データであってもよい。
【0037】
尚、属性データは複数であってもよい。属性データが複数ある場合には、属性データと同数の項目が観測データへ付加され、属性データと同数の度合表示データが各位置データに対応して観測データへ付加される。
【0038】
観測データは、観測によって収集された属性名(属性データ)およびその属性値(度合表示データ)を意味する。地理情報分析用データは、分析のために用意された属性名(属性データ)およびその属性値(度合表示データ)を意味する。
【0039】
このように、データ分析装置100は、地理情報データに基づく属性データと、属性データに該当する度合を示す度合表示データとを観測データへ付加することによって地理情報分析用データを作成する。
【0040】
地理情報分析用データは、データ分析器150によってデータ分析される。地理情報分析用データを分析することによって、属性データに関する傾向が得られる。例えば、図3に示した地理情報分析用データから「交差点の10m以内に位置する道路の損傷度は大きい」という傾向が得られ得る。
【0041】
データ処理部130およびデータ分析器150はコンピュータのCPUを用いて実現され得る。データ分析装置100は、データベース110、データベース120、データ処理部130、メモリ140およびデータ分析器150を個別に備え、これらを通信可能に接続したシステムであってもよい。一方で、データ分析装置100は、データベース110、データベース120、データ処理部130、メモリ140およびデータ分析器150を一体に組み込んだワークステーションなどであってもよい。
【0042】
図4(A)は、本発明に従ったデータ分析方法の第1の実施形態に係る地理情報データの概念図である。図4(B)は、第1の実施形態に係る地理情報分析用データの概念図である。図5は第1の実施形態によるデータ分析方法のフロー図である。本実施の形態はデータ分析装置100を用いて実行され得る。
【0043】
図4(A)に示す地理情報データはデータベース110に格納されており、図4(B)に示す地理情報分析用データのうち観測データはデータベース120に格納されている。本実施の形態において、地理情報データはある地域の地図データである。この地図データ内に示す観測点1から観測点3において観測が実施され、その測定結果が観測データに示されている。観測データには、観測点1から観測点3のそれぞれの位置データとして座標(X,Y)が示されている。また、観測点1から観測点3に対応した測定結果(○または×)が示されている。
【0044】
例えば、本実施の形態は、観測点1から観測点3のそれぞれの道路の損傷度を観測したデータを示していると仮定する。この場合、損傷度が所定の基準以上である観測点の測定結果を「○」とし、損傷度が所定の基準未満である観測点の測定結果を「×」とする。
【0045】
データ処理部130は、観測データをデータベース120から読み出し、メモリ140へ格納する(S10)。
【0046】
次に、検索・変換器132がデータベース110に格納されている地理情報データからある特徴を検索する(S20)。この検索は、データベース110に格納されている地理情報データから任意の特徴を検索することが好ましい。但し、データ分析の結果として傾向が得られないと判明している属性データは選択しない。例えば、総ての位置データに対応する度合表示データが同じである場合は、データ分析によって傾向を得ることができない。従って、ある特徴に対して度合表示データを判定し、その結果、総ての位置データにおいて同じとなる属性データは選択しない。
【0047】
より詳細には、図4(A)において、属性データが「100m以内に学校がある」である場合には、データ番号1から3のいずれの位置も学校から100m以内に存在しない。よって、総ての位置データにおいて度合表示データが「No」となる。その結果、データ分析器150が地理情報分析用データをデータ分析したとしても何らの傾向も得られない。このように、総ての位置データにおいて度合表示データが同じになるような属性データは選択されない。
【0048】
図4(B)における地理情報分析用データに示されているように、「100m以内に病院がある」という属性データが選択されている。この場合には、度合表示データは、観測点1および観測点2において「Yes」であり、観測点3において「No」である。度合表示データは、例えば、病院が位置する座標と観測点1から観測点3の座標との距離を計算し、その距離が100m以下であるか否かを判別することによって作成され得る。
【0049】
次に、検索・変換器132は、属性データおよび度合表示データを表形式に変換する(S30)。観測データも表形式であるので、属性データおよび度合表示データは、表形式に変換されることによって観測データへ付加され得る。
【0050】
次に、データ処理部130が、メモリ140内に格納された観測データへ属性データおよび度合表示データを付加する(S40)。それによって、地理情報分析用データが完成する。
【0051】
さらに、データ分析器150が、メモリ140に格納された地理情報分析用データをデータ分析する(S50)。その結果、例えば、「100m以内に病院がある道路の損傷度は所定の基準以上である」という傾向が得られる。
【0052】
本実施の形態において、観測点は3つだけであったが、より多くの観測点における測定結果が観測データに含まれていることが好ましい。それによって、地理情報分析用データからより正確な傾向が得られ得る。本実施の形態において、属性データは、位置データが示す地理上の座標から病院までの距離に関する情報であった。
【0053】
位置データが示す位置からの距離に関する属性データの他の具体例として、例えば、「周囲Sm以内にTがある」を属性データとしてもよい。このときSが定数である場合には、度合表示データは、位置データが示す座標のSm以内にTがあるときに「Yes」であり、これに該当しないときに「No」である。即ち、Sが定数である場合には、度合表示データは2値情報になる。一方で、Sが変数である場合には、度合表示データは、位置データが示す座標からTまでの距離を示すデータになる。即ち、Sが変数である場合には、度合表示データは多値情報となる。
【0054】
さらに、例えば、「北側Pm以内にQがある」を属性データとしてもよい。Pが定数である場合またはある範囲を示す場合には、度合表示データは、位置データが示す座標の北側Pm以内にQがあるときに「Yes」であり、これに該当しないときに「No」である。即ち、Pが定数である場合またはある範囲を示す場合には、度合表示データは2値情報になる。一方で、Pが変数である場合には、度合表示データは、位置データが示す座標とQとの距離である。即ち、Pが変数である場合には、度合表示データは多値情報となる。
【0055】
上記の具体例においては、属性データは、位置データが示す地理上の位置からの距離に関するものであった。しかし、このような距離に限らず、属性データは地理上ある状態の分布に関する特徴を示すものであってもよい。
【0056】
例えば、地理情報データが示す地域におけるある状態の分布に関する特徴、具体的には、地理情報データが示す地域の人口密度分布データを予めデ―タベース110に格納しておき、「人口密度がnである」を属性データとしてもよい。nが定数である場合またはある範囲を示す場合には、度合表示データは、位置データが示す座標の人口密度がこの属性データに該当するときに「Yes」であり、これに該当しないときに「No」である。即ち、nが定数である場合またはある範囲を示す場合には、度合表示データは2値情報になる。一方で、nが変数である場合には、度合表示データは、位置データが示す座標の人口密度の数値である。即ち、nが変数である場合には、度合表示データは多値情報となる。
【0057】
また、例えば、「時刻Uの時は交通量がV以上である」を属性データとしてもよい。このときUが定数である場合またはある範囲を示す場合には、度合表示データは、位置データが示す座標の交通量がV以上であるときに「Yes」であり、これに該当しないときに「No」である。即ち、Uが定数である場合には、度合表示データは2値情報になる。一方で、Uが変数である場合には、度合表示データは、位置データが示す座標において交通量がV以上であるときの日時である。即ち、Uが変数である場合には、度合表示データは多値情報となる。
【0058】
勿論、度合表示データは3値以上の離散的な値のいずれかであってもよい。例えば、属性データが「人口密度がnである」であって、nがある範囲を示す場合に、度合表示データは、位置データが示す座標の人口密度がnが示す範囲より高いときに「高」、nが示す範囲に含まれる場合に「中」、nが示す範囲より低いときに「低」とする。これによって、度合表示データを3値情報にすることができる。
【0059】
本実施の形態によれば、位置データに基づいて地理情報データから分析に必要な属性データを抽出し、この属性データおよび度合表示データを表形式へ自動で変換することができる。それによって、データ分析装置100は、属性データおよび度合表示データを分析対象データ(即ち、観測データ)へ付加して地理情報分析用データを作成することができる。データ分析器150が、空間データマイニング法や統計分析法などのデータ分析をこの地理情報分析用データに施すことによって、その地理内において事象が生じる傾向を得ることができる。
【0060】
図6(A)は、本発明によるデータ分析方法の第2の実施形態に係る地理情報データの概念図である。図6(B)は、第2の実施形態に係る地理情報分析用データの概念図である。本実施の形態はデータ分析装置100を用いて実行され得る。本実施の形態のフロー図は、図5に示したフロー図とほぼ同様であるが、ステップS20においてデータ処理部130がクラスタリング処理を併用して属性データおよび度合表示データを観測データへ付加する点で異なる。
【0061】
データ処理部130は、観測データのうち位置データが示す座標を地理情報データ上にプロットし、距離が近い位置データ同士を関連付けることによって複数のクラスタを形成する。本実施の形態によれば、属性データはクラスタであり、度合表示データは各位置データが属するクラスタ名である。
【0062】
例えば、図6(A)に示すように、データ番号1からデータ番号9までの位置データが示す座標(X,Y)を地理情報データへプロットする。これらの位置データをクラスタリング処理することによって、3つのクラスタA、BおよびCが形成される。属性データをクラスタとすれば、度合表示データは各位置データが属するクラスタ名、即ち、クラスタA、BまたはCのいずれかである。これらの処理はデータ処理部130が実行する。尚、クラスタリング処理はデータ分析器150が実行してもよい。
【0063】
図7は、本実施の形態による方法のフロー図である。第1の実施形態におけるステップS20において、属性データとしてクラスタが選択される。その後、データ処理部130が、データ番号1から9の位置データを地理情報データにプロットする(S22)。図6(A)の地図情報データ上に示された1から9の点がステップ22においてプロットされた位置データである。
【0064】
次に、地理情報データにプロットされた位置データをクラスタリングする(S24)。これにより、データ番号1から9の観測データが地理情報データに基づいてクラスタA、BまたはCへクラスタリングされる。
【0065】
次に、クラスタを属性データとして、並びに、各位置データが属するクラスタ名を度合表示データとして表形式に変換する(S30)。
【0066】
次に、これらの属性データおよび度合表示データを観測データへ付加する(S40)。それにより、地理情報分析用データが完成する。このように、本実施の形態により、クラスタリング処理を併用して図6(B)に示す地理情報分析用データを作成することができる。
【0067】
さらに、第1の実施の形態と同様にデータ分析部150がデータ分析を実行する(S50)。データ分析器150が、図6(B)に示す地理情報分析用データを分析することによって、例えば、「クラスタAおよびクラスタA近傍の道路の損傷度が基準を超えている」等の傾向が得られる。
【0068】
本実施の形態によれば、属性データはクラスタであり、度合表示データがクラスタ名である。しかし、クラスタに代えてクラスタが位置する地点の地理的な特徴を属性データおよび度合表示データとして採用してもよい。この地理的な特徴は、同じクラスタに属する位置データが共通に有する特徴である。例えば、属性データを「共通して100m以内にある構造物」として、同じクラスタの総ての位置データから100m以内にある構造物の名称をクラスタA、BまたはCに代えて度合表示データとして観測データへ付加する。これにより、地理情報データ内にある名称を度合表示データとして用いることができる。
【0069】
また、各クラスタの代表点が有する特徴を属性データおよび度合表示データとして採用してもよい。代表点は、例えば、あるクラスタのうちの1つの位置データの座標であってもよく、そのクラスタ内の総ての位置データの座標を平均した座標であってもよい。例えば、属性データを「共通して100m以内にある構造物」とした場合には、クラスタの代表点から100m以内にある構造物の名称をクラスタ名に代えて度合表示データとして観測データへ付加する。
【0070】
1つのクラスタを複数の属性データで置換してもよい。例えば、あるクラスタを、「100m以内にある構造物」と「河川の近傍」との2つの属性データで置換してもよい。この場合は、属性データの項目が2つになる。度合表示データは、クラスタ内の位置データから100m以内にある構造物の名称、および、河川の近傍であるか否かを示す「Yes」または「No」である。これら2つの度合表示データが各項目に対して位置データごとに付加される。
【0071】
図8は、本発明に係る実施の形態に従った他のデータ分析装置200のブロック図である。データ分析装置200は、決定木作成器210をさらに備えている点でデータ分析装置100と異なる。決定木作成器210は、地理情報データにおける地図上の一点の場所を表す固有データ(例えば、固有名称)が含まれている場合に、この固有データを複数検索可能なデータに置換する。
【0072】
図9(A)から図10(C)は、本発明によるデータ分析方法の第3の実施形態に係る概念図である。図9(A)は、属性データが市町村名という固有名称を有する地理情報分析用データの概念図である。図9(B)は、図9(A)に示す地理情報分析用データを決定木作成器210によって処理した後の地理情報分析用データの概念図である。図10(A)から図10(C)は、決定木を作成する過程を示した概念図である。
【0073】
図9(A)に示す地理情報分析用データの属性データは市町村名であり、その度合表示データは具体的な町名である。図9(A)に示す地理情報分析用データをデータ分析した場合には、A町およびB町における測定結果が「○」であり、一方、C町における測定結果が「×」であることがわかる。しかし、A町およびB町に共通する特徴が不明であるので、測定結果が「○」となる原因は依然として不明である。即ち、市町村名はその市町村自体を表す固有名称であるので、データ分析器150が市町村名を含む地理情報分析用データをデータ分析しても、適切な傾向を得ることができない。
【0074】
そこで、図10(A)から図10(C)に示すように、決定木を利用して、図9(A)に示す属性データおよび度合表示データの市町村名を、データベース110から複数の市町村名を検索することが可能な検索可能データ、即ち、一般的な特徴を示す属性データおよび度合表示データへ置換する。
【0075】
図10(A)は、図9(A)に示すデータ番号、属性データおよび度合表示データの関係を示す。データ番号1、2および3のそれぞれの度合表示データはA町、B町およびC町である。
【0076】
図10(B)に示すように、町名を末端ノードに有する決定木を用いて、「人口」および「自動車の普及率」という2つの特徴によってA町、B町およびC町を区別する。町の人口が1万人以上という特徴によって、C町がA町およびB町と区別され、さらに、自動車普及率が60%以上という特徴によってA町とB町とが区別されている。
【0077】
図10(A)に示す属性データに代えて、図10(B)に示す決定木を挿入することによって図10(C)に示す決定木が形成される。図10(C)に示す決定木に基づいて作成された地理情報分析用データが図9(B)に示されている。図9(B)に示す地理情報分析用データをデータ分析器150がデータ分析することによって、適切な傾向を得ることができる。本実施の形態によれば、「人口が1万人以下である場合に測定結果が「○」である」という傾向が得られる。
【0078】
尚、本実施の形態において、データベース110は、地理情報データに対応した人口の分布データおよび自動車の普及率の分布データを予め有し、検索・変換器132がA町、B町およびC町の人口および自動車普及率を抽出する。また、本実施の形態においては、人口および自動車の普及率の2つの特徴の組合せを属性データとして用いたが、1つの特徴または3つ以上の特徴の組合せを属性データとしてもよい。
【0079】
図11は、本実施の形態による方法のフロー図である。本実施の形態のフロー図のステップS10からステップS40までは図5に示すフロー図と同様である。
【0080】
続いて、決定木作成木210が、地理情報分析用データに含まれる固有名称に代わる地理的特徴の組合せを決定するために決定木を作成する(S42)。
【0081】
次に、決定木によって得られた特徴をそれぞれ属性データとして、位置データごとに特徴に該当する度合を度合表示データとして観測データへ付加する(S44)。これにより、地理情報分析用データが完成する。
【0082】
データ分析器150が、地理情報分析用データをデータ分析することによって、事象の生じる傾向が発見される。
【0083】
本実施の形態によれば、固有名称などの地理情報データにおける地図上の一点の場所を表す固有データを検索可能データに置換するので、データ分析器150が地理情報分析用データをデータ分析することによって適切な傾向を得ることができる。
【0084】
第2の実施の形態による方法においてクラスタを属性データとしたが、本実施の形態においては、このクラスタを他の地理的特徴の組合せへ変換してもよい。この場合、図6に示すクラスタAに属する観測データの総てに共通する地理的な特徴を属性データとすればよい。
【0085】
図12は、本発明に係るさらに他の実施の形態に従ったデータ分析装置300のブロック図である。データ分析装置300は、語彙データを格納したデータベース310および語彙編集器320をさらに備えている点でデータ分析装置100と異なる。データベース310は、地理情報データに含まれる項目ではない語彙、即ち、検索不能な語彙およびその語彙に対応する地理情報データの項目と同じ語彙、即ち、自動検索可能な語彙が予め登録されている。語彙編集器320は、語彙検索不能な語彙を自動検索可能な語彙の組合せに変換するように構成されている。
【0086】
図13は、本発明によるデータ分析方法の第4の実施の形態に係る概念図である。本実施の形態はデータ分析装置300によって実行される。本実施の形態は、第3の実施の形態と同様に、地理情報分析用データに含まれている自動検索不能な語彙を自動検索可能な表現で置換する。
【0087】
例えば、属性データが「Yに四方を囲まれている」であった場合には、四方を囲まれている基準がない。よって、このような属性データを含む地理情報分析用データは自動検索することができないのでデータ分析することができない。そこで、「Yに四方を囲まれている」に関連付けて、「北10Km以内にYがある」、「東10Km以内にYがある」、「西10Km以内にYがある」および「南10Km以内にYがある」という4つの語彙をデータベース310に予め登録しておく。語彙編集器320が「Yに四方を囲まれている」という語彙に対してこれら4つの語彙をデータベース310から読み出して組み合わせる。これら4つの語彙の組合せを属性データとして地理情報分析用データを作成する。これによって、地理情報分析用データは、データ分析器150によってデータ分析され得る。
【0088】
図14は、本実施の形態による方法のフロー図である。本実施の形態のフロー図のステップS10からステップS40までは図5に示すフロー図と同様である。
【0089】
続いて、語彙編集器320が自動検索不能な語彙に対して自動検索可能な語彙の組合せをデータベース310から読み出す(S41)。
【0090】
次に、自動検索可能な語彙の組合せを属性データとし、これらの語彙のそれぞれに該当する度合を度合表示データとして観測データへ付加する(S43)。これにより地理情報分析用データが完成する。
【0091】
さらに、データ分析器150が、地理情報分析用データをデータ分析する(S50)。これにより事象の生じる傾向が発見される。
【0092】
本実施の形態によれば、フォーマットの異なる地理情報データを表形式に変換して観測データへ付加し、地理情報分析用データを自動的に作成することができる。地理情報分析用データに空間データマイニング法または統計データ分析法等のデータ分析を施すことによって、事象が生じる傾向を導出することができる。この傾向は、例えば、IF−THEN規則によって表現される。
【0093】
この傾向を応用することによって、データベース110に格納された地理情報データが示す地域(以下、第1の地域という)とは異なる他の地域(以下、第2の地域という)において同じ事象の生じる傾向を予測することができる。
【0094】
例えば、第2の地域においては道路の損傷度の観測が未だ実施されていないとする。この場合、予測の対象となる予測対象データは、位置データを有するものの、図2に示す観測データと異なり、道路の損傷度を示す事象データを有しない。
【0095】
そこで、地理情報分析用データに含まれていた属性データに基づいて、予測対象データの位置データのそれぞれに対応した度合表示データを予測対象データに付加する。例えば、「10m以内に交差点があるか」という属性データおよびこの属性データに該当する場合に「○」該当しない場合に「×」という度合表示データを予測対象データへ付加する。第1の地域の地理情報分析用データを分析することによって得られた傾向を、度合表示データを有する予測対象データに適用する。例えば、「10m以内に交差点がある場合に道路の損傷度が大きい」という傾向を予測対象データへ適用する。それによって、予測対象データに含まれる度合表示データから第2の地域における道路の損傷度が判明する。
【0096】
このようにして、データ分析装置から得た属性データに関する傾向に基づいて、実際に観測されていない事象を予測することができる。この予測による結果データは、例えば、補修工事が必要な道路の位置を予測することに役立つ。
【0097】
上述したデータ分析装置またはデータ分析方法は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、データ分析装置の機能またはデータ分析方法を実現するプログラムをフロッピーディスクやCD−ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の携帯可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
【0098】
また、上述したデータ分析装置の機能またはデータ分析方法を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
【0099】
【発明の効果】
本発明に従った分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラムは、観測データに含まれる位置データに基づいて地理情報データから分析に必要な属性データを自動抽出し、この属性データおよび観測データに基づいてデータ分析を自動的に行うことを可能にする。
【図面の簡単な説明】
【図1】本発明に係る実施の形態に従ったデータ分析装置100のブロック図。
【図2】観測データの具体例を示す概念図。
【図3】地理情報分析用データの具体例を示す概念図。
【図4】本発明によるデータ分析方法の第1の実施形態に係る地理情報データおよび地理情報分析用データの概念図。
【図5】データ分析方法の第1の実施形態のフロー図。
【図6】本発明によるデータ分析方法の第2の実施形態に係る地理情報データおよび地理情報分析用データの概念図。
【図7】第2の実施の形態による方法のフロー図。
【図8】本発明に係る実施の形態に従った他のデータ分析装置200のブロック図。
【図9】本発明によるデータ分析方法の第3の実施形態に係る概念図。
【図10】決定木を作成する過程を示した概念図。
【図11】第3の実施の形態による方法のフロー図。
【図12】本発明に係るさらに他の実施の形態に従ったデータ分析装置300のブロック図。
【図13】本発明によるデータ分析方法の第4の実施の形態に係る概念図。
【図14】第4の実施の形態による方法のフロー図。
【符号の説明】
100、200、300 データ分析装置
110、120、310 データベース
130 データ処理部
132 検索・変換器
134 表データ管理器
140 メモリ
150 データ分析器
210 決定木作成器
320 語彙編集器
Claims (15)
- 地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いた分析用データ作成方法であって、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、
前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、
表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記事象の生じる傾向を導出するために用いられる地理情報分析用データを作成する付加ステップとを具備する分析用データ作成方法。 - 地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いたデータ分析方法であって、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、
前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、
表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記地理情報分析用データを作成する付加ステップと、
前記地理情報分析用データを用いて前記事象が生じる傾向を導出する導出ステップとを具備するデータ分析方法。 - 地理に関する地理情報データを記憶する第1の記憶部と、
前記地理内の位置を示す複数の位置データおよび該位置において生じた事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部と、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出し、前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換して前記観測データへ付加することによって地理情報分析用データを作成するデータ処理部と、
前記地理情報分析用データを用いて、前記事象が生じる傾向を導出するデータ分析部とを備えたデータ分析装置。 - 前記属性データは前記位置データが示す前記地理上の位置からの距離に関する特徴、若しくは、前記地理におけるある状態の分布に関する特徴を示すことを特徴とする請求項3に記載のデータ分析装置。
- 前記データ処理部は、前記位置データの分布に基づいて前記地理内を複数の地域群に分割し、前記観測データを前記地域群と前記位置データとの関係に基づいて前記地域群に分類し、前記地域群を前記属性データとして、並びに、前記位置データが属する前記地域群の名称を前記度合表示データとして前記観測データへ付加することを特徴とする請求項3に記載のデータ分析装置。
- 前記観測データまたは前記属性データに、前記地理情報データにおける地図上の一点の場所を表す固有データが含まれている場合に、
前記データ処理部は、前記地理情報データに含まれる地理的特長を示す情報から前記固有データに関する特徴を求め、該特徴または該特徴の組合せを用いて、該固有データを前記第1の記憶部から複数検索することが可能なデータへ変換することを特徴とする請求項3に記載のデータ分析装置。 - 前記固有データは、ある地理的な領域を示す固有名称であることを特徴とする請求項6に記載のデータ分析装置。
- 予め第1の特徴と第2の特徴とを関連付けて記憶した第3の記憶部と、
前記特徴の表現に含まれる前記第1の特徴の表現を、前記第2の特徴の表現に変換するデータ変換部とをさらに備えたことを特徴とする請求項3に記載のデータ分析装置。 - 地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いて、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、
前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、
表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記事象の生じる傾向を導出するために用いられる地理情報分析用データを作成する付加ステップとを処理するデータ作成プログラム。 - 地理に関する地理情報データを記憶する第1の記憶部と、前記地理内の位置を示す複数の位置データおよび該位置における事象を示す事象データを含む観測データを表形式で記憶する第2の記憶部とを備えた計算機を用いて、
前記地理情報データに基づいた前記地理内のある特徴を示す属性データを前記第1の記憶部から抽出する抽出ステップと、
前記属性データおよび該属性データに該当する度合を示す度合表示データを表形式に変換する変換ステップと、
表形式で表された前記属性データおよび前記度合表示データを前記観測データへ付加することによって、前記事象の生じる傾向を導出するために用いられる地理情報分析用データを作成する付加ステップと、
前記地理情報分析用データを用いて前記事象が生じる傾向を導出する導出ステップとを処理するデータ分析プログラム。 - 前記属性データは前記位置データが示す前記地理上の位置からの距離に関する特徴、若しくは、前記地理におけるある状態の分布に関する特徴を示すことを特徴とする請求項10に記載のデータ分析プログラム。
- 前記抽出ステップにおいて、前記位置データの分布に基づいて前記地理内を複数の地域群に分割し、該地域群を前記属性データとして抽出し、
前記計算機は、前記抽出ステップ後に、前記観測データを前記地域群と前記位置データとの関係に基づいて前記地域群に分類する分類ステップをさらに処理し、
前記付加ステップにおいて、前記地域群を前記属性データとして、並びに、前記位置データが属する前記地域群の名称を前記度合表示データとして前記観測データへ付加することを特徴とする請求項10に記載のデータ分析プログラム。 - 前記観測データまたは前記属性データに、前記地理情報データにおける地図上の一点の場所を表す固有データが含まれている場合に、
前記計算機は、前記固有データに対して付与された前記地理情報データに含まれる地理的特長を示す情報から、該固有データが持つ特徴を求め、該特徴または該特徴の組合せを用いて、該固有データを複数の場所を示すデータに変換するステップをさらに処理することを特徴とする請求項10に記載のデータ分析プログラム。 - 前記固有データは、ある地理的な領域を示す固有名称であることを特徴とする請求項13に記載のデータ分析プログラム。
- 前記計算機は、
第1の特徴と、前記地理情報データから求めることが可能な第2の特徴とを関連付けて予め記憶した第3の記憶部と、
前記第1の特徴の表現を、前記第2の特徴の表現に変換するデータ変換部とをさらに備え、
前記特徴の表現に前記第1の特徴を示す表現が含まれていた場合には、
前記変換ステップにおいて、前記属性データに含まれる前記第1の特徴の表現を前記第2の特徴の表現に変換することを特徴とする請求項10に記載のデータ分析プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002287426A JP2004126780A (ja) | 2002-09-30 | 2002-09-30 | 分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラム |
US10/653,292 US20040064450A1 (en) | 2002-09-30 | 2003-09-03 | Method for preparing data to be analyzed, data analysis method, data analysis device, data preparation program, data analysis program, data prediction device, data prediction method, data prediction program and computer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002287426A JP2004126780A (ja) | 2002-09-30 | 2002-09-30 | 分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004126780A true JP2004126780A (ja) | 2004-04-22 |
Family
ID=32280232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002287426A Pending JP2004126780A (ja) | 2002-09-30 | 2002-09-30 | 分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004126780A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011221693A (ja) * | 2010-04-07 | 2011-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 地理属性変化検出方法、地理属性変化検出装置及び地理属性変化検出プログラム |
CN104615677A (zh) * | 2015-01-20 | 2015-05-13 | 同济大学 | 一种图数据存取方法及系统 |
CN104615707A (zh) * | 2015-02-02 | 2015-05-13 | 百度在线网络技术(北京)有限公司 | 信息点的确定方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001117486A (ja) * | 1999-10-14 | 2001-04-27 | Dgs Computer:Kk | 地図情報システム |
JP2001147974A (ja) * | 1999-06-29 | 2001-05-29 | Sony Corp | 商品販売役務提供システム、商品販売役務提供ネットワーク運用システム、情報記録媒体及びその管理方法 |
JP2001229186A (ja) * | 2000-02-18 | 2001-08-24 | Dainippon Printing Co Ltd | 地図複合情報作成システム |
JP2001318938A (ja) * | 2000-05-09 | 2001-11-16 | Internatl Business Mach Corp <Ibm> | 空間データマイニング方法、空間データマイニング装置、および記憶媒体 |
JP2002197098A (ja) * | 2000-12-27 | 2002-07-12 | Mitsubishi Electric Corp | データマイニング装置 |
-
2002
- 2002-09-30 JP JP2002287426A patent/JP2004126780A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001147974A (ja) * | 1999-06-29 | 2001-05-29 | Sony Corp | 商品販売役務提供システム、商品販売役務提供ネットワーク運用システム、情報記録媒体及びその管理方法 |
JP2001117486A (ja) * | 1999-10-14 | 2001-04-27 | Dgs Computer:Kk | 地図情報システム |
JP2001229186A (ja) * | 2000-02-18 | 2001-08-24 | Dainippon Printing Co Ltd | 地図複合情報作成システム |
JP2001318938A (ja) * | 2000-05-09 | 2001-11-16 | Internatl Business Mach Corp <Ibm> | 空間データマイニング方法、空間データマイニング装置、および記憶媒体 |
JP2002197098A (ja) * | 2000-12-27 | 2002-07-12 | Mitsubishi Electric Corp | データマイニング装置 |
Non-Patent Citations (2)
Title |
---|
"地図情報システム・フォーラムシステム・フォーラム 第4回", 日経情報ストラテジー, vol. 第8巻 第8号, CSND200000901016, 24 August 1999 (1999-08-24), JP, pages 227 - 237, ISSN: 0000778310 * |
スター ジェフリー,エステス ジョン, 入門 地理情報システム, vol. 初版, CSNB200300023001, 10 August 1992 (1992-08-10), JP, pages 25 - 46, ISSN: 0000778309 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011221693A (ja) * | 2010-04-07 | 2011-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 地理属性変化検出方法、地理属性変化検出装置及び地理属性変化検出プログラム |
CN104615677A (zh) * | 2015-01-20 | 2015-05-13 | 同济大学 | 一种图数据存取方法及系统 |
CN104615677B (zh) * | 2015-01-20 | 2018-02-09 | 同济大学 | 一种图数据存取方法及系统 |
CN104615707A (zh) * | 2015-02-02 | 2015-05-13 | 百度在线网络技术(北京)有限公司 | 信息点的确定方法及装置 |
CN104615707B (zh) * | 2015-02-02 | 2018-04-13 | 百度在线网络技术(北京)有限公司 | 信息点的确定方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106649331B (zh) | 商圈识别方法及设备 | |
CN106529410B (zh) | 一种基于监控视频的灰霾扩散路径绘制与来源确定方法 | |
CN112288247B (zh) | 一种基于空间交互关系的土壤重金属风险识别方法 | |
CN109376205B (zh) | 挖掘地址兴趣点关系的方法、装置、设备及存储介质 | |
CN109947881B (zh) | 一种poi判重方法、装置、移动终端及计算机可读存储介质 | |
JP4032125B1 (ja) | 移動体位置推定システム、及び、移動体位置推定方法 | |
US20040064450A1 (en) | Method for preparing data to be analyzed, data analysis method, data analysis device, data preparation program, data analysis program, data prediction device, data prediction method, data prediction program and computer | |
US20200334246A1 (en) | Information processing device, combination condition generation method, and combination condition generation program | |
JP2008014743A (ja) | 移動体位置推定システム、及び、移動体位置推定方法 | |
JP2002032773A (ja) | 地図データの処理装置及び方法 | |
CN112365595A (zh) | 基于报警数据点要素的鉴别交通事故多发点的分析方法 | |
CN117036939A (zh) | 一种基于图卷积网络的多源数据协同的城市功能区识别方法 | |
Mooney et al. | Accessing the history of objects in OpenStreetMap | |
CN117095216B (zh) | 基于对抗生成网络的模型训练方法、系统、设备及介质 | |
JP2003256757A (ja) | 空間データ分析装置、空間データ分析方法、及び空間データ分析プログラム | |
CN115828406B (zh) | 铁路桥梁bim信息化管理方法、装置、设备及可读存储介质 | |
JP2004126780A (ja) | 分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラム | |
Droj | GIS and remote sensing in environmental management | |
CN111382165A (zh) | 一种移动国土管理系统 | |
CN115017396A (zh) | 一种智能型城市知识图谱构建方法及系统 | |
CN110413662B (zh) | 一种多通道式经济数据输入系统、采集系统与方法 | |
JP2004126757A (ja) | データ予測装置、データ予測方法およびデータ予測プログラム | |
Karsznia et al. | May ai help you? Automatic settlement selection for small-scale maps using selected machine learning models | |
CN113535870B (zh) | 基于大数据的交通信息可视化分析方法、系统及终端 | |
Anderson et al. | Increasing OSM Data Accessibility with the Analysis-Ready Daylight Distribution of OSM: Demonstration of Cloud-Based Assessments of Global Building Completeness |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061122 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070209 |