JP2006031442A - 空間データ分析装置、空間データ分析方法及び空間データ分析プログラム - Google Patents
空間データ分析装置、空間データ分析方法及び空間データ分析プログラム Download PDFInfo
- Publication number
- JP2006031442A JP2006031442A JP2004209977A JP2004209977A JP2006031442A JP 2006031442 A JP2006031442 A JP 2006031442A JP 2004209977 A JP2004209977 A JP 2004209977A JP 2004209977 A JP2004209977 A JP 2004209977A JP 2006031442 A JP2006031442 A JP 2006031442A
- Authority
- JP
- Japan
- Prior art keywords
- attribute information
- combination
- record
- records
- data analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
Abstract
【課題】 密集条件を満たす属性情報及び属性情報の組合せを少ないデータ計算量で確実に発見する。
【解決手段】 2次元以上の空間内における位置を示す位置情報と、相異なる複数の属性に属する複数の属性情報とを含むレコードの群から、同一の前記属性情報を有するレコードを選択する処理を前記属性情報ごとに行い、選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが所定の密集条件を満たす場合は、前記レコードの選択に用いた前記属性情報を記憶し、記憶された前記属性情報を異なる属性間で組み合わせて、属性情報の組合せを生成し、前記属性情報の組合せを有するレコードを前記レコードの群から選択し、選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが前記所定の密集条件を満たす場合は、選択に用いた前記属性情報の組合せを記憶する。
【選択図】 図1
【解決手段】 2次元以上の空間内における位置を示す位置情報と、相異なる複数の属性に属する複数の属性情報とを含むレコードの群から、同一の前記属性情報を有するレコードを選択する処理を前記属性情報ごとに行い、選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが所定の密集条件を満たす場合は、前記レコードの選択に用いた前記属性情報を記憶し、記憶された前記属性情報を異なる属性間で組み合わせて、属性情報の組合せを生成し、前記属性情報の組合せを有するレコードを前記レコードの群から選択し、選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが前記所定の密集条件を満たす場合は、選択に用いた前記属性情報の組合せを記憶する。
【選択図】 図1
Description
本発明は、空間データ分析装置、空間データ分析方法及び空間データ分析プログラムに関する。
近年、GPS(Global Positioning System)やセンサーネットワーク等の発達により、位置情報及び属性情報を有するデータ(空間データ)が多く蓄積されている。
これらの空間データを分析し、「どの条件(どの属性情報、どの属性情報の組合せ)のデータはどの辺りに密集するか」という規則性を発見できると、その規則に合致するデータは将来もある特定の場所に密集することが期待されるので、あらかじめ効果的な対策を行うことが可能となる。
しかし、属性情報と密集状態との間の相関関係を発見するには、全ての属性情報及び属性情報の全ての組合せについてそれぞれ該当するデータを選択し、密集状態を判定しなければならず、多大な計算時間を必要とする。
以上のことに鑑み、特開2003-256757公報(特許文献1)には、データの密集状態の判定を行う回数を削減しつつ、データが密集する属性情報の条件(属性情報及び属性情報の組合せ)を発見する手法が提案されている。
しかし、この手法では、このある属性において密集条件を満たさない属性情報が含まれる場合は、この属性を含む分類規則を発見することは困難であるという問題があった。
特開2003−256757公報
本発明の目的は、密集条件を満たす属性情報及び属性情報の組合せを少ないデータ計算量により確実に発見できる空間データ分析装置、空間データ分析方法及び空間データ分析プログラムを提供することにある。
本発明の空間データ分析装置は、2次元以上の空間内における位置を示す位置情報と、相異なる複数の属性に属する複数の属性情報とを含むレコードの群から、前記空間内において前記レコードが密集する前記属性情報の条件を発見する空間データ分析装置であって:前記レコードの群から同一の前記属性情報を有するレコードを選択する処理を前記属性情報ごとに行う第1のデータ選択手段と;選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが所定の密集条件を満たす場合は、前記レコードの選択に用いた前記属性情報を記憶する第1の密集条件判定手段と;記憶された前記属性情報を異なる属性間で組み合わせて、属性情報の組合せを生成する組合せデータ生成手段と;前記属性情報の組合せを有するレコードを前記レコードの群から選択する第2のデータ選択手段と;前記第2のデータ選択手段によって選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが前記所定の密集条件を満たす場合は、選択に用いた前記属性情報の組合せを記憶する第2の密集条件判定手段と;を備える。
本発明の空間データ分析方法は、2次元以上の空間内における位置を示す位置情報と、相異なる複数の属性に属する複数の属性情報とを含むレコードの群から、前記空間内において前記レコードが密集する前記属性情報の条件を発見する空間データ分析方法であって:前記レコードの群から同一の前記属性情報を有するレコードを選択することを前記属性情報ごとに行い;選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが所定の密集条件を満たす場合は、前記レコードの選択に用いた前記属性情報を記憶し;記憶された前記属性情報を異なる属性間で組み合わせて、属性情報の組合せを生成し;前記属性情報の組合せを有するレコードを前記レコードの群から選択し;選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが前記所定の密集条件を満たす場合は、選択に用いた前記属性情報の組合せを記憶する;ことを特徴とする。
本発明の空間データ分析プログラムは、2次元以上の空間内における位置を示す位置情報と、相異なる複数の属性に属する複数の属性情報とを含むレコードの群から、前記空間内において前記レコードが密集する前記属性情報の条件を発見する空間データ分析プログラムであって:前記レコードの群から同一の前記属性情報を有するレコードを選択することを前記属性情報ごとに行う第1のデータ選択ステップと;選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが所定の密集条件を満たす場合は、前記レコードの選択に用いた前記属性情報を記憶する第1の密集条件判定ステップと;記憶された前記属性情報を異なる属性間で組み合わせて、属性情報の組合せを生成する組合せデータ生成ステップと;前記属性情報の組合せを有するレコードを前記レコードの群から選択する第2のデータ選択ステップと;前記第2のデータ選択ステップによって選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが前記所定の密集条件を満たす場合は、選択に用いた前記属性情報の組合せを記憶する第2の密集条件判定ステップと;をコンピュータに実行させることを特徴とする。
本発明により、密集条件を満たす属性情報及び属性情報の組合せを少ないデータ計算量により確実に発見できる。
図1は、本発明の実施の形態に従った空間データ分析装置の機能ブロック図である。
図14は、図1の空間データ分析装置による処理ステップを示すフローチャートである。
図15は、図1の空間データ分析装置による分析対象データ例としての交通事故発生履歴データを示す図である。
図16は、図15の交通事故発生履歴データを2次元平面上にプロットした様子を示す分布図である。
図15に示すように、この交通事故発生履歴データには、交通事故の発生地点の緯度経度情報(位置情報)に加えて、ドライバの性別、年齢、その日の天候(属性)を示す情報(属性情報)が含まれる。より詳しくは、ドライバの性別として男と女の2つの属性情報が含まれ、ドライバの年齢として若年と高年の2つの属性情報が含まれ、当日の天候として晴、雨、雪の3つの属性情報が含まれる。
図1の空間データ分析装置は、この交通事故発生履歴データに示されるような位置情報と属性情報とを含む分析対象データ(レコード群)を分析して、レコードが空間的に密集する(密集条件を満たす)属性情報または属性情報の組合せを発見しようとするものである。
まず、図1及び図14を用いて、本空間データ分析装置の基本的な構成及び動作について説明する。
(1)図1のデータ選択手段11は、分析対象データ格納手段14に格納された分析対象データ(例えば交通事故発生履歴データ)を読み込み(ステップS11)、属性情報の一覧(例えば「女」、「男」、「若」、「高」、「晴」、「雨」、「雪」)を作成する(ステップS12)。
データ選択手段11は、属性情報の一覧から1つの属性情報を抽出し(ステップS13)、抽出した属性情報を含むレコードを分析対象データから選択する(ステップS14)。即ち、データ選択手段11は、抽出した属性情報を選択条件として分析対象データからレコードを選択する。データ選択手段11は、この処理を全ての属性情報について行う。即ち、データ選択手段11は、例えば属性情報「女」を含む全てのレコードを選択、「男」を含む全てのレコードを選択、「若」を含む全てのレコードを選択・・する。
(2)密集状態判定手段12は、データ選択手段11によって属性情報別に選択されたレコード群がそれぞれ所定の密集条件を満たすか否かを判断し、満たす場合はその属性情報を解の候補として記憶する(ステップS15)。
より詳しくは、密集状態判定手段12は、まず、属性情報別に選択されたレコード群の重心を、レコード群を構成する各レコードの位置情報に基づいて算出する。次いで、算出した重心と、各レコードの位置情報とに基づいて、密集度(後述)を算出する。密集状態判定手段12は、算出した密集度が、密集状態判定パラメータ入力手段15から入力された密集状態判定パラメータによる基準を満たすか否かを判定し、基準を満たす場合はその属性情報を解の候補として選択する。選択された属性情報(解の候補)は、重心及び密集度と共に記憶される。記憶された属性情報、重心及び密集度は、本空間データ分析装置による出力となる。
(3)選択条件合成手段13は、密集状態判定手段12によって選択された所定の密集条件を満たす属性情報を異なる属性同士間で組み合わせて(合成して)属性情報の組合せを生成する。選択条件合成手段13は、生成した属性情報の組合せをデータ選択手段11に渡す(ステップS16のYES、S17)。
(4)データ選択手段11は、渡された属性情報の組合せを含むレコードを分析対象データから選択する(ステップS14)。
(5)密集状態判定手段12は、選択されたレコード群が上記所定の密集条件を満たすか否かを判断し、満たす場合はその属性情報の組合せを解の候補として記憶する(ステップS15)。
より詳しくは、密集状態判定手段12は、選択された属性情報の組合せを含むレコード群の重心、さらに密集度を上述と同様にして算出し、算出した密集度が、上述の密集状態判定パラメータによる基準を満たす場合はその属性情報の組合せ(選択条件)を解の候補として、重心及び密集度と共に記憶する。記憶された属性情報の組合せ、重心及び密集度は、本空間データ分析装置による出力となる。
(6)選択条件合成手段13は、選択された属性情報の組合せと、先に密集状態判定手段12によって選択された属性情報とを、同一の属性が重複しないように組み合わせて、新たな属性情報の組合せを生成する(ステップS16のYES、ステップS17)。選択条件合成手段13は、生成した新たな属性情報の組合せをデータ選択手段11に渡す(ステップS17)。
この後、(4)〜(6)を、選択条件合成手段13により属性情報の組合せが生成されなくなる(ステップS16のNO)まで繰り返す。
以下、具体例として、図1の空間データ分析装置により図15の交通事故発生履歴データを分析して、密集条件を満たす属性情報及びこれの組合せを発見する場合を説明する。
先ず、データ選択手段11が、分析対象データである図15の交通事故発生履歴データから、各属性(性別、年齢、天候)の属性情報を選択条件としてレコードを選択する。
即ち、 図15の分析対象データから、「性別=女」、「性別=男」、「年齢=若」、「年齢=高」、「天候=晴」、「天候=雨」、「天候=雪」を含むレコードをそれぞれ選択する。
各属性情報(「性別=女」、「性別=男」「「年齢=若」、年齢=高」、「天候=晴」、「天候=雨」、「天候=雪」)に基づき選択されたレコード群と、レコード群を構成する各レコードの位置を2次元の地図上にプロットした様子とを、図2(A)及び(B)〜図8(A)及び(B)に示す。
続いて、図1に示す密集状態判定手段12において、上述の7つの属性情報(選択条件)に基づき選択された各レコード群が、空間(本例では横軸が経度、縦軸が緯度の2次元空間)内において密集するか否か(所定の密集条件を満たすか否か)が判定される。密集条件を満たすか否かの判定は、各選択条件(属性情報)に基づき選択されたレコード群からそれぞれ密集度を算出し、算出された密集度がそれぞれ、密集度判定パラメータ入力手段15からユーザにより入力されたパラメータによる基準を満たすか否かで行う。
本実施の形態では、密集度は、レコード群の重心(レコード群を構成する各レコードにおける経度の平均及び緯度の平均)から、各レコードの位置(経度及び緯度)までの距離の自乗の和をレコード数で割ったものとする。そして、密集度が、12.5(ユーザから上記パラメータとして入力される閾値)以下の状態を、密集状態と定義する。但し、密集を形成する最小レコード数を2(ユーザから上記パラメータとして入力される)とする。つまり、あるレコード群について、密集度が12.5以下で且つレコード数が2以上の場合、そのレコード群は密集条件を満たす。
そこで、まず、密集状態判定手段12は、上述の「性別=女」、「性別=男」、「年齢=若」、「年齢=高」、「天候=晴」、「天候=雨」、「天候=雪」の属性情報により選択された各レコード群に関して、それぞれレコード数、重心及び密集度等を算出する。この結果、以下の(表1)のようになる。
(表1)
属性情報 レコード数 重心 重心との距離の自乗の和 密集度
「性別=女」 10 (2.4, 5.7) 74.5 7.45
「性別=男」 10 (7.3, 5.1) 101.0 10.1
「年齢=若」 10 (4.9, 6.7) 143.0 14.3
「年齢=高」 10 (4.8, 4.1) 120.5 12.05
「天候=雨」 8 (4.875, 5.625) 136.75 17.09375
「天候=晴」 9 (5.0, 5.89) 142.89 15.88
「天候=雪」 3 (4.33, 3.33) 1.33 0.44
(表1)
属性情報 レコード数 重心 重心との距離の自乗の和 密集度
「性別=女」 10 (2.4, 5.7) 74.5 7.45
「性別=男」 10 (7.3, 5.1) 101.0 10.1
「年齢=若」 10 (4.9, 6.7) 143.0 14.3
「年齢=高」 10 (4.8, 4.1) 120.5 12.05
「天候=雨」 8 (4.875, 5.625) 136.75 17.09375
「天候=晴」 9 (5.0, 5.89) 142.89 15.88
「天候=雪」 3 (4.33, 3.33) 1.33 0.44
表1から、密集度が12.5以下で、レコード数が2以上の属性情報、つまり密集条件を満たす属性情報は、「性別=女」、「性別=男」、「年齢=高」、「天候=雪」の4つであり、これらの4つの属性情報及びこれに対応するデータ(レコード数、重心、重心との距離の自乗の和、密集度)が、密集状態判定手段12に記憶される。記憶された属性情報は、図1の選択条件合成手段13に渡される。
選択条件合成手段13は、密集状態判定手段12から渡された属性情報を異なる属性同士間で組み合わせて(合成して)、属性情報の組合せを生成する。即ち、選択条件合成手段13は、互いに異なる属性間で、2つの属性情報のANDをとる。
つまり、本例では、選択条件合成手段13は、渡された4つの属性情報(「性別=女」「性別=男」「年齢=高」「天候=雪」)に基づき、「性別=女 かつ 年齢=高」、「性別=男 かつ 年齢=高」、「性別=女 かつ 天候=雪」、「性別=男 かつ 天候=雪」、「年齢=高 かつ 天候=雪」の5つの属性情報の組合せを生成する。
生成されたこれら5つの属性情報の組合せ(選択条件)は、選択条件合成手段13から、図1のデータ選択手段11に渡される。データ選択手段11は、図15の交通事故発生履歴データから、各選択条件(「性別=女 かつ 年齢=高」、「性別=男 かつ 年齢=高」、「性別=女 かつ 天候=雪」、「性別=男 かつ 天候=雪」、「年齢=高 かつ 天候=雪」)に基づいてレコードを選択する。
選択条件(「性別=女 かつ 年齢=高」、「性別=男 かつ 年齢=高」、「性別=女 かつ 天候=雪」、「性別=男 かつ 天候=雪」、「年齢=高 かつ 天候=雪」)に基づき選択された各レコード群と、レコード群を構成する各レコードの位置を2次元の地図上にプロットした様子とを、図9(A)及び(B)〜図13(A)及び(B)に示す。
図1の密集状態判定手段12は、選択された各レコード群が、所定の密集条件を満たすか否かの判定を、上述と同様にして、行う。
即ち、まず、密集状態判定手段12は、選択条件(「性別=女 かつ 年齢=高」、「性別=男 かつ 年齢=高」、「性別=女 かつ 天候=雪」、「性別=男 かつ 天候=雪」、「年齢=高 かつ 天候=雪」)により選択された各レコード群に関して、それぞれレコード数、重心及び密集度等を算出する。この結果、以下の(表2)のようになる。
(表2)
属性情報の組合せ レコード数 重心 重心との距離の自乗の和 密集度
「性別=女 かつ 年齢=高」 5 (2.6,3.6) 16.4 8.2
「性別=男 かつ 年齢=高」 5 (7,4.6) 53.2 10.64
「性別=女 かつ 天候=雪」 2 (4,3.5) 0.5 0.25
「性別=男 かつ 天候=雪」 1 (5,3) 0.0
「年齢=高 かつ 天候=雪」 3 (4.33, 3.33) 1.33 0.44
(表2)
属性情報の組合せ レコード数 重心 重心との距離の自乗の和 密集度
「性別=女 かつ 年齢=高」 5 (2.6,3.6) 16.4 8.2
「性別=男 かつ 年齢=高」 5 (7,4.6) 53.2 10.64
「性別=女 かつ 天候=雪」 2 (4,3.5) 0.5 0.25
「性別=男 かつ 天候=雪」 1 (5,3) 0.0
「年齢=高 かつ 天候=雪」 3 (4.33, 3.33) 1.33 0.44
表2から、密集度が12.5以下で、レコード数が2以上である属性情報の組合せ(選択条件)、つまり密集条件を満たす属性情報の組合せ(選択条件)は、「性別=女 かつ 年齢=高」、「性別=男 かつ 年齢=高」、「性別=女 かつ 天候=雪」、「年齢=高 かつ 天候=雪」の4つである。従って、これら4つの属性情報の組合せ(選択条件)及びこれに対応するデータ(レコード数、重心、重心との距離の自乗の和、密集度)が、密集状態判定手段12に記憶される。記憶された属性情報の組合せ(選択条件)は、図1の選択条件合成手段13に渡される。
選択条件合成手段13は、渡された4つの属性情報の組合せ(選択条件)と、前回(第1回目に)使用した属性情報(選択条件)である「性別=女」、「性別=男」、「年齢=高」、「天候=雪」とを同一属性が重複しないように組み合わせる。この結果、「性別=女 かつ 年齢=高 かつ 天候=雪」、「性別=男 かつ 年齢=高 かつ 天候=雪」の2つの新たな属性情報の組合せ(選択条件)が生成される。
生成されたこれら2つの属性情報の組合せ(選択条件)が選択条件合成手段13からデータ選択手段11に渡され、データ選択手段11は、受け取った各選択条件に基づき、図15の交通事故発生履歴データからレコードを選択する。
選択条件(「性別=女 かつ 年齢=高 かつ 天候=雪」、「性別=男 かつ 年齢=高 かつ 天候=雪」)により選択された各レコード群について、図1の密集状態判定手段12において、所定の密集条件を満たすか否かが、上述と同様にして判定される。
即ち、まず、密集状態判定手段12は、選択条件(「性別=女 かつ 年齢=高 かつ 天候=雪」、「性別=男 かつ 年齢=高 かつ 天候=雪」)により選択された各レコード群に関して、レコード数、重心及び密集度等を算出する。この結果、以下の(表3)のようになる。
(表3)
属性情報の組合せ レコード数 重心 重心との距離の自乗の和 密集度
「女 かつ 高 かつ 雪」 2 (4,3.5) 0.5 0.25
「男 かつ 高 かつ 雪」 1 (5,3) 0.0
(表3)
属性情報の組合せ レコード数 重心 重心との距離の自乗の和 密集度
「女 かつ 高 かつ 雪」 2 (4,3.5) 0.5 0.25
「男 かつ 高 かつ 雪」 1 (5,3) 0.0
表3から、密集度が12.5以下で、レコード数が2以上の属性情報の組合せ(選択条件)、つまり所定の密集条件を満たす属性情報の組合せ(選択条件)は、「性別=女 かつ 年齢=高 かつ 天候=雪」の1つであり、この属性情報の組合せ(選択条件)及びこれに対応するデータ(レコード数、重心、重心との距離の自乗の和、密集度)が、密集状態判定手段12に記憶される。記憶された属性情報の組合せは図1の選択条件合成手段13に渡される。
選択条件合成手段13は、渡された選択条件に対し組み合わせるべき属性情報はもはや存在しないと判断し(どの属性情報と組合せても同一の属性が重複する)、処理の終了指示を、密集状態判定手段12に出力する。
密集状態判定手段12は、処理の終了指示を受け取ったら、記憶した属性情報及び属性情報の組合せ等を出力する。出力された属性情報及び属性情報の組合せ等を、以下の(表4)に示す。
(表4)
属性情報またはこれの組合せ レコード数 重心 重心との距離の自乗の和 密集度
「性別=女」 10 (2.4, 5.7) 74.5 7.45
「性別=男」 10 (7.3, 5.1) 101.0 10.1
「年齢=高」 10 (4.8, 4.1) 120.5 12.05
「天候=雪」 3 (4.33, 3.33) 1.33 0.44
「性別=女 かつ 年齢=高」 5 (2.6,3.6) 16.4 8.2
「性別=男 かつ 年齢=高」 5 (7,4.6) 53.2 10.64
「性別=女 かつ 天候=雪」 2 (4,3.5) 0.5 0.25
「年齢=高 かつ 天候=雪」 3 (4.33, 3.33) 1.33 0.44
「性別=女かつ年齢=高かつ天候=雪」
2 (4,3.5) 0.5 0.25
(表4)
属性情報またはこれの組合せ レコード数 重心 重心との距離の自乗の和 密集度
「性別=女」 10 (2.4, 5.7) 74.5 7.45
「性別=男」 10 (7.3, 5.1) 101.0 10.1
「年齢=高」 10 (4.8, 4.1) 120.5 12.05
「天候=雪」 3 (4.33, 3.33) 1.33 0.44
「性別=女 かつ 年齢=高」 5 (2.6,3.6) 16.4 8.2
「性別=男 かつ 年齢=高」 5 (7,4.6) 53.2 10.64
「性別=女 かつ 天候=雪」 2 (4,3.5) 0.5 0.25
「年齢=高 かつ 天候=雪」 3 (4.33, 3.33) 1.33 0.44
「性別=女かつ年齢=高かつ天候=雪」
2 (4,3.5) 0.5 0.25
(表4)に示す結果を得るために所定の密集条件についての判定対象となった属性情報及び属性情報の組合せの数は、1回目の7個、2回目の5個、3回目の2個の、合計14個である。従って、本実施の形態では、従来のような、属性情報の全ての組合せ数である35通りを判断する場合に比べて、少ないデータ計算量で、密集条件を満たす属性情報または属性情報の組合せを発見できる。
また、本実施の形態では、ある属性について密集条件を満たさない第1属性情報が含まれる場合であってもそのある属性について密集条件を満たす第2属性情報が存在する場合は、その第2属性情報を含めて密集条件を満たす属性情報及び属性情報の組合せを発見できる。例えば、本例では、天候の属性情報として、「晴」、「雨」、「雪」の3つが存在し、このうち「晴」「雨」は密集条件を満たさないものの(密集度が12.5より大きい)、「雪」は密集条件を満たすので「雪」を含めて、密集条件を満たす属性情報及び属性情報の組合せを発見できる。
以上のようにして得られた属性情報及び属性情報の組合せ、重心及び密集度等は種々の用途に用いることができる。
例えば、(表4)の7行目(性別=女 かつ 天候=雪)から、女性の場合、雪の時に、重心(4,3.5)の付近で交通事故が発生し易いことが理解され、従って、重心の周囲に、女性向けに、「スリップ注意」などの、注意を促す標識を設けることなどが考えられる。標識を設ける範囲は、密集度が「0.25」と小さい(密集の傾向が大きい)ので、重心(4,3.5)から比較的近距離とする等の判断もできる。
以上では、分析対象データ例として、交通事故発生履歴データを用いたが、他にも、位置情報を含む種々の空間データを用いることが可能である。例えば、タクシーが客を拾った位置を位置情報として含むデータを分析して、性別や時間帯等別に乗客が集中する箇所を算出し、これにより有効な営業戦略を立てることなどができる。
ところで、図1の選択条件合成手段13において、選択条件(属性情報、属性情報の組合せ)を組み合わせて属性情報の組合せを生成するに当たり、生成された属性情報の組合せが密集条件を満たさないことがあらかじめ予測される場合は(組合せ対象となる各選択条件を満たすレコード群に共通に含まれるレコード数が少ないことが予測される場合は)、データ計算量を低減する観点から、組合せを生成しないことが好ましい。
属性情報の組合せを生成した場合にその属性情報の組合せが密集条件を満たすか否かの予測は、例えば各組合せ対象(属性情報あるいは属性情報の組合せ)を含むレコード群についてそれぞれ重心を求め、重心間距離の自乗が、所定の閾値による基準を満たすか否かで行う。
例えば、上述の2回目の処理では、
「性別=女」(レコード数 10、重心 (2.4, 5.7)、密集度 7.45)
「性別=男」(レコード数 10、重心 (7.3, 5.1)、密集度 10.1)
「年齢=高」(レコード数 10、重心 (4.8, 4.1)、密集度 12.05)
「天候=雪」(レコード数 3、重心 (4.33, 3.33)、密集度 0.44)
の4つの属性情報(選択条件)を組み合わせる前に、まず、各属性情報を含むレコード群の重心間距離の自乗を計算する。そして、この値が10(所定の閾値)以上になる場合は、その組合せは、距離が離れていると判断して、属性情報の組合せを生成しないこととする。
「性別=女」(レコード数 10、重心 (2.4, 5.7)、密集度 7.45)
「性別=男」(レコード数 10、重心 (7.3, 5.1)、密集度 10.1)
「年齢=高」(レコード数 10、重心 (4.8, 4.1)、密集度 12.05)
「天候=雪」(レコード数 3、重心 (4.33, 3.33)、密集度 0.44)
の4つの属性情報(選択条件)を組み合わせる前に、まず、各属性情報を含むレコード群の重心間距離の自乗を計算する。そして、この値が10(所定の閾値)以上になる場合は、その組合せは、距離が離れていると判断して、属性情報の組合せを生成しないこととする。
そこで、まず、これら4つの属性情報に関し、各属性情報同士間で、重心間距離の自乗を計算すると、
「性別=女 かつ 年齢=高」(重心間距離の自乗 8.32)
「性別=男 かつ 年齢=高」(重心間距離の自乗 7.25)
「性別=女 かつ 天候=雪」(重心間距離の自乗 9.35)
「性別=男 かつ 天候=雪」(重心間距離の自乗 11.95)
「年齢=高 かつ 天候=雪」(重心間距離の自乗 0.81)
となる。
「性別=女 かつ 年齢=高」(重心間距離の自乗 8.32)
「性別=男 かつ 年齢=高」(重心間距離の自乗 7.25)
「性別=女 かつ 天候=雪」(重心間距離の自乗 9.35)
「性別=男 かつ 天候=雪」(重心間距離の自乗 11.95)
「年齢=高 かつ 天候=雪」(重心間距離の自乗 0.81)
となる。
「性別=男 かつ 天候=雪」の組合せは、重心間距離の自乗が10(所定の閾値)以上となる(11.95)ので、この組合せは生成しないことする。この結果、「性別=男 かつ 天候=雪」を含むレコードの交通事故発生履歴データ(図15参照)からの選択処理、及び選択されたレコード群が密集条件を満たすか否かの判定処理は省略される。これにより、データ計算量をさらに低減できる。
以上に説明した本実施の形態において、図2に示す処理ステップは、ハードウェアによって実現することの他、ソフトウェアを実行することによって実現してもよい。
また、上述の実施の形態では、2次元空間を例として説明したが、3次元以上の空間に対しても本発明は適用可能である。
11 データ選択手段
12 密集状態判定手段
13 選択条件合成手段
14 分析対象データ格納手段
15 密集度判定パラメータ入力手段
12 密集状態判定手段
13 選択条件合成手段
14 分析対象データ格納手段
15 密集度判定パラメータ入力手段
Claims (16)
- 2次元以上の空間内における位置を示す位置情報と、相異なる複数の属性に属する複数の属性情報とを含むレコードの群から、前記空間内において前記レコードが密集する前記属性情報の条件を発見する空間データ分析装置であって:
前記レコードの群から同一の前記属性情報を有するレコードを選択する処理を前記属性情報ごとに行う第1のデータ選択手段と;
選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが所定の密集条件を満たす場合は、前記レコードの選択に用いた前記属性情報を記憶する第1の密集条件判定手段と;
記憶された前記属性情報を異なる属性間で組み合わせて、属性情報の組合せを生成する組合せデータ生成手段と;
前記属性情報の組合せを有するレコードを前記レコードの群から選択する第2のデータ選択手段と;
前記第2のデータ選択手段によって選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが前記所定の密集条件を満たす場合は、選択に用いた前記属性情報の組合せを記憶する第2の密集条件判定手段と;
を備えた空間データ分析装置。 - 前記組合せデータ生成手段は、前記第2の密集条件判定手段により記憶された前記属性情報の組合せと、前記第1の密集条件判定手段により記憶された前記属性情報とを組み合わせて新たな属性情報の組合せを生成することを特徴とする請求項1に記載の空間データ分析装置。
- 前記属性情報の組合せを、前記属性情報の組合せに含まれない属性に属する前記属性情報と組み合わせることにより新たな属性情報の組合せを生成することを特徴とする請求項2に記載の空間データ分析装置。
- 前記第1又は第2のデータ選択手段によって選択された前記レコードの前記位置情報に基づいて、選択された前記レコードの重心を算出する重心算出手段と;
算出された前記重心と、選択された前記レコードの前記位置情報とに基づいて、選択された前記レコードの密集度を算出する密集度算出手段と;をさらに備え、
前記1又は第2の密集条件判定手段は、算出された前記密集度が所定の基準を満たすか否かにより、前記所定の密集条件が満されるか否かの判断を行うことを特徴とする請求項1乃至3のいずれかに記載の空間データ分析装置。 - 前記密集度算出手段は、算出された前記重心から、選択された前記レコードまでの距離の自乗の和を、選択された前記レコードの数で除算したものを前記密集度として算出することを特徴とする請求項4に記載の空間データ分析装置。
- 前記組合せデータ生成手段は、前記属性情報の組合せを生成する前に、各組合せの対象についてそれぞれ選択された前記レコードの前記位置情報に基づいて、各前記組合せの対象に関してそれぞれ前記レコードの重心を算出し、前記重心間の距離が所定の基準を満たした場合は、前記属性情報の組合せを生成することを特徴とする請求項1乃至5のいずれかに記載の空間データ分析装置。
- 2次元以上の空間内における位置を示す位置情報と、相異なる複数の属性に属する複数の属性情報とを含むレコードの群から、前記空間内において前記レコードが密集する前記属性情報の条件を発見する空間データ分析方法であって:
前記レコードの群から同一の前記属性情報を有するレコードを選択することを前記属性情報ごとに行い;
選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが所定の密集条件を満たす場合は、前記レコードの選択に用いた前記属性情報を記憶し;
記憶された前記属性情報を異なる属性間で組み合わせて、属性情報の組合せを生成し;
前記属性情報の組合せを有するレコードを前記レコードの群から選択し;
選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが前記所定の密集条件を満たす場合は、選択に用いた前記属性情報の組合せを記憶する;
ことを特徴とする空間データ分析方法。 - 記憶された前記属性情報の組合せと、記憶された前記属性情報とを組み合わせて新たな属性情報の組合せを生成し;
新たな前記属性情報の組合せを有するレコードを前記レコードの群から選択し;
選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが前記所定の密集条件を満たす場合は、選択に用いた新たな前記属性情報の組合せを記憶する;
ことを繰り返すことを特徴とする請求項7に記載の空間データ分析方法。 - 前記属性情報の組合せを、前記属性情報の組合せに含まれない属性に属する前記属性情報と組み合わせることにより新たな属性情報の組合せを生成することを特徴とする請求項8に記載の空間データ分析方法。
- 記憶された前記属性情報の組合せが全種類の属性を含む場合は繰り返しを終了することを特徴とする請求項8に記載の空間データ分析方法。
- 前記所定の密集条件を満たす選択された前記レコードが存在しない場合は、繰り返しを終了することを特徴とする請求項8に記載の空間データ分析方法。
- 選択された前記レコードの前記位置情報に基づいて、選択された前記レコードの重心を算出し;
算出された前記重心と、選択された前記レコードの前記位置情報とに基づいて、選択された前記レコードの密集度を算出し;
算出された前記密集度が所定の基準を満たすか否かにより、前記所定の密集条件が満たされるか否かの判断を行うことを特徴とする請求項7乃至11のいずれかに記載の空間データ分析方法。 - 算出された前記重心から、選択された前記レコードまでの距離の自乗の和を、選択された前記レコードの数で除算したものを前記密集度として算出することを特徴とする請求項12に記載の空間データ分析方法。
- 前記属性情報の組合せを生成する前に、各組合せの対象についてそれぞれ選択された前記レコードの前記位置情報に基づいて、各前記組合せの対象に関してそれぞれ前記レコードの重心を算出し、前記重心間の距離が所定の基準を満たす場合は、前記属性情報の組合せを生成することを特徴とする請求項7乃至13のいずれかに記載の空間データ分析方法。
- 2次元以上の空間内における位置を示す位置情報と、相異なる複数の属性に属する複数の属性情報とを含むレコードの群から、前記空間内において前記レコードが密集する前記属性情報の条件を発見する空間データ分析プログラムであって:
前記レコードの群から同一の前記属性情報を有するレコードを選択することを前記属性情報ごとに行う第1のデータ選択ステップと;
選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが所定の密集条件を満たす場合は、前記レコードの選択に用いた前記属性情報を記憶する第1の密集条件判定ステップと;
記憶された前記属性情報を異なる属性間で組み合わせて、属性情報の組合せを生成する組合せデータ生成ステップと;
前記属性情報の組合せを有するレコードを前記レコードの群から選択する第2のデータ選択ステップと;
前記第2のデータ選択ステップによって選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが前記所定の密集条件を満たす場合は、選択に用いた前記属性情報の組合せを記憶する第2の密集条件判定ステップと;
をコンピュータに実行させることを特徴とする空間データ分析プログラム。 - 前記第2の密集条件判定ステップにより記憶された前記属性情報の組合せと、前記第1の密集条件判定ステップにより記憶された前記属性情報とを組み合わせて新たな属性情報の組合せを生成する再生成ステップと;
新たな前記属性情報の組合せを有するレコードを前記レコードの群から選択する第3のデータ選択ステップと;
選択された前記レコードの前記位置情報に基づいて、選択された前記レコードが前記所定の密集条件を満たす場合は、選択に用いた新たな前記属性情報の組合せを記憶する第3の密集条件判定ステップと;
前記再生成ステップと、前記第3のデータ選択ステップと、前記第3の密集条件判定ステップとをこの順序で繰り返す繰り返しステップと;
をさらに備えたことを特徴とする請求項15に記載の空間データ分析プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004209977A JP2006031442A (ja) | 2004-07-16 | 2004-07-16 | 空間データ分析装置、空間データ分析方法及び空間データ分析プログラム |
US11/080,619 US20060015362A1 (en) | 2004-07-16 | 2005-03-16 | Spatial data analyzing apparatus, spatial data analyzing method and spatial data analyzing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004209977A JP2006031442A (ja) | 2004-07-16 | 2004-07-16 | 空間データ分析装置、空間データ分析方法及び空間データ分析プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006031442A true JP2006031442A (ja) | 2006-02-02 |
Family
ID=35600583
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004209977A Pending JP2006031442A (ja) | 2004-07-16 | 2004-07-16 | 空間データ分析装置、空間データ分析方法及び空間データ分析プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20060015362A1 (ja) |
JP (1) | JP2006031442A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020013511A (ja) * | 2018-07-20 | 2020-01-23 | 株式会社日立製作所 | 特徴量生成装置および特徴量生成方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060230009A1 (en) * | 2005-04-12 | 2006-10-12 | Mcneely Randall W | System for the automatic categorization of documents |
US7644068B2 (en) * | 2006-10-06 | 2010-01-05 | International Business Machines Corporation | Selecting records from a list with privacy protections |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030055707A1 (en) * | 1999-09-22 | 2003-03-20 | Frederick D. Busche | Method and system for integrating spatial analysis and data mining analysis to ascertain favorable positioning of products in a retail environment |
AU1086901A (en) * | 1999-10-15 | 2001-04-30 | Dekalb Genetics Corporation | Methods and systems for plant performance analysis |
US6496814B1 (en) * | 2000-07-19 | 2002-12-17 | International Business Machines Corporation | Method and system for integrating spatial analysis, and scheduling to efficiently schedule and monitor infrastructure maintenance |
US20030030637A1 (en) * | 2001-04-20 | 2003-02-13 | Grinstein Georges G. | Method and system for data analysis |
JP2003256757A (ja) * | 2002-03-06 | 2003-09-12 | Toshiba Corp | 空間データ分析装置、空間データ分析方法、及び空間データ分析プログラム |
US6975939B2 (en) * | 2002-07-29 | 2005-12-13 | The United States Of America As Represented By The Secretary Of The Army | Mapping patterns of movement based on the aggregation of spatial information contained in wireless transmissions |
US20040236604A1 (en) * | 2002-12-20 | 2004-11-25 | Mcnair Douglas S. | System and method for detecting spatiotemporal clusters |
US7346597B2 (en) * | 2004-04-02 | 2008-03-18 | Spadac Inc. | Geospatial model forecasting of events and threats |
-
2004
- 2004-07-16 JP JP2004209977A patent/JP2006031442A/ja active Pending
-
2005
- 2005-03-16 US US11/080,619 patent/US20060015362A1/en not_active Abandoned
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020013511A (ja) * | 2018-07-20 | 2020-01-23 | 株式会社日立製作所 | 特徴量生成装置および特徴量生成方法 |
JP7068085B2 (ja) | 2018-07-20 | 2022-05-16 | 株式会社日立製作所 | 特徴量生成装置および特徴量生成方法 |
Also Published As
Publication number | Publication date |
---|---|
US20060015362A1 (en) | 2006-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9536146B2 (en) | Determine spatiotemporal causal interactions in data | |
US10520326B2 (en) | Driving route matching method and apparatus, and storage medium | |
US8180557B2 (en) | Traffic state predicting apparatus | |
JP4506663B2 (ja) | 交通状況予測装置、方法及びプログラム、経路探索システム並びに交通状況提供システム | |
US20120221231A1 (en) | Positional information analysis device and positional information analysis method | |
Zhu et al. | Mobile traffic sensor routing in dynamic transportation systems | |
JP6464849B2 (ja) | 移動経路データ匿名化装置および方法 | |
JP2011075345A (ja) | 走行リンク確定装置及びリンク旅行時間算出装置 | |
JP5388243B2 (ja) | 管理サーバ、人口情報算出管理サーバ、不在エリア管理方法および人口情報算出方法 | |
JP6277709B2 (ja) | 経路情報処理方法、装置、及びプログラム | |
JP6857211B2 (ja) | 情報処理方法およびサーバ装置 | |
CN106528559B (zh) | 一种位置信息的提供方法和设备 | |
KR101766640B1 (ko) | 이동체의 기준 경로 계산 장치 및 방법 | |
JP2006031442A (ja) | 空間データ分析装置、空間データ分析方法及び空間データ分析プログラム | |
JP2013196366A (ja) | 危険検知装置、危険検知方法およびプログラム | |
JP6070123B2 (ja) | 位置情報秘匿方法、位置情報秘匿装置及び位置情報秘匿プログラム | |
JP6364432B2 (ja) | 移動経路推定の方法および装置 | |
JP6324175B2 (ja) | 地図情報表示システム及び方法、プログラム | |
KR101591595B1 (ko) | 대용량 그래프 데이터베이스에서 링크를 예측하는 방법 | |
JP2016042369A (ja) | 危険事例表示プログラム、危険事例表示方法、および危険事例表示装置 | |
S. de Sousa et al. | A cluster-based framework for predicting large scale road-network constrained trajectories | |
JP4403157B2 (ja) | エリア分割装置、エリア分割方法及びプログラム | |
EP3752793B1 (en) | Apparatus and method for estimating a physical state of a movable object | |
JP4384105B2 (ja) | 空間データマイニング装置、方法およびプログラム | |
JP2004126757A (ja) | データ予測装置、データ予測方法およびデータ予測プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081114 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090113 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090327 |