JP2001318938A - 空間データマイニング方法、空間データマイニング装置、および記憶媒体 - Google Patents

空間データマイニング方法、空間データマイニング装置、および記憶媒体

Info

Publication number
JP2001318938A
JP2001318938A JP2000135928A JP2000135928A JP2001318938A JP 2001318938 A JP2001318938 A JP 2001318938A JP 2000135928 A JP2000135928 A JP 2000135928A JP 2000135928 A JP2000135928 A JP 2000135928A JP 2001318938 A JP2001318938 A JP 2001318938A
Authority
JP
Japan
Prior art keywords
distance
starting point
azimuth
point
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000135928A
Other languages
English (en)
Other versions
JP3659318B2 (ja
Inventor
Yasuhiko Morimoto
康彦 森本
Harunobu Kubo
晴信 久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2000135928A priority Critical patent/JP3659318B2/ja
Priority to US09/825,013 priority patent/US7024402B2/en
Publication of JP2001318938A publication Critical patent/JP2001318938A/ja
Application granted granted Critical
Publication of JP3659318B2 publication Critical patent/JP3659318B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/918Location
    • Y10S707/921Spatial
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)
  • Instructional Devices (AREA)

Abstract

(57)【要約】 【課題】 予め距離や方位を定めた上で空間相関ルール
を導き出すのではなく、多くの分析業務にて要求され
る、ある目的を最適化する距離自体、方位自体を求める
空間データマイニングを提供する。 【解決手段】 住所などの空間情報を含むデータベース
の中から最適な距離を計算する空間データマイニング装
置であって、距離最適化に必要な目的関数を入力する入
力手段と、データベースにおける始点集合データおよび
質問点集合データに基づいて始点と質問点との距離を計
算して中間テーブルを生成する中間テーブル作成部30
と、この中間テーブル作成部30によって生成された中
間テーブルに基づいて入力手段により入力された目的関
数の値を最適化する距離を計算する最適距離計算部39
とを備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、空間データマイニ
ングにおけるデータベース処理に関し、より詳しくは、
空間データマイニングの基本機能である最適距離または
最適方角を算出する手法、装置等に関する。
【0002】
【従来の技術】データベースにある住所などの空間情報
を空間的な文脈で解釈し、その空間的な法則を大量のデ
ータの中から導き出す新しい技術を空間データマイニン
グと呼ぶ。この空間データマイニングは、大量データに
対して、コストの高い空間・幾何学演算を行なう必要が
あり、技術的にはかなり難しい問題に直面する場合が多
い。そのために、空間データマイニングはあまり発展し
ているとは言えず、未開拓の研究分野である。しかしな
がら、その一方で、空間データマイニングは、情報産業
の中でも最もビジネスボリュームの大きなデータベース
やGIS(Geographical Information System:地理情報
システム)分野を大いに発展させる可能性を秘めた基礎
技術と考えられ、ビジネス的、また技術的にも大変有望
な技術分野である。
【0003】ここで、既存の空間データマイニングシス
テムとして、あらかじめ距離を定めた上で空間相関ルー
ルを導き出すものが知られている。例えば、J.Han
らによる手法("Spatial Data Mining: Progress and Ch
allenges,"SIGMOD'96 Data Mining Workshop,pp.55-69,
1996)では、述語として「close to」「far from」とい
う距離述語を定義し、空間情報を有するデータベースか
ら、例えば、 「close to 公園」→「住宅地である」(支持度5%、
確信度80%)、 「地価下落」→「far from 駅」(支持度10%、確信
度70%) のような距離述語を含んだ空間相関ルールを導き出して
いる。
【0004】また、既存の空間データマイニングシステ
ムとして、あらかじめ方位を定めた上で空間相関ルール
を導き出すものも知られている。例えば、上記J.Ha
nらによる手法では、述語として「west of」「north o
f」という方角述語を定義し、空間情報を有するデータ
ベースから、例えば、 「west of 公園」→「住宅地である」(支持度5%、確
信度80%)、 「地価下落」→「north of 駅」(支持度10%、確信
度70%) のような方位述語を含んだ空間相関ルールを導き出すこ
とが可能である。
【0005】
【発明が解決しようとする課題】しかしながら、J.H
anらによる手法のような「close to」「far from」
は、あらかじめマイニング開始前に、「close to X」
=「Xから距離Y以内である」、「far from X」=
「Xから距離Z以遠である」のような距離を与えて定義
しておく必要がある。また、上述した「west of」「nor
th of」は、あらかじめマイニング開始前に、「west of
X」=「Xの西側に隣接する1辺がYの長さで長方形
の内側である」、「north of X」=「Xから方角でY
1°からY2°である」のように存在範囲や角度等を与
えて定義しておく必要がある。このとき、多くの分析業
務においては、ある目的を最適化するY、Zのような距
離自体、また、ある目的を最適化するY1°、Y2°の
ような厳密な方角を規定する数値自体が必要とされてお
り、最先端の既存技術を適用しても、かかる多くの分析
業務で十分な対応を図ることができない。
【0006】例えば、「A地区で、現金自動預払機(A
TM)の単位距離あたりの存在密度を最大化する、コン
ビニエンスストアからの半径を求めよ」といった検索
や、「強い大気汚染が広がっているのは、各ゴミ処分場
からどの方角であるかを求めよ」といったような検索に
は、既存のデータマイニングシステムでは対応すること
ができない。
【0007】本発明は、以上のような技術的課題を解決
するためになされたものであって、その目的とするとこ
ろは、予め距離や方位を定めた上で空間相関ルールを導
き出すことなく、多くの分析業務で要求される距離自
体、方位自体を求める技術を提供することにある。また
他の目的は、距離自体、方位自体を求める際に、マイニ
ング作業の高速化を図ることにある。更に他の目的は、
ユーザ(お客様)に対して利便性の高いマイニング出力結
果を提供することにある。
【0008】
【課題を解決するための手段】かかる目的のもと、本発
明は、予め距離や方位を定めた上で空間相関ルールを導
き出すのではなく、入力パラメータとして距離や方位の
定義、始点集合の定義、目的関数の定義から、多くの分
析業務にて要求される、ある目的を最適化する距離自体
または方位自体を求める空間データマイニングを提供す
るものである。即ち、本発明は、住所などの空間情報を
含むデータベースの中から空間的な法則を導き出す空間
データマイニング方法であって、データベースから始点
または始点群を与えるステップと、与えられた前記始点
または前記始点群から距離または方位を定義するステッ
プと、空間的な法則を導き出すために調べる目的関数を
定義するステップと、定義された前記目的関数を最適化
するような前記始点または前記始点群からの距離区間ま
たは方位区間を算出するステップとを含むことを特徴と
している。
【0009】ここで、この目的関数は、分析業務に要求
される距離自体または方位自体が与えられていない関数
であることを特徴としている。また、距離の定義、始点
または始点群の定義、および目的関数の定義を入力パラ
メータとして入力するステップとを更に含むことを特徴
とすることができる。更に、距離区間を算出するステッ
プは、始点群からなる始点集合データと定義された目的
関数とに基づいて中間テーブルを生成すると共に、生成
された中間テーブルに基づいてデータベースにおける各
質問点の属性値を距離の値に応じて集計することを特徴
とすれば、計算時間を大幅に短縮することができる点で
好ましい。また、算出された始点または始点群からの距
離区間または方位区間を地図上に表示するステップとを
更に含むことを特徴とすれば、計算されたルールを視覚
的に把えることが可能となり、ユーザに対する利便性を
向上させることができる。
【0010】ここで、算出された方位区間は、この目的
関数を最適化する方位を数値として算出することを特徴
とすることができる。また、算出された方位区間は、検
索対象となるデータの範囲として方位を算出するのに適
した始点または始点群からの等距離範囲を選択すること
を特徴とすることができる。始点または始点群から無限
遠まで計算するのは殆ど不可能であり、最適化される領
域を定めることは有効である。
【0011】また、本発明は、空間情報を含むデータベ
ースの中から方位に関する空間的な法則を導き出すため
のデータテーブルを生成する空間データマイニング方法
であって、データベースから始点の集合および質問点の
集合を与えるステップと、始点の集合と質問点の集合と
の距離の上限を指定するステップと、質問点に対して始
点との距離を計算するステップと、計算された始点との
距離が指定された上限に含まれる質問点に対して、始点
との角度を計算するステップと、計算された始点との角
度を用いてデータテーブルを生成するステップとを含む
ことを特徴とすることができる。ここで、質問点とは、
例えば顧客データの点集合等が挙げられ、実際に始点や
始点群からの距離、方位が計算される対象である。
【0012】本発明を装置から把えると、本発明は、住
所などの空間情報を含むデータベースの中から最適な距
離を計算する空間データマイニング装置であって、距離
最適化に必要な目的関数を入力する入力手段と、データ
ベースにおける始点集合データおよび質問点集合データ
に基づいて始点と質問点との距離を計算して中間テーブ
ルを生成する中間テーブル生成手段と、この中間テーブ
ル生成手段によって生成された中間テーブルに基づいて
入力手段により入力された目的関数の値を最適化する距
離を計算する最適距離計算手段とを備えたことを特徴と
することができる。
【0013】ここで、この中間テーブル生成手段は、デ
ータベースにおける始点集合データからボロノイ図を作
成するボロノイ図作成手段と、このボロノイ図作成手段
によって作成されたボロノイ図とデータベースにおける
質問点集合データとに基づいて各始点と各質問点との距
離を計算してデータレコードを生成する距離計算手段
と、調べたい目的関数から最適化関数を選択して距離区
間毎に最適値に必要なレコード値をデータレコードから
集計する距離別計算手段とを含むことを特徴とすること
ができる。更に、このボロノイ図作成手段は、入力始点
数に応じて平面四分割を繰り返し、入力始点数を末端の
分割平面ピクセルに振り分けて各ピクセルの中にある始
点の中から1つをピクセルの代表点として選択し、各段
ピクセルを中間ノードとする四分木を作成し、この四分
木の各ノードを広さ優先順に最上段から走査して順序付
けされた始点集合を出力することを特徴とすれば、処理
を高速化することが出来る点で好ましい。また、この四
分木の構造を事前に計算しておき、メモリに蓄積するよ
うに構成すれば、この四分木の構造は距離最適化や方位
最適化に関するマイニングで頻繁に利用することから、
マイニング作業を更に高速化することができる点で好ま
しい。
【0014】一方、本発明は、住所などの空間情報を含
むデータベースの中から最適な方位を計算する空間デー
タマイニング装置であって、方位最適化に必要な目的関
数を入力する入力手段と、このデータベースにおける始
点集合データおよび質問点集合データに基づいて、始点
から特定方向を0度とする角度を用いて質問点の位置す
る方位を含む中間テーブルを生成する中間テーブル生成
手段と、この中間テーブル生成手段によって生成された
中間テーブルに基づいて入力手段により入力された目的
関数の値を最適化する方位を計算する最適方位計算手段
とを備えたことを特徴とすることができる。ここで、こ
の中間テーブル生成手段は、このデータベースにおける
始点集合データからボロノイ図を作成するボロノイ図作
成手段と、このボロノイ図作成手段によって作成された
ボロノイ図とデータベースにおける質問点集合データと
に基づいて各始点と各質問点との距離を計算する距離計
算手段と、この距離計算手段により計算された距離の中
から、指定された上限距離以内の質問点の始点からの方
位を計算して中間テーブルのレコードとする方位計算手
段と、調べたい目的関数から最適化関数を選択して方位
区間毎に最適値に必要なレコード値をこのデータレコー
ドから集計する方位別計算手段とを含むことを特徴とす
ることができる。
【0015】本発明を他の観点から把えると、本発明
は、住所などの空間情報を含むデータベースの中から最
適な距離または方位を計算して出力する空間データマイ
ニング装置であって、分析業務に要求される距離自体お
よび方位自体が与えられていない目的関数を入力する入
力手段と、このデータベースにおける始点集合データお
よび質問点集合データに基づいて始点と質問点との距離
または方位を求めると共に、この目的関数の値を最適化
する最適距離または最適方位を計算する最適距離・方位
計算手段と、最適距離・方位計算手段により計算された
最適距離または最適方位を地理情報システムの画面上に
表示する表示手段とを備えたことを特徴とすることがで
きる。
【0016】ここで、この表示手段は、最適距離・方位
計算手段により計算された最適距離を各始点を中心とす
る円形領域にて表示することを特徴とすることができ
る。また、この表示手段は、最適距離・方位計算手段に
より計算された最適方位を各始点からの扇形領域にて表
示することを特徴とすることができる。これらによれ
ば、求まった最適距離や最適方位を地図上に解かり易く
表示することが可能となり、お客様の使い勝手を各段に
向上させることができる。
【0017】また、本発明は、住所などの空間情報を含
むデータベースの中から空間的な法則を導き出す空間デ
ータマイニング装置であって、データベースから始点ま
たは始点群を与える始点付与手段、空間的な法則を導き
出すために調べる目的関数を定義する目的関数定義手
段、定義された目的関数を最適化するような始点または
始点群からの距離区間を算出する距離区間算出手段、与
えられた始点または始点群から方位を定義する方位定義
手段、定義された目的関数を最適化するような始点また
は始点群からの方位区間を算出する方位区間算出手段と
を含むことを特徴とすることができる。更に、データベ
ースから始点の集合および質問点の集合を与える始点/
質問点付与手段、付与された始点の集合と質問点の集合
との距離の上限を指定する距離上限指定手段、質問点に
対して始点との距離を計算する距離計算手段、計算され
た始点との距離が指定された上限に含まれる質問点に対
して、始点との角度を計算する角度計算手段、計算され
た始点との角度を用いてデータテーブルを生成するデー
タテーブル生成手段とを含むことを特徴とすることがで
きる。
【0018】また更に、本発明は、距離自体および方位
自体が与えられていない目的関数に基づいて住所などの
空間情報を含むデータベースの中から空間的な法則を導
き出すプログラムを格納した記憶媒体であって、このプ
ログラムは、データベースから始点または始点群を与え
るステップと、与えられた始点または始点群からの距離
または方位を定義するステップと、調べたい目的関数を
定義するステップと、定義されたこの目的関数を最適化
するような、始点または始点群からの距離区間または方
位区間を算出するステップとを含むことを特徴とするこ
とができる。この記憶媒体としては、例えばCD−RO
M等の可搬性のある媒体の他、ネット等を介してプログ
ラムをダウンロードするための、プログラムを提供する
側のハードディスク等の記憶媒体、ダウンロード等によ
ってプログラムの提供を受けたユーザ側のハードディス
ク等の記憶媒体を含むものである。
【0019】
【発明の実施の形態】以下、添付図面に示す実施の形態
に基づいてこの発明を詳細に説明する。まず、本実施の
形態における空間データマイニングの理解を容易にする
ために、本方式のモデリングとアルゴリズムについて説
明する。図1は、本実施の形態におけるモデリング1と
して、距離最適化エンジンによる出力例を示した図であ
る。地図11上に、始点(または始点群)12〜14であ
るコンビニエンスストア(CS)から、目的関数を最適化
するような距離(あるいは距離区間)が、所定の半径を有
する円15〜17で表示される。図1に示す例では、
「ひったくりの発生率を最大化するコンビニエンススト
アからの距離を求めよ。」といった検索から、その目的
関数を最適化するような始点12〜14からの距離が示
されている。
【0020】この出力例では、例えば、「ひったくり」
→(「コンビニエンスストア」,「[0,100]」),
「5」件といった内容が出力される。その意味は、「ひ
ったくり」の発生率を最大化するのは、「コンビニエンス
ストア」から半径「0」m以上「100」m以内で、半径
(m)あたり「5」件発生している。である。始点からの距
離の出力としては、以下のような例がある。 「ひったくり」→(「駅」,「[50,180]」),「6.
1」件 「ひったくり」→(「銀行」,「[200,−]」),「2.
2」件 「強盗」→(「銀行」,「[60,200]」),「1.3」件 「殺人」→(「飲食店」,「[0,50]」),「0.4」件
【0021】図2は、本実施の形態におけるモデリング
2として、方位最適化エンジンによる出力例を示した図
である。地図11上に、始点(または始点群)12〜14
であるコンビニエンスストア(CS)から、目的関数を最
適化するような始点12〜14からの方位区間18〜2
0が算出されて示されている。図2に示す例では、「ひ
ったくりの発生率を最大化するコンビニエンスストアか
らの方角を求めよ。」といった検索から扇型の領域で表
現される角度が示されている。この出力例では、例え
ば、 「ひったくり」→(「コンビニエンスストア」,「[0,1
00]」),「5」件 といった内容が出力される。その意味は、「ひったくり」
の発生率を最大化するのは、「コンビニエンスストア」か
ら方位「0」°以上「100」°以内で、10°あたり「5」
件発生している。である。始点からの方位の出力として
は、その他に、 「ひったくり」→(「神社」,「[120,240]」),
「6.1」件 等の出力例が挙げられる。
【0022】図3は、本実施の形態における距離・方位
最適化エンジンのアルゴリズムの概略を説明するための
フローチャートである。まず、始点(または始点群)を与
える(ステップ101)。即ち、距離最適化の場合には距
離を計算する際の起点となる地図上のエンティティ(実
体)を指定し、方位を最適化する際にはどの地点から見
た方角なのかを計算するために方角基準点として地図上
のエンティティを指定する。この始点は、各計算毎に1
つでも複数でもよく、それを始点あるいは始点群(集合)
とする。次に、その始点(または始点群)からの距離・方
位を定義する(ステップ102)。方位では、どこを起点
とするかを定義する。但し、常に距離をユークリッド距
離として定める場合には、距離に対する定義は不要とな
る。そして、例えば、ある商品の売り上げ総額、犯罪の
発生件数などの調べたいものの目的関数を定義する(ス
テップ103)。その後、その目的関数を最適化するよ
うな始点からの距離区間、あるいは方位区間を算出する
(ステップ104)。その後、距離・方位のバケット集計
と最適化距離の計算が実行される。尚、nを質問点数、
mを始点点数とし、N=n+mと仮定すると、距離算出
の平均実行時間はO(N)で表わすことができる。即ち、
質問点に対応する始点を見つけるのに、平均計算量でO
(logn)、距離の計算はO(1)で可能であり、この処理
にO(nlogn)かかる。しかし、距離がユークリッド距
離である場合は、後述する四分木構造(quaternary incr
emental method)を利用することで、平均実行時間をO
(n)とすることができる。ここで質問点とは、処理の対
象となるデータベースにおける顧客データ等である。
【0023】図4は、データベース例を示した図であ
る。本実施の形態では、図に示すようなスキーマ(仕様)
を有するデータベースと関連付けされた統合化地理情報
システムの存在を前提としている。このデータベースの
各スキーマには、データを区別するためのID情報と、
位置(座標)情報が含まれている。この位置情報は、住所
データで表わされる場合の他、地図情報に対応した座標
情報等が格納されている。また、下線で示される数値属
性や、下線した斜体文字で示されるカテゴリカル属性が
含まれている。このデータベースから、距離や方位に関
する最適化ルールがマイニングされる。
【0024】図5は、入力パラメータとして始点群や基
点群(方位の始点群)の定義例を示した図であり、図3の
フローチャートのステップ101にて示した距離の始点
群や方位の始点群を定義する例を示している。この始点
や基点の定義としては、例えば、郵便局、学校、警察等
のエンティティが指定される。ここで、例えば、郵便局
(ALL)であれば、集配局や特定郵便局等の複数のカテ
ゴリカル属性に基づく郵便局を統合して定義される。同
様に学校(ALL)であれば、各種学校や小学校、中学校
等のカテゴリカル属性を統合して定義される。また、例
えば、駅であれば、乗降客X以上や乗降客X未満等の数
値属性に基づいて、始点群や基準群を定義できる。同様
に、例えば、コンビニエンスストア(コンビニ)では、売
上X以上、売上X未満等の数値属性に基づく定義が可能
である。
【0025】図6は、距離や方位の定義例を示した図で
あり、図3のフローチャートにおけるステップ102の
定義例である。これらの定義は、最適化ルールをマイニ
ングする場合に、入力パラメータとして指定されるもの
である。距離の定義としては、ユークリッド距離やネッ
トワーク距離がある。このユークリッド距離はボロノイ
図などを利用して計算されるが、高速に計算する場合や
ごく近距離の場合には、地図の実体とかい離することが
ある。また、ネットワーク距離はダイクストラ法などで
計算される。このダイクストラ法は、各ノードへの最短
距離をスタートノードの周辺から1つずつ確定して徐々
に範囲を広げていき、最終的に全てのノードへの最短距
離を求める方法であり、計算時間は多く必要となるが地
図上での実体を反映することができる。尚、本実施の形
態では、ユークリッド距離の場合に適用される計算法を
用いており、それ以外の距離では計算法が全く異なる。
ユークリッド距離として決める場合には、距離の定義は
不要である。また、方位の定義としては、例えば、北を
0°として時計回りに360°で1周する方位スケール
を定義する等があり、これらの方位スケール上で方位区
間が定義される。
【0026】図7は、目的関数の定義例を示した図であ
り、図3のフローチャートにおけるステップ103の定
義例である。これらの目的関数は最適化ルールをマイニ
ングする際に指定されるものである。この目的関数の定
義としては、各スキーマに対して、図の下線で示される
数値(あるいは数値として派生する)属性、下線した斜体
文字で示されるカテゴリカル(あるいはカテゴリ値とし
て派生する)属性を用いて定義することができる。例え
ば、顧客スキーマとして、数値属性を用いて「支持率S
以上の顧客の「平均年収」最大化距離」や、カテゴリカル
属性を用いて「支持率S以上の顧客「年齢60歳以上」の
顧客比率最大化距離」等の定義や、例えばATMスキー
マとして「支持率S以上の顧客の「ATM数/顧客数」最
大化距離」等を定義することができる。
【0027】次に、図3のフローチャートにおけるステ
ップ104では、定義された目的関数を最適化するよう
な始点からの距離区間、方位区間が算出される。本実施
の形態では、後述するように中間テーブルを作成して高
速化処理が図られている。この中間テーブルでは、始点
集合を母点とする幾何図形であるボロノイ図(ティーセ
ン分割)を、逐次添加法によって作成している。即ち、
m個の母点P1,…,Pmからなるボロノイ図Vmに新たな
母点Pm+1を加え、m+1個の点からなるボロノイ図V
m+1を作っている。
【0028】図8は、逐次添加法による処理の流れを示
した図である。図の左側は処理の流れをフローチャート
で示し、図の右側に形成過程におけるボロノイ図の例を
示している。まず、P1,…,Pmの中でPm+1に最も近い
点Pを「ボロノイ図の高速点位置決定法」(後述)により求
める(ステップ111)。次に、Pのボロノイ領域内にP
m+1の垂直2等分線Lを引く(ステップ112)。次
に、Lが接するボロノイ領域の母点に対しても同様に垂
直2等分線を引く(ステップ113)。上記の作業を繰り
返し、Pm+1のボロノイ領域を作成してVm+1とする(ス
テップ114)。
【0029】図9は、ボロノイ図の点位置決定法におけ
る処理の流れを示した図である。ここで示す「ボロノイ
図の点位置決定法」は、ある点Pがm個の母点P1,…,P
mからなるボロノイ図Vmのどの母点に最も近いかを求め
る(どのボロノイ領域にあるかを求める)ものである。ま
ず、P1,…,Pmの中で任意の点Piを選び、点Pとの距
離dを求める(ステップ121)。次に、Piの各隣接母
点PjとPとの距離djを計算し、dと比較する(ステッ
プ122)。ここで、dj<dが判断され(ステップ12
3)、dj<dであればd=dj、Pi=Pjとしてステッ
プ122に戻る。そのような母点がない場合には、Pi
を答えて(ステップ125)終了する。
【0030】図10は、逐次添加法の前処理における処
理の流れを示した図である。まず、母点が各ピクセルに
およそ1つ含まれるような深さdの四分木を作成する
(ステップ131)。次に、図(a)のようにピクセルに番
号を付ける(ステップ132)。この図(a)は、地図(2
次元平面)のビューを示しており、ここに示される矢印
は、ピクセル番号を付ける順序を示したものである。次
に、各母点を座標値によってそれぞれピクセル(四分木
の葉)に割り当て、各葉にラベルを付ける(ステップ13
3)。次に、番号順に、各葉の全ての(まだラベルのな
い)先祖に対して、自分のラベル値をコピーする(ステッ
プ134)。最後に、この四分木の各節と葉を、広さ優
先順に並べ、その順に「逐次添加法」を実行する(ステッ
プ135)。図(b)は深さ3の四分木のビューを示して
おり、深さ方向ではなく横方向の順番にて「逐次添加法」
が実行される。尚、駅、郵便局、警察、学校、公園な
ど、分析対象になり易く、あまり位置的に変更のない地
図上のエンティティについては、予めボロノイ図を構成
しておくこともできる。
【0031】その後、ボロノイ図を利用した始点からの
距離が計算される。ここでは、「n個の質問点に対し、
m個の母点P1,…,Pmからなるボロノイ図Vmを使った
点位置決定問題を解く」ことが行なわれる。即ち、n個
(かなり多い数)の各質問点(例えば犯罪データなど)と、
m点(コンビニなど)からなる始点集合との距離が計算さ
れる。但し、距離は、最寄の始点との距離とする。より
具体的には、ピクセルで最初の質問点に対しては、逐次
点においてそのピクセルのラベルとなった母点により、
質問点が各ピクセル毎に計算される。また、ピクセルで
最初の質問点でない場合には、前回の距離・方位計算で
最近点とされた母点によって質問点が各ピクセル毎に計
算される。以上のようにして、中間テーブルが作成され
る。
【0032】最後に、距離、方位のバケット集計と最適
距離計算がなされる。ここでは、n個(このnはかなり
多い数)の各質問点の属性値を、距離・方位の値に応じ
て集計する。即ち、各バケット毎に「データ数」と目的
関数値算出に必要なデータが集計される。例えば、「顧
客スキーマ」(支持率S以上の顧客の「平均年収」最大
化距離)という目的関数の場合には、距離に応じたデー
タ数と年収合計数が順次、加算され、集計結果が出力さ
れる。このような集計情報を1回スイープすることで、
最適化距離が求められる。この結果は、例えば図1や図
2に示したように、地図上に円形形状や扇形状等によっ
て表示される。
【0033】以上、本発明における処理のアルゴリズム
を説明した。このような処理アルゴリズムは、コンピュ
ータ・プログラムによって実現し、実行することができ
る。図11は、空間データマイニング装置としてのコン
ピュータ・システムの概略構成を説明するための図であ
る。本実施の形態における処理アルゴリズムは、図示す
るようなコンピュータ・システムにおいて実行可能なプ
ログラムとすることもできる。処理プログラムは、ハー
ドディスクドライブ(HDD)75に格納され、実行時に
はメインメモリ72にロードされ、CPU71によって
処理される。また、HDD75は住所などの空間情報を
含む大量のデータベースをも含んでおり、処理プログラ
ムはそのデータベースに対するアクセスを行うものであ
る。地図情報システム(GIS)等の地図情報や最適化距
離、最適化方位の計算結果は、表示装置76によってユ
ーザに提示される。ユーザは、入力装置77にて調べた
い目的関数の入力や、データ出力の命令等を入力する。
このような入力装置77には、キーボードやマウス、ポ
インティング・デバイスやディジタイザ等を含む。さら
に、出力結果を補助記憶装置であるフロッピー(登録商
標)ディスクドライブ(FDD)73のフロッピーディス
クに記憶したり、また新たなデータをFDD73から入
力することもできる。さらに、CD−ROMドライブ7
4を用いて、データを入力することもできる。
【0034】更に、本実施の形態における処理アルゴリ
ズムを実現したコンピュータ・プログラムは、フロッピ
ーディスクやCD−ROMといった記憶媒体に記憶し
て、持ち運ぶことができる。この場合、通常のデータベ
ース検索プログラムのデータ取り出し部分や、表示装置
76に表示するだけの処理を行うプログラムは、すでに
HDD75に記憶されている場合もある。従って、それ
以外の部分が上記のような各種記憶媒体にて流通するこ
とは通常行われる事項である。また、図示されていない
通信装置がバス78に接続されて、遠隔地にあるデータ
ベースを用いて処理したり、処理結果を遠隔地に送信す
るように構成することも可能である。即ち、住所などの
空間情報を含む大量のデータベースを図11に示す構成
の外部に設けるように構成することもできる。
【0035】次に、本実施の形態における構成を、更
に、機能ブロック図等を用いて詳述する。図12は、本
実施の形態における空間データマイニングシステムの構
成を説明するためのブロック図であり、図11で示した
CPU71における構成を詳述したものである。ここで
は、大きく、中間テーブル作成部30と最適距離計算部
39とを備えている。この中間テーブル作成部30は、
ボロノイ図作成部31、距離計算部32、および距離別
計算部33とを備えている。このボロノイ図作成部31
は、ID、名前、地図上の座標等からなる、例えばコン
ビニの点集合等の始点集合データを受けて、始点添加順
決定部34およびボロノイ図点追加部35によりボロノ
イ図を作成している。距離計算部32では、ID、名
前、地図上の座標、買上金額等からなる、例えば顧客デ
ータの点集合等の質問点集合データを受けて、距離の計
算された顧客データレコードあるいはレコード集合を生
成している。また、距離別計算部33では、距離計算部
32から出力された顧客データレコードを基に、距離区
間毎に最適化に必要なレコード値を集計している。その
結果として、図12に示されるような中間テーブルが作
成される。ここでは、距離区間毎にレコード値と買上金
額計が示されている。最適距離計算部39では、この中
間テーブルをスキャンして最適化関数値の最も良くなる
距離が計算され、距離最適化ルールとして出力がなされ
る。
【0036】次に、図13および図14を用いてボロノ
イ図作成部31における始点添加順決定部34の機能を
説明する。図13は、ボロノイ図作成部31における始
点添加順決定部34の構成を説明するためのブロック図
である。この始点添加順決定部34は、平面四分割機能
41、始点分配機能42、代表点決定機能43、四分木
作成機能44、および添加順序決定機能45を備えてい
る。平面四分割機能41は、始点集合データを全て入力
し、入力始点数mに応じて、図に示すように平面四分割
をt(t=m1/2−1)回、繰り返す。即ち、各段の1ピ
クセルを4等分するが、各ピクセルには、ほぼ1点の始
点を有することが好ましい。
【0037】図14は、分割された平面ピクセルと作成
された四分木を説明する図である。図14に示すよう
に、平面四分割機能41によって分割されたピクセルに
は番号が付けられる。ここでは深さ3として0〜63の
64のピクセルに分割される。図13に示す始点分配機
能42では、m個の入力始点が末端の分割平面(ここで
は0〜64)のピクセルに振り分けられる。図14で
は、ピクセル0に始点8(S8)と始点19(S19)が、
ピクセル60に始点12(S12)が振り分けられてい
る。次に、図13に示す代表点決定機能43では、各ピ
クセルの中にある始点の中から、一つを、そのピクセル
の代表点として選定する。例えば、図14のピクセル6
0では始点12(S12)が選ばれている。複数始点があ
る場合には、任意の一つを選び(例えば、ピクセル0で
は始点8(S8)が選ばれている)、始点がない場合に
は、代表点は「なし」となる。
【0038】図13に示す四分木作成機能44では、前
述の四分割の繰り返し過程で現われる、(最下段ではな
い)各段の各ピクセルを中間ノードとする四分木が作成
される(図14右図参照)。更に、木の下段の中間ノード
から順に、各中間ノードの代表点が決定される。図14
では、各中間ノードにおける子ノードの代表点の中から
一つを代表点としており、始点8(S8)が順に選ばれて
いる。図13に示す添加順序決定機能45では、四分木
の各ノードを広さ優先順に最上段から走査していく。即
ち、深さ方向(深さ優先順)ではなく、各段ごとに横方向
に走査する。その過程で、各ノードのまだリストにない
代表点を出力始点リストの最後に加えていく。最下段の
葉ノードに関しては、代表点だけではなく、そのノード
に属する全ての(まだリストにない)始点が加えられる。
即ち、図14の例では、ピクセル0の始点19(S19)
が加えられる。以上のようにして、始点添加順決定部3
4から、順序付けされた始点集合が図12に示したボロ
ノイ図点追加部35に出力される。
【0039】図15は、図12に示したボロノイ図作成
部31のボロノイ図点追加部35の構成を説明するため
のブロック図である。このボロノイ図点追加部35は、
大きく高速点位置決定機能51と領域分割機能52を有
している。更にこの高速点位置決定機能51は、開始位
置決定機能53および漸近機能54とを備え、P1,…,
mの中でPm+1に最も近い点Pを「高速点位置決定法」
により求めている。この開始位置決定機能53では、入
力点が四分木の最下段でどのピクセルXに属するかが計
算され、ピクセルXの代表点の始点(ボロノイ点)Piを
開始位置とされる。但し、代表点「なし」の場合には、
親ノードの代表点を開始位置とされる。また、漸近機能
54では、Piと入力点Pm+1との距離dが計算される。
そして、Piの各隣接ボロノイ点PjとPm+1との距離dj
が計算され、dとの比較がなされる。dj<dならばd
=dj, Pi=Pjとされる。そのような隣接母点がなけ
れば、Piが答えとされる。そして、ピクセルXの代表
点はPiとされる。領域分割機能52では、右図に示す
ように、Pのボロノイ領域内にPPm+1の垂直2等分線
Lがひかれる。Lが接するボロノイ領域の始点をPと
し、同様に垂直2等分線がひかれる。これを垂直2等分
線で囲まれる領域ができるまで繰り返されることによっ
て、右図のようなm+1点からなる中間ボロノイ図V
m+1を得ることができる。
【0040】図12に示した中間テーブル作成部30で
は、以上のようにして作成されたボロノイ図作成部31
にて作成されたボロノイ図と、質問点集合データから、
前述したように、距離計算部32によって距離の計算さ
れた顧客データレコードが出力される。即ち、質問点集
合の各レコードにおける質問点レコードと中間ボロノイ
図Vm+1とから、高速点位置決定法によって入力点に最
も近いボロノイ点が抽出され、質問点レコードとボロノ
イ点との距離を計算し、距離付き質問点レコードを出力
する。その後、前述したように、距離別計算部33を経
て、距離区間毎にレコード値が集計された中間テーブル
が中間テーブル作成部30から出力される。出力された
中間テーブルの情報は、例えばHDD75等に格納され
る。
【0041】このソートされた中間テーブルを用いて、
最適距離計算部39にて最適距離が計算される。例え
ば、図12に示したような質問点集合データにおける顧
客データであれば、距離の小さなレコードから順に、買
上金額をアキュムレート(累算)し、その過程で「アキュ
ムレートされた買上金額/これまでのアキュムレートさ
れたレコード数」の最も高い値を出す距離を記録する。
その際、一般的には、このアキュムレートの過程で、最
高値を出したレコードと、中間テーブルにおけるその次
のレコードの距離との中間値を暫定最適距離として記録
する。このように目的関数の最高値を出す暫定最適距離
を維持しながら中間テーブルを1度スキャンすること
で、最適距離を求めることができる。求めた最適距離
は、表示装置76を用いて図1のように表示することが
可能である。
【0042】方位最適化を図るアルゴリズムの中間テー
ブルには、図2に示したように最適化する対象である各
円の内側のデータのみが含まれる。即ち、空間情報と関
連付けられているデータベースの各レコード(質問点)に
対して、基準点との距離を計算し、半径以内に含まれて
いるものについて基準点との角度を計算し、角度の値に
応じて中間テーブルのレコードへ集計される。但し、検
索対象となる円が互いに重なっている場合には、複数の
円に同時に含まれる質問点が存在する場合があり得るこ
とから、中間テーブルを作成する際に、以下の二通りの
どちらかの方法で処理を行うこととする。 ・それぞれの基準点に基づく角度を、全ての対応する中
間テーブルのレコードに加える。 ・一番距離の近い基準点に対する角度に対応するレコー
ドにのみ、中間テーブルへ加える。
【0043】方位最適化の際の中間テーブルには、この
ように等間隔の昇順あるいは降順の角度区間を属性とし
て有している。例えば、目的関数が平均年収である場合
に、中間テーブルは、その計算に必要な年収合計とレコ
ード数とを属性として持つ。 年収合計 角度区間 レコード数 8,400,000 0〜10 6 5,000,000 10〜20 1 7,000,000 20〜30 3 5,800,000 30〜40 3
【0044】その後、中間テーブルを用いて目的関数の
最適方位の範囲を決定する。例えば、角度の小さなレコ
ード順のインデックスをs,tとして、区間[s,t]の平
均年収X[s,t]を、X[s,t]=「区間[s,t]の間に
含まれるレコードの年収の総和 ÷ 区間[s,t]の給与
所得者数」と表わすと、X[s,t]を最適化する区間
[s,t]を求める問題となる。そのための区間アルゴリ
ズムは、中間テーブルサイズをnとしてO(n)で実行可
能であるが、角度を数値化した時に発生する0度での不
連続性を考慮したアルゴリズムを適用する。例えば、ソ
ートされた中間テーブルのレコードに対し、年収とレコ
ード数とをそれぞれ累積演算させながら、 ・Σ年収 / Σレコード数を最大にするレコード位置t
とtにおけるΣ年収とΣレコード数 ・Σ年収 / Σレコード数を最小にするレコード位置s
とsにおけるΣ年収とΣレコード数 を記憶しておく。360度までスキャンしたときの値か
ら、最適方角を求めることが可能である。s<tなら
ば、最適区間は0をまたがずに[s,t]と与えられ、そ
の平均年収も直ぐに求めることができる。t<sなら
ば、最適区間は0をまたぐ[s,t]で、その平均年収も
全質問点数と全質問点との年収総額を用いて求めること
が可能である。このようにして求めた結果は、表示装置
76を用いて図2のように地図上に表示することが可能
である。
【0045】このように、本実施の形態によれば、必要
に応じて入力パラメータとして距離の定義(ユークリッ
ドか(この場合ほぼ線形時間)ネットワークか(この場合
多項式時間))や方位(方角)の定義、始点集合の定義、お
よび目的関数の定義を指定することで、最適化ルールを
計算して列挙することが可能となる。例えば、 距離 ユークリッド距離、 始点集合の定義 郵便局(ALL,各種類)、学校(ALL,各種類)、 目的関数の定義 顧客(支持率S以上の顧客の平均年収最大化距離) 顧客(性別の相互情報量最大化距離) を指定した場合、各始点集合から各目的関数の最適化ル
ールは、例えば、 「平均年収を最大化するのは郵便局からX以内(支持率
s,平均年収x)」 「性別の相互情報量を最大化するのは大学からX以内
(支持率s,エントロピーゲインg)」 などのようなルールがそれぞれの組み合わせに対して列
挙され、ユーザは自分の興味に従って、これらのルール
をソートしたり、ファイリングしたりすることが可能と
なる。また、特に関心があるものについては、図1や図
2に示したようにGUIを用いて地図上にルールを表示
することもできる。
【0046】
【発明の効果】以上説明したように、本発明によれば、
予め距離や方位を定めた上で空間相関ルールを導き出す
のではなく、多くの分析業務にて要求される、ある目的
を最適化する距離自体、方位自体を求める空間データマ
イニングを提供することが可能となる。
【図面の簡単な説明】
【図1】 本実施の形態におけるモデリング1として、
距離最適化エンジンによる出力例を示した図である。
【図2】 本実施の形態におけるモデリング2として、
方位最適化エンジンによる出力例を示した図である。
【図3】 本実施の形態における距離・方位最適化エン
ジンのアルゴリズムの概略を説明するためのフローチャ
ートである。
【図4】 データベース例を示した図である。
【図5】 入力パラメータとして始点群や基準群の定義
例を示した図である。
【図6】 距離や方位の定義例を示した図である。
【図7】 目的関数の定義例を示した図である。
【図8】 逐次添加法による処理の流れを示した図であ
る。
【図9】 ボロノイ図の点位置決定法における処理の流
れを示した図である。
【図10】 逐次添加法の前処理における処理の流れを
示した図である。
【図11】 空間データマイニング装置としてのコンピ
ュータ・システムの概略構成を説明するための図であ
る。
【図12】 本実施の形態における空間データマイニン
グシステムの構成を説明するためのブロック図である。
【図13】 ボロノイ図作成部31における始点添加順
決定部34の構成を説明するためのブロック図である。
【図14】 分割された平面ピクセルと作成された四分
木を説明する図である。
【図15】 図12に示したボロノイ図作成部31のボ
ロノイ図点追加部35の構成を説明するためのブロック
図である。
【符号の説明】
11…地図、12〜14…始点(または始点群)、15〜
17…円、18〜20…方位区間、30…中間テーブル
作成部、31…ボロノイ図作成部、32…距離計算部、
33…距離別計算部、34…始点添加順決定部、35…
ボロノイ図点追加部、39…最適距離計算部、41…平
面四分割機能、42…始点分配機能、43…代表点決定
機能、44…四分木作成機能、45…添加順序決定機
能、51…高速点位置決定機能、52…領域分割機能、
53…開始位置決定機能、54…漸近機能、71…CP
U、72…メインメモリ、73…フロッピーディスクド
ライブ(FDD)、74…CD−ROMドライブ、75…
ハードディスクドライブ(HDD)、76…表示装置、7
7…入力装置、78…バス
フロントページの続き (72)発明者 森本 康彦 神奈川県大和市下鶴間1623番地14 日本ア イ・ビー・エム株式会社 東京基礎研究所 内 (72)発明者 久保 晴信 神奈川県大和市下鶴間1623番地14 日本ア イ・ビー・エム株式会社 東京基礎研究所 内 Fターム(参考) 2C032 HB05 5B049 AA06 EE02 EE31 FF01 5B075 PP02 PP03 PQ02 PQ13 PQ69 UU14 5L096 BA12 DA02 FA66 FA67 FA74 GA34 MA07 9A001 BB06 FF01 GG04 JJ01 JJ11

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 住所などの空間情報を含むデータベース
    の中から空間的な法則を導き出す空間データマイニング
    方法であって、 前記データベースから始点または始点群を与えるステッ
    プと、 前記空間的な法則を導き出すために調べる目的関数を定
    義するステップと、 定義された前記目的関数を最適化するような前記始点ま
    たは前記始点群からの距離区間を算出するステップとを
    含むことを特徴とする空間データマイニング方法。
  2. 【請求項2】 前記目的関数は、分析業務に要求される
    距離自体が与えられていない関数であることを特徴とす
    る請求項1記載の空間データマイニング方法。
  3. 【請求項3】 前記始点または前記始点群の定義、およ
    び前記目的関数の定義を入力パラメータとして入力する
    ステップとを更に含むことを特徴とする請求項1記載の
    空間データマイニング方法。
  4. 【請求項4】 前記距離区間を算出するステップは、前
    記始点群からなる始点集合データと定義された前記目的
    関数とに基づいて中間テーブルを生成すると共に、生成
    された当該中間テーブルに基づいて前記データベースに
    おける各質問点の属性値を距離の値に応じて集計するこ
    とを特徴とする請求項1記載の空間データマイニング方
    法。
  5. 【請求項5】 算出された前記始点または前記始点群か
    らの距離区間を地図上に表示するステップとを更に含む
    ことを特徴とする請求項1記載の空間データマイニング
    方法。
  6. 【請求項6】 住所などの空間情報を含むデータベース
    の中から空間的な法則を導き出す空間データマイニング
    方法であって、 前記データベースから始点または始点群を与えるステッ
    プと、 与えられた前記始点または前記始点群から方位を定義す
    るステップと、 前記空間的な法則を導き出すために調べる目的関数を定
    義するステップと、 定義された前記目的関数を最適化するような前記始点ま
    たは前記始点群からの方位区間を算出するステップとを
    含むことを特徴とする空間データマイニング方法。
  7. 【請求項7】 前記目的関数は、分析業務に要求される
    方位自体が与えられていない関数であることを特徴とす
    る請求項6記載の空間データマイニング方法。
  8. 【請求項8】 算出された前記方位区間は、前記目的関
    数を最適化する方位を数値として算出することを特徴と
    する請求項6記載の空間データマイニング方法。
  9. 【請求項9】 算出された前記方位区間は、検索対象と
    なるデータの範囲として方位を算出するのに適した前記
    始点または前記始点群からの等距離範囲を選択すること
    を特徴とする請求項6記載の空間データマイニング方
    法。
  10. 【請求項10】 算出された前記始点または前記始点群
    からの方位区間を地図上に表示するステップとを更に含
    むことを特徴とする請求項6記載の空間データマイニン
    グ方法。
  11. 【請求項11】 空間情報を含むデータベースの中から
    方位に関する空間的な法則を導き出すためのデータテー
    ブルを生成する空間データマイニング方法であって、 前記データベースから始点の集合および質問点の集合を
    与えるステップと、 前記始点の集合と前記質問点の集合との距離の上限を指
    定するステップと、 前記質問点に対して前記始点との距離を計算するステッ
    プと、 計算された前記始点との距離が指定された前記上限に含
    まれる質問点に対して、当該始点との角度を計算するス
    テップと、 計算された前記始点との角度を用いてデータテーブルを
    生成するステップとを含むことを特徴とする空間データ
    マイニング方法。
  12. 【請求項12】 住所などの空間情報を含むデータベー
    スの中から最適な距離を計算する空間データマイニング
    装置であって、 距離最適化に必要な目的関数を入力する入力手段と、 前記データベースにおける始点集合データおよび質問点
    集合データに基づいて始点と質問点との距離を計算して
    中間テーブルを生成する中間テーブル生成手段と、 前記中間テーブル生成手段によって生成された前記中間
    テーブルに基づいて前記入力手段により入力された前記
    目的関数の値を最適化する距離を計算する最適距離計算
    手段とを備えたことを特徴とする空間データマイニング
    装置。
  13. 【請求項13】 前記中間テーブル生成手段は、 前記データベースにおける始点集合データからボロノイ
    図を作成するボロノイ図作成手段と、 前記ボロノイ図作成手段によって作成された前記ボロノ
    イ図と前記データベースにおける質問点集合データとに
    基づいて各始点と各質問点との距離を計算してデータレ
    コードを生成する距離計算手段と、 調べたい目的関数から最適化関数を選択して距離区間毎
    に最適値に必要なレコード値を前記データレコードから
    集計する距離別計算手段とを含むことを特徴とする請求
    項12記載の空間データマイニング装置。
  14. 【請求項14】 前記ボロノイ図作成手段は、入力始点
    数に応じて平面四分割を繰り返し、前記入力始点数を末
    端の分割平面ピクセルに振り分けて各ピクセルの中にあ
    る始点の中から1つを当該ピクセルの代表点として選択
    し、各段ピクセルを中間ノードとする四分木を作成し、
    当該四分木の各ノードを広さ優先順に最上段から走査し
    て順序付けされた始点集合を出力することを特徴とする
    請求項13記載の空間データマイニング装置。
  15. 【請求項15】 住所などの空間情報を含むデータベー
    スの中から最適な方位を計算する空間データマイニング
    装置であって、 方位最適化に必要な目的関数を入力する入力手段と、 前記データベースにおける始点集合データおよび質問点
    集合データに基づいて、始点から特定方向を0度とする
    角度を用いて質問点の位置する方位を含む中間テーブル
    を生成する中間テーブル生成手段と、 前記中間テーブル生成手段によって生成された前記中間
    テーブルに基づいて前記入力手段により入力された前記
    目的関数の値を最適化する方位を計算する最適方位計算
    手段とを備えたことを特徴とする空間データマイニング
    装置。
  16. 【請求項16】 前記中間テーブル生成手段は、 前記データベースにおける始点集合データからボロノイ
    図を作成するボロノイ図作成手段と、 前記ボロノイ図作成手段によって作成された前記ボロノ
    イ図と前記データベースにおける質問点集合データとに
    基づいて各始点と各質問点との距離を計算する距離計算
    手段と、 前記距離計算手段により計算された距離の中から、指定
    された上限距離以内の質問点の前記始点からの方位を計
    算して前記中間テーブルのレコードとする方位計算手段
    と、 調べたい目的関数から最適化関数を選択して方位区間毎
    に最適値に必要なレコード値を前記レコードから集計す
    る方位別計算手段とを含むことを特徴とする請求項15
    記載の空間データマイニング装置。
  17. 【請求項17】 住所などの空間情報を含むデータベー
    スの中から最適な距離または方位を計算して出力する空
    間データマイニング装置であって、 分析業務に要求される距離自体および方位自体が与えら
    れていない目的関数を入力する入力手段と、 前記データベースにおける始点集合データおよび質問点
    集合データに基づいて始点と質問点との距離または方位
    を求めると共に、前記目的関数の値を最適化する最適距
    離または最適方位を計算する最適距離・方位計算手段
    と、 前記最適距離・方位計算手段により計算された最適距離
    または最適方位を地理情報システムの画面上に表示する
    表示手段とを備えたことを特徴とする空間データマイニ
    ング装置。
  18. 【請求項18】 前記表示手段は、前記最適距離・方位
    計算手段により計算された最適距離を各始点を中心とす
    る円形領域にて表示することを特徴とする請求項17記
    載の空間データマイニング装置。
  19. 【請求項19】 前記表示手段は、前記最適距離・方位
    計算手段により計算された最適方位を各始点からの扇形
    領域にて表示することを特徴とする請求項17記載の空
    間データマイニング装置。
  20. 【請求項20】 住所などの空間情報を含むデータベー
    スの中から空間的な法則を導き出す空間データマイニン
    グ装置であって、 前記データベースから始点または始点群を与える始点付
    与手段と、 前記空間的な法則を導き出すために調べる目的関数を定
    義する目的関数定義手段と、 前記目的関数定義手段により定義された前記目的関数を
    最適化するような前記始点または前記始点群からの距離
    区間を算出する距離区間算出手段とを含むことを特徴と
    する空間データマイニング装置。
  21. 【請求項21】 住所などの空間情報を含むデータベー
    スの中から空間的な法則を導き出す空間データマイニン
    グ装置であって、 前記データベースから始点または始点群を与える始点付
    与手段と、 前記始点付与手段により与えられた前記始点または前記
    始点群から方位を定義する方位定義手段と、 前記空間的な法則を導き出すために調べる目的関数を定
    義する目的関数定義手段と、 前記目的関数定義手段により定義された前記目的関数を
    最適化するような前記 始点または前記始点群からの方位区間を算出する方位区
    間算出手段とを含むことを特徴とする空間データマイニ
    ング装置。
  22. 【請求項22】 空間情報を含むデータベースの中から
    方位に関する空間的な法則を導き出すためのデータテー
    ブルを生成する空間データマイニング装置であって、 前記データベースから始点の集合および質問点の集合を
    与える始点/質問点付与手段と、 前記始点/質問点付与手段により付与された前記始点の
    集合と前記質問点の集合との距離の上限を指定する距離
    上限指定手段と、 前記質問点に対して前記始点との距離を計算する距離計
    算手段と、 前記距離計算手段により計算された前記始点との距離が
    前記距離上限指定手段により指定された前記上限に含ま
    れる質問点に対して、当該始点との角度を計算する角度
    計算手段と、 前記角度計算手段により計算された前記始点との角度を
    用いてデータテーブルを生成するデータテーブル生成手
    段とを含むことを特徴とする空間データマイニング装
    置。
  23. 【請求項23】 距離自体および方位自体が与えられて
    いない目的関数に基づいて住所などの空間情報を含むデ
    ータベースの中から空間的な法則を導き出すプログラム
    を格納した記憶媒体であって、 前記プログラムは、前記データベースから始点または始
    点群を与えるステップと、与えられた前記始点または前
    記始点群からの距離または方位を定義するステップと、
    調べたい目的関数を定義するステップと、定義された前
    記目的関数を最適化するような、前記始点または前記始
    点群からの距離区間または方位区間を算出するステップ
    とを含むことを特徴とする記憶媒体。
JP2000135928A 2000-05-09 2000-05-09 空間データマイニング装置 Expired - Fee Related JP3659318B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000135928A JP3659318B2 (ja) 2000-05-09 2000-05-09 空間データマイニング装置
US09/825,013 US7024402B2 (en) 2000-05-09 2001-04-03 Spatial data mining method, spatial data mining apparatus and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000135928A JP3659318B2 (ja) 2000-05-09 2000-05-09 空間データマイニング装置

Publications (2)

Publication Number Publication Date
JP2001318938A true JP2001318938A (ja) 2001-11-16
JP3659318B2 JP3659318B2 (ja) 2005-06-15

Family

ID=18643946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000135928A Expired - Fee Related JP3659318B2 (ja) 2000-05-09 2000-05-09 空間データマイニング装置

Country Status (2)

Country Link
US (1) US7024402B2 (ja)
JP (1) JP3659318B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126757A (ja) * 2002-09-30 2004-04-22 Toshiba Corp データ予測装置、データ予測方法およびデータ予測プログラム
JP2004126780A (ja) * 2002-09-30 2004-04-22 Toshiba Corp 分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラム
WO2006059629A1 (ja) * 2004-11-30 2006-06-08 Hewlett-Packard Development Company, L.P. エリア情報の管理装置・方法・プログラム
US7173632B2 (en) 2002-09-05 2007-02-06 International Business Machines Corporation Information display
US7240063B2 (en) 2000-01-27 2007-07-03 Hitachi, Ltd. System for getting conversion rules
JP2020009225A (ja) * 2018-07-10 2020-01-16 古野電気株式会社 グラフ生成装置
CN113516903A (zh) * 2021-05-11 2021-10-19 中钢集团马鞍山矿山研究总院股份有限公司 面向智能矿山场景的数字孪生演化机理及方法

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6385312B1 (en) * 1993-02-22 2002-05-07 Murex Securities, Ltd. Automatic routing and information system for telephonic services
JP3629514B2 (ja) * 2000-05-24 2005-03-16 インターナショナル・ビジネス・マシーンズ・コーポレーション 領域算出方法、空間データマイニング装置、地図情報表示装置、空間データマイニングシステム、および記憶媒体
US7447687B2 (en) * 2002-05-10 2008-11-04 International Business Machines Corporation Methods to browse database query information
US6947929B2 (en) * 2002-05-10 2005-09-20 International Business Machines Corporation Systems, methods and computer program products to determine useful relationships and dimensions of a database
US7716167B2 (en) * 2002-12-18 2010-05-11 International Business Machines Corporation System and method for automatically building an OLAP model in a relational database
US7953694B2 (en) * 2003-01-13 2011-05-31 International Business Machines Corporation Method, system, and program for specifying multidimensional calculations for a relational OLAP engine
US7895191B2 (en) 2003-04-09 2011-02-22 International Business Machines Corporation Improving performance of database queries
US7720993B2 (en) * 2003-12-17 2010-05-18 Palo Alto Research Center Incorporated Information driven routing in ad hoc sensor networks
US7707143B2 (en) * 2004-06-14 2010-04-27 International Business Machines Corporation Systems, methods, and computer program products that automatically discover metadata objects and generate multidimensional models
US20050283494A1 (en) * 2004-06-22 2005-12-22 International Business Machines Corporation Visualizing and manipulating multidimensional OLAP models graphically
US7480663B2 (en) * 2004-06-22 2009-01-20 International Business Machines Corporation Model based optimization with focus regions
US7512626B2 (en) * 2005-07-05 2009-03-31 International Business Machines Corporation System and method for selecting a data mining modeling algorithm for data mining applications
US7761350B1 (en) * 2006-04-26 2010-07-20 Aol Inc. Biasing of search result clustering to ensure more effective point of interest (POI) targeting
US7853596B2 (en) * 2007-06-21 2010-12-14 Microsoft Corporation Mining geographic knowledge using a location aware topic model
JP5050815B2 (ja) * 2007-11-30 2012-10-17 アイシン・エィ・ダブリュ株式会社 施設情報出力装置、施設情報出力方法、施設情報出力プログラム
US8819065B2 (en) * 2011-07-08 2014-08-26 International Business Machines Corporation Mining generalized spatial association rule
TWI503041B (zh) * 2013-10-17 2015-10-01 Chunghwa Telecom Co Ltd Applied to Cellular Cellular Exploration Methods for Cellular Mobile Networks
US10339107B2 (en) * 2015-06-08 2019-07-02 International Business Machines Corporation Multi-level colocation and processing of spatial data on MapReduce
US10817800B2 (en) 2016-01-20 2020-10-27 Robert Bosch Gmbh Value addition dependent data mining techniques for assembly lines
US11282152B2 (en) 2016-08-22 2022-03-22 Adp, Inc. Real property valuation system using traffic flow information
CN110825788A (zh) * 2019-11-07 2020-02-21 成都康赛信息技术有限公司 基于数据质量检测规则挖掘结果的规则约简方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6282489B1 (en) * 1993-05-28 2001-08-28 Mapquest.Com, Inc. Methods and apparatus for displaying a travel route and generating a list of places of interest located near the travel route
DE4317831C1 (de) * 1993-05-28 1994-07-07 Daimler Benz Ag Display zur Anzeige der Gefahrenträchtigkeit der momentanen Fahrsituation eines Kraftfahrzeugs
US5644656A (en) * 1994-06-07 1997-07-01 Massachusetts Institute Of Technology Method and apparatus for automated text recognition
KR100271469B1 (ko) * 1997-02-25 2001-01-15 이민화 초음파스캔시스템의 디지탈스캔컨버터
FR2780529B1 (fr) * 1998-06-30 2000-08-04 Bull Sa Procede pour l'optimisation des acces a une base de donnees
US6178380B1 (en) * 1998-10-22 2001-01-23 Magellan, Dis, Inc. Street identification for a map zoom of a navigation system
FI106823B (fi) * 1998-10-23 2001-04-12 Nokia Mobile Phones Ltd Tiedonhakujärjestelmä
US6397208B1 (en) * 1999-01-19 2002-05-28 Microsoft Corporation System and method for locating real estate in the context of points-of-interest
US6381605B1 (en) * 1999-05-29 2002-04-30 Oracle Corporation Heirarchical indexing of multi-attribute data by sorting, dividing and storing subsets
US6366851B1 (en) * 1999-10-25 2002-04-02 Navigation Technologies Corp. Method and system for automatic centerline adjustment of shape point data for a geographic database

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240063B2 (en) 2000-01-27 2007-07-03 Hitachi, Ltd. System for getting conversion rules
US7173632B2 (en) 2002-09-05 2007-02-06 International Business Machines Corporation Information display
JP2004126757A (ja) * 2002-09-30 2004-04-22 Toshiba Corp データ予測装置、データ予測方法およびデータ予測プログラム
JP2004126780A (ja) * 2002-09-30 2004-04-22 Toshiba Corp 分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラム
WO2006059629A1 (ja) * 2004-11-30 2006-06-08 Hewlett-Packard Development Company, L.P. エリア情報の管理装置・方法・プログラム
US7619913B2 (en) 2004-11-30 2009-11-17 Hewlett-Packard Development Company, L.P. Device, method and program for managing area information
JP2020009225A (ja) * 2018-07-10 2020-01-16 古野電気株式会社 グラフ生成装置
JP7195073B2 (ja) 2018-07-10 2022-12-23 古野電気株式会社 グラフ生成装置
CN113516903A (zh) * 2021-05-11 2021-10-19 中钢集团马鞍山矿山研究总院股份有限公司 面向智能矿山场景的数字孪生演化机理及方法

Also Published As

Publication number Publication date
US7024402B2 (en) 2006-04-04
US20010051947A1 (en) 2001-12-13
JP3659318B2 (ja) 2005-06-15

Similar Documents

Publication Publication Date Title
JP2001318938A (ja) 空間データマイニング方法、空間データマイニング装置、および記憶媒体
JP6436909B2 (ja) スケッチからの画像
JP3989339B2 (ja) 情報表示システム、情報表示方法、該情報表示方法を実行させるためのプログラム、該プログラムを記録したコンピュータ可読な記憶媒体、サーバ制御方法、該サーバ制御方法を実行させるためのプログラム、該プログラムを記録したコンピュータ可読な記憶媒体および情報表示のためのグラフィカル・ユーザ・インタフェイス・システム
US8234264B2 (en) System and method for preferred services in nomadic environments
US11720606B1 (en) Automated geospatial data analysis
JPH11282878A (ja) 関連情報検索装置及びプログラム記録媒体
CN113434623A (zh) 一种基于多源异构空间规划数据的融合方法
JP2001337956A (ja) 領域算出方法、空間データマイニング装置、地図情報表示装置、空間データマイニングシステム、および記憶媒体
KR102249466B1 (ko) 인공지능 추천 모델을 사용하여 추천 정보를 제공하는 데이터 카탈로그 제공 방법 및 시스템
CN112819544A (zh) 基于大数据的广告投放方法、装置、设备及存储介质
CN116701771B (zh) 一种基于云计算的数字图书馆检索与资源共享系统
CN107341221B (zh) 索引结构的建立、关联检索方法、装置、设备及存储介质
JP2019185394A (ja) データカタログ自動生成システム及びその自動生成方法
Xu et al. Continuous k nearest neighbor queries over large multi-attribute trajectories: a systematic approach
CN114820960B (zh) 构建图谱的方法、装置、设备和介质
US20180011934A1 (en) Identifying spatial records
JPH0477869A (ja) データベースシステムのマルチメデイアデータ処理方法
CN115329221B (zh) 一种针对多源地理实体的查询方法及查询系统
Alrebdi et al. Using Visualization Methods for Improving Web Navigation
Sham et al. Cluster based Indexing for Spatial Analysis on Read-only Database
Tao Geospatial data analysis: from querying to visualized exploration
Goldner et al. Using Industry-based Spatio-Temporal Database to Store and Retrieve Big Trafc Data
Hu et al. Intelligent Question-Answering System for Famous Towns and Villages Based on Knowledge Graph
CN116263799A (zh) 一种基于r树的推荐方法及装置
CN113127439A (zh) 一种物流大数据平台

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040422

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040922

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050222

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20050223

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050308

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090325

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100325

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110325

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110325

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120325

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130325

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140325

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees