WO2020031296A1

WO2020031296A1 - 地図データ処理装置

Info

Publication number: WO2020031296A1
Application number: PCT/JP2018/029793
Authority: WO
Inventors: 威郎坂入
Original assignee: 三菱電機株式会社
Priority date: 2018-08-08
Filing date: 2018-08-08
Publication date: 2020-02-13
Also published as: JP6472589B1; JPWO2020031296A1

Abstract

本発明は地図データ処理装置に関し、地物の属性データを含む地図データにおいて、属性データが欠落しているデータ欠落地域の地図データを補完する地図データ処理装置であって、複数の地域を検索して、データ欠落地域と類似する類似地域を取得する類似地域検索部と、類似地域の地図データに基づいて、データ欠落地域の地図データにおける欠落データを補完した補完済み地図データを生成する補完データ構築部と、補完済み地図データを含む前記地図データに基づいて分析を行うデータ分析部と、データ分析部における補完済み地図データに基づいた分析結果の適否を判定する整合性判定部と、整合性判定部による判定結果が適正である場合は、補完済み地図データを出力するデータ出力部と、を備えている。

Description

地図データ処理装置

　本発明は地図データ処理装置に関し、特に、地図データを用いて地域分析などを行う地図データ処理装置に関する。

　自治体、小売業者および配送業者などの事業体においては、地図データは各種計画立案、事業評価などの様々な業務で利用されている。例えば、自治体では地図データを用いて地域分析などを行って都市計画を立案し、小売業者では店舗の出店計画などを立案する。

　このような、地図データは、道路、建物などの地図を構成する地物の集合で構成されている。そして、地物は、その形状を緯度、経度などの座標列で表現する幾何情報と、道路名、施工年など当該地物の特性を示す属性情報、さらには地物どうし位置関係を示す位相情報で構成されている。

　詳細な地図データを作成するには、個々の地物の幾何および属性をきめ細かく調査する必要があり、時間および費用などのコストを多く必要とする。一般的に規模の小さい自治体および小売業者などが、地図データを用いて高サービスの業務を遂行するためには、広域かつ詳細な地図データが必要になる場合があるが、コスト面から対象地域全域の地図データが整備されず、優先度の高い地域の地図データのみを作成することにより、地図データの一部が欠落してしまうといった課題がある。

　地図データが欠落している場合において、欠落したデータを補完するために、例えば、特許文献１に開示される地図情報表示処理装置では、ディスプレイ画面で地図を拡大表示する際に、詳細な地図情報を有さないエリアでも見栄えを落とすことなく表示するために、詳細度が低い(小縮尺の)地図情報を用いて補完表示する技術が開示されている。

　また、特許文献２では、走行制御に必要な路面画像情報が欠損しているような場合、過去に蓄積した周辺の画像情報から、類似する画像特徴を取得し、欠損部分を補完する技術が開示されている。

特開平１０－２９３５３４号公報特開２０１６－１２６６０５号公報

　以上説明したように、特許文献１においては、地図情報の欠損している部分を、より詳細度が低い地図情報を用いて補完する技術が開示され、特許文献２においては、画像情報の欠損している部分を、周辺の類似する画像情報を用いて補完する技術が開示されているだけであり、地図データを用いて地域分析などを行うのに必要な属性情報まで補完する技術は開示されていない。

　本発明は上記のような問題を解決するためになされたものであり、地域分析などを行うのに必要な属性情報まで補完することができる地図データ処理装置を提供することを目的とする。

　本発明に係る地図データ処理装置は、地物の属性データを含む地図データにおいて、前記属性データが欠落しているデータ欠落地域の地図データを補完する地図データ処理装置であって、複数の地域を検索して、前記データ欠落地域と類似する類似地域を取得する類似地域検索部と、前記類似地域の地図データに基づいて、前記データ欠落地域の地図データにおける欠落データを補完した補完済み地図データを生成する補完データ構築部と、前記補完済み地図データを含む前記地図データに基づいて分析を行うデータ分析部と、前記データ分析部における前記補完済み地図データに基づいた分析結果の適否を判定する整合性判定部と、前記整合性判定部による判定結果が適正である場合は、前記補完済み地図データを出力するデータ出力部と、を備えている。

　上記の地図データ処理装置によれば、地域分析等に用いる属性データが欠落したデータ欠落地域があった場合でも、類似地域の地図データを用いて欠落データを補完するので、データ分析部での分析を実行することができる。

本発明に係る実施の形態１の地図データ処理装置の構成を示すブロック図である。本発明に係る実施の形態１の地図データ処理装置のハードウェア構成を示すブロック図である。地図データの構成を示す図である。幾何形状の種類を示す図である。地物の幾何情報の構成を示す図である。地物の位相情報の構成を示す図である。地物の属性情報の構成を示す図である。補完データの構成を示す図である。欠落データを示す図である。本発明に係る実施の形態１の地図データ処理装置の全体処理を説明するフローチャートである。類似地域検索部における類似地域検索処理を説明するフローチャートである。補完データ構築部における補完データ構築処理を説明するフローチャートである。本発明に係る実施の形態２における地図上にメッシュを重畳した図である。本発明に係る実施の形態３における補完データの保存を説明する図である。

　＜実施の形態１＞
　図１は、本発明に係る実施の形態１の地図データ処理装置１の構成を示す機能ブロック図である。図１に示されるように、地図データ処理装置１は、類似地域検索部２、補完データ構築部３、データ分析部４、整合性判定部５およびデータ出力部６を備えている。

　図２は、地図データ処理装置１のハードウェア構成の一例を示すブロック図である。図２に示される地図データ処理装置１は、例えば、パーソナルコンピュータ（パソコン）、スマートフォン、携帯電話およびＰＤＡ（Personal Digital Assistantなどの情報端末装置に組み込まれ、当該情報端末装置のハードウェアにより各機能が実現される。

　図２に示す外部記憶装置２０６には、類似地域検索部２で用いる地図データベースなどのデータベース、当該データベースにアクセスするデータアクセスプログラム、地図データを用いて所望の機能を実行するためのアプリケーションプログラム、アプリケーション処理で利用されるデータなどが記憶（格納）される。データアクセスプログラム、アプリケーションプログラムなどのプログラムは、外部記憶装置２０６からメモリ２０５上に展開されて、ＣＰＵ（Central Processing Unit）２０４で実行される。

　アプリケーションプログラムは、地図データ処理装置１で実行される各種の機能を実現するためのプログラムであり、例えば、類似地域検索部２で実行される、類似地域検索部２で検索された類似地域と、データ欠落地域とを比較し、類似度を評価する機能を実現する。

　データアクセスプログラムは、データベースにアクセスして、当該データベースから、アプリケーションプログラムの実行に必要な情報を取得するためのプログラムである。このデータアクセスプログラムが実行されることにより、外部記憶装置で管理されている地図データベースから必要な地図データを取得することで、類似地域検索部２の機能が実現される。

　外部記憶装置２０６は、地図データ処理装置１が組み込まれたハードディスク装置（ＨＤＤ）、ドライブ装置で再生可能なＣＤ（Compact Disc）およびＤＶＤ（Digital Versatile Disk）などの外部記憶メディア、所定の入出力インターフェースを介してデータ読み書きが可能なＵＳＢ（Universal Serial Bus）メモリ等に構築することができる。

　ＣＰＵ２０４による演算結果は、バスを介して表示装置２０２に出力されて画面表示される。表示装置２０２は、ＣＲＴモニター、液晶ディスプレイ、プラズマディスプレイ等により実現される。

　通信装置２０３は、図示しない外部装置と通信を行い、ＧＰＳ（Global Positioning System）衛星からのＧＰＳ信号およびＦＭ電波を受信する場合、インターネットまたはイントラネットを介して接続された外部のサーバシステムで管理されている外部情報との通信を行う場合に利用される。

　入力装置２０１は、外部からの操作入力を受け付ける装置であり、キーボード、マウス、操作スイッチおよび表示装置２０２に組み込まれたタッチパネルで実現される。

　以上説明したハードウェア構成により、図１の地図データ処理装置１の各機能が実現される。例えば、図１の類似地域検索部２、補完データ構築部３、データ分析部４および整合性判定部５は、図２のＣＰＵ２０４が外部記憶装置２０６からメモリ２０５上に展開されたプログラムを実行することにより実現される。

　なお、地図データ処理装置１の構成要素は、上述したような１台の情報端末装置で構成される場合の他、インターネットおよびイントラネットなどのネットワーク上に別々の情報端末装置に分けて構成しても良い。例えば、処理負荷の高い類似地域検索部２を複数台の情報端末装置に分散して処理を行う構成を採っても良い。

　ここで、図１のブロック図の説明に戻り、地図データ処理装置１の各機能について説明する。類似地域検索部２は、複数の地域のそれぞれの地図データを検索して、データ欠落地域と同様の特徴を有する、すなわち類似する類似地域を取得する。類似地域を探すために、データ欠落地域の地図データも使用する。

　類似地域検索部２で使用する地図データは、地図を構成する地物の種類（レイヤ）ごとに分類して管理され、さらにデータアクセスしやすいように、矩形単位で分割、または空間インデックスを付与して管理されている。当該地図データは、図２に示す外部記憶装置２０６に記憶されている。

　地図データは、何を主題とするかによって、地図の幾何情報および属性情報の詳細度および構成が異なる。例えば、防犯計画のために犯罪が起こりやすい地域を推定するシミュレーションを行う場合は、昼間人口比、最寄り駅までの距離（最寄り駅距離）、都心までの時間距離（都心時間距離）、道路面積率、商住面積比および持ち家率など、一般的な市販地図には含まれていない属性情報（属性データ）が必要となる。

　類似地域検索部２では、例えば、人口、面積、主要産業、緑地率などの属性情報が格納された地図データに基づいて、統計学的な分析手法を用いて特徴量を定量的に表現し、その値の大きさによって類似性を判定して類似地域を取得する。主な分析手法としては、多変量解析が挙げられる。多変量解析は、互いに関係のある複数の変数を用いてある事象の要約や予測を行う統計手法であり、重回帰分析、数量化分析、クラスタ分析などが一例として挙げられる。重回帰分析は、定量的に表される複数の変数からある１つの変数を予測する手法であり、数量化分析では、変数のデータ形態が定性か定量かで数量化１類、数量化２類および数量化３類の何れかの分析手法を使用し、クラスタ分析は、異なる性質を持つものの集団から、互いに類似した性質を持つものどうしでグルーピングするような分析方法である。

　それぞれの分析方法には特徴があり、用いるデータによって分析の向き、不向きがあるため、同じデータを用いたとしても結果が異なる場合がある。類似性の判定は、例えば、各分析方法で得られたカテゴリスコア、サンプルスコアなどの値が近いものであれば、類似していると判定することができる。

　また、類似地域検索部２では、欠落している属性データ（欠落データ）以外の属性情報を用いて、類似地域を検索することも可能である。すなわち、類似地域検索部２は、地図データ処理装置１が具備するＣＲＴモニターまたは液晶ディスプレイなどの表示装置２０２（図２）を介して、ユーザがデータ欠落地域を選択し、どの地図データを使って類似地域を検索するかなどの設定が可能である。地域および地図データの選択は、マウスおよびキーボードなどのユーザインターフェースである入力装置２０１（図２）を用いて行う。

　また、類似地域検索部２では、複数の検索パターンで類似地域を検索することも想定される。その場合、結果として算出された類似地域の地図データに基づいて、補完データ構築部３がデータ欠落地域の欠落データを補完した補完データ（補完済み地図データ）を生成する。この補完データは、検索パターンごとにタグ付けされて、データ出力部６から出力される。このタグとしては、属性名が用いられる。

　複数の検索パターンの一例としては、例えば、世帯当たり人員、人口密度、地区容積率の３つの指標で類似地域を算出する検索パターン１と、昼間人口比、都心までの時間距離、持ち家率の３つの指標で類似地域を算出する検索パターン２とを挙げることができる。検索パターン１は、住宅密集の観点から見たパターンであり、検索パターン２は、ベッドタウン的な性質から見た検索パターンと言える。

　このような場合、タグとしては、例えば、検索パターン１には「住宅密集地」、検索パターン２には「ベッドタウン」などを使用することで、補完データがどのような観点から算出されているかをイメージすることが可能となり、また、ユーザは検索パターンごとに地域分析の結果を比較することができる。

　補完データ構築部３は、類似地域検索部２で検索された類似地域の地図データに基づいて補完データを生成する。補完データの生成においては、データ欠落地域の地図データと類似地域の地図データとを比較し、２つの地図データの差に応じて類似地域の地図データを補正し、補完データとしても良い。例えば、類似地域検索部２で使用した統計手法により得られた類似度の差を用いて補完データを作成する方法が考えられる。

　すなわち、Ｂ市が欠落地域であり、一般的な統計データである国勢調査などの全国一律で整備されているデータを使って類似地域を算出する場合、Ａ市の面積が２０ｋｍ^２、Ｂ市の面積が４０ｋｍ^２であった場合、都市の成長力の観点からＡ市が類似地域として算出されたと仮定する。この場合、Ｂ市に対してＡ市は８０％類似しているという結果が得られてものとする。例えば、都市の成長力を示す間接的な指標として、年間の道路工事総延長という指標を用いると、Ａ市は５０ｋｍ、Ｂ市のそれは欠落している場合、Ｂ市の面積はＡ市の２倍であるので、単純に面積比でＢ市の年間の道路工事総延長を補完すると、１００ｋｍとなる。しかし、Ａ市の類似度は８０％であるため、類似度１００％に対して２０％分の誤差があるものとして、Ｂ市の道路工事総延長は８０ｋｍ～１２０ｋｍ（±２０ｋｍ）として補完することができる。

　その他、類似地域とデータ欠落地域との両方が持っている地図データを用いて、両者の地図データの比率から補完データを導出する方法も考えられる。例えば犯罪発生率を表現する説明変数の集合において、Ａ市とＢ市の両方が持っている指標のみで類似地域を算出することも考えられる。この場合も、類似性を示す比率から補完データを導出する点については同じである。

　データ分析部４は、補完データ構築部３で生成された補完データも含めて、外部記憶装置２０６に記憶された地図データを用いて、シミュレーションおよび統計分析などの地域分析を行う。どのような分析を実施するかはユーザが決定し、データ分析部４はユーザが決定した分析を実行する。この際、ユーザは、地図データにデータ欠落地域が含まれ、それを補完した補完データを使用していることなどは意識することなく、分析を実行させることができる。

　データ分析部４での分析結果は、地図データ処理装置１が具備するＣＲＴモニターまたは液晶ディスプレイなどの表示装置２０２を介してユーザに提示される。

　整合性判定部５は、データ分析部４での分析結果の適否を判定する。補完データが正しく生成されなかった場合、データ分析部４での分析結果が予期したものとは大きく外れることが想定され、分析結果と予め想定した想定値との差に基づいて分析結果の適否を判定する。例えば、補完データに基づいて求めたＡ市の犯罪発生率が、想定値であるＡ市の隣のＢ市の犯罪発生率の１００倍となった場合は、分析結果が不適切であると判定される。

　また、ある年度の地図データのみが欠落している場合、補完データがその前後の年度の地図データの傾向と異なっていれば、それは補完データが正しく生成されていないと判定することができる。

　なお、分析結果の適否の判定に替えて、補完データの適否を判定するようにしても良い。補完データが正しいか否かは、例えば、複数の検索パターンで類似地域を検索する方法で得られた補完データどうしを比較することで判定することができる。例えば、補完データのズレが±１０％以内に収まっていれば、正しく補完できていると判定することができる。また、分析結果をユーザが判断し、その傾向に基づいて補完精度を向上させることも考えられる。

　データ出力部６は、補完データ構築部３で生成され、整合性判定部５で正しいと判断された補完データを、外部記憶装置２０６などの記憶媒体に出力する機能を有している。このように補完データを出力することで、再度この補完データを用いる必要性が生じた場合に再利用することができる。補完データは、それが補完データあることを明示するフラグを付与し、既存の地図データベースに格納される。

　また、補完データおよび地図データを地図データ処理装置１とは別個の外部記憶装置２０６に保存することで、補完データおよび地図データを地図データ処理装置１以外の分析装置でも使用することが可能となる。

　　＜地図データ＞
　図３は、地図データの構成の一例を示す図である。地図データは、リレーショナルデータベースおよびファイルシステムなどを用いて管理される。以下では、このうちリレーショナルデータベースを用いて地図データを管理する地図データベース２０（以下「地図ＤＢ２０」と記す）を例にして地図データの構成を説明する。

　地図データベースＤＢ２０は、以下に示すデータ構造に基づき、地図データを管理している。すなわち、地図ＤＢ２０は、地図データの構成要素である地物２１の集合であり、地物２１は、幾何情報３１、属性情報４１および位相情報５１の組み合わせで構成されている。幾何情報３１は、地物の形状を表現するための緯度および経度などの座標による位置情報を配列した情報である。属性情報４１は、地物の特徴を示す情報である。位相情報５１は、地物どうしのつながりを示す情報である。

　これらの情報は組み合わせることが可能である。例えば、道路ネットワークを示す場合は、位相情報５１と属性情報４１、道路形状を示す場合は、幾何情報３１と属性情報４１などのように組みあわせて利用される。幾何情報３１と位相情報５１との組み合わせでは、それぞれの情報が配列として管理され、それぞれ属性情報４１と関連付けられる。以下、幾何情報３１と属性情報４１との関連付けについて説明する。なお、位相情報５１と属性情報４１との関連付けについても同様である。

　図４は、幾何情報３１に示される主な幾何形状の種類（幾何種別３１ａ）の一例を示す図である。幾何種別３１ａには、例えば、市区町村名および地名の代表点などを表現するポイント（点）データと、川、バス路線、等高線などの線を表現するポリライン（線）データと、家形図、公園、湖沼などの閉空間を表現するポリゴン（面）データなどが含まれる。また、これらの特徴を表現する属性情報４１として、例えば道路の場合、国道、県道、市町村道などの道路種別、道路幅、道路名称などが定義される。

　図５は、複数の地物の幾何情報３１の構成の一例を示す図である。図５に示すように、幾何情報３１は、幾何種別３１ａだけでなく、地物の形を構成する座標点の配列（座標配列）、地物を一意に識別する地物ＩＤなども合わせて管理される場合がある。座標点は、緯度、経度および平面直角座標系などで定義された数値情報で表現される。なお、地図データ（地図情報）の特徴によっては、セキュリティ面から座標値の配列に対して暗号化、圧縮化が行われている場合もある。

　図６は、位相情報５１の構成の一例を示す図である。図６に示すように、位相情報５１は、地物どうしのつながりを示す情報であり、例えばノード１およびリンク１などによって表現される。位相情報５１は、道路ネットワークおよび鉄道ネットワークなどのネットワークのデータを管理する。ノードは、交差点などのネットワークを構成する結節点であり、始点、終点などを表現し、リンクは、ノードとノードとの間をつなぐ線などの要素である。

　図７は、複数の地物の属性情報を格納するテーブル構造６１の一例を示す図である。テーブル構造６１は、例えば、対象となる地物を一意に識別する地物ＩＤと、当該地物の特徴を示した複数種類の属性情報とで構成される。例えば、地物が道路である場合には、その属性情報として、国道、県道、市町村道などの道路種別、道路幅、道路名称などが定義される。属性値の種類としては、数値、文字列、画像など、地物を特徴付ける各種情報から構成される。複数の地物に対する属性情報の集合は、属性情報リストとなる。

　図８は、補完データが格納された地図データの属性情報のテーブル構造の一例を示す図である。図８に示すように、テーブル構造７１は、データ欠落地域を含むエリアの地図データの属性情報と、それが補完データであるか否かを示す補完データフラグで構成されている。例えば、ＩＤ２は、属性情報Ａｔｔｒ５が欠落しているデータ欠落地域であり、属性情報Ａｔｔｒ５は補完データ構築部３で生成された補完データであり、それが補完データであることを示す補完データフラグがＴｒｕｅとなっている。一方、ＩＤ１は、属性情報Ａｔｔｒ５が欠落しているデータ欠落地域ではなく、Ａｔｔｒ５を保持しているため、補完データフラグがＦａｌｓｅとなっている。

　なお、図８に示すテーブル構造７１は、地図データ処理装置１が具備する地図データベース２０の中で管理される。このように、地図データベース２０の中で補完データも管理することで、ハードウェアコストを抑制できる。

　図９は、欠落データの一例を示す図である。図９においては、類似地域検索部２で算出された類似地域８１としてＡ市、Ｂ市およびＣ市が示されている。図中のデータ項目は、犯罪発生シミュレーションに用いるものであり、東京近郊の都市を想定し、世帯当たり人員、人口密度、昼間人口比、最寄り駅距離、都心時間距離、道路面積率、商住面積比、地区建ぺい率、地区容積率、持ち家率、公営公団率および民営借家率などの説明変数（ｘ_ｎ）であり、これらに基づいて被説明変数（従属変数）である犯罪発生率（ｙ）を算出する。

　ここで、昼間人口比は、人口に対する昼間人口の比率（昼間人口／人口）で規定され、最寄り駅距離は、町（市）の中心点を起点とする駅までの距離で規定され、都心時間距離は、山手線から最寄り駅までの電車所要時間で規定され、道路面積率は、町面積に対する道路面積の比率（道路面積／町面積）で規定され、商住面積比は、住宅用地面積に対する商業用地面積の比率（商業用地面積／住宅用地面積）で規定される。地区建ぺい率は、町面積に対する建物面積の比率（建物面積／町面積）で規定され、地区容積率は、町面積に対する建物面積×建物階数の比率（（建物面積×建物階数）／町丁面積）で規定される。

　犯罪発生率（ｙ）と説明変数（ｘ_ｎ）との関係式を以下の数式（１）で表す。

　ｙ＝ｘ_１β_１＋ｘ_２β_２＋ｘ_３β_３＋ｘ_４β_４＋ｘ_５β_５＋ｘ_６β_６＋・・・＋ｘ_ｎβ_ｎ・・・（１）
　上記数式（１）は、多変量解析で使用される重回帰分析の回帰式であり、説明変数（ｘ_ｎ）として、図９に表される世帯当たり人員、人口密度、昼間人口比などを使用し、各説明変数の係数（β_ｎ）は、偏回帰係数である。

　図９に示されるように、Ａ市は、犯罪発生率を算出するために必要な説明変数が全て○印であり、データを全て有している。一方、Ｂ市は道路面積率、持ち家率、公営公団率および民営借家率が×印であり、これらのデータが欠落している。またＣ市は、商住面積比、地区建ぺい率、地区容積率が×印であり、これらのデータが欠落している。

　この場合、Ｂ市において、上記数式（１）から犯罪発生率を算出するために、欠落している道路面積率、持ち家率、公営公団率および民営借家率のデータを補完するために、補完データ構築部３が、Ａ市のデータに基づいて補完データを作成する。また、Ｃ市において欠落しているデータについても同様にＡ市のデータに基づいて補完データを作成する。

　上記のように、Ｂ市およびＣ市においては欠落データを有しているが、類似地域検索部２における類似地域検索処理では、与えられた全ての説明変数を使って類似地域を算出するものではなく、まず、どの視点から類似地域を算出するかを決め、類似性を判断する指標としてふさわしい説明変数を選出し、それを用いて類似地域を算出するものであり、Ｂ市およびＣ市において欠落データがあっても、それらを使用しなければ、類似地域検索処理は実行できる。例えば、世帯当たり人員、人口密度、昼間人口比などを選出すれば、類似性を判断に支障はない。

　次に、図１０に示すフローチャートを用いて、地図データ処理装置１の全体処理について説明する。地図データ処理装置１が動作を開始すると、まず、類似地域検索部２において類似地域検索を実行し、類似地域を出力する（ステップＳ１）。

　次に、補完データ構築部３において、類似地域検索部２から出力された類似地域のうち特定の類似地域を選定し、データ欠落地域の欠落データを補完した補完データを作成する（ステップＳ２）。

　次に、データ分析部４において、補完データ構築部３で作成した補完データを用いて、ユーザによって選択された地域分析を実行する（ステップＳ３）。

　次に、整合性判定部５において、データ分析部４で実行したデータ欠落地域における地域分析の結果の整合性の有無を判定する（ステップＳ４）。地域分析の結果が周辺地域と大きく異なったり、予想とかけ離れたりした場合は、分析結果に整合性なしと（Ｎｏ）として、ステップＳ２の補完データの構築を再度実行し、再構築した補完データを用いて、ステップＳ３の地域分析をやり直す。一方、分析結果に整合性がある場合（Ｙｅｓ）は、ステップＳ５に移行する。

　ステップＳ５では、再度補完データを利用するために、ステップＳ３で生成した補完データをＨＤＤなどの外部記憶装置２０６に出力し、一連の処理を終了する。

　図１１は、図１０に示したステップＳ１の類似地域検索部２における類似地域検索処理を詳細に示したフローチャートである。

　類似地域検索処理を開始すると、まず、データ欠落地域を含み、欠落データを補完するための類似地域を検索する検索対象範囲を設定する（ステップＳ２１）。

　本実施の形態では、都道府県および市区町村などの予め定義された行政区域に基づいてユーザが選択し、類似地域検索の検索対象範囲として設定することを想定している。これにより、行政区域に従った分析を行うことができる。

　また、ユーザが類似地域の検索対象範囲を指定することで、検索にかかる処理コストを抑えることができる。

　次に、ステップＳ２１で設定した検索対象範囲に含まれ、補完データを作成する対象であるデータ欠落地域をユーザが設定する（ステップＳ２２）。データ欠落地域は、上記行政区域などのように予め定義された地域を想定している。

　次に、ステップＳ２２で設定したデータ欠落地域において、補完データを作成する対象である欠落データをユーザが設定する（ステップＳ２３）。ここで設定する欠落データは、複数であっても良い。なお、この処理は、後述する図１２におけるステップＳ３１の前に実行しても良い。

　次に、ステップＳ２１で設定した類似地域を検索する対象範囲から、ステップＳ２２で設定した補完対象であるデータ欠落地域と類似の特徴を有する類似地域を検索するために用いる地域データをユーザが設定する（ステップＳ２４）。ここで用いる地域データとは、例えば地域の地理的特性を示す地形、土地利用、河川、気象、面積などのデータに加え、社会的特性を示す人口、住宅数、過去の災害被害、犯罪発生数などのデータが挙げられる。

　これらは、一般的に整備されている統計情報であり、汎用性が高い情報である。類似地域を検索するためにこれらを用いることで、地域ごとの特徴に基づいた類似地域を算出することができる。

　なお、上述した一般的な統計情報ではなく、データ分析部４で実行される分析で使用されるデータを用いて類似地域を算出しても良い。この場合、分析使用するデータが予め決まっているので、一般的な統計情報を用いる場合のように、設定の手間を省くことができる。

　次に、ステップＳ２４で設定した類似地域を算出するために設定した地域データに基づいて、類似地域検索部２において、多変量解析である重回帰分析、数量化分析、クラスタ分析など、類似性を分析することを特徴とする統計手法を用いて類似地域検索を実行する（ステップＳ２５）。類似地域検索は、類似性を示す定量的な数値（類似度）に基づいて実行される。

　次に、ステップＳ２５で算出した類似度に基づき、類似地域検索部２において、類似度の高い順に類似地域を並べて出力する（ステップＳ２６）。この場合、出力する類似地域数を指定することも可能である。また、類似度の値も併せて出力する。

　図１２は、図１０に示したステップＳ２の補完データ構築部３における補完データ構築処理を詳細に示したフローチャートである。

　補完データ構築処理を開始すると、まず、類似地域検索部２において検索した類似地域の中から、データ欠落地域の補完データを構築するための補完元となる類似地域をユーザが設定する（ステップＳ３１）。このため、類似地域検索部２での検索結果は、表示装置２０２（図２）を介してユーザに提示される。ユーザは、入力装置２０１（図２）を類似地域を選択する。

　この類似地域はデータ欠落地域における欠落データに対応するデータを有していることを前提条件とする。もし、対応するデータが類似地域においても欠落している場合は、その対応するデータを有している別の類似地域を設定する。

　また、ユーザは類似度の値も見ることができるので、ユーザは意図的に補完元となる類似地域を選択することができる。また類似度の値が低い場合は、別の地域データを用いて類似地域の検索をやり直すなどの判断をすることができる。

　なお、類似地域検索部２からは類似度の高い順に類似地域が出力されるので、補完データ構築部３が最初に出力される類似地域を自動的に選択して類似地域としても良い。この場合、最初に出力される類似地域が、データ欠落地域における欠落データに対応するデータを有していない場合は、２番目に出力される類似地域を選択するようにすれば良い。

　次に、ステップＳ３１で設定された類似地域の地図データに基づいて、補完データ構築部３がデータ欠落地域の補完データを生成する（ステップＳ３２）。この際に、類似地域とデータ欠落地域の地域差を考慮した係数を算出し、それを類似地域における補完元となるデータに掛けることで、データ欠落地域の補完データを生成する。この係数は、例えばデータ欠落地域と類似地域の人口比および面積比など、欠落データと相関関係にある地域データを用いることで算出することができる。

　欠落データと相関関係にある地域データを用いて算出した係数を使用して補完データを生成することにより、定量的にデータを補完することができる。

　次に、ステップ３２で生成した補完データに対して補完データ構築部３が補正する処理を行う（ステップＳ３３）。例えば、補完元となる類似地域のデータの作成年が古い場合、現時点でのデータに補正する必要がある。このように補完データを補正する必要がある場合は、本ステップ中で実行する。補完データの補正は、例えば、人口密度であれば、該当地域の人口の増加係数（または減少係数）が判っているような場合は、補完元となる類似地域の人口密度を人口の増加係数（または減少係数）に基づいて現時点でのデータに補正する。

　次に、ステップ３３で補正した補完データを地図データ処理装置１が備えるメモリ２０５（図２）上に一時保管（キャッシュ）する（ステップＳ３４）。キャッシュされた補完データは、データ分析部４でのデータ分析で用いられる。

　このように、補完データに対して補完データ構築部３が補正する処理を行うことで、高度な地域分析で必要となるきめ細かい地図データを得ることができ、都市計画および観光計画で利用される高度なシミュレーションを手軽に行うことができる。また、補完データは、それが補完データあることを明示するフラグが付与されているので、補完データそのものを見ることで、当該地域の現状を把握できる。また、分析結果から欠落データを整備すべきかどうかを判断できる。また、類似地域が判ることで、そこで採用している施策などを参考にすることができる。

　＜実施の形態２＞
　以上説明した実施の形態１では、類似地域検索を行う検索対象範囲およびデータ欠落地域の設定を、都道府県および市区町村などの予め定義された行政区域に基づいてユーザが設定するものとして説明したが、ユーザが任意の範囲を指定して設定するようにしても良い。例えば、ユーザが任意の範囲をマウス等の入力装置２０１（図２）を用いて設定しても良い。

　図１３は、任意の範囲として、地図上に重畳したメッシュの矩形状の１つのメッシュ１０１を指定する例を示している。この図１３中のハッチングを付したメッシュ１０１が指定されたデータ欠落地域であり、メッシュが重畳された領域が類似地域検索を行う指定された検索対象範囲である。

　このメッシュ１０１のデータを補完するために、それ以外の場所のメッシュが重畳された検索対象範囲の地域データを用いて、図１０～図１２を用いて説明した実施の形態１の処理フローに従って、類似地域検索を行い、補完データを構築する。そのために、メッシュごとに地域データを集計する必要がある。メッシュごとに地域データを集計するためには、メッシュが被せられた予め定義された行政区域などが有する地域データを用いる。

　図１３のメッシュ１０１のように、同じメッシュ内に複数の行政区域がまたがっている場合、そのメッシュ内に占める割合に応じて、そこにまたがっている行政区域が有する地域データを補正する。例えば、メッシュ内にＡ市、Ｂ市およびＣ市がまたがっており、それぞれ面積的に６０％、３０％および１０％を占めており、Ａ市、Ｂ市およびＣ市の人口が５万人、３万人および２万人だった場合、メッシュ１０１の人口は、５万人×６０％、３万人×３０％、２万人×１０％の合計値である４．１万人となる。このようにして、各メッシュの地図データを集計し、メッシュが持つ属性値とする。なおこのメッシュ単位の地図データは、実施の形態１で示した地図データベース２０を用いて管理する。

　このように、類似地域検索を行う範囲およびデータ欠落地域を任意の範囲として設定することで、よりきめ細かい地域分析が可能となる。例えば人口集中地区などをメッシュで区切って分析することで、地域の状態をより詳細に把握することができる。

　＜実施の形態３＞
　以上説明した実施の形態１では、地図データ処理装置１のデータ出力部６が出力するデータ欠落地域の補完データは、地図データ処理装置１が具備する地図データベース２０の中で、補完データであることを示すフラグを設けたテーブル構造７１で管理されるものとして説明したが、図１４に示されるように、地図データベース２０（第１のデータベース）とは別に、補完データのみで構成される地図データベース２３（第２のデータベース）を設け、そこで管理する形態としても良い。

　この場合、補完データを管理する地図データベース２３は、補完データを格納するテーブル構造７１を有し、そのテーブルが持つＩＤと、地図データベース２０が有する属性情報を格納するテーブル構造６１のＩＤとがそれぞれ同一の地物であることを示す構造とすることで、そのＩＤをキーとして地図データベース２０と補完データを格納する地図データベース２３とを連携させることが可能となる。

　補完データを管理する地図データベース２３を別途設けることで、既存の地図データベース２０に手を加える必要がないため、保守性が向上する。

　この発明は詳細に説明されたが、上記した説明は、全ての局面において、例示であって、この発明がそれに限定されるものではない。例示されていない無数の変形例が、この発明の範囲から外れることなく想定され得るものと解される。

　なお、本発明は、その発明の範囲内において、各実施の形態を自由に組み合わせたり、各実施の形態を適宜、変形、省略することが可能である。

Claims

　地物の属性データを含む地図データにおいて、前記属性データが欠落しているデータ欠落地域の地図データを補完する地図データ処理装置であって、
　複数の地域を検索して、前記データ欠落地域と類似する類似地域を取得する類似地域検索部と、
　前記類似地域の地図データに基づいて、前記データ欠落地域の地図データにおける欠落データを補完した補完済み地図データを生成する補完データ構築部と、
　前記補完済み地図データを含む前記地図データに基づいて分析を行うデータ分析部と、
　前記データ分析部における前記補完済み地図データに基づいた分析結果の適否を判定する整合性判定部と、
　前記整合性判定部による判定結果が適正である場合は、前記補完済み地図データを出力するデータ出力部と、を備える、地図データ処理装置。
　前記類似地域検索部は、
　前記データ欠落地域の地図データに含まれる、前記欠落データ以外の地域の地理的特性および社会的特性を示すデータを統計学的な分析手法により処理して、前記類似地域を取得する、請求項１記載の地図データ処理装置。
　前記類似地域検索部は、
　取得した前記類似地域を、前記データ欠落地域との類似の程度を示す類似度と共に出力する、請求項１記載の地図データ処理装置。
　前記補完データ構築部は、
　前記類似地域の地図データのうち、前記欠落データと相関の高いデータに基づいて前記類似地域と前記データ欠落地域との地域差を考慮した係数を算出し、該係数を前記類似地域の地図データの補完元となるデータに掛けることで、前記欠落データを補完する、請求項１記載の地図データ処理装置。
　前記類似地域検索部は、
　検索パターンを使用して前記複数の地域を検索して前記類似地域を取得し、
　前記データ出力部は、
　前記補完データ構築部で生成した前記補完済み地図データに、前記検索パターンを表すタグを付けて出力する、請求項１記載の地図データ処理装置。
　前記類似地域検索部は、
　前記データ分析部で分析に使用する前記地図データのうち、前記欠落データ以外のデータを統計学的な分析手法により処理して、前記類似地域を取得する、請求項１記載の地図データ処理装置。
　前記類似地域検索部は、
　ユーザによって指定された検索対象範囲で前記類似地域を検索する、請求項１記載の地図データ処理装置。
　前記検索対象範囲は、
　予め定義された行政区域に従って指定される、請求項７記載の地図データ処理装置。
　前記検索対象範囲は、
　ユーザによって設定されたメッシュに従って指定される、請求項７記載の地図データ処理装置。
　前記補完済み地図データは、
　外部に設けられた外部記憶装置に保存される、請求項１記載の地図データ処理装置。
　前記補完済み地図データは、
　前記外部記憶装置内の、前記地図データを保存する第１のデータベースとは別の第２のデータベースで管理される、請求項１０記載の地図データ処理装置。