JP2007080137A - 住所データのマッチング方法および装置 - Google Patents

住所データのマッチング方法および装置 Download PDF

Info

Publication number
JP2007080137A
JP2007080137A JP2005269635A JP2005269635A JP2007080137A JP 2007080137 A JP2007080137 A JP 2007080137A JP 2005269635 A JP2005269635 A JP 2005269635A JP 2005269635 A JP2005269635 A JP 2005269635A JP 2007080137 A JP2007080137 A JP 2007080137A
Authority
JP
Japan
Prior art keywords
address
character string
data
basic
latitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005269635A
Other languages
English (en)
Inventor
Hideshi Inoue
英志 井上
Katsuhiro Kitani
克広 木谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2005269635A priority Critical patent/JP2007080137A/ja
Publication of JP2007080137A publication Critical patent/JP2007080137A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 住所データが本来持っている情報を欠落させない状態を保持したまま既存の住所データと緯度経度付き住所データとのマッチングを行う方法及び装置を提供すること。
【解決手段】 住所情報解析手段により国土交通省等から提供されている緯度経度付き住所データを解析し、各住所データを住所基本文字列、住所補足文字列、緯度、経度から成る要素に分解した住所解析情報テーブルを作成するステップと、マッチング処理手段によりマッチング対象の住所データを基本住所文字列と地番文字列に分解し、基本住所文字列と地番文字列を検索キーとして前記住所解析情報テーブルを検索し、検索キーである基本住所文字列と地番文字列にマッチングする住所基本文字列、住所補足文字列を有する住所の緯度経度付き住所データを取得するステップとを備えることを特徴とする。
【選択図】 図2

Description

本発明は、住所データのマッチング方法に係り、詳しくは既存の住所データから地図データを検索するために、既存の住所データと緯度経度付き住所データをマッチングする方法および装置に関する。
従来、既存の住所データを管理するデータ管理手段としては、例えば、下記特許文献1及び特許文献2に記載のものが知られている。
下記特許文献1に記載のものは、既存の住所データベースと地図データベースとを備え、それらの情報を関連付ける地図データリンケージシステムにおいて、住所データベースと地図データベース中のそれぞれの住所データを正規化して表記方法を統一し、正規化されたそれぞれの住所データを比較した結果を基に、データの関連付けを行うリンク情報を作成してデータのリンケージを行うようにしたものである。
これは、正規化に用いられる住所データベースと地図データベースのそれぞれのデータのうち、無視してもよい文字列のリスト、置換してもよい文字列のリスト、順不問にしてもよい文字列のリストを用意し、各リストの内容を編集する手段を備えた地図データリンケージシステムである。
このシステムでは、既存の住所データベースに対して、複数の地図データを備えた地図データリンケージシステムにおいて、地域名毎にその地域を含む上位地域名及びその地域に含まれる下位地域名を登録し、最上位の地域名に対応する地図データIDを登録した住所逆引きテーブルと住所データベースから住所データを取得して、表記方法を統一し、その取得した住所データについて住所逆引きテーブルを参照して、住所の不足分を判定し、その不足分を住所データに付加して住所データを正規化する。
正規化された住所データにリンクすべき地図住所データを含む地図データを住所逆引きテーブルに登録された地図データIDに従い、複数の地図データの中から対象となる地図データを選択し、選択された地図データから地図住所データを取得し、地図データの地図住所データを正規化する。それぞれ正規化されたデータを比較した結果を基に各データの関連付けを行うリンク情報を作成して、住所のマッチングを行うようにしたものである。
また、下記特許文献2に記載のものは、既存住所データを階層化して管理し、検索したい住所文字列を検索する処理において、対応する住所データを検索できない場合に、検索したい住所文字列の最下層から所定量を削除して、検索を繰り返す住所検索システムである。
このシステムでは、入力された文字列が所定の住所表記に従っていない場合に、所定の住所表記に従う文字列に修正し、この修正した文字列を検索住所文字列として設定する。修正する手段は、検索住所文字列の最下層の情報から住所表記上の単位または検索住所文字列の最下層の情報から1文字単位または検索住所文字列の最下層の情報から所定の境界単位で削除することにより修正する。
所定の境界は、文字と数字との境界または数字とハイフンの境界のいずれかまたは双方である。検索結果が複数の場合は、検索結果を一覧形式で記載する。さらに検索結果が所定値を上回った場合には、ユーザに検索住所文字列の属する範囲を絞り込ませる。
データの管理手段は、住所データと地図データとを関連付けて管理し、検索住所文字列に対応する住所データを検索し、さらに検索された住所データに関連付けられた地図データを検索する。
設定手段により設定された検索住所文字列と一致する住所データを検索できない場合は、検索住所文字列の示す住所より広い区域の住所を示すように検索住所文字列を段階的に修正する。
入力された検索住所文字列に対応する住所データを検索するための住所検索方法において、検索住所文字列に対応する住所データが検索されるまで、検索住所文字列を最下層の情報から所定量ずつ削除しながら検索を繰り返させる住所検索方法である。
特開平10−154161号公報 特開2003−186880号公報
しかしながら、上記特許文献1に記載の技術は、住所データ文字列に対して、無視、置換、順序の入れ替えの処理を施すため、本来の文字列とは、異なるデータに変換されるという問題がある。
また、上記特許文献2に記載の技術も同様に、住所データ文字列において、検索されない場合には、最下層の情報から住所表記上の単位で削除処理を施すため、本来の文字列とは、異なるデータに変換されるという問題がある。
本発明の目的は、住所データが本来持っている情報を欠落させない状態を保持したまま既存の住所データと緯度経度付き住所データとのマッチングを行う方法及び装置を提供することにある。
上記目的を達成するために、本発明に係る住所データのマッチング方法は、住所情報解析手段により国土交通省等から提供されている緯度経度付き住所データを解析し、各住所データを住所基本文字列、住所補足文字列、緯度、経度から成る要素に分解した住所解析情報テーブルを作成するステップと、マッチング処理手段によりマッチング対象の住所データを基本住所文字列と地番文字列に分解し、基本住所文字列と地番文字列を検索キーとして前記住所解析情報テーブルを検索し、検索キーである基本住所文字列と地番文字列にマッチングする住所基本文字列、住所補足文字列を有する住所の緯度経度付き住所データを取得するステップとを備えることを特徴とする。
また、本発明に係る住所データのマッチング処理装置は、緯度経度付き住所データを解析し、各住所データを住所基本文字列、住所補足文字列、緯度、経度から成る要素に分解した住所解析情報テーブルを作成する住所情報解析手段と、マッチング対象の住所データを基本住所文字列と地番文字列に分解し、基本住所文字列と地番文字列を検索キーとして前記住所解析情報テーブルを検索し、検索キーである基本住所文字列と地番文字列にマッチングする住所基本文字列、住所補足文字列を有する住所の緯度経度付き住所データを取得するマッチング処理手段とを備えることを特徴とする。
本発明によれば、住所データが本来持っている情報を欠落させない状態を保持したまま既存の住所データと緯度経度付き住所データとのマッチングを行うことができ、標準的なGIS(GeoGraphical Infoemation System:地理情報システム)が保持している地図データベースの地図データを検索する場合に極めて有用なものとなる。
以下、本発明を実施する場合の一形態を図面を参照して具体的に説明する。
図1は、本発明を適用した地理情報処理装置の実施の形態を示すブロック図である。
この実施形態における地理情報処理装置は、図1に示すように、各種データの入出力、マッチング処理を行う処理装置10と、マッチング対象となる住所データを格納した住所データDB20と、マッチングの基本となる「住所解析情報テーブル」13の元データとなる緯度経度付住所データを格納した緯度経度付住所データDB30と、マッチングにより出力対象となる地図データを格納した地図データDB40とからなっている。
処理装置10は、図3に示すような構成の「住所解析情報テーブル」13を作成する住所情報解析テーブル作成プログラム11とマッチング処理を行うマッチング処理プログラム12とからなっている。
図3は、緯度経度付住所データDB30に格納された緯度経度付住所データに基づいて住所情報解析テーブル作成プログラム11が作成する「住所解析情報テーブル」13の構成を示す図である。
「住所解析情報テーブル」13は、住所マッチングテーブル131と住所文字列解析情報テーブル132とからなる。
住所マッチングテーブル131は、住所基本文字列1311と住所補足文字列1312と、それに対応した緯度1313及び経度1314の情報から構成されている。
住所基本文字列1311は、住所の町大字名までの数字表記部分を除いた住所文字列である。
住所補足文字列1312は、住所文字列の数字表記部分である丁目以下の数値情報を保持した文字列である。
「住所文字列解析情報テーブル」132は、住所基本文字列1321とそれに対応する住所内数字数1322とからなる。
住所基本文字列1321に必要な数値情報の数を住所内数字数1322として予め設定しておく。例えば、広島県中区大手町における住所表記の丁目以下の数字情報が3桁で表記されている場合には「3」が設定される。
図4は、国土交通省から提供されている街区レベル位置参照情報ダウンロードサービスによるデータのうち本システムで使用する情報である。
漢字で提供される都道府県名41と、市区町村名42、大字・町丁目43、街区符号・地番44、座標系番号45、緯度46、経度47から成る情報で構成されるが、本発明では住所情報解析テーブル作成プログラム11により、都道府県名41と、市区町村名42、大字・町丁目43の“丁目”を除いたものを図3の住所マッチングテーブル131の住所基本文字列1311および住所文字列解析情報テーブル132の住所基本文字列1321に格納する。
さらに、大字・町丁目43の“丁目”と街区符号・地番44の情報を編集する。編集の方法は、“丁目”がある場合には、数字を半角英数字に変換し「丁目」の文字列を「−(半角ハイフン)」に変換し、半角英数字及び半角ハイフンで提供される街区符号・地番44の文字列と結合する。結語された文字列を図3の住所マッチングテーブル131の住所補足文字列1312に格納する。
また、住所補足文字列1312の文字列のうちハイフンの数に1足した数値を住所内数字数1322に格納する。最後に、対応する緯度46と経度47をそれぞれ図3の住所マッチングテーブル131の緯度1313と経度1314に格納する。
本発明では、住所データDB20に格納された住所データに対応する地図データを検索する場合には、予め、住所情報解析テーブル作成プログラム11によって図3の住所情報解析テーブル13を作成しておく。
図2は、住所データをローカルのDB20として保持している場合に、対象となる地図データを地図データDB40から検索する処理の流れの概要を示す図である。
(ステップ1)
ここでは、まず、テンプレートに応じたメニュー項目を取得し、住所データを検索するレコードの絞込みを行う。
テンプレートとは、各地図利用業務に合った項目選択用画面を表示するための枠組みであり、例えば、水道料金の未払者の一覧情報の場合、氏名・年齢・住所などの情報項目をテンプレートとして用意し、住所データDB20から未払いフラグの立っているレコードからテンプレートにある列を抽出し、表形式で選択画面として出力する。この選択画面から地図を表示したい顧客を選択することにより前記住所データを検索するレコードの絞込みを行うためのものである。
(ステップ2)
次にローカルの住所データDB20内で住所データを検索するレコードが決定されたならば、対象レコードの住所データをローカルDB20から取得する。
(ステップ3)
次に、取得した住所データから位置データを取得するために、地図検索時における住所文字列マッチング処理をマッチング処理プログラム12によって実行する。
この住所文字列マッチング処理では、ローカルの住所データDB20から取得した不完全な住所文字列から図3の住所文字列解析情報テーブル132を参照して町大字名までの数字表記部分を除いた住所基本文字列と丁目以降の数字文字列数を取得する。
次に、住所文字列解析情報テーブル132を参照することにより完全な住所文字列データとなった住所文字列を図3の住所マッチングテーブル131を参照して緯度、経度から成る位置情報に変換する。
(ステップ4)
次に、緯度、経度から成る位置情報により地図データDB40を検索して出力する。
上記ステップ3における住所データのローカルDB20を使用した地図検索では、ローカルの住所データDB20から抽出された住所データを住所文字列解析情報テーブル131を参照して完全な住所文字列に変換し、その変換された住所文字列を「住所→位置情報変換」により緯度・経度情報に変換する。
「住所→位置情報変換」の変換処理は、マッチング処理プログラム12により、図5および図6に示す通り、以下のステップで行う。
(Step1)
まず、住所データDB20から抽出された住所データから半角/全角のスペースを削除する。
(Step2)
次に、漢数字を含む”一丁目”〜”九丁目”を”1−”〜”9−”に変換する。この際、単純に漢数字を変換すると”八丁堀”のような漢数字を含む住所文字列がマッチしなくなるため、必ず「丁目」を含んだ文字列を変換対象とする。
(Step3)
次に、全角数字(‘1’〜‘9’)を半角数字(’1’〜’9’)に変換する。
(Step4)
次に、文字列の先頭から最初の半角英数字までの住所基本文字列を切り出し、残りを地番文字列とする。
(Step5)
次に、Step4で求めた住所基本文字列をキーとしてまず後方一致で、図3の住所文字列解析情報テーブル132を検索し、住所基本文字列1321と住所内数字数1322を求める。住所文字列解析情報テーブル132に該当する項目がある場合には、この後方一致検索によりほとんどの場合該当項目を得られる(下記変換例1及び変換例2)。
そして、上記Step4で切り出した住所基本文字列と検索した住所基本文字列が完全一致かどうかを判定し、完全一致である場合には、住所基本文字列を検索結果住所基本文字列とし、地番文字列を住所補足文字列とする。
完全一致とならなかった場合には、一致している部分のみを検索結果住所基本文字列とし、一致しない部分の文字列は地番文字列と結合し、住所補足文字列とする。
(Step6)
次に、変数Iにステップ508で求めた住所数字数を代入し、Step5で求めた住所数字数分、住所補足文字列から数字(漢数字またはアラビア数字)を取り出し、ハイフン(‘−‘)で連結する処理を変数IがI>0の条件を満たさなくなるまで繰り返す。この時、連続した半角数字は1つの数字と見なす(123番45号→123−45)。
(Step7)
次に、検索結果住所基本文字列と変換後住所補足文字列から、図3の住所マッチングテーブル131を検索し、緯度1313と経度1314の情報を取得する。
次に、住所データの変換例について説明する。
(変換例1)
「広島市中区 大手町1丁目 2番3号 広島第4ビル3F」という文字列を変換する場合を図7に示す。
Step1:変換後=広島市中区大手町1丁目2番3号広島第4ビル3F
Step2:文字列中に漢数字を含む”一丁目”〜”九丁目”がないため、スキップ
Step3:変換後=広島市中区大手町1丁目2番3号広島第4ビル3F
Step4:基本住所文字列=広島市中区大手町、地番文字列:1丁目2番3号広島第4ビル3F
Step5:検索結果住所基本文字列=広島県広島市中区大手町、住所数字数:3
不完全一致のため、住所補足文字列=1丁目2番3号広島第4ビル3F
Step6:変換後住所補足文字列:1-2-3
Step7:緯度・経度情報取得
(変換例2)
「広島市中区 大手町一丁目 二番三号 広島第4ビル3F」という文字列を変換する場合を図8に示す。
Step1:変換後=広島市中区大手町一丁目二番三号広島第4ビル3F
Step2:変換後=広島市中区大手町1−二番三号広島第4ビル3F
Step3:変換後=広島市中区大手町1−二番三号広島第4ビル3F
Step4:住所基本文字列=広島市中区大手町、地番文字列:1−二番三号広島第4ビル3F
Step5:検索結果住所基本文字列=広島県広島市中区大手町、住所数字数:3
住所補足文字列:1−二番三号広島第4ビル3F
Step6:変換後住所補足文字列:1-2-3
Step7:緯度・経度情報取得
本発明の一実施の形態の地理情報システム処理装置の概略構成を示すブロック図である。 住所データをローカルのDB20として保持している場合に、対象となる地図データを地図データDB40から検索する処理の流れの概要を示す図である。 緯度経度付住所データDB30に格納された緯度経度付住所データに基づいて住所情報解析テーブル作成プログラム11が作成する「住所解析情報テーブル」13の構成を示す図である。 国土交通省から提供されている街区レベル位置参照情報ダウンロードサービスによるデータのうち本システムで使用する情報を示す図である。 住所・位置情報変換処理の手順を示すフローチャートである。 図5の続きを示すフローチャートである。 住所・位置情報変換処理例1を示す図である。 住所・位置情報変換処理例2を示す図である。
符号の説明
10 処理装置
11 住所情報解析テーブル作成プログラム
12 マッチング処理プログラム
20 住所データDB
21 緯度経度付き住所データDB
21 地図データDB

Claims (2)

  1. 住所情報解析手段により緯度経度付き住所データを解析し、各住所データを住所基本文字列、住所補足文字列、緯度、経度から成る要素に分解した住所解析情報テーブルを作成するステップと、マッチング処理手段によりマッチング対象の住所データを基本住所文字列と地番文字列に分解し、基本住所文字列と地番文字列を検索キーとして前記住所解析情報テーブルを検索し、検索キーである基本住所文字列と地番文字列にマッチングする住所基本文字列、住所補足文字列を有する住所の緯度経度付き住所データを取得するステップとを備えることを特徴とする住所データのマッチング方法。
  2. 緯度経度付き住所データを解析し、各住所データを住所基本文字列、住所補足文字列、緯度、経度から成る要素に分解した住所解析情報テーブルを作成する住所情報解析手段と、マッチング対象の住所データを基本住所文字列と地番文字列に分解し、基本住所文字列と地番文字列を検索キーとして前記住所解析情報テーブルを検索し、検索キーである基本住所文字列と地番文字列にマッチングする住所基本文字列、住所補足文字列を有する住所の緯度経度付き住所データを取得するマッチング処理手段とを備えることを特徴とする住所データのマッチング処理装置。
JP2005269635A 2005-09-16 2005-09-16 住所データのマッチング方法および装置 Pending JP2007080137A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005269635A JP2007080137A (ja) 2005-09-16 2005-09-16 住所データのマッチング方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005269635A JP2007080137A (ja) 2005-09-16 2005-09-16 住所データのマッチング方法および装置

Publications (1)

Publication Number Publication Date
JP2007080137A true JP2007080137A (ja) 2007-03-29

Family

ID=37940357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005269635A Pending JP2007080137A (ja) 2005-09-16 2005-09-16 住所データのマッチング方法および装置

Country Status (1)

Country Link
JP (1) JP2007080137A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011175447A (ja) * 2010-02-24 2011-09-08 Zenrin Datacom Co Ltd 三次元位置情報生成装置、方法及びプログラム
CN106202028A (zh) * 2015-04-30 2016-12-07 阿里巴巴集团控股有限公司 一种地址信息识别方法及装置
CN110795512A (zh) * 2018-07-17 2020-02-14 中国移动通信集团重庆有限公司 地址匹配方法、装置、设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011175447A (ja) * 2010-02-24 2011-09-08 Zenrin Datacom Co Ltd 三次元位置情報生成装置、方法及びプログラム
CN106202028A (zh) * 2015-04-30 2016-12-07 阿里巴巴集团控股有限公司 一种地址信息识别方法及装置
CN106202028B (zh) * 2015-04-30 2019-10-11 阿里巴巴集团控股有限公司 一种地址信息识别方法及装置
CN110795512A (zh) * 2018-07-17 2020-02-14 中国移动通信集团重庆有限公司 地址匹配方法、装置、设备及存储介质
CN110795512B (zh) * 2018-07-17 2023-08-01 中国移动通信集团重庆有限公司 地址匹配方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US7069502B2 (en) Structured document management system and structured document management method
CN110825805B (zh) 一种数据的可视化方法及装置
CN104899340B (zh) 一种基于最紧致片段的ietm技术信息片段检索装置及其检索方法
CN111522901A (zh) 文本中地址信息的处理方法及装置
CN111143478A (zh) 基于轻量化模型、工程对象位号的二三维文件关联方法
JP2007080137A (ja) 住所データのマッチング方法および装置
Ahuja et al. Using machine learning to accelerate data wrangling
JP2006023968A (ja) 固有表現抽出方法および装置並びにそれらに用いるプログラム
JP2003223453A (ja) 住所情報と位置座標のマッチング方法
JP2008027290A (ja) 日本語文作成支援方法及びその装置
CN110675729B (zh) 一种多版本地理信息一体化制图方法及系统
JP2002109448A (ja) 帳票処理装置、帳票処理方法、記憶媒体
Le Guilcher et al. Analysis of massive imports of open data in openstreetmap database: A study case for france
JP4382634B2 (ja) 住所解析装置、住所解析方法及び住所解析プログラム
JP2003167912A (ja) 住所コード検索システムと住所コード検索処理プログラム
JP2006172380A (ja) 空間データの検索用インデックス作成装置および空間データ検索装置および空間データの検索用インデックス作成方法
JP2006072802A (ja) 住所データの検索方法及び住所データベース
JP4415768B2 (ja) 住所テーブル生成支援方法及び装置及びプログラム
JP2007199987A (ja) 特許情報検索システム
JP3824468B2 (ja) データ管理システム
JPH11134342A (ja) 文書検索装置および文書検索方法および文書検索プログラムを記録した記録媒体
JP2006106872A (ja) 知識情報収集システム、知識検索システム及び知識情報収集方法
Bajjali Geocoding
JPH10240710A (ja) 住所位置特定装置
JP2004102628A (ja) 住所表示変更用データの作成方法