JP5113108B2 - 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム - Google Patents

注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム Download PDF

Info

Publication number
JP5113108B2
JP5113108B2 JP2009058707A JP2009058707A JP5113108B2 JP 5113108 B2 JP5113108 B2 JP 5113108B2 JP 2009058707 A JP2009058707 A JP 2009058707A JP 2009058707 A JP2009058707 A JP 2009058707A JP 5113108 B2 JP5113108 B2 JP 5113108B2
Authority
JP
Japan
Prior art keywords
data
note
facility
name
latitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009058707A
Other languages
English (en)
Other versions
JP2010027031A (ja
Inventor
佳代子 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009058707A priority Critical patent/JP5113108B2/ja
Publication of JP2010027031A publication Critical patent/JP2010027031A/ja
Application granted granted Critical
Publication of JP5113108B2 publication Critical patent/JP5113108B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、インターネット上の地図情報提供サービス等において使用される電子的な地図データを管理する技術に関する。
インターネット上の地図情報提供サービスは利用度が高く、より一層の利便性向上のために種々の取り組みがなされている。
一般に地図データは地図業者により作成され、地形データと注記データとを含んでいる。地形データは、行政区画、道路、鉄道、施設等の図形データであり、図形上の点は緯度経度と対応付けられている。注記データは、地図上に表示される行政区画名、道路名、鉄道名、施設名等の文字や数字のテキストデータであり、表示されるべき地図上の点の緯度経度と対応付けられている。
また、インターネット上の地図情報提供サービスでは、飲食店、映画館等の施設の情報を施設データとして上記の注記データとは別途に作成・管理しており、地図上に施設を示すアイコン等を表示し、そのアイコンが選択された場合に当該施設の詳細情報を表示する等している。施設データは、施設の正式名称、分類名、画像、説明文等のデータを含み、地図上の該当する位置の緯度経度と対応付けられている。
注記データと施設データは適宜にメンテナンスが行われるものであり、注記データと施設データは同じ施設についての情報を含むものであるが、上述したように両者は異なるシステムで別途に管理されるものであるため、オペレータは個々に手作業でメンテナンスを行っていた。すなわち、注記データのメンテナンスにあっては施設データが入手できる場合には施設データを参考にし、施設データのメンテナンスにあっては注記データを参考にし、内容の正確性等を確認するために用いていた。
特開2006−260365号公報 特開平10−154161号公報 特開平09−259141号公報
上述したように、注記データと施設データは同じ施設についての情報を含むものであり、相互に参考にされるものであるが、それぞれ別のシステムで管理されるものであるため、同じ施設についての情報でも緯度経度や名称に違いがあり、同一性を判断するのが困難であるという問題があった。特に、文字列の完全一致によるデータの付き合わせ処理では、ある注記データに対応する施設データを見つけることができなかった。
図1は注記データと施設データの不一致の例を示す図である。(a)は、同じ施設であっても注記データと施設データとでは緯度経度に若干の差があり、双方の緯度経度が完全一致しない場合の例である。施設データと注記データの緯度経度がミリ秒単位で完全に一致するケースは、実データにおいてほとんどない。(b)は、同じ施設であっても名称の表記に違いがあり、更に緯度経度にも若干の差がある例である。施設データの名称は正式名称であるのに対し、注記データの名称は正式名称を略していることが多いため、双方の名称が完全一致しないことがある。
このように、同じ施設についての情報でも緯度経度や名称に違いがあることから、同一性を判断するのが困難であり、データのメンテナンスが効率よく行えないという問題があった。
また、ユーザの入力した施設名等に基づいて該当する施設を検索して表示する場合、注記データに対して行った検索結果と施設データに対して行った検索結果とが実質的に重複してしまい、有効な検索結果を提供できないという問題もあった。
一方、特許文献1には、地図DBと住所DB間のリンク処理を行うために、複数通りのバリエーションを持った住所表記を統一した表記に改めた中間コードを生成し、地図DBと住所DBの紐付けを行う技術が開示されている。特許文献2には、正式名称と略称等の曖昧な住所情報を正規化し、正規化された情報を比較することにより、住所と地図の情報をリンクさせる技術が開示されている。特許文献3には、住所DBの住所または名称をキーに地図DBの住所または名称を検索し、地図DB中の名称中の連続文字列の一致率に基づいて住所DBと地図DBの関連付けを行う技術が開示されている。
これらの文献には住所と地図をリンクさせるための名寄せ処理を行う技術が開示されているが、住所の文字列に基づいて地図情報との紐付けを行うものであり、名寄せ処理の精度に問題があった。
本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、実質的に同一の施設にかかる注記データと施設データを有効に名寄せすることのできる注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラムを提供することにある。
上記の課題を解決するため、本発明にあっては、請求項1に記載されるように、地図データに含まれる注記データを蓄積した注記データベースと、当該注記データベースとは別途に作成・管理され、地図上に存在する施設についての施設データを蓄積した施設データベースとに基づき、前記注記データベースに含まれる注記データに基づいて前記施設データベースに含まれる施設データのうちの同一施設に係るデータを関連付ける装置であって、特定された注記データを基準にして、その注記データの少なくとも位置情報および名称を施設データの位置情報および名称と比較して一致の程度を示すスコアを算出する手段と、スコアに基づいて名寄せ対象の施設データを特定し、両者を関連付ける名寄せ情報を登録する手段とを備える注記名寄せ装置を要旨としている。
また、請求項2に記載されるように、請求項1に記載の注記名寄せ装置において、特定された注記データを基準にして、その注記データの緯度経度と施設データの緯度経度の一致率を示す緯度経度スコアを計算する手段と、特定された注記データを基準にして、その注記データの名称と施設データの名称の一致率を示す名称スコアを計算する手段と、特定された注記データを基準にして、その注記データの分類と施設データの分類の一致率を示す分類スコアを計算する手段と、計算された緯度経度スコア、名称スコア、分類スコアから統合スコアを計算する手段とを備えるようにすることができる。
また、請求項3に記載されるように、請求項2に記載の注記名寄せ装置において、統合スコアのランキング処理およびランキング結果の表示を行う手段と、表示されたランキング結果から名寄せ確定の対象を選択させる手段と、名寄せ確定した施設データと元になる注記データとを対応付ける名寄せ情報を所定のデータベースに登録する手段とを備えるようにすることができる。
また、請求項4に記載されるように、請求項2または3のいずれか一項に記載の注記名寄せ装置において、統合スコアのうち所定の閾値を超える施設データを名寄せ確定させる手段と、名寄せ確定した施設データと元になる注記データとを対応付ける名寄せ情報を所定のデータベースに登録する手段とを備えるようにすることができる。
また、請求項5に記載されるように、請求項2乃至4のいずれか一項に記載の注記名寄せ装置において、緯度経度スコアは、施設データと注記データにつき、緯度経度の「度」「分」「秒」のそれぞれの一致率を計算し、それぞれに緯度経度の重要度を乗算し、その合計により計算し、名称スコアは、施設の文字列片と一致する注記の文字列片数を注記の文字列片数で除したものに名称の重要度を乗算することにより計算し、分類スコアは、施設の分類が注記の分類名に含まれるか否かにより、含まれる場合に「1」それ以外は「0」とし、これに分類の重要度を乗算することにより計算し、統合スコアは、緯度経度スコア、名称スコア、分類スコアを合計することにより計算するようにすることができる。
また、請求項6に記載されるように、請求項2乃至5のいずれか一項に記載の注記名寄せ装置において、緯度経度の重要度は、名称の重要度よりも高く、名称の重要度は、緯度経度の「度」、「分」、「秒」の重要度より低く、緯度経度の「分」より「度」で注記データと施設データが一致しているほうが重要度が高く、緯度経度の「秒」より「分」で注記データと施設データが一致しているほうが重要度が高く、名称の重要度は、分類の重要度より高いものとすることができる。
また、請求項7に記載されるように、請求項1に記載の注記名寄せ装置において、特定された注記データを基準にして、その注記データの位置情報と一致する施設データを抽出する手段と、抽出された施設データにつき、特定された注記データの名称との一致率を算出する手段とを備えるようにすることができる。
また、請求項8に記載されるように、請求項7に記載の注記名寄せ装置において、位置情報の一致の比較は、前記注記データの緯度経度に対応するメッシュコードにより行うようにすることができる。
また、請求項9に記載されるように、請求項7に記載の注記名寄せ装置において、位置情報の一致の比較は、前記注記データの住所文字列に対応する行政コードにより行うようにすることができる。
また、請求項10に記載されるように、地図データに含まれる注記データを蓄積した注記データベースと、当該注記データベースとは別途に作成・管理され、地図上に存在する施設についての施設データを蓄積した施設データベースとに基づき、前記注記データベースに含まれる注記データに基づいて前記施設データベースに含まれる施設データのうちの同一施設に係るデータを関連付ける方法であって、注記名寄せ装置が、特定された注記データを基準にして、その注記データの少なくとも位置情報および名称を施設データの位置情報および名称と比較して一致の程度を示すスコアを算出する工程と、前記注記名寄せ装置が、スコアに基づいて名寄せ対象の施設データを特定し、両者を関連付ける名寄せ情報を登録する工程とを備える注記名寄せ方法として構成することができる。
また、請求項11に記載されるように、地図データに含まれる注記データを蓄積した注記データベースと、当該注記データベースとは別途に作成・管理され、地図上に存在する施設についての施設データを蓄積した施設データベースとに基づき、前記注記データベースに含まれる注記データに基づいて前記施設データベースに含まれる施設データのうちの同一施設に係るデータを関連付ける注記名寄せ装置を構成するコンピュータを、特定された注記データを基準にして、その注記データの少なくとも位置情報および名称を施設データの位置情報および名称と比較して一致の程度を示すスコアを算出する手段、スコアに基づいて名寄せ対象の施設データを特定し、両者を関連付ける名寄せ情報を登録する手段として機能させる注記名寄せプログラムとして構成することができる。
本発明の注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラムにあっては、複数の要素に基づいてスコアリングして名寄せを行うため、実質的に同一の施設にかかる注記データと施設データを有効に名寄せすることができる。
注記データと施設データの不一致の例を示す図である。 本発明の第1の実施形態にかかる注記名寄せ装置の構成例を示す図である。 名寄せ結果データベースの構造例を示す図である。 注記データベースおよび施設データベースの構造例を示す図である。 スコアリング重み付けルール保持部の保持するデータの構造例を示す図である。 第1の実施形態の処理例を示すフローチャートである。 緯度経度スコアの計算例を示す図である。 名称スコアの計算例を示す図である。 注記データおよび施設データにおける分類の例を示す図である。 ランキング表示の例を示す図である。 本発明の第2の実施形態にかかる注記名寄せ装置の構成例を示す図である。 注記データベースおよび施設データベースの構造例を示す図である。 スコアリング重み付けルール保持部の保持するデータの構造例を示す図である。 第2の実施形態の処理例を示すフローチャートである。 施設データ抽出部の処理例を示すフローチャートである。 中心メッシュコードおよびメッシュコード群の例を示す図である。 住所文字列と行政コードの有効桁数の対応関係の例を示す図である。 注記データから閾値を算出する場合の加算値の例を示す図である。
以下、本発明の好適な実施形態につき説明する。
<第1の実施形態>
図2は本発明の第1の実施形態にかかる注記名寄せ装置の構成例を示す図である。
図2において、注記データベース1および施設データベース2はそれぞれ別のシステムで管理されるデータベースであり、各システムの装置内のHDD(Hard Disk Drive)等の記憶媒体上に所定のデータを体系的に保持するものである。注記データベース1は複数の注記データを格納し、施設データベース2は複数の施設データを格納している。注記名寄せ装置3は注記データベース1および施設データベース2からデータを読み込み、名寄せの結果(名寄せ情報)を注記データベース1および施設データベース2に書き込む。
注記名寄せ装置3は、名寄せ処理制御部30と注記データ取得部31と施設データ取得部32とスコアリング重み付けルール保持部33と緯度経度スコア計算部34と名称スコア計算部35と分類スコア計算部36と統合スコア計算部37と名寄せ処理部38とを備えている。名寄せ処理制御部30、注記データ取得部31、施設データ取得部32、緯度経度スコア計算部34、名称スコア計算部35、分類スコア計算部36、統合スコア計算部37、名寄せ処理部38は、注記名寄せ装置3を構成するコンピュータのCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等のハードウェア資源上で実行されるコンピュータプログラムによって実現されるものである。なお、これらの機能部は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される形態であってもよい。
名寄せ処理制御部30は、注記名寄せ装置3内の全体的な制御(オペレータとのやりとりの制御を含む)を行う機能を有している。
注記データ取得部31は、注記データベース1から名寄せの対象とする基準となる注記データを読み出す機能を有している。
施設データ取得部32は、施設データベース2から施設データを読み出す機能を有している。
スコアリング重み付けルール保持部33は、緯度経度スコア、名称スコア、分類スコアの重み付け(重要度)のルールを保持している。
緯度経度スコア計算部34は、特定された注記データを基準にして、その注記データの緯度経度と施設データの緯度経度の一致率を示す緯度経度スコアを計算する機能を有している。
名称スコア計算部35は、特定された注記データを基準にして、その注記データの名称と施設データの名称の一致率を示す名称スコアを計算する機能を有している。
分類スコア計算部36は、特定された注記データを基準にして、その注記データの分類と施設データの分類の一致率を示す分類スコアを計算する機能を有している。
なお、緯度経度スコア計算部34による緯度経度スコア、名称スコア計算部35による名称スコア、分類スコア計算部36による分類スコアの計算はどの順序で行ってもよい。
統合スコア計算部37は、計算された緯度経度スコア、名称スコア、分類スコアから統合スコアを計算する機能を有している。
名寄せ処理部38は、オペレータによる手動操作の場合には、統合スコアのランキング処理、ランキング結果の表示、ランキング結果からの名寄せ確定対象の選択受付、名寄せ確定した施設データと元になる注記データとを対応付ける名寄せ情報の注記データベース1および施設データベース2への登録を行い、自動処理の場合には統合スコアのうち所定の閾値を超える施設データを名寄せ確定し、その施設データと元になる注記データとを対応付ける名寄せ情報の注記データベース1および施設データベース2への登録を行う機能を有している。
なお、別に名寄せ結果データベースを設け、名寄せ処理結果を注記データベース1や施設データベース2と独立して管理することもできる。注記データベース1や施設データベース2以外にも複数のデータベースを用いた場合など、規模が大きくなった場合を考えると、名寄せ結果を名寄せ結果データベースとして別のデータベースでマージして管理しておいた方が分かりやすくなるという利点がある。図3は名寄せ結果データベースの構造例を示す図であり、データベースを特定する「データベースID」、データベースの名称を示す「データベース名」、データベース中でのデータを特定する「データID」の項目を複数組(ここでは3組)設けている。図示の例では、データベースID「DB001」、データベース名「注記データベース」、データID「1111」の注記データと、データベースID「DB002」、データベース名「施設データベース」、データID「5555」の施設データと、データベースID「DB003」、データベース名「不動産関連データベース」、データID「0009」の不動産関連データとが、同一対象にかかるものであるとして名寄せされたことを示している。
図4は注記データベース1および施設データベース2の構造例を示す図である。(a)は注記データベース1に含まれる注記データの論理構造を示しており、注記データベース1内の注記データを特定する「注記データID」と、注記の文字列を示す「名称」と、注記が表示される地図上の緯度を示す「緯度」と、注記が表示される地図上の経度を示す「経度」と、注記の属する分類を示す「分類」と、名寄せにより同一対象を示すものと判断された施設データを特定する施設データIDおよび統合スコアを示す「名寄せ施設データID(複数可)」等の項目を含んでいる。なお、「名寄せ施設データID」は初期状態ではブランクである。
(b)は施設データベース2に含まれる施設データの論理構造を示しており、施設データベース2内の施設データを特定する「施設データID」と、施設の正式名称を示す「名称」と、施設の住所を示す「住所」と、施設の電話番号を示す「電話番号」と、施設の存在する地図上の緯度を示す「緯度」と、施設の存在する地図上の経度を示す「経度」と、施設の属する分類を示す「分類」と、名寄せにより同一対象を示すものと判断された注記データIDおよび統合スコアを示す「名寄せ注記データID(複数可)」と、施設の代表的な画像を示す「画像」と、施設の説明文等を示す「説明」と、施設の利用者による評価文等を示す「利用者レビュー」等の項目を含んでいる。
図5はスコアリング重み付けルール保持部33の保持するデータの構造例を示す図であり、「緯度/経度」、「名称」、「分類」の各項目に対して重要度が設定されている。「緯度/経度」は、更に「度」、「分」、「秒」に細分化されて重要度が設定されている。「緯度/経度」の重要度(12.0)は、「度」「分」「秒」の重要度を加算した値(12=5+4+3)となる。ここでは、次の方針で重要度を設定している。
・「緯度/経度」は、「名称」よりも重要度が高い。
・「名称」の重要度は、「緯度/経度」の「度」、「分」、「秒」の重要度より低い。
・「分」より「度」で注記データと施設データが一致しているほうが重要。
・「秒」より「分」で注記データと施設データが一致しているほうが重要。
・「名称」の重要度は、「分類」の重要度より高い。
図6は第1の実施形態の処理例を示すフローチャートである。
図6において、手動もしくはバッチにより処理を開始すると(ステップS1)、先ず、名寄せの対象とする注記を特定する(ステップS2)。注記データ取得部31の制御のもと、オペレータが手作業で個別に注記の名寄せを行う場合にはオペレータにより注記が特定され、自動処理により所定対象の注記について名寄せを行う場合には、対象となる注記群の中から1つが特定される。
次いで、注記データ取得部31は特定された注記に対応する注記データを注記データベース1から取得する(ステップS3)。なお、取得した注記データについては、特に「名称」に対して正規化を行うことが望ましい。「名称」に対する正規化としては、全角英数を半角英数に変換したり、余分な空白を削除したりする等が含まれる。
次いで、施設データ取得部32は施設データを施設データベース2から取得する(ステップS4)。
次いで、緯度経度スコア計算部34は、特定された注記データを基準にして、その注記データの緯度経度と各施設データの緯度経度の一致率を示す緯度経度スコアを計算する(ステップS5)。
施設と注記の緯度経度がミリ秒単位で完全に一致するケースは、実データにおいてほとんどない。したがって、ある注記に対して緯度経度の差が小さい施設ほど大きなスコアを付ける。具体的には、以下の式により、「度」「分」「秒」のそれぞれにつき一致率を計算し、それに図5で示した重要度をそれぞれ乗算し、その合計をもって緯度経度スコアとする。
一致率および緯度経度スコアの計算式は次の通りである。
・「度」についての一致率
緯度の差(度)=|注記の緯度(度)−施設の緯度(度)|
経度の差(度)=|注記の経度(度)−施設の経度(度)|
緯度経度の一致率(度)=1/(緯度の差(度)+経度の差(度)+1)
・「分」についての一致率
緯度の差(分)=|注記の緯度(分)−施設の緯度(分)|
経度の差(分)=|注記の経度(分)−施設の経度(分)|
緯度経度の一致率(分)=1/(緯度の差(分)+経度の差(分)+1)
・「秒」についての一致率
緯度の差(秒)=|注記の緯度(秒)−施設の緯度(秒)|
経度の差(秒)=|注記の経度(秒)−施設の経度(秒)|
緯度経度の一致率(秒)=1/(緯度の差(秒)+経度の差(秒)+1)
・緯度経度スコア
緯度経度スコア(度)=緯度経度の一致率(度)×緯度経度(度)の重要度(5.0)
緯度経度スコア(分)=緯度経度の一致率(分)×緯度経度(分)の重要度(4.0)
緯度経度スコア(秒)=緯度経度の一致率(秒)×緯度経度(秒)の重要度(3.0)
緯度経度スコア=緯度経度スコア(度)+緯度経度スコア(分)+緯度経度スコア(秒)
上記の式によって、緯度経度の差が小さいほど緯度経度の一致率を大きくし、緯度経度の差が大きいほど緯度経度の一致率を小さくすることができる。
図7は緯度経度スコアの計算例を示す図である。以下に施設#1について具体的な計算手順を示す。
・施設#1についての緯度経度の一致率(度)の計算
注記の緯度(度)=施設の緯度(度)=35
注記の経度(度)=施設の経度(度)=139
施設#1の緯度(度)=施設の緯度(度)=35
施設#1の経度(度)=施設の経度(度)=139
緯度の差(度)=|35−35|= 0
経度の差(度)=|139−139|=0
緯度経度の一致率(度)=1/(0+0+1)=1
・施設#1についての緯度経度の一致率(分)の計算
注記の緯度(分)=施設の緯度(分)=56
注記の経度(分)=施設の経度(分)=52
施設#1の緯度(分)=施設の緯度(分)=56
施設#1の経度(分)=施設の経度(分)=52
緯度の差(分)=|56−56|=0
経度の差(分)=|52−52|=0
緯度経度の一致率(分)=1/(0+0+1)=1
・施設#1についての緯度経度の一致率(秒)の計算
注記の緯度(秒)=40.729200
注記の経度(秒)=33.852000
施設#1の緯度(秒)=40.729000
施設#1の経度(秒)=33.850000
緯度の差(秒)=|40.729200−40.729000|=0.0002
経度の差(秒)=|33.852000−33.850000|=0.002
緯度経度の一致率(秒)=1/(0.0002+0.002+1)=0.998
・緯度経度スコアの計算
緯度経度のスコア(度)=1×5.0
緯度経度のスコア(分)=1×4.0
緯度経度のスコア(秒)=0.998×3.0
緯度経度のスコア=5.0+4.0+2.99=11.99
次いで、図6に戻り、名称スコア計算部35は、特定された注記データを基準にして、その注記データの名称と施設データの名称の一致率を示す名称スコアを計算する(ステップS6)。
注記の名称と施設の名称は、完全一致しないケースがある。図8に注記とそれに対応する施設の名称の例を示す。図8のタイプ「完全一致」の場合は、単純な文字列比較により、注記に対応付く施設を特定することができる。しかし、それ以外のタイプ「部分文字列」「文字の欠落」「文字の置換」「文字の挿入」のような場合に対しては、単純な文字列比較は適用することができない。
そこで、曖昧検索で一般的に用いられるN−gram方式を採用することで、名称比較を行うこととする。
以下に、図8のタイプ「部分文字列」の場合の例につき具体的な処理手順を説明する。その他のタイプ「文字の欠落」「文字の置換」「文字の挿入」についても同様の手順で処理することができる。
先ず、「市立△松小学校」という施設の名称の文字列を2文字の文字列片に開始位置を1文字ずつずらして分けると次のようになる。
「市立」「立△」「△松」「松小」「小学」「学校」
一方、注記の文字列「△松小」を同じく文字列片に分けると次のようになる。
「△松」「松小」
そして、両者の文字列片を照らし合わせると、
「△松」「松小」
の2つが合致することがわかる。すなわち、注記の文字列片2個に対して、施設の文字列片と一致するものが2個あることがわかる。
そこで、
一致率=施設の文字列片と一致する注記の文字列片数/注記の文字列片数
とし、
名称スコア=一致率×名称の重要度(2.0)
により名称スコアを計算するものとする。
上記の例の場合は、2/2=1.0が一致率となり、名称スコアは1.0×2.0=2.0となる。
なお、注記の文字列を基準として施設の名称の文字列に対して一致率を計算する場合、注記の文字列片数が多い場合には一致する文字列片数が同じでも一致率が低くなってしまい、文字列の比較という観点から見て一致していると考えられるケースでも一致率が低く計算されてしまう。そこで、基準を逆とした第2の一致率、すなわち
第2の一致率=施設の文字列片と一致する注記の文字列片数/施設の文字列片数
も計算し、もともとの一致率と第2の一致率のうちの大きい方を一致率として名称スコアを計算することが望ましい。
次いで、図6に戻り、分類スコア計算部36は、特定された注記データを基準にして、その注記データの分類と施設データの分類の一致率を示す分類スコアを計算する(ステップS7)。
図9に注記の分類とそれに対応する施設の分類の例を示すが、注記の分類と施設の分類の文字列は完全一致しないケースがある。なお、本実施形態では、緯度経度と名称の二つの項目のみでほぼ名寄せを行うことができているため、注記と施設の分類名を対応付けるための対策は特に行わず、注記の分類と施設の分類の単純な文字列比較のみ行うものとする。
具体的には、図9の施設の分類「橋・トンネル」のように施設の分類名に要素列記を意味する「・」が入っている場合、「橋」「トンネル」のように「・」を境界として文字列を分割する。その後、分割した文字列のいずれかが注記の分類名に含まれるか否か確認する。含まれている場合、注記の分類と施設の分類は一致したとみなす。文字列が一致した場合は「1」、それ以外は「0」とし、これに図5に示した分類の重要度(1.0)を乗算したものを分類スコアとする。なお、名称の場合と同様にN−gram方式を採用し、変化量から分類スコアを計算するようにしてもよい。
次いで、図6に戻り、統合スコア計算部37は、計算された緯度経度スコア、名称スコア、分類スコアから統合スコアを計算する(ステップS8)。
統合スコアは、
統合スコア=緯度経度スコア+名称スコア+分類スコア
により計算する。統合スコアは、ある注記に対して施設が一致する可能性の大きさを示す値である。統合スコアが大きいほど、ある注記に対して施設が一致する可能性は大きく、統合スコアが小さいほど、一致する可能性は小さい。
次いで、オペレータによる手動操作の場合には、名寄せ処理部38は統合スコアに基づいてランキングを行い(ステップS9)、ランキング結果の表示を行い(ステップS10)、オペレータの選択により名寄せ対象の特定を行う(ステップS11)。
図10はランキング表示の例を示す図であり、(a)(b)(c)において、「対象注記」に続いて、注記の名称、経度、緯度が表示され、次の行以下に、「施設情報」に続いて、統合スコア、施設の名称、経度、緯度が表示されている。
(a)は、注記の近くに存在する、同一名称の施設が上位にランキングされた例であり、注記「○ブン△□ブン」に対応する施設情報として、緯度経度の近い順にランキングされている。したがって、1行目の注記に対応する可能性の最も高い施設は、2行目の施設であるといえる。
(b)は、注記の近くに存在する、類似名称の施設が上位にランキングされた例であり、注記「ショッピングセンター○◎△□スコ」に対応する施設情報として、緯度経度の近い、2行目の施設「△□スコ○◎店」が上位にランキングされている。名称スコアの観点からみると、2行目の施設「△□スコ○◎店」よりも3行目の施設「ショッピングセンター××・○◎」の方が、注記「ショッピングセンター○◎△□スコ」の文字列片と一致する文字列片の数が多いため、名称スコアは高い。しかし、名称よりも緯度経度の重要度の方が高いため、緯度経度スコアの高い2行目の施設「△□スコ○◎店」の方が、統合スコアが高くなり、上位にランキングされる。
(c)は、注記の近くに存在する、同一名称かつ別分類の施設が上位にランキングされた例である。1行目の注記「△沼橋」は分類名が「橋名」であり、それに対応する2行目の施設「△沼橋」は分類名が「橋・トンネル」である。緯度経度で見た場合、1行目の注記「△沼橋」に一番近い施設は、分類名が「地点名」である3行目の施設「△沼橋」である。しかし、1行目の注記「△沼橋」と2行目の施設「△沼橋」は分類が一致するため、2行目の施設「△沼橋」に分類スコアが加算され、上位にランキングされている。
一方、図6に戻り、自動処理の場合には、名寄せ処理部38は統合スコアのうち所定の閾値を超える施設データを名寄せ確定として特定する(ステップS12)。所定の閾値は運用を通して経験的に定めた値である。
そして、オペレータによる手動操作の場合および自動処理の場合のいずれの場合においても、名寄せ処理部38は名寄せ確定の結果に応じ、その施設データと元になる注記データとを対応付ける名寄せ情報を注記データベース1および施設データベース2に格納する(ステップS13)。すなわち、図4(a)の注記データベース1における該当する注記データの「名寄せ施設データID」に同一対象を示すものと判断された施設データを特定する施設データIDおよび統合スコアを格納する。また、図4(b)の施設データベース2における該当する施設データの「名寄せ注記データID」に同一対象を示すものと判断された注記データを特定する注記データIDおよび統合スコアを格納する。なお、同一対象を示すものと判断されたものが複数ある場合には、複数のIDおよび統合スコアを格納する。
次いで、図6に戻り、処理続行の場合、すなわちオペレータによる手動操作の場合は続けて名寄せ処理を行う場合、自動処理の場合は名寄せの対象とする注記がまだ残っている場合(ステップS14のYes)、注記の特定(ステップS2)に戻り、同様の処理を繰り返す。
処理続行をしない場合(ステップS14のNo)、名寄せ処理を終了する(ステップS15)。
<第2の実施形態>
前述した第1の実施形態では注記データおよび施設データに緯度経度が含まれていることを前提としていたが、この第2の実施形態では、位置情報として緯度経度あるいは住所名称文字列のいずれか一方もしくは双方が含まれているものとしている。
また、第1の実施形態では緯度経度、名称および分類の3種類の情報を考慮していたが、第2の実施形態では、原則として位置情報と名称のみを対象とする。なお、分類、電話番号、URL(Uniform Resource Locator)等を更に考慮してもよい。
また、第1の実施形態では各施設データに対し、緯度経度スコア、名称スコアおよび分類スコアの3種類のスコアを計算し、それを統合していたが、第2の実施形態では、注記データを基準にして、位置情報の一致する施設データを抽出し、抽出した施設データに対して名称の比較を行い、位置情報として緯度経度を用いたのか住所文字列を用いたのか、住所文字列ではどの程度の細かさで比較したのか等に応じて重み付けしてスコアを算出するようにしている。
更に、第2の実施形態では、位置情報の一致を判断するために、緯度経度を用いる場合にはメッシュコードを使用し、住所文字列を用いる場合には行政コードを使用している。メッシュコードとは、緯度経度に基づいて地域を区分する所定の大きさの網目(メッシュ)に付されたコードであり、JIS X0410等において詳細が定められている。行政コードとは、住所に基づいて付されたコードであり、JIS X0401、X0402等において詳細が定められている。
また、第2の実施形態では、比較の基準となる注記データから閾値を算出し、この閾値を超えるスコアの施設データに絞り込むことで、対応付く可能性の低い施設データを除外するようにしている。
図11は本発明の第2の実施形態にかかる注記名寄せ装置の構成例を示す図である。
図11において、注記データベース1および施設データベース2はそれぞれ別のシステムで管理されるデータベースであり、各システムの装置内のHDD等の記憶媒体上に所定のデータを体系的に保持するものである。注記データベース1は複数の注記データを格納し、施設データベース2は複数の施設データを格納している。注記名寄せ装置3は注記データベース1および施設データベース2からデータを読み込み、名寄せの結果(名寄せ情報)を注記データベース1および施設データベース2に書き込む。なお、別に名寄せ結果データベースを設け、名寄せ処理結果を注記データベース1や施設データベース2と独立して管理することもできる。
注記名寄せ装置3は、名寄せ処理制御部300と注記データ取得部301と注記データ正規化部302と施設データ抽出部303と名称比較部304とスコア算出部305とスコアリング重み付けルール保持部306と閾値算出部307と施設データ絞り込み部308と名寄せ処理部309とを備えている。名寄せ処理制御部300、注記データ取得部301、注記データ正規化部302、施設データ抽出部303、名称比較部304、スコア算出部305、閾値算出部307、施設データ絞り込み部308、名寄せ処理部309は、注記名寄せ装置3を構成するコンピュータのCPU、ROM、RAM等のハードウェア資源上で実行されるコンピュータプログラムによって実現されるものである。なお、これらの機能部は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される形態であってもよい。
名寄せ処理制御部300は、注記名寄せ装置3内の全体的な制御(オペレータとのやりとりの制御を含む)を行う機能を有している。
注記データ取得部301は、注記データベース1から名寄せの対象とする基準となる注記データを読み出す機能を有している。
注記データ正規化部302は、注記データ取得部301により取得した注記データの各項目に対して正規化のためのデータ整形を行う機能を有している。
施設データ抽出部303は、基準となる注記データと位置情報の一致する施設データを施設データベース2から抽出する機能を有している。位置情報の一致を判断するために、基準となる注記データに緯度経度が含まれている場合は緯度経度を用い、緯度経度が含まれていない場合は住所文字列を用いる。具体的な比較には、緯度経度を用いる場合にはメッシュコードを使用し、住所文字列を用いる場合には行政コードを使用する。
名称比較部304は、施設データ抽出部303により位置情報が一致するものとして抽出された複数の施設データに対し、基準となる注記データの名称と施設データの名称とを比較して一致率を算出する機能を有している。
スコア算出部305は、位置情報として緯度経度を用いたのか住所文字列を用いたのか、住所文字列ではどの程度の細かさで比較したのか、および名称比較の有無等に応じて重み付けしてスコアを算出する機能を有している。
スコアリング重み付けルール保持部306は、スコア算出部305におけるスコア算出の重み付け(重要度)のルールを保持している。
閾値算出部307は、比較の基準となる注記データから閾値を算出する機能を有している。
施設データ絞り込み部308は、閾値算出部307により算出された閾値に基づき、施設データ抽出部303により抽出され、名称比較部304により名称比較された複数の施設データから、閾値を超えるスコアの施設データに絞り込む機能を有している。
名寄せ処理部309は、オペレータによる手動操作の場合には、閾値を超えた施設データのランキング処理、ランキング結果の表示、ランキング結果からの名寄せ確定対象の選択受付、名寄せ確定した施設データと元になる注記データとを対応付ける名寄せ情報の注記データベース1および施設データベース2への登録を行い、自動処理の場合には最高スコアの施設データもしくは上位所定数(全部を含む)の施設データを名寄せ確定し、その施設データと元になる注記データとを対応付ける名寄せ情報の注記データベース1および施設データベース2への登録を行う機能を有している。
図12は注記データベース1および施設データベース2の構造例を示す図である。後述する処理で対象となる項目のみを示しているが、図4と比較して、注記データベース1、施設データベース2とも、緯度と経度が位置情報に拡張され、位置情報としては緯度経度もしくは住所文字列のいずれか一方または両方が格納される点が異なる。なお、注記データベース1および施設データベース2には、緯度経度に対応するメッシュコードや住所文字列に対応する行政コードを併せて格納してもよい。
図13はスコアリング重み付けルール保持部306の保持するデータの構造例を示す図である。重要度の値は経験則に基づく任意の値を用いることができるが、この例では、緯度経度に対応するメッシュコードを用いて抽出した施設データについては「4.0」を、住所文字列に対応する行政コードを用いて抽出した施設データについては、比較に用いた有効桁数に応じ、11桁では「4.0」、8桁では「3.0」、5桁では「2.0」を設定している。名称比較の一致率に対する重要度は「2.0」としている。
図14は第2の実施形態の処理例を示すフローチャートである。
図14において、手動もしくはバッチにより処理を開始すると(ステップS101)、先ず、名寄せの対象とする注記を特定する(ステップS102)。注記データ取得部31の制御のもと、オペレータが手作業で個別に注記の名寄せを行う場合にはオペレータにより注記が特定(入力)され、自動処理により所定対象の注記について名寄せを行う場合には、対象となる注記群の中から1つが特定される。
次いで、注記データ正規化部302は、注記データ取得部301により取得した注記データの各項目に対して正規化のためのデータ整形を行う(ステップS103)。具体的には、住所文字列に対して、
?丁目、番地、号などを「-」に変換
?全角英数を半角英数へ変換
?余分な空白を削除
?丁番号とビル等の建物名の間に空白挿入
等の処理を行う。また、名称に対して、
?全角英数を半角英数へ変換
?余分な空白を削除
等の処理を行う。
次いで、施設データ抽出部303は、基準となる注記データと位置情報の一致する施設データを施設データベース2から抽出する(ステップS104)。
図15は施設データ抽出部303の処理例を示すフローチャートである。
図15において、施設データ抽出部303は、位置情報を利用した施設データの抽出処理を開始すると(ステップS121)、基準となる注記データに緯度経度を含むか否か判断する(ステップS122)。
基準となる注記データに緯度経度を含む場合(ステップS122のYes)、施設データ抽出部303は、注記データの緯度経度に対応するメッシュコード(中心メッシュコード)を取得する(ステップS123)。メッシュコードは注記データの緯度経度から算出することができる。なお、メッシュコードにはメッシュの細かさに応じた次数があるが、対象となる施設の大きさに応じた次数とする。通常の施設であれば6次メッシュ(125m四方)が適当である。
図16(a)は中心メッシュコードの例を示しており、注記データの緯度が「35.678287」、経度が「139.777239」である場合、6次のメッシュコードは「5339-4612-1-3-4」となる。図中の正方形は地図上のメッシュを示しており、注記データの緯度経度に相当する位置を含むものとなっている。
次いで、図15に戻り、施設データ抽出部303は、中心メッシュコードのメッシュを囲むメッシュのメッシュコードを求め、中心メッシュコードと併せてメッシュコード群とする(ステップS124)。
図16(b)は、図16(a)の中心メッシュコードのメッシュと、このメッシュを囲む8個の、計9個(3×3個)のメッシュのメッシュコードを示しており、これらのメッシュコードを束ねたものをメッシュコード群とする。
図15に戻り、施設データ抽出部303は、メッシュコード群のいずれかのメッシュコードと一致する施設データを施設データベース2から抽出する(ステップS125)。すなわち、施設データベース2の各施設データの緯度経度に着目し、メッシュコードに変換した上でメッシュコード群のいずれかのメッシュコードと一致するか否か比較し、一致した場合には読み込む。施設データに緯度経度が含まれておらず、住所文字列が含まれている場合は、住所文字列から緯度経度を求め(住所文字列と緯度経度の対応関係を管理するデータベースを利用)、その緯度経度からメッシュコードを算出する。施設データベース2に予めメッシュコードが格納されている場合には、そのメッシュコードとの直接的な比較を行う。
基準となる注記データに緯度経度を含む場合はこれで処理を終了する(ステップS130)。
一方、基準となる注記データに緯度経度を含まない場合(ステップS122のNo)、施設データ抽出部303は、注記データの住所文字列に対応する行政コードを取得する(ステップS126)。行政コードは住所文字列と行政コードを対応付けて管理するデータベースを参照することにより求める。
次いで、施設データ抽出部303は、注記データの住所文字列から行政コードの有効桁数を算出する(ステップS127)。図17は住所文字列と行政コードの有効桁数の対応関係の例を示す図であり、住所文字列が市区郡町村まで含む場合は有効桁数「5」、住所文字列が大字通称まで含む場合は有効桁数「8」、住所文字列が丁目名、字名、小字名、通称名等まで含む場合は有効桁数「11」となる。
次いで、図15に戻り、施設データ抽出部303は、注記データの住所文字列に対応する有効桁数の行政コード(基準行政コード)を取得する(ステップS128)。
次いで、施設データ抽出部303は、基準行政コードに前方一致する施設データを施設データベース2から抽出する(ステップS129)。すなわち、施設データベース2の各施設データの住所文字列に着目し、行政コードに変換した上で一致するか否か前方一致により比較し、一致した場合には読み込む。施設データに住所文字列が含まれておらず、緯度経度が含まれている場合は、緯度経度から住所文字列を求め(住所文字列と緯度経度の対応関係を管理するデータベースを利用)、その住所文字列から行政コードを取得する。施設データベース2に予め行政コードが格納されている場合には、その行政コードとの直接的な比較を行う。
基準となる注記データに緯度経度を含まない場合の住所文字列による処理はこれで終了する(ステップS130)。
次いで、図14に戻り、名称比較部304は、施設データ抽出部303により位置情報が一致するものとして抽出された複数の施設データに対し、基準となる注記データの名称と施設データの名称とを比較して一致率を算出する(ステップS105)。名称についての一致率の算出は第1の実施形態における場合と同様である。
次いで、スコア算出部305は、スコアリング重み付けルール保持部306を用いて、位置情報として緯度経度を用いたのか住所文字列を用いたのか、住所文字列ではどの程度の細かさで比較したのか、および名称比較の有無等に応じて重み付けしてスコアを算出する(ステップS106)。図13のスコアリング重み付けルール保持部306に従い、例えば、緯度経度に対応するメッシュコードを用いて抽出された施設データで、名称の一致率が「0.5」であった場合、1×4.0+0.5×2.0=5がスコアとなる。
次いで、図14に戻り、閾値算出部307は、比較の基準となる注記データから閾値を算出する(ステップS107)。図18は注記データから閾値を算出する場合の加算値の例を示す図である。加算値は経験則に基づく任意の値を用いることができるが、この例では、注記データに緯度経度が含まれている場合(緯度経度による施設データの抽出が行われる場合)は「4.0」が閾値に加算されるものとしている。注記データに緯度経度が含まれていない場合(住所文字列による施設データの抽出が行われる場合)は、行政コードの有効桁数が11桁の場合は「4.0」が閾値に加算され、行政コードの有効桁数が8桁の場合は「3.0」が閾値に加算され、行政コードの有効桁数が5桁の場合は「2.0」が閾値に加算されるものとしている。名称については、一律に「0.5」が閾値に加算されるものとしている。
次いで、図14に戻り、施設データ絞り込み部308は、閾値算出部307により算出された閾値に基づき、施設データ抽出部303により抽出され、名称比較部304により名称比較された複数の施設データから、閾値を超えるスコアの施設データに絞り込む(ステップS108)。
次いで、オペレータによる手動操作の場合には、名寄せ処理部309はスコアに基づいてランキングを行い(ステップS109)、ランキング結果の表示を行い(ステップS110)、オペレータの選択により名寄せ対象の特定を行う(ステップS111)。
一方、自動処理の場合には、名寄せ処理部309は最高スコアの施設データもしくは上位所定数(全部を含む)の施設データを名寄せ確定として特定する(ステップS112)。
そして、オペレータによる手動操作の場合および自動処理の場合のいずれの場合においても、名寄せ処理部309は名寄せ確定の結果に応じ、その施設データと元になる注記データとを対応付ける名寄せ情報を注記データベース1および施設データベース2に格納する(ステップS113)。
次いで、処理続行の場合、すなわちオペレータによる手動操作の場合は続けて名寄せ処理を行う場合、自動処理の場合は名寄せの対象とする注記がまだ残っている場合(ステップS114のYes)、注記の特定(ステップS102)に戻り、同様の処理を繰り返す。
処理続行をしない場合(ステップS114のNo)、名寄せ処理を終了する(ステップS115)。
<総括>
以上説明したように、本実施形態によれば、次のような利点がある。
(1)複数の要素に基づいてスコアリングして名寄せを行うため、名称に基づく名寄せに比べて高精度に名寄せ処理を行うことが可能になる。第1の実施形態においては、ランダムサンプリングした実データを用いて結果を検証したところ、100件中93件の成功ケース(残り6件は例外ケース、残り1件は失敗ケース)で93%程度の精度であることが分かり、本手法によるスコアリングの妥当性を確認することができた。なお、注記の名称が「2」「46」等の数字のみによる文字列の場合については、名寄せの対象外としている。
(2)人手で注記データと施設データの名寄せを行う必要がなく、ほぼ自動で名寄せを行うことが可能になり、オペレータの負担を軽減することができる。
(3)ユーザの入力した施設名等に基づいて該当する施設を検索して表示する場合、注記データに対して行った検索結果と施設データに対して行った検索結果とに重複がなくなり、有効な検索結果を提供することができる。
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。
1 注記データベース
2 施設データベース
3 注記名寄せ装置
30 名寄せ処理制御部
31 注記データ取得部
32 施設データ取得部
33 スコアリング重み付けルール保持部
34 緯度経度スコア計算部
35 名称スコア計算部
36 分類スコア計算部
37 統合スコア計算部
38 名寄せ処理部
300 名寄せ処理制御部
301 注記データ取得部
302 注記データ正規化部
303 施設データ抽出部
304 名称比較部
305 スコア算出部
306 スコアリング重み付けルール保持部
307 閾値算出部
308 施設データ絞り込み部
309 名寄せ処理部

Claims (11)

  1. 地図データに含まれる注記データを蓄積した注記データベースと、当該注記データベースとは別途に作成・管理され、地図上に存在する施設についての施設データを蓄積した施設データベースとに基づき、前記注記データベースに含まれる注記データに基づいて前記施設データベースに含まれる施設データのうちの同一施設に係るデータを関連付ける装置であって、
    特定された注記データを基準にして、その注記データの少なくとも位置情報および名称を施設データの位置情報および名称と比較して一致の程度を示すスコアを算出する手段と、
    スコアに基づいて名寄せ対象の施設データを特定し、両者を関連付ける名寄せ情報を登録する手段と
    を備えたことを特徴とする注記名寄せ装置。
  2. 請求項1に記載の注記名寄せ装置において、
    特定された注記データを基準にして、その注記データの緯度経度と施設データの緯度経度の一致率を示す緯度経度スコアを計算する手段と、
    特定された注記データを基準にして、その注記データの名称と施設データの名称の一致率を示す名称スコアを計算する手段と、
    特定された注記データを基準にして、その注記データの分類と施設データの分類の一致率を示す分類スコアを計算する手段と、
    計算された緯度経度スコア、名称スコア、分類スコアから統合スコアを計算する手段と
    を備えたことを特徴とする注記名寄せ装置。
  3. 請求項2に記載の注記名寄せ装置において、
    統合スコアのランキング処理およびランキング結果の表示を行う手段と、
    表示されたランキング結果から名寄せ確定の対象を選択させる手段と、
    名寄せ確定した施設データと元になる注記データとを対応付ける名寄せ情報を所定のデータベースに登録する手段と
    を備えたことを特徴とする注記名寄せ装置。
  4. 請求項2または3のいずれか一項に記載の注記名寄せ装置において、
    統合スコアのうち所定の閾値を超える施設データを名寄せ確定させる手段と、
    名寄せ確定した施設データと元になる注記データとを対応付ける名寄せ情報を所定のデータベースに登録する手段と
    を備えたことを特徴とする注記名寄せ装置。
  5. 請求項2乃至4のいずれか一項に記載の注記名寄せ装置において、
    緯度経度スコアは、施設データと注記データにつき、緯度経度の「度」「分」「秒」のそれぞれの一致率を計算し、それぞれに緯度経度の重要度を乗算し、その合計により計算し、
    名称スコアは、施設の文字列片と一致する注記の文字列片数を注記の文字列片数で除したものに名称の重要度を乗算することにより計算し、
    分類スコアは、施設の分類が注記の分類名に含まれるか否かにより、含まれる場合に「1」それ以外は「0」とし、これに分類の重要度を乗算することにより計算し、
    統合スコアは、緯度経度スコア、名称スコア、分類スコアを合計することにより計算する
    ことを特徴とする注記名寄せ装置。
  6. 請求項2乃至5のいずれか一項に記載の注記名寄せ装置において、
    緯度経度の重要度は、名称の重要度よりも高く、
    名称の重要度は、緯度経度の「度」、「分」、「秒」の重要度より低く、
    緯度経度の「分」より「度」で注記データと施設データが一致しているほうが重要度が高く、
    緯度経度の「秒」より「分」で注記データと施設データが一致しているほうが重要度が高く、
    名称の重要度は、分類の重要度より高い
    ことを特徴とする注記名寄せ装置。
  7. 請求項1に記載の注記名寄せ装置において、
    特定された注記データを基準にして、その注記データの位置情報と一致する施設データを抽出する手段と、
    抽出された施設データにつき、特定された注記データの名称との一致率を算出する手段と
    を備えたことを特徴とする注記名寄せ装置。
  8. 請求項7に記載の注記名寄せ装置において、
    位置情報の一致の比較は、前記注記データの緯度経度に対応するメッシュコードにより行う
    ことを特徴とする注記名寄せ装置。
  9. 請求項7に記載の注記名寄せ装置において、
    位置情報の一致の比較は、前記注記データの住所文字列に対応する行政コードにより行う
    ことを特徴とする注記名寄せ装置。
  10. 地図データに含まれる注記データを蓄積した注記データベースと、当該注記データベースとは別途に作成・管理され、地図上に存在する施設についての施設データを蓄積した施設データベースとに基づき、前記注記データベースに含まれる注記データに基づいて前記施設データベースに含まれる施設データのうちの同一施設に係るデータを関連付ける方法であって、
    注記名寄せ装置が、特定された注記データを基準にして、その注記データの少なくとも位置情報および名称を施設データの位置情報および名称と比較して一致の程度を示すスコアを算出する工程と、
    前記注記名寄せ装置が、スコアに基づいて名寄せ対象の施設データを特定し、両者を関連付ける名寄せ情報を登録する工程と
    を備えたことを特徴とする注記名寄せ方法。
  11. 地図データに含まれる注記データを蓄積した注記データベースと、当該注記データベースとは別途に作成・管理され、地図上に存在する施設についての施設データを蓄積した施設データベースとに基づき、前記注記データベースに含まれる注記データに基づいて前記施設データベースに含まれる施設データのうちの同一施設に係るデータを関連付ける注記名寄せ装置を構成するコンピュータを、
    特定された注記データを基準にして、その注記データの少なくとも位置情報および名称を施設データの位置情報および名称と比較して一致の程度を示すスコアを算出する手段、
    スコアに基づいて名寄せ対象の施設データを特定し、両者を関連付ける名寄せ情報を登録する手段
    として機能させる注記名寄せプログラム。
JP2009058707A 2008-06-18 2009-03-11 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム Active JP5113108B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009058707A JP5113108B2 (ja) 2008-06-18 2009-03-11 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008158798 2008-06-18
JP2008158798 2008-06-18
JP2009058707A JP5113108B2 (ja) 2008-06-18 2009-03-11 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム

Publications (2)

Publication Number Publication Date
JP2010027031A JP2010027031A (ja) 2010-02-04
JP5113108B2 true JP5113108B2 (ja) 2013-01-09

Family

ID=41732757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009058707A Active JP5113108B2 (ja) 2008-06-18 2009-03-11 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム

Country Status (1)

Country Link
JP (1) JP5113108B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5155351B2 (ja) * 2010-03-23 2013-03-06 ヤフー株式会社 地図データ処理装置及び方法
JP5065470B2 (ja) * 2010-12-07 2012-10-31 楽天株式会社 サーバ、情報管理方法、情報管理プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
JP5221630B2 (ja) * 2010-12-07 2013-06-26 楽天株式会社 サーバ、情報管理方法、情報管理プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
JP5606303B2 (ja) * 2010-12-17 2014-10-15 三菱電機株式会社 情報処理装置及び情報処理方法及びプログラム
JP5520857B2 (ja) * 2011-02-25 2014-06-11 株式会社エヌ・ティ・ティ・データ キーワード付与装置、コンテンツ提供システム、キーワード付与方法およびプログラム
JP4869448B1 (ja) * 2011-07-08 2012-02-08 株式会社ぐるなび 名寄せ管理システム
JP5940018B2 (ja) * 2013-04-26 2016-06-29 三菱電機ビルテクノサービス株式会社 データ名称抽出装置及びプログラム
JP6017411B2 (ja) * 2013-12-27 2016-11-02 三菱電機ビルテクノサービス株式会社 データ関連情報処理装置及びプログラム
JP6287619B2 (ja) * 2014-06-20 2018-03-07 株式会社デンソー 電力管理システム
CN106598965B (zh) * 2015-10-14 2020-03-20 阿里巴巴集团控股有限公司 一种基于地址信息的账户映射方法及装置
JP6696305B2 (ja) * 2016-06-02 2020-05-20 コニカミノルタ株式会社 患者情報表示装置及び患者情報表示方法
JP2017215883A (ja) * 2016-06-02 2017-12-07 コニカミノルタ株式会社 患者情報表示装置及び患者情報表示方法
JP6945325B2 (ja) * 2017-04-04 2021-10-06 株式会社Nttドコモ 名寄せ支援装置
JP6838150B2 (ja) * 2017-06-07 2021-03-03 三菱電機ビルテクノサービス株式会社 データ名称分類支援装置及びデータ名称分類支援プログラム
JP2019053469A (ja) * 2017-09-14 2019-04-04 ヤフー株式会社 データベース生成装置、データベース生成方法、およびプログラム
JP7150689B2 (ja) * 2018-12-20 2022-10-11 三井住友ファイナンス&リース株式会社 排出物の分類方法及び排出物管理システム
CN112507223B (zh) * 2020-12-10 2023-06-23 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04267477A (ja) * 1991-02-22 1992-09-24 Kyushu Nippon Denki Software Kk 住所のメッシュコード化による範囲検索方式
JP3131142B2 (ja) * 1996-03-26 2001-01-31 日立ソフトウエアエンジニアリング株式会社 地図データリンケージシステム

Also Published As

Publication number Publication date
JP2010027031A (ja) 2010-02-04

Similar Documents

Publication Publication Date Title
JP5113108B2 (ja) 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム
US7840456B2 (en) System and method for categorizing credit card transaction data
US8600980B2 (en) Consolidated information retrieval results
US7870139B2 (en) Correlating genealogy records systems and methods
US8768970B2 (en) Providing alternatives within a family tree systems and methods
US8886661B2 (en) Information extraction system, information extraction method, information extraction program, and information service system
EP1550958A2 (en) Genealogy investigation and documentation systems and methods
CN102708095A (zh) 选择用于文本分割的语言的方法和系统
JP5221630B2 (ja) サーバ、情報管理方法、情報管理プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
US20090222440A1 (en) Search engine for carrying out a location-dependent search
JP4957796B2 (ja) 差分算出プログラム、差分算出装置および差分算出方法
US6070169A (en) Method and system for the determination of a particular data object utilizing attributes associated with the object
JP2009129009A (ja) 特許審査支援システム、特許審査支援方法、および特許審査支援プログラム
JP5271526B2 (ja) 商標検索システム及び商標検索サーバ
EP2763052A1 (en) Search method and information management device
JP2002063363A (ja) 保険契約情報管理システム及び顧客インデックス作成方法
US20090144317A1 (en) Data search markup language for searching research data
JP2010218216A (ja) 類似文書検索システム、方法及びプログラム
CN116384948B (zh) 一种标讯项目所在地的抽取方法、装置、设备及介质
JP2014235619A (ja) 画像情報処理装置及び画像情報処理方法
US20220327162A1 (en) Information search system
JP2003223459A (ja) 住所情報の管理方法
JP5367448B2 (ja) 商標検索装置
Wolf et al. New York City Directories Extracted Persons Entries, 1850-1890
JP2005107888A (ja) 情報登録方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121002

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121011

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5113108

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350