JP2004280659A - 住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置 - Google Patents

住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置 Download PDF

Info

Publication number
JP2004280659A
JP2004280659A JP2003073460A JP2003073460A JP2004280659A JP 2004280659 A JP2004280659 A JP 2004280659A JP 2003073460 A JP2003073460 A JP 2003073460A JP 2003073460 A JP2003073460 A JP 2003073460A JP 2004280659 A JP2004280659 A JP 2004280659A
Authority
JP
Japan
Prior art keywords
address information
information
extracted
map
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003073460A
Other languages
English (en)
Inventor
Naoki Inoue
直己 井ノ上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2003073460A priority Critical patent/JP2004280659A/ja
Publication of JP2004280659A publication Critical patent/JP2004280659A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ウェブテキストから住所情報を効率良く抽出することができる住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置を提供する。
【解決手段】IP網を介して取り込んだウェブテキストについて住所情報に関する抽出範囲を決定し、決定した抽出範囲内のウェブテキストから複数の住所情報に該当する文字列を抽出し、少なくとも抽出した文字列が特定のキーワードを含むかどうかを調べることにより各住所情報の重要度を決定し、重要度の低い住所情報に関する抽出した文字列を削除して必要な住所情報に関する文字列のみを残す。
【選択図】 図4

Description

【0001】
【発明の属する技術分野】
本発明は、インターネットを利用した住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置に関する。
【0002】
【従来の技術】
携帯電話や移動通信機器の技術の発展に伴い、最近は、GPS(グローバルポジショニングシステム)を利用した位置情報サービスが提供されるようになってきている。しかしながら、現状では、位置情報サービス提供側の保有しているコンテンツ数がさほど多くないため、地図上に実際に表示される、施設(例えば、レストラン、デパート、ホテル、旅館、公共施設)やスポットなどの対象の数は少ない。
【0003】
そこで、インターネットプロトコル(IP)網上に存在する膨大な情報から多数の対象の位置情報を抽出し、位置情報サービスの内容を充実させることが考えられる。その場合、検索して得たウェブテキストから位置情報を効率良く抽出することが非常に重要となってくる。
【0004】
ネットワーク上に存在する地理情報を抽出し収集する方法として、ホームページを作成する際に、ページ作者が本当に伝えたい位置情報を特別のタグ(<spa>及び</spa>タグ)であらかじめ囲っておき、位置情報抽出時は、このタグで囲われた部分のみを位置情報として認識し、自然言語処理する方法が知られている(例えば、非特許文献1)。
【0005】
【非特許文献1】
相良 毅 他、“ネットワーク上各種情報源からの地理情報抽出収集手法”、地理情報システム学会、1999年8月
【0006】
【発明が解決しようとする課題】
しかしながら、非特許文献1に記載されているような地理情報抽出収集方法は、ページ作成時に特別のタグを記載しなければならず、また特別のタグが記載されていない情報については抽出することが全くできないため、実現が非常に難しいという問題がある。
【0007】
従って本発明の目的は、ウェブテキストから住所情報を効率良く抽出することができる住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置を提供することにある。
【0008】
【課題を解決するための手段】
本発明によれば、IP網を介して取り込んだウェブテキストについて住所情報に関する抽出範囲を決定し、決定した抽出範囲内のウェブテキストから複数の住所情報に該当する文字列を抽出し、少なくとも抽出した文字列が特定のキーワードを含むかどうかを調べることにより各住所情報の重要度を決定し、重要度の低い住所情報に関する抽出した文字列を削除して必要な住所情報に関する文字列のみを残す、住所情報の自動抽出方法が提供される。
【0009】
ウェブテキストから抽出した文字列が特定のキーワードを含むかどうかを調べて各住所情報の重要度を決定し、重要度の低い住所情報に関する文字列を削除するようにしているため、必要な住所情報のみを効率良く抽出することができる。
【0010】
抽出範囲が、ウェブテキストの所定のタグによって定まる範囲であることが好ましい。この場合、所定のタグが、<TABLE>及び</TABLE>タグであることがより好ましい。
【0011】
住所情報の重要度が、所定のタグによって決まる階層の深さによっても決定されることも好ましい。
【0012】
複数の住所情報に該当する文字列の抽出が、パターンマッチングによって行われることが好ましい。
【0013】
特定のキーワードが、ウェブテキストの作者情報を表すキーワードであることが好ましい。
【0014】
本発明によれば、さらに、上述の方法によって地図上に表示すべき対象の住所情報を抽出し、抽出した住所情報を緯度経度情報に変換して移動通信網に提供する位置情報提供方法、並びに上述の方法によって地図上に表示すべき対象の住所情報を抽出し、抽出した住所情報を緯度経度情報に変換し、緯度経度情報に従って対象を地図上に合成してなる地図情報を作成して移動通信網に提供する位置情報提供方法が与えられる。
【0015】
本発明によれば、さらにまた、IP網に接続されており、IP網上のウェブサーバから取り込んだウェブテキストについて住所情報に関する抽出範囲を決定する手段と、決定した抽出範囲内のウェブテキストから複数の住所情報に該当する文字列を抽出する手段と、少なくとも抽出した文字列が特定のキーワードを含むかどうかを調べることにより各住所情報の重要度を決定する手段と、重要度の低い住所情報に関する抽出した文字列を削除して必要な住所情報の文字列のみを残す手段とを備えた住所情報の自動抽出装置が提供される。
【0016】
ウェブテキストから抽出した文字列が特定のキーワードを含むかどうかを調べて各住所情報の重要度を決定し、重要度の低い住所情報に関する文字列を削除するようにしているため、必要な住所情報のみを効率良く抽出することができる。
【0017】
抽出範囲が、ウェブテキストの所定のタグによって定まる範囲であることが好ましい。この場合、所定のタグが、<TABLE>及び</TABLE>タグであることがより好ましい。
【0018】
住所情報の重要度を決定する手段が、所定のタグによって決まる階層の深さによっても重要度を決定する手段であることも好ましい。
【0019】
複数の住所情報に該当する文字列を抽出する手段が、パターンマッチングにより該当する文字列を抽出する手段であることが好ましい。
【0020】
特定のキーワードが、ウェブテキストの作者情報を表すキーワードであることが好ましい。
【0021】
本発明によれば、さらに、地図上に表示すべき対象の住所情報を抽出する上述した自動抽出装置と、抽出した各住所情報に関する文字列情報を緯度経度情報に変換して移動通信網に提供する手段とを備えた位置情報提供装置、並びに地図上に表示すべき対象の住所情報を抽出する上述した装置と、抽出した各住所情報に関する文字列情報を緯度経度情報に変換する手段と、緯度経度情報に従って対象を地図上に合成してなる地図情報を作成して移動通信網に提供する手段とを備えた位置情報提供装置が与えられる。
【0022】
【発明の実施の形態】
図1は本発明の一実施形態として、位置情報ポータルサービスシステムの構成を概略的に示す図である。
【0023】
同図において、10はカーナビゲーション端末11、携帯情報端末(PDA)12及び携帯電話13などの移動端末を収容する移動通信網、14はGPS衛星、15は複数のウェブサーバ16、17が接続されているIP網、18は移動通信網10及びIP網15の両方に接続されており、IP網15上のウェブサーバから取り込んだ各種コンテンツの位置情報を移動通信網10の移動端末に提供する位置情報ポータル装置をそれぞれ示している。
【0024】
図2は位置情報ポータル装置18の構成を概略的に表すブロック図であり、図3はその動作を説明する図である。
【0025】
位置情報ポータル装置18は、本発明の位置情報提供装置に対応しており、図2に示すように、移動通信網10及びIP網15に接続されており、表示すべき対象の検索要求を移動通信網10側から受けてIP網15側へ要求する検索要求手段18aと、IP網15に接続されており、検索結果を読み込む検索結果読み込み手段18bと、検索結果読み込み手段18bに接続されており読み込んだ検索結果から必要とする住所情報を抽出する住所情報抽出手段18cと、住所情報抽出手段18cに接続されており抽出した住所情報を緯度経度変換データベース(緯度経度変換DB)19を用いて緯度経度情報に変換する緯度経度変換手段18dと、地図データベース(地図DB)20から得られる地図と対象とを合成して地図情報を作成する合成手段18eとを備えている。
【0026】
この位置情報ポータル装置18は、図3に示すように、▲1▼携帯電話などの移動端末13から、施設(例えば、レストラン、デパート、ホテル、旅館、公共施設)やスポットなどの対象の検索キーを受け取ると、▲2▼IP網15上の検索エンジン21に検索要求を出し、▲3▼その検索結果を取り込んで必要とする住所情報のみを抽出し、▲4▼抽出した各対象の住所情報を、緯度経度変換DB19を用いて緯度経度情報に変換し、▲5▼変換した緯度経度情報に基づいて各対象を地図DB20から得た地図上に重ねて地図情報を作成し、▲6▼作成した地図情報を移動端末通信網の移動端末13に提供する。
【0027】
図4は、位置情報ポータル装置18における住所情報抽出手段18cの機能を説明するフローチャートである。
【0028】
検索すべき対象について1つ又は複数の検索エンジンで検索し、その結果、1つ又は複数のウェブサーバから読み込まれたウェブテキストファイル(HTMLファイル)のうち1ページをまず読み込む(ステップS1)。
次いで、そのページ内で、最初及び最後に現れる所定のタグ、例えば<table>タグ及び</table>タグで挟まれている部分を住所情報抽出範囲として決定する(ステップS2)。
【0029】
この住所情報抽出範囲内のテキストについて、パターンマッチングにより住所情報を抽出する(ステップS3)。なお、テキストから情報を抽出するパターンマッチングによる情報抽出法は、例えば、関根 聡、“テキストからの情報抽出”、情報処理、Vol.40、No.4、pp.370−373、情報処理学会、1999年4月に記載されている。
【0030】
図5a及び図5bはこのステップS3における住所情報の抽出処理の一例を説明するフローチャートである。以下これらの図を用いて、住所情報抽出処理を詳細に説明する。なお、住所情報の抽出処理方法は、この方法に限定されることなく、種々の方法が適用可能である。
【0031】
まず、抽出範囲内のテキストのうち、タグに挟まれているテキストを読み込む(ステップS301)。この読み込んだテキスト中に都道府県名があるかどうか判定し(ステップS302)、YESの場合(ある場合)は都道府県名がある場所を記憶し(ステップS303)、Noの場合(ない場合)は読み出したテキストに区市町村郡名があるかどうか判定する(ステップS304)。区市町村郡名がある場合は、区市町村郡名の前に都道府県名があるかどうか判定し(ステップS304)、YESの場合は住所の先頭が都道府県名のある場所とし(ステップS305)、NOの場合は住所の先頭が区市町村郡名のある場所とする(ステップS306)。ステップS304において、NOの場合はステップS301に戻り次のタグに挟まれたテキストについて処理を行う。
【0032】
ステップS306又はS307において、住所の先頭が定まった場合は、区市町村郡名から25文字以内に数字があり、記号、国道や徒歩などの住所とは関係のないキーワードが入っていないかどうか判定する(ステップS308)。YESの場合は、この読み込んだテキストを住所情報と判断し、その住所の先頭から数字、ハイフン、丁目、番地、号が続くところまで抽出する(ステップS309)。
【0033】
ステップS308において、NOの場合は、次のタグに挟まれているテキストを元のテキストに結合し(ステップS310)、区市町村郡名から25文字以内に数字があり、記号、国道や徒歩などの住所とは関係のないキーワードが入っていないかどうか判定する(ステップS311)。YESの場合は、この読み込んだテキストを住所情報と判断し、その住所の先頭から数字、ハイフン、丁目、番地、号が続くところまで抽出する(ステップS309)。ステップS311においてNOの場合は、ステップS301に戻り次のタグに挟まれたテキストについて処理を行う。
【0034】
次いで、住所情報抽出範囲の終わりまで処理をしたかどうか判定し(ステップS312)、YESの場合はこの抽出処理を終了し、NOの場合はステップS301に戻り次のタグに挟まれたテキストについて処理を行う。
【0035】
その後、住所情報抽出範囲内から抽出した複数の住所情報について、重要度を決定する(ステップS4)。この重要度の決定は、例えば、その住所情報のレイアウトと前後の文字列とを読み込み、(A)その前後の文字列に、例えば「Copyright」、「発行者」、「お問い合わせ」などのウェブテキストの作者情報を表すキーワードが存在するかどうかを調べ、存在する場合は重要度が低いと判断する、(B)改行されていたり、表の形式になっているかどうか調べ、そうでない場合は重要度が低いと判断する、(C)その住所情報が抽出範囲の先頭か最後の住所情報である際に、<TABLE>及び</TABLE>タグなどの所定のタグによって決まる階層を調べ、階層が他と異なっている場合は重要度が低いと判断することによって行う。
【0036】
次いで、重要度の低い住所情報に関する文字列を削除し(ステップS5)、必要な住所情報のみを抽出する。
【0037】
次いで、ウェブテキストファイルの全てのページについて処理が終了したかどうか判定し(ステップS6)、NOの場合は、ステップS1において1ページの読み込みを行って上述の処理を繰り返す。YESの場合は、処理を終了する。
【0038】
以下、本実施形態における住所情報抽出処理について、IP網から「長野の温泉宿」の住所情報を抽出する場合を例にとって具体的に説明する。
【0039】
「長野の温泉宿」について、検索エンジンを用いて検索した結果の1ページ分のウェブテキストを文字表示すると、次のようになる。
【0040】
ABC 長野のお宿
○○○○旅館
境内にある静かなお宿
アクセス/長野自動車道・長野I.C.より20分
住所/長野県長野市○○町111
tel.026−xxx−xxxx / fax.026−xxx−xxxx
××ホテル
五千坪の敷地にくつろぎの空間。全室温泉付
アクセス/上信越自動車道・更埴I.C.より15分
住所/埴科郡戸倉町戸倉温泉1111
tel.026−xxx−xxxx / fax.026−xxx−xxxx





△△△温泉ホテル
標高1500m・雲海を見下す露天風呂
アクセス/上信越自動車道・長野須坂東I.C.より30分
住所/長野県上高井郡××村△ 1111−111 △牧場
tel.026−xxx−xxxx / fax.026−xxx−xxxx
ABC長野放送
〒381−xxxx 長野市○○ 1−11−111
TEL 026−xxx−xxxx
Copyright(C)1990−2000 ABC Ltd. All Right Reserved.
【0041】
これをHTML形式で表すと以下のようになる。
【0042】
<HTML>
<HEAD>
<TITLE>ABC 長野のお宿</TITLE>
</HEAD>
<BODY BGCOLOR=”#F5FFF6” TOPMARGIN=”10” MARGINHEIGHT=”10” LEFTMARGIN=”0” MARGINWIDTH=”0”>
<div align=”center”>
<table width=”500” border=”0” cellspacing=”0” cellpadding=”0”>
<tr>
<td width=”65” align=”right”><img src=”./image/tool/C10.gif”></td>
<td width=”413” background=”./image/tool/C30.gif”><img src=”./image/tool/C22.gif”></td>
<td width=”22”><img src=”./image/tool/C40.gif”></td></tr>
<tr>
<td width=”65” align=”right”> </td>
<td width=”413” bgcolor=”#FFFFFF”>
<table width=”100%” border=”0” cellspacing=”2” cellpadding=”2”>
<tr>
<th align=”left”><a href=”http://xxx.ne.jp/” target=”_blank”>○○○○旅館</a></th></tr>
<tr>
<td>境内にある静かなお宿</td></tr>
<tr>
<td>アクセス/長野自動車道・長野I.C.より20分<br>住所/長野県長野市○○町111<br>tel.026−xxx−xxxx / fax.026−xxx−xxxx</td></tr>
<tr>
<td align=”center”><img src=”./image/tool/bg−gr−line.gif” width=”100%” height=”1”></td></tr>
<tr>
<th align=”left”><a href=”http://www.xxxx.co.jp/” target=”_blank”>××ホテル</a></th></tr>
<tr>
<td>五千坪の敷地にくつろぎの空間。全室温泉付</td></tr>
<tr>
<td>アクセス/上信越自動車道・更埴I.C.より15分<br>住所/埴科郡戸倉町戸倉温泉1111<br>tel.026−xxx−xxxx / fax.026−xxx−xxxx</td></tr>
<tr>
<td align=”center”><img src=”./image/tool/bg−gr−line.gif” width=”100%” height=”1”></td></tr>
<tr>
<th align=”left”><a href=”http://www.xxx.or.jp/users/cervin/” target=”_blank”>△△△温泉ホテル</a></th></tr>
<tr>
<td>標高1500m・雲海を見下す露天風呂</td></tr>
<tr>
<td>アクセス/上信越自動車道・長野須坂東I.C.より30分<br>住所/長野県上高井郡××村△ 1111−111 △牧場<br>tel.026−xxx−xxxx / fax.026−xxx−xxxx</td></tr>
<tr>
<td align=”center”><img src=”./image/tool/bg−gr−line.gif” width=”100%” height=”1”></td></tr>
</table>
</td>
<td width=”22”> </td>
</tr>
<tr align=”center”>
<td colspan=”3”>
</td>
</tr>
<tr align=”center”>
<td colspan=”3”>
<hr NOSHADE width=”95%”>
<img src=”http://xxxx.gif” width=”150” height=”38”><br>
<span style=”font−size: 10pt”>〒381−xxxx 長野市○○ 2−22−222<br>
TEL 026−xxx−xxxx<br>
Copyright(C)1990−2000 ABC Ltd. All Right Reserved.</span>
</td>
</tr>
</table>
<p> </p>
</div>
</BODY>
</HTML>
【0043】
最初に現れる<table>タグと最後に現れる</table>タグとで挟まれている部分が、住所情報抽出範囲であり、この中には、「○○○○旅館」、「××ホテル」、・・・・、「△△△温泉ホテル」の住所情報の他に、このページの作者である「ABC長野放送」の住所情報が入っている。しかしながら、この「ABC長野放送」の住所情報は、その近辺に作者情報を示すキーワードである「Copyright」が存在し、さらに、深い階層の<table>タグ及び</table>タグで挟まれている。このため、「ABC長野放送」の住所情報は、重要度が低いと判断され、削除される。これにより、「長野の温泉宿」として、所望の「○○○○旅館」、「××ホテル」、・・・・、「△△△温泉ホテル」の住所情報のみが抽出されることとなる。
【0044】
このようにして抽出された「長野の温泉宿」の各住所情報は、緯度経度変換DB19(図2)を用いることによって緯度経度情報に変換され、地図DB20(図2)から得た地図上に重ねて合成することによって地図情報が作成される。この作成された地図情報が移動端末通信網の移動端末11、12、13に供給される。なお、移動端末側が地図を既に有している場合は、合成することなく緯度経度情報に変換された住所情報を移動端末に供給するようにしても良い。
【0045】
上述した実施形態では、位置情報ポータル装置18は、表示すべき対象の検索要求を移動通信網10側から受けてリアルタイムで情報検索し、住所情報の抽出及び地図表示を行っているが、表示すべき対象の検索及び住所情報の抽出さらに必要に応じて地図上への表示をあらかじめ行って記憶しておき、移動通信網からの要求に応じてその記憶内容を提供するようにも良いことは明らかである。
【0046】
以上述べた実施形態は全て本発明を例示的に示すものであって限定的に示すものではなく、本発明は他の種々の変形態様及び変更態様で実施することができる。従って本発明の範囲は特許請求の範囲及びその均等範囲によってのみ規定されるものである。
【0047】
【発明の効果】
以上詳細に説明したように本発明によれば、ウェブテキストから抽出した文字列が特定のキーワードを含むかどうかを調べて各住所情報の重要度を決定し、重要度の低い住所情報に関する文字列を削除するようにしているため、必要な住所情報のみを効率良く抽出することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態として、位置情報ポータルサービスシステムの構成を概略的に示す図である。
【図2】位置情報ポータル装置の構成を概略的に表すブロック図である。
【図3】位置情報ポータル装置の動作を説明する図である。
【図4】位置情報ポータル装置における住所情報抽出手段の機能を説明するフローチャートである。
【図5a】住所情報の抽出処理の一例を説明するフローチャートである。
【図5b】住所情報の抽出処理の一例を説明するフローチャートである。
【符号の説明】
10 移動通信網
11 カーナビゲーション端末
12 携帯情報端末(PDA)
13 携帯電話
14 GPS衛星
15 IP網
16、17 ウェブサーバ
18 位置情報ポータル装置
18a 検索要求手段
18b 検索結果読み込み手段
18c 住所情報抽出手段
18d 緯度経度変換手段
18e 合成手段
19 緯度経度変換DB
20 地図DB

Claims (16)

  1. インターネットプロトコル網を介して取り込んだウェブテキストについて住所情報に関する抽出範囲を決定し、該決定した抽出範囲内のウェブテキストから複数の住所情報に該当する文字列を抽出し、少なくとも該抽出した文字列が特定のキーワードを含むかどうかを調べることにより各住所情報の重要度を決定し、重要度の低い住所情報に関する前記抽出した文字列を削除して必要な住所情報に関する文字列のみを残すことを特徴とする住所情報の自動抽出方法。
  2. 前記抽出範囲が、ウェブテキストの所定のタグによって定まる範囲であることを特徴とする請求項1に記載の方法。
  3. 前記所定のタグが、<TABLE>及び</TABLE>タグであることを特徴とする請求項2に記載の方法。
  4. 前記住所情報の重要度が、前記所定のタグによって決まる階層の深さによっても決定されることを特徴とする請求項2又は3に記載の方法。
  5. 前記複数の住所情報に該当する文字列の抽出が、パターンマッチングによって行われることを特徴とする請求項1から4のいずれか1項に記載の方法。
  6. 前記特定のキーワードが、該ウェブテキストの作者情報を表すキーワードであることを特徴とする請求項1から5のいずれか1項に記載の方法。
  7. 請求項1から6のいずれか1項に記載の方法によって地図上に表示すべき対象の住所情報を抽出し、該抽出した住所情報を緯度経度情報に変換して移動通信網に提供することを特徴とする位置情報提供方法。
  8. 請求項1から6のいずれか1項に記載の方法によって地図上に表示すべき対象の住所情報を抽出し、該抽出した住所情報を緯度経度情報に変換し、該緯度経度情報に従って前記対象を地図上に合成してなる地図情報を作成して移動通信網に提供することを特徴とする位置情報提供方法。
  9. インターネットプロトコル網に接続されており、該インターネットプロトコル網上のウェブサーバから取り込んだウェブテキストについて住所情報に関する抽出範囲を決定する手段と、該決定した抽出範囲内のウェブテキストから複数の住所情報に該当する文字列を抽出する手段と、少なくとも該抽出した文字列が特定のキーワードを含むかどうかを調べることにより各住所情報の重要度を決定する手段と、重要度の低い住所情報に関する前記抽出した文字列を削除して必要な住所情報の文字列のみを残す手段とを備えたことを特徴とする住所情報の自動抽出装置。
  10. 前記抽出範囲が、ウェブテキストの所定のタグによって定まる範囲であることを特徴とする請求項9に記載の装置。
  11. 前記所定のタグが、<TABLE>及び</TABLE>タグであることを特徴とする請求項10に記載の装置。
  12. 前記住所情報の重要度を決定する手段が、前記所定のタグによって決まる階層の深さによっても重要度を決定する手段であることを特徴とする請求項10又は11に記載の装置。
  13. 前記複数の住所情報に該当する文字列を抽出する手段が、パターンマッチングにより該当する文字列を抽出する手段であることを特徴とする請求項9から12のいずれか1項に記載の装置。
  14. 前記特定のキーワードが、該ウェブテキストの作者情報を表すキーワードであることを特徴とする請求項9から13のいずれか1項に記載の装置。
  15. 地図上に表示すべき対象の住所情報を抽出する請求項9から14のいずれか1項に記載の装置と、該抽出した各住所情報に関する文字列情報を緯度経度情報に変換して移動通信網に提供する手段とを備えたことを特徴とする位置情報提供装置。
  16. 地図上に表示すべき対象の住所情報を抽出する請求項9から14のいずれか1項に記載の装置と、該抽出した各住所情報に関する文字列情報を緯度経度情報に変換する手段と、該緯度経度情報に従って前記対象を地図上に合成してなる地図情報を作成して移動通信網に提供する手段とを備えたことを特徴とする位置情報提供装置。
JP2003073460A 2003-03-18 2003-03-18 住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置 Withdrawn JP2004280659A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003073460A JP2004280659A (ja) 2003-03-18 2003-03-18 住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003073460A JP2004280659A (ja) 2003-03-18 2003-03-18 住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置

Publications (1)

Publication Number Publication Date
JP2004280659A true JP2004280659A (ja) 2004-10-07

Family

ID=33289354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003073460A Withdrawn JP2004280659A (ja) 2003-03-18 2003-03-18 住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置

Country Status (1)

Country Link
JP (1) JP2004280659A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006155275A (ja) * 2004-11-30 2006-06-15 Denso It Laboratory Inc 情報抽出方法及び情報抽出装置
JP2008527503A (ja) * 2004-12-30 2008-07-24 グーグル インコーポレイテッド 地理的関連性に従う文書のインデックス付け
JP2009511991A (ja) * 2005-10-12 2009-03-19 グーグル インク. 分散型地理情報システムのエンティティ表示の優先順位付け
JP2009104528A (ja) * 2007-10-25 2009-05-14 Oki Electric Ind Co Ltd 位置表現抽出装置、方法及びプログラム
CN102325303A (zh) * 2011-09-16 2012-01-18 惠州Tcl移动通信有限公司 一种基于无线通讯设备的位置定位方法及无线通讯设备
JP2014021167A (ja) * 2012-07-12 2014-02-03 Ricoh Co Ltd 業務支援システム、その制御装置及び制御方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006155275A (ja) * 2004-11-30 2006-06-15 Denso It Laboratory Inc 情報抽出方法及び情報抽出装置
US7801897B2 (en) 2004-12-30 2010-09-21 Google Inc. Indexing documents according to geographical relevance
JP2008527503A (ja) * 2004-12-30 2008-07-24 グーグル インコーポレイテッド 地理的関連性に従う文書のインデックス付け
US9189496B2 (en) 2004-12-30 2015-11-17 Google Inc. Indexing documents according to geographical relevance
US8290942B2 (en) 2005-10-12 2012-10-16 Google Inc. Entity display priority in a distributed geographic information system
US8965884B2 (en) 2005-10-12 2015-02-24 Google Inc. Entity display priority in a distributed geographic information system
JP2009511991A (ja) * 2005-10-12 2009-03-19 グーグル インク. 分散型地理情報システムのエンティティ表示の優先順位付け
US9715530B2 (en) 2005-10-12 2017-07-25 Google Inc. Entity display priority in a distributed geographic information system
US9785648B2 (en) 2005-10-12 2017-10-10 Google Inc. Entity display priority in a distributed geographic information system
US9870409B2 (en) 2005-10-12 2018-01-16 Google Llc Entity display priority in a distributed geographic information system
US10592537B2 (en) 2005-10-12 2020-03-17 Google Llc Entity display priority in a distributed geographic information system
US11288292B2 (en) 2005-10-12 2022-03-29 Google Llc Entity display priority in a distributed geographic information system
JP2009104528A (ja) * 2007-10-25 2009-05-14 Oki Electric Ind Co Ltd 位置表現抽出装置、方法及びプログラム
CN102325303A (zh) * 2011-09-16 2012-01-18 惠州Tcl移动通信有限公司 一种基于无线通讯设备的位置定位方法及无线通讯设备
JP2014021167A (ja) * 2012-07-12 2014-02-03 Ricoh Co Ltd 業務支援システム、その制御装置及び制御方法

Similar Documents

Publication Publication Date Title
CN101647020B (zh) 搜索结构化地理数据
CN102033934B (zh) 一种形成提问的方法、装置和知识问答系统的服务器端
US20090228490A1 (en) Apparatus and method for universal data access by location based systems
CN105704675A (zh) 一种景区信息的处理方法及装置
JP5529092B2 (ja) 注記データ翻訳装置、注記データ翻訳方法および注記データ翻訳プログラム
CN104572782A (zh) 一种基于浏览器搜索的定向消息推送方法及系统
US20050234991A1 (en) Automated location indexing by natural language correlation
CN108984640A (zh) 一种基于web数据挖掘的地理信息获取方法
KR20120094562A (ko) 번역문에서 키워드 추출에 의해 부가 정보를 검색하는 시스템 및 방법
JP2007114942A (ja) メタデータ生成装置およびメタデータ生成方法
JP5587281B2 (ja) 注記表記変換装置、注記表記変換方法および注記表記変換プログラム
JP2004280659A (ja) 住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置
JP2016058057A (ja) 翻訳システム、翻訳方法、コンピュータプログラム、コンピュータが読み取り可能な記憶媒体
US20100325143A1 (en) Automatically linking geographic terms to geographic information
JP4987687B2 (ja) 配信サーバ及び配信方法
JP2009037502A (ja) 情報処理装置
KR100572751B1 (ko) 웹 기반의 지리정보 검색 시스템
CN104504070B (zh) 一种搜索的方法和装置
Schockaert et al. Mining topological relations from the web
Fränti et al. MOPSI location-based search engine: concept, architecture and prototype
WO2022192609A1 (en) Automated structured data object creation and location integration into multiple location applications
US20120150884A1 (en) Apparatus and method for universal data access by location based systems
CN104504069A (zh) 一种文档索引的建立方法和装置
JP2004086272A (ja) 位置情報処理装置、方法及びコンピュータプログラム
JP2006172380A (ja) 空間データの検索用インデックス作成装置および空間データ検索装置および空間データの検索用インデックス作成方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060606