JP2004086272A - 位置情報処理装置、方法及びコンピュータプログラム - Google Patents

位置情報処理装置、方法及びコンピュータプログラム Download PDF

Info

Publication number
JP2004086272A
JP2004086272A JP2002242952A JP2002242952A JP2004086272A JP 2004086272 A JP2004086272 A JP 2004086272A JP 2002242952 A JP2002242952 A JP 2002242952A JP 2002242952 A JP2002242952 A JP 2002242952A JP 2004086272 A JP2004086272 A JP 2004086272A
Authority
JP
Japan
Prior art keywords
information
address
position information
latitude
related information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002242952A
Other languages
English (en)
Inventor
Noritsugu Kimura
木村 典嗣
Toshiya Yoshimura
吉村 俊哉
Tsutomu Horikoshi
堀越 力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2002242952A priority Critical patent/JP2004086272A/ja
Publication of JP2004086272A publication Critical patent/JP2004086272A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】様々な情報が混在する情報の中かから、短時間で住所情報を抽出し、そこから当該住所の正確な位置を特定することができる仕組みを得る。
【解決手段】抽出処理部14が、様々な情報が混在するWebページなどの情報中から住所の特定が容易な項目を表す住所関係情報を特定し、この住所関係情報に関連付けられている住所情報を抽出し、位置情報変換部15がアドレスジオデータベース11を参照して、当該住所を表す位置情報に変換して、データ出力部16が変換された位置情報を出力するようにした。
【選択図】    図1

Description

【0001】
【発明の属する技術分野】
本発明は、所定の情報中から住所情報を抽出し、抽出した住所情報の緯度経度情報を特定するための技術に関する。
【0002】
【従来の技術】
従来から、例えば、Webページなどの情報から、都道府県名や地名などの住所情報を抽出し、この住所情報を緯度経度情報に変換するアドレスジオデータベースが用いられている。
このデータベースを用いる場合、住所情報に基づいて検索を行う必要があるが、通常Webページ上には住所情報のほかに様々な情報が混在しているため、従来は、自然言語解析によりWebページ中の情報を解析して、解析した言語情報に基づいて位置情報の抽出を行っていた。
【0003】
【発明が解決しようとする課題】
しかし、従来の自然言語処理による位置情報の抽出を行う場合には、住所に関係のない文字列まで抽出してしまうことが多かった。
そのため、住所に関係のない文字列までアドレスジオデータベースで検索を行うこととなり、住所情報から位置情報への変換処理に大変な時間がかかってしまい、これが実用化への障害となっていた。
【0004】
本発明は上述の問題点を解決するためになされたものであって、住所情報を含む様々な情報が含まれた情報の中から、短時間で住所情報を抽出し、そこから当該住所の正確な位置を特定できる仕組みを提供することを課題とする。
【0005】
【課題を解決するための手段】
上述の課題を解決するため、本発明にかかる位置情報処理装置は、住所情報を含む様々な情報を含んだ情報の中から、住所の特定が可能な項目を表す住所関係情報を特定し、特定した住所関係情報に関係付けられている住所情報を抽出する抽出手段と、住所情報と当該住所の緯度経度を表す位置情報を関連付けて記憶する記憶手段と、上記記憶手段を参照して、 抽出された住所情報を位置情報に変換する変換手段と、変換された位置情報を出力する出力手段とを有することを特徴とする。
【0006】
また、上記抽出手段は、上記情報を形態素解析により単語ごとに分解し、分解した文字列の中から住所関係情報を抽出するようにしてもよい。
【0007】
また、上記抽出手段は、上記抽出された住所関係情報の後に続いている情報を住所情報として特定するようにしてもよい。
【0008】
本発明にかかる位置情報処理方法は、コンピュータにより、住所情報を含む様々な情報を含んだ情報の中から、住所の特定が可能な項目を表す住所関係情報を特定する処理と、上記特定した住所関係情報に関係付けられている住所情報を抽出する処理と、住所情報と当該住所の緯度経度を表す位置情報を関連付けて記憶した記憶手段を参照して、抽出された住所情報を位置情報に変換する処理とを行うことを特徴とする。
【0009】
本発明にかかるコンピュータプログラムは、コンピュータに対して、住所情報を含む様々な情報を含んだ情報の中から、住所の特定が可能な項目を表す住所関係情報を特定する処理と、上記特定した住所関係情報に関係付けられている住所情報を抽出する処理と、住所情報と当該住所の緯度経度を表す位置情報を関連付けて記憶した記憶手段を参照して、抽出された住所情報を位置情報に変換する処理とを実行させることを特徴とする。
【0010】
【発明の実施の形態】
以下、図面を参照して本発明にかかる位置情報処理装置及びコンピュータプログラムを、インターネット上のWebページを検索してショップの情報を抽出して登録するシステムに適用した一実施形態について説明する。
図1に本実施形態にかかるシステムの概略構成を示す。
図1において、本実施形態にかかるシステムは、位置情報処理装置1と、この位置情報処理装置1とLAN(Local Area Network)あるいはWAN(Wide Area Network)などの所定のネットワークを介して接続可能に構成されたサーバ2と、インターネットを介して位置情報処理装置1と接続可能に構成されたWebサーバ3から構成されている。
【0011】
サーバ2は、コンピュータにより構成され、位置情報処理装置1が出力したショップの緯度経度情報やショップなどを表す画像のメタファイルなどのデータをデータベース化して管理することができる。
なお、本実施形態では、サーバ2は、位置情報処理装置1とネットワークを介して接続可能に構成されているが、このような構成に限定されるものではない。例えば、データサーバ2をスタンドアロンとし、CD−ROMなどの所定のコンピュータ読み取り可能な記録媒体を介して位置情報処理装置1が出力したデータを受け取るように構成してもよい。
【0012】
Webサーバ3は、所定のWebページを介して情報の提供を行うことができるコンピュータである。Webページを通して提供される情報は、テキストデータ、動画、静止画などの画像データ、音声データなどにより構成されていてもよく、限定されるものではない。
【0013】
位置情報処理装置1は、コンピュータにより構成され、図示しない表示手段としてのディスプレイ及び入力手段としてのキーボード、マウスなどのが接続可能となっている。
この位置情報処理装置1は、CPU(Central Processing Unit)、CPUが実行するコンピュータプログラム、このコンピュータプログラム等を記憶することができるRAM、ROMなどの内部メモリ及びハードディスクドライブなどの外部記憶装置により図1に示した機能ブロックを構成することができる。
図1に示した機能ブロックは、 アドレスジオデータベース(DB)11、データ収集部12、アドレスジオ編集部13、抽出処理部14、位置情報変換部15、データ出力部16から構成されている。
【0014】
アドレスジオデータベース11は、住所情報とこれに対応する位置情報とをデータベース化したものである。
住所情報は、住所を特定できる情報であればよく、例えば、住所(都道府県、市町村、番地)、郵便番号、電話番号(市外局番)、FAX番号、(市外局番)などが含まれる。
また、位置情報は、当該住所の位置を特定する情報であって、例えば、緯度経度情報などがある。
【0015】
データ収集部12は、Webサーバ3が提供しているWebページのデータ収集を行う。このデータ収集を行う場合、例えば、データ収集部12が所定のインターネットの検索エンジンなどを用いて、「ショップ」というキーワードを含むWebページを検索するようにしてもよい。
また、データ収集部12は、Webページ上のHTML、画像、音声などの所定形式の情報をテキストデータに変換する処理を行うことができる。
【0016】
アドレスジオデータ編集部13は、アドレスジオデータベース11のデータの登録、修正、削除の処理を行う。
この修正等の処理は、住所の名称等が変更になった場合など、適当な時期に行えばよい。
【0017】
抽出処理部14は、データ収集部12が収集したデータの入力を受け付け、受け付けた情報中から住所関係情報を特定し、この住所関係情報に関連付けられている住所情報を抽出する処理を行う。
ここに、住所関係情報とは、住所情報が存在する可能性が高い項目を表す情報などをいう。この住所関係情報としては、例えば、「住所」、「電話番号」又は「TEL」、「FAX番号」又は「ファクシミリ」、「郵便番号」又は「〒」、「都道府県名」などの項目名が含まれる。
また、抽出処理部14は、入力された情報を形態素解析により単語ごとに分解し、この単語の中から住所関係情報を抽出し、抽出した住所関係情報の後に続いて列挙されている情報を住所情報として特定することができる。
【0018】
位置情報変換部15は、アドレスジオデータベース11を参照して、抽出された住所情報を当該住所に対応する位置情報に変換する処理を行う。
この処理としては、位置情報変換部15が、抽出された住所情報がアドレスジオデータベース11に存在しているか否か判別し、存在している場合には当該住所に該当する緯度経度情報を特定することにより行うことができる。
【0019】
データ出力部16は、住所情報から変換された位置情報をサーバ2に対して出力する処理を行う。
この際、データ出力部16は、緯度経度情報や登録するショップを表すメタデータファイルを例えばXML形式などに変換することにより、サーバ2が登録する際のデータ形式にあわせる処理を行うようにしてもよい。
また、登録に際しては、データ出力部16が、緯度経度情報等をディスプレイ上に表示するなどしてユーザに確認、修正のチェックを行った上で、サーバ2へ登録を行うようにしてもよい。
【0020】
次に、本発明にかかる位置情報処理方法の一実施形態を、インターネット上に掲載されている所定のショップの情報を収集して、その場所を地図データベースに登録する際の処理を例として説明する。
なお、前処理としてアドレスジオデータ編集部13により、住所情報とその緯度経度情報が予めアドレスジオデータベース11に記憶されているものとする。図2において、まず、データ収集部12が、インターネットを介してショップに関するWebページを検索すると共に、検索されたWebページに掲載されているショップのテキストデータ、画像データ等を収集する(S1)。このデータ収集処理は、データ収集部12が定期的に行ってもよいし、またユーザからの指示に基づいて行うようにしてもよい。
データの収集が完了すると、データ収集処理部12は、収集したデータをテキストデータに変換して抽出処理部14に提供する(S2)。
【0021】
抽出処理部14は、提供されたテキストデータの文章を1文ずつに区切る処理を行う(S3)。この処理は、例えば、図3に示すように、テキストデータ内のタグに基づいて一文ずつに区切ってもよい。
抽出処理部14は、区切られた各文に対して、形態素解析を行い品詞単位に分解する(S4)。この形態素解析としては、例えば、抽出処理部14が、図示しない「辞書データ」と文法に関する「解析ライブラリ」などを参照することで行うことができ、これにより図4に示すように各文章を品詞単位に分解することができる。
【0022】
形態素解析処理が完了すると、抽出処理部14は分解された単語の中から住所関係情報として、例えば、住所、電話番号、FAX番号、郵便番号及びそのマーク、都道府県名を抽出する(S5)。
図4の例では、抽出処理部14は、郵便のマーク「〒」、都道府県名としての「東京都」、電話番号の公務を表す「TEL」などを住所関連情報として抽出する。
【0023】
抽出処理部14は、抽出された住所関係情報の後に列挙されている文字列、例えば、図4の例では、「〒」のあとに列挙されている「135−6033」、または「東京都」の後に列挙されている「江東区3−3」、「TEL」の後に列挙されている「03−**−**」を住所情報として特定する(S6)。
【0024】
位置情報変換部15は、アドレスジオデータベース11を参照して、抽出された住所情報に対応する位置情報が登録されているか判別する(S7)。
判別の結果、アドレスジオデータベース11に登録されていない場合には、抽出処理部14が上述のステップS5に戻って、他の住所関係情報を抽出して処理を繰り返す。
【0025】
また、S7の判別の結果、住所情報がアドレスジオデータベース11に登録されている場合には、位置情報変換部15はアドレスジオデータベース11を参照して、住所情報を、これに対応付けて登録されている位置情報(緯度経度情報)に変換する(S8)。
【0026】
そして、抽出処理部14は、収集したWebデータ中に他の住所関係情報が含まれていないか判別する(S9)。
判別の結果、他の住所関係情報がある場合には、S5の処理に戻って処理を繰り返す。
【0027】
また、判別の結果、他の住所関係情報がない場合には、データ出力部16は特定された位置情報としての緯度経度情報及び、必要に応じて作成された当該ショップを表示するためのメタファイルをXMLのデータに変換する(S10)。
これにより、サーバ2が管理しているメタファイルデータベースへの登録の前処理が完了する。
データ出力部16は、例えば図5に示すように、取得した位置情報及びショップを表す画像情報をディスプレイ上に表示して、ユーザにこの情報を登録するか否か確認する(S11)。
確認の結果、ユーザが登録を選択した場合には、データ出力部16は、ショップの位置情報等を含むXMLファイルをサーバ2に提供して(S12)、処理を終了する。
これにより、サーバ2側では図6に示すように提供されたXMLファイルの位置情報等に基づいて、ショップを所定の地図上に対応付けて登録することができる。
【0028】
このように、本実施形態によれば、抽出処理部14が、インターネット上のWebページから収集した情報中から住所関係情報を特定し、この住所関係情報に関連付けられている住所情報を抽出し、位置情報変換部15が、抽出された住所情報を、当該住所を表す緯度経度情報に変換して、データ出力部16から出力するようにしたことから、住所情報の抽出から緯度経度情報の抽出までの一連の処理を効率的に行うことができる。
即ち、位置情報変換部15がアドレスジオデータベースの検索を行うのは、住所関係情報の後に列挙されている住所情報のみであるから、従来のように全ての単語等について検索を行う場合に比べて、アドレスジオデータベース11の検索の回数及び時間を大幅に短縮できる。
【0029】
また、抽出処理部14は、入力された情報を形態素解析により単語ごとに分解し、分解した文字列の中から住所関係情報を抽出するようにしたことから、住所関係情報を単語単位で処理することができ、効率的に処理を行うことができる。
【0030】
また、抽出処理部14は、抽出された住所関係情報の後に続いている情報を住所情報として特定するようにしたことから、住所関係情報の後には住所を特定する情報が存在する可能性が高いため、効率的に住所情報の特定ができる。
【0031】
また、位置情報として緯度経度情報を出力するようにしたことから、ユーザとしてはその場所を簡単に確認できるし、サーバ2では緯度経度情報を基に地図上で平面データとして簡単に登録ができるようになる。
【0032】
本実施形態の位置情報処理装置1用のコンピュータプログラムを、コンピュータ読み取り可能な媒体(FD、CD−ROM等)に格納して配布してもよいし、搬送波に重畳し、通信ネットワークを介して配信することも可能である。
なお、位置情報処理装置1の機能をOS(Operating System)が分担又はOSとアプリケーションプログラムの共同により実現する場合等には、OS以外の部分のみをコンピュータプログラムとして、またこのコンピュータプログラムをコンピュータ読み取り可能な媒体に格納したり、このコンピュータプログラムを配信等してもよい。
【0033】
【発明の効果】
本発明によれば、様々な情報が混在する情報の中から、短時間で住所情報を抽出し、そこから当該住所の正確な位置を特定することができる。
【図面の簡単な説明】
【図1】本発明にかかる位置情報処理装置及びコンピュータプログラムを適用したシステムの一実施形態の概略構成図。
【図2】本実施形態にかかる位置情報処理方法の処理の流れを示した処理フロー。
【図3】本実施形態にかかるWebページから収集した情報の一例を示す図。
【図4】本実施形態にかかるWebページから収集した情報から住所関係情報等を抽出する際の例を示した図。
【図5】本実施形態にかかる位置情報の登録をユーザに確認する際の画面の一例を示した図。
【図6】本実施形態にかかる抽出したショップの位置情報に基づいて地図上にアイコンを登録した際の画面の一例を示した図。
【符号の説明】
1   位置情報処理装置
11  アドレスジオデータベース
12  データ収集部
14  抽出処理部
15  位置情報変換部
16  データ出力部

Claims (5)

  1. 住所情報を含む様々な情報を含んだ情報の中から、住所の特定が可能な項目を表す住所関係情報を特定し、特定した住所関係情報に関係付けられている住所情報を抽出する抽出手段と、
    住所情報と当該住所の緯度経度を表す位置情報を関連付けて記憶する記憶手段と、
    上記記憶手段を参照して、抽出された住所情報を位置情報に変換する変換手段と、
    上記変換された位置情報を出力する出力手段と、
    を有することを特徴とする位置情報処理装置。
  2. 上記抽出手段は、上記情報を形態素解析により単語ごとに分解し、分解した文字列の中から住所関係情報を抽出する、
    請求項1記載の位置情報処理装置。
  3. 上記抽出手段は、上記抽出された住所関係情報の後に続いている情報を住所情報として特定する、
    請求項1又は2記載の位置情報処理装置。
  4. コンピュータにより、
    住所情報を含む様々な情報を含んだ情報の中から、住所の特定が可能な情報を含む項目を表す住所関係情報を特定する処理と、
    上記特定した住所関係情報に関係付けられている住所情報を抽出する処理と、住所情報と当該住所の緯度経度を表す位置情報を関連付けて記憶した記憶手段を参照して、抽出された住所情報を位置情報に変換する処理と、
    を行うことを特徴とする位置情報処理方法。
  5. コンピュータに対して、
    住所情報を含む様々な情報を含んだ情報の中から、住所の特定が可能な情報を含む項目を表す住所関係情報を特定する処理と、
    上記特定した住所関係情報に関係付けられている住所情報を抽出する処理と
    住所情報と当該住所の緯度経度を表す位置情報を関連付けて記憶した記憶手段を参照して、抽出された住所情報を位置情報に変換する処理と、
    を実行させるコンピュータプログラム。
JP2002242952A 2002-08-23 2002-08-23 位置情報処理装置、方法及びコンピュータプログラム Pending JP2004086272A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002242952A JP2004086272A (ja) 2002-08-23 2002-08-23 位置情報処理装置、方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002242952A JP2004086272A (ja) 2002-08-23 2002-08-23 位置情報処理装置、方法及びコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2004086272A true JP2004086272A (ja) 2004-03-18

Family

ID=32051840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002242952A Pending JP2004086272A (ja) 2002-08-23 2002-08-23 位置情報処理装置、方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2004086272A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902536A (zh) * 2012-12-24 2014-07-02 中国电信股份有限公司 基于电子地图的热门活动显示方法和系统
WO2016075830A1 (ja) * 2014-11-14 2016-05-19 富士通株式会社 情報取得プログラム、情報取得方法および情報取得装置
WO2016113887A1 (ja) * 2015-01-15 2016-07-21 富士通株式会社 情報処理装置、情報処理方法および情報処理プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339330A (ja) * 1999-05-28 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 座標付きホームページ情報収集提供方法、記録媒体及び装置
JP2002082982A (ja) * 2000-09-06 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 情報提供装置および方法と情報提供プログラムを記録した記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339330A (ja) * 1999-05-28 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 座標付きホームページ情報収集提供方法、記録媒体及び装置
JP2002082982A (ja) * 2000-09-06 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 情報提供装置および方法と情報提供プログラムを記録した記録媒体

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902536A (zh) * 2012-12-24 2014-07-02 中国电信股份有限公司 基于电子地图的热门活动显示方法和系统
WO2016075830A1 (ja) * 2014-11-14 2016-05-19 富士通株式会社 情報取得プログラム、情報取得方法および情報取得装置
US20170242853A1 (en) * 2014-11-14 2017-08-24 Fujitsu Limited Information acquisition method, and information acquisition device
JPWO2016075830A1 (ja) * 2014-11-14 2017-08-31 富士通株式会社 情報取得プログラム、情報取得方法および情報取得装置
US10726076B2 (en) 2014-11-14 2020-07-28 Fujitsu Limited Information acquisition method, and information acquisition device
WO2016113887A1 (ja) * 2015-01-15 2016-07-21 富士通株式会社 情報処理装置、情報処理方法および情報処理プログラム
JPWO2016113887A1 (ja) * 2015-01-15 2017-08-03 富士通株式会社 情報処理装置、情報処理方法および情報処理プログラム

Similar Documents

Publication Publication Date Title
JP5064388B2 (ja) 位置識別方法
JP5371480B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2010518495A (ja) 構造化された地理的なデータの検索
JP2007249322A (ja) 文書視覚化装置及び文書視覚化プログラム
JP2007114942A (ja) メタデータ生成装置およびメタデータ生成方法
JP2009075757A (ja) 情報処理装置、およびプログラム
US7343372B2 (en) Direct navigation for information retrieval
JP2011165092A (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
JP2009037502A (ja) 情報処理装置
JP2004086272A (ja) 位置情報処理装置、方法及びコンピュータプログラム
JP2007011973A (ja) 情報検索装置及び情報検索プログラム
JP4002943B1 (ja) 検索最適化装置、方法、及びコンピュータプログラム
JP5688754B2 (ja) 情報検索装置及びコンピュータプログラム
JP2009259248A (ja) ウェブページに含まれるイメージに対してタグ付けを実行し、その結果を利用してウェブ検索サービスを提供するための方法、装置及びコンピュータ読み取り可能な記録媒体
JP2006155275A (ja) 情報抽出方法及び情報抽出装置
JP2006309631A (ja) ウェブページデータの検索
JPH10307837A (ja) 検索装置並びに検索プログラムを記録した記録媒体
JP2009282903A (ja) 知識抽出・検索装置およびその方法
JP2004280659A (ja) 住所情報の自動抽出方法、抽出装置、位置情報提供方法及び提供装置
JP6082085B1 (ja) ジャンル推定サーバ、ジャンル推定方法、およびジャンル推定プログラム
CN111680122A (zh) 空间数据主动推荐方法、装置、存储介质及计算机设备
JP2002342342A (ja) 文書管理方法及びその実施システム並びにその処理プログラムと記録媒体
JPH1145254A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001101197A (ja) 電子文書の付加情報検索方法およびシステム
JP3467159B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050802