JP2009087140A - 位置表記検索システム、方法及びプログラム - Google Patents
位置表記検索システム、方法及びプログラム Download PDFInfo
- Publication number
- JP2009087140A JP2009087140A JP2007257689A JP2007257689A JP2009087140A JP 2009087140 A JP2009087140 A JP 2009087140A JP 2007257689 A JP2007257689 A JP 2007257689A JP 2007257689 A JP2007257689 A JP 2007257689A JP 2009087140 A JP2009087140 A JP 2009087140A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- position notation
- notation character
- information
- priority
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】入力された位置表記文字列の一部を含む位置表記文字列候補が複数存在する場合において、利用者の状況に応じて最適な表記優先順位を与えることができるようにする。
【解決手段】本発明の位置表記検索システムは、入力された位置表記文字列の一部に対応する位置表記文字列を検索する位置表記検索システムにおいて、少なくとも、複数の位置表記文字列と、各位置表記文字列の位置情報とを対応付けて記憶する位置表記文字列記憶手段と、位置表記文字列記憶手段から、入力された位置表記文字列の一部を含む1又は複数の位置表記文字列候補を検索する位置表記文字列検索手段と、位置表記文字列検索手段により複数の位置表記文字列候補が検索された場合に、各位置表記文字列候補の位置情報と1又は複数の基準情報とに基づいて、各位置表記文字列候補の優先順位を決定する優先順位決定手段とを備えることを特徴とする。
【選択図】 図1
【解決手段】本発明の位置表記検索システムは、入力された位置表記文字列の一部に対応する位置表記文字列を検索する位置表記検索システムにおいて、少なくとも、複数の位置表記文字列と、各位置表記文字列の位置情報とを対応付けて記憶する位置表記文字列記憶手段と、位置表記文字列記憶手段から、入力された位置表記文字列の一部を含む1又は複数の位置表記文字列候補を検索する位置表記文字列検索手段と、位置表記文字列検索手段により複数の位置表記文字列候補が検索された場合に、各位置表記文字列候補の位置情報と1又は複数の基準情報とに基づいて、各位置表記文字列候補の優先順位を決定する優先順位決定手段とを備えることを特徴とする。
【選択図】 図1
Description
本発明は、位置表記検索システム、方法及びプログラムに関し、例えば、入力された位置表記文字列の一部に基づいて、完全な位置表記文字列を決定する表記順序決定システム、方法及びプログラムに適用し得るものである。
例えば、情報処理において、住所の一部のみを入力し、その一部を含む住所を検索し、完全な住所を出力することは既に広く行なわれている。
このとき、入力された住所の一部を含む住所が複数存在する場合には、複数の住所が候補として挙げられることがあるため、利用者が希望する住所を的確に出力するには、例えば、一意に特定できるだけの、より長い住所の再入力を求めるか、又は利用者の状況にかかわらず、常に一定の順序で並べたリストを提示し、利用者に選択させるものが一般的である。例えば、「日本橋」という地名は東京都と大阪府に存在するが、利用者の状況を考慮せず単にデータベースの格納順に提示する場合、関西からの利用であっても常に「東京都中央区日本橋」を上位候補として提示してしまい、必ずしも利用者の期待に応えられないことがある。
この問題を解決する従来技術として、特許文献1及び特許文献2に記載の技術がある。
特許文献1には、先に確定入力された住所文字列データを階層的な住所コードに分割して記憶・学習し、次の地名データの検索の際に、この学習されているデータを優先的に検索することにより、優先順位を付した住所候補を出力する技術が記載されている。
また、特許文献2には、例えばGPS(Global Positioning System)等によって得られる緯度・経度情報から利用者の現在位置を求め、階層ツリー構造をもつ地名辞書データと現在位置とを比較し、ノードからノードヘ至るパス上の枝の数で定義される距離を用いて住所候補の優先順位を決定し、住所候補を出力する技術が記載されている。
しかしながら、特許文献1に記載の技術を適用する場合、ある階層で同じ住所の一部を持つ候補に関しては優先順位を付すことができるが、それ以外の階層では優先順位を付すことができないという問題がある。
例えば、「日本橋」の例で示すならば、先に確定入力された住所が大阪府のものであれば優先順位を付すことができるが、奈良県のものであった場合は、埼玉県であった場合と区別できず優先順位を付すことができない。
また特許文献2の技術を適用する場合、住所候補がそれぞれ異なる都道府県である場合、いずれも「日本国」を経由するパスとなってしまうため(特許文献2の図4参照)、特許文献1の技術の場合と同様に、現在位置が奈良県であった場合と埼玉県であった場合とで、住所候補の優先順位を区別することができないという問題がある。
そのため、入力された位置表記文字列の一部を含む位置表記文字列候補が複数存在する場合において、これら複数の位置表記文字列候補に対して、利用者の状況に応じて最適な表記優先順位を与えることができる位置表記検索システム、方法及びプログラムが求められている。
かかる課題を解決するために、第1の本発明の位置表記検索システムは、入力された位置表記文字列の一部に対応する位置表記文字列を検索する位置表記検索システムにおいて、(1)少なくとも、複数の位置表記文字列と、各位置表記文字列の位置情報とを対応付けて記憶する位置表記文字列記憶手段と、(2)位置表記文字列記憶手段から、入力された位置表記文字列の一部を含む1又は複数の位置表記文字列候補を検索する位置表記文字列検索手段と、(3)位置表記文字列検索手段により複数の位置表記文字列候補が検索された場合に、各位置表記文字列候補の位置情報と1又は複数の基準情報とに基づいて、各位置表記文字列候補の優先順位を決定する優先順位決定手段とを備えることを特徴とする。
第2の本発明の位置表記検索方法は、入力された位置表記文字列の一部に対応する位置表記文字列を検索する位置表記検索方法において、(1)位置表記検索システムが、少なくとも、複数の位置表記文字列と、各位置表記文字列の位置情報とを対応付けて記憶する位置表記文字列記憶手段と、位置表記文字列検索手段と、優先順位決定手段とを備え、(2)位置表記文字列検索手段が、位置表記文字列記憶手段から、入力された位置表記文字列の一部を含む1又は複数の位置表記文字列候補を検索する位置表記文字列検索工程と、(3)優先順位決定手段が、位置表記文字列検索手段により複数の位置表記文字列候補が検索された場合に、各位置表記文字列候補の位置情報と1又は複数の基準情報とに基づいて、各位置表記文字列候補の優先順位を決定する優先順位決定工程とを有することを特徴とする。
第3の本発明の位置表記検索プログラムは、入力された位置表記文字列の一部に対応する位置表記文字列を検索する位置表記検索プログラムにおいて、(1)少なくとも、複数の位置表記文字列と、各位置表記文字列の位置情報とを対応付けて記憶する位置表記文字列記憶手段と接続可能なコンピュータに、(2)位置表記文字列記憶手段から、入力された位置表記文字列の一部を含む1又は複数の位置表記文字列候補を検索する位置表記文字列検索手段、(3)位置表記文字列検索手段により複数の位置表記文字列候補が検索された場合に、各位置表記文字列候補の位置情報と1又は複数の基準情報とに基づいて、各位置表記文字列候補の優先順位を決定する優先順位決定手段として機能させるものである。
本発明によれば、入力された位置表記文字列の一部を含む位置表記文字列候補が複数存在する場合において、これら複数の位置表記文字列候補に対して、利用者の状況に応じて最適な表記優先順位を与えることができる。
(A)第1の実施形態
以下では、本発明の位置表記検索システム、方法及びプログラムの第1の実施形態について図面を参照しながら説明する。
以下では、本発明の位置表記検索システム、方法及びプログラムの第1の実施形態について図面を参照しながら説明する。
第1の実施形態では、本発明の位置表記検索システム、方法及びプログラムを利用して、入力された位置表記文字列の一部(以下、部分位置表記という)から完全な位置表記文字列(以下、位置表記という)を検索する位置表記検索システムを実現する実施形態を例示して説明する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態の位置表記検索システム1の主な全体構成を示す全体構成図である。
図1は、第1の実施形態の位置表記検索システム1の主な全体構成を示す全体構成図である。
図1において、第1の実施形態の位置表記検索システム1は、表記順序決定部10、入力情報取得部20、基準情報提供部30、を少なくとも有して構成される。
なお、位置表記検索システム1はソフトウェア処理により実現されるものであり、そのハードウェア構成は図示しないが、例えば、CPU、ROM、RAMなどを備え、CPUが、ROMに格納される処理プログラムを処理に必要なデータを用いて実行することにより実現されるものである。
また、表記順序決定部10、入力情報取得部20及び基準情報提供部30はそれぞれ、物理的に同一のハードウェア構成上にある必要はなく、それぞれ別のハードウェア構成上にあってもよい。
入力情報取得部20は、利用者により入力された部分位置表記を取得し、この部分位置表記を表記順序決定部10に与えるものである。
表記順序決定部10は、入力情報取得部20から部分位置表記を取り込み、この部分位置表記に基づいて完全な位置表記候補を検索し、その検索結果を位置表記候補リストとして出力するものである。
また、表記順序決定部10は、部分位置表記に対応する位置表記候補が複数個ある場合、利用者の位置情報を含む基準情報を利用して複数の位置表記候補に優先度を付与し、この優先度に応じて位置表記候補の並べ替えをした位置表記候補リストを出力するものである。これにより、図示しない出力制御部が位置表記候補リストに挙げられている順番に従って位置表記候補を出力制御することができる。
表記順序決定部10は、位置表記・位置座標対応情報テーブル11、位置表記検索部12、優先順位決定部13を少なくとも有するものである。
位置表記・位置座標対応情報テーブル11は、位置表記とその位置の位置座標とが対応付けられたテーブルである。位置表記・位置座標対応情報テーブル11は、例えば、HDD(Hard Disk Drive)、ROM(Read Only Memory)などの記憶デバイスを含むハードウェア資源で実現される。
図2は、位置表記・位置座標対応情報テーブル11の構成を示す構成図である。図2に示すように、位置表記・位置座標対応情報テーブル11は、「ID」、「位置表記情報」、「位置座標情報」を管理項目として構成される。
「ID」は、位置表記・位置座標対応情報テーブル11の登録データを識別する識別情報である。「位置表記情報」は、例えば、「都道府県」、「市郡」、「区」、「町字」等の住所などの位置表記を格納するものである。「位置座標情報」は、対応する位置表記の「緯度」及び「経度」情報を格納するものである。
なお、図2において、「位置表記情報」は、「都道府県」、「市郡」、「区」、「町字」などの単位でそれぞれの列に格納するものとしたが、これに限定されず、例えば、ある位置表記全体を1個の位置表記として1個の列に格納してもよい。この理由については後述する。
位置表記検索部12は、入力情報取得部20から受け取った部分位置表記を用いて、位置表記・位置座標対応情報テーブル11から、部分位置表記を含む位置表記候補を検索して優先順位決定部13に与えるものである。
優先順位決定部13は、位置表記検索部12から複数の位置表記候補を受け取った場合、基準情報提供部30からの基準情報を用いて各位置表記候補に対して優先度を付与し、この優先度に従って並び替えをした位置表記候補を位置表記候補リストとして出力するものである。
ここで、優先順位決定部13による位置表記候補の優先度の決定方法は、利用者の位置情報を含む基準情報と各位置表記候補の位置座標情報とを利用して決定する方法を適用することができる。
例えば、後述するように基準情報提供部30からの基準情報が位置座標情報(例えば緯度情報及び経度情報)を含む情報である。そこで、優先順位決定部13は、位置表記候補のそれぞれの位置座標情報(例えば緯度情報及び経度情報)と基準情報(位置座標情報)の2点間距離を計算し、基準情報との2点間距離が小さい位置表記候補の優先度を高くするようにして決定する方法を適用できる。
ここで、2点間距離の計算方法としては、種々の計算方法を広く適用することができるが、例えば、球面三角法などを用いて厳密に計算する方法や、直角三角形の公式を用いた簡単な計算方法を適用することもできる。この基準情報との2点間距離は各位置表記候補の優先度を求めることが目的あるから、相対的な2点間距離の比較ができれば十分である。
例えば、単純に、各位置標記候補の位置座標情報と基準情報に基づいて、下記式(1)示すようにして2点間距離を求める方法を適用できる。
基準情報との2点間距離=(経度情報の差)2+(緯度情報の差)2 …(1)
この方法によれば、例え都道府県が異なる場合であっても、基準情報が示す基準点から近い順に、位置表記候補の優先順位を決定することが可能になる。
この方法によれば、例え都道府県が異なる場合であっても、基準情報が示す基準点から近い順に、位置表記候補の優先順位を決定することが可能になる。
また例えば、具体的な別の方法としては、基準情報が位置座標情報と方角情報を有する場合、次のような方法を適用できる。
図3に示すように、基準情報には位置座標情報20と方角情報21とが含まれる。ここで、方角情報21とは、例えば、電子コンパスのようにハードウェア装置から直接取得してもよく、移動体においてはある時間内での位置の移動情報から動きベクトルをもとに求めたものなどを適用できる。
具体的には、各位置表記候補の位置座標情報22及び23と基準情報の位置座標情報20との間を結ぶ直線を直線24及び25とする。そして、この直線24及び25のそれぞれと、位置座標情報20を基点とする方角情報21とのなす角度(劣角)をそれぞれθ1及びθ2とし、この角度θが小さいほど優先度が高くなるように決定する方法を適用できる。例えば、単純に下記式(2)を用いることができる。
基準情報の方角情報となす角度=cos(θ/2) …(2)
この方法によれば、基準点から指定した方向に一致する順に優先度を決定することができる。
この方法によれば、基準点から指定した方向に一致する順に優先度を決定することができる。
さらに、具体的な別の方法として、上記で説明した、基準情報との2点間距離と、方角情報とのなす角度との両方を用いて計算してもよい。この場合、角度θが同じならば距離小さいほど優先度が高く、距離が同じならば角度θが小さいほど優先度が高くなるような関数を用いればよい。例えば単純には下記式(3)を用いることができる。
この方法によれば、基準点からの距離と方向の一致を総合的に判断して優先度を決定することができる。
基準情報提供部30は、利用者が入力した部分位置表記に対応する位置表記候補の優先度を決定するために、基準情報を優先順位決定部13に与えるものである。
ここで、第1の実施形態では、基準情報提供部30が、利用者側の位置座標情報を利用して基準情報を求める場合の適用を説明する。
図4は、基準情報提供部30の内部構成を示す内部構成図である。第1の実施形態の基準情報提供部30は、位置座標情報取得部31と基準情報生成部32とを有する。
位置座標情報取得部31は、利用者の位置座標情報を取得し、その位置座標情報を基準情報生成部32に与えるものである。ここで、位置座標情報としては、例えば、GPSを利用したGPS情報(緯度情報及び経度情報)などを適用することができる。この場合、例えば、利用者が所持する携帯端末(例えば、携帯電話機など)が備えるGPS機能により定期的に取得したGPS情報を用いることができる。
基準情報生成部32は、位置座標情報取得部31から受け取った利用者の位置座標情報に基づいて基準情報を生成し、この生成した基準情報を表記順序決定部10に与えるものである。
ここで、基準情報生成部32による基準情報の生成方法としては、種々の方法を適用することができるが、例えば、以下に示すような方法を適用することができる。
例えば、基準情報生成部32は、図5に示すように、位置座標情報取得部31から定期的に利用者の位置座標情報を取得し、それぞれの位置座標情報が変化しない滞留時間を計測し、位置座標情報毎に記録する。そして、複数の位置座標情報のうち滞留時間が最も長い位置座標情報を基準情報とする方法を適用することができる。これにより、利用者が最も長く滞在している位置を基準として、優先順位決定部13に優先順位を計算させることができる。例えば、図5では、滞留時間が最も長い「経度情報;135.50500、緯度情報;34.65900」を基準情報とする。これにより、優先順位決定部13は大阪地方の位置表記候補の優先度を高くすることができる。
また例えば、基準情報生成部32は、図5に示すように、位置座標情報の滞留時間を記録し、これらの位置座標情報の中から滞留時間の長い順に複数の位置座標情報を抽出し、複数の位置座標情報を基準情報として表記順序決定部10に与えるようにしてもよい。つまり、複数の基準情報を表記順序決定部10に与えるようにしてもよい。この場合、優先順位決定部13は、複数の基準情報のそれぞれを基準として位置表記候補の優先度を計算し、その結果から位置表記候補の優先順位を決定する。例えば、図5では、滞留時間が1番目長い「経度情報;135.50500、緯度情報;34.65900」と2番目に長い「経度情報;135.50000、緯度情報;34.66200」の2個の基準情報とする。これにより、優先順位決定部13は、いずれの基準情報を基準としても大阪地方の位置表記候補の優先度を高くすることができるので大阪地方の位置表記候補の優先度を高くすることができる。
さらに例えば、基準情報生成部32は、位置座標情報統計機能を備え、過去の位置座標情報の履歴を集計し、その集計結果に基づいて優先度を付与し、優勢度の高い1又は複数の位置座標情報を基準情報とする方法を適用することができる。
また例えば、基準情報生成部32は、位置座標情報の他に方向情報を含む基準情報を表記順序決定部10に与えるようにしてもよい。
(A−2)第1の実施形態の動作
次に、第1の実施形態の位置表記検索システム1において、入力された部分位置表記に対する位置表記候補が複数ある場合の位置表記候補の優先順位を決定する処理の動作について図面を参照しながら説明する。
次に、第1の実施形態の位置表記検索システム1において、入力された部分位置表記に対する位置表記候補が複数ある場合の位置表記候補の優先順位を決定する処理の動作について図面を参照しながら説明する。
図6は、複数の位置表記候補の優先順位を決定する表記順序決定部10における処理を示す動作フローチャートである。
まず、利用者の入力した部分位置表記が入力情報取得部20に与えられると、その部分位置表記が位置表記検索部12に与えられる(ステップS101)。
位置表記検索部12では、位置表記・位置座標対応情報テーブル11から部分位置表記を含む位置表記を候補として検索する(ステップS102)。例えば、このとき、位置表記検索部12に与えられた部分位置表記が例えば「日本橋」である場合、位置表記検索部12は、図2に示す位置表記・位置座標対応情報テーブル11から、部分位置表記「日本橋」を含むID=811及びID=1521の行を候補として取得する。
ここで、第1の実施形態において、位置表記・位置座標対応情報テーブル11が、「都道府県」、「市郡」、「区」、「町字」などの単位でそれぞれの列に格納する構成とした理由について説明する。
一般に、利用者が入力する部分位置表記は、住所のある区分そのままの文字列を入力するのが自然である。すなわち「日本橋」などと入力されることは多いが、「中央区日本」などと入力されることは稀である。そこで、「日本橋」の一致は、図2のような位置表記を分割して複数の列に格納している構成にしておけば、ある列に対する部分一致ではなく、全体一致で該当行を検索することができる。位置表記・位置座標対応情報テーブル11は、通常、データベースシステムを用いるが、大半のデータベースシステムはインデックスの割り当てなどと呼ばれる機能を用いることによって、全体一致検索は部分一致検索に比べ非常に高速に検索することが可能であるので、図2のように位置表記を分割して格納することで、入力された部分位置表記に対してまずは全体一致検索を行なうことができるので、処理速度を早くすることができる。
次に、ステップS103では、該当行が2行以上存在するか否かを判定する。このとき、該当行が「1行」であればステップS107に移行し当該行の位置表記を出力して終了し、「0行」であれば該当なしとして出力して終了する。
一方、ステップS103において、該当行が2行以上存在する場合、ステップS104に移行する。
ステップS104では、優先順位決定部13が、基準情報提供部30から基準情報を取得する。
そして、優先順位決定部13は、基準情報と各該当行の位置表記候補とを用いて、上述したいずれかの方法によって、該当行毎の優先度を計算する(ステップS105)。
優先順位決定部13において、各該当行の優先度が計算されると、各該当行の優先度に従って各位置標記は並び替えられ(ステップS106)、各該当行の位置表記が位置表記候補リストとして出力される(ステップS107)。
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、入力された部分位置表記を含む位置表記が複数存在する場合に、利用者の行動位置を基準とする基準情報を利用して優先順位を決定することができる。その結果、複数の位置表記が他の都道府県にある場合でも、利用者の希望する位置表記に対して最適な優先順位を与えることができる。
以上のように、第1の実施形態によれば、入力された部分位置表記を含む位置表記が複数存在する場合に、利用者の行動位置を基準とする基準情報を利用して優先順位を決定することができる。その結果、複数の位置表記が他の都道府県にある場合でも、利用者の希望する位置表記に対して最適な優先順位を与えることができる。
(B)第2の実施形態
次に、本発明の本発明の位置表記検索システム、方法及びプログラムの第2の実施形態について図面を参照しながら説明する。
次に、本発明の本発明の位置表記検索システム、方法及びプログラムの第2の実施形態について図面を参照しながら説明する。
(B−1)第2の実施形態の構成
第2の実施形態では、図1の基準情報提供部30を基準情報提供部40に置き換え、それ以外の構成は、第1の実施形態で説明した構成と同様である。
第2の実施形態では、図1の基準情報提供部30を基準情報提供部40に置き換え、それ以外の構成は、第1の実施形態で説明した構成と同様である。
そこで、以下では、基準情報提供部40の機能構成を中心に説明し、それ以外の構成については省略する。
第2の実施形態の基準情報提供部40は、利用者と関連付けられる特定の文書(例えば、利用者が書いたWebログ(別名ブログ)などの文書)から住所表現を抽出し、抽出した住所表現を利用して基準情報を優先順位決定部13に与えるものである。
なお、利用者に関連する文書は、Webログに限定されず、その他に、テキスト文書、電子メールなどを適用することができる。
図7は、第2の実施形態の基準情報提供部40の構成を示す構成図である。図7において、第2の実施形態の基準情報提供部40は、情報抽出部41、基準情報生成部42、住所表現データベース(DB)43を少なくとも有して構成される。
住所表現データベース(DB)43は、複数の地名を示す地名文字列を登録データとして記憶するデータベースである。
情報抽出部41は、利用者データベース50に保存されている利用者の特定の文書を利用者データベース50から取得し、この特定の文書の中から住所表現DB43に登録されている地名文字列をマッチングにより抽出し、その抽出結果を優先順位決定部13に与えるものである。
ここで、特定の文書が保存されている利用者DB50のドメイン名などのアドレス情報は、利用者により情報抽出部50に設定される。これにより、情報抽出部41による情報抽出の対象を特定することができる。なお、1個又は2個以上のアドレス情報を設定するようにしてもよく、これにより1又は複数のデータベースを情報取得の対象とすることができる。
また、情報抽出部41は、1又は複数の特定の文書を取得して情報抽出するようにしてもよい。つまり、利用者が過去に書いた特定の文書を全部又は一部取得して情報抽出するようにしてもよい。
基準情報生成部42は、情報抽出部41から情報抽出結果を受け取り、この情報抽出結果に基づいて基準情報を生成するものである。
ここで、基準情報生成部42による基準情報の決定方法としては、種々の方法を適用することができるが、例えば、情報抽出部41が抽出した各地名文字列の出現回数を集計し、その中から最も出現回数が多い地名文字列を選択し、その地名文字列の地名基準点を基準情報とする方法を適用することができる。
ここで、地名基準点は、各地名文字列に対応する位置座標情報を用いることができ、あらかじめ各地名文字列に対応付けて設定しておく。
勿論、基準情報生成部42が決定する基準情報は1個に限定せず、出現回数が多いものから順に複数の地名文字列を選択し、複数の地名文字列の地名基準点を基準情報とすることができる。
(B−2)第2の実施形態の動作
以下では、第2の実施形態の基準情報提供部40における処理の動作について説明する。
以下では、第2の実施形態の基準情報提供部40における処理の動作について説明する。
図8は、第2の実施形態の基準情報提供部40における基準情報の決定処理の一例を示す動作フローチャートである。
まず、情報抽出部41は、利用者により設定されたアドレス情報に基づいて利用者DB50にアクセスし、利用者DB50から当該利用者の特定の文書を取得する(ステップS201)。
情報抽出部41が利用者の特定の文書を取得すると、情報抽出部41により、地名文字列DB43に登録されている登録データとマッチングする地名文字列が特定の文書から抽出され(ステップS202)、抽出された1又は複数の地名文字列が基準情報生成部42に与えられる(ステップS203)。
情報抽出結果が基準情報生成部42に与えられると、基準情報生成部42において、各地名文字列毎の出現回数が求められ(ステップS204)、最も出現回数の多い地名文字列が選択され、この地名文字列の地名基準点が基準情報として決定され(ステップS205)、出力される(ステップS206)。
例えば、利用者の特定の文書として利用者が過去に書いたWebログとする。情報抽出部41は、Webサイトから当該利用者のWebログを取得すると、このWebログから地名文字列DB43の登録データとマッチングする地名文字列を抽出する。このマッチング技術については既存技術を広く適用することができるので詳細な説明を省略する。
そして、抽出された各地名文字列のうち、地名文字列「大阪」が最も出現回数が多い場合、「大阪」の地名基準点が基準情報として出力される。
(B−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、第1の実施形態で説明した効果に加えて、利用者に関連する文書に書かれている文字列を利用して基準情報を決定することができる。
以上のように、第2の実施形態によれば、第1の実施形態で説明した効果に加えて、利用者に関連する文書に書かれている文字列を利用して基準情報を決定することができる。
(C)第3の実施形態
次に、本発明の本発明の位置表記検索システム、方法及びプログラムの第2の実施形態について図面を参照しながら説明する。
次に、本発明の本発明の位置表記検索システム、方法及びプログラムの第2の実施形態について図面を参照しながら説明する。
(C−1)第3の実施形態の構成
図9は、第3の実施形態の位置表記検索システム2の主な全体構成を示す全体構成図である。
図9は、第3の実施形態の位置表記検索システム2の主な全体構成を示す全体構成図である。
第3の実施形態は、図1の位置表記・位置座標対応情報テーブル11を位置表記・位置座標対応情報テーブル51に置き換える点と、図1の優先順位決定部13を優先順位決定部53に置き換える点が第1の実施形態と異なり、それ以外は、第1の実施形態と同じである。
なお、基準情報提供部は、第1の実施形態の基準情報提供部30又は第2の実施形態の基準情報提供部40のいずれを適用することができる。
図10は、第3の実施形態の位置表記・位置座標対応情報テーブル51の構成を示す構成図である。
図10に示すように、位置表記・位置座標対応情報テーブル51は、「ID」、「位置表記情報」、「位置座標情報」に加えて、「知名度」を管理項目として有する。
この「知名度」は、一般的にその名が知られている度合いであり、位置表記情報毎に予め設定しておく。また、この「知名度」は、種々の観点から調査することができ、例えば、サンプリング調査などによって求めることができるが、位置表記に対応する地域の人口、面積、Webページでの出現回数や、過去の選択回数など知名度と関連性があると考えられる別のデータを利用して設定することができる。
また、「知名度」は、1個の行に対して複数個の度合いを設けるようにしてもよい。この場合は、いずれの知名度を選択するか、又は、知名度の優先順序や係数などを決定しておく。
優先順位決定部53は、位置表記検索部12により複数の位置表記候補を受け取った場合、第1の実施形態で説明した処理と共に、位置表記・位置座標対応情報テーブル51の「知名度」を参照して、各位置表記候補に対して優先順位を付与し、この優先順位に従って並び替えをした位置表記候補を位置表記候補リストとして出力するものである。
(C−2)第3の実施形態の動作
次に、第3の実施形態の位置表記検索システム1において、入力された部分位置表記に対する位置表記候補が複数ある場合の位置表記候補の優先順位を決定する処理の動作について図面を参照しながら説明する。
次に、第3の実施形態の位置表記検索システム1において、入力された部分位置表記に対する位置表記候補が複数ある場合の位置表記候補の優先順位を決定する処理の動作について図面を参照しながら説明する。
図10は、複数の位置表記候補の優先順位を決定する表記順序決定部50における処理を示す動作フローチャートである。
まず、ステップS301〜ステップS305の処理は、図6の第1の実施形態で説明した処理のステップS101〜ステップS105の処理に対応するので、ここでの詳細な説明は省略する。
ステップS305では、優先順位決定部53が、第1の実施形態で説明した方法により、基準情報と該当行のそれぞれの位置座標情報とを用いて優先度を計算する。
次に、ステップS306では、優先順位決定部53が、ステップS305で求めた各行の優先度と、位置表記・位置座標対応情報テーブル51の「知名度」とを用いて、該当行の位置表記候補の並び替えをして、出力する(ステップS306及びS307)。
ここで、優先順位決定部53による並び替え方法は、種々の方法を適用することができるが、例えば図12に示す並べ替え方法を適用できる。
図12において、まず、ステップS305で求めた各行の優先度が閾値未満であるか否かを判断し(ステップS401)、閾値未満である場合、優先順位決定部53は、閾値未満の優先度の行について、位置表記・位置座標対応情報テーブル51の「知名度」を参照して優先度を付与して並び替える(ステップS402)。
そして、閾値以上の優先度を持つ各行の位置表記情報については、ステップS305で求めた優先度に従って並び替え、その後、ステップS402で並び替えた閾値未満の優先度を持つ各行の位置表記情報を並べる(ステップS403)。
例えば「日本橋」の場合、基準情報が奈良県であれば「大阪府大阪市浪速区日本橋」を、基準情報が埼玉県であれば「東京都中央区日本橋」を優先して表記するのは第1の実施形態と同様であるが、例えば基準情報が「北海道」である場合に、[知名度]を参照して、「大阪府大阪市浪速区日本橋」を優先して上位に表記することができる。
これにより、基準点から十分に遠い地名であれば、一般に省略された地名は距離よりも知名度によって一致させたことが望ましい事実を反映することができる。
(C−3)第3の実施形態の効果
以上のように、第3の実施形態によれば、第1及び第2の実施形態の効果に加えて、さらに、最適な優先順位を与えることができる。
以上のように、第3の実施形態によれば、第1及び第2の実施形態の効果に加えて、さらに、最適な優先順位を与えることができる。
(D)他の実施形態
第1〜第3の実施形態では、位置表記の例として住所を例示して説明したが、本発明は、それに限定されない。例えば最寄りのチェーン店を特定する場合にも使用できる(チェーン店名「居酒屋○○」を入力すれば、最寄りのチェーン店「居酒屋○○(大阪日本橋店)」を最上位候補として出力する)ことも可能である。
第1〜第3の実施形態では、位置表記の例として住所を例示して説明したが、本発明は、それに限定されない。例えば最寄りのチェーン店を特定する場合にも使用できる(チェーン店名「居酒屋○○」を入力すれば、最寄りのチェーン店「居酒屋○○(大阪日本橋店)」を最上位候補として出力する)ことも可能である。
基準情報提供部の基準情報の決定方法は、第1〜第3の実施形態で説明した方法以外にも、例えば、先に確定入力された位置表記に対応する位置座標情報としたり、GPSを利用して得られたGPS情報(緯度情報及び経度情報)をそのまま用いるようにしてもよい。また、例えば予め登録された利用者の居住地の位置座標情報を用いるようにしてもよい。
第1〜第3の実施形態において、位置表記検索部と優先順位決定部は、専用の制御デバイスあるいは、プログラムを実行するプロセッサと、そのプロセッサで実行するプログラムとデータを記憶するRAM(Random Access Memory)、HDD(Hard Disk Drive)などの記憶デバイスを含むハードウェア資源で実現されるものである。
なお、第1〜第3の実施形態では、位置表記検索システムの各構成は、機能的に説明したものであり、実現するハードウェアの物理構成が各部分毎に明確に分離され、独立に用意される必要はない。例えば位置表記検索部と優先順位決定部を実現するプロセッサとRAM、ROMは共通のものであってもよく、さらにプログラムを格納するHDDは位置表記・位置座標対応テーブルのHDDと共通のものであってもよく、さらには他の機能を実現する装置の一部を利用してもよい。また、本装置の構成する部分の一部はネットワークで接続された他の場所に配置してもよい。
1及び2…位置表記検索システム、10…表記順序決定部、11、51…位置表記・位置座標対応情報テーブル、12…位置表記検索部、13、53…優先順位決定部、20…入力情報取得部、30、40…基準情報提供部、31…位置座標情報取得部、32…基準情報生成部、41…情報抽出部、42…基準情報生成部、43…地名文字列データベース(DB)、50…利用者データベース(DB)
Claims (9)
- 入力された位置表記文字列の一部に対応する位置表記文字列を検索する位置表記検索システムにおいて、
少なくとも、複数の位置表記文字列と、上記各位置表記文字列の位置情報とを対応付けて記憶する位置表記文字列記憶手段と、
上記位置表記文字列記憶手段から、上記入力された位置表記文字列の一部を含む1又は複数の位置表記文字列候補を検索する位置表記文字列検索手段と、
上記位置表記文字列検索手段により複数の上記位置表記文字列候補が検索された場合に、上記各位置表記文字列候補の位置情報と1又は複数の基準情報とに基づいて、上記各位置表記文字列候補の優先順位を決定する優先順位決定手段と
を備えることを特徴とする位置表記検索システム。 - 上記位置表記文字列記憶手段が、さらに、上記各位置表記文字列に対して優先度を記憶するものであり、
上記優先順位決定手段が、上記各位置表記文字列候補に対して、上記位置表記文字列記憶手段の上記各位置表記文字列の優先度を参照して、上記各位置表記文字列の優先順位を決定することを特徴とする請求項1に記載の位置表記検索システム。 - 上記優先順位決定手段が、上記1又は複数の基準情報が示す位置を基準点とし、上記各位置表記文字列候補の位置情報と上記1又は複数の基準情報との位置関係に基づいて、上記各位置表記文字列候補の優先順位を決定することを特徴とする請求項1又は2に記載の位置表記検索システム。
- 上記1又は複数の基準情報が位置情報と方向情報とを含むものであり、
上記優先順位決定手段が、上記1又は複数の基準情報の位置と上記各位置表示文字列候補の位置情報との結ぶ直線と、上記1又は複数の基準情報の方向情報とのなす角度を用いて上記各位置表記文字列候補の優先順位を決定することを特徴とする請求項1〜3のいずれかに記載の位置表記検索システム。 - 上記位置表記文字列記憶手段が、さらに、上記各位置表記文字列に対して優先度を記憶するものであり、
上記優先順位決定手段が、上記各位置表記文字列候補に対して、上記位置表記文字列記憶手段の上記各位置表記文字列の優先度を参照して、上記複数の位置表記文字列の優先順位を決定することを特徴とする請求項1〜4のいずれかに記載の位置表記検索システム。 - 上記優先順位決定手段に対して、上記1又は複数の基準情報を提供する基準情報提供手段を備え、
上記基準情報提供手段が、上記位置表記文字列の一部を入力した利用者の行動状況に応じた位置情報に基づいて、上記1又は複数の基準情報を生成する基準情報生成部を有する
ことを特徴とする請求項1〜5のいずれかに記載の位置表記検索システム。 - 上記優先順位決定手段に対して、上記1又は複数の基準情報を提供する基準情報提供手段を備え、
上記基準情報提供手段が、上記位置表記文字列の一部を入力した利用者に関連する文書から抽出した位置文字列に基づいて、上記1又は複数の基準情報を生成する基準情報生成部を有する
ことを特徴とする請求項1〜5のいずれかに記載の位置表記検索システム。 - 入力された位置表記文字列の一部に対応する位置表記文字列を検索する位置表記検索方法において、
位置表記検索システムが、少なくとも、複数の位置表記文字列と、上記各位置表記文字列の位置情報とを対応付けて記憶する位置表記文字列記憶手段と、位置表記文字列検索手段と、優先順位決定手段とを備え、
上記位置表記文字列検索手段が、上記位置表記文字列記憶手段から、上記入力された位置表記文字列の一部を含む1又は複数の位置表記文字列候補を検索する位置表記文字列検索工程と、
上記優先順位決定手段が、上記位置表記文字列検索手段により複数の上記位置表記文字列候補が検索された場合に、上記各位置表記文字列候補の位置情報と1又は複数の基準情報とに基づいて、上記各位置表記文字列候補の優先順位を決定する優先順位決定工程と
を有することを特徴とする位置表記検索方法。 - 入力された位置表記文字列の一部に対応する位置表記文字列を検索する位置表記検索プログラムにおいて、
少なくとも、複数の位置表記文字列と、上記各位置表記文字列の位置情報とを対応付けて記憶する位置表記文字列記憶手段と接続可能なコンピュータに、
上記位置表記文字列記憶手段から、上記入力された位置表記文字列の一部を含む1又は複数の位置表記文字列候補を検索する位置表記文字列検索手段、
上記位置表記文字列検索手段により複数の上記位置表記文字列候補が検索された場合に、上記各位置表記文字列候補の位置情報と1又は複数の基準情報とに基づいて、上記各位置表記文字列候補の優先順位を決定する優先順位決定手段
として機能させる位置表記検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007257689A JP2009087140A (ja) | 2007-10-01 | 2007-10-01 | 位置表記検索システム、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007257689A JP2009087140A (ja) | 2007-10-01 | 2007-10-01 | 位置表記検索システム、方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009087140A true JP2009087140A (ja) | 2009-04-23 |
Family
ID=40660463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007257689A Pending JP2009087140A (ja) | 2007-10-01 | 2007-10-01 | 位置表記検索システム、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009087140A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015011637A (ja) * | 2013-07-01 | 2015-01-19 | 富士通株式会社 | 住所特定プログラム、住所特定方法及び住所特定装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11132777A (ja) * | 1997-10-24 | 1999-05-21 | Aisin Aw Co Ltd | 車両用ナビゲーション装置及びそのプログラムを記録した記憶媒体 |
JP2001255160A (ja) * | 2000-03-13 | 2001-09-21 | Alpine Electronics Inc | ナビゲーションシステム |
JP2006099727A (ja) * | 2004-08-30 | 2006-04-13 | Denso Corp | 項目検索装置 |
JP2007148559A (ja) * | 2005-11-24 | 2007-06-14 | Honda Motor Co Ltd | 情報検索装置 |
-
2007
- 2007-10-01 JP JP2007257689A patent/JP2009087140A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11132777A (ja) * | 1997-10-24 | 1999-05-21 | Aisin Aw Co Ltd | 車両用ナビゲーション装置及びそのプログラムを記録した記憶媒体 |
JP2001255160A (ja) * | 2000-03-13 | 2001-09-21 | Alpine Electronics Inc | ナビゲーションシステム |
JP2006099727A (ja) * | 2004-08-30 | 2006-04-13 | Denso Corp | 項目検索装置 |
JP2007148559A (ja) * | 2005-11-24 | 2007-06-14 | Honda Motor Co Ltd | 情報検索装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015011637A (ja) * | 2013-07-01 | 2015-01-19 | 富士通株式会社 | 住所特定プログラム、住所特定方法及び住所特定装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5315664B2 (ja) | 位置表現検出装置、プログラム、及び、記憶媒体 | |
US8442716B2 (en) | Identifying physical locations of entities | |
US8682646B2 (en) | Semantic relationship-based location description parsing | |
JP5390840B2 (ja) | 情報分析装置 | |
CN108304423A (zh) | 一种信息识别方法及装置 | |
US8958826B2 (en) | Device and method for mobility pattern mining | |
JP5087377B2 (ja) | 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体 | |
AU2016201273B2 (en) | Recommending form fragments | |
US20150193447A1 (en) | Synthetic local type-ahead suggestions for search | |
JP6136702B2 (ja) | 場所推定方法、場所推定装置および場所推定プログラム | |
CN104067273A (zh) | 将搜索结果分组为简档页面 | |
US8849792B2 (en) | Information management method and information management apparatus | |
JP6662689B2 (ja) | 単語判定装置 | |
JP5980520B2 (ja) | 効率的にクエリを処理する方法及び装置 | |
JP2009087140A (ja) | 位置表記検索システム、方法及びプログラム | |
JP2008090334A (ja) | 所在地解析装置、所在地解析方法及びそのプログラム並びに記録媒体 | |
JPWO2015125209A1 (ja) | 情報構造化システム及び情報構造化方法 | |
Katragadda et al. | An unsupervised approach to identify location based on the content of user’s tweet history | |
JP2022002034A (ja) | 抽出方法、抽出プログラム、及び、抽出装置 | |
US10204139B2 (en) | Systems and methods for processing geographic data | |
JP2013242620A (ja) | 近隣情報検索装置及び方法及びプログラム | |
JP5647090B2 (ja) | クエリ推薦装置及び方法及びプログラム | |
JP5824415B2 (ja) | 住所特徴語抽出装置及び方法及びプログラム | |
US20100125560A1 (en) | Uncertainty-based geocoding for risk management | |
JP2018005759A (ja) | 引用マップ生成装置、引用マップ生成方法およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100811 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120925 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130212 |