JP5087377B2 - 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体 - Google Patents
地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP5087377B2 JP5087377B2 JP2007309281A JP2007309281A JP5087377B2 JP 5087377 B2 JP5087377 B2 JP 5087377B2 JP 2007309281 A JP2007309281 A JP 2007309281A JP 2007309281 A JP2007309281 A JP 2007309281A JP 5087377 B2 JP5087377 B2 JP 5087377B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- importance
- place name
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Zhou,Y.,et al.,"hybrid Index Structures for Location−based Web Search",In Proc.of CIKM 2005 Subodh Vaid,et al.,"Spatio−textual Indexing for Geographical Search on the Web",In proc.of SSTD 2005. C.Schlieder,T.Vogele,U.Visser,"Qualitative Spatial Representation for information Retrieval by Gazetteers,In proc.of COSIT 2001 Paul Clough, Extracting metadata for spatially−aware information retrieval on the internet, GIR 2005.
また請求項3に記載の検索装置は、請求項2において、前記文書位置付与部による重みつき重心の計算における重みは、地名の広さが広いほどに小さな値である、ことを特徴としている。
また請求項6に記載の検索方法は、請求項5において、前記文書位置付与ステップによる重みつき重心の計算における重みは、地名の広さが広いほどに小さな値である、ことを特徴としている。
(2)請求項1、4に記載の発明によれば、重要度分布データベースによって、領域内にある店舗や家屋に関する分布状況によって重みの与え方を変えることができる。
(3)請求項2、5に記載の発明によれば、各文書に対して、文書が示す地点を付与しているので、高速な検索が実現される。
図1は本発明の地理的情報を含む文書群の検索装置の第1の実施例の構成を示している。図1において、本実施例の検索装置は、地理情報抽出部1、文書データベース(DB)2、要求処理部3、関連文書検索部4、地名重要度算出部5、地名位置範囲データベース(DB)6、近傍文書検索部7、スコア評価部8とをを備えている。
ここで、a、bはそれぞれ定数である。
(1−1)要求処理部3が、利用者の端末から入力された要求を処理して、検索位置と検索語(キーワード)を出力する。
(1−2)地理情報抽出部1が文書データベース2内の文書から地名、住所、店舗名、電話番号等を抽出し、それぞれについて、文書中での出現箇所、正規化された地名、緯度経度を出力する。
(1−3)関連文書検索部4が、要求処理部3の出力である、利用者からのキーワード(検索語)を入力として、関連性が高いと思われる文書データベース2中の文書とその関連度スコア(第1のスコア)を出力する。
(1−4)地名重要度算出部6が、地名位置範囲データベース5内の地名と地点の座標を入力として、地名に対する地点の重要度を前記式(1)を算出して求める。
(1−5)近傍文書検索部7が、要求処理部3によって得られた検索位置を入力として、その位置に近い地理情報を含んだ文書を文書データベース2から検索し、その文書に含まれる各地理領域に対する重みを地名重要度算出部6から求め、その重みの和を前記式(2)により算出し、これをスコア(第2のスコア)として文書とともに出力する。
(1−6)スコア評価部8が、関連文書検索部4と近傍文書検索部7のそれぞれの出力(検索された文書、第1のスコア、第2のスコア)を入力とし、前記式(3)を計算して文書のスコアを求めそのスコアの高い文書から順に、文書を出力する。
図2は本発明の検索装置の第2の実施例の構成を示しており、図1と同一部分は同一符号をもって示している。図2において、本実施例の検索装置は、地理情報抽出部1、文書データベース(DB)2、要求処理部3、関連文書検索部4、地名重要度算出部5、重要度分布算出部26a、重要度分布データベース(DB)26b、近傍文書検索部27、スコア評価部28とを備えている。
(2−1)要求処理部3が、利用者の端末から入力された要求を処理して、検索位置と検索語(キーワード)を出力する。
(2−2)地理情報抽出部1が文書データベース2内の文書から地名、住所、店舗名、電話番号等を抽出し、それぞれについて、文書中での出現箇所、正規化された地名、緯度経度を出力する。
(2−3)関連文書検索部4が、要求処理部3の出力である、利用者からのキーワード(検索語)を入力として、関連性が高いと思われる文書データベース2中の文書とその関連度スコア(第1のスコア)を出力する。
(2−4)地名重要度算出部26aが、まず、地名位置範囲データベース5を用いて、入力された地名が示す範囲を含む緯度の範囲と経度の範囲を得る。次に、重要度分布データベース26bを用いて、上記地名位置範囲データベース5により得た緯度範囲、経度範囲から得られる領域と、この領域内の各小領域の重要度の合計を得る。次に地点が含まれる小領域の重要度を得る。
(2−5)近傍文書検索部27が、要求処理部3によって得られた検索位置を入力として、その位置に近い地理情報を含んだ文書を文書データベース2から検索し、その文書に対して、重要度分布算出部26aから出力された地点の重要度(式(4))に基づいて文書のスコア(第2のスコア)を与える。
(2−6)スコア評価部28が、関連文書検索部4と近傍文書検索部27のそれぞれの出力(検索された文書、第1のスコア、第2のスコア)を入力とし、前記式(3)を計算して文書のスコアを求めそのスコアの高い文書から順に、文書を出力する。
図3は本発明の検索装置の第3の実施例の構成を示しており、図1と同一部分は同一符号をもって示している。図3において、本実施例の検索装置は、地理情報抽出部1、文書データベース(DB)2、要求処理部3、関連文書検索部4、地名重要度算出部5、文書位置付与部36a、文書位置データベース(DB)36b、近傍文書検索部37、スコア評価部38とを備えている。
(3−1)要求処理部3が、利用者の端末から入力された要求を処理して、検索位置と検索語(キーワード)を出力する。
(3−2)地理情報抽出部1が文書データベース2内の文書から地名、住所、店舗名、電話番号等を抽出し、それぞれについて、文書中での出現箇所、正規化された地名、緯度経度を出力する。
(3−3)関連文書検索部4が、要求処理部3の出力である、利用者からのキーワード(検索語)を入力として、関連性が高いと思われる文書データベース2中の文書とその関連度スコア(第1のスコア)を出力する。
(3−4)文書位置付与部36aが、文書データベース2中の各文書に対して地名のクラスタリングを行い、その文書の代表クラスタを決め、その代表クラスタに対して、地名の含意する広さを考慮した文書位置を決定するために、前記式(5)を計算して重み付き重心を計算し、それを文書の位置とし、文書位置データベース36bに記録する。
(3−5)近傍文書検索部37が、要求処理部3によって処理された座標を示す点と、文書位置データベース36bに記録されている文書の代表点との距離が近い順に文書と距離を出力する。
(3−6)スコア評価部38が、関連文書検索部4と近傍文書検索部37の各出力を入力とし、前記式(6)を計算して文書のスコアを求め、該スコアが高い文書から順に文書を出力する。
Claims (8)
- 文書群から、検索語と位置を指定することにより、検索語と位置に関連した文書を検索する地理的情報を含む文書群の検索装置において、
前記指定された検索語と関連した文書を、検索対象の文書を集めた文書データベースから検索し、該検索された文書と、その関連度を表す第1のスコアとを出力する関連文書検索手段と、
前記文書データベース内の検索対象の文書中に出現する地名を抽出し、それらに対し緯度経度を割当てる地理情報抽出手段と、
地名が示す範囲内の各地点の重要度を算出する重要度算出手段と、
前記指定された位置に近い地点を含む地名が出現する文書を検索し、該検索された文書に対して地理的尺度に基づく第2のスコアを与え、当該検索文書と第2のスコアとを出力する近傍文書検索手段と、
前記関連文書検索手段と近傍文書検索手段の出力を用いて、各文書のスコアの評価を行うスコア評価手段とを備え、
前記重要度算出手段は、地球上での場所を示す小領域およびその地点の重要度で構成された重要度分布データベースと、地名およびその地名が含意する範囲で構成された地名位置範囲データベースとを用いて、地名が含まれる小領域の重要度を地名に該当する小領域の重要度の合計値で除した値を、当該地名に対する当該地点の重要度として算出する重要度分布算出部を有し、
前記近傍文書検索手段は、前記重要度分布算出部により算出された重要度に基づいて前記第2のスコアを算出する
ことを特徴とする地理的情報を含む文書群の検索装置。 - 文書群から、検索語と位置を指定することにより、検索語と位置に関連した文書を検索する地理的情報を含む文書群の検索装置において、
前記指定された検索語と関連した文書を、検索対象の文書を集めた文書データベースから検索し、該検索された文書と、その関連度を表す第1のスコアとを出力する関連文書検索手段と、
前記文書データベース内の検索対象の文書中に出現する地名を抽出し、それらに対し緯度経度を割当てる地理情報抽出手段と、
地名が示す範囲内の各地点の重要度を算出する重要度算出手段と、
前記指定された位置に近い地点を含む地名が出現する文書を検索し、該検索された文書に対して地理的尺度に基づく第2のスコアを与え、当該検索文書と第2のスコアとを出力する近傍文書検索手段と、
前記関連文書検索手段と近傍文書検索手段の出力を用いて、各文書のスコアの評価を行うスコア評価手段とを備え、
前記重要度算出手段は、地名およびその地名が含意する範囲で構成された地名位置範囲データベースと前記文書データベースとを用いて、前記文書データベース中の各文書に対して、文書に出現する地名が現す地点の重みつき重心を計算することにより文書が示す地点を付与する文書位置付与部と、該文書位置付与部で付与された文書の位置を記録した文書位置データベースとを有し、
前記近傍文書検索手段は、前記文書位置データベースを用いて、前記指定された位置と前記文書位置データベースに記録された文書の位置との距離に基づき、距離が小さいほどに大きな値となるように第2のスコアを算出する
ことを特徴とする地理的情報を含む文書群の検索装置。 - 前記文書位置付与部による重みつき重心の計算における重みは、地名の広さが広いほどに小さな値である、
ことを特徴とする請求項2に記載の地理的情報を含む文書群の検索装置。 - 文書群から、検索語と位置を指定することにより、検索語と位置に関連した文書を検索する地理的情報を含む文書群の検索方法において、
関連文書検索手段が、前記指定された検索語と関連した文書を、検索対象の文書を集めた文書データベースから検索し、該検索された文書と、その関連度を表す第1のスコアとを出力する関連文書検索ステップと、
地理情報抽出手段が、前記文書データベース内の検索対象の文書中に出現する地名を抽出し、それらに対し緯度経度を割当てる地理情報抽出ステップと、
重要度算出手段が、地名が示す範囲内の各地点の重要度を算出する重要度算出ステップと、
近傍文書検索手段が、前記指定された位置に近い地点を含む地名が出現する文書を検索し、該検索された文書に対して地理的尺度に基づく第2のスコアを与え、当該検索文書と第2のスコアとを出力する近傍文書検索ステップと、
スコア評価手段が、前記関連文書検索手段と近傍文書検索手段の出力を用いて、各文書のスコアの評価を行うスコア評価ステップとを備え、
前記重要度算出ステップは、重要度分布算出部が、地球上での場所を示す小領域およびその地点の重要度で構成された重要度分布データベースと、地名およびその地名が含意する範囲で構成された地名位置範囲データベースとを用いて、地名が含まれる小領域の重要度を地名に該当する小領域の重要度の合計値で除した値を、当該地名に対する当該地点の重要度として算出する重要度分布算出ステップを有し、
前記近傍文書検索ステップは、前記重要度分布算出ステップにより算出された重要度に基づいて前記第2のスコアを算出することを特徴とする地理的情報を含む文書群の検索方法。 - 文書群から、検索語と位置を指定することにより、検索語と位置に関連した文書を検索する地理的情報を含む文書群の検索方法において、
関連文書検索手段が、前記指定された検索語と関連した文書を、検索対象の文書を集めた文書データベースから検索し、該検索された文書と、その関連度を表す第1のスコアとを出力する関連文書検索ステップと、
地理情報抽出手段が、前記文書データベース内の検索対象の文書中に出現する地名を抽出し、それらに対し緯度経度を割当てる地理情報抽出ステップと、
重要度算出手段が、地名が示す範囲内の各地点の重要度を算出する重要度算出ステップと、
近傍文書検索手段が、前記指定された位置に近い地点を含む地名が出現する文書を検索し、該検索された文書に対して地理的尺度に基づく第2のスコアを与え、当該検索文書と第2のスコアとを出力する近傍文書検索ステップと、
スコア評価手段が、前記関連文書検索手段と近傍文書検索手段の出力を用いて、各文書のスコアの評価を行うスコア評価ステップとを備え、
前記重要度算出ステップは、文書位置付与部が、地名およびその地名が含意する範囲で構成された地名位置範囲データベースと前記文書データベースとを用いて、前記文書データベース中の各文書に対して、文書に出現する地名が現す地点の重みつき重心を計算することにより文書が示す地点を付与する文書位置付与ステップと、該文書位置付与ステップで付与された文書の位置を文書位置データベースに記録するステップとを有し、
前記近傍文書検索ステップは、前記文書位置データベースを用いて、前記指定された位置と前記文書位置データベースに記録された文書の位置との距離に基づき、距離が小さいほどに大きな値となるように第2のスコアを算出することを特徴とする地理的情報を含む文書群の検索方法。 - 前記文書位置付与ステップによる重みつき重心の計算における重みは、地名の広さが広いほどに小さな値である、
ことを特徴とする請求項5に記載の地理的情報を含む文書群の検索方法。 - コンピュータを、請求項1ないし3のいずれか1項に記載の各手段として機能させる地理的情報を含む文書群の検索プログラム。
- 請求項7に記載の地理的情報を含む文書群の検索プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007309281A JP5087377B2 (ja) | 2007-11-29 | 2007-11-29 | 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007309281A JP5087377B2 (ja) | 2007-11-29 | 2007-11-29 | 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009134463A JP2009134463A (ja) | 2009-06-18 |
JP5087377B2 true JP5087377B2 (ja) | 2012-12-05 |
Family
ID=40866289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007309281A Active JP5087377B2 (ja) | 2007-11-29 | 2007-11-29 | 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5087377B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5164968B2 (ja) * | 2009-12-25 | 2013-03-21 | ヤフー株式会社 | 地域スコアデータベースを作成する装置、方法及びプログラム |
JP5351123B2 (ja) * | 2010-10-21 | 2013-11-27 | 日本電信電話株式会社 | 文書検索キーワード提示装置および文書検索キーワード提示プログラム |
JP5416723B2 (ja) * | 2011-01-25 | 2014-02-12 | 日本電信電話株式会社 | 文書検索装置、文書検索方法、文書検索プログラム |
JP5689780B2 (ja) * | 2011-11-17 | 2015-03-25 | 日本電信電話株式会社 | 文書検索装置及び方法及びプログラム |
JP5801243B2 (ja) * | 2012-04-05 | 2015-10-28 | 日本電信電話株式会社 | 特徴キーワード推薦装置及び方法及びプログラム |
GB201306937D0 (en) | 2013-04-17 | 2013-05-29 | Tomtom Int Bv | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
GB201306942D0 (en) | 2013-04-17 | 2013-05-29 | Tomtom Int Bv | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
GB201306944D0 (en) | 2013-04-17 | 2013-05-29 | Tomtom Int Bv | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
JP5981386B2 (ja) * | 2013-04-18 | 2016-08-31 | 日本電信電話株式会社 | 代表ページ選択装置及び代表ページ選択プログラム |
JP6209488B2 (ja) * | 2014-05-15 | 2017-10-04 | 日本電信電話株式会社 | 距離閾値指定装置,距離閾値指定方法、距離閾値指定プログラム |
US11442970B2 (en) * | 2018-05-21 | 2022-09-13 | Rakuten Group, Inc. | Facility search system, facility search method, and program for adding area information of a facility by using a place tag of another facility close to the facility |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4199671B2 (ja) * | 2002-03-15 | 2008-12-17 | 富士通株式会社 | 地域情報検索方法及び地域情報検索装置 |
JP4403357B2 (ja) * | 2002-10-31 | 2010-01-27 | ソニー株式会社 | コンテンツ再生装置、コンテンツ提供システム、およびプログラム |
-
2007
- 2007-11-29 JP JP2007309281A patent/JP5087377B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009134463A (ja) | 2009-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5087377B2 (ja) | 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体 | |
US9031938B2 (en) | Computer-implemented methods and systems for multi-level geographic query | |
US7917490B2 (en) | Interpreting local search queries | |
JP7182585B2 (ja) | プログラム | |
US20150356088A1 (en) | Tile-based geocoder | |
CN107203526B (zh) | 一种查询串语义需求分析方法及装置 | |
US9945676B2 (en) | Navigation system with content curation mechanism and method of operation thereof | |
RU2598165C1 (ru) | Недетерминированное разрешение неоднозначности и сопоставление данных места коммерческого предприятия | |
CN102693266A (zh) | 搜索数据库的方法、生成索引结构的导航设备和方法 | |
JP2010128806A (ja) | 情報分析装置 | |
KR101344913B1 (ko) | 지역별 자동완성 질의어 제공 시스템 및 방법 | |
JP6662689B2 (ja) | 単語判定装置 | |
US11487937B2 (en) | Location query processing and scoring | |
JP5639549B2 (ja) | 情報検索装置及び方法及びプログラム | |
JP2009134464A (ja) | 地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体 | |
Fränti et al. | Location-based search engine for multimedia phones | |
KR101459872B1 (ko) | SOI와 Content의 결합 객체에 대한 공간정보 색인 시스템 | |
Thenmozhi et al. | A framework for tourist recommendation system exploiting geo-tagged photos | |
Hall et al. | Exploring the Relationship Between" Informal Standards" and Contributor Practice in OpenStreetMap | |
Asadi et al. | Using local popularity of web resources for geo-ranking of search engine results | |
Katragadda et al. | An unsupervised approach to identify location based on the content of user’s tweet history | |
JP5806974B2 (ja) | 近隣情報検索装置及び方法及びプログラム | |
An et al. | Improving local search with open geographic data | |
JP5670944B2 (ja) | 文書要約装置及び方法及びプログラム | |
JP5650607B2 (ja) | 文書検索キーワード提示装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090618 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090925 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100528 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120131 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120910 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5087377 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150914 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |