JP5647090B2 - クエリ推薦装置及び方法及びプログラム - Google Patents

クエリ推薦装置及び方法及びプログラム Download PDF

Info

Publication number
JP5647090B2
JP5647090B2 JP2011234261A JP2011234261A JP5647090B2 JP 5647090 B2 JP5647090 B2 JP 5647090B2 JP 2011234261 A JP2011234261 A JP 2011234261A JP 2011234261 A JP2011234261 A JP 2011234261A JP 5647090 B2 JP5647090 B2 JP 5647090B2
Authority
JP
Japan
Prior art keywords
query
keyword
score
word
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011234261A
Other languages
English (en)
Other versions
JP2013092894A (ja
Inventor
正彬 西野
正彬 西野
宜仁 安田
宜仁 安田
義昌 小池
義昌 小池
良治 片岡
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011234261A priority Critical patent/JP5647090B2/ja
Publication of JP2013092894A publication Critical patent/JP2013092894A/ja
Application granted granted Critical
Publication of JP5647090B2 publication Critical patent/JP5647090B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、クエリ推薦装置及び方法及びプログラムに係り、特に、World Wide Web上のドキュメントを検索する情報検索システムの利便性を高めるためのクエリ推薦装置及び方法及びプログラムに関する。
具体的には、検索システムの利用者が検索を行った位置をもとに、利用者に対して適切な検索クエリを推薦することで、利用者がより有用な情報を含むドキュメントを発見することを助けるためのクエリ推薦装置及び方法及びプログラムに関する。
既存の技術として、情報検索システムの利用者が過去に入力したクエリ(クエリログ)をもとに、あるクエリに関連するキーワードを抽出してクエリ推薦を行う仕組みが存在する(例えば、非特許文献1参照)。
Ricardo Baeza-Yates, Carlos Hurtado, and Marcelo Mendoza, "Query Recommendation using Query Logs in Search Engines", Lecture Notes in Computer Science, 2005, Volume 3268/2005, 395-397, DOI: 10.1007/978-3-540-30192-9_58
しかしながら、既存手法では、推薦に利用されるキーワードは入力されたクエリと関連性が高いかどうかによって選択され、検索システムの利用者にとって有用な情報を含むかどうかは考慮されていなかった。そのため、推薦されたクエリを用いても利用者が必要とする情報に辿りつけない可能性があった。
本発明は、上記の点に鑑みなされたもので、ある場所に行く前には必要性に気づかないが、現地に行くと必要となることを知るキーワードを検索するためのコストを削減することが可能なクエリ推薦装置及び方法及びプログラムを提供することを目的とする。
上記の課題を解決するために、本発明(請求項1)は、利用者が検索を行った位置に基づいて該利用者に適切な検索クエリを推薦するためのクエリ推薦装置であって、
利用者から複数のキーワードが含まれるクエリを取得し、該キーワードに位置語が含まれていれば、該位置語に緯度・経度を付与したキーワードを抽出する位置情報抽出手段と、
前記クエリを取得した時点の前記利用者の位置情報を取得し、該位置情報の緯度・経度と前記位置情報抽出手段から取得した位置語の緯度・経度を比較して該位置語と該利用者の位置が同一か否かにより現地検索か否かを判定し、前記クエリ、前記位置語、および判定結果の組を1つのレコードとしてクエリ記憶手段に格納するクエリ・位置関連性判定手段と、
前記クエリ記憶手段に格納されている情報に基づいて、位置語aを持つレコードのクエリに含まれる各キーワードwについて、該位置語aを満たすレコード数1と、該位置語aと該キーワードwを満たすレコード数2と、該位置語aと該キーワードwと前記判定結果が現地検索を満たすレコード数3とによって、スコアを計算し、該位置語a、該キーワードw、および該スコアとを組みにしてスコア記憶手段に格納するスコア算出手段と、
新たに入力されたクエリのキーワードxに基づいて前記スコア記憶手段を参照し、該キーワードxを位置語aとみなして、最もスコアの高いキーワードwを選択する推薦キーワード決定手段と、を有する。
また、本発明(請求項2)は、前記クエリ・位置関性判定手段に、
前記クエリを取得した時点の前記利用者の位置情報の緯度・経度と前記位置語の緯度・経度の距離を求め、該距離が所定の閾値以下である場合は、現地検索と判定する手段を含む。
また、本発明(請求項3)は、前記スコア算出手段に、
前記レコード数2が大きいほどに前記スコアが高く、前記レコード数3が大きいほどに前記スコアを高く算出する手段を含む。
本発明は、利用者の位置と当該利用者から入力されたクエリ中に出現する特定の位置を示すキーワードを利用して、当該利用者が現在位置に関する検索を行っているかを判定することにより、検索システムの利用者が、ある場所に行く前には必要性に気づかないが、現地に行くと必要となることをキーワード推薦によって知ることができるため、結果として、必要な情報に辿り着くための手数を削減する効果がある。
本発明の一実施の形態におけるクエリ推薦装置の構成図である。 本発明の一実施の形態におけるクエリ推薦装置の概要動作のフローチャートである。 本発明の一実施の形態における入力データの例である。 本発明の一実施の形態におけるジオコーディング後データの例である。 本発明の一実施の形態におけるクエリ・位置関係性判定処理のフローチャートである。 本発明の一実施の形態における関係性判定後データの例である。 本発明の一実施の形態におけるスコア算出処理のフローチャートである。 本発明の一実施の形態におけるスコア付与後データの例である。
以下図面と共に、本発明の実施の形態を説明する。
まず、本発明の概要を説明する。
検索システム利用者の位置と、クエリ中に出現する特定の位置を示すキーワード(以下、位置語と呼ぶ)とを利用して、検索を行った利用者が現在位置に関する検索を行っているのかそうでないのかを判定する。近年、位置測位機能を搭載した携帯端末が広く普及しているため、検索を行う位置が取得できるという前提は妥当である。検索が現在位置に関するものかの判定後、ある場所について、その場所に居た利用者に固有の検索キーワードを抽出する。抽出された検索キーワードは、その場所に実際に行った人が必要になる情報を反映している可能性が高いため、有用な情報に辿りつける可能性が高いキーワードとしてクエリ推薦に用いる。
例えば、あるレジャー施設にいる人とそうでない人とのクエリを比較したとする。レジャー施設に居る人のクエリからは、「日差しが強い」といったようにその場所にいる人にしか分からない情報を反映したキーワードを抽出できることを本発明で達成する。
以下に本発明を詳細に説明する。
図1は、本発明の一実施の形態におけるクエリ推薦装置の構成を示す。
同図に示すクエリ推薦装置は、クエリ入力部1,ジオコーディング処理部2,位置入力部3,クエリ・位置関係性判定部4,クエリ記憶部5,スコア算出処理部6,推薦キーワード決定部7,スコア記憶部8,キーワード出力部9からなる。
クエリ入力部1は、情報検索システムの利用者が入力するクエリを受け取る。入力されるクエリは、複数個のキーワードから構成される。クエリ入力部1で受け取ったクエリはジオコーディング処理部2、もしくは推薦キーワード決定部7に渡される。
ジオコーディング処理部2は、受け取ったクエリに含まれるキーワードに対して位置語が含まれるか判定し、含まれていたならばその語に対してジオコーディング処理を行う。ここで、ジオコーディングとは、地名を入力として、その地名が対応する場所の緯度・経度を出力する技術のことをいう。ジオコーディングの例として、Google社が提供している「Google Geocoding API(登録商標)」などがある(Google Geocoding API http://code.google.com/intl/ja/apis/maps/documentation/geocoding/)。位置語への緯度・経度の付与が終了後、処理結果をクエリ・位置関連性判定部4へと渡す。
位置入力部3は、情報検索システムの利用者がシステムにクエリを入力した時点での位置を入力として受け取る。位置は緯度・経度によって指定され、利用者が検索システムを利用した端末に搭載されている位置測位システム等によって取得されるものとする。取得された位置はクエリ・位置関連性判定部4へと渡される。
クエリ・位置関連性判定部4は、ジオコーディング処理部2から位置語に緯度・経度を付与したキーワード群、位置入力部3から利用者の緯度・経度を受け取り、位置語で示される位置と利用者の位置が同一であるかの判定処理を実行する。判定処理の詳細については図5で後述する。実行結果をクエリ記憶部5に渡す。
クエリ記憶部5は、ハードディスク等の記憶媒体であり、クエリ・位置関連性判定部4から受け取ったデータを保持する。保持したデータはスコア算出部6での処理で用いられる。
スコア算出処理部6では、クエリ記憶部5に記録されたデータを受け取り、スコア算出処理を行う。スコア算出処理の詳細については、図7で後述する。処理結果はスコア記憶部8に渡される。
スコア記憶部8は、ハードディスク等の記憶媒体であり、スコア算出処理部6で算出された、キーワード/スコアのペアを記憶する。記憶したデータは推薦キーワード決定部7で利用される。
推薦キーワード決定部7では、クエリ入力部1から受け取った、情報検索システムへのクエリについて、スコア記憶部8に記録されたスコアに基づいて推薦すべきキーワードを決定する。推薦に使うキーワードが定まれば、それをキーワード出力部9に渡す。
キーワード出力部9では、推薦キーワード決定部7から受け取った推薦キーワードを検索システムの利用者に提示する。
次に、処理の流れを説明する。
図2は、本発明の一実施の形態におけるクエリ推薦装置の概要動作のフローチャートである。
ステップ1) クエリ入力部1、位置入力部3は、それぞれ、情報検索システムの利用者から、検索クエリと位置を取得する。入力されるデータの例を図3に示す。同図に示すように、位置は緯度と経度により表される。
ステップ2) 次に、ジオコーディング処理部3は、受け取ったクエリに含まれるキーワードに、位置語が含まれるかどうかを判定する。もし位置語が含まれなかった場合には、処理を終了する。位置語を含む場合には、ステップ3に進む。
ステップ3) ジオコーディング処理部3がジオコーディングを行い、クエリに含まれる位置語の座標(緯度・経度)を取得し、その結果をクエリ記憶部5に記憶する。クエリ記憶部5に記憶されるデータの例を図4に示す。同図に示すように、クエリ記憶部5には、クエリ毎に緯度・経度、位置語、位置語緯度・経度が格納される。
ステップ4) クエリ・位置関連性判定部4は、クエリ・位置関係性判定処理を行う。この処理について図5に示す詳細フローを用いて説明する。
まず、ステップ11で、クエリの緯度・経度と位置語の緯度・経度の距離を算出する(ステップ11)。距離の算出は、クエリの緯度をlatq 経度をlonq、位置語の緯度をlatw、 経度をlonwとするなら、例えば,
Figure 0005647090
として、距離dを算出すればよい。次に、ステップ12でdが予め定めた距離のしきい値より小さいかを判定し(ステップ12)、小さいならばステップ13に進み、入力された位置と、位置語が対応する位置とが同じであり、つまり検索が現地で行われたと判定する(ステップ13)。大きいならばステップ14に進み、検索が現地で行われていないと判定する。処理結果は図6のような形式で、クエリ記憶部5に保持される。
ステップ5) スコア算出部6は、クエリ記憶部5に記録されている各位置語に対する推薦キーワードのスコア算出処理を行う。スコア算出処理について、図7のフローチャートを用いて説明する。
スコア算出部6は、位置語をひとつ定め(ステップ21)、その位置語を含むレコードをクエリ記憶部5からすべて取り出す。ある位置語aについて、aと同じクエリ中に出現したことがあるキーワードの集合をWとする(ステップ22)。あるキーワードのスコアをscore(a,w)とし、
Figure 0005647090
として計算する(ステップ23)。ここで、ca,wはクエリ記憶部5に記憶されているレコードのうち、aを位置語、wをクエリ中に含むものの総数であり、ga,wはクエリ記憶部5に記憶されているレコードのうち、aを位置語、wをクエリ中に含み、かつ現地で検索されたと判定されたものの総数である。次に、計算したスコアを図8に示すように、スコア記憶部8に記憶し、処理を終了する(ステップ24)。
ステップ6) 推薦キーワード決定部7は、新たにクエリ入力部1からクエリとしてキーワードxを受け取り、スコア記憶部8に記憶されているスコアscore(x,w)が最大となるキーワードwを選択し、それをキーワード出力部9から出力して、処理を終了する。
上記の処理において、例えば、位置語として「横浜」とキーワード「クルーズ」を含む検索クエリと検索者の現在位置が入力されると、位置語「横浜」にとって同時に入力されたキーワードほど値が高く(式(2)の第1項)、検索者の現在位置近く入力されるキーワードほど値が高く(式(2)の第2項)なる位置語にとってスコアの高いキーワードが推薦される。結果的には、図8に示す位置語「横浜」でスコアが最大となるキーワード「クルーズ」が出力される。
なお、本発明の図1に示すクエリ推薦装置の各構成要素の動作をプログラムとして構築し、クエリ推薦装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
1 クエリ入力部
2 ジオコーディング処理部
3 位置入力部
4 クエリ・位置関連性判定部
5 クエリ記憶部
6 スコア算出処理部
7 推薦キーワード決定部
8 スコア記憶部
9 キーワード出力部

Claims (7)

  1. 利用者が検索を行った位置に基づいて該利用者に適切な検索クエリを推薦するためのクエリ推薦装置であって、
    利用者から複数のキーワードが含まれるクエリを取得し、該キーワードに位置語が含まれていれば、該位置語に緯度・経度を付与したキーワードを抽出する位置情報抽出手段と、
    前記クエリを取得した時点の前記利用者の位置情報を取得し、該位置情報の緯度・経度と前記位置情報抽出手段から取得した位置語の緯度・経度を比較して該位置語と該利用者の位置が同一か否かにより現地検索か否かを判定し、前記クエリ、前記位置語、および判定結果の組を1つのレコードとしてクエリ記憶手段に格納するクエリ・位置関連性判定手段と、
    前記クエリ記憶手段に格納されている情報に基づいて、位置語aを持つレコードのクエリに含まれる各キーワードwについて、該位置語aを満たすレコード数1と、該位置語aと該キーワードwを満たすレコード数2と、該位置語aと該キーワードwと前記判定結果が現地検索を満たすレコード数3とによって、スコアを計算し、該位置語a、該キーワードw、および該スコアとを組みにしてスコア記憶手段に格納するスコア算出手段と、
    新たに入力されたクエリのキーワードxに基づいて前記スコア記憶手段を参照し、該キーワードxを位置語aとみなして、最もスコアの高いキーワードwを選択する推薦キーワード決定手段と、
    を有することを特徴とするクエリ推薦装置。
  2. 前記クエリ・位置関性判定手段は、
    前記クエリを取得した時点の前記利用者の位置情報の緯度・経度と前記位置語の緯度・経度の距離を求め、該距離が所定の閾値以下である場合は、現地検索と判定する手段を含む請求項1記載のクエリ推薦装置。
  3. 前記スコア算出手段は、
    前記レコード数2が大きいほどに前記スコアが高く、前記レコード数3が大きいほどに前記スコアを高く算出する手段を含む請求項1記載のクエリ推薦装置。
  4. 利用者が検索を行った位置に基づいて該利用者に適切な検索クエリを推薦するためのクエリ推薦方法であって、
    位置情報抽出手段が、利用者から複数のキーワードが含まれるクエリを取得し、該キーワードに位置語が含まれていれば、該位置語に緯度・経度を付与したキーワードを抽出する位置情報抽出ステップと、
    クエリ・位置関連性判定手段が、前記クエリを取得した時点の前記利用者の位置情報を取得し、該位置情報の緯度・経度と前記位置情報抽出ステップで付与された位置語の緯度・経度を比較して該位置語と該利用者の位置が同一か否かにより現地検索か否かを判定し、前記クエリ、前記位置語、および判定結果の組を1つのレコードとしてクエリ記憶手段に格納するクエリ・位置関連性判定ステップと、
    スコア算出手段が、前記クエリ記憶手段に格納されている情報に基づいて、位置語aを持つレコードのクエリに含まれる各キーワードwについて、該位置語aを満たすレコード数1と、該位置語aと該キーワードwを満たすレコード数2と、該位置語aと該キーワードwと前記判定結果が現地検索を満たすレコード数3とによって、スコアを計算し、該位置語a、該キーワードw、および該スコアとを組みにしてスコア記憶手段に格納するスコア算出ステップと、
    推薦キーワード決定手段が、新たに入力されたクエリのキーワードxに基づいて前記スコア記憶手段を参照し、該キーワードxを位置語aとみなして、最もスコアの高いキーワードwを選択する推薦キーワード決定ステップと、
    を行うことを特徴とするクエリ推薦方法。
  5. 前記クエリ・位置関性判定ステップにおいて、
    前記クエリを取得した時点の前記利用者の位置情報の緯度・経度と前記位置語の緯度・経度の距離を求め、該距離が所定の閾値以下である場合は、現地検索と判定する
    請求項4記載のクエリ推薦方法。
  6. 前記スコア算出ステップにおいて、
    前記レコード数2が大きいほどに前記スコアが高く、前記レコード数3が大きいほどに前記スコアを高く算出する
    請求項4記載のクエリ推薦方法。
  7. コンピュータを、
    請求項1乃至3のいずれか1項に記載のクエリ推薦装置の手段として機能させるためのクエリ推薦プログラム。
JP2011234261A 2011-10-25 2011-10-25 クエリ推薦装置及び方法及びプログラム Expired - Fee Related JP5647090B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011234261A JP5647090B2 (ja) 2011-10-25 2011-10-25 クエリ推薦装置及び方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011234261A JP5647090B2 (ja) 2011-10-25 2011-10-25 クエリ推薦装置及び方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013092894A JP2013092894A (ja) 2013-05-16
JP5647090B2 true JP5647090B2 (ja) 2014-12-24

Family

ID=48615973

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011234261A Expired - Fee Related JP5647090B2 (ja) 2011-10-25 2011-10-25 クエリ推薦装置及び方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5647090B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200062781A (ko) * 2018-11-27 2020-06-04 황민선 위치 기반 경험 공유 시스템 및 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10016A (en) * 1853-09-13 Bootjack
KR100469825B1 (ko) * 2004-04-29 2005-02-03 엔에이치엔(주) 지역의 인기 정보를 제공하는 방법 및 지역 인기 정보제공 시스템
KR20090076798A (ko) * 2006-11-08 2009-07-13 가부시키가이샤 시리우스 테크놀로지즈 광고정보 제공 방법, 광고정보 제공 시스템 및 광고정보 제공 프로그램
JP2010287048A (ja) * 2009-06-11 2010-12-24 Zenrin Datacom Co Ltd 情報検索装置、情報検索プログラム、及び携帯端末装置
JP5556100B2 (ja) * 2009-09-17 2014-07-23 富士通株式会社 情報提供装置、情報提供方法及びコンピュータプログラム
JP2011085994A (ja) * 2009-10-13 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> 広告配信装置、広告配信方法および広告配信プログラム
JP5164968B2 (ja) * 2009-12-25 2013-03-21 ヤフー株式会社 地域スコアデータベースを作成する装置、方法及びプログラム

Also Published As

Publication number Publication date
JP2013092894A (ja) 2013-05-16

Similar Documents

Publication Publication Date Title
JP6759844B2 (ja) 画像を施設に対して関連付けるシステム、方法、プログラム及び装置
US9418128B2 (en) Linking documents with entities, actions and applications
US10747793B2 (en) Expanding search queries
WO2014146550A1 (zh) 地图搜索的搜索建议方法、装置、计算机存储介质和设备
US8442716B2 (en) Identifying physical locations of entities
US11861516B2 (en) Methods and system for associating locations with annotations
WO2018133648A1 (zh) 搜索方法、装置及非临时性计算机可读存储介质
US9069794B1 (en) Determining location information for images using landmark, caption, and metadata location data
KR20120042307A (ko) 지역기반의 검색어를 추천하는 시스템 및 그 방법
JP5543384B2 (ja) ローカルクエリ抽出装置、ローカルクエリ抽出プログラム、およびローカルクエリ抽出方法
US20160357857A1 (en) Apparatus, system and method for string disambiguation and entity ranking
US20110208715A1 (en) Automatically mining intents of a group of queries
US20190129995A1 (en) Expanding search queries
CN110377684A (zh) 一种基于用户反馈的空间关键字个性化语义查询方法
CN106095738A (zh) 推荐表单片段
Li et al. A probabilistic topic-based ranking framework for location-sensitive domain information retrieval
CN105550308A (zh) 一种信息处理方法,检索方法及电子设备
JP5486667B2 (ja) クエリ結果を多様化するための方法および装置
CN102129454A (zh) 一种基于云存储的百科数据处理方法及系统
US10922321B2 (en) Interpreting user queries based on device orientation
CN103646034A (zh) 一种基于内容可信的Web搜索引擎系统及搜索方法
JP5647090B2 (ja) クエリ推薦装置及び方法及びプログラム
US20170277702A1 (en) Interpreting user queries based on nearby locations
CN107463590B (zh) 自动的对话阶段发现
EP3143516A1 (en) Disambiguation of queries implicit to multiple entities

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131004

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141106

R150 Certificate of patent or registration of utility model

Ref document number: 5647090

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees