JP5543384B2 - ローカルクエリ抽出装置、ローカルクエリ抽出プログラム、およびローカルクエリ抽出方法 - Google Patents
ローカルクエリ抽出装置、ローカルクエリ抽出プログラム、およびローカルクエリ抽出方法 Download PDFInfo
- Publication number
- JP5543384B2 JP5543384B2 JP2011006229A JP2011006229A JP5543384B2 JP 5543384 B2 JP5543384 B2 JP 5543384B2 JP 2011006229 A JP2011006229 A JP 2011006229A JP 2011006229 A JP2011006229 A JP 2011006229A JP 5543384 B2 JP5543384 B2 JP 5543384B2
- Authority
- JP
- Japan
- Prior art keywords
- query
- user data
- search
- local query
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
まず、本発明の第1の実施形態に係るローカルクエリ抽出装置1の構成について、図1を参照しながら説明する。図1は、ローカルクエリ抽出装置1の構成概要図である。図1に示すように、ローカルクエリ抽出装置1は、検索ログ格納部10(特許請求の範囲の「検索ログ格納手段」に相当)、ユーザデータ格納部20(特許請求の範囲の「ユーザデータ格納手段」に相当)、メタデータ格納部30(特許請求の範囲の「メタデータ格納手段」に相当)、検索ログ側付加部40(特許請求の範囲の「検索ログ側関連付け手段」に相当)、ユーザデータ側付加部50(特許請求の範囲の「ユーザデータ側関連付け手段」に相当)、ローカルクエリ抽出部60(特許請求の範囲の「ローカルクエリ抽出手段」に相当)、およびローカルクエリ出力部70を備える。
引き続き、本発明の第2の実施形態について説明する。第2の実施形態は、第1の実施形態(図1を参照)と比べ、検索頻度算出部61(特許請求の範囲の「検索頻度算出手段」に相当)を更に備え、ローカルクエリ抽出部60の動作に相違点がある。以下、第2の実施形態における相違点を中心に説明し、共通する部分においては説明を省略する。
引き続き、本発明の第3の実施形態について説明する。第3の実施形態は、第1の実施形態(図1を参照)と比べ、TF値算出部62(特許請求の範囲の「第1値算出手段」に相当)およびIDF値算出部63(特許請求の範囲の「第2値算出手段」に相当)を更に備え、ローカルクエリ抽出部60の動作に相違点がある。以下、第1の実施形態における相違点を中心に説明し、共通する部分においては説明を省略する。
tfidfエリア、共起語=tfエリア、共起語・idfエリア、共起語…(6)
以上、本発明の第1〜第3の実施形態をローカルクエリ抽出装置1として説明した。以上の説明は、コンピュータをローカルクエリ抽出装置1として動作させるローカルクエリ抽出プログラムに係る説明としても捉えることができる。重複する説明は省略するが、ローカルクエリ抽出プログラムは、コンピュータを、以上で説明した検索ログ格納部10、ユーザデータ格納部20、メタデータ格納部30、検索ログ側付加部40、ユーザデータ側付加部50、ローカルクエリ抽出部60、およびローカルクエリ出力部70として機能させる。ローカルクエリ抽出プログラムは、例えば、記録媒体に格納されて提供される。なお、記録媒体としては、フレキシブルディスク、CD、DVD等の記録媒体、ROM等の記録媒体、または半導体メモリ等が例示される。
また、以上の説明は、ローカルクエリ抽出装置1より行われるローカルクエリ抽出方法に係る説明としても捉えることができる。重複する説明は省略するが、ローカルクエリ抽出方法では、検索ログ格納部10に、検索サービスにおいてユーザが入力したクエリ、およびユーザIDを含む検索ログが格納されており、ユーザデータ格納部20に、ユーザIDを含むユーザデータが格納されており、メタデータ格納部30に、位置情報、および当該位置情報に関連付けられたメタデータが格納されている。そして、ローカルクエリ抽出方法は、検索ログ側付加部40が、クエリに含まれるメタデータを基に、メタデータ格納部30に格納された位置情報を抽出し、当該抽出した位置情報を検索ログと関連付ける検索ログ側関連付けステップと、ユーザデータ側付加部50が、ユーザデータに含まれるメタデータを基に、メタデータ格納部30に格納された位置情報を抽出し、当該抽出した位置情報をユーザデータと関連付けるユーザデータ側関連付けステップと、ローカルクエリ抽出部60が、検索ログと関連付けられた位置情報と、ユーザデータと関連付けられた位置情報とを照合することにより、ローカルクエリを抽出するローカルクエリ抽出ステップと、を備える。
続いて、本実施形態にかかるローカルクエリ抽出装置1、コンピュータをローカルクエリ抽出装置1として動作させるローカルクエリ抽出プログラム、ローカルクエリ抽出装置1より行われるローカルクエリ抽出方法の作用及び効果について説明する。
第1の実施形態では、検索ログと関連付けられた位置情報と、ユーザデータと関連付けられた位置情報とを照合することにより、ローカルクエリを抽出することができる。検索ログは、ユーザが検索サービス使用時に入力した検索クエリと、検索結果から遷移し閲覧したウェブサイトのURL情報とを蓄積したログである。検索ログ側付加部40は検索ログに格納されているクエリに含まれるメタデータを基に、検索ログに位置情報を追加するものである。メタデータは位置または地名に関連する抽象的なデータであり、数値または文字列から構成されている。例えば、都道府県名、市町村名、電話番号、郵便番号、あるいは東京ドーム、ディズニーランド、上野動物園などといった固有名詞が一例として含まれる。ユーザデータに含まれるメタデータからユーザの位置情報をユーザデータ側付加部50にて推定する。ユーザデータは、ユーザのIPアドレス、GPSまたはネットワーク測位による位置データ(緯度経度)、ユーザがこれまで入力したクエリやライフログのことを指し、これらのデータから位置情報が推定される。ローカルクエリ抽出部60は、クエリの位置情報とユーザの位置情報とを照合し、地域毎にローカルクエリの抽出を行う。地域(エリア)とは、都道府県、市町村、またはある特定の位置から一定の範囲の領域のことを指すが限定はしない。ローカルクエリ出力部70における出力形式は固定していないが、クエリの検索回数を基準に規則的にソートされていてもよいし、またランダムな順序でもよい。また集計においては、クエリ単位の集計に限定されない。
第2の実施形態では、クエリの検索頻度と他地域における同一クエリの検索頻度とを比較してから、ローカルクエリを抽出する。検索頻度はその地域で特定のワードがどの程度の割合で検索されたかを示すものである。例えば地域名と共起するクエリのうち「ラーメン」が検索された割合が1割ならば、「ラーメン」の当該地域名における検索頻度は0.1となる。検索頻度の地域毎の比較を行うことで、検索ログからローカルクエリの抽出をさらに洗練することが可能である。一例として、地域名と共起するクエリを母集団とし、「映画」というワードにおいて、それぞれの地域でワード「映画」が検索される平均の割合がXだとした場合を考える。この場合、例えば「六本木」エリアで「映画」と検索される割合がYだった場合、YとXを比較し、YがXを一定の基準値以上上回っていた場合、「映画」というクエリは全国の地域を押し並べて比較した結果、地域「六本木」の特徴を表しているローカルクエリであると言えることになる。対象となる地域の検索頻度と全国平均頻度を必ず比較するとは限らない。地域毎の検索頻度を比較し、ある地域における検索頻度が他の地域における検索頻度に比べて一定の基準を超えた場合、当該クエリを当該地域におけるローカルクエリとしてもよい。また基準値は固定値であってもよいが、地域毎の人口や地域の特徴に応じて変動する値であってもかまわない。
第3の実施形態では、ローカルクエリ抽出処理の結果に対する重み付けがTF値、IDF値およびTFIDF値により行われ、更に精度良くローカルクエリを抽出することが可能となる。また、TF値、IDF値およびTFIDF値を基にローカルクエリの並び変えを行うことで、どのクエリがよりその地域と相関が高いかを把握することが可能となる。例えば、その地域にしかない人気レストランなどは高いTF値、IDF値およびTFIDF値で重み付けされる。また、病院といったどこの地域にもあるような一般的なクエリには、低いTF値、IDF値およびTFIDF値で重み付けされる。このように、第3の実施形態では、地域毎にその他の地域と比較してより地域特定性の高いクエリや検索頻度の高いクエリに高い値で重み付けが行われるので、クエリの更なるローカライズが可能となる。また、正規化に関しては、上記「第2の実施形態の作用及び効果」と同様のことが言える。
Claims (9)
- 検索サービスにおいてユーザが入力したクエリ、およびユーザ特定情報を含む検索ログを格納する検索ログ格納手段と、
前記ユーザ特定情報を含むユーザデータを格納するユーザデータ格納手段と、
位置情報、および前記位置情報に関連付けられたメタデータを格納するメタデータ格納手段と、
前記クエリに含まれるメタデータを基に、前記メタデータ格納手段に格納された位置情報を抽出し、当該抽出した位置情報を前記検索ログと関連付ける検索ログ側関連付け手段と、
前記ユーザデータに含まれるメタデータを基に、前記メタデータ格納手段に格納された位置情報を抽出し、当該抽出した位置情報を前記ユーザデータと関連付けるユーザデータ側関連付け手段と、
前記クエリの地域毎の検索頻度を算出する検索頻度算出手段と、
前記検索ログと関連付けられた位置情報と、前記ユーザデータと関連付けられた位置情報とを照合することにより、ローカルクエリを抽出するローカルクエリ抽出手段と、
を備え、
前記ローカルクエリ抽出手段は、ある地域におけるあるクエリの前記検索頻度が、他の地域における前記あるクエリの前記検索頻度より閾値以上高い場合に、前記あるクエリを前記ある地域における前記ローカルクエリとして抽出する、
ことを特徴とするローカルクエリ抽出装置。 - 特定の地域にて特定のクエリが検索された回数を、前記特定の地域での総検索回数で割ることで得られる第1の値を算出する第1値算出手段と、
地域の総数を、前記特定のクエリが検索された地域の数で割ることで得られる第2の値を算出する第2値算出手段と、
を更に備え、
前記ローカルクエリ抽出手段は、前記第1の値および前記第2の値に基づき算出される第3の値が基準値以上である場合に、前記特定のクエリを前記特定の地域における前記ローカルクエリとして抽出する、
ことを特徴とする請求項1に記載のローカルクエリ抽出装置。 - 前記検索頻度、前記第1の値、前記第2の値、および前記第3の値のうち何れか1つ以上をユニークユーザ数単位で正規化する正規化手段を更に備え、
前記ローカルクエリ抽出手段は、当該正規化後の値を用いて前記ローカルクエリとして抽出する、
ことを特徴とする請求項2に記載のローカルクエリ抽出装置。 - 前記メタデータ格納手段に格納されたメタデータは、都道府県名、市町村名、電話番号、郵便番号、地域の固有名詞、施設名、住所、IPアドレス、GPS測位による緯度経度、およびネットワーク測位による緯度経度のうち何れか1つ以上を示す情報である、
ことを特徴とする請求項1〜3の何れか1項に記載のローカルクエリ抽出装置。 - 前記ユーザデータ側関連付け手段は、前記ユーザデータに含まれる前記ユーザにより事前に登録された住所を基に、前記メタデータ格納手段に格納された位置情報を抽出し、当該抽出した位置情報を前記ユーザデータと関連付ける、
ことを特徴とする請求項4に記載のローカルクエリ抽出装置。 - 前記ユーザデータ側関連付け手段は、前記ユーザデータに含まれる前記ユーザのIPアドレス、または前記GPS若しくはネットワーク測位による緯度経度を基に、前記メタデータ格納手段に格納された位置情報を抽出し、当該抽出した位置情報を前記ユーザデータと関連付ける、
ことを特徴とする請求項4に記載のローカルクエリ抽出装置。 - 前記ユーザデータ側関連付け手段は、前記ユーザが過去に発行したクエリまたはライフログを基に、前記メタデータ格納手段に格納された位置情報を抽出し、当該抽出した位置情報を前記ユーザデータと関連付ける、
ことを特徴とする請求項4に記載のローカルクエリ抽出装置。 - コンピュータを、
検索サービスにおいてユーザが入力したクエリ、およびユーザ特定情報を含む検索ログを格納する検索ログ格納手段と、
前記ユーザ特定情報を含むユーザデータを格納するユーザデータ格納手段と、
位置情報、および前記位置情報に関連付けられたメタデータを格納するメタデータ格納手段と、
前記クエリに含まれるメタデータを基に、前記メタデータ格納手段に格納された位置情報を抽出し、当該抽出した位置情報を前記検索ログと関連付ける検索ログ側関連付け手段と、
前記ユーザデータに含まれるメタデータを基に、前記メタデータ格納手段に格納された位置情報を抽出し、当該抽出した位置情報を前記ユーザデータと関連付けるユーザデータ側関連付け手段と、
前記クエリの地域毎の検索頻度を算出する検索頻度算出手段と、
前記検索ログと関連付けられた位置情報と、前記ユーザデータと関連付けられた位置情報とを照合することにより、ローカルクエリを抽出するローカルクエリ抽出手段、
として動作させ、
前記ローカルクエリ抽出手段は、ある地域におけるあるクエリの前記検索頻度が、他の地域における前記あるクエリの前記検索頻度より閾値以上高い場合に、前記あるクエリを前記ある地域における前記ローカルクエリとして抽出する、
ことを特徴とするローカルクエリ抽出プログラム。 - 検索ログ格納手段に、検索サービスにおいてユーザが入力したクエリ、およびユーザ特定情報を含む検索ログが格納されており、
ユーザデータ格納手段に、前記ユーザ特定情報を含むユーザデータが格納されており、
メタデータ格納手段に、位置情報、および前記位置情報に関連付けられたメタデータが格納されており、
検索ログ側関連付け手段が、前記クエリに含まれるメタデータを基に、前記メタデータ格納手段に格納された位置情報を抽出し、当該抽出した位置情報を前記検索ログと関連付ける検索ログ側関連付けステップと、
ユーザデータ側関連付け手段が、前記ユーザデータに含まれるメタデータを基に、前記メタデータ格納手段に格納された位置情報を抽出し、当該抽出した位置情報を前記ユーザデータと関連付けるユーザデータ側関連付けステップと、
検索頻度算出手段が、前記クエリの地域毎の検索頻度を算出する検索頻度算出ステップと、
ローカルクエリ抽出手段が、前記検索ログと関連付けられた位置情報と、前記ユーザデータと関連付けられた位置情報とを照合することにより、ローカルクエリを抽出するローカルクエリ抽出ステップと、
を備え、
前記ローカルクエリ抽出ステップでは、ある地域におけるあるクエリの前記検索頻度が、他の地域における前記あるクエリの前記検索頻度より閾値以上高い場合に、前記あるクエリを前記ある地域における前記ローカルクエリとして抽出する、
ことを特徴とするローカルクエリ抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011006229A JP5543384B2 (ja) | 2011-01-14 | 2011-01-14 | ローカルクエリ抽出装置、ローカルクエリ抽出プログラム、およびローカルクエリ抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011006229A JP5543384B2 (ja) | 2011-01-14 | 2011-01-14 | ローカルクエリ抽出装置、ローカルクエリ抽出プログラム、およびローカルクエリ抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012146264A JP2012146264A (ja) | 2012-08-02 |
JP5543384B2 true JP5543384B2 (ja) | 2014-07-09 |
Family
ID=46789743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011006229A Expired - Fee Related JP5543384B2 (ja) | 2011-01-14 | 2011-01-14 | ローカルクエリ抽出装置、ローカルクエリ抽出プログラム、およびローカルクエリ抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5543384B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5398884B1 (ja) * | 2012-08-10 | 2014-01-29 | 日本電信電話株式会社 | 名物を代表する地域の推定装置及び方法 |
JP5901502B2 (ja) * | 2012-11-27 | 2016-04-13 | 日本電信電話株式会社 | 居住地推定用データ生成装置、居住地推定用データ生成方法、及びプログラム |
JP6363474B2 (ja) * | 2014-11-17 | 2018-07-25 | 株式会社Nttドコモ | 特定場所発見装置および特定場所発見プログラム |
CN106257448A (zh) | 2015-06-19 | 2016-12-28 | 阿里巴巴集团控股有限公司 | 一种关键词的展示方法和装置 |
JP6782591B2 (ja) * | 2016-09-12 | 2020-11-11 | ヤフー株式会社 | 推定装置、推定方法、及び推定プログラム |
JP6788637B2 (ja) * | 2018-02-27 | 2020-11-25 | 株式会社 ミックウェア | 情報検索装置及び情報検索システム |
JP6467694B1 (ja) * | 2018-03-07 | 2019-02-13 | データ・サイエンティスト株式会社 | 検索語の評価装置、評価システム、評価方法、及び評価モジュール生産方法 |
JP7023920B2 (ja) * | 2019-12-17 | 2022-02-22 | ヤフー株式会社 | 情報処理装置、情報処理方法、および情報処理プログラム |
WO2023228560A1 (ja) * | 2022-05-23 | 2023-11-30 | 株式会社Nttドコモ | データ集計装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7483881B2 (en) * | 2004-12-30 | 2009-01-27 | Google Inc. | Determining unambiguous geographic references |
JP4929268B2 (ja) * | 2008-11-12 | 2012-05-09 | ヤフー株式会社 | 知識レベルに基づいて広告を配信する装置及び方法 |
-
2011
- 2011-01-14 JP JP2011006229A patent/JP5543384B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012146264A (ja) | 2012-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5543384B2 (ja) | ローカルクエリ抽出装置、ローカルクエリ抽出プログラム、およびローカルクエリ抽出方法 | |
Bennett et al. | Inferring and using location metadata to personalize web search | |
Biancalana et al. | An approach to social recommendation for context-aware mobile services | |
US8166013B2 (en) | Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis | |
CN1766880B (zh) | 用于提供地理搜索功能的系统和方法 | |
CN102982153B (zh) | 一种信息检索方法及其装置 | |
US9418128B2 (en) | Linking documents with entities, actions and applications | |
US10152478B2 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
US8407781B2 (en) | Information providing support device and information providing support method | |
US20100161591A1 (en) | System and method of geo-based prediction in search result selection | |
JP2005085285A5 (ja) | ||
US11216499B2 (en) | Information retrieval apparatus, information retrieval system, and information retrieval method | |
US20110313954A1 (en) | Community model based point of interest local search | |
US20120311140A1 (en) | Method of processing web access information and server implementing same | |
KR101429397B1 (ko) | 소셜 네트워크 서비스의 메시지 분석을 이용한 핵심사건 추출 방법 및 시스템 | |
JP7166116B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US9348925B2 (en) | Locally significant search queries | |
Guo et al. | A nonparametric model for event discovery in the geospatial-temporal space | |
JP4569380B2 (ja) | ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
KR101752474B1 (ko) | 지식 공유 서비스 제공 장치, 방법 및 컴퓨터 프로그램 | |
Li et al. | A probabilistic topic-based ranking framework for location-sensitive domain information retrieval | |
KR101867421B1 (ko) | 소셜 데이터를 이용한 서비스 제공업체 추천 방법 및 장치 | |
JP4759600B2 (ja) | 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体 | |
JP2006235875A (ja) | 情報ナビゲーション方法及び装置及びプログラム | |
JP2012190167A (ja) | 情報処理装置および情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130816 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140128 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140415 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140508 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5543384 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |