JP5094891B2 - 検索スコア算出装置 - Google Patents
検索スコア算出装置 Download PDFInfo
- Publication number
- JP5094891B2 JP5094891B2 JP2010017041A JP2010017041A JP5094891B2 JP 5094891 B2 JP5094891 B2 JP 5094891B2 JP 2010017041 A JP2010017041 A JP 2010017041A JP 2010017041 A JP2010017041 A JP 2010017041A JP 5094891 B2 JP5094891 B2 JP 5094891B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- click
- value
- ranking
- search score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims description 155
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 claims description 7
- 238000000034 method Methods 0.000 description 16
- 238000010606 normalization Methods 0.000 description 11
- 239000013256 coordination polymer Substances 0.000 description 9
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
特許文献1には、検索結果が表示される回数と、検索結果が表示された後に、この検索結果に含まれるURLにユーザがアクセスした回数とに基づいて、検索結果の適合性の最適化を自動的に行う技術が提案されている。
しかし、画像検索において、従来の検索スコアの算出方法では、ユーザの傾向が十分に反映されず、検索結果に対する検索スコアが適切に算出されないおそれがあった。
以下、本発明の実施形態について図面を参照しながら説明する。
図1は、本発明の第1実施形態に係る検索スコア算出装置1を含む検索システム100の全体構成を示す図である。図1に示すように、検索システム100は、検索スコア算出装置1と、検索エンジンサーバ2と、ユーザ端末4と、外部サーバ3と、通信回線5とを備える。
検索エンジンサーバ2は、検索エンジン21を有し、ユーザ端末4から受け付けたクエリを用いて検索を実行し、得られた検索結果をユーザ端末4へ送信する。
検索スコア算出装置1は、検索エンジン21における画像検索の優先度を示す検索スコアを算出するものである。検索スコア算出装置1は、記憶手段としてのクリックログデータベース(DB)110と、制御部130と、表示部150と、通信部160とを備える。
図2は、クリックログDB110に記憶されるクリックログテーブル111の一例を示す図である。図2に示すように、クリックログテーブル111には、クリックランキングと、クリック数と、画像IDと、ファーストクリックと、クエリ及びこのクエリの検索数とが関連付けて記憶されている。
画像IDとは、各画像を識別する識別IDをいう。
具体的には、第1クリック数計数部131は、図2に示す検索クエリと検索数において、クエリ「ガッキー」の検索数「191」と、クエリ「ガッキー 古垣結衣」の検索数「1」との和を計数することで、クリック数「192(=191+1)」が算出される。同様にして、第1クリック数計数部131は、他のクエリ及び検索数についてもクリック数をそれぞれ算出する。このように第1クリック数計数部131により算出された値が図2に示す「クリック数」の項目に示された値である。
例えば、第2クリック数計数部132は、図2に示すクリック数「192」に関連付けられたファーストクリックの項目が「1」となっている、すなわち、最先にアクセスされたURLであるため、クリック数「192」に所定数「1.5」を乗じた値である「288(=192×1.5)」を、クリック数として用いる。
例えば、代表クエリ決定部135は、図2に示すように、代表クリックランキング決定部134により決定された代表クリックランキング「2」に関連付けられたクエリ及びその検索数において、検索数の最も多い(検索数「1175」)クエリである「古垣結衣」を、画像ID「buzzdbw」で識別される画像の代表クエリとして決定する。
CP=ceil{100*log(1+3301)/log(1+36534270.5)}=ceil(46.5280503)=47
となる。
例えば、取得部137は、上述した代表クエリ「古垣結衣」を用いて検索エンジン21により画像検索を実行することで、現時点における代表クエリ「古垣結衣」により検索された画像の数及び画像ID「buzzdbw」で識別される画像の表示順位を取得する。その結果、取得部137により取得された画像の数は「143件」であり、画像ID「buzzdbw」で識別される画像の表示順位は「8位」であった。
CO=2/8=0.25(>0.1)
となる。そして、検索スコア算出部138は、第1の値COが0.1以上であるため、第1の値COを1とする。
CH=2/143=0.013986≒0.014(<0.1)
となる。そして、検索スコア算出部138は、第2の値CHが0.1よりも小さいため、この第2の値CH「0.014」を採用する。
具体的には、検索スコア算出部138は、採用された、又は1とした第1の値CO及び第2の値CH並びに正規化部136により正規化されたクリック数CPに基づいて、下記の(2)式を用いて、画像それぞれの検索スコアSを算出する。
S=(47*100)+ceil{(47/10)/1/0.014}=5036
となる。
例えば、上述した検索スコアS=5036を用いた場合には、正規化された検索スコアSnは、434となる。
図3は、第1実施形態に係る検索スコア算出装置1により検索スコアを算出する処理について示すフローチャートである。なお、以下の処理では、複数のクエリに対応する検索結果に含まれる画像のうち、一の画像について説明するが、他の画像についても同様の処理が実行されることで、検索結果に含まれる全ての画像について検索スコアが算出される。
ステップS2において、第2クリック数計数部132は、第1クリック数計数部131により計数されたクリック数の総数を計数する。
ステップS6において、正規化部136は、正規化されたクリック数の最大値が100となるように、画像それぞれのクリック数を、上述した(1)式を用いて正規化する。
ステップS11において、検索スコア算出部138は、算出された第1の値COが所定値P以上の場合には、算出された第1の値COを1とする。
ステップS14において、検索スコア算出部138は、算出された第2の値CHが所定値P以上の場合には、算出された第2の値CHを1とする。
ステップS17において、検索スコア算出部138により算出された、正規化された検索スコアSnを表示部150に所定の態様で表示させる。
次に、本発明に係る検索スコア算出装置の第2実施形態について説明する。第2実施形態については、主として、第1実施形態とは異なる点を説明し、第1実施形態と同様の構成について同一符号を付し、説明を省略する。第2実施形態について特に説明しない点については、第1実施形態についての説明が適宜適用される。
図4に示すように、検索スコア算出装置1aの制御部130は、第1クリック数計数部131と、第2クリック数計数部132と、クリックランキング付与部133と、代表クリックランキング決定部134と、代表クエリ決定部135と、正規化部136と、取得部137と、検索スコア算出部138と、出力部139と、サーチランキング算出手段としてのサーチランキング算出部140と、順位相関係数算出手段としての順位相関係数算出部141と、判定手段としての判定部142と、決定手段としての決定部143とを備える。
そして、順位相関係数算出部141は、第1の期間N(N個)及び順位差Dとの順位相関係数ρを、下記(4)式を用いて算出する。
図5は、第2実施形態に係る検索スコア算出装置1aにより検索スコアを算出する処理について示すフローチャートである。
ステップS28において、サーチランキング算出部140は、第1の期間N(例えば、1週間)内において、クリックログDB110に記憶される複数のクエリのうち、あるクエリが検索エンジン21による画像の検索に用いられた回数を、第1の期間Nより短い第2の期間M(例えば、1日)(N>M)ごとに算出する。そして、サーチランキング算出部140は、算出した回数それぞれにランキングを付すことで、あるクエリについての第2の期間Mごとのサーチランキングを算出する。
ステップS30において、判定部142は、順位相関係数算出部141により算出されたあるクエリにおける順位相関係数ρが所定の閾値TH1(例えば、−0.8)以下であるか否かを判定する。順位相関係数ρが所定の閾値TH1以下であると判定された場合(Yes)には、ステップS31へ移る。一方、順位相関係数ρが所定の閾値TH1を超えると判定された場合(No)には、ステップS32へ移る。
ステップS32において、決定部143は、あるクエリの検索スコアSを算出しないことを決定し、処理を終了する。
ステップS35において、検索スコア算出部138は、算出された検索スコアSnに対して所定の演算を行うことで、この正規化された検索スコアSnを変更する。
ステップS36において、出力部139は、検索スコア算出部138により算出された、変更された検索スコアSnを表示部150に所定の態様で表示させる。
また、第2実施形態で説明した手法を画像及び/又はテキスト検索におけるサーチランキング、クリックランキングに適用してもよい。
また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
110 クリックログDB(記憶手段)
131 第1クリック数計数部(第1クリック数計数手段)
132 第2クリック数計数部(第2クリック数計数手段)
133 クリックランキング付与部(クリックランキング付与手段)
134 代表クリックランキング決定部(代表クリックランキング決定手段)
135 代表クエリ決定部(代表クエリ決定手段)
136 正規化部
137 取得部(取得手段)
138 検索スコア算出部(検索スコア算出手段)
Claims (6)
- 画像検索の検索スコアを算出する検索スコア算出装置であって、
前記画像検索に用いられた複数のクエリと、当該複数のクエリそれぞれの画像検索の検索結果とを関連付けて記憶する記憶手段と、
前記検索結果に含まれる画像のURLに対するクリック数を、前記クエリ及び前記画像ごとに計数する第1クリック数計数手段と、
前記第1クリック数計数手段により計数された前記クリック数の総数を、前記画像ごとに計数する第2クリック数計数手段と、
前記検索結果における前記画像に、前記クリック数の多い順に、ランキングをクリックランキングとして付すクリックランキング付与手段と、
前記画像それぞれのクリックランキングのうち、前記クリック数が最も多いクリックランキングを前記画像それぞれにおける代表クリックランキングとして決定する代表クリックランキング決定手段と、
前記画像それぞれの代表クリックランキングに対応するクエリを、前記画像それぞれの代表クエリとして決定する代表クエリ決定手段と、
前記画像それぞれの前記代表クエリを用いて検索エンジンにより画像検索をすることで、現時点における前記代表クエリにより検索された画像の数及び前記画像それぞれの表示順位を取得する取得手段と、
前記第2クリック数計数手段により計数された前記クリック数、前記代表クリックランキング決定手段により決定された前記代表クリックランキング、前記取得手段により取得された画像の数及び前記表示順位に基づいて、前記画像それぞれの検索スコアを算出する検索スコア算出手段とを備える検索スコア算出装置。 - 前記検索スコア算出手段は、
前記代表クリックランキング決定手段により決定された前記代表クリックランキングに対する前記取得手段により取得された前記表示順位の比である第1の値を算出し、算出された前記第1の値が所定値よりも小さい場合には、前記第1の値を採用し、
前記代表クリックランキング決定手段により決定された前記代表クリックランキングに対する前記取得手段により取得された前記画像の数の比である第2の値を算出し、算出された前記第2の値が前記所定値よりも小さい場合には、前記第2の値を採用し、
採用された前記第1の値、前記第2の値及び前記第2クリック数計数手段により計数された前記クリック数に基づいて、前記画像それぞれの前記検索スコアを算出し、
算出された前記検索スコアを正規化し、正規化された検索スコアを算出する請求項1に記載の検索スコア算出装置。 - 前記検索スコア算出手段は、前記第1の値及び/又は前記第2の値が前記所定値よりも大きい場合には、前記第1の値及び/又は前記第2の値を所定の値とする請求項2に記載の検索スコア算出装置。
- 第1の期間内において、前記記憶手段に記憶される前記複数のクエリのうち、前記あるクエリが前記検索エンジンによる画像の検索に用いられた回数を、前記第1の期間より短い第2の期間ごとに算出し、算出した当該回数それぞれにランキングを付すことで、前記あるクエリについての前記第2の期間ごとのサーチランキングを算出するサーチランキング算出手段と、
前記あるクエリにおける前記サーチランキングと前記あるクエリにおける前記クリックランキングとの順位相関係数を算出する順位相関係数算出手段と、
前記順位相関係数算出手段により算出された前記あるクエリにおける前記順位相関係数が所定の閾値以下であるか否かを判定する判定手段と、
前記判定手段により前記あるクエリにおける前記順位相関係数が前記所定の閾値以下であると判定された場合には、前記あるクエリの前記検索スコアを算出することを決定する決定手段とをさらに備え、
前記検索スコア算出手段は、
前記決定手段により前記あるクエリの前記検索スコアを算出することが決定された場合には、正規化された前記クリック数、前記代表クエリにより検索された画像の数及び前記画像それぞれの表示順位に基づいて、前記画像それぞれについての前記検索スコアを算出し、
算出された前記検索スコアに対して所定の演算を行うことで、当該検索スコアを変更する請求項1に記載の検索スコア算出装置。 - 前記順位相関係数は、スピアマンの順位相関係数を用いる請求項4に記載の検索スコア算出装置。
- 前記第2クリック数計数手段は、前記画像それぞれへリンクする前記URLに対して、任意のユーザ端末が最先にアクセスした場合には、当該クリック数に所定数を乗じた値を、当該クリック数として用いる請求項1から請求項5のいずれか一項に記載の検索スコア算出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010017041A JP5094891B2 (ja) | 2010-01-28 | 2010-01-28 | 検索スコア算出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010017041A JP5094891B2 (ja) | 2010-01-28 | 2010-01-28 | 検索スコア算出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011154638A JP2011154638A (ja) | 2011-08-11 |
JP5094891B2 true JP5094891B2 (ja) | 2012-12-12 |
Family
ID=44540531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010017041A Active JP5094891B2 (ja) | 2010-01-28 | 2010-01-28 | 検索スコア算出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5094891B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5767413B1 (ja) | 2014-03-18 | 2015-08-19 | 楽天株式会社 | 情報処理システム、情報処理方法、および情報処理プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2767190B2 (ja) * | 1993-10-18 | 1998-06-18 | 株式会社エイ・ティ・アール通信システム研究所 | 画像検索装置 |
US7761448B2 (en) * | 2004-09-30 | 2010-07-20 | Microsoft Corporation | System and method for ranking search results using click distance |
JP5153390B2 (ja) * | 2008-03-07 | 2013-02-27 | 富士フイルム株式会社 | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム |
JP4848388B2 (ja) * | 2008-04-09 | 2011-12-28 | ヤフー株式会社 | 検索クエリに関するスコアを算出する方法 |
-
2010
- 2010-01-28 JP JP2010017041A patent/JP5094891B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011154638A (ja) | 2011-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9171078B2 (en) | Automatic recommendation of vertical search engines | |
JP5632124B2 (ja) | 格付け方法、検索結果並び替え方法、格付けシステム及び検索結果並び替えシステム | |
US7783630B1 (en) | Tuning of relevancy ranking for federated search | |
US7962466B2 (en) | Automated tool for human assisted mining and capturing of precise results | |
US9146997B2 (en) | Customizing image search for user attributes | |
JP4633162B2 (ja) | インデックス生成システム、情報検索システム、及びインデックス生成方法 | |
CN108460082B (zh) | 一种推荐方法及装置,电子设备 | |
US9002867B1 (en) | Modifying ranking data based on document changes | |
US20140214711A1 (en) | Intelligent job recruitment system and method | |
EP2945076A1 (en) | Ranking system for search results on network | |
US20110184940A1 (en) | System and method for detecting changes in the relevance of past search results | |
JP2007256992A (ja) | コンテンツ特定方法及び装置 | |
JP5228584B2 (ja) | 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム | |
CA2805964A1 (en) | Information provision device, information provision method, program, and information recording medium | |
US10296924B2 (en) | Document performance indicators based on referral context | |
US9064014B2 (en) | Information provisioning device, information provisioning method, program, and information recording medium | |
US20140059062A1 (en) | Incremental updating of query-to-resource mapping | |
JP5296745B2 (ja) | クエリサジェスチョン提供装置及び方法 | |
US9785676B2 (en) | Systems and methods for providing ordered results for search queries | |
JP5094891B2 (ja) | 検索スコア算出装置 | |
JP5072792B2 (ja) | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ | |
JP2022111544A (ja) | 情報処理システム、及び情報処理方法 | |
CN113204705A (zh) | 文章推荐方法、装置、电子设备和计算机介质 | |
JP5538459B2 (ja) | 情報処理装置及び方法 | |
JP6065060B2 (ja) | 情報処理装置、端末装置、情報処理方法、表示方法、情報処理プログラム、及び表示プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5094891 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |