JP2012003532A - クエリサジェスチョン提供装置及び方法 - Google Patents

クエリサジェスチョン提供装置及び方法 Download PDF

Info

Publication number
JP2012003532A
JP2012003532A JP2010138222A JP2010138222A JP2012003532A JP 2012003532 A JP2012003532 A JP 2012003532A JP 2010138222 A JP2010138222 A JP 2010138222A JP 2010138222 A JP2010138222 A JP 2010138222A JP 2012003532 A JP2012003532 A JP 2012003532A
Authority
JP
Japan
Prior art keywords
search
query
score
search query
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010138222A
Other languages
English (en)
Other versions
JP5296745B2 (ja
Inventor
Yasuaki Yoshida
泰明 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2010138222A priority Critical patent/JP5296745B2/ja
Publication of JP2012003532A publication Critical patent/JP2012003532A/ja
Application granted granted Critical
Publication of JP5296745B2 publication Critical patent/JP5296745B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】絞り込みクエリを含まないメインクエリのみが入力される検索ログも分析対象として関連する情報を抽出し、ユーザ端末から受け付けた検索クエリに対してユーザの意図を適切に反映した情報を自動的に提供すること。
【解決手段】クエリサジェスチョン提供装置(1)は、検索クエリ及び再検索クエリを含む一連の検索操作を示す検索ログを参照して、一連の検索操作に含まれる検索クエリ間の関連度を示すスコアを算出する。このとき、クエリサジェスチョン提供装置(1)は、一連の検索操作のうちの最終クエリと、他の検索クエリと、の間のスコアに高いウェイトを付与してスコアを算出する。そして、クエリサジェスチョン提供装置(1)は、その後、ユーザ端末(30)から検索クエリを受け付けると、当該検索クエリとの間のスコアの高い検索クエリをユーザ端末(30)に提供する。
【選択図】図1

Description

本発明は、クエリサジェスチョン提供装置及び方法に関し、特に、ユーザ端末から検索クエリを受け付けると、当該検索クエリに関連する検索ワードを提案(サジェスチョン)するクエリサジェスチョン提供装置及び方法に関する。
ネットワークを介したWWW(World Wide Web)等のドキュメントシステムにおいては、非常に多くの数のウェブページが公開されている。ユーザは、検索サイトにおいて適宜の検索クエリを入力し、検索結果として表示される複数の候補から検索条件に適合するウェブページのURL(Uniform Resource Locator)を選択し、その選択したURLへのリンクを辿ることで、所望のウェブページを閲覧できる。
ウェブページの検索システムは、日々発展しており、近年では、入力された検索クエリに関連する情報を自動的に提案することが一般的に行われている。自動的に提案される情報は検索の利便性に直接的に影響を与えるものであり、検索サイトの運営者は、入力された検索クエリに関連した情報を適切に抽出する方法の発見を望んでいる。
検索クエリに関連する情報を抽出する方法として、例えば、非特許文献1には、検索サイトのクエリログ(検索ログ)を利用し、共通の上位語を持つ語を抽出する方法が開示されている。
山口雅史、大島裕明、小山聡、田中克己、著「サーチエンジンのクエリログを利用した同位語の発見」、[online]、[平成22年5月27日検索]、<http://www.dbsj.org/Japanese/DBSJLetters/vol5/no2/yamaguchi.pdf>
しかしながら、非特許文献1に開示された方法では、メインクエリと共に絞り込み用のクエリが入力される絞り込み検索時に使用される当該絞り込みクエリと関係する情報を抽出するに過ぎず、抽出される情報の幅が狭く著しく偏った情報となってしまう。また、非特許文献1に開示された方法は、絞り込み検索されている検索クエリからしか共通の上位語を持つ語を抽出することができない。ところで、検索サイトにおける検索は、このような絞り込みクエリを含まない単独のクエリに基づいて行われることのほうがむしろ多く、非特許文献1に開示された方法は、このような単独のメインクエリのみが入力される検索ログに基づいて、関連する情報を抽出することはできない。
本発明はこのような問題に鑑みてなされたものであり、絞り込みクエリを含まないメインクエリのみが入力される検索ログも分析対象として関連する情報を抽出し、ユーザ端末から受け付けた検索クエリに対してユーザの意図を適切に反映した情報を自動的に提供可能なクエリサジェスチョン提供装置及びその方法を提供する。
(1) ユーザ端末から受け付けた検索クエリに対応するサジェスチョンを提供するクエリサジェスチョン提供装置であって、ユーザ端末から受け付けた検索クエリ及び当該検索クエリに基づく検索の後に引き続き受け付けた検索クエリを再検索クエリとして関連付けて、一連の検索操作を示す所定の識別情報と共に検索ログとして記憶する検索ログDBと、前記所定の識別情報により特定される前記一連の検索操作において最後に受け付けた検索クエリを最終クエリとして抽出する最終クエリ抽出手段と、前記検索ログDBに記憶された前記検索ログを参照して、前記所定の識別情報により特定される前記一連の検索操作に含まれる検索クエリ間の関連度を示すスコアを算出するスコア算出手段であって、前記最終クエリ抽出手段により抽出された前記最終クエリと、当該最終クエリが含まれる一連の検索操作に含まれる検索クエリと、の間のスコアに高いウェイトを付与してスコアを算出するスコア算出手段と、ユーザ端末から検索クエリを受け付けたことに応じて、当該検索クエリとの間のスコアの高い検索クエリを優先して前記ユーザ端末に提供するサジェスチョン送信手段と、を備えるクエリサジェスチョン提供装置。
(1)に記載のクエリサジェスチョン提供装置によれば、ユーザの行った一連の検索操作に基づいてスコアを算出し、ユーザ端末から受け付けた検索クエリとの間の当該スコアの高い検索クエリを優先してユーザ端末に提供する。一連の検索操作において連続して入力された検索クエリは、ユーザによる意図を反映して関連している可能性が高く、(1)のクエリサジェスチョン提供装置によれば、このようなユーザの意図を的確に捉えた提案をユーザに対して行うことができる。しかも、クエリサジェスチョン提供装置は、絞り込みクエリを含まないメインクエリのみが入力される検索ログも分析対象として、当該提案する検索クエリを抽出することができる。
また、(1)のクエリサジェスチョン提供装置では、一連の検索操作において、最終クエリ及び当該最終クエリが含まれる一連の検索操作における検索クエリとの間の関係に重みをおいてスコアを算出する。ここで、最終クエリは、一連の検索操作においてユーザが最終的に入力した検索クエリであり、その検索結果に基づいて、ユーザの一連の検索操作が終わった、言い換えると所望の情報に到達した可能性が高いことを示す検索クエリである。そのため、最終クエリとの間のスコアに重みをおくことで、ユーザの検索したい情報を最も反映したスコアを算出することができ、結果として、ユーザの意図を的確に捉えた提案をユーザに対して行うことができる。
(2) 前記検索ログDBは、前記一連の検索操作に含まれる検索クエリ又は再検索クエリをそれぞれ受け付けた時間を示すタイムスタンプを、前記所定の識別情報に関連付けて、前記検索ログとして更に記憶し、前記最終クエリ抽出手段は、前記タイムスタンプに基づいて前記最終クエリを抽出する、(1)に記載のクエリサジェスチョン提供装置。
(2)のクエリサジェスチョン提供装置によれば、最終クエリ抽出手段は、タイムスタンプに基づいて容易に最終クエリを抽出することができる。
(3) 同一のキーワードについて、所定期間内に検索クエリ又は再検索クエリとして受け付けた総検索数に基づいて、前記スコア算出手段により算出されたスコアを補正する補正手段を備える(1)又は(2)に記載のクエリサジェスチョン提供装置。
著名なウェブページを検索するための検索クエリは、一連の検索操作の流れに関係なく入力されることがあり、本来関連性が低いにも関わらず、高いスコアが算出されることがある。(3)のクエリサジェスチョン提供装置は、補正手段が総検索数に基づいてスコアを補正するため、このような著名なウェブページの影響を抑制して関連性をより正確に示すスコアを算出することができる。
(4) ユーザ端末とネットワークを介して接続されたコンピュータが、前記ユーザ端末から受け付けた検索クエリに対応するサジェスチョンを提供する方法であって、前記コンピュータが実行する、ユーザ端末から受け付けた検索クエリ及び当該検索クエリに基づく検索の後に引き続き受け付けた検索クエリを再検索クエリとして関連付けて、一連の検索操作を示す所定の識別情報と共に検索ログとして記憶する検索ログDBに記憶するステップと、前記所定の識別情報により特定される前記一連の検索操作において最後に受け付けた検索クエリを最終クエリとして抽出するステップと、前記検索ログDBに記憶された前記検索ログを参照して、前記所定の識別情報により特定される前記一連の検索操作に含まれる検索クエリ間の関連度を示すスコアを算出するステップであって、前記検索クエリを最終クエリとして抽出するステップにより抽出された前記最終クエリと、当該最終クエリが含まれる一連の検索操作に含まれる検索クエリと、の間のスコアに高いウェイトを付与してスコアを算出するステップと、ユーザ端末から検索クエリを受け付けたことに応じて、当該検索クエリとの間のスコアの高い検索クエリを優先して前記ユーザ端末に提供するステップと、を含む方法。
(4)の方法によれば、(1)のクエリサジェスチョン提供装置と同じ効果を奏する。
本発明によれば、ユーザ端末から受け付けた検索クエリに対してユーザの意図を適切に反映した情報を自動的に提供できる。
本発明のクエリサジェスチョン提供装置の機能構成を示すブロック図である。 検索クエリと再検索クエリとの関係を示す図である。 本発明の検索ログDBを示す図である。 本発明のスコア算出手段によるスコアの算出例を示す図である。 本発明のスコアDBを示す図である。 本発明のスコア算出処理を示すフローチャートである。 本発明のサジェスト処理を示すフローチャートである。 クエリサジェスチョン提供画面を示す図である。 別実施形態のクエリサジェスチョン提供装置の機能構成を示すブロック図である。 スコア算出の変形例を示す図である。
以下、本発明の実施形態について図面を参照して説明する。
[クエリサジェスチョン提供装置の構成]
図1は、クエリサジェスチョン提供装置1の機能構成を示すブロック図である。クエリサジェスチョン提供装置1は、ネットワーク50を介してユーザ端末30と通信可能に接続され、制御部10と記憶部20とを含んで構成される。
制御部10は、ユーザ端末30から受け付けた検索クエリのログ(検索ログ)から、各検索クエリ間の関連度を示すスコアを算出するスコア算出部11と、ユーザ端末30から受け付けた検索クエリに対して、スコア算出部11により算出されたスコアの高い検索クエリを提案(サジェスチョン)するサジェスチョン提供部12と、を含む。
初めに、スコア算出部11及び記憶部20について説明する。スコア算出部11は、検索ログ受信手段111と、最終クエリ抽出手段112と、スコア算出手段113と、を含む。また、記憶部20は、検索ログDB21と、スコアDB22と、を含む。
検索ログ受信手段111は、ネットワーク50を介して接続された複数のユーザ端末30から検索ログを受信する。検索ログとは、ユーザ端末30による一連の検索操作の記録(ログ)であり、ユーザ端末30から受け付けた検索クエリ及び当該検索クエリに基づく検索の後に引き続き受け付けた再検索クエリを含む。ここで、検索クエリと再検索クエリとの関係について、図2を参照して具体的に説明する。
図2(1)に示す検索画面1において、検索入力欄201に「単語A」が入力され、「単語A」を検索クエリとする検索が行われると、図2(2)に示す検索画面2が表示される。図2(2)では、検索入力欄202に加え、検索結果欄211が表示され、検索結果欄211には、「単語A」の検索結果が表示される。このとき、検索結果欄211の結果内容に満足しないユーザは、引き続き検索を行うことがある。図2(2)では、検索入力欄202に、「単語A」が自動的に挿入されている場合には「単語A」を削除した後、「単語B」が入力され、「単語B」を検索クエリとする検索が引き続き行われている。本実施形態では、このような検索クエリ「単語A」と、検索クエリ「単語A」に基づく検索結果が表示された画面において再度入力された検索クエリ「単語B」とを、検索クエリ「単語A」及び再検索クエリ「単語B」としている。より具体的には、例えば、検索画面1において、検索入力欄201に「サッカー」と入力され、「サッカー」を検索クエリとする検索が行われ、この検索結果画面において、検索入力欄201に入力されている「サッカー」が削除された後に「ワールドカップ」が入力され、「ワールドカップ」を検索クエリとする検索が行われる場合を考えると、検索クエリは「サッカー」となり、再検索クエリは「ワールドカップ」となる。
なお、「単語A」を検索クエリとする検索画面2の検索結果欄211に表示されている各Webページを参照した後に検索画面2に戻り検索クエリ「単語B」が入力された場合であっても、「単語A」と「単語B」の関係は同じように扱われる。
更に、図2(2)において「単語B」を検索クエリとする検索が行われると、「単語B」の検索結果を表示する検索結果欄212と、検索入力欄203とを含む検索画面3(図2(3))が表示される。このとき、検索入力欄203に「単語B」が削除され「単語C」が入力され、検索が行われた場合には、検索クエリ「単語B」、再検索クエリ「単語C」となる。
図1に戻り、検索ログ受信手段111が受信した検索ログは、所定の識別情報(セッションID)と関連付けて検索ログDB21に記憶される。
検索ログDB21は、検索クエリ及び再検索クエリを関連付けて、一連の検索操作を示すセッションIDと共に検索ログとして記憶する。具体的には、図3に示すように、検索ログDB21には、セッションIDに対応付けて、検索クエリ、再検索クエリ及び検索時刻が少なくとも記憶される。ここで、セッションIDは、検索ログを送信したユーザ端末30を識別するための情報であり、セッションIDに基づいてユーザ端末30による一連の検索操作が特定される。図3を参照して、例えば、検索ログA1,A2,A3は、セッションID「A001」に対応する検索ログであり、同一のユーザ端末30による一連の検索操作であると特定される。
図1に戻り、最終クエリ抽出手段112は、検索ログDB21を参照して最終クエリを抽出する。ここで、最終クエリとは、セッションIDにより特定される一連の検索操作において最後に受け付けた検索クエリを示し、検索ログDB21の検索時刻から特定される。例えば、図3を参照して、一連の検索操作である検索ログA1,A2,A3では、検索ログA3の検索時刻が最も遅い。このような場合、最終クエリ抽出手段112は、検索ログA3の再検索ログ「単語D」をセッションID「A001」により特定される一連の検索操作の最終クエリであると特定する。このような最終クエリは、一連の検索操作のうちユーザが最終的に入力した検索クエリであり、ユーザの一連の検索操作が終わった、言い換えると所望の情報に到達したことを示す検索クエリであるといえる。なお、最終クエリを抽出する一連の検索操作を特定する場合に、検索時刻が一定の範囲内のものに限定して特定してもよい。例えば、同一のセッションIDであっても検索時刻が一時間以内の検索ログのみを一連の検索操作であると特定してもよい。本実施形態では、検索クエリ間の関連度を示すスコアを算出する際に、最終クエリとの間のスコア算出に高いウェイトを付与することとしている。
スコア算出手段113は、検索ログDB21に記憶された検索ログから、セッションIDにより特定される一連の検索操作に含まれる検索クエリと再検索クエリとに基づいて、検索クエリ間の関連度を示すスコアを算出する。特に、スコア算出手段113は、最終クエリと、この最終クエリが含まれる一連の検索操作に含まれる検索クエリとの間のスコアに高いウェイトを付与してスコアを算出する。スコアの算出について、図4を参照して説明する。
図4では、セッションID「A001」により特定される一連の検索操作である検索ログA1,A2,A3から各検索クエリ間のスコアを算出している。本実施形態では、検索ログA1,A2,A3に含まれる検索クエリ「単語A」「単語B」「単語C」「単語D」の間のスコアを算出している。具体的には、「単語A−単語B」、「単語A−単語C」、「単語A−単語D」、「単語B−単語C」、「単語B−単語D」及び「単語C−単語D」のスコアを算出している。このとき、本実施形態では、最終検索クエリ「単語D」との間のスコアに高いウェイトを付与してスコアを算出する。一例としては、「単語A−単語B」、「単語A−単語C」及び「単語B−単語C」のスコアを「1pt」とし、最終クエリ「単語D」を含む「単語A−単語D」、「単語B−単語D」及び「単語C−単語D」のスコアを「5pt」とする。
スコア算出手段113は、セッションID毎にスコアを算出すると、算出したスコアの和(他の全てのセッションIDとの和)を算出する。具体的には、セッションID「X010」では、「単語A−単語C」のスコアとして「1pt」が算出される(図3の検索ログX1参照)。このとき、スコア算出手段113は、「単語A−単語C」のスコアとして、セッションID「A001」の「1pt」と、セッションID「X010」の「1pt」との和をとり「2pt」と算出する。スコア算出手段113が算出した、検索クエリ間のスコアの和は、スコアDB22に記憶される。
なお、本発明は、最終クエリと、この最終クエリが含まれる一連の検索操作に含まれる検索クエリとの間のスコアに高いウェイトを付与することに特徴を有するものであり、他のスコアの算出については設計者が任意に変更可能である。
例えば、セッションID毎のスコアの和の算出は、検索クエリと再検索クエリとの間の順序に従うこととしてもよく、無視することとしてもよい。具体的には、「検索クエリ「単語A」−再検索クエリ「単語B」」のスコア「1pt」と、「検索クエリ「単語B」−再検索クエリ「単語A」」のスコア「1pt」とは、異なるものであるとして和を算出しないこととしてもよく(順序に従う)、同じものであるとして和を算出することとしてもよい(順序を無視する)。
また、本実施形態では、最終クエリにのみ高いウェイトを付与することとしているが、これに限られるものではない。例えば、検索クエリと再検索クエリとの関係にある検索クエリ間のスコアにウェイトを付与することとしてもよい。具体的には、セッションID「A001」を参照して、検索クエリと再検索クエリとの関係にある「単語A−単語B」のスコアを「2pt」とし、検索クエリと再検索クエリとの関係にない「単語A−単語C」のスコアを「1pt」としてもよい。
図1に戻り、スコアDB22は、スコア算出手段113により算出された検索クエリ間のスコアを記憶する。具体的には、図5に示すように、スコアDB22は、検索クエリに対応付けて、他の検索クエリとの間のスコアを記憶する。
本実施形態では、ユーザ端末30から検索クエリの入力を受け付けると、当該検索クエリとの間のスコアが高い検索クエリから順にユーザ端末30に提案(サジェスチョン)される。本実施形態では、このように提案される検索クエリを「同位語」という。すなわち、「同位語」とは、一連の検索操作において連続して入力される可能性の高い検索クエリの組合せを意味し、必ずしも同一の意味を有する単語、同じ属性を有する単語のみを意味するものではない。ここで、「連続して入力される可能性」は、スコアにより特定され、スコアの高い順に所定数(任意に設計可能)の検索クエリが同位語となる。例えば、図5を参照して、「単語A」に対しては、スコアの高い「単語D」や「単語B」等が同位語となる。
続いて、ユーザ端末30から受け付けた検索クエリの同位語を提案するサジェスチョン提供部12について説明する。サジェスチョン提供部12は、クエリ受信手段121と、サジェスチョン抽出手段122と、サジェスチョン送信手段123と、を含む。
クエリ受信手段121は、ユーザにより入力された検索クエリを、ネットワーク50を介してユーザ端末30から受信する。
サジェスチョン抽出手段122は、クエリ受信手段121が受信した検索クエリの同位語をスコアDB22を参照して抽出する。具体的には、ユーザ端末30から検索クエリとして「単語A」を受信した場合には、サジェスチョン抽出手段122は、「単語A」に対しては、スコアの高い「単語D」や「単語B」等を同位語として抽出する。
サジェスチョン送信手段123は、サジェスチョン抽出手段122が抽出した同位語をネットワーク50を介してユーザ端末30に送信する。
[クエリサジェスチョン提供装置の構成]
以上説明したクエリサジェスチョン提供装置1のハードウェアは、一般的なコンピュータによって構成することができる。一般的なコンピュータは、例えば、制御部10として、中央処理装置(CPU)を備える他、記憶部20として、メモリ(RAM、ROM)、ハードディスク(HDD)及び光ディスク(CD、DVD等)を、ネットワーク通信装置として、各種有線及び無線LAN装置を、表示装置として、例えば、液晶ディスプレイ、プラズマディスプレイ等の各種ディスプレイを、入力装置として、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボール等)を適宜備え、これらは、バスラインにより接続されている。このような一般的なコンピュータにおいて、CPUは、クエリサジェスチョン提供装置1を統括的に制御し、各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
[クエリサジェスチョン提供装置の処理]
続いて、図6及び図7を参照して、クエリサジェスチョン提供装置1の処理の流れについて説明する。
[スコア算出処理]
初めに、図6を参照して、スコア算出処理について説明する。図6は、クエリサジェスチョン提供装置1により行われるスコア算出処理の流れを示すフローチャートである。
S1:制御部10(検索ログ受信手段111)は、ネットワーク50を介して接続された複数のユーザ端末30から検索ログを受信する。検索ログ受信手段111が受信した検索ログは、セッションIDと対応付けられて検索ログDB21に記憶される。
S2〜S4:制御部10(最終クエリ抽出手段112)は、スコア算出時期であるか否かを判別し(S2)、スコア算出時期である場合には、検索ログDB21から検索ログを取得し(S3)、セッションIDにより特定される一連の検索操作に含まれる検索クエリから最終クエリを抽出する(S4)。スコア算出時期としては、1日毎や1週間毎等の所定の周期を用いることができ、設計者が任意に設計可能である。
S5,S6:制御部10(スコア算出手段113)は、検索ログDB21に記憶された検索ログから、セッションIDにより特定される一連の検索操作に含まれる検索クエリと再検索クエリとに基づいて、検索クエリ間の関連度を示すスコアを算出する(S5)。このとき、スコア算出手段113は、最終クエリと、この最終クエリが含まれる一連の検索操作に含まれる他の検索クエリとの間のスコアに高いウェイトを付与してスコアを算出する。その後、制御部10は、算出されたスコアをスコアDB22に記憶し(S6)、スコア算出処理を終了する。
[サジェスト処理]
続いて、図7を参照して、サジェスト処理について説明する。図7は、クエリサジェスチョン提供装置1により行われるサジェスト処理の流れを示すフローチャートである。
S11:制御部10(クエリ受信手段121)は、ユーザにより入力された検索クエリを、ネットワーク50を介してユーザ端末30から受信する。
S12:制御部10(サジェスチョン抽出手段122)は、スコアDB22を参照して、同位語を抽出する。すなわち、サジェスチョン抽出手段122は、受信した検索クエリとの間のスコアが高い検索クエリをスコアDB22から所定数抽出する。
S13:制御部10(サジェスチョン送信手段123)は、抽出した同位語をネットワーク50を介してユーザ端末30に送信する。これにより、ユーザ端末30には、ユーザが入力した検索クエリが同位語として提供される。
ユーザ端末30への同位語の提供について、図8を参照して具体的に説明する。検索入力欄204に検索クエリ「単語A」が入力されると、検索クエリ「単語A」との間のスコアの高い検索クエリ「単語D」、「単語B」等が同位語として抽出され、同位語表示欄221に表示される。ユーザは、同位語表示欄221に表示された同位語を選択することで、一連の検索操作において連続して入力される可能性の高い検索クエリを容易に選択することができる。このとき、本発明によれば、検索サイトにおける検索の大部分を占める単独の検索クエリによる検索から同位語を抽出することができるため、ユーザの意図を的確に捉えた検索クエリを自動的に提供できる。
具体的には、同位語の抽出には検索クエリ間のスコアが用いられるところ、このスコアは、ユーザの行った一連の検索操作に基づいて算出される。一連の検索操作において連続して入力された検索クエリは、ユーザによる意図を反映して関連している可能性が高く、このように算出されるスコアを用いて同位語を抽出することで、一連の検索操作において連続して入力される可能性の高い同位語(ユーザの意図を的確に捉えた同位語)を提案することができる。
特に、スコアは、一連の検索操作における最終クエリ(ユーザが最終的に入力した検索クエリであり、その検索結果に基づいて、ユーザの一連の検索操作が終わった、言い換えると所望の情報に到達したことを示す検索クエリ)との間のスコアに重みをおいて算出されるため、ユーザの検索したい情報を最も反映したスコアを算出することができ、結果として、ユーザの意図を的確に捉えた同位語をユーザに対して提案できる。
(変形形態)
著名なウェブページを検索するための検索クエリは、一連の検索操作の流れに関係なく入力されることがある。例えば、一連の検索操作を行っている中で、著名な動画配信サイトや人名等を検索するための検索クエリ(以下、「著名な検索クエリ」とする)が何の脈絡もなく入力されることがある。このような著名なウェブページを検索するための検索クエリは、一連の検索操作の流れに関係なく多くのユーザが入力する結果、本来関連性が低いはずの検索クエリとの間にも高いスコアが算出されてしまう。そのため、スコア算出手段113が算出したスコアを補正する補正手段を設けることとしてもよい。
図9を参照して、変形形態に係るクエリサジェスチョン提供装置1Aについて、説明する。なお、図9において、上記実施形態のクエリサジェスチョン提供装置1と同様の構成については、詳細な説明を省略する。
クエリサジェスチョン提供装置1Aの制御部10Aのスコア算出部11Aは、検索ログ受信手段111、最終クエリ抽出手段112及びスコア算出手段113に加え、補正手段114Aを含む。
補正手段114Aは、スコア算出手段113が算出したスコアを、各検索クエリの検索総数に基づいて補正する。総検索数に基づく補正は、設計者が任意に設計可能であるが、一例としては、以下の式を用いることができる。
Figure 2012003532
ここで、総検索数は、所定の期間に検索された検索クエリ(検索クエリか再検索クエリかは問わない)の総数を意味する。スコア算出手段113が算出したスコア(図5)に上記式を適用し補正した補正スコアを図10に示す。図10では、「単語D」は著名な検索クエリであり、「単語A」との実際の関連性が低い検索クエリであり、「単語C」は著名な検索クエリではないが、「単語A」との実際の関連性が高い検索クエリである。「単語D」は、著名な検索クエリであり総検索数が多いため「単語A」と検索クエリ・再検索クエリの関係になることも多く、結果としてスコア算出手段113により高いスコアが算出される。しかしながら、「単語D」は、「単語A」と検索クエリ・再検索クエリの関係にならないことの方が多く、補正手段114Aによる補正を行うと低いスコアに補正される。一方、「単語C」は、著名な検索クエリでないため総検索数は少ないが、「単語A」との関連性が高く検索クエリとして入力された場合には多くの場合で「単語A」と検索クエリ・再検索クエリの関係になる。そのため、スコア算出手段113では低いスコアが算出されるが、補正手段114Aによる補正を行うと高いスコアに補正される。このように、スコア算出手段113で算出されたスコアを総検索数により補正することで、著名性の影響を軽減したスコアを算出することができる。これにより、一連の検索操作において連続して入力される可能性の高い同位語を、的確にユーザ端末30に提供することができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
1 クエリサジェスチョン提供装置
10 制御部
11 スコア算出部
111 検索ログ受信手段
112 最終クエリ抽出手段
113 スコア算出手段
12 サジェスチョン提供部
121 クエリ受信手段121
122 サジェスチョン抽出手段
123 サジェスチョン送信手段
20 記憶部
21 検索ログDB
22 スコアDB

Claims (4)

  1. ユーザ端末から受け付けた検索クエリに対応するサジェスチョンを提供するクエリサジェスチョン提供装置であって、
    ユーザ端末から受け付けた検索クエリ及び当該検索クエリに基づく検索の後に引き続き受け付けた検索クエリを再検索クエリとして関連付けて、一連の検索操作を示す所定の識別情報と共に検索ログとして記憶する検索ログDBと、
    前記所定の識別情報により特定される前記一連の検索操作において最後に受け付けたクエリを最終クエリとして抽出する最終クエリ抽出手段と、
    前記検索ログDBに記憶された前記検索ログを参照して、前記所定の識別情報により特定される前記一連の検索操作に含まれる検索クエリ間の関連度を示すスコアを算出するスコア算出手段であって、前記最終クエリ抽出手段により抽出された前記最終クエリと、当該最終クエリが含まれる一連の検索操作に含まれる検索クエリと、の間のスコアに高いウェイトを付与してスコアを算出するスコア算出手段と、
    ユーザ端末から検索クエリを受け付けたことに応じて、当該検索クエリとの間のスコアの高い検索クエリを優先して前記ユーザ端末に提供するサジェスチョン送信手段と、
    を備えるクエリサジェスチョン提供装置。
  2. 前記検索ログDBは、前記一連の検索操作に含まれる検索クエリ又は再検索クエリをそれぞれ受け付けた時間を示すタイムスタンプを、前記所定の識別情報に関連付けて、前記検索ログとして更に記憶し、
    前記最終クエリ抽出手段は、前記タイムスタンプに基づいて前記最終クエリを抽出する、
    請求項1に記載のクエリサジェスチョン提供装置。
  3. 同一のキーワードについて、所定期間内に検索クエリ又は再検索クエリとして受け付けた総検索数に基づいて、前記スコア算出手段により算出されたスコアを補正する補正手段を備える請求項1又は2に記載のクエリサジェスチョン提供装置。
  4. ユーザ端末とネットワークを介して接続されたコンピュータが、前記ユーザ端末から受け付けた検索クエリに対応するサジェスチョンを提供する方法であって、
    前記コンピュータが実行する、
    ユーザ端末から受け付けた検索クエリ及び当該検索クエリに基づく検索の後に引き続き受け付けた検索クエリを再検索クエリとして関連付けて、一連の検索操作を示す所定の識別情報と共に検索ログとして記憶する検索ログDBに記憶するステップと、
    前記所定の識別情報により特定される前記一連の検索操作において最後に受け付けた検索クエリを最終クエリとして抽出するステップと、
    前記検索ログDBに記憶された前記検索ログを参照して、前記所定の識別情報により特定される前記一連の検索操作に含まれる検索クエリ間の関連度を示すスコアを算出するステップであって、前記検索クエリを最終クエリとして抽出するステップにより抽出された前記最終クエリと、当該最終クエリが含まれる一連の検索操作に含まれる検索クエリと、の間のスコアに高いウェイトを付与してスコアを算出するステップと、
    ユーザ端末から検索クエリを受け付けたことに応じて、当該検索クエリとの間のスコアの高い検索クエリを優先して前記ユーザ端末に提供するステップと、
    を含む方法。
JP2010138222A 2010-06-17 2010-06-17 クエリサジェスチョン提供装置及び方法 Active JP5296745B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010138222A JP5296745B2 (ja) 2010-06-17 2010-06-17 クエリサジェスチョン提供装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010138222A JP5296745B2 (ja) 2010-06-17 2010-06-17 クエリサジェスチョン提供装置及び方法

Publications (2)

Publication Number Publication Date
JP2012003532A true JP2012003532A (ja) 2012-01-05
JP5296745B2 JP5296745B2 (ja) 2013-09-25

Family

ID=45535431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010138222A Active JP5296745B2 (ja) 2010-06-17 2010-06-17 クエリサジェスチョン提供装置及び方法

Country Status (1)

Country Link
JP (1) JP5296745B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10546336B2 (en) 2014-03-07 2020-01-28 Rakuten, Inc. Search device, search method, program, and storage medium
JP2020046942A (ja) * 2018-09-19 2020-03-26 Zホールディングス株式会社 情報処理装置、情報処理方法、およびプログラム
JP2020047126A (ja) * 2018-09-20 2020-03-26 Zホールディングス株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2020046940A (ja) * 2018-09-19 2020-03-26 Zホールディングス株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2020129193A (ja) * 2019-02-07 2020-08-27 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11110404A (ja) * 1997-10-01 1999-04-23 Matsushita Electric Ind Co Ltd データ検索支援装置、データ検索支援方法及びその方法を記録した記録媒体
WO2008114433A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited 情報検索システム、情報検索プログラムおよび情報検索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11110404A (ja) * 1997-10-01 1999-04-23 Matsushita Electric Ind Co Ltd データ検索支援装置、データ検索支援方法及びその方法を記録した記録媒体
WO2008114433A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited 情報検索システム、情報検索プログラムおよび情報検索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200401365010; 川前徳章 他: 'ユーザの検索行動に基づいたキーワード提示による検索支援' ヒューマンインタフェース学会研究報告会 第4巻 第1号, 20020124, pp.75-80, ヒューマンインタフェース学会 *
JPN6012045740; 川前徳章 他: 'ユーザの検索行動に基づいたキーワード提示による検索支援' ヒューマンインタフェース学会研究報告会 第4巻 第1号, 20020124, pp.75-80, ヒューマンインタフェース学会 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10546336B2 (en) 2014-03-07 2020-01-28 Rakuten, Inc. Search device, search method, program, and storage medium
JP2020046942A (ja) * 2018-09-19 2020-03-26 Zホールディングス株式会社 情報処理装置、情報処理方法、およびプログラム
JP2020046940A (ja) * 2018-09-19 2020-03-26 Zホールディングス株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP7088795B2 (ja) 2018-09-19 2022-06-21 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2020047126A (ja) * 2018-09-20 2020-03-26 Zホールディングス株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2020129193A (ja) * 2019-02-07 2020-08-27 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP7044729B2 (ja) 2019-02-07 2022-03-30 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JP5296745B2 (ja) 2013-09-25

Similar Documents

Publication Publication Date Title
US8392394B1 (en) Merging search results
US20220365966A1 (en) System and method for providing content to users based on interactions by similar other users
US20130282709A1 (en) Method and system for query suggestion
US9679079B2 (en) Search query suggestions based in part on a prior search and searches based on such suggestions
US10496717B2 (en) Storing predicted search results on a user device based on software application use
US8484190B1 (en) Prompt for query clarification
US20150058712A1 (en) Method for assisting website design using keywords
JP2011192102A (ja) サマリ作成装置、サマリ作成方法及びプログラム
US20140330770A1 (en) Context-aware implicit and explicit search
JP5269938B2 (ja) 急上昇ワード関連付け装置及び方法
JP5296745B2 (ja) クエリサジェスチョン提供装置及び方法
JP5118431B2 (ja) 情報提供システム、情報提供装置、携帯端末、情報提供方法及びプログラム
JP2003091552A (ja) 検索要求情報抽出方法及びその実施システム並びにその処理プログラム
US9690858B1 (en) Predicting categorized completions of a partial search term
WO2014059851A1 (zh) 一种搜索服务器及搜索方法
US10262064B2 (en) Information processing apparatus, information processing method, information processing program, recording medium having stored therein information processing program
JP5208229B2 (ja) 検索サジェスト装置及び方法
JP2017134870A (ja) 検索結果内に添付された情報データベースに基づいた検索リスト及び検索語順位の提供方法及びシステム
JP2011191980A (ja) レシピ提供システム及び方法
JP5072792B2 (ja) 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ
JP5813560B2 (ja) 検索条件提示装置、方法、及びプログラム
US20160078105A1 (en) Information providing system, information providing server and information providing method
JP5717099B2 (ja) 分散コンシェルジュシステム、分散コンシェルジュシステムの制御方法、ソーシャルコンシェルジュ装置、及びソーシャルコンシェルジュ装置の制御プログラム
US9116996B1 (en) Reverse question answering
JP5331166B2 (ja) 検索サーバ及び方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120904

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20121005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130613

R150 Certificate of patent or registration of utility model

Ref document number: 5296745

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250