JP2012059182A - 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム - Google Patents

検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム Download PDF

Info

Publication number
JP2012059182A
JP2012059182A JP2010204091A JP2010204091A JP2012059182A JP 2012059182 A JP2012059182 A JP 2012059182A JP 2010204091 A JP2010204091 A JP 2010204091A JP 2010204091 A JP2010204091 A JP 2010204091A JP 2012059182 A JP2012059182 A JP 2012059182A
Authority
JP
Japan
Prior art keywords
user
query
program
search
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010204091A
Other languages
English (en)
Other versions
JP5341847B2 (ja
Inventor
Naoki Fujita
尚樹 藤田
Shinji Miyahara
伸二 宮原
Norifumi Katabuchi
典史 片渕
Ryoji Kataoka
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010204091A priority Critical patent/JP5341847B2/ja
Publication of JP2012059182A publication Critical patent/JP2012059182A/ja
Application granted granted Critical
Publication of JP5341847B2 publication Critical patent/JP5341847B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】ユーザの興味に応じた流行の検索クエリを推薦し、ユーザの情報検索を支援する。
【解決手段】情報収集処理は、テレビ番組の情報に基づき番組の固有表現を収集し、番組の固有表現を保存するテーブル12を作成する。クエリログ分析処理は、検索エンジン3のDB4のクエリログをテーブル12のデータに限定し、出現頻度が急上昇している急上昇ワードのリストL2と、ユーザ毎に分類したユーザ別検索ワードを保存するテーブル17とを作成する。ユーザ興味分析処理は、テーブル12、17に基づきユーザ別番組興味度を保持するテーブル21と、テーブル12に応じたリストL2の情報を保存するテーブル22と、テーブル21、22に基づき急上昇ワードに対する各ユーザの興味度を保持するテーブル23を作成する。推薦クエリ出力処理は、テーブル23の興味度順に急上昇ワードを、ユーザに検索クエリとして推薦する。
【選択図】図1

Description

本発明は、ユーザが検索クエリを検索エンジンに投入して必要な情報を検索するにあたってユーザに検索クエリの推薦を行う技術に関する。
現在、ブロードバンドの普及によりインターネットの利用が拡大し、インターネット上の情報は急激に増大していることから、検索エンジンの重要性が高まっている。この検索エンジンは、ユーザが送信した検索クエリに対応したインターネット上の文書のリストをもってユーザに応答し、ユーザはインターネット上の膨大な情報から求める情報を得るために検索エンジンを利用している。
ユーザは検索クエリとして、自分が知りたい「人、モノ、出来事」について入力を行うことが多く、その場合は「人、モノ、出来事」の名前は事前に知っている必要がある。検索クエリのログの中には、新たな飲食店や商品名、略語などの新語や話題語が多数含まれており、ユーザはそのような新語や話題語を見たり、聞いたりした際に、検索エンジンで検索を行う傾向がある。この傾向を用いて、非特許文献1.2に示すように、検索エンジンは検索回数が急上昇した流行の検索クエリを提示してユーザに検索を促している。
また、ユーザの検索履歴(クエリログ)を利用したパーソナライズの技術も多数存在している。例えば特許文献1では、クエリログからユーザの嗜好を抽出し、それに基づいた検索結果を表示する方式を提案している。
特開2010−97461
"キーワードランキング"、[online]、goo、[平成22年8月26日検索]、インターネット<URL:http://ranking.goo.ne.jp/keyword/> "急上昇ワード"、「online」、Google、「平成22年8月26日検索」、インターネット<URL:http://www.google.co.jp/m/trends>
しかしながら、非特許文献1.2では、検索回数が急上昇した流行の検索クエリを推薦クエリとして提示する際にユーザの興味に応じたパーソナライズができないため、ユーザの興味のないクエリも提示されてしまう。
また、流行の検索クエリの中でも特に新語はどの分野の語句かを分類することが困難なため、特許文献1のようにユーザの興味が分かっている場合でも、そのユーザが興味を持っているか適切な判断が困難なことが少なくない。
本発明は、上述のような従来技術の問題点を解決するためになされたものであり、ユーザの興味に応じた流行の検索クエリを提示し、ユーザの情報検索を支援することを解決課題とする。
そこで、本発明は、テレビの番組情報から番組の固有表現を抽出し、検索ログ中のクエリ群を該固有表現に限定して出現頻度の高い急上昇ワード(流行語)とユーザ別検索ワードとを求める。つぎにユーザ別検索ワードと番組の固有表現とからユーザ別番組興味度を求める。その後に番組の固有表現に応じた急上昇ワードとユーザ別番組興味度とから該急上昇ワードに対するユーザの興味度を算出し、算出された興味度の高いワードを検索クエリの推薦クエリとしてユーザに提示する。
すなわち、本発明の検索クエリ推薦方法は、クエリログ分析手段が、テレビの番組情報から抽出された各番組の固有表現に基づき検索エンジンのクエリログを限定して分析対象とし、該分析対象をユーザ毎に分類したユーザ別検索ワードと、該分析対象中で出現頻度の上昇している急上昇ワードを求めるクエリログ分析ステップと、ユーザ興味分析手段が、前記固有表現およびユーザ別検索ワードに基づきユーザ別の番組興味度を求め、ユーザ別の番組興味度と前記固有表現に応じた急上昇ワードとから該急上昇ワードに対するユーザの興味度を算出するユーザ興味分析ステップと、推薦クエリ出力手段が、前記算出されたユーザの興味度順に前記固有表現に応じた任意数の急上昇ワードをユーザに検索クエリとして推薦する推薦クエリ出力ステップと、を有する。
また、本発明の検索クエリ推薦装置は、テレビの番組情報から抽出された各番組の固有表現に基づき検索エンジンのクエリログを限定して分析対象とし、該分析対象をユーザ毎に分類したユーザ別検索ワードと、該分析対象中で出現頻度の上昇している急上昇ワードを求めるクエリログ分析手段と、前記固有表現およびユーザ別検索ワードに基づきユーザ別の番組興味度を求め、ユーザ別の番組興味度と前記固有表現に応じた急上昇ワードとから該急上昇ワードに対するユーザの興味度を算出するユーザ興味分析手段と、前記算出されたユーザの興味度順に前記固有表現に応じた任意数の急上昇ワードをユーザに検索クエリとして推薦する推薦クエリ出力手段と、を備える。
なお、本発明は、前記装置としてコンピュータを機能させるプログラムの態様としてもよい。このプログラムは、ネットワークや記録媒体などを通じて提供することができる。
本発明によれば、ユーザの興味に応じた流行の検索クエリが推薦クエリとしてユーザに提示されるため、ユーザの情報検索が支援され、情報検索の効率向上に貢献することができる。
本発明の実施形態に係る検索クエリ推薦装置の構成図。 同 情報収集処理手段の構成図。 同 クエリログ分析処理手段の構成図。 同 ユーザ興味分析処理手段の構成図。 同 リアルタイム推薦クエリ出力処理手段の構成図。
図1に基づき本発明の実施形態に係る検索クエリ推薦装置1を説明する。この推薦装置1は、テレビの番組情報から流行の検索クエリをユーザに推薦する。すなわち、テレビ番組の情報を基に新語の分類とユーザの興味の分類とを行ってユーザの興味を反映させた推薦クエリと最新のリアルタイム推薦クエリとを抽出する。ここでは前記推薦装置1は、インターネット経由でユーザ端末2と通信自在に接続されているものとする。なお、図1中、ユーザ端末2は、パーソナルコンピュータを示しているが、例えば携帯電話やPDAなどの情報端末を用いることもできる。
具体的には前記推薦装置1は、検索エンジン3と連携したシステムを構成し、通常のコンピュータのハードウェアリソース、例えばCPU.メモリ(RAM).ハードディスクドライブ装置.通信デバイスなどを備える。このハードウェアリソースとソフトウェアリソース(OS,アプリケーションなど)との協働の結果、前記推薦装置1は、情報収集処理・クエリログ分析処理・ユーザ興味分析処理・推薦クエリ出力処理・リアルタイム推薦クエリ出力処理を実行する。
この情報収集処理は、情報収集処理手段(各抽出機能部5〜8.各テーブル9〜12)により実行される。ここではテレビ番組の情報として番組情報のテキストデータD1と番組に対するコメントデータD2とを用いる。すなわち、テキストデータD1に基づき番組情報抽出機能部5で番組名などを抽出し、番組情報テーブル9に保存する。また、各固有表現抽出機能部6.7は、それぞれテキストデータD1.コメントデータD2から前記テーブル9の番組毎に固有表現(語句)を抽出し、各固有表現テーブル10.11に保存する。さらに1次固有表現抽出機能部8は、前記テーブル10.11の双方に含まれる固有表現を抽出し、1次固有表現テーブル12に保存する。
クエリログ分析処理は、クエリログ分析処理手段(各機能部13〜16.ユーザ別クエリ情報テーブル17)により実行される。すなわち、固有表現リスト抽出機能部13は、前記テーブル12の保存された固有表現から固有表現リストL1を作成し、クエリログフィルタリング機能部14は検索エンジン3のクエリログDB4に記録されたクエリログを前記リストL1の番組固有表現に限定する。また、急上昇ワード抽出機能部15は、前記限定されたクエリログ中で出現頻度が急上昇している流行の検索クエリ、即ち急上昇ワードを抽出し、急上昇ワードリストL2を作成する。さらに、ユーザ別クエリ情報テーブル作成機能部16は、前記限定されたクエリログをユーザ毎に分類したユーザ別のクエリ情報をユーザ別クエリ情報テーブル17に保存する。
ユーザ興味分析処理は、ユーザ興味分析処理手段(各機能部18〜20.各テーブル21〜23)により実行される。ここではユーザ興味分析機能部18は、前記テーブル12.17の保存情報に基づきユーザ別番組興味度を求め、ユーザ興味テーブル21に保存する。また、2次固有表現テーブル作成機能部19は、前記テーブル12の前記固有表現に応じた前記リストL2の急上昇ワードを2字固有表現テーブル22に保存する。さらに、ユーザ興味語抽出機能部20は、前記テーブル21.22の保存情報に基づき急上昇ワードに対する各ユーザの興味度を求め、該興味度をユーザ興味語テーブル23に保存する。
推薦クエリ出力処理は、推薦クエリ出力処理手段(ユーザ興味語取得機能部24)により実行され、ユーザ端末2に入力されたユーザIDに応じて前記テーブル23の情報を取得する。この取得情報中、興味度の順に任意数のワード、即ち前記固有表現に応じた急上昇ワードを推薦クエリとして、ユーザ端末2に返信するため、ユーザの興味に応じた流行の検索クエリが提示される。
リアルタイム推薦クエリ出力処理は、リアルタイム推薦クエリ出力手段(各機能部25〜29)により実行され、クエリログ分析処理・ユーザ興味分析処理を経ることなく、情報収集処理でテレビ番組の情報を解析したタイミングで出現頻度の高い任意数の固有表現(語句)をリアルタイム推薦クエリとしてユーザ端末2に送信する。これにより前記推薦クエリとは別にリアルタイムに最新の推薦クエリをユーザに提示することができる。
なお、前記各テーブル9〜12.17.21〜23は、それぞれメモリ(RAM)あるいはハードディスクドライブ装置などの記憶・保存手段に設けられ、ユーザ端末2との送受信は通信デバイスを通じて実施されるものとする。以下、図2〜図5に基づき前記各処理の詳細を説明する。
≪情報収集処理≫
図2に基づき情報収集処理を説明する。ここでは情報収集対象のテレビ番組の情報としては、「チャンネル」・「時刻」・「番組名」・「出演者」・「番組内容」などを記録したテキストデータD1と、テレビ番組に対するコメントや感想などを投稿しているブログやミニブログのデータ、即ちコメントデータD2とを用いる。このブログやミニブログでは、カテゴリやタグ情報を付与することで、テレビ番組に対するコメントを特定できるものが存在し、これらをコメントデータD2とする。例えば「twitter」ではテレビ局ごとのタグが存在しており、「#xtv」や「#ytv」などはそれぞれテレビチャンネル「X−TV」「Y−TV」を表すコメントと特定できる。ここではテキストデータD1は、人手作成してもよく、あるいは音声や画面認識システムを用いて自動的に作成してもよい。また、コメントデータD2は、ブログサイトやミニブログサイトが用意しているAPIなどを利用して取得すればよい。
具体的には情報収集処理は、テキストデータD1に基づく前記抽出機能部5.6の前記テーブル9.10の作成から開始される。すなわち、前記抽出機能部5は、テキストデータD1を解析して、番組毎に「開始時刻:終了時刻:番組名」の情報をテキストデータD1から抽出し、前記テーブル9に保存する(番組情報抽出ステップ)。なお、前記テーブル9は、「X−TV」や「Y−TV」などのTVチャンネル毎の列を持ち、前記各情報が当該TVチャンネルの要素として保存されている。
また、前記抽出機能部6は、テキストデータD1を解析して番組毎にテキストデータD1から語句を抽出し「番組名:語句リスト」の情報を前記テーブル10に保存する(番組固有表現抽出ステップ)。ここでは前記テーブル10は、前記テーブル9と同様に「X−TV」や「Y−TV」などTVチャンネル毎の列を持ち、前記各情報が当該TVチャンネルの要素として保存されている。この保存情報中の「語句リスト」は、前記抽出機能部6がテキストデータの「出演者」・「内容」などから抽出した固有表現(語句)を、「,」などの区切り文字で区切りが分かるように並べた情報を表している。この固有表現の一例として、「○○ラーメン」や「△△食堂」などの商品名や店名、あるいは「伊藤○○」などの人名、「イタリア」などの地名・国名が記録されている。
一方、前記抽出機能部7は、コメントデータD2に基づき前記テーブル11を作成する(コメント固有表現抽出ステップ)。すなわち、コメントデータD2は、「投稿時間」・「投稿本文」・「チャンネルタグ」を含んだテキスト情報にからなり、前記抽出機能部7は、「チャンネルタグ」および「投稿時間」の情報をキーに前記テーブル9を探索し、対応する番組を特定する。ここで特定された番組の固有表現(語句)を「投稿本文」から抽出し、該番組の放映時間内におけるすべてのコメント中の語句の頻度を計算する。この計算結果に基づき(出現回数|word)を1要素とするリストを作成し、前記テーブル11に「番組名:頻度付き語句リスト」として保存する。なお、前記テーブル11も、前記テーブル9.10と同様に「X−TV」や「Y−TV」などTVチャンネル毎の列を持ち、前記各情報が当該TVチャンネルの要素として保存されている。
ここでテキストデータD1とコメントデータD2は、番組の進行およびコメントの投稿などが随時発生することから、前記抽出機能部5〜7は任意の間隔(5分毎など)で抽出処理を行って、前記各テーブル9〜12の保存情報を随時更新するものとする。
そして、前記抽出機能部8は、前記各テーブル10.11の保存情報について番組名毎にそれぞれの語句リストを比較し、双方に含まれる語句のみを当該番組における固有表現として抽出し、前記テーブル12に保存する(1次固有表現抽出ステップ)。具体的には前記テーブル12は、すべての番組から抽出した固有表現の種類Nに応じたN行・番組数Mに応じたM列のテーブルからなり、該テーブルの各セルには番組のコメントデータD2中における固有表現の出現頻度が記述されている。
≪クエリログ分析処理≫
図3に基づきクエリログ分析処理を説明する。ここでは検索エンジン3のクエリログDB4に記録されたクエリログには、「クエリの投入時刻」・「クエリ」・「ユーザID」の情報が含まれているものとする。この分析対象となるクエリログは、前記出力機能部29でユーザに提示されたクエリのうちユーザが採択したクエリのみとしてもよく、あるいは検索エンジンに投入されたクエリのうち任意期間内のクエリログとしてもよい。
具体的には前記機能部13は、前記テーブル12からN個の固有表現を抽出し、前記リストL1を作成する(固有表現リスト抽出ステップ)。作成された前記リストL1はメモリ(RAM)あるいはハードディスクドライブ装置に記憶・保存される。ここで記憶された前記リストL1に基づき前記機能部14は、テレビ番組関連のクエリログに限定するフィルタリング処理(クエリログのフィルタリングステップ)を実行する。すなわち、クエリログの「クエリ」に含まれている検索ワードのうち、前記リストL1におけるN個の固有表現に含まれない検索ワードを削除し、クエリログをN個の固有表現に絞り込む。
そして、前記機能部15は、フィルタリング処理後に残った各検索ワードのクエリログ中における出現頻度を単位時間毎に抽出し、抽出された各時間単位の出現頻度を比較する。比較の結果、過去の出現頻度に比べて異常に上昇(増加)しているL個の検索ワードを急上昇ワードとして抽出し、前記リストL2を作成する(急上昇ワード抽出ステップ)。前記リストL2の作成にあたっては3シグマ法(3σ法)など管理図を利用した手法を用いてもよい。また、あらかじめ任意の閾値を設定し、過去の出現頻度に対して該閾値を超える割合で出現頻度が増加していれば、急上昇ワードとして抽出してもよい。なお、作成された前記リストL2も、メモリ(RAM)あるいはハードディスクライブ装置に記憶・保存される。
また、前記機能部16は、フィルタリング処理により絞り込まれたクエリログをユーザID毎にまとめて、固有表現毎の検索ワード入力回数、即ちユーザ別クエリ情報を前記テーブル17に保存する(ユーザ別クエリ情報テーブル作成ステップ)。例えば図3中の前記テーブル17の保存情報例では、ユーザID「user_a」・「user_b」・「user_c」毎に各検索ワードの入力回数が記述されている。
≪ユーザ興味分析処理≫
図4に基づきユーザ興味分析処理を説明する。まず、前記機能部18は、前記テーブル12.17の保存情報に基づき各ユーザの番組毎の興味度を分析し、分析結果のユーザ別番組興味度を前記テーブル21に保存する(ユーザ興味分析ステップ)。このとき図4中の前記テーブル12.17によれば、前記テーブル17におけるユーザID「user_a」の行の保存情報は式(1)のベクトルqとして表すことができ、前記テーブル12の保存情報は式(2)のベクトルW1として表すことができる。なお、式(1)中の「T」は転置を示している。
ベクトルqの要素はN個の固有表現に対応してN次元からなり、ベクトルW1の列は番組を表し番組数分のM次元・ベクトルW1の行は固有表現を表しN次元からなる。ここではユーザID「user_a」を持つユーザの番組興味度を式(3)により計算し、計算結果を前記テーブル21の「user_a」の行に保存する。
同様にユーザID「user_b」・「user_c」を持つユーザの番組興味度を計算し、計算結果を前記テーブル21のそれぞれの行に保存する。これにより前記テーブル21中の各要素は、その列が示す番組に対する各ユーザの興味度を表す数値となる。
つぎに前記機能部19は、前記テーブル12の固有表現と前記リストL2の急上昇ワードとに基づき前記テーブル22を作成する(2次固有表現テーブル作成ステップ)。ここでは前記テーブル12から前記リストL2の急上昇ワード(L個)に含まれている固有表現の行を抽出し、前記テーブル22に保存する。これにより前記テーブル12の固有表現に応じた前記リストL2の急上昇ワードが、前記テーブル22に前記データD2中の出現頻度と併せて記述される。
最後に前記機能部20は、前記テーブル21.22の保存情報に基づきそれぞれの急上昇ワードに対する各ユーザの興味度、即ち急上昇ワード別のユーザ興味度を抽出し、該興味度を前記テーブル23に保存する(ユーザ興味語抽出ステップ)。このとき図4中の前記テーブル21.22によれば、前記テーブル21におけるユーザID「user_a」の行の保存情報は式(4)のベクトルuとして表すことができ、また前記テーブル22の保存情報は式(5)のベクトルW2として表すことができる。なお、式(4)中の「T」は転置を示している。
ベクトルuの要素はM個の番組に対応してM次元からなり、ベクトルW2の列は番組を表し番組数分のM次元・行は急上昇ワードのワード数を表しL次元からなる。ここではユーザID「user_a」を持つユーザの急上昇ワード別の興味度を式(6)により計算し、計算結果を前記テーブル23の「user_a」の行に保存する。
同様にユーザID「user_b」・「user_c」を持つユーザの急上昇ワード別の興味度を計算し、計算結果を前記テーブル23のそれぞれの行に保存する。これにより前記テーブル23中、n番目の要素はn番目の急上昇ワード「p−word n」に対するユーザの興味度を表す数値となる。
≪推薦クエリ出力処理≫
前記機能部24は、ユーザ端末2を通じてユーザが入力・送信したユーザIDを受信すると、該ユーザIDをキーとして前記テーブル23を探索し、該当するユーザIDの行の情報を取得する。この取得情報中、興味度の数値順に並べ替え(ソートする)、上位から任意数の急上昇ワードを推薦クエリとしてユーザ端末2に送信し、ユーザ端末2のブラウザ上に推薦クエリ群を表示させる(推薦クエリ出力ステップ)。この推薦クエリ群は、例えばユーザがログイン時に入力したユーザIDに応じて、「お勧めの検索ワード」として表示させることができる。
このような推薦クエリ群は、前記テーブル23に記述された興味度の数値が上位の急上昇ワードなため、ユーザの興味に応じてパーソナライズされ、これによりユーザの興味に応じた流行の検索クエリを推薦クエリとしてユーザに提示することができる。この結果、従来は流行の検索クエリの中でも特に新語はどのような分野で用いられる用語かを判断することが困難であったが、前記推薦装置1によれば、かかる弊害が緩和される。
すなわち、情報収集処理にてテレビの番組情報(テキストデータD1・コメントデータD2)をもとに当該新語がどの番組で出現するかを収集し、クエリログ分析手段にてユーザの興味の傾向をどの番組で出現する語を検索キーワードとして入力しているかを求め、ユーザ興味分析処理にて該両者を対応付けてユーザの興味を反映させた新語を推薦クエリとして抽出することができる。
≪リアルタイム推薦クエリ出力処理≫
図5に基づきリアルタイム推薦クエリ出力処理を説明する。ここでは事前に図1中で図示省略した現時刻取得機能部30,最新番組情報取得機能部31の処理が実施される。すなわち、前記機能部30は、プログラムが起動しているOSの時刻や外部の時刻サーバなどから現在時刻を取得する。この現在時刻に基づき前記機能部31は、前記テーブル9から最新あるいは直前の番組の情報をチャンネル毎に取得する。ここで取得した番組(foreach番組)毎に前記機能部25〜27の処理が開始される。この処理は前記テーブル10.11の更新に応じて実行される。
詳細を説明すれば、前記機能部25は、推薦クエリ候補を取得すべく、番組名をキーとして前記テーブル10.11から対応する番組を探索し、該対応番組の「語句リスト」と「頻度付き語句リスト」とを取得する(推薦クエリ候補取得ステップ)。この取得後に前記機能部26は、「語句リスト」と「頻度付き語句リスト」のいずれにも含まれる語句(固有表現)を抽出する(フィルタリングステップ)。
つぎに前記機能部27は、前記機能部26により抽出された語句から出現頻度の高い任意数(n件)を選択して抽出し、メモリ(RAM)あるいはハードディスクドライブ装置の一時記憶領域32に保存する。このとき同時に該当番組の放映時間中におけるクエリログを解析し、該クエリログ内の出現頻度も含めた上位n件を抽出して一時記憶領域32に保存してもよい。なお、一時記憶領域32への保存により前記機能部25〜27の処理を終了する。
その後に前記機能部28が一時記憶領域32に保存された各語句を取得し、前記機能部29が該各語句を出現頻度順に並べ替えて最終的に出現頻度の高い順に任意数(n個)の語句をリアルタイム推薦クエリとして抽出する。このとき前記テーブル10.11の更新に応じて前記機能部25〜27の処理が実行されるため、リアルタイム推薦クエリは前記テーブル10.11の更新時に抽出される。
抽出されたリアルタイム推薦クエリは、ユーザ端末2からのアクセスがあれば、ユーザIDの入力を問わず、ユーザ端末2に送信され、すべてのユーザに提示される。これにより情報収集処理でコメントデータD1とテキストデータD2とを解析したタイミングで最新の推薦クエリをユーザに提供することできる。
すなわち、クエリログ分析処理で検索回数が急上昇したクエリを検知した時点では、既に多くのユーザが検索を行った後であり、リアルタイム性に欠けるおそれがある。そこで、リアルタイム推薦クエリをユーザに提示することで、クエリログ中での出現頻度が急上昇する前に最新の推薦クエリをユーザに提供する。
この結果、前記推薦装置1によれば、流行の検索クエリにユーザの興味を反映させた推薦クエリと最新のリアルタイム推薦クエリとをユーザに提示でき、ユーザの情報検索を効果的に支援できる。例えばWebページにユーザ端末2がアクセスすれば、リアルタイム推薦クエリを「最新の検索ワード」としてブラウザ上に表示させ、その後にユーザIDの入力があれば、推薦クエリを「お勧めの検索ワード」として表示させることができ、ユーザの情報検索の効率向上に貢献する。
なお、本発明は、上記実施形態に限定されるものではなく、各請求項に記載した範囲内で変更することができる。例えば前記機能部25は、前記テーブル10.11ではなく、前記テーブル12の保存情報を取得してもよい。この場合には前記テーブル10.11の更新時ではなく、前記テーブル12の更新時にリアルタイム推薦クエリが抽出されるものの、前記テーブル12には前記テーブル10.11の双方に含まれる語句と出現頻度が記述されているため、前記機能部26の処理が省略され、処理を簡素化することができる。
≪プログラムなど≫
本発明は、前記推薦装置の各部5〜29の一部もしくは全部として、コンピュータを機能させる文書検索プログラムとして構成することもできる。このプログラムによれば、前記各ステップの一部あるいは全部をコンピュータに実行させることが可能となる。
前記プログラムは、Webサイトや電子メールなどネットワークを通じて提供することができる。また、前記プログラムは、CD−ROM,DVD−ROM,CD−R,CD−RW,DVD−R,DVD−RW,MO,HDD,BD−ROM,BD−R,BD−REなどの記録媒体に記録して、保存・配布することも可能である。この記録媒体は、記録媒体駆動装置を利用して読み出され、そのプログラムコード自体が前記実施形態の処理を実現するので、該記録媒体も本発明を構成する。
1…検索クエリ推薦装置
2…ユーザ端末
3…検索エンジン
4…クエリログDB
5…番組情報抽出機能部
6…番組固有表現抽出機能部
7…コメント固有表現抽出機能部
8…1次固有表現抽出機能部
9…番組情報テーブル
10…番組固有表現テーブル
11…コメント固有表現テーブル
12…1次固有表現テーブル
13…固有表現リスト抽出機能部
14…クエリログフィルタリング機能部
15…急上昇ワード抽出機能部
16…ユーザ別クエリ情報テーブル作成機能部
17…ユーザ別クエリ情報テーブル
18…ユーザ興味分析機能部
19…2次固有表現テーブル作成機能部
20…ユーザ興味語抽出機能部
21…ユーザ興味テーブル
22…2次固有表現テーブル
23…ユーザ興味語テーブル
24…ユーザ興味語取得機能部
25…推薦クエリ候補取得機能部
26…フィルタリング機能部
27…上位固有表現抽出機能部
28…全推薦クエリ候補取得機能部
29…推薦クエリ出力機能部
30…現時刻取得機能部
31…最新番組情報取得機能部
32…一時記憶領域
D1…テキストデータ
D2…コメントデータ
L1…固有表現リスト
L2…急上昇ワードリスト

Claims (9)

  1. ユーザが検索クエリを検索エンジンに投入して必要な情報を検索するにあたってユーザに検索クエリの推薦を行う方法であって、
    クエリログ分析手段が、テレビの番組情報から抽出された各番組の固有表現に基づき検索エンジンのクエリログを限定して分析対象とし、該分析対象をユーザ毎に分類したユーザ別検索ワードと、該分析対象中で出現頻度の上昇している急上昇ワードを求めるクエリログ分析ステップと、
    ユーザ興味分析手段が、前記固有表現およびユーザ別検索ワードに基づきユーザ別の番組興味度を求め、ユーザ別の番組興味度と前記固有表現に応じた急上昇ワードとから該急上昇ワードに対するユーザの興味度を算出するユーザ興味分析ステップと、
    推薦クエリ出力手段が、前記算出されたユーザの興味度順に前記固有表現に応じた任意数の急上昇ワードをユーザに検索クエリとして推薦する推薦クエリ出力ステップと、
    を有することを特徴とする検索クエリ推薦方法。
  2. 情報収集手段が、テレビの番組情報として該番組情報を記録したデータと、該番組情報に記録された番組に対するコメントデータとを用いて、両データのいずれにも含まれる番組の固有表現を抽出する情報収集ステップをさらに有する
    ことを特徴とする請求項1記載の検索クエリ推薦方法。
  3. リアルタイム推薦クエリ出力手段が、前記両データのいずれにも含まれている番組の固有表現を出現頻度順にソートし、該出現頻度に応じて任意数の固有表現をリアルタイム推薦クエリとしてユーザに提示するリアルタイム推薦クエリ出力ステップをさらに有する
    ことを特徴とする請求項2記載の検索クエリ推薦装置。
  4. リアルタイム推薦クエリ出力ステップは、前記各データから抽出した番組の固有表現を保存する保存手段のデータ更新に応じてリアルタイム推薦クエリをユーザに提示する
    ことを特徴とする請求項3記載の検索クエリ推薦方法。
  5. ユーザが検索クエリを検索エンジンに投入して必要な情報を検索するにあたってユーザに検索クエリの推薦を行う装置であって、
    テレビの番組情報から抽出された各番組の固有表現に基づき検索エンジンのクエリログを限定して分析対象とし、該分析対象をユーザ毎に分類したユーザ別検索ワードと、該分析対象中で出現頻度の上昇している急上昇ワードを求めるクエリログ分析手段と、
    前記固有表現およびユーザ別検索ワードに基づきユーザ別の番組興味度を求め、ユーザ別の番組興味度と前記固有表現に応じた急上昇ワードとから該急上昇ワードに対するユーザの興味度を算出するユーザ興味分析手段と、
    前記算出されたユーザの興味度順に前記固有表現に応じた任意数の急上昇ワードをユーザに検索クエリとして推薦する推薦クエリ出力手段と、
    を備えることを特徴とする検索クエリ推薦装置。
  6. テレビの番組情報として該番組情報を記録したデータと、該番組情報に記録された番組に対するコメントデータとを用いて、両データのいずれにも含まれる番組の固有表現を抽出する情報収集手段をさらに備える
    ことを特徴とする請求項5記載の検索クエリ推薦装置。
  7. 前記両データのいずれにも含まれている番組の固有表現を出現頻度順にソートし、該出現頻度に応じて任意数の固有表現をリアルタイム推薦クエリとしてユーザに提示するリアルタイム推薦クエリ出力手段をさらに備える
    ことを特徴とする請求項6記載の検索クエリ推薦装置。
  8. 情報収集手段は、前記各データから抽出した番組の固有表現を保存する保存手段を備え、
    リアルタイム推薦クエリ出力手段は、前記保存手段のデータ更新に応じてリアルタイム推薦クエリをユーザに提示する
    ことを特徴とする請求項7記載の検索クエリ推薦装置。
  9. 請求項5〜8のいずれか1項に記載された検索クエリ推薦装置としてコンピュータを機能させる検索クエリ推薦プログラム。
JP2010204091A 2010-09-13 2010-09-13 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム Expired - Fee Related JP5341847B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010204091A JP5341847B2 (ja) 2010-09-13 2010-09-13 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010204091A JP5341847B2 (ja) 2010-09-13 2010-09-13 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム

Publications (2)

Publication Number Publication Date
JP2012059182A true JP2012059182A (ja) 2012-03-22
JP5341847B2 JP5341847B2 (ja) 2013-11-13

Family

ID=46056167

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010204091A Expired - Fee Related JP5341847B2 (ja) 2010-09-13 2010-09-13 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム

Country Status (1)

Country Link
JP (1) JP5341847B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105025339A (zh) * 2015-07-22 2015-11-04 天脉聚源(北京)传媒科技有限公司 一种电视盒子中节目的分类搜索方法及装置
JP2016177620A (ja) * 2015-03-20 2016-10-06 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP2018067193A (ja) * 2016-10-20 2018-04-26 ヤフー株式会社 抽出装置、抽出方法および抽出プログラム
JP2019036191A (ja) * 2017-08-18 2019-03-07 ヤフー株式会社 判定装置、判定方法及び判定プログラム
WO2020079748A1 (ja) * 2018-10-16 2020-04-23 株式会社島津製作所 事例検索方法および事例検索システム
US11630824B2 (en) 2018-10-16 2023-04-18 Shimadzu Corporation Document search method and document search system

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003199084A (ja) * 2001-12-27 2003-07-11 Seiko Epson Corp 番組編集システム、番組情報検索システム、番組情報取得システム及び番組編集プログラム、並びに番組編集方法
JP2004312627A (ja) * 2003-04-10 2004-11-04 Matsushita Electric Ind Co Ltd テレビジョン受像装置およびその番組情報検索方法
JP2007264789A (ja) * 2006-03-27 2007-10-11 Toshiba Corp シーン情報抽出方法、シーン抽出方法および抽出装置
WO2008087728A1 (ja) * 2007-01-18 2008-07-24 Fujitsu Limited キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法
JP2010055501A (ja) * 2008-08-29 2010-03-11 Toshiba Corp 情報提供サーバ、情報提供方法及び情報提供システム
JP2010146570A (ja) * 2008-12-19 2010-07-01 Nhn Corp 番組放送中に検索サービスを提供する方法及び装置
JP2010171539A (ja) * 2009-01-20 2010-08-05 Ntt Docomo Inc 番組記録制御システム、放送受信端末、及び番組記録制御方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003199084A (ja) * 2001-12-27 2003-07-11 Seiko Epson Corp 番組編集システム、番組情報検索システム、番組情報取得システム及び番組編集プログラム、並びに番組編集方法
JP2004312627A (ja) * 2003-04-10 2004-11-04 Matsushita Electric Ind Co Ltd テレビジョン受像装置およびその番組情報検索方法
JP2007264789A (ja) * 2006-03-27 2007-10-11 Toshiba Corp シーン情報抽出方法、シーン抽出方法および抽出装置
WO2008087728A1 (ja) * 2007-01-18 2008-07-24 Fujitsu Limited キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法
JP2010055501A (ja) * 2008-08-29 2010-03-11 Toshiba Corp 情報提供サーバ、情報提供方法及び情報提供システム
JP2010146570A (ja) * 2008-12-19 2010-07-01 Nhn Corp 番組放送中に検索サービスを提供する方法及び装置
JP2010171539A (ja) * 2009-01-20 2010-08-05 Ntt Docomo Inc 番組記録制御システム、放送受信端末、及び番組記録制御方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200300647001; 榎並 和雅: 'IT時代の放送サービスとコンテンツ制作〜知的コンテンツ制作システムの実現を目指して〜' 映像情報メディア学会技術報告 第25巻 第21号, 20010301, pp.1-6, (社)映像情報メディア学会 *
CSNH200800004011; 岡本 昌之 他: 'デジタルメディア処理先端技術' 東芝レビュー 第62巻 第12号, 20071201, pp.58-61, 株式会社東芝 *
JPN6013037941; 榎並 和雅: 'IT時代の放送サービスとコンテンツ制作〜知的コンテンツ制作システムの実現を目指して〜' 映像情報メディア学会技術報告 第25巻 第21号, 20010301, pp.1-6, (社)映像情報メディア学会 *
JPN6013037944; 岡本 昌之 他: 'デジタルメディア処理先端技術' 東芝レビュー 第62巻 第12号, 20071201, pp.58-61, 株式会社東芝 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016177620A (ja) * 2015-03-20 2016-10-06 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
CN105025339A (zh) * 2015-07-22 2015-11-04 天脉聚源(北京)传媒科技有限公司 一种电视盒子中节目的分类搜索方法及装置
JP2018067193A (ja) * 2016-10-20 2018-04-26 ヤフー株式会社 抽出装置、抽出方法および抽出プログラム
JP2019036191A (ja) * 2017-08-18 2019-03-07 ヤフー株式会社 判定装置、判定方法及び判定プログラム
WO2020079748A1 (ja) * 2018-10-16 2020-04-23 株式会社島津製作所 事例検索方法および事例検索システム
WO2020080376A1 (ja) * 2018-10-16 2020-04-23 株式会社島津製作所 事例検索方法および事例検索システム
JPWO2020080376A1 (ja) * 2018-10-16 2021-11-04 株式会社島津製作所 事例検索方法および事例検索システム
US11630824B2 (en) 2018-10-16 2023-04-18 Shimadzu Corporation Document search method and document search system

Also Published As

Publication number Publication date
JP5341847B2 (ja) 2013-11-13

Similar Documents

Publication Publication Date Title
US9747342B2 (en) Information processing apparatus, information processing method, information processing program, and recording medium
CN102708174B (zh) 一种浏览器中的富媒体信息的展示方法和装置
US20170154116A1 (en) Method and system for recommending contents based on social network
RU2670494C2 (ru) Способ обработки поискового запроса, сервер и машиночитаемый носитель для его осуществления
JP5341847B2 (ja) 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム
CN104035972B (zh) 一种基于微博的知识推荐方法与系统
KR101925950B1 (ko) 컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치
KR20150036117A (ko) 쿼리 확장
US20130173605A1 (en) Extracting Query Dimensions from Search Results
US20150347543A1 (en) Federated search
WO2011062598A1 (en) System and method for automated filtering of reviews for marketability
JP6728178B2 (ja) 検索データを処理するための方法及び装置
JP5547669B2 (ja) 関連語抽出装置、関連語抽出方法、関連語抽出プログラム
CN104090923A (zh) 一种浏览器中的富媒体信息的展示方法和装置
JP2012118918A (ja) 情報検索システム、情報検索方法、情報検索プログラム
Anh et al. Extracting user requirements from online reviews for product design: A supportive framework for designers
JP2014085862A (ja) 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
KR20100132376A (ko) 스니펫 제공 장치 및 방법
JP2006331292A (ja) Weblogコミュニティ検索支援方法、検索支援装置および検索支援方法のプログラムを記録した記録媒体
KR101544462B1 (ko) 위치기반 정보 제공 시스템에서의 클라이언트 단말 정보를 이용한 개인화 된 poi정보 제공 방법 및 그 클라이언트 단말
JP2013054606A (ja) 文書検索装置及び方法及びプログラム
JP4759600B2 (ja) 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体
JP6568284B1 (ja) 提供装置、提供方法及び提供プログラム
JP2011100191A (ja) 文書検索装置、文書検索方法、及び文書検索プログラム
KR101132431B1 (ko) 관심 정보 제공 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130806

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130808

R150 Certificate of patent or registration of utility model

Ref document number: 5341847

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees