JP6203304B2 - 情報処理装置、情報処理方法および情報処理プログラム - Google Patents

情報処理装置、情報処理方法および情報処理プログラム Download PDF

Info

Publication number
JP6203304B2
JP6203304B2 JP2016030239A JP2016030239A JP6203304B2 JP 6203304 B2 JP6203304 B2 JP 6203304B2 JP 2016030239 A JP2016030239 A JP 2016030239A JP 2016030239 A JP2016030239 A JP 2016030239A JP 6203304 B2 JP6203304 B2 JP 6203304B2
Authority
JP
Japan
Prior art keywords
information
search
ambiguity
keyword
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016030239A
Other languages
English (en)
Other versions
JP2017146926A (ja
Inventor
友貴 矢野
友貴 矢野
玲 田島
玲 田島
幸浩 田頭
幸浩 田頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016030239A priority Critical patent/JP6203304B2/ja
Publication of JP2017146926A publication Critical patent/JP2017146926A/ja
Application granted granted Critical
Publication of JP6203304B2 publication Critical patent/JP6203304B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。
従来、インターネット等のネットワーク上にウェブサイトを公開し、そのウェブサイトにアクセスしてきた端末装置に対して、端末装置のユーザが所望する情報を提示するサービスが存在する。
例えば、オンラインショッピングのウェブサイトでは、ユーザが指定したキーワードを含む検索クエリを端末装置から受け付け、かかるキーワードに基づいて予め商品の情報が登録されたデータベースを検索し、検索された商品の情報を含む検索結果を端末装置へ送信する。検索された商品が、ユーザが目的としている商品の情報であれば、その購入手続き等を行うことで、ユーザにその商品を提供することができる。
また、ユーザが検索キーワードを入力して「検索」ボタンをクリックすると、検索結果のページにジャンプするだけでなく、ユーザによって入力された検索キーワードに関連する他の検索キーワードを表示する仕組みも提案されている(例えば、特許文献1参照)。
特許文献1に記載の技術では、ユーザによって入力された検索キーワードを受信し、明確に規定されていない意図に対応する複数の所定の単語と検索キーワードとが比較される。そして、かかる比較結果に基づいて、検索キーワードがユーザによって明確に規定された意図を示すか否かが判定され、検索キーワードが明確に規定された意図を示さないと判定された場合に、更なる推薦検索キーワードを取得するための処理が実行される。
特表2014−501422号公報
しかしながら、上記従来の手法では、明確に規定されていない意図に対応する複数の所定の単語である不明確意図ワードセットを用いるため、例えば、不明確意図ワードセットの設定によってはキーワードの曖昧性の判定精度に課題がある。
本発明は、上記に鑑みてなされたものであって、検索に用いられるキーワードの曖昧性を精度よく判定することができる情報処理装置、情報処理方法および情報処理プログラムを提供することを目的とする。
本願に係る情報処理装置は、記憶部と、曖昧性判定部とを備える。前記記憶部は、検索時に用いられたキーワードと、当該キーワードを用いて検索された検索結果の中から選択された複数の対象に関する情報とを関連付けて検索履歴情報として記憶する。前記曖昧性判定部は、前記記憶部に記憶された検索履歴情報に基づき、前記キーワードに対応する前記複数の対象間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を判定する。
実施形態の一態様によれば、検索に用いられるキーワードの曖昧性を精度よく判定することができる情報処理装置、情報処理方法および情報処理プログラムを提供することができる。
図1は、実施形態に係る情報処理の説明図である。 図2は、実施形態に係る情報処理システムの構成例を示す図である。 図3は、実施形態に係る情報処理装置の具体的構成例を示す図である。 図4は、曖昧性情報記憶部に記憶された曖昧度テーブルの一例を示す図である。 図5は、検索履歴記憶部に記憶される検索履歴テーブルの一例を示す図である。 図6は、端末装置で表示される検索結果情報の一例を示す図である。 図7は、ある選択対象のトピック分布の一例を示す図である。 図8は、特徴情報記憶部に記憶される特徴情報の一例を示す図である。 図9は、異なるクエリのそれぞれのトピック分布を示す図である。 図10は、実施形態に係る情報処理装置における情報処理の流れを示すフローチャートである。 図11は、図10に示す検索処理の流れを示すフローチャートである。 図12は、図10に示す曖昧性判定処理の流れを示すフローチャートである。 図13は、情報処理プログラムを実行するコンピュータのハードウェア構成の一例を示す図である。
以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。
[1.曖昧性判定処理を含む情報処理]
まず、実施形態に係る情報処理について説明する。図1は、実施形態に係る情報処理の説明図であり、かかる情報処理は情報処理装置3によって実行される。情報処理装置3が実行する情報処理には検索処理および曖昧性判定処理が含まれる。以下、検索処理および曖昧性判定処理の順に説明する。
図1に示すように、実施形態に係る情報処理装置3は、端末装置2からキーワードk1(以下、検索キーワードk1と記載する)を含む検索クエリが送信されると(ステップS1)、検索クエリに含まれる検索キーワードk1を用いて検索処理を行い、かかる検索結果を端末装置へ送信する(ステップS2)。
情報処理装置3から送信される検索結果には、複数の選択対象d1〜dn(nは2以上の整数)の情報が含まれている。端末装置2のユーザ(以下、端末ユーザと記載する場合がある)は、これら複数の選択対象d1〜dn(以下、選択対象dと総称する場合がある)の中から1以上の選択対象dを選択すると、かかる選択結果が情報処理装置3へ送信される(ステップS3)。情報処理装置3は、端末装置2から選択結果を受け取ると、かかる選択結果に対応する情報を端末装置2へ送信する(ステップS4)。
例えば、情報処理装置3がオンラインショッピングのウェブサイトを提供する場合、情報処理装置3は、検索キーワードk1に応じた複数の商品のウェブページのそれぞれへのリンクが選択対象d1〜dnとして設定された検索結果ページを端末装置2へ送信する。端末ユーザは、検索結果ページの中から選択対象d1を選択(商品Aのリンクをクリック)すると、情報処理装置3は、選択対象d1(商品A)に対応するウェブページを端末装置2へ提供する。
情報処理装置3は、上述してステップS1〜S4で行われる検索処理の履歴を検索履歴情報として記憶する(ステップS5)。図1に示す例では、各選択対象d1〜dnの端末ユーザによる選択割合が検索キーワードk1に関連付けられて検索履歴情報として記憶されている。かかる選択割合は、同一の検索キーワードk1に対する1以上の端末ユーザの選択結果全体に対する割合である。
また、情報処理装置3は、選択対象d1〜dnのそれぞれの特徴を解析して特徴情報として記憶部に記憶する(ステップS6)。特徴情報は、選択対象dの特徴を示すための指標である。例えば、情報処理装置3は、選択対象dがウェブページである場合、かかるウェブページに含まれる特徴要素を抽出し、ウェブページにおける特徴要素の分布を検出する。
特徴要素は、例えば、ウェブページに含まれる単語から抽出されるトピックである。かかるトピックは、ウェブページなどのデータに含まれる単語を例えば、話題や興味として抽象的に表したものである。例えば、情報処理装置3は、例えば、公知のトピックモデル(言語モデル)である潜在的ディリクレ配分法(LDA:Latent Dirichlet Allocation)を用いてトピックを抽出することができる。
情報処理装置3は、検索キーワードk1に対応する複数の選択対象d1〜dn間の類似度を算出し、算出した類似度から検索キーワードk1の曖昧性を判定する(ステップS7)。例えば、情報処理装置3は、選択対象d1〜dn間での特徴要素の分布の類似度に基づいて、選択対象d1〜dn間の類似度を算出することができる。この場合、情報処理装置3は、例えば、上述した選択対象d1〜dnの選択割合に応じて各選択対象d1〜dnの特徴要素の重み付けを行い、このように重み付けを行った特徴要素の分布間の類似度を算出する。
なお、情報処理装置3は、複数の選択対象d1〜dn間の類似度をそのまま検索キーワードk1の曖昧性としたり、複数の選択対象d1〜dn間の類似度に応じて、3段階の曖昧度を「低」、「中」、「高」のいずれかから選択したりすることもできる。
このように、情報処理装置3は、端末ユーザによって選択された選択対象d1〜dn(対象の一例)間の類似度から検索クエリに含まれる検索キーワードk1の曖昧性を判定することから、検索に用いられる検索キーワードk1の曖昧性を精度よく判定することができる。
なお、2以上の選択対象dをグループ化して選択対象d1〜dnを複数のグループg1〜gm(m<n)に振り分け、グループg1〜gm(以下、選択グループgと総称する場合がある)間の類似度から検索クエリに含まれる検索キーワードk1の曖昧性を判定することもできる。情報処理装置3がオンラインショッピングのウェブサイトを提供する場合、選択グループgは、例えば、商品カテゴリである。
この場合、情報処理装置3は、各グループg1〜gm(対象の一例)の特徴を解析して特徴情報として記憶部に記憶する。例えば、情報処理装置3は、選択対象d1〜dnがウェブページである場合、各グループg1〜gmに含まれるウェブページに含まれる特徴要素を抽出し、各グループg1〜gmにおける特徴要素の分布を検出する。
[2.情報処理システム]
図2は、実施形態に係る情報処理システムの構成例を示す図である。図2に示すように、実施形態に係る情報処理システム1は、複数の端末装置2〜2(nは、2以上の整数)と、情報処理装置3とを備える。
これら複数の端末装置2〜2(以下、端末装置2と総称する場合がある)および情報処理装置3は、ネットワーク4を介して互いに通信可能に接続される。ネットワーク4は、例えば、LAN(Local Area Network)や、インターネットなどのWAN(Wide Area Network)である。
端末装置2は、例えば、端末ユーザによって利用されるPC(Personal Computer)、PDA(Personal Digital Assistant)、スマートフォンなどである。かかる端末装置2は、例えば、情報処理装置3にアクセスするためのアプリケーション(例えば、ブラウザアプリケーション)がインストールされている。
情報処理装置3は、通信部10、記憶部20および制御部30を備える。制御部30は、情報提供部31と、曖昧性判定部32とを備える。情報提供部31は、例えばショッピングサイトやニュース・サイト、Q&Aサイト、電子商取引サイト、動画提供サイト、検索サイト等のウェブサイトをネットワーク4上で公開し、記憶部20に記憶された提供情報に基づいて情報提供サービスを端末装置2へ提供する。
端末装置2は、端末ユーザが所望の情報にアクセスするために指定した検索キーワードを含む検索クエリを情報処理装置3へ送信し、情報処理装置3は、検索キーワードに応じた検索処理を行い、かかる検索結果を端末装置2へ提供する。端末ユーザが検索結果の中から所望の対象を選択すると、かかる選択結果が端末装置2から情報処理装置3へ送信される。情報処理装置3は、端末ユーザの選択結果に応じた情報を端末装置2へ提供する。なお、検索キーワードは、1以上の語(例えば、一つの単語や複数の単語の組)を含む。
記憶部20は、検索時に用いられた検索キーワードと、かかる検索キーワードを用いて検索された検索結果の中から選択された複数の対象に関する情報とを関連付けて検索履歴情報として記憶する。曖昧性判定部32は、記憶部20に記憶された検索履歴情報に基づき、検索キーワードに対応する複数の対象間の類似度を算出し、算出した類似度から検索キーワードの曖昧性を判定する。
情報提供部31は、曖昧性判定部32によって判定された曖昧性に基づいて、検索キーワードに応じた検索結果を提供することができる。例えば、情報提供部31は、検索キーワードの曖昧度が高い場合、検索クエリに他の情報(例えば、追加キーワード等)を補充して検索を行ったり、検索を補助するための他の情報(例えば、追加キーワード等)を絞り込み候補の情報として端末装置2へ提供したりすることができる。絞り込み候補の情報は、端末ユーザに選択可能に端末装置2の検索画面(例えば、検索キーワードの入力ボックスの上部)に表示され、かかる絞り込み候補を端末装置2において端末ユーザが選択することによって、かかる選択結果が端末装置2から情報処理装置3へ送信される。これにより、情報提供部31は、端末ユーザに選択された絞り込み候補に応じた検索結果を端末ユーザに提供することができる。なお、絞り込み候補の情報は、検索キーワードと追加キーワードとを含む情報であってもよい。なお、上記他の情報として例えば端末ユーザのユーザ情報を利用して嗜好情報に対応したキーワードを用いることができる。
このように、情報処理装置3は、検索キーワードに対応する複数の対象(例えば、選択対象dまたは選択グループg)間の類似度を算出し、算出した類似度から検索キーワードの曖昧性を判定することから、検索キーワードの曖昧性を精度よく判定することができる。さらに、情報処理装置3は、検索キーワードの曖昧性に基づいて、端末ユーザへ適切な検索結果を提示したり、絞り込み候補の情報を端末ユーザに提供して端末ユーザに絞り込み候補を選択させることによって端末ユーザの検索意図をより明確にしたりすることができる。
以下、図3を参照して情報処理装置3の構成についてさらに具体的に説明する。図3は、実施形態に係る情報処理装置3の具体的構成例を示す図である。以下、通信部10、記憶部20および制御部30の順に具体的に説明する。
[2.1.通信部10]
通信部10は、ネットワーク4との間で情報の送受信を行う通信インターフェイスであり、ネットワーク4との接続を有線または無線で行う。制御部30は、通信部10およびネットワーク4を介して、端末装置2との間で各種の情報を送受信することができる。
[2.2.記憶部20]
記憶部20は、提供情報記憶部21と、ユーザ情報記憶部22と、曖昧性情報記憶部23と、検索履歴記憶部24と、特徴情報記憶部25とを有する。提供情報記憶部21、ユーザ情報記憶部22、曖昧性情報記憶部23、検索履歴記憶部24および特徴情報記憶部25は、例えば、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子、または、HDD(Hard Disk Drive)、光ディスク等の記憶装置である。
[2.3.制御部30]
制御部30は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、入出力ポートなどを有するマイクロコンピュータや各種の回路を含む。
制御部30は、情報提供部31と、曖昧性判定部32とを備える。かかる情報提供部31および曖昧性判定部32の機能は、例えば、上記CPUが上記ROMに記憶されているプログラムを読み出して実行することにより実現される。なお、情報提供部31および曖昧性判定部32は、それぞれ一部または全部がASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等のハードウェアで構成されてもよい。
情報提供部31は、要求受信部41と、検索処理部42と、提供情報生成部43と、提供情報出力部44とを備える。また、曖昧性判定部32は、特徴抽出部51と、情報取得部52と、類似度算出部53と、クエリ曖昧度設定部54とを備える。以下、これらの各部について具体的に説明する。
[2.3.1.要求受信部41]
要求受信部41は、端末装置2から送信される各種の情報提供要求をネットワーク4経由で受信する。情報提供要求として、例えば、検索キーワードを含む検索クエリや、要求する情報を特定する情報(例えば、URL(Uniform Resource Locator))を含む情報提供クエリなどがある。
[2.3.2.検索処理部42]
検索処理部42は、要求受信部41により受信された検索クエリに含まれる検索キーワードを取得し、提供情報記憶部21に予め記憶されている検索対象データ(例えば、商品データ)等を参照して、検索キーワードに対応する複数のコンテンツを検索する。
かかるコンテンツは、情報提供部31がショッピングサイトのサービスを提供する場合、例えば、検索キーワードに対応する商品のウェブページ(以下、商品ページと記載する)であり、検索処理部42は、かかる商品ページの情報(例えば、商品名やURLの情報)を提供情報記憶部21から取得する。なお、提供情報記憶部21は、例えば、検索対象データを検索可能に構成されたデータベースである。
また、情報提供部31が動画提供サイトのサービスを提供する場合、上記コンテンツは、例えば、検索キーワードに対応する動画データであり、検索処理部42は、かかる動画データの情報(例えば、動画のタイトルやURLの情報)を取得する。
また、検索処理部42は、曖昧性情報記憶部23に記憶された曖昧度テーブルに基づいて、検索処理の内容を変更することができる。図4は、曖昧性情報記憶部23に記憶された曖昧度テーブルの一例を示す図である。
図4に示すように、曖昧度テーブルは、検索キーワードk1〜kp(pは2以上の整数)のぞれぞれの曖昧度をそれぞれ検索キーワードk1〜kp(以下、検索キーワードkと総称する場合がある)と関連付けた情報である。図4に示す曖昧度テーブルでは、検索キーワードk1に曖昧度として「1.21」が対応付けられ、検索キーワードk2に曖昧度として「0.88」が対応付けられ、検索キーワードkpに曖昧度として「1.82」が対応付けられている。
検索処理部42は、かかる曖昧度テーブルに基づいて、例えば、検索キーワードkの曖昧度を判定し、かかる曖昧度が高い(例えば、予め設定された閾値TH以上である)場合、補助情報を利用した検索処理を行うことができる。
例えば、検索処理部42は、検索キーワードの曖昧度が高い場合、ユーザ情報記憶部22に記憶された端末ユーザのユーザ情報のうち検索クエリに対応する端末ユーザのユーザ情報を利用して嗜好情報に対応したキーワードを補助情報として検索キーワードに追加して検索処理を行う。一方、検索処理部42は、検索キーワードの曖昧度が低い(例えば、予め設定された閾値TH未満である)場合、検索キーワードに追加キーワードを補充することなく、検索処理を行う。
また、検索処理部42は、曖昧度が高い場合、例えば、検索キーワードkに補充する他の情報(例えば、追加キーワード)であって端末ユーザが選択可能な情報である絞り込み候補の情報を補助情報として端末装置2へ提供することができる。端末ユーザは、絞り込み候補を選択することで、絞り込み候補に応じた検索結果を得ることができ、より検索意図に応じた検索結果を得ることができる。なお、検索処理部42は、検索キーワードkの曖昧度に応じて、上述した補助情報の利用方法を切り替えることもできる。
また、検索処理部42は、検索クエリに含まれる検索キーワードkの曖昧度に応じて、検索方法を変更することもできる。例えば、検索処理部42は、曖昧度が高い検索キーワードkを有する検索クエリのための検索方法と、曖昧度が低いキーワードkを有する検索クエリのための検索方法とを異なる検索方法にし、検索キーワードkの曖昧度に応じて、検索方法を切り替えることができる。また、検索処理部42は、検索クエリに含まれる検索キーワードkの曖昧度に応じて、検索されたコンテンツ(例えば、ウェブページ)のランキング方法を変更して検索結果におけるコンテンツの表示順位を変更することもできる。
[2.3.3.提供情報生成部43]
提供情報生成部43は、検索処理部42による検索処理の結果を取得し、かかる検索結果を含む情報(以下、検索結果情報と記載する)を提供情報として生成する。
かかる検索結果情報は、情報提供部31がショッピングサイトのサービスを提供する場合、例えば、検索キーワードに対応する複数の商品の名称が表示され、かつ、検索キーワードに対応する複数の商品ページがリンク先として設定されたウェブページである。
また、情報提供部31が動画提供サイトのサービスを提供する場合、検索結果情報は、例えば、検索キーワードに対応する複数の動画データのタイトルが表示され、かつ、検索キーワードに対応する複数の動画データがリンク先として設定されたウェブページである。
また、提供情報生成部43は、要求受信部41で受信した情報提供クエリに含まれる情報(例えば、URL)に応じたコンテンツを情報提供部31から取得し、取得したコンテンツを含む提供情報を生成する。
ここで、要求受信部41で受信した情報提供クエリが、検索結果情報に含まれる選択対象dのうち端末ユーザによって選択された選択対象dの情報の送信を要求するクエリであるとする。この場合、提供情報生成部43は、検索結果情報に対応するキーワードと選択された選択対象dに関する情報とを関連付けて検索履歴記憶部24に記憶する。
選択対象dに関する情報は、例えば、端末ユーザによって選択された選択対象dを特定する情報や、各選択対象dが端末ユーザにより選択される割合(以下、選択割合と記載する)の情報などが含まれる。
図5は、検索履歴記憶部24に記憶される検索履歴テーブルの一例を示す図である。図5に示す検索履歴テーブル(検索履歴情報の一例)には、例えば、検索キーワードk1と選択対象d1〜dnの選択割合の情報とが関連付けて記憶されている。
図5に示す検索履歴テーブルは、検索キーワードk1による検索結果に含まれる選択対象d1、d2、d3、d4、・・・、dnの端末ユーザによる選択割合が5%、3%、12%、2%、・・・、4%であることを示す。以下、ある検索キーワードkによる検索結果に含まれる選択対象dの端末ユーザによる選択割合の分布をクリック分布p(d|q)と記載する場合がある。なお、検索履歴記憶部24に記憶される検索履歴情報は、図5に示す検索履歴テーブルに限定されず、例えば、検索キーワードkと各選択グループgの選択割合とが関連付けられたテーブルであってもよく、以下、選択グループgの選択割合の分布をクリック分布p(g|q)と記載する場合がある。
[2.3.4.提供情報出力部44]
提供情報出力部44は、提供情報生成部43によって生成された提供情報を対応する情報提供要求(例えば、検索クエリや情報提供クエリ)を送信した通信部10を介して端末装置2へ送信する。これにより、端末装置2において、情報提供要求に応じた情報が取得され表示される。
図6は、端末装置2で表示される検索結果情報の一例を示す図である。図6に示す検索結果情報は、情報提供部31がショッピングサイトのサービスを提供する場合において、端末装置2の表示部に表示される商品検索結果ページ80を示す。
図6に示す商品検索結果ページ80では、検索キーワードとして、端末ユーザにより「カメラ」が入力ボックス81へ入力された状態で検索ボタン82をクリック(選択)して検索した場合における検索結果が示される。かかる商品検索結果ページ80には、検索結果として、商品A、B、Cの情報をそれぞれ選択可能に表示した複数の領域83〜85が設定される。
端末ユーザが、例えば、「商品A」の文字を選択(例えば、クリック)することで、商品Aが選択対象dとして選択され、かかる選択結果を含む情報提供クエリが端末装置2から情報処理装置3へ送信される。また、端末ユーザが、例えば、「商品B」の文字を選択(例えば、クリック)することで、商品Bが選択対象dとして選択され、かかる選択結果を含む情報提供クエリが端末装置2から情報処理装置3へ送信される。
[2.3.5.特徴抽出部51]
特徴抽出部51は、検索履歴記憶部24に記憶された情報と提供情報記憶部21に記憶された情報に基づいて、各検索キーワードkに対応する検索結果に含まれる選択対象dの特徴を抽出する。
かかる特徴抽出部51は、選択対象dがウェブページである場合、かかるウェブページに含まれる自然言語のデータから形態素解析により複数の形態素を抽出し、かかる形態素から特徴語(例えば、名詞)を抽出する。そして、特徴抽出部51は、抽出した各特徴語が属するトピックt(特徴要素の一例)を公知のトピックモデル(例えば、上述したLDA)を用いて判定し、選択対象dにおけるトピックtの確率分布としてトピック分布p(t|d)を求める。
また、特徴抽出部51は、例えば、選択対象dが動画データである場合や動画データが含まれるウェブページである場合、動画データに含まれる特徴画像、特徴音声、特徴語などの特徴要素をトピックtとして抽出し、各トピックtの出現割合の分布を求めることができる。
なお、トピック分布p(t|d)は、一つの選択対象dを対象とした確率分布であるが、特徴抽出部51は、2以上の選択対象dを含む選択グループgを対象とした確率分布であるトピック分布p(t|g)を求めることもできる。このようにグループ化することによって、選択対象dが多い場合であっても、トピック分布の演算負荷を抑えることができる。
図7は、ある選択対象dのトピック分布p(t|d)の一例を示す図である。図7に示す例では、ある選択対象dに含まれる全トピックt1〜tn(nは、2以上の整数)の数に対する各トピックt1〜tn数の割合がトピック分布p(t|d)として表されている。
特徴抽出部51は、抽出した選択対象dの特徴を示す特徴情報として各選択対象dのトピック分布p(t|d)の情報と各選択対象dの情報とを対応づけた情報を特徴情報記憶部25に記憶する。図8は、特徴情報記憶部25に記憶される特徴情報の一例を示す図である。なお、特徴情報は、図8に示す特徴情報に限定されない。例えば、特徴情報は、各選択グループgのトピック分布p(t|g)の情報と各選択グループgの情報とを対応づけた情報であってもよい。
また、特徴抽出部51は、例えば、選択対象dの特徴を空間ベクトル上のベクトルで表した特徴情報を選択対象dから算出し、かかる特徴情報を特徴情報記憶部25に記憶することもできる。かかる特徴情報は、ベクトルの向きおよび大きさによって選択対象dの特徴が表現される。なお、ベクトル表現の生成については、例えば潜在的意味索引(LSI:Latent Semantic Indexing)等の手法を用いることができる。なお、特徴抽出部51は、選択グループgのベクトルで表した特徴情報を選択グループgに含まれる複数の選択対象dから算出することもできる。
[2.3.6.情報取得部52]
情報取得部52は、検索履歴記憶部24に記憶されている検索履歴情報を取得する。情報取得部52は、図5に示す検索履歴テーブルが検索履歴記憶部24に記憶されている場合、例えば、検索キーワードk1に対応する選択対象d1〜dnの選択割合の情報を検索履歴記憶部24から取得する。
また、情報取得部52は、特徴情報記憶部25に記憶される特徴情報を取得する。例えば、情報取得部52は、検索キーワードk1に対応する選択対象d1〜dnのそれぞれのトピック分布p(t|d)を特徴情報記憶部25から取得する。また、情報取得部52は、検索キーワードk1に対応する複数の選択グループgのそれぞれのトピック分布p(t|g)を特徴情報記憶部25から取得することもできる。
[2.3.7.類似度算出部53]
類似度算出部53は、情報取得部52で取得される各検索キーワードkに対応する複数の選択対象dの情報と、かかる複数の選択対象dのそれぞれのトピック分布p(t|d)とに基づいて、各検索キーワードkに対応する複数の選択対象d間の類似度を算出する。
類似度算出部53は、トピックtの分布の強度を定量化するために、検索キーワードkに対応する検索結果のうち選択された選択対象dのトピック分布p(t|d)を選択対象dの選択割合に応じて重み付けを行った後に合算して、平均トピック分布p(t|q)を求める。例えば、類似度算出部53は、下記式(1)を用いて、検索キーワードk毎に平均トピック分布p(t|q)を求める。
Figure 0006203304
平均トピック分布p(t|q)は、ある検索キーワードkを有する検索クエリqが与えられたときに、あるトピックtが出てくる確率を示す。なお、上記式(1)において、「q」は検索キーワードkを有する検索クエリqを示し、検索クエリqと検索キーワードkとは一対一で対応する。したがって、「q」は、実質的に検索キーワードkを示す。
また、上記式(1)において、「d」は、選択(クリック)された選択対象dを示し、「Dq」は、検索クエリqに関連する選択対象dを要素とする集合を示す。また、「p(d|q)」は、上述したクリック分布(選択分布)であり、ある検索クエリqが与えられたときに、ある選択対象dが選択(クリック)される確率を示す。
次に、類似度算出部53は、検索クエリq毎に、選択対象d間の類似度を算出する。例えば、類似度算出部53は、検索クエリq毎に、各選択対象dのクエリ分布と平均トピック分布p(t|q)との類似性を算出し、平均トピック分布p(t|q)と基準とした選択対象d間の類似性を求める。
さらに、類似度算出部53は、選択対象d間の類似性に基づいて、検索クエリq毎の検索キーワードkの曖昧度(以下、キーワード曖昧度と記載する)を判定する。例えば、類似度算出部53は、すべての選択対象dの類似性を平均した値を算出し、かかる算出結果をキーワード曖昧度として判定する。
具体的には、類似度算出部53は、下記式(2)を用いて、選択対象d間の類似度をカルバック・ライブラー情報量(Kullback-Leibler divergence)として算出し、さらに、かかる選択対象d間の類似度に基づいてクエリ曖昧度amb(q,Dq)をキーワード曖昧度として求める。クエリ曖昧度amb(q,Dq)は、各トピック分布p(t|d)と平均トピック分布p(t|q)との間のカルバック・ライブラー情報量を選択対象dの選択割合で重み付けして平均化した値である。
Figure 0006203304
クエリ曖昧度amb(q,Dq)は、負ではなく、また、端末ユーザの検索意図が完全に明確な検索キーワードkを有する検索クエリqの場合はゼロであり、端末ユーザの検索意図がより曖昧である検索キーワードkを有する検索クエリqほどより大きな値になる。なお、上記式(2)において、「T」は、トピックtを要素とする集合を示し、「Dq」は、上述したように検索クエリqに関連する選択対象dを要素とする集合を示す。また、上述したように、検索クエリqと検索キーワードkとは一対一で対応しており、したがって、クエリ曖昧度amb(q,Dq)は、キーワードの曖昧度を示す。
このように、類似度算出部53は、検索クエリq毎に、選択対象d間のトピック分布p(t|d)を比較することによって、検索クエリqの曖昧性(キーワードの曖昧性)を定量化できる。図9は、異なる検索クエリq1、q2、q3のそれぞれのトピック分布p(t|q)を示す図である。図9に示すトピック分布p(t|q)は、理解を容易にするために、トピックtが3つ(トピックt1〜t3)であり、選択対象dが3つ(選択対象d1〜d3)である例を示す。
図9に示すように、トピックt1〜t3から構成されるトピック空間における選択対象d1〜d3間の距離が異なり、検索クエリq1、検索クエリq2、検索クエリq3の順に、選択対象d1〜d3間の距離が近くなる。したがって、検索クエリqの曖昧度(キーワード曖昧度)は、検索クエリq1>検索クエリq2>検索クエリq3であることが理解できる。
したがって、上述のように、検索クエリq毎に、トピック分布p(t|q)を選択対象d間で比較することにより、各検索クエリqの検索キーワードkの曖昧性を精度よく判定することができることがわかる。
ところで、各選択対象dが一つのトピックtだけ有し、かつ、各選択対象dのトピックtが独立である場合、上記式(2)は、下記式(3)に示すように簡略化することができる。
Figure 0006203304
また、類似度算出部53は、検索クエリq毎に、選択グループg間のトピック分布p(t|g)を比較してキーワード曖昧度を求めることもできる。この場合、類似度算出部53は、選択対象dを選択グループgに置き換えて上述と同様の処理を行うことで、キーワード曖昧度を求めることができる。例えば、類似度算出部53は、上述した(1)、(2)等において、トピック分布p(t|d)をトピック分布p(t|g)に置き換え、クリック分布p(d|q)をクリック分布p(g|q)に置き換えることによって、キーワード曖昧度を求めることができる。
なお、選択対象d間(または選択グループg間)の類似性の算出手法は、上述した例に限定されず、選択対象d間(または選択グループg間)の類似性を算出することができればよい。類似度算出部53は、予め準備した基準のトピック分布と各選択対象dのトピック分布p(t|d)との類似性を算出し、かかる類似性間の類似性に基づいて、選択対象d間の類似性を算出することもできる。また、類似度算出部53は、選択グループgについても同様に、予め準備した基準のトピック分布と各選択グループgのトピック分布p(t|g)との類似性を算出し、選択グループg間の類似性を判定することもできる。
また、類似度算出部53は、例えば、選択対象dの特徴が空間ベクトル上のベクトルで表される場合、かかるベクトルの選択対象d間での類似度を算出することで、選択対象d間の類似度を算出することができる。なお、選択グループgについても同様に、類似度算出部53は、ベクトルの選択グループg間の類似性を判定することができる。
[2.3.8.クエリ曖昧度設定部54]
クエリ曖昧度設定部54は、クエリ曖昧度amb(q,Dq)をそのままキーワード曖昧度として曖昧性情報記憶部23に設定する。また、クエリ曖昧度設定部54は、クエリ曖昧度amb(q,Dq)をそのままキーワード曖昧度とせずに、所定の変換テーブルを用いて、クエリ曖昧度amb(q,Dq)をキーワード曖昧度に変換することもできる。
変換テーブルは、例えば、「低」、「中」、「高」の3段階に分けたキーワード曖昧度とクエリ曖昧度amb(q,Dq)の値の範囲とを対応付けたテーブルであり、かかるテーブルに基づいて、キーワード曖昧度が「低」、「中」、「高」の中から判定される。
なお、類似度算出部53に基づいて算出した選択対象d間(または選択グループg間)の類似性が低いほどキーワード曖昧度が高くなるように、検索キーワードk毎のキーワード曖昧度を曖昧性情報記憶部23に設定することができれば上記方法に限定されない。
[3.情報処理装置3の処理フロー]
次に、図10を用いて、情報処理装置3における情報処理の手順について説明する。図10は、実施形態に係る情報処理装置3における情報処理の流れを示すフローチャートであり、かかる情報処理は繰り返し実行される。
図10に示すように、情報処理装置3の情報提供部31は、端末装置2からの検索クエリを受信したか否かを判定する(ステップS10)。検索クエリを受信したと判定した場合(ステップS10;Yes)、情報提供部31は、検索処理を実行する(ステップS11)。かかる検索処理は、図11に示すステップS20〜S25に示す処理であり、後で詳述する。
ステップS11の処理が終了した場合、または、ステップS10において検索クエリを受信していないと判定した場合(ステップS10;No)、情報提供クエリを受信したか否かを判定する(ステップS12)。情報提供クエリを受信したと判定した場合(ステップS12;Yes)、情報提供部31は、情報提供クエリに応じた提供情報を端末装置2へ送信し(ステップS13)、情報提供クエリによって要求された提供情報に関する情報を検索履歴情報として記憶する(ステップS14)。提供情報に関する情報は、例えば、選択された選択対象に関する情報である。
ステップS14の処理が終了した場合、または、ステップS12において情報提供クエリを受信していないと判定した場合(ステップS12;No)、曖昧性判定部32は、曖昧性判定契機になったか否かを判定する(ステップS15)。曖昧性判定契機は、例えば、所定周期(例えば、1日毎)に発生する契機である。
曖昧性判定契機になったと判定した場合(ステップS15;Yes)、曖昧性判定部32は、曖昧性判定処理を実行する(ステップS16)。かかる曖昧性判定処理は、図12に示すステップS30〜S33に示す処理であり、後で詳述する。ステップS16の処理が終了した場合、または、ステップS15において曖昧性判定契機になっていないと判定した場合(ステップS15;No)、制御部30は、図10に示す処理を終了する。
次に、ステップS11に示す検索処理について説明する。図11は、図10に示すステップS11の検索処理の流れを示すフローチャートである。
図11に示すように、情報提供部31は、受信した検索クエリのキーワード曖昧度の情報を記憶部20から取得し(ステップS20)、取得したキーワード曖昧度が閾値TH以上であるか否かを判定する(ステップS21)。
キーワード曖昧度が閾値TH以上であると判定した場合(ステップS21;Yes)、情報提供部31は、補助情報を取得する(ステップS23)。補助情報は、例えば、検索クエリに含まれる検索キーワードに補充する情報(例えば、追加キーワード)である。ステップS23が終了した場合、または、キーワード曖昧度が閾値TH以上ではないと判定した場合(ステップS21;No)、情報提供部31は、検索クエリに含まれる検索キーワードを用いた検索を行う(ステップS22)。
情報提供部31は、ステップS23で補助情報を取得している場合、ステップS22において、補助情報を利用する。例えば、情報提供部31は、検索キーワードkに補助情報(例えば、追加キーワード)を補充した検索キーワードによって検索処理を行うことができる。また、情報提供部31は、検索クエリに含まれる検索キーワードkに補充する絞り込み候補の情報(例えば、追加キーワード)を補助情報として端末装置2へ送信して端末ユーザに絞り込み候補の情報を提供する。そして、情報提供部31は、端末ユーザが選択した絞り込み候補を含むクエリを受信すると、検索キーワードkに絞り込み候補を補充したキーワードによって検索を行う。
ステップS22、S23の処理が終了した場合、情報提供部31は、検索結果の情報を検索クエリの送信元である端末装置2へ送信する(ステップS24)。そして、情報提供部31は、かかる検索履歴の情報(例えば、検索キーワードkや選択対象dの情報)を記憶部20に記憶し(ステップS25)、図11に示す処理を終了する。
次に、ステップS16に示す曖昧性判定処理について説明する。図12は、図10に示すステップS16の曖昧性判定処理の流れを示すフローチャートである。
図12に示すように、曖昧性判定部32は、各検索キーワードkに対応する選択対象d(または選択グループg)の特徴を抽出する(ステップS30)。次に、曖昧性判定部32は、選択対象d(または選択グループg)の選択割合の情報を取得する(ステップS31)。
次に、曖昧性判定部32は、ステップS31で取得した情報に基づいて、選択対象dまたは選択グループg間の類似性を算出する(ステップS32)。曖昧性判定部32は、例えば、選択対象d(または選択グループg)の選択割合に応じて各選択対象d(または選択グループg)の特徴要素の重み付けを行い、このように重み付けを行った特徴要素の分布間の類似度を算出することで、選択対象d(または選択グループg)間の類似性を算出する。
次に、曖昧性判定部32は、ステップS32で算出した類似性に応じたクエリ曖昧度を記憶部20に記憶し(ステップS33)、図12に示す処理を終了する。かかる処理において、曖昧性判定部32は、例えば、ステップS32で算出した類似性をそのままクエリ曖昧度として記憶部20に記憶したり、所定の変換テーブルを用いて、ステップS32で算出した類似性をクエリ曖昧度に変換したりすることもできる。
[4.変形例]
上述した実施形態では、キーワード曖昧性を考慮した検索処理とキーワード曖昧性を判定する曖昧性判定処理とを同一の情報処理装置3によって実行する例を説明したが、検索処理を行う情報処理装置と曖昧性判定処理を行う情報処理装置とを別体の装置で行っても良い。この場合、これらの装置間でキーワード曖昧性の情報が送受信される。
また、情報処理装置3が検索キーワードkに対応して提供するコンテンツは、ウェブページなどのウェブコンテンツに限定されるものではなく、検索キーワードkで検索されるデジタルコンテンツであればよい。なお、デジタルコンテンツとしては、例えば、文書データ、動画データ、音声データなどが含まれる。
また、上述した実施形態では、曖昧性判定部32は、選択対象dの特徴としてトピックモデル(例えば、LDA)を用いてトピックtの分布に基づいて選択対象d間の類似度を判定する例を示したが、かかる例に限定されない。例えば、曖昧性判定部32は、選択対象d間における特徴語(例えば、予め設定された名詞)の分布の類似度に基づいて、選択対象d間の類似度を判定することもできる。
曖昧性判定部32は、選択対象d(または選択グループg)の選択割合に加え、さらに選択対象d(または選択グループg)の選択までにかかった時間に応じた重み付けを行うことができる。これにより、さらに、検索キーワードkの曖昧性を精度よく判定することができる。この場合、情報提供部31は、選択対象d(または選択グループg)の選択までにかかった時間の情報を検索履歴情報として記憶部20に記憶する。
[5.ハードウェア構成〕
なお、上述した実施形態における情報処理装置3は、例えば図13に示すような構成のコンピュータ100が情報処理プログラムを実行することによって実現される。図13は、情報処理プログラムを実行するコンピュータのハードウェア構成の一例を示す図である。コンピュータ100は、CPU101、RAM102、ROM103、HDD104、通信インターフェイス(I/F)105、入出力インターフェイス(I/F)106、およびメディアインターフェイス(I/F)107を備える。
CPU101は、ROM103またはHDD104に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM103は、コンピュータ100の起動時にCPU101によって実行されるブートプログラムや、コンピュータ100のハードウェアに依存するプログラム等を格納する。
HDD104は、CPU101によって実行されるプログラムによって使用されるデータ等を格納する。例えば、HDD104は、図3に記載した提供情報記憶部21、ユーザ情報記憶部22、曖昧性情報記憶部23、検索履歴記憶部24および特徴情報記憶部25と同様のデータを記憶する。通信インターフェイス105は、通信部10に対応し、ネットワーク4を介して他の機器からデータを受信してCPU101へ送り、CPU101が生成したデータを、ネットワーク4を介して他の機器へ送信する。
CPU101は、入出力インターフェイス106を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU101は、入出力インターフェイス106を介して、入力装置からデータを取得する。また、CPU101は、生成したデータを、入出力インターフェイス106を介して出力装置へ出力する。
メディアインターフェイス107は、記録媒体108に格納されたプログラムまたはデータを読み取り、RAM102を介してCPU101に提供する。CPU101は、当該プログラムを、メディアインターフェイス107を介して記録媒体108からRAM102上にロードし、ロードしたプログラムを実行する。記録媒体108は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
コンピュータ100が上述した実施形態に係る情報処理装置3して機能する場合、コンピュータ100のCPU101は、RAM102上にロードされたプログラムを実行することにより、図3に示す情報提供部31および曖昧性判定部32の各機能を実現する。コンピュータ100のCPU101は、情報処理プログラムを、記録媒体108から読み取って実行するが、他の例として、他の装置から、ネットワーク4を介してこれらのプログラムを取得してもよい。
[6.効果]
実施形態に係る情報処理装置3は、記憶部20と、曖昧性判定部32とを備える。記憶部20は、検索時に用いられた検索キーワードkと、検索キーワードkを用いて検索された検索結果の中から選択された複数の選択対象d(または複数の選択グループg;対象の一例)に関する情報とを関連付けて検索履歴情報として記憶する。曖昧性判定部32は、記憶部20に記憶された検索履歴情報に基づき、検索キーワードkに対応する複数の選択対象d間(または複数の選択グループg間)の類似度を算出し、算出した類似度から検索キーワードkの曖昧性を判定する。このように、端末ユーザによって選択された選択対象d1〜dn間(または複数の選択グループg間)の関係を考慮して検索キーワードkの曖昧性を判定することから、検索に用いられる検索キーワードkの曖昧性を精度よく判定することができる。
また、曖昧性判定部32は、情報取得部52と、類似度算出部53とを備える。情報取得部52は、選択された複数の選択対象d(または複数の選択グループg)それぞれの特徴を示す特徴情報を取得する。また、類似度算出部53は、選択対象dの選択割合(または選択グループgの選択割合)に基づいて重み付けられた複数の選択対象d間(または複数の選択グループg間)での特徴情報の類似度に基づき、複数の選択対象d間(または複数の選択グループg間)の類似度(以下、対象類似度と記載する)を算出する。このように特徴情報に基づいて、対象類似度を算出することから、かかる類似度を精度よく算出することができる。
また、情報取得部52は、特徴情報としてトピック分布p(t|d)(またはp(t|g))(特徴要素の分布の一例)を示す情報を取得する。類似度算出部53は、選択された複数の選択対象d間(または複数の選択グループg間)でのトピック分布p(t|d)(またはp(t|g))の類似度に基づき、対象類似度の類似度を算出する。このように、トピック分布p(t|d)(またはp(t|g))の類似度を用いることにより、対象類似度をさらに精度よく算出することができる。
また、選択された選択対象dは、検索結果の中から選択されたコンテンツ(またはコンテンツのグループ)であり、特徴情報は、コンテンツに含まれるトピック分布(またはグループの2以上のコンテンツに含まれるトピック分布)である。事前に十分に調整されたグループが存在する場合、選択されたグループのトピック分布に基いて対象類似度を算出する方が、コンテンツのトピック分布を基いて対象類似度を算出する場合に比べ、対象類似度をより精度よく算出できる可能性がある。また、選択されたグループのトピック分布に基づいて対象類似度を算出することによって、例えば、判定対象を減らすことができることから対象類似度の判定負荷を軽減することができる。
曖昧性判定部32は、検索キーワードk毎に類似度に対応するキーワード曖昧度を含む曖昧性情報を記憶部20に記憶する。このように、検索キーワードk毎に類似度に対応するキーワード曖昧度を記憶するとから、新たな検索を行うために入力された検索キーワードkに対して、キーワード曖昧度に応じた検索を行うことができる。
実施形態に係る情報処理装置3は、情報提供部31を備える。情報提供部31は、新たに検索を行うために入力された検索キーワードkに対して、曖昧性情報から検索キーワードkに対するキーワード曖昧度(曖昧度の情報の一例)を取得し、取得したキーワード曖昧度の情報に対応させた情報提供処理(例えば、検索処理)を行う。これにより、検索クエリqの検索キーワードkの曖昧度に応じた適切な検索結果を端末ユーザに提供することができる。
情報提供部31は、キーワード曖昧度と、予め設定した閾値THとを比較し、キーワード曖昧度が閾値TH以上である場合に、検索キーワードkに他の情報を補充し、補充した内容で検索を行い、キーワード曖昧度が閾値TH以上でない場合に、検索キーワードkで検索を行う。これにより、曖昧度が高い検索キーワードkを有する検索クエリに対して、ユーザの検索意図に対応する適切な検索結果を端末ユーザに提供することができる。
情報提供部31は、キーワード曖昧度と、予め設定した閾値THとを比較し、キーワード曖昧度が閾値TH以上である場合に、検索キーワードkに他の情報を補充する絞り込み候補の情報を端末装置2へ提供することもできる。これにより、曖昧度が高い検索キーワードkを有する検索クエリに対して、ユーザの検索意図に対応するより明確なり込み候補を端末ユーザに提供することができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述した情報処理装置3は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、曖昧性判定部は、曖昧性判定手段や曖昧性判定回路に読み替えることができる。
1 情報処理システム
2 端末装置
3 情報処理装置
4 ネットワーク
10 通信部
20 記憶部
21 提供情報記憶部
22 ユーザ情報記憶部
23 曖昧性情報記憶部
24 検索履歴記憶部
25 特徴情報記憶部
30 制御部
31 情報提供部
32 曖昧性判定部
41 要求受信部
42 検索処理部
43 提供情報生成部
44 提供情報出力部
51 特徴抽出部
52 情報取得部
53 類似度算出部
54 クエリ曖昧度設定部

Claims (10)

  1. 検索時に用いられたキーワードと、当該キーワードを用いて検索された検索結果の中から選択された複数の対象に関する情報とを関連付けて検索履歴情報として記憶する記憶部と、
    前記記憶部に記憶された検索履歴情報に基づき、前記キーワードに対応する前記複数の対象間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を判定する曖昧性判定部と、
    を有することを特徴とする情報処理装置。
  2. 前記曖昧性判定部は、
    前記複数の対象それぞれの特徴を示す特徴情報を取得する情報取得部と、
    前記対象の選択割合に基づいて重み付けた前記複数の対象間での前記特徴情報の類似度に基づき、前記複数の対象間の類似度を算出する類似度算出部と、を備える
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記情報取得部は、
    前記特徴情報として特徴要素の分布を示す情報を取得し、
    前記類似度算出部は、
    前記複数の対象間での前記特徴要素の分布の類似度に基づき、前記複数の対象間の類似度を算出する
    ことを特徴とする請求項2に記載の情報処理装置。
  4. 前記対象は、前記検索結果の中から選択されたコンテンツまたは当該コンテンツのグループであり、
    前記特徴情報は、前記コンテンツに含まれる特徴要素の分布または前記グループの2以上のコンテンツに含まれる特徴要素の分布である
    ことを特徴とする請求項3に記載の情報処理装置。
  5. 前記曖昧性判定部は、
    前記キーワード毎に前記類似度に対応する曖昧性情報を前記記憶部に記憶する
    ことを特徴とする請求項1〜4のいずれか一つに記載の情報処理装置。
  6. 新たに検索を行うために入力されたキーワードに対して、前記曖昧性情報から前記キーワードに対する曖昧度の情報を取得し、取得した曖昧度の情報に対応させた情報提供処理を行う情報提供部を有する
    ことを特徴とする請求項5に記載の情報処理装置。
  7. 前記情報提供部は、
    前記曖昧度と、予め設定した閾値とを比較し、前記曖昧度が前記閾値以上である場合に、前記キーワードに他の情報を補充し、補充した内容で検索を行い、前記曖昧度が前記閾値以上でない場合に、前記キーワードで検索を行う
    ことを特徴とする請求項6に記載の情報処理装置。
  8. 前記情報提供部は、
    前記曖昧度と、予め設定した閾値とを比較し、前記曖昧度が前記閾値以上である場合に、前記キーワードを送信した端末装置へ前記キーワードに補充する他の情報を提供する
    ことを特徴とする請求項6または7に記載の情報処理装置。
  9. コンピュータが実行する情報処理方法であって、
    検索時に用いられたキーワードと、当該キーワードを用いて検索された検索結果の中から選択された複数の対象に関する情報とを関連付けて検索履歴情報として記憶部に記憶する記憶工程と、
    前記記憶部に記憶された検索履歴情報に基づき、前記キーワードに対応する前記複数の対象間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を判定する曖昧性判定工程と、を含む
    ことを特徴とする情報処理方法。
  10. 検索時に用いられたキーワードと、当該キーワードを用いて検索された検索結果の中から選択された複数の対象に関する情報とを関連付けて検索履歴情報として記憶部に記憶する記憶手順と、
    前記記憶部に記憶された検索履歴情報に基づき、前記キーワードに対応する前記複数の対象間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を判定する曖昧性判定手順と、
    をコンピュータに実行させることを特徴とする情報処理プログラム。
JP2016030239A 2016-02-19 2016-02-19 情報処理装置、情報処理方法および情報処理プログラム Active JP6203304B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016030239A JP6203304B2 (ja) 2016-02-19 2016-02-19 情報処理装置、情報処理方法および情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016030239A JP6203304B2 (ja) 2016-02-19 2016-02-19 情報処理装置、情報処理方法および情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2017146926A JP2017146926A (ja) 2017-08-24
JP6203304B2 true JP6203304B2 (ja) 2017-09-27

Family

ID=59683221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016030239A Active JP6203304B2 (ja) 2016-02-19 2016-02-19 情報処理装置、情報処理方法および情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6203304B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7132479B2 (ja) * 2017-11-27 2022-09-07 キヤノンマーケティングジャパン株式会社 情報処理システム、その制御方法、及びプログラム、並びに、情報処理装置、その制御方法、及びプログラム
JP6924450B2 (ja) * 2018-11-06 2021-08-25 データ・サイエンティスト株式会社 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法
JP6739584B1 (ja) * 2019-04-22 2020-08-12 株式会社プレシジョン 情報処理装置、情報処理方法及び情報処理プログラム
US20230306034A1 (en) * 2020-11-04 2023-09-28 Datascientist Inc. Search needs evaluation program, search needs evaluation device and search needs evaluation method, and evaluation program, evaluation device and evaluation method
JP7262863B2 (ja) * 2020-11-04 2023-04-24 データ・サイエンティスト株式会社 検索ニーズ評価プログラム、検索ニーズ評価装置および検索ニーズ評価方法、ならびに、評価プログラム、評価装置および評価方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4008551B2 (ja) * 1997-11-07 2007-11-14 富士通株式会社 キーワード重み生成装置、キーワード重み生成方法及びコンピュータ読み取り可能な記録媒体
JP2003076694A (ja) * 2001-09-05 2003-03-14 Canon Inc 画像検索装置及びその方法、プログラム
US7620628B2 (en) * 2004-12-06 2009-11-17 Yahoo! Inc. Search processing with automatic categorization of queries
JP2009277154A (ja) * 2008-05-16 2009-11-26 Ntt Docomo Inc 情報検索装置及び情報検索方法
JP6056610B2 (ja) * 2013-03-29 2017-01-11 株式会社Jvcケンウッド テキスト情報処理装置、テキスト情報処理方法、及びテキスト情報処理プログラム

Also Published As

Publication number Publication date
JP2017146926A (ja) 2017-08-24

Similar Documents

Publication Publication Date Title
JP5436665B2 (ja) 同時選択画像の分類
US9830390B2 (en) Related entities
US9436707B2 (en) Content-based image ranking
JP6050327B2 (ja) 動的な画像表示領域およびウェブ検索結果内での画像表示
JP5736469B2 (ja) ユーザ意図の有無に基づく検索キーワードの推薦
US8341147B2 (en) Blending mobile search results
JP6203304B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
US9053158B1 (en) Method for human ranking of search results
US8620929B2 (en) Context based resource relevance
US8819006B1 (en) Rich content for query answers
US9116992B2 (en) Providing time series information with search results
US9183312B2 (en) Image display within web search results
US9613145B2 (en) Generating contextual search presentations
US20170097967A1 (en) Automated Customization of Display Component Data for Search Results
JP2020024674A (ja) 情報をプッシュするための方法及び装置
CN107704560B (zh) 一种信息推荐的方法、装置及设备
JP6956119B2 (ja) 文脈情報を提供するためのシステムおよび方法
US9916384B2 (en) Related entities
JP6728178B2 (ja) 検索データを処理するための方法及び装置
JP6433270B2 (ja) コンテンツ検索結果提供システム及びコンテンツ検索結果提供方法
US10055463B1 (en) Feature based ranking adjustment

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170518

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170829

R150 Certificate of patent or registration of utility model

Ref document number: 6203304

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250