JP5526934B2 - 情報検索装置、情報検索方法および情報検索プログラム - Google Patents

情報検索装置、情報検索方法および情報検索プログラム Download PDF

Info

Publication number
JP5526934B2
JP5526934B2 JP2010079206A JP2010079206A JP5526934B2 JP 5526934 B2 JP5526934 B2 JP 5526934B2 JP 2010079206 A JP2010079206 A JP 2010079206A JP 2010079206 A JP2010079206 A JP 2010079206A JP 5526934 B2 JP5526934 B2 JP 5526934B2
Authority
JP
Japan
Prior art keywords
group
information
content
unit
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010079206A
Other languages
English (en)
Other versions
JP2011210143A (ja
Inventor
彰 烏谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010079206A priority Critical patent/JP5526934B2/ja
Publication of JP2011210143A publication Critical patent/JP2011210143A/ja
Application granted granted Critical
Publication of JP5526934B2 publication Critical patent/JP5526934B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

この発明は、情報検索装置、情報検索方法および情報検索プログラムに関する。
従来、PC(personal computer)やPVR(Personal Video Recorder)などを利用するユーザの嗜好に合わせてテレビ番組やニュース番組などを検索し、検索した番組を推薦する技術が提案されている。この技術によれば、ユーザに検索の手間をかけさせることなく、テレビ番組やニュース番組を簡単に視聴や録画させることが可能となる。
ユーザの嗜好に合わせて番組を検索する技術には、例えば、以下に説明する従来技術1や従来技術2が存在する。
従来技術1は、ユーザの嗜好に応じて予め定めたキーワードなどの検索条件に合致する番組を検索する、いわゆるブーリアン検索を行う技術である。この従来技術1は、番組のタイトルや詳細情報、ジャンルなどの中に、予め定められたキーワードが含まれる番組を検索する。この従来技術1は、キーワードによる検索にヒットした番組をユーザに推薦するだけなので、ユーザが検索結果から所望の番組を見つけにくいという問題がある。
また、従来技術2は、ユーザの番組録画履歴や番組視聴履歴から、ユーザの嗜好に合う番組のベクトルを算出し、算出したベクトルに基づいて番組を検索する技術である。この従来技術2は、ユーザが録画した番組や視聴した番組のタイトルや詳細情報、ジャンルなどに共通するキーワードなどを抽出し、抽出したキーワードに重みを付与する。次に、従来技術2は、キーワードに付与された重みを用いて、ユーザの嗜好と番組との距離を用いて計算し、ユーザの嗜好との距離が近い番組、言い換えれば、ユーザの嗜好により合致した番組ほど高いスコアがつくようにスコアを付与する。そして、従来技術2は、例えば、スコアの高い番組を検索し、検索結果をランク付けしてユーザに推薦する。よって、従来技術2は、上述した従来技術1に比較して、ユーザが検索結果から所望の番組を見つけやすいという特徴がある。
特開2008−123210号公報 特開2003−114903号公報 特許第3714310号公報
しかしながら、上述した従来技術2は、番組の検索結果が嗜好性の強い番組に偏ってしまい、番組の検索結果から多様性が失われてしまうという問題があった。
ユーザは、検索結果として従来技術2により検索された番組のうち、上位にランク付けされた番組から順に確認するのが一般的である。そして、検索結果が膨大であれば、検索結果としてユーザに提供された番組のうち、下位にランク付けされている番組にまでは、ユーザの確認が行き届かない可能性も十分に考えられる。結果として、上位にランク付けされた番組ばかりを、ユーザが録画あるいは視聴する傾向が強くなくことも予想される。
従来技術2は、上述したように、ユーザの番組録画や番組視聴履歴を用いて番組の検索処理を行う。よって、上位にランク付けされた番組についての番組録画履歴や番組視聴履歴だけが偏って増加すれば、上位にランク付けされた番組と同一の嗜好性を有する番組だけが、検索結果として常に上位にランク付けされることとなる。一方、上位にランク付けされた番組と嗜好性が異なる番組は、検索結果として常に下位にランク付けされてしまう。つまり、従来技術2では、ユーザの嗜好に合わせて番組を検索する場合に、番組の検索結果から多様性が失われてしまう。
また、嗜好に合わせた番組を推薦してもらう技術を利用するユーザからは、ドラマだけでなく、例えば、映画やバラエティなど、嗜好に含まれる様々な番組を推薦して欲しいとの要請がある。しかしながら、上述した従来技術2では、番組検索の多様性が失われてしまうので、このユーザの要請には答えられないのが現状である。
今後、放送の地上デジタル化やインターネットを利用した動画配信などの進展により、検索対象となる番組数が増えれば、上述した従来技術2の問題点がより顕在化することが予想される。
開示の技術は、上記に鑑みてなされたものであって、ユーザの多様な嗜好を反映した番組の検索結果をユーザに提供することが可能な情報検索装置、情報検索方法および情報検索プログラムを提供することを目的とする。
本願の開示する技術は、一つの態様において、操作履歴記憶部と、評価情報生成部と、履歴分類部と、比率算出部と、グループ評価情報生成部と、ソート部と、抽出部と、表示出力部とを有する。操作履歴記憶部は、コンテンツに関するユーザの操作ごとに操作内容と操作対象とを対応づけた操作履歴を記憶する。評価情報生成部は、操作履歴記憶部に記憶されている各操作履歴に含まれる操作対象の情報を用いて、操作履歴ごとに、該操作履歴に残されるコンテンツの内容を複数の評価軸で評価した評価情報をそれぞれ生成する。履歴分類部は、操作履歴記憶部に記憶されている各操作履歴に含まれる操作対象の情報から、該操作対象に共通して出現する頻度の高いキーワードを抽出する。そして、履歴分類部は、抽出されたキーワードごとに、該キーワードを有する操作履歴を第1グループにそれぞれ分類する。さらに、履歴分類部は、分類された第1グループごとに階層的クラスタリングを行うことにより、複数の第1グループをさらに複数の第2グループにそれぞれ分類する。比率算出部は、操作履歴全体の大きさに対して履歴分類部により分類された第2グループの大きさが占有する比率を該第2グループごとにそれぞれ算出する。グループ評価情報生成部は、評価情報生成部により生成された評価情報を、履歴分類部により分類された第2グループごとに統合することにより、該第2グループごとに、該第2グループにおけるコンテンツのユーザ嗜好を示すグループ評価情報を生成する。ソート部は、検索対象となるコンテンツの中から、グループ評価情報生成部により生成されたグループ評価情報に合致するコンテンツの情報を第2グループごとに検索する。そして、ソート部は、検索されたコンテンツの情報を該グループ評価情報と相関性の高い順に該第2グループ内でそれぞれソートする。抽出部は、ソート部により第2グループ内でそれぞれソートされたコンテンツの情報の中から、比率算出部により算出された比率に応じた件数分のコンテンツの情報を、該第2グループごとに、グループ評価情報と相関性の高いものからそれぞれ抽出する。表示出力部は、抽出部により抽出されたコンテンツの情報をマージして表示出力する。
本願の開示する技術の一つの態様によれば、ユーザの多様な嗜好を反映したコンテンツの検索結果をユーザに提供できる。
図1は、実施例1に係る情報検索装置の構成を示す図である。 図2は、実施例2に係る情報検索装置を示す図である。 図3は、操作履歴記憶部102に記憶される情報例を示す図である。 図4は、履歴グルーピング部104の処理の概要を示す図である。 図5は、履歴グルーピング部104により生成される操作履歴のインデックスの一例を示す図である。 図6は、履歴グルーピング部104によるキーワードの抽出例を示す図である。 図7は、履歴グルーピング部104により実行されるキーワードに応じた操作履歴の分類例を示す図である。 図8は、履歴グルーピング部104により実行される階層的クラスタリングの概念図である。 図9は、嗜好抽出部105により抽出される嗜好の一例を示す図である。 図10は、グルーピング比率保管部106により保存されるデータ例を示す図である。 図11は、推奨コンテンツ検索部107により検索されるコンテンツの情報例を示す図である。 図12は、推奨コンテンツマージ部108により実行されるコンテンツ情報のマージの概念図である。 図13は、推奨コンテンツマージ部108によるコンテンツの情報の再評価結果の一例を示す図である。 図14は、推奨コンテンツフィードバック部109により操作履歴に記録される操作内容の一例を示す図である。 図15は、操作内容と操作内容に応じた係数との対応関係を示す図である。 図16は、履歴グルーピング部104により実行されるキーワードに応じた操作履歴の分類処理の流れを示す図である。 図17は、履歴グルーピング部104により実行される階層的クラスタリング処理の流れを示す図である。 図18は、グルーピング比率保管部106により実行される比率保存処理の流れを示す図である。 図19は、嗜好抽出部105により実行される嗜好抽出処理の流れを示す図である。 図20は、推奨コンテンツ検索部107により実行されるコンテンツ検索処理の流れを示す図である。 図21は、推奨コンテンツマージ部108により実行されるコンテンツ情報のマージ処理の流れを示す図である。 図22は、推奨コンテンツマージ部108によるコンテンツの情報の再評価処理の流れを示す図である。 図23は、推奨コンテンツフィードバック部109により実行される操作内容記録処理の流れを示す図である。 図24は、履歴グルーピング部104により実行されるインデックス生成処理の流れを示す図である。 図25は、情報検索プログラムを実行するコンピュータの一例を示す図である。
以下に、図面を参照しつつ、本願の開示する情報検索装置、情報検索方法および情報検索プログラムの一実施形態について詳細に説明する。なお、本願の開示する情報検索装置、情報検索方法および情報検索プログラムの一実施形態として後述する実施例により、本願が開示する技術が限定されるものではない。
図1は、実施例1に係る情報検索装置50を示す図である。図1に示すように、実施例1に係る情報検索装置50は、操作履歴記憶部51と、評価情報生成部52と、履歴分類部53と、比率算出部54と、グループ評価情報生成部55と、ソート部56と、抽出部57と、表示出力部58とを有する。
操作履歴記憶部51は、コンテンツに関するユーザの操作ごとに操作内容と操作対象とを対応づけた操作履歴を記憶する。評価情報生成部52は、操作履歴記憶部51に記憶されている各操作履歴に含まれる操作対象の情報を用いて、操作履歴ごとに、該操作履歴に残されるコンテンツの内容を複数の評価軸で評価した評価情報をそれぞれ生成する。
履歴分類部53は、操作履歴記憶部51に記憶されている各操作履歴に含まれる操作対象の情報から、該操作対象に共通して出現する頻度の高いキーワードを抽出する。そして、履歴分類部53は、該キーワードを有する操作履歴をグループ化して抽出されたキーワードごとの第1グループにそれぞれ分類する。さらに、履歴分類部53は、分類された第1グループごとに階層的クラスタリングを行うことにより、各第1グループを複数の第2グループにそれぞれ分類する。
比率算出部54は、操作履歴全体の大きさに対して履歴分類部53により分類された第2グループの大きさが占有する比率を該第2グループごとにそれぞれ算出する。グループ評価情報生成部55は、評価情報生成部52により生成された評価情報を、履歴分類部53により分類された第2グループごとに統合することで、該第2グループにおけるコンテンツのユーザ嗜好を示すグループ評価情報をそれぞれ生成する。
ソート部56は、検索対象となるコンテンツの中から、グループ評価情報生成部55により生成されたグループ評価情報に合致するコンテンツの情報を第2グループごとに検索する。そして、ソート部56は、検索されたコンテンツの情報を該グループ評価情報と相関性の高い順に該第2グループ内でそれぞれソートする。
抽出部57は、ソート部56によりソートされたコンテンツの情報の中から、比率算出部54により算出された比率に応じた件数分のコンテンツの情報を、第2グループごとに、グループ評価情報と相関性の高いものからそれぞれ抽出する。表示出力部58は、抽出部57により抽出されたコンテンツの情報をマージして表示出力する。
上述してきたように、実施例1に係る情報検索装置50は、例えば、コンテンツに関するユーザの操作履歴に共通して出現するキーワードにより、操作履歴を予め分類した後、分類された各操作履歴を階層的クラスタリングによりグルーピングする。そして、次に、情報検索装置50は、全操作履歴の大きさに対して、操作履歴の各グループの大きさが占める比率をそれぞれ算出する。また、情報検索装置50は、各グループの含まれるコンテンツの情報からユーザの嗜好を示すグループ評価情報をそれぞれ生成する。続いて、情報検索装置50は、各グループのグループ評価情報に応じたコンテンツの情報をそれぞれ検索し、各グループの検索結果から、各グループの比率に応じた分の検索結果を抽出する。そして、情報検索装置50は、抽出結果をマージして表示出力する。このようなことから、実施例1によれば、ユーザの多様な嗜好を反映したコンテンツの検索結果をユーザに提供できる。
[情報検索装置の構成(実施例2)]
図2は、実施例2に係る情報検索装置の構成を示す図である。図2に示すように、実施例2に係る情報検索装置100は、表示出力部101と、操作履歴記憶部102と、コンテンツデータ記憶部103と、履歴グルーピング部104と、嗜好抽出部105と、グルーピング比率保管部106を有する。また、情報検索装置200は、推奨コンテンツ検索部107と、推奨コンテンツマージ部108と、推奨コンテンツフィードバック部109とを有する。なお、情報処理装置100は、例えば、PC(personal computer)やPVR(Personal Video Recorder)などに該当する。なお、情報検索装置100は、テレビ番組や動画などのコンテンツを検索対象とするが、以下の説明では、テレビ番組を例に挙げて説明する。
表示出力部101は、ユーザに推奨するテレビ番組の情報を表示出力する。表示出力部101は、ユーザに推奨するテレビ番組の情報を推奨コンテンツマージ部108から取得する。
操作履歴記憶部102は、テレビ番組に関するユーザの操作履歴をそれぞれ記憶する。操作履歴記憶部102は、操作履歴ごとに一意に付与されるIDと、ユーザの操作があった操作日時と、ユーザの操作内容と、テレビ番組のジャンルや番組名などに該当する操作対象とを対応付けて記憶する。
図3は、操作履歴記憶部102に記憶される情報例を示す図である。例えば、操作履歴記憶部102は、「ID:1」と、「操作日時:2009/05/08 22:00」と、「操作内容:録画」と、「操作対象:ドラマ,番組1」とを対応付けて記憶する。また、図3に示すように、操作履歴記憶部102は、「ID:2」と、「操作日時:2009/05/08 22:10」と、「操作内容:録画」と、「操作対象:ドラマ,番組2」とを対応付けて記憶する。また、図3に示すように、操作履歴記憶部102は、「ID:3」と、「操作日時:2009/05/09 21:00」と、「操作内容:録画」と、「操作対象:バラエティ,番組3」とを対応付けて記憶する。また、図3に示すように、操作履歴記憶部102は、「ID:4」と、「操作日時:2009/05/10 21:30」と、「操作内容:録画」と、「操作対象:バラエティ,番組4」とを対応付けて記憶する。
また、図3に示すように、操作履歴記憶部102は、「ID:5」と、「操作日時:2009/05/12 23:00」と、「操作内容:録画」と、「操作対象:ドラマ,番組5」とを対応付けて記憶する。また、図3に示すように、操作履歴記憶部102は、「ID:ドラマ,6」と、「操作日時:2009/05/12 23:05」と、「操作内容:録画」と、「操作対象:番組6」とを対応付けて記憶する。また、図3に示すように、操作履歴記憶部102は、「ID:7」と、「操作日時:2009/05/24 13:00」と、「操作内容:録画」と、「操作対象:バラエティ,番組7」とを対応付けて記憶する。また、図3に示すように、操作履歴記憶部102は、「ID:8」と、「操作日時:2009/05/24 13:08」と、「操作内容:録画」と、「操作対象:ドラマ,番組8」とを対応付けて記憶する。
また、図3に示すように、操作履歴記憶部102は、「ID:9」と、「操作日時:2009/06/01 13:00」と、「操作内容:録画」と、「操作対象:料理,番組9」とを対応付けて記憶する。また、図3に示すように、操作履歴記憶部102は、「ID:10」と、「操作日時:2009/06/01 14:00」と、「操作内容:録画」と、「操作対象:教育,番組10」とを対応付けて記憶する。また、図3に示すように、操作履歴記憶部102は、「ID:11」と、「操作日時:2009/06/07 15:00」と、「操作内容:録画」と、「操作対象:ドラマ,番組11」とを対応付けて記憶する。なお、上述した「〜,番組〜」は、テレビ番組のジャンルや番組名などのテキストデータに該当する。
コンテンツデータ記憶部103は、ユーザに推奨するために検索対象となるテレビ番組の情報を記憶する。コンテンツデータ記憶部103は、例えば、ネットワークなどを介して取得された最新のテレビ番組のデータを記憶するものとする。
上述した操作履歴記憶部102およびコンテンツデータ記憶部103は、例えば、RAM(Random Access Memory)やフラッシュメモリ(flash memory)などの半導体メモリ素子に該当する。
履歴グルーピング部104は、テレビ番組に関するユーザの操作履歴に共通して出現するキーワードにより、操作履歴を予めグルーピングする。図4を用いて、履歴グルーピング部104による処理の概要を説明する。図4は、履歴グルーピング部104の処理の概要を示す図である。
例えば、履歴グルーピング部104は、図4に示すように、操作履歴記憶部102に記憶されている操作履歴4−1から、ジャンルや番組名など、テレビ番組のメタデータに対応する情報を取得し、取得した情報を用いて、操作履歴のインデックスを生成する。次に、履歴グルーピング部104は、所定のキーワードにより操作履歴を分類し、分類された操作履歴を階層的にクラスタリングすることにより、操作履歴を複数のグループに分ける。ここで、メタデータとは、例えば、テレビ番組や動画のジャンルや番組名、番組詳細情報などを記したテキストデータに該当する。なお、以下において、「操作対象」と表記するものは、上述したメタデータに対応するものとする。
まず、インデックスの生成について具体的に説明する。ここで、インデックスとは、操作対象として操作履歴に含まれるテレビ番組の番組名などから、テレビ番組の内容が多次元からなる複数の評価軸で評価されたベクトルに該当する。
履歴グルーピング部104は、操作履歴記憶部102に記憶されている操作履歴を取得し、取得した操作履歴に含まれる操作対象を解析する。例えば、履歴グルーピング部104は、テキストデータを形態素解析やn−gram解析にかけることにより、テキストデータをキーワードに分解する。次に、履歴グルーピング部104は、各キーワードが操作対象中に出現する頻度などからなる統計量を計算し、計算した統計量により各キーワードを重み付けする。
統計量としては、例えば、TF(Term Frequency)やDF(Document Frequency)、TFとDFの逆数の積などを用いる。TFとは、例えば、操作対象として操作履歴に残されたテレビ番組のジャンルや番組名、番組詳細情報などのテキストデータ中に特定のキーワードが出現する頻度に該当する。DFとは、操作対象として操作履歴に残されたテレビ番組のテキストデータや検索対象となるテレビ番組のテキストデータなど、インデックスの作成対象となる全てのテキストデータのうち、特定のキーワードを含むテキストデータの数に該当する。
キーワード重み付けを終えると、履歴グルーピング部104は、ベクトル空間法を用いて、操作履歴のインデックスを生成する。例えば、履歴グルーピング部104は、抽出したキーワードをベクトルの基底とし、各キーワードの統計量を、そのベクトルの要素の値として、各操作対象についてベクトルを作成し、作成したベクトルを操作履歴のインデックスとする。
図5は、履歴グルーピング部104により生成される操作履歴のインデックスの一例を示す図である。図5に示す5−1〜5−3は、テレビ番組の内容を評価するための座標軸をそれぞれ表す。図5に示す5−4〜5−7は、各操作履歴のインデックスを表す。図5に示すように、履歴グルーピング部104により生成される操作履歴のインデックスは、操作履歴ごとにユニークなベクトルとなる。以上で、履歴グルーピング部104によるインデックスの生成の説明を終える。
次に、所定のキーワードによる操作履歴の分類について具体的に説明する。履歴グルーピング部104は、操作履歴記憶部102に記憶されている操作履歴を全て取得し、取得した操作履歴のそれぞれに含まれる操作対象から、DF(Document Frequency)の高いキーワードを抽出する。ここで、履歴グルーピング部104は、操作履歴のそれぞれに含まれる操作対象に限定したDFを用いる。すなわち、操作履歴のそれぞれに含まれる操作対象のテキストデータに共通して頻出するキーワードのみを抽出する趣旨である。なお、DFの高さを判断するための閾値は予め定めるものとする。
図6は、履歴グルーピング部104によるキーワードの抽出例を示す図である。図6に示すように、履歴グルーピング部104は、操作履歴記憶部102に記憶されている操作対象に共通して頻出するキーワードとして、「ドラマ」、「バラエティ」、「料理」、「教育」、「土曜」、「温泉」、「英会話」などが抽出される。そして、図6には、例えば、「ドラマ」、「バラエティ」、「料理」、「教育」、「土曜」、「温泉」、「英会話」・・・の順に、操作対象に共通して頻出するキーワードであることが示されている。
キーワードの抽出後、履歴グルーピング部104は、抽出したDFの高いキーワードを用いて、操作履歴記憶部102に記憶されている操作履歴を分類する。履歴グルーピング部104は、抽出したキーワードごとに、同一のキーワードを含む操作対象を操作履歴記憶部102の中から抽出し、抽出した操作対象に対応する操作履歴を同一のグループに分類する。なお、履歴グルーピング部104は、排他的あるいは非排他的、いずれの分類を行ってもよい。例えば、排他的な分類を行う場合には、既にあるグループにまとめられた操作対象は他のグループには分類されない。一方、非排他的な分類を行う場合には、操作対象は複数のグループに分類される。
図7は、履歴グルーピング部104により実行されるキーワードに応じた操作履歴の分類例を示す図である。図7には、キーワードと、キーワードにより分類された操作履歴との対応関係を示している。図7に示すように、例えば、「キーワード:ドラマ」に対応するグループとして、「ID:1、番組1」、「ID:2、番組2」、「ID:5、番組5」「ID:6、番組6」「ID:8、番組8」「ID:11、番組11」の操作履歴が分類される。また、図7に示すように、「キーワード:バラエティ」に対応するグループとして、「ID:3、番組3」、「ID:4、番組4」、「ID:7、番組7」の操作履歴が分類される。また、図7に示すように、「キーワード:料理」に対応するグループとして、「ID:9、番組9」の操作履歴が分類される。また、図7に示すように、「キーワード:教育」に対応するグループとして、「ID:10、番組10」の操作履歴が分類される。以上で、履歴グルーピング部104による操作履歴の分類の説明を終える。
次に、分類された各グループの階層的クラスタリングについて具体的に説明する。履歴グルーピング部104は、各操作履歴をクラスタに割り当て、その操作履歴のインデックスをクラスタのインデックスとして、クラスタ同士の類似性を評価する。そして、履歴グルーピング部104は、クラスタ同士の類似度合が閾値以上の場合には、それらのクラスタを結合して新たなクラスタを生成する。なお、クラスタ同士の類似性は、クラスタのインデックスの相関係数、例えば、ベクトルの内積や角度を用いて評価する。
履歴グルーピング部104は、新しいクラスタができた場合には、新しいクラスタに含まれる操作履歴のインデックスの総和、例えば、ベクトル和を求めて、求めたインデックスの総和を新しいクラスタのインデックスとする。履歴グルーピング部104は、ここまでの処理を、結合されるクラスタがなくなるまで繰り返し実行する。なお、クラスタ同士の結合は、最初に類似度合が閾値を超えたクラスタ同士を結合してもよいし、類似度合が閾値以上で最も高かったクラスタ同士を結合してもよい。
そして、履歴グルーピング部104は、最終的に生成されたクラスタを、操作履歴の分類結果、つまり操作履歴のグループとし、各グループの大きさを抽出する。ここで、グループの大きさとは、各グループに含まれる操作履歴の件数、クラスタの密度と件数を乗じた値、クラスタのインデックスのノルム、つまり、クラスタ内の操作履歴のインデックスの総和などを用いることができる。
図8は、履歴グルーピング部104により実行される階層的クラスタリングの概念図である。図8には、たとえば、上述した図7に示すキーワード「ドラマ」に対応付けて分類された「ID:1、番組1」〜「ID:11、番組11」の操作履歴の階層的クラスタリングの概念が表されている。図8に示す「C(1,1)」〜「C(1,6)」、「C(1,1)´」〜「C(1,3)´」、「C(1,1)´´」〜「C(1,2)´´」は、各クラスタを表す。図8に示す「r」は、各クラスタのインデックスを表す。なお、クラスタを結合した場合のインデックスは、クラスタを結合する側のインデックスを用いるものとする。また、図8に示すcn(x,y)は、クラスタの大きさを表す。x,yは、自然数である。
図8に示すように、履歴グルーピング部104は、操作履歴「ID:1、番組1」〜「ID:11、番組11」の操作履歴にクラスタ「C(1,1)」〜「C(1,6)」をそれぞれに割り当てる。そして、履歴グルーピング部104は、その操作履歴のインデックスをクラスタのインデックスとして、「C(1,1)」と「C(1,4)」、「C(1,2)」と「C(1,6)」、「C(1,3)」と「C(1,5)」のクラスタ同士の類似性を評価する。
そして、図8に示すように、履歴グルーピング部104は、クラスタ同士の類似度合が閾値以上である「C(1,1)」のクラスタと「C(1,4)」のクラスタとを結合して新たなクラスタ「C(1,1)´」を生成する。同様に、履歴グルーピング部104は、クラスタ同士の類似度合が閾値以上である「C(1,2)」のクラスタと「C(1,6)」のクラスタとを結合して新たなクラスタ「C(1,2)´」を生成する。同様に、履歴グルーピング部104は、クラスタ同士の類似度合が閾値以上である「C(1,3)」のクラスタと「C(1,5)」のクラスタとを結合して新たなクラスタ「C(1,3)´」を生成する。
さらに、図8に示すように、履歴グルーピング部104は、クラスタ同士の類似度合が閾値以上である「C(1,1)´」のクラスタと「C(1,2)´」のクラスタとを結合して新たなクラスタ「C(1,1)´´」を生成する。また、履歴グルーピング部104は、類似度値が閾値以上であるクラスタがない「C(1,3)´」を、そのまま新たなクラスタ「C(1,2)´´」とする。そして、履歴グルーピング部104は、これ以上クラスタリングできないので、最終的なクラスタ「C(1,1)´´」の大きさcn(1,1)=4,「C(1,2)´´」の大きさをそれぞれcn(1,1)=2をそれぞれ求める。そして、履歴グルーピング部104は階層的クラスタリングを終了する。以上で、履歴グルーピング部104による階層的クラスタリングの説明を終える。
嗜好抽出部105は、履歴グルーピング部104によりクラスタリングされた操作履歴の各グループについて、グループに属する操作履歴のインデックスを統合することにより、各グループにおけるユーザの嗜好を求める。例えば、嗜好抽出部105は、グループ内の各操作履歴のインデックスを表すベクトルの総和を求める。
図9は、嗜好抽出部105により抽出される嗜好の一例を示す図である。図9に示す9−1〜9−3は、テレビ番組の内容を評価するための座標軸をそれぞれ表す。図9に示す9−4〜9−7は、あるグループに属する各操作履歴のインデックスをそれぞれ表す。図9に示すように、グループに属する操作履歴のインデックス9−4〜9−7を統合することによって嗜好抽出部105により求められるユーザの嗜好は、例えば、図9に示す9−8のようになる。上述してきたように、嗜好抽出部105は、従来のようにユーザの好みを一つの嗜好で表すのではなく、ユーザが有する様々な好みをいくつかの嗜好として表すことができる。よって、ユーザの薄い嗜好に対しても他の嗜好に埋もれることなく、嗜好を抽出することができる。
グルーピング比率保管部106は、履歴グルーピング部104により求められた操作履歴の各グループの大きさをそれぞれ保管する。この時、グルーピング比率保管部106は、各グループの大きさだけでなく、操作履歴全体の大きさ全体に対する各グループの比率を求め、求めた各比率をグループに対応付けて内部的な記憶部に保管する。
図10は、グルーピング比率保管部106により保存されるデータ例を示す図である。グルーピング比率保管部106は、クラスタ番号と、クラスタに属する操作履歴と、クラスタの大きさとを対応付けて保管する。例えば、図10に示すように、クラスタ番号「C(1,1)」と、操作履歴(「ID:1,番組1」,「ID:2,番組2」,「ID6:番組6」,「ID:11,番組11」)と、クラスタの大きさ「4,(37%)」とを対応付けて記憶する。また、図10に示すように、クラスタ番号「C(1,2)」と、操作履歴(「ID:5,番組5」,「ID:8,番組8」)と、クラスタの大きさ「2,(18%)」とを対応付けて記憶する。また、図10に示すように、クラスタ番号「C(2,1)」と、操作履歴(「ID:3,番組3」,「ID:4,番組4」)と、クラスタの大きさ「2,(18%)」とを対応付けて記憶する。また、図10に示すように、クラスタ番号「C(3,1)」と、操作履歴(「ID:7,番組7」,「ID:9,番組9」,「ID:10,番組10」)と、クラスタの大きさ「3,(27%)」とを対応付けて記憶する。
なお、グルーピング比率保管部106は、クラスタの大きさとして、例えば、クラスタリングされた各グループに属する操作履歴の件数と、操作履歴全件数に対して各グループに属する操作履歴の件数が占有する比率とを保管する。グルーピング比率保管部106は、例えば、図10に示す場合では、クラスタ番号「C(1,1)」について、クラスタ番号「C(1,1)」のグループの属する操作履歴の件数「4」と、このグループの比率「37%」とをクラスタの大きさとして保管する。
推奨コンテンツ検索部107は、嗜好抽出部105により求められた各グループにおけるユーザの嗜好、つまりインデックスを用いて、グループごとに、グループにおけるユーザの嗜好に応じたテレビ番組を検索する。このとき、コンテンツデータ記憶部103に記憶されている検索対象となるテレビ番組についてもインデックスを予め求めておく。そして、推奨コンテンツ検索部107は、操作履歴の各グループのインデックスと検索対象となるテレビ番組との類似度合を評価する。この類似度合は、操作履歴のインデックス、つまりユーザの嗜好と検索対象となるテレビ番組のインデックスとの相関係数のスコアにより評価する。相関係数は、例えば、ベクトルの内積や角度に基づいて算出される。操作履歴のインデックスと検索対象となるテレビ番組のインデックスとの相関係数が高いほど、ユーザの嗜好と検索対象となるテレビ番組の類似度合が高いものとし、ユーザの嗜好によりマッチングしたテレビ番組であると評価する。推奨コンテンツ検索部107は、相関係数が高い、つまり類似度合が高い検索結果から降順にソートする。
図11は、推奨コンテンツ検索部107により検索されるコンテンツの情報例を示す図である。図11に示すように、推奨コンテンツ検索部107は、相関係数が高い、つまり類似度合が高い検索結果から降順にソートする。例えば、図11に示すように、相関係数が最も高い相関係数「0.70」、放送日時「2009/05/15 23:15」、ジャンル「ドラマ:国内ドラマ」、番組名「番組12」の検索結果が最上段にソートされる。そして、相関係数が最も低い相関係数「0.50」、放送日時「2009/05/08 23:15」、ジャンル「ドラマ:国内ドラマ」、番組名「番組17」の検索結果が最下段にソートされる。
推奨コンテンツマージ部108は、推奨コンテンツ検索部107による各グループについてのテレビ番組の検索結果をマージすることにより最終的なテレビ番組の検索結果を作成する。
図12は、推奨コンテンツマージ部108により実行されるコンテンツ情報のマージの概念図である。例えば、推奨コンテンツマージ部108は、グルーピング比率保管部106から各グループの比率を取得し、最終的な検索結果の提示件数に対して、グループごとに何件の検索結果を提示するかを求める。例えば、図12に示すように、推奨コンテンツマージ部108は、最終的な検索結果の提示件数「30件」と、クラスタC(1,1)に対応する操作履歴のグループの比率「37%」とを用いて、このグループからの検索結果の提示件数「11件」を求める。
また、図12に示すように、推奨コンテンツマージ部108は、最終的な検索結果の提示件数「30件」と、クラスタC(1,2)に対応する操作履歴のグループの比率「18%」とを用いて、このグループからの検索結果の提示件数「5件」を求める。また、図12に示すように、推奨コンテンツマージ部108は、最終的な検索結果の提示件数「30件」と、クラスタC(2,1)に対応する操作履歴のグループの比率「18%」とを用いて、このグループからの検索結果の提示件数「5件」を求める。同様の手順で、推奨コンテンツマージ部108は、グループごとに何件の検索結果を提示するかを求める。なお、上述した最終的な検索結果の提示件数「30件」はあくまで一例であり、任意に決定できる。
続いて、推奨コンテンツマージ部108は、各グループについての検索結果のうち相関係数が上位のものから、各グループの提示件数分の検索結果を取り出し、取り出した検索結果をマージする。例えば、図12に示すように、推奨コンテンツマージ部108は、スコア「0.80」〜番組名「番組12」から、スコア「0.55」〜番組名「番組15」までの検索結果をマージする。このとき、推奨コンテンツマージ部108は、テレビ番組の属性、つまり番組の放送日時や長さ、チャンネルやジャンルなどを用いて検索結果をソートした上でマージしてもよい。
なお、推奨コンテンツ検索部107により求められた相関係数のスコアは、各グループの嗜好を用いて検索対象を評価した類似度合であるので評価軸が異なる。よって、推奨コンテンツマージ部108は、相関係数のスコアを用いて検索結果をソートすることは厳密にはできない。そこで、ユーザの嗜好全体に対する各検索結果の類似度合を再評価することにより、各検索結果の最終的な相関係数のスコアを求めて、求めたスコアに基づいて各検索結果を最終的にソートする。例えば、推奨コンテンツマージ部108は、操作履歴のインデックス、もしくは操作履歴のグループのインデックスを統合することによりユーザの全体的な嗜好を求める。続いて、推奨コンテンツマージ部108は、ユーザの全体的な嗜好を用いて、推奨コンテンツ検索部107によりグループごとに検索された検索結果を再評価することにより、ユーザの全体的な嗜好に対する各検索結果の類似度合を求める。そして、推奨コンテンツマージ部108は、類似度合として求められた相関係数のスコアを用いて、推奨コンテンツ検索部107によりグループごとに検索された検索結果をランク付けし、相関係数のスコアの高いものから降順にソートする。
図13は、推奨コンテンツマージ部108によるコンテンツの情報の再評価結果の一例を示す図である。例えば、図13に示すように、推奨コンテンツマージ部108は、検索結果の再評価の結果、スコア「0.70」〜番組名「番組12」から、スコア「0.55」〜番組名「番組15」を順にソートした上でマージする。検索結果の再評価の結果、図13に示す検索結果のマージ結果と、図12に示す検索結果のマージ結果との間で、検索結果のスコアの値および検索結果のソート順が異なるものが出てくる。
テレビ番組の検索結果に対してユーザにより行われた操作を操作履歴に反映する。例えば、推奨コンテンツフィードバック部109は、検索結果の番組を録画や視聴など、ユーザにより肯定的な操作が行われた場合には、その検索結果はユーザにとって正解であったと判断する。そして、推奨コンテンツフィードバック部109は、履歴グルーピング部104によりグルーピングが実行される場合に、正解の検索結果が得られた操作履歴のグループの比率が高くなるように、ポジディブなフィードバックを行う。
一方、推奨コンテンツフィードバック部109は、検索結果の番組に対して否定的な操作がユーザにより行われた場合は、その検索結果はユーザにとって不正解であったと判断する。そして、推奨コンテンツフィードバック部109は、履歴グルーピング部104によりグルーピングが実行される場合に、不正解の検索結果が得られた操作履歴のグループの比率が低くなるように、ネガティブなフィードバックを行う。
具体的には、推奨コンテンツフィードバック部109は、検索結果に対するユーザの操作を操作履歴記憶部102に記録しておく。図14は、推奨コンテンツフィードバック部109により操作履歴に記録される操作内容の一例を示す図である。例えば、図14に示すように、推奨コンテンツフィードバック部109は、検索結果に対するユーザの操作の履歴として、「ID:154」、「操作内容:検索結果を録画」を記録する。
また、推奨コンテンツフィードバック部109は、検索結果に対するユーザに操作内容に応じた係数を予め設定しておく。図15は、操作内容と操作内容に応じた係数との対応関係を示す図である。例えば、図15に示すように、推奨コンテンツフィードバック部109は、「操作内容:検索結果の録画」に対して「係数:1.2」を予め設定する。また、図15に示すように、推奨コンテンツフィードバック部109は、「操作内容:検索結果の視聴」に対して「係数:1.2」を予め設定する。また、図15に示すように、推奨コンテンツフィードバック部109は、「操作内容:検索結果の肯定評価」に対して「係数:2.0」を予め設定する。また、図15に示すように、推奨コンテンツフィードバック部109は、「操作内容:検索結果の否定評価」に対して「係数:−2.0」を予め設定する。
そして、推奨コンテンツフィードバック部109は、履歴グルーピング部104により操作履歴のインデックスの生成が行われる際に、検索結果に対するユーザの操作の操作履歴のインデックスに対して操作内容に応じた係数を乗算する。これにより、ユーザにより肯定的に評価された検索結果のインデックスは強く評価され、否定的に評価された検索結果のインデックスは低く評価されることとなる。この結果、履歴グルーピング部104によりグルーピングされた各グループのインデックスや大きさが変化することとなる。なお、それぞれの検索結果を含むグループのインデックスや大きさは、そのグループに属する操作履歴のインデックスや件数で定まる。よって、検索結果に対する操作履歴を有するグループに対して上述した係数を乗算することにより、グループに属する操作履歴の数に対しても検索結果に対するユーザの操作内容を反映させることもできる。
なお、履歴グルーピング部104、嗜好抽出部105、グルーピング比率保管部106、推奨コンテンツ検索部107、推奨コンテンツマージ部108、推奨コンテンツフィードバック部109は、例えば、電子回路や集積回路に該当する。電子回路としては、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)がある。また、集積回路としては、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などがある。
[情報検索装置による処理(実施例2)]
図16〜図24を用いて、実施例2に係る情報検索装置による処理の流れを説明する。まず、図16を用いて、履歴グルーピング部104により実行されるキーワードに応じた操作履歴の分類処理の流れを説明する。図16は、履歴グルーピング部104により実行されるキーワードに応じた操作履歴の分類処理の流れを示す図である。
図16に示すように、履歴グルーピング部104は、たとえば、番組検索の開始指示があると(ステップS1601,YES)、操作履歴Hのメタデータを、たとえばN個取得する(ステップS1602)。なお、履歴グルーピング部104は、番組検索の開始指示があるまで、ステップS1601の判定結果をNOとして同じ判定を繰り返す。
次に、履歴グルーピング部104は、メタデータ中の操作対象情報、すなわちテキストデータから操作履歴のインデックスを生成する(ステップS1603)。続いて、履歴グルーピング部104は、メタデータ中の操作対象情報から出現頻度の高いキーワードKを、例えばM個抽出する(ステップS1604)。
次に、履歴グルーピング部104は、iに初期値を設定するとともに(ステップS1605)、jに初期値を設定する(ステップS1606)。そして、履歴グルーピング部104は、iがM以下であるか否かを判定する(ステップS1607)。判定の結果、iがM以下である場合には(ステップS1607,YES)、履歴グルーピング部104は、jがN以下であるか否かを判定する(ステップS1608)。判定の結果、jがN以下である場合には(ステップS1608,YES)、履歴グルーピング部104は、操作履歴H(j)の操作対象情報にK(i)を含むか否かを判定する(ステップS1609)。
判定の結果、操作履歴H(j)の操作対象情報にK(i)を含む場合には(ステップS1609,YES)、履歴グルーピング部104は、H(j)をK(i)のグループに追加する(ステップS1610)。そして、履歴グルーピング部104は、j=J+1として(ステップS1611)、上述したステップS1608に戻り、jがN以下であるか否かを判定する。
ここでステップS1609の説明に戻る。履歴グルーピング部104は、判定の結果、操作履歴H(j)の操作対象情報にK(i)を含まない場合には(ステップS1609,NO)、上述したステップS1611に移る。
ここでステップS1608の説明に戻る。履歴グルーピング部104は、判定の結果、jがN以下ではない場合には(ステップS1608,NO)、i=i+1として(ステップS1612)、上述したステップS1607に戻り、iがM以下であるか否かを判定する。判定の結果、iがM以下ではない場合には(ステップS1607、NO)、履歴グルーピング部104は、iを初期値にリセットし(ステップS1613)、iがM以下であるか否かを判定する(ステップS1614)。判定の結果、iがM以下である場合には(ステップS1614,YES)、履歴グルーピング部104は、階層的クラスタリング処理を行う(ステップS1615)。
そして、履歴グルーピング部104は、i=i+1として(ステップS1616)、上述したステップS1614に戻り、iがM以下であるか否かを判定する。ここでステップS1614の説明に戻る。判定の結果、iがM以下ではない場合には(ステップS1614、NO)、履歴グルーピング部104は、操作履歴の分類処理を終了する。
次に、図17を用いて、履歴グルーピング部104により実行される階層的クラスタリング処理の流れを説明する。図17は、履歴グルーピング部104により実行される階層的クラスタリング処理の流れを示す図である。
図17に示すように、履歴グルーピング部104は、iを初期値に設定し(ステップS1701)、iがM以下であるか否かを判定する(ステップS1702)。判定の結果、履歴グルーピング部104は、iがM以下である場合には(ステップS1702,YES)、キーワードK(i)のグループを抽出する(ステップS1703)。そして、履歴グルーピング部104は、jに初期値を設定し(ステップS1704)、jがN以下であるか否かを判定する(ステップS1705)。判定の結果、jがN以下である場合には(ステップS1705,YES)、履歴グルーピング部104は、操作履歴H(j)をスタートクラスタC(i,j)に設定する(ステップS1706)。
そして、履歴グルーピング部104は、j=j+1として(ステップS1707)、上述したステップS1705に戻り、jがN以下であるか否かを判定する。ここでステップS1705の説明に戻る。履歴グルーピング部104は、判定の結果、jがN以下ではない場合には(ステップS1705,NO)、以下のステップS1709〜1715により結合されるクラスタがあるか否かを判定する(ステップS1708)。判定の結果、結合されるクラスタがある場合には(ステップS1708,YES)、履歴グルーピング部104は、jがクラスタ数CN以下であるか否かを判定する(ステップS1709)。
判定の結果、jがクラスタ数CN以下である場合には(ステップS1709,YES)、履歴グルーピング部104は、k=j+1として(ステップS1710)、kがクラスタ数CN以下であるか否かを判定する(ステップS1711)。判定の結果、kがクラスタ数CN以下である場合には(ステップS1711,YES)、履歴グルーピング部104は、クラスタC(i,j)とクラスタC(i,k)との相関係数が規定の閾値以上であるか否かを判定する(ステップS1712)。判定の結果、クラスタC(i,j)とクラスタC(i,k)との相関係数が規定の閾値以上である場合には(ステップS1712,YES),履歴グルーピング部104は、クラスタC(i,j)とクラスタC(i,k)とを結合する(ステップS1713)。
次に、履歴グルーピング部104は、結合後のクラスタC(i,j)のインデックスを生成する(ステップS1714)。続いて、履歴グルーピング部104は、キーワードK(i)のグループからC(i,k)を除外した後、クラスタ数CNを更新する(ステップS1715)。そして、履歴グルーピング部104は、j=j+1として(ステップS1716)、上述したステップS1709に戻り、jがクラスタ数CN以下であるか否かを判定する。
ここでステップS1709の説明に戻る。履歴グルーピング部104は、判定の結果、jがクラスタ数CN以下ではない場合には(ステップS1709,NO)、上述したステップS1708に戻り、結合されるクラスタがあるか否かを判定する。ここでステップS1708の説明に戻る。履歴グルーピング部104は、判定の結果、結合されるクラスタがない場合には(ステップS1708,NO)、i=i+1として(ステップS1717)、上述したステップS1702に戻り、iがM以下であるか否かを判定する。
ここでステップS1702の説明に戻る。履歴グルーピング部104は、判定の結果、iがM以下ではない場合には(ステップS1702,NO)、階層的クラスタリング処理を終了する。
続いて、図18を用いて、グルーピング比率保管部106により実行される比率保存処理の流れを説明する。図18は、グルーピング比率保管部106により実行される比率保存処理の流れを示す図である。
図18に示すように、グルーピング比率保管部106は、iに初期値を設定するとともに(ステップS1801)、jに初期値を設定し(ステップS1802)、iがM以下であるか否かを判定する(ステップS1803)。判定の結果、iがM以下である場合には(ステップS1803,YES)、グルーピング比率保管部106は、jがN(i)以下であるか否かを判定する(ステップS1804)。N(i)は、クラスタC(i,j)のjの最大値を表す。
グルーピング比率保管部106は、判定の結果、jがN(i)以下である場合には(ステップS1804,YES)、クラスタC(i,j)の大きさを取得する(ステップS1805)。続いて、グルーピング比率保管部106は、全体、すなわちクラスタの大きさの総和に対するクラスタC(i,j)の大きさの比率を保存する(ステップS1806)。そして、グルーピング比率保管部106は、j=j+1として(ステップS1807)、上述したステップS1804に戻り、jがN(i)以下であるか否かを判定する。
ここでステップS1804の説明に戻る。グルーピング比率保管部106は、判定の結果、jがN(i)以下ではない場合には(ステップS1804,NO)、i=i+1として(ステップS1808)、上述したステップS1803に戻り、iがM以下であるか否かを判定する。ここでステップS1803の説明に戻る。グルーピング比率保管部106は、判定の結果、iがM以下ではない場合には(ステップS1803,NO)、比率保存処理を終了する。
次に、図19を用いて、嗜好抽出部105により実行される嗜好抽出処理の流れを説明する。図19は、嗜好抽出部105により実行される嗜好抽出処理の流れを示す図である。
図19に示すように、嗜好抽出部105は、iに初期値を設定するとともに(ステップS1901)、jに初期値を設定し(ステップS1902)、iがM以下であるか否かを判定する(ステップS1903)。判定の結果、iがM以下である場合には(ステップS1903,YES)、嗜好抽出部105は、jがN(i)以下であるか否かを判定する(ステップS1904)。N(i)は、クラスタC(i,j)のjの最大値を表す。
嗜好抽出部105は、判定の結果、jがN(i)以下である場合には(ステップS1904,YES)、クラスタC(i,j)に含まれる全ての操作履歴のインデックスを取得する(ステップS1905)。続いて、嗜好抽出部105は、取得したインデックスの総和、すなわちクラスタC(i,j)の嗜好を算出する(ステップS1906)。そして、嗜好抽出部105は、j=j+1として(ステップS1907)、上述したステップS1904に戻り、jがN(i)以下であるか否かを判定する。
ここでステップS1904の説明に戻る。嗜好抽出部105は、判定の結果、jがN(i)以下ではない場合には(ステップS1904,NO)、i=i+1として(ステップS1908)、上述したステップS1903に戻り、iがM以下であるか否かを判定する。ここでステップS1903の説明に戻る。嗜好抽出部105は、判定の結果、iがM以下ではない場合には(ステップS1903,NO)、嗜好抽出処理を終了する。
続いて、図20を用いて、推奨コンテンツ検索部107により実行されるコンテンツ検索処理の流れを説明する。図20は、推奨コンテンツ検索部107により実行されるコンテンツ検索処理の流れを示す図である。
図20に示すように、推奨コンテンツ検索部107は、クラスタC(i,j)の嗜好を抽出する(ステップS2001)。次に、推奨コンテンツ検索部107は、検索対象となるコンテンツ(l)をコンテンツデータ記憶部103から取得し、取得したコンテンツ(l)のインデックスを、例えばL個抽出する(ステップS2002)。
そして、推奨コンテンツ検索部107は、lがL以下であるか否かを判定する(ステップS2003)。判定の結果、lがL以下である場合には(ステップS2003,YES)、クラスタC(i,j)の嗜好とコンテンツ(l)の相関係数を算出する(ステップS2004)。次に、推奨コンテンツ検索部107は、クラスタC(i,j)の嗜好とコンテンツ(l)の相関係数が規定の閾値以上であるか否かを判定する(ステップS2005)。
推奨コンテンツ検索部107は、判定の結果、クラスタC(i,j)の嗜好とコンテンツ(l)の相関係数が規定の閾値以上である場合には(ステップS2005,YES)、次にように処理する。すなわち、推奨コンテンツ検索部107は、コンテンツ(l)の情報をクラスタC(i,j)の嗜好と相関性の高い検索結果として抽出する(ステップS2006)。
そして、推奨コンテンツ検索部107は、l=l+1として(ステップS2007)、上述したステップS2003に戻り、lがL以下であるか否かを判定する。ここでステップS2003の説明に戻る。推奨コンテンツ検索部107は、判定の結果、lがL以下ではない場合には(ステップS2003,NO)、コンテンツ検索処理を終了する。
次に、図21を用いて、推奨コンテンツマージ部108により実行されるコンテンツ情報のマージ処理の流れを説明する。図21は、推奨コンテンツマージ部108により実行されるコンテンツ情報のマージ処理の流れを示す図である。
図21に示すように、推奨コンテンツマージ部108は、iに初期値を設定するとともに(ステップS2101)、jに初期値を設定し(ステップS2102)、iがM以下であるか否かを判定する(ステップS2103)。判定の結果、iがM以下である場合には(ステップS2103,YES)、推奨コンテンツマージ部108は、jがN(i)以下であるか否かを判定する(ステップS2104)。N(i)は、クラスタC(i,j)のjの最大値を表す。
推奨コンテンツマージ部108は、判定の結果、jがN(i)以下である場合には(ステップS2104,YES)、クラスタC(i,j)の比率hを取得する(ステップS2105)。続いて、推奨コンテンツマージ部108は、比率hを用いて、コンテンツの総検索件数RNに対するクラスタC(i,j)についての検索結果からの抽出件数を算出する(ステップS2106)。そして、推奨コンテンツマージ部108は、クラスタC(i,j)についての検索結果のうち、相関係数が上位のものから抽出件数分のコンテンツ情報を抽出する(ステップS2107)。
続いて、推奨コンテンツマージ部108は、j=j+1として(ステップS2108)、上述したステップS2104に戻り、jがN(i)以下であるか否かを判定する。ここでステップS2104の説明に戻る。判定の結果、jがN(i)以下ではない場合には(ステップS2104,NO)、推奨コンテンツマージ部108は、i=i+1として(ステップS2109)、上述したステップS2103に戻り、iがM以下であるか否かを判定する。ここでステップS2103の説明に戻る。推奨コンテンツマージ部108は、判定の結果、iがM以下ではない場合には(ステップS2103,NO)、コンテンツ情報のマージ処理を終了する。
続いて、図22を用いて、推奨コンテンツマージ部108によるコンテンツの情報の再評価処理の流れを説明する。図22は、推奨コンテンツマージ部108によるコンテンツの情報の再評価処理の流れを示す図である。
図22に示すように、推奨コンテンツマージ部108は、履歴グルーピング部104によりクラスタリングされた全クラスタのインデックス、つまり嗜好を抽出する(ステップS2201)。次に、推奨コンテンツマージ部108は、全クラスタのインデックスの総和、つまり全体的な嗜好を算出する(ステップS2202)。
続いて、推奨コンテンツマージ部108は、iに初期値を設定し(ステップS2003)、iが総検索件数RN以下であるか否かを判定する(ステップS2004)。判定の結果、iが総検索件数RN以下である場合には(ステップS2004,YES)、推奨コンテンツマージ部108は、検索結果(i)を取得する(ステップS2205)。
次に、推奨コンテンツマージ部108は、検索結果(i)のインデックスと全クラスタのインデックスの総和との相関係数を算出する(ステップS2206)。続いて、推奨コンテンツマージ部108は、i=i+1として(ステップS2207)、上述したステップS2204に戻り、iが総検索件数RN以下であるか否かを判定する。
ここでステップS2204の説明に戻る。推奨コンテンツマージ部108は、判定の結果、iが総検索件数RN以下ではない場合には(ステップS2204,NO)、相関係数のスコアに応じて検索結果を降順にソートし(ステップS2208)、再評価処理を終了する。
次に、図23を用いて、推奨コンテンツフィードバック部109により実行される操作内容記録処理の流れを説明する。図23は、推奨コンテンツフィードバック部109により実行される操作内容記録処理の流れを示す図である。
図23に示すように、推奨コンテンツフィードバック部109は、推奨コンテンツマージ部108によりマージされ、ユーザに提供された検索結果に対するユーザの操作を検知されたか否かを判定する(ステップS2301)。判定の結果、検索結果に対応するユーザの操作を検知すると(ステップS2301,YES)、推奨コンテンツフィードバック部109は、検知された操作内容がフィードバック対象であるか否かを判定する(ステップS2302)。
推奨コンテンツフィードバック部109は、判定の結果、検知された操作内容がフィードバック対象である場合には(ステップS2302,YES)、操作内容を操作履歴に記録し(ステップS2303)、上述したステップS2301に戻る。ここでステップ2301の説明に戻る。推奨コンテンツフィードバック部109は、判定の結果、検索結果に対応するユーザの操作を検知していない場合には、ステップS2301の判定結果をNOとして同じ判定を繰り返す。また、ステップS2302の説明に戻る。推奨コンテンツフィードバック部109は、判定の結果、検知された操作内容がフィードバック対象ではない場合には(ステップS2302,NO)、上述したステップS2301に戻る。
なお、図23に示す処理は、検索結果に対するユーザの操作検知に応じて処理を行ったが、これに限定されるものではなく、所定のタイミングで定期的に実行してもよい。
続いて、図24を用いて、履歴グルーピング部104により実行されるインデックス生成処理の流れを説明する。図24は、履歴グルーピング部104により実行されるインデックス生成処理の流れを示す図である。
図24に示すように、履歴グルーピング部104は、iに初期値を設定し(ステップS2401)、iが全フィードバック対象操作履歴数S以下であるか否かを判定する(ステップS2402)。
履歴グルーピング部104は、判定の結果、iが全フィードバック対象操作履歴数S以下である場合には(ステップS2402,YES)、操作履歴(i)の操作対象(i)を抽出する(ステップS2403)。次に、履歴グルーピング部104は、操作対象(i)についてインデックスを生成し(ステップS2404)、操作対象(i)に対応する操作内容(i)を抽出する(ステップS2405)。
続いて、履歴グルーピング部104は、操作内容(i)に応じて規定の係数を取得し(ステップS2406)、操作対象(i)について生成したインデックスに係数を乗算する(ステップS2407)。そして、履歴グルーピング部104は、i=i+1として(ステップS2408)、上述したステップS2402に戻り、iが全フィードバック対象操作履歴数S以下であるか否かを判定する。
ここでステップS2402の説明に戻る。履歴グルーピング部104は、判定の結果、iが全フィードバック対象操作履歴数S以下ではない場合には(ステップS2402,NO)、インデックス生成処理を終了する。
[実施例2による効果]
上述してきたように、情報検索装置100は、テレビ番組に関するユーザの操作履歴に共通して出現するキーワードに基づいて、操作履歴を予め複数のグループにグルーピングする。次に、情報検索装置100は、例えば、操作履歴に含まれる全件数に対して、操作履歴の各グループに属する操作履歴の件数が占める比率をそれぞれ算出する。また、情報検索装置50は、各グループの含まれる操作履歴のインデックスと統合することによりユーザの嗜好を抽出する。そして、情報検索装置100は、各グループのユーザに嗜好に応じたテレビ番組の情報をそれぞれ検索し、各グループについての検索結果から、各グループの比率に応じた件数分の検索結果を抽出する。このようなことから、実施例2によれば、ユーザの多様な嗜好を反映したテレビ番組や動画などのコンテンツの検索結果をユーザに提供できる。
また、実施例2によれば、操作履歴をキーワードにより分類した後に、階層的クラスタリングを行うので、階層的クラスタリングを直接行う方法に比べて、少ない計算量で操作履歴をクラスタリングすることができる。
また、実施例2によれば、操作履歴をクラスタリングした各グループの大きさを求めるので、操作履歴をクラスタリングした各グループにおけるユーザの嗜好の強さを簡易に得ることができる。
また、実施例2によれば、検索対象となるテレビ番組の中から、操作履歴をクラスタリングしたグループごとに、グループおけるユーザの嗜好によりマッチするテレビ番組を検索する。これにより、ユーザの嗜好を細かく捉えて、嗜好の強弱によらず、ユーザの嗜好に含まれる様々な番組についての検索結果を得ることができる。
また、実施例2によれば、操作履歴をクラスタリングしたグループごとに、各グループの嗜好に応じて検索した検索結果の中から、各グループの大きさに応じた件数分の検索結果をそれぞれ抽出し、抽出した検索結果をマージしてユーザに提供する。これにより、ユーザの嗜好に含まれる様々な番組についての検索結果をユーザに提供できる。
また、実施例2によれば、グループごとの検索結果をマージする際に、検索結果をユーザの全体的な嗜好で再評価し、再評価結果に応じて検索結果をソートしなおしてからマージする。よりユーザの嗜好に沿った形でソートされた検索結果をユーザに提供できる。また、グループごとに嗜好が異なるので、各グループの嗜好を用いてグループの検索結果同士を正しく比較することはできない。そこで、テレビ番組の放送時間やジャンルなどの属性でソートを行うことが考えられる。しかしながら、この場合には、検索結果のソート結果がユーザの嗜好に沿っていないという問題が起こりうるが、このような問題の発生も回避される。
また、実施例2によれば、検索結果に対するユーザの操作の履歴を記録しておいて、操作履歴へのフィードバックを行う。これにより、次回、操作履歴のクラスタリングが行われる場合に、検索結果に対するユーザの操作が肯定的であるほど、クラスタリングされる操作履歴のグループの比率が大きくなるように、操作履歴のグループの大きさを半自動的に調整できる。
以下、本願の開示する情報検索装置、情報検索方法および情報検索プログラムの他の実施形態を説明する。
(1)装置構成等
例えば、図2に示した情報検索装置100の構成は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。例えば、図2に示した情報検索装置100の推奨コンテンツ検索部107と推奨コンテンツマージ部108とを機能的または物理的に統合してもよい。このように、情報検索装置100の全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
(2)情報検索方法
上述してきた実施例により、以下に説明するように、コンテンツに関するユーザの操作履歴をそれぞれ記憶する操作履歴記憶部としても機能できる情報検索装置100に適用される情報検索方法が実現される。この情報検索方法は、評価情報生成部ステップ、履歴分類部ステップ、比率算出ステップ、グループ評価情報生成ステップ、ソートステップ、抽出ステップおよび表示出力ステップを含む情報検索方法が実現される。
評価情報生成ステップは、操作履歴記憶部に記憶されている各操作履歴に含まれる操作対象の情報を用いて、操作履歴ごとに、該操作履歴に残されるコンテンツの内容を複数の評価軸で評価した評価情報をそれぞれ生成する。履歴分類ステップは、操作履歴記憶部に記憶されている各操作履歴に含まれる操作対象の情報から、該操作対象に共通して出現する頻度の高いキーワードを抽出する。そして、履歴分類ステップは、抽出されたキーワードごとに、該キーワードを有する操作履歴を第1グループにそれぞれ分類する。さらに、履歴分類ステップは、分類された第1グループごとに階層的クラスタリングを行うことにより、複数の第1グループをさらに複数の第2グループにそれぞれ分類する。比率算出ステップは、操作履歴全体の大きさに対して履歴分類ステップにより分類された第2グループの大きさが占有する比率を該第2グループごとにそれぞれ算出する。グループ評価情報生成ステップは、評価情報生成ステップにより生成された評価情報を、履歴分類ステップにより分類された第2グループごとに統合することにより、該第2グループにおけるコンテンツのユーザ嗜好を示すグループ評価情報をそれぞれ生成する。ソートステップは、検索対象となるコンテンツの中から、グループ評価情報生成ステップにより生成されたグループ評価情報に合致するコンテンツの情報を第2グループごとに検索する。そして、ソートステップは、検索されたコンテンツの情報を該グループ評価情報と相関性の高い順に該第2グループ内でそれぞれソートする。抽出ステップは、ソート部により第2グループ内でそれぞれソートされたコンテンツの情報の中から、比率算出ステップにより算出された比率に応じた件数分のコンテンツの情報を、グループ評価情報と相関性の高いものからそれぞれ抽出する。表示出力ステップは、抽出ステップにより抽出されたコンテンツの情報をマージして表示出力する。
(3)情報検索プログラム
また、例えば、上述の実施例にて説明した情報検索装置100により実行される各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータなどの電子機器で実行することによって実現することもできる。なお、情報検索装置100の各種の処理については、例えば、図16〜24等を参照されたい。
そこで、以下では、図25を用いて、上述の実施例にて説明した情報検索装置100により実行される処理と同様の機能を実現する情報検索プログラムを実行するコンピュータの一例を説明する。図25は、情報検索プログラムを実行するコンピュータの一例を示す図である。
図25に示すように、情報検索装置100と同様の機能を実現するコンピュータ200は、各種演算処理を実行するCPU(Central Processing Unit)210と、ユーザからデータの入力を受け付ける入力装置220と、モニタ230とを有する。
また、コンピュータ200は、図25に示すように、記憶媒体からプログラム等を読取る媒体読取装置240と、ネットワークを介して他のコンピュータとの間でデータの授受を行うネットワークインターフェース装置250を有する。また、コンピュータ200は、図25に示すように、各種情報を一時記憶するRAM(Random Access Memory)260と、ハードディスク装置270とを有する。そして、各装置210〜270は、バス280に接続される。
なお、入力装置220は、例えば、キーボードやマウスなどである。なお、入力装置220がマウスを有する場合には、モニタ230と協働して、ポインティングデバイス機能を実現することもできる。また、入力装置220がタッチパッドなどの他の入力デバイスを有する場合にも、マウスの場合と同様にポインティングデバイス機能を実現できる。
また、CPU210の代わりに、例えば、MPU(Micro Processing Unit)などの電子回路、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路を用いることもできる。また、RAM260の代わりに、フラッシュメモリ(flash memory)などの半導体メモリ素子を用いることもできる。
ハードディスク装置270には、上述した情報検索装置100の機能と同様の機能を発揮する情報検索プログラム271および情報検索用データ272が記憶されている。なお、この情報検索プログラム271を適宜分散させて、ネットワークを介して通信可能に接続された他のコンピュータの記憶部に記憶させておくこともできる。
そして、CPU210が、情報検索プログラム271をハードディスク装置270から読み出してRAM260に展開することにより、図25に示すように、情報検索プログラム271は情報検索プロセス261として機能する。情報検索プロセス261は、ハードディスク装置270から読み出した情報検索用データ272等の各種データを適宜RAM260上の自身に割当てられた領域に展開し、この展開した各種データに基づいて各種処理を実行する。
なお、情報検索プロセス261は、例えば、図2に示した情報検索装置100の履歴グルーピング部104、嗜好抽出部105およびグルーピング比率保管部106にて実行される処理を含む。さらに、情報検索プロセス261は、推奨コンテンツ検索部107、推奨コンテンツマージ部108および推奨コンテンツフィードバック部109にて実行される処理を含む。
なお、情報検索プログラム271については、必ずしも最初からハードディスク装置270に記憶させておく必要はない。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ200がこれらから各プログラムを読み出して実行するようにしてもよい。
さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータ200に接続される「他のコンピュータ(またはサーバ)」などに各プログラムを記憶させておく。そして、コンピュータ200がこれらから各プログラムを読み出して実行するようにしてもよい。
50 情報検索装置
51 操作履歴記憶部
52 評価情報生成部
53 履歴分類部
54 比率算出部
55 グループ評価情報生成部
56 ソート部
57 抽出部
58 表示出力部
100 情報検索装置
101 表示出力部
102 操作履歴記憶部
103 コンテンツデータ記憶部
104 履歴グルーピング部
105 嗜好抽出部
106 グルーピング比率保管部
107 推奨コンテンツ検索部
108 推奨コンテンツマージ部
109 推奨コンテンツフィードバック部
200 コンピュータ
210 CPU
220 入力装置
230 モニタ
240 媒体読取装置
250 ネットワークインターフェース装置
260 RAM
261 情報検索プロセス
270 ハードディスク装置
271 情報検索プログラム
272 情報検索用データ

Claims (7)

  1. コンテンツに関するユーザの操作ごとに操作内容と操作対象とを対応づけた操作履歴を記憶する操作履歴記憶部と、
    前記操作履歴記憶部に記憶されている各操作履歴から抽出した複数のキーワードそれぞれを基底とし、各操作履歴における各キーワードの出現回数を要素とするベクトルを、前記操作履歴ごとに、該操作履歴に残されるコンテンツの内容を評価する評価情報としてそれぞれ生成する評価情報生成部と、
    前記操作履歴記憶部に記憶されている各操作履歴に含まれる操作対象の情報から、該操作対象に共通して出現する頻度の高いキーワードを抽出し、該キーワードを有する操作履歴をグループ化して抽出されたキーワードごとの第1グループにそれぞれ分類し、分類された第1グループごとに階層的クラスタリングを行うことにより、各第1グループを複数の第2グループにそれぞれ分類する履歴分類部と、
    前記操作履歴全体の大きさに対して前記履歴分類部により分類された前記第2グループの大きさが占有する比率を該第2グループごとにそれぞれ算出する比率算出部と、
    前記評価情報生成部により生成された前記評価情報について、前記履歴分類部により分類された前記第2グループごとにベクトル和を算出することにより、該第2グループごとに、該第2グループにおける前記コンテンツのユーザ嗜好を示すグループ評価情報を生成するグループ評価情報生成部と、
    各コンテンツの情報に基づいて、前記基底および前記要素に基づくベクトルが前記評価情報として予め生成されている検索対象となるコンテンツの中から、前記操作履歴を分類した前記第1グループをそれぞれ階層的クラスタリングした前記第2グループごとに、前記グループ評価情報生成部により生成された前記グループ評価情報とベクトルの相関値が所定値以上である前記評価情報を有するコンテンツの情報を前記第2グループにおける前記ユーザの嗜好にマッチするコンテンツの情報として検索し、検索されたコンテンツの情報を該グループ評価情報と相関性の高い順に該第2グループ内でそれぞれソートするソート部と、
    前記ソート部により前記第2グループ内でそれぞれソートされたコンテンツの情報の中から、前記比率算出部により算出された前記比率に応じた件数分のコンテンツの情報を、該第2グループごとに、前記グループ評価情報と相関性の高いものからそれぞれ抽出する抽出部と、
    前記抽出部により抽出されたコンテンツの情報をマージして表示出力する表示出力部と
    を有することを特徴とする情報検索装置。
  2. 前記操作履歴全体の大きさ、及び第2グループの大きさは、操作履歴の件数、又はクラスタ内の評価情報をベクトルで表したインデックスのベクトル和の少なくとも一つであることを特徴とする請求項1記載の情報検索装置。
  3. 前記評価情報生成部により生成された前記評価情報を統合した統合結果、または前記グループ評価情報生成部により生成された前記グループ評価情報を統合した統合結果に基づいて、前記抽出部により前記第2グループごとにそれぞれ抽出されたコンテンツの情報を、前記統合結果と相関性の高い順に改めてソートする再ソート部をさらに有し、
    前記表示出力部は、前記再ソート部により再ソートされたコンテンツの情報を表示出力することを特徴とする請求項1に記載の情報検索装置。
  4. 前記評価情報生成部は、前記評価情報を生成する場合に、前記表示出力部により表示出力されたコンテンツの情報に対するユーザの操作内容に応じた係数を評価情報に乗算することを特徴とする請求項1〜3のいずれか一つに記載の情報検索装置。
  5. 前記比率算出部は、前記操作履歴の全件数に対して前記第2グループの件数が占有する比率、または前記操作履歴の全評価情報に対して前記第2グループのグループ評価情報が占有する比率を該第2グループごとにそれぞれ算出することを特徴とする請求項1に記載の情報検索装置。
  6. 情報検索装置が実行する情報検索方法であって、
    前記情報検索装置は、
    操作ごとに操作内容と操作対象とを対応づけて操作履歴記憶部に記憶されるユーザの操作履歴から抽出した複数のキーワードそれぞれを基底とし、各操作履歴における各キーワードの出現回数を要素とするベクトルを、前記操作履歴ごとに、該操作履歴に残されるコンテンツの内容を評価する評価情報としてそれぞれ生成する評価情報生成ステップと、
    前記操作履歴記憶部に記憶されている各操作履歴に含まれる操作対象の情報から、該操作対象に共通して出現する頻度の高いキーワードを抽出し、抽出されたキーワードごとに、該キーワードを有する操作履歴を第1グループにそれぞれ分類し、分類された第1グループごとに階層的クラスタリングを行うことにより、複数の第1グループをさらに複数の第2グループにそれぞれ分類する履歴分類ステップと、
    前記操作履歴全体の大きさに対して前記履歴分類ステップにより分類された前記第2グループの大きさが占有する比率を該第2グループごとにそれぞれ算出する比率算出ステップと、
    前記評価情報生成ステップにより生成された前記評価情報について、前記履歴分類ステップにより分類された前記第2グループごとにベクトル和を算出することにより、該第2グループごとに、該第2グループにおける前記コンテンツのユーザ嗜好を示すグループ評価情報を生成するグループ評価情報生成ステップと、
    各コンテンツの情報に基づいて、前記基底および前記要素に基づくベクトルが前記評価情報として予め生成されている検索対象となるコンテンツの中から、前記操作履歴を分類した前記第1グループをそれぞれ階層的クラスタリングした前記第2グループごとに、前記グループ評価情報生成ステップにより生成された前記グループ評価情報とベクトルの相関値が所定値以上である前記評価情報を有するコンテンツの情報を前記第2グループにおける前記ユーザの嗜好にマッチするコンテンツの情報として検索し、検索されたコンテンツの情報を該グループ評価情報と相関性の高い順に該第2グループ内でそれぞれソートするソートステップと、
    前記ソートステップにより前記第2グループ内でそれぞれソートされたコンテンツの情報の中から、前記比率算出ステップにより算出された前記比率に応じた件数分のコンテンツの情報を、該第2グループごとに、前記グループ評価情報と相関性の高いものからそれぞれ抽出する抽出ステップと、
    前記抽出ステップにより抽出されたコンテンツの情報をマージして表示出力する表示出力ステップと
    を含んだことを特徴とする情報検索方法。
  7. 情報検索装置としてのコンピュータに実行させる情報検索プログラムであって、
    前記情報検索装置としてのコンピュータに、
    操作ごとに操作内容と操作対象とを対応づけて操作履歴記憶部に記憶されるユーザの操作履歴から抽出した複数のキーワードそれぞれを基底とし、各操作履歴における各キーワードの出現回数を要素とするベクトルを、前記操作履歴ごとに、該操作履歴に残されるコンテンツの内容を評価する評価情報としてそれぞれ生成する評価情報生成手順と、
    前記操作履歴記憶部に記憶されている各操作履歴に含まれる操作対象の情報から、該操作対象に共通して出現する頻度の高いキーワードを抽出し、抽出されたキーワードごとに、該キーワードを有する操作履歴を第1グループにそれぞれ分類し、分類された第1グループごとに階層的クラスタリングを行うことにより、複数の第1グループをさらに複数の第2グループにそれぞれ分類する履歴分類手順と、
    前記操作履歴全体の大きさに対して前記履歴分類手順により分類された前記第2グループの大きさが占有する比率を該第2グループごとにそれぞれ算出する比率算出手順と、
    前記評価情報生成手順により生成された前記評価情報について、前記履歴分類手順により分類された前記第2グループごとにベクトル和を算出することにより、該第2グループごとに、該第2グループにおける前記コンテンツのユーザ嗜好を示すグループ評価情報を生成するグループ評価情報生成手順と、
    各コンテンツの情報に基づいて、前記基底および前記要素に基づくベクトルが前記評価情報として予め生成されている検索対象となるコンテンツの中から、前記操作履歴を分類した前記第1グループをそれぞれ階層的クラスタリングした前記第2グループごとに、前記グループ評価情報生成手順により生成された前記グループ評価情報とベクトルの相関値が所定値以上である前記評価情報を有するコンテンツの情報を前記第2グループにおける前記ユーザの嗜好にマッチするコンテンツの情報として検索し、検索されたコンテンツの情報を該グループ評価情報と相関性の高い順に該第2グループ内でそれぞれソートするソート手順と、
    前記ソート手順により前記第2グループ内でそれぞれソートされたコンテンツの情報の中から、前記比率算出手順により算出された前記比率に応じた件数分のコンテンツの情報を、該第2グループごとに、前記グループ評価情報と相関性の高いものからそれぞれ抽出する抽出手順と、
    前記抽出手順により抽出されたコンテンツの情報をマージして表示出力する表示出力手順と
    を実行させることを特徴とする情報検索プログラム。
JP2010079206A 2010-03-30 2010-03-30 情報検索装置、情報検索方法および情報検索プログラム Expired - Fee Related JP5526934B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010079206A JP5526934B2 (ja) 2010-03-30 2010-03-30 情報検索装置、情報検索方法および情報検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010079206A JP5526934B2 (ja) 2010-03-30 2010-03-30 情報検索装置、情報検索方法および情報検索プログラム

Publications (2)

Publication Number Publication Date
JP2011210143A JP2011210143A (ja) 2011-10-20
JP5526934B2 true JP5526934B2 (ja) 2014-06-18

Family

ID=44941103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010079206A Expired - Fee Related JP5526934B2 (ja) 2010-03-30 2010-03-30 情報検索装置、情報検索方法および情報検索プログラム

Country Status (1)

Country Link
JP (1) JP5526934B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3789463B1 (ja) * 2005-02-07 2006-06-21 三菱電機株式会社 推奨番組抽出装置及び推奨番組抽出方法
JP5224868B2 (ja) * 2008-03-28 2013-07-03 株式会社東芝 情報推薦装置および情報推薦方法

Also Published As

Publication number Publication date
JP2011210143A (ja) 2011-10-20

Similar Documents

Publication Publication Date Title
US20220035827A1 (en) Tag selection and recommendation to a user of a content hosting service
US10394878B2 (en) Associating still images and videos
Van Leuken et al. Visual diversification of image search results
Hasan et al. Dominance of AI and Machine Learning Techniques in Hybrid Movie Recommendation System Applying Text-to-number Conversion and Cosine Similarity Approaches
Clinchant et al. Semantic combination of textual and visual information in multimedia retrieval
US8949198B2 (en) Systems and methods for building a universal multimedia learner
WO2009128021A1 (en) Method and apparatus for searching a plurality of stored digital images
Liu et al. Heterogeneous features and model selection for event-based media classification
Liu et al. Event analysis in social multimedia: a survey
Chang et al. An interactive approach to integrating external textual knowledge for multimodal lifelog retrieval
D'Addio et al. A collaborative filtering approach based on user's reviews
Nguyen et al. Interactive search vs. automatic search: an extensive study on video retrieval
JP5526934B2 (ja) 情報検索装置、情報検索方法および情報検索プログラム
Vrochidis et al. Optimizing visual search with implicit user feedback in interactive video retrieval
Kannan et al. Improving video summarization based on user preferences
Wang et al. Video indexing and retrieval based on key frame extraction
Li et al. Learning cooking techniques from youtube
Ventura et al. Automatic keyframe selection based on mutual reinforcement algorithm
Arca et al. Automated Tag Enrichment by Semantically Related Trends.
KR101643979B1 (ko) 비디오 컨텐츠 증강 방법
Sevillano et al. Look, listen and find: A purely audiovisual approach to online videos geotagging
Harakawa et al. An efficient extraction method of hierarchical structure of web communities for web video retrieval
Pawaskar et al. Web image search engine using semantic of Images's meaning for achieving accuracy
Koskela et al. Improving automatic video retrieval with semantic concept detection
Ashraf et al. Improved Ingredients-based Recipe Recommendation Software using Machine Learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140331

R150 Certificate of patent or registration of utility model

Ref document number: 5526934

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees