JP5545883B2

JP5545883B2 - 推薦データ成形方法、推薦データ成形装置および推薦データ成形プログラム

Info

Publication number: JP5545883B2
Application number: JP2011109431A
Authority: JP
Inventors: 佳林前橋; 彰中山
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2011-05-16
Filing date: 2011-05-16
Publication date: 2014-07-09
Anticipated expiration: 2031-05-16
Also published as: JP2012242892A

Description

本発明は、ユーザに推薦するコンテンツを、複数のグループにわけて出力する推薦データ成形方法、推薦データ成形装置および推薦データ成形プログラムに関する。

昨今の情報機器の発達に伴い、映像データなどのコンテンツが膨大に増えるとともに、そのコンテンツの視聴形態が多様化している。例えば映像コンテンツの場合、地上波によるテレビ放送だけでなく、衛星波による放送もある。また、放送されるコンテンツも、海外ドラマ、新作映画など、多種多様である。また、ユーザは、個々の携帯電話機、スマートフォン、パソコンなどを使って、動画配信サイトにアクセスし、所望のコンテンツを選択して視聴する場合もある。

このように、ユーザが視聴可能なコンテンツの数は多く、その内容や種類も多い。従って、ユーザが所望のコンテンツを検索可能なサービスを提供するウェブサイトがある。ユーザは例えば、コンピュータ、携帯電話機、テレビなどの情報機器から、サービス提供者のウェブサイトにアクセスする。ユーザは、サービス提供者のウェブサイトにおいて視聴可能なコンテンツに関する情報を収集して、ユーザが所望するコンテンツを選択することができる。

この場合でも、ユーザは多数のコンテンツから、所望のコンテンツを検索しなければならない。そこで、このようなサービス提供者のウェブサイトにおいて、ユーザの興味のありそうなコンテンツを推薦し、提示するサービスが普及している。

この際に用いられる具体的な推薦方法として、様々な方法が考えられる。ここで、ユーザに的確にコンテンツを推薦するため、推薦結果の提示の方法も重視される必要があると考えられる。例えば、単に推薦コンテンツのタイトル、サムネイル等が並べられている推薦結果表示画面の場合、ユーザは、タイトルとサムネイルを逐次探索的に確認して、興味を持ったコンテンツのみについて、詳細画面を閲覧することになる。従って、本来そのコンテンツに興味を持つ場合であっても、ユーザが、タイトルとサムネイルから、詳細画面までを閲覧するとは限らない。そこで、ユーザの興味を引き出すために、推薦結果の表示方法も工夫が必要であると考えられる。

そこで例えば、ユーザの興味に合わせて結果の表示方法を変更する方法が考えられる。この方法の場合、ユーザは推薦結果が自分の興味を反映していることをより明確に理解することができるので、推薦結果により興味を持つと考えられる。例えば、検索結果をクラスタリングし、クラスごとに結果を表示する方法がある（例えば、非特許文献１参照。）。非特許文献１に記載の技術では、検索結果のウェブページのタイトルおよびスニペットに出現する特徴語に着眼し、特徴語により検索結果をクラスタリングして表示する。この非特許文献１に記載の技術では、クラスごとに結果を表示することにより、ユーザは、検索結果を把握しやすい。

村松亮介，福田直樹，石川博．「分類階層を利用した検索エンジンの検索結果の構造化とその提示方法の改良」，電子情報通信学会第19回データ工学ワークショップ論文集，b6-3，April, 2008

しかしながら、上記非特許文献１に記載の技術は、ユーザごとに表示結果を変えるものではない。また、非特許文献１に記載の技術は、ウェブページのタイトルやスニペットに基づいて特定される特徴語により、検索結果をクラスタリングする。従って、非特許文献１に記載の方法でクラスタリングされた検索結果は、ユーザの興味を反映しているとは限らず、ユーザの、この検索結果に対する興味は、低くなってしまうと考えられる。

従って本発明の目的は、ユーザに推薦するコンテンツを、ユーザの興味を反映してグルーピングする推薦データ成形方法、推薦データ成形装置および推薦データ成形プログラムを提供することである。

上記課題を解決するために、本発明の第１の特徴は、ユーザに推薦するコンテンツを、複数のグループにわけて出力する推薦データ成形方法に関する。すなわち本発明の第１の特徴に係る推薦データ成形方法は、コンピュータが、ユーザに推薦するコンテンツの識別子と、当該ユーザへ当該コンテンツを推薦することの適切さを示す適合度を対応づけた推薦コンテンツデータと、当該コンテンツのキャスト名であるキャスト情報を含むメタデータとを取得するステップと、コンピュータが、キャスト情報の一致度の高い所定数ｎのコンテンツをグルーピングし、グループ識別子と、当該グループに含まれるコンテンツの識別子と、を対応づけたキャスト情報グルーピングデータを、出力するステップと、を備え、出力するステップは、所定のキャスト情報に対応づけられるコンテンツ数が所定数ｎよりも多い場合、当該キャスト情報に対応づけられるコンテンツを適合度の順にｎ段階に分割し、各段階からコンテンツを選択してグルーピングする。

ここで、メタデータは、コンピュータが、シノプシス情報を含み、ユーザのクエリログデータから、映像視聴と関係の深いクエリと共起するクエリに基づいて、当該ユーザのキーワードを生成するステップと、コンピュータが、シノプシス情報に含まれる有意味語とキーワードとの類似度に基づいて、類似度の高い所定数のコンテンツをグルーピングし、グループ識別子と、当該グループに含まれるコンテンツの識別子と、当該キーワードとを対応づけたシノプシス情報グルーピングデータを出力するステップと、をさらに備えても良い。

さらに、コンピュータが、キャスト情報グルーピングデータに含まれる各グループについて、当該グループに対応づけられたコンテンツの識別子に対応するメタデータのシノプシス情報を取得するとともに、当該グループの複数のコンテンツに含まれるキャスト名に基づいて、シノプシス情報からスニペットを生成し、シノプシス情報グルーピングデータに含まれる各グループについて、各グループに対応づけられたコンテンツの識別子に対応するメタデータのシノプシス情報を取得するとともに、当該キーワードに基づいて、シノプシス情報からスニペットを生成して、推薦成形データを出力するステップをさらに備えても良い。

本発明の第２の特徴は、ユーザに推薦するコンテンツを、複数のグループにわけて出力する推薦データ成形装置に関する。すなわち本発明の第２の特徴に係る推薦データ成形装置は、ユーザに推薦するコンテンツの識別子と、当該ユーザへ当該コンテンツを推薦することの適切さを示す適合度を対応づけた推薦コンテンツデータと、当該コンテンツのキャスト名であるキャスト情報を含むメタデータとを取得する推薦コンテンツメタデータ取得手段と、キャスト情報の一致度の高い所定数ｎのコンテンツをグルーピングし、グループ識別子と、当該グループに含まれるコンテンツの識別子と、を対応づけたキャスト情報グルーピングデータを、出力するキャスト情報分析手段と、を備え、キャスト情報分析手段は、所定のキャスト情報に対応づけられるコンテンツ数が所定数ｎよりも多い場合、当該キャスト情報に対応づけられるコンテンツを適合度の順にｎ段階に分割し、各段階からコンテンツを選択してグルーピングする。

ここで、メタデータは、シノプシス情報を含み、ユーザのクエリログデータから、映像視聴と関係の深いクエリと共起するクエリに基づいて、当該ユーザのキーワードを生成するキーワード生成手段と、シノプシス情報に含まれる有意味語とキーワードとの類似度に基づいて、類似度の高い所定数のコンテンツをグルーピングし、グループ識別子と、当該グループに含まれるコンテンツの識別子と、当該キーワードとを対応づけたシノプシス情報グルーピングデータを出力するシノプシス情報分析手段と、をさらに備えても良い。

さらに、キャスト情報グルーピングデータに含まれる各グループについて、当該グループに対応づけられたコンテンツの識別子に対応するメタデータのシノプシス情報を取得するとともに、当該グループの複数のコンテンツに含まれるキャスト名に基づいて、シノプシス情報からスニペットを生成し、シノプシス情報グルーピングデータに含まれる各グループについて、各グループに対応づけられたコンテンツの識別子に対応するメタデータのシノプシス情報を取得するとともに、当該キーワードに基づいて、シノプシス情報からスニペットを生成して、推薦成形データを出力するスニペット生成手段をさらに備えても良い。

本発明の第３の特徴は、コンピュータを本発明の第２の特徴に記載の手段として機能させるためのコンテンツ収集プログラムに関する。

本発明によれば、ユーザに推薦するコンテンツを、ユーザの興味を反映してグルーピングする推薦データ成形方法、推薦データ成形装置および推薦データ成形プログラムを提供することができる。

本発明の実施の形態に係る推薦データ成形装置の機能ブロックを説明する図である。本発明の実施の形態に係る推薦成形データを表示する画面の一例を説明する図である。本発明の実施の形態に係る推薦コンテンツデータのデータ構造とデータの一例を説明する図である。本発明の実施の形態に係るコンテンツメタデータのデータ構造とデータの一例を説明する図である。本発明の実施の形態に係るクエリログデータのデータ構造とデータの一例を説明する図である。本発明の実施の形態に係る推薦データ成形装置の処理の概要を説明するフローチャートである。本発明の実施の形態に係るキャスト情報グルーピングデータのデータ構造とデータの一例を説明する図である。本発明の実施の形態に係るキャスト情報分析手段によるキャスト情報分析処理の概要を説明するフローチャートである。本発明の実施の形態に係るキーワードデータのデータ構造とデータの一例を説明する図である。本発明の実施の形態に係るキーワード生成手段によるキーワード生成処理の概要を説明するフローチャートである。本発明の実施の形態に係るシノプシス情報グルーピングデータのデータ構造とデータの一例を説明する図である。本発明の実施の形態に係るシノプシス情報分析手段によるシノプシス情報分析処理の概要を説明するフローチャートである。本発明の実施の形態に係るグルーピングデータのデータ構造とデータの一例を説明する図である。本発明の実施の形態に係る集計手段による集計処理の概要を説明するフローチャートである。本発明の実施の形態に係るスニペット生成手段によるスニペット生成処理の概要を説明するフローチャートである。

次に、図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一または類似の部分には同一または類似の符号を付している。

図１を参照して、本発明の実施の形態に係る推薦データ成形装置１を説明する。本発明の実施の形態に係る推薦データ成形装置１は、記憶装置１０、中央処理制御装置２０、通信制御装置（図示せず）などを備える一般的なコンピュータである。本発明の実施の形態に係る推薦データ成形装置１は、所定の処理を実行するための推薦データ成形プログラムが、一般的なコンピュータにインストールされ実行されることにより、実現される。

推薦データ成形装置１は、ユーザに推薦するコンテンツを、複数のグループにわけて出力する。本発明の実施の形態においてコンテンツは、映像データである場合について説明する。推薦データ成形装置１は、推薦装置１００から、ユーザに推薦するコンテンツの識別子と、その適合度を含む推薦コンテンツデータ１０１ａを取得し、推薦コンテンツデータ１１ａとして、記憶装置１０に記憶する。推薦データ成形装置１は、コンテンツメタデータ記憶部１０２に記憶されたコンテンツメタデータ１０２ａ、１０２ｂ、…と、クエリログデータ記憶部１０３に記憶されたクエリログデータ１０３ａに基づいて、推薦コンテンツデータ１１ａに含まれる所定数のコンテンツを、所定数のグループに分割して成形した推薦成形データ１６ａを、情報提供装置１０４に出力する。情報提供装置１０４は、ユーザ端末１０５に、推薦成形データ１６ａを出力する。

ここで、推薦成形データ１６ａは、図２に示すようにユーザ端末１０５に表示される。図２に示す推薦成形データ表示画面Ｐ１０１は、第１グループＧＲ１、第２グループＧＲ２および第３グループＧＲ３と、複数のグループにわけて、ユーザに推薦するコンテンツが表示される。このグループは、推薦データ成形装置１が、推薦装置１００から取得した推薦コンテンツデータ１１ａを、所定の処理に従って分割されたものである。例えば、第１グループＧＲ１は、キャストの”トニー・デッブ”に関するコンテンツが含まれている。第２グループＧＲ２は、キーワードの”イカデミー”に関するコンテンツが含まれている。第３グループＧＲ３は、キーワードの”ファンタジー”に関するコンテンツが含まれている。このように、推薦データ成形装置１は、推薦コンテンツデータ１１ａを、キャストやキーワードでグルーピングして出力する。

さらに、各グループに含まれるコンテンツについて、サムネイルと、このコンテンツを説明するスニペットＮ１１、…、Ｎ２１、…、Ｎ３１、…が設けられている。これらスニペットＮ１１、…、Ｎ２１、…、Ｎ３１、…は、各コンテンツのシノプシス情報に基づいて、ユーザの興味をひくキャスト情報やキーワードを強調表示して、作成される。ここでシノプシス情報とは、コンテンツのあらすじの情報である。

このような推薦成形データ表示画面Ｐ１０１によると、ユーザは、ユーザの興味の単位で設けられたグループから、所望のコンテンツを選択しやすい。また、ユーザの興味をひくキャスト情報やキーワードに基づいてスニペットが生成されることにより、ユーザはさらに、所望のコンテンツを選択しやすい。

図２に示す例では、推薦成形データ表示画面Ｐ１０１に３つのグループが表示され、各グループに３つのコンテンツが含まれる。推薦データ成形装置１は、キャストまたはキーワードが類似する３つのコンテンツを抽出して一つのグループを生成し、生成したグループのうち、３つのグループを出力する。本発明の実施の形態においては、各グループに含まれるコンテンツの数ｎ＝３の場合を説明する。

以下、図１に示す各要素について詳述する。

推薦装置１００は、ユーザＵｉに推薦するコンテンツについて、ユーザＵｉへの適合度を算出する。ここで適合度とは、推薦装置１００が採用する推薦アルゴリズムにおいて、ユーザＵｉへ当該コンテンツを推薦することの適切さを示す指標である。例えば、適合度が高いコンテンツが、ユーザＵｉにより推薦しやすいコンテンツとなる。この推薦装置１００が採用する推薦アルゴリズムは、どのようなものでも構わない。

推薦装置１００は、推薦コンテンツデータ１０１ａが記憶された推薦コンテンツデータ記憶部１０１を備える。この推薦コンテンツデータ１０１ａは、図３に示すように、ユーザＵｉの識別子、ユーザＵｉに推薦するコンテンツの識別子および適合度を対応づけたデータである。図３に示す例では、コンテンツの識別子として、ＣＲＩＤ（Content Reference ＩＤ：コンテンツ参照識別子）を採用している。

コンテンツメタデータ記憶部１０２は、コンテンツメタデータ１０２ａ、１０２ｂ…が記憶された記憶領域である。コンテンツメタデータ記憶部１０２は、どのような装置が備えても良い。例えば、コンテンツを管理するサーバの記憶装置に、コンテンツメタデータ記憶部１０２が実装されても良い。

コンテンツメタデータ１０２ａ、１０２ｂ…は、推薦コンテンツデータ１０１ａにおいて、推薦対象となりうるすべてのコンテンツのメタデータを蓄積する。本発明の実施の形態においては、コンテンツごとに、コンテンツメタデータ１０２ａ、１０２ｂ…が設定される。図４に示すコンテンツメタデータ１０２ａは、ＣＲＩＤが、”／／ＸＸＸ．ｃｏ．ｊｐ／１３５４６”のコンテンツに関するコンテンツメタデータである。図４に示すコンテンツメタデータ１０２ａは、ＴＶ−ａｎｙｔｉｍｅＦｏｒｕｍ（ｈｔｔｐ：／／ＷＷＷ．ｔｖ−ａｎｙｔｉｍｅ．ｏｒｇ／）で規定されたスキーマを参考にして作成され、ＸＭＬで記述されている。ここで、ＴＶ−ａｎｙｔｉｍｅＦｏｒｕｍは、サーバ型放送に関連した標準化を行っている団体である。

図４に示すコンテンツメタデータ１０２ａには、タイトルを示す＜Ｔｉｔｌｅ＞タグ、解説やあらましなどを示す＜Ｓｙｎｏｐｓｉｓ＞タグ、出演者などを示す＜Ｃａｓｔ＞タグ、コンテンツのジャンルを示す＜Ｇｅｎｒｅ＞タグなどが設けられている。

＜Ｔｉｔｌｅ＞タグには、このコンテンツのタイトル情報が設定される。＜Ｓｙｎｏｐｓｉｓ＞タグには、このコンテンツのシノプシス情報が設定される。＜Ｃａｓｔ＞タグには、このコンテンツのキャスト情報が設定される。このキャスト情報は、複数のキャスト名を含む場合がある。＜Ｇｅｎｒｅ＞タグには、このコンテンツのジャンル情報が設定される。本発明の実施の形態においては、これらのタグの設定値を使用するので、これらのタグには予め有効な値が設定されているものとする。

ここで、コンテンツメタデータ記憶部１０２のデータ形式は、ＸＭＬ形式などのツリー構造のデータ形式とは限らない。コンテンツメタデータ記憶部１０２は、例えば、ＲＤＢ、ＸＭＬ−ＤＢなどで実現されても良い。推薦データ成形装置１が、コンテンツのＩＤ、要素、属性名などを参照できればどのように実装されても良い。

クエリログデータ記憶部１０３は、クエリログデータ１０３ａが記憶された記憶領域である。クエリログデータ記憶部１０３は、どのような装置が備えても良い。例えば、番組紹介サイトや一般的な検索サイトなどが、クエリログデータ記憶部１０３を備える。このようなサイトは、検索窓を設け、ユーザが検索窓にクエリを入力する度に、クエリログをクエリログデータ記憶部１０３に蓄積する。

クエリログデータ１０３ａは、例えば、図５に示すデータである。クエリログデータ１０３ａは、時刻、検索したユーザのユーザＩＤおよびクエリを対応づけている。このクエリは、例えば、検索窓にユーザが入力した検索キーワードである。

情報提供装置１０４は、例えば、ユーザに推薦成形データ１６ａを表示する。本発明の実施の形態において情報提供装置１０４は、例えば、映像視聴サービスの番組紹介サイトを提供する。情報提供装置１０４は、会員用ページにおいて、当該サービスの会員であるユーザＵｉに対して、コンテンツの推薦結果を提示する。このとき情報提供装置１０４は、推薦データ成形装置１が出力した推薦成形データ１６ａを、ユーザ端末１０５に表示する。この推薦成形データ１６ａは、推薦装置１００が出力した推薦コンテンツデータ１０１ａに含まれるｋ件のコンテンツのうち、ユーザ端末１０５に最終的に提示するコンテンツの組み合わせと、その表示方法を、示したデータである。

ユーザ端末１０５は、コンピュータ、携帯電話機、スマートフォンなど、映像を視聴可能な情報機器である。ユーザは、ユーザ端末１０５の表示装置に表示された推薦成形データ１６ａに基づいて、所望のコンテンツを選択することができる。

（推薦データ成形方法）
図６を参照して、本発明の実施の形態に係る推薦データ成形方法の概要を説明する。

まずステップＳ１において推薦データ成形装置１は、推薦装置１００から、推薦コンテンツデータ１１ａを取得する。ここで推薦データ成形装置１は、例えば、ユーザＵｉに関する推薦コンテンツデータ１１ａを取得するとする。さらにステップＳ２において推薦データ成形装置１は、推薦コンテンツデータ１１ａに含まれる各コンテンツについて、コンテンツメタデータ記憶部１０２からコンテンツメタデータ１０２ａ、１０２ｂ…を取得し、メタデータ１１ｂ、１１ｃ…として、記憶装置１０の推薦コンテンツメタデータ記憶部１１に記憶する。

ステップＳ３において推薦データ成形装置１は、ステップＳ１で受信した推薦コンテンツデータ１１ａの各コンテンツについて、キャスト情報に基づいてグルーピングする。ここで推薦データ成形装置１は、キャスト情報が類似するコンテンツが一つのグループになるように、グルーピングして、キャスト情報グルーピングデータ１２ａを出力する。図２に示す例では、コンテンツ３つを一つのグループとして表示するので、推薦データ成形装置１は、キャスト情報が類似するコンテンツが３つ以上ある場合、そのコンテンツに基づいて一つのグループを生成する。

さらにステップＳ４において推薦データ成形装置１は、ステップＳ１で受信した推薦コンテンツデータ１１ａのうち、ステップＳ３でグルーピングされなかった各コンテンツについて、シノプシス情報に基づいてグルーピングする。ここで推薦データ成形装置１は、例えば、ユーザの嗜好を示すキーワードに基づいて、そのキーワードに関連するコンテンツが一つのグループになるように、グルーピングして、シノプシス情報グルーピングデータ１４ａを出力する。図２に示す例では、コンテンツ３つを一つのグループとして表示するので、推薦データ成形装置１は、所定のキーワードに関連するコンテンツが３つ以上ある場合、そのコンテンツに基づいて一つのグループを生成する。

ステップＳ５において推薦データ成形装置１は、ステップＳ３で生成したキャスト情報グルーピングデータ１２ａと、ステップＳ４で生成したシノプシス情報グルーピングデータ１４ａとから、ユーザに表示するグループを選択する。例えば、図２で示す例では、３つのグループが表示されているので、ステップＳ３およびステップＳ４で生成されたグループから３つを選択する。

ステップＳ５において推薦データ成形装置１は、ステップＳ５で選択されたグループについて、スニペットを生成する。推薦データ成形装置１は、グループを構成する各コンテンツのシノプシス情報に基づいて、ステップＳ３で生成したグループについてはキャスト名を、ステップＳ４で生成したグループについてはキーワードを、それぞれ強調したスニペットを生成し、推薦成形データ１６ａを生成する。

このように生成された推薦成形データ１６ａは、情報提供装置１０４に出力され、情報提供装置１０４を介して、ユーザ端末１０５に表示される。

（推薦データ成形装置）
次に図１を参照して、推薦データ成形装置１を詳述する。

推薦データ成形装置１の記憶装置１０は、推薦データ成形プログラムを記憶するとともに、推薦コンテンツメタデータ記憶部１１、キャスト情報グルーピングデータ記憶部１２、キーワードデータ記憶部１３、シノプシス情報グルーピングデータ記憶部１４、グルーピングデータ記憶部１５および推薦成形データ記憶部１６を備える。

推薦コンテンツメタデータ記憶部１１は、記憶装置１０のうち、推薦コンテンツデータ１１ａと、推薦コンテンツのメタデータ１１ｂ、１１ｃ、…が記憶された記憶領域である。キャスト情報グルーピングデータ記憶部１２は、記憶装置１０のうち、キャスト情報グルーピングデータ１２ａが記憶された記憶領域である。キーワードデータ記憶部１３は、記憶装置１０のうち、キーワードデータ１３ａが記憶された記憶領域である。シノプシス情報グルーピングデータ記憶部１４は、記憶装置１０のうち、シノプシス情報グルーピングデータ１４ａが記憶された記憶領域である。グルーピングデータ記憶部１５は、記憶装置１０のうち、グルーピングデータ１５ａが記憶された記憶領域である。推薦成形データ記憶部１６は、記憶装置１０のうち、推薦成形データ１６ａが記憶された記憶領域である。

推薦コンテンツデータ１１ａ、メタデータ１１ｂ、１１ｃ…、キャスト情報グルーピングデータ１２ａ、キーワードデータ１３ａ、シノプシス情報グルーピングデータ１４ａ、グルーピングデータ１５ａおよび推薦成形データ１６ａは、中央処理制御装置２０の各処理手段によって出力される。

中央処理制御装置２０は、推薦コンテンツメタデータ取得手段２１、キャスト情報分析手段２２、キーワード生成手段２３、シノプシス情報分析手段２４、集計手段２５、スニペット生成手段２６および出力手段２７を備える。

推薦コンテンツメタデータ取得手段２１は、ユーザに推薦するＣＲＩＤ（コンテンツの識別子）を含む推薦コンテンツデータ１１ａと、当該コンテンツのキャスト名であるキャスト情報を含むメタデータ１１ｂ、１１ｃ、…とを取得する。推薦コンテンツメタデータ取得手段２１は、これらのデータを、推薦コンテンツメタデータ記憶部１１に記憶する。

推薦コンテンツメタデータ取得手段２１は、推薦装置１００から、ユーザＵｉのための推薦コンテンツデータ１１ａを取得する。推薦コンテンツデータ１１ａは、図３を参照して説明したように、ＣＲＩＤと、その適合度と、を対応づけたデータである。本発明の実施の形態において、推薦コンテンツデータ１１ａは、ユーザＵｉに推薦するｋ件のコンテンツと、そのコンテンツの適合度を対応づけている。

さらに推薦コンテンツメタデータ取得手段２１は、コンテンツメタデータ記憶部１０２から、推薦コンテンツデータ１１ａに含まれるコンテンツ識別子のそれぞれについて、各コンテンツ識別子に対応するメタデータ１１ｂ、１１ｃ、…を取得する。このメタデータ１１ｂ、１１ｃ、…は、図４を参照して説明したように、タイトル、キャスト、シノプシス、ジャンル、公開年などの各項目が設定されているデータである。推薦コンテンツメタデータ取得手段２１は、推薦コンテンツデータ１１ａと、推薦コンテンツそれぞれのメタデータ１１ｂ、１１ｃ、…を、推薦コンテンツメタデータ記憶部１１に記憶する。

キャスト情報分析手段２２は、キャスト情報の一致度の高い所定数のコンテンツをグルーピングし、グループ識別子と、当該グループに含まれるＣＲＩＤ（コンテンツの識別子）と、を対応づけたキャスト情報グルーピングデータ１２ａを、出力する。キャスト情報分析手段２２は、キャスト情報グルーピングデータ１２ａを、キャスト情報グルーピングデータ記憶部１２に記憶する。

キャスト情報分析手段２２は、推薦コンテンツデータ１１ａに含まれるコンテンツのキャスト情報に基づいて、類似するキャスト情報を持つコンテンツをグルーピングする。キャスト情報分析手段２２は、グループに含まれるコンテンツの数ｎ＝３であるので、キャスト情報の一致度の高いコンテンツが３つある場合、それらのコンテンツを一つのグループとして出力する。

キャスト情報分析手段２２が出力するキャスト情報グルーピングデータ１２ａは、図７に示すように、グループＩＤ、コンテンツの識別子（ＣＲＩＤ）、キャスト情報および適合度を対応づけたデータである。図７に示すグループＩＤ”ＧＲ００１”のグループでは、このグループに含まれるすべてのコンテンツのキャスト情報に、”トニー・デッブ”が含まれていることにより、キャスト情報の一致度が高くなっている。

このように、キャスト情報分析手段２２は、キャスト情報の一致度が高いコンテンツは、ユーザの興味を強く表していると考える。キャスト情報分析手段２２は、キャスト情報の一致度が高いコンテンツを優先的にグルーピングすることにより、ユーザの興味を反映したコンテンツグループを出力する。

図８を参照して、キャスト情報分析手段２２によるキャスト情報分析処理を説明する。

まずステップＳ１０１においてキャスト情報分析手段２２は、推薦コンテンツデータ１１ａから、上位ｍ件の適合度を持つコンテンツについて、そのメタデータ１１ｂ、１１ｃ、…から、キャスト情報を取得する。このときキャスト情報分析手段２２は、コンテンツのＣＲＩＤと対応づけてキャスト情報を取得する。図４に示すようなメタデータの場合、キャスト情報分析手段２２は、各メタデータについて＜Ｃａｓｔ＞タグに設定された値を、キャスト情報として取得する。＜Ｃａｓｔ＞タグに複数のキャスト名が含まれている場合、キャスト情報分析手段２２は、個々のキャスト名を、ＣＲＩＤと対応づけて取得する。

ここで、コンテンツＩＤ”／／ＸＸＸ．ｃｏ．ｊｐ／１３５４６”のコンテンツの＜Ｃａｓｔ＞タグの＜ＰｅｒｓｏｎＮａｍｅ＞属性の値に、｛トニー・デッブ, フアン・ロドリゲス, デイビッド・スコフィールド｝と３名のキャスト名が設定され、コンテンツＩＤ”／／ＸＸＸ．ｃｏ．ｊｐ／９８７６５”のコンテンツの＜Ｃａｓｔ＞タグの＜ＰｅｒｓｏｎＮａｍｅ＞属性の値に、｛古川玲子, 小西里美, トニー・デッブ, 大竹たかひろ, ジョン・ブラウン｝と５名のキャスト名が設定され、コンテンツＩＤ”／／ＸＸＸ．ｃｏ．ｊｐ／３８７６５”のコンテンツの＜Ｃａｓｔ＞タグの＜ＰｅｒｓｏｎＮａｍｅ＞属性の値に、｛アレックス佐藤, トニー・デッブ, ジョン・ブラウン｝と３名のキャスト名が設定された場合を考える。

この場合、キャスト情報分析手段２２は、これらの各コンテンツから、キャスト名として、｛トニー・デッブ, ジョン・ブラウン,フアン・ロドリゲス, デイビッド・スコフィールド,古川玲子, 小西里美, 大竹たかひろ,アレックス佐藤｝を取得する。ここでキャスト情報分析手段２２は、キャスト名が重複しないように、キャスト名を取得する。さらにキャスト情報分析手段２２は、取得したキャスト名のそれぞれについて、そのキャスト名が対応づけられたＣＲＩＤを対応づける。具体的にキャスト情報分析手段２２は、トニー・デッブについて、｛／／ＸＸＸ．ｃｏ．ｊｐ／１３５４６, ／／ＸＸＸ．ｃｏ．ｊｐ／９８７６５, ／／ＸＸＸ．ｃｏ．ｊｐ／３８７６５｝の３つのＣＲＩＤを、ジョン・ブラウンについて、｛／／ＸＸＸ．ｃｏ．ｊｐ／９８７６５, ／／ＸＸＸ．ｃｏ．ｊｐ／３８７６５｝の２つのＣＲＩＤを、フアン・ロドリゲスについて、｛／／ＸＸＸ．ｃｏ．ｊｐ／１３５４６｝の１つのＣＲＩＤを対応づける。取得したすべてのキャスト名について、ＣＲＩＤの対応づけが終了すると、ステップＳ１０２に進む。

ステップＳ１０２においてキャスト情報分析手段２２は、上位ｍ件のコンテンツにおける各キャスト名に基づいて、一致度の高い組み合わせがあるか否かを判定する。

本発明の実施の形態において、キャスト情報の一致度とは、所定のキャスト名について、それを含むコンテンツの数とする。トニー・デッブについては、３つのＣＲＩＤが対応づけられているので、一致度は「３」となる。ジョン・ブラウンについては、２つのＣＲＩＤが対応づけられているので、一致度は「２」となる。フアン・ロドリゲスについては、１つのＣＲＩＤが対応づけられているので、一致度は「１」となる。

また本発明の実施の形態において、「一致度の高い」とは、所定のキャスト名に対応づけられたＣＲＩＤの数が、各グループに含まれるコンテンツの数ｎ以上の場合をいう。従って、所定のキャスト名に対応づけられたＣＲＩＤの数がｎ以上の場合、このキャスト名に対応づけられたＣＲＩＤのコンテンツの組み合わせを、「一致度の高い組み合わせ」という。例えば、各グループに含まれるコンテンツの数ｎ＝３で、トニー・デッブに３つのＣＲＩＤが対応づけられている場合を考える。この場合、キャスト情報分析手段２２は、トニー・デッブのキャスト情報が対応づけられたＣＲＩＤ｛／／ＸＸＸ．ｃｏ．ｊｐ／１３５４６, ／／ＸＸＸ．ｃｏ．ｊｐ／９８７６５, ／／ＸＸＸ．ｃｏ．ｊｐ／３８７６５｝のコンテンツの組み合わせを、「一致度の高い組み合わせ」として、グループを生成する。

ここで、所定のキャスト名に対応づけられるＣＲＩＤの数が、ｎより多い場合、具体的にはｎ＝３とすると４以上の場合、キャスト情報分析手段２２は、このキャスト名に対応づけられるＣＲＩＤのうち、ｎ個のＣＲＩＤを選択して、コンテンツの組み合わせを生成する。例えば、キャスト情報分析手段２２は、選択したコンテンツを、適合度の順にｎ段階に分割し、各段階から一つのコンテンツを選択して、グルーピングに含めるｎ個のコンテンツを決定することができる。

ステップＳ１０２において一致度の高い組み合わせがある場合、ステップＳ１０３においてキャスト情報分析手段２２は、一致度の高い組み合わせを、キャスト情報グルーピングデータ１２ａに記憶するグループとする。キャスト情報分析手段２２は、グループＩＤを採番し、この組み合わせに含まれるコンテンツのＣＲＩＤ、キャスト情報および適合度を対応づけたキャスト情報グルーピングデータ１２ａを生成する。

一方、ステップＳ１０２において一致度の高い組み合わせがない場合、ステップＳ１０４に進む。ステップＳ１０４において、条件を緩和して、さらにキャスト情報によるグルーピングを続けるか否かを判定する。例えば、キャスト情報のグルーピング条件について、一致度が高いグループのみを出力する、一致度の高いグループがない場合、条件を緩和したグループを出力する、一致度の高いグループがない場合でも条件を緩和したグループを出力しない、などのフラグが予め設定されている。「一致度が高いグループのみを出力する」または「一致度の高いグループがない場合でも条件を緩和したグループを出力しない」フラグが設定されている場合、キャスト情報分析手段２２は、ステップＳ１０６に進む。一方、「一致度の高いグループがない場合、条件を緩和したグループを出力する」フラグが設定されている場合、キャスト情報分析手段２２は、ステップＳ１０５に進む。

ステップＳ１０５においてキャスト情報分析手段２２は、ステップＳ１０２での一致度の判定より条件を緩和して、キャスト情報によるグルーピングを試みる。

ここで、条件を緩和したキャスト情報によるグルーピング処理を説明する。キャスト情報分析手段２２は、推薦コンテンツデータ１１ａのすべてのメタデータを読み出すとともに、推薦コンテンツデータ１１ａの適合度の上位ｍ件のコンテンツのキャスト情報を取得する。さらにキャスト情報分析手段２２は、推薦コンテンツデータ１１ａのすべてのコンテンツから、取得したキャスト情報と類似するコンテンツを選択して、キャスト情報グルーピングデータ１２ａを生成する。

例えば、上位ｍ件に属するコンテンツＩＤ”／／ＸＸＸ．ｃｏ．ｊｐ／１３５４６／”のコンテンツの＜Ｃａｓｔ＞タグの＜ＰｅｒｓｏｎＮａｍｅ＞属性の値が{トニー・デッブ, フアン・ロドリゲス, デイビッド・スコフィールド}であるとする。キャスト情報分析手段２２は、このキャスト情報に類似する＜Ｃａｓｔ＞タグの＜ＰｅｒｓｏｎＮａｍｅ＞属性の値を持つコンテンツを検索する。キャスト情報分析手段２２は、例えば、このコンテンツの＜Ｃａｓｔ＞タグの＜ＰｅｒｓｏｎＮａｍｅ＞属性の値をクエリとして、その他のコンテンツの＜Ｃａｓｔ＞タグの＜ＰｅｒｓｏｎＮａｍｅ＞属性の値を検索対象として検索し、一致したコンテンツのＣＲＩＤを取得する。

また＜Ｃａｓｔ＞タグの＜ＰｅｒｓｏｎＮａｍｅ＞属性の値が、コンテンツＩＤ”／／ＸＸＸ．ｃｏ．ｊｐ／１３５４６／”のコンテンツのように複数ある場合、キャスト情報分析手段２２は、それぞれの値ごとに、検索しても良い。コンテンツＩＤ”／／ＸＸＸ．ｃｏ．ｊｐ／１３５４６／”の場合、キャスト情報分析手段２２は、”トニー・デッブ”をクエリとして検索し、”フアン・ロドリゲス”をクエリとして検索し、”デイビッド・スコフィールド”をクエリとして検索しても良い。

この場合、キャスト情報分析手段２２は、それぞれで取得したＣＲＩＤのうち、最も重複してヒットした数が多いものから、グループを構成するコンテンツの数ｎに至るまで、コンテンツを選択する。コンテンツＩＤ”／／ＸＸＸ．ｃｏ．ｊｐ／１３５４６／”の場合、キャスト数は３なので、ヒット数の最大値は３である。ヒット数が同じコンテンツがグループを構成するコンテンツの数ｎ以上ある場合、キャスト情報分析手段２２は、その中でランダムにｎ件のコンテンツを選択しても良い。

このようにしてキャスト情報分析手段２２は、このようにｎ件のグループを生成する処理を、上位ｍ件に属するコンテンツすべてについて実行する。キャスト情報分析手段２２は、このように生成した組み合わせについて、グループＩＤを採番し、このグループに含まれるコンテンツのＣＲＩＤ、キャスト情報および適合度を対応づけたキャスト情報グルーピングデータ１２ａを生成する。

ここで、上位ｍ件すべてについてこの処理を行うのではなく、ｍ件中でさらに上位の j 件のコンテンツについてのみ、グループを作成することにより、キャスト情報分析手段２２の処理を軽減しても良い。

ステップＳ１０３またはステップＳ１０５の処理により、キャスト情報グルーピングデータ１２ａを生成すると、あるいは、ステップＳ１０４において条件を緩和したキャスト情報によるグルーピングを実行しない場合、ステップＳ１０６に進む。ステップＳ１０６においてキャスト情報分析手段２２は、推薦コンテンツデータ１１ａのうち、キャスト情報グルーピングデータ１２ａに含まれないコンテンツのＣＲＩＤを特定する。キャスト情報分析手段２２は、特定したコンテンツのＣＲＩＤを、シノプシス情報分析手段２４に入力する。

キーワード生成手段２３は、ユーザのクエリログデータ１０３ａから、当該ユーザのキーワードを生成する。キーワード生成手段２３が生成するキーワードは、シノプシス情報分析手段２４で利用される。キーワード生成手段２３は、推薦成形データ１６ａの出力の処理とは非同期に、逐次実行されても良い。

このクエリログデータ１０３ａが、番組紹介サイトなどにおいて映像データの推薦に関するクエリによって生成されている場合、キーワード生成手段２３は、このクエリログデータ１０３ａのクエリに基づいて、キーワードを生成する。例えばキーワード生成手段２３は、出現の多い所定数のクエリを、キーワードとして出力する。また、クエリログデータ１０３ａが、一般的な検索サイトなどにおいて生成されている場合、キーワード生成手段２３は、「映画」、「動画」などの映像視聴と関係の深いクエリと共起するクエリに基づいて、キーワードを生成する。例えば、一般的な検索サイトにおいて「映画トニー・デッブ」とクエリが入力された場合、キーワード生成手段２３は、キーワードとして「トニー・デッブ」を出力する。

キーワード生成手段２３は、ユーザごとにキーワードを生成して、キーワードデータ１３ａを出力する。キーワードデータ１３ａは、例えば図９に示すようなデータ構造を備える。図９に示すようにキーワードデータ１３ａは、ユーザＩＤと、そのユーザのキーワードが対応づけられたデータである。

図１０を参照して、キーワード生成手段２３によるキーワード生成処理を説明する。

まずステップＳ２０１においてキーワード生成手段２３は、クエリログデータ記憶部１０３から、ユーザＵｉの最近Ｎ日分のクエリログデータ１０３ａを取得する。ステップＳ２０２においてキーワード生成手段２３は、取得したクエリログデータ１０３ａからユーザＵｉのキーワードを生成する。

さらにステップＳ２０３においてキーワード生成手段２３は、ユーザＵｉのユーザＩＤ、およびステップＳ２０２で生成したキーワードを関連づけて、キーワードデータ１３ａを生成する。

シノプシス情報分析手段２４は、シノプシス情報に含まれる有意味語とキーワードデータ１３ａのキーワードとの類似度に基づいて、類似度の高い所定数のコンテンツをグルーピングする。シノプシス情報分析手段２４は、グループ識別子と、当該グループに含まれるコンテンツの識別子（ＣＲＩＤ）と、当該キーワードとを対応づけたシノプシス情報グルーピングデータ１４ａを出力する。

シノプシス情報分析手段２４は、推薦コンテンツデータ１１ａのうち、キャスト情報分析手段２２によりグルーピングの対象とならなかったコンテンツについて、シノプシス情報およびキーワードに基づいて、グルーピングする。シノプシス情報分析手段２４は、ジャンルごとに、グルーピング対象となるコンテンツを検索する。

シノプシス情報分析手段２４は、所定のジャンルについて、このジャンルに属するすべてのコンテンツのそれぞれについて、メタデータのシノプシス情報を形態素解析し、名詞などの有意味語を抽出する。シノプシス情報分析手段２４は、各コンテンツについて、キーワードデータ１３ａのキーワードと、各コンテンツのシノプシス情報から抽出された有意味語を比較して、各コンテンツの類似度を判定する。ここで、シノプシス情報分析手段２４は、キーワードと有意味語が一致すれば、その一致した数を類似度としても良い。ここでシノプシス情報分析手段２４は、シソーラス辞書を参照してキーワードを拡張した上で、各コンテンツのシノプシス情報の有意味語との類似度を算出しても良い。シノプシス情報分析手段２４は、当該コンテンツとの類似度が、既定値より高いコンテンツを、グルーピング候補のコンテンツとして選択する。

所定のジャンルに属するすべてのコンテンツについて類似度が算出され、グルーピング候補のコンテンツが選択されると、シノプシス情報分析手段２４は、選択されたコンテンツから、グルーピングするコンテンツｎ個を抽出する。シノプシス情報分析手段２４は、選択したコンテンツを、適合度の順にｎ段階に分割し、各段階から一つのコンテンツを選択して、グルーピングに含めるｎ個のコンテンツを決定することができる。

すべてのジャンルについて、グルーピングに含めるｎ個のコンテンツを決定すると、各グループについて、グループＩＤを採番して、そのグループに含めるコンテンツのＣＲＩＤ、キーワードおよび適合度を対応づけたシノプシス情報グルーピングデータ１４ａを出力する。

シノプシス情報分析手段２４が出力するシノプシス情報グルーピングデータ１４ａは、図１１に示すように、グループＩＤ、コンテンツの識別子（ＣＲＩＤ）、キーワードおよび適合度を対応づけたデータである。図１１に示すように、グループＩＤには、グループを構成するコンテンツの数ｎのＣＲＩＤが対応づけられる。さらにグループＩＤ”ＧＲ０１０１”のグループでは、キーワード”ファンタジー”が対応づけられる。このグループＩＤに対応づけられたＣＲＩＤのコンテンツは、キーワード”ファンタジー”と類似度の高い有意味語を含むシノプシス情報が対応づけられたコンテンツである。

図１２を参照して、シノプシス情報分析手段２４によるシノプシス情報分析処理を説明する。

まずステップＳ２０１においてシノプシス情報分析手段２４は、キャスト情報分析手段２２より、推薦コンテンツデータ１１ａに含まれるコンテンツのＣＲＩＤのうち、キャスト情報分析手段２２によってグルーピングされなかったコンテンツのＣＲＩＤを取得する。

さらにステップＳ２０２においてシノプシス情報分析手段２４は、キーワードデータ１３ａから、ユーザＵｉのキーワードを取得する。ここで、シノプシス情報分析手段２４は、取得したキーワードが十分であるか否かを判定する。例えば、ユーザＵｉに関するクエリログデータ１０３ａの数が十分でない場合、キーワードデータ１３ａのキーワードが十分でない可能性が考えられる。その場合シノプシス情報分析手段２４は、推薦コンテンツデータ１１ａに含まれる各コンテンツのメタデータ１１ｂ、１１ｃ、…から、新たにキーワードを生成しても良い。

例えばシノプシス情報分析手段２４は、推薦コンテンツメタデータ記憶部１１に記憶された推薦コンテンツのメタデータのシノプシス情報を形態素解析し、頻繁に出てくる単語を特定し、特定した単語から、コンテンツの内容を表す単語として不適切な単語を除いたリストを生成する。シノプシス情報分析手段２４は、生成したリストからランダムに選択した単語を、キーワードとして使用しても良い。

ステップＳ２０３においてシノプシス情報分析手段２４は、キャスト情報分析手段２２によってグルーピングされなかったＣＲＩＤに対応するメタデータから、＜Ｓｙｎｏｐｓｉｓ＞タグのシノプシス情報と、コンテンツのジャンルを示す＜Ｇｅｎｒｅ＞タグのジャンル情報を取得する。

ステップＳ２０３で取得したジャンルのそれぞれについて、シノプシス情報分析手段２４は、ステップＳ３０４ないしステップＳ３０６の処理を繰り返す。さらに、所定のジャンルのすべてのコンテンツについて、シノプシス情報分析手段２４は、ステップＳ３０４およびステップＳ３０５の処理を繰り返す。

ステップＳ３０４においてシノプシス情報分析手段２４は、所定のジャンルの所定のコンテンツについて、シノプシス情報を形態素解析して、有意味語を抽出する。ここで有意味語とは、形態素解析の結果得られた名詞、形容詞、形容動詞、動詞の各形態素である。ここで、有意味語のみを抽出することにより、後述の処理を効率化し、また精度を向上させることができる。また形態素解析をする際、シソーラス辞書を参照して、有意味語の類義語を保持しても良い。

ステップＳ３０５においてシノプシス情報分析手段２４は、ステップＳ３０４で抽出した有意味語と、ステップＳ３０２で取得したキーワードの類似度を算出する。例えばここで、シノプシス情報分析手段２４は、シソーラス辞書を参照してキーワードを拡張した上で、各コンテンツのシノプシス情報の有意味語との類似度を算出しても良い。シノプシス情報分析手段２４は、当該コンテンツの類似度が、既定値より高いコンテンツを、グルーピング候補のコンテンツとして選択する。

所定のジャンルに属するすべてのコンテンツについて、ステップＳ３０４およびステップＳ３０５の処理が終了すると、ステップＳ３０６においてシノプシス情報分析手段２４は、ステップＳ３０５で選択されたコンテンツからグループに含めるべきコンテンツをｎ個選択して、グループを作成する。シノプシス情報分析手段２４は、例えば、ステップＳ３０５で選択したコンテンツを適合度の高さ順にｎ段階にわける。シノプシス情報分析手段２４は、各段階から一つのコンテンツを選択したｎ個のコンテンツを、一つのグループに含めるコンテンツとして決定することができる。

当該ジャンルのすべてのコンテンツについて、ステップＳ３０５およびステップＳ３０６の処理が終了すると、シノプシス情報分析手段２４は、新たなジャンルについて、ステップＳ３０４ないしステップＳ３０６の処理を繰り返す。

すべてのジャンルについて、ステップＳ３０４ないしステップＳ３０６の処理が終了すると、シノプシス情報分析手段２４は、ステップＳ３０６で生成した各グループについてグループＩＤを採番し、グループＩＤ、コンテンツの識別子（ＣＲＩＤ）、キーワードおよび適合度を対応づけて、シノプシス情報グルーピングデータ１４ａを生成する。

ここで、クエリログデータ１０３ａにおけるキーワードは、ユーザが入力した状況や意図がわからない。従って、キーワードが一致するシノプシス情報を持つコンテンツを抽出しても、全く関連性のないコンテンツが抽出されてしまう場合がある。そこでシノプシス情報分析手段２４は、一つのジャンルに関連するコンテンツから、一つのグループを生成することにより、同一ジャンル内で、キーワードに一致するコンテンツを特定し、グルーピングの対象とすることができる。これにより、シノプシス情報分析手段２４は、同一グループに関連性の高いコンテンツを含めることができる。

集計手段２５は、キャスト情報グルーピングデータ１２ａおよびシノプシス情報グルーピングデータ１４ａに含まれる複数のグループから、推薦成形データ１６ａに含むグループを決定する。例えば、図２に示す例では、推薦成形データに、３つのグループが含まれている。従って、キャスト情報グルーピングデータ１２ａおよびシノプシス情報グルーピングデータ１４ａに含まれるグループの合計が４以上の場合、集計手段２５は、これらのグループから推薦成形データ１６ａに含ませるグループを決定し、グルーピングデータ１５ａを生成する。

グルーピングデータ１５ａは、図１３に示すように、グループＩＤ、ＣＲＩＤ、キャスト情報／キーワードおよび適合度が対応づけられたデータである。グルーピングデータ１５ａのキャスト情報／キーワードの項目において、キャスト情報グルーピングデータ１２ａから生成されたグループについては、当該コンテンツのキャスト情報が設定される。また、グルーピングデータ１５ａのキャスト情報／キーワードの項目において、シノプシス情報グルーピングデータ１４ａから生成されたグループについては、当該コンテンツに関連するキーワードが設定される。

図１４を参照して、集計手段２５による集計処理を説明する。まずステップＳ４０１において集計手段２５は、記憶装置１０から、キャスト情報グルーピングデータ１２ａおよびシノプシス情報グルーピングデータ１４ａを読み出し、ステップＳ４０２において、これらに含まれるグループの数をカウントする。

ステップＳ４０３において集計手段２５は、推薦成形データ１６ａに含ませる規定のグループ数と比べて、同等以下かどうかを判定する。同等以下の場合、集計手段２５は、ステップＳ４０５に進む。

多い場合、ステップＳ４０４において、キャスト情報グルーピングデータ１２ａおよびシノプシス情報グルーピングデータ１４ａに含まれるグループから、規定数のグループを選択する。集計手段２５は、例えば、各グループにおいて最も適合度の高いコンテンツ同士を比較する。集計手段２５は、高い適合度を持つコンテンツを含むグループを、適合度の高い順に規定のグループ数だけ選択し、ステップＳ４０５に進む。

ステップＳ４０５において集計手段２５は、キャスト情報グルーピングデータ１２ａおよびシノプシス情報グルーピングデータ１４ａから、グルーピングデータ１５ａを生成する。

スニペット生成手段２６は、グルーピングデータ１５ａに含まれる各コンテンツについて、各コンテンツのシノプシス情報に含まれる、キャスト情報またはキーワードのフォントを強調フォントにして、スニペットを生成して、推薦成形データ１６ａを出力する。推薦成形データ１６ａは、グループＩＤと、グループに含まれるＣＲＩＤと、シノプシス情報から生成されたスニペットと、が対応づけられたデータである。

具体的にはスニペット生成手段２６は、グルーピングデータ１５ａのうち、キャスト情報グルーピングデータ１２ａに含まれていた各グループについて、当該グループに対応づけられたコンテンツの識別子に対応するメタデータのシノプシス情報を取得する。さらにスニペット生成手段２６は、当該グループのすべてのコンテンツに共通して含まれるキャスト名に基づいて、シノプシス情報からスニペットを生成する。例えば、図１３に示すグループＩＤ”ＧＲ００１”については、キャスト名”トニー・デッブ”すべてのコンテンツに含まれている。従って、スニペット生成手段２６は、グループＩＤ”ＧＲ００１”に含まれる各コンテンツのシノプシス情報について、各コンテンツに共通するキャスト名”トニー・デッブ”に強調表示のための加工を施して、スニペット情報を生成する。ここで強調表示のための加工とは、フォントを変える、ハイライト表示するなどである。

またスニペット生成手段２６は、グルーピングデータ１５ａのうち、シノプシス情報グルーピングデータ１４ａに含まれていた各グループについて、各グループに対応づけられたコンテンツの識別子に対応するメタデータのシノプシス情報を取得する。スニペット生成手段２６は、当該キーワードに基づいて、シノプシス情報からスニペットを生成する。例えば、図１３に示すグループＩＤ”ＧＲ１０１”については、キーワードとして”ファンタジー”が対応づけられている。従って、スニペット生成手段２６は、グループＩＤ”ＧＲ１００１”に含まれる各コンテンツのシノプシス情報について、”ファンタジー”に強調表示のための加工を施して、スニペット情報を生成する。ここで強調表示のための加工とは、フォントを変える、ハイライト表示するなどである。

ここでスニペット情報を生成する際、スニペット生成手段２６は、シノプシス情報から、キャスト情報またはキーワードが完全に一致する単語を含む文節を抽出する。あるいは、スニペット生成手段２６は、検索エンジンで検索結果のページのスニペットを生成する従来技術を用いて、スニペットを生成しても良い。このようにスニペットを生成することにより、ユーザの嗜好を導くキャスト情報やキーワードを、明示的に表示することができる。これにより、シノプシス情報が長く、すべてのシノプシス情報を表示するための十分なスペースを確保しづらい問題や、すべてのシノプシス情報を表示すると、視認性が低下する問題を、回避することができる。

スニペット生成手段２６は、グループＩＤ、グループに含まれるＣＲＩＤ、およびスニペット情報を関連づけて、推薦成形データ１６ａを出力する。ここで、推薦成形データ１６ａに、各コンテンツのサムネイルや公開年などの情報が含まれても良い。

図１５を参照して、スニペット生成手段２６によるスニペット生成処理を説明する。スニペット生成手段２６は、グルーピングデータ１５ａのすべてのコンテンツについて、ステップＳ５０１ないしステップＳ５０３の処理を繰り返す。

ステップＳ５０１においてスニペット生成手段２６は、当該コンテンツが、キャスト情報グルーピングデータに含まれたデータでキャスト情報が対応づけられているか、あるいはシノプシス情報グルーピングデータに含まれたデータでキーワードが対応づけられているかを判定する。キャスト情報が対応づけられている場合、ステップＳ５０２においてスニペット生成手段２６は、当該コンテンツのシノプシス情報に含まれるキャスト情報に基づいて、スニペットを生成する。一方、キーワードが対応づけられている場合、ステップＳ５０３においてスニペット生成手段２６は、当該コンテンツのシノプシス情報に含まれるキーワードに基づいて、スニペットを生成する。

すべてのコンテンツについて、ステップＳ５０１ないしステップＳ５０３の処理が終了すると、スニペット生成手段２６は、処理を終了する。

出力手段２７は、記憶装置１０から推薦成形データ１６ａを読み出し、情報提供装置１０４に出力する。情報提供装置１０４は、例えば、ユーザ端末１０５からのリクエストに応じて、図２に示すような推薦成形データ表示画面Ｐ１０１をユーザ端末１０５に出力する。

本発明の実施の形態に係る推薦データ成形装置１によれば、ユーザの興味のあるキャスト情報やキーワードをもとに、ユーザに推薦するコンテンツをグルーピングしてユーザに表示することができる。これにより、ユーザの興味に応じて推薦結果を表示することができ、推薦するコンテンツに対するユーザの興味を高めることができる。また、ユーザに推薦するコンテンツに対応して表示するスニペットにおいて、ユーザの興味のあるキャスト情報やキーワードを強調表示することにより、よりユーザの興味を高めることができる。

（その他の実施の形態）
上記のように、本発明の実施の形態によって記載したが、この開示の一部をなす論述および図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例および運用技術が明らかとなる。

例えば、本発明の実施の形態に記載した推薦データ成形装置は、図１に示すように一つのハードウェア上に構成されても良いし、その機能や処理数に応じて複数のハードウェア上に構成されても良い。また、既存の情報処理システム上に実現されても良い。

本発明はここでは記載していない様々な実施の形態等を含むことは勿論である。従って、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。

１推薦データ成形装置
１０記憶装置
１１推薦コンテンツメタデータ記憶部
１２キャスト情報グルーピングデータ記憶部
１３キーワードデータ記憶部
１４シノプシス情報グルーピングデータ記憶部
１５グルーピングデータ記憶部
１６推薦成形データ記憶部
２０中央処理制御装置
２１推薦コンテンツメタデータ取得手段
２２キャスト情報分析手段
２３キーワード生成手段
２４シノプシス情報分析手段
２５集計手段
２６スニペット生成手段
２６出力手段
１００推薦装置
１０１推薦コンテンツデータ記憶部
１０２コンテンツメタデータ記憶部
１０３クエリログデータ記憶部
１０４情報提供装置
１０５ユーザ端末

Claims

ユーザに推薦するコンテンツを、複数のグループにわけて出力する推薦データ成形方法であって、
コンピュータが、前記ユーザに推薦するコンテンツの識別子と、当該ユーザへ当該コンテンツを推薦することの適切さを示す適合度を対応づけた推薦コンテンツデータと、当該コンテンツのキャスト名であるキャスト情報を含むメタデータとを取得するステップと、
前記コンピュータが、前記キャスト情報の一致度の高い所定数ｎのコンテンツをグルーピングし、グループ識別子と、当該グループに含まれるコンテンツの識別子と、を対応づけたキャスト情報グルーピングデータを、出力するステップと、を備え、
前記出力するステップは、所定のキャスト情報に対応づけられるコンテンツ数が前記所定数ｎよりも多い場合、当該キャスト情報に対応づけられるコンテンツを適合度の順にｎ段階に分割し、各段階からコンテンツを選択してグルーピングする
ことを特徴とする推薦データ成形方法。
前記メタデータは、シノプシス情報を含み、
前記コンピュータが、前記ユーザのクエリログデータから、映像視聴と関係の深いクエリと共起するクエリに基づいて、当該ユーザのキーワードを生成するステップと、
前記コンピュータが、前記シノプシス情報に含まれる有意味語と前記キーワードとの類似度に基づいて、類似度の高い前記所定数のコンテンツをグルーピングし、グループ識別子と、当該グループに含まれるコンテンツの識別子と、当該キーワードとを対応づけたシノプシス情報グルーピングデータを出力するステップと、
をさらに備えることを特徴とする請求項１に記載の推薦データ成形方法。
前記コンピュータが、
前記キャスト情報グルーピングデータに含まれる各グループについて、当該グループに対応づけられたコンテンツの識別子に対応するメタデータのシノプシス情報を取得するとともに、当該グループの複数のコンテンツに含まれるキャスト名に基づいて、前記シノプシス情報からスニペットを生成し、
前記シノプシス情報グルーピングデータに含まれる各グループについて、各グループに対応づけられたコンテンツの識別子に対応するメタデータのシノプシス情報を取得するとともに、当該キーワードに基づいて、前記シノプシス情報からスニペットを生成して、推薦成形データを出力するステップ
をさらに備えることを特徴とする請求項２に記載の推薦データ成形方法。
ユーザに推薦するコンテンツを、複数のグループにわけて出力する推薦データ成形装置であって、
前記ユーザに推薦するコンテンツの識別子と、当該ユーザへ当該コンテンツを推薦することの適切さを示す適合度を対応づけた推薦コンテンツデータと、当該コンテンツのキャスト名であるキャスト情報を含むメタデータとを取得する推薦コンテンツメタデータ取得手段と、
前記キャスト情報の一致度の高い所定数ｎのコンテンツをグルーピングし、グループ識別子と、当該グループに含まれるコンテンツの識別子と、を対応づけたキャスト情報グルーピングデータを、出力するキャスト情報分析手段と、を備え、
前記キャスト情報分析手段は、所定のキャスト情報に対応づけられるコンテンツ数が前記所定数ｎよりも多い場合、当該キャスト情報に対応づけられるコンテンツを適合度の順にｎ段階に分割し、各段階からコンテンツを選択してグルーピングする
ことを特徴とする推薦データ成形装置。
前記メタデータは、シノプシス情報を含み、
前記ユーザのクエリログデータから、映像視聴と関係の深いクエリと共起するクエリに基づいて、当該ユーザのキーワードを生成するキーワード生成手段と、
前記シノプシス情報に含まれる有意味語と前記キーワードとの類似度に基づいて、類似度の高い前記所定数のコンテンツをグルーピングし、グループ識別子と、当該グループに含まれるコンテンツの識別子と、当該キーワードとを対応づけたシノプシス情報グルーピングデータを出力するシノプシス情報分析手段と、
をさらに備えることを特徴とする請求項４に記載の推薦データ成形装置。
前記キャスト情報グルーピングデータに含まれる各グループについて、当該グループに対応づけられたコンテンツの識別子に対応するメタデータのシノプシス情報を取得するとともに、当該グループの複数のコンテンツに含まれるキャスト名に基づいて、前記シノプシス情報からスニペットを生成し、
前記シノプシス情報グルーピングデータに含まれる各グループについて、各グループに対応づけられたコンテンツの識別子に対応するメタデータのシノプシス情報を取得するとともに、当該キーワードに基づいて、前記シノプシス情報からスニペットを生成して、推薦成形データを出力するスニペット生成手段
をさらに備えることを特徴とする請求項５に記載の推薦データ成形装置。
コンピュータを、請求項４ないし請求項６のいずれか１項に記載の手段として機能させるためのコンテンツ収集プログラム。