WO2007013390A1

WO2007013390A1 - 情報処理装置、特徴抽出方法、記録媒体、および、プログラム

Info

Publication number: WO2007013390A1
Application number: PCT/JP2006/314558
Authority: WO
Inventors: Mitsuhiro Miyazaki
Original assignee: Sony Corporation
Priority date: 2005-07-26
Filing date: 2006-07-24
Publication date: 2007-02-01
Also published as: KR20080031148A; JP2007058842A; EP1909194A4; EP1909194A1

Abstract

本発明は、複数の要素を分類したクラスの特徴を簡単かつ正確に抽出することができる情報処理装置、特徴抽出方法、記録媒体、および、プログラムに関する。組み合わせ抽出部８３は、コンテンツ分類部８１がユーザの指令に基づいて複数のコンテンツを分類したクラスの特徴として、特徴を抽出する対象となる特徴抽出対象クラスに属するコンテンツごとのメタデータの全ての組み合わせのうち、他のクラスに属するコンテンツごとのメタデータの組み合わせには存在しないメタデータの組み合わせを抽出する。本発明は、推薦システムに適用することができる。

Description

明細書

情報処理装置、特徴抽出方法、記録媒体、および、プログラム

技術分野

[0001] 本発明は、情報処理装置、特徴抽出方法、記録媒体、および、プログラムに関し、特に、複数の要素を分類したクラスの特徴を簡単かつ正確に抽出できるようにした情報処理装置、特徴抽出方法、記録媒体、および、プログラムに関する。

背景技術

[0002] 従来、視聴者が番組を視聴中に番組に関連する情報をサーバに要求し、視聴中の番組に予め関連づけられて記憶されて！、る番組関連情報を視聴者に提供するシステムが提案されている (例えば、特許文献 1参照)。

[0003] また、近年、特許文献 1に記載の発明のようにユーザの要求に応えるだけではなく、商品の購入、コンテンツ（例えば、テレビジョン番組や Webページなど）の視聴などの過去のユーザの実績に基づいて、ユーザの嗜好に合わせた商品やコンテンツを推薦するシステムやサービスが普及してきて、る。

[0004] 例えば、視聴者が選択した番組および選択しなカゝつた番組の番組名を構成する語句を評価し、評価が高い語句を番組名に含む番組候補を優先して表示することが提案されている（例えば、特許文献 2参照)。

[0005] 特許文献 1 :特開 2005— 102109号公報

特許文献 2：特開 2001— 275056号公報

発明の開示

発明が解決しょうとする課題

[0006] し力しながら、現状の商品やコンテンツを推薦するシステムやサービスにおいては、ユーザの過去の実績に基づいて、例えば、類似した購買パターンを有する他のユーザの購買履歴を利用する強調フィルタリングなどの推薦アルゴリズムを用いる場合が多いが、この場合、ユーザに明確な推薦理由を提示することが困難である。

[0007] また、例えば、データ集合力規則または知識を発見するための理論であるラフ集合理論を用いて、ユーザが過去に購入した商品、視聴したコンテンツなどのデータ属性の中から、ユーザの嗜好を示すデータ属性の組み合わせを推薦理由として抽出することが考えられるが、アルゴリズムが複雑かつ膨大になり、計算量および計算に必要な記憶媒体の記憶容量が膨大になってしまう。そのため、商品やコンテンツなどに関連づけるデータ属性の数や種類を制限したり、あるいは、処理能力が高いコンビュータを準備するといつた対応が必要となる。

[0008] また、特許文献 2に記載の発明では、選択した番組の番組名を構成する語句から、選択しなカゝつた番組名を構成する語句を単純に差し引いて、残った語句を含む番組を推薦するものであり、必ずしもユーザの嗜好を正確に抽出し、反映しているとは限らない。

[0009] 本発明は、このような状況に鑑みてなされたものであり、複数の要素を分類したクラスの特徴を簡単かつ正確に抽出できるようにするものである。

課題を解決するための手段

[0010] 本発明の一側面の情報処理装置には、各要素の特徴を表すデータがそれぞれ関連づけられている複数の前記要素を分類したクラスの特徴として、特徴を抽出する対象となる前記クラスに属するそれぞれの前記要素について前記要素に関連づけられている 1つ以上の前記データを取り出すことにより求められる前記データの全ての組み合わせのうち、他の前記クラスに属するそれぞれの前記要素につ、て前記要素に関連づけられている 1つ以上の前記データを取り出すことにより求められる前記データの組み合わせには存在しない前記データの組み合わせを抽出する特徴抽出手段が設けられている。

[0011] 抽出された前記データの組み合わせのうち 1つ以上を前記クラスの特徴としてユーザに提示するように前記クラスの特徴の提示を制御する特徴提示制御手段をさらに設けることができる。

[0012] 前記クラスに属する前記要素と前記データとの第 1の関連度、および、他の前記クラスに属する前記要素と前記データとの第 2の関連度と前記第 1の関連度との違いに基づいて、前記クラスに属する前記要素の特徴をより明確に表している前記データを、前記データの組み合わせを抽出する前に抽出するデータ抽出手段をさらに設け、前記特徴抽出手段には、前記データ抽出手段により抽出された前記データの組み合わせを抽出させることができる。

[0013] 前記データ抽出手段には、前記第 1の関連度、および、前記第 2の関連度と前記第 1の関連度との違いに基づいて、前記クラスにおける前記データの重みを求め、前記重みの値が上位である所定の数の前記データ、または、前記重みの値が所定の閾値以上の前記データを抽出させることができる。

[0014] Hij gd " ~~タ抽出牛段には、 tfiaf(term frequency with inverse document frequency;

、相互情報量、情報利得比、 X 2乗値、または、対数尤度比のうちいずれかを前記クラスにおける前記データの重みとして求めさせることができる。

[0015] 抽出された前記データの組み合わせに基づいて、前記要素により構成される第 1のグループとは異なる第 2のグループに属する要素の中から、前記データの組み合わせが抽出された前記クラスに属する前記要素と関連のある要素を抽出する要素抽出手段をさらに設けることができる。

[0016] 前記要素抽出手段には、抽出された前記データの組み合わせを含む前記データが関連づけられている前記第 2のグループに属する前記要素を抽出させるようにすることができる。

[0017] 抽出された前記要素のユーザへの提示を制御する要素提示制御手段をさらに設けることができる。

[0018] 前記要素提示制御手段には、前記要素を抽出した根拠として、前記要素の抽出に用いた前記データの組み合わせをさらに提示するように制御させることができる。

[0019] 前記要素はコンテンツであり、前記データは前記コンテンツに関するメタデータであるよう〖こすることがでさる。

[0020] 抽出された前記データの組み合わせと前記データの組み合わせが抽出された前記クラスである抽出対象クラスに属する前記要素との関連度を示す評価指標を算出する評価指標算出手段をさらに設けることができる。

[0021] 前記評価指標算出手段には、前記抽出対象クラスに属する前記要素のうち、前記データの組み合わせを含む前記データが関連づけられている前記要素の占める割合である再現率、および、前記データの組み合わせを含む前記データが関連づけられている前記要素のうち、前記抽出対象クラスに属する前記要素の占める割合である適合率の調和平均である F値を前記評価指標として算出させることができる。

[0022] 分類する対象となる要素に関連づけられている前記データの組み合わせに対する前記評価指標に基づいて、前記分類する対象となる要素を前記クラスに分類するクラス分類手段をさらに設けることができる。

[0023] 分類する対象となる要素に関連づけられている前記データの組み合わせのうち、それぞれの前記クラス力抽出された前記データの組み合わせに一致する数に基づいて、前記分類する対象となる要素を前記クラスに分類するクラス分類手段をさらに設けることができる。

[0024] 特徴を提示する対象となる要素に関連づけられて、る前記データの組み合わせのうち、それぞれの前記クラス力抽出された前記データの組み合わせに一致する前記データの組み合わせに含まれる前記データ、および、一致する前記データの組み合わせが抽出された前記クラスに基づいて、前記特徴を提示する対象となる要素の特徴を提示する特徴提示手段をさらに設けることができる。

[0025] 本発明の一側面の特徴抽出方法またはプログラムは、各要素の特徴を表すデータがそれぞれ関連づけられて、る複数の前記要素を分類したクラスの特徴として、特徴を抽出する対象となる前記クラスに属するそれぞれの前記要素について前記要素に関連づけられている 1つ以上の前記データを取り出すことにより求められる前記データの全ての糸且み合わせのうち、他の前記クラスに属するそれぞれの前記要素について前記要素に関連づけられている 1つ以上の前記データを取り出すことにより求められる前記データの組み合わせには存在しない前記データの組み合わせを抽出するステップを含む。

[0026] 本発明の一側面においては、各要素の特徴を表すデータがそれぞれ関連づけられている複数の前記要素を分類したクラスの特徴として、特徴を抽出する対象となる前記クラスに属するそれぞれの前記要素について前記要素に関連づけられている 1 つ以上の前記データを取り出すことにより求められる前記データの全ての組み合わせのうち、他の前記クラスに属するそれぞれの前記要素について前記要素に関連づけられている 1つ以上の前記データを取り出すことにより求められる前記データの組み合わせには存在しない前記データの組み合わせが抽出される。発明の効果

[0027] 以上のように、本発明の一側面によれば、複数の要素を分類したクラスの特徴を抽出することができる。また、本発明の一側面によれば、複数の要素を分類したクラスの特徴を簡単かつ正確に抽出することができる。

図面の簡単な説明

[0028] [図 1]本発明を適用した情報処理システムの第 1の実施の形態を示すブロック図である。

[図 2]図 2のクライアント演算部の機能の構成の例を示すブロック図である。

[図 3]コンテンツに関連づけられているメタデータの例を示す図である。

[図 4]図 1の情報処理システムにより実行されるキーワード抽出処理を説明するためのフローチャート図ある。

[図 5]コンテンツを分類する視点を説明するための図である。

[図 6]メタデータの抽出の例を説明するための図である。

[図 7]図 4のステップ S3のメタデータ抽出処理の詳細を説明するためのフローチヤ一トである。

[図 8]抽出したキーワードをユーザに提示する画面の例である。

[図 9]抽出したキーワードをユーザに提示する画面の他の例である。

[図 10]図 1の情報処理システムにより実行されるコンテンツ推薦処理を説明するためのフローチャートである。

[図 11]本発明を適用した情報処理システムの第 2の実施の形態を示すブロック図である。

[図 12]図 11のクライアント演算部の機能の構成の例を示すブロック図である。

[図 13]図 11の情報処理システムにより実行されるコンテンツ分類処理の第 1の実施の形態を説明するためのフローチャートである。

[図 14]コンテンツを分類する視点を説明するための図である。

[図 15]メタデータの抽出の例を説明するための図である。

[図 16]図 11の情報処理システムにより実行されるコンテンツ分類処理の第 2の実施の形態を説明するためのフローチャートである。 [図 17]パーソナルコンピュータの構成の例を示すブロック図である。

符号の説明

[0029] 1 情報処理システム， 11 コンテンツ視聴クライアント， 12 コンテクスト検出端末， 13 コンテンツ配信サーバ， 14 コンテンツ推薦サーバ， 21 ユーザ入力部， 22 クライアント演算部， 23 クライアント記憶部， 24 クライアント出力部， 41 コンテンツ配信部， 81 コンテンツ分類部， 82 メタデータ抽出部， 83 組み合わせ抽出部， 84 キーワード提示部， 85 推薦コンテンツ抽出部， 86 推薦コンテンツ提示咅 201 †青報処理システム， 211 コンテンツ視クライアント , 212 コンテクスト検出端末， 213 コンテンツ配信サーバ， 214 コンテンツ推薦サーバ， 221 ユーザ入力部， 222 クライアント演算部， 223 クライアント記憶部， 224 クライアント出力部， 241 コンテンツ配信部， 281 コンテンツ分類部， 282 メタデータ抽出部， 283 組み合わせ抽出部， 291 コンテンツ分類ルール生成部， 292 コンテンツ自動分類部， 293 分類結果提示部， 901 C PU, 902 ROM, 903 RAM, 908 記録部， 910 ドライブ， 911 リムーバブルメディア

発明を実施するための最良の形態

[0030] 以下、図を参照して、本発明の実施の形態について説明する。

[0031] 図 1は、本発明を適用した情報処理システム 1の一実施の形態を示すブロック図である。

[0032] 情報処理システム 1は、コンテンツ視聴クライアント 11、コンテクスト検出端末 12、コンテンッ配信サーバ 13、および、コンテンツ推薦サーバ 14を含むように構成される。

[0033] コンテンツ視クライアント 11は、例えば、クライアントコンピュータ、コンシユーマエレクト口-タス機器 (CE機器)、携帯型情報端末などにより構成される。コンテンツ視聴クライアント 11は、クライアント記憶部 23に記憶されているコンテンツをユーザに提示したり、コンテンツ配信サーバ 13から配信されるコンテンツを受信して、ユーザに提示したりする。

[0034] なお、本明細書において、コンテンツとは、一般的にコンテンツと称されている、例えば、テレビジョン番組、映画、写真、楽曲等 (動画像、静止画像、若しくは音声、または、それらの組み合わせ等)の他、各種の情報、文書、商品（物品含）、会話等のユーザが使用可能なソフトウェアまたはハードウェアの全てを指す広い概念である。ただし、コンテンツが物品（ノヽ一ドウエア）の場合、例えば、その物品が動画像や静止画像等に射影されてデータ化されたものが、コンテンツデータとして使用される。

[0035] また、情報処理システム 1により扱われる各コンテンツには、図 3を参照してその例を示すように、各コンテンツの特徴を表すメタデータがそれぞれ関連づけられてヽる。

[0036] コンテンツ視聴クライアント 11は、機能的構成の観点に立つと、ユーザ入力部 21、クライアント演算部 22、クライアント記憶部 23、および、クライアント出力部 24を含むように構成される。

[0037] ユーザ入力部 21は、コンテンツ視聴クライアント 11に対する操作をユーザが行うための入力機器であって、例えば、キーボード、マウス、リモコン、タツチパネル、マイク等で構成される。ユーザ入力部 21を利用してユーザが入力した操作内容、正確には、その操作内容を示す情報は、クライアント演算部 22に供給される。

[0038] クライアント演算部 22は、例えば、ここでは、 CPU (Central Processing Unit)とそれが実行するプログラム、すなわち、ハードウェアとソフトウェアとの組み合わせにより構成される。もちろん、クライアント演算部 22は、ソフトウェアまたはハードウェア単体で構成することちできる。

[0039] クライアント演算部 22は、クライアント出力部 24を制御して、クライアント記憶部 23 に記憶されているコンテンツをユーザに提示する。また、クライアント演算部 22は、ュ一ザにより指定された視点に基づいて、クライアント記憶部 23に記憶されているコンテンッの一部または全部を複数のクラスに分類する。クライアント演算部 22は、図 7を参照して後述するように、必要に応じて、コンテクスト検出端末 12から供給されるコンテクスト情報、または、ユーザ入力部 21から供給されるユーザの操作内容を示す情報を用いて、分類したクラスの特徴を表すメタデータの組み合わせを抽出する。クライアント演算部 22は、クライアント出力部 24を制御して、抽出したメタデータの組み合わせをそのクラスの特徴としてユーザに提示する。

[0040] また、クライアント演算部 22は、図 10を参照して後述するように、抽出したメタデータの組み合わせに基づ、て、クライアント記憶部 23に記憶されて、るコンテンツの中から、ユーザに推薦するコンテンツを抽出する。クライアント演算部 22は、クライアント出力部 24を制御して、抽出したコンテンツに関する情報をユーザに提示する。

[0041] さらに、クライアント演算部 22は、抽出したメタデータの組み合わせの一部または全部を含み、そのメタデータの組み合わせに基づいてユーザに推薦するコンテンツを抽出するように要求する情報 (以下、推薦コンテンツ抽出要求情報と称する）をクライアント記憶部 23に記憶させる。クライアント演算部 22は、それに対する抽出結果を示す情報をクライアント記憶部 23から取得する。クライアント演算部 22は、抽出結果に基づいて、クライアント出力部 24を制御して、抽出されたコンテンツに関する情報をユーザに提示する。

[0042] また、クライアント演算部 22は、ユーザにより分類されたクラスに関する情報およびそのクラス属するコンテンツに関するメタデータを含み、そのクラスの特徴を表すメタデータの組み合わせの抽出を要求する情報 (以下、組み合わせ抽出要求情報と称する）をクライアント記憶部 23に記憶させる。クライアント演算部 22は、組み合わせ抽出要求情報に対する抽出結果を示す情報をクライアント記憶部 23から取得する。クライアント演算部 22は、抽出結果に基づいて、クライアント出力部 24を制御して、抽出されたメタデータの組み合わせをユーザに提示する。

[0043] さらに、クライアント演算部 22は、コンテンツの配信 (送信)を要求する情報をクライアント記憶部 23に記憶させる。

[0044] クライアント記憶部 23は、例えば、ハードディスクや RAM (Random Access Memory) などの記録媒体または記憶媒体を含むように構成される。クライアント記憶部 23は、ククライアント演算部 22が利用するコンテクスト情報、および、ユーザの操作指令を示す情報を適宜記憶する。また、クライアント記憶部 23は、コンテクスト情報、ユーザの操作内容を示す情報、推薦コンテンツ抽出要求情報、または、組み合わせ抽出要求情報を、必要に応じて、コンテンツ推薦サーバ 14のサーバ記憶部 51に送信する。さらに、クライアント記憶部 23は、コンテンツの配信を要求する情報をコンテンツ配信サーバ 13のコンテンツ配信部 41に送信する。

[0045] また、クライアント記憶部 23は、サーバ記憶部 51から送信されてくる、コンテンツに関するメタデータ、ユーザに推薦するコンテンツの抽出結果を示す情報、および、メタデータの組み合わせの抽出結果を示す情報を記憶する。さらに、クライアント記憶部 23は、コンテンツ配信部 41から送信されてくるコンテンツを記憶する。また、クライアント記憶部 23は、コンテンツ、または、コンテンツに関するメタデータを受信したことを通知する情報をクライアント演算部 22に供給する。さらに、クライアント記憶部 23は、記憶しているコンテンツ、または、コンテンツのメタデータをクライアント出力部 24に供給する。

[0046] クライアント出力部 24は、例えば、モニタまたはプリンタなどの画像出力機器、スピ一力などの音声出力機器などにより構成される。クライアント出力部 24は、クライアント記憶部 23に記憶されているコンテンツを、画像、テキスト情報、もしくは、音声、または、画像もしくはテキスト情報を印刷した媒体などの形式によりユーザに提示する。また、クライアント出力部 24は、クライアント演算部 22の制御の基に、クライアント記憶部 23に記憶されてヽるコンテンツを分類したクラスの特徴を表すメタデータの組み合わせ、または、ユーザに推薦するコンテンツに関する情報をユーザに提示する。

[0047] コンテクスト検出端末 12は、機能的構成の観点に立つと、コンテクスト検出部 31、および、コンテクスト記憶部 32を含むように構成される。

[0048] コンテクスト検出部 31は、例えば、ユーザの状態や感情、ユーザが置かれている状況 (例えば、場所や時間など)などに関するコンテクスト情報を検出する。具体的には、コンテンツ検出部 31は、ユーザの現在位置情報を検出する GPS(Global Positioning System)レシーバ、現在時刻を計時 (検出）する電波時計、ユーザの周辺に位置する人や物体を検出する無線通信機器、ユーザの脈拍、呼吸数、発汗、もしくは、瞳孔の開き等を検出する各種の生体情報センサ、カメラ、または、各種の画像を認識する画像認識装置などにより構成される。コンテクスト検出部 31は、上述したコンテクスト情報をリアルタイムに検出し、検出したコンテクスト情報をコンテクスト記憶部 32に記憶させる。また、コンテクスト検出端末 12は、コンテンツ視聴クライアント 11のクライアント演算部 22に、検出したコンテクスト情報を供給する。

[0049] コンテクスト記憶部 32は、例えば、ハードディスクや RAMなどの記録媒体または記憶媒体を含むように構成され、コンテクスト検出部 31から供給される時系列に沿ったコンテクスト情報を格納する。 [0050] コンテンツ配信サーバ 13は、例えば、コンテンツを配信するための放送機器、または、サーバコンピュータなどにより構成される。コンテンツ配信サーバ 13は、機能的構成の観点に立つと、コンテンツ配信部 41、および、コンテンツメタデータ記憶部 42 を含むように構成される。

[0051] コンテンツ配信部 41は、例えば、ここでは、 CPUとそれが実行するプログラム、すなわち、ハードウェアとソフトウェアとの組み合わせにより構成される。もちろん、コンテンッ配信部 41は、ソフトウェアまたはハードウェア単体で構成することもできる。具体的には、例えば、コンテンツ配信部 41は、テレビジョン放送システムの配信サーバ、または、インターネット上のストリーミングコンテンツサーバなどにより構成される。コンテンッ配信部 41は、コンテンツ視聴クライアント 11のクライアント記憶部 23にコンテンッを配信 (送信)する。

[0052] コンテンツメタデータ記憶部 42は、例えば、ハードディスクや RAM等の記録媒体または記憶媒体を含むように構成され、コンテンツ配信サーバ 13が配信可能なコンテンッ、および、コンテンツに関するデータであるメタデータを記憶する。なお、コンテンッメタデータ記憶部 42に記憶されて、るコンテンツまたはメタデータは、コンテンツ配信元の運用ルール等に従って適宜更新される。

[0053] コンテンツ推薦サーバ 14は、例えば、サーバコンピュータにより構成される。コンテンッ推薦サーバ 14は、機能的構成の観点に立つと、サーバ記憶部 51、および、サーバ演算部 52を含むように構成される。

[0054] サーバ記憶部 51は、例えば、ハードディスクや RAM等の記録媒体または記憶媒体を含むように構成される。サーバ記憶部 51は、コンテンツ配信サーバ 13のコンテンツメタデータ記憶部 42に記憶されてヽる各コンテンツのメタデータを、適宜取得して記憶するとともに、必要に応じて、コンテンツ視聴クライアント 11のクライアント記憶部 23 に送信する。また、サーバ記憶部 51は、クライアント記憶部 23から送信されてくる、コンテクスト情報、ユーザの操作内容を示す情報、推薦コンテンツ抽出要求情報、または、組み合わせ抽出要求情報を記憶する。さらに、サーバ記憶部 51は、サーバ演算部 52から供給される、ユーザに推薦するコンテンツの抽出結果を示す情報、または、メタデータの組み合わせの抽出結果を示す情報を記憶するとともに、クライアント記憶部 23、または、コンテンツメタデータ記憶部 42に送信する。

[0055] サーバ演算部 52は、例えば、ここでは、 CPUとそれが実行するプログラム、すなわち、ハードウェアとソフトウェアとの組み合わせにより構成される。もちろん、サーバ演算部 52は、ソフトウェアまたはハードウェア単体で構成することもできる。

[0056] サーバ演算部 52は、サーバ記憶部 51に記憶されている、ユーザの操作内容を示す情報、コンテクスト情報、または、推薦コンテンツ抽出要求情報に基づいて、サーバ記憶部 51にメタデータが記憶されて、るコンテンツの中から、ユーザに推薦するコンテンッを抽出する。サーバ演算部 52は、ユーザに推薦するコンテンツの抽出結果を示す情報をサーバ記憶部 51に記憶させる。

[0057] また、サーバ演算部 52は、サーバ記憶部 51に記憶されている、ユーザの操作内容を示す情報、コンテクスト情報、または、組み合わせ抽出要求情報に基づいて、そのクラスの特徴を表すメタデータの組み合わせを抽出する。サーバ演算部 52は、メタデータの組み合わせの抽出結果を示す情報をサーバ記憶部 51に記憶させる。

[0058] ところで、図 1は、機能的構成例を示しているため、各装置間の接続形態、すなわち、コンテンツ視聴クライアント 11乃至コンテンッ推薦サーバ 14のそれぞれの間の接続の形態は特に図示されていないが、その接続の形態は特に限定されない。すなわち、接続の形態は、有線であってもよいし無線であってもよいし、その組み合わせでもよい。また、接続の形態は、ネットワークを介在する形態であってもよいし、装置間で直接通信を行う形態であってもよいし、その組み合わせでもよい。さらに、ネットヮークを介在する形態の場合も、ネットワークの形態は限定されず、例えば、インターネットゃイントラネット等でもよい。この場合も、ネットワークは単一のネットワークに限定されず、複数のネットワークが存在してもよい。従って、図 1には図示されていないが、実際には、コンテンツ視聴クライアント 11乃至コンテンツ推薦サーバ 14のそれぞれには、対応する接続形態に応じた通信部がさらに設けられることになる。

[0059] また、コンテクスト検出端末 12、コンテンツ配信サーバ 13、および、コンテンツ推薦サーバ 14は、情報処理システム 1において必須な構成要素ではない。すなわち、図 4乃至図 10を参照して後述するように、情報処理システム 1により行われるキーワード抽出処理およびコンテンツ推薦処理は、コンテンツ視聴クライアント 11のみで実現することが可能である。

[0060] 図 2は、クライアント演算部 22の機能の構成の例を示すブロック図である。クライアント演算部 22は、コンテンツ分類部 81、メタデータ抽出部 82、組み合わせ抽出部 83 、キーワード提示部 84、推薦コンテンツ抽出部 85、および、推薦コンテンツ提示部 8 6を含むように構成される。

[0061] コンテンツ分類部 81は、ユーザ入力部 21を介してユーザが入力したコンテンツを分類する視点を示す情報をユーザ入力部 21から取得する。コンテンツ分類部 81は、図 4を参照して後述するように、指定された視点に基づいて、コンテンツ記憶部 23に記憶されているコンテンツの一部または全部により構成されるグループを複数のクラスに分類する。コンテンツ分類部 81は、分類したクラスに関する情報をメタデータ抽出部 82に供給する。また、コンテンツ分類部 81は、必要に応じて、組み合わせ抽出要求情報を、クライアント記憶部 23およびサーバ記憶部 51を介して、サーバ演算部 52に送信する。

[0062] メタデータ抽出部 82は、図 4を参照して後述するように、対象となるクラスに属するコンテンツとメタデータとの関連度、および、他のクラスに属するコンテンツとメタデータとの関連度と対象となるクラスに属するコンテンツとメタデータとの関連度との違いに基づ!/、て、対象となるクラスに属するコンテンツの特徴をより明確に表して！/ヽるメタデータを抽出する。メタデータ抽出部 82は、抽出したメタデータを示す情報を組み合わせ抽出部 83に供給する。

[0063] 組み合わせ抽出部 83は、図 7を参照して後述するように、特徴を抽出する対象となるクラスに属するそれぞれのコンテンツについてコンテンツに関連づけられている 1つ以上のメタデータを取り出すことにより求められるメタデータの全ての組み合わせのうち、他のクラスに属するそれぞれのコンテンツについて、コンテンツに関連づけられている 1つ以上のメタデータを取り出すことにより求められるメタデータの組み合わせには存在しないメタデータの組み合わせであって、メタデータ抽出部 82により抽出されたメタデータの組み合わせを抽出する。組み合わせ抽出部 83は、抽出したメタデータの組み合わせを示す情報を、キーワード提示部 84または推薦コンテンツ抽出部 85 に供給する。 [0064] また、組み合わせ抽出部 83は、コンテンツ分類部 81から送信された組み合わせ抽出要求情報に対する抽出結果を示す情報を、サーバ記憶部 51およびクライアント記憶部 23を介して、サーバ演算部 52から受信する。組み合わせ抽出部 83は、抽出されたメタデータの組み合わせを示す情報を、キーワード提示部 84または推薦コンテンッ抽出部 85に供給する。

[0065] キーワード提示部 84は、図 4を参照して後述するように、抽出されたメタデータの組み合わせのうち 1つ以上を、メタデータの組み合わせを抽出したクラスの特徴としてュ一ザに提示するように、クライアント出力部 24を制御する。また、キーワード提示部 84 は、ユーザ入力部 21を介してユーザが入力したキーワードの決定または変更を指令する情報をユーザ入力部 21から取得する。

[0066] 推薦コンテンツ抽出部 85は、図 10を参照して後述するように、組み合わせ抽出部 83により抽出されたメタデータの組み合わせに基づいて、メタデータの組み合わせが抽出されたクラスに属するコンテンツと関連のあるコンテンツを、ユーザに推薦するコンテンツとしてクライアント記憶部 23に記憶されているコンテンツの中力も抽出する。推薦コンテンツ抽出部 85は、抽出したコンテンツに関する情報を推薦コンテンツ提示部 86に供給する。

[0067] また、推薦コンテンツ抽出部 85は、組み合わせ抽出部 83により抽出されたメタデータの組み合わせに基づいて、ユーザに推薦するコンテンツを抽出するように要求する推薦コンテンツ抽出要求情報を、クライアント記憶部 23およびサーバ記憶部 51を介して、サーバ演算部 52に送信する。推薦コンテンツ抽出部 85は、推薦コンテンツ抽出要求情報に対応する抽出結果を示す情報を、サーバ記憶部 51およびクライアント記憶部 23を介して、サーバ演算部 52から受信する。推薦コンテンツ抽出部 85は、抽出されたコンテンツに関する情報を推薦コンテンツ提示部 86に供給する。また、推薦コンテンツ抽出部 85は、コンテンツ、または、コンテンツに関するメタデータを受信したことを通知する情報をクライアント記憶部 23から取得する。

[0068] 推薦コンテンツ提示部 86は、推薦コンテンツ抽出部 85により抽出されたコンテンツを推薦するコンテンツとしてユーザに提示するとともに、コンテンツを推薦した根拠（理由）として、推薦するコンテンツの抽出に用いたメタデータの組み合わせを提示するように、クライアント出力部 24を制御する。推薦コンテンツ提示部 86は、ユーザ入力部 21を介してユーザが入力した推薦したコンテンツの決定を指令する情報をユーザ入力部 21から取得する。推薦コンテンツ提示部 86は、ユーザにより決定されたコンテンッを通知する情報をクライアント記憶部 23に供給する。

[0069] 次に、図 3を参照して、情報処理システム 1で扱われるコンテンツおよびコンテンツに関連づけられているメタデータの例を説明する。図 3は、コンテンツが音楽データである場合におけるコンテンツ、および、そのメタデータの例を示している。なお、図 3には、以後の説明を簡単にするために、音楽データ (楽曲）を演奏するアーティストごとにメタデータが関連づけられている例を示している。すなわち、同じアーティストの音楽データには、全て同じメタデータが関連づけられる。もちろん、楽曲単位でメタデータを関連づけるようにしてもょ、。

[0070] なお、以下、コンテンツ Aにメタデータ Bが関連づけられている場合、コンテンツ Aがメタデータ Bを有する、または、コンテンツ Aにメタデータ Bが設定されているというような表現を適宜用いる。

[0071] 図 3の例では、各コンテンツ（アーティスト）には、色彩、ノリ、かわいらしい、ブーム、冬、センチメンタルなど、そのアーティストが演奏する楽曲の音楽性を表すキーワード力 Sメタデータとして関連づけられている。なお、このキーワードは、例えば、音楽評論家などにより専門家の視点で設定されたり、アーティストに関する評論文や紹介記事

、または、楽曲の歌詞などをテキスト解析することにより抽出される。また、音楽性を表すキーワード以外に、音楽ジャンル、アーティストの年代および出身地、音楽データから抽出される特徴量、ヒットチャート情報などの特徴を表すデータをメタデータに用いるようにしてちょい。

[0072] また、各コンテンツにおけるメタデータ（キーワード）の有無は、 0または 1の 2値により示されている。 0が設定されているメタデータは、そのアーティストが有していないメタデータ、すなわち、そのアーティストの特徴を表していないキーワードである。 1が設定されているメタデータは、そのアーティストが有しているメタデータ、すなわち、そのアーティストの特徴を表しているキーワードである。なお、元々の値が 0または 1以外の 2値以外の値を取る場合、所定の閾値を基準にして、 0または 1の 2値にメタデータが変換されて用いられる。例えば、アーティストのデビュー日がメタデータに設定されている場合、所定の日にちを基準にして、デビュー日がその日にちより前の場合、メタデータが 0に変換され、デビュー日がその日にち以降の場合、メタデータが 1に変換される。

[0073] 次に、図 4乃至図 10を参照して、情報処理システム 1により実行される処理を説明する。

[0074] まず、図 4のフローチャートを参照して、情報処理システム 1により実行されるキーヮード抽出処理を説明する。なお、この処理は、例えば、ユーザ入力部 21を介して、ュ一ザがキーワード抽出処理の開始の指令を入力した場合、開始される。

[0075] ステップ S1において、コンテンツ分類部 81は、コンテンツを分類する。具体的には、ユーザは、ユーザ入力部 21を介して、コンテンツを分類するための視点を示す情報を入力する。ユーザ入力部 21は、入力された情報をコンテンツ分類部 81に供給する。

[0076] 図 5は、コンテンツを分類するための視点の例を示す図である。なお、図 5に示される表には、図 3に示される表と比較して、分類の視点の項目が追加されている。

[0077] 図 5には、コンテンツを分類するための視点として、ユーザの好き嫌い、および、プレイリストに選択されている楽曲力否かの 2つの例が示されている。なお、プレイリストとは、ユーザが任意に選曲した楽曲により構成されるグループであり、例えば、ユーザは、プレイリスト単位で楽曲の再生を指示し、プレイリストに登録されている楽曲を順に再生させることができる。

[0078] ユーザの好き嫌!、の視点に基づ!/、てコンテンツ (アーティスト）を分類する場合、各コンテンツは、「好き」「嫌い」「どちらでもない」の 3つのクラスに分類される。この好き嫌いの評価は、ユーザが明示的に設定するようにしてもよいし、例えば、ユーザがィンターネットに接続されているサーバなど力ダウンロードした楽曲を演奏するァーティストの評価を「好き」に設定し、ユーザが削除した楽曲を演奏するアーティストの評価を「嫌い」に設定するなど、ユーザの操作履歴などに基づいて、コンテンツ視聴クライアント 11に学習させるようにするようにしてもよ!、。

[0079] プレイリスト選択曲の視点に基づいてコンテンツを分類する場合、各コンテンツは、プレイリストに選択されて、る（選択）、プレイリストに選択されて、な、（非選択)の 2 つのクラスに分類される。

[0080] コンテンツ分類部 81は、ユーザにより指定された視点に基づいて、コンテンツを複数のクラスに分類する。コンテンツ分類部 81は、分類したコンテンツのクラスに関する情報をメタデータ抽出部 82に供給する。

[0081] なお、以下の説明では、プレイリスト選択曲の視点に基づいてコンテンツが分類され、プレイリストに選択されているコンテンツのメタデータ（キーワード）を抽出する場合の例について説明する。また、以下、図 5に示されるように、プレイリスト選択曲のクラスに属する要素（コンテンツ)をアーティスト 1乃至 11とし、プレイリスト非選択曲のクラスに属する要素（コンテンツ)をアーティスト 12乃至 24とする。また、以下、キーヮードを抽出する対象となるクラスを抽出対象クラスと称し、それ以外のクラスを比較対象クラスと称する。

[0082] ステップ S2において、メタデータ抽出部 82は、メタデータの重み付けを行い、メタデータを抽出する。具体的には、メタデータ抽出部 82は、各コンテンツが有するメタデータの頻度分布を統計的尺度で測ることによりメタデータの重み付けを行う。以下に、メタデータの重み付けを行うための統計的尺度の例について説明する。

[0083] ま *f 、 tfidfUerm frequency with inverse document frequency)を用ヽる方法にっヽて説明する。

[0084] tfid 用いる場合、あるクラス Ciに属するコンテンツのうち、メタデータ Wjを有するコンテンッの出現頻度を ¾·、クラスの総数を n、メタデータ Wjを有するコンテンツが属するクラスの数を njとしたとき、以下の式（1)により算出される tfid Ci, Wj)力クラス Ciにおけるメタデータ Wjの重みに設定される。

[0085] tfidKCi, Wj) = fij X {1 + log (n/nj) } · · · ( 1 )

e

[0086] なお、式（1)では、 logの底を e (自然対数）としたが、 tfdifの値そのものはあまり重要でないため、底を 2または 10としてもよい。

[0087] 例えば、以下の条件（1)乃至（3)が成立している場合、 tfidKCi, Wj)は以下のように計算される。

[0088] (1)コンテンツ (アーティスト）を分類したクラス数 n=9とし、それぞれのクラスを C乃至 Cとする。

9

(2)メタデータ W (例えば、 [センチメンタル])を有するコンテンツが属するクラスの数 n

1

=8とする。

1

(3)クラス Cの属するコンテンツのうち、メタデータ W有するコンテンツの出現頻度（ク

1 1

ラス Cにおけるメタデータ Wを有するアーティスト数) f =5とする。

1 1 11

[0089] この場合、クラス Cにおけるメタデータ Wの重みである tfidf (C， W )は、以下の式（

1 1 1 1

2)のとおりに算出される。

[0090] tfidKC , W )=f X {1 + log(n/n )} = 5 X {1 + log(9/8)} =5.58891 (2)

1 1 11 1

[0091] すなわち、 tfidKC , W )は、メタデータ Wjの頻度による局所的重み fijに大域的重み {

1 1

l +log(nZnj)}を乗じたものである。なお、 tfidfには、例えば、以下のような特徴またはメリットがある。

[0092] ·局所的分布と大域的分布とのバランスを考慮して、メタデータの重要性を測ることができる。

•重み付けの計算式に様々なノリエーシヨンがあり、用途に応じて使い分けることができる。

•文書分類における特徴語の重み付けで広く用いられている。

[0093] なお、 fijを、クラス Ciに属するコンテンツにおけるメタデータ Wjを有するコンテンツの割合としたり、 nZnjを (コンテンツの総数 Zメタデータ Wjを有するコンテンツ数）とするようにしてもよい。

[0094] 次に、相互情報量を用いる方法について説明する。

[0095] 相互情報量を用いる場合、以下の式（3)により算出される、あるクラス Ci内におけるメタデータ Wjの相互情報量 MI(Ci, Wj)が、クラス Ciにおけるメタデータ Wjの重みに設定される。

[0096] [数 1] ^MI (^Gi，^Wj)

⁺

. . . ( 3 ) なお、 P()は、括弧内の事象が発生する確率を示す。

[0097] 例えば、以下の条件（1)乃至（5)が成立している場合、 MI(Ci, Wj)は以下のように計算される。

[0098] (1)コンテンツ (アーティスト）を分類したクラス数 n=9とし、それぞれのクラスを C乃至 Cとする。

9

(2)コンテンツの総数 numA=80とする。

(3)メタデータ W (例えば、 [センチメンタル])を有するコンテンツの総数 aFreqW= 16

1

とする。

(4)クラス Cに属するコンテンツのうち、メタデータ Wを有するコンテンツの数 aFreqW

1 1

C = 3とする。

(5)クラス Cに属するコンテンツの数 aFreqC = l lとする。

1

[0099] この場合、式（3)に出てくる各確率値は、以下の式 (4)乃至（9)のとおりとなる。

[0100] [数 2]

P(Wj) = aFreqW/numA = 16/80 = 0.2 · · · (4)

P(Cj) = aFreqC/numA = 11/80 = 0.1375 · · · (5)

P (Wj, C|) = aFreqWC/numA = 3/80 = 0.0375 · ' · (6)

P(Wj, Ci)

= (aFreqC-aFreqWC)/numA = (11 -3)/80 = 0.1 * * * (7)

= (aFreqW-aFreqWO/numA = (16-3)/80 = 0.1625 * · * (8)

= 1 - {P (Wj, C| ) +P (Wj, C| ) +P (Wj, C| ) } = 0.7 · ' · (9)

[oioi] 従って、クラス cにおけるメタデータ wの重みである MI(C , w )の値は、以下の式（

1 1 1 1

10)に示されるように、式 (4)乃至（9)により算出された値を式（3)に代入することにより求められる。

[0102] MI(C , W ) = 0.0375 Xlog {0.0375/(0.2X0.1375)1+0.1 X log {0.1/((1-0.2)X0.1

1 1 2 2

375)}+0.1625 X log {0.1625/(0.2 X (1-0.1375)1+0.7 X log {0.7/((1— 0.2) X (1— 0.

2 2

1375))}

= 0.01677···+ (-0.01375···) + (— 0.01400···) +0.01453···

= 0.00355 (10)

[0103] すなわち、相互情報量は、クラス Ciへの帰属を知ることによるメタデータ Wjのェント口ピーの減少量により計算される。なお、相互情報量には、例えば、以下のような特徴またはメリットがある。

[0104] ·事象の不確力さを表す情報理論のエントロピーが利用されており、クラス間の差異が強調されやすい。

•重みの高い語で文書の要約を作成して、文書間の差異を知るような用途に強い。

[0105] また、具体的な計算例の説明は省略するが、この他にも、情報利得比、 X 2乗値、対数尤度比などを、メタデータの重み付けを行う統計的尺度として用いることも可能である。 [0106] 情報利得比を用いる場合、以下の式（11)乃至（14)により算出される、あるクラス Ci におけるメタデータ Wjの情報利得比 IGR(Ci, Wj)力クラス Ciにおけるメタデータ Wjの重みに設定される。

[0107] [数 3] info(Ci,Wi)— infOdivCGi'Wi)

(11) (^Gi， ^W」) = ~ splits) info(Ci,Wj) = ∑ p(W|Ci) log₂p(W|Ci) (12)

m_orph(C|) info(G_k，Wj: (13)

k)

spl itiCj) =一∑ Og (14) k

)：クラス Giに属するコンテンツが有する

メタデータの総数

[0108] すなわち、情報利得比は、クラスを分割する前と後のメタデータ Wjのエントロピーの減少量と、クラス分割に関するエントロピーとの比である。なお、情報利得比には、例えば、以下のような特徴またはメリットがある。

[0109] •個々のクラスに対する重みではなぐ分類全体 (例えば、好き嫌いの分類そのもの）に対して偏って分布しているメタデータにより大きな重みが与えられる。

•階層構造になっているデータに対して、例えば、あるディレクトリ以下において特徴的な語を知るような用途に有用である。

[0110] % 2乗値を用いる場合、以下の式（15)により算出される、あるクラス Ciにおけるメタデータ Wjの χ 2乗値である χ 2(Ci, Wj)力クラス Ciにおけるメタデータ Wjの重みに設定される。

[0111] [数 4]

- - · (15) f (Wj, C| |H_dep)：クラス Giにおけるメタデータ Wjを有する

コンテンツ数の実数

f (Wj， Gi |H_indep)：クラス Giにおけるメタデータ Wjを有する

コンテンツ数の期待値

[0112] すなわち、％ 2乗値は、クラス αに属するコンテンツのうち、メタデータ wjを有するコンテンッの数の実数と期待値との差に基づいており、クラス αに対するメタデータ wj の依存性を示している。なお、％ 2乗値には、例えば、以下のような特徴またはメリットがある。

[0113] •統計的期待値からメタデータの共起関係に基づいて重み付けされる。

•インターネット上に存在するコンピュータやネットワークにつけられる識別子であるドメイン別の専門語の抽出などに広く適用される。

[0114] 対数尤度比を用いる場合、以下の式（16)により算出される、あるクラス αにおけるメタデータ Wjの対数尤度比である LL(Ci, Wj)力クラス Ciにおけるメタデータ Wjの重みに設定される。

[0115] [数 5]

, 、 ― P(W,C|H_dep)

LL(Ci,Wj) = ∑ ∑ log— -— - - - (16)

P(Wj,Ci|H_dep)：クラス Cjに属するコンテンツが

メタデータ Wjを有する確率の実数

P(Wj，Ci|H_ind )：クラス Gjに属するコンテンツが

メタデータ _Wjを有する確率の期待値

[0116] すなわち、対数尤度比は、クラス αに属するコンテンツカ^タデータ wjを有する確率の実数と期待値との比を示している。なお、対数尤度比には、例えば、以下のような特徴およびメリットがある。

[0117] •統計的期待値からメタデータの共起関係に基づいて重み付けされる。 •インターネット上に存在するコンピュータやネットワークにつけられる識別子であるドメイン別の専門語の抽出などに広く適用される。

[0118] メタデータ抽出部 82は、以上の方法のうちいずれかの方法を用いて、各クラスにおける各メタデータの重みを求める。すなわち、あるクラス Aにおけるあるメタデータ Bの重みは、クラス Aに属するコンテンツとメタデータ Bとの関連度 (クラス Aに属するコンテンッとメタデータ Bにより表される特徴との関連の深さ）、および、他のクラスに属するコンテンツとメタデータ Bとの関連度とクラス Aに属するコンテンツとメタデータ Bとの関連度との違、に基づ、て求められる。

[0119] メタデータ抽出部 82は、例えば、クラスごとに、設定された重みの値が上位である所定の数 (例えば、 10)のメタデータ、または、設定された重みが所定の閾値以上のメタデータを抽出する。すなわち、クラスごとに、そのクラスに属するコンテンツの特徴をより明確に表しているメタデータが抽出される。より詳細に言えば、クラスごとに、そのクラスに属するコンテンツと関連の深い特徴を表すとともに、他のクラスに属するコンテンッと比べてより関連の深い特徴を表すメタデータが抽出される。

[0120] メタデータ抽出部 82は、クラスごとに抽出したメタデータを示す情報を組み合わせ抽出部 83に供給する。なお、以下、クラスごとに抽出されたメタデータをクラス別重要メタデータと称する。

[0121] なお、以下、ステップ S2において、図 6に示されるように、プレイリスト選択曲のクラス、すなわち、抽出対象クラスからは、 [冬] [恋] [BGM] [ドラマ] [夏パワフル] [爽ゃ力 ] [ 俳優] [心地よい] [ノリ]の 10個のメタデータが抽出され、プレイリスト非選択曲のクラス力もは、 [恋] [センチメンタル] [夏] [ノスタルジー] [タイアップ] [心地よい] [ドラマ] [ダンス] [壮大] [ぬくもり]の 10個のメタデータが抽出されたものとして説明する。なお、キーヮードの抽出を行わないクラスについては、メタデータの抽出を必ずしも行う必要はない。

[0122] ステップ S3において、組み合わせ抽出部 83は、メタデータ組み合わせ抽出処理を行う。ここで、図 7のフローチャートを参照して、組み合わせ抽出部 83により実行されるメタデータ組み合わせ抽出処理の詳細を説明する。

[0123] ステップ S21において、組み合わせ抽出部 83は、論理式 Pを初期化する。 [0124] ステップ S22において、組み合わせ抽出部 83は、比較対象クラスのコンテンツとの比較が完了していない抽出対象クラスのコンテンツがある力否かを判定する。比較対象クラスのコンテンツとの比較が完了してヽな、抽出対象クラスのコンテンツがあると判定された場合、処理はステップ S 23に進む。

[0125] ステップ S23において、組み合わせ抽出部 83は、比較が完了していない抽出対象クラスのコンテンツを 1つ選択する。なお、以下、ステップ S23において選択されたコンテンッを抽出対象コンテンツと称する。

[0126] ステップ S24において、組み合わせ抽出部 83は、論理式 Qを初期化する。

[0127] ステップ S25において、組み合わせ抽出部 83は、抽出対象コンテンツとの比較が完了していない比較対象クラスのコンテンツがあるカゝ否かを判定する。抽出対象コンテンッとの比較が完了していない比較対象クラスのコンテンツがあると判定された場合、処理はステップ S 26に進む。

[0128] ステップ S26において、組み合わせ抽出部 83は、抽出対象コンテンツとの比較が完了していない比較対象クラスのコンテンツを 1つ選択する。なお、以下、ステップ S2 6において選択されたコンテンツを比較対象コンテンツと称する。

[0129] ステップ S27において、組み合わせ抽出部 83は、抽出対象コンテンツが有していて、比較対象コンテンツが有していないメタデータを抽出する。具体的には、組み合わせ抽出部 83は、抽出対象クラスのクラス別重要メタデータのうち、抽出対象コンテンッが有して!/、て、比較対象コンテンツが有してヽな、メタデータを抽出する。

[0130] ステップ S28において、組み合わせ抽出部 83は、抽出したメタデータを orで連結して論理式 Rを生成する。例えば、抽出対象クラスであるプレイリスト選択曲のクラス別重要メタデータのうち、抽出対象コンテンツであるアーティスト 1が有していて、比較対象コンテンツであるアーティスト 12が有していないメタデータとして、 [冬] [恋パヮフル] [爽やかさ]および [俳優]が抽出された場合、論理式 Rは、以下の式（17)のようになる。

[0131] R= [冬] or [恋] οιΐパワフル] or [爽やかさ] or [俳優] "' (17)

[0132] なお、論理式 Rにおいて抽出されたメタデータを orで連結することにより、抽出対象コンテンツと比較対象コンテンツを比較する場合、論理式 Rが満たされる力否かにより、抽出対象コンテンツと比較対象コンテンツとを区別することができる。

[0133] ステップ S29において、組み合わせ抽出部 83は、論理式 Rを andで連結して論理式

Qに追加する。すなわち、以下の式（18)に示される論理演算が行われる。

[0134] Q Q and R 〜（18)

[0135] その後、処理はステップ S25に戻り、ステップ S25において、抽出対象コンテンツとの比較が完了してヽな、比較対象クラスのコンテンツがな、と判定されるまで、ステツプ S25乃至 S29の処理が繰り返し実行される。すなわち、抽出対象コンテンツが比較対象クラス (抽出対象クラス以外のクラス）に含まれる全てのコンテンツと比較され、抽出対象クラスのクラス別重要メタデータのうち、抽出対象コンテンツが有していて、比較対象コンテンツが有していないメタデータが抽出され、論理式 Qに追加される。例えば、比較対象クラスに属するコンテンツが m個あり、抽出対象コンテンツと比較対象クラスの各コンテンツとを比較した結果を示す餘理式を餘理式 Ri (i= l, 2, · ··, m)とした場合、論理式 Qは、以下の式（19)で表される。

[0136] Q=R1 and R2 and · ·· and Rm · ,· (19)

[0137] より具体的には、例えば、論理式 Qは、以下の式（20)のようになる。

[0138] Q = ([冬] or [恋] orレヮフル] or [爽ゃ力、] or [俳優]) and ([冬] or [恋] or [ドラマ] orレヮフル] or [俳優]) and ([冬] orレヮフル] or [爽ゃ力、] or [俳優] or [心地よい] ) and ([冬] or [ドラマ] or [パワフル] or [爽ゃ力、] or [俳優] or [心地よい]) and ([冬] o r [恋] or [ドラマ] orレヮフノレ] or [爽ゃ力、] or [ィ非優]) and ([ィ非優] or [心地よい]) an d ([冬] or [恋] or [爽ゃ力、] or [ィ非優]) and ([パヮフノレ] or [爽ゃ力、] or [ィ非優] or [心地よい]) and ([冬] or [ドラマ] or [爽やか] or [俳優] or [心地よい]) and ([冬] or [恋] or [ドラマ] or [爽やか] or [俳優] or [心地よい])

ー(20)

[0139] なお、論理式 Qにおいて各論理式 Riを andで連結することにより、抽出対象コンテンッと比較対象クラスに属するコンテンツとを比較する場合、論理式 Qが満たされるか否かにより、抽出対象コンテンツと比較対象クラスに属する全てのコンテンツとを区別することができる。

[0140] ステップ S25において、抽出対象コンテンツとの比較が完了していない比較対象クラスのコンテンツがないと判定された場合、すなわち、抽出対象コンテンツと比較対象クラスの全てのコンテンツとの比較が完了した場合、処理はステップ S30に進む。

[0141] ステップ S30において、組み合わせ抽出部 83は、論理式 Qを簡略する。具体的には、組み合わせ抽出部 83は、論理式 Qを最大項の積で表した標準和積形に変換する。例えば、式（20)の最初の項である項 Tl = ([冬] or [恋] orレヮフル] or [爽やか

] or [俳優])は、以下の式（21)のように変換される。

[0142] T1 = ([冬] or [恋] or [パワフル] or [爽やか] or [俳優] or 〜[BGM] or〜[ドラマ] or 〜

[夏] or〜[心地よい] or〜[ノリ]) and ([冬] or [恋] orレヮフル] or [爽やか] or [俳優] or 〜[BGM] or [ドラマ] or〜[夏] or〜[心地よい] or〜[ノリ]) and ([冬] or [恋] or [パヮフノレ] or [爽ゃ力、] or [ィ非優] or [BGM] or [ドラマ] or〜[夏] or〜[心地よい] or〜[ノリ])…

(以下、省略）ー（21)

なお、〜は否定を表す記号である。

[0143] 次に、組み合わせ抽出部 83は、標準和積形に変換した論理式 Qを、標準積和形に変換する。例えば、項 T1は、以下の式（22)のように変換される。

[0144] Tl = ([冬] and [恋] andレヮフル] and [爽ゃ力、] and [俳優] and [BGM] and [ドラマ] and [夏] and [心地よい] and [ノリ]) or ([冬] and [恋] andレヮフル] and [爽ゃ力、] and [俳優] and [BGM] and [ドラマ] and [夏] and [心地よい] and〜[ノリ]) or ([冬] and

[恋] and [パワフル] and [爽ゃ力、] and [俳優] and [BGM] and [ドラマ] and [夏] and 〜

[心地よ！/、] and [ノリ])' · · (以下、省略） …（22)

[0145] さらに、組み合わせ抽出部 83は、標準積和形に変換した論理式 Qをクワイン'マクラスキー法などを用いて簡略ィ匕する。例えば、式（20)の論理式 Qは、以下の式（23) のように簡略ィ匕される。

[0146] Q = ([俳優]) or ([冬] and [心地よ、]) or ([恋] and [心地よ、]) or ([ドラマ] and [爽や力] and [心地よい]) or ([パワフル] and [爽ゃ力] and [心地よい]) …（23)

[0147] すなわち、式（23)の論理式 Qにおいて orで連結されている各項は、抽出対象クラスに属するそれぞれのコンテンツについてコンテンツに関連づけられている 1つ以上のメタデータを取り出すことにより求められるメタデータの全ての組み合わせのうち、比較対象クラスに属するそれぞれのコンテンッについてコンテンッに関連づけられている 1つ以上のメタデータを取り出すことにより求められるメタデータの組み合わせには存在しな、メタデータの組み合わせであって、抽出対象クラスのクラス別重要メタデータの組み合わせを示して、る。

[0148] ステップ S31において、組み合わせ抽出部 83は、論理式 Qを orで連結して論理式

Pに追加する。すなわち、以下の式（24)に示される論理演算が行われる。

[0149] P P or Q - -- (24)

[0150] その後、処理はステップ S22〖こ戻り、ステップ S22において、比較対象クラスのコンテンッとの比較が完了してヽな、抽出対象クラスのコンテンツがな、と判定されるまで、ステップ S22乃至 S31の処理が繰り返し実行される。すなわち、抽出対象クラスの全てのコンテンツが、比較対象クラスの全てのコンテンツと比較される。例えば、抽出対象クラスのコンテンツが n個あり、抽出対象クラスの各コンテンツの比較結果により求められた論理式 Qを Qi (i= l, 2, · ··, n)とした場合、論理式 Pは、以下の式（25) で表される。

[0151] P = Q1 or Q2 or - " or Qn · '· (25)

[0152] より具体的には、例えば、論理式 Ρは、以下の式（26)のようになる。

[0153] P = ([BGM]) or ([ィ非優]) or ([冬] and [心地よ、]) or ([恋] and [心地よ、]) or ([冬] and [ノリ]) or ([恋] and [ノリ]) or ([夏] and [ノリ]) or ([爽や力、] and [ノリ]) or ([ドラマ] a nd [爽ゃ力 ] and [心地よい]) or ([パワフル] and [爽ゃ力] and [心地よい]) …（26)

[0154] なお、論理式 Pにおいて各論理式 Qiを orで連結することにより、論理式 Pが満たされるカゝ否かにより、抽出対象クラスに属するコンテンツカゝ、比較対象クラスに属するコンテンッかを区別することができる。

[0155] ステップ S22において、比較対象クラスのコンテンツとの比較が完了していない抽出対象クラスのコンテンツがないと判定された場合、すなわち、抽出対象クラスの全てのコンテンツについて、比較対象クラスのコンテンツとの比較が完了した場合、処理はステップ S32に進む。

[0156] ステップ S32において、組み合わせ抽出部 83は、メタデータの組み合わせを抽出する。具体的には、組み合わせ抽出部 83は、論理式 Pの orで連結されている各項を、抽出対象クラスの特徴として抽出する。例えば、論理式 Pが式（26)に示される値である場合、以下に示す 10組のメタデータの組み合わせが抽出される。

[0157] - [BGM]

' [俳優]

' [冬] and [心地よい]

' [恋] and [心地よい]

' [冬] and [ノリ]

' [恋] and [ノリ]

' [夏] and [ノリ]

' [爽や力 ] and [ノリ]

' [ドラマ] and [爽ゃ力 ] and [心地よい]

^パワフル] and [爽ゃ力、] and [心地よい]

[0158] ステップ S33において、組み合わせ抽出部 83は、メタデータの組み合わせをクライアント記憶部 23に記憶させて、メタデータ組み合わせ抽出処理は終了する。具体的には、組み合わせ抽出部 83は、抽出したメタデータの組み合わせを示すデータをクライアント記憶部 23に記憶させる。また、組み合わせ抽出部 83は、抽出したメタデータの組み合わせを示す情報をキーワード提示部 84および推薦コンテンツ抽出部 85 に供給する。

[0159] 図 4に戻り、ステップ S4において、キーワード提示部 84は、キーワードを提示する。

具体的には、キーワード提示部 84は、ステップ S3において抽出されたメタデータの組み合わせのうち 1つ以上を選択する。例えば、以下の基準により、メタデータの組み合わせが選択される。

[0160] (1)含まれるメタデータの数が最も多い組み合わせ (例えば、ステップ S32において上述した例の場合、（[ドラマ] and [爽ゃ力] and [心地よい])または (Iパワフル] and [爽やか ]and [心地よい]))

(2)含まれるメタデータの数が最も少な、組み合わせ (例えば、ステップ S32におヽて上述した例の場合、（[BGM])または ([俳優]))

(3)ステップ S2において設定されたメタデータの重みの合計値または平均値が最も大きい組み合わせ (4)抽出対象クラスに属する最も多くのコンテンツが有する組み合わせ

(5)抽出対象クラスに属する特定のコンテンツが有する組み合わせ

(6)全ての組み合わせ

[0161] なお、上述した基準は、例えば、抽出されたメタデータの組み合わせを使用するシステムまたはアプリケーションプログラムなどの仕様や目的などに応じて選択される。

[0162] キーワード提示部 84は、クライアント出力部 24を制御して、選択したメタデータをュ一ザに提示する。例えば、キーワード提示部 84は、選択したメタデータの組み合わせを表示させるための画像データを生成する。キーワード提示部 84は、生成した画像データをクライアント出力部 24に供給し、画像データに基づく画像、すなわち、抽出対象クラスであるプレイリスト選択曲クラスの特徴を表すメタデータ（キーワード）をクライアント出力部 24に表示させる。

[0163] 図 8は、ステップ S4において、クライアント出力部 24に表示される画面の例を示す図である。図 8の例においては、上述した図 5に示される表とともに、ポップアップウインドウ 101がクライアント出力部 24に表示される。ポップアップウィンドウ 101には、プレイリスト選択曲に対する（プレイリスト選択曲クラスの特徴を明確に表す)キーワードとして抽出されたメタデータの組み合わせが表示されている。また、ポップアップウインドウ 101には、含まれるメタデータの数が多い組み合わせを優先してメタデータの組み合わせを抽出したことを通知するメッセージが表示されている。

[0164] さらに、コンテンツを分類する視点としてプレイリスト選択曲が選択されていることが分力るように、例えば、プレイリスト選択曲の項目の列の背景力網掛けまたは他の列と異なる色とされている。また、ポップアップウィンドウ 101に表示されているキーヮードの対象となるクラスに属するコンテンツが分力るように、例えば、表の左端のコンテンッを示す列のアーティスト 1乃至 11の欄の背景力網掛けまたは他の列と異なる色とされている。

[0165] これにより、ユーザは、自分が選択したプレイリストの特徴 (傾向）を簡単に確認ことができる。

[0166] 図 9は、ステップ S4において、クライアント出力部 24に表示される画面の他の例を示す図である。図 9においては、実際にプレイリストを作成するための画面上に、抽出したキーワードを表示する場合の例を示してヽる。

[0167] タイトルバー 111には、この画面を表示させているソフトウェアの製品名などが表示される。メニューバー 112には、各種の操作を表示するためのメニューなどが表示される。ウィンドウ 113には、ボリュームを調整したり、動作のモードを切替えたりするための GUI (Graphical User Interface)などが表示される。ウィンドウ 114には、コンテンッの再生、停止、スキップなどを行うための GUIなどが表示される。

[0168] ウィンドウ 115には、プレイリストに選択されている楽曲の一覧などが表示される。

楽曲の一覧には、シリアル No.、タイトル、アーティスト名、演奏時間、楽曲が属するジヤンル、楽曲をプレイリストに登録した日時、楽曲の出典元となるアルバム名、出典元のアルバムにおける楽曲のトラック No.などが表示される。

[0169] ウィンドウ 116には、ウィンドウ 115に表示されているプレイリストの特徴を表すキーワードなどが表示される。ユーザは、ウィンドウ 116を見ることにより、自分が作成したプレイリストの特徴 (傾向）を簡単に確認することができる。また、ユーザはボタン 121 を押下することにより、ウィンドウ 116に表示されているキーワードに基づいて、例えば、「パワフルで爽やかで心地よいソング集」のように、適切なプレイリストのタイトルを自動的に作成させることができる。ボタン 122が押下された場合、タイトルの自動作成は行われずに、ウィンドウ 116が閉じられる。

[0170] ステップ S5において、キーワード提示部 84は、キーワードを変更するか否かを判定する。キーワードを変更しないと判定された場合、処理はステップ S6に進む。

[0171] ステップ S6において、コンテンツ分類部 81は、コンテンツを分類する視点を変更する力否かを判定する。コンテンツを分類する視点を変更しないと判定された場合、処理はステップ S7に進む。

[0172] ステップ S7において、キーワード提示部 84は、キーワードを決定する力否かを判定する。キーワードを決定しないと判定された場合、処理はステップ S5に戻る。

[0173] その後、ステップ S5において、キーワードを変更すると判定される力ステップ S6において、コンテンツを分類する視点を変更すると判定される力ステップ S7において、キーワードを決定すると判定されるまで、ステップ S5乃至 S7の処理が繰り返し実行される。 [0174] ステップ S5において、例えば、ユーザが、提示されているキーワードを変更したいと考え、ユーザ入力部 21を介してキーワードの変更を指令する情報を入力した場合、ユーザ入力部 21は、取得した情報をキーワード提示部 84に供給する。キーワード提示部 84は、キーワードの変更を指令する情報を取得した場合、キーワードを変更すると判定し、処理はステップ S4に戻る。

[0175] その後、ステップ S4において、ステップ S3において抽出されたメタデータの組み合わせの中から別の組み合わせが選択され、選択されたメタデータが、抽出対象クラスの特徴を表すキーワードとしてクライアント出力部 24に提示される。

[0176] ステップ S6にお!/、て、例えば、ユーザが、別の視点でコンテンツを分類したクラスのキーワードを抽出したいと考え、ユーザ入力部 21を介して、コンテンツを分類する視点の変更を指令する情報を入力した場合、ユーザ入力部 21は、取得した情報をコンテンッ分類部 81に供給する。コンテンツ分類部 81は、コンテンツを分類する視点の変更を指令する情報を取得した場合、コンテンツを分類する視点を変更すると判定し、処理はステップ S1に戻る。

[0177] その後、ステップ S1において、新たな視点でコンテンツが分類され (例えば、好き嫌いの視点でコンテンツが分類され)、新たに分類されたクラスについて、ステップ S2 以降の処理が実行される。なお、コンテンツを分類する新たな視点を、ユーザが明示的に指定するようにしてもよいし、予め決められた設定に基づいて、コンテンツ分類部 81が自動的に設定するようにしてもよ!、。

[0178] ステップ S7において、例えば、ユーザが、ユーザ入力部 21を介して、キーワードの決定を指令する情報を入力した場合、ユーザ入力部 21は、取得した情報をキーヮード提示部 84に供給する。キーワード提示部 84は、キーワードの決定を指令する情報を取得した場合、キーワードを決定すると判定し、キーワード抽出処理は終了する。

[0179] なお、キーワードがユーザに提示された後、ユーザからの反応がないアイドル状態が所定の時間 «続した場合、例えば、自動的に提示するキーワードを変更したり、コンテンッを分類する視点を変更するようにしてもょ、。

[0180] このようにして、ユーザの指定した視点により分類されたクラスの特徴を表すメタデータの組み合わせを簡単に抽出することができる。また、抽出されたメタデータの組み合わせは、上述したように、比較対象クラスに対して抽出対象クラスを特徴づけるものであり、抽出対象クラスの特徴を正確に表している。さらに、簡単な論理演算により、メタデータの組み合わせを抽出することができる。さらに、メタデータの組み合わせ抽出する前に、クラス別重要メタデータを抽出して、メタデータの数を絞り込むことにより、計算量および計算に必要な記憶媒体の記憶容量を削減することができ、例えば、携帯音楽プレーヤーのような処理能力が低い機器においても、容易に本発明を適用することができる。

[0181] 次に、図 10のフローチャートを参照して、情報処理システム 1により実行されるコンテンッ推薦処理を説明する。

[0182] ステップ S41において、図 4のステップ S1の処理と同様に、コンテンツが分類される

[0183] ステップ S42において、図 4のステップ S2の処理と同様に、メタデータの重み付けが行われ、クラス別重要メタデータが抽出される。

[0184] ステップ S43において、図 4のステップ S3の処理と同様に、すなわち、図 7のフローチャートに従って、メタデータ組み合わせ抽出処理が実行される。

[0185] ステップ S44において、推薦コンテンツ抽出部 85は、ユーザに推薦するコンテンツを抽出する。例えば、推薦コンテンツ抽出部 85は、ステップ S43において抽出されたメタデータの組み合わせに基づ、て、ステップ S 1にお、て分類したコンテンツにより構成されるグループとは異なるグループに属するコンテンツの中から、メタデータの組み合わせが抽出された抽出対象クラスに属するコンテンツと関連のあるコンテンッをユーザに推薦するコンテンッとして抽出する。

[0186] 具体的には、例えば、新着のコンテンツ (例えば、新着の映画、番組、楽曲など）に関するメタデータ力サーバ記憶部 51からクライアント記憶部 23に送信されてきた場合、クライアント記憶部 23は、送信されてきたメタデータを記憶するとともに、新着のコンテンッがあることを示す情報を推薦コンテンツ抽出部 85に供給する。推薦コンテンッ抽出部 85は、ステップ S43において抽出されたメタデータの組み合わせの中から、ユーザに推薦するコンテンツを抽出するためのメタデータの組み合わせを、例えば、上述したステップ S4において説明したものと同様の基準を用いて選択する。推薦コンテンッ抽出部 85は、クライアント記憶部 23にメタデータが記憶されている新着のコンテンッの中から、選択したメタデータの組み合わせを含むメタデータを有するコンテンッを抽出する。推薦コンテンツ抽出部 85は、抽出したコンテンツに関する情報を推薦コンテンツ提示部 86に供給する。

[0187] また、抽出されたメタデータの組み合わせに基づいて、ユーザに推薦するコンテンッを抽出するように要求する推薦コンテンッ抽出要求情報を、推薦コンテンッ抽出部 85から、クライアント記憶部 23およびサーバ記憶部 51を介して、サーバ演算部 52に送信し、サーバ記憶部 51にメタデータが記憶されて、るコンテンツの中から抽出したメタデータの組み合わせを含むメタデータを有するコンテンツをサーバ演算部 52に抽出させることち可會である。

[0188] なお、ユーザに推薦するコンテンツを抽出する方法は上述した方法に限定されるものではなぐ例えば、ベクトル空間法によるマッチングを行ったり、状態行動関数を用いたりするなど、他の方法を用いて、抽出されたメタデータに基づいて、抽出対象クラスに属するコンテンツに関するコンテンツ、すなわち、ユーザに推薦するコンテンツを抽出することも可能である。

[0189] ステップ S45において、推薦コンテンツ提示部 86は、ユーザにコンテンツを推薦する。具体的には、推薦コンテンツ提示部 86は、クライアント出力部 24を制御して、ステツプ S44において抽出されたコンテンツを、推薦するコンテンツとしてユーザに提示する。例えば、推薦コンテンツ提示部 86は、ステップ S44において抽出されたコンテンッをユーザに推薦するための画像データを生成する。推薦コンテンツ提示部 86 は、生成した画像データをクライアント出力部 24に供給し、画像データに基づく画像、すなわち、ユーザにコンテンツを推薦する画像を表示させる。この画像には、例えば、推薦するコンテンツに関する情報 (例えば、タイトル、概要など）とともに、コンテンッを推薦する根拠 (推薦理由）が表示される。コンテンツの推薦理由は、例えば、推薦するコンテンツの抽出に用、たメタデータの組み合わせをそのまま表示するようにしてもょヽし、メタデータの組み合わせに基づく推薦文を作成して表示するようにしてちょい。

[0190] ステップ S46において、推薦コンテンツ提示部 86は、推薦するコンテンツを変更する力否かを判定する。推薦するコンテンツを変更しないと判定された場合、処理はステツプ S47に進む。

[0191] ステップ S47において、図 4のステップ S47の処理と同様に、コンテンツを分類する視点を変更する力否かが判定される。コンテンツを分類する視点を変更しな、と判定された場合、処理はステップ S48に進む。

[0192] ステップ S48において、推薦コンテンツ提示部 86は、コンテンツを決定するか否かを判定する。コンテンツを決定しないと判定した場合、処理はステップ S46に戻る。

[0193] その後、ステップ S46において、推薦するコンテンツを変更すると判定される力、ステツプ S47において、コンテンツを分類する視点を変更すると判定される力、ステップ S48において、コンテンツを決定すると半 IJ定されるまで、ステップ S46乃至 S48の処理が繰り返し実行される。

[0194] ステップ S46において、例えば、ユーザが、推薦されているコンテンツを変更したいと考え、ユーザ入力部 21を介してコンテンツの変更を指令する情報を入力した場合、ユーザ入力部 21は、取得した情報を推薦コンテンツ提示部 86に供給する。推薦コンテンッ提示部 86は、推薦するコンテンツの変更を指令する情報を取得した場合、推薦するコンテンツを変更すると判定し、処理はステップ S44に戻る。

[0195] その後、ステップ S44において、ステップ S43において抽出されたメタデータの組み合わせの中力別の組み合わせが選択され、選択されたメタデータの組み合わせに基づいて抽出されたコンテンツがユーザに推薦される。

[0196] ステップ S47において、コンテンツを分類する視点を変更すると判定された場合、処理はステップ S41に戻る。

[0197] その後、ステップ S41において、新たな視点でコンテンツが分類され (例えば、好き嫌いの視点でコンテンツが分類され)、新たに分類されたクラスについて、ステップ S 2以降の処理が実行される。

[0198] ステップ S48において、例えば、ユーザが、推薦されたコンテンツを気に入り、コンテンッを視聴したいと考え、ユーザ入力部 21を介して、コンテンツの決定を指令する情報を入力した場合、ユーザ入力部 21は、取得した情報を推薦コンテンツ提示部 8 6に供給する。推薦コンテンツ提示部 86は、コンテンツの決定を指令する情報を取得した場合、コンテンツを決定すると判定し、コンテンツ推薦処理は終了する。

[0199] その後、推薦コンテンツ提示部 86は、決定されたコンテンツを通知する情報をクライアント記憶部 23に供給する。例えば、決定されたコンテンツがクライアント記憶部 2 3に記憶されている場合、クライアント記憶部 23は、そのコンテンツをクライアント出力部 24に供給する。クライアント出力部 24は、例えば、コンテンツに基づく画像を表示したり、音声を出力したりする。

[0200] また、例えば、決定されたコンテンツがクライアント記憶部 23に記憶されて、な、場合、クライアント記憶部 23は、決定されたコンテンツの配信を要求する情報を、コンテンッ配信部 41に供給する。コンテンツ配信部 41は、要求されたコンテンツを、クライアント記憶部 23に配信する。クライアント記憶部 23は、配信されたコンテンツを記憶するとともに、そのコンテンツをクライアント出力部 24に供給する。クライアント出力部 24は、例えば、コンテンツに基づく画像を表示したり、音声を出力したりする。

[0201] なお、コンテンツがユーザに推薦された後、ユーザからの反応がないアイドル状態が所定の時間継続した場合、例えば、自動的に推薦するコンテンツを変更したり、コンテンッを分類する視点を変更したりするようにしてもよい。

[0202] このようにして、ユーザの指定した視点により分類されたクラスの特徴を表すメタデータの組み合わせに基づいて抽出されたコンテンツをユーザに推薦するとともに、推薦する根拠 (理由）をユーザに明確に提示することができる。例えば、ユーザの嗜好（例えば、ユーザの好き嫌いなど）に基づいた視点により分類されたクラス力も抽出されたメタデータの組み合わせを用いることにより、ユーザの嗜好を正確に反映したコンテンッをユーザに推薦することができる。また、ユーザの嗜好に基づく視点とは異なる視点によりコンテンツを分類することにより、 ί列えば、コンテンツ提供佃 jの販売促進を狙ったコンテンツなど、ユーザの嗜好に拠らな!/ヽコンテンツを推薦することもできる。

[0203] 次に、図 11乃至図 16を参照して、本発明の第 2の実施の形態について説明する。

[0204] 図 11は、本発明を適用した情報処理システムの第 2の実施の形態を示すブロック図である。

[0205] 情報処理システム 201は、コンテンツ視聴クライアント 211、コンテクスト検出端末 2 12、コンテンツ配信サーバ 213、および、コンテンツ推薦サーバ 214を含むように構成される。コンテンツ視聴クライアント 211は、機能的構成の観点に立つと、ユーザ入力部 221、クライアント演算部 222、クライアント記憶部 223、および、クライアント出力部 224を含むように構成される。コンテクスト検出端末 212は、機能的構成の観点に立つと、コンテクスト検出部 231、および、コンテクスト記憶部 232を含むように構成される。コンテンツ配信サーバ 213は、機能的構成の観点に立つと、コンテンツ配信部 241、および、コンテンツメタデータ記憶部 242を含むように構成される。コンテンツ推薦サーバ 214は、機能的構成の観点に立つと、サーバ記憶部 251、および、サーバ演算部 252を含むように構成される。

[0206] なお、図中、図 1と対応する部分については下 2桁が同じ符号を付してあり、処理が同じ部分に関しては、その説明は繰り返しになるので省略する。

[0207] クライアント演算部 222は、図 13または図 16を参照して後述するように、クライアント記憶部 223に記憶されているコンテンツおよびメタデータに関する情報、コンテクスト検出端末 212から供給されるコンテクスト情報、または、ユーザ入力部 221から供給されるユーザの操作内容を示す情報に基づいて、コンテンツを所定のクラスに分類するためのコンテンツ分類ルールを生成するとともに、生成したコンテンツ分類ルールの信頼度を示す評価指標を算出する。クライアント演算部 222は、生成したコンテンッ分類ルールに基づヽて、ユーザなどにより分類する対象として指定されたコンテンッを分類する。クライアント演算部 222は、クライアント出力部 224を制御して、コンテンッを分類した結果、コンテンツの特徴などをユーザに提示する。また、クライアント演算部 222は、生成したコンテンツ分類ルールおよびその評価指標を示す情報をクライアント記憶部 223に記憶させる。

[0208] クライアント記憶部 223は、コンテンツ分類ルールおよびその評価指標を示す情報を記憶する。また、クライアント記憶部 223は、コンテンツ分類ルールおよびその評価指標を示す情報を、必要に応じて、コンテンツ推薦サーバ 214のサーバ記憶部 251 に送信する。

[0209] クライアント出力部 224は、クライアント演算部 222の制御の基に、コンテンツを分類した結果、コンテンツの特徴などをユーザに提示する。 [0210] サーバ記憶部 251は、クライアント記憶部 223から送信されてくる、コンテンツ分類ルールおよびその評価指標を示す情報を記憶する。また、サーバ記憶部 251は、サーバ演算部 252から供給される、コンテンツ分類ルールおよびその評価指標を示す情報、または、コンテンツの分類結果を示す情報を記憶する。

[0211] サーバ演算部 252は、サーバ記憶部 251に記憶されている、ユーザの操作内容を示す情報、および、コンテクスト情報に基づいて、サーバ記憶部 251に記憶されているコンテンツを分類するためのコンテンツ分類ルールを生成するとともに、生成したコンテンッ分類ルールの信頼度を示す評価指標を算出する。サーバ演算部 252は、生成したコンテンツ分類ルールに基づ、て、サーバ記憶部 251に記憶されて、るコンテンッを分類する。サーバ演算部 252は、生成したコンテンツ分類ルールおよびその評価指標を示す情報、または、コンテンツの分類結果を示す情報をサーバ記憶部 251に記憶させる。

[0212] ところで、図 11は、機能的構成例を示しているため、各装置間の接続形態、すなわち、コンテンッ視聴クライアント 211乃至コンテンッ推薦サーバ 214のそれぞれの間の接続の形態は特に図示されていないが、その接続の形態は特に限定されない。すなわち、接続の形態は、有線であってもよいし無線であってもよいし、その組み合わせでもよい。

また、接続の形態は、ネットワークを介在する形態であってもよいし、装置間で直接通信を行う形態であってもよいし、その組み合わせでもよい。さらに、ネットワークを介在する形態の場合も、ネットワークの形態は限定されず、例えば、インターネットやイントラネット等でもよい。この場合も、ネットワークは単一のネットワークに限定されず、複数のネットワークが存在してもよい。従って、図 11には図示されていないが、実際には、コンテンツ視聴クライアント 211乃至コンテンツ推薦サーバ 214のそれぞれには、対応する接続形態に応じた通信部がさらに設けられることになる。

[0213] また、コンテクスト検出端末 212、コンテンツ配信サーバ 213、および、コンテンツ推薦サーバ 214は、情報処理システム 201において必須な構成要素ではない。すなわち、図 13または図 16を参照して後述するように、情報処理システム 201により行われるコンテンツ分類処理は、コンテンツ視聴クライアント 211のみで実現することが可能である。

[0214] 図 12は、クライアント演算部 222の機能の構成の例を示すブロック図である。クライアント演算部 222は、コンテンツ分類部 281、メタデータ抽出部 282、組み合わせ抽出部 283、コンテンツ分類ルール生成部 291、コンテンツ自動分類部 292、および、分類結果提示部 293を含むように構成される。なお、図中、図 2と対応する部分については下 2桁が同じ符号を付してあり、処理が同じ部分に関しては、その説明は繰り返しになるので省略する。

[0215] 組み合わせ抽出部 283は、抽出したメタデータの組み合わせを示す情報を、コンテンッ分類ルール生成部 291に供給する。

[0216] コンテンツ分類ルール生成部 291は、図 13を参照して後述するように、コンテンツ分類ルールを生成するとともに、生成したコンテンツ分類ルールの評価指標を算出する。

コンテンツ分類ルール生成部 291は、生成したコンテンツ分類ルール、および、その評価指標を示す情報を、コンテンツ自動分類部 292に供給するとともに、クライアント記憶部 223に記憶させる。

[0217] コンテンツ自動分類部 292は、ユーザ入力部 221を介してユーザが入力した、自動分類する対象となるコンテンツを指定する情報を、ユーザ入力部 221から取得する。また、コンテンツ自動分類部 292は、新着または推薦コンテンツがあることを示す情報をクライアント記憶部 223から取得する。コンテンツ自動分類部 292は、図 13または図 16を参照して後述するように、コンテンツ分類ルールに基づいて、ユーザにより指定されたコンテンツ、または、クライアント記憶部 223から通知された新着または推薦コンテンッなどの分類する対象となるコンテンッを所定のクラスに分類する。コンテンッ自動分類部 292は、コンテンツを分類した結果を示す情報を分類結果提示部 2 93に供給する。

[0218] 分類結果提示部 293は、コンテンツを分類した結果、コンテンツの特徴などをユーザに提示するように、クライアント出力部 224を制御する。

[0219] 次に、図 13乃至図 16を参照して、情報処理システム 201により実行される処理を説明する。 [0220] まず、図 13のフローチャートを参照して、情報処理システム 201により実行されるコンテンッ分類処理の第 1の実施の形態を説明する。なお、この処理は、例えば、ユーザ入力部 221を介して、ユーザがコンテンツ分類処理の開始の指令を入力したとき、開始される。

[0221] ステップ S101において、コンテンツ分類部 281は、上述した図 4のステップ S1と同様の処理により、ユーザにより指定された視点に基づいて、コンテンツを複数のクラスに分類し、分類したコンテンツのクラスに関する情報をメタデータ抽出部 282に供給する。

[0222] 図 14は、図 3に示されるコンテンツを分類するための視点の例を示す図である。なお、図 14に示される表には、図 3に示される表と比較して、分類の視点の項目が追カロされている。また、図 14には、コンテンツを分類する視点として、ユーザの好き嫌い、および、コンテンツが格納されているフォルダの 2つの例が示されている。ユーザの好き嫌いの視点については、図 5を参照して上述した例と同様である。

[0223] なお、以下、コンテンツが格納されるフォルダを「ポップス」および「バラード」の 2種類とした場合の例について説明する。例えば、ユーザは、コンテンツ (いまの例の場合、楽曲）の曲調などに基づいて、各コンテンツを「ポップス」または「バラード」のフォルダに分類して管理する。従って、コンテンツが格納されているフォルダの視点に基づいてコンテンツを分類する場合、各コンテンツは、「ポップス」「バラード」の 2つのクラスに分類される。

[0224] また、説明を簡単にするために、図 5の例において、「プレイリスト選択曲」のクラスに属するコンテンツが、図 14の例において、「ポップス」のクラスに属し、すなわち、「ポップス」のフォルダに格納され、図 5の例において、「プレイリスト非選択曲」のクラスに属するコンテンツが、図 14の例において、「バラード」のクラスに属し、すなわち、「バラード」のフォルダに格納されているものとする。

[0225] なお、以下では、ステップ S101において、コンテンツを分類する視点としてコンテンッが格納されているフォルダがユーザにより指定された場合の例について説明する。

[0226] ステップ S102において、メタデータ抽出部 282は、上述した図 4のステップ S2と同様の処理により、メタデータの重み付けを行い、クラスごとに、クラス別重要メタデータを抽出する。メタデータ抽出部 282は、抽出したクラス別重要メタデータを示す情報を組み合わせ抽出部 283に供給する。

[0227] なお、以下、ステップ S102において、図 15に示されるように、ポップスのクラスからは、 [冬] [恋] [BGM] [ドラマ] [夏] [パワフル] [爽やか] [俳優] [心地よい] [ノリ]の 10個のメタデータがクラス別重要メタデータとして抽出され、ノラードのクラスからは、 [恋] [センチメンタル] [夏] [ノスタルジー] [タイアップ] [心地よい] [ドラマ] [ダンス] [壮大] [ぬくもり] の 10個のメタデータがクラス別重要メタデータとして抽出されたものとして説明する。

[0228] ステップ S103において、組み合わせ抽出部 283は、上述した図 4のステップ S3と同様の処理により、各クラスについて、メタデータ組み合わせ抽出処理を行う。組み合わせ抽出部 283は、抽出したメタデータの組み合わせを示すデータを、クライアント記憶部 223に記憶させるとともに、コンテンツ分類ルール生成部 291に供給する。

[0229] なお、以下、ポップスのクラスからは、以下に示す 10組のメタデータの組み合わせが抽出されとものとして説明する。

[0230] - [BGM]

' [俳優]

' [冬] and [心地よい]

' [恋] and [心地よい]

' [冬] and [ノリ]

' [恋] and [ノリ]

' [夏] and [ノリ]

' [爽や力 ] and [ノリ]

' [ドラマ] and [爽ゃ力 ] and [心地よい]

^パワフル] and [爽ゃ力、] and [心地よい]

[0231] また、以下、バラードのクラスからは、以下に示す 10組のメタデータの組み合わせが抽出されとものとして説明する。

[0232] ' [夏] and [ノスタルジー]

' [ノスタルジー] and [タイアップ]

' [ドラマ] and [壮大] ' [心地よい] and [壮大]

' [ぬくもり] and [壮大]

' [恋] and [夏] and [ドラマ]

' [センチメンタル] and [夏] and [ドラマ]

' [恋] and [ノスタルジー] and [ダンス]

' [センチメンタル] and [タイアップ] and [ドラマ]

' [夏] and [タイアップ] and [ドラマ]

[0233] ステップ S104において、コンテンツ分類ルール生成部 291は、コンテンツ分類ルールを生成する。具体的には、まず、コンテンツ分類ルール生成部 291は、ステップ S103において抽出されたメタデータの組み合わせを条件部（If¾)、そのメタデータの組み合わせが抽出されたクラスを結論部 (then部）とするコンテンツ分類ルールを、抽出されたメタデータの組み合わせごとに生成する。例えば、ポップスのクラスを結論部とするコンテンツ分類ルール（以下、単に、ポップスのクラスのコンテンツ分類ルールとも表現する）として、以下の Rpl乃至 RplOの 10個のコンテンツ分類ルールが生成される。

[0234] ノレ一ノレ Rpl： if ([BGM] = true) then (クラス =「ポップス」 )

ルール Rp2 :if ([俳優] = true) then (クラス =「ポップス」）

ルール Rp3 :if ([冬] = true and [心地よい] = true) then (クラス =「ポップス」）ルール Rp4:if ([恋] = true and [心地よい] = true) then (クラス =「ポップス」）ルール Rp5 :if ([冬] = true and [ノリ] = true) then (クラス =「ポップス」）

ルール Rp6 :if ([恋] = true and [ノリ] = true) then (クラス =「ポップス」）

ルール Rp7 :if ([夏] = true and [ノリ] = true) then (クラス =「ポップス」）

ルール Rp8 :if ([爽や力 ] = true and [ノリ] = true) then (クラス =「ポップス」）ノレ一ノレ Rp9 : if ([ドラマ] = true and [爽ゃ力、] = true and [心地よい] = true) then (クラス=「ポップス」）

ノレ一ノレ RplO : if ([パヮフノレ] = true and [爽ゃ力、] = true and [心地よい] = true) then ( クラス =「ポップス」）

[0235] 例えば、ルール Rplは、あるコンテンツが [BGM]というメタデータを有している場合、そのコンテンツが分類されるクラスは「ポップス」であると、うルールを表して、る。

[0236] 同様に、ノ《ラードのクラスを結論部とするコンテンツ分類ルール (以下、単に、バラードのクラスのコンテンツ分類ルールとも表現する）として、以下の Rbl乃至 RblOの 10 個のコンテンツ分類ルールが生成される。

[0237] ルール Rbl： if ([夏] = true and [ノスタルジー] = true) then (クラス =「バラード」 )ルール Rb2 : if ([ノスタルジー] = true and [タイアップ] = true) then (クラス =「バラード」）ルール Rb3 :if ([ドラマ] = true and [壮大] = true) then (クラス =「バラード」）ルール Rb4: if ([心地よい] = true and [壮大] = true) then (クラス =「バラード」）ルール Rb5 : if ([ぬくもり] = true and [壮大] = true) then (クラス =「バラード」）ノレ一ノレ Rb6 :if ([恋] = true and [夏] = true and [ドラマ] = true) then (クラス =「バラード」）

ルール Rb7 : if ([センチメンタル] = true and [夏] = true and [ドラマ] = true) then (クラス=「バラード」）

ルール Rb8 :if ([恋] = true and [ノスタルジー] = true and [ダンス] = true) then (クラス =「バラード」）

ルール Rb9 : if ([センチメンタル] = true and [タイアップ] = true and [ドラマ] = true) th en (クラス =「バラード」）

ルール RblO : if ([夏] = true and [タイアップ] = true and [ドラマ] = true) then (クラス = 「バラード」）

[0238] なお、以下、コンテンツ分類ルールの条件部に示されるメタデータの組み合わせを、単に、コンテンツ分類ルールのメタデータの組み合わせとも称する。また、以下、コンテンッ分類ルールの結論部に示されるクラスを、単に、コンテンツ分類ルールのクラスとち称する。

[0239] 次に、コンテンツ分類ルール生成部 291は、各コンテンツ分類ルールの評価指標を算出する。

[0240] ここで、評価指標の算出方法の例について説明する。

[0241] 第 1の方法は、以下の式（27)に示されるように、コンテンツ分類ルールのメタデータの組み合わせに含まれるメタデータの重みの合計値を評価指標とする方法である [0242] EI=∑Weight(Wi) - -- (27)

[0243] なお、 EIは、評価指標を表し、 Wiは、コンテンツ分類ルールのメタデータの組み合わせに含まれるメタデータを表し、 Weight(Wi)は、コンテンツ分類ルールのクラスにおけるメタデータ Wiの重みを表す。

[0244] 例えば、ルール Rp3の場合、クラス「ポップス」におけるメタデータ [冬]の重みとクラス「ポップス」におけるメタデータ [心地よ!/、]の重みとを合計した値が評価指標となる。

[0245] 第 1の方法においては、コンテンツ分類ルールのメタデータの組み合わせに含まれるメタデータの数が多いほど、または、コンテンツ分類ルールのメタデータの組み合わせに含まれるメタデータの重みが大きいほど、評価指標が大きくなる。すなわち、コンテンッ分類ルールのメタデータの組み合わせが、コンテンッ分類ルールのクラスに属するコンテンツとの関連が深いほど、換言すれば、コンテンツ分類ルールのメタデータの組み合わせが、コンテンッ分類ルールのクラスに属するコンテンッの特徴を表す度合いが大きいほど、評価指標が大きくなる。さらに換言すれば、コンテンツ分類ルールのクラスにぉ、て、コンテンツ分類ルールのメタデータの組み合わせを含むメタデータを有するコンテンツの占める割合が高いほど、評価指標が大きくなる。

[0246] 第 2の方法は、以下の式（28)に示されるように、コンテンツ分類ルールのメタデータの組み合わせに含まれるメタデータの重みの平均値を評価指標とする方法である

[0247] EI={∑Weight(Wi)}÷Nc · '· (28)

[0248] なお、 Ncは、コンテンツ分類ルールのメタデータの組み合わせに含まれるメタデータの数を表す。

[0249] 例えば、ルール Rp3の場合、クラス「ポップス」におけるメタデータ [冬]の重みとクラス「ポップス」におけるメタデータ [心地よい]の重みとを合計した値を、条件部に含まれるメタデータの数である 2で割った値が評価指標となる。

[0250] 第 2の方法においては、コンテンツ分類ルールのメタデータの組み合わせに含まれるメタデータの重みが大きいほど、評価指標が大きくなる。すなわち、コンテンツ分類ルールの条件部に含まれる個々のメタデータ力コンテンツ分類ルールのクラスに属するコンテンツとの関連が深いほど、換言すれば、コンテンツ分類ルールの条件部に含まれる個々のメタデータ力コンテンツ分類ルールのクラスに属するコンテンツの特徴を表す度合いが大きいほど、評価指標が大きくなる。さらに換言すれば、コンテンッ分類ルールのクラスにぉ、て、コンテンツ分類ルールのメタデータの組み合わせに含まれるメタデータのうち少なくとも 1つを有するコンテンツの占める割合が高いほど、評価指標が大きくなる。

[0251] 第 3の方法は、以下の式（29)に示されるように、全てのコンテンツのうちコンテンツ分類ルールの条件部を満たすコンテンツの占める割合、換言すれば、全てのコンテンッのうちコンテンツ分類ルールのメタデータの組み合わせに含まれるメタデータを有するコンテンツの占める割合、いわゆる、被覆率を評価指標とする方法である。なお、ここで、全てのコンテンツとは、ステップ S 1において、各クラスに分類されたコンテンッのことである。

[0252] EI = Count(Condition) ÷ N - - - (29)

[0253] なお、 Count(Condition)は、コンテンツ分類ルールの条件部を満たすコンテンツの個数を表し、 Nは、コンテンツの全個数を表す。

[0254] 例えば、ルール Rp3の場合、全コンテンツのうち、メタデータ [冬]とメタデータ [心地よ

V、]を有するコンテンツの占める割合が評価指標となる。

[0255] 第 3の方法においては、全コンテンツのうち、コンテンツ分類ルールの条件部を満たすコンテンツの占める割合が高いほど、評価指標が大きくなる。

[0256] 第 4の方法は、以下の式（30)に示されるように、コンテンツ分類ルールのクラスに属するコンテンツのうち、コンテンツ分類ルールの条件部を満たすコンテンツの占める割合、いわゆる、再現率 (Recall)を評価指標とする方法である。

[0257] EI = Recall = Count(Condition & Decision) ÷Count(Decision) · · · dO)

[0258] なお、 Count(Condition & Decision)は、コンテンツ分類ルールのクラスに属するコンテンッのうち、コンテンツ分類ルールの条件部を満たすコンテンツの個数を表し、 Cou nt(Decision)は、コンテンッ分類ルールのクラスに属するコンテンッの個数を表す。

[0259] 例えば、ルール Rp3の場合、クラス「ポップス」に属するコンテンツのうち、メタデータ [ 冬]とメタデータ [心地よい]を有するコンテンツの占める割合が評価指標となる。 [0260] 第 4の方法においては、コンテンツ分類ルールのクラスに属するコンテンツが、コンテンッ分類ルールのメタデータの組み合わせを含むメタデータを有する割合が高くなるほど、評価指標が大きくなる。すなわち、コンテンツ分類ルールのメタデータの組み合わせが、コンテンツ分類ルールのクラスに属するコンテンツと関連が深いほど、換言すれば、コンテンツ分類ルールのメタデータの組み合わせ力コンテンツ分類ルールのクラスに属するコンテンツの特徴を表す度合いが大きいほど、評価指標が大きくなる。

[0261] 第 5の方法は、以下の式（31)に示されるように、コンテンツ分類ルールの条件部を満たすコンテンツのうち、コンテンツ分類ノレ一ノレのクラスに属するコンテンツの占める割合、いわゆる、適合率 (Precision)を評価指標とする方法である。

[0262] EI = Precision =し ount (し onmtion & Decision) ÷し ount (し ondition) · " Κά ΐ )

[0263] 例えば、ルール Rp3の場合、メタデータ [冬]とメタデータ [心地よヽ]を有するコンテンッのうち、クラス「ポップス」に属するコンテンツの占める割合が評価指標となる。

[0264] 第 5の方法においては、コンテンツ分類ルールのメタデータの組み合わせを含むメタデータを有するコンテンツ力コンテンツ分類ルールのクラスに属する割合が高くなるほど、評価指標が大きくなる。すなわち、コンテンツ分類ルールのメタデータの組み合わせが、コンテンツ分類ルールのクラスに属するコンテンツと関連が深いほど、換言すれば、コンテンツ分類ルールのメタデータの組み合わせ力コンテンツ分類ルールのクラスに属するコンテンツの特徴を表す度合いが大きいほど、評価指標が大きくなる。

[0265] 第 6の方法は、以下の式（32)に示されるように、式（30)により求められる再現率 (R ecall)と式（31)により求められる適合率（Precision)との調和平均、いわゆる、 F値を評価指標とする方法である。

[0266] EI = F = 2 ÷ (1 ÷ Recall + 1 ÷ Precision) · , · (32)

[0267] 第 6の方法においては、コンテンツ分類ルールのメタデータの組み合わせを含むメタデータを有するコンテンツの集合と、コンテンツ分類ルールのクラスとが近くなるほど、評価指標が大きくなる。

[0268] 第 7の方法は、以下の式（33)に示されるように、コンテンツ分類ルールの条件部と結論部をそれぞれ 1つの事象としてとらえ、条件部の事象が発生する確率と結論部の事象が発生する確率の依存性を評価指標とする方法である。

[0269] EI = Count (し ondition & Decision)―し ount (し ondition) X Count(Decision) ÷ N

•••(33)

[0270] なお、式（33)は、以下のようにして導出される。

[0271] Prob(Condition) = Count(Condition) ÷ N - - - (34)

Prob(Decision) = L,ount(Decision) ÷ N · · ·、35)

Prob(Condition & Decision) = Count(Condition & Decision)÷N · · · (36) [0272] なお、 Prob(Condition)は、コンテンツ分類ルールの条件部の事象が発生する確率、 Prob(Decision)は、コンテンツ分類ルールの結論部の事象が発生する確率、 Prob(C ondition & Decision)は、コンテンツ分類ルールの条件部の事象と結論部の事象が同時に発生する確率を表す。

[0273] 式（34)乃至式（36)より、コンテンツ分類ルールの条件部の事象が発生する確率と結論部の事象が発生する確率の依存性 Rは、以下の式（37)により求められる。

[0274] R=Prob(Condition & Decision)— Prob(Condition) X Prob(Decision)

= Count(C ondition & Decision) ÷N—Count(Condition) X Count(Decision) ÷ N²

- (37)

[0275] そして、コンテンツの全個数 Nは、全てのコンテンツ分類ルールに共通な値であるので、依存性 Rにコンテンツの全個数 Nを乗じることにより、式（33)が導出される。

[0276] 例えば、ルール Rp3の場合、クラス「ポップス」に属し、かつ、メタデータ [冬]とメタデータ [心地よ、]を有するコンテンツの数から、メタデータ [冬]とメタデータ [心地よ、]を有するコンテンツの数 Xクラス「ポップス」に属するコンテンツの数 ÷Nを引いた値が評価指標となる。

[0277] 第 7の方法においては、コンテンツが、コンテンツ分類ルールのメタデータの組み合わせを含むメタデータを有する確率と、コンテンツ分類ルールのクラスに属する確率の依存性が高いほど、評価指標が大きくなる。すなわち、コンテンツが、コンテンツ分類ルールのメタデータの組み合わせを含むメタデータを有する事象と、コンテンツ分類ルールのクラスに属する事象との関連が深いほど、評価指標が大きくなる。また、コンテンッ分類ルールの条件部の事象と結論部の事象とが独立して、る場合、以下の式（38)が成り立つので、評価指標は最小の 0となる。

[0278] Prob(Condition & Decision) = Prob(Condition) X Prob(Decision) · · · (38)

[0279] このように、評価指標は、コンテンツ分類ルールの条件部に含まれるメタデータまたはその組み合わせ力結論部のクラスに属するコンテンツが有するメタデータに出現する度合いを示す。特に、第 1、第 2、第 4乃至第 7の方法を用いて算出した評価指標は、コンテンツ分類ルールの条件部に含まれるメタデータの組み合わせと、結論部のクラスに属するコンテンツとの関連度を表す。すなわち、第 1、第 2、第 4乃至第 7の方法を用いて算出した評価指標は、コンテンツ分類ルールの条件部に含まれるメタデータの組み合わせが、結論部のクラスに属するコンテンツの特徴を表す度合いを示す。

[0280] なお、以下、評価指標を算出する方法として第 5の方法を採用した場合、すなわち、評価指標を F値とする場合の例について説明する。また、以下、各コンテンツ分類ルールの評価指標 EIが以下の値となるものとして説明する。

EI(Rpl) = = 0.429

EI(Rp2) = = 0.240

EI(Rp3) = =0.167

EI(Rp4) = :0.333

EI(Rp5) = =0.167

EI(Rp6) = =0.167

EI(Rp7) = =0.167

EI(Rp8) = =0.167

EI(Rp9) = =0.167

EI(Rb勝 = 0.167

EI(Rbl) = = 0.267

EI(Rb2) = = 0.267

EI(Rb3) = = 0.267

EI(Rb4) = :0.333 EI(Rb5) = 0.143

EI(Rb6) = 0.267

EI(Rb7) = 0.143

EI(Rb8) = 0.143

EI(Rb9) = 0.143

EI(RblO) = 0.143

[0282] コンテンツ分類ルール生成部 291は、生成したコンテンツ分類ルール、および、各コンテンツ分類ルールの評価指標を示す情報を、クライアント記憶部 223に記憶させるとともに、コンテンツ自動分類部 292に供給する。

[0283] ステップ S105において、コンテンツ自動分類部 292は、自動分類するコンテンツを設定する。具体的には、例えば、ユーザが、ユーザ入力部 221を介して、クライアント記憶部 223に記憶されて、るコンテンツの中から、まだ各クラスに分類されて、な!/ヽコンテンツ (例えば、ユーザが新たに購入した楽曲、映画、新たに録画した番組など）を 1つ以上を自動分類する対象として選択した場合、ユーザ入力部 221は、ユーザにより選択されたコンテンツを示す情報をコンテンツ自動分類部 292に供給する。コンテンッ自動分類部 292は、ユーザにより選択されたコンテンツを自動分類する対象に定する。

[0284] また、例えば、新着コンテンツ (例えば、新着の映画、番組、楽曲など）に関するメタデータ、または、何らかの推薦アルゴリズムにより決定した推薦コンテンツに関するメタデータが、サーバ記憶部 251からクライアント記憶部 223に送信されてきた場合、クライアント記憶部 223は、送信されてきたメタデータを記憶するとともに、新着または推薦コンテンツがあることを示す情報をコンテンツ自動分類部 292に供給する。コンテンッ自動分類部 292は、それらの新着または推薦コンテンツを自動分類する対象に設定する。

[0285] ステップ S106において、コンテンツ自動分類部 292は、コンテンツを自動分類する。具体的には、コンテンツ自動分類部 292は、コンテンツ分類ルールに基づいて、ステツプ S105において設定した各コンテンツを各クラスに分類し、分類した結果を示す情報を分類結果提示部 293に供給する。 [0286] 例えば、コンテンツ自動分類部 292は、自動分類する対象となる各コンテンツについて、そのコンテンツが有するメタデータの組み合わせ力条件部のメタデータの組み合わせを含むコンテンツ分類ルール (以下、コンテンツに適合するコンテンツ分類ルールとも表現する）を抽出する。すなわち、コンテンツ自動分類部 292は、自動分類する対象となる各コンテンツについて、そのコンテンツに適合するコンテンツ分類ルールを抽出する。コンテンツ自動分類部 292は、抽出されたコンテンツ分類ルールを結論部のクラスごとに分類し、その数を集計する。コンテンツ自動分類部 292は、適合したコンテンツ分類ルールの数が最大となるクラスに、そのコンテンツを分類する

[0287] 例えば、 [BGM] [恋] [夏] [ノリ] [心地よ、] [ノスタルジー] [ダンス]の 7個のメタデータを有するコンテンツ Xについて考えた場合、コンテンツ Xは、 R_P1、 R_P4、 Rp7、 Rbl、 Rb8 の 5つのコンテンツ分類ルールに適合する。そして、適合したコンテンツ分類ルールの数を、結論部のクラスごとに集計すると、結論部が「ポップス」となるコンテンツ分類ルールの数が 3となり、結論部が「バラード」となるコンテンツ分類ルールの数が 2となる。

従って、この場合、結論部が「ポップス」となるコンテンツ分類ルールの数が最大となるため、コンテンツ Xはクラス「ポップス」に分類される。

[0288] また、例えば、自動分類する対象となる各コンテンツについて、適合するコンテンツ分類ルールのうち、評価指標が最大となるコンテンツ分類ルールのクラスにそのコンテンッを分類するようにしてもょ、。

[0289] 例えば、上述したコンテンツ Xの場合、コンテンツ Xが適合する各コンテンツ分類ノレールの評価指標は、以下のとおりとなる。

[0290] EI(Rpl) = 0.429

EI(Rp4) = 0.333

EI(Rp7) = 0.167

EI(Rbl) = 0.267

EI(Rb8) = 0.143

[0291] 従って、この場合、コンテンツ Xは、評価指標が最大の 0.429となるコンテンツ分類ルール Rplの結論部のクラス「ポップス」に分類される。

[0292] さらに、例えば、自動分類する対象となる各コンテンツについて、適合するコンテンッ分類ルールの評価指標を、結論部のクラスごとに集計し、評価指標の合計値が最大となるクラスにそのコンテンツを分類するようにしてもょ、。

[0293] 例えば、上述したコンテンツ Xの場合、コンテンツ Xが適合する各コンテンツ分類ノレールの評価指標を、結論部のクラスごとに集計すると、以下のとおりとなる。

[0294] ∑ EI(Rp) = EI(Rpl) + EI(Rp4) + EI(Rp7) = 0.929 · '· (39)

∑ EI(Rb) = EI(Rbl) + EI(Rb8) = 0.410 · · · (40)

[0295] なお、∑EI(Rp)は、コンテンツ Xが適合するコンテンツ分類ルールのうち、結論部がクラス「ポップス」であるコンテンツ分類ルールの評価指標の合計値を表し、∑ EI(Rb) は、コンテンツ Xが適合するコンテンツ分類ルールのうち、結論部がクラス「バラード」であるコンテンツ分類ルールの評価指標の合計値を表す。

[0296] 従って、この場合、コンテンツ Xは、評価指標の合計値が最大となるクラス「ポップス

」に分類される。

[0297] また、例えば、自動分類する対象となる各コンテンツについて、適合するコンテンツ分類ルールの評価指標の平均値が最大となるクラスに分類するようにしてもよい。

[0298] 例えば、上述したコンテンツ Xの場合、コンテンツ Xが適合するコンテンツ分類ノレ一ルの評価指標の、結論部のクラスごとの平均値は、以下のとおりとなる。

[0299] Elav(Rp) =∑ EI(Rp) ÷ 3 = 0.929 ÷ 3 = 0.309 (41)

Elav(Rb) =∑ EI(Rb) ÷ 2 = 0.410 ÷ 2 = 0.205 · · · (42)

[0300] なお、 Elav(Rp)は、コンテンツ Xが適合するコンテンツ分類ルールのうち、結論部がクラス「ポップス」であるコンテンツ分類ルールの評価指標の平均値を表し、 Elav(Rp) は、コンテンツ Xが適合するコンテンツ分類ルールのうち、結論部がクラス「バラード」であるコンテンツ分類ルールの評価指標の平均値を表す。

[0301] 従って、この場合、コンテンツ Xは、評価指標の平均値が最大となるクラス「ポップス」に分類される。

[0302] なお、各コンテンツをそれぞれただ 1つのクラスに分類するのではなぐ各コンテンッを 1つ以上のクラスに分類するとともに、そのコンテンツがそのクラスに適合する度合ヽを示す適合度を設定するようにしてもよ!ヽ。

[0303] 例えば、自動分類する対象となる各コンテンツについて、適合したコンテンツ分類ルールの結論部に含まれる全てのクラスにコンテンツを分類したり、評価指標の合計値、評価指標の平均値、クラス内での評価指標の最大値などが、所定の閾値以上となる全てのクラスにそのコンテンツを分類するようにしてもよい。そして、例えば、コンテンッが分類された各クラスにっヽて、適合したコンテンツ分類ルールのうち結論部がそのクラスであるコンテンツ分類ルールの数、または、適合したコンテンツ分類ルールのうち結論部がそのクラスであるコンテンツ分類ルールの評価指標の合計値、平均値、あるいは、最大値などを適合度として設定するようにしてもよい。

[0304] 例えば、上述したコンテンツ Xの場合、適合したコンテンツ分類ルールの結論部に含まれる「ポップス」と「バラード」の両方のクラスにコンテンッ Xを分類するとともに、クラス「ポップス」の評価指標の合計値である 0.929を、コンテンツ Xのクラス「ポップス」に対する適合度として設定し、クラス「バラード」の評価指標の合計値である 0.410を、コンテンツ Xのクラス「バラード」に対する適合度として設定するようにしてもよ!、。

[0305] ステップ S107において、分類結果提示部 293は、自動分類の結果を提示する。具体的には、分類結果提示部 293は、クライアント出力部 224を制御して、ステップ S1 06にお、てコンテンツを自動分類した結果をユーザに提示する。

[0306] 例えば、分類結果提示部 293は、クラインアント出力部 224を制御して、以下の情報を表示させる。

[0307] コンテンツ X：「ポップス」キーワード： BGM,恋，ノリ，心地よい

[0308] これにより、ユーザは、コンテンツ Xが、メタデータ（いまの場合、ユーザに対してはキーワードとして提示されて、る） [BGM] [恋] [ノリ] [心地よ、]に基づ、て、グループ「ポップス」に分類されたことを知ることができる。

[0309] なお、例えば、コンテンツ Xを実際に分類する前に、この情報をユーザに提示し、コンテンッ Xをグループ「ポップス」に分類することをユーザに推薦するようにしてもよい

[0310] また、各コンテンツが有するメタデータの組み合わせのうち、コンテンツ分類ルールの条件部と一致するメタデータの組み合わせに含まれるメタデータ、および、条件部に一致したコンテンツ分類ルールの結論部のクラスに基づヽて、コンテンツの特徴をユーザに対して提示するようにしてもよい。例えば、コンテンツが分類されたクラス名、コンテンツの分類に用いたメタデータに基づいて、コンテンツの特徴をユーザに対して提示するようにしてもょヽ。

[0311] 例えば、上述したコンテンツ Xの場合、分類結果提示部 293は、クラインアント出力部 224を制御して、コンテンツ Xの特徴として、以下の情報を表示させる。

[0312] コンテンツ X: BGM風の「ポップス」、ノスタルジー感のある夏の「バラード」

[0313] これにより、ユーザは、コンテンツ Xの特徴を、容易かつ具体的に知ることができる。

なお、この例は、適合度を設定して、 1つ以上のクラスにコンテンツを分類する場合の例を示している。

[0314] ステップ S108において、コンテンツ自動分類部 292は、自動分類するコンテンツを変更する力否かを判定する。例えば、ユーザが、他のコンテンツを自動分類したいと考え、ユーザ入力部 221を介して、自動分類するコンテンツの変更を指令する情報を入力した場合、ユーザ入力部 221は、取得した情報をコンテンツ自動分類部 292 に供給する。コンテンツ自動分類部 292は、自動分類するコンテンツの変更を指令する情報を取得した場合、自動分類するコンテンツを変更すると判定し、処理はステップ S105に戻る。その後、ステップ S108において、自動分類するコンテンツを変更しないと判定されるまで、ステップ S 105乃至 S 108の処理が繰り返し実行され、ユーザにより指定されたコンテンツが自動分類される。

[0315] ステップ S108において、自動分類するコンテンツを変更しないと判定された場合、処理はステップ S 109に進む。

[0316] ステップ S109において、コンテンツ分類部 281は、上述した図 4のステップ S6の処理と同様に、コンテンツを分類する視点を変更する力否かを判定する。コンテンツを分類する視点を変更すると判定された場合、処理はステップ S101に戻り、その後、ステップ S 109において、コンテンツを分類する視点を変更しないと判定されるまで、ステップ S101乃至 S109の処理が繰り返し実行される。すなわち、新たな視点（例えば、好き嫌いの視点）に基づいて、コンテンツが自動分類される。

[0317] ステップ S109において、コンテンツを分類する視点を変更しないと判定された場合、コンテンツ分類処理は終了する。

[0318] このようにして、メタデータに依存しないユーザの視点に基づいて、例えば、上述した好き嫌い、フォルダなどの視点に基づいて、ユーザがコンテンツを分類するためのメタデータの条件の設定を行うことなぐ各コンテンツを自動的に分類することができる。

[0319] 次に、図 16のフローチャートを参照して、情報処理システム 201により実行されるコンテンッ分類処理の第 2の実施の形態について説明する。なお、この処理は、例えば、ユーザ入力部 221を介して、ユーザがコンテンツ分類処理の開始の指令を入力した場合、開始される。

[0320] ステップ S151において、コンテンツ分類部 281は、コンテンツ分類ルールを生成する視点を選択する。具体的には、コンテンツ分類部 281は、まだコンテンツ分類ルールを生成していない視点のうち 1つを選択する。例えば、上述した図 14に示される例の場合、ユーザの好き嫌い、および、コンテンツが格納されているフォルダの 2つの視点のうち、まだコンテンツ分類ルールを生成して、な、視点が 1つ選択される。

[0321] ステップ S152において、コンテンツ分類部 281は、上述した図 13のステップ S101 と同様の処理により、ステップ S 151において選択した視点に基づいて、コンテンツを複数のクラスに分類し、分類したコンテンツのクラスに関する情報をメタデータ抽出部 282に供給する。

[0322] ステップ S 153乃至ステップ S 155の処理は、上述した図 13のステップ S 102乃至 S 104の処理と同様であり、その説明は繰り返しになるので省略する力上述したように、これらの処理により、ステップ S 151において選択された視点に対する、コンテンツ分類ルールが生成されるとともに、各コンテンツ分類ルールに対する評価指標が算出される。

[0323] ステップ S 156において、コンテンツ分類部 281は、全ての視点についてコンテンツ分類ルールを生成したかを判定する。全ての視点につ!、てコンテンツ分類ルールを生成していないと判定された場合、処理はステップ S151に戻り、ステップ S 156において、全ての視点についてコンテンツ分類ルールを生成したと判定されるまで、ステップ S151乃至 S156の処理が繰り返し実行される。すなわち、全ての視点について、コンテンツ分類ルールが生成されるとともに、各コンテンツ分類ルールに対する評価指標が算出される。

[0324] ステップ S 156において、全ての視点についてコンテンツ分類ルールが生成されたと判定された場合、処理はステップ S157に進む。

[0325] ステップ S157において、上述した図 13のステップ S105の処理と同様に、自動分類するコンテンツが設定される。

[0326] ステップ S158において、コンテンツ自動分類部 292は、コンテンツを自動分類する。具体的には、例えば、まず、コンテンツ自動分類部 292は、自動分類する対象となる各コンテンツについて、全てのコンテンツ分類ルールの中から、そのコンテンツに適合するコンテンツ分類ルールを抽出する。コンテンツ自動分類部 292は、抽出したコンテンツ分類ルールの評価指標を、結論部のクラスごとに集計する。

[0327] 次に、コンテンツ自動分類部 292は、各視点ごとに、評価指標の合計値が最大となるクラスと評価指標の合計値が 2番目に大きいクラスとの間の評価指標の差を算出し、算出した差が最大となる視点、すなわち、そのコンテンツの特徴が最も顕著に現れる視点を選択する。コンテンツ自動分類部 292は、選択した視点におけるクラスのうち、評価指標の合計値が最大となるクラスに、そのコンテンツを分類する。

[0328] また、例えば、自動分類する対象となる各コンテンツについて、視点に関係なぐ適合するコンテンツ分類ルールの評価指標の合計値、平均値、または、最大値が最大となるクラスにそのコンテンツを分類するようにしてもょ、。

[0329] さらに、例えば、自動分類する対象となる各コンテンツについて、適合するコンテンッ分類ルールの評価指標の合計値、平均値、または、クラス内での評価指標の最大値が所定の閾値以上となる全てのクラスにそのコンテンツを分類するとともに、上述した適合度を設定するようにしてもよい。この場合、 1つのコンテンツが、 1つの視点内の複数のクラスに属したり、複数の視点のクラスに属するように分類される場合がある

[0330] コンテンツ自動分類部 292は、各コンテンツを分類した結果を示す情報を分類結果提示部 293に供給する。

[0331] ステップ S159において、上述した図 13のステップ S108の処理と同様に、自動分類の結果がユーザに提示される。

[0332] ステップ S160において、上述した図 13のステップ S109の処理と同様に、自動分類するコンテンツを変更するカゝ否かが判定される。自動分類するコンテンツを変更すると判定された場合、処理はステップ S157に戻り、ステップ S160において、自動分類するコンテンツを変更しないと判定されるまで、ステップ S157乃至 S160が繰り返し実行される。

[0333] ステップ S160にお、て、コンテンツを分類する視点を変更しな、と判定された場合

、コンテンツ分類処理は終了する。

[0334] このようにして、一度に複数の視点に基づいて、コンテンツを自動分類することができる。

[0335] 以上のように、各要素の特徴を表すデータがそれぞれ関連づけられて、る複数の要素を分類したクラスの特徴として、特徴を抽出する対象となるクラスに属するそれぞれの要素について要素に関連づけられている 1つ以上のデータを取り出すことにより求められるデータの全ての組み合わせのうち、他のクラスに属するそれぞれの要素について要素に関連づけられている 1つ以上のデータを取り出すことにより求められるデータの組み合わせには存在しないデータの組み合わせを抽出する場合には、複数の要素を分類したクラスの特徴を抽出することができる。また、複数の要素を分類したクラスの特徴を簡単かつ正確に抽出することができる。

[0336] なお、以上の説明では、コンテンツを分類する視点を 1つとする例を示したが、 2つ以上の視点を組み合わせるようにしてもよい。例えば、図 5に示される例を用いれば、ユーザの好き嫌いの視点とプレイリスト選択曲の視点とを組み合わせて、例えば、ュ一ザが好きであって、かつ、プレイリストに選択されていないコンテンツが属するクラスの特徴を表すメタデータの組み合わせを容易に抽出することができる。

[0337] また、複数の視点を組み合わせる例として、コンテンツを管理する多層構造のディレクトリゃブックマークを、コンテンツを分類する視点に用いることができる。この分類の視点を用いることにより、例えば、ユーザが行ったコンテンツの分類 (ディレクトリまたはブックマークなど）の粒度や詳細度の特徴を表すメタデータの組み合わせを抽出することができる。 [0338] さらに、例えば、コンテンツが属しているディレクトリと、ユーザの好き嫌いの 2つの視点を組み合わせて分類したクラスの特徴を表すメタデータの組み合わせを抽出することも可能である。

[0339] なお、コンテンツを分類する視点が増えても、コンテンツを複数のクラスに分類した後の処理には影響しないため、図 4、図 7、図 10、図 13、または、図 16を参照して上述した本発明のアルゴリズムをそのまま適用することができる。また、コンテンツを分類する視点を複数組み合わせることにより、ユーザの嗜好などをより精緻に表すメタデータの組み合わせを抽出することができるようになる。

[0340] また、例えば、メタデータの種類が少な、場合、または、処理能力が高、コンビユータなどにより処理を行う場合、クラス別重要メタデータの抽出を行わないようにしてもよい。全てのメタデータを用いてメタデータの組み合わせを抽出する場合、クラスの特徴をより正確に表すメタデータの組み合わせが抽出される可能性が高くなる。

[0341] さらに、以上の説明では、コンテンツに関連づけられているメタデータの組み合わせを抽出する例を示したが、例えば、ある学校のクラスの特徴を、各クラスに所属する生徒に関するデータ (例えば、成績、身長、体重など）に基づいて抽出したり、同じ商品を製造する複数の製造者の特徴を、各製造者が製造する商品に関するデータ (例えば、価格、機能、形、色など）に基づいて抽出する場合など、本発明は、各要素の特徴を表すデータが関連づけられている複数の要素を複数のクラスに分類し、各要素が有するデータに基づいて、各クラスの特徴を抽出する場合に適用することができる。

[0342] なお、本発明は、例えば、ユーザにコンテンツや商品などを推薦したり、または、コンテンッゃ商品などを分類したクラスの特徴を抽出したりする装置やシステム（例えば、推薦システム、パーソナルコンピュータ、携帯電話機、 PDA (Personal Digital Assist ant)、各種の AV (Audio Visual)機器など）、または、ソフトウェアなどに適用することができる。

[0343] 例えば、ユーザの視聴履歴を学習する TV番組推薦機能を持つ装置に本発明を適用することにより、例えば、抽出されたタレント Aとバラエティ番組というメタデータの組み合わせに基づ、て、ユーザが好きなタレント Aの出演するバラエティ番組を推薦する一方、ユーザが嫌いなタレント Aの出演する歌番組は推薦しないというように、ユーザの精緻な嗜好パターンに基づいて、ユーザに番組を推薦することができるとともに、その推薦理由を提示することが可能となり、推薦された番組に対するユーザの受容度を高めることができる。

[0344] また、例えば、音楽プレーヤーと連携したパーソナルコンピュータで実行される楽曲ファイル閲覧および編集ソフトウェアに本発明を適用することにより、プレイリストの作成や閲覧などの操作に応じて、プレイリストの特徴を表すメタデータの組み合わせをユーザに提示することができ、ファイルを閲覧したり、編集したりする作業を快適にするとともに、その作業を行う楽しみを与えることができる。

[0345] また、本発明は、例えば、各種のコンテンツを分類して管理する装置やシステム、または、ソフトウェアなどに適用することができる。例えば、本発明の第 2の実施の形態を電子メールのソフトウェアに適用することにより、従来のメールの差出人、件名、へッダ情報などを分類する条件として設定することなぐメールの内容に基づいて自動的にメールを分類することができる。

[0346] 上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラム力専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

[0347] 図 17は、上述した一連の処理をプログラムにより実行するパーソナルコンピュータの構成の例を示すブロック図である。 CPU (Central Processing Unit) 901は、 ROM (R ead Only Memory) 902、または記録部 908に記憶されているプログラムに従って各種の処理を実行する。 RAM (Random Access Memory) 903には、 CPU901力実行するプログラムやデータなどが適宜記憶される。これらの CPU901、 ROM902、および R AM903は、バス 904により相互に接続されて!ヽる。

[0348] CPU901にはまた、バス 904を介して入出力インタフェース 905が接続されて!、る。

入出力インタフェース 905には、キーボード、マウス、マイクロホンなどよりなる入力部 906、ディスプレイ、スピーカなどよりなる出力部 907が接続されている。 CPU901は、入力部 906から入力される指令に対応して各種の処理を実行する。そして、 CPU90 1は、処理の結果を出力部 907に出力する。

[0349] 入出力インタフェース 905に接続されている記録部 908は、例えばノヽードディスクからなり、 CPU901が実行するプログラムや各種のデータを記憶する。通信部 909は、インターネットやローカルエリアネットワークなどのネットワークを介して外部の装置と通信する。

[0350] また、通信部 909を介してプログラムを取得し、記録部 908に記憶してもよ、。

[0351] 入出力インタフェース 905に接続されているドライブ 910は、磁気ディスク、光デイスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア 911が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記録部 908に転送され、記憶される

[0352] コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、図 17に示すように、磁気ディスク (フレキシブルディスクを含む）、光ディスク（CD- ROM(Compact Disc-Read Only Memory),DV D(Digital Versatile Disc)を含む）、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア 911、または、プログラムが一時的もしくは永続的に格納される ROM902や、記録部 908を構成するハードディスクなどにより構成される。プログラム記録媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインタフェースである通信部 909を介して、ローカルエリアネットワーク、ィンターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。

[0353] なお、本明細書にぉ、て、プログラム記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

[0354] また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。

さらに、本発明の実施の形態は、上述した実施の形態に限定されるものではなぐ本発明の要旨を逸脱しな、範囲にぉレ、て種々の変更が可能である。

Claims

請求の範囲

[1] 各要素の特徴を表すデータがそれぞれ関連づけられて、る複数の前記要素を分類したクラスの特徴として、特徴を抽出する対象となる前記クラスに属するそれぞれの前記要素につ、て前記要素に関連づけられて、る 1つ以上の前記データを取り出すことにより求められる前記データの全ての組み合わせのうち、他の前記クラスに属するそれぞれの前記要素につ、て前記要素に関連づけられて、る 1つ以上の前記データを取り出すことにより求められる前記データの組み合わせには存在しない前記データの組み合わせを抽出する特徴抽出手段を

含む情報処理装置。

[2] 抽出された前記データの組み合わせのうち 1つ以上を前記クラスの特徴としてユーザに提示するように前記クラスの特徴の提示を制御する特徴提示制御手段をさらに含む請求項 1に記載の情報処理装置。

[3] 前記クラスに属する前記要素と前記データとの第 1の関連度、および、他の前記クラスに属する前記要素と前記データとの第 2の関連度と前記第 1の関連度との違いに基づいて、前記クラスに属する前記要素の特徴をより明確に表している前記データを、前記データの組み合わせを抽出する前に抽出するデータ抽出手段を

さらに含み、

前記特徴抽出手段は、前記データ抽出手段により抽出された前記データの組み合わせを抽出する

請求項 1に記載の情報処理装置。

[4] 前記データ抽出手段は、前記第 1の関連度、および、前記第 2の関連度と前記第 1 の関連度との違いに基づいて、前記クラスにおける前記データの重みを求め、前記重みの値が上位である所定の数の前記データ、または、前記重みの値が所定の閾値以上の前記データを抽出する

請求項 3に記載の情報処理装置。

[5] Hij gd " ~~タ抽出牛段は、 tfiaf(term frequency with inverse document frequency)、相互情報量、情報利得比、 X 2乗値、または、対数尤度比のうちいずれかを前記クラスにおける前記データの重みとして求める請求項 4に記載の情報処理装置。

[6] 抽出された前記データの組み合わせに基づいて、前記要素により構成される第 1のグループとは異なる第 2のグループに属する要素の中から、前記データの組み合わせが抽出された前記クラスに属する前記要素と関連のある要素を抽出する要素抽出手段を

さらに含む請求項 1に記載の情報処理装置。

[7] 前記要素抽出手段は、抽出された前記データの組み合わせを含む前記データが関連づけられている前記第 2のグループに属する前記要素を抽出する

請求項 6に記載の情報処理装置。

[8] 抽出された前記要素のユーザへの提示を制御する要素提示制御手段を

さらに含む請求項 6に記載の情報処理装置。

[9] 前記要素提示制御手段は、前記要素を抽出した根拠として、前記要素の抽出に用 V、た前記データの組み合わせをさらに提示するように制御する

請求項 8に記載の情報処理装置。

[10] 前記要素はコンテンツであり、前記データは前記コンテンツに関するメタデータである請求項 1に記載の情報処理装置。

[11] 抽出された前記データの組み合わせと前記データの組み合わせが抽出された前記クラスである抽出対象クラスに属する前記要素との関連度を示す評価指標を算出する評価指標算出手段を

さらに含む請求項 1に記載の情報処理装置。

[12] 前記評価指標算出手段は、前記抽出対象クラスに属する前記要素のうち、前記データの組み合わせを含む前記データが関連づけられている前記要素の占める割合である再現率、および、前記データの組み合わせを含む前記データが関連づけられている前記要素のうち、前記抽出対象クラスに属する前記要素の占める割合である適合率の調和平均である F値を前記評価指標として算出する

請求項 11に記載の情報処理装置。

[13] 分類する対象となる要素に関連づけられている前記データの組み合わせに対する前記評価指標に基づいて、前記分類する対象となる要素を前記クラスに分類するクラス分類手段を

さらに含む請求項 11に記載の情報処理装置。

[14] 分類する対象となる要素に関連づけられている前記データの組み合わせのうち、それぞれの前記クラス力抽出された前記データの組み合わせに一致する数に基づいて、前記分類する対象となる要素を前記クラスに分類するクラス分類手段を

さらに含む請求項 1に記載の情報処理装置。

[15] 特徴を提示する対象となる要素に関連づけられている前記データの組み合わせのうち、それぞれの前記クラス力抽出された前記データの組み合わせに一致する前記データの組み合わせに含まれる前記データ、および、一致する前記データの組み合わせが抽出された前記クラスに基づいて、前記特徴を提示する対象となる要素の特徴を提示する特徴提示手段を

さらに含む請求項 1に記載の情報処理装置。

[16] 各要素の特徴を表すデータがそれぞれ関連づけられて!、る複数の前記要素を分類したクラスの特徴として、特徴を抽出する対象となる前記クラスに属するそれぞれの前記要素につ、て前記要素に関連づけられて、る 1つ以上の前記データを取り出すことにより求められる前記データの全ての組み合わせのうち、他の前記クラスに属するそれぞれの前記要素につ、て前記要素に関連づけられて、る 1つ以上の前記データを取り出すことにより求められる前記データの組み合わせには存在しない前記データの組み合わせを抽出する

ステップを含む特徴抽出方法。

[17] 各要素の特徴を表すデータがそれぞれ関連づけられている複数の前記要素を分類したクラスの特徴として、特徴を抽出する対象となる前記クラスに属するそれぞれの前記要素につ、て前記要素に関連づけられて、る 1つ以上の前記データを取り出すことにより求められる前記データの全ての組み合わせのうち、他の前記クラスに属するそれぞれの前記要素につ、て前記要素に関連づけられて、る 1つ以上の前記データを取り出すことにより求められる前記データの組み合わせには存在しない前記データの組み合わせを抽出する

ステップをコンピュータに実行させるプログラム。 [18] 請求項 17に記載のプログラムが記録されて、る記録媒体。