WO2006134866A1

WO2006134866A1 - 情報処理装置、方法、およびプログラム

Info

Publication number: WO2006134866A1
Application number: PCT/JP2006/311742
Authority: WO
Inventors: Noriyuki Yamamoto; Kei Tateno; Mari Saito; Tomohiro Tsunoda
Original assignee: Sony Corporation
Priority date: 2005-06-16
Filing date: 2006-06-12
Publication date: 2006-12-21
Also published as: EP1804182A4; US7953735B2; CN101044484B; CN101044484A; US20090043811A1; JP2007026425A; JP4752623B2; EP1804182A1; KR20080011643A

Abstract

本発明は、ユーザの嗜好情報に合致したコンテンツあるいは指定されるコンテンツに類似したコンテンツを、より少ない演算量で検索してユーザに提示することができる情報処理装置、情報処理方法、およびプログラムに関する。楽曲のメタデータの各項目（タイトル、アーティスト名、ジャンル、レビューテキスト、テンポ、ビート、リズムなど）をクラスタ層（第１乃至ｎ層）のいずれかに分類し、各項目の実情報を分類したクラスタ層に設けられる複数のクラスタのいずれかに分類（クラスタリング）する。そして、メタデータの代わりに楽曲の特徴を示す情報として、メタデータの各項目の実情報を分類したクラスタのクラスタＩＤ（図２におけるＣＬ１１など）から成るクラスタ情報をデータベース化する。本発明は、楽曲データのようなコンテンツの購入を勧めるホームページのサーバ、テレビジョン番組の録画予約を薦めるビデオレコーダなどに適用することができる。

Description

明細書

情報処理装置、方法、およびプログラム技術分野

[0001] 本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、コンテンッをクラスタに分類し、コンテンツが分類されたクラスタを用いてコンテンツの特徴を管理し、コンテンツの検索や推薦に利用するようにした情報処理装置、情報処理方法、およびプログラムに関する。

背景技術

[0002] 従来、ユーザの嗜好に基づヽてテレビジョン番糸且、楽曲などのコンテンツを検索し、ユーザに推薦する（いわゆる、コンテンツパーソナライゼーシヨン)ための発明が提案されている（例えば、特許文献 1参照)。

[0003] コンテンツパーソナライゼーシヨンには、コンテントベーストフィルタリング (CBF)と称される手法が広く使われている。 CBF手法では、コンテンツに対して配信側や販売側によって予め付与されているメタデータが直接的に嗜好の抽出やコンテンツの推薦に利用されていた。例えばコンテンツが楽曲である場合、各楽曲にはメタデータとしてタイトル、アーティスト名、ジャンル、レビューテキストなどが予め付与されている。予め付与されている情報の他、楽曲のテンポ、リズムなどを検出してメタデータを追カロする場合もある。

[0004] ユーザの嗜好情報は、楽曲のメタデータを特徴ベクトルとみなし、楽曲に対するュ一ザの操作 (再生、録音、スキップ、消去など）に応じて楽曲の特徴ベクトルを足し合わせることにより生成していた。例えば、再生した楽曲の特徴ベクトルは 1倍、録音した楽曲の特徴ベクトルは 2倍、スキップした楽曲の特徴ベクトルは 1倍、消去した楽曲の特徴ベクトルは 2倍にして足し合わされて、た。

[0005] ユーザの嗜好に合致した楽曲を推薦する場合、ユーザの嗜好を示す特徴ベクトルと、候補となる各楽曲の特徴べ外ルとの距離 (余弦相関など)を算出し、算出された距離の短い楽曲がユーザの嗜好に合致したものとして推薦されるようになされていた [0006] 特許文献 1 :特開 2004— 194107号公報

発明の開示

発明が解決しょうとする課題

[0007] し力しながら、上述したようにユーザの嗜好情報を楽曲の嗜好ベクトルの足し合わせによって生成した場合、嗜好の特徴が埋もれてしまう、いわゆる、嗜好の足し合わせによるなまりの問題が生じ、ユーザの嗜好に合致しないものが推薦されてしまうことかあつた。

[0008] 例えば、ユーザがアップテンポでリズミカルなロックの楽曲を好み、かつ、スローテンポでスロービートのジャズの楽曲も好むような場合、この 2つの好みを足し合わせると、アップテンポとスローテンポ、リズミカルとスロービート、ロックとジャズがいずれも好きとなり、ユーザの嗜好に合致しな、アップテンポなジャズの楽曲が推薦される可能性があった。

[0009] また、楽曲のメタデータのうち、数値によって表現されるものは名義尺度化して特徴ベクトルの要素とされることが一般的であるが、この場合、名義尺度化する際の閾値を挟む二つの値がそれぞれ異なる値に変換されてしま、、変換前の二つの値が数値的に近ヽと、う関係が消失してしまうと、う問題もある。

[0010] さらに、ユーザの嗜好を示す特徴ベクトルと候補となる各楽曲の特徴ベクトルとの距離を計算するに際し、その計算量の削減が望まれている。

[0011] 本発明はこのような状況に鑑みてなされたものであり、ユーザの嗜好情報に合致したコンテンツあるいは指定されるコンテンツに類似したコンテンツを、より少な、演算量で検索してユーザに提示できるようにするものである。

課題を解決するための手段

[0012] 本発明の一側面の情報処理装置は、コンテンツ群のな力から所定の条件を満たすコンテンツを選択する情報処理装置であって、前記コンテンツ群を構成する各コンテンッを、コンテンッのメタデータに応じた階層のそれぞれにお、て複数の第 1のクラスタのいずれかに分類するコンテンツ分類手段と、各コンテンツと各コンテンツのそれぞれが分類された前記階層における前記第 1のクラスタとの対応関係を示すデータベースを保持する保持手段と、前記階層毎に前記所定の条件に対応する前記第 1 のクラスタを指定し、指定した前記第 1のクラスタに対応するコンテンツを特定する特定手段と、前記特定手段によって特定された前記コンテンツを提示する提示手段とを含むことを特徴とする。

[0013] 前記コンテンツ分類手段によって前記コンテンツが分類される各第 1のクラスタに、ユーザの嗜好の程度を示す嗜好値を対応付けて記憶する記憶手段をさらに設け、前記特定手段には、前記記憶手段によって記憶されて、る嗜好値に基づ!、て前記第 1のクラスタを指定し、指定した前記第 1のクラスタに対応するコンテンツを特定させることができる。

[0014] 前記特定手段には、指定した前記第 1のクラスタに対応するコンテンツの中から、前記嗜好値に応じた階層毎の重みにより重み付けした、ユーザのコンテンツの嗜好の度合、を示す評価値で、さらにコンテンツを特定させることができる。

[0015] 前記コンテンツ分類手段によって前記コンテンツが分類される各第 1のクラスタに対してキーワードを設定する設定手段と、前記設定手段によって設定されたキーワードを用い、コンテンツの提示理由を表す理由文を生成する生成手段とをさらに設け、前記提示手段には、前記理由文も提示させることができる。

[0016] 前記コンテンツは楽曲であり、前記メタデータには、楽曲のテンポ、ビート、またはリズムのうちの少なくとも 1つが含まれるようにすることができる。

[0017] 前記メタデータには、対応するコンテンツに対するレビューテキストが含まれるようにすることができる。

[0018] コンテンツのメタデータを複数の第 2のクラスタのいずれかに分類し、第 2のクラスタに前記階層を割り当てるメタデータ分類手段をさらに設け、前記コンテンツ分類手段には、各コンテンツを、割り当てられた前記階層のそれぞれにおいて複数の第 1のクラスタの、ずれかに分類させることができる。

[0019] 前記特定手段には、類似元となるコンテンツが分類される前記第 1のクラスタに対応するコンテンツの中から、類似元となるコンテンツとの類似の度合いを示す類似度で、さらにコンテンツを特定させることができる。

[0020] 前記特定手段には、類似元となるコンテンツの前記第 1のクラスタへの帰属の重みに応じた階層毎の重みにより重み付けした前記類似度でコンテンツを特定させることができる。

[0021] 本発明の一側面の情報処理方法は、コンテンツ群のな力から所定の条件を満たすコンテンツを選択する情報処理装置の情報処理方法であって、前記コンテンツ群を構成する各コンテンツを、コンテンツのメタデータに応じた階層のそれぞれにおいて複数のクラスタのヽずれかに分類する分類ステップと、各コンテンツと各コンテンツのそれぞれが分類された前記階層における前記クラスタとの対応関係を示すデータべースを保持する保持ステップと、前記階層毎に前記所定の条件に対応する前記クラスタを旨定し、旨定した前記クラスタに対応するコンテンツを特定する特定ステップと、特定された前記コンテンツを提示する提示ステップとを含むことを特徴とする。

[0022] 本発明の一側面のプログラムは、コンテンツ群のな力から所定の条件を満たすコンテンッを選択するためのプログラムであって、前記コンテンツ群を構成する各コンテンッを、コンテンツのメタデータに応じた階層のそれぞれにおいて複数のクラスタのいずれかに分類する分類ステップと、各コンテンツと各コンテンツのそれぞれが分類された前記階層における前記クラスタとの対応関係を示すデータベースを保持する保持ステップと、前記階層毎に前記所定の条件に対応する前記クラスタを指定し、指定した前記クラスタに対応するコンテンツを特定する特定ステップと、特定された前記コンテンッを提示する提示ステップとを含む処理をコンピュータに実行させることを特徴とする。

[0023] 本発明の一側面においては、コンテンツ群を構成する各コンテンツが、コンテンツのメタデータに応じた階層のそれぞれにおヽて複数のクラスタの!/ヽずれかに分類され、各コンテンツと各コンテンツのそれぞれが分類された前記階層における前記クラスタとの対応関係を示すデータベースが保持され、前記階層毎に前記所定の条件に対応する前記クラスタが指定され、指定された前記クラスタに対応するコンテンツが特定され、特定された前記コンテンツが提示される。

発明の効果

[0024] 本発明によれば、ユーザの嗜好情報に合致したコンテンツあるいは指定されるコンテンッに類似したコンテンツを、より少な、演算量で検索してユーザに提示することが可能となる。図面の簡単な説明

[図 1]本発明を適用した推薦システムの構成例を示すブロック図である。

[図 2]メタデータを分類するクラスタとクラスタ層の概念を示す図である。

[図 3]クラスタ情報の一例を示す図である。

[図 4]クラスタ—楽曲 HD情報の一例を示す図である。

[図 5]嗜好情報の一例を示す図である。

[図 6]クラスタリング第 1乃至 4手法から 2種類の手法を選択する方法を説明するための図である。

[図 7]クラスタリング第 1乃至 4手法から 2種類の手法を選択する方法を説明するための図である。

[図 8]クラスタリング第 1乃至 4手法から 2種類の手法を選択する方法を説明するための図である。

[図 9]クラスタリング第 1乃至 4手法から 2種類の手法を選択する方法を説明するための図である。

[図 10]クラスタリング第 1乃至 4手法から 2種類の手法を選択する方法を説明するための図である。

[図 11]第 1の類似楽曲検索処理を説明するフローチャートである。

[図 12]第 2の類似楽曲検索処理を説明するフローチャートである。

[図 13]第 3の類似楽曲検索処理を説明するフローチャートである。

[図 14]第 1の楽曲推薦処理を説明するフローチャートである。

[図 15]第 2の楽曲推薦処理を説明するフローチャートである。

[図 16]汎用パーソナルコンピュータの構成例を示すブロック図である。

[図 17]本発明の一実施の形態の推薦システムの他の構成の例を示すブロック図である。

[図 18]オフライン時の前処理の例を説明するフローチャートである。

[図 19]ソフトクラスタリングされた各楽曲のメタデータの例を示す図である。

[図 20]各楽曲のメタデータの例を示す図である。

[図 21]クラスタ情報の例を示す図である。 [図 22]第 4の類似楽曲検索処理を説明するフローチャートである。

[図 23]クラスタ情報の例を示す図である。

[図 24]類似度の例を示す図である。

[図 25]第 5の類似楽曲検索処理を説明するフローチャートである。

[図 26]第 3の楽曲推薦処理を説明するフローチャートである。

[図 27]嗜好値の例を示す図である。

[図 28]クラスタ情報の例を示す図である。

[図 29]類似度の例を示す図である。

[図 30]重みの例を示す図である。

[図 31]類似度の例を示す図である。

[図 32]第 4の楽曲推薦処理を説明するフローチャートである。

[図 33]嗜好値の例を示す図である。

[図 34]類似度の例を示す図である。

符号の説明

[0026] 1 推薦システム， 11 楽曲データベース， 12 クラスタリング部， 13 キーワード設定部， 14 クラスタ情報データベース， 21 検索楽曲指定部， 22 クラスタマツビング部， 23 楽曲抽出部， 24 嗜好情報データベース， 25 嗜好入力部， 26 ランダム選択部， 27 類似度算出部， 28 選択理由生成部， 29 楽曲提示部 , 201 メタデータクラスタリング部， 202 楽曲クラスタリング部

発明を実施するための最良の形態

[0027] 以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。

[0028] 図 1は本発明の一実施の形態である推薦システムの構成例を示している。この推薦システム 1は、ユーザの嗜好に合致した楽曲、あるいはユーザが指定した楽曲に類似した楽曲を検索し、ユーザに提示するものである。なお、推薦システム 1は、楽曲以外のコンテンツ、例えばテレビジョン番組、映画、書籍などを推薦する場合にも適用することが可能である。

[0029] 推薦システム 1は、検索の対象となる数多くの楽曲のメタデータが記録されている楽曲データベース（DB) 11、楽曲データベース 11に記録されている各楽曲を、楽曲のメタデータに基づ!/ヽてクラスタリングして各楽曲のクラスタ情報を生成するクラスタリング部 12、各クラスタ層および各クラスタの特徴をそれぞれ示すキーワードを設定するキーワード設定部 13、および、各楽曲のクラスタ情報を保持するクラスタ情報データベース（DB) 14から構成される。

[0030] さらに、推薦システム 1は、検索しょうとする楽曲の類似元となる楽曲（以下、元楽曲と称する）を指定する検索楽曲指定部 21、元楽曲のメタデータを従来力あるクラスタ識別手法 (クラシフィケーシヨン手法)を用いて最適なクラスタにマッピングするクラスタマッピング部 22、ユーザに提示する楽曲を 1以上抽出する楽曲抽出部 23、ユーザの嗜好を示す嗜好情報が記録されている嗜好情報データベース (DB) 24、ユーザの嗜好を入力する嗜好入力部 25、抽出された楽曲の中力もランダムに 1つの楽曲を選択するランダム選択部 26、抽出された楽曲と元楽曲またはユーザの嗜好との類似度を算出して最も類似度の高い楽曲を選択する類似度算出部 27、ランダム選択部 26または類似度算出部 27における選択の理由を示す選択理由文を生成する選択理由生成部 28、および、選択した楽曲と選択理由文をユーザに提示する楽曲提示部 29から構成される。

[0031] 楽曲データベース（DB) 11は、音楽 CDに収録されている楽曲のメタデータを供給するインタネット上のデータサーバである CDDB(CD Data Base)や Music Naviなどに相当する。

[0032] クラスタリング部 12は、楽曲データベース 11の全ての楽曲に対し、楽曲のメタデータの各項目（タイトル、アーティスト名、ジャンル、レビューテキスト、テンポ、ビート、リズムなど)を、図 2に示すようなクラスタ層（第 1乃至 n層）のいずれかに分類し、各項目の実情報を分類したクラスタ層に設けられる複数のクラスタのいずれかに楽曲を分類 (クラスタリング)する。

[0033] なお、 1つの楽曲を複数のクラスタに分類してもよい。同一クラスタ層に存在するクラスタ間の距離 (類似の程度を示す）は既知であるものとする。このクラスタリングの手法については後述する。そして、メタデータの代わりに楽曲の特徴を示す情報として、メタデータの各項目の実情報を分類したクラスタのクラスタ ID (図 2における CL11など )から成るクラスタ情報を生成してクラスタ情報データベース 14に出力する。

[0034] なお、分類に適したクラスタが存在しな、場合、新たにクラスタを新設してもよヽ。各クラスタのサイズは任意であって複数の楽曲を包含できるものである。なお、単一の楽曲だけしか分類することができないクラスタを設けてもよい。この場合、当該クラスタのクラスタ IDに唯一分類可能な楽曲の実情報の ID (アーティスト ID、アルバム ID、タィトル ID)を用いてもよい。

[0035] クラスタ情報データベース 14は、クラスタリング部 12によって生成された各楽曲のクラスタ情報を保持している。また、クラスタ情報データベース 14は、保持するクラスタ情報に基づき、各クラスタにメタデータが分類された楽曲の楽曲 IDを示すクラスタ一楽曲 ID情報を生成し、これを保持している。さらに、クラスタ情報データベース 14は、キーワード設定部 13によって設定された各クラスタ層や各クラスタに対して設定されたキーワードも保持してヽる。

[0036] 図 3はクラスタ情報の一例を示している。同図においては、例えば、楽曲 ID=ABC1 23の楽曲のクラスタ†青報は、 (CL12, CL21, CL35, CL47, CL52, · ··, CLn2)であることを示している。また例えば、楽曲 ID = CTH863の楽曲のクラスタ情報は、クラスタ ID (CL11、 CL25, CL31, CL42, CL53, · ··, CLnl)であることを示して! /、る。

[0037] 図 4は、図 3に示されたクラスタ情報に対応するクラスター楽曲 ID情報の一例を示している。同図においては、例えば、クラスタ ID = CL11には、楽曲 ID = CTH863が対応することを示している。また例えば、クラスタ ID=CL21には、楽曲 ID=ABC123が対応することを示している。

[0038] なお、クラスタリング部 12、キーワード設定部 13、およびクラスタ情報データベース 14の処理は、類似楽曲検索処理や楽曲推薦処理 (後述)を実行する以前に予め実行する必要がある。

[0039] 図 1に戻る。検索楽曲指定部 21は、ユーザによって指定される元楽曲の楽曲 IDとメタデータをクラスタマッピング部 22に出力する。クラスタマッピング部 22は、検索楽曲指定部 21から入力された元楽曲のメタデータを、既存のクラスタ識別手法 (クラシフィケーシヨン手法)を用いて最適クラスタを選ぶ。クラスタ識別手法としては、 k-Near est-Neighbor法などを適用することができる。なお、元楽曲のクラスタ情報が既にクラスタ情報データベース 14に存在する場合、それを読み出して楽曲抽出部 23に供給するようにしてちょい。

[0040] 楽曲抽出部 23は、クラスタマッピング部 22から供給される元楽曲のクラスタ情報に基づ、てクラスタ情報データベース 14を参照し、元楽曲と同じクラスタに分類されている楽曲の楽曲 IDを取得してランダム選択部 26または類似度算出部 27に供給する。また、楽曲抽出部 23は、嗜好情報データベース 24の嗜好情報に基づいてクラスタ情報データベース 14を参照して、ユーザの嗜好に合致する楽曲の楽曲 IDを取得してランダム選択部 26または類似度算出部 27に供給する。

[0041] 嗜好情報データベース 24は、ユーザの嗜好を示す嗜好情報が記録されている。嗜好情報には、各クラスタに対するユーザの嗜好の程度を示す嗜好値が記録されて、る。この嗜好値は正規ィ匕された値であり、嗜好入力部 25によって更新される。また、嗜好情報データベース 24は、各クラスタ層における嗜好値の分散を演算し、嗜好値の分散が最も小さい（すなわち、ユーザの嗜好が特定のクラスタに集中している）クラスタ層を検出する。

[0042] 図 5は嗜好情報の一例を示している。同図においては、例えばクラスタ CL11に対する嗜好値が 0. 5であることを示している。また例えば、クラスタ CL32に対する嗜好値が 0. 1であることを示している。

[0043] 嗜好入力部 25は、楽曲に対するユーザの操作 (再生、録音、スキップ、消去など）の履歴に基づいて各クラスタにそれぞれ対応する嗜好値を更新する。また、嗜好入力部 25は、ユーザからの設定に基づき、ユーザが重視しているクラスタ層をクラスタ情報データベース 14に通知する。

[0044] ランダム選択部 26は、楽曲抽出部 23によって抽出された楽曲の中力もランダムに楽曲 IDを 1つ選択して選択理由生成部 28に出力する。類似度算出部 27は、楽曲抽出部 23によって抽出された楽曲と元楽曲またはユーザの嗜好との類似度を算出し、最も類似度の高い楽曲を選択して選択理由生成部 28に出力する。なお、ランダム選択部 26と類似度算出部 27は、双方が動作する必要はなぐいずれか一方が動作すればよい。

[0045] 選択理由生成部 28は、クラスタ情報データベース 14力もクラスタ層やクラスタに対応するキーワードを取得し、取得したキーワードなどを用いて選択の理由を示す選択理由文を生成し、選択された楽曲の楽曲 IDとともに楽曲提示部 29に出力する。

[0046] 選択理由文は以下のように生成する。例えば、類似した楽曲や嗜好に合致した楽曲を選択するときに優先したクラスタ層に設定されたキーワードやクラスタのキーヮードを用いる。具体的には、レビューテキストに対応するクラスタ層を最も優先した場合、「レビューテキストに出てくる「夏」、「海辺」がお気に入りじやない？」などの選択理由文を生成する。あるいは、選択された楽曲のレビューテキストをそのまま選択理由文として引用したり、選択された楽曲のレビューテキストから抽出した単語を用いて選択理由文を生成する。なお、レビューテキストから選択理由文に用いる単語を抽出するには Tf/idlf去を適用することができる。

[0047] 楽曲提示部 29は、例えばディスプレイなどからなり、選択理由生成部 28から入力される楽曲 IDの楽曲と選択理由文とをユーザに提示する。

[0048] 次に、クラスタリング部 12によるメタデータの分類 (クラスタリング）について説明する

[0049] クラスタリング手法はいかなる手法でもかまわないが、クラスタ層毎に最適なクラスタリング手法、距離尺度を選ぶようにする。例えば、メタデータの実情報が数値であるならばそのまま、タイトルなどの場合は主成分分析等の数量ィ匕手法を用いて数値にして、ユークリッド距離などの距離尺度を定義してクラスタリングすることになる。代表的なクラスタリング手法としは、 K-means法、階層クラスタリング法などを挙げることができる。

[0050] この際、嗜好距離を反映したクラスタリング (例えば、制約付きクラスタリング）によつて実施することが望ましい。そのためには、事前調査により部分的な正解集 (嗜好的に近い実情報の集合、遠い実情報の集合など)を作り、それに適合する数値表現、距離、クラスタリング手法を用いるものとする。またさらに、形成される各クラスタ層の独立性が高くなるクラスタリング手法 (すなわち、特性の異なるクラスタリング手法)を選ぶことが望ましい。

[0051] 例えば 4種類のクラスタリング手法 (以下、第 1乃至 4手法と称する）の中力も特性の異なる 2種類のクラスタリング手法を選択する方法について、図 6乃至図 10を参照して説明する。

[0052] まず、第 1乃至 4手法によってメタデータの実情報であるアーティスト八乃¾ [をクラスタリングする。そして図 6に示すような結果が得られたとする。

[0053] すなわち、第 1手法により、アーティスト A乃至 Cがクラスタ CL1に、アーティスト D乃至 Gがクラスタ CL2に、アーティスト 11乃¾ [がクラスタ CL3にクラスタリングされ、第 2 手法により、アーティスト A, Bがクラスタ CL1に、アーティスト C乃至 Fがクラスタ CL2 に、アーティスト 0乃¾ [がクラスタ CL3にクラスタリングされ、第 3手法により、アーティスト A, D, G, Jがクラスタ CL1に、アーティストお E, Hがクラスタ CL2に、アーティス C, F, Iがクラスタ CL3にクラスタリングされ、第 4手法により、アーティスト D, I, Jがクラスタ CL1に、アーティスト E乃至 Gがクラスタ CL2に、アーティスト A乃至 Cおよび H 力 Sクラスタ CL3にクラスタリングされたとする。

[0054] この場合、第 1乃至 4手法による結果の重複率（％)は図 7に示すとおりである。すなわち、第 1手法と第 2手法の重複率は 0. 8、第 1手法と第 3手法の重複率は 0. 3、第 1手法と第 4手法の重複率は 0. 4、第 2手法と第 3手法の重複率は 0. 3、第 2手法と第 4手法の重複率は 0. 3、第 3手法と第 4手法の重複率は 0. 4である。

[0055] 図 7に示された重複率が小さいほど 2つの手法の特性が異なると考えられるので、重複率が最小値の 0. 3である第 1手法と第 3手法の組み合わせ、第 2手法と第 3手法の組み合わせ、または第 2手法と第 4手法の組み合わせを採用することが望ま、。

[0056] 一方、ユーザ自身によってアーティスト八乃¾ [のうちの二人が同じクラスタに分類されるべきである力否かを判定させた場合、図 8に示すような結果が得られたとする。ただし、同図において、 1は同じクラスタに分類されるべきであることを、 0は異なるクラスタに分類されるべきであることを意味する。すなわち、同図においては、例えば、ァーテイスト Aがアーティスト B, C, F, H, Iと同じクラスタに分類されるべきであると判断されたが示されており、アーティスト Bがアーティスト C, D, E, Jと同じクラスタに分類されるべきであることが示されて、る。

[0057] 図 8に示された結果と正解として理想的なクラスタリング結果であるとするならば、上述した第 1乃至 4手法の正解率は図 9に示すとおりである。すなわち、第 1手法の正解率は 62. 2%、第 2手法の正解率は 55. 6%、第 3手法の正解率は 40. 0%、第 4 手法の正解率は 66. 7%である。

[0058] したがって、正解率を重視するならば、正解率が高い第 1手法と第 4手法の組み合わせを採用することが望ましい。

[0059] さらに、重複率と正解率を加味したクラスタリング手法の組み合わせを求めるため、第 1乃至 4手法の正解の重複率を算出すれば、図 10に示すとおりとなる。図 9に示された結果から正解率が極端に低!ヽ手法を特定し、特定した当該手法を含まな!/ヽ組み合わせのうちの正解率の重複率が最も低、組み合わせを採用すればよ!、。すなわち、正解率が極端に低い手法として第 3手法が特定され、第 3手法を含まない組み合わせのうちの正解の重複率が最も低いものとして第 2手法と第 4手法の組み合わせが選択される。

[0060] なお、上述した重複率や正解率にっ、ては絶対的な閾値を指定して、それ閾値を満たすことができなヽ手法を除外してもよ!/ヽし、バランスがとれた手法を採用するために、 2つの指標（重複率と正解率）に基づいて例えば、以下に示す 2例のような総合的な指標を作成し、総合的な指標に基づいてクラスタリングの手法の組み合わせを選択するようにしてもよヽ。

総合的な指標 =正解率 X ( 1—重複率）

総合的な指標 = a ·正解率 X |8 ( 1—重複率） ( a , 13は所定の係数）

[0061] 次に、元楽曲に類似した楽曲を提示する 3種類の類似楽曲検索処理と、ユーザの嗜好に合致する楽曲を提示する 2種類の楽曲推薦処理について説明する。

[0062] なお、以下に説明する類似楽曲検索処理や楽曲推薦処理が行われる前処理として、クラスタリング部 12、キーワード設定部 13、およびクラスタ情報データベース 14が動作しており、既にクラスタ情報データベース 14には、クラスタリング部 12によって生成された各楽曲のクラスタ情報と、クラスタ情報データベース 14が生成したクラスター楽曲 ID情報と、キーワード設定部 13によって設定された各クラスタ層や各クラスタに対して設定されたキーワードが保持されて、るものとする。

[0063] まず、類似楽曲検索処理について説明する。

[0064] 図 11は、第 1の類似楽曲検索処理を説明するフローチャートである。第 1の類似楽曲検索処理の前処理として、クラスタ情報データベース 14は、嗜好入力部 25から入力されるユーザの各クラスタ層に対する優先度に応じ、優先順位が高い方のクラスタ層力も順に、層番号を 1, 2, · ··, nまで振り直しているものとする。

[0065] ステップ S1において、検索楽曲指定部 21は、ユーザによって指定される元楽曲の楽曲 IDとメタデータをクラスタマッピング部 22に出力する。クラスタマッピング部 22は、入力された元楽曲のメタデータを、従来のクラスタ識別手法を用いて最適クラスタにマッピングし、この結果 (以下、最適クラスタ情報と称する）を楽曲抽出部 23に供給する。

[0066] ステップ S2において、楽曲抽出部 23は、クラスタ情報データベース 14を参照し、クラスタ情報データベース 14にクラスタ情報が保持されている全ての楽曲の楽曲 IDを要素とする集合 Cを想定する。ステップ S3において、楽曲抽出部 23は、層番号 iを 1 に初期化する。

[0067] ステップ S4において、楽曲抽出部 23は、層番号 W (nはクラスタ層の総数)以下であるか否かを判定する。層番号 ¾以下であると判定された場合、処理はステップ S5に進む。ステップ S5において、楽曲抽出部 23は、クラスタマッピング部 22から入力された元楽曲の最適クラスタ情報に基づき、元楽曲が第 i層にお、てどのクラスタに属して、るのかを特定する。特定したクラスタを CLixと称する。

[0068] ステップ S6において、楽曲抽出部 23は、クラスタ情報データベース 14のクラスタ一楽曲 Iひ f青報を参照し、特定したクラスタ CLixに属する楽曲の楽曲 IDを取得する。ステツプ S7において、楽曲抽出部 23は、ステップ S6の処理で取得した楽曲 IDを要素とする集合 Aを想定する。ステップ S8において、楽曲抽出部 23は、集合 Cと集合 Aに共通する要素（楽曲 ID)を抽出し、ステップ S9において、共通する楽曲 IDが存在する力否力 (すなわち、ステップ S8の処理で、集合 Cと集合 Aに共通する楽曲 IDを抽出できたか否か)を判定する。集合 Cと集合 Aに共通する楽曲 IDが存在すると判定した場合、処理はステップ S 10に進み、集合 Cの要素を、ステップ S8で抽出した共通する楽曲 IDだけに減少させる。ステップ S 11において、楽曲抽出部 23は、層番号 iを 1だけインクリメントしてステップ S4に戻り、それ以降の処理を繰り返す。

[0069] なお、ステップ S9において、集合 Cと集合 Aに共通する楽曲 IDが存在しないと判定された場合、ステップ S10はスキップされ、処理はステップ S 11に進む。 [0070] このステップ S4乃至 Sl lの処理が繰り返されることにより、集合 Cの要素（楽曲 ID) が減少されてゆく。そして、ステップ S4において、層番号よりも大きくなり、 n以下ではないと判定された場合、処理はステップ S 12に進む。

[0071] ステップ S12において、楽曲抽出部 23は、集合 Cの要素（楽曲 ID)をランダム選択部 26に出力する。ランダム選択部 26は、集合 Cの中力もランダムに 1つの楽曲を選択して選択理由生成部 28に出力する。なお、ランダム選択部 26ではなぐ類似度算出部 27に集合 Cの要素（楽曲 ID)を出力し、類似度算出部 27により、 1つの楽曲を選択するようにしてもよヽ。

[0072] ステップ S13において、選択理由生成部 28は、ランダム選択部 26 (または類似度算出部 27)によって選択された楽曲が選択された理由を示す選択理由文を生成して、選択された楽曲の楽曲 IDとともに楽曲提示部 29に出力する。ステップ S14において、楽曲提示部 29は、選択理由生成部 28から入力される楽曲 IDの楽曲と選択理由文とをユーザに提示する。

[0073] 以上説明した第 1の類似楽曲検索処理によれば、元楽曲の特徴ベクトルと他の楽曲の特徴ベクトルとの距離の算出を必須とせず、各クラスタ層に対するユーザの優先順位を考慮しつつ、元楽曲に類似した楽曲を提示することが可能となる。

[0074] 図 12は、第 2の類似楽曲検索処理を説明するフローチャートである。第 2の類似楽曲検索処理の前処理として、嗜好情報データベース 24は、各クラスタ層における嗜好値の分散を演算し、嗜好値の分散が最も小さい (すなわち、ユーザの嗜好が特定のクラスタに集中して、る）クラスタ層を検出し、嗜好が集中して、るクラスタを特定しているものとする。当該クラスタ層の層番号を P、当該クラスタを CLppとする。

[0075] ステップ S31〖こお!/、て、嗜好情報データベース 24は、各クラスタ層における嗜好値の分散を演算し、嗜好値の分散が最も小さい (すなわち、ユーザの嗜好が特定のクラスタに集中して、る）クラスタ層を検出して第 P層とするは 1乃至 nの整数)。さらに、第 P層にお、て嗜好が集中して、るクラスタを特定して CLppとする。

[0076] ステップ S32において、検索楽曲指定部 21は、ユーザによって指定される元楽曲の楽曲 IDとメタデータをクラスタマッピング部 22に出力する。クラスタマッピング部 22 は、入力された元楽曲のメタデータを、従来のクラスタ識別手法を用いて最適クラスタにマッピングし、この最適クラスタ情報を生成し楽曲抽出部 23に供給する。

[0077] ステップ S33において、楽曲抽出部 23は、クラスタ情報データベース 14を参照し、クラスタ情報データベース 14にクラスタ情報が保持されている全ての楽曲の楽曲 ID を要素とする集合 Cを想定する。ステップ S34において、楽曲抽出部 23は、層番号 i を 1に初期化する。

[0078] ステップ S35において、楽曲抽出部 23は、層番号 iが n(nはクラスタ層の総数）以下であるか否かを判定する。層番号 ¾以下であると判定された場合、処理はステップ S36に進む。ステップ S36において、楽曲抽出部 23は、ステップ S31で特定した Pと層番号 iがー致する力否かを判定し、一致すると判定した場合、ステップ S37に進み、次のステップ 39における処理対象をクラスタ CLppに特定する。

[0079] 一方、ステップ S36において、ステップ S31で特定した Pと層番号 iがー致しないと判定された場合、ステップ S38に進む。ステップ S38において、楽曲抽出部 23は、クラスタマッピング部 22から入力された元楽曲の最適クラスタ情報に基づき、元楽曲が第 i層にお、てどのクラスタに属して、るのかを特定する。特定したクラスタを CLixと称する。

[0080] ステップ S39において、楽曲抽出部 23は、クラスタ情報データベース 14のクラスタ —楽曲 HD情報を参照し、ステップ S37の処理で特定したクラスタ CLppまたはステツプ S38の処理で特定したクラスタ CLixに属する楽曲の楽曲 IDを取得する。

[0081] ステップ S40において、楽曲抽出部 23は、ステップ S39の処理で取得した楽曲 ID を要素とする集合 Aを想定する。ステップ S41において、楽曲抽出部 23は、集合じと集合 Aに共通する要素（楽曲 ID)を抽出し、ステップ S42において、共通する楽曲 ID が存在するか否か (すなわち、ステップ S41の処理で、集合 Cと集合 Aに共通する楽曲 IDを抽出できたカゝ否か)を判定する。集合 Cと集合 Aに共通する楽曲 IDが存在すると判定した場合、処理はステップ S43に進み、集合 Cの要素を、ステップ S41で抽出した共通する楽曲 IDだけに減少させる。ステップ S44において、楽曲抽出部 23は、層番号 iを 1だけインクリメントしてステップ S35に戻り、それ以降の処理を繰り返す。

[0082] なお、ステップ S42において、集合 Cと集合 Aに共通する楽曲 IDが存在しないと判定された場合、ステップ S43はスキップされ、処理はステップ S44に進む。 [0083] このステップ S35乃至 S44の処理が繰り返されることにより、集合 Cの要素（楽曲 ID )が減少されてゆく。そして、ステップ S35において、層番号よりも大きくなり、 n以下ではな!/ヽと判定された場合、処理はステップ S45に進む。

[0084] ステップ S45において、楽曲抽出部 23は、集合 Cの要素（楽曲 ID)をランダム選択部 26に出力する。ランダム選択部 26は、集合 Cの中力もランダムに 1つの楽曲を選択して選択理由生成部 28に出力する。なお、ランダム選択部 26ではなぐ類似度算出部 27に集合 Cの要素（楽曲 ID)を出力し、類似度算出部 27により、 1つの楽曲を選択するようにしてもよヽ。

[0085] ステップ S46において、選択理由生成部 28は、ランダム選択部 26 (または類似度算出部 27)によって選択された楽曲が選択された理由を示す選択理由文を生成して、選択された楽曲の楽曲 IDとともに楽曲提示部 29に出力する。ステップ S47において、楽曲提示部 29は、選択理由生成部 28から入力される楽曲 IDの楽曲と選択理由文とをユーザに提示する。

[0086] 以上説明した第 2の類似楽曲検索処理によれば、元楽曲の特徴ベクトルと他の楽曲の特徴ベクトルとの距離の算出を必須とせず、ユーザの嗜好を示す嗜好値が高いクラスタに属する楽曲であって、かつ、元楽曲に類似した楽曲を提示することが可能となる。

[0087] 図 13は、第 3の類似楽曲検索処理を説明するフローチャートである。

[0088] ステップ S61において、検索楽曲指定部 21は、ユーザによって指定される元楽曲の楽曲 IDとメタデータをクラスタマッピング部 22に出力する。クラスタマッピング部 22 は、入力された元楽曲のメタデータを従来のクラスタ識別手法を用いて最適クラスタにマッピングし、この最適クラスタ情報を楽曲抽出部 23に供給する。

[0089] ステップ S62において、楽曲抽出部 23は、評価値を付けた楽曲 IDを要素とする集合 Cを想定して初期化する。すなわち、この時点で集合 Cは空集合である。ステップ S 63において、楽曲抽出部 23は、層番号 iを 1に初期化する。

[0090] ステップ S64において、楽曲抽出部 23は、層番号 iが n(nはクラスタ層の総数）以下であるか否かを判定する。層番号 ¾以下であると判定された場合、処理はステップ S65に進む。ステップ S65において、楽曲抽出部 23は、クラスタマッピング部 22から入力された元楽曲の最適クラスタ情報に基づき、元楽曲が第 i層においてどのクラスタに属して、るのかを特定する。特定したクラスタを CLixと称する。

[0091] ステップ S66において、楽曲抽出部 23は、嗜好情報データベース 24を参照して、ステップ S65の処理で特定したクラスタ CLixに対するユーザの嗜好値を取得し、取得した嗜好値に基づ!/、て、クラスタ CLixに属する楽曲に対して付与する評価値を決定する。

[0092] ステップ S67において、楽曲抽出部 23は、クラスタ情報データベース 14のクラスタ —楽曲 HD情報を参照し、特定したクラスタ CLixに属する楽曲の楽曲 IDを取得する。ステップ S68において、楽曲抽出部 23は、ステップ S67の処理で取得した楽曲 IDに、ステップ S66の処理で決定した評価値を付与する。そして、評価値付の楽曲 IDを要素とする集合 Aを想定する。

[0093] ステップ S69において、楽曲抽出部 23は、集合 Cに集合 Aの要素 (評価値付の楽曲 ID)を追加する。ステップ S70において、楽曲抽出部 23は、層番号 iを 1だけインクリメントしてステップ S64に戻り、それ以降の処理を繰り返す。

[0094] このステップ S64乃至 S70の処理が繰り返されることにより、集合 Cの要素（評価値付の楽曲 ID)が増加してゆく。そして、ステップ S64において、層番号よりも大きくなり、 n以下ではないと判定された場合、処理はステップ S71に進む。

[0095] ステップ S71において、楽曲抽出部 23は、集合 Cの要素 (評価値付の楽曲 ID)の中から、評価値が最も高いものを選択し、ランダム選択部 26 (または類似度算出部 2 7)を介して選択理由生成部 28に出力する。

[0096] ステップ S72において、選択理由生成部 28は、楽曲抽出部 23によって選択された楽曲が選択された理由を示す選択理由文を生成して、選択された楽曲の楽曲 IDとともに楽曲提示部 29に出力する。ステップ S73において、楽曲提示部 29は、選択理由生成部 28から入力される楽曲 IDの楽曲と選択理由文とをユーザに提示する。

[0097] 以上説明した第 3の類似楽曲検索処理によれば、元楽曲の特徴ベクトルと他の楽曲の特徴ベクトルとの距離の算出を必須とせず、元楽曲に類似した楽曲のうち、ユーザの嗜好に応じて付与された評価値が最も高いものを提示することが可能となる。

[0098] なお、上述した第 1乃至第 3の類似楽曲検索処理においては検索条件として楽曲を指定したが、アーティスト、アルバム等を指定して類似楽曲検索処理を行うこともできる。この場合、図 3, 4の楽曲 IDをアーティスト IDあるいはアルバム IDと読みかえればよい。例えばアーティストを検索条件とする場合、図 2でアーティストの関わるタイトル、アルバム、ジャンルなどに相当するクラスタ層を用いる。

[0099] 次に、楽曲推薦処理について説明する。

[0100] 図 14は、第 1の楽曲推薦処理を説明するフローチャートである。第 1の楽曲推薦処理の前処理として、クラスタ情報データベース 14は、嗜好入力部 25から入力されるユーザの各クラスタ層に対する優先度に応じ、優先順位が高い方のクラスタ層から順に、層番号を 1, 2, · ··, nまで振り直しているものとする。

[0101] ステップ S91において、楽曲抽出部 23は、クラスタ情報データベース 14を参照し、クラスタ情報データベース 14にクラスタ情報が保持されている全ての楽曲の楽曲 ID を要素とする集合 Cを想定する。ステップ S92において、楽曲抽出部 23は、層番号 i を 1に初期化する。

[0102] ステップ S93において、楽曲抽出部 23は、層番号 W¾(nはクラスタ層の総数)以下であるか否かを判定する。層番号 ¾以下であると判定された場合、処理はステップ S94に進む。ステップ S94において、楽曲抽出部 23は、嗜好情報データベース 24を参照し、第 i層のクラスタのうち、ユーザの嗜好値が最大のクラスタを特定する。特定したクラスタを CLixと称する。

[0103] ステップ S95において、楽曲抽出部 23は、クラスタ情報データベース 14のクラスタ —楽曲 HD情報を参照し、特定したクラスタ CLixに属する楽曲の楽曲 IDを取得する。ステップ S96において、楽曲抽出部 23は、ステップ S95の処理で取得した楽曲 IDを要素とする集合 Aを想定する。ステップ S97において、楽曲抽出部 23は、集合 Cと集合 Aに共通する要素（楽曲 ID)を抽出し、ステップ S98において、共通する楽曲 IDが存在するか否か (すなわち、ステップ S97の処理で、集合 Cと集合 Aに共通する楽曲 I Dを抽出できたか否か)を判定する。集合 Cと集合 Aに共通する楽曲 IDが存在すると判定した場合、処理はステップ S99に進み、集合 Cの要素を、ステップ S97で抽出した共通する楽曲 IDだけに減少させる。ステップ S 100において、楽曲抽出部 23は、層番号 iを 1だけインクリメントしてステップ S93に戻り、それ以降の処理を繰り返す。 [0104] なお、ステップ S98において、集合 Cと集合 Aに共通する楽曲 IDが存在しないと判定された場合、ステップ S99はスキップされ、処理はステップ S100に進む。

[0105] このステップ S93至 S100の処理が繰り返されることにより、集合 Cの要素（楽曲 ID) が減少されてゆく。そして、ステップ S93において、層番号よりも大きくなり、 n以下ではな!/ヽと判定された場合、処理はステップ S101に進む。

[0106] ステップ S101において、楽曲抽出部 23は、集合 Cの要素（楽曲 ID)をランダム選択部 26に出力する。ランダム選択部 26は、集合 Cの中力もランダムに 1つの楽曲を選択して選択理由生成部 28に出力する。なお、ランダム選択部 26ではなぐ類似度算出部 27に集合 Cの要素 (楽曲 ID)を出力し、類似度算出部 27により、 1つの楽曲を選択するようにしてもよ、。

[0107] ステップ S102において、選択理由生成部 28は、ランダム選択部 26 (または類似度算出部 27)によって選択された楽曲が選択された理由を示す選択理由文を生成して、選択された楽曲の楽曲 IDとともに楽曲提示部 29に出力する。ステップ S103において、楽曲提示部 29は、選択理由生成部 28から入力される楽曲 IDの楽曲と選択理由文とをユーザに提示する。

[0108] 以上説明した第 1の楽曲推薦処理によれば、ユーザの嗜好に対応する特徴べタトルと楽曲の特徴ベクトルとの距離の算出を必須とせず、各クラスタ層に対するユーザの優先順位を考慮しつつ、ユーザの嗜好に合致した楽曲をユーザに推薦することが可能となる。

[0109] 図 15は、第 2の楽曲推薦処理を説明するフローチャートである。

[0110] ステップ S121において、楽曲抽出部 23は、評価値を付けた楽曲 IDを要素とする集合 Cを想定して初期化する。すなわち、この時点で集合 Cは空集合である。ステツプ S122において、楽曲抽出部 23は、層番号 iを 1に初期化する。

[0111] ステップ S123において、楽曲抽出部 23は、層番号 iが n(nはクラスタ層の総数）以下であるか否かを判定する。層番号 ¾以下であると判定された場合、処理はステツプ S124に進む。ステップ S124において、楽曲抽出部 23は、嗜好情報データべ一ス 24を参照し、第 i層のクラスタのうち、ユーザの嗜好に対応する嗜好値が所定の値以上であるものを特定する。特定したものをクラスタ群 CLixと称する。 [0112] ステップ S125において、楽曲抽出部 23は、ステップ S 124の処理で特定したクラスタ群 CLixの各クラスタに対する嗜好値に基づ、て、クラスタ群 CLixの各クラスタに属する楽曲に対して付与する評価値を決定する。

[0113] ステップ S126において、楽曲抽出部 23は、クラスタ情報データベース 14のクラスター楽曲 HD情報を参照し、特定したクラスタ群 CLixの各クラスタに属する楽曲の楽曲 IDを取得する。ステップ S127において、楽曲抽出部 23は、ステップ S126の処理で取得した楽曲 IDに、ステップ S 125の処理で決定した評価値を付与する。そして、評価値付の楽曲 IDを要素とする集合 Aを想定する。

[0114] ステップ S128において、楽曲抽出部 23は、集合 Cに集合 Aの要素 (評価値付の楽曲 ID)を追加する。この際、集合 Cに同じ楽曲 IDがあれば評価値を足し合わせる。ステツプ S129において、楽曲抽出部 23は、層番号 iを 1だけインクリメントしてステップ S 123に戻り、それ以降の処理を繰り返す。

[0115] このステップ S123乃至 S129の処理が繰り返されることにより、集合 Cの要素（評価値付の楽曲 ID)が増加してゆく。そして、ステップ S123において、層番号 iが nよりも大きくなり、 n以下ではないと判定された場合、処理はステップ S130に進む。

[0116] ステップ S130において、楽曲抽出部 23は、集合 Cの要素 (評価値付の楽曲 ID)の中から、評価値が最も高いものを選択し、ランダム選択部 26 (または類似度算出部 2 7)を介して選択理由生成部 28に出力する。

[0117] ステップ S131において、選択理由生成部 28は、楽曲抽出部 23によって選択された楽曲が選択された理由を示す選択理由文を生成して、選択された楽曲の楽曲 ID とともに楽曲提示部 29に出力する。ステップ S132において、楽曲提示部 29は、選択理由生成部 28から入力される楽曲 IDの楽曲と選択理由文とをユーザに提示する

[0118] 以上説明した第 2の楽曲推薦処理によれば、ユーザの嗜好に対応する特徴べタトルと楽曲の特徴ベクトルとの距離の算出を必須とせず、ユーザの嗜好に応じて付与された評価値が最も高い楽曲をユーザに推薦することが可能となる。

[0119] 以上説明した第 1乃至 3の類似楽曲検索処理、並びに第 1および第 2の楽曲推薦処理によれば、元楽曲あるいはユーザの嗜好に対応する特徴ベクトルと、検索対象の楽曲の特徴ベクトルとの距離 (余弦相関など)を算出することなぐ提示する楽曲を選択することができる。また、いずれの処理においても、ユーザの嗜好を優先することができるので、検索や推薦に対するユーザの満足度を向上させることができる

[0120] クラスタ層毎に提示するための候補となる楽曲を選び出しているので、いわゆる嗜好の足し合わせによるなまりの問題が生じないという利点がある。

[0121] さらに、楽曲のメタデータのうち、数値によって表現されるものは、それ力クラスタ間の距離に反映されるように数値そのものが直接クラスタリングに使われるため、情報が最大限活用される。

[0122] また、クラスタ層をグループに分けて部分的に用いてもよい。例えば {関連アーティスト層、アーティストジャンル層、アーティストレビューテキスト層 }をアーティスト検索推薦用グループに、 {楽曲特徴量層（テンポ、リズム、 etc) ,曲ジャンル層、曲レビューテキスト層 }を楽曲検索推薦用グループとして定義するようにしてもょ、。

[0123] ところで、上述した一連の処理は、ハードウェアにより実行させることもできる力ソフトウエア〖こより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラム力専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図 16に示すように構成される汎用のパーソナルコンビユータなどに、記録媒体からインストールされる。

[0124] このパーソナルコンピュータ 100は、 CPU(Central Processing Unit)101を内蔵している。 CPU101にはバス 104を介して、入出力インタフェース 105が接続されている。ノス 104には、 ROM(Read Only Memory)102および RAM(Random Access Memory) 103が接続されている。

[0125] 入出力インタフェース 105には、ユーザが操作コマンドを入力するキーボード、マウス等の入力デバイスよりなる入力部 106、画面を表示する CRT(Cathode Ray Tube)または LCD(Liquid Crystal Display)等のディスプレイよりなる出力部 107、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部 108、およびモデム、 LAN (Local Area Network)アダプタなどよりなり、インタネットに代表されるネットヮークを介した通信処理を実行する通信部 109が接続されている。また、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD- ROM(Compact Disc-Read Only Memor y)、 DVD(Digital Versatile Disc)を含む）、光磁気ディスク（MD(Mini Disc)を含む）、もしくは半導体メモリなどの記録媒体 111に対してデータを読み書きするドライブ 110 が接続されている。

[0126] このパーソナルコンピュータ 100に上述した一連の処理を実行させるプログラムは、記録媒体 111に格納された状態でパーソナルコンピュータ 100に供給され、ドライブ 110によって読み出されて記憶部 108に内蔵されるハードディスクドライブにインストールされている。記憶部 108にインストールされているプログラムは、入力部 106に入力されるユーザからのコマンドに対応する CPU101の指令によって、記憶部 108から RAM103にロードされて実行される。

[0127] 図 17は、本発明の一実施の形態の推薦システム 1の他の構成の例を示すブロック図である。図 17において、図 1に示す場合と同様の部分には同一の符号を付してあり、その説明は省略する。

[0128] 図 17に示される推薦システム 1は、楽曲 DB11、キーワード設定部 13、クラスタ情報 DB14、検索楽曲指定部 21、クラスタマッピング部 22、楽曲抽出部 23、嗜好情報データベース 24、嗜好入力部 25、ランダム選択部 26、類似度算出部 27、選択理由生成部 28、楽曲提示部 29、メタデータクラスタリング部 201、および楽曲クラスタリング部 202から構成される。

[0129] メタデータクラスタリング部 201は、楽曲データベース 11に記録されている各楽曲のメタデータをクラスタリングする。すなわち、メタデータクラスタリング部 201は、コンテンッである楽曲のメタデータを複数のクラスタの、ずれかに分類し、クラスタに階層を割り当てる。

[0130] メタデータクラスタリング部 201は、各楽曲のメタデータのクラスタリングの結果を楽曲クラスタリング部 202に供給する。

[0131] 楽曲クラスタリング部 202は、メタデータクラスタリング部 201による各楽曲のメタデータのクラスタリングの結果を基に、クラスタリング部 12と同様に、各楽曲をクラスタリングして各楽曲のクラスタ情報を生成する。すなわち、楽曲クラスタリング部 202は、各楽曲のクラスタリングの結果に応じたクラスタ情報を生成してクラスタ情報 DB14に出力する。

[0132] 次に、図 18のフローチャートを参照して、図 17に示される推薦システム 1における、楽曲を推薦する処理の準備であるオフライン時の前処理の例について説明する。

[0133] ステップ S201において、メタデータクラスタリング部 201は、楽曲 DB11から楽曲のメタデータを取得して、取得したメタデータの次元を圧縮する。例えば、ステップ S20 1において、メタデータクラスタリング部 201は、楽曲 DB11から取得した楽曲のメタデ ~~タの次兀、 LbA {the latent semantic analysis)、 PLbA {the probabilistic latent se mantic analysis)、または数量化 III類などの手法により圧縮する。

[0134] なお、ステップ S201において、メタデータクラスタリング部 201は、楽曲のメタデータをベクトルィ匕するようにしてもょ、。

[0135] ステップ S202において、メタデータクラスタリング部 201は、各楽曲のメタデータをクラスタリングする。例えば、ステップ S 202において、メタデータクラスタリング部 201 は、各楽曲のメタデータをソフトクラスタリングする。

[0136] より具体的には、例えば、図 19で示されるように、メタデータクラスタリング部 201は、それぞれの階層内において、アイテムの各クラスタへの帰属重みの和が 1となるように、各楽曲のメタデータをソフトクラスタリングする。

[0137] 例えば、 ABC123である楽曲 IDで特定される楽曲のメタデータの第 1階層（層番号 1 )における第 1のクラスタ、第 2のクラスタ、第 3のクラスタ、および第 4のクラスタへの帰属重みは、それぞれ、 0. 0、 0. 8、 0. 0、および 0. 2である。 ABC123である楽曲 ID で特定される楽曲のメタデータの第 2階層（層番号 2)における第 5のクラスタ、第 6のクラスタ、第 7のクラスタ、および第 8のクラスタへの帰属重みは、それぞれ、 0. 4、 0. 6、 0. 0、および 0. 0である。 ABC123である楽曲 IDで特定される楽曲のメタデータの第 3階層（層番号 3)における第 9のクラスタ、第 10のクラスタ、および第 11のクラスタへの帰属重みは、それぞれ、 0. 0、 0. 0、および 1. 0である。また、 ABC123である楽曲 IDで特定される楽曲のメタデータの第 n階層（層番号 n)における 4つのクラスタのそれぞれへの帰属重みは、それぞれ、 1. 0、 0. 0、 0. 0、および 0. 0である。

[0138] 例えば、 CTH863である楽曲 IDで特定される楽曲のメタデータの第 1階層における第 1のクラスタ、第 2のクラスタ、第 3のクラスタ、および第 4のクラスタへの帰属重みは、それぞれ、 1. 0、 0. 0、 0. 0、および 0. 0である。 CTH863である楽曲 IDで特定される楽曲のメタデータの第 2階層における第 5のクラスタ、第 6のクラスタ、第 7のクラスタ、および第 8のクラスタへの帰属重みは、それぞれ、 0. 0、 0. 5、 0. 5、および 0. 0である。 CTH863である楽曲 IDで特定される楽曲のメタデータの第 3階層における第 9 のクラスタ、第 10のクラスタ、および第 11のクラスタへの帰属重みは、それぞれ、 0. 7 、 0. 3、および 0. 0である。また、 CTH863である楽曲 IDで特定される楽曲のメタデータの第 n階層における 4つのクラスタのそれぞれへの帰属重みは、それぞれ、 0. 0、 0 . 8、 0. 2、および 0. 0である。

[0139] 例えば、 XYZ567である楽曲 IDで特定される楽曲のメタデータの第 1階層における第 1のクラスタ、第 2のクラスタ、第 3のクラスタ、および第 4のクラスタへの帰属重みは、それぞれ、 0. 0、 0. 4、 0. 6、および 0. 0である。 XYZ567である楽曲 IDで特定される楽曲のメタデータの第 2階層における第 5のクラスタ、第 6のクラスタ、第 7のクラスタ、および第 8のクラスタへの帰属重みは、それぞれ、 0. 0、 0. 0、 0. 0、および 1. 0である。 XYZ567である楽曲 IDで特定される楽曲のメタデータの第 3階層における第 9のクラスタ、第 10のクラスタ、および第 11のクラスタへの帰属重みは、それぞれ、 0. 9、 0. 0、および 0. 1である。また、 XYZ567である楽曲 IDで特定される楽曲のメタデータの第 n階層における 4つのクラスタのそれぞれへの帰属重みは、それぞれ、 0. 3、 0. 0、 0. 0、および 0. 7である。

[0140] なお、各楽曲のメタデータのソフトクラスタリングは、それぞれの階層内において、ァィテム、すなわち楽曲の各クラスタへの帰属重みの和が 1となるものに限られない。また、各アイテムが各階層において、いずれのクラスタに属さないものとしてもよい。

[0141] ステップ S203において、メタデータクラスタリング部 201は、クラスタの層を割り当てる。

[0142] ここで、図 20および図 21を参照して、メタデータのクラスタリングおよびクラスタの層の割り当てについて説明する。図 20は、メタデータの例を示す図である。図 20で示されるメタデータは、簡単のため、 0または 1のいずれかの値のカテゴリカルデータとされている。

[0143] 高次の分類としてのメタグループ 1には、メタデータ 1、メタデータ 2、およびメタデータ 3が属し、高次の分類としてのメタグループ 2には、メタデータ 4、メタデータ 5、およびメタデータ 6が属する。例えば、メタグループ 1には、アーティストに関するメタデータが属し、メタデータ 1は、アーティストの外観を示し、メタデータ 2は、グループであることを示す。また、例えば、メタグループ 2には、ジャンルに関するメタデータが属し、メタデータ 4は、ポップスであることを示し、メタデータ 5は、ロックであることを示す。

[0144] 図 20に示す例において、 ABC123である楽曲 IDで特定される楽曲のメタデータ 1乃至メタデータ 6は、それぞれ、 1, 1, 1, 1, 1, 1であり、 CTH863である楽曲 IDで特定される楽曲のメタデータ 1乃至メタデータ 6は、それぞれ、 0, 1, 0, 0, 1, 1であり、 XY Z567である楽曲 IDで特定される楽曲のメタデータ 1乃至メタデータ 6は、それぞれ、 1 , 1, 1, 1, 1, 1である。また、 EKF534である楽曲 IDで特定される楽曲のメタデータ 1 乃至メタデータ 6は、それぞれ、 1, 0, 1, 0, 0, 1であり、 OPQ385である楽曲 IDで特定される楽曲のメタデータ 1乃至メタデータ 6は、それぞれ、 1, 0, 1, 1, 0, 0である。

[0145] このとき、 ABC123である楽曲 IDで特定される楽曲乃至 OPQ385である楽曲 IDで特定される楽曲についての、メタデータ 1をベクトルとみなす。同様に、 ABC123である楽曲 IDで特定される楽曲乃至 OPQ385である楽曲 IDで特定される楽曲についての、メタデータ 2乃至メタデータ 6のそれぞれをベクトルとみなす。すなわち、複数の楽曲についての 1つのメタデータの値をベクトルとみなす。

[0146] このベクトル同士の距離に注目する。

[0147] 図 20で示される例において、ベクトルとみなされたメタデータ 1、メタデータ 3、メタデータ 4が、マンハッタン距離 1以内のクラスタに、また、メタデータ 2、メタデータ 5、メタデータ 6が、マンハッタン距離 1以内の他のクラスタに、まとまつている。

[0148] そこで、これらのクラスタを、新たなメタデータの階層とする。すなわち、階層のそれぞれの層に、より近、メタデータが割り付けられる。

[0149] 図 21は、このようにクラスタリングされ、層が割り付けられたメタデータの例を示す。

図 21に示す例において、第 1層には、メタデータ 1、メタデータ 3、およびメタデータ 4 が属し、第 2層には、メタデータ 2、メタデータ 5、およびメタデータ 6が属する。

[0150] このように、相関の高いメタデータの集まりでそれぞれの層が形成され、その中で楽曲のクラスタリングが行われるので、ジャンルやアーティストなどをそのまま階層とするような通常の階層分けでは表現しきれない微妙な楽曲間の差をクラスタに反映することがでさる。

[0151] 図 18に戻り、ステップ S204において、楽曲クラスタリング部 202は、層毎に楽曲をクラスタリングして、処理は終了する。すなわち、楽曲クラスタリング部 202は、各コンテンッを、割り当てられた階層のそれぞれにおヽて複数のクラスタの!/ヽずれかに分類する。

[0152] このようにすることで、メタデータによる楽曲の表現の詳細度 (表現の詳細さの度合い）を保ったまま、データ量および計算量を削減して、楽曲をクラスタリングすることができる。

[0153] また、以上のように、メタデータを階層化することにより、楽曲間の微妙な相違がよく表現されるように楽曲をクラスタリングすることができる。

[0154] 次に、図 22のフローチャートを参照して、第 4の類似楽曲検索処理を説明する。ステツプ S221において、検索楽曲指定部 21は、類似元となる元楽曲を設定する。すなわち、例えば、ステップ S221において、検索楽曲指定部 21は、クラスタマッピング部 22を介して、ユーザの指定に応じて、元楽曲の楽曲 IDを楽曲抽出部 23に出力することにより、元楽曲を設定する。

[0155] ステップ S222において、類似度算出部 27は、各クラスタの帰属重みから、元楽曲と、元楽曲以外の全ての楽曲のそれぞれとの類似度を計算する。

[0156] 例えば、楽曲抽出部 23は、楽曲 IDで特定される元楽曲のクラスタ情報と、元楽曲以外の全ての楽曲のクラスタ情報とを、クラスタ情報データベース 14力も読み出す。そして、楽曲抽出部 23は、読み出したクラスタ情報を類似度算出部 27に供給する。類似度算出部 27は、元楽曲と元楽曲以外の全ての楽曲とのクラスタ情報で示される各クラスタの帰属重みから、元楽曲と、元楽曲以外の全ての楽曲のそれぞれとの類似度を計算する。

[0157] より具体的には、例えば、楽曲クラスタリング部 202により、各楽曲が、それぞれの階層内において、ソフトクラスタリングされ、各クラスタの帰属重みを示すクラスタ情報力 Sクラスタ情報データベース 14に格納されて、る。

[0158] 図 23は、クラスタの帰属重みを示すクラスタ情報の例を示す図である。 [0159] 例えば、第 1階層におけるクラスタである、 CL11であるクラスタ IDで特定されるクラスタ、 CL12であるクラスタ IDで特定されるクラスタ、 CL 13であるクラスタ IDで特定されるクラスタ、および CL14であるクラスタ IDで特定されるクラスタへの、 ABC123である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 1. 0、 0. 0、および 0. 2 である。第 2階層におけるクラスタである、 CL21であるクラスタ IDで特定されるクラスタ、 CL22であるクラスタ IDで特定されるクラスタ、 CL23であるクラスタ IDで特定されるクラスタ、および CL24であるクラスタ IDで特定されるクラスタへの、 ABC123である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 6、 0. 8、 0. 0、および 0. 0 である。

[0160] また、第 3階層におけるクラスタである、 CL31であるクラスタ IDで特定されるクラスタ、 CL32であるクラスタ IDで特定されるクラスタ、および CL33であるクラスタ IDで特定されるクラスタへの、 ABC123である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 0. 0、および 1. 0である。さらに、第 4階層におけるクラスタである、 CL41 であるクラスタ IDで特定されるクラスタ、 CL42であるクラスタ IDで特定されるクラスタ、 CL43であるクラスタ IDで特定されるクラスタ、および CL44であるクラスタ IDで特定されるクラスタへの、 ABC123である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 1. 0、 0. 0、 0. 0、および 0. 0である。

[0161] 例えば、第 1階層におけるクラスタである、 CL11であるクラスタ IDで特定されるクラスタ、 CL12であるクラスタ IDで特定されるクラスタ、 CL 13であるクラスタ IDで特定されるクラスタ、および CL14であるクラスタ IDで特定されるクラスタへの、 CTH863である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 1. 0, 0. 0、 0. 0、および 0. 0 である。第 2階層におけるクラスタである、 CL21であるクラスタ IDで特定されるクラスタ、 CL22であるクラスタ IDで特定されるクラスタ、 CL23であるクラスタ IDで特定されるクラスタ、および CL24であるクラスタ IDで特定されるクラスタへの、 CTH863である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 0. 7、 0. 7、および 0. 0 である。

[0162] また、第 3階層におけるクラスタである、 CL31であるクラスタ IDで特定されるクラスタ、 CL32であるクラスタ IDで特定されるクラスタ、および CL33であるクラスタ IDで特定されるクラスタへの、 CTH863である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 9、 0. 4、および 0. 0である。さら〖こ、第 4階層〖こおけるクラスタである、 CL41 であるクラスタ IDで特定されるクラスタ、 CL42であるクラスタ IDで特定されるクラスタ、 CL43であるクラスタ IDで特定されるクラスタ、および CL44であるクラスタ IDで特定されるクラスタへの、 CTH863である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 1. 0、 0. 3、および 0. 0である。

[0163] 例えば、第 1階層におけるクラスタである、 CL11であるクラスタ IDで特定されるクラスタ、 CL12であるクラスタ IDで特定されるクラスタ、 CL 13であるクラスタ IDで特定されるクラスタ、および CL14であるクラスタ IDで特定されるクラスタへの、 XYZ567である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 0. 6、 0. 8、および 0. 0 である。第 2階層におけるクラスタである、 CL21であるクラスタ IDで特定されるクラスタ、 CL22であるクラスタ IDで特定されるクラスタ、 CL23であるクラスタ IDで特定されるクラスタ、および CL24であるクラスタ IDで特定されるクラスタへの、 XYZ567である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 0. 0、 0. 0、および 1. 0 である。

[0164] また、第 3階層におけるクラスタである、 CL31であるクラスタ IDで特定されるクラスタ、 CL32であるクラスタ IDで特定されるクラスタ、および CL33であるクラスタ IDで特定されるクラスタへの、 XYZ567である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 1. 0、 0. 0、および 0. 1である。さら〖こ、第 4階層〖こおけるクラスタである、 CL41 であるクラスタ IDで特定されるクラスタ、 CL42であるクラスタ IDで特定されるクラスタ、 CL43であるクラスタ IDで特定されるクラスタ、および CL44であるクラスタ IDで特定されるクラスタへの、 XYZ567である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 5、 0. 0、 0. 0、および 0. 9である。

[0165] 例えば、第 1階層におけるクラスタである、 CL11であるクラスタ IDで特定されるクラスタ、 CL12であるクラスタ IDで特定されるクラスタ、 CL 13であるクラスタ IDで特定されるクラスタ、および CL14であるクラスタ IDで特定されるクラスタへの、 EKF534である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 9、 0. 0、 0. 0、および 0. 5 である。第 2階層におけるクラスタである、 CL21であるクラスタ IDで特定されるクラスタ、 CL22であるクラスタ IDで特定されるクラスタ、 CL23であるクラスタ IDで特定されるクラスタ、および CL24であるクラスタ IDで特定されるクラスタへの、 EKF534である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 0. 6、 0. 0、および 0. 8 である。

[0166] また、第 3階層におけるクラスタである、 CL31であるクラスタ IDで特定されるクラスタ、 CL32であるクラスタ IDで特定されるクラスタ、および CL33であるクラスタ IDで特定されるクラスタへの、 EKF534である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 7、 0. 0、および 0. 7である。さら〖こ、第 4階層〖こおけるクラスタである、 CL41 であるクラスタ IDで特定されるクラスタ、 CL42であるクラスタ IDで特定されるクラスタ、 CL43であるクラスタ IDで特定されるクラスタ、および CL44であるクラスタ IDで特定されるクラスタへの、 EKF534である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 0. 9、 0. 4、および 0. 3である。

[0167] 例えば、第 1階層におけるクラスタである、 CL11であるクラスタ IDで特定されるクラスタ、 CL12であるクラスタ IDで特定されるクラスタ、 CL 13であるクラスタ IDで特定されるクラスタ、および CL14であるクラスタ IDで特定されるクラスタへの、 OPQ385である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 7、 0. 2、 0. 6、および 0. 0 である。第 2階層におけるクラスタである、 CL21であるクラスタ IDで特定されるクラスタ、 CL22であるクラスタ IDで特定されるクラスタ、 CL23であるクラスタ IDで特定されるクラスタ、および CL24であるクラスタ IDで特定されるクラスタへの、 OPQ385である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 1. 0, 0. 0、 0. 0、および 0. 0 である。

[0168] また、第 3階層におけるクラスタである、 CL31であるクラスタ IDで特定されるクラスタ、 CL32であるクラスタ IDで特定されるクラスタ、および CL33であるクラスタ IDで特定されるクラスタへの、 OPQ385である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 1. 0、および 0. 0である。さら〖こ、第 4階層〖こおけるクラスタである、 CL41 であるクラスタ IDで特定されるクラスタ、 CL42であるクラスタ IDで特定されるクラスタ、 CL43であるクラスタ IDで特定されるクラスタ、および CL44であるクラスタ IDで特定されるクラスタへの、 OPQ385である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 4、 0. 9、 0. 0、および 0. 0である。

[0169] 例えば、類似度算出部 27は、 iである楽曲 IDで特定される元楽曲と jである楽曲 ID で特定される楽曲との類似度 sim (i,j)を、それぞれの楽曲のクラスタへの帰属重みから、式（1)で示される演算で計算する。

[0170] [数 1]

s i m ( i , j ) = ∑ ∑ w_{i l c}w _{i l c} … ( 1 )

l eL ceC ( l )

[0171] 式（1)において、 Lは、階層の数を示す値であり、 1は、階層を特定する値である。 C(l )は、クラスタの全体を示し、 cは、クラスタを特定する値である。 w は、 iである楽曲 ID

ilc

で特定される元楽曲の、第 1層の第 cクラスタの帰属重みを示す。 w は、 jである楽曲 I Dで特定される楽曲の、第 1層の第 cクラスタの帰属重みを示す。

[0172] 図 24は、クラスタの帰属重みを示す図 23のクラスタ情報から、式（1)で示される演算により計算された類似度の例を示す図である。なお、図 24において、 ABC123である楽曲 IDで特定される元楽曲に対する、 CTH863乃至 OPQ385のそれぞれの楽曲 ID で特定される楽曲のそれぞれにつ、ての類似度が示されて、る。

[0173] 図 24で示されるように、図 23のクラスタ情報を基に、 ABC123である楽曲 IDで特定される元楽曲に対して、 CTH863乃至 OPQ385のそれぞれの楽曲 IDで特定される楽曲のそれぞれの類似度を式（1)で示される演算で計算すると、 CTH863乃至 OPQ385 のそれぞれの楽曲 IDで特定される楽曲のそれぞれの類似度は、 0. 57、 1. 18、 1. 27、 1. 20となる。

[0174] 例えば、ステップ S222において、類似度算出部 27は、式（1)で示される演算により、それぞれ、 0. 57、 1. 18、 1. 27、 1. 20である、 ABC123である楽曲 IDで特定される元楽曲に対する、 CTH863乃至 OPQ385のそれぞれの楽曲 IDで特定される楽曲のそれぞれの類似度を計算する。

[0175] ステップ S223において、類似度算出部 27は、類似度を基に、元楽曲に類似している順に、元楽曲以外の全ての楽曲をソートする。

[0176] より具体的には、類似度算出部 27は、計算の結果得られた楽曲の類似度と、楽曲の楽曲 IDとを対応付けて、類似度を基に、元楽曲に類似している順に楽曲の楽曲 I Dを並び替えることにより、元楽曲に類似している順に、元楽曲以外の全ての楽曲をソートする。

[0177] ステップ S224において、類似度算出部 27は、ソートされた楽曲のうち、任意の数の上位の楽曲を選択する。類似度算出部 27は、選択した楽曲の楽曲 IDを選択理由生成部 28に供給する。

[0178] 例えば、ステップ S224において、類似度算出部 27は、最上位の楽曲を選択して、最上位の楽曲の楽曲 IDを選択理由生成部 28に供給する。または、例えば、ステップ S224において、類似度算出部 27は、上位 10曲の楽曲を選択して、上位 10曲の楽曲の楽曲 IDを選択理由生成部 28に供給する。

[0179] ステップ S225において、選択理由生成部 28は、類似度算出部 27によって選択された楽曲が選択された理由を示す選択理由文を生成して、選択された楽曲の楽曲 I Dとともに楽曲提示部 29に出力する。ステップ S226において、楽曲提示部 29は、選択理由生成部 28から入力される楽曲 IDの楽曲と選択理由文とをユーザに提示して、処理は終了する。

[0180] 次に、図 25のフローチャートを参照して、第 5の類似楽曲検索処理を説明する。ステツプ S241乃至ステップ S 251のそれぞれは、図 11のステップ S 1乃至ステップ S 11 のそれぞれと同様なので、その説明は省略する。

[0181] ステップ S252において、類似度算出部 27は、楽曲抽出部 23から供給された、集合 Cの要素 (楽曲 ID)を基に、各クラスタの帰属重みから、元楽曲と、集合 Cの楽曲のそれぞれとの類似度を計算する。例えば、ステップ S252において、類似度算出部 2 7は、式（1)で示される演算により、元楽曲と集合 Cの楽曲のそれぞれとの類似度を計算する。

[0182] ステップ S253において、類似度算出部 27は、類似度を基に、元楽曲に類似している順に、集合 Cの楽曲をソートする。

[0183] より具体的には、類似度算出部 27は、計算の結果得られた類似度と、集合 Cの楽曲の楽曲 IDとを対応付けて、類似度を基に、集合 Cの楽曲の楽曲 IDを並び替えることにより、元楽曲に類似している順に、集合 Cの楽曲をソートする。

[0184] ステップ S224において、類似度算出部 27は、ソートされた楽曲のうち、任意の数の上位の楽曲を選択する。類似度算出部 27は、選択した楽曲の楽曲 IDを選択理由生成部 28に供給する。

[0185] 例えば、ステップ S224において、類似度算出部 27は、最上位の楽曲を選択して、最上位の楽曲の楽曲 IDを選択理由生成部 28に供給する。または、例えば、ステップ S224において、類似度算出部 27は、上位 10曲の楽曲を選択して、上位 10曲の楽曲の楽曲 IDを選択理由生成部 28に供給する。

[0186] ステップ S225において、選択理由生成部 28は、類似度算出部 27によって選択された楽曲が選択された理由を示す選択理由文を生成して、選択された楽曲の楽曲 I Dとともに楽曲提示部 29に出力する。ステップ S226において、楽曲提示部 29は、選択理由生成部 28から入力される楽曲 IDの楽曲と選択理由文とをユーザに提示して、処理は終了する。

[0187] 次に、図 26のフローチャートを参照して、第 3の楽曲推薦処理を説明する。ステップ S261乃至ステップ S270のそれぞれは、図 14のステップ S91乃至ステップ S100のそれぞれと同様なので、その説明は省略する。

[0188] ステップ S271において、類似度算出部 27は、楽曲抽出部 23から供給された、集合 Cの要素（楽曲 ID)を基に、各クラスタの帰属重みを示すユーザの嗜好値と、集合 Cの楽曲のそれぞれのクラスタ情報であって、各クラスタの帰属重みを示すクラスタ情報との類似度を計算する。

[0189] ここで、図 27乃至図 31を参照して、ユーザの嗜好値と、集合 Cの楽曲のそれぞれのクラスタ情報との類似度を説明する。

[0190] 例えば、嗜好情報データベース 24は、ソフトクラスタリングされ、それぞれの階層内にお、て、各クラスタの帰属重みを示す嗜好値を記録して、る。

[0191] 図 27は、各クラスタの帰属重みを示す嗜好値の例を示す図である。

[0192] 例えば、第 1階層におけるクラスタである、 CL11であるクラスタ IDで特定されるクラスタ、 CL12であるクラスタ IDで特定されるクラスタ、 CL 13であるクラスタ IDで特定されるクラスタ、および CL14であるクラスタ IDで特定されるクラスタへの、 U001であるュ一ザ IDで特定されるユーザの嗜好値の帰属重みは、それぞれ、 0. 0、 0. 8、 0. 0、および 0. 6である。第 2階層におけるクラスタである、 CL21であるクラスタ IDで特定されるクラスタ、 CL22であるクラスタ IDで特定されるクラスタ、 CL23であるクラスタ IDで特定されるクラスタ、および CL24であるクラスタ IDで特定されるクラスタへの、 U001 であるユーザ IDで特定されるユーザの嗜好値の帰属重みは、それぞれ、 0. 4、 0. 6 、 0. 7、および 0. 0である。

[0193] また、第 3階層におけるクラスタである、 CL31であるクラスタ IDで特定されるクラスタ、 CL32であるクラスタ IDで特定されるクラスタ、および CL33であるクラスタ IDで特定されるクラスタへの、 U001であるユーザ IDで特定されるユーザの嗜好値の帰属重みは、それぞれ、 0. 7、 0. 5、および 0. 5である。さらに、第 4階層におけるクラスタである、 CL41であるクラスタ IDで特定されるクラスタ、 CL42であるクラスタ IDで特定されるクラスタ、 CL43であるクラスタ IDで特定されるクラスタ、および CL44であるクラスタ I Dで特定されるクラスタへの、 U001であるユーザ IDで特定されるユーザの嗜好値の帰属重みは、それぞれ、 0. 0、 0. 5、 0. 4、および 0. 0である。

[0194] 図 28は、各クラスタの帰属重みを示すクラスタ情報の例を示す図である。

[0195] 例えば、第 1階層におけるクラスタである、 CL11であるクラスタ IDで特定されるクラスタ、 CL12であるクラスタ IDで特定されるクラスタ、 CL 13であるクラスタ IDで特定されるクラスタ、および CL14であるクラスタ IDで特定されるクラスタへの、 ABC123である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 1. 0、 0. 0、および 0. 2 である。第 2階層におけるクラスタである、 CL21であるクラスタ IDで特定されるクラスタ、 CL22であるクラスタ IDで特定されるクラスタ、 CL23であるクラスタ IDで特定されるクラスタ、および CL24であるクラスタ IDで特定されるクラスタへの、 ABC123である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 6、 0. 8、 0. 0、および 0. 0 である。

[0196] また、第 3階層におけるクラスタである、 CL31であるクラスタ IDで特定されるクラスタ、 CL32であるクラスタ IDで特定されるクラスタ、および CL33であるクラスタ IDで特定されるクラスタへの、 ABC123である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 0. 0、および 1. 0である。さらに、第 4階層におけるクラスタである、 CL41 であるクラスタ IDで特定されるクラスタ、 CL42であるクラスタ IDで特定されるクラスタ、 CL43であるクラスタ IDで特定されるクラスタ、および CL44であるクラスタ IDで特定されるクラスタへの、 ABC123である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 1. 0、 0. 0、 0. 0、および 0. 0である。

[0197] 例えば、第 1階層におけるクラスタである、 CL11であるクラスタ IDで特定されるクラスタ、 CL12であるクラスタ IDで特定されるクラスタ、 CL 13であるクラスタ IDで特定されるクラスタ、および CL14であるクラスタ IDで特定されるクラスタへの、 CTH863である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 1. 0, 0. 0、 0. 0、および 0. 0 である。第 2階層におけるクラスタである、 CL21であるクラスタ IDで特定されるクラスタ、 CL22であるクラスタ IDで特定されるクラスタ、 CL23であるクラスタ IDで特定されるクラスタ、および CL24であるクラスタ IDで特定されるクラスタへの、 CTH863である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 0. 7、 0. 7、および 0. 0 である。

[0198] また、第 3階層におけるクラスタである、 CL31であるクラスタ IDで特定されるクラスタ、 CL32であるクラスタ IDで特定されるクラスタ、および CL33であるクラスタ IDで特定されるクラスタへの、 CTH863である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 9、 0. 4、および 0. 0である。さら〖こ、第 4階層〖こおけるクラスタである、 CL41 であるクラスタ IDで特定されるクラスタ、 CL42であるクラスタ IDで特定されるクラスタ、 CL43であるクラスタ IDで特定されるクラスタ、および CL44であるクラスタ IDで特定されるクラスタへの、 CTH863である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 1. 1、 0. 3、および 0. 0である。

[0199] 例えば、第 1階層におけるクラスタである、 CL11であるクラスタ IDで特定されるクラスタ、 CL12であるクラスタ IDで特定されるクラスタ、 CL 13であるクラスタ IDで特定されるクラスタ、および CL14であるクラスタ IDで特定されるクラスタへの、 XYZ567である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 0. 6、 0. 8、および 0. 0 である。第 2階層におけるクラスタである、 CL21であるクラスタ IDで特定されるクラスタ、 CL22であるクラスタ IDで特定されるクラスタ、 CL23であるクラスタ IDで特定されるクラスタ、および CL24であるクラスタ IDで特定されるクラスタへの、 XYZ567である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 0、 0. 0、 0. 0、および 1. 0 である。 [0200] また、第 3階層におけるクラスタである、 CL31であるクラスタ IDで特定されるクラスタ、 CL32であるクラスタ IDで特定されるクラスタ、および CL33であるクラスタ IDで特定されるクラスタへの、 XYZ567である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 1. 0、 0. 0、および 0. 1である。さら〖こ、第 4階層〖こおけるクラスタである、 CL41 であるクラスタ IDで特定されるクラスタ、 CL42であるクラスタ IDで特定されるクラスタ、 CL43であるクラスタ IDで特定されるクラスタ、および CL44であるクラスタ IDで特定されるクラスタへの、 XYZ567である楽曲 IDで特定される楽曲の帰属重みは、それぞれ、 0. 4、 0. 0、 0. 0、および 0. 7である。

[0201] 例えば、類似度算出部 27は、ユーザの嗜好値におけるクラスタへの帰属重みと、 i である楽曲 IDで特定される楽曲のクラスタ情報におけるクラスタへの帰属重みとから、式 (2)で示される演算で類似度 sim (u,i)を計算する。

[0202] [数 2] s i m ( u, i ) = ∑ L h_u| _cw_{M c} … ( 2 )

l eL ceC ( l )

[0203] 式（2)において、 Lは、階層の数を示す値であり、 1は、階層を特定する値である。 C(l )は、クラスタの全体を示し、 cは、クラスタを特定する値である。 w は、 iである楽曲 ID

ilc

で特定される楽曲のクラスタ情報の、第 1層の第 cクラスタの帰属重みを示す。 h は、ユーザ uの嗜好値の第 1層の第 cクラスタの帰属重みを示す。

[0204] 図 29は、図 27のクラスタの帰属重みを示す嗜好値と、図 28のクラスタの帰属重みを示すクラスタ情報とから、式 (2)で示される演算により計算された類似度の例を示す図である。

[0205] U001であるユーザ IDで特定されるユーザの嗜好値の帰属重みのうちの、第 1層の帰属重みと、 ABC123である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みのうちの、第 1層の帰属重みとが、対応する帰属重み同士で乗算され、乗算された結果が積算されると、図 29の ABC123である楽曲 IDに対する第 1層に配置した値である 0 . 91が求められる。同様に、第 2層、第 3層、および第 4層について、 U001であるユーザ IDで特定されるユーザの嗜好値の帰属重みと、 ABC123である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みとが、対応する帰属重み同士で乗算され、乗算された結果が積算されると、図 29の ABC123である楽曲 IDに対する第 2層、第 3層、および第 4層のそれぞれに配置した値である 0. 67、 0. 53、 0. 00が求められる。

[0206] 最終的に、 U001であるユーザ IDで特定されるユーザの嗜好値と ABC123である楽曲 IDで特定される楽曲のクラスタ情報との類似度は、第 1層、第 2層、第 3層、および第 4層のそれぞれ【こつ!ヽて求められた 0. 91、 0. 67、 0. 53、および 0. 00をカロ算した値である 2. 11とされる。

[0207] U001であるユーザ IDで特定されるユーザの嗜好値の帰属重みのうちの、第 1層の帰属重みと、 CTH863である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みのうちの、第 1層の帰属重みとが、対応する帰属重み同士で乗算され、乗算された結果が積算されると、図 29の CTH863である楽曲 IDに対する第 1層に配置した値である 0 . 00が求められる。同様に、第 2層、第 3層、および第 4層について、 U001であるユーザ IDで特定されるユーザの嗜好値の帰属重みと、 CTH863である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みとが、対応する帰属重み同士で乗算され、乗算された結果が積算されると、図 29の CTH863である楽曲 IDに対する第 2層、第 3層、および第 4層のそれぞれに配置した値である 0. 92、 0. 82、 0. 63が求められる。

[0208] 最終的に、 U001であるユーザ IDで特定されるユーザの嗜好値と CTH863である楽曲 IDで特定される楽曲のクラスタ情報との類似度は、第 1層、第 2層、第 3層、および第 4層のそれぞれ【こつ!ヽて求められた 0. 00、 0. 92、 0. 82、および 0. 63をカロ算した値である 2. 37とされる。

[0209] U001であるユーザ IDで特定されるユーザの嗜好値の帰属重みのうちの、第 1層の帰属重みと、 XYZ567である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みのうちの、第 1層の帰属重みとが、対応する帰属重み同士で乗算され、乗算された結果が積算されると、図 29の XYZ567である楽曲 IDに対する第 1層に配置した値である 0 . 44が求められる。同様に、第 2層、第 3層、および第 4層について、 U001であるユーザ IDで特定されるユーザの嗜好値の帰属重みと、 XYZ567である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みとが、対応する帰属重み同士で乗算され、乗算された結果が積算されると、図 29の XYZ567である楽曲 IDに対する第 2層、第 3層、および第 4層のそれぞれに配置した値である 0. 00、 0. 72、 0. 00が求められる。 [0210] 最終的に、 U001であるユーザ IDで特定されるユーザの嗜好値と XYZ567である楽曲 IDで特定される楽曲のクラスタ情報との類似度は、第 1層、第 2層、第 3層、および第 4層のそれぞれ【こつ!ヽて求められた 0. 44、 0. 00、 0. 72、および 0. 00をカロ算した値である 1. 15とされる。

[0211] また、各階層における、ユーザの嗜好値の帰属重みの分布に基づいた重みを用いて類似度を計算するようにしてもょヽ。

[0212] 例えば、類似度算出部 27は、ユーザの嗜好値におけるクラスタへの帰属重みと、 i である楽曲 IDで特定される楽曲のクラスタ情報におけるクラスタへの帰属重みとから、式 (3)で示される演算で類似度 sim (u,i)を計算する。

[0213] [数 3] s i m ( u, i ) = ∑ ∑ b_u| h_u |_cw_{M c} … ( 3 )

l eL ceC ( l )

[0214] 式（3)において、 Lは、階層の数を示す値であり、 1は、階層を特定する値である。 C(l )は、クラスタの全体を示し、 cは、クラスタを特定する値である。 w は、 iである楽曲 ID

ilc

で特定される楽曲のクラスタ情報の、第 1層の第 cクラスタの帰属重みを示す。 h は、ユーザ uの嗜好値の第 1層の第 cクラスタの帰属重みを示す。 bは、ユーザ uの嗜好値

ul

の第 1層につ、ての重みを示す。

[0215] 図 30は、ユーザの嗜好値のそれぞれの階層の帰属重みの分散である、階層毎の重みの例を示す図である。図 30に示す例において、 U001であるユーザ IDで特定されるユーザのについての第 1層の重み、第 2層の重み、第 3層の重み、および第 4層の重みは、それぞれ、 0. 17、 0. 10、 0. 01、および 0. 06である。

[0216] 図 31は、図 27のクラスタの帰属重みを示す嗜好値と、図 28のクラスタの帰属重みを示すクラスタ情報と、図 30の階層毎の重みとから、式 (3)で示される演算により計算された類似度の例を示す図である。なお、図 30に示す類似度は、式 (3)で示される演算により計算された結果を 10倍したものである。

[0217] U001であるユーザ IDで特定されるユーザの嗜好値の第 1層の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 ABC123である楽曲 IDで特定される楽曲のクラスタ情報の第 1層の帰属重みと、第 1の層の重みとが乗算され、乗算された結果が積算されると、図 31の ABC123である楽曲 IDに対する第 1層に配置した値である 1. 27が求められる。同様に、第 2層、第 3層、および第 4層について、 U001であるユーザ ID で特定されるユーザの嗜好値の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 ABC123である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みと、第 2層、第 3層、または第 4層のうちのその層の重みとが乗算され、乗算された結果が積算されると、図 31の ABC123である楽曲 IDに対する第 2層、第 3層、および第 4層のそれぞれに酉己置した値である 0. 49、 0. 03、 0. 00力 S求められる。

[0218] 最終的に、 U001であるユーザ IDで特定されるユーザの嗜好値と ABC123である楽曲 IDで特定される楽曲のクラスタ情報との類似度は、第 1層、第 2層、第 3層、および第 4層のそれぞれ【こつ!ヽて求められた 1. 27、 0. 49、 0. 03、および 0. 00をカロ算した値である 1. 79とされる。

[0219] U001であるユーザ IDで特定されるユーザの嗜好値の第 1層の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 CTH863である楽曲 IDで特定される楽曲のクラスタ情報の第 1層の帰属重みと、第 1の層の重みとが乗算され、乗算された結果が積算されると、図 31の CTH863である楽曲 IDに対する第 1層に配置した値である 0. 00が求められる。同様に、第 2層、第 3層、および第 4層について、 U001であるユーザ ID で特定されるユーザの嗜好値の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 CTH863である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みと、第 2層、第 3層、または第 4層のうちのその層の重みとが乗算され、乗算された結果が積算されると、図 31の CTH863である楽曲 IDに対する第 2層、第 3層、および第 4層のそれぞれに酉己置した値である 0. 65、 0. 04、 0. 27力 S求められる。

[0220] 最終的に、 U001であるユーザ IDで特定されるユーザの嗜好値と CTH863である楽曲 IDで特定される楽曲のクラスタ情報との類似度は、第 1層、第 2層、第 3層、および第 4層のそれぞれ【こつ!ヽて求められた 0. 00、 0. 65、 0. 04、および 0. 27をカロ算した値である 0. 96とされる。

[0221] U001であるユーザ IDで特定されるユーザの嗜好値の第 1層の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 XYZ567である楽曲 IDで特定される楽曲のクラスタ情報の第 1層の帰属重みと、第 1の層の重みとが乗算され、乗算された結果が積算されると、図 31の XYZ567である楽曲 IDに対する第 1層に配置した値である 0. 53が求められる。同様に、第 2層、第 3層、および第 4層について、 U001であるユーザ ID で特定されるユーザの嗜好値の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 XYZ567である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みと、第 2層、第 3層、または第 4層のうちのその層の重みとが乗算され、乗算された結果が積算されると、図 31の XYZ567である楽曲 IDに対する第 2層、第 3層、および第 4層のそれぞれに酉己置した値である 0. 00、 0. 04、 0. 00力 S求められる。

[0222] 最終的に、 U001であるユーザ IDで特定されるユーザの嗜好値と XYZ567である楽曲 IDで特定される楽曲のクラスタ情報との類似度は、第 1層、第 2層、第 3層、および第 4層のそれぞれ【こつ!ヽて求められた 0. 53、 0. 00、 0. 04、および 0. 00をカロ算した値である 0. 57とされる。

[0223] 図 27で示される嗜好値に注目すると、 U001であるユーザ IDで特定されるユーザの嗜好値の帰属重みの値は、第 2層乃至第 4層に比較して、第 1層において大きく変化しているので、第 2層乃至第 4層に比較して、第 1層の各要素の値が、 U001であるュ一ザ IDで特定されるユーザの嗜好により関係すると予測される。

[0224] このように、重み付けすることによって、ユーザの嗜好にあまり関係しないと予測される値に比較して、ユーザの嗜好により関係すると予測される値によって、その値がより大きく変化する類似度を求めることができるので、より正確に、ユーザの好む楽曲を検出することができる。

[0225] 図 26に戻り、ステップ S272において、類似度算出部 27は、類似度を基に、ユーザの嗜好に類似している順に、集合 Cの楽曲をソートする。

[0226] より具体的には、類似度算出部 27は、計算の結果得られた類似度と、集合 Cの楽曲の楽曲 IDとを対応付けて、類似度を基に、集合 Cの楽曲の楽曲 IDを並び替えることにより、ユーザの嗜好に類似している順に、集合 Cの楽曲をソートする。

[0227] ステップ S273において、類似度算出部 27は、ソートされた楽曲のうち、任意の数の上位の楽曲を選択する。類似度算出部 27は、選択した楽曲の楽曲 IDを選択理由生成部 28に供給する。

[0228] 例えば、式（2)で示される演算により類似度が計算され、 ABC123である楽曲 IDで特定される楽曲についての類似度が 2. 11とされ、 CTH863である楽曲 IDで特定される楽曲についての類似度が 2. 37とされ、 XYZ567である楽曲 IDで特定される楽曲についての類似度が 1. 15とされた場合、 1つの楽曲を選択するとき、類似度が最大である、 CTH863である楽曲 IDで特定される楽曲が選択されることになる。

[0229] また、例えば、式（3)で示される演算により、各階層における、ユーザの嗜好値の帰属重みの分布に基づいた重みを用いて類似度が計算され、 ABC123である楽曲 ID で特定される楽曲についての類似度が 1. 79とされ、 CTH863である楽曲 IDで特定される楽曲についての類似度が 0. 96とされ、 XYZ567である楽曲 IDで特定される楽曲についての類似度が 0. 57とされた場合、 1つの楽曲を選択するとき、類似度が最大である、 ABC123である楽曲 IDで特定される楽曲が選択されることになる。

[0230] ステップ S274において、選択理由生成部 28は、類似度算出部 27によって選択された楽曲が選択された理由を示す選択理由文を生成して、選択された楽曲の楽曲 I Dとともに楽曲提示部 29に出力する。ステップ S275において、楽曲提示部 29は、選択理由生成部 28から入力される楽曲 IDの楽曲と選択理由文とをユーザに提示して、処理は終了する。

[0231] 次に、図 32のフローチャートを参照して、第 4の楽曲推薦処理を説明する。ステップ S281乃至ステップ S284のそれぞれは、図 15のステップ S121乃至ステップ S124 のそれぞれと同様なので、その説明は省略する。

[0232] ステップ S285において、楽曲抽出部 23は、特定した各クラスタにそれぞれ対応する嗜好値と第 i層の重みに基づき評価値を決定する。

[0233] 図 33は、図 27で示される嗜好値の帰属重みのうち、 0. 6である閾値以上の帰属重み力もなる嗜好値の例を示す図である。

[0234] すなわち、図 27で示される嗜好値の帰属重みのうち、 0. 6未満である帰属重みが 0. 0に置き換えられることにより、図 33で示される嗜好値が求められる。

[0235] 例えば、第 1階層におけるクラスタである、 CL11であるクラスタ IDで特定されるクラスタ、 CL12であるクラスタ IDで特定されるクラスタ、 CL 13であるクラスタ IDで特定されるクラスタ、および CL14であるクラスタ IDで特定されるクラスタへの、 U001であるュ一ザ IDで特定されるユーザの嗜好値の帰属重みは、それぞれ、 0. 0、 0. 8、 0. 0、および 0. 6である。第 2階層におけるクラスタである、 CL21であるクラスタ IDで特定されるクラスタ、 CL22であるクラスタ IDで特定されるクラスタ、 CL23であるクラスタ IDで特定されるクラスタ、および CL24であるクラスタ IDで特定されるクラスタへの、 U001 であるユーザ IDで特定されるユーザの嗜好値の帰属重みは、それぞれ、 0. 0、 0. 6 、 0. 7、および 0. 0である。

[0236] また、第 3階層におけるクラスタである、 CL31であるクラスタ IDで特定されるクラスタ、 CL32であるクラスタ IDで特定されるクラスタ、および CL33であるクラスタ IDで特定されるクラスタへの、 U001であるユーザ IDで特定されるユーザの嗜好値の帰属重みは、それぞれ、 0. 7、 0. 0、および 0. 0である。さらに、第 4階層におけるクラスタである、 CL41であるクラスタ IDで特定されるクラスタ、 CL42であるクラスタ IDで特定されるクラスタ、 CL43であるクラスタ IDで特定されるクラスタ、および CL44であるクラスタ I Dで特定されるクラスタへの、 U001であるユーザ IDで特定されるユーザの嗜好値の帰属重みは、それぞれ、 0. 0、 0. 0、 0. 0、および 0. 0である。

[0237] 例えば、ステップ S285において、楽曲抽出部 23は、閾値以上の帰属重み力もなる嗜好値におけるクラスタへの帰属重みと、 iである楽曲 IDで特定される楽曲のクラスタ情報におけるクラスタへの帰属重みとから、式 (3)で示される演算で類似度を計算する。すなわち、元の嗜好値の帰属重みのうち、例えば 0. 6である閾値未満の帰属重みと乗算されて求められる値は、類似度に加算されず、元の嗜好値の帰属重みのうち、閾値以上である帰属重みと乗算されて求められる値は、類似度に加算されることになる。

[0238] 図 34は、図 33の閾値以上の帰属重みからなる嗜好値と、図 28のクラスタの帰属重みを示すクラスタ情報と、図 30の階層毎の重みとから、式（3)で示される演算により計算された類似度の例を示す図である。

[0239] U001であるユーザ IDで特定されるユーザの嗜好値であって、閾値以上の帰属重み力なる嗜好値の第 1層の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 ABC123である楽曲 IDで特定される楽曲のクラスタ情報の第 1層の帰属重みと、第 1 の層の重みとが乗算され、乗算された結果が積算されると、図 34の ABC123である楽曲 IDに対する第 1層に配置した値である 0. 15が求められる。同様に、第 2層、第 3層、および第 4層について、 U001であるユーザ IDで特定されるユーザの嗜好値であつて、閾値以上の帰属重みからなる嗜好値の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 ABC123である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みと、第 2層、第 3層、または第 4層のうちのその層の重みとが乗算され、乗算された結果が積算されると、図 34の ABC123である楽曲 IDに対する第 2層、第 3層、および第 4 層のそれぞれに酉己置した値である 0. 05、 0. 00、 0. 00力 S求められる。

[0240] 最終的に、 U001であるユーザ IDで特定されるユーザの嗜好値と ABC123である楽曲 IDで特定される楽曲のクラスタ情報との類似度は、第 1層、第 2層、第 3層、および第 4層のそれぞれ【こつ!ヽて求められた 0. 15、 0. 05、 0. 00、および 0. 00をカロ算した値である 0. 20とされる。

[0241] U001であるユーザ IDで特定されるユーザの嗜好値であって、閾値以上の帰属重み力なる嗜好値の第 1層の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 CTH863である楽曲 IDで特定される楽曲のクラスタ情報の第 1層の帰属重みと、第 1 の層の重みとが乗算され、乗算された結果が積算されると、図 34の CTH863である楽曲 IDに対する第 1層に配置した値である 0. 00が求められる。同様に、第 2層、第 3層、および第 4層について、 U001であるユーザ IDで特定されるユーザの嗜好値であつて、閾値以上の帰属重みからなる嗜好値の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 CTH863である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みと、第 2層、第 3層、または第 4層のうちのその層の重みとが乗算され、乗算された結果が積算されると、図 34の CTH863である楽曲 IDに対する第 2層、第 3層、および第 4 層のそれぞれに配置した値である 0. 10、 0. 00、 0. 00が求められる。

[0242] 最終的に、 U001であるユーザ IDで特定されるユーザの嗜好値と CTH863である楽曲 IDで特定される楽曲のクラスタ情報との類似度は、第 1層、第 2層、第 3層、および第 4層のそれぞれ【こつ!ヽて求められた 0. 00、 0. 10、 0. 00、および 0. 00をカロ算した値である 0. 10とされる。

[0243] U001であるユーザ IDで特定されるユーザの嗜好値であって、閾値以上の帰属重み力なる嗜好値の第 1層の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 XYZ567である楽曲 IDで特定される楽曲のクラスタ情報の第 1層の帰属重みと、第 1 の層の重みとが乗算され、乗算された結果が積算されると、図 34の XYZ567である楽曲 IDに対する第 1層に配置した値である 0. 07が求められる。同様に、第 2層、第 3層、および第 4層について、 U001であるユーザ IDで特定されるユーザの嗜好値であつて、閾値以上の帰属重みからなる嗜好値の帰属重みと、ユーザの嗜好値の帰属重みに対応する、 XYZ567である楽曲 IDで特定される楽曲のクラスタ情報の帰属重みと、第 2層、第 3層、または第 4層のうちのその層の重みとが乗算され、乗算された結果が積算されると、図 34の XYZ567である楽曲 IDに対する第 2層、第 3層、および第 4層のそれぞれに酉己置した値である 0. 00、 0. 00、 0. 00力 S求められる。

[0244] 最終的に、 U001であるユーザ IDで特定されるユーザの嗜好値と XYZ567である楽曲 IDで特定される楽曲のクラスタ情報との類似度は、第 1層、第 2層、第 3層、および第 4層のそれぞれ【こつ!ヽて求められた 0. 07、 0. 00、 0. 00、および 0. 00をカロ算した値である 0. 08とされる。

[0245] ステップ S286乃至ステップ S292のそれぞれは、図 15のステップ S 126乃至ステツプ S132のそれぞれと同様なので、その説明は省略する。

[0246] なお、それぞれの階層に属する帰属重みの分散である重みを用いると説明したが、これに限らず、階層における帰属重みのばらつきが大きい場合により大きい値となる重みを計算すればよぐ例えば、式 (4)によりエントロピー Hを算出し、 1からエントロピ一 Hを弓 Iき算した結果得られる値である重みを計算するようにしてもよ!、。

画

H (| ) = ∑ h | _G l og h | _c … ( 4 )

c eC ( l)

[0247] このように、情報の欠落を最小限に抑えつつ、適切なコンテンツを選択するための計算量を削減することができる。また、利用者がどのような情報に着目してコンテンツを選択してヽるかを確実に反映したコンテンツを提示することができるようになる。

[0248] なお、本明細書にぉ、て、プログラムに基づ、て実行されるステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

[0249] また、プログラムは、 1台のコンピュータにより処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであってもよい。

また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。

Claims

請求の範囲

[1] コンテンツ群のな力から所定の条件を満たすコンテンツを選択する情報処理装置において、

前記コンテンツ群を構成する各コンテンツを、コンテンツのメタデータに応じた階層のそれぞれにおいて複数の第 1のクラスタのいずれか〖こ分類するコンテンツ分類手段と、

各コンテンツと各コンテンツのそれぞれが分類された前記階層における前記第 1のクラスタとの対応関係を示すデータベースを保持する保持手段と、

前記階層毎に前記所定の条件に対応する前記第 1のクラスタを指定し、指定した前記第 1のクラスタに対応するコンテンツを特定する特定手段と、

前記特定手段によって特定された前記コンテンツを提示する提示手段とを含むことを特徴とする情報処理装置。

[2] 前記コンテンツ分類手段によって前記コンテンツが分類される各第 1のクラスタに、ユーザの嗜好の程度を示す嗜好値を対応付けて記憶する記憶手段をさらに含み、前記特定手段は、前記記憶手段によって記憶されて、る嗜好値に基づ!、て前記第 1のクラスタを指定し、指定した前記第 1のクラスタに対応するコンテンツを特定する

ことを特徴とする請求項 1に記載の情報処理装置。

[3] 前記特定手段は、指定した前記第 1のクラスタに対応するコンテンツの中から、前記嗜好値に応じた階層毎の重みにより重み付けした、ユーザのコンテンツの嗜好の度合いを示す評価値で、さらにコンテンツを特定する

ことを特徴とする請求項 2に記載の情報処理装置。

[4] 前記コンテンツ分類手段によって前記コンテンツが分類される各第 1のクラスタに対してキーワードを設定する設定手段と、

前記設定手段によって設定されたキーワードを用い、コンテンツの提示理由を表す理由文を生成する生成手段とをさらに含み、

前記提示手段は、前記理由文も提示する

ことを特徴とする請求項 1に記載の情報処理装置。

[5] 前記コンテンツは楽曲であり、

前記メタデータには、前記楽曲のテンポ、ビート、またはリズムのうちの少なくとも 1 つが含まれる

ことを特徴とする請求項 1に記載の情報処理装置。

[6] 前記メタデータには、対応するコンテンツに対するレビューテキストが含まれる

ことを特徴とする請求項 1に記載の情報処理装置。

[7] コンテンツのメタデータを複数の第 2のクラスタのいずれかに分類し、第 2のクラスタに前記階層を割り当てるメタデータ分類手段をさらに含み、

前記コンテンツ分類手段は、各コンテンツを、割り当てられた前記階層のそれぞれにお、て複数の第 1のクラスタの、ずれかに分類する

ことを特徴とする請求項 1に記載の情報処理装置。

[8] 前記特定手段は、類似元となるコンテンツが分類される前記第 1のクラスタに対応するコンテンツの中から、類似元となるコンテンツとの類似の度合いを示す類似度で、さらにコンテンツを特定する

ことを特徴とする請求項 1に記載の情報処理装置。

[9] 前記特定手段は、類似元となるコンテンツの前記第 1のクラスタへの帰属の重みに応じた階層毎の重みにより重み付けした前記類似度でコンテンツを特定することを特徴とする請求項 8に記載の情報処理装置。

[10] コンテンツ群のな力から所定の条件を満たすコンテンツを選択する情報処理装置の情報処理方法において、

前記コンテンツ群を構成する各コンテンツを、コンテンツのメタデータに応じた階層のそれぞれにお、て複数のクラスタの!/、ずれかに分類する分類ステップと、

各コンテンツと各コンテンツのそれぞれが分類された前記階層における前記クラスタとの対応関係を示すデータベースを保持する保持ステップと、

前記階層毎に前記所定の条件に対応する前記クラスタを指定し、指定した前記クラスタに対応するコンテンツを特定する特定ステップと、

特定された前記コンテンッを提示する提示ステップと

を含むことを特徴とする情報処理方法。コンテンツ群のな力から所定の条件を満たすコンテンツを選択するためのプロダラムであって、

特定された前記コンテンッを提示する提示ステップと

を含む処理をコンピュータに実行させることを特徴とするプログラム。