JP2007115222A

JP2007115222A - 情報処理装置および方法、並びにプログラム

Info

Publication number: JP2007115222A
Application number: JP2006001043A
Authority: JP
Inventors: Mari Saito; 真里斎藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2005-09-26
Filing date: 2006-01-06
Publication date: 2007-05-10

Abstract

【課題】ユーザに適した情報の推薦を行えるようにする。
【解決手段】クラスタ学習部５２は、ユーザの嗜好や価値観が反映されたユーザからの情報を取得し、その取得された情報を解析することによりクラスタを決定する。決定されたクラスタは、アイテムのメタデータに付与される。クラスタ付与学習部５３は、クラスタが付与されたメタデータを用いて、新たなメタデータであって、クラスタが付与されていないメタデータに対してクラスタを付与する。推薦部５５は、ユーザのプロファイルとクラスタが付与されているメタデータに基づき、ユーザに適した情報を検索し、検索結果を、ユーザに提供する。本発明は、所定のアイテムの販売を管理するサーバに適用することができる。
【選択図】図３

Description

本発明は情報処理装置および方法、並びにプログラムに関し、特に、所定のアイテムのメタデータを、ユーザからの情報により更新し、かつ、その更新は、メタデータの作成者の手を煩わすことなくできるようにした情報処理装置および方法、並びにプログラムに関する。

従来、顧客の嗜好に基づいてテレビジョン番組、楽曲などのコンテンツを検索して推薦する（いわゆる、コンテンツパーソナライゼーション）ための発明が提案されている（例えば、特許文献１参照）。

コンテンツパーソナライゼーションには、協調フィルタリング(CF)と称する手法やコンテントベーストフィルタリング(CBF)と称される手法が広く使われている。

CF手法は、各顧客の購入履歴を管理し、コンテンツを推薦しようとする顧客Ａに対し、購入履歴が似ている他の顧客Ｘを検出して、当該他の顧客Ｘが購入しており、かつ、顧客Ａが購入していないコンテンツを推薦するようにしたものであり、例えば、インターネット上の通信販売サイトにおいて採用されている。

CBF手法は、コンテンツに対して配信側や販売側によって予め付与されているメタデータが直接的に嗜好の抽出やコンテンツの推薦に利用されていた。すなわち、顧客の嗜好を示す特徴ベクトルと、候補となる各楽曲の特徴ベクトルとの距離（余弦相関など）を算出し、算出された距離の短い楽曲がユーザの嗜好に合致したものとして推薦されるようになされている。

特開２００４−１９４１０７号公報

上述したCF手法などでは、例えば、以下のような不都合が生じてしまう可能性があった。まず、新規の顧客に対してコンテンツを推薦する場合、当該顧客の購入履歴が少ないので、履歴情報が類似している他の顧客を検出することができず、コンテンツを推薦することができないといった不都合が生じてしまう可能性があった（コールドスタート問題などと称されることがある）。

また、通常、コンテンツの数も顧客の数も増加していくが、その場合、購入履歴が似ている他の顧客を検出する際の演算が多くなり、推薦するコンテンツを速やかに決定することができないといった不都合が生じてしまう可能性があった。

また、推薦するための処理を実行するときに用いられるメタデータは、推薦対象となるコンテンツの特徴に基づいて、人が手動で付与するため、その付与される情報は、付与する側の人の嗜好に依存するものとなってしまう。そのため、メタデータ自体が、恣意的になり、特定の人の嗜好に依存したものとなってしまうといった不都合が生じてしまう可能性があった。また、人が付与するということは、人件費がかかることを意味し、コストがかかってしまといった不都合が生じてしまう可能性があった。

本発明は、このような状況に鑑みてなされたものであり、ユーザの意見が反映されたメタデータが作成できるようにするものである。

本発明の一側面の情報処理装置は、所定のアイテムに対する情報であり、ユーザの嗜好が反映された情報を取得する取得手段と、前記取得手段により取得された前記情報を解析し、クラスタを学習する第１の学習手段と、前記第１の学習手段により学習された前記クラスタが付与された前記アイテムに関するメタデータを用いて、クラスタ毎の特徴を学習する第２の学習手段と、前記第２の学習手段により学習された前記特徴に基づいて、クラスタが付与されていないアイテムのメタデータにクラスタを付与する付与手段と、クラスタが付与されているメタデータと、前記ユーザの嗜好に関するプロファイルとを用いて、前記ユーザに推薦するための情報を検索し、推薦する推薦手段とを備える。

前記取得手段により取得される情報は、前記ユーザに対して実施されたアンケートの結果に関する情報、または、前記ユーザが購入したアイテムに関する購入履歴の情報であるようにすることができる。

前記第１の学習手段は、前記取得手段により取得された情報を多変量解析することにより数次元のデータに数量化し、数次元のデータに数量化された前記情報をクラスタリングすることによりクラスタを学習するようにすることができる。

本発明の一側面の情報処理方法またはプログラムは、所定のアイテムに対する情報であり、ユーザの嗜好が反映された情報を取得する取得ステップと、前記取得ステップの処理で取得された前記情報を解析し、クラスタを学習する第１の学習ステップと、前記第１の学習ステップの処理で学習された前記クラスタが付与された前記アイテムに関するメタデータを用いて、クラスタ毎の特徴を学習する第２の学習ステップと、前記第２の学習ステップの処理で学習された前記特徴に基づいて、クラスタが付与されていないアイテムのメタデータにクラスタを付与する付与ステップと、クラスタが付与されているメタデータと、前記ユーザの嗜好に関するプロファイルとを用いて、前記ユーザに推薦するための情報を検索し、推薦する推薦ステップとを含む。

本発明の一側面の情報処理装置および方法、並びにプログラムにおいては、ユーザの嗜好が反映された情報から、所定のアイテムに関するメタデータを分類するためのクラスタが決定される。また、決定されたクラスタが付与されたメタデータが用いられ、ユーザに対して推薦するアイテムが検索される。

本発明の一側面によれば、ユーザの嗜好を解析することができる。

本発明の一側面によれば、ユーザの嗜好を解析し、その解析結果に基づき、ユーザに提供する情報を分類することができる。

以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書または図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書または図面に記載されていることを確認するためのものである。従って、明細書または図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。

本発明の一側面の情報処理装置（例えば、図２のサーバ２）は、所定のアイテムに対する情報であり、ユーザの嗜好が反映された情報を取得する取得手段（例えば、図２の学習部５１）と、前記取得手段により取得された前記情報を解析し、クラスタを学習する第１の学習手段（例えば、図２のクラスタ学習部５２）と、前記第１の学習手段により学習された前記クラスタが付与された前記アイテムに関するメタデータを用いて、クラスタ毎の特徴を学習する第２の学習手段（例えば、図２のクラスタ付与学習部５３）と、前記第２の学習手段により学習された前記特徴に基づいて、クラスタが付与されていないアイテムのメタデータにクラスタを付与する付与手段（例えば、図２のクラスタ付与学習部５３）と、クラスタが付与されているメタデータと、前記ユーザの嗜好に関するプロファイルとを用いて、前記ユーザに推薦するための情報を検索し、推薦する推薦手段（例えば、図２の推薦部５５）とを備える。

以下に、本発明の実施の形態について図面を参照して説明する。

［システムの構成について］
図１は、本発明を適用したシステムの一実施の形態の構成を示す図である。ネットワーク１には、サーバ２、端末３−１乃至３−Ｎが接続されている。図１に示したシステムは、所定の情報（例えば、曲、番組、商品など）を、ユーザに推薦するシステムである。ネットワーク１は、インターネットやＬＡＮ（Local Area Network）などから構成される。

サーバ２は、推薦する情報を蓄積したり、推薦するための情報を生成したりする。端末３−１乃至３−Ｎは、ユーザ側の端末である。例えば、端末３−１によりユーザが、ネット上の店で所定の商品を購入したとき、その商品に関連する他の商品を推薦するための情報が、サーバ２で生成され、ネットワーク１を介して端末３−１に供給される。

以下の説明において、端末３−１乃至３−Ｎを個々に区別する必要がない場合、単に、端末３と記述する。また、図１においては、サーバ２を１つしか記載していないが、複数設けることも、勿論可能である。

［サーバの構成および動作について］
図２は、サーバ２の内部構成例を示す図である。ＣＰＵ（Central Processing Unit）２１は、ＲＯＭ（Read Only Memory）２２、または記憶部２８に記憶されているプログラムに従って各種の処理を実行する。ＲＡＭ（Random Access Memory）２３には、ＣＰＵ２１が実行するプログラムやデータなどが適宜記憶される。これらのＣＰＵ２１、ＲＯＭ２２、およびＲＡＭ２３は、バス２４により相互に接続されている。

ＣＰＵ２１にはまた、バス２４を介して入出力インターフェース２５が接続されている。入出力インターフェース２５には、キーボード、マウス、マイクロホンなどよりなる入力部２６、ディスプレイ、スピーカなどよりなる出力部２０７が接続されている。ＣＰＵ２１は、入力部２６から入力される指令に対応して各種の処理を実行する。そして、ＣＰＵ２１は、処理の結果を出力部２７に出力する。

入出力インターフェース２５に接続されている記憶部２８は、例えばハードディスクからなり、ＣＰＵ２１が実行するプログラムや各種のデータを記憶する。通信部２９は、ネットワーク１を介して外部の装置（例えば、端末３）と通信する。また、通信部２９を介してプログラムを取得し、記憶部２８に記憶してもよい。

入出力インターフェース２５に接続されているドライブ３０は、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどのリムーバブルメディア３１が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記憶部２８に転送され、記憶される。

端末３は、基本的にサーバ２と同様の構成で構成することができるので、ここでは、その説明を省略する。

図３は、サーバ２の機能について説明するための図である。サーバ２は、ユーザに推薦するためのデータ（以下、メタデータと称する）を分類するためのデータを学習したり、学習されたデータから新規のデータを分類するための学習をしたりするための学習部５１を備える。学習部５１は、クラスタ学習部５２とクラス付与学習部５３を含む構成とされている。

クラスタ学習部５２は、メタデータを分類するためのデータ（クラスタ）を学習するための機能である。クラス付与学習部５３は、クラスタを新しい情報（以下、適宜、アイテムと称する）のメタデータに付与するための学習を行う機能である。なお、以下の本明細書において、アイテムとは、曲、番組、プログラムなどのデータとしてユーザに提供されるものや、家電製品などの物体としてユーザに提供されるものの情報（この場合、メタデータに記載されている情報や、メタデータに関連付けられている他の情報）が付加される対象となるものとしての意味を有するとする。

サーバ２は、メタデータなどのデータを記憶するデータベース５４を備える。また、サーバ２は、データベース５４に記憶されているメタデータを参照し、ユーザに適した情報を推薦するための処理を実行する推薦部５５を備える。

図４は、クラスタ学習部５２の構成例を示す図である。クラスタ学習部５２は、情報取得部７１、多変量解析部７２、および、クラスタリング部７３を含む構成とされている。情報取得部７１は、ユーザからの情報（後述するように、アンケート結果や購入履歴などの情報）を取得する。多変量解析部７２は、取得された情報を数値化する。そして、クラスタリング部７３は、数値化された情報をクラスタ毎に分類する。

クラスタ学習部５２は、上記したような構成により、複数の情報をクラスタリングする。クラスタ付与学習部５３は、クラスタ学習部５２によるクラスタリングの結果を用いて、新規に追加される情報が、どのクラスタに属するかを判断し、クラスタを付与する。

図５は、クラスタ付与学習部５３の構成例を示す図である。クラスタ付与学習部５３は、メタデータ取得部７１、特徴分析部９２、クラスタ決定部９３、アイテムメタデータ取得部９４、および、追加部９５から構成されている。

メタデータ取得部９１は、クラスタ学習部５２による学習に用いられたアイテムのメタデータ（クラスタが付与されているメタデータ）を取得する。特徴分析部９２は、取得されたアイテムのメタデータから、そのアイテム（メタデータ）の特徴を抽出する。抽出された特徴量は、クラスタ決定部９３に供給される。クラスタ決定部９３には、アイテムメタデータ部９４からの情報も供給される。

アイテムメタデータ取得部９４は、クラスタを割り当てるアイテムのメタデータ（クラスタが付与されていないメタデータ）を取得する。クラスタ決定部９３は、アイテムメタデータ取得部９４から供給される所定のアイテムのメタデータを参照し、その参照したメタデータの特徴と、特徴分析部９２から供給される特徴とをマッチングし、クラスタを判別する。判別されたクラスタは、処理対象とされているアイテムのメタデータに追加される。クラスタが付与されたメタデータは、追加部９５により、データベース５４に追加記憶される。

このようにして、クラスタが付与されたメタデータを用いて、推薦部５５は、ユーザに対して、ユーザに適した情報を推薦するための処理を実行する。

図６は、推薦部５５の構成例を示す図である。推薦部５５は、ユーザプロファイル生成部１１１、類似度計算部１１２、推薦情報生成部１１３、カテゴリ検索部１１４、および、プレイリスト個人化部１１５から構成されている。ユーザプロファイル生成部１１１は、ユーザ毎のプロファイルを生成する。生成されたプロファイルは、必要に応じ、類似度計算部１１２とカテゴリ検索部１１４に供給される。

類似度計算部１１２は、ユーザプロファイル生成部１１１により生成された所定のユーザのプロファイルと、アイテムのメタデータとを用いて、類似度を計算する。推薦情報生成部１１３は、類似度の高いアイテムを、推薦情報として、推薦する。

カテゴリ検索部１１４は、ユーザのプロファイルから、ユーザの好むアイテムのカテゴリを検索する。その検索結果は、プレイリスト個人化部１１５に供給される。プレイリスト個人化部１１５は、ユーザの好むアイテムのカテゴリを基に、ユーザ毎のプレイリストを作成する。

このような各部が処理を行う際に用いられるメタデータなどのデータについて説明する。データは、データベース５４（図３）に記憶されている。図７乃至１１は、データベース５４に記憶されているデータを示す図である。

データベース５４には、図７に示したユーザからのアンケートを集計した結果を管理するアンケート管理テーブル１５１、図８に示したユーザの購入履歴を管理する購入履歴テーブル１５２、図９に示したアイテム毎の数量化された数値を管理する数量化管理テーブル１５３、図１０に示したアイテムのメタデータ１５４、および、図１１に示したユーザのプロファイル１５５が記憶されている。

図７に示したアンケート管理テーブル１５１は、ユーザに対して実施したアンケートの結果が書き込まれている。アンケートは、例えば、ユーザに対してネット上で行われたり、紙媒体で行なわれたりする。またアンケートの内容としては、例えば、図７に示した例においては、ある曲に対してであり、その曲を好きか（ＹＥＳ）嫌いか（ＮＯ）といったことである。

図７に示したアンケート管理テーブル１５１には、例えば、“曲１”に対して、“ユーザＡ”は“ＹＥＳ（好き）”と答え、“ユーザＢ”は“ＮＯ（嫌い）”と答え、“ユーザＣ”は“ＹＥＳ（好き）”と答えていることが記載されている。このようなアンケートは、所定数のユーザに対して、所定数の曲に対して行われる。例えば、１００人のユーザに１００曲に対して、好きか嫌いかといったアンケートが行われ、その結果が、アンケート管理テーブル１５１に書き込まれる。

図８に示した購入履歴テーブル１５２は、ユーザが購入したアイテムと、そのアイテムを購入した時刻が関連付けられた情報が記載されているテーブルである。例えば、時刻“２００５／０８／２２／９：２５”に、ユーザＩＤが”ID0024“のユーザが、アイテム”Item0034“を購入したことが記載されている。

例えば、この場合、ユーザIDが“ID00024”であるユーザが購入したアイテムを“ＹＥＳ”とし、購入していないアイテムを“ＮＯ”と記載する。他のユーザに対しても、同様に、購入したアイテムを“ＹＥＳ”とし、購入していないアイテムを“ＮＯ”と書き込む。このようにすれば、図７に示したテーブルと同様の内容のテーブルを作成することができる。すなわち、所定の曲（アイテム）を購入した（好き）ユーザと、購入してない（嫌い）ユーザとの情報が記載されたテーブルを、図８に示した購入履歴テーブル１５２から作成することができる。

アンケートのような形式で、ユーザの嗜好に関する情報を取得するようにしても良いし、購入履歴といった情報から、ユーザの嗜好に関する情報を取得しても良い。データベース５４には、アンケート管理テーブル１５１と購入履歴テーブル１５２の両方を記憶させ、後述する処理（クラスタリングの処理など）が行われるようにしても良いし、どちらか一方のみを記憶させ、後述する処理が行われるようにしても良い。

購入履歴テーブル１５２は、他のサーバ（例えば、商品を販売している店のサーバ）から取得されるようにしても良い。

図７に示したアンケート管理テーブル１５１、または、図８に示した購入履歴テーブル１５２から、図９に示したような数量化管理テーブル１５３が作成される。数量化管理テーブル１５３は、例えば、図７に示したような所定のパターン（図７においては、あるユーザが購入した（好きといった）曲のパターン）が得られる情報から作成される。

数量化管理テーブル１５３には、曲毎に、次元毎の値が記載されている。すなわち、数量化管理テーブル１５３には、図７に示したようなテーブルからパターンを読みとり、数量化することにより、この場合、所定の曲を数次元の情報で表したときの情報が記載される。図９に示した例では、“曲１”の次元１の値は“0.12”、次元２の値は“0.34”、次元３の値は“0.62”と記載されている。

なお、次元は、何次元でも良い。次元は、処理の仕方（どのような方法により数値化するか）により決定され、後述するクラスタに分けるときの処理に必要な次元に決定される。数量化管理テーブル１５３は、後述するように、クラスタを決定する際の処理に用いられる。

クラスタは、図１０に示すように、所定のアイテムのメタデータ１５４にも記載される。図１０に示したメタデータ１５４は、アイテムが曲であり、その曲に関する情報が記載されているデータである。図１０に示したメタデータ１５４には、アイテムＮＯ、ジャンル、アーティスト、テンポ、ハーモニ、およびクラスタといった項目が設けられ、それぞれの項目に対応する情報が関連付けられて管理されている。

例えば、アイテムＩＤが“I-001”のジャンルは“Rock”であり、アーティストは“ABC”であり、テンポが“２４”であり、ハーモニが“Ａ”であり、クラスタが“１”であることが関連付けられて記載されている。

アイテムＮＯ、ジャンル、アーティストといった情報は、人の手によりメタデータ１５４に書き込まれ、テンポやハーモニといった情報は、曲を解析することにより、人の手によらずに書き込まれるようにしても良い。

図１１は、所定のユーザのプロファイル１５５である。プロファイル１５５は、管理対象とされているユーザが購入した（または、アンケートなどで好きと言った）曲に関する情報が記載されている。所定のユーザに対するプロファイル１５５には、ジャンル、アーティスト、テンポ、ハーモニ、クラスタといった情報が、それぞれ関連付けられて管理されている。また、各情報は、さらに細かい分類がされている。例えば、ジャンルは、“Rock”、“J-POP”といった分類がされており、アーティストには“ABC”“GGG”といった分類がされている。

例えば、ジャンル“Rock”の欄には“２”との数値が記載されているが、これは、ジャンルとして“Rock”に分類される曲を２回購入している（２曲好きだと申告している）ことを意味している。同様に、他の情報の分類の欄に記載されている数値は、その分類に属する曲を何回購入したか（好きと申告しているか）を示している。以下、プロファイル１５５に記載される情報（数値）は、購入回数を示すとして説明を続ける。

このように、所定のユーザのプロファイル１５５には、所定のユーザが購入した曲の情報（特徴）毎に、回数が記載されている。

このようなデータを用いた処理について説明する。まず、学習部５１のクラスタ学習部５２（図４）が行う処理について、図１２のフローチャートを参照して説明する。ステップＳ１１において、クラスタ学習部５２の情報取得部７１は、情報を取得する。ステップＳ１１において取得される情報は、ユーザからのアンケートの結果や購入履歴である。

ユーザからのアンケートの結果が、ステップＳ１１において取得される場合、例えば、事前に、紙媒体で実施したアンケートの結果として取得されたり、ネット上で実施されたアンケートの結果が集計されたりすることにより取得される。このように、アンケート結果が取得される場合、図７に示したようなアンケート管理テーブル１５１が作成される。

アンケートとしては、例えば、１００曲に対して、１００人の人に対して“好き”または“嫌い”といったような内容のアンケートである。すなわち、この場合、所定の曲数に対して、所定のユーザ数からの回答が、情報として取得されることにより、図７に示したようなアンケート管理テーブル１５１が作成される。

ステップＳ１１において取得される情報が、購入履歴であったような場合、図８に示したような購入履歴テーブル１５２から所定の人数（例えば、１００人）分の購入履歴が抽出される。そして、その抽出されたユーザが購入した曲から所定の数の曲が抽出される。抽出された曲の内、所定のユーザが購入した曲は“好き”と判断され、所定のユーザは購入していない曲は“嫌い”と判断され、テーブルが作成される。作成されたテーブルは、図７に示したような、所定の曲数に対して、所定のユーザ数からの回答が取得されたテーブルとなる。

このようにして、ステップＳ１１において情報が取得される。ステップＳ１１において取得される情報は、上述したように、アンケートの結果や購入履歴であり、ユーザの嗜好や価値観により変化する情報である。換言すれば、ステップＳ１１において取得される情報は、ユーザの嗜好や価値観に依存している情報である。

ステップＳ１２において、多変量解析が実行される。例えば、図７に示したようなアンケート管理テーブル１５１に記載されている情報に対して、多変量解析が実行されることにより、図９に示したような数量化管理テーブル１５３が作成される。すなわち、図７に示したようなアンケート管理テーブル１５１の回答パターン（ＹＥＳ、ＮＯのパターン）から、対応分析や主成分分析などの多変量解析により、ユーザの嗜好に基づく曲毎の特徴が、数次元のデータに数量化される。

例えば、図７に示したようなアンケート管理テーブル１５１（図８に示した購入履歴テーブル１５２から作成されたテーブル）は、ユーザ（ユーザＡとする）が好きな曲のパターンが記述されているテーブルである。ユーザＡが好きな曲のパターンを解析することにより、ユーザＡの好む曲の特徴を解析することができる。また、ユーザＡが好きな曲（曲１とする）を好きな他のユーザ（例えば、ユーザＣ）の特徴も、ユーザＡと同様に解析することできる。

曲１を好きなユーザＡやユーザＣにはどのような特徴があるのかを解析することにより、曲１が好きなユーザ全体の特徴を解析することができる。また、曲１が好きなユーザの特徴を、曲１の特徴の１つとして扱うこともできる。このようなことから、図７に示したようなアンケート管理テーブル１５１を解析し、曲を多次元の数量化されたデータに変換することにより、曲毎の特徴を数値化することができる。

曲の情報を多次元の数量化されたデータとして管理しているのが、図９に示した数量化管理テーブル１５３である。このような数量化管理テーブル１５３が、ステップＳ１２において作成される。

ステップＳ１３において、数量化管理テーブル１５３に記載されている情報（数値）が、マッピングされる。例えば、図９に示した数量化管理テーブル１５３のうち次元１と次元２の欄に記載されている数値をマッピングすることを考える。次元１を例えばＸ軸、次元２を例えばＹ軸に対応させることにより、Ｘ軸とＹ軸の２軸からなる２次元に、数量化管理テーブル１５３に記載されている各曲の特徴（情報）をマッピングすることができる。このようなマッピングが行われると、例えば、図１３に示したようなグラフを取得することができる。

図１３に示したグラフは、図９に示したような数量化管理テーブル１５３に記載されている曲を、曲毎に、次元１と次元２の数値を用いて、マッピングした一例である。マッピングは、数量化管理テーブル１５３に記載されている曲数分（例えば、１００曲分）に対して行われる。このような処理が行われるため、多変量変換を行うときの次元は、何次元にマッピングし、後述する処理が実行されるかにより、決定されればよい。例えば、２次元にマッピングされ、後述する処理が実行される場合には、多変量変換は、２次元のデータに数量化されればよい。

図１３に示したようなグラフが作成されると、ステップＳ１４（図１２）において、クラスタが決定される。クラスタは、例えば、図１３に示したグラフを解析し、まとまりのある部分（点が集中している部分など）毎に分割し、その分割された領域をクラスタ１、クラスタ２などと順次割り当てることにより、クラスタが決定される。

クラスタリングは、例えば、k-meansや階層などの手法により行われる。

クラスタリングが行われることにより、例えば、図１３に示したグラフから、図１４に示したような結果が取得される。図１４に示した結果は、クラスタ１乃至５の５つのクラスタに分類されたときの状態を示している。各クラスタは、重なりがない状態で設定されている。このように、各クラスタに重なりがないように設定することにより、１つのアイテムに対して１つのクラスタを割り当てることが可能となる。

各クラスタに重なりがあっても良いように設定することも可能である。ソフトクラスタリング手法などと称されるクラスタリング手法を用いてクラスタリングを行った場合、クラスタに重なりが生じることがある。クラスタに重なりがあるような場合、例えば、クラスタ１が９０％、クラスタ２が１０％といったように、１つのアイテムに対して、複数のクラスタと占める割合が割り当てられる。

また、クラスタに重なりがあるようにした場合に、各クラスタの値を合計したときに、必ずしも１００％になる必要性はない。例えば、クラスタ１が８０％、クラスタ２が３０％であっても良い。

本実施の形態においては、後述するように、所定のアイテムを所定のクラスタに分類できれば良く、例えば、クラスタリングの結果、クラスタ１が８０％、クラスタ２が３０％と算出された場合、そしてそのような重なりのあるクラスタに所定のアイテムが分類されるようなとき、パーセンテージの高い、クラスタ１に分類されると決定されるようにすればよい。よって、このクラスタに重なりがあるようにクラスタが導き出されるようにしても（ソフトクラスタリングの手法が用いられるようにしても）、クラスタに重なりがないような手法にしても、後述するアイテムの分類（クラスタの付与の処理）は行えるため、どちらの手法を用いても良い。

すなわち、所定のアイテムが、所定のクラスタに属すると分類されるとき、そのクラスタで確からしいという確率（帰属度）が求められれば良い。ここでは、図１４に示したように、各クラスタには重なりがないとして説明を続ける。

このようにして、所定の情報からクラスタが導き出されると、ステップＳ１５（図１２）において、導き出されたクラスタが記憶される。上記したように、例えば、ステップＳ１１において、情報が取得される際、図７に示したようなアンケート管理テーブル１５１が取得される。このアンケート管理テーブル１５１は、曲１、曲２といった曲毎に、情報が管理されている。

各曲にはメタデータが付随している。メタデータは、図１０に示したようなメタデータ１５４のように、アイテムＮＯ、ジャンル、アーティスト、テンポ、ハーモニ、クラスタといった項目に対する情報が関連付けられたテーブルである。このような項目のうち、クラスタ以外の項目、すなわち、アイテムＮＯ、ジャンル、アーティスト、テンポ、ハーモニは、事前に、曲のメタデータとして付与されている情報である（各曲のメタデータは、これらの項目に対する情報が記載された状態で、データベース５４に記憶されている）。

ステップＳ１１における処理で取得された情報、すなわち、クラスタの決定の処理のために用いられた曲（アイテム）のメタデータは、クラスタという項目に対する情報が記載されていない状態である。そこで、ステップＳ１２において、ステップＳ１１における処理で取得された情報（アイテム）に対応するメタデータのクラスタという項目の欄に、対応するクラスタが書き込まれる。

このように、クラスタの学習の処理に用いられた曲のメタデータには、学習の結果得られたクラスタが設定され、メタデータのクラスタの欄に書き込まれる。

他のクラスタリングの手法について説明する。

上記したクラスタリングの手法（クラスタの学習）は、マッピングなどの処理を行うことにより、クラスタリングを行う例である。ここでは、ユーザの支持率を用いてクラスタの学習を行う例をあげ、図１５のフローチャートを参照して説明する。ユーザの支持率とは、例えば、調査対象とされるユーザの数のうち、何人のユーザが調査対象とされたアイテム（以下、アイテムとして曲を例に挙げて説明する）購入したかを調べることにより行われる。例えば、調査対象とされるユーザの数が、１００人であり、曲１を購入したのが、３人であった場合、曲１に対する支持率は、支持率３％と算出される。

ステップＳ２０において、調査対象となる曲（例えば、１００曲）に対して、支持率が算出される。この算出は、図８に示したユーザの購入履歴を管理する購入履歴テーブル１５２が参照されて行われる。すなわち、調査対象とされる曲と調査対象とするユーザを設定し、設定された曲を購入したユーザ数を算出することにより行われる。勿論、その他のユーザからの情報（例えば、ユーザに対して調査対象の曲が好きか嫌いかを示すアンケートを取り、そのアンケート結果など）を用いて支持率が算出されるようにすることも可能である。

ステップＳ２１において、所定の曲の支持率が、０乃至２０％未満であるか否かが判断される。ステップＳ２１において、支持率が、０乃至２０％未満であると判断された場合、ステップＳ２２において、処理対象とされている曲のクラスタが、クラスタ１と設定される。設定されたクラスタは、処理対象とされた曲のメタデータ内の１つの情報として記憶される。

一方、ステップＳ２１において、支持率が、０乃至２０％未満ではないと判断された場合、ステップＳ２３に処理が進められ、支持率が、２０乃至４０％未満であるか否かが判断される。ステップＳ２３において、支持率が、２０乃至４０％未満であると判断された場合、ステップＳ２４において、処理対象とされている曲のクラスタが、クラスタ２と設定される。設定されたクラスタは、処理対象とされた曲のメタデータ内の１つの情報として記憶される。

一方、ステップＳ２３において、支持率が、２０乃至４０％未満ではないと判断された場合、ステップＳ２５に処理が進められ、支持率が、４０乃至６０％未満であるか否かが判断される。ステップＳ２５において、支持率が、４０乃至６０％未満であると判断された場合、ステップＳ２６において、処理対象とされている曲のクラスタが、クラスタ３と設定される。設定されたクラスタは、処理対象とされた曲のメタデータ内の１つの情報として記憶される。

一方、ステップＳ２５において、支持率が、４０乃至６０％未満ではないと判断された場合、ステップＳ２７に処理が進められ、支持率が、６０乃至８０％未満であるか否かが判断される。ステップＳ２７において、支持率が、６０乃至８０％未満であると判断された場合、ステップＳ２８において、処理対象とされている曲のクラスタが、クラスタ４と設定される。設定されたクラスタは、処理対象とされた曲のメタデータ内の１つの情報として記憶される。

一方、ステップＳ２７において、支持率が、６０乃至８０％未満ではないと判断された場合、ステップＳ２９に処理が進められ、処理対象とされている曲のクラスタが、クラスタ５と設定される。設定されたクラスタは、処理対象とされた曲のメタデータ内の１つの情報として記憶される。

ステップＳ２１乃至Ｓ２９の処理が繰り返されることにより、曲毎にクラスタが付けられる。このように、ユーザの支持率を用いて、クラスタの学習を行うようにしても良い。このようにした場合も、ユーザの支持率を用いているため（この支持率自体、ユーザの購入履歴などから算出することが可能であり、ユーザからの情報を用いていることになる）、ユーザの嗜好を反映したクラスタの学習が行えることは、上記したマッピングなどの手法を用いて学習する場合と同様に言えることである。

このようにして、クラスタの学習が行われると、新たに追加されるメタデータ（クラスタの情報がまだ記載されていないメタデータ）に対してクラスタを割り当てるための処理が実行される。このような処理は、学習部５１のクラスタ付与学習部５３により行われる。図１６のフローチャートを参照し、クラスタ付与に係わる処理について説明する。

ステップＳ３１において、メタデータ取得部９１（図５）は、クラスタが付与されているメタデータを取得する。クラスタが付与されているメタデータは、クラスタ学習部５２における処理が終了した時点で、データベース５４（図３）に記憶されている。すなわち、データベース５４には、クラスタが付与されているメタデータと、クラスタが付与されていないメタデータとが存在する。

ステップＳ３１においては、クラスタが付与されているメタデータが取得される。ステップＳ３２において、取得されたメタデータから、特徴量が抽出される。メタデータは、上記したように、クラスタ以外の項目に対する情報（以下、適宜、既存情報と記述する）は、記載されている状態で、データベース５４に記憶されている。

例えば、まず、クラスタ１が付与されているメタデータを抽出し、抽出された各メタデータから、既存情報が読み出される。クラスタは、上記したように、ユーザの嗜好などに基づいて分類された結果である。ユーザの嗜好などに基づいているため、クラスタ毎に特徴がある。すなわちこの場合、所定のクラスタ（例えば、クラスタ１）に属する曲（アイテム）には、一定の特徴があると考えられる。

そこで、ステップＳ３２において、所定のクラスタに属する曲のメタデータを抽出し、抽出されたメタデータから、既存情報を読み出し、読み出された既存情報を用いて、クラスタの特徴が算出される。算出されたクラスタの特徴は、適宜、データベース５４に記憶される。

ステップＳ３３において、アイテムメタデータ取得部９４は、データベース５４に記憶されているメタデータのうち、クラスタが付与されていない（クラスタの情報が記載されていない）メタデータを読み出す。読み出されたメタデータは、クラスタ決定部９３に供給される。クラスタ決定部９３は、ステップＳ３４において、クラスタを判断する。

クラスタ決定部９３は、アイテムメタデータ取得部９４から供給されたメタデータの既存情報を読み出し、その既存情報と、特徴分析部９２から供給される（または、データベース５４から読み出される）特徴量とのマッチングをとることにより、どのクラスタに属するか（例えば、図１４に示したようにクラスタ１乃至５の５個のクラスタがあるときには、クラスタ１乃至５のうちのどのクラスタに属するか）が判断される。

なおここでは、既存情報と特徴量とがマッチングされることによりクラスタが決定されるとしたが、特徴量としてどのようなデータが算出されるかなど（すなわち、ステップＳ３２において算出される情報）は、このステップＳ３４において実行されるクラスタの判断処理の仕方に依存して決定される。また、ここではマッチングによりクラスタが決定されるとして説明したが、他の方法によりクラスタが決定されるようにしても良い。またここでは、クラスタが決定されるとの表記をしているが、設定されているクラスタに、クラスタが付与されていないメタデータを分類することも意味するとする。

ステップＳ３４において、所定の曲のメタデータのクラスタ（アイテムのクラスタ）が決定されると、ステップＳ３５において、その決定されたクラスタが、メタデータに書き込まれる。クラスタが書き込まれたメタデータは、データベース５４に記憶される。クラスタが書き込まれたメタデータは、例えば、図１０に示したようなメタデータ１５４である。

このようにして、既にクラスタが付与されているメタデータが用いられて、クラスタが付与されていないメタデータに対してクラスタが付与される。このようにしてクラスタが付与されたデータを、ステップＳ３１における処理で、クラスタが付与されているメタデータとして取り扱われるようにしても良い。または、図１２のフローチャート（クラスタ学習処理）の処理対象とされたメタデータのみが、ステップＳ３１におけるクラスタが付与されているメタデータとして取得されるようにしても良い。

なお、図１２のフローチャート（クラスタ学習処理）の処理対象とされたメタデータのみが、ステップＳ３１の処理で取得されるようにした場合、ステップＳ３１やステップＳ３２の処理は、１度だけ行われればよい。ステップＳ３１やステップＳ３２における処理により、一度算出された特徴量は、データベース５４に記憶され、その記憶されている特徴量が用いられて、ステップＳ３３以降の処理が実行されるようにすればよい。すなわち、ステップＳ３１とステップＳ３２の処理は、１度、特徴量が算出された後は、省略することが可能である。

ここで、ステップＳ３４（図１６）において実行されるクラスタの判別に係わる処理について、図１７のフローチャートを参照して説明を加える。図１７のフローチャートを参照して説明するクラスタの判別の処理は、上記したようなマッチングによりクラスタを判別する場合の１例であり、そのマッチングを、決定木の手法に基づいて行う例である。

ステップＳ４１において、処理対象とされている曲のリリース（release）が５０以下であるか否かが判断される。リリースの情報に関しては、曲のメタデータに記載されている。以下に説明するピッチ（pitch move）、スピード（speed）、コードバリエーション（chord variation）なども、メタデータに記載されており、そのメタデータに記載されている情報が用いられる。ただし、図１０に示したメタデータ１５４は一例であり、全ての情報を図示していないため、例えば、リリースなどの情報は省略して図示してある。

ステップＳ４１において、リリースが５０以下であると判断された場合、ステップＳ４２に処理が進められ、ピッチが５０以上であるか否かが判断される。ステップＳ４２において、ピッチが５０以上であると判断されると、ステップＳ４３において、その処理対象とされている曲のクラスタが、クラスタ１に設定される。そして、処理対象とされた曲のメタデータ１５４のクラスタの欄に、その設定されたクラスタ（この場合、１）が書き込まれる。

一方、ステップＳ４２において、ピッチは、５０以上であると判断された場合、ステップＳ４４に処理が進められ、コードバリエーションが６０以下であるか否かが判断される。ステップＳ４４において、コードバリエーションが６０以下であると判断されると、ステップＳ４５において、その処理対象とされている曲のクラスタが、クラスタ２に設定される。そして、処理対象とされた曲のメタデータ１５４のクラスタの欄に、その設定されたクラスタ（この場合、２）が書き込まれる。

一方、ステップＳ４４において、コードバリエーションは、６０以下であると判断された場合、ステップＳ４６に処理が進められ、その処理対象とされている曲のクラスタが、クラスタ３に設定される。そして、処理対象とされた曲のメタデータ１５４のクラスタの欄に、その設定されたクラスタ（この場合、３）が書き込まれる。

一方、ステップＳ４１において、リリースは、５０以下であると判断された場合、ステップＳ４７に処理が進められ、リリースが７０以上であるか否かが判断される。ステップＳ４７において、リリースが７０以上であると判断されると、ステップＳ４８において、スピードが４０以下であるか否かが判断される。ステップＳ４８において、スピードが４０以下であると判断されると、ステップＳ４９において、その処理対象とされている曲のクラスタが、クラスタ４に設定される。そして、処理対象とされた曲のメタデータ１５４のクラスタの欄に、その設定されたクラスタ（この場合、４）が書き込まれる。

一方、ステップＳ４８において、スピードは、４０以下であると判断された場合、ステップＳ５０に処理が進められ、その処理対象とされている曲のクラスタが、クラスタ５に設定される。そして、処理対象とされた曲のメタデータ１５４のクラスタの欄に、その設定されたクラスタ（この場合、５）が書き込まれる。

一方、ステップＳ４７において、リリースは、７０以上であると判断された場合、ステップＳ５１に処理が進められ、その処理対象とされている曲のクラスタが、クラスタ１に設定される。そして、処理対象とされた曲のメタデータ１５４のクラスタの欄に、その設定されたクラスタ（この場合、１）が書き込まれる。

このような処理が繰り返されることにより、曲毎にクラスタが判別される。

図１７に示したようなフローチャートでは、曲のメタデータ１５４に書き込まれている情報を用いてクラスタの判別が行われるようにした。ここでは、リリース、ピッチ、コードバリエーション、および、スピードという情報を用いて判別が行われるとして説明した。これらの情報を用いて行われる各判断、例えば、ステップＳ４１においては、リリースが５０以下であるか否かという判断が行われるが、その判断のときに用いられる数値（この場合、“５０”）は、既存情報が解析されることにより設定される。

よって、図１７のフローチャートに記載されている数値は、一例であり、図示した数値に限定されることを示すものではない。また、一度設定された数値であっても、例えば、新たにクラスタが付与されたメタデータが存在するときに、その新たなデータを既存情報として、再度解析が行われ、更新されるようにしても良い。

既存情報は、既に学習の処理によりクラスタが付与されたメタデータ１５４である。よって、クラスタ毎（この場合、１乃至５毎）に、どのような特徴があるか、例えば、リリースとして、クラスタ１はどのような数値を有するかなどの統計をとる（特徴を抽出する）ことにより、各判断で用いられる数値が算出される。また、フローチャートの処理の流れ自体も、既存情報を解析することにより決定される。

すなわち、図１７に示したフローチャートの処理は、既存情報が解析されることにより、判断に用いられる数値や処理の流れが決定される。

また、その結果、図１７のフローチャートに示したように、同一のクラスタと判断されるステップが複数（例えば、図１７では、クラスタ１と判断されるステップは、ステップＳ４３とステップＳ５１の２ステップある）存在するような処理の流れになっても良い。

さらに、図１７に示したように、クラスタ１と判断されるステップが２ステップあるような場合、ステップＳ４３において設定されるクラスタ１と、ステップＳ５１において設定されるクラスタ１とを区別するようにしても良い。すなわち、同じクラスタ１であっても、処理の流れが異なるということは、異なる曲（異なる特徴を有する曲）であると判断することができるため、同じクラスタに属しても区別されるようにしても良い。

換言すればこの場合、ステップＳ４３において設定されるクラスタ１は、リリースが５０以下であり、ピッチが５０以下の曲であるが、ステップＳ５１において設定されるクラスタ１は、リリースが７０以上の曲である。このように、異なるステップで判別されるクラスタは、異なる特徴を有するので、異なるクラスタとして設定されるようにしても。例えば、この場合、ステップＳ５１において設定されるクラスタは、クラスタ１と異なるクラスタ６などとしても良い。

このように、学習の結果（クラスタが付与された既存情報）を解析することにより、新たなクラスタが増えた場合、そのクラスタも含めた処理を行うようにしても良い。換言すれば、例えば、図１２のフローチャートを参照して説明したような学習の処理が終了したことにより作成された既存情報が用いられて、さらに図１７に示したようなフローチャートを作成するための学習が行われるようにしてもよい。

このように、クラスタの数は、学習が行われた結果、決定されるようにしても良い。このように、換言するならば、異なる学習の手法での学習を繰り返すことにより、より詳細なクラスタリングを行うことが可能となる。このようなことは、例えば、１回の学習でクラスタを分類したときに、クラスタ１に属すると判断された複数の曲であっても、さらに学習することにより、それらの複数の曲が異なるクラスタ（例えば、クラスタ１とクラスタ６）とに分類されることになるため、より、詳細に分類ができるようになる。

よって、後述するように、ユーザに対して曲を推薦する際、よりユーザにあった（ユーザが好むであろう）曲を推薦することが可能となる。

クラスタの判断に関する他の処理について説明する。上述したように、マッチングを用いる手法や、決定木による手法の他に、判別式を用いた手法により、クラスタが付与されていないアイテム（曲）のメタデータにクラスタが付与されるようにしても良い。

例えば、判別式として次式（１）を用いることができる。
Ｄ＝１．１×ｓｐｅｅｄ―０．８×ｐｉｔｃｈ＋４．２・・・（１）
Ｄ≧０ならば該当
Ｄ＜０ならば非該当

式（１）において、“１．１”、“−０．８”、“＋４．２”といった数値は、係数である。これらの係数は、既存情報が解析されることにより算出される。例えば、クラスタ１に属する既存情報を解析し、クラスタ１に関する係数（判別式）が算出される。そして、クラスタが付与されていない曲のメタデータの情報を用い、式（１）に基づく演算が行われ、Ｄが０以上である場合、クラスタ１に属すると設定され、０未満である場合、クラスタ１には属さないと設定される（他のクラスタに属するとして、他の判別式による演算が行われる）。

このように、判別式を生成し、その判別式により、クラスタが付与されていないメタデータに、クラスタを付与するための処理が実行されるようにしても良い。

このようにして、クラスタが付与されたメタデータが用いられ、ユーザに対して、ユーザに適した情報が推薦される際の処理が実行される。推薦の処理は、推薦部５５（図６）により実行される。図１８のフローチャートを参照し、推薦部５５により行われる推薦の処理について説明する。

ステップＳ７１において、推薦部５５のユーザプロファイル生成部１１１は、ユーザプロファイルを作成する。作成されるユーザプロファイルは、図１１に示したようなプロファイル１５５である。このようなプロファイルは、例えば、ユーザがアイテム（この場合、曲）を購入した時点で、更新されることにより作成されるようにしても良い。例えば、曲が購入された場合、その曲のメタデータが取得され、取得されたメタデータからの情報が参照され、その情報に対応するプロファイル１５５の情報が１だけ増加されることにより更新される。

例えば、購入された曲のメタデータが、図１０に示したようなメタデータ１５４であり、図１１に示したようなプロファイル１５５がデータベース５４に記憶されていた場合、まず、プロファイル１５５のジャンルの“Rock”という欄の情報“２”が、１だけインクリメントされ、“３”に更新される。同様にプロファイル１５５のアーティストの“ABC”という欄の情報“２”が“３”に更新され、テンポの“21-50”という欄の情報“５”が“６”に更新され、ハーモニの“Ａ”という欄の情報“３”が“４”に更新され、クラスタの“１”という欄の情報“１０”が“１１”に更新される。

このようにして、プロファイルが更新（生成）されると、ステップＳ７２において、類似度計算部１１２（図６）は、ユーザのプロファイルとアイテムのメタデータとの類似度を計算する。プロファイル１５５（図１１）には、メタデータ１５４（図１０）と同様の項目が設けられている。それらの項目に記載されている情報が用いられて、プロファイル１５５とメタデータ１５４との類似度が計算される。

類似度が計算される際、メタデータ１５４やプロファイル１５５に設けられている全ての項目に記載されている情報が用いられて類似度が計算されるようにしても良いし、１または複数の所定の項目に記載されている情報（例えば、クラスタの情報）のみが用いられて類似度が計算されるようにしても良い。

類似度が計算される際、メタデータ１５４やプロファイル１５５に記載されている情報が用いられるが、所定の項目に対応する情報に重みを付けるなどして、類似度が計算されるようにしても良い。類似度の計算は、例えば、ベクトル空間法などによる手法を適用することにより行うことが可能である。

ステップＳ７３において、推薦情報生成部１１３（図６）は、ステップＳ７２において計算された類似度の内、類似度が高いメタデータを抽出し、抽出されたメタデータのアイテムを、ユーザに対して推薦する。すなわち、この場合、ユーザが購入した曲と類似性が高いと思われる曲が、ユーザに対して推薦される。

また、このような推薦が行われる一方で、カテゴリ検索部１１４により、ユーザのプロファイル１５５から、ユーザが好むであろうカテゴリが検索される。例えば、ジャンルが“Rock”に属する曲であっても、“Rock”に属する全ての曲が、ユーザの好みであるとは限らず、“Rock”に属する曲の一部の曲が好みに一致していると考えられる。上記したようにクラスタを付与することにより、同じ“Rock”というジャンルに属している曲であっても、クラスタが異なれば、異なるカテゴリであると判断することができるようになる。

そこで、クラスタにより、ユーザが好みのカテゴリを判断するようにする。カテゴリが判断されると、そのカテゴリに基づき、プレイリスト個人化部１１５により、ユーザ毎のプレイリストが作成される。すなわち、ユーザ毎に、ユーザが好むカテゴリに含まれるアイテムだけに絞られた検索が行えるようにプレイリストが作成される。

このように、本実施の形態においては、アンケートや購入履歴といったユーザの嗜好や価値観などが反映されるユーザからの情報により、アイテムに対するクラスタが付与される。よって、ユーザの認識により近い情報を検索し、提示することが可能となる。

また、ＣＦ（協調フィルタリング）などの手法により情報を推薦するような場合に生じるコールドスタート問題も、本発明を適用して推薦を行うようにすれば、解決することが可能である。すなわち、ＣＦの手法によれば、ある程度のデータが取得（蓄積）された状態でなければ、推薦のための処理を行うことができなかったが、本発明を適用した場合、クラスタを学習するためのデータが少ない状態でも、クラスタをユーザの嗜好に合った状態で付与することができ、そのようなクラスタの情報を用いた情報の推薦は、ユーザの嗜好に一致したものとすることができる。

また、ユーザの嗜好（価値観などを含む）から判断されるクラスタにより、推薦などの処理を行うことにより、既存のジャンルなどにとらわれないカテゴリで、ユーザ毎に、ユーザに適した情報を検出し、提示することが可能となる。

上述した実施の形態においては、クラスタは、１つしか付与されないとして説明したが、複数付与されるようにしても良い。例えば、図１０に示したメタデータ１５４において、クラスタという項目を複数設けても良い。複数のクラスタがメタデータ１５４に記載されるようにした場合、例えば、購入履歴からクラスタを学習するようなときには、上記した実施の形態においては、所定のユーザが購入した曲が収集されるとして説明したが（人が基準として情報が収集されるとしたが）、その他の情報が基準として情報が収集され、クラスタが学習されるようにしても良い。

例えば、所定の時間帯に購入された曲を基準として情報が収集されるようにしても良い。この時には、昼間に購入される曲と夜間に購入される曲とで、クラスタが異なる可能性があり、１つの特徴を見いだすことができると考えられる。そのようなクラスタが用いられて情報が推薦されるようにすれば、例えば、夜間に曲を購入した人には、夜間に購入される可能性の高い曲が推薦されるようにすることができる。

曲の購入時間だけでなく、例えば、購入したユーザの年齢、性別、価値観などの情報が基準とされて、クラスタを学習するための情報が収集されるようにしても良い。また、同一の情報からクラスタを学習するようにし、クラスタリングの方法を異なる手法で行うことにより、複数のクラスタが取得されるようにしても良い。

複数のクラスタを組み合わせて用いることにより、よりユーザの嗜好や価値観など、ユーザに依存する情報で、ユーザ毎に、ユーザに適した情報を提示することが可能となる。

なお、上述した実施の形態においては、扱われる情報や推薦される情報は、曲であるとして説明をしたが、曲以外の情報でも勿論、本発明を適用することは可能である。例えば、ワインなどの情報（色、生産地、タンニンの量などをメタデータとして記載しておく）を扱い、ワインを推薦するといったことにも、本発明を適用することはできる。

［記録媒体について］
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム格納媒体からインストールされる。

コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム格納媒体は、図２に示すように、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ＲＯＭ(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む）、光磁気ディスク（ＭＤ（Mini-Disc）を含む）、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア３１、または、プログラムが一時的もしくは永続的に格納されるＲＯＭ２２や、記憶部２８を構成するハードディスクなどにより構成される。プログラム格納媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインターフェースである通信部２９を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。

なお、本明細書において、プログラム格納媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理は勿論、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。

なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

本発明を適用したシステムの一実施の形態の構成を示す図である。サーバの構成例を示す図である。サーバの機能を示す図である。クラスタ学習部の構成例を示す図である。クラスタ付与学習部の構成例を示す図である。推薦部の構成例を示す図である。アンケート管理テーブルについて説明する図である。購入履歴テーブルについて説明する図である。数量化管理テーブルについて説明する図である。メタデータについて説明する図である。プロファイルについて説明する図である。クラスタの学習について説明するフローチャートである。クラスタの設定について説明する図である。クラスタの設定について説明する図である。クラスタの他の学習について説明するフローチャートである。クラスタ付与処理について説明するフローチャートである。クラスタの判断について説明するフローチャートである。推薦処理について説明するフローチャートである。

符号の説明

１ネットワーク，２サーバ，３端末，２１ＣＰＵ，２２ＲＯＭ，２３ＲＡＭ，２８記憶部，３１リムーバブルメディア，５１学習部，５２クラスタ学習部，５３クラスタ付与学習部，５４データベース，５５推薦部，７１情報取得部，７２多変量解析部，７３クラスタリング部，９１メタデータ取得部，９２特徴分析部，９３クラスタ決定部，９４アイテムメタデータ取得部，９５追加部，１１１プロファイル生成部，１１２類似度計算部，１１３推薦情報生成部，１１４カテゴリ検索部，１１５プレイリスト個人化部

Claims

所定のアイテムに対する情報であり、ユーザの嗜好が反映された情報を取得する取得手段と、
前記取得手段により取得された前記情報を解析し、クラスタを学習する第１の学習手段と、
前記第１の学習手段により学習された前記クラスタが付与された前記アイテムに関するメタデータを用いて、クラスタ毎の特徴を学習する第２の学習手段と、
前記第２の学習手段により学習された前記特徴に基づいて、クラスタが付与されていないアイテムのメタデータにクラスタを付与する付与手段と、
クラスタが付与されているメタデータと、前記ユーザの嗜好に関するプロファイルとを用いて、前記ユーザに推薦するための情報を検索し、推薦する推薦手段と
を備える情報処理装置。
前記取得手段により取得される情報は、前記ユーザに対して実施されたアンケートの結果に関する情報、または、前記ユーザが購入したアイテムに関する購入履歴の情報である
請求項１に記載の情報処理装置。
前記第１の学習手段は、前記取得手段により取得された情報を多変量解析することにより数次元のデータに数量化し、
数次元のデータに数量化された前記情報をクラスタリングすることによりクラスタを学習する
請求項１に記載の情報処理装置。
所定のアイテムに対する情報であり、ユーザの嗜好が反映された情報を取得する取得ステップと、
前記取得ステップの処理で取得された前記情報を解析し、クラスタを学習する第１の学習ステップと、
前記第１の学習ステップの処理で学習された前記クラスタが付与された前記アイテムに関するメタデータを用いて、クラスタ毎の特徴を学習する第２の学習ステップと、
前記第２の学習ステップの処理で学習された前記特徴に基づいて、クラスタが付与されていないアイテムのメタデータにクラスタを付与する付与ステップと、
クラスタが付与されているメタデータと、前記ユーザの嗜好に関するプロファイルとを用いて、前記ユーザに推薦するための情報を検索し、推薦する推薦ステップと
を含む情報処理方法。
所定のアイテムに対する情報であり、ユーザの嗜好が反映された情報を取得する取得ステップと、
前記取得ステップの処理で取得された前記情報を解析し、クラスタを学習する第１の学習ステップと、
前記第１の学習ステップの処理で学習された前記クラスタが付与された前記アイテムに関するメタデータを用いて、クラスタ毎の特徴を学習する第２の学習ステップと、
前記第２の学習ステップの処理で学習された前記特徴に基づいて、クラスタが付与されていないアイテムのメタデータにクラスタを付与する付与ステップと、
クラスタが付与されているメタデータと、前記ユーザの嗜好に関するプロファイルとを用いて、前記ユーザに推薦するための情報を検索し、推薦する推薦ステップと
を含む処理をコンピュータに実行させるプログラム。