JP2007207218A

JP2007207218A - 情報処理装置および方法、並びにプログラム

Info

Publication number: JP2007207218A
Application number: JP2006307833A
Authority: JP
Inventors: Mari Saito; 真里斎藤; Takaomi Kimura; 隆臣木村
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2006-01-06
Filing date: 2006-11-14
Publication date: 2007-08-16
Anticipated expiration: 2026-11-14
Also published as: JP4893940B2

Abstract

【課題】ユーザの気分（ムード）に適したアイテムを提供できるようにする。
【解決手段】ユーザデータ取得部７２は、ユーザが、所定のムードに該当するアイテムであるか否かを判断した結果を取得する。非該当フィルタ生成部７４は、全てのユーザが、所定のムードに該当しないと判断したアイテムの特徴量を、特徴量解析部７３から取得する。非該当フィルタ生成部７４は、取得した複数のアイテムの特徴量を解析することにより、所定のムードに該当しないアイテムの特徴量を抽出する。非該当フィルタ生成部７４により生成された非該当フィルタは、所定のアイテムが、所定のムードに該当するアイテムであるか否かを判断する際に用いられる。本発明は、アイテムを推薦し、提供するサーバなどに適用できる。
【選択図】図５

Description

本発明は情報処理装置および方法、並びにプログラムに関し、特に、ユーザの感情に適した情報を提供できるようにした情報処理装置および方法、並びにプログラムに関する。

従来、顧客の嗜好に基づいてテレビジョン番組、楽曲などのコンテンツを検索して推薦する（いわゆる、コンテンツパーソナライゼーション）ための発明が提案されている（例えば、特許文献１参照）。コンテンツパーソナライゼーションには、協調フィルタリング(CF)と称する手法やコンテントベーストフィルタリング(CBF)と称される手法が広く使われている。

また、ユーザの感情に合わせた曲が、ユーザに提供されるようなサービスも提案されている。例えば、ユーザが楽しいときに聞きたい曲をリクエストすると、そのリクエストに応じて、楽しいと判断される曲が選局され、ユーザに提供されるような仕組みが提案されている。

特開２００４−１９４１０７号公報

ユーザの感情（ムード）に合った曲を提供するような場合、予め提供する曲に対して、どのようなムードのときに提供する曲であるかという情報を付与しておく必要がある。そのような情報の付与は、専属の人により付与されたり、ネットワークなどを介してボランティアの人により付与されたりする。

人の手により付与されているため、情報を付与するためにかかるコストが高くなってしまう、時間がかかってしまうなどの問題があった。また、ボランティアなど、専属の人以外に依存して情報が付加される場合、ボランティアの人達が正確な情報の付与を必ず行うとは限らず、そのために、精度が低下してしまうということもあった。

人の手を介さずに情報が付与される（プログラムや専用の装置などにより付与される）ようにした場合、曲の特徴が解析され、その解析結果に応じて情報が付与される。しかしながら、人により異なるイメージを適切に記述することは難しく、最大公約数的な情報しか付与できなかった。上記したような問題は、曲に対して情報を付加する場合のみではなく、何らかのアイテムに対して情報を付加する場合にも同様に起こりえることである。

本発明は、このような状況に鑑みてなされたものであり、より適切にムードに合った情報を提供することができるようにするものである。

本発明の一側面の情報処理装置は、所定のアイテムが、所定のムードに該当するか否かを示す情報を取得する取得手段と、前記取得手段により取得された前記情報を解析し、所定のムードに該当しないと判断されるアイテムの特徴量を抽出する抽出手段と、前記取得手段により取得された前記情報を解析し、前記ムードに対応するクラスタとそのクラスタに対応する複数のサブクラスタを学習する第１の学習手段と、前記第１の学習手段により学習された前記クラスタとサブクラスタが付与された前記アイテムを用いて、前記ムード毎の特徴を学習する第２の学習手段と、クラスタが付与されていないアイテムの特徴量が、前記抽出手段により抽出された前記特徴量と一致するか否かを判断する判断手段と、前記判断手段により、一致しないと判断された前記アイテムに対して、前記第２の学習手段により学習された前記特徴に基づいて、クラスタとサブクラスタを付与する付与手段とを備える。

前記取得手段により取得される情報は、前記ユーザに対して実施されたアンケートの結果に関する情報であるようにすることができる。

前記第１の学習手段は、前記取得手段により取得された情報を多変量解析することにより数次元のデータに数量化し、数次元のデータに数量化された前記情報をクラスタリングすることによりクラスタを学習するようにすることができる。

前記第１の学習手段は、前記抽出手段により特徴量が抽出される対象とされない前記アイテムの特徴量を多変量解析することにより数次元のデータに数量化し、数次元のデータに数量化された前記特徴量をクラスタリングすることによりクラスタを学習するようにすることができる。

前記第１の学習手段は、前記サブクラスタを再編集する再編集手段を備え、前記再編集手段は、所定のサブクラスタに含まれるアイテム数が、所定の閾値以下である場合、そのサブクラスタを削除するようにしても良い。

前記再編集手段は、所定のサブクラスタに含まれるアイテム数が、所定の閾値以下であり、かつ、前記所定のサブクラスタに含まれるアイテムのうち、所定のムードに該当する判断されたアイテム数の比率により算出される値が、所定の閾値以上である場合、前記所定のサブクラスタを、他のサブクラスタに併合するようにしても良い。

前記第１の学習手段において、前記サブクラスタが学習されるときに用いられる複数のクラスタリング手法から１つの手法を選択する選択手段をさらに備え、前記選択手段は、前記複数のクラスタリング手法のそれぞれでクラスタリングを行った結果に基づいて、前記サブクラスタが最も分散している手法を選択するようにしても。

ムードに関する情報を、その情報が表すムードに関連付けられているクラスタに変換する変換手段と、前記変換手段により変換された前記クラスタが割り当てられているアイテムを推薦する推薦手段とをさらに備え、前記推薦手段により推薦された第１のアイテム以外の第２のアイテムの推薦が指示された場合、前記第１のアイテムのサブクラスタと異なるサブクラスタが付与された前記第２のアイテムを推薦するようにすることができる。

本発明の一側面の情報処理方法は、所定のアイテムが、所定のムードに該当するか否かを示す情報を取得する取得ステップと、前記取得ステップの処理で取得された前記情報を解析し、所定のムードに該当しないと判断されるアイテムの特徴量を抽出する抽出ステップと、前記取得ステップの処理で取得された前記情報を解析し、前記ムードに対応するクラスタとそのクラスタに対応する複数のサブクラスタを学習する第１の学習ステップと、前記第１の学習ステップの処理で学習された前記クラスタとサブクラスタが付与された前記アイテムを用いて、前記ムード毎の特徴を学習する第２の学習ステップと、クラスタが付与されていないアイテムの特徴量が、前記抽出ステップの処理で抽出された前記特徴量と一致するか否かを判断する判断ステップと、前記判断ステップの処理で一致しないと判断された前記アイテムに対して、前記第２の学習ステップの処理で学習された前記特徴に基づいて、クラスタとサブクラスタを付与する付与ステップとを含む。

本発明の一側面のプログラムは、所定のアイテムが、所定のムードに該当するか否かを示す情報を取得する取得ステップと、前記取得ステップの処理で取得された前記情報を解析し、所定のムードに該当しないと判断されるアイテムの特徴量を抽出する抽出ステップと、前記取得ステップの処理で取得された前記情報を解析し、前記ムードに対応するクラスタとそのクラスタに対応する複数のサブクラスタを学習する第１の学習ステップと、前記第１の学習ステップの処理で学習された前記クラスタとサブクラスタが付与された前記アイテムを用いて、前記ムード毎の特徴を学習する第２の学習ステップと、クラスタが付与されていないアイテムの特徴量が、前記抽出ステップの処理で抽出された前記特徴量と一致するか否かを判断する判断ステップと、前記判断ステップの処理で一致しないと判断された前記アイテムに対して、前記第２の学習ステップの処理で学習された前記特徴に基づいて、クラスタとサブクラスタを付与する付与ステップとを含む処理をコンピュータに実行させる。

本発明の一側面の情報処理装置および方法、並びにプログラムにおいては、ユーザが感じる気分や感情に応じて、アイテムが分類される。分類された結果が用いられ、さらに、分類されていないアイテムの分類が行われる。また、ユーザの気分や感情に該当するアイテムが、分類結果に基づいて、ユーザに提供される。

本発明の一側面によれば、ムードに適したアイテムをユーザに提供することが可能となる。

以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書または図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書または図面に記載されていることを確認するためのものである。従って、明細書または図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。

本発明の一側面の情報処理装置は、所定のアイテムが、所定のムードに該当するか否かを示す情報を取得する取得手段（例えば、図４のユーザデータ取得部７２）と、取得手段により取得された情報を解析し、所定のムードに該当しないと判断されるアイテムの特徴量を抽出する抽出手段（例えば、図４の非該当フィルタ生成部７４）と、取得手段により取得された情報を解析し、ムードに対応するクラスタとそのクラスタに対応する複数のサブクラスタを学習する第１の学習手段（例えば、図４の多変量解析部７５とクラスタリング部７６）と、第１の学習手段により学習されたクラスタとサブクラスタが付与されたアイテムを用いて、ムード毎の特徴を学習する第２の学習手段（例えば、図６のメタデータ取得部１１１と特徴分析部１１２）と、クラスタが付与されていないアイテムの特徴量が、抽出手段により抽出された特徴量と一致するか否かを判断する判断手段（例えば、図６の非該当フィルタ１１３）と、判断手段により、一致しないと判断されたアイテムに対して、第２の学習手段により学習された特徴に基づいて、クラスタとサブクラスタを付与する付与手段（例えば、図６のクラスタ決定部１１５）とを備える。

ムードに関する情報を、その情報が表すムードに関連付けられているクラスタに変換する変換手段（例えば、図７のムード情報取得部１４１とムードクラスタ変換部１４２）と、変換手段により変換されたクラスタが割り当てられているアイテムを推薦する推薦手段（例えば、図７の推薦情報生成部１４３）とをさらに備えるようにすることができる。

以下に、本発明の実施の形態について図面を参照して説明する。

［システムの構成について］
図１は、本発明を適用したシステムの一実施の形態の構成を示す図である。ネットワーク１には、サーバ２、端末３−１乃至３−Ｎが接続されている。図１に示したシステムは、所定の情報（例えば、曲、番組、商品などのアイテム）を、ユーザに推薦するシステムである。また、推薦するための情報を生成するための解析なども行われる。ネットワーク１は、インターネットやＬＡＮ（Local Area Network）などから構成される。

サーバ２は、推薦する情報を蓄積したり、推薦するための情報を生成したりする。端末３−１乃至３−Ｎは、ユーザ側の端末である。例えば、端末３−１によりユーザが、所定のアイテムを購入、試聴したりする場合に操作される端末である。また、アイテムは、サーバ２からネットワーク１を介して供給される。

以下の説明において、端末３−１乃至３−Ｎを個々に区別する必要がない場合、単に、端末３と記述する。また、図１においては、サーバ２を１つしか記載していないが、複数設けることも、勿論可能である。

［サーバの構成および動作について］
図２は、サーバ２の内部構成例を示す図である。ＣＰＵ（Central Processing Unit）２１は、ＲＯＭ（Read Only Memory）２２、または記憶部２８に記憶されているプログラムに従って各種の処理を実行する。ＲＡＭ（Random Access Memory）２３には、ＣＰＵ２１が実行するプログラムやデータなどが適宜記憶される。これらのＣＰＵ２１、ＲＯＭ２２、およびＲＡＭ２３は、バス２４により相互に接続されている。

ＣＰＵ２１にはまた、バス２４を介して入出力インターフェース２５が接続されている。入出力インターフェース２５には、キーボード、マウス、マイクロホンなどよりなる入力部２６、ディスプレイ、スピーカなどよりなる出力部２０７が接続されている。ＣＰＵ２１は、入力部２６から入力される指令に対応して各種の処理を実行する。そして、ＣＰＵ２１は、処理の結果を出力部２７に出力する。

入出力インターフェース２５に接続されている記憶部２８は、例えばハードディスクからなり、ＣＰＵ２１が実行するプログラムや各種のデータを記憶する。通信部２９は、ネットワーク１を介して外部の装置（例えば、端末３）と通信する。また、通信部２９を介してプログラムを取得し、記憶部２８に記憶してもよい。

入出力インターフェース２５に接続されているドライブ３０は、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどのリムーバブルメディア３１が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記憶部２８に転送され、記憶される。

端末３は、基本的にサーバ２と同様の構成で構成することができるので、ここでは、その説明を省略する。

図３は、サーバ２の機能について説明するための図である。サーバ２は、ユーザに推薦するためのアイテムのデータ（以下、メタデータと称する）を分類するためのデータを学習したり、学習されたデータから新規のデータを分類するための学習をしたりするための学習部５１を備える。学習部５１は、クラスタ学習部５２とクラス付与学習部５３を含む構成とされている。

クラスタ学習部５２は、メタデータを分類するためのデータ（クラスタ）を学習するための機能である。クラス付与学習部５３は、クラスタを新しい情報（以下、適宜、アイテムと称する）のメタデータに付与するための学習を行う機能である。なお、以下の本明細書において、アイテムとは、曲、番組、プログラムなどのデータとしてユーザに提供されるものや、家電製品などの物体としてユーザに提供されるものの情報（この場合、メタデータに記載されている情報や、メタデータに関連付けられている他の情報）が付加される対象となるものとしての意味を有するとする。

サーバ２は、メタデータなどのデータを記憶するデータベース５４を備える。また、サーバ２は、データベース５４に記憶されているメタデータを参照し、ユーザに適した情報を推薦するための処理を実行する推薦部５５を備える。

以下の説明においては、アイテムとして曲が提供される場合を例に挙げて説明する。よって、メタデータも、曲に関するデータである場合を例に挙げて説明する。

図４は、クラスタ学習部５２の構成例を示す図である。クラスタ学習部５２は、楽曲データ取得部７１、ユーザデータ取得部７２、特徴量解析部７３、非該当フィルタ生成部７４、多変量解析部７５、および、クラスタリング部７６を含む構成とされている。

楽曲データ取得部７１は、ユーザ側（端末３）に提供する曲のデータを（曲そのもののデータ）を取得する。ユーザデータ取得部７２は、ユーザからの情報（後述するように、アンケート結果の情報）を取得する。特徴量解析部７３は、楽曲データ取得部７１により取得された楽曲データを解析し、その曲の特徴量（例えば、スピードやテンポなど）を抽出し、曲の情報を生成する。

後述するように、曲のメタデータには、クラスタという情報が付与される。そのクラスタは、ムード（Mood、ユーザの感情、気分）に応じて付与される識別子としての役割を有する情報である。後述するように、非該当フィルタ生成部７４は、クラスタが付与されていない曲のメタデータに対して付与される際、付与するクラスタの対象とはされないメタデータを排除するためのフィルタを生成する。

非該当フィルタ生成部７４は、特徴量解析部７３から供給される曲のデータ（特徴量）と、ユーザデータ取得部７２から取得されるユーザからのデータを用いて、非該当フィルタを生成する。生成された非該当フィルタに関する情報は、データベース５４（図３）に供給され、記憶される。

多変量解析部７５は、ユーザデータ取得部７２から、供給されるユーザからのデータ（情報）を数値化する。そして、クラスタリング部７６は、数値化された情報をクラスタ毎に分類する（クラスタを生成する）。

なお後述するように、クラスタは、ムードを識別するためのクラスタと、同一のクラスタ内において（同一のムードにおいて）、細かい分類を行うためのサブクラスがある。クラスタリング部７６は、このようなクラスタとサブクラスタを生成する。

クラスタ学習部５２は、上記したような構成により、非該当フィルタを生成するとともに、クラスタを生成し、処理対象とされたメタデータに付与する（すなわちクラスタリングする）。クラスタ付与学習部５３は、クラスタ学習部５２によるクラスタリングの結果を用いて、新規に追加される情報が、どのクラスタに属するかを判断し、クラスタを付与する。

図５は、クラスタ学習部５２の他の構成例を示す図である。図４に示したクラスタ学習部５２と比較するに、図５に示したクラスタ学習部５２’（図４に示したクラスタ学習部５２と区別を付けるために、ダッシュ（’）を付して記述する）は、クラスタ学習部５２に、メタデータ解析部８１を追加した構成とされている。

また、図５に示したクラスタ学習部５２’メタデータ解析部８１には、非該当フィルタ生成部７４により、非該当ではないと判断された曲の情報が非該当フィルタ生成部７４から供給され、その曲に対応する特徴量が、特徴量解析部７３から供給される構成とされている。また、メタデータ解析部８１による解析結果は、多変量解析部７５に供給される構成とされている。

図４に示したクラスタ学習部５２は、クラスタを、ユーザからのデータ（情報）に基づいて生成し、クラスタリングの処理を実行するが、図５に示したクラスタ学習部５２’は、クラスタを、楽曲データから生成し、クラスタリングの処理を実行する。クラスタ学習部５２およびクラスタ学習部５２’が、それぞれ行うクラスタの学習の処理については、フローチャートを参照して後述する。

図６は、クラスタ付与学習部５３の構成例を示す図である。クラスタ付与学習部５３は、メタデータ取得部１１１、特徴分析部１１２、非該当フィルタ１１３、アイテムメタデータ取得部１１４、クラスタ決定部１１５、および、追加部１１６から構成されている。

メタデータ取得部１１１は、クラスタ学習部５２（またはクラスタ学習部５２’）による学習に用いられたアイテムのメタデータ（クラスタが付与されているメタデータ）を取得する。特徴分析部１１２は、取得されたアイテムのメタデータから、そのアイテム（メタデータ）の特徴を抽出する。抽出された特徴量は、非該当フィルタ１１３に供給される。非該当フィルタ１１３には、アイテムメタデータ取得部１１４からの情報も供給される。

アイテムメタデータ取得部１１４は、クラスタを割り当てるアイテムのメタデータ（クラスタが付与されていないメタデータ）を取得する。非該当フィルタ１１３は、アイテムメタデータ取得部１１４から供給されるメタデータが、クラスタを付与する対象となるメタデータであるか否かを判断する（フィルタリングする）。フィルタリングの結果、非該当フィルタ１１３から出力されるメタデータは、クラスタを付与するメタデータである。

非該当フィルタ１１３から出力されたメタデータは、クラスタ決定部１１５に供給される。クラスタ決定部１１５は、非該当フィルタ１１３から供給される所定のアイテムのメタデータを参照し、その参照したメタデータの特徴と、特徴分析部１１２から供給される特徴とをマッチングし、クラスタを判別する。判別されたクラスタは、処理対象とされているアイテムのメタデータに追加される。クラスタが付与されたメタデータは、追加部１１６により、データベース５４に追加記憶される。

このようにして、クラスタが付与されたメタデータを用いて、推薦部５５は、ユーザに対して、ユーザに適した情報（この場合、特に、ユーザの感情（ムード）に適した情報）を推薦するための処理を実行する。

図７は、推薦部５５の構成例を示す図である。推薦部５５は、ムード情報取得部１４１、ムードクラスタ変換部１４２、および、推薦情報生成部１４３を含む構成とされている。ムード情報取得部１４１は、ユーザが指示したムードに関する情報（以下、適宜ムード情報と記述する）を取得する。ムード情報とは、例えば、“悲しい”、“楽しい”といった感情に関する情報である。

ムード情報取得部１４１により取得されたムードに関する情報は、ムードクラスタ変換部１４２に供給される。ムードクラスタ変換部１４２は、ムード情報取得部１４１からのムード情報をクラスタの情報に変換し、推薦情報生成部１４３に供給する。推薦情報生成部１４３は、供給されたクラスタに対応するアイテムを、データベース５４から読み出し、ユーザ側に提供する。

このような各部が処理を行う際に用いられるメタデータなどのデータについて説明する。データは、データベース５４（図３）に記憶されている。図８乃至１０は、データベース５４に記憶されているデータを示す図である。

データベース５４には、図８に示したユーザからのアンケートを集計した結果を管理するアンケート管理テーブル１７１、図９に示したアイテムのメタデータ１７２、および図１０に示したアイテム毎の数量化された数値を管理する数量化管理テーブル１７３が記憶されている。

図８に示したアンケート管理テーブル１７１は、ユーザに対して実施したアンケートの結果が書き込まれている。アンケートは、例えば、ユーザに対してネット上で行われたり、紙媒体で行われたりする。アンケートの内容としては、例えば、図８に示した例においては、ある曲に対して、その曲が“悲しい”曲に分類されるか否かといった内容である。換言すれば、どのようなムード（感情、気分）のときに、どのような曲を聴きたいかといった情報を取得するためのアンケートが行われる。

図８に示したアンケート管理テーブル１７１には、例えば、“曲１”に対して、“ユーザＡ”は“○（悲しい曲である）”と答え、“ユーザＢ”は“○（悲しい曲である）”と答え、“ユーザＣ”は無印（○が記載されていない状態、（悲しい曲ではない））と答えていることが記載されている。

このようなアンケートは、所定数のユーザに対して、所定数の曲に対して行われる。例えば、１００人のユーザに１００曲に対して、悲しい曲であるか、悲しくない曲であるかといったアンケートが行われ、その結果が、アンケート管理テーブル１７１に書き込まれる。また、“悲しい”以外の感情（ムード）に対しても、同様なアンケートが行われ、情報が取得される。

なお、ユーザ側へのアンケートは、単に、“悲しい曲であるか”、“悲しくない曲であるか”を問う、二者択一のアンケートでも良いし、“普通”といった選択肢も含まれるアンケートでも良いし、さらには、“すごく悲しい”といったような選択肢も含まれるアンケートでも良い。すなわち、アンケートにおける選択肢の数に制限はなく、実施されたアンケートに応じたアンケート管理テーブル１７１が作成される。

また、同じような感情に対して、複数のアンケートを採るようにしても良い。例えば、“悲しい”という感情に対して“物悲しい”、“悲嘆”といったような類似する感情に対してもアンケートを採るようにしても良い。

このように、アンケート管理テーブル１７１は、ユーザに対して行われたアンケートの結果が記載され、管理されるテーブルである。

図９は、曲のメタデータである。図９に示したメタデータ１７２は、アイテムが曲であり、その曲に関する情報が記載されているデータである。図９に示したメタデータ１７２には、アイテムＮＯ、ジャンル、アーティスト、テンポ、ハーモニ、クラスタ、および、サブクラスタといった項目が設けられ、それぞれの項目に対応する情報が関連付けられて管理されている。

例えば、アイテムＩＤが“I-001”のジャンルは“Rock”であり、アーティストは“ABC”であり、テンポが“２４”であり、ハーモニが“Ａ”であり、クラスタが“１”であり、サブクラスタが“１”であることが関連付けられて記載されている。

アイテムＮＯ、ジャンル、アーティストといった情報は、人の手によりメタデータ１７２に書き込まれ、テンポやハーモニといった情報は、曲を解析することにより、人の手によらずに書き込まれるようにしても良い。また、クラスタやサブクラスタは、後述するクラスタの学習処理や付与処理の際に付加される情報である。

図８に示したアンケート管理テーブル１７１、または、図９に示したメタデータ１７２から、図１０に示したような数量化管理テーブル１７３が作成される。数量化管理テーブル１７３は、例えば、図８に示したような所定のパターン（図８においては、あるユーザが“悲しい曲”と設定した曲のパターン）が得られる情報から作成される。

図９に示したメタデータ１７２から数量化管理テーブル１７３が作成される場合、例えば、“悲しい曲”に分類された複数の曲のメタデータ１７２を解析し、その解析結果から、所定のパターン（例えば、スピードの分布などを解析しパターンを抽出する）を生成し、そのパターンが用いられて数量化管理テーブル１７３が作成される。

数量化管理テーブル１７３には、曲毎に、次元毎の値が記載されている。すなわち、数量化管理テーブル１７３には、図８に示したようなテーブルからパターンを読みとり、数量化することにより、この場合、所定の曲を数次元の情報で表したときの情報が記載される。図１０に示した例では、“曲１”の次元１の値は“0.12”、次元２の値は“0.34”、次元３の値は“0.62”と記載されている。

なお、次元は、何次元でも良い。次元は、処理の仕方（どのような方法により数値化するか）により決定され、後述するクラスタに分けるときの処理に必要な次元に決定される。数量化管理テーブル１７３は、後述するように、クラスタを決定する際の処理に用いられる。

［クラスタ（サブクラスタ）の学習処理について］
このようなデータを用いた処理について説明する。まず、学習部５１のクラスタ学習部５２（図４）が行う処理について、図１１のフローチャートを参照して説明する。ステップＳ１１において、クラスタ学習部５２の楽曲データ取得部７１は、楽曲データを取得する。楽曲データは、データベース５４（図３）に記憶され、その記憶されている楽曲データが取得されるようにしても良いし、ネットワーク１（図１）を介して他のサーバ（不図示）から取得されるようにしても良い。

なお、楽曲データとは、曲そのもののデータであり、例えば、ＷＡＶ形式のデータである。

ステップＳ１２において、特徴量解析部７３は、楽曲データ取得部７１により取得された楽曲データを解析することにより、その曲の特徴量を抽出する。抽出される特徴量は、例えば、メタデータ１７２（図９）に記載されている情報（テンポやハーモニといった情報）である。

ここでは、楽曲データ取得部７１により楽曲データが取得され、特徴量解析部７３により取得された楽曲データが解析され、特徴量が抽出されるとして説明をしたが、このような取得、解析、抽出といった処理を行わずに、データベース５４にメタデータ１７２が記憶されている場合には、そのメタデータ１７２が取得されるようにしても良い。換言すれは、ステップＳ１１の処理とステップＳ１２の処理の代わりに、データベース５４からメタデータ１７２を取得するという処理が行われるようにしても良い。

ステップＳ１３において、ユーザデータ取得部７２は、ユーザデータを取得する。ステップＳ１３において取得される情報は、ユーザからのアンケートの結果である。ユーザからのアンケートの結果が、ステップＳ１３において取得される場合、例えば、事前に、紙媒体で実施したアンケートの結果として取得されたり、ネット上で実施されたアンケートの結果が集計されたりすることにより取得される。このように、アンケート結果が取得される場合、図８に示したようなアンケート管理テーブル１７１が作成される。

アンケートとしては、例えば、１００曲に対して、１００人の人に対して、「この曲は、“悲しい”、“悲しくない”のどちらか？」といったような内容のアンケートである。すなわち、この場合、所定の曲数に対して、所定のユーザ数から、所定のムード（感情）に属する曲の回答が、情報として取得される。そして、図８に示したようなアンケート管理テーブル１７１が作成される。

このようにして、ステップＳ１３においてユーザからの情報（ユーザデータ）が取得される。ステップＳ１３において取得される情報は、上述したように、アンケートの結果であり、ユーザの嗜好や価値観に依存している情報である。

なお、ここでは、ステップＳ１３の処理として、ユーザデータが取得され、解析され、アンケート管理テーブル１７１が作成されるとしたが、クラスタの学習処理の１処理（１ステップ）として行われなくても、他の時点で（学習処理が行われる前の時点で）、このような処理が実行され、アンケート管理テーブル１７１が作成されるようにしても良い。そして作成されたアンケート管理テーブル１７１は、データベース５４に記憶され、ステップＳ１３においては、データベース５４に記憶されているアンケート管理テーブル１７１が取得される処理が実行されるようにしても良い。

ステップＳ１４において、非該当フィルタ生成部７４は、非該当フィルタを生成する。図１２のフローチャートを参照し、ステップＳ１４における非該当フィルタ生成処理について説明する。

ステップＳ２１において、ステップＳ１３（図１１）において取得されたユーザデータ（アンケート管理テーブル１７１）が参照され、処理対象とされている曲（例えば、曲１）が、全てのユーザが、処理対象としているムード（例えば、“悲しい”）に該当しないと判断した曲であるか否かが判断される。

非該当フィルタは、上述したように、クラスタが付与されるときに、クラスタを付与しなくて良いメタデータを排除するためのフィルタである。例えば、“悲しい”というムードのときには、絶対に提供されない曲などは、“悲しい”というムードに関連付けられたクラスタが付与されることはなく、“悲しい”というムードに関連付けられたクラスタが付与される処理が実行されるときには、排除しても良い曲（その曲のメタデータ）である。そのような排除しても良い曲が排除されるようにし、クラスタを付与すべきメタデータを抽出する処理を実行するためのフィルタが、非該当フィルタである。

非該当フィルタは、このようなフィルタであるため、確実に該当しないであろう曲（メタデータ）を排除できるようなフィルタであることが好ましい。換言すれば、例えば、“悲しい曲”と思う人が１人でもいるような曲は、非該当フィルタによる処理で排除されないようにすることが好ましい。ただし、ここまでの性能が必要であるかは、設計の段階で、適宜変更することが可能である。

また、非該当フィルタを用いることにより、確実に該当しないであろう曲を排除することができ、後述するように、例えば、所定の曲（アイテム）にサブクラスタを付与するときに、付与の対象とする曲数を減らすことができ、多くの曲を処理するときなどに、効率良く処理できるようになるため、非該当フィルタを設けることは有効である。

しかしながら、例えば、確実に該当しないであろう曲自体が少ない場合、すなわち、排除対象とされる曲自体の数が少ない場合、非該当フィルタを設けても、排除される曲が少ないため、非該当フィルタを設けることによる効果が低いと考えられるようなときには、非該当フィルタを設けないようにしても良い。すなわち、設計の段階などで、所定のムードに関しては、非該当フィルタを設けないと設定するようにすることも可能である。

ステップＳ２１における処理は、特徴量解析部７３により取得されたユーザデータ（アンケート管理テーブル１７１）が参照されて行われる。アンケート管理テーブル１７１には、図８を参照して説明したように、所定のムード（図８では“悲しい”というムード）に関して、所定の曲が、その所定のムードに該当するか否かのユーザの判断結果が、記載されている。

例えば、図８に示したアンケート管理テーブル１７１を参照するに、“曲１”は、“ユーザＡ”と“ユーザＢ”が悲しい曲として投票していることがわかる。また“曲２”に関しては、ユーザＡ，Ｂ，Ｃともに、悲しい曲としては投票していないことがわかる。ここでは、ユーザＡ，Ｂ，Ｃの投票結果しか示していないが、仮に、“曲２”に関しては、全てのユーザが“悲しい曲”としては投票していないとする。そのような曲は、悲しいというムードのときに提供されることは絶対にないと判断できる曲である。

非該当フィルタ生成部７４は、このような全てのユーザが、所定のムード（処理対象とされているムード）には該当しないとした曲が抽出される。この場合、“曲２”が抽出される。なお、ここでは、“全てのユーザ”としたが、上記したように、フィルタの精度は、適宜変更可能であり、例えば、“全てのユーザ”ではなく、“調査対象としたユーザ数の５％以下のユーザ”が、所定のムードには該当しないとした曲が抽出されるようにしても良い。

ステップＳ２１において、処理対象とされた曲は、全てのユーザが該当しないと判断した曲ではないと判断された場合、ステップＳ２２に処理が進められ、アンケート管理テーブル１７１に記載されている次の曲が処理対象の曲に設定される。そして、ステップＳ２１以下の処理が繰り返される。

一方、ステップＳ２１において、処理対象とされた曲は、全てのユーザが該当しないと判断した曲であると判断された場合、ステップＳ２３に処理が進められ、その曲の特徴量が一旦記憶（蓄積）される。非該当フィルタ生成部７４には、特徴量解析部７３から、曲の特徴量が供給される。この供給される特徴量は、処理対象とされている曲の特徴量である。

ステップＳ２４において、アンケート管理テーブル１７１に記載されている全ての曲（処理対象とされているムードに関する全ての曲）を調べたか否かが判断される。ステップＳ２４において、全曲調べてはいないと判断された場合、ステップＳ２２に処理が進められ、次の曲に処理対象の曲が設定される。そして、ステップＳ２１以下の処理が繰り返される。

一方、ステップＳ２４において、全曲調べたと判断された場合、ステップＳ２５に処理が進められる。ステップＳ２５において、蓄積されている特徴量からさらに特徴量が抽出される。ステップＳ２１乃至Ｓ２４の処理が繰り返されることにより、所定のムードには該当しない曲の特徴量が蓄積されている。それらの曲に共通する特徴量が、ステップＳ２５の処理として抽出される。

ステップＳ２５において抽出された特徴量は、ステップＳ２６において、非該当フィルタのデータとして、データベース５４に記憶される。

このようにして、所定のムードに対しての非該当フィルタが生成される。このような処理が繰り返されることにより、複数のムード毎に、非該当フィルタが生成される。

図１１のフローチャートの説明に戻り、ステップＳ１４において、上記したような非該当フィルタ生成処理が実行されているとともに、ステップＳ１５において、多変量解析部７５により多変量解析の処理が実行される。

例えば、図８に示したようなアンケート管理テーブル１７１に記載されている情報に対して、多変量解析が実行されることにより、図１０に示したような数量化管理テーブル１７３が作成される。すなわち、図８に示したようなアンケート管理テーブル１７１の回答パターンから、対応分析や主成分分析などの多変量解析により、ユーザの感情（ムード）に基づく曲毎の特徴が、数次元のデータに数量化される。

曲の情報を多次元の数量化されたデータとして管理しているのが、図１０に示した数量化管理テーブル１７３である。このような数量化管理テーブル１７３が、ステップＳ１５において作成される。

ステップＳ１５において、数量化管理テーブル１７３に記載されている情報（数値）が、マッピングされる。例えば、図１０に示した数量化管理テーブル１７３のうち次元１と次元２の欄に記載されている数値をマッピングすることを考える。次元１を例えばＸ軸、次元２を例えばＹ軸に対応させることにより、Ｘ軸とＹ軸の２軸からなる２次元に、数量化管理テーブル１５３に記載されている各曲の特徴（情報）をマッピングすることができる。このようなマッピングが行われると、例えば、図１３に示したようなグラフを取得することができる。

図１３に示したグラフは、図１０に示したような数量化管理テーブル１７３に記載されている曲を、曲毎に、次元１と次元２の数値を用いて、マッピングした一例である。マッピングは、数量化管理テーブル１７３に記載されている曲数分（例えば、１００曲分（非該当フィルタの生成の元になった曲は除外された曲数分））に対して行われる。このような処理が行われるため、多変量変換を行うときの次元は、何次元にマッピングし、後述する処理が実行されるかにより決定されればよい。例えば、２次元にマッピングされ、後述する処理が実行される場合には、多変量変換は２次元のデータに数量化されればよい。

図１３に示したようなグラフが作成されると、ステップＳ１７（図１１）において、クラスタが決定される。クラスタは、例えば、図１３に示したグラフを解析し、まとまりのある部分（点が集中している部分など）毎に分割し、その分割された領域をクラスタ１、クラスタ２などと順次割り当てることにより、クラスタが決定される。

クラスタリングは、例えば、k-meansや階層などの手法により行われる。

クラスタリングが行われることにより、例えば、図１３に示したグラフから、図１４に示したような結果が取得される。図１４に示した結果は、サブクラスタ１乃至５の５つのサブクラスタに分類されたときの状態を示している。各サブクラスタは、重なりがない状態で設定されている。このように、各サブクラスタに重なりがないように設定することにより、１つのアイテムに対して１つのサブクラスタを割り当てることが可能となる。

各サブクラスタに重なりがあっても良いように設定することも可能である。ソフトクラスタリング手法などと称されるクラスタリング手法を用いてクラスタリングを行った場合、サブクラスタに重なりが生じることがある。サブクラスタに重なりがあるような場合、例えば、サブクラスタ１が９０％、サブクラスタ２が１０％といったように、１つのアイテムに対して、複数のサブクラスタと占める割合が割り当てられる。

また、サブクラスタに重なりがあるようにした場合に、各サブクラスタの値を合計したときに、必ずしも１００％になる必要性はない。例えば、サブクラスタ１が８０％、サブクラスタ２が３０％であっても良い。

本実施の形態においては、後述するように、所定のアイテムを所定のクラスタとそのクラスタにおけるサブクラスタに分類できれば良く、例えば、クラスタリングの結果、所定のクラスタに属し、そのクラスタにおけるサブクラスタ１が８０％、サブクラスタ２が３０％と算出された場合、そしてそのような重なりのあるサブクラスタに所定のアイテムが分類されるようなとき、パーセンテージの高い、サブクラスタ１に分類されると決定されるようにすればよい。よって、このサブクラスタに重なりがあるようにサブクラスタが導き出されるようにしても（ソフトクラスタリングの手法が用いられるようにしても）、サブクラスタに重なりがないような手法にしても、後述するアイテムの分類（サブクラスタの付与の処理）は行えるため、どちらの手法を用いても良い。

すなわち、所定のアイテムが、所定のサブクラスタに属すると分類されるとき、そのサブクラスタで確からしいという確率（帰属度）が求められれば良い。ここでは、図１４に示したように、各サブクラスタには重なりがないとして説明を続ける。

ここでは、図１４に示したように、各サブクラスタには重なりがないとして説明を続ける。

ここで、クラスタとサブクラスタについて、説明を加える。上記したような処理が行われることにより、ここでは、サブクラスタ１乃至５が生成されるとした。このサブクラスタ１乃至５は、もともと、１つのムードに対して処理が行われた結果、生成されたサブクラスタである。換言すれば、この場合、“悲しい”というムードに対して、“悲しい”という曲に該当する曲をクラスタリングすることにより生成されたサブクラスタである。

ここで、例えば、“悲しい”というムードに、サブクラスタの上位階層であるクラスタの“クラスタ１”を割り当てると、このクラスタ１という“悲しい”というムードに対して、サブクラスタ１乃至５のサブクラスタが存在することになる。このように、所定のムードを識別するためのクラスタを“クラスタ”とし、そのクラスタに属する複数のクラスタを“サブクラスタ”とする。この場合、“悲しい”というムードがクラスタ１であり、そのクラスタ１に属するサブクラスタは、サブクラスタ１乃至５ということである。

ステップＳ１７（図１１）の処理で決定されるクラスタは、処理対象とされているムードに、他のムードに割り振られていないクラスタを割り当て、マッピングの処理の結果得られるクラスタを、サブクラスタとして割り当てる処理である。

このようにして、所定の情報からサブクラスタが導き出されると、ステップＳ１８（図１１）において、導き出されたサブクラスタが記憶される。

上記したように、例えば、ステップＳ１３において、ユーザデータが取得される際、図８に示したようなアンケート管理テーブル１７１が取得される。このアンケート管理テーブル１７１は、曲１、曲２といった曲毎に、情報が管理されている。

各曲にはメタデータが付随している。メタデータは、図９に示したようなメタデータ１７２のように、アイテムＮＯ、ジャンル、アーティスト、テンポ、ハーモニ、クラスタ、サブクラスタといった項目に対する情報が関連付けられたテーブルである。このような項目のうち、クラスタとサブクラスタ以外の項目、すなわち、アイテムＮＯ、ジャンル、アーティスト、テンポ、ハーモニは、事前に、曲のメタデータとして付与されている情報である（各曲のメタデータは、これらの項目に対する情報が記載された状態で、データベース５４に記憶されている）。

クラスタの決定の処理のために用いられた曲（アイテム）のメタデータは、クラスタという項目に対する情報が記載されていない状態である。そこで、ステップＳ１８において、ステップＳ１１以降の処理対象とされた曲（アイテム）に対応するメタデータのクラスタとサブクラスタという項目の欄に、対応するクラスタとサブクラスタが書き込まれる。

このように、クラスタの学習の処理に用いられた曲のメタデータには、学習の結果得られたクラスタとサブクラスタが設定され、メタデータのクラスタとサブクラスタの欄にそれぞれ書き込まれる。

例えば、図９に示したメタデータ１７２のアイテムＮＯが“１−００１”という曲に対しては、クラスタとして“１”が割り当てられ、サブクラスタとして“２”が割り当てられ、それぞれ値が記載された状態を示している。またアイテムＮＯが“１−００２”という曲に対しては、クラスタとして“１”が割り当てられ、サブクラスタとして“３”が割り当てられ、それぞれの値が記載された状態を示している。

このように、アイテムＮＯが“１−００１”という曲と“１−００２”という曲は、共にクラスタとしては“１”という共通の分類がされている。よって、同じムードに属する曲である。しかしながら、サブクラスタは、“１−００１”という曲は“２”であり、“１−００２”という曲は“３”であり、それぞれ異なる分類がされている。よって、サブクラスまで考慮すると、同じムードに属する曲であっても、違う分類がされていることになる。

なおここでは、クラスタとその下のサブクラスタがあるとして説明を続けるが、サブクラスタの下に、さらにサブクラスを付けることも可能である。すなわち、１つのサブクラスタ（サブクラスタＡとする）に対して、上記したようなクラスタの学習の処理を実行すれば、サブクラスタＡに対して、複数のクラスタが生成されることになり、その生成されたクラスタをサブクラスタＡのサブクラスタとすることも可能である。このように、サブクラスタの下にサブクラスタを付けることにより、さらに細かい分類を行うことが可能となる。

図１１を参照して説明したクラスタの学習処理は、図４に示したクラスタ学習部５２による処理である。次に、図５に示したクラスタ学習部５２’が行うクラスタの学習処理について、図１５のフローチャートを参照して説明する。

図１５のフローチャートのうち、ステップＳ３１乃至３４の処理は、図１１のステップＳ１１乃至Ｓ１４の処理と同様であるので、その説明は省略する。すなわち、クラスタ学習部５２’（図５）においても、非該当フィルタは、上述したクラスタ学習部５２（図４）が行う処理と同様の処理で生成される。

ステップＳ３５において、メタデータ解析部８１は、メタデータを解析する。メタデータには、例えば、図９に示したメタデータ１７２のように、テンポなどの曲の特徴量が記載されている。そのような曲の特徴量は、特徴量解析部７３から取得される。特徴量解析部７３は、上記したように、楽曲データから特徴量を抽出するか、予めデータベース５４などに記憶されているメタデータ１７２を取得することにより特徴量を取得し、メタデータ解析部８１に供給する。

また、メタデータ解析部８１に供給される曲の特徴量は、非該当フィルタ生成部７４により、非該当であると判断された曲以外の曲に関する特徴量である。すなわち、メタデータ解析部８１は、所定のムードに該当すると判断された曲のメタデータを取得し、解析を行う。メタデータの解析とは、例えば、該当すると判断された曲には、どのような特徴があるかを調べるための処理である。

メタデータ解析部８１による解析結果は、多変量解析部７５に供給される。多変量解析部７５は、ステップＳ３６において、多変量解析を行う。ステップＳ３６以下の処理（多変量解析部７５とクラスタリング部７６で行われる処理）は、図１１のステップＳ１５以下の処理と同様であるので、その説明は省略する。

このように、図５に示したクラスタ学習部５２’においては、所定のムードに該当すると判断された曲のメタデータが解析されることにより、クラスタが生成される。このような場合も、クラスタと、サブクラスタが生成されることは、上述した場合と同様であり、サブクラスタを設けることによる効果も、同様に得ることができる。

さらにクラスタ（サブクラスタ）の他の学習について説明する。以下に説明するクラスタの学習の処理は、図４に示したクラスタ学習部５２により行われる。また、非該当フィルタの生成に関しては、上記した場合と同様であるので、その説明は省略する。

上記したクラスタの学習は、マッピングなどの処理を行うことにより、クラスタの学習を行う例である。ここでは、ユーザの支持率を用いてクラスタの学習を行う例をあげ、図１６のフローチャートを参照して説明する。ユーザの支持率とは、例えば、調査対象とされるムードにおいて、調査対象とされたユーザの数のうち、何人のユーザが調査対象とされたアイテム（以下、アイテムとして曲を例に挙げて説明する）を、調査対象とされたムードに該当すると判断したかを調べることにより行われる。例えば、調査対象とされるユーザの数が、１００人であり、曲１を“悲しい曲”と判断したのが、３人であった場合、曲１に対する支持率は、支持率３％と算出される。

また、クラスタは、処理対象とされるムードが決定された時点で、そのムードに対応する（関連付けられている、または、関連付ける）クラスタが割り当てられるため、以下の説明は、サブクラスタの学習の処理である。

ステップＳ５１において、調査対象となる曲（例えば、１００曲）に対して、支持率が算出される。この算出は、図８に示したアンケート管理テーブル１７１が参照されて行われる。すなわち、調査対象とするムードと調査対象とされる曲、設定された曲がそのムードに該当すると判断したユーザ数を算出することにより行われる。

ステップＳ５２において、所定の曲の支持率が、０乃至２０％未満であるか否かが判断される。ステップＳ５２において、支持率が、０乃至２０％未満であると判断された場合、ステップＳ５３において、処理対象とされている曲のサブクラスタが、サブクラスタ１と設定される。設定されたサブクラスタは、処理対象とされた曲のメタデータ内の１つの情報として記憶される。

一方、ステップＳ５２において、支持率が、０乃至２０％未満ではないと判断された場合、ステップＳ５４に処理が進められ、支持率が、２０乃至４０％未満であるか否かが判断される。ステップＳ５４において、支持率が、２０乃至４０％未満であると判断された場合、ステップＳ５５において、処理対象とされている曲のサブクラスタが、サブクラスタ２と設定される。設定されたサブクラスタは、処理対象とされた曲のメタデータ内の１つの情報として記憶される。

一方、ステップＳ５４において、支持率が、２０乃至４０％未満ではないと判断された場合、ステップＳ５６に処理が進められ、支持率が、４０乃至６０％未満であるか否かが判断される。ステップＳ５６において、支持率が、４０乃至６０％未満であると判断された場合、ステップＳ５７において、処理対象とされている曲のサブクラスタが、サブクラスタ３と設定される。設定されたサブクラスタは、処理対象とされた曲のメタデータ内の１つの情報として記憶される。

一方、ステップＳ５６において、支持率が、４０乃至６０％未満ではないと判断された場合、ステップＳ５８に処理が進められ、支持率が、６０乃至８０％未満であるか否かが判断される。ステップＳ５８において、支持率が、６０乃至８０％未満であると判断された場合、ステップＳ５９において、処理対象とされている曲のサブクラスタが、サブクラスタ４と設定される。設定されたサブクラスタは、処理対象とされた曲のメタデータ内の１つの情報として記憶される。

一方、ステップＳ５８において、支持率が、６０乃至８０％未満ではないと判断された場合、ステップＳ６０に処理が進められ、処理対象とされている曲のサブクラスタが、サブクラスタ５と設定される。設定されたサブクラスタは、処理対象とされた曲のメタデータ内の１つの情報として記憶される。

ステップＳ５２乃至Ｓ６０の処理が繰り返されることにより、曲毎にサブクラスタが付けられる。このように、ユーザの支持率を用いて、サブクラスタの学習を行うようにしても良い。このようにした場合も、ユーザの支持率を用いているため（この支持率自体、ユーザの購入履歴などから算出することが可能であり、ユーザからの情報を用いていることになる）、ユーザの嗜好を反映したサブクラスタの学習が行えることは、上記したマッピングなどの手法を用いて学習する場合と同様に言えることである。

［サブクラスタの再設定に関わる処理について］
上記したように、クラスタおよびサブクラスタが学習された結果、例えば、図１４のようにサブクラスタが分布しているようなグラフを作成することができる。図１４に示したサブクラスタの分布の例では、個々のサブクラスタに属するアイテム数を示していないが、個々のサブクラスタに属するアイテム数は、サブクラスタ毎に異なる。

所定のサブクラスタに含まれるアイテム数が、サブクラスタ毎に異なるため、例えば、サブクラスタ１には１００個のアイテムが含まれるが、サブクラスタ２には、５個のアイテムしか含まれていないなど、サブクラスタに含まれるアイテムの個数に開きが生じる可能性がある。他のサブクラスタと比較したとき、少ない個数のアイテムしか含まれないようなサブクラスタは、サブクラスタとして独立して設定するには適していない可能性がある。換言すれば、他のサブクラスタに含めてしまっても良い可能性があり、他のサブクラスタに含めた方がより適切なサブクラスタの設定である場合がある。

また、サブクラスタの数が多くなると、より詳細に分類されるという利点はあるが、上記したように、不適切に分類されたサブクラスタが含まれる可能性があるし、後述するようにアイテムをユーザに推薦するときの処理で多くのサブクラスタがあると適切な推薦ができなくなる可能性がある。例えば、詳細すぎて、ユーザ側にサブクラスタ毎の違いが分かりづらくなり、ユーザが異なるサブクラスタのアイテムを推薦して欲しいと所望し、異なるサブクラスタのアイテムが紹介されても、似たようなアイテムしか推薦されなくなるような可能性がある。

換言すれば、サブクラスタの数が多くなると、サブクラスタ毎の特徴がでなくなり、サブクラスタを設定し、アイテムを分類した意味合いが薄くなってしまう。

すなわち、サブクラスタの数は、後述するように新たなアイテムにサブクラスタを付与する場合や、アイテムをユーザに推薦する場合に、適切な処理をできる適切な数である方が好ましく、また、各サブクラスタの特徴が出るような数である方が好ましいと考えられる。そこで、上記したような処理により生成されたサブクラスタの数を、適切な数になるようにするための処理が行われるようにする。以下に、その処理について説明する。

図１７は、図１４と同じく、上記したようなサブクラスタの生成の処理が実行された結果、複数のアイテムが、複数のサブクラスタに分類されたときの、サブクラスタの分布と各サブクラスタに含まれるアイテム数を示す図である。図１７に示した例は、サブクラスタ１乃至７という７個のサブクラスタが生成された例である。

サブクラスタ１には、８個のアイテムが含まれ、サブクラスタ２には、６個のアイテムが含まれ、サブクラスタ３には、３個のアイテムが含まれ、サブクラスタ４には、５個のアイテムが含まれ、サブクラスタ５には、３個のアイテムが含まれ、サブクラスタ６には、２個のアイテムが含まれ、サブクラスタ７には、２個のアイテムが含まれている。

ここで、サブクラスタ３、５、６、７（図１７中、点線で示したサブクラスタ）は、他のサブクラスタ（図中、実線で示したサブクラスタ）、例えば、サブクラスタ１と比べて含むアイテム数が少ない。このような含まれるアイテムの数が少ないサブクラスタを、他のサブクラスタと併合する、または、削除することにより、サブクラスタの数を適切な数に編集する。すなわちここでは、サブクラスタ３、５、６、７が、それぞれ、サブクラスタ１、２、４のいずれかのサブクラスタに併合されるか、または削除される。

含まれるアイテム数が少ないために、他のサブクラスタに併合するかまたは削除するかを判断するために、支持率という概念をここでは導入し、支持率が高いときには、併合されないようにし、支持率が低いときには、併合されるようにする。

また、本実施の形態においては、含まれるアイテム数が少ないために他のサブクラスタに併合されるときには、併合されるサブクラスタ同士の特徴が類似しているようにする。併合されるサブクラスタ同士の特徴が類似しているようにするために、サブクラスタ同士の距離という概念を導入し、距離が近いサブクラスタに併合されるようにする。

まず、支持率について説明を加える。なお、図１６を参照して説明した、サブクラスタの他の学習処理における“支持率”と、以下に説明する“支持率”は異なる支持率を示す（異なる数値）ものである。

図１８は、図８に示した、所定のモードに関して、所定の曲に関するユーザの統計を示すアンケート管理テーブル１７１を、支持率を算出するためのテーブルに書き直したテーブルである。図１８に示したテーブルも、ユーザからのアンケート結果に基づき作成されるので、アンケート管理テーブル１７１’と記述する。

図１８に示したアンケート管理テーブル１７１’においては、縦軸にユーザ名、横軸にアイテム（この場合、曲）を示し、所定の曲が、“悲しい”というモードに適合するか否かをユーザが判断した結果を示している。例えば、曲１に対し、ユーザＡは、悲しいと判断し（図１８においては、○で表記）、ユーザＢは、悲しくないと判断し（図１８においては、×で表記）、ユーザＣは、悲しいと判断し、ユーザＤは、悲しいと判断し、ユーザＥは、悲しいと判断したことが示されている。また、その結果、曲１に対して悲しいと判断したユーザの総数は“４”であり、比率は“０．８０”（＝４／５）であることが示されている。

このように、アンケート管理テーブル１７１’では、所定のモード（図１８に示した例においては“悲しい”というモード）において、何人のユーザが、処理対象とされたアイテム（曲）を、その所定のモードに合致していると判断したかの総数と、比率が管理される。

このようなアンケート管理テーブル１７１’で管理されているデータ（図８に示したアンケート管理テーブル１７１で管理されているデータ）に基づき、サブクラスタを学習する処理が実行された結果、図１７に示したようにサブクラスタが分布し、アイテム（曲）が含まれる場合を例に挙げて説明を続ける。

図１７を参照して説明したように、図１７に示したサブクラスタのうち、サブクラスタ３、５、６、７は、他のサブクラスタに併合されるかまたは削除されるサブクラスタとして決定されたサブクラスタである。このうち、サブクラスタ３とサブクラスタ６を例に挙げて、以下の説明を続ける。

図１９は、サブクラスタ３に含まれる曲とサブクラスタ６に含まれる曲を示した図である。サブクラスタ３には、曲４、曲５、曲６が含まれ、サブクラスタ６には、曲１と曲２が含まれる。サブクラスタ３に含まれる曲４、５、６の比率は、それぞれ“０．２０”、“０．２０”、“０．２０”、である。また、サブクラスタ６に含まれる曲１と曲２の比率は、それぞれ“０．８０”、“１．００”である。

支持率は、サブクラスタに含まれる曲毎の比率を用いて算出される。ここでは、支持率は、所定の曲の比率に関するデータを用いて、次式（１）に基づいて算出されるとする。
支持率＝Σ（Ｎ_i／ｉ）・・・（１）

この式（１）において、“ｉ”は、サブクラスタのメンバー数を表し、Ｎ_iは、アイテムの合致評価数を表す。“サブクラスタのメンバー数”とは、所定のアイテムを評価したユーザの数であり、例えば、図１８においては、ユーザＡ乃至Ｅの５人である。また、“アイテムの合致評価数”とは、何人のユーザが、所定のアイテムに対して、所定のモードが合致すると答えたかを表す数であり、例えば、図１８において、“曲１”に対して、“悲しい”というモードが合致すると答えたユーザは、４人であるので、アイテムの合致評価数は４となる。

よって、（Ｎ_i／ｉ）は、合致評価数をユーザの数で除算した結果であるので、“比率”になる。例えば、図１８において、“曲１”の“Ｎ_i”は４、“ｉ”は、５となるので、（Ｎ_i／ｉ）は“０．８”と算出される。すなわち、この“０．８”は、比率である。よって、式（１）は、比率の総和を算出する式である。

式（１）は、処理対象とされているサブクラスタに含まれるアイテムの比率の総和を求める式であり、その算出結果が、支持率とされる。

ここで、式（１）に基づき、サブクラスタ３とサブクラスタ６の支持率をそれぞれ求める。サブクラスタ３とサブクラスタ６に、それぞれ含まれるアイテム（この場合、曲）と、そのアイテムの比率は、図１９に示すとおりである。
サブクラスタ３の支持率＝０．２０＋０．２０＋０．２０＝０．６０
サブクラスタ６の支持率＝０．８０＋１．００＝１．８０

このように、サブクラスタ３は、含まれるアイテム数が、サブクラスタ６より多いが、支持率は、サブクラスタ６の支持率よりも低い値となる。

上記したように、サブクラスタ３とサブクラスタ６は、含まれるアイテム数が所定の数以下であるので、削除または他のサブクラスタと併合する対象とされているサブクラスタである。削除または併合の対象とされているサブクラスタを、削除するか否かを決定する条件として、対象とされているサブクラスタの支持率が所定の値以下である場合、そのサブクラスタを削除し、支持率が所定の値以上である場合、そのサブクラスタを他のサブクラスタと併合するという条件をここでは適用する。

所定の値として、例えば“１．００”が設定された場合、支持率が“０．６０”のサブクラスタ３は削除され、支持率が“１．８０”のサブクラスタ６は、削除されずに他のサブクラスタに併合されることになる。

このような設定のもと、サブクラスタの削除と併合が行われる場合、削除または併合の対象とされているサブクラスタ３，５，６，７のうち、サブクラスタ３とサブクラスタ７は、支持率が所定の値以下となるため削除対象とされ、サブクラスタ５とサブクラスタ６は、支持率が所定の値以上となるため、併合対象とされる。このようなときに、削除と併合が行われた後の結果を示すと、図２０に示したようなサブクラスタの分布となる。すなわち、図１７に示したサブクラスタの分布は、図２０に示したようなサブクラスタの分布に再編集される。

図２０に示したサブクラスタの分布においては、サブクラスタ１に、サブクラスタ５とサブクラスタ６が併合されため、サブクラスタ５とサブクラスタ６は存在していない。また、サブクラスタ３とサブクラスタ７は、削除されため、図２０に示したサブクラスタの分布においては存在していない。

また、サブクラスタ１に、サブクラスタ５とサブクラスタ６が併合されたため、サブクラスタ１内のアイテムの数は、８個から１３個に増加している。

また、サブクラスタの削除と併合が行われた後には、図２０に示したように、サブクラスタ１、サブクラスタ２、およびサブクラスタ４という３つのサブクラスタが残っている状態となる。このような状態になった後、サブクラスタ４をサブクラスタ３と変更しても良い（以下、適宜、サブクラスタ３などの“３”といった番号をサブクラスタ番号と記述する）。すなわち、サブクラスタ番号に、空き番がないように、サブクラスタ番号が再編集されるようにしても良い。

このような処理が実行されるときの、クラスタ学習部５２のクラスタリグ部７６（図４または図５）の機能ブロック図を図２１に示す。なお、図２１に示す機能は、クラスタリング部７６が備えるようにしても良いし（以下の説明ではそのように説明する）、クラスタリング部７６からの結果が供給される他の部分で行われる（例えば、図４のクラスタリング部７６からの供給を受けて処理を実行する部分が追加された構成とされる）ようにしても良い。

図２１に示したクラスタリング部７６は、アイテム数判断部２０１、処理対象判断部２０２、支持率算出部２０３、併合対象判断部２０４、併合先決定部２０５、および再サブクラスタ設定部２０６を含む構成とされている。

アイテム数判断部２０１は、例えば図１１に示したフローチャートの処理が実行された結果、サブクラスタが図１７に示したように決定された後の結果を用いて、処理対象とされるサブクラスタ内に含まれるアイテムの数を判断する機能である。例えば、図１７のサブクラスタ３が処理対象とされているときには、アイテム数判断部２０１は、サブクラスタ３に含まれるアイテム数は３個であると判断する。

処理対象判断部２０２は、アイテム数判断部２０１により、判断されたアイテム数と所定の値（閾値）を比較し、閾値以下である場合、削除または併合の処理を行う対象となるサブクラスタであると判断し、後段の処理が実行されるサブクラスタとして設定し、閾値以上である場合、そのまま残すサブクラスタであるとして設定する。

支持率算出部２０３は、処理対象とされたサブクラスタの支持率を、上記したようにして算出する。支持率算出部２０３は、例えば、処理対象とされたサブクラスタが、図１９に示したサブクラスタ３である場合、支持率を０．８０と算出する。

併合対象判断部２０４は、支持率算出部２０３により算出された支持率と設定されている所定の値を比較し、処理対象とされたサブクラスタを削除するか、他のサブクラスタと併合するかを判断する。

併合先決定部２０５は、併合対象判断部２０４により併合対象であると判断されたサブクラスタを、どのサブクラスタと併合するかを決定する。併合対象決定部２０５は、併合するサブクラスタとセントロイド距離が最短となるサブクラスタを判断し、最短となるサブクラスタを併合先のサブクラスタとして決定する。

再サブクラスタ設定部２０６は、併合対象判断部２０４により削除対象と判断されたサブクラスタを、既に作成されているサブクラスタの分布から削除し、併合先決定部２０５により併合先が決定されたサブクラスタを併合先とされたサブクラスタと併合することにより、一度作成されたサブクラスタを編集し直す。

このような機能を有するクラスタリング部７６の動作について、図２２のフローチャートを参照して説明する。

ステップＳ７１において、アイテム数判断部２０１は、クラスタリングされた結果を取得する。すなわち、ステップＳ７１の処理は、既にクラスタリングされ、例えば、図１７に示すように複数のサブクラスタが設定されている状態のときに行われ、その設定されているサブクラスタの情報が、取得される。

そして、アイテム数判断部２０１は、取得したクラスタリングの結果を参照し、所定のサブクラスタを処理対象とし、そのサブクラスタに含まれるアイテム数を判断し、処理対象判断部２０２に、その判断結果を供給する。

ステップＳ７２において、処理対象判断部２０２は、アイテム数判断部２０１から供給されたアイテム数が、所定の閾値以下であるか否かを判断することで、その時点で処理対象とされているサブクラスタを、削除または併合の処理を実行する対象とするサブクラスタに設定するか否かを判断する。

ステップＳ７２において、処理対象とされているサブクラスタに含まれるアイテム数が、所定の閾値以上であると判断された場合、ステップＳ７３に処理が進められ、そのサブクラスタは、そのまま残すサブクラスタとして設定される。例えば、上述したように、図１７に示したクラスタリングの結果のうち、サブクラスタ１が処理対象とされ、所定の閾値が３であるような場合、サブクラスタ１に含まれるアイテム数は８であるので、閾値以上であると判断され、サブクラスタ１はそのまま残すサブクラスタであるとして設定される。

一方、ステップＳ７２において、処理対象とされているサブクラスタに含まれるアイテム数が、所定の閾値以下であると判断された場合、ステップＳ７４に処理が進められ、支持率が算出される。処理対象判断部２０２により、アイテム数が所定の閾値以下であると判断された場合、削除または併合の処理が行われる対象とされるサブクラスタとして設定されたことになり、そのサブクラスタの情報が、支持率算出部２０３に供給され、支持率が算出される。

支持率の算出の仕方については、例えば、図１８や図１９を参照して説明したように、サブクラスタに含まれるアイテムの比率の総和を算出することにより行われる。支持率算出部２０３により算出された支持率は、併合対象判断部２０４に供給される。

ステップＳ７５において、併合対象判断部２０４は、支持率と所定の閾値を比較し、支持率が閾値以下であるか否かを判断する。ステップＳ７５において、支持率が閾値以下であると判断された場合、ステップＳ７６に処理が進められ、処理対象とされているサブクラスタが、削除対象のサブクラスタとして設定される。一方、ステップＳ７５において、支持率が閾値以上であると判断された場合、ステップＳ７７に処理が進められ、処理対象とされているサブクラスタが、併合対象のサブクラスとして設定される。

ステップＳ７７において、処理対象とされているサブクラスタが、他のサブクラスタと併合するとして設定された場合、ステップＳ７８において、併合先のサブクラスタが決定される。併合先のサブクラスタは、処理対象とされているサブクラスタのセントロイドからの距離が最も短いサブクラスタであり、かつ、削除対象や併合対象とされていないサブクラスタ（ステップＳ７３において、そのまま残すとサブクラスタとして設定されたサブクラスタ）が、併合先のサブクラスタとして決定される。決定された併合先のサブクラスタの情報と、併合するサブクラスタの情報は、再サブクラスタ設定部２０６に供給される。

例えば、図１７に示したサブクラスタの分布において、サブクラスタ６が他のサブクラスタと併合すると設定された場合、サブクラスタ６とセントロイドの距離が近いサブクラスタ１が併合先のサブクラスタとして決定される。そして、併合するサブクラスタの情報として、サブクラスタ６の情報が再サブクラスタ設定部２０６に供給され、併合先のサブクラスタの情報として、サブクラスタ１の情報が、再サブクラスタ設定部２０６に供給される。

ステップＳ７９において、再サブクラスタ設定部２０６は、削除対象とされたサブクラスタを削除し、併合対象とされたサブクラスタを併合先のサブクラスタと併合するといった、サブクラスタの再編集を実行する。この際、削除や併合されることにより割り当てられなくなったサブクラスタ番号を、存在しているサブクラスタのサブクラスタ番号と入れ換えるといった処理が行われ、サブクラスタ番号の編集も行われるようにしても良い。

このようにして、例えば、図１７に示したようなサブクラスタの分布は、図２０に示したようなサブクラスタの分布に編集される。このようにサブクラスタが編集されることにより、サブクラスタとして設定するにはふさわしくないサブクラスタを排除することができ、適切なサブクラスタの設定が行えるようになる。

上述したような処理が行われることにより、適切なサブクラスタを設定することができるが、その結果、例えば、サブクラスタの数が少なくなりすぎると、極端の例であるが、サブクラスタが１つになってしまうと、クラスタ＝サブクラスタとなってしまい、サブクラスタを設けたことによる効果が低くなってしまう。換言すれば、サブクラスタの数が少ないと、サブクラスタ毎の特徴が出にくくなってしまう可能性がある。また、サブクラスタの数が多くても、サブクラスタ毎の違いが小さいものとなり、結果としてサブクラスタ毎の特徴が出にくくなってしまう可能性がある。

そこで、サブクラスタの数が、サブクラスタ毎の特徴が明確になるぐらいの数であり、かつ、数が多すぎるために処理がしづらくなるといったような不都合が発生しづらい数になるように、すなわち、適切な数にまとまるように処理が行われるようにしても良い。

適切な数にまとまるようにするために、例えば、ステップＳ７２において、サブクラスタに含まれるアイテム数が閾値と比較されるが、編集の結果、サブクラスタの数が少なくなりすぎないように、または多くなりすぎないように、その閾値を可変値とし、適宜変更されるようにしても良い。すなわち、閾値を可変とし、調整することで、そのまま残すサブクラスタの数を調整することができる。

また、ステップＳ７５において、支持率が閾値以下であるか否かが判断されるが、編集の結果、サブクラスタの数が少なくなりすぎないように、または多くなりすぎないように、その閾値を可変値とし、適宜変更されるようにしても良い。すなわち、閾値を可変とし、調整することで、削除されるサブクラスタの数を調整することができる。

また、以下に説明するように、クラスタリングの手法を変えるようにしても良い。クラスタリングの手法としては、上記したように、k-meansや階層などの手法などがあり、複数のクラスタリングの手法が存在する。そこで、予め複数のクラスタリングの手法毎に、サブクラスタを求め、その結果を比較、検討することにより、適切なサブクラスタの数（分布）となる手法を適用するようにしても良い。

ここでは、図１８に示した結果が用いられ、クラスタリングされるとする。そして、そのクラスタリングの結果、一度サブクラスタが決定されたが、その後、上記したようなサブクラスタリングの削除や併合が行われ、その結果、図２３に示すような結果が得られたとして説明を続ける。

図２３は、クラスタリングの手法として、手法Ｘ、手法Ｙ、手法Ｚのそれぞれの手法で、クラスタリングを行い、削除や併合といった処理を行った結果を示している。すなわち、図２３においては、クラスタリングの手法、曲１乃至６、分類先のサブクラスタがそれぞれ関連付けられている。

図２３に示した表によれば、曲１と曲２は、それぞれ、手法Ｘ、手法Ｙ、および手法Ｚの全ての手法で“サブクラスタ１”に分類されている。曲３は、手法Ｘだと“サブクラスタ２”に分類され、手法Ｙまたは手法Ｚだと“サブクラスタ１”に分類される。曲４は、手法Ｘだと“サブクラスタ３”に分類され、手法Ｙまたは手法Ｚだと“サブクラスタ２”に分類される。曲５は、手法Ｘまたは手法Ｙだと“サブクラスタ３”に分類され、手法Ｚだと“サブクラスタ２”に分類される。曲６は、手法Ｘだと“サブクラスタ３”に分類され、手法Ｙまたは手法Ｚだと“サブクラスタ２”に分類される。

このように、曲１乃至６が、それぞれの手法Ｘ、手法Ｙ、または手法Ｚでクラスタリングされると、異なるサブクラスタに分類される可能性がある。このような結果を用いて、どのクラスタリングの手法が、そのモードに適しているかを判断する。

どのクラスタリングの手法にするかを決定するために、図２４に示すように、手法毎の支持率が算出される。支持率は、算出対象となる手法に含まれる所定のサブクラスタの比率の総和を、そのサブクラスタ数で除算した値とされる。例えば、手法Ｘにおけるサブクラスタ１の支持率は、以下のように算出される。

手法Ｘでクラスタリングされると、曲１と曲２がクラスタ１に分類される（図２３参照）。曲１と曲２の比率は、それぞれ“０．８０”と“１．００”である（図１８参照）。よって、手法Ｘにおけるサブクラスタ１における比率の総和は“１．８０”（＝０．８０＋１．００）である。この総和は、曲１と曲２という２つのアイテムの比率の総和であるので、この総和を２で除算し、“０．９０”という値が得られる。このようにして支持率が算出される。

同様に、手法Ｘにおけるサブクラスタ２の支持率を算出すると、以下のようになる。すなわち、手法Ｘでクラスタリングされたときにサブクラスタ２に分類されるのは、曲３だけであり、曲３の比率は“０．６０”であるので、０．６０／１＝０．６０と支持率が算出される。

さらに同様に、手法Ｘにおけるサブクラスタ３の支持率を算出すると、以下のようになる。すなわち、手法Ｘでクラスタリングされたときにサブクラスタ３に分類されるのは、曲４、曲５、曲６であり、曲４の比率は“０．２０”、曲５の比率は“０．２０”、曲６の比率は“０．２０”であるので、（０．２０＋０．２０＋０．２０）／３＝０．２０と支持率が算出される。

このようにして、手法毎に、またサブクラスタ毎に、支持率を算出すると、図２４に示したようになる。

ところで、良いクラスタリングの手法とは、その結果が分散している方が良い。そこで、図２４に示したような結果を用いて、手法毎の支持率の分散を算出し、その値が最も大きい手法を、適切な手法であるとして設定されるようにする。

支持率の分散は、以下の式（２）に基づいて算出される。式（２）における分散の値は、
σ² で表している。

式（２）において、ｎは、所定の手法でクラスタリングを実行し、サブクラスタの編集をしたときに、結果として得られたサブクラスタの数である。例えば、図２４において、手法Ｘでクラスタリングを実行したときに、結果として得られるのは、クラスタリング１乃至３の３個のサブクラスタであるので、ｎの値は“３”となる。

式（２）において、分子の括弧内の第１項は、所定の手法における支持率の平均値を示し、第２項は、各支持率を表す。すなわち、括弧内の演算が行われることにより、所定の手法における所定のサブクラスタの支持率が、その手法における支持率の平均値とどのくらいぶれているのかが算出される。式（２）における分子においては、括弧内の値の２乗の総和が算出され、その総和が算出される。その総和がｎで除算されることにより分散の値が求められる。

例えば、手法Ｘにおける支持率の平均値は、図２４を参照するに、
（０．９０＋０．６０＋０．２０）／３＝０．５６６
と算出される。よって、式（２）における括弧内の第１項の値は、“０．５７”とされる（四捨五入）。

そして、この支持率の平均値との差分の２乗が算出される、その総和が算出されることにより、式（２）の分子の値が算出される。すなわち、手法Ｘのときには、次式により式（２）の分子の値が算出される。
（０．５７−０．９０）²＋（０．５７−０．６０）²＋（０．５７−０．２０）²＝０．２４７

分母ｎは、“３”であるので、算出された“０．２４７”を“３”で除算し、“０．０８２”という値を得ることができる。この値が手法Ｘの分散の値である。

このような計算が手法Ｙと手法Ｚのそれぞれで、同様に行われることにより、手法Ｙの分散の値は“０．０８０”と求められ、手法Ｚの分散の値は“０．１１６”と求められる。まとめると以下のようになる。
手法Ｘ０．０８２
手法Ｙ０．０８０
手法Ｚ０．１１６

このうち、最も値が高いのは、手法Ｚの分散の値である。よってこの場合、手法Ｚが、クラスタリングの手法として適した手法であるとして適用される。

このようにして、複数のクラスタリングの手法から、最も適していると判断される１つの手法が選択され、設定される。このようにクラスタリングの手法自体が選択されることにより、より適切にサブクラスタを設定することが可能となる。また、適切なクラスタリング手法によりクラスタリングされた結果を利用することにより、より適切な処理、例えば、後述するアイテムの推薦の処理などを行うことが可能となる。

［クラスタ（サブクラスタ）の付与に関わる処理について］
このようにして、クラスタの学習が行われると、新たに追加されるメタデータ（クラスタやサブクラスタの情報がまだ記載されていないメタデータ）に対してクラスタやサブクラスタ（以下、クラスタとの記載には、特に断りの無い限り、サブクラスタを含むとする）を割り当てるための処理が実行される。このような処理は、学習部５１のクラスタ付与学習部５３（図６）により行われる。図２５のフローチャートを参照し、クラスタ付与に係わる処理について説明する。

ステップＳ８１において、メタデータ取得部１１１（図６）は、クラスタが付与されているメタデータを取得する。クラスタが付与されているメタデータは、クラスタ学習部５２（または、クラスタ学習部５２’）における処理が終了した時点で、データベース５４（図３）に記憶されている。すなわち、データベース５４には、クラスタが付与されているメタデータと、クラスタが付与されていないメタデータとが存在する。

ステップＳ８１においては、クラスタが付与されているメタデータが取得される。ステップＳ８２において、取得されたメタデータから、特徴量が抽出される。メタデータは、上記したように、クラスタ以外の項目に対する情報（以下、適宜、既存情報と記述する）は、記載されている状態で、データベース５４に記憶されている。

例えば、まず、クラスタ１が付与されているメタデータを抽出し、抽出された各メタデータから、既存情報が読み出される。クラスタは、上記したようにムード（ユーザの感情）などに基づいて分類された結果である。ユーザの感情などに基づいているため、クラスタ毎に特徴がある。すなわちこの場合、所定のクラスタ（例えば、クラスタ１）に属する曲（アイテム）には、一定の特徴があると考えられる。なおこのとき、サブクラスタも考慮し、同一のクラスタの同一のサブクラスタに属する曲が処理対象とされるようにしても良い。

そこで、ステップＳ８２において、所定のクラスタに属する曲のメタデータを抽出し、抽出されたメタデータから、既存情報を読み出し、読み出された既存情報を用いて、クラスタに属する曲の特徴量が算出される。算出されたクラスタの特徴量は、適宜データベース５４に記憶される。

ステップＳ８３において、アイテムメタデータ取得部１１４は、データベース５４に記憶されているメタデータのうち、クラスタが付与されていない（クラスタの情報が記載されていない）メタデータを読み出す。読み出されたメタデータは、非該当フィルタ１１３に供給される。非該当フィルタ１１３は、上述したクラスタの学習処理が実行されることにより生成されたフィルタである。

非該当フィルタ１１３は、その時点で、処理対象とされているムード（処理対象とされているクラスタ（サブクラスは含まない））に関して生成された非該当フィルタのデータを、データベース５４から読み出し、そのデータと、アイテムメタデータ取得部１１４からのデータが一致するか否かを判断することによりフィルタリングを行う。

すなわち、アイテムメタデータ取得部１１４からのアイテムが、所定のムードに該当するアイテムであるか否かが判断される。

ステップＳ８５において、ステップＳ８４のフィルタリングの処理が行われた結果、アイテムメタデータ取得部１１４からのアイテムは、サブクラスタを付与する対象となるアイテム（そのアイテムのメタデータ）であるか否かが判断される。ステップＳ８５において、サブクラスタを付与すべきメタデータではないと判断された場合、換言すれば、処理対象とされているムードには該当しないアイテムであると判断された場合、ステップＳ８５以下の処理を行う必要がないため、そのアイテムに対するサブクラスタの付与処理は終了される。

一方、ステップＳ８５において、サブクラスタを付与すべきメタデータであると判断された場合、ステップＳ８６に処理が進められる。この場合、所定のムードに該当すると判断された時点で、その所定のムードに割り振られたクラスタに決定されることになる。よって、クラスタは決定されたので、後の処理としてはサブクラスタを決定するための処理が行われる。

所定のムードに該当すると判断された時点で、その所定のムードに割り振られたクラスタに決定されると記載したが、そのような処理を行うために、例えば、図２６に示すようなムードクラスタ変換テーブル１９１が参照される。このムードクラスタ変換テーブル１９１は、クラスタ決定部１１５（図６）が保持している。

ムードクラスタ変換テーブル１９１は、図２６に示すように１つのムードと１つのクラスタが関連付けられた情報が記載されているテーブルである。ムードクラスタ変換テーブル１９１には、さらに他の情報も記載する（関連付ける）ようにしても良い。

例えば、１つのムードと、そのムードに関連する（連想される）言葉を、さらに関連付けることも可能ある。例えば、“悲しい”といったムード（言葉）から連想される“葬式”、“失恋”、“夕暮れ”といった言葉を関連付け、ムードクラスタ変換テーブル１９１に記載しておいても良い。このようにしたとき、ユーザが“夕暮れ”というキーワードを入力した場合、“夕暮れ”に関連付けられている“悲しい”というムードが設定され、その“悲しい”というムードに関連付けられているクラスタが設定される。

なおここでは、１つのムードに１つのクラスタが割り当てられているとして説明をするが、複数のムードに１つのクラスタが割り当てられるようにしても良い。ただし、複数のムードとは、類似するムード（例えば、悲しい、もの悲しい、悲嘆などの類似する感情）であることが好ましい。また、本実施の形態においては、サブクラスタが設定できるため、類似する複数のムードを１つのクラスタに割り当てても、サブクラスタで分類することができるため、複数のムードを１つのクラスタに割り当てたことによる精度の低下などが発生することはない。

このようなムードクラスタ変換テーブル１９１が参照されてクラスタが設定され、以下に説明する処理により、サブクラスタが設定される。

ステップＳ８６において、クラスタ決定部１１５は、サブクラスタを判断する。クラスタ決定部１１５は、アイテムメタデータ取得部１１４から供給されたメタデータの既存情報を読み出し、その既存情報と、特徴分析部１１２から供給される（または、データベース５４から読み出される）特徴量とのマッチングをとることにより、どのサブクラスタに属するか（例えば、図１４に示したようにサブクラスタ１乃至５の５個のサブクラスタがあるときには、サブクラスタ１乃至５のうちのどのサブクラスタに属するか）が判断される。

なおここでは、既存情報と特徴量とがマッチングされることによりサブクラスタが決定されるとしたが、特徴量としてどのようなデータが算出されるかなど（すなわち、ステップＳ８２において算出される情報）は、このステップＳ８６において実行されるサブクラスタの判断処理の仕方に依存して決定される。また、ここではマッチングによりサブクラスタが決定されるとして説明したが、他の方法によりサブクラスタが決定されるようにしても良い。

例えば、サブクラスタを判断するときの処理として、決定木などの手法、判別式を用いた手法、クラスタのセントロイドとの類似度を用いる手法、支持率により類似度の計算を行う際に重み付けをして行う手法、特徴量メタデータをカテゴリー化して類似度計算を行う手法などを用いることができる。すなわち、非該当曲やクラスタの分類を行えるような学習手法であれば、どんな手法でも良い。

このような決定木などの手法や判別式を用いた手法などを用いて、サブクラスタが判断されるようにした場合、決定木や判別式は、ステップＳ８１やステップＳ８２の処理が行われることにより生成された数値や処理手順が用いられる。

すなわち、クラスタ（サブクラスタ）が付与されているメタデータを解析することにより、例えば、アイテムが曲であった場合、クラスタ１でサブクラスタ１に属する曲のテンポはどのような数値の範囲内に収まるか、スピードはどのような数値の範囲内に収まるかなどが解析され、そのような解析に基づく決定木や判別式が生成される。そして、生成された決定木や判別式に基づき、サブクラスタの判断の処理が実行される。

ステップＳ８６において、所定の曲のメタデータのサブクラスタ（アイテムのサブクラスタ）が決定されると、ステップＳ８７において、その決定されたサブクラスタが、メタデータに書き込まれる。なお、クラスタは上述したように、非該当フィルタ１１３のおけるフィルタリングをされた時点で決定されおり（ムードクラスタ変換テーブル１９１が参照された時点で決定されており）、そのクラスタがメタデータに、サブクラスタとともに書き込まれる。

クラスタとサブクラスタが書き込まれたメタデータは、データベース５４に記憶される。クラスタが書き込まれたメタデータは、例えば、図９に示したようなメタデータ１７２である。

このようにして、既にクラスタやサブクラスタが付与されているメタデータが用いられて、クラスタが付与されていないメタデータに対してクラスタとサブクラスタが付与される。このようにしてクラスタとサブクラスタが付与されたデータを、ステップＳ８１における処理で、クラスタが付与されているメタデータとして取り扱われるようにしても良い。または、図１１や図１５のフローチャート（クラスタ学習処理）の処理対象とされたメタデータのみが、ステップＳ８１におけるクラスタが付与されているメタデータとして取得されるようにしても良い。

なお、図１１や図１５のフローチャート（クラスタ学習処理）の処理対象とされたメタデータのみが、ステップＳ８１の処理で取得されるようにした場合、ステップＳ８１やステップＳ８２の処理は、１度だけ行われればよい。ステップＳ８１やステップＳ８２における処理により、一度算出された特徴量は、データベース５４に記憶され、その記憶されている特徴量が用いられて、ステップＳ８３以降の処理が実行されるようにすればよい。すなわち、ステップＳ８１とステップＳ８２の処理は、１度、特徴量が算出された後は、省略することが可能である。

［アイテムの推薦に関わる処理について］
このようにして、クラスタが付与されたメタデータが用いられ、ユーザに対して、ユーザに適した情報が推薦される際の処理が実行される。推薦の処理は、推薦部５５（図７）により実行される。図２７のフローチャートを参照し、推薦部５５により行われる推薦の処理について説明する。

ステップＳ１０１において、ムード情報取得部１４１は、ムード情報を取得する。ムード情報は、ユーザから提供される。例えば、端末３（図１）が操作され、ユーザが、ユーザ自身のムード（その時点の感情、気分など）を入力し（例えば、“悲しい”といったテキストデータを入力し）、サーバ２に対して送信すると、その情報が、サーバ２のムード情報取得部１４１に供給される。

ステップＳ１０２において、ムードクラスタ変換部１４２は、ムード情報取得部１４１により取得されたムード情報を、クラスタの情報に変換する。上述したように、１つのムードには１つのクラスタが対応するように割り当てられている。例えば、図２６のムードクラスタ変換テーブル１９１に記載されているように、“悲しい”といったムードは、“クラスタ１”に、“楽しい”といったムードは、“クラスタ２”にといったように、ムードとクラスタは対になっている。

このような、ムード情報をクラスタ情報に変換するために、ムードクラスタ変換部１４２は、例えば、図２６に示すようなムードクラスタ変換テーブル１９１を保持している。ムードクラスタ変換テーブル１９１は、上述したようにクラスタ付与学習部５３のクラスタ決定部１１５も保持しているとして説明をしたが、そのクラスタ決定部１１５が保持しているムードクラスタ変換テーブル１９１を、ムードクラスタ変換部１４２が参照する（共用する）ことも可能である。

ムードクラスタ変換部１４２は、ステップＳ１０２において、供給されたムード情報が、どのクラスタに該当する情報であるかを、ムードクラスタ変換テーブル１９１を参照して決定する。決定されたクラスタ情報は、推薦情報生成部１４３に供給される。

ステップＳ１０３において、推薦情報生成部１４３は、クラスタ情報が示すクラスタに属するアイテムのうちの１つをユーザ側に提供する。アイテムのメタデータ１７２（図９）には、クラスタの情報が書き込まれている。その書き込まれているクラスタが、クラスタ情報と一致するアイテムが、データベース５４から読み出される。クラスタ情報と一致するクラスタが書き込まれたメタデータのアイテムは、データベース５４に複数記憶されている可能性がある。

複数のアイテムがデータベース５４に記憶されていた場合、例えば、サブクラスタが“１”（デフォルト値）のアイテムが読み出される。サブクラスタが“１”のアイテムも、データベース５４に複数記憶されている可能性があるが、複数記憶されているような場合には、所定の方式に従って（例えばアイテムＮＯが若い順に従って）、１つのアイテムが読み出されるようにしても良いし、ランダムに１つのアイテムが読み出されるようにしても良い。

いずれにしても、クラスタ情報と一致するクラスタが書き込まれているメタデータを有するアイテムが読み出され、ユーザに提供される。

ステップＳ１０５において、別のアイテムの提供が指示されたか否かが判断される。例えば、ユーザは、提供されたアイテム（曲）が、自分が入力したムード（気分）に適していないと思い、他の曲の提供を指示することができる。このような指示があったか否かが、ステップＳ１０５において判断される。この判断は、ムード情報取得部１４１が行うようにすることができる。

ステップＳ１０５において、別のアイテム（曲）の提供は指示されていないと判断された場合、そのまま、その時点でのクラスタとサブクラスタに該当するアイテムが、ユーザ側に提供し続けられる。

一方、ステップＳ１０５において、別のアイテムの提供が指示されたと判断された場合、ステップＳ１０６に処理が進められる。ステップＳ１０６において、その時点で設定されているサブクラスタの次のサブクラスタ（他のサブクラスタ）に設定がし直され、その設定し直されたサブクラスタに属するアイテムが読み出され、ユーザに提供される（ステップＳ１０４に処理が戻され、それ以降の処理が繰り科されることにより、ユーザに提供される）。

この際、サブクラスタは設定し直されるが、クラスタは、そのままの設定が維持される。すなわち、ユーザが入力したムードに属する（クラスタに属する）曲が、継続的にユーザ側に提供されるが、同じムードに属していても異なる感じの曲（サブクラスタの異なる曲）が、ユーザ側に提供される。

このことは、同じムード（同じ気分、感情など）であっても、ユーザにより感じ方が異なるようなことがあるが、そのような違いを吸収したアイテムの提供ができることを意味している。すなわち、本発明を適用すれば個々のユーザに適したアイテムの提供が行える。

ところで、上述した実施の形態においては、サーバ２側でクラスタの学習やアイテムの推薦に関する処理が行われるとして説明をした。このようなサーバ２側で処理が行われるような形態は、例えば、ネットワーク１を介してアイテムを提供する際などに適している。

しかしながら、上述したようなクラスタの学習やアイテムの推薦に関する処理が、サーバ２側でのみ行われることを意味しているのではない。例えば、クラスタの学習に関する処理は、サーバ２側で行い、その結果を利用して端末３側で、アイテムの推薦が行われるようにすることも可能である。さらには、端末３側でクラスタの学習やアイテムの推薦に関する処理が実行されるようにしても良い。

端末３側で、学習は推薦の処理が行われるようにした場合、例えば、ユーザが購入したＣＤ（Compact Disk）に記録されている楽曲データや端末３のデータベース（不図示）に記憶されている曲の楽曲データを解析することにより、クラスタの学習が行われ、端末３のデータベースに記憶されている曲が推薦されるようにするといった処理を行うことも可能である。

端末３側で、学習から推薦までの一連処理を行うようにした場合も、上述した場合と同様な処理で行うことが可能である。

本発明を適用することにより、ユーザの感情、気分といったムードに適したアイテムが、どのようなアイテムであるかを学習することができる。また、学習の結果を用いて、新たに追加されたアイテムが、どのようなムードに適したアイテムであるかを分類することができる。さらに、分類された結果を用いて、ユーザのムードに適したアイテムを推薦することができる。その推薦は、個々のユーザにとって、適したアイテムを推薦することができる。

［記録媒体について］
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム格納媒体からインストールされる。

コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム格納媒体は、図２に示すように、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ＲＯＭ(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む）、光磁気ディスク（ＭＤ（Mini-Disc）を含む）、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア３１、または、プログラムが一時的もしくは永続的に格納されるＲＯＭ２２や、記憶部２８を構成するハードディスクなどにより構成される。プログラム格納媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインターフェースである通信部２９を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。

なお、本明細書において、プログラム格納媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理は勿論、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。

なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

本発明を適用したシステムの一実施の形態の構成を示す図である。サーバの構成例を示す図である。サーバの機能を示す図である。クラスタ学習部の構成例を示す図である。クラスタ学習部の他の構成例を示す図である。クラスタ付与学習部の構成例を示す図である。推薦部の構成例を示す図である。アンケート管理テーブルについて説明する図である。メタデータについて説明する図である。数量化管理テーブルについて説明する図である。クラスタの学習について説明するフローチャートである。非該当フィルタ生成処理について説明するフローチャートである。サブクラスタの設定について説明する図である。サブクラスタの設定について説明する図である。クラスタの他の学習について説明するフローチャートである。サブクラスタの他の学習について説明するフローチャートである。サブクラスタの分布について説明する図である。支持率の算出に用いられる情報について説明する図である。支持率の算出に用いられる情報について説明する図である。再編集されたサブクラスタの分布について説明する図である。サブクラスタの再編集に関わるクラスタリグ部７６の機能ブロック図である。再サブクラスタの設定処理について説明するフローチャートである。クラスタリングの手法の選択に用いられる情報について説明する図である。手法毎の支持率について説明するための図である。クラスタ付与処理について説明するフローチャートである。ムードクラスタ変換テーブルについて説明する図である。クラスタの判断について説明するフローチャートである。

符号の説明

１ネットワーク，２サーバ，３端末，２１ＣＰＵ，２２ＲＯＭ，２３ＲＡＭ，２８記憶部，３１リムーバブルメディア，５１学習部，５２クラスタ学習部，５３クラスタ付与学習部，５４データベース，５５推薦部，７１楽曲データ取得部，７２ユーザデータ取得部，７３特徴量解析部，７４非該当フィルタ生成部，７５多変量解析部，７６クラスタリング部，８１メタデータ解析部，１１１メタデータ取得部，１１２特徴分析部，１１３非該当フィルタ，１１４アイテムメタデータ取得部，１１５クラスタ決定部，１１６追加部，１４１ムード情報取得部，１４２ムードクラスタ変換部，１４３推薦情報生成部，２０１アイテム数判断部，２０２処理対象判断部，２０３支持率算出部，２０４併合対象判断部，２０５併合先決定部，２０６再サブクラスタ設定部

Claims

所定のアイテムが、所定のムードに該当するか否かを示す情報を取得する取得手段と、
前記取得手段により取得された前記情報を解析し、所定のムードに該当しないと判断されるアイテムの特徴量を抽出する抽出手段と、
前記取得手段により取得された前記情報を解析し、前記ムードに対応するクラスタとそのクラスタに対応する複数のサブクラスタを学習する第１の学習手段と、
前記第１の学習手段により学習された前記クラスタとサブクラスタが付与された前記アイテムを用いて、前記ムード毎の特徴を学習する第２の学習手段と、
クラスタが付与されていないアイテムの特徴量が、前記抽出手段により抽出された前記特徴量と一致するか否かを判断する判断手段と、
前記判断手段により、一致しないと判断された前記アイテムに対して、前記第２の学習手段により学習された前記特徴に基づいて、クラスタとサブクラスタを付与する付与手段と
を備える情報処理装置。
前記取得手段により取得される情報は、前記ユーザに対して実施されたアンケートの結果に関する情報である
請求項１に記載の情報処理装置。
前記第１の学習手段は、前記取得手段により取得された情報を多変量解析することにより数次元のデータに数量化し、
数次元のデータに数量化された前記情報をクラスタリングすることにより前記サブクラスタを学習する
請求項１に記載の情報処理装置。
前記第１の学習手段は、前記抽出手段により特徴量が抽出される対象とされない前記アイテムの特徴量を多変量解析することにより数次元のデータに数量化し、
数次元のデータに数量化された前記特徴量をクラスタリングすることにより前記サブクラスタを学習する
請求項１に記載の情報処理装置。
前記第１の学習手段は、前記サブクラスタを再編集する再編集手段を備え、
前記再編集手段は、所定のサブクラスタに含まれるアイテム数が、所定の閾値以下である場合、そのサブクラスタを削除する
請求項１に記載の情報処理装置。
前記再編集手段は、所定のサブクラスタに含まれるアイテム数が、所定の閾値以下であり、かつ、前記所定のサブクラスタに含まれるアイテムのうち、所定のムードに該当する判断されたアイテム数の比率により算出される値が、所定の閾値以上である場合、前記所定のサブクラスタを、他のサブクラスタに併合する
請求項５に記載の情報処理装置。
前記第１の学習手段において、前記サブクラスタが学習されるときに用いられる複数のクラスタリング手法から１つの手法を選択する選択手段をさらに備え、
前記選択手段は、前記複数のクラスタリング手法のそれぞれでクラスタリングを行った結果に基づいて、前記サブクラスタが最も分散している手法を選択する
請求項１に記載の情報処理装置。
ムードに関する情報を、その情報が表すムードに関連付けられているクラスタに変換する変換手段と、
前記変換手段により変換された前記クラスタが割り当てられているアイテムを推薦する推薦手段と
をさらに備え、
前記推薦手段により推薦された第１のアイテム以外の第２のアイテムの推薦が指示された場合、前記第１のアイテムのサブクラスタと異なるサブクラスタが付与された前記第２のアイテムを推薦する
請求項１に記載の情報処理装置。
所定のアイテムが、所定のムードに該当するか否かを示す情報を取得する取得ステップと、
前記取得ステップの処理で取得された前記情報を解析し、所定のムードに該当しないと判断されるアイテムの特徴量を抽出する抽出ステップと、
前記取得ステップの処理で取得された前記情報を解析し、前記ムードに対応するクラスタとそのクラスタに対応する複数のサブクラスタを学習する第１の学習ステップと、
前記第１の学習ステップの処理で学習された前記クラスタとサブクラスタが付与された前記アイテムを用いて、前記ムード毎の特徴を学習する第２の学習ステップと、
クラスタが付与されていないアイテムの特徴量が、前記抽出ステップの処理で抽出された前記特徴量と一致するか否かを判断する判断ステップと、
前記判断ステップの処理で一致しないと判断された前記アイテムに対して、前記第２の学習ステップの処理で学習された前記特徴に基づいて、クラスタとサブクラスタを付与する付与ステップと
を含む情報処理方法。
所定のアイテムが、所定のムードに該当するか否かを示す情報を取得する取得ステップと、
前記取得ステップの処理で取得された前記情報を解析し、所定のムードに該当しないと判断されるアイテムの特徴量を抽出する抽出ステップと、
前記取得ステップの処理で取得された前記情報を解析し、前記ムードに対応するクラスタとそのクラスタに対応する複数のサブクラスタを学習する第１の学習ステップと、
前記第１の学習ステップの処理で学習された前記クラスタとサブクラスタが付与された前記アイテムを用いて、前記ムード毎の特徴を学習する第２の学習ステップと、
クラスタが付与されていないアイテムの特徴量が、前記抽出ステップの処理で抽出された前記特徴量と一致するか否かを判断する判断ステップと、
前記判断ステップの処理で一致しないと判断された前記アイテムに対して、前記第２の学習ステップの処理で学習された前記特徴に基づいて、クラスタとサブクラスタを付与する付与ステップと
を含む処理をコンピュータに実行させるプログラム。