JP2007183927A

JP2007183927A - 情報処理装置および方法、並びにプログラム

Info

Publication number: JP2007183927A
Application number: JP2006314534A
Authority: JP
Inventors: Hiroshi Tateno; 啓舘野
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2005-12-05
Filing date: 2006-11-21
Publication date: 2007-07-19

Abstract

【課題】コンテンツに対して最適なキーワードを付与することができるようにする。
【解決手段】コンテンツ特徴量抽出部５２は、コンテンツに関係するコンテンツ特徴量を抽出し、ラベル情報抽出部５４は、コンテンツの属性を示すラベル情報を抽出する。対応情報算出部５６は、コンテンツ特徴量とラベル情報とに共通する潜在変数ｚ_K、コンテンツ特徴量、ラベル情報のそれぞれの確率分布の性質を表わすパラメータを算出し、コンテンツ特徴量-潜在空間対応情報蓄積部５７またはラベル情報-潜在空間対応情報蓄積部５８は、それぞれ、算出された潜在変数ｚ_Kを蓄積することで、コンテンツに対して、最適なキーワードを付与することができるようになる。本発明は、情報処理装置に適用できる。
【選択図】図２

Description

本発明は情報処理装置および方法、並びにプログラムに関し、特に、コンテンツに対して最適なキーワードを付与することができるようにした情報処理装置および方法、並びにプログラムに関する。

従来より、音楽や映像のコンテンツに対してキーワードを付与することにより、それらのコンテンツを検索したり、分類したりする技術がある。このようなキーワードは、一般的に、メタデータと称されるが、例えば、対象となるCD（Compact Disc）に関する曲名やアーティスト名などの情報を提供するCDDB（CD DataBase）のように、コンテンツに対してキーワードを付与するためには、人手による膨大な作業が必要となっていた。この場合、新しいコンテンツが登場するたびに、手作業により、それらのコンテンツに対してキーワードを登録する作業が発生していた。

また、特に、音楽のコンテンツなどでは、個々の楽曲の特徴を数値化する技術も開発されており、その数値からキーワードなどのメタデータを推測する技術もある。

具体的には、多変量解析の手法である数量化III類により個々のコンテンツに付与されたキーワードなどの離散量を連続量空間に配置し、その空間と特徴量の空間で正準相関分析を行うことにより両者の対応関係を得て、その対応関係を用いて新規コンテンツの特徴量からキーワードを推測する情報処理装置もある（例えば、特許文献１）。

また、コンテンツのクラスタリングやキーワードをクラスタリングする手法（例えば、特許文献２）、コンテンツとキーワードとを同時にクラスタリングする手法（例えば、非特許文献１）、またはユーザの嗜好や文脈（コンテクスト）に合わせてコンテンツを推薦する手法（例えば、特許文献３）も提案されている。
特開平１１−９６１６５号公報特開２００２−４１５７３号公報特開２００１−１７５６７６号公報高村大也、松本裕治著、「文書分類のための共クラスタリング」情報処理学会論文誌 Vol.44 No.02、２００３年２月発行

しかしながら、新しいコンテンツが増えるたびに、そのコンテンツにキーワードを付与する人手による膨大な作業が発生し、永続的にコストがかかるという問題があった。

また、従来のコンテンツにキーワードを付与する手法であると、コンテンツに対して、最適なキーワードが付与されているとは言えなかった。

例えば、特開平１１−９６１６５号公報に開示されている情報処理装置は、数量化III類を用いてキーワードを推測しているが、数量化III類は、質的なデータに対してのみ適用が可能であるため、例えば、ある楽曲に対するレビュー文において、複数回出現している単語は重要であると考えられるが、そのような重み付けをすることはできない。

また、例えば、特開２００２−４１５７３号公報や上記非特許文献１に開示されている手法は、コンテンツやキーワードをクラスタリングする手法であるが、コンテンツの特徴を示す特徴量と、それに付与されたキーワードとの両方を用いてクラスタリングやモデル化をすることはできない。

さらに、例えば、特開２００１−１７５６７６号公報に開示されている手法は、ユーザの嗜好や文脈に合わせてコンテンツを推薦しているが、高評価を得たコンテンツのメタデータを蓄積して作成したユーザプロファイルとの距離が近いコンテンツを推薦する手法を用いており、嗜好の情報などの分布を考慮していないために、最適なコンテンツを推薦しているとは言えなかった。

本発明はこのような状況に鑑みてなされたものであり、コンテンツに対して最適なキーワードを付与することができるようにするものである。

本発明の第１の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報とに共通する第１の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第１のパラメータを算出する第１の算出手段と、算出された前記第１のパラメータを蓄積する蓄積手段とを備える情報処理装置である。

前記特徴量を抽出する第１の抽出手段と、前記属性情報を抽出する第２の抽出手段とをさらに設け、前記第１の算出手段には、抽出された前記特徴量と、抽出された前記属性情報とから、前記第１のパラメータを算出させることができる。

前記第２の抽出手段には、自然言語によって記述された文章を、単語または前記単語のまとまりであるフレーズに分割させることができる。

算出された前記第１のパラメータに基づいて、前記フレーズの前記特徴量との関連度を示す特徴性を算出する第２の算出手段と、算出された前記特徴性に基づいて、前記フレーズの表示を制御する表示制御手段とをさらに設けることができる。

前記第１の算出手段には、前記特徴量、前記属性情報、またはユーザによる前記コンテンツの利用に関する情報を示す利用情報のそれぞれに共通する第２の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第２のパラメータを算出し、前記蓄積手段は、算出された前記第２のパラメータを蓄積させることができる。

前記利用情報を抽出する抽出手段をさらに設け、前記第１の算出手段には、前記特徴量、前記属性情報、または抽出された前記利用情報から、前記第２のパラメータを算出させることができる。

前記第１の算出手段には、前記特徴量、前記属性情報、または前記コンテンツに対するユーザの嗜好に関する情報を示す嗜好情報のそれぞれに共通する第３の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第３のパラメータを算出させ、前記蓄積手段には、算出された前記第３のパラメータを蓄積させることができる。

前記嗜好情報を抽出する抽出手段をさらに設け、前記第１の算出手段には、前記特徴量、前記属性情報、または抽出された前記嗜好情報から、前記第３のパラメータを算出させることができる。

本発明の第１の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報とに共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータを算出する算出ステップと、算出された前記パラメータを蓄積する蓄積ステップとを含む情報処理方法である。

本発明の第１の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータを算出する算出ステップと、算出された前記パラメータを蓄積する蓄積ステップとをコンピュータに実行させるプログラムである。

本発明の第１の側面においては、コンテンツに関係する特徴量とコンテンツの属性を示す属性情報とに共通する第１の潜在変数、特徴量、および属性情報のそれぞれの確率分布の性質を表わす第１のパラメータが算出され、算出された第１のパラメータが蓄積される。

本発明の第２の側面は、コンテンツに関係する特徴量を抽出する抽出手段と、前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換手段と、前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出手段と、算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択手段とを備える情報処理装置である。

前記選択手段には、前記コンテンツに対応する属性として、算出された前記距離が所定の閾値以下となる属性か、または前記距離の近さが上位となる所定の個数の属性を選択するようにすることができる。

本発明の第２の側面は、コンテンツに関係する特徴量を抽出する抽出ステップと、前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換ステップと、前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出ステップと、算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択ステップとを含む情報処理方法である。

本発明の第２の側面は、コンテンツに関係する特徴量を抽出する抽出ステップと、前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換ステップと、前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出ステップと、算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択ステップとをコンピュータに実行させるプログラムである。

本発明の第２の側面においては、コンテンツに関係する特徴量が抽出され、特徴量とコンテンツの属性を示す属性情報に共通する潜在変数、特徴量、および属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された特徴量が潜在空間に配置されるように変換され、潜在空間中に変換された特徴量と、潜在変数により特徴量に対して潜在的に結び付いている属性情報との距離が算出され、算出された距離に基づいて、コンテンツに対応する属性が選択される。

本発明の第３の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換手段と、前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出手段と、算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択手段とを備える情報処理装置である。

前記選択手段には、前記属性情報に対応するコンテンツとして、算出された前記距離が所定の閾値以下となるコンテンツか、または前記距離の近さが上位となる所定の個数のコンテンツを選択させることができる。

本発明の第３の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換ステップと、前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出ステップと、算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択ステップとを含む情報処理方法である。

本発明の第３の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換ステップと、前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出ステップと、算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択ステップとをコンピュータに実行させるプログラムである。

本発明の第３の側面においては、コンテンツに関係する特徴量とコンテンツの属性を示す属性情報に共通する潜在変数、特徴量、および属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、属性情報が潜在空間に配置されるように変換され、潜在空間中に変換された属性情報と、潜在変数により属性情報に対して潜在的に結び付いている特徴量との距離が算出され、算出された距離に基づいて、属性情報に対応するコンテンツが選択される。

以上のように、本発明の第１の側面によれば、コンテンツに対して最適なキーワードを付与することができる。

また、本発明の第２の側面によれば、コンテンツに対して最適なキーワードを付与することができる。

本発明の第３の側面によれば、より確実に、キーワードに対応するコンテンツを検索することができる。

以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書または図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書または図面に記載されていることを確認するためのものである。従って、明細書または図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。

本発明の第１の側面の情報処理装置（例えば、図２のコンテンツ提供装置１）は、コンテンツ（例えば、音楽コンテンツ）に関係する特徴量（例えば、コンテンツ特徴量）と前記コンテンツの属性（例えば、ラベル）を示す属性情報（例えば、ラベル情報）とに共通する第１の潜在変数（例えば、潜在変数ｚ_K）、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第１のパラメータ（例えば、対応情報）を算出する第１の算出手段（例えば、図２の対応情報算出部５６）と、算出された前記第１のパラメータを蓄積する蓄積手段（例えば、図２のコンテンツ特徴量-潜在空間対応情報蓄積部５７）とを備える。

前記特徴量を抽出する第１の抽出手段（例えば、図２のコンテンツ特徴量抽出部５２）と、前記属性情報を抽出する第２の抽出手段（例えば、図２のラベル情報抽出部５４）とをさらに設け、前記第１の算出手段は、抽出された前記特徴量と、抽出された前記属性情報とから、前記第１のパラメータを算出することができる。

前記第２の抽出手段は、自然言語によって記述された文章を、単語または前記単語のまとまりであるフレーズに分割することができる。

算出された前記第１のパラメータに基づいて、前記フレーズの前記特徴量との関連度を示す特徴性（例えば、特徴性）を算出する第２の算出手段（例えば、図３１の特徴性算出部１８１）と、算出された前記特徴性に基づいて、前記フレーズの表示を制御する表示制御手段（例えば、図３１のフレーズ表示制御部１８３）とをさらに備える。

前記第１の算出手段は、前記特徴量、前記属性情報、またはユーザによる前記コンテンツの利用に関する情報を示す利用情報（例えば、コンテクスト情報）のそれぞれに共通する第２の潜在変数（例えば、潜在変数ｚ_K）、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第２のパラメータ（例えば、対応情報）を算出し、前記蓄積手段は、算出された前記第２のパラメータを蓄積することができる。

前記利用情報を抽出する抽出手段（例えば、図１８のコンテクスト情報抽出部１１１）をさらに備え、前記第１の算出手段は、前記特徴量、前記属性情報、または抽出された前記利用情報から、前記第２のパラメータを算出することができる。

前記第１の算出手段は、前記特徴量、前記属性情報、または前記コンテンツに対するユーザの嗜好に関する情報を示す嗜好情報（例えば、嗜好情報）のそれぞれに共通する第３の潜在変数例えば、潜在変数ｚ_K）、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第３のパラメータ（例えば、対応情報）を算出し、前記蓄積手段は、算出された前記第３のパラメータを蓄積することができる。

前記嗜好情報を抽出する抽出手段（例えば、図２２の嗜好情報抽出部１５１）をさらに備え、前記第１の算出手段は、前記特徴量、前記属性情報、または抽出された前記嗜好情報から、前記第３のパラメータを算出することができる。

本発明の第１の側面の情報処理方法またはプログラムは、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報とに共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータを算出する算出ステップ（例えば、図６のステップＳ２１の処理）と、算出された前記パラメータを蓄積する蓄積ステップ（例えば、図６のステップＳ２２の処理）とを含む。

本発明の第２の側面の情報処理装置（例えば、図２のコンテンツ提供装置１）は、コンテンツ（例えば、音楽コンテンツ）に関係する特徴量（例えば、コンテンツ特徴量）を抽出する抽出手段（例えば、図２のコンテンツ特徴量抽出部５２）と、前記特徴量と前記コンテンツの属性（例えば、ラベル）を示す属性情報（例えば、ラベル情報）に共通する潜在変数（例えば、潜在変数ｚ_K）、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータ（例えば、対応情報）に基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換手段（例えば、図２のコンテンツ特徴量-潜在空間変換部５９）と、前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出手段（例えば、図２の潜在空間距離算出部６１）と、算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択手段（例えば、図２のラベル選択部６２）とを備える。

前記選択手段は、前記コンテンツに対応する属性として、算出された前記距離が所定の閾値以下となる属性か、または前記距離の近さが上位となる所定の個数の属性を選択することができる。

本発明の第２の側面の情報処理方法またはプログラムは、コンテンツに関係する特徴量を抽出する抽出ステップ（例えば、図１４のステップＳ３１の処理）と、前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換ステップ（例えば、図１４のステップＳ３２の処理）と、前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出ステップ（例えば、図１４のステップＳ３３の処理）と、算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択ステップ（例えば、図１４のステップＳ３４の処理）とを含む。

本発明の第３の側面の情報処理装置（例えば、図２のコンテンツ提供装置１）は、コンテンツ（例えば、音楽コンテンツ）に関係する特徴量（例えば、コンテンツ特徴量）と前記コンテンツの属性（例えば、ラベル）を示す属性情報（例えば、ラベル情報）に共通する潜在変数（例えば、潜在変数ｚ_K）、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータ（例えば、対応情報）に基づいて、前記属性情報が潜在空間に配置されるように変換する変換手段（例えば、図２のラベル情報-潜在空間変換部６０）と、前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出手段（例えば、図２の潜在空間距離算出部６１）と、算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択手段（例えば、図２のコンテンツ選択部６３）とを備える。

前記選択手段は、前記属性情報に対応するコンテンツとして、算出された前記距離が所定の閾値以下となるコンテンツか、または前記距離の近さが上位となる所定の個数のコンテンツを選択することができる。

本発明の第３の側面の情報処理方法またはプログラムは、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換ステップ（例えば、図１６のステップＳ４１の処理）と、前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出ステップ（例えば、図１６のステップＳ４２の処理）と、算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択ステップ（例えば、図１６のステップＳ４３の処理）とを含む。

本発明の第１の側面、第２の側面、または第３の側面のプログラムは、記録媒体（例えば、図１のリムーバブルメディア２１）に記録することができる。

以下、図面を参照しながら本発明の実施の形態について説明する。

図１は、コンテンツ提供装置１のハードウェアの構成の例を説明するブロック図である。

図１のコンテンツ提供装置１において、CPU（Central Processing Unit）１１は、ROM（Read Only Memory）１２に記憶されているプログラム、または記録部１８からRAM（Random Access Memory）１３にロードされたプログラムに従って各種の処理を実行する。RAM１３にはまた、CPU１１が各種の処理を実行する上において必要なデータなども適宜記憶される。

CPU１１、ROM１２、およびRAM１３は、バス１４を介して相互に接続されている。このバス１４にはまた、入出力インターフェース１５も接続されている。

入出力インターフェース１５には、キーボード、マウスなどよりなる入力部１６、スピーカ、LCD（Liquid Crystal Display）などのディスプレイなどよりなる出力部１７、ハードディスクなどより構成される記録部１８、並びにインターネットなどのネットワークを介しての他の機器との通信処理を制御する通信部１９が接続されている。

入出力インターフェース１５にはまた、必要に応じてドライブ２０が接続され、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア２１が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記録部１８にインストールされる。

なお、コンテンツ提供装置１のハードウェアの構成は、図１の例に限定されず、後述する図２の機能的構成を少なくとも有していればよい。

図２は、コンテンツ提供装置１の機能的構成例を示す機能ブロック図である。

コンテンツ提供装置１は、例えば、記録しているコンテンツから特徴量を抽出し、抽出した特徴量（後述するコンテンツ特徴量）とキーワード（後述するラベル情報）とを対応付けするなどの所定の処理を行う機器であり、本発明の情報処理装置の一例である。

コンテンツ提供装置１は、コンテンツ蓄積部５１、コンテンツ特徴量抽出部５２、コンテンツ特徴量蓄積部５３、ラベル情報抽出部５４、ラベル情報蓄積部５５、対応情報算出部５６、コンテンツ特徴量-潜在空間対応情報蓄積部５７、ラベル情報-潜在空間対応情報蓄積部５８、コンテンツ特徴量-潜在空間変換部５９、ラベル情報-潜在空間変換部６０、潜在空間距離算出部６１、ラベル選択部６２、およびコンテンツ選択部６３を含むようにして構成される。

コンテンツ特徴量抽出部５２は、コンテンツ蓄積部５１に蓄積（保存）されているコンテンツからコンテンツ特徴量を抽出する。コンテンツ特徴量抽出部５２は、抽出したコンテンツ特徴量をコンテンツ特徴量蓄積部５３に蓄積（保存）させる。

ここで、コンテンツとは、一般的にコンテンツと称されている、例えば、テレビジョン番組、映画、写真、楽曲（動画像、静止画像、若しくは音声、またはそれらの組み合わせなど）の他、各種の情報、文章、書籍、データベースなども含んでいるものとする。なお、以下、本実施例においては、音楽であるコンテンツ（音楽コンテンツ）を例にして説明する。

また、コンテンツ特徴量とは、あるコンテンツの特徴を数値化したものである。コンテンツ特徴量は、例えば、音楽コンテンツである場合、その曲のスピード（テンポ）、明るさ（例えば、メジャーコードの曲は明るい曲となり、マイナーコードの曲は暗い曲となる）、または音圧（音のない状態と比較して音があるときに加わる圧力）などを数値化したものとなる。

ラベル情報抽出部５４は、コンテンツ蓄積部５１に蓄積（保存）されているコンテンツに関するラベル情報を抽出する。ラベル情報抽出部５４は、抽出したラベル情報をラベル情報蓄積部５５に蓄積（保存）させる。

ここで、ラベル情報とは、コンテンツの属性を示す情報である。ラベル情報は、例えば、レビュー文や歌詞、コンテンツのタイトル、または動画像のテロップなどに含まれる単語や記号、タグなどの識別可能で、かつ、コンテンツに対して、重みなどを付けることができる、コンテンツに固有な属性を示す情報となる。

対応情報算出部５６は、コンテンツ特徴量蓄積部５３に蓄積されているコンテンツ特徴量と、ラベル情報蓄積部５５に蓄積されているラベル情報との対応情報を算出する。対応情報算出部５６は、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部５７およびラベル情報-潜在空間対応情報蓄積部５８のそれぞれに蓄積させる。

ここで、詳細は後述するが、対応情報とは、コンテンツとラベルとを対応付けるための情報である。対応情報は、例えば、後述する潜在変数ｚ_Kにより、コンテンツとラベルとを結び付ける。

コンテンツ特徴量-潜在空間変換部５９は、コンテンツ特徴量-潜在空間対応情報蓄積部５７に蓄積されている対応情報を基に、抽出されたコンテンツ特徴量が潜在空間中に配置されるように変換する。コンテンツ特徴量-潜在空間変換部５９は、変換された結果を潜在空間距離算出部６１に供給する。

潜在空間距離算出部６１は、コンテンツ特徴量-潜在空間変換部５９から供給された、コンテンツ特徴量を潜在空間中に配置されるように変換した処理結果およびラベル情報-潜在空間対応情報蓄積部５８に蓄積されている対応情報を基に、コンテンツとラベルとの距離を算出する。潜在空間距離算出部６１は、算出した距離の結果をラベル選択部６２に供給する。

ラベル選択部６２は、潜在空間距離算出部６１から供給された距離の結果を基に、ラベルを選択する。

ラベル情報-潜在空間変換部６０は、ラベル情報-潜在空間対応情報蓄積部５８に蓄積されている対応情報を基に、対象となるラベルが潜在空間中に配置されるように変換する。ラベル情報-潜在空間変換部６０は、変換された結果を潜在空間距離算出部６１に供給する。

潜在空間距離算出部６１は、ラベル情報-潜在空間変換部６０から供給された、ラベル情報を潜在空間中に配置されるように変換した処理結果およびコンテンツ特徴量-潜在空間対応情報蓄積部５７に蓄積されている対応情報を基に、コンテンツとラベルとの距離を算出する。潜在空間距離算出部６１は、算出した距離の結果をコンテンツ選択部６３に供給する。

コンテンツ選択部６３は、潜在空間距離算出部６１から供給された距離の結果を基に、コンテンツを選択する。

なお、上述した例においては、コンテンツ特徴量-潜在空間対応情報蓄積部５７とラベル情報-潜在空間対応情報蓄積部５８とを別々にするとして説明したが、それらを１つにまとめることも可能である。そのとき、コンテンツ特徴量-潜在空間対応情報蓄積部５７およびラベル情報-潜在空間対応情報蓄積部５８のいずれか一方が、両方の対応情報を蓄積することになる。

ところで、コンテンツ提供装置１が行う処理としては、大別すると、第１に、コンテンツ特徴量とラベル情報との対応付けをするための学習を行う処理（以下、学習フェーズとも称する）と、第２に、学習フェーズにより、対応付けられたコンテンツ特徴量とラベル情報との関係を用いて、例えば、他のコンテンツに対してラベルを付与したり、コンテンツを検索するなどをして、実際の運用を行う処理（以下、運用フェーズとも称する）がある。本明細書においては、まず、図３乃至図１３を参照して、学習フェーズについて説明し、その後、図１４乃至図１６を参照して、運用フェーズについて説明する。

まず、図３のフローチャートを参照して、図２のコンテンツ提供装置１による、学習の処理について説明する。

ステップＳ１１において、コンテンツ特徴量抽出部５２は、コンテンツからコンテンツ特徴量を抽出し、抽出したコンテンツ特徴量をコンテンツ特徴量蓄積部５３に蓄積（保存）させる。例えば、ステップＳ１１において、コンテンツ特徴量抽出部５２は、コンテンツ蓄積部５１に蓄積されている音楽コンテンツから、その曲の、スピード、明るさ、または音圧などのコンテンツ特徴量を抽出し、抽出したそれらのコンテンツ特徴量をコンテンツ特徴量蓄積部５３に蓄積させる。

具体的には、コンテンツ蓄積部５１に蓄積されている音楽コンテンツとして、例えば、曲１乃至曲１０のそれぞれが蓄積されている場合、コンテンツ特徴量抽出部５２は、図４の例に示すようなコンテンツ特徴量を抽出する。

図４は、音楽コンテンツに関するコンテンツ特徴量の例を示す図である。

図４で示される例において、１列目と１行目は項目を示し、１列目には、コンテンツ蓄積部５１に蓄積されている音楽コンテンツの名称が示され、１行目には、１列目のコンテンツに対するコンテンツ特徴量に関する名称、すなわち、スピード、明るさ、および音圧が示されている。

また、１行目の項目において、左から２番目のスピードであるコンテンツ特徴量は、抽出されたコンテンツ特徴量を数値化した値を示し、例えば、より0に近づくほどスピードの遅い曲（テンポの遅い曲）となり、それに対して、より100に近づくほどスピードの速い曲（テンポの速い曲）となることを意味している。

同様に、左から３番目の明るさであるコンテンツ特徴量は、例えば、より0に近づくほど暗い感じの曲（マイナーコードの曲）となり、それに対して、より100に近づくほど明るい感じの曲（メジャーコードの曲）となることを意味している。また、左から４番目の“音圧”であるコンテンツ特徴量は、例えば、より0に近づくほど音圧が低くなり、それに対して、より100に近づくほど音圧が高くなることを意味している。

すなわち、例えば、コンテンツ特徴量抽出部５２は、図４に示すように、曲１（２行目）から、71であるスピード、52である明るさ、および58である音圧、曲２（３行目）から、53であるスピード、65である明るさ、および67である音圧、曲３（４行目）から、47であるスピード、75である明るさ、および51である音圧、並びに曲４（５行目）から、59であるスピード、55である明るさ、および48である音圧のそれぞれを、コンテンツ特徴量として抽出する。

また、同様に、例えば、コンテンツ特徴量抽出部５２は、曲５（６行目）から、57であるスピード、52である明るさ、および59である音圧、曲６（７行目）から、39であるスピード、39である明るさ、および31である音圧、並びに曲７（８行目）から、45であるスピード、55である明るさ、および40である音圧のそれぞれを、コンテンツ特徴量として抽出する。

さらに、同様に、例えば、コンテンツ特徴量抽出部５２は、曲８（９行目）から、34であるスピード、34である明るさ、および34である音圧、曲９（１０行目）から、39であるスピード、27である明るさ、および45である音圧、並びに曲１０（１１行目）から、36であるスピード、45である明るさ、および46である音圧のそれぞれを、コンテンツ特徴量として抽出する。

そして、例えば、コンテンツ特徴量抽出部５２は、曲１乃至曲１０から抽出したコンテンツ特徴量（図４）を、それぞれ、コンテンツ特徴量蓄積部５３に蓄積させる。

換言すれば、コンテンツ特徴量抽出部５２は、コンテンツ蓄積部５１に蓄積されているラベル情報の付与された個々の音楽コンテンツからコンテンツ特徴量を抽出することにより、１つの音楽コンテンツに対して、１つのベクトルをコンテンツ特徴量蓄積部５３に蓄積させているとも言える。

なお、上述した例においては、音楽コンテンツから抽出するコンテンツ特徴量として、“スピード”、“明るさ”、および“音圧”を例にして説明したが、本発明はそれに限らず、例えば、対象となる音楽コンテンツの、“コード”、“コード進行”、または“音源の種類”など、音楽コンテンツに関係する特徴量であればよい。

図３のフローチャートに戻り、ステップＳ１２において、ラベル情報抽出部５４は、ラベル情報を抽出し、抽出したラベル情報をラベル情報蓄積部５５に蓄積（保存）させる。例えば、ステップＳ１２において、ラベル情報抽出部５４は、コンテンツ蓄積部５１に蓄積されている音楽コンテンツのレビュー文から、それらのレビュー文に含まれている単語の頻度などのラベル情報を抽出し、抽出したラベル情報をラベル情報蓄積部５５に蓄積させる。

具体的には、例えば、コンテンツ蓄積部５１に蓄積されている音楽コンテンツとして、曲１乃至曲１０のそれぞれが蓄積されている場合、ラベル情報抽出部５４は、曲１乃至曲１０のそれぞれのレビュー文に対して、形態素解析による単語化を行って、その単語をカウントすることにより、図５に示すようなラベル情報を抽出する。

図５は、音楽コンテンツに関するラベル情報の例を示す図である。

図５で示される例において、１列目と１行目は項目を示し、１列目には、コンテンツ蓄積部５１に蓄積されている音楽コンテンツの名称が示され、１行目には、１列目のコンテンツに関するラベル情報、すなわち、音楽コンテンツのレビュー文に含まれている単語として、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”が示されている。

また、１行目の項目において、左から２番目の“ゆったり”であるラベル情報は、ある音楽コンテンツのレビュー文の中に、“ゆったり”である単語が何回現れたかの値を示し、同様に、左から３番目の“明るい”であるラベル情報は、レビュー文に、“明るい”である単語が何回現れたかの値を示している。また、同様に、左から４番目の“ノリノリ”、左から５番目の“重い”、および左から６番目の“軽い”であるラベル情報においても、レビュー文に、それらの単語が何回現れたかの値を示している。

すなわち、例えば、ラベル情報抽出部５４は、図５に示すように、曲１（２行目）のレビュー文から、“ノリノリ”と“軽い”である単語がそれぞれ２回ずつ現れ、曲２（３行目）のレビュー文から、“明るい”、“ノリノリ”、“軽い”である単語がそれぞれ１回ずつ現れ、曲３（４行目）のレビュー文から、“明るい”と“ノリノリ”である単語がそれぞれ２回ずつ現れ、曲４（５行目）のレビュー文から、“ノリノリ”と“軽い”である単語がそれぞれ１回ずつ現れたことをそれぞれ抽出する。

また、同様に、例えば、ラベル情報抽出部５４は、曲５（６行目）のレビュー文から、“ノリノリ”と“軽い”である単語がそれぞれ１回ずつ現れ、曲６（７行目）のレビュー文から、“ゆったり”と“重い”である単語がそれぞれ１回ずつ現れ、曲７（８行目）のレビュー文から、“ノリノリ”である単語が１回現れたことをそれぞれ抽出する。

さらに、同様に、例えば、ラベル情報抽出部５４は、曲８（９行目）のレビュー文から、“ゆったり”である単語が１回、“重い”である単語が２回現れ、曲９（１０行目）のレビュー文から、“ゆったり”である単語が１回現れ、曲１０（１１行目）のレビュー文から、“ゆったり”である単語が２回現れたことをそれぞれ抽出する。

ラベル情報抽出部５４は、曲１乃至曲１０から抽出したラベル情報（図５）を、それぞれ、ラベル情報蓄積部５５に蓄積させる。

なお、上述した例においては、ラベル情報として、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”を例にして説明したが、本発明はそれに限らず、例えば、“はやい”、“遅い”、または“スロー”など、音楽コンテンツのレビュー文に含まれている単語であればよい。

図３のフローチャートに戻り、ステップＳ１３において、対応情報算出部５６は、コンテンツ特徴量とラベル情報との対応情報の算出の処理を行う。対応情報算出部５６は、コンテンツ特徴量とラベル情報との対応情報の算出の処理により得られた結果を、コンテンツ特徴量-潜在空間対応情報蓄積部５７およびラベル情報-潜在空間対応情報蓄積部５８のそれぞれに蓄積させて、学習の処理は終了する。

ここで、ステップＳ１３における、対応情報算出部５６による、対応情報の算出の処理の詳細について、図６のフローチャートを参照して説明する。

ステップＳ２１において、対応情報算出部５６は、コンテンツ特徴量蓄積部５３に蓄積されているコンテンツ特徴量と、ラベル情報蓄積部５５に蓄積されているラベル情報との対応情報を算出する。

ここで、コンテンツ特徴量とラベル情報とを対応させる対応情報の詳細について説明する。コンテンツ特徴量とラベル情報との対応情報であるが、コンテンツ特徴量の分布とラベル情報の分布とは、一般的には異なる分布となるので、それらの分布を結合させる必要がある。特に、連続量と離散量となる場合、同一の空間で扱うには無理があるので、異なる分布を持つ２つの空間をどのようにして結合するかが問題となる。例えば、コンテンツ特徴量が連続量となる場合、その分布をモデル化するためには、主成分分析や因子分析、混合正規分布（GMM（Gaussian Mixture Model））などの手法が用いられてきた。

混合正規分布（GMM）は、観測点（本実施例ではコンテンツ特徴量により表現された個々の音楽コンテンツ）の出現を潜在的な複数の正規分布からのものとみなすもので、一般的に、その潜在的な分布パラメータを尤度に基づいて推定する。尤度に基づくパラメータの推定方法には、例えば、EM（Expectation Maximization）アルゴリズムが代表的であるが、他にベイズ推定の考え方を用いた変分ベイズ法などもある。

一方、例えば、音楽コンテンツのレビュー文に含まれる単語の頻度などのラベル情報のモデル化には、例えば、PLSA（Probabilistic Latent Semantic Analysis）がある。PLSAは、潜在変数の条件付き確率として、文書と単語との共起を表現し、やはり尤度に基づいてこれらの条件付き確率を推定する。

これらのアルゴリズムに共通するのは、いずれも潜在変数を用いることにより、分布のパラメータが決定される点である。したがって、コンテンツ特徴量の分布を表現するための潜在変数と、ラベル情報の分布を表現するための潜在変数とを共通化することにより、それぞれの分布の特徴を反映したかたちの潜在的な概念空間を得ることができる。

よって、本実施例においては、コンテンツ特徴量の分布に関する混合正規分布（GMM）と、ラベル情報の分布に関するPLSAとの、両者の潜在変数を共通化した場合のEMアルゴリズムによるパラメータの推定を一例にして説明する。

図７は、コンテンツ特徴量による混合正規分布（GMM）と、ラベル情報によるPLSAとの潜在変数を共通化したときのグラフィカルモデルの例を示す図である。

図７で示される例において、ｚ_K（=｛ｚ1,ｚ2,ｚ3,・・・，ｚ_K｝（K：潜在変数の個数）、一般的に、ｚ_Kにより表す）は潜在変数（以下、潜在変数ｚ_Kと称する）を示し、ｓ_nはコンテンツ（以下、コンテンツｓ_nとも称する）を示し、ｗ_iはラベル（以下、ラベルｗ_iとも称する）を示す。また、ｐ（ｓ_n｜ｚ_K）は、コンテンツの出現を示す条件付確率を表し、ｐ（ｗ_i｜ｚ_K）は、ラベルの出現を示す条件付確率を表し、それらのｐ（ｓ_n｜ｚ_K）とｐ（ｗ_i｜ｚ_K）とでは、ｐ（ｚ_K）により決定される潜在変数ｚ_Kが共通化されていることになる。

すなわち、コンテンツｓ_nとラベルｗ_iとは、潜在変数ｚ_Kにより対応付けられていることになる。

ここで、例えば、潜在変数ｚ_Kからラベルの出現は、条件付確率ｐ（ｗ_i｜ｚ_K）により決定し、一方、コンテンツ特徴量の分布は、潜在変数ｚ_Kに対応する平均ベクトルと分散共分散行列（例えば、各変数の分散と、すべての変数との組み合わせについての共分散を示す行列）により決定するとした場合、コンテンツｓ_nとラベルｗ_iとの共起確率は、式（１）により表現される。

ここで、式（１）においては、ｐ（ｚ_K）＝α_Kであり、ｐ（ｓ_n｜ｚ_K）は、式（２）により表現される。

なお、式（２）においては、ｆ_nはｎ番目のコンテンツのコンテンツ特徴量を示し、μ_Kは潜在変数ｚ_Kに対応する平均ベクトル（以下、平均ベクトルμ_Kとも称する）を示し、Ｓ_Kは潜在変数ｚ_Kに対応する分散共分散行列（以下、分散共分散行列Ｓ_Kとも称する）を示し、Ｆはコンテンツ特徴量の次元数を示す。

この場合、EMアルゴリズムのQ関数は、式（３）により表現される。

なお、ｃ（ｗ_i，ｓ_n）はコンテンツｓ_nにおけるラベルｗ_iの出現回数または重みを示し、θ^(t)はt回目の繰り返しにおけるパラメータを示す。

したがって、式（３）より、E-step（Expectation Step）は、式（４）により表現される。

また、M-step（Maximization Step）は、式（５）、式（６）、式（７）、式（８）により表現される。

すなわち、対応情報である、μ_K（平均ベクトル）、Ｓ_K（分散共分散行列）、α_K、ｐ（ｗ_i｜ｚ_K）は、それぞれ、式（５）、式（６）、式（７）、式（８）により算出される。

例えば、ステップＳ２１において、対応情報算出部５６は、式（１）乃至式（８）を用いることにより、音楽コンテンツの１０曲（曲１乃至曲１０）のそれぞれに対する、コンテンツ特徴量蓄積部５３に蓄積されている、スピード、明るさ、および音圧を示すコンテンツ特徴量（図４）と、ラベル情報蓄積部５５に蓄積されている、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”を示すラベル情報（図５）を基に、潜在変数ｚ_Kが２つ（ｚ1，ｚ2）（潜在変数が２次元）であるときの対応情報として、μ_K、Ｓ_K、α_K、ｐ（ｗ_i｜ｚ_K）をそれぞれ算出する。

ここで、図８乃至図１３を参照して、対応情報算出部５６により算出される対応情報について、より具体的に説明する。まず、図８乃至図１０を参照して、コンテンツとラベルとの潜在空間上の配置の例について説明する。

図８は、コンテンツの潜在空間表現の例を示す図である。図８は、曲の潜在空間表現、すなわち、条件付確率ｐ（ｚ_K｜ｓ_n）による値の例を示している。

図８で示される例において、１列目と１行目は項目を示し、１列目には、コンテンツ蓄積部５１に蓄積されている音楽コンテンツの名称が示され、１行目には、１列目のコンテンツに関する２つの潜在変数（潜在変数ｚ1、潜在変数ｚ2）が示されている。

例えば、対応情報算出部５６は、図８に示すように、潜在変数ｚ1の値として、曲１（２行目）を0.9、曲２（３行目）を0.7、曲３（４行目）を0.6、曲４（５行目）を0.65、曲５（６行目）を0.6、曲６（７行目）を0.2、曲７（８行目）を0.4、曲８（９行目）を0.1、曲９（１０行目）を0.3、および曲１０（１１行目）を0.4として、それぞれ算出する。

すなわち、曲１乃至曲１０（音楽コンテンツ）のそれぞれは、潜在変数ｚ1により、ラベルと対応付けられることになる。

また、同様に、例えば、対応情報算出部５６は、図８に示すように、潜在変数ｚ2の値として、曲１（２行目）を0.1、曲２（３行目）を0.3、曲３（４行目）を0.4、曲４（５行目）を0.35、曲５（６行目）を0.4、曲６（７行目）を0.8、曲７（８行目）を0.6、曲８（９行目）を0.8、曲９（１０行目）を0.7、および曲１０（１１行目）を0.6として、それぞれ算出する。

すなわち、曲１乃至曲１０（音楽コンテンツ）のそれぞれは、潜在変数ｚ2により、ラベルと対応付けられることになる。

次に、図９は、ラベル（単語）の潜在空間表現の例を示す図である。図９は、音楽コンテンツのレビュー文に含まれている単語の潜在空間表現、すなわち、条件付確率ｐ（ｚ_K｜ｗ_i）による値の例を示している。

図９で示される例において、１列目と１行目は項目を示し、１列目には、コンテンツ蓄積部５１に蓄積されている音楽コンテンツのレビュー文に含まれているラベルが示され、１行目には、１列目のラベルに関する２つの潜在変数（潜在変数ｚ1、潜在変数ｚ2）が示されている。

例えば、対応情報算出部５６は、図９に示すように、潜在変数ｚ1の値として、“ゆったり”（２行目）を0.1、“明るい”（３行目）を0.7、“ノリノリ”（４行目）を0.7、“重い”（５行目）を0.2、および“軽い”（６行目）を0.9として、それぞれ算出する。

すなわち、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”であるラベルのそれぞれが、潜在変数ｚ1により、コンテンツ（音楽コンテンツ）と対応付けられることになる。

また、同様に、対応情報算出部５６は、図９に示すように、潜在変数ｚ2の値として、“ゆったり”（２行目）を0.9、“明るい”（３行目）を0.3、“ノリノリ”（４行目）を0.3、“重い”（５行目）を0.8、および“軽い”（６行目）を0.1として、それぞれ算出する。

すなわち、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”であるラベルのそれぞれが、潜在変数ｚ2により、コンテンツ（音楽コンテンツ）と対応付けられることになる。

次に、図１０は、潜在変数ｚ_Kの事前確率の例を示す図である。図１０は、事前確率ｐ（ｚ_K）＝α_Kによる値の例を示している。

図１０の２行目で示されるように、事前確率ｐ（ｚ_K）＝α_Kは、２つの潜在変数ｚ_Kのうち、潜在変数ｚ1のとき、ｐ（ｚ_K）が0.48となり、潜在変数ｚ2のとき、ｐ（ｚ_K）が0.52となる。

このように、対応情報算出部５６は、潜在変数ｚ_Kを潜在変数ｚ1と潜在変数ｚ2との２つとした場合、式（１）乃至式（８）を用いて、各音楽コンテンツ（曲１乃至曲１０）とラベル（“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”）とを潜在空間中に配置させている。

また、上述したように、対応情報算出部５６は、対応情報として、例えば、平均ベクトルμ_Kおよび分散共分散行列Ｓ_Kを算出する。以下、図１１乃至図１３を参照して、平均ベクトルμ_Kおよび分散共分散行列Ｓ_Kの具体的な例について説明する。

まず、図１１および図１２を参照して、対応情報算出部５６により算出される、潜在変数ｚ_Kに対する分散共分散行列Ｓ_Kについて説明する。

図１１は、潜在変数ｚ1に対する分散共分散行列Ｓ₁の例を示す図である。

図１１で示される例において、１列目と１行目は項目を示し、１列目には、コンテンツ蓄積部５１に蓄積されている音楽コンテンツのコンテンツ特徴量（の名称）が示され、同様に、１行目には、コンテンツ特徴量（の名称）が示されている。

例えば、対応情報算出部５６は、図１１の２行目に示すように、分散共分散行列Ｓ₁の値として、“スピード”と“スピード”とを80、“スピード”と“明るさ”とを-30、および“スピード”と“音圧”とを5として、それぞれ算出する。

また、同様に、例えば、対応情報算出部５６は、図１１の３行目に示すように、分散共分散行列Ｓ₁の値として、“明るさ”と“スピード”とを-30（２行目の左から３番目と同一となる）、“明るさ”と“明るさ”とを100、“明るさ”と“音圧”とを-10として、それぞれ算出する。

さらに、同様に、例えば、対応情報算出部５６は、図１１の４行目に示すように、分散共分散行列Ｓ₁の値として、“音圧”と“スピード”とを5（２行目の左から４番目と同一となる）、“音圧”と“明るさ”とを-10（３行目の左から４番目と同一となる）、“音圧”と“音圧”とを50として、それぞれ算出する。

また、図１２は、潜在変数ｚ2に対する分散共分散行列Ｓ₂の例を示す図である。

図１２で示される例において、１列目と１行目の項目は、図１１と同様であるので、その説明は省略する。

例えば、対応情報算出部５６は、図１２の２行目に示すように、分散共分散行列Ｓ₂の値として、“スピード”と“スピード”とを30、“スピード”と“明るさ”とを30、“スピード”と“音圧”とを10として、それぞれ算出する。

また、同様に、例えば、対応情報算出部５６は、図１２の３行目に示すように、分散共分散行列Ｓ₂の値として、“明るさ”と“スピード”とを30（２行目の左から３番目と同一となる）、“明るさ”と“明るさ”とを90、“明るさ”と“音圧”とを0として、それぞれ算出する。

さらに、同様に、例えば、対応情報算出部５６は、図１２の４行目に示すように、分散共分散行列Ｓ₂の値として、“音圧”と“スピード”とを10（２行目の左から４番目と同一となる）、“音圧”と“明るさ”とを0（３行目の左から４番目と同一となる）、“音圧”と“音圧”とを50として、それぞれ算出する。

次に、図１３を参照して、対応情報算出部５６により算出される、潜在変数ｚ_Kに対する平均ベクトルμ_Kについて説明する。すなわち、図１３は、潜在変数ｚ1に対する平均ベクトルμ₁と、潜在変数ｚ2に対する平均ベクトルμ₂との例を示している図である。

例えば、対応情報算出部５６は、図１３に示すように、潜在変数ｚ1に対する平均ベクトルμ₁の値として、スピード（２行目）を58、明るさ（３行目）を63、音圧（４行目）を59として、それぞれ算出する。

また、同様に、例えば、対応情報算出部５６は、図１３に示すように、潜在変数ｚ2に対する平均ベクトルμ₂の値として、スピード（２行目）を42、明るさ（３行目）を39、音圧（４行目）を40として、それぞれ算出する。

このように、対応情報算出部５６は、潜在変数ｚ1と潜在変数ｚ2に対する、分散共分散行列Ｓ₁、分散共分散行列Ｓ₂、平均ベクトルμ₁、および平均ベクトルμ₂のそれぞれを算出する。

なお、上述した例において、対応情報算出部５６による対応情報算出の処理は、混合正規分布（GMM）とPLSAとの組み合わせを一例として説明したが、コンテンツ特徴量の分布は正規分布などに限らず、例えば、SAM（Semantic Aggregation Model）や、他のパラメトリックな分布に対して適用可能となる。また、パラメータの推定方法においても、上述したEMアルゴリズムに限らず、他の手法により行うようにしてもよい。

図６のフローチャートに戻り、ステップＳ２２において、対応情報算出部５６は、算出されたコンテンツ特徴量と潜在空間との対応情報をコンテンツ特徴量-潜在空間対応情報蓄積部５７に蓄積させる。

例えば、ステップＳ２２において、対応情報算出部５６は、対応情報として、各潜在変数ｚ_Kに対応する、α_K、分散共分散行列Ｓ_k、および平均ベクトルμ_kをコンテンツ特徴量-潜在空間対応情報蓄積部５７に蓄積させる。すなわち、上述した例の場合、コンテンツ特徴量-潜在空間対応情報蓄積部５７には、例えば、図１０のα₁とα₂、図１１の分散共分散行列Ｓ₁、図１２の分散共分散行列Ｓ₂、および図１３の平均ベクトルμ₁と平均ベクトルμ₂がそれぞれ蓄積される。

ステップＳ２３において、対応情報算出部５６は、算出されたラベル情報と潜在空間との対応情報をラベル情報-潜在空間対応情報蓄積部５８に蓄積させて、対応情報の算出の処理は終了する。

例えば、ステップＳ２３において、対応情報算出部５６は、対応情報として、すべての潜在変数ｚ_Kとラベルｗ_iとの組み合わせに対する、ｐ（ｗ_i｜ｚ_K）とα_K＝ｐ（ｚ_K）をラベル情報-潜在空間対応情報蓄積部５８に蓄積させる。すなわち、上述した例の場合、ラベル情報-潜在空間対応情報蓄積部５８には、例えば、図９に示す例と同様の、潜在変数ｚ1および潜在変数ｚ2と、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”とのｐ（ｗ_i｜ｚ_K）、並びに、図１０のα_K＝ｐ（ｚ_K）が蓄積される。

なお、このとき、各コンテンツとラベルとの潜在空間上での表現は、それぞれ、ｐ（ｚ_K｜ｓ_n）、ｐ（ｚ_K｜ｗ_i）（K=1,2,・・・,K）となる。

以上のように、コンテンツ提供装置１は、学習の処理を行うことにより、コンテンツ特徴量-潜在空間対応情報蓄積部５７とラベル情報-潜在空間対応情報蓄積部５８のそれぞれに、対応情報を蓄積することになる。

換言すれば、コンテンツ提供装置１は、学習の処理を行うことにより、異なる分布を持っているコンテンツ特徴量とラベル情報とを、潜在変数ｚ_Kにより１つの潜在空間中で統合させる。その結果、コンテンツ提供装置１は、コンテンツとラベルとを対応付けることになる。

このように、学習フェーズにおいては、異なる分布を持っている、コンテンツとラベルとを１つの潜在空間（潜在変数ｚ_K）により統合することができる。

次に、上述したように、図１４乃至図１６を参照して、運用フェーズについて説明する。また、運用フェーズの説明では、最初に、あるコンテンツ（音楽コンテンツ）に対して、ラベルを付与する処理を説明し、その後、あるキーワード（ラベル）に一致しているコンテンツ（音楽コンテンツ）を検索する処理を説明する。

まず、図１４のフローチャートを参照して、コンテンツ提供装置１による、ある音楽コンテンツに対して、ラベルを付与する処理について説明する。なお、この処理は、例えば、ユーザにより新規の音楽コンテンツが追加されたときに開始される。

ステップＳ３１において、コンテンツ特徴量抽出部５２は、コンテンツからコンテンツ特徴量を抽出し、抽出したコンテンツ特徴量をコンテンツ特徴量蓄積部５３に蓄積（保存）させる。

例えば、ステップＳ３１において、コンテンツ特徴量抽出部５２は、新規に追加される音楽コンテンツＳ_NEWから、コンテンツ特徴量ｆ_NEW=（“スピード”,“明るさ”,“音圧”）=（55,65,45）を抽出し、抽出したコンテンツ特徴量ｆ_NEWをコンテンツ特徴量蓄積部５３に蓄積させる。

換言すれば、コンテンツ特徴量抽出部５２は、新規に追加される音楽コンテンツＳ_NEWからコンテンツ特徴量を抽出することにより、１つの音楽コンテンツに対して、１つのベクトルをコンテンツ特徴量蓄積部５３に蓄積させているとも言える。

ステップＳ３２において、コンテンツ特徴量-潜在空間変換部５９は、コンテンツ特徴量-潜在空間対応情報蓄積部５７に蓄積されている対応情報を基に、抽出されたコンテンツ特徴量が潜在空間中に配置されるように変換し、変換された結果を潜在空間距離算出部６１に供給する。

例えば、ステップＳ３２において、コンテンツ特徴量-潜在空間変換部５９は、コンテンツ特徴量-潜在空間対応情報蓄積部５７に蓄積されている、分散共分散行列Ｓ_K（例えば、図１１の分散共分散行列Ｓ₁および図１２の分散共分散行列Ｓ₂）と平均ベクトルμ_K（図１３の平均ベクトルμ₁と平均ベクトルμ₂）とを用いて、コンテンツ特徴量ｆ_NEW=（55,65,45）を潜在空間中に配置されるよう変換する（マッピングする）。

具体的には、コンテンツ特徴量から潜在空間への変換は、上述した学習フェーズ（図３のフローチャートの処理）により得られた分布パラメータを利用することにより、例えば、式（９）により算出される。

すなわち、ｐ（ｚ₁｜Ｓ_NEW），ｐ（ｚ₂｜Ｓ_NEW）のそれぞれは、式（９）を用いて、以下に示すようにして算出される。

ｐ（ｚ₁｜Ｓ_NEW）＝ｐ（ｚ₁）Ｎ（ｆ_NEW,μ_1,Ｓ₁）=0.48×1.48×10^-5=7.09×10^-6

ｐ（ｚ₂｜Ｓ_NEW）＝ｐ（ｚ₂）Ｎ（ｆ_NEW,μ_2,Ｓ₂）=0.52×2.98×10^-6=1.43×10^-6

以上のようにして算出された、ｐ（ｚ₁｜Ｓ_NEW）=7.09×10^-6と、ｐ（ｚ₂｜Ｓ_NEW）=1.43×10^-6とを正規化することにより、ｐ（ｚ｜Ｓ_NEW）=（0.83，0.17）が算出される。

なお、音楽コンテンツの事前確率ｐ（ｓ_n）は、一般に自明ではないので、すべて等確率として扱うが、観測値全体の分布を利用して計算するようにしてもよい。

ステップＳ３３において、潜在空間距離算出部６１は、コンテンツ特徴量-潜在空間変換部５９から供給された、コンテンツ特徴量を潜在空間中に配置されるように変換した処理結果およびラベル情報-潜在空間対応情報蓄積部５８に蓄積されている対応情報を基に、コンテンツとラベルとの距離を算出し、算出した距離の結果をラベル選択部６２に供給する。

具体的には、コンテンツとラベルとの距離の算出は、例えば、ラベルの条件付確率を利用して、式（１０）により算出される。

また、コンテンツとラベルとの距離であるが、上述した式（１０）に限らず、例えば、コンテンツの潜在空間中での表現、ｐ（ｚ_K｜ｓ_n）と、ラベルの潜在空間での表現ｐ（ｚ_K｜ｗ_i）とのカルバック-ライブラー距離（Kullback-Leibler Divergence）や、ジェンセン-シャノン距離（Jensen-Shannon Divergence）（以下、JS距離とも称する）などを用いてもよい。

カルバック-ライブラー距離は、例えば、式（１１）により算出される。

また、ジェンセン-シャノン距離は、例えば、式（１２）により算出される。

なお、実際には、潜在空間はユークリット空間とならないが、より簡略化するために、ユークリット距離や各K（潜在変数の個数）に関する要素の差の総和などを用いるようにしてもよい。

すなわち、例えば、潜在空間距離算出部６１は、コンテンツ特徴量-潜在空間変換部５９から供給されたｐ（ｚ_K｜Ｓ_NEW）=（0.83，0.17）およびラベル情報-潜在空間対応情報蓄積部５８に蓄積されているｐ（ｗ_i｜ｚ_K）とα_K＝ｐ（ｚ_K）を基に、式（１２）を用いて、潜在空間中における、コンテンツとラベルとの距離（JS距離）を算出する。

図１５は、潜在空間距離算出部６１により算出される、コンテンツとラベルとの距離の例を示す図である。

図１５で示される例において、１列目は、例えば、ラベル情報-潜在空間対応情報蓄積部５８に蓄積されているラベル（各単語）を示し、２列目は、潜在空間距離算出部６１により算出されるコンテンツと１列目のラベルとの距離を示す。なお、図１５の例では、式（１２）を用いて、コンテンツとラベルとの距離（JS距離）を算出している。

例えば、潜在空間距離算出部６１は、図１５に示すように、音楽コンテンツＳ_NEWと“ゆったり”である単語とのJS距離（２行目）が0.3000、音楽コンテンツＳ_NEWと“明るい”である単語とのJS距離（３行目）が0.0119、音楽コンテンツＳ_NEWと“ノリノリ”である単語とのJS距離（４行目）が0.0119となることをそれぞれ算出する。

また、同様に、例えば、潜在空間距離算出部６１は、図１５に示すように、音楽コンテンツＳ_NEWと“重い”である単語とのJS距離（５行目）が0.2150、音楽コンテンツＳ_NEWと“軽い”である単語とのJS距離（６行目）が0.0053となることをそれぞれ算出する。

このように、例えば、潜在空間距離算出部６１は、図１５に示される、コンテンツとラベルとの距離を算出し、算出した距離の結果をラベル選択部６２に供給する。

図１４のフローチャートに戻り、ステップＳ３４において、ラベル選択部６２は、潜在空間距離算出部６１から供給された距離の結果を基に、ラベルを選択して、ラベル付与の処理は終了する。

例えば、ステップＳ３４において、ラベル選択部６２は、潜在空間距離算出部６１から供給された距離の結果が、図１５のコンテンツとラベルとの距離である場合、それらのJS距離のより近い、“軽い”（JS距離=0.0053）と“明るい”（JS距離=0.0119）の２つを、この新規に追加された音楽コンテンツＳ_NEWに付与するラベルとして選択する。

なお、新規に追加された音楽コンテンツＳ_NEWに対して付与するラベルの数は、上述した２つに限らず、例えば、コンテンツとラベルとの距離が所定の閾値以下となるラベルか、または距離の近いラベルの上位Ｎ個（Ｎは整数）を選択するなどしてもよい。

また、ラベル選択部６２により選択された、コンテンツに付与されたラベルであるが、例えば、出力部１７の画面に表示させることで、直接ユーザに対して提示するようにしてもよいし、また、メタデータとして蓄積しておき、例えば、コンテンツの検索などに用いるようにしてもよい。

以上のようにして、コンテンツ提供装置１は、あるコンテンツに対して、より最適となるラベルを付与する。

このように、コンテンツ特徴量とラベル情報のそれぞれの分布の特徴を反映した潜在空間（潜在変数）により、ラベルを持っていないコンテンツに対しても、そのコンテンツに、より最適なラベルを付与することができる。その結果、コンテンツにキーワード（ラベル）を付与する人手による作業がなくなるので、コストを削減することができる。

次に、図１６のフローチャートを参照して、コンテンツ提供装置１による、コンテンツ検索の処理について説明する。なお、この処理は、例えば、ユーザによりユーザインターフェースを介して、所定のラベルに適合するコンテンツの検索を指示されたときに開始される。

ステップＳ４１において、ラベル情報-潜在空間変換部６０は、ラベル情報-潜在空間対応情報蓄積部５８に蓄積されている対応情報を基に、対象となるラベルが潜在空間中に配置されるように変換し、変換された結果を潜在空間距離算出部６１に供給する。

例えば、ステップＳ４１において、ラベル情報-潜在空間変換部６０は、ユーザにより“明るい”であるラベルが指示された場合、ラベル情報-潜在空間対応情報蓄積部５８に蓄積されている、すべての潜在変数ｚ_Kとラベルｗ_iとの組み合わせに対する、ｐ（ｗ_i｜ｚ_K）とα_K＝ｐ（ｚ_K）を基に、“明るい”であるラベルが潜在空間中に配置されるように変換（マッピング）し、変換された結果（ｐ（ｚ_K｜ｗ_i））を潜在空間距離算出部６１に供給する。

具体的には、ラベルの潜在空間への変換は、例えば、式（１３）により算出される。

なお、ここでは、ラベル（単語）の事前確率ｐ（ｗ_i）は自明ではないので、等確率としたが、観測値の分布を用いるようにしてもよい。

ステップＳ４２において、潜在空間距離算出部６１は、ラベル情報-潜在空間変換部６０から供給された、ラベル情報を潜在空間中に配置されるように変換した処理結果およびコンテンツ特徴量-潜在空間対応情報蓄積部５７に蓄積されている対応情報を基に、コンテンツとラベルとの距離を算出し、算出した距離の結果をコンテンツ選択部６３に供給する。

例えば、ステップＳ４２において、潜在空間距離算出部６１は、ラベル情報-潜在空間変換部６０から供給されたｐ（ｚ_K｜ｗ_i）およびコンテンツ特徴量-潜在空間対応情報蓄積部５７に蓄積されている、各潜在変数ｚ_Kに対応する、α_K、分散共分散行列Ｓ_k、および平均ベクトルμ_kを基に、上述した式（１２）を用いて、潜在空間中における、コンテンツとラベルとの距離を算出する。

なお、コンテンツとラベルとの距離の算出方法であるが、図１４のステップＳ３３の処理と同様に、式（１２）のジェンセン-シャノン距離に限らず、例えば、ラベルの条件付確率（式（１０））、カルバック-ライブラー距離（式（１１））、またはユークリット距離などを用いるようにしてもよい。

図１７は、ユーザにより“明るい”であるラベルが指示された場合の、潜在空間距離算出部６１により算出される、コンテンツとラベルとの距離の例を示す図である。

例えば、潜在空間距離算出部６１は、図１７に示すように、“明るい”であるラベルと曲１とのJS距離（２行目）が0.3100、“明るい”であるラベルと曲２とのJS距離（３行目）が0.0051、“明るい”であるラベルと曲３とのJS距離（４行目）が“0.0022、“明るい”であるラベルと曲４とのJS距離（５行目）が0.1114、“明るい”であるラベルと曲５とのJS距離（６行目）が0.2547となることをそれぞれ算出する。

また、同様に、例えば、潜在空間距離算出部６１は、図１７に示すように、“明るい”であるラベルと曲６とJS距離（７行目）が0.0947、“明るい”であるラベルと曲７とのJS距離（８行目）が0.1473、“明るい”であるラベルと曲８とのJS距離（９行目）が0.4123、“明るい”であるラベルと曲９とのJS距離（１０行目）が0.1119、“明るい”であるラベルと曲１０とのJS距離（１１行目）が0.3451となることをそれぞれ算出する。

さらに、同様に、例えば、潜在空間距離算出部６１は、図１７の１２行目に示すように、図１４のフローチャートの処理により、“軽い”と“明るい”であるラベルが付与された音楽コンテンツＳ_NEWを示す曲１１と、“明るい”であるラベルとのJS距離が0.0049となることを算出する。

このように、例えば、潜在空間距離算出部６１は、図１７に示される、コンテンツとラベルとの距離を算出し、算出した距離の結果をコンテンツ選択部６３に供給する。

図１６のフローチャートに戻り、ステップＳ４３において、コンテンツ選択部６３は、潜在空間距離算出部６１から供給された距離の結果を基に、コンテンツを選択して、コンテンツ検索の処理は終了する。

例えば、ステップＳ４３において、コンテンツ選択部６３は、潜在空間距離算出部６１から供給された距離の結果が、図１７のコンテンツとラベルとの距離である場合、それらのJS距離のより近い、曲３（JS距離=0.0022）、曲１１（JS距離=0.0049）、曲２（JS距離=0.0051）の上位３つを、“明るい”であるラベルに対応するコンテンツとして選択して、出力部１７の画面などに表示させる。

なお、選択されるコンテンツの数は、上述した３つに限らず、例えば、コンテンツとラベルとの距離が所定の閾値以下となるコンテンツか、または距離の近いコンテンツの上位Ｎ個（Ｎは整数）を選択するなどしてもよい。

また、上述したように、選択されるコンテンツは、学習フェーズにおいて利用したコンテンツに限らず、運用フェーズにおいて、後から追加されたコンテンツ（例えば、音楽コンテンツＳ_NEW）も含んでいるものとする。

さらに、例えば、ユーザにより指定されたラベルが、ラベル情報-潜在空間対応情報蓄積部５８に存在しない場合、あらかじめ別のデータ（例えば、ラベルが単語である場合には、一般のコーパスやそのコンテンツの属する領域での文書データなど）を利用してより多くのラベルを含むようなモデル（補助モデル）を構築しておき、その補助モデルの中の、（学習フェーズで登場した）既知のラベルの中で指定された未知のラベルと最も近いものを代替クエリとして使用するようにしてもよい。

以上のようにして、コンテンツ提供装置１は、ラベルに対応するコンテンツを検索する。

このように、コンテンツ特徴量とラベル情報のそれぞれの分布の特徴を反映した潜在空間（潜在変数）により、キーワード（ラベル）からコンテンツを検索することができる。その結果、ユーザは、所望のコンテンツを取得することができる。

ところで、上述した例においては、コンテンツ特徴量とラベル情報との対応付けについて説明してきたが、本発明はこれに限らず、例えば、ラベル情報やコンテンツ特徴量と後述するコンテクスト情報とを対応付けしたり、ラベル情報やコンテンツ特徴量と後述する嗜好情報とを対応付けしたりすることもできる。

まず、図１８乃至図２１を参照して、ラベル情報およびコンテンツ特徴量と、コンテクスト情報との対応付けについて説明する。

図１８は、コンテンツ提供装置１の機能的構成例の他の例について説明するブロック図である。

なお、図１８では、図２と同様の箇所には、同一の符号が付してありその説明は省略する。すなわち、図１８において、コンテンツ提供装置１は、図２のブロック図と比較して、コンテクスト情報抽出部１１１、コンテクスト情報蓄積部１１２、およびコンテクスト情報-潜在空間対応情報蓄積部１１３をさらに含むようにして構成されている。

コンテクスト情報抽出部１１１は、コンテンツ蓄積部５１に蓄積されているコンテンツに関するコンテクスト情報を抽出する。コンテクスト情報抽出部１１１は、抽出したコンテクスト情報をコンテクスト情報蓄積部１１２に蓄積（保存）させる。

ここで、コンテクスト情報とは、ユーザがコンテンツを体験する際の、コンテンツそのもの以外の情報である。コンテクスト情報は、例えば、ユーザがコンテンツを体験した時間、季節、場所、天候、気分、一緒にいた人などとなる。

対応情報算出部５６は、コンテンツ特徴量蓄積部５３に蓄積されているコンテンツ特徴量と、ラベル情報蓄積部５５に蓄積されているラベル情報との対応情報を算出する。対応情報算出部５６は、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部５７およびラベル情報-潜在空間対応情報蓄積部５８のそれぞれに蓄積（保存）させる。

また、対応情報算出部５６は、ラベル情報蓄積部５５に蓄積されているラベル情報と、コンテクスト情報蓄積部１１２に蓄積されているコンテクスト情報との対応情報を算出する。対応情報算出部５６は、算出した対応情報をラベル情報-潜在空間対応情報蓄積部５８およびコンテクスト情報-潜在空間対応情報蓄積部１１３のそれぞれに蓄積（保存）させる。

さらに、対応情報算出部５６は、コンテンツ特徴量蓄積部５３に蓄積されているコンテンツ特徴量と、コンテクスト情報蓄積部１１２に蓄積されているコンテクスト情報との対応情報を算出する。対応情報算出部５６は、算出した対応情報をコンテンツ特徴量-潜在空間対応情報蓄積部５７およびコンテクスト情報-潜在空間対応情報蓄積部１１３のそれぞれに蓄積（保存）させる。

なお、ここで、対応情報は、コンテンツ、ラベル、またはコンテクストのそれぞれを対応付けるための情報となる。対応情報は、例えば、潜在変数ｚ_Kにより、コンテンツ、ラベル、またはコンテクストのそれぞれを結び付ける。

また、上述した例においては、コンテンツ特徴量-潜在空間対応情報蓄積部５７、ラベル情報-潜在空間対応情報蓄積部５８、およびコンテクスト情報-潜在空間対応情報蓄積部１１３のそれぞれを別々にするとして説明したが、それらを１つにまとめることも可能である。そのとき、コンテンツ特徴量-潜在空間対応情報蓄積部５７、ラベル情報-潜在空間対応情報蓄積部５８、およびコンテクスト情報-潜在空間対応情報蓄積部１１３のいずれかが、すべての対応情報を蓄積することになる。

次に、図１９のフローチャートを参照して、図１８のコンテンツ提供装置１による、学習の処理について説明する。

ステップＳ５１およびステップＳ５２の処理のそれぞれは、図３のステップＳ１１およびステップＳ１２の処理のそれぞれと同様であるのでその説明は省略する。

ステップＳ５３において、コンテクスト情報抽出部１１１は、コンテンツ蓄積部５１に蓄積されているコンテンツに関するコンテクスト情報を抽出し、抽出したコンテクスト情報をコンテクスト情報蓄積部１１２に蓄積（保存）させる。例えば、ステップＳ５３において、コンテクスト情報抽出部１１１は、コンテンツ蓄積部５１に蓄積されている音楽コンテンツに対して、その曲がどの時間帯に聴かれたか、またはその曲がどの場所で聴かれたかを示すコンテクスト情報を抽出し、抽出したそれらのコンテクスト情報をコンテクスト情報蓄積部１１２に蓄積させる。

具体的には、コンテンツ蓄積部５１に蓄積されている音楽コンテンツとして、例えば、曲１乃至曲１０のそれぞれが蓄積されている場合、コンテクスト情報抽出部１１１は、図２０の例に示すようなコンテクスト情報を抽出する。

図２０は、音楽コンテンツに関するコンテクスト情報の例を示す図である。

図２０で示される例において、１列目と１行目は項目を示し、１列目には、コンテンツ蓄積部５１に蓄積されている音楽コンテンツの名称が示され、１行目には、１列目の音楽コンテンツに関するコンテクスト情報、すなわち、それらの音楽コンテンツが、朝、昼、晩のどの時間帯に聴かれたかと、自宅、屋外、通勤のどの場所で聴かれたかが示されている。

すなわち、例えば、コンテクスト情報抽出部１１１は、図２０に示すように、曲１（２行目）が、時間帯ごとにみると、朝に３回、昼に４回、晩に２回ずつ聴かれ、かつ、場所ごとにみると、自宅で２回、屋外で３回、通勤中に４回ずつ聴かれ、曲２（３行目）が、朝に５回、昼に４回、晩に２回ずつ聴かれ、かつ、自宅で３回、屋外で２回、通勤中に３回ずつ聴かれ、曲３（４行目）が、朝に３回、昼に３回、晩に１回ずつ聴かれ、かつ、自宅で３回、屋外で３回、通勤中に５回ずつ聴かれ、曲４（５行目）が、朝に４回、昼に３回、晩に２回ずつ聴かれ、かつ、自宅で２回、屋外で３回、通勤中に３回ずつ聴かれていることを示すコンテクスト情報をそれぞれ抽出する。

また、同様に、例えば、コンテクスト情報抽出部１１１は、曲５（６行目）が、朝に４回、昼に２回、晩に３回ずつ聴かれ、かつ、自宅で２回、屋外で２回、通勤中に４回ずつ聴かれ、曲６（７行目）が、朝に２回、昼に３回、晩に４回ずつ聴かれ、かつ、自宅で３回、屋外で３回、通勤中に２回ずつ聴かれ、曲７（８行目）が、朝に３回、昼に１回、晩に３回ずつ聴かれ、かつ、自宅で３回、屋外で３回、通勤中に２回ずつ聴かれていることを示すコンテクスト情報をそれぞれ抽出する。

さらに、同様に、例えば、コンテクスト情報抽出部１１１は、曲８（９行目）が、朝に１回、昼に２回、晩に５回ずつ聴かれ、かつ、自宅で４回、屋外で３回、通勤中に３回ずつ聴かれ、曲９（１０行目）が、朝に２回、昼に２回、晩に４回ずつ聴かれ、かつ、自宅で５回、屋外で２回、通勤中に２回ずつ聴かれて、曲１０（１１行目）が、朝に１回、昼に２回、晩に３回ずつ聴かれ、自宅で４回、屋外で３回、通勤中に３回ずつ聴かれていることを示すコンテクスト情報をそれぞれ抽出する。

図１９のフローチャートに戻り、ステップＳ５４において、対応情報算出部５６は、コンテンツ特徴量蓄積部５３に蓄積されているコンテンツ特徴量、ラベル情報蓄積部５５に蓄積されているラベル情報、またはコンテクスト情報蓄積部１１２に蓄積されているコンテクスト情報を基に、それらの対応情報を算出し、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部５７、ラベル情報-潜在空間対応情報蓄積部５８、またはコンテクスト情報-潜在空間対応情報蓄積部１１３に蓄積させて、学習の処理は終了する。

ここで、コンテンツ特徴量、ラベル情報、またはコンテクスト情報の潜在空間表現は、上述したコンテンツ特徴量とラベル情報との関係と同様に共通の潜在変数ｚ_Kを持ちつつ、さらに、それぞれ別の分布関数を用いて、上述した方法（図３のステップＳ１３の処理）と同様に算出することができる。

すなわち、対応情報算出部５６は、図３のステップＳ１３の処理と同様にして、コンテンツ、ラベル、またはコンテクストの対応情報を算出する。

具体的には、例えば、図２０で示されるコンテクスト情報のように、それらの音楽コンテンツが、朝、昼、晩のどの時間帯に聴かれたかと、自宅、屋外、通勤のどの場所で聴かれたかとを蓄積（保存）しておくことにより、対応情報算出部５６は、コンテンツ特徴量（図４）、ラベル情報（図５）、およびコンテクスト情報（図２０）を基に、対応情報を算出する。

図２１は、コンテクスト情報の潜在空間表現の例を示す図である。

図２１で示される例において、１列目と１行目は項目を示し、１列目には、コンテクストが示され、１行目には、１列目のコンテクストに関する２つの潜在変数（潜在変数ｚ1、潜在変数ｚ2）が示されている。

例えば、対応情報算出部５６は、図２１に示すように、潜在変数ｚ1の値として、朝（２行目）を0.8、昼（３行目）を0.7、晩（４行目）を0.23、自宅（５行目）を0.3、屋外（６行目）を0.45、および通勤（７行目）を0.9として、それぞれ算出する。

すなわち、朝、昼、晩、自宅、屋外、および通勤であるコンテクストのそれぞれが、潜在変数ｚ1により、コンテンツまたはラベルと対応付けられることになる。

また、同様に、例えば、対応情報算出部５６は、図２１に示すように、潜在変数ｚ2の値として、朝（２行目）を0.2、昼（３行目）を0.3、晩（４行目）を0.77、自宅（５行目）を0.7、屋外（６行目）を0.55、および通勤（７行目）を0.2として、それぞれ算出する。

すなわち、朝、昼、晩、自宅、屋外、および通勤であるコンテクストのそれぞれが、潜在変数ｚ2により、コンテンツまたはラベルと対応付けられることになる。

このように、本発明では、例えば、音楽コンテンツ（例えば、曲１乃至曲１０）のそれぞれを、「朝/昼/晩」のどの時間帯に聴いたか、または「自宅/屋外/通勤」のどの場所で聴いたかを蓄積しておくことにより、上述した、コンテンツ特徴量やラベル情報と組み合わせることができる。そして、コンテンツ特徴量、ラベル情報、またはコンテクスト情報を組み合わせることにより、それぞれの分布の傾向が加味された潜在空間を生成することができ、コンテクストは、例えば、図２１に示すように潜在空間にマッピングされることになる。

これにより、運用フェーズでは、上述した、図１６のフローチャートと同様に、例えば、ユーザにより、「朝、自宅で聴きたい音楽コンテンツ」を指示された場合、コンテンツ提供装置１は、「朝」であるコンテクストと、「自宅」であるコンテクストに近い音楽コンテンツを選択することになる。

なお、コンテクストとコンテンツとの距離計算や、コンテクストとラベルとの距離計算であるが、これも、図１６のステップＳ４２と同様に算出されることになる。

また、コンテンツに対するコンテクスト情報は、ユーザにより異なるが、１人のユーザに関するコンテクスト情報でもよいし、または複数のユーザによるコンテクスト情報を加算したものであってもよい。

次に、図２２乃至図２５を参照して、ラベル情報およびコンテンツ特徴量と、嗜好情報との対応付けについて説明する。

図２２は、コンテンツ提供装置１の機能的構成例の他の例について説明するブロック図である。

なお、図２２では、図２と同様の箇所には、同一の符号が付してありその説明は省略する。すなわち、図２２において、コンテンツ提供装置１は、図２のブロック図と比較して、嗜好情報抽出部１５１、嗜好情報蓄積部１５２、および嗜好情報-潜在空間対応情報蓄積部１５３をさらに含むようにして構成されている。

嗜好情報抽出部１５１は、コンテンツ蓄積部５１に蓄積されているコンテンツに関する嗜好情報を抽出する。嗜好情報抽出部１５１は、抽出した嗜好情報を嗜好情報蓄積部１５２に蓄積（保存）させる。

ここで、嗜好情報とは、ユーザによるコンテンツの好みに関する情報である。嗜好情報は、例えば、各ユーザによるコンテンツに関する評価を示す情報（評価情報）などとなる。

また、対応情報算出部５６は、ラベル情報蓄積部５５に蓄積されているラベル情報と、嗜好情報蓄積部１５２に蓄積されている嗜好情報との対応情報を算出する。対応情報算出部５６は、算出した対応情報をラベル情報-潜在空間対応情報蓄積部５８および嗜好情報-潜在空間対応情報蓄積部１５３のそれぞれに蓄積（保存）させる。

さらに、対応情報算出部５６は、コンテンツ特徴量蓄積部５３に蓄積されているコンテンツ特徴量と、嗜好情報蓄積部１５２に蓄積されている嗜好情報との対応情報を算出する。対応情報算出部５６は、算出した対応情報をコンテンツ特徴量-潜在空間対応情報蓄積部５７および嗜好情報-潜在空間対応情報蓄積部１５３のそれぞれに蓄積（保存）させる。

なお、ここで、対応情報は、コンテンツ、ラベル、または嗜好情報のそれぞれを対応付けるための情報となる。対応情報は、例えば、潜在変数ｚ_Kにより、コンテンツ、ラベル、または嗜好情報のそれぞれを結び付ける。

また、上述した例においては、コンテンツ特徴量-潜在空間対応情報蓄積部５７、ラベル情報-潜在空間対応情報蓄積部５８、および嗜好情報-潜在空間対応情報蓄積部１５３のそれぞれを別々にするとして説明したが、それらを１つにまとめることも可能である。そのとき、コンテンツ特徴量-潜在空間対応情報蓄積部５７、ラベル情報-潜在空間対応情報蓄積部５８、および嗜好情報-潜在空間対応情報蓄積部１５３のいずれかが、すべての対応情報を蓄積することになる。

次に、図２３のフローチャートを参照して、図２２のコンテンツ提供装置１による、学習の処理について説明する。

ステップＳ６１およびステップＳ６２の処理のそれぞれは、図３のステップＳ１１およびステップＳ１２の処理のそれぞれと同様であるのでその説明は省略する。

ステップＳ６３において、嗜好情報抽出部１５１は、コンテンツ蓄積部５１に蓄積されているコンテンツに関する嗜好情報を抽出し、抽出した嗜好情報を嗜好情報蓄積部１５２に蓄積（保存）させる。例えば、ステップＳ６３において、嗜好情報抽出部１５１は、コンテンツ蓄積部５１に蓄積されている音楽コンテンツに対して、各ユーザ（例えば、ユーザ１、ユーザ２、ユーザ３、ユーザ４、およびユーザ５）の評価情報を示す嗜好情報を抽出し、抽出したそれらの嗜好情報を嗜好情報蓄積部１５２に蓄積させる。

具体的には、コンテンツ蓄積部５１に蓄積されている音楽コンテンツとして、例えば、曲１乃至曲１０のそれぞれが蓄積されている場合、嗜好情報抽出部１５１は、図２４の例に示すような嗜好情報を抽出する。

図２４は、音楽コンテンツに関する嗜好情報の例を示す図である。

図２４で示される例において、１列目と１行目は項目を示し、１列目には、コンテンツ蓄積部５１に蓄積されている音楽コンテンツの名称が示され、１行目には、１列目の音楽コンテンツに関する嗜好情報、すなわち、それらの音楽コンテンツに対する、ユーザ１、ユーザ２、ユーザ３、ユーザ４、およびユーザ５のそれぞれの評価情報（例えば、図２４では、つまらないと感じた曲に「1」、楽しいと感じた曲に「5」を評価する５段階評価）が示されている。

すなわち、例えば、嗜好情報抽出部１５１は、図２４に示すように、曲１（２行目）に対して、ユーザ１が3、ユーザ２が4、ユーザ３が2、ユーザ４が2、ユーザ５が4にそれぞれ評価し、曲２（３行目）に対して、ユーザ１が5、ユーザ２が4、ユーザ３が2、ユーザ４が3、ユーザ５が3にそれぞれ評価し、曲３（４行目）に対して、ユーザ１が3、ユーザ２が3、ユーザ３が1、ユーザ４が3、ユーザ５が5にそれぞれ評価し、曲４（５行目）に対して、ユーザ１が4、ユーザ２が3、ユーザ３が2、ユーザ４が2、ユーザ５が3にそれぞれ評価したことを示す嗜好情報をそれぞれ抽出する。

また、同様に、例えば、嗜好情報抽出部１５１は、図２４に示すように、曲５（６行目）に対して、ユーザ１が4、ユーザ２が2、ユーザ３が3、ユーザ４が2、ユーザ５が4にそれぞれ評価し、曲６（７行目）に対して、ユーザ１が2、ユーザ２が3、ユーザ３が4、ユーザ４が3、ユーザ５が2にそれぞれ評価し、曲７（８行目）に対して、ユーザ１が3、ユーザ２が1、ユーザ３が3、ユーザ４が3、ユーザ５が2にそれぞれ評価したことを示す嗜好情報をそれぞれ抽出する。

さらに、同様に、例えば、嗜好情報抽出部１５１は、図２４に示すように、曲８（９行目）に対して、ユーザ１が1、ユーザ２が2、ユーザ３が5、ユーザ４が4、ユーザ５が3にそれぞれ評価し、曲９（１０行目）に対して、ユーザ１が2、ユーザ２が2、ユーザ３が4、ユーザ４が5、ユーザ５が2にそれぞれ評価し、曲１０（１１行目）に対して、ユーザ１が1、ユーザ２が2、ユーザ３が3、ユーザ４が4、ユーザ５が3にそれぞれ評価したことを示す嗜好情報をそれぞれ抽出する。

図２３のフローチャートに戻り、ステップＳ６４において、対応情報算出部５６は、コンテンツ特徴量蓄積部５３に蓄積されているコンテンツ特徴量、ラベル情報蓄積部５５に蓄積されているラベル情報、または嗜好情報蓄積部１５２に蓄積されている嗜好情報を基に、それらの対応情報を算出し、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部５７、ラベル情報-潜在空間対応情報蓄積部５８、または嗜好情報-潜在空間対応情報蓄積部１５３に蓄積させて、学習の処理は終了する。

ここで、コンテンツ特徴量、ラベル情報、または嗜好情報の潜在空間表現は、上述したコンテンツ特徴量とラベル情報との関係と同様に共通の潜在変数ｚ_Kを持ちつつ、さらに、それぞれ別の分布関数を用いて、上述した方法（図３のステップＳ１３の処理）と同様に算出することができる。

すなわち、対応情報算出部５６は、図３のステップＳ１３の処理と同様にして、コンテンツ、ラベル、または嗜好情報の対応情報を算出する。

具体的には、例えば、図２４で示される嗜好情報のように、各ユーザによる評価情報を蓄積（保存）しておくことにより、対応情報算出部５６は、コンテンツ特徴量（図４）、ラベル情報（図５）、および嗜好情報（図２４）を基に、対応情報を算出する。

図２５は、嗜好情報の潜在空間表現の例を示す図である。

図２５で示される例において、１列目と１行目は項目を示し、１列目には、嗜好情報の名称（コンテンツを評価したユーザ名）が示され、１行目には、１列目のコンテンツに関する２つの潜在変数（潜在変数ｚ1、潜在変数ｚ2）が示されている。

例えば、対応情報算出部５６は、図２５に示すように、潜在変数ｚ1の値として、ユーザ１（２行目）を0.8、ユーザ２（３行目）を0.7、ユーザ３（４行目）を0.3、ユーザ４（５行目）を0.45、およびユーザ５（６行目）を0.9として、それぞれ算出する。

すなわち、ユーザ１、ユーザ２、ユーザ３、ユーザ４、ユーザ５である嗜好情報のそれぞれが、潜在変数ｚ1により、コンテンツまたはラベルと対応付けられることになる。

また、同様に、例えば、対応情報算出部５６は、図２５に示すように、潜在変数ｚ2の値として、ユーザ１（２行目）を0.2、ユーザ２（３行目）を0.3、ユーザ３（４行目）を0.7、ユーザ４（５行目）を0.55、およびユーザ５（６行目）を0.2として、それぞれ算出する。

すなわち、ユーザ１、ユーザ２、ユーザ３、ユーザ４、ユーザ５である嗜好情報のそれぞれが、潜在変数ｚ2により、コンテンツまたはラベルと対応付けられることになる。

このように、本発明では、例えば、図２４の例のように、５人のユーザが、曲１乃至曲１０に対して、それぞれ５段階評価をしている場合、この音楽コンテンツに関する嗜好情報（図２４）と、音楽コンテンツのコンテンツ特徴量（図４）とを組み合わせることにより、ユーザの嗜好の傾向とコンテンツ特徴量の傾向とが、相互に影響を及ぼしながら、最適な潜在空間（潜在変数ｚ_K）が生成され、図２５で示すようなユーザの嗜好情報が潜在空間に配置されることになる。

また、本発明では、例えば、コンテンツ特徴量またはラベル情報と共通の潜在変数ｚ_Kを持ちながら、別の分布のパラメータ推定を行うことにより、各ユーザの嗜好の傾向を反映しつつ、コンテンツそのものの特徴や、（例えば、権威者などによるレビュー文に含まれる単語などの）客観的なラベルの傾向をも反映した潜在空間を得ることができる。

これにより、運用フェーズでは、例えば、ユーザ嗜好情報とコンテンツとの潜在空間中での表現を利用することにより、ユーザ全体の嗜好の情報が加味されたユーザのクラスタリングやコンテンツのクラスタリング、さらに、ユーザとコンテンツとの同時クラスタリングも可能となる。

このように、本発明によれば、ユーザの好みにあったコンテンツを推薦することができる。

なお、上述した例においては、５人のユーザの評価情報を例にして説明したが、ユーザの人数は何人でもよく、例えば、１人のユーザの評価情報を１次元の空間とみなして、潜在空間（潜在変数ｚ_K）を算出するようにしてもよい。

ところで、本発明においては、上述した潜在空間にマッピング可能となる、例えば、コンテンツ特徴量、ラベル情報、コンテクスト情報、または嗜好情報などにおける特徴性を定義することもできる。具体的には、特徴性は、例えば、潜在空間中に確率分布として表現された対象の特徴性を、どのようにそのエントロピーに対して単調減少させるものかを、式（１４）で定義することにより、算出することができる。

すなわち、例えば、対応情報算出部５６は、音楽コンテンツに関するコンテクスト情報（図２０）を、式（１４）を用いて定義することにより、後述する図２６のコンテクストの特徴性を得ることができる。

図２６は、コンテクストの特徴性の例を示す図である。

図２６で示される例において、１列目はコンテクストを示し、２列目は特徴性の値を示している。

例えば、対応情報算出部５６は、図２６に示すように、朝（２行目）に対して、0.500である特徴性の値、昼（３行目）に対して0.389である特徴性の値、晩（４行目）に対して、0.461である特徴性の値、自宅（５行目）に対して、0.389である特徴性の値、屋外（６行目）に対して、0.311である特徴性の値、および通勤（７行目）に対して、0.675である特徴性の値をそれぞれ算出する。

すなわち、例えば、図２０の音楽コンテンツに関するコンテクスト情報の例における、６つのコンテクスト情報の特徴性は、「通勤」（特徴性の値が0.675）や「朝」（特徴性の値が0.500）であるコンテクストが、特徴的（特徴性の値が大きい、すなわち、音楽の聴き方に強く影響している）であることがわかる。この特徴性を用いることにより、例えば、「屋外」であるコンテクストは、音楽の聴き方に影響を及ぼさないので、ユーザが屋外にいるときには、その他の、メタデータやコンテクスト情報を推薦したり、「通勤」であるコンテクスト情報は、特徴性が強いので、他のコンテクストは無視して、潜在空間中で、「通勤」であるコンテクスト情報にのみ近い距離となる音楽コンテンツを推薦したりすることも可能となる。

また、この特徴性は、上記ラベル情報に対しても用いることができる。つまり、特徴性の高いラベル情報は、コンテンツの特徴量と関連の深い、特徴的なラベル情報であるとも言えるので、例えば、そのようなラベル情報を選択し、強調して表示することで、音楽コンテンツのレビュー文などの文章を読んでいるユーザの、音楽コンテンツの理解を補助することもできる。

そこで、まず、図２７乃至図３０を参照して、コンテンツとラベルとの対応付けを行う処理（学習フェーズ）について説明し、その後、図３１乃至図３５を参照して、対応付けられたコンテンツ特徴量とラベル情報との関係を用いて、特徴性の高いラベル情報を選択し、そのラベル情報を強調して表示する処理（運用フェーズ）について説明する。

図２７は、コンテンツ提供装置１の機能的構成の他の例について説明するブロック図である。

なお、図２７では、図２と同様の箇所には、同一の符号が付してあり、処理が同じ部分に関しては、その説明は繰り返しになるので適宜省略する。すなわち、図２７において、コンテンツ提供装置１は、図２のブロック図と比較して、コンテンツ特徴量蓄積部５３、ラベル情報蓄積部５５、コンテンツ特徴量-潜在空間変換部５９、ラベル情報-潜在空間変換部６０、潜在空間距離算出部６１、ラベル選択部６２、およびコンテンツ選択部６３の代わりに、ラベル情報抽出部５４と接続するようにして、文章蓄積部１７１が設けられている。

文章蓄積部１７１は、コンテンツ蓄積部５１に蓄積されているコンテンツに関する、例えば、レビュー文や感想文などの自然言語によって記述された文章の情報である文章情報を蓄積（保存）する。文章蓄積部１７１は、ラベル情報抽出部５４からの要求に応じて、文書情報をラベル情報抽出部５４に供給する。

ラベル情報抽出部５４は、文章蓄積部１７１に蓄積されている文章情報を、単語または、例えば、形態素解析によって、人間にとって意味のある単位（フレーズ）に分割して単語化する。ラベル情報抽出部５４は、形態素解析により得られた形態素などの情報を、ラベル情報として対応情報算出部５６に供給する。

なお、フレーズとは、人間にとって意味のある単位に区切られた、「単語」または「単語列」である。

また、詳細は後述するが、形態素解析とは、コンピュータなどの計算機を用いた、いわゆる自然言語処理の基礎技術のひとつで、自然言語で書かれた文を形態素（（Morpheme）、おおまかに言えば、言語で意味を持つ最小の単位）の列に分割し、品詞を見分ける作業である。なお、一般的に、形態素解析においては、例えば、日本語自然文を形態素に分割する形態素解析器（例えば、奈良先端科学技術大学院大学松本研究室で開発された「茶筌（ChaSen）」など）や、形態素を意味のあるまとまりにする、いわゆるチャンカ（例えば、「YamCha」など）などが利用される。また、文章が英語などの場合は、複数形や時制などによる語尾変化を削除して語幹だけを残す、「lemmatization」と称される単語の基本形を取り出す処理などが行われる。

対応情報算出部５６は、コンテンツ特徴量抽出部５２から供給されるコンテンツ特徴量と、ラベル情報抽出部５４から供給されるラベル情報との対応情報を算出する。対応情報算出部５６は、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部５７およびラベル情報-潜在空間対応情報蓄積部５８のそれぞれに蓄積させる。

なお、説明を簡略化するために、図２７には図示していないが、上述した場合と同様に、コンテンツ特徴量抽出部５２により抽出されたコンテンツ特徴量をコンテンツ特徴量蓄積部５３に蓄積させ、ラベル情報抽出部５４により抽出されたラベル情報をラベル情報蓄積部５５に蓄積させてもよい。その場合、対応情報算出部５６は、蓄積されているコンテンツ特徴量およびラベル情報を読み出し、それらの対応情報を算出する。

次に、図２８のフローチャートを参照して、図２７のコンテンツ提供装置１による、学習の処理について説明する。

ステップＳ７１の処理は、図３のステップＳ１１の処理と同様であるので、その説明は省略する。

ステップＳ７２において、ラベル情報抽出部５４は、文章蓄積部１７１に蓄積されている文章情報からラベル情報を抽出する、ラベル情報抽出の処理を行う。

ここで、ステップＳ７２における、ラベル情報抽出部５４による、ラベル情報抽出の処理の詳細について、図２９のフローチャートを参照して説明する。

ステップＳ８１において、ラベル情報抽出部５４は、文章蓄積部１７１に蓄積されている文章情報を読み出す。

ステップＳ８２において、ラベル情報抽出部５４は、読み出した文章情報に対して、形態素解析を行う。

図３０は、ラベル情報抽出部５４によって行われる、形態素解析の例について説明する図である。

図３０の例において、図中上側に示されるように、「・・・ひたすら明るいノリノリの曲が・・・」である文章情報が文章蓄積部１７１に蓄積されているとき、ラベル情報抽出部５４は、その「・・・ひたすら明るいノリノリの曲が・・・」である文章情報に対して、形態素解析を行うことで、図中下側に示される形態素解析の結果を得る。

図３０の下側に示す形態素解析の結果においては、図中６列で表される結果のうち、図中左側から１列目は「文字列」を示し、２列目は「読み」を示し、３列目は「原形」を示し、４列目は「品詞の種類」を示し、５列目は「活用の種類」を示し、６列目は「活用形」を示している。

つまり、ラベル情報抽出部５４によって、形態素解析が行われた結果、図３０の上側に示すような、「・・・ひたすら明るいノリノリの曲が・・・」である文章情報は、図３０の下側に示すように、“ひたすら”である「文字列」については、「読み」が“ヒタスラ”、「原形」が“ひたすら”、「品詞の種類」が“副詞−一般”であると解析され、“明るい”である「文字列」については、「読み」が“アカルイ”、「原形」が“明るい”、「品詞の種類」が“形容詞−自立”、「活用の種類」が“形容詞・アウオ段”、「活用形」が“基本形”であると解析され、“ノリノリ”である「文字列」については、「読み」が“ノリノリ”、「原形」が“ノリノリ”、「品詞の種類」が“名詞−形容動詞語幹”であると解析される。

また、同様に、図３０に示すように、「・・・ひたすら明るいノリノリの曲が・・・」である文章情報は、“の”である「文字列」については、「読み」が“ノ”、「原形」が“の”、「品詞の種類」が“助詞−連体化”であると解析され、“曲”である「文字列」については、「読み」が“キョク”、「原形」が“曲”、「品詞の種類」が“名詞−一般”であると解析され、“が”である「文字列」については、「読み」が“ガ”、「原形」が“が”、「品詞の種類」が“助詞−格助詞−一般”であると解析される。

なお、ラベル抽出部５４は、形態素解析において明らかに重要でないと考えられる単語、すなわち、図３０の下側に示す形態素解析の結果における、例えば、“の”および“が”などの助詞を、あらかじめ定義されたリストにしたがって削除することも可能である。

図２９のフローチャートに戻り、ステップＳ８３において、ラベル情報抽出部５４は、形態素解析により得られた形態素を、ラベル情報として対応情報算出部５６に供給して、ラベル情報抽出の処理は終了し、処理は、図２８のステップＳ７２に戻り、ステップＳ７３以降の処理が実行される。

具体的には、ラベル情報抽出部５４は、図３０の下側に示す形態素解析の結果のうち、例えば、左側から３列目の、“ひたすら”、“明るい”、“ノリノリ”、“曲”、などの「原形」（通常活用前の原形）を、形態素とする。そして、ラベル情報抽出部５４は、“ひたすら”、“明るい”、“ノリノリ”、“曲”である形態素を、ラベル情報として対応情報算出部５６に供給する。

ステップＳ７３において、図３のステップＳ１３の処理と同様に、対応情報算出部５６によって、コンテンツ特徴量とラベル情報との対応情報が算出され、その対応情報がコンテンツ特徴量-潜在空間対応情報蓄積部５７およびラベル情報-潜在空間対応情報蓄積部５８のそれぞれに蓄積されて、学習の処理は終了する。

例えば、対応情報算出部５６は、コンテンツ特徴およびラベル情報を基に、潜在変数ｚ_Kであるときの対応情報として、平均ベクトルμ_K、分散共分散行列Ｓ_K、α_K、ｐ（ｗ_i｜ｚ_K）をそれぞれ算出する。そして、対応情報算出部５６は、対応情報として、例えば、潜在変数ｚ_Kに対応する、α_K、分散共分散行列Ｓ_K、および平均ベクトルμ_Kをコンテンツ特徴量-潜在空間対応情報蓄積部５７に蓄積させ、例えば、潜在変数ｚ_Kとラベルｗ_iとの組み合わせに対する、ｐ（ｗ_i｜ｚ_K）とα_K＝ｐ（ｚ_K）をラベル情報-潜在空間対応情報蓄積部５８に蓄積させる。

以上のようにして、コンテンツ提供装置１は、学習の処理を行うことにより、コンテンツ特徴量-潜在空間対応情報蓄積部５７とラベル情報-潜在空間対応情報蓄積部５８のそれぞれに、対応情報を蓄積することになる。

このように、文章情報による自然文に含まれるフレーズを活用することで、ユーザは、コンテンツの特徴を特別に意識することなく、単に文章だけを記述さえすれば、コンテンツに属性（フレーズ）を付与することができる。また、特徴量とフレーズとの関連性が算出されるので、それらの関連性を利用して、コンテンツにメタデータを付与するコストを軽減することもできる。

次に、図３１乃至図３５を参照して、図３１乃至図３５を参照して、上記学習の処理によって対応付けられたコンテンツ特徴量とラベル情報との関係を用いて、フレーズのコンテンツ特徴量との関連度を示す特徴性の高いラベル情報を選択し、そのラベル情報を強調して表示する処理について説明する。

図３１は、コンテンツ提供装置１の機能的構成の他の例について説明するブロック図である。

なお、図３１では、図２７と同様の箇所には、同一の符号が付してあり、処理が同じ部分に関しては、その説明は繰り返しになるので適宜省略する。すなわち、図３１において、コンテンツ提供装置は、図２７のブロック図と比較して、特徴性算出部１８１、特徴フレーズ選択部１８２、フレーズ表示制御部１８３、および表示部１８４が設けられている。

特徴性算出部１８１は、コンテンツ特徴量-潜在空間対応情報蓄積部５７およびラベル情報-潜在空間対応情報蓄積部５８に蓄積されている、上記文章情報が分割された各フレーズに対応する対応情報を取得する。

特徴性算出部１８１は、取得した各フレーズに対応する対応情報を基に、式（１４）を用いて、フレーズのコンテンツ特徴量との関連度を示す特徴性を算出する。特徴性算出部１８１は、算出した特徴性と、その特徴性に対応するフレーズを特徴フレーズ選択部１８２に供給する。また、特徴性算出部１８１は、文章情報が分割された各フレーズをフレーズ表示制御部１８３に供給する。

特徴フレーズ選択部１８２は、特徴性算出部１８１から供給される特徴性の値に基づいて、特徴性に対応する各フレーズのなかから、特徴的なフレーズである特徴フレーズを選択する。特徴フレーズ選択部１８２は、選択した特徴フレーズをフレーズ表示制御部１８３に供給する。

なお、特徴フレーズ選択部１８２による、特徴フレーズの選択方法であるが、特徴性算出部１８１により算出された特徴性の値が、所定の値を超えるフレーズを特徴フレーズとしたり、特徴性の値が大きい順に並べられたフレーズのなかから、上位10％のフレーズを特徴フレーズとしたりすることができる。

フレーズ表示制御部１８３は、特徴フレーズ選択部１８２から供給される特徴フレーズに基づいて、特徴性算出部１８１から供給される、文章情報が分割された各フレーズのうち、特徴フレーズと一致するフレーズが強調されて表示部１８４に表示されるように表示を制御する。

表示部１８４は、図１の出力部１７に相当し、フレーズ表示制御部１８３の制御にしたがって、例えば、文章情報による文章などを表示する。

次に、図３２のフローチャートを参照して、図３１のコンテンツ提供装置１による、フレーズ表示の処理について説明する。

ステップＳ９１において、特徴性算出部１８１は、文章情報から切り出された各フレーズに対応する対応情報に基づいて、上述した式（１４）を用いて、各フレーズごとの特徴性を算出する。

なお、以下の説明では、上述した図３０の上側に示すような、「・・・ひたすら明るいノリノリの曲が・・・」である文章情報から切り出された、“ひたすら”、“明るい”、“ノリノリ”、“曲”、・・・であるフレーズ、すなわち、ラベルｗ_i（“の”および“が”などの助詞は除く）に対して、潜在変数ｚ1、ｚ2に対する確率分布のパラメータ（対応情報）であるｐ（ｚ＝ｚ₁｜ｗ_i）とｐ（ｚ＝ｚ₂｜ｗ_i）とが、図３３のように求められ、それらの情報がラベル情報-潜在空間対応情報蓄積部５８に蓄積されているとして説明する。

図３３は、フレーズ（ラベルｗ_i）の潜在空間表現の例を示す図である。図３３は、例えば、フレーズの潜在空間表現、すなわち、条件付確率ｐ（ｚ_K｜ｗ_i）による値の例を示している。

図３３で示される例において、１列目と１行目は項目を示し、１列目にはラベル情報抽出部５４によって抽出された、コンテンツのレビュー文などの文章情報から切り出されたフレーズが示され、１行目には、１列目のフレーズに関する２つの潜在変数（潜在変数ｚ1、潜在変数ｚ2）が示されている。

例えば、ラベル情報-潜在空間対応情報蓄積部５８においては、図３３に示すように、潜在変数ｚ1の値として、“ひたすら”（２行目）に対して0.4、“明るい”（３行目）に対して0.8、“ノリノリ”（４行目）に対して0.7、“曲”（５行目）に対して0.5が、それぞれ蓄積されている。

すなわち、“ひたすら”、“明るい”、“ノリノリ”、“曲”、・・・であるフレーズのそれぞれが、潜在変数ｚ1により、音楽コンテンツと対応付けられている。

また、同様に、ラベル情報-潜在空間対応情報蓄積部５８においては、図３３に示すように、潜在変数ｚ2の値として、“ひたすら”（２行目）に対して0.6、“明るい”（３行目）に対して0.2、“ノリノリ”（４行目）に対して0.3、“曲”（５行目）に対して0.5が、それぞれ蓄積されている。

すなわち、“ひたすら”、“明るい”、“ノリノリ”、“曲”、・・・であるフレーズのそれぞれが、潜在変数ｚ2により、音楽コンテンツと対応付けられている。

また、図３３に示すように、例えば、“明るい”や“ノリノリ”といった、音楽コンテンツの内容に密接に関係してくるフレーズは、潜在変数ｚ1または潜在変数ｚ2のどちらかの潜在変数に対応する条件付確率ｐ（ｚ_K｜ｗ_i）の値が大きくなる。

すなわち、特徴性算出部１８１は、例えば、図３３に示される各フレーズに対応する対応情報を基に、式（１４）を用いて、図３４に示すような特徴性を算出する。

図３４は、フレーズ（ラベルｗ_i）の特徴性の例を示す図である。

図３４で示される例において、１列目はフレーズを示し、２列目は特徴性の値を示している。

例えば、特徴性算出部１８１は、図３４に示すように、“ひたすら”（２行目）に対して0.708、“明るい”（３行目）に対して0.859、“ノリノリ”（４行目）に対して0.816、“曲”（５行目）に対して0.699である特徴性の値を、それぞれ算出する。

図３２のフローチャートに戻り、ステップＳ９２において、特徴フレーズ選択部１８２は、文章情報から切り出されたフレーズのなかから、特徴フレーズを選択する。

例えば、特徴フレーズ選択部１８２は、図３４に示すような、“ひたすら”、“明るい”、“ノリノリ”、“曲”、・・・のなかから、特徴性の値が0.8よりも大きい、“明るい”および“ノリノリ”であるフレーズを、特徴フレーズとして選択する。

換言すれば、特徴フレーズ選択部１８２は、確率分布のパラメータ（対応情報）がより偏っている、“明るい”および“ノリノリ”であるフレーズを選択することで、コンテンツの内容に密接に関係するフレーズを選択しているとも言える。つまり、図３４のフレーズの特徴性の例においては、“曲”（0.699）、“ひたすら”（0.708）、“ノリノリ”（0.816）、“明るい”（0.859）の順に、特徴性の値が大きくなっており、例えば、“明るい”や“ノリノリ”のような確率分布のパラメータ（対応情報）がより偏っているフレーズのほうが、より大きい特徴性を持っている。

なお、上述した例では、特徴性の値が0.8より大きいフレーズを特徴フレーズとしたが、特徴フレーズの選択方法は、上記のように特徴性の値が所定の閾値を超えるフレーズや、特徴性の値が上位Ｎ％（0≦Ｎ≦100）のフレーズを、特徴フレーズとして選択してもよい。

図３２のフローチャートに戻り、ステップＳ９３において、フレーズ表示制御部１８３は、文章情報から切り出されたフレーズのうち、特徴フレーズと一致するフレーズを強調して表示部１８４に表示させて、フレーズ表示の処理は、終了する。

例えば、フレーズ表示制御部１８３は、音楽コンテンツのレビュー文などの文章情報から切り出されたフレーズのなかから、特徴フレーズ選択部１８２により選択された、“明るい”および“ノリノリ”であるフレーズを強調して表示部１８４に表示させる。

図３５は、音楽コンテンツのレビュー文などの文章を表示する表示部１８４の例を示す図である。

表示部１８４においては、図３５の上側に示すように、「・・・ひたすら明るいノリノリの曲が・・・」である文章のうち、特徴性の値の大きい、“明るい”と“ノリノリ”である特徴フレーズが他の文字よりも、文字の大きさが大きくなるように表示されている。

また、表示部１８４においては、図３５の下側に示すように、特徴性の値の大きい、“明るい”と“ノリノリ”である特徴フレーズが他の文字と背景の模様が異なるように表示されている。

これにより、コンテンツの特徴量と関連の深いフレーズが強調表示されるので、ユーザは、そのコンテンツのレビュー文などの文章を読むとき、その強調表示されたフレーズを注目して読むことができる。

なお、上述した例では、特徴フレーズの文字の大きさを大きくしたり、背景の模様を変える例について説明したが、それに限らず、例えば、特徴フレーズの色を変えてもよい。要は、特徴フレーズの表示の仕方を他のフレーズと変えればよいのであって、その手段、方法は、任意である。

また、本発明においては、例えば、コンテンツやラベルなどをクラスタリングすることも可能である。例えば、潜在空間への対応付けがなされたコンテンツやラベルのクラスタリングは、任意のクラスタリングアルゴリズムにより実行可能となる。また、このとき、例えば、コンテンツとラベルとは、同一の空間上に表現されているので、コンテンツまたはラベルごとのクラスタリングに限らず、コンテンツとラベルとを同時にクラスタリングして、それぞれのクラスタにコンテンツとラベルとを混在させることも可能となる。

これにより、例えば、図１６のフローチャートにより説明した、コンテンツ検索の処理では、コンテンツやラベルの検索処理を個別に行わずに、同一のクラスタに入っているコンテンツとラベルとを、それに対する検索結果とみなすこともできる。その結果、ユーザは、迅速に所望のコンテンツを取得することができる。

また、上述した例においては、コンテンツ提供装置１は、学習フェーズで行われる処理と、運用フェーズで行われる処理の両方を行うとして説明したが、学習フェーズと運用フェーズの処理を別々の装置により行うようにしてもよい。以下、図３６および図３７を参照して、学習フェーズと運用フェーズの処理を別々に行う、コンテンツ提供装置１について説明する。

図３６は、学習フェーズの処理を行う、コンテンツ提供装置１の機能的構成例を示す機能ブロック図である。

図３６では、図２と同様の箇所には、同一の符号が付してありその説明は省略する。すなわち、図３６のコンテンツ提供装置１は、学習フェーズの処理を行う、コンテンツ蓄積部５１、コンテンツ特徴量抽出部５２、コンテンツ特徴量蓄積部５３、ラベル情報抽出部５４、ラベル情報蓄積部５５、対応情報算出部５６、コンテンツ特徴量-潜在空間対応情報蓄積部５７、およびラベル情報-潜在空間対応情報蓄積部５８を含むようにして構成される。

図３６のコンテンツ提供装置１は、例えば、図３の学習の処理を行うことにより、コンテンツ蓄積部５１に蓄積されているコンテンツのコンテンツ特徴量とラベル情報との対応情報を算出し、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部５７およびラベル情報-潜在空間対応情報蓄積部５８のそれぞれに蓄積する。

すなわち、図３６のコンテンツ提供装置１は、運用フェーズの処理を行う機器（例えば、後述する図３７のクライアント端末装置２０１）に対して、自分が蓄積しているデータを提供することになる。

一方、図３７は、運用フェーズの処理を行う、クライアント端末装置２０１の機能的構成例を示す機能ブロック図である。

図３７では、図２と同様の箇所には、同一の符号が付してありその説明は省略する。すなわち、図３７のクライアント端末装置２０１は、コンテンツ特徴量抽出部５２、コンテンツ特徴量-潜在空間変換部５９、ラベル情報-潜在空間変換部６０、潜在空間距離算出部６１、ラベル選択部６２、およびコンテンツ選択部６３を含むようにして構成される。クライアント端末装置２０１は、本発明の情報処理装置の一例である。

クライアント端末装置２０１は、例えば、図１４のラベル付与の処理を行うことにより、新規に追加するコンテンツに対してラベルを付与する。このとき、クライアント端末装置２０１は、例えば、図３６のコンテンツ提供装置１から、ラベル付与の処理に必要となるデータを取得して処理を行うことになる。

また、クライアント端末装置２０１は、例えば、図１６のコンテンツ検索の処理を行うことにより、図３６のコンテンツ提供装置１が蓄積しているコンテンツを取得する。このとき、クライアント端末装置２０１は、例えば、図３６のコンテンツ提供装置１から、コンテンツ検索の処理に必要となるデータを取得して処理を行うことになる。

このように、本発明では、学習フェーズと運用フェーズの処理を別々の装置で行うことができる。

なお、クライアント端末装置２０１は、例えば、運用フェーズの処理のうち、図１４のラベル付与の処理のみを行うようにしてもよいし、また、図１６のコンテンツ検索の処理のみを行うようにしてもよい。

また、図２７乃至図３５を参照して説明した処理のうち、図２７乃至図３０を参照して説明した学習フェーズの処理を、図３６のコンテンツ提供装置１が行って、図３１乃至図３５を参照して説明した運用フェーズの処理を、図３７のクライアント端末装置２０１が行うようにしてもよい。

以上のように、本発明によれば、コンテンツに対して最適なキーワードを付与することができる

また、本発明によれば、コンテンツ特徴量とラベル情報のそれぞれの分布の特徴を反映した潜在空間により、ラベルを持たないコンテンツに対しても、そのコンテンツに対してラベルを付与したり、またはラベルからコンテンツを検索することができる。

さらに、本発明によれば、コンテンツ特徴量やラベル情報の他に、ユーザの経験に依存している嗜好情報やコンテクストなどの異なる分布を持つ複数の情報を統合した潜在空間により、従来手法では発見することのできなかった相互の関連性を発見することができ、例えば、コンテンツを推薦するシステムなどに適用することができる。

なお、本実施の形態では、対応情報は、コンテンツとラベルとを対応付けるための情報、すなわち、具体的には、例えば、μ_K（平均ベクトル）、Ｓ_K（分散共分散行列）、α_K、ｐ（ｗ_i｜ｚ_K）などであるとして説明したが、これらは、コンテンツ特徴量、ラベル情報、潜在変数のそれぞれの確率分布の性質を表わす（確率分布の）パラメータであるとも言える。つまり、対応情報算出部５６は、対応情報として、これらのパラメータを算出している。

また、コンテンツ特徴量、ラベル情報、コンテクスト情報、嗜好情報は、それぞれ、コンテンツ特徴量抽出部５２、ラベル情報抽出部５４、コンテクスト情報抽出部１１１、嗜好情報抽出部１５１が抽出するとして説明したが、それらは、コンテンツ提供装置１により抽出されるのではなく、例えば、外部の他の機器や、ユーザによって付与するようにしてもよい。

さらにまた、上述した例においては、説明を分かり易くするために、曲数を減らして１０曲で説明しているが、実際には、数千曲単位で行うのが望ましく、曲数が増えた場合でも、同様に処理が行われる。

上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。

この記録媒体は、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory)，DVD（Digital Versatile Disk））を含む）、光磁気ディスク（MD（Mini-Disc）（登録商標）を含む）、若しくは半導体メモリなどよりなる図１のリムーバブルメディア２１により構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されている図１のROM１２や記録部１８などで構成される。

また、上述した一連の処理を実行させるプログラムは、必要に応じてルータ、モデムなどのインターフェースを介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を介してコンピュータにインストールされるようにしてもよい。

なお、本明細書において、記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。

なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

コンテンツ提供装置のハードウェアの構成の例を説明するブロック図である。コンテンツ提供装置の機能的構成例を示す機能ブロック図である。図２のコンテンツ提供装置による、学習の処理について説明するフローチャートである。音楽コンテンツに関するコンテンツ特徴量の例を示す図である。音楽コンテンツに関するラベル情報の例を示す図である。対応情報の算出の処理の詳細について説明するフローチャートである。コンテンツ特徴量による混合正規分布（GMM）と、ラベル情報によるPLSAとの潜在変数を共通化したときのグラフィカルモデルの例を示す図である。コンテンツの潜在空間表現の例を示す図である。ラベルの潜在空間表現の例を示す図である。潜在変数ｚ_Kの事前確率の例を示す図である。潜在変数ｚ1に対する分散共分散行列Ｓ₁の例を示す図である。潜在変数ｚ2に対する分散共分散行列Ｓ₂の例を示す図である。対応情報算出部により算出される、平均ベクトルμ₁と平均ベクトルμ₂の例を示す図である。コンテンツ提供装置による、あるコンテンツに対して、ラベルを付与する処理について説明するフローチャートである。潜在空間距離算出部により算出される、コンテンツとラベルとの距離の例を示す図である。コンテンツ提供装置による、コンテンツ検索の処理について説明するフローチャートである。潜在空間距離算出部により算出される、コンテンツとラベルとの距離の例を示す図である。コンテンツ提供装置の機能的構成例の他の例について説明するブロック図である。図１８のコンテンツ提供装置による、学習の処理について説明するフローチャートである。音楽コンテンツに関するコンテクスト情報の例を示す図である。コンテクスト情報の潜在空間表現の例を示す図である。コンテンツ提供装置の機能的構成例の他の例について説明するブロック図である。図２２のコンテンツ提供装置による、学習の処理について説明するフローチャートである。音楽コンテンツに関する嗜好情報の例を示す図である。嗜好情報の潜在空間表現の例を示す図である。コンテクストの特徴性の例を示す図である。コンテンツ提供装置の機能的構成の他の例について説明するブロック図である。図２７のコンテンツ提供装置による、学習の処理について説明するフローチャートである。ラベル情報算出の処理の詳細について説明するフローチャートである。形態素解析の例について説明する図である。コンテンツ提供装置の機能的構成の他の例について説明するブロック図である。図３１のコンテンツ提供装置による、フレーズ表示の処理について説明するフローチャートである。ラベルの潜在空間表現の例を示す図である。フレーズの特徴性の例を示す図である。音楽コンテンツのレビュー文などの文章を表示する表示部の例を示す図である。学習フェーズの処理を行う、コンテンツ提供装置の機能的構成例を示す機能ブロック図である。運用フェーズの処理を行う、クライアント端末装置の機能的構成例を示す機能ブロック図である。

符号の説明

１コンテンツ提供装置，１１ CPU，１２ ROM，１３ RAM，１６入力部，１７出力部，１８記録部，１９通信部，２０ドライブ，２１リムーバブルメディア，５１コンテンツ蓄積部，５２コンテンツ特徴量抽出部，５３コンテンツ特徴量蓄積部，５４ラベル情報抽出部，５５ラベル情報蓄積部，５６対応情報算出部，５７コンテンツ特徴量-潜在空間対応情報蓄積部，５８ラベル情報-潜在空間対応情報蓄積部，５９コンテンツ特徴量-潜在空間変換部，６０ラベル情報-潜在空間対応情報変換部，６１潜在空間距離算出部，６２ラベル選択部，６３コンテンツ選択部，１１１コンテクスト情報抽出部，１１２コンテクスト情報蓄積部，１１３コンテクスト情報-潜在空間対応情報蓄積部，１５１嗜好情報抽出部，１５２嗜好情報蓄積部，１５３嗜好情報-潜在空間対応情報蓄積部，１７１文章蓄積部，１８１特徴性算出部，１８２特徴フレーズ選択部，１８３フレーズ表示制御部，１８４表示部，２０１クライアント端末装置

Claims

コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報とに共通する第１の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第１のパラメータを算出する第１の算出手段と、
算出された前記第１のパラメータを蓄積する蓄積手段と
を備える情報処理装置。
前記特徴量を抽出する第１の抽出手段と、
前記属性情報を抽出する第２の抽出手段と
をさらに備え、
前記第１の算出手段は、抽出された前記特徴量と、抽出された前記属性情報とから、前記第１のパラメータを算出する
請求項１の情報処理装置。
前記第２の抽出手段は、自然言語によって記述された文章を、単語または前記単語のまとまりであるフレーズに分割する
請求項２の情報処理装置。
算出された前記第１のパラメータに基づいて、前記フレーズの前記特徴量との関連度を示す特徴性を算出する第２の算出手段と、
算出された前記特徴性に基づいて、前記フレーズの表示を制御する表示制御手段と
をさらに備える請求項３の情報処理装置。
前記第１の算出手段は、前記特徴量、前記属性情報、またはユーザによる前記コンテンツの利用に関する情報を示す利用情報のそれぞれに共通する第２の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第２のパラメータを算出し、
前記蓄積手段は、算出された前記第２のパラメータを蓄積する
請求項１の情報処理装置。
前記利用情報を抽出する抽出手段をさらに備え、
前記第１の算出手段は、前記特徴量、前記属性情報、または抽出された前記利用情報から、前記第２のパラメータを算出する
請求項５の情報処理装置。
前記第１の算出手段は、前記特徴量、前記属性情報、または前記コンテンツに対するユーザの嗜好に関する情報を示す嗜好情報のそれぞれに共通する第３の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第３のパラメータを算出し、
前記蓄積手段は、算出された前記第３のパラメータを蓄積する
請求項１の情報処理装置。
前記嗜好情報を抽出する抽出手段をさらに備え、
前記第１の算出手段は、前記特徴量、前記属性情報、または抽出された前記嗜好情報から、前記第３のパラメータを算出する
請求項７の情報処理装置。
コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報とに共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータを算出する算出ステップと、
算出された前記パラメータを蓄積する蓄積ステップと
を含む情報処理方法。
コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータを算出する算出ステップと、
算出された前記パラメータを蓄積する蓄積ステップと
をコンピュータに実行させるプログラム。
コンテンツに関係する特徴量を抽出する抽出手段と、
前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換手段と、
前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出手段と、
算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択手段と
を備える情報処理装置。
前記選択手段は、前記コンテンツに対応する属性として、算出された前記距離が所定の閾値以下となる属性か、または前記距離の近さが上位となる所定の個数の属性を選択する
請求項１１の情報処理装置。
コンテンツに関係する特徴量を抽出する抽出ステップと、
前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換ステップと、
前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出ステップと、
算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択ステップと
を含む情報処理方法。
コンテンツに関係する特徴量を抽出する抽出ステップと、
前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換ステップと、
前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出ステップと、
算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択ステップと
をコンピュータに実行させるプログラム。
コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換手段と、
前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出手段と、
算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択手段と
を備える情報処理装置。
前記選択手段は、前記属性情報に対応するコンテンツとして、算出された前記距離が所定の閾値以下となるコンテンツか、または前記距離の近さが上位となる所定の個数のコンテンツを選択する
請求項１５の情報処理装置。
コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換ステップと、
前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出ステップと、
算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択ステップと
を含む情報処理方法。
コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換ステップと、
前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出ステップと、
算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択ステップと
をコンピュータに実行させるプログラム。