JP2007183927A - 情報処理装置および方法、並びにプログラム - Google Patents

情報処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JP2007183927A
JP2007183927A JP2006314534A JP2006314534A JP2007183927A JP 2007183927 A JP2007183927 A JP 2007183927A JP 2006314534 A JP2006314534 A JP 2006314534A JP 2006314534 A JP2006314534 A JP 2006314534A JP 2007183927 A JP2007183927 A JP 2007183927A
Authority
JP
Japan
Prior art keywords
content
information
feature amount
attribute information
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006314534A
Other languages
English (en)
Inventor
Hiroshi Tateno
啓 舘野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006314534A priority Critical patent/JP2007183927A/ja
Priority to US11/815,538 priority patent/US8478781B2/en
Publication of JP2007183927A publication Critical patent/JP2007183927A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】コンテンツに対して最適なキーワードを付与することができるようにする。
【解決手段】コンテンツ特徴量抽出部52は、コンテンツに関係するコンテンツ特徴量を抽出し、ラベル情報抽出部54は、コンテンツの属性を示すラベル情報を抽出する。対応情報算出部56は、コンテンツ特徴量とラベル情報とに共通する潜在変数zK、コンテンツ特徴量、ラベル情報のそれぞれの確率分布の性質を表わすパラメータを算出し、コンテンツ特徴量-潜在空間対応情報蓄積部57またはラベル情報-潜在空間対応情報蓄積部58は、それぞれ、算出された潜在変数zKを蓄積することで、コンテンツに対して、最適なキーワードを付与することができるようになる。本発明は、情報処理装置に適用できる。
【選択図】図2

Description

本発明は情報処理装置および方法、並びにプログラムに関し、特に、コンテンツに対して最適なキーワードを付与することができるようにした情報処理装置および方法、並びにプログラムに関する。
従来より、音楽や映像のコンテンツに対してキーワードを付与することにより、それらのコンテンツを検索したり、分類したりする技術がある。このようなキーワードは、一般的に、メタデータと称されるが、例えば、対象となるCD(Compact Disc)に関する曲名やアーティスト名などの情報を提供するCDDB(CD DataBase)のように、コンテンツに対してキーワードを付与するためには、人手による膨大な作業が必要となっていた。この場合、新しいコンテンツが登場するたびに、手作業により、それらのコンテンツに対してキーワードを登録する作業が発生していた。
また、特に、音楽のコンテンツなどでは、個々の楽曲の特徴を数値化する技術も開発されており、その数値からキーワードなどのメタデータを推測する技術もある。
具体的には、多変量解析の手法である数量化III類により個々のコンテンツに付与されたキーワードなどの離散量を連続量空間に配置し、その空間と特徴量の空間で正準相関分析を行うことにより両者の対応関係を得て、その対応関係を用いて新規コンテンツの特徴量からキーワードを推測する情報処理装置もある(例えば、特許文献1)。
また、コンテンツのクラスタリングやキーワードをクラスタリングする手法(例えば、特許文献2)、コンテンツとキーワードとを同時にクラスタリングする手法(例えば、非特許文献1)、またはユーザの嗜好や文脈(コンテクスト)に合わせてコンテンツを推薦する手法(例えば、特許文献3)も提案されている。
特開平11−96165号公報 特開2002−41573号公報 特開2001−175676号公報 高村大也、松本裕治著、「文書分類のための共クラスタリング」情報処理学会論文誌 Vol.44 No.02、2003年2月発行
しかしながら、新しいコンテンツが増えるたびに、そのコンテンツにキーワードを付与する人手による膨大な作業が発生し、永続的にコストがかかるという問題があった。
また、従来のコンテンツにキーワードを付与する手法であると、コンテンツに対して、最適なキーワードが付与されているとは言えなかった。
例えば、特開平11−96165号公報に開示されている情報処理装置は、数量化III類を用いてキーワードを推測しているが、数量化III類は、質的なデータに対してのみ適用が可能であるため、例えば、ある楽曲に対するレビュー文において、複数回出現している単語は重要であると考えられるが、そのような重み付けをすることはできない。
また、例えば、特開2002−41573号公報や上記非特許文献1に開示されている手法は、コンテンツやキーワードをクラスタリングする手法であるが、コンテンツの特徴を示す特徴量と、それに付与されたキーワードとの両方を用いてクラスタリングやモデル化をすることはできない。
さらに、例えば、特開2001−175676号公報に開示されている手法は、ユーザの嗜好や文脈に合わせてコンテンツを推薦しているが、高評価を得たコンテンツのメタデータを蓄積して作成したユーザプロファイルとの距離が近いコンテンツを推薦する手法を用いており、嗜好の情報などの分布を考慮していないために、最適なコンテンツを推薦しているとは言えなかった。
本発明はこのような状況に鑑みてなされたものであり、コンテンツに対して最適なキーワードを付与することができるようにするものである。
本発明の第1の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報とに共通する第1の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第1のパラメータを算出する第1の算出手段と、算出された前記第1のパラメータを蓄積する蓄積手段とを備える情報処理装置である。
前記特徴量を抽出する第1の抽出手段と、前記属性情報を抽出する第2の抽出手段とをさらに設け、前記第1の算出手段には、抽出された前記特徴量と、抽出された前記属性情報とから、前記第1のパラメータを算出させることができる。
前記第2の抽出手段には、自然言語によって記述された文章を、単語または前記単語のまとまりであるフレーズに分割させることができる。
算出された前記第1のパラメータに基づいて、前記フレーズの前記特徴量との関連度を示す特徴性を算出する第2の算出手段と、算出された前記特徴性に基づいて、前記フレーズの表示を制御する表示制御手段とをさらに設けることができる。
前記第1の算出手段には、前記特徴量、前記属性情報、またはユーザによる前記コンテンツの利用に関する情報を示す利用情報のそれぞれに共通する第2の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第2のパラメータを算出し、前記蓄積手段は、算出された前記第2のパラメータを蓄積させることができる。
前記利用情報を抽出する抽出手段をさらに設け、前記第1の算出手段には、前記特徴量、前記属性情報、または抽出された前記利用情報から、前記第2のパラメータを算出させることができる。
前記第1の算出手段には、前記特徴量、前記属性情報、または前記コンテンツに対するユーザの嗜好に関する情報を示す嗜好情報のそれぞれに共通する第3の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第3のパラメータを算出させ、前記蓄積手段には、算出された前記第3のパラメータを蓄積させることができる。
前記嗜好情報を抽出する抽出手段をさらに設け、前記第1の算出手段には、前記特徴量、前記属性情報、または抽出された前記嗜好情報から、前記第3のパラメータを算出させることができる。
本発明の第1の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報とに共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータを算出する算出ステップと、算出された前記パラメータを蓄積する蓄積ステップとを含む情報処理方法である。
本発明の第1の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータを算出する算出ステップと、算出された前記パラメータを蓄積する蓄積ステップとをコンピュータに実行させるプログラムである。
本発明の第1の側面においては、コンテンツに関係する特徴量とコンテンツの属性を示す属性情報とに共通する第1の潜在変数、特徴量、および属性情報のそれぞれの確率分布の性質を表わす第1のパラメータが算出され、算出された第1のパラメータが蓄積される。
本発明の第2の側面は、コンテンツに関係する特徴量を抽出する抽出手段と、前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換手段と、前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出手段と、算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択手段とを備える情報処理装置である。
前記選択手段には、前記コンテンツに対応する属性として、算出された前記距離が所定の閾値以下となる属性か、または前記距離の近さが上位となる所定の個数の属性を選択するようにすることができる。
本発明の第2の側面は、コンテンツに関係する特徴量を抽出する抽出ステップと、前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換ステップと、前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出ステップと、算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択ステップとを含む情報処理方法である。
本発明の第2の側面は、コンテンツに関係する特徴量を抽出する抽出ステップと、前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換ステップと、前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出ステップと、算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択ステップとをコンピュータに実行させるプログラムである。
本発明の第2の側面においては、コンテンツに関係する特徴量が抽出され、特徴量とコンテンツの属性を示す属性情報に共通する潜在変数、特徴量、および属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された特徴量が潜在空間に配置されるように変換され、潜在空間中に変換された特徴量と、潜在変数により特徴量に対して潜在的に結び付いている属性情報との距離が算出され、算出された距離に基づいて、コンテンツに対応する属性が選択される。
本発明の第3の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換手段と、前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出手段と、算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択手段とを備える情報処理装置である。
前記選択手段には、前記属性情報に対応するコンテンツとして、算出された前記距離が所定の閾値以下となるコンテンツか、または前記距離の近さが上位となる所定の個数のコンテンツを選択させることができる。
本発明の第3の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換ステップと、前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出ステップと、算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択ステップとを含む情報処理方法である。
本発明の第3の側面は、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換ステップと、前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出ステップと、算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択ステップとをコンピュータに実行させるプログラムである。
本発明の第3の側面においては、コンテンツに関係する特徴量とコンテンツの属性を示す属性情報に共通する潜在変数、特徴量、および属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、属性情報が潜在空間に配置されるように変換され、潜在空間中に変換された属性情報と、潜在変数により属性情報に対して潜在的に結び付いている特徴量との距離が算出され、算出された距離に基づいて、属性情報に対応するコンテンツが選択される。
以上のように、本発明の第1の側面によれば、コンテンツに対して最適なキーワードを付与することができる。
また、本発明の第2の側面によれば、コンテンツに対して最適なキーワードを付与することができる。
本発明の第3の側面によれば、より確実に、キーワードに対応するコンテンツを検索することができる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書または図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書または図面に記載されていることを確認するためのものである。従って、明細書または図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
本発明の第1の側面の情報処理装置(例えば、図2のコンテンツ提供装置1)は、コンテンツ(例えば、音楽コンテンツ)に関係する特徴量(例えば、コンテンツ特徴量)と前記コンテンツの属性(例えば、ラベル)を示す属性情報(例えば、ラベル情報)とに共通する第1の潜在変数(例えば、潜在変数zK)、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第1のパラメータ(例えば、対応情報)を算出する第1の算出手段(例えば、図2の対応情報算出部56)と、算出された前記第1のパラメータを蓄積する蓄積手段(例えば、図2のコンテンツ特徴量-潜在空間対応情報蓄積部57)とを備える。
前記特徴量を抽出する第1の抽出手段(例えば、図2のコンテンツ特徴量抽出部52)と、前記属性情報を抽出する第2の抽出手段(例えば、図2のラベル情報抽出部54)とをさらに設け、前記第1の算出手段は、抽出された前記特徴量と、抽出された前記属性情報とから、前記第1のパラメータを算出することができる。
前記第2の抽出手段は、自然言語によって記述された文章を、単語または前記単語のまとまりであるフレーズに分割することができる。
算出された前記第1のパラメータに基づいて、前記フレーズの前記特徴量との関連度を示す特徴性(例えば、特徴性)を算出する第2の算出手段(例えば、図31の特徴性算出部181)と、算出された前記特徴性に基づいて、前記フレーズの表示を制御する表示制御手段(例えば、図31のフレーズ表示制御部183)とをさらに備える。
前記第1の算出手段は、前記特徴量、前記属性情報、またはユーザによる前記コンテンツの利用に関する情報を示す利用情報(例えば、コンテクスト情報)のそれぞれに共通する第2の潜在変数(例えば、潜在変数zK)、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第2のパラメータ(例えば、対応情報)を算出し、前記蓄積手段は、算出された前記第2のパラメータを蓄積することができる。
前記利用情報を抽出する抽出手段(例えば、図18のコンテクスト情報抽出部111)をさらに備え、前記第1の算出手段は、前記特徴量、前記属性情報、または抽出された前記利用情報から、前記第2のパラメータを算出することができる。
前記第1の算出手段は、前記特徴量、前記属性情報、または前記コンテンツに対するユーザの嗜好に関する情報を示す嗜好情報(例えば、嗜好情報)のそれぞれに共通する第3の潜在変数例えば、潜在変数zK)、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第3のパラメータ(例えば、対応情報)を算出し、前記蓄積手段は、算出された前記第3のパラメータを蓄積することができる。
前記嗜好情報を抽出する抽出手段(例えば、図22の嗜好情報抽出部151)をさらに備え、前記第1の算出手段は、前記特徴量、前記属性情報、または抽出された前記嗜好情報から、前記第3のパラメータを算出することができる。
本発明の第1の側面の情報処理方法またはプログラムは、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報とに共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータを算出する算出ステップ(例えば、図6のステップS21の処理)と、算出された前記パラメータを蓄積する蓄積ステップ(例えば、図6のステップS22の処理)とを含む。
本発明の第2の側面の情報処理装置(例えば、図2のコンテンツ提供装置1)は、コンテンツ(例えば、音楽コンテンツ)に関係する特徴量(例えば、コンテンツ特徴量)を抽出する抽出手段(例えば、図2のコンテンツ特徴量抽出部52)と、前記特徴量と前記コンテンツの属性(例えば、ラベル)を示す属性情報(例えば、ラベル情報)に共通する潜在変数(例えば、潜在変数zK)、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータ(例えば、対応情報)に基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換手段(例えば、図2のコンテンツ特徴量-潜在空間変換部59)と、前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出手段(例えば、図2の潜在空間距離算出部61)と、算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択手段(例えば、図2のラベル選択部62)とを備える。
前記選択手段は、前記コンテンツに対応する属性として、算出された前記距離が所定の閾値以下となる属性か、または前記距離の近さが上位となる所定の個数の属性を選択することができる。
本発明の第2の側面の情報処理方法またはプログラムは、コンテンツに関係する特徴量を抽出する抽出ステップ(例えば、図14のステップS31の処理)と、前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換ステップ(例えば、図14のステップS32の処理)と、前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出ステップ(例えば、図14のステップS33の処理)と、算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択ステップ(例えば、図14のステップS34の処理)とを含む。
本発明の第3の側面の情報処理装置(例えば、図2のコンテンツ提供装置1)は、コンテンツ(例えば、音楽コンテンツ)に関係する特徴量(例えば、コンテンツ特徴量)と前記コンテンツの属性(例えば、ラベル)を示す属性情報(例えば、ラベル情報)に共通する潜在変数(例えば、潜在変数zK)、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータ(例えば、対応情報)に基づいて、前記属性情報が潜在空間に配置されるように変換する変換手段(例えば、図2のラベル情報-潜在空間変換部60)と、前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出手段(例えば、図2の潜在空間距離算出部61)と、算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択手段(例えば、図2のコンテンツ選択部63)とを備える。
前記選択手段は、前記属性情報に対応するコンテンツとして、算出された前記距離が所定の閾値以下となるコンテンツか、または前記距離の近さが上位となる所定の個数のコンテンツを選択することができる。
本発明の第3の側面の情報処理方法またはプログラムは、コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換ステップ(例えば、図16のステップS41の処理)と、前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出ステップ(例えば、図16のステップS42の処理)と、算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択ステップ(例えば、図16のステップS43の処理)とを含む。
本発明の第1の側面、第2の側面、または第3の側面のプログラムは、記録媒体(例えば、図1のリムーバブルメディア21)に記録することができる。
以下、図面を参照しながら本発明の実施の形態について説明する。
図1は、コンテンツ提供装置1のハードウェアの構成の例を説明するブロック図である。
図1のコンテンツ提供装置1において、CPU(Central Processing Unit)11は、ROM(Read Only Memory)12に記憶されているプログラム、または記録部18からRAM(Random Access Memory)13にロードされたプログラムに従って各種の処理を実行する。RAM13にはまた、CPU11が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU11、ROM12、およびRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。
入出力インターフェース15には、キーボード、マウスなどよりなる入力部16、スピーカ、LCD(Liquid Crystal Display)などのディスプレイなどよりなる出力部17、ハードディスクなどより構成される記録部18、並びにインターネットなどのネットワークを介しての他の機器との通信処理を制御する通信部19が接続されている。
入出力インターフェース15にはまた、必要に応じてドライブ20が接続され、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア21が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記録部18にインストールされる。
なお、コンテンツ提供装置1のハードウェアの構成は、図1の例に限定されず、後述する図2の機能的構成を少なくとも有していればよい。
図2は、コンテンツ提供装置1の機能的構成例を示す機能ブロック図である。
コンテンツ提供装置1は、例えば、記録しているコンテンツから特徴量を抽出し、抽出した特徴量(後述するコンテンツ特徴量)とキーワード(後述するラベル情報)とを対応付けするなどの所定の処理を行う機器であり、本発明の情報処理装置の一例である。
コンテンツ提供装置1は、コンテンツ蓄積部51、コンテンツ特徴量抽出部52、コンテンツ特徴量蓄積部53、ラベル情報抽出部54、ラベル情報蓄積部55、対応情報算出部56、コンテンツ特徴量-潜在空間対応情報蓄積部57、ラベル情報-潜在空間対応情報蓄積部58、コンテンツ特徴量-潜在空間変換部59、ラベル情報-潜在空間変換部60、潜在空間距離算出部61、ラベル選択部62、およびコンテンツ選択部63を含むようにして構成される。
コンテンツ特徴量抽出部52は、コンテンツ蓄積部51に蓄積(保存)されているコンテンツからコンテンツ特徴量を抽出する。コンテンツ特徴量抽出部52は、抽出したコンテンツ特徴量をコンテンツ特徴量蓄積部53に蓄積(保存)させる。
ここで、コンテンツとは、一般的にコンテンツと称されている、例えば、テレビジョン番組、映画、写真、楽曲(動画像、静止画像、若しくは音声、またはそれらの組み合わせなど)の他、各種の情報、文章、書籍、データベースなども含んでいるものとする。なお、以下、本実施例においては、音楽であるコンテンツ(音楽コンテンツ)を例にして説明する。
また、コンテンツ特徴量とは、あるコンテンツの特徴を数値化したものである。コンテンツ特徴量は、例えば、音楽コンテンツである場合、その曲のスピード(テンポ)、明るさ(例えば、メジャーコードの曲は明るい曲となり、マイナーコードの曲は暗い曲となる)、または音圧(音のない状態と比較して音があるときに加わる圧力)などを数値化したものとなる。
ラベル情報抽出部54は、コンテンツ蓄積部51に蓄積(保存)されているコンテンツに関するラベル情報を抽出する。ラベル情報抽出部54は、抽出したラベル情報をラベル情報蓄積部55に蓄積(保存)させる。
ここで、ラベル情報とは、コンテンツの属性を示す情報である。ラベル情報は、例えば、レビュー文や歌詞、コンテンツのタイトル、または動画像のテロップなどに含まれる単語や記号、タグなどの識別可能で、かつ、コンテンツに対して、重みなどを付けることができる、コンテンツに固有な属性を示す情報となる。
対応情報算出部56は、コンテンツ特徴量蓄積部53に蓄積されているコンテンツ特徴量と、ラベル情報蓄積部55に蓄積されているラベル情報との対応情報を算出する。対応情報算出部56は、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部57およびラベル情報-潜在空間対応情報蓄積部58のそれぞれに蓄積させる。
ここで、詳細は後述するが、対応情報とは、コンテンツとラベルとを対応付けるための情報である。対応情報は、例えば、後述する潜在変数zKにより、コンテンツとラベルとを結び付ける。
コンテンツ特徴量-潜在空間変換部59は、コンテンツ特徴量-潜在空間対応情報蓄積部57に蓄積されている対応情報を基に、抽出されたコンテンツ特徴量が潜在空間中に配置されるように変換する。コンテンツ特徴量-潜在空間変換部59は、変換された結果を潜在空間距離算出部61に供給する。
潜在空間距離算出部61は、コンテンツ特徴量-潜在空間変換部59から供給された、コンテンツ特徴量を潜在空間中に配置されるように変換した処理結果およびラベル情報-潜在空間対応情報蓄積部58に蓄積されている対応情報を基に、コンテンツとラベルとの距離を算出する。潜在空間距離算出部61は、算出した距離の結果をラベル選択部62に供給する。
ラベル選択部62は、潜在空間距離算出部61から供給された距離の結果を基に、ラベルを選択する。
ラベル情報-潜在空間変換部60は、ラベル情報-潜在空間対応情報蓄積部58に蓄積されている対応情報を基に、対象となるラベルが潜在空間中に配置されるように変換する。ラベル情報-潜在空間変換部60は、変換された結果を潜在空間距離算出部61に供給する。
潜在空間距離算出部61は、ラベル情報-潜在空間変換部60から供給された、ラベル情報を潜在空間中に配置されるように変換した処理結果およびコンテンツ特徴量-潜在空間対応情報蓄積部57に蓄積されている対応情報を基に、コンテンツとラベルとの距離を算出する。潜在空間距離算出部61は、算出した距離の結果をコンテンツ選択部63に供給する。
コンテンツ選択部63は、潜在空間距離算出部61から供給された距離の結果を基に、コンテンツを選択する。
なお、上述した例においては、コンテンツ特徴量-潜在空間対応情報蓄積部57とラベル情報-潜在空間対応情報蓄積部58とを別々にするとして説明したが、それらを1つにまとめることも可能である。そのとき、コンテンツ特徴量-潜在空間対応情報蓄積部57およびラベル情報-潜在空間対応情報蓄積部58のいずれか一方が、両方の対応情報を蓄積することになる。
ところで、コンテンツ提供装置1が行う処理としては、大別すると、第1に、コンテンツ特徴量とラベル情報との対応付けをするための学習を行う処理(以下、学習フェーズとも称する)と、第2に、学習フェーズにより、対応付けられたコンテンツ特徴量とラベル情報との関係を用いて、例えば、他のコンテンツに対してラベルを付与したり、コンテンツを検索するなどをして、実際の運用を行う処理(以下、運用フェーズとも称する)がある。本明細書においては、まず、図3乃至図13を参照して、学習フェーズについて説明し、その後、図14乃至図16を参照して、運用フェーズについて説明する。
まず、図3のフローチャートを参照して、図2のコンテンツ提供装置1による、学習の処理について説明する。
ステップS11において、コンテンツ特徴量抽出部52は、コンテンツからコンテンツ特徴量を抽出し、抽出したコンテンツ特徴量をコンテンツ特徴量蓄積部53に蓄積(保存)させる。例えば、ステップS11において、コンテンツ特徴量抽出部52は、コンテンツ蓄積部51に蓄積されている音楽コンテンツから、その曲の、スピード、明るさ、または音圧などのコンテンツ特徴量を抽出し、抽出したそれらのコンテンツ特徴量をコンテンツ特徴量蓄積部53に蓄積させる。
具体的には、コンテンツ蓄積部51に蓄積されている音楽コンテンツとして、例えば、曲1乃至曲10のそれぞれが蓄積されている場合、コンテンツ特徴量抽出部52は、図4の例に示すようなコンテンツ特徴量を抽出する。
図4は、音楽コンテンツに関するコンテンツ特徴量の例を示す図である。
図4で示される例において、1列目と1行目は項目を示し、1列目には、コンテンツ蓄積部51に蓄積されている音楽コンテンツの名称が示され、1行目には、1列目のコンテンツに対するコンテンツ特徴量に関する名称、すなわち、スピード、明るさ、および音圧が示されている。
また、1行目の項目において、左から2番目のスピードであるコンテンツ特徴量は、抽出されたコンテンツ特徴量を数値化した値を示し、例えば、より0に近づくほどスピードの遅い曲(テンポの遅い曲)となり、それに対して、より100に近づくほどスピードの速い曲(テンポの速い曲)となることを意味している。
同様に、左から3番目の明るさであるコンテンツ特徴量は、例えば、より0に近づくほど暗い感じの曲(マイナーコードの曲)となり、それに対して、より100に近づくほど明るい感じの曲(メジャーコードの曲)となることを意味している。また、左から4番目の“音圧”であるコンテンツ特徴量は、例えば、より0に近づくほど音圧が低くなり、それに対して、より100に近づくほど音圧が高くなることを意味している。
すなわち、例えば、コンテンツ特徴量抽出部52は、図4に示すように、曲1(2行目)から、71であるスピード、52である明るさ、および58である音圧、曲2(3行目)から、53であるスピード、65である明るさ、および67である音圧、曲3(4行目)から、47であるスピード、75である明るさ、および51である音圧、並びに曲4(5行目)から、59であるスピード、55である明るさ、および48である音圧のそれぞれを、コンテンツ特徴量として抽出する。
また、同様に、例えば、コンテンツ特徴量抽出部52は、曲5(6行目)から、57であるスピード、52である明るさ、および59である音圧、曲6(7行目)から、39であるスピード、39である明るさ、および31である音圧、並びに曲7(8行目)から、45であるスピード、55である明るさ、および40である音圧のそれぞれを、コンテンツ特徴量として抽出する。
さらに、同様に、例えば、コンテンツ特徴量抽出部52は、曲8(9行目)から、34であるスピード、34である明るさ、および34である音圧、曲9(10行目)から、39であるスピード、27である明るさ、および45である音圧、並びに曲10(11行目)から、36であるスピード、45である明るさ、および46である音圧のそれぞれを、コンテンツ特徴量として抽出する。
そして、例えば、コンテンツ特徴量抽出部52は、曲1乃至曲10から抽出したコンテンツ特徴量(図4)を、それぞれ、コンテンツ特徴量蓄積部53に蓄積させる。
換言すれば、コンテンツ特徴量抽出部52は、コンテンツ蓄積部51に蓄積されているラベル情報の付与された個々の音楽コンテンツからコンテンツ特徴量を抽出することにより、1つの音楽コンテンツに対して、1つのベクトルをコンテンツ特徴量蓄積部53に蓄積させているとも言える。
なお、上述した例においては、音楽コンテンツから抽出するコンテンツ特徴量として、“スピード”、“明るさ”、および“音圧”を例にして説明したが、本発明はそれに限らず、例えば、対象となる音楽コンテンツの、“コード”、“コード進行”、または“音源の種類”など、音楽コンテンツに関係する特徴量であればよい。
図3のフローチャートに戻り、ステップS12において、ラベル情報抽出部54は、ラベル情報を抽出し、抽出したラベル情報をラベル情報蓄積部55に蓄積(保存)させる。例えば、ステップS12において、ラベル情報抽出部54は、コンテンツ蓄積部51に蓄積されている音楽コンテンツのレビュー文から、それらのレビュー文に含まれている単語の頻度などのラベル情報を抽出し、抽出したラベル情報をラベル情報蓄積部55に蓄積させる。
具体的には、例えば、コンテンツ蓄積部51に蓄積されている音楽コンテンツとして、曲1乃至曲10のそれぞれが蓄積されている場合、ラベル情報抽出部54は、曲1乃至曲10のそれぞれのレビュー文に対して、形態素解析による単語化を行って、その単語をカウントすることにより、図5に示すようなラベル情報を抽出する。
図5は、音楽コンテンツに関するラベル情報の例を示す図である。
図5で示される例において、1列目と1行目は項目を示し、1列目には、コンテンツ蓄積部51に蓄積されている音楽コンテンツの名称が示され、1行目には、1列目のコンテンツに関するラベル情報、すなわち、音楽コンテンツのレビュー文に含まれている単語として、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”が示されている。
また、1行目の項目において、左から2番目の“ゆったり”であるラベル情報は、ある音楽コンテンツのレビュー文の中に、“ゆったり”である単語が何回現れたかの値を示し、同様に、左から3番目の“明るい”であるラベル情報は、レビュー文に、“明るい”である単語が何回現れたかの値を示している。また、同様に、左から4番目の“ノリノリ”、左から5番目の“重い”、および左から6番目の“軽い”であるラベル情報においても、レビュー文に、それらの単語が何回現れたかの値を示している。
すなわち、例えば、ラベル情報抽出部54は、図5に示すように、曲1(2行目)のレビュー文から、“ノリノリ”と“軽い”である単語がそれぞれ2回ずつ現れ、曲2(3行目)のレビュー文から、“明るい”、“ノリノリ”、“軽い”である単語がそれぞれ1回ずつ現れ、曲3(4行目)のレビュー文から、“明るい”と“ノリノリ”である単語がそれぞれ2回ずつ現れ、曲4(5行目)のレビュー文から、“ノリノリ”と“軽い”である単語がそれぞれ1回ずつ現れたことをそれぞれ抽出する。
また、同様に、例えば、ラベル情報抽出部54は、曲5(6行目)のレビュー文から、“ノリノリ”と“軽い”である単語がそれぞれ1回ずつ現れ、曲6(7行目)のレビュー文から、“ゆったり”と“重い”である単語がそれぞれ1回ずつ現れ、曲7(8行目)のレビュー文から、“ノリノリ”である単語が1回現れたことをそれぞれ抽出する。
さらに、同様に、例えば、ラベル情報抽出部54は、曲8(9行目)のレビュー文から、“ゆったり”である単語が1回、“重い”である単語が2回現れ、曲9(10行目)のレビュー文から、“ゆったり”である単語が1回現れ、曲10(11行目)のレビュー文から、“ゆったり”である単語が2回現れたことをそれぞれ抽出する。
ラベル情報抽出部54は、曲1乃至曲10から抽出したラベル情報(図5)を、それぞれ、ラベル情報蓄積部55に蓄積させる。
なお、上述した例においては、ラベル情報として、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”を例にして説明したが、本発明はそれに限らず、例えば、“はやい”、“遅い”、または“スロー”など、音楽コンテンツのレビュー文に含まれている単語であればよい。
図3のフローチャートに戻り、ステップS13において、対応情報算出部56は、コンテンツ特徴量とラベル情報との対応情報の算出の処理を行う。対応情報算出部56は、コンテンツ特徴量とラベル情報との対応情報の算出の処理により得られた結果を、コンテンツ特徴量-潜在空間対応情報蓄積部57およびラベル情報-潜在空間対応情報蓄積部58のそれぞれに蓄積させて、学習の処理は終了する。
ここで、ステップS13における、対応情報算出部56による、対応情報の算出の処理の詳細について、図6のフローチャートを参照して説明する。
ステップS21において、対応情報算出部56は、コンテンツ特徴量蓄積部53に蓄積されているコンテンツ特徴量と、ラベル情報蓄積部55に蓄積されているラベル情報との対応情報を算出する。
ここで、コンテンツ特徴量とラベル情報とを対応させる対応情報の詳細について説明する。コンテンツ特徴量とラベル情報との対応情報であるが、コンテンツ特徴量の分布とラベル情報の分布とは、一般的には異なる分布となるので、それらの分布を結合させる必要がある。特に、連続量と離散量となる場合、同一の空間で扱うには無理があるので、異なる分布を持つ2つの空間をどのようにして結合するかが問題となる。例えば、コンテンツ特徴量が連続量となる場合、その分布をモデル化するためには、主成分分析や因子分析、混合正規分布(GMM(Gaussian Mixture Model))などの手法が用いられてきた。
混合正規分布(GMM)は、観測点(本実施例ではコンテンツ特徴量により表現された個々の音楽コンテンツ)の出現を潜在的な複数の正規分布からのものとみなすもので、一般的に、その潜在的な分布パラメータを尤度に基づいて推定する。尤度に基づくパラメータの推定方法には、例えば、EM(Expectation Maximization)アルゴリズムが代表的であるが、他にベイズ推定の考え方を用いた変分ベイズ法などもある。
一方、例えば、音楽コンテンツのレビュー文に含まれる単語の頻度などのラベル情報のモデル化には、例えば、PLSA(Probabilistic Latent Semantic Analysis)がある。PLSAは、潜在変数の条件付き確率として、文書と単語との共起を表現し、やはり尤度に基づいてこれらの条件付き確率を推定する。
これらのアルゴリズムに共通するのは、いずれも潜在変数を用いることにより、分布のパラメータが決定される点である。したがって、コンテンツ特徴量の分布を表現するための潜在変数と、ラベル情報の分布を表現するための潜在変数とを共通化することにより、それぞれの分布の特徴を反映したかたちの潜在的な概念空間を得ることができる。
よって、本実施例においては、コンテンツ特徴量の分布に関する混合正規分布(GMM)と、ラベル情報の分布に関するPLSAとの、両者の潜在変数を共通化した場合のEMアルゴリズムによるパラメータの推定を一例にして説明する。
図7は、コンテンツ特徴量による混合正規分布(GMM)と、ラベル情報によるPLSAとの潜在変数を共通化したときのグラフィカルモデルの例を示す図である。
図7で示される例において、zK(={z1,z2,z3,・・・,zK}(K:潜在変数の個数)、一般的に、zKにより表す)は潜在変数(以下、潜在変数zKと称する)を示し、snはコンテンツ(以下、コンテンツsnとも称する)を示し、wiはラベル(以下、ラベルwiとも称する)を示す。また、p(sn|zK)は、コンテンツの出現を示す条件付確率を表し、p(wi|zK)は、ラベルの出現を示す条件付確率を表し、それらのp(sn|zK)とp(wi|zK)とでは、p(zK)により決定される潜在変数zKが共通化されていることになる。
すなわち、コンテンツsnとラベルwiとは、潜在変数zKにより対応付けられていることになる。
ここで、例えば、潜在変数zKからラベルの出現は、条件付確率p(wi|zK)により決定し、一方、コンテンツ特徴量の分布は、潜在変数zKに対応する平均ベクトルと分散共分散行列(例えば、各変数の分散と、すべての変数との組み合わせについての共分散を示す行列)により決定するとした場合、コンテンツsnとラベルwiとの共起確率は、式(1)により表現される。
Figure 2007183927
ここで、式(1)においては、p(zK)=αKであり、p(sn|zK)は、式(2)により表現される。
Figure 2007183927
なお、式(2)においては、fnはn番目のコンテンツのコンテンツ特徴量を示し、μKは潜在変数zKに対応する平均ベクトル(以下、平均ベクトルμKとも称する)を示し、SKは潜在変数zKに対応する分散共分散行列(以下、分散共分散行列SKとも称する)を示し、Fはコンテンツ特徴量の次元数を示す。
この場合、EMアルゴリズムのQ関数は、式(3)により表現される。
Figure 2007183927
なお、c(wi,sn)はコンテンツsnにおけるラベルwiの出現回数または重みを示し、θ(t)はt回目の繰り返しにおけるパラメータを示す。
したがって、式(3)より、E-step(Expectation Step)は、式(4)により表現される。
Figure 2007183927
また、M-step(Maximization Step)は、式(5)、式(6)、式(7)、式(8)により表現される。
Figure 2007183927
Figure 2007183927
Figure 2007183927
Figure 2007183927
すなわち、対応情報である、μK(平均ベクトル)、SK(分散共分散行列)、αK、p(wi|zK)は、それぞれ、式(5)、式(6)、式(7)、式(8)により算出される。
例えば、ステップS21において、対応情報算出部56は、式(1)乃至式(8)を用いることにより、音楽コンテンツの10曲(曲1乃至曲10)のそれぞれに対する、コンテンツ特徴量蓄積部53に蓄積されている、スピード、明るさ、および音圧を示すコンテンツ特徴量(図4)と、ラベル情報蓄積部55に蓄積されている、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”を示すラベル情報(図5)を基に、潜在変数zKが2つ(z1,z2)(潜在変数が2次元)であるときの対応情報として、μK、SK、αK、p(wi|zK)をそれぞれ算出する。
ここで、図8乃至図13を参照して、対応情報算出部56により算出される対応情報について、より具体的に説明する。まず、図8乃至図10を参照して、コンテンツとラベルとの潜在空間上の配置の例について説明する。
図8は、コンテンツの潜在空間表現の例を示す図である。図8は、曲の潜在空間表現、すなわち、条件付確率p(zK|sn)による値の例を示している。
図8で示される例において、1列目と1行目は項目を示し、1列目には、コンテンツ蓄積部51に蓄積されている音楽コンテンツの名称が示され、1行目には、1列目のコンテンツに関する2つの潜在変数(潜在変数z1、潜在変数z2)が示されている。
例えば、対応情報算出部56は、図8に示すように、潜在変数z1の値として、曲1(2行目)を0.9、曲2(3行目)を0.7、曲3(4行目)を0.6、曲4(5行目)を0.65、曲5(6行目)を0.6、曲6(7行目)を0.2、曲7(8行目)を0.4、曲8(9行目)を0.1、曲9(10行目)を0.3、および曲10(11行目)を0.4として、それぞれ算出する。
すなわち、曲1乃至曲10(音楽コンテンツ)のそれぞれは、潜在変数z1により、ラベルと対応付けられることになる。
また、同様に、例えば、対応情報算出部56は、図8に示すように、潜在変数z2の値として、曲1(2行目)を0.1、曲2(3行目)を0.3、曲3(4行目)を0.4、曲4(5行目)を0.35、曲5(6行目)を0.4、曲6(7行目)を0.8、曲7(8行目)を0.6、曲8(9行目)を0.8、曲9(10行目)を0.7、および曲10(11行目)を0.6として、それぞれ算出する。
すなわち、曲1乃至曲10(音楽コンテンツ)のそれぞれは、潜在変数z2により、ラベルと対応付けられることになる。
次に、図9は、ラベル(単語)の潜在空間表現の例を示す図である。図9は、音楽コンテンツのレビュー文に含まれている単語の潜在空間表現、すなわち、条件付確率p(zK|wi)による値の例を示している。
図9で示される例において、1列目と1行目は項目を示し、1列目には、コンテンツ蓄積部51に蓄積されている音楽コンテンツのレビュー文に含まれているラベルが示され、1行目には、1列目のラベルに関する2つの潜在変数(潜在変数z1、潜在変数z2)が示されている。
例えば、対応情報算出部56は、図9に示すように、潜在変数z1の値として、“ゆったり”(2行目)を0.1、“明るい”(3行目)を0.7、“ノリノリ”(4行目)を0.7、“重い”(5行目)を0.2、および“軽い”(6行目)を0.9として、それぞれ算出する。
すなわち、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”であるラベルのそれぞれが、潜在変数z1により、コンテンツ(音楽コンテンツ)と対応付けられることになる。
また、同様に、対応情報算出部56は、図9に示すように、潜在変数z2の値として、“ゆったり”(2行目)を0.9、“明るい”(3行目)を0.3、“ノリノリ”(4行目)を0.3、“重い”(5行目)を0.8、および“軽い”(6行目)を0.1として、それぞれ算出する。
すなわち、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”であるラベルのそれぞれが、潜在変数z2により、コンテンツ(音楽コンテンツ)と対応付けられることになる。
次に、図10は、潜在変数zKの事前確率の例を示す図である。図10は、事前確率p(zK)=αKによる値の例を示している。
図10の2行目で示されるように、事前確率p(zK)=αKは、2つの潜在変数zKのうち、潜在変数z1のとき、p(zK)が0.48となり、潜在変数z2のとき、p(zK)が0.52となる。
このように、対応情報算出部56は、潜在変数zKを潜在変数z1と潜在変数z2との2つとした場合、式(1)乃至式(8)を用いて、各音楽コンテンツ(曲1乃至曲10)とラベル(“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”)とを潜在空間中に配置させている。
また、上述したように、対応情報算出部56は、対応情報として、例えば、平均ベクトルμKおよび分散共分散行列SKを算出する。以下、図11乃至図13を参照して、平均ベクトルμKおよび分散共分散行列SKの具体的な例について説明する。
まず、図11および図12を参照して、対応情報算出部56により算出される、潜在変数zKに対する分散共分散行列SKについて説明する。
図11は、潜在変数z1に対する分散共分散行列S1の例を示す図である。
図11で示される例において、1列目と1行目は項目を示し、1列目には、コンテンツ蓄積部51に蓄積されている音楽コンテンツのコンテンツ特徴量(の名称)が示され、同様に、1行目には、コンテンツ特徴量(の名称)が示されている。
例えば、対応情報算出部56は、図11の2行目に示すように、分散共分散行列S1の値として、“スピード”と“スピード”とを80、“スピード”と“明るさ”とを-30、および“スピード”と“音圧”とを5として、それぞれ算出する。
また、同様に、例えば、対応情報算出部56は、図11の3行目に示すように、分散共分散行列S1の値として、“明るさ”と“スピード”とを-30(2行目の左から3番目と同一となる)、“明るさ”と“明るさ”とを100、“明るさ”と“音圧”とを-10として、それぞれ算出する。
さらに、同様に、例えば、対応情報算出部56は、図11の4行目に示すように、分散共分散行列S1の値として、“音圧”と“スピード”とを5(2行目の左から4番目と同一となる)、“音圧”と“明るさ”とを-10(3行目の左から4番目と同一となる)、“音圧”と“音圧”とを50として、それぞれ算出する。
また、図12は、潜在変数z2に対する分散共分散行列S2の例を示す図である。
図12で示される例において、1列目と1行目の項目は、図11と同様であるので、その説明は省略する。
例えば、対応情報算出部56は、図12の2行目に示すように、分散共分散行列S2の値として、“スピード”と“スピード”とを30、“スピード”と“明るさ”とを30、“スピード”と“音圧”とを10として、それぞれ算出する。
また、同様に、例えば、対応情報算出部56は、図12の3行目に示すように、分散共分散行列S2の値として、“明るさ”と“スピード”とを30(2行目の左から3番目と同一となる)、“明るさ”と“明るさ”とを90、“明るさ”と“音圧”とを0として、それぞれ算出する。
さらに、同様に、例えば、対応情報算出部56は、図12の4行目に示すように、分散共分散行列S2の値として、“音圧”と“スピード”とを10(2行目の左から4番目と同一となる)、“音圧”と“明るさ”とを0(3行目の左から4番目と同一となる)、“音圧”と“音圧”とを50として、それぞれ算出する。
次に、図13を参照して、対応情報算出部56により算出される、潜在変数zKに対する平均ベクトルμKについて説明する。すなわち、図13は、潜在変数z1に対する平均ベクトルμ1と、潜在変数z2に対する平均ベクトルμ2との例を示している図である。
例えば、対応情報算出部56は、図13に示すように、潜在変数z1に対する平均ベクトルμ1の値として、スピード(2行目)を58、明るさ(3行目)を63、音圧(4行目)を59として、それぞれ算出する。
また、同様に、例えば、対応情報算出部56は、図13に示すように、潜在変数z2に対する平均ベクトルμ2の値として、スピード(2行目)を42、明るさ(3行目)を39、音圧(4行目)を40として、それぞれ算出する。
このように、対応情報算出部56は、潜在変数z1と潜在変数z2に対する、分散共分散行列S1、分散共分散行列S2、平均ベクトルμ1、および平均ベクトルμ2のそれぞれを算出する。
なお、上述した例において、対応情報算出部56による対応情報算出の処理は、混合正規分布(GMM)とPLSAとの組み合わせを一例として説明したが、コンテンツ特徴量の分布は正規分布などに限らず、例えば、SAM(Semantic Aggregation Model)や、他のパラメトリックな分布に対して適用可能となる。また、パラメータの推定方法においても、上述したEMアルゴリズムに限らず、他の手法により行うようにしてもよい。
図6のフローチャートに戻り、ステップS22において、対応情報算出部56は、算出されたコンテンツ特徴量と潜在空間との対応情報をコンテンツ特徴量-潜在空間対応情報蓄積部57に蓄積させる。
例えば、ステップS22において、対応情報算出部56は、対応情報として、各潜在変数zKに対応する、αK、分散共分散行列Sk、および平均ベクトルμkをコンテンツ特徴量-潜在空間対応情報蓄積部57に蓄積させる。すなわち、上述した例の場合、コンテンツ特徴量-潜在空間対応情報蓄積部57には、例えば、図10のα1とα2、図11の分散共分散行列S1、図12の分散共分散行列S2、および図13の平均ベクトルμ1と平均ベクトルμ2がそれぞれ蓄積される。
ステップS23において、対応情報算出部56は、算出されたラベル情報と潜在空間との対応情報をラベル情報-潜在空間対応情報蓄積部58に蓄積させて、対応情報の算出の処理は終了する。
例えば、ステップS23において、対応情報算出部56は、対応情報として、すべての潜在変数zKとラベルwiとの組み合わせに対する、p(wi|zK)とαK=p(zK)をラベル情報-潜在空間対応情報蓄積部58に蓄積させる。すなわち、上述した例の場合、ラベル情報-潜在空間対応情報蓄積部58には、例えば、図9に示す例と同様の、潜在変数z1および潜在変数z2と、“ゆったり”、“明るい”、“ノリノリ”、“重い”、および“軽い”とのp(wi|zK)、並びに、図10のαK=p(zK)が蓄積される。
なお、このとき、各コンテンツとラベルとの潜在空間上での表現は、それぞれ、p(zK|sn)、p(zK|wi)(K=1,2,・・・,K)となる。
以上のように、コンテンツ提供装置1は、学習の処理を行うことにより、コンテンツ特徴量-潜在空間対応情報蓄積部57とラベル情報-潜在空間対応情報蓄積部58のそれぞれに、対応情報を蓄積することになる。
換言すれば、コンテンツ提供装置1は、学習の処理を行うことにより、異なる分布を持っているコンテンツ特徴量とラベル情報とを、潜在変数zKにより1つの潜在空間中で統合させる。その結果、コンテンツ提供装置1は、コンテンツとラベルとを対応付けることになる。
このように、学習フェーズにおいては、異なる分布を持っている、コンテンツとラベルとを1つの潜在空間(潜在変数zK)により統合することができる。
次に、上述したように、図14乃至図16を参照して、運用フェーズについて説明する。また、運用フェーズの説明では、最初に、あるコンテンツ(音楽コンテンツ)に対して、ラベルを付与する処理を説明し、その後、あるキーワード(ラベル)に一致しているコンテンツ(音楽コンテンツ)を検索する処理を説明する。
まず、図14のフローチャートを参照して、コンテンツ提供装置1による、ある音楽コンテンツに対して、ラベルを付与する処理について説明する。なお、この処理は、例えば、ユーザにより新規の音楽コンテンツが追加されたときに開始される。
ステップS31において、コンテンツ特徴量抽出部52は、コンテンツからコンテンツ特徴量を抽出し、抽出したコンテンツ特徴量をコンテンツ特徴量蓄積部53に蓄積(保存)させる。
例えば、ステップS31において、コンテンツ特徴量抽出部52は、新規に追加される音楽コンテンツSNEWから、コンテンツ特徴量fNEW=(“スピード”,“明るさ”,“音圧”)=(55,65,45)を抽出し、抽出したコンテンツ特徴量fNEWをコンテンツ特徴量蓄積部53に蓄積させる。
換言すれば、コンテンツ特徴量抽出部52は、新規に追加される音楽コンテンツSNEWからコンテンツ特徴量を抽出することにより、1つの音楽コンテンツに対して、1つのベクトルをコンテンツ特徴量蓄積部53に蓄積させているとも言える。
ステップS32において、コンテンツ特徴量-潜在空間変換部59は、コンテンツ特徴量-潜在空間対応情報蓄積部57に蓄積されている対応情報を基に、抽出されたコンテンツ特徴量が潜在空間中に配置されるように変換し、変換された結果を潜在空間距離算出部61に供給する。
例えば、ステップS32において、コンテンツ特徴量-潜在空間変換部59は、コンテンツ特徴量-潜在空間対応情報蓄積部57に蓄積されている、分散共分散行列SK(例えば、図11の分散共分散行列S1および図12の分散共分散行列S2)と平均ベクトルμK(図13の平均ベクトルμ1と平均ベクトルμ2)とを用いて、コンテンツ特徴量fNEW=(55,65,45)を潜在空間中に配置されるよう変換する(マッピングする)。
具体的には、コンテンツ特徴量から潜在空間への変換は、上述した学習フェーズ(図3のフローチャートの処理)により得られた分布パラメータを利用することにより、例えば、式(9)により算出される。
Figure 2007183927
すなわち、p(z1|SNEW),p(z2|SNEW)のそれぞれは、式(9)を用いて、以下に示すようにして算出される。
p(z1|SNEW)=p(z1)N(fNEW,μ1,1)=0.48×1.48×10-5=7.09×10-6
p(z2|SNEW)=p(z2)N(fNEW,μ2,2)=0.52×2.98×10-6=1.43×10-6
以上のようにして算出された、p(z1|SNEW)=7.09×10-6と、p(z2|SNEW)=1.43×10-6とを正規化することにより、p(z|SNEW)=(0.83,0.17)が算出される。
なお、音楽コンテンツの事前確率p(sn)は、一般に自明ではないので、すべて等確率として扱うが、観測値全体の分布を利用して計算するようにしてもよい。
ステップS33において、潜在空間距離算出部61は、コンテンツ特徴量-潜在空間変換部59から供給された、コンテンツ特徴量を潜在空間中に配置されるように変換した処理結果およびラベル情報-潜在空間対応情報蓄積部58に蓄積されている対応情報を基に、コンテンツとラベルとの距離を算出し、算出した距離の結果をラベル選択部62に供給する。
具体的には、コンテンツとラベルとの距離の算出は、例えば、ラベルの条件付確率を利用して、式(10)により算出される。
Figure 2007183927
また、コンテンツとラベルとの距離であるが、上述した式(10)に限らず、例えば、コンテンツの潜在空間中での表現、p(zK|sn)と、ラベルの潜在空間での表現p(zK|wi)とのカルバック-ライブラー距離(Kullback-Leibler Divergence)や、ジェンセン-シャノン距離(Jensen-Shannon Divergence)(以下、JS距離とも称する)などを用いてもよい。
カルバック-ライブラー距離は、例えば、式(11)により算出される。
Figure 2007183927
また、ジェンセン-シャノン距離は、例えば、式(12)により算出される。
Figure 2007183927
なお、実際には、潜在空間はユークリット空間とならないが、より簡略化するために、ユークリット距離や各K(潜在変数の個数)に関する要素の差の総和などを用いるようにしてもよい。
すなわち、例えば、潜在空間距離算出部61は、コンテンツ特徴量-潜在空間変換部59から供給されたp(zK|SNEW)=(0.83,0.17)およびラベル情報-潜在空間対応情報蓄積部58に蓄積されているp(wi|zK)とαK=p(zK)を基に、式(12)を用いて、潜在空間中における、コンテンツとラベルとの距離(JS距離)を算出する。
図15は、潜在空間距離算出部61により算出される、コンテンツとラベルとの距離の例を示す図である。
図15で示される例において、1列目は、例えば、ラベル情報-潜在空間対応情報蓄積部58に蓄積されているラベル(各単語)を示し、2列目は、潜在空間距離算出部61により算出されるコンテンツと1列目のラベルとの距離を示す。なお、図15の例では、式(12)を用いて、コンテンツとラベルとの距離(JS距離)を算出している。
例えば、潜在空間距離算出部61は、図15に示すように、音楽コンテンツSNEWと“ゆったり”である単語とのJS距離(2行目)が0.3000、音楽コンテンツSNEWと“明るい”である単語とのJS距離(3行目)が0.0119、音楽コンテンツSNEWと“ノリノリ”である単語とのJS距離(4行目)が0.0119となることをそれぞれ算出する。
また、同様に、例えば、潜在空間距離算出部61は、図15に示すように、音楽コンテンツSNEWと“重い”である単語とのJS距離(5行目)が0.2150、音楽コンテンツSNEWと“軽い”である単語とのJS距離(6行目)が0.0053となることをそれぞれ算出する。
このように、例えば、潜在空間距離算出部61は、図15に示される、コンテンツとラベルとの距離を算出し、算出した距離の結果をラベル選択部62に供給する。
図14のフローチャートに戻り、ステップS34において、ラベル選択部62は、潜在空間距離算出部61から供給された距離の結果を基に、ラベルを選択して、ラベル付与の処理は終了する。
例えば、ステップS34において、ラベル選択部62は、潜在空間距離算出部61から供給された距離の結果が、図15のコンテンツとラベルとの距離である場合、それらのJS距離のより近い、“軽い”(JS距離=0.0053)と“明るい”(JS距離=0.0119)の2つを、この新規に追加された音楽コンテンツSNEWに付与するラベルとして選択する。
なお、新規に追加された音楽コンテンツSNEWに対して付与するラベルの数は、上述した2つに限らず、例えば、コンテンツとラベルとの距離が所定の閾値以下となるラベルか、または距離の近いラベルの上位N個(Nは整数)を選択するなどしてもよい。
また、ラベル選択部62により選択された、コンテンツに付与されたラベルであるが、例えば、出力部17の画面に表示させることで、直接ユーザに対して提示するようにしてもよいし、また、メタデータとして蓄積しておき、例えば、コンテンツの検索などに用いるようにしてもよい。
以上のようにして、コンテンツ提供装置1は、あるコンテンツに対して、より最適となるラベルを付与する。
このように、コンテンツ特徴量とラベル情報のそれぞれの分布の特徴を反映した潜在空間(潜在変数)により、ラベルを持っていないコンテンツに対しても、そのコンテンツに、より最適なラベルを付与することができる。その結果、コンテンツにキーワード(ラベル)を付与する人手による作業がなくなるので、コストを削減することができる。
次に、図16のフローチャートを参照して、コンテンツ提供装置1による、コンテンツ検索の処理について説明する。なお、この処理は、例えば、ユーザによりユーザインターフェースを介して、所定のラベルに適合するコンテンツの検索を指示されたときに開始される。
ステップS41において、ラベル情報-潜在空間変換部60は、ラベル情報-潜在空間対応情報蓄積部58に蓄積されている対応情報を基に、対象となるラベルが潜在空間中に配置されるように変換し、変換された結果を潜在空間距離算出部61に供給する。
例えば、ステップS41において、ラベル情報-潜在空間変換部60は、ユーザにより“明るい”であるラベルが指示された場合、ラベル情報-潜在空間対応情報蓄積部58に蓄積されている、すべての潜在変数zKとラベルwiとの組み合わせに対する、p(wi|zK)とαK=p(zK)を基に、“明るい”であるラベルが潜在空間中に配置されるように変換(マッピング)し、変換された結果(p(zK|wi))を潜在空間距離算出部61に供給する。
具体的には、ラベルの潜在空間への変換は、例えば、式(13)により算出される。
Figure 2007183927
なお、ここでは、ラベル(単語)の事前確率p(wi)は自明ではないので、等確率としたが、観測値の分布を用いるようにしてもよい。
ステップS42において、潜在空間距離算出部61は、ラベル情報-潜在空間変換部60から供給された、ラベル情報を潜在空間中に配置されるように変換した処理結果およびコンテンツ特徴量-潜在空間対応情報蓄積部57に蓄積されている対応情報を基に、コンテンツとラベルとの距離を算出し、算出した距離の結果をコンテンツ選択部63に供給する。
例えば、ステップS42において、潜在空間距離算出部61は、ラベル情報-潜在空間変換部60から供給されたp(zK|wi)およびコンテンツ特徴量-潜在空間対応情報蓄積部57に蓄積されている、各潜在変数zKに対応する、αK、分散共分散行列Sk、および平均ベクトルμkを基に、上述した式(12)を用いて、潜在空間中における、コンテンツとラベルとの距離を算出する。
なお、コンテンツとラベルとの距離の算出方法であるが、図14のステップS33の処理と同様に、式(12)のジェンセン-シャノン距離に限らず、例えば、ラベルの条件付確率(式(10))、カルバック-ライブラー距離(式(11))、またはユークリット距離などを用いるようにしてもよい。
図17は、ユーザにより“明るい”であるラベルが指示された場合の、潜在空間距離算出部61により算出される、コンテンツとラベルとの距離の例を示す図である。
例えば、潜在空間距離算出部61は、図17に示すように、“明るい”であるラベルと曲1とのJS距離(2行目)が0.3100、“明るい”であるラベルと曲2とのJS距離(3行目)が0.0051、“明るい”であるラベルと曲3とのJS距離(4行目)が“0.0022、“明るい”であるラベルと曲4とのJS距離(5行目)が0.1114、“明るい”であるラベルと曲5とのJS距離(6行目)が0.2547となることをそれぞれ算出する。
また、同様に、例えば、潜在空間距離算出部61は、図17に示すように、“明るい”であるラベルと曲6とJS距離(7行目)が0.0947、“明るい”であるラベルと曲7とのJS距離(8行目)が0.1473、“明るい”であるラベルと曲8とのJS距離(9行目)が0.4123、“明るい”であるラベルと曲9とのJS距離(10行目)が0.1119、“明るい”であるラベルと曲10とのJS距離(11行目)が0.3451となることをそれぞれ算出する。
さらに、同様に、例えば、潜在空間距離算出部61は、図17の12行目に示すように、図14のフローチャートの処理により、“軽い”と“明るい”であるラベルが付与された音楽コンテンツSNEWを示す曲11と、“明るい”であるラベルとのJS距離が0.0049となることを算出する。
このように、例えば、潜在空間距離算出部61は、図17に示される、コンテンツとラベルとの距離を算出し、算出した距離の結果をコンテンツ選択部63に供給する。
図16のフローチャートに戻り、ステップS43において、コンテンツ選択部63は、潜在空間距離算出部61から供給された距離の結果を基に、コンテンツを選択して、コンテンツ検索の処理は終了する。
例えば、ステップS43において、コンテンツ選択部63は、潜在空間距離算出部61から供給された距離の結果が、図17のコンテンツとラベルとの距離である場合、それらのJS距離のより近い、曲3(JS距離=0.0022)、曲11(JS距離=0.0049)、曲2(JS距離=0.0051)の上位3つを、“明るい”であるラベルに対応するコンテンツとして選択して、出力部17の画面などに表示させる。
なお、選択されるコンテンツの数は、上述した3つに限らず、例えば、コンテンツとラベルとの距離が所定の閾値以下となるコンテンツか、または距離の近いコンテンツの上位N個(Nは整数)を選択するなどしてもよい。
また、上述したように、選択されるコンテンツは、学習フェーズにおいて利用したコンテンツに限らず、運用フェーズにおいて、後から追加されたコンテンツ(例えば、音楽コンテンツSNEW)も含んでいるものとする。
さらに、例えば、ユーザにより指定されたラベルが、ラベル情報-潜在空間対応情報蓄積部58に存在しない場合、あらかじめ別のデータ(例えば、ラベルが単語である場合には、一般のコーパスやそのコンテンツの属する領域での文書データなど)を利用してより多くのラベルを含むようなモデル(補助モデル)を構築しておき、その補助モデルの中の、(学習フェーズで登場した)既知のラベルの中で指定された未知のラベルと最も近いものを代替クエリとして使用するようにしてもよい。
以上のようにして、コンテンツ提供装置1は、ラベルに対応するコンテンツを検索する。
このように、コンテンツ特徴量とラベル情報のそれぞれの分布の特徴を反映した潜在空間(潜在変数)により、キーワード(ラベル)からコンテンツを検索することができる。その結果、ユーザは、所望のコンテンツを取得することができる。
ところで、上述した例においては、コンテンツ特徴量とラベル情報との対応付けについて説明してきたが、本発明はこれに限らず、例えば、ラベル情報やコンテンツ特徴量と後述するコンテクスト情報とを対応付けしたり、ラベル情報やコンテンツ特徴量と後述する嗜好情報とを対応付けしたりすることもできる。
まず、図18乃至図21を参照して、ラベル情報およびコンテンツ特徴量と、コンテクスト情報との対応付けについて説明する。
図18は、コンテンツ提供装置1の機能的構成例の他の例について説明するブロック図である。
なお、図18では、図2と同様の箇所には、同一の符号が付してありその説明は省略する。すなわち、図18において、コンテンツ提供装置1は、図2のブロック図と比較して、コンテクスト情報抽出部111、コンテクスト情報蓄積部112、およびコンテクスト情報-潜在空間対応情報蓄積部113をさらに含むようにして構成されている。
コンテクスト情報抽出部111は、コンテンツ蓄積部51に蓄積されているコンテンツに関するコンテクスト情報を抽出する。コンテクスト情報抽出部111は、抽出したコンテクスト情報をコンテクスト情報蓄積部112に蓄積(保存)させる。
ここで、コンテクスト情報とは、ユーザがコンテンツを体験する際の、コンテンツそのもの以外の情報である。コンテクスト情報は、例えば、ユーザがコンテンツを体験した時間、季節、場所、天候、気分、一緒にいた人などとなる。
対応情報算出部56は、コンテンツ特徴量蓄積部53に蓄積されているコンテンツ特徴量と、ラベル情報蓄積部55に蓄積されているラベル情報との対応情報を算出する。対応情報算出部56は、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部57およびラベル情報-潜在空間対応情報蓄積部58のそれぞれに蓄積(保存)させる。
また、対応情報算出部56は、ラベル情報蓄積部55に蓄積されているラベル情報と、コンテクスト情報蓄積部112に蓄積されているコンテクスト情報との対応情報を算出する。対応情報算出部56は、算出した対応情報をラベル情報-潜在空間対応情報蓄積部58およびコンテクスト情報-潜在空間対応情報蓄積部113のそれぞれに蓄積(保存)させる。
さらに、対応情報算出部56は、コンテンツ特徴量蓄積部53に蓄積されているコンテンツ特徴量と、コンテクスト情報蓄積部112に蓄積されているコンテクスト情報との対応情報を算出する。対応情報算出部56は、算出した対応情報をコンテンツ特徴量-潜在空間対応情報蓄積部57およびコンテクスト情報-潜在空間対応情報蓄積部113のそれぞれに蓄積(保存)させる。
なお、ここで、対応情報は、コンテンツ、ラベル、またはコンテクストのそれぞれを対応付けるための情報となる。対応情報は、例えば、潜在変数zKにより、コンテンツ、ラベル、またはコンテクストのそれぞれを結び付ける。
また、上述した例においては、コンテンツ特徴量-潜在空間対応情報蓄積部57、ラベル情報-潜在空間対応情報蓄積部58、およびコンテクスト情報-潜在空間対応情報蓄積部113のそれぞれを別々にするとして説明したが、それらを1つにまとめることも可能である。そのとき、コンテンツ特徴量-潜在空間対応情報蓄積部57、ラベル情報-潜在空間対応情報蓄積部58、およびコンテクスト情報-潜在空間対応情報蓄積部113のいずれかが、すべての対応情報を蓄積することになる。
次に、図19のフローチャートを参照して、図18のコンテンツ提供装置1による、学習の処理について説明する。
ステップS51およびステップS52の処理のそれぞれは、図3のステップS11およびステップS12の処理のそれぞれと同様であるのでその説明は省略する。
ステップS53において、コンテクスト情報抽出部111は、コンテンツ蓄積部51に蓄積されているコンテンツに関するコンテクスト情報を抽出し、抽出したコンテクスト情報をコンテクスト情報蓄積部112に蓄積(保存)させる。例えば、ステップS53において、コンテクスト情報抽出部111は、コンテンツ蓄積部51に蓄積されている音楽コンテンツに対して、その曲がどの時間帯に聴かれたか、またはその曲がどの場所で聴かれたかを示すコンテクスト情報を抽出し、抽出したそれらのコンテクスト情報をコンテクスト情報蓄積部112に蓄積させる。
具体的には、コンテンツ蓄積部51に蓄積されている音楽コンテンツとして、例えば、曲1乃至曲10のそれぞれが蓄積されている場合、コンテクスト情報抽出部111は、図20の例に示すようなコンテクスト情報を抽出する。
図20は、音楽コンテンツに関するコンテクスト情報の例を示す図である。
図20で示される例において、1列目と1行目は項目を示し、1列目には、コンテンツ蓄積部51に蓄積されている音楽コンテンツの名称が示され、1行目には、1列目の音楽コンテンツに関するコンテクスト情報、すなわち、それらの音楽コンテンツが、朝、昼、晩のどの時間帯に聴かれたかと、自宅、屋外、通勤のどの場所で聴かれたかが示されている。
すなわち、例えば、コンテクスト情報抽出部111は、図20に示すように、曲1(2行目)が、時間帯ごとにみると、朝に3回、昼に4回、晩に2回ずつ聴かれ、かつ、場所ごとにみると、自宅で2回、屋外で3回、通勤中に4回ずつ聴かれ、曲2(3行目)が、朝に5回、昼に4回、晩に2回ずつ聴かれ、かつ、自宅で3回、屋外で2回、通勤中に3回ずつ聴かれ、曲3(4行目)が、朝に3回、昼に3回、晩に1回ずつ聴かれ、かつ、自宅で3回、屋外で3回、通勤中に5回ずつ聴かれ、曲4(5行目)が、朝に4回、昼に3回、晩に2回ずつ聴かれ、かつ、自宅で2回、屋外で3回、通勤中に3回ずつ聴かれていることを示すコンテクスト情報をそれぞれ抽出する。
また、同様に、例えば、コンテクスト情報抽出部111は、曲5(6行目)が、朝に4回、昼に2回、晩に3回ずつ聴かれ、かつ、自宅で2回、屋外で2回、通勤中に4回ずつ聴かれ、曲6(7行目)が、朝に2回、昼に3回、晩に4回ずつ聴かれ、かつ、自宅で3回、屋外で3回、通勤中に2回ずつ聴かれ、曲7(8行目)が、朝に3回、昼に1回、晩に3回ずつ聴かれ、かつ、自宅で3回、屋外で3回、通勤中に2回ずつ聴かれていることを示すコンテクスト情報をそれぞれ抽出する。
さらに、同様に、例えば、コンテクスト情報抽出部111は、曲8(9行目)が、朝に1回、昼に2回、晩に5回ずつ聴かれ、かつ、自宅で4回、屋外で3回、通勤中に3回ずつ聴かれ、曲9(10行目)が、朝に2回、昼に2回、晩に4回ずつ聴かれ、かつ、自宅で5回、屋外で2回、通勤中に2回ずつ聴かれて、曲10(11行目)が、朝に1回、昼に2回、晩に3回ずつ聴かれ、自宅で4回、屋外で3回、通勤中に3回ずつ聴かれていることを示すコンテクスト情報をそれぞれ抽出する。
図19のフローチャートに戻り、ステップS54において、対応情報算出部56は、コンテンツ特徴量蓄積部53に蓄積されているコンテンツ特徴量、ラベル情報蓄積部55に蓄積されているラベル情報、またはコンテクスト情報蓄積部112に蓄積されているコンテクスト情報を基に、それらの対応情報を算出し、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部57、ラベル情報-潜在空間対応情報蓄積部58、またはコンテクスト情報-潜在空間対応情報蓄積部113に蓄積させて、学習の処理は終了する。
ここで、コンテンツ特徴量、ラベル情報、またはコンテクスト情報の潜在空間表現は、上述したコンテンツ特徴量とラベル情報との関係と同様に共通の潜在変数zKを持ちつつ、さらに、それぞれ別の分布関数を用いて、上述した方法(図3のステップS13の処理)と同様に算出することができる。
すなわち、対応情報算出部56は、図3のステップS13の処理と同様にして、コンテンツ、ラベル、またはコンテクストの対応情報を算出する。
具体的には、例えば、図20で示されるコンテクスト情報のように、それらの音楽コンテンツが、朝、昼、晩のどの時間帯に聴かれたかと、自宅、屋外、通勤のどの場所で聴かれたかとを蓄積(保存)しておくことにより、対応情報算出部56は、コンテンツ特徴量(図4)、ラベル情報(図5)、およびコンテクスト情報(図20)を基に、対応情報を算出する。
図21は、コンテクスト情報の潜在空間表現の例を示す図である。
図21で示される例において、1列目と1行目は項目を示し、1列目には、コンテクストが示され、1行目には、1列目のコンテクストに関する2つの潜在変数(潜在変数z1、潜在変数z2)が示されている。
例えば、対応情報算出部56は、図21に示すように、潜在変数z1の値として、朝(2行目)を0.8、昼(3行目)を0.7、晩(4行目)を0.23、自宅(5行目)を0.3、屋外(6行目)を0.45、および通勤(7行目)を0.9として、それぞれ算出する。
すなわち、朝、昼、晩、自宅、屋外、および通勤であるコンテクストのそれぞれが、潜在変数z1により、コンテンツまたはラベルと対応付けられることになる。
また、同様に、例えば、対応情報算出部56は、図21に示すように、潜在変数z2の値として、朝(2行目)を0.2、昼(3行目)を0.3、晩(4行目)を0.77、自宅(5行目)を0.7、屋外(6行目)を0.55、および通勤(7行目)を0.2として、それぞれ算出する。
すなわち、朝、昼、晩、自宅、屋外、および通勤であるコンテクストのそれぞれが、潜在変数z2により、コンテンツまたはラベルと対応付けられることになる。
このように、本発明では、例えば、音楽コンテンツ(例えば、曲1乃至曲10)のそれぞれを、「朝/昼/晩」のどの時間帯に聴いたか、または「自宅/屋外/通勤」のどの場所で聴いたかを蓄積しておくことにより、上述した、コンテンツ特徴量やラベル情報と組み合わせることができる。そして、コンテンツ特徴量、ラベル情報、またはコンテクスト情報を組み合わせることにより、それぞれの分布の傾向が加味された潜在空間を生成することができ、コンテクストは、例えば、図21に示すように潜在空間にマッピングされることになる。
これにより、運用フェーズでは、上述した、図16のフローチャートと同様に、例えば、ユーザにより、「朝、自宅で聴きたい音楽コンテンツ」を指示された場合、コンテンツ提供装置1は、「朝」であるコンテクストと、「自宅」であるコンテクストに近い音楽コンテンツを選択することになる。
なお、コンテクストとコンテンツとの距離計算や、コンテクストとラベルとの距離計算であるが、これも、図16のステップS42と同様に算出されることになる。
また、コンテンツに対するコンテクスト情報は、ユーザにより異なるが、1人のユーザに関するコンテクスト情報でもよいし、または複数のユーザによるコンテクスト情報を加算したものであってもよい。
次に、図22乃至図25を参照して、ラベル情報およびコンテンツ特徴量と、嗜好情報との対応付けについて説明する。
図22は、コンテンツ提供装置1の機能的構成例の他の例について説明するブロック図である。
なお、図22では、図2と同様の箇所には、同一の符号が付してありその説明は省略する。すなわち、図22において、コンテンツ提供装置1は、図2のブロック図と比較して、嗜好情報抽出部151、嗜好情報蓄積部152、および嗜好情報-潜在空間対応情報蓄積部153をさらに含むようにして構成されている。
嗜好情報抽出部151は、コンテンツ蓄積部51に蓄積されているコンテンツに関する嗜好情報を抽出する。嗜好情報抽出部151は、抽出した嗜好情報を嗜好情報蓄積部152に蓄積(保存)させる。
ここで、嗜好情報とは、ユーザによるコンテンツの好みに関する情報である。嗜好情報は、例えば、各ユーザによるコンテンツに関する評価を示す情報(評価情報)などとなる。
対応情報算出部56は、コンテンツ特徴量蓄積部53に蓄積されているコンテンツ特徴量と、ラベル情報蓄積部55に蓄積されているラベル情報との対応情報を算出する。対応情報算出部56は、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部57およびラベル情報-潜在空間対応情報蓄積部58のそれぞれに蓄積(保存)させる。
また、対応情報算出部56は、ラベル情報蓄積部55に蓄積されているラベル情報と、嗜好情報蓄積部152に蓄積されている嗜好情報との対応情報を算出する。対応情報算出部56は、算出した対応情報をラベル情報-潜在空間対応情報蓄積部58および嗜好情報-潜在空間対応情報蓄積部153のそれぞれに蓄積(保存)させる。
さらに、対応情報算出部56は、コンテンツ特徴量蓄積部53に蓄積されているコンテンツ特徴量と、嗜好情報蓄積部152に蓄積されている嗜好情報との対応情報を算出する。対応情報算出部56は、算出した対応情報をコンテンツ特徴量-潜在空間対応情報蓄積部57および嗜好情報-潜在空間対応情報蓄積部153のそれぞれに蓄積(保存)させる。
なお、ここで、対応情報は、コンテンツ、ラベル、または嗜好情報のそれぞれを対応付けるための情報となる。対応情報は、例えば、潜在変数zKにより、コンテンツ、ラベル、または嗜好情報のそれぞれを結び付ける。
また、上述した例においては、コンテンツ特徴量-潜在空間対応情報蓄積部57、ラベル情報-潜在空間対応情報蓄積部58、および嗜好情報-潜在空間対応情報蓄積部153のそれぞれを別々にするとして説明したが、それらを1つにまとめることも可能である。そのとき、コンテンツ特徴量-潜在空間対応情報蓄積部57、ラベル情報-潜在空間対応情報蓄積部58、および嗜好情報-潜在空間対応情報蓄積部153のいずれかが、すべての対応情報を蓄積することになる。
次に、図23のフローチャートを参照して、図22のコンテンツ提供装置1による、学習の処理について説明する。
ステップS61およびステップS62の処理のそれぞれは、図3のステップS11およびステップS12の処理のそれぞれと同様であるのでその説明は省略する。
ステップS63において、嗜好情報抽出部151は、コンテンツ蓄積部51に蓄積されているコンテンツに関する嗜好情報を抽出し、抽出した嗜好情報を嗜好情報蓄積部152に蓄積(保存)させる。例えば、ステップS63において、嗜好情報抽出部151は、コンテンツ蓄積部51に蓄積されている音楽コンテンツに対して、各ユーザ(例えば、ユーザ1、ユーザ2、ユーザ3、ユーザ4、およびユーザ5)の評価情報を示す嗜好情報を抽出し、抽出したそれらの嗜好情報を嗜好情報蓄積部152に蓄積させる。
具体的には、コンテンツ蓄積部51に蓄積されている音楽コンテンツとして、例えば、曲1乃至曲10のそれぞれが蓄積されている場合、嗜好情報抽出部151は、図24の例に示すような嗜好情報を抽出する。
図24は、音楽コンテンツに関する嗜好情報の例を示す図である。
図24で示される例において、1列目と1行目は項目を示し、1列目には、コンテンツ蓄積部51に蓄積されている音楽コンテンツの名称が示され、1行目には、1列目の音楽コンテンツに関する嗜好情報、すなわち、それらの音楽コンテンツに対する、ユーザ1、ユーザ2、ユーザ3、ユーザ4、およびユーザ5のそれぞれの評価情報(例えば、図24では、つまらないと感じた曲に「1」、楽しいと感じた曲に「5」を評価する5段階評価)が示されている。
すなわち、例えば、嗜好情報抽出部151は、図24に示すように、曲1(2行目)に対して、ユーザ1が3、ユーザ2が4、ユーザ3が2、ユーザ4が2、ユーザ5が4にそれぞれ評価し、曲2(3行目)に対して、ユーザ1が5、ユーザ2が4、ユーザ3が2、ユーザ4が3、ユーザ5が3にそれぞれ評価し、曲3(4行目)に対して、ユーザ1が3、ユーザ2が3、ユーザ3が1、ユーザ4が3、ユーザ5が5にそれぞれ評価し、曲4(5行目)に対して、ユーザ1が4、ユーザ2が3、ユーザ3が2、ユーザ4が2、ユーザ5が3にそれぞれ評価したことを示す嗜好情報をそれぞれ抽出する。
また、同様に、例えば、嗜好情報抽出部151は、図24に示すように、曲5(6行目)に対して、ユーザ1が4、ユーザ2が2、ユーザ3が3、ユーザ4が2、ユーザ5が4にそれぞれ評価し、曲6(7行目)に対して、ユーザ1が2、ユーザ2が3、ユーザ3が4、ユーザ4が3、ユーザ5が2にそれぞれ評価し、曲7(8行目)に対して、ユーザ1が3、ユーザ2が1、ユーザ3が3、ユーザ4が3、ユーザ5が2にそれぞれ評価したことを示す嗜好情報をそれぞれ抽出する。
さらに、同様に、例えば、嗜好情報抽出部151は、図24に示すように、曲8(9行目)に対して、ユーザ1が1、ユーザ2が2、ユーザ3が5、ユーザ4が4、ユーザ5が3にそれぞれ評価し、曲9(10行目)に対して、ユーザ1が2、ユーザ2が2、ユーザ3が4、ユーザ4が5、ユーザ5が2にそれぞれ評価し、曲10(11行目)に対して、ユーザ1が1、ユーザ2が2、ユーザ3が3、ユーザ4が4、ユーザ5が3にそれぞれ評価したことを示す嗜好情報をそれぞれ抽出する。
図23のフローチャートに戻り、ステップS64において、対応情報算出部56は、コンテンツ特徴量蓄積部53に蓄積されているコンテンツ特徴量、ラベル情報蓄積部55に蓄積されているラベル情報、または嗜好情報蓄積部152に蓄積されている嗜好情報を基に、それらの対応情報を算出し、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部57、ラベル情報-潜在空間対応情報蓄積部58、または嗜好情報-潜在空間対応情報蓄積部153に蓄積させて、学習の処理は終了する。
ここで、コンテンツ特徴量、ラベル情報、または嗜好情報の潜在空間表現は、上述したコンテンツ特徴量とラベル情報との関係と同様に共通の潜在変数zKを持ちつつ、さらに、それぞれ別の分布関数を用いて、上述した方法(図3のステップS13の処理)と同様に算出することができる。
すなわち、対応情報算出部56は、図3のステップS13の処理と同様にして、コンテンツ、ラベル、または嗜好情報の対応情報を算出する。
具体的には、例えば、図24で示される嗜好情報のように、各ユーザによる評価情報を蓄積(保存)しておくことにより、対応情報算出部56は、コンテンツ特徴量(図4)、ラベル情報(図5)、および嗜好情報(図24)を基に、対応情報を算出する。
図25は、嗜好情報の潜在空間表現の例を示す図である。
図25で示される例において、1列目と1行目は項目を示し、1列目には、嗜好情報の名称(コンテンツを評価したユーザ名)が示され、1行目には、1列目のコンテンツに関する2つの潜在変数(潜在変数z1、潜在変数z2)が示されている。
例えば、対応情報算出部56は、図25に示すように、潜在変数z1の値として、ユーザ1(2行目)を0.8、ユーザ2(3行目)を0.7、ユーザ3(4行目)を0.3、ユーザ4(5行目)を0.45、およびユーザ5(6行目)を0.9として、それぞれ算出する。
すなわち、ユーザ1、ユーザ2、ユーザ3、ユーザ4、ユーザ5である嗜好情報のそれぞれが、潜在変数z1により、コンテンツまたはラベルと対応付けられることになる。
また、同様に、例えば、対応情報算出部56は、図25に示すように、潜在変数z2の値として、ユーザ1(2行目)を0.2、ユーザ2(3行目)を0.3、ユーザ3(4行目)を0.7、ユーザ4(5行目)を0.55、およびユーザ5(6行目)を0.2として、それぞれ算出する。
すなわち、ユーザ1、ユーザ2、ユーザ3、ユーザ4、ユーザ5である嗜好情報のそれぞれが、潜在変数z2により、コンテンツまたはラベルと対応付けられることになる。
このように、本発明では、例えば、図24の例のように、5人のユーザが、曲1乃至曲10に対して、それぞれ5段階評価をしている場合、この音楽コンテンツに関する嗜好情報(図24)と、音楽コンテンツのコンテンツ特徴量(図4)とを組み合わせることにより、ユーザの嗜好の傾向とコンテンツ特徴量の傾向とが、相互に影響を及ぼしながら、最適な潜在空間(潜在変数zK)が生成され、図25で示すようなユーザの嗜好情報が潜在空間に配置されることになる。
また、本発明では、例えば、コンテンツ特徴量またはラベル情報と共通の潜在変数zKを持ちながら、別の分布のパラメータ推定を行うことにより、各ユーザの嗜好の傾向を反映しつつ、コンテンツそのものの特徴や、(例えば、権威者などによるレビュー文に含まれる単語などの)客観的なラベルの傾向をも反映した潜在空間を得ることができる。
これにより、運用フェーズでは、例えば、ユーザ嗜好情報とコンテンツとの潜在空間中での表現を利用することにより、ユーザ全体の嗜好の情報が加味されたユーザのクラスタリングやコンテンツのクラスタリング、さらに、ユーザとコンテンツとの同時クラスタリングも可能となる。
このように、本発明によれば、ユーザの好みにあったコンテンツを推薦することができる。
なお、上述した例においては、5人のユーザの評価情報を例にして説明したが、ユーザの人数は何人でもよく、例えば、1人のユーザの評価情報を1次元の空間とみなして、潜在空間(潜在変数zK)を算出するようにしてもよい。
ところで、本発明においては、上述した潜在空間にマッピング可能となる、例えば、コンテンツ特徴量、ラベル情報、コンテクスト情報、または嗜好情報などにおける特徴性を定義することもできる。具体的には、特徴性は、例えば、潜在空間中に確率分布として表現された対象の特徴性を、どのようにそのエントロピーに対して単調減少させるものかを、式(14)で定義することにより、算出することができる。
Figure 2007183927
すなわち、例えば、対応情報算出部56は、音楽コンテンツに関するコンテクスト情報(図20)を、式(14)を用いて定義することにより、後述する図26のコンテクストの特徴性を得ることができる。
図26は、コンテクストの特徴性の例を示す図である。
図26で示される例において、1列目はコンテクストを示し、2列目は特徴性の値を示している。
例えば、対応情報算出部56は、図26に示すように、朝(2行目)に対して、0.500である特徴性の値、昼(3行目)に対して0.389である特徴性の値、晩(4行目)に対して、0.461である特徴性の値、自宅(5行目)に対して、0.389である特徴性の値、屋外(6行目)に対して、0.311である特徴性の値、および通勤(7行目)に対して、0.675である特徴性の値をそれぞれ算出する。
すなわち、例えば、図20の音楽コンテンツに関するコンテクスト情報の例における、6つのコンテクスト情報の特徴性は、「通勤」(特徴性の値が0.675)や「朝」(特徴性の値が0.500)であるコンテクストが、特徴的(特徴性の値が大きい、すなわち、音楽の聴き方に強く影響している)であることがわかる。この特徴性を用いることにより、例えば、「屋外」であるコンテクストは、音楽の聴き方に影響を及ぼさないので、ユーザが屋外にいるときには、その他の、メタデータやコンテクスト情報を推薦したり、「通勤」であるコンテクスト情報は、特徴性が強いので、他のコンテクストは無視して、潜在空間中で、「通勤」であるコンテクスト情報にのみ近い距離となる音楽コンテンツを推薦したりすることも可能となる。
また、この特徴性は、上記ラベル情報に対しても用いることができる。つまり、特徴性の高いラベル情報は、コンテンツの特徴量と関連の深い、特徴的なラベル情報であるとも言えるので、例えば、そのようなラベル情報を選択し、強調して表示することで、音楽コンテンツのレビュー文などの文章を読んでいるユーザの、音楽コンテンツの理解を補助することもできる。
そこで、まず、図27乃至図30を参照して、コンテンツとラベルとの対応付けを行う処理(学習フェーズ)について説明し、その後、図31乃至図35を参照して、対応付けられたコンテンツ特徴量とラベル情報との関係を用いて、特徴性の高いラベル情報を選択し、そのラベル情報を強調して表示する処理(運用フェーズ)について説明する。
図27は、コンテンツ提供装置1の機能的構成の他の例について説明するブロック図である。
なお、図27では、図2と同様の箇所には、同一の符号が付してあり、処理が同じ部分に関しては、その説明は繰り返しになるので適宜省略する。すなわち、図27において、コンテンツ提供装置1は、図2のブロック図と比較して、コンテンツ特徴量蓄積部53、ラベル情報蓄積部55、コンテンツ特徴量-潜在空間変換部59、ラベル情報-潜在空間変換部60、潜在空間距離算出部61、ラベル選択部62、およびコンテンツ選択部63の代わりに、ラベル情報抽出部54と接続するようにして、文章蓄積部171が設けられている。
文章蓄積部171は、コンテンツ蓄積部51に蓄積されているコンテンツに関する、例えば、レビュー文や感想文などの自然言語によって記述された文章の情報である文章情報を蓄積(保存)する。文章蓄積部171は、ラベル情報抽出部54からの要求に応じて、文書情報をラベル情報抽出部54に供給する。
ラベル情報抽出部54は、文章蓄積部171に蓄積されている文章情報を、単語または、例えば、形態素解析によって、人間にとって意味のある単位(フレーズ)に分割して単語化する。ラベル情報抽出部54は、形態素解析により得られた形態素などの情報を、ラベル情報として対応情報算出部56に供給する。
なお、フレーズとは、人間にとって意味のある単位に区切られた、「単語」または「単語列」である。
また、詳細は後述するが、形態素解析とは、コンピュータなどの計算機を用いた、いわゆる自然言語処理の基礎技術のひとつで、自然言語で書かれた文を形態素((Morpheme)、おおまかに言えば、言語で意味を持つ最小の単位)の列に分割し、品詞を見分ける作業である。なお、一般的に、形態素解析においては、例えば、日本語自然文を形態素に分割する形態素解析器(例えば、奈良先端科学技術大学院大学松本研究室で開発された「茶筌(ChaSen)」など)や、形態素を意味のあるまとまりにする、いわゆるチャンカ(例えば、「YamCha」など)などが利用される。また、文章が英語などの場合は、複数形や時制などによる語尾変化を削除して語幹だけを残す、「lemmatization」と称される単語の基本形を取り出す処理などが行われる。
対応情報算出部56は、コンテンツ特徴量抽出部52から供給されるコンテンツ特徴量と、ラベル情報抽出部54から供給されるラベル情報との対応情報を算出する。対応情報算出部56は、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部57およびラベル情報-潜在空間対応情報蓄積部58のそれぞれに蓄積させる。
なお、説明を簡略化するために、図27には図示していないが、上述した場合と同様に、コンテンツ特徴量抽出部52により抽出されたコンテンツ特徴量をコンテンツ特徴量蓄積部53に蓄積させ、ラベル情報抽出部54により抽出されたラベル情報をラベル情報蓄積部55に蓄積させてもよい。その場合、対応情報算出部56は、蓄積されているコンテンツ特徴量およびラベル情報を読み出し、それらの対応情報を算出する。
次に、図28のフローチャートを参照して、図27のコンテンツ提供装置1による、学習の処理について説明する。
ステップS71の処理は、図3のステップS11の処理と同様であるので、その説明は省略する。
ステップS72において、ラベル情報抽出部54は、文章蓄積部171に蓄積されている文章情報からラベル情報を抽出する、ラベル情報抽出の処理を行う。
ここで、ステップS72における、ラベル情報抽出部54による、ラベル情報抽出の処理の詳細について、図29のフローチャートを参照して説明する。
ステップS81において、ラベル情報抽出部54は、文章蓄積部171に蓄積されている文章情報を読み出す。
ステップS82において、ラベル情報抽出部54は、読み出した文章情報に対して、形態素解析を行う。
図30は、ラベル情報抽出部54によって行われる、形態素解析の例について説明する図である。
図30の例において、図中上側に示されるように、「・・・ひたすら明るいノリノリの曲が・・・」である文章情報が文章蓄積部171に蓄積されているとき、ラベル情報抽出部54は、その「・・・ひたすら明るいノリノリの曲が・・・」である文章情報に対して、形態素解析を行うことで、図中下側に示される形態素解析の結果を得る。
図30の下側に示す形態素解析の結果においては、図中6列で表される結果のうち、図中左側から1列目は「文字列」を示し、2列目は「読み」を示し、3列目は「原形」を示し、4列目は「品詞の種類」を示し、5列目は「活用の種類」を示し、6列目は「活用形」を示している。
つまり、ラベル情報抽出部54によって、形態素解析が行われた結果、図30の上側に示すような、「・・・ひたすら明るいノリノリの曲が・・・」である文章情報は、図30の下側に示すように、“ひたすら”である「文字列」については、「読み」が“ヒタスラ”、「原形」が“ひたすら”、「品詞の種類」が“副詞−一般”であると解析され、“明るい”である「文字列」については、「読み」が“アカルイ”、「原形」が“明るい”、「品詞の種類」が“形容詞−自立”、「活用の種類」が“形容詞・アウオ段”、「活用形」が“基本形”であると解析され、“ノリノリ”である「文字列」については、「読み」が“ノリノリ”、「原形」が“ノリノリ”、「品詞の種類」が“名詞−形容動詞語幹”であると解析される。
また、同様に、図30に示すように、「・・・ひたすら明るいノリノリの曲が・・・」である文章情報は、“の”である「文字列」については、「読み」が“ノ”、「原形」が“の”、「品詞の種類」が“助詞−連体化”であると解析され、“曲”である「文字列」については、「読み」が“キョク”、「原形」が“曲”、「品詞の種類」が“名詞−一般”であると解析され、“が”である「文字列」については、「読み」が“ガ”、「原形」が“が”、「品詞の種類」が“助詞−格助詞−一般”であると解析される。
なお、ラベル抽出部54は、形態素解析において明らかに重要でないと考えられる単語、すなわち、図30の下側に示す形態素解析の結果における、例えば、“の”および“が”などの助詞を、あらかじめ定義されたリストにしたがって削除することも可能である。
図29のフローチャートに戻り、ステップS83において、ラベル情報抽出部54は、形態素解析により得られた形態素を、ラベル情報として対応情報算出部56に供給して、ラベル情報抽出の処理は終了し、処理は、図28のステップS72に戻り、ステップS73以降の処理が実行される。
具体的には、ラベル情報抽出部54は、図30の下側に示す形態素解析の結果のうち、例えば、左側から3列目の、“ひたすら”、“明るい”、“ノリノリ”、“曲”、などの「原形」(通常活用前の原形)を、形態素とする。そして、ラベル情報抽出部54は、“ひたすら”、“明るい”、“ノリノリ”、“曲”である形態素を、ラベル情報として対応情報算出部56に供給する。
ステップS73において、図3のステップS13の処理と同様に、対応情報算出部56によって、コンテンツ特徴量とラベル情報との対応情報が算出され、その対応情報がコンテンツ特徴量-潜在空間対応情報蓄積部57およびラベル情報-潜在空間対応情報蓄積部58のそれぞれに蓄積されて、学習の処理は終了する。
例えば、対応情報算出部56は、コンテンツ特徴およびラベル情報を基に、潜在変数zKであるときの対応情報として、平均ベクトルμK、分散共分散行列SK、αK、p(wi|zK)をそれぞれ算出する。そして、対応情報算出部56は、対応情報として、例えば、潜在変数zKに対応する、αK、分散共分散行列SK、および平均ベクトルμKをコンテンツ特徴量-潜在空間対応情報蓄積部57に蓄積させ、例えば、潜在変数zKとラベルwiとの組み合わせに対する、p(wi|zK)とαK=p(zK)をラベル情報-潜在空間対応情報蓄積部58に蓄積させる。
以上のようにして、コンテンツ提供装置1は、学習の処理を行うことにより、コンテンツ特徴量-潜在空間対応情報蓄積部57とラベル情報-潜在空間対応情報蓄積部58のそれぞれに、対応情報を蓄積することになる。
このように、文章情報による自然文に含まれるフレーズを活用することで、ユーザは、コンテンツの特徴を特別に意識することなく、単に文章だけを記述さえすれば、コンテンツに属性(フレーズ)を付与することができる。また、特徴量とフレーズとの関連性が算出されるので、それらの関連性を利用して、コンテンツにメタデータを付与するコストを軽減することもできる。
次に、図31乃至図35を参照して、図31乃至図35を参照して、上記学習の処理によって対応付けられたコンテンツ特徴量とラベル情報との関係を用いて、フレーズのコンテンツ特徴量との関連度を示す特徴性の高いラベル情報を選択し、そのラベル情報を強調して表示する処理について説明する。
図31は、コンテンツ提供装置1の機能的構成の他の例について説明するブロック図である。
なお、図31では、図27と同様の箇所には、同一の符号が付してあり、処理が同じ部分に関しては、その説明は繰り返しになるので適宜省略する。すなわち、図31において、コンテンツ提供装置は、図27のブロック図と比較して、特徴性算出部181、特徴フレーズ選択部182、フレーズ表示制御部183、および表示部184が設けられている。
特徴性算出部181は、コンテンツ特徴量-潜在空間対応情報蓄積部57およびラベル情報-潜在空間対応情報蓄積部58に蓄積されている、上記文章情報が分割された各フレーズに対応する対応情報を取得する。
特徴性算出部181は、取得した各フレーズに対応する対応情報を基に、式(14)を用いて、フレーズのコンテンツ特徴量との関連度を示す特徴性を算出する。特徴性算出部181は、算出した特徴性と、その特徴性に対応するフレーズを特徴フレーズ選択部182に供給する。また、特徴性算出部181は、文章情報が分割された各フレーズをフレーズ表示制御部183に供給する。
特徴フレーズ選択部182は、特徴性算出部181から供給される特徴性の値に基づいて、特徴性に対応する各フレーズのなかから、特徴的なフレーズである特徴フレーズを選択する。特徴フレーズ選択部182は、選択した特徴フレーズをフレーズ表示制御部183に供給する。
なお、特徴フレーズ選択部182による、特徴フレーズの選択方法であるが、特徴性算出部181により算出された特徴性の値が、所定の値を超えるフレーズを特徴フレーズとしたり、特徴性の値が大きい順に並べられたフレーズのなかから、上位10%のフレーズを特徴フレーズとしたりすることができる。
フレーズ表示制御部183は、特徴フレーズ選択部182から供給される特徴フレーズに基づいて、特徴性算出部181から供給される、文章情報が分割された各フレーズのうち、特徴フレーズと一致するフレーズが強調されて表示部184に表示されるように表示を制御する。
表示部184は、図1の出力部17に相当し、フレーズ表示制御部183の制御にしたがって、例えば、文章情報による文章などを表示する。
次に、図32のフローチャートを参照して、図31のコンテンツ提供装置1による、フレーズ表示の処理について説明する。
ステップS91において、特徴性算出部181は、文章情報から切り出された各フレーズに対応する対応情報に基づいて、上述した式(14)を用いて、各フレーズごとの特徴性を算出する。
なお、以下の説明では、上述した図30の上側に示すような、「・・・ひたすら明るいノリノリの曲が・・・」である文章情報から切り出された、“ひたすら”、“明るい”、“ノリノリ”、“曲”、・・・であるフレーズ、すなわち、ラベルwi(“の”および“が”などの助詞は除く)に対して、潜在変数z1、z2に対する確率分布のパラメータ(対応情報)であるp(z=z1|wi)とp(z=z2|wi)とが、図33のように求められ、それらの情報がラベル情報-潜在空間対応情報蓄積部58に蓄積されているとして説明する。
図33は、フレーズ(ラベルwi)の潜在空間表現の例を示す図である。図33は、例えば、フレーズの潜在空間表現、すなわち、条件付確率p(zK|wi)による値の例を示している。
図33で示される例において、1列目と1行目は項目を示し、1列目にはラベル情報抽出部54によって抽出された、コンテンツのレビュー文などの文章情報から切り出されたフレーズが示され、1行目には、1列目のフレーズに関する2つの潜在変数(潜在変数z1、潜在変数z2)が示されている。
例えば、ラベル情報-潜在空間対応情報蓄積部58においては、図33に示すように、潜在変数z1の値として、“ひたすら”(2行目)に対して0.4、“明るい”(3行目)に対して0.8、“ノリノリ”(4行目)に対して0.7、“曲”(5行目)に対して0.5が、それぞれ蓄積されている。
すなわち、“ひたすら”、“明るい”、“ノリノリ”、“曲”、・・・であるフレーズのそれぞれが、潜在変数z1により、音楽コンテンツと対応付けられている。
また、同様に、ラベル情報-潜在空間対応情報蓄積部58においては、図33に示すように、潜在変数z2の値として、“ひたすら”(2行目)に対して0.6、“明るい”(3行目)に対して0.2、“ノリノリ”(4行目)に対して0.3、“曲”(5行目)に対して0.5が、それぞれ蓄積されている。
すなわち、“ひたすら”、“明るい”、“ノリノリ”、“曲”、・・・であるフレーズのそれぞれが、潜在変数z2により、音楽コンテンツと対応付けられている。
また、図33に示すように、例えば、“明るい”や“ノリノリ”といった、音楽コンテンツの内容に密接に関係してくるフレーズは、潜在変数z1または潜在変数z2のどちらかの潜在変数に対応する条件付確率p(zK|wi)の値が大きくなる。
すなわち、特徴性算出部181は、例えば、図33に示される各フレーズに対応する対応情報を基に、式(14)を用いて、図34に示すような特徴性を算出する。
図34は、フレーズ(ラベルwi)の特徴性の例を示す図である。
図34で示される例において、1列目はフレーズを示し、2列目は特徴性の値を示している。
例えば、特徴性算出部181は、図34に示すように、“ひたすら”(2行目)に対して0.708、“明るい”(3行目)に対して0.859、“ノリノリ”(4行目)に対して0.816、“曲”(5行目)に対して0.699である特徴性の値を、それぞれ算出する。
図32のフローチャートに戻り、ステップS92において、特徴フレーズ選択部182は、文章情報から切り出されたフレーズのなかから、特徴フレーズを選択する。
例えば、特徴フレーズ選択部182は、図34に示すような、“ひたすら”、“明るい”、“ノリノリ”、“曲”、・・・のなかから、特徴性の値が0.8よりも大きい、“明るい”および“ノリノリ”であるフレーズを、特徴フレーズとして選択する。
換言すれば、特徴フレーズ選択部182は、確率分布のパラメータ(対応情報)がより偏っている、“明るい”および“ノリノリ”であるフレーズを選択することで、コンテンツの内容に密接に関係するフレーズを選択しているとも言える。つまり、図34のフレーズの特徴性の例においては、“曲”(0.699)、“ひたすら”(0.708)、“ノリノリ”(0.816)、“明るい”(0.859)の順に、特徴性の値が大きくなっており、例えば、“明るい”や“ノリノリ”のような確率分布のパラメータ(対応情報)がより偏っているフレーズのほうが、より大きい特徴性を持っている。
なお、上述した例では、特徴性の値が0.8より大きいフレーズを特徴フレーズとしたが、特徴フレーズの選択方法は、上記のように特徴性の値が所定の閾値を超えるフレーズや、特徴性の値が上位N%(0≦N≦100)のフレーズを、特徴フレーズとして選択してもよい。
図32のフローチャートに戻り、ステップS93において、フレーズ表示制御部183は、文章情報から切り出されたフレーズのうち、特徴フレーズと一致するフレーズを強調して表示部184に表示させて、フレーズ表示の処理は、終了する。
例えば、フレーズ表示制御部183は、音楽コンテンツのレビュー文などの文章情報から切り出されたフレーズのなかから、特徴フレーズ選択部182により選択された、“明るい”および“ノリノリ”であるフレーズを強調して表示部184に表示させる。
図35は、音楽コンテンツのレビュー文などの文章を表示する表示部184の例を示す図である。
表示部184においては、図35の上側に示すように、「・・・ひたすら明るいノリノリの曲が・・・」である文章のうち、特徴性の値の大きい、“明るい”と“ノリノリ”である特徴フレーズが他の文字よりも、文字の大きさが大きくなるように表示されている。
また、表示部184においては、図35の下側に示すように、特徴性の値の大きい、“明るい”と“ノリノリ”である特徴フレーズが他の文字と背景の模様が異なるように表示されている。
これにより、コンテンツの特徴量と関連の深いフレーズが強調表示されるので、ユーザは、そのコンテンツのレビュー文などの文章を読むとき、その強調表示されたフレーズを注目して読むことができる。
なお、上述した例では、特徴フレーズの文字の大きさを大きくしたり、背景の模様を変える例について説明したが、それに限らず、例えば、特徴フレーズの色を変えてもよい。要は、特徴フレーズの表示の仕方を他のフレーズと変えればよいのであって、その手段、方法は、任意である。
また、本発明においては、例えば、コンテンツやラベルなどをクラスタリングすることも可能である。例えば、潜在空間への対応付けがなされたコンテンツやラベルのクラスタリングは、任意のクラスタリングアルゴリズムにより実行可能となる。また、このとき、例えば、コンテンツとラベルとは、同一の空間上に表現されているので、コンテンツまたはラベルごとのクラスタリングに限らず、コンテンツとラベルとを同時にクラスタリングして、それぞれのクラスタにコンテンツとラベルとを混在させることも可能となる。
これにより、例えば、図16のフローチャートにより説明した、コンテンツ検索の処理では、コンテンツやラベルの検索処理を個別に行わずに、同一のクラスタに入っているコンテンツとラベルとを、それに対する検索結果とみなすこともできる。その結果、ユーザは、迅速に所望のコンテンツを取得することができる。
また、上述した例においては、コンテンツ提供装置1は、学習フェーズで行われる処理と、運用フェーズで行われる処理の両方を行うとして説明したが、学習フェーズと運用フェーズの処理を別々の装置により行うようにしてもよい。以下、図36および図37を参照して、学習フェーズと運用フェーズの処理を別々に行う、コンテンツ提供装置1について説明する。
図36は、学習フェーズの処理を行う、コンテンツ提供装置1の機能的構成例を示す機能ブロック図である。
図36では、図2と同様の箇所には、同一の符号が付してありその説明は省略する。すなわち、図36のコンテンツ提供装置1は、学習フェーズの処理を行う、コンテンツ蓄積部51、コンテンツ特徴量抽出部52、コンテンツ特徴量蓄積部53、ラベル情報抽出部54、ラベル情報蓄積部55、対応情報算出部56、コンテンツ特徴量-潜在空間対応情報蓄積部57、およびラベル情報-潜在空間対応情報蓄積部58を含むようにして構成される。
図36のコンテンツ提供装置1は、例えば、図3の学習の処理を行うことにより、コンテンツ蓄積部51に蓄積されているコンテンツのコンテンツ特徴量とラベル情報との対応情報を算出し、算出した対応情報を、コンテンツ特徴量-潜在空間対応情報蓄積部57およびラベル情報-潜在空間対応情報蓄積部58のそれぞれに蓄積する。
すなわち、図36のコンテンツ提供装置1は、運用フェーズの処理を行う機器(例えば、後述する図37のクライアント端末装置201)に対して、自分が蓄積しているデータを提供することになる。
一方、図37は、運用フェーズの処理を行う、クライアント端末装置201の機能的構成例を示す機能ブロック図である。
図37では、図2と同様の箇所には、同一の符号が付してありその説明は省略する。すなわち、図37のクライアント端末装置201は、コンテンツ特徴量抽出部52、コンテンツ特徴量-潜在空間変換部59、ラベル情報-潜在空間変換部60、潜在空間距離算出部61、ラベル選択部62、およびコンテンツ選択部63を含むようにして構成される。クライアント端末装置201は、本発明の情報処理装置の一例である。
クライアント端末装置201は、例えば、図14のラベル付与の処理を行うことにより、新規に追加するコンテンツに対してラベルを付与する。このとき、クライアント端末装置201は、例えば、図36のコンテンツ提供装置1から、ラベル付与の処理に必要となるデータを取得して処理を行うことになる。
また、クライアント端末装置201は、例えば、図16のコンテンツ検索の処理を行うことにより、図36のコンテンツ提供装置1が蓄積しているコンテンツを取得する。このとき、クライアント端末装置201は、例えば、図36のコンテンツ提供装置1から、コンテンツ検索の処理に必要となるデータを取得して処理を行うことになる。
このように、本発明では、学習フェーズと運用フェーズの処理を別々の装置で行うことができる。
なお、クライアント端末装置201は、例えば、運用フェーズの処理のうち、図14のラベル付与の処理のみを行うようにしてもよいし、また、図16のコンテンツ検索の処理のみを行うようにしてもよい。
また、図27乃至図35を参照して説明した処理のうち、図27乃至図30を参照して説明した学習フェーズの処理を、図36のコンテンツ提供装置1が行って、図31乃至図35を参照して説明した運用フェーズの処理を、図37のクライアント端末装置201が行うようにしてもよい。
以上のように、本発明によれば、コンテンツに対して最適なキーワードを付与することができる
また、本発明によれば、コンテンツ特徴量とラベル情報のそれぞれの分布の特徴を反映した潜在空間により、ラベルを持たないコンテンツに対しても、そのコンテンツに対してラベルを付与したり、またはラベルからコンテンツを検索することができる。
さらに、本発明によれば、コンテンツ特徴量やラベル情報の他に、ユーザの経験に依存している嗜好情報やコンテクストなどの異なる分布を持つ複数の情報を統合した潜在空間により、従来手法では発見することのできなかった相互の関連性を発見することができ、例えば、コンテンツを推薦するシステムなどに適用することができる。
なお、本実施の形態では、対応情報は、コンテンツとラベルとを対応付けるための情報、すなわち、具体的には、例えば、μK(平均ベクトル)、SK(分散共分散行列)、αK、p(wi|zK)などであるとして説明したが、これらは、コンテンツ特徴量、ラベル情報、潜在変数のそれぞれの確率分布の性質を表わす(確率分布の)パラメータであるとも言える。つまり、対応情報算出部56は、対応情報として、これらのパラメータを算出している。
また、コンテンツ特徴量、ラベル情報、コンテクスト情報、嗜好情報は、それぞれ、コンテンツ特徴量抽出部52、ラベル情報抽出部54、コンテクスト情報抽出部111、嗜好情報抽出部151が抽出するとして説明したが、それらは、コンテンツ提供装置1により抽出されるのではなく、例えば、外部の他の機器や、ユーザによって付与するようにしてもよい。
さらにまた、上述した例においては、説明を分かり易くするために、曲数を減らして10曲で説明しているが、実際には、数千曲単位で行うのが望ましく、曲数が増えた場合でも、同様に処理が行われる。
上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
この記録媒体は、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disk))を含む)、光磁気ディスク(MD(Mini-Disc)(登録商標)を含む)、若しくは半導体メモリなどよりなる図1のリムーバブルメディア21により構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されている図1のROM12や記録部18などで構成される。
また、上述した一連の処理を実行させるプログラムは、必要に応じてルータ、モデムなどのインターフェースを介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を介してコンピュータにインストールされるようにしてもよい。
なお、本明細書において、記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
コンテンツ提供装置のハードウェアの構成の例を説明するブロック図である。 コンテンツ提供装置の機能的構成例を示す機能ブロック図である。 図2のコンテンツ提供装置による、学習の処理について説明するフローチャートである。 音楽コンテンツに関するコンテンツ特徴量の例を示す図である。 音楽コンテンツに関するラベル情報の例を示す図である。 対応情報の算出の処理の詳細について説明するフローチャートである。 コンテンツ特徴量による混合正規分布(GMM)と、ラベル情報によるPLSAとの潜在変数を共通化したときのグラフィカルモデルの例を示す図である。 コンテンツの潜在空間表現の例を示す図である。 ラベルの潜在空間表現の例を示す図である。 潜在変数zKの事前確率の例を示す図である。 潜在変数z1に対する分散共分散行列S1の例を示す図である。 潜在変数z2に対する分散共分散行列S2の例を示す図である。 対応情報算出部により算出される、平均ベクトルμ1と平均ベクトルμ2の例を示す図である。 コンテンツ提供装置による、あるコンテンツに対して、ラベルを付与する処理について説明するフローチャートである。 潜在空間距離算出部により算出される、コンテンツとラベルとの距離の例を示す図である。 コンテンツ提供装置による、コンテンツ検索の処理について説明するフローチャートである。 潜在空間距離算出部により算出される、コンテンツとラベルとの距離の例を示す図である。 コンテンツ提供装置の機能的構成例の他の例について説明するブロック図である。 図18のコンテンツ提供装置による、学習の処理について説明するフローチャートである。 音楽コンテンツに関するコンテクスト情報の例を示す図である。 コンテクスト情報の潜在空間表現の例を示す図である。 コンテンツ提供装置の機能的構成例の他の例について説明するブロック図である。 図22のコンテンツ提供装置による、学習の処理について説明するフローチャートである。 音楽コンテンツに関する嗜好情報の例を示す図である。 嗜好情報の潜在空間表現の例を示す図である。 コンテクストの特徴性の例を示す図である。 コンテンツ提供装置の機能的構成の他の例について説明するブロック図である。 図27のコンテンツ提供装置による、学習の処理について説明するフローチャートである。 ラベル情報算出の処理の詳細について説明するフローチャートである。 形態素解析の例について説明する図である。 コンテンツ提供装置の機能的構成の他の例について説明するブロック図である。 図31のコンテンツ提供装置による、フレーズ表示の処理について説明するフローチャートである。 ラベルの潜在空間表現の例を示す図である。 フレーズの特徴性の例を示す図である。 音楽コンテンツのレビュー文などの文章を表示する表示部の例を示す図である。 学習フェーズの処理を行う、コンテンツ提供装置の機能的構成例を示す機能ブロック図である。 運用フェーズの処理を行う、クライアント端末装置の機能的構成例を示す機能ブロック図である。
符号の説明
1 コンテンツ提供装置, 11 CPU, 12 ROM, 13 RAM, 16 入力部, 17 出力部, 18 記録部, 19 通信部, 20 ドライブ, 21 リムーバブルメディア, 51 コンテンツ蓄積部, 52 コンテンツ特徴量抽出部, 53 コンテンツ特徴量蓄積部, 54 ラベル情報抽出部, 55 ラベル情報蓄積部, 56 対応情報算出部, 57 コンテンツ特徴量-潜在空間対応情報蓄積部, 58 ラベル情報-潜在空間対応情報蓄積部, 59 コンテンツ特徴量-潜在空間変換部, 60 ラベル情報-潜在空間対応情報変換部, 61 潜在空間距離算出部, 62 ラベル選択部, 63 コンテンツ選択部, 111 コンテクスト情報抽出部, 112 コンテクスト情報蓄積部, 113 コンテクスト情報-潜在空間対応情報蓄積部, 151 嗜好情報抽出部, 152 嗜好情報蓄積部, 153 嗜好情報-潜在空間対応情報蓄積部, 171 文章蓄積部, 181 特徴性算出部, 182 特徴フレーズ選択部, 183 フレーズ表示制御部, 184 表示部, 201 クライアント端末装置

Claims (18)

  1. コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報とに共通する第1の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第1のパラメータを算出する第1の算出手段と、
    算出された前記第1のパラメータを蓄積する蓄積手段と
    を備える情報処理装置。
  2. 前記特徴量を抽出する第1の抽出手段と、
    前記属性情報を抽出する第2の抽出手段と
    をさらに備え、
    前記第1の算出手段は、抽出された前記特徴量と、抽出された前記属性情報とから、前記第1のパラメータを算出する
    請求項1の情報処理装置。
  3. 前記第2の抽出手段は、自然言語によって記述された文章を、単語または前記単語のまとまりであるフレーズに分割する
    請求項2の情報処理装置。
  4. 算出された前記第1のパラメータに基づいて、前記フレーズの前記特徴量との関連度を示す特徴性を算出する第2の算出手段と、
    算出された前記特徴性に基づいて、前記フレーズの表示を制御する表示制御手段と
    をさらに備える請求項3の情報処理装置。
  5. 前記第1の算出手段は、前記特徴量、前記属性情報、またはユーザによる前記コンテンツの利用に関する情報を示す利用情報のそれぞれに共通する第2の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第2のパラメータを算出し、
    前記蓄積手段は、算出された前記第2のパラメータを蓄積する
    請求項1の情報処理装置。
  6. 前記利用情報を抽出する抽出手段をさらに備え、
    前記第1の算出手段は、前記特徴量、前記属性情報、または抽出された前記利用情報から、前記第2のパラメータを算出する
    請求項5の情報処理装置。
  7. 前記第1の算出手段は、前記特徴量、前記属性情報、または前記コンテンツに対するユーザの嗜好に関する情報を示す嗜好情報のそれぞれに共通する第3の潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わす第3のパラメータを算出し、
    前記蓄積手段は、算出された前記第3のパラメータを蓄積する
    請求項1の情報処理装置。
  8. 前記嗜好情報を抽出する抽出手段をさらに備え、
    前記第1の算出手段は、前記特徴量、前記属性情報、または抽出された前記嗜好情報から、前記第3のパラメータを算出する
    請求項7の情報処理装置。
  9. コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報とに共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータを算出する算出ステップと、
    算出された前記パラメータを蓄積する蓄積ステップと
    を含む情報処理方法。
  10. コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータを算出する算出ステップと、
    算出された前記パラメータを蓄積する蓄積ステップと
    をコンピュータに実行させるプログラム。
  11. コンテンツに関係する特徴量を抽出する抽出手段と、
    前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換手段と、
    前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出手段と、
    算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択手段と
    を備える情報処理装置。
  12. 前記選択手段は、前記コンテンツに対応する属性として、算出された前記距離が所定の閾値以下となる属性か、または前記距離の近さが上位となる所定の個数の属性を選択する
    請求項11の情報処理装置。
  13. コンテンツに関係する特徴量を抽出する抽出ステップと、
    前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換ステップと、
    前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出ステップと、
    算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択ステップと
    を含む情報処理方法。
  14. コンテンツに関係する特徴量を抽出する抽出ステップと、
    前記特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、抽出された前記特徴量が潜在空間に配置されるように変換する変換ステップと、
    前記潜在空間中に変換された前記特徴量と、前記潜在変数により前記特徴量に対して潜在的に結び付いている前記属性情報との距離を算出する算出ステップと、
    算出された前記距離に基づいて、前記コンテンツに対応する属性を選択する選択ステップと
    をコンピュータに実行させるプログラム。
  15. コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換手段と、
    前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出手段と、
    算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択手段と
    を備える情報処理装置。
  16. 前記選択手段は、前記属性情報に対応するコンテンツとして、算出された前記距離が所定の閾値以下となるコンテンツか、または前記距離の近さが上位となる所定の個数のコンテンツを選択する
    請求項15の情報処理装置。
  17. コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換ステップと、
    前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出ステップと、
    算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択ステップと
    を含む情報処理方法。
  18. コンテンツに関係する特徴量と前記コンテンツの属性を示す属性情報に共通する潜在変数、前記特徴量、および前記属性情報のそれぞれの確率分布の性質を表わすパラメータに基づいて、前記属性情報が潜在空間に配置されるように変換する変換ステップと、
    前記潜在空間中に変換された前記属性情報と、前記潜在変数により前記属性情報に対して潜在的に結び付いている前記特徴量との距離を算出する算出ステップと、
    算出された前記距離に基づいて、前記属性情報に対応するコンテンツを選択する選択ステップと
    をコンピュータに実行させるプログラム。
JP2006314534A 2005-12-05 2006-11-21 情報処理装置および方法、並びにプログラム Pending JP2007183927A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006314534A JP2007183927A (ja) 2005-12-05 2006-11-21 情報処理装置および方法、並びにプログラム
US11/815,538 US8478781B2 (en) 2005-12-05 2006-12-04 Information processing apparatus, information processing method and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005350824 2005-12-05
JP2006314534A JP2007183927A (ja) 2005-12-05 2006-11-21 情報処理装置および方法、並びにプログラム

Publications (1)

Publication Number Publication Date
JP2007183927A true JP2007183927A (ja) 2007-07-19

Family

ID=38339928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006314534A Pending JP2007183927A (ja) 2005-12-05 2006-11-21 情報処理装置および方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP2007183927A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079871A (ja) * 2008-06-09 2010-04-08 Yahoo Japan Corp ベクトルデータ検索装置
JP2013114586A (ja) * 2011-11-30 2013-06-10 Nippon Telegr & Teleph Corp <Ntt> 特徴語抽出装置、特徴語抽出方法、及びプログラム
KR101318923B1 (ko) * 2011-12-28 2013-10-17 포항공과대학교 산학협력단 자료 특징 추출 시스템 및 자료 특징 추출 방법
JP2015515038A (ja) * 2012-03-02 2015-05-21 ノキア コーポレイション メディア・イベントの提案を提供する方法及び装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079871A (ja) * 2008-06-09 2010-04-08 Yahoo Japan Corp ベクトルデータ検索装置
JP2013114586A (ja) * 2011-11-30 2013-06-10 Nippon Telegr & Teleph Corp <Ntt> 特徴語抽出装置、特徴語抽出方法、及びプログラム
KR101318923B1 (ko) * 2011-12-28 2013-10-17 포항공과대학교 산학협력단 자료 특징 추출 시스템 및 자료 특징 추출 방법
JP2015515038A (ja) * 2012-03-02 2015-05-21 ノキア コーポレイション メディア・イベントの提案を提供する方法及び装置

Similar Documents

Publication Publication Date Title
US20220035827A1 (en) Tag selection and recommendation to a user of a content hosting service
US11720572B2 (en) Method and system for content recommendation
US8027977B2 (en) Recommending content using discriminatively trained document similarity
JP4622589B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP4857333B2 (ja) 諸文書にわたる文脈要約情報の決定方法
US7953735B2 (en) Information processing apparatus, method and program
JP4378646B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US8650094B2 (en) Music recommendation using emotional allocation modeling
US8200667B2 (en) Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile
US8478781B2 (en) Information processing apparatus, information processing method and program
US20210142791A1 (en) System and Method for Intent Discovery from Multimedia Conversation
JP2002230021A (ja) 情報検索装置及び情報検索方法並びに記憶媒体
JP2006048286A (ja) 情報処理装置および方法、並びにプログラム
JP2011175362A (ja) 情報処理装置、重要度算出方法及びプログラム
Boughanmi et al. Dynamics of musical success: A machine learning approach for multimedia data fusion
Martín et al. Using semi-structured data for assessing research paper similarity
JP2000148793A (ja) 複合メディア文書の類似検索方法及び装置及び複合メディア文書の類似検索プログラムを格納した記憶媒体
Ramkumar et al. Scoring products from reviews through application of fuzzy techniques
Hyung et al. Utilizing context-relevant keywords extracted from a large collection of user-generated documents for music discovery
US20060230036A1 (en) Information processing apparatus, information processing method and program
JP2007183927A (ja) 情報処理装置および方法、並びにプログラム
US20200293574A1 (en) Audio Search User Interface
CN108664661B (zh) 一种基于频繁主题集偏好的学术论文推荐方法
JP5131565B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
EP4287039A1 (en) System and method for content-based music project recommendation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111129

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120327