JP2006048320A - 情報処理装置および方法、記録媒体、並びにプログラム - Google Patents
情報処理装置および方法、記録媒体、並びにプログラム Download PDFInfo
- Publication number
- JP2006048320A JP2006048320A JP2004227540A JP2004227540A JP2006048320A JP 2006048320 A JP2006048320 A JP 2006048320A JP 2004227540 A JP2004227540 A JP 2004227540A JP 2004227540 A JP2004227540 A JP 2004227540A JP 2006048320 A JP2006048320 A JP 2006048320A
- Authority
- JP
- Japan
- Prior art keywords
- content
- user
- feature amount
- weight
- contents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】 各特徴量に対するユーザの感じ方の個人差を考慮して、指定コンテンツと検索または推薦の対象となる対象コンテンツとの類似度を計算する。
【解決手段】 ユーザは、入力部21において、ユーザコンテンツDB23のなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度を入力する。重み計算部26は、指定コンテンツに対するユーザの嗜好度と、指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対するユーザの重みを計算する。類似度計算部27は、重み計算部26から供給される、ユーザの各特徴量の重みを用いて、任意の検索対象コンテンツ間の類似度を計算する。そして、類似度が高い検索対象コンテンツが、ユーザの嗜好に合致するコンテンツとしてユーザに提示される。本発明は、例えば、コンテンツを検索する情報処理装置に適用できる。
【選択図】図1
【解決手段】 ユーザは、入力部21において、ユーザコンテンツDB23のなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度を入力する。重み計算部26は、指定コンテンツに対するユーザの嗜好度と、指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対するユーザの重みを計算する。類似度計算部27は、重み計算部26から供給される、ユーザの各特徴量の重みを用いて、任意の検索対象コンテンツ間の類似度を計算する。そして、類似度が高い検索対象コンテンツが、ユーザの嗜好に合致するコンテンツとしてユーザに提示される。本発明は、例えば、コンテンツを検索する情報処理装置に適用できる。
【選択図】図1
Description
本発明は、情報処理装置および方法、記録媒体、並びにプログラムに関し、特に、各特徴量に対するユーザの感じ方の個人差を考慮して、指定コンテンツと検索または推薦の対象となる対象コンテンツとの類似度を計算する情報処理装置および方法、記録媒体、並びにプログラムに関する。
テレビジョン放送やラジオ放送などの番組、映画、写真等の画像、楽曲(音声)、または、インターネット上のサイトなどに掲載されている、料理や旅行、ショッピングなどの各種の情報など様々なコンテンツにおいて、数多くのコンテンツのなかから、ユーザ自身の嗜好に合うコンテンツを検索することがある。
ユーザの嗜好に合うコンテンツを検索する方法では、コンテンツの特徴を表す数種類のコンテンツの特徴量を用いて、ユーザが指定した指定コンテンツと検索対象となる検索対象コンテンツとの特徴量の類似度を計算し、指定コンテンツと類似度が高い検索対象コンテンツをユーザの嗜好に合うコンテンツとする方法がある。
例えば、特許文献1では、検索キーとなる1つの検索キーオブジェクト(コンテンツ)を入力し、その検索キーオブジェクトの特徴量と、特徴量格納・管理装置に格納されているオブジェクトの特徴量とから、両者の類似度を算出し、その類似度が所定の値以上のオブジェクトについて類似度の高い順に順序付けが行われて出力される類似オブジェクト検索装置が開示されている。
従来、コンテンツ検索において指定コンテンツと検索対象コンテンツとの特徴量の類似度を計算する場合、コンテンツの各特徴量に対する重要度(重み)は、すべて同等であるものとして計算されている。
しかしながら、コンテンツにユーザの嗜好の度合いがあるように、コンテンツの特徴量に対しても、ユーザの嗜好の度合いがある。例えば、コンテンツとして楽曲を考えた場合、コンテンツの特徴量を、例えば、テンポ、ムード、音の多さとすると、あるユーザは、テンポと音の多さは、重要視していないが、ムードについては、コンテンツの検索において重要視している、などということがある。
ところが、従来のコンテンツの検索においては、コンテンツの各特徴量のうち、ユーザがどの特徴量に敏感であるか(重要視しているか)を考慮して、換言すれば、各特徴量に対するユーザの感じ方の個人差を考慮して、指定コンテンツと検索対象コンテンツとの類似度を計算していなかった。従って、コンテンツ検索では、ユーザの嗜好に最も合致する(最適な)コンテンツを検索(提示)しているとは言い難かった。
本発明は、このような状況に鑑みてなされたものであり、各特徴量に対するユーザの感じ方の個人差を考慮して、指定コンテンツと検索または推薦の対象となる対象コンテンツとの類似度を計算することができるようにするものである。
本発明の情報処理装置は、対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対するユーザの重みを計算する重み計算手段と、重み計算手段により計算されたユーザの各特徴量の重みを用いて、任意の対象コンテンツ間の類似度を計算する類似度計算手段とを備えることを特徴とする。
類似度計算手段により計算された、任意の対象コンテンツ間の類似度を用いて、各対象コンテンツの合成スコアを計算する合成スコア計算手段と、合成スコアが大きい対象コンテンツを、ユーザの嗜好に合致するコンテンツとして提示する提示手段とをさらに設けることができる。
指定コンテンツを表す指定コンテンツ情報と、指定コンテンツに対するユーザの嗜好度を入力する入力手段をさらに設け、重み計算手段には、入力手段により入力された指定コンテンツ情報が表す指定コンテンツとユーザの嗜好度とを用いて、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対するユーザの重みを計算させることができる。
重み計算手段には、ユーザが敏感な種類の特徴量に対しては、ユーザの重みが大きく、ユーザが鈍感な種類の特徴量に対しては、ユーザの重みが小さくなるように、コンテンツの各特徴量に対するユーザの重みを計算させることができる。
指定コンテンツの特徴量を抽出する抽出手段をさらに設けることができる。
本発明の情報処理方法は、対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対するユーザの重みを計算する重み計算ステップと、重み計算ステップの処理により計算されたユーザの各特徴量の重みを用いて、任意の対象コンテンツ間の類似度を計算する類似度計算ステップとを含むことを特徴とする。
本発明の記録媒体に記録されているプログラムは、対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対するユーザの重みを計算する重み計算ステップと、重み計算ステップの処理により計算されたユーザの各特徴量の重みを用いて、任意の対象コンテンツ間の類似度を計算する類似度計算ステップとを含むことを特徴とする。
本発明のプログラムは、対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対するユーザの重みを計算する重み計算ステップと、重み計算ステップの処理により計算されたユーザの各特徴量の重みを用いて、任意の対象コンテンツ間の類似度を計算する類似度計算ステップとを含む処理をコンピュータに実行させることを特徴とする。
本発明においては、対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対するユーザの重みが計算され、計算されたユーザの各特徴量の重みを用いて、任意の対象コンテンツ間の類似度が計算される。
本発明によれば、各特徴量に対するユーザの感じ方の個人差を考慮して、指定コンテンツと検索または推薦の対象となる対象コンテンツとの類似度を計算することができる。
以下に本発明の実施の形態を説明するが、請求項に記載の構成要件と、発明の実施の形態における具体例との対応関係を例示すると、次のようになる。この記載は、請求項に記載されている発明をサポートする具体例が、発明の実施の形態に記載されていることを確認するためのものである。従って、発明の実施の形態中には記載されているが、構成要件に対応するものとして、ここには記載されていない具体例があったとしても、そのことは、その具体例が、その構成要件に対応するものではないことを意味するものではない。逆に、具体例が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その具体例が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
さらに、この記載は、発明の実施の形態に記載されている具体例に対応する発明が、請求項に全て記載されていることを意味するものではない。換言すれば、この記載は、発明の実施の形態に記載されている具体例に対応する発明であって、この出願の請求項には記載されていない発明の存在、すなわち、将来、分割出願されたり、補正により追加される発明の存在を否定するものではない。
請求項1に記載の情報処理装置は、
複数種類の特徴量によってコンテンツの特徴が表されている、検索または推薦の対象となる複数の対象コンテンツに対する処理を行う情報処理装置(例えば、図1のコンテンツ提示装置11)において、
前記対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の前記指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対する前記ユーザの重みを計算する重み計算手段(例えば、図1の重み計算部26)と、
前記重み計算手段により計算された前記ユーザの前記各特徴量の重みを用いて、任意の前記対象コンテンツ間の類似度を計算する類似度計算手段(例えば、図1の類似度計算部27)と
を備えることを特徴とする。
複数種類の特徴量によってコンテンツの特徴が表されている、検索または推薦の対象となる複数の対象コンテンツに対する処理を行う情報処理装置(例えば、図1のコンテンツ提示装置11)において、
前記対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の前記指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対する前記ユーザの重みを計算する重み計算手段(例えば、図1の重み計算部26)と、
前記重み計算手段により計算された前記ユーザの前記各特徴量の重みを用いて、任意の前記対象コンテンツ間の類似度を計算する類似度計算手段(例えば、図1の類似度計算部27)と
を備えることを特徴とする。
請求項2に記載の情報処理装置は、
前記類似度計算手段により計算された、任意の前記対象コンテンツ間の前記類似度を用いて、各対象コンテンツの合成スコアを計算する合成スコア計算手段(例えば、図1の合成部29)と、
前記合成スコアが大きい対象コンテンツを、前記ユーザの嗜好に合致するコンテンツとして提示する提示手段(例えば、図1の制御部22)と
をさらに備えることを特徴とする。
前記類似度計算手段により計算された、任意の前記対象コンテンツ間の前記類似度を用いて、各対象コンテンツの合成スコアを計算する合成スコア計算手段(例えば、図1の合成部29)と、
前記合成スコアが大きい対象コンテンツを、前記ユーザの嗜好に合致するコンテンツとして提示する提示手段(例えば、図1の制御部22)と
をさらに備えることを特徴とする。
請求項3に記載の情報処理装置は、
前記指定コンテンツを表す指定コンテンツ情報と、前記指定コンテンツに対する前記ユーザの嗜好度を入力する入力手段(例えば、図1の入力部21)をさらに備え、
前記重み計算手段は、前記入力手段により入力された前記指定コンテンツ情報が表す前記指定コンテンツと前記ユーザの嗜好度とを用いて、所定数の前記指定コンテンツに対する前記ユーザの嗜好度と、所定数の前記指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対する前記ユーザの重みを計算する
ことを特徴とする。
前記指定コンテンツを表す指定コンテンツ情報と、前記指定コンテンツに対する前記ユーザの嗜好度を入力する入力手段(例えば、図1の入力部21)をさらに備え、
前記重み計算手段は、前記入力手段により入力された前記指定コンテンツ情報が表す前記指定コンテンツと前記ユーザの嗜好度とを用いて、所定数の前記指定コンテンツに対する前記ユーザの嗜好度と、所定数の前記指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対する前記ユーザの重みを計算する
ことを特徴とする。
請求項5に記載の情報処理装置は、
前記指定コンテンツの特徴量を抽出する抽出手段(例えば、図1の特徴量抽出部24)をさらに備える
ことを特徴とする。
前記指定コンテンツの特徴量を抽出する抽出手段(例えば、図1の特徴量抽出部24)をさらに備える
ことを特徴とする。
請求項6に記載の情報処理方法は、
複数種類の特徴量によってコンテンツの特徴が表されている、検索または推薦の対象となる複数の対象コンテンツに対する処理を行う情報処理方法において、
前記対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の前記指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対する前記ユーザの重みを計算する重み計算ステップ(例えば、図16のステップS3の処理)と、
前記重み計算ステップの処理により計算された前記ユーザの前記各特徴量の重みを用いて、任意の前記対象コンテンツ間の類似度を計算する類似度計算ステップ(例えば、図17のステップS22の処理)と
を含むことを特徴とする。
複数種類の特徴量によってコンテンツの特徴が表されている、検索または推薦の対象となる複数の対象コンテンツに対する処理を行う情報処理方法において、
前記対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の前記指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対する前記ユーザの重みを計算する重み計算ステップ(例えば、図16のステップS3の処理)と、
前記重み計算ステップの処理により計算された前記ユーザの前記各特徴量の重みを用いて、任意の前記対象コンテンツ間の類似度を計算する類似度計算ステップ(例えば、図17のステップS22の処理)と
を含むことを特徴とする。
請求項7に記載の記録媒体のプログラム、請求項8に記載のプログラムの各ステップの具体例も、請求項6に記載の情報処理方法の各ステップの発明の実施の形態における具体例と同様である。
以下、図を参照して、本発明の実施の形態について説明する。
図1は、本発明を適用したコンテンツ提示装置の一実施の形態の構成例(機能ブロック図)を示している。
図1のコンテンツ提示装置11は、ユーザが指定したコンテンツ(指定コンテンツ)を基に、ユーザに最適な(ユーザの嗜好に合致する)コンテンツを検索し、ユーザに提示する。
ここで、検索の対象となるコンテンツを検索対象コンテンツ(対象コンテンツ)と称する。また、コンテンツとは、例えば、テレビジョン放送やラジオ放送などの番組、映画、写真等の画像、楽曲(音声)、または、インターネット上のサイトなどに掲載されている、料理や旅行、ショッピングなどの各種のカテゴリの情報を表す。但し、本実施の形態では、コンテンツは楽曲であるとして、ユーザの嗜好に合致する楽曲を提示する例について説明する。
コンテンツ提示装置11の入力部21において、ユーザは、ユーザコンテンツDB(Data Base)23に記憶されているコンテンツ(楽曲)(検索対象コンテンツ)のなかで、既に聴いたことがある楽曲を複数(所定数)指定するとともに、その指定コンテンツに対するユーザの嗜好度を入力する。
入力部21は、ユーザに指定された指定コンテンツを表す指定コンテンツ情報と、その指定コンテンツに対するユーザの嗜好度(以下、ユーザ嗜好度ともいう)とを制御部22に供給する。
入力部21における、コンテンツ(指定コンテンツ)を指定する方法と、その指定コンテンツに対する嗜好度の入力方法(U/I(User Interface))は、特に限定されず、どのような方法でもよい。例えば、ユーザコンテンツDB23に記憶されている楽曲のリストを図示せぬLCD (Liquid Crystal Display)などの表示部に表示させ、図示せぬキーボードまたはマウス等により、ユーザが、表示されている楽曲のリストのなかからコンテンツを指定し、その後、その指定コンテンツに対する嗜好度を数値入力するようにさせることができる。
制御部22は、入力部21から供給される指定コンテンツ情報とユーザ嗜好度とを重み計算部26に供給する。また、制御部22は、指定コンテンツ情報を類似度計算部27にも供給する。
また、制御部22には、ソート部30から、各検索対象コンテンツの合成スコアS(後述)が大きい順にソートされた検索対象コンテンツのリストが供給される。制御部22は、ソート部30から供給される検索対象コンテンツのリストを、表示部に表示させユーザに提示する。なお、制御部22は、合成スコアSの一番大きい検索対象コンテンツを、ユーザコンテンツDB23からコンテンツ再生部32に供給させ、再生させることもできる。
ユーザコンテンツDB23は、ユーザの嗜好に合致するコンテンツを検索する対象である検索対象コンテンツを記憶している。また、入力部21において、ユーザは、ユーザコンテンツDB23に記憶されている検索対象コンテンツのなかから、指定コンテンツを入力するので、検索対象コンテンツには、指定コンテンツであるものも含まれる。ユーザコンテンツDB23に記憶されているコンテンツは、例えば、外部I/F部31を介して接続される音楽配信(Electronic Music Distribution:EMD)サーバなどの外部サーバ(図示せず)からダウンロードされる。
また、ユーザコンテンツDB23に記憶されているコンテンツは、必要に応じて、特徴量抽出部24またはコンテンツ再生部32に供給される。なお、ユーザコンテンツDB23には、上述したように、外部I/F31を介して外部サーバから取得したコンテンツの他、例えば、DVD(Digital Versatile Disc)や半導体メモリなどの所定の記録媒体(リムーバブルメディア)から、図示せぬドライブなどを介して取得されるコンテンツも記憶させることができる。
特徴量抽出部24は、ユーザコンテンツDB23に記憶されている全てのコンテンツ(指定コンテンツを含む全ての検索対象コンテンツ)についてコンテンツの特徴量を抽出し、抽出した各特徴量の値を重み計算部26および類似度計算部27に供給する。なお、特徴量抽出部24は、ユーザコンテンツDB23に記憶されているコンテンツのうち、一度特徴量を抽出したコンテンツについては、特徴量DB25に記憶させておくようにして、特徴量DB25から取り出すことにより、重み計算部26および類似度計算部27にコンテンツの特徴量を供給することができる。
ここで、本実施の形態では、コンテンツを楽曲としているので、コンテンツの特徴量の種類としては、例えば、テンポ、ムード、および音の多さを採用する。また、コンテンツの特徴量の値は、0乃至1の範囲の数値となっており、これにより、その特徴の度合いを表す。例えば、テンポ(の特徴量)については、その楽曲が遅いテンポの曲であるか、または速いテンポの曲であるかが0乃至1の範囲の数値で表されている。また、ムード(の特徴量)については、その楽曲が暗いムードの曲であるか、または明るいムードの曲であるかが0乃至1の範囲の数値で表されている。さらに、音の多さ(の特徴量)については、その楽曲がソロの演奏による曲であるか、または多数の楽器を用いた演奏による曲であるかが0乃至1の範囲の数値で表されている。
なお、コンテンツの特徴量の種類の数は、上述の3つに限定されず、2以下でも、4以上でもよい。その他の楽曲の特徴量の種類としては、例えば、メロディー、コード進行などを採用することができる。
また、特徴量抽出部24は、外部I/F部31を介して外部のサーバから供給されるコンテンツの特徴量を抽出し、特徴量DB25に記憶させることもできる。
さらに、特徴量抽出部24は、コンテンツ提示装置11がユーザに操作されていない時間(コンテンツ提示装置11が待機状態の時間)を利用して、ユーザコンテンツDB23に記憶されていて、まだ特徴量が抽出されていないコンテンツの特徴量を抽出し、特徴量DB25に記憶させておくようにしても良い。
特徴量DB25は、特徴量抽出部24から供給されるコンテンツの特徴量を記憶し、特徴量抽出部24に供給する。
重み計算部26には、指定コンテンツ情報とユーザ嗜好度が制御部22から供給される。また、重み計算部26には、ユーザコンテンツDB23に記憶されている全コンテンツの各特徴量(テンポ、ムード、および音の多さ)の値が特徴量抽出部24から供給される。
重み計算部26は、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対するユーザの重み(各特徴量の重み係数)を計算し、類似度計算部27に供給する。なお、コンテンツの各特徴量の重み係数の求め方については後述する。
類似度計算部27には、上述したように、ユーザコンテンツDB23に記憶されている全コンテンツの各特徴量(テンポ、ムード、および音の多さ)の値が特徴量抽出部24から供給される。また、類似度計算部27には、コンテンツの各特徴量に対するユーザの重み(各特徴量の重み係数)が重み計算部26から供給される。さらに、類似度計算部27には、制御部22から指定コンテンツ情報が供給される。
類似度計算部27は、重み計算部26から供給されるユーザの重みによって特徴量抽出部24から供給されるコンテンツの各特徴量の値を重み付けし、重み付けられたコンテンツの特徴量を用いて、指定コンテンツと検索対象コンテンツそれぞれとの類似度を、全ての指定コンテンツについて計算し、スコア計算部28に供給する。
ここで、指定コンテンツと検索対象コンテンツとの類似度を表す指標としては、例えば、テンポ、ムード、音の多さの特徴量それぞれを軸とする3次元空間における、指定コンテンツのベクトルと検索対象コンテンツのベクトルのユークリッド距離を採用することができる。
即ち、指定コンテンツと検索対象コンテンツとの距離D(類似度)は、
D=sqrt{(検索対象コンテンツ.テンポ−指定コンテンツ.テンポ)2
+(検索対象コンテンツ.ムード−指定コンテンツ.ムード)2
+(検索対象コンテンツ.音の多さ−指定コンテンツ.音の多さ)2}
・・・・・・・・・・・・(1)
+(検索対象コンテンツ.ムード−指定コンテンツ.ムード)2
+(検索対象コンテンツ.音の多さ−指定コンテンツ.音の多さ)2}
・・・・・・・・・・・・(1)
と表すことができる。そして、式(1)のコンテンツの各特徴量に対して、重み計算部26から供給される重み係数が乗算されるので、最終的な指定コンテンツと検索対象コンテンツとの類似度D’は、式(2)で表すことができる。
D’=sqrt{
((検索対象コンテンツ.テンポ−指定コンテンツ.テンポ)×テンポの重み係数)2
+((検索対象コンテンツ.ムード−指定コンテンツ.ムード)×ムードの重み係数)2
+((検索対象コンテンツ.音の多さ−指定コンテンツ.音の多さ)×音の多さの重み係数)2}
・・・・・・・・・・・・(2)
((検索対象コンテンツ.テンポ−指定コンテンツ.テンポ)×テンポの重み係数)2
+((検索対象コンテンツ.ムード−指定コンテンツ.ムード)×ムードの重み係数)2
+((検索対象コンテンツ.音の多さ−指定コンテンツ.音の多さ)×音の多さの重み係数)2}
・・・・・・・・・・・・(2)
なお、式(1)と式(2)において、検索対象コンテンツ.テンポは、検索対象コンテンツのテンポの特徴量(の値)を表し、検索対象コンテンツ.ムードは、検索対象コンテンツのムード(の値)を表し、検索対象コンテンツ.音の多さは、検索対象コンテンツの音の多さ(の値)を表す。指定コンテンツについても同様である。また、sqrtは、平方根(√)を表す。
また、指定コンテンツと検索対象コンテンツとの類似度を表す指標としては、上述のユークリッド距離に限定されず、例えば、指定コンテンツおよび検索対象コンテンツそれぞれのベクトルの内積などを採用することもできる。
ここで、指定コンテンツの総数をn個、検索対象コンテンツの総数をm個(n,mは、2以上の任意の整数)とした場合、1つの指定コンテンツに対して、m個の類似度D’が計算されるので、全部でn×m個の類似度D’がスコア計算部28に供給される。
スコア計算部28は、類似度計算部27から供給される、指定コンテンツと検索対象コンテンツとの類似度D’を用いて、指定コンテンツと検索対象コンテンツとのスコアsを計算し、合成部29に供給する。従って、スコア計算部28においても、類似度計算部27と同様のn×m個のスコアsが計算され、合成部29に供給される。
スコア計算部28では、指定コンテンツと検索対象コンテンツとの類似度D’が高いほどスコアsが大きくなるようにスコアsが計算される。従って、類似度D’として上述の式(2)を用いた場合、類似度D’は、その値が小さいほど類似度が高いことを表すことになるので、スコアsは、例えば、式(3)を採用することができる。
s=1÷(D’+α)
・・・・・・・・・・・・(3)
・・・・・・・・・・・・(3)
なお、式(3)において、αは、類似度D’がゼロの場合(指定コンテンツと検索対象コンテンツとが完全に一致する場合)でも分母がゼロとならないようにするための所定の定数を表す。
また、類似度D’を、その値が大きくなるほど類似度が高くなるような指標を用いた場合には、類似度D’の値をそのままスコアsとすることができる。この場合、スコア計算部28は省略することができる。
合成部29は、検索対象コンテンツごとに指定コンテンツと検索対象コンテンツとのスコアsを合成した各検索対象コンテンツの合成スコアSを計算する。即ち、合成部29は、検索対象コンテンツごとに指定コンテンツと検索対象コンテンツとのスコアsを加算することにより、各検索対象コンテンツの合成スコアSを計算する。従って、合成スコアSが大きいほど、ユーザに最適な(ユーザの嗜好に類似する)コンテンツであることを表す。合成部29では、各検索対象コンテンツについてn個のスコアsの加算が行われ、m個の合成スコアS(各検索対象コンテンツの合成スコアS)がソート部30に供給される。
ソート部30は、合成部29から供給されるm個の合成スコアS(各検索対象コンテンツの合成スコアS)を、その合成スコアSが大きい順にソートする。そして、ソート部30は、合成スコアSが大きい順に(ユーザの嗜好に合致する順に)ソートされた検索対象コンテンツのリストを制御部22に供給する。
外部I/F(Inter Face)部31は、例えば、ADSL(Asymmetric Digital Subscriber Line)モデムや、LAN (Local Area Network)カード等で構成され、インターネットなどの各種のネットワークとの間の通信インタフェースとして機能する。外部I/F部31は、制御部22の制御の下、図示せぬネットワークを介して、外部サーバからコンテンツをダウンロードし、ユーザコンテンツDB23または特徴量抽出部24に供給する。
コンテンツ再生部32は、制御部22の制御の下、ユーザコンテンツDB23から供給されるコンテンツを再生する。再生された楽曲は、図示せぬスピーカなどから出力される。
以上のように構成される図1のコンテンツ提示装置11では、入力部21において、コンテンツの指定と、その指定コンテンツに対する嗜好度の入力がユーザにより行われる。
特徴量抽出部24は、ユーザコンテンツDB23に記憶されている全てのコンテンツ(指定コンテンツおよび検索対象コンテンツ)についてコンテンツの特徴量(の値)を抽出し、重み計算部26および類似度計算部27に供給する。重み計算部26は、指定コンテンツに対するユーザの嗜好度と、その指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対するユーザの重み(各特徴量の重み係数)を計算し、類似度計算部27に供給する。類似度計算部27は、重み計算部26から供給されたコンテンツの各特徴量に対する重みを付加した、指定コンテンツと検索対象コンテンツとの類似度D’を計算する。
さらに、スコア計算部28において、指定コンテンツと検索対象コンテンツとの類似度D’がスコアsに変換され、合成部29において、検索対象コンテンツごとに、スコアsが加算される(合成スコアSが計算される)。そして、ソート部30から制御部22に合成スコアSが大きい順の検索対象コンテンツのリストが供給され、ユーザに提示される。
図2は、ユーザコンテンツDB23に記憶されている全ての検索対象コンテンツについて抽出された特徴量のデータ例を示している。
ユーザコンテンツDB23には、コンテンツA1乃至コンテンツAmのm個の検索対象コンテンツが記憶されており、特徴量抽出部24によって、図2に示すように、テンポ、ムード、および音の多さの各特徴量が抽出され、重み計算部26と類似度計算部27とに供給される。
具体的には、特徴量抽出部24によって抽出された各特徴量の値は、図2に示すように、コンテンツA1のテンポが0.4であり、コンテンツA1のムードが0.2であり、コンテンツA1の音の多さが0.8となっている。また、コンテンツA2のテンポが0.3であり、コンテンツA2のムードが0.5であり、コンテンツA2の音の多さが0.5となっている。さらに、コンテンツAmのテンポが0.4であり、コンテンツAmのムードが0.6であり、コンテンツAmの音の多さが0.1となっている。なお、コンテンツA3乃至コンテンツAm-1のデータについては図示が省略されている。
そして、ユーザコンテンツDB23に記憶されている全検索対象コンテンツA1乃至Amのなかから、ユーザは、入力部21において、図3に示すように、コンテンツA1,A6,A9,A14,・・・,A23の計20個のコンテンツ(指定コンテンツ)を指定するとともに、その指定コンテンツに対するユーザの嗜好度を入力したとする。ここで、指定コンテンツに対するユーザの嗜好度は、大好きを1とし、大嫌いを−1とする1乃至−1の範囲の値で入力されている。
具体的には、入力部21において、コンテンツA1のユーザ嗜好度は、大好きであることを表す+1、コンテンツA6の嗜好度は、大嫌いであることを表す−1、コンテンツA9の嗜好度は、+0.2、コンテンツA14の嗜好度は、−0.3,・・・・、コンテンツA23の嗜好度は、好きであることを表す+0.5が、それぞれ入力されている。なお、図3において、指定コンテンツの左側のNO.1乃至NO.20の表示は、指定コンテンツの入力個数を表している。従って、本実施の形態では、指定コンテンツの総数は、20個(n=20)であり、検索対象コンテンツの総数は、23個以上(m≧23)となっている。
図4は、図2に示した全検索対象コンテンツA1乃至Amのなかの、図3で入力された指定コンテンツについての特徴量のデータ例を示している。
具体的には、コンテンツA1のテンポが0.4であり、コンテンツA1のムードが0.2であり、コンテンツA1音の多さが0.8となっている。また、コンテンツA6のテンポが0.9であり、コンテンツA6のムードが0.4であり、コンテンツA6の音の多さが0.2となっている。さらに、コンテンツA23はテンポが0.2であり、コンテンツA23のムードが0.8であり、コンテンツA23の音の多さが0.1となっている。なお、指定コンテンツのその他のデータについては図示が省略されている。
次に、図5乃至図10を参照して、コンテンツ提示装置11の重み計算部26における、コンテンツの各特徴量に対するユーザの重み(各特徴量の重み係数)の算出方法について説明する。なお、図5乃至図10を参照して説明する処理は、特徴量(の種類)ごとに行われる。
重み計算部26は、コンテンツの特徴量の値とユーザ嗜好度との間に所定の相関関係(因果関係)がない特徴量については、重み係数が小さく、コンテンツの特徴量の値とユーザ嗜好度との間に所定の相関関係(因果関係)がある特徴量については、重み係数が大きくなるように重み係数を計算する。換言すれば、重み計算部26は、コンテンツの特徴量の値とユーザ嗜好度とが無関係と考えられる特徴量については、重み係数を小さくし、コンテンツの特徴量の値とユーザ嗜好度との間に明らかな因果関係が見られる特徴量については、重み係数を大きくする。
第1の値(第1の関数による値)と第2の値(第2の関数による値)との相関関係を求める方法としては、統計手法としての相関係数または順位相関係数がある。しかしながら、相関係数または順位相関係数は、ユーザの好みを反映させることを目的とするコンテンツの特徴量の重み係数としては適さない。そこで、重み計算部26は、以下のようにして、コンテンツの特徴量に対する重み係数を算出する。
初めに、重み計算部26は、図5に示すように、1つの特徴量の種類ごとに、特徴量の値をx軸、ユーザ嗜好度をy軸とするxy平面上に指定コンテンツの20個のデータをプロットする。
例えば、図5は、図4の指定コンテンツA1,A6,・・・,A23(以下、指定コンテンツA1乃至A23という)の、例えば、テンポに対する特徴量の値と、ユーザ嗜好度をプロットした例を示している。
図5中の星印それぞれは、指定コンテンツA1乃至A23を表している。なお、本実施の形態では、コンテンツの特徴量の値は、0乃至1の範囲の数値で表し、ユーザ嗜好度は、1乃至−1の範囲の値で表すこととしているので、x軸の取り得る値の範囲は、0乃至1となり、y軸の取り得る値の範囲は、1乃至−1となっている。
次に、図5に示すxy平面の、0乃至1の範囲を有するx軸を、2k個(kは正の整数)の区間に分割し、xの小さい方から、x’=1,2,3,・・,2kとする。ここで、x軸の0乃至1の範囲を所定数の区間に分割する区間数としては、例えば、24=16区間や27=128区間などとすることができる。なお、計算の便宜上、分割数を2のべき乗としているが、分割数は必ずしも2のべき乗でなくてもよい。
図6は、x軸の0乃至1の範囲を16区間に分割した例を示している。
重み計算部26は、図6に示す各区間x’=1,2,3,・・・,16のそれぞれにおけるユーザ嗜好度Y(x’)を計算する。各区間のユーザ嗜好度Y(x’)としては、例えば、区間内にプロットされている指定コンテンツのユーザ嗜好度の合計値が採用される。即ち、1区間内に指定コンテンツA1乃至A23が1つもプロットされていなければ0、1区間内に1つの指定コンテンツがプロットされていれば、そのプロットされている指定コンテンツのユーザ嗜好度、1区間内に複数の指定コンテンツがプロットされていれば、そのプロットされている複数の指定コンテンツのユーザ嗜好度の合計値がY(x’)となる。
図6に示す16区間の各区間x’について計算されたユーザ嗜好度Y(x’)を図示すると図7に示すようになる。
図7では、例えば、x’=1および2では、1区間に1つの星印(指定コンテンツの特徴量の値)がプロットされており、ユーザ嗜好度Y(x)は、その指定コンテンツの特徴量の値(星印)と重なっている。
また、例えば、x’=3では、1区間に2つの星印がプロットされており、正と負の特徴量の値が合計されて、ユーザ嗜好度Y(x)は0に近い値となっている。
さらに、例えば、x’=9では、1区間に1つの星印(指定コンテンツの特徴量の値)もプロットされていないので、ユーザ嗜好度Y(x)は0となっている。
ここで、各区間x’について計算されたユーザ嗜好度Y(x’)は、離散関数であると言える。以下において、各区間x’のユーザ嗜好度Y(x’)を離散関数Y(x’)という。
重み計算部26は、離散関数Y(x’)に対して低域通過フィルタ(Low Pass Filter)を用いたフィルタ処理を施す。
図8は、図7に示す離散関数Y(x’)に低域通過フィルタを施した後の離散関数Yf(x’)を示している。
入力部21においてユーザが指定したコンテンツ数(サンプリング数)が少ない場合、例えば、x’=1および2などのように1区間内で1つの指定コンテンツの嗜好度の値しかない場合など、離散関数Y(x’)は、その区間内でサンプリングされた1つのユーザ嗜好度の値に大きく依存するので、離散関数Y(x’)は極端な波形となることがある。
従って、離散関数Y(x’)に低域通過フィルタを施すことにより、特異なサンプリング値を除去し、図8に示すように、滑らかな曲線を得ることができる。
次に、重み計算部26は、全ての区間x’におけるフィルタ処理後の離散関数Yf(x’)の平均値YAVE(x’)を求める。いまの場合、区間数を16としているので、平均値YAVE(x’)は、YAVE(x’)=ΣYf(x’)÷16で求めることができる。なお、Σは、区間x’についてのサメーションを表す。
図9は、図8のフィルタ処理後の離散関数Yf(x’)について計算された平均値YAVE(x’)の例を示している。
即ち、図9では、図8のフィルタ処理後の離散関数Yf(x’)の全区間の平均値YAVE(x’)が、点線で示されている。
重み計算部26は、離散関数Yf(x’)と平均値YAVE(x’)とを用いて次式(4)により、コンテンツの特徴量に対する重み係数(ユーザの重み)Zを求める。
Z=Σabs(Yf(x’)−YAVE(x’))÷16
・・・・・・・・・・・・(4)
・・・・・・・・・・・・(4)
ここで、Σは、区間x’についてのサメーションを表し、absは、絶対値を表す。
即ち、式(4)で求められる重み係数Zは、図10で斜線を付して示される離散関数Yf(x’)と平均値YAVE(x’)とで囲まれる部分の面積(Σabs(Yf(x’)−YAVE(x’)))の全区間の平均値を表している。また、重み係数Zの値は、Σabs(Yf(x’)−YAVE(x’))で表される図10の斜線部分の面積をx’の区間数で除算されているので、区間数に拠らず一定の範囲内の数値となる。
また、重み計算部26は、式(4)に代えて、次式(5)を採用し、コンテンツの特徴量に対する重み係数(ユーザの重み)Zを求めるようにすることもできる。
Z=Σ(Yf(x’)−YAVE(x’))2÷16
・・・・・・・・・・・・(5)
式(5)において、Σは、区間x’についてのサメーションを表す。
・・・・・・・・・・・・(5)
式(5)において、Σは、区間x’についてのサメーションを表す。
以上のようにして、重み計算部26は、1つの特徴量(の種類)に対する重み係数を求める。そして、この処理を全ての特徴量(の種類)について行うことにより、全ての特徴量の重み係数を求めることができる。
図11乃至図13は、あるユーザ(同一ユーザ)について、テンポ、ムード、および音の多さの各特徴量に対する重み係数を求めた例を示している。
図11は、ユーザのテンポに対する指定コンテンツの特徴量の値とユーザ嗜好度の分布を示している。
ユーザは、図11に示すように、どのようなテンポ(特徴量)の値に対してもユーザ嗜好度が大きい(好きな)ものと小さい(嫌いな)ものが点在しており、偏りがない。従って、離散関数Yf(x’)は、x’軸にほぼ平行で、かつ平均値YAVE(x’)に近い値となっている。ここで、図11に示すユーザの指定コンテンツの嗜好度によって式(4)で求められる、ユーザのテンポに対する重み係数Zは、例えば、0.1である。
図12は、ユーザのムードに対する指定コンテンツの特徴量の値とユーザ嗜好度の分布を示している。
図12では、ムード(特徴量)の値が小さいコンテンツと大きいコンテンツは、平均値YAVE(x’)に対して離散関数Yf(x’)の値が大きく、ムードの値が中間的なコンテンツは、平均値YAVE(x’)に対して離散関数Yf(x’)の値が小さいという傾向が顕著に現れている。即ち、ユーザは、ムードが暗い楽曲と明るい楽曲は好きだが、ムードが暗いとも明るいともつかないような楽曲は嫌いであるという傾向が顕著に現れている。ここで、図12に示すユーザの指定コンテンツの嗜好度によって式(4)で求められる、ユーザのムードに対する重み係数Zは、例えば、0.3である。
図13は、ユーザの音の多さに対する指定コンテンツの特徴量の値とユーザ嗜好度の分布を示している。
図13では、音の多さ(特徴量)の値が小さいコンテンツは、平均値YAVE(x’)に対して離散関数Yf(x’)の値が大きく、音の多さ(特徴量)の値が大きいコンテンツは、平均値YAVE(x’)に対して離散関数Yf(x’)の値が小さいという傾向が顕著に現れている。即ち、ユーザは、音が少ない楽曲は好きだが、音が多い楽曲は嫌いであるという傾向が顕著に現れている。ここで、図13に示すユーザの指定コンテンツの嗜好度によって式(4)で求められる、ユーザの音の多さに対する重み係数Zは、例えば、0.3である。
従って、図11乃至図13によれば、テンポ(の特徴量)に対する重み係数Zとしては0.1が求められ、ムード(の特徴量)に対する重み係数Zとしては0.3が求められ、音の多さ(の特徴量)に対する重み係数Zとしては0.3が求められる。
即ち、ユーザは、どのようなテンポの楽曲を聴いても特に好きとも嫌いとも思わない。従って、テンポに対してユーザは鈍感である(テンポは、嗜好にほとんど影響しない)ので、0.1の重み係数が与えられる。反対に、ムードと音の多さについては、ユーザは、どのようなムードあるいは音の多さが好きか(または嫌いか)がはっきりしている。従って、ムードおよび音の多さに対してユーザは敏感である(ムードおよび音の多さは、嗜好に影響しやすい)ので、0.3の重み係数が与えられる。
このように、重み計算部26によれば、ユーザが敏感なムードや音の多さについては、特徴量の重み係数が大きく、ユーザが鈍感なテンポについては、特徴量の重み係数が小さくなるように、コンテンツの各特徴量に対するユーザの重みを計算することができる。
従って、重み計算部26によれば、ユーザは検索対象コンテンツのなかから、既に聴いたことがあるコンテンツをいくつか指定し、その指定コンテンツに対する好み(嗜好度)を入力するだけで、コンテンツの各特徴量に対する重み係数を自動的に計算することができる。これにより、ユーザは、自らコンテンツの特徴量ごとの重みを入力することなく、自分の各特徴量に対する嗜好をコンテンツの検索に反映させることができる。
以上のように、各特徴量に対する重み係数が計算され、類似度計算部27に供給されると、類似度計算部27は、指定コンテンツのそれぞれについて、上述した式(2)により、指定コンテンツと検索対象コンテンツとの類似度D’を計算する。
図14は、類似度計算部27による、図4の指定コンテンツと図2の検索対象コンテンツとの類似度D’の計算結果の例を示している。
図14に示す表の行(横の列)は、ユーザコンテンツDB23に記憶されている全ての検索対象コンテンツA1乃至Am(Aj,j=1乃至m)を表し、表の列(縦の列)は、入力部21で指定された指定コンテンツA1乃至A23(Ai,i=1,6,9,・・,23)を表している。そして、図14に示す表の、検索対象コンテンツの行と指定コンテンツの列の交差するセルに、その行の検索対象コンテンツとその列の指定コンテンツとの類似度D’i,jが示されている。
なお、指定コンテンツは、ユーザコンテンツDB23のなかから指定されているので、同一のコンテンツどうしの類似度D’i,jも計算されることになる。この場合、例えば、図14のセル51に示されているように、同一のコンテンツどうしの類似度D’1,1(指定コンテンツA1と検索対象コンテンツA1との類似度D’1,1)は、0となる。また、同一のコンテンツどうしの類似度D’i,jが0となることは、上述した式(2)からも明らかである。
図14のセル52に示されている、指定コンテンツA6と検索対象コンテンツA1との類似度D’6,1は、式(2)に基づいて、次のように計算される。
D’6,1=sqrt{((コンテンツA1.テンポ − コンテンツA6.テンポ)×テンポの重み係数}2
+((コンテンツA1. ムード − コンテンツA6. ムード)×ムードの重み係数)2
+((コンテンツA1. 音の多さ − コンテンツA6. 音の多さ)×音の多さの重み係数)2}
=sqrt{((0.4−0.9)×0.12+((0.2−0.4)×0.3)2+((0.8−0.2)×0.3)2}
=sqrt{0.0385}
≒0.20
+((コンテンツA1. ムード − コンテンツA6. ムード)×ムードの重み係数)2
+((コンテンツA1. 音の多さ − コンテンツA6. 音の多さ)×音の多さの重み係数)2}
=sqrt{((0.4−0.9)×0.12+((0.2−0.4)×0.3)2+((0.8−0.2)×0.3)2}
=sqrt{0.0385}
≒0.20
同様にして、指定コンテンツA9と検索対象コンテンツA1との類似度D’9,1、指定コンテンツA14と検索対象コンテンツA1との類似度D’14,1,・・・、および指定コンテンツA23と検索対象コンテンツA1との類似度D’23,1が、それぞれ、0.33,0.12,・・・,0.28と計算されている。
さらに、検索対象コンテンツA2乃至Amについても、同様に、各指定コンテンツとの類似度D’i,jが計算されている。
そして、図14に示す類似度D’i,jが類似度計算部27からスコア計算部28に供給されると、スコア計算部28は、その類似度D’i,jを基に、式(3)により、指定コンテンツAiと検索対象コンテンツAjとのスコアsi,jを計算する。
図15は、図14の指定コンテンツAiと検索対象コンテンツAjとの類似度D’i,jがスコア計算部28に供給されたときの、指定コンテンツAiと検索対象コンテンツAjとのスコアsi,jと、そのスコアsi,jに基づいて計算される各検索対象コンテンツの合成スコアSjの計算例を示している。なお、図15では、式(3)における所定の定数αは0.1として計算されている。
例えば、図15のセル61に示されている、指定コンテンツA1と検索対象コンテンツA1とのスコアs1,1は、式(3)を用いて次のように計算される。
指定コンテンツA1と検索対象コンテンツA1とのスコアs1,1=1÷(0.00+0.1)
=10.0
=10.0
また、例えば、図15のセル62に示されている、指定コンテンツA6と検索対象コンテンツA1とのスコアs6,1は、次のように計算される。
指定コンテンツA6と検索対象コンテンツA1とのスコアs6,1=1÷(0.20+0.1)
≒3.3
≒3.3
同様にして、図15に示すように、全ての指定コンテンツAiと検索対象コンテンツAjとのスコアsi,jが計算され、スコア計算部28から合成部29に供給される。
そして、合成部29は、検索対象コンテンツごとに、指定コンテンツAiと検索対象コンテンツAjとのスコアsi,jを加算することにより、検索対象コンテンツAjの合成スコアSjを計算する。
図15では、合成部29が計算した各検索対象コンテンツAjの合成スコアSjが表の一番右の列に示されている。
即ち、例えば、検索対象コンテンツA1(指定コンテンツでもある)の合成スコアS1は、次式に示すように、その行方向のスコアsi,jの加算によって表され、67.7となっている。
検索対象コンテンツA1の合成スコアS1
=10.0+3.3+2.3+4.5+・・・・・・+2.6
=67.7
=10.0+3.3+2.3+4.5+・・・・・・+2.6
=67.7
また、例えば、検索対象コンテンツA2の合成スコアS2は、次式に示すように、その行方向のスコアsi,jの加算によって表され、70.8となっている。
検索対象コンテンツA2の合成スコアS2
=4.3+4.8+5.6+7.1+・・・・・・+4.0
=70.8
=4.3+4.8+5.6+7.1+・・・・・・+4.0
=70.8
同様にして、ユーザコンテンツDB23に記憶されている全ての検索対象コンテンツ(コンテンツA1乃至Am)について、合成スコアS1乃至Smが、それぞれ求められている。
そして、ソート部30において、図15に示す合成スコアS1乃至Smが、その値の大きい順にソートされて、制御部22に供給される。制御部22は、合成スコアS1乃至Smが大きい順にソートされた検索対象コンテンツのリストをユーザに提示したり、合成スコアの一番大きい検索対象コンテンツをユーザコンテンツDB23からコンテンツ再生部32に供給し、再生させる。
次に、図6のフローチャートを参照して、コンテンツ提示装置11のコンテンツ提示処理について説明する。
初めに、ステップS1において、入力部21は、指定コンテンツ情報とユーザ嗜好度が入力されたか否か、即ち、コンテンツが指定され、その指定されたコンテンツ(指定コンテンツ)に対するユーザの嗜好度が入力されたか否かを判定する。ステップS1で、指定コンテンツとユーザ嗜好度が入力されたと判定されるまで、ステップS1の処理が繰り返される。
ステップS1で、指定コンテンツとユーザ嗜好度が入力されたと判定された場合、ステップS2に進み、制御部22は、ユーザコンテンツDB23に記憶されている全てのコンテンツ(指定コンテンツを含む全ての検索対象コンテンツ)についてコンテンツの特徴量を抽出し、抽出されたコンテンツの特徴量の値を重み計算部26および類似度計算部27に供給して、ステップS3に進む。
ステップS3において、重み計算部26は、指定コンテンツのユーザの嗜好度と、その指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対するユーザの重み(各特徴量の重み係数)を計算し、類似度計算部27に供給して、ステップS4に進む。
ステップS4において、類似度計算部27およびスコア計算部28は、スコア計算処理を行い、ステップS5に進む。ステップS4のスコア計算処理では、図14と図15を参照して説明したように、指定コンテンツAiと検索対象コンテンツAjとの類似度D’i,jおよびスコアsi,jが求められる。なお、スコア計算処理の詳細については、図17を参照して後述する。
ステップS5において、合成部29は、検索対象コンテンツごとに、指定コンテンツAiと検索対象コンテンツAjとのスコアsi,jを加算することにより、検索対象コンテンツごとの合成スコア(検索対象コンテンツAjの合成スコアSj)を計算し、ソート部30に供給して、ステップS6に進む。
ステップS6において、ソート部30は、ステップS5で計算された合成スコアSjが大きい順となるように検索対象コンテンツAjをソートし、その結果得られる検索対象コンテンツのリストを制御部22に供給する。また、ステップS6では、制御部22は、合成スコアSjが大きい順にソートされた検索対象コンテンツのリストをユーザに提示したり、合成スコアSjの一番大きい検索対象コンテンツをユーザコンテンツDB23からコンテンツ再生部32に供給し、再生させて、処理を終了する。
次に、図17のフローチャートを参照して、図16のステップS4におけるスコア計算処理について説明する。
初めに、ステップS21において、類似度計算部27は、最初の指定コンテンツAiと検索対象コンテンツAjとを選択して、ステップS22に進む。
ステップS22において、類似度計算部27は、式(2)を用いて、指定コンテンツAiと検索対象コンテンツAjとの類似度D’i,jを計算し、その計算結果をスコア計算部28に供給して、ステップS23に進む。
ステップS23において、類似度計算部27は、いま選択されている指定コンテンツAiについて、全ての検索対象コンテンツAjとの類似度D’i,jを計算したか否かを判定する。ステップS23で、指定コンテンツAiについて、全ての検索対象コンテンツAjとの類似度D’i,jが計算されていないと判定された場合、ステップS24に進み、類似度計算部27は、次の検索対象コンテンツAjを選択して、ステップS22に戻る。
一方、ステップS23で、指定コンテンツAiについて、全ての検索対象コンテンツAjとの類似度D’i,jが計算されたと判定された場合、ステップS25に進む。
ステップS25において、類似度計算部27は、全ての指定コンテンツについて類似度D’i,jを計算したか否かを判定する。
ステップS25で、全ての指定コンテンツについて類似度D’i,jが計算されていないと判定された場合、ステップS26に進み、類似度計算部27は、次の指定コンテンツAiを選択して、ステップS22に戻る。
一方、ステップS25で、全ての指定コンテンツについて類似度D’i,jが計算されたと判定された場合、ステップS27に進む。
ステップS27において、スコア計算部28は、最初の指定コンテンツAiと検索対象コンテンツAjとを選択して、ステップS28に進む。
ステップS28において、スコア計算部28は、類似度計算部27から供給された指定コンテンツAiと検索対象コンテンツAjとの類似度D’i,jから、指定コンテンツAiと検索対象コンテンツAjとのスコアsi,jを計算し、合成部29に供給して、ステップS29に進む。
ステップS29において、スコア計算部28は、いま選択されている指定コンテンツAiについて、全ての検索対象コンテンツAjとのスコアsi,jを計算したか否かを判定する。ステップS29で、指定コンテンツAiについて、全ての検索対象コンテンツAjとのスコアsi,jが計算されていないと判定された場合、ステップS30に進み、スコア計算部28は、次の検索対象コンテンツAjを選択して、ステップS28に戻る。
一方、ステップS29で、指定コンテンツAiについて、全ての検索対象コンテンツAjとのスコアsi,jが計算されたと判定された場合、ステップS31に進む。
ステップS31において、スコア計算部28は、全ての指定コンテンツについてスコアsi,jを計算したか否かを判定する。
ステップS31で、全ての指定コンテンツについてスコアsi,jが計算されていないと判定された場合、ステップS32に進み、スコア計算部28は、次の指定コンテンツAiを選択して、ステップS28に戻る。
一方、ステップS31で、全ての指定コンテンツについてスコアsi,jが計算されたと判定された場合、処理を戻る。
以上のように、図16のコンテンツ提示処理によれば、入力部21で入力(指定)される指定コンテンツとユーザ嗜好度に従って、検索対象コンテンツのなかから、ユーザの嗜好に最も合致する(スコアの大きい)コンテンツを検索し、ユーザに提示することができる。即ち、ユーザに最適なコンテンツを提示することができる。
また、コンテンツ提示処理では、入力部21で入力される指定コンテンツとユーザ嗜好度とから、コンテンツの特徴量ごとの重み係数を算出し、各特徴量に対する重み係数を考慮した、指定コンテンツAiと検索対象コンテンツAjとの類似度D’ i,jを計算し、その類似度D’ i,jを基に、検索対象コンテンツAjの合成スコアSjを計算する。これにより、ユーザは、コンテンツの特徴量ごとの重み係数を特に入力しなくても、コンテンツの各特徴量に対するユーザの感じ方(各特徴量に対するユーザの感じ方の個人差)を考慮したコンテンツの検索を行うことが可能となる。
なお、上述した実施の形態では、検索対象コンテンツは、ユーザが既に保有しているコンテンツであり、コンテンツ提示処理によって、ユーザコンテンツDB23に記憶されているコンテンツを自分の嗜好に合うようにパーソナライズしているとも言うことができる。
なお、コンテンツ提示処理は、ユーザがまだ保有していないコンテンツ、例えば、外部I/F部31と接続されている外部のサーバ内のコンテンツから、ユーザの嗜好に合致するコンテンツを検索し、ユーザに推薦する場合にも適用することができる。この場合においても、コンテンツの各特徴量に対するユーザの感じ方を考慮したコンテンツの推薦(検索)を行うことができる。
さらに、上述した実施の形態では、類似度およびスコアの計算を、コンテンツごとに行うようにしたが、さらに細かく、テンポやムードなどのコンテンツの特徴量ごとに行うようにしても良い。
また、上述した実施の形態では、重み計算部26において、各特徴量に対するユーザの重みを計算する場合の指定コンテンツと、類似度計算部27において、ユーザの各特徴量の重みを用いて、指定コンテンツと検索対象コンテンツとの類似度D’i,jを計算する場合の指定コンテンツを、同一の指定コンテンツA1乃至A23として説明したが、ユーザの各特徴量の重みを計算する場合の指定コンテンツと、類似度D’i,jを計算する場合の指定コンテンツは、異なるコンテンツでもよい。
さらに、図14で説明した例では、類似度計算部27が、全ての検索対象コンテンツAjについて類似度D’i,jを計算したが、検索対象コンテンツAjのうちの一部の検索対象コンテンツのみについて類似度D’i,jを計算し、その類似度D’i,jが計算された検索対象コンテンツだけで合成スコアSを計算することもできる。即ち、類似度計算部27は、重み計算部26により計算されたユーザの各特徴量の重みを用いて、任意の検索対象コンテンツ間の類似度を計算するようにすることができる。
上述したコンテンツ提示処理などの一連の処理は、専用のハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。コンテンツ提示処理をソフトウエアによって行う場合、そのコンテンツ提示処理は、例えば、図18に示されるような(パーソナル)コンピュータにプログラムを実行させることにより実現することができる。
図18において、CPU(Central Processing Unit)301は、ROM(Read Only Memory)302に記憶されているプログラム、または記憶部308からRAM(Random Access Memory)303にロードされたプログラムに従って各種の処理を実行する。RAM303にはまた、CPU301が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU301は、例えば、図1のコンテンツ提示装置11の制御部22、特徴量抽出部24、重み計算部26、類似度計算部27、スコア計算部28、合成部29、およびソート部30の処理を行う。
CPU301、ROM302、およびRAM303は、バス304を介して相互に接続されている。このバス304にはまた、入出力インタフェース305も接続されている。
入出力インタフェース305には、キーボード、マウスなどよりなる入力部306、CRT(Cathode Ray Tube)、LCD(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部307、ハードディスクなどより構成される記憶部308、モデム、ターミナルアダプタなどより構成される通信部309が接続されている。通信部309は、インターネットなどのネットワークを介しての通信処理を行う。
入力部306は、例えば、コンテンツ提示装置11の入力部21として、記憶部208は、例えば、コンテンツ提示装置11のユーザコンテンツDB23および特徴量DB25として機能する。また、通信部309は、例えば、コンテンツ提示装置11の外部I/F部31として機能する。
入出力インタフェース305にはまた、必要に応じてドライブ310が接続され、磁気ディスク321、光ディスク322、光磁気ディスク323、或いは半導体メモリ324などが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部308にインストールされる。
なお、本明細書において、フローチャートに記述されたステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
11 コンテンツ提示装置, 21 入力部, 22 制御部, 23 ユーザコンテンツDB, 24 特徴量抽出部, 25 特徴量DB, 26 重み計算部, 27 類似度計算部, 28 スコア計算部, 29 合成部, 30 ソート部
Claims (8)
- 複数種類の特徴量によってコンテンツの特徴が表されている、検索または推薦の対象となる複数の対象コンテンツに対する処理を行う情報処理装置において、
前記対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の前記指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対する前記ユーザの重みを計算する重み計算手段と、
前記重み計算手段により計算された前記ユーザの前記各特徴量の重みを用いて、任意の前記対象コンテンツ間の類似度を計算する類似度計算手段と
を備えることを特徴とする情報処理装置。 - 前記類似度計算手段により計算された、任意の前記対象コンテンツ間の前記類似度を用いて、各対象コンテンツの合成スコアを計算する合成スコア計算手段と、
前記合成スコアが大きい対象コンテンツを、前記ユーザの嗜好に合致するコンテンツとして提示する提示手段と
をさらに備えることを特徴とする請求項1に記載の情報処理装置。 - 前記指定コンテンツを表す指定コンテンツ情報と、前記指定コンテンツに対する前記ユーザの嗜好度を入力する入力手段をさらに備え、
前記重み計算手段は、前記入力手段により入力された前記指定コンテンツ情報が表す前記指定コンテンツと前記ユーザの嗜好度とを用いて、所定数の前記指定コンテンツに対する前記ユーザの嗜好度と、所定数の前記指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対する前記ユーザの重みを計算する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記重み計算手段は、ユーザが敏感な種類の特徴量に対しては、前記ユーザの重みが大きく、ユーザが鈍感な種類の特徴量に対しては、前記ユーザの重みが小さくなるように、コンテンツの各特徴量に対する前記ユーザの重みを計算する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記指定コンテンツの特徴量を抽出する抽出手段をさらに備える
ことを特徴とする請求項1に記載の情報処理装置。 - 複数種類の特徴量によってコンテンツの特徴が表されている、検索または推薦の対象となる複数の対象コンテンツに対する処理を行う情報処理方法において、
前記対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の前記指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対する前記ユーザの重みを計算する重み計算ステップと、
前記重み計算ステップの処理により計算された前記ユーザの前記各特徴量の重みを用いて、任意の前記対象コンテンツ間の類似度を計算する類似度計算ステップと
を含むことを特徴とする情報処理方法。 - 複数種類の特徴量によってコンテンツの特徴が表されている、検索または推薦の対象となる複数の対象コンテンツに対する処理を行うプログラムであって、
前記対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の前記指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対する前記ユーザの重みを計算する重み計算ステップと、
前記重み計算ステップの処理により計算された前記ユーザの前記各特徴量の重みを用いて、任意の前記対象コンテンツ間の類似度を計算する類似度計算ステップと
を含むことを特徴とするコンピュータが読み取り可能なプログラムが記録されている記録媒体。 - 複数種類の特徴量によってコンテンツの特徴が表されている、検索または推薦の対象となる複数の対象コンテンツに対する処理を行うプログラムにおいて、
前記対象コンテンツのなかから指定された、所定数の指定コンテンツに対するユーザの嗜好度と、所定数の前記指定コンテンツの各特徴量の値とから、コンテンツの各特徴量に対する前記ユーザの重みを計算する重み計算ステップと、
前記重み計算ステップの処理により計算された前記ユーザの前記各特徴量の重みを用いて、任意の前記対象コンテンツ間の類似度を計算する類似度計算ステップと
を含む処理をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004227540A JP2006048320A (ja) | 2004-08-04 | 2004-08-04 | 情報処理装置および方法、記録媒体、並びにプログラム |
US11/193,485 US20060036597A1 (en) | 2004-08-04 | 2005-08-01 | Information processing apparatus and method, recording medium, and program |
CN2005101160028A CN1750004B (zh) | 2004-08-04 | 2005-08-04 | 信息处理装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004227540A JP2006048320A (ja) | 2004-08-04 | 2004-08-04 | 情報処理装置および方法、記録媒体、並びにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006048320A true JP2006048320A (ja) | 2006-02-16 |
Family
ID=35801197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004227540A Abandoned JP2006048320A (ja) | 2004-08-04 | 2004-08-04 | 情報処理装置および方法、記録媒体、並びにプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20060036597A1 (ja) |
JP (1) | JP2006048320A (ja) |
CN (1) | CN1750004B (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011123530A (ja) * | 2009-12-08 | 2011-06-23 | Nec Corp | 話題推薦装置、話題推薦装方法およびプログラム |
WO2013179558A1 (ja) * | 2012-05-29 | 2013-12-05 | パナソニック株式会社 | 画像評価装置、画像評価方法、プログラム、集積回路 |
CN105718524A (zh) * | 2016-01-15 | 2016-06-29 | 合一网络技术(北京)有限公司 | 确定视频正本的方法和装置 |
JP2017503275A (ja) * | 2014-01-03 | 2017-01-26 | フェイスブック,インク. | 類似度距離に基づいたオブジェクトの推奨 |
WO2019012684A1 (ja) * | 2017-07-14 | 2019-01-17 | 三菱電機株式会社 | 再生リスト作成装置および再生リスト作成方法 |
US10691762B2 (en) | 2015-10-05 | 2020-06-23 | Fujitsu Limited | Method of outputting recommended item and recommended item output device |
JP2021108167A (ja) * | 2020-05-21 | 2021-07-29 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science Technology Co., Ltd. | コンテンツ推薦方法、装置及び機器 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080071741A1 (en) * | 2006-09-19 | 2008-03-20 | Kazunari Omi | Method and an apparatus to perform feature weighted search and recommendation |
US20080071764A1 (en) * | 2006-09-19 | 2008-03-20 | Kazunari Omi | Method and an apparatus to perform feature similarity mapping |
JP4678546B2 (ja) * | 2008-09-08 | 2011-04-27 | ソニー株式会社 | 推薦装置および方法、プログラム、並びに記録媒体 |
JP4650541B2 (ja) * | 2008-09-08 | 2011-03-16 | ソニー株式会社 | 推薦装置および方法、プログラム、並びに記録媒体 |
CN102362275A (zh) * | 2009-03-23 | 2012-02-22 | 富士通株式会社 | 内容推荐方法、推荐信息生成方法、内容推荐程序、内容推荐服务器以及内容提供系统 |
EP2565835A4 (en) * | 2010-04-28 | 2013-10-16 | Jvc Kenwood Corp | ARTICLES SELECTION DEVICE, ARTICLES SELECTION METHOD, AND ARTICLES SELECTION UTILIZATION PROGRAM |
CN103136289B (zh) * | 2011-12-05 | 2016-09-28 | 腾讯科技(深圳)有限公司 | 资源推荐方法及系统 |
CN103377250B (zh) * | 2012-04-27 | 2017-08-04 | 杭州载言网络技术有限公司 | 基于邻域的top‑k推荐方法 |
JP6065907B2 (ja) * | 2012-05-11 | 2017-01-25 | ソニー株式会社 | 情報処理装置、情報処理方法、および、プログラム |
WO2016002985A1 (en) * | 2014-07-01 | 2016-01-07 | Lg Electronics Inc. | Electronic device and method for controlling the same |
CN110969460B (zh) * | 2018-09-29 | 2023-10-31 | 北京国双科技有限公司 | 一种针对信息流广告的投放效果预测方法和装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5911008A (en) * | 1996-04-30 | 1999-06-08 | Nippon Telegraph And Telephone Corporation | Scheme for detecting shot boundaries in compressed video data using inter-frame/inter-field prediction coding and intra-frame/intra-field coding |
ATE480826T1 (de) * | 1999-01-29 | 2010-09-15 | Lg Electronics Inc | Verfajren zum suchen und browsen von multimediadaten und datenstruktur |
KR100788643B1 (ko) * | 2001-01-09 | 2007-12-26 | 삼성전자주식회사 | 색과 질감의 조합을 기반으로 하는 영상 검색 방법 |
CN1864171A (zh) * | 2003-08-08 | 2006-11-15 | 皇家飞利浦电子股份有限公司 | 处理数据的系统及其方法 |
JP4423262B2 (ja) * | 2003-09-11 | 2010-03-03 | パナソニック株式会社 | コンテンツ選択方法およびコンテンツ選択装置 |
JP4428036B2 (ja) * | 2003-12-02 | 2010-03-10 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法 |
-
2004
- 2004-08-04 JP JP2004227540A patent/JP2006048320A/ja not_active Abandoned
-
2005
- 2005-08-01 US US11/193,485 patent/US20060036597A1/en not_active Abandoned
- 2005-08-04 CN CN2005101160028A patent/CN1750004B/zh not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011123530A (ja) * | 2009-12-08 | 2011-06-23 | Nec Corp | 話題推薦装置、話題推薦装方法およびプログラム |
WO2013179558A1 (ja) * | 2012-05-29 | 2013-12-05 | パナソニック株式会社 | 画像評価装置、画像評価方法、プログラム、集積回路 |
US9177201B2 (en) | 2012-05-29 | 2015-11-03 | Panasonic Intellectual Property Management Co., Ltd. | Image evaluation device, image evaluation method, program, and integrated circuit |
JPWO2013179558A1 (ja) * | 2012-05-29 | 2016-01-18 | パナソニックIpマネジメント株式会社 | 画像評価装置、画像評価方法、プログラム、集積回路 |
JP2017503275A (ja) * | 2014-01-03 | 2017-01-26 | フェイスブック,インク. | 類似度距離に基づいたオブジェクトの推奨 |
US10691762B2 (en) | 2015-10-05 | 2020-06-23 | Fujitsu Limited | Method of outputting recommended item and recommended item output device |
CN105718524A (zh) * | 2016-01-15 | 2016-06-29 | 合一网络技术(北京)有限公司 | 确定视频正本的方法和装置 |
WO2019012684A1 (ja) * | 2017-07-14 | 2019-01-17 | 三菱電機株式会社 | 再生リスト作成装置および再生リスト作成方法 |
JP2021108167A (ja) * | 2020-05-21 | 2021-07-29 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science Technology Co., Ltd. | コンテンツ推薦方法、装置及び機器 |
JP7269275B2 (ja) | 2020-05-21 | 2023-05-08 | 阿波▲羅▼智▲聯▼(北京)科技有限公司 | コンテンツ推薦方法、装置及び機器 |
Also Published As
Publication number | Publication date |
---|---|
US20060036597A1 (en) | 2006-02-16 |
CN1750004A (zh) | 2006-03-22 |
CN1750004B (zh) | 2010-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11620326B2 (en) | User-specific media playlists | |
US20060036597A1 (en) | Information processing apparatus and method, recording medium, and program | |
US8601003B2 (en) | System and method for playlist generation based on similarity data | |
US8620919B2 (en) | Media item clustering based on similarity data | |
JP4179341B2 (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
US20060217828A1 (en) | Music searching system and method | |
US20080141133A1 (en) | Display Control Processing Apparatus, Display Control Processing Method and Display Control Processing Program | |
JP2006190127A (ja) | 情報処理装置および方法、並びにプログラム | |
JP2008165759A (ja) | 情報処理装置及び方法並びにプログラム | |
EP2161668A1 (en) | System and method for playlist generation based on similarity data | |
US8015186B2 (en) | Information processing apparatus and method, recording medium, and program | |
US9305119B1 (en) | System, apparatus and method for determining correct metadata from community-submitted data | |
JP2003316818A (ja) | 情報検索方法及びその装置、コンピュータプログラム | |
JP2008513877A (ja) | 追従情報を提供する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070703 |
|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20080424 |