JP2008234043A - 情報処理装置及び情報処理方法、並びにプログラム - Google Patents

情報処理装置及び情報処理方法、並びにプログラム Download PDF

Info

Publication number
JP2008234043A
JP2008234043A JP2007069298A JP2007069298A JP2008234043A JP 2008234043 A JP2008234043 A JP 2008234043A JP 2007069298 A JP2007069298 A JP 2007069298A JP 2007069298 A JP2007069298 A JP 2007069298A JP 2008234043 A JP2008234043 A JP 2008234043A
Authority
JP
Japan
Prior art keywords
concept
target user
recommended
user
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007069298A
Other languages
English (en)
Other versions
JP5114984B2 (ja
Inventor
Naoki Kamimaeda
直樹 上前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007069298A priority Critical patent/JP5114984B2/ja
Publication of JP2008234043A publication Critical patent/JP2008234043A/ja
Application granted granted Critical
Publication of JP5114984B2 publication Critical patent/JP5114984B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】相性のよいユーザが利用したコンテンツを推薦する。
【解決手段】ステップS1において、推薦対象ユーザの好きな概念が抽出され、ステップS2において、推薦対象ユーザのタイプが決定され、ステップS3において、推薦対象ユーザのタイプの概念が検出され、ステップS4において、検出された概念と所定の関係を有する概念(対応概念)が検出され、ステップS5において、非推薦対象ユーザ全体のタイプが決定され、ステップS6において、非推薦対象ユーザ全体のタイプのユーザが、非推薦対象ユーザとして検出され、ステップS7において、非推薦対象ユーザの操作履歴や嗜好情報と、推薦対象ユーザの操作履歴や嗜好情報に基づいて、協調フィルタリングが行われ、その結果に基づいて推薦対象ユーザに推薦するユーザが決定される。本発明は、例えば、番組推薦装置に適用できる。
【選択図】図11

Description

本発明は、情報処理装置及び情報処理方法、並びにプログラムに関し、特に、変化に富んだコンテンツ推薦を行うことができるようにした情報処理装置及び情報処理方法、並びにプログラムに関する。
膨大なコンテンツの中からユーザに推薦するコンテンツを決定する方法として、協調フィルタリングを用いる方法が知られている(特許文献1)。
この方法では、通常、コンテンツを推薦する対象であるユーザ(以下、推薦対象ユーザと称する)の操作履歴などから生成される推薦対象ユーザの嗜好を示す嗜好情報と類似する嗜好情報を有する他のユーザ(以下、類似ユーザと称する)が特定され、推薦対象ユーザの嗜好情報と類似ユーザの嗜好情報に基づいて、協調フィルタリングが行われる。そしてその結果として、類似ユーザが利用したコンテンツであって推薦対象ユーザがまだ利用していないコンテンツが、推薦対象ユーザに推薦される。
特開2003−167901号公報
ところで、実社会の人間関係においては、嗜好傾向は異なるが、いわゆる相性が良い人が存在し、そのような相性の良い人が利用したコンテンツに興味を持つ場合もある。このように嗜好が類似する者以外にも他の観点から見た所定の関係を有する者が利用したコンテンツに興味を持つ可能性がある。
しかしながら従来の方法では、基本的に、嗜好が類似する類似ユーザが利用したコンテンツのみが推薦されるので、例えばいわゆる相性がよい人が利用したコンテンツを推薦することができず、変化に富んだコンテンツ推薦を行うことができない。
本発明は、このような状況に鑑みてなされたものであり、嗜好が類似する類似ユーザが利用したコンテンツだけでなく、例えば相性の良い人が利用したコンテンツを推薦することができるようにするものである。
本発明の一側面の情報処理装置は、他のユーザが利用したコンテンツに基づいて、コンテンツを特定の推薦対象ユーザに推薦する情報処理装置において、前記推薦対象ユーザが好むコンテンツの内容上の所定の概念を抽出する第1の抽出手段と、前記第1の抽出手段により抽出された前記概念と所定の関係がある所定の概念を抽出する第2の抽出手段と、前記第2の抽出手段により抽出された前記概念を好む非推薦対象ユーザを検出する非推薦対象ユーザ検出手段と、前記非推薦対象ユーザ検出手段により検出された前記非推薦対象ユーザが利用したコンテンツに基づいて、前記推薦対象ユーザに推薦するコンテンツを決定する決定手段とを備える。
前記第2の抽出手段は、前記第1の抽出手段により抽出された前記概念から前記特定のユーザの特徴を検出する第1の検出手段と、前記第1の検出手段により検出された前記特徴を有する概念を検出する第2の検出手段と、前記第2の検出手段により検出された前記概念と前記所定の関係がある概念を検出する第3の検出手段とを備え、前記非推薦対象ユーザ検出手段は、前記第2の抽出手段の前記第3の検出手段により検出された前記概念から非推薦対象ユーザの特徴を検出する第4の検出手段と、前記第4の検出手段により検出された前記特徴を有するユーザを、非推薦対象ユーザとして検出する第5の検出手段とを備えることができる。
前記決定手段は、前記特定のユーザと前記非推薦対象ユーザ間の協調フィルタリングを行い、その結果に基づいて前記特定のユーザに推薦するコンテンツを決定することができる。
本発明の一側面の情報処理方法またはプログラムは、他のユーザが利用したコンテンツに基づいて、コンテンツを特定の推薦対象ユーザに推薦する情報処理装置の情報処理方法において、または他のユーザが利用したコンテンツに基づいて、コンテンツを特定の推薦対象ユーザに推薦する情報処理をコンピュータに実行させるプログラムにおいて、前記推薦対象ユーザが好むコンテンツの内容上の所定の概念を抽出する第1の抽出ステップと、前記第1の抽出ステップの処理で抽出された前記概念と所定の関係がある所定の概念を抽出する第2の抽出ステップと、前記第2の抽出ステップの処理で抽出された前記概念を好む非推薦対象ユーザを検出する非推薦対象ユーザ検出ステップと、前記非推薦対象ユーザ検出ステップの処理で検出された前記非推薦対象ユーザが利用したコンテンツに基づいて、前記推薦対象ユーザに推薦するコンテンツを決定する決定ステップとを含む。
本発明の一側面において、前記推薦対象ユーザが好むコンテンツの内容上の所定の概念が抽出され、抽出された前記概念と所定の関係がある所定の概念が抽出され、抽出された前記概念を好む非推薦対象ユーザが検出され、検出された前記非推薦対象ユーザが利用したコンテンツに基づいて、前記推薦対象ユーザに推薦するコンテンツが決定される。
本発明の一側面によれば、変化に富んだコンテンツ推薦を行うことができる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
本発明の一側面の情報処理装置は、
他のユーザが利用したコンテンツに基づいて、コンテンツを特定の推薦対象ユーザに推薦する情報処理装置において、
前記推薦対象ユーザが好むコンテンツの内容上の所定の概念を抽出する第1の抽出手段(例えば、図1の概念抽出エンジン11)と、
前記第1の抽出手段により抽出された前記概念と所定の関係がある所定の概念を抽出する第2の抽出手段(例えば、図1の対応概念抽出エンジン20)と、
前記第2の抽出手段により抽出された前記概念を好む非推薦対象ユーザを検出する非推薦対象ユーザ検出手段(例えば、図1の非推薦対象ユーザ検出エンジン23)と、
前記非推薦対象ユーザ検出手段により検出された前記非推薦対象ユーザが利用したコンテンツに基づいて、前記推薦対象ユーザに推薦するコンテンツを決定する決定手段(例えば、図11の協調フィルタリングエンジン24)と
を備える。
前記第2の抽出手段は、
前記第1の抽出手段により抽出された前記概念から前記特定のユーザの特徴を検出する第1の検出手段(例えば、図1のタイプ検出エンジン16)と、
前記第1の検出手段により検出された前記特徴を有する概念を検出する第2の検出手段(例えば、図1の類似概念検出エンジン19)と、
前記第2の検出手段により検出された前記概念と前記所定の関係がある概念を検出する第3の検出手段(例えば、図1の対応関係検出エンジン20)と
を備え、
前記非推薦対象ユーザ検出手段は、
前記第2の抽出手段の前記第3の検出手段により検出された前記概念から非推薦対象ユーザの特徴を検出する第4の検出手段(例えば、図1のタイプ検出エンジン22)と、
前記第4の検出手段により検出された前記特徴を有するユーザを、非推薦対象ユーザとして検出する第5の検出手段(例えば、図1の非推薦対象ユーザ検出エンジン23))と
を備えることができる。
本発明の一側面の情報処理方法またはプログラムは、
他のユーザが利用したコンテンツに基づいて、コンテンツを特定の推薦対象ユーザに推薦する情報処理装置の情報処理方法において、または他のユーザが利用したコンテンツに基づいて、コンテンツを特定の推薦対象ユーザに推薦する情報処理をコンピュータに実行させるプログラムにおいて、
前記推薦対象ユーザが好むコンテンツの内容上の所定の概念を抽出する第1の抽出ステップ(例えば、図11のステップS1)と、
前記第1の抽出ステップの処理で抽出された前記概念と所定の関係がある所定の概念を抽出する第2の抽出ステップ(例えば、図11のステップS4)と、
前記第2の抽出ステップの処理で抽出された前記概念を好む非推薦対象ユーザを検出する非推薦対象ユーザ検出ステップ(例えば、図11のステップS6)と、
前記非推薦対象ユーザ検出ステップの処理で検出された前記非推薦対象ユーザが利用したコンテンツに基づいて、前記推薦対象ユーザに推薦するコンテンツを決定する決定ステップ(例えば、図11のステップS7)と
を含む。
図1は、本発明を適用したコンテンツ推薦装置の構成例を示している。なおここでは、テレビジョン放送番組(以下、番組と略称する)を推薦する場合について説明するが、インターネットで配信される画像、楽曲や書籍など、その他のコンテンツを推薦する場合についても適用することができる。
嗜好抽出エンジン11は、例えば操作履歴データベース(DB)12に蓄積されている、番組推薦の対象であるユーザ(すなわち、推薦対象ユーザ)の操作履歴情報を参照して、そのユーザに操作された番組(例えば、視聴や録画等のための操作がなされ、視聴や録画等がなされた番組)を検出するとともに、その番組に対する操作履歴情報と、メタ情報DB13に蓄積されているその番組のメタ情報に基づいて、推薦対象ユーザの嗜好を抽出する。
嗜好抽出エンジン11は、抽出した推薦対象ユーザの嗜好を、ユーザ嗜好情報DB14、概念抽出エンジン15、及び協調フィルタリングエンジン24にそれぞれ供給する。
操作履歴DB12に蓄積されているユーザの操作履歴情報は、例えば図2に示すように、MemberID、ProgramID、LogType、LogValue、及びLogTimeを含んで構成されている。
MemberIDは、このコンテンツ推薦装置によるコンテンツの推薦を受けることができるユーザのID(以下、UserIDと称する)と同一のものである。ProgramIDは、ユーザの操作対象となった番組を示すIDである。
LogTypeは、番組になされた操作の種類を表し、図2の例では、VOTE、DETAIL、RESERVATIONがある。
ここでVOTEは、番組に対する投票操作が行われたことを示し、DETAILは、番組の詳細を見るための操作が行われたことを示し、RESERVATIONは、番組の再生予約や録画予約の操作が行われたことを示す。
なおLogTypeにはVOTE、DETAIL、及びRESERVATIONの他、Play、Stop、及びRemoveなどがある。Playは、録画した番組を再生する操作が行われたことを示し、Stopは、再生を停止する操作が行われたことを示し、Removeは、録画された番組を削除する操作が行われたことを示す。
LogValueは、LogTypeの操作内容を表し、図2の例のように、LogTypeがVOTEである場合、投票内容を示すGOODまたはBADとなる。
LogTimeは、操作がなされた日付時刻を示す。
メタ情報DB13に蓄積されているメタ情報は、例えば図3に示すように、ProgramID、及びAttributeIDとValueIDの組から構成されている。
ProgramIDは、ユーザが視聴可能な番組を示すIDである。
AttributeIDは、対応するProgramIDを有する番組の、ValueIDで示されるメタ情報の属性(例えば、ジャンル、人物、キーワード、タイトル等)を示すIDである。ValueIDは、対応するAttributeIDで示される属性に属するメタ情報を示すIDである。
例えば、AttributeIDが、メタ情報がジャンルであることを示す1である場合、ValueIDは、番組が、例えばニュース番組、バラエティ番組等であることを示すID(以下、GenreIDと称する)となる。
またAttributeIDが、メタ情報が人物を特定する情報であることを示す2である場合、ValueIDは、例えばその番組に出演している所定の出演者(人物)を示すID(以下、PersonIDと称する)となる。なお以下において、このようにメタ情報が人物を特定する情報であることを示す2のAttributeIDを、適宜、人物AttributeIDと称する。
またAttributeIDが、メタ情報がキーワードであることを示す6である場合、ValueIDは、その番組に関連する所定のキーワードを示すID(以下、KeywordIDと称する)となる。
AttributeIDが、メタ情報がタイトルであることを示す11である場合、ValueIDは、その番組のタイトル(題名)を示すID(以下、TitleIDと称する)となる。
このように操作履歴DB12及びメタ情報DB13は構成されている。すなわち嗜好抽出エンジン11は、操作履歴DB12の、推薦対象ユーザのユーザID(すなわち、MemberID)を含む操作履歴情報を参照してそれに含まれるProgramIDを取得するとともに、メタ情報DB13の、取得したProgramIDを有する番組のメタ情報に基づいて、図4に示したような推薦対象ユーザの嗜好ベクトルVucを生成する。
図4の例の場合、嗜好ベクトルVucは、UserID、及びAttributeID、ValueID、Scoreの組から構成されている。
UserIDは、推薦対象ユーザのUserIDである。
AttributeIDは、ユーザが操作した番組のメタ情報の、ジャンル、人物、キーワード、タイトル等の属性を示すIDであり、ValueIDは、AttributeIDに応じた属性に属するメタ情報を示すIDである。
Scoreは、ユーザが操作した番組の操作結果に応じて計算される個々のメタ情報の重みである。
例えば、ユーザがニュース番組をよく視聴している場合、AttributeIDがジャンルを示す1で、ニュースを示すValueIDに対応するScoreは、大きな値となる。
また例えば、ある人物が出演している番組をよく視聴している場合、AttributeIDが人物を示す2で、その人物のIDを示すValueIDに対応するScoreは、大きな値となる。
嗜好抽出エンジン11は、このように生成した推薦対象ユーザの嗜好ベクトルVucを、ユーザ嗜好情報DB14、概念抽出エンジン15、及び協調フィルタリングエンジン24に供給する。なおユーザ嗜好情報DB14に供給された嗜好ベクトルVucは、図5に示すように蓄積される。
図1に戻り概念抽出エンジン15は、嗜好抽出エンジン11から供給された推薦対象ユーザの嗜好に基づいて、推薦対象ユーザの好きな概念を抽出し、タイプ検出エンジン16に供給する。
具体的には、概念抽出エンジン15は、嗜好抽出エンジン11から供給された推薦対象ユーザの嗜好ベクトルVuc(図4)の中の、所定の属性に関するScore、例えば人物に関するScore(すなわち人物AttributeIDに対応するScore)に着目し、値が高い上位N個のScoreまたは所定の閾値より大きいScoreに対応するValueIDを選択し、選択したValueID(以下、ここで選択されたValueIDをPersonIDと称する)を、ユーザの好む概念(すなわち人物)を表すものとしてタイプ検出エンジン16に供給する。
タイプ検出エンジン16は、概念抽出エンジン15から供給された推薦対象ユーザの好きな概念と、概念タイプDB17に蓄積されているその概念のタイプに基づいて、推薦対象ユーザのタイプを決定し、ユーザ概念DB18に登録したり、類似概念検出エンジン19に供給する。
概念タイプDB17に蓄積されている概念情報は、図6に示すように、PersonID、AttributeID、ValueID、及びScoreから構成されている。
PersonIDは、Attributeが2のときのValueIDの値に相当するものであり、人物のIDである。
AttributeIDは、対応するValueIDで示される情報が人物のタイプを示す情報であることを示すID(図6の例では、3)であり、ValueIDは、対応するPersonIDが示す人物のタイプの種類を示すID(以下、PersonCharacterIDと称する)であり、Scoreは、対応するPersonIDが示す人物が、対応するValueIDが示す種類のタイプである度合いを示す値である。
例えばValueIDが、人物タイプが司会系であることを示す1である場合、それに対応するScoreは、PersonIDが示す人物が司会系タイプである度合いを示す。
またValueIDが、人物タイプが癒し系であることを示す2である場合、それに対応するScoreは、PersonIDが示す人物が、癒し系タイプである度合いを示す。
またValueIDが、人物タイプが熱血系であることを示す3である場合、それに対応するScoreは、PersonIDが示す人物が熱血系タイプである度合いを示す。
ここで人物タイプである度合いとは、例えばその人物が出演している番組における役柄の多さによって決定され、司会者として番組に出演する機会が多い人物の司会系タイプの度合いは大きな値となり、逆に司会者として番組に出演する機会が少ない人物の司会系タイプの度合いは小さな値となる。
同様に、例えば性格がやさしい役柄で出演する機会が多い人物の癒し系タイプの度合いは大きな値となり、熱血的な役柄で出演する機会が多い人物の熱血系タイプの度合いは大きな値とされる。なおここでは人物タイプとして、司会系タイプ、癒し系タイプ、熱血系タイプを例として説明するが人物のタイプを表すものであれば、他のものを利用することもできる。
なお人物タイプである度合いの具体的な値は、その人物が出演する番組のメタ情報から算出することもできるし、例えば概念タイプDB17の管理者が自己の判断で設定することも可能である。
このように概念タイプDB17は構成されている。すなわち、タイプ検出エンジン16は、概念タイプDB17の、概念抽出エンジン15から供給されたPersonIDに対応するValueIDとScoreを参照して、そのPersonIDが示す人物のタイプベクトルを生成する。そしてタイプ検出エンジン16は、生成した各人物のタイプベクトルを、例えば足し合わせて平均を取り、その結果得られたタイプベクトルを、推薦対象ユーザのタイプベクトルとして、ユーザ概念DB18に登録したり、類似概念検出エンジン19に供給する。
例えば図6の例において、1及び4のPersonIDが概念抽出エンジン15から供給されてきた場合、図7に示すように、それらのタイプベクトルVgtが生成される。そしてそれらのタイプベクトルVgtについて、ValueID毎に、Scoreの平均が取られて、図8に示すような推薦対象ユーザのタイプベクトルVutが生成される。
概念抽出エンジン15から供給されてきたPersonIDは、推薦対象ユーザが好む人物(好きな概念)を表し、図7に示したその人物のタイプベクトルVgtは、その人物(好きな概念)のタイプを表すので、その好きな概念のタイプに基づいて生成された図8に示したタイプベクトルutは、推薦対象ユーザのタイプ(すなわち、特徴)を表していることになる。
生成された推薦対象ユーザのタイプベクトルVutは、図9に示すようにユーザ概念DB18に登録されるとともに、類似概念検出エンジン19に供給される。
なおここでは人物のタイプベクトルVgtを単純に足し合わせて推薦対象ユーザのタイプベクトルVutを生成するようにしたが、例えば、足し合わせる際、人物の出演回数を元に人物の重み(出演頻度など)を算出し、その重みを掛け合わせるようにすることもできる。
類似概念検出エンジン19は、概念タイプDB17を参照して、タイプ検出エンジン16から供給された推薦対象ユーザのタイプに対応する概念を検出し、その検索結果を、対応概念検出エンジン20に供給する。
具体的には、類似概念検出エンジン19は、概念タイプDB17(図6)の中のすべての人物についてタイプベクトルを生成し、タイプ検出エンジン16から供給された推薦対象ユーザのタイプベクトルとの類似度を、例えば2ベクトル間の距離、コサイン尺度、相関係数等を用いて算出するとともに、類似する上位M個のタイプベクトルまたはある閾値より大きい類似度が得られたタイプベクトルを有する人物を検出する。すなわち推薦対象ユーザが、司会系の人物(正確には、司会者としてよく出演している人物)を好むタイプである場合、司会者としてよく出演している人物(概念)がさらに検出される。
類似概念検出エンジン19は、検出した人物を示すPersonIDを、対応概念検出エンジン20に供給する。
対応概念検出エンジン20は、概念関係DB21を参照して、類似概念検出エンジン19から供給された推薦対象ユーザのタイプに対応する概念と所定の関係にある概念(以下、適宜、対応概念と称する)を抽出し、タイプ検出エンジン22に供給する。
概念関係DB21に蓄積されている概念関係情報は、図10に示すように、OrgAttributeID、OrgValueID、DstAttributeID、DstValueID、及びScoreから構成されており、OrgAttributeIDとValueID(PersonID)で示される概念と、DstAttributeIDとDstValueID(PersonID)で示される概念との所定の関係における強さがScoreより表されている。
この例の場合、概念間の所定の関係における強さとは、番組の内容上において、共演関係となっている度合い、恋愛関係となっている度合い、ライバル関係となっている度合い、または番組の説明文中に共起している度合いなどである。
なお共演関係となっている度合いは、番組データをEPG(Electronic Program Guide)ともいう等より取得し、各番組に出演している出演者群の情報を取得し、例えば、式(1)で求められるJaccord係数を、出演者Aと出演者Bが共演関係となっている度合いRWA,Bとして計算することができる。
Figure 2008234043
Jaccord係数の他、共演関係、共著関係となっている度合いを計算する手法として、Simson係数、ダイス係数、共起頻度、相互情報量、コサイン尺度等の尺度を利用することができる。なおこれらの詳細は、例えば、“人工知能学会論文誌 20巻1号E(2005年) Web上の情報からの人間関係ネットワークの抽出”に記載されている。
恋人関係やライバル関係となっている度合いは、主人公やヒロイン、ライバル関係などを示すメタ情報が存在する場合、そのメタ情報をEPG等より取得し、例えば、式(2)を利用して、恋人関係やライバル関係となっている度合いを計算することができる。
Figure 2008234043
また共起関係の度合いは、番組データをEPG等より取得し、説明文中の出演者の共起関係を元に、式(3)に示すように、その関係の重みを計算することができる。
Figure 2008234043
すなわち対応概念検出エンジン20は、概念関係DB21(図10)の、類似概念検出エンジン19から供給されたPersonIDから得られるAttributeID(2)とValueIDをOrgAttributeID(2)とOrgValueIDとする概念関係情報を参照し、OrgAttributeIDとOrgValueID毎に、値が高い上位P個のScoreまたは所定の閾値より大きいScoreが得られたDstAttributeIDとDstValueIDを取得し、それを(すなわち、PersonIDを)タイプ検出エンジン22に供給する。
すなわち類似概念検出エンジン19から供給されたPersonIDが示す人物それぞれと所定の関係を有する人物が検出され、タイプ検出エンジン22に供給される。
タイプ検出エンジン22は、対応概念検出エンジン20から供給された、推薦対象ユーザのタイプの概念(すなわち、ある人物)と所定の関係(例えば、共演関係)を有する概念(すなわち、ある人物)に基づいて、推薦コンテンツを決定する際に参照にするユーザ(以下、非推薦対象ユーザと称する)全体のタイプを決定する。
具体的には、タイプ検出エンジン22は、概念タイプDB17の(図6)、対応概念検出エンジン20から供給されたPersonIDに対応するValueID及びScoreを参照して、PersonIDが示す人物のタイプベクトル(基本的は、図7に示したものと同様のベクトル)を生成する。そしてタイプ検出エンジン22は、例えば生成した人物のタイプベクトルを足し合わせて平均を取り、その結果得られたタイプベクトルを、非推薦対象ユーザ全体のタイプを表すタイプベクトル(基本的は、図8に示したものと同様のベクトル)とする。タイプ検出エンジン22は、このように生成した非推薦対象ユーザ全体のタイプベクトルを、非推薦対象ユーザ検出エンジン23に供給する。
なおここでは人物のタイプベクトルを単純に足し合わせて非推薦対象ユーザ全体のタイプベクトルを生成するようにしたが、例えば、足し合わせる際、人物の出演回数を元に人物の重み(出演頻度など)を算出し、その重みを掛け合わせるようにすることもできる。
非推薦対象ユーザ検出エンジン23は、タイプ検出エンジン22から供給された非推薦対象ユーザ全体のタイプに基づいて、非推薦対象ユーザを検出し、協調フィルタリングエンジン24に供給する。
具体的には非推薦対象ユーザ検出エンジン23は、ユーザ概念DB18(図9)に基づいて、全ユーザのタイプベクトル(基本的には、図7に示すタイプベクトルと同様の構成を有し、図7のPersonIDがUserIDとなったもの)を生成するとともに、タイプ検出エンジン22から供給された非推薦対象ユーザのタイプベクトルとの類似度を、例えば2ベクトル間の距離、コサイン尺度、相関係数等を用いて算出し、類似する上位Q個またはある閾値より大きい類似度が得られたタイプベクトルを有する非推薦対象ユーザ(UserID)を検出する。非推薦対象ユーザ検索エンジン23は、検出した非推薦対象ユーザのUserIDを、協調フィルタリングエンジン24に供給する。
協調フィルタリングエンジン24は、非推薦対象ユーザ検出エンジン23から供給された非推薦対象ユーザの操作履歴や嗜好情報と、推薦対象ユーザの操作履歴や嗜好情報に基づいて、協調フィルタリングを行い、その結果に基づいて推薦対象ユーザに推薦する番組を決定する。
具体的には、協調フィルタリングエンジン24は、ユーザ嗜好情報DB14(図5)の、非推薦対象ユーザ検出エンジン23から供給された非推薦対象ユーザのUserIDの嗜好ベクトルを読み出す。
そして協調フィルタリングエンジン24は、読み出した非推薦対象ユーザの嗜好ベクトルと嗜好抽出エンジン11から供給された推薦対象ユーザの嗜好ベクトルなどに基づいて、例えば、式(4)を演算して、非推薦対象ユーザの嗜好ベクトルの中で重みが高く、推薦対象ユーザがまだ利用していない番組を検出する。
Figure 2008234043
式(4)中WCiは、推薦対象ユーザに推薦する番組iの重みであり、Rjは、非推薦対象ユーザのタイプベクトルと非推薦対象ユーザのタイプベクトルの類似度であり、WC(j)は、非推薦対象ユーザjの番組iの重みである。
なおこのように式(4)を用いて推薦するコンテンツを決定する方法の他、非推薦対象ユーザの好んでいる番組(例えば、視聴したものや嗜好ベクトル内で重みの高いもの等)で推薦対象ユーザが好んでいない番組(例えば、視聴していないものや嗜好ベクトル内で重みの低いもの等)を推薦する番組とすることもできる。
協調フィルタリングエンジン24は、このように検出した推薦コンテンツがリストアップされた推薦リストを生成する。生成された推薦リストは、例えば図示せぬ表示部に表示され、ユーザに提示される。
なお協調フィルタリングの結果として、メタ情報が抽出される場合、それらを推薦リストに提示したり、そのメタ情報を嗜好ベクトルの更新に利用したりすることができる。
次に、コンテンツ推薦装置の動作を、図11のフローチャートを参照して説明する。
ステップS1において、ユーザの好きな概念が抽出される。
すなわち嗜好抽出エンジン11は、操作履歴DB12(図2)の、推薦対象ユーザのユーザID(MemberID)を含む操作履歴情報を参照してそれに含まれるProgramIDを取得するとともに、メタ情報DB13(図3)の、取得したProgramIDを有する番組のメタ情報に基づいて、図4に示したような推薦対象ユーザの嗜好ベクトルVucを生成し、ユーザ嗜好情報DB14、概念抽出エンジン15、及び協調フィルタリングエンジン24に供給する。なお推薦対象ユーザの嗜好ベクトルVucがユーザ嗜好情報DB14にすでに蓄積されている場合、嗜好抽出エンジン11は、ユーザ嗜好情報DB14から推薦対象ユーザの嗜好ベクトルVucを読み出すようにすることもできる。
概念抽出エンジン15は、嗜好抽出エンジン11から供給された推薦対象ユーザの嗜好ベクトルVucの中の人物AttributeIDに対応するValueIDのScoreに着目し、例えば、値が高い上位N個のScoreに対応するValueIDを選択し、選択したValueID(すなわち、PersonID)を、推薦対象ユーザの好む概念(すなわち、人物)を表すものとして、推薦対象タイプ検出エンジン16に供給する。
ステップS2において、推薦対象ユーザのタイプが決定される。
すなわち、タイプ検出エンジン16は、概念タイプDB17(図6)の、概念抽出エンジン15から供給されたPersonIDに対応するScoreを参照して、そのPersonIDが示す人物のタイプベクトルVgt(図7)を生成する。そしてタイプ検出エンジン16は、生成した人物のタイプベクトルVgtを、例えば足し合わせて平均を取り、推薦対象ユーザのタイプベクトルVut(図8)を生成し、ユーザ概念DB18に登録したり、類似概念検出エンジン19に供給する。
ステップS3において、推薦対象ユーザのタイプに対応する概念が検出される。
類似概念検出エンジン19は、概念タイプDB17(図6)の中のすべての人物についてタイプベクトルを生成し、タイプ検出エンジン16から供給された推薦対象ユーザのタイプベクトルVutとの類似度を算出するとともに、例えば類似する上位M個のタイプベクトルを有する人物を検出する。類似概念検出エンジン19は、検出した人物のPersonIDを、対応概念検出エンジン20に供給する。
ステップS4において、ステップS3で検出された概念と所定の関係を有する概念(すなわち、対応概念)が検出される。
すなわち対応概念検出エンジン20は、概念関係DB21(図10)の、類似概念検出エンジン19から供給されたPersonIDに対応するAttributeIDとValueIDをOrgAttributeIDとOrgValueIDとする概念関係情報を参照し、OrgAttributeIDとOrgValueID毎に、高いScoreが得られたDstAttributeIDとDstValueIDを取得し、それを(すなわち、PersonIDを)タイプ検出エンジン22に供給する。
ステップS5において、非推薦対象ユーザ全体のタイプが決定される。
すなわちタイプ検出エンジン22は、概念タイプDB17の(図6)、対応概念検出エンジン20から供給されたPersonIDに対応するValueID及びScoreを参照して、そのPersonIDが示す人物のタイプベクトルを生成する。そしてタイプ検出エンジン22は、例えば、生成した人物のタイプベクトルを足し合わせ平均を取り、非推薦対象ユーザ全体のタイプベクトルを生成する。タイプ検出エンジン22は、このように生成した非推薦対象ユーザ全体のタイプベクトルを、非推薦対象ユーザ検出エンジン23に供給する。
ステップS6において、非推薦対象ユーザ全体のタイプのユーザが、非推薦対象ユーザとして検出される。
すなわち非推薦対象ユーザ検出エンジン23は、ユーザ概念DB18(図9)に基づいて、全ユーザのタイプベクトルを生成するとともに、タイプ検出エンジン22から供給された非推薦対象ユーザ全体のタイプベクトルとの類似度を算出し、例えば類似する上位Q個のタイプベクトルを有するユーザ(すなわち、非推薦対象ユーザ)を検出し、その非推薦対象ユーザのUserIDを、協調フィルタリングエンジン24に供給する。
ステップS7において、協調フィルタリングエンジン24は、非推薦対象ユーザ検出エンジン23から供給された非推薦対象ユーザの操作履歴や嗜好情報と、推薦対象ユーザの操作履歴や嗜好情報に基づいて、協調フィルタリングを行い、その結果に基づいて推薦対象ユーザに推薦するユーザを決定し、決定した番組がリストアップされた推薦リストを生成する。
以上のように、推薦対象ユーザが好むコンテンツの内容上の所定の概念(例えば、ある人物)と所定の関係(例えば、共演関係)がある所定の概念(例えば、ある人物)を好むユーザを、非推薦対象ユーザとして検出するようにしたので、概念同士の関係に対応する関係を有するユーザを、非推薦対象ユーザとして検出することができる。
例えばコンテンツがドラマ番組である場合、それに出演している出演者同士の関係は、実社会の人間関系となっている。例えば、恋人関係となることが多い出演者は、一方が情熱的な役柄で、他方がいわゆるやさしい性格の役柄であるなど、役柄においては、いわゆる嗜好が類似する関係ではないが、恋人同士としてふさわしい、すなわち相性がよい関係となっている。ライバル関係となることが多い出演者同士も、ある意味相性がよい関係であるということができる。
そこで好む概念同士が所定の関係にあるユーザとも、その所定の関係が擬似的に成立するものとし(すなわち相性がよいものとし)、そのようなユーザを、非推薦対象ユーザとして検出するようにすれば、嗜好が類似するユーザに限らず、概念同士の関係に応じたユーザを、非推薦対象ユーザとして検出することができので、変化に富んだコンテンツ推薦を行うことができる。
また推薦対象ユーザが好む概念(例えば、ある人物)から推薦対象ユーザの特徴(例えば、推薦対象ユーザのタイプベクトル)を求め、その特徴を有する概念(例えば、ある人物)と所定の関係(例えば、共演関係)がある所定の概念(例えば、ある人物)を求め、その所定の概念から非推薦対象ユーザとしての特徴(例えば、非推薦対象ユーザ全体のタイプベクトル)を求め、そしてその特徴を有するユーザを、非推薦対象ユーザとして検出するようにしたので、非推薦対象ユーザをより広い範囲から適切に検出することができる。
なお以上においては、主に、「概念」を番組に出演する人物(出演者)をとし、「概念同士の関係」を共演関係として説明したが、例えば番組内またはその説明文で使用される所定のキーワードを「概念」とし、キーワード同士の共起関係を「概念同士の関係」とすることもできる。すなわちコンテンツ推薦において有用な実社会での人間関係に対応する関係を有するものであれば、「概念」または「概念同士の関係」とすることができる。
また以上においては、「概念」が1個である場合を例として説明したが、複数の「概念」を設け、所定の「概念」の組み合わせ同士の関係を利用することもできる。
図12は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)201,ROM(Read Only Memory)202,RAM(Random Access Memory)203は、バス204により相互に接続されている。
バス204には、さらに、入出力インタフェース205が接続されている。入出力インタフェース205には、キーボード、マウス、マイクロホンなどよりなる入力部206、ディスプレイ、スピーカなどよりなる出力部207、ハードディスクや不揮発性のメモリなどよりなる記憶部208、ネットワークインタフェースなどよりなる通信部209、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどのリムーバブルメディア211を駆動するドライブ210が接続されている。
以上のように構成されるコンピュータでは、CPU201が、例えば、記憶部208に記憶されているプログラムを、入出力インタフェース205及びバス204を介して、RAM203にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU201)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア211に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
そして、プログラムは、リムーバブルメディア211をドライブ210に装着することにより、入出力インタフェース205を介して、記憶部208にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部209で受信し、記憶部208にインストールすることができる。その他、プログラムは、ROM202や記憶部208に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
本発明を適用したコンテンツ推薦装置の構成例を示すブロック図である。 図1の操作履歴DB12に蓄積されている操作履歴情報の例を示す図である。 図1のメタ情報DB13に蓄積されているメタ情報の例を示す図である。 嗜好ベクトルの例を示す図である。 図1のユーザ嗜好情報DB14に蓄積されている嗜好情報の例を示す図である。 図1の概念タイプDB17に蓄積されている概念タイプ情報の例を示す図である。 人物のタイプベクトルの例を示す図である。 推薦対象ユーザのタイプベクトルの例を示す図である。 図1のユーザ概念DB18に蓄積されているタイプベクトルの例を示す図である。 図1の概念関係DB21に蓄積されている概念関係情報の例を示す図である。 コンテンツ推薦装置の動作を説明するフローチャートである。 パーソナルコンピュータの構成例を示すブロック図である。
符号の説明
11 嗜好抽出エンジン, 12 操作履歴DB, 13 メタ情報DB, 14 ユーザ嗜好情報DB, 15 概念抽出エンジン, 16 タイプ検出エンジン, 17 概念タイプDB, 18 ユーザ概念DB, 19 類似概念検出エンジン, 20 対応概念検出エンジン, 21 概念関係DB, 22 タイプ検出エンジン, 23 非推薦対象ユーザ検出エンジン, 24 協調フィルタリングエンジン

Claims (5)

  1. 他のユーザが利用したコンテンツに基づいて、コンテンツを特定の推薦対象ユーザに推薦する情報処理装置において、
    前記推薦対象ユーザが好むコンテンツの内容上の所定の概念を抽出する第1の抽出手段と、
    前記第1の抽出手段により抽出された前記概念と所定の関係がある所定の概念を抽出する第2の抽出手段と、
    前記第2の抽出手段により抽出された前記概念を好む非推薦対象ユーザを検出する非推薦対象ユーザ検出手段と、
    前記非推薦対象ユーザ検出手段により検出された前記非推薦対象ユーザが利用したコンテンツに基づいて、前記推薦対象ユーザに推薦するコンテンツを決定する決定手段と
    を備える情報処理装置。
  2. 前記第2の抽出手段は、
    前記第1の抽出手段により抽出された前記概念から前記特定のユーザの特徴を検出する第1の検出手段と、
    前記第1の検出手段により検出された前記特徴を有する概念を検出する第2の検出手段と、
    前記第2の検出手段により検出された前記概念と前記所定の関係がある概念を検出する第3の検出手段と
    を備え、
    前記非推薦対象ユーザ検出手段は、
    前記第2の抽出手段の前記第3の検出手段により検出された前記概念から非推薦対象ユーザの特徴を検出する第4の検出手段と、
    前記第4の検出手段により検出された前記特徴を有するユーザを、非推薦対象ユーザとして検出する第5の検出手段と
    を備える請求項1に記載の情報処理装置。
  3. 前記決定手段は、前記特定のユーザと前記非推薦対象ユーザ間の協調フィルタリングを行い、その結果に基づいて前記特定のユーザに推薦するコンテンツを決定する
    請求項1に記載の情報処理装置。
  4. 他のユーザが利用したコンテンツに基づいて、コンテンツを特定の推薦対象ユーザに推薦する情報処理装置の情報処理方法において、
    前記推薦対象ユーザが好むコンテンツの内容上の所定の概念を抽出する第1の抽出ステップと、
    前記第1の抽出ステップの処理で抽出された前記概念と所定の関係がある所定の概念を抽出する第2の抽出ステップと、
    前記第2の抽出ステップの処理で抽出された前記概念を好む非推薦対象ユーザを検出する非推薦対象ユーザ検出ステップと、
    前記非推薦対象ユーザ検出ステップの処理で検出された前記非推薦対象ユーザが利用したコンテンツに基づいて、前記推薦対象ユーザに推薦するコンテンツを決定する決定ステップと
    を含む情報処理方法。
  5. 他のユーザが利用したコンテンツに基づいて、コンテンツを特定の推薦対象ユーザに推薦する情報処理をコンピュータに実行させるプログラムにおいて、
    前記推薦対象ユーザが好むコンテンツの内容上の所定の概念を抽出する第1の抽出ステップと、
    前記第1の抽出ステップの処理で抽出された前記概念と所定の関係がある所定の概念を抽出する第2の抽出ステップと、
    前記第2の抽出ステップの処理で抽出された前記概念を好む非推薦対象ユーザを検出する非推薦対象ユーザ検出ステップと、
    前記非推薦対象ユーザ検出ステップの処理で検出された前記非推薦対象ユーザが利用したコンテンツに基づいて、前記推薦対象ユーザに推薦するコンテンツを決定する決定ステップと
    ステップを含む情報処理をコンピュータに実行させるプログラム。
JP2007069298A 2007-03-16 2007-03-16 情報処理装置及び情報処理方法、並びにプログラム Expired - Fee Related JP5114984B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007069298A JP5114984B2 (ja) 2007-03-16 2007-03-16 情報処理装置及び情報処理方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007069298A JP5114984B2 (ja) 2007-03-16 2007-03-16 情報処理装置及び情報処理方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2008234043A true JP2008234043A (ja) 2008-10-02
JP5114984B2 JP5114984B2 (ja) 2013-01-09

Family

ID=39906782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007069298A Expired - Fee Related JP5114984B2 (ja) 2007-03-16 2007-03-16 情報処理装置及び情報処理方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP5114984B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010237919A (ja) * 2009-03-31 2010-10-21 Kddi Corp 嗜好推定装置
JP2013149140A (ja) * 2012-01-20 2013-08-01 Hitachi Consumer Electronics Co Ltd 情報処理装置、及び、情報処理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003167901A (ja) * 2001-11-29 2003-06-13 Kddi Corp 協調フィルタリング方法、協調フィルタリング装置及び協調フィルタリングプログラム
WO2006116543A2 (en) * 2005-04-28 2006-11-02 Friendster, Inc. Compatibility scoring of users in a social network

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003167901A (ja) * 2001-11-29 2003-06-13 Kddi Corp 協調フィルタリング方法、協調フィルタリング装置及び協調フィルタリングプログラム
WO2006116543A2 (en) * 2005-04-28 2006-11-02 Friendster, Inc. Compatibility scoring of users in a social network

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010237919A (ja) * 2009-03-31 2010-10-21 Kddi Corp 嗜好推定装置
JP2013149140A (ja) * 2012-01-20 2013-08-01 Hitachi Consumer Electronics Co Ltd 情報処理装置、及び、情報処理方法

Also Published As

Publication number Publication date
JP5114984B2 (ja) 2013-01-09

Similar Documents

Publication Publication Date Title
US8612866B2 (en) Information processing apparatus, information processing method, and information processing program
US8214318B2 (en) Apparatus, method and computer program for content recommendation and recording medium
US8200689B2 (en) Apparatus, method and computer program for content recommendation and recording medium
US20100250554A1 (en) Adding and processing tags with emotion data
US8869042B2 (en) Recommendation engine
US7620551B2 (en) Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
US8321203B2 (en) Apparatus and method of generating information on relationship between characters in content
KR101061234B1 (ko) 정보처리 장치와 방법, 및 기록 매체
Liu et al. The relation of culture, socio-economics, and friendship to music preferences: A large-scale, cross-country study
JP2012018412A (ja) 会話の話題を決定して関連するコンテンツを取得して提示する方法及びシステム
JP2009076043A (ja) メッセージから活動関連のコンテキスト情報を推測するための方法
US20060004871A1 (en) Multimedia data reproducing apparatus and multimedia data reproducing method and computer-readable medium therefor
US8174579B2 (en) Related scene addition apparatus and related scene addition method
US8504422B2 (en) Enhancing photo browsing through music and advertising
US20130239033A1 (en) Lifestyle collecting apparatus, user interface device, and lifestyle collecting method
US20140074828A1 (en) Systems and methods for cataloging consumer preferences in creative content
JP2008257655A (ja) 情報処理装置及び方法、並びにプログラム
US20150347525A1 (en) Context-Based Object Retrieval In A Social Networking System
JP2011145742A (ja) 情報処理装置、情報処理方法、およびプログラム
Tsagkias et al. Predicting podcast preference: An analysis framework and its application
CN110929158A (zh) 一种内容推荐方法、系统及存储介质和终端设备
JP2010262436A (ja) 情報処理装置および方法、並びにプログラム
JP6767808B2 (ja) 視聴ユーザログ蓄積システム、視聴ユーザログ蓄積サーバ、及び視聴ユーザログ蓄積方法
TW201109944A (en) Music recommendation method and program product thereof
US20210034324A1 (en) Information processing system, method, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120918

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121001

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151026

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees