JP2008130032A - コンテンツ抽出装置、方法、プログラム、及び記録媒体 - Google Patents

コンテンツ抽出装置、方法、プログラム、及び記録媒体 Download PDF

Info

Publication number
JP2008130032A
JP2008130032A JP2006317476A JP2006317476A JP2008130032A JP 2008130032 A JP2008130032 A JP 2008130032A JP 2006317476 A JP2006317476 A JP 2006317476A JP 2006317476 A JP2006317476 A JP 2006317476A JP 2008130032 A JP2008130032 A JP 2008130032A
Authority
JP
Japan
Prior art keywords
content
evaluation value
contents
distance
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006317476A
Other languages
English (en)
Other versions
JP4917412B2 (ja
Inventor
Keiko Watanuki
啓子 綿貫
Tomoaki Yamamoto
智昭 山本
Michiaki Mukai
理朗 向井
Yasushi Adachi
靖 安達
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2006317476A priority Critical patent/JP4917412B2/ja
Publication of JP2008130032A publication Critical patent/JP2008130032A/ja
Application granted granted Critical
Publication of JP4917412B2 publication Critical patent/JP4917412B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】記録されたコンテンツ間の類似性が乏しい場合や、類似性に偏りが発生した場合でも、視聴候補選択を容易とするコンテンツ抽出技術を提供する。
【解決手段】コンテンツ抽出装置Aは、デジタル放送信号を受信してコンテンツ(テレビ番組など)を記録するコンテンツDB2と、コンテンツ間の類似度(距離)を計算し、2次元配置座標を算出するコンテンツ配置座標演算部6と、表示する所定数のコンテンツを抽出するコンテンツ抽出部7と、抽出されたコンテンツを表示するコンテンツ表示部20と、を備えている。配置座標取得部7aは、検索開始直前に視聴していたコンテンツKiを基に、所定の距離rに位置するコンテンツをコンテンツDB2から取得する。重心絞込み部7cは、コンテンツ数Nが所定数nよりも多いとき、n個に絞り込むために、距離rの円周領域をn分割し、各領域の重心位置を求めて、その重心に位置するコンテンツを抽出する。
【選択図】図1

Description

本発明は、コンテンツ抽出技術に関し、特に、テレビジョン装置などのデジタル放送信号を受信・記録した記録媒体からコンテンツを抽出し、表示するためのコンテンツ抽出装置、コンテンツ抽出方法、前記コンテンツ抽出方法のプログラム、及び該プログラムを記録した記録媒体に関する。
従来、放送された映像を記録したコンテンツの中から、自分の見たいコンテンツを見つけるためには、早送り再生を行うなどの処理を行っていた。しかしながら、ストレージメディアの大容量化にともなって、記録された全てのコンテンツの中から、早送り再生により所望のコンテンツを探すことは、時間も労力もかかり、面倒である。
そこで、最近では、記録されたコンテンツについて、ディレクトリ形式のリスト表示する方法が行われている。しかしながら、情報が大量になると、ディレクトリ形式の分類では階層構造が深くなってしまい、所望のコンテンツを探すのに時間がかかる。
一方、コンテンツに付与されたテキスト情報を基に、自然言語を用いて検索する方法も提案されている。しかしながら、このような検索方法は、見たいコンテンツが明確な場合は効率的であるが、ユーザが明確な意図を持たない場合や、自分の興味をうまく言葉で表現できない場合には、利用することが困難である。
そこで、ユーザが明確な意図を持たない場合でも、情報を探すことを可能にすることを目的として、情報を視覚的に分類配置し、ユーザに見える形で提供する方法が提案されている。例えば、下記非特許文献1には、コンテンツがテキスト文書である場合において、テキスト文書中のキーワードとそのキーワードの出現頻度とを抽出してキーワードベクトル(意味ベクトル)を生成し、これに多次元尺度法を適用してコンテンツを2次元配置し、出来上がったコンテンツマップ上をユーザがブラウジングする手法が記載されている。
下記非特許文献2には、コンテンツの空間配置を実現する具体的手法が提案されている。概念ベース(意味ベクトルの集まり)を基に、予め決められた特徴的な単語で表された分類カテゴリの単語情報を、多次元尺度法を用いて2次元配置し(これを「基準マップ」と呼ぶ)、そこにコンテンツを配置する手法が記載されている。この場合、コンテンツには予め分類カテゴリと説明文などのテキストもしくはキーワードなどのメタ情報が付与されており、そのメタ情報と概念ベースや基準マップとの類似性(距離)を算出し、各コンテンツの意味ベクトルを計算し、多次元尺度法を用いて基準マップ上にコンテンツを分類配置する。
下記特許文献1には、コンテンツ(画像、映像、音楽、テキスト情報など)に分類カテゴリが付与されていることを前提として、分類カテゴリ情報が付与されたコンテンツを、その分類構造を反映するようにマッピングすることにより分類カテゴリ毎にコンテンツをクラスター化し、マップに分類体系の構造を反映する手法が記載されている。
図22は、コンテンツを分類配置する従来技術の概念を説明するための構成例を示す図であり、図23はその処理の流れを示すフローチャート図である。まず、図22に示す概念ベクトル算出処理部107は、コンテンツDB115に格納されているコンテンツの概要説明文を読み出し(ステップS501)、概念ベクトルを算出する。この際、概念ベクトルは多次元ベクトルとして表される。算出した概念ベクトルは、各コンテンツに対応付けてコンテンツDB115に格納する(ステップS502)。次に、2次元座標算出処理部105は、各コンテンツの概念ベクトルを用いて、全ての二つのコンテンツの組合せについて、コンテンツ間の距離を算出する(ステップS503)。そして、多次元尺度構成法によって、コンテンツの2次元平面上での位置情報を算出する(ステップS504)。多次元尺度構成法は、高次元ベクトル空間から低次元空間への圧縮アルゴリズムである。このようにして算出された位置情報を基に、マップ画像を作成する(ステップS505)。コンテンツ表示部110は、作成されたコンテンツのマップ画像を、入力部117から入力されるユーザからの要求に応えて表示する(ステップS506)。概要説明文から概念ベクトルを算出する方法については、非特許文献3を参照可能である。
上記非特許文献1、2及び特許文献1に代表されるコンテンツを空間配置する手法においては、類似度の差が小さいコンテンツは近くに集まり、類似度の差が大きいコンテンツは遠くに集まるというように、コンテンツ間の類似度をもとに配置することを可能にする。すなわち、記録されたコンテンツ全体の傾向(分布状態)と、コンテンツの相互関係の把握が容易になり、図22のコンテンツ表示部110に示されるようなコンテンツマップ上を自由に散策するようにコンテンツを選ぶことが可能になり、コンテンツ選択の利便性を向上させている。特に、上記手法は、コンテンツ選択に明確な選択意図を持たないために、コンテンツのジャンルや、コンテンツに付加された個々のメタデータやキーワードを用いたコンテンツ選択方法が向かない場合の、コンテンツ選択用のコンテンツ表示方法として有効である。
James A. Wise, et al. "Visualizing the non-visual: Spatial analysis and interaction with information from text documents", Proc. Of IEEE information on Visualization, ’95, pp. 51-58. (1995) 藤田悦郎「分類情報と言語情報の統合利用に基づくコンテンツ空間の可視化」DEWS2003 1-P-03, Mar. (2003) 熊本睦ほか、「概念ベースの情報検索への適用−概念ベースを用いた検索の特性評価−」信学技法 AI98-63 (1999). 特開2003-323454号公報
しかしながら、上記非特許文献1、2及び特許文献1に記載され、コンテンツ間類似度を基にしたコンテンツマップをユーザに表示し、類似度を手掛かりに、コンテンツマップからユーザにコンテンツを選択させる手法には、以下のような問題が生じる場合がある。
1)記録されたコンテンツ間の類似度が全体的に乏しい場合、図24に示すように、表示部110に表示されるコンテンツの空間配置による分布121が薄く広く拡散し、視聴候補選択の手掛かりとなるコンテンツグループが見いだせない。
2)或いは、図25に示すように、少数のコンテンツで構成された多数のコンテンツグループ121aが発生する。
3)類似性の大きなコンテンツばかりが記録されている等、記録されたコンテンツの類似度に偏りが存在する場合には、コンテンツの空間配置に偏りが発生して、図26に示すように、特定の位置に多数のコンテンツを含む、極少数のコンテンツグループ123が生じる。すなわち、視聴候補となるコンテンツグループの数が、少な過ぎる上に、1つのコンテンツグループに含まれるコンテンツの数が多くなり過ぎる。
以上のような現象が発生することにより、従来手法では次のような問題が生じる。
1)図24に示すようにコンテンツグループが発生しない場合には、コンテンツ選択の手掛かりがなくなり、どのあたりに、どのようなコンテンツがあるのかが掴みにくい。
2)図25に示すようにコンテンツグループの数が多くなり過ぎた場合は、何処のコンテンツグループをコンテンツ選択の手掛かりとしてチェックするのか選択に迷う上に、コンテンツグループの内容をチェックするのに時間が掛かる。
3)図26に示すようにコンテンツグループの数が少なくなった場合には、コンテンツ選択の手掛かりとなる対象のコンテンツグループの選択は容易になるが、その反面、個々のコンテンツグループに含まれる、チェックしなければならないコンテンツの数が多くなり過ぎる。
本発明は、上記問題点に鑑み、記録されたコンテンツ間の類似性が乏しい場合や、類似性に偏りが発生した場合でも、視聴候補選択を容易とするコンテンツ抽出技術を提供することを目的としている。
本発明の一観点によれば、コンテンツ間の類似度を基に、コンテンツ空間上における配置情報を持つ複数のコンテンツから、コンテンツを探すコンテンツ抽出装置であって、あるコンテンツと所定の類似度を持つ複数のコンテンツを前記類似度と対応関係を持つ前記コンテンツ空間における距離に基づいて、ある数(n個)のコンテンツを抽出することを可能にするコンテンツ抽出部と、前記コンテンツ抽出部により抽出されたコンテンツを表示部に表示する制御を行う制御部と、を有するコンテンツ抽出装置が提供される。
また、本発明の他の観点によれば、コンテンツ間の類似度を基に、コンテンツ空間上における配置情報を持つ複数のコンテンツから、コンテンツを探すコンテンツ抽出方法であって、あるコンテンツと所定の類似度を持つ複数のコンテンツを前記類似度と対応関係を持つ前記コンテンツ空間における距離に基づいて、ある数(n個)のコンテンツを抽出するステップと、抽出された前記コンテンツを表示するステップと、を有することを特徴とするコンテンツ抽出方法が提供される。
本発明は、上記に記載のステップをコンピュータに実行させるためのプログラム又は、そのプログラムを記録するコンピュータ読みとり可能な記録媒体も含むものである。
コンテンツ間の類似性を基に作成したコンテンツマップの中から、一定の規則に従って一定数の視聴候補を抽出することで、
(1)この目的を達成する為に、本発明のコンテンツ抽出装置の第1の構成は、コンテンツDB、概念ベクトル算出処理部、及びn(nは、2以上の自然数)次元座標算出処理部を備えたコンテンツ配置座標演算部、ユーザの行動を検出する行動検出部、n次元座標算出処理部で算出されたコンテンツの配置座標を基に、視聴候補となるコンテンツを抽出するコンテンツ抽出部、を備えている。
そして、前記コンテンツ抽出部は、コンテンツ選択基準となるコンテンツKiから、n次元配置座標上での距離が所定の距離r±Δ1(なお、Δ1は、0<Δ1≦r/2)の範囲に位置するコンテンツを、視聴候補のコンテンツとしてコンテンツDBから取得するコンテンツ候補取得部、前記配置座標取得部で取得された視聴候補コンテンツの数Nが、予め設定した数nよりも多いか否かを判断するコンテンツ候補確認部、コンテンツ数Nが所定数nよりも多いとき、n個に絞り込むために、距離r±Δ1の領域をn分割し、各分割領域のコンテンツ分布の重心位置を求めて、その重心位置に最も近い位置に存在するコンテンツを抽出するコンテンツ絞込み部、を備えている。
(2)本発明のコンテンツ抽出装置の第2の構成は、前記コンテンツ絞込み部の構成が、コンテンツ数Nが所定数nよりも多いとき、n個に絞り込むために、距離r±Δ1の領域に含まれるコンテンツの中から、予め設定したコンテンツ評価基準に基づき、評価値の上位n個のコンテンツを抽出するコンテンツ絞込み部となり、上記本発明のコンテンツ抽出装置の第1の構成と異なっている。
本発明では、ユーザはコンテンツ間の類似度を基に抽出され表示されたコンテンツ候補の中からコンテンツを選ぶことができ、視聴候補選択が容易になるという利点がある。
本発明は、前述したように、コンテンツ間の類似度を基にコンテンツを空間に配置する技術(非特許文献1)をベースにしている。各コンテンツに対し、予め特徴的な語彙(EPG情報など)や映像情報(色情報など)、音響情報(音量など)などを用いて多次元ベクトル(意味ベクトル)を作成し、コンテンツ間の類似度を計算して多次元空間上にコンテンツを配置する。あるいは、正規分布による配置や多次元尺度構成によって2次元空間上に配置しても良い。
これにより、コンテンツ空間上において、類似度の高いコンテンツは近くに、低いコンテンツは遠くに配置される。但し、実際にマップを作成する必要はなく、配置座標を持っているだけでもよい。コンテンツマップは多次元でも可能であるが、以下の説明では、2次元空間上にコンテンツが配置されている場合を例に説明する。また、検索時直前に視聴していたコンテンツを中心に、抽出したコンテンツをその周囲に表示する場合(図1の20)で説明する。
以下に、本発明の一実施の形態によるコンテンツ抽出技術について図面を参照しながら説明を行う。
まず、本発明の第1の実施の形態によるコンテンツ抽出技術について説明する。
本実施の形態は、上記解決手段(1)に対応する実施の形態である。本実施の形態は、あるコンテンツKiと類似度が同じコンテンツが所定数n個(たとえば8個)より多く存在する場合に、その中からn個の代表コンテンツを抽出する方法の一つであり、あるコンテンツKiから所定の距離rの円周を所定数n(ここでは8個)の領域に分割して、各領域の重心位置を算出し、その重心位置に存在するコンテンツを抽出して表示することを特徴とする。
図1に示すように、本実施の形態によるコンテンツ抽出装置Aは、従来技術(図22)と同様の構成を有するコンテンツ配置座標演算部6に加えて、ユーザの行動を検出する行動検出部21とコンテンツの配置座標を基に視聴候補となるコンテンツを抽出するコンテンツ抽出部7を備えることを特徴とする。
従来技術(図22)では、コンテンツマップを作成することを特徴としているが、本実施の形態では、コンテンツマップを作成することは必ずしも必要でない。また、コンテンツの配置座標は2次元でなく、多次元でもよい。但し、以下の説明では、2次元配置座標を用いた場合を例にする。図1は、本発明の第1の実施の形態に係るコンテンツ抽出装置Aの一構成例を示す機能ブロック図である。図1に示すように、本実施の形態によるコンテンツ抽出装置Aは、以下の構成要素を備えている。
1)コンテンツ配置座標演算部6:従来技術(図22)と同じ構成を有しており、コンテンツDB2、概念ベクトル算出処理部6c、2次元座標算出処理部6b、マップ作成処理部6aを備えている。但し、マップ作成処理部6aは任意に設けられる。コンテンツDB2には、コンテンツと共に、コンテンツの配置座標が記録される。
2)行動検出部21:例えば、ユーザのリモコン操作や顔の向き、視線、体温や心拍などのセンサを含んで構成され、ユーザがどのコンテンツを視聴しているかを常時検出すると共に、ユーザの検索開始タイミングを検出する。
3)コンテンツ抽出部7:配置座標取得部7a、候補確認部7b、重心絞込み部7cを備えている。
3−1)配置座標取得部7aは、検索開始直前に視聴していたコンテンツKiを基に、所定の距離rに位置するコンテンツの配置座標をコンテンツDB2bから取得する。
3−2)候補確認部7bは、取得されたコンテンツ数Nが所定数nよりも多いかどうかを判断する。
3−3)重心絞込み部7cは、コンテンツ数Nが所定数nよりも多いとき、n個に絞り込むために、距離rの円周領域をn分割し、各領域の重心位置を求めて、その重心に位置するコンテンツを抽出する。
次に、重心絞込み部7cにおいて、コンテンツ間の類似度を基に、所定数n個(たとえばディスプレイ上に一覧表示可能な1個から8個)のコンテンツを視聴候補として抽出する手法について説明する。表示部に表示するコンテンツは、コンテンツそのものであり、或いはそのサムネイルなど内容を実際に表示するものであれば良い。
まず、あるコンテンツKi(たとえば、検索直前に視聴していたコンテンツ)と所定の類似度を有するコンテンツ数Nが、所定数nより少ない場合は、全コンテンツを抽出し、表示する。Nがnより多い場合は、n個に絞り込む必要が生じる。この解決手段では、コンテンツ間の類似度を基に、代表コンテンツn個を抽出する手段として、コンテンツ群の重心を用いる。
次に、コンテンツ群の重心を用いる方法について説明する。あるコンテンツKi(たとえば、検索直前に視聴していたコンテンツ)との類似度を基にコンテンツ空間をn個(たとえば1個乃至8個)の領域に分割する。次に、各領域の重心位置を求め、そこに位置するコンテンツ(計n個)を代表コンテンツとして抽出し、当該配置座標を有するコンテンツをコンテンツDB2aから抽出して表示する。なお、本実施例では図示していないが、コンテンツDB2aそのものはネットワーク上に蓄積するようにしてもよい。
(n個の領域への分割方法)
図3は、コンテンツ空間の表示例を示す図である。コンテンツ表示部20には、多数のコンテンツ41が表示されている。
(1)コンテンツKiと類似度が同じn個を抽出する方法:
(ア)コンテンツKiと類似度が同じn個を抽出するには、図4に示すように、コンテンツKiを中心((1)に対応)に、所定距離rの円周43をn個(Lにより)に分割する。図4はn個に等分割した例である。等分割された領域43は、2)から9)までの領域である。領域43毎の円周上に位置するコンテンツ群の重心コンテンツを抽出する。同じ円周上のコンテンツを選択することで、類似度が同じ8種類のコンテンツが選ばれる。
図5は、円周Lをn個に不等分割した例を示す図である。距離rの円周43上には、複数のコンテンツが存在するため、n分割された各領域の重心を求め、重心に位置するコンテンツをひとつずつ、計n個を抽出する。ユーザには、たとえば、図9の画面20中央に現在見ているコンテンツKi(43)を、その周囲に各領域の重心に位置するコンテンツ(計n個:43−1〜43−8)を表示する(図9)。これにより、コンテンツKiとある一定の類似度を持つ代表コンテンツn個からユーザがコンテンツを選択できるようになる。
(イ)上記(ア)において、距離rの円周を分割する際、n等分するのではなく、以下のようにしてもよい。すなわち、予め全コンテンツ41を、コンテンツ41が持つ意味ベクトル間のユークリッド距離に基づいてK−means法などによりクラスタ化し、クラスタ毎に分割するようにする(図6:45−1〜45−4)。
(ウ)尚、上記(ア)において、分割したn個の領域内で1つずつランダムにn個を抽出してもよい。
(2) コンテンツKiと類似度が異なるn個のコンテンツを抽出する方法:
(ア)コンテンツKiと類似度が異なるn個のコンテンツを抽出するには、コンテンツKi(1)を中心に同心円的にn分割し(図7)、分割された各領域からひとつずつランダムにコンテンツを抽出する(41a、41b、41c、…)。これにより、コンテンツKiと類似度の異なる代表コンテンツn個からユーザは選べるようになる。図では、現コンテンツから一定距離毎に同心円的に領域を区切り、ドーナツ状の各領域から1つずつランダムにコンテンツを抽出する。これにより、類似度の異なる8種類のコンテンツを選択することができる。
(イ)上記(ア)において同心円的に分割した後、コンテンツKiを中心に、さらに、Lにより円周をm分割する(図8)。そして、n×m分割された各領域(例えばA1)の重心を求め、m分割された各領域内で重心位置のコンテンツ(計n個)を抽出する。この方法においても、現在あるいは直前に視聴していたコンテンツKiと、類似度の異なるn種類のコンテンツ8個からユーザは選べるようになる。
(装置の基本構成例)
図1は、本実施の形態によるコンテンツ抽出装置Aの一構成例を示す機能ブロック図である。図1に示すコンテンツ抽出装置Aは、デジタル放送信号を受信してコンテンツ(テレビ番組など)を記録するコンテンツDB2と、コンテンツ間の類似度(距離)を計算し、2次元配置座標を算出するコンテンツ配置座標演算部6と、表示する所定数のコンテンツを抽出するコンテンツ抽出部7と、抽出されたコンテンツを表示するコンテンツ表示部20と、を備えている。コンテンツDB2には、コンテンツ2aと共に、コンテンツの配置座標2bが記録されている。上述のように、本実施の形態の特徴であるコンテンツ抽出部7に関連して、行動検出部21と、配置座標取得部7a、候補確認部7b、重心絞込み部7cを備えている。行動検出部21は、例えば、ユーザのリモコン操作や顔の向き、視線、体温や心拍などを検出するセンサであり、ユーザがどのコンテンツを視聴しているかを常時検出すると共に、ユーザの検索開始を検出する。配置座標取得部7aは、検索開始直前に視聴していたコンテンツKiを基に、所定の距離rに位置するコンテンツをコンテンツDB2から取得する。候補確認部7bは、取得されたコンテンツ数Nが所定数nよりも多いか否かを判断する。重心絞込み部7cは、コンテンツ数Nが所定数nよりも多いとき、n個に絞り込むために、距離rの円周領域をn分割し、各領域の重心位置を求めて、その重心に位置するコンテンツを抽出する。
(ハードウエアの構成)
図2は、上記コンテンツ抽出装置の具体的なハードウエアの構成例を示す図である。図2において、受信手段1は、デジタル放送信号を受信し、コンテンツ蓄積手段2においてコンテンツ(テレビ番組など)を蓄積する。入力手段3は、リモコンや顔の向き、視線、体温や心拍などを検出するセンサなどを含み、ユーザの行動を検出する。CPU4は、ワークメモリ5に記憶された内蔵のシステムプログラムに従ってシステム制御を行うほかに、コンテンツ配置座標演算手段6における処理プログラム、およびコンテンツ抽出手段7における処理プログラムを実行してワークメモリ5上に処理結果を作成する。ワークメモリ5は、表示に関するデータや演算に使用するデータおよび演算結果等を一時的に記憶するいわゆるワーキングメモリであり、CPU4により実行されるプログラム処理において利用されるプログラムや処理データ等を格納する。
尚、このプログラムは、図示していないROM(Read Only Memory)に格納されるものでもよい。また、ワークメモリ5として用いられるRAM(Random Access Memory)の一部の記憶領域は、電源バックアップするか、あるいは、EEPROM (electrically erasable programmable ROM)やフラッシュメモリ等の不揮発性メモリにより構成され、電源OFF後も設定条件を保持する。
コンテンツ表示手段8は、ドットマトリックス構成の液晶表示装置(LCD)等で構成され、コンテンツ蓄積手段2に格納されたコンテンツやCPU4の演算処理結果を表示する。外部記憶装置(記録媒体)10は、電源バックアップされたメモリカードやDVD−ROM等からなり、コンテンツ抽出処理プログラム等を記録した記録媒体である。外部記憶ドライバ9は、外部記憶装置10の内容を読み取る装置である。
(コンテンツ抽出処理のフローチャート)
以下、図16を参照しながら、コンテンツ抽出部の動作についてフローチャートを参照しながら説明する。
コンテンツ抽出処理が開始されると、行動検出部21は、ユーザの検索開始を検出するか否かを判定する(ステップS100)。検索を開始しなければ(NO)、コンテンツ抽出処理は終了する(END)。検索を開始すれば(YES)、配置座標取得部7aが、検索直前に視聴していたコンテンツKiから距離rに位置するコンテンツをコンテンツDB2から取得する(ステップS101)。この際、距離rは予めシステムが設定しておいてもよいし、あるいは、ユーザが検索時に指定できるようにしても良い。
次に、候補確認部7bは、コンテンツ数がN>nであるか否かを判定する。取得されたコンテンツ数Nが所定数n(たとえば8個)以下の場合(NO)は、取得されたコンテンツをすべてコンテンツ表示部に出力して、処理を終了する(END)。一方、取得されたコンテンツ数Nが所定数n(たとえば8個)より多い場合(YES)は、候補を絞り込むための次のステップに進む。
次に、重心絞込み部7cは、コンテンツKiを中心とする距離rの円周領域を所定数n(たとえば8)に分割し(ステップS103)、n分割された各領域の重心位置を求め、重心に位置するコンテンツを抽出し(ステップS104)、ステップ102に戻る。候補確認部7bは、取得されたコンテンツ数Nが所定数n以下であることを確認して(NO)、抽出されたコンテンツをコンテンツ表示部20に出力し、処理を終了する(END)。次に、本発明の第2の実施の形態によるコンテンツ抽出装置について図面を参照しながら説明を行う。本実施の形態は、前記解決手段(2)に対応する実施の形態である。
本発明の第2の実施の形態は、類似度が同じコンテンツが所定数n個(たとえば8個)より多く存在する場合に、その中からn個の代表コンテンツを抽出する際に、ユーザの視聴行動を反映させることを特徴とする。
そのために、各コンテンツにユーザの視聴行動を反映する評価値を設定し、評価値を基に視聴候補となるコンテンツを抽出する。すなわち、本発明の第2の実施の形態によるコンテンツ抽出装置は、図10に示すように、コンテンツ評価値演算部22を備え、また、コンテンツ抽出部7に評価値絞込み部7dを備えることを特徴とする。
図10において、
コンテンツ配置座標演算部6は、従来技術(図22)と同様であり、コンテンツDB2、概念ベクトル算出処理部6c、2次元座標算出処理部6b、マップ作成処理部6aを備える。但し、マップ作成処理部6aは任意に設けられる。コンテンツDB2には、コンテンツ2aと共に、コンテンツの配置座標2b、さらに、評価値2cが記録される。
行動検出部21は、例えば、ユーザのリモコン操作や顔の向き、視線、体温や心拍などのセンサであり、ユーザがどのコンテンツを視聴しているかを常時検出すると共に、ユーザの検索開始を検出する。
コンテンツ抽出部7は、配置座標取得部7a、候補確認部7b、評価値絞込み部7dを備えている。配置座標書取得部7aは、さらに、視聴部7a−1と検索部7a−2とを備える。
配置座標取得部7aは、検索開始直前に視聴していたコンテンツKiを基に、所定の距離rに位置するコンテンツをコンテンツDB2から取得する。候補確認部7bは、取得されたコンテンツ数Nが所定数nよりも多いかどうかを判断する。
Nがnより多い場合は、n個に絞り込む必要が出てくるが、本実施の形態では、コンテンツ間の類似度を基に、代表コンテンツn個を抽出する手段として、コンテンツの評価値を用いることを特徴とする。コンテンツ評価値演算部22は、評価値取得部22a、評価値更新部22bを備えている。
次に、コンテンツの評価値を用いる方法について説明する。あるコンテンツKi(例えば、検索直前に視聴していたコンテンツ)と所定の類似度(距離)を有するコンテンツ群の中から、ユーザの嗜好に合うコンテンツn個を代表コンテンツとして抽出し、表示する。
具体的には、各コンテンツに対し、ユーザの視聴行動を反映する評価値を設ける。あるコンテンツを視聴すると、当該コンテンツの評価値を上げると共に、そのコンテンツと類似度(距離)が同じかあるいは近傍のコンテンツの評価値Pを上げる。視聴したコンテンツとの距離が遠いほど評価値Pが小さくなるようにする(図11)。これにより、地形図のような3次元マップができる(図12)。図12に示すように、評価値のピークP1からP8の3次元マップが生成される。 ただし、マップは多次元でもよいし、マップの形で保持する必要もない。尚、ユーザの嗜好は時間の経過と共に変化することが予測される。そこで、評価値は、時間の経過と共に元の値に戻るようにする。
(コンテンツの抽出方法)
(1)コンテンツKiから距離rのコンテンツ群(抽出候補)の中から、評価値の値が大きい上位n個のコンテンツを抽出して表示する(図13)。これにより、ユーザの嗜好にマッチしたコンテンツを選ぶことができる。
(2)コンテンツKiを中心に、所定距離rの円周をn分割する。各領域内で評価値が最大のコンテンツを抽出して表示する。(同一領域内で最大評価値を持つコンテンツが複数あるときは、その重心位置にあるコンテンツとする。)
(3)コンテンツKiを中心に、所定距離rの円周をn分割する。該円周を含む領域の中で、評価値がある閾値を超えるコンテンツを含む領域P11、P21、P31、P41においてのみ、評価値が最大のコンテンツを抽出して表示する(図14)。
(4)上記(2)〜(3)の領域の分割方法は、上記解決手段(1)における同心円的分割方法でもよい。
(5)コンテンツの評価値を基に、出来上がる分布の重心位置(C1、C2、C3、…)を求め(図15)、そこに位置するコンテンツを抽出し、表示する。
以下、類似度が同じコンテンツが所定数n個(たとえば8個)より多く存在する場合に、その中からn個の代表コンテンツを抽出する際、あるコンテンツKi(たとえば、検索直前に視聴していたコンテンツ)と所定の類似度(距離)を有するコンテンツ群の中から、評価値が上位n個のコンテンツを抽出して表示する方法を詳細に述べる。
(構成例)
図10は、本発明の第2の実施の形態に係るコンテンツ抽出装置の一構成例を示すブロック図である。デジタル放送信号を受信してコンテンツ(テレビ番組など)を記録するコンテンツDB2、コンテンツ間の類似度(距離)を計算し、2次元配置座標を算出するコンテンツ配置座標演算部6、表示する所定数のコンテンツを抽出するコンテンツ抽出部7、抽出されたコンテンツを表示するコンテンツ表示部20に加え、コンテンツの評価値を算出するコンテンツ評価値演算部22を備えている。
本実施の形態によるコンテンツ抽出部7において、行動検出部21は、ユーザがどのコンテンツを視聴しているか、検索を開始したかを検出する。配置座標取得部7aは視聴部7a−1と検索部7a−2を備える。また、評価値絞込み部7dを備える。コンテンツ評価値演算部22は、評価値取得部22a、評価値更新部22bを備えている。さらに、コンテンツDB2は、コンテンツの評価値を記録する評価値DB(2c)を新たに備えている。本実施の形態では、前述したように、ユーザの視聴行動を反映する評価値2cを設けることを特徴とする。そこで、コンテンツ抽出部7の行動検出部21がユーザの視聴行動を検出するか、検索行動を検出するかで振る舞いが異なってくる。
(コンテンツ評価値演算処理=視聴時のフローチャート)
以下、本発明の第2の実施の形態において、ユーザの視聴を検出したときの動作を、図17に示すフローチャート図を参照しながら説明する。
行動検出部21で、ユーザがコンテンツを視聴しているか、あるいは、検索を行うかを常時検出している(ステップS200)。検索を検出すれば、コンテンツ抽出処理へ進み、コンテンツ評価値演算処理は終了する。視聴を検出すれば、配置座標取得部7aの視聴部7a−1が、視聴コンテンツKiとそれと類似度が同じか近傍のコンテンツの座標をコンテンツDB2bから取得して評価値取得部22aに出力する(ステップS201)。
次に、評価値取得部22aが、取得されたコンテンツの評価値を評価値DB2cから取得し、評価値更新部22bに出力する(ステップS202)。評価値更新部22bで当該コンテンツの評価値を更新し(ステップS203)、評価値DB2cに入力する(ステップS204)。
(評価値の算出方法)
視聴したコンテンツKiと、あるコンテンツKjとの距離をDi,jとすると、コンテンツKjの評価値(W)は次式(1)で与えられる。
Figure 2008130032
尚、(1)式において、関数g(Di,j)はガウス関数を用いてもよいし、あるいは次式でもよい。
Figure 2008130032
(2)式において、定数aは、評価値の加算係数、bはKiからの距離である。
(1)式において、定数a,bを変数にして、同じ類似度を持つコンテンツの視聴回数t(繰り返し)に応じて、変えられるようにしてもよい。(繰り返しが多くなると、評価値の加算率(aに相当)を小さく抑えたり、評価値加算の適用範囲(bに相当)を狭くしたりする。)
評価値加算の適用範囲(bに相当)を最適にすることにより、ユーザの嗜好をより適切に反映する評価値になることが期待される。
尚、ユーザの嗜好は、時間の経過と共に変化することが予測される。そこで、評価値は、時間の経過と共に元の値に戻るようにする。コンテンツDB2内の評価値DB2cは、たとえば、表1に示すようなテーブルの形態をとる。
Figure 2008130032
表1に示すように、コンテンツと、このコンテンツのA、B、Cによる評価値がテーブル化されている。
(コンテンツ抽出処理=検索時のフローチャート)
次に、本発明の第2の実施の形態において、ユーザの検索を検出したときの動作を、フローチャート(図18)を参照しながら説明を行う。コンテンツ抽出処理が開始され、行動検出部21がユーザの検索を検出すると(ステップS210)、配置座標取得部7aの検索部7a−2が、検索直前に視聴していたコンテンツKiから距離rに位置するコンテンツをコンテンツDB2から取得する(ステップS211)。この際、距離rは、予めシステムが設定しておいてもよいし、あるいは、ユーザが検索時に指定できるようにしても良い。
次に、候補確認部7bは、取得されたコンテンツ数Nが所定数n(たとえば8個)以下の場合(NO)は、取得されたコンテンツをすべてコンテンツ表示部20に出力して、処理を終了する。一方、取得されたコンテンツ数Nが所定数n(たとえば8個)より多い場合(YES)は、候補を絞り込むための次のステップに進む(ステップS212)。
次に、評価値絞込み部7dは、ステップS211で取得されたコンテンツN個の評価値を評価値DB2cから取得し(ステップS213)、評価値の高い上位n個のコンテンツを抽出し(ステップS214)、ステップS212に戻る。候補確認部7bは取得されたコンテンツ数Nが所定数n以下であることを確認して(NO)、抽出されたコンテンツをコンテンツ表示部20に出力し、処理を終了する(END)。尚、視聴したコンテンツKiそのものは、次回の検索時に代表コンテンツとして抽出されないようにしてもよい。
(新しいコンテンツが記録されたときの処理方法)
新しく放送されたコンテンツが受信されるたびに、コンテンツ間類似度が計算され、当該コンテンツの座標が決まる。このとき、新コンテンツKnの評価値は、近傍のコンテンツの評価値の平均値とすればよい。尚、これまでは、コンテンツ毎に評価値を持たせていたが、コンテンツマップ全体を所定数の領域(たとえば分類カテゴリなど)に区切って、その領域毎に評価値を持たせても良い。このとき、新コンテンツKnの評価値は、そのコンテンツKnが含まれる領域の評価値とする。これにより、新コンテンツの評価値は一意に決まる。
次に、本発明の第3の実施の形態によるコンテンツ抽出技術について図面を参照しながら説明を行う。
第3の実施の形態では、第2の実施の形態において、コンテンツ評価値を算出する際に、行動をパタン毎(たとえば、時間帯(朝・昼・夜)、曜日(週日・週末)、季節、場所(移動中・家庭)など)に分けてコンテンツの評価値を算出することを特徴とする。
そのために、ユーザの行動を検出する際に、ユーザの行動パタン(時間や場所など)を検出する。そして、ユーザの視聴時には、そのパタン別にコンテンツの評価値を算出する。一方、ユーザの検索時には、対応するパタン別の評価値を用いてコンテンツを抽出、表示するようにする。これにより、ユーザは、たとえば、時間帯により異なる自分の嗜好に合った番組を選べるようになる。尚、ユーザ行動パタンとは、たとえば、時間帯(朝・昼・夜)、曜日(週日・週末)、季節、場所(移動中・家庭)などである。
(構成例)
図19は、本発明の第3の実施の形態に係るコンテンツ抽出装置の一構成例を示すブロック図である。デジタル放送信号を受信してコンテンツ(テレビ番組など)を記録するコンテンツDB2、コンテンツ間の類似度(距離)を計算し、2次元配置座標を算出するコンテンツ配置座標演算部6、ユーザに表示する所定数のコンテンツを抽出するコンテンツ抽出部7、抽出されたコンテンツを表示するコンテンツ表示部20、コンテンツの評価値を算出するコンテンツ評価値演算部22を備えている。
本実施の形態における行動検出部21は、ユーザの視聴時及び検索時の状況(時間や場所など)を検出し、行動パタンを解析する行動パタン解析部21aを新たに備える。また、コンテンツDB2は、行動パタン別の評価値2dを蓄えることを特徴とする。
(コンテンツ評価値演算処理=視聴時のフローチャート)
以下、本発明の実施の形態において、ユーザの視聴を検出したときの動作を、フローチャート(図20)を参照しながら説明する。
コンテンツ評価値演算処理を開始すると(START)、行動検出部21でユーザがコンテンツを視聴しているか、あるいは、検索を行うかを常時検出しておく(ステップS300)。検索を行うことを検出すれば、コンテンツ抽出処理へ進み、評価値演算処理は終了する。視聴を検出すれば、行動検出部21の行動パタン解析部21aが視聴時のユーザの状況(現在の時刻や場所など)を解析し、配置座標取得部7aの視聴部7a−1に出力する(ステップS301)。
次に、配置座標取得部7aの視聴部7a−1が、視聴コンテンツKiとそれと類似度が同じか近傍のコンテンツの座標をコンテンツDB2bから取得して、ユーザ状況の解析結果と共に評価値取得部22aに出力する(ステップS302)。
次に、評価値取得部22aが、取得されたコンテンツの評価値を当該行動パタンの評価値DB2dから取得し(ステップS303)、評価値更新部22bで当該コンテンツの評価値を更新し(ステップS304)、行動パタン別の評価値DB2dに入力する(ステップS305)。
(コンテンツ抽出処理=検索時のフローチャート)
次に、本実施例3において、ユーザの検索を検出したときの動作を、フローチャート(図21)を参照しながら説明する。
行動検出部21が検索行動を検出すると(ステップS310のYES)、行動検出部21の行動パタン解析部21aが検索時のユーザの状況(現在の時刻や場所など)を解析し、配置座標取得部7aの検索部7a−2に出力する(ステップS311)。配置座標取得部7aの検索部7a−2が、検索直前に視聴していたコンテンツKiから距離rに位置するコンテンツをコンテンツDB2から取得する(ステップS312)。このとき、距離rは、予めシステムが設定しておいてもよいし、あるいは、ユーザが検索時に指定できるようにしても良い。
次に、候補確認部7bは、取得されたコンテンツ数Nが所定数n(たとえば8個)以下の場合(NO)は、取得されたコンテンツをすべてコンテンツ表示部20に出力する。一方、取得されたコンテンツ数Nが所定数n(たとえば8個)より多い場合(YES)は、候補を絞り込むための次のステップに進む(ステップS313)。
次に、評価値絞込み部7dは、ステップS312で取得されたコンテンツN個の評価値を評価値DB2の該当行動パタン(検索時に解析された行動パタン)2dから取得し(ステップS314)、評価値の高い上位n個のコンテンツを抽出して(ステップS315)、ステップ313に戻る。候補確認部7bは取得されたコンテンツ数Nが所定数n以下であることを確認して(NO)、抽出されたコンテンツをコンテンツ表示部20に出力し、処理を終了する(END)。
以上に説明したように、本実施の形態によるコンテンツ抽出装置によれば、本発明では、ユーザはコンテンツ間の類似度を基に抽出され表示されたコンテンツ候補の中からコンテンツを選ぶことができ、視聴候補選択が容易になる。
コンテンツ間の類似性を基に作成したコンテンツマップの中から、一定の規則に従って一定数の視聴候補を抽出することで、記録されたコンテンツ間の類似性が乏しい場合や、類似性に偏りが発生した場合でも、視聴候補選択を容易とする。
また、ユーザの視聴行動を反映する評価値を各コンテンツに与えることで、ユーザの嗜好に応じたコンテンツを抽出して表示し、ユーザの視聴意欲を高めることを可能にする。
ユーザプロファイルを作ることなく、ユーザの嗜好に適応したコンテンツを抽出し、ユーザに表示できる。
また、オリジナルマップ(コンテンツ間類似度)を変更することがないため(コンテンツの評価値を変えるだけ)、より少ない計算量で済む。オリジナルマップ(類似度間類似度)を変更することなく、ユーザ毎のマップが作れるという利点がある。
ユーザがコンテンツに対する評価作業を行わなくても、ユーザの嗜好を的確に捉えることができる。評価値を時間の経過と共に基の値に戻すようにすることによって、ユーザの嗜好の変化に対応できる。オリジナルマップ(類似度)を変更することなく、各ユーザの行動パタン毎のマップが作れるので便利である。
本発明は、コンテンツ再生装置に利用可能である。
本発明の第1の実施の形態によるコンテンツ抽出装置の一構成例を示す図である。 図1のコンテンツ抽出装置の具体的なハードウエアの構成例を示す図である。 コンテンツ空間の表示例を示す図である。 所定距離rの円周43をn個(Lにより)に分等分割した例を示す図である。 円周Lをn個に不等分割した例を示す図である。 コンテンツが持つ意味ベクトル間のユークリッド距離に基づいてK−means法などによりクラスタ化し、クラスタ毎に分割した図である。 コンテンツKi(1))を中心に同心円的にn分割した例を示す図である。 同心円的に分割した後、コンテンツKiを中心に、さらに、Lにより円周をm分割した図である。 画面中央に現在見ているコンテンツKiを、その周囲に各領域の重心に位置するコンテンツ(計n個)を表示する例を示す図である。 本発明の第2の実施の形態に係るコンテンツ抽出装置の一構成例を示すブロック図である。 コンテンツの評価値の距離依存性を示す図である。 評価値のピークP1からP8の3次元マップである。 コンテンツKiから距離rのコンテンツ群(抽出候補)の中から、評価値の値が大きい上位n個のコンテンツを抽出して表示した例を示す図である。 評価値がある閾値を超えるコンテンツを含む領域P11、P21、P31、P41においてのみ、評価値が最大のコンテンツを抽出して表示した例を示す図である。 コンテンツの評価値を基に、出来上がる分布の重心位置(C1、C2、C3、…)を求めた図である。 コンテンツ抽出部の動作を示すフローチャート図である。 本発明の第2の実施の形態において、ユーザの視聴を検出したときの動作を示すフローチャート図である。 本発明の第2の実施の形態において、ユーザの検索を検出したときの動作を、フローチャート図である。 本発明の第3の実施の形態に係るコンテンツ抽出装置の一構成例を示すブロック図である。 本発明の第3の実施の形態において、ユーザの視聴を検出したときの動作を示すフローチャート図である。 本発明の第3の実施の形態において、ユーザの検索を検出したときの動作を示すフローチャート図である。 コンテンツを分類配置する従来技術の概念を説明するための構成例を示す図である。 図22の処理の流れを示すフローチャート図である。 記録されたコンテンツ間の類似度が全体的に乏しい場合に表示されるコンテンツの空間配置例である。 少数のコンテンツで構成された多数のコンテンツグループが発生する例を示す図である。 特定の位置に多数のコンテンツを含む、極少数のコンテンツグループが生じる例を示す図である。
符号の説明
A…コンテンツ抽出装置、2…コンテンツDB、6a…マップ作成処理部、6b…2次元座標算出処理部、6c…概念ベクトル算出処理部、7…コンテンツ抽出部、7a…配置座標取得部、7b…候補確認部、7c…重心絞込み部、20…表示部、21…行動検出部。

Claims (30)

  1. コンテンツ間の類似度を基に、コンテンツ空間上における配置情報を持つ複数のコンテンツから、コンテンツを探すコンテンツ抽出装置であって、
    あるコンテンツと所定の類似度を持つ複数のコンテンツを前記類似度と対応関係を持つ前記コンテンツ空間における距離に基づいて、ある数(n個)のコンテンツを抽出することを可能にするコンテンツ抽出部と、
    前記コンテンツ抽出部により抽出されたコンテンツを表示部に表示する制御部と
    を有することを特徴とするコンテンツ抽出装置。
  2. 前記制御部は、前記表示部に前記コンテンツのサムネイルを表示することを特徴とする請求項1に記載のコンテンツ抽出装置。
  3. ある数(n個)のコンテンツを抽出する重心絞込み部を備え、
    該重心絞込み部は、
    コンテンツの配置座標を用いて、あるコンテンツと前記コンテンツ空間における距離が同程度の複数のコンテンツ群を前記コンテンツ空間においてn分割し、
    分割した各領域の重心を求め、
    該重心に位置するコンテンツをn個抽出する第1の方法によりコンテンツを抽出することを特徴とする請求項1又は2に記載のコンテンツ抽出装置。
  4. 前記重心絞込み部は、
    ある数(n個)のコンテンツを抽出する第2の方法として、
    コンテンツの配置座標を用いて、あるコンテンツを基に、前記コンテンツ空間におけるn種類の距離によって分類される複数のコンテンツ群を求め、
    さらに、前記複数のコンテンツ群のそれぞれが含まれる各領域をm分割し、
    n×m分割された各領域の重心を求め、
    該重心に位置するコンテンツをn個抽出する
    ことを特徴とする請求項3に記載のコンテンツ抽出装置。
  5. 前記ある数(n個)のコンテンツを抽出する手段として、
    コンテンツにユーザの視聴行動を反映する評価値を付与するコンテンツ評価値演算部と、
    その評価値を基にn個のコンテンツを抽出する評価値絞込み部を備え、
    前記コンテンツ評価値演算部は、ユーザがあるコンテンツを視聴すると、当該コンテンツの評価値を上げると共に、そのコンテンツと類似度(距離)が同じかあるいは近傍のコンテンツの評価値を上げる、すなわち、視聴したコンテンツとの距離が遠いほど評価値が小さくなるようにすることを特徴とし、
    前記評価値絞込み部は、あるコンテンツと類似度(距離)が同じ複数のコンテンツの中から、評価値を基にコンテンツ(n個)を抽出する
    ことを特徴とする請求項1又は2に記載のコンテンツ抽出装置。
  6. 前記評価値絞込み部は、
    あるコンテンツと前記コンテンツ空間における距離が同程度のコンテンツ群の中から、評価値の上位n個のコンテンツを抽出することを特徴とする請求項5に記載のコンテンツ抽出装置。
  7. 前記評価値絞込み部は、
    あるコンテンツと前記コンテンツ空間における距離が同程度のコンテンツ群をn分割し、該分割された各領域における評価値が最大のコンテンツを計n個だけ抽出することを特徴とする請求項5に記載のコンテンツ抽出装置。
  8. 前記評価値絞込み部は、
    あるコンテンツと前記コンテンツ空間における距離が同程度のコンテンツ群をn分割し、評価値がある閾値を超えるコンテンツを含む領域においてのみ、評価値が最大のコンテンツをn個を越えない範囲で抽出することを特徴とする請求項5に記載のコンテンツ抽出装置。
  9. 前記評価値絞込み部は、
    あるコンテンツを基に前記コンテンツ空間における距離別に分類した複数のコンテンツの中から、評価値を基にコンテンツをn個だけ抽出することを特徴とする請求項5に記載のコンテンツ抽出装置。
  10. 前記評価値絞込み部は、
    あるコンテンツを基に分類した前記コンテンツ空間における距離別の各コンテンツ群から、評価値が上位のコンテンツを計n個だけ抽出することを特徴とする請求項5に記載のコンテンツ抽出装置。
  11. 前記評価値絞込み部は、
    あるコンテンツを基に、前記コンテンツ空間における距離別に、コンテンツ群をn分割し、分割された各領域において評価値が最大のコンテンツを計n個だけ抽出することを特徴とする請求項5に記載のコンテンツ抽出装置。
  12. 前記評価値絞込み部は、
    あるコンテンツと類似度(距離)が同じコンテンツ群をn分割し、評価値がある閾値を超えるコンテンツを含む領域においてのみ、評価値が最大のコンテンツ(計最高n個)を抽出することを特徴とする請求項5に記載のコンテンツ抽出装置。
  13. 前記評価値絞込み部は、
    評価値で形成される分布の固まり(n個)毎に重心位置を求め、
    その重心に位置するコンテンツ(計n個)を抽出する
    ことを特徴とする請求項5に記載のコンテンツ抽出装置。
  14. 前記コンテンツ評価値演算部は、
    コンテンツ評価値を算出する別の方法として、ユーザ行動をパタン毎に分けてコンテンツの評価値を算出し、ユーザ検索時の行動パタンに対応するパタン別の評価値を用いてコンテンツを抽出することを特徴とする請求項5に記載のコンテンツ抽出装置。
  15. 前記コンテンツ評価値演算部は、時間の経過と共に、元の値に戻るように演算されることを特徴とする請求項5に記載のコンテンツ抽出装置。
  16. 前記コンテンツ抽出部において、検索開始時または直前に視聴していたコンテンツを基に、類似度を求めることを特徴とする請求項1又は2に記載のコンテンツ抽出装置。
  17. ユーザがコンテンツを視聴しているか、あるいは、検索を行うかに関連するユーザの行動を検出する行動検出部と、
    コンテンツを蓄積するコンテンツDBと、
    該コンテンツDBに格納されているコンテンツに基づいて概念ベクトルを算出する概念ベクトル算出処理部と、
    各コンテンツの概念ベクトルに基づいて、全ての二つのコンテンツの組合せについて、コンテンツ間の距離を算出し、コンテンツの2次元平面上での位置情報を算出するn(nは、2以上の自然数)次元座標算出処理部を備えたコンテンツ配置座標演算部と、
    前記行動検出部においてコンテンツの検索が行われることが検出されると、前記n次元座標算出処理部で算出されたコンテンツの位置座標を基に、視聴候補となるコンテンツを抽出するコンテンツ抽出部と
    を備えることを特徴とするコンテンツ抽出装置。
  18. さらに、前記行動検出部において、ユーザがコンテンツを視聴していることを検出すると、当該コンテンツの評価値を上げると共に、そのコンテンツと類似度(距離)が同じかあるいは近傍のコンテンツの評価値を上げる、すなわち、視聴したコンテンツとの距離が遠いほど評価値が小さくなるようにするコンテンツ評価値演算部を有することを特徴とする請求項17に記載のコンテンツ抽出装置。
  19. 前記コンテンツ抽出部は、
    コンテンツ選択基準となるコンテンツKiから、n次元配置座標上での距離が所定の距離r±Δ1(Δ1は、0<Δ1≦r/2)の範囲に位置するコンテンツを、視聴候補のコンテンツとしてコンテンツDBから取得するコンテンツ候補取得部と、
    前記配置座標取得部で取得された視聴候補コンテンツの数Nが、予め設定した数nよりも多いか否かを判断するコンテンツ候補確認部と、
    コンテンツ数Nが所定数nよりも多いとき、n個に絞り込むために、距離r±Δ1の領域をn分割し、各分割領域のコンテンツ分布の重心位置を求め、その重心位置に最も近い位置に存在するコンテンツを抽出するコンテンツ絞込み部と
    を備えていることを特徴とする請求項17に記載のコンテンツ抽出装置。
  20. 前記コンテンツ絞込み部が、コンテンツ数Nが所定数nよりも多いとき、n個に絞り込むために、距離r±Δ1の領域に含まれるコンテンツの中から、予め設定したコンテンツ評価基準に基づき、評価値の上位n個のコンテンツを抽出することを特徴とする請求項17に記載のコンテンツ抽出装置。
  21. コンテンツ間の類似度を基に、コンテンツ空間上における配置情報を持つ複数のコンテンツから、コンテンツを探すコンテンツ抽出方法であって、
    あるコンテンツと所定の類似度を持つ複数のコンテンツを前記類似度と対応関係を持つ前記コンテンツ空間における距離に基づいて、ある数(n個)のコンテンツを抽出するステップと、
    抽出された前記コンテンツを表示するステップと
    を有することを特徴とするコンテンツ抽出方法。
  22. 前記コンテンツを抽出するステップは、ある数(n個)のコンテンツを抽出する重心絞込みステップを含み、
    該重心絞込みステップは、
    コンテンツの配置座標を用いて、あるコンテンツと前記コンテンツ空間における距離が同程度の複数のコンテンツ群を前記コンテンツ空間においてn分割するステップと、
    分割した各領域の重心を求めるステップと、
    該重心に位置するコンテンツをn個抽出する第1の方法によりコンテンツを抽出するステップと
    を有することを特徴とする請求項21に記載のコンテンツ抽出方法。
  23. 前記コンテンツを抽出するステップは、ある数(n個)のコンテンツを抽出する重心絞込みステップを含み、
    該重心絞込みステップは、ある数(n個)のコンテンツを抽出する第2の方法として、
    コンテンツの配置座標を用いて、あるコンテンツを基に、前記コンテンツ空間におけるn種類の距離によって分類される複数のコンテンツ群を求めるステップと、
    前記複数のコンテンツ群のそれぞれが含まれる各領域をm分割し、n×m分割された各領域の重心を求めるステップと、
    該重心に位置するコンテンツをn個抽出するステップと
    を有することを特徴とする請求項21に記載のコンテンツ抽出方法。
  24. 前記ある数(n個)のコンテンツを抽出するステップは、
    コンテンツにユーザの視聴行動を反映する評価値を付与するステップと、
    その評価値を基にある数(n個)のコンテンツを抽出するステップと、を含み、
    前記コンテンツを抽出するステップは、ユーザがあるコンテンツを視聴すると、当該コンテンツの評価値を上げると共に、そのコンテンツと類似度(距離)が同じかあるいは近傍のコンテンツの評価値を上げる、すなわち、視聴したコンテンツとの距離が遠いほど評価値が小さくなるようにすることを特徴とし、
    前記評価値を付与するステップは、あるコンテンツと類似度(距離)が同じ複数のコンテンツの中から、評価値を基にコンテンツ(n個)を抽出するステップを有することを特徴とする請求項21に記載のコンテンツ抽出方法。
  25. ユーザがコンテンツを視聴しているか、あるいは、検索を行うかに関連するユーザの行動を検出するステップと、
    コンテンツDBに格納されているコンテンツに基づいて概念ベクトルを算出するステップと、
    各コンテンツの概念ベクトルに基づいて、全ての二つのコンテンツの組合せについて、コンテンツ間の距離を算出し、コンテンツの2次元平面上での位置情報を算出するステップと、
    前記行動を検出するステップにおいてコンテンツの検索が行われることが検出されると、コンテンツの位置座標を基に、視聴候補となるコンテンツを抽出するステップと
    を備えることを特徴とするコンテンツ抽出方法。
  26. さらに、前記行動検出部において、ユーザがコンテンツを視聴していることを検出すると、当該コンテンツの評価値を上げると共に、そのコンテンツと類似度(距離)が同じかあるいは近傍のコンテンツの評価値を上げる、すなわち、視聴したコンテンツとの距離が遠いほど評価値が小さくなるようにするステップと
    を有することを特徴とする請求項25に記載のコンテンツ抽出方法。
  27. 前記コンテンツを抽出するステップは、
    コンテンツ選択基準となるコンテンツKiから、n次元配置座標上での距離が所定の距離r±Δ1(Δ1は、0<Δ1≦r/2)の範囲に位置するコンテンツを、視聴候補のコンテンツとしてコンテンツDBから取得するステップと、
    取得された視聴候補コンテンツの数Nが、予め設定した数nよりも多いか否かを判断するステップと、
    コンテンツ数Nが所定数nよりも多いとき、n個に絞り込むために、距離r±Δ1の領域をn分割し、各分割領域のコンテンツ分布の重心位置を求め、その重心位置に最も近い位置に存在するコンテンツを抽出するステップと
    を含むことを特徴とする請求項25に記載のコンテンツ抽出方法。
  28. コンテンツ数Nが所定数nよりも多いとき、n個に絞り込むために、距離r±Δ1の領域に含まれるコンテンツの中から、予め設定したコンテンツ評価基準に基づき、評価値の上位n個のコンテンツを抽出するステップを有することを特徴とする請求項25に記載のコンテンツ抽出方法。
  29. 請求項21から28までのいずれか1項に記載のステップをコンピュータに実行させるためのプログラム。
  30. 請求項29に記載のプログラムを記録するコンピュータ読みとり可能な記録媒体。
JP2006317476A 2006-11-24 2006-11-24 コンテンツ抽出装置、方法、プログラム、及び記録媒体 Expired - Fee Related JP4917412B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006317476A JP4917412B2 (ja) 2006-11-24 2006-11-24 コンテンツ抽出装置、方法、プログラム、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006317476A JP4917412B2 (ja) 2006-11-24 2006-11-24 コンテンツ抽出装置、方法、プログラム、及び記録媒体

Publications (2)

Publication Number Publication Date
JP2008130032A true JP2008130032A (ja) 2008-06-05
JP4917412B2 JP4917412B2 (ja) 2012-04-18

Family

ID=39555751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006317476A Expired - Fee Related JP4917412B2 (ja) 2006-11-24 2006-11-24 コンテンツ抽出装置、方法、プログラム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP4917412B2 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055431A (ja) * 2008-08-28 2010-03-11 Toshiba Corp 表示処理装置および表示処理方法
JP2010055425A (ja) * 2008-08-28 2010-03-11 Toshiba Corp 表示処理装置、プログラムおよび表示処理方法
WO2011010434A1 (ja) * 2009-07-23 2011-01-27 日本電気株式会社 情報提示システム、情報提示方法および記憶媒体
JP2011034366A (ja) * 2009-08-03 2011-02-17 Alpine Electronics Inc 車載オーディオ装置における選曲方法及び選曲装置
WO2011052526A1 (ja) * 2009-10-30 2011-05-05 楽天株式会社 特有コンテンツ判定プログラム、特有コンテンツ判定装置、特有コンテンツ判定方法、記録媒体、コンテンツ生成装置及び関連コンテンツ挿入装置
US8041155B2 (en) 2007-09-25 2011-10-18 Kabushiki Kaisha Toshiba Image display apparatus and computer program product
JP2012505452A (ja) * 2008-10-08 2012-03-01 エーイクスベー アセット マネージメント ゲーエムベーハー 情報エンティティの距離に応じた選択
US8174523B2 (en) 2008-08-28 2012-05-08 Kabushiki Kaisha Toshiba Display controlling apparatus and display controlling method
US8244738B2 (en) 2009-03-25 2012-08-14 Kabushiki Kaisha Toshiba Data display apparatus, method, and program
JP2012226704A (ja) * 2011-04-22 2012-11-15 Xing Inc 歌唱情報処理装置及び歌唱情報処理プログラム
US8466961B2 (en) 2007-09-25 2013-06-18 Kabushiki Kaisha Toshiba Apparatus and method for outputting video images, and purchasing system
WO2013136637A1 (ja) * 2012-03-14 2013-09-19 パナソニック株式会社 コンテンツ表示処理装置、コンテンツ表示処理方法、プログラム、及び集積回路
KR20140099341A (ko) * 2013-01-30 2014-08-12 에스케이플래닛 주식회사 디지털 컨텐츠 선택 경로 분석을 통한 연관 컨텐츠 추천 방법 및 그 장치
US8949741B2 (en) 2009-03-03 2015-02-03 Kabushiki Kaisha Toshiba Apparatus and method for presenting content
US10614134B2 (en) 2009-10-30 2020-04-07 Rakuten, Inc. Characteristic content determination device, characteristic content determination method, and recording medium

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01195578A (ja) * 1988-01-29 1989-08-07 Nec Corp 電子化文書検索装置
JPH06124309A (ja) * 1992-10-14 1994-05-06 Hitachi Ltd 情報サービスシステムおよび放送受信システム
JPH08249352A (ja) * 1995-03-15 1996-09-27 Omron Corp 画像検索方法及び装置
JPH10162027A (ja) * 1996-11-29 1998-06-19 Sony Corp 情報検索方法及びその装置
JP2003323454A (ja) * 2001-11-16 2003-11-14 Nippon Telegr & Teleph Corp <Ntt> メタ情報を有するコンテンツをマッピングする方法、装置、及びコンピュータプログラム
JP2005004727A (ja) * 2003-05-21 2005-01-06 Konica Minolta Holdings Inc 検索装置、検索方法及びプログラム
JP2005049968A (ja) * 2003-07-30 2005-02-24 Seiko Epson Corp 画像管理装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01195578A (ja) * 1988-01-29 1989-08-07 Nec Corp 電子化文書検索装置
JPH06124309A (ja) * 1992-10-14 1994-05-06 Hitachi Ltd 情報サービスシステムおよび放送受信システム
JPH08249352A (ja) * 1995-03-15 1996-09-27 Omron Corp 画像検索方法及び装置
JPH10162027A (ja) * 1996-11-29 1998-06-19 Sony Corp 情報検索方法及びその装置
JP2003323454A (ja) * 2001-11-16 2003-11-14 Nippon Telegr & Teleph Corp <Ntt> メタ情報を有するコンテンツをマッピングする方法、装置、及びコンピュータプログラム
JP2005004727A (ja) * 2003-05-21 2005-01-06 Konica Minolta Holdings Inc 検索装置、検索方法及びプログラム
JP2005049968A (ja) * 2003-07-30 2005-02-24 Seiko Epson Corp 画像管理装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8466961B2 (en) 2007-09-25 2013-06-18 Kabushiki Kaisha Toshiba Apparatus and method for outputting video images, and purchasing system
US8041155B2 (en) 2007-09-25 2011-10-18 Kabushiki Kaisha Toshiba Image display apparatus and computer program product
JP2010055425A (ja) * 2008-08-28 2010-03-11 Toshiba Corp 表示処理装置、プログラムおよび表示処理方法
US8527899B2 (en) 2008-08-28 2013-09-03 Kabushiki Kaisha Toshiba Display processing apparatus, display processing method, and computer program product
JP4675995B2 (ja) * 2008-08-28 2011-04-27 株式会社東芝 表示処理装置、プログラムおよび表示処理方法
JP2010055431A (ja) * 2008-08-28 2010-03-11 Toshiba Corp 表示処理装置および表示処理方法
US8174523B2 (en) 2008-08-28 2012-05-08 Kabushiki Kaisha Toshiba Display controlling apparatus and display controlling method
JP2012505452A (ja) * 2008-10-08 2012-03-01 エーイクスベー アセット マネージメント ゲーエムベーハー 情報エンティティの距離に応じた選択
KR101358321B1 (ko) 2008-10-08 2014-02-04 이엑스비 에셋 매니지먼트 게엠베하 정보 엔티티의 거리 종속적 선택
US8949741B2 (en) 2009-03-03 2015-02-03 Kabushiki Kaisha Toshiba Apparatus and method for presenting content
US8244738B2 (en) 2009-03-25 2012-08-14 Kabushiki Kaisha Toshiba Data display apparatus, method, and program
JPWO2011010434A1 (ja) * 2009-07-23 2012-12-27 日本電気株式会社 情報提示システム及び情報提示方法
WO2011010434A1 (ja) * 2009-07-23 2011-01-27 日本電気株式会社 情報提示システム、情報提示方法および記憶媒体
JP2011034366A (ja) * 2009-08-03 2011-02-17 Alpine Electronics Inc 車載オーディオ装置における選曲方法及び選曲装置
WO2011052526A1 (ja) * 2009-10-30 2011-05-05 楽天株式会社 特有コンテンツ判定プログラム、特有コンテンツ判定装置、特有コンテンツ判定方法、記録媒体、コンテンツ生成装置及び関連コンテンツ挿入装置
US10614134B2 (en) 2009-10-30 2020-04-07 Rakuten, Inc. Characteristic content determination device, characteristic content determination method, and recording medium
JP2012226704A (ja) * 2011-04-22 2012-11-15 Xing Inc 歌唱情報処理装置及び歌唱情報処理プログラム
WO2013136637A1 (ja) * 2012-03-14 2013-09-19 パナソニック株式会社 コンテンツ表示処理装置、コンテンツ表示処理方法、プログラム、及び集積回路
JPWO2013136637A1 (ja) * 2012-03-14 2015-08-03 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America コンテンツ表示処理装置、コンテンツ表示処理方法、プログラム、及び集積回路
KR20140099341A (ko) * 2013-01-30 2014-08-12 에스케이플래닛 주식회사 디지털 컨텐츠 선택 경로 분석을 통한 연관 컨텐츠 추천 방법 및 그 장치
KR102088656B1 (ko) 2013-01-30 2020-04-14 에스케이플래닛 주식회사 디지털 컨텐츠 선택 경로 분석을 통한 연관 컨텐츠 추천 방법 및 그 장치

Also Published As

Publication number Publication date
JP4917412B2 (ja) 2012-04-18

Similar Documents

Publication Publication Date Title
JP4917412B2 (ja) コンテンツ抽出装置、方法、プログラム、及び記録媒体
US10394878B2 (en) Associating still images and videos
JP6328761B2 (ja) 画像ベース検索
KR101659097B1 (ko) 복수의 저장된 디지털 이미지들을 탐색하기 위한 방법 및 장치
JP4902499B2 (ja) 画像表示装置、画像表示方法、および画像表示システム
US7769771B2 (en) Searching a document using relevance feedback
KR102206184B1 (ko) 동영상 내 객체 관련 정보 검색 방법 및 동영상 재생 장치
JP5121917B2 (ja) 画像検索装置、画像検索方法及びプログラム
JP2009509215A (ja) 画像データベースでのナビゲーション、視覚化、及びクラスタ化のための相互ランク類似度空間
JP4374902B2 (ja) 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
Stober et al. Musicgalaxy: A multi-focus zoomable interface for multi-facet exploration of music collections
US20210165818A1 (en) Image searching apparatus, image searching method, and storage medium
KR102592904B1 (ko) 영상 요약 장치 및 방법
JP2011128773A (ja) 画像検索装置、画像検索方法及びプログラム
JP5014479B2 (ja) 画像検索装置、画像検索方法及びプログラム
KR100644016B1 (ko) 동영상 검색 시스템 및 방법
JP5356289B2 (ja) 画像検索システム
JP2005525606A (ja) 階層的な画像特徴ベースの視覚化方法
JP2007323319A (ja) 類似検索処理方法及び装置及びプログラム
JP6764992B2 (ja) 検索システム、検索方法、及びプログラム
US11341660B1 (en) Feature based image detection
US20160162752A1 (en) Retrieval apparatus, retrieval method, and computer program product
KR101941693B1 (ko) 내용 기반 이미지 검색방법 및 그에 따른 시스템
JP4692784B2 (ja) 画像記述システムにおける特徴量選択プログラム、特徴量選択方法および装置
EP3109777A1 (en) Object classification device and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110816

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120126

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees