JP2010206729A - ダイジェスト再生装置、ダイジェスト再生方法、およびプログラム - Google Patents

ダイジェスト再生装置、ダイジェスト再生方法、およびプログラム Download PDF

Info

Publication number
JP2010206729A
JP2010206729A JP2009052674A JP2009052674A JP2010206729A JP 2010206729 A JP2010206729 A JP 2010206729A JP 2009052674 A JP2009052674 A JP 2009052674A JP 2009052674 A JP2009052674 A JP 2009052674A JP 2010206729 A JP2010206729 A JP 2010206729A
Authority
JP
Japan
Prior art keywords
frame
cluster
frames
clusters
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009052674A
Other languages
English (en)
Inventor
Noboru Murabayashi
昇 村林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2009052674A priority Critical patent/JP2010206729A/ja
Publication of JP2010206729A publication Critical patent/JP2010206729A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

【課題】類似度に応じて各クラスタに適切に分類されたフレームに基づいて、コンテンツのダイジェストを効果的に再生可能な、ダイジェスト再生装置、ダイジェスト再生方法、およびプログラムを提供する。
【解決手段】コンテンツを構成する複数のフレームからなるフレーム系列について、各フレームの特徴量を抽出する特徴量抽出部105と、各フレームの特徴量に基づいて、互いに異なるクラスタ数kで、複数のフレームをクラスタリングするクラスタリング処理部107と、各クラスタ数のクラスタリング結果を評価し、特定のクラスタ数のクラスタリング結果を選択するクラスタリング評価・選択部109と、選択されたクラスタリング結果に基づいて、各クラスタの代表フレーム区間を選択するフレーム区間選択部111と、各クラスタの代表フレーム区間に含まれる1以上のフレームを、コンテンツのダイジェストとして再生するフレーム再生部115と、を備える。
【選択図】図1

Description

本発明は、ダイジェスト再生装置、ダイジェスト再生方法、およびプログラムに関する。
従来、コンテンツを構成する複数の画像および/またはフレームからなるフレーム系列について、複数のフレームをクラスタに分類し、各クラスタに含まれるフレームを用いてコンテンツのダイジェストを再生する、ダイジェスト再生方法が知られている。ダイジェスト再生方法では、各フレームから抽出される特徴量に基づいて、フレーム同士の類似度が判定され、類似度の高いフレームが同一のクラスタに分類される。
ここで、ダイジェスト再生方法では、最短距離法等の階層的クラスタリング手法、k−平均法等の非階層的クラスタリング手法が用いられる。階層的クラスタリング手法では、フレーム系列に含まれるフレーム同士の類似度に応じて、ある程度適応的にクラスタ数が設定される。一方、非階層的クラスタリング手法では、フレーム系列に含まれるフレーム同士の類似度にかかわらずに、クラスタ数が予め設定されてしまう場合がある。
特開2006−345270号公報
このため、フレーム系列に応じては、類似度の低いフレームが同一クラスタに分類され、または類似度の高いフレームが互いに異なるクラスタに分類されてしまう場合がある。この場合、複数のフレームが類似度に応じて各クラスタに適切に分類されていないので、各クラスタに含まれるフレームを用いてコンテンツのダイジェストを効果的に再生することができなかった。
そこで、本発明は、類似度に応じて各クラスタに適切に分類されたフレームに基づいて、コンテンツのダイジェストを効果的に再生可能な、ダイジェスト再生装置、ダイジェスト再生方法、およびプログラムを提供するものである。
本発明の第1の観点によれば、コンテンツを構成する複数のフレームからなるフレーム系列について、各フレームの特徴量を抽出する特徴量抽出部と、各フレームの特徴量に基づいて、互いに異なるクラスタ数で、複数のフレームをクラスタリングするクラスタリング処理部と、各クラスタ数のクラスタリング結果を評価し、特定のクラスタ数のクラスタリング結果を選択するクラスタリング評価・選択部と、選択されたクラスタリング結果に基づいて、各クラスタの代表フレーム区間を選択するフレーム区間選択部と、各クラスタの代表フレーム区間に含まれる1以上のフレームを、コンテンツのダイジェストとして再生するフレーム再生部と、を備える、ダイジェスト再生装置が提供される。
かかる構成によれば、ダイジェスト再生装置は、コンテンツを構成する複数のフレームを、各フレームの特徴量に基づいて、互いに異なるクラスタ数でクラスタリングし、各クラスタ数のクラスタリング結果を評価し、特定のクラスタ数のクラスタリング結果を選択する。そして、ダイジェスト再生装置は、選択されたクラスタリング結果に基づいて、各クラスタの代表フレーム区間を選択し、代表フレーム区間に含まれる1以上のフレームをコンテンツのダイジェストとして再生する。これにより、各クラスタ数のクラスタリング結果を評価することで、複数のフレームが類似度に応じて適切に分類されているクラスタリング結果を選択することができる。よって、類似度に応じて各クラスタに適切に分類されたフレームに基づいて、コンテンツのダイジェストを効果的に再生することができる。
また、本発明の第2の観点によれば、コンテンツを構成する複数のフレームからなるフレーム系列について、各フレームの特徴量を抽出するステップと、各フレームの特徴量に基づいて、互いに異なるクラスタ数で、複数のフレームをクラスタリングするステップと、各クラスタ数のクラスタリング結果を評価し、特定のクラスタ数のクラスタリング結果を選択するステップと、選択されたクラスタリング結果に基づいて、各クラスタの代表フレーム区間を選択するステップと、各クラスタの代表フレーム区間に含まれる1以上のフレームを、コンテンツのダイジェストとして再生するステップと、を含む、ダイジェスト再生方法が提供される。
かかる方法によれば、各クラスタ数のクラスタリング結果を評価することで、複数のフレームが類似度に応じて適切に分類されているクラスタリング結果を選択することができる。よって、類似度に応じて各クラスタに適切に分類されたフレームに基づいて、ダイジェストを効果的に再生することができる。
また、本発明の第3の観点によれば、第2の観点によるダイジェスト再生方法をコンピュータに実行させるためのプログラムが提供される。
以上説明したように本発明によれば、類似度に応じて各クラスタに適切に分類されたフレームに基づいて、コンテンツのダイジェストを効果的に再生可能な、ダイジェスト再生装置、ダイジェスト再生方法、およびプログラムを提供することができる。
本発明の実施形態に係るダイジェスト再生方法の手順を示すフロー図である。 ダイジェスト再生方法の実施例を示す図である。 本発明の実施形態に係るダイジェスト再生装置の機能構成例を示すブロック図である。 クラスタリングに関連する処理の手順を示すフロー図である。 クラスタ数の範囲設定テーブルの例を示す図である。 クラスタリング結果の評価処理例を概念的に示す図である。 クラスタリング結果の評価処理例を概念的に示す図である。 ダイジェスト再生に関連する処理の手順を示すフロー図である。 代表フレーム区間の選択処理例を示す図である。 再生モードA、Bのダイジェスト再生処理例を示す図である。 再生モードC、Dのダイジェスト再生処理例を示す図である。
以下に、添付した図面を参照しながら、本発明の好適な実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
[1.ダイジェスト再生方法の概要]
まず、図1および図2を参照しながら、本発明の実施形態に係るダイジェスト再生方法の概要について説明する。図1は、本発明の実施形態に係るダイジェスト再生方法の手順を示すフロー図である。図2は、ダイジェスト再生方法の実施例を示す図である。
ダイジェスト再生方法は、コンテンツを構成する複数のフレームからなるフレーム系列について、複数のフレームをクラスタに分類し、各クラスタの代表フレーム区間に含まれる1以上のフレームを、コンテンツのダイジェストとして再生するものである。
ここで、コンテンツは、複数の画像フレームおよび音声フレーム、または複数の画像フレームのみから構成される画像(映像)コンテンツでもよく、複数の音声フレームのみから構成される音声コンテンツでもよい。以下では、説明の便宜上、複数の画像フレームのみからなる画像コンテンツを想定して、ダイジェスト再生方法の概要について説明する。
図1に示すように、ダイジェスト再生方法では、まず、コンテンツを構成する各フレームの特徴量が抽出される(ステップS11)。次に、各フレームの特徴量に基づいて、互いに異なるクラスタ数kで、複数のフレームがクラスタリングされる(S13)。次に、各クラスタ数kのクラスタリング結果が評価され、特定のクラスタ数koptのクラスタリング結果が選択される(S15)。次に、選択されたクラスタリング結果に基づいて、各クラスタの代表フレーム区間が選択される(S17)。そして、各クラスタの代表フレーム区間に含まれる1以上のフレームがコンテンツのダイジェストとして再生される(S19)。
図2に示す実施例では、複数のフレーム(画像フレーム)からなるフレーム系列を有するコンテンツのダイジェストを再生する場合が示されている。ここで、説明の便宜上、複数のフレームは、フレーム区間f1〜f10に区分されている。また、フレーム画像は、ハッチングパターンとして簡略的に表されている。複数のフレームは、各フレームの特徴量に基づいて、互いに異なるクラスタ数k=3、4、5でクラスタリングされている。ここで、複数のフレームは、各フレームの特徴量に基づいて、フレーム同士の類似度が判定され、各クラスタ数k=3、4、5に応じて、類似度の高いフレームが同一のクラスタに分類されている。
クラスタ数k=3のクラスタリングでは、フレーム区間f1〜f4、フレーム区間f5、f6、およびフレーム区間f7〜f10に含まれるフレームがクラスタ1、2、および3に各々に分類されている。クラスタ数k=4のクラスタリングでは、フレーム区間f1〜f4、フレーム区間f5、f6、フレーム区間f7、f8、およびフレーム区間f9、f10に含まれるフレームがクラスタ1、2、3、および4に各々に分類されている。クラスタ数k=5のクラスタリングでは、フレーム区間f1、f2、フレーム区間f3、f4、フレーム区間f5、f6、フレーム区間f7、f8、およびフレーム区間f9、f10に含まれるフレームがクラスタ1、2、3、4、および5に各々に分類されている。
クラスタ数k=3、4、5のクラスタリング結果の評価値Ecは、Ec3=0.7、Ec4=0.8、およびEc5=0.9として各々に算定されている。ここで、クラスタリング結果の評価値Ecは、複数のフレームが類似度に応じて適切に分類されているほど、大きな値として算定される。このため、フレーム区間f1〜f10に含まれるフレームが類似度に応じて適切に分類されているクラスタリング結果として、k=5のクラスタリング結果が選択される。
そして、クラスタ数k=5のクラスタリング結果に基づいて、クラスタ1〜5に含まれるフレーム区間f1〜f10から、例えば、フレーム区間f1、f3、f5、f7、およびf9がクラスタ1、2、3、4、および5の代表フレーム区間として各々に選択され、各クラスタの代表フレーム区間に含まれるフレームがコンテンツのダイジェストとして再生される。
これにより、各クラスタ数のクラスタリング結果を評価することで、複数のフレームが類似度に応じて適切に分類されているクラスタリング結果を選択することができる。よって、類似度に応じて各クラスタに適切に分類されたフレームに基づいて、コンテンツのダイジェストを効果的に再生することができる。
[2.ダイジェスト再生装置の機能構成]
次に、図3を参照しながら、本発明の実施形態に係るダイジェスト再生装置の主要な機能構成について説明する。図3は、ダイジェスト再生装置の機能構成例を示すブロック図である。ここで、ダイジェスト再生装置は、例えば、画像および/または音声フレームの記録再生機能を有する、ビデオレコーダ、ビデオカメラ、サウンドレコーダ、テレビジョン受信機、パーソナルコンピュータ、携帯電話機等である。以下では、放送コンテンツの画像および音声フレームの記録再生機能を有するビデオレコーダ100を想定して、ダイジェスト再生装置の主要な機能構成について説明する。
図3に示すように、ビデオレコーダ100は、チューナ部101、フレーム処理部103、特徴量抽出部105、クラスタリング処理部107、クラスタリング評価・選択部109、フレーム区間選択部111、フレーム記録部113、フレーム再生部115、出力部117、操作I/F部119、制御部121を含んで構成される。また、ビデオレコーダ100は、特徴量抽出結果保持部123、クラスタリング結果保持部125、クラスタリング評価結果保持部127、フレーム区間選択結果保持部129を含んで構成される。
チューナ部101は、アンテナ131等を通じて、所定の放送チャンネル上で放送されているコンテンツの画像(映像)・音声信号およびコンテンツ情報信号(EPG信号等)を選択的に受信し、信号処理を施した上で、フレーム処理部103に供給する。また、チューナ部101は、EPG信号からコンテンツの区分を示す信号を抽出し、制御部121に供給する。
フレーム処理部103は、チューナ部101から供給される画像信号および音声信号を画像フレームおよび音声フレームに区分し、特徴量抽出部105およびフレーム記録部113に供給する。また、フレーム処理部103は、フレームに区分された画像・音声信号を、画像・音声データに変換した上で、特徴量抽出部105およびフレーム記録部113に供給してもよい。また、フレーム処理部103は、EPG信号をEPGフレームに区分し、フレーム記録部113に供給してもよい。ここで、画像・音声信号およびEPG信号は、同一の時間単位でフレームに区分される。なお、以下では、フレームに区分された画像・音声信号または画像・音声データ、EPG信号またはEPGデータを、画像・音声フレーム、EPGフレームとも称する。
特徴量抽出部105は、フレーム処理部103から供給される画像・音声フレームから、所定の特徴量を抽出し、画像・音声フレームに関連付けて特徴量抽出結果保持部123に供給する。ここで、画像フレームの特徴量は、例えば、フレームに区分された画像信号が表す輝度、色差等に基づいて、多次元の特徴ベクトルとして抽出される。音声フレームの特徴量は、フレームに区分された音声信号の基本周波数、音声スペクトル等に基づいて、多次元の特徴ベクトルとして抽出される。画像・音声フレームの特徴量は、フレーム同士の類似度を判定するために用いられる。
クラスタリング処理部107は、画像・音声フレームの特徴量に基づいて、互いに異なるクラスタ数kで、画像・音声フレームをクラスタリングする。クラスタリング処理部107は、特徴量抽出結果保持部123から画像・音声フレームの特徴量を読出し、特徴量に基づいて画像・音声フレームをクラスタリングし、クラスタリング結果をクラスタリング結果保持部125に供給する。
ここで、クラスタリング処理部107は、画像または音声フレームのいずれか一方をメインフレーム、他方をサブフレームとして取扱うことが好ましい。クラスタリング処理部107は、画像・音声フレームの特徴量に基づいて、メインフレームをクラスタリングし、メインフレームのクラスタリング結果に対応するようにサブフレームを分類する。これにより、画像フレームおよび音声フレームは、フレームに含まれる画像信号および音声信号が互いにずれることなしに、互いの関係性が維持された状態で分類される。なお、クラスタリング処理部107は、画像・音声フレームのいずれか一方の特徴量に基づいて、メインフレームおよびサブフレームを分類してもよい。
ここで、詳細は後述するが、互いに異なるクラスタ数kは、コンテンツの区分に応じてクラスタ数kの範囲k1〜knとして設定される。よって、クラスタリング結果保持部125には、コンテンツを構成する複数の画像・音声フレームを、フレームの類似度に応じて、クラスタ数k1〜knの各クラスタ(クラスタ1〜k1、1〜k1+1、・・・、1〜kn)に分類した結果が保持されることになる。
クラスタリング評価・選択部109は、各クラスタ数kのクラスタリング結果を評価し、特定のクラスタ数koptのクラスタリング結果を選択する。クラスタリング評価・選択部109は、クラスタリング結果保持部125から各クラスタ数kのクラスタリング結果を読出して評価値Eckを算定し、評価値Eckに基づいて、特定のクラスタ数koptのクラスタリング結果を選択する。これにより、詳細は後述するが、コンテンツを構成する複数の画像・音声フレームが類似度に応じて適切に分類されている最適なクラスタリング結果が選択される。また、クラスタリング評価・選択部109は、クラスタリング結果の評価結果をクラスタリング評価結果保持部127に供給する。
フレーム区間選択部111は、選択されたクラスタリング結果に基づいて、各クラスタの代表フレーム区間を選択する。フレーム区間選択部111は、クラスタリング結果保持部125から、選択されたクラスタリング結果を読出し、各クラスタに含まれる画像・音声フレームから、詳細は後述するが、所定の基準に従って代表フレーム区間を選択する。フレーム区間選択部111は、各クラスタの代表フレーム区間を示すフレーム区間選択情報をフレーム区間選択結果保持部129に供給する。
フレーム記録部113は、フレーム処理部103から供給される画像・音声フレームに区分された画像・音声信号(または画像・音声信号データ)、および選択的にEPGフレームに区分されたEPG信号(またはEPGデータ)を記録する。
フレーム再生部115は、コンテンツを構成するフレームの画像・音声信号、および選択的にEPG信号を再生する。フレーム再生部115は、特に、クラスタリング結果に基づいて選択された、各クラスタの代表フレーム区間に含まれる1以上のフレームをコンテンツのダイジェストとして再生する。フレーム再生部115は、フレーム区間選択結果保持部129からフレーム区間選択情報を読出し、フレーム区間選択情報に基づいて、フレーム記録部113から各クラスタの代表フレーム区間に含まれる画像・音声信号を読出す。フレーム再生部115は、代表フレーム区間に含まれる画像・音声信号を再生処理し、再生処理結果を出力部117に供給する。なお、フレーム再生部115は、代表フレーム区間に含まれるEPG信号を読出し、出力部117に供給してもよい。
出力部117は、フレームの画像・音声信号に相当する画像・音声情報、および選択的にEPG信号に相当するEPG情報を画像(映像)表示装置、音声出力装置等に出力する。出力部117は、特に、各クラスタの代表フレーム区間に含まれる画像・音声信号に相当する画像・音声情報を画像(映像)表示装置、音声出力装置等に出力する。
操作I/F部119は、放送チャンネルの選局処理、コンテンツの記録・再生処理等に関する操作情報をユーザから取得する。操作I/F部119は、ビデオレコーダ100本体に設けられた操作ボタン・操作キー等でもよく、不図示のコントローラから操作信号を受信する操作信号受信部でもよい。また、操作I/F部119は、ビデオレコーダ100の動作状態等を出力するインジケータを含んでもよい。
制御部121は、CPU、ROM、RAM等を含み、ビデオレコーダ100の動作に必要な処理および各構成要素の制御を行う。CPUは、ダイジェスト再生処理プログラムをROMから読出し、RAM上に展開して実行する。RAMは、後述するクラスタ数の範囲設定テーブル等、ダイジェスト再生処理プログラムの実行に必要なパラメータを保持する。また、RAMは、特徴量抽出結果保持部123、クラスタリング結果保持部125、クラスタリング評価結果保持部127、フレーム区間選択結果保持部129の少なくともいずれかとして機能してもよい。
なお、ビデオレコーダ100の各構成要素は、汎用的な部材・回路により構成されてもよく、各構成要素の機能に特化したハードウェアにより構成されてもよい。また、各構成要素の機能のうち少なくとも一部は、CPU上で実行されるプログラムにより実現されてもよい。
[3.ダイジェスト再生方法]
[3−1.クラスタリングに関連する処理]
次に、図4〜図10を参照しながら、本発明の実施形態に係るダイジェスト再生方法について説明する。
まず、図4〜図7を参照しながら、クラスタリングに関連する処理について説明する。図4は、クラスタリングに関連する処理の手順を示すフロー図である。図5は、クラスタ数の範囲設定テーブルの例を示す図である。図6および図7は、クラスタリング結果の評価処理例を概念的に示す図である。
図4に示すように、チューナ部101は、所定の放送チャンネル上で放送されているコンテンツの画像・音声信号およびEPG信号を選択的に受信し、信号処理を施した上で、フレーム処理部103に供給する(ステップS101)。フレーム処理部103は、コンテンツの画像・音声信号を画像・音声フレームに区分し、フレームの順序を識別可能なフレームIDとともに、特徴量抽出部105およびフレーム記録部113に供給する。また、フレーム記録部113は、画像・音声フレームに区分された画像・音声信号をフレームIDとともに記録する。
特徴量抽出部105は、画像・音声フレームから所定の特徴量を抽出し、画像・音声フレームIDに関連付けて特徴量抽出結果保持部123に供給する(S103)。
制御部121は、コンテンツの区分に応じてクラスタ数kの範囲k1〜knを設定する。クラスタ数kの範囲は、経験則上、コンテンツの内容に応じて、例えば図5に示すようなテーブルとして設定される。クラスタ数の範囲は、スポーツコンテンツであれば、k=20〜30(野球)、k=10〜20(サッカー)に設定され、ニュースコンテンツであれば、k=10〜20に設定され、ドラマコンテンツであれば、k=40〜50に設定されている。これにより、コンテンツの区分に応じて適切に設定される数の各クラスタに、複数のフレームを類似度に応じて適切に分類することができる。
クラスタリング処理部107は、画像・音声フレームの特徴量に基づいて、互いに異なるクラスタ数kで、画像・音声フレームをクラスタリングする。クラスタリング処理部107は、クラスタ数kをk1〜knに順次に設定し、各クラスタ数kで画像・音声フレームをクラスタリングし、各クラスタ数kのクラスタリング結果をクラスタリング結果保持部125に供給する(S107〜S115)。クラスタリング結果は、クラスタ数k、クラスタ番号、フレームIDを関連付けたデータとなる。
クラスタリング評価・選択部109は、各クラスタ数kのクラスタリング結果を評価し、特定のクラスタ数koptのクラスタリング結果を選択する(S117〜S133)。クラスタリング評価・選択部109は、まず、クラスタ数kをk1に設定し(S117)、最大評価値Ecmaxを0、最適クラスタ数koptをk1に設定する(S119)。
クラスタリング評価・選択部109は、クラスタリング結果保持部125からクラスタ数kのクラスタリング結果を読出し(S121)、評価値Eckを算定する(S123)。クラスタリング評価・選択部109は、評価値Eckを最大評価値Ecmaxと比較し(S125)、評価値Eckが最大評価値Ecmaxより大きければ、最大評価値Ecmaxおよび最適クラスタ数koptを評価値Eckおよびクラスタ数kに各々に更新する(S127)。クラスタリング評価・選択部109は、クラスタ数kをインクリメントし(S129)、クラスタ数を判定する(S131)。クラスタリング評価・選択部109は、クラスタ数kがkn以下であれば、ステップS121の処理に復帰し、knを超えていれば、ステップS133の処理を行う。
そして、クラスタリング評価・選択部109は、ステップS121〜S131の処理を繰返し、各クラスタ数k1〜knのクラスタリング結果を順次に評価する。これにより、クラスタリング評価・選択部109は、クラスタリング結果の最大評価値Ecmaxを有する、最適クラスタ数koptのクラスタリング結果を、最適なクラスタリング結果として選択する(S133)。
ここで、クラスタリング結果は、最短距離法、最長距離法、群平均法等の階層的クラスタリング手法、k−平均法、ファジーc−平均法等の非階層的クラスタリング手法等のクラスタリング手法を用いて評価される。
一般的に、良好なクラスタリングとは、各クラスタに分類された集合要素同士の分散値が相対的に小さく、各クラスタ同士の距離が相対的に大きくなるようなクラスタリング結果をもたらすものであると考えられる。このため、クラスタの分散値およびクラスタ間の距離に基づいて、クラスタリング結果を評価することができる。
図6および図7には、非階層的クラスタリング手法による、クラスタリング結果の評価処理例が概念的に示されている。図6では、クラスタ数k=3のクラスタリング結果が示されている。ここで、vi(i=1〜3)およびci(i=1〜3)がクラスタ1〜3の分散値および中心を示し、callは、全クラスタの中心を示している。
クラスタの分散値は、全クラスタの分散値の総和Vallとして式1より求められ、クラスタ間の距離は、クラスタ間の評価指標Coとして式2より求められる。そして、クラスタリング結果の評価値Ecは、クラスタの分散値を示す指標Vallおよびクラスタ間の距離を示す指標Ecに基づいて、式3より求められる。なお、クラスタリング結果は、評価値Ecが大きいほど良好なクラスタリングとして評価される。
Vall=Σvi・・・(式1)
Co=Σ(ci−call)・・・(式2)
Ec=Co÷Vall・・・(式3)
図7では、クラスタ数k=2およびk=3のクラスタリング結果が対比して示されている。ここで、クラスタ数k=2のクラスタリング結果では、クラスタ数k=3のクラスタリングでクラスタ1および2に分類された集合要素が単一のクラスタ1´に分類されている。この場合、クラスタ数k=3のクラスタリング結果に対して、クラスタ1´に分類された集合要素同士の分散値v1´が相対的に大きく、クラスタ1´とクラスタ2の距離が相対的に小さくなる。よって、クラスタ数k=2のクラスタリング結果の評価値Ec2は、クラスタ数k=3のクラスタリング結果の評価値Ec3よりも小さくなってしまう。
クラスタリング評価・選択部109は、クラスタリングの評価結果をクラスタリング評価保持部に供給する。クラスタリング評価結果は、クラスタ数k、各クラスタの分散値、クラスタ間の距離、各クラスタ数のクラスタリング結果の評価値Eckを関連付けたデータとなる。
なお、上記説明では、全てのフレームを対象として、各フレームの特徴量を抽出し、特徴量に基づいて各フレームをクラスタリングする場合について説明した。しかし、全てのフレームを対象とする代わりに、例えばフレーム系列から10フレーム毎に抽出された区間フレームを対象として、各区間フレームの特徴量を抽出し、特徴量に基づいて区間フレームにより区分されたフレーム単位でクラスタリングしてもよい。
また、上記説明では、複数のフレームをクラスタ数k1〜knでクラスタリングした上で、クラスタリング結果の評価値Eckが最大となるクラスタリング結果を選択する場合について説明した。しかし、評価値の閾値を予め設定しておき、複数のフレームをクラスタ数k1〜knで順次にクラスタリングしながら、クラスタリング結果の評価値Eckを閾値と比較してもよい。この場合、クラスタリング処理は、クラスタリング結果の評価値Eckが閾値を超えた時点で打ち切られ、閾値を超える評価値Eckが得られたクラスタリング結果が選択されることになる。
[3−2.ダイジェスト再生に関連する処理]
次に、図8、図9、および図10A、10Bを参照しながら、ダイジェスト再生に関連する処理について説明する。図8は、ダイジェスト再生に関連する処理の手順を示すフロー図である。図9は、代表フレーム区間の選択処理例を示す図である。図10A、10Bは、再生モードA〜Dのダイジェスト再生処理例を示す図である。
図8に示すように、操作I/F部119は、不図示の再生処理メニュー等を通じて、再生モードの選択に関する操作情報をユーザから取得する(S151)。
制御部121は、選択された再生モードに応じて、ダイジェスト再生処理を行う。制御部121は、ステップS153の処理において、ダイジェスト再生処理が選択されると、ステップS155以降の処理でダイジェスト再生処理を行い、通常再生処理が選択されると、通常再生処理を行う。また、制御部121は、選択された再生モードに応じて、再生モードA〜Dでダイジェスト再生処理を行う。
ダイジェスト再生処理において、フレーム区間選択部111は、選択されたクラスタリング結果に基づいて、各クラスタに含まれる画像・音声フレームから、所定の基準に従って各クラスタの代表フレーム区間を選択する。フレーム区間選択部111は、まず、特徴量抽出結果保持部123から各フレームの特徴量を読出し、クラスタリング結果保持部125からクラスタ数koptのクラスタリング結果を読出す。フレーム区間選択部111は、クラスタのカウンタCkを1〜koptに順次に設定し、各クラスタに含まれる画像・音声フレームから、各クラスタの代表フレーム区間を選択する(S157〜S163)。そして、フレーム区間選択部111は、各クラスタの代表フレーム区間の選択結果をフレーム区間選択結果保持部129に供給する。フレーム区間選択結果は、クラスタ番号、各クラスタの代表フレーム区間を特定可能なフレームIDの組合せを関連付けたデータとなる。
図9には、代表フレーム区間の選択処理例が示されている。フレーム区間選択部111は、フレーム区間特徴量の評価値Efが所定の閾値Ethを越える1以上のフレーム区間を各クラスタの代表フレーム区間として選択する。なお、図9に示す例では、クラスタiのフレーム区間f1〜f7のうち、フレーム区間f2〜f4のフレーム区間特徴量の評価値Efが閾値Ethを越えているので、フレーム区間f2〜f4がクラスタiの代表フレーム区間として選択されている。
ここで、フレーム区間特徴量の評価値Efは、例えば、話者の音声レベル、カメラ特徴(パン、チルト、ズーム)の頻度、人物像の出現頻度等の指標に基づいて算定される。なお、カメラ特徴は、画像フレーム間における画像信号の変化から推定され、人物像の出現は、画像フレームの画像信号から検出される。フレーム区間特徴量の評価値Efは、単一の指標から求められてもよく、正規化された各指標を所定の重み付けで組合せて算定されてもよい。これにより、フレーム区間特徴量の評価値Efが所定の基準を満たす1以上のフレーム区間を、各クラスタの代表フレーム区間として適切に選択することができる。
本実施形態では、フレーム区間選択部111が特徴量抽出結果保持部123に保持されている各フレームの特徴量に基づいて、フレーム区間特徴量を算定し、1以上のフレーム区間を代表フレーム区間として選択する場合を想定している。しかし、特徴量抽出結果保持部123に保持されている特徴量と異なる指標を用いた特徴量に基づいて、フレーム区間特徴量を算定し、代表フレーム区間を選択する場合、不図示の第2の特徴量抽出部により各フレームまたはフレーム区間の特徴量が抽出されてもよい。
フレーム再生部115は、クラスタリング結果に基づいて選択された、各クラスタの代表フレーム区間に含まれる1以上のフレームをコンテンツのダイジェストとして再生する(S165)。フレーム再生部115は、フレーム区間選択結果保持部129からフレーム区間選択結果を読出す。フレーム再生部115は、フレーム区間選択結果に基づいて、代表フレーム区間に含まれる1以上のフレームに相当する画像・音声信号をフレーム記録部113から読出して再生処理し、再生処理結果を出力部117に供給する。そして、出力部117は、各クラスタの代表フレーム区間に含まれる1以上のフレームに相当する画像・音声情報を画像(映像)表示装置、音声出力装置等に出力する。
図10A、10Bには、再生モードA〜Dのダイジェスト再生処理例が示されている。なお、図10A、10Bでは、代表フレーム区間として選択されたフレーム区間にハッチングが施されている。再生モードAが選択されると(S155)、フレーム再生部115は、図10Aに示すように、クラスタの順序に従って代表フレーム区間に含まれるフレームを再生する。フレーム再生部115は、前述したように、各クラスタの代表フレーム区間を選択し(S157〜S163)、各クラスタの代表フレーム区間に含まれるフレームをコンテンツのダイジェストとして再生する(S165)。図10Aに示す例では、フレーム再生部115は、クラスタ1、2、3の順序に従って、各クラスタの代表フレーム区間f2、f5、f6、f7、f12、f13に含まれるフレームを再生する。
再生モードBが選択されると(S167)、フレーム再生部115は、図10Aに示すように、フレーム数nが相対的に多いクラスタの代表フレーム区間に含まれるフレームを優先的に再生する。フレーム再生部115は、クラスタリング結果保持部125に記録されているクラスタリング結果に基づいて、各クラスタに含まれるフレーム数nを特定し(S169)、フレーム数nに従って各クラスタを降順にソートする(S171)。そして、フレーム再生部115は、前述したように、各クラスタの代表フレーム区間を選択し(S157〜S163)、クラスタのソート結果に従って、各クラスタの代表フレーム区間に含まれるフレームをコンテンツのダイジェストとして再生する(S165)。
図10Aに示す例では、クラスタ1、2、3に含まれるフレーム数nの比が3、7、4であるので、フレーム再生部115は、クラスタ2、3、1の順序に従って、各クラスタの代表フレーム区間f5、f6、f7、f12、f13、f2に含まれるフレームを再生する。これにより、フレーム数nが相対的に多いクラスタの代表フレーム区間に含まれるフレームを優先的に再生することができる。よって、コンテンツの全体的な特徴を示すフレームを優先的に再生することができる。
再生モードCが選択されると(S173)、フレーム再生部115は、図10Bに示すように、フレーム同士の相関性Corが相対的に高いクラスタの代表フレーム区間に含まれるフレームを優先的に再生する。フレーム再生部115は、クラスタリング評価結果保持部127に保持されている各クラスタの分散値に基づいて、各クラスタに含まれるフレーム同士の相関性Corを特定し(S175)、フレーム同士の相関性Corに従って各クラスタを降順にソートする(S177)。そして、フレーム再生部115は、前述したように、各クラスタの代表フレーム区間を選択し(S157〜S163)、クラスタのソート結果に従って、各クラスタの代表フレーム区間に含まれるフレームをコンテンツのダイジェストとして再生する(S165)。
図10Bに示す例では、クラスタ1、2、3の相関性Corが0.7、0.6、0.8であるので、フレーム再生部115は、クラスタ3、1、2の順序に従って、各クラスタの代表フレーム区間f12、f13、f2、f5、f6、f7に含まれるフレームを再生する。これにより、フレーム同士の相関性Corが相対的に高いクラスタの代表フレーム区間に含まれるフレームを優先的に再生することができる。よって、コンテンツの要点部分となる特徴を示すフレームを優先的に再生することができる。
再生モードDが選択されると(S179)、フレーム再生部115は、図10Bに示すように、フレーム同士の相関性Corが相対的に低いクラスタの代表フレーム区間に含まれるフレームを優先的に再生する。フレーム再生部115は、クラスタリング評価結果保持部127に保持されている各クラスタの分散値に基づいて、各クラスタに含まれるフレーム同士の相関性Corを特定し(S181)、フレーム同士の相関性Corに従って各クラスタを昇順にソートする(S183)。そして、フレーム再生部115は、前述したように、各クラスタの代表フレーム区間を選択し(S157〜S163)、クラスタのソート結果に従って、各クラスタの代表フレーム区間に含まれるフレームをコンテンツのダイジェストとして再生する(S165)。
図10Bに示す例では、クラスタ1、2、3の相関性Corが0.7、0.6、0.8であるので、フレーム再生部115は、クラスタ2、1、3の順序に従って、各クラスタの代表フレーム区間f5、f6、f7、f2、f12、f13に含まれるフレームを再生する。これにより、フレーム同士の相関性Corが相対的に低いクラスタの代表フレーム区間に含まれるフレームを優先的に再生することができる。よって、コンテンツに含まれる変化の多い部分を示すフレームを優先的に再生することができる。
なお、フレーム再生部115は、再生モードBおよびCを組合せて、フレーム数nが相対的に多く、フレーム同士の相関性Corが相対的に高いクラスタの代表フレーム区間に含まれるフレームを優先的に再生してもよい。この場合、フレーム再生部115は、フレーム数nおよびフレーム同士の相関性Corを所定の重み付けで組合せて用いればよい。
[4.まとめ]
以上説明したように、本実施形態に係るダイジェスト再生方法によれば、ビデオレコーダ100は、コンテンツを構成する複数のフレームを、各フレームの特徴量に基づいて、互いに異なるクラスタ数kでクラスタリングし、各クラスタ数kのクラスタリング結果を評価し、特定のクラスタ数koptのクラスタリング結果を選択する。そして、ビデオレコーダ100は、選択されたクラスタリング結果に基づいて、各クラスタの代表フレーム区間を選択し、各クラスタの代表フレーム区間に含まれる1以上のフレームをコンテンツのダイジェストとして再生する。
これにより、各クラスタ数kのクラスタリング結果を評価することで、複数のフレームが類似度に応じて適切に分類されているクラスタリング結果を選択することができる。よって、類似度に応じて各クラスタに適切に分類されたフレームに基づいて、コンテンツのダイジェストを効果的に再生することができる。
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されない。当業者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
100 ビデオレコーダ
103 フレーム処理部
105 特徴量抽出部
107 クラスタリング処理部
109 クラスタリング評価・選択部
111 フレーム区間選択部
113 フレーム記録部
115 フレーム再生部

Claims (8)

  1. コンテンツを構成する複数のフレームからなるフレーム系列について、前記各フレームの特徴量を抽出する特徴量抽出部と、
    前記各フレームの特徴量に基づいて、互いに異なるクラスタ数で、前記複数のフレームをクラスタリングするクラスタリング処理部と、
    前記各クラスタ数のクラスタリング結果を評価し、特定のクラスタ数のクラスタリング結果を選択するクラスタリング評価・選択部と、
    前記選択されたクラスタリング結果に基づいて、前記各クラスタの代表フレーム区間を選択するフレーム区間選択部と、
    前記各クラスタの代表フレーム区間に含まれる1以上のフレームを、前記コンテンツのダイジェストとして再生するフレーム再生部と、
    を備える、ダイジェスト再生装置。
  2. 前記互いに異なるクラスタ数は、前記コンテンツの区分に応じて、所定の範囲に含まれる2以上のクラスタ数として設定される、請求項1に記載のダイジェスト再生装置。
  3. 前記フレーム区間選択部は、前記選択されたクラスタリング結果に基づいて、フレーム区間の特徴量の評価値が所定の基準を満たす1以上のフレーム区間を、前記各クラスタの代表フレーム区間として選択する、請求項1に記載のダイジェスト再生装置。
  4. 前記フレーム再生部は、前記フレームの数が相対的に多いクラスタから相対的に少ないクラスタの順序に従って、前記各クラスタの代表フレーム区間に含まれる1以上のフレームを再生する、請求項1に記載のダイジェスト再生装置。
  5. 前記フレーム再生部は、前記各クラスタに含まれる前記フレーム同士の相関性が相対的に高いクラスタから相対的に低いクラスタの順序に従って、前記各クラスタの代表フレーム区間に含まれる1以上のフレームを再生する、請求項1に記載のダイジェスト再生装置。
  6. 前記フレーム再生部は、前記各クラスタに含まれる前記フレーム同士の相関性が相対的に低いクラスタから相対的に高いクラスタの順序に従って、前記各クラスタの代表フレーム区間に含まれる1以上のフレームを再生する、請求項1に記載のダイジェスト再生装置。
  7. コンテンツを構成する複数のフレームからなるフレーム系列について、前記各フレームの特徴量を抽出するステップと、
    前記各フレームの特徴量に基づいて、互いに異なるクラスタ数で、前記複数のフレームをクラスタリングするステップと、
    前記各クラスタ数のクラスタリング結果を評価し、特定のクラスタ数のクラスタリング結果を選択するステップと、
    前記選択されたクラスタリング結果に基づいて、前記各クラスタの代表フレーム区間を選択するステップと、
    前記各クラスタの代表フレーム区間に含まれる1以上のフレームを、前記コンテンツのダイジェストとして再生するステップと、
    を含む、ダイジェスト再生方法。
  8. コンテンツを構成する複数のフレームからなるフレーム系列について、前記各フレームの特徴量を抽出するステップと、
    前記各フレームの特徴量に基づいて、互いに異なるクラスタ数で、前記複数のフレームをクラスタリングするステップと、
    前記各クラスタ数のクラスタリング結果を評価し、特定のクラスタ数のクラスタリング結果を選択するステップと、
    前記選択されたクラスタリング結果に基づいて、前記各クラスタの代表フレーム区間を選択するステップと、
    前記各クラスタの代表フレーム区間に含まれる1以上のフレームを、前記コンテンツのダイジェストとして再生するステップと、
    を含む、ダイジェスト再生方法をコンピュータに実行させるためのプログラム。
JP2009052674A 2009-03-05 2009-03-05 ダイジェスト再生装置、ダイジェスト再生方法、およびプログラム Withdrawn JP2010206729A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009052674A JP2010206729A (ja) 2009-03-05 2009-03-05 ダイジェスト再生装置、ダイジェスト再生方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009052674A JP2010206729A (ja) 2009-03-05 2009-03-05 ダイジェスト再生装置、ダイジェスト再生方法、およびプログラム

Publications (1)

Publication Number Publication Date
JP2010206729A true JP2010206729A (ja) 2010-09-16

Family

ID=42967716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009052674A Withdrawn JP2010206729A (ja) 2009-03-05 2009-03-05 ダイジェスト再生装置、ダイジェスト再生方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP2010206729A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012227645A (ja) * 2011-04-18 2012-11-15 Nikon Corp 画像処理プログラム、画像処理方法、画像処理装置、撮像装置
JP2013017494A (ja) * 2011-07-07 2013-01-31 Hitachi Medical Corp 生体光計測装置、波形解析方法
JP2013090119A (ja) * 2011-10-18 2013-05-13 Sony Corp 画像処理装置、画像処理方法、及び、プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012227645A (ja) * 2011-04-18 2012-11-15 Nikon Corp 画像処理プログラム、画像処理方法、画像処理装置、撮像装置
JP2013017494A (ja) * 2011-07-07 2013-01-31 Hitachi Medical Corp 生体光計測装置、波形解析方法
JP2013090119A (ja) * 2011-10-18 2013-05-13 Sony Corp 画像処理装置、画像処理方法、及び、プログラム

Similar Documents

Publication Publication Date Title
CN108184169B (zh) 视频播放方法、装置、存储介质及电子设备
JP4683031B2 (ja) 電子機器、コンテンツ分類方法及びそのプログラム
US6744922B1 (en) Signal processing method and video/voice processing device
US8290341B2 (en) Video playing device, video playing method, and video playing program having automatic video selections based upon user concentration
US20110243529A1 (en) Electronic apparatus, content recommendation method, and program therefor
JP4389973B2 (ja) 情報処理装置および方法、並びにプログラム
Han et al. An integrated baseball digest system using maximum entropy method
US20110106531A1 (en) Program endpoint time detection apparatus and method, and program information retrieval system
US20100008641A1 (en) Electronic apparatus, video content editing method, and program
WO2000045604A1 (en) Signal processing method and video/voice processing device
JP2009536490A (ja) ユーザの関連フィードバックによりビデオのサマリを更新する方法
CN109783656A (zh) 音视频数据的推荐方法、系统及服务器和存储介质
US20130259445A1 (en) Information processing device, information processing method, and program
CN111930338A (zh) 一种音量推荐方法、装置、设备及存储介质
JP2010206729A (ja) ダイジェスト再生装置、ダイジェスト再生方法、およびプログラム
KR20160035106A (ko) 영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록매체
US20090024666A1 (en) Method and apparatus for generating metadata
CN103248953B (zh) 一种电视广告时间的处理方法、系统及电视节目播放终端
JP2012039523A (ja) 動画像処理装置、動画像処理方法およびプログラム
CN113099305A (zh) 播放控制方法及装置
JP2010518672A (ja) 第1のビデオセグメントと第2のビデオセグメントとの間の遷移を平滑化するための方法及び装置
CN102034520A (zh) 电子装置、内容再现方法及其程序
KR20150069619A (ko) 디스플레이장치 및 그 제어방법
JP5266981B2 (ja) 電子機器、情報処理方法及びプログラム
JP4609244B2 (ja) コンテンツ再生装置及びコンテンツ再生方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120605