JP5537285B2 - 要約映像生成装置及び要約映像生成プログラム - Google Patents
要約映像生成装置及び要約映像生成プログラム Download PDFInfo
- Publication number
- JP5537285B2 JP5537285B2 JP2010146443A JP2010146443A JP5537285B2 JP 5537285 B2 JP5537285 B2 JP 5537285B2 JP 2010146443 A JP2010146443 A JP 2010146443A JP 2010146443 A JP2010146443 A JP 2010146443A JP 5537285 B2 JP5537285 B2 JP 5537285B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- divided
- score
- unit
- stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 claims description 100
- 238000004458 analytical method Methods 0.000 claims description 71
- 238000000605 extraction Methods 0.000 claims description 46
- 239000013598 vector Substances 0.000 claims description 31
- 238000001514 detection method Methods 0.000 claims description 20
- 239000000284 extract Substances 0.000 claims description 19
- 238000000926 separation method Methods 0.000 claims description 14
- 230000010354 integration Effects 0.000 claims description 10
- 230000000877 morphologic effect Effects 0.000 claims description 7
- 230000000007 visual effect Effects 0.000 description 78
- 238000000034 method Methods 0.000 description 30
- 238000003860 storage Methods 0.000 description 16
- 238000004519 manufacturing process Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Description
なお、より汎用的な技術として、電子番組表における紹介テキストを利用する技術もある(特許文献1参照)。
さらに、ユーザの嗜好に合致したキーワードに基づいてシーンを選択する技術が提案されている(特許文献2参照)。
特許文献1に記載の要約映像を生成する装置では、外部情報である電子番組表が入手できない場合(例えば過去の番組等)、あるいは、電子番組表の情報が制作されていない番組の場合に対して、当該電子番組表を全く利用できないため、要約映像を生成することができないという問題がある。
また、特許文献2に記載の要約映像を生成する装置では、やはり全く異なるジャンルの番組に対応できないという問題がある。
このとき、要約映像生成装置は、分割映像選択手段により、算出されたスコアに基づいて要約映像の時間長となるまで、元映像から分割映像の映像区間を選択する。そして、要約映像生成装置は、調整手段により、選択された分割映像について予め設定された当該分割映像の時間的に前後となる所定分割映像範囲にある分割映像のスコアを引き下げる調整を行う。そして、要約映像生成装置は、分割映像連結手段により、調整されたスコアに基づいて、分割映像選択手段で選択された分割映像を映像時間が早い方から連結して要約映像を生成する。
このとき、要約映像生成装置は、要約映像生成装置は、スコア統合手段により、映像評価手段で算出したスコア及び音声評価手段で算出したスコアを合算する。そして、要約映像生成装置は、分割映像選択手段により、算出されたスコアに基づいて要約映像の時間長となるまで、元映像から分割映像の映像区間を選択する。そして、要約映像生成装置は、調整手段により、選択された分割映像について予め設定された当該分割映像の時間的に前後となる所定分割映像範囲にある分割映像のスコアを引き下げる調整を行う。そして、要約映像生成装置は、分割映像連結手段により、調整されたスコアに基づいて、分割映像選択手段で選択された分割映像を映像時間が早い方から連結して要約映像を生成する。
時間が短い時間長となる要約映像を生成するためにコンピュータを、映像分割手段、映像
解析手段、映像評価手段、映像区間選択手段、として機能させる構成とした。
このとき、映像区間選択手段は、元映像から、分割映像の映像区間の映像を選択するたびに、選択した分割映像の時間的に前後となる予め設定された設定分割映像範囲について、当該設定分割映像範囲にある分割映像のスコアを引き下げることとする。
このとき、映像区間選択手段は、元映像から、分割映像の映像区間の映像を選択するたびに、選択した分割映像の時間的に前後となる予め設定された設定分割映像範囲について、当該設定分割映像範囲にある分割映像のスコアを引き下げることとする。
請求項1、6に記載の発明によれば、映像の特徴を示すブロック領域について、あたかも単語(視覚単語)の種類のように扱うことで、元映像からハードディスクレコーダなどの録画機器において自動的に要約映像を生成することが可能となり、ユーザはその要約映像から判断して素早く目的の映像を選択することが可能となる。
また、映像制作者においては、映像販売のための見本映像を自動生成することが可能となり、製作者の負担を軽減することができる。特に、大量の映像を処理する場合には、大きな効果を期待できる。
また、本発明によれば、分割映像を元映像の全体からバランスよく選択することが可能となる。
請求項3に記載の発明によれば、ブロック領域(視覚単語)の特徴量について区分けされる種類の数がクラスタリング手段により適切に抑制されるので、視覚単語の分布が疎となる状態を抑制し、適切に特徴となる分割映像を選択することができる。
まず、図1(図2)を参照して、本発明の実施形態に係る要約映像生成装置1の構成について説明する。要約映像生成装置1は、MEPG2ストリームのようなデジタル放送番組映像の映像を入力して、その入力した映像より映像時間が短い時間長となる要約映像を生成して出力するものである。この要約映像生成装置1は、入力手段2と、映像分割手段4と、映像解析手段5と、映像評価手段6と、映像区間選択手段8と、出力手段9とを備え、さらに、分割映像を記憶する記憶手段7と、外部入力手段10により要約映像の時間長を設定する目標長さ設定手段11とを備えている。
ここでは、映像解析手段5は、映像分割手段4で分割された各分割映像から予め設定された条件によりキーフレームを抽出する。そして、映像解析手段5は、その抽出したキーフレームのフレーム画像内の特徴となるブロック領域を視覚単語とみなし、その視覚単語(ブロック領域)の種類を特徴量ごとに区分するため、予め設定された勾配ヒストグラムを用い映像を解析し、映像評価手段6に解析した分割映像ごとのキーフレームを評価したスコアを出力する。映像解析手段5は、ここでは、図2に示すように、キーフレーム抽出手段5a、特徴ブロック領域抽出手段5b及びクラスタリング手段5cを備えている。
図3(a)は、横軸に分割映像(映像基本単位)の時間(フレーム画像単位)を示し、縦軸にフレーム画像ごとの動きベクトル量を示している。また、図3(b)は、横軸に分割映像(映像基本単位)の時間(フレーム画像単位)を示し、縦軸にフレーム画像ごとの動きベクトル量の累計を示している。なお、この図3(b)では、映像基本単位の動きベクトル累計を、予め定めたキーフレームの数で等分し、その等分した累計に対応したフレーム画像をキーフレームとして選択した例を示している。
これによって、図3(b)に示すように、動きベクトル量が大きく変化する(動きが激しい)時間区間で、より多くのキーフレームを抽出することができ、映像基本単位内で特徴となるフレーム画像をより多く選択することができる。
なお、キーフレームの抽出数は、任意に設定することができる。例えば、分割映像(映像基本単位)の時間長に対応してキーフレームの数を予め定めておく。キーフレームの数が多ければ、評価するときに緻密に評価できるが、処理速度が遅くなるので、処理速度と正確な評価を行えるフレーム数を予め統計により定めておくことが望ましい。
特徴ブロック領域抽出手段5bは、抽出されたキーフレームのフレーム画像の特徴を示すブロック領域を検出し、検出したブロック領域を視覚単語とみなし、その視覚単語の種類を利用して視覚単語の分類を行い、分割映像ごとにどのような種類の視覚単語がいくつ含まれているかを解析するものである。解析した分割映像ごとのキーフレームにおける視覚単語は、映像評価手段6に出力される。この特徴ブロック領域抽出手段5bは、ここでは、キーフレーム画像特徴検出手段5b1と、勾配ヒストグラム生成手段5b2とを備えている。
以上のように要約映像生成装置1を構成することで、映像のジャンル等にかかわらず、映像に含まれる視覚的特徴によって、要約映像を生成することができる。
次に、本発明に係る要約映像生成装置1の動作について説明する。ここでは、要約映像生成装置1の全体動作の概略について先に説明し、個別の手段における詳細動作についてはその後に説明することとする。
まず、図4を参照(構成については、適宜図2参照)して、要約映像生成装置1の全体動作について説明する。
まず、要約映像生成装置1は、元映像を、入力手段2を介して入力し映像分割手段4により映像基本単位となる分割映像に分割する(ステップS1)。このとき、映像分割手段4は、シーンの区切りで映像を分割して映像基本単位としている。
さらに、要約映像生成装置1は、映像区間選択手段8により、ステップS4で算出されたスコアの値に基づいて、元映像の分割映像が記憶されている記憶手段7から、当該スコアが高い映像区間(分割映像)を選択し、さらに、ここではスコアの調整を行い、選択された分割映像を映像時間が早い方から並べて、予め設定された時間長となるまで連結することで要約映像を生成する(ステップS6)。
以上の動作によって、要約映像生成装置1は、映像に含まれる視覚的特徴によって、要約映像を生成する。
次に、図5を参照(構成については、適宜図2参照)して、要約映像生成装置1の映像分割手段4において分割映像(映像基本単位)を生成する動作について詳細に説明する。なお、この動作は、図4で説明した要約映像生成装置1の全体動作のうちのステップS1の動作に相当する。
さらに、要約映像生成装置1は、映像分割手段4によって、ステップS12で検出したショットごとに、映像基本単位である分割映像として映像を分割する(ステップS13)。なお、映像分割手段4は、分割映像ごとにショットの初めと終わりの時間情報を付すこととする。そして、全フレームの処理が終了していない場合(ステップS14でNo)、ステップS12に戻って前記した同じ処理を繰り返し行い、元映像の全てのフレームについて処理する(ステップS14でYes)。
この動作によって、要約映像生成装置1は、元映像からショット単位で、映像基本単位となる分割映像を生成することができる。
次に、図6を参照(構成については、適宜図2参照)して、要約映像生成装置1の映像解析手段5において、分割映像(映像基本単位)における視覚単語の種類を解析する動作について詳細に説明する。なお、この動作は、図5で説明した要約映像生成装置1の全体動作のうちのステップS2の動作に相当する。
そして、要約映像生成装置1は、特徴ブロック領域抽出手段5bのキーフレーム画像特徴検出手段5b1により、ステップS21で抽出されたキーフレームのフレーム画像の特徴となるブロック領域を検出する(ステップS22)。このステップS22で検出されたブロック領域を視覚単語としてみなして扱うようにする。
次に、図7を参照(構成については、適宜図2参照)して、要約映像生成装置1の映像区間選択手段8において、映像区間を選択し、連結する動作について詳細に説明する。なお、この動作は、図5で説明した要約映像生成装置1の全体動作のうちのステップS6の動作に相当する。
一方、選択された分割映像の時間長の合計が、目標長さを越えた場合(ステップS63でYes)、要約映像生成装置1は、分割映像連結手段8cにより、ステップS61で選択された分割映像を映像時間の早い方から並べて連結する(ステップS64)。なお、このとき、目標長さを超過した映像については、カットすることとしてもよい。
次に、本発明の他の実施形態に係る要約映像生成装置の構成について説明する。図1(図2)で説明した要約映像生成装置1は、映像のデータ(映像ストリーム等)から要約映像を生成するものであったが、映像及び音声のデータから要約映像を生成するように構成してもよい。
入力される映像となる元映像には、少なくとも映像データである映像ストリームと、音声データである音声ストリームがあればよく、さらに、データストリームが文字情報を含んでいれば、要約映像生成装置1Aでは、その文字情報が使用される。
一方、ストリーム分離手段3により分離された音声ストリームとデータストリームは、文字情報抽出手段15に入力される。
文字情報抽出手段15は、文字データ検出手段15aで検出した文字データ(テキストデータ)か、あるいは、音声認識手段15bで音声認識して生成した文字データ(テキストデータ)かのいずれかを形態素解析手段16に出力する。
例えば、音声のスコアをfa(s)、映像のスコアをfv(s)、重みをα(予め設定された値)としたとき、式(2)により、重み付き和による統合スコアf(s)を算出することができ、式(3)により、重み付き積による統合スコアf(s)を算出することができる。
以上のように要約映像生成装置1Aを構成することで、映像及び音声によって、特徴のある映像区間を抽出することができ、映像のジャンル等にかかわらず、要約映像を生成することができる。
次に、本発明に係る要約映像生成装置1Aの動作について説明する。ここでは、要約映像生成装置1Aの全体動作の概略について先に説明し、個別の手段における詳細動作についてはその後に説明することとする。なお、すでに説明したステップは、同じ符号を付してその説明を省略する。
まず、図10を参照(構成については、適宜図8,図9参照)して、要約映像生成装置1Aの全体動作について説明する。
まず、要約映像生成装置1Aは、MEPG2ストリームのようなデジタル放送番組映像が入力手段2を介して入力されると、ストリーム分離手段3により、映像ストリームと、音声ストリームと、データストリームとに分離する(ステップS1A)。そして、ストリーム分離手段3は、分離した映像ストリームを映像分割手段4に出力し、分離した音声ストリーム及びデータストリームを文字情報抽出手段15に出力する。また、要約映像生成装置1Aは、すでに説明したように、映像分割手段4により、映像ストリームから、映像基本単位である、例えばショットの単位となる分割映像を生成する(ステップS1)。
以上の動作によって、要約映像生成装置1Aは、映像や音声に含まれる特徴によって、要約映像を生成する。
次に、図11を参照(構成については、適宜図9参照)して、要約映像生成装置1Aの文字情報抽出手段15において、文字データを抽出する動作について詳細に説明する。なお、この動作は、図10で説明した要約映像生成装置1Aの全体動作のうちのステップS2Aの動作に相当する。
このように、要約映像生成装置1Aは、データストリーム中に映像で使用されるクローズドキャプションのような文字データがあった場合、音声認識を行わないため、動作の負荷を軽減することができる。
次に、図12を参照(構成については、適宜図9参照)して、要約映像生成装置1Aの映像区間選択手段8Aにおいて、映像区間を選択し、連結する動作について詳細に説明する。なお、この動作は、図10で説明した要約映像生成装置1Aの全体動作のうちのステップS6αの動作に相当する。
すでに説明した図1,図2で示す要約映像生成装置1と、図9,図10で示す要約映像生成装置1Aについて、以下のような構成としてもよい例を説明する。
このように、共起を利用することにより映像基本単位の特徴をより正確に捉えることが可能となる。
なお、式(5)において、全ての共起を利用するようにしているが、画像特徴ベクトルにおいて、ある位置関係(近くに出現する関係、ある位置関係に出現する関係等)を満たすものだけを利用して、重要度を算出するようにしてもよい。
Vに対して新たな映像区間となる分割映像vn+1を追加する場合は、H(V)の増加量と分割映像vn+1の重要度(スコア)を統合したスコアに基づいて、分割映像を選択することになる。すなわち、メモリ8eに記憶させたスコアを更新させながら、分割映像選択手段8bが、統合したスコアにより分割映像を選択するようになる。なお、統合した重要度δは、以下の式(8)により算出することができる。
また、要約映像生成装置1Aでは、音声評価手段17において、形態素について、スコアを算出する場合、前記した式(4)〜(6)の値を使用してスコアを算出することも可能となる。
1A 要約映像生成装置
2 入力手段
3 ストリーム分離手段
4 映像分割手段
5 映像解析手段
5a キーフレーム抽出手段
5b 特徴ブロック領域抽出手段
5b1 キーフレーム画像特徴検出手段
5b2 勾配ヒストグラム生成手段
5c クラスタリング手段
6 映像評価手段
7 記憶手段
8 映像区間選択手段
8a 統合手段
8b 分割映像選択手段
8c 分割映像連結手段
8d 調整手段
8e メモリ
9 出力手段
10 外部入力手段
11 目標長さ設定手段
15 文字情報抽出手段
15a 文字データ検出手段
15b 音声認識手段
16 形態素解析手段
17 音声評価手段
Claims (7)
- 元映像から当該元映像よりも映像時間が短い時間長となる要約映像を生成する要約映像生成装置であって、
入力した前記元映像からショットの単位となる映像単位ごとに分割した分割映像を生成する映像分割手段と、
この映像分割手段で分割した分割映像ごとにキーフレームを抽出して、抽出した前記キーフレームの特徴を示すブロック領域を検出し、当該ブロック領域の種類を特徴量ごとに区分して解析する映像解析手段と、
この映像解析手段で解析したブロック領域の特徴量における種類のそれぞれについて、当該特徴量が前記元映像において特徴的であることを識別する予め定めた指標を評価基準となるスコアとして算出し、その総和を求めることで分割映像ごとのスコアを算出する映像評価手段と、
この映像評価手段で算出された分割映像のスコアの高い順で映像時間が早い方から前記要約映像の時間長となるまで、前記元映像から前記分割映像の映像区間の映像を順次選択する映像区間選択手段と、を備え、
前記映像区間選択手段は、
算出された前記分割映像のスコアに基づいて前記要約映像の時間長となるまで、前記元映像から前記分割映像の映像区間の映像を順次選択する分割映像選択手段と、
この分割映像選択手段により選択した分割映像の時間的に前後となる予め設定された設定分割映像範囲について、当該設定分割映像範囲にある分割映像のスコアを引き下げる調整を行なう調整手段と、
この調整手段により調整を行なって、前記分割映像選択手段が選択した前記分割映像を連結して前記要約映像を生成する分割映像連結手段と、
を備えることを特徴とする要約映像生成装置。 - 元映像から当該元映像よりも映像時間が短い時間長となる要約映像を生成する要約映像生成装置であって、
前記元映像が、映像ストリームと、音声ストリームとを有する映像であって、入力した前記元映像から前記映像ストリームと、前記音声ストリームとを分離するストリーム分離手段と、
このストリーム分離手段で分離した前記映像ストリームからショットの単位となる映像単位ごとに分割した分割映像を生成する映像分割手段と、
この映像分割手段で分割した分割映像ごとにキーフレームを抽出して、抽出した前記キーフレームの特徴を示すブロック領域を検出し、当該ブロック領域の種類を特徴量ごとに区分して解析する映像解析手段と、
この映像解析手段で解析したブロック領域の特徴量における種類のそれぞれについて、当該特徴量が前記元映像において特徴的であることを識別する予め定めた指標を評価基準となるスコアとして算出する映像評価手段と、
前記音声ストリームから音声を認識して文字データを抽出する文字情報抽出手段と、
この文字情報抽出手段により抽出した文字データを単語ごとに形態素解析する形態素解析手段と、
この形態素解析手段により解析した文字データについて、前記映像分割手段により分割した分割映像の映像単位ごとに特徴のある前記単語が前記元映像において特徴的であることを識別する予め定めた指標を評価基準となるスコアとして算出する音声評価手段と、
前記映像評価手段で算出したスコアと、前記音声評価手段で算出したスコアを合算して求めたスコアの高い順で映像時間が早い方から前記要約映像の時間長となるまで、前記元映像から前記分割映像の映像区間を順次選択すると共に、前記元映像から当該映像区間の音声ストリームを選択する映像区間選択手段と、を備え、
前記映像区間選択手段は、
前記映像評価手段で算出したスコアと、前記音声評価手段で算出したスコアを合算するスコア統合手段と、
このスコア統合手段で合算して算出した前記スコアに基づいて、当該スコアの高い順で映像時間が早い方から前記要約映像の時間長となるように、前記元映像から前記分割映像の映像区間を選択する分割映像選択手段と、
この分割映像選択手段により選択した分割映像の時間的に前後となる予め設定された設定分割映像範囲について、当該設定分割映像範囲にある分割映像のスコアを引き下げる調整を行なう調整手段と、
この調整手段により調整を行なって、前記分割映像選択手段が選択した前記分割映像を連結して前記要約映像を生成する分割映像連結手段と、
を備えることを特徴とする要約映像生成装置。 - 前記映像解析手段は、前記ブロック領域を特徴量ごとの種類によりクラスタリングするクラスタリング手段をさらに備え、
前記映像評価手段は、前記クラスタリング手段でクラスタリングした種類の前記特徴量について前記スコアを算出することを特徴とする請求項1又は請求項2に記載の要約映像生成装置。 - 前記映像解析手段は、前記分割映像のフレーム画像ごとに動きベクトル量を算出し、前記動きベクトル量の累計が前記分割映像の総動きベクトル量を予め定めた数で等分した累計に達したときのフレーム画像を順次、前記キーフレームとして抽出することを特徴とする請求項1から請求項3のいずれか一項に記載の要約映像生成装置。
- 前記元映像は前記映像ストリームと、前記音声ストリームと、データストリームとを有し、前記ストリーム分離手段は、前記元映像を前記映像ストリームと、前記音声ストリーム及び前記データストリームとに分離し、
前記文字情報抽出手段は、前記データストリームに前記映像ストリームに対する文字データが含まれているか否かを検出する文字データ検出手段をさらに備え、
前記データストリームに文字データが存在しない場合に、音声認識手段により前記文字データを抽出して前記形態素解析手段に出力し、前記データストリームに文字データが含まれている場合に、前記文字データ検出手段により文字データを検出して前記形態素解析手段に出力することを特徴とする請求項2に記載の要約映像生成装置。 - 元映像から当該元映像よりも映像時間が短い時間長となる要約映像を生成するためにコンピュータを、
入力した前記元映像からショットの単位となる映像単位ごとに分割した分割映像を生成する映像分割手段、
この映像分割手段で分割した分割映像ごとにキーフレームを抽出して、抽出した前記キーフレームの特徴を示すブロック領域を検出し、当該ブロック領域の種類を特徴量ごとに区分して解析する映像解析手段、
この映像解析手段で解析したブロック領域の特徴量における種類のそれぞれについて、当該特徴量が前記元映像において特徴的であることを識別する予め定めた指標を評価基準となるスコアとして算出し、その総和を求めることで分割映像ごとのスコアを算出する映像評価手段、
この映像評価手段で算出された分割映像のスコアの高い順で映像時間が早い方から前記要約映像の時間長となるまで、前記元映像から前記分割映像の映像区間の映像を順次選択する映像区間選択手段、として機能させ、
前記映像区間選択手段は、前記元映像から、分割映像の映像区間の映像を選択するたびに、選択した分割映像の時間的に前後となる予め設定された設定分割映像範囲について、当該設定分割映像範囲にある分割映像のスコアを引き下げることを特徴とする要約映像生成プログラム。 - 元映像から当該元映像よりも映像時間が短い時間長となる要約映像を生成するためにコンピュータを、
前記元映像が、映像ストリームと、音声ストリームとを有する映像であって、入力した前記元映像から前記映像ストリームと、前記音声ストリームとを分離するストリーム分離手段、
このストリーム分離手段で分離した前記映像ストリームからショットの単位となる映像単位ごとに分割した分割映像を生成する映像分割手段、
この映像分割手段で分割した分割映像ごとにキーフレームを抽出して、抽出した前記キーフレームの特徴を示すブロック領域を検出し、当該ブロック領域の種類を特徴量ごとに区分して解析する映像解析手段、
この映像解析手段で解析したブロック領域の特徴量における種類のそれぞれについて、当該特徴量が前記元映像において特徴的であることを識別する予め定めた指標を評価基準となるスコアとして算出する映像評価手段、
前記音声ストリームから音声を認識して文字データを抽出する文字情報抽出手段、
この文字情報抽出手段により抽出した文字データを単語ごとに形態素解析する形態素解析手段、
この形態素解析手段により解析した文字データについて、前記映像分割手段により分割した分割映像の映像単位ごとに特徴のある前記単語が前記元映像において特徴的であることを識別する予め定めた指標を評価基準となるスコアとして算出する音声評価手段、
前記映像評価手段で算出したスコアと、前記音声評価手段で算出したスコアを合算して求めたスコアの高い順で映像時間が早い方から前記要約映像の時間長となるまで、前記元映像から前記分割映像の映像区間を順次選択すると共に、前記元映像から当該映像区間の音声ストリームを選択する映像区間選択手段、として機能させ、
前記映像区間選択手段は、前記元映像から、分割映像の映像区間の映像を選択するたびに、選択した分割映像の時間的に前後となる予め設定された設定分割映像範囲について、当該設定分割映像範囲にある分割映像のスコアを引き下げることを特徴とする要約映像生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010146443A JP5537285B2 (ja) | 2010-06-28 | 2010-06-28 | 要約映像生成装置及び要約映像生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010146443A JP5537285B2 (ja) | 2010-06-28 | 2010-06-28 | 要約映像生成装置及び要約映像生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012010265A JP2012010265A (ja) | 2012-01-12 |
JP5537285B2 true JP5537285B2 (ja) | 2014-07-02 |
Family
ID=45540264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010146443A Active JP5537285B2 (ja) | 2010-06-28 | 2010-06-28 | 要約映像生成装置及び要約映像生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5537285B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015195418A (ja) * | 2012-08-14 | 2015-11-05 | 三菱電機株式会社 | 記録再生装置、記録再生方法、記録装置及び再生装置 |
JP6257337B2 (ja) * | 2014-01-14 | 2018-01-10 | 日本放送協会 | 画像選択装置 |
KR101804383B1 (ko) * | 2014-01-14 | 2017-12-04 | 한화테크윈 주식회사 | 요약 영상 브라우징 시스템 및 방법 |
US9799376B2 (en) | 2014-09-17 | 2017-10-24 | Xiaomi Inc. | Method and device for video browsing based on keyframe |
CN104284240B (zh) * | 2014-09-17 | 2018-02-02 | 小米科技有限责任公司 | 视频浏览方法及装置 |
KR101994291B1 (ko) * | 2014-10-14 | 2019-06-28 | 한화테크윈 주식회사 | 통합써머리를 제공하는 영상재생장치 및 방법 |
KR102071388B1 (ko) * | 2016-07-01 | 2020-01-30 | 주식회사 케이티 | 영상 요약 장치 및 영상 처리 장치 |
JP6917788B2 (ja) * | 2017-06-09 | 2021-08-11 | 日本放送協会 | 要約映像生成装置及びプログラム |
JP7121378B2 (ja) * | 2017-09-26 | 2022-08-18 | Jcc株式会社 | 映像管理方法、映像管理装置、及び映像管理システム |
CN109819338B (zh) | 2019-02-22 | 2021-09-14 | 影石创新科技股份有限公司 | 一种视频自动剪辑方法、装置及便携式终端 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE9902328A0 (sv) * | 1999-06-18 | 2000-12-19 | Ericsson Telefon Ab L M | Förfarande och system för att alstra sammanfattad video |
JP2002142189A (ja) * | 2000-11-06 | 2002-05-17 | Canon Inc | 画像処理装置、画像処理方法及び記憶媒体 |
JP4211338B2 (ja) * | 2002-09-24 | 2009-01-21 | セイコーエプソン株式会社 | 画像レイアウト装置及び画像レイアウトプログラム、並びに画像レイアウト方法 |
EP1793581A1 (en) * | 2005-12-05 | 2007-06-06 | Microsoft Corporation | Automatic selection of images for transfer depending on connection characteristics |
JP4247638B2 (ja) * | 2006-04-06 | 2009-04-02 | ソニー株式会社 | 記録再生装置および記録再生方法 |
JP4755575B2 (ja) * | 2006-12-12 | 2011-08-24 | ヤフー株式会社 | 動画代表画像抽出方法、装置、及びコンピュータ・プログラム |
JP4920395B2 (ja) * | 2006-12-12 | 2012-04-18 | ヤフー株式会社 | 動画要約自動作成装置、方法、及びコンピュータ・プログラム |
JP5243888B2 (ja) * | 2008-08-18 | 2013-07-24 | 日本放送協会 | データ分類装置及びデータ分類プログラム |
-
2010
- 2010-06-28 JP JP2010146443A patent/JP5537285B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012010265A (ja) | 2012-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5537285B2 (ja) | 要約映像生成装置及び要約映像生成プログラム | |
US8938393B2 (en) | Extended videolens media engine for audio recognition | |
US9734407B2 (en) | Videolens media engine | |
US6892193B2 (en) | Method and apparatus for inducing classifiers for multimedia based on unified representation of features reflecting disparate modalities | |
US6993535B2 (en) | Business method and apparatus for employing induced multimedia classifiers based on unified representation of features reflecting disparate modalities | |
US20110243529A1 (en) | Electronic apparatus, content recommendation method, and program therefor | |
CN106649713B (zh) | 一种基于内容的电影可视化处理方法及其系统 | |
KR100687732B1 (ko) | 내용 기반 멀티 모달 특징값을 이용한 유해 동영상 차단방법 및 그 장치 | |
US20030068087A1 (en) | System and method for generating a character thumbnail sequence | |
JP2005514841A (ja) | マルチメディア・コンテンツをリンクするよう複数モードのストーリーをセグメントする方法及び装置 | |
WO2000045604A1 (en) | Signal processing method and video/voice processing device | |
Yang et al. | Key frame extraction using unsupervised clustering based on a statistical model | |
Kolekar et al. | Semantic event detection and classification in cricket video sequence | |
KR100436828B1 (ko) | 주문형 동영상 요약 서비스 시스템 | |
JP2000285242A (ja) | 信号処理方法及び映像音声処理装置 | |
JP2008153920A (ja) | 動画像一覧表示装置 | |
Premaratne et al. | Improving event resolution in cricket videos | |
JP2010015588A (ja) | 動画像データの分類装置 | |
Detyniecki et al. | Video rushes summarization by adaptive acceleration and stacking of shots | |
JP2005167456A (ja) | Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置 | |
Lu et al. | An integrated correlation measure for semantic video segmentation | |
Huayong | Content-based tv sports video retrieval based on audio-visual features and text information | |
Ding et al. | A keyframe extraction method based on transition detection and image entropy | |
Dimitrova et al. | Selective video content analysis and filtering | |
JP2004260734A (ja) | 動画像データの分類装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140313 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20140326 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140401 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140425 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5537285 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |