JP3312105B2 - 動画像インデックス生成方法および生成装置 - Google Patents

動画像インデックス生成方法および生成装置

Info

Publication number
JP3312105B2
JP3312105B2 JP02296197A JP2296197A JP3312105B2 JP 3312105 B2 JP3312105 B2 JP 3312105B2 JP 02296197 A JP02296197 A JP 02296197A JP 2296197 A JP2296197 A JP 2296197A JP 3312105 B2 JP3312105 B2 JP 3312105B2
Authority
JP
Japan
Prior art keywords
frame
index
image
moving image
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02296197A
Other languages
English (en)
Other versions
JPH10224736A (ja
Inventor
子 敏 充 金
修 堀
木 恒 青
田 進 窪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP02296197A priority Critical patent/JP3312105B2/ja
Publication of JPH10224736A publication Critical patent/JPH10224736A/ja
Application granted granted Critical
Publication of JP3312105B2 publication Critical patent/JP3312105B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、動画像の一部また
は全体に対し、それらの内容を代表するフレーム画像を
インデックスとして選択する方法および装置に関する。
【0002】
【従来の技術】動画像は各時間に対応する静止画(フレ
ーム)の列から構成されており、時間の経過に合わせて
表示するフレームを逐次変更することにより、動きを表
現している。動画像においては静止画像と異なり、時間
軸が加わっているために全体の内容を素早く把握するこ
とが難しい。
【0003】動画像全体の内容を把握したり、また、動
画像の所望の一部分を検索したりする場合に、全てのフ
レームが一画面に表示されていれば、効率が良いことに
なるが、動画像に含まれるフレームの数は極めて多いた
め、全てのフレームを表示することは通常は効率的では
ない。例えば、テレビジョン標準化システムの1つであ
るNTSC(National Television System Committee)
方式においては、1秒間あたり約30のフレームが含ま
れており、1時間では10万以上のフレームを含むこと
になってしまい、これらを1画面に表示するのは不可能
である。また、数フレームずつを1ページとして構成し
て1画面に表示するようにしたとしてもページ数が多く
なってしまい、結局、動画像を早送りして再生するほう
が効率がよいという事態になってしまう。
【0004】一方、全てのフレームの表示の中には冗長
な情報が多く含まれていることから表示するフレームを
少なくし、内容把握や検索の効率を上げることができ
る。このとき表示のために選ばれたフレームをインデッ
クスと呼ぶことにする。例えば、1秒当たり1フレーム
や30秒あたり1フレームといった具合にインデックス
を選択することができる。このとき、単純に数フレーム
に1枚の割合でインデックス映像を選んでいくと、必ず
しもわかりやすい表示ができるとは限らない。例えば、
内容的に重要ではあるが、表示時間が短いためにインデ
ックスに選ばれなかったフレームがあったり、逆にあま
り意味的には重要ではないが長い時間静止した映像が存
在したために同じようフレームがインデックス映像とな
ってしまうという不都合が生じる。
【0005】こういった不都合を解消するために、カッ
トと呼ばれる不連続なフレームを検出し、カットとカッ
トの間に含まれるフレームの中から一つのインデックス
映像を選択するという方法が考えられている。このよう
にインデックス映像を選ぶフレーム区間を決定すること
により、同じ様な映像がインデックスとして選択される
のをある程度防ぐことができる。カットを自動的に検出
する手法としては、特開平1−68084号公報、特開
平3−214364号公報、特開平4−219878号
公報等に記載された技術がある。通常は、カットとして
あるフレームを検出した後、そのカット後の先頭のフレ
ームをインデックスとして選択されている。
【0006】
【発明が解決しようとする課題】上記のようなカットと
カットの間のフレームの中から一つのインデックスを選
択するという方法は、インデックスを選択する区間の決
定には有効であるが、カットとカットの間に含まれる複
数のフレームのうちのどれをインデックス映像として選
択するべきかは解決しない問題として残されている。す
なわち、動画像のある決められた一部分、もしくは全体
から内容を最もよく反映した1つのフレームを選択する
ための方法が与えられていないという問題点があった。
【0007】本発明は、上記問題点を解決するために、
撮影されている内容に意味のあるフレームをインデック
スとして選択することにより、動画像をインデックス表
示した場合に動画像の内容把握が容易で所望場面の検索
も容易な動画像インデックス生成方法および生成装置を
提供することを目的としている。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、この発明の第1の基本構成に係る動画像インデック
ス生成方法は、入力された動画像から各時間に対応する
静止画像であるフレームを抽出するステップと、所望の
映像に関する辞書としての、見つけたいオブジェクトの
画像を予め学習させて統計的な分布を規定するパラメー
タを求めたものであるオブジェクト辞書を用いて、予め
定められた算出方法により動画像の一部または全てに含
まれる前記フレームの部分領域の評価値を算出するステ
ップと、前記フレームに含まれる全ての領域に対して算
出された評価値からフレームの評価値を算出するステッ
プと、前記評価値に基づいて前記フレームのうちから特
定のフレームの画像を、表示の際のインデックス画像と
して選択するステップと、を備える。
【0009】上記第1の基本構成に係る動画像インデッ
クス生成方法において、前記動画像の一部または全体に
含まれる前記フレームに対して、移動するオブジェクト
を背景から切り出すステップと、切り出された前記オブ
ジェクトごとに予め定められた算出方法により評価値を
算出するステップと、同一フレームに含まれるオブジェ
クトの評価値からフレームの評価値を算出するステップ
と、前記フレームの評価値に基づいて特定フレームを表
示の際のインデックスとして選択して出力するステップ
と、をさらに備えていても良い。
【0010】上記第1の基本構成に掛かる動画像インデ
ックス生成方法において、前記動画像の一部または全体
に含まれるフレームに対し、前記動画像を撮影している
カメラの動きと向きの変化を示すカメラパラメータを推
定するステップと、予め定められたカメラパラメータを
有するフレームを表示の際のインデックスとして選択す
るステップと、をさらに備えていても良い。
【0011】上記第1の基本構成に係る動画像インデッ
クス生成方法において、動画像の一部または全体に含ま
れるフレームに対して任意の組み合わせのフレーム間の
類似度を予め定められた算出方法により算出するステッ
プと、前記類似度が所定の方法により算出されたしきい
値よりも大きな類似度を有するフレームを検出すること
によって繰り返し登場するフレームを検出するステップ
と、これら繰り返し登場するフレームの中から表示の際
のインデックスとするフレームを選択するステップと、
をさらに備えていても良い。
【0012】この発明の第2の基本構成に係る動画像イ
ンデックス生成装置は、入力された動画像から各時間に
対応する静止画像であるフレームを抽出するフレーム抽
出手段と、所望の映像に関する辞書としての、見つけた
いオブジェクトの画像を予め学習させて統計的な分布を
規定するパラメータを求めたものであるオブジェクト辞
書を格納し、予め定められた算出方法により動画像の一
部または全てに含まれる前記フレームの部分領域の評価
値を算出する領域評価値算出手段と、前記フレームに含
まれる全ての領域に対して前記領域評価値算出手段によ
り算出された評価値からフレームの評価値を算出するフ
レーム評価値算出手段と、前記評価値に基づいて前記フ
レームのうちから特定のフレームの画像を、表示の際の
インデックス画像として選択するインデックス画像選択
手段と、を備えることを特徴としている。
【0013】上記第2の基本構成に係る動画像インデッ
クス生成装置において、前記フレームの部分領域は、移
動するオブジェクトであり、前記インデックス選択手段
は、この移動するオブジェクトの動き量に基づいて、動
画像のシーンが激しく変化したフレームの静止画像をイ
ンデックス画像として選択するように構成されていても
良い。
【0014】上記第2の基本構成に係る動画像インデッ
クス生成装置において、前記フレームの部分領域は、繰
り返し登場する類似度の高い部分領域であり、前記フレ
ーム評価値算出手段は、フレーム間の類似度を評価値と
して算出し、前記インデックス画像選択手段は、所定の
しきい値よりも前記評価値の高いフレームを繰り返しの
多いインデックス画像として選択するように構成されて
いても良い。
【0015】
【発明の実施の形態】以下、本発明に係る動画像インデ
ックス生成方法および生成装置の好適な実施形態につい
て、添付図面を参照しながら詳細に説明する。まず、本
発明の基本概念を示す第1実施形態に係る動画像インデ
ックス生成方法および第2実施形態に係る動画像インデ
ックス生成装置について、図1および図2を参照しなが
ら説明する。
【0016】図1は、本発明の第1実施形態に係る動画
像インデックス生成方法の動作手順を示すフローチャー
トであり、同図において、動画像インデックス生成方法
は、入力された動画像から各時間に対応する静止画像で
あるフレームを抽出するステップST1と、所望の映像に
関する辞書を用いて、予め定められた算出方法により動
画像の一部または全てに含まれる前記フレームの部分領
域の評価値を算出するステップST2と、前記フレームに
含まれる全ての領域に対して算出された評価値からフレ
ームの評価値を算出するステップST3と、前記評価値に
基づいて前記フレームのうちから特定のフレームの画像
を表示の際のインデックス画像として選択するステップ
ST4と、を備えている。
【0017】次に、装置発明の基本概念を示す第2実施
形態に係る動画像インデックス生成装置を、図2のブロ
ック構成図に従い説明する。図2において、第2実施形
態に係る動画像インデックス生成装置は、入力された動
画像から各時間に対応する静止画像であるフレームを抽
出するフレーム抽出手段1と、所望の映像に関する辞書
を格納し、予め定められた算出方法により動画像の一部
または全てに含まれる前記フレームの部分領域の評価値
を算出する領域評価値算出手段2と、前記フレームに含
まれる全ての領域に対して前記領域評価値算出手段2に
より算出された評価値からフレームの評価値を算出する
フレーム評価値算出手段3と、前記評価値に基づいて前
記フレームのうちから特定のフレームの画像を表示の際
のインデックス画像として選択するインデックス画像選
択手段4と、を備えることを特徴としている。
【0018】上記第2実施形態に係る動画像インデック
ス生成装置の動作は、上述した第1実施形態に係る動画
像インデックス生成方法の各処理手順がこれに相当して
いるので、重複説明を省略する。次に、図3ないし図2
1を用いて下位概念に係る各実施形態について説明す
る。
【0019】本発明の第3実施形態に係る動画像インデ
ックス生成装置は、例えば図3に示すように構成され
る。図3において、符号101はユーザインタフェース
部であり、実際にはキーボードやマウス、タッチパネル
等のポインティングデバイスなどである。ユーザは10
1から指示を送ることにより、システムに動画像の再
生、停止、インデックスの表示などを行なわせる。
【0020】102は制御部であり、システム全体の制
御を行なう。103は映像表示部であり、動画像やイン
デックス映像の表示を行なう。105はバスであり、各
処理部間のデータの伝送はここを通して行なわれる。1
04は動画像記録部であり、具体的には磁気ディスクや
磁気テープ、光ディスクなどの大容量データ記録媒体で
ある。この動画像記録部104はそのままネットワーク
上の動画像サーバや動画像放送の受信で置き換えても良
い。
【0021】106はインデックス映像選択部であり、
動画像記録部104に蓄積された動画像のインデックス
映像の選択処理を行なう。ここでの選択処理の方法は後
で詳細に説明する。107はインデックス情報記録部で
あり、インデックス映像選択部106において選択され
たインデックスに関する情報を蓄積しておく。具体的に
は半導体メモリや磁気ディスク、光ディスクなどの記録
媒体である。
【0022】108はカット検出部であり、動画像記録
部104に蓄積された動画像から映像の不連続なフレー
ム間であるカットを検出する。109はカット情報記憶
部であり、カット検出部108で検出されたカット情報
を蓄積しておく、半導体メモリや磁気ディスク、光ディ
スクなどの記録媒体である。
【0023】インデックス情報を生成するときには、ま
ず、カット検出部108においてカットの検出が行なわ
れる。処理対象となる動画像は、動画像記録部104か
らバス105を通してカット検出部108に送られる。
カット検出部108での処理はいかなるカット検出手法
でも用いることが可能であるが、例えば特開平01−6
8084、特開平3−214364号公報、特開平4−
219878号公報などで説明されている方法を適用す
ることが可能である。検出されたカットに関する情報
は、フレーム番号、動画像の先頭からの時間、先頭から
のバイト数などのカット情報として出力され、カット情
報記憶部109に記憶される。
【0024】次に、カット情報記憶部109に蓄積され
ているカット情報のうち、連続するカットに挟まれたフ
レームをインデックス選択のための部分動画像とする。
これら複数の部分動画像ごとにインデックス映像選択部
106においてインデックス映像が選択される。ここで
の処理は後述するが、選択されたインデックス映像に関
する情報は、フレーム番号、動画像の先頭からの時間、
先頭からのバイト数などの形式でインデックス情報に対
応したフレームのみを動画像記録部104から再生し、
インデックス映像のみからなる映像データを生成してお
いても良い。
【0025】ユーザインタフェース101からインデッ
クス表示命令が入力されたときにはインデックス情報記
憶部107に記憶されたインデックス情報が読み出さ
れ、インデックス情報に対応したフレームの映像が動画
像記録部104から読み出され、映像表示部103に表
示される。また、インデックス映像のみからなる映像デ
ータが既に生成されている場合には、動画像記録部10
4から動画像データを読み出すのではなく、直接インデ
ックス映像のみからなる映像データが読み出されて映像
表示部103に表示される。
【0026】以下、インデックス映像選択部106にお
ける処理を図4に従い、より詳細に説明する。図4はイ
ンデックス映像選択部106の内部のブロック図であ
る。
【0027】まず、カット情報記憶部109に記憶され
たカット情報をもとに、インデックス映像がまだ選択さ
れていないカット間のフレームがインデックス映像の選
択範囲として選ばれる。選択範囲内のフレームは順次バ
ス105を介してフレーム画像記憶部201に読み込ま
れる。202はサンプル領域切り出し・正規化部であ
り、フレーム画像記憶部201に記憶されたフレーム画
像の一部の矩形領域の切り出しを行なう。切り出す矩形
のスケールや位置は予め決めておくのが簡単であるが、
入力される画像により逐次変更できるようにしておいて
も良い。通常は、一つのフレーム画像から複数のスケー
ル、位置の組み合わせの矩形をサンプル領域として切り
出す。例えば、横20画素、縦20画素から横50画
素、縦50画素まで縦横各々一画素ステップで、フレー
ム上の全ての位置から切り出すといったように定めてお
く。切り出されたサンプル領域は、スケールが異なるの
で、あらかじめ定められたスケールに正規化される。
【0028】オブジェクト辞書記録部204はオブジェ
クト辞書を記録しておくための記録媒体である。オブジ
ェクト辞書は見つけたいオブジェクトの画像を予め学習
させ、統計的な分布を規定するパラメータを求めたもの
である。例えば、人間の顔や動物、車などをオブジェク
トとして辞書を作成する。辞書作成の手法としては、ベ
イズ推定がよく知られている。また、オブジェクト辞書
は見つけたいオブジェクトの画像の代表的なパターンの
集合としてもよい。
【0029】距離計算部205では、あらかじめ定めら
れた手法により正規化されたサンプル領域とオブジェク
ト辞書に登録されたデータとの距離を算出する。例え
ば、オブジェクト辞書としてオブジェクトの統計的分布
の平均ベクトルや、共分散行列が用いられている場合に
は、平均からのユークリッド距離やマハラノビス距離を
用いることができる。また、オブジェクト辞書にオブジ
ェクトの画像の代表的なパターンが登録されている場合
には、正規化されたサンプル領域とユークリッド距離や
マハラノビス距離が最も近い代表パターンまでの距離と
して算出されても良い。
【0030】距離計算部205により計算された距離情
報は距離情報記憶部203に記憶される。同一のフレー
ムごとに距離の最小値のみを記憶、更新し、フレーム内
の全てのサンプル領域に対する距離算出処理が終了する
と、距離の最小値がフレームを代表する距離情報として
距離情報記憶部203に記憶される。距離情報記憶部2
03はフレーム内の距離の最小値と共に、これまでに算
出されたフレームを代表する距離情報の最小値、および
そのフレームのフレーム番号またはそれに代わる情報を
記憶している。インデックス映像選択範囲内の全てのフ
レームに対しての距離算出処理が終了すると、距離情報
記憶部203はインデックス映像選択範囲内のフレーム
の中で最も小さな距離値を与えたフレームをインデック
ス映像として選択し、そのフレーム番号、または動画像
の先頭からの時間、バイト数などの情報をバス105を
介してインデックス情報記憶部107に送る。
【0031】例えば、オブジェクト辞書として、人物の
正面の顔を学習、登録しておいたものとする。この場
合、距離計算部205で算出された距離が小さいときに
はサンプル領域として人物の正面画像が切り出されてい
る可能性が高いことを意味している。図16はこの例に
おいて、正面顔の含まれているフレームがインデックス
として選択される様子を示している。図16において、
距離算出部205で計算される距離は、正面顔を含む中
央のフレームにおいて最小値をとり、正面顔を含まない
左右両端のフレームにおいては算出される距離が大きく
なっている。この結果、中央の正面顔を含むフレームが
インデックスとなる。
【0032】このような処理を行なうことにより、イン
デックスとして無意味なフレームを選択するのではな
く、人物という意味のあるオブジェクトが存在するフレ
ームがインデックス表示の際に表示され、内容の把握し
やすい表示、検索を効率よく行なうことのできる表示が
可能になる。
【0033】オブジェクト辞書記録部204に記憶され
るオブジェクト辞書の種類、数は限定される物ではな
い。従って、インデックスとして表示されたいオブジェ
クトを複数用意しておくことができる。例えば、人物の
顔の他、車の辞書を登録しておくことにより、人物が登
場しない場合であっても、車の登場するフレームを優先
的にインデックスとして選択することができるようにな
る。
【0034】また、どのフレームにおいても大きな距離
しか算出されなかった場合には、オブジェクト辞書に登
録されているオブジェクトはどれも含まれていないと判
断して、別の方法でインデックス映像を選択するように
してもよい。例えば、インデックス映像選択範囲内の先
頭フレームにするとか、真ん中のフレームにするといっ
た簡単な方法でも良い。
【0035】ここまで説明した処理は、ソフトウェア、
ハードウェアのどちらでも行なうことが可能である。ソ
フトウェアにより処理を行なう場合には例えば図5のフ
ローチャートに示す処理によっても、本発明のインデッ
クス生成を行なうことが可能である。図5において、フ
レーム区間から未処理のフレームを選択し(ステップST
11)、フレーム画像からサンプル領域を切り出し(ステ
ップST12)た後、サンプル領域を正規化して辞書十距離
を求める(ステップST13)。ステップST13により求めら
れた距離が最も小さいのならば、現在のフレームをイン
デックス候補とする(ステップST14)。次に、ステップ
ST15において、全てのスケール・位置のサンプル領域が
試されたか否かが判断され、まだ試されていないスケー
ル・位置が残っている場合にはステップST12に戻り、全
てのサンプル領域について検出が行われる。ステップST
15において、全てのサンプル領域が試されたものと判断
された場合には、ステップST16において、フレーム区間
内の全てのフレームについて試されたか否かが判断さ
れ、全てのフレームについて処理が行われていない場合
には、ステップST11ないしST16の処理が繰り返され、全
てのフレームについて処理が行われているものと判断さ
れた場合には、ステップST17において前記インデックス
候補をインデックス映像として決定する。
【0036】次に、本発明の第4実施形態に係る動画像
インデックス装置について、図6を参照しながら説明す
る。この第4実施形態においても、第3実施形態の装置
において説明した図3に関する部分は全く同様に説明さ
れるので、ここでは説明を省略する。従って、インデッ
クス映像選択部106の構成についてのみ、説明を行な
う。
【0037】図6は第4実施形態に係る装置におけるイ
ンデックス映像選択部106の一例構成を示すブロック
図である。まず、カット情報記憶部108に記憶された
カット情報をもとに、インデックス映像がまだ選択され
ていないカット間のフレームがインデックス映像の選択
範囲として選ばれる。選択範囲内のフレームは順次バス
105を介してフレーム画像記憶部401に読み込まれ
る。402はサンプル領域切り出し・正規化部であり、
フレーム画像記憶部401に記憶されたフレーム画像の
一部の矩形領域の切り出しを行なう。切り出す矩形のス
ケールや位置は第3実施形態における説明と全く同様で
あり、あらかじめ決めておくか、入力される画像により
逐次変更できるようにしておいても良い。切り出された
サンプル領域は、スケールが異なるので、サンプル領域
切り出し・正規化部402において後に行なう距離算出
に適している予め定められたスケールに正規化する。こ
の第4実施形態のサンプル切り出し・正規化部402で
は、第3実施形態とは異なり、切り出された領域のスケ
ール、位置の情報をフレーム評価値算出部405に送る
処理も行なう。
【0038】オブジェクト辞書記録部406はオブジェ
クト辞書を記憶しておくための記録媒体である。第3実
施形態において説明した通り、オブジェクト辞書は見つ
けたいオブジェクトの画像をあらかじめ学習させ、統計
的な分布を規定するパラメータを求めたものである。距
離算出部403はオブジェクト辞書記録部406に記憶
されているオブジェクト辞書と正規化されたサンプル領
域との距離を所定の方法を用いて算出する。算出された
距離情報はフレーム評価値算出部405に送られる。
【0039】フレーム評価値算出部405は、距離算出
部403から送られてきた距離の値が定められたしきい
値よりも小さい場合に、サンプル切り出し・正規化部4
02より送られてくる切り出し領域のスケール、位置情
報および距離情報とから領域の評価値を算出する。この
評価値はスケールが大きい、また、位置がフレームの中
心に近い、また、距離が小さいほど大きくなるようにす
る。例えば、領域の中心とフレームの中心との距離を
d、スケール(例えば、面積)をs、距離算出部403
で算出された辞書との距離をD、さらにC1,C2,C
3,C4,C5を定数として、 として算出するものとする。
【0040】フレーム評価値算出部405は上記の領域
の評価値を蓄積しておき、同一のフレーム内の領域に対
して算出された領域の評価値の和を求め、これをフレー
ム評価値とする。ただし、同一フレーム内でも重なり合
った領域に対して算出された領域の評価値については、
これら領域の一つの評価値に対してのみ和をとるものと
する。
【0041】フレーム評価値算出部405では、インデ
ックス映像選択範囲内の全てのフレームに対しての最大
値、および最大値を与えるフレームのフレーム番号もし
くはそれに代わる情報(先頭からの時間やバイト数な
ど)を記憶される。インデックス映像選択範囲内の全て
のフレームに対して処理が終わったときに、上記最大の
フレーム評価値を与えるフレーム番号またはそれに代わ
る情報をインデックス情報記憶部107に送ることによ
り、インデックス選択範囲内のインデックス選択が終了
する。
【0042】第4実施形態のように処理を行なうことに
より、インデックス選択範囲内のフレームから、インデ
ックスとして取り上げたいオブジェクトが画面の中心付
近にあり、かつ、大きく映っているものがインデックス
として選択されやすくなる。例えば、オブジェクトに人
物の正面顔を選んだ場合には、画面の端に小さく顔が映
っているフレームよりも、中心に大きく映っているフレ
ームをインデックスとして選択することになり、インデ
ックス表示の際の視認性が向上する。図3はその一例で
ある。左端のフレームでは顔が画面の端の方にあること
から、フレーム評価値は顔が中心に映っている中央のフ
レームよりも低くなっている。また、右端のフレームで
は顔が端に映っている上に小さいため、さらに低いフレ
ーム評価値が算出されている。図17の例の場合には、
中央のフレームがインデックスとして選択される。
【0043】一方、評価値算出の際の定数としてC1=
C3=C4=0を選択すると、オブジェクトが多く存在
しているフレームがインデックスとして選択され易くな
る。先の例のようにオブジェクトとして人物の正面顔を
採用した場合には、一人だけ映っているフレームよりも
二人、三人が映っているフレームの方がインデックスと
して選択されやすくなる。このようなインデックスは、
登場人物を把握する上で好ましいインデックスである。
【0044】ここまで説明した処理は、第3実施形態と
同様に、ソフトウェア、ハードウェアのどちらでも行な
うことが可能である。ソフトウェアにより処理を行なう
場合には例えば図7のフローチャートに示す処理によ
り、本発明のインデックス生成を行なうことが可能であ
る。図7において、ステップST11ないしST13およびステ
ップST15ないしST17は、図5に示された第3実施形態の
インデックス映像選択部の処理動作と同一である。この
第4実施形態の処理動作においては、第3実施形態のス
テップST14の代わりに距離がしきい値よりも小さいなら
ば距離・位置・スケールより評価値を求めるステップST
20が設けられ、また、ステップST15とステップST16の間
に、フレーム全体の評価値の和が最も大きいならば現在
のフレームをインデックス候補とするステップST21が設
けられている点が第3実施形態と異なっている。
【0045】次に、第5実施形態について説明する。こ
の第5実施形態においても、第3実施形態で説明した図
3に関する部分は同様に説明されるので、ここでは説明
を省略する。従って、インデックス映像選択部106の
処理についてのみ、説明を行なう。
【0046】図6は第5実施形態の動画像インデックス
生成装置におけるインデックス映像選択部106のブロ
ック図の一例である。まず、カット情報記憶部に記憶さ
れたカット情報をもとに、インデックス映像がまだ選択
されていないカット間のフレームがインデックス映像の
選択範囲として選ばれる。
【0047】インデックス映像選択範囲内のフレーム
は、移動オブジェクト分離部601においてインデック
ス選択範囲内のフレームについてフレーム内に存在して
いるオブジェクトの分離処理が行なわれる。例えば、映
像の小領域ごとにフレーム間での移動量をベクトルとし
て推定し、これをフレーム前面に対して行なう。この処
理により得られたフレーム全体の小領域ごとの動きの情
報は、一般にオプティカルフローと呼ばれ、様々な手法
が開発されている(例えば、PROCEEDING OF THEIEEE, p
p.917-935, VOL.76, NO.8,1988.など)。次に、得られ
た動きを表すベクトルをクラスタリングすることにより
類似した動きを有する連続領域を特定している。このよ
うな処理により異なる動きを有しているオブジェクトを
分離することができる(例えば、COMPUTER GRAPHICS AN
D IMAGE PROCESSING, pp.301-315,VOL.9, 1979.な
ど)。
【0048】オブジェクト面積算出部602では、移動
オブジェクト分離部601で分離されたオブジェクトが
占める面積を算出する。一つのフレームから複数のオブ
ジェクトが分離された場合には、面積が最大のオブジェ
クトがどれであるかの特定も行なう。ここでの面積と
は、分離されたオブジェクトの占める画素数である。
【0049】次にオブジェクト重心算出部603におい
てオブジェクトの重心位置を算出する。これは一つのフ
レーム内の分離されたオブジェクトのうち、オブジェク
ト面積算出部において面積最大と判定されたオブジェク
トに対して行なう。
【0050】オブジェクト重心計算部603で算出され
た重心位置は、距離算出部605に送られ、フレームの
中心位置とのユークリッド距離が算出される。算出され
た距離は距離情報記憶部604に送られる。
【0051】距離情報記憶部では、処理されたフレーム
の中での最小の距離の値と、最小の距離を与えるフレー
ムを特定する情報(フレーム番号、先頭からの時間、バ
イト数など)とを記憶する。新たなフレームに関する距
離情報が605より送られてくると、最小の距離の更新
処理を行なう。インデックス映像選択範囲内の全てのフ
レームに関する距離情報の入力が終了すると、距離の最
小値を与えるフレームの特定情報をバス105を介して
インデックス情報記憶部107に送り、インデックス選
択処理を終了する。
【0052】第5実施形態において説明された処理を行
なうことにより、インデックス映像選択範囲内に登場す
る最も大きな移動オブジェクトが、最も中心に位置して
いるフレームがインデックスとして選択される。第1、
第2の実施例においてはオブジェクトが何であるかをあ
らかじめ特定する必要があった。しかし、第5実施形態
ではどのようなオブジェクトであっても、フレーム内に
大きく映っている移動オブジェクトが存在すれば、その
オブジェクトが中心に映っているフレームをインデック
スとして選択することが可能である。例えば、画面の端
から端まで車が横切るような場面においては、車が画面
の中央に位置しているフレームがインデックスとして選
択される。
【0053】第5実施形態で説明した処理は、ソフトウ
ェア、ハードウェアのどちらでも行なうことが可能であ
る。ソフトウェアにより処理を行なう場合には例えば図
9のフローチャートに示す処理により、本発明のインデ
ックス生成を行なうことが可能である。図9において、
フレーム区間から未処理のフレームを選択するステップ
ST11の処理を行なう前に、フレーム区間に含まれる移動
オブジェクトを分離するステップST22が設けられてい
る。また、ステップST11とステップST14との間にフレー
ム画像に含まれる面積最大のオブジェクトの重心を求め
るステップST23とオブジェクトの中心と映像の中心との
距離を求めるステップST24とが設けられている。その他
の処理ステップは図5の処理ステップと同一なので重複
説明を省略する。
【0054】次に第6実施形態に係る動画像インデック
ス生成装置について説明する。第6実施形態において
も、第3実施形態で説明した図3に関する部分は全く同
様に説明されるので、ここでは説明を省略する。したが
って、インデックス映像選択部106の処理についての
み、説明を行なう。
【0055】図10は第6実施形態に係る生成装置にお
けるインデックス映像選択部106のブロック図の例で
ある。まず、これまでの幾つかの実施形態と同様、カッ
ト情報記憶部109に記憶されたカット情報をもとに、
インデックス映像がまだ選択されていないカット間のフ
レームがインデックス映像の選択範囲として選択され
る。
【0056】インデックス映像選択範囲内のフレーム
は、移動オブジェクト分離部802においてインデック
ス選択範囲内のフレームについてフレーム内に存在して
いるオブジェクトの分離処理が行なわれる。これは第5
実施形態において説明した601と同様のものであり、
オプティカルフローのクラスタリングにより、行なうこ
とが可能である。
【0057】オブジェクト重心算出部801では、80
2で分離されたオブジェクトの重心を算出する。ただ
し、第5実施形態とは異なり、分離された全てのオブジ
ェクトについて重心が計算される。オブジェクト面積算
出部803は、802で分離された全てのオブジェクト
の面積(占有する画素数)を算出する。これら、重心の
位置情報、および面積情報はオブジェクトごとにオブジ
ェクト評価値算出部804に送られる。
【0058】オブジェクト評価値算出部804では、面
積情報、重心の位置情報からオブジェクト毎に評価値を
算出する。オブジェクト評価値は、面積が大きいほど大
きくなり、重心位置が画面の中央に近いほど大きくなる
ように決定される。例えば、面積をs’、重心と画面の
中央との距離をd’,C6,C7,C8,C9を定数と
して、 とする。オブジェクト評価値は同一のフレームから分離
されたオブジェクト全てについて算出され、フレーム評
価値算出部806に送られる。
【0059】フレーム評価値算出部806では、同一フ
レーム内のオブジェクトについて算出された評価値から
フレームの評価値を算出する。これは、例えば単純に和
をとることにより行なわれたり、しきい値以上のオブジ
ェクト評価値の数として算出することができる。算出さ
れたフレーム評価値はフレーム評価値記憶部805に送
られる。フレーム評価値記憶部805では、インデック
ス選択範囲内のフレーム全ての中から最大のフレーム評
価値を持つフレームを選出し、バス105を介してイン
デックス情報記憶部107にフレームを特定する情報
(フレーム番号、先頭からの時間、バイト数など)を送
り、インデックス映像選択範囲内からのインデックス選
択処理を終了する。
【0060】第6実施形態のようにインデックス選択処
理を行なうことにより、インデックス選択範囲内のフレ
ームのうち、移動しているオブジェクトがなるべく多
く、なるべく画面の中心付近に存在し、なるべく大きく
映っているフレームがインデックスとして選ばれる。こ
のような性質を持つフレームをインデックスにすること
により、動画像に登場するオブジェクトを素早く認識す
ることが可能になる。
【0061】第6実施形態で説明した処理は、ソフトウ
ェア、ハードウェアのどちらでも行なうことが可能であ
る。ソフトウェアにより処理を行なう場合には例えば図
11のフローチャートに示す処理により、本発明のイン
デックス生成を行なうことが可能である。図9に示した
第5実施形態の動作説明のフローチャートと図11の第
6実施形態に係る生成装置の動作との違いは、図9のス
テップST24およびST14の代わりに、オブジェクト毎に評
価値を求めこれらの和をフレームの評価値とするステッ
プST25と、フレームの評価値が最も大きいのならば現在
のフレームをインデックス候補とするステップST26とが
設けられている点である。
【0062】次に、第7実施形態に係る動画像インデッ
クス生成装置について説明する。この第7実施形態に係
る装置においても、第3実施形態で説明した図3に関す
る部分の構成は全く同一であるので、重複説明を省略す
る。したがって、インデックス映像選択部106の処理
についてのみ、説明を行なう。
【0063】図12は第7実施形態に係る動画像インデ
ックス生成装置におけるインデックス映像選択部106
のブロック図の異なる例である。これまでの実施形態と
同様に、はじめにカット情報記憶部に記憶されたカット
情報をもとに、インデックス映像がまだ選択されていな
いカット間のフレームがインデックス映像の選択範囲と
して選ばれる。
【0064】インデックス映像選択範囲内のフレーム
は、カメラパラメータ推定部1001においてカメラパ
ラメータが推定される。カメラパラメータは、動画像を
撮影したときの被写体とカメラとの相対的な位置、向
き、およびパンやズームなどの移動、倍率の変化等に関
するパラメータのことを指している。カメラパラメータ
推定部1001では、複数の連続するフレームから、有
するフレームにおけるカメラパラメータ推定部1001
では、複数の連続するフレームから、有るフレームにお
けるカメラパラメータを推定する。このための手法とし
ては、ハフ変換を用いて動きのベクトルの消失点を求
め、複数有る消失点のうちの最大の投票数を得た消失点
を背景に対する消失点とし、カメラパラメータに関する
拘束式を説くなどの手法がある。カメラパラメータと消
失点との関係やカメラパラメータを求める手法は、例え
ば「金谷健一著、『画像理解』、森北出版」などに詳し
い。カメラパラメータが推定されると、推定されたパラ
メータの値はカメラパラメータマッチング部1004に
送られる。
【0065】カメラパラメータマッチング部1004で
はカメラパラメータ推定部1001から送られたパラメ
ータ値と、登録カメラパラメータ記憶部1002に登録
されているカメラパラメータとが同じかどうかの判定を
行なう。1002に登録されているカメラパラメータ
は、1フレームが有するパラメータ値でも良いが、それ
よりはむしろカメラパラメータの変化点としておく方が
望ましい。例えば、ズーム・インが終了した時点のフレ
ームとして、ズームを表すパラメータ(ズーム・インで
正値をとるものとする)の値が0、かつ直前のフレーム
におけるパラメータの微分値が負となる条件を登録した
り、パンの始まりや終わりとして、パンを表すパラメー
タが0で、直前のフレームのパラメータの微分値の絶対
値がしきい値よりも大きくなるといった条件を登録す
る。カメラパラメータマッチング部1004はこれらの
登録カメラパラメータと推定されたカメラパラメータが
一致した場合には、マッチしたという情報をフレームの
特定情報と共にマッチング情報記憶部1003に送る。
【0066】マッチング情報記憶部では、インデックス
映像選択範囲内のフレーム全てについての処理が終了す
るまで、全てのマッチング情報を記憶しておく。そし
て、複数のインデックスの選択が許されている場合に
は、マッチしたフレームの特定情報を全てインデックス
情報蓄積部107に送り、インデックス選択処理を終了
する。
【0067】インデックス映像選択範囲内から一つのイ
ンデックスのみを選択する場合、一般に1003に記憶
された複数のフレームの中から一つをインデックスとし
て選択しなければならない。この際の処理としては、第
3ないし第6実施形態で説明した処理をマッチング情報
記憶部1003に記憶されたフレームに対して行ない、
インデックスを選択することが可能である。また、簡略
的に決定したい場合には、インデックス映像選択範囲内
の真ん中に近いフレームを選択したり、先頭のフレーム
を選択したりしても良い。
【0068】第7実施形態のようにインデックス選択処
理を行なうことにより、例えば、人物の顔にズーム・イ
ンした映像が含まれる場合では、ズーム・インされた顔
の映像が大きく映っているフレームがインデックスとし
て選択されるため、動画像に途上しているものや撮影者
が注目しているものがインデックスに反映されることに
なる。
【0069】また、図18は、「水平方向、垂直方向の
カメラパラメータが0で、直前の水平方向のカメラパラ
メータの微分値のあるしきい値を上回る」という条件を
登録した例である。この条件は、左右方向のカメラの動
き、すなわちパンの終了したフレームを示している。図
18の例において説明されている動画像は、右方向のパ
ンがずっと続き、最後に人物の顔が中心にきたところで
パンが終了し、カメラが静止するというものである。水
平方向、垂直方向のカメラの動き速度(カメラパラメー
タ)は上のグラフ、そして同速度の微分値を下のグラフ
に示している。この例では、右側のフレームにおいて、
水平方向の動き速度が0で、かつ、直前の微分値がしき
い値を上回って大きく突出しているため、インデックス
画像に選択されている。
【0070】第7実施形態で説明した処理は、ソフトウ
ェア、ハードウェアのどちらでも行なうことが可能であ
る。ソフトウェアにより処理を行なう場合には例えば図
13のフローチャートに示す処理により、本発明のイン
デックス生成を行なうことが可能である。ステップST11
において、フレーム区間から未処理のフレームを選択し
た後、ステップST31において、フレーム画像のカメラパ
ラメータを推定する。ステップST32において、フレーム
区間内の全てのフレームのカメラパラメータを求めたか
否かが判断される。全てのフレームのカメラパラメータ
が求められたものと判断された場合には、登録されてい
るカメラパラメータを含むフレームをインデックス候補
とする(ステップST33)。最後に、インデックス候補が
複数の場合、そのうちの1つを選択し、インデックス画
像とする(ステップST34)。
【0071】次に第8実施形態に係る動画像インデック
ス生成装置について説明する。第8実施形態において
も、第3実施形態のインデックス生成装置で説明した図
3に関する部分は全く同様に説明されるので、ここでは
説明を省略する。従って、インデックス映像選択部10
6の処理についてのみ、説明を行なう。
【0072】図14は第8実施形態におけるインデック
ス映像選択部106のブロック図の例である。これまで
の実施例と同様、はじめにカット情報記憶部に記憶され
たカット情報をもとに、インデックス映像がまだ選択さ
れていないカット間のフレームが選ばれる。選択範囲内
のフレームは順次バスを介してフレーム画像記憶部12
01に読み込まれる。
【0073】比較フレーム画像記憶部1203には動画
像に含まれるフレームのうち、1201に読み込まれて
いるフレーム、及びそのフレームから決められたフレー
ム数以上離れた位置にあるフレームが順次読み込まれ
る。類似度算出部1204はフレーム画像記憶部120
1と比較フレーム画像記億部1203に読み込まれてい
るフレームとの類似度をあらかじめ決められた手法によ
り算出する。例えば、単純に対応する位置の画素値の差
分の絶対値もしくは2乗した値をフレーム全体で足し合
わせるといった方法がとられる。
【0074】しきい値算出部1202は、比較部120
5において類似度と比較されるしきい値を算出する。し
きい値は、通常、定数としておけば十分であるが、画面
全体の色や輝度の分布により変化させることも可能であ
る。比較部1205においては、しきい値よりも高い類
似度であると判定された場合には、フレーム画像記憶部
1201に読み込まれているフレームをインデックス候
補として、類似度とフレームを特定するフレーム番号等
の情報がインデックス候補記憶部1206に送られる。
【0075】インデックス候補記憶部1206では、一
つのフレームのみが候補となっている場合にはこれをイ
ンデックス映像として選択するが、通常は複数のフレー
ムが候補となるか、一つも候補にならない。一つも候補
がない場合には、他の方法により選ばれたフレームをイ
ンデックス映像とする。例えば、第3ないし第7実施形
態において説明した手法により選択されたフレームをイ
ンデックス映像と決定する。
【0076】複数のフレームが候補となっている場合に
は、その中の一つをインデックス映像と決定する。この
ときには、第3内次第7実施形態において説明した手法
を候補となっているフレームについてのみ行なうことに
より決定することができる。また、単純な方法として、
類似度の最大値を与えるフレームに決定する方法や、候
補となったフレームのうちで真ん中に位置するフレーム
に決定するという方法でも良い。
【0077】第8実施形態で説明された手法により、重
要であるために繰り返し撮影されている場面がインデッ
クスとして選択されることが可能になる。例えば、スポ
ーツ映像においてリプレイとして繰り返し出てくるシー
ンや、スロー再生として同じシーンを異なる再生速度で
映し出すような場合がこれに相当する。これらはどれも
重要なシーンであり、本実施例による方法で検出するこ
とが可能である。これらのフレームからインデックスを
選択することにより検索や、内容理解の効率化が図れ
る。
【0078】第8実施形態において説明した処理は、ソ
フトウェア、ハードウェアのどちらでも行なうことが可
能である。ソフトウェアにより処理を行なう場合には例
えば図15のフローチャートに示す処理により、本発明
のインデックス生成を行なうことが可能である。図15
において、まず、フレーム区間辛み処理のフレームを選
択し(ステップST11)、次に、ステップST35において、
他のフレームとの類似度を算出する。ステップST36で
は、類似度がしきい値よりも大きなフレームをインデッ
クス候補として設定する。ステップST16において、フレ
ーム区間内の全てのフレームが試されたか否かを判断す
る処理動作は第3ないし第7実施形態に係る動作と同じ
である。全てのフレームについて処理が終了していない
場合には、ステップST11,ST35およびST36を全てのフレ
ームについて行ない、全てのフレームについての処理が
終了した場合には、ステップST37に進む。ステップST37
においては、インデックス候補が複数の場合にその内の
1つを選択してインデックス映像として出力する。
【0079】次に、上記インデックス生成方法および装
置により生成されたインデックス画像を表示出力する方
法について、図19ないし図21に従い詳細に説明す
る。図19は本発明の第9実施形態に係る動画像インデ
ックス生成方法のインデックス画像の表示を説明するた
めの概念図である。CRT(Cathode Ray Tube)や液晶
ディスプレイ等の表示装置の画面10には、動画像のあ
る一定の時間区間を表す立体アイコンウインドウ11が
最も手前側に表示されており、その後ろには代表フレー
ムの一覧表示欄ウインドウ12が表示されている。立体
アイコンウインドウ11の横には、映像の編集作業を支
援する部品リストウインドウ13が表示されており、こ
の部品リストウインドウ13を用いて映像に関する編集
作業を行なうことができる。この部品リストウインドウ
13を用いて行なう編集作業については後述する。
【0080】図19において、各々のウインドウ11,
12および13は、画面内の仮想的3次元空間内に表示
されており、利用者の操作により上下左右および奥行き
方向に自由に位置を移動させることができ、また、自由
な方向に回転させることもできる。ここでいう「仮想的
3次元空間」とは、2次元で表示される画面内に投影表
示される3次元空間のことを意味しており、バーチャル
リアリティの分野で通常用いられている表示方法のこと
である。
【0081】左右の目の位置すなわち視点の位置に応じ
た表示方法を用いて、真の3次元表示を行なっても構わ
ないし、また、移動・回転についての自由度は、各々の
ウインドウ11,12および13が互いに衝突しないよ
うに、あるいは画面の表示上からも不都合とならないよ
うに、制限を加えておくようにしても良く、本発明に係
る動画像インデックス生成方法を含む表示装置によって
自動的に制御することも可能である。
【0082】図20は、図19の画面10における立体
アイコンウインドウ11のみを詳細に示す説明図であ
り、図において、立体アイコンウインドウ11は情報に
突出する代表フレーム15を有している。各代表フレー
ム15は、それを生成したショットの時間的な長さに比
例した奥行き方向の距離的な長さ分ずつ離隔して配置さ
れている。図20においては、奥行き方向の距離にわた
って並べられるフレームの連続として表示されている
が、これに限定されず、連続する一纏まりのフレーム毎
に箱状の容器に収納されているように表現しても良い。
【0083】また、立体アイコンを箱状にすると共にこ
の箱毎にインデックスを表示して視認しやすくすること
も可能であるし、時間的な経過を奥から手前に向かって
時間的に新しくなるように配列しても良いし、その逆に
手前から奥に向かって新しくするように並べても良い。
要するに、代表フレームを並べて表示する際に、それぞ
れのショットの時間の長さに比例した空間的な距離をも
って3次元空間内に配列されるような構成のものであれ
ば、細かい仕様は如何なるものであっても実施可能であ
る。
【0084】図21は、図19に示された代表フレーム
一覧ウインドウ12の詳細を示す説明図である。図21
において、ウインドウ12は、各ショットから生成され
た代表フレームを列挙するフレーム表示欄17と、フレ
ーム表示欄17に記載された代表フレームが示している
ショットの有する属性や付加情報等を表示する情報表示
欄18と、を備えている。属性・付加情報とは、ショッ
ト内のカメラ操作の情報(ズームやパン等)、登場人物
の有無、登場人物名、撮影時間、継続時間、フレーム数
等のショットに関する情報一般を指している。また、利
用者がそのショットについてのコメント(覚え書き)等
を入力したならば、これも属性・付加情報に含めても良
い。
【0085】さて、図19に戻り、この表示方法を用い
た操作の例について説明する。利由者は、立体アイコン
ウインドウ11または代表フレーム一覧ウインドウ12
を眺めながら、自分が必要であると判断したショットを
選択する。この選択操作は、例えば代表フレーム一覧ウ
インドウ12上で目的とするショットの部分をマウスで
クリックして、「選択ボタン」(図示せず)を押下する
か、再びクリックするかして選択する。また、代表フレ
ーム一覧ウインドウ12上の目的のショット部分にマウ
スポインタを位置決めしてマウスボタンを押し下げたま
ま部品リストウインドウ13上にマウスポインタ移動さ
せての端を放す(ドラッグ・アンド・ドロップ)ことに
よっても、目的のショットを選択することができる。
【0086】また、選択の対象は、代表フレーム一覧ウ
インドウでなく、立体アイコンウインドウ11であって
も良いし、ショット中の時間部分を限定して選択するよ
うにしても良い。部品リストウインドウ13にはこのよ
うにして選択・登録されたショットやショット中の部分
が列挙されている。この部品リストウインドウ13は動
画像全体から利用者が後になって編集作業に利用したも
のを素材として登録しておくための記録領域を想定して
表示しているものである。利用者は、動画像全体から必
要な部分だけを予めこの部品リストウインドウ13にピ
ックアップしておいて、後の操作においてはこの部品リ
ストウインドウ13に登録された映像素材を並べ替える
等の方法により目的のドキュメントを作成することがで
きる。
【0087】ここで、代表フレームのリストは、カット
検出によるものだけでなくて良い。例えば、カット検出
により決定されたショットの中でも、特定の人物が映っ
ているもののみを表示させたり、或いは、ズームインし
ているもののみを表示させたりする等、上記の属性・付
加情報を検索条件として利用者が指定したショットのみ
を表示させても良い。
【0088】上記第9実施形態に係る動画像インデック
ス生成方法および装置によれば、カット検出の結果を3
次元表示したことにより、立体アイコン表示の際にそれ
ぞれの代表フレームが重なり合い、見難くなるという問
題点を、利用者の任意の移動・回転操作により克服する
ことができる。また、複数のウインドウを3次元空間内
に配置したことにより、現在の作業に最も必要なウイン
ドウを最前面に移動させてきたりすることができるばか
りでなく、斜め方向に配置させることにより画面内の大
きな場所を占めずに多くのウインドウを表示させること
ができるなど、種々の効果がある。
【0089】さらに、部品リストウインドウを導入した
ことにより、長大な動画像から直接必要な部分を探索す
るという面倒な作業を行うことなく、ショット単位で映
像素材をピックアップし、次にピックアップした映像素
材を並べ換えることにより完成させているので、編集作
業環境を改善して動画編集作業の流れの効率化を図るこ
とができる。
【0090】
【発明の効果】本発明の動画像インデックス生成方法お
よび生成装置により、インデックスとして無意味なフレ
ームを選択するのではなく、人物などの意味のあるオブ
ジェクトが存在するフレームがインデックスとして選択
されるようになる。また、人物などのオブジェクトが多
く存在しているフレームがインデックスとして選択され
やすくなる。
【0091】さらに、大きなオブジェクトが、最も中心
に位置しているフレームがインデックスとして選択され
る。さらにまた、動画像に登場しているものや撮影者が
注目しているものがインデックスに反映されることにな
る。さらに、重要であるために繰り返し撮影されている
場面がインデックスとして選択されることが可能にな
る。
【0092】従って、内容的に意味のあるフレームがイ
ンデックスとして選択されることから、動画像のインデ
ックス表示を行なった際に、動画像の内容の把握が簡単
になり、また、所望の検索が容易になる。
【図面の簡単な説明】
【図1】本発明の基本概念としての第1実施形態に係る
動画像インデックス生成方法のステップを示すフローチ
ャート。
【図2】本発明の基本概念としての第2実施形態に係る
動画像インデックス生成装置の構成を示すブロック図。
【図3】本発明の第3ないし第8実施形態の全体の概略
構成を示すブロック図。
【図4】本発明の第3実施形態における選択部の構成を
示すブロック図。
【図5】本発明の第3実施形態における処理手順を示す
フローチャート。
【図6】本発明の第4実施形態における選択部の構成を
示すブロック図。
【図7】本発明の第4実施形態における処理手順を示す
フローチャート。
【図8】本発明の第5実施形態における選択部の構成を
示すブロック図。
【図9】本発明の第5実施形態における処理手順を示す
フローチャート。
【図10】本発明の第6実施形態における選択部の構成
を示すブロック図。
【図11】本発明の第6実施形態における処理手順を示
すフローチャート。
【図12】本発明の第7実施形態における選択部の構成
を示すブロック図。
【図13】本発明の第7実施形態における処理手順を示
すフローチャート。
【図14】本発明の第8実施形態における選択部の構成
を示すブロック図。
【図15】本発明の第8実施形態における処理手順を示
すフローチャート。
【図16】本発明における距離に関するオブジェクト辞
書の一例を示す説明図。
【図17】本発明における評価値に関するオブジェクト
辞書の他の一例を示す説明図。
【図18】本発明におけるカメラパラメータのオブジェ
クト辞書の例を示す説明図。
【図19】本発明の第9実施形態に係る表示方法を示す
説明図。
【図20】本発明の第9実施形態の詳細を示す説明図。
【図21】本発明の第9実施形態の異なる詳細を示す説
明図。
【符号の説明】
1 フレーム抽出手段 2 領域評価値算出手段 3 フレーム評価値算出手段 4 インデックス選択手段 101 ユーザインタフェース部 102 制御部 103 映像表示部 104 動画像記録部 105 バス 106 インデックス映像選択部 107 インデックス情報記憶部 108 カット検出部 109 カット情報記憶部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 窪 田 進 神奈川県川崎市幸区小向東芝町1 株式 会社東芝 研究開発センター内 (56)参考文献 特開 平9−9202(JP,A) 特開 平6−253254(JP,A) 特開 平5−20366(JP,A) 特開 平6−165107(JP,A) 特開 平7−38842(JP,A) 特開 平1−68084(JP,A) 特開 平3−214364(JP,A) 特開 平4−219878(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04N 5/76 - 5/956

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された動画像から各時間に対応する静
    止画像であるフレームを抽出するステップと、 所望の映像に関する辞書としての、見つけたいオブジェ
    クトの画像を予め学習させて統計的な分布を規定するパ
    ラメータを求めたものであるオブジェクト辞書を用い
    て、予め定められた算出方法により動画像の一部または
    全てに含まれる前記フレームの部分領域の評価値を算出
    するステップと、 前記フレームに含まれる全ての領域に対して算出された
    評価値からフレームの評価値を算出するステップと、 前記評価値に基づいて前記フレームのうちから特定のフ
    レームの画像を、表示の際のインデックス画像として選
    択するステップと、 を備える動画像インデックス生成方法。
  2. 【請求項2】前記動画像の一部または全体に含まれる前
    記フレームに対して、移動するオブジェクトを背景から
    切り出すステップと、 切り出された前記オブジェクトごとに予め定められた算
    出方法により評価値を算出するステップと、 同一フレームに含まれるオブジェクトの評価値からフレ
    ームの評価値を算出するステップと、 前記フレームの評価値に基づいて特定フレームを表示の
    際のインデックスとして選択して出力するステップと、 をさらに備える請求項1に記載の動画像インデックス生
    成方法。
  3. 【請求項3】前記動画像の一部または全体に含まれるフ
    レームに対して、前記動画像を撮影しているカメラの動
    きと向きの変化を示すカメラパラメータを推定するステ
    ップと、予め定められたカメラパラメータを有するフレ
    ームを表示の際のインデックスとして選択するステップ
    と、をさらに備える請求項1に記載の動画像インデック
    ス生成方法。
  4. 【請求項4】前記動画像の一部または全体に含まれるフ
    レームに対して任意の組み合わせのフレーム間の類似度
    を予め定められた算出方法により算出するステップと、
    前記類似度が所定の方法により算出されたしきい値より
    も大きな類似度を有するフレームを検出することによっ
    て繰り返し登場するフレームを検出するステップと、こ
    れら繰り返し登場するフレームの中から表示の際のイン
    デックスとするフレームを選択するステップと、をさら
    に備える請求項1に記載の動画像インデックス生成方
    法。
  5. 【請求項5】入力された動画像から各時間に対応する静
    止画像であるフレームを抽出するフレーム抽出手段と、 所望の映像に関する辞書としての、見つけたいオブジェ
    クトの画像を予め学習させて統計的な分布を規定するパ
    ラメータを求めたものであるオブジェクト辞書を格納
    し、予め定められた算出方法により動画像の一部または
    全てに含まれる前記フレームの部分領域の評価値を算出
    する領域評価値算出手段と、 前記フレームに含まれる全ての領域に対して前記領域評
    価値算出手段により算出された評価値からフレームの評
    価値を算出するフレーム評価値算出手段と、 前記評価値に基づいて前記フレームのうちから特定のフ
    レームの画像を、表示の際のインデックス画像として選
    択するインデックス画像選択手段と、 を備える動画像インデックス生成装置。
  6. 【請求項6】前記フレームの部分領域は移動するオブジ
    ェクトであり、前記インデックス選択手段は、この移動
    するオブジェクトの動き量に基づいて、動画像のシーン
    が激しく変化したフレームの静止画像をインデックス画
    像として選択することを特徴とする請求項5に記載の動
    画像インデックス生成装置。
  7. 【請求項7】前記フレームの部分領域は、繰り返し登場
    する類似度の高い部分領域であり、前記フレーム評価値
    算出手段は、フレーム間の類似度を評価値として算出
    し、前記インデックス画像選択手段は、所定のしきい値
    よりも前記評価値の高いフレームを繰り返しの多いイン
    デックス画像として選択することを特徴とする請求項5
    に記載の動画像インデックス生成装置。
JP02296197A 1997-02-05 1997-02-05 動画像インデックス生成方法および生成装置 Expired - Fee Related JP3312105B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02296197A JP3312105B2 (ja) 1997-02-05 1997-02-05 動画像インデックス生成方法および生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02296197A JP3312105B2 (ja) 1997-02-05 1997-02-05 動画像インデックス生成方法および生成装置

Publications (2)

Publication Number Publication Date
JPH10224736A JPH10224736A (ja) 1998-08-21
JP3312105B2 true JP3312105B2 (ja) 2002-08-05

Family

ID=12097199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02296197A Expired - Fee Related JP3312105B2 (ja) 1997-02-05 1997-02-05 動画像インデックス生成方法および生成装置

Country Status (1)

Country Link
JP (1) JP3312105B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1986128A2 (en) 2007-04-23 2008-10-29 Sony Corporation Image processing apparatus, imaging apparatus, image processing method, and computer program
US8270806B2 (en) 2008-10-29 2012-09-18 Canon Kabushiki Kaisha Information processing apparatus and method of controlling same
US8379931B2 (en) 2008-06-27 2013-02-19 Canon Kabushiki Kaisha Image processing apparatus for retrieving object from moving image and method thereof
US8866900B2 (en) 2008-11-12 2014-10-21 Canon Kabushiki Kaisha Information processing apparatus and method of controlling same

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2796218C (en) * 1998-11-30 2016-11-29 Gemstar Development Corporation Search engine for video and graphics
JP2000350156A (ja) * 1999-06-09 2000-12-15 Hitachi Ltd 動画像情報の記憶方法及びこれを記録した記録媒体
JP4497761B2 (ja) 2001-07-18 2010-07-07 キヤノン株式会社 画像処理装置及びインデックス作成方法
JP3976316B2 (ja) * 2002-10-18 2007-09-19 富士フイルム株式会社 画像再生装置
JPWO2005086478A1 (ja) * 2004-03-04 2008-01-24 セイコーエプソン株式会社 動画像データ処理
JP2005269510A (ja) 2004-03-22 2005-09-29 Seiko Epson Corp ダイジェスト画像データの生成
US7697785B2 (en) * 2004-03-31 2010-04-13 Fuji Xerox Co., Ltd. Generating a highly condensed visual summary
JP4259421B2 (ja) * 2004-08-02 2009-04-30 日本電信電話株式会社 映像の代表画像選出方法及びプログラム
US20070266322A1 (en) * 2006-05-12 2007-11-15 Tretter Daniel R Video browsing user interface
JP5095501B2 (ja) * 2008-05-27 2012-12-12 富士フイルム株式会社 注目度算出装置および方法並びにプログラム
JP5111269B2 (ja) 2008-07-09 2013-01-09 キヤノン株式会社 画像処理装置、画像処理方法
JP2010166256A (ja) 2009-01-14 2010-07-29 Sony Corp 情報処理装置、情報処理方法、およびプログラム
CN104205089B (zh) 2012-02-29 2018-10-16 全球文档系统控股有限责任公司 流识别和过滤

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1986128A2 (en) 2007-04-23 2008-10-29 Sony Corporation Image processing apparatus, imaging apparatus, image processing method, and computer program
US8064656B2 (en) 2007-04-23 2011-11-22 Sony Corporation Image processing apparatus, imaging apparatus, image processing method, and computer program
US8379931B2 (en) 2008-06-27 2013-02-19 Canon Kabushiki Kaisha Image processing apparatus for retrieving object from moving image and method thereof
US8270806B2 (en) 2008-10-29 2012-09-18 Canon Kabushiki Kaisha Information processing apparatus and method of controlling same
US8866900B2 (en) 2008-11-12 2014-10-21 Canon Kabushiki Kaisha Information processing apparatus and method of controlling same

Also Published As

Publication number Publication date
JPH10224736A (ja) 1998-08-21

Similar Documents

Publication Publication Date Title
JP3312105B2 (ja) 動画像インデックス生成方法および生成装置
JP4226730B2 (ja) 物体領域情報生成方法及び物体領域情報生成装置並びに映像情報処理方法及び情報処理装置
CN107633241B (zh) 一种全景视频自动标注和追踪物体的方法和装置
US9361943B2 (en) System and method for tagging objects in a panoramic video and associating functions and indexing panoramic images with same
EP2426917A1 (en) Display control device, display control method, and program
JP6179889B2 (ja) コメント情報生成装置およびコメント表示装置
US6342904B1 (en) Creating a slide presentation from full motion video
US8818038B2 (en) Method and system for video indexing and video synopsis
US7146022B2 (en) Spatiotemporal locator processing method and apparatus
US5805733A (en) Method and system for detecting scenes and summarizing video sequences
JP4973188B2 (ja) 映像分類装置、映像分類プログラム、映像検索装置、および映像検索プログラム
US20090278937A1 (en) Video data processing
JP2002536729A (ja) 内容にもとづく視覚アニメ化データの索引付け及び検索用の移動オブジェクトの軌跡を表現するシステム及び方法
US11758082B2 (en) System for automatic video reframing
JP2000512410A (ja) 参照モデルを用いて画像情報を索引付けをする方法
JP2019186689A (ja) 情報処理装置、システム、分析方法、コンピュータプログラム、及び記憶媒体
JP6203188B2 (ja) 類似画像検索装置
JP3372096B2 (ja) 画像情報アクセス装置
JP2003303333A (ja) 画像表示制御装置
Lienhart et al. The MoCA workbench: Support for creativity in movie content analysis
CN113312949B (zh) 视频数据处理方法、视频数据处理装置和电子设备
JP2009123020A (ja) 情報処理装置、情報処理方法、プログラム及び記憶媒体
JPH11134352A (ja) 動画像表示方法
El-Alfy et al. Multi-scale video cropping
JP2006244424A (ja) 映像シーン分類方法及び装置及びプログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090524

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090524

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100524

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110524

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110524

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120524

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120524

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130524

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130524

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140524

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees