JP2006325223A - 動画像の特徴情報記述方法および記憶媒体 - Google Patents
動画像の特徴情報記述方法および記憶媒体 Download PDFInfo
- Publication number
- JP2006325223A JP2006325223A JP2006160928A JP2006160928A JP2006325223A JP 2006325223 A JP2006325223 A JP 2006325223A JP 2006160928 A JP2006160928 A JP 2006160928A JP 2006160928 A JP2006160928 A JP 2006160928A JP 2006325223 A JP2006325223 A JP 2006325223A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- information
- feature information
- screen
- shot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
Abstract
【課題】階層的な特徴区間決定を可能にし、特徴画面の検索を容易にするための動画像データの特徴情報記述方法および記憶媒体を提供することにある。
【解決手段】動画像ファイルに対して、動画像ファイル全体の特徴情報を記述し、該動画像ファイル全体の特徴情報の下位情報として動画像ファイル内の各ショットの特徴情報#1〜#Nsを記述し、該ショットの特徴情報の下位情報として各ショット内の同一特徴区間の特徴情報#1〜#Nkを記述する。また、前記各ショット内の同一特徴区間の特徴情報の下位情報として、さらに第n階層(nは正の整数)まで下位の同一特徴区間の特徴情報を記述する。
【選択図】 図12
【解決手段】動画像ファイルに対して、動画像ファイル全体の特徴情報を記述し、該動画像ファイル全体の特徴情報の下位情報として動画像ファイル内の各ショットの特徴情報#1〜#Nsを記述し、該ショットの特徴情報の下位情報として各ショット内の同一特徴区間の特徴情報#1〜#Nkを記述する。また、前記各ショット内の同一特徴区間の特徴情報の下位情報として、さらに第n階層(nは正の整数)まで下位の同一特徴区間の特徴情報を記述する。
【選択図】 図12
Description
本発明は動画像の特徴情報記述方法および記憶媒体に関し、特に、デジタル動画像信号の特徴情報記述方法および記憶媒体に関する。
動画像信号から特徴画面を抽出する従来装置の一例を図23に示す。図23において、制御部108からの制御信号aにより、動画像データは動画像メモリ104から1画面ずつ順次取り出され、特徴ベクトル抽出部100に入力される。特徴ベクトル抽出部100では、入力画面の特徴ベクトルIVが抽出される。該特徴ベクトルとしては輝度のヒストグラムなどを利用することができる。抽出された入力画面の特徴ベクトルIVは、変化度測定部101に入力されると共に、入力ベクトルメモリ105に蓄積される。
入力画面の特徴ベクトルIVは、変化度測定部101にて、参照ベクトルメモリ106に蓄積されている参照画面の特徴ベクトルRVと比較され、参照画面からの変化度値Dが測定される。この変化度値Dは、例えば、入力画面の特徴ベクトルIVと参照画面の特徴ベクトルRVの絶対差分和などで求めることができる。
次に、該変化度値Dは特徴区間決定部102に入力される。該特徴区間決定部102は、変化度値Dが予め定められた閾値Tより大きいか否かの判断をする。この判断が終わると、該判断の結果を示す信号bが参照ベクトル更新部107および制御部108に伝えられる。
該特徴区間決定部102において、前記変化度値Dが前記閾値Tより大きいと判断された場合には、同一特徴区間を終了させ、同一特徴区間情報cを特徴画面抽出部103に出力する。特徴画面抽出部103は、同一特徴区間情報cから同一特徴区間内における先頭の画面の画面番号を求め、該画面番号dを特徴画面として出力する。これと同時に、参照ベクトル更新部107は参照ベクトルを更新する。参照ベクトルの更新方法としては、最後に入力された画面の特徴ベクトルを入力ベクトルメモリ105から取り出すことにより更新することができる。この更新された参照ベクトルは参照ベクトルメモリ106に蓄積される。次に、画像メモリ104から次の画像データが読み出され、該入力画像データの特徴ベクトルと更新された参照ベクトルを用いて、前記したのと同じ動作が行われ、次の同一特徴区間が決定される。
一方、前記変化度測定部101で測定された変化度値Dが閾値T以下の場合は、制御部108からの制御信号aにより、画像メモリ104から次の画像データが読み出され、これを特徴ベクトル抽出部100に入力させて、前記と同様の変化度測定処理を行う。
なお、画像メモリ104から読み出される動画像データが第1画面の場合は、入力ベクトルメモリ105に蓄積された入力画面の特徴ベクトルIVを参照ベクトルメモリ106に参照ベクトルとして入力させ、第1画面に関する処理を終了させる。その後は、制御部108からの制御により、画像メモリ104から次の画像データを特徴ベクトル抽出部100に入力させて、次の変化度測定処理を行う。
前記した従来方法では、変化度値Dが高い画面が現れた時点で同一特徴区間が終了するが、常に区間の最初の画面と入力画面を比較しているため、同一特徴区間の決定は先頭画面の特性に大きく左右されることになる。
また、固定した閾値で特徴区間を決定するため、大きな動きがあるシーンでは特徴区間数および特徴画面数は多くなり、逆に動きの少ないシーンでは特徴区間数および特徴画面数は少なくなる。このため、目標の特徴画面数でシーンを分割することは困難になる。
さらに、特徴画面は同一特徴区間の先頭の画面を用いることが多いが、例えばパンするシーンでは先頭画面よりも中ほどの画面が意味的に重要なことが多い。しかし、従来装置では、該意味的に重要な画面を特徴画面とすることができない。さらに、各特徴画面間の関係がわからないため、特徴区間を階層的に表示することができない。
本発明の目的は、前記した従来技術の問題点を解決し、階層的な特徴区間決定を可能にし、特徴画面の検索を容易にするための動画像データの特徴情報記述方法および記憶媒体を提供することにある。
前記の目的を達成するために、本発明は、動画像ファイルに対して、動画像ファイル全体の特徴情報を記述し、該動画像ファイル全体の特徴情報の下位情報として動画像ファイル内の各ショットの特徴情報を記述し、該ショットの特徴情報の下位情報として各ショット内の同一特徴区間の特徴情報を記述するようにした点に特徴がある。
本発明によれば、映像ファイルの内容を階層的に記述することができ、必要とするレベルで、情報の内容を容易に検索することが可能となる。
また、動画像の特徴情報記述方法により得られた動画像ファイルを、コンピュータ読取り可能な記憶媒体に格納して、提供できるようになる。
以下に、図面を参照して、本発明を詳細に説明する。図1は、本発明の一実施形態の概略の構成を示すブロック図、図2はその動作を説明するフローチャートである。この実施形態は、動画像データから、目標とする個数の同一特徴区間を抽出できるようにした点に特徴がある。
図1において、制御部108からの制御信号aにより動画像データが動画像メモリ104から1画面ずつ順次取り出され、該取り出された画面は特徴ベクトル抽出部100に入力される。特徴ベクトル抽出部100は、該動画像データから入力画面の特徴ベクトルIVを順次抽出する。該特徴ベクトルとしては、輝度のヒストグラムなどを利用することができる。次に、入力画面の特徴ベクトルIVは変化度測定部101に送られ、また入力ベクトルメモリ105に送られて蓄積される。
変化度測定部101に送られた入力画面の特徴ベクトルIVは、参照ベクトルメモリ106に蓄積されている参照画面の特徴ベクトルRVと比較され、変化度値Dが測定される。例えば、変化度値Dは、図22の(1)式や(2)式のように入力画面の特徴ベクトルIV(i) と参照画面の特徴ベクトルRV(i) の絶対差分和や絶対差分二乗和などで求めることができる。
ここで、Mはベクトルの次数である。特徴ベクトルとしては、輝度画素データ、YUV画素データ、サブサンプリングした画素データ、小領域内の平均輝度データ、輝度ヒストグラム、YUVヒストグラム、RGBヒストグラムや、輝度、RGB、YUV画面平均などを用いることができる。
変化度値Dは特徴区間決定部102に入力され、予め定められた閾値TK0 と比較される。該比較の結果を示す信号bは、参照ベクトル更新部107と制御部108に送られる。該変化度値Dが該閾値TK0 より大きいと判断された場合には、特徴区間決定部102は同一特徴区間を終了させ、また参照ベクトル更新部107は参照ベクトルを更新する。また、同一特徴区間数カウンタ21はカウントアップする。参照ベクトルの更新方法の一例としては、最後に入力された画面の特徴ベクトルを入力ベクトルメモリ105から取り出し、参照ベクトルとして参照ベクトルメモリ106に蓄積する。
上記のようにして、1個の同一特徴区間が決定されると、画像メモリ104は制御部108からの制御信号aにより、引き続き、動画像データを1画面ずつ読み出す。そして、前記と同様の動作が行われ、更新された参照ベクトルを用いて、次の同一特徴区間を決定する。
一方、前記変化度値Dが閾値TK0 以下の場合は、特徴区間決定部102から、変化度値Dと閾値TK0 との比較結果を示す信号bが制御部108に送られる。そうすると、制御部108は、制御信号aにより、画像メモリ104からの次の画像データを読み出させ、次の1画面の特徴ベクトルIVと前記参照ベクトルRVとの変化度値Dを測定する処理を行う。以下、前記と同様の動作が繰り返される。
また、第1画面の場合は、入力ベクトルメモリ105に蓄積された入力画面の特徴ベクトルIVを参照ベクトルメモリ106に参照ベクトルとして入力させ、第1画面に関する処理を終了させる。次いで、制御部108からの制御により、画像メモリ104から次の画像データを読出して特徴ベクトル抽出部100に入力させて、次の変化度値Dを測定する処理を行う。
これらの処理をショット内の画面がすべて入力されるまで繰り返した後で、同一特徴区間数NK0 を同一特徴区間数カウンタ21から閾値決定部22に入力させる。閾値決定部22では、1ショット内の同一特徴区間数NK0 と、制御部108から指示された目標の同一特徴区間数NKTから同一特徴区関数特性を用いて、目標の同一特徴区間数NKTを得るための閾値TKTを決定する。
同一特徴区間数特性は、例えば図3のような特性図を用いることができる。図3の横軸は閾値(=TK)を示し、縦軸は同一特徴区間数(=NKT)を示す。例えば、閾値TK0 =500における同一特徴区関数NK0 =8で、目標の同一特徴区間数NKT=2の場合には、目標の閾値TKT=1000に設定すればよい。また、特性図から、多項式近似曲線を特性関数として求め、特性関数から数値計算することも可能である。
なお、このような特性図は、いくつかのテスト画像を用いて閾値TK0 を変化させたときの同一特徴区間数NK1の変化を調査し、グラフ化することにより求めることができる。また複数テスト画像が類似した特性を有する場合はそれらの特性曲線を平均化などの統計処理を行って特性の信頼性を高めることができる。
次に、新しく決定した閾値TKTを特徴区間決定部102に入力させる。次に、既に入力ベクトルメモリ105に記憶されているショット内の入力ベクトルを第1画面から取り出して、参照ベクトルメモリ106にセットする。次に、第2画面の入力ベクトルVを入力ベクトルメモリ105から取り出して、変化度測定部101に入力させる。また参照ベクトルメモリ106から参照ベクトルRVを取り出して変化度測定部101に入力させて、入力ベクトルVと参照ベクトルRVの変化度値Dを測定する。変化度値Dが新しい閾値TKTよりも大きい場合は同一特徴区間を終了させ、参照ベクトルを更新させる。
さらに、同一特徴区間のタイムコードを特徴画面抽出部103に入力させる。特徴画面抽出部103では同一特徴区間内の特徴画面を抽出する。例えば、同一特徴区間内における先頭の画面の画面番号を特徴画面として出力することができる。また、変形例として、先頭の画面から連続する画面の番号を特徴映像として出力することもできる。この場合、画面数としては、固定した画面数や同一特徴区間の長さに応じた比率で画面数を決定してもよい。
一方、変化度値Dが閾値TKT以下の場合は、次の画面の特徴ベクトルVを入力ベクトルメモリ105から取り出して、変化度値Dの測定を行う。
以上の処理を、ショット内の画面全てについて行う。図2のフローチャートは、本実施形態の前記した動作を示したものであるが、詳細な説明は省略する。この処理により、図4に示されているように、1ショットの動画像データを、目標とする個数(図示の場合4個)の同一特徴区間に分けることができるようになる。
次に、本発明の第2の実施形態について、図1、図5を参照して説明する。前記第1の実施形態では、参照ベクトル更新部107における参照ベクトルの更新は、更新前に入力されたベクトルのうち最後に入力されたベクトルを参照ベクトルとするように更新している。したがって、変化度値Dを測定する場合、常に同一特徴区間内で最初の画面の入力ベクトルと現在入力されているベクトルを比較することになる。例えば、図5(a) では、同一特徴区間1では入力画面1の特徴ベクトルを参照ベクトルRV1として、RV1と第2画面以降の画面の入力ベクトルを比較して特徴区間を決定している。この場合、同一特徴区間内における最初の画面の特性に変化度測定が大きく依存する。
これに対して、該第2の実施形態は、図5(b) に示されているように、参照ベクトルの特性を画面入力の度に更新して参照ベクトルの特性変動を抑えるようにした点に特徴がある。この場合、新たな画面が入力される度に参照ベクトルが更新されるため、同一特徴区間の特徴を表した参照ベクトルを得ることができる。参照ベクトルの更新方法としては、これまで入力されてきた特徴ベクトルIVk(i)の平均やメディアン等の共通特徴ベクトルを用いることができる。
特徴ベクトルの平均ベクトルRVc(i)は、例えば図22の(3)式から求めることができる。
ここで、Cはこれまで入力された画面のうち同一特徴区間内の画面数を示す。
また、特徴ベクトルのメディアンベクトルRVc(i)は、例えば下記の(4)式から求めることができる。
RVc(i)=Median{IVk(i),k=0,1,…,C−1} …(4)
また、同一区間内に存在する画面を画素単位で平均した画面平均に対する上記の特徴ベクトルを参照ベクトルとすることもできる。
次に、本発明の第3の実施形態について説明する。前記第1の実施形態では特徴画面抽出部103において同一特徴区間内における先頭の画面の画面番号、または先頭の画面から連続する画面の番号を特徴画面として出力している。しかしながら、同一特徴特徴画面がカメラパンのシーンの場合には、必ずしも最初の画面がその同一特徴区間を代表する画面とはいえず、区間内における共通の特徴を有する画面を代表画面とすることが望ましい。区間内の共通の特徴ベクトルをCVとすると、代表画面Rは、下記の(5)式のように、CVとIVの距離を最小にする画面Rとして求めることができる。
R=arg[Min{Dist( CV(i) ,IVR(i))}] …(5)
ここで、CVとIVの距離Distの測定については、(1)(2)式のようにベクトル間の絶対差分和や絶対差分二乗和などを用いることができる。また、共通特徴ベクトルCVとしては、図22の(6)式のような同一特徴区間内の平均ベクトルや、下記の(7)式のようなメディアンベクトルを用いることができる。
CV(i) =Median{IVk(i),k=0,1,…,TC−1} …(7)
ここで、TCは同一特徴区間全体の画面数を示す。
本実施形態の変形例として、代表画面を、連続する複数の画面とすることも可能である。この場合、代表画面Rを含むRVフレームを代表映像とすることができる。RVの値は、同一特徴区間長に依存しない固定値でも、同一特徴区間長に比例した値でもかまわない。また、代表映像における代表画面Rの位置は、代表映像の中心に位置しなくてもよい。
次に、本発明の第4実施形態について、図6を参照して説明する。前記第1の実施形態では、図3の同一特徴区間数特性図を用いて目標の特徴画面数に対する閾値を閾値決定部22において決定し、新しく決定した閾値TKTを用いて特徴区間決定部102で特徴区間の決定を行っている。
これに対して、本実施形態は、同一特徴区間数特性図を再帰的に用いて階層的に特徴区間を決定するようにした点に特徴がある。
この実施形態では、まず、第1の実施形態と同様に、ショット内のすべての画面に対して閾値TK0 で変化度を測定して、同一特徴区間数NK0 を求める。この際、参照ベクトルの更新については、前記第2の実施形態の手法を用いることが可能である。次に、第1階層の同一特徴区間数NKT1 を設定し、図6の特徴区間数特性からTK0 に対してNK0 を示す曲線1を用いてNKT1 に対する閾値TKT1 を求める。第1階層では閾値TKT1 を用いてショット内のすべての画面に対して変化度を測定して第1階層の同一特徴区間数NK1 を求め、各同一特徴区間の特徴画面を抽出する。この際、前記第1の実施形態や、第3の実施形態の手法を用いて特徴画面抽出することが可能である。
次に、第2階層の同一特徴区間数NKT2 を設定し、図6の特徴区間数特性からTKT1 に対してNK1 を示す曲線2を用いてNKT2 に対する閾値TKT2を求める。第2階層では閾値TKT2 を用いてショット内の変化度を測定して第2階層の同一特徴区間数NK2 を求め、各同一特徴区間の特徴画面を抽出する。この処理を第n階層まで繰り返して、第n階層の特徴画面を抽出する。なお、前記曲線1、2、…は、トレーニング画像を用いて求められた、予め求められている特性曲線である。
この実施形態によれば、ショット内の同一特徴区間数を階層的に決定することができるようになる。
次に、本発明の第5実施形態について、図7と図8を用いて説明する。なお、図7の図1と同一の符号は、同一または同等物を示し、詳細な動作説明を省略する。
前記第4の実施形態では、各階層についてショット内のすべての画面の特徴ベクトルを用いて同一特徴区間を求めているが、第5の実施形態は、各階層で求められた同一特徴区間の情報、例えば代表特徴ベクトルを用いて、次の階層の同一特徴区間を求めるようにした点に特徴がある。構成的には、入力ベクトルメモリ105と参照ベクトルメモリ106との間に、入力ベクトル更新部70を設けた点に特徴があるので、主に該入力ベクトル更新部70の動作について、詳しく説明する。
図1で説明したのと同様の動作により、閾値TK0 を用いて同一特徴区間を求める処理を、ショット内の画面がすべて画像メモリ104から入力されるまで繰り返した後で、同一特徴区間数カウンタ21でカウントした同一特徴区間数NK0 を閾値決定部22に入力させる。閾値決定部22では、同一特徴区間数NK0と第1階層における目標の同一特徴区間数NKT1から、図3または図6の同一特徴区間数特性を用いて目標の閾値TKT1を決定する。
次に、閾値決定部22で新しく決定された閾値TKT1は特徴区間決定部102に入力される。制御部108は入力ベクトル更新部70に指示を出して、第1特徴区間に存在する画面の入力ベクトルを入力ベクトルメモリ105から取り出させる。入力ベクトル更新部70は、受けとった入力ベクトルで参照ベクトルを更新し、参照ベクトルメモリ106にセットする。次に、第2特徴区間に存在する画面の入力ベクトルを入力ベクトルメモリ105から取り出して入力ベクトル更新部70で更新し、変化度測定部101に入力させる。
入力ベクトル更新部70では、下記の方法1〜4のいずれかを用いて、入力ベクトルを更新し、これを同一特徴区間の代表特徴ベクトルとすることができる。
方法1 同一特徴区間の先頭画面の入力特徴ベクトルを代表特徴ベクトルとして用いる。
方法2 同一特徴区間内の画面の入力特徴ベクトル平均ベクトルを代表特徴ベクトルとして用いる。
方法3 同一特徴区間内の画面の入力特徴ベクトルのメディアンベクトルを代表特徴ベクトルとして用いる。
方法4 同一特徴区間内の画面の入力ベクトルの平均ベクトルに最も距離の小さい入力ベクトルを有する画面の入力ベクトルを代表特徴ベクトルとして用いる。なお、距離の測定には、前記(1)式や(2)式のようにベクトル間の絶対差分和や絶対差分二乗和を用いることができる。
次に、参照ベクトルメモリ106から参照ベクトルRVを取り出して変化度測定部101に入力させて、第2特徴区間に存在する画面の代表特徴ベクトルと参照ベクトルの変化度値Dを測定する。変化度値Dが新しい閾値TKT1 よりも大きい場合は同一特徴区間を終了させ、参照ベクトルを更新させる。さらに同一特徴区間のタイムコードを特徴画面抽出部103に入力させる。特徴画面抽出部103では同一区間内の特徴画面を抽出する。例えば同一特徴区間内における先頭の画面の画面番号を特徴画面として出力することができる。
逆に、変化度値Dが閾値TKT以下の場合は、次の同一特徴区間の画面の代表特徴ベクトルを入力ベクトルメモリ105から取り出して、変化度測定を行う。
これらの処理をすべての同一特徴区間について行い、第1階層の特徴区間を決定する。この際、実施形態1や実施形態3の手法を用いて、各特徴区間における特徴画面抽出をすることが可能である。
次に、第2階層の同一特徴区間数NKT2 を設定し、特徴区間数特性からNKT2 に対する閾値TKT2 を求める。なお、閾値の求め方としては第1の実施形態や第4の実施形態に記載された方法を用いることができる。
第2階層では閾値TKT2 を用いて、第1階層で求めた各特徴区間における代表特徴ベクトルの参照ベクトルに対する変化度値を測定する。そして、第2階層の同一特徴区間数NK2を求め、各同一特徴区間の特徴画面を抽出する。この処理を第n階層まで繰り返して、第n階層の特徴画面を抽出する。
前記第1〜5実施形態で説明した動画像の特徴画面抽出機能は、ソフトウェア(プログラム)で実現でき、該ソフトウェアは、光ディスク、フロッピディスク、ハードディスクなどの過般型記憶媒体に記憶することができる。また、コンピュータなどのハードディスクなどのメモリ中に予め入れておいても、また該コンピュータが接続されたネットワークから該コンピュータのハードディスクなどのメモリ中に取り込むようにしてもよい。また、ネットワークのように、データを一時的に記憶保持するような伝送媒体であってもよい。
図21は、前記過般型記憶媒体あるいはハードディスクなどの記憶媒体に記憶されたプログラムを読み取って、前記動画像の特徴画面抽出機能を実行するコンピュータのハード構成を示すブロック図である。該コンピュータ200は、前記図1、図7に示した、特徴ベクトル抽出部100、変化度測定部101、特徴区間決定部102、特徴画面抽出部103、同一特徴区間数カウンタ21、閾値決定部22、および参照ベクトル更新部107の機能のプログラムが記憶された記憶媒体210と、該記憶媒体210に記憶されたプログラムを実行するCPU211と、各種のデータを記憶するROM212と、画像、入力ベクトル、参照ベクトル、演算パラメータ等を記憶するRAM213と、キーボード、マウスなどの入力装置214と、ディスプレー、プリンタなどの出力装置215と、ネットワークなどと接続される入出力インタフェース216等から構成されている。
CPU211は、記憶媒体210に記憶されている前記動画像の特徴画面抽出機能プログラムを実行することにより、前記第1〜5実施形態で説明した動画像の特徴画面抽出処理を実行する。
図8は、前記した処理を分かりやすく図示したもので、閾値TK0 を用いて同一特徴区間を求める処理をショット内の画面のすべてに対して行うことにより、NK0 個の同一特徴区間K0(0),K0(1),…,K0(NK0 −1)が得られたとすると、その後、前記のようにして、第1階層における目標の閾値TKT1を決定する。そして、該閾値TKT1を用いて、前記同一特徴区間K0(0),K0(1),…,K0(NK0 −1)から、それらの代表特徴ベクトルを用いて、第1階層の同一特徴区間K1(0),K1(1),…,K1(NK1 −1)を抽出する。次に、第2階層における目標の閾値TKT2を決定し、該閾値TKT2を用いて、前記第2階層の同一特徴区間K2(0),K2(1),…,K2(NK2 −1)を抽出する。以下、同様の処理をして、第n階層における目標の閾値TKTn を決定し、該閾値TKTn を用いて、第n階層の同一特徴区間Kn(0),Kn(1),…,Kn(NKn −1)を抽出する。
次に、本発明の第6実施形態について説明する。前記第1〜5の実施形態では同一特徴区間の検出方法について述べた。この第6の実施形態は、ショットとファイル全体の代表画面、代表映像の決定方法に特徴がある。図9は、本実施形態の動作を示すフローチャートである。まず、動画像を入力し(ステップS1)、入力された動画像についてカット点が検出される。カット点の検出方法としては「動画像のカット画面検出方法」(特開平7−59108号公報)などを利用することができる。これによりカット点とカット点間を示すショット区間を検出することができる(ステップS2)。次に、各ショット区間の動画像について、第1〜第5の実施形態で述べた同一特徴区間検出を用いて各ショット内における同一特徴区間を検出すると共に、同一特徴区間を代表する代表画面や代表映像を決定する(ステップS3)。
次に、ショット内の代表画面や代表映像を決定する(ステップS4)。図10はショット内の代表画面、代表映像を決定する方法を示すブロック図である。ショット内の画像はショット内画像メモリ801から取り出され、ショット内特徴ベクトル抽出部800に入力される。ショット内特徴ベクトルとしては第1の実施形態と同様に、画面内の輝度ヒストグラムなどを用いることができる。ショット内特徴ベクトルSIVはショット内特徴ベクトルメモリ802に蓄積されると共に、ショット内特徴画面・映像抽出部803に入力される。ショット内特徴画面・映像抽出部803では、共通特徴ベクトルSCVを用いて、ショット内の代表画面・映像が決定される。
すなわち、ショット内の代表画面SRはSCVとSIVの距離を最小にする画面として求めることができる。ここで、SCVとSIVの距離の測定についてはベクトル間の絶対差分和や絶対差分二乗和などを用いることができる。また、ショット内共通特徴ベクトルSCVについては、ショット内の平均ベクトルやメディアンベクトルを用いることができる。ショット内の代表映像としては、代表画面SRを含むSRVフレームを代表映像とすることができる。SRVの値はショット長に依存しない固定値でも、ショット長に比例した値でもかまわない。また、代表映像における代表画面SRの位置は代表映像の中心に位置しなくてもよい。さらにショット内の同一特徴区間情報を用いて、ショット代表画面が存在する同一特徴画面区間すべてを代表映像としてもよい。
本実施形態の変形例としては、前に求めた同一特徴区間における代表画面を用いてショット代表画面を決定することができる。この場合、ショット内画像メモリ801にはショット内のすべての画像を用いる代わりに、各同一特徴区間の代表画面のみを用いる。これにより特徴ベクトルの抽出処理や特徴画面・映像抽出に必要な処理量を大幅に削減することができる。さらに特徴ベクトルとして、同一特徴区間検出で用いた特徴ベクトルと同一のベクトルを用いることにより、ショット内特徴ベクトル抽出処理を省略することができる。
別の変形例としては、既に求められている各同一特徴区間における共通ベクトルCVを各同一特徴区間の特徴ベクトルとして用いて、上で述べた方法を用いてショット内共通特徴ベクトルSCVを求めることができる。この場合、各同一特徴画面における共通ベクトルをショット内特徴ベクトルとして用いることにより、前記変形例と同様にショット内特徴ベクトル抽出処理が不要になり、全体の処理量を削減することができる。
また、別の変形例の代表画面・代表映像の決定方法として、各同一特徴区間で最も長い区間を有する同一特徴区間の代表画面・代表映像を用いることも可能である。
次に、ファイル全体の代表画面や代表映像を決定する(ステップS5)。図11は映像ファイル内の代表画面、代表映像を決定する方法を示したものである。映像ファイル内の画像はファイル内画像メモリ901から取り出され、ファイル内特徴ベクトル抽出部900に入力される。ファイル内特徴ベクトルとしては、第1の実施形態と同様に、画面内の輝度ヒストグラムなどを用いることができる。ファイル内特徴ベクトルFIVはファイル内特徴ベクトルメモリ902に蓄積されると共に、ファイル内特徴画面・映像抽出部903に入力される。ファイル内特徴画面・映像抽出部903では、ファイル内の共通特徴ベクトルFCVを用いて、ファイル内の代表画面・映像FRが決定される。
ファイル内の代表画面FRはFCVとFIVの距離を最小にする画面として求めることができる。ここで、FCVとFIVの距離の測定についてはベクトル間の絶対差分和や絶対差分二乗和などを用いることができる。また、ファイル内共通特徴ベクトルFCVについてはファイル内画面の特徴ベクトルの平均ベクトルやメディアンベクトルを用いることができる。ファイル内の代表映像としては、代表画面FRを含むFRVフレームを代表映像とすることができる。また、ショット情報を用いて、ファイル代表画面を含むショットすべてを代表映像としてもよい。また、ショット内の同一特徴区間情報を用いて、ファイル代表画面が存在する同一特徴画面区間すべてを代表映像としてもよい。
変形例としては,前に求めた各ショット区間における代表画面を用いてファイル代表画面を決定することができる。この場合、ファイル内画像メモリ901にはファイル内のすべての画像を用いる代わりに,各ショットの代表画面のみを用いる。これにより特徴ベクトルの抽出処理や特徴画面・映像抽出に必要な処理量を大幅に削減することができる。さらに特徴ベクトルとして、ショット内代表画面検出で用いた特徴ベクトルと同一のベクトルを用いることにより、ファイル内特徴ベクトル抽出処理を省略することができる。
別の変形例としては,ショット代表画面検出で用いたショット内の共通特徴ベクトルSCVを用いてファイル代表画面を求めることができる。この場合、各ショットにおける共通特徴ベクトルをファイル内特徴ベクトルとして用いることにより,前記変形例と同様にファイル内特徴ベクトル抽出処理が不要になり、全体の処理量を削減することができる。
また別の変形例としては,代表画面・代表映像の決定方法として各ショットで最も長いショット長を有するショットの代表画面・代表映像を用いることも可能である。
次に、本発明の第7実施形態について説明する。前記第1〜5の実施形態では同一特徴区間の検出方法について述べた。これらの検出処理を各映像ファイルに対して毎回行う代わりに、各映像ファイルにおける特徴区間情報ファイルを作成し、これを例えば図21の記憶媒体210に格納して使用することにより、映像ファイルの同一特徴区間に対する検索効率を高めることが可能である。
図12は特徴情報ファイルの1構成例を示したものである。特徴情報ファイルはファイルヘッダの後にショット情報#1、ショット情報#2、…のように各ショット情報で構成される。
さらに、各ショット情報はショットヘッダの後に同一特徴区間情報#1、同一特徴区間情報#2、…の順で構成される。また、各同一特徴区間情報は同一特徴区間ヘッダと同一特徴区間詳細情報で構成される。
前記ファイルヘッダの構成例を、図13に示す。ファイルヘッダはファイルヘッダスタートコードの後に、ファイル属性情報、ショット数、ショット情報アドレス#1、ショット情報アドレス#2、…の順に構成される。ファイルヘッダスタートコードはファイルヘッダ情報を示す開始コードで、他のスタートコードと区別できるようなユニークなコードを用いる。ファイル属性情報には、映像ファイルの属性情報について記述する。
ファイル属性情報には、映像ファイルの符号化形式、映像タイトル、映像サブタイトル、著作権情報、再生時間長、ファイル代表画面、ファイル代表映像など映像ファイルに関する属性情報などを含めることができる。このうち映像ファイル代表画面については、前の実施形態で述べた方法を用いて決定した画面や映像に関する情報を記述する。記述方法としては、代表画面のタイムコードや画像データを用いることができる。後者の場合、JPEGなどの静止画像圧縮方式で圧縮された画像データを用いることができる。また、画像サイズを元の動画像ファイルよりも小さくすることにより、属性情報のファイルサイズを削減することができる。また、映像全体を代表する動画像については、代表する動画像の開始と終了タイムコードを用いて動画像の位置を指定したり、動画像データを用いることができる。後者の場合、MPEG−4などの動画像圧縮方式で圧縮された動画像データを用いることができる。また画像サイズを元の動画像ファイルより小さくすることにより属性情報のファイルサイズを削減することができる。
ショット数は映像ファイルに含まれるショットの数NSを記述する。ショット情報アドレスでは、各ショット情報が格納されている位置を示すアドレスを記述する。このアドレス情報はショットの数NSに等しい個数作成される。このアドレス情報を用いることにより、各ショット情報をランダムに検索してショット内容の閲覧などに用いることができる。
図12のショットヘッダの構成例を、図14に示す。ショットヘッダはショットヘッダスタートコードの後に、ショット属性情報、同一特徴区間数、同一特徴区間情報アドレス#1、同一特徴区間情報情報アドレス#2、…の順に構成される。ショットヘッダスタートコードはショットヘッダ情報を示す開始コードで、ファイルヘッダスタートコードなど他のスタートコードと区別できるようなユニークなコードを用いる。ショット属性情報には、ショットの属性情報について記述する。属性情報にはショット番号、ショットタイトル、ショットサブタイトル、ショット開始時刻、ショット終了時刻、ショット長、ショット代表画面・映像に関する属性情報などを含めることができる。このうちショット代表画面については第6の実施形態で述べた方法を用いて決定した画面や映像に関する情報を記述することができる。記述方法としては、先のファイル代表画面の場合と同様な方法を用いることができる。
同一特徴区間数はショットに含まれる同一特徴区間数NKを記述する。同一特徴区間情報アドレスには、各同一特徴区間情報が格納されている位置を示すアドレスを記述する。このアドレス情報は同一特徴区間の数NKに等しい個数作成される。このアドレス情報を用いることにより、各同一特徴区間情報をランダムに検索して、同一特徴区間の内容の閲覧などに用いることができる。
図12の同一特徴区間情報ヘッダの構成例を、図15に示す。同一特徴区間情報ヘッダは、同一特徴区間情報ヘッダスタートコードと同一特徴区間属性情報で構成される。同一特徴区間情報ヘッダスタートコードは、同一特徴区間ショットヘッダ情報を示す開始コードでファイルヘッダスタートコードなど他の種類のコードと区別できるようなユニークなコードを用いる。同一特徴区間属性情報には、同一特徴区間の属性情報について記述する。属性情報には、同一特徴区間番号、同一特徴区間階層番号、同一特徴区間開始時刻、同一特徴区間終了時刻、同一特徴区間長など、同一特徴区間に関する属性情報などを含めることができる。同一特徴区間階層番号は記述された同一特徴区間の階層を表すため、要求される階層レベルに応じて同一特徴区間を検索することが可能である。
図12の同一特徴区間詳細情報には、各同一特徴区間の詳細情報が記述される。詳細情報としては、同一特徴区間代表画面・映像時刻や同一特徴区間代表画面・映像データなどを含めることが可能である。またこれらの代表画面や代表映像については第6の実施形態で述べた方法を用いて決定した画面や映像に関する情報を記述することができる。
次に、本発明の第8の実施形態について説明する。
第7の実施形態では各ショットごとに、ショット内の同一特徴区間の記述方法について述べた。この場合、各ショットを階層的に検索する場合、各ショットの情報を順に読み込むことで詳細な内容を把握することができる。本実施形態は、1つの映像ファイルを階層ごとに記述するようにした点に特徴がある。なお、この実施形態の記述方法で得られたファイルを、例えば図21の記憶媒体210に格納して使用することにより、検索効率を高めることができるようになる。
図16は第8の実施形態の構成例を示したものである。ファイルは第1階層から第n階層までの情報で構成される。第1階層には最も高いレベルの情報を記述する。記述例を図17に示す。図17は第1階層をファイル全体の情報としたもので、ファイルヘッダで構成される。ファイルヘッダの内容としてはファイルヘッダスタートコードの後にファイル属性情報が続く。ファイルヘッダスタートコードやファイル属性情報については、第7の実施形態と同様な情報を記述することができる。
第2階層情報の構成例を図18に示す。第2階層情報には各ショット情報を記述し、ショットヘッダの後に、ショット情報#1,…,ショット情報#Nsを続けて記述する。なお、Ns はショット数を示す。ショットヘッダはショットヘッダスタートコードのあとにショット数、ショット情報アドレス#1,…,ショット情報アドレス#Ns で構成される。ショットヘッダスタートコードは第7の実施形態と同様なコードを用いることができる。また、ショット情報アドレスでは各ショット情報が格納されている位置を示すアドレスを記述する。このアドレス情報を用いることにより、各ショット情報をランダムに検索してショット内容の閲覧などに用いることができる。
各ショット情報は、ショットスタートコードとショット属性情報で構成される。ショットスタートコードは各ショット情報の開始点を示すコードでショットヘッダスタートコードと同様にユニークなコードを用いることによって他のスタートコードと識別する。また、ショット属性情報については、第7実施形態のショット属性情報と同様な情報を記述することができる。なお、本実施形態では、第7実施形態とは異なり、ショット情報には同一特徴区間に関する情報は記述されておらず、ショット全体の内容を示す記述のみが行われる。
次に、第3階層情報の記述例を図19に示す。第3階層情報では各ショット内の同一特徴区間について記述し、第3階層同一特徴区間ヘッダのあとに第3特徴区間情報#1から第3特徴区間情報#Nk3までが続く。なお、Nk3は第3階層におけるファイル全体の同一特徴区関数を示す。第3階層同一特徴区間ヘッダは、第3階層特徴区間ヘッダスタートコードの後に、第3階層同一特徴区間数、第3階層同一特徴区間情報アドレス#1から第3階層同一特徴区間情報アドレス#Nk3までが続く。第3階層同一特徴区間ヘッダスタートコードは、第3階層情報の開始点を示すコードでユニークなコードを用いることによって他のスタートコードと識別する。
第3階層同一特徴区間情報は、第3階層同一特徴区間スタートコードと、それに続く第3階層同一特徴区間属性情報からなる。第3階層同一特徴区間スタートコードは、第3階層同一特徴区間の開始点を示すコードでユニークなコードを用いることによって他のスタートコードと識別する。また第3階層同一特徴区間属性情報には、同一特徴区間の属性情報について記述する。属性情報には、第7実施形態の同一特徴区間属性情報と同様な情報を記述することができる。これにより、第2階層情報についてさらに詳細の情報を第3階層情報から得ることが可能になる。
同様な方法を用いて、第n階層情報を構成した例を図20に示す。第n階層情報は第n−1階層の情報をさらに詳細に記述するための情報で、例えば第1の実施形態や第4の実施形態で述べた階層的な同一特徴区関数について、n−1階層に比べてさらに同一特徴区関数を多くした場合の記述を第n階層で行う。例えば第n−1階層でNKn-1 個の同一特徴区間数を記述して、第n階層ではさらに詳細のNKn 個(>NKn-1 )の同一特徴区関数について記述する。これによりnが大きくなるに従い、より詳しい内容について情報を得ることが可能になる。
このような方法により、第7実施形態と比べると、階層ごとに映像内容が記述されているため、必要とするレベルで検索ができ、検索効率を高めることが可能になる。
21…同一特徴区間数カウンタ、22…閾値決定部、70…入力ベクトル更新部、100…特徴ベクトル抽出部、101…変化度測定部、102…特徴区間決定部、103…特徴画面抽出部、104…画像メモリ、105…入力ベクトルメモリ、106…参照ベクトルメモリ、107…参照ベクトル更新部、108…制御部、800…ショット内特徴ベクトル抽出部、801…ショット内画像メモリ、802…ショット内特徴ベクトルメモリ、803…ショット内特徴画面映像抽出部、900…ファイル内特徴ベクトル抽出部、901…ファイル内画像メモリ、902…ファイル内特徴ベクトルメモリ、903…ファイル内特徴画面映像抽出部。
Claims (9)
- 動画像ファイルに対して、動画像ファイル全体の特徴情報を記述し、
該動画像ファイル全体の特徴情報の下位情報として動画像ファイル内の各ショットの特徴情報を記述し、
該ショットの特徴情報の下位情報として各ショット内の同一特徴区間の特徴情報を記述することを特徴とする動画像の特徴情報記述方法。 - 請求項1に記載の動画像の特徴情報記述方法において、
前記各ショット内の同一特徴区間の特徴情報の下位情報として、さらに第n階層(nは正の整数)まで下位の同一特徴区間の特徴情報を記述することを特徴する動画像の特徴情報記述方法。 - 請求項1または2に記載の動画像の特徴情報記述方法において、
該動画像の各特徴情報は、ヘッダ情報と下位特徴情報で記述されることを特徴とする動画像の特徴情報記述方法。 - 請求項3に記載の動画像の特徴情報記述方法において、
前記ヘッダ情報は、スタートコード、属性情報、下位特徴情報数、および下位特徴情報アドレスで構成されることを特徴とする動画像の特徴情報記述方法。 - 請求項1または2に記載の動画像の特徴情報記述方法において、
該動画像の各特徴情報は、ヘッダ情報と同位の詳細特徴情報で記述されることを特徴とする動画像の特徴情報記述方法。 - 請求項5に記載の動画像の特徴情報記述方法において、
前記ヘッダ情報は、スタートコード、同位の特徴情報数、および同位の特徴情報アドレスで構成されることを特徴とする動画像の特徴情報記述方法。 - 請求項5に記載の動画像の特徴情報記述方法において、
前記詳細特徴情報は、スタートコードと属性情報で構成されることを特徴とする動画像の特徴情報記述方法。 - 請求項4または7に記載の動画像の特徴情報記述方法において、
前記属性情報は、特徴情報のタイトル、開始・終了時間、代表画面、代表映像情報のうち少なくとも1個以上の情報で構成されることを特徴とする動画像の特徴情報記述方法。 - 請求項1ないし8のいずれかに記載の動画像の特徴情報記述方法により得られた動画像ファイルを記録したコンピュータ読取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006160928A JP2006325223A (ja) | 2006-06-09 | 2006-06-09 | 動画像の特徴情報記述方法および記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006160928A JP2006325223A (ja) | 2006-06-09 | 2006-06-09 | 動画像の特徴情報記述方法および記憶媒体 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000065259A Division JP3832706B2 (ja) | 2000-03-09 | 2000-03-09 | 動画像の特徴画面抽出装置およびその記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006325223A true JP2006325223A (ja) | 2006-11-30 |
Family
ID=37544490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006160928A Pending JP2006325223A (ja) | 2006-06-09 | 2006-06-09 | 動画像の特徴情報記述方法および記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006325223A (ja) |
-
2006
- 2006-06-09 JP JP2006160928A patent/JP2006325223A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10368123B2 (en) | Information pushing method, terminal and server | |
KR101015365B1 (ko) | 시각적으로 대표되는 비디오 썸네일을 생성하는 컴퓨터 구현 방법, 컴퓨팅 장치, 컴퓨터, 비디오 장치, 비디오 기록 장치 및 컴퓨터 판독가능 기록매체 | |
US6157744A (en) | Method and apparatus for detecting a point of change in a moving image | |
AU2020217352A1 (en) | Detecting segments of a video program | |
JP5227911B2 (ja) | 監視映像検索装置及び監視システム | |
CN111095939B (zh) | 识别媒体项目的先前流传输部分以避免重复重放 | |
JP4555690B2 (ja) | 軌跡付加映像生成装置及び軌跡付加映像生成プログラム | |
JPWO2005096180A1 (ja) | 画像検索方法、装置及びプログラムを記録した記録媒体 | |
KR20180058019A (ko) | 영상 검색 장치, 데이터 저장 방법 및 데이터 저장 장치 | |
JP5180922B2 (ja) | 画像検索システム及び画像検索方法 | |
JP5008484B2 (ja) | 映像処理方法 | |
JP2005517319A (ja) | 客体形状情報を利用した要約画像の抽出装置及びその方法、並びにそれを利用した動画像の要約及び索引システム | |
US8285008B2 (en) | Image processing apparatus, method and program for facilitating retrieval of an individual group using a list of groups, a list of selected group members and a list of members of the groups excluding the selected group members | |
JP2012256980A (ja) | 画像処理システムおよび画像処理方法 | |
JP5768265B2 (ja) | 類似画像検索システム | |
JP2006217046A (ja) | 映像インデックス画像生成装置及び映像のインデックス画像を生成するプログラム | |
US20070061727A1 (en) | Adaptive key frame extraction from video data | |
JP2005303566A (ja) | ブロック分割領域における動きベクトルの分布を利用した特定シーン抽出方法及び装置 | |
KR101982258B1 (ko) | 오브젝트 검출 방법 및 오브젝트 검출 장치 | |
JP2014110020A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP3832706B2 (ja) | 動画像の特徴画面抽出装置およびその記憶媒体 | |
CN111866419B (zh) | 热成像图像显示方法、装置及热成像设备 | |
WO2012157611A1 (ja) | 類似画像検索システム | |
CN116431857A (zh) | 一种用于无人场景的视频处理方法和系统 | |
JP2007149095A (ja) | 動画像の変化点検出方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080604 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080731 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080820 |