JP4997179B2 - 画像処理装置、方法およびプログラム - Google Patents

画像処理装置、方法およびプログラム Download PDF

Info

Publication number
JP4997179B2
JP4997179B2 JP2008152809A JP2008152809A JP4997179B2 JP 4997179 B2 JP4997179 B2 JP 4997179B2 JP 2008152809 A JP2008152809 A JP 2008152809A JP 2008152809 A JP2008152809 A JP 2008152809A JP 4997179 B2 JP4997179 B2 JP 4997179B2
Authority
JP
Japan
Prior art keywords
moving image
frame
image data
block
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008152809A
Other languages
English (en)
Other versions
JP2009302723A (ja
Inventor
将義 中嶋
Original Assignee
富士通エレクトロニクス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通エレクトロニクス株式会社 filed Critical 富士通エレクトロニクス株式会社
Priority to JP2008152809A priority Critical patent/JP4997179B2/ja
Publication of JP2009302723A publication Critical patent/JP2009302723A/ja
Application granted granted Critical
Publication of JP4997179B2 publication Critical patent/JP4997179B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)

Description

本発明は、動画像コンテンツのデータを解析して、他の動画像コンテンツとの同一性を検証するために利用される特徴量を算出する画像処理装置、方法およびプログラムに関する。
近年、一般のユーザが動画像コンテンツを投稿できるWebサイトが増加している。これに伴い、著作権が保護されたコンテンツが違法に投稿されることが増加しており、例えばそのWebサイトの運営者が訴えられるといったケースも生じている。このような事態を受けて、投稿された動画像コンテンツが著作権保護されたものかどうかを判定できる技術が求められている。
そのような画像判定の技術としては、動画像データに著作権者などの情報をメタデータなどとして付加しておき、その付加情報から判定する方法と、動画像データ自体を比較して、それらの同一性を判断する方法とに大別される。
これらのうち、前者の技術では、付加情報を付加するために余計な手間がかかってしまうという問題がある。また、データの中から、付加情報を除いた動画像の情報のみを取り出されてしまうと、照合が不可能になってしまう。この場合、上記のうちの後者の技術を用いざるを得なくなる。
一方、後者の技術としては、2つの動画像コンテンツにおける対応するフレーム間で画像データの相関値を検出する技術が知られている(例えば、特許文献1参照)。
ここで、図17は、動画像データ同士を比較する方法の例について説明するための図である。
図17において、“#n”は動画像データの第n番目のフレームを示している。この図17では、(N+2)枚のフレームを有する参照動画像と、3枚のフレームを有する検査対象動画像とを例示している。なお、Nは1以上の整数である。そして、この例では、参照動画像の中に、検査対象動画像が含まれているか否かを検証する。具体的には、検査対象動画像の3フレームと、参照動画像中の連続する3フレームとの相関値を演算し、その相関値から各コンテンツの一致度を判定する。
この方法では、検査対象動画像と比較する参照動画像の3フレーム分の範囲を、参照動画像の先頭から順次移動させていく。そして、移動するごとに、参照動画像中の3フレーム分のデータと、検査対象動画像のデータとの相関値を演算する。
このような方法により、参照動画像の全フレームに亘って、検査対象動画像が含まれているか否かを検証できる。図中の下段には、比較対象とする参照動画像中の3フレームのうちの先頭フレームを、第1番目のフレームから第N番目のフレームまで移動させたときに得られた相関値を、グラフに示している。このグラフにおいて、参照動画像の第4番目のフレームを先頭とした3フレームと検査対象動画像とを比較したときに、その前後と比較して相関値が極端に高くなっていることから、参照動画像におけるこの範囲の画像が検査対象動画像に似ていると推定できる。
しかし、複数フレーム同士の相関値の演算は、演算量が大きいという問題がある。特に、上記のように比較対象とする動画像の範囲を変化させながら、その都度相関値を演算していくと、演算量はさらに大きくなる。さらに、このような演算をすべての動画像コンテンツの組み合わせに対して行うと、その演算量は膨大なものとなってしまう。
これに対して、動画像コンテンツの特徴量をあらかじめ求めておき、2つの動画像コンテンツの特徴量同士を比較することでそれらの同一性を判定する技術が考えられている。このような特徴量としては、例えば、動画像データの各フレームの情報に対して周波数変換および量子化を施した情報が考えられる(例えば、特許文献2参照)。
なお、2つの画像間の関連性を示す情報として、動きベクトルがある。例えば、フレーム間の動きベクトルを算出する技術は、撮像装置における電子式の手ぶれ検出などに利用されている(例えば、特許文献3参照)。
特開2006−352594号公報 特開2001−326952号公報 特開2007−174455号公報
上記のように、膨大な数の動画像コンテンツの同一性を、できるだけ少ない演算量で高精度に判定できるようにすることが求められている。そして、このような技術としては、あらかじめ求めておいた動画像コンテンツの特徴量を用いて判定できるようにすることが求められている。
本発明はこのような点に鑑みてなされたものであり、複数の動画像ストリーム間の同一性を簡単な処理で精度よく判定できるようにした画像処理装置、方法およびプログラムを提供することを目的とする。
上記目的を達成するために、動画像コンテンツのデータを解析して、他の動画像コンテンツとの同一性を検証するために利用される特徴量を算出する画像処理装置が提供される。この画像処理装置は、入力された動画像データにおける現在のフレーム内に1つ以上の検索領域を設定し、それぞれの前記検索領域の中に、複数でかつ同一数の隣接画素からなるブロックを順次設定するブロック設定部と、前記現在のフレームに設定された前記ブロック内の画像データと、当該フレームの前または後のフレームにおける当該ブロックと同じ領域内の画像データとの相関を求める相関演算部と、相関演算の結果、前記検索領域内で相関が最大であった前記ブロックの位置を示す位置情報を、前記検索領域ごとに出力する位置情報出力部と、入力された動画像データごとの前記特徴量として、前記検索領域ごとの前記位置情報を当該動画像データの各フレームに対応付けた情報を出力する特徴量出力部と、を有する。
ここで、ブロック設定部は、入力された動画像データにおける現在のフレーム内に、1つ以上の検索領域を設定し、さらに、それぞれの検索領域の中にブロックを順次設定する。検索領域に設定される各ブロックは、複数でかつ同一数の隣接画素によって構成される。相関演算部は、現在のフレームに設定されたブロック内の画像データと、このフレームの前または後のフレームにおける当該ブロックと同じ領域内の画像データとの相関を求める。位置情報出力部は、相関演算の結果、各検索領域内で相関が最大であったブロックの位置を示す位置情報を、検索領域ごとに出力する。特徴量出力部は、検索領域ごとに出力された位置情報を動画像データの各フレームに対応付け、フレームと位置情報とが対応付けられた情報を当該動画像データの特徴量として出力する。
また、上記目的を達成するために、上記の画像処理装置と同様の処理を行う画像処理方法および画像処理プログラムが提供される。
上記の画像処理装置によれば、他の動画像データに基づく画像との同一性を簡単な処理で精度よく判定可能にするような特徴量を出力することができる。
以下、実施の態様について、図面を参照して詳細に説明する。
図1は、実施の形態に係る画像処理装置の構成を概略的に示す図である。
図1に示す画像処理装置1は、他の動画像コンテンツとの同一性を検証するために利用される特徴量を、入力された動画像コンテンツのデータを基に算出するための装置である。この画像処理装置1は、ブロック設定部11、相関演算部12、位置情報出力部13、特徴量出力部14および特徴量データベース15を備えている。
ブロック設定部11は、入力された動画像データにおける現在のフレーム内に、1つ以上の検索領域を順次設定する。さらに、設定したそれぞれの検索領域の中に、複数でかつ同一数の隣接画素からなるブロックを順次設定する。このとき、ブロックは、例えば、検索領域の全域を網羅するように設定される。
相関演算部12は、現在のフレームに対してブロック設定部11により設定されたブロック内の画像データを取得する。これとともに、そのフレームの前または後のフレームにおける、設定されたブロックに対応する領域の画像データを取得する。そして、これらの各領域の画像データの相関を求める。
相関演算部12は、1つの検索領域においてブロックが設定されるたびに、現在のフレームにおけるブロック内の画像データと、その前または後のフレームにおける対応する領域の画像データとの相関を演算する。さらに、検索領域が複数設定された場合には、各検索領域において同様の処理を繰り返す。
位置情報出力部13は、相関演算の結果、それぞれの検索領域内で相関が最大であったブロックの位置を示す位置情報を、それらの検索領域ごとに出力する。この位置情報は、例えば、検索領域内での位置(所定の基準位置からの相対位置)を示す情報であってもよいし、あるいは、1フレーム内での位置を示す情報であってもよい。
特徴量出力部14は、検索領域ごとに出力された位置情報を、入力された動画像データの各フレームに対応付ける。そして、このような情報を、入力された動画像データごとの特徴量として出力する。特徴量は、特徴量データベース15に格納される。なお、特徴量データベース15は、画像処理装置1の外部に設けられてもよい。
このような処理により、特徴量データベース15には、特徴量が動画像データごとに蓄積される。そして、2つの動画像データのそれぞれの特徴量の相関をとることにより、これらの動画像コンテンツの同一性を検証することが可能となる。例えば、各動画像データの特徴量の差分の絶対値の総和(SAD:Sum of Absolute Difference)を演算することで、同一性を判定する。このような同一性の検証処理によれば、例えば、各コンテンツの画像データ同士の相関をとる場合と比較して、演算量を大幅に低減できる。
また、上記のような特徴量の演算方法では、設定した検索領域において最も動きの少ないブロックの位置を、その検索領域に対応する特徴量としている。このような特徴量を用いて動画像コンテンツの同一性を判定すると、その判定結果に対して画像の時間的な変化の影響がおよびにくくなり、比較的安定した判定精度を得ることが可能になる。
次に、上記の特徴量の演算方法を用いた実施の態様について、より具体的に説明する。ここでは例として、動画像コンテンツの特徴量の演算機能と、その特徴量を用いた動画像コンテンツの同一性検証機能とを備えた画像検証装置について説明する。
図2は、実施の形態に係る画像検証装置の機能を示すブロック図である。
図2に示す画像検証装置100は、制御部110、前処理部120、特徴量検出処理部130、特徴量データベース140および同一性判定処理部150を備えている。
制御部110は、画像検証装置100全体の動作を統括的に制御するブロックである。
前処理部120は、入力された動画像ストリームに前処理を施し、特徴量検出処理部130に出力する。前処理としては、画像サイズを一定のサイズ(画素数)に変換するスケーリング処理が行われる。さらに、前処理部120では、例えば、ローパスフィルタなどを用いてノイズを除去する処理などが行われてもよい。
特徴量検出処理部130は、前処理部120からの動画像ストリームを基に、その動画像ストリームの特徴量を検出し、特徴量情報101を生成する。後述するように、特徴量情報101には、動画像ストリームのフレームごとに検索領域とベクトルデータとが対応付けられて格納される。さらに、本実施の形態では、シーンチェンジの位置を示す情報(シーンチェンジ情報)も格納される。特徴量検出処理部130は、入力された動画像ストリームの中から、隣接する2つのフレーム間でブロックごとに相関演算を行うことで、上記のベクトルデータおよびシーンチェンジ情報を算出する。これらの算出方法の詳細については後述する。
特徴量データベース140は、特徴量検出処理部130から出力された、動画像ストリームごとの特徴量情報101を蓄積する。なお、特徴量データベース140は、例えばHDD(Hard Disk Drive)などの記憶媒体に構築される。
同一性判定処理部150は、特徴量データベース140から、2つの動画像ストリームの特徴量情報101を読み出し、これらを基に各動画像の同一性を判定する。同一性判定処理部150は、各動画像ストリームから一定フレーム数に対応するベクトルデータを抽出して、それらの相関をとることで、同一性を判定する。また、ベクトルデータを抽出するフレームの開始位置を、特徴量情報101に含まれるシーンチェンジ情報を基に決定することもできる。
なお、同一性判定処理部150は、一方の動画像ストリームの特徴量情報101を、特徴量データベース140からではなく、特徴量検出処理部130から直接受け取るようにしてもよい。
図3は、特徴量情報のデータ構成例を示す図である。
図3に示すように、特徴量情報101には、フレーム番号に対して、検索領域番号およびベクトルデータが対応付けられて格納されている。さらに、シーンチェンジ情報も格納されている。
検索領域番号は、ベクトルデータの算出の際に、検出対象とされている現在のフレームに設定される検索領域を識別する情報である。検索領域は、各フレームにおいて常に同じ位置に設定されるので、各フレーム番号にはそれぞれ同数の検索領域番号およびベクトルデータが対応付けられる。なお、検索領域は、各フレームに1つのみ設定されてもよい。
ベクトルデータは、各検索領域において順次設定されるブロックのうち、現在のフレームに隣接する参照フレームの同じ領域との相関が最も高いブロック(すなわち、画像の変化が少ないブロック)の位置を示す情報である。本実施の形態では、後述するように、このようなブロックの位置を示す情報が、各検索領域内の基準位置からの相対位置を示すベクトルデータとして記述される。
シーンチェンジ情報は、シーンチェンジが検出された位置を示す情報であり、例えばその位置に対応するフレーム番号として記述される。シーンチェンジ情報は、検出された数だけ特徴量情報101内に格納される。
次に、特徴量検出処理部130によって実行されるベクトルデータの検出処理について詳しく説明する。
まず、図4は、検索領域内でのブロックの設定方法を説明するための図である。
特徴量検出処理部130は、ベクトルデータの検出対象とする現在のフレームの画像データと、このフレームに隣接する参照フレームの画像データとを用いて、これらの相関を演算する。本実施の形態では、例として、現在のフレームより1つ前のフレームを参照フレームとする。
特徴量検出処理部130は、まず、現在のフレームの内部に、画像の変化が少ない領域を検索するための検索領域を設定する。本実施の形態では、例として、図4のようにフレームを水平方向に4つ、垂直方向に3つの合計12の等しい領域に分割し、これらのうちの隣接する6領域(水平方向に3領域、垂直方向に2領域)を1つの検索領域とする。
図4の例では、まず、フレームの左上に第1番目の検索領域A1を設定している。次に、特徴量検出処理部130は、設定した検索領域A1の内部に順次ブロックを設定していく。図中のステップS1では、まず、検索領域A1の左上に第1番目のブロックB1_1を設定している。さらに、特徴量検出処理部130は、参照フレーム上のブロックB1_1と同じ位置に、参照領域C1_1を設定する。そして、ブロックB1_1内の画像データと、対応する参照領域C1_1内の画像データとの相関を演算する。
次に、特徴量検出処理部130は、図中のステップS2に示すように、検索領域A1内の異なる位置に、第2番目のブロックB1_2を設定する。さらに、上記と同様に、参照フレーム上のブロックB1_2と同じ位置に、参照領域C1_2を設定する。そして、ブロックB1_2内の画像データと、参照領域C1_2内の画像データとの相関を演算する。
このようにして、特徴量検出処理部130は、検索領域A1内に、位置を変化させながらブロックを順次設定していき、その都度、ブロック内の画像データと、参照フレーム内の対応する参照領域内の画像データとの相関を演算していく。図4に示すように、ブロックは、例えば、参照領域A1内を網羅するようにk個分だけ順次設定されていき(ただし、kは2以上の整数)、その都度、対応する参照領域との相関が演算される。なお、図中のステップS3では、第k番目のブロックB1_kの設定位置と対応する参照領域C1_kの設定位置とが示されている。
以上の手順により、検索領域A1におけるブロックごとに相関演算が行われると、特徴量検出処理部130は、これらのうち相関が最大であったブロックを検出し、そのブロックの位置を記憶する。
次に、図5は、フレーム内での検索領域の設定方法を説明するための図である。
特徴量検出処理部130は、上記の手順によって1つの検索領域でのブロックごとの相関演算を行った後、さらに、検索領域の位置を変更して、同様の手順でその内部にブロックを設定し、相関演算を実行する。検索領域は、例えば、フレーム内の全領域を網羅するように順次設定される。前述のように、本実施の形態ではフレームを12分割した分割領域を単位として検索領域が設定されるため、検索領域をフレームの左上、右上、左下、右下の4領域だけ設定することで、フレーム全体を検索対象とすることができる。
図5のステップS11では、現在のフレームの右上に第2番目の検索領域A2を設定した場合を示している。このとき、特徴量検出処理部130は、検索領域A2内で位置を変えながらブロックを順次設定していく。そして、ブロックを設定するたびに、そのブロック内の画像データと、参照フレーム上でそのブロックと同じ位置の領域(参照領域)内の画像データとの相関を演算する。
特徴量検出処理部130は、検索領域A2内に設定したすべてのブロックについて相関演算を実行した後、これらのうち相関が最大であったブロックを検出して、その位置を記憶する。
この後、特徴量検出処理部130は、図中のステップS12に示すように、フレーム内の左下に第3番目の検索領域A3を設定する。そして、上記と同様の手順で、検索領域A3内のブロックごとに相関演算を行い、相関が最大であったブロックの位置を記憶する。さらに、図中のステップS13に示すように、フレーム内の右下に第4番目の検索領域A4を設定する。そして、上記と同様の手順で、検索領域A4内のブロックごとに相関演算を行い、相関が最大であったブロックの位置を記憶する。
なお、上記の例では、検索領域をフレーム当たり複数設定していたが、検索領域を1つのフレームに対して1つだけ設定してもよい。また、検索領域をフレーム当たり複数設定した場合には、検索領域は、上記の例のように1つの検索領域の少なくとも一部が他の検索領域に重複するように設定されても、あるいは重複しないように設定されてもよい。
一方、検索領域内ではブロックが複数設定される必要があるが、各ブロックは、上記の例のように1つのブロックの少なくとも一部が他のブロックと重複するように設定されても、あるいは重複しないように設定されてもよい。ただし、各ブロックの位置の差を小さくして、ブロックを検索領域内でより多く設定するほど、相関が最大となるブロックの検出精度は高くなり、その結果、コンテンツの同一性判定処理の精度も高くなる。
また、上記の例では、複数の検索領域によってフレームの全域が検索対象とされているが、フレームの一部のみが検索対象となるように検索領域が設定されてもよい。ただし、通常は、フレーム内のできるだけ広い領域が検索対象に含められることが望ましい。
以上の手順により、フレーム内に設定した検索領域ごとに、対応する参照領域との相関が最大であったブロックの位置が検出される。本実施の形態では、検索領域ごとのブロックの位置を、その検索領域内の基準位置からの相対位置を示すベクトルデータとして算出する。
図6は、ブロックの位置を示すベクトルデータを説明するための図である。
図6の例では、検索領域の左上の画素を、その検索領域の基準位置としている。また、検索領域内のブロックの左上の画素を、そのブロックの基準位置としている。このような場合、ブロックの位置を、検索領域の基準位置の座標を始点とした、ブロックの基準位置の相対座標であるベクトルデータとして表すことができる。
図6では例として、検索領域A4に設定した全ブロックのうち、ブロックBmaxから得られた相関値が最大であった場合について示している。このとき、ブロックBmaxを示すベクトルデータVは、検索領域A4の基準位置Paから、ブロックBmaxの基準位置Pbまでの水平方向,垂直方向の画素数であるvx,vyを用いて、(vx,vy)と表すことができる。
なお、検索領域ごとのブロックの位置は、上記の例のように検索領域での相対位置ではなく、他の情報によって表されてもよい。例えば、ブロックの基準位置をフレーム内の絶対位置(座標)によって表してもよい。また、後述するように、ブロックの位置を示す相対位置を、設定した各領域の比によって表すようにしてもよい。
以上説明した手順により、フレームごとに、1つ以上の検索領域と、それに対応するブロックを指し示すベクトルデータとが得られて、特徴量情報101に格納される。図4および図5の例の場合には、図3に示した特徴量情報101のうち、各フレーム番号に対して4つの検索領域番号とベクトルデータとが格納されることになる。
次に、ブロック内の画像データと、そのブロックに対応する参照フレームの参照領域内の画像データとの相関演算の方法について説明する。本実施の形態では、相関値の例としてSADを求める。
図7は、SADの演算方法を説明するための図である。
現在のフレームのブロック内の画像データをd、そのブロックに対応する参照フレームの参照領域内の画像データをrとすると、ブロックと参照領域とのSADの値は下記の式(1)によって求められる。なお、図7では例として、ブロックが8×8画素により構成されるものとし、ブロック内の各画素の画像データをd00〜d63、対応する参照領域内の各画素の画像データをr00〜r63と表している。そして、下記の式(1)には、例として、この図7のような場合のSAD算出のための式も、併せて示している。
SAD_BLK=Σ|(d−r)|
=|(d00−r00)|+|(d01−r01)|+・・・+|(d63−r63)|
……(1)
SADの値は、ブロックと参照領域との相関が大きいほど小さくなる。従って、特徴量検出処理部130は、検索領域内の各ブロックのうち、対応する参照領域とのSADの値が最小となるブロックを検出し、そのブロックの位置を示す情報(ベクトルデータ)を特徴量として登録する。
次に、相関を示す値としてSADを用いた場合の特徴量検出処理部130の具体的な構成例について説明する。
図8は、特徴量検出処理部の内部構成例を示すブロック図である。
図8に示す特徴量検出処理部130は、SAD演算部131、最小値検出部132、ベクトルデータ出力部133、SAD総和演算部134およびシーンチェンジ検出部135を備えている。
SAD演算部131は、現フレームの画像データと、参照フレーム(本実施の形態では前フレーム)の画像データとを基に、ブロックごとのSAD値を演算する。具体的には、例えば、検索領域およびブロックの位置を設定し、現フレームにおけるブロック内の画像データと、参照フレームにおけるブロックに対応する参照領域内の画像データとのSADを演算する。
最小値検出部132は、SAD演算部131の演算結果から、各検索領域におけるSADの最小値を検出する。そして、最小値が検出されたブロックの位置を示す情報を、検索領域ごとにベクトルデータ出力部133に出力する。
ベクトルデータ出力部133は、SADの最小値が検出されたブロックの位置を、そのブロックが属する検索領域の基準位置を基準としたベクトルデータとして出力する。
SAD総和演算部134およびシーンチェンジ検出部135は、SAD演算部131および最小値検出部132の演算・検出結果を利用してシーンチェンジを検出するための機能である。SAD総和演算部134は、最小値検出部132で検出された、各検索領域におけるSADの最小値を1フレーム分ずつ取得して、これらの総和を求める。
シーンチェンジ検出部135は、SAD総和演算部134により演算された、フレームごとの最小SADの総和を所定のしきい値と比較し、最小SADの総和がしきい値を超えた場合にシーンチェンジが発生したと判定する。そして、シーンチェンジが検出されたフレームの番号を出力する。
以上の特徴量検出処理部130では、ベクトルデータ出力部133からのベクトルデータと、シーンチェンジ検出部135からのフレーム番号とから特徴量情報101が生成されて、特徴量データベース140に登録される。このとき、この特徴量情報101は、同一性判定処理部150にも直接的に出力されてもよい。
ここで、図9は、最小SADの総和を用いたシーンチェンジの検出方法について説明するための図である。
シーンチェンジが発生した後のフレームは、その前のフレームとの相関が小さくなると考えられる。そこで、特徴量検出処理部130では、SAD演算部131で求めたフレーム間の相関(すなわちSAD)を、シーンチェンジの発生を検出処理に流用している。SAD演算部131では、現フレームに設定したブロック内の画像データと、参照フレーム(前フレーム)におけるブロックに対応する参照領域内の画像データとのSADを、検索領域ごとに算出している。そして、最小値検出部132は、検索領域ごとにSADの最小値を検出している。このとき検出されたSADの最小値は、検索領域における現フレームと参照フレームとの相関を示すと考えることができる。このため、設定した検索領域ごとに検出されたSADの最小値を1フレーム分だけ累積加算した値を、フレーム間の相関を示す値と見なすことができる。
図9(A)は、SAD総和演算部134によって演算されたフレームごとの最小SADの総和を、フレーム番号ごとにプロットしたグラフを示している。なお、ここでは例として、各フレームの画素数を360×240、検索領域の画素数を32×32、ブロックの画素数を16×16としている。
このグラフにおいて、最小SADの総和がその前後の値と比較して著しく高い場合には、画面が大きく変化した(すなわち、シーンチェンジが発生した)と推定できる。そこで、シーンチェンジ検出部135は、最小SADの総和が所定のしきい値を超えた場合に、シーンチェンジが発生したと判定する。このグラフでは、しきい値を“4000”に設定している。
なお、図9(B)には、参考のために、(A)で検出対象としたものと同一の画像を目視することによってシーンチェンジを検出したときの検出例を示している。このグラフでは、シーンチェンジが検出されたフレーム番号について0より大きい一定の値をプロットしている。図9(A),(B)を比較すると、(A)でシーンチェンジが検出されたフレーム番号と、(B)において最小SADの総和が突出しているフレーム番号とがほぼ一致していることがわかる。従って、比較に用いるしきい値を適切に設定することにより、最小SADの総和に基づく検出方法によってシーンチェンジを概ね正確に検出できる。
次に、以上で説明した特徴量情報101の検出処理の全体について、フローチャートを用いて説明する。
図10は、特徴量検出処理の手順を示すフローチャートである。
[ステップS21]SAD演算部131は、前処理部120から出力される動画像ストリームのうち、処理の対象とする現在のフレームを決定する。
[ステップS22]SAD演算部131は、フレームの中に検索領域を設定する。
[ステップS23]SAD演算部131は、設定した検索領域内にブロックを設定する。
[ステップS24]SAD演算部131は、現在のフレームの画像データのうち、ステップS23で設定したブロック内の画像データを読み込む。さらに、参照フレームの画像データのうち、設定したブロックに対応する参照領域内の画像データを読み込む。そして、これらの画像データ同士でSADを演算する。
[ステップS25]SAD演算部131は、ステップS22で設定した検索領域に設定すべき全ブロックについてのSAD演算を終了したか否かを判定する。終了していない場合には、ステップS23の処理が実行され、次のブロックが設定されて、このブロックに対応するSADの演算が実行される。また、終了した場合には、ステップS26の処理が実行される。
[ステップS26]最小値検出部132は、ステップS24においてSAD演算部131から出力されたSAD値のうち、最小値を検出する。
[ステップS27]ベクトルデータ出力部133は、ステップS26において最小値が検出されたブロックを指し示すベクトルデータを生成して出力する。このベクトルデータは、ステップS22で設定された検索領域を識別する番号に対応付けて特徴量情報101に格納される。
[ステップS28]SAD演算部131は、現在のフレームに設定すべき全検索領域についての処理が終了したか否かを判定する。終了していない場合には、ステップS22の処理が実行される。この場合、新たに検索領域が設定され、その検索領域内にブロックが順次設定されて、ブロックに対応するSAD値が演算される。そして、検索領域に対応するベクトルデータが出力される。また、全検索領域についての処理が終了した場合には、ステップS29の処理が実行される。
[ステップS29]SAD総和演算部134は、ステップS26で検出されたSADの最小値を1フレーム分取得し、これらの総和を演算する。
[ステップS30]シーンチェンジ検出部135は、ステップS29で算出された最小SADの総和を所定のしきい値と比較し、シーンチェンジが発生したか否かを判定する。最小SADの総和がしきい値を超えている場合には、シーンチェンジが発生したと判定して、現在のフレームを示すフレーム番号を出力する。このフレーム番号は、特徴量情報101に格納される。また、最小SADの総和がしきい値以下である場合には、シーンチェンジが発生していないと判定する。この場合、フレーム番号は出力されず、次のステップS31の処理が実行される。
[ステップS31]SAD演算部131は、動画像ストリーム全体に対する処理が終了したか否かを判定する。終了していない場合には、ステップS21の処理が実行され、次のフレームが処理対象フレームに決定され、ベクトルデータおよびシーンチェンジが検出される。そして、動画像ストリームにおけるすべてのフレームについての処理が実行されると、特徴量検出処理部130での処理が終了される。このとき、特徴量データベース140には、処理対象としていた動画像ストリームに対応する特徴量情報101として、図3に示したような情報が登録される。
なお、上記の特徴量検出処理では、SAD演算部131は、フレーム内に設定するすべての検索領域について、検索領域内に設定するすべてのブロックごとにSADを演算していた。しかし、異なる検索領域のブロック同士で画素数および位置が同一のものがある場合には、それらのブロックに対応するSADを最初に一回だけ演算して保持しておき、その値を複数の検索領域で共用してもよい。これにより、SADの演算量を抑制でき、特徴量検出に要する時間を短縮できる。
また、SADの演算量を抑制する他の方法の例として、最小値検出部132で、検索領域内の全ブロックに対応するSADの最小値を検出する代わりに、ブロックに対応するSADの値を所定のしきい値と比較する方法が考えられる。この場合、最小値検出部132は、SAD演算部131により検索領域内にブロックが設定されるごとに、そのブロックに対応するSADの値を取得して、しきい値と比較する。
このとき、SADの値がしきい値以下であった場合には、対応するブロックを最小値が検出されたものと判定し、当該検索領域における次のブロックの設定およびSAD演算を中止する。これによりSADの演算量を抑制できる。なお、SADの値がしきい値より大きかった場合には、検索領域内に次のブロックを設定してSADの演算を行い、しきい値と比較する。そして、検索領域内の全ブロックに対応するSADがしきい値より大きかった場合には、前述の通りこれらのSADの中から最小値を検出する。
一方、検索領域において動きの少ない領域を検出する際の検出精度を高める方法として、例えば、最小値検出部132によって検出された検索領域内でのSADの最小値が所定のしきい値より大きい場合には、その最小値に対応するブロックを指し示すベクトルデータを特徴量情報101に含めないという方法も考えられる。ただし、この場合には、後述する同一性判定処理機能の仕様として、ベクトルデータを含まない検索領域についての取り扱いをあらかじめ決めておく必要がある。その例としては、特徴量情報101に対して、検索領域に対応するベクトルデータの代わりに該当ブロックがないことを示す情報を含めておき、同一性の判定処理時に、この検索領域に対応する相関の演算をスキップする方法が考えられる。
次に、同一性判定処理部150における処理について説明する。
図11は、同一性判定処理部の内部構成例を示すブロック図である。
同一性判定処理部150は、図11に示すように、読み込み制御部151、SAD演算部152および同一性判定部153を備えている。
読み込み制御部151は、同一性の判定対象とする2つの動画像ストリームのそれぞれについて、判定対象とする範囲(フレーム番号)を決定する。そして、各動画像ストリームに対応する特徴量情報101に含まれるベクトルデータのうち、決定した判定対象範囲に対応するベクトルデータのみを読み込む。
この読み込み制御部151での処理は、後述するように、一方の動画像ストリームについてのベクトルデータの読み込み開始位置(フレーム番号)を順次変化させる第1の読み込み制御と、各特徴量情報101に含まれるシーンチェンジ情報に基づいて読み込み開始位置を決定する第2の読み込み制御とに大別される。後者の場合には、読み込み制御部151は、少なくとも一方の特徴量情報101に含まれるシーンチェンジ情報を参照する。
SAD演算部152は、読み込み制御部151を通じて読み込まれた各動画像ストリームのベクトルデータ同士の相関を演算する。本実施の形態では、相関演算の例として、SAD演算を行う。
同一性判定部153は、相関の演算結果を基に、各動画像ストリームが同一のものであるか否かを判定する。本実施の形態では、算出されたSADの値が所定のしきい値以下であった場合に、各動画像ストリームが同一のものであると判定する。
図12は、第1の読み込み制御を適用した場合のベクトルデータの相関演算について説明するための図である。
図12では、同一性を判定する第1の動画像ストリーム、第2の動画像ストリームのそれぞれを、フレーム番号を羅列することによって模式的に示している。すなわち、図12では例として、各動画像ストリームについて、先頭のフレームから26番目のフレームまでを示している。
同一性判定処理部150は、例えば、各動画像ストリームに対してそれぞれ同じフレームの範囲を判定対象として選択し、それぞれの判定対象範囲に対応するベクトルデータ間の相関を演算する。第1の読み込み制御を適用する場合、判定対象範囲は、各動画像ストリームの先頭から1フレームずつ移動させながら順に選択される。
図12の例では、判定対象範囲を20フレームの範囲としている。この場合、読み込み制御部151は、まず、第2の動画像ストリームに対して、先頭から20フレームの範囲を判定対象範囲Rbとして設定する。そして、第2の動画像ストリームの特徴量情報101から、判定対象範囲Rbのフレームに対応するベクトルデータをフレーム順および検索領域番号順に読み込む。
一方、第1の動画像ストリームに対しては、まず、先頭から20フレームの範囲を判定対象範囲Ra1として設定する。そして、第1の動画像ストリームの特徴量情報101から、判定対象範囲Ra1のフレームに対応するベクトルデータをフレーム順および検索領域番号順に読み込む。
SAD演算部152は、このように読み込まれたベクトルデータ間のSADを演算する。SAD演算部152は、各判定対象範囲の先頭からの位置が同じフレームにおける同一検索領域番号に対応付けられたベクトルデータの差分をそれぞれ求め、それらの差分の絶対値を加算することで、SADを求める。一方の判定対象範囲Ra1における先頭からpフレーム目のq番目の検索領域に対応付けられたベクトルデータをVa_pq、他方の判定対象範囲Rbにおける先頭からpフレーム目のq番目の検索領域に対応付けられたベクトルデータをVb_pqとすると、各範囲でのベクトルデータ間のSADの値は次の式(2)によって求められる。
SAD_STR=Σ|(Va_pq−Vb_pq)| ……(2)
同一性判定部153は、このようにしてSAD演算部152により算出されたSADの値を、所定のしきい値と比較する。SADの値がしきい値以下であった場合には、各範囲の動画像が同一であると判定できる。
一方、SADがしきい値より大きかった場合には、読み込み制御部151は、判定対象範囲を変化させて、同様の処理によりSADを演算する。図12の例では、次に、第1の動画像ストリームに設定する判定対象範囲を、2フレーム目を先頭とした20フレーム(判定対象範囲Ra2)に変更している。読み込み制御部151は、設定した判定対象範囲Ra2における各検索領域に対応付けられたベクトルデータを読み込む。SAD演算部152は、各範囲でのベクトルデータ間のSADを算出し、同一性判定部153は、算出されたSADの値をしきい値と比較する。
以上の処理手順に従い、判定対象範囲の動画像が同一と判定されるまで、判定対象範囲を変化させて同様の処理が実行される。例えば、図12に示すように、第1の動画像ストリームに対する判定対象範囲が、判定対象範囲Ra3,Ra4,Ra5,……のように1フレームずつ後ろに移動される。また、その判定対象範囲の末尾が第1の動画像ストリームの末尾のフレームに達した場合には、次に、第2の動画像ストリームに対する判定対象範囲が、1フレームだけ後ろに移動されて、上記と同様に第1の動画像ストリームに対する判定対象範囲が順次移動され、その都度SADの演算およびしきい値との比較が行われる。
図13は、第1の読み込み制御を適用した場合のSADの算出例を示すグラフである。
図13に示すグラフは、第2の動画像ストリームにおける所定の位置に100フレーム分の判定対象範囲を設定するとともに、第1の動画像ストリームに同数のフレームからなる判定対象範囲を順次移動させながら設定したときのSADの値をプロットしたものである。従って、図13のグラフの横軸は、第1の動画像ストリームに設定される判定対象範囲の先頭を示すフレーム番号である。なお、この算出例では、各動画像ストリームのフレームの画素数を360×240、参照領域の画素数を64×64、ブロックの画素数を16×16としている。
このグラフでは、第1の動画像ストリームに設定される判定対象範囲の先頭を500フレームの位置としたとき、SADの値がその前後と比較して極端に低下している。この場合、第1の動画像ストリームにおける500フレームから600フレームまでの動画像と、第2の動画像ストリームに設定した判定対象範囲における動画像とが同じものであると判定できる。
なお、このグラフに示すように、本実施の形態での特徴量検出処理および同一性判定処理を用いた場合、各動画像ストリームにおける判定対象範囲の動画像が一致していないときに算出されるSADの値は、大きく変動しない。すなわち、各動画像ストリームにおける画面の変化に対して、コンテンツが一致していない場合の相関値と一致している場合の相関値との差が安定的に大きくなる。このため、単にSADに対するしきい値判定を行うだけで、動画像の同一性を精度よく判定できる。
このように、同一性判定時において算出されるSADの値はほぼ一定となるので、この値があらかじめわかっていれば、しきい値を容易に設定できる。ただし、このようなSADの値は、例えば、各動画像ストリームに設定する判定対象範囲のフレーム数などに応じて異なると考えられる。
そこで、同一性判定部153では、SAD演算部152によって算出されるSADの値を、あらかじめ決められた複数のフレーム数分だけ平均し、その平均値に対して所定の比率を適用した値(ただし、比率を0より大きく1未満の値とする)をしきい値に設定してもよい。例えば、SADの平均値の20%の値をしきい値とする。前述のように、1回の同一性判定時にSAD演算部152により算出されるSADの値は(各動画像が一致していない場合に)ほぼ一定となるので、この手法でしきい値を設定した場合でも同一性を高精度に判定できる。
図14は、第1の読み込み制御を適用した場合の同一性判定処理の手順を示すフローチャートである。
[ステップS41]読み込み制御部151は、第2の動画像ストリームに対して判定対象範囲を設定する。
[ステップS42]読み込み制御部151は、第1の動画像ストリームに対して判定対象範囲を設定する。
[ステップS43]読み込み制御部151は、各動画像ストリームに対応する特徴量情報101の中から、設定した判定対象範囲内のベクトルデータを読み込む。
[ステップS44]SAD演算部152は、読み込まれた各判定対象範囲内のベクトルデータのSADを演算する。
[ステップS45]同一性判定部153は、SADの演算結果をしきい値と比較し、各判定対象範囲の動画像が同一か否かを判定する。
[ステップS46]ステップS45において同一と判定された場合には、ステップS49の処理が実行される。一方、同一でないと判定された場合には、ステップS47の処理が実行される。
[ステップS47]読み込み制御部151は、第1の動画像ストリームに対して設定し得るすべての判定対象範囲を設定したか否かを判定する。すべての範囲を設定済みである場合には、ステップS48の処理が実行される。
一方、すべての範囲を設定済みではない場合には、ステップS42の処理が実行される。この場合、読み込み制御部151は、第1の動画像ストリームに対する判定対象範囲の設定位置を、例えば後側に1フレーム分だけ移動させる。そして、各動画像ストリームに設定された判定対象範囲に対して、上記と同様にステップS43〜S46の処理が実行される。
[ステップS48]読み込み制御部151は、第2の動画像ストリームに対して設定し得るすべての判定対象範囲を設定したか否かを判定する。すべての範囲を設定済みである場合には、ステップS49の処理が実行される。
一方、すべての範囲を設定済みではない場合には、ステップS41の処理が実行される。この場合、読み込み制御部151は、第2の動画像ストリームに対する判定対象範囲の設定位置を、例えば後側に1フレーム分だけ移動させる。そして、ステップS42〜S47の処理が再度実行される。なお、ステップS41が再度実行された後では、ステップS42では、第1の動画像ストリームに対する判定対象範囲の先頭位置が、このストリームの先頭フレームから順に設定される。
なお、各動画像ストリームに対して設定し得るすべての判定対象範囲でのSAD演算により、動画像が一致したと判定されなかった場合には、さらに、判定対象範囲に含まれるフレーム数を変えて(例えば、フレーム数を少なくして)、ステップS41〜S48の処理を再度実行してもよい。
[ステップS49]同一性判定部153は、動画像が同一であるか否かの判定結果を出力する。
なお、以上の図14の処理例では、SADの算出結果としきい値との比較結果から、各判定対象範囲の動画像が一致したと判定された時点で、判定結果を出力して処理を終了していた。しかし、この他に例えば、処理の途中で動画像が一致したと判定された場合でも、設定すべきすべての判定対象範囲同士の同一性判定を行うようにしてもよい。この場合、例えば、同一と判定されたときのSADの値のうちの最小値が算出された判定対象範囲を、同一の動画像として出力してもよい。
次に、図15は、第2の読み込み制御を適用した場合のベクトルデータの相関演算について説明するための図である。
図15では、図12と同様の第1の動画像ストリームおよび第2の動画像ストリームを例示している。また、第1の動画像ストリームに対応する特徴量情報101には、シーンチェンジ情報として少なくともフレーム番号“6”,“16”が含まれており、第2の動画像ストリームに対応する特徴量情報101には、シーンチェンジ情報として少なくともフレーム番号“11”が含まれていたものとする。なお、図15では、判定対象範囲を10フレームとしている。
第2の読み込み制御が適用される場合、各動画像ストリームに対して、それぞれの先頭フレームから順に判定対象範囲が設定されるのではなく、各動画像ストリームに対応する特徴量情報101に記載されたシーンチェンジ情報を基に、判定対象範囲を設定する先頭フレーム(または末尾フレーム)が設定される。
読み込み制御部151は、まず、各動画像ストリームに対応する特徴量情報101からシーンチェンジ情報を読み込む。次に、例えば、第1の動画像ストリームから検出された、最も先頭に近いシーンチェンジの位置(フレーム)を先頭にして、第1の動画像ストリームに対して判定対象範囲(例えば、図中の判定対象範囲Rbb)を設定する。一方、第2の動画像ストリームに対しては、同様に最も先頭に近いシーンチェンジの位置(フレーム)を先頭にして、判定対象範囲(例えば、図中の判定対象範囲Raa1)を設定する。この後の処理は前述した通りであり、SAD演算部152は、このように設定された判定対象範囲間のベクトルデータのSADを演算し、同一性判定部153は、その演算結果を基に同一性を判定する。
次に、読み込み制御部151は、第1の動画像ストリームからシーンチェンジが複数の位置において検出されている場合には、先頭から2番目に近いシーンチェンジの位置(フレーム)を先頭にして、第1の動画像ストリームに対して判定対象範囲(例えば、図中の判定対象範囲Raa2)を設定する。そして、各動画像ストリームの判定対象範囲間でSADが演算され、同一性が判定される。
以後、第1の動画像ストリームにおけるシーンチェンジの検出位置のそれぞれを先頭として、判定対象範囲が順次設定されていき、各範囲での動画像の同一性が判定される。さらに、第1の動画像ストリームにおけるすべてのシーンチェンジ検出位置に対して判定対象範囲が設定された後、第2の動画像ストリームからシーンチェンジが複数の位置において検出されている場合には、読み込み制御部151は、第2の動画像ストリームに対する判定対象範囲の先頭を各シーンチェンジの位置に順次設定していく。そして、第2の動画像ストリームに対する判定対象範囲が変更されるごとに、第1の動画像ストリームにおける判定対象範囲が上記と同様の処理により順次設定されていき、各判定対象範囲での動画像の同一性が判定される。
なお、第2の読み込み制御を適用した同一性判定処理は、例えば、図14に示した処理手順において、ステップS41,S42での判定対象範囲の設定処理を、各動画像ストリームに対応するシーンチェンジの位置に応じて決定するように変更することで実現される。
以上のような第2の読み込み制御を適用した場合には、第1の読み込み制御を適用した場合と比較して、各動画像ストリームに対して設定する判定対象範囲の組み合わせ数が大幅に減少される。このため、同一性判定処理時の演算量が低減され、その処理に要する時間を短縮できる。
なお、第2の読み込み制御の処理において、読み込み制御部151は、例えば、1つの動画像ストリームの複数の位置からシーンチェンジが検出されている場合には、判定対象範囲のフレーム数を2つのシーンチェンジ検出位置間のフレーム数としてもよい。これによって、同一性判定処理の処理効率をさらに向上させることができる。
以上説明した特徴量検出処理と、この処理により生成された特徴量情報101を用いた同一性判定処理によれば、それぞれの動画像ストリームに対して、そこに含まれるフレームごとに、フレームの画素数よりはるかに少ない数の特徴量(ベクトルデータ)を対応付けておき、2つの動画像ストリーム間でそれらの特徴量の相関をとることによって、動画像の同一性を判定できる。従って、例えば、各動画像ストリームの画像データの相関をとることで同一性を判定する場合と比較して、その演算量を大幅に低減することができる。
また、特徴量を、各フレームに設定した1つ以上の検索領域において最も動きの少ないブロックの位置を示す情報としたことで、画像の変化に関係なく、安定的に高精度の同一性判定を行うことができる。
さらに、このような特徴量の検出処理の過程において、現在のフレームと参照フレームとの間で、同じ領域内の画像の相関が求められる。このため、このように求められた相関値を、特徴量の検出に加えてシーンチェンジの検出にも利用することが可能となる。シーンチェンジの検出は、検索領域内で最も相関が高いブロックでの相関値を1フレーム分だけ累積加算し、しきい値と比較するという単純な処理により実行可能である。そして、前述のように、特徴量情報101にシーンチェンジ情報を含めておき、この情報を同一性判定処理時のデータ読み込み制御に利用することで、同一性判定処理の演算量を大幅に低減できる。
また、上記のように、特徴量の検出処理の過程において、現在のフレームと参照フレームとの間で、同じ領域内の画像の相関が求められるため、各領域の画像データを簡易な制御によって読み込むことが可能である。さらに、フレームに設定する複数の検索領域の間で、同じ位置にブロックが設定される場合には、それらのブロックに対応して演算された相関値を複数の検索領域の処理で共用できる。この場合、相関演算の演算量をさらに低減できる。
ここで、同一性判定処理に用いる特徴量として、2つのフレーム間の動きベクトルを検出する方法を考える。この方法では、例えば、上記の検索領域内の1つのブロックと相関の高い領域を、参照フレーム内の検索領域に対応する領域から検出し、検出された領域とブロックとのフレーム内での位置関係を動きベクトルとして表す。検索領域やブロックを上記の実施の形態と同様に設定し、1つの参照領域に対して1つの動きベクトルを対応付けるものとすれば、動きベクトル検出のための演算量は、基本的には、本実施の形態でのベクトルデータ検出のための演算量と同等となる。
しかし、動きベクトルを検出する場合には、相関の演算のほとんどの過程において、2つのフレームにおける異なる領域内の画像データ間で相関が演算される。このため、前述のように、ブロックに対応して演算された相関値を複数の検索領域の処理で共用することは不可能であり、相関演算量をさらに低減することはできない。
次に、特徴量検出処理の変形例について補足説明する。
前述の画像検証装置100では、前処理部120において、入力画像に対するスケーリング処理を行って、各フレームの画素数を一定に揃えた上で、ベクトルデータを算出する処理を行っていた。この場合、ブロックの位置を示すベクトルデータのx成分,y成分を、ともに画素数によって表すことが可能であった。
しかし、前処理部120は、この他に例えば、フレーム全体の画素数を一定に変換せずに、入力画像のアスペクト比のみを一定にするように変換してもよい。この場合、特徴量検出処理部130では、以下で説明する方法によりベクトルデータを生成することによって、生成したベクトルデータを同一性判定処理時に共通に利用することが可能になる。
図16は、ベクトルデータを画像領域の比を基に算出する手順を説明するための図である。
まず、特徴量検出処理部130のSAD演算部131は、入力画像のフレームの画素数に関係なく、検索領域の水平/垂直方向の画素数と、フレーム全体の水平/垂直方向の画素数との比が同じになるように、検索領域を設定する。図16(A)の例では、フレームの水平/垂直方向の画素数をそれぞれxf,yf、検索領域A4の水平/垂直方向の画素数をそれぞれxa,yaとすると、xa/xf,ya/yfをそれぞれ一定とするように検索領域A4を設定する。ただし、1つのフレームに対して複数の検索領域を設定する場合、各検索領域がすべて同じ画素数である必要はない。
次に、SAD演算部131は、設定した検索領域内にブロックを設定し、SADの演算を行う。このときも、検索領域(またはフレーム)の水平/垂直方向の画素数とブロックの水平/垂直方向の画素数との比が一定になるように、ブロックを設定する。
ここで、検索領域A4内に設定した各ブロックに対応するSADの値のうち、ブロックBmaxに対応するSADの値が最大であったとする。このとき、ブロックBmaxの位置は、例えば図16(A)に示すように、検索領域A4内の基準位置Paを基準とした、ブロックBmaxの基準位置Pbの相対位置を示すベクトルデータVとして表すことができる。
ここで、ベクトルデータVの水平/垂直方向の各成分を、検索領域の水平/垂直方向の各画素数に対する、基準位置Pa,Pb間の水平/垂直方向の各座標差の比率として表す。図16(A)の場合には、例えば、V=(vx1/xa,vy1/ya)と表すことができる。
また、ブロックの位置を表現するための基準位置として、検索領域の基準位置Paの代わりに、図16(B)に示すように、フレーム内の基準位置Pfを用いてもよい。この場合、ベクトルデータVの水平/垂直方向の各成分を、フレームの水平/垂直方向の各画素数に対する、基準位置Pf,Pb間の水平/垂直方向の各座標差の比率として表す。図16(B)の場合には、例えば、V=(vx2/xf,vy2/yf)と表すことができる。
このように、入力画像の画素数に関係なく、検索領域およびブロックをフレーム全体に対する比率が常に同じになるように設定し、ブロックの相対位置を、検索領域またはフレームの大きさに対する比率によって表すことにより、生成されるベクトルデータは、同一性判定処理において必ず共通に利用できるものとなる。特徴量の検出対象とされる動画像コンテンツの量は膨大であり、それらの動画像コンテンツには画素数が異なるものも多いことから、上記処理によって同一性判定処理の汎用性を高めることができる。
また、特徴量検出処理部130の機能が、同一性判定処理部150の機能とは別の複数の装置において実現される場合もある。このような場合でも、各特徴量検出装置において上記の処理が適用されることで、検出対象とする動画像コンテンツの画素数を装置間で統一する必要がなくなる。
なお、上記の画像処理装置1や画像検証装置100が備える処理機能の少なくとも一部は、コンピュータによって実現することができる。その場合には、上記各装置が有すべき処理機能の処理内容を記述したプログラムが提供される。そして、そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。
プログラムを流通させる場合には、例えば、そのプログラムが記録された光ディスクなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、そのプログラムを、サーバコンピュータからネットワークを介して他のコンピュータに転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムまたはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、そのプログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
実施の形態に係る画像処理装置の構成を概略的に示す図である。 実施の形態に係る画像検証装置の機能を示すブロック図である。 特徴量情報のデータ構成例を示す図である。 検索領域内でのブロックの設定方法を説明するための図である。 フレーム内での検索領域の設定方法を説明するための図である。 ブロックの位置を示すベクトルデータを説明するための図である。 SADの演算方法を説明するための図である。 特徴量検出処理部の内部構成例を示すブロック図である。 最小SADの総和を用いたシーンチェンジの検出方法について説明するための図である。 特徴量検出処理の手順を示すフローチャートである。 同一性判定処理部の内部構成例を示すブロック図である。 第1の読み込み制御を適用した場合のベクトルデータの相関演算について説明するための図である。 第1の読み込み制御を適用した場合のSADの算出例を示すグラフである。 第1の読み込み制御を適用した場合の同一性判定処理の手順を示すフローチャートである。 第2の読み込み制御を適用した場合のベクトルデータの相関演算について説明するための図である。 ベクトルデータを画像領域の比を基に算出する手順を説明するための図である。 動画像データ同士を比較する方法の例について説明するための図である。
符号の説明
1 画像処理装置
11 ブロック設定部
12 相関演算部
13 位置情報出力部
14 特徴量出力部
15 特徴量データベース

Claims (12)

  1. 動画像コンテンツのデータを解析して、他の動画像コンテンツとの同一性を検証するために利用される特徴量を算出する画像処理装置において、
    入力された動画像データにおける現在のフレーム内に1つ以上の検索領域を設定し、それぞれの前記検索領域の中に、複数でかつ同一数の隣接画素からなるブロックを順次設定するブロック設定部と、
    前記現在のフレームに設定された前記ブロック内の画像データと、当該フレームの前または後のフレームにおける当該ブロックと同じ領域内の画像データとの相関を求める相関演算部と、
    相関演算の結果、前記検索領域内で相関が最大であった前記ブロックの位置を示す位置情報を、前記検索領域ごとに出力する位置情報出力部と、
    入力された動画像データごとの前記特徴量として、前記検索領域ごとの前記位置情報を当該動画像データの各フレームに対応付けた情報を出力する特徴量出力部と、
    を有することを特徴とする画像処理装置。
  2. 前記相関演算部は、前記現在のフレームに設定された前記ブロック内の各画素のデータと、当該フレームの前または後のフレームにおける当該ブロックと同じ領域内の対応する画素のデータとの差分の絶対値を、前記検索領域内に設定した前記ブロック内の全画素数分だけ累積加算することで画像相関値を算出し、
    前記位置情報出力部は、前記検索領域内で前記画像相関値が最小であった前記ブロックの位置を示す前記位置情報を出力する、
    ことを特徴とする請求項1記載の画像処理装置。
  3. 前記位置情報出力部から出力される前記位置情報が指し示す前記ブロックに対応する前記画像相関値を1フレーム分だけ累積加算した相関値総和を所定のしきい値と比較し、前記相関値総和が前記しきい値を超えた場合にシーンチェンジが発生したと判定するシーンチェンジ検出部をさらに有し、
    前記特徴量出力部は、前記シーンチェンジ検出部の判定結果に基づき、シーンチェンジが発生したフレームを示すフレーム識別情報を前記特徴量に付加して出力することを特徴とする請求項2記載の画像処理装置。
  4. 前記ブロック設定部、前記相関演算部、前記位置情報出力部および前記特徴量出力部の処理によって2つの動画像データからそれぞれ得られた前記位置情報および前記フレーム識別情報を基に、当該2つの動画像データに基づく動画像の同一性を判定する同一性判定処理部をさらに有し、
    前記同一性判定処理部は、
    前記2つの動画像データのそれぞれに対して、同一のフレーム数分の判定対象範囲を、その先頭位置を移動させながら順次設定する範囲設定部と、
    前記2つの動画像データの少なくとも一方について前記判定対象範囲が移動されて設定されるごとに、一方の動画像データに設定された前記判定対象範囲に対応する前記位置情報と、他方の動画像データに設定された前記判定対象範囲に対応する前記位置情報との相関を求める位置相関演算部と、
    前記位置相関演算部により求められた相関を示す値を所定のしきい値と比較した結果を基に、当該2つの動画像データに基づく動画像の同一性を判定する比較部と、
    を有し、
    前記範囲設定部は、前記判定対象範囲の先頭位置を、設定対象の動画像データに対応する前記フレーム識別情報により識別されるフレームとすることを特徴とする請求項3記載の画像処理装置。
  5. 前記ブロック設定部、前記相関演算部、前記位置情報出力部および前記特徴量出力部の処理によって2つの動画像データからそれぞれ得られた前記位置情報を取得し、当該2つの動画像データにそれぞれ対応する前記位置情報の相関を基に、当該2つの動画像データに基づく動画像の同一性を判定する同一性判定処理部をさらに有することを特徴とする請求項1記載の画像処理装置。
  6. 前記同一性判定処理部は、
    前記2つの動画像データのそれぞれに対して、同一のフレーム数分の判定対象範囲を、その先頭位置を移動させながら順次設定する範囲設定部と、
    前記2つの動画像データの少なくとも一方について前記判定対象範囲が移動されて設定されるごとに、一方の動画像データに設定された前記判定対象範囲に対応する前記位置情報と、他方の動画像データに設定された前記判定対象範囲に対応する前記位置情報との相関を求める位置相関演算部と、
    前記位置相関演算部により求められた相関を示す値を所定のしきい値と比較した結果を基に、当該2つの動画像データに基づく動画像の同一性を判定する比較部と、
    を有することを特徴とする請求項5記載の画像処理装置。
  7. 前記比較部は、前記位置相関演算部により求められた相関を示す値のうちの一定数の値の平均値を演算し、前記しきい値を当該平均値に対する所定の比率の値に設定することを特徴とする請求項6記載の画像処理装置。
  8. 入力された動画像データの各フレームのアスペクト比を所定の比率に変換するアスペクト比変換部をさらに有し、
    前記ブロック設定部は、前記アスペクト比変換部による変換処理後の動画像データにおける前記現在のフレーム内に、前記検索領域および前記ブロックを、当該フレームの大きさに対する比率が常に一定となるような大きさにそれぞれ設定することを特徴とする請求項1〜7のいずれか1項に記載の画像処理装置。
  9. 前記位置情報出力部は、前記位置情報を、フレームまたは前記検索領域における所定の位置を基準とした相対位置情報として表し、さらに、当該相対位置情報の水平方向成分および垂直方向成分の大きさを、フレームまたは前記検索領域の大きさに対する比率によって表すことを特徴とする請求項8記載の画像処理装置。
  10. 前記ブロック設定部は、対応する前記検索領域内で、その領域の一部が他の前記ブロックの領域と重複するように前記ブロックを設定することを特徴とする請求項1〜9のいずれか1項に記載の画像処理装置。
  11. 動画像コンテンツのデータを解析して、他の動画像コンテンツとの同一性を検証するために利用される特徴量を算出する画像処理方法において、
    ブロック設定部が、入力された動画像データにおける現在のフレーム内に1つ以上の検索領域を設定し、それぞれの前記検索領域の中に、複数でかつ同一数の隣接画素からなるブロックを順次設定し、
    相関演算部が、前記現在のフレームに設定された前記ブロック内の画像データと、当該フレームの前または後のフレームにおける当該ブロックと同じ領域内の画像データとの相関を求め、
    位置情報出力部が、相関演算の結果、前記検索領域内で相関が最大であった前記ブロックの位置を示す位置情報を、前記検索領域ごとに出力し、
    特徴量出力部が、入力された動画像データごとの前記特徴量として、前記検索領域ごとの前記位置情報を当該動画像データの各フレームに対応付けた情報を出力する、
    ことを特徴とする画像処理方法。
  12. 動画像コンテンツのデータを解析して、他の動画像コンテンツとの同一性を検証するために利用される特徴量を算出する画像処理プログラムにおいて、
    コンピュータを、
    入力された動画像データにおける現在のフレーム内に1つ以上の検索領域を設定し、それぞれの前記検索領域の中に、複数でかつ同一数の隣接画素からなるブロックを順次設定するブロック設定部、
    前記現在のフレームに設定された前記ブロック内の画像データと、当該フレームの前または後のフレームにおける当該ブロックと同じ領域内の画像データとの相関を求める相関演算部、
    相関演算の結果、前記検索領域内で相関が最大であった前記ブロックの位置を示す位置情報を、前記検索領域ごとに出力する位置情報出力部、
    入力された動画像データごとの前記特徴量として、前記検索領域ごとの前記位置情報を当該動画像データの各フレームに対応付けた情報を出力する特徴量出力部、
    として機能させることを特徴とする画像処理プログラム。
JP2008152809A 2008-06-11 2008-06-11 画像処理装置、方法およびプログラム Expired - Fee Related JP4997179B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008152809A JP4997179B2 (ja) 2008-06-11 2008-06-11 画像処理装置、方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008152809A JP4997179B2 (ja) 2008-06-11 2008-06-11 画像処理装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2009302723A JP2009302723A (ja) 2009-12-24
JP4997179B2 true JP4997179B2 (ja) 2012-08-08

Family

ID=41549191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008152809A Expired - Fee Related JP4997179B2 (ja) 2008-06-11 2008-06-11 画像処理装置、方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4997179B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170372142A1 (en) 2016-06-27 2017-12-28 Facebook, Inc. Systems and methods for identifying matching content
US20190020913A9 (en) * 2016-06-27 2019-01-17 Facebook, Inc. Systems and methods for identifying matching content
KR102112768B1 (ko) * 2018-08-06 2020-06-04 네이버웹툰 주식회사 이미지 매칭을 이용한 표식 검출 방법, 장치 및 프로그램

Also Published As

Publication number Publication date
JP2009302723A (ja) 2009-12-24

Similar Documents

Publication Publication Date Title
CN109426782B (zh) 对象检测方法和用于对象检测的神经网络系统
US9646389B2 (en) Systems and methods for image scanning
CN110853033B (zh) 基于帧间相似度的视频检测方法和装置
WO2019023921A1 (zh) 一种手势识别方法、装置及设备
JP5048542B2 (ja) 画像処理装置及び画像処理プログラム
CN111512317A (zh) 一种多目标实时跟踪方法、装置及电子设备
US20130070105A1 (en) Tracking device, tracking method, and computer program product
JP6103080B2 (ja) ビデオにおけるカメラ動きの型を検出する方法および装置
JP2005128619A (ja) 物体計測装置、物体計測方法、およびプログラム
CN108921131B (zh) 一种生成人脸检测模型、三维人脸图像的方法及装置
WO2011161579A1 (en) Method, apparatus and computer program product for providing object tracking using template switching and feature adaptation
US8660302B2 (en) Apparatus and method for tracking target
US20110069155A1 (en) Apparatus and method for detecting motion
CN112749726B (zh) 目标检测模型的训练方法、装置、计算机设备和存储介质
Tian et al. Scene Text Detection in Video by Learning Locally and Globally.
JP2013501289A (ja) 画像解析方法
JP2012073971A (ja) 動画オブジェクト検出装置、方法、及びプログラム
JP2009003866A (ja) 顔認証装置
JP4997179B2 (ja) 画像処理装置、方法およびプログラム
US8428369B2 (en) Information processing apparatus, information processing method, and program
CN111444817A (zh) 一种人物图像识别方法、装置、电子设备和存储介质
JP6305856B2 (ja) 画像処理装置、画像処理方法、およびプログラム
WO2024022301A1 (zh) 视角路径获取方法、装置、电子设备及介质
CN110427816B (zh) 物体检测方法、装置、计算机设备和存储介质
Zhang et al. Long-term face tracking in the wild using deep learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110523

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120508

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120514

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4997179

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees