JP4997179B2 - 画像処理装置、方法およびプログラム - Google Patents
画像処理装置、方法およびプログラム Download PDFInfo
- Publication number
- JP4997179B2 JP4997179B2 JP2008152809A JP2008152809A JP4997179B2 JP 4997179 B2 JP4997179 B2 JP 4997179B2 JP 2008152809 A JP2008152809 A JP 2008152809A JP 2008152809 A JP2008152809 A JP 2008152809A JP 4997179 B2 JP4997179 B2 JP 4997179B2
- Authority
- JP
- Japan
- Prior art keywords
- moving image
- frame
- image data
- block
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
- Image Analysis (AREA)
Description
ここで、図17は、動画像データ同士を比較する方法の例について説明するための図である。
図1は、実施の形態に係る画像処理装置の構成を概略的に示す図である。
図1に示す画像処理装置1は、他の動画像コンテンツとの同一性を検証するために利用される特徴量を、入力された動画像コンテンツのデータを基に算出するための装置である。この画像処理装置1は、ブロック設定部11、相関演算部12、位置情報出力部13、特徴量出力部14および特徴量データベース15を備えている。
図2に示す画像検証装置100は、制御部110、前処理部120、特徴量検出処理部130、特徴量データベース140および同一性判定処理部150を備えている。
前処理部120は、入力された動画像ストリームに前処理を施し、特徴量検出処理部130に出力する。前処理としては、画像サイズを一定のサイズ(画素数)に変換するスケーリング処理が行われる。さらに、前処理部120では、例えば、ローパスフィルタなどを用いてノイズを除去する処理などが行われてもよい。
図3に示すように、特徴量情報101には、フレーム番号に対して、検索領域番号およびベクトルデータが対応付けられて格納されている。さらに、シーンチェンジ情報も格納されている。
まず、図4は、検索領域内でのブロックの設定方法を説明するための図である。
特徴量検出処理部130は、上記の手順によって1つの検索領域でのブロックごとの相関演算を行った後、さらに、検索領域の位置を変更して、同様の手順でその内部にブロックを設定し、相関演算を実行する。検索領域は、例えば、フレーム内の全領域を網羅するように順次設定される。前述のように、本実施の形態ではフレームを12分割した分割領域を単位として検索領域が設定されるため、検索領域をフレームの左上、右上、左下、右下の4領域だけ設定することで、フレーム全体を検索対象とすることができる。
図6の例では、検索領域の左上の画素を、その検索領域の基準位置としている。また、検索領域内のブロックの左上の画素を、そのブロックの基準位置としている。このような場合、ブロックの位置を、検索領域の基準位置の座標を始点とした、ブロックの基準位置の相対座標であるベクトルデータとして表すことができる。
現在のフレームのブロック内の画像データをd、そのブロックに対応する参照フレームの参照領域内の画像データをrとすると、ブロックと参照領域とのSADの値は下記の式(1)によって求められる。なお、図7では例として、ブロックが8×8画素により構成されるものとし、ブロック内の各画素の画像データをd00〜d63、対応する参照領域内の各画素の画像データをr00〜r63と表している。そして、下記の式(1)には、例として、この図7のような場合のSAD算出のための式も、併せて示している。
SAD_BLK=Σ|(d−r)|
=|(d00−r00)|+|(d01−r01)|+・・・+|(d63−r63)|
……(1)
SADの値は、ブロックと参照領域との相関が大きいほど小さくなる。従って、特徴量検出処理部130は、検索領域内の各ブロックのうち、対応する参照領域とのSADの値が最小となるブロックを検出し、そのブロックの位置を示す情報(ベクトルデータ)を特徴量として登録する。
図8は、特徴量検出処理部の内部構成例を示すブロック図である。
SAD総和演算部134およびシーンチェンジ検出部135は、SAD演算部131および最小値検出部132の演算・検出結果を利用してシーンチェンジを検出するための機能である。SAD総和演算部134は、最小値検出部132で検出された、各検索領域におけるSADの最小値を1フレーム分ずつ取得して、これらの総和を求める。
シーンチェンジが発生した後のフレームは、その前のフレームとの相関が小さくなると考えられる。そこで、特徴量検出処理部130では、SAD演算部131で求めたフレーム間の相関(すなわちSAD)を、シーンチェンジの発生を検出処理に流用している。SAD演算部131では、現フレームに設定したブロック内の画像データと、参照フレーム(前フレーム)におけるブロックに対応する参照領域内の画像データとのSADを、検索領域ごとに算出している。そして、最小値検出部132は、検索領域ごとにSADの最小値を検出している。このとき検出されたSADの最小値は、検索領域における現フレームと参照フレームとの相関を示すと考えることができる。このため、設定した検索領域ごとに検出されたSADの最小値を1フレーム分だけ累積加算した値を、フレーム間の相関を示す値と見なすことができる。
図10は、特徴量検出処理の手順を示すフローチャートである。
[ステップS22]SAD演算部131は、フレームの中に検索領域を設定する。
[ステップS24]SAD演算部131は、現在のフレームの画像データのうち、ステップS23で設定したブロック内の画像データを読み込む。さらに、参照フレームの画像データのうち、設定したブロックに対応する参照領域内の画像データを読み込む。そして、これらの画像データ同士でSADを演算する。
[ステップS27]ベクトルデータ出力部133は、ステップS26において最小値が検出されたブロックを指し示すベクトルデータを生成して出力する。このベクトルデータは、ステップS22で設定された検索領域を識別する番号に対応付けて特徴量情報101に格納される。
[ステップS30]シーンチェンジ検出部135は、ステップS29で算出された最小SADの総和を所定のしきい値と比較し、シーンチェンジが発生したか否かを判定する。最小SADの総和がしきい値を超えている場合には、シーンチェンジが発生したと判定して、現在のフレームを示すフレーム番号を出力する。このフレーム番号は、特徴量情報101に格納される。また、最小SADの総和がしきい値以下である場合には、シーンチェンジが発生していないと判定する。この場合、フレーム番号は出力されず、次のステップS31の処理が実行される。
図11は、同一性判定処理部の内部構成例を示すブロック図である。
同一性判定処理部150は、図11に示すように、読み込み制御部151、SAD演算部152および同一性判定部153を備えている。
図12では、同一性を判定する第1の動画像ストリーム、第2の動画像ストリームのそれぞれを、フレーム番号を羅列することによって模式的に示している。すなわち、図12では例として、各動画像ストリームについて、先頭のフレームから26番目のフレームまでを示している。
SAD_STR=Σ|(Va_pq−Vb_pq)| ……(2)
同一性判定部153は、このようにしてSAD演算部152により算出されたSADの値を、所定のしきい値と比較する。SADの値がしきい値以下であった場合には、各範囲の動画像が同一であると判定できる。
図13に示すグラフは、第2の動画像ストリームにおける所定の位置に100フレーム分の判定対象範囲を設定するとともに、第1の動画像ストリームに同数のフレームからなる判定対象範囲を順次移動させながら設定したときのSADの値をプロットしたものである。従って、図13のグラフの横軸は、第1の動画像ストリームに設定される判定対象範囲の先頭を示すフレーム番号である。なお、この算出例では、各動画像ストリームのフレームの画素数を360×240、参照領域の画素数を64×64、ブロックの画素数を16×16としている。
[ステップS41]読み込み制御部151は、第2の動画像ストリームに対して判定対象範囲を設定する。
[ステップS43]読み込み制御部151は、各動画像ストリームに対応する特徴量情報101の中から、設定した判定対象範囲内のベクトルデータを読み込む。
[ステップS45]同一性判定部153は、SADの演算結果をしきい値と比較し、各判定対象範囲の動画像が同一か否かを判定する。
なお、以上の図14の処理例では、SADの算出結果としきい値との比較結果から、各判定対象範囲の動画像が一致したと判定された時点で、判定結果を出力して処理を終了していた。しかし、この他に例えば、処理の途中で動画像が一致したと判定された場合でも、設定すべきすべての判定対象範囲同士の同一性判定を行うようにしてもよい。この場合、例えば、同一と判定されたときのSADの値のうちの最小値が算出された判定対象範囲を、同一の動画像として出力してもよい。
図15では、図12と同様の第1の動画像ストリームおよび第2の動画像ストリームを例示している。また、第1の動画像ストリームに対応する特徴量情報101には、シーンチェンジ情報として少なくともフレーム番号“6”,“16”が含まれており、第2の動画像ストリームに対応する特徴量情報101には、シーンチェンジ情報として少なくともフレーム番号“11”が含まれていたものとする。なお、図15では、判定対象範囲を10フレームとしている。
前述の画像検証装置100では、前処理部120において、入力画像に対するスケーリング処理を行って、各フレームの画素数を一定に揃えた上で、ベクトルデータを算出する処理を行っていた。この場合、ブロックの位置を示すベクトルデータのx成分,y成分を、ともに画素数によって表すことが可能であった。
まず、特徴量検出処理部130のSAD演算部131は、入力画像のフレームの画素数に関係なく、検索領域の水平/垂直方向の画素数と、フレーム全体の水平/垂直方向の画素数との比が同じになるように、検索領域を設定する。図16(A)の例では、フレームの水平/垂直方向の画素数をそれぞれxf,yf、検索領域A4の水平/垂直方向の画素数をそれぞれxa,yaとすると、xa/xf,ya/yfをそれぞれ一定とするように検索領域A4を設定する。ただし、1つのフレームに対して複数の検索領域を設定する場合、各検索領域がすべて同じ画素数である必要はない。
11 ブロック設定部
12 相関演算部
13 位置情報出力部
14 特徴量出力部
15 特徴量データベース
Claims (12)
- 動画像コンテンツのデータを解析して、他の動画像コンテンツとの同一性を検証するために利用される特徴量を算出する画像処理装置において、
入力された動画像データにおける現在のフレーム内に1つ以上の検索領域を設定し、それぞれの前記検索領域の中に、複数でかつ同一数の隣接画素からなるブロックを順次設定するブロック設定部と、
前記現在のフレームに設定された前記ブロック内の画像データと、当該フレームの前または後のフレームにおける当該ブロックと同じ領域内の画像データとの相関を求める相関演算部と、
相関演算の結果、前記検索領域内で相関が最大であった前記ブロックの位置を示す位置情報を、前記検索領域ごとに出力する位置情報出力部と、
入力された動画像データごとの前記特徴量として、前記検索領域ごとの前記位置情報を当該動画像データの各フレームに対応付けた情報を出力する特徴量出力部と、
を有することを特徴とする画像処理装置。 - 前記相関演算部は、前記現在のフレームに設定された前記ブロック内の各画素のデータと、当該フレームの前または後のフレームにおける当該ブロックと同じ領域内の対応する画素のデータとの差分の絶対値を、前記検索領域内に設定した前記ブロック内の全画素数分だけ累積加算することで画像相関値を算出し、
前記位置情報出力部は、前記検索領域内で前記画像相関値が最小であった前記ブロックの位置を示す前記位置情報を出力する、
ことを特徴とする請求項1記載の画像処理装置。 - 前記位置情報出力部から出力される前記位置情報が指し示す前記ブロックに対応する前記画像相関値を1フレーム分だけ累積加算した相関値総和を所定のしきい値と比較し、前記相関値総和が前記しきい値を超えた場合にシーンチェンジが発生したと判定するシーンチェンジ検出部をさらに有し、
前記特徴量出力部は、前記シーンチェンジ検出部の判定結果に基づき、シーンチェンジが発生したフレームを示すフレーム識別情報を前記特徴量に付加して出力することを特徴とする請求項2記載の画像処理装置。 - 前記ブロック設定部、前記相関演算部、前記位置情報出力部および前記特徴量出力部の処理によって2つの動画像データからそれぞれ得られた前記位置情報および前記フレーム識別情報を基に、当該2つの動画像データに基づく動画像の同一性を判定する同一性判定処理部をさらに有し、
前記同一性判定処理部は、
前記2つの動画像データのそれぞれに対して、同一のフレーム数分の判定対象範囲を、その先頭位置を移動させながら順次設定する範囲設定部と、
前記2つの動画像データの少なくとも一方について前記判定対象範囲が移動されて設定されるごとに、一方の動画像データに設定された前記判定対象範囲に対応する前記位置情報と、他方の動画像データに設定された前記判定対象範囲に対応する前記位置情報との相関を求める位置相関演算部と、
前記位置相関演算部により求められた相関を示す値を所定のしきい値と比較した結果を基に、当該2つの動画像データに基づく動画像の同一性を判定する比較部と、
を有し、
前記範囲設定部は、前記判定対象範囲の先頭位置を、設定対象の動画像データに対応する前記フレーム識別情報により識別されるフレームとすることを特徴とする請求項3記載の画像処理装置。 - 前記ブロック設定部、前記相関演算部、前記位置情報出力部および前記特徴量出力部の処理によって2つの動画像データからそれぞれ得られた前記位置情報を取得し、当該2つの動画像データにそれぞれ対応する前記位置情報の相関を基に、当該2つの動画像データに基づく動画像の同一性を判定する同一性判定処理部をさらに有することを特徴とする請求項1記載の画像処理装置。
- 前記同一性判定処理部は、
前記2つの動画像データのそれぞれに対して、同一のフレーム数分の判定対象範囲を、その先頭位置を移動させながら順次設定する範囲設定部と、
前記2つの動画像データの少なくとも一方について前記判定対象範囲が移動されて設定されるごとに、一方の動画像データに設定された前記判定対象範囲に対応する前記位置情報と、他方の動画像データに設定された前記判定対象範囲に対応する前記位置情報との相関を求める位置相関演算部と、
前記位置相関演算部により求められた相関を示す値を所定のしきい値と比較した結果を基に、当該2つの動画像データに基づく動画像の同一性を判定する比較部と、
を有することを特徴とする請求項5記載の画像処理装置。 - 前記比較部は、前記位置相関演算部により求められた相関を示す値のうちの一定数の値の平均値を演算し、前記しきい値を当該平均値に対する所定の比率の値に設定することを特徴とする請求項6記載の画像処理装置。
- 入力された動画像データの各フレームのアスペクト比を所定の比率に変換するアスペクト比変換部をさらに有し、
前記ブロック設定部は、前記アスペクト比変換部による変換処理後の動画像データにおける前記現在のフレーム内に、前記検索領域および前記ブロックを、当該フレームの大きさに対する比率が常に一定となるような大きさにそれぞれ設定することを特徴とする請求項1〜7のいずれか1項に記載の画像処理装置。 - 前記位置情報出力部は、前記位置情報を、フレームまたは前記検索領域における所定の位置を基準とした相対位置情報として表し、さらに、当該相対位置情報の水平方向成分および垂直方向成分の大きさを、フレームまたは前記検索領域の大きさに対する比率によって表すことを特徴とする請求項8記載の画像処理装置。
- 前記ブロック設定部は、対応する前記検索領域内で、その領域の一部が他の前記ブロックの領域と重複するように前記ブロックを設定することを特徴とする請求項1〜9のいずれか1項に記載の画像処理装置。
- 動画像コンテンツのデータを解析して、他の動画像コンテンツとの同一性を検証するために利用される特徴量を算出する画像処理方法において、
ブロック設定部が、入力された動画像データにおける現在のフレーム内に1つ以上の検索領域を設定し、それぞれの前記検索領域の中に、複数でかつ同一数の隣接画素からなるブロックを順次設定し、
相関演算部が、前記現在のフレームに設定された前記ブロック内の画像データと、当該フレームの前または後のフレームにおける当該ブロックと同じ領域内の画像データとの相関を求め、
位置情報出力部が、相関演算の結果、前記検索領域内で相関が最大であった前記ブロックの位置を示す位置情報を、前記検索領域ごとに出力し、
特徴量出力部が、入力された動画像データごとの前記特徴量として、前記検索領域ごとの前記位置情報を当該動画像データの各フレームに対応付けた情報を出力する、
ことを特徴とする画像処理方法。 - 動画像コンテンツのデータを解析して、他の動画像コンテンツとの同一性を検証するために利用される特徴量を算出する画像処理プログラムにおいて、
コンピュータを、
入力された動画像データにおける現在のフレーム内に1つ以上の検索領域を設定し、それぞれの前記検索領域の中に、複数でかつ同一数の隣接画素からなるブロックを順次設定するブロック設定部、
前記現在のフレームに設定された前記ブロック内の画像データと、当該フレームの前または後のフレームにおける当該ブロックと同じ領域内の画像データとの相関を求める相関演算部、
相関演算の結果、前記検索領域内で相関が最大であった前記ブロックの位置を示す位置情報を、前記検索領域ごとに出力する位置情報出力部、
入力された動画像データごとの前記特徴量として、前記検索領域ごとの前記位置情報を当該動画像データの各フレームに対応付けた情報を出力する特徴量出力部、
として機能させることを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008152809A JP4997179B2 (ja) | 2008-06-11 | 2008-06-11 | 画像処理装置、方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008152809A JP4997179B2 (ja) | 2008-06-11 | 2008-06-11 | 画像処理装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009302723A JP2009302723A (ja) | 2009-12-24 |
JP4997179B2 true JP4997179B2 (ja) | 2012-08-08 |
Family
ID=41549191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008152809A Expired - Fee Related JP4997179B2 (ja) | 2008-06-11 | 2008-06-11 | 画像処理装置、方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4997179B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170372142A1 (en) | 2016-06-27 | 2017-12-28 | Facebook, Inc. | Systems and methods for identifying matching content |
US20190020913A9 (en) * | 2016-06-27 | 2019-01-17 | Facebook, Inc. | Systems and methods for identifying matching content |
KR102112768B1 (ko) * | 2018-08-06 | 2020-06-04 | 네이버웹툰 주식회사 | 이미지 매칭을 이용한 표식 검출 방법, 장치 및 프로그램 |
-
2008
- 2008-06-11 JP JP2008152809A patent/JP4997179B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009302723A (ja) | 2009-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109426782B (zh) | 对象检测方法和用于对象检测的神经网络系统 | |
US9646389B2 (en) | Systems and methods for image scanning | |
CN110853033B (zh) | 基于帧间相似度的视频检测方法和装置 | |
WO2019023921A1 (zh) | 一种手势识别方法、装置及设备 | |
JP5048542B2 (ja) | 画像処理装置及び画像処理プログラム | |
CN111512317A (zh) | 一种多目标实时跟踪方法、装置及电子设备 | |
US20130070105A1 (en) | Tracking device, tracking method, and computer program product | |
JP6103080B2 (ja) | ビデオにおけるカメラ動きの型を検出する方法および装置 | |
JP2005128619A (ja) | 物体計測装置、物体計測方法、およびプログラム | |
CN108921131B (zh) | 一种生成人脸检测模型、三维人脸图像的方法及装置 | |
WO2011161579A1 (en) | Method, apparatus and computer program product for providing object tracking using template switching and feature adaptation | |
US8660302B2 (en) | Apparatus and method for tracking target | |
US20110069155A1 (en) | Apparatus and method for detecting motion | |
CN112749726B (zh) | 目标检测模型的训练方法、装置、计算机设备和存储介质 | |
Tian et al. | Scene Text Detection in Video by Learning Locally and Globally. | |
JP2013501289A (ja) | 画像解析方法 | |
JP2012073971A (ja) | 動画オブジェクト検出装置、方法、及びプログラム | |
JP2009003866A (ja) | 顔認証装置 | |
JP4997179B2 (ja) | 画像処理装置、方法およびプログラム | |
US8428369B2 (en) | Information processing apparatus, information processing method, and program | |
CN111444817A (zh) | 一种人物图像识别方法、装置、电子设备和存储介质 | |
JP6305856B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
WO2024022301A1 (zh) | 视角路径获取方法、装置、电子设备及介质 | |
CN110427816B (zh) | 物体检测方法、装置、计算机设备和存储介质 | |
Zhang et al. | Long-term face tracking in the wild using deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110523 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120508 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120514 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4997179 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |