JP4207763B2 - 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム - Google Patents

動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP4207763B2
JP4207763B2 JP2003412818A JP2003412818A JP4207763B2 JP 4207763 B2 JP4207763 B2 JP 4207763B2 JP 2003412818 A JP2003412818 A JP 2003412818A JP 2003412818 A JP2003412818 A JP 2003412818A JP 4207763 B2 JP4207763 B2 JP 4207763B2
Authority
JP
Japan
Prior art keywords
evaluation value
motion vector
unit
calculated
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003412818A
Other languages
English (en)
Other versions
JP2005175869A (ja
Inventor
哲二郎 近藤
健治 高橋
和志 吉川
貴規 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2003412818A priority Critical patent/JP4207763B2/ja
Publication of JP2005175869A publication Critical patent/JP2005175869A/ja
Application granted granted Critical
Publication of JP4207763B2 publication Critical patent/JP4207763B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラムに関する。さらに詳細には、動画像データからの動きベクトル検出処理を実行する動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラムに関する。
近年の情報処理装置、通信端末の高機能化、高速通信インフラの整備、さらに、DVD、Blu−rayディスクなどの高密度記録媒体の普及などに伴い、ネットワークを介した動画像データの配信、あるいは高密度記録媒体を利用した動画像データの記憶、再生などが盛んに行なわれるようになってきた。このような状況に伴って、動画像データに対するデータ処理、例えば符号化処理などにおける効率性や高速性の向上が求められている。
動画像データの高能率符号化における動き補償型画像符号化、交通監視システムあるいは自律走行車両の視覚センサにおける動物体の検出処理、速度検出処理などにおいては、画像データ中に含まれる各物体の動きの方向および大きさ(速度)を検出する処理、すなわち、動きベクトルの検出処理が必要となる。
例えば、動き補償型画像符号化処理の一例として、動画の高能率符号化の国際的標準方式であるMPEG(Moving Picture Coding Experts Group)方式が提案されているが、このMPEG方式は、DCT(Discrete Cosine Transform)と動き補償予測符号化とを組み合わせた符号化を行なう方式である。動き補償予測符号化においては、動画像データを構成する現フレームと、1つ前の前フレームの連続フレームにおける画像信号レベルの相関を検出し、検出した相関に基づいて動きベクトルを求め、検出した動きベクトルに基づく動き画像の補正処理を行うことで、効率的な符号化を達成している。
動きベクトルの検出方法の一つとして、ブロックマッチング法が知られている。図1を参照して、ブロックマッチング法の概要を説明する。動画像を構成する時間的に連続するフレーム画像、例えば図に示す時間(t)の現フレーム[F]20と、時間(t−1)の前フレーム[Ft−1]10を抽出する。フレーム画像の1画面を複数の画素で構成される小さな領域(以下、ブロックと称する)m画素×nラインに分割する。
現フレーム[F]20を参照フレームとし、参照フレームの検査ブロックBy21を、所定のサーチエリア22内で移動し、前フレーム[Ft−1]10の基準ブロックBx11と最も画素値差分の少ない、すなわち画素値が最も合致する(最も相関の大きな)検査ブロックを検出する。前フレーム[Ft−1]10の基準ブロックBx11が、この現フレーム[F]20から検出した相関の高い検査ブロックの位置に動いたと推定する。この推定された動きを示すベクトルに基づいて、各画素の動きベトクルを求める。このように、ブロックマッチング法は、所定のブロック(m×n)単位で、フレーム間の相関判定(マッチング判定)処理を行い、動きベクトルを求める手法である。
ブロックマッチング法において、動きベクトルはブロック毎に求められる。各ブロックの相関、すなわち合致の程度を表す評価値としては、例えば、基準ブロックBx内の複数の画素と、検査ブロックBy内の複数の画素との間で空間的に同一位置の画素同士の値を減算してフレーム差を求め、算出したフレーム差の絶対値を積算することで算出されるフレーム差絶対値和が適用される。あるいは、フレーム差の二乗和等を使用することも可能である。
しかし、上述のブロックマッチング法は、サーチエリア内の全てのデータの比較を行う全探索であるため、検出に要する比較の回数が非常に多く、動き検出に時間がかかる欠点があった。
また、ブロック内に動き部分と静止部分とが含まれるような場合、ブロックを単位として検出された動きは、正確にはブロック内の個々の画素の動きに対応するとは言えない。このような問題は、ブロックサイズの設定により調整可能であるが、例えば、ブロックを大きくすると、演算量の増大に加えて、ブロック内の複数動きの問題が発生し易くなる。逆に、ブロック内に複数の動きが含まれないように、ブロックのサイズを小さくした場合には、マッチングの判断の領域が小さくなるので、動き検出の精度が低下する問題が生じる。すなわち、ブロックマッチングを行う際、基準ブロックと似た検査ブロック、すなわち基準ブロックと相関の高い検査ブロックが多数出現する可能性が高くなる。これらは、動きに起因しないものが含まれるからであり、動き検出の精度が低下する。例えば、文字テロップが水平または垂直方向に動く時には、反復パターンの影響が現れやすい。漢字の文字パターンの場合では、同じ文字でも、小さな部分に分割すると、同一のパターンとなることが多い。従って、ブロック内に複数の動きが混在する場合には、正確な動きを求めることが難しいという問題があった。
本特許出願に係る出願人は、例えば特許文献1において、演算量を増大させることなく、1画素毎の動きベクトルを検出でき、且つ、誤検出を防止した動きベクトル検出方法および検出装置を提案している。
特許文献1において開示している動きベクトル検出処理のポイントは、画素またはブロック毎に評価値を算出して動きベクトルを決定するのではなく、第1ステップの処理として、フレームの一方に複数画素からなる複数ブロックを設定して、各ブロックの代表点を設定し、各代表点と他方のフレームに設定したサーチエリアの各画素との相関を調べ、相関情報に基づく評価値を算出して、評価値に基づく相関情報としての評価値テーブルを形成し、その評価値テーブルから、複数の候補ベクトルを抽出する。次に、第2ステップの処理として、抽出した候補ベクトルから、1画素毎に最良と思われる候補ベクトルを選択して対応付けて、各画素毎の動きベクトルとして決定する。このように、
評価値テーブルの生成処理、
評価値テーブルに基づく候補ベクトルの選択処理、
各画素対応の動きベクトルとして、複数の候補ベクトルから最適なものを対応付ける処理
以上の処理によって、各画素毎の動きベクトルを求める方式である。この方式を、以下、候補ベクトル方式と称する。
候補ベクトル方式による動きベクトル検出処理の利点は、評価テーブルに基づいて、限られた数の候補ベクトルを抽出しておくことで、演算量の軽減が図れること。また、動きベクトルの誤検出が起りやすい被写体の境界部分においても、予め絞り込んである候補ベクトルの中から、各画素に対応する最良の動きベクトルを判定することが可能となることなどがある。従来は、各画素の動きベクトルをフレーム間の画素の差分などを評価値として算出し、評価値をフレーム全画素について求める全探索処理を実行する方式がとられていたが、候補ベクトル方式では、予め絞り込んである候補ベクトルの中から、各画素に対応する最良の動きベクトルを判定する処理が可能であるので、全探索処理と比較して、同じ評価値が発生する確率が減り、誤検出が防止される。
しかし、この候補ベクトル方式においても、以下の問題点がある。すなわち、評価値テーブルを形成する際、フレーム差の絶対値を積算していた為、例えば画素値データが0〜255の8bitである場合、フレーム差の絶対値データは、0〜255の8bitのデータが必要となり、評価値テーブルをメモリで構成する場合、メモリ容量が多く必要となる。メモリ容量を小さくするためには、評価値情報の構成ビットを圧縮することが有効であり、例えば、ビット数の縮減を行なうことが有効であると想定されるが、ビット数の縮減によって、正確な評価値テーブルが得られなくなるという問題が発生する。
特開2001−61152号公報
本発明は、上述の問題点に鑑みてなされたものであり、例えば候補ベクトル方式に基づく動きベクトル検出処理において評価値テーブルを生成する際の評価値データを、画像の特性に応じて重み付けを行い、画像特性に応じた正確な評価値テーブルを生成可能とすることで、1画素単位での効率的で正確な動きベクトルの検出を可能とした動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラムを提供することを目的とする。
本発明の第1の側面は、
動画像データから動きベクトルを検出する動きベクトル検出装置であり、
時間軸上における異なるフレーム間の画素値相関情報に基づいて評価値テーブルを生成する評価値テーブル形成部と、
前記評価値テーブルに基づいて動画像データのフレーム構成画素に対する動きベクトルを検出して対応付ける動きベクトル検出部とを有し、
前記評価値テーブル形成部は、
時間軸上における異なるフレーム間の相関情報の算出処理を実行する相関演算部と、
注目画素を含む近傍領域画素の特徴量に基づく可変閾値を生成する可変閾値生成部と、
前記相関演算部の算出した相関情報と、前記可変閾値生成部の生成した閾値との比較処理を実行し、該比較処理結果に基づく仮評価値を算出する相関判定部と、
画像特性に基づく重み情報を算出し、前記相関判定部の算出した仮評価値および前記重み情報に基づく演算を実行して最終評価値を算出する評価値調整部と、
前記評価値調整部の出力する最終評価値を積算し、評価値テーブルを生成する評価値テーブル算出部と、
を有することを特徴とする動きベクトル検出装置にある。
さらに、本発明の動きベクトル検出装置の一実施態様において、前記評価値調整部は、画像特性に基づく重み情報を算出する重み決定部と、前記仮評価値と前記重み情報との乗算を実行する乗算部を有し、前記乗算部における乗算結果を最終評価値として前記評価値テーブル算出部に出力する処理を実行する構成であることを特徴とする。
さらに、本発明の動きベクトル検出装置の一実施態様において、前記評価値調整部は、画像特性に基づく重み情報を算出する重み決定部と、前記仮評価値と前記重み情報との乗算を実行する乗算部を有し、前記重み決定部は、前記相関演算部から入力するフレーム差分絶対値|ΔF|と、前記可変閾値生成部から入力する閾値THを適用して、下記式に従って重み情報Wを算出する処理を実行し、
=TH−|ΔF|+1
前記乗算部は、前記相関判定部の算出した仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として前記評価値テーブル算出部に出力する処理を実行する構成であることを特徴とする。
さらに、本発明の動きベクトル検出装置の一実施態様において、前記評価値調整部は、画像特性に基づく重み情報を算出する重み決定部と、前記仮評価値と前記重み情報との乗算を実行する乗算部を有し、前記重み決定部は、前記可変閾値生成部から入力する画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って重み情報Wを算出する処理を実行し、
=DR
前記乗算部は、前記相関判定部の算出した仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として前記評価値テーブル算出部に出力する処理を実行する構成であることを特徴とする。
さらに、本発明の動きベクトル検出装置の一実施態様において、前記評価値調整部は、画像特性に基づく重み情報を算出する重み決定部と、前記仮評価値と前記重み情報との乗算を実行する乗算部を有し、前記重み決定部は、前記可変閾値生成部から入力する画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って重み情報W'を算出する処理を実行し、
'=DR/n
ただし、nは2以上の自然数
前記乗算部は、前記相関判定部の算出した仮評価値と前記重み情報W'との乗算を実行し、乗算結果を最終評価値として前記評価値テーブル算出部に出力する処理を実行する構成であることを特徴とする。
さらに、本発明の動きベクトル検出装置の一実施態様において、前記評価値調整部は、画像特性に基づく重み情報を算出する重み決定部と、前記仮評価値と前記重み情報との乗算を実行する乗算部を有し、前記重み決定部は、前記相関演算部から入力するフレーム差分絶対値|ΔF|と、前記可変閾値生成部から入力する閾値THと、画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って、複数の重み情報W,Wに基づく重み情報Wを算出する処理を実行し、
=TH−|ΔF|+1
=DR
=αW+βW
α,β:係数
前記乗算部は、前記相関判定部の算出した仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として、前記評価値テーブル算出部に出力する処理を実行する構成であることを特徴とする。
さらに、本発明の動きベクトル検出装置の一実施態様において、前記相関判定部は、前記相関演算部の算出した相関情報と、前記可変閾値生成部の生成した閾値との比較処理を実行し、該比較処理結果に基づく1ビットの仮評価値を算出し、前記評価値調整部は、画像特性に基づく重み情報を算出し、前記相関判定部の算出した1ビット仮評価値と前記重み情報に基づく演算を実行して複数ビットの最終評価値を算出する構成であることを特徴とする。
さらに、本発明の動きベクトル検出装置の一実施態様において、前記動きベクトル検出装置は、さらに、前記評価値テーブルに基づいて1以上の候補ベクトルを抽出する候補ベクトル抽出部を有し、前記動きベクトル検出部は、動画像データのフレーム構成画素各々に対応する動きベクトルを、前記候補ベクトルから選択して対応付ける処理を実行する構成であることを特徴とする。
さらに、本発明の動きベクトル検出装置の一実施態様において、前記可変閾値生成部は、注目画素を含む近傍領域画素のダイナミックレンジを算出し、該ダイナミックレンジを特徴量として、該特徴量に基づく可変閾値を設定する構成であることを特徴とする。
さらに、本発明の動きベクトル検出装置の一実施態様において、前記可変閾値生成部は、前記相関演算部の算出するフレーム間差分情報を入力し、該フレーム間差分情報に基づいて、前記注目画素を含む近傍領域画素のダイナミックレンジを算出する構成であることを特徴とする。
さらに、本発明の動きベクトル検出装置の一実施態様において、前記可変閾値生成部は、前記相関演算部の算出するフレーム間差分情報を入力し、該フレーム間差分情報に基づいて、前記注目画素を含む近傍領域画素のダイナミックレンジを算出するとともに、該ダイナミックレンジ構成ビットのビット情報圧縮処理により閾値を算出する構成であることを特徴とする。
さらに、本発明の第2の側面は、
動画像データから動きベクトルを検出する動きベクトル検出方法であり、
時間軸上における異なるフレーム間の画素値相関情報に基づいて評価値テーブルを生成する評価値テーブル形成ステップと、
前記評価値テーブルに基づいて動画像データのフレーム構成画素に対する動きベクトルを検出して対応付ける動きベクトル検出ステップとを有し、
前記評価値テーブル形成ステップは、
時間軸上における異なるフレーム間の相関情報の算出処理を実行する相関演算ステップと、
注目画素を含む近傍領域画素の特徴量に基づく可変閾値を生成する可変閾値生成ステップと、
前記相関演算ステップにおいて算出した相関情報と、前記可変閾値生成ステップにおいて生成した閾値との比較処理を実行し、該比較処理結果に基づく仮評価値を算出する相関判定ステップと、
画像特性に基づく重み情報を算出し、前記相関判定ステップにおいて算出した仮評価値および前記重み情報に基づく演算を実行して最終評価値を算出する評価値調整ステップと、
前記評価値調整ステップにおいて算出する最終評価値を積算し、評価値テーブルを生成する評価値テーブル算出ステップと、
を有することを特徴とする動きベクトル検出方法にある。
さらに、本発明の動きベクトル検出方法の一実施態様において、前記評価値調整ステップは、画像特性に基づく重み情報を算出する重み決定ステップと、前記仮評価値と前記重み情報との乗算を実行する乗算ステップを有し、前記乗算ステップにおける乗算結果を最終評価値として設定する処理を実行することを特徴とする。
さらに、本発明の動きベクトル検出方法の一実施態様において、前記評価値調整ステップは、画像特性に基づく重み情報を算出する重み決定ステップと、前記仮評価値と前記重み情報との乗算を実行する乗算ステップを有し、前記重み決定ステップは、前記相関演算ステップにおいて算出されるフレーム差分絶対値|ΔF|と、前記可変閾値生成ステップにおいて算出される閾値THを適用して、下記式に従って重み情報Wを算出する処理を実行し、
=TH−|ΔF|+1
前記乗算ステップは、前記相関判定ステップにおいて算出した仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として算出する処理を実行することを特徴とする。
さらに、本発明の動きベクトル検出方法の一実施態様において、前記評価値調整ステップは、画像特性に基づく重み情報を算出する重み決定ステップと、前記仮評価値と前記重み情報との乗算を実行する乗算ステップを有し、前記重み決定ステップは、前記可変閾値生成ステップにおいて算出される画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って重み情報Wを算出する処理を実行し、
=DR
前記乗算ステップは、前記相関判定ステップにおいて算出される仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として算出する処理を実行することを特徴とする。
さらに、本発明の動きベクトル検出方法の一実施態様において、前記評価値調整ステップは、画像特性に基づく重み情報を算出する重み決定ステップと、前記仮評価値と前記重み情報との乗算を実行する乗算ステップを有し、前記重み決定ステップは、前記可変閾値生成ステップにおいて算出される画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って重み情報W'を算出する処理を実行し、
'=DR/n
ただし、nは2以上の自然数
前記乗算ステップは、前記相関判定ステップにおいて算出される仮評価値と前記重み情報W'との乗算を実行し、乗算結果を最終評価値として算出する処理を実行することを特徴とする。
さらに、本発明の動きベクトル検出方法の一実施態様において、前記評価値調整ステップは、画像特性に基づく重み情報を算出する重み決定ステップと、前記仮評価値と前記重み情報との乗算を実行する乗算ステップを有し、前記重み決定ステップは、前記相関演算ステップにおいて算出されるフレーム差分絶対値|ΔF|と、前記可変閾値生成ステップにおいて算出される閾値THと、画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って、複数の重み情報W,Wに基づく重み情報Wを算出する処理を実行し、
=TH−|ΔF|+1
=DR
=αW+βW
α,β:係数
前記乗算ステップは、前記相関判定ステップにおいて算出される仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として算出する処理を実行することを特徴とする。
さらに、本発明の動きベクトル検出方法の一実施態様において、前記相関判定ステップは、前記相関演算ステップにおいて算出される相関情報と、前記可変閾値生成ステップにおいて算出される閾値との比較処理を実行し、該比較処理結果に基づく1ビットの仮評価値を算出し、前記評価値調整ステップは、画像特性に基づく重み情報を算出し、前記相関判定ステップにおいて算出される1ビット仮評価値と前記重み情報に基づく演算を実行して複数ビットの最終評価値を算出することを特徴とする。
さらに、本発明の動きベクトル検出方法の一実施態様において、前記動きベクトル検出方法は、さらに、前記評価値テーブルに基づいて1以上の候補ベクトルを抽出する候補ベクトル抽出ステップを有し、前記動きベクトル検出ステップは、動画像データのフレーム構成画素各々に対応する動きベクトルを、前記候補ベクトルから選択して対応付ける処理を実行することを特徴とする。
さらに、本発明の動きベクトル検出方法の一実施態様において、前記可変閾値生成ステップは、注目画素を含む近傍領域画素のダイナミックレンジを算出し、該ダイナミックレンジを特徴量として、該特徴量に基づく可変閾値を設定するステップであることを特徴とする。
さらに、本発明の動きベクトル検出方法の一実施態様において、前記可変閾値生成ステップは、前記相関演算ステップにおいて算出するフレーム間差分情報を入力し、該フレーム間差分情報に基づいて、前記注目画素を含む近傍領域画素のダイナミックレンジを算出することを特徴とする。
さらに、本発明の動きベクトル検出方法の一実施態様において、前記可変閾値生成ステップは、前記相関演算ステップにおいて算出するフレーム間差分情報を入力し、該フレーム間差分情報に基づいて、前記注目画素を含む近傍領域画素のダイナミックレンジを算出するとともに、該ダイナミックレンジ構成ビットのビット情報圧縮処理により閾値を算出することを特徴とする。
さらに、本発明の第3の側面は、
動画像データから動きベクトルを検出する動きベクトル検出処理を実行するコンピュータ・プログラムであり、
時間軸上における異なるフレーム間の画素値相関情報に基づいて評価値テーブルを生成する評価値テーブル形成ステップと、
前記評価値テーブルに基づいて動画像データのフレーム構成画素に対する動きベクトルを検出して対応付ける動きベクトル検出ステップとを有し、
前記評価値テーブル形成ステップは、
時間軸上における異なるフレーム間の相関情報の算出処理を実行する相関演算ステップと、
注目画素を含む近傍領域画素の特徴量に基づく可変閾値を生成する可変閾値生成ステップと、
前記相関演算ステップにおいて算出した相関情報と、前記可変閾値生成ステップにおいて生成した閾値との比較処理を実行し、該比較処理結果に基づく仮評価値を算出する相関判定ステップと、
画像特性に基づく重み情報を算出し、前記相関判定ステップにおいて算出した仮評価値および前記重み情報に基づく演算を実行して最終評価値を算出する評価値調整ステップと、
前記評価値調整ステップにおいて算出する最終評価値を積算し、評価値テーブルを生成する評価値テーブル算出ステップと、
を有することを特徴とするコンピュータ・プログラムにある。
なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能なコンピュータ・システムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやFD、MOなどの記録媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータ・システム上でプログラムに応じた処理が実現される。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
本発明の構成によれば、動画像データからの動きベクトル検出処理において生成する評価値テーブルの生成情報としての評価値を、画像特性に応じた重み情報を加味した評価値として設定することが可能となり、より正確な動きベクトル検出を可能とする評価値テーブルを生成することが可能となる。
本発明の構成によれば、注目画素を含む近傍領域画素の特徴量に基づく可変閾値と、相関情報との比較処理結果に基づいて算出する1ビットの仮評価値に対して、画像特性に基づく重み情報に基づく演算を実行して、画像特性に応じた重み情報を加味した最終評価値を算出し、この最終評価値を評価値テーブルの生成情報としたので、画像特性に応じた評価値テーブルを生成することが可能となり、正確な動きベクトル検出が可能となる。
本発明の構成によれば、相関演算部から入力するフレーム差分絶対値、可変閾値生成部から入力する閾値TH、または可変閾値生成部から入力する画像特徴量としてのダイナミックレンジ(DR)を適用して重み情報Wを算出し、相関判定部の算出した仮評価値と重み情報Wとの乗算により最終評価値を算出し、この最終評価値を評価値テーブルの生成情報としたので、画像特性に応じた評価値テーブルを生成することが可能となり、正確な動きベクトル検出が可能となる。
以下、図面を参照しながら本発明の動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラムの詳細について説明する。なお、説明は、以下の項目順に行なう。
1.代表点マッチングによる評価値テーブルの生成、候補ベクトル方式の概要
2.動きベクトル検出装置全体構成および動きベクトル検出処理手順
3.画像特性に基づく重みを設定した評価値テーブル形成処理の詳細
[1.代表点マッチングによる評価値テーブルの生成、候補ベクトル方式の概要]
以下、説明する動きベクトル検出処理においては、代表点マッチング法を適用する。代表点マッチング法については、本特許出願人が先に出願し、特許取得済みである特許2083999号公報に開示されている。すなわち、以下、説明する動きベクトル検出処理は、前述の背景技術の欄で説明した候補ベクトル方式(特開2001−61152号公報に開示)を適用するとともに、代表点マッチング法を利用した処理例である。
なお、以下の説明においては、動画像データを構成する1フレームを1画面として、各画面(フレーム)間の相互検証処理によってフレームにおける動きベクトル検出処理を行う例について説明するが、本発明は、このような処理例に限らず、例えば、1フレームを細分化とした1フィールドを1画面として扱い、1フィールド単位の動きベクトル検出処理を行なう場合などにも適用可能である。
また、以下に説明する処理例は、主にテレビジョン信号に基づく動画像データに対する処理例として説明するが、本発明は、テレビジョン信号以外の様々な動画像データに対しても適用可能である。また、映像信号を処理対象とする場合においてもインターレース信号およびノンインターレース信号の何れでもよい。
図2〜図4を参照して、本発明における動きベクトル検出処理において適用する代表点マッチング法による評価値テーブルの作成処理、評価値テーブルに基づく候補ベクトルの抽出処理、抽出した候補ベクトルに基づく各画素に対応する動きベクトル設定処理の概要について説明する。
動画像を構成する時間的に連続するフレーム画像、例えば図に示す時間(t)の現フレーム[F]80と、時間(t−1)の前フレーム[Ft−1]70を抽出する。
例えば、現フレーム[F]80を参照フレームとし、前フレーム[Ft−1]70を、m画素×nラインの複数のブロックに分割し、各ブロックを代表する代表点Ryを設定する。各ブロックの代表点は、例えば、
a.ブロックの中心位置の画素値、
b.ブロック内のすべての画素の画素値の平均値、
c.ブロック内のすべての画素の画素値の中間値、
等の、ブロックを代表する画素値が対応付けられる。
代表点マッチング法では、前フレーム[Ft−1]70に設定したブロックの代表点Ry71に対応させて、現フレーム[F]80に所定のサーチエリア81を設定し、設定したサーチエリア81内に含まれる各画素の画素値と代表点Ry71の画素値との比較を行なう。サーチエリア81は例えば、p画素×qラインの画素領域として設定される。
すなわち、上記a〜cのいずれかの代表点画素値と、サーチエリア81内の各画素の画素値を比較検証して、評価値(例えば、フレーム差や判定結果)を算出する。評価値は、サーチエリア81の各偏移毎(各画素位置毎)に算出される。前フレーム[Ft−1]70に設定したブロックの代表点各々に対応して、現フレーム[F]80にサーチエリアが設定され、代表点画素値と、対応するサーチエリア内の各画素の画素値を比較に基づく評価値を取得し、1画面内の全ての代表点について積算する。従って、サーチエリアと同一の大きさの評価値テーブルが形成される。
なお、各代表点に対応するサーチエリアは、図3(a)に示すように隣接するサーチエリアと一部が重なり合うように設定しても良い。図3(a)に示す例では、サーチエリアをp×q(画素またはライン)の領域に設定した例であり、例えば、前フレーム[Ft−1]70に設定したブロックの代表点71aに対応するサーチエリア81aと、前フレーム[Ft−1]70に設定したブロックの代表点71bに対応するサーチエリア81bとが重なりを持つ領域として設定される。
このように、サーチエリアは、各代表点に対応付けられて設定され、各代表点と、その代表点に対応して設定されたサーチエリア内の画素との比較が実行されて、比較値に基づいて、例えば相関の度合いが高いほど(画素値の一致度合いが高いほど)高い評価値が設定され、各サーチエリアの構成画素に対応する評価値が設定される。
各サーチエリアにおける評価値は、図3(B)に示すように積算され、その結果として、図3(C)に示すような評価値テーブル90が生成される。評価値テーブルは、前フレーム[Ft−1]70に設定した例えばn個のブロックに設定された各ブロックの代表点Ry1〜nと、参照フレームである現フレーム[F]80に設定した各代表点Ry1〜nに対応するサーチエリア内の各画素との比較に基づく評価値、例えば差分絶対値の積算値として算出され、サーチエリアと同一の大きさの評価値テーブルとして形成される。
なお、従来技術においては、画素値(例えば0〜255の8ビット)の差分値としての8ビットデータを積算していたが、本発明においては、後述するように、差分データに基づく例えば1ビットの仮評価値を算出し、さらに、画像の特性に応じた重み情報Wを算出し、1ビットの仮評価値に対して重み情報Wを乗算した結果を最終的な出力評価値として設定し、この最終評価値の積算を行なって評価値テーブルを生成する構成を持つ。この処理の詳細については、後述する。
評価値テーブル90においては、サーチエリアの各偏移位置(i,j)における画素値と代表点との相関が高い場合に、ピーク(極値)が発生する。評価値テーブルに出現するピークは、動画像データの画面の表示物体の移動に対応する。
例えば、画面(フレーム)全体が同一の動きをした場合は、サーチエリア(p×q)と同一の大きさの評価値テーブルにおいて、その動き方向、距離を持つベクトルの終点に対応する位置に1つのピークが出現する。また、画面(フレーム)内に2つの異なる動きをした物体があった場合は、サーチエリア(p×q)と同一の大きさの評価値テーブルにおいて、その異なる動き方向、距離を持つ2つのベクトルの終点に対応する2つの位置に2つのピークが出現する。なお、静止部分がある場合は、静止部分に対応するピークも出現する。
このような評価値テーブルに出現するピークに基づいて、前フレーム[Ft−1]70と、参照フレームである現フレーム[F]80とにおける動きベクトルの候補(候補ベクトル)を求める。
評価値テーブルに出現したピークに基づいて、複数の候補ベクトルを抽出した後、フレームの各画素について、抽出した候補ベクトルから最も適応する候補ベクトルをそれぞれ選択して、各画素に対応する動きベクトルとして設定する。
抽出候補ベクトルに基づいて実行する各画素に対応する動きベクトルの設定処理について図4を参照して説明する。
図4において、中央の画素91が前フレーム[Ft−1]の1つの画素を示している。この画素は例えば輝度値(α)を有している。また、前述の評価値テーブルに出現したピークに基づいて、複数の候補ベクトルが抽出済みであり、これらの候補ベクトルを図に示す候補ベクトルA,B,Cであるとする。前フレーム[Ft−1]の1つの画素91は、これらの候補ベクトルのいずれかに従って移動して、現フレーム[F]の画素に対応する位置に表示されると判定される。
図4において、画素a95、画素b96、画素c97は、前フレーム[Ft−1]の1つの画素91から候補ベクトルA,B,Cに基づいて移動先として推定される各画素位置の現フレーム[F]の画素を示している。これらの3画素を含むブロックの画素値と、画素91を含むブロックの画素値との相関がブロックマッチング処理によって判定され、最も高い対応にある組が選択され、その選択した組に設定された候補ベクトルを画素91の動きベクトルとする。
1つの画面(フレーム)に含まれるすべての画素について、同様の処理、すなわち候補ベクトルから最適なベクトルの選択処理を行い、各画素に対応する動きベクトルを設定する。
上述したように、代表点マッチングは、各ブロックを代表する代表点を設定し、設定した代表点のみについての評価値算出を行なって候補ベクトルを設定することが可能であり、限られた数の代表点のみの評価値算出を行なうことで、評価値算出に要する演算量を減少させることができ、高速処理が可能となる。
以下、説明する本発明の動きベクトル検出装置および動きベクトル検出方法の実施例においては、上述の代表点マッチングを適用した候補ベクトル抽出処理を伴う動きベクトル検出構成を説明する。
[2.動きベクトル検出装置全体構成および動きベクトル検出処理手順]
動きベクトル検出処理を実行する本発明の動きベクトル検出装置の一実施例構成を図5に示し、動きベクトル検出処理の処理シーケンスを図6のフローチャートに示す。
動きベクトル検出装置は、図5に示すように、評価値テーブル形成部101、候補ベクトル抽出部102、動きベクトル検出部103、制御部(コントローラ)104を有する。評価値テーブル形成部101は、動きベクトル検出処理対象となる画像データを入力端子を介して入力し、評価値テーブルを生成する。入力画像は、例えば、ラスタスキャンにより得られる画像データである。画像データは、例えば、ディジタルカラー映像信号のコンポーネント信号中の輝度信号を含む。
入力画像データは、評価値テーブル形成部101に供給され、前述した代表点マッチング法をベースとして、サーチエリアと同一の大きさの評価値テーブルを形成する。図6のフローにおけるステップS101の処理である。
候補ベクトル抽出部102は、評価値テーブル形成部101において生成した評価値テーブルから、1画面内の候補ベクトルとして、複数の動きベクトルを抽出する。すなわち、前述したように、評価値テーブルに出現したピークに基づいて、複数の候補ベクトルを抽出する。図6のフローにおけるステップS102の処理である。
動きベクトル決定部103では、候補ベクトル抽出部102において抽出した複数の候補ベクトルを対象として、全フレームの各画素毎に、候補ベクトルによって対応付けられるフレーム間の画素間の相関をブロックマッチング等により判定し、最も相関の高い対応となったブロックを結ぶ候補ベクトルを、その画素に対応する動きベクトルとして設定する。図6のフローにおけるステップS103の処理である。この処理は、先に図4を参照して説明した処理である。
動きベクトル決定部103では、1つの画面(フレーム)に含まれるすべての画素について、候補ベクトルから最適なベクトルの選択処理を行い、各画素に対応する動きベクトルを決定し、決定した動きベクトルを出力する。
制御部104は、評価値テーブル形成部101、候補ベクトル抽出部102、動きベクトル検出部103における処理タイミングの制御、中間データのメモリに対する格納、出力処理制御などを行なう。
以上が、本発明の動きベクトル検出装置において実行する代表点マッチングをベースとした評価値テーブルの生成と、候補ベクトル方式を適用した動きベクトル検出処理の流である。
[3.画像特性に基づく重みを設定した評価値テーブル形成処理の詳細]
次に、本発明の動きベクトル検出装置における評価値テーブル形成部の詳細について説明する。評価値テーブル形成部の詳細構成を図7に示す。
図7に示すように、本発明の動きベクトル検出装置における評価値テーブル形成部200は、相関演算部210、可変閾値生成部220、相関判定部230、評価値調整部240、評価値テーブル算出部250を有する。
相関演算部210は、代表点メモリ211、画素値の差分データを算出する減算回路212、絶対値算出部213を有する。可変閾値生成部220は、特徴量抽出部221、特徴量メモリ222、閾値生成部223を有する。相関判定部230は、相関演算部210からの出力値であるフレーム差絶対値データと、可変閾値生成部220からの出力である閾値データとの比較処理を行なう比較部230を有し、各代表点と各画素の1つの評価値として、例えば1ビットデータの仮評価値を算出し、評価値調整部240の乗算部242に出力する。
評価値調整部240は、重み決定部241と乗算部242を有する。重み決定部241は、相関演算部210からの出力データであるフレーム差絶対値と、可変閾値生成部220の出力データである可変閾値を入力して重み情報Wを生成し、乗算部242に出力する。あるいは、可変閾値生成部220の生成データである特徴量データ(ダイナミックレンジデータ)を入力して重み情報Wを生成し、乗算部242に出力する。これらの処理の詳細については、後述する。
乗算部242は、相関判定部230からの出力である1ビットデータの仮評価値と、重み決定部241からの出力である重み情報WまたはWを入力して、1ビットの仮評価値と重み情報WまたはWの乗算処理を実行し、最終的に出力する複数ビットの最終評価値を生成して、評価値テーブル算出部250に出力する。評価値テーブル算出部250は、例えば乗算部242から入力する最終評価値を評価値積算部251において積算し、評価値テーブルを生成して評価値テーブルメモリ252に格納する。
まず、相関演算部210の処理について説明する。入力端子を介して画像データが、例えばフレーム単位で、相関演算部210に入力される。相関演算部210に入力された画像データは、減算回路212及び代表点メモリ211に供給される。
代表点メモリ211に記憶される画像データは、例えばフレーム単位で入力される画像データから生成される予め決められた代表点データである。例えば、先に図2、図3を参照して説明した画面を分割して設定されたブロック、例えばm×n画素のブロックにおいて代表点が1つ設定される。なお、代表点は、
a.ブロックの中心位置の画素値、
b.ブロック内のすべての画素の画素値の平均値、
c.ブロック内のすべての画素の画素値の中間値、
等の、ブロックを代表する画素値データが対応付けられる。
具体的には、例えば、入力フレーム画像から、空間的に均等に間引かれた画素位置の画像データ(画素値データ)が、制御部(コントローラ)104(図5参照)からの信号によるタイミング制御によって選択されて、代表点データとして代表点メモリ211に記憶される。
代表点メモリ211から読み出された前フレームの代表点データと、現フレームの画像データが、減算回路212に供給される。
減算回路211は、前フレームの代表点の画素値と、現フレームの画像データに設定される各代表点に対応するサーチエリア内の画素との画素値差分、例えばフレーム差(相関演算結果)を算出し、絶対値算出部213に出力する。
絶対値算出部213では、減算回路211から入力する前フレームの代表点データと、現フレームの画像データに基づくフレーム差(相関演算結果)を入力し、フレーム差絶対値を算出する。なお、画素値は、例えば輝度値として0〜255からなる256階調の輝度レベルを有しており、この256階調を示す画素値データとして8ビットが適用されている。従って、相関演算部210では、8ビットの代表点画素値データとサーチエリアにおける各画素の画素値8ビットの減算によって8ビットのフレーム差、およびフレーム差絶対値が算出される。
相関演算部210からの出力として得られる8ビットのフレーム差絶対値は、相関判定部230に入力され、相関判定部230で例えば1ビットデータに縮退し、この1ビットデータを仮評価値とする。
この1ビットの仮評価値は、例えば、
ビット値[1]は、代表点の画素値と、サーチエリアの比較対照となる画素値との相関あり
ビット値[0]は、代表点の画素値と、サーチエリアの比較対照となる画素値との相関なし
のいずれかを示すことになる。
この出力に基づいて、ビット値[1]の数を積算し、相関ありの結果が多いか否かを示す度数分布型の評価値テーブルを生成することも可能であるが、本発明の構成においては、さらに、仮評価値を評価値調整部240に入力し、評価値調整部240の乗算部242において、重み決定部241からの出力である重み情報WまたはWとの乗算処理を実行し、最終的な出力評価値を生成して、評価値テーブル算出部250に出力する。
評価値テーブル算出部250においては、最終的な出力評価値、すなわち、評価値調整部240の乗算部242から入力する最終評価値を積算して、評価値テーブルを生成する。評価値テーブルは、サーチエリア内の各偏移(i,j)において、代表点と参照点に相関がある場合に乗算部242から出力される重み付けされた最終評価値が加算され、1画面の全ての代表点の相関判定結果が積算されたものとなる。つまり、評価値テーブルの各偏移(i,j)において、相関が高いほど積算値が高くなり、形成された評価値テーブルには、動画像データの画面の表示物体の移動に対応したピーク(極値)が出現する。
従って、生成した評価値テーブルには、動画像データの画面の表示物体の移動に対応したピーク(極値)が出現し、候補ベクトルの選定が可能となる。
図7に示す本発明の評価値テーブル算出部250における相関判定部230では、可変閾値を可変閾値生成部220から入力して、相関演算部210から入力する差分データとしてのフレーム差絶対値との比較処理を行なう。
固定閾値を用いず、可変閾値を適用する理由は、実際の動きの程度に対応した、より正確な動き検出を行うことを可能とするためである。
空間内に於けるレベル変動の大きい画像、つまり、ある注目画素の近傍で大きなレベル変化(画素値変動)のある画像、例えば、縦方向の複数本のストライプ状のパターン画像など、エッジ部分の多い画像の場合には、次のフレームで画像に僅かの動きがあってもフレーム差が非常に大きくなる。従って、相関演算部210から出力されるフレーム差分は大きな値になる。一方、空間内に於けるレベル変動の小さい画像、例えば人の顔の頬の部分、あるいは緑一色の草原や、空に雲が浮かんでいるような全体的に平坦な輝度分布を持つ画像の場合には、次のフレームで画像に動きがあってもフレーム差が小さくなる。従って、相関演算部210から出力されるフレーム差分は小さな値となる。
固定閾値を用いて、相関演算部210から出力されるフレーム差分データを一律に「相関有り」、または「相関無し」のいずれかに区別してしまうと、全体的に平坦な輝度分布を持つ画像の場合には、動きがあった場合にも相関なしと判定され、動きのない画像データであると判定されてしまう恐れがある。
そこで、注目画素の時間方向変動を空間内変動で正規化し、この正規化出力に基づいて動きの有無を判断する。この処理のために、可変閾値生成部220において、注目画素の時間方向変動を空間内変動で正規化したデータを用いて可変閾値を生成して、可変閾値を適用して、相関演算部210から出力されるフレーム差分データとの比較を行う。
すなわち、画像データに応じた異なる閾値を適用して、相関判定部230の比較部231において相関演算部210から入力する差分データとしてのフレーム差絶対値との比較処理を行なって相関あり[1]、相関なし[0]の仮評価値を生成する。
可変閾値に基づく相関判定を行なうことで、時間方向変動のみに基づいてなされる動きの有無の判断(固定閾値を適用した判定に対応する)と比較して、実際の動きの程度に対応した、より正確な動き検出を行うことができる。
つまり、可変閾値を用いた相関の判定を行なうことで、時間方向変動が大きい場合であっても、フレーム内に於けるレベル変動、即ち、空間内変動が比較的大きい場合には動き検出感度が低下する。また、時間方向変動が小さい場合であっても、フレーム内に於けるレベル変動、即ち、空間内変動が比較的小さい場合には、動き検出感度が向上し、画像データに応じた正確な動き判定、すなわち、相関判定処理が可能となる。
可変閾値生成部220の処理について説明する。可変閾値生成部220は、空間内変動を表す特徴量を抽出し、特徴量に対応して異なる閾値を設定する。空間内変動を表す特徴量の抽出は、特徴量抽出部221において実行する。
特徴量抽出部221は、相関演算部210の減算回路212の出力値、すなわち、フレム差分データを入力し、空間内変動を表す特徴量として、代表点の近傍領域(3×3)のダイナミックレンジ(DR)を算出する。
なお、ここでは、空間内変動を表す特徴量として、代表点の近傍領域(3×3)のダイナミックレンジ(DR)を適用する例を説明するが、空間内変動を表す特徴量としては、例えば、代表点の両隣3画素のダイナミックレンジや、差分和、近傍領域の平均偏差和等を用いることが可能である。
代表点近傍領域(3×3)のダイナミックレンジ(DR)は、代表点マッチングの相関演算結果を利用することで算出可能である。代表点マッチングの相関演算結果を利用した代表点近傍領域(3×3)のダイナミックレンジ(DR)算出処理について、図8を参照して説明する。
図8(A)には、現フレーム[F]、現フレーム[F]の1つ前の前フレーム[Ft−1]、現フレーム[F]の2つ前のフレーム[Ft−2]の3つの連続フレームを示している。
現フレーム[F]の1つ前の前フレーム[Ft−1]のある代表点Ryの近傍領域(3×3)は、例えば、代表点Ryの画素を中心画素(i,j)とすると、図8(B)に示す9点の画素(i−1,j−1)〜(i+1,j+1)によって構成される。代表点Ry近傍領域(3×3)のダイナミックレンジ(DR)は、これらの9画素(i−1,j−1)〜(i+1,j+1)の各画素値の最大値と最小値の差で表される値である。
可変閾値生成部220の特徴量抽出部221は、この前フレーム[Ft−1]のある代表点Ryの近傍領域(3×3)のダイナミックレンジを、2フレーム前[Ft−2]の代表点Pyにおける相関演算のフレーム差に基づいて算出する。この処理を実行する特徴量抽出部221の構成例を図9に示す。
特徴量抽出部221には、連続するフレームの代表点とサーチエリアにおける画素値の差分データがフレーム差として入力される。図8に示す2フレーム前[Ft−2]の代表点Pyと、前フレーム[Ft−1]のある代表点Ryの近傍領域(3×3)の差分データがそれぞれ入力されたと仮定する。
差分データは、代表点Pyと、9画素(i−1,j−1)〜(i+1,j+1)各々の差分データは、順次入力され、最大値検出部301、最小値検出部303において、代表点Pyと、9画素(i−1,j−1)〜(i+1,j+1)各々の差分データの最大値と最小値が求められる。まず最初の入力差分データは、最大値検出部301、最小値検出部303を通過して、レジスタ302,304に格納され、次に入力する差分データと、最大値検出部301、最小値検出部303において比較され、それぞれ最大差分値がレジスタ302に格納され、最小差分値がレジスタ304に格納される。これを繰り返し実行することで、代表点Pyと、9画素(i−1,j−1)〜(i+1,j+1)各々の差分データの最大値と最小値が求められる。
この結果求められた代表点Pyと、9画素(i−1,j−1)〜(i+1,j+1)各々の差分データの最大値と最小値は、減算回路305において減算され、この結果が代表点Ryの近傍領域(3×3)、すなわち、9画素(i−1,j−1)〜(i+1,j+1)のダイナミックレンジ(DR)としてラッチ306を介して出力される。
前述したように、代表点Ryの近傍領域(3×3)のダイナミックレンジとは、図8(B)に示す9点の画素の画素値の最大値と最小値の差で表される値である。2フレーム前[Ft−2]の代表点Pyと、この9点とのフレーム差は、9点のDC成分が変化しただけなので、この9点のフレーム差の最大値と最小値の差も、上記のダイナミックレンジと同値となる。
具体的な画素値を設定した例で説明する。前フレーム[Ft−1]の9点の画素値が、10、11、7、9、9、12、15、11、8の各画素値(輝度レベル)を有するとする。2フレーム前の[Ft−2]の代表点Ryの画素値が、[11]であったとする。この場合、代表点Ryと、前フレーム[Ft−1]の9点の画素値のフレーム差は、其々、
10−11=−1
11−11=0
7−11=−4
9−11=−2
9−11=−2
12−11=+1
15−11=+4
11−11=0
8−11=−3
となり、これら9個の差分データに基づいて、図9に示す特徴量抽出部221において求められる値(DR)は、上記9式の結果の最大値[+4]から最小値[−4]を減算した値であり、[8]となる。一方、前フレーム[Ft−1]の9点の画素値{10、11、7、9、9、12、15、11、8}から直接求めたダイナミックレンジは、15(MAX)−7(MIN)=8であり、いずれの値も[8]となって、いずれも同値となる。
このように、2フレーム前[Ft−2]と前フレーム[Ft−1]とを対象として相関演算部210において実行する代表点マッチング処理における相関結果、すなわち、フレーム差分データを用いて、前フレーム[Ft−1]の代表点近傍のダイナミックレンジを算出可能であり、このダイナミックレンジ(DR)を空間内変動の特徴量として適用する。
可変閾値生成部221において実行する可変閾値生成処理手順について、図10に示すフローを参照して説明する。
まず、ステップS151では、相関演算部210において実行する代表点マッチング処理により算出されるフレーム差分データを取り込む。ステップS152では、特徴量抽出部221が、上述した処理に従ってフレーム差分データに基づいて代表点近傍のダイナミックレンジ(DR)を算出する。
ステップS153において、算出したダイナミックレンジ(DR)を、代表点に対応させて特徴量メモリ222に記憶する。ステップS154において、特徴量メモリ222から、代表点に対応するダイナミックレンジ(DR)データを読み出す。ステップS155において、読み出したダイナミックレンジ(DR)を閾値生成部223で閾値に変換し、ステップS156において、変換した可変閾値を、相関判定部230に出力する。
このように、図7(A)における可変閾値生成部220の特徴量抽出部221では、上述した処理によって、相関演算部210から入力するフレーム差分データに基づいて、特徴点近傍のダイナミックレンジを算出し、これを空間内変動を表す特徴量として特徴量メモリ222に格納し、閾値生成部223は、この特徴量を閾値として設定し、相関判定部230に出力する。
閾値生成部223における閾値生成処理、すなわち、空間内変動の特徴量としての代表点近傍のダイナミックレンジデータに基づく閾値生成処理について、図11を参照して説明する。
閾値生成部223には、特徴量抽出部221において、フレーム差分データに基づいて算出されたダイナミックレンジ(DR)データが入力される。このデータは、8ビット画素値の差分データであり8ビットデータである。
閾値生成部223のビット分解部351では、入力された8ビットのダイナミックレンジ(DR)をMSBから1ビット単位で分解し、上位6ビットのみを抽出する。上位ビットから、それぞれ、D7、D6、D5、D4、D3、D2とする。
OR回路352には、MSBから3ビットD7、D6、D5が入力され、OR演算が実行され、1ビットの出力がなされる。3ビットD7、D6、D5のいずれかにビット値[1]が含まれれば[1]が出力される。
さらに、OR回路352の出力と、ビット分解部351の出力D4が、OR回路353に入力され、OR演算の結果が出力値とされる。さらに、OR回路353の出力と、ビット分解部351の出力D3が、OR回路354に入力され、OR演算の結果が出力値とされる。さらに、OR回路354の出力と、ビット分解部351の出力D2が、OR回路355に入力され、OR演算の結果が出力値とされる。
OR回路353の出力と、OR回路354の出力と、OR回路355の出力の計3ビットd2,d1,d0が、ビット合成部356に入力され、ビット合成部356では、上位から、d2、d1、d0の3ビットデータ[000]〜[111]を10進数に変換し、値0〜7を、閾値として出力する。このように、閾値生成部223は、注目画素近傍の空間内変動の特徴量としての代表点近傍のダイナミックレンジデータの構成ビットのビット情報圧縮処理により閾値を算出する。
図12は、この閾値生成部223の入出力関係をプロットしたグラフであり、閾値の上限リミッターを設けた可変閾値が生成される。図12は、横軸が、可変閾値生成部に入力されるフレーム差分に基づいて算出されるダイナミックレンジ(DR)であり、縦軸がダイナミックレンジ(DR)に基づいて算出し、相関判定部230に出力する可変閾値を示す。
例えば、ダイナミックレンジ(DR)が0〜3では、相関判定部230に出力する可変閾値は0となる。ダイナミックレンジ(DR)が4〜7では、相関判定部230に出力する可変閾値は1となる。以下、同様であり、ダイナミックレンジ(DR)が28以上においては、相関判定部230に出力する可変閾値は7となり、閾値の上限リミッターを設けた可変閾値が生成される。
ダイナミックレンジ(DR)が小さい、すなわち平坦な画像であっても、閾値は比較的小さく設定されるので、相関判定部230における相関判定では、相関ありなしの判定が比較的正確に行なわれることになる。
相関判定部230は、相関演算部210からの出力値であるフレーム差絶対値データを入力し、さらに、可変閾値生成部220から、上述の可変閾値を入力して比較部231において比較処理を実行する。フレーム差絶対値データが、可変閾値より小であれば、1ビットデータとして、相関あり[1]を仮評価値として乗算部242に出力し、可変閾値より大であれば、相関なし[0]を仮評価値として乗算部242に出力する。
この相関判定部230の出力する仮評価値は、相関あり[1]、相関なし[0]の1ビットデータである。
相関判定部230に対して相関演算部210から入力するフレーム差絶対値を|ΔF|とし、可変閾値生成部220から入力する閾値をTHとしたとき、以下の式(式1)に示す条件が成立する場合は、相関判定部230の出力する仮評価値は、相関あり[1]として設定される。
|ΔF|<TH・・・(式1)
例えば、可変閾値生成部220から入力する閾値TH=5の場合、相関判定部230の出力する仮評価値は、図13に示すような結果となる。すなわち、相関演算部210から入力するフレーム差分絶対値が0〜5の場合は、相関判定部230の出力する仮評価値は、相関あり[1]となり、フレーム差分絶対値が6以上の場合は、相関判定部230の出力する仮評価値は、相関なし[0]となる。
しかしながら、相関判定部230の出力する仮評価値が、同じ相関あり[1]となった場合であっても、実際には、相関演算部210から入力するフレーム差分絶対値が0である場合の方が、相関演算部210から入力するフレーム差分絶対値が5である場合よりも、相関度が高い。
本発明においては、このような画像の属性に応じた重み情報を重み決定部241において算出し、算出した重み情報によって、相関判定部230の出力する仮評価値を調整し、最終的な出力評価値を算出する。
以下、重み決定部241における処理例として、
(a)相関演算部210から入力するフレーム差分絶対値|ΔF|と、可変閾値生成部220から入力する閾値THを適用して重み情報Wを算出する処理例
(b)可変閾値生成部220から入力する画像特徴量としてのダイナミックレンジ(DR)を適用して重み情報Wを算出する処理例
これらの2通りの処理例について説明する。
(a)相関演算部210から入力するフレーム差分絶対値|ΔF|と、可変閾値生成部220から入力する閾値THを適用して重み情報Wを算出する処理例
まず、相関演算部210から入力するフレーム差分絶対値|ΔF|と、可変閾値生成部220から入力する閾値THを適用して重み情報Wを算出する処理例について説明する。
図14を参照して評価値調整部240の構成および処理について説明する。評価値調整部240内の重み決定部241は、重み情報算出部243を有する。重み情報算出部243は、相関演算部210から入力するフレーム差分絶対値|ΔF|と、可変閾値生成部220から入力する閾値THを適用して、下式(式2)に従って、重み情報Wを算出する。
=TH−|ΔF|+1・・・(式2)
重み決定部241は、上記式(式2)に従って算出した重み情報Wを乗算部242に出力する。乗算部242では、相関判定部230から入力する1ビットの仮評価値に対して、重み情報Wを乗算して最終評価値を算出し、算出した最終評価値を評価値テーブル算出部250に出力する。
可変閾値生成部220から入力する閾値TH=5の場合における、相関判定部230の出力する仮評価値と、重み決定部241において上記式(式2)に従って算出した重み情報Wを適用して乗算部242が算出する最終評価値の対応例を図15に示す。
図15に示すように、可変閾値生成部220から入力する閾値TH=5の場合、相関演算部210から入力するフレーム差分絶対値が0〜5の場合は、相関判定部230の出力する仮評価値は、相関あり[1]となり、フレーム差分絶対値が6以上の場合は、相関判定部230の出力する仮評価値は、相関なし[0]となる。しかし、重み決定部241において上記式(式2)に従って算出した重み情報Wを適用して乗算部242が算出する最終評価値は、
フレーム差絶対値=0→最終評価値=6
フレーム差絶対値=1→最終評価値=5
フレーム差絶対値=2→最終評価値=4
フレーム差絶対値=3→最終評価値=3
フレーム差絶対値=4→最終評価値=2
フレーム差絶対値=5→最終評価値=1
のように、相関演算部210から入力するフレーム差分絶対値の値に応じた最終評価値が得られることになる。この場合、最終評価値は0〜6の値であり、最大3ビット情報となる。従って、フレーム差絶対値をそのまま評価値とする場合に必要となる8ビット情報に比較するとデータ量が削減され、評価値テーブルメモリの容量を小さくすることができる。
乗算部242が出力する画像特性に基づいて決定される重みを考慮した最終評価値は、評価値テーブル形成部200の評価値テーブル算出部250に出力され、評価値テーブル算出部250内の評価値積算部251において積算され、積算結果に基づく評価値テーブルが生成されて、評価値テーブルメモリ252に格納される。
この結果として、画像の特性、すなわち、フレーム差分情報に対応した相関評価値に基づいた評価値テーブルの生成が可能となる。
(b)可変閾値生成部220から入力する画像特徴量としてのダイナミックレンジ(DR)を適用して重み情報Wを算出する処理例
次に、可変閾値生成部220から入力する画像特性情報としての代表点近傍のダイナミックレンジDRを適用して重み情報Wを算出する処理例について説明する。
注目点の近傍領域の高周波成分特徴量(例えば、ダイナミックレンジ)が、大きい方が、動き量ミスが起きた場合、目立つ劣化となってしまうため、ダイナミックレンジが大きい代表点の動きは、出来るだけ評価値テーブルから抽出できるようにしたい。従って、本実施例では、代表点近傍の高周波成分特徴量としてのダイナミックレンジ(DR)を重み情報として設定する。
図16を参照して評価値調整部240の構成および処理について説明する。評価値調整部240内の重み決定部241は、重み情報算出部244を有する。重み情報算出部244は、可変閾値生成部220から入力する画像特性情報としての代表点近傍のダイナミックレンジDRを適用して、下式(式3)に従って、重み情報Wを算出する。
=DR・・・(式3)
重み決定部241は、上記式(式3)に従って算出した重み情報Wを乗算部242に出力する。乗算部242では、相関判定部230から入力する1ビットの仮評価値に対して、重み情報Wを乗算して最終評価値を算出し、算出した最終評価値を評価値テーブル算出部250に出力する。
乗算部242が出力する画像特性に基づいて決定される重みを考慮した最終評価値は、評価値テーブル形成部200の評価値テーブル算出部250に出力され、評価値テーブル算出部250内の評価値積算部251において積算され、積算結果に基づく評価値テーブルが生成されて、評価値テーブルメモリ252に格納される。
この結果として、画像の特性、すなわち、画像特性情報に対応した相関評価値に基づいた評価値テーブルの生成が可能となる。
なお、上記式(式3)に従って算出した重み情報Wは、ダイナミックレンジが例えば8ビットデータである場合は、8ビットの重み情報となるが、積算対象となる評価値の情報量を削減するための処理として、下式(式4)に従って、重み情報W'を算出する校正としてもよい。
'=DR/n・・・(式4)
ただし、nは2以上の自然数
上記式(式4)に従って算出した重み情報W'を乗算部242に出力し、相関判定部230から入力する1ビットの仮評価値に対して、重み情報W'を乗算して最終評価値を算出し、算出した最終評価値を評価値テーブル算出部250に出力する構成としてもよい。この構成とすることにより、最終評価値のビット数が削減され、評価値テーブルメモリ252の容量を削減できる。
なお、ここでは、特徴量として代表点近傍のダイナミックレンジ(DR)を用いた例について説明したが、他に、代表点の両隣3画素のダイナミックレンジや、差分和、近傍領域の平均偏差和等を用いても良い。
なお、評価値調整部240内の重み決定部241における処理例として、
(a)相関演算部210から入力するフレーム差分絶対値|ΔF|と、可変閾値生成部220から入力する閾値THを適用して重み情報Wを算出する処理例
(b)可変閾値生成部220から入力する画像特徴量としてのダイナミックレンジ(DR)を適用して重み情報Wを算出する処理例
これらの2通りの処理例について説明したが、重み決定部241では、これらいずれかの処理を実行するか、あるいは、これらの処理の双方を実行し、双方の結果に基づく重み情報Wを算出し、重み情報Wを乗算部242に出力する構成としてもよい。
例えば下式(式5)に従って、重み情報Wと重み情報Wとから重み情報Wを算出する。
=αW+βW・・・(式5)
α,β:係数
図17に示すフローチャートを参照して、本発明における評価値テーブル形成部の処理シーケンスを説明する。
まず、ステップS201において、入力画像データに基づいて代表点マッチング処理を実行し、フレーム差分データを算出する。次に、ステップS202において、フレーム差分データの絶対値を算出する。これらの処理は、図7の評価値テーブル形成部200の相関演算部210において実行する処理である。
ステップS203では、相関演算部210がステップS201において生成したフレーム差分データに基づいて可変閾値を生成する。この処理は、図7の評価値テーブル形成部200の可変閾値生成部220において実行する処理である。
ステップS204では、相関演算部210がステップS202において生成した差分データの絶対値と、可変閾値生成部220が、ステップS203において生成した可変閾値との比較により、「相関あり」または「相関なし」を示す仮評価値としての1ビットデータを生成する。この処理は、図7の評価値テーブル形成部200の相関判定部230において実行する処理である。
次にステップS205において、評価値調整部240内の重み決定部241において重み情報Wを決定する。この処理は、上述したように、
(a)相関演算部210から入力するフレーム差分絶対値|ΔF|と、可変閾値生成部220から入力する閾値THを適用して重み情報Wを算出する処理、あるいは、
(b)可変閾値生成部220から入力する画像特徴量としてのダイナミックレンジ(DR)を適用して重み情報Wを算出する処理、
のいずれか、または、両処理を実行して双方の重みを考慮した重み情報Wを算出する処理などである。
ステップS206は、評価値調整部240内の乗算部242の処理であり、相関判定部230からの出力(1ビット)に対して重み決定部241から入力する重み情報を乗算し、最終評価値(複数ビット)を算出する。
次に、ステップS207において、乗算部242の生成した画像特性に基づく重み情報を考慮した最終評価値を積算し、評価値テーブルを生成する。この処理は、図7の評価値テーブル形成部200の評価値テーブル算出部250において実行する処理である。
このように、本実施例の評価値テーブル形成部は、画像特性に基づく重み情報を算出し、相関判定部230から出力される相関の有無のみを示す1ビットの仮評価値を、重み情報によって調整した値を最終評価値(複数ビット)として算出し、この最終評価値による積算データに基づく評価値テーブルを生成する構成としたので、評価値テーブルが、画像特性を反映したテーブルとして生成されることになり、より高精度な評価値テーブルを生成することが可能となる。結果として評価値テーブルに出現するピーク(極値)は、処理対象となる動画像データの動きに対応するより急峻度が大きなピーク(極値)となり、誤検出の恐れを低下させ、図5に示す候補ベクトル抽出部102において評価値テーブルに基づいて実行する候補ベクトル抽出処理を効率的に正確な処理として実行することが可能となり、さらにその結果として、動きベクトル検出部103において実行する各画素対応の動きベクトルの設定、すなわち候補ベクトルの対応付けをより正確に実行することが可能となる。
上述した評価値テーブル形成部構成を持つ動きベクトル検出装置を適用し、実際の動画像データに対する処理を実行した場合に生成される評価値テーブルの例を説明する。
具体的な、動画像データとして、図18に示すような、静止背景400の前景に移動物体(A)401と、移動物体(B)402とが存在するデータを適用した。
移動物体(A)401は水平右方向に移動する物体であり、この物体の表示領域の画素に対応する正しい動きベクトルは(Vx,Vy)=(9,0)である。つまり水平右方向の動きベクトルが設定されるべき画素領域である。移動物体(B)402は、水平左方向に移動する物体あり、この物体の表示領域の画素に対応する正しい動きベクトルとしては、(Vx,Vy)=(−9,0)である。つまり、水平左方向の動きベクトルが設定されるべき画素領域である。
この動画像データに対して、本発明を適用した評価値テーブル生成処理、すなわち相関判定部230からの出力である仮評価値(1ビット)に対して、評価値調整部240内の重み決定部241から入力する重み情報を乗算し、最終評価値(複数ビット)を算出して、最終評価値を積算することで生成した評価値テーブルの例を図19(a)に示す。一方、相関判定部230からの出力(1ビット)を、そのまま積算した結果として得られる度数分布型の評価値テーブルの例を図19(b)に示す。なお、図19(a),(b)とも評価値テーブルの2次元データである。
図19(a),(b)とも、移動物体(A)に対応する動きベクトル(9,0)に対応するピーク(極値)411,421と、移動物体(B)に対応する動きベクトル(−9,0)に対応するピーク(極値)412,422と、背景の静止領域に対応する静止を示す動きベトクル(0,0)に対応するピーク(極値)413,423の3つのピーク(極値)が出現しているが、本発明に従った重み情報を考慮して生成した最終評価値に基づいて生成した評価値テーブルにおいて出現するピークは、相関判定部230からの出力(1ビット)を、そのまま積算した結果として得られる度数分布型評価値テーブルに比較して、より急峻なピークとして形成される。
従って、評価値テーブルに出現したピーク(極値)に基づく候補ベクトル抽出処理において、より正確な候補ベクトル抽出が可能となる。
評価値テーブルにおいて出現するピーク(極値)の位置が、1画面に存在する動きに対応し、この評価値テーブルにおいて出現するピーク(極値)の位置に基づいて候補ベクトルが取得される。例えば図19(a)に示した型評価値テーブルでは、動きベクトル(9,0)と、動きベクトル(−9,0)、動き(静止)ベクトル(0,0)が候補ベクトルとして抽出可能である。
評価値テーブルにおけるピーク(極値)の急峻度が大きい方が信憑性が高く、ピーク(極値)が高い方も信憑性が高いと言える。評価値テーブルからの候補ベクトル抽出処理を実行するのは、図5に示す動きベクトル検出装置における候補ベクトル抽出部102である。候補ベクトル抽出部102は、評価値テーブル形成部101が、前述した手法で生成した型評価値テーブルを受領し、受領した評価値テーブルからピーク(極値)検出を実行して、検出したピーク(極値)の座標に基づいて、候補ベクトルを抽出する。
評価値テーブルはサーチエリアに対応した大きさを持つ。サーチエリアの範囲が、水平方向が−H〜(H−1)、垂直方向が−V〜(V−1)に設定したとすると、評価値テーブルの大きさは、水平が2H、垂直が2Vの大きさとなる。この場合の評価値テーブルの概念図を、図20に示す。図20は、評価値テーブルの平面図を示しており、水平:2H、垂直:2Vはサーチエリアの大きさに対応する。
図5に示す候補ベクトル抽出部102は、評価値テーブル形成部101が生成した評価値テーブルを受領し、受領した評価値テーブルからピーク(極値)を調べるために、図20に示す評価値テーブル500における注目点501の近傍を参照する。注目点501は、座標(i,j)を有する。
例えば、サーチエリアの中心位置にピークがある場合は、静止ベクトル(0,0)に対応する。候補ベクトル抽出部102は、各座標(i,j)地点にピークがあるか否かを判定する処理を行い、ピークがあると判定された座標(i,j)に対応する候補ベクトルを抽出する。サーチエリアの中央、例えば座標(0,0)にピークがある場合は、静止ベクトル(0,0)が候補ベクトルとして抽出される。
候補ベクトル抽出部102は、評価値テーブル500におけるピークを検出する処理を実行するが、この場合、評価値テーブル情報を格納するメモリの情報領域をサーチエリアと同一の大きさに設定すると、ピーク位置が、評価値テーブルの上下左右の端に位置する場合に、正確なピーク位置の検出が困難となる場合がある。従って、評価値テーブルメモリの大きさは、サーチエリアより少し広めに設定しておくことが好ましい。
候補ベクトル抽出部102は、例えば評価値テーブル500におけるピーク(極値)の高いものから順に予め設定された数の候補ベクトルを選択する。すなわちピーク(極値)大きい値から、順番に、予め設定された候補ベクトル数に対応するデータを順に取り出し、これらを候補ベクトルとする。
図5に示す動きベクトル検出部103は、候補ベクトル抽出部102が評価値テーブルから抽出した複数の候補ベクトルから、各画素毎に最適なベクトルを選択して対応付ける処理を行い、各画素毎の動きベクトルを決定する処理を実行する。
動きベクトル検出部103においては、複数の候補ベクトルから、各画素毎に最適なベクトルを選択して対応付けて、各画素毎の動きベクトルを決定する。この処理においては、基本的に、各候補ベクトルに基づく移動位置とのブロックマッチングによる評価を行い、最も相関の高い画素データを指す候補ベクトルを選択する。すなわち、複数の候補ベクトルに対するマッチング評価に基づいて、各画素に対応付ける動きベクトルを決定する。
例えば、予め設定された候補ベクトル数を3として、前フレーム[Ft−1]と現フレーム[F]との間で、上述した評価値テーブル形成した後、評価値テーブルに基づいて候補ベクトルの抽出を行った結果、図21に図示するような3つの候補ベクトルV1,V2,V3が得られたものと仮定する。
静止ベクトル(0,0)も本来考慮すべきであるが、一例として、ここでは、3つの候補ベクトルV1,V2,V3から動きベクトルが選択される場合の処理例を説明する。
前フレーム[Ft−1]のある注目画素をP(0)として、この注目画素に3つの候補ベクトルの中から最良な動きベクトルを決定する処理について説明する。前フレーム[Ft−1]の注目画素P(0)が、候補ベクトル分移動した先の、現フレーム[F]の画素を、其々、A(0),B(0),C(0)とする。
また、注目画素P(0)の周辺の隣接画素は、図示するように、P(1),・・・,P(8)の8画素からなるブロックがあるものとする。3つの候補ベクトルV1,V2,V3によって指定される現フレーム[F]の画素位置、A(0),B(0),C(0)の周辺にも、図示しないが、それぞれ同様に、A(1),・・・,A(8)、B(1),・・・,B(8)、C(1),・・・,C(8)の画素からなるブロックが存在する。
動きベクトル検出部103におけるブロックマッチングは、注目画素の周辺画素を含むブロック領域を設定して、前フレーム[Ft−1]のある注目画素をP(0)含むブロックと、候補ベクトル(V1,V2,V3)によって指定される現フレーム[F]の画素位置、A(0),B(0),C(0)を含むブロックの画素値の相関を判別する処理である。ここでは、ブロックマッチングサイズは、説明を分かりやすくするために、一例として、3画素×3画素としている。
動きベクトル検出部103は、フレームメモリから、現フレーム[F]の画素値データと、前フレーム[Ft−1]の画素値データを読み出して、予め取得済みの候補ベクトルデータに基づいて、各画素を含むブロックを設定して、ブロックマッチング処理を実行し、最も相関の高いブロックに対応する候補ベクトルをその画素の動きベクトルとして設定する処理を実行する。
この結果、動画像データのフレームを構成する画素に対応する動きベクトルが決定される。この動きベクトルに基づいて、例えばMPEG符号化処理など、各種の動画像データに対する処理が実行される。
以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。
なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。
例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
以上、説明したように、本発明の構成によれば、動画像データからの動きベクトル検出処理において生成する評価値テーブルの生成情報としての評価値を、画像特性に応じた重み情報を加味した評価値として設定することが可能となり、より正確な動きベクトル検出を可能とする評価値テーブルを生成することが可能となる。従って、動画像データの符号化処理などを実行する画像処理装置などにおいて本発明を適用することにより、より正確な動きベクトル検出処理が可能となる。
本発明の構成によれば、注目画素を含む近傍領域画素の特徴量に基づく可変閾値と、相関情報との比較処理結果に基づいて算出する1ビットの仮評価値に対して、画像特性に基づく重み情報に基づく演算を実行して、画像特性に応じた重み情報を加味した最終評価値を算出し、この最終評価値を評価値テーブルの生成情報としたので、画像特性に応じた評価値テーブルを生成することが可能となり、正確な動きベクトル検出が可能となる。従って、動画像データの符号化処理などを実行する画像処理装置などにおいて本発明を適用することにより、より正確な動きベクトル検出処理が可能となる。
本発明の構成によれば、相関演算部から入力するフレーム差分絶対値、可変閾値生成部から入力する閾値TH、または可変閾値生成部から入力する画像特徴量としてのダイナミックレンジ(DR)を適用して重み情報Wを算出し、相関判定部の算出した仮評価値と重み情報Wとの乗算により最終評価値を算出し、この最終評価値を評価値テーブルの生成情報としたので、画像特性に応じた評価値テーブルを生成することが可能となり、正確な動きベクトル検出が可能となる。従って、動画像データの符号化処理などを実行する画像処理装置などにおいて本発明を適用することにより、より正確な動きベクトル検出処理が可能となる。
ブロックマッチング法の概要を説明する図である。 動きベクトル検出処理において適用する代表点マッチング法による評価値テーブルの作成処理、評価値テーブルに基づく候補ベクトルの抽出処理、抽出した候補ベクトルに基づく各画素に対応する動きベクトルの設定処理の概要について説明する図(その1)である。 動きベクトル検出処理において適用する代表点マッチング法による評価値テーブルの作成処理、評価値テーブルに基づく候補ベクトルの抽出処理、抽出した候補ベクトルに基づく各画素に対応する動きベクトルの設定処理の概要について説明する図(その2)である。 動きベクトル検出処理において適用する代表点マッチング法による評価値テーブルの作成処理、評価値テーブルに基づく候補ベクトルの抽出処理、抽出した候補ベクトルに基づく各画素に対応する動きベクトルの設定処理の概要について説明する図(その3)である。 動きベクトル検出処理を実行する本発明の動きベクトル検出装置の一実施例構成を示す図である。 動きベクトル検出処理を実行する本発明の動きベクトル検出装置の処理シーケンスを説明するフローチャートである。 本発明の動きベクトル検出装置の評価値テーブル形成部の詳細構成を示す図である。 代表点マッチングの相関演算結果を利用した代表点近傍領域(3×3)のダイナミックレンジ(DR)算出処理について説明する図である。 特徴量抽出部の構成例を示す図である。 可変閾値生成部において実行する可変閾値生成処理手順について説明するフロー図である。 閾値生成部における空間内変動の特徴量としての代表点近傍のダイナミックレンジデータに基づく閾値生成処理について説明する図である。 閾値生成部の入出力関係をプロットしたグラフを示す図である。 フレーム差絶対値と、仮評価値との対応を説明する図である。 評価値調整部における重み決定部および乗算部における処理(処理例1)を説明する図である。 フレーム差絶対値と、仮評価値と、重み情報に基づいて調整された評価値としての最終評価値の対応を説明する図である。 評価値調整部における重み決定部および乗算部における処理(処理例2)を説明する図である。 評価値テーブル形成部の処理シーケンスを説明するフローチャートを示す図である。 評価値テーブル生成処理対象となる動画像データの例を示す図である。 重み情報を適用して生成した評価値テーブルと適用しないで生成した評価値テーブルの例を示す図である。 水平が2H、垂直が2Vの大きさを持つ評価値テーブルの概念図(平面図)を示す図である。 動きベクトル検出装置における動きベクトル検出部の処理概要を説明する図である。
符号の説明
10 前フレーム
11 検査ブロックBy
12 サーチエリア
20 現フレーム
21 基準ブロックBx
70 前フレーム
71 代表点Ry
80 現フレーム
81 サーチエリア
90 評価値テーブル
91 前フレーム画素
95,96,97 現フレーム画素
101 評価値テーブル形成部
102 候補ベクトル抽出部
103 動きベクトル検出部
104 制御部(コントローラ)
200 評価値テーブル形成部
210 相関演算部
211 代表点メモリ
212 減算回路
213 絶対値算出部
220 可変閾値生成部
221 特徴量抽出部
222 特徴量メモリ
223 閾値生成部
230 相関判定部
231 比較部
240 評価値調整部
241 重み決定部
242 乗算部
243,244 重み情報算出部
250 評価値テーブル算出部
251 評価値積算部
252 評価値テーブルメモリ
301 最大値検出部
302 レジスタ
303 最小値検出部
304 レジスタ
305 減算回路
306 ラッチ
351 ビット分解部
352〜355 OR回路
356 ビット合成部
400 静止背景
401 移動物体(A)
402 移動物体(B)
411〜413 ピーク(極値)
421〜423 ピーク(極値)
500 評価値テーブル
501 注目点

Claims (23)

  1. 動画像データから動きベクトルを検出する動きベクトル検出装置であり、
    時間軸上における異なるフレーム間の画素値相関情報に基づいて評価値テーブルを生成する評価値テーブル形成部と、
    前記評価値テーブルに基づいて動画像データのフレーム構成画素に対する動きベクトルを検出して対応付ける動きベクトル検出部とを有し、
    前記評価値テーブル形成部は、
    時間軸上における異なるフレーム間の相関情報の算出処理を実行する相関演算部と、
    注目画素を含む近傍領域画素の特徴量に基づく可変閾値を生成する可変閾値生成部と、
    前記相関演算部の算出した相関情報と、前記可変閾値生成部の生成した閾値との比較処理を実行し、該比較処理結果に基づく仮評価値を算出する相関判定部と、
    画像特性に基づく重み情報を算出し、前記相関判定部の算出した仮評価値および前記重み情報に基づく演算を実行して最終評価値を算出する評価値調整部と、
    前記評価値調整部の出力する最終評価値を積算し、評価値テーブルを生成する評価値テーブル算出部と、
    を有することを特徴とする動きベクトル検出装置。
  2. 前記評価値調整部は、
    画像特性に基づく重み情報を算出する重み決定部と、前記仮評価値と前記重み情報との乗算を実行する乗算部を有し、前記乗算部における乗算結果を最終評価値として前記評価値テーブル算出部に出力する処理を実行する構成であることを特徴とする請求項1に記載の動きベクトル検出装置。
  3. 前記評価値調整部は、
    画像特性に基づく重み情報を算出する重み決定部と、前記仮評価値と前記重み情報との乗算を実行する乗算部を有し、
    前記重み決定部は、
    前記相関演算部から入力するフレーム差分絶対値|ΔF|と、前記可変閾値生成部から入力する閾値THを適用して、下記式に従って重み情報Wを算出する処理を実行し、
    =TH−|ΔF|+1
    前記乗算部は、
    前記相関判定部の算出した仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として前記評価値テーブル算出部に出力する処理を実行する構成であることを特徴とする請求項1に記載の動きベクトル検出装置。
  4. 前記評価値調整部は、
    画像特性に基づく重み情報を算出する重み決定部と、前記仮評価値と前記重み情報との乗算を実行する乗算部を有し、
    前記重み決定部は、
    前記可変閾値生成部から入力する画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って重み情報Wを算出する処理を実行し、
    =DR
    前記乗算部は、
    前記相関判定部の算出した仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として前記評価値テーブル算出部に出力する処理を実行する構成であることを特徴とする請求項1に記載の動きベクトル検出装置。
  5. 前記評価値調整部は、
    画像特性に基づく重み情報を算出する重み決定部と、前記仮評価値と前記重み情報との乗算を実行する乗算部を有し、
    前記重み決定部は、
    前記可変閾値生成部から入力する画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って重み情報W'を算出する処理を実行し、
    '=DR/n
    ただし、nは2以上の自然数
    前記乗算部は、
    前記相関判定部の算出した仮評価値と前記重み情報W'との乗算を実行し、乗算結果を最終評価値として前記評価値テーブル算出部に出力する処理を実行する構成であることを特徴とする請求項1に記載の動きベクトル検出装置。
  6. 前記評価値調整部は、
    画像特性に基づく重み情報を算出する重み決定部と、前記仮評価値と前記重み情報との乗算を実行する乗算部を有し、
    前記重み決定部は、
    前記相関演算部から入力するフレーム差分絶対値|ΔF|と、前記可変閾値生成部から入力する閾値THと、画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って、複数の重み情報W,Wに基づく重み情報Wを算出する処理を実行し、
    =TH−|ΔF|+1
    =DR
    =αW+βW
    α,β:係数
    前記乗算部は、
    前記相関判定部の算出した仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として、前記評価値テーブル算出部に出力する処理を実行する構成であることを特徴とする請求項1に記載の動きベクトル検出装置。
  7. 前記相関判定部は、
    前記相関演算部の算出した相関情報と、前記可変閾値生成部の生成した閾値との比較処理を実行し、該比較処理結果に基づく1ビットの仮評価値を算出し、
    前記評価値調整部は、
    画像特性に基づく重み情報を算出し、前記相関判定部の算出した1ビット仮評価値と前記重み情報に基づく演算を実行して複数ビットの最終評価値を算出する構成であることを特徴とする請求項1に記載の動きベクトル検出装置。
  8. 前記動きベクトル検出装置は、さらに、
    前記評価値テーブルに基づいて1以上の候補ベクトルを抽出する候補ベクトル抽出部を有し、
    前記動きベクトル検出部は、
    動画像データのフレーム構成画素各々に対応する動きベクトルを、前記候補ベクトルから選択して対応付ける処理を実行する構成であることを特徴とする請求項1に記載の動きベクトル検出装置。
  9. 前記可変閾値生成部は、
    注目画素を含む近傍領域画素のダイナミックレンジを算出し、該ダイナミックレンジを特徴量として、該特徴量に基づく可変閾値を設定する構成であることを特徴とする請求項1に記載の動きベクトル検出装置。
  10. 前記可変閾値生成部は、
    前記相関演算部の算出するフレーム間差分情報を入力し、該フレーム間差分情報に基づいて、前記注目画素を含む近傍領域画素のダイナミックレンジを算出する構成であることを特徴とする請求項9に記載の動きベクトル検出装置。
  11. 前記可変閾値生成部は、
    前記相関演算部の算出するフレーム間差分情報を入力し、該フレーム間差分情報に基づいて、前記注目画素を含む近傍領域画素のダイナミックレンジを算出するとともに、該ダイナミックレンジ構成ビットのビット情報圧縮処理により閾値を算出する構成であることを特徴とする請求項9に記載の動きベクトル検出装置。
  12. 動画像データから動きベクトルを検出する動きベクトル検出方法であり、
    時間軸上における異なるフレーム間の画素値相関情報に基づいて評価値テーブルを生成する評価値テーブル形成ステップと、
    前記評価値テーブルに基づいて動画像データのフレーム構成画素に対する動きベクトルを検出して対応付ける動きベクトル検出ステップとを有し、
    前記評価値テーブル形成ステップは、
    時間軸上における異なるフレーム間の相関情報の算出処理を実行する相関演算ステップと、
    注目画素を含む近傍領域画素の特徴量に基づく可変閾値を生成する可変閾値生成ステップと、
    前記相関演算ステップにおいて算出した相関情報と、前記可変閾値生成ステップにおいて生成した閾値との比較処理を実行し、該比較処理結果に基づく仮評価値を算出する相関判定ステップと、
    画像特性に基づく重み情報を算出し、前記相関判定ステップにおいて算出した仮評価値および前記重み情報に基づく演算を実行して最終評価値を算出する評価値調整ステップと、
    前記評価値調整ステップにおいて算出する最終評価値を積算し、評価値テーブルを生成する評価値テーブル算出ステップと、
    を有することを特徴とする動きベクトル検出方法。
  13. 前記評価値調整ステップは、
    画像特性に基づく重み情報を算出する重み決定ステップと、
    前記仮評価値と前記重み情報との乗算を実行する乗算ステップを有し、
    前記乗算ステップにおける乗算結果を最終評価値として設定する処理を実行することを特徴とする請求項12に記載の動きベクトル検出方法。
  14. 前記評価値調整ステップは、
    画像特性に基づく重み情報を算出する重み決定ステップと、前記仮評価値と前記重み情報との乗算を実行する乗算ステップを有し、
    前記重み決定ステップは、
    前記相関演算ステップにおいて算出されるフレーム差分絶対値|ΔF|と、前記可変閾値生成ステップにおいて算出される閾値THを適用して、下記式に従って重み情報Wを算出する処理を実行し、
    =TH−|ΔF|+1
    前記乗算ステップは、
    前記相関判定ステップにおいて算出した仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として算出する処理を実行することを特徴とする請求項12に記載の動きベクトル検出方法。
  15. 前記評価値調整ステップは、
    画像特性に基づく重み情報を算出する重み決定ステップと、前記仮評価値と前記重み情報との乗算を実行する乗算ステップを有し、
    前記重み決定ステップは、
    前記可変閾値生成ステップにおいて算出される画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って重み情報Wを算出する処理を実行し、
    =DR
    前記乗算ステップは、
    前記相関判定ステップにおいて算出される仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として算出する処理を実行することを特徴とする請求項12に記載の動きベクトル検出方法。
  16. 前記評価値調整ステップは、
    画像特性に基づく重み情報を算出する重み決定ステップと、前記仮評価値と前記重み情報との乗算を実行する乗算ステップを有し、
    前記重み決定ステップは、
    前記可変閾値生成ステップにおいて算出される画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って重み情報W'を算出する処理を実行し、
    '=DR/n
    ただし、nは2以上の自然数
    前記乗算ステップは、
    前記相関判定ステップにおいて算出される仮評価値と前記重み情報W'との乗算を実行し、乗算結果を最終評価値として算出する処理を実行することを特徴とする請求項12に記載の動きベクトル検出方法。
  17. 前記評価値調整ステップは、
    画像特性に基づく重み情報を算出する重み決定ステップと、前記仮評価値と前記重み情報との乗算を実行する乗算ステップを有し、
    前記重み決定ステップは、
    前記相関演算ステップにおいて算出されるフレーム差分絶対値|ΔF|と、前記可変閾値生成ステップにおいて算出される閾値THと、画像特徴量としてのダイナミックレンジ(DR)を適用して、下記式に従って、複数の重み情報W,Wに基づく重み情報Wを算出する処理を実行し、
    =TH−|ΔF|+1
    =DR
    =αW+βW
    α,β:係数
    前記乗算ステップは、
    前記相関判定ステップにおいて算出される仮評価値と前記重み情報Wとの乗算を実行し、乗算結果を最終評価値として算出する処理を実行することを特徴とする請求項12に記載の動きベクトル検出方法。
  18. 前記相関判定ステップは、
    前記相関演算ステップにおいて算出される相関情報と、前記可変閾値生成ステップにおいて算出される閾値との比較処理を実行し、該比較処理結果に基づく1ビットの仮評価値を算出し、
    前記評価値調整ステップは、
    画像特性に基づく重み情報を算出し、前記相関判定ステップにおいて算出される1ビット仮評価値と前記重み情報に基づく演算を実行して複数ビットの最終評価値を算出することを特徴とする請求項12に記載の動きベクトル検出方法。
  19. 前記動きベクトル検出方法は、さらに、
    前記評価値テーブルに基づいて1以上の候補ベクトルを抽出する候補ベクトル抽出ステップを有し、
    前記動きベクトル検出ステップは、
    動画像データのフレーム構成画素各々に対応する動きベクトルを、前記候補ベクトルから選択して対応付ける処理を実行することを特徴とする請求項12に記載の動きベクトル検出方法。
  20. 前記可変閾値生成ステップは、
    注目画素を含む近傍領域画素のダイナミックレンジを算出し、該ダイナミックレンジを特徴量として、該特徴量に基づく可変閾値を設定するステップであることを特徴とする請求項12に記載の動きベクトル検出方法。
  21. 前記可変閾値生成ステップは、
    前記相関演算ステップにおいて算出するフレーム間差分情報を入力し、該フレーム間差分情報に基づいて、前記注目画素を含む近傍領域画素のダイナミックレンジを算出することを特徴とする請求項20に記載の動きベクトル検出方法。
  22. 前記可変閾値生成ステップは、
    前記相関演算ステップにおいて算出するフレーム間差分情報を入力し、該フレーム間差分情報に基づいて、前記注目画素を含む近傍領域画素のダイナミックレンジを算出するとともに、該ダイナミックレンジ構成ビットのビット情報圧縮処理により閾値を算出することを特徴とする請求項20に記載の動きベクトル検出方法。
  23. 動画像データから動きベクトルを検出する動きベクトル検出処理を実行するコンピュータ・プログラムであり、
    時間軸上における異なるフレーム間の画素値相関情報に基づいて評価値テーブルを生成する評価値テーブル形成ステップと、
    前記評価値テーブルに基づいて動画像データのフレーム構成画素に対する動きベクトルを検出して対応付ける動きベクトル検出ステップとを有し、
    前記評価値テーブル形成ステップは、
    時間軸上における異なるフレーム間の相関情報の算出処理を実行する相関演算ステップと、
    注目画素を含む近傍領域画素の特徴量に基づく可変閾値を生成する可変閾値生成ステップと、
    前記相関演算ステップにおいて算出した相関情報と、前記可変閾値生成ステップにおいて生成した閾値との比較処理を実行し、該比較処理結果に基づく仮評価値を算出する相関判定ステップと、
    画像特性に基づく重み情報を算出し、前記相関判定ステップにおいて算出した仮評価値および前記重み情報に基づく演算を実行して最終評価値を算出する評価値調整ステップと、
    前記評価値調整ステップにおいて算出する最終評価値を積算し、評価値テーブルを生成する評価値テーブル算出ステップと、
    を有することを特徴とするコンピュータ・プログラム。
JP2003412818A 2003-12-11 2003-12-11 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム Expired - Fee Related JP4207763B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003412818A JP4207763B2 (ja) 2003-12-11 2003-12-11 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003412818A JP4207763B2 (ja) 2003-12-11 2003-12-11 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2005175869A JP2005175869A (ja) 2005-06-30
JP4207763B2 true JP4207763B2 (ja) 2009-01-14

Family

ID=34733112

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003412818A Expired - Fee Related JP4207763B2 (ja) 2003-12-11 2003-12-11 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP4207763B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4697276B2 (ja) 2008-07-30 2011-06-08 ソニー株式会社 動きベクトル検出装置、動きベクトル検出方法及びプログラム
JP5338684B2 (ja) 2010-01-08 2013-11-13 ソニー株式会社 画像処理装置、画像処理方法、およびプログラム

Also Published As

Publication number Publication date
JP2005175869A (ja) 2005-06-30

Similar Documents

Publication Publication Date Title
KR101098394B1 (ko) 움직임 벡터 검출 장치 및 움직임 벡터 검출 방법
TWI565306B (zh) 視訊解碼裝置、視訊編碼裝置、視訊解碼方法、視訊編碼方法、及儲存媒體(四)
US7050502B2 (en) Method and apparatus for motion vector detection and medium storing method program directed to the same
JP5338684B2 (ja) 画像処理装置、画像処理方法、およびプログラム
KR100973429B1 (ko) 배경 움직임 벡터 선택기, 업-변환 유닛, 이미지 처리 장치, 배경 움직임 벡터 선택 방법 및 컴퓨터 판독 가능한 기록 매체
KR101217627B1 (ko) 블록 기반의 움직임 추정 방법 및 장치
JP2009147807A (ja) 画像処理装置
KR20060044827A (ko) 화상 처리 장치 및 방법, 기록 매체, 및 프로그램
JP2013031163A (ja) 超解像処理装置及び超解像処理方法
US20100080299A1 (en) Frame frequency conversion apparatus, frame frequency conversion method, program for achieving the method, computer readable recording medium recording the program, motion vector detection apparatus, and prediction coefficient generation apparatus
JP2005528708A (ja) 現動きベクトルを推定するユニット及び方法
JP2010114597A (ja) 動きベクトル検出装置、その処理方法およびプログラム
JP2005528709A (ja) 現動きベクトルを推定するユニット及び方法
JP4626158B2 (ja) 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム
JP4525064B2 (ja) 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム
JPWO2013008374A1 (ja) 動画領域検出装置
JP4622264B2 (ja) 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム
JP4622265B2 (ja) 動きベクトル検出装置、および動きベクトル検出方法、並びにプログラム
JP2010114596A (ja) 動きベクトル検出装置、その処理方法およびプログラム
JP4207763B2 (ja) 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム
JP4207764B2 (ja) 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム
JP3175914B2 (ja) 画像符号化方法および画像符号化装置
WO2022172341A1 (ja) 物体検出装置、方法、及びプログラム
JP4525063B2 (ja) 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム
JP2013005400A (ja) 情報処理装置と情報処理方法およびプログラムと記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080930

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081013

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131031

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees