JP4514203B2 - 動きベクトル検出装置及び方法 - Google Patents

動きベクトル検出装置及び方法 Download PDF

Info

Publication number
JP4514203B2
JP4514203B2 JP2004174604A JP2004174604A JP4514203B2 JP 4514203 B2 JP4514203 B2 JP 4514203B2 JP 2004174604 A JP2004174604 A JP 2004174604A JP 2004174604 A JP2004174604 A JP 2004174604A JP 4514203 B2 JP4514203 B2 JP 4514203B2
Authority
JP
Japan
Prior art keywords
motion vector
vector
reliability
global
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004174604A
Other languages
English (en)
Other versions
JP2005354528A (ja
JP2005354528A5 (ja
Inventor
大輔 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004174604A priority Critical patent/JP4514203B2/ja
Priority to US11/142,287 priority patent/US20050276328A1/en
Publication of JP2005354528A publication Critical patent/JP2005354528A/ja
Publication of JP2005354528A5 publication Critical patent/JP2005354528A5/ja
Application granted granted Critical
Publication of JP4514203B2 publication Critical patent/JP4514203B2/ja
Priority to US14/598,995 priority patent/US20150201209A1/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • H04N5/145Movement estimation

Description

本発明は、動きベクトル検出装置及び方法に関し、更に詳しくは画像間の動きが大きな場合にも適応的に動きベクトルの検出が行える動きベクトル検出装置及び方法に関する。
近年、音声信号、映像信号など所謂マルチメディアに関連する情報のデジタル化が急進しており、これに対応して映像信号の圧縮符号化復号化技術が注目されている。圧縮符号化及び復号化技術により、映像信号の格納に必要な記憶容量や伝送に必要な帯域を減少させることができるため、マルチメディア産業には極めて重要な技術である。
これらの圧縮符号化復号化技術は、多くの映像信号が有する自己相関性の高さ(すなわち、冗長性)を利用して情報量/データ量を圧縮している。映像信号が有する冗長性には、時間冗長性及び二次元の空間冗長性があり、時間冗長性は、ブロック単位の動き推定及び動き補償を用いて低減することが出来、一方、空間冗長性は、離散コサイン変換(DCT)を用いて低減させることが出来る。
圧縮符号化復号化技術として知られるMPEG方式などではこれらの手法により映像信号の冗長性を低減させ、経時的に変わるビデオフレーム/フィールドのデータ圧縮効果を向上させる。時間冗長性を低減させるためのブロック単位の動き推定とは、連続して入力する参照フレーム/フィールド(過去のフレーム/フィールド)と現在フレーム/フィールドとの間で最も近似するブロックを探し出す作業であり、対応するブロックの移動方向、移動量を表すベクトルを動きベクトルという。従って、動き推定とは動きベクトルの推定と同義である。
一般に動きベクトルを推定する方法としては、ブロックマッチング方式が用いられる。ブロックマッチング方式とは、参照フレーム/フィールドと現在フレーム/フィールドのように2枚の映像をブロック単位で比較し、信号類型の整合度に基づいてブロック単位で動きを推定する方法をいう。かかるブロックマッチング方式により、参照フレーム/フィールドと現在フレーム/フィールドとからブロックごとに動きベクトルを推定し、推定された動きベクトルを用いて動き補償予測を行う。このブロックマッチング方式については例えば特許文献1に記載されているが、図2を用いて説明する。
図2はブロックマッチング方式を用いた動きベクトル検出装置を示すブロック図である。同図において動きベクトル検出装置は、現在フレーム/フィールド保存部20、参照フレームフィールド保存部21、現在マクロブロック保存バッファ22、参照サーチウィンドウ保存バッファ23、動きベクトル探索部24から成っている。
現在フレーム/フィールド保存部20と参照フレーム/フィールド保存部21はそれぞれ現在フレーム/フィールドと参照フレーム/フィールドが保存され、動きベクトルの推定に用いられる。現在マクロブロック保存バッファ22は現在フレーム/フィールド保存部20から現在のマクロブロックの画像を取り出す。参照サーチウィンドウ保存バッファ23は現在のマクロブロックの中心に探索領域の中心を設定し探索領域の範囲(以下、サーチウィンドウと呼ぶ)分だけ参照フレームフィールド保存部21から画像を取り出す。動きベクトル探索部24ではサーチウィンドウ内で現在のマクロブロックの画像を探索し、現在のマクロブロックについての最終的な動きベクトルを推定する。
また、ブロックマッチング方式には、図3に示すように、図2の動きベクトル検出装置に、動きベクトル探索部24で推定された動きベクトルを保存する動きベクトル保存器35を持たせた構成も存在する。この構成では、参照フレーム/フィールド保存部21に動きベクトル保存器35から一つ前のマクロブロックについて推定した動きベクトルを提供する。参照フレーム/フィールド保存部21は、一つ前のマクロブロックの動きベクトル分だけ現在マクロブロックからずらした位置に探索領域の中心位置を設定し、参照サーチウィンドウ保存バッファ23へ参照画像を出力する。
ブロックマッチング方式のようにマクロブロックごとに動きベクトルの検出/推定を行い、この動きベクトルを用いて動き補償予測を行う方法を、局所的な検出をするという意味から、以後まとめてローカル動き補償と呼ぶことにする。またブロック単位の動きベクトルをローカル動きベクトルと呼ぶことにする。
これまで説明してきたローカル動き補償方式は現在国際標準方式H.261、H.263、MPEG1、MPEG2、MPEG4で用いられており、最も広く採用されている動き補償方式である。
特開平04−323780号公報(第2頁)
しかしながら、ローカル動き補償方式においては1フレームより少ない数の画素からなるサーチウィンドウを用いているため、現在のマクロブロックの中心に探索領域の中心を設定した場合や一つ前のマクロブロックの動きベクトルを用いてサーチウィンドウの中心の位置決めを行った場合、野球中継のように画像間の動きが速いか、画面全体がパンニング(panning)される画像のマクロブロックはサーチウィンドウ内に存在しなくなることがある。この場合、従来のローカル動き補償方式においては画像フレーム間の差異値を得るノン・イントラ(又はインター)符号化を行わず、その代わりにイントラ符号化を行うため、圧縮率が低下し、符号化データ量が多くなってしまう問題点がある。
従って、本発明の目的はフレーム間の動きが大きい画像に対しても動きベクトルの検出が可能な動きベクトル検出装置及び方法を提供することにある。
また、本発明の別の目的は、フレーム間の動きが大きい画像の場合にも圧縮率の高い符号化が可能な動き補償符号化装置及び方法を提供することである。
上述の目的は、現画像を構成する複数のマクロブロックの各々について、参照画像に設定された探索領域内で探索することにより、複数のマクロブロックの各々の動きベクトルを検出する動きベクトル検出装置であって、現画像と参照画像の画素値の差分の演算を含んだ評価関数を演算することによって、現画像と参照画像の空間的な位置の差を示すグローバルベクトルを求めるグローバルベクトル決定手段と、評価関数の演算によって得られた値と所定の閾値とを比較して、グローバルベクトルの信頼性が高いか否かを判定する信頼性判定手段と、信頼性判定手段によってグローバルベクトルの信頼性が高いと判定された場合、グローバルベクトルが指す位置の周辺に探索領域を設定し、グローバルベクトルの信頼性が高くないと判定された場合には、予め定められた動きベクトルが指す位置の周辺に探索領域を設定する探索領域設定手段と、現画像の複数のマクロブロックの各々について、探索領域設定手段によって設定された探索領域内で探索し、当該マクロブロックに対する動きベクトルを検出する動きベクトル探索手段とを有することを特徴とする動きベクトル検出装置によって達成される。
また、上述の目的は、現画像を構成する複数のマクロブロックの各々について、参照画像に設定された探索領域内で探索することにより、複数のマクロブロックの各々の動きベクトルを検出する動きベクトル検出方法であって、現画像と参照画像の画素値の差分の演算を含んだ評価関数を演算することによって、現画像と参照画像の空間的な位置の差を示すグローバルベクトルを求めるグローバルベクトル決定ステップと、評価関数の演算によって得られた値と所定の閾値とを比較して、グローバルベクトルの信頼性が高いか否かを判定する信頼性判定ステップと、信頼性判定ステップによってグローバルベクトルの信頼性が高いと判定された場合、グローバルベクトルが指す位置の周辺に探索領域を設定し、グローバルベクトルの信頼性が高くないと判定された場合には、予め定められた動きベクトルが指す位置の周辺に探索領域を設定する探索領域設定ステップと、現画像の複数のマクロブロックの各々について、探索領域設定ステップによって設定された探索領域内で探索し、当該マクロブロックに対する動きベクトルを検出する動きベクトル探索ステップとを有することを特徴とする動きベクトル検出方法によっても達成される。
また、上述の目的は、コンピュータを本発明の動きベクトル検出装置の各手段として機能させるためのプログラム又はこのプログラムを格納したコンピュータ読み取り可能な記録媒体によっても達成される。
このような構成により、本発明の動きベクトル検出装置は、動きの大きい場面においても動きベクトルを検出することができる。
以下、図面を参照して本発明をその好適な実施形態に基づき詳細に説明する。
●(第1の実施形態)
図1は、本発明の第1の実施形態に係る動きベクトル検出装置の構成例を示すブロック図である。
本実施形態における動きベクトル検出装置は、参照フレーム/フィールド保存部100、現在フレーム/フィールド保存部101、グローバルベクトル決定部102、グローバルベクトル信頼性判定部103、サーチウィンドウ位置決定部104、動きベクトル探索部105、動きベクトル保存部106、参照サーチウィンドウ保存バッファ107及び現在マクロブロック保存バッファ108とから構成される。
係る構成において、参照フレーム/フィールド保存部100と現在フレーム/フィールド保存部101には、動きベクトル検出/推定のための参照フレーム/フィールド(参照画像)と現在フレーム/フィールド(現画像)がそれぞれ保存される。
グローバルベクトル決定部102は、参照フレーム/フィールド保存部100及び現在フレーム/フィールド保存部101から提供される参照フレーム/フィールドの画素値全てと現在フレーム/フィールドの画素値全てを用い、参照フレーム/フィールドに対する現在フレーム/フィールドの空間的な位置の差を示すグローバルベクトルを決定する。
グローバルベクトル信頼性判定部103は、グローバルベクトル決定部102が決定したグローバルベクトルの信頼度を判定する。サーチウィンドウ位置決定部104はグローバルベクトル又は一つ前のローカル動きベクトルから参照サーチウィンドウを決定する。
動きベクトル探索部105、動きベクトル保存部及び参照サーチウィンドウ保存バッファ107、現在マクロブロック保存バッファ108は図2及び図3で説明した同名の構成要素と同一でよいため説明を省略する。
以上説明した本実施形態の動きベクトル検出装置の動作を、図9のフローチャートを用いて説明する。
まず、グローバルベクトル決定部102は、参照フレーム/フィールド(参照画像)と現在フレーム/フィールド(現画像)との動きベクトルであるグローバルベクトルを検出するため、これら画像間の位置関係毎に評価関数を演算する(ステップS103)。
参照フレーム/フィールドと現在フレーム/フィールドとが最大相関度を有する移動距離及び方向を表すグローバルベクトルを推定するためには、次のようなMSE(Mean Square Error)(数1)、MAE(Mean Absolute Error)(数2)、あるいはMAD(Mean Absolute Difference)などの評価関数を用いることができる。
Figure 0004514203
Figure 0004514203
ここで、Scur(m,n)は現在のフレーム/フィールドでの(m,n)番目の画素値、Sref(m,n)は参照フレーム、フィールドでの(m,n)番目の画素値を示す。(i,j)は参照フレーム/フィールドに対する現在のフレーム/フィールドの空間的な位置をそれぞれ示している。
(ただし、M,Nを1フレーム/フィールドでの水平及び垂直画素数とすると、m=k×q,n=l×rであり、k,lは0≦m≦M、1≦k≦M,0≦n≦N,1≦l≦Nを満たす自然数である。また、Q,RはM−k≦Q≦M,N−l≦R≦Nを満たす)
この評価関数は画素値の差に基づいたものであり、最も小さいMAE値やMSE値となるベクトルをグローバルベクトルとして決定する。
MAE値を例にした場合の、グローバルベクトルの選定方法の例を図5に示す。参照フレームを所定の方向に1画素ずつずらしていき、画素の移動距離ごとにMAE値の総和の平均を取る。そして平均MAE値が最小となるときの移動量がグローバルベクトルの選定基準となる。この処理を例えば所定の方向と直交する他の方向についても行い、この方向で平均MAE値が最小となる移動量が求まれば、2つの移動量とその移動方向からグローバルベクトルを決定することができる。
また、この時に求まる最小のMAE値やMSE値をグローバルベクトル信頼性判定部103でグローバルベクトル信頼値GRV(Global vector Reliable Value)として用いる。このように、グローバルベクトル決定部102は上述の評価関数の演算を行った後、最大相関度を示す位置への動きベクトルをグローバルベクトルとして定め、グローバルベクトル信頼性判定部103にグローバルベクトル信頼値GRV及びグローバルベクトルを送信する(ステップS105)。
(グローバルベクトルの信頼性の判定方法)
次に、グローバルベクトル信頼性判定部103により、グローバルベクトル決定部102が決定したグローバルベクトルの信頼性を判定する(ステップS107)。この判定方法の例を図6に示す。
本実施形態において、グローバルベクトル信頼性判定部103はグローバルベクトル決定部102から送信されてきたグローバルベクトル信頼値GRVと予め設定してある閾値とを比較し、グローバルベクトル信頼値GRVの値が閾値以下ならばグローバルベクトルの信頼性が高いと判断する。この時、サーチウィンドウの位置決定にグローバルベクトルを用いるため、サーチウィンドウ位置決定部104にグローバルベクトルを送信する。
一方、グローバルベクトル信頼値GRVの値が閾値より大きければグローバルベクトルの信頼性が低いと判断する。この場合には、グローバルベクトルの代わりに動きベクトル保存部106から一つ前のローカル動きベクトルをサーチウィンドウ位置決定部104に送信させる。なお、この場合には動きが無いことを意味するゼロ動きベクトルを一つ前のローカル動きベクトルの代わりに送信することも出来る。また、その他、使用者が定義可能な任意の動きベクトルを一つ前のローカル動きベクトルの代わりに送信しても良い。
サーチウィンドウ位置決定部104は送信されてきた動きベクトル(グローバルベクトル(ステップS109)又は一つ前のローカル動きベクトル(ステップS111))に従いサーチウィンドウ位置を決定する。つまり、サーチウィンドウの中心を、現在のマクロブロックに対応する参照フレーム/フィールドのマクロブロックから、動きベクトルの分だけずらした位置に指定する。参照フレーム/フィールド保存部100は、サーチウィンドウ位置決定部104が決定したサーチウィンドウの中心に従って必要な範囲の画像を取り出し、参照サーチウィンドウ保存バッファ107に送信する。
また、同時に現在フレーム/フィールド保存部101は、現在マクロブロックの画像を取り出し、現在マクロブロック保存バッファ108に送信する。
このように、グローバルベクトルの信頼性が高い時はグローバルベクトルが指す位置の周辺を探索するようにサーチウィンドウの位置を決定し、信頼性が低い時はマクロブロックの周辺を探索するようにサーチウィンドウの位置を決定する様子を模式的に図7に示す。
(動きベクトルの探索)
次に、動きベクトル探索部105は、サーチウィンドウ内でマクロブロックと類似した領域の探索を行い、現在のマクロブロックに対応する動きベクトルを検出/推定する(ステップS113)。推定した動きベクトルは外部に出力するほか、動きベクトル保存部106に送信し、グローバルベクトルの信頼性が低い場合の次のマクロブロックの動きベクトル推定で用いる。
ここで、N×Nサイズのマクロブロックの動きベクトルを参照フレーム/フィールドで±p画素の範囲で探索するとすると、サーチウィンドウの大きさは(N+2p)×(N+2p)となる。ここで、動きベクトルの候補になり得る総ての位置で上述した評価関数を計算した後、最大相関度を示す位置へのベクトルを動きベクトルに決める。
最大相関度を有する動きベクトルを推定するためには、前述のMSE(Mean Square Error)(数3)、MAE(Mean Absolute Error)(数4)、あるいはMAD(Mean Absolute Difference)などの評価関数を用いて次のように求められる。
Figure 0004514203
Figure 0004514203
ここで、Srefは参照フレーム/フィールド、Scur,kは現在のフレーム、フィールドでk番目のマクロブロックを示す。(i,j)は現在フレーム/フィールドのk番目のマクロブロックに対する参照フレーム/フィールドの空間的な位置をそれぞれ示している。
(ただし、X及びYをサーチウィンドウの水平及び垂直画素数とすると、x=g×u,y=h×vであり、g、hは0≦x≦X、1≦g≦X,0≦y≦Y,1≦h≦Yを満たす自然数である。また、U,VはX−g≦U≦X,Y−h≦V≦Yを満たす。)
この評価関数は画素値の差に基づいたものであり、最も小さいMAE値やMSE値を有する場合の移動距離及び方向を表す動きベクトルを現在のマクロブロックにおける最終的な動きベクトルとして選定する。
本実施形態によれば、上述の構成により、現画像全体と参照画像全体との動きベクトルであるグローバルベクトルを求め、グローバルベクトルを用いて参照サーチウィンドウを設定することにより、現在のマクロブロックを参照サーチウィンドウの中心としたり、一つ前のローカル動きベクトルを用いて参照サーチウィンドウを設定する場合に比べ、大きな動きを有する画像に対しても動きベクトルを検出することができる。従って、本実施形態による動きベクトル検出装置を用いることにより、動きの大きい場面において動きベクトルを決定できず、イントラ符号化を行い、符号量が多くなる従来の動き補償符号化システムにおける問題を解決し、動き補償圧縮符号化効率を向上させることが可能になる。
●(第2の実施形態)
図4は、本発明の第2の実施形態に係る動きベクトル検出装置の構成例を示すブロック図である。第2の実施形態に係る動きベクトル検出装置はサーチウィンドウ位置決定部104に代わってサーチウィンドウ範囲決定部304を有する点及び動きベクトル保存部106を持たない点を除き、第1の実施形態のそれと基本的に同じ構造を有する。従って、図4において図1と同様の構成要素については同じ参照数字を付し、重複する説明は省略する。
以下、図10のフローチャートを併せて参照しながら、本実施形態の動きベクトル検出装置の動作について説明する。
まず、グローバルベクトル決定までの処理(ステップS103〜S105)については第1の実施形態と同様である。
本実施形態においては、ステップS207においてグローバルベクトル信頼性判定部103が行う信頼性判定処理と、その結果に応じたサーチウィンドウの設定処理が第1の実施形態と異なる。
具体的にはステップS207においてグローバルベクトル信頼性判定部103が信頼性判定を行う際、閾値を複数用いる。そして、信頼値GRVと複数の閾値との関係に応じて、サーチウィンドウ範囲を段階的に変化させる。本実施形態ではグローバルベクトル信頼性判定部103が2つの閾値Th1,Th2を用いて信頼性評価を行う場合を例に挙げて説明する。
この場合、グローバルベクトル信頼値GRVと閾値Th1,Th2とが取りうる関係は以下の3通りである。
Figure 0004514203
そして、本実施形態のグローバルベクトル信頼性判定部103は、(i)、(ii)、(iii)の順に信頼性が落ちる、つまり(i)の条件を満たす場合が最も信頼性が高いものと判定する。そして、その判定結果に応じてサーチウィンドウの範囲と探索精度を段階的に設定する(ステップS209、S211、S213)。
具体的には信頼性が最も高い場合(i)には、サーチウィンドウの大きさは通常通りのものとし、探索精度も通常の1画素(あるいは半画素)単位のものとする。次に信頼性が高い(ii)の場合は(i)の場合に比べ、グローバルベクトルの信頼性が落ちるため、サーチウィンドウ範囲を通常よりも大きくする。
単純にサーチウィンドウ範囲を大きくすると、参照サーチウィンドウ保存バッファ107に入りきらない場合や、探索処理にかかる時間が増大する。そのため、本実施形態においては、サーチウィンドウ範囲の拡大と同時に探索精度を低下させることでこれらの問題を解消する。
具体的には、参照サーチウィンドウ保存バッファ107に保存する参照画像の解像度を水平及び垂直方向において1/2にすると、バッファ107には通常の4倍の範囲の参照画像を保存できる。このような参照画像を用いて1画素毎に探索処理を行うことは、通常の解像度の参照画像に対して1画素飛びに探索を行うことと同義であり、探索精度を1/4に低下させることと同等である。
また、(iii)の場合にはさらにグローバルベクトルの信頼性が落ちるため、(ii)の場合よりも探索範囲を拡げる(例えば参照画像の解像度を水平及び垂直方向に1/3として範囲を9倍に拡大する)。このような参照画像を用いて1画素毎に探索処理を行うことは、通常の解像度の参照画像に対して2画素飛びに探索を行うことと同義であり、探索精度を1/9に低下させることと同等である。
図8に、本実施形態における、グローバルベクトルの信頼性に応じたサーチウィンドウ範囲の制御を模式的に示す。このように、本実施形態においては、グローバルベクトルがサーチウィンドウの基準位置(図8では左上座標)を決定し、グローバルベクトルの信頼性がサーチウィンドウの大きさを決定する。
なお、本実施形態では(ii)の場合にサーチウィンドウの大きさを(i)の場合の4倍、(iii)の場合に(i)の場合の9倍に設定したが、勿論、(ii)、(iii)各々の場合において、サーチウィンドウの倍率を別の値に設定することも出来る。例えば、水平方向のみ解像度を1/2とするなど、垂直方向とで解像度の低下率を異ならせても良い。また、本実施形態では信頼度判定に用いる閾値の数を2個に設定していたが、閾値の数を更に増やして、サーチウィンドウの大きさを更に段階的に変化させることも出来る。
サーチウィンドウ範囲決定部304はグローバルベクトル信頼性判定部103から送信されてくるグローバルベクトルとサーチウィンドウの範囲に応じて、参照フレーム/フィールド保存部100、現在フレーム/フィールド保存部101から各々動きベクトル推定に必要な画像を取り出し、参照サーチウィンドウ保存バッファ107と現在マクロブロック保存バッファ108に送信する。この際、参照サーチウィンドウ保存バッファ107に保存する画像については、サーチウィンドウの大きさに応じて画素を間引くなどして解像度を低下させる。
そして、動きベクトル探索部105は、第1の実施形態において説明したようにして、動きベクトルを検出し(ステップS113)、出力する。
本実施形態ではグローバルベクトルとグローバルベクトル信頼値GRVを用いてサーチウィンドウの位置及び大きさを決定していたが、上述の数3あるいは数4で求められる値のうち最小のものを信頼値として、ローカル動きベクトルとその信頼値LRV(Local vector Reliable Value)を用いてサーチウィンドウの位置及び大きさを決定してもよい。
以上説明したように本実施形態によれば、グローバルベクトルの信頼度に応じてサーチウィンドウの大きさを制御するため、グローバルベクトルの信頼性が低い場合でもローカル動きベクトルを探索できる可能性を高めることができる。また、ローカル動きベクトル保存部106が不要となり、より簡便な構成を実現できる。
(他の実施形態)
上述の実施形態で説明した動きベクトル検出装置は、動き補償圧縮符号化装置に好適に適用することができ、結果として大きな動きを有する画像に対する圧縮率を向上させることが可能である。
上述の実施形態においては、1つの機器から構成される動きベクトル検出装置についてのみ説明したが、同等の機能を複数の機器から構成されるシステムによって実現しても良い。
尚、前述した実施形態の機能を実現するソフトウェアのプログラムを、記録媒体から直接、或いは有線/無線通信を用いて当該プログラムを実行可能なコンピュータを有するシステム又は装置に供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムを実行することによって同等の機能が達成される場合も本発明に含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータに供給、インストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明の機能処理を実現するためのコンピュータプログラム自体も本発明に含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気記録媒体、MO、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−R、DVD−RW等の光/光磁気記憶媒体、不揮発性の半導体メモリなどがある。
有線/無線通信を用いたプログラムの供給方法としては、コンピュータネットワーク上のサーバに本発明を形成するコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイル等、クライアントコンピュータ上で本発明を形成するコンピュータプログラムとなりうるデータファイル(プログラムデータファイル)を記憶し、接続のあったクライアントコンピュータにプログラムデータファイルをダウンロードする方法などが挙げられる。この場合、プログラムデータファイルを複数のセグメントファイルに分割し、セグメントファイルを異なるサーバに配置することも可能である。
つまり、本発明の機能処理をコンピュータで実現するためのプログラムデータファイルを複数のユーザに対してダウンロードさせるサーバ装置も本発明に含む。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件を満たしたユーザに対して暗号化を解く鍵情報を、例えばインターネットを介してホームページからダウンロードさせることによって供給し、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
本発明の第1の実施形態に係る動きベクトル検出装置の構成例を示すブロック図である。 従来の動きベクトル検出装置の構成例を示すブロック図である。 従来の動きベクトル検出装置の別の構成例を示すブロック図である。 本発明の第2の実施形態に係る動きベクトル検出装置の構成例を示すブロック図である。 実施形態におけるグローバルベクトルの選定方法を説明するための図である。 第1の実施形態における、グローバルベクトルの信頼性の判定方法を説明するための図である。 第1の実施形態における、グローバルベクトルの信頼性に応じたサーチウィンドウ位置の決定方法を説明するための図である。 第2の実施形態における、グローバルベクトルの信頼性に応じたサーチウィンドウ範囲の決定方法を説明するための図である。 本発明の第1の実施形態に係る動きベクトル検出装置の動作を説明するフローチャートである。 本発明の第2の実施形態に係る動きベクトル検出装置の動作を説明するフローチャートである。
符号の説明
100 現在フレーム/フィールド保存部
101 参照フレーム/フィールド保存部
102 グローバルベクトル決定部
103 グローバルベクトル信頼性判定部
104 サーチウィンドウ位置決定部
105 動きベクトル探索部
106 動きベクトル保存部
107 参照サーチウィンドウ保存バッファ
108 現在マクロブロック保存バッファ
304 サーチウィンドウ範囲決定部

Claims (11)

  1. 現画像を構成する複数のマクロブロックの各々について、参照画像に設定された探索領域内で探索することにより、前記複数のマクロブロックの各々の動きベクトルを検出する動きベクトル検出装置であって、
    前記現画像と前記参照画像の画素値の差分の演算を含んだ評価関数を演算することによって、前記現画像と前記参照画像の空間的な位置の差を示すグローバルベクトルを求めるグローバルベクトル決定手段と、
    前記評価関数の演算によって得られた値と所定の閾値とを比較して、前記グローバルベクトルの信頼性が高いか否かを判定する信頼性判定手段と、
    前記信頼性判定手段によって前記グローバルベクトルの信頼性が高いと判定された場合、前記グローバルベクトルが指す位置の周辺に前記探索領域を設定し、前記グローバルベクトルの信頼性が高くないと判定された場合には、予め定められた動きベクトルが指す位置の周辺に前記探索領域を設定する探索領域設定手段と、
    前記現画像の複数のマクロブロックの各々について、前記探索領域設定手段によって設定された探索領域内で探索し、当該マクロブロックに対する動きベクトルを検出する動きベクトル探索手段とを有することを特徴とする動きベクトル検出装置。
  2. 前記グローバルベクトル決定手段は、前記評価関数として、前記現画像と前記参照画像との差分の画素値を自乗した値を累積する評価関数、または、前記現画像と前記参照画像との差分の画素値の絶対値を累積する評価関数を演算することによって前記グローバルベクトルを求めることを特徴とする請求項1記載の動きベクトル検出装置。
  3. 前記グローバルベクトル決定手段は、前記参照画像を前記現画像に対して所定の方向に1画素ずつずらしながら前記評価関数の演算を行い、画素の移動距離ごとに前記評価関数の演算結果の総和の平均値を算出し、さらに、前記参照画像を前記現画像に対して前記所定の方向と直交する方向に1画素ずつずらしながら前記評価関数の演算を行い、画素の移動距離ごとに前記評価関数の演算結果の総和の平均値を算出して、それぞれの平均値が最小となるときの前記所定の方向及び前記所定の方向に直交する方向における画素の移動距離に基づいて前記グローバルベクトルを求め、
    前記信頼性判定手段は、前記それぞれの平均値の最小値と前記所定の閾値とを比較することによって前記グローバルベクトルの信頼性が高いか否かを判定することを特徴とする請求項1または2記載の動きベクトル検出装置。
  4. さらに、前記動きベクトル探索手段によって検出された動きベクトルを保存する保存手段を有し、
    前記探索領域設定手段が、前記グローバルベクトルの信頼性が高くないと判定された場合、前記保存手段に保存された、前記現画像における一つ前のマクロブロックで検出された動きベクトルが指す位置の周辺に前記探索領域を設定することを特徴とする請求項1乃至3のいずれか1項記載の動きベクトル検出装置。
  5. 前記探索領域設定手段が、前記グローバルベクトルの信頼性が高くないと判定された場合、ゼロ動きベクトル又は予め定義された動きベクトルが指す位置の周辺に前記探索領域を設定することを特徴とする請求項1乃至3のいずれか1項記載の動きベクトル検出装置。
  6. 前記信頼性判定手段は、前記評価関数の演算によって得られた値と、所定の複数の閾値とを比較することによって前記グローバルベクトルの信頼性の高さを3つ以上に分類して判定し、
    前記信頼性判定手段によって判定された前記グローバルベクトルの信頼性が低くなるにつれて、前記探索領域設定手段が前記探索領域を段階的に拡大するとともに、前記動きベクトル探索手段が前記探索領域内の探索精度を段階的に低下させることを特徴とする請求項1乃至3のいずれか1項記載の動きベクトル検出装置。
  7. 前記探索領域に対応する参照画像を保存するバッファ手段をさらに有し、
    前記バッファ手段は、前記信頼性判定手段によって判定された前記グローバルベクトルの信頼性が低くなるにつれて、保存すべき前記探索領域に対応する参照画像の解像度を段階的に低くすることを特徴とする請求項6記載の動きベクトル検出装置。
  8. 請求項1乃至請求項7のいずれか1項に記載の動きベクトル検出装置を用いて動きベクトルを検出し、当該動きベクトルを用いて前記現画像の動き補償圧縮符号化を行う動き補償圧縮符号化装置。
  9. 現画像を構成する複数のマクロブロックの各々について、参照画像に設定された探索領域内で探索することにより、前記複数のマクロブロックの各々の動きベクトルを検出する動きベクトル検出方法であって、
    前記現画像と前記参照画像の画素値の差分の演算を含んだ評価関数を演算することによって、前記現画像と前記参照画像の空間的な位置の差を示すグローバルベクトルを求めるグローバルベクトル決定ステップと、
    前記評価関数の演算によって得られた値と所定の閾値とを比較して、前記グローバルベクトルの信頼性が高いか否かを判定する信頼性判定ステップと、
    前記信頼性判定ステップによって前記グローバルベクトルの信頼性が高いと判定された場合、前記グローバルベクトルが指す位置の周辺に前記探索領域を設定し、前記グローバルベクトルの信頼性が高くないと判定された場合には、予め定められた動きベクトルが指す位置の周辺に前記探索領域を設定する探索領域設定ステップと、
    前記現画像の複数のマクロブロックの各々について、前記探索領域設定ステップによって設定された探索領域内で探索し、当該マクロブロックに対する動きベクトルを検出する動きベクトル探索ステップとを有することを特徴とする動きベクトル検出方法。
  10. コンピュータを請求項1乃至請求項7のいずれか1項に記載の動きベクトル検出装置の各手段として機能させるためのプログラム。
  11. 請求項10記載のプログラムを格納したコンピュータ読み取り可能な記録媒体。
JP2004174604A 2004-06-11 2004-06-11 動きベクトル検出装置及び方法 Expired - Fee Related JP4514203B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004174604A JP4514203B2 (ja) 2004-06-11 2004-06-11 動きベクトル検出装置及び方法
US11/142,287 US20050276328A1 (en) 2004-06-11 2005-06-02 Motion vector detection apparatus and method
US14/598,995 US20150201209A1 (en) 2004-06-11 2015-01-16 Motion vector detection apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004174604A JP4514203B2 (ja) 2004-06-11 2004-06-11 動きベクトル検出装置及び方法

Publications (3)

Publication Number Publication Date
JP2005354528A JP2005354528A (ja) 2005-12-22
JP2005354528A5 JP2005354528A5 (ja) 2007-07-19
JP4514203B2 true JP4514203B2 (ja) 2010-07-28

Family

ID=35460488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004174604A Expired - Fee Related JP4514203B2 (ja) 2004-06-11 2004-06-11 動きベクトル検出装置及び方法

Country Status (2)

Country Link
US (2) US20050276328A1 (ja)
JP (1) JP4514203B2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363717B2 (en) * 2005-05-17 2013-01-29 Canon Kabushiki Kaisha Image processing apparatus
EP1841232A1 (en) * 2006-03-31 2007-10-03 Sony Deutschland Gmbh Method and apparatus to improve the convergence speed of a recursive motion estimator
FR2907301A1 (fr) * 2006-10-12 2008-04-18 Thomson Licensing Sas Procede d'interpolation d'une image compensee en mouvement et dispositif pour la mise en oeuvre dudit procede
JP4857243B2 (ja) * 2007-11-05 2012-01-18 キヤノン株式会社 画像符号化装置及びその制御方法、コンピュータプログラム
US8938005B2 (en) 2007-11-05 2015-01-20 Canon Kabushiki Kaisha Image encoding apparatus, method of controlling the same, and computer program
JP5220482B2 (ja) * 2008-05-30 2013-06-26 株式会社豊田中央研究所 対象物検出装置及びプログラム
JP5517436B2 (ja) * 2008-10-31 2014-06-11 キヤノン株式会社 動きベクトル検出装置及びプログラム
JP4564564B2 (ja) 2008-12-22 2010-10-20 株式会社東芝 動画像再生装置、動画像再生方法および動画像再生プログラム
WO2010140338A1 (ja) * 2009-06-01 2010-12-09 パナソニック株式会社 画像符号化装置、方法、集積回路、プログラム
JP2011097572A (ja) 2009-09-29 2011-05-12 Canon Inc 動画像符号化装置
CN102378002B (zh) * 2010-08-25 2016-05-04 无锡中感微电子股份有限公司 动态调整搜索窗的方法及装置、块匹配方法及装置
KR101491591B1 (ko) * 2012-11-05 2015-02-09 주식회사 케이티 웹앱 가상화 서비스를 제공하는 가상화 서버 및 웹앱 가상화 서비스 제공을 위한 데이터 전송방법
JP6395506B2 (ja) * 2014-08-22 2018-09-26 キヤノン株式会社 画像処理装置および方法、プログラム、並びに撮像装置
US20160191945A1 (en) * 2014-12-24 2016-06-30 Sony Corporation Method and system for processing video content
JP6663201B2 (ja) 2015-10-27 2020-03-11 キヤノン株式会社 画像符号化装置及びその制御方法、並びに、コンピュータプログラム及び記憶媒体
US10003821B2 (en) 2015-10-27 2018-06-19 Canon Kabushiki Kaisha Image encoding apparatus and method of controlling same
EP3255607B1 (en) * 2016-06-08 2020-05-13 Esaote S.p.A. Method and system for estimating motion between images, particularly in ultrasound spatial compounding
JP6875802B2 (ja) 2016-08-22 2021-05-26 キヤノン株式会社 画像符号化装置及びその制御方法及び撮像装置及びプログラム
US10812823B2 (en) * 2018-07-11 2020-10-20 Apple Inc. Global motion vector video encoding systems and methods
EP3912354A4 (en) * 2019-03-08 2022-03-16 Huawei Technologies Co., Ltd. SEARCH REGION FOR MOTION VECTOR REFINEMENT
US11330296B2 (en) 2020-09-14 2022-05-10 Apple Inc. Systems and methods for encoding image data
JP2022122682A (ja) 2021-02-10 2022-08-23 キヤノン株式会社 画像符号化装置及びその制御方法及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0262178A (ja) * 1988-08-26 1990-03-02 Fujitsu Ltd 画像処理装置の動き検出方式
JPH0965339A (ja) * 1995-08-18 1997-03-07 Mitsubishi Electric Corp 画像ブロック動き検出装置
JPH11113003A (ja) * 1997-08-07 1999-04-23 Matsushita Electric Ind Co Ltd 動きベクトル検出装置および動きベクトル検出方法
JPH11308617A (ja) * 1998-04-23 1999-11-05 Hitachi Ltd ディジタル画像符号化装置とこれに用いる動きベクトル検出装置
JP2000278694A (ja) * 1999-03-19 2000-10-06 Canon Inc 符号化装置、画像処理装置、画像処理システム、符号化方法、及び記憶媒体
JP2001169288A (ja) * 1999-12-07 2001-06-22 Nec Corp 動きベクトル探索装置および方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0896300B1 (en) * 1997-08-07 2002-01-30 Matsushita Electric Industrial Co., Ltd. Device and method for motion vector detection

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0262178A (ja) * 1988-08-26 1990-03-02 Fujitsu Ltd 画像処理装置の動き検出方式
JPH0965339A (ja) * 1995-08-18 1997-03-07 Mitsubishi Electric Corp 画像ブロック動き検出装置
JPH11113003A (ja) * 1997-08-07 1999-04-23 Matsushita Electric Ind Co Ltd 動きベクトル検出装置および動きベクトル検出方法
JPH11308617A (ja) * 1998-04-23 1999-11-05 Hitachi Ltd ディジタル画像符号化装置とこれに用いる動きベクトル検出装置
JP2000278694A (ja) * 1999-03-19 2000-10-06 Canon Inc 符号化装置、画像処理装置、画像処理システム、符号化方法、及び記憶媒体
JP2001169288A (ja) * 1999-12-07 2001-06-22 Nec Corp 動きベクトル探索装置および方法

Also Published As

Publication number Publication date
JP2005354528A (ja) 2005-12-22
US20050276328A1 (en) 2005-12-15
US20150201209A1 (en) 2015-07-16

Similar Documents

Publication Publication Date Title
JP4514203B2 (ja) 動きベクトル検出装置及び方法
US7027509B2 (en) Hierarchical hybrid shot change detection method for MPEG-compressed video
US8064522B2 (en) Motion-vector detecting device, motion-vector detecting method, and computer program
EP1779662B1 (en) Method and device for motion estimation and compensation for panorama image
US8229233B2 (en) Method and apparatus for estimating and compensating spatiotemporal motion of image
KR100843418B1 (ko) 화상 부호화 장치 및 화상 부호화 방법
JP2009147807A (ja) 画像処理装置
US20070092007A1 (en) Methods and systems for video data processing employing frame/field region predictions in motion estimation
US8363726B2 (en) Electronic apparatus, motion vector detecting method, and program therefor
US20050123039A1 (en) Motion estimation method for motion picture encoding and recording medium having program recorded thereon to implement the motion estimation method
US20050138532A1 (en) Apparatus and method for concealing errors in a frame
JP2007174202A (ja) 動きベクトル検出装置およびその方法
CN101822058A (zh) 使用像素抽取的视频编码
JP4898415B2 (ja) 動画像符号化装置及び動画像符号化方法
JP2005167976A (ja) 動きベクトル検出装置及び動きベクトル検出プログラム
US6754278B1 (en) Method for recovering moving picture by extending a damaged region in which an error occurs
JP4677351B2 (ja) 動き補償器、動き補償処理方法、コンピュータプログラム及び記憶媒体
JP4235209B2 (ja) 動きベクトル検出装置および動きベクトル検出方法
JP4507896B2 (ja) 動画像圧縮装置と動画像圧縮処理方法
JP4429996B2 (ja) 動画像符号化プログラム、動画像符号化方法および動画像符号化装置
JP2008072608A (ja) 画像符号化装置及び画像符号化方法
US20150365681A1 (en) Method of encoding and decoding video stream for image compression
JP5247210B2 (ja) 動画像符号化装置及び動画像符号化方法
JP2008258769A (ja) 画像符号化装置及びその制御方法、並びに、コンピュータプログラム
JP2006042114A (ja) 動きベクトル検出装置及び検出プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070604

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070604

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100507

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100510

R150 Certificate of patent or registration of utility model

Ref document number: 4514203

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140521

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees