JP5492223B2 - 動きベクトル検出装置及び方法 - Google Patents

動きベクトル検出装置及び方法 Download PDF

Info

Publication number
JP5492223B2
JP5492223B2 JP2011545919A JP2011545919A JP5492223B2 JP 5492223 B2 JP5492223 B2 JP 5492223B2 JP 2011545919 A JP2011545919 A JP 2011545919A JP 2011545919 A JP2011545919 A JP 2011545919A JP 5492223 B2 JP5492223 B2 JP 5492223B2
Authority
JP
Japan
Prior art keywords
vector
block
hierarchy
motion vector
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011545919A
Other languages
English (en)
Other versions
JPWO2011074121A1 (ja
Inventor
琢麿 山本
直 三島
泰豊 武山
敏充 金子
利幸 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of JPWO2011074121A1 publication Critical patent/JPWO2011074121A1/ja
Application granted granted Critical
Publication of JP5492223B2 publication Critical patent/JP5492223B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C11/00Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor
    • G11C11/56Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using storage elements with more than two stable states represented by steps, e.g. of voltage, current, phase, frequency
    • G11C11/5621Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using storage elements with more than two stable states represented by steps, e.g. of voltage, current, phase, frequency using charge storage in a floating gate
    • G11C11/5642Sensing or reading circuits; Data output circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/223Analysis of motion using block-matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C2211/00Indexing scheme relating to digital stores characterized by the use of particular electric or magnetic storage elements; Storage elements therefor
    • G11C2211/56Indexing scheme relating to G11C11/56 and sub-groups for features not covered by these groups
    • G11C2211/563Multilevel memory reading aspects
    • G11C2211/5634Reference cells

Description

本発明は、動画像符号化等の画像処理に用いられる動きベクトルを動画像データから検出する動きベクトル検出装置及び方法に関する。
従来、動画像処理における基礎的な処理として、異なる時刻のフレーム間での物体の移動方向及び大きさを示す動きベクトルを検出する動き探索がある。動き探索は、例えば、動画像のフレーム間に新たなフレームを内挿することでフレームレートを向上させるフレーム補間処理、動画像符号化、カメラの手ぶれ補正等に利用される。
特許文献1には、動画像データに含まれるフレームを複数のブロックに分割して、ブロック毎に動きベクトルを検出する方法が開示されている。しかしながら、フレーム中に、ブロックのサイズより大きくかつ輝度変化の殆ど無いフラットな領域が存在する場合、動きベクトルを検出する精度が低下する問題がある。
また、特許文献2に開示される方法では、フレームを階層化し、動きベクトルを検出する対象となる階層よりも上位階層において既に検出済みの動きベクトルを、特許文献1で説明した候補ベクトルにさらに加えて動きベクトルを検出している。しかしながら、上位階層で誤検出が発生した場合、それらを候補ベクトルとして決定された下位階層の動きベクトルも誤検出されることがある問題がある。
特許第3147893号公報 特開2004−241880号公報
本発明は、上記問題点を解決するためになされたものであり、動きベクトルを精度良く検出することができる動きベクトル検出装置及び方法を提供することを目的とする。
本発明の一態様に係る動きベクトル検出装置は、
第1の画像及び前記第1の画像とは異なる時刻に表示すべき第2の画像の夫々に対して、設定されるブロックの数を示す解像度が異なる複数の階層を生成する階層化部と、
前記第1の画像に対応するいずれかの階層内の注目ブロックで、前記注目ブロックの属する階層内の第1の参照ブロックに対して、割り当てられている動きベクトルを空間候補ベクトルとして抽出する第1の抽出部と、
前記第1及び第2の画像とは異なる時刻に表示すべき第3の画像に対応する前記注目ブロックの属する階層と同じ階層内の第2の参照ブロックに対して、割り当てられている動きベクトルを時間候補ベクトルとして抽出する第2の抽出部と、
前記第1の画像に対応する階層であって、前記注目ブロックの属する階層よりも前記解像度が低い階層内の第3の参照ブロックに対して割り当てられている動きベクトルを階層候補ベクトルとして抽出する第3の抽出部と、
前記注目ブロックに、前記空間候補ベクトル、時間候補ベクトル及び階層候補ベクトル夫々を割り当てることで特定される前記第2の画像に対応するブロックと、前記注目ブロックとの相関をブロック相関に基づいて前記注目ブロックに割り当てる動きベクトルを決定する動きベクトル決定部と、
を具備することを特徴とする。
動きベクトルを精度良く検出することできる。
一実施形態に係る動きベクトル検出装置の構成例を示すブロック図である。 最適ベクトル決定部の構成例を示すブロック図である。 ベクトルメモリ及び階層ベクトルメモリの記憶領域を示す模式図である。 ベクトルメモリ及び階層ベクトルメモリの記憶領域を抜粋して示す模式図である。 空間候補抽出部、時間候補抽出部及び階層候補抽出部により選定される参照ブロックを示す模式図である。 探索部が最適候補ベクトルから最適ベクトルを決定する方法を説明する図である。 誤検出された動きベクトルが再帰処理により訂正される例を示す図である。 ベクトルメモリ及び階層ベクトルメモリの動作を説明する図である。 ベクトルメモリ及び階層ベクトルメモリの動作を説明するため図である。 ベクトルメモリ及び階層ベクトルメモリの動作を説明する図である。 ベクトルメモリ及び階層ベクトルメモリの動作を説明する図である。 ベクトルメモリ及び階層ベクトルメモリの動作を説明する図である。 ベクトルメモリ及び階層ベクトルメモリの動作を説明する図である。 動きベクトルを検出する手順の一例を示すフローチャートである。 最適ベクトル決定部が、最適ベクトルを決定する手順の一例を示す図である。
以下、必要に応じて図面を参照しながら、本発明の一実施形態に係る動きベクトル検出装置を説明する。なお、以下の実施形態では、同じ番号を付した部分については同様の動作を行うものとして、重ねての説明を省略する。
図1は、一実施形態に係る動きベクトル検出装置の構成を概略的に示している。この動きベクトル検出装置は、図1に示されるように、最適ベクトル決定部101、ベクトルメモリ102、階層ベクトルメモリ103、空間候補抽出部104、時間候補抽出部105、及び階層候補抽出部106を備えている。
最適ベクトル決定部101は、図示しない外部装置から動画像データを受け取り、動画像データに含まれる複数のフレーム(静止画像)を一時的に保持する。また、最適ベクトル決定部101は、保持しているフレームを所定サイズのブロックに分割し、分割したブロック毎に動きベクトルを演算により決定する。ブロックは、複数の画素を含む。一例として、ブロックのサイズは、5画素×5画素に設定される。
本明細書では、動きベクトルを検出する対象となっているブロックを注目ブロックと称す。注目ブロックに対して割り当てるべき動きベクトルは、最適ベクトル決定部101によって、後に説明される空間候補ベクトル、時間候補ベクトル及び階層候補ベクトルに基づいて決定される。この動きベクトルは、基準となるフレームと、このフレームとは異なる時間に表示すべきフレームとの間におけるブロック毎のシフト量及びその方向を示す。
さらに、最適ベクトル決定部101は、フレームを縮小して複数の縮小画像を生成し、フレームを階層化する。各階層の縮小画像は、所定サイズのブロックに分割され、分割されたブロック毎に動きベクトルが決定される。最適ベクトル決定部101で決定された動きベクトルは、最適ベクトルとしてベクトルメモリ102へ送られる。
ベクトルメモリ102は、最適ベクトル決定部101から受け取った動きベクトルを、ブロックの位置を示す情報と関連づけて記憶する。ある階層内の全てのブロックの動きベクトルが決定されると、ベクトルメモリ102に記憶されているこれらの動きベクトルは、階層ベクトルメモリ103へ送られる。階層ベクトルメモリ103は、ベクトルメモリ102から受け取った動きベクトルを、階層及びブロックの位置を示す情報に関連づけて記憶する。
空間候補抽出部(第1の抽出部)104は、注目ブロックが属している階層内のブロックのうちの、注目ブロックの位置に応じた所定範囲内のブロックを、参照ブロックとして選定する。また、空間候補抽出部104は、選定した参照ブロックに割り当てられている動きベクトルを空間候補ベクトルとして、ベクトルメモリ102から抽出する。
時間候補抽出部(第2の抽出部)105は、注目ブロックを含むフレームとは異なる時刻に表示すべきフレームに含まれるブロックであって、注目ブロックが属している階層と同じ階層内のブロックのうちの、注目ブロックの位置に応じた所定範囲内のブロックを、参照ブロックとして選定する。また、時間候補抽出部105は、選定した参照ブロックに割り当てられている動きベクトルを時間候補ベクトルとして、階層ベクトルメモリ103から抽出する。
階層候補抽出部(第3の抽出部)106は、注目ブロックが属している階層より上位の階層内のブロックのうちの、注目ブロックの位置に応じた所定範囲内のブロックを参照ブロックとして選定する。また、階層候補抽出部106は、選定した参照ブロックに割り当てられている動きベクトルを階層候補ベクトルとして、階層ベクトルメモリ103から抽出する。
上述した空間候補抽出部104、時間候補抽出部105及び階層候補抽出部106で抽出された各候補ベクトルは、最適ベクトル決定部101に送られる。この後の最適ベクトル決定部101の処理の詳細は以下に示される。
図2は、最適ベクトル決定部101の構成を概略的に示している。最適ベクトル決定部101は、図2に示されるように、外部装置から受信した動画像データに含まれるフレームから縮小画像を生成する縮小画像生成部201と、ブロックマッチング等によって候補ベクトルから最適候補ベクトルを選択する最適候補選択部202と、選択された最適候補ベクトルに基づいて最適ベクトルを探索する探索部203と、を備えている。また、最適候補選択部202及び探索部203をまとめて動きベクトル決定部204と称す。
図2に示される縮小画像生成部(階層化部ともいう)201は、フレームを縮小して所定数(例えば、L−1個)の縮小画像を生成し、フレームを階層化する。この縮小画像生成部201は、階層毎に予め設定された解像度に応じて、原画像であるフレームを縮小して縮小画像を生成する。本明細書では、解像度とは、画像を分割するブロックの数を意味する。例えば、動画像データに含まれるフレームのサイズが500画素×500画素、ブロックサイズが5画素×5画素、階層数Lが3である場合を想定すると、第3階層の解像度は、100ブロック×100ブロックとなる。また、この例において、第3階層の画像を縦及び横方向に1/2に縮小して、第2階層の画像を生成すると、第2階層の解像度は、50ブロック×50ブロックとなる。同様にして、第1階層の解像度は、25ブロック×25ブロックとなる。
ここで、階層化されたフレームにおいて、最も解像度の低い縮小画像を第1階層と称し、解像度の低い順に第2階層、第3階層等と称す。また、階層化されたフレームでは、解像度が低い方を上位、解像度が高い方を下位とする。この場合、第1階層が最も上位の階層となる。
図3は、時刻tに表示されるフレーム301、及び時刻tより前の時刻t−1に表示されるフレーム311の夫々に関して、動きベクトルが割り当てられている様子を示している。時刻tのフレーム301は、動きベクトルを検出する対象となっているフレームを示し、第1のフレーム、注目フレームとも称す。第1のフレーム301に対応する各ブロックに割り当てられている動きベクトルは、時刻t+1のフレーム(第2のフレームともいう)に対する動きベクトルを示す。
時刻t−1のフレーム311は、時間候補ベクトルを抽出する対象となるフレームを示し、第3のフレームとも称す。また、第3のフレーム311に対応する各ブロックに割り当てられている動きベクトルは、第1のフレーム301に対する動きベクトルを示す。第1、第2及び第3のフレームは、互いに異なる時刻に表示されるフレームであればよく、第2及び第3のフレームは、夫々、第1のフレームより前の時刻に表示されるフレームであってもよく、注目フレームより後の時刻に表示されるフレームであってもよい。
図3に示される例では、第1のフレーム301では、第h階層に注目ブロックが位置している。第1のフレーム301においては、第1階層から第h−1階層までの各ブロックの動きベクトルが決定されていて、第h階層は、動きベクトルが既に決定されているブロックと、動きベクトルがまだ決定されていないブロックとを含んでいる。第3のフレーム311においては、各階層の各ブロックの動きベクトルが既に決定されている。本実施形態では、既に決定されている空間候補ベクトル、時間候補ベクトル及び階層候補ベクトルが再帰的に伝搬されて各ブロックの動きベクトルが算出される。
生成された縮小画像は、図2に示される縮小画像生成部201に一時的に保持される。一例として、縮小画像生成部201は、フレームに対してガウシアンフィルタ等による平滑化処理を行った後に、縮小を繰り返すことで、異なる解像度の画像を生成する。階層化されたフレームは、最適候補選択部202及び探索部203へ送られる。
なお、フレームの階層化は、上述したような縮小画像生成部201で原画像を縮小する例に限定されず、より上位の階層では、より大きいブロックサイズで原画像を分割することで実現されてもよい。例えば、原画像のサイズが500画素×500画素、階層数Lが3である場合を想定すると、原画像のサイズを変更せずに、ブロックサイズを、第3階層では、5画素×5画素とし、第2階層では、10画素×10画素とし、第1階層では、20画素×20画素と設定してもよい。このようにしても、階層毎に異なる解像度の画像を生成することができる。
ここで、図3及び図4を参照して、各候補ベクトルを選定する方法を説明する。
図4は、図3に示される第1のフレーム301の第h階層302及び第h−1階層303、並びに第3のフレーム311の第h階層312を抜き出して示している。図2の最適候補選択部202は、上位の階層から順番に、即ち、第1階層から第L階層へ向かって階層毎に動きベクトルを決定する。図4に示されるように、一例として、各階層では、各ブロックの動きベクトルは、左上に位置されるブロックから右下に位置されるブロックに向けて順番に決定される。より具体的には、最も上段の行において、左から右に向かって各ブロックの動きベクトルを決定し、1つ下の行に移行して左から右に向かって各ブロックの動きベクトルを決定する。本明細書では、フレームが表示装置に表示される際の走査線方向に対応する方向を水平方向とし、信号線方向に対応する方向を垂直方向として、上下左右、行及び列を定義する。
第1のフレーム301の第h階層302では、図4に示されるように、例えば、注目ブロック304の左及び上のブロック305、306が参照ブロック(図3及び図4では、空間候補ブロックと示される)として選定される。空間候補抽出部104は、下記数式1のように、参照ブロック305、306に割り当てられている動きベクトルを空間候補ベクトルの集合Cとして抽出する。
Figure 0005492223
ここで、u (x)は、第1のフレーム301の第h階層302において、位置ベクトルxで特定されるブロックの動きベクトルを示し、bは、注目ブロック304の位置ベクトルを示す。図4に示される注目ブロック304の位置は、例えば、b=(4,3)と表される。ここで、Tは、転置を意味する。なお、記号C、u、b及びx、並びに以下に示される記号B及びe等は、各々ベクトルを示し、数式中では太字で示されている。
なお、空間候補ベクトルは、数式1に示される例に限定されず、注目ブロック304の近傍のブロックであって、動きベクトルが既に決定されているブロックであれば、どのブロックから抽出されてもよい。例えば、空間候補抽出部104は、下記数式2のように、注目ブロック304の左斜め上及び右斜め上に隣接するブロックに割り当てられている動きベクトルを、空間候補ベクトルの集合C´として抽出してもよい。
Figure 0005492223
他の例では、上述の集合Csと集合C´との和集合(C∪C´)が、空間候補ベクトルの集合に設定されてもよい。さらに他の例では、集合Csは、ゼロベクトルを含んでもよい。また、例えば、階層内で最初に動きベクトルが決定される左上のブロックが注目ブロックである場合、空間候補ベクトルの集合は、空集合となるか、或いは、ゼロベクトルを含む。
第3のフレーム311の第h階層312では、例えば、注目ブロック304と同じ位置ベクトルで特定されるブロック313、並びにこのブロック313の右及び下のブロック314、315が参照ブロック(図3及び図4では、時間候補ブロックと示される)として選定される。時間候補抽出部105は、下記数式3のように、参照ブロック313、314、315に割り当てられている動きベクトルを、時間候補ベクトルの集合Cとして抽出する。
Figure 0005492223
なお、時間候補ベクトルは、数式3に示される例に限定されず、異なる時刻のフレームにおいて、注目ブロック304に対応する位置の近傍のブロックであればどのブロックから抽出されてもよい。例えば、時間候補抽出部105は、下記数式4のように、第3のフレーム311の第h階層312において、注目フレームに対応する参照ブロック313に割り当てられている動きベクトル、並びにこの参照ブロック313の右斜め下及び左斜め下のブロックに割り当てられている動きベクトルを、時間候補ベクトルの集合C´として抽出してもよい。
Figure 0005492223
他の例では、上述の集合Cと集合C´との和集合(Ct∪C´t)が時間候補ベクトルの集合に設定されてもよい。
さらに、第1フレーム301の第h−1階層303では、注目ブロック304に対応するブロック307が参照ブロック(図3及び図4では、階層候補ブロックと示される)として選定される。階層候補抽出部106は、下記数式5に従って、注目ブロック304の属する階層より一つ上の階層である第h−1階層303内の参照ブロック307に割り当てられている動きベクトルを階層候補ベクトルの集合Cとして抽出する。
Figure 0005492223
また、kは、縮小画像の縮小率を示す。第h−1階層303は、第h階層302と比較して縮小率kだけ縮小されているため、抽出された動きベクトルは、係数1/kを掛けて第h階層302に対応するように伸長される。
なお、階層候補ベクトルは、数式5に示される例に限定されず、上位階層における注目ブロック304に対応する位置の近傍のブロックであれば、どのブロックから抽出されてもよい。例えば、階層候補抽出部106は、下記数式6のように、第1のフレーム301の第h−1階層313に含まれるブロックであって、注目フレームに対応するブロック307に割り当てられている動きベクトル、並びにこのブロック307の上下左右に隣接するブロックに割り当てられている動きベクトルを、階層候補ベクトルの集合C´として抽出してもよい。
Figure 0005492223
さらに、階層候補抽出部106は、複数の上位階層から階層候補ベクトルを選定してもよく、例えば、下記数式7のように、第h−1階層313及び第h−2階層に含まれるブロックであって、注目ブロックに対応するブロックに割り当てられている動きベクトルを階層候補ベクトルの集合C″として抽出してもよい。
Figure 0005492223
上述のようにして、例えば数式1、数式3及び数式5に従って参照ブロックが図5に示されるように選定され、これら参照ブロックに割り当てられている動きベクトルが候補ベクトルとして抽出される。抽出された各候補ベクトルは、最適候補選択部202へ送られる。
次に、図2に示される最適候補選択部202が、候補ベクトルの中から注目ブロックに割り当てるべき最適候補ベクトルを選定する方法を説明する。
最適候補選択部202は、空間候補抽出部104から空間候補ベクトルを、時間候補抽出部105から時間候補ベクトルを、階層候補抽出部106から階層候補ベクトルを受け取る。
最適候補選択部202は、注目ブロックと、注目ブロックの位置ベクトル及び抽出された候補ベクトルで特定される第2のフレームに対応するブロックとの相関をブロック相関に基づいて算出する。そして、最適候補選択部202は、相関値が最も大きくなる候補ベクトルを特定し、特定した候補ベクトルを下記数式8に示される最適候補ベクトルとして選択する。
Figure 0005492223
最適候補選択部202は、例えば下記数式9のように、複数の候補ベクトルのうちの、評価関数D(b,u)の値を最も小さくする候補ベクトルを、数式8の最適候補ベクトルとして選択する。
Figure 0005492223
ここで、C=C∪C∪Cであり、D(b,u)は、動きベクトルuに対する評価関数を示す。評価関数D(b,u)は、例えば、下記数式10で定義される。
Figure 0005492223
ここで、Isrc(x)は、第1のフレーム301に対応するブロックであって、位置ベクトルxで特定されるブロックの画素値を示し、Idst(x)は、第3のフレームに対応するブロックであって、位置ベクトルxで特定されるブロックの画素値を示し、B(b)は、位置ベクトルbで特定されるブロック内の画素の位置ベクトルの集合を示す。また、|A|は、Aがスカラー値のときはAの絶対値を意味し、Aが集合のときはAの要素数を意味する。ブロック間の相関を評価するための画素値は、輝度であってもよく、或いは、赤と緑と青に関する色の情報を示すRGB空間での値であってもよい。
なお、上記の評価関数では、画素値の差の絶対値を合計しているが、これに限定されず、例えば、画素値の差を二乗したものを合計してもよい。さらに、上記評価関数では、画素値の差の絶対値の合計を要素数で除算しているが、除算しなくてもよい。
画像中において、多くの場合、注目ブロックの近傍は、輝度分布が類似したブロックが存在すると仮定されるが、物体境界ではこの仮定が成り立たないことがある。そこで、下記数式11のように、注目ブロックと参照ブロックとの相関をペナルティ項(重みともいう)αとして評価関数に加えることで、注目ブロックと類似したブロックの候補ベクトルを選択されやすくする。従って、重みαを加えることにより、注目ブロックと相関の高い参照ブロックが優先的に選択されるようになる。
Figure 0005492223
ここで、重みαは、注目ブロックと参照ブロックとの相関を示し、eは注目ブロックから見た参照ブロックへの位置ベクトルを示す。例えば、注目ブロック304の上のブロック306を候補ベクトルuとして参照する場合、重みαは、下記数式12のように表すことができる。
Figure 0005492223
なお、重みαは、数式12に示される例に限定されず、絶対値を二乗して算出されてもよく、或いは、下記数式13のように正規化されてもよい。
Figure 0005492223
探索部203は、図6に示されるように、数式8の最適候補ベクトルに基づいて局所領域内を探索して、下記数式14に示される最適ベクトルを決定する。
Figure 0005492223
具体的には、探索部203は、下記数式15のように、最適候補ベクトル、及びこの最適候補ベクトルを微小変化させて生成した複数の局所ベクトルの中から、評価関数を最小にする局所ベクトルを数式14に示される最適ベクトルに決定する。
Figure 0005492223
ここで、局所ベクトルの集合Cは、例えば下記数式16のように、下記数式17に示される最適候補ベクトル、及びこの最適候補ベクトルの上下左右方向に微小変化した局所ベクトルを含む。
Figure 0005492223
Figure 0005492223
ここで、εは微小定数である。例えば、εは、画素間の距離を示す。
なお、局所ベクトルの集合Cは、数式16に示される例に限定されず、下記数式18のように、探索範囲をより広く設定されてもよい。
Figure 0005492223
また、上述したように、最適候補ベクトルを選択した後に局所探索を行うのではなく、下記数式19及び数式20のように、全ての候補ベクトルに関して局所探索して最適ベクトルが決定されてもよい。この場合、最適候補ベクトルを選定することなく、最適ベクトルが決定されることとなる。
Figure 0005492223
Figure 0005492223
上述のように、最適ベクトル決定部101では、空間候補ベクトル、時間候補ベクトル及び階層候補ベクトルを含む候補ベクトルに基づいて、注目ブロックの動きベクトルが決定される。
本実施形態に係る動きベクトル検出装置においては、各階層の各ブロックの動きベクトルの算出に、空間候補ベクトル、時間候補ベクトル及び階層候補ベクトルのうちのいずれか1つを最適候補ベクトルとして選定することで、精度良く動きベクトルを決定することができる。一例として、図7に示されるように、第1のフレーム701の第2階層703に位置されるブロック706の動きベクトルを算出する場合、第2階層703から抽出される空間候補ベクトル、及び第1階層704から抽出される階層候補ベクトルが誤って算出されていたとしても、第3のフレーム711の第2階層713から抽出された時間候補ベクトルを選択することで、このブロック706の動きベクトルを正確に算出することができる。また、第3階層702のブロック705において、第2階層703のブロック706の動きベクトルを階層候補ベクトルとして参照することで、第1のフレーム701の第3階層702から抽出された空間候補ベクトル、及び第3のフレーム711の第3階層712から抽出された時間候補ベクトルが誤っていたとしても、動きベクトルを正確に算出することができる。
このように、本実施形態に係る動きベクトル検出装置においては、算出された動きベクトルを次のブロックの計算に使用する再帰処理を行うことによって、漸次的に動きベクトルの誤りを減少させることができる。さらに、再帰処理を空間、時間、階層にわたって逐次行うことにより誤りの少ない動きベクトルを推定することができる。
次に、図8Aから図8Fを参照して、ベクトルメモリ102及び階層ベクトルメモリ103の構造を具体的に説明する。
ベクトルメモリ102は、注目ブロックを含む階層の各ブロックの動きベクトルを一時的に保存する。このため、ブロック数が最も多い階層、即ち、最も下位の階層に含まれるブロックの数だけ動きベクトルを格納可能な容量が用意されればよい。上述した例のように、最も下位の階層である第3階層の解像度が100ブロック×100ブロックである場合、ベクトルメモリ102には、10000個の動きベクトルを格納することができる容量が用意されればよい。ベクトルメモリ102では、動きベクトルは、ブロックの位置を示す情報と関連づけて記憶される。
階層ベクトルメモリ103は、階層毎に動きベクトルを記憶するための領域が割り当てられ、決定された動きベクトルを階層毎に記憶する。上述した例のように、最も下位の階層である第3階層の解像度が100ブロック×100ブロック、第2階層の解像度が50ブロック×50ブロック、第1階層の解像度が25ブロック×25ブロックである場合、階層ベクトルメモリ103は、合計13125個の動きベクトルを格納可能な容量が用意されればよい。階層ベクトルメモリ103では、動きベクトルは、階層及びブロックの位置を示す情報と関連づけて記憶される。
図8Aから図8Fでは、簡単にするために、階層数Lが3であり、第1階層が3ブロック×3ブロックに分割され、第2階層が4ブロック×4ブロックに分割され、第3階層が6ブロック×6ブロックに分割される場合における、ベクトルメモリ102及び階層ベクトルメモリ103の動作例が示されている。
図8Aに示されるように、時刻tのフレームの第1階層において注目ブロックの動きベクトルを算出しているときには、階層ベクトルメモリ103には、時刻t−1のフレームの第1から第3階層の各ブロックにおいて算出された動きベクトルが格納されている。最適候補選択部202は、空間候補ベクトル、時間候補ベクトル及び階層候補ベクトルを参照して、第1階層内の各ブロックの動きベクトルを算出する。第1階層内のブロックの動きベクトルを算出する場合、第1階層より上位の階層が存在しないために、仮想的な階層が存在するものとして、参照する階層候補ベクトルはゼロベクトルとする。時間候補ベクトルは、階層ベクトルメモリ103に割り当てられた第1階層用の領域から抽出される。
図8Bに示されるように、第1階層内の全てのブロックの動きベクトルが決定されると、ベクトルメモリ102に記憶されている情報が階層ベクトルメモリ内の第1階層用の領域へコピーされる。従って、階層ベクトルメモリ103では、第1階層用の領域には、時刻tのフレームに関連する動きベクトルが記憶され、第2及び第3階層用の領域には、時刻t−1のフレームに関連する動きベクトルが記憶されている。ベクトルメモリ102内の情報は、コピー終了後に消去されてもよく、或いは、次の第2階層に関する情報で上書きされてもよい。
図8Cに示されるように、第2階層内のブロックの動きベクトルを算出するときには、階層ベクトルメモリ103に割り当てられた第1階層用の領域から階層候補ベクトルが抽出され、階層ベクトルメモリ103に割り当てられた第2階層用の領域から時間候補ベクトルが抽出され、ベクトルメモリ102から空間候補ベクトルが抽出される。図8Dに示されるように、第2階層内の全てのブロックの動きベクトルが決定されると、ベクトルメモリ102に記憶されている情報が階層ベクトルメモリ内の第2階層用の領域へコピーされる。
続いて、図8Eに示されるように、第3階層内のブロックの動きベクトルを算出するときには、階層ベクトルメモリ103に割り当てられた第2階層用の領域から階層候補ベクトルが抽出され、階層ベクトルメモリ103に割り当てられた第3階層用の領域から時間候補ベクトルが抽出され、ベクトルメモリ102から空間候補ベクトルが抽出される。図8Fに示されるように、第3階層内の全てのブロックの動きベクトルが決定されると、ベクトルメモリ102に記憶されている情報が階層ベクトルメモリ内の第3階層用の領域へコピーされる。
時刻tのフレームの全ての階層について動きベクトルの計算が終了すると、ベクトルメモリ102に記憶されている情報、即ち、時刻tのフレームの各ブロックの動きベクトルを含む情報が外部へ出力され、次の時刻t+1のフレームの処理が開始される。ここで、時刻t+1のフレームの処理を開始するときには、階層ベクトルメモリ103に記憶されている情報は、時刻tのフレームに関連する情報になっている。
なお、上述の説明では、階層ベクトルメモリ103は、ベクトルメモリ102に記憶されている情報で随時上書きされるが、これに限定されず、階層ベクトルメモリ103の容量を増やして、複数の時刻のフレームに関連する動きベクトル情報を格納する構成としてもよい。複数の時刻のフレームに関連する動きベクトル情報を階層ベクトルメモリ103に格納することで、注目フレームの時刻と異なる時刻の複数のフレームに関連する動きベクトルを時間候補ベクトルとして抽出することができる。
次に、図9を参照して、注目フレームの各ブロックの動きベクトルを決定する手順を説明する。
まず、ステップS901において、注目ブロックが所定の順序に従って選定される。ステップS902では、空間候補抽出部104によって空間候補ベクトルが、例えば数式1又は数式2に示されるように、特定の参照ブロックから選定される。ステップS903では、時間候補抽出部105によって時間候補ベクトルが、例えば数式3又は数式4に示されるように、特定の参照ブロックから選定される。ステップS904では、階層候補抽出部106によって階層候補ベクトルが、例えば数式5、数式6又は数式7に示されるように、特定の参照ブロックから選定される。ステップS902からS904は、適宜順序を入れ替えることができる。ステップS902からS904では、空間候補ベクトル、時間候補ベクトル及び階層候補ベクトルを含む候補ベクトルが選定される。
ステップS905では、ステップS902からS904で選定された候補ベクトルに基づいて、注目ブロックの最適ベクトルが決定される。ステップS905は、図10を参照して後に説明される。ステップS906では、選定された最適ベクトルがベクトルメモリ102に記憶される。
ステップS907では、処理中の階層内の全てのブロックの動きベクトルが決定されたか否かが判断される。動きベクトルが未決定のブロックが存在する場合、ステップS901に戻され、次の注目ブロックが選定される。ステップS901からS906が繰り返されて、処理中の階層内の全てのブロックの動きベクトルが決定されると、ステップS908に進む。
ステップS908では、ベクトルメモリ102に記憶されている情報が階層ベクトルメモリ103へコピーされる。ステップS909では、注目フレームの全ての階層が処理されたか否かが判断される。即ち、注目フレームの最も下位の階層(例えば、第L階層)が処理されたか否かが判断される。未処理の階層が存在する場合、ステップS901に戻される。注目フレームの全ての階層が処理された場合、ステップS910において、ベクトルメモリ102に記憶されている情報が図示しない画像処理装置に出力され、一連の処理が終了する。
次に、図10を参照して、注目ブロックの最適ブロックを決定する手順を説明する。
まず、ステップS1001では、縮小画像生成部201によって、これから処理する階層に応じた縮小画像が生成される。このステップS1001に示される縮小画像の生成は、フレーム受信時に予め実行されてもよい。ステップS1002では、例えば数式9に示されるように、最適候補選択部202によって、注目ブロックとの相関が最も大きい参照ブロックが特定され、特定された参照ブロックの候補ベクトルが最適候補ベクトルとして選択される。ステップS1003では、例えば数式15及び数式16に示されるように、探索部203によって、選定された最適候補ベクトルに基づいて最適ベクトルが決定される。
以上のように、本実施形態に係る動きベクトル検出装置においては、既に決定された動きベクトルを使用して注目ブロックの動きベクトルを再帰的に算出することで、動きベクトルを検出する精度を向上することができる。
本発明に係る動きベクトル検出装置は、種々の分野に応用することができる。例えば、動きベクトル検出装置は、高フレームレートを実現してテレビの画質を向上させるフレーム補間技術への利用では、動画像のフレーム間に内挿するフレームを生成する際に利用される。また、本発明に係る動きベクトル検出装置の検出精度の向上は、動画像符号化における符号化効率を向上させたり、カメラの手ぶれ補正の性能を向上させることができる。さらに、本発明に係る動きベクトル検出装置は、2次元の画像情報から3次元の奥行き情報を推定する技術にも利用することができる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
上記の各実施形態に係る動きベクトル検出装置は、種々の画像処理技術、例えば、フレーム補間技術に利用することができる。
101…最適ベクトル決定部、102…ベクトルメモリ、103…階層ベクトルメモリ、104…空間候補抽出部、105…時間候補抽出部、106…階層候補抽出部、201…縮小画像生成部、202…最適候補選択部、203…探索部、204…動きベクトル決定部、301,302…フレーム、304…注目ブロック、305,306,307,313,314,315…参照ブロック

Claims (8)

  1. 第1の画像及び前記第1の画像とは異なる時刻に表示すべき第2の画像の夫々に対して、設定されるブロックの数を示す解像度が異なる複数の階層を生成する階層化部と、
    前記第1の画像に対応する全ての階層内の注目ブロックで、前記注目ブロックの属する階層内の第1の参照ブロックに対して、割り当てられている動きベクトルを空間候補ベクトルとして抽出する第1の抽出部と、
    前記第1及び第2の画像とは異なる時刻に表示すべき第3の画像に対応する前記注目ブロックの属する階層と同じ階層内の第2の参照ブロックに対して、割り当てられている動きベクトルを時間候補ベクトルとして抽出する第2の抽出部と、
    前記第1の画像に対応する階層であって、前記注目ブロックの属する階層よりも前記解像度が低い階層内の第3の参照ブロックに対して割り当てられている動きベクトルを階層候補ベクトルとして抽出する第3の抽出部であって、前記注目ブロックの属する階層が前記解像度の最も低い階層である場合には、ゼロベクトルを前記階層候補ベクトルとして使用する第3の抽出部と、
    前記注目ブロックに、前記空間候補ベクトル、時間候補ベクトル及び階層候補ベクトル夫々を割り当てることで特定される前記第2の画像に対応するブロックと、前記注目ブロックとのブロック相関に基づいて前記注目ブロックに割り当てる動きベクトルを決定する動きベクトル決定部と、
    を具備することを特徴とする動きベクトル検出装置。
  2. 前記動きベクトル決定部は、前記空間候補ベクトル、時間候補ベクトル及び階層候補ベクトルのうち前記ブロック相関が最も大きくなる1つを最適候補ベクトルに選択し、当該最適候補ベクトルを変化させて複数の局所ベクトルを生成し、当該複数の局所ベクトルのうち、当該複数の局所ベクトルの夫々で特定される前記第1及び第2の画像に対応する画素間の相関が最も大きくなる1つを最適ベクトルとして選択し、当該最適ベクトルを前記注目ブロックに割り当てることを特徴とする請求項1に記載の動きベクトル検出装置。
  3. 前記階層化部は、前記第1及び第2の画像を縮小することで、或いは、分割するブロックのサイズを変更することで、前記第1及び第2の画像を階層化することを特徴とする請求項2に記載の動きベクトル検出装置。
  4. 前記階層候補抽出部は、前記注目ブロックが属している前記階層より、上位の複数の階層から前記第3の参照ブロックを選択することを特徴とする請求項2に記載の動きベクトル検出装置。
  5. 前記動きベクトル決定部は、前記第1、第2及び第3の参照ブロックの各々と、前記注目ブロックとの相関を重みとして加えて、前記ブロック相関を算出することを特徴とする請求項2に記載の動きベクトル検出装置。
  6. 前記動きベクトル決定部は、前記空間候補ベクトル、時間候補ベクトル及び階層候補ベクトルの各々を変化させて生成される局所ベクトルを含めて、前記ブロック相関を算出して前記最適ベクトルを決定することを特徴とする請求項1に記載の動きベクトル検出装置。
  7. 前記動きベクトル決定部は、前記階層毎に動きベクトルを決定することを特徴とする請求項1に記載の動きベクトル検出装置。
  8. 第1の画像及び前記第1の画像とは異なる時刻に表示すべき第2の画像の夫々に対して、設定されるブロックの数を示す解像度が異なる複数の階層を生成し、
    前記第1の画像に対応する全ての階層内に位置する注目ブロックの属する階層内の第1の参照ブロックに対して、割り当てられている動きベクトルを空間候補ベクトルとして抽出し、
    前記第1及び第2の画像とは異なる時刻に表示すべき第3の画像に対応する前記注目ブロックの属する階層と同じ階層内の第2の参照ブロックに対して、割り当てられている動きベクトルを時間候補ベクトルとして抽出し、
    前記第1の画像に対応する階層であって、前記注目ブロックの属する階層よりも前記解像度が低い階層内の第3の参照ブロックに対して割り当てられている動きベクトルを階層候補ベクトルとして抽出し、前記注目ブロックの属する階層が前記解像度の最も低い階層である場合には、ゼロベクトルを前記階層候補ベクトルとして使用し、
    前記注目ブロックに、前記空間候補ベクトル、時間候補ベクトル及び階層候補ベクトル夫々を割り当てることで特定される前記第2の画像に対応するブロックと、前記注目ブロックとのブロック相関に基づいて前記注目ブロックに割り当てる動きベクトルを決定する、
    ことを特徴とする動きベクトル検出方法。
JP2011545919A 2009-12-18 2009-12-18 動きベクトル検出装置及び方法 Expired - Fee Related JP5492223B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/071174 WO2011074121A1 (ja) 2009-12-18 2009-12-18 動きベクトル検出装置及び方法

Publications (2)

Publication Number Publication Date
JPWO2011074121A1 JPWO2011074121A1 (ja) 2013-04-25
JP5492223B2 true JP5492223B2 (ja) 2014-05-14

Family

ID=44166910

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011545919A Expired - Fee Related JP5492223B2 (ja) 2009-12-18 2009-12-18 動きベクトル検出装置及び方法

Country Status (3)

Country Link
US (1) US9406376B2 (ja)
JP (1) JP5492223B2 (ja)
WO (1) WO2011074121A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014093602A (ja) * 2012-11-01 2014-05-19 Toshiba Corp 画像処理装置、画像処理方法、画像処理プログラム、および立体画像表示装置
JP6297822B2 (ja) * 2013-11-19 2018-03-20 ルネサスエレクトロニクス株式会社 検知装置、検知システム及び検知方法
JP6532187B2 (ja) * 2014-03-17 2019-06-19 キヤノン株式会社 画像処理装置、その制御方法、および制御プログラム
JP6223899B2 (ja) 2014-04-24 2017-11-01 株式会社東芝 動きベクトル検出装置、距離検出装置および動きベクトル検出方法
JP6453837B2 (ja) * 2016-12-08 2019-01-16 株式会社東芝 画像処理装置、画像処理方法、画像処理プログラム、および立体画像表示装置
US10891997B2 (en) 2017-12-28 2021-01-12 Spin Memory, Inc. Memory array with horizontal source line and a virtual source line

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004241880A (ja) * 2003-02-04 2004-08-26 Sony Corp 画像処理装置および方法、記録媒体、並びにプログラム
JP2005182829A (ja) * 2003-12-23 2005-07-07 Genesis Microchip Inc 一時的動きベクトルフィルタリング
JP2009295029A (ja) * 2008-06-06 2009-12-17 Sony Corp 動き量検出装置及び動き量検出方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5072293A (en) 1989-08-29 1991-12-10 U.S. Philips Corporation Method of estimating motion in a picture signal
JP2008219141A (ja) * 2007-02-28 2008-09-18 Sanyo Electric Co Ltd 動きベクトル検出装置、それを用いた画像符号化装置および撮像装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004241880A (ja) * 2003-02-04 2004-08-26 Sony Corp 画像処理装置および方法、記録媒体、並びにプログラム
JP2005182829A (ja) * 2003-12-23 2005-07-07 Genesis Microchip Inc 一時的動きベクトルフィルタリング
JP2009295029A (ja) * 2008-06-06 2009-12-17 Sony Corp 動き量検出装置及び動き量検出方法

Also Published As

Publication number Publication date
JPWO2011074121A1 (ja) 2013-04-25
US20120213285A1 (en) 2012-08-23
US9406376B2 (en) 2016-08-02
WO2011074121A1 (ja) 2011-06-23

Similar Documents

Publication Publication Date Title
JP6016061B2 (ja) 画像生成装置、画像表示装置及び画像生成方法並びに画像生成プログラム
RU2454721C2 (ru) Устройство и способ для формирования изображения, программа для его реализации и носитель информации, который хранит программу
JP4958233B2 (ja) 多眼視画像作成システム及び多眼視画像作成方法
TWI455588B (zh) 以雙向、局部及全域移動評估為基礎之框率轉換
JP5492223B2 (ja) 動きベクトル検出装置及び方法
US7936950B2 (en) Apparatus for creating interpolation frame
RU2438179C1 (ru) Устройство и способ для формирования изображения, программа для его реализации и носитель информации, который хранит программу
KR20100139030A (ko) 이미지들의 수퍼 해상도를 위한 방법 및 장치
JP2004104656A (ja) 動きベクトル検出方法、フレーム補間画像作成方法及び画像表示システム
EP1815441B1 (en) Rendering images based on image segmentation
JP2000244851A (ja) 画像処理装置、方法及びコンピュータ読み取り可能な記憶媒体
KR20120082336A (ko) 배경 픽셀 확장 및 배경 우선 패치 매칭을 사용하는 멀티 뷰 렌더링 장치 및 방법
JP2007053621A (ja) 画像生成装置
JP7233150B2 (ja) 奥行推定装置およびそのプログラム
JP4626158B2 (ja) 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム
WO2012066866A1 (ja) 動きベクトル検出装置、動きベクトル検出方法、フレーム補間装置及びフレーム補間方法
JP6057629B2 (ja) 画像処理装置、その制御方法、および制御プログラム
JP2006215657A (ja) 動きベクトル検出方法、動きベクトル検出装置、動きベクトル検出プログラム及びプログラム記録媒体
JP4831084B2 (ja) 対応点探索装置
JP5400655B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、及び、電子機器
JP2013126123A (ja) 画像処理装置、撮像装置及び画像処理方法
JP5963166B2 (ja) 画像復元装置、方法、及びプログラム
RU2308817C1 (ru) Способ и устройство масштабирования динамического видеоизображения
JP2009004919A (ja) 動きベクトル処理装置、動きベクトル検出方法、動きベクトル検出プログラム、および該プログラムを記録した記録媒体
KR20060132280A (ko) 중간 시점 영상 합성용 적응형 변이 추정 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130528

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130724

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130924

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131224

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140228

R151 Written notification of patent or utility model registration

Ref document number: 5492223

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees