JP2009520407A - 予測誘導間引き探索を使用する動き推定 - Google Patents

予測誘導間引き探索を使用する動き推定 Download PDF

Info

Publication number
JP2009520407A
JP2009520407A JP2008545790A JP2008545790A JP2009520407A JP 2009520407 A JP2009520407 A JP 2009520407A JP 2008545790 A JP2008545790 A JP 2008545790A JP 2008545790 A JP2008545790 A JP 2008545790A JP 2009520407 A JP2009520407 A JP 2009520407A
Authority
JP
Japan
Prior art keywords
motion vector
search
seed
pixel
full pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008545790A
Other languages
English (en)
Other versions
JP5044568B2 (ja
Inventor
ホフマン,マーク
シャン,ウェイ
シン,ラカ
ニング,ケー
Original Assignee
アナログ・デバイシズ・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アナログ・デバイシズ・インコーポレーテッド filed Critical アナログ・デバイシズ・インコーポレーテッド
Publication of JP2009520407A publication Critical patent/JP2009520407A/ja
Application granted granted Critical
Publication of JP5044568B2 publication Critical patent/JP5044568B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/223Analysis of motion using block-matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/533Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/557Motion estimation characterised by stopping computation or iteration based on certain criteria, e.g. error magnitude being too large or early exit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search

Abstract

予測誘導間引き探索動き推定アルゴリズムを使用する方法および装置が提供される。予測誘導間引き探索動き推定アルゴリズムは、ビデオシーケンスからのフレーム内のマクロブロックを符号化するのに使用される動きベクトルを生成する。アルゴリズムは、フルピクセルシードベクトルを生成すること、生成されたシードベクトルのまわりにフルピクセル探索を実行することを含み、これに分数ピクセル探索が続く。生成されたフルピクセルシードベクトルは、予測動きベクトルおよび階層化動きベクトルである。分数ピクセル探索は、フルピクセル探索によって生成された最終動きベクトルのまわりに実施してもよく、2分の1ピクセル探索および4分の1ピクセル探索を含めてもよい。予測誘導間引き探索動き推定アルゴリズムは、ソフトウエアおよびハードウエアの両方において実装することができる。アルゴリズムは、効率向上、スケーラビリティ、および複雑度低下を特徴とする。

Description

本発明は、一般的にはビデオシーケンスにおける動き推定に関し、より具体的には予測誘導間引き探索(prediction guided decimated search)動き推定アルゴリズムを使用する方法および装置に関する。
関係出願の相互参照
本出願は、35U.S.C.§1 19(e)の下で、参照によりその全文を本明細書に組み入れてある、2005年12月15日付け出願の「PREDICTION GUIDED DECIMATED SEARCH (PGDS) A LOW COST HIGH PERFORMANCE MOTION ESTIMATION FOR REAL-TIME EMBEDDED SYSTEM」とう名称の米国特許仮出願番号第60/750578号への優先権を主張するものである。
発明の背景
高画質低ビットレートビデオは、電気通信、エンターテインメント、放送、監視、ディジタルカメラ、および軍事用途において広範に使用されている。DVDプレーヤー、ディジタルTV、パーソナルビデオレコーダ、マルチメディアジュークボックス、ビデオ可能セル電話など、その他、多数のビデオ製品が、ビデオシーケンスを記憶および/または伝送するのに必要とされるビット数を低減するのに、ビデオ圧縮に頼っている。
ビデオシーケンスは一連のフレームからなっている。ビデオデータ圧縮効率を向上させるために、動き推定が行われる。動き推定は、隣接フレーム間の相関を抽出することによって、ビデオシーケンスの時間的冗長性を利用する上で有効であることがわかっている。フレームのシーケンスにおいて、現在フレームが、参照フレームと呼ばれる先行フレームから予測される。現在フレームは、通常、ブロックまたはマクロブロックに分轄される。マクロブロックのサイズは、典型的には16×16ピクセルであるが、標準に応じて変わってもよい。例えば、絶対差和(SAD:sum of absolute differences)、最小二乗誤差(MSE)、または平均絶対誤差(MAE:mean absolute error)などの、なんらかの誤差基準を使用して、ベストマッチのマクロブロックを探し出す試みにおいて、現在フレームにおける各マクロブロックは、参照フレーム内で、やはりマクロブロックと呼ぶことができる同一サイズの領域と比較される。
計算コストを最小化するために、動き推定は、参照フレーム内の所定の探索領域に対して実施してもよい。現在フレーム内のマクロブロックに対する、参照フレーム内のベストマッチのマクロブロックの変位を表わすベクトルが求められる。このベクトルは、動きベクトルと呼ばれる。動きベクトルは、通常は、フレーム全体ではなく、1つのフレームから次のフレームへの画像の変化を符号化することによって、ビデオシーケンスを圧縮するのに使用される。
画像通信用途に対する高い要求を満足するために、多くのビデオ圧縮標準が開発されてきた。動き推定は、例えば、ISO/IEC MPEG−I、MPEG−2、MPEG−4、CCITT H.261、ITU−T H.263、ITU−T H.264、およびMicrosoft WMV9/VC−Iなどの、多くのビデオ圧縮方式の中核部分である。また、動き推定は、例えば、画像安定化、コンピュータビジョン、動きセグメンテーション、ビデオ解析などの、ビデオ圧縮以外のその他の用途に使用することもできる。
ビデオ符号化システムにおける典型的な動き推定モジュールは、通常、最も計算量の多い構成要素であって、計算時間および能力から見た合計コストの約50〜60%、場合によっては最大80%までを占める。効率的な動き推定アルゴリズムを開発するために多くの研究がなされているが、ほとんどの先行研究は、超大規模集積回路(VLSI)システムを対象としており、ソフトウエアフレンドリではない。それらのハードウエア指向のアルゴリズムでは、十分な順応性が得られず、追加のリソースが必要となる。これらのアルゴリズムの厳密なソフトウエア実装では、同等のレベルの効率を達成することができない。多くの動き推定アルゴリズムの開発において、計算操作数が、それらの計算複雑度を計測するために使用される。リソースが制限された組込みシステムに対する重大な制約となる、計算性能とメモリアクセス帯域幅の両方を最適化するアルゴリズムは、ほとんど開発されていない。
前述の観点から、本発明は、ソフトウエアおよびハードウエアの両方に実装することのできる、予測誘導間引き探索(PGDS:Prediction Guided Decimated Search)動き推定アルゴリズムを使用する、動き推定の方法を提供する。このアルゴリズムは、以下に示すように、改善された効率、拡張性(scalability)、および低い複雑度(complexity)を特徴とする。さらに、このアルゴリズムをソフトウエアに実装すると、順応性が得られ、新しい標準や機能要件の変化に適応可能になる。
本発明の態様において、PGDSアルゴリズムは、フルピクセルシードベクトル(full-pixel seed vector)を生成すること、生成されたシードベクトルについてのフルピクセル探索を行うことを含み、それに分数ピクセル探索(fractional pixel search)が続く。フルピクセル探索を開始するために、最終動きベクトルに対する探索を誘導することのできる、開始点(複数を含む)を与えるのが望ましい。開始点またはシード(seeds)を利用することによって、探索を高速化することができる。したがって、2つのフルピクセル探索シード、すなわち予測動きベクトル(PMV:predicted motion vector)および階層化動きベクトル(HMV:hierarchical motion vector)が生成される。PVMは、隣接マクロブロックの動きベクトルから導出される、絶対差和(SAD)重み付きメジアン動きベクトル(Sum-of-Absolute-Difference (SAD)-weighted median motion vector)である。HMVは、菱形パターン(diamond pattern)のまわりのらせん探索(helical search)を用いて、間引きされた現在マクロブロックと相似的に間引きされた参照フレームとから生成される動きベクトルである。
判断モジュールを使用して、フルピクセル探索をPVM、HVM、またはその両方を用いて実施するかどうかを決定してもよい。したがって、この判断は、現行文脈と履歴データとに基づいて行われる。フルピクセル探索によって評価される探索点、すなわち試験しようとする候補動きベクトルの数を、判断モジュールによって提供してもよい。分数ピクセル探索を、フルピクセル探索によって生成される最終動きベクトルのまわりに実施するとともに、2分の1ピクセル探索および4分の1ピクセル探索を含めてもよい。本発明の態様においては、フルピクセル動きベクトルのまわりの2分の1ピクセル正方形探索および2分の1ピクセル動きベクトルのまわりの4分の1ピクセル菱形探索が、十分な解像度をもたらす。分数ピクセル探索は、動き補償誤差を抑制する追加の精度をもたらす。
したがって、本発明のいくつかの観点を、限定を意図するものではない、いくつかの例示的態様とともに提示する。
そのような観点の1つは、ビデオシーケンスにおける動き推定の方法である。この方法は、予測シード動きベクトル符号化コストを使用して符号化された予測シード動きベクトルを生成すること;階層化シード動きベクトル符号化コストを使用して符号化された階層化シード動きベクトルを生成すること;フルピクセル探索に対する前記予測シード動きベクトル符号化コストと前記階層化シード動きベクトル符号化コストの比較に基づいて、前記予測シード動きベクトル、前記階層化シード動きベクトル、またはその両方を選択すること;前記フルピクセル動きベクトルの符号化コストに基づいてフルピクセル動きベクトルを選択するために、前記選択シード動きベクトルのそれぞれについて前記フルピクセル探索を行うこと;および最終動きベクトルを推定するために、前記選択されたフルピクセル動きベクトルを使用して分数ピクセル探索を行うことを含む。
別の観点によれば、コンピュータ可読記憶媒体が提供される。このコンピュータ可読記憶媒体は、コンピュータシステム上で実行するためのコンピュータ命令で符号化されており、前記命令は、実行されると、予測シード動きベクトル符号化コストを使用して符号化された予測シード動きベクトルを生成すること;階層化シード動きベクトル符号化コストを使用して符号化された階層化シード動きベクトルを生成すること;フルピクセル探索に対する前記予測シード動きベクトル符号化コストと前記階層化シード動きベクトル符号化コストの比較に基づいて、前記予測シード動きベクトル、前記階層化シード動きベクトル、またはその両方を選択すること;前記フルピクセル動きベクトルの符号化コストに基づいてフルピクセル動きベクトルを選択するために、前記選択シード動きベクトルのそれぞれについて前記フルピクセル探索を行うこと;および最終動きベクトルを推定するために、前記選択されたフルピクセル動きベクトルを使用して分数ピクセル探索を行うことを含む、ビデオシーケンスにおける動き推定の方法を実行する。
別の観点によれば、装置は、プロセッサと、該プロセッサ上で実行するためのコンピュータ命令を含むコンピュータ可読記憶媒体とを含み、前記命令は、予測シード動きベクトル符号化コストを使用して符号化された予測シード動きベクトルを生成すること;階層化シード動きベクトル符号化コストを使用して符号化された階層化シード動きベクトルを生成すること;フルピクセル探索に対する前記予測シード動きベクトル符号化コストと前記階層化シード動きベクトル符号化コストの比較に基づいて、前記予測シード動きベクトル、前記階層化シード動きベクトル、またはその両方を選択すること;前記フルピクセル動きベクトルの符号化コストに基づいてフルピクセル動きベクトルを選択するために、前記選択シード動きベクトルのそれぞれについて前記フルピクセル探索を行うこと;および最終動きベクトルを推定するために、前記選択されたフルピクセル動きベクトルを使用して分数ピクセル探索を行うことを含む、ビデオシーケンスにおける動き推定の方法を提供する。
いくつかの態様においては、最終動きベクトルは、前記ビデオシーケンスから現在ビデオフレーム内部の入力マクロブロックに対して推定してもよい。最終動きベクトルは、設定可能なサイズの探索ウィンドウ内部で推定しもよい。
予測シード動きベクトルは、隣接マクロブロックに対して、先に推定された動きベクトルを使用して生成してもよい。階層化シードベクトルは、階層化探索を使用して生成してもよい。
いくつかの態様においては、前記階層化シードベクトルを生成することには、所定の間引き係数(decimation factor)を使用して、入力マクロブロックを間引きすること、および所定の間引き係数を使用してビデオシーケンスからの参照フレームを間引きすることを含めてもよい。
いくつかの態様においては、フルピクセル探索は、選択された階層化シード動きベクトルおよび/または前記選択された予測シード動きベクトルを使用して実行してもよく、フルピクセル探索場所の数は設定可能である。
いくつかの態様においては、フルピクセル探索は、正方形探索としてもよい。分数ピクセル探索には、少なくとも1回の2分の1ピクセル正方形探索および少なくとも1回の4分の1ピクセル菱形探索を含めても良い。
なお、上述して以下に考察する態様は、特に断らない限り、相互に排他的であることを意図するものではない。
添付の図面は、実寸法に合わせて描くことを意図するものではない。図面において、様々な図において示される、それぞれの同一構成要素、またはほぼ同一の構成要素は、同じ数字で表わされる。わかりやすくするために、すべての図面ですべての構成要素にラベル付けすることはしない。
詳細な説明
図1Aは、動きベクトルを推定するために行われる動き推定を示す概略図である。現在フレーム100内部のマクロブロック102が、参照フレーム104内のマクロブロックと比較される。通常、マクロブロック102は、最初に、参照フレーム102内の同一場所にあるマクロブロック106と比較され、その後に、この同一場所にあるマクロブロック106は、例えば、場所108および110に示されているように、参照フレーム内の他の場所へと移動される。この移動の大きさは可変であり、その方向は、使用される探索パターンと探索アルゴリズムのパラメータとに依存する。マクロブロック104にベストマッチのマクロブロック112が参照フレーム104内で見つかった場合に、動きベクトル116を構成する、マクロブロック102と112の間の変位を、図1Bに示すように、求めることができる。動きベクトル116は、水平(x)成分114Aと垂直(y)成分114Bを含む。結果的に、現在フレーム100からのマクロブロック102は、参照フレーム104において、ベストマッチするマクロブロック112に対する、動きベクトル116として符号化される。マクロブロック102の符号化は、概略的に図1Bに示されており、ベストマッチングのマイクロブロック112が、表現の便宜のために示されている。
図2は、図1に示す動きベクトルをより詳細に示す概略図である。図2は、参照フレーム200と、探索の領域の境界を定める探索ウィンドウ202とを示す。探索ウィンドウの大きさは変わってもよい。さらに、図2は、例として右上位置(x,y)を有するマクロブロック102が、例えば右上位置(x,y)を有するベストマッチのマクロブロック112に対して変位する場合に、動きベクトル116は(Δx,Δy)として符号化され、ここでΔxおよびΔyは、それぞれ水平および垂直の変位であることを示している。そうではなく、動きが検出されず、ベストマッチのマクロブロック112が、現在フレーム(図示せず)におけるマクロブロック102と、参照フレーム内の同一の場所で見つかる場合には、対応する動きベクトル116は(0,0)と表わすことができる。
図3を参照すると、本発明の態様において使用された予測誘導間引き探索(PGDS)アルゴリズム300のステップが示されている。このアルゴリズムは、ステップ302Aおよび302Bにおいて、動きベクトルの探索を開始するために、2種類のシードベクトルを生成することに依拠している。シードベクトルは、所定のパターンに続く、後続の探索を行うのに使用される。
シードベクトルの1つは、ステップ302Aにおいて生成される、予測動きベクトル(PMV)と呼ばれる。PMVは、図4に詳細に示されているように、隣接マクロブロックの動きベクトルから推定される、SAD重み付きメジアン動きベクトルである。現在マクロブロック400の3つの隣接マクロブロックに対して先に推定された動きベクトルが、本発明の態様において、現在マクロブロック400に対するPMVを予測するのに使用される。現在マクロブロック400がMB(n,n)と表わされると、使用される3つの空間隣接マクロブロックは、左側マクロブロック402(MB(n,ny−1))、直上のマクロブロック404(MB(ny−1,n))、および右上のマクロブロック406(MB(nx−1,ny+1))である。隣接マクロブロックの使用は、動きが発生すると、同一の物体を取り囲むマクロブロックが一緒に動くとの仮定に基づいている。
適応コスト閾を使用して、(3つの上記の隣接マクロブロックの)各候補マクロブロックが、それが利用可能な場合に、PMV予測に使用される資格があるかどうかが、それを符号化するのに使用される動きベクトルのコストとSAD値とに基づいて、評価される。適応閾は、候補マクロブロックに対する平均ランニングコストとしてもよく、
Figure 2009520407
で定義され、ここで
Figure 2009520407
Wは探索フレーム幅、(i,j)は現在ブロックの位置、Nはマクロブロック内のピクセル数(16×16ピクセルマクロブロックに対して256)、COST(m,n)はコスト関数であり、これはSADおよび動きベクトル符号化コストを含む。
コスト関数は、
Figure 2009520407
で定義され、SADは、
Figure 2009520407
で定義され、ここでCは現在マクロブロック、Rは参照マクロブロック、M×Nは現在マクロブロックおよび参照マクロブロックの次元である(例えば、いくつかの態様におけるように、16×16ピクセル)。動きベクトル符号化コスト、MV_COST(mv,mv)は、現在マクロブロックに対する動きベクトルを符号化するのに必要となるビット数である。ここで、適応閾は、その他の様々な好適な方法を使用して定義してもよいことを理解すべきである。ビデオ符号化において、SAD値は、現在フレーム内のマクロブロックのピクセル強度値と、参照フレーム内の同一サイズのマクロブロックのピクセル強度値との間のピクセル・バイ・ピクセル差を表わすのに使用される標準的な基準である。
図5は、本発明の態様による、隣接マクロブロックを使用してマクロブロックに対するPMVシードベクトルの予測、を示すフローチャートである。この予測は、適応閾COST_THRESHOLDよりも低い符号化コストを特徴とする、候補隣接マクロブロック502の利用可能性に依存する。利用可能な候補マクロブロックのそれぞれに対して、動きベクトルは、先に推定されていると仮定されるとともに、対応する符号化コストは、式(2)に定義されるように、先に求められていると仮定される。したがって、例えば、図4に示されているマクロブロック402、404、406などの、3つの候補マクロブロックのすべてが、ステップ504において求められる、適応閾よりも低いコストを特徴とする場合には、PMVは、ステップ506に示されるように、3つの対応する動きベクトルのメジアン値として定義される。ステップ506はまた、現在マクロブロックを符号化するコスト、PCOSTが、3つの候補マクロブロックを符号化するコストのメジアンとして定義されることを示している。
さらに、ステップ508において、候補マクロブロックの2つが予測に対して正当であるかどうかが決定され、その答えが肯定である場合には、ステップ510において、それらの動きベクトルの平均値が使用される。同様に、PCOSTは、2つの候補マクロブロックを符号化するのに使用される、それぞれのコストの平均値として定義される。そうでない場合には、ステップ512は、1つだけの候補マクロブロックが、閾を超えないコストを特徴とするかどうかを判定し、そうである場合には、ステップ514に示されるように、この候補マクロブロックに対して以前に推定された動きベクトルが、PMVを定義するのに使用される。PCOSTは、候補マクロブロックを符号化するのに使用されるコストとして定義される。最後に、試験された隣接マクロブロックのどれもがPMV予測に使用される資格がない場合には、PMVはゼロと定義され、これがステップ516に示されている。この場合には、PCOSTは無限大であると考えられる。本発明の態様においては、PVMを予測するために、それぞれのステップが特定のマクロブロックの隣接マクロブロックの試験を含む、2つまたは3つの上記の探索ステップが実行される。探索ステップ数は、設定可能である。
図3を参照すると、ステップ302Bにおいて、階層化シード動きベクトル(HMV)が生成される。HMVシートベクトルを生成するために、現在マクロブロックと参照フレームとが間引きされる。この間引きは、図6に図式的に示されており、この図は、元の全解像度フレーム(またはマクロブロック)600および間引きフレーム(またはマクロブロック)602を示している。異なるアプローチをとって、フレームを間引きして、その解像度を低減して、符号化プロセスを高速化することができる。本発明の態様においては、「シフト・バイ・フォー(shift by 4)」技法が使用され、4×4ピクセルサイズの非オーバラップブロックが、それぞれのブロックにおけるピクセルの値を平均化することによって1ピクセルに圧縮される。したがって、16×16ピクセルサイズのマクロブロックは、4×4ピクセルサイズのマクロブロックに間引きされる(すなわち間引き係数は4である)。その他の好適な係数を使用することもできる。
HMVシードベクトルを推定するために、菱形パターンのまわりのらせん探索を使用する動き推定を、間引きされた参照フレームについて実行してもよく、その一例が図7に図解されている。図7において、Xは探索の開始位置であり、その他の位置が番号付きの円で示されており、ここで番号は、特定のステップサイズを特徴とする菱形パターンにそれぞれグループ化された、探索ステップの順序を示す。図7に示されているような菱形探索パターンが使用される場合には、現在フレーム内のマクロブロックと同位置にあるマクロブロック(Xの印)に対するSAD値を含む、現在マクロブロックのピクセル強度と参照フレーム内のマクロブロックのピクセル強度の間のSAD値が、決定される。同位置にあるマクロブロックは、所定のサイズのステップだけ変位させられる。
現在マクロブロックと参照フレーム内で試験されたそれぞれのマクロブロックとの間の変位を示す動きベクトルを符号化するのに使用されると予測される符号化コストが求められる。符号化コストと関連するSAD値は、式(2)に示されるように、参照フレーム内で試験されたそれぞれのマクロブロックを使用して、現在マクロブロックを符号化するコストを定義するのに使用してもよい。すなわち、図7において、(X印の)開始点を包囲する、1の番号がつけられた8個の円は、第1の菱形探索パターンを構成する。図7において例としてのみ示された菱形探索パターンのステップサイズは2である。すなわち現在マクロブロックと同位置にある参照フレーム内のマクロブロックが、垂直および水平の両方向に2ピクセルだけ変位させられ、それによって「菱形」を形成する。ここで、その他の好適なサイズの探索ステップ(例えば、8)を使用してもよいことを理解すべきである。
菱形探索パターンにおける次の探索が、参照フレーム内のマクロブロックのまわりで実行されて、このマクロブロックは、現在マクロブロックを符号化するのに使用される場合には、参照フレーム内のその他の試験されたマクロブロックを使用するのに伴う符号化コストと比較して、最小の符号化コストを与える。図7において、2の番号がつけられた第2の組の点は、次の菱形探索パターンを含み、この場合にステップサイズは1に低減される。後続のステップにおいて、菱形パターンにおける探索は、上述のように選ばれたマクロブロック(図示せず)のまわりに、参照フレーム内のマクロブロックを試験することによって進めることができる。この方法で実行される探索数は、可変としてもよく、いくつかの態様においては、約10としてもよい。上述の菱形パターンにおいてそれぞれ実行される探索ステップは、「らせん」探索経路と呼べるものに従う。したがって、図7に関係して説明した探索は、菱形パターンのまわりのらせん探索と呼ばれる。
図3に示すように、判断モジュール304は、フルピクセル探索を実行するのに、PMVシードベクトルもしくはHMVシートベクトル、またはその両方のいずれのシードベクトルを使用するかを決定する。したがって、ステップ306において決定される、PMVシードベクトルおよびHMVシードベクトルを符号化するコストが互いに等しい場合には、ステップ308において、両方のシードがフルピクセル探索を開始するのに使用される。ステップ310において決定される、PMVシードベクトルのコストが、HMVシードベクトルのコストよりも低い場合には、ステップ312において、PMVシードベクトルが、フルピクセル探索の開始点として選択される。そうでない場合には、ステップ314において、HMVシードベクトルが使用される。
本発明の態様においては、1つのシードベクトルまたは2つのシードベクトルのまわりのフルピクセル探索が、正方形探索パターンで実行される。図8は、正方形探索パターンの例を示す。したがって、図8においては、X印の開始点は、現在マクロブロックを符号化するのに最小コストを必要とする動きベクトルをもたらすと決定された、マクロブロックの場所を示し、1の印のついた円は、第1の正方形パターンを形成する点の場所を示し、2の印のついた円は、やはり正方形探索パターンにおいて、その後に評価される点の場所を示す。図8に示されている正方形探索パターンにおけるステップのサイズは1である。しかしながら、ステップのサイズは設定可能であることを理解すべきである。1つの正方形パターンから次への移行の方向は、図7に提示された菱形探索パターンに対して説明したのと同じ方法で、すなわち、現在マクロブロックを符号化するのに必要な最小コストを与えるマクロブロックに向う方向に、決定される。
フルピクセル探索の結果として、現在マクロブロックに対する最終フルピクセル動きベクトルが推定される。ここで、フルピクセル動きベクトルは、現在マクロブロックと、最低符号化コストを使用しての現在マクロブロックの符号化を可能にする、参照フレーム内のマクロブロックとの間の変位を表わすことを理解すべきである。フルピクセル探索が、PMVシードベクトルとHMVシードベクトルの両方を使用して実行される場合には、図8で説明した正方形探索を、シードベクトルのそれぞれのまわりで実施して、最終フルピクセル動きベクトルが、上述の符号化コスト基準を使用して、2つのそれぞれの探索から生じる、2つのフルピクセル動きベクトルの中から選択される。
本発明の態様において、シードベクトルまわりで、最高3つまでのフルピクセル正方形パターン探索が実行される。所定の回数の探索、ならびにステップサイズを、ビデオエンコーダの品質および複雑度の要件に適合するように調整することができる。ここで、フルピクセル探索は、整数値座標(integer-valued coordinates)を有するピクセルについて実行され、これに対してサブピクセル探索は、例えば、2分の1ピクセルまたは4分の1ペル(quarter-pel)の、分数値座標(fractional-valued coordinates)に対応する補間ピクセル値について実施されることを理解すべきである。
図9を参照すると、最終フルピクセル動きベクトル900を、図3のステップ316に示されるように、PGDSアルゴリズムの最後のステップ、分数ピクセル探索に対する開始点として使用してもよい。図10は、分数ピクセル探索によって解析されるピクセルを全体的に示しており、ここで円は、整数値座標のピクセルを示し、三角形および正方形は、それぞれ2分の1ピクセル値および4分の1ピクセル値の座標を表わす。本発明の態様において、フルピクセル動きベクトル900まわりの2分の1ピクセル正方形探索902が実行され、探索ステップサイズは、現在マクロブロックにベストマッチするマクロブロックの位置から、垂直および水平の両方向において2分の1ピクセルである。各2分の1ピクセルの値は、フルピクセルの平均をとるか、またはその他の任意好適な方法を使用することによって、隣接フルピクセルの値から補間される。2分の1ピクセル動きベクトル904が、2分の1ピクセル正方形探索902を使用して得られ、その後に、4分の1ピクセル菱形探索906が、2分の1ピクセル動きベクトル904のまわりに実行される。
4分の1ピクセルの値は、2分の1ピクセルを平均化するか、またはその他任意好適な方法を使用することによって、隣接する2分の1ピクセルから補間される。ここで、正方形2分の1ピクセル探索および菱形4分の1ピクセル探索は、図8および7に関してそれぞれ説明した、それぞれのフルピクセル探索と同様に実行されることを理解すべきである。それぞれの探索が実行される回数は設定可能である。本発明の態様において、正方形2分の1ピクセル探索および菱形4分の1ピクセル探索はそれぞれ一度、実行された。分数補間点を必要とする、例えば、H.264やMPEG−4などの、いくつかのビデオ符号化標準は、分数ピクセル探索を行う回数が少ないことから、計算コストの観点で有利である。
表1および2は、「foreman」、「paris」、「mobile」、「tennis」などの、4つの公知の試験クリップについて本発明者らが実施した性能実験の結果の一部を示す。表1では、全域探索FS(Full Search)、2次元対数探索TDL(Two-Dimensional Logarithm Search)、階層化探索HS(Hierarchical Search)、(本発明の態様による)PGDSなどの4つの異なる動き推定アルゴリズムの性能を評価するために、2つの尺度(metrics)、すなわちビデオシーケンスを符号化するのに使用された平均ビット数(avg bits)、および平均ピークシグナル・ノイズ比PSNR(Peak Signal-to-Noise Ratio)を使用した。少ないビット数および高いPSNR値は、良好な性能を示す。また、ビット数における百分率増加(%inc bits)、およびFSアルゴリズムと比較したPSNRの差(psnr diff)が得られた。
FSは、最も計算負荷が高いが、最良の符号化品質と、低いビットレートが得られる。動き推定アルゴリズムに対して、ビット数およびPSNRが、FSアルゴリズムによって生成されるものに近いほど、アルゴリズムの性能は良好となる。表1は、ローモーションクリップ(low-motion clip)、「foreman」および「paris」に対して、FSと比較して、PGDSは、わずか1%未満のビットレートの増加と、ほとんど同等のPSNRを得た。ハイモーションクリップ(high-motion clip)、「mobile」および「tennis」に対しては、PGDSは、FSよりも良い性能を示した。
Figure 2009520407
表2では、FS、TDL、HS、予測探索PRED(Predicted Search)、および(本発明の態様による)PGDSなどの5つの動き推定アルゴリズムの実装コストを、割当てメモリ量(バイト数)、マクロブロック当りのダイレクトメモリアクセス(DMA)帯域幅、および探索点の数において比較する。10の異なる動き探索範囲が示されており、サイズの範囲、例えば16×16ピクセルを有する探索が、垂直および水平の両方の方向で16ピクセルを包囲する探索ウィンドウ、すなわち探索ウィンドウはサイズ32×32ピクセル、の内部で実行される。表2によれば、PGDSを実行するのに必要なメモリの量とDMA帯域幅は、同一の探索範囲に対して、FSおよびTDLを実行するのに必要なものよりずっと少なかった。同時に、PGDSの性能は、FSのそれと非常に近く、TDLの性能を超える。
Figure 2009520407
本発明の態様は、ソフトウエア、ハードウエア、ファームウエア、様々な種類のプロセッサ、またはそれらの組合せに実装することができる。すなわち、態様は、それには限定されないが、磁気記憶媒体(例えば、ROMS、RAM、フレキシブルディスク)、光学可読媒体(例えば、CD−ROM、DVD、その他)、および搬送波(例えば、インターネット上での伝送)などの記憶媒体を含む、1つまたは2つ以上のコンピュータ可読媒体に組み込まれる、コンピュータ可読命令として実装してもよい。本発明のいくつかの態様は、それにコンピュータ可読命令を記憶させたコンピュータ可読媒体として、または例えば、アナログ・デバイシズ社(Analog Devices, Inc., Norwood, MA)から入手可能な、Blackfinファミリーの埋込み型ディジタル信号プロセッサの高性能メンバの範囲内のビデオエンコーダなどの、様々な好適な計算装置のハードウエア構成要素として実装することができる。例えば、それぞれが600MHz性能を有する、2つの独立コアを含む、ディジタル信号プロセッサADSP−BF561、および最高756MHz性能を達成するシングルコアADSP−BF533ディジタル信号プロセッサを使用してもよい。その他の様々な好適なディジタル信号プロセッサも、本発明の態様を実装することができる。
図11は、本発明の態様を実装するための、例示的計算装置の図である。そのような装置としては、それに限定はされないが、システムバス1108によって相互接続された、マイクロプロセッサ1100、キャッシュメモリ1102、内部メモリ1104、およびDMAコントローラ1106が挙げられる。図11の計算装置を使用して実装された、本発明の態様において、システムバス1108は、外部メモリ1112を制御する、外部メモリコントローラ1110に接続されている。
さらに、PGDSは、異なる埋込み式システムアーキテクチャに適合させて、異なるリソースバジェット(resource budget)に合致させることができる。このアルゴリズムはまた、異なるフレームサイズに対して拡大縮小が可能であり、これはCIF(PALシステムにおいて352×288ピクセル、NTSCシステムにおいて352×240ピクセル)からDI(NTSCシステムにおいて720×480ピクセル、PALおよびSECAMシステムにおいて720×576ピクセル)解像度標準、およびハイ/ローモーションシーンまで範囲に含めることができる。PGDSの実行遅延は、ランタイム中に動的に調整して、異なる複雑度レベルで動作させることができる。すなわち、システム作業負荷が軽い場合には、PGDSは、より大量の探索を実行して、システムのリソースを完全に利用することができる。システム作業負荷が重い時間中は、PGDSは、リアルタイムスケジューリング要件を守るために、最小遅延で動作することができる。
前記のことから理解されるように、互いに独立に、または任意の組合せで使用することのできる、本明細書に記載した本発明の多数の観点がある。特に、本発明の様々な観点は、単独、組合せ、または前記で説明した態様において具体的に考察しなかった様々な配設において使用することができるとともに、本明細書に記載した本発明の観点は、その応用において、前記の明細書に記載されるか、また図面に示された詳細および配設に限定されるものではない。本発明の観点は、その他の態様が可能であるとともに、様々な方法で実施または実行することができる。本発明の様々な観点は、任意の種類の回路を使用して実装してもよく、回路実装についての制限はない。したがって、前述の説明と図面は、例としてだけのものである。
ここで、本明細書において使用された語句および用語は、説明を目的とするものであり、限定するものとはみなすべきではない。本明細書において「含む(including)」、「備える(comprising)」、または「有する(having)」、「含む(containing)」、「伴う(involving)」およびその変形形態は、その後に列挙される項目およびその均等物、ならびに追加の項目を包含することを意図するものである。
動きベクトルを推定するために実行される動き推定の概略図である。 現在フレーム内のマクロブロックを符号化するのに使用される、動きベクトルを示す概略図である。 現在フレーム内のマクロブロックを符号化するのに使用される、図1Bの動きベクトルをさらに詳細に示す概略図である。 予測誘導間引き探索 (PGDS)アルゴリズムを示すフローチャートである。 現在マクロブロックに対する予測動きベクトル(PMV)シードを生成するのに使用される、現在マクロブロックおよびその隣接マクロブロックを示す概略図である。 PMVシードベクトルを予測し、PMVシードベクトルを符号化するコストを予測するプロセスのフローチャートである。 フレーム間引きを示す概略図である。 動き推定に使用される菱形パターンのまわりのらせん探索を示す図である。 動き推定に使用される正方形探索パターンを示す図である。 フルピクセル動きベクトルのまわりの分数ピクセル探索のステップを示すフローチャートである。 分数ピクセル探索において、フルピクセルに対して、2分の1ピクセルおよび4分の1ピクセルの場所を示す図である。 本発明の一態様による動き推定の方法を実装するための、例示的計算装置のブロック図である。

Claims (27)

  1. 予測シード動きベクトル符号化コストを使用して符号化された予測シード動きベクトルを生成すること;
    階層化シード動きベクトル符号化コストを使用して符号化された階層化シード動きベクトルを生成すること;
    フルピクセル探索に対する前記予測シード動きベクトル符号化コストと前記階層化シード動きベクトル符号化コストの比較に基づいて、前記予測シード動きベクトル、前記階層化シード動きベクトル、またはその両方を選択すること;
    前記フルピクセル動きベクトルの符号化コストに基づいてフルピクセル動きベクトルを選択するために、前記選択シード動きベクトルのそれぞれについて前記フルピクセル探索を行うこと;および
    最終動きベクトルを推定するために、前記選択されたフルピクセル動きベクトルを使用して分数ピクセル探索を行うこと
    を含む、ビデオシーケンスにおける動き推定の方法。
  2. 最終動きベクトルが、ビデオシーケンスから、現在ビデオフレーム内の入力マクロブロックに対して推定される、請求項1に記載の方法。
  3. 予測シード動きベクトルが、隣接マクロブロックに対して先に推定された動きベクトルを使用して生成される、請求項2に記載の方法。
  4. 階層化シードベクトルが、階層化探索を使用して生成される、請求項2に記載の方法。
  5. 階層化シードベクトルを生成することが、所定の間引き係数を使用して入力マクロブロックを間引きすること、および前記所定の間引き係数を使用してビデオシーケンスからの参照フレームを間引きすることを含む、請求項2に記載の方法。
  6. フルピクセル探索が、選択された階層化シード動きベクトルおよび/または選択された予測シード動きベクトルを使用して行われるとともに、フルピクセル探索場所の数が設定可能である、請求項2に記載の方法。
  7. フルピクセル探索が、正方形探索である、請求項2に記載の方法。
  8. 分数ピクセル探索が、少なくとも1回の2分の1ピクセル正方形探索および少なくとも1回の4分の1ピクセル菱形探索を含む、請求項2に記載の方法。
  9. 最終動きベクトルが、設定可能な寸法の探索ウィンドウ内で推定される、請求項2に記載の方法。
  10. コンピュータシステム上で実行するためのコンピュータ命令で符号化されたコンピュータ可読記憶媒体であって、前記命令は、実行されると、
    予測シード動きベクトル符号化コストを使用して符号化された予測シード動きベクトルを生成すること;
    階層化シード動きベクトル符号化コストを使用して符号化された階層化シード動きベクトルを生成すること;
    フルピクセル探索に対する前記予測シード動きベクトル符号化コストと前記階層化シード動きベクトル符号化コストの比較に基づいて、前記予測シード動きベクトル、前記階層化シード動きベクトル、またはその両方を選択すること;
    前記フルピクセル動きベクトルの符号化コストに基づいてフルピクセル動きベクトルを選択するために、前記選択シード動きベクトルのそれぞれについて前記フルピクセル探索を行うこと;および
    最終動きベクトルを推定するために、前記選択されたフルピクセル動きベクトルを使用して分数ピクセル探索を行うこと
    を含む、ビデオシーケンスにおける動き推定の方法を実行する、前記コンピュータ可読記憶媒体。
  11. 最終動きベクトルが、ビデオシーケンスから、現在ビデオフレーム内の入力マクロブロックに対して推定される、請求項10に記載のコンピュータ可読記憶媒体。
  12. 予測シード動きベクトルが、隣接マクロブロックに対して先に推定された動きベクトルを使用して生成される、請求項11に記載のコンピュータ可読記憶媒体。
  13. 階層化シードベクトルが、階層化探索を使用して生成される、請求項11に記載のコンピュータ可読記憶媒体。
  14. 階層化シードベクトルを生成することが、所定の間引き係数を使用して入力マクロブロックを間引きすること、および前記所定の間引き係数を使用してビデオシーケンスからの参照フレームを間引きすることを含む、請求項11に記載のコンピュータ可読記憶媒体。
  15. フルピクセル探索が、選択された階層化シード動きベクトルおよび/または選択された予測シード動きベクトルを使用して行われるとともに、フルピクセル探索場所の数が設定可能である、請求項11に記載のコンピュータ可読記憶媒体。
  16. フルピクセル探索が、正方形探索である、請求項11に記載のコンピュータ可読記憶媒体。
  17. 分数ピクセル探索が、少なくとも1回の2分の1ピクセル正方形探索および少なくとも1回の4分の1ピクセル菱形探索を含む、請求項11に記載のコンピュータ可読記憶媒体。
  18. 最終動きベクトルが、設定可能な寸法の探索ウィンドウ内で推定される、請求項11に記載のコンピュータ可読記憶媒体。
  19. プロセッサと、該プロセッサ上で実行するためのコンピュータ命令を含むコンピュータ可読記憶媒体とを含む装置であって、前記命令が、
    予測シード動きベクトル符号化コストを使用して符号化された予測シード動きベクトルを生成すること;
    階層化シード動きベクトル符号化コストを使用して符号化された階層化シード動きベクトルを生成すること;
    フルピクセル探索に対する前記予測シード動きベクトル符号化コストと前記階層化シード動きベクトル符号化コストの比較に基づいて、前記予測シード動きベクトル、前記階層化シード動きベクトル、またはその両方を選択すること;
    前記フルピクセル動きベクトルの符号化コストに基づいてフルピクセル動きベクトルを選択するために、前記選択シード動きベクトルのそれぞれについて前記フルピクセル探索を行うこと;および
    最終動きベクトルを推定するために、前記選択されたフルピクセル動きベクトルを使用して分数ピクセル探索を行うこと
    を含む、ビデオシーケンスにおける動き推定の方法を行う、前記装置。
  20. 最終動きベクトルが、ビデオシーケンスから、現在ビデオフレーム内の入力マクロブロックに対して推定される、請求項19に記載の装置。
  21. 予測シード動きベクトルが、隣接マクロブロックに対して先に推定された動きベクトルを使用して生成される、請求項20に記載の装置。
  22. 階層化シードベクトルが、階層化探索を使用して生成される、請求項20に記載の装置。
  23. 階層化シードベクトルを生成することが、所定の間引き係数を使用して入力マクロブロックを間引きすること、および前記所定の間引き係数を使用してビデオシーケンスからの参照フレームを間引きすることを含む、請求項20に記載の装置。
  24. フルピクセル探索が、選択された階層化シード動きベクトルおよび/または選択された予測シード動きベクトルを使用して行われるとともに、フルピクセル探索場所の数が設定可能である、請求項20に記載の装置。
  25. フルピクセル探索が、正方形探索である、請求項20に記載の装置。
  26. 分数ピクセル探索が、少なくとも1回の2分の1ピクセル正方形探索および少なくとも1回の4分の1ピクセル菱形探索を含む、請求項20に記載の装置。
  27. 最終動きベクトルが、設定可能な寸法の探索ウィンドウ内で推定される、請求項20に記載の装置。
JP2008545790A 2005-12-15 2006-12-14 予測誘導間引き探索を使用する動き推定 Active JP5044568B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US75057805P 2005-12-15 2005-12-15
US60/750,578 2005-12-15
PCT/US2006/047641 WO2007078800A1 (en) 2005-12-15 2006-12-14 Motion estimation using prediction guided decimated search

Publications (2)

Publication Number Publication Date
JP2009520407A true JP2009520407A (ja) 2009-05-21
JP5044568B2 JP5044568B2 (ja) 2012-10-10

Family

ID=37950207

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008545790A Active JP5044568B2 (ja) 2005-12-15 2006-12-14 予測誘導間引き探索を使用する動き推定

Country Status (6)

Country Link
US (1) US8406303B2 (ja)
EP (1) EP1960967B1 (ja)
JP (1) JP5044568B2 (ja)
CN (1) CN101326550B (ja)
TW (1) TWI440364B (ja)
WO (1) WO2007078800A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011035569A (ja) * 2009-07-30 2011-02-17 Fujitsu Ltd 動きベクトル検出装置及び動きベクトル検出方法
KR20130006616A (ko) * 2010-03-16 2013-01-17 톰슨 라이센싱 비디오 인코딩 및 디코딩을 위한 암시적인 적응 움직임 벡터 예측자 선택을 위한 방법 및 장치
KR20140095607A (ko) * 2013-01-23 2014-08-04 한국전자통신연구원 인터 예측 방법 및 그 장치
KR20200013254A (ko) * 2020-01-21 2020-02-06 한국전자통신연구원 인터 예측 방법 및 그 장치
KR20200126954A (ko) * 2020-01-21 2020-11-09 한국전자통신연구원 인터 예측 방법 및 그 장치
KR20210093818A (ko) * 2020-10-28 2021-07-28 한국전자통신연구원 인터 예측 방법 및 그 장치

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006043707A1 (de) * 2006-09-18 2008-03-27 Robert Bosch Gmbh Verfahren zur Datenkompression in einer Videosequenz
KR101403343B1 (ko) * 2007-10-04 2014-06-09 삼성전자주식회사 부화소 움직임 추정을 이용한 인터 예측 부호화, 복호화방법 및 장치
US8355077B2 (en) * 2008-03-27 2013-01-15 Csr Technology Inc. Adaptive windowing in motion detector for deinterlacer
US8144766B2 (en) 2008-07-16 2012-03-27 Sony Corporation Simple next search position selection for motion estimation iterative search
US8094714B2 (en) * 2008-07-16 2012-01-10 Sony Corporation Speculative start point selection for motion estimation iterative search
US20100166073A1 (en) * 2008-12-31 2010-07-01 Advanced Micro Devices, Inc. Multiple-Candidate Motion Estimation With Advanced Spatial Filtering of Differential Motion Vectors
WO2010086018A1 (en) * 2009-01-29 2010-08-05 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for efficient hardware motion estimation
US8498493B1 (en) 2009-06-02 2013-07-30 Imagination Technologies Limited Directional cross hair search system and method for determining a preferred motion vector
KR101612125B1 (ko) * 2009-06-12 2016-04-12 삼성전자주식회사 사용자의 손떨림 또는 의도적 움직임의 유무를 판단하는 방법
US8488007B2 (en) * 2010-01-19 2013-07-16 Sony Corporation Method to estimate segmented motion
US8285079B2 (en) * 2010-03-19 2012-10-09 Sony Corporation Method for highly accurate estimation of motion using phase correlation
US9591326B2 (en) * 2010-03-31 2017-03-07 Intel Corporation Power efficient motion estimation techniques for video encoding
TWI404422B (zh) * 2010-04-14 2013-08-01 Himax Tech Ltd 階層式動作估計的方法與系統
CN101867815B (zh) * 2010-04-30 2011-09-14 西北工业大学 快速小数像素分级搜索方法
TWI451767B (zh) * 2010-05-27 2014-09-01 Mstar Semiconductor Inc 視訊編碼系統、移動估算裝置及移動估算方法
CN102377995B (zh) * 2010-08-05 2015-03-18 富士通株式会社 分数像素运动估计方法和系统
PL2455522T3 (pl) 2010-11-18 2016-09-30 Element z materiału kompozytowego dla zapięcia na rzepy
TWI491248B (zh) * 2011-12-30 2015-07-01 Chung Shan Inst Of Science Global motion vector estimation method
CN102547296B (zh) * 2012-02-27 2015-04-01 开曼群岛威睿电通股份有限公司 移动估计加速电路、移动估计方法及环路滤波加速电路
US9691180B2 (en) * 2012-09-28 2017-06-27 Intel Corporation Determination of augmented reality information
CN103281533B (zh) * 2013-05-14 2016-02-24 芯原微电子(北京)有限公司 用于可伸缩视频编码中增强层运动估计的设备和方法
US9838710B2 (en) * 2014-12-23 2017-12-05 Intel Corporation Motion estimation for arbitrary shapes
CN106331703B (zh) * 2015-07-03 2020-09-08 华为技术有限公司 视频编码和解码方法、视频编码和解码装置
CN105516726B (zh) * 2015-11-27 2019-04-09 传线网络科技(上海)有限公司 视频编码的运动补偿匹配方法和系统
FR3057130B1 (fr) * 2016-10-03 2019-08-02 B<>Com Procede de codage d'une image, procede de decodage, dispositifs, equipement terminal et programmes d'ordinateurs associes
CN109587501B (zh) * 2017-09-28 2022-07-12 腾讯科技(深圳)有限公司 进行运动估计的方法、装置及存储介质
EP3648059B1 (en) * 2018-10-29 2021-02-24 Axis AB Video processing device and method for determining motion metadata for an encoded video
CN112866719B (zh) * 2019-11-27 2022-09-23 北京博雅慧视智能技术研究院有限公司 一种针对avs2的快速分像素预测方法
US11887314B2 (en) * 2021-11-08 2024-01-30 SmartThings, Inc. Compressed domain motion detection

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1066083A (ja) * 1996-08-23 1998-03-06 Nec Corp 動きべクトル探索方式
JPH1075455A (ja) * 1996-08-30 1998-03-17 Nec Corp 動きベクトル検出回路
JPH11239354A (ja) * 1998-02-23 1999-08-31 Mitsubishi Electric Corp 動きベクトル検出器
JP2004260251A (ja) * 2003-02-24 2004-09-16 Victor Co Of Japan Ltd 動きベクトル検出装置及び動きベクトル検出プログラム
JP2005167976A (ja) * 2003-11-14 2005-06-23 Victor Co Of Japan Ltd 動きベクトル検出装置及び動きベクトル検出プログラム
JP2006025033A (ja) * 2004-07-06 2006-01-26 Sony Corp 画像処理装置および画像処理方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6466083A (en) 1987-09-07 1989-03-13 Matsushita Electric Ind Co Ltd Method for forming solid capacitor lead
KR0181069B1 (ko) * 1995-11-08 1999-05-01 배순훈 움직임 추정장치
US6014181A (en) * 1997-10-13 2000-01-11 Sharp Laboratories Of America, Inc. Adaptive step-size motion estimation based on statistical sum of absolute differences
US6876703B2 (en) * 2000-05-11 2005-04-05 Ub Video Inc. Method and apparatus for video coding
US6859494B2 (en) * 2001-07-27 2005-02-22 General Instrument Corporation Methods and apparatus for sub-pixel motion estimation
ATE404019T1 (de) * 2001-09-12 2008-08-15 Nxp Bv Bewegungsschätzung und/oder kompensation
US6925123B2 (en) * 2002-08-06 2005-08-02 Motorola, Inc. Method and apparatus for performing high quality fast predictive motion search
US7280597B2 (en) * 2003-06-24 2007-10-09 Mitsubishi Electric Research Laboratories, Inc. System and method for determining coding modes, DCT types and quantizers for video coding
KR100727989B1 (ko) * 2005-10-01 2007-06-14 삼성전자주식회사 동영상 부호화시의 인터 모드 결정 방법 및 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1066083A (ja) * 1996-08-23 1998-03-06 Nec Corp 動きべクトル探索方式
JPH1075455A (ja) * 1996-08-30 1998-03-17 Nec Corp 動きベクトル検出回路
JPH11239354A (ja) * 1998-02-23 1999-08-31 Mitsubishi Electric Corp 動きベクトル検出器
JP2004260251A (ja) * 2003-02-24 2004-09-16 Victor Co Of Japan Ltd 動きベクトル検出装置及び動きベクトル検出プログラム
JP2005167976A (ja) * 2003-11-14 2005-06-23 Victor Co Of Japan Ltd 動きベクトル検出装置及び動きベクトル検出プログラム
JP2006025033A (ja) * 2004-07-06 2006-01-26 Sony Corp 画像処理装置および画像処理方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011035569A (ja) * 2009-07-30 2011-02-17 Fujitsu Ltd 動きベクトル検出装置及び動きベクトル検出方法
KR20130006616A (ko) * 2010-03-16 2013-01-17 톰슨 라이센싱 비디오 인코딩 및 디코딩을 위한 암시적인 적응 움직임 벡터 예측자 선택을 위한 방법 및 장치
JP2013523010A (ja) * 2010-03-16 2013-06-13 トムソン ライセンシング ビデオ符号化およびビデオ復号化のための暗示的適応型動きベクトル予測器選択の方法および装置
KR101952606B1 (ko) * 2010-03-16 2019-02-27 톰슨 라이센싱 비디오 인코딩 및 디코딩을 위한 암시적인 적응 움직임 벡터 예측자 선택을 위한 방법 및 장치
KR20140095607A (ko) * 2013-01-23 2014-08-04 한국전자통신연구원 인터 예측 방법 및 그 장치
KR102070719B1 (ko) * 2013-01-23 2020-01-30 한국전자통신연구원 인터 예측 방법 및 그 장치
KR20200126954A (ko) * 2020-01-21 2020-11-09 한국전자통신연구원 인터 예측 방법 및 그 장치
KR102173576B1 (ko) * 2020-01-21 2020-11-03 한국전자통신연구원 인터 예측 방법 및 그 장치
KR20200013254A (ko) * 2020-01-21 2020-02-06 한국전자통신연구원 인터 예측 방법 및 그 장치
KR102281514B1 (ko) * 2020-01-21 2021-07-26 한국전자통신연구원 인터 예측 방법 및 그 장치
KR20210093818A (ko) * 2020-10-28 2021-07-28 한국전자통신연구원 인터 예측 방법 및 그 장치
KR102380722B1 (ko) * 2020-10-28 2022-04-01 한국전자통신연구원 인터 예측 방법 및 그 장치
KR20220044258A (ko) * 2020-10-28 2022-04-07 한국전자통신연구원 인터 예측 방법 및 그 장치
KR102503694B1 (ko) * 2020-10-28 2023-02-24 한국전자통신연구원 인터 예측 방법 및 그 장치
KR20230031862A (ko) * 2020-10-28 2023-03-07 한국전자통신연구원 인터 예측 방법 및 그 장치
KR102618379B1 (ko) * 2020-10-28 2023-12-27 한국전자통신연구원 인터 예측 방법 및 그 장치

Also Published As

Publication number Publication date
JP5044568B2 (ja) 2012-10-10
TW200727710A (en) 2007-07-16
EP1960967A1 (en) 2008-08-27
US8406303B2 (en) 2013-03-26
WO2007078800A1 (en) 2007-07-12
TWI440364B (zh) 2014-06-01
WO2007078800A8 (en) 2007-12-21
EP1960967B1 (en) 2013-03-13
CN101326550A (zh) 2008-12-17
CN101326550B (zh) 2013-12-25
US20070183504A1 (en) 2007-08-09

Similar Documents

Publication Publication Date Title
JP5044568B2 (ja) 予測誘導間引き探索を使用する動き推定
US11856220B2 (en) Reducing computational complexity when video encoding uses bi-predictively encoded frames
EP1430724B1 (en) Motion estimation and/or compensation
US6275532B1 (en) Video coding device and video decoding device with a motion compensated interframe prediction
US8964829B2 (en) Techniques to perform fast motion estimation
RU2381630C2 (ru) Способ и устройство для определения качества соответствия блока
KR100739281B1 (ko) 움직임 추정 방법 및 장치
US11902563B2 (en) Encoding and decoding method and device, encoder side apparatus and decoder side apparatus
US8130835B2 (en) Method and apparatus for generating motion vector in hierarchical motion estimation
KR101396365B1 (ko) 영상의 시공간적 움직임 추정/보상 방법 및 장치
Suh et al. Fast sub-pixel motion estimation techniques having lower computational complexity
EP1393572A2 (en) Method and apparatus for motion vector estimation
KR20010082934A (ko) 움직임 추정 방법 및 장치
JP2006254349A (ja) 動きベクトル検出方法、動きベクトル検出装置およびコンピュータ上で動きベクトル検出処理を実行するコンピュータプログラム
US20050123039A1 (en) Motion estimation method for motion picture encoding and recording medium having program recorded thereon to implement the motion estimation method
KR20050097936A (ko) 효과적인 예측 이미지 파라미터 추정
Lee Fast motion estimation based on search range adjustment and matching point decimation
Huang et al. An adaptively refined block matching algorithm for motion compensated video coding
WO2001099437A2 (en) Method of performing motion estimation
Lee Fast motion estimation based on adaptive search range adjustment and matching error prediction
JP2004088309A (ja) 動きベクトル検出方法、動きベクトル検出装置、動画像符号化方法、動画像符号化装置、通信装置。

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120222

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120229

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120522

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120619

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120713

R150 Certificate of patent or registration of utility model

Ref document number: 5044568

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150720

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250