JP5025645B2 - 動き推定方法 - Google Patents

動き推定方法 Download PDF

Info

Publication number
JP5025645B2
JP5025645B2 JP2008517649A JP2008517649A JP5025645B2 JP 5025645 B2 JP5025645 B2 JP 5025645B2 JP 2008517649 A JP2008517649 A JP 2008517649A JP 2008517649 A JP2008517649 A JP 2008517649A JP 5025645 B2 JP5025645 B2 JP 5025645B2
Authority
JP
Japan
Prior art keywords
pixel
error
candidate
motion vector
candidate motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008517649A
Other languages
English (en)
Other versions
JP2008544676A (ja
Inventor
シウフ カリーナ
デ ハーン ヘーラルト
Original Assignee
トライデント マイクロシステムズ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by トライデント マイクロシステムズ インコーポレイテッド filed Critical トライデント マイクロシステムズ インコーポレイテッド
Publication of JP2008544676A publication Critical patent/JP2008544676A/ja
Application granted granted Critical
Publication of JP5025645B2 publication Critical patent/JP5025645B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

本発明は一般に、開口問題を克服するために改良された動き推定に関するものである。
ビデオ処理の分野における新技術の出現に伴い、動き補償ビデオアルゴリズムが手に届くようになり、そして高品位ビデオ処理にとって必要になっている。高品位ビデオ処理を提供するために、異なる動き補償のアプリケーション(応用)が提供されている。ノイズ低減のための動き補償(MC:Motion Compensated)フィルタリング、符号化のためのMC予測、インターレース(飛越し走査)フォーマットからプログレッシブ(順次走査)フォーマットへの変換のためのMCデインターリーブ(インターリーブされたものを元に戻す)、またはMC画像レート変換のようなアプリケーションが知られている。これらのアプリケーションは動き推定(ME:Motion Estimation)アルゴリズムの恩恵を受け、MEアルゴリズムについては種々の方法が知られている。
ビデオフォーマット変換における動き推定アルゴリズムの一例は、ブロックベースの動き推定器である3D(三次元)回帰探索(3DRS:3D Recursive Search)として知られている。
動き推定アルゴリズムは、画素の輝度またはクロミナンス値は位置の線形関数によって近似することができるという仮定に基づいていた。この仮定は小さい変位のみについて正しい。しかし、この制約は画素ベースの動き推定法(PEL再帰法)によって解決されている。
動き推定の実現はブロック推定も含む。ブロックマッチング(ブロック整合)動き推定アルゴリズムでは、現在フィールドn内のある画素ブロック
Figure 0005025645
の中心
Figure 0005025645
に変位ベクトル
Figure 0005025645
を割り当てることができ、このことは、時間的に隣接したフィールド、例えばフィールドn−1、n+1内の、同じく
Figure 0005025645
を中心とする探索領域
Figure 0005025645
内で類似のブロックを探索することによって行う。この類似のブロックは、
Figure 0005025645
に対して
Figure 0005025645
だけ変位した中心を有し得る。
Figure 0005025645
を見出すために、候補ベクトル
Figure 0005025645
の集合を評価する。候補ベクトル
Figure 0005025645
の集合を評価するために、ブロックの類似度を定量化する誤差(エラー)尺度
Figure 0005025645
を計算する。
探索領域
Figure 0005025645
内の
Figure 0005025645
に対するすべての可能な変位を記述した候補ベクトル
Figure 0005025645
は、
Figure 0005025645
として記述することができ、ここにN、Mは探索領域
Figure 0005025645
を制限する定数である。
完全探索ブロックマッチング処理によって生じた変位ベクトル
Figure 0005025645
は、少なくとも1つの誤差関数
Figure 0005025645
の最小値を生じさせる候補ベクトル
Figure 0005025645
である。この変位ベクトルは、次式:
Figure 0005025645
によって計算することができる。
通常は、最小のマッチング誤差を有するベクトル
Figure 0005025645
をブロック
Figure 0005025645
内のすべての位置
Figure 0005025645
に割り当てる。所定の候補ベクトル
Figure 0005025645
に対する誤差値は、現在ブロック内、及び前のフィールドから(位置が)シフト(移動)したブロック内の画素の輝度値をブロック
Figure 0005025645
全体にわたる総和の関数とすることができる。この誤差値は他の画素値の関数とすることもでき、次式の:
Figure 0005025645
のようにコスト関数の総和として表現することができ、ノンインターレース(順次走査)信号については共通のp=1を選定し、インターレース(飛越し走査)信号については共通のp=2を選定する。コスト関数は例えば、2つの画素ブロック間の絶対差分和(差分絶対和、差分の絶対値の総和)とすることができる。
所定の候補ベクトルの誤差値は、コスト関数または制約関数として考えることもできる。画像内の動きの性質に関係する制約関数は例えば、強度保存の制約または空間コヒーレンスの制約とすることができる。制約の選定は、これらの制約が別個に、直交する解の部分空間をもたらす際に最良である。画像内容からは、可能な動きベクトルの集合に対して、動きの滑らかさ、オブジェクトの慣性、等のような物理的制約を課すことが可能であり得る。数学的には、これらの制約は、動きパラメータ/動きベクトルを変数として有する等式(動きパラメータ/動きベクトルに対する制約)の形をとることができ、最小化すべきコスト関数に加えるか組み合わせることができる。
図1に、上述したブロックマッチング動き推定アルゴリズムを示す。図には、画像シーケンス(列)2の2つの時点n−1、nを示す。画像シーケンス2内では、種々のブロック4を水平位置X及び垂直位置Yに定める。ブロック4の変位
Figure 0005025645
を特定するために、上述した誤差尺度
Figure 0005025645
を適用して、種々の候補ベクトル
Figure 0005025645
8を評価する。1つの可能な誤差関数は、絶対差分和(SAD)の基準であり、次式で表わされ:
Figure 0005025645
ここに、
Figure 0005025645
はブロック4内の画素の輝度値である。現在画像内の複数画素位置
Figure 0005025645
にあるブロック4の中心
Figure 0005025645
に変位ベクトル
Figure 0005025645
を割り当て、このことは、前の画像内または次の画像内の
Figure 0005025645
を中心とする探索領域
Figure 0005025645
6内で類似のブロック10を探索することによって行う。上記前または次の画像は、時間的に前または次の画像またはフィールドとすることができる。従って、2つのブロック4、10間の相関尺度を最適化して、変位ベクトル
Figure 0005025645
を識別することができる。
平均二乗誤差、及び正規化相互相関関数のような別の誤差基準を用いることができる。特に、後者は、フーリエ(周波数)領域内で計算する場合に用いることができる。誤差基準の別な例は、大幅に異なる画素の数とすることができる。上記基準はコスト関数とすることができる。境界条件のような物理的制約は、独立したコスト関数の新たな候補を提供し得る。
ブロックマッチング法は、真の動きベクトルに近い候補ベクトルを見つけることを可能にする。一貫性をさらに改善するために、誤差関数にペナルティ値を加えたペナルティシステムを採用し、このペナルティ値は予測の種類、即ち空間的予測または時間的予測に依存するものとすることができる。
しかし、上述した関数は2次元動きパラメータを完全には特定しない。これらのコスト関数にはいわゆる開口問題があり得る。この問題を克服するために、画像内容についての追加的情報、例えばいくつかの物理的制約、即ち、動きが滑らかである、オブジェクトが慣性を有する、等が必要になり得る。例えば、単一の向きを有するシーケンス、即ちエッジでは、単一エッジの方向に同じベクトル成分を有するすべての候補ベクトルは同じコスト関数を有し得る。従って、SADは動きの二次元成分を完全には特定せず、単にエッジに直交する成分を特定するだけである。SADを単独で用いた動き推定は悪化し、高々、シーケンス、例えばエッジに対する単一方向の一定の接線が定まるに過ぎない。この問題は動き補償の開口問題とも称される。
この問題は、境界条件、あるいはビデオシーケンス内の動きの性質に関する制約のような追加的な誤差関数を同時に課すことによって解決されてきた。動きベクトルの決定における悪化を取り除くために必要な条件は、各制約が、互いに直交する部分空間の解をもたらすべきである、ということである。動きベクトルの解の空間に課される物理的制約(即ち、滑らかな動き、オブジェクトの慣性、境界条件、等)は、解の全体空間を部分空間に分割し得る。ある部分空間内の各動きベクトルは少なくとも1つの制約に従う。2つの物理的制約が独立である際には、これらの制約に対応する部分空間は、互いに独立なベクトルを含み、換言すれば、対応する部分空間が互いに直交する。互いに直交する部分空間を有する候補動きベクトルの集合CSmaxを用いることができる。一般に、誤差関数εmを有するm個の制約の集合は、すべての制約が満たされた場合に、推定動きベクトル
Figure 0005025645
の解をもたらし得る。この推定動きベクトルに対し、総コスト関数はその最小値を有する。この総コスト関数は次式のように計算することができ:
Figure 0005025645
ここに、λmはいくつかの任意の乗算係数である。しかし、その最小値を有する総コスト関数は、個別の制約を必ずしもすべて満足しない。
例えば、1つのコスト関数は、候補動きベクトル
Figure 0005025645
の複数の最小値及びある絶対最小値で悪化し得る。総コスト関数は、1つの制約の局所的最小値において、この制約に対する局所的最小値を有し得る。1つの制約の局所的最小値が他の制約の局所的最小値よりもずっと小さい場合には、他のコスト関数からの非最小の寄与分を補償することができる。従って、総誤差関数は、すべての個別の制約の最小値ではないことがある誤った最小値を生じさせる。こうした場合には、
Figure 0005025645
が次式の不等式:
Figure 0005025645
を満足するのに十分大きいもとのすれば、次式の不等式:
Figure 0005025645
が成り立つ。
従って、本発明の1つの目的は、コスト関数の悪化を克服する解決法を提供することにある。本発明の他の目的は、開口問題を克服する動き推定を提供することにある。本発明の他の目的は、改良された推定動きベクトルを生成する動き推定を提供することにある。
これらの問題の1つ以上を克服するために、本発明は、その一態様によれば、画像信号における推定動きベクトルを決定する方法を提供し、この方法は、信号の画像内の少なくとも1つの画素に対して少なくとも2つの候補動きベクトルを生成するステップと、これらの候補動きベクトル毎に、少なくとも2つの誤差基準を計算するステップと、この誤差基準の非線形関数を最小にする候補動きベクトルを、上記少なくとも1つの画素に対する推定動きベクトルとして選定するステップとを具えている。
本発明の好適例による信号はあらゆる画像シーケンス、例えばビデオシーケンスとすることができる。信号中の画像は画素で構成することができる。これらの画素は、画像の特定部分の輝度及びクロミナンスを記述する画像要素とすることができる。画像内の複数の隣接画素は画素ブロックとして解釈することができる。
画像内の要素は数フレームで見れば動きが生じ得る。この要素の動きは動きベクトルによって記述することができる。動きベクトルは、特定の画素または画素ブロックの移動の向き及び速さを記述することができる。
動き推定は、動きの確率を計算することとして理解することができる。動き推定を用いて、画像内の実際の動きを最も近く記述する動きベクトルを計算することができる。推定した動きベクトルを用いて、インターレース画像をノンインターレースにすることもできる。
候補動きベクトルは、画素または画素ブロックの可能な動きを記述する可能なベクトルの集合とすることができる。候補動きベクトルの集合を用いて、画像内の実際の動きに最も良く合った1つの推定ベクトルを決定することができる。例えば、ノンインターレース化及び時間的アップコンバージョンのような高品位ビデオフォーマット変換アルゴリズム、コンピュータビジョン(コンピュータ映像)のアプリケーション、及びビデオ圧縮は動き推定を必要とし得る。動き推定中の開口問題は、シーン中の動きの性質についての追加的知識がないことから生じる。単純な向き、即ちエッジを含む信号からは、二次元の動き成分は特定されないか、あるいは、高々、エッジに対する接線の方向の定数が定まるに過ぎない。
この不特定性は、コスト関数における複数の最小値、及び動き推定の悪化をもたらす。この悪化は動きベクトルの誤った評価をもたらし、このことはビデオフォーマット変換におけるアーティファクト(歪像)をもたらし得る。本発明の1つの好適例によれば、この問題は、動きの性質に関する異なる制約を有する複数の誤差関数を課すことによって解決される。こうした制約は、強度保存または空間的コヒーレンスとすることができる。制約の選定は、これらの制約が別個に直交の解をもたらすようにすることが好ましい。
候補動きベクトルの集合に対する最も高コストの制約を最小化する、複数の誤差関数の非線形結合の応用は、最適化された動き推定をもたらす。最も高コストのコスト関数が最大値を取り得る。すべてのコスト関数の最大値を最小にすることによって、最も高コストのコスト関数を最小化することができる。
本発明の好適例によれば、上記少なくとも2つの候補動きベクトルは、探索領域内の画素の可能な変位を記述する。こうした変位はx方向及びy方向のものとすることができる。これらのベクトルは、そのx成分及びy成分によって動きの向きを記述することができる。動きの速さはベクトルの絶対値によって記述することができる。
上記少なくとも2つの候補動きベクトルは、本発明の好適例による空間的予測及び/または時間的予測を用いて生成する。例えば、走査画像ラインを提供する走査画像内では、まだ送信されていない画像のブロック内での空間的予測の使用は、因果関係によって妨げられる。代わりに時間的予測を用いることができる。
上記誤差基準は、絶対差分和の基準、平均二乗誤差の基準、正規化相互相関の基準、あるいは主要画素数の基準の少なくとも1つとすることができる。これらの誤差基準は制約として理解することができる。
上記非線形関数は、次式の誤差基準の最大値であり:
Figure 0005025645
ここに、
Figure 0005025645
は、位置
Figure 0005025645
における候補ベクトル
Figure 0005025645
のm番目(m>1)の誤差基準εである。これにより、候補動きベクトルの集合上で最も高コストの制約を最小化することができる。上記非線形関数は、誤差基準の中央値(メジアン)とすることもできる。さらに、少なくとも1つの誤差基準を、補間した画素とフィールド内で補間した画素との絶対差分から計算することができる。誤差基準の少なくとも1つは、現在のフレームまたはフィールドからの画素と、インターレースをノンインターレース化して得られた前または次のフレームまたはフィールドからの動き補償補間された画素との絶対差分から計算することもできる。
インターレース信号での動き推定の改善を提供するために、一般化したサンプリング定理を用いたインターレース信号からの画素値の計算を提供する。
本発明の他の態様は、画像信号における推定動きベクトルを決定するコンピュータプログラムであり、このプログラムは、プロセッサに、上記信号の画像中の少なくとも1つの画素に対して少なくとも2つの候補動きベクトルを生成させ、これらの候補動きベクトル毎に少なくとも2つの誤差基準を計算させ、そして、この誤差基準の非線形関数を最小化する候補動きベクトルを、上記少なくとも1つの画素に対する推定動きベクトルとして選定させるように作用する命令を含む。
本発明の別な態様は、画像信号における推定動きベクトルを決定するためのコンピュータプログラム製品であり、この製品上に読出し可能な形に記憶されたプログラムは、プロセッサに、上記信号の画像内の少なくとも1つの画素に対して少なくとも2つの候補動きベクトルを生成させ、これらの候補動きベクトル毎に少なくとも2つの誤差基準を計算させ、そして、この誤差基準の非線形関数を最小化する候補動きベクトルを、上記少なくとも1つの画素に対する推定動きベクトルとして選定させるように作用する命令を有する。
本発明のこれら及び他の特徴は、以下の実施例を参照した説明より明らかになる。
図1に示すブロックマッチャー(ブロック整合器)は上述した通りである。現在画像n内のブロック4と、前の画像n−1内の探索領域内のテストブロック10とを、候補ベクトル
Figure 0005025645
8を用いて接続する。これら2つのブロック4、10間の相関尺度、整合誤差(マッチエラー)を最適化して、最良の候補ベクトル
Figure 0005025645
8を識別することができる。これにより、異なる候補ベクトル
Figure 0005025645
を用いた異なるテストブロック10をテストすることができ、最良マッチングの候補ベクトルのために整合誤差を最小化することができる。
G.de Haan, "Progress in Motion Estimation for Consumer Video Format Conversion", IEEE transactions on consumer electronics
ブロックマッチャーにおける整合基準の最小値を探索することは、多くの解法が利用可能な二次元最適化問題である。1つの可能な実現は、3ステップのブロックマッチャー、2D(二次元)対数法または横断検索法、あるいは1つずつ探索するブロックマッチングを用いる。異なるブロックマッチング方策は、G.de Haan, “Progress in Motion Estimation for Consumer Video Format Conversion”, IEEE transactions on consumer electronics, 2000年8月の449〜459ページに開示されている。
最適化方策の1つの可能な実現は、3D再帰探索型ブロックマッチャー(3D RS)とすることができる。この3D RSは、ブロックより大きいオブジェクトに対して、最良の候補ベクトルが画素またはブロックの空間的近傍に発生し得ることに対処する。
図2aに示すように、左から右、及び上から下への走査方向を仮定すれば、因果関係が、現在ブロックDc4aの右下にある4つの空間的予測ベクトルDsの使用を妨げる。代わりに、時間的予測ベクトルD 4cを使用する必要がある。現在ブロックDc4aに関しては、探索領域2内では、空間的予測ベクトルDs4b及び時間的予測ベクトルDt4cが利用可能である。既に走査したブロックのみを、現在ブロックDc4aの空間的予測に用いることができるので、空間的予測はブロックDt4cで可能である、というのは、探索領域2の前の時刻からは、ブロックDt4cについての情報が利用可能であり得るからである。
図2に、2つの空間的予測ベクトルDs4b及び1つの時間的予測ベクトルDt4cを用いた現在ブロック4aの予測を示す。
探索範囲内のすべての可能なベクトルを評価することは無意味であることが判明している。空間的に隣接したブロックから取得したベクトルを次式のように評価するだけで既に十分であり得る:
Figure 0005025645
ここに、CSmaxは、前の画像内の探索領域
Figure 0005025645
内の
Figure 0005025645
に対するすべての可能な変位(画素グリッド(格子)上の整数、非整数)を記述する候補ベクトル
Figure 0005025645
の集合として、次式のように定義され:
Figure 0005025645
ここに、n及びmは
Figure 0005025645
を限定する制約である。計算のオーバーヘッドを低減するために、空間的に隣接したブロックCSから取得したベクトル
Figure 0005025645
のみを評価すれば十分であり得る。X、Yはそれぞれ、ブロックの幅及び高さを規定することができる。因果関係、及び実現をパイプライン化する必要性は、すべての隣接ブロックを利用可能にし、初期化時にすべてのベクトルが0になり得ることを防ぐ。
ベクトルの利用可能性を明らかにするために、現在の画像ではまだ計算していないベクトルを、前のベクトルフィールド内の対応する位置から取得する。図2aに、現在ブロックDc4a、及び結果的なベクトルを候補ベクトルとして取得したブロックDs4b、Dt4cの相対位置を示す。ブロックを左上から右下に走査する場合には、候補の集合は次式のように定義することができる:
Figure 0005025645
この候補の集合CSは、空間的及び/または時間的一貫性を暗に仮定する。
初期化時の0ベクトルの問題は、更新ベクトルを加えることによって対処することができる。候補の集合からのいくつかの空間的−時間的予測を省略することの1つの可能な実現を図2bに示し、ここでは候補の集合
Figure 0005025645
を次式のように定義することができ:
Figure 0005025645
ここで、更新ベクトル
Figure 0005025645
及び
Figure 0005025645
は交互に利用可能であり、そして限定された固定の整数または非整数の更新値の集合、例えば次式からとったものである:
Figure 0005025645
平行移動のみより複雑なオブジェクトの動き、例えば回転またはスケーリング(拡大縮小)を記述することのできるモデルは、画像を個別のオブジェクトに区分(セグメント化)すること、及びこれらのオブジェクト毎に動きパラメータの集合を推定することを用いることができる。ブロックの数は通常、オブジェクトの数をずっと大幅に超えるので、画像当たりの計算する必要のある動きパラメータの数を低減する。しかし、計算の複雑性は増加する。
実施例によれば、画素ブロックのオブジェクトを定めることができ、これは画素グループと称することができる。動きパラメータ、例えば画素グループ毎の動きベクトルを決定することができる。候補ベクトルは、現在画像内の画素グループの輝度値と、時間的に隣接する第2画像内のこれらの輝度値に対応する動き補償された輝度値との間の絶対差分和SADを計算することによってテストすることができる。2つの時刻を用いて、局所的画素グループの動きパラメータの集合を推定することができる。
絶対差分和の基準、または上述した他の単一の基準を用いた候補ベクトルからの推定動きベクトルの決定は、二次元動きパラメータを完全には特定しない。図3に概略的に示すように、ビデオコンテンツは1つの単純なエッジ12を含み得る。画像内の動きは、単純なエッジ12の動きであり得る。単一のブロック4についての動き推定は、候補ベクトル8a〜8cを用いて行うことができる。候補動きベクトル8a〜8cに対するテストブロック10a〜10cは、コスト関数の同じ値を生じさせる。その結果、単一のコスト関数を用いても、動きの二次元成分は完全には定まらず、エッジに直交する成分だけである。単一のコスト関数を用意することは悪化であり、高々、エッジの接線方向の定数が定まるに過ぎない。この問題は動き推定における開口問題と称することもできる。
この問題を克服するために、異なるコスト関数を同時に解く。こうしたコスト関数は、境界条件、あるいはビデオシーン中の動きの性質に関する制約とすることができる。動きベクトルの決定における悪化を取り除くための1つの重要な条件は、各コスト関数が互いに直交する部分空間の解をもたらすべきである、ということである。
図4に、異なるコスト関数ε1及びε2を最小化する候補動きベクトルの集合CSmaxのこうした直交する部分空間を示す。コスト関数ε1は候補ベクトル18a〜18eによって特徴付けることができる。コスト関数ε2は、候補ベクトル19a〜19dによって表現することができる。各部分空間は、そのすべての要素が、等しく明確に規定されたエッジに直交する方向の動き成分を有することによって特徴付けられる。両方の制約を同時に課すことは、これら2つの制約の解の部分空間が互いに直交する場合に一意的な解をもたらす。一意的な解は候補ベクトル18c、19cであり得る。
一般に、m個の制約の集合を同時に、候補ベクトルの集合に課すことができる。これらの制約は次式のものとすることができる:
Figure 0005025645
すべての制約を満足すれば、例えばいくつかの値についての絶対最小値
Figure 0005025645
を有すれば、次式の総コスト関数:
Figure 0005025645
も最小値を有し、ここにλm>0である。しかし、総コスト関数が最小であれば、個別の制約は必ずしも満足されない。このことは動き推定におけるアーティファクトをもたらし得る。
この問題を克服するために、本発明の応用はコスト関数全体をより強固にする。このことは、次式のようなコスト関数の非線形結合によって行うことができる:
Figure 0005025645
この非線形性は誤差がより生じにくい。実際に、値
Figure 0005025645
は、残りの制約も局所的最小値または絶対最小値に近い場合のみに、総コスト関数の最小値になり得る。次の不等式は、上記非線形結合についてのみ真である:
Figure 0005025645
図5に、個別のコスト関数ε1、ε2を異なるように計算した際の、これらのコスト関数の総コストに対する効果を示す。曲線20a、20bは個別のコスト関数を示す。曲線20aは2つの局所的最小値及び1つの絶対最小値を有する。コスト関数20bは1つの絶対最小値を有する。
コスト関数20の線形結合では、総コスト関数(ε1,ε2)/2 22は、一方のコスト関数の絶対最小値の所にその最小値を有する。図に示すコスト関数は、2つの任意の制約ε1、ε2の候補ベクトルの集合上での変動を表す。線形コスト関数は制約ε2の最小値の1つに至る。コスト関数の非線形結合MAX(ε1,ε2)を曲線24で示す。この総コスト関数の最小値は、両方の個別の制約に共通の局所的最小値に近い値をとることを強いられる。この例より、総コスト関数は、線形結合よりも各制約の最小値の近くにあることが明らかになる。
制約の非線形結合をインターレースビデオ素材に適用する考えは、インターレース素材の画素は、インターレースの位相次第では常に利用可能とは限らない、という問題を生じさせる。
例えば画素が利用可能でない場合には、位置
Figure 0005025645
において欠落した画素は、ノンインターレース化アルゴリズムによって当該位置で計算した輝度の値に寄与し得る。この画素値を計算するために、一般化したサンプリング定理(GST:Generalized Sampling Theorem)の補間フィルタを用いることによってこの画素値を再構成することができ、このフィルタは、n番目及びn−1番目のフィールドまたはn番目及びn+1番目のフィールドのいずれかからのサンプルを用いることができる。
Figure 0005025645
即ち、n番目及びn±1番目のフィールドを用いたGSTにより、二乗絶対差分誤差関数は次式のようにすることができる:
Figure 0005025645
この第1の制約は、強固な総コスト関数を構成するには不十分である。
連続する2つのフィールド間における偶数個分の画素変位において発生する誤った動きベクトルを回避するために、第2の制約を課すことができる。この第2の制約は、既にノンインターレース化した映像の前のフレームn−1を利用することができる。このことは、現在フィールド内の既存の画素値を推定するための動き補償付きの双線形補間を可能にする。この双線形補間の出力は
Figure 0005025645
によって与えられ、これは、第2の誤差関数を次式のように構成することを可能にする:
Figure 0005025645
第2の制約も単独では強固な総コスト関数を構成することを可能にしない。これらの誤差関数の線形結合を構成することは、単に、これらの基準の一方の解決法からの動き推定基準を交代させるに過ぎない。しかし、本発明によって提供される誤差関数の非線形結合を適用すれば、より強固な動き推定が生じる。
本発明は動き推定のための強固な解決法を提供し、この解決法は異なるビデオフォーマット変換アルゴリズムに適用することができる。直交解をもたらす異なる動き推定基準間の非線形結合を提案する。
ブロックマッチングを例示する図である。 図2a及び2bは、再帰的探索ブロックマッチャーの候補ベクトルの集合を例示する図である。 単一の向きを有するシーケンス上のブロックマッチングを例示する図である。 一意的な解に至り得る直交解の部分空間を例示する図である。 複数の基準コスト関数を例示する図である。

Claims (9)

  1. 画像シーケンスを表現する画像信号における推定動きベクトルを決定する方法において、
    前記画像シーケンス中の画像内の少なくとも1つの画素に対して少なくとも2つの候補動きベクトルを生成するステップであって、前記候補動きベクトルは、前記少なくとも1つの画素の可能な動きを記述するステップと;
    前記候補動きベクトル毎に、少なくとも2つの誤差基準を計算するステップと;
    前記誤差基準の非線形関数を最小にする前記候補動きベクトルを、前記少なくとも1つの画素に対する推定動きベクトルとして選定するステップとを具え、
    前記誤差基準は、互いに直交する部分空間の解を生じさせる制約を課し、
    前記非線形関数が、次式
    Figure 0005025645
    ここに、
    nは、前記画像シーケンス中の前記画像の番号、
    Figure 0005025645
    は、位置
    Figure 0005025645
    における候補ベクトル
    Figure 0005025645
    m番目(m>1)の誤差基準である、
    で表わされる、誤差基準の最大値εである
    ことを特徴とする推定動きベクトルの決定方法。
  2. 前記少なくとも2つの候補動きベクトルが、探索領域内の画素の可能な変位を記述することを特徴とする請求項1に記載の方法。
  3. 前記少なくとも2つの候補動きベクトルのすべてを、空間的予測を用いて生成するか、前記少なくとも2つの候補動きベクトルのすべてを、時間的予測を用いて生成するか、前記少なくとも2つの候補動きベクトルのうち、1つ以上の候補動きベクトルは空間的予測を用いて生成し、他の候補動きベクトルは時間的予測を用いて生成することを特徴とする請求項1に記載の方法。
  4. 前記誤差基準が、
    a)絶対差分和の基準;
    b)平均二乗誤差の基準;
    c)正規化相互相関の基準;
    d)主要画素数の基準
    の少なくとも1つであることを特徴とする請求項1に記載の方法。
  5. 前記非線形関数が、前記誤差基準の中央値であることを特徴とする請求項1に記載の方法。
  6. 前記誤差基準の少なくとも1つを、補間した画素の絶対差分から計算することを特徴とする請求項1に記載の方法。
  7. 前記誤差基準の少なくとも1つを、補間した画素とフィールド内で補間した画素との絶対差分から計算することを特徴とする請求項1に記載の方法。
  8. 前記誤差基準の少なくとも1つを、現在のフレームまたはフィールドからの1つの画素と、インターレースをノンインターレース化して得られた前または次のフレームまたはフィールドからの動き補償補間された画素との絶対差分から計算することを特徴とする請求項1に記載の方法。
  9. 画像シーケンスを表現する画像信号における推定動きベクトルを決定するコンピュータプログラムにおいて、
    プロセッサに、
    前記画像シーケンス中の画像内の少なくとも1つの画素に対して少なくとも2つの候補動きベクトルを生成させ、前記候補動きベクトルは、前記少なくとも1つの画素の可能な動きを記述し;
    前記候補動きベクトル毎に、少なくとも2つの誤差基準を計算させ;
    前記誤差基準の非線形関数を最小にする前記候補動きベクトルを、前記少なくとも1つの画素に対する推定動きベクトルとして選定させる
    ように作用する命令を具え、
    前記誤差基準は、互いに直交する部分空間の解を生じさせる制約を課し、
    前記非線形関数が、次式
    Figure 0005025645
    ここに、
    nは、前記画像シーケンス中の前記画像の番号、
    Figure 0005025645
    は、位置
    Figure 0005025645
    における候補ベクトル
    Figure 0005025645
    のm番目(m>1)の誤差基準である、
    で表わされる、誤差基準の最大値εである
    ことを特徴とするコンピュータプログラム。
JP2008517649A 2005-06-23 2006-06-15 動き推定方法 Expired - Fee Related JP5025645B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP05105634 2005-06-23
EP05105634.9 2005-06-23
EP05106733.8 2005-07-22
EP05106733 2005-07-22
PCT/IB2006/051919 WO2006136983A2 (en) 2005-06-23 2006-06-15 Motion estimation

Publications (2)

Publication Number Publication Date
JP2008544676A JP2008544676A (ja) 2008-12-04
JP5025645B2 true JP5025645B2 (ja) 2012-09-12

Family

ID=37310409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008517649A Expired - Fee Related JP5025645B2 (ja) 2005-06-23 2006-06-15 動き推定方法

Country Status (5)

Country Link
EP (1) EP1897376A2 (ja)
JP (1) JP5025645B2 (ja)
KR (1) KR100942887B1 (ja)
CN (1) CN101288310B (ja)
WO (1) WO2006136983A2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5138048B2 (ja) * 2007-12-19 2013-02-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 適応性動き推定
TWI566586B (zh) 2009-10-20 2017-01-11 湯姆生特許公司 一序列形象的現時區塊之寫碼方法和重建方法
TW201306568A (zh) 2011-07-20 2013-02-01 Novatek Microelectronics Corp 移動估測方法
CN102905124A (zh) * 2011-07-29 2013-01-30 联咏科技股份有限公司 移动估测方法
KR20130030181A (ko) * 2011-09-16 2013-03-26 한국전자통신연구원 움직임 벡터 예측기를 이용한 움직임 벡터 부호화/복호화 방법 및 장치
CN110139100B (zh) * 2019-05-16 2021-07-06 东莞职业技术学院 多图像运动估计的扩展块匹配及运动矢量估计算法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7266151B2 (en) * 2002-09-04 2007-09-04 Intel Corporation Method and system for performing motion estimation using logarithmic search
TWI227641B (en) * 2003-11-11 2005-02-01 Mediatek Inc Method and related apparatus for motion estimation

Also Published As

Publication number Publication date
KR20080041630A (ko) 2008-05-13
WO2006136983A2 (en) 2006-12-28
CN101288310A (zh) 2008-10-15
KR100942887B1 (ko) 2010-02-17
JP2008544676A (ja) 2008-12-04
CN101288310B (zh) 2011-04-13
EP1897376A2 (en) 2008-03-12
WO2006136983A3 (en) 2007-03-22

Similar Documents

Publication Publication Date Title
JP4997281B2 (ja) イメージ中の推定動きベクトルの決定方法、コンピュータプログラムおよびディスプレイ装置
JP5657391B2 (ja) ハローを低減する画像補間
KR100582856B1 (ko) 움직임 추정 및 움직임 보상된 보간법
JP4242656B2 (ja) 動きベクトル予測方法及び動きベクトル予測装置
US8144778B2 (en) Motion compensated frame rate conversion system and method
KR100579493B1 (ko) 움직임 벡터 생성 장치 및 방법
JP5089610B2 (ja) ブロック基盤の動き推定方法及び装置
JP2003259374A (ja) 走査フォーマットの変換装置及び方法
JP5025645B2 (ja) 動き推定方法
KR100727795B1 (ko) 모션 추정
Braspenning et al. True-motion estimation using feature correspondences
US20060098886A1 (en) Efficient predictive image parameter estimation
KR100855976B1 (ko) 배경과 이동 객체를 분리하여 움직임을 추정하는 프레임보간 장치 및 프레임 보간 방법
KR100955415B1 (ko) 움직임 파라미터 세트 및 화상 반복 패턴을 제공하기 위한 방법, 컴퓨터 판독가능 저장 매체 및 집적 회로와, 움직임 파라미터를 제공하기 위한 컴퓨터
US20080144716A1 (en) Method For Motion Vector Determination
KR20070043703A (ko) 비월 비디오 이미지에서의 움직임 추정
WO2004082294A1 (en) Method for motion vector determination
JP5448983B2 (ja) 解像度変換装置及び方法、走査線補間装置及び方法、並びに映像表示装置及び方法
Biswas et al. A novel de-interlacing technique based on phase plane correlation motion estimation
US20090324115A1 (en) Converting the frame rate of video streams
KR20020026042A (ko) 움직임 보상형 보간을 이용한 디-인터레이싱 장치 및 그방법
KR20040054052A (ko) 영역 기반으로 영상 데이터를 보간하기 위한 디인터레이싱장치 및 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110118

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110125

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110221

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110228

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120131

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20120217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120522

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120619

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees