JP2000511366A6 - 4分割ツリーベースの可変ブロックサイズ動き推定装置および方法 - Google Patents
4分割ツリーベースの可変ブロックサイズ動き推定装置および方法 Download PDFInfo
- Publication number
- JP2000511366A6 JP2000511366A6 JP1997518195A JP51819597A JP2000511366A6 JP 2000511366 A6 JP2000511366 A6 JP 2000511366A6 JP 1997518195 A JP1997518195 A JP 1997518195A JP 51819597 A JP51819597 A JP 51819597A JP 2000511366 A6 JP2000511366 A6 JP 2000511366A6
- Authority
- JP
- Japan
- Prior art keywords
- block
- blocks
- child
- distortion
- parent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Abstract
4分割ツリー構造に基づく可変ブロックサイズ(VBS)動き推定を行うための最適な4分割ツリー構造を決定する方法と装置。この方法は、最大ブロックサイズから最小ブロックサイズまでの全4分割ツリーに対する動きベクトルを計算する。次に、本方法は各ブロックにたいする最適量子化器スケールを任意に選択出来る。本方法は次に、“ボトムアップ”から全てのサブブロックまたはサブノード(子供)の符号化による歪みの和を、そのサブノード(子供)に分割したブロックまたはノード(親)の符号化による歪みと比較する。前記子供の符号化による歪みの和が前記親の歪みより大きければ、そのノードを合成する。反対に、前記子供の符号化による歪みの和が前記親の歪みより小さければ、そのノードを分割し、前記親に対するラグランジェコストをその子供達のラグランジェコストの和として設定する。このステップを、最適な4分割ツリー構造が得られるまで全てのレベルの全てのノードに対して反復する。
Description
発明の属する技術分野
本願は1995年10月25日出願の米国仮出願No.60/007,017並びに1996年6月28日出願の米国仮出願No.60/020,514の利益を請求するものである。
本発明は、ビデオ画像シーケンスを符号化する方法と装置に関する。より詳細には、本発明は4分割ツリーベースの(quadtree-based)可変ブロックサイズの動きを推定するための動きベクトルを決定する際の計算オーバヘッドを減少させるための装置とそれに関連する方法に関する。
発明の背景
ディジタルビデオ技術の発展は、ビデオ圧縮コーデック(コーダ(符号器)/デコーダ(復号器))の高いコストの削減と異なるメーカの装置の互換性の解決が益々重要な問題になっている。これらの目的を達成するために、MPEG(Moving Picture Experts Group:動画専門家グループ)はMPEGによるISO/IEC国際規格11172(1991)(一般にMPEG−1フォーマットと呼ばれる)及びISO/IEC国際規格13818(1995)(一般にMPEG−2フォーマットと呼ばれる)が作成されており、参照のために、ここに完全引用する。しかしながら、MPEGは有効なビットストリームを生成するのに必要な特有のアルゴリズムを規定していない。
動き推定に関して、MPEGは各画像のための動きベクトルを計算する特有のアルゴリズムを定義しない。動きベクトルは、現在画像中の1ブロックの座標位置から参照フレーム内座標までのオフセットを提供するために計算される二次元ベクトルである。動きベクトルを用いることにより、現在フレーム内の変分だけを符号化し伝送すればよいので、伝送路で伝送する情報量が削減でき、画像圧縮をかなり向上させる。
一般的に、動きベクトルは固定サイズのブロックにつき計算される。先行参照画像をもとに各ブロックの動きに“最良”整合を求めて探索した後に各ブロック毎に1つの動きベクトルが生成される。しかしながら、大きいブロックサイズは一般に劣った動き推定となることから、大きな動き補償フレーム差分(誤差信号)を生み出す。反対に、小さいブロックサイズは一般に優れた動き推定となり、計算の複雑度が増大し、より多くの動きベクトルを受信側に伝送するためにオーバヘッドが増大する。このように、高い動きベクトルオーバーヘッドと良好な動き推定とのバランスが可変ブロックサイズ動き推定方法の眼目になる。
図1に任意可変のブロックサイズと位置を用いて画像を分割するという方法による動き推定の1つの方法を示す。この分割構造を伝送するための計算オーバヘッドは非常に高価で、例えば、ブロック毎の位置とサイズを記述する際のビットコストは非常に高い。
さらに、図1には所定の画像に対する最適なブロックサイズの決定という第2の問題がある。1つの方法は、全数探索を行うことであり、全ての可能な構造を所定の深さ又は許容ブロックサイズ数に分析する。4分割ツリー構造(以下に記述する)において、必要な探索数は全ての可能なサブツリーの数と同じであり、下記の帰納関係式で与えられる。
Cf(d)=1+(Cf(d−1))4 (1)
式中、dは木の最大深さ、Cf(d)はdと同じか又はそれ以下の深さを
9*10307となり、これは多くの実装にとって実際的でない。
従って、当該技術分野において、4分割ツリーによる可変ブロックサイズ動き推定のための動きベクトルを計算する際の計算処理のオーバヘッドを減少させる装置と方法が必要とされている。
発明の概要
本発明は、4分割ツリーによる可変ブロックサイズ(VBS:Variable Block-Size)の動き評価のための最適な4分割ツリー構造の計算装置と方法である。この方法は先ず全ての可能なノード位置の動きベクトルを計算する。即ち、画像全体を全てのノードにつき最低レベルまで空間的に区分する。本方法は次に、“ボトムアップ”から全てのサブブロック又はサブノード(子供)の符号化による歪みの和を、そのサブノード(子供)に分割したブロックまたはノード(親)の符号化による歪みと比較する。子の符号化による歪みの和がその親の符号化による歪みより大きい場合は、そのノードは“合成(merge)”される。反対に、子の符号化による歪みの和がその親の符号化による歪みより小さい場合、そのノードは“分割(split)”され、親ノードに対するラグランジェコストはその子のラグランジェのコストの和として設定される。このステップは最適な4分割ツリー構造が得られるまで全てのレベルを通し全てのノードに対し反復される。
図面の簡単な説明
本発明の内容は、下記の詳細な説明を添付の図面を参照して検討すれば容易に理解出来るであろう。
図1は、任意の可変ブロックのサイズと位置を画像の分割に用いる動き推定のブロック図である。
図2は、本発明による装置のブロック図である。
図3は、4分割ツリー構造を示すブロック図である。
図4は、親ノードとその子ノードのラグランジェコスト間の関係を示す図である。
図5は、4分割ツリー構造と量子化器スケールの共同最適化のフローチャートである。
図6は、VBS動き推定とFBS動き推定間の信号対雑音比(SNR)の比較を示す図である。
図7は、VBS動き推定とFBS動き推定間のビットレートの比較を示す図である。
図8は、VBS動き推定のための輝度ビット、動きベクトルビット及び4分割ツリービットの結果を示す図である。
図9は、セールスマンシーケンスのVBS動き推定時にフレーム60に対し使用した4分割ツリー構造を示す図である。
図10は、ウェーブレットの階層的サブバンド分解を示す図である。
図11は、ウェーブレットの階層的サブバンド分解のためのサブサンプル画像の3世代の場合の親子関係を示す図である。
図12は、ウェーブレットベースの本装置のブロック図である。
図13は、均等ブロックサイズ構造を示す図である。
図14は、アフィン動きモデルの不規則ブロック形状構造を示す図である。
図15は、4分割ツリー構造動き補償グリッドを示す図である。
図16は、図15の可変ブロックのアフィン動き構造を示す図である。理解を容易にするために、可能な範囲で図面に共通な同一要素には同じ参照番号を付してある。
発明の実施の形態
本発明の装置と方法は、最適化問題を解くためのラグランジェの乗数処理により開発された。条件付き最適化問題は4分割ツリー構造(図3を参照して以下に記述する)と各ノードに対する量子化器スケールを、総歪みDが総ビットバジェット拘束条件Rbudget、に基づきに最小になるように同時に決定することである。この問題は、下式により表現される。
式中、SはVBS動き推定用の4分割ツリーであり、Q=Q(S)は4分割ツリーS中の全ノードに対する量子化器スケールの集まり、RはSとQに対応するビットレートである。
この問題は、ラグランジェ乗数λ≦0に対応するラグランジエコストL(S,Q)=D(S,Q)+λR(S,Q)を導入することにより無条件最小化問題のパラメータ化されたファミリー問題に変えられ、この問題は、次式で表される。
このように、式(3)の解(S*,Q*)はRbudget=R(S*,Q*)の特定なケースの式(2)の解でもある。さらに、R(S*,Q*)をRbudgetに等しくさせるλ*を持つ式(3)中の無条件最適問題の解を得て、次に(S*,Q*)で式(2)の中の条件付き問題を解決する。λとR(S,Q)間には単調な関係(逆比例)があるので、λ*に等しいλを0から∞まで走査して得る(図5を参照し以下に説明する)。
最後に、式(3)のラグランジェのコストを4分割ツリーの最適化と量子化器スケールの最適化に分解する。サブツリーSの1つのノードをnで表し、Sに属する全てのnの集合をAsで表す。コストは各ノードにおけるコストの合計として表現される。
式中、Lnはノードnに対するラグランジェコストであり、q(n)はそのノードに対する量子化器スケールである。上記の分解により、式(3)の共同最小化問題は2つの独立した最小化問題になる。1つは、Sに関し、もう1つはQに関する。
式中、AQはすべての許容される量子化器スケールの集合である。式(5)を解くために、最初のステップとして全4分割ツリー中の全てのノードに対する最良の量子化器スケール問題を解く。次のステップでは、前記ノードのラグランジェコストを最小にする最良のサブツリーSを決定する。式(5)の問題の解法について図2と図5を参照し、以下に詳述する。図2には、4分割ツリーに基づく可変ブロックサイズの動きを推定するための動きベクトルを計算する際の計算処理オーバヘッドを減少させる本発明による装置200のブロック図である。本発明のこの好ましい実施例において、装置200はより複雑な可変ブロックに基づく動き補償符号化システムの部分または符号器である。装置200は、ブロック動き推定モジュール240と、動き補償モジュール250と、レートコントロルモジュール230と、離散コサイン変換(DCT)モジュール260と、量子化(Q)モジュールと270と、可変長符号化(VLC)モジュール280と、バッファ(BUF)290と、逆量子化(Q-1)モジュール275と、逆DCT(DCT-1)変換モジュール265と、減算器215と加算器255より成る。装置200は複数のモジュールから成るが、当業者には種々のモジュールで実行される機能は図2に示すように別々のモジュールに分離しないでも良いことは理解できるであろう。例えば、動き補償モジュール250と逆量子化モジュール275と逆DCT変換モジュール265とより成るモジュール1式は通常“埋め込み復号器”として知られている。
図2には、パス210に入力画像(画像シーケンス)が示されており、この入力画像はディジタル化され、MPEG規格に一致した1つの輝度信号と2つの異なる色信号(Y,Cr,Cb)として表現される。これらの信号は、さらに、複数の層(シーケンス、画像グループ、画像、スライスおよびブロック)に分けられ、各画像(フレーム)は異なる寸法を有する複数のブロックにより表現される。1枚の画像をブロック単位に分けることにより、2枚の連続する画像間の変化を識別する能力を改善(下記に説明する)し、低振幅の変換係数の除去により画像の圧縮度を改善する。ディジタル化信号は、適当なウィンドウ、分解能と入力フォーマットを選択するためのフォーマットのような予備処理を適宜施される。好ましい実施例において、許容されるブロックサイズとブロックの位置は、図3に示すように4分割ツリー構造によって指示される。
図3に、5つのレベルを有する4分割ツリー構造の概念を示す。この4分割ツリー構造は可変サイズのブロックを許容するが、ブロックサイズと位置を予め定義された構造に制限する。
図示のように、4分割ツリー構造は完全な画像の単一ブロック310より成る初期レベル“0”から始まる。特に、初期ブロックは256×256ブロックであり、全ての入力画像はこのブロックサイズに切り落とす。4分割ツリー構造をさらに第2レベル“1”に区分する場合は、初期ブロックは4つのブロック320に分割する。ブロック320をさらに区分する必要があれば、各ブロック320を4つのブロック350に分割し、さらにブロック340に区分し、さらにサブブロック350等々にと区分することが出来る。この好ましい実施例の場合、許容されるブロックサイズのセットは、{8,16,32,64,128,256}である。換言すれば、6層の4分割ツリー構造を選択している。しかしながら、当業者ならば、他のツリー構造および/または異なる層数を採用して本発明を変更できることは理解できるであろう。例えば、この4分割ツリーを、各ブロックを次のレベルで16ブロックに分割する“16分割ツリー”として実施出来る。
4分割ツリー構造は、より大きな動き推定を要する有意義差(動き情報)がある画像領域により小さいブロックを指定する効率的な方法を提供する。例えば、図3の4分割ツリー構造は、右上“分割”ブロック320に変位を有している画像に適している。他の“合成(merged)”ブロック320中の情報は参照画像と比較し変位を含んでおらず、より大きい歪みを導入する条件を付けることなくより大きいブロックサイズに対する動きベクトルで符号化出来る。
このように、この4分割ツリー構造は、図3の(破線で囲んだ)ブロック360又は図1のブロックで表すような任意のブロックサイズと配置を許さない。この制限は4分割ツリー構造をツリーずつするために受信側(図示せず)に送る情報を単純化する。例えば、図3の4分割ツリー構造は13データビット、例えば、1,0100,0100,0100(コンマはデータセットの部分ではない)で有効に記述出来る。しかしながら、当業者ならば4分割ツリーを構造を記述するためにデータビットを用いる種々の方法を採用でき、例えば、頻繁に使用する4分割ツリー構造等を表現するために短縮ビットパターンを用いることは理解できよう。4分割ツリーを使用しなければ、各画像毎に受信側へブロック数、各々のブロックサイズ及び各々のブロック位置を記述するには何百ものビットを必要とする。このように、4分割ツリーのブロックサイズの可変度と位置に関するこの制限は、その構造を伝送する際のビットを削減することで相殺される。
図2に戻り、パス210の入力ビデオ画像は、動きベクトルを推定するために可変ブロック動き推定モジュール240に入力される。この可変ブロック動き推定モジュール240は、特に、画像全体に対する全ての可能なノード位置の動きベクトルを計算する。即ち、この4分割ツリーは満開、即ち、画像全体を全てのノードにつき空間的に最低レベルまで分割していると仮定する。かように、最大ブロックサイズから最小ブロックサイズまで4分割ツリー全体につき動きベクトルを計算する。
可変ブロック動き推定モジュール240からの動きベクトルは、サンプル値の予測の効率を改善するために動き補償モジュール250に送られる。この動き補償処理は、予測誤差を形成するために用いる、先に復号されたサンプル値を含んでいる過去及び/又は未来の基準フレームにオフセットを供給する動きベクトルを用いた予測処理を含んでいる。即ち、この動き補償モジュール250は先に復号されたフレームと動きベクトルを使用して現フレームの推定を構成する。
さらに、所定ブロックに対する動き補償予測の前に、符号化モードを選択しなければならない。符号化モード決定領域において、MPEGは、複数の異なる符号化モードを規定している。一般に、これらの符号化モードは、2つの広い分類、インターモード(inter mode)符号化及びイントラモード(intra mode)符号化に大別される。イントラモード符号化は、1つのブロック又は1枚の画像を、同ブロックまたは同画像からの情報のみを用いて符号化する。これに反し、インターモード符号化は、1つのブロック又は1枚の画像を、同ブロックまたは同画像からの情報と異なる時間に発生したブロック又は画像からの情報の両方を用いて符号化する。特に、MPEG−2はイントラモードと、動き補償なし(No MC)モードと、フレーム/フィールド/デュアル-プライム(dual-prime)動き補償インターモードと、前方/後方/平均インターモードと、フィールド/フレームDCTモードを符号化モードを含む符号化モードを規定している。各ブロックに対するモードを正しく選択することによって、符号化の性能特性が向上する。符号器の設計者は、符号化モードを決定実施するために種々の方法を使用することが出来る。
符号化モードを選択すると、動き補償モジュール250は過去及び/又は未来の参照画像に基づきブロック内容の動き補償予測(予測画像)をパス252上に生成する。パス252上のこの動き補償画像をパス210上の現ブロック中のビデオ画像から減算器215で差し引いてパス253上に誤差信号または予測残差信号を形成する。この予測残差信号の形成により、入力ビデオ画像中の冗長情報が有効に除去される。即ち、伝送チャンネルで実際のビデオ画像を伝送する代わりに、ビデオ画像の予測を生成するに必要な情報と予測誤差のみを送信する。これにより、送信を要するデータ量をかなり削減できる。ビットレートをさらに削減するために、パス253上の予測残差信号をDCTモジュール260に送り符号化する。
DCTモジュール260は前方離散コサイン変換プロセスを予測残差信号の各ブロックに適用し、8×8ブロックのDCT係数のセットを生成する。DCT係数の8×8ブロック数は各ブロックのサイズに依存する。この離散コサイン変換は可逆離散直交変換であり、そこでのDCT係数はコサイン基関数の集合(セット)の振幅を表す。離散コサイン変換の利点は、DCT係数が無相関であることである。DCT係数の無相関は圧縮の場合に重要である。何故なら、各係数は圧縮効率の損失無く個別に処理できるからである。さらに、DCT基関数又はサブバンド分割は、量子化の次の段階のために重要である視覚心理判定基準(psychovisual criteria)の有効使用を可能にする。
量子化モジュール270は生成された8×8ブロックのDCT係数を受け取り量子化する。量子化プロセスは、DCT係数を量子化値のセットで割り適当に丸めて整数値にして表現し精度を低減させる。量子化値は、(視覚的に重みづけた量子化として知られる)基関数の可視性(visibility)に基づく判定基準を用いて各DCT係数毎に個別に設定出来る。即ち、量子化値は、所定基関数の可視性に対する閾値、即ち、人間の目により正確に検出できる係数振幅に該当する。DCT係数をこの値で量子化することにより、多数のDCT係数を“0”値に変換し、画像圧縮効率を向上させることができる。この量子化プロセスは画質を達成し、符号器を制御して出力を所定のビットレートに整合させる(レートコントロールの)ための重要な処理であり、重要なツールである。異なる量子化値を各DCT係数に適用できるので、“量子化マトリックス”を参照テーブル、例えば、輝度量子化テーブルまたは色量子化テーブルとして一般に設定する。このように、符号器は変換ブロック中の各周波数の量子化方法を決定する量子化マトリックスを選択する。
しかしながら、量子化誤差の主観的知覚は、周波数によってかなり変化し、周波数が高いほど粗い量子化値を使用できる有利さがある。即ち、人間の量子化誤差に対する知覚感度は空間周波数が高いほど低くなる。従って、高い周波数は、低い周波数より少ない許容値でより粗く量子化する。さらに、正確な量子化マトリックスは、このような意図するディスプレイの特性、視距離、画像源のノイズ量等の多数の外部パラメータに左右される。このように、応用又はフレームの個別シーケンスに対しても特殊な量子化マトリックスを適合させることは可能である。一般に、カスタム化した量子化マトリックスを圧縮ビデオ画像と共にコンテキスト(context)として保管できる。量子化器のスケールはレートコントローラ230によリ正しく選択される。図5を参照して以下に説明する。
次に、可変長符号化モジュール280は信号コネクタ271を介して8×8ブロックの量子化DCT係数を受信し、量子化係数の二次元ブロックを“ジグザグ”順序で走査し量子化係数の一次元の列に変換する。このジグザグ走査順序はDCT係数を最低空間周波数から最高空間周波数までの近似遂次順序である。量子化は一般に高い空間周波数のDCT係数を0に減小させるので、代表的には量子化DCT係数の一次元列を若干の整数とそれに続くゼロ列で表現する。
可変長符号化(VLC)モジュール280が量子化DCT係数の列と、ブロック形式及び動きベクトルのような全てのサイド情報を符号化する。VLCモジュール280は符号化効率を有効に改善するために可変長符号化とランレングス符号化を用いる。可変長符号化は可逆符号化プロセスであり、短い符号語(code-word)を頻度の高い事象に指定し、長い符号語を頻度の低い事象に指定する。一方、ランレングス符号化は記号列を単一記号で符号化することで符号化効率を高める。これらの符号化スキームは当該技術において公知であり、整数長符号語を使用する時にハフマン符号化と称されることも多い。かようにVLCモジュール280は入力ビデオ画像を有効データストリームに変換する最終段階を実行する。
データストリームは“先入れ先出し(FIFO)”バッファ290に保管される。異なる画像形式と可変長符号化を用いる結果、FIFOバッファへの総ビットレートは可変である。即ち、各フレームを符号化するために使用するビット数は異なり得る。固定レートチャンネルを含む用途の場合、FIFOバッファを使用し符号器の出力をビットレートを平滑化するためのチャンネルに整合させる。このようにして、FIFOバッファ290の出力信号は入力ビデオ画像210の圧縮表現となり、パス295で記憶媒体または電気通信チャンネルに送られる。
レートコントロールモジュール230はデータストリーム送信後、復号側(受信機又は目的の記憶装置(図示せず)内)でのオーバフローとアンダーフローを防止するためにFIFOバッファ290に入力するデータストリームのビットレートを監視し調整する働きをする。固定レートチャンネルが復号器内の入力バッファへ一定のレートでビットを入力すると仮定する。画像レートにより決まる一定の間隔で、復号器は入力バッファから次の画像用の全てのビットを即座に移動する。入力バッファ中のビットが少なすぎる、即ち、次の画像用の全ビットが受信されていない場合、入力バッファはアンダーフローになりエラーを生じる。同様に、入力バッファ中のビットが多すぎる、即ち、入力バッファが一画像と他画像の開始点間で容量超過になっていると、入力バッファはオーバフローになリオーバフローエラーを生じる。このように、レートコントロールモジュール230の役割は、バッファ290の状態を監視し符号器が生成するビット数を調整し、オーバフロー及びアンダーフロー状態を防止する。レートコントロールのアルゴリズムは、画像の質と圧縮効率に重要な役割を演じる。
現在、ビットレートを制御する1つの方法として量子化プロセスを変える方法があり、これは、入力画像の歪みに影響を与える。量子化器スケール(ステップサイズ)を変えることにより、ビットレートを変えて制御することができる。実例で説明すれば、バッファがオーバーフローに向かっている場合は、量子化器スケールを増加させねばならない。この動作により、量子化プロセスは追加のDCT係数を“ゼロ”値まで減じ、1つのブロックを符号化するのに必要なビット数を減少させる。これにより、実際にビットレートを減じ、潜在的なオーバフロー状態を除去する。
反対に、バッファがアンダーフローの方向に向かっている場合、量子化器のスケールを減少させねばならない。この動作により、非ゼロ(non-zero)量子化DCT係数の数が増加し、1つのブロックを符号化するのに必要なビット数を増加させる。このように、ビットレートを増加し潜在的なオーバフロー状態を除去する。
本発明の好ましい実施例において、レートコントロールモジュール230は、各ノードにおける各ブロック毎に量子化器スケールを、完全なツリー中の全てのノードのラグランジェのコストを計算し各ノードに対する最良の量子化器スケールを発見して選択する。即ち、各ブロックを量子化器スケール(1−31)の完全セットで符号化し最小のラグランジェのコストを生じる量子化器スケールをそのブロックに対して選択する。尚、当業者ならば異なる数値の量子化器スケールを使用できることは容易に理解できよう。量子化器スケールと4分割ツリー構造との合同最適化(joint optimization)方法につき、図5を参照し以下に詳述する。
量子化モジュール270からの量子化DCT係数の8×8ブロックは、信号接続272を介して逆量子化モジュール275にも送られる。この段階で、符号器200は、次の符号化の参照フレームとして使用するために、データを復号して入力ビデオ画像のIフレームとPフレームを生成する。この逆量子化モジュール275は量子化DCT係数を逆量子化することにより復号プロセスを開始する。即ち、量子化DCT係数に量子化値のセットを乗じ、しかるべく整数値に丸める。
逆量子化した8×8ブロックのDCT係数を逆DCTモジュール265に送る。該モジュールは各ブロックを逆離散コサイン変換(DCT)し復号エラー信号を生成する。このエラー信号を、動き補償モジュールからの予測信号に加算器255を用いて加算し復号参照画像(再構成画像)を生成する。一般に、Iフレーム又はPフレームを復号して保管し、同時に最も古い保管参照フレームを除去する。
適切な4分割ツリー構造を選択するために、装置200は“ボトムアップ”(最低レベルから最高レベルまで)の方向で、全サブブロックまたはサブノード(子供)の符号化による歪みの合計をサブノードに区分されたブロック又はノードの符号化歪みと比較する。即ち、親ノードのラグランジェコストを子供ノードのラグランジェコストと比較して、その親を分割するか併合する。子供の符号化歪みの合計が親の符号化歪みより大きい場合、そのノードを“合成”する。反対に、子供の符号化歪みの合計が親の符号化歪みより小さい場合、そのノードを“分割”し、親ノードのラグランジェコストをその子供のラグランジェコストの合計として設定する。このステップを最適4分割ツリー構造が得られるまで、全てのレベルの全てのノードに対し反復する。
上述の枝刈り方法を説明するために、図4にレベルi(i番目のレベル)の位置j(j番目の位置)における親ノードを示し、その子供のラグランジェコストをLi jで表す。その子供ノードのラグランジェコストを次のように表し、そのノードを合成する。もしくは、そのノードを分割する。
この方法は、式(1)の全数探索法と比較して、計算オーバヘッドをかなり減少させる。この木の枝刈り法の複雑度は、ラグランジェコストの比較回数に比例する。この回数は、ボトムレベル(レベルd)を除く4分割ツリーの全ノード数と一致する。このように、複雑度は、次式で表される。
d=5の場合、複雑度Cp(5)は341である。このように、本方法は全数探索法に比し、約10305倍の非常に有効な削減を達成する。
さらに、この方法は、完全に開花したツリーから開始し、木の上から下への“トップダウン”比較(探索パターン)に付随する極小を避けられるので最適な解が得られる。
図5に、本発明の好ましい実施例における4分割ツリー構造と量子化器スケールの合同最適化処理のフローチャートを示す。この方法500は4分割ツリー構造の各ブロックに対する最適な量子化器スケールを有する最適な4分割ツリー構造を導出するために公式化されている。その解は画像に割り当てられたバジェットビットレートを満足し、符号化画像の総歪みを最小にする。
以下、図5を参照して説明する。本方法はステップ505より始まり、ステップ510に進む。この方法は全ての可能なノード位置のベクトルを計算する。本方法は4分割ツリーの完全な開花、即ち、全画像を全てのノードにつき最低レベルまで空間的に区分することを保証する。このように、最大ブロックサイズから最小ブロックサイズまで全4分割ツリーに対する動きベクトルを計算する。全ブロックに対する動きベクトルをステップ520に送り、適当な量子化器スケールを計算する。
ステップ520において、本方法は各ノードに対する量子化を最適化する。本方法は全ての可能な量子化器スケール(例えば、1−31)につき、各ブロックの歪みを計算し比較する。即ち、各ブロックを1から31までの量子化器スケールの完全セットで符号化し、ラグランジェコストを最小にする量子化器スケールをそのブロックに対して選択する。
ステップ530において、本方法は、iをd−1に等しく設定する。ここで、iは現在の深さレベルであり、dは最深レベルである。本方法は、ボトムアップから最適の4分割ツリーの探索を開始する。ステップ540において、本方法は、最低レベルから最高レベルまで、現在の親レベルnのラグランジエコストLnをその子供ノードcのラグランジェコストLcの合計と比較する。実際に、本方法は、全てのサブブロックまたはサブノード(子)の符号化歪みの合計をそのサブノードに区分したブロックまたはノード(親)の符号化歪みと比較する。子供の符号化歪み(ラグランジェコスト)の合計が、親の符号化歪みより大きい場合、そのノードを合成する。反対に、子供の符号化歪み(ラグランジェコスト)の合計が、親の符号化歪みより小さい場合、そのノードを分割し、親ノードに対するLnをその子供のLcの合計として設定する。Ln←ΣLcの効果は極小問題を除去する。この高速枝刈り法は、方法500を適当なハードウェアにおいてリアルタイムで実施できるように最適4分割ツリー構造を決定する際の計算複雑度を有効に減少させる。
ステップ550において、方法500は現レベルで残っている追加ノードがあるか問い合わせる。問い合わせに対する答えが肯定であれば、方法500はステップ540に戻り、次のノードの枝刈りをするかどうかを決定する。前記問い合わせに対する回答が否定であれば、方法500はステップ560に進む。
ステップ560において、方法500は、プロセスが4分割ツリーの最高レベル又はルート(root)まで到達したか問い合わせる。問い合わせに対する答えが否定であれば、方法500はステップ530に戻り、ステップ540と550を、次のレベルを枝刈りするまで繰り返す。前記問い合わせに対する回答が肯定であれば、本方法500はステップ570に進む。
ステップ570において、方法500は、選択したλがR(S*,Q*)をRbudgetに等しくするλ*と等しいか問い合わせる。本発明において、ラグランジェの乗数が固定されているものと仮定する。しかしながら、この乗数λはλを0から無限大までの範囲で掃き出す(sweep)ことにより反復計算できる。すなわち、掃き出し(sweep)の間に、R*(λ)の値がRbudgetに等しくなるようなS*,Q*及びR*(λ)の解のセットを得る。R(λ)は単調減少関数であるので、2分探索を用いて先述のビットバジェット制約条件に対する歪みを最小にする所望のλを計算する。例えば、λ*は下記の関係式から選択することができる。
式中、(R1とD1)と(R2とD2)のセットは、任意に選択した2つのλ1とλ2に対するビットレートと歪みである。一般に、λ1は0のような低い数値に設定し、λ2は1、000、000のような高い数値に設定する。式(7)から計算されたλ*を使用し、その値がR*(λ)をRbudgetに等しくする適切な数値であるかを調べる。λ*が適切なλでなければ、式(7)に使用し、λ1またはλ2を置き換え、新しいλ*を計算する。この反復プロセスは、R*(λ)がRbudgetより少ないかまたは等しくなるまで継続する。一般に、λ*は10回以下の反復で得ることができる。
しかしながら、当業者ならば、多くの2分探索法(バイナリサーチ)があり、記述の方法は式(7)に限定されないことは容易に理解できよう。このようなアルゴリズムは、Yair Shoham及びAllen Gersho、“量子化器の任意セットに対する有効なビット割り当て”、IEEEの音響、音声及び信号処理に関する会報、第36巻、No.9(1988年9月)に詳述されている。
このように、本方法500は、ステップ570において選択したλがR*(λ)をRbudgetに等しくするλ*に等しくないと判定すると、ステップ520に戻り、式(7)に従って異なるλを用いて本方法を繰り返す。問い合わせに対する回答が肯定であれば、方法500はステップ575に進み方法を終了するか、本方法を次の画像に対し繰り返す。
尚、本発明の複雑度をさらに低減するために、ステップ数を削減し方法を簡素化することが可能である。第1の簡素化は、先行画像のラグランジェ乗数を現在の画像のラグランジェ乗数として使用することにより、図5のステップ570を除去することである。第2の簡素化は、所与のサブツリーの全てのノードまたは4分割ツリーSの全体に対し同一の量子化器スケールを採用することである。
最後の第3の簡素化は、4分割ツリー探索のためにグリーディ(Greedy)アルゴリズムを使用することである。所望の構造を得るために、完全4分割ツリーの枝刈りの代わりに、上記のツリー枝刈リアルゴリズムと同一のラグランジェコストの比較規則を使用し、4分割ツリーをトップからボタムまでグリーディに成長させることができる。このグリーディ法の場合、全ての可能なノードに対しレート−歪みデータを生成する必要はない。成長中のツリーのノードに対するデータのみが計算を要する。しかしながら、この方法により得た解は極小問題のために最適ではない。
セールスマンシーケンスでのシミュレーションを行い、最適VBS動き推定の性能と16×16の固定ブロックサイズ(FBS)の従来の動き推定の性能を比較した。比較のために、同じ量子化器スケールの最適化ルーチンと同じ残差符号器を両方の場合に使用する。さらに、輝度(Y)のみを符号化し、前方動き補償のみを用いて符号化の遅れを減少させる。このシミュレーションはセールスマンシーケンスの120フレームを256×256のサイズに刈り込み(crop)、フレームレートをビットレート64キロビット/秒に対し10フレーム/秒とした。
図6と図7に、セールスマンシーケンスに対する信号ノイズ比(SNR)の結果と64kb/sec.時のビットレート結果を示す。VBS動き推定方法はFBS動き推定方法より1.7デシベルだけ向上する。VBS方法の場合の平均SNRとFBS方法の場合の平均SNRは各々32.54デシベルと30.84デシベルであった。
図8には、輝度データと、動きベクトルと、4分割ツリー表現のビットレート曲線を示す。図9には、セールスマンシーケンスのフレーム60に対しVBS法で使用した最適4分割ツリーを示す。
第2の好ましい実施例においては、上記の方法をウェーブレットベースのスキームに適用する。ウェーブレットベースの補償は、1992年3月にカリフオルニア州サンフランシスコ市にて開催された音響、音声及び信号処理に関する国際会議の議事録第・巻、657-660頁)に記載されている圧縮技法である。同資料には、階層サブバンド分解又はウェーブレット変換を行い、ゼロツリーを含む階層的遂次近似エントロピー符号化量子化器を後続する信号圧縮システムが記述されている。マルチ解像度階層サブバンド表現を用いる信号データの表現はBurt他によりIEEEの通信に関する会報(第31巻、No.4、1993年4月、533頁)に開示されている。臨界サンプリング直交ミラーフィルター(critically sampled quadrature-mirror filter)(QMF)サブバンド表現とも呼ばれるウェーブレットピラミッドは画像のマルチ解像度階層的サブバンド表現である。このウェーブレットピラミッドはPentrand他が1991年4月8-11日に米国ユタ州スノーバード市にて開催されたデータ圧縮会議の論文集中で開示している。QMFサブバンドピラミッドは、“サブバンド画像符号化”(J.W.Wood編、Kluwer Academic出版社、1991年)と“ウェーブレットに関する10の講義”(I.Daubechies,工業及び応用数学の学会(SIAM)、米国ペンシルヴアニア州フィラデルフィア,1992年)に記述されている。また、フレーム間(インターフレーム)ウェーブレットビデオ圧縮スキームが、1996年2月27日に発行された動画像復号化に関する米国特許No.5,495,292に開示されている。
さらに、ウェーブレットに基づく圧縮技法が、1995年5月2日に発行された米国特許No.5,412,741に開示されており、本明細書においてもこれを参照する。同技法は、階層画像表現のために埋込みゼロツリーウェーブレット(EZW)の導出に離散ウェーブレット変換(DWT)を使用することを記述している。この階層表現は、次に、エントロピー符号化を使用して有効に符号化される。
ウェーブレットの階層サブバンド分解の場合、画像は2回ずつサンプリングされ高水平−高垂直(HH)周波数サブバンド、高水平−低垂直(HL)周波数サブバンド、低水平−高垂直(LH)周波数サブバンド、低水平−低垂直(LL)周波数サブバンドに分解される。LLサブバンドはさらに2回ずつサブサンプリングされて、HH,HL,LH及びLLのサブバンドのセット(組)を生成する。このようなサンプリングを繰り返し、図10に示すような列(アレイ)を3度のサブサンプリングにより生成する。好ましくは、6回のサブサンプリングを実施する。親子関係は親ノードのサブバンドから子ノードのサブバンドを指す矢印で示される。最低周波数サブバンドは左上のLL1であり、最高周波数サブバンドは右下のHH3である。この例の場合、全ての子ノードは1人の親を持つ。
図11に、サブサンプリングされた画像の3世代の親子関係を示す。1人の親ノード72は、4度のサブサンプリングによる画像中の同一領域に対応する4人の子ノード74を有する。各子ノード74はさらに4度のサブサンプリングによる4つの対応する次世代の子ノード76を持つ。
図12に、4分割ツリーに基づく可変ブロックサイズの動き推定のための動きベクトルを決定する際の計算オーバヘッドを減少させるために、ウェーブレット変換方法を実施する本発明の装置1200のブロック図を示す。本発明の好ましい実施例において、装置1200は符号器又はより複雑な可変ブロックベースの動き補償符号化システムの一部分である。この装置1200は、図2に示す装置200につき記述したモジュールと略同一のモジュールより成る。両者の違いは、DCTモジュール260と逆DCTモジュール265とVLCモジュール280をDWTモジュール1260と逆DWTモジュール1265とウェーブレット符号化モジュール1280で各々置き換えていることである。ウェーブレット符号化モジュールは、ゼロツリー符号化及び/又はエントロピー符号化のような異なる符号化方式を任意数内蔵できる。装置1200の機能は、入力ビデオ画像でウェーブレット変換を行うことを除き、装置200の機能と同じである。
しかしながら、ウェーブレットベースの方法は、ブロック間の独立性を許さない。従って、各個別ブロックの正確なコスト計算を行うのは非常に難しい。
このように、ウェーブレットベースの方法は、歪みのモデルを使用し、ビットレートに対する動きベクトルビットだけを計数する。符号化歪みを、予測誤差MSEの定数倍によって近似させる。この定数は実験的に決められ、MSEは予測残差の平均二乗誤差であり、原画像と復号フレーム間の差ではない。十分な時間的相関性が仮定できれば、ラグランジェの乗数は、先行フレームの残差符号化のレート歪みカーブの傾斜により近似できる。
第2のウェーブレットベースの方法では、親ノードとその子ノードの総フレーム・ラグランジェ・コストだけを比較する。この総コストを計算するために、隣接ブロックのブロック区分を先行4分割ツリーの枝刈り結果によって定める。枝刈りがなされていない区域のブロック区分は最小ブロックサイズ(最低レベル)によって定める。
第3の実施例において、本発明の可変4分割ツリー構造はアフィン動きモデルと共に可変ブロックサイズアフィン動きモデルを生成するのに用いる。アフィン動きモデルはJ.Nieweglowski他により“ディジタル画像のワーピング(warping)を利用するテンポラル(時間的)予測ベースの新規ビデオ符号化スキーム“(IEEE会報、コンシューマエレクトロニクス、第39巻3、141-150頁、1993年8月)に開示されており、本明細書でも参照する。このアフィン動きモデルは、“画像のワーピング”として知られる幾何学的変換を適用し先行画像から予測画像又はフレームを構成する。この変換により、先行画像と予測画像中の各点間の空間的関係が規定される。
一般に、ブロックマッチング法を使用する動き補償は平行移動に関し良好な統合性能を提供する。しかしながら、ブロックマッチングによる動き推定は動きが回転成分又はスケーリング成分(例えば、ズーミング又は回転イメージ)を含んでいる場合、良い成果は得られない。
これに反し、アフィン動きモデル(アフィン変換)は6つのパラメータ(a1からa6)により定められ、下式のように表現される。
式中、(x,y)は先行フレーム中の画素座標であり、(u,v)は予測フレーム中の所定画素の座標である。J.Nieweglowski他の参考資料に6つのパラメータの計算方法が詳細に記述されている。アフィン関係は6つのパラメータを特徴とする。このように、アフィン動きモデルは、一般的に、自然なシーケンスのみならずディジタル効果を用いた合成画像においてしばしば観察される平行移動(translation)、スケーリングおよび回転のような動きを予測する場合により有効である。
実際に、アフィン動きモデルはフレーム毎の全体の動き補償に用いるか、又は、ブロックベースの動き補償フレームワークと連結して使用できる。前者の場合、オーバヘッド情報が少ないと云う利点があるが、しかし、局部の動きをよく把握できない。極端な場合、アフィン動きモデルを全体的な動き補償の場合のようなフレームレベルに構築してしまう。
同様に、後者の場合も局所的回転、平行移動及びスケーリングの動きに良く適合するが、相対的に“固定された”ブロックサイズ条件は幾分制限的である。即ち、アフィン動きモデルは、(例えば、図13に示す完全開花4分割ツリー構造)の一様なパッチブロックと比較して、不規則なブロック形状(図14)を含んでいるが、現有の符号器に実装できるように設計されている。このように、“グリッドポイント”の個数を従来の動き補償ブロックの個数と同じになるように選択する。
さらに特定すると、グリッドポイントのセットを先行フレーム上で選択する。動きは、現フレーム上で上記のグリッドポイントに最も良くマッチするポイントを発見して推定する。別案では、グリッドポイントのセットを現フレーム上で選択しプロセスを逆にすることができ、動きは、先行フレーム上で上記のグリッドポイントに最も良くマッチするポイントを発見して推定する。
アフィン動きモデルにおける主な問題は、非常に小さい画像ブロック(例えば、16×16マクロブロック)に対するアフィンパラメータの推定である。反復勾配(iterative gradient)ベースの方法は、最初のポイントが正確に選択されないと収斂しない。アフィンパラメータの計算は種々の方法でなされる。しかしながら、Tihao ChiangとYa-Qin Zhangが“ステレオビデオ符号化”(1995年10月にニューヨークにて開催された<マルチメディアとビデオ符号化>に関する国際シンポジウムの論文集)に記述しているように、ピラミッド法をアフィンパラメータの評価のために良好な始点を発見するために使用でき、この論文を本明細書に参照する。このように、本4分割ツリーベースの可変ブロックサイズの動き推定のフレームワーク(図15に示される)は同様なやり方で拡張し、可変ブロックサイズアフィン動きモデル(図16に示される)を生成する。即ち、“アフィン”4分割ツリーが完全に開花し、即ち、全体画像を図14に示すように全てのノードに対し最下位レベルまで空間的に区分したと仮定する。最大ブロックサイズから最小ブロックサイズまでアフィン4分割ツリー全体に対する動きベクトルを計算する。この方法は、前述の如く各ノードに対する量子化を最適化するために任意に実行する。最小の歪みを生み出す量子化器スケールを選択する。
同様に、本方法は、(最低レベルから最高レベルまで)“ボトムアップ”しながら、全ての“アフィン”サブブロック又はサブノード(子供)の符号化歪みの合計をサブノードに区分したブロック又はノード(親)の符号化歪みと比較する。子供の符号化歪みの合計が親の符号化歪みより大きい場合、そのノードを“合成”する。反対に、子供の符号化歪みの合計が親の符号化歪みより小さい場合、そのノードを“分割”し、親ノードのラグランジェコストをその子供のラグランジェコストの合計として設定する。このステップを(例えば、図16に図示のような)最適なアフィン4分割ツリー構造が得られるまで全てのレベルの全てのノードに対し反復する。
可変ブロックサイズアフィン動きモデルは、異なる形状の画像分割を補償する能力を有するので、より良い予測特性を達成でき、提案されているMPEG4規格ビデオ(MPEG4規格の作成は現在進行中)のビデオ・オブジェクト平面(VOP)を有効に符号化する能力を向上させる。
以上、4分割ツリーベースの可変ブロックサイズ動き推定のために動きベクトルを算定する際の計算オーバヘッドを減少させるための新規な装置とその方法を説明してきた。本発明の多くの変更、修正、変種及び他の使用と応用は、実施態様を開示しているこの明細書読み添付の図面を参照すれば、当業者には明らかになるであろう。尚、このような改変,変更、変形及び他の使用と応用はすべて、本発明の精神と範囲から逸脱するものではなく、本発明により包含されるとみなされ、以下の特許請求範囲にのみ限定される。
本願は1995年10月25日出願の米国仮出願No.60/007,017並びに1996年6月28日出願の米国仮出願No.60/020,514の利益を請求するものである。
本発明は、ビデオ画像シーケンスを符号化する方法と装置に関する。より詳細には、本発明は4分割ツリーベースの(quadtree-based)可変ブロックサイズの動きを推定するための動きベクトルを決定する際の計算オーバヘッドを減少させるための装置とそれに関連する方法に関する。
発明の背景
ディジタルビデオ技術の発展は、ビデオ圧縮コーデック(コーダ(符号器)/デコーダ(復号器))の高いコストの削減と異なるメーカの装置の互換性の解決が益々重要な問題になっている。これらの目的を達成するために、MPEG(Moving Picture Experts Group:動画専門家グループ)はMPEGによるISO/IEC国際規格11172(1991)(一般にMPEG−1フォーマットと呼ばれる)及びISO/IEC国際規格13818(1995)(一般にMPEG−2フォーマットと呼ばれる)が作成されており、参照のために、ここに完全引用する。しかしながら、MPEGは有効なビットストリームを生成するのに必要な特有のアルゴリズムを規定していない。
動き推定に関して、MPEGは各画像のための動きベクトルを計算する特有のアルゴリズムを定義しない。動きベクトルは、現在画像中の1ブロックの座標位置から参照フレーム内座標までのオフセットを提供するために計算される二次元ベクトルである。動きベクトルを用いることにより、現在フレーム内の変分だけを符号化し伝送すればよいので、伝送路で伝送する情報量が削減でき、画像圧縮をかなり向上させる。
一般的に、動きベクトルは固定サイズのブロックにつき計算される。先行参照画像をもとに各ブロックの動きに“最良”整合を求めて探索した後に各ブロック毎に1つの動きベクトルが生成される。しかしながら、大きいブロックサイズは一般に劣った動き推定となることから、大きな動き補償フレーム差分(誤差信号)を生み出す。反対に、小さいブロックサイズは一般に優れた動き推定となり、計算の複雑度が増大し、より多くの動きベクトルを受信側に伝送するためにオーバヘッドが増大する。このように、高い動きベクトルオーバーヘッドと良好な動き推定とのバランスが可変ブロックサイズ動き推定方法の眼目になる。
図1に任意可変のブロックサイズと位置を用いて画像を分割するという方法による動き推定の1つの方法を示す。この分割構造を伝送するための計算オーバヘッドは非常に高価で、例えば、ブロック毎の位置とサイズを記述する際のビットコストは非常に高い。
さらに、図1には所定の画像に対する最適なブロックサイズの決定という第2の問題がある。1つの方法は、全数探索を行うことであり、全ての可能な構造を所定の深さ又は許容ブロックサイズ数に分析する。4分割ツリー構造(以下に記述する)において、必要な探索数は全ての可能なサブツリーの数と同じであり、下記の帰納関係式で与えられる。
Cf(d)=1+(Cf(d−1))4 (1)
式中、dは木の最大深さ、Cf(d)はdと同じか又はそれ以下の深さを
9*10307となり、これは多くの実装にとって実際的でない。
従って、当該技術分野において、4分割ツリーによる可変ブロックサイズ動き推定のための動きベクトルを計算する際の計算処理のオーバヘッドを減少させる装置と方法が必要とされている。
発明の概要
本発明は、4分割ツリーによる可変ブロックサイズ(VBS:Variable Block-Size)の動き評価のための最適な4分割ツリー構造の計算装置と方法である。この方法は先ず全ての可能なノード位置の動きベクトルを計算する。即ち、画像全体を全てのノードにつき最低レベルまで空間的に区分する。本方法は次に、“ボトムアップ”から全てのサブブロック又はサブノード(子供)の符号化による歪みの和を、そのサブノード(子供)に分割したブロックまたはノード(親)の符号化による歪みと比較する。子の符号化による歪みの和がその親の符号化による歪みより大きい場合は、そのノードは“合成(merge)”される。反対に、子の符号化による歪みの和がその親の符号化による歪みより小さい場合、そのノードは“分割(split)”され、親ノードに対するラグランジェコストはその子のラグランジェのコストの和として設定される。このステップは最適な4分割ツリー構造が得られるまで全てのレベルを通し全てのノードに対し反復される。
図面の簡単な説明
本発明の内容は、下記の詳細な説明を添付の図面を参照して検討すれば容易に理解出来るであろう。
図1は、任意の可変ブロックのサイズと位置を画像の分割に用いる動き推定のブロック図である。
図2は、本発明による装置のブロック図である。
図3は、4分割ツリー構造を示すブロック図である。
図4は、親ノードとその子ノードのラグランジェコスト間の関係を示す図である。
図5は、4分割ツリー構造と量子化器スケールの共同最適化のフローチャートである。
図6は、VBS動き推定とFBS動き推定間の信号対雑音比(SNR)の比較を示す図である。
図7は、VBS動き推定とFBS動き推定間のビットレートの比較を示す図である。
図8は、VBS動き推定のための輝度ビット、動きベクトルビット及び4分割ツリービットの結果を示す図である。
図9は、セールスマンシーケンスのVBS動き推定時にフレーム60に対し使用した4分割ツリー構造を示す図である。
図10は、ウェーブレットの階層的サブバンド分解を示す図である。
図11は、ウェーブレットの階層的サブバンド分解のためのサブサンプル画像の3世代の場合の親子関係を示す図である。
図12は、ウェーブレットベースの本装置のブロック図である。
図13は、均等ブロックサイズ構造を示す図である。
図14は、アフィン動きモデルの不規則ブロック形状構造を示す図である。
図15は、4分割ツリー構造動き補償グリッドを示す図である。
図16は、図15の可変ブロックのアフィン動き構造を示す図である。理解を容易にするために、可能な範囲で図面に共通な同一要素には同じ参照番号を付してある。
発明の実施の形態
本発明の装置と方法は、最適化問題を解くためのラグランジェの乗数処理により開発された。条件付き最適化問題は4分割ツリー構造(図3を参照して以下に記述する)と各ノードに対する量子化器スケールを、総歪みDが総ビットバジェット拘束条件Rbudget、に基づきに最小になるように同時に決定することである。この問題は、下式により表現される。
式中、SはVBS動き推定用の4分割ツリーであり、Q=Q(S)は4分割ツリーS中の全ノードに対する量子化器スケールの集まり、RはSとQに対応するビットレートである。
この問題は、ラグランジェ乗数λ≦0に対応するラグランジエコストL(S,Q)=D(S,Q)+λR(S,Q)を導入することにより無条件最小化問題のパラメータ化されたファミリー問題に変えられ、この問題は、次式で表される。
このように、式(3)の解(S*,Q*)はRbudget=R(S*,Q*)の特定なケースの式(2)の解でもある。さらに、R(S*,Q*)をRbudgetに等しくさせるλ*を持つ式(3)中の無条件最適問題の解を得て、次に(S*,Q*)で式(2)の中の条件付き問題を解決する。λとR(S,Q)間には単調な関係(逆比例)があるので、λ*に等しいλを0から∞まで走査して得る(図5を参照し以下に説明する)。
最後に、式(3)のラグランジェのコストを4分割ツリーの最適化と量子化器スケールの最適化に分解する。サブツリーSの1つのノードをnで表し、Sに属する全てのnの集合をAsで表す。コストは各ノードにおけるコストの合計として表現される。
式中、Lnはノードnに対するラグランジェコストであり、q(n)はそのノードに対する量子化器スケールである。上記の分解により、式(3)の共同最小化問題は2つの独立した最小化問題になる。1つは、Sに関し、もう1つはQに関する。
式中、AQはすべての許容される量子化器スケールの集合である。式(5)を解くために、最初のステップとして全4分割ツリー中の全てのノードに対する最良の量子化器スケール問題を解く。次のステップでは、前記ノードのラグランジェコストを最小にする最良のサブツリーSを決定する。式(5)の問題の解法について図2と図5を参照し、以下に詳述する。図2には、4分割ツリーに基づく可変ブロックサイズの動きを推定するための動きベクトルを計算する際の計算処理オーバヘッドを減少させる本発明による装置200のブロック図である。本発明のこの好ましい実施例において、装置200はより複雑な可変ブロックに基づく動き補償符号化システムの部分または符号器である。装置200は、ブロック動き推定モジュール240と、動き補償モジュール250と、レートコントロルモジュール230と、離散コサイン変換(DCT)モジュール260と、量子化(Q)モジュールと270と、可変長符号化(VLC)モジュール280と、バッファ(BUF)290と、逆量子化(Q-1)モジュール275と、逆DCT(DCT-1)変換モジュール265と、減算器215と加算器255より成る。装置200は複数のモジュールから成るが、当業者には種々のモジュールで実行される機能は図2に示すように別々のモジュールに分離しないでも良いことは理解できるであろう。例えば、動き補償モジュール250と逆量子化モジュール275と逆DCT変換モジュール265とより成るモジュール1式は通常“埋め込み復号器”として知られている。
図2には、パス210に入力画像(画像シーケンス)が示されており、この入力画像はディジタル化され、MPEG規格に一致した1つの輝度信号と2つの異なる色信号(Y,Cr,Cb)として表現される。これらの信号は、さらに、複数の層(シーケンス、画像グループ、画像、スライスおよびブロック)に分けられ、各画像(フレーム)は異なる寸法を有する複数のブロックにより表現される。1枚の画像をブロック単位に分けることにより、2枚の連続する画像間の変化を識別する能力を改善(下記に説明する)し、低振幅の変換係数の除去により画像の圧縮度を改善する。ディジタル化信号は、適当なウィンドウ、分解能と入力フォーマットを選択するためのフォーマットのような予備処理を適宜施される。好ましい実施例において、許容されるブロックサイズとブロックの位置は、図3に示すように4分割ツリー構造によって指示される。
図3に、5つのレベルを有する4分割ツリー構造の概念を示す。この4分割ツリー構造は可変サイズのブロックを許容するが、ブロックサイズと位置を予め定義された構造に制限する。
図示のように、4分割ツリー構造は完全な画像の単一ブロック310より成る初期レベル“0”から始まる。特に、初期ブロックは256×256ブロックであり、全ての入力画像はこのブロックサイズに切り落とす。4分割ツリー構造をさらに第2レベル“1”に区分する場合は、初期ブロックは4つのブロック320に分割する。ブロック320をさらに区分する必要があれば、各ブロック320を4つのブロック350に分割し、さらにブロック340に区分し、さらにサブブロック350等々にと区分することが出来る。この好ましい実施例の場合、許容されるブロックサイズのセットは、{8,16,32,64,128,256}である。換言すれば、6層の4分割ツリー構造を選択している。しかしながら、当業者ならば、他のツリー構造および/または異なる層数を採用して本発明を変更できることは理解できるであろう。例えば、この4分割ツリーを、各ブロックを次のレベルで16ブロックに分割する“16分割ツリー”として実施出来る。
4分割ツリー構造は、より大きな動き推定を要する有意義差(動き情報)がある画像領域により小さいブロックを指定する効率的な方法を提供する。例えば、図3の4分割ツリー構造は、右上“分割”ブロック320に変位を有している画像に適している。他の“合成(merged)”ブロック320中の情報は参照画像と比較し変位を含んでおらず、より大きい歪みを導入する条件を付けることなくより大きいブロックサイズに対する動きベクトルで符号化出来る。
このように、この4分割ツリー構造は、図3の(破線で囲んだ)ブロック360又は図1のブロックで表すような任意のブロックサイズと配置を許さない。この制限は4分割ツリー構造をツリーずつするために受信側(図示せず)に送る情報を単純化する。例えば、図3の4分割ツリー構造は13データビット、例えば、1,0100,0100,0100(コンマはデータセットの部分ではない)で有効に記述出来る。しかしながら、当業者ならば4分割ツリーを構造を記述するためにデータビットを用いる種々の方法を採用でき、例えば、頻繁に使用する4分割ツリー構造等を表現するために短縮ビットパターンを用いることは理解できよう。4分割ツリーを使用しなければ、各画像毎に受信側へブロック数、各々のブロックサイズ及び各々のブロック位置を記述するには何百ものビットを必要とする。このように、4分割ツリーのブロックサイズの可変度と位置に関するこの制限は、その構造を伝送する際のビットを削減することで相殺される。
図2に戻り、パス210の入力ビデオ画像は、動きベクトルを推定するために可変ブロック動き推定モジュール240に入力される。この可変ブロック動き推定モジュール240は、特に、画像全体に対する全ての可能なノード位置の動きベクトルを計算する。即ち、この4分割ツリーは満開、即ち、画像全体を全てのノードにつき空間的に最低レベルまで分割していると仮定する。かように、最大ブロックサイズから最小ブロックサイズまで4分割ツリー全体につき動きベクトルを計算する。
可変ブロック動き推定モジュール240からの動きベクトルは、サンプル値の予測の効率を改善するために動き補償モジュール250に送られる。この動き補償処理は、予測誤差を形成するために用いる、先に復号されたサンプル値を含んでいる過去及び/又は未来の基準フレームにオフセットを供給する動きベクトルを用いた予測処理を含んでいる。即ち、この動き補償モジュール250は先に復号されたフレームと動きベクトルを使用して現フレームの推定を構成する。
さらに、所定ブロックに対する動き補償予測の前に、符号化モードを選択しなければならない。符号化モード決定領域において、MPEGは、複数の異なる符号化モードを規定している。一般に、これらの符号化モードは、2つの広い分類、インターモード(inter mode)符号化及びイントラモード(intra mode)符号化に大別される。イントラモード符号化は、1つのブロック又は1枚の画像を、同ブロックまたは同画像からの情報のみを用いて符号化する。これに反し、インターモード符号化は、1つのブロック又は1枚の画像を、同ブロックまたは同画像からの情報と異なる時間に発生したブロック又は画像からの情報の両方を用いて符号化する。特に、MPEG−2はイントラモードと、動き補償なし(No MC)モードと、フレーム/フィールド/デュアル-プライム(dual-prime)動き補償インターモードと、前方/後方/平均インターモードと、フィールド/フレームDCTモードを符号化モードを含む符号化モードを規定している。各ブロックに対するモードを正しく選択することによって、符号化の性能特性が向上する。符号器の設計者は、符号化モードを決定実施するために種々の方法を使用することが出来る。
符号化モードを選択すると、動き補償モジュール250は過去及び/又は未来の参照画像に基づきブロック内容の動き補償予測(予測画像)をパス252上に生成する。パス252上のこの動き補償画像をパス210上の現ブロック中のビデオ画像から減算器215で差し引いてパス253上に誤差信号または予測残差信号を形成する。この予測残差信号の形成により、入力ビデオ画像中の冗長情報が有効に除去される。即ち、伝送チャンネルで実際のビデオ画像を伝送する代わりに、ビデオ画像の予測を生成するに必要な情報と予測誤差のみを送信する。これにより、送信を要するデータ量をかなり削減できる。ビットレートをさらに削減するために、パス253上の予測残差信号をDCTモジュール260に送り符号化する。
DCTモジュール260は前方離散コサイン変換プロセスを予測残差信号の各ブロックに適用し、8×8ブロックのDCT係数のセットを生成する。DCT係数の8×8ブロック数は各ブロックのサイズに依存する。この離散コサイン変換は可逆離散直交変換であり、そこでのDCT係数はコサイン基関数の集合(セット)の振幅を表す。離散コサイン変換の利点は、DCT係数が無相関であることである。DCT係数の無相関は圧縮の場合に重要である。何故なら、各係数は圧縮効率の損失無く個別に処理できるからである。さらに、DCT基関数又はサブバンド分割は、量子化の次の段階のために重要である視覚心理判定基準(psychovisual criteria)の有効使用を可能にする。
量子化モジュール270は生成された8×8ブロックのDCT係数を受け取り量子化する。量子化プロセスは、DCT係数を量子化値のセットで割り適当に丸めて整数値にして表現し精度を低減させる。量子化値は、(視覚的に重みづけた量子化として知られる)基関数の可視性(visibility)に基づく判定基準を用いて各DCT係数毎に個別に設定出来る。即ち、量子化値は、所定基関数の可視性に対する閾値、即ち、人間の目により正確に検出できる係数振幅に該当する。DCT係数をこの値で量子化することにより、多数のDCT係数を“0”値に変換し、画像圧縮効率を向上させることができる。この量子化プロセスは画質を達成し、符号器を制御して出力を所定のビットレートに整合させる(レートコントロールの)ための重要な処理であり、重要なツールである。異なる量子化値を各DCT係数に適用できるので、“量子化マトリックス”を参照テーブル、例えば、輝度量子化テーブルまたは色量子化テーブルとして一般に設定する。このように、符号器は変換ブロック中の各周波数の量子化方法を決定する量子化マトリックスを選択する。
しかしながら、量子化誤差の主観的知覚は、周波数によってかなり変化し、周波数が高いほど粗い量子化値を使用できる有利さがある。即ち、人間の量子化誤差に対する知覚感度は空間周波数が高いほど低くなる。従って、高い周波数は、低い周波数より少ない許容値でより粗く量子化する。さらに、正確な量子化マトリックスは、このような意図するディスプレイの特性、視距離、画像源のノイズ量等の多数の外部パラメータに左右される。このように、応用又はフレームの個別シーケンスに対しても特殊な量子化マトリックスを適合させることは可能である。一般に、カスタム化した量子化マトリックスを圧縮ビデオ画像と共にコンテキスト(context)として保管できる。量子化器のスケールはレートコントローラ230によリ正しく選択される。図5を参照して以下に説明する。
次に、可変長符号化モジュール280は信号コネクタ271を介して8×8ブロックの量子化DCT係数を受信し、量子化係数の二次元ブロックを“ジグザグ”順序で走査し量子化係数の一次元の列に変換する。このジグザグ走査順序はDCT係数を最低空間周波数から最高空間周波数までの近似遂次順序である。量子化は一般に高い空間周波数のDCT係数を0に減小させるので、代表的には量子化DCT係数の一次元列を若干の整数とそれに続くゼロ列で表現する。
可変長符号化(VLC)モジュール280が量子化DCT係数の列と、ブロック形式及び動きベクトルのような全てのサイド情報を符号化する。VLCモジュール280は符号化効率を有効に改善するために可変長符号化とランレングス符号化を用いる。可変長符号化は可逆符号化プロセスであり、短い符号語(code-word)を頻度の高い事象に指定し、長い符号語を頻度の低い事象に指定する。一方、ランレングス符号化は記号列を単一記号で符号化することで符号化効率を高める。これらの符号化スキームは当該技術において公知であり、整数長符号語を使用する時にハフマン符号化と称されることも多い。かようにVLCモジュール280は入力ビデオ画像を有効データストリームに変換する最終段階を実行する。
データストリームは“先入れ先出し(FIFO)”バッファ290に保管される。異なる画像形式と可変長符号化を用いる結果、FIFOバッファへの総ビットレートは可変である。即ち、各フレームを符号化するために使用するビット数は異なり得る。固定レートチャンネルを含む用途の場合、FIFOバッファを使用し符号器の出力をビットレートを平滑化するためのチャンネルに整合させる。このようにして、FIFOバッファ290の出力信号は入力ビデオ画像210の圧縮表現となり、パス295で記憶媒体または電気通信チャンネルに送られる。
レートコントロールモジュール230はデータストリーム送信後、復号側(受信機又は目的の記憶装置(図示せず)内)でのオーバフローとアンダーフローを防止するためにFIFOバッファ290に入力するデータストリームのビットレートを監視し調整する働きをする。固定レートチャンネルが復号器内の入力バッファへ一定のレートでビットを入力すると仮定する。画像レートにより決まる一定の間隔で、復号器は入力バッファから次の画像用の全てのビットを即座に移動する。入力バッファ中のビットが少なすぎる、即ち、次の画像用の全ビットが受信されていない場合、入力バッファはアンダーフローになりエラーを生じる。同様に、入力バッファ中のビットが多すぎる、即ち、入力バッファが一画像と他画像の開始点間で容量超過になっていると、入力バッファはオーバフローになリオーバフローエラーを生じる。このように、レートコントロールモジュール230の役割は、バッファ290の状態を監視し符号器が生成するビット数を調整し、オーバフロー及びアンダーフロー状態を防止する。レートコントロールのアルゴリズムは、画像の質と圧縮効率に重要な役割を演じる。
現在、ビットレートを制御する1つの方法として量子化プロセスを変える方法があり、これは、入力画像の歪みに影響を与える。量子化器スケール(ステップサイズ)を変えることにより、ビットレートを変えて制御することができる。実例で説明すれば、バッファがオーバーフローに向かっている場合は、量子化器スケールを増加させねばならない。この動作により、量子化プロセスは追加のDCT係数を“ゼロ”値まで減じ、1つのブロックを符号化するのに必要なビット数を減少させる。これにより、実際にビットレートを減じ、潜在的なオーバフロー状態を除去する。
反対に、バッファがアンダーフローの方向に向かっている場合、量子化器のスケールを減少させねばならない。この動作により、非ゼロ(non-zero)量子化DCT係数の数が増加し、1つのブロックを符号化するのに必要なビット数を増加させる。このように、ビットレートを増加し潜在的なオーバフロー状態を除去する。
本発明の好ましい実施例において、レートコントロールモジュール230は、各ノードにおける各ブロック毎に量子化器スケールを、完全なツリー中の全てのノードのラグランジェのコストを計算し各ノードに対する最良の量子化器スケールを発見して選択する。即ち、各ブロックを量子化器スケール(1−31)の完全セットで符号化し最小のラグランジェのコストを生じる量子化器スケールをそのブロックに対して選択する。尚、当業者ならば異なる数値の量子化器スケールを使用できることは容易に理解できよう。量子化器スケールと4分割ツリー構造との合同最適化(joint optimization)方法につき、図5を参照し以下に詳述する。
量子化モジュール270からの量子化DCT係数の8×8ブロックは、信号接続272を介して逆量子化モジュール275にも送られる。この段階で、符号器200は、次の符号化の参照フレームとして使用するために、データを復号して入力ビデオ画像のIフレームとPフレームを生成する。この逆量子化モジュール275は量子化DCT係数を逆量子化することにより復号プロセスを開始する。即ち、量子化DCT係数に量子化値のセットを乗じ、しかるべく整数値に丸める。
逆量子化した8×8ブロックのDCT係数を逆DCTモジュール265に送る。該モジュールは各ブロックを逆離散コサイン変換(DCT)し復号エラー信号を生成する。このエラー信号を、動き補償モジュールからの予測信号に加算器255を用いて加算し復号参照画像(再構成画像)を生成する。一般に、Iフレーム又はPフレームを復号して保管し、同時に最も古い保管参照フレームを除去する。
適切な4分割ツリー構造を選択するために、装置200は“ボトムアップ”(最低レベルから最高レベルまで)の方向で、全サブブロックまたはサブノード(子供)の符号化による歪みの合計をサブノードに区分されたブロック又はノードの符号化歪みと比較する。即ち、親ノードのラグランジェコストを子供ノードのラグランジェコストと比較して、その親を分割するか併合する。子供の符号化歪みの合計が親の符号化歪みより大きい場合、そのノードを“合成”する。反対に、子供の符号化歪みの合計が親の符号化歪みより小さい場合、そのノードを“分割”し、親ノードのラグランジェコストをその子供のラグランジェコストの合計として設定する。このステップを最適4分割ツリー構造が得られるまで、全てのレベルの全てのノードに対し反復する。
上述の枝刈り方法を説明するために、図4にレベルi(i番目のレベル)の位置j(j番目の位置)における親ノードを示し、その子供のラグランジェコストをLi jで表す。その子供ノードのラグランジェコストを次のように表し、そのノードを合成する。もしくは、そのノードを分割する。
この方法は、式(1)の全数探索法と比較して、計算オーバヘッドをかなり減少させる。この木の枝刈り法の複雑度は、ラグランジェコストの比較回数に比例する。この回数は、ボトムレベル(レベルd)を除く4分割ツリーの全ノード数と一致する。このように、複雑度は、次式で表される。
d=5の場合、複雑度Cp(5)は341である。このように、本方法は全数探索法に比し、約10305倍の非常に有効な削減を達成する。
さらに、この方法は、完全に開花したツリーから開始し、木の上から下への“トップダウン”比較(探索パターン)に付随する極小を避けられるので最適な解が得られる。
図5に、本発明の好ましい実施例における4分割ツリー構造と量子化器スケールの合同最適化処理のフローチャートを示す。この方法500は4分割ツリー構造の各ブロックに対する最適な量子化器スケールを有する最適な4分割ツリー構造を導出するために公式化されている。その解は画像に割り当てられたバジェットビットレートを満足し、符号化画像の総歪みを最小にする。
以下、図5を参照して説明する。本方法はステップ505より始まり、ステップ510に進む。この方法は全ての可能なノード位置のベクトルを計算する。本方法は4分割ツリーの完全な開花、即ち、全画像を全てのノードにつき最低レベルまで空間的に区分することを保証する。このように、最大ブロックサイズから最小ブロックサイズまで全4分割ツリーに対する動きベクトルを計算する。全ブロックに対する動きベクトルをステップ520に送り、適当な量子化器スケールを計算する。
ステップ520において、本方法は各ノードに対する量子化を最適化する。本方法は全ての可能な量子化器スケール(例えば、1−31)につき、各ブロックの歪みを計算し比較する。即ち、各ブロックを1から31までの量子化器スケールの完全セットで符号化し、ラグランジェコストを最小にする量子化器スケールをそのブロックに対して選択する。
ステップ530において、本方法は、iをd−1に等しく設定する。ここで、iは現在の深さレベルであり、dは最深レベルである。本方法は、ボトムアップから最適の4分割ツリーの探索を開始する。ステップ540において、本方法は、最低レベルから最高レベルまで、現在の親レベルnのラグランジエコストLnをその子供ノードcのラグランジェコストLcの合計と比較する。実際に、本方法は、全てのサブブロックまたはサブノード(子)の符号化歪みの合計をそのサブノードに区分したブロックまたはノード(親)の符号化歪みと比較する。子供の符号化歪み(ラグランジェコスト)の合計が、親の符号化歪みより大きい場合、そのノードを合成する。反対に、子供の符号化歪み(ラグランジェコスト)の合計が、親の符号化歪みより小さい場合、そのノードを分割し、親ノードに対するLnをその子供のLcの合計として設定する。Ln←ΣLcの効果は極小問題を除去する。この高速枝刈り法は、方法500を適当なハードウェアにおいてリアルタイムで実施できるように最適4分割ツリー構造を決定する際の計算複雑度を有効に減少させる。
ステップ550において、方法500は現レベルで残っている追加ノードがあるか問い合わせる。問い合わせに対する答えが肯定であれば、方法500はステップ540に戻り、次のノードの枝刈りをするかどうかを決定する。前記問い合わせに対する回答が否定であれば、方法500はステップ560に進む。
ステップ560において、方法500は、プロセスが4分割ツリーの最高レベル又はルート(root)まで到達したか問い合わせる。問い合わせに対する答えが否定であれば、方法500はステップ530に戻り、ステップ540と550を、次のレベルを枝刈りするまで繰り返す。前記問い合わせに対する回答が肯定であれば、本方法500はステップ570に進む。
ステップ570において、方法500は、選択したλがR(S*,Q*)をRbudgetに等しくするλ*と等しいか問い合わせる。本発明において、ラグランジェの乗数が固定されているものと仮定する。しかしながら、この乗数λはλを0から無限大までの範囲で掃き出す(sweep)ことにより反復計算できる。すなわち、掃き出し(sweep)の間に、R*(λ)の値がRbudgetに等しくなるようなS*,Q*及びR*(λ)の解のセットを得る。R(λ)は単調減少関数であるので、2分探索を用いて先述のビットバジェット制約条件に対する歪みを最小にする所望のλを計算する。例えば、λ*は下記の関係式から選択することができる。
式中、(R1とD1)と(R2とD2)のセットは、任意に選択した2つのλ1とλ2に対するビットレートと歪みである。一般に、λ1は0のような低い数値に設定し、λ2は1、000、000のような高い数値に設定する。式(7)から計算されたλ*を使用し、その値がR*(λ)をRbudgetに等しくする適切な数値であるかを調べる。λ*が適切なλでなければ、式(7)に使用し、λ1またはλ2を置き換え、新しいλ*を計算する。この反復プロセスは、R*(λ)がRbudgetより少ないかまたは等しくなるまで継続する。一般に、λ*は10回以下の反復で得ることができる。
しかしながら、当業者ならば、多くの2分探索法(バイナリサーチ)があり、記述の方法は式(7)に限定されないことは容易に理解できよう。このようなアルゴリズムは、Yair Shoham及びAllen Gersho、“量子化器の任意セットに対する有効なビット割り当て”、IEEEの音響、音声及び信号処理に関する会報、第36巻、No.9(1988年9月)に詳述されている。
このように、本方法500は、ステップ570において選択したλがR*(λ)をRbudgetに等しくするλ*に等しくないと判定すると、ステップ520に戻り、式(7)に従って異なるλを用いて本方法を繰り返す。問い合わせに対する回答が肯定であれば、方法500はステップ575に進み方法を終了するか、本方法を次の画像に対し繰り返す。
尚、本発明の複雑度をさらに低減するために、ステップ数を削減し方法を簡素化することが可能である。第1の簡素化は、先行画像のラグランジェ乗数を現在の画像のラグランジェ乗数として使用することにより、図5のステップ570を除去することである。第2の簡素化は、所与のサブツリーの全てのノードまたは4分割ツリーSの全体に対し同一の量子化器スケールを採用することである。
最後の第3の簡素化は、4分割ツリー探索のためにグリーディ(Greedy)アルゴリズムを使用することである。所望の構造を得るために、完全4分割ツリーの枝刈りの代わりに、上記のツリー枝刈リアルゴリズムと同一のラグランジェコストの比較規則を使用し、4分割ツリーをトップからボタムまでグリーディに成長させることができる。このグリーディ法の場合、全ての可能なノードに対しレート−歪みデータを生成する必要はない。成長中のツリーのノードに対するデータのみが計算を要する。しかしながら、この方法により得た解は極小問題のために最適ではない。
セールスマンシーケンスでのシミュレーションを行い、最適VBS動き推定の性能と16×16の固定ブロックサイズ(FBS)の従来の動き推定の性能を比較した。比較のために、同じ量子化器スケールの最適化ルーチンと同じ残差符号器を両方の場合に使用する。さらに、輝度(Y)のみを符号化し、前方動き補償のみを用いて符号化の遅れを減少させる。このシミュレーションはセールスマンシーケンスの120フレームを256×256のサイズに刈り込み(crop)、フレームレートをビットレート64キロビット/秒に対し10フレーム/秒とした。
図6と図7に、セールスマンシーケンスに対する信号ノイズ比(SNR)の結果と64kb/sec.時のビットレート結果を示す。VBS動き推定方法はFBS動き推定方法より1.7デシベルだけ向上する。VBS方法の場合の平均SNRとFBS方法の場合の平均SNRは各々32.54デシベルと30.84デシベルであった。
図8には、輝度データと、動きベクトルと、4分割ツリー表現のビットレート曲線を示す。図9には、セールスマンシーケンスのフレーム60に対しVBS法で使用した最適4分割ツリーを示す。
第2の好ましい実施例においては、上記の方法をウェーブレットベースのスキームに適用する。ウェーブレットベースの補償は、1992年3月にカリフオルニア州サンフランシスコ市にて開催された音響、音声及び信号処理に関する国際会議の議事録第・巻、657-660頁)に記載されている圧縮技法である。同資料には、階層サブバンド分解又はウェーブレット変換を行い、ゼロツリーを含む階層的遂次近似エントロピー符号化量子化器を後続する信号圧縮システムが記述されている。マルチ解像度階層サブバンド表現を用いる信号データの表現はBurt他によりIEEEの通信に関する会報(第31巻、No.4、1993年4月、533頁)に開示されている。臨界サンプリング直交ミラーフィルター(critically sampled quadrature-mirror filter)(QMF)サブバンド表現とも呼ばれるウェーブレットピラミッドは画像のマルチ解像度階層的サブバンド表現である。このウェーブレットピラミッドはPentrand他が1991年4月8-11日に米国ユタ州スノーバード市にて開催されたデータ圧縮会議の論文集中で開示している。QMFサブバンドピラミッドは、“サブバンド画像符号化”(J.W.Wood編、Kluwer Academic出版社、1991年)と“ウェーブレットに関する10の講義”(I.Daubechies,工業及び応用数学の学会(SIAM)、米国ペンシルヴアニア州フィラデルフィア,1992年)に記述されている。また、フレーム間(インターフレーム)ウェーブレットビデオ圧縮スキームが、1996年2月27日に発行された動画像復号化に関する米国特許No.5,495,292に開示されている。
さらに、ウェーブレットに基づく圧縮技法が、1995年5月2日に発行された米国特許No.5,412,741に開示されており、本明細書においてもこれを参照する。同技法は、階層画像表現のために埋込みゼロツリーウェーブレット(EZW)の導出に離散ウェーブレット変換(DWT)を使用することを記述している。この階層表現は、次に、エントロピー符号化を使用して有効に符号化される。
ウェーブレットの階層サブバンド分解の場合、画像は2回ずつサンプリングされ高水平−高垂直(HH)周波数サブバンド、高水平−低垂直(HL)周波数サブバンド、低水平−高垂直(LH)周波数サブバンド、低水平−低垂直(LL)周波数サブバンドに分解される。LLサブバンドはさらに2回ずつサブサンプリングされて、HH,HL,LH及びLLのサブバンドのセット(組)を生成する。このようなサンプリングを繰り返し、図10に示すような列(アレイ)を3度のサブサンプリングにより生成する。好ましくは、6回のサブサンプリングを実施する。親子関係は親ノードのサブバンドから子ノードのサブバンドを指す矢印で示される。最低周波数サブバンドは左上のLL1であり、最高周波数サブバンドは右下のHH3である。この例の場合、全ての子ノードは1人の親を持つ。
図11に、サブサンプリングされた画像の3世代の親子関係を示す。1人の親ノード72は、4度のサブサンプリングによる画像中の同一領域に対応する4人の子ノード74を有する。各子ノード74はさらに4度のサブサンプリングによる4つの対応する次世代の子ノード76を持つ。
図12に、4分割ツリーに基づく可変ブロックサイズの動き推定のための動きベクトルを決定する際の計算オーバヘッドを減少させるために、ウェーブレット変換方法を実施する本発明の装置1200のブロック図を示す。本発明の好ましい実施例において、装置1200は符号器又はより複雑な可変ブロックベースの動き補償符号化システムの一部分である。この装置1200は、図2に示す装置200につき記述したモジュールと略同一のモジュールより成る。両者の違いは、DCTモジュール260と逆DCTモジュール265とVLCモジュール280をDWTモジュール1260と逆DWTモジュール1265とウェーブレット符号化モジュール1280で各々置き換えていることである。ウェーブレット符号化モジュールは、ゼロツリー符号化及び/又はエントロピー符号化のような異なる符号化方式を任意数内蔵できる。装置1200の機能は、入力ビデオ画像でウェーブレット変換を行うことを除き、装置200の機能と同じである。
しかしながら、ウェーブレットベースの方法は、ブロック間の独立性を許さない。従って、各個別ブロックの正確なコスト計算を行うのは非常に難しい。
このように、ウェーブレットベースの方法は、歪みのモデルを使用し、ビットレートに対する動きベクトルビットだけを計数する。符号化歪みを、予測誤差MSEの定数倍によって近似させる。この定数は実験的に決められ、MSEは予測残差の平均二乗誤差であり、原画像と復号フレーム間の差ではない。十分な時間的相関性が仮定できれば、ラグランジェの乗数は、先行フレームの残差符号化のレート歪みカーブの傾斜により近似できる。
第2のウェーブレットベースの方法では、親ノードとその子ノードの総フレーム・ラグランジェ・コストだけを比較する。この総コストを計算するために、隣接ブロックのブロック区分を先行4分割ツリーの枝刈り結果によって定める。枝刈りがなされていない区域のブロック区分は最小ブロックサイズ(最低レベル)によって定める。
第3の実施例において、本発明の可変4分割ツリー構造はアフィン動きモデルと共に可変ブロックサイズアフィン動きモデルを生成するのに用いる。アフィン動きモデルはJ.Nieweglowski他により“ディジタル画像のワーピング(warping)を利用するテンポラル(時間的)予測ベースの新規ビデオ符号化スキーム“(IEEE会報、コンシューマエレクトロニクス、第39巻3、141-150頁、1993年8月)に開示されており、本明細書でも参照する。このアフィン動きモデルは、“画像のワーピング”として知られる幾何学的変換を適用し先行画像から予測画像又はフレームを構成する。この変換により、先行画像と予測画像中の各点間の空間的関係が規定される。
一般に、ブロックマッチング法を使用する動き補償は平行移動に関し良好な統合性能を提供する。しかしながら、ブロックマッチングによる動き推定は動きが回転成分又はスケーリング成分(例えば、ズーミング又は回転イメージ)を含んでいる場合、良い成果は得られない。
これに反し、アフィン動きモデル(アフィン変換)は6つのパラメータ(a1からa6)により定められ、下式のように表現される。
式中、(x,y)は先行フレーム中の画素座標であり、(u,v)は予測フレーム中の所定画素の座標である。J.Nieweglowski他の参考資料に6つのパラメータの計算方法が詳細に記述されている。アフィン関係は6つのパラメータを特徴とする。このように、アフィン動きモデルは、一般的に、自然なシーケンスのみならずディジタル効果を用いた合成画像においてしばしば観察される平行移動(translation)、スケーリングおよび回転のような動きを予測する場合により有効である。
実際に、アフィン動きモデルはフレーム毎の全体の動き補償に用いるか、又は、ブロックベースの動き補償フレームワークと連結して使用できる。前者の場合、オーバヘッド情報が少ないと云う利点があるが、しかし、局部の動きをよく把握できない。極端な場合、アフィン動きモデルを全体的な動き補償の場合のようなフレームレベルに構築してしまう。
同様に、後者の場合も局所的回転、平行移動及びスケーリングの動きに良く適合するが、相対的に“固定された”ブロックサイズ条件は幾分制限的である。即ち、アフィン動きモデルは、(例えば、図13に示す完全開花4分割ツリー構造)の一様なパッチブロックと比較して、不規則なブロック形状(図14)を含んでいるが、現有の符号器に実装できるように設計されている。このように、“グリッドポイント”の個数を従来の動き補償ブロックの個数と同じになるように選択する。
さらに特定すると、グリッドポイントのセットを先行フレーム上で選択する。動きは、現フレーム上で上記のグリッドポイントに最も良くマッチするポイントを発見して推定する。別案では、グリッドポイントのセットを現フレーム上で選択しプロセスを逆にすることができ、動きは、先行フレーム上で上記のグリッドポイントに最も良くマッチするポイントを発見して推定する。
アフィン動きモデルにおける主な問題は、非常に小さい画像ブロック(例えば、16×16マクロブロック)に対するアフィンパラメータの推定である。反復勾配(iterative gradient)ベースの方法は、最初のポイントが正確に選択されないと収斂しない。アフィンパラメータの計算は種々の方法でなされる。しかしながら、Tihao ChiangとYa-Qin Zhangが“ステレオビデオ符号化”(1995年10月にニューヨークにて開催された<マルチメディアとビデオ符号化>に関する国際シンポジウムの論文集)に記述しているように、ピラミッド法をアフィンパラメータの評価のために良好な始点を発見するために使用でき、この論文を本明細書に参照する。このように、本4分割ツリーベースの可変ブロックサイズの動き推定のフレームワーク(図15に示される)は同様なやり方で拡張し、可変ブロックサイズアフィン動きモデル(図16に示される)を生成する。即ち、“アフィン”4分割ツリーが完全に開花し、即ち、全体画像を図14に示すように全てのノードに対し最下位レベルまで空間的に区分したと仮定する。最大ブロックサイズから最小ブロックサイズまでアフィン4分割ツリー全体に対する動きベクトルを計算する。この方法は、前述の如く各ノードに対する量子化を最適化するために任意に実行する。最小の歪みを生み出す量子化器スケールを選択する。
同様に、本方法は、(最低レベルから最高レベルまで)“ボトムアップ”しながら、全ての“アフィン”サブブロック又はサブノード(子供)の符号化歪みの合計をサブノードに区分したブロック又はノード(親)の符号化歪みと比較する。子供の符号化歪みの合計が親の符号化歪みより大きい場合、そのノードを“合成”する。反対に、子供の符号化歪みの合計が親の符号化歪みより小さい場合、そのノードを“分割”し、親ノードのラグランジェコストをその子供のラグランジェコストの合計として設定する。このステップを(例えば、図16に図示のような)最適なアフィン4分割ツリー構造が得られるまで全てのレベルの全てのノードに対し反復する。
可変ブロックサイズアフィン動きモデルは、異なる形状の画像分割を補償する能力を有するので、より良い予測特性を達成でき、提案されているMPEG4規格ビデオ(MPEG4規格の作成は現在進行中)のビデオ・オブジェクト平面(VOP)を有効に符号化する能力を向上させる。
以上、4分割ツリーベースの可変ブロックサイズ動き推定のために動きベクトルを算定する際の計算オーバヘッドを減少させるための新規な装置とその方法を説明してきた。本発明の多くの変更、修正、変種及び他の使用と応用は、実施態様を開示しているこの明細書読み添付の図面を参照すれば、当業者には明らかになるであろう。尚、このような改変,変更、変形及び他の使用と応用はすべて、本発明の精神と範囲から逸脱するものではなく、本発明により包含されるとみなされ、以下の特許請求範囲にのみ限定される。
Claims (10)
- 画像フレームに対する可変ブロックサイズでの動き推定を行うためのツリー構造を決定する方法であって、該ツリー構造が親−子関係を持つ複数レベルに編成された複数ブロックを有する方法において、
(a)前記画像フレームを前記ツリー構造の最低レベルまで複数のブロックに分割するステップと、
(b)前記複数ブロックの各ブロックを符号化するための歪みを計算するステップと、
(c)子ブロックのセットの前記歪みの和を対応する親ブロックの歪みと比較するステップと、
(d)前記比較ステップの結果に従って前記親ブロックのサイズを調整するステップとを備えた可変ブロックサイズ動き推定を行うためのツリー構造を決定する方法。 - 請求項1に記載の方法において、前記調整ステップ(d)が、前記子ブロックの前記歪みの前記和が前記親ブロックの歪みより大きい場合は前記子ブロックを合成し、前記子ブロックの前記歪みの前記和が前記子の親ブロックの歪みより小さい場合は該親ブロックをその子ブロックに分割するステップを備えた可変ブロックサイズ動き推定を行うためのツリー構造を決定する方法。
- 請求項2に記載の方法において、前記調整ステップ(d)が、前記子ブロックの前記歪みの前記和が前記子の親ブロックの歪みより小さい場合は、前記親ブロックの歪みを前記親の子ブロックの前記歪みの前記和として設定するステップを備えた可変ブロックサイズ動き推定を行うためのツリー構造を決定する方法。
- 請求項1に記載の方法において、前記比較ステップ(c)と前記調整ステップ(d)をボトムアップ探索パターンを用いて行う可変ブロックサイズ動き推定を行うためのツリー構造を決定する方法。
- 請求項1に記載の方法において、前記歪み計算ステップ(b)が、前記複数ブロックの各ブロックに対する動きベクトルを計算するステップを備え、各ブロックの前記歪みが前記動きベクトルをもちいて各ブロックを符号化した結果となるようにした可変ブロックサイズ動き推定を行うためのツリー構造を決定する方法。
- 請求項1に記載の方法において、前記複数ブロックがアフィンブロックであ
る可変ブロックサイズ動き推定を行うためのツリー構造を決定する方法。 - 請求項1に記載の方法において、前記画像フレームがビデオオブジェクト平面より成る可変ブロックサイズ動き推定を行うためのツリー構造を決定する方法。
- ツリー構造に従って分割された入力画像を符号化する装置であって、該ツリー構造が親−子関係を持つ複数レベルに編成された複数のブロックを有する装置において、入力画像の全ツリー構造に対する前記複数のブロックの全てに対する複数の動きベクトルを計算する可変ブロック動き推定モジュールと、該可変ブロック動き推定モジュールに結合されており、前記の複数の動きベクトルを用いて予測画像を生成する動き補償モジュールと、該動き補償モジュールに結合されており、前記入力画像と前記予測画像間の差信号に変換を加えることにより複数の係数を生成する変換モジュールと、該変換モジュールに結合されており、前記複数の係数を量子化する量子化モジュールとを備えた入力画像を符号化する装置。
- 請求項8に記載の装置において、前記量子化モジュールに結合されており前記複数のブロックの各ブロックにつき最小のラグランジェコストをもたらす量子化器スケールを選択するレートコントロールモジュールをさらに備えた入力画像を符号化する装置。
- 請求項9に記載の装置において、前記子ブロックセットの前記ラグランジェコストの和を対応する親ブロックの前記ラグランジェコストと比較することにより前記ツリー構造を調整するようにした入力画像を符号化する装置。
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US701795P | 1995-10-25 | 1995-10-25 | |
| US2051496P | 1996-06-28 | 1996-06-28 | |
| US60/007,017 | 1996-06-28 | ||
| US60/020,514 | 1996-06-28 | ||
| PCT/US1996/016956 WO1997017797A2 (en) | 1995-10-25 | 1996-10-23 | Apparatus and method for quadtree based variable block size motion estimation |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003374710A Division JP3659353B2 (ja) | 1995-10-25 | 2003-11-04 | ビデオ画像符号化方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2000511366A JP2000511366A (ja) | 2000-08-29 |
| JP2000511366A6 true JP2000511366A6 (ja) | 2004-07-08 |
Family
ID=26676361
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP09518195A Ceased JP2000511366A (ja) | 1995-10-25 | 1996-10-23 | 4分割ツリーベースの可変ブロックサイズ動き推定装置および方法 |
| JP2003374710A Expired - Lifetime JP3659353B2 (ja) | 1995-10-25 | 2003-11-04 | ビデオ画像符号化方法 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003374710A Expired - Lifetime JP3659353B2 (ja) | 1995-10-25 | 2003-11-04 | ビデオ画像符号化方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US6084908A (ja) |
| JP (2) | JP2000511366A (ja) |
| WO (1) | WO1997017797A2 (ja) |
Families Citing this family (175)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2329781B (en) * | 1996-03-11 | 1999-08-18 | Samsung Electronics Co Ltd | Motion picture compression circuit and method using motion vector |
| US6272178B1 (en) * | 1996-04-18 | 2001-08-07 | Nokia Mobile Phones Ltd. | Video data encoder and decoder |
| US6233017B1 (en) * | 1996-09-16 | 2001-05-15 | Microsoft Corporation | Multimedia compression system with adaptive block sizes |
| EP2173103A3 (en) * | 1997-02-13 | 2010-09-08 | Mitsubishi Denki Kabushiki Kaisha | Moving picture prediction system |
| US6728775B1 (en) | 1997-03-17 | 2004-04-27 | Microsoft Corporation | Multiple multicasting of multimedia streams |
| US6633611B2 (en) * | 1997-04-24 | 2003-10-14 | Mitsubishi Denki Kabushiki Kaisha | Method and apparatus for region-based moving image encoding and decoding |
| AU8759198A (en) * | 1997-07-28 | 1999-02-16 | Roy H. Campbell | A robust, reliable compression and packetization scheme for transmitting video |
| AUPO951297A0 (en) * | 1997-09-29 | 1997-10-23 | Canon Information Systems Research Australia Pty Ltd | Method and apparatus for digital data compression |
| US6829301B1 (en) | 1998-01-16 | 2004-12-07 | Sarnoff Corporation | Enhanced MPEG information distribution apparatus and method |
| FR2778039B1 (fr) * | 1998-04-27 | 2000-07-21 | Canon Kk | Codage et decodage de signal numerique |
| FR2778038B1 (fr) * | 1998-04-27 | 2000-07-21 | Canon Kk | Codage de signal numerique |
| US6501860B1 (en) | 1998-01-19 | 2002-12-31 | Canon Kabushiki Kaisha | Digital signal coding and decoding based on subbands |
| US6560285B1 (en) | 1998-03-30 | 2003-05-06 | Sarnoff Corporation | Region-based information compaction as for digital images |
| AUPP366598A0 (en) * | 1998-05-22 | 1998-06-18 | Canon Kabushiki Kaisha | Deriving polygonal boundaries from quadtree representation |
| AU739419B2 (en) * | 1998-05-22 | 2001-10-11 | Canon Kabushiki Kaisha | Deriving polygonal boundaries from quadtree representation |
| US6895051B2 (en) * | 1998-10-15 | 2005-05-17 | Nokia Mobile Phones Limited | Video data encoder and decoder |
| FR2786353B1 (fr) * | 1998-11-25 | 2001-02-09 | Thomson Multimedia Sa | Procede et dispositif de codage d'images selon la norme mpeg pour l'incrustation d'imagettes |
| FI111764B (fi) * | 1999-06-10 | 2003-09-15 | Nokia Corp | Menetelmä ja järjestely kuvatiedon käsittelemiseksi |
| KR100611999B1 (ko) * | 1999-08-27 | 2006-08-11 | 삼성전자주식회사 | 그리디 알고리듬을 이용한 객체 기반 콰드 트리 메쉬 움직임 보상방법 |
| BR0015959A (pt) * | 1999-12-14 | 2002-08-06 | Scientific Atlanta | Sistema e método para o processamento de vìdeo adaptativo com alocação de recursos coordenados |
| US6738423B1 (en) * | 2000-01-21 | 2004-05-18 | Nokia Mobile Phones Ltd. | Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder |
| CA2359260C (en) * | 2000-10-20 | 2004-07-20 | Samsung Electronics Co., Ltd. | Coding apparatus and method for orientation interpolator node |
| ES2248245T3 (es) * | 2000-10-20 | 2006-03-16 | Samsung Electronics Co., Ltd. | Aparato y procedimiento de codificacion/descodificacion para datos de nodo interpolador de la orientacion. |
| FR2815748B1 (fr) * | 2000-10-20 | 2003-01-24 | Canon Kk | Procede et dispositif de traitement et de decodage d'un signal numerique code |
| US6765964B1 (en) | 2000-12-06 | 2004-07-20 | Realnetworks, Inc. | System and method for intracoding video data |
| US6782052B2 (en) | 2001-03-16 | 2004-08-24 | Sharp Laboratories Of America, Inc. | Reference frame prediction and block mode prediction for fast motion searching in advanced video coding |
| US6671324B2 (en) * | 2001-04-16 | 2003-12-30 | Mitsubishi Electric Research Laboratories, Inc. | Estimating total average distortion in a video with variable frameskip |
| WO2003005727A1 (en) * | 2001-07-06 | 2003-01-16 | Koninklijke Philips Electronics N.V. | Methods of and units for motion or depth estimation and image processing apparatus provided with such motion estimation unit |
| CA2460349A1 (en) * | 2001-07-11 | 2003-02-06 | Daniel Kilbank | System and method for compressing data |
| US20070070059A1 (en) * | 2001-08-10 | 2007-03-29 | Alan Rojer | Refinement of block motion estimate using texture mapping |
| EP2819411B1 (en) * | 2001-09-14 | 2018-08-29 | NTT DoCoMo, Inc. | Coding method and decoding method |
| US6909748B2 (en) * | 2001-12-20 | 2005-06-21 | Sorenson Media, Inc. | Method and system for image compression using block size heuristics |
| US7274857B2 (en) * | 2001-12-31 | 2007-09-25 | Scientific-Atlanta, Inc. | Trick modes for compressed video streams |
| KR100453714B1 (ko) * | 2001-12-31 | 2004-10-20 | (주)펜타마이크로 | Mpeg 영상 압축 기술을 이용한 디지털 영상 저장장치에서의 움직임 검출 장치 및 그 방법 |
| US20030161400A1 (en) * | 2002-02-27 | 2003-08-28 | Dinerstein Jonathan J. | Method and system for improved diamond motion search |
| CN1647405A (zh) * | 2002-04-23 | 2005-07-27 | D·基尔班克 | 在通信中使用微单元的系统和方法 |
| US6711300B2 (en) * | 2002-08-15 | 2004-03-23 | Envivio, Inc. | Quantization and compression of information in a direct acyclic graph |
| US7020201B2 (en) * | 2002-11-20 | 2006-03-28 | National Chiao Tung University | Method and apparatus for motion estimation with all binary representation |
| US20060071932A1 (en) * | 2002-11-21 | 2006-04-06 | Koninklijke Philips Electronics N.V. | Method and apparatus for visualizing a sequece of volume images |
| CN1757237A (zh) * | 2003-03-03 | 2006-04-05 | 皇家飞利浦电子股份有限公司 | 视频编码 |
| US7408486B2 (en) * | 2003-04-21 | 2008-08-05 | Qbit Corporation | System and method for using a microlet-based modem |
| GB2437579B (en) * | 2003-05-07 | 2007-12-19 | British Broadcasting Corp | Data processing |
| GB2401502B (en) * | 2003-05-07 | 2007-02-14 | British Broadcasting Corp | Data processing |
| JP2007503750A (ja) * | 2003-08-26 | 2007-02-22 | サムスン エレクトロニクス カンパニー リミテッド | 適応型フレーム間ウェーブレットのビデオコーディング方法、前記方法のためのコンピュータで読取り可能な記録媒体、及び装置 |
| US7966642B2 (en) * | 2003-09-15 | 2011-06-21 | Nair Ajith N | Resource-adaptive management of video storage |
| WO2005086981A2 (en) * | 2004-03-10 | 2005-09-22 | Sindhara Supermedia, Inc. | Methods and apparatuses for compressing digital image data with motion prediction |
| US20050207495A1 (en) * | 2004-03-10 | 2005-09-22 | Jayaram Ramasastry | Methods and apparatuses for compressing digital image data with motion prediction |
| US7983835B2 (en) | 2004-11-03 | 2011-07-19 | Lagassey Paul J | Modular intelligent transportation system |
| US20050214428A1 (en) * | 2004-03-23 | 2005-09-29 | Yonas Gizaw | Non-steeped corn blend and article of commerce |
| KR100994773B1 (ko) | 2004-03-29 | 2010-11-16 | 삼성전자주식회사 | 계층적 움직임 추정에 있어서 움직임 벡터 생성 방법 및장치 |
| DE102004029973B4 (de) * | 2004-06-21 | 2006-11-30 | Daimlerchrysler Ag | Umformwerkzeug und Verfahren zur Herstellung eines Umformwerkzeugs |
| FR2872989A1 (fr) * | 2004-07-06 | 2006-01-13 | Thomson Licensing Sa | Procede et dispositif pour choisir un vecteur mouvement pour le codage d'un ensemble de blocs |
| US8600217B2 (en) * | 2004-07-14 | 2013-12-03 | Arturo A. Rodriguez | System and method for improving quality of displayed picture during trick modes |
| DE102004038110B3 (de) * | 2004-08-05 | 2005-12-29 | Siemens Ag | Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung |
| DE102004041664A1 (de) * | 2004-08-27 | 2006-03-09 | Siemens Ag | Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung |
| JP4832305B2 (ja) * | 2004-08-31 | 2011-12-07 | パナソニック株式会社 | ステレオ信号生成装置およびステレオ信号生成方法 |
| US7720154B2 (en) * | 2004-11-12 | 2010-05-18 | Industrial Technology Research Institute | System and method for fast variable-size motion estimation |
| US8515987B1 (en) * | 2004-12-15 | 2013-08-20 | Dun & Bradstreet, Inc. | Database information consolidation |
| JP4501676B2 (ja) | 2004-12-22 | 2010-07-14 | 日本電気株式会社 | 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム |
| US20060230428A1 (en) * | 2005-04-11 | 2006-10-12 | Rob Craig | Multi-player video game system |
| US8118676B2 (en) * | 2005-07-08 | 2012-02-21 | Activevideo Networks, Inc. | Video game system using pre-encoded macro-blocks |
| US9061206B2 (en) * | 2005-07-08 | 2015-06-23 | Activevideo Networks, Inc. | Video game system using pre-generated motion vectors |
| US8284842B2 (en) * | 2005-07-08 | 2012-10-09 | Activevideo Networks, Inc. | Video game system using pre-encoded macro-blocks and a reference grid |
| US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
| US8074248B2 (en) | 2005-07-26 | 2011-12-06 | Activevideo Networks, Inc. | System and method for providing video content associated with a source image to a television in a communication network |
| US7885335B2 (en) * | 2005-09-16 | 2011-02-08 | Sont Corporation | Variable shape motion estimation in video sequence |
| GB2431064A (en) * | 2005-10-10 | 2007-04-11 | Motorola Inc | Encoding a video signal using a motion-dependent adaptive spatial wavelet transform |
| KR100728031B1 (ko) * | 2006-01-23 | 2007-06-14 | 삼성전자주식회사 | 가변 블록 크기 움직임 예측을 위한 부호화 모드 결정 방법및 장치 |
| CN100548051C (zh) * | 2006-05-25 | 2009-10-07 | 联想(北京)有限公司 | 视频编解码设备和方法以及系统 |
| US20080126278A1 (en) * | 2006-11-29 | 2008-05-29 | Alexander Bronstein | Parallel processing motion estimation for H.264 video codec |
| EP2632164A3 (en) | 2007-01-12 | 2014-02-26 | ActiveVideo Networks, Inc. | Interactive encoded content system including object models for viewing on a remote device |
| US9826197B2 (en) | 2007-01-12 | 2017-11-21 | Activevideo Networks, Inc. | Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device |
| US20080225947A1 (en) * | 2007-03-13 | 2008-09-18 | Matthias Narroschke | Quantization for hybrid video coding |
| EP2187643A3 (en) * | 2007-07-18 | 2012-10-24 | Humax Co., Ltd. | Adaptive bit-precision entropy coding |
| US20090033791A1 (en) * | 2007-07-31 | 2009-02-05 | Scientific-Atlanta, Inc. | Video processing systems and methods |
| US20090154567A1 (en) * | 2007-12-13 | 2009-06-18 | Shaw-Min Lei | In-loop fidelity enhancement for video compression |
| US8351509B1 (en) * | 2007-12-21 | 2013-01-08 | Dimension, Inc. | Video codec systems and methods for optimal motion vector with variable size blocks |
| US20090168871A1 (en) * | 2007-12-31 | 2009-07-02 | Ning Lu | Video motion estimation |
| US8300696B2 (en) * | 2008-07-25 | 2012-10-30 | Cisco Technology, Inc. | Transcoding for systems operating under plural video coding specifications |
| US8311111B2 (en) | 2008-09-11 | 2012-11-13 | Google Inc. | System and method for decoding using parallel processing |
| US8326075B2 (en) * | 2008-09-11 | 2012-12-04 | Google Inc. | System and method for video encoding using adaptive loop filter |
| US8325796B2 (en) * | 2008-09-11 | 2012-12-04 | Google Inc. | System and method for video coding using adaptive segmentation |
| US8503527B2 (en) | 2008-10-03 | 2013-08-06 | Qualcomm Incorporated | Video coding with large macroblocks |
| US8619856B2 (en) * | 2008-10-03 | 2013-12-31 | Qualcomm Incorporated | Video coding with large macroblocks |
| JP5001964B2 (ja) * | 2009-02-18 | 2012-08-15 | 株式会社エヌ・ティ・ティ・ドコモ | 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム |
| PT3288268T (pt) | 2009-07-01 | 2019-09-19 | Interdigital Vc Holdings Inc | Métodos e aparelhos para sinalizar a intra predição para grandes blocos para codificadores e descodificadores de vídeo |
| US9654792B2 (en) | 2009-07-03 | 2017-05-16 | Intel Corporation | Methods and systems for motion vector derivation at a video decoder |
| CN102483333B (zh) | 2009-07-09 | 2016-03-09 | 通腾科技股份有限公司 | 使用具有路线搜索加速数据的地图数据的导航装置 |
| US9109909B2 (en) * | 2009-07-09 | 2015-08-18 | Tomtom International B.V. | Navigation devices |
| KR101483750B1 (ko) | 2009-07-24 | 2015-01-19 | 삼성전자주식회사 | 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치 |
| US8194862B2 (en) * | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
| KR101456498B1 (ko) * | 2009-08-14 | 2014-10-31 | 삼성전자주식회사 | 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
| AU2013202016B2 (en) * | 2009-08-14 | 2014-07-24 | Samsung Electronics Co., Ltd | Method and apparatus for encoding video, and method and apparatus for decoding video |
| KR101487686B1 (ko) | 2009-08-14 | 2015-01-30 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
| US9307251B2 (en) * | 2009-08-19 | 2016-04-05 | Sharp Laboratories Of America, Inc. | Methods and systems for determining data-adaptive weights for motion estimation in a video sequence |
| KR101457418B1 (ko) * | 2009-10-23 | 2014-11-04 | 삼성전자주식회사 | 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
| EP2520092A1 (en) * | 2009-12-31 | 2012-11-07 | Thomson Licensing | Methods and apparatus for adaptive coupled pre-processing and post-processing filters for video encoding and decoding |
| US8559519B2 (en) * | 2010-01-08 | 2013-10-15 | Blackberry Limited | Method and device for video encoding using predicted residuals |
| US8315310B2 (en) * | 2010-01-08 | 2012-11-20 | Research In Motion Limited | Method and device for motion vector prediction in video transcoding using full resolution residuals |
| US20110170608A1 (en) * | 2010-01-08 | 2011-07-14 | Xun Shi | Method and device for video transcoding using quad-tree based mode selection |
| US8340188B2 (en) * | 2010-01-08 | 2012-12-25 | Research In Motion Limited | Method and device for motion vector estimation in video transcoding using union of search areas |
| US8358698B2 (en) * | 2010-01-08 | 2013-01-22 | Research In Motion Limited | Method and device for motion vector estimation in video transcoding using full-resolution residuals |
| EP2343899A1 (en) * | 2010-01-08 | 2011-07-13 | Research In Motion Limited | Method and device for video transcoding using quad-tree based mode selection |
| CN102804782A (zh) * | 2010-01-15 | 2012-11-28 | 三星电子株式会社 | 用于预测编码的使用可变分区的视频编码的方法和设备以及用于预测编码的使用可变分区的视频解码的方法和设备 |
| KR101495724B1 (ko) | 2010-02-02 | 2015-02-25 | 삼성전자주식회사 | 계층적 데이터 단위의 스캔 순서에 기반한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
| KR101419634B1 (ko) * | 2010-04-07 | 2014-07-16 | 가부시키가이샤 제이브이씨 켄우드 | 동화상 부호화 장치, 동화상 부호화 방법 및 동화상 부호화 프로그램, 및 동화상 복호 장치, 동화상 복호 방법 및 동화상 복호 프로그램 |
| JP2011234337A (ja) * | 2010-04-07 | 2011-11-17 | Jvc Kenwood Corp | 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム |
| JP2011234338A (ja) * | 2010-04-07 | 2011-11-17 | Jvc Kenwood Corp | 動画像復号装置、動画像復号方法及び動画像復号プログラム |
| LT3958573T (lt) | 2010-04-13 | 2023-09-25 | Ge Video Compression, Llc | Vaizdo kodavimas naudojant kadrų multimedžių poskaidinius |
| RS66159B1 (sr) | 2010-04-13 | 2024-12-31 | Ge Video Compression Llc | Spajanje regiona uzoraka |
| BR112012026400B1 (pt) | 2010-04-13 | 2021-08-10 | Ge Video Compression, Ll | Predição inter-plano |
| CN102939618B (zh) | 2010-04-13 | 2016-08-03 | Ge视频压缩有限责任公司 | 在样本数组多元树细分中的继承技术 |
| WO2011131417A1 (en) | 2010-04-21 | 2011-10-27 | Tomtom International B.V. | System and method of generating a route across an electronic map |
| CN102947676B (zh) | 2010-04-23 | 2016-06-01 | 通腾科技股份有限公司 | 导航装置及在其上实行的方法 |
| US8488890B1 (en) * | 2010-06-11 | 2013-07-16 | Nvidia Corporation | Partial coverage layers for color compression |
| US20110310976A1 (en) * | 2010-06-17 | 2011-12-22 | Qualcomm Incorporated | Joint Coding of Partition Information in Video Coding |
| JP2012034352A (ja) * | 2010-06-30 | 2012-02-16 | Panasonic Corp | ステレオ動画像符号化装置及びステレオ動画像符号化方法 |
| AU2015203103B2 (en) * | 2010-08-17 | 2016-06-30 | Samsung Electronics Co., Ltd. | Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus |
| CN104967849B (zh) | 2010-08-17 | 2018-07-10 | 三星电子株式会社 | 视频解码方法 |
| SG10201808631PA (en) * | 2010-09-30 | 2018-11-29 | Samsung Electronics Co Ltd | Video Encoding Method For Encoding Hierarchical-Structure Symbols And A Device Therefor, And Video Decoding Method For Decoding Hierarchical-Structure Symbols And A Device Therefor |
| US9055305B2 (en) * | 2011-01-09 | 2015-06-09 | Mediatek Inc. | Apparatus and method of sample adaptive offset for video coding |
| WO2012051528A2 (en) | 2010-10-14 | 2012-04-19 | Activevideo Networks, Inc. | Streaming digital video between video devices using a cable television system |
| PL3389277T3 (pl) | 2010-12-06 | 2021-04-06 | Sun Patent Trust | Sposób dekodowania obrazu, urządzenie do dekodowania obrazu |
| US8624891B2 (en) * | 2011-01-17 | 2014-01-07 | Disney Enterprises, Inc. | Iterative reprojection of images |
| US8553769B2 (en) | 2011-01-19 | 2013-10-08 | Blackberry Limited | Method and device for improved multi-layer data compression |
| US9154799B2 (en) | 2011-04-07 | 2015-10-06 | Google Inc. | Encoding and decoding motion via image segmentation |
| US9204203B2 (en) | 2011-04-07 | 2015-12-01 | Activevideo Networks, Inc. | Reduction of latency in video distribution networks using adaptive bit rates |
| US8781004B1 (en) | 2011-04-07 | 2014-07-15 | Google Inc. | System and method for encoding video using variable loop filter |
| US8780971B1 (en) | 2011-04-07 | 2014-07-15 | Google, Inc. | System and method of encoding using selectable loop filters |
| US8780996B2 (en) | 2011-04-07 | 2014-07-15 | Google, Inc. | System and method for encoding and decoding video data |
| HRP20182107T1 (hr) * | 2011-09-14 | 2019-02-22 | Samsung Electronics Co., Ltd | Postupak za dekodiranje predviđajuće jedinice (pu) temeljeno na njezinoj veličini |
| US8885706B2 (en) | 2011-09-16 | 2014-11-11 | Google Inc. | Apparatus and methodology for a video codec system with noise reduction capability |
| US9781449B2 (en) * | 2011-10-06 | 2017-10-03 | Synopsys, Inc. | Rate distortion optimization in image and video encoding |
| US9338463B2 (en) | 2011-10-06 | 2016-05-10 | Synopsys, Inc. | Visual quality measure for real-time video processing |
| US9100657B1 (en) | 2011-12-07 | 2015-08-04 | Google Inc. | Encoding time management in parallel real-time video encoding |
| US10409445B2 (en) | 2012-01-09 | 2019-09-10 | Activevideo Networks, Inc. | Rendering of an interactive lean-backward user interface on a television |
| US9262670B2 (en) | 2012-02-10 | 2016-02-16 | Google Inc. | Adaptive region of interest |
| US9131073B1 (en) | 2012-03-02 | 2015-09-08 | Google Inc. | Motion estimation aided noise reduction |
| US20130235926A1 (en) * | 2012-03-07 | 2013-09-12 | Broadcom Corporation | Memory efficient video parameter processing |
| US9800945B2 (en) | 2012-04-03 | 2017-10-24 | Activevideo Networks, Inc. | Class-based intelligent multiplexing over unmanaged networks |
| US9123084B2 (en) | 2012-04-12 | 2015-09-01 | Activevideo Networks, Inc. | Graphical application integration with MPEG objects |
| US9344729B1 (en) | 2012-07-11 | 2016-05-17 | Google Inc. | Selective prediction signal filtering |
| JP6191609B2 (ja) * | 2012-09-18 | 2017-09-06 | 日本電気株式会社 | 映像符号化装置、映像符号化方法および映像符号化プログラム |
| CN104704817B (zh) | 2012-12-06 | 2017-12-26 | 日本电气株式会社 | 视场显示系统、视场显示方法及视场显示程序 |
| JP6157114B2 (ja) * | 2012-12-28 | 2017-07-05 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
| US9998750B2 (en) | 2013-03-15 | 2018-06-12 | Cisco Technology, Inc. | Systems and methods for guided conversion of video from a first to a second compression format |
| WO2014145921A1 (en) | 2013-03-15 | 2014-09-18 | Activevideo Networks, Inc. | A multiple-mode system and method for providing user selectable video content |
| US9326047B2 (en) | 2013-06-06 | 2016-04-26 | Activevideo Networks, Inc. | Overlay rendering of user interface onto source video |
| US9219922B2 (en) | 2013-06-06 | 2015-12-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
| US9294785B2 (en) | 2013-06-06 | 2016-03-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
| US11425395B2 (en) | 2013-08-20 | 2022-08-23 | Google Llc | Encoding and decoding using tiling |
| US9967558B1 (en) | 2013-12-17 | 2018-05-08 | Google Llc | Adaptive motion search control for variable block size partitions in video coding |
| JP6187826B2 (ja) | 2014-02-04 | 2017-08-30 | パナソニックIpマネジメント株式会社 | 動画像符号化装置及び動画像符号化方法 |
| US20150256832A1 (en) * | 2014-03-07 | 2015-09-10 | Magnum Semiconductor, Inc. | Apparatuses and methods for performing video quantization rate distortion calculations |
| US9788029B2 (en) | 2014-04-25 | 2017-10-10 | Activevideo Networks, Inc. | Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks |
| US11974906B2 (en) | 2014-05-27 | 2024-05-07 | Productos Familia S.A. | Absorbent article with multiple layers |
| US9392272B1 (en) | 2014-06-02 | 2016-07-12 | Google Inc. | Video coding using adaptive source variance based partitioning |
| CN104077233B (zh) * | 2014-06-18 | 2017-04-05 | 百度在线网络技术(北京)有限公司 | 多通道卷积层处理方法和装置 |
| US9578324B1 (en) | 2014-06-27 | 2017-02-21 | Google Inc. | Video coding using statistical-based spatially differentiated partitioning |
| JP6402520B2 (ja) * | 2014-07-22 | 2018-10-10 | 沖電気工業株式会社 | 符号化装置、方法、プログラム及び機器 |
| US10356403B2 (en) * | 2014-08-28 | 2019-07-16 | Nec Corporation | Hierarchial video code block merging using depth-dependent threshold for block merger |
| US10102613B2 (en) | 2014-09-25 | 2018-10-16 | Google Llc | Frequency-domain denoising |
| KR101576198B1 (ko) | 2014-10-29 | 2015-12-10 | 삼성전자주식회사 | 계층적 데이터 단위의 스캔 순서에 기반한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
| WO2016116984A1 (ja) * | 2015-01-19 | 2016-07-28 | 日本電気株式会社 | 動画像符号化装置、動画像符号化方法および動画像符号化プログラム |
| KR101576199B1 (ko) | 2015-04-13 | 2015-12-10 | 삼성전자주식회사 | 계층적 데이터 단위의 스캔 순서에 기반한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
| CN109005407B (zh) | 2015-05-15 | 2023-09-01 | 华为技术有限公司 | 视频图像编码和解码的方法、编码设备和解码设备 |
| KR101576200B1 (ko) | 2015-07-03 | 2015-12-10 | 삼성전자주식회사 | 계층적 데이터 단위의 스캔 순서에 기반한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
| KR101577243B1 (ko) | 2015-07-03 | 2015-12-14 | 삼성전자주식회사 | 계층적 데이터 단위의 스캔 순서에 기반한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
| US9794574B2 (en) | 2016-01-11 | 2017-10-17 | Google Inc. | Adaptive tile data size coding for video and image compression |
| US10542258B2 (en) | 2016-01-25 | 2020-01-21 | Google Llc | Tile copying for video compression |
| EP3306922A1 (en) * | 2016-10-05 | 2018-04-11 | Thomson Licensing | Method and apparatus for encoding a picture using rate-distortion based block splitting |
| US20190273943A1 (en) * | 2016-10-10 | 2019-09-05 | Sharp Kabushiki Kaisha | Systems and methods for performing motion compensation for coding of video data |
| US10506258B2 (en) * | 2017-07-13 | 2019-12-10 | Google Llc | Coding video syntax elements using a context tree |
| CN111770339B (zh) * | 2020-07-22 | 2022-04-15 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、设备及存储介质 |
| CN113242430B (zh) * | 2021-05-31 | 2024-05-31 | 杭州当虹科技股份有限公司 | 视频编码方法 |
Family Cites Families (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0200284B1 (en) * | 1980-04-11 | 1993-09-29 | Ampex Corporation | Interpolation filter for image transformation system |
| US4941193A (en) * | 1987-10-02 | 1990-07-10 | Iterated Systems, Inc. | Methods and apparatus for image compression by iterated function system |
| JP2845473B2 (ja) * | 1989-02-13 | 1999-01-13 | 繁 安藤 | 動画像の運動、非運動領域検出装置 |
| GB9019538D0 (en) * | 1990-09-07 | 1990-10-24 | Philips Electronic Associated | Tracking a moving object |
| US5396567A (en) * | 1990-11-16 | 1995-03-07 | Siemens Aktiengesellschaft | Process for adaptive quantization for the purpose of data reduction in the transmission of digital images |
| US5412741A (en) * | 1993-01-22 | 1995-05-02 | David Sarnoff Research Center, Inc. | Apparatus and method for compressing information |
| AU6099594A (en) * | 1993-02-03 | 1994-08-29 | Qualcomm Incorporated | Interframe video encoding and decoding system |
| US5515388A (en) * | 1993-03-19 | 1996-05-07 | Sony Corporation | Apparatus and method for preventing repetitive random errors in transform coefficients representing a motion picture signal |
| KR0162203B1 (ko) * | 1993-06-21 | 1998-12-15 | 김광호 | 양자화스텝사이즈의 가변을 이용한 적응적 부호화방법 및 그 장치 |
| US5446806A (en) * | 1993-11-15 | 1995-08-29 | National Semiconductor Corporation | Quadtree-structured Walsh transform video/image coding |
| US5734755A (en) * | 1994-03-11 | 1998-03-31 | The Trustees Of Columbia University In The City Of New York | JPEG/MPEG decoder-compatible optimized thresholding for image and video signal compression |
| US5654760A (en) * | 1994-03-30 | 1997-08-05 | Sony Corporation | Selection of quantization step size in accordance with predicted quantization noise |
| KR100213015B1 (ko) * | 1994-03-31 | 1999-08-02 | 윤종용 | 양자화 방법 및 회로 |
| US5461422A (en) * | 1994-05-23 | 1995-10-24 | Industrial Technology Research Institute | Quantizer with automatic pre-threshold |
| DE69533870T2 (de) * | 1994-10-19 | 2005-05-25 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Bilddekodierung |
| US5561475A (en) * | 1994-12-30 | 1996-10-01 | Daewoo Electronics Co., Ltd. | Variable block matching motion estimation apparatus |
| KR0171146B1 (ko) * | 1995-03-18 | 1999-03-20 | 배순훈 | 특징점을 이용한 움직임 벡터 검출 장치 |
| CN1157080A (zh) * | 1995-04-25 | 1997-08-13 | 菲利浦电子有限公司 | 用于编码视频图像的装置和方法 |
| US5778192A (en) * | 1995-10-26 | 1998-07-07 | Motorola, Inc. | Method and device for optimal bit allocation between different sources of information in digital video compression |
| US5790131A (en) * | 1996-05-15 | 1998-08-04 | Iterated Systems, Inc. | System and method for lossy compression of data with output file size control |
| US5825930A (en) * | 1997-03-05 | 1998-10-20 | Samsung Electronics Co., Ltd. | Motion estimating method |
-
1996
- 1996-10-23 US US08/735,869 patent/US6084908A/en not_active Expired - Lifetime
- 1996-10-23 JP JP09518195A patent/JP2000511366A/ja not_active Ceased
- 1996-10-23 WO PCT/US1996/016956 patent/WO1997017797A2/en not_active Ceased
-
2003
- 2003-11-04 JP JP2003374710A patent/JP3659353B2/ja not_active Expired - Lifetime
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3659353B2 (ja) | ビデオ画像符号化方法 | |
| JP2000511366A6 (ja) | 4分割ツリーベースの可変ブロックサイズ動き推定装置および方法 | |
| US6160846A (en) | Apparatus and method for optimizing the rate control in a coding system | |
| US6895050B2 (en) | Apparatus and method for allocating bits temporaly between frames in a coding system | |
| CA2295689C (en) | Apparatus and method for object based rate control in a coding system | |
| US6690833B1 (en) | Apparatus and method for macroblock based rate control in a coding system | |
| US6243497B1 (en) | Apparatus and method for optimizing the rate control in a coding system | |
| US6351491B1 (en) | Apparatus and method for optimizing the rate control for multiscale entropy encoding | |
| US6208692B1 (en) | Apparatus and method for performing scalable hierarchical motion estimation | |
| JP3204645B2 (ja) | 映像符号化及び復号化方法並びにその装置 | |
| KR100961760B1 (ko) | 이산코사인변환 계수를 참조하는 움직임 추정 방법 및 장치 | |
| JP4532607B2 (ja) | ブロック・ベースのコード化システムにおいてコード化モードを選択するための装置および方法 | |
| US20090208122A1 (en) | Image coding method and apparatus, and image decoding method and apparatus | |
| Kuo et al. | Multiresolution video coding based on Kalman filtering motion estimation | |
| Wu et al. | Near-lossless image compression by combining wavelets and CALIC |
