JP2006503518A - 高度にスケーラブルな3次元オーバコンプリート・ウェーブレット・ビデオ符号化 - Google Patents

高度にスケーラブルな3次元オーバコンプリート・ウェーブレット・ビデオ符号化 Download PDF

Info

Publication number
JP2006503518A
JP2006503518A JP2005501325A JP2005501325A JP2006503518A JP 2006503518 A JP2006503518 A JP 2006503518A JP 2005501325 A JP2005501325 A JP 2005501325A JP 2005501325 A JP2005501325 A JP 2005501325A JP 2006503518 A JP2006503518 A JP 2006503518A
Authority
JP
Japan
Prior art keywords
subband
motion compensated
subband signals
motion
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005501325A
Other languages
English (en)
Inventor
チュル イェ,ジョン
ダー シャール,ミハエラ ヴァン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2006503518A publication Critical patent/JP2006503518A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/547Motion estimation performed in a transform domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、ビデオを符号化する方法及び装置に関し、異なる周波数サブバンドからなる少なくとも2つの信号にビデオ信号が空間的に分解され、それぞれのサブバンド信号に対し、個別化された動き補償時間フィルタリング方式が信号の内容に従って適応的に適用され、動き補償された時間フィルタリングされたサブバンド信号に対し、テクスチャ符号化が信号の内容に従って適応的に適用される。

Description

本発明は、ビデオ圧縮に関し、より詳細には、適応動き補償時間フィルタリングを使用したオーバコンプリート・ウェーブレット・ビデオ符号化に関する。
本出願は、2002年10月16日に提出された米国仮出願シリアル番号60/418,961号につき35USC119(e)の下で優先権を主張するものであって、引用によりその内容全体が本明細書に組み込まれる。
現在のビデオ符号化アルゴリズムは、動き補償予測符号化によるハイブリッド符号化方式に主に基づいている。かかるハイブリッド方式では、動き補償を使用して時間的な冗長度が低減され、動き補償の残差を変換符号化することで、空間解像度が低減される。しかし、これらハイブリッド符号化方式は、エラー伝播する傾向があり、また、真のスケーラブルビットストリームを提供する観点でのフレキシビリティがない傾向があり、すなわち、同じ圧縮されたビットストリームとは異なる品質、解像度及びフレームレートレイヤを伸張するための能力がない。
対照的に、3次元(3D)サブバンド/ウェーブレット符号化は、非常にフレキシブルなスケーラブルビットストリーム及びより高いエラー回復力を提供することができる。ウェーブレットに基づいたスケーラブルビデオ符号化方式は、許容される異なるスケーラビリティのタイプの観点で、大きなフレキシビリティを許容する。したがって、異なる能力をもつ様々な装置への異質の無線及び有線ネットワークにわたるビデオ転送について特に有効である。
現在のところ、オーバコンプリート・ウェーブレット(over-complete wavelet)及びフレーム間ウェーブレット(inter-frame wavelet)である、2つのウェーブレットに基づいたビデオ符号化方式が存在する。オーバコンプリート(OW)ウェーブレットビデオ符号化では、それぞれのフレームについて空間ウェーブレット変換がはじめに実行され、ウェーブレット係数値を予測すること、又はエントロピー符号化における時間的な状況を定義することでフレーム間の冗長度を利用することが続く。フレーム間ウェーブレット符号化では、時間軸に沿ってウェーブレットフィルタリングが実行され、2次元空間ウェーブレット変換が続く。
現在のフレーム間ウェーブレットビデオ符号化方式は、時間的な冗長度を低減するため、動き補償時間フィルタリング(MCTF: Motion Compensated Temporal Filtering)を使用する。MCTFは、空間分解が実行される前に時間的な動きの方向で実行される。かかるビデオ符号化方式は、空間領域MCTF(SDMCTF)と本明細書では呼ばれる。しかし、動き予測アルゴリズムにより提供される整合の品質は、SDMCTFビデオ符号化方式を本質的に制限する。たとえば、フレーム間ウェーブレット符号化された系列のなかには、僅かにぼやけたものがある。これは、不完全な動き予測により、フレームの詳細が時間的な高周波サブバンドへの動きを引き起こし、そこから空間的な高周波のサブバンドへの動きを引き起こす。これらのアーチファクトは、量子化されていない、空間的にスケーリングされた系列について視覚的なパフォーマンスの低下を招く。さらに、時間的な分割レベル数の減少によりアーチファクトを減少させることができることが試験で示されている。
現在のOWビデオ符号化方式では、ビデオフレームのそれぞれを複数のサブバンドに空間的に分割するためにウェーブレットフィルタリングが使用されており、動き予測を使用して、それぞれのサブバンドの時間的な相関が除かれる。
ウェーブレット領域で動き補償によりウェーブレット係数を予測するための多くの試みがされてきている。しかし、ウェーブレット領域での動き補償は、信号のアライメント及び分析のために選択された離散的なグリッドに非常に依存している。原画像のウェーブレット係数と1画素シフトされた画像のウェーブレット係数との間に非常に大きな差が存在する。このシフト不変の特性は、画像のエッジの周りで頻繁に生じるため、ウェーブレット係数の動き補償が難しくなる。
既存のOWビデオ符号化方式は、予測における奇数位相のウェーブレット係数を利用することでウェーブレット領域における動き予測の非効率性を克服する。奇数位相の係数を得る便利な方法は、バンドシフトを実行することである。復号化された前のフレームはデコーダで利用可能であるので、オーバコンプリートな拡張からの予測は、更なるオーバヘッドを必要としない。さらに、最適な位相とウェーブレット領域における動きベクトルとをサーチすることに関する計算上の複雑さは、分数画素の精度で、空間領域における従来の動き予測のそれに匹敵する。
しかし、動き予測/補償のため、従来のOWフレームワークは、SNRスケーラビリティにおけるパフォーマンスのロスになるドリフトに苦しむ。さらに、制限されたレンジの時間的なスケーラビリティは、Bフレームを使用して達成することができる。
したがって、改善されたSNR及び時間的なスケーラビリティをもつウェーブレットに基づいたビデオ符号化方式が必要とされる。
本発明は、ビデオを符号化するための方法及び装置に対処するものである。
本発明の第一の態様によれば、ビデオ信号は、異なるサブバンド周波数からなる少なくとも2つの信号に空間的に分割される。個別化された動き補償時間フィルタリング方式がそれぞれのサブバンド信号に適用される。次いで、テクスチャ符号化(texture coding)が動き補償された時間フィルタリングされたサブバンド信号のそれぞれに適用される。本発明の第二の態様によれば、少なくとも2つの、符号化され、動き補償時間フィルタリングされた、ビデオ信号の異なる周波数サブバンド信号(at least two encoded motion compensated temporally filtered, different frequency sub-band signals of video signal)を含む信号が復号化される。逆動き補償時間フィルタリングは、復号化された少なくとも2つのサブバンド信号のそれぞれに独立に適用される。少なくとも2つのサブバンド信号は、空間的に再構成され、ビデオ信号は、該少なくとも2つの空間的に作り直されたサブバンド信号のうちの少なくとも1つから再構成される。
本発明は、新しいインバンド動き補償時間フィルタリング(IMCTF: Inband Motion Compensated Temporal Filtering)方法を利用した高度にスケーラブルな3次元(3D)オーバコンプリート・ウェーブレット・ビデオ符号化方式である。本発明のIBMCTF方法は、先のIBMCTF符号化方法の問題点を克服するものであって、空間領域の動き補償時間フィルタリングを利用した従来のフレーム間ウェーブレット符号化方法に匹敵するか、又は該方法よりも良好な符号化効率を示す。
図1は、本発明の例示的な実施の形態に係る3次元オーバコンプリート・ウェーブレットビデオエンコーダのブロック図であって、このビデオエンコーダは、本発明のIBMCTF方法を実行するために使用される場合がある。ビデオエンコーダ100は、従来の3次元オーバコンプリート・ウェーブレットフィルタリング処理を使用して、入力ビデオのそれぞれのビデオフレームを所望の数の多数のサブバンド1,2,...,Nに空間的に分解する3次元ウェーブレット変換ユニット110を含んでいる。
ビデオエンコーダ100は、ウェーブレット変換ユニット110により発生されたそれぞれのサブバンドについて、区分ユニット120a、120b、120cをさらに含んでいる。それぞれの区分ユニット120a、120b、120cは、その関連するサブバンドのウェーブレット係数を、グループとしての符号化のためにグループ・オブ・フレーム(GOF)に分解する。
また、ビデオエンコーダ100は、それぞれのサブバンドについて動き補償時間フィルタリング(MCTF)ユニット130a,130b,130cを含んでおり、これらユニットは、動き予測器131a,131b,131c、及び時間フィルタ132a,132b,132cを含んでいる。それぞれのMCTF130a、130b,130cは、動き補償時間フィルタリング(MCTF)処理を使用して、それぞれのサブバンドのGOFから時間的な相関又は冗長度を個別に除く。本発明によれば、それぞれのサブバンドの個別のMCTFの使用により、動き補償時間フィルタリング処理は、他のサブバンドとは独立にそれぞれのサブバンドについて構成することができる。さらに、特定のサブバンドについて選択された時間フィルタリング処理は、異なる基準に基づいている場合がある。
エンコーダは、それぞれのサブバンドについて、テクスチャエンコーダ140a、140b,140cを更に含んでおり、これらテクスチャエンコーダは、それぞれのサブバンドについてMCTFユニット130a,130b,130cにより発生された残差信号及び動き情報(動きベクトル)が最適化されたテクスチャ符号化処理を使用して独立にテクスチャ符号化することを可能にする。次いで、テクスチャ符号化された残差信号及び動き情報は、マルチプレクサ150により1つのビットストリームに結合される。別の実施の形態のテクスチャ符号化は、フルサイズの残差フレームの全体的な変化であり、このグローバル変換は、それぞれのサブバンドにMCTFユニット130a,130b,130cにより発生された全ての残差信号及び動き情報がフルサイズの残差フレームを発生するために結合された後に適用される。
当業者であれば理解されるように、公知のIBMCTF方法におけるクリティカル・サンプル・ウェーブレット分解は、周期的なシフト不変である。したがって、ウェーブレット領域における動き予測及び補償を実行することは、非効率的であって、符号化の性能低下を招く。この問題に対処するため、それぞれの動き補償フィルタリングユニット130a,130b,130cは、図2に示されるように、適応型の高次の補間フィルタ200を利用して、動き予測器131a,131b,131cの性能を最大にする。本発明の補間フィルタ200は、ロウバンドシフティングを実行するロウバンドシフト(LBS)ユニット210、オーバコンプリート・ウェーブレット係数のインタリーブを実行するインタリーブユニット220、及び補間ユニット230を含んでいる。LBS処理は、シフト不変である、オリジナルウェーブレット係数のオーバコンプリート表現を効率的に発生する1以上の公知のLBSアルゴリズムによりLBSユニット210において実現される。LBSは、1以上の類似のLBSアルゴリズムを使用してエンコーダ及びデコーダでオリジナルのウェーブレット係数のオーバコンプリート展開を有利にも発生し、それにより、従来のフレーム間ウェーブレット符号化方式に比較して、更なる情報が符号化及び転送される必要がない。
インタリーブユニット220により実行されるインタリーブ処理は、拡張された参照フレームを発生するため、オーバコンプリート・ウェーブレット係数により提供される異なる位相情報を結合する。したがって、先にIBMCTFに基づくビデオ符号化方法におけるように、個別に位相情報を符号化する必要が存在しない。本発明のインタリーブ処理のため、位相情報は、より高い精度の動きベクトルの一部として固有に符号化される。
拡張された参照フレームから、補間ユニット230は、1/2画素,1/4画素,1/8画素,1/16画素のような分数画素を発生し、この分数画素は、動き予測のために動き予測器131a,131b,131cにより使用される。補間は、従来の1次元補間フィルタで実現される場合がある。動き予測及びMCTFの性能を最適化するため、異なるタップをもつ独立に最適化された補間フィルタがそれぞれのサブバンドについて使用することができる。図3は、本発明に係るウェーブレット係数のオーバコンプリート展開による、動き予測のための拡張された参照フレームの発生を例示している。HHサブバンドのオーバコンプリート展開300における動き予測のための高次の補間を達成するため、たとえば、低いサブバンドを量(1,0)、(0,1)及び(1,1)だけシフトすることで、オリジナルウェーブレット係数310から3つの他の位相のウェーブレット係数が生成される。次いで、拡張された参照フレーム350を生成するため、4つの位相のウェーブレット係数310,320,330,340がインタリーブされる。
本発明のIBMCTFに基づく3次元オーバコンプリート・ウェーブレット・ビデオ符号化方法は、公知の空間領域の動き補償時間フィルタリング(SDMCTF: Spatial Domain Motion Compensated Temporal Filtering)に基づくビデオ符号化方法と比較して改善された空間スケーラビリティのパフォーマンスを提供する。これは、時間フィルタリングがサブバンド(解像度)当たりで実行されるからであり、したがって、より精細な解像度のサブバンドからの情報の損失は、時間方向におけるドリフトを招かない。
先に説明されたように、それぞれのサブバンドについてディスクリートなMCTFユニット130a,130b,130cの使用により、様々な解像度で異なる時間フィルタリング技術を使用することが可能である。たとえば、1実施の形態では、低い解像度のサブバンドについて双方向性の時間フィルタリング技術を使用することができ、高い解像度のサブバンドについて順方向の時間フィルタリング技術を使用することができる。時間フィルタリング技術は、歪み又は複雑さの測度を最小化することに基づいて選択することができる(たとえば、低い解像度のサブバンドは少ない画素を有し、より多くの画素数を有する高い解像度のサブバンドについて順方向の予測が実行される)。かかる時間フィルタリングのオプションに関する柔軟性のある選択により、MCTFにより実行されたような厳密な1D+2D分解方式から、時間レベルを通して空間サイズの低減をもつ、より一般的な3次元分解方式へと本発明を移し、この場合、高い空間周波数サブバンドは、より長期の時間フィルタリングから省略される。
それぞれのサブバンドについて個別の区分ユニット120a,120b,120cの使用により、GOFはサブバンド当たり適応的に決定することができる。たとえば、LLサブバンドは非常に大きなGOFを有し、Hサブバンドは、制限されたGOFを使用することができる。GOFサイズは、系列の特性、複雑さ又は回復力の要件に基づいて変動することができる。先に説明されたように、図4Aに示されるように、従来のMCTFの分解方式は、ぼやけた画像を生成する。しかし、異なる時間的な分解レベル及びGOFサイズの使用により、本発明の3次元ウェーブレットビデオ符号化方式はかかる問題点を克服することが可能である。図4Bに示されるように、LL,LH(HL)及びHHのGOFサイズは、それぞれ8フレーム、4フレーム及び2フレームであり、最大の分解レベル3,2及び1をそれぞれ可能にする。このように、高い空間周波数サブバンドは、より長期の時間フィルタリングから省略される。
様々なサブバンドの時間分解レベルの数は、内容に基づいて決定することができ、又は特定の歪みのメトリックを低減するため、若しくはそれぞれの解像度における所望の時間スケーラビリティに基づいて決定することができる。たとえば、30,15及び7.5HzフレームレートがCIF(352×288)サイズの解像度で望まれる場合、30及び15HzフレームレートがSD(704×576)サイズの解像度で望まれる場合、LL空間サブバンドについて、3つのレベルの時間分解が使用され、LH,HL及びHHサブバンドについて2つのレベルの時間分解を適用することができる。
先に説明したように、それぞれのサブバンドについて個別のテクスチャ符号化ユニット140a,140b,140cの使用により、様々な空間サブバンドの適応的なテクスチャ符号化が可能となる。たとえば、ウェーブレット又はDCTベースのテクスチャ符号化方式が使用される場合がある。DCTに基づくテクスチャ符号化が使用される場合、状況をカバーすること及びカバーしないことに効率的に対処するため、イントラ符号化されたブロックをGOFの何処かに有利に挿入することができる。また、MPEG−4/H.26Lによる「適応型イントラリフレッシュ」コンセプトは、改善された回復量を提供するために容易に利用することができ、異なる回復力を得るために様々なサブバンドについて異なるリフレッシュレートを使用することができる。このことは、高い解像度のサブバンドを隠すために低い解像度のサブバンドを使用することができるので特に利益があり、したがって、回復力がより重要である。
本発明の別の利点は、デコーダの複雑さのスケーラビリティに関する。異なる計算能力及びディスプレイをもつ多くのデコーダが存在する場合、SNR/空間/時間スケーラビリティを通して全てのそれらデコーダをサポートするため、同じスケーラブルビットストリームを使用することができる。たとえば、本発明のエンコーダにより生成されたスケーラブルビットストリームは、低い計算上の負荷のみを招く、低い解像度の空間及び時間分解レベルのみをデコードすることができる低い複雑さをもつデコーダによりデコードすることができる。同様に、本発明のエンコーダにより発生されたスケーラブルビットストリームは、完全な空間及び時間解像度を達成するため、全体のビットストリームをデコードすることができる洗練された復号化能力を有するデコーダでデコードすることができる。
図5は、本発明の例示的な実施の形態に係る3次元のオーバコンプリート・ウェーブレット・ビデオデコーダのブロック図である。デコーダは、本発明のエンコーダにより生成されたビットストリームを復号化するために使用される場合がある。ビデオデコーダ400は、動き情報から符号化されたウェーブレット係数を分離するためにビットストリームを処理するデマルチプレクサ410を含む場合がある。
第一のテクスチャデコーダ420は、符号化側で実行されたテクスチャ符号化技術の逆に従って、ウェーブレット係数をテクスチャデコードしてそれぞれ個別のサブバンド1,2,...Nを得る。第一のテクスチャデコーダ420により生成されたサブバンドのウェーブレット係数は、サブバンドのそれぞれのGOFに対応する。動きベクトルデコーダ430は、符号化側で実行されたテクスチャ符号化技術の逆の処理に従い、それぞれのサブバンドの動き情報をデコードする。復号化された動きベクトル及び残差テクスチャ情報を使用して、それぞれのサブバンドについて独立にMCTFユニット440a,440b,440cにより逆MCTFが適用され、逆ウェーブレット変換ユニット450は、低レベル、中レベル及び高レベル画像を再構成するため、それぞれのサブバンドを空間的に再構成する。ロウバンドシフトブロックは、フルサイズの画像を組み立てるため、再構成されたサブバンド画像を読み出し、次いで、ロウバンドシフトされたウェーブレット分解は、逆MCTFユニット440a,440b,440cについて拡張された参照フレームを提供するために適用される。ディスプレイの解像度に依存して、ビデオ再構成ユニット(図示せず)は、低レベル解像度のビデオを生成するためにサブバンドのうちの1つを使用するか、中レベル解像度のビデオを生成するために2つのサブバンドを使用するか、若しくは高レベル解像度、フルクオリティビデオを生成するために全てのサブバンドを使用する場合がある。
本発明のビデオスキームで利用される各種プロセスは、以下に更に詳細に説明される。
オーバコンプリート・ウェーブレット領域における動き予測及び補償
1.ロウバンドシフト方法(LBS: Low Band Shifting Method)
ウェーブレット変換で実行される間引き処理は、もはやシフト不変ではないウェーブレット係数を生成する。空間領域における動きは、ウェーブレット係数から正確に予測することはできず、符号化効率におけるかなりの損失を生成する。本発明で利用されるLBSアルゴリズムは、ウェーブレット変換のシフト変化の特性を克服する方法を提供する。第一のレベルで、オリジナル及びシフトされた信号は、ロウサブバンド信号とハイサブバンド信号とに分解される。その後、ロウサブバンド信号は、第一のレベルに関して同じやり方で更に分解される。
図6は、2つのレベルに分解について、LBSアルゴリズムを使用したオーバコンプリート・ウェーブレット展開を示している。1次元(1D)の定式化は、複数のレベルを有するウェーブレット分解に容易に拡張することができ、2次元(2D)画像信号にも拡張することができる。ペア(m,n)は、そのサブバンド内のウェーブレット係数がx方向でm画素のシフト及びy方向でn画素のシフトにより生成されたことを示している。LBSアルゴリズムは、入力サブバンドの全ての可能なシフトについてフルセットのウェーブレット係数を発生する。したがって、表現は、空間領域でいずれかのシフトを正確に伝達する。更に説明されるように、特定の空間位置で同じ分解レベルに対応する異なるシフトされたウェーブレット係数は、「クロスフェーズ」ウェーブレット係数と呼ばれる。
図7は、LBS方法を使用して得られた2レベルのオーバコンプリート・ウェーブレット変換のビデオを示している。なお、nレベルの分解について、オーバコンプリート・ウェーブレット表現は、原画像のストレージスペースよりも大きい3n+1であるストレージスペースを必要とする。
2.ウェーブレット係数のインタリーブ
本発明の新しいインタリーブ方式は、図6及び図7に示されるものとは異なるオーバコンプリート・ウェーブレット係数を記憶する。1次元のケースの1レベル分解について本発明のインタリーブ方式を例示している図8に示されるように、シフトインタリーブのための係数は、オーバコンプリート領域における新たな座標がオリジナルの空間領域における関連するシフトに対応するように実行される。
インタリーブ方式は、それぞれの分解レベルで再帰的に使用することができ、2次元信号について直接的に拡張することができる。図9は、本発明のインタリーブ処理を実行後の、図7のビデオの最初のフレームのオーバコンプリート・ウェーブレット係数を示している。図9から分かるように、インタリーブされたロウサブバンド信号は、オーバコンプリート・ウェーブレット・ロウパスフィルタを使用して、オリジナルフレームのロウパスフィルタされたバージョンである。本発明のインタリーブ処理により、本発明のIBMCTF方法は、サブピクセル精度の動き予測及び補償を提供するのを可能にする。先に提案されたIBMCTF方式は、隣接するウェーブレット係数間のクロスフェーズの依存性を考慮していないので、最適なサブピクセル精度の動き予測及び補償を提供することができない。さらに、インタリーブ処理により、本発明のIBMCTF方法は、階層的な可変サイズのブロックマッチング、後方動き補償、及びイントラブロックの適応型の挿入を使用することを可能にする。
ウェーブレットブロックの生成
当該技術分野で公知であるように、ウェーブレット分解では、最高周波数のサブバンドにおける係数を除いて、所与のスケールでのそれぞれの係数は、より再生なスケールでの同じオリエンテーションの係数のセットに関連することができる。多くのウェーブレットコーダでは、この関係は、ウェーブレットツリーと呼ばれるデータ構造として係数を表現することで利用される。LBSアルゴリズムでは、最も低いサブバンドに位置するそれぞれのウェーブレットツリーの係数は、図10に示されるようなウェーブレットブロックを形成するために再配置される。ウェーブレットブロックの目的は、ウェーブレット係数と画像において空間的に表現されるものとの間で直接的な関連付けを提供することにある。全てのスケール及びオリエンテーションでの関連する係数は、それぞれのブロックに含まれる。
動き予測の構造
空間領域では、ブロックに基づく動き予測は、画像を小さなブロックに通常分割し、絶対平均差(MAD: Mean Absolute Different)を現在のフレームのそれぞれのブロックに対して最小にする参照フレームのブロックを発見する。LBSアルゴリズムの動き予測は、現在のウェーブレットブロックと参照のウェーブレットブロックとの間の最小MADを発生する動きベクトル(dx,dy)を発見する。例として、入力画像が第三のレベルにまで分解され(すなわち、入力画像は全体で10のサブバンドに分解することができる)、変位ベクトルが(dx,dy)である場合、図10におけるk番目のウェーブレットブロックのMADは、以下のように計算される。
Figure 2006503518
ここで、xi,k=x0,k/2i及びyi,k=y0,k/2iであり、図10に示されるように、(x0,k,y0,k)は空間領域におけるk番目のウェーブレットブロックに最初の位置を示す。
(外1)
Figure 2006503518
は、xよりも大きくない最も大きな整数を示している。ここで、参照フレームのi番目のレベルのHLサブバンドは、HLref (i)(m,n;x,y)により表され、(m,n)は、空間領域におけるx方向及びy方向のシフト数を示しており、(x,y)はサブバンド信号の位置である。動き予測の最適な基準は、このMADを最小にする最適値(dx,dy)を発見する。なお、オリジナルのLBSアルゴリズムでは、(dx,dy)の整数ではない値について、先の式を使用してMADを計算するのは可能ではない。より詳細には、従来のIBMCTFビデオ符号化方式におけるMADは、同じ位相のウェーブレット係数にのみ基づいており、結果的に得られるサブピクセル精度の動き予測及び補償は最適ではない。
しかし、本発明のIBMCTF方法では、インタリーブ処理により、MAD計算は、サブピクセル精度であったとしても、SDMCTFビデオ符号化方式におけるのと同様に実行することができる。より詳細には、本発明のIBMCTF方法について変位ベクトル(dx,dy)のためのMADは、以下のように計算される。
Figure 2006503518
ここで、たとえばLBS_HLref (i)(x,y)は、本発明のインタリーブ処理を使用した参照フレームの拡張されたHLサブバンドを示している。なお、(dx、dy)が整数ではない値であってとしても、整数ではない変位についてMADを発生するため、それぞれ拡張されたサブバンドについて、SDMCTFのために使用される同じ補間技術を容易に使用することができる。したがって、本発明のIBMCTFビデオ符号化方式は、既存のIBMCTF符号化方式に比較して、より効率的であって、確かに最適なサブピクセル動き予測を提供する。また、ウェーブレットブロック構造による本発明のIBMCTFビデオ符号化方式では、符号化されるべき動きベクトルの数がSDMCTFのそれに同じであるため、動きベクトルのオーバヘッドを招かない。動き予測は、残差の符号化と密に揃えられるので、符号化性能を改善するため、(残差信号のエントロピーのような)より洗練された動き予測基準が使用される場合がある。
シミュレーション結果
オーバコンプリート・ウェーブレット領域における本発明に係る動き予測及び動き補償がウェーブレット領域でより低い残差エネルギーを生じることを確かめるため、1レベルの時間分解を使用し、IBMCTF及びSDMCTFの両者についてMADを計算する。なお、フレーム間ウェーブレット符号化において、MADは空間領域で計算されるが、実際に最小化される必要があるのは、ウェーブレット領域における残差エネルギーである。図11は、時間的なハイサブバンドフレームについてウェーブレット領域におけるMADを例示している。MAD値は、時間的なハイサブバンドの最初の50フレームにわたり平均される。SDMCTFケースについて、ウェーブレット領域における対応するMAD値は、残差信号のウェーブレット変換後に計算される。なお、IBMCTFのためのMADは、SDMCTFのMADよりも常に小さく、これは、SDMCTFに対して本発明のIBMCTFビデオ符号化方式の可能な符号化ゲインを示している。
図12から図17は、本発明のIBMCTFビデオ符号化方式のレート歪み性能、及び整数及び1/8画素精度の動き予測のために幾つかのテスト系列についてSDMCTFのレート歪み性能をプロットしたものである。MCTFのインバンド構造は、Daubechies9/7フィルタにより実行される2つのレベルの空間分解により計算されており、4つのレベルの分解は、時間方向について使用されている。テクスチャ符号化は、S.T.Hsiang et al.,による“Invertible Three-Dimensional Analysis/Synthesis Systems For Video Coding With Half-Pixel Accurate Motion Compensation” VCIP 1999, SPIE Vol.3653, pp.537-546と題される論文において記載されるEZBCアルゴリズムにより実行されている。SDMCTFと同様に、1/8画素を使用したサブピクセル動き予測は、IBMCTFの符号化性能を大きく改善する。IBMCTF及びSDMCTFの全体の符号化性能は、匹敵するものである。しかし、“Coastguard”、“Silent”及び“Stefan”のような幾つかの系列は、0.5dBに及ぶ性能ゲインを示し、“Mobile”系列について、0.3dBの性能の低下を観察することができる。視覚的に、本発明のIBMCTFアルゴリズムは、動き予測のブロッキングアーチファクトがない。これは、動き予測及びフィルタリングがそれぞれサブバンドで行われ、動きの境界がウェーブレット再構成フィルタを使用してフィルタ出力されるためである。
図18は、本発明の原理を実現するために使用される場合があるシステム500の例示的な実施の形態である。システム500は、テレビジョン、セットトップボックス、デスクトップ、ラップトップ又はパームトップコンピュータ、パーソナルデジタルアシスタント(PDA)、ビデオカセットレコーダ(VCR)、デジタルビデオレコーダ(DVR)、TiVO装置等のようなビデオ/イメージストレージ装置、及びこれらの装置と他の装置の一部又は組み合わせを表している場合がある。システム500は、1以上のビデオ/イメージソース501、1以上の入力/出力装置502、プロセッサ503及びメモリ504を含んでいる。ビデオ/イメージソース501は、たとえば、テレビ受像機、VCR又は他のビデオ/イメージストレージ装置を表している場合がある。ソース501は、たとえば、インターネット、ワイドエリアネットワーク、メトロポリタンエリアネットワーク、ローカルエリアネットワーク、地上波放送システム、ケーブルネットワーク、衛星ネットワーク、無線ネットワーク、又は電話ネットワーク、並びにこれらのタイプのネットワークと他のタイプのネットワークの一部又は組み合わせをとおして、1以上のサーバからビデオを受信するための1以上のネットワークコネクションを代替的に表している場合がある。
入力/出力装置502、プロセッサ503及びメモリ504は、通信媒体505を通して通信する場合がある。通信媒体505は、たとえば、バス、通信ネットワーク、回路、回路カード又は他の装置からなる1以上の内部接続、並びにこれらの通信媒体と他の通信媒体との一部又は組み合わせを表している場合がある。ソース501からの入力ビデオデータは、メモリ504に記憶され、表示装置506に供給される出力ビデオ/イメージを生成するためにプロセッサ503により実行される1以上のソフトウェアプログラムに従って処理される。
好適な実施の形態では、本発明の符号化及び復号化原理は、システムにより実行されるコンピュータ読取り可能なコードにより実現される場合がある。コードは、メモリ504に記憶され、CD−ROM又はフロッピー(登録商標)ディスクのようなメモリ媒体から読取り/ダウンロードされる場合がある。他の実施の形態では、ハードウェア回路は、本発明を実現するためのソフトウェア命令の代わりに、又は該ソフトウェア命令と組み合わせて使用される場合がある。たとえば、図1、図2及び図5に示される機能的なエレメントは、個別のハードウェアエレメントとして実現される場合がある。
本発明は特定の実施の形態の観点で先に説明されてきたが、本発明は本明細書に開示される実施の形態に限定又は制限されることが意図されていないことを理解されたい。たとえば、限定されるものではないがウェーブレット又はマッチングの遂行を含めて、DCT以外の他の変換を利用することもできる。これら及び全ての他のかかる変更及び変形は、特許請求の範囲内にあることが考慮される。
本発明のIBMCTF方法を実行するために使用される場合がある、本発明の例示的な実施の形態に係る3次元オーバコンプリート・ウェーブレットビデオエンコーダのブロック図である。 本発明で使用される適応型高次の補間フィルタのブロック図である。 本発明に係るウェーブレット係数のオーバコンプリート展開による動き予測のための拡張された参照フレームの発生を例示する図である。 ぼやけた画像を発生する従来のMCTFのための分解方式を例示する図である。 本発明で使用される分解方式を例示する図である。 本発明の例示的な実施の形態に係る3次元オーバコンプリート・ウェーブレットビデオデコーダのブロック図である。 2つのレベル分割のためのLBSアルゴリズムを使用するオーバコンプリート・ウェーブレット展開を示す図である。 LBS方法を使用して得られた2レベルのオーバコンプリート・ウェーブレット変換のビデオである。 1次元ケースの1レベル分解について本発明のインタリーブ方式を例示する図である。 本発明のインタリーブ処理を実行後、図7のビデオの最初のフレームのオーバコンプリート・ウェーブレット係数を示す図である。 LBSアルゴリズムによるウェーブレットブロックの形式を示す図である。 時間的な高周波サブバンドフレームについてウェーブレット領域におけるMADを例示する表である。 本発明のIBMCTFビデオ符号化方式のレート歪みの性能のプロット、及び整数及び1/8精度の動き予測について幾つかのテスト系列のためのSDMCTFのプロットである。 本発明のIBMCTFビデオ符号化方式のレート歪みの性能のプロット、及び整数及び1/8精度の動き予測について幾つかのテスト系列のためのSDMCTFのプロットである。 本発明のIBMCTFビデオ符号化方式のレート歪みの性能のプロット、及び整数及び1/8精度の動き予測について幾つかのテスト系列のためのSDMCTFのプロットである。 本発明のIBMCTFビデオ符号化方式のレート歪みの性能のプロット、及び整数及び1/8精度の動き予測について幾つかのテスト系列のためのSDMCTFのプロットである。 本発明のIBMCTFビデオ符号化方式のレート歪みの性能のプロット、及び整数及び1/8精度の動き予測について幾つかのテスト系列のためのSDMCTFのプロットである。 本発明のIBMCTFビデオ符号化方式のレート歪みの性能のプロット、及び整数及び1/8精度の動き予測について幾つかのテスト系列のためのSDMCTFのプロットである。 本発明の原理を実現するために使用される場合があるシステムの例示的な実施の形態である。

Claims (26)

  1. ビデオを符号化する方法であって、
    ビデオ信号を供給するステップと、
    異なる周波数サブバンドからなる少なくとも2つの信号に該ビデオ信号を空間的に分解するステップと、
    個別化された動き補償時間フィルタリング方式をそれぞれのサブバンド信号に適用するステップと、
    動き補償された時間フィルタリングされたサブバンド信号のそれぞれをテクスチャ符号化するステップと、
    を有する方法。
  2. 該空間的に分解するステップは、ウェーブレットフィルタリングにより実行される、
    請求項1記載の方法。
  3. 該ビデオ信号は、複数のフレームを定義しており、該空間的に分解するステップは、異なる周波数サブバンドからなる少なくとも2つの信号に該ビデオ信号のフレームのそれぞれを空間的に分解するステップを含む、
    請求項1記載の方法。
  4. 該動き補償時間フィルタリング方式を適用する該ステップの前に、該サブバンド信号のそれぞれを所定の内容を有する時間のグループ・オブ・フレームを表す信号に分割するステップを更に有する、
    請求項1記載の方法。
  5. 該それぞれのサブバンド信号に適用される該個別化された動き補償時間フィルタリング方式は、該グループ・オブ・フレームの内容に従って個別化される、
    請求項4記載の方法。
  6. 該動き補償時間フィルタリング方式を適用する該ステップの前に、該サブバンド信号のそれぞれをグループ・オブ・フレームを表す信号に分割するステップを更に有し、少なくとも1つのグループ・オブ・フレーム信号でのフレーム数は、適応的に決定される、
    請求項1記載の方法。
  7. 該それぞれのサブバンド信号に適用される該個別化された動き補償時間フィルタリング方式は、該サブバンド信号の空間解像度に従って個別化される、
    請求項1記載の方法。
  8. 該それぞれのサブバンド信号に該個別化された動き補償時間フィルタリング方式を適用する該ステップは、信号コンテンツに依存する、可変の精度による動き予測を使用することで実行される、
    請求項1記載の方法。
  9. 該それぞれのサブバンド信号に適用される該個別化された動き補償時間フィルタリング方式は、該サブバンド信号の時間的な相関に従って個別化される、
    請求項1記載の方法。
  10. 該それぞれのサブバンド信号に該個別化された動き補償時間フィルタリング方式を適用するステップは、動き予測の性能を最大にするために個別化された補間フィルタを使用することで実行される、
    請求項1記載の方法。
  11. 該それぞれのサブバンド信号に適用される該個別化された動き補償時間フィルタリング方式は、該サブバンド信号の特性に従って個別化される、
    請求項1記載の方法。
  12. 該それぞれのサブバンド信号に該個別化された動き補償時間フィルタリング方式を適用するステップは、多方向の時間フィルタと単方向の時間フィルタからなるグループから選択された時間フィルタを使用することで実行される、
    請求項1記載の方法。
  13. 該それぞれのサブバンド信号に該個別化された動き補償時間フィルタリング方式を適用する該ステップは、
    3つの更なる位相からなるウェーブレット係数を生成するため、該空間的に分解するステップで生成されたウェーブレット係数の位相による該サブバンド信号を少なくとも3回シフトするステップと、
    拡張された参照フレームを生成するため、4つの位相からなるウェーブレット係数をインタリーブするステップと、
    該拡張された参照フレームを使用して動きを予測するステップと、
    を含む請求項1記載の方法。
  14. 該空間的に分解するステップは、それぞれの分解レベルが異なる周波数のサブバンドを含む複数の分解レベルを提供するために実行され、該個別化された動き補償時間フィルタリング方式を適用するステップは、該シフトするステップ、該インタリーブするステップ及び該予測するステップを実行することで、それぞれの分解レベルについて再帰的に適用される、
    請求項13記載の方法。
  15. 該それぞれのサブバンド信号に該個別化された動き補償時間フィルタリング方式を適用するステップは、
    3つの更なる位相からなるウェーブレット係数を生成するため、該空間的に分解するステップで生成されたウェーブレット係数の位相による該サブバンド信号を少なくとも3回シフトするステップと、
    拡張された参照フレームを生成するため、4つの位相からなるウェーブレット係数を結合するステップと、
    該拡張されたフレームから分数の画素を生成するステップと、
    該分数画素に従って動きを予測するステップと、
    を含む請求項1記載の方法。
  16. 該空間的に分解するステップは、それぞれの分解レベルが異なる周波数サブバンドを含む複数の分解レベルを提供するために実行され、該個別化された動き補償時間フィルタリング方式を適用するステップは、該シフトするステップ、該結合するステップ、該発生するステップ及び該予測するステップを実行することで、それぞれの分解レベルについて再帰的に適用される、
    請求項14記載の方法。
  17. ビデオを符号化するための記憶媒体であって、
    異なる周波数サブバンドからなる少なくとも2つの信号にビデオ信号を空間的に分解するためのコードと、
    それぞれのサブバンド信号に個別化された動き補償時間フィルタリング方式を適用するためのコードと、
    該動き補償時間フィルタリングされたサブバンド信号のそれぞれをテクスチャ符号化するためのコードと、
    を含む記憶媒体。
  18. ビデオを符号化するための装置であって、
    異なる周波数サブバンドからなる少なくとも2つの信号にビデオ信号を空間的に分解するためのウェーブレット変換ユニットと、
    該少なくとも2つのサブバンド信号のそれぞれについて、個別化された動き補償時間フィルタリング方式をその関連するサブバンド信号に適用する動き補償時間フィルタリングユニットと、
    該少なくとも2つのサブバンド信号について、その関連する動き補償時間フィルタリングされたサブバンド信号をテクスチャ符号化するテクスチャ符号化ユニットと、
    を有する装置。
  19. それぞれのサブバンド信号について、所定の内容を含む時間のグループ・オブ・フレームを表す信号にその関連するサブバンド信号を分割する区分ユニットを更に有する、
    請求項18記載の装置。
  20. それぞれの動き補償時間フィルタリングユニットは、
    3つの更なる位相からなるウェーブレット係数を生成するため、ウェーブレット係数の位相によるその関連するサブバンド信号を少なくとも3回シフトするロウバンドシフトユニットと、
    拡張された参照フレームを生成するため、4つの位相からなるウェーブレット係数をインタリーブするインタリーブユニットと、
    を含む請求項18記載の装置。
  21. それぞれの動き補償時間フィルタリングユニットは、該拡張されたフレームから分数の画素を生成するための補間ユニットを更に含む、
    請求項20記載の装置。
  22. それぞれの動き補償時間フィルタリングユニットは、該分数の画素に従って動きを予測する動き予測ユニットを更に含む、
    請求項21記載の装置。
  23. ビデオを復号化する方法であって、
    少なくとも2つの、符号化され、動き補償時間フィルタリングされた、ビデオ信号の異なる周波数サブバンド信号を含む信号を復号化するステップと、
    動き補償時間フィルタリングとは逆の処理を復号化された少なくとも2つのサブバンド信号のそれぞれに独立に適用するステップと、
    該少なくとも2つのサブバンド信号を空間的に構成し直すステップと、
    該少なくとも2つの空間的に構成し直されたサブバンド信号のうちの少なくとも1つからビデオ信号を再構成するステップと、
    を有する方法。
  24. 該ビデオ信号は、少なくとも2つの空間的に構成し直されたサブバンド信号の全てから再構成される、
    請求項23記載の方法。
  25. ビデオを復号化するためのメモリ媒体であって、
    少なくとも2つの、符号化され、動き補償時間フィルタリングされた、ビデオ信号の異なる周波数サブバンド信号を含む信号を復号化するためのコードと、
    動き補償時間フィルタリングとは逆の処理を該復号化された少なくとも2つのサブバンド信号のそれぞれに独立に適用するためのコードと、
    該少なくとも2つのサブバンド信号を空間的に構成し直すためのコードと、
    該少なくとも2つの空間的に構成し直されたサブバンド信号のうちの少なくとも1つからビデオ信号を再構成するためのコードと、
    を有する記憶媒体。
  26. ビデオを復号化する装置であって、
    少なくとも2つの、符号化され、動き補償時間フィルタリングされた、ビデオ信号の異なる周波数サブバンド信号を含む信号を復号化するテクスチャ復号化ユニットと、
    該少なくとも2つのサブバンド信号のそれぞれについて、動き補償時間フィルタリングとは逆の処理をその関連する復号化された少なくとも2つのサブバンド信号に独立に適用する逆動き補償時間フィルタリングユニットと、
    該少なくとも2つのサブバンド信号を空間的に構成し直すための逆ウェーブレット変換ユニットと、
    該少なくとも2つの空間的に構成し直されたサブバンド信号のうちの少なくとも1つからビデオ信号を再構成するためのビデオ再構成ユニットと、
    を有する装置。

JP2005501325A 2002-10-16 2003-10-08 高度にスケーラブルな3次元オーバコンプリート・ウェーブレット・ビデオ符号化 Pending JP2006503518A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US41896102P 2002-10-16 2002-10-16
US48379603P 2003-06-30 2003-06-30
PCT/IB2003/004452 WO2004036919A1 (en) 2002-10-16 2003-10-08 Fully scalable 3-d overcomplete wavelet video coding using adaptive motion compensated temporal filtering

Publications (1)

Publication Number Publication Date
JP2006503518A true JP2006503518A (ja) 2006-01-26

Family

ID=32110202

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005501325A Pending JP2006503518A (ja) 2002-10-16 2003-10-08 高度にスケーラブルな3次元オーバコンプリート・ウェーブレット・ビデオ符号化

Country Status (6)

Country Link
US (1) US20060008000A1 (ja)
EP (1) EP1554887A1 (ja)
JP (1) JP2006503518A (ja)
KR (1) KR20050052532A (ja)
AU (1) AU2003264804A1 (ja)
WO (1) WO2004036919A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060024449A (ko) * 2003-06-30 2006-03-16 코닌클리케 필립스 일렉트로닉스 엔.브이. 오버컴플릿 웨이브릿 도메인에서 비디오 코딩
CN1813269A (zh) * 2003-06-30 2006-08-02 皇家飞利浦电子股份有限公司 使用过完备小波编码和循环预测映射进行视频处理的系统及方法
JP2007506348A (ja) * 2003-09-23 2007-03-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ インバンド動き補償時間フィルタリングを利用したビデオノイズ除去アルゴリズム
KR100643269B1 (ko) * 2004-01-13 2006-11-10 삼성전자주식회사 Roi를 지원하는 영상 코딩 방법 및 장치
FR2867328A1 (fr) * 2004-03-02 2005-09-09 Thomson Licensing Sa Procede de decodage d'une sequence d'images codee avec echelonnabilite spatiale et temporelle
US20050201468A1 (en) * 2004-03-11 2005-09-15 National Chiao Tung University Method and apparatus for interframe wavelet video coding
US20080037633A1 (en) * 2004-07-13 2008-02-14 France Telecom Method and Device for Coding a Sequence of Video Images
US8374238B2 (en) * 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
TWI255138B (en) * 2005-03-08 2006-05-11 Novatek Microelectronics Corp Method and apparatus for noise reduction of video signals
US20070009050A1 (en) * 2005-04-11 2007-01-11 Nokia Corporation Method and apparatus for update step in video coding based on motion compensated temporal filtering
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US20070053441A1 (en) * 2005-06-29 2007-03-08 Xianglin Wang Method and apparatus for update step in video coding using motion compensated temporal filtering
US8755440B2 (en) * 2005-09-27 2014-06-17 Qualcomm Incorporated Interpolation techniques in wavelet transform multimedia coding
KR100791453B1 (ko) * 2005-10-07 2008-01-03 성균관대학교산학협력단 움직임보상 시간축 필터링을 이용한 다시점 비디오 부호화및 복호화 방법 및 장치
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US8244071B2 (en) 2006-11-27 2012-08-14 Microsoft Corporation Non-dyadic spatial scalable wavelet transform
WO2008079508A1 (en) * 2006-12-22 2008-07-03 Motorola, Inc. Method and system for adaptive coding of a video
TWI354496B (en) 2006-12-28 2011-12-11 Nippon Telegraph & Telephone Video processing method and apparatus, video proce
CN101779220B (zh) * 2007-06-08 2013-10-02 汤姆森特许公司 用于多点阵基于稀疏性的滤波的方法和装置
EP2099176A1 (en) * 2007-12-18 2009-09-09 Nokia Corporation Method and device for adapting a buffer of a terminal and communication system comprising such device
US8619861B2 (en) * 2008-02-26 2013-12-31 Microsoft Corporation Texture sensitive temporal filter based on motion estimation
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US20090328093A1 (en) * 2008-06-30 2009-12-31 At&T Intellectual Property I, L.P. Multimedia Content Filtering
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
JP5544361B2 (ja) * 2008-08-26 2014-07-09 コーニンクレッカ フィリップス エヌ ヴェ 三次元ビデオ信号を符号化するための方法及びシステム、三次元ビデオ信号を符号化するための符号器、三次元ビデオ信号を復号するための方法及びシステム、三次元ビデオ信号を復号するための復号器、およびコンピュータ・プログラム
FR2954035B1 (fr) * 2009-12-11 2012-01-20 Thales Sa Procede d'estimation de la qualite video a une resolution quelconque
WO2020084475A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Utilization of refined motion vector
EP3857879A4 (en) * 2018-11-12 2022-03-16 Beijing Bytedance Network Technology Co., Ltd. SIMPLIFICATION OF COMBINED INTER-INTRA PREDICTION
KR20210091161A (ko) 2018-11-20 2021-07-21 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 부분적 위치에 기반한 차분 계산
KR102635518B1 (ko) 2019-03-06 2024-02-07 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 변환된 단예측 후보의 사용

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5560003A (en) * 1992-12-21 1996-09-24 Iowa State University Research Foundation, Inc. System and hardware module for incremental real time garbage collection and memory management
US6065020A (en) * 1998-05-27 2000-05-16 Microsoft Corporation Dynamic adjustment of garbage collection

Also Published As

Publication number Publication date
AU2003264804A1 (en) 2004-05-04
WO2004036919A1 (en) 2004-04-29
KR20050052532A (ko) 2005-06-02
EP1554887A1 (en) 2005-07-20
US20060008000A1 (en) 2006-01-12

Similar Documents

Publication Publication Date Title
JP2006503518A (ja) 高度にスケーラブルな3次元オーバコンプリート・ウェーブレット・ビデオ符号化
KR101176650B1 (ko) 3d 부-대역 코딩을 위한 내장형 기본 계층 코덱
KR101183304B1 (ko) Sdmctf 인코딩된 비디오의 3d 부-대역 디코딩에서의 공간 확장성
KR101203338B1 (ko) 움직임-보상형 시간적 필터링에서의 적응적 업데이트를위한 방법
JP5014989B2 (ja) 基礎階層を利用するフレーム圧縮方法、ビデオコーディング方法、フレーム復元方法、ビデオデコーディング方法、ビデオエンコーダ、ビデオデコーダ、および記録媒体
JP4409276B2 (ja) 多重解像度映像表示の方法及び映像符号器
JP4587321B2 (ja) インタレースデジタルビデオデータのスケーラブル符号化および復号化
JP4844741B2 (ja) 動画像符号化装置及び動画像復号装置と、その方法及びプログラム
US20060146937A1 (en) Three-dimensional wavelet video coding using motion-compensated temporal filtering on overcomplete wavelet expansions
JP2005533425A (ja) 単一の基準フレームと複数の基準フレームの両者に基づいた動き補償フィルタリングを使用したウェーブレットベースの符号化
US8855198B2 (en) Moving picture encoding method, moving picture decoding method, moving picture encoding device, moving picture decoding device, and computer program
US7242717B2 (en) Wavelet domain motion compensation system
KR100587562B1 (ko) 비디오 프레임에 대한 움직임 추정 방법 및 비디오 인코더
EP1642463A1 (en) Video coding in an overcomplete wavelet domain
Ye et al. Fully scalable 3D overcomplete wavelet video coding using adaptive motion-compensated temporal filtering
KR20060131796A (ko) 동화상의 부호화 방법 및 장치, 그리고 동화상의 복호 방법및 장치
Wang Fully scalable video coding using redundant-wavelet multihypothesis and motion-compensated temporal filtering
CN1706197A (zh) 使用自适应运动补偿时间滤波的完全可分级3-d过完整小波视频编码
JP2007088833A (ja) 符号化装置及び復号装置