JP2006503475A - Drift-free video encoding and decoding method and corresponding apparatus - Google Patents

Drift-free video encoding and decoding method and corresponding apparatus Download PDF

Info

Publication number
JP2006503475A
JP2006503475A JP2004544560A JP2004544560A JP2006503475A JP 2006503475 A JP2006503475 A JP 2006503475A JP 2004544560 A JP2004544560 A JP 2004544560A JP 2004544560 A JP2004544560 A JP 2004544560A JP 2006503475 A JP2006503475 A JP 2006503475A
Authority
JP
Japan
Prior art keywords
resolution
sequence
low
gof
low resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004544560A
Other languages
Japanese (ja)
Inventor
ブルジュ,アルノー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2006503475A publication Critical patent/JP2006503475A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

3次元(3D)サブバンド符号化方式は、それらの時間フィルタリングステージにおける動き補償を使用している。残念なことに、この手順は、2つの問題点をもたらす。(a)フル解像度でMCが適用され、低い解像度で復号化したときにドリフトが現れる。(b)フル解像度で予測される全ての動きベクトルが送信され、これはビット数の浪費である。本発明によれば、オリジナルの入力フレーム系列から、ウェーブレット分解により、低解像度フレームの系列をはじめに生成し、該低解像度フレームに動き補償空間−時間分析を実行することで、低解像度の系列が得られる。次いで、それぞれフル解像度のグループ・オブ・フレームの動き補償空間−時間分析が実行され、生成された低解像度の系列の対応する空間−時間サブバンドにより、それぞれの時間分解レベルで、分解に関する低周波サブバンドが最後に置き換えられる。このように得られた変更された系列が最終的に符号化される。このアプローチのおかげで、フル解像度での古典的な3Dサブバンドコーデックのパフォーマンスに近付けつつ、低解像度での良好な挙動が維持される。Three-dimensional (3D) subband coding schemes use motion compensation in their temporal filtering stage. Unfortunately, this procedure introduces two problems. (A) MC is applied at full resolution, and drift appears when decoding at low resolution. (B) All motion vectors predicted at full resolution are transmitted, which is a waste of the number of bits. According to the present invention, a low-resolution sequence is obtained by first generating a low-resolution frame sequence from the original input frame sequence by wavelet decomposition and performing motion compensation space-time analysis on the low-resolution frame. It is done. A full-resolution group-of-frame motion-compensated space-time analysis is then performed, with the corresponding low-frequency subbands of the generated low-resolution sequence at the respective time-resolving level, the low-frequency for the decomposition. Subbands are replaced last. The modified sequence thus obtained is finally encoded. Thanks to this approach, good behavior at low resolution is maintained while approaching the performance of a classic 3D subband codec at full resolution.

Description

本発明は、連続するグループ・オブ・フレーム(GOF)に分割されるオリジナルのビデオ系列の圧縮のための符号化方法、及び対応する復号化に関する。また、本発明は、対応する符号化装置及び復号化装置に関する。   The present invention relates to an encoding method for compression of an original video sequence divided into successive group of frames (GOF) and corresponding decoding. The present invention also relates to a corresponding encoding device and decoding device.

インターネットの成長及びマルチメディア技術における進歩は、ビデオ圧縮向けの新たなアプリケーション及びサービスを可能にしてきている。それらの多くは、符号化効率を要求するだけでなく、変動するネットワーク状態及び端末の能力に適合するための拡張された機能性と柔軟性を要求しており、スケーラビリティは、これらの要求に答えるものである。現在のビデオ圧縮規格は、ハイブリッドDCT(Discrete Cosine Transform)予測構造に基づくことがあり、幾つかのスケーラビリティの特徴を既に含んでいる。ハイブリッド構造は、それぞれのフレームが所与の参照フレームから時間的に予測される予測スキーム(予測オプションは、Pフレームについて前方向、又はBフレームについて双方向)に基づいており、したがって、次いで得られる予測誤差は、空間的な冗長度の利点を得るために空間的に変換される(2次元DCT変換が標準スキームで使用される)。スケーラビリティは、更なるエンハンスメントレイヤのおかげで達成される。   Internet growth and advances in multimedia technology have enabled new applications and services for video compression. Many of them not only require coding efficiency, but also require extended functionality and flexibility to adapt to changing network conditions and terminal capabilities, and scalability meets these demands. Is. Current video compression standards may be based on a hybrid DCT (Discrete Cosine Transform) prediction structure and already include some scalability features. The hybrid structure is based on a prediction scheme in which each frame is temporally predicted from a given reference frame (prediction options are forward for P frames or bidirectional for B frames) and are then obtained The prediction error is spatially transformed to obtain the advantage of spatial redundancy (a two-dimensional DCT transform is used in the standard scheme). Scalability is achieved thanks to a further enhancement layer.

代替的に、3次元(3D)サブバンドビデオ符号化技術は、フルスケーラビリティをもつ、単一の、埋め込まれたビットストリームを生成する。この3Dサブバンドビデオ符号化技術は、所望の空間解像度又はフレームレートでの再構成を可能にする空間−時間フィルタリングに頼る。かかるアプローチは、たとえば、文献“Thee-dimensional subband coding of video”, C. Podilchuk and al., IEEE Transaction on Image Processing, vol. 4, No. 2, February 1995, pp. 125-139で提案されており、グループ・オブ・フレーム(GOP)は、3次元(2D+t,又は3D)構造として処理され、低周波におけるエネルギーを凝集するために空間−時間フィルタリングされる(更なる研究は、全体の符号化効率を改善するため、このスキームにおける動き補償を含む)。   Alternatively, three-dimensional (3D) subband video coding techniques generate a single, embedded bitstream with full scalability. This 3D subband video coding technique relies on space-time filtering that allows reconstruction at the desired spatial resolution or frame rate. Such an approach has been proposed, for example, in the literature “Thee-dimensional subband coding of video”, C. Podilchuk and al., IEEE Transaction on Image Processing, vol. 4, No. 2, February 1995, pp. 125-139. The group of frames (GOP) is processed as a three-dimensional (2D + t, or 3D) structure and is spatio-temporal filtered to agglomerate energy at low frequencies. Including motion compensation in this scheme to improve efficiency).

図1には、かかるアプローチにより得られる3Dサブバンド構造が示されており、動き補償による例示される3Dウェーブレット分解がグループ・オブ・フレームに適用され、この現在のGOFは、大きな動きをもつ系列を処理するためにはじめに動き補償され(MC)、Haarウェーブレットを使用して時間フィルタリング(TF)される(破線矢印は、高域通過時間フィルタリングに対応し、他の矢印は、低域通過時間フィルタリングに対応する)。動き補償動作及び時間フィルタリング動作の後、それぞれの時間サブバンドは、空間−時間サブバンドに空間分解され、これにより、オリジナルGOFの3Dウェーブレット表現が最終的に得られ、3つの分解のステージは、図1の例に示されている(L及びH=第一ステージ;LL及びLH=第二ステージ;LLL及びLLH=第三ステージ)。公知のSPIHTアルゴリズムは、2Dから3Dに拡張され、空間−時間分解構造に関して最終的な係数ビットプレーンを効率的に符号化するために選択される。   FIG. 1 shows the 3D subband structure obtained by such an approach, where the exemplified 3D wavelet decomposition with motion compensation is applied to the group of frames, and this current GOF is a sequence with large motion. Is first motion compensated (MC) and time filtered (TF) using Haar wavelets (dashed arrows correspond to high pass time filtering, other arrows are low pass time filtered) Corresponding to). After the motion compensation operation and temporal filtering operation, each temporal subband is spatially decomposed into space-time subbands, so that a final 3D wavelet representation of the original GOF is obtained, and the three decomposition stages are: Shown in the example of FIG. 1 (L and H = first stage; LL and LH = second stage; LLL and LLH = third stage). The known SPIHT algorithm is extended from 2D to 3D and is selected to efficiently encode the final coefficient bitplane with respect to the space-time decomposition structure.

実現されたとき、この3Dサブバンド構造は、エンコーダ側でオリジナルのフル解像度での動き補償(MC)空間−時間分析を適用する。空間スケーラビリティは、分解に関する最高の空間サブバンドを除くことで達成される。しかし、動き補償が3D分析スキームで使用されるとき、本方法は、非常に高いビットレートであっても、低い解像度でのビデオ系列の完全な再構成を可能にしない。この現象は、以下の説明ではドリフトと呼ばれ、目的とされる最終的な表示サイズでの直接的な符号化に比較してスケーラブルなソリューションの視覚的な品質を低くする。文献“Multi-scale video compression using wavelet transform and motion compensation”, P. Y. Cheng and al., Proceeding of the International Conference on Image Processing (ICIP95), Vol. 1, 1995, pp. 606-609に説明されるように、該ドリフトは、交換可能ではないウェーブレット変換及び動き補償の順序から生じる。空間スケーラビリティがデコーダ側でイネーブルにされるとき、エンコーダ側で実行される最も高い分解に関する空間サブバンドがスキップされ、これにより、オリジナルフレームAの低い解像度のバージョンadの再構成又は合成を可能にする。かかる合成について、以下の演算が適用される。 When implemented, this 3D subband structure applies the original full resolution motion compensation (MC) space-time analysis at the encoder side. Spatial scalability is achieved by removing the best spatial subbands for decomposition. However, when motion compensation is used in a 3D analysis scheme, the method does not allow complete reconstruction of video sequences at low resolution, even at very high bit rates. This phenomenon is referred to as drift in the following description and reduces the visual quality of the scalable solution compared to direct encoding at the intended final display size. As explained in the document “Multi-scale video compression using wavelet transform and motion compensation”, PY Cheng and al., Proceeding of the International Conference on Image Processing (ICIP95), Vol. 1, 1995, pp. 606-609. The drift results from the order of wavelet transform and motion compensation that are not interchangeable. When spatial scalability is enabled at the decoder side, spatial sub-band is skipped regarding the highest decomposition is performed at the encoder side, thereby, possible reconstruction or synthesis of lower resolution versions a d of the original frame A To do. For such synthesis, the following operations are applied.

Figure 2006503475
ここで、DWTL(空間領域における離散コサイン変換)は、3D分析におけるのと同じウェーブレットフィルタを使用して解像度のダウンサンプリングを示している。パーフェクト・スケーラブル・ソリューションでは、以下を有することを望む。
Figure 2006503475
Here, DWT L (discrete cosine transform in the spatial domain) shows resolution downsampling using the same wavelet filter as in 3D analysis. In a perfect scalable solution we want to have:

Figure 2006503475
したがって、式(1)の残りの部分はドリフトに対応する。MCが適用されない場合、ドリフトが除かれる。同じ現象は、固有の動きベクトルがフレームに適用される場合に(画像の境界を除いて)発生する。さらに、MCが良好な符号化効率を達成するために回避不可能であることが知られており、固有の全体的な動きの可能性は、以下のパラグラフでこの特定のケースを除くために十分に小さい。
Figure 2006503475
Therefore, the remaining part of equation (1) corresponds to drift. If MC is not applied, drift is eliminated. The same phenomenon occurs (except for image boundaries) when a unique motion vector is applied to the frame. In addition, MC is known to be unavoidable to achieve good coding efficiency, and the inherent overall motion potential is sufficient to exclude this particular case in the following paragraphs Small.

J.W.Woods等のような著者は、文献“A resolution and frame-rate scalable subband /wavelet video coder”, IEEE Transaction on Circuits and Systems for Video Technology, vol.1, No.9, September 2001, pp.1035-1044において、このドリフトを除くための技術的なソリューションを既に提案している。しかし、かかる文献では、記載される方式は、全く複雑であることに加えて、ビットストリームにおいて余分の情報を送出することを含んでおり、したがって幾つかのビット数を浪費する。先に引用された文献“Multi-scale video compression … ”で記載されるソリューションは、このボトルネックを回避するが、予測的な方式で動作し、3Dサブバンドコーデックに置き換えることができない。   Authors such as JWWoods et al. Have written the document “A resolution and frame-rate scalable subband / wavelet video coder”, IEEE Transaction on Circuits and Systems for Video Technology, vol.1, No.9, September 2001, pp.1035- 1044 has already proposed a technical solution to eliminate this drift. However, in such a document, the described scheme includes sending extra information in the bitstream in addition to being quite complex, thus wasting some number of bits. The solution described in the previously cited document "Multi-scale video compression ..." avoids this bottleneck, but operates in a predictive manner and cannot be replaced by a 3D subband codec.

つぎに、2002年1月22日に提出された欧州特許出願番号02290155.7 (PHFR020002)では、これらの問題点を回避するソリューションであって、ビデオ符号化方法が、連続するグループ・オブ・フレーム(GOF)に分割されるオリジナルのビデオ系列の圧縮のために使用される、以下のステップを含むことに従うソリューションを提案している。
(1)ウェーブレット分解により、連続する低解像度のGOFを含む低解像度の系列をオリジナルのビデオ系列から生成するステップ。
(2)それぞれの低解像度GOFの動き補償空間−時間分析により、該低解像度の低解像度系列に関して低解像度の分解を実行するステップ。
(3)ウェーブレット分解から生じる高周波の空間サブバンドを該低解像度の分解に固定することで、該低解像度の分解からフル解像度の系列を生成するステップ。
(4)出力の符号化されたビットストリームを生成するため、動き補償空間−時間分析の間に生成された該フル解像度の系列及び動きベクトルを符号化するステップ。
Next, European Patent Application No. 02290155.7 (PHFR020002) filed on January 22, 2002 is a solution that avoids these problems, and the video coding method is a continuous group of frames (GOF). Proposed a solution according to including the following steps used for compression of the original video sequence divided into:
(1) A step of generating a low-resolution sequence including a continuous low-resolution GOF from the original video sequence by wavelet decomposition.
(2) performing a low resolution decomposition on the low resolution low resolution sequence by motion compensated space-time analysis of each low resolution GOF;
(3) generating a full resolution sequence from the low resolution decomposition by fixing high frequency spatial subbands resulting from wavelet decomposition to the low resolution decomposition;
(4) encoding the full resolution sequence and motion vectors generated during motion compensated space-time analysis to generate an output encoded bitstream;

3DS分析における分解ツリーの全体的な構造が保持され、ドリフト作用を補正するために余分の情報を送出しない(分解/再構成メカニズムのみが変化する)かかるソリューションは、図2の符号化スキーム、及び図3に例示される最も低い解像度での動き補償時間分析を参照して更に詳細なやり方で再び思い出される。   Such a solution that preserves the overall structure of the decomposition tree in 3DS analysis and does not send extra information to compensate for drift effects (only the decomposition / reconstruction mechanism changes) is the encoding scheme of FIG. It is recalled again in a more detailed manner with reference to the motion compensation time analysis at the lowest resolution illustrated in FIG.

2つの主要なステップが提供される。(a)最も低い解像度での動き補償ステップ。(b)高い空間サブバンドの符号化ステップ。はじめに、より低い解像度でのドリフトを回避するため、動き補償(MC)はこのレベルで適用される。結果的に、フル解像度でのGOF(図2では21)は、はじめにダウンサイズされ(このステップは、図3における参照符号dにより示され、図2におけるステップ22,23に対応)、次いで、通常の3DサブバンドMC分解スキームは、図3に示されるようにフルサイズGOFの代わりにダウンサイズされたGOFに適用され、図2におけるステップ24により例示される。図3では、時間サブバンド(L0,d,H0,d)及び(L1,d,H1,d)は、公知のリフティングスキームに従って決定され(HはA及びBからはじめに決定され、次いでLがA及びHから決定される)、破線の矢印は高域通過時間フィルタリングに対応し、実線の矢印は低域通過フィルタリングに対応し、(A0,d,A1,d,A2,d,A3,dで参照される系列のフレームの低周波空間サブバンドAの間、又はL0,d及びL1,dで参照される低周波時間サブバンドLの間の)曲線は、動き補償に対応する(この方法の副作用は、ビットストリームで送出されるべき動きベクトルの量の低減であり、これによりテクスチャ符号化のためのビット数を節約することができる)。サブバンドをツリーに基づくエントロピーコーダ(たとえば文献“Low bit-rate scalable video coding with 3D set partitioning in hierarchical trees (3D-SPIHT)”, B.J.Kim and al. IEEE Transaction on Circuits Systems for Video Technology, vol.10, No.8, December 2000, pp.1374-1387に記載されるような、たとえば図2に示されるような3D−SPIHTエンコーダ27)に送信する前に、フル解像度の再構成を可能にする高い空間サブバンド(図2におけるステップ26)を置く。最後のツリー構造は、“A fully scalable 3D sub-band video codec”, IEEE Conference on Image Processing (ICIP2001), vol.2, pp.1017-1020, Thessaloniki, Greece, October 7-10, 2001に記載されるような3Dサブバンドコーデックの構造に非常に類似して見え、したがって、ツリーに基づくエントロピーコーダは、限定することなしにそれに適用することができる。図2の符号化方式では、(フル解像度の系列21について)参照符号は以下の通りである。 Two main steps are provided. (A) A motion compensation step at the lowest resolution. (B) High spatial subband encoding step. First, motion compensation (MC) is applied at this level to avoid drift at lower resolutions. As a result, the GOF at full resolution (21 in FIG. 2) is first downsized (this step is indicated by reference d in FIG. 3 and corresponds to steps 22 and 23 in FIG. 2) and then normally The 3D subband MC decomposition scheme is applied to the downsized GOF instead of the full size GOF as shown in FIG. 3, and is illustrated by step 24 in FIG. In FIG. 3, the time subbands (L 0, d , H 0, d ) and (L 1, d , H 1, d ) are determined according to a known lifting scheme (H is first determined from A and B, L is then determined from A and H), the dashed arrow corresponds to high-pass time filtering, the solid arrow corresponds to low-pass filtering, (A 0, d , A 1, d , A 2 , d , A 3, d ) between the low frequency spatial subbands A of the frames of the sequence referenced by A , d , or between the low frequency temporal subbands L referenced by L 0, d and L 1, d , Corresponding to motion compensation (a side effect of this method is a reduction in the amount of motion vectors to be transmitted in the bitstream, thereby saving the number of bits for texture coding). Entropy coder based on tree subbands (eg “Low bit-rate scalable video coding with 3D set partitioning in hierarchical trees (3D-SPIHT)”, BJKim and al. IEEE Transaction on Circuits Systems for Video Technology, vol.10, No. 8, December 2000, pp. 1374-1387, high space allowing full resolution reconstruction prior to transmission to eg 3D-SPIHT encoder 27 as shown in FIG. Place the subband (step 26 in FIG. 2). The final tree structure is described in “A fully scalable 3D sub-band video codec”, IEEE Conference on Image Processing (ICIP2001), vol.2, pp.1017-1020, Thessaloniki, Greece, October 7-10, 2001. Such a 3D subband codec structure looks very similar, so a tree-based entropy coder can be applied to it without limitation. In the coding scheme of FIG. 2, the reference codes (for the full resolution sequence 21) are as follows:

FRS:フル解像度の系列21
WD :ウェーブレット分解22
LRS:低解像度の系列23
MC-3DSA:動き補償3Dサブバンド分析24
LRD:低解像度の分解(251)
HS :高いサブバンド26
U-HFSS:フレームの3つの高周波空間サブバンドの結合体
FR-3D-SPIHT:フル解像度3DSPIHT27
OCB :出力符号化ビットストリーム
図4に示される対応する符号化スキームは、このエンコーダに対して対称的である(図4では、更なる参照符号は以下の通りである。
FRS: Full resolution series 21
WD: Wavelet decomposition 22
LRS: Low resolution series 23
MC-3DSA: Motion compensated 3D subband analysis 24
LRD: Low resolution decomposition (251)
HS: High subband 26
U-HFSS: Combined three high-frequency spatial subbands of the frame
FR-3D-SPIHT: Full resolution 3D SPIHT27
OCB: Output Encoded Bitstream The corresponding encoding scheme shown in FIG. 4 is symmetric with respect to this encoder (in FIG. 4, further reference symbols are as follows).

FR-3D-SPIHT:復号化ステップ41
MC-3DSS:動き補償3Dサブバンド合成43
HSS:高いサブバンド分離44
FRR:フル解像度の系列のフル解像度の再構成45)
空間スケーラビリティを可能にするため、高周波の空間サブバンドは、通常のバージョンの3Dサブバンドコーデックにおけるようにカットされなければならず、図4の復号化方式は、低解像度の系列をどのように自然に得ることができるかを示している。
次いで、高い空間サブバンドを符号化するため、2つの主要なソリューションが提案され、第一のソリューションはMCなしであり、第二のソリューションはMCをもつ。
FR-3D-SPIHT: Decoding step 41
MC-3DSS: Motion compensated 3D subband synthesis 43
HSS: High subband separation 44
FRR: Full resolution reconstruction of full resolution series 45)
In order to enable spatial scalability, the high frequency spatial subbands must be cut as in the normal version of the 3D subband codec, and the decoding scheme of FIG. Shows you can get to.
Then, to encode the high spatial subband, two main solutions are proposed, the first solution is without MC and the second solution has MC.

第一のソリューションでは、高いサブバンドは、ウェーブレット分解におけるGOFのオリジナル(フル解像度)のフレームの高い周波数空間サブバンドに対応する。それらのサブバンドは、復号化側のフル解像度での再構成を可能にする。確かに、フレームは、低解像度で復号化することができる。しかし、これらのフレームは、オリジナルフレームのウェーブレット解析における低い空間サブバンドに対応する。したがって、低い解像度フレームと対応する高いサブバンドとを一緒にすることが必要であって、フル解像度のフレームを得るためにウェーブレット合成を適用し、これにより3D−SPIHTエンコーダを最適化する。3DサブバンドエンコーダのためのMCスキームでは、低い時間サブバンドは、GOFのオリジナルフレームのうちの1つに常に見える。実際の問題として、   In the first solution, the high subband corresponds to the high frequency space subband of the original (full resolution) frame of the GOF in wavelet decomposition. These subbands allow reconstruction at full resolution on the decoding side. Indeed, the frame can be decoded at a low resolution. However, these frames correspond to low spatial subbands in the wavelet analysis of the original frame. Therefore, it is necessary to combine low resolution frames and corresponding high subbands, applying wavelet synthesis to obtain full resolution frames, thereby optimizing the 3D-SPIHT encoder. In the MC scheme for 3D subband encoders, the low time subband is always visible in one of the original frames of the GOF. As a matter of fact,

Figure 2006503475
したがってLはAのように見える。結果的に、Aの高い空間サブバンドは、Lに対応する低い解像度の分解で置き換えられる。(前方向MCのケースにおける高い空間サブバンドを再オーダリングする)このアプローチは、図5に例示されており、jtは、時間分解レベルを示しており(0はフルフレームレートについてであり、jt_maxは最も低いフレームレートについてである)、nfは、時間レベルjtでのサブバンドインデックスであり、DWTHは、高周波ウェーブレットフィルタを示し、係数cjtは、乗算係数であり、OF,LRF,TSは、参照符号0〜3で参照されるオリジナルフレーム、参照符号00〜03で参照される低解像度フレーム、及び送信されたサブバンドをそれぞれ示している。
Figure 2006503475
Thus L looks like A. As a result, A's high spatial subband is replaced with a low resolution decomposition corresponding to L. This approach (reordering high spatial subbands in the forward MC case) is illustrated in FIG. 5 where jt indicates the time resolution level (0 is for full frame rate and jt_max is Nf is the subband index at time level jt, DWT H denotes a high frequency wavelet filter, coefficient c jt is a multiplication coefficient, and OF, LRF, TS are An original frame referred to by reference numerals 0 to 3, a low resolution frame referred to by reference numerals 00 to 03, and a transmitted subband are shown.

第二のソリューションでは、それぞれのサブバンドでMCを使用することは、ドリフトのない再構成を可能にしないので、高い空間サブバンドを構成するためにMCを部分的に使用することも可能であり、それぞれの解像度を再構成することが可能である。ウェーブレット分解の高い周波数空間サブバンドを直接使用する代わりに、ウェーブレット分解は、フル解像度で実行されるMCから得られる予測誤差に実行され、たとえば、低い解像度の動きベクトルを再使用する。   In the second solution, using MC in each subband does not allow drift-free reconfiguration, so it is also possible to partially use MC to form higher spatial subbands. Each resolution can be reconstructed. Instead of directly using the high frequency space subbands of the wavelet decomposition, wavelet decomposition is performed on the prediction error obtained from the MC performed at full resolution, for example, reusing low resolution motion vectors.

本発明の目的は、フル解像度での古典的な3Dサブバンドコーデックのパフォーマンスに近くしつつ、低い解像度でその良好な振る舞いを保持することで、先に説明されたソリューションを改善することにある。   The object of the present invention is to improve the previously described solution by retaining its good behavior at low resolution while approaching the performance of a classic 3D subband codec at full resolution.

上記目的のため、本発明は、連続するグループ・オブ・フレーム(GOF)に分割されるオリジナルのビデオ系列の圧縮のためのビデオ符号化方法に関連し、本方法は、以下のステップを有している。
(1)ウェーブレット分解により、オリジナルビデオ系列のフル解像度のフレームから、連続する低解像度のGOFに編成される低解像度のフレーム系列を生成するステップ。
(2)該低解像度のフレーム系列のそれぞれの低解像度GOFに、動き補償空間−時間分析(motion compensated spatio-temporal analysis)を実行し、低解像度の系列を得るステップ。
(3)オリジナルのビデオ系列のそれぞれのフル解像度(full resolution)のGOFの動き補償空間−時間分析を実行するステップ。
(4)それぞれの時間分解レベルで、該分解の低周波サブバンドを低解像度の系列の対応する空間−時間サブバンドで置き換えるステップ。
(5)出力符号化ビットストリームについて、このように得られた変更された系列と、それぞれのフル解像度のGOFの動き補償空間−時間分析の間に生成された動きベクトルとを符号化するステップ。
For the above purpose, the present invention relates to a video coding method for compression of an original video sequence divided into consecutive group of frames (GOF), which method comprises the following steps: ing.
(1) A step of generating a low-resolution frame sequence organized into a continuous low-resolution GOF from a full-resolution frame of an original video sequence by wavelet decomposition.
(2) A step of performing motion compensated spatio-temporal analysis on each low resolution GOF of the low resolution frame sequence to obtain a low resolution sequence.
(3) performing a motion resolution space-time analysis of each full resolution GOF of the original video sequence.
(4) At each time resolution level, replacing the low frequency subband of the decomposition with the corresponding space-time subband of the low resolution sequence.
(5) For the output encoded bitstream, encoding the modified sequence thus obtained and the motion vectors generated during the motion-compensated space-time analysis of the respective full resolution GOF.

また、本発明は、先に定義されたビデオ符号化方法に対応するビデオ復号化方法に関し、対応するビデオ符号化装置並びにビデオ復号化装置に関する。
本発明は、添付図面を参照してより詳細なやり方で説明される。
The present invention also relates to a video decoding method corresponding to the previously defined video encoding method, and to a corresponding video encoding device and video decoding device.
The invention will now be described in more detail with reference to the accompanying drawings.

先に記載されたソリューションに関して、その基本ステップを参照して本発明がここに説明される。(a)最も低い解像度での動き補償(この最初のステップ、動き補償(MC)は、実際に、先のソリューションのケースで記載されたものと厳密に等価である。空間ウェーブレットフィルタを使用してGOFをダウンサイズし、次いで、このダウンサイズされたGOFに通常の3DサブバンドMC分解スキームが適用される)、(b)高い空間サブバンドの符号化。   With respect to the solutions described above, the present invention will now be described with reference to its basic steps. (A) Motion compensation at the lowest resolution (this first step, motion compensation (MC) is actually exactly equivalent to that described in the case of the previous solution. Using a spatial wavelet filter Downsize the GOF and then apply the normal 3D subband MC decomposition scheme to this downsized GOF), (b) High spatial subband coding.

前のソリューションとの主要な違いは、第二のステップにあり、その原理は、それぞれの分解レベルで低い空間解像度の分析をフル解像度の分析のそれらに注入することである。したがって、(高周波空間サブバンドについて、前のソリューションにおけるように、イントラコーディング又は予測誤差ではない)リアル時間フィルタリングを実行しつつ、デコーダ側でオリジナルフレームを再構成することが可能である。   The main difference from the previous solution is in the second step, whose principle is to inject low spatial resolution analysis at each resolution level into those of full resolution analysis. Thus, it is possible to reconstruct the original frame at the decoder side while performing real time filtering (for high frequency spatial subbands, not intra coding or prediction errors as in the previous solution).

以下の式は、より詳細なやり方でのメカニズムを説明している、先のように、第一の時間分析は、低い解像度で実行され、これらは式(4)及び式(5)により表される場合がある。   The following equations illustrate the mechanism in a more detailed manner. As before, the first temporal analysis is performed at low resolution, which are represented by equations (4) and (5). There is a case.

Figure 2006503475
次の表記による。A=参照フレーム、B=現在のフレーム、DWT=離散ウェーブレット変換。Ad=フレームAのDWTの低周波空間サブバンド、すなわちフレームAの低い空間解像度バージョン。Bd=フレームBのDWTの低周波空間サブバンド、すなわちフレームBの低い空間解像度バージョン。H=低い空間解像度での高周波時間サブバンド。L=低い空間解像度での低周波時間サブバンド。MCdown=低下解像度(すなわちサブサンプルされた)フレームで実行された動き補償。MC-1=逆動き補償(フレームAからフレームBを予測するために計算される動きベクトルは、フレームBからフレームAを予測するために逆に使用される)。
Figure 2006503475
According to the following notation. A = reference frame, B = current frame, DWT = discrete wavelet transform. A d = low frequency spatial subband of DWT of frame A, ie low spatial resolution version of frame A. B d = Low frequency spatial subband of frame B DWT, ie, low spatial resolution version of frame B. H = high frequency temporal subband with low spatial resolution. L = low frequency temporal subband at low spatial resolution. MC down = motion compensation performed on reduced resolution (ie subsampled) frames. MC −1 = inverse motion compensation (the motion vector calculated to predict frame B from frame A is used inversely to predict frame A from frame B).

式(6)〜式(9)は、LS及びHSを定義するのを可能にする。 Equations (6)-(9) make it possible to define L S and H S.

Figure 2006503475
ここで、XS=(XS=HS又はLSによる)所与のフレームXのDWTの3つの高周波空間サブバンドの結合体。MCfull=フル解像度のフレームに実行される動き補償。L’及びH’=従来の3Dサブバンド方式における低周波時間サブバンド及び高周波時間サブバンド。H=DWT-1[Hd∪HS]。L=DWT-1[Ld∪LS]。
Figure 2006503475
Where X S = the combination of the three high frequency spatial subbands of the DWT of a given frame X (by X S = H S or L S ). MC full = motion compensation performed on full resolution frames. L ′ and H ′ = low frequency time subband and high frequency time subband in the conventional 3D subband system. H = DWT −1 [H d ∪H S ]. L = DWT −1 [L d ∪L S ].

低周波時間サブバンド及び高周波時間サブバンドの全てが所与の時間レベルjtでひとたび生成されると、低い空間解像度と高い空間解像度の両者で、低周波時間サブバンドLは、次の時間レベルjt+1を達成するために更に分解される。   Once all of the low frequency time subbands and the high frequency time subband are generated at a given time level jt, the low frequency time subband L is the next time level jt + 1 at both low and high spatial resolution. Is further decomposed to achieve

これは、時間分解のそれぞれのステップで、古典的な3Dサブバンドエンコーダの構造に非常に類似している時間分解の構造を最終的にもたらす。次いで、最後のレベルの低周波の時間サブバンド、及び全てのレベルの高周波の時間サブバンドがウェーブレットフィルタを通して空間的に分解され、ビットストリームを形成するために符号化される。   This ultimately results in a time-resolved structure that is very similar to the structure of the classic 3D subband encoder at each step of time-resolved. The last level low frequency time subbands and all levels of high frequency time subbands are then spatially decomposed through a wavelet filter and encoded to form a bitstream.

記載される本発明は、フル解像度での古典的な3Dサブバンドコーデックのパフォーマンスにより接近しつつ、低い解像度での前のソリューションに関する良好な振る舞いを保持する(3Dサブバンド分析における分解ツリーの全体的な構造が保持され、ドリフト作用を補正するために余分の情報が送出されない。分解/再構成メカニズムが変化される)。主要なアップグレードは、分解ツリーへの高い整合性をもたらす、高周波の空間サブバンドを生成するための新たなアプローチから生じ、したがってシステムの符号化効率を改善する。   The described invention retains good behavior for previous solutions at lower resolutions while approaching the performance of classic 3D subband codecs at full resolution (the overall resolution tree in 3D subband analysis) And no extra information is sent out to compensate for drift effects (disassembly / reconstruction mechanism is changed). Major upgrades arise from a new approach to generate high frequency spatial subbands that result in high consistency to the decomposition tree, thus improving the coding efficiency of the system.

デコーダでは、良好な再構成を可能にするために全ての前の式に戻ることができる。復号化が関係しており、幾つかの情報が失われている場合があることを示すため、それぞれのサブバンドには^のみが付加されている。はじめに、低解像度での古典的な3Dサブバンド合成により、Ld及びHdから低い空間解像度サブバンドAd及びBdを与えるのを可能にする。 At the decoder, all previous equations can be reverted to allow good reconstruction. Only ^ is added to each subband to indicate that decoding is involved and some information may be lost. First, classical 3D subband synthesis at low resolution makes it possible to give low spatial resolution subbands A d and B d from L d and H d .

Figure 2006503475
また、Hを合成すること、及び式(7)を復帰させることでASを得ることは容易である。プロセスは、式(12)〜式(15)により説明される。
Figure 2006503475
Moreover, it is easy to obtain A S by synthesizing H and returning Equation (7). The process is described by equations (12)-(15).

Figure 2006503475
次いで、
Figure 2006503475
Then

(外1)

Figure 2006503475
は、 (Outside 1)
Figure 2006503475
Is

(外2)

Figure 2006503475
から簡単に再構成される。結果的に、BSを得ることができ、最終的にBを合成することができる。このことは、式(16)〜式(19)のシステムにより要約される。 (Outside 2)
Figure 2006503475
Easily reconstructed from. As a result, B S can be obtained, and finally B can be synthesized. This is summarized by the system of equations (16)-(19).

Figure 2006503475
これらの演算は、文字通り最初の時間レベルまで、すなわちGOFが完全に復号化されるまで繰り返される。L及びHがビットストリームで完全に送信されるとすぐ、完全な再構成が達成されるので、この方式はドリフトを生じないことが明らかに分かるであろう(フル空間解像度の合成がそれぞれの時間レベルで低い解像度のものと即座にリンクされる。これは、先のソリューションにおけるケースではない)。
Figure 2006503475
These operations are literally repeated until the first time level, that is, until the GOF is fully decoded. As soon as L and H are completely transmitted in the bitstream, it will clearly be seen that this scheme does not cause drift, since full reconstruction is achieved (combining full spatial resolution at each time). Immediately linked to the lower resolution level, which is not the case in the previous solution).

先に定義された符号化原理は、符号化方法の主要な処理を例示する図6、及び対応する動き補償時間フィルタリング方式をより詳細なやり方で例示する(実際には2つの図である図7A及び図7Bを含む)図7を参照して、より詳細なやり方で記載される。   The previously defined coding principle illustrates the main process of the coding method in FIG. 6 and the corresponding motion compensated temporal filtering scheme in a more detailed manner (actually two diagrams, FIG. 7A). And with reference to FIG. 7 (including FIG. 7B).

図6の符号化方式では、オリジナルのグループ・オブ・フレームGOF(この現在のGOFはフル解像度のフレームFRFを含んでいる)は、ウェーブレット分解WDにより、低解像度のフレームLRFを生成するために使用され、次いで、この低解像度のフレームに対して、動き補償空間−時間分析MCSTAが実行される。このように、低解像度の系列が得られる。また、オリジナルのフル解像度フレーム(すなわち、それぞれフル解像度GOF)は、高い空間サブバンドHSSを生成するため、動き補償空間−時間分析(対応する連続するステップMCSTA及びWDは、「MC時間分析」及び「ウェーブレット分解」に対応する)を実行するために使用される。   In the coding scheme of FIG. 6, the original group of frames GOF (this current GOF includes a full resolution frame FRF) is used to generate a low resolution frame LRF by wavelet decomposition WD. The motion compensated space-time analysis MCSTA is then performed on this low resolution frame. In this way, a low resolution sequence is obtained. Also, since the original full resolution frame (ie, each full resolution GOF) produces a high spatial subband HSS, motion compensated spatial-temporal analysis (corresponding successive steps MCSTA and WD are "MC temporal analysis" and Used to perform “corresponding to“ wavelet decomposition ”).

フル解像度のフレームに実行されたこれら2つの並列なステップからなるセットの後、このように得られた分解に関する低周波サブバンドは、それぞれ時間分解レベルで、以下の動作に従う、低解像度の系列LRSの対応する空間−時間サブバンドにより、繰返し置き換えられる。
(a)はじめに、記憶動作62では、最後の符号化ステップ69を考慮して、分解に関する高周波空間−時間サブバンドを記憶する。
(b)次いで、ウェーブレット合成63は、該分解の低周波の空間−時間サブバンドから実行される(テスト61「L又はH時間サブバンド」は、該低周波の空間−時間サブバンドと高周波の空間−時間サブバンドを分離することを可能にする)。
(c)次いで、時間分解レベルのランクに関するテスト64は、該レベルが最後のものである場合に、該分解に関する低周波の空間−時間サブバンドを記憶し、該レベルが最後のものではない場合に、対照的に、次の時間レベル66について2つの並列なステップのセットが更に実行される。
After a set of these two parallel steps performed on a full resolution frame, the low frequency subbands thus obtained for the decomposition are low resolution sequences LRS according to the following behavior, respectively, at the time resolution level: Are repeatedly replaced by their corresponding space-time subbands.
(A) First, the storage operation 62 stores the high-frequency space-time subbands related to the decomposition in consideration of the last encoding step 69.
(B) The wavelet synthesis 63 is then performed from the low frequency space-time subband of the decomposition (test 61 “L or H time subband” Allows separation of space-time subbands).
(C) The test 64 for the rank of the time resolution level then stores the low frequency space-time subband for the decomposition if the level is the last, and if the level is not the last In contrast, two parallel sets of steps are further performed for the next time level 66.

(符号化側での)全体的な分解方式及び(復号化側での)対応する動き補償合成方式のより詳細な表現は、図7及び(2つの図である図8A及び図8Bを備えている)図8に見ることができる。本発明に係る空間−時間分解のこの例は、前方向の動き補償及び2つの分解レベルによる、(明確さのために)4つのフレームA0〜A3からなるGOFに関連している。高周波及び低周波(H’0,H’1及びL’0,L’1のそれぞれの)時間サブバンドは、たとえば、文献“Factoring wavelet transforms into lifting steps”, I. Daubechies and W. Sweldens, Bell Laboratories technical report, Lucent Technologies, 1996に記載されている、いわゆるリフティング方式を使用することでオリジナルフレームから計算される。表記DWT及びDWT-1は、ウェーブレット分解及びウェーブレット合成をそれぞれ示している。図7の右側は、第一の空間−時間分解レベル分解に関する低周波空間−時間サブバンドに適用される逆合成、及び(低い解像度の系列の対応する空間−時間サブバンドによる分解に関する低周波サブバンドの置き換えの後に実行され、該置き換えは、図7の左側からの矢印により示される)第二の空間−時間分解レベルを連続して例示している。 A more detailed representation of the overall decomposition scheme (on the encoding side) and the corresponding motion compensation synthesis scheme (on the decoding side) comprises FIG. 7 and (two diagrams, FIGS. 8A and 8B). It can be seen in FIG. This example of space-time decomposition according to the invention relates to a GOF consisting of four frames A0 to A3 (for clarity) with forward motion compensation and two decomposition levels. High and low frequency (respectively H ′ 0 , H ′ 1 and L ′ 0 , L ′ 1 ) time subbands are described, for example, in the literature “Factoring wavelet transforms into lifting steps”, I. Daubechies and W. Sweldens, Bell It is calculated from the original frame using the so-called lifting method described in Laboratories technical report, Lucent Technologies, 1996. The notations DWT and DWT -1 indicate wavelet decomposition and wavelet synthesis, respectively. The right side of FIG. 7 shows the inverse synthesis applied to the low frequency space-time subband for the first space-time resolution level decomposition and the low frequency sub for the decomposition by the corresponding space-time subband of the low resolution sequence. It is performed after the band replacement, which continuously illustrates the second space-time resolution level (indicated by the arrow from the left side of FIG. 7).

本発明に係るビデオ符号化方法及び装置は、詳細なやり方で先に説明されてきたが、本発明は、該ビデオ符号化方法を実現するときに実行されるステップとデュアル(二元的)な連続するステップを含んでいる、対応するビデオ復号化方法、並びに該ビデオ符号化装置で提供される手段とデュアルな連続する手段を含んでいる、対応するビデオ復号化装置に関する。   Although the video encoding method and apparatus according to the present invention has been described above in a detailed manner, the present invention is dual in terms of the steps performed when implementing the video encoding method. The invention relates to a corresponding video decoding method comprising successive steps and to a corresponding video decoding device comprising means which are continuous with the means provided in the video coding apparatus.

3Dサブバンド分解を示す図である。FIG. 3 shows 3D subband decomposition. 先の実施の形態に係る符号化方式に関する実施の形態を示す図である。It is a figure which shows embodiment regarding the encoding system which concerns on previous embodiment. 最低の解像度での動き補償時間分析を例示する図である。It is a figure which illustrates motion compensation time analysis in the lowest resolution. 図2の符号化方式に対応する復号化方式に関する実施の形態を示す図である。It is a figure which shows embodiment regarding the decoding system corresponding to the encoding system of FIG. (前方向動き補償について)高い空間サブバンドの再オーダリング(再整理)を例示する図である。FIG. 6 is a diagram illustrating reordering (rearrangement) of high spatial subbands (for forward motion compensation). 本発明に係る符号化方法の主要な処理を例示する図である。It is a figure which illustrates the main processes of the encoding method which concerns on this invention. 対応する動き補償時間フィルタリングの分解方式を例示する図である。It is a figure which illustrates the decomposition | disassembly method of corresponding motion compensation time filtering. 対応する動き補償時間フィルタリングの分解方式を例示する図である。It is a figure which illustrates the decomposition | disassembly method of corresponding motion compensation time filtering. 復号化側での、図5の符号化方法に対応する合成スキームの実現を例示する図である。FIG. 6 is a diagram illustrating the realization of a synthesis scheme corresponding to the encoding method of FIG. 5 on the decoding side. 復号化側での、図5の符号化方法に対応する合成スキームの実現を例示する図である。FIG. 6 is a diagram illustrating the realization of a synthesis scheme corresponding to the encoding method of FIG. 5 on the decoding side.

Claims (4)

連続するグループ・オブ・フレーム(GOF)に分割されるオリジナルのビデオ系列の圧縮のためのビデオ符号化方法であって、
該オリジナルのビデオ系列のフル解像度のフレームから、ウェーブレット分解により、連続する低解像度のGOFに編成される低解像度のフレームの系列を生成するステップと、
該低解像度のフレームの系列のそれぞれの低解像度のGOFに動き補償空間−時間分析を実行して、低解像度の系列を得るステップと、
該オリジナルのビデオ系列のそれぞれのフル解像度のGOFの動き補償空間−時間分析を実行するステップと、
それぞれの時間分解レベルで、該分解に関する低周波サブバンドを該低解像度の系列の対応する空間−時間サブバンドで置き換えるステップと、
出力符号化ビットストリームを生成するため、得られた変更された系列と、それぞれフル解像度のGOFの動き補償空間−時間分析の間に生成された動きベクトルを符号化するステップと、
を含むことを特徴とするビデオ符号化方法。
A video encoding method for compression of an original video sequence that is divided into successive groups of frames (GOF), comprising:
Generating a sequence of low resolution frames organized into a continuous low resolution GOF from the full resolution frames of the original video sequence by wavelet decomposition;
Performing a motion compensated space-time analysis on each low resolution GOF of the low resolution frame sequence to obtain a low resolution sequence;
Performing a motion compensated spatio-temporal analysis of each full resolution GOF of the original video sequence;
At each temporal resolution level, replacing the low frequency subbands for the decomposition with corresponding space-time subbands of the low resolution sequence;
Encoding the resulting modified sequences and motion vectors generated during motion compensated spatial-temporal analysis of each full resolution GOF to generate an output encoded bitstream;
A video encoding method comprising:
連続するグループ・オブ・フレーム(GOF)に分割されるオリジナルのビデオ系列の圧縮のためのビデオ符号化装置であって、
該オリジナルのビデオ系列のフル解像度のフレームから、ウェーブレット分解により、連続する低解像度のGOFに編成される低解像度のフレームの系列を生成する手段と、
該低解像度のフレームの系列のそれぞれの低解像度のGOFに動き補償空間−時間分析を実行して、低解像度の系列を得る手段と、
該オリジナルのビデオ系列のそれぞれのフル解像度のGOFに関する動き補償空間−時間分析を実行する手段と、
それぞれの時間分解レベルで、該分解に関する低周波サブバンドを該低解像度の系列の対応する空間−時間サブバンドで置き換える手段と、
出力符号化ビットストリームを生成するため、得られた変更された系列と、それぞれフル解像度のGOFに関する動き補償空間−時間分析の間に生成された動きベクトルを符号化する手段と、
を有することを特徴とするビデオ符号化装置。
A video encoding device for compression of an original video sequence that is divided into successive groups of frames (GOF),
Means for generating, from the full resolution frame of the original video sequence, a sequence of low resolution frames organized into a continuous low resolution GOF by wavelet decomposition;
Means for performing a motion compensated space-time analysis on each low resolution GOF of the low resolution frame sequence to obtain a low resolution sequence;
Means for performing motion compensation space-time analysis on each full resolution GOF of the original video sequence;
Means for replacing the low frequency subbands for the decomposition with corresponding space-time subbands of the low resolution sequence at each time resolution level;
Means for encoding the resulting modified sequences and motion vectors generated during motion compensated spatial-temporal analysis for each full resolution GOF to generate an output encoded bitstream;
A video encoding apparatus comprising:
ビデオ符号化方法により符号化されたビデオ系列に対応する符号化されたビットストリームを復号化するために提供されるビデオ復号化方法であって、
該ビデオ符号化方法は、該オリジナルのビデオ系列の圧縮のため、
該オリジナルのビデオ系列のフル解像度のフレームから、ウェーブレット分解により、連続する低解像度のGOFに編成される低解像度のフレームの系列を生成するステップと、
該低解像度のフレームの系列のそれぞれの低解像度のGOFに動き補償空間−時間分析を実行して、低解像度の系列を得るステップと、
該オリジナルのビデオ系列のそれぞれのフル解像度のGOFに関する動き補償空間−時間分析を実行するステップと、
それぞれの時間分解レベルで、該分解に関する低周波サブバンドを該低解像度の系列の対応する空間−時間サブバンドで置き換えるステップと、
出力符号化ビットストリームを生成するため、得られた変更された系列と、それぞれフル解像度のGOFに関する動き補償空間−時間分析の間に生成された動きベクトルを符号化するステップとを含み、
該ビデオ復号化方法は、請求項1のビデオ符号化方法に従って実行される処理と二元的な連続する処理を含む、
ことを特徴とするビデオ復号化方法。
A video decoding method provided for decoding an encoded bitstream corresponding to a video sequence encoded by a video encoding method, comprising:
The video encoding method is used to compress the original video sequence.
Generating a sequence of low resolution frames organized into a continuous low resolution GOF from the full resolution frames of the original video sequence by wavelet decomposition;
Performing a motion compensated space-time analysis on each low resolution GOF of the low resolution frame sequence to obtain a low resolution sequence;
Performing a motion compensated space-time analysis on each full resolution GOF of the original video sequence;
At each temporal resolution level, replacing the low frequency subbands for the decomposition with corresponding space-time subbands of the low resolution sequence;
Encoding the resulting modified sequences and motion vectors generated during motion compensated spatial-temporal analysis for each full resolution GOF to generate an output encoded bitstream;
The video decoding method includes a process performed according to the video encoding method of claim 1 and a binary continuous process.
A video decoding method characterized by the above.
ビデオ符号装置により符号化されたビデオ系列に対応する符号化されたビットストリームを復号化するために提供されるビデオ復号化装置であって、
該ビデオ符号化装置は、該オリジナルのビデオ系列の圧縮のため、
該オリジナルのビデオ系列のフル解像度のフレームから、ウェーブレット分解により、連続する低解像度のGOFに編成される低解像度のフレームの系列を生成する手段と、
該低解像度のフレームの系列のそれぞれの低解像度のGOFに動き補償空間−時間分析を実行して、低解像度の系列を得る手段と、
該オリジナルのビデオ系列のそれぞれのフル解像度のGOFに関する動き補償空間−時間分析を実行する手段と、
それぞれの時間分解レベルで、該分解に関する低周波サブバンドを該低解像度の系列の対応する空間−時間サブバンドで置き換える手段と、
出力符号化ビットストリームを生成するため、得られた変更された系列と、それぞれフル解像度のGOFの動き補償空間−時間分析の間に生成された動きベクトルを符号化する手段とを含み、
該ビデオ復号化装置は、請求項2のビデオ符号化装置で提供される手段と二元的な連続する手段を含む、
ことを特徴とするビデオ復号化装置。
A video decoding device provided for decoding an encoded bitstream corresponding to a video sequence encoded by a video encoding device, comprising:
The video encoding device is for compressing the original video sequence.
Means for generating, from the full resolution frame of the original video sequence, a sequence of low resolution frames organized into a continuous low resolution GOF by wavelet decomposition;
Means for performing a motion compensated space-time analysis on each low resolution GOF of the low resolution frame sequence to obtain a low resolution sequence;
Means for performing motion compensation space-time analysis on each full resolution GOF of the original video sequence;
Means for replacing the low frequency subbands for the decomposition with corresponding space-time subbands of the low resolution sequence at each time resolution level;
Means for encoding the resulting modified sequences and motion vectors generated during motion compensated spatial-temporal analysis of each full resolution GOF to generate an output encoded bitstream;
The video decoding apparatus includes means continuous with the means provided in the video encoding apparatus of claim 2 and binary continuous means,
A video decoding apparatus characterized by the above.
JP2004544560A 2002-10-16 2003-10-01 Drift-free video encoding and decoding method and corresponding apparatus Pending JP2006503475A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02292551 2002-10-16
PCT/IB2003/004326 WO2004036918A1 (en) 2002-10-16 2003-10-01 Drift-free video encoding and decoding method, and corresponding devices

Publications (1)

Publication Number Publication Date
JP2006503475A true JP2006503475A (en) 2006-01-26

Family

ID=32104016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004544560A Pending JP2006503475A (en) 2002-10-16 2003-10-01 Drift-free video encoding and decoding method and corresponding apparatus

Country Status (6)

Country Link
EP (1) EP1554886A1 (en)
JP (1) JP2006503475A (en)
KR (1) KR20050057655A (en)
CN (1) CN1706198A (en)
AU (1) AU2003263547A1 (en)
WO (1) WO2004036918A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101885698B1 (en) 2011-06-27 2018-08-07 삼성디스플레이 주식회사 Display device

Also Published As

Publication number Publication date
CN1706198A (en) 2005-12-07
WO2004036918A1 (en) 2004-04-29
KR20050057655A (en) 2005-06-16
AU2003263547A1 (en) 2004-05-04
EP1554886A1 (en) 2005-07-20

Similar Documents

Publication Publication Date Title
JP5026965B2 (en) Method and apparatus for predecoding and decoding a bitstream including a base layer
JP5014989B2 (en) Frame compression method, video coding method, frame restoration method, video decoding method, video encoder, video decoder, and recording medium using base layer
US7889793B2 (en) Method and apparatus for effectively compressing motion vectors in video coder based on multi-layer
RU2503137C2 (en) Method and apparatus for highly scalable intraframe video coding
KR100679026B1 (en) Method for temporal decomposition and inverse temporal decomposition for video coding and decoding, and video encoder and video decoder
JP2004502358A (en) Encoding method for video sequence compression
Pau et al. Motion compensation and scalability in lifting-based video coding
US20060013311A1 (en) Video decoding method using smoothing filter and video decoder therefor
US20060013312A1 (en) Method and apparatus for scalable video coding and decoding
US20050018771A1 (en) Drift-free video encoding and decoding method and corresponding devices
WO2006080662A1 (en) Method and apparatus for effectively compressing motion vectors in video coder based on multi-layer
KR20050028019A (en) Wavelet based coding using motion compensated filtering based on both single and multiple reference frames
US20060012680A1 (en) Drift-free video encoding and decoding method, and corresponding devices
JP2005533432A (en) 3D wavelet video coding method, decoding method and corresponding apparatus
JP2006509410A (en) Video encoding method and apparatus
JP2006503475A (en) Drift-free video encoding and decoding method and corresponding apparatus
US20070019722A1 (en) Subband-video decoding method and device
Wu et al. Wavelet based distributed video coding with spatial scalability
KR20070028720A (en) Motion image encoding system based on wavelet packet transform and the method thereof
WO2006006796A1 (en) Temporal decomposition and inverse temporal decomposition methods for video encoding and decoding and video encoder and decoder
Heijmans Motion Compensation and Scalability in Lifting-Based Video Coding