JP2005513925A - ビデオ符号化及び復号化方法及び装置 - Google Patents

ビデオ符号化及び復号化方法及び装置 Download PDF

Info

Publication number
JP2005513925A
JP2005513925A JP2003555814A JP2003555814A JP2005513925A JP 2005513925 A JP2005513925 A JP 2005513925A JP 2003555814 A JP2003555814 A JP 2003555814A JP 2003555814 A JP2003555814 A JP 2003555814A JP 2005513925 A JP2005513925 A JP 2005513925A
Authority
JP
Japan
Prior art keywords
motion vector
motion
level
decoding
spatial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003555814A
Other languages
English (en)
Other versions
JP2005513925A5 (ja
Inventor
ボットレアウ ヴィンセント
マリオン ベネティエレ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2005513925A publication Critical patent/JP2005513925A/ja
Publication of JP2005513925A5 publication Critical patent/JP2005513925A5/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/29Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving scalability at the object level, e.g. video object layer [VOL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/62Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding by frequency transforming in three dimensions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、フレームの群(GOF)に分割されたビデオシーケンスの圧縮のための符号化方法に関し、ここで各フレームの群は3次元(3D)ウェーブレット変換によって分解され、当該ウェーブレット変換は各分解レベルにおいて連続的に、動き補償ステップ、時間フィルタリングステップ及び空間分解ステップを有する。前記動き補償は、符号化され、関連する空間分解レベルの符号化されたテクスチャ情報と共にかつ該情報の直前に前記符号化されたビットストリーム中に配置される動きベクトルに導く動き推定に基づく。前記動きベクトルの符号化動作は最低の空間分解能で実行され、他の空間分解能のそれぞれにおける前記動きベクトルのリファインメントビットのみが、リファインメントビットプレーン毎に符号化されたビットストリーム中に配置される。それぞれ前記ビットプレーンの末尾、前記時間分解レベル、及び前記空間分解レベルを示すための特定のマーカが、前記符号化されたビットストリーム中に導入される。本発明によれば、各時間分解レベルについて、各空間分解レベルにおいて前記空間分解レベルに関連する動きベクトル情報の末尾を示すための付加的なマーカが、次いで前記符号化されたビットストリーム中に導入される。本方法は、非常に低い復号化ビットレートの場合、残りの動き情報をスキップしテクスチャ情報のみを復号化することを可能とし、又は他の実装においては、前記残りの動き情報及び関連する時間レベルの残りの空間レベルをもスキップすることを可能とする。

Description

本発明は、それぞれが幾つかのフレームの対に更に分割されたフレームの群に分割されたビデオシーケンスの圧縮のための符号化方法であって、前記フレームの群のそれぞれは3次元ウェーブレット変換によって分解され、前記変換は各分解レベルにおいてフレームの各対の2つのフレームの間の動き補償ステップ、時間フィルタリングステップ、及びかくして得られた各時間サブバンドの空間分解ステップを連続的に有し、前記動き補償は各時間分解レベルについて最高の空間分解能レベルで実行された動き推定に基づき、かくして得られた動きベクトルはより低い空間分解能についても動きベクトルを得るために2のべき乗によって乗算され、いずれの空間分解能レベルも再構築することをも可能とする前記推定された動きベクトルは符号化され、所定の空間レベルにおけるウェーブレット係数によって形成される符号化されたテクスチャ情報と共にかつ該情報の直前に前記符号化されたビットストリーム中に配置され、前記符号化の動作は前記推定された動きベクトルに対して最低の空間分解能で実行され、ある分解能レベルから他の分解能レベルへと、各空間分解能における前記動きベクトルのリファインメント(refinement)ビットのみが次いでリファインメントビットプレーン毎に前記符号化されたビットストリーム中に配置され、それぞれビットプレーンの末尾、時間分解レベル及び空間分解レベルを示す特定のマーカが前記符号化されたビットストリーム中に導入される方法に関する。
本発明はまた、対応する符号化装置、かような符号化装置によって生成された符号化されたビットストリームから成る伝送可能なビデオ信号、対応する復号化装置、及びかような復号化装置における利用のためのコンピュータ実行可能な処理ステップに関する。
異種のネットワークに渡るビデオストリーミングは高いスケーラビリティ能力を必要とする。高いスケーラビリティ能力とは即ち、ビットストリームの一部がシーケンスの完全な復号化なしに復号化されることができ、より低い空間若しくは時間分解能(空間スケーラビリティ、時間スケーラビリティ)で又はより低い品質で(SNR又はビットレートスケーラビリティ)最初のビデオ情報を再構築するために結合されることができることを意味する。これら3つのタイプのスケーラビリティ(空間、時間、SNR)の全てを達成する便利な方法は、入力ビデオシーケンスの動き補償の後の、前記入力ビデオシーケンスの3次元サブバンド分解(subband decomposition)である(効率的なスケーラブルなビデオ符号化方式の設計のため、動き推定及び動き補償は本当に重要な要素であるが、主にテクスチャの符号化/復号化のために利用可能なビット予算(budget)を急激に減少させないように動き情報のオーバヘッドを低く保ちつつ、優れた時間的な予測を提供するための、幾つかの相反する要求を伴う)。
完全にスケーラブルなビデオ符号化方法は既に、国際特許出願公開WO02/01881(PHFR000070)において記載されている。本方法の主な特徴は、ビデオシーケンスの時間的なサブバンド分解を示す図1を参照しながら最初に思い起こされる。図示された動き補償を用いた3Dウェーブレット分解はフレームの群(GOF)に適用され、ここでフレームはF1乃至F8で参照される。各GOFは、大きな動きを伴うシーケンスを処理するために最初に動き補償(MC)され、次いでHaarウェーブレットを利用して時間フィルタリング(TF)される(点線の矢印はハイパス時間フィルタリングに対応し、他方のものはローパス時間フィルタリングに対応する)。動き補償操作及び時間フィルタリング操作の後、各時間サブバンドが空間−時間サブバンドに空間的に分解され、図2に示すように最終的には元のGOFの3Dウェーブレット表現に導く。図1及び図2の例においては、分解の3つの段階が示され(L及びH=第1段階、LL及びLH=第2段階、LLL及びLLH=第3段階)、動きベクトル場の群が各時間分解レベルにおいて、即ち第1のレベルにおいてMV4、第2のレベルにおいてMV3、第3のレベルにおいてMV2というように生成される(実際には、各時間分解レベルにおいて考慮されるGOF中の2つのフレーム毎に1つの動きベクトルが生成され、それ故動きベクトル場の数は、3つの分解レベルの例では、時間サブバンド中のフレームの数の半分に等しい。即ち、動きベクトル場の第1のレベルでは4、第2のレベルにおいては2、第1のレベルにおいては1である)。
復号化器側においては、時間スケーラビリティの場合、プログレッシブな復号化を可能とするため、前記ビットストリームは例えば図3に記載されるように構成される。図1の3つの時間分解レベル(ここではTDLと呼ばれる)は、4つの時間分解能レベル(1乃至4)をもたらし、最初のフレームレートから得られることができる可能なフレームレートを表す。最低の分解能時間レベルに対応する係数(coefficient)が、当該レベルにおいて動きベクトルを送信することなく最初に符号化され(1)、他の全ての再構築フレームレート(2、3、4)については、動きベクトル場MV2乃至MV4及び対応する高周波の時間サブバンド2乃至4のフレームが符号化される。ビットストリームの構成のこの説明は時間レベルのみを考慮に入れており、各時間レベル内の空間的なスケーラビリティも考慮される必要がある。このことは、図4において思い起こされる完全なスケーラビリティ解決方法に導き、ここでは各時間スケール内で、全ての空間分解能が連続的に走査され(SDL=空間分解レベル)、それ故全ての空間周波数が利用可能である(フレームレートt=1乃至4、表示サイズs=1乃至4)。ビットプレーン及び時間レベルを分離するためにマーカが利用される(それぞれ、2つのビットプレーンの間のフラグA、及び2つの連続する時間分解レベルの間のフラグB)。
空間スケーラビリティの場合、減少された空間分解能のビデオを再構築することが可能であるように、前記ビットストリームの最初において、全分解能の動きベクトル場を伝送することは望ましくなく思われ、前記引用文献におけるこの目的のために提案される解決方法は、動きベクトルによって記述される動きを現在の空間レベルのサイズに適応させるためのものである。即ち、最低の空間分解能に対応する低い分解能の動きベクトル場が最初に伝送され、前記動きベクトルの分解能は空間分解能における増加に従ってプログレッシブに増大させられ、動きベクトル場の分解能と他のものとの差分のみが符号化され伝送される(かくして記載された手法においては、前記動きベクトルは、全検索ブロックマッチング又はいずれの他の得られた手法のようなブロックベースの動き推定方法によって得られるものと仮定され、前記動き推定におけるブロックのサイズはこのとき注意深く選択される必要がある。実際には、全分解能において前記ブロックの元のサイズが8×8の場合、半分の分解能において4×4となり、4分の1で2×2となる等する。従って、前記ブロックの元のサイズが小さすぎる場合、前記元のサイズが分解/再構築レベルの数と適合性があるかどうかのチェックに常に導くという問題が発生し得る)。
例えば空間分解レベルについては、全てのとり得る分解能に対応する動きベクトルを望む場合、最初の動きベクトルが2によって除算されるか、又はs個の位置のシフトが実行されるかのいずれかとなり、その結果は、サイズが2によって除算された最低の分解能からのブロックに対応する動きベクトルを表す。前記元の動きベクトルの2s−1による除算は、次の空間分解能を提供し得るが、この値は既に以前の操作から取得可能であり、s−1個の位置のシフトに対応する。最初の操作に対する差は、2s−1の重みを持つ動きベクトルのバイナリ表現におけるビットである。このとき、より高い分解能で前記動きベクトルを再構築するため、以前に伝送されたベクトルに当該ビット(リファインメントビットと呼ばれる)を追加することは十分である。このことはs=4について図5に示される。前記動きベクトルのこのプログレッシブな伝送は、図6に示すように、同一の空間レベルにおけるテクスチャに対応するビットの直前に、ある空間分解能から他の空間分解能へと前記ビットストリーム中に前記動きベクトル場の前記リファインメントビットを含むことを可能とする。上述したように、空間レベルを分離するためにマーカが利用される(2つの連続するレベルの間のフラグC)。
(前記引用文献に記載され、以上に思い起こされたような)このスケーラブルな動きベクトル符号化方法のため、時間及び空間レベルの階層構造が動きベクトル符号化に置き換えられ、動き情報をプログレッシブに復号化することを可能とする。所定の空間分解能について、前記復号化器はもはや該レベルにおいて有用ではない前記ビットストリームの一部を復号化する必要はない。しかしながら、前記スケーラブルなベクトル符号化方法は、完全にプログレッシブなビットストリームを保証するが、非常に低いビットレートにおける復号化の場合には動き情報のオーバヘッドが高くなりすぎ、以下の欠点、即ち、利用可能な予算の不足のためテクスチャビットを復号化することができない点、及びそれ故非常に悪い再構築品質という欠点に導く。
本発明の目的はそれ故、この欠点を回避し、それ故高いビットレートのスケーラビリティが得られる必要がある状況、即ち復号化ビットレートが符号化ビットレートよりもかなり低い場合に、より適合した符号化方法を提案することにある。
この目的のため、本発明は、本明細書の導入部において定義されたような符号化方法であって、更に、各時間分解レベルについて、各空間分解レベルにおいて前記空間分解レベルに関連する動きベクトル情報の末尾を示す付加的な特定のマーカが前記符号化されたビットストリーム中に導入されることを特徴とする符号化方法に関する。
本発明の他の目的は、前記符号化方法を実行する符号化装置を提案することにある。
この目的のため、本発明は、それぞれが幾つかのフレームの対に更に分割されたフレームの群に分割されたビデオシーケンスを符号化するための装置であって、前記フレームの群のそれぞれは3次元ウェーブレット変換によって分解され、前記変換は各分解レベルにおいてフレームの各対の2つのフレームの間の動き補償ステップ、時間フィルタリングステップ、及びかくして得られた各時間サブバンドの空間分解ステップを連続的に有し、前記動き補償は各時間分解レベルについて最高の空間分解能レベルで実行された動き推定に基づき、かくして得られた動きベクトルはより低い空間分解能についても動きベクトルを得るために2のべき乗によって乗算され、いずれの空間分解能レベルも再構築することをも可能とする前記推定された動きベクトルは符号化され、所定の空間レベルにおけるウェーブレット係数によって形成される符号化されたテクスチャ情報と共にかつ該情報の直前に前記符号化されたビットストリーム中に配置され、前記符号化の動作は前記推定された動きベクトルに対して最低の空間分解能で実行され、ある分解能レベルから他の分解能レベルへと、各空間分解能における前記動きベクトルのリファインメントビットのみが次いでリファインメントビットプレーン毎に前記符号化されたビットストリーム中に配置され、それぞれビットプレーンの末尾、時間分解レベル及び空間分解レベルを示す特定のマーカが前記符号化されたビットストリーム中に導入される装置であって、前記ビデオシーケンスから前記フレームの全ての対に関連する動きベクトルを決定ための動き推定手段と、前記ビデオシーケンス及び前記動きベクトルに基づいて動き補償ステップ、時間フィルタリングステップ及び空間分解ステップを連続的に各フレームの群内で実行する3次元ウェーブレット変換手段と、前記変換手段から生じた係数と前記動き推定手段によって出力された動きベクトルとの両方を符号化し前記符号化されたビットストリームを生じる符号化手段とを有する装置において、前記装置は更に、各空間分解レベルにおいて前記空間分解レベルに関連する動きベクトル情報の末尾を示す付加的な特定のマーカを前記符号化されたビットストリーム中に導入する手段を有することを特徴とする装置に関する。
本発明はまた、かような符号化装置によって生成された符号化されたビットストリームから成る送信可能なビデオ信号であって、前記符号化されたビットストリームが、各空間分解レベルにおいて前記空間分解レベルに関連する動きベクトル情報の末尾を示す付加的な特定のマーカを有することを特徴とする送信可能なビデオ信号に関する。
本発明の他の目的は、提案されるような符号化方法を実行することにより生成されるビットストリームを復号化する装置を提案することにある。
この目的のため、本発明は、上述した符号化方法を実行することにより生成された符号化されたビットストリームを復号化する装置であって、前記復号化装置は、前記符号化されたビットストリームにおいて係数と動きベクトルとの両方を復号化する復号化手段と、前記復号化された係数及び動きベクトルに基づいて出力ビデオシーケンスを再構築する逆3次元ウェーブレット変換手段と、各動きベクトル復号化処理の前に既に費やされたビット予算の量を規定し、前記量に基づいて動き情報に関連する復号化動作を前記動き情報の残りの部分のスキップ動作によって停止するか否かを決定するリソース制御手段とを有する装置、又は前記符号化方法を実行することにより生成された符号化されたビットストリームを復号化する装置であって、前記復号化装置は、前記符号化されたビットストリームにおいて係数と動きベクトルとの両方を復号化する復号化手段と、前記復号化された係数及び動きベクトルに基づいて出力ビデオシーケンスを再構築する逆3次元ウェーブレット変換手段と、各動きベクトル復号化処理の前に既に費やされたビット予算の量を規定し、前記量に基づいて動き情報及び関連する空間分解レベルの残りの部分に関連する復号化動作を、前記動き情報の残りの部分及び前記関連する空間分解レベルの後続する残りの部分のスキップ動作によって停止するか否かを決定するリソース制御手段とを有する装置に関する。
本発明はまた、かような復号化装置における利用のためのコンピュータ実行可能な処理ステップに関する。
本発明は、添付する図を参照しながら以下に例として説明される。
図6に示された方法は、第1のビットプレーン(タイプAの2つのフラグの間に含まれ、所定の品質に対応する各ビットプレーンは、全ての時間レベルについての情報を含み、各時間レベルは所定のフレームレートに対応する)が復号化器側で完全に再構築されるべきこと、即ち復号化ビットレート(符号化器側では先験的に知られない)が少なくとも当該ビットプレーンを完全に再構築するのに十分であるべきことを仮定する。前記ビットレートは、前記復号化器が到達することができる品質、フレームレート及び空間分解能の点で最低の再構築パラメータに対応する(各時間レベルはすべての空間レベルについての情報を含み、各空間レベルは所定の空間分解能に対応する)。しかしながら、スケーラビリティが完全に利用される実際の応用においては、前記復号化ビットレートは、所定の瞬間において(例えばネットワークの輻輳のため)、所望の復号化パラメータに従って当該特定のビットプレーンを復号化するには低くなりすぎる可能性がある(例えば、ユーザは完全なフレームレート及び完全な空間分解能を必要とし得る)。この状況が起こる場合、前記第1のビットプレーンは、ビデオの粗い平均のみを含むため、再構築の質は許容できないものとなり、一方でビデオの詳細をも得るために、及び視覚的に許容可能な再構築の品質を得るために、幾つかの付加的なビットプレーンが復号化される必要がある。
これらの特定の状況下で、本発明によれば、動きベクトル復号化の損傷にテクスチャビットを復号化することに集中すること、及び復号化処理の実施の間前記動きベクトルの復号化を続けることを許容するか否かの決定を導入することが提案される。特定の復号化ビットレートが与えられると、各動きベクトル復号化処理(近似MV1又はその他のMVi)の前に、既に費やされたビット予算がチェックされる。この量が、総ビット予算の特定の百分率(M%)を超える場合、動きオーバヘッドは更なる詳細なビットプレーンの復号化を許容するには高すぎると推測され、以降のテクスチャ係数のためにビットを節約するため、動き情報の残りの部分を復号化しないことが決定される。この手法を実施化することを可能とするため、前記復号化器は、次のテクスチャ部分に直接ジャンプするために前記動きベクトルに対応するビットストリームの部分をスキップすることが可能である必要がある。例えば図7において、一方MV2中の復号化動きベクトル及び前記アルゴリズムが次いで、s=2の冒頭において復号化処理を再同期化させる必要がある間、上述の臨界百分率が到達され得る。本発明によれば、テクスチャビットへの容易で直接なアクセスを可能とするため、付加的な特定のマーカ即ちDで表されるフラグが、図7に示されるように動きベクトル情報の末尾に追加される。
かくして説明された符号化方法は、図8に示されたような、以下の主モジュールを有する符号化装置において実施化されても良い。第1に、入力ビデオシーケンスを受信する動き推定回路81が、(好ましくはブロックマッチングアルゴリズムによって)前記動きベクトルの推定を実行する。次いで、3Dウェーブレット変換回路82が前記入力ビデオシーケンス及び前記推定された動きベクトルを受信し、動き補償ステップ、時間フィルタリングステップ、及び空間分解ステップを実行する。変換回路82によってもたらされた係数及び回路81の出力部において利用可能な動きベクトルは、最後に符号化手段によって受信される。該符号化手段は、例えば符号化装置83及び算術符号化装置84を直列に有し、前記ウェーブレット変換から生じた係数と前記動き補償から生じたベクトルとの両方を符号化するために備えられる。前記符号化手段の出力部において利用可能な符号化されたビットストリームCBは伝送される(復号化器による受信を考慮して)か又は保存される(復号化器又はサーバによる後の受信を考慮して)。
復号化側において(又はサーバにおいて)、対応する復号化方法は、図9に示されたような、以下の主モジュールを有する復号化装置において実施化され得る。前記受信された符号化されたビットストリームは最初に復号化装置91によって処理される。該復号化処理装置91は、例えば算術復号化段と復号化段とを直列に有し、符号化された係数及び符号化された動きベクトルを含む前記符号化されたビットストリームを復号化するために備えられる。前記復号化された係数及び動きベクトルは次いで、元のものに対応する出力ビデオシーケンスを再構築するために備えられた、逆3Dウェーブレット変換回路92によって受信される。前記復号化装置はまた、リソースコントローラ93を有する。該リソースコントローラ93は、チェック動作を担当する。即ち、各動きベクトル復号化処理の前に既に費やされたビット予算の量を検証し、当該量に基づいて前記動き情報に関する復号化動作を停止して関連する空間分解レベルの残りのテクスチャ情報のみを復号化するか否か決定する必要がある。
提案されたような方法はしかしながら、前記動きベクトル復号化動作が特定の空間−時間レベルにおいて停止させられた場合、符号化動作と復号化動作との間にずれを生じる。更なる空間−時間レベルが依然復号化される場合、動き補償は実際に、再構築中であるものを含むこれらの残りの分解能について実行されない。この欠点を制限するために、及び復号化のために利用可能なビット予算の多くの部分が第1のビットプレーンのために既に到達されたという事実を考慮に入れ、本発明によれば、視覚的に許容可能な再構築品質を得るために、例えば応用の所定の要求に従ってフレームレート又は空間分解能を減少させることにより、復号化パラメータのセットを動的に減少させることが提案される。動きベクトルの復号化動作が停止させられる空間−時間分解能は、利用可能なビット予算により許容される最大の品質で再構築される必要があり、より高い分解能は断念される。かくしてここでは、上述した復号化条件によりいずれの方法でも悪い品質のものとなるであろう現在の空間−時間分解能についてのビットプレーンの全ての再構築を試みる代わりに、前記ビットプレーンの綿密な探査に重点が置かれる。このことは図10に示され、ここでは、本発明によって、第2の空間分解能から動きベクトルの復号化動作を停止することが選択されている。残りの2つの空間ビットレベルも次いで、各時間分解能について中断されており、このことは、4分の1の空間分解能におけるが完全なフレームレートにおける復号化には対応しない。
本発明の好適な実施例の以上の記載は、例示及び説明の目的のために示された。当該記載は網羅的であることを意図されておらず、本発明を開示されたそのままの形式に限定することを意図されていない。明らかに、当業者には明白で本発明の範囲内に含まれることを意図された多くの変更及び変形が、上述の教示に照らして可能である。
例えば、ここで記載された装置はハードウェア、ソフトウェア又はハードウェアとソフトウェアとの組み合わせによって実装されることができることは理解されるべきである。このとき、単一のアイテムのハードウェア又はソフトウェアが幾つかの機能を実行することができること、又はハードウェア及びソフトウェア若しくはこれら両方のアイテムの集合が単一の機能を実行することを除外するものではない。これらの装置は、いずれのタイプのコンピュータシステムによっても、又はここで記載された方法を実行するように構成された他の装置によって実装されても良い。ハードウェアとソフトウェアとの典型的な組み合わせは、ロードされ実行されるときにコンピュータシステムがここで記載された方法を実行するように該コンピュータシステムを制御するコンピュータプログラムを持つ汎用コンピュータシステムであり得る。代替として、本発明の機能タスクのうちの1以上のものを実行するための特化されたハードウェアを含む専用コンピュータが利用されても良い。本発明はまた、ここで記載された方法及び機能の実装を可能とする全ての特徴を有し、コンピュータシステムにロードされたときこれらの方法及び機能を実行することが可能な、コンピュータプログラム製品に組み込まれても良い。本文脈においてコンピュータプログラム、ソフトウェアプログラム、プログラム、プログラム製品、又はソフトウェアとは、情報処理能力を持つシステムに、特定の機能を直接に又は以下のいずれか又は両方の後に実行させるように意図された命令のセットの、いずれの言語、コード又は表記によるいずれの表現をも意味する:(a)他の言語、コード又は表記への変換、及び/又は(b)異なるマテリアル形式での再生。
動き補償を伴う時間サブバンド分解を示す。 3次元ウェーブレット分解に起因する空間−時間サブバンドを示す。 時間スケーラビリティのためのビットストリーム中の動きベクトル挿入を示す。 空間−時間ツリーの時間主導の走査を用いて得られるビットストリームの構造を示す。 動きベクトルのバイナリ表現、及び該ベクトルの最低の分解能から最高の分解能までのプログレッシブな伝送である。 以前に引用された文献WO02/01881において記載された完全にスケーラブルなアプローチにおける動きベクトル符号化のためのビットストリーム構成を示す。 本発明による符号化方法を実行するときに得られる符号化されたビットストリームを示し、前記符号化されたビットストリームが次いで本発明によってどのような復号化されるかを理解することを可能とする図である。 本発明による符号化方法を実行するための符号化装置を示す。 本発明による復号化方法を実行するための復号化装置を示す。 符号化されたビットストリームの他の表現を示し、本発明による復号化方法の他の実施例を示す。

Claims (7)

  1. それぞれが幾つかのフレームの対に更に分割されたフレームの群に分割されたビデオシーケンスの圧縮のための符号化方法であって、前記フレームの群のそれぞれは3次元ウェーブレット変換によって分解され、前記変換は各分解レベルにおいてフレームの各対の2つのフレームの間の動き補償ステップ、時間フィルタリングステップ、及びかくして得られた各時間サブバンドの空間分解ステップを連続的に有し、前記動き補償は各時間分解レベルについて最高の空間分解能レベルで実行された動き推定に基づき、かくして得られた動きベクトルはより低い空間分解能についても動きベクトルを得るために2のべき乗によって乗算され、いずれの空間分解能レベルも再構築することをも可能とする前記推定された動きベクトルは符号化され、所定の空間レベルにおけるウェーブレット係数によって形成される符号化されたテクスチャ情報と共にかつ該情報の直前に前記符号化されたビットストリーム中に配置され、前記符号化の動作は前記推定された動きベクトルに対して最低の空間分解能で実行され、ある分解能レベルから他の分解能レベルへと、各空間分解能における前記動きベクトルのリファインメントビットのみが次いでリファインメントビットプレーン毎に前記符号化されたビットストリーム中に配置され、それぞれビットプレーンの末尾、時間分解レベル及び空間分解レベルを示す特定のマーカが前記符号化されたビットストリーム中に導入される方法において、各時間分解レベルについて、各空間分解レベルにおいて前記空間分解レベルに関連する動きベクトル情報の末尾を示す付加的な特定のマーカが前記符号化されたビットストリーム中に導入されることを特徴とする方法。
  2. それぞれが幾つかのフレームの対に更に分割されたフレームの群に分割されたビデオシーケンスを符号化するための装置であって、前記フレームの群のそれぞれは3次元ウェーブレット変換によって分解され、前記変換は各分解レベルにおいてフレームの各対の2つのフレームの間の動き補償ステップ、時間フィルタリングステップ、及びかくして得られた各時間サブバンドの空間分解ステップを連続的に有し、前記動き補償は各時間分解レベルについて最高の空間分解能レベルで実行された動き推定に基づき、かくして得られた動きベクトルはより低い空間分解能についても動きベクトルを得るために2のべき乗によって乗算され、いずれの空間分解能レベルも再構築することをも可能とする前記推定された動きベクトルは符号化され、所定の空間レベルにおけるウェーブレット係数によって形成される符号化されたテクスチャ情報と共にかつ該情報の直前に前記符号化されたビットストリーム中に配置され、前記符号化の動作は前記推定された動きベクトルに対して最低の空間分解能で実行され、ある分解能レベルから他の分解能レベルへと、各空間分解能における前記動きベクトルのリファインメントビットのみが次いでリファインメントビットプレーン毎に前記符号化されたビットストリーム中に配置され、それぞれビットプレーンの末尾、時間分解レベル及び空間分解レベルを示す特定のマーカが前記符号化されたビットストリーム中に導入される装置であって、前記ビデオシーケンスから前記フレームの全ての対に関連する動きベクトルを決定するための動き推定手段と、前記ビデオシーケンス及び前記動きベクトルに基づいて動き補償ステップ、時間フィルタリングステップ及び空間分解ステップを連続的に各フレームの群内で実行する3次元ウェーブレット変換手段と、前記変換手段から生じた係数と前記動き推定手段によって出力された動きベクトルとの両方を符号化し前記符号化されたビットストリームを生じる符号化手段とを有する装置において、前記装置は更に、各空間分解レベルにおいて前記空間分解レベルに関連する動きベクトル情報の末尾を示す付加的な特定のマーカを前記符号化されたビットストリーム中に導入する手段を有することを特徴とする装置。
  3. 請求項2に記載の符号化装置によって生成された符号化されたビットストリームから成る送信可能なビデオ信号であって、前記符号化されたビットストリームが、各空間分解レベルにおいて前記空間分解レベルに関連する動きベクトル情報の末尾を示す付加的な特定のマーカを有することを特徴とする送信可能なビデオ信号。
  4. 請求項1に記載の符号化方法を実行することにより生成された符号化されたビットストリームを復号化する装置であって、前記復号化装置は、前記符号化されたビットストリームにおいて係数と動きベクトルとの両方を復号化する復号化手段と、前記復号化された係数及び動きベクトルに基づいて出力ビデオシーケンスを再構築する逆3次元ウェーブレット変換手段と、各動きベクトル復号化処理の前に既に費やされたビット予算の量を規定し、前記量に基づいて動き情報に関連する復号化動作を前記動き情報の残りの部分のスキップ動作によって停止するか否かを決定するリソース制御手段とを有する装置。
  5. 請求項1に記載の符号化方法を実行することにより生成された符号化されたビットストリームを復号化する装置における利用のためのコンピュータ実行可能な処理ステップであって、前記処理ステップは、前記符号化されたビットストリームにおいて係数と動きベクトルとの両方を復号化する復号化ステップと、前記復号化された係数及び動きベクトルに基づいて出力ビデオシーケンスを再構築する逆3次元ウェーブレット変換ステップと、各動きベクトル復号化処理の前に既に費やされたビット予算の量を規定し、前記量に基づいて動き情報に関する復号化動作を前記動き情報の残りの部分のスキップ動作によって停止するか否かを決定するリソース制御ステップとを有する、コンピュータ実行可能な処理ステップ。
  6. 請求項1に記載の符号化方法を実行することにより生成された符号化されたビットストリームを復号化する装置であって、前記復号化装置は、前記符号化されたビットストリームにおいて係数と動きベクトルとの両方を復号化する復号化手段と、前記復号化された係数及び動きベクトルに基づいて出力ビデオシーケンスを再構築する逆3次元ウェーブレット変換手段と、各動きベクトル復号化処理の前に既に費やされたビット予算の量を規定し、前記量に基づいて動き情報及び関連する空間分解レベルの残りの部分に関連する復号化動作を、前記動き情報の残りの部分及び前記関連する空間分解レベルの後続する残りの部分のスキップ動作によって停止するか否かを決定するリソース制御手段とを有する装置。
  7. 請求項1に記載の符号化方法を実行することにより生成された符号化されたビットストリームを復号化する装置における利用のためのコンピュータ実行可能な処理ステップであって、前記処理ステップは、前記符号化されたビットストリームにおいて係数と動きベクトルとの両方を復号化する復号化ステップと、前記復号化された係数及び動きベクトルに基づいて出力ビデオシーケンスを再構築する逆3次元ウェーブレット変換ステップと、各動きベクトル復号化処理の前に既に費やされたビット予算の量を規定し、前記量に基づいて動き情報及び関連する空間分解レベルの残りの部分に関連する復号化動作を、前記動き情報の残りの部分及び前記関連する空間分解レベルの後続する残りの部分のスキップ動作によって停止するか否かを決定するリソース制御ステップとを有する、コンピュータ実行可能な処理ステップ。
JP2003555814A 2001-12-20 2002-12-09 ビデオ符号化及び復号化方法及び装置 Withdrawn JP2005513925A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01403319 2001-12-20
PCT/IB2002/005306 WO2003055224A1 (en) 2001-12-20 2002-12-09 Video encoding and decoding method and device

Publications (2)

Publication Number Publication Date
JP2005513925A true JP2005513925A (ja) 2005-05-12
JP2005513925A5 JP2005513925A5 (ja) 2006-02-02

Family

ID=8183040

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003555814A Withdrawn JP2005513925A (ja) 2001-12-20 2002-12-09 ビデオ符号化及び復号化方法及び装置

Country Status (7)

Country Link
US (1) US20050069212A1 (ja)
EP (1) EP1461956A1 (ja)
JP (1) JP2005513925A (ja)
KR (1) KR20040068963A (ja)
CN (1) CN1606880A (ja)
AU (1) AU2002366825A1 (ja)
WO (1) WO2003055224A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712178B2 (en) 2011-04-25 2014-04-29 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7321625B2 (en) * 2002-12-13 2008-01-22 Ntt Docomo, Inc. Wavelet based multiresolution video representation with spatially scalable motion vectors
US20060153466A1 (en) * 2003-06-30 2006-07-13 Ye Jong C System and method for video processing using overcomplete wavelet coding and circular prediction mapping
WO2005002234A1 (en) * 2003-06-30 2005-01-06 Koninklijke Philips Electronics, N.V. Video coding in an overcomplete wavelet domain
WO2005078663A1 (en) * 2004-02-17 2005-08-25 Newsouth Innovations Pty Limited Improved method for motion adaptive transformation of video
WO2006016029A1 (fr) * 2004-07-13 2006-02-16 France Telecom Procede et dispositif de codage d’une sequence d’images video en coefficients de sous-bandes de frequence de differentes resolutions spatiales
KR101102393B1 (ko) * 2004-12-06 2012-01-05 엘지전자 주식회사 에러 파급을 방지하는 영상신호의 엔코딩 및 디코딩 방법과장치
CN1319383C (zh) * 2005-04-07 2007-05-30 西安交通大学 高性能空域可伸缩的运动估计与运动矢量编码实现方法
CN1319382C (zh) * 2005-04-07 2007-05-30 西安交通大学 可伸缩视频编解码器体系结构设计方法
JP2007081720A (ja) * 2005-09-13 2007-03-29 Sanyo Electric Co Ltd 符号化方法
CN100512439C (zh) * 2005-10-27 2009-07-08 中国科学院研究生院 一种具有类框架小波结构的小波域运动估计方法
FR2894421B1 (fr) * 2005-12-07 2008-01-18 Canon Kk Procede et dispositif de decodage d'un flux video code suivant un codage hierarchique
FR2896371B1 (fr) * 2006-01-19 2008-11-07 Canon Kk Procede et dispositif de traitement d'une sequence d'images numeriques au format extensible
US20080115175A1 (en) * 2006-11-13 2008-05-15 Rodriguez Arturo A System and method for signaling characteristics of pictures' interdependencies
US8155207B2 (en) 2008-01-09 2012-04-10 Cisco Technology, Inc. Processing and managing pictures at the concatenation of two video streams
US8875199B2 (en) * 2006-11-13 2014-10-28 Cisco Technology, Inc. Indicating picture usefulness for playback optimization
US8416859B2 (en) * 2006-11-13 2013-04-09 Cisco Technology, Inc. Signalling and extraction in compressed video of pictures belonging to interdependency tiers
KR101366086B1 (ko) 2007-01-03 2014-02-21 삼성전자주식회사 잔차 블록의 계수들에 대한 부호화 결정 방법, 장치,인코더 및 디코더
US8804845B2 (en) * 2007-07-31 2014-08-12 Cisco Technology, Inc. Non-enhancing media redundancy coding for mitigating transmission impairments
US8958486B2 (en) * 2007-07-31 2015-02-17 Cisco Technology, Inc. Simultaneous processing of media and redundancy streams for mitigating impairments
EP2213097A2 (en) * 2007-10-16 2010-08-04 Cisco Technology, Inc. Conveyance of concatenation properties and picture orderness in a video stream
US8718388B2 (en) * 2007-12-11 2014-05-06 Cisco Technology, Inc. Video processing with tiered interdependencies of pictures
US8619861B2 (en) * 2008-02-26 2013-12-31 Microsoft Corporation Texture sensitive temporal filter based on motion estimation
US8416858B2 (en) * 2008-02-29 2013-04-09 Cisco Technology, Inc. Signalling picture encoding schemes and associated picture properties
US8886022B2 (en) 2008-06-12 2014-11-11 Cisco Technology, Inc. Picture interdependencies signals in context of MMCO to assist stream manipulation
US8699578B2 (en) 2008-06-17 2014-04-15 Cisco Technology, Inc. Methods and systems for processing multi-latticed video streams
US8705631B2 (en) * 2008-06-17 2014-04-22 Cisco Technology, Inc. Time-shifted transport of multi-latticed video for resiliency from burst-error effects
US8971402B2 (en) * 2008-06-17 2015-03-03 Cisco Technology, Inc. Processing of impaired and incomplete multi-latticed video streams
US20090323822A1 (en) * 2008-06-25 2009-12-31 Rodriguez Arturo A Support for blocking trick mode operations
US8259814B2 (en) * 2008-11-12 2012-09-04 Cisco Technology, Inc. Processing of a video program having plural processed representations of a single video signal for reconstruction and output
US8326131B2 (en) * 2009-02-20 2012-12-04 Cisco Technology, Inc. Signalling of decodable sub-sequences
US8782261B1 (en) 2009-04-03 2014-07-15 Cisco Technology, Inc. System and method for authorization of segment boundary notifications
US8949883B2 (en) 2009-05-12 2015-02-03 Cisco Technology, Inc. Signalling buffer characteristics for splicing operations of video streams
US8279926B2 (en) 2009-06-18 2012-10-02 Cisco Technology, Inc. Dynamic streaming with latticed representations of video
US20110222837A1 (en) * 2010-03-11 2011-09-15 Cisco Technology, Inc. Management of picture referencing in video streams for plural playback modes
CN103119592A (zh) * 2010-11-03 2013-05-22 瑞典移动成像公司 渐进的多媒体同步
CN102055978B (zh) * 2010-12-28 2014-04-30 深圳市融创天下科技股份有限公司 帧运动补偿编码、解码方法、装置
WO2013173292A1 (en) 2012-05-14 2013-11-21 Motorola Mobility Llc Scalable video coding with enhanced base layer
US9749642B2 (en) 2014-01-08 2017-08-29 Microsoft Technology Licensing, Llc Selection of motion vector precision
US9774881B2 (en) * 2014-01-08 2017-09-26 Microsoft Technology Licensing, Llc Representing motion vectors in an encoded bitstream
US9942560B2 (en) 2014-01-08 2018-04-10 Microsoft Technology Licensing, Llc Encoding screen capture data
EP3451663A1 (en) * 2017-08-31 2019-03-06 Thomson Licensing Pools of transforms for local selection of a set of transforms in video coding
CN108596069A (zh) * 2018-04-18 2018-09-28 南京邮电大学 基于深度3d残差网络的新生儿疼痛表情识别方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6674911B1 (en) * 1995-09-14 2004-01-06 William A. Pearlman N-dimensional data compression using set partitioning in hierarchical trees
EP1114555A1 (en) * 1999-07-20 2001-07-11 Koninklijke Philips Electronics N.V. Encoding method for the compression of a video sequence
EP1300023A2 (en) * 2000-06-30 2003-04-09 Koninklijke Philips Electronics N.V. Encoding method for the compression of a video sequence
WO2002023475A2 (en) * 2000-09-12 2002-03-21 Koninklijke Philips Electronics N.V. Video coding method
US6931068B2 (en) * 2000-10-24 2005-08-16 Eyeball Networks Inc. Three-dimensional wavelet-based scalable video compression
US7042946B2 (en) * 2002-04-29 2006-05-09 Koninklijke Philips Electronics N.V. Wavelet based coding using motion compensated filtering based on both single and multiple reference frames
US7321625B2 (en) * 2002-12-13 2008-01-22 Ntt Docomo, Inc. Wavelet based multiresolution video representation with spatially scalable motion vectors

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712178B2 (en) 2011-04-25 2014-04-29 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method

Also Published As

Publication number Publication date
WO2003055224A1 (en) 2003-07-03
EP1461956A1 (en) 2004-09-29
KR20040068963A (ko) 2004-08-02
US20050069212A1 (en) 2005-03-31
AU2002366825A1 (en) 2003-07-09
CN1606880A (zh) 2005-04-13

Similar Documents

Publication Publication Date Title
JP2005513925A (ja) ビデオ符号化及び復号化方法及び装置
JP4891234B2 (ja) グリッド動き推定/補償を用いたスケーラブルビデオ符号化
US6307886B1 (en) Dynamically determining group of picture size during encoding of video sequence
RU2609088C2 (ru) Способ кодирования и декодирования изображений, устройство кодирования и декодирования и соответствующие компьютерные программы
US20020154697A1 (en) Spatio-temporal hybrid scalable video coding apparatus using subband decomposition and method
US20050163224A1 (en) Device and method for playing back scalable video streams
JP2007228581A (ja) ビデオトランスコーディング方法及び装置
WO2005074277A1 (en) Method and device for transmitting scalable video bitstream
JP2006521727A (ja) インタレースデジタルビデオデータのスケーラブル符号化および復号化
JP2007520149A (ja) エンコーダ部からスケーラビリティを提供するスケーラブルビデオコーディング装置および方法
JP2005524352A (ja) 複数基準フレームに基づいた動き補償時間的フィルタ化を用いたスケーラブルなウェーブレット・ベースの符号化
KR20050028019A (ko) 하나 및 다수의 기준 프레임을 기반으로 한 움직임 보상필터링을 사용한 웨이블릿 기반 코딩
KR100843080B1 (ko) 비디오 트랜스코딩 방법 및 장치
JP2005538637A (ja) 映像符合化方法及び装置
JP2005086834A (ja) フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体
US7809061B1 (en) Method and system for hierarchical data reuse to improve efficiency in the encoding of unique multiple video streams
JP2012151894A (ja) 画像シーケンスを符号化する方法または復号する方法および装置
AU2004310917B2 (en) Method and apparatus for scalable video encoding and decoding
EP1707008A1 (en) Method and apparatus for reproducing scalable video streams
JP2007503750A (ja) 適応型フレーム間ウェーブレットのビデオコーディング方法、前記方法のためのコンピュータで読取り可能な記録媒体、及び装置
US8121422B2 (en) Image encoding method and associated image decoding method, encoding device, and decoding device
JP2005524354A (ja) 複数基準フレームに基づいた動き補償時間的フィルタ化を行うウェーブレット・ベース符号化
JP2006502677A (ja) 無制約及びリフティング型動き補償時間フィルタ処理のための効率的動きベクトル予測
JP2006501750A (ja) ウェーブレットベースの符号化において、動き補償された時間フィルタリングのための、フィルタリングされた領域とフィルタリングされない領域とを両方備えるlフレーム
KR20050029219A (ko) 비디오 코딩 방법 및 장치

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051208

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051208

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070511