JP5295233B2 - ビデオエンコーダ、ビデオデコーダ、エンコードするための方法、デコードするための方法、コンピュータプログラム、およびスケーラブルなビットストリーム - Google Patents

ビデオエンコーダ、ビデオデコーダ、エンコードするための方法、デコードするための方法、コンピュータプログラム、およびスケーラブルなビットストリーム Download PDF

Info

Publication number
JP5295233B2
JP5295233B2 JP2010513663A JP2010513663A JP5295233B2 JP 5295233 B2 JP5295233 B2 JP 5295233B2 JP 2010513663 A JP2010513663 A JP 2010513663A JP 2010513663 A JP2010513663 A JP 2010513663A JP 5295233 B2 JP5295233 B2 JP 5295233B2
Authority
JP
Japan
Prior art keywords
prediction
signal
pixel value
prediction residual
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010513663A
Other languages
English (en)
Other versions
JP2010531585A (ja
Inventor
ウィーガント,トーマス
ビンケン,マルティーン
Original Assignee
フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2010531585A publication Critical patent/JP2010531585A/ja
Application granted granted Critical
Publication of JP5295233B2 publication Critical patent/JP5295233B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、スケーラブルなビデオコーディング、特に、ピクセル値の改良のスケーラビリティーをサポートするスケーラブルなビデオコーディングに関する。
ISO/IEC Moving Pictures Experts Group(MPEG)とITU−T Video Coding Experts Group(VCEG)のJoint Video Team(JVT)の現在のプロジェクトは、T.Wiegand、G.J.Sullivan、J.Reichel、H.Schwarz、M.Wien著、「Joint Draft 10 of SVC Amendment」、Joint Video Team編、JVT−W201、San Jose、CA、USA、2007年4月と、J.Reichel、H.Schwarz、M.Wien著、「Joint Scarable Video Model JSVM−10」、Joint Video Team編、JVT−W202、San Jose、CA、USA、2007年4月、で定義されるビデオコーディングの規格であるH.264/MPEG4−AVCの最先端の水準のスケーラブルな拡張機能を開発するものであって、動画像列の時間的、空間的、SNRのスケーラブルなコーディング、またはそれらの組み合わせをサポートするものである。
ITU−T Rec.&ISO/IEC 14496−10 AVC、「Advanced Video Coding for Generic Audiovisual Services」version 3、2005年、に記載されているH.264/MPEG4−AVCは、ハイブリッドなビデオコーディックを指定している。そこでは、マクロブロックな予測信号は、動き補償補償による時間的なドメインにおいて、またはレイヤ内予測による空間的なドメインにおいて発生する。両予測は残差コーディングを伴う。スケーラビリティー拡張機能がないH.264/MPEG4−AVCコーディングは、シングルレイヤのH.264/MPEG4−AVCコーディングと言われる。シングルレイヤのH.264/MPEG4−AVCに相当する歪み率の性能は、典型的に、同じ視覚的な再構築品質が10%のビットレートで達成されることを意味する。上述したように、スケーラビリティーは、特定の解像度でのシングルレイヤのH.264/MPEG4−AVCのコーディングに相当する、サポートされた空間的、時間的またはSNRの解像度でR−Dの性能を達成する際に、ビットストリームの一部を取り除くための機能として考えられている。
スケーラブルなビデオコーディング(SVC)の基本設計は、レイヤのビデオコーディックに分類され得る。各レイヤでは、動き補償予測とレイヤ内予測の基本概念が、H.264/MPEG4−AVCとして、採用される。しかし、いくつかの空間的またはSNRのレイヤの間の冗長性を低減するために、追加的なレイヤ間予測のメカニズムが組み合わされてきた。SNRのスケーラビリティーは、基本的に、残差量子化によって達成される。そして、空間的なスケーラビリティーに関しては、動き補償予測とオーバーサンプルされたピラミッド分解との組み合わせが採用される。H.264/MPEG4−AVCの時間的スケーラビリティーの提案が続けられている。
一般的に、コーダの構造は、アプリケーションによって要求されるスケーラビリティー空間によって決定される。図示するために、図7は、2つの空間的レイヤ902a、902bを有する典型的なコーダ構造900を示す。各レイヤでは、レイヤの特定の動きパラ
メータ906a,bを用いた独立した階層的な動き補償予測構造904a,bが採用される。連続したレイヤ902a,b間の冗長性は、動きパラメータ906a,bのための予測メカニズムとテクスチャデータ910a,bとを含むレイヤ間予測コンセプト908によって低減される。各レイヤ902a,bの入力ピクチャ914a,bのベース画像(representation)912a,bは、H.264/MPEG4−AVCのものと同類の変換コーディング916a,916bによって取得される。対応するNAL(Network Abstraction Layer)ユニットは、動き情報とテクスチャデータとを含む。最も低いレイヤのベース画像のNALユニットは、すなわち912aは、シングルレイヤのH.264/MPEG4−AVCに相当する。ベース画像の再構築品質は、進歩的な改良スライスと言われる追加的なコーディング918a,bによって改良され得る。fine granular quality scalability(FGS)または柔軟性のあるbit−rate adaptationをサポートするために、対応のNALユニットが適宜排除され得る。
スケーラブルなビットストリーム922を得るために、ベースレイヤコーディング916a,bと進歩的なSNRの改良テクスチャコーディング918a,bから出力されたそれぞれのレイヤ902a,bの結果のとしてのビットストリームが、それぞれ、マルチプレクサ920によって多重送信される。当該ビットストリーム922は、時間的、空間的、およびSNRの品質において、スケーラブルなものである。
ビデオコーディング規格であるH.264/MPEG4−AVCの上記のスケーラブルな拡張機能に従って、時間的スケーラビリティーの集約は、階層的な予測構造を用いることによって提供される。この階層的な予測構造に関して、シングルレイヤH.264/MPEG4−AVCの規格の1つは、何らの変更無しに利用され得る。空間的およびSNRのスケーラビリティーに関し、追加的な手段を、シングルレイヤのH.264/MPEG4.AVCに追加する必要がある。組み合わされたスケーラビリティーを大きくサポートするビットストリームを生成するために、3つの全てのスケーラビリティーのタイプが組合され得る。
あるアプリケーションは、低いビット深度、または、より一般的には、低いピクセル値解像度、おそらくは低い空間的解像度のベースレイヤに加えて、高いビット深度の、おそらくは高い空間的解像度の内容を抽出したり、表示したりすることを可能にする強化レイヤから利益を得る。しかし、上述したスケーラブルな拡張機能のバージョンでは、スケーラビリティー手段は、ベースレイヤと強化レイヤとが、対応する輝度値と色度値の配列の同じビット深さ/ピクセル値解像度を有する取得されたビデオ素材(video material)を表わす場合にのみ指定される。
このように、ピクセル値解像度に関するスケーラビリティーをサポートするスケーラブルなビデオスキームを提供することは有益であろう。ビデオコーディングスキームが、ピクセル値解像度の異なるレベル間の、可能なピクセル値解像度のマッピングの広いスペクトルをサポートする場合は、より有益であろう。さらに、ビデオコーディングスキームが、デコーダサイドでの計算量を低く保つことが好ましいだろう。上述したビデオコーディング技術の1つを利用すること、ピクセル値解像度に関するスケーラビリティーを提供することは、異なるピクセル値解像度に基づいてコードされた、完全な自己完結型の2つの別個のビデオビットストリームを、1つの共通のスケーラブルなデータストリームへと合体させる必要があろう。しかし、これの場合は、圧縮率が悪くなってしまう。
このように、本発明の目的は、ピクセル値解像度に関するスケーラビリティーを可能に
するより効率的な方法を可能にする、スケーラブルなビデオコーディングスキームを提供することである。
この目的は、請求項1に従うエンコーダと、請求項12に従うデコーダと、請求項21または22に従う方法と、請求項24に従うスケーラブルなビデオビットストリームとによって達成される。
本発明は、ピクセル値解像度に関するスケーラビリティーを可能にするより効率的な方法が、第2の画像よりもピクセル値解像度が低い第1の画像に基づいて互いに別個のビデオ素材の第1および第2の画像を時間的に予測し、第1の予測残差または第1の予測残差の再構築されたバージョンを、第1のピクセル値解像度から、時間的に第2の画像を予測することによって取得される第2の予測信号によって決定される第2のピクセル値解像度へとマッピングし、第2と第3の予測信号との組み合わせと第2の画像との間の差分を表わす第2のピクセル値解像度の第2の予測残差をコーディングすることによって達成できるということを発見したことに基づくものである。第1の予測残差または第1の予測残差の再構築されたバージョンを第1のピクセル値解像度から第2のピクセル値解像度へとマップするために、第2の予測信号を使用することによって、第1の予測残差または第1の予測残差の再構築されたバージョンを個別にマップすることは、非線形マッピングスキームが使用される際においても、第1の予測信号とは独立して実行され得る。この方法によって、レイヤ間予測が正確かつ同時に行なわれるものとなり、デコーダは、たとえば、比較的複雑な動き補償を含む第1の画像を時間的に予測する必要がなくなる。そして、このことによって、比較的高い歪み率の性能でのデコーダにおける複雑さの低下が実現される。さらに、スケーラブルなコーディングスキーム自体は、線形的な予測値解像度間のマップに使用されるマッピングスキームを制限するものではない。
以下では、図面を参照しながら、好ましい実施の形態が説明される。特に、各図面は以下のものを示す。
本発明の実施の形態に従うビデオエンコーダのブロック図である。 本発明の実施の形態に従う複数のブロックからなるビデオ素材の概略図である。 本発明の実施の形態に従う逆トーンマッピングの概略図である。 本発明の実施の形態に従う高品質レイヤのピクセルと低品質レイヤのピクセルとの間の空間的な対応を示すビデオ素材のピクチャの左上の角部分を示す概略図である。 本発明の実施の形態に従う図1の逆残差トーンマッピングとアップサンプリングのモジュールの内部構造を示す概略ブロック図である。 本発明の実施の形態に従う図1の逆残差トーンマッピングとアップサンプリングのモジュールの内部構造を示す概略ブロック図である。 本発明の実施の形態に従うビデオデコーダのブロック図である。 スケーラブルなビデオコーディングのための通常のコーダ構造のブロック図である。
図1は、基本レイヤエンコーディングモジュール102と、高品質エンコーディングモジュール104と、品質低減モジュール106と、マルチプレクサ108を備えるビデオエンコーダ100を示す。図1のビデオエンコーダ100は、高品質ソースビデオ信号を受け取るための入力110と、スケーラブルなビデオビットストリームを出力するための
出力112とを備える。ビデオエンコーダ100は、高品質ソースビデオ信号110をスケーラブルなビデオビットストリーム112にエンコードすることによって、出力112でのスケーラブルなビデオビットストリームの第1の部分、以下では低品質基本レイヤという、が自己完結するように構成されている。この部分は、入力110での信号の初期の品質よりも低い品質、すなわち低品質で、出力112でのスケーラブルなビデオビットストリームの残りの部分の情報または使用が無い状態で、入力112における高品質ソースビデオ信号のビデオコンテンツの再構築を可能にする。そして、残りの部分、以下では高品質強化レイヤという、は低品質基本レイヤと高品質強化レイヤとを組み合わせることによって低品質よりも高い品質で入力112での高品質ソースビデオ信号の再構築を可能にする。
以下さらに詳細に説明する。一方の高品質強化レイヤと他方の低品質基本レイヤとの間の品質の違いは、少なくとも、ピクセル値のビット深度、輝度および/または色度値のようなピクセル値解像度に関するものである。以下ではピクセル値改良の違いの例として高品質強化レイヤと低品質基本レイヤとのビット深度の違いについて述べるが、ピクセル値解像度の差に関する他の例も可能である。たとえば、低品質基本レイヤのピクセル値解像度よりも高い高品質強化レイヤのピクセル値解像度は、低品質基本レイヤに対して高品質強化レイヤにおけるピクセル毎の色パラメータのより多くの個数の結果となり得る。ビット深度についても同様である。たとえば、低品質基本レイヤは、3つの8ビット値のみを使用することによってビデオコンテンツを表わし、高品質強化レイヤは4つの8ビット値を利用し得る。しかし、以下の説明の理解を容易にするために、以下ではピクセル値解像度の違いのための例として、ビット深度の違いについて説明する。
既に上述したように、アウトプット112でのスケーラブルなビットストリームは、一方の高品質強化レイヤと他方の低品質基本レイヤとから構成される。高品質強化レイヤ信号は高品質エンコーディングモジュール104によって出力され、低品質エンコーディングモジュール102は低品質基本レイヤ信号を出力する。マルチプレクサ108は、両方の信号を受け取り、それらをスケーラブルなビットストリーム112へと多重化して送信する。たとえば、マルチプレクサ108は、低品質基本レイヤが高品質強化レイヤよりも先んじるように、両方の信号をスケーラブルなビットストリーム112へと多重送信する。高品質エンコーディングモジュール104は、ビデオエンコーダ100の入力110とマルチプレクサ108の第1の入力との間に接続される。低品質エンコーディングモジュール102の場合、品質低減モジュール106が、ソースビデオ信号が低品質エンコーディングモジュール102に入る前にソースビデオ信号のピクセル値解像度を減らすために、入力110と低品質エンコーディングモジュール102の入力との間に接続される。以下さらに詳細に説明する。モジュール106上で実行される品質低減は、ピクセル値解像度の低減に加えて他の品質低減を含み得る。以下に説明するように、ピクセル値解像度の低減は、ビット深度の低減によって達成され得る。さらに、品質低減は、空間解像度の低減をさらに備える。特に、以下の例示は、ピクセル値解像度および空間解像度の両方において、低品質が高品質とは異なる場合の実施の形態に関するものである。
基本品質エンコーディングモジュール102は、品質低減モジュール106の出力とマルチプレクサ108の他の入力との間に接続される。そして、マルチプレクサ108の出力は、ビデオエンコーダ100の出力112に接続される。
高品質エンコーディングモジュール104は、このように接続されるので、高品質ソースビデオ信号を直接エンコーディングするためのものである。一方、低品質エンコーディングモジュール102は、品質低減モジュール106による出力としてのビデオソース信号の低品質バージョンをエンコードする。以下、さらに詳細に説明する。エンコーディングモジュール102および104の両者は互いに同時に動作し、エンコーディングモジュ
ール102および104の両者は別個にそれぞれの入力信号に対する時間的な予測を実行する。モジュール102および104の以下の実施の形態に従うと、予測残差をそれぞれの出力信号、すなわちモジュール104の場合の高品質強化レイヤとモジュール102の場合の低品質基本レイヤ、にエンコードするために、両モジュールはそれら独自の動き補償予測ループを備える。しかし、以下さらに詳細に説明すると、高品質エンコーディングモジュール104は、少なくとも部分的に、すなわち少なくともビデオ素材のいくつかのブロックに関して、独自の高品質時間予測ループの予測信号を改良するために、低品質エンコーディングモジュール102の予測残差または当該予測残差の再構築バージョンとを追加的に使用する。高品質エンコーディングモジュール104内で予測を改良するために、低品質基本レイヤの予測残差のみを使用することによって、高品質を得るための出力112におけるスケーラブルなビットストリームのデコーディングは、1つの時間的な予測だけを実行することによって可能となる。以下さらに詳細に説明する。低品質基本レイヤの予測残差のみを使用することによって、高品質レイヤの高いビット深度から線形な低品質レイヤへのトーンマッピングが必要でなくなる。むしろ、高品質強化レイヤ予測ループの予測信号は非線形性を正すために用いられる。
装置内部では、基本品質エンコーディングモジュール102は、減算器114と、変換モジュール116と、量子化モジュール118と、逆変換モジュール120と、加算器122と、デブロッキングフィルタ124と、予測モジュール126と、エントロピーコーディングモジュール128とを備える。減算器114と、変換モジュール116と、量子化モジュール118と、逆変換モジュール120と、加算器122と、デブロッキングフィルタ124と、予測モジュール126とは、閉じられた予測ループを形成するものであって、すなわち、それらは上述の順序で閉じられたループになるように接続される。特に、減算器114の非反転入力は、低品質エンコーディングモジュール102の入力を構成するものであって、その場合、減算器114の反転入力が予測モジュール126の出力に接続される。予測モジュール126の出力もまた加算器122の第1の入力に接続され、その場合、加算器122の他の入力が逆変換モジュール120の出力に接続される。逆変換モジュール120の入力は、量子化モジュール118の出力に接続される。そして、量子化モジュール118もまたエントロピーコーディングモジュール128の入力に接続される。エントロピーコーディングモジュール128の出力は低品質エンコーディングモジュール102の出力をも構成する。
同様に、高品質エンコーディングモジュール104は、減算器130と、変換モジュール132と、量子化モジュール134と、逆変換モジュール136と、加算器138と、デブロッキングフィルタ140と、予測モジュール142と、エントロピーコーディングモジュール144とを備える。要素130から144は、低品質エンコーディングモジュール102における要素114から128と同様の方法で互いに接続される。つまり、要素130から142は、閉じられたループになるように接続される。減算器130の非反転入力は、高品質エンコーディングモジュール104の入力を構成する。量子化モジュール134の出力は、逆変換モジュール136の入力およびエントロピーコーディングモジュール146の入力に接続される。予測モジュール142の出力は、本ケースにおいては、例示的に、ダイレクトでない方法であって、減算器130の反転入力およびさらに加算器138の入力に接続される。しかし、これらの要素に加えて、高品質エンコーディングモジュール104は、さらに、加算器146と、2つのレイヤ間予測パス148および150とを備える。レイヤ間予測パス148は、一方の低品質エンコーディングモジュール102の逆変換モジュール120の出力と、パス148を加算器146の入力へ/から接続および非接続するためにパス148に接続されるスイッチ152を介して、他方の加算器146の入力との間に接続される。特に、スイッチ152は、加算器146の入力に0を適用したり、パス148を加算器146の入力に接続したりするように構成される。パス148は、モジュール102からモジュール104へと低品質予測残差を提供するため
の低品質予測残差パスを表わし、互いに接続される逆マッピングおよびアップサンプリングモジュール154と選択フィルタ156とを有する。選択フィルタ156は逆マッピングおよびアップサンプリングモジュール154と逆変換モジュール120との間に接続される。
同様に、パス150は、一方で低品質エンコーディングモジュール102の加算器122の出力から、他方でスイッチ158から、延びる基本品質再構築信号提供パスを示す。スイッチ158は、減算器130の反転入力と加算器138の他の入力とを加算器146の出力またはパス150の他端に接続する。パス148と同様に、パス150は上述した順序で接続される選択フィルタ160と逆マッピングおよびアップサンプリングモジュール162とを有する。
逆マッピングおよびアップサンプリングモジュール162とは対称的に、残差パス148に接続される逆マッピングおよびアップサンプリングモジュール154は、さらに、予測モジュール142によって出力される予測シグナルを受け取るための入力または、代替的に、予測モジュール142によって出力される予測信号と逆変換モジュール136の出力との合計、すなわち高品質エンコーディングモジュール104の再構築された残差信号、とを備える。このように、逆マッピングおよびアップサンプリングモジュール154の別の入力は、予測モジュール142の出力に直接的に、または別の加算器164の出力に接続される。加算器164の入力は、予測モジュール142の出力と逆変換モジュール136の出力とにそれぞれ接続される。図6によって明確になるが、スイッチは、加算器168の入力に、0または逆変換モジュール136によって出力される信号を適用する、代替的に、2つの可能性の間で切り換えることを可能にするために、加算器164と逆変換モジュール136の出力との間にスイッチが接続され得る。
ビデオエンコーダ100の内部構造を詳細に説明してきたが、以下では動作の一般的なモードについてより詳細に説明する。特に、以下では、動作のモードが、スイッチ152および158が図1に示される位置にある、すなわち残差パス148を加算器146の入力に接続し、加算器146の出力を減算器130の反転入力に接続し、それゆえに基本レイヤ再構築パス150を減算器130の反転入力から非接続にした例示的なケースとして予め説明されている。この想定に従うと、本発明の別の実施の形態では、スイッチ158および152は、スイッチ152、158の実線によって示されるように、要素130、146、154、162の間の接続から解除され得る。
既に上述したように、モジュール102および104の各々は、それぞれの入力信号に対して時間予測を実行する。たとえば、低品質エンコーディングモジュール102においては、減算器114は、モジュール102の入力において受け取られたソースビデオ信号の低品質バージョンから予測モジュール126によって出力される低品質予測信号を減じる。その結果、減算器114は、低品質残差を出力する。変換モジュール116は、低品質残差信号の変換を実行する。この変換は、TCT、FFT、またはフェーブレット変換のような、空間分解を含み得る。変換された信号は、量子化モジュール118によって量子化される。量子化モジュール118は取り除くことも可能である。たとえば、変換モジュール116によって実行される変換は、本質的に整数の変換係数を生じ得る。変換モジュール116によって実行される変換は、たとえば、ブロックワイズな変換であって、変換残差信号は、減算器114によって出力される低品質残差信号の空間画像を表わす。この方法によって、変換モジュール116と量子化モジュール118の組み合わせが、不可逆または可逆的に変換ベースな方法によって、減算器114から出力される残差信号をエンコードする。変換され量子化された残差信号は、エントロピーコーディングモジュール128によってエントロピーコードされ、それによって、マルチプレクサ108によってスケーラブルなビットストリームに多重化される低品質基本レイヤ部分が生じることにな
る。
逆変換モジュール120は、逆変換、すなわち変換モジュール116の変換と逆の変換、を行なうことによって、量子化モジュール118の出力からの低品質残差信号を再構築する。このようにして、逆変換モジュール120の出力は、低品質残差信号の再構築されたバージョンを表わす。この残差信号は、下記に示すように、パス148を介して高品質エンコーディングモジュール104に導かれる。しかしながら、再構築されたバージョンは、低品質エンコーディングモジュール102の入力で受け取られる低品質ビデオ信号の再構築されたバージョンを取得するために加算器122によっても使用される。特に、加算器122は、再構築された残差信号を、予測モジュール126の出力、すなわち低品質予測信号に加算する。このようにして取得された低品質ビデオ信号の再構築されたバージョンは、不可逆圧縮に伴う悪い副作用を取り除くために、選択的なデブロッキングフィルタ124によってフィルタされ、予測モジュール126に送られる。予測モジュール126は、低品質入力信号の再構築されて上記のようにデブロックされたバージョンに対して時間的な予測を実行する。時間的な予測は、たとえば動き補償を含む。予測モジュール126は、このような方法によって低品質予測信号を計算し、当該信号を減算器114の反転入力および加算器122の別の入力へと出力する。
既に上述したように、高品質エンコーディングモジュール104は、実質的に、低品質エンコーディングモジュール102と同様に動作する。つまり、高品質ソースビデオ信号は減算器130に受け取られ、減算器130は残差パス148から導き出される信号に沿って、上記信号から予測モジュール142によって出力される予測信号を減ずる。これによって、減算器130は、モジュール102の要素106および118に関して上述したように、変換モジュール132によって変換されて量子化モジュール134によって量子化された高品質予測残差を出力する。エントロピーコーディングモジュール144は、マルチプレクサ108によってスケーラブルなビットストリームに多重化される高品質強化レイヤの部分を取得するために、変換されて量子化された予測残差をエントロピーコードする。
逆変換モジュール136は、変換され量子化された予測残差から、減算器130によって出力される予測残差の再構築されたバージョンを再構築し、当該バージョンを加算器138に出力する。加算器138は、高品質エンコーディングモジュール104への入力としての高品質ソースビデオ信号の再構築されたバージョンを取得するために、高品質予測信号の当該再構築されたバージョンに、減算器130の反転入力に入力される組み合わされた予測信号を加算する。要素126および124と同様に、デブロッキングフィルタ140は、再構築された高品質ビデオ信号に対するデブロッキングフィルタリングを実行し、予測モジュール142はデブロッキングフィルタ140の出力結果に時間的な予測を実行する。繰り返しになるが、デブロッキングフィルタは選択的なものであって、モジュール104から取り除くことができる。予測モジュール142の出力は、高品質予測信号を表わす。加算器146では、以下に述べるように、高品質予測信号が、パス148の経路を介して低品質エンコーディングモジュール102の予測残差から得られる予測によってさらに改良される。加算器146の出力は、組み合わされた予測信号を、減算器130の反転入力と加算器138の別の入力とに提供する。
逆変換モジュール120による出力としてパス148において再構築された低品質予測残差信号を使用できるように、低品質予測残差信号の低品質レベルが高品質レベルへと送られる。つまり、低品質レイヤのより低いピクセル値解像度が高品質レイヤのピクセル値解像度に合わせられる。さらに、図1の実施の形態に従うと、空間解像度も、高品質レイヤの空間解像度に適合するように増加させられる。それによって、副作用低減フィルタリングのような選択フィルタ146によって、いくつかの選択フィルタリングの後に、低品
質予測残差信号が、品質低減モジュール106で実行されるトーンマッピングおよびダウンサンプリングを逆にするために、逆トーンマッピングおよびアップサンプリング処理がなされる。この品質適合においては、品質が適合された予測残差信号が加算器146に適用される。このように、より小さな高品質予測残差信号が要素132、134、144の手段によってコードされ得るように、予測モジュールによる出力としての予測信号と、品質が適合された予測残差信号との合計が、高品質エンコーディングモジュール144への元の入力としての高品質ソースビデオ信号の改良された予測結果となる。そして、これによって、スケーラブルなビデオビットストリーム112のより良い歪み率の性能が実現される。
モジュール155における逆トーンマッピングおよびアップサンプリングをより詳細に説明する前に、高品質エンコーディングモジュール104の動作のモードについて簡単に説明する。ここでは、点線で示すように、スイッチ158および152が別の位置にある場合についてである。図に示すように、レイヤ間モードにおいては、低品質レイヤからの品質が適合された予測残差は使用されない。代わりに、0が加算器146の別の入力に適用される。さらに、スイッチ158は、パス150を減算器130の反転入力に接続する。この方法によって、再構築された低品質ビデオ信号の品質が適合されたバージョンは、予測信号として、減算器130の反転入力に適用される。パス148と同様に、選択フィルタ160は、選択的に、低品質の再構築された信号をフィルタし、逆マッピングおよびアップサンプリングモジュール162はピクセル値を逆にマップし選択的にフィルタされ再構築された低品質ビデオ信号をアップサンプルする。
上記の説明から明らかになったように、パス148および150は同様の動作を行なう。以下に、モジュール154および162の動作の違いについて説明する。上記の目的を達成するために、以下の説明では、高品質エンコーディングモジュール104が、スイッチ152および158のいくつかのスイッチングモード、それらのうちの2つのモードが説明されている、の間のブロックワイズな切り換えをできるようになる。より正確には、ビデオ素材200の一部を示す図2が参照される。図に示すように、ビデオ素材は一連のピクチャ202を備える。各ピクチャは、共通して複数のブロック204に分割される。特に、図2においては、各ピクチャ202は、4×3ブロック204の配列に構成されているように示されている。しかしながら、図2に例示されたブロックワイズな構成は、単に例として挙げられたものであって、他のブロックワイズな再分割も可能である。
ブロック204は、低品質エンコーディングモジュール102がレイヤ内およびレイヤ間予測を切り換えられるユニットを示す。特に、ブロック204は、マクロブロックに対応し得る。マクロブロックは、これらのマクロブロックのどれが予測モジュール126によって時間的に予測されるべきであるか、およびどれが時間的に予測することなくコードされるべきであるかを決定するために、低品質エンコーディングモジュール102によって使用されるものである。しかし、ブロック204は、マクロブロックサイズ以外のブロックサイズにも対応し得る。
低品質エンコーディングモジュール102と高品質エンコーディングモジュール104の効果的なマクロブロックのサイズは、両者のレイヤの間の例示的な空間解像度に基づいて、互いに異なり得る。より正確には、高品質エンコーディングモジュール104と低品質エンコーディングモジュール102の両方において、マクロブロックサイズは16×16のサンプルに設定され得る。高品質エンコーディングモジュール104のマクロブロックは、例示的な空間解像度の違いが原因で、低品質エンコーディングモジュール102のマクロブロックよりも小さなそれぞれのピクチャの部分を想定し得る。さらに、高品質レイヤおよび低品質レイヤの間の空間解像度比率に従って、低品質レイヤのマクロブロックの境界は高品質レイヤのマクロブロックの境界に一致することが可能である。
さらに、図2は、ピクチャ202を、第1のピクチャの小さな領域内のブロック206に再分割する例を示す。ブロック206は、高品質エンコーディング手段がさまざまなレイヤ間の予測モードの間で切り換え可能であるユニットを示す。ブロック205は、マクロブロックに対応し得る。マクロブロックは、たとえば、マクロブロックのうちのどれが予測モジュール142によって時間的に予測されるべきであるか、およびどれが時間予測なしでコードされるべきであるかを決定するための高品質エンコーディングモジュール102で使用される。たとえば、図2は、ブロック204およびブロック206がそれぞれマクロブロックサイズである場合を示し得る。この場合、図2は、マクロブロックサイズが与えられた低品質レイヤの2倍の空間解像度である高品質レイヤの空間解像度の例を示す。サンプルはモジュール102および104において同じである。図に示すように、各ブロック204はさらに4つのサブブロック206に再分割される。ブロック204への再分割が低品質エンコーディングモジュール102によるレイヤ間およびレイヤ内予測の切換能力を示し、ブロック206への再分割が高品質エンコーディングモジュール104のスイッチ152および158の操作能力を示すものとした場合、以下の説明から、高品質エンコーディングモジュール104が、ブロック204のユニットにおいて実行される低品質エンコーディングモジュール102のレイヤ内/レイヤ間予測に基づいて、スイッチ152および158を操作するように構成される。これによって、低品質エンコーディングモジュール102によってレイヤ間予測されたまたは時間的に予測されたブロック204をオーバーレイするこれらのブロック206に関して、パス148が回避されて、代わりにパス150が使用される、またはパス148および150のいずれもが使用されない。他のすべてのブロック206では、高品質エンコーディングモジュール104が自由に、例示的には固定で、レイヤ間の予測のために残差パス148を使用する。以下の説明から明確なものとなるが、この方法によって、より高い品質レイヤをデコードする際であっても、ビデオ素材のピクチャの各部分のために、最大でも1つだけの時間的予測がデコーダサイドで必要なものとなる。
上記の説明から明らかになったように、モジュール154および162は逆トーンマッピングを実行する。しかし、上記説明から明らかになったように、モジュール162に入力される入力信号は、低品質ビデオ信号自体の再構築を示す。それらのものとは対称的に、モジュール154に入力される入力信号は、低品質予測残差の再構築されたバージョンを単に表わすものである。モジュール154および162が厳密に同じものである場合、非線形トーンマッピングが利用される場合には、低品質予測信号パス148によって提供される予測の改良が悪化し得る。
このことを説明するために、図3が参照される。図3は、低品質レイヤが8ビットのサンプル値、すなわち輝度および/または色度値、を用いて動作する場合の例を示す。8ビット値は、例示的に300として示される。さらに、図3では、高品質レイヤが10ビットサンプル値302に基づいて動作することが想定される。8ビット値300から10ビット値302までをポイントする矢印304は、モジュール154によって実行される逆マッピングを示し、上記改良のような修正された方法でモジュール162に内在するものである。もちろん、8ビット値300のビットを、10ビット値302の最も重要な8つのビットにコピーすることも可能である。このことは、8ビット深さから10ビット深さへと線形的にマッピングすることに対応する。しかし、マッピング機能は、線形的なマッピング特性に限定されるものではない。306において、図3は、例示的に、8ビット値から10ビット値への非線形なマッピングを示すグラフを示す。この例に従う特有のマッピングカーブは308によって示される。図に示すように、カーブ308の傾きは、例示的に8ビット値が高くなるにつれて低くなり、8ビット値が小さくなるにつれて高くなる。さらに、8ビット値に関するグラフ306のx軸に沿って、図3は予測モジュール126によって出力される予測信号の例示的な8ビット値を示す矢印310を示す。これによ
って、矢印312は、逆変換モジュール120による出力としての再構築された予測残差の8ビット値を示すために示される。図に示すように、加算器122の手段によって値310および312の両者を合計することは、モジュール162によって正確に10ビット値302に非線形にマッピングする機能308によってマップされる比較的高い8ビット値をもたらす。しかし、モジュール154が、直接的に小さな8ビットの予測残差値312を使用し、この値をカーブ308に適用する場合、低品質予測信号値310が示す(0で始まるとき)カーブ308のエリアの傾きよりも高い非常に小さな8ビット値(または0)のためのマッピング機能308の傾きが原因で、結果として生じた10ビット残差値の過度な増大がもたらされ得ることがわかる。しかし、デコーダサイドで低品質レイヤの時間的な予測を実行する必要があるために、モジュール154は、8ビット残差値312をマッピングカーブ308の正しい位置へとシフトさせるために低品質予測値310を使用すべきではない。むしろ、両方、すなわち低品質レイヤおよび高品質レイヤ、の時間的予測を実行する必要性は避けられるべきである。それゆえに、図1に示されるように、高品質エンコーディングモジュール104の逆マッピングおよびアップサンプリングモジュール154には、逆変換モジュール136の出力としての高品質残差信号の再構築されたバージョンに選択的に追加されるべき予測モジュール152によって出力される高品質予測信号が与えられる。モジュール154は、失われた低品質予測信号値310を推定し、8ビット予測残差値300を加算器146へと出力される10ビットの予測残差値へと正確に逆マップするために、高品質レイヤの当該情報を使用する。逆マッピングおよびアップサンプリングモジュール154によって使用される「訂正」/「推定」のための詳細および異なる可能性が以下でより詳細に説明されるであろう。
しかし、逆マッピングおよび逆アップサンプリングモジュール154の動作のモードについての詳細な説明を開始する前に、図4を参照する。図4は、図1に従う高品質および低品質レイヤの空間解像度の違いに関する例を示すものである。図に示すように、図4では、モジュール106によって実行されるダウンサンプリングが、列方向のピクセルの半分の個数と行方向のピクセルの半分の個数とを有する低品質基本レイヤ画像をもたらすことが想定される。特に、図4は、実線によって低品質レイヤのピクセルを示し、点線によって高品質レイヤに従うピクセルへのピクチャ202の再分割を示す。図に示すように、各低品質ピクセルはきっちりと4つの、すなわち2×2の配列の、高品質ピクセルに重ね合わさる。たとえば、ピクセルAは高品質のピクセルa1からa4に重ね合わさる。もちろん、図4の例は単なる説明であって、高品質および低品質レイヤの間の他の空間解像度の比率も可能である。上述したように異方性の解像度の比率と同様に、空間解像度の間の差は含まれない。図4は、以下において、現在の低品質予測残差値310のための失われた低品質予測信号310の代わりを導き出すモジュール154の機能を説明するために使用されるだろう。
特に、図1のビデオエンコーダの機能について大まかに説明し終えたので、その機能について、以下で詳細に説明する。上述したように、ビット深さの、選択的に、空間解像度の、品質低減のスケーラビリティーを達成するために、モジュールはまず初めに入力110の高品質入力ビデオ信号を低品質エンコーディングモジュール102に入力される基本品質ビデオ信号にダウンコンバートする。ダウンコンバージョンのこのような処理は、以下のものに限定されるわけではないが、サンプル値を丸めることを含むトーンマッピングスキームを利用するシングルサンプルのビット深さの低減を含み得る。さらに、ダウンコンバージョンは、RGBからYCpCrへの変換のような入力信号のフィルタリングや、たとえばHDTBからSDTBへの解像度の変換のような入力信号の区分解像度の低減や、上述したダウンコンバージョンの方法の組み合わせを含み得る。モジュール106は、連続した各々のピクチャの各々のブロック204に対して、異なるダウンコンバージョンスキームを用いることもできるし、すべてのピクチャに同じスキームを用いることもできる。
次のステップでは、モジュール102に入力される基本品質信号が、たとえばH.264/AVCのような、スケーラブルでないビデオコーディングスキームを利用することによってコードされる。このエンコーディング処理から得られる圧縮されたビデオ信号は、基本品質画像を形成し、モジュール102によってマルチプレクサ108へと出力される。この基本品質画像によって、レガシーなビデオデコーダによるデコードが可能になる。高品質ソース信号のコーディングに関しては、基本品質画像に既に送られた情報が、モジュール104によって出力された高品質強化レイヤ信号が入力110で入力された元の高品質入力シーケンスに対するコードされた予測の違いのみを格納するように、高品質入力信号の予測を得るために使用される。図1の例においては、H.264/AVCの場合における各々のマクロブロックのように、各々のピクチャ202の各々のブロック206に関して、レイヤ間の予測メカニズムが当該ブロック206のために使用されるか否かを、状況に順応しながら選択することが可能である。使用されないレイヤ間の予測メカニズムは、スイッチ152が点線で示される位置にあって、スイッチ158が実線で示される位置にある場合に対応するものである。そのように、高品質エンコーディングモジュール104と低品質エンコーディングモジュール102とが完全に互いに独立して動作するための同時放送のような動作への交替は、レイヤ間予測メカニズムが失敗するピクチャの領域では常に起こり得ることである。ここでは、基本品質画像からのレイヤ間の予測が実行される方法が詳細に説明される。基本および高品質レイヤに関して、2つの区別できる動き補償予測ループが採用される。
特に以下の詳細な説明では、シングルループのデコーディングの制約下での基本から高品質画像への予測処理について説明する。シングルループのデコーディングは、高品質画像のデコーディングに関し、対応する基本品質画像を完全にデコードする必要がないということを明白にする。特に、動き補償予測の非常に複雑な動作は、高品質ピクチャの使用のためにのみ実行される必要がある。基本品質ピクチャサンプルを使用するほとんど複雑ではないレイヤ内予測処理の実行は、対応する高品質ピクチャをデコードするためにも要求され得る。
まず、「レイヤ内コードされた」基本品質ピクチャブロック204の場合、すなわち動き補償予測を使用することなくエンコードされたブロック、について説明する。より正確には、これらのブロックは低品質エンコーディングモジュール102における動き補償予測を使用することによってエンコードされたブロック204に重ね合わさることについて検討される。これらのブロック206に関しては、デコードされた基本品質ピクチャサンプルが、すなわち加算器122の出力として提供される再構築された基本品質ビデオシグナルが、高品質エンコーディングモジュール104への入力としての対応する高品質ピクチャサンプルの予測を取得するために直接使用される。予測処理は、モジュール162および160を含み、逆マッピングおよびアップサンプリングモジュール162の動作のモードは以下の2つのステップを含み得る。
1.たとえば8ビットから10ビットのように、より高いビット深度への基本品質サンプル値の逆トーンマッピング。
2.このケースにおいて想定されているように、基本および高品質ピクチャが異なる空間解像度でコードされる場合における、たとえばCIFから4CIFへの、低解像度基本品質ピクチャブロック204の最も高い空間解像度へのアップサンプリング。同じ空間解像度が使用される場合、ステップ2は省略され得るし、または、代替的に、その機能が「非動作」とみなされ得る。
これらの2つの動作またはステップが実行される順序は、固定であってもよいし変更可
能であってもよい。変更可能な場合は、高品質エンコーディングモジュール104は、サイド情報として、利用される当該順序をデコーダに送信するように構成されてもよい。すなわち、指示が、それぞれのブロック204に関して使用される当該順序を示す、高品質強化レイヤデータストリームに含まれるサイド情報に挿入される。
逆トーンマッピングの処理は、特に、さまざまな方法で実行される。たとえば、ビット深度に関するスケーラビリティーに関しては、モジュール162の入力での基本品質サンプルに2M-Nが掛けられ得る。ここで、Mは高品質信号のビット深度であり、Nは線形マッピングに対応する基本品質シグナルのビット深度である。代替的に、このことは、min(2M-N×2M−1)に従った、モジュール162の入力での基本品質サンプル値のスケーリングおよびクリッピングの実行とみなされ得る。
代替的に、以下のマッピングメカニズムの1つは予測処理のために利用される。たとえば、区分的な線形マッピングは互換点の任意の個数が指定される場合に利用され得る。たとえば、値xと2つの与えられた補完点(xn,yn)と(xn+1,yn+1)とを有する基本品質サンプルに関して、対応する予測サンプルyは、以下の式に従って、モジュール162によって取得される。
Figure 0005295233
この線形の補完は、xn+1−xnが2のべき乗に限られている場合においては、分割動作の変わりにビットシフトのみを用いることによって、複雑でない計算によって実行され得る。
他の取り得るマッピングメカニズムは、参照テーブルマッピングを表わす。そこでは、基本品質サンプル値の手段によって、テーブルの参照が参照テーブルにて実行される。そこでは、各々の取り得る基本品質サンプリング値に関して、対応する予測サンプル値が指定される。参照テーブルは、サイド情報として、デコーダ側に提供され、またはデフォルトでデコーダに知られ得る。
さらに、所定のオフセットへの対応が利用され得る。この代替案に従うと、より高いビット深度を有する対応する高品質予測サンプルyを得るために、たとえば、それぞれに、以下の式の1つに従って、モジュール162が基本品質サンプルxに所定のファクタである2M-N-Kを掛け、その後、所定のオフセットである2M-1−2M-1-Kが加算される。
Figure 0005295233
この方法によって、低品質のダイナミックレンジ[0;2N−1]が以下のことに従う方法で、第2のダイナミックレンジ[0;2M−1]にマップされる。すなわち、xのアップされた値は、Kによって決定される拡張内のyの取り得るダイナミックレンジ[0;2M−1]を考慮した集中型の方法によって分配される。Kの値は、整数値または実数値を取り得る。Kの値は、たとえば、品質的にスケーラブルなデータストリームの中のサイ
ド情報としてデコーダへと送られ得る。これによってデコーダではいくつかの予測手段が、後述するように、予測モジュール134と同じ方法で動作する。MおよびNの定義を考慮して、上記説明について述べる。丸め動作は、整数値化されたyの値を得るために使用され得る。
他の可能性は可変のオフセットに対応する。たとえば以下の式の1つに従って、基本品質サンプルxには所定のファクタが掛けられ、その後、可変のオフセットが加算される。
Figure 0005295233
この方法によって、低品質ダイナミックレンジが、以下の方法に基づいて第2のダイナミックレンジへとマップされる。すなわち、xのマップされた値は、yの取り得るダイナミックレンジの一部に分配される。その拡張は、Kによって決定される。より低い境界に関するそのオフセットは、Dによって決定される。Dは、整数または実数であり得る。結果であるyは、高いビット深度の予測信号のピクチャサンプル値を表わす。KおよびDの値は、たとえば品質的にスケーラブルなデータストリームの中でサイド情報としてデコーダへと送信され得る。再度、丸め動作は、整数値化されたyの値を得るために利用され得る。繰返しはっきりと述べていなくとも、後者は、ビット深度のマッピングに関して、本出願で提供されている他の例にも当てはまるものである。
さらに別の可能性は重ね合わせに対応する。たとえば以下の式の1つに従って、高いビット深度の予測サンプルyは、対応する基本品質サンプルxから取得される。なお、floor(a)は、aを最も近い整数に丸めるものである。
Figure 0005295233
上述した可能性は組み合わせ得る。たとえば、重ね合わせと所定のオフセットとに対応することが利用され得る。たとえば、以下の式の1つに従って、高いビット深度の予測サンプルyが取得される。なお、floor(a)は、aを最も近い整数に丸めるものである。
Figure 0005295233
Kの値は、デコーダへのサイド情報として指定され得る。
同様に、重ね合わせと可変のオフセットとに対応することが利用され得る。以下の式に従って、高いビット深度の予測サンプルyが取得される。なお、floor(a)は、aを最も近い整数に丸めるものである。
Figure 0005295233
DおよびKの値は、デコーダへのサイド情報として指定され得る。
さらに、確率密度関数のように、統計が異なり得るということに配慮するために、基本品質信号の輝度および色度の成分のための異なるマッピングメカニズムを指定することが可能である。また、領域が必ずしも連続している必要がないピクチャの異なる領域のための異なるマッピングメカニズムを指定することも可能である。さらに、上述したマッピングメカニズムの1つを採用した後に、擬似ランダムノイズ信号(「ギザリング信号」)がエンコーダおよびデコーダの予測モジュールのそれぞれで実行される予測処理においての高いビット深度予測信号に追加されることが指定されてもよい。この信号は、高いビット深度の画像をデコードすることが可能になるように、デコーダにおいて正確に知られている。そのため、擬似ランダム処理の、擬似ランダム生成器の初期値や、分散や形状(たとえば、通常のまたは均一の分布)のようなあるパラメータが、サイド情報として送信される必要があり得る。そのようなサイド情報がスケーラブルなビットストリームの中で送信されない場合、たとえばレンジ[0,2M-N−1]または[0,2M-N-K−1]それぞれの擬似ランダム値の均一な分布のようにデフォルトな値が、選択されたマッピングメカニズムに従って使用され得る。
もちろん、完全なシーケンスのための同様のメカニズムの使用と、各々のピクチャの各々のブロックのための異なる逆トーンマッピングメカニズムの使用とを指定することもできる。
どのようなケースにおいても、マッピングカーブは、上記の可能性によって定義されたものによって制限されるものではないということが強調される。特に、マッピングカーブは、線形的なものにも部分的に線形的なものにも限定されるものではない。
モジュール162における基本品質ピクチャブロックをより高い空間解像度へとアップサンプリングするための処理に関しては、サンプル補完処理が、空間的なスケーラビリティーの場合のためのH.264/AVCビデオコーディング規格のスケーラブルなビデオコーディング拡張に記載されている1つに従い得る。直接的な解決方法としては、低解像度ピクセルサンプルA(図4を参照)のための逆マップされた10ビット値が、対応する4つの共通に配置された高解像度ピクセル位置A1からA4へと単にコピーされ得る。同様のことが上記の切り換えられる2つのステップの場合における8ビット値にも適用されるだろう。
次に、動き補償予測を用いてエンコードされる、「レイヤ間コードされた」基本品質ピクチャブロック204、すなわちブロック、の場合について考える。より正確には、それらのブロック206の場合における高品質エンコーディングモジュール104の機能について説明する。ブロック206は、低品質エンコーディングモジュール102内で動き補償予測を使用することによって、エンコードされるブロック204に重ね合わさる。上述したシングルループデコーディングの制約が原因で、加算器122によって出力されるデコードされた基本品質ピクチャサンプルは、高品質画像をデコードするためにデコーダでは利用できない。それゆえに、この場合には、レイヤ間の予測が、減算器114による出力としての基本品質残差データ、または基本品質残差の逆変換モジュール120による出力としての再構築されたバージョンを利用することによって実行される。このため、この場合には、レイヤ間の予測がレイヤ間の残差予測としてみなされ得る。
完全性だけの目的のためには、たとえば、予測モジュール126によって低品質予測信号を得るために使用されるようなモーションベクトルおよび参照ピクチャインデックスを含むモーションデータは、この情報がデコーダ側で予測モジュール126によって実行される動き予測をエミュレートすることに利用可能となるように、低品質基本レイヤに含まれる。もちろん、同じものが予測モジュール142にも適用される。予測モジュール142も、時間的な予測を実行する際における、モーションベクトルや参照ピクチャインデックスを含むモーションデータを生成する。モーションデータは、モジュール104によって出力される高品質強化レイヤ信号に含まれる。この点に関し、基本品質モーションデータは、レイヤ間の動き予測の予測残差のみが高品質強化レイヤにエンコードされ得るように、高品質動きデータのための予測として利用され得る。
図3を参照しながら説明したように、たとえば、ビットシフト操作を介するように、線形的な逆トーンマッピング動作の普通のケースのためには、逆トーンマッピングは、逆マッピングおよびアップサンプリングモジュール154に入力される残差データに直接適用することができない。なぜなら、実際に再構築された低いビット深度のサンプル値310は、対応する高いビット深度のサンプル値の予測を得られるように、知られている必要があるからである。しかし、残差312は、単なる差分信号であって、それゆえに、再構築された基本品質サンプル310の値が、高品質予測信号と、低品質残差データと、選択的に高品質残差シグナルとを用いることによって推定されるのに従って、追加的な方法がモジュール162に関するモジュール154内において採用される。特に、品質的に適合された残差信号は、以下の方法の1つに従って取得される。
1.ここで想定される空間的なスケーラビリティーの場合には、各々の基本品質残差サンプルが、1つの高品質残差サンプルよりも多くに対応する。この目的を達成するために、図4が参照される。ピクセルAのための基本品質残差サンプルは、空間的に、4つの高品質残差サンプル、すなわちa1からa4、に対応する。それゆえに、第1のステップにおいては、各々の基本品質残差サンプルAに関して、高品質画像値に対応するシングルが決定される。最も単純なケースにおいては、特定の基本品質残差サンプルAに対応する高品質動き補償予測信号サンプル値a1からa4だけが、平均値、メジアン値、たとえば代表値としての、左上のサンプル値のような予測信号サンプル値a1からa4のセットから取得される他の独特の値を使用することが考えられる。同様のことが、予測信号サンプル値だけの代わりに、予測モジュール142による出力としての高品質予測信号サンプル値と逆変換モジュール136による出力としての高品質残差サンプルとの合計を用いる際にも適用される。同様の空間解像度が基本および高品質ピクチャの両者に利用される場合、代表値は、単なる共通に配置された高品質予測サンプル値、または共通に配置された高品質残差と予測サンプル値との合計である。
このように、取得される代表値は、第1の取り得る方法に従ってトーンマッピングを訂正するのに利用される。理解を容易にするために、図5Aを参照する。図5Aは、品質適合の第1の取り得る方法を内包するモジュール154の機能を示す。今説明された代表値の選択は、参照符号500を用いて図5Aに示される。今説明したように、代表値の選択は、高品質予測信号502、または高品質予測信号502と高品質残差信号504の両者を含み得る。ここでは、「()」によって示される高品質残差信号の選択性と、「+」によって示される組み合わせとを伴う。高品質残差および予測信号を表わす情報系502および504のそれぞれに含まれる圧着された部分506は、これらの信号502および504内の空間的な位置または空間的な領域を示す。部分506は、空間的に、基本品質残差信号510内のピクセル508に対応し、逆マッピングおよびアップサンプリングモジュール154によって処理される必要がある。
ブロック500で選択された代表値は、シングルループデコーディングの制約が原因で利用できない再構築された低いビット深度のサンプル値の推定値を得るために利用される。この推定値は、同様のトーンマッピング動作、または、高品質画像値の基本品質エンコーディングのための高品質ソースシーケンスのダウンコンバージョン段階中、すなわち品質低減モジュール106内で、使用されたものに非常に似通ったものを利用することによって取得される。より正確には、ブロック500内での代表値の選択の後に、トーンマッピング512が、10ビット値のような取得された代表値を、たとえば8ビットのような、より低いビット深度を有する値へと変換するために実行される。次に、時間がかかるビット深度推定の値がブロック512によって出力され、モジュール154に入力される低いビット深度の残差サンプル値が低い解像度、低いビット深度の再構築されたサンプル値の改良された推定値を得るために追加的な動作514によって合計される。この改良された推定値は、ブロック516を用いてブロック516内で逆トーンマップされる。ここで想定されているような空間的なスケーラビリティーの場合においては、低い解像度、低いビット深度の再構築された信号の改良された推定値をアップサンプリングする。アップサンプリング処理は、上述したようにレイヤ内でコードされた基本品質ピクチャブロックのために使用される処理に従い得る。最後に、逆トーンマップと、もしかしたら、改良されアップサンプルされた推定値とブロック500にて選択されたような高品質代表値との間の差分が計算ブロック518にて決定される。結果である差分は、モジュール154によって加算器146に出力される、逆残差トーンマップされアップサンプルされた基本品質残差サンプルを表わす。
2.品質的に適合された残差信号を取得するための第2の方法を、図5Bを参照して説明する。この場合には、空間的に、ベース品質残差信号510の低品質サンプル値508、または、高品質動き補償予測サンプル502のサンプル値506と高品質残差信号504のサンプル値506とのサンプルワイズな合計に対応する高品質動き補償予測信号502内のサンプル値506が、同様のトーンマッピング動作、または高い空間解像度、低いビット深度画像を生じる基本品質エンコーディングのための高品質ソースシーケンスのダウンコンバーティング段階中に使用される非常に似通った動作を使用することによって、サンプルワイズにトーンマップされる520。異なる空間解像度が基本および高品質ピクチャに使用されるときに備えて、このケースでは以下のことが例示的に想定される。モジュール154に入力される基本品質残差サンプル508は高い空間解像度、低いビット深度画像を生じながら、高品質空間解像度にアップサンプルされる522。さもなければ、すなわち基本および高品質レイヤ内の空間解像度が同じである場合、元の基本品質残差サンプル508は既に高品質解像度となっており、ブロック522を用いることなく直接利用される。これらの2つの高い空間解像度、低いビット深度信号は合計され524、その後、高い空間解像度、高いビット深度画像を再び生じながら、上述したようにレイヤ内でコードされた基本品質ピクチャブロックのために使用される処理に従って、逆トーンマップされる526。高品質動き補償予測信号サンプル値または、()によって示される選択的な場合において、高品質動き補償予測信号サンプル値と、高品質残差信号サンプルとの合計のそれぞれと逆トーンマップされた高い空間解像度、高いビット深度信号の間の差分が減算器528において決定される。結果として生じる逆トーンマップされた高い空間解像度、高いビット深度の信号は、モジュール154によって加算器146へと出力される「逆残差トーンマップされアップサンプルされた」基本品質残差信号を表わす。
これら2つのレイヤ間残差予測スキームのどちらが使用されるかは、固定であってもよいし変更可能であってもよい。変更可能な場合には、情報が、デコーダ側に図5Aおよび5Bの選択肢のうちのどちらが特定のブロック206のために使用されたかを示す高品質強化レイヤ信号に含まれるサイド情報に挿入され得る。
図5Aおよび5Bの両選択肢においては、それぞれ、まず高いビット深度から低いビッ
ト深度のドメインまでの前のトーンマッピング動作を利用し、その後、基本品質残差と低いビット深度のドメインとを加算し、続いて高いビット深度のドメインへと戻る逆トーンマッピング動作を行なう、間接的な方法が使用された。この間接的な方法は、他の実施の形態に従うと、回避することも可能である。たとえば、「逆」トーンマッピングの特性カーブ308は、第1のテーラ近似を用いることによって線形化され得る。この場合、モジュール154に入力される基本品質残差サンプル値は、取り得るアップサンプリング動作の前に、ブロック500によって選択されることによって導き出された対応の高品質画像値によって決まるファクタによって、線形的に測定され得る。代替的に、空間的なスケーラビリティーに関しては、アップサンプルされた他の元の基本品質残差サンプル値が、対応する高品質動き補償された予測信号サンプル値、または、高品質動き補償された予測信号サンプル値と高品質残差信号サンプル値との合計によって決まる要因によって、線形的に測定される。換言すれば、ビット深度の適用は、加算器168からの高品質信号、すなわち高品質予測信号、または当該高品質予測信号と高品質予測残差との組み合わせ、に従って残差値の測定と組み合わされる。
上述したように、逆トーンマップされた、本実施例に従えば、アップサンプルされた、モジュール154によって出力される基本品質残差サンプル値は、予測モジュール142によって出力される高品質予測信号を改良するために利用される。
レイヤ間の動き予測に関しては、予測モジュール142において高品質画像のコーディングのために利用されるH.264/AVCにおけるマクロブロックの領域確保、参照ピクチャインデックス、モーションベクトルのような、動きパラメータが、コーディング効率の向上を達成するために、モジュール126において基本品質画像の対応するパラメータを利用することによって、予測との差分として送信され得る。レイヤ間の動き予測スキームは、サンプルのビット深度の観点からはスケーラビリティーとは独立したものであって、それゆえに、H.264/AVCビデオコーディングの規格のスケーラブルなビデオコーディングの拡張に記述されているメカニズムが利用され得る。
他の実施の形態に従うと、高品質エンコーディングモジュール104は、シングルループのデコーディングの制約には縛られない。シングルループのデコーディングでの制約がない場合、すべての再構築された基本品質サンプルが高品質画像のデコーディングのために利用可能であって、ビデオエンコーダ100は、レイヤ間の予測パス150を含む予測メカニズム、または、レイヤ間の予測パス148を含む予測メカニズムのいずれかを使用することを自由に選択し得る。両予測メカニズムに関する決定は、出力112での結果として生じるスケーラブルなビットストリームの最も良い歪み率の性能が発揮できるようになされ得る。しかしながら、たとえば、要求されたエンコーディングの複雑さを低減させるような、他の決定基準も利用可能である。
ビデオエンコーダについての実施の形態を説明したので、以下では、図6を参照しながらビデオデコーダの実施の形態を説明する。図6のビデオデコーダ600は、デマルチプレクサ602と、基本品質および高品質の残差信号を再構築するためのエントロピーデコーディングおよび逆変換ユニット604と、基本品質再構築ユニット606と、高品質再構築ユニット608とを備える。そして、高品質再構築ユニット608は、時間的予測ユニット610と、再構築ユニット612とを備える。
図6のデコーダ600は、図1のビデオエンコーダ100の出力112で出力されるスケーラブルなビットストリームをデコードすることができる。特に、ビデオデコーダ600は、スケーラブルなビットストリームを受信するための入力614を備え、当該スケーラブルなビットストリームから基本品質シーケンスと高品質シーケンスの両方を抽出することができる。この目的を達成するために、図6のデコーダ600は、デコードされた基
本品質シーケンスのための出力616と、デコードされた高品質シーケンスのための出力618とを備える。デコーダ600は、高品質シーケンスと低品質シーケンスの両方を抽出できるものであるが、他の実施の形態に従うと、デコーダ600は出力616を備えないことも可能である。
デマルチプレクサ602の入力は、入力614に接続される。マルチプレクサ602は2つの出力を備え、一方は高品質強化レイヤ信号のためのものであって、他方は低品質基本レイヤ信号のためのものである。両方の出力は、残差信号再構築ユニット604のそれぞれの入力に接続される。内部では、残差信号再構築ユニット604は、それぞれに逆変換ユニット624および626が続くエントロピーデコーディングユニット620および622のそれぞれの2つのシリーズ接続を備える。各シリーズ接続は、デマルチプレクサ602の出力の他方に接続される。特に、残差信号再構築ユニット604は、2つの出力を備える。ここでは、エントロピーデコーディングユニット620と逆変換ユニット624がこれらの出力の1つとデマルチプレクサ602の高品質強化レイヤの出力との間に接続される。一方、エントロピーデコーディングユニット622と逆変換ユニット626とは、他の出力とデマルチプレクサ602の低品質基本レイヤの出力との間に接続される。
エントロピーデコーディングユニット620は、エントロピーコーディングユニット144によって実行されるエントロピーコーディングの逆の動作を行なう。エントロピーデコーディングユニット622は、エントロピーコーディングユニット128によって実行されるエントロピーコーディングの逆の動作を行なう。逆変換ユニット624は、その動作に関しては、逆変換ユニット136と同様である。逆変換ユニット626は逆変換ユニット120に対応する。このように、逆変換ユニット624の出力においては、逆変換ユニット136による出力として再構築された高品質残差信号が利用可能なものとなる。逆変換ユニット262は、低品質エンコーディングモジュール102内の逆変換ユニット120の場合と同様に、低品質残差信号の再構築されたバージョンを出力する。
低品質再構築ユニット606は、低品質エンコードモジュール102の要素122から126に対応する要素を含む。特に、低品質再構築ユニット606は、加算器628と、予測ユニット630と、デブロッキングユニット632と、要素122、126、124のそれぞれに対応する要素とを備える。特に、加算器628とデブロッキングユニット632とは上述した順序で、逆変換ユニット626の出力と出力616との間に連続的に結合される。一方、予測ユニット630は、デブロッキングフィルタ632の出力と加算器628の別の入力との間に接続される。
高品質再構築ユニット608内では、再構築ユニット612が、高品質エンコーディングモジュール104の要素146、138、140に対応する要素を含む。同様に、予測ユニット610は、要素142、164、148から162に対応する要素を含む。より正確には、再構築ユニット612は、加算器634と他の加算器636とデブロッキングフィルタ638とを備える。ここでは、加算器634とデブロッキングフィルタ638とが、上述した順序で、逆変換モジュール624の出力と出力618との間に連続的に結合される。予測ユニット610は、予測ユニット640と、加算器642と、第1のレイヤ間の予測パス644と、第2のレイヤ間の予測パス646と、3つのスイッチ648、650、652とを備える。パス644および646の各々においては、選択フィルタ654および656のシリーズ接続のそれぞれと逆マッピングおよびアップサンプリングモジュール658および660とが接続される。機能性と相互接続との観点から、要素640から652は、図1の要素148から164および142に対応する。追加的なスイッチ648は、図1の点線と同様に、モジュール658および154のそれぞれによって実行される逆マッピングを訂正するために、逆変換ユニット624および136のそれぞれの出力の寄与率の選択性を示す。特に、スイッチ148は、エンコーダ100が、高品質予
測信号が高品質残差との組み合わせに利用されるか否か、または高品質予測信号がそれだけで利用されるか否かを決定することができるということを明らかにする。この場合、スイッチ648は、加算器642の別の入力に0を適用する。この場合、高品質強化レイヤ信号内のそれぞれのサイド情報は、スイッチ648をどのように操作するかを決定するために、高品質再構築ユニット608によって利用され得る。サイド情報は、スケーラブルなビットストリームを介して、高品質エンコーディングモジュール104によって提供されるだろう。
完全を期するために、スイッチ648は、加算器642の他の入力と逆変換ユニット624の出力との間に接続される。当該パス646は、加算器628の出力から、スイッチ652を介して、加算器634の他の入力まで伸長される。第1のレイヤ間の予測パス644は、逆変換ユニット626の出力から、スイッチ650を介して、加算器636の他の入力まで伸長される。さらに、予測ユニット640は、デブロッキングフィルタ638の出力と加算器636の他の入力との間に接続される。加算器636の出力は、スイッチ652を介して、加算器634の他の入力に接続される。
高品質ビデオ信号の再構築においては、デコーダ600は以下の方法で動作する。まず第1に、入力614におけるスケーラブルなビットストリームが、一方では高品質強化レイヤを得るために、他方では低品質基本レイヤを得るために、マルチプレクサ602によって逆多重化される。ユニット620および622のそれぞれによるエントロピーデコーディングの後、結果として生じる変換係数は、逆変換ユニット624および626のそれぞれによって実行される逆変換のためのものである。逆変換ユニット624の出力では、高品質予測残差の再構築されたバージョンが得られる。同様に、逆変換ユニット626の出力では、低品質予測残差の再構築されたバージョンが得られる。予測ユニット640は、動き補償された予測のような時間的な予測を実行するために、デコードされた高品質のシーケンスを利用する。この目的を達成するために、予測モジュール640は、予測モジュール142によって生成され、高品質強化レイヤ信号に入力された動きデータのような時間的な予測データを利用する。この高品質予測信号は、レイヤ間の予測パス644によって取得される予測残差のための加算器636による予測の加算によって改良される。少なくとも、ブロック206に関して以下のことが当てはまる。高品質エンコーディングモジュール104は、たとえば、スケーラブルなビットストリーム内のそれぞれのサイド情報から、または低品質基本レイヤ信号から、これらのブロックが識別可能であることを利用して、パス148を利用した。これらのブロックに関しては、スイッチ648および650が、図6の実線で示される位置にあるものとする。一方、スイッチ652は、点線で示される位置にあるものとする。改良された予測信号は、スイッチ652を介して加算器634へと送られる。加算器634は、再構築された高品質予測残差に改良された予測信号を加算する。その後、デブロッキングフィルタ638が、デコードされた高品質シーケンスを取得し、当該シーケンスを出力618で出力するために、デブロッキングフィルタリングを実行する。
高品質エンコーディングモジュール104がパス150を利用する場合の対象となるブロック206に関して、スイッチ652は、図6において実線で示される位置にあるものとする。一方、スイッチ650は、別の位置、すなわち点線、にあるものとする。これらのブロックの識別に関して、他のレイヤ間の予測されたブロックに関する今説明された機能について説明する。これらのブロックの場合には、加算器634が、再構築された高品質予測残差に、加算器628の出力からパス646を介して取得された逆マップされアップサンプルされた形式の再構築された基本品質ビデオ信号を加算する。特に、予測ユニット630は、時間的な予測が低品質エンコーディングモジュール102にて利用された対象となるブロック204のための時間的な予測を実行する。加算器628は、パス646によって利用される基本品質ビデオ信号の再構築されたバージョンを出力するために、こ
の予測信号を再構築された低品質予測残差に加算する。再度、予測ユニット630は、動き補償データのような時間的な予測データに従って、基本品質レイヤに対する時間的な予測を実行するということを述べる。これは、低品質エンコーディングモジュール102の予測モジュール126によって用いられ、低品質基本レイヤへと挿入されるものである。
これまでに説明されていないデコーダ600の他のブロックに関して、上記のビデオエンコーダ100の説明を参照する。これらのブロックに関しては、エンコーダの場合と同様のステップが実行される。このことは、特に、逆マッピングおよびアップサンプリングユニット658および660と、逆マッピングおよびアップサンプリングユニット658によって、予測信号、または、予測ユニット640の予測信号とスイッチ648を介して加算器642に提供される高品質予測残差の再構築されたバージョンとの合計の利用による基本品質予測信号の見積もりとに関して当てはまる。
最後に、リービングユニット658としての逆トーンマップされ(もしかすると)アップサンプルされた基本品質残差サンプル値は、加算器634に入力されるコードされた高品質残差サンプル値に加算され、それゆえに、効率的な高いビット深度、デコーディング処理において再構築のために利用される高い解像度の予測残差信号、予測信号リービング予測ユニット640、高品質シーケンスが取得される。ビデオの各部分に関して、高品質でビデオコンテンツをデコードするために最大で1つの時間的な予測だけが必要になるように、シングルループの制約を満たすことができる。
図6のデコーダの実施の形態をH.264/AVCの環境に移す場合、要素622、626および606の使用による基本品質画像のデコーディングは、完全にH.264/AVCに従う。上述したSVCに関する提案において記載されたような、ビット深度のスケーラビリティーがない空間的なスケーラビリティーの動作と比較して、高品質画像のデコーディングに要求される追加的なステップは、逆トーンマッピングと、空間的なスケーラビリティーの場合には、SVCのレイヤ間の解釈の代わりに採用されるデコードされた基本品質ピクチャサンプルのためのアップサンプリング動作と、逆残差トーンマッピングと、空間的なスケーラビリティーの場合における、SVCのレイヤ間の残差予測の代わりに採用される基本品質残差サンプルのためのアップサンプリング動作である。
換言すれば、上記の実施の形態は、ビデオ信号のレイヤ化された画像をコーディング(エンコーディング/デコーディング)するためのビデオコーダ(エンコーダ/デコーダ)を説明するものである。そして、当該ビデオ信号は、基本品質レイヤをコーディングするための規格化されたビデオコーディング方法と、レイヤ内コードされた基本品質ピクチャブロックまたはシングルループのデコーディングの制約に従うべき場合における再構築された基本品質信号を使用することによって、高品質強化レイヤ信号の予測を実行するための予測方法と、以下では「レイヤ間残差予測」と言われる、レイヤ間コードされた基本品質ピクチャブロックの場合におけるデコードされた基本品質残差信号を用いることによって、高品質強化レイヤ残差信号の予測を実行するための予測方法と、高品質強化レイヤ信号の予測残差をコーディングするための残差コーディング方法と、高品質強化レイヤ予測モードを考慮するためのコーディング方法とを備える。
レイヤ間レイヤ内予測は、空間的なスケーラビリティー(すなわち、基本および高品質レイヤに関する異なる空間解像度の使用)の場合、基本品質レイヤ信号のアップサンプリングと、基本品質レイヤに関連したダイナミックレンジから高品質強化レイヤに関連したダイナミックレンジまでのマッピング機能を利用することによって実行され得る。そして、アップサンプリングおよびマッピング動作の順序は固定であってもよいし、変更可能であってもよい。変更可能な場合、当該順序は、サイド情報としてデコーダへと送信され得る。
レイヤ間レイヤ内予測は、空間的なスケーラビリティー(すなわち、基本および高品質レイヤに関する異なる空間解像度の使用)の場合、基本品質レイヤ信号のアップサンプリングと、以下の式に従う(もしかしたらアップサンプルされた)基本品質レイヤのサンプル値xをスケーリングおよびクリッピングすることによっても実行される。
Figure 0005295233
ここで、基本品質レイヤのサンプル値xは、Nのビット深度によって示される。高品質強化レイヤのサンプル値は、Mのビット深度によって示される。M>Nである。アップサンプリングとスケーリングとクリッピング動作との順序は、固定であってもよいし変更可能であってもよい。変更可能な場合、当該順序がサイド情報としてデコーダへと送信されるべきである。
さらに、レイヤ間レイヤ内予測は、空間的なスケーラビリティー(基本および高品質レイヤに関する異なる空間的解像度の使用)の場合、基本品質レイヤ信号のアップサンプリングと、サイド情報として送信される所定の個数の補完点を用いたピースワイズな線形マッピングとを利用することによっても実行され得る。ここでは、アップサンプリングと線形的な補完マッピング動作との順序が固定であってもよいし、変更可能であってもよい。変更可能な場合、当該順序がサイド情報としてデコーダへと送信されるべきである。
レイヤ間レイヤ内予測は、代替的に、空間的なスケーラビリティー(すなわち、基本および高品質レイヤに関する異なる空間解像度の使用)の場合、基本品質レイヤ信号のアップサンプリングと、対応する高品質サンプル値を含み、サイド情報として送信され得る参照テーブルをインデックスするための(もしかするとアップサンプルされた)基本品質信号サンプルの値を利用することによって実行され得る。ここでは、アップサンプリングと参照テーブルマッピングの動作の順序が、固定であってもよいし、変更可能であってもよい。変更可能な場合、当該順序が、サイド情報としてデコーダへと送信され得る。
他の可能性として、レイヤ間レイヤ内予測は、空間的なスケーラビリティー(すなわち基本および高品質レイヤに関する異なる空間解像度の使用)の場合、基本品質残差信号のアップサンプリングと、基本品質レイヤに関連したダイナミックレンジから高品質強化レイヤに関連したダイナミックレンジへのマッピング機能を利用することと、によって実行される。ここでは、アップサンプリングとマッピングの動作の順序が、固定であってもよいし、変更可能であってもよい。変更可能な場合、当該順序が、サイド情報としてデコーダへと送信され得る。他の実施の形態に従うと、レイヤ間レイヤ内予測は、空間的なスケーラビリティー(すなわち、基本および高品質レイヤに関する異なる空間的な解像度の使用)の場合、基本品質残差信号のアップサンプリングと、サイド情報として送信される所定の個数の補完点を用いたピースワイズな線形マッピングを利用することとによって実行される。ここでは、アップサンプリングと線形補完マッピングの動作との順序が固定であってもよいし、変更可能であってもよい。変更可能な場合、当該順序がサイド情報としてデコーダへと送信され得る。
代替的に、レイヤ間レイヤ内予測は、各々の基本品質サンプルに関して、(同様の空間解像度が基本および高品質ピクチャの両方のために利用される場合に1つのシングル値から構成され得る)共通に配置された高品質予測信号サンプル値のセットから、高品質画像値(平均値、メジアン値、他の特有の値であり得る。)を決定することと、その後の高品
質画像値に対するトーンマッピング動作を実行することと、このトーンマップされた高品質画像値と対応する基本品質残差サンプル値(たとえば、加算操作を介する)とを組み合わせることと、その後の逆トーンマッピングおよび空間的なスケーラビリティー(すなわち、基本および高品質レイヤに関する異なる空間解像度の使用)の場合においては、上述の方法を用いた当該組み合わされた信号のアップサンプリングと、最後に逆トーンマップされ(もしかすると)アップサンプルされ組み合わされた信号と高品質画像値との間の差異を決定することによって実行される。
別の代替案として、レイヤ間レイヤ内予測は、各々の基本品質サンプルに関して、共通して配置された高品質予測信号サンプル値と(同様の空間解像度が基本および高品質ピクチャの両方のために利用される場合において1つのシングル値のみから構成され得る)対応する高品質残差信号サンプル値との合計のセットから、高品質画像値(平均値、メジアン値、または他の特有の値であり得る)を決定することと、その後の高品質画像値に対するトーンマッピング動作を実行することと、当該トーンマップされた高品質画像値と対応する基本品質残差サンプル値(たとえば、加算操作を介する)とを組み合わせることと、その後の逆トーンマッピングおよび、空間的なスケーラビリティー(すなわち、基本および高品質レイヤに関する異なる空間解像度の使用)の場合においては、上述した方法を用いた当該組み合わされた信号のアップサンプリングと、最後に逆トーンマップされ(もしかすると)アップサンプルされ組み合わされた信号と高品質画像値との間の差異を決定することとによって実行される。
他の変形例として、レイヤ間レイヤ内予測は、アップサンプルされた空間的なスケーラビリティー(すなわち、基本および高品質レイヤに関する異なる空間解像度の使用)の場合においては、(たとえば、加算操作を介して、)他の元の基本品質残差サンプル値と、共通に配置されたトーンマップされた高品質予測信号サンプル値とを組み合わせることと、その後のアップサンプリングステップを除いた上述したばかりの方法を用いた当該組み合わされた信号の逆トーンマッピングと、最後に逆トーンマップされ組み合わされた信号と高品質予測信号との間の差分を決定することとによって実行される。
この点に関して、他の変形例として、レイヤ間レイヤ内予測は、アップサンプルされた空間的なスケーラビリティー(すなわち、基本および高品質レイヤに関する異なる空間解像度の使用)の場合においては、(たとえば、加算操作を介して、)他の元の基本品質残差サンプル値と、共通に配置されたトーンマップされた高品質予測信号サンプル値とを組み合わせることと、その後のアップサンプリングステップを除いた上述の代替案として記述したばかりの方法を用いた当該組み合わされた信号の逆トーンマッピングと、最後に逆トーンマップされ組み合わされた信号と高品質予測信号および残差信号の合計との間の差分を決定することとによって実行される。他の代替案においては、レイヤ間レイヤ内予測は、空間的なスケーラビリティー(すなわち、基本および高品質レイヤに関する異なる空間解像度の使用)の場合において、アップサンプリングと、共通に配置された高品質予測信号のサンプル値によって決定され、参照テーブルをインデックスすることによって取得され得るスケーリングファクタを用いて(もしかするとアップサンプルされた)基本品質残差サンプル値のスケーリングによって実行される。この参照テーブルは、サイド情報として送信され、または、既にデコーダに知られ得るものである。アップサンプリングとスケーリング動作の順序は、固定されていてもよいし、変更可能であってもよい。変更可能な場合、当該順序は、サイド情報としてデコーダへと送信され得る。さらに別の代替案に従うと、レイヤ間レイヤ内予測は、空間的なスケーラビリティー(すなわち、基本および高品質レイヤに関する異なる空間解像度の使用)の場合において、アップサンプリングと、共通して配置される高品質予測信号サンプルと対応する高品質残差信号サンプルとの合計の値によって決定され、参照テーブルをインデックスすることによって取得され得るスケーリングファクタを用いることによって(もしかするとアップサンプルされた)基本品
質残差サンプル値をスケーリングすることによって実行される。この参照テーブルは、サイド情報として送信されてもよいし、既にデコーダに知られ得るものであってもよい。アップサンプリングとスケーリング動作の順序は、固定されていてもよいし、変更可能であってもよい。変更可能な場合、当該順序は、サイド情報としてデコーダへと送信され得る。
残差コーディングは、H.264/AVCの規格に沿って実行され、H.264/AVCの規格によっても実行され得る。
上述した実施の形態は変更することが可能である。たとえば、予測ユニット142の出力と減算機130の反転入力との間に加算器146を配置する代わりに、逆マッピングおよびアップサンプリングモジュール154の出力を、スイッチ152を介して、変換モジュール132の入力と入力110との間に配置される他の減算器と、逆変換モジュール136とデブロッキングフィルタ140の入力との間に接続される他の加算器に提供してもよい。フィルタ140から124およびデコーダにおける対応する要素に関しては、取り除くことも可能である。さらに、エントロピーデコーディングおよびエントロピーコーディングモジュールが、他のコーディングモジュールに取替えられてもよいし、取り除かれてもよい。そして、エントロピーコーディングスキームとして、ハフマン(Huffman)コーディング、または可変長コーディングが、算術コーディングのように使用されてもよい。予測残差のコーディングおよびデコーディングに含まれる変換および逆変換は、たとえば、エンコーディングモジュール102および104が、レイヤ間/レイヤ内予測、またはレイヤ間予測、またはそのどちらでもないもの、のそれぞれを決定するところの、ユニット内におけるマクロブロックよりも小さな、変換のブロックサイズで、ブロックワイズ動作を行ない得る。そして、動き補償または空間的な予測に関して、この予測もまた、たとえば、変換ブロックのものとマクロブロックのものとの間のブロックサイズのブロックワイズな基準に基づいて実行され得る。さらに、上述したレイヤ間モードの間のブロックワイズな切換は必ずしも必要ではない。むしろ、上記実施の形態は、パス646および148のそれぞれを、使用するレイヤ間予測モードだけが有効となるように修正することが可能である。
さらに、上記においてははっきりと述べられていないが、逆マッピングおよびアップサンプリングモジュールにおいて実行されるステップは、品質低減モジュール106において実行される品質低減方法によって決まる、他の品質適用方法を含み得る。さらに、図6でははっきりと説明されなかったが、スケーラブルなビットストリームに挿入されると説明されていたすべてのサイド情報は、必要であれば図6のデコーダにおいて、対応する要素をそれぞれコントロールするために利用される。さらに、上記実施の形態においては、低品質予測残差の再構築されたバージョンは、高品質レイヤにおける予測を改良するために使用されるものであった。しかしながら、予防方法だけのものとして、エンコーダ減算器114による出力としての低品質予測残差をも使用することができる。しかしながら、逆変換モジュール120による出力としての再構築されたバージョンの使用は、再構築されたバージョンがデコーダ側において利用可能となるという点において有益である。一方、元の低品質予測残差は、単に、再構築されたバージョンに対応するためにデコーダによって推定されるに過ぎない。同様に、上記説明に従うと、閉じられたループの予測は使用されたが、開かれたループの予測も、すなわち、再構築された信号よりもむしろ入力信号に基づいた時間的な予測も使用され得る。
換言すれば、上記の実施形態は、ピクセル値解像度、および選択的に、空間解像度のための例としてのサンプルビット深度に関するスケーラビリティーへのSVCの可能な拡張の提供を可能にする。特に、可能な拡張によって、エンコーダは、レガシーなビデオデコーダによってデコードすることができるビデオシーケンスの基本品質画像を、より高いビ
ット深度、および選択的にレガシーなビデオデコーダによって無視されるより高い空間解像度の強化信号とともに記憶することができるようになる。たとえば、高品質画像は、CIF解像度(352×288サンプル)のビデオシーケンスの8ビットバージョンを含める。そして、高品質強化信号は、同じシーケンスの4CIF解像度(704×576サンプル)の10ビットバージョンへの「改良」を含む。別の構成においては、基本および強化品質画像の両方に対して同じ空間解像度を使用することもでき、それによって、高品質強化信号は、たとえば8ビットから10ビットの、サンプルビット深度の改良も含む。さらに換言すると、上述した実施の形態から、ピクセル値解像度、および選択的に空間解像度に関する異なる画像を用いた、ビデオのスケーラブルなコーディングの概念が容易に利用可能となる。ここでは、スケーラブルなH.264/MPEG4−AVC拡張の現在の作業草案において特定されるような時間的および空間的な予測処理の両方が、それらが低いところから高いサンプルビット深度への信頼度または一般的なピクセル値解像度、そして選択的には低いところから高い空間解像度までのマッピングを含む。
最後に、本発明は、ソフトウェア、ハードウェア、またはフィールドプログラマブルゲートアレイのようなプログラム可能なハードウェアで実現される。この点に関して、図1および6に示されるモジュールおよびユニットは、それぞれのエンコーディング/デコーディング方法で実行されるそれぞれのステップに対応し得るが、図5Aおよび5Bに示されるブロックはそれぞれの集積回路のハードウェア部分または上述されたそれぞれの機能を果たすコンピュータプログラムのプログラム部分に対応し得る。
特に、上記実施の形態のある実現化に伴う要求によると、これらの実施の形態は、ハードウェアまたはソフトウェアで実現され得る。実現化は、デジタル記憶媒体、特に、記憶された電気的に読取可能な制御信号を有するディスクまたはCD、を用いることによってなされ得る。それらは、プログラム可能なコンピュータシステムと協働することができ、これによってそれぞれの方法が実行される。それゆえに、一般的に、上記実施の形態は、機械読取可能なキャリアに格納され、コンピュータプログラムがコンピュータ上で走る際に、それぞれの方法を実行するように構成されたプログラムコードを有するコンピュータプログラム製品によって実現され得る。換言すれば、それゆえに、上述したエンコーディング/デコーディングの方法は、コンピュータプログラムがコンピュータ上で走る際に、進歩的な方法を実行するためのプログラムコードを有するコンピュータプログラムである。

Claims (25)

  1. ビデオ素材(200)の第1の画像を時間的に予測することによって第1の予測信号を取得し、前記第1の予測信号と前記第1の画像との差を示す第1の予測残差をコーディングするための第1の手段(102)を備え、
    前記第1の画像と前記第1の予測信号と前記第1の予測残差とは、第1のピクセル値解像度(300)のものであって、
    前記ビデオ素材(200)の第2の画像を時間的に予測することによって第2の予測信号を取得するための第2の手段(104)をさらに備え、
    前記第2の画像と前記第2の予測信号とは、前記第1のピクセル値解像度(300)よりも高い第2のピクセル値解像度(302)のものであって、
    前記第2の手段(104)は、
    前記第1のピクセル値解像度(300)から、前記第1のピクセル値解像度に関連付けられた動的範囲から前記第2のピクセル値解像度に関連付けられた動的範囲の非線形なマッピング関数の範囲を用いること、および、前記範囲を指示する前記第1の予測信号の推定値として前記第2の予測信号を用いることによって決まる前記第2のピクセル値解像度(302)へと、前記第1の予測残差または前記第1の予測残差の再構築されたバージョンをマップすることによって、第3の予測信号を取得し、
    前記第2および第3の予測信号との組み合わせと前記第2の画像との間の差を示す前記第2のピクセル値解像度(302)の第2の予測残差をコードするように構成されている、ビデオエンコーダ。
  2. 前記第1の手段(102)は、
    前記第1の画像から前記第1の予測信号を引くことによって、前記第1の予測残差を取得するための手段(114)と、
    前記第1の予測残差を不可逆に変換コーディングすることによって、前記第1の予測残差の変換コードされたバージョンを取得するための手段(116,118)と、
    前記変換コードされたバージョンから前記第1の予測残差を再構築することによって、前記第1の予測残差の再構築されたバージョンを取得するための手段(120)と、
    前記第1の予測残差の再構築されたバージョンと前記第1の予測信号とを合せることに
    よって、前記第1の画像の再構築されたバージョンを取得するための手段(122)と、
    前記第1の画像の前記再構築されたバージョンに対して時間的な予測を実行することによって、前記第1の予測信号を取得するための手段(126)とを備える、請求項1に記載のビデオエンコーダ。
  3. 前記第2の手段(104)は、
    前記第2の画像から前記第2の予測信号と前記第3の予測信号とを引くことによって、前記第2の予測残差を取得するための手段(130,146)と、
    前記第2の予測残差を不可逆に変換コーディングすることによって、前記第2の予測残差の変換コードされたバージョンを取得するための手段(132,134)と、
    前記第2の予測残差の変換コードされたバージョンから前記第2の予測残差を再構築することによって、前記第2の予測残差の再構築されたバージョンを取得するための手段(136)と、
    前記第2の予測残差の再構築されたバージョンと前記第3の予測信号と前記第2の予測信号とを合せることによって、前記第2の画像の再構築されたバージョンを取得するための手段(138,146)と、
    前記第2の画像の前記再構築されたバージョンに対して時間的な予測を実行することによって、前記第2の予測信号を取得するための手段(142)とを備える、請求項1または2に記載のビデオエンコーダ。
  4. 前記第2の手段(104)は、
    前記第2の予測信号(502)、または前記第2の予測信号(502)と前記第2の予測残差(504)との組み合わせのいずれかを、前記第2のピクセル値解像度(302)から前記第1のピクセル値解像度(300)へとマップする(512)ことによって、ダウンマップされたオフセット信号を取得し、
    前記ダウンマップされたオフセット信号と前記第1の予測残差または前記第1の予測残差(510)の再構築されたバージョンの組み合わせを、前記第1のピクセル値解像度(300)から前記第2のピクセル値解像度(302)へとマップする(516)ことによって、アップマップされた信号を取得し、
    前記第2の予測信号(502)、または前記第2の予測信号(502)と前記第2の予測残差(504)との組み合わせのいずれかを、前記アップマップされた信号から引くことによって、前記第3の予測信号を取得するように構成される、請求項1から3のいずれかに記載のビデオエンコーダ。
  5. 前記第2の手段(104)は、さらに、
    前記第2の予測信号(502)、または前記第2の予測信号(502)と前記第2の予測残差(504)との組み合わせのいずれかをマップする際に、前記第2の予測信号(502)、または前記第2の予測信号(502)と前記第2の予測残差(504)との組み合わせのいずれかにおける空間ピクセルサンプリング解像度を減少させ(500)、当該減少結果を利用することによって、前記ダウンマップされたオフセット信号を取得し、
    前記ダウンマップされたオフセット信号と前記第1の予測残差または前記第1の予測残差(510)の再構築されたバージョンの組み合わせをマップする際に、前記ダウンマップされたオフセット信号と前記第1の予測残差または前記第1の予測残差(510)の再構築されたバージョンとの組み合わせにおける空間アップサンプリング(516)を実行し、当該アップサンプリング結果を利用することによって、前記アップマップされた信号を取得するように構成される、請求項4に記載のビデオエンコーダ。
  6. 前記第2の手段(104)は、さらに、
    前記ダウンマップされたオフセット信号と前記第1の予測残差または前記第1の予測残差(510)の再構築されたバージョンの組み合わせをマップする際に、前記第1の予測
    残差または前記第1の予測残差(510)の再構築されたバージョンに対して空間アップサンプリングを実行し、当該アップサンプリング結果を利用することによって、前記アップマップされた信号を取得するように構成される、請求項4に記載のビデオエンコーダ。
  7. 前記第2の手段(104)は、さらに、
    第1の動作モードにおいて、
    前記第2の予測信号(502)、または前記第2の予測信号(502)と前記第2の予測残差(504)との組み合わせのいずれかをマップする際に、前記第2の予測信号(502)、または前記第2の予測信号(502)と前記第2の予測残差(504)との組み合わせのいずれかにおける空間ピクセルサンプリング解像度を減少させ(500)、当該減少結果を利用することによって、前記ダウンマップされたオフセット信号を取得し、
    前記ダウンマップされたオフセット信号と前記第1の予測残差または前記第1の予測残差(510)の再構築されたバージョンの組み合わせをマップする際に、前記ダウンマップされたオフセット信号と前記第1の予測残差または前記第1の予測残差(510)の再構築されたバージョンとの組み合わせにおける空間アップサンプリング(516)を実行し、当該アップサンプリング結果を利用することによって、前記アップマップされた信号を取得し、
    第2の動作モードにおいて、
    前記ダウンマップされたオフセット信号と前記第1の予測残差または前記第1の予測残差(510)の再構築されたバージョンの組み合わせをマップする際に、前記第1の予測残差または前記第1の予測残差(510)の再構築されたバージョンに対して空間アップサンプリングを実行し、当該アップサンプリング結果を利用することによって、前記アップマップされた信号を取得するように構成され、
    前記ビデオ素材(200)は複数のブロック(206)に分割され、
    前記第2の手段(104)は、ブロック毎に選択的に前記第1または前記第2の動作モードで動作し、デコーダ側のためのサイド情報において、予め定められたブロック(206)のために前記第1の動作モードまたは前記第2の動作モードのいずれが利用されたのかを示すように構成される、請求項4に記載のビデオエンコーダ。
  8. 前記第2の手段(104)は、
    前記第2の予測信号(310)によって決まるスケーリングファクターを用いて、マップされた第1の予測残差または前記第1の予測残差のマップされ再構築されたバージョンをスケーリングすることによって、前記第1の予測残差または前記第1の予測残差の再構築されたバージョンを、第1のピクセル値ビット深度(300)から当該第1のピクセル値ビット深度(300)よりも高い第2のピクセル値ビット深度(302)へとマップするように構成される、請求項1から3のいずれかに記載のビデオエンコーダ。
  9. 前記ビデオ素材(200)は、複数のブロック(204)に分割され、
    前記第1の手段(102)は、少なくとも1つの第1のブロックのために、前記第1の予測残差がコードされ、少なくとも1つの第2のブロックのために、前記第1の画像が時間予測とは独立してコードされるように、ブロックの選択を行なうように構成され、
    前記第2の手段は、前記少なくとも1つの第1のブロックのために、前記第2の予測残差をコードし、前記少なくとも1つの第2のブロックのために、前記第1のピクセル値解像度から前記第2のピクセル値解像度へと前記第1の画像の再構築されたバージョンをマップすることによって、前記第1の画像のアップサンプルされ再構築されたバージョンを取得し、前記第2の画像と前記第1の画像のアップサンプルされ再構築されたバージョンとの間の差をコードするように構成される、請求項1から8のいずれかに記載のビデオエンコーダ。
  10. 前記第2の手段(104)は、さらに、
    前記第1の画像の再構築されたバージョンをマップする際に、前記第1の画像の再構築されたバージョンに対して空間アップサンプリングを実行し、当該アップサンプリング結果を利用することによって、前記第1の画像のアップサンプリングされ再構築されたバージョンを取得する、請求項9に記載のビデオエンコーダ。
  11. 前記第2の手段(104)は、ブロック毎に選択的にアップサンプリングとマッピングの実行の順序を変更し、利用された前記順序を、デコーダ側のためのサイド情報において示すように構成される、請求項10に記載のビデオエンコーダ。
  12. 第1および第2のピクセル値解像度(300,302)を有するビデオ素材(200)を表わすスケーラブルなビデオ信号をデコードするためのビデオデコーダであって、
    前記第2のピクセル値解像度(302)は前記第1のピクセル値解像度(300)よりも高く、
    前記スケーラブルなビデオ信号は、その内部に、前記第1のピクセル値解像度(300)の第1の予測残差と前記第2のピクセル値解像度(302)の第2の予測残差とを有し、
    前記ビデオデコーダは、
    前記スケーラブルなビデオ信号から前記第1および第2の予測残差を再構築するためのデコーディング手段(604)と、
    第2の予測信号を得るために前記ビデオ素材の第2の画像を時間的に予測するための手段(610)とを備え、前記第2の画像と前記第2の予測信号とは、前記第2のピクセル値解像度(302)の信号であり、前記時間的に予測するための手段(610)は、前記第1のピクセル値解像度(300)から、前記第1のピクセル値解像度に関連付けられた動的範囲から前記第2のピクセル値解像度に関連付けられた動的範囲の非線形なマッピング関数の範囲を用いること、および、前記範囲を指示する第1の予測信号の推定値として前記第2の予測信号を用いることによって決まる前記第2のピクセル値解像度(302)へと前記第1の予測残差をマップすることによって、第3の予測信号を取得し、
    前記ビデオデコーダは、前記第2の予測信号と、前記第3の予測信号と、前記第2の予測残差とに基づいて、前記第2の画像を再構築するための手段(612)をさらに備える、ビデオデコーダ。
  13. 前記デコーディング手段(604)は、逆変換(624,626)によって、前記第1および第2の予測残差を再構築するように構成されている、請求項12に記載のビデオデコーダ。
  14. 前記時間的に予測するための手段(610)は、
    前記再構築するための手段と接続されることによって、前記第2の画像の再構築画像を取得し、
    前記第2の画像の再構築されたバージョンに対して時間的な予測を実行することによって、第2の予測信号を取得するための手段(640)を含む、請求項13に記載のビデオデコーダ。
  15. 前記時間的に予測するための手段(610)は、
    前記第2の予測信号、または前記第2の予測信号と前記第2の予測残差との組み合わせのいずれかを、前記第2のピクセル値解像度から前記第1のピクセル値解像度へとマップすることによって、前記ダウンマップされたオフセット信号を取得し、
    前記ダウンマップされたオフセット信号と前記第1の予測残差との組み合わせを、前記第1のピクセル値解像度から第2のピクセル値解像度へとマップすることによって、アップマップされた信号を取得し、
    前記第2の予測信号、または前記第2の予測信号と前記第2の予測残差との組み合わせ
    のいずれかを、前記アップマップされた信号から引くことによって、前記第3の予測信号を取得するように構成される、請求項12から14のいずれかに記載のビデオデコーダ。
  16. 前記時間的に予測するための手段は、さらに、
    前記第2の予測信号、または前記第2の予測信号と前記第2の予測残差との組み合わせのいずれかをマップする際に、前記第2の予測信号、または前記第2の予測信号と前記第2の予測残差との組み合わせのいずれかにおける空間ピクセルサンプリング解像度を減少させ、当該減少結果を利用することによって、前記ダウンマップされたオフセット信号を取得し、
    前記ダウンマップされたオフセット信号と前記第1の予測残差との組み合わせをマップする際に、前記ダウンマップされたオフセット信号と前記第1の予測残差との組み合わせにおける空間アップサンプリングを実行し、当該アップサンプリング結果を利用することによって、前記アップマップされた信号を取得するように構成される、請求項15に記載のビデオデコーダ。
  17. 前記時間的に予測するための手段は、さらに、
    前記ダウンマップされたオフセット信号と前記第1の予測残差との組み合わせをマップする際に、前記第1の予測残差における空間アップサンプリングを実行し、当該アップサンプリング結果を利用することによって、前記アップマップされた信号を取得するように構成される、請求項15に記載のビデオデコーダ。
  18. 前記時間的に予測するための手段は、さらに、
    第1の動作モードにおいて、
    前記第2の予測信号、または前記第2の予測信号と前記第2の予測残差との組み合わせのいずれかをマップする際に、前記第2の予測信号、または前記第2の予測信号と前記第2の予測残差との組み合わせのいずれかにおける空間ピクセルサンプリング解像度を減少させ、当該減少結果を利用することによって、前記ダウンマップされたオフセット信号を取得し、
    前記ダウンマップされたオフセット信号と前記第1の予測残差との組み合わせをマップする際に、前記ダウンマップされたオフセット信号と前記第1の予測残差との組み合わせにおける空間アップサンプリングを実行し、当該アップサンプリング結果を利用することによって、前記アップマップされた信号を取得し、
    第2の動作モードにおいて、
    前記ダウンマップされたオフセット信号と前記第1の予測残差との組み合わせをマップする際に、前記第1の予測残差に対して空間アップサンプリングを実行し、当該アップサンプリング結果を利用することによって、前記アップマップされた信号を取得するように構成され、
    前記ビデオ素材は複数のブロックに分割され、
    前記時間的に予測するための手段(610)は、ブロック毎に選択的に、予め定められたブロック(206)に関して当該予め定められたブロックのために前記第1の動作モードまたは前記第2の動作モードのいずれが利用されるべきかを示すスケーラブルなビデオ信号のサイド情報に含まれる情報によって決まる前記第1または前記第2の動作モードで動作するように構成される、請求項15に記載のビデオデコーダ。
  19. 前記時間的に予測するための手段は、
    前記第2の予測信号によって決まるスケーリングファクターを用いて、マップされた第1の予測残差をスケーリングすることによって、前記第1の予測残差を、第1のピクセル値ビット深度から当該第1のピクセル値ビット深度よりも高い第2のピクセル値ビット深度へとマップするように構成される、請求項12から14のいずれかに記載のビデオデコーダ。
  20. 前記ビデオ素材は、複数のブロック(206)に分割され、
    前記スケーラブルなビデオ素材は、その内部に、第1の複数のブロックについて前記第1の予測残差をコードし、第2の複数のブロックについて前記第2の画像と前記第1の画像のアップサンプルされ再構築されたバージョンとの差をコードし、
    時間的に予測するための手段(610)と再構築するための手段(612)とは、前記第1の複数のブロックに関してブロックの選択を行なうように構成され、
    前記ビデオデコーダは、
    前記第2の複数のブロックに関して、前記第1の画像を予測する(630)ことによって第1の予測信号を取得し、前記第1の予測残差と前記第1の予測信号とを利用して前記第1の画像を再構築(628)することによって、前記第1の画像の再構築されたバージョンを取得し、前記第1の画像の再構築されたバージョンを前記第1のピクセル値解像度(300)から前記第2のピクセル値解像度(302)へとマップする(660)ことによって、前記第1の画像のアップマップされ再構築されたバージョンを取得し、前記第2の画像と前記第1の画像のアップマップされ再構築されたバージョンと前記第1の画像のアップマップされ再構築されたバージョンとの差を利用して前記第2の画像を再構築する(634)ための手段(606,646)をさらに備える、請求項12から19のいずれかに記載のビデオデコーダ。
  21. 前記第2の複数のブロックに関して、前記時間的に予測するための手段(606,646)は、さらに、
    前記第1の画像の再構築されたバージョンをマップする際に、前記第1の画像の再構築されたバージョンに対して空間アップサンプリングを実行し、当該アップサンプリング結果を利用することによって、前記第1の画像のアップサンプリングされ再構築されたバージョンを取得する、請求項20に記載のビデオデコーダ。
  22. 前記第2の複数のブロックに関して、前記時間的に予測することは、さらに、アップサンプリングとマッピングの実行の順序を示すスケーラブルなビデオ信号のサイド情報に含まれる情報に従って、ブロック毎に選択的に当該順序を変更するように構成される、請求項21に記載のビデオデコーダ。
  23. ビデオをエンコードするための方法であって、
    ビデオ素材の第1の画像を時間的に予測することによって第1の予測信号を取得し、前記第1の予測信号と前記第1の画像との差を示す第1の予測残差をコーディングすることを含み、
    前記第1の画像と前記第1の予測信号と前記第1の予測残差とは、第1のピクセル値解像度のものであって、
    前記ビデオ素材の第2の画像を時間的に予測することによって第2の予測信号を取得することを含み、
    前記第2の画像と前記第2の予測信号とは、前記第1のピクセル値解像度よりも高い第2のピクセル値解像度のものであって、
    前記時間的に予測することは、
    前記第1のピクセル値解像度から、前記第1のピクセル値解像度に関連付けられた動的範囲から前記第2のピクセル値解像度に関連付けられた動的範囲の非線形なマッピング関数の範囲を用いること、および、前記範囲を指示する前記第1の予測信号の推定値として前記第2の予測信号を用いることによって決まる前記第2のピクセル値解像度へと、前記第1の予測残差または前記第1の予測残差の再構築されたバージョンをマップすることによって、第3の予測信号を取得することと、
    前記第2および第3の予測信号との組み合わせと前記第2の画像との間の差を示す前記第2のピクセル値解像度の第2の予測残差をコードすることを含む、ビデオをエンコー
    ドするための方法。
  24. 第1および第2のピクセル値解像度を有するビデオ素材を表わすスケーラブルなビデオ信号をデコードするための方法であって、
    前記第2のピクセル値解像度は前記第1のピクセル値解像度よりも高く、
    前記スケーラブルなビデオ信号は、その内部に、前記第1のピクセル値解像度の第1の予測残差と前記第2のピクセル値解像度の第2の予測残差とを有し、
    前記スケーラブルなビデオ信号から前記第1および第2の予測残差を再構築し、
    前記ビデオ素材の第2の画像を時間的に予測することによって、第2の予測信号と、前記第2の画像と、前記第2のピクセル値解像度の前記第2の予測信号とを取得し、
    前記時間的に予測することは、前記第1のピクセル値解像度から、前記第1のピクセル値解像度に関連付けられた動的範囲から前記第2のピクセル値解像度に関連付けられた動的範囲の非線形なマッピング関数の範囲を用いること、および、前記範囲を指示する第1の予測信号の推定値として前記第2の予測信号を用いることによって決まる前記第2のピクセル値解像度へと前記第1の予測残差をマップすることによって、第3の予測信号を取得することを含み、
    前記第2の予測信号と、前記第3の予測信号と、前記第2の予測残差とに基づいて、前記第2の画像を再構築する、スケーラブルなビデオ信号をデコードするための方法。
  25. コンピュータで実行される、請求項23または24に記載の方法を実行するための指示を有するコンピュータプログラム。
JP2010513663A 2007-06-29 2007-06-29 ビデオエンコーダ、ビデオデコーダ、エンコードするための方法、デコードするための方法、コンピュータプログラム、およびスケーラブルなビットストリーム Active JP5295233B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2007/005808 WO2009003499A1 (en) 2007-06-29 2007-06-29 Scalable video coding supporting pixel value refinement scalability

Publications (2)

Publication Number Publication Date
JP2010531585A JP2010531585A (ja) 2010-09-24
JP5295233B2 true JP5295233B2 (ja) 2013-09-18

Family

ID=39322600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010513663A Active JP5295233B2 (ja) 2007-06-29 2007-06-29 ビデオエンコーダ、ビデオデコーダ、エンコードするための方法、デコードするための方法、コンピュータプログラム、およびスケーラブルなビットストリーム

Country Status (7)

Country Link
US (1) US8934542B2 (ja)
EP (1) EP2143279B1 (ja)
JP (1) JP5295233B2 (ja)
CN (1) CN102084653B (ja)
AT (1) ATE484155T1 (ja)
DE (1) DE602007009730D1 (ja)
WO (1) WO2009003499A1 (ja)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2193661A4 (en) * 2007-06-27 2011-10-19 Thomson Licensing METHOD AND APPARATUS FOR ENCODING AND / OR DECODING VIDEO DATA USING RESIDUAL PREDICTION OF IMPROVING LAYER FOR SCALABILITY OF BINARY DEPTH
BRPI0817767A2 (pt) * 2007-10-16 2020-01-28 Thomson Licensing métodos e aparelhos para remoção de artefato para capacidade de escalonamento de profundidade de bit
KR20150126728A (ko) * 2007-10-19 2015-11-12 톰슨 라이센싱 조합된 공간 및 비트 심도 확장성
US8654850B2 (en) * 2008-05-20 2014-02-18 Panasonic Corporation Image coding device and image coding method
JP5519654B2 (ja) * 2008-06-12 2014-06-11 トムソン ライセンシング 低減ビット深度更新モードおよび低減色度サンプリング更新モードを用いるビデオコーディングおよびデコーディングのための方法および装置
US9571856B2 (en) * 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
EP2204965B1 (en) * 2008-12-31 2016-07-27 Google Technology Holdings LLC Device and method for receiving scalable content from multiple sources having different content quality
JP5688773B2 (ja) * 2009-02-03 2015-03-25 トムソン ライセンシングThomson Licensing ビット深度スケーラビリティにおける平滑参照フレームを用いた動き補償のための方法および装置
WO2010093432A1 (en) * 2009-02-11 2010-08-19 Thomson Licensing Methods and apparatus for bit depth scalable video encoding and decoding utilizing tone mapping and inverse tone mapping
TWI468020B (zh) * 2009-02-19 2015-01-01 Sony Corp Image processing apparatus and method
TWI440363B (zh) 2009-02-19 2014-06-01 Sony Corp Image processing apparatus and method
KR101597987B1 (ko) * 2009-03-03 2016-03-08 삼성전자주식회사 계층 독립적 잔차 영상 다계층 부호화 장치 및 방법
US9106920B2 (en) 2009-05-05 2015-08-11 Telefonaktiebolaget L M Ericsson (Publ) Scalable video coding method, encoder and computer program
KR101255880B1 (ko) * 2009-09-21 2013-04-17 한국전자통신연구원 기저계층의 화질을 향상시키는 스케일러블 비디오 부/복호화 방법 및 장치
WO2012004709A1 (en) * 2010-07-06 2012-01-12 Koninklijke Philips Electronics N.V. Generation of high dynamic range images from low dynamic range images
TWI559779B (zh) 2010-08-25 2016-11-21 杜比實驗室特許公司 擴展影像動態範圍
KR101679233B1 (ko) * 2010-09-08 2016-11-24 삼성전자주식회사 디블록킹 필터 및 이를 포함하는 영상 표시 장치
JP5539592B2 (ja) * 2010-09-14 2014-07-02 サムスン エレクトロニクス カンパニー リミテッド 多階層画像符号化及び復号装置及び方法
GB2500835B (en) 2010-12-10 2014-02-12 Ibm High-dynamic range video tone mapping
WO2012090454A1 (ja) 2010-12-27 2012-07-05 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
JP5594841B2 (ja) * 2011-01-06 2014-09-24 Kddi株式会社 画像符号化装置及び画像復号装置
US9247261B2 (en) 2011-03-04 2016-01-26 Vixs Systems, Inc. Video decoder with pipeline processing and methods for use therewith
US9025660B2 (en) * 2011-03-04 2015-05-05 Vixs Systems, Inc. Video decoder with general video decoding device and methods for use therewith
US9088800B2 (en) * 2011-03-04 2015-07-21 Vixs Systems, Inc General video decoding device for decoding multilayer video and methods for use therewith
ES2750234T3 (es) 2011-04-14 2020-03-25 Dolby Laboratories Licensing Corp Predictor de regresión múltiple de múltiples canales de color
EP2702764B1 (en) 2011-04-25 2016-08-31 Dolby Laboratories Licensing Corporation Non-linear vdr residual quantizer
US20130163660A1 (en) * 2011-07-01 2013-06-27 Vidyo Inc. Loop Filter Techniques for Cross-Layer prediction
US9055304B2 (en) * 2011-07-01 2015-06-09 Qualcomm Incorporated Reduced resolution pixel interpolation
US9948938B2 (en) * 2011-07-21 2018-04-17 Texas Instruments Incorporated Methods and systems for chroma residual data prediction
CN107295342B (zh) * 2011-07-22 2020-04-28 Sk电信有限公司 视频编码装置
US10237565B2 (en) 2011-08-01 2019-03-19 Qualcomm Incorporated Coding parameter sets for various dimensions in video coding
TWI575933B (zh) 2011-11-04 2017-03-21 杜比實驗室特許公司 階層式視覺動態範圍編碼中之層分解技術
EP2774360B1 (en) * 2011-11-04 2017-08-02 Huawei Technologies Co., Ltd. Differential pulse code modulation intra prediction for high efficiency video coding
KR20130050149A (ko) * 2011-11-07 2013-05-15 오수미 인터 모드에서의 예측 블록 생성 방법
WO2013068548A2 (en) 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient multi-view coding using depth-map estimate for a dependent view
CN104247432B (zh) 2011-11-11 2019-06-11 Ge视频压缩有限责任公司 使用深度图估计和更新的高效多视点编码
EP3739886A1 (en) 2011-11-18 2020-11-18 GE Video Compression, LLC Multi-view coding with efficient residual handling
WO2013106190A1 (en) * 2012-01-09 2013-07-18 Dolby Laboratories Licensing Corporation Hybrid reference picture reconstruction method for single and multiple layered video coding systems
US9219913B2 (en) 2012-06-13 2015-12-22 Qualcomm Incorporated Inferred base layer block for TEXTURE—BL mode in HEVC based single loop scalable video coding
US9247242B2 (en) 2012-07-09 2016-01-26 Qualcomm Incorporated Skip transform and residual coding mode extension for difference domain intra prediction
JPWO2014050948A1 (ja) * 2012-09-28 2016-08-22 シャープ株式会社 画像復号装置、画像復号方法及び画像符号化装置
CN103716622B (zh) * 2012-09-29 2017-02-08 华为技术有限公司 用于图像处理的方法和装置
JP6301932B2 (ja) 2012-10-01 2018-03-28 ジーイー ビデオ コンプレッション エルエルシー エンハンスメント層の中の変換係数ブロックの副ブロックに基づいた符号化を使用するスケーラブルビデオ符号化
US10085017B2 (en) * 2012-11-29 2018-09-25 Advanced Micro Devices, Inc. Bandwidth saving architecture for scalable video coding spatial mode
TWI521946B (zh) * 2012-12-21 2016-02-11 杜比實驗室特許公司 在高位元深度視訊的可適性編碼中,高精度升取樣
US9532057B2 (en) * 2012-12-28 2016-12-27 Qualcomm Incorporated Inter-layer prediction using sample-adaptive adjustments for bit depth scalable video coding
US9596465B2 (en) * 2013-01-04 2017-03-14 Intel Corporation Refining filter for inter layer prediction of scalable video coding
US20140192866A1 (en) * 2013-01-09 2014-07-10 Mitsubishi Electric Research Laboratories, Inc. Data Remapping for Predictive Video Coding
US9800884B2 (en) * 2013-03-15 2017-10-24 Qualcomm Incorporated Device and method for scalable coding of video information
CN103227919B (zh) * 2013-03-29 2015-11-25 苏州皓泰视频技术有限公司 一种基于多核处理器Tilera的SVC编码方法
WO2014156707A1 (ja) * 2013-03-29 2014-10-02 ソニー株式会社 画像符号化装置および方法、並びに、画像復号装置および方法
CN105122804A (zh) * 2013-04-05 2015-12-02 夏普株式会社 利用颜色位深缩放的视频压缩
EP2997732A1 (en) * 2013-05-15 2016-03-23 VID SCALE, Inc. Single loop decoding based inter layer prediction
US9143797B2 (en) 2013-05-29 2015-09-22 Blackberry Limited Lossy data compression with conditional reconstruction refinement
EP2816805B1 (en) * 2013-05-29 2020-12-30 BlackBerry Limited Lossy data compression with conditional reconstruction reinfinement
TWI652937B (zh) * 2013-10-07 2019-03-01 Vid衡器股份有限公司 多層視訊編碼組合可調能力處理方法
JP6202330B2 (ja) * 2013-10-15 2017-09-27 ソニー株式会社 復号装置および復号方法、並びに符号化装置および符号化方法
WO2015077329A1 (en) 2013-11-22 2015-05-28 Dolby Laboratories Licensing Corporation Methods and systems for inverse tone mapping
EP2887664A1 (en) * 2013-12-19 2015-06-24 Thomson Licensing Method and device for encoding a high-dynamic range image
US9445111B2 (en) * 2014-01-08 2016-09-13 Sony Corporation Image processing apparatus and image processing method
WO2015143119A1 (en) 2014-03-19 2015-09-24 Arris Enterprises, Inc. Scalable coding of video sequences using tone mapping and different color gamuts
US9704213B2 (en) 2014-08-13 2017-07-11 Qualcomm Incorporated Texture element streaming
EP2991354A1 (en) * 2014-08-27 2016-03-02 Thomson Licensing Method and apparatus for improving the prediction of a block of the enhancement layer
US10410398B2 (en) * 2015-02-20 2019-09-10 Qualcomm Incorporated Systems and methods for reducing memory bandwidth using low quality tiles
US20160286224A1 (en) * 2015-03-26 2016-09-29 Thomson Licensing Method and apparatus for generating color mapping parameters for video encoding
EP3113492A1 (en) * 2015-06-30 2017-01-04 Thomson Licensing Method and apparatus for determining prediction of current block of enhancement layer
US10283032B2 (en) 2015-10-07 2019-05-07 Samsung Display Co., Ltd. Integrated circuit for nonlinear data encoding
US10110931B2 (en) * 2016-04-27 2018-10-23 Aspeed Technology Inc. Variable length coding and decoding methods and devices for grouped pixels
GB2554065B (en) * 2016-09-08 2022-02-23 V Nova Int Ltd Data processing apparatuses, methods, computer programs and computer-readable media
TWI625955B (zh) * 2016-10-12 2018-06-01 國立清華大學 合作式多媒體通訊方法及其系統
CN107087212B (zh) * 2017-05-09 2019-10-29 杭州码全信息科技有限公司 基于空间可伸缩编码的交互式全景视频转码与播放方法及系统
US11228757B2 (en) 2017-05-31 2022-01-18 Interdigital Vc Holdings, Inc. Method and a device for picture encoding and decoding
US11557022B2 (en) 2017-07-27 2023-01-17 Nvidia Corporation Neural network system with temporal feedback for denoising of rendered sequences
US11861811B2 (en) 2017-07-27 2024-01-02 Nvidia Corporation Neural network system with temporal feedback for denoising of rendered sequences
US11475542B2 (en) 2017-07-27 2022-10-18 Nvidia Corporation Neural network system with temporal feedback for adaptive sampling and denoising of rendered sequences
EP3725083A1 (en) 2017-12-14 2020-10-21 InterDigital VC Holdings, Inc. Method and apparatus for encoding a picture block
EP3518538A1 (en) * 2018-01-29 2019-07-31 Thomson Licensing A method and a device for encoding and decoding a picture part
EP4221201A1 (en) * 2018-01-29 2023-08-02 InterDigital VC Holdings, Inc. Encoding and decoding with refinement of the reconstructed picture
EP3756347A1 (en) * 2018-02-20 2020-12-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Picture/video coding supporting varying resolution and/or efficiently handling region-wise packing
CN117176950A (zh) 2018-03-30 2023-12-05 交互数字Vc控股公司 视频编码和解码中的色度量化参数调整
US10970881B2 (en) 2018-12-21 2021-04-06 Samsung Display Co., Ltd. Fallback modes for display compression
US12033301B2 (en) 2019-09-09 2024-07-09 Nvidia Corporation Video upsampling using one or more neural networks

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7042944B2 (en) * 2000-09-22 2006-05-09 Koninklijke Philips Electronics N.V. Single-loop motion-compensation fine granular scalability
US20020126759A1 (en) * 2001-01-10 2002-09-12 Wen-Hsiao Peng Method and apparatus for providing prediction mode fine granularity scalability
JP2005506815A (ja) * 2001-10-26 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間拡張可能圧縮のための方法及び装置
KR20050078709A (ko) * 2004-01-31 2005-08-08 삼성전자주식회사 스케일러블 비디오 코딩방법 및 디코딩방법과 이를 위한장치
US20050195896A1 (en) * 2004-03-08 2005-09-08 National Chiao Tung University Architecture for stack robust fine granularity scalability
US20050259729A1 (en) 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability
DE102004031407A1 (de) * 2004-06-29 2006-01-26 Siemens Ag Verfahren zur Bildencodierung einer Folge von Originalbildern, sowie dazugehöriges Bilddecodierverfahren, Encodiervorrichtung und Decodiervorrichtung
WO2007018682A1 (en) * 2005-07-22 2007-02-15 Thomson Licensing Method and apparatus for weighted prediction for scalable video coding
JP2009522971A (ja) * 2006-01-10 2009-06-11 ノキア コーポレイション 拡張可能ビデオ符号化のための切換型フィルタアップサンプリング機構
US8315308B2 (en) * 2006-01-11 2012-11-20 Qualcomm Incorporated Video coding with fine granularity spatial scalability
US8014445B2 (en) 2006-02-24 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for high dynamic range video coding
AU2007325737B2 (en) * 2006-11-27 2011-02-10 Dolby Laboratories Licensing Corporation Apparatus and methods for boosting dynamic range in digital images
EP2092748A4 (en) * 2006-12-14 2011-01-05 Thomson Licensing METHOD AND DEVICE FOR CODING AND / OR DECODING VIDEO DATA USING EXPANSION LAYER RESTRICTION FOR SOFTENCE SCALINGABILITY
KR20150126728A (ko) * 2007-10-19 2015-11-12 톰슨 라이센싱 조합된 공간 및 비트 심도 확장성

Also Published As

Publication number Publication date
JP2010531585A (ja) 2010-09-24
US8934542B2 (en) 2015-01-13
ATE484155T1 (de) 2010-10-15
EP2143279B1 (en) 2010-10-06
CN102084653A (zh) 2011-06-01
DE602007009730D1 (de) 2010-11-18
US20100260260A1 (en) 2010-10-14
EP2143279A1 (en) 2010-01-13
WO2009003499A1 (en) 2009-01-08
CN102084653B (zh) 2013-05-08

Similar Documents

Publication Publication Date Title
JP5295233B2 (ja) ビデオエンコーダ、ビデオデコーダ、エンコードするための方法、デコードするための方法、コンピュータプログラム、およびスケーラブルなビットストリーム
US11115651B2 (en) Quality scalable coding with mapping different ranges of bit depths
US11711542B2 (en) Bit-depth scalability
KR20060063532A (ko) 다 계층 기반의 비디오 인코딩 방법, 디코딩 방법 및 상기방법을 이용한 장치
WO2008049445A1 (en) Quality scalable coding
KR20140127405A (ko) 비디오 부호화 및 복호화 방법, 그를 이용한 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111206

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120302

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130611

R150 Certificate of patent or registration of utility model

Ref document number: 5295233

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250