JP5383674B2 - ビット深さスケーラビリティのために向上層残差予測を使ってビデオ・データをエンコードおよび/またはデコードする方法および装置 - Google Patents

ビット深さスケーラビリティのために向上層残差予測を使ってビデオ・データをエンコードおよび/またはデコードする方法および装置 Download PDF

Info

Publication number
JP5383674B2
JP5383674B2 JP2010513605A JP2010513605A JP5383674B2 JP 5383674 B2 JP5383674 B2 JP 5383674B2 JP 2010513605 A JP2010513605 A JP 2010513605A JP 2010513605 A JP2010513605 A JP 2010513605A JP 5383674 B2 JP5383674 B2 JP 5383674B2
Authority
JP
Japan
Prior art keywords
slice
base layer
enhancement layer
coded
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010513605A
Other languages
English (en)
Other versions
JP2010531584A (ja
Inventor
ガオ,ヨンイン
ウー,ユウェン
ワン,チュアンミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2010531584A publication Critical patent/JP2010531584A/ja
Application granted granted Critical
Publication of JP5383674B2 publication Critical patent/JP5383674B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、デジタル・ビデオ符号化の技術分野に関する。新たな型のスケーラビリティであるビット深さスケーラビリティ(bit depth scalability)についての符号化ソリューションが提示される。
近年、通常の8ビット色深さではなくより高い色深さが、科学撮像、デジタル映画、高品質ビデオ機能のあるコンピュータ・ゲームならびに業務用スタジオおよびホームシアター関係のアプリケーションといった多くの分野で、ますます望ましいものとなっている。そこで、現状技術のビデオ符号化規格H.264/AVCはすでに忠実度範囲拡張(FRExt: Fidelity Range Extensions)を含んでいる。これは標本値当たり14ビットまでおよび4:4:4までのクロマ・サンプリングをサポートする。現行のSVC参照ソフトウェアJSVMは高いビット深さはサポートしない。
しかしながら、既存の先進符号化ソリューションはいずれもビット深さスケーラビリティはサポートしていない。二つの異なるデコーダ、あるいはたとえば同じ原ビデオ(raw video)について8ビットおよび12ビットのようなビット深さについての異なる要求をもつクライアントをもつシナリオについては、既存のH.264/AVCソリューションは12ビットの原ビデオをエンコードして第一のビットストリームを生成し、次いで12ビットの原ビデオを8ビットの原ビデオに変換してそれをエンコードして第二のビットストリームを生成するというものである。異なるビット深さを要求する異なるクライアントにビデオが送達される場合、2回送達されねばならない。たとえば、二つのビットストリームが一つのディスクに一緒に収められる。これは圧縮率および動作的な複雑さの両面で低効率である。
欧州特許出願第EP06291041号は、12ビットの原ビデオ全体を1回エンコードしてH.264/AVC互換な基本層(BL: base layer)およびスケーラブルな向上層(EL: enhancement layer)を含む一つのビットストリームを生成するスケーラブルなソリューションを開示している。上述の第一のビットストリームと比較してのスケーラブルなビットストリーム全体のオーバーヘッドは、第二のビットストリームの追加に比べれば小さい。受信側でH.264/AVCデコーダが利用可能であれば、BLサブ・ビットストリームのみがデコードされ、デコードされた8ビット・ビデオを通常の8ビット・ディスプレイ装置で見ることができる。受信側でビット深さスケーラブルなデコーダが利用可能であれば、BLサブ・ビットストリームおよびELサブ・ビットストリームの両方がデコードされて12ビット・ビデオを得ることができ、それを8ビットを超える色深さをサポートする高品質ディスプレイ装置で見ることができる。
H.264/AVCスケーラビリティ拡張SVCは、他の型のスケーラビリティ、たとえば空間的スケーラビリティも提供する。空間的スケーラビリティでは、BLおよびELにおけるピクセル数が異なる。こうして、ビット深さスケーラビリティを他のスケーラビリティ型、たとえば空間的スケーラビリティとどのように組み合わせるかの問題が生じる。本発明は、この問題についてのソリューションを提供する。
請求項1は、ビット深さスケーラビリティおよび他のスケーラビリティ型の組み合わせを許容するエンコード方法を開示する。請求項5は、対応するデコード方法を開示する。前記エンコード方法を利用する装置が請求項9で開示され、前記デコード方法を利用する装置が請求項10で開示される。
本発明によれば、符号化効率を改善するために、ルックアップ・テーブル(LUT)ベースの逆トーン・マッピング(inverse tone mapping)技法が層間予測(inter-layer prediction)に用いられる。LUTベースの逆トーン・マッピング技法は、BLスライス型がIスライスであるときに使われる。LUTは、エンコーダにおける再構成されたBL Iスライスおよび共位置の(collocated)もとのELスライスに基づいて生成される。ソリューション全体は、SVCの構造内で実装でき、他の型のスケーラビリティ、すなわち時間的、空間的およびSNRスケーラビリティとの互換性がサポートされる。
ある実施形態では、BL情報は論理的な二段階においてアップサンプリングされる。一つの段階はテクスチャ・アップサンプリングで、他方の段階はビット深さのアップサンプリングである。テクスチャ・アップサンプリングは、ピクセル数を増すプロセスであり、ビット深さアップサンプリングは各ピクセルがもつことのできる値の数を増すプロセスである。前記値はピクセルの色強度に対応する。アップサンプリングされたBL単位は、共位置のEL単位を予測するために使われる。エンコーダはELビデオ・データから残差を生成し、その残差はさらにエンコード(通例エントロピー符号化)され、送信される。アップサンプリングされるべきBL情報はいかなる粒度でもよい。たとえば、単一ピクセル、ピクセル・ブロック、マクロブロック(MB)または画像全体の単位である。さらに、上記二つの論理的なアップサンプリング段階を単一の段階で実行することも可能である。基本層情報はエンコーダ側でアップサンプリングされるとともに、同じようにしてデコーダ側でもアップサンプリングされる。ここで、アップサンプリングとは空間的およびビット深さの特徴についてである。
さらに、組み合わされた空間的およびビット深さアップサンプリングは、イントラ符号化された画像についておよびインター符号化された画像について実行されることができる。
具体的には、基本層および向上層をもつビデオ・データをエンコードする方法であって、基本層のピクセルは向上層のピクセルより小さなビット深さおよびより低い空間解像度をもち、当該方法は
基本層データをスライス・レベルでエンコードし、ここで、第一の諸基本層スライスはイントラ符号化され、第二の諸基本層スライスはインター符号化され、
エンコードされた基本層スライスを再構成し、
再構成された基本層スライスをアップサンプリングし、ここで、対応する向上層スライスの第一の予測されたバージョンであって、基本層スライスより高い空間的、時間的またはSNR解像度をもつものが得られ、
第一のイントラ符号化された基本層スライスについて、アップサンプリングされた再構成された第一の基本層スライスと対応するもとの向上層スライスとの間の個別のマッピングを定義するトーン・マッピング・テーブル(LUT)を生成し、ここで、両方のスライスが互いに比較され、第二のインター符号化された基本層スライスについてはトーン・マッピング・テーブルは生成されず、
前記トーン・マッピングに基づいて向上層スライスの第一の予測されたバージョンをビット深さアップサンプリングし、ここで、対応する向上層スライスの第二の予測されたバージョンであって向上層スライスの第一の予測されたバージョンより高いビット深さ解像度をもつものが得られ、
もとの向上層スライスと向上層スライスの対応する第二の予測されたバージョンとの間の差である向上層残差を生成し、
向上層残差を向上層スライス中にエンコードし、ここで、向上層スライスはそのスライス・ヘッダにその対応するトーン・マッピング・テーブルを含む、
ステップを含む。
本発明のある側面によれば、ビデオ・データをデコードする方法が、
向上層情報および基本層情報を受信し、
向上層情報から、イントラ符号化された向上層スライスのスライス・ヘッダからのトーン・マッピング・データを抽出し、
受信された情報に対して逆量子化および逆変換(たとえばDCT)を実行し、ここで、逆量子化および逆変換された向上層情報は残差情報を含み、
イントラ符号化された基本層スライスを再構成し、
基本層情報をアップサンプリングし、ここでピクセル数が増加され、増加したピクセル数についてピクセル毎の値深さ(value depth)が増加され、ここで、イントラ符号化されたスライスについては、再構成された基本層スライスおよび抽出されたトーン・マッピング・データが使用され、予測された向上層情報が得られ、
予測された向上層情報および逆量子化され逆変換された向上層情報から再構成された向上層ビデオ情報を再構成する、
ステップを含む。
本発明のある実施形態では、前記エンコード方法はBL情報をイントラ・エンコードし、イントラ・エンコードされたBL情報を再構成し、再構成されたBL情報に対して空間的アップサンプリングおよび色ビット深さアップサンプリングを実行し、現在のEL情報(すなわち画像データ)と前記空間的および色ビット深さアップサンプリングされたBL情報(すなわち画像データ)との間の差であるEL残差を生成するステップを含む。
本発明のある実施形態では、前記エンコード方法は、(インター符号化されたBLについて通常であるように)現在のBL画像データと予測されたBL画像データとの間の差であるBL残差を生成し、前記予測されたBL画像データは現在のまたは前のBL画像のデータから予測されることができ、前記BL残差をエンコード(すなわち変換および量子化)し、エンコードされたBL残差を再構成(逆変換および逆量子化)し、再構成されたBL残差に対して残差(空間的)アップサンプリングおよび色ビット深さアップサンプリングを実行し、現在のEL残差データと前記空間的および色ビット深さアップサンプリングされた再構成されたBL残差との差であるEL層間残差を生成する、ステップを含む。
有利には、二つの前述したエンコーダ実施形態は、イントラ・エンコードされたビデオ・データおよびインター・エンコードされたビデオ・データを適応的にエンコードできる組み合わされたエンコーダに組み合わされることができる。
本発明のある実施形態では、前記デコード方法はさらに、(暗黙的に)受信されたBL情報がイントラ符号化されていることを検出し、受信された逆量子化および逆変換されたBL情報からBLビデオを再構成し、再構成されたBLビデオをアップサンプリングし、ここで、アップサンプリングはテクスチャー(空間的)アップサンプリングおよびビット深さアップサンプリングを含み、予測されたEL情報が得られ、予測されたEL情報ならびに逆量子化および逆変換された受信されたEL情報から再構成されたELビデオ情報を再構成する、ステップを含む。
本発明のある実施形態では、前記デコード方法は、(暗黙的に)受信されたBL情報がインター符号化されていることを検出し、受信されたBLデータからBL残差を抽出し、抽出されたBL残差に対して残差(空間的)アップサンプリングおよび色ビット深さアップサンプリングを実行し、逆量子化および逆変換されたEL情報からEL残差を抽出し、EL残差およびアップサンプリングされたBL残差から再構成されたEL残差を再構成し、再構成されたEL残差および前に再構成されたEL情報から再構成されたELビデオ情報を再構成する、ステップを含む。
有利には、二つの前述したデコーダ実施形態は、イントラ・エンコードされたビデオ・データおよびインター・エンコードされたビデオ・データを適応的にデコードできる組み合わされたデコーダに組み合わされることができる。
本発明の別の側面によれば、基本層および向上層をもつビデオ・データをエンコードする装置であって、基本層は向上層より低い色解像度およびより低い空間解像度をもち、当該装置は、
基本層データをスライス・レベルでエンコードし、ここで、第一の諸基本層スライスはイントラ符号化され、第二の諸基本層スライスはインター符号化される、手段と、
エンコードされた基本層スライスを再構成する手段と、
再構成された基本層スライスをアップサンプリングし、ここで、対応する向上層スライスの第一の予測されたバージョンであって、基本層スライスより高い空間的、時間的またはSNR解像度をもつものが得られる、手段と、
第一のイントラ符号化された基本層スライスについて、アップサンプリングされた再構成された第一の基本層スライスと対応するもとの向上層スライスとの間の個別のマッピングを定義するトーン・マッピング・テーブルを生成し、ここで、両方のスライスが互いに比較され、第二のインター符号化された基本層スライスについてはトーン・マッピング・テーブルは生成されない、手段と、
前記トーン・マッピングに基づいて向上層スライスの第一の予測されたバージョンをビット深さアップサンプリングし、ここで、対応する向上層スライスの第二の予測されたバージョンであって向上層スライスの第一の予測されたバージョンより高いビット深さ解像度をもつものが得られる、手段と、
もとの向上層スライスと向上層スライスの対応する第二の予測されたバージョンとの間の差である向上層残差を生成する手段と、
向上層残差を向上層スライス中にエンコードし、ここで、向上層スライスはそのスライス・ヘッダにその対応するトーン・マッピング・テーブルを含む、手段とを備える。
本発明のある側面によれば、ビデオ・データをエンコードまたはデコードする装置が、空間的(残差またはテクスチャー)アップサンプリングを実行する手段と、色ビット深さアップサンプリングを実行する手段とを備える。ここで、空間的アップサンプリングのための手段はBL情報内の値の数を増し、色ビット深さアップサンプリングのための手段は値の色範囲を増し、空間的アップサンプリングおよび色ビット深さアップサンプリングされたBLデータが得られる。
本発明の別の側面によれば、エンコードされたスケーラブルなビデオ信号はイントラ符号化されたBLデータおよびイントラ符号化されたELデータを含み、前記イントラ符号化されたELデータは、アップサンプリングされたBL画像とEL画像との間の差である残差を含み、その残差は差分テクスチャー情報および差分ビット深さ情報を含む。
提示される符号化ソリューションのさまざまな実施形態はH.264/AVCおよびH.264/AVCスケーラブル拡張(SVC)において現在定義されているあらゆる種類のスケーラビリティと互換である。
本発明の有利な実施形態が従属請求項、以下の記述および図面において開示される。
本発明の例示的な実施形態について、付属の図面を参照しつつ述べる。
色ビット深さスケーラブル符号化の枠組みを示す図である。 空間的スケーラビリティのテクスチャー内(intra texture)層間(inter-layer)予測の、色ビット深さスケーラビリティへの拡張のためのエンコーダを示す図である。 空間的スケーラビリティの残差層間予測の、色ビット深さスケーラビリティへの拡張のためのエンコーダを示す図である。 空間的スケーラビリティのテクスチャー内層間予測の、色ビット深さスケーラビリティへの拡張のためのデコーダを示す図である。 空間的スケーラビリティの残差層間予測の、色ビット深さスケーラビリティへの拡張のためのデコーダを示す図である。 空間的スケーラビリティの残差層間予測の、色ビット深さスケーラビリティへの拡張の枠組みと論理的に等価な図である。
図1に示されるように、本ビデオ・エンコーダへの入力として二つのビデオが使用される:Nビットの原ビデオおよびMビットのビデオである(M<Nで、通例M=8)。Mビット・ビデオはNビットの原ビデオから分解されることもできるし、あるいは他の方法で与えられることもできる。スケーラブルなソリューションは、BLのピクチャを使うことによって二つの層の間の冗長性を減らすことができる。一方は8ビット・カラーで他方はNビット・カラー(N>8)の二つのビデオ・ストリームがエンコーダに入力され、その出力はスケーラブルなビットストリームである。一つのNビット・カラー・データ・ストリームのみが入力されて、それからMビット(M<N)のカラー・データ・ストリームがBLのために内部的に生成されることも可能である。Mビット・ビデオは、含まれているH.264/AVCエンコーダを使ってBLとしてエンコードされる。BLの情報は、ELの符号化効率を改善するために使用できる。これは、本稿では層間予測(inter-layer prediction)と呼ばれる。各ピクチャ――MBの集まり――は二つのアクセス単位をもつ。一方はBL用であり、他方はEL用である。符号化された両ビットストリームは多重化されたスケーラブルなビットストリームを形成する。BLエンコーダはたとえばH.264/AVCエンコーダを含み、再構成が、ELエンコードのために使われるNビット・カラー・ビデオを予測するために使われる。
図1に示されているように、スケーラブルなビットストリームは例示的にAVC準拠のBLビットストリームを含んでおり、AVC準拠のBLビットストリームはBLデコーダ(従来式のAVCデコーダ)によってデコードできる。次いで、エンコーダにおけるのと同じ予測がデコーダ側においてなされ(それぞれの指標(indication)の評価後)、予測されたNビット・ビデオが得られる。このNビットの予測されたビデオを用いて、ELデコーダは次いでNビット予測を使って高品質(High Quality)ディスプレイ(HQ)のための最終的なNビット・ビデオを生成する。
以下では、色ビット深さ(color bit depth)の用語が使われるとき、それはビット深さ、すなわち値当たりのビット数を意味する。これは通例、色強度(color intensity)に対応する。
ある実施形態では、本発明は、SVCの空間的、時間的および品質スケーラビリティの現行の構造に基づいており、向上された色ビット深さのためのビット深さスケーラビリティによって向上される。よって、この実施形態は、現行のSVC規格と完全に互換である。しかしながら、当業者にとっては、それを他の規格に適応させることは容易であろう。ビット深さスケーラビリティの鍵は、ビット深さ層間予測である。層間予測を使うことによって、Nビット・ビデオとMビット・ビデオの間の差がELとしてエンコードされる。陳述の便宜上、以下では次の記号を使うことにする:
BLorg:基本層のもとのMB
BLres:基本層の残差MB
BLrec:基本層の再構成されたMB
ELorg:向上層のもとのMB
ELrec:向上層の再構成されたMB
EL'res:向上層の残差MB
Prec{ }:色ビット深さ層間予測演算子
Pret{ }:テクスチャー(空間的)層間予測演算子
Prer{ }:残差(空間的)層間予測演算子。
本発明は、符号化効率を改善するために、ビット深さスケーラブル符号化の層間予測(inter-layer prediction)に用いられるLUTベースの逆トーン・マッピング(inverse tone mapping)技法を適用する。LUTは、再構成されたBLスライスと共位置の(collocated)もとのELスライスとの間の関係に基づいて、エンコーダ側で生成される。一般には、各ルミナンス/クロミナンス・チャネルY、CbおよびCrについて一つのLUTが生成される。実際上は、異なるチャネルが同じLUTを共有してもよい。その際、生成されたLUTはエンコーダにおける層間予測の際に、BLとELとの間の冗長性を相関除去する(de-correlate)ために使用される。LUTはビットストリーム中に挿入され、デコーダ側で回復できる。デコーダは層間予測において同じLUTを使い、それにより高品質でELを再構成できる。
本発明のある側面によれば、LUTベースの逆トーン・マッピング技法は、BLスライスがイントラ符号化されている(Iスライス)ときに使われるのみである。これは、たとえば現行のSVC規格で使われるようなイントラ符号化されたスライスの単一ループ・デコードに準拠し、やはり現行のSVC規格でサポートされている他の型のスケーラビリティとも互換であるという利点がある。
例示的には、SVC互換のMBレベルのビット深さスケーラブルな符号化ソリューションは、現行のSVC空間的スケーラビリティに基づく。以下では、この空間的スケーラビリティの、イントラ符号化およびインター符号化両方のためのビット深さスケーラビリティへの拡張の詳細な記述が与えられる。SVC互換なビット深さスケーラブルな符号化の第一のステップは、H.264/AVC FRExt拡張がELエンコードおよびデコードにおいて行うような高ビット符号化(現在のところ標本値あたり10ないし14ビット)をサポートすることである。
〈イントラ符号化〉
図2は、現行のSVC規格で使われるような空間的スケーラビリティのテクスチャー内層間予測(intra texture inter-layer prediction)の、ビット深さスケーラビリティへの拡張のためのエンコーダを示している。ビット深さアップサンプリング・ブロックBDUpがビット深さスケーラビリティへの拡張を表し、一方、他のブロックは現行のSVC規格における空間的スケーラビリティを表す。このブロックBDUpが従来式のSVCイントラ・エンコーダと本発明に基づくイントラ・エンコーダとの間の差である。図2では、Mビット基本層MBがBLエンコーダに入力され、Nビット向上層MBがELエンコーダに入力される(N>M)。現行のSVC規格では、テクスチャ・アップサンプリングは空間的テクスチャー内層間予測のために設計されたものである。図2では、テクスチャ・アップサンプリングTUpへの入力は再構成されたBLマクロブロックBLrecであり、出力は、ELマクロブロックの空間的に(テクスチャー)予測されたバージョンPret{BLrec}である。ビット深さスケーラビリティは、テクスチャ・アップサンプリングTUpの直後(この例では)のビット深さアップサンプリングBDUpのステップによって実現される。実際上は、まずテクスチャ・アップサンプリングを空間的層間予測として適用するのがしばしば有利であり、次いでビット深さアップサンプリングBDUpがビット深さ層間予測として行われる。テクスチャ・アップサンプリングTUpおよびビット深さアップサンプリングBDUpの両方を用いると、NビットELマクロブロックの予測されたバージョンPrec{Pret{BLrec}}が得られる。同様の残差は、両予測ステップを逆順にしても得られる。
もとのNビットELマクロブロックELorgとその予測されたバージョンPrec{Pret{BLrec}}との間の残差EL'resが差演算子DELによって得られる。残差は本発明のある実施形態では、SVCにおけるようにさらに変換Tされ、量子化Qされ、エントロピー・エンコードECELされ、ELサブ・ビットストリームを形成する。数学的表現では、色ビット深さイントラ・アップサンプリングの残差は
EL'res=ELorg−Prec{Pret{BLrec}} (式1)
である。ここで、Pret{ }はテクスチャ・アップサンプリング演算子を表す。
エンコード・プロセスの種々の変形が可能であり、制御パラメータによって制御できる。EL残差が再構成されたEL情報に基づいて予測されるかアップサンプリングされたBL情報に基づいて(based)予測されるかを決める例示的なフラグbase_mode_flagが図2に示されている。
以下では、SVCビット深さスケーラビリティにおけるLUTベースの逆トーン・マッピングを可能にする技術的解決策の例示的な実施形態が提示される。詳しくは、表1の行46〜71に例示的に示されるように、スケーラブル拡張におけるスライス・ヘッダにいくつかの新しいシンタックス要素が加えられる。
Figure 0005383674
Figure 0005383674
Figure 0005383674
表1 スケーラブル拡張におけるスライス・ヘッダ内の例示的な実装。
以下の表現が使われる:
inv_tone_map_flagが1に等しいことは、Yチャネルのための層間予測において逆トーン・マッピングのプロセスが呼び出されるべきことを指定する。inv_tone_map_flagが0に等しいことは、Yチャネルのための層間予測において逆トーン・マッピングのプロセスが呼び出されないことを指定する(デフォルト)。
lookup_table_luma_inv_tone_map_flagが1に等しいことは、Yチャネルのための層間予測においてルックアップ・テーブルに基づく逆トーン・マッピングが用いられることを指定する。lookup_table_luma_inv_tone_map_flagが0に等しいことは、Yチャネルのための層間予測においてルックアップ・テーブルに基づく逆トーン・マッピングが用いられないことを指定する(デフォルト)。
level_lookup_table_luma_minus8に8を加えたものは、Yチャネルについてのルックアップ・テーブルのレベル数を指定する。
offset_val_lookup_table_luma[i]は、Yチャネルについてのルックアップ・テーブル中のレベルiがマッピングされる値を次のようにして指定する:
iが0に等しくなければ、Yチャネルについてのルックアップ・テーブル中のレベルiがマッピングされる値s[i]はs[i−1]にoffset_val_lookup_table_luma[i]を加えたものに等しく、ここで、s[i−1]はYチャネルについてのルックアップ・テーブル中のレベルi−1がマッピングされる値である。
iが0に等しければ、Yチャネルについてのルックアップ・テーブル中のレベルiがマッピングされる値s[i]はoffset_val_lookup_table_luma[i]に等しい。
lookup_table_chroma_inv_tone_map_flagが1に等しいことは、CbおよびCrチャネルのための層間予測においてルックアップ・テーブルに基づく逆トーン・マッピングが用いられることを指定する。lookup_table_luma_inv_tone_map_flagが0に等しいことは、CbまたはCrチャネルのための層間予測においてルックアップ・テーブルに基づく逆トーン・マッピングが用いられないことを指定する(デフォルト)。
lookup_table_chrom_inv_tone_map_override_flagが0に等しいことは、CbおよびCrチャネルについての層間予測においてYチャネルについてのルックアップ・テーブルが再使用されることを指定する(デフォルト)。lookup_table_chrom_inv_tone_map_override_flagが1に等しいことは、CbおよびCrチャネルについての層間予測においてYチャネルについてのルックアップ・テーブル以外の異なるルックアップ・テーブルが使用されることを指定する。
level_lookup_table_chroma_minus8に8を加えたものは、CbおよびCrチャネルについてのルックアップ・テーブルのレベル数を指定する。
offset_val_lookup_table_cb[i]は、Cbチャネルについてのルックアップ・テーブル中のレベルiがマッピングされる値を次のようにして指定する:
iが0に等しくなければ、Cbチャネルについてのルックアップ・テーブル中のレベルiがマッピングされる値s[i]はs[i−1]にoffset_val_lookup_table_cb[i]を加えたものに等しく、ここで、s[i−1]はCbチャネルについてのルックアップ・テーブル中のレベルi−1がマッピングされる値である。
iが0に等しければ、Cbチャネルについてのルックアップ・テーブル中のレベルiがマッピングされる値s[i]はoffset_val_lookup_table_cb[i]に等しい。
offset_val_lookup_table_cr[i]は、Crチャネルについてのルックアップ・テーブル中のレベルiがマッピングされる値を次のようにして指定する:
iが0に等しくなければ、Crチャネルについてのルックアップ・テーブル中のレベルiがマッピングされる値s[i]はs[i−1]にoffset_val_lookup_table_cr[i]を加えたものに等しく、ここで、s[i−1]はCrチャネルについてのルックアップ・テーブル中のレベルi−1がマッピングされる値である。
iが0に等しければ、Crチャネルについてのルックアップ・テーブル中のレベルiがマッピングされる値s[i]はoffset_val_lookup_table_cr[i]に等しい。
LUTはもとのELスライスおよびアップサンプリングされた再構成されたBLスライスに基づいて生成され、したがってデコーダにおいてアップサンプリングされた再構成されたBLスライスをELスライスにマッピングするために使用できる。これは、LUTが、デコーダ側で利用可能なスライス、すなわち(アップサンプリングされた)再構成されたBLスライスと、最高の利用可能な品質をもつELスライス、すなわちもとのELスライスとの間のマッピングを定義するという利点をもつ。こうして、本方法は、デコーダのニーズに対して最適に適応される。
エンコーダおよびデコーダにおいて、イントラ符号化されたBLは再構成され、層間予測がもとのELとアップサンプリングされた再構成されたBLとの間に適用される。イントラ符号化されたスライスについては、BLがIスライスであればLUTはBL/ELスライス対について個々に生成され、そのLUTがELスライスと一緒に送信される。ELスライスは、エンコーダにおいて、このLUTを使って再構成されたBLスライスから予測され、残差がイントラ符号化されて送信される。次いで、LUTはデコーダにおいて再構成されたBLスライス(Iスライス)に適用され、残差が加えられる。結果は、より高い色ビット深さをもつELスライス(Iスライス)である。PおよびBスライスについては、LUT以外の別の技法が使われるべきである。これは、もとのBLとELとの間で非線形変換がある可能性があるからである。再構成されたBLともとのELについてうまく機能するLUTが残差についてはうまく機能しないこともありうるのである。
LUTベースの逆トーン・マッピングをサポートするための追加されたシンタックス要素に関し、それらをslice_header_in_scalable_extension中に挿入することに二つの利点がある。
第一に、実際上、異なるスライスが異なるLUTをもつことができる。スライス・レベルで新しいシンタックス要素を追加することは、逆トーン・マッピングを用いることの柔軟性を許容する。たとえば、スライスのオブジェクト・ベースのセグメンテーションの場合、異なるスライスは異なる特性を負い(owe)、BLスライスと共位置のELスライスとの間の関係は、異なるスライスの間で全く異なることがありうる。したがって、異なるスライスについて異なるLUTを生成することは有益でありうる。
さらに、JSVMにおいてスライス・レベル・シンタックス要素がビットストリーム中に書かれるとき、再構成されたBLは利用可能であり、次いでLUTが生成できる。もしLUT情報がたとえばシーケンス・パラメータ・セット(SPS: Sequence Parameter Set)またはピクチャー・パラメータ・セット(PPS: Picture Parameter Set)中に書かれるとしたら、これはJSVMの著しい変更を要求するであろう。
〈インター符号化〉
インター符号化のためのビット深さスケーラビリティは、イントラ符号化についてとは異なる仕方で実装される。現行のSVC規格では、動きアップサンプリングおよび残差アップサンプリングは空間的なテクスチャー間(inter texture)層間予測のために設計されていた。
インター符号化されたスライス(PスライスおよびBスライス)について、層間予測は再構成されたBLスライスに基づくのではない。これは、SVCの空間的スケーラビリティへの準拠を可能にする。したがって、動き補償された予測は、空間的スケーラビリティにおいてなされるように、ELにおいて適用される。再構成されたBLともとのELとの間の残差は次いで変換され、量子化され、エントロピー符号化される。
PスライスおよびBスライスについては、図3および図5に示される技法が適用される。BL残差からEL残差を予測するために、Iスライスの一つと同じLUTを使うことも可能かもしれないが、もとのBLとELとの間にありうる非線形変換のため、結果は良好ではない。このように、再構成されたBLともとのELについてうまく機能するLUTが残差についてはうまく機能しないこともありうる。
図3は、インター符号化された(PおよびB)マクロブロックについての残差層間予測の拡張のためのエンコーダを示している。ビット深さスケーラビリティは、(空間的)残差アップサンプリングRUpの直後(この例では)のビット深さアップサンプリングBDUpのステップによって実現される。残差アップサンプリングRUpへの入力は再構成されたBL残差BLres,rec,kであるが、これは(後述の式(3)に表されるような)送信されるべきBL残差BLres,kの再構成されたバージョンである。実際上は、しばしばまず動きアップサンプリングMUpがなされ、次いで残差アップサンプリングRUpが一種の空間的層間予測としてなされる。最後に、ビット深さアップサンプリングBDUpがビット深さ層間予測としてなされる。動きアップサンプリングMUp、残差アップサンプリングRUpおよび色ビット深さアップサンプリングBDUpを用いて、NビットELマクロブロックの予測されたバージョンPrec{Prer{BLres,rec,k}}が得られる。結果として得られる向上層残差EL'res,k(後述の式(3)で定義)はさらに、SVCにおけるように変換Tされ、量子化Qされ、エントロピー符号化されてELサブ・ビットストリームを形成する。
エンコード・プロセスのさまざまな変形が可能であり、制御パラメータによって制御できる。図3に示されるフラグは、動き補償がELから得られる動きベクトルに基づくかBLからアップサンプリングされるかを制御するbase_mode_flagおよびBL残差がEL残差を予測するために使われるかどうかを制御するresidual_pred_flagである。図2に示されるように、base_mode_flagはまた、テクスチャー内層間予測を制御するためにも使われる。
図4は、層間予測を利用する、イントラ符号化されたBL画像についての例示的なデコーダを示す。エンコードされたBLおよびEL情報をたとえば多重化されたパケット化ビットストリームにおいて受信し、EL情報からBLを分離したのちたのち、BL情報およびEL情報がエントロピー・デコードされる。次いで、逆量子化Q-1および逆変換T-1が適用される。BLについては、処理は従来式のSVCについてと同じである:画像が空間的イントラ予測を使って、すなわち同じ画像の以前に再構成された情報に基づいて再構成される。ブロック解除(deblocking)後、結果として得られるBL信号BLrecは、上記のように、8ビット色深さをもって標準的なSVCディスプレイ上に表示されることができる。しかしながら、代替的に、この信号は、共位置のEL画像の予測されたバージョンPrec{Pret{BLrec}}を生成するためにも使用できる。この目的のため、その信号はテクスチャ・アップサンプリングTUpされ、ここで、EL画像のテクスチャー予測されたバージョンPret{BLrec}が得られる。これは次いで、抽出されたルックアップ・テーブルを使ってビット深さアップサンプリングBDUpされる。テクスチャーおよびビット深さアップサンプリングされた再構成されたBL画像Prec{Pret{BLrec}}は次いで、改善された逆量子化および逆変換されたEL残差EL'resを更新A2,ELするために使われる。それにより得られる信号が、ブロック解除後に、HQディスプレイのためのELビデオELrecとして出力できる。
もちろん、ELモードで動作させられているデコーダは内部的にはBLビデオBLrecをも生成する。EL予測にBLビデオが必要だからである。しかしながら、BLビデオは必ずしもデコーダ出力において利用可能である必要はない。ある実施形態では、デコーダは、BLビデオBLrecのために一つ、ELビデオELrecのために一つで、二つの出力をもつ。一方、別の実施形態では、ELビデオELrecについての出力のみをもつ。
図2のイントラ・エンコーダについて上記したように、デコーダもエンコードに対応して種々のモードで機能できる。したがって、各フラグがビットストリームから抽出されて評価される。たとえば、層間予測が使われるかどうかを決める指標base_mode_flagである。使われない場合、EL画像は、ブロック解除、空間的予測および空間的に予測された画像の更新A1,ELを使って従来式に再構成される。
図5は、インター符号化された単位、たとえばインター符号化されたMBのための例示的なデコーダを示している。エントロピー符号化されていてもよく相応してデコードされるBLビットストリームから、ある実施形態では、動きデータが検出および抽出され、必要ならばELのためにアップサンプリングされることができる。これは、BLまたはELビットストリーム中に含められる指標によって指示されることができる。さらに、BLビットストリーム・データは逆量子化Q-1および逆変換T-1され、それにより、再構成されたBL残差BLres,kが得られる。BLビデオ信号BLdecが必要とされるなら、さらなるBL処理は、ブロック解除、フレーム・メモリへの記憶、動き補償および残差BLres,kによる動き補償された予測画像の更新を含む通常のSVCデコードを含む。ELビデオ信号のみが必要とされる場合には、これらのステップは省略できる。
残差BLres,kはELデータを予測するために使われる:それは、一種の空間的アップサンプリングであり、すなわち値の数が増加される残差アップサンプリングRUpと、ビット深さ、よって各値の可能な範囲が増加されるビット深さアップサンプリングBDUpとによってアップサンプリングされ、予測された信号Prec{Prer{BLres,k}}を生成する。共位置のEL単位が残差層間予測を使ってエンコードされていた場合、フラグresidual_pred_flagによって指示されるように、予測された残差Prec{Prer{BLres,k}}が受信された逆量子化および逆変換されたEL残差EL'res,kを更新A'1するために使われる。それにより、実際のEL残差ELres,kが得られる。受信された逆量子化および逆変換されたEL残差EL'res,kは、原理的には、通常の空間的EL残差Rorgと、前の単位k−1からエンコーダにおいて再構成されアップサンプリングされた残差Rrec,k-1(αΔx,αΔy)との間の差と等価である。
さらなるEL処理は原理的にはSVCと同様である(ただし、向上されたビット深さを使う):再構成された残差ELres,kは、ブロック解除DeblkEL、フレーム・メモリFMへの記憶および再構成された画像ELrec,k-1の動き補償(motion compensation)MCのステップにより予測されたEL画像S_ELrec,k-1=ELrec,k-1(αΔx,αΔy)を更新するために使われる。受信された向上層データELencが動き情報(motion information)ELMIを含んでいる場合、動き情報は抽出され、動き補償ユニットMCに与えられることができる。代替的に、BLからのアップサンプリングMUpされた動き情報が使用されることもできる。
明らかに、本発明に基づく改善されたEL残差はSVC空間的スケーラビリティにおいて定義されるものとは異なっている。しかしながら、そのエンコードは、原理的には、図6に示されるように、もとのELマクロブロックELorg,kとテクスチャー(空間的)およびビット深さアップサンプリングされたBLマクロブロックPrec{Prer{BLorg,k}}との間の差のインター・エンコードと等価である。
空間的スケーラビリティのビット深さスケーラビリティへの提示された拡張の一つの利点は、色ビット深さスケーラビリティへの拡張を実現するために新しい予測モードが必要とされないということである。
特にインター符号化についてのもう一つの利点は、最終的にエンコードされるEL残差が「残差の残差」であり、したがって、(式3)で定義されるような層間残差のインター・エンコードと等価であるので、高い符号化効率が得られるということである。実際上、インター符号化における最終的な符号化されたEL残差は、もとのELマクロブロックから、動き(アップサンプリングされた動き)補償された再構成された参照ELマクロブロックを引いて、次いで共位置のBL再構成された残差の動き補償された残差アップサンプリングされ次いでビット深さアップサンプリングされたバージョンを引いたものと等価である。
あるさらなる利点は、インター符号化の場合については、BLマクロブロックを再構成する必要がないということである。こうして、BL再構成はスキップでき、これはデコーダをより簡単にする。
有利には、色ビット深さスケーラビリティのイントラ符号化が、提示されるイントラ色ビット深さ層間予測によって実現される。このイントラ色ビット深さ層間予測は、ある実施形態ではテクスチャー内層間予測の直後に続く。
本発明のさらなる利点は、他の型のスケーラビリティとの完全な互換性、堅牢性および先んだ技術への拡張可能性である。具体的には、本発明は、LUTベースの逆トーン・マッピングを基本層Iスライスのみに適用する単一ループ・デコードの枠組みを保持したまま符号化効率を改善する。
また、インター符号化されたスライスのアップサンプリングのために再構成されたスライスが使われることも利点である。というのも、デコーダにおいては再構成されたBLのみならずもとのBLが利用可能だからである。したがって、エンコーダ側での予測はデコーダ側での予測によりよく適応され、それにより残差がよりよくなり、デコーダ側においてよりよい予測および再構成結果が達成できる。
本発明は、スケーラブルなエンコーダ、スケーラブルなデコーダおよびスケーラブルな信号のために、特に種々の品質の層および高い層間冗長性をもつビデオ信号または他の型の信号のために使用できる。
本発明が純粋に例として記載されてきたのであり、本発明の範囲から外れることなく細部の修正がなしうることは理解されるであろう。本記載ならびに(適切な場合には)請求項および図面において開示されている各特徴は、独立して、あるいは任意の適切な組み合わせにおいて設けられてよい。諸特徴は(適切な場合には)ハードウェア、ソフトウェアまたは両者の組み合わせにおいて実装されうる。請求項に参照符号が現れたとしてもあくまでも例示のためであり、特許請求の範囲に対して何ら限定する効果をもつものではない。

Claims (7)

  1. 基本層および向上層をもつビデオ・データをエンコードする方法であって、基本層は向上層に比べより低いビット深さ解像度およびより低い空間的、時間的および/またはSNR解像度をもち、当該方法は、
    ・基本層データをスライス・レベルでエンコードする段階であって、ここで、第一の諸基本層スライスはイントラ符号化され、第二の諸基本層スライスはインター符号化される、段階と;
    ・エンコードされた基本層スライスを再構成する段階であって、第一のイントラ符号化された基本層スライスから、再構成された第一の基本層スライスが得られ、第二のインター符号化された基本層スライスから、再構成された第二の基本層スライスが得られる、段階と;
    ・前記再構成された第一および第二の基本層スライスをアップサンプリングする段階であって、対応する向上層スライスの第一の予測されたバージョンであって基本層スライスより高い空間的、時間的またはSNR解像度をもつものが得られ、前記アップサンプリングは、第二の再構成された基本層スライスの場合には、再構成された基本層残差データのアップサンプリングを含む、段階と;
    ・第一のイントラ符号化された基本層スライスについて、アップサンプリングされた再構成された第一の基本層スライスと対応するもとの向上層スライスとの間の個別のマッピングを定義するトーン・マッピング・テーブル(LUT)を生成する段階であって、両方のスライスが互いに比較され、第二のインター符号化された基本層スライスについてはトーン・マッピング・テーブルは生成されず、イントラ符号化された各スライス対については個別のトーン・マッピング・テーブルが生成されエンコードされ、インター符号化されたスライス対についてはトーン・マッピング・テーブルは生成されない、段階と;
    ・向上層スライスの前記第一の予測されたバージョンをビット深さアップサンプリングする段階であって、向上層スライスの前記第一の予測されたバージョンが第一のイントラ符号化された基本層スライスから得られる場合には前記ビット深さアップサンプリングは前記トーン・マッピング・テーブルに基づき、向上層スライスの前記第一の予測されたバージョンが第二のインター符号化された基本層スライスから得られる場合には前記ビット深さアップサンプリングは前記トーン・マッピング・テーブルに基づかず、対応する向上層スライスの第二の予測されたバージョンであって向上層スライスの前記第一の予測されたバージョンより高いビット深さ解像度をもつものが得られる、段階と;
    ・もとの向上層スライスと向上層スライスの対応する前記第二の予測されたバージョンとの間の差である向上層残差を生成する段階と;
    ・前記向上層残差を向上層スライス中にエンコードする段階であって、前記向上層スライスはそのスライス・ヘッダにその対応するトーン・マッピング・テーブルを含む、段階とを含む、
    方法。
  2. イントラ符号化されたスライスについて、ルミナンス・チャネルとクロミナンス・チャネルについて別個のトーン・マッピング・テーブルが生成される、請求項に記載の方法。
  3. 基本層および向上層をもち、スライス・レベルでエンコードされているビデオ・データをデコードする方法であって、
    ・向上層情報および基本層情報を受領する段階と;
    ・前記向上層情報から、イントラ符号化された向上層スライスのスライス・ヘッダからのトーン・マッピング・データを抽出する段階と;
    ・受領された情報に対して逆量子化および逆変換を実行する段階であって、逆量子化および逆変換された向上層情報は残差情報を含む、段階と;
    ・受領されたインター符号化された向上層情報から、動き情報を抽出する段階と;
    ・第一の、イントラ符号化された基本層スライスおよび第二の、インター符号化された基本層スライスを再構成する段階と;
    ・前記第二の、インター符号化された基本層スライスから、前記向上層動き情報を使って、向上層ビデオを再構成する段階と;
    前記第一のイントラ符号化された基本層スライスおよび前記第二のインター符号化された基本層スライスを含む基本層情報をアップサンプリングする段階であって、ピクセル数が増加され、増加したピクセル数についてピクセル毎のビット深さが増加され、ここで、抽出されたトーン・マッピング・データはイントラ符号化されたスライスについては使用されるが、インター符号化されたスライスについては使用されず、予測された向上層情報が得られる、段階と;
    ・予測された向上層情報ならびに逆量子化および逆変換された向上層情報から、再構成された向上層ビデオ情報を再構成する段階とを含む、
    方法。
  4. 前記トーン・マッピング・データが、前記向上層の各スライス・ヘッダからのみ抽出される、請求項に記載の方法。
  5. 基本層および向上層をもつビデオ・データをエンコードする装置であって、前記基本層は前記向上層に比べより低いビット深さ解像度およびより低い空間的、時間的および/またはSNR解像度をもち、当該装置は、
    ・基本層データをスライス・レベルでエンコードする手段であって、第一の諸基本層スライスはイントラ符号化され、第二の諸基本層スライスはインター符号化される、手段と;
    ・エンコードされた基本層スライスを再構成する手段であって、第一のイントラ符号化された基本層スライスから、再構成された第一の基本層スライスが得られ、第二のインター符号化された基本層スライスから、再構成された第二の基本層スライスが得られる、手段と;
    ・前記再構成された第一および第二の基本層スライスをアップサンプリングする手段であって、対応する向上層スライスの第一の予測されたバージョンであって基本層スライスより高い空間的、時間的またはSNR解像度をもつものが得られ、前記アップサンプリングは、第二の再構成された基本層スライスの場合には、再構成された基本層残差データのアップサンプリングを含む、手段と;
    ・第一のイントラ符号化された基本層スライスについて、アップサンプリングされた再構成された第一の基本層スライスと対応するもとの向上層スライスとの間の個別のマッピングを定義するトーン・マッピング・テーブルを生成する手段であって、両方のスライスが互いに比較され、第二のインター符号化された基本層スライスについてはトーン・マッピング・テーブルは生成されず、イントラ符号化された各スライス対については個別のトーン・マッピング・テーブルが生成されエンコードされ、インター符号化されたスライス対についてはトーン・マッピング・テーブルは生成されない、手段と;
    ・向上層スライスの第一の予測されたバージョンをビット深さアップサンプリングする手段であって、向上層スライスの前記第一の予測されたバージョンが第一のイントラ符号化された基本層スライスから得られる場合には前記ビット深さアップサンプリングは前記トーン・マッピング・テーブルに基づき、向上層スライスの前記第一の予測されたバージョンが第二のインター符号化された基本層スライスから得られる場合には前記ビット深さアップサンプリングは前記トーン・マッピング・テーブルに基づかず、対応する向上層スライスの第二の予測されたバージョンであって向上層スライスの前記第一の予測されたバージョンより高いビット深さ解像度をもつものが得られる、手段と;
    ・もとの向上層スライスと向上層スライスの対応する前記第二の予測されたバージョンとの間の差である向上層残差を生成する手段と;
    ・前記向上層残差を向上層スライス中にエンコードする手段であって、前記向上層スライスはそのスライス・ヘッダにその対応するトーン・マッピング・テーブルを含む、手段とを備える、
    装置。
  6. 基本層および向上層をもち、スライス・レベルでエンコードされているビデオ・データをデコードする装置であって、
    ・向上層情報を受領する手段および基本層情報を受領する手段と;
    ・前記向上層情報から、イントラ符号化された向上層スライスのスライス・ヘッダからのトーン・マッピング・データを抽出する手段と;
    ・受領された情報に対して逆量子化および逆変換を実行する手段であって、逆量子化および逆変換された向上層情報は残差情報を含む、手段と;
    ・受領されたインター符号化された向上層情報から、動き情報を抽出する手段と;
    ・第一の、イントラ符号化された基本層スライスおよび第二の、インター符号化された基本層スライスを再構成する手段と;
    ・前記第二の、インター符号化された基本層スライスから、前記向上層動き情報を使って、向上層ビデオを再構成する手段と;
    前記第一のイントラ符号化された基本層スライスおよび前記第二のインター符号化された基本層スライスを含む基本層情報をアップサンプリングする手段であって、ピクセル数が増加され、増加したピクセル数についてピクセル毎のビット深さが増加され、ここで、抽出されたトーン・マッピング・データがイントラ符号化されたスライスについては使用されるが、インター符号化されたスライスについては使用されず、予測された向上層情報が得られる、手段と;
    ・予測された向上層情報ならびに逆量子化および逆変換された向上層情報から、再構成された向上層ビデオ情報を再構成する手段とを備える、
    装置。
  7. 前記トーン・マッピング・テーブルを記憶するルックアップ・テーブル手段をさらに有する、請求項またはに記載の装置。
JP2010513605A 2007-06-27 2007-06-27 ビット深さスケーラビリティのために向上層残差予測を使ってビデオ・データをエンコードおよび/またはデコードする方法および装置 Expired - Fee Related JP5383674B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2007/002009 WO2009000110A1 (en) 2007-06-27 2007-06-27 Method and apparatus for encoding and/or decoding video data using enhancement layer residual prediction for bit depth scalability

Publications (2)

Publication Number Publication Date
JP2010531584A JP2010531584A (ja) 2010-09-24
JP5383674B2 true JP5383674B2 (ja) 2014-01-08

Family

ID=40185156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010513605A Expired - Fee Related JP5383674B2 (ja) 2007-06-27 2007-06-27 ビット深さスケーラビリティのために向上層残差予測を使ってビデオ・データをエンコードおよび/またはデコードする方法および装置

Country Status (5)

Country Link
US (1) US8737474B2 (ja)
EP (1) EP2193661A4 (ja)
JP (1) JP5383674B2 (ja)
CN (1) CN101796841B (ja)
WO (1) WO2009000110A1 (ja)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101365596B1 (ko) * 2007-09-14 2014-03-12 삼성전자주식회사 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
EP2051527A1 (en) 2007-10-15 2009-04-22 Thomson Licensing Enhancement layer residual prediction for bit depth scalability using hierarchical LUTs
KR101512833B1 (ko) * 2007-10-16 2015-04-16 톰슨 라이센싱 비트 깊이 확장성을 위한 아티팩트 제거를 위한 방법 및 장치
ES2389458T3 (es) * 2008-07-10 2012-10-26 The University Of Warwick Métodos y dispositivos para la compresión de datos de vídeo HDR
WO2010090630A1 (en) * 2009-02-03 2010-08-12 Thomson Licensing Methods and apparatus for motion compensation with smooth reference frame in bit depth scalability
US20100208795A1 (en) * 2009-02-19 2010-08-19 Motorola, Inc. Reducing aliasing in spatial scalable video coding
EP2265026A1 (en) * 2009-06-16 2010-12-22 Canon Kabushiki Kaisha Method and device for deblocking filtering of SVC type video streams during decoding
CN101998119B (zh) * 2009-08-14 2013-12-11 北京中星微电子有限公司 一种重构图获取方法及装置
KR101457418B1 (ko) 2009-10-23 2014-11-04 삼성전자주식회사 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
WO2011094047A1 (en) * 2010-02-01 2011-08-04 Dolby Laboratories Licensing Corporation Filtering for image and video enhancement using asymmetric samples
KR20120028843A (ko) * 2010-09-14 2012-03-23 삼성전자주식회사 계층적 영상 부호화/복호화 방법 및 장치
EP2445214A1 (en) * 2010-10-19 2012-04-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Video coding using temporally coherent dynamic range mapping
CN103202019A (zh) * 2010-11-22 2013-07-10 索尼公司 编码装置和编码方法、以及解码装置和解码方法
GB2500835B (en) * 2010-12-10 2014-02-12 Ibm High-dynamic range video tone mapping
EP2466204B1 (de) 2010-12-16 2013-11-13 Siemens Aktiengesellschaft Regeleinrichtung für eine Brenneranlage
US9001883B2 (en) * 2011-02-16 2015-04-07 Mediatek Inc Method and apparatus for slice common information sharing
US9848197B2 (en) * 2011-03-10 2017-12-19 Qualcomm Incorporated Transforms in video coding
US8891863B2 (en) * 2011-06-13 2014-11-18 Dolby Laboratories Licensing Corporation High dynamic range, backwards-compatible, digital cinema
TWI575933B (zh) 2011-11-04 2017-03-21 杜比實驗室特許公司 階層式視覺動態範圍編碼中之層分解技術
WO2013106190A1 (en) 2012-01-09 2013-07-18 Dolby Laboratories Licensing Corporation Hybrid reference picture reconstruction method for single and multiple layered video coding systems
WO2013147455A1 (ko) * 2012-03-29 2013-10-03 엘지전자 주식회사 인터 레이어 예측 방법 및 이를 이용하는 장치
EP2859724B1 (en) 2012-06-22 2019-09-04 MediaTek Inc. Method and apparatus of adaptive intra prediction for inter-layer coding
EP2865185A4 (en) * 2012-06-26 2016-08-03 Intel Corp LAYER AND CHANNEL SURVEY SAMPLING
EP2868078A4 (en) * 2012-06-27 2016-07-27 Intel Corp PREDICTION OF RESIDUES BETWEEN LAYERS AND BETWEEN CHANNELS
CA2878807C (en) 2012-07-09 2018-06-12 Vid Scale, Inc. Codec architecture for multiple layer video coding
US10277908B2 (en) 2012-09-25 2019-04-30 Intel Corporation Inter-layer sample adaptive filter parameters re-use for scalable video coding
US20140086319A1 (en) * 2012-09-25 2014-03-27 Sony Corporation Video coding system with adaptive upsampling and method of operation thereof
FR2996093A1 (fr) * 2012-09-27 2014-03-28 France Telecom Procede de codage et decodage d'images, dispositifs de codage et decodage et programmes d'ordinateur correspondants
US9124899B2 (en) 2012-09-28 2015-09-01 Sharp Laboratories Of America, Inc. Motion derivation and coding for scaling video
US10375405B2 (en) * 2012-10-05 2019-08-06 Qualcomm Incorporated Motion field upsampling for scalable coding based on high efficiency video coding
JP2016502801A (ja) * 2012-11-27 2016-01-28 エルジー エレクトロニクス インコーポレイティド 信号送受信装置及び信号送受信方法
US10085017B2 (en) 2012-11-29 2018-09-25 Advanced Micro Devices, Inc. Bandwidth saving architecture for scalable video coding spatial mode
KR102163477B1 (ko) * 2012-12-04 2020-10-07 인텔렉추얼디스커버리 주식회사 비디오 부호화 및 복호화 방법, 그를 이용한 장치
US9357211B2 (en) * 2012-12-28 2016-05-31 Qualcomm Incorporated Device and method for scalable and multiview/3D coding of video information
US9800884B2 (en) 2013-03-15 2017-10-24 Qualcomm Incorporated Device and method for scalable coding of video information
WO2014156707A1 (ja) * 2013-03-29 2014-10-02 ソニー株式会社 画像符号化装置および方法、並びに、画像復号装置および方法
US9998735B2 (en) * 2013-04-01 2018-06-12 Qualcomm Incorporated Inter-layer reference picture restriction for high level syntax-only scalable video coding
US10277909B2 (en) * 2013-05-15 2019-04-30 Vid Scale, Inc. Single loop decoding based interlayer prediction
AU2014288482A1 (en) * 2013-07-12 2015-02-26 Sony Corporation Image coding device and method
US10063886B2 (en) * 2013-10-07 2018-08-28 Vid Scale, Inc. Combined scalability processing for multi-layer video coding
US9756337B2 (en) * 2013-12-17 2017-09-05 Qualcomm Incorporated Signaling color values for 3D lookup table for color gamut scalability in multi-layer video coding
US10531105B2 (en) 2013-12-17 2020-01-07 Qualcomm Incorporated Signaling partition information for 3D lookup table for color gamut scalability in multi-layer video coding
EP2887667A1 (en) * 2013-12-19 2015-06-24 Thomson Licensing Coding of high dynamic range images
MX364028B (es) * 2013-12-27 2019-04-11 Sony Corp Aparato y metodo de procesamiento de imagenes.
US9445111B2 (en) * 2014-01-08 2016-09-13 Sony Corporation Image processing apparatus and image processing method
US9826232B2 (en) * 2014-01-08 2017-11-21 Qualcomm Incorporated Support of non-HEVC base layer in HEVC multi-layer extensions
US9906804B2 (en) * 2014-01-16 2018-02-27 Qualcomm Incorporated Reference layer sample position derivation for scalable video coding
MX2016012130A (es) 2014-03-19 2017-04-27 Arris Entpr Inc Codificacion escalable de secuencias de video utilizando mapeo de tonos y diferentes gamas de colores.
JP2016015009A (ja) * 2014-07-02 2016-01-28 ソニー株式会社 情報処理システム、情報処理端末、および情報処理方法
US9838662B2 (en) * 2014-10-10 2017-12-05 Qualcomm Incorporated Harmonization of cross-component prediction and adaptive color transform in video coding
US10283091B2 (en) * 2014-10-13 2019-05-07 Microsoft Technology Licensing, Llc Buffer optimization
EP3251351B1 (en) 2015-01-27 2021-07-14 Dolby International AB Predictive image encoding and decoding with pixel group based quantization
GB2538997A (en) * 2015-06-03 2016-12-07 Nokia Technologies Oy A method, an apparatus, a computer program for video coding
EP3113496A1 (en) * 2015-06-30 2017-01-04 Thomson Licensing Method and device for encoding both a hdr picture and a sdr picture obtained from said hdr picture using color mapping functions
US9621767B1 (en) * 2015-11-24 2017-04-11 Intel Corporation Spatially adaptive tone mapping for display of high dynamic range (HDR) images
EP3185556A1 (en) 2015-12-21 2017-06-28 Thomson Licensing Method and apparatus for combined adaptive resolution and internal bit-depth increase coding
US10074162B2 (en) 2016-08-11 2018-09-11 Intel Corporation Brightness control for spatially adaptive tone mapping of high dynamic range (HDR) images
EP4221201A1 (en) 2018-01-29 2023-08-02 InterDigital VC Holdings, Inc. Encoding and decoding with refinement of the reconstructed picture
US10771797B2 (en) * 2018-07-30 2020-09-08 Logmein, Inc. Enhancing a chroma-subsampled video stream
CN114503573A (zh) * 2019-03-20 2022-05-13 威诺瓦国际有限公司 低复杂性增强视频编码
CN115695803B (zh) * 2023-01-03 2023-05-12 宁波康达凯能医疗科技有限公司 一种基于极限学习机的帧间图像编码方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9206860D0 (en) * 1992-03-27 1992-05-13 British Telecomm Two-layer video coder
US6836512B2 (en) * 2000-10-11 2004-12-28 Koninklijke Philips Electronics N.V. Spatial scalability for fine granular video encoding
WO2004114671A2 (en) * 2003-06-19 2004-12-29 Thomson Licensing S.A. Method and apparatus for low-complexity spatial scalable decoding
US8045614B2 (en) * 2005-05-11 2011-10-25 Dolby Laboratories Licensing Corporation Quantization control for variable bit depth
US20050259729A1 (en) * 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability
KR101014667B1 (ko) * 2004-05-27 2011-02-16 삼성전자주식회사 스케일러블 동영상 인코딩, 디코딩 장치 및 그 방법
JP2008516556A (ja) * 2004-10-13 2008-05-15 トムソン ライセンシング コンプレクシティスケーラブル映像符号化復号化方法及び装置
KR100763178B1 (ko) * 2005-03-04 2007-10-04 삼성전자주식회사 색 공간 스케일러블 비디오 코딩 및 디코딩 방법, 이를위한 장치
KR101366918B1 (ko) * 2005-10-12 2014-02-24 톰슨 라이센싱 스케일러블 비디오 인코딩 및 디코딩에서의 가중 예측을위한 방법 및 장치
US8565314B2 (en) * 2006-10-12 2013-10-22 Qualcomm Incorporated Variable length coding table selection based on block type statistics for refinement coefficient coding
WO2008049446A1 (en) * 2006-10-25 2008-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Quality scalable coding
US20110228855A1 (en) * 2006-12-25 2011-09-22 Yongying Gao Device for Encoding Video Data, Device for Decoding Video Data, Stream of Digital Data
JP5295233B2 (ja) * 2007-06-29 2013-09-18 フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン ビデオエンコーダ、ビデオデコーダ、エンコードするための方法、デコードするための方法、コンピュータプログラム、およびスケーラブルなビットストリーム
KR101365597B1 (ko) * 2007-10-24 2014-02-20 삼성전자주식회사 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
KR20090097015A (ko) * 2008-03-10 2009-09-15 삼성전자주식회사 스케일러블 영상 부호화장치 및 스케일러블 영상복호화장치
US8428128B2 (en) * 2008-12-30 2013-04-23 Korea Electronics Technology Institute Method for prediction coding using scalable video codec

Also Published As

Publication number Publication date
WO2009000110A1 (en) 2008-12-31
CN101796841A (zh) 2010-08-04
EP2193661A4 (en) 2011-10-19
CN101796841B (zh) 2012-07-18
US8737474B2 (en) 2014-05-27
EP2193661A1 (en) 2010-06-09
US20100135393A1 (en) 2010-06-03
JP2010531584A (ja) 2010-09-24

Similar Documents

Publication Publication Date Title
JP5383674B2 (ja) ビット深さスケーラビリティのために向上層残差予測を使ってビデオ・データをエンコードおよび/またはデコードする方法および装置
JP5346198B2 (ja) 階層的lutを利用したビット深度スケーラビリティのためのエンハンスメントレイヤ残差予測
JP5036826B2 (ja) ビット深度スケーラビリティのためのエンハンスメントレイヤの残差予測を使用したビデオデータを符号化及び/又は復号化する方法及び装置
JP5232797B2 (ja) 空間予測及びビット深度予測の適応的予測順序を使用してビデオ・データを符号化し、かつ/又は復号化する方法及び装置
JP5232796B2 (ja) 適応エンハンスメントレイヤ予測を使用したビット深度スケーラブルなビデオデータを符号化及び/又は復号化する方法及び装置
US20100128786A1 (en) Method and apparatus for encoding video data, method and apparatus for decoding encoded video data and encoded video signal
EP2127395B1 (en) Video encoding method and video decoding method for enabling bit depth scalability
US20100046622A1 (en) Method and apparatus for encoding and/or decoding bit depth scalable video data using adaptive enhancement layer residual prediction
EP1933565A1 (en) Method and apparatus for encoding and/or decoding bit depth scalable video data using adaptive enhancement layer prediction

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120626

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130521

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131001

R150 Certificate of patent or registration of utility model

Ref document number: 5383674

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350