[0039]本開示の技法は、ビデオコード化における色域スケーラビリティのための3次元(3D)色予測又はマッピングに関する。色域スケーラビリティのための3D色予測技法は、ビデオデータの下位参照レイヤ用の色域がビデオデータの上位拡張レイヤ用の色域とは異なるとき、レイヤ間参照ピクチャを生成するためにビデオエンコーダ及び/又はビデオデコーダによって使用され得る。例えば、ビデオエンコーダ及び/又はビデオデコーダは、最初に、下位参照レイヤ用の参照ピクチャの色データを上位拡張レイヤ用の色域に変換するために、色域スケーラビリティのための3Dルックアップテーブルを使用して色予測を実施し、次いで、変換された色データに基づいてレイヤ間参照ピクチャを生成し得る。色予測技法はまた、ビデオデータの下位参照レイヤのビット深度がビデオデータの上位拡張レイヤのビット深度とは異なるとき、レイヤ間参照ピクチャを生成するためにビデオエンコーダ及び/又はビデオデコーダによって使用され得る。
[0040]色域は、例えば、ビデオデータのピクチャ、スライス、ブロック又はレイヤ中で、画像のために再生され得る色の完全範囲を備える。従来、マルチレイヤビデオコード化では、ビデオデータの下位レイヤ(例えば、ベースレイヤ)及びビデオデータの上位レイヤ(例えば、拡張レイヤ)は、同じ色域中、例えば高解像度(HD)色域BT.709中の色データを含む。この場合、ビデオエンコーダ及び/又はビデオデコーダは、ビデオデータの下位レイヤのためのコロケート参照ピクチャ(co-located reference pictures)のアップサンプリングされたバージョンとして、ビデオデータの上位レイヤのためのレイヤ間参照ピクチャを生成し得る。
[0041]しかしながら、幾つかの例では、ビデオデータの下位レイヤは、第1の色域、例えば、BT.709中の色データを含み得、ビデオデータの上位レイヤは、異なる第2の色域、例えば、超高解像度(UHD)色域BT.2020中の色データを含み得る。この例では、ビデオデータの上位レイヤのためのレイヤ間参照ピクチャを生成するために、ビデオエンコーダ及び/又はビデオデコーダは、最初に、ビデオデータの下位レイヤのための第1の色域中の参照ピクチャの色データをビデオデータの上位レイヤのための第2の色域に変換するために、色予測を実施しなければならない。
[0042]ビデオエンコーダ及び/又はビデオデコーダは、色域スケーラビリティのための3Dルックアップテーブルを使用して色予測を実施し得る。幾つかの例では、色成分の各々、即ち、ルーマ(Y)成分、第1のクロマ(U)成分及び第2のクロマ(V)成分について別個の3Dルックアップテーブルが生成され得る。3Dルックアップテーブルの各々は、ルーマ(Y)次元と、第1のクロマ(U)次元と、第2のクロマ(V)次元とを含み、3つの独立した色成分(Y、U、V)を使用してインデックス付けされる。
[0043]本開示で説明する技法によれば、ビデオエンコーダ及び/又はビデオデコーダは、3Dルックアップテーブルの入力色成分と出力色成分との制約付きビット深度を用いて3D色予測を実施し得る。例えば、3Dルックアップテーブルの入力色成分のビット深度は、下位参照レイヤピクチャのビット深度に等しくなるように制約され得る。更なる一例として、3Dルックアップテーブルの出力色成分のビット深度は、両端値を含めて、下位参照レイヤピクチャのビット深度と上位拡張レイヤピクチャのビット深度との間の範囲内になるように制約され得る。言い換えれば、3Dルックアップテーブルの出力色成分のビット深度は、下位参照レイヤピクチャのビット深度以上であり上位拡張レイヤピクチャのビット深度以下である範囲内になるように制約され得る。
[0044]本開示で説明する更なる技法によれば、複数のレイヤの場合、ビデオエンコーダ及び/又はビデオデコーダは、1つ又は複数の識別された参照レイヤ中のみの参照ピクチャに対して制約付き適用を用いて3D色予測を実施し得る。例えば、ビデオエンコーダは、各3Dルックアップテーブルについて1つ又は複数の参照レイヤ識別子(ID)をビデオデコーダに信号伝達し得、ビデオデコーダは、1つ又は複数の識別された参照レイヤ内の参照レイヤピクチャのみに3Dルックアップテーブルを適用し得る。別の例として、各拡張レイヤピクチャについて、ビデオエンコーダ及び/又はビデオデコーダは、参照レイヤのうちの指定された参照レイヤ内の参照レイヤピクチャのみに3Dルックアップテーブルを適用するように更に制約され得る。
[0045]開示する技法は、高効率ビデオコード化(HEVC)コーデックなどの高度ビデオコーデックのコンテキストにおいて使用され得る。本開示で説明する技法に関係するスケーラブルビデオコード化(SVC)技法が図4〜図6に関して以下で検討され、その後に図7〜図14に関してHEVC規格及び関係する色域スケーラビリティ技法の説明が続く。
[0046]ビデオコード化規格は、ITU−T H.261と、ISO/IEC MPEG−1 Visualと、ITU−T H.262又はISO/IEC MPEG−2 Visualと、ITU−T H.263と、ISO/IEC MPEG−4 Visualと、それのスケーラブルビデオコード化(SVC)拡張及びマルチビュービデオコード化(MVC)拡張を含む(ISO/IEC MPEG−4 AVCとしても知られる)ITU−T H.264とを含む。更に、高効率ビデオコード化(HEVC)は、ITU−Tビデオコード化エキスパートグループ(VCEG)とISO/IECモーションピクチャエキスパートグループ(MPEG)とのビデオコード化共同研究部会(JCT−VC)によって開発された。HEVC WDと呼ばれる、最新のHEVCドラフト仕様、Wangら、「High efficiency video coding (HEVC) Defect Report」、ITU−T SG16 WP3とISO/IEC JTC1/SC29/WG11とのビデオコード化共同研究部会(JCT−VC)、第14回会合:ウィーン、AT、2013年7月25日〜8月2日、JCTVC−N1003v1は、http://phenix.int−evry.fr/jct/doc_end_user/documents/14_Vienna/wg11/JCTVC−N1003−v1.zipから入手可能である。確定したHEVC規格文書は、ITU−T H.265、Series H:Audiovisual and Multimedia Systems、Infrastructure of audiovisual services−Coding of moving video、High efficiency video coding、国際電気通信連合(ITU)の電気通信標準化部門、2013年4月として公開されている。
[0047]HEVCのマルチビュー拡張(MV−HEVC)と、より高度な3Dビデオコード化のための別のHEVC拡張(3D−HEVC)とはJCT−3Vによって開発されており、一方、HEVCのスケーラブルビデオコード化拡張(SHVC)はJCT−VCによって開発されている。以下でMV−HEVC WD5と呼ばれる、MV−HEVCの最近のワーキングドラフト(WD)は、http://phenix.it−sudparis.eu/jct2/doc_end_user/documents/5_Vienna/wg11/JCT3V−E1004−v6.zipから入手可能である。以下で3D−HEVC WD1と呼ばれる、3D−HEVCの最近のWDは、http://phenix.it−sudparis.eu/jct2/doc_end_user/documents/5_Vienna/wg11/JCT3V−E1001−v3.zipから入手可能である。以下でSHVC WD3と呼ばれる、SHVCの最近のワーキングドラフト(WD)は、http://phenix.it−sudparis.eu/jct/doc_end_user/documents/14_Vienna/wg11/JCTVC−N1008−v3.zipから入手可能である。
[0048]図1は、本開示で説明する技法を利用し得る例示的なビデオ符号化及び復号システム10を示すブロック図である。図1に示されているように、システム10は、宛先機器14によって後で復号されるべき符号化ビデオデータを提供する発信源機器12を含む。具体的には、発信源機器12は、コンピュータ可読媒体16を介して宛先機器14にビデオデータを提供する。発信源機器12及び宛先機器14は、デスクトップコンピュータ、ノートブック(即ち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、所謂「スマート」フォンなどの電話ハンドセット、所謂「スマート」パッド、テレビジョン、カメラ、表示装置、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミング機器などを含む、広範囲にわたる機器のいずれかを備え得る。場合によっては、発信源機器12及び宛先機器14はワイヤレス通信のために装備され得る。
[0049]宛先機器14は、コンピュータ可読媒体16を介して、復号されるべき符号化ビデオデータを受信し得る。コンピュータ可読媒体16は、発信源機器12から宛先機器14に符号化ビデオデータを移動させることが可能な任意のタイプの媒体又は機器を備え得る。一例では、コンピュータ可読媒体16は、発信源機器12が符号化ビデオデータを宛先機器14にリアルタイムで直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先機器14に送信され得る。通信媒体は、無線周波数(RF)スペクトルあるいは1つ又は複数の物理伝送線路など、任意のワイヤレス又はワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、又はインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、又は発信源機器12から宛先機器14への通信を可能にするために有用であり得る任意の他の機器を含み得る。
[0050]幾つかの例では、符号化データは、出力インターフェース22から記憶装置に出力され得る。同様に、符号化データは、入力インターフェースによって記憶装置からアクセスされ得る。記憶装置は、ハードドライブ、Blu−ray(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、揮発性又は不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散された又はローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。更なる一例では、記憶装置は、発信源機器12によって生成された符号化ビデオを記憶し得るファイルサーバ又は別の中間記憶装置に対応し得る。宛先機器14は、ストリーミング又はダウンロードを介して、記憶装置から記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先機器14に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバは、(例えば、ウェブサイト用の)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)機器、又はローカルディスクドライブを含む。宛先機器14は、インターネット接続を含む任意の標準的なデータ接続を通じて符号化ビデオデータにアクセスし得る。これは、ワイヤレスチャネル(例えば、Wi−Fi(登録商標)接続)、ワイヤード接続(例えば、DSL、ケーブルモデムなど)、又はファイルサーバ上に記憶された符号化ビデオデータにアクセスするのに好適である両方の組合せを含み得る。記憶装置からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、又はそれらの組合せであり得る。
[0051]本開示の技法は、ワイヤレスの適用例又は設定に必ずしも限定されるとは限らない。本技法は、無線テレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーHTTP(DASH)などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体上に記憶されたデジタルビデオの復号、又は他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコード化に適用され得る。幾つかの例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、及び/又はビデオテレフォニーなどの適用例をサポートするために一方向又は双方向のビデオ送信をサポートするように構成され得る。
[0052]図1の例では、発信源機器12は、ビデオ発信源18と、ビデオエンコーダ20と、出力インターフェース22とを含む。宛先機器14は、入力インターフェース28と、ビデオデコーダ30と、表示装置32とを含む。本開示によれば、発信源機器12のビデオエンコーダ20は、ビデオデータを並列に処理するための技法を適用するように構成され得る。他の例では、発信源機器及び宛先機器は、他の構成要素又は構成を含み得る。例えば、発信源機器12は、外部カメラなど、外部ビデオ発信源18からビデオデータを受信し得る。同様に、宛先機器14は、内蔵表示装置を含むのではなく、外部表示装置とインターフェースし得る。
[0053]図1の図示のシステム10は一例にすぎない。ビデオデータを並列に処理するための技法は、任意のデジタルビデオ符号化及び/又は復号機器によって実施され得る。概して、本開示の技法は、ビデオ符号化機器によって実施されるが、本技法は、「コーデック」と通常呼ばれるビデオエンコーダ/デコーダによっても実施され得る。その上、本開示の技法はビデオプリプロセッサによっても実施され得る。発信源機器12及び宛先機器14は、発信源機器12が宛先機器14への送信のためにコード化ビデオデータを生成するようなコード化機器の例にすぎない。幾つかの例では、機器12、14は、機器12、14の各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称的に動作し得る。従って、システム10は、例えば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、又はビデオテレフォニーのために、ビデオ機器12とビデオ機器14との間で一方向又は双方向のビデオ送信をサポートし得る。
[0054]発信源機器12のビデオ発信源18は、ビデオカメラなどの撮像装置、以前に撮られたビデオを含んでいるビデオアーカイブ、及び/又はビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。更なる代替として、ビデオ発信源18は、発信源ビデオとしてのコンピュータグラフィックスベースのデータ、又はライブビデオとアーカイブビデオとコンピュータ生成ビデオとの組合せを生成し得る。場合によっては、ビデオ発信源18がビデオカメラである場合、発信源機器12及び宛先機器14は所謂カメラフォン又はビデオフォンを形成し得る。しかしながら、上述のように、本開示で説明する技法は、概してビデオコード化に適用可能であり得、ワイヤレス及び/又はワイヤード適用例に適用され得る。各々の場合において、撮られたビデオ、以前に撮られたビデオ、又はコンピュータ生成ビデオは、ビデオエンコーダ20によって符号化され得る。符号化ビデオ情報は、次いで、出力インターフェース22によってコンピュータ可読媒体16上に出力され得る。
[0055]コンピュータ可読媒体16は、ワイヤレスブロードキャスト又はワイヤードネットワーク送信などの一時媒体、若しくはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、Blu−rayディスク、又は他のコンピュータ可読媒体などの記憶媒体(即ち、非一時的記憶媒体)を含み得る。幾つかの例では、ネットワークサーバ(図示せず)は、例えば、ネットワーク送信を介して、発信源機器12から符号化ビデオデータを受信し、符号化ビデオデータを宛先機器14に提供し得る。同様に、ディスクスタンピング設備などの媒体製造設備のコンピューティング機器は、発信源機器12から符号化ビデオデータを受信し、その符号化ビデオデータを含んでいるディスクを製造し得る。従って、コンピュータ可読媒体16は、様々な例において、様々な形態の1つ又は複数のコンピュータ可読媒体を含むことが理解され得る。
[0056]宛先機器14の入力インターフェース28は、コンピュータ可読媒体16から情報を受信する。コンピュータ可読媒体16の情報は、ビデオエンコーダ20によって定義されビデオデコーダ30によっても使用される、ブロック及び他のコード化単位、例えば、ピクチャのグループ(GOP)の特性及び/又は処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。表示装置32は、ユーザに復号ビデオデータを表示し、陰極線管(CRT)、液晶表示器(LCD)、プラズマ表示器、有機発光ダイオード(OLED)表示器、又は別のタイプの表示装置など、様々な表示装置のいずれかを備え得る。
[0057]ビデオエンコーダ20及びビデオデコーダ30は各々、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理回路、ソフトウェア、ハードウェア、ファームウェア又はそれらの任意の組合せなどの、様々な好適なエンコーダ回路のいずれかとして実装され得る。本技法が部分的にソフトウェアで実装されたとき、機器は、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、1つ又は複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実施し得る。ビデオエンコーダ20及びビデオデコーダ30の各々は、1つ又は複数のエンコーダ又はデコーダ中に含まれ得、そのいずれも、それぞれの機器において複合エンコーダ/デコーダ(コーデック)の一部として統合され得る。
[0058]図1の例では、ビデオエンコーダ20及びビデオデコーダ30は、ITU−Tビデオコード化エキスパートグループ(VCEG)とISO/IECモーションピクチャエキスパートグループ(MPEG)とのビデオコード化共同研究部会(JCT−VC)によって開発された高効率ビデオコード化(HEVC)規格に従って動作し得る。最新のHEVCドラフト仕様は、上記した、HEVC WDと呼ばれる。HEVCのマルチビュー拡張(MV−HEVC)と、より高度な3Dビデオコード化のための別のHEVC拡張(3D−HEVC)とはJCT−3Vによって開発されており、HEVCのスケーラブルビデオコード化拡張(SHVC)はJCT−VCによって開発されている。MV−HEVCの最新のドラフト仕様は、上記した、MV−HEVC WD5と呼ばれる。3D−HEVCの最新のドラフト仕様は、上記した、3D−HEVC WD1と呼ばれる。SHVCの最近のドラフト仕様は、上記した、SHVC WD3と呼ばれる。
[0059]HEVC及び他のビデオコード化規格では、ビデオシーケンスは、通常、一連のピクチャを含む。ピクチャは「フレーム」と呼ばれることもある。ピクチャは、SL、SCb、及びSCrと示される、3つのサンプルアレイを含み得る。SLは、ルーマサンプルの2次元アレイ(即ち、ブロック)である。SCbは、Cbクロミナンスサンプルの2次元アレイである。SCrは、Crクロミナンスサンプルの2次元アレイである。クロミナンスサンプルは、本明細書では「クロマ」サンプルと呼ばれることもある。他の例では、ピクチャはモノクロームであり得、ルーマサンプルのアレイのみを含み得る。
[0060]ビデオエンコーダ20は、コード化ツリー単位(CTU)のセットを生成し得る。CTUの各々は、ルーマサンプルのコード化ツリーブロックと、クロマサンプルの2つの対応するコード化ツリーブロックと、それらのコード化ツリーブロックのサンプルをコード化するために使用されるシンタックス構造とを備え得る。モノクロームピクチャ又は3つの別個の色平面を有するピクチャでは、CTUは、単一のコード化ツリーブロックと、そのコード化ツリーブロックのサンプルをコード化するために使用されるシンタックス構造とを備え得る。コード化ツリーブロックはサンプルのN×Nブロックであり得る。CTUは「ツリーブロック」又は「最大コード化単位」(LCU)と呼ばれることもある。HEVCのCTUは、H.264/AVCなどの他のビデオコード化規格のマクロブロックに広い意味で類似し得る。しかしながら、CTUは、必ずしも特定のサイズに限定されるとは限らず、1つ又は複数のコード化単位(CU)を含み得る。スライスは、ラスタ走査において連続的に順序付けられた整数個のCTUを含み得る。
[0061]本開示は、サンプルの1つ又は複数のブロックと、サンプルの1つ又は複数のブロックのサンプルをコード化するために使用されるシンタックス構造とを指すために、「ビデオ単位」又は「ビデオブロック」という用語を使用することがある。例示的なタイプのビデオ単位は、CTU、CU、PU、変換単位(TU)、マクロブロック、マクロブロック区分などを含み得る。
[0062]コード化CTUを生成するために、ビデオエンコーダ20は、コード化ツリーブロックをコード化ブロックに分割するためにCTUのコード化ツリーブロックに対して4分木区分を再帰的に実施し得、従って「コード化ツリー単位」という名称がある。コード化ブロックはサンプルのN×Nブロックである。CUは、ルーマサンプルアレイとCbサンプルアレイとCrサンプルアレイとを有するピクチャのルーマサンプルのコード化ブロックと、そのピクチャのクロマサンプルの2つの対応するコード化ブロックと、それらのコード化ブロックのサンプルをコード化するために使用されるシンタックス構造とを備え得る。3つの別個の色平面を有するモノクロームピクチャ又はピクチャでは、CUは、単一のコード化ブロックと、そのコード化ブロックのサンプルをコード化するために使用されるシンタックス構造とを備え得る。
[0063]ビデオエンコーダ20は、CUのコード化ブロックを1つ又は複数の予測ブロックに区分化し得る。予測ブロックは、同じ予測が適用されるサンプルの矩形(即ち、正方形又は非正方形)ブロックであり得る。CUの予測単位(PU)は、ルーマサンプルの予測ブロックと、ピクチャのクロマサンプルの2つの対応する予測ブロックと、予測ブロックサンプルを予測するために使用されるシンタックス構造とを備え得る。モノクロームピクチャ又は3つの別個の色平面を有するピクチャでは、PUは、単一の予測ブロックと、予測ブロックサンプルを予測するために使用されるシンタックス構造とを備え得る。ビデオエンコーダ20は、CUの各PUのルーマ予測ブロックと、Cb予測ブロックと、Cr予測ブロックとのために、予測ルーマブロックと、予測Cbブロックと、予測Crブロックとを生成し得る。
[0064]ビデオエンコーダ20は、PUの予測ブロックを生成するためにイントラ予測又はインター予測を使用し得る。ビデオエンコーダ20がPUの予測ブロックを生成するためにイントラ予測を使用する場合、ビデオエンコーダ20は、PUに関連付けられたピクチャの復号サンプルに基づいてPUの予測ブロックを生成し得る。
[0065]ビデオエンコーダ20がPUの予測ブロックを生成するためにインター予測を使用する場合、ビデオエンコーダ20は、PUに関連付けられたピクチャ以外の1つ又は複数のピクチャの復号サンプルに基づいてPUの予測ブロックを生成し得る。インター予測は、単方向インター予測(即ち、単予測)又は双方向インター予測(即ち、双予測)であり得る。単予測又は双予測を実施するために、ビデオエンコーダ20は、現在スライスに対して、第1の参照ピクチャリスト(RefPicList0)と第2の参照ピクチャリスト(RefPicList1)とを生成し得る。参照ピクチャリストの各々は1つ又は複数の参照ピクチャを含み得る。単予測を使用するとき、ビデオエンコーダ20は、参照ピクチャ内の参照位置(reference location)を決定するために、RefPicList0とRefPicList1のいずれか又は両方の中の参照ピクチャを探索し得る。更に、単予測を使用するとき、ビデオエンコーダ20は、参照位置に対応するサンプルに少なくとも部分的に基づいて、PUの予測サンプルブロックを生成し得る。更に、単予測を使用するとき、ビデオエンコーダ20は、PUの予測ブロックと参照位置との間の空間変位を示す単一の動きベクトルを生成し得る。PUの予測ブロックと参照位置との間の空間変位を示すために、動きベクトルは、PUの予測ブロックと参照位置との間の水平変位を指定する水平成分を含み得、PUの予測ブロックと参照位置との間の垂直変位を指定する垂直成分を含み得る。
[0066]PUを符号化するために双予測を使用するとき、ビデオエンコーダ20は、RefPicList0中の参照ピクチャ中の第1の参照位置と、RefPicList1中の参照ピクチャ中の第2の参照位置とを決定し得る。ビデオエンコーダ20は、次いで、第1及び第2の参照位置に対応するサンプルに少なくとも部分的に基づいて、PUの予測ブロックを生成し得る。その上、PUを符号化するために双予測を使用するとき、ビデオエンコーダ20は、PUのサンプルブロックと第1の参照位置との間の空間変位を示す第1の動きと、PUの予測ブロックと第2の参照位置との間の空間変位を示す第2の動きとを生成し得る。
[0067]ビデオエンコーダ20が、CUの1つ又は複数のPUのために予測ルーマブロックと、予測Cbブロックと、予測Crブロックとを生成した後に、ビデオエンコーダ20は、CUのルーマ残差ブロックを生成し得る。CUのルーマ残差ブロック中の各サンプルは、CUの予測ルーマブロックのうちの1つの中のルーマサンプルと、CUの元のルーマコード化ブロック中の対応するサンプルとの間の差分を示す。更に、ビデオエンコーダ20は、CUのCb残差ブロックを生成し得る。CUのCb残差ブロック中の各サンプルは、CUの予測Cbブロックのうちの1つの中のCbサンプルと、CUの元のCbコード化ブロック中の対応するサンプルとの間の差分を示し得る。ビデオエンコーダ20はまた、CUのCr残差ブロックを生成し得る。CUのCr残差ブロック中の各サンプルは、CUの予測Crブロックのうちの1つの中のCrサンプルと、CUの元のCrコード化ブロック中の対応するサンプルとの間の差分を示し得る。
[0068]更に、ビデオエンコーダ20は、CUのルーマ残差ブロックと、Cb残差ブロックと、Cr残差ブロックとを、1つ又は複数のルーマ変換ブロックと、Cb変換ブロックと、Cr変換ブロックとに分解するために、4分木区分を使用し得る。変換ブロックは、同じ変換が適用されるサンプルの矩形ブロックであり得る。CUの変換単位(TU)は、ルーマサンプルの変換ブロックと、クロマサンプルの2つの対応する変換ブロックと、それらの変換ブロックサンプルを変換するために使用されるシンタックス構造とを備え得る。モノクロームピクチャ又は3つの別個の色平面を有するピクチャでは、TUは、単一の変換ブロックと、変換ブロックサンプルを変換するために使用されるシンタックス構造とを備え得る。従って、CUの各TUは、ルーマ変換ブロック、Cb変換ブロック、及びCr変換ブロックに関連付けられ得る。TUに関連付けられたルーマ変換ブロックは、CUのルーマ残差ブロックのサブブロックであり得る。Cb変換ブロックは、CUのCb残差ブロックのサブブロックであり得る。Cr変換ブロックは、CUのCr残差ブロックのサブブロックであり得る。
[0069]ビデオエンコーダ20は、TUのルーマ係数ブロックを生成するために、TUのルーマ変換ブロックに1つ又は複数の変換を適用し得る。係数ブロックは変換係数の2次元アレイであり得る。変換係数はスカラー量であり得る。ビデオエンコーダ20は、TUのCb係数ブロックを生成するために、TUのCb変換ブロックに1つ又は複数の変換を適用し得る。ビデオエンコーダ20は、TUのためのCr係数ブロックを生成するために、TUのCr変換ブロックに1つ又は複数の変換を適用し得る。
[0070]係数ブロック(例えば、ルーマ係数ブロック、Cb係数ブロック又はCr係数ブロック)を生成した後に、ビデオエンコーダ20は係数ブロックを量子化し得る。量子化は、概して、変換係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、更なる圧縮を実現する処理を指す。更に、ビデオエンコーダ20は、ピクチャのCUのTUの変換ブロックを再構成するために、変換係数を逆量子化し、変換係数に逆変換を適用し得る。ビデオエンコーダ20は、CUのコード化ブロックを再構成するために、CUのTUの再構成された変換ブロックと、CUのPUの予測ブロックとを使用し得る。ピクチャの各CUのコード化ブロックを再構成することによって、ビデオエンコーダ20はピクチャを再構成し得る。ビデオエンコーダ20は、再構成されたピクチャを復号ピクチャバッファ(DPB)に記憶し得る。ビデオエンコーダ20は、DPB中の再構成されたピクチャをインター予測及びイントラ予測のために使用し得る。
[0071]ビデオエンコーダ20が係数ブロックを量子化した後に、ビデオエンコーダ20は、量子化された変換係数を示すシンタックス要素をエントロピー符号化し得る。例えば、ビデオエンコーダ20は、量子化された変換係数を示すシンタックス要素に対してコンテキスト適応型バイナリ算術コード化(CABAC)を実施し得る。ビデオエンコーダ20は、エントロピー符号化されたシンタックス要素をビットストリーム中に出力し得る。
[0072]ビデオエンコーダ20は、コード化ピクチャ及び関連するデータの表現を形成する一連のビットを含むビットストリームを出力し得る。ビットストリームは、一連のネットワーク抽象化レイヤ(NAL)単位を備え得る。NAL単位の各々は、NAL単位ヘッダを含み、ローバイトシーケンスペイロード(RBSP)をカプセル化する。NAL単位ヘッダは、NAL単位タイプコードを示すシンタックス要素を含み得る。NAL単位のNAL単位ヘッダによって指定されるNAL単位タイプコードは、NAL単位のタイプを示す。RBSPは、NAL単位内にカプセル化された整数個のバイトを含んでいるシンタックス構造であり得る。幾つかの事例では、RBSPはゼロビットを含む。
[0073]異なるタイプのNAL単位は、異なるタイプのRBSPをカプセル化し得る。例えば、第1のタイプのNAL単位はピクチャパラメータセット(PPS)のためのRBSPをカプセル化し得、第2のタイプのNAL単位はコード化スライスのためのRBSPをカプセル化し得、第3のタイプのNAL単位は補足拡張情報(SEI:supplemental enhancement information)のためのRBSPをカプセル化し得、以下同様である。PPSは、0個以上のコード化ピクチャ全体に適用されるシンタックス要素を含んでいることがあるシンタックス構造である。ビデオコード化データのためのRBSPをカプセル化するNAL単位は(パラメータセット及びSEIメッセージのためのRBSPとは対照的に)、ビデオコード化レイヤ(VCL)NAL単位と呼ばれることがある。コード化スライスをカプセル化するNAL単位は、本明細書ではコード化スライスNAL単位と呼ばれることがある。コード化スライスのRBSPは、スライスヘッダとスライスデータとを含み得る。
[0074]ビデオデコーダ30はビットストリームを受信し得る。更に、ビデオデコーダ30は、ビットストリームからシンタックス要素を復号するためにビットストリームを構文解析(parse)し得る。ビデオデコーダ30は、ビットストリームから復号されたシンタックス要素に少なくとも部分的に基づいてビデオデータのピクチャを再構築し得る。ビデオデータを再構築するためのプロセスは、ビデオエンコーダ20によって実施されるプロセスの概して逆であり得る。例えば、ビデオデコーダ30は、現在CUのPUのための予測ブロックを決定するためにPUの動きベクトルを使用し得る。ビデオデコーダ30は、PUのための予測ブロックを生成するためにPUの1つ又は複数の動きベクトルを使用し得る。
[0075]更に、ビデオデコーダ30は、現在CUのTUに関連付けられた係数ブロックを逆量子化し得る。ビデオデコーダ30は、現在CUのTUに関連付けられた変換ブロックを再構築するために、係数ブロックに対して逆変換を実施し得る。ビデオデコーダ30は、現在CUのPUのための予測サンプルブロックのサンプルを現在CUのTUの変換ブロックの対応するサンプルに加算することによって、現在CUのコード化ブロックを再構成し得る。ピクチャの各CUのためのコード化ブロックを再構成することによって、ビデオデコーダ30はピクチャを再構成し得る。ビデオデコーダ30は、出力のために及び/又は他のピクチャを復号する際に使用するために、復号されたピクチャを復号ピクチャバッファに記憶し得る。
[0076]MV−HEVC、3D−HEVC、及びSHVCでは、ビデオエンコーダは、一連のネットワーク抽象化レイヤ(NAL)単位を備えるビットストリームを生成し得る。ビットストリームの異なるNAL単位は、ビットストリームの異なるレイヤに関連付けられ得る。レイヤは、同じレイヤ識別子を有するビデオコード化レイヤ(VCL)NAL単位及び関連する非VCL NAL単位のセットとして定義され得る。レイヤは、マルチビュービデオコード化におけるビューと等価であり得る。マルチビュービデオコード化では、レイヤは、様々な時間インスタンスをもつ同じレイヤの全てのビュー成分を含むことができる。各ビュー成分は、特定の時間インスタンスにおいて特定のビューに属するビデオシーンのコード化ピクチャであり得る。3Dビデオコード化では、レイヤは、特定のビューの全てのコード化深度ピクチャ、又は特定のビューのコード化テクスチャピクチャのいずれかを含み得る。同様に、スケーラブルビデオコード化のコンテキストにおいて、レイヤは、通常、他のレイヤ中のコード化ピクチャと異なるビデオ特性を有するコード化ピクチャに対応する。そのようなビデオ特性は、通常、空間解像度と品質レベル(信号対雑音比)とを含む。HEVC及びそれの拡張では、時間スケーラビリティは、特定の時間レベルをもつピクチャのグループをサブレイヤとして定義することによって、1つのレイヤ内で達成され得る。
[0077]ビットストリームのそれぞれのレイヤごとに、下位レイヤ中のデータは、どんな上位レイヤ中のデータとも無関係に復号され得る。スケーラブルビデオコード化では、例えば、ベースレイヤ中のデータは、拡張レイヤ中のデータと無関係に復号され得る。NAL単位は、単に、単一のレイヤのデータをカプセル化する。SHVCでは、ビデオデコーダが、あるビュー中のピクチャを他のレイヤのデータと無関係に復号することができる場合、そのビューは「ベースレイヤ」と呼ばれることがある。ベースレイヤは、HEVCベース仕様に準拠し得る。従って、ビットストリームの残りの最高レイヤのデータをカプセル化するNAL単位は、ビットストリームの残りのレイヤ中のデータの復号可能性に影響を及ぼすことなくビットストリームから除去され得る。MV−HEVCでは、上位レイヤは追加のビュー成分を含み得る。SHVCでは、上位レイヤは、信号対雑音比(SNR)拡張データ、空間拡張データ、及び/又は時間拡張データを含み得る。
[0078]幾つかの例では、上位レイヤ中のデータは、1つ又は複数の下位レイヤ中のデータを参照して復号され得る。下位レイヤは、レイヤ間予測を使用して上位レイヤを圧縮するための参照ピクチャとして使用され得る。下位レイヤのデータは、上位レイヤと同じ解像度を有するようにアップサンプリングされ得る。概して、1つ又は複数のアップサンプリングされた下位レイヤが、1つ又は複数の近隣ピクチャとは対照的に、参照ピクチャとして使用され得ることを除いて、ビデオエンコーダ20及びビデオデコーダ30は、上記で説明したインター予測と同様の方法でレイヤ間予測を実施し得る。
[0079]図4は、3つの異なる次元におけるスケーラビリティの一例を示す概念図である。スケーラブルビデオコード化構造では、スケーラビリティは、3つの次元において有効化される。図4の例では、スケーラビリティは、空間(S)次元100、時間(T)次元102、及び信号対雑音比(SNR)次元又は品質(Q)次元104において有効化される。時間次元102では、例えば、7.5Hz(T0)、15Hz(T1)又は30Hz(T2)をもつフレームレートが時間スケーラビリティによってサポートされ得る。空間スケーラビリティがサポートされるとき、例えば、1/4共通中間フォーマット(QCIF)(S0)、共通中間フォーマット(CIF)(S1)及び4CIF(S2)、など、異なる解像度が空間次元100において有効化される。特定の空間解像度及びフレームレートごとに、ピクチャ品質を改善するために、SNR次元104においてSNRレイヤ(Q1)が追加され得る。
[0080]ビデオコンテンツがそのようなスケーラブルな方法で符号化されると、例えば、クライアント又は送信チャネルに依存する適用要件に従って、実際の配信されたコンテンツを適応させるために、抽出器ツールが使用され得る。図4に示された例では、各立方体は、同じフレームレート(時間レベル)、空間解像度、及びSNRレイヤをもつピクチャを含んでいる。立方体(即ち、ピクチャ)を次元100、102又は104のいずれかに追加することによって、より良い表現が達成され得る。2つ、3つ、又は更に多くのスケーラビリティが有効化されるとき、複合スケーラビリティがサポートされる。
[0081]H.264に対するSVC拡張、即ちSHVCなど、スケーラブルビデオコード化規格では、最低の空間レイヤ及びSNRレイヤをもつピクチャは、単一レイヤビデオコーデックと互換性があり、最低の時間レベルにあるピクチャは、上位時間レベルにあるピクチャを用いて拡張され得る時間ベースレイヤを形成する。ベースレイヤに加えて、空間及び/又は品質スケーラビリティを実現するために幾つかの空間及び/又はSNR拡張レイヤが追加され得る。各々の空間拡張レイヤ又はSNR拡張レイヤ自体は、ベースレイヤと同じ時間スケーラビリティ構造で、時間的にスケーラブルであり得る。1つの空間拡張レイヤ又はSNR拡張レイヤについて、それが依存する下位レイヤは、その特定の空間拡張レイヤ又はSNR拡張レイヤのベースレイヤと呼ばれることがある。
[0082]図5は、スケーラブルビデオコード化ビットストリームの例示的な構造110を示す概念図である。ビットストリーム構造110は、ピクチャ又はスライスI0、P4及びP8を含むレイヤ0 112と、ピクチャ又はスライスB2、B6及びB10を含むレイヤ1 114とを含む。更に、ビットストリーム構造110は、ピクチャ0、2、4、6、8及び10をそれぞれ含むレイヤ2 116並びにレイヤ3 117と、ピクチャ0〜11を含むレイヤ4 118とを含む。
[0083]ベースレイヤは、最低の空間レイヤ及び品質レイヤを有する(即ち、QCIF解像度をもつ、レイヤ0 112及びレイヤ1 114中のピクチャ)。これらの中で、最低時間レベルのそれらのピクチャは、図5のレイヤ0 112に示されているように、時間ベースレイヤを形成する。時間ベースレイヤ(レイヤ0)112は、上位時間レベル、例えば、15Hzのフレームレートをもつレイヤ1 114、又は30Hzのフレームレートをもつレイヤ4 118のピクチャで拡張され得る。
[0084]ベースレイヤ112、114に加えて、空間及び/又は品質スケーラビリティを実現するために幾つかの空間及び/又はSNR拡張レイヤが追加され得る。例えば、CIF解像度をもつレイヤ2 116は、ベースレイヤ112、114に対する空間拡張レイヤであり得る。別の例では、レイヤ3 117は、ベースレイヤ112、114とレイヤ2 116とに対するSNR拡張レイヤであり得る。図5に示されているように、各々の空間拡張レイヤ又はSNR拡張レイヤ自体は、ベースレイヤ112、114と同じ時間スケーラビリティ構造で、時間的にスケーラブルであり得る。更に、拡張レイヤは空間解像度とフレームレートの一方又は両方を向上させ得る。例えば、レイヤ4 118は、フレームレートを15Hzから30Hzに更に増大させる、4CIF解像度拡張レイヤを提供する。
[0085]図6は、ビットストリーム順序で、例示的なスケーラブルビデオコード化アクセス単位120A〜120E(「アクセス単位120」)を示す概念図である。図6に示されているように、同じ時間インスタンス中のコード化ピクチャ又はスライスは、ビットストリーム順序で連続しており、H.264に対するSVC拡張、即ち、SHVCなど、スケーラブルビデオコード化規格のコンテキストにおいて1つのアクセス単位を形成する。これらのアクセス単位120は、次いで、表示順序とは異なり、例えば、アクセス単位120間の時間予測関係によって決定され得る、復号順序に従う。
[0086]例えば、アクセス単位120Aは、レイヤ0 112からのピクチャI0と、レイヤ2 116からのピクチャ0と、レイヤ3 117からのピクチャ0と、レイヤ4 118からのピクチャ0とを含む。アクセス単位120Bは、レイヤ0 112からのピクチャP4と、レイヤ2 116からのピクチャ4と、レイヤ3 117からのピクチャ4と、レイヤ4 118からのピクチャ4とを含む。アクセス単位120Cは、レイヤ1 114からのピクチャB2と、レイヤ2 116からのピクチャ2と、レイヤ3 117からのピクチャ2と、レイヤ4 118からのピクチャ2とを含む。アクセス単位120Dは、レイヤ4 118からのピクチャ1を含み、アクセス単位120Eはレイヤ4 118からのピクチャ3を含む。
[0087]図7は、例示的な3レイヤSHVCエンコーダ122を示すブロック図である。図7に示されているように、SHVCエンコーダ122は、ベースレイヤエンコーダ124と、第1の拡張レイヤエンコーダ125と、第2の拡張レイヤエンコーダ126とを含む。高レベルのシンタックス専用SHVCでは、HEVC単一レイヤコード化と比較されると、新しいブロックレベルのコード化ツールは存在しない。SHVCでは、スライス及びその上のレベルのシンタックス変更、並びにピクチャのフィルタリング又はアップサンプリングなどのピクチャレベルの動作のみが許可される。
[0088]レイヤ間の冗長性を低減するために、単一レイヤ内のフレーム間予測と同じ方法でレイヤ間予測が達成され得るように、下位/ベースレイヤのためのアップサンプリングされたコロケート参照レイヤピクチャが生成され、上位/拡張レイヤのための参照バッファに記憶され得る。図7に示されているように、リサンプリングされたレイヤ間参照(ILR)ピクチャ128がベースレイヤエンコーダ124中の参照ピクチャから生成され、第1の拡張レイヤエンコーダ125に記憶される。同様に、リサンプリングされたILRピクチャ129が第1の拡張レイヤエンコーダ125中の参照ピクチャから生成され、第2の拡張レイヤエンコーダ126に記憶される。SHVC WD3では、ILRピクチャは拡張レイヤのための長期参照ピクチャとしてマークされる。レイヤ間参照ピクチャに関連付けられた動きベクトル差分は0に制約される。
[0089]超高解像度テレビジョン(UHDTV)機器及びそのコンテンツの来るべき展開は、レガシー機器とは異なる色域を使用することになる。具体的には、HDは、BT.709勧告、ITU−R勧告BT.709「Parameter values for the HDTV standards for production and international programme exchange」2010年12月を使用するのに対して、UHDTVは、BT.2020勧告、ITU−R勧告BT.2020「Parameter values for UHDTV systems for production and international programme exchange」2012年4月を使用することになる。色域は、例えば、ビデオデータのピクチャ、スライス、ブロック又はレイヤ中で、画像のために再生され得る色の完全範囲を備える。これらのシステム間の主な差は、UHDTVの色域がHDよりもかなり大きいことである。UHDTVは、高解像度など、他のUHDTV特性に一致する、より真に迫った、又は現実的な視聴体験を提供することになると主張されている。
[0090]図8は、サンプルビデオシーケンス130の例示的な色域を示すグラフである。図8に示されているように、SWG1サンプルビデオシーケンス130は、UHD色域BT.2020 132の輪郭線内の点のクラスタとして示される。比較のために、HD色域BT.709 134の輪郭及び国際照明委員会(CIE:International Commission on Illumination)−XYZ線形色空間136の輪郭は、SWG1サンプルビデオシーケンス130をオーバーレイする。UHD色域BT.2020 132はHD色域BT.709 134よりもはるかに大きいことが図8から容易に観察される。BT.709色域134から外れるSWG1サンプルビデオシーケンス130中の画素の数に留意されたい。
[0091]図9は、HD色域BT.709 134からUHD色域BT.2020 132への変換を示すブロック図である。HD色域BT.709 134とUHD色域BT.2020 132は両方とも、ルーマ成分及びクロマ成分(例えば、YCbCr又はYUV)中の色画素の表現を定義する。各色域は、CIE−XYZ線形色空間136の間の変換を定義する。この共通の中間色空間は、HD色域BT.709 134中のルーマ値及びクロマ値の、UHD色域BT.2020 132中の対応するルーマ値及びクロマ値への変換を定義するために使用され得る。図8に示されたサンプルシーケンスの色域及び図9に示された色域変換に関する更なる詳細は、L.Kerofsky、A.Segall、S.−H.Kim、K.Misra、「Color Gamut Scalable Video Coding:New Results」、JCTVC−L0334、ITU−T SG 16 WP 3とISO/IEC JTC 1/SC 29/WG 11とのビデオコード化共同研究部会(JCT−VC)、第12回会合、ジュネーブ、スイス、2013年1月14日〜23日(以下、「JCTVC−L0334」と呼ばれる)において見つけられ得る。
[0092]図10は、ベースレイヤ色域と拡張レイヤ色域とが異なるときにレイヤ間参照ピクチャを生成し得る色予測処理ユニット144を含む色域スケーラブルコーダ140を示すブロック図である。色予測処理ユニット144は、ベースレイヤと拡張レイヤとの色域が異なる色域スケーラブルビデオコード化を実施するために、図2からのビデオエンコーダ20又は図3からのビデオデコーダ30などのビデオコーダによって使用され得る。幾つかの場合には、色予測処理ユニット144は、図2からのビデオエンコーダ20の色予測処理ユニット66と実質的に同様に動作し得る。他の場合には、色予測処理ユニット144は、図3からのビデオデコーダ30の色予測処理ユニット86と実質的に同様に動作し得る。
[0093]図10に示されている例では、ベースレイヤコード化ループ142は、第1の色域、例えば、BT.709中の色データを含むピクチャのビデオコード化を実施し、拡張レイヤコード化ループ146は、第2の色域、例えば、BT.2020中の色データを含むピクチャのビデオコード化を実施する。色予測処理ユニット144は、第1の色域中のベースレイヤ参照ピクチャの色データを第2の色域にマッピング又は変換するために色予測を実施し、ベースレイヤ参照ピクチャのマッピングされた色データに基づいて、拡張レイヤのためにレイヤ間参照ピクチャを生成する。
[0094]高いコード化効率を達成するために、色予測処理ユニット144は、レイヤ間参照ピクチャを生成するとき、特定の色予測を実施するように構成される。以下でより詳細に説明するように、色予測処理ユニット144は、線形予測モデル、区分線形予測モデル、又は3Dルックアップテーブルベースの色予測モデルのうちのいずれかに従って色予測を実施するように構成され得る。
[0095]線形予測モデルは、上記で参照したJCTVC−L0334で提案されている。概して、線形予測モデルの色予測プロセスは、利得及びオフセットモデルとして記述され得る。線形予測モデルは個々の色平面上で動作する。整数計算を容易にするために、パラメータは、パラメータnumFractionBitsを使用する計算において使用される小数ビットの数を記述する。各チャネルについて、gain[c]及びoffset[c]が指定される。線形予測モデルは次のように定義される。
Pred[c][x][y] = (gain[c]*In[x][y] + (1<<(numFractionBits-1)) >> numFractionBits + offset[c]
[0096]区分線形予測モデルは、上記で参照した、JCTVC−L0334に基づく、C.Auyeung、K.Sato、「AHG14:Color gamut scalable video coding with piecewise linear predictions and shift−offset model」、JCTVC−N0271、ウィーン、オーストリア、2013年7月で提案されている。区分線形予測モデルの色予測プロセスも、利得及びオフセットモデルとして記述され得る。区分線形予測モデルは次のように定義される。
d[c][x][y] = In[c][x][y] - knot[c]とする.
d[c][x][y] <= 0の場合
Pred[c][x][y] = (gain1[c]*d[c][x][y] + offset[c] + (1<<(numFractionBits-1))) >> numFractionBits
さもなければ
Pred[c][x][y] = (gain2[c]*d[c][x][y] + offset[c] + (1<<(numFractionBits-1))) >> numFractionBits
予測パラメータknot[c]、offset[c]、gain1[c]、及びgain2[c]はビットストリーム中で符号化され得る。
[0097]図11A及び図11Bは、色域スケーラビリティのための例示的な3Dルックアップテーブル150の異なるビューを示す概念図である。3Dルックアップテーブルベースの色予測モデルは、P.Bordes、P.Andrivon、F.Hiron、「AHG14: Color Gamut Scalable Video Coding using 3D LUT: New Results」、JCTVC−N0168、ITU−T SG 16 WP 3とISO/IEC JTC 1/SC 29/WG 11とのビデオコード化共同研究部会(JCT−VC)、第14回会合、ウィーン、オーストリア、2013年7月(以下、「JCTVC−N0168」と呼ばれる)で提案されている。色域スケーラビリティのための3Dルックアップテーブルの原理が図11A及び図11Bに示されている。3Dルックアップテーブル150は、第1の3D色空間、例えば、HD色域BT.709のサブサンプリングと見なされ得、ここで、各交点は、第2の3D色空間(即ち、予測された)値、例えば、UHD色域BT.2020)に対応するカラートリプレット(color triplet)値(y,u,v)に関連付けられる。
[0098]概して、第1の色域は、各色次元(即ち、Y、U、及びV)においてオクタント又は直方体に区分化され得、オクタントの交点は、第2の色域に対応するカラートリプレット値に関連付けられ、3Dルックアップテーブル150をポピュレートするために使用される。各色次元における交点又はセグメントの数は、3Dルックアップテーブルのサイズを示す。図11Aは、3Dルックアップテーブル150の各色次元におけるオクタントの交点又は交差する格子点を示す。図11Bは、3Dルックアップテーブル150の交点の各々に関連付けられた様々な色値を示す。図示のように、図11Aでは、各色次元は4つの交点を有し、図11Bでは、各色次元は4つの色値を含む。
[0099]図12は、色域スケーラビリティのための3Dルックアップテーブル152を用いた3線補間を示す概念図である。第1の色域中の所与のベースレイヤ色サンプルに関して、拡張レイヤのための第2の色域中のそれの予測の計算は、次の式に従って、3線補間を使用して行われる。
S0(y)=y1−y及びS1(y)=y−y0
y0は、yよりも下位である、最も近いサブサンプリングされた交点のインデックスである。
y1は、yより上位である、最も近いサブサンプリングされた交点のインデックスである。
図11A及び図11Bに示された3Dルックアップテーブルと、図12に示された3Dルックアップテーブルを用いた3線補間とについての更なる詳細は、上記のJCTVC−N0168において見つけられ得る。
[0100]図13は、色域スケーラビリティのための3Dルックアップテーブル154を用いた四面体補間を示す概念図である。四面体補間は、3Dルックアップテーブルの計算複雑さを低減するために、上記で説明した3線補間の代わりに使用され得る。
[0101]図14は、四面体補間を使用して補間されるべき3Dルックアップテーブルの点Pを包含するために使用される四面体の6つの例156A〜156F(集合的に「四面体156」)を示す概念図である。図14の例では、交点P0及びP7が四面体中に含まれる必要があると仮定すると、3Dルックアップテーブルのオクタント中で補間されるべき点Pを含んでいる四面体を決定するために6つの選択肢が存在する。四面体補間を使用して、3Dルックアップテーブルは、各2つの成分、即ち、y及びu、y及びv、u及びvの関係をチェックする代わりに、高速決定のために設計され得る。
[0102]2014年10月10日に出願された米国特許出願第14/512,177号において、非対称3D LUT及び不平衡3D LUTについて説明された。非対称3Dルックアップテーブルは、ルーマ成分とクロマ成分が異なるテーブルサイズを有するように、例えば、クロマ成分がより粗いルックアップテーブルを使用し、ルーマ成分がより洗練されたルックアップテーブルを使用するように使用され得る。不平衡3Dルックアップテーブル、即ち、table[M][N][K]が使用され得、ここで、色マッピングが、同じ色成分からはより正確であるが、他の色成分からはあまり正確でないことがあるように、各次元のサイズは異なる。3Dルックアップテーブルはルーマ成分のみのために使用され得、一方、1D線形マッピング又は区分線形マッピングはそれぞれU成分及びV成分のために使用される。
[0103]2014年12月16日に出願された米国特許出願第14/571,939号、及び2014年12月16日に出願された米国特許出願第14/572,002号において、上記で説明した非対称3D LUT及び不平衡3D LUTに対する改善について説明された。例えば、説明された改善は、色域スケーラビリティのための3D LUTを生成するために使用される区分情報及び/又は色値を信号伝達するための技法を含む。更なる詳細は、関係する米国特許出願の原文において見つけられ得る。
[0104]第17回JCT−VC会合において、JCTVC−Q0048(Li,X.ら、「SCE1.2: Color gamut scalability with asymmetric 3D LUT」、ITU−T SG 16 WP 3とISO/IEC JTC 1/SC 29/WG 11とのJCT−VC、第17回会合:バレンシア、スペイン、2014年3月27日〜4月4日)で提案された非対称3Dルックアップテーブルベースの色域スケーラビリティが採用された。関係するシンタックステーブル及びセマンティクスは次の通りである。
[0105] 色マッピングテーブルRBSPシンタックス
[0106] 色マッピングテーブルオクタントRBSPシンタックス
[0107]色マッピングテーブルRBSPセマンティクス
[0108]cm_octant_depthは、色マッピングテーブルの最大分割深度を指定する。この仕様のこのバージョンに準拠するビットストリームでは、cm_octant_depthの値は、両端値を含む、0〜1の範囲内にあるものである。変数COctantNumは次のように導出される。
COctantNum=1<<cm_octant_depth
[0109]cm_y_part_num_log2は、ルーマ成分のための最も小さい色マッピングテーブルオクタントの区分の数を指定する。変数YOctantNum及びYPartNumは次のように導出される。
YOctantNum=1<<(cm_octant_depth+cm_y_part_num_log2)
YPartNum=1<<cm_y_part_num_log2
[0110]cm_input_bit_depth_luma_minus8は、色マッピングプロセスの入力ルーマ成分のサンプルビット深度を指定する。変数CMInputBitDepthYは次のように導出される。
CMInputBitDepthY=8+cm_input_bit_depth_luma_minus8
[0111]cm_input_bit_depth_chroma deltaは、色マッピングプロセスの入力クロマ成分のサンプルビット深度を指定する。変数CMInputBitDepthCは次のように導出される。
CMInputBitDepthC=CMInputBitDepthY+ cm_input_bit_depth_chroma_delta
[0112]cm_output_bit_depth_luma_minus8は、色マッピングプロセスの出力ルーマ成分のサンプルビット深度を指定する。変数CMOutputBitDepthYは次のように導出される。
CMOutputBitDepthY=8+cm_output_bit_depth_luma_minus8
[0113]cm_output_bit_depth_chroma_deltaは、色マッピングプロセスの出力クロマ成分のサンプルビット深度を指定する。変数CMOutputBitDepthCは次のように導出される。
CMOutputBitDepthC=CMOutputBitDepthY +
cm_output_bit_depth_chroma_delta
[0114]cm_res_quant_bitsは、交点残差値res_y、res_u及びres_vに追加されるべき最下位ビットの数を指定する。
[0115]色マッピングテーブルオクタントRBSPセマンティクス
[0116]1に等しいsplit_octant_flagは、現在の色マッピングテーブルオクタントが、3次元の各々において1/2の長さをもつ8つのオクタントに更に分割されることを指定する。0に等しいsplit_octant_flagは、現在の色マッピングテーブルオクタントが、8つのオクタントに更に分割されないことを指定する。存在しないとき、split_octant_flagの値は0に等しいと推論される。
[0117]1に等しいcoded_vertex_flag[yIdx][uIdx][vIdx][vertex]は、インデックス[yIdx][uIdx][vIdx][vertex]をもつ交点の残差が存在することを指定する。0に等しいcoded_vertex_flagは、インデックス[yIdx][uIdx][vIdx][vertex]をもつ交点の残差が存在しないことを指定する。存在しないとき、coded_vertex_flagの値は0に等しいと推論される。
[0118]res_y[yIdx][uIdx][vIdx][vertex]は、インデックス[yIdx][uIdx][vIdx][vertex]をもつ交点のためのルーマ成分の予測残差を指定する。存在しないとき、res_y[yIdx][uIdx][vIdx][vertex]の値は0に等しいと推論される。
[0119]res_u[yIdx][uIdx][vIdx][vertex]は、インデックス[yIdx][uIdx][vIdx][vertex]をもつ交点のためのCb成分の予測残差を指定する。存在しないとき、res_u[yIdx][uIdx][vIdx][vertex]の値は0に等しいと推論される。
[0120]res_v[yIdx][uIdx][vIdx][vertex]は、インデックス[yIdx][uIdx][vIdx][vertex]をもつ交点のためのCr成分の予測残差を指定する。存在しないとき、res_v[yIdx][uIdx][vIdx][vertex]の値は0に等しいと推論される。
[0121]上記の例では、色成分の各々のための各オクタントについて、オクタントの交点が信号伝達され得る。この例では、所与の交点の予測値と所与の交点の実効値との間の残差値が信号伝達され得る。第2の例では、色成分の各々のための各オクタントについて、オクタントの交点の代わりに、3Dルックアップテーブル中の色値の線形色マッピング関数のための色マッピング係数(即ち、a、b、c及びd)が信号伝達され得る。色予測を実施するために、色マッピングパラメータをもつ線形色マッピング関数が直接使用され得る。共通の線形色マッピング関数は次のように表され得る。
上記の例示的な関数では、下付き文字e及びbは、それぞれ、ルーマ色成分、第1のクロマ色成分、及び第2のクロマ色成分(即ち、Y、U、及びV)の各々のための上位レイヤ(即ち、拡張レイヤ)及び下位レイヤ(例えば、ベースレイヤ)を示す。パラメータa、b、c、及びdは、ビデオデータの下位レイヤの色成分と上位レイヤの色成分との間の重み係数である色マッピング係数を表す。
[0122]3Dルックアップテーブルの各オクタントのための線形色マッピング関数のための色マッピング係数を信号伝達する例示的な技法では、colour_mapping_table_octantシンタックステーブルは、交点残差値resY[yIdx][uIdx][vIdx][vertex]、resU[yIdx][uIdx][vIdx][vertex]、及びresV[yIdx][uIdx][vIdx][vertex]を信号伝達する代わりに、オクタントの線形色マッピング関数のための色マッピング係数(即ち、a、b、c、及びd)と、オクタントについて予測される色マッピング係数値との間の差分である残差値を示し得る。関係するシンタックステーブル及びセマンティクスは次の通りである。
[0123] 色マッピングオクタントシンタックス
[0124]色マッピングオクタントセマンティクス
[0125]1に等しいsplit_octant_flagは、現在の色マッピングオクタントが、3次元の各々において1/2の長さをもつ8つのオクタントに更に分割されることを指定する。0に等しいsplit_octant_flagは、現在の色マッピングオクタントが、8つのオクタントに更に分割されないことを指定する。存在しないとき、split_octant_flagの値は0に等しいと推論される。
[0126]1に等しいcoded_res_flag[idxShiftY][idxCb][idxCr][j]は、(idxShiftY,idxCb,idxCr)に等しいオクタントインデックスをもつオクタントのj番目の色マッピング係数の残差が存在することを指定する。0に等しいcoded_res_flag[idxShiftY][idxCb][idxCr][j]は、(idxShiftY,idxCb,idxCr)に等しいオクタントインデックスをもつオクタントのj番目の色マッピング係数の残差が存在しないことを指定する。存在しないとき、coded_res_flag[idxShiftY][idxCb][idxCr][j]の値は0に等しいと推論される。
[0127]res_coeff_q[idxShiftY][idxCb][idxCr][j][c]は、(idxShiftY,idxCb,idxCr)に等しいオクタントインデックスをもつオクタントのc番目の色成分のj番目の色マッピング係数のための残差の商を指定する。存在しないとき、res_coeff_q[idxShiftY][idxCb][idxCr][j][c]の値は0に等しいと推論される。
[0128]res_coeff_r[idxShiftY][idxCb][idxCr][j][c]は、(idxShiftY,idxCb,idxCr)に等しいオクタントインデックスをもつオクタントのc番目の色成分のj番目の色マッピング係数のための残差の剰余を指定する。res_coeff_rをコード化するために使用されるビット数はCMResLSBitsに等しい。CMResLSBitsが0に等しい場合、res_coeff_rは存在しない。存在しないとき、res_coeff_r[idxShiftY][idxCb][idxCr][j][c]の値は0に等しいと推論される。
[0129]res_coeff_s[idxShiftY][idxCb][idxCr][j][c]は、(idxShiftY,idxCb,idxCr)に等しいオクタントインデックスをもつオクタントのc番目の色成分のj番目の色マッピング係数のための残差の符号を指定する。存在しないとき、res_coeff_s[idxShiftY][idxCb][idxCr][j][c]の値は0に等しいと推論される。
[0130]上記で説明した非対称3Dルックアップテーブルベースの色域スケーラビリティ(CGS:color gamut scalability)において、以下の潜在的問題が識別された。第1の潜在的問題として、色域スケーラビリティのための3D色予測の現在の設計では、色予測プロセスの入力色成分のビット深度と出力色成分のビット深度が両方ともエンコーダによって信号伝達され、これは不要であり得る。更に、現在のシンタックスは、色予測プロセスの参照レイヤ信号(例えば、ベースレイヤ色成分)と入力色成分が異なるビット深度を有することを可能にする。
[0131]第2の潜在的問題として、複数の参照レイヤの場合、現在の設計は、拡張レイヤのためにCGSテーブルを定義するが、拡張レイヤのためのレイヤ間参照ピクチャを導出するために、信号伝達されるCGSテーブルが参照レイヤのどれに適用されるのかを明確に定義しない。第3の潜在的問題として、現在のシンタックスは、レイヤ間重み付き予測が色予測プロセスの上に適用され得ることを可能にし、それにより、どんなコード化利得の恩恵をももたらすことなしに複雑さが増加され得る。
[0132]本開示で説明する技法は、上述の問題のうちの1つ又は複数を解決し得る。以下の技法は、それぞれ個々に適用され得る。代替的に、技法のうちの2つ以上が一緒に適用され得る。
[0133]上記で説明した第1の潜在的問題への第1の解決策として、制約がビデオエンコーダ20及び/又はビデオデコーダ30において入力ビット深度と出力ビット深度の一方又は両方に適用されて、色予測プロセスの入力ビット深度と出力ビット深度は両方がビットストリーム中で信号伝達される。一例では、ビデオエンコーダ20及び/又はビデオデコーダ30は、CGS色予測プロセスの入力ルーマ成分と入力クロマ成分とのビット深度を、それらのビット深度が参照レイヤピクチャのルーマ成分とクロマ成分とのビット深度に等しくなるように制約するように構成され得る。この例では、参照レイヤの出力信号(例えば、参照レイヤピクチャの色成分)は、CGS色予測プロセスのための3Dルックアップテーブルの入力信号として使用され得る。
[0134]別の例では、ビデオエンコーダ20及び/又はビデオデコーダ30は、CGS色予測プロセスの出力ルーマ成分と出力クロマ成分とのビット深度を、それらのビット深度が拡張レイヤピクチャのルーマ成分とクロマ成分とのビット深度に等しくなるように制約するように構成され得る。代替例では、ビデオエンコーダ20及び/又はビデオデコーダ30は、CGS色予測プロセスの出力ルーマ成分と出力クロマ成分とのビット深度を、それらのビット深度が両端値を含めて参照レイヤピクチャのルーマ成分及びクロマ成分のビット深度と拡張レイヤピクチャのルーマ成分及びクロマ成分のビット深度との間の範囲内にあるように制約するように構成され得る。
[0135]上記で説明した第1の潜在的問題への第2の解決策として、制約がビデオエンコーダ20及び/又はビデオデコーダ30において入力ビット深度と出力ビット深度の一方又は両方に適用されて、色予測プロセスの出力ビット深度のみがビットストリーム中で信号伝達され、入力ビット深度はビットストリーム中で信号伝達されない。この場合、ビデオデコーダ30は、制約に従って色予測プロセスの入力ビット深度を導出する。一例では、ビデオエンコーダ20及び/又はビデオデコーダ30は、CGS色予測プロセスの入力ルーマ成分と入力クロマ成分とのビット深度を、それらのビット深度が参照レイヤピクチャのルーマ成分とクロマ成分とのビット深度に等しくなるように制約するように構成され得る。
[0136]別の例では、ビデオエンコーダ20及び/又はビデオデコーダ30は、CGS色予測プロセスの出力ルーマ成分と出力クロマ成分とのビット深度を、それらのビット深度が拡張レイヤピクチャのルーマ成分とクロマ成分とのビット深度に等しくなるように制約するように構成され得る。代替例として、ビデオエンコーダ20及び/又はビデオデコーダ30は、CGS色予測プロセスの出力ルーマ成分と出力クロマ成分とのビット深度を、それらのビット深度が両端値を含めて参照レイヤピクチャのルーマ成分及びクロマ成分のビット深度と拡張レイヤピクチャのルーマ成分及びクロマ成分のビット深度との間の範囲内にあるように制約するように構成され得る。
[0137]上記で説明した第1の潜在的問題への第3の解決策として、制約がビデオエンコーダ20及び/又はビデオデコーダ30において入力ビット深度と出力ビット深度の一方又は両方に適用されて、色予測プロセスの入力ビット深度及び出力ビット深度は、ビットストリーム中で信号伝達されないが、代わりに導出される。一例では、ビデオエンコーダ20及び/又はビデオデコーダ30は、CGS色予測プロセスへの入力ルーマ成分と入力クロマ成分とのビット深度を、それらのビット深度が参照レイヤピクチャのルーマ成分とクロマ成分とのビット深度に等しくなるように導出するように構成され得る。別の例では、ビデオエンコーダ20及び/又はビデオデコーダ30は、CGS色予測プロセスの出力ルーマ成分と出力クロマ成分とのビット深度を、それらのビット深度が拡張レイヤピクチャのルーマ成分とクロマ成分とのビット深度に等しくなるように導出するように構成される。
[0138]上記で説明した第2の潜在的問題への解決策として、複数の参照レイヤの場合、ビデオエンコーダ20及び/又はビデオデコーダ30は、1つ又は複数の識別された参照レイヤのみの内の参照ピクチャに拡張レイヤの3Dルックアップテーブルを適用するように制約される。3Dルックアップテーブルは、ピクチャパラメータセット(PPS)によって参照される1つ又は複数のピクチャに3Dルックアップテーブルが適用されるように、ビットストリームのPPS中で信号伝達される。PPSは、ビデオデータの拡張レイヤ中の1つ又は複数の拡張レイヤピクチャと、ビデオデータの1つ又は複数の参照レイヤ中の1つ又は複数のコロケート参照レイヤピクチャとを参照し得る。PPSが複数の参照レイヤ(例えば、2つ以上の参照レイヤ)を含む例では、本開示の技法は、所与の拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するために3Dルックアップテーブルをそれに適用すべき参照レイヤのうちの少なくとも1つを識別する。
[0139]例えば、ビデオエンコーダ20は、CGSのための3Dルックアップテーブルのための1つ又は複数の参照レイヤ識別子(ID)を信号伝達し得、ビデオデコーダ30は、信号伝達された参照レイヤIDによって識別される1つ又は複数の参照レイヤ中の参照レイヤピクチャのみに3Dルックアップテーブルを適用する。3Dルックアップテーブルは、拡張レイヤピクチャのレイヤ間参照ピクチャを生成するためにCGSを実施するために、所与の拡張レイヤピクチャについて信号伝達される。ビデオデコーダ30は、レイヤ間参照ピクチャを生成するために3Dルックアップテーブルがそれらに適用されるべきである1つ又は複数の参照レイヤを知る必要がある。
[0140]幾つかの例では、拡張レイヤピクチャのための3Dルックアップテーブルを使用してレイヤ間参照ピクチャを生成するために、複数参照レイヤのうちの2つ以上中の参照レイヤピクチャが一緒に使用され得る。この場合、2つ以上の参照レイヤを識別する2つ以上の参照レイヤIDがビットストリーム中で信号伝達される。他の例では、拡張レイヤピクチャのための3Dルックアップテーブルを使用してレイヤ間参照ピクチャを生成するために、複数の参照レイヤのうちのただ1つの中の参照レイヤピクチャが使用され得る。この場合、1つの参照レイヤを識別する1つの参照レイヤIDがビットストリーム中で信号伝達される。
[0141]追加の例として、低い計算複雑さを保つために、ビデオエンコーダ20及び/又はビデオデコーダ30は、複数の参照レイヤが利用可能であるときでも、各拡張レイヤピクチャについてCGS色予測プロセスを1回のみ適用するように制約され得る。この例では、各拡張レイヤピクチャについて、拡張レイヤピクチャのための3Dルックアップテーブルを使用してレイヤ間参照ピクチャを生成するために、複数参照レイヤのうちの厳密に1つの中の参照レイヤピクチャが使用され得る。ビデオエンコーダ20は、各拡張レイヤピクチャについて厳密に1つの参照レイヤIDを信号伝達するように制約され得、ビデオデコーダ30は、信号伝達された参照レイヤIDによって識別される厳密に1つの参照レイヤ中の参照レイヤピクチャのみに3Dルックアップテーブルを適用するように制約され得る。
[0142]2つの連続する拡張レイヤピクチャの場合、異なる参照レイヤ中の参照レイヤピクチャがCGS色予測プロセスのために使用され得る。例えば、第1の拡張レイヤピクチャについて、ビデオエンコーダ20及び/又はビデオデコーダ30は、第1の拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するために第1の参照レイヤ中の参照レイヤピクチャを使用し得る。第2の拡張レイヤピクチャについて、ビデオエンコーダ20及び/又はビデオデコーダ30は、第2の拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するために第1の参照レイヤとは異なる第2の参照レイヤ中の参照レイヤピクチャを使用し得る。
[0143]CGSのための3Dルックアップテーブル中で参照レイヤIDを信号伝達する一例について以下で説明する。上記に提示されたcolour_mapping_tableのシンタックス及びセマンティクスへの追加はイタリック体のテキストで示されている。
[0145]CGSのための3Dルックアップテーブル中で参照レイヤIDを信号伝達する別の例について以下で説明する。colour_mapping_tableのシンタックス及びセマンティクスへの追加はイタリック体のテキストで示されている。
[0148]上記で説明した第3の潜在的問題への解決策として、低い計算複雑さを保つために、ビデオエンコーダ20及び/又はビデオデコーダ30は、CGS色予測プロセスによって生成されたレイヤ間参照ピクチャに重み付き予測を適用しないように制約される。この場合、1つ又は複数の参照レイヤピクチャに適用される3Dルックアップテーブルを使用して拡張レイヤピクチャのために生成されたレイヤ間参照ピクチャは、拡張レイヤピクチャを予測するためにそれ自体で使用される。拡張レイヤピクチャのための重み付き予測の場合、レイヤ間参照ピクチャは、候補参照ピクチャのグループ中の候補参照ピクチャとして使用されない。
[0149]図2は、本開示で説明する技法を実装し得るビデオエンコーダ20の一例を示すブロック図である。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコード化及びインターコード化を実施し得る。イントラコード化は、所与のビデオフレーム又はピクチャ内のビデオの空間冗長性を低減又は除去するために空間的予測に依拠する。インターコード化は、ビデオシーケンスの隣接するフレーム又はピクチャ内のビデオの時間冗長性を低減又は除去するために時間的予測に依拠する。イントラモード(Iモード)は、幾つかの空間ベースのコード化モードのいずれかを指し得る。単方向予測(Pモード)又は双予測(Bモード)などのインターモードは、幾つかの時間ベースのコード化モードのいずれかを指し得る。
[0150]図2に示されているように、ビデオエンコーダ20は、符号化されるべきビデオフレーム内の現在ビデオブロックを受信する。図2の例では、ビデオエンコーダ20は、モード選択ユニット40と、ビデオデータメモリ41と、復号ピクチャバッファ64と、加算器50と、変換処理ユニット52と、量子化ユニット54と、エントロピー符号化ユニット56とを含む。モード選択ユニット40は、今度は、動き補償ユニット44と、動き推定ユニット42と、イントラ予測単位46と、区分化ユニット48とを含む。ビデオブロック再構成のために、ビデオエンコーダ20はまた、逆量子化ユニット58と、逆変換処理ユニット60と、加算器62とを含む。再構成されたビデオからブロック歪み(blockiness artifacts)を除去するためにブロック境界をフィルタ処理するためのデブロッキングフィルタ(図2に図示されず)も含まれ得る。所望される場合、デブロッキングフィルタは、通常、加算器62の出力をフィルタ処理することになる。デブロッキングフィルタに加えて、追加のフィルタ(ループ内又はループ後)も使用され得る。そのようなフィルタは簡潔のために示されていないが、所望される場合、(ループ内フィルタとして)加算器50の出力をフィルタ処理し得る。
[0151]ビデオデータメモリ41は、ビデオエンコーダ20の構成要素によって符号化されるべきビデオデータを記憶し得る。ビデオデータメモリ41に記憶されたビデオデータは、例えば、ビデオ発信源18から取得され得る。復号ピクチャバッファ64は、例えば、イントラコード化モード又はインターコード化モードでビデオエンコーダ20によってビデオデータを符号化する際に使用するための、参照ビデオデータを記憶する参照ピクチャメモリであり得る。ビデオデータメモリ41及び復号ピクチャバッファ64は、同期DRAM(SDRAM)を含む、ダイナミックランダムアクセスメモリ(DRAM)、磁気抵抗RAM(MRAM)、抵抗RAM(RRAM(登録商標))、又は他のタイプのメモリ機器など、様々なメモリ機器のいずれかによって形成され得る。ビデオデータメモリ41及び復号ピクチャバッファ64は、同じメモリ機器又は別個のメモリ機器によって提供され得る。様々な例では、ビデオデータメモリ41は、ビデオエンコーダ20の他の構成要素とともにオンチップであるか、又はそれらの構成要素に対してオフチップであり得る。
[0152]符号化プロセス中に、ビデオエンコーダ20は、コード化されるべきビデオフレーム又はスライスを受信する。フレーム又はスライスは、複数のビデオブロックに区分化され得る。動き推定ユニット42及び動き補償ユニット44は、時間的予測を行うために、1つ又は複数の参照フレーム中の1つ又は複数のブロックに対して、受信されたビデオブロックのインター予測コード化を実施する。イントラ予測単位46は、代替的に、空間的予測を行うために、コード化されるべきブロックと同じフレーム又はスライス中の1つ又は複数の隣接ブロックに対して、受信されたビデオブロックのイントラ予測コード化を実施し得る。ビデオエンコーダ20は、例えば、ビデオデータの各ブロックに適切なコード化モードを選択するために、複数のコード化パスを実施し得る。
[0153]その上、区分化ユニット48は、前のコード化パスにおける前の区分方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分化し得る。例えば、区分化ユニット48は、初めにフレーム又はスライスをLCUに区分化し、レート歪み分析(例えば、レート歪み最適化)に基づいてLCUの各々をサブCUに区分化し得る。モード選択ユニット40は、LCUをサブCUに区分化することを示す4分木データ構造を更に生成し得る。4分木のリーフノードCUは、1つ又は複数のPU及び1つ又は複数のTUを含み得る。
[0154]モード選択ユニット40は、例えば、誤差結果に基づいてコード化モード、イントラ又はインターのうちの1つを選択し、残差ブロックデータを生成するために、得られたイントラコード化ブロック又はインターコード化ブロックを加算器50に提供し、また、参照フレームとして使用するための符号化ブロックを再構成するために、得られたイントラコード化ブロック又はインターコード化ブロックを加算器62に提供し得る。モード選択ユニット40はまた、動きベクトル、イントラモードインジケータ、区分情報、及び他のそのようなシンタックス情報など、シンタックス要素をエントロピー符号化ユニット56に提供する。
[0155]動き推定ユニット42と動き補償ユニット44は、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット42によって実施される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、例えば、現在ピクチャ(又は、他のコード化単位)内でコード化されている現在ブロックに対する参照ピクチャ(又は、他のコード化単位)内の予測ブロックに対する現在ビデオフレーム又はピクチャ内のビデオブロックのPUの変位を示し得る。予測ブロックは、絶対差分和(SAD)、2乗差分和(SSD)、又は他の差分メトリックによって決定され得る画素差分に関して、コード化されるべきブロックにぴったり一致することがわかるブロックである。幾つかの例では、ビデオエンコーダ20は、復号ピクチャバッファ64に記憶された参照ピクチャのサブ整数画素位置の値を計算し得る。例えば、ビデオエンコーダ20は、参照ピクチャの1/4画素位置、1/8画素位置、又は他の分数画素位置の値を補間し得る。従って、動き推定ユニット42は、フル画素位置と分数画素位置とに対する動き探索を実施し、分数画素精度で動きベクトルを出力し得る。
[0156]動き推定ユニット42は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライスにおけるビデオブロックのPUのための動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)又は第2の参照ピクチャリスト(リスト1)から選択され得、それらの参照ピクチャリストの各々は、復号ピクチャバッファ64に記憶された1つ又は複数の参照ピクチャを識別する。動き推定ユニット42は、計算された動きベクトルをエントロピー符号化ユニット56と動き補償ユニット44とに送る。
[0157]動き補償ユニット44によって実施される動き補償は、動き推定ユニット42によって決定された動きベクトルに基づいて予測ブロックをフェッチ又は生成することを伴い得る。同じく、動き推定ユニット42と動き補償ユニット44は、幾つかの例では、機能的に統合され得る。現在ビデオブロックのPUのための動きベクトルを受信すると、動き補償ユニット44は、参照ピクチャリストのうちの1つにおいて動きベクトルが指す予測ブロックの位置を特定し得る。加算器50は、下記で論じられるように、コード化されている現在ビデオブロックの画素値から予測ブロックの画素値を減算し、画素差分値を形成することによって、残差ビデオブロックを形成する。概して、動き推定ユニット42は、ルーマ成分に対して動き推定を実施し、動き補償ユニット44は、クロマ成分とルーマ成分の両方について、ルーマ成分に基づいて計算された動きベクトルを使用する。モード選択ユニット40はまた、ビデオスライスのビデオブロックを復号する際のビデオデコーダ30による使用のために、ビデオブロックとビデオスライスとに関連付けられたシンタックス要素を生成し得る。
[0158]イントラ予測単位46は、上記で説明したように、動き推定ユニット42と動き補償ユニット44とによって実施されるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測単位46は、現在ブロックを符号化するために使用すべきイントラ予測モードを決定し得る。幾つかの例では、イントラ予測単位46は、例えば別々の符号化パス中に、様々なイントラ予測モードを使用して現在ブロックを符号化し得、イントラ予測単位46(又は、幾つかの例では、モード選択ユニット40)は、テストされたモードから使用すべき適切なイントラ予測モードを選択し得る。
[0159]例えば、イントラ予測単位46は、様々なテストされたイントラ予測モードのためのレート歪み分析を使用してレート歪み値を計算し、テストされたモードの間で最良のレート歪み特性を有するイントラ予測モードを選択し得る。レート歪み分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間の歪み(又は誤差)の量、並びに符号化ブロックを生成するために使用されたビットレート(即ち、ビット数)を決定する。イントラ予測単位46は、どのイントラ予測モードがブロックについて最良のレート歪み値を呈するかを決定するために、様々な符号化ブロックの歪み及びレートから比を計算し得る。
[0160]ブロックのためのイントラ予測モードを選択した後に、イントラ予測単位46は、ブロックのための選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット56に提供し得る。エントロピー符号化ユニット56は、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ20は、複数のイントラ予測モードインデックステーブル及び複数の修正されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)と、様々なブロックのための符号化コンテキストの定義と、コンテキストの各々について使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、及び修正されたイントラ予測モードインデックステーブルの指示とを含み得る構成データを送信ビットストリーム中に含め得る。
[0161]ビデオエンコーダ20は、コード化されている元のビデオブロックから、モード選択ユニット40からの予測データを減算することによって残差ビデオブロックを形成する。加算器50は、この減算演算を実施する1つ又は複数の構成要素を表す。変換処理ユニット52は、離散コサイン変換(DCT)又は概念的に同様の変換など、変換を残差ブロックに適用し、残差変換係数値を備えるビデオブロックを生成する。変換処理ユニット52は、DCTと概念的に同様である他の変換を実施し得る。ウェーブレット変換、整数変換、サブバンド変換又は他のタイプ変換も使用され得る。いずれの場合も、変換処理ユニット52は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、残差情報を画素値領域から周波数領域などの変換領域に変換し得る。変換処理ユニット52は、得られた変換係数を量子化ユニット54に送り得る。量子化ユニット54は、ビットレートを更に低減するために変換係数を量子化する。量子化プロセスは、係数の一部又は全てに関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって修正され得る。幾つかの例では、量子化ユニット54は、次いで、量子化変換係数を含む行列の走査を実施し得る。代替的に、エントロピー符号化ユニット56が走査を実施し得る。
[0162]量子化に続いて、エントロピー符号化ユニット56は、量子化変換係数をエントロピーコード化する。例えば、エントロピー符号化ユニット56は、コンテキスト適応型可変長コード化(CAVLC)、コンテキスト適応型バイナリ算術コード化(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コード化(SBAC)、確率間隔区分エントロピー(PIPE)コード化又は別のエントロピーコード化技法を実施し得る。コンテキストベースエントロピーコード化の場合、コンテキストは隣接ブロックに基づき得る。エントロピー符号化ユニット56によるエントロピーコード化に続いて、符号化ビットストリームは、別の機器(例えば、ビデオデコーダ30)に送信されるか、又は後で送信するか又は取り出すためにアーカイブされ得る。
[0163]逆量子化ユニット58及び逆変換処理ユニット60は、それぞれ逆量子化及び逆変換を適用して、例えば、参照ブロックとして後で使用するために、画素領域中で残差ブロックを再構築する。動き補償ユニット44は、復号ピクチャバッファ64のフレームのうちの1つの予測ブロックに残差ブロックを加算することによって参照ブロックを計算し得る。動き補償ユニット44はまた、動き推定において使用するサブ整数画素値を計算するために、1つ又は複数の補間フィルタを再構築された残差ブロックに適用し得る。加算器62は、再構成された残差ブロックを、動き補償ユニット44によって生成された動き補償された予測ブロックに加算して、復号ピクチャバッファ64に記憶するための再構成されたビデオブロックを生成する。再構成されたビデオブロックは、後続ビデオフレーム中のブロックをインターコード化するための参照ブロックとして、動き推定ユニット42と動き補償ユニット44とによって使用され得る。
[0164]ビデオエンコーダ20は、本開示の技法を単独で又は任意の組合せで実施するように構成され得るビデオエンコーダの一例を表す。
[0165]ビデオエンコーダ20は、3Dルックアップテーブルに対して入力色成分の制約付きビット深度を用いて3D色予測を実施するように構成された1つ又は複数のプロセッサを備えるビデオ符号化機器を表し得る。この場合、ビデオエンコーダ20の色予測処理ユニット66は、3Dルックアップテーブルの入力ビット深度をビデオデータの参照レイヤ中の参照レイヤピクチャの色成分のビット深度に等しくなるように決定する。このようにして、3Dルックアップテーブルの入力ビット深度は、拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するための変換のために3Dルックアップテーブルに入力され得る、参照レイヤピクチャの色成分のビット深度に等しくなる。幾つかの例では、色予測処理ユニット66はまた、3Dルックアップテーブルの出力ビット深度を、参照レイヤピクチャの色成分のビット深度以上であり拡張レイヤピクチャの色成分のビット深度以下である範囲内になるように決定し得る。一例では、色予測処理ユニット66は、3Dルックアップテーブルの出力ビット深度を拡張レイヤピクチャの色成分のビット深度に等しくなるように決定し得る。
[0166]色予測処理ユニット66は、ビデオデータの参照レイヤ用の第1の色域及び/又は第1のビット深度からビデオデータの拡張レイヤ用の第2の色域及び/又は第2のビット深度に色成分を変換するために3Dルックアップテーブルを参照レイヤピクチャの色成分に適用する。色予測処理ユニット66は、変換された色成分に基づいてビデオデータの拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成する。ビデオエンコーダ20は、3Dルックアップテーブルを使用して生成されたレイヤ間参照ピクチャに基づいて拡張レイヤピクチャにおいてビデオブロックを符号化する。
[0167]本開示の技法の一例によれば、ビデオエンコーダ20は、参照レイヤピクチャのルーマ成分のビット深度に等しい、3Dルックアップテーブルの入力ルーマ成分のための第1のビット深度を示す第1のシンタックス要素を信号伝達し、参照レイヤピクチャのクロマ成分のビット深度に等しい、3Dルックアップテーブルの入力クロマ成分のための第2のビット深度を示す第2のシンタックス要素を信号伝達し得る。追加又は代替として、ビデオエンコーダ20は、参照レイヤピクチャのルーマ成分のビット深度以上であり拡張レイヤピクチャのルーマ成分のビット深度以下である、3Dルックアップテーブルの出力ルーマ成分のための第3のビット深度を示す第3のシンタックス要素を信号伝達し、参照レイヤピクチャのクロマ成分のビット深度以上であり拡張レイヤピクチャのクロマ成分のビット深度以下である、3Dルックアップテーブルの出力クロマ成分のための第4のビット深度を示す第4のシンタックス要素を信号伝達し得る。
[0168]本開示の技法の別の例では、色予測処理ユニット66は、第1及び第2のビット深度を示す第1及び第2のシンタックス要素を信号伝達することなしに、3Dルックアップテーブルの入力ルーマ成分のための第1のビット深度を決定し、3Dルックアップテーブルの入力クロマ成分のための第2のビット深度を決定し得る。追加又は代替として、色予測処理ユニット66は、第3及び第4のビット深度を示す第3及び第4のシンタックス要素を信号伝達することなしに、3Dルックアップテーブルの出力ルーマ成分のための第3のビット深度を決定し、3Dルックアップテーブルの出力クロマ成分のための第4のビット深度を決定し得る。
[0169]更に、ビデオエンコーダ20は、ビデオデータの複数の利用可能な参照レイヤからの少なくとも1つの決定された参照レイヤ中の参照ピクチャのみに対して制約付き適用を用いて3D色予測を実施するように構成された1つ又は複数のプロセッサを備えるビデオ符号化機器を表し得る。この場合、ビデオエンコーダ20の色予測処理ユニット66は、3Dルックアップテーブルのために複数の参照レイヤのうちの少なくとも1つの参照レイヤを決定する。色予測処理ユニット66は、ビデオデータの参照レイヤ用の第1の色域及び/又は第1のビット深度からビデオデータの拡張レイヤ用の第2の色域及び/又は第2のビット深度に色成分を変換するために、3Dルックアップテーブルを少なくとも1つの参照レイヤ中の参照レイヤピクチャの色成分に適用する。色予測処理ユニット66は、変換された色成分に基づいてビデオデータの拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成する。ビデオエンコーダ20は、3Dルックアップテーブルを使用して生成されたレイヤ間参照ピクチャに基づいて拡張レイヤピクチャにおいてビデオブロックを符号化する。
[0170]開示する技法によれば、ビデオエンコーダ20は、3Dルックアップテーブルがそれに適用される少なくとも1つの参照レイヤを識別する少なくとも1つの参照レイヤIDを信号伝達する。一例では、ビデオエンコーダ20は、3Dルックアップテーブルが拡張レイヤピクチャのためにそれに適用される厳密に1つの参照レイヤを識別する、厳密に1つの参照レイヤIDを信号伝達し得る。この例では、色予測処理ユニット66は、3Dルックアップテーブルのために厳密に1つの参照レイヤを決定し、3Dルックアップテーブルをその厳密に1つの参照レイヤ中の参照レイヤピクチャの色成分に適用する。拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するためにただ1つの参照レイヤ中の参照レイヤピクチャに3Dルックアップテーブルを適用することによって、ビデオエンコーダ20は、ビデオデコーダ30において計算複雑さを低減する。
[0171]別の例では、ビデオエンコーダ20は、3Dルックアップテーブルが拡張レイヤピクチャのためにそれに適用される2つ以上の参照レイヤを識別する2つ以上の参照レイヤIDを信号伝達し得る。この例では、色予測処理ユニット66は、3Dルックアップテーブルのための2つ以上の参照レイヤを決定し、2つ以上の参照レイヤの各々中の参照レイヤピクチャの色成分に3Dルックアップテーブルを適用し、2つ以上の参照レイヤからの変換された色成分の組合せに基づいて拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成する。
[0172]更なる一例では、拡張レイヤ中の第1の拡張レイヤピクチャについて、色予測処理ユニット66は、拡張レイヤ中の第1の拡張レイヤピクチャのための第1のレイヤ間参照ピクチャを生成するために3Dルックアップテーブルがそれに適用される第1の参照レイヤを識別する第1の参照レイヤIDを信号伝達し得る。表示順序又はコード化順序で第1の拡張レイヤピクチャに対して後続のピクチャであり得る拡張レイヤ中の第2の拡張レイヤピクチャについて、色予測処理ユニット66は、拡張レイヤ中の第2の拡張レイヤピクチャのための第2のレイヤ間参照ピクチャを生成するために3Dルックアップテーブルがそれに適用される複数の参照レイヤのうちの第2の参照レイヤを識別する第2の参照レイヤIDを信号伝達し得、ここで、第2の参照レイヤは第1の参照レイヤとは異なる。
[0173]更に、ビデオエンコーダ20は、3Dルックアップテーブルによって生成されたレイヤ間参照ピクチャに対して重み付き予測を実施することなしに3D色予測を実施するように構成された1つ又は複数のプロセッサを備えるビデオ符号化機器を表し得る。ビデオエンコーダ20の色予測処理ユニット66は、少なくとも1つの参照レイヤ中の参照レイヤピクチャの色成分に適用される3Dルックアップテーブルを使用して、拡張レイヤ中の拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成する。開示する技法によれば、拡張レイヤピクチャを予測するためにレイヤ間参照ピクチャ自体が使用される。拡張レイヤピクチャのための重み付き予測の場合、レイヤ間参照ピクチャは、候補参照ピクチャのグループ中の候補参照ピクチャとして使用されない。レイヤ間参照ピクチャに対して重み付き予測を適用しないことによって、ビデオエンコーダ20は、ビデオデコーダ30における計算複雑さを低減する。
[0174]図3は、本開示で説明する技法を実装し得るビデオデコーダ30の一例を示すブロック図である。図3の例では、ビデオデコーダ30は、エントロピー復号ユニット70と、ビデオデータメモリ71と、動き補償ユニット72と、色予測処理ユニット86と、イントラ予測単位74と、逆量子化ユニット76と、逆変換処理ユニット78と、復号ピクチャバッファ82と、加算器80とを含む。ビデオデコーダ30は、幾つかの例では、ビデオエンコーダ20(図2)に関して説明した符号化パスとは概して逆の復号パスを実施し得る。動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルに基づいて予測データを生成し得、イントラ予測単位74は、エントロピー復号ユニット70から受信されたイントラ予測モードインジケータに基づいて予測データを生成し得る。
[0175]ビデオデータメモリ71は、ビデオデコーダ30の構成要素によって復号されるべき符号化ビデオビットストリームなどのビデオデータを記憶し得る。ビデオデータメモリ71に記憶されるビデオデータは、例えば、コンピュータ可読媒体16から、例えば、カメラなどのローカルビデオ発信源から、ビデオデータの有線又はワイヤレスネットワーク通信を介して、又は物理データ記憶媒体にアクセスすることによって取得され得る。ビデオデータメモリ71は、符号化ビデオビットストリームからの符号化ビデオデータを記憶するコード化ピクチャバッファ(CPB)を形成し得る。復号ピクチャバッファ82は、例えば、イントラコード化モード又はインターコード化モードでビデオデコーダ30によってビデオデータを復号する際に使用するための参照ビデオデータを記憶する参照ピクチャメモリであり得る。ビデオデータメモリ71及び復号ピクチャバッファ82は、同期DRAM(SDRAM)を含む、ダイナミックランダムアクセスメモリ(DRAM)、磁気抵抗RAM(MRAM)、抵抗RAM(RRAM)、又は他のタイプのメモリ機器など、様々なメモリ機器のいずれかによって形成され得る。ビデオデータメモリ71及び復号ピクチャバッファ82は、同じメモリ機器又は別個のメモリ機器によって提供され得る。様々な例では、ビデオデータメモリ71は、ビデオデコーダ30の他の構成要素とともにオンチップであるか、又はそれらの構成要素に対してオフチップであり得る。
[0176]復号プロセス中に、ビデオデコーダ30は、ビデオエンコーダ20から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ30のエントロピー復号ユニット70は、量子化係数と、動きベクトル又はイントラ予測モードインジケータと、他のシンタックス要素とを生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット70は、動きベクトルと他の予測シンタックス要素とを動き補償ユニット72に転送する。ビデオデコーダ30は、ビデオスライスレベル及び/又はビデオブロックレベルでシンタックス要素を受信し得る。
[0177]ビデオスライスがイントラコード化(I)スライスとしてコード化されるとき、イントラ予測単位74は、信号伝達されたイントラ予測モードと、現在フレーム又はピクチャの、前に復号されたブロックからのデータとに基づいて、現在ビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化(即ち、B又はP)スライスとしてコード化されるとき、動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルと他のシンタックス要素とに基づいて、現在ビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの1つの内の参照ピクチャのうちの1つから生成され得る。ビデオデコーダ30は、復号ピクチャバッファ82に記憶された参照ピクチャに基づいて、デフォルト構成技法を使用して、参照ピクチャリスト、リスト0及びリスト1を構成し得る。
[0178]動き補償ユニット72は、動きベクトルと他のシンタックス要素とを構文解析することによって現在ビデオスライスのビデオブロックに関する予測情報を決定し、その予測情報を使用して、復号されている現在ビデオブロックのための予測ブロックを生成する。例えば、動き補償ユニット72は、ビデオスライスのビデオブロックをコード化するために使用される予測モード(例えば、イントラ予測又はインター予測)と、インター予測スライスタイプ(例えば、Bスライス又はPスライス)と、スライス用の参照ピクチャリストのうちの1つ又は複数についての構成情報と、スライスの各インター符号化ビデオブロックについての動きベクトルと、スライスの各インターコード化ビデオブロックについてのインター予測ステータスと、現在ビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、受信されたシンタックス要素のうちの幾つかを使用する。
[0179]動き補償ユニット72はまた、補間フィルタに基づいて補間を実施し得る。動き補償ユニット72は、参照ブロックのサブ整数画素のための補間値を計算するために、ビデオブロックの符号化中にビデオエンコーダ20によって使用された補間フィルタを使用し得る。この場合、動き補償ユニット72は、受信されたシンタックス要素からビデオエンコーダ20によって使用された補間フィルタを決定し、その補間フィルタを使用して予測ブロックを生成し得る。
[0180]逆量子化ユニット76は、ビットストリーム中に与えられ、エントロピー復号ユニット70によって復号された量子化変換係数を逆の量子化をする(inverse quantize)、即ち、逆量子化する(de-quantize)。逆量子化プロセスは、量子化の程度を決定し、同様に、適用されるべき逆量子化の程度を決定するための、ビデオスライス中の各ビデオブロックについてビデオデコーダ30によって計算される量子化パラメータの使用を含み得る。逆変換処理ユニット78は、画素領域において残差ブロックを生成するために、変換係数に逆変換、例えば、逆DCT、逆整数変換、又は概念的に同様の逆変換プロセスを適用する。
[0181]動き補償ユニット72が、動きベクトル及び他のシンタックス要素に基づいて現在ビデオブロックのための予測ブロックを生成した後に、ビデオデコーダ30は、逆変換処理ユニット78からの残差ブロックを動き補償ユニット72によって生成された対応する予測ブロックと加算することによって、復号ビデオブロックを形成する。加算器80は、この加算演算を実施する1つ又は複数の構成要素を表す。所望される場合、ブロック歪みを除去するために復号ブロックをフィルタ処理するためのデブロッキングフィルタも適用され得る。画素遷移を平滑化するか、又はさもなければビデオ品質を改善するために、(コード化ループ中或いはコード化ループ後の)他のループフィルタも使用され得る。所与のフレーム又はピクチャ中の復号ビデオブロックは、次いで、後続の動き補償のために使用される参照ピクチャを記憶する復号ピクチャバッファ82に記憶される。復号ピクチャバッファ82はまた、図1の表示装置32などの表示装置上での後の表示のために、復号ビデオを記憶する。
[0182]ビデオエンコーダ30は、本開示の技法を単独で又は任意の組合せで実施するように構成され得る。
[0183]ビデオデコーダ30は、3Dルックアップテーブルに対して入力色成分の制約付きビット深度を用いて3D色予測を実施するように構成された1つ又は複数のプロセッサを備えるビデオ復号機器を表し得る。この場合、ビデオデコーダ30の色予測処理ユニット86は、3Dルックアップテーブルの入力ビット深度をビデオデータの参照レイヤ中の参照レイヤピクチャの色成分のビット深度に等しくなるように決定する。このようにして、3Dルックアップテーブルの入力ビット深度は、拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するための変換のために3Dルックアップテーブルに入力され得る、参照レイヤピクチャの色成分のビット深度に等しくなる。幾つかの例では、色予測処理ユニット86はまた、3Dルックアップテーブルの出力ビット深度を、参照レイヤピクチャの色成分のビット深度以上であり拡張レイヤピクチャの色成分のビット深度以下である範囲内になるように決定し得る。一例では、色予測処理ユニット86は、3Dルックアップテーブルの出力ビット深度を拡張レイヤピクチャの色成分のビット深度に等しくなるように決定し得る。
[0184]本開示の技法の一例によれば、色予測処理ユニット86は、参照レイヤピクチャのルーマ成分のビット深度に等しい、3Dルックアップテーブルの入力ルーマ成分のための第1のビット深度を示す第1のシンタックス要素を受信し、参照レイヤピクチャのクロマ成分のビット深度に等しい、3Dルックアップテーブルの入力クロマ成分のための第2のビット深度を示す第2のシンタックス要素を受信し得る。追加又は代替として、色予測処理ユニット86は、参照レイヤピクチャのルーマ成分のビット深度以上であり拡張レイヤピクチャのルーマ成分のビット深度以下である、3Dルックアップテーブルの出力ルーマ成分のための第3のビット深度を示す第3のシンタックス要素を受信し、参照レイヤピクチャのクロマ成分のビット深度以上であり拡張レイヤピクチャのクロマ成分のビット深度以下である、3Dルックアップテーブルの出力クロマ成分のための第4のビット深度を示す第4のシンタックス要素を受信し得る。
[0185]本開示の技法の別の例では、色予測処理ユニット86は、第1及び第2のビット深度を含む第1及び第2のシンタックス要素を受信することなしに、3Dルックアップテーブルの入力ルーマ成分のための第1のビット深度を独立して導出し、3Dルックアップテーブルの入力クロマ成分のための第2のビット深度を独立して導出し得る。追加又は代替として、色予測処理ユニット86は、第3及び第4のビット深度を示す第3及び第4のシンタックス要素を受信することなしに、3Dルックアップテーブルの出力ルーマ成分のための第3のビット深度を独立して導出し、3Dルックアップテーブルの出力クロマ成分のための第4のビット深度を独立して導出し得る。
[0186]色予測処理ユニット86は、ビデオデータの参照レイヤ用の第1の色域及び/又は第1のビット深度からビデオデータの拡張レイヤ用の第2の色域及び/又は第2のビット深度に色成分を変換するために3Dルックアップテーブルを参照レイヤピクチャの色成分に適用する。色予測処理ユニット86は、変換された色成分に基づいてビデオデータの拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成する。ビデオデコーダ30は、次いで、3Dルックアップテーブルを使用して生成されたレイヤ間参照ピクチャに基づいて拡張レイヤピクチャにおいてビデオブロックを復号する。
[0187]更に、ビデオデコーダ30は、ビデオデータの複数の利用可能な参照レイヤからの少なくとも1つの識別された参照レイヤ中の参照ピクチャのみに対して制約付き適用を用いて3D色予測を実施するように構成された1つ又は複数のプロセッサを備えるビデオ復号機器を表し得る。この場合、ビデオデコーダ30の色予測処理ユニット86は、3Dルックアップテーブルのための複数の参照レイヤのうちの少なくとも1つの参照レイヤを識別する少なくとも1つの参照レイヤIDを受信する。色予測処理ユニット86は、ビデオデータの参照レイヤ用の第1の色域及び/又は第1のビット深度からビデオデータの拡張レイヤ用の第2の色域及び/又は第2のビット深度に色成分を変換するために、少なくとも1つの参照レイヤIDによって識別される少なくとも1つの参照レイヤ中の参照レイヤピクチャの色成分に3Dルックアップテーブルを適用する。色予測処理ユニット86は、変換された色成分に基づいてビデオデータの拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成する。ビデオデコーダ30は、次いで、3Dルックアップテーブルを使用して生成されたレイヤ間参照ピクチャに基づいて拡張レイヤピクチャにおいてビデオブロックを復号する。
[0188]開示する技法の一例では、ビデオデコーダ30の色予測処理ユニット86は、3Dルックアップテーブルが拡張レイヤピクチャのためにそれに適用される厳密に1つの参照レイヤを識別する、厳密に1つの参照レイヤIDを受信し得る。この例では、色予測処理ユニット86は、次いで、厳密に1つの参照レイヤIDによって識別される厳密に1つの参照レイヤ中の参照レイヤピクチャの色成分に3Dルックアップテーブルを適用する。拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するためにただ1つの参照レイヤ中の参照レイヤピクチャに3Dルックアップテーブルを適用することは、ビデオデコーダ30における計算複雑さを減少させる。
[0189]開示する技法の別の例では、ビデオデコーダ30の色予測処理ユニット86は、3Dルックアップテーブルが拡張レイヤピクチャのためにそれに適用される2つ以上の参照レイヤを識別する、2つ以上の参照レイヤIDを受信し得る。この例では、色予測処理ユニット86は、次いで、2つ以上の参照レイヤIDによって識別される2つ以上の参照レイヤの各々中の参照レイヤピクチャの色成分に3Dルックアップテーブルを適用し、2つ以上の参照レイヤからの変換された色成分の組合せに基づいて拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成する。
[0190]開示する技法の更なる一例では、拡張レイヤ中の第1の拡張レイヤピクチャについて、色予測処理ユニット86は、拡張レイヤ中の第1の拡張レイヤピクチャのための第1のレイヤ間参照ピクチャを生成するために3Dルックアップテーブルがそれに適用される第1の参照レイヤを識別する第1の参照レイヤIDを受信し得る。表示順序又はコード化順序で第1の拡張レイヤピクチャに対して後続のピクチャであり得る拡張レイヤ中の第2の拡張レイヤピクチャについて、色予測処理ユニット86は、拡張レイヤ中の第2の拡張レイヤピクチャのための第2のレイヤ間参照ピクチャを生成するために3Dルックアップテーブルがそれに適用される複数の参照レイヤのうちの第2の参照レイヤを識別する第2の参照レイヤIDを受信し得、ここで、第2の参照レイヤは第1の参照レイヤとは異なる。
[0191]更に、ビデオデコーダ30は、3Dルックアップテーブルによって生成されたレイヤ間参照ピクチャに対して重み付き予測を実施することなしに3D色予測を実施するように構成された1つ又は複数のプロセッサを備えるビデオ復号機器を表し得る。ビデオデコーダ30の色予測処理ユニット86は、少なくとも1つの参照レイヤ中の参照レイヤピクチャの色成分に適用される3Dルックアップテーブルを使用して、拡張レイヤ中の拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成する。開示する技法によれば、拡張レイヤピクチャを予測するためにレイヤ間参照ピクチャ自体が使用される。拡張レイヤピクチャのための重み付き予測の場合、レイヤ間参照ピクチャは、候補参照ピクチャのグループ中の候補参照ピクチャとして使用されない。レイヤ間参照ピクチャに対して重み付き予測を適用しないことは、ビデオデコーダ30における計算複雑さを減少させる。
[0192]図15は、3Dルックアップテーブルに対して入力色成分の制約付きビット深度を用いて3D色予測を実施するように構成されたビデオエンコーダの例示的な動作を示すフローチャートである。図15の例示的な動作は、本明細書では、図2のビデオエンコーダ20の色予測処理ユニット66によって実施されるものとして説明される。他の例では、動作は、図10の色予測処理ユニット144によって実施され得る。
[0193]ビデオエンコーダ20の色予測処理ユニット66は、3D色予測を実施するために色域スケーラビリティのための3Dルックアップテーブルを生成し得る。3Dルックアップテーブルは、コード化されるべきビデオデータのためのピクチャパラメータセット(PPS)中で信号伝達され、PPSによって参照される1つ又は複数のピクチャに適用される。PPSは、ビデオデータの拡張レイヤ中の1つ又は複数の拡張レイヤピクチャと、ビデオデータの1つ又は複数の参照レイヤ中の1つ又は複数のコロケート参照レイヤピクチャとを参照し得る。例えば、各3Dルックアップテーブルは、参照レイヤ中に含まれるコロケート参照レイヤピクチャに基づいて、拡張レイヤ中に含まれる拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するために使用され得る。参照レイヤは、拡張レイヤよりも、ビデオデータのベースレイヤ及び/又は下位レイヤを備え得る。
[0194]本開示の技法によれば、色予測処理ユニット66は、3Dルックアップテーブルの入力ビット深度をビデオデータの参照レイヤ中の参照レイヤピクチャの色成分のビット深度に等しくなるように決定する(160)。例えば、色予測処理ユニット66は、参照レイヤピクチャのルーマ成分のビット深度に等しい、3Dルックアップテーブルの入力ルーマ成分のための第1のビット深度を決定し得る。色予測処理ユニット66は、参照レイヤピクチャのクロマ成分のビット深度に等しい、3Dルックアップテーブルの入力クロマ成分のための第2のビット深度を決定し得る。このようにして、3Dルックアップテーブルの入力ビット深度は、拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するための変換のために3Dルックアップテーブルに入力され得る、参照レイヤピクチャの色成分のビット深度に等しくなる。
[0195]幾つかの例では、色予測処理ユニット66はまた、3Dルックアップテーブルの出力ビット深度を、両端値を含めて、参照レイヤピクチャの色成分のビット深度と、拡張レイヤピクチャの色成分のビット深度との間の範囲内になるように決定し得る。例えば、色予測処理ユニット66は、参照レイヤピクチャのルーマ成分のビット深度以上であり拡張レイヤピクチャのルーマ成分のビット深度以下である、3Dルックアップテーブルの出力ルーマ成分のための第3のビット深度を決定し、参照レイヤピクチャのクロマ成分のビット深度以上であり拡張レイヤピクチャのクロマ成分のビット深度以下である、3Dルックアップテーブルの出力クロマ成分のための第4のビット深度を決定し得る。一例では、色予測処理ユニット66は、3Dルックアップテーブルの出力ビット深度を拡張レイヤピクチャの色成分のビット深度に等しくなるように決定し得る。
[0196]色予測処理ユニット66は、次いで、ビデオデータの参照レイヤ用の第1の色域からビデオデータの拡張レイヤ用の第2の色域に色成分を変換するために3Dルックアップテーブルを参照レイヤピクチャの色成分に適用する(162)。色成分を変換することは、参照レイヤのビット深度を拡張レイヤのビット深度に変換することを含み得る。色予測処理ユニット66は、変換された色成分に基づいてビデオデータの拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成する(164)。
[0197]ビデオエンコーダ20は、3Dルックアップテーブルを使用して生成されたレイヤ間参照ピクチャに基づいて拡張レイヤピクチャにおいてビデオブロックを符号化する(166)。ビデオエンコーダ20は、次いで、符号化ビデオデータと関連するシンタックス要素とのビットストリームを信号伝達する(168)。例えば、本開示の技法によれば、ビデオエンコーダ20は、参照レイヤピクチャのルーマ成分のビット深度に等しい、3Dルックアップテーブルの入力ルーマ成分のための第1のビット深度を示す第1のシンタックス要素を信号伝達し、参照レイヤピクチャのクロマ成分のビット深度に等しい、3Dルックアップテーブルの入力クロマ成分のための第2のビット深度を示す第2のシンタックス要素を信号伝達し得る。追加又は代替として、ビデオエンコーダ20は、参照レイヤピクチャのルーマ成分のビット深度以上であり拡張レイヤピクチャのルーマ成分のビット深度以下である、3Dルックアップテーブルの出力ルーマ成分のための第3のビット深度を示す第3のシンタックス要素を信号伝達し、参照レイヤピクチャのクロマ成分のビット深度以上であり拡張レイヤピクチャのクロマ成分のビット深度以下である、3Dルックアップテーブルの出力クロマ成分のための第4のビット深度を示す第4のシンタックス要素を信号伝達し得る。
[0198]図16は、3Dルックアップテーブルに対して入力色成分の制約付きビット深度を用いて3D色予測を実施するように構成されたビデオデコーダの例示的な動作を示すフローチャートである。図16の例示的な動作は、本明細書では、図3のビデオデコーダ30の色予測処理ユニット86によって実施されるものとして説明される。他の例では、動作は、図10の色予測処理ユニット144によって実施され得る。
[0199]ビデオデコーダ30は、符号化ビデオデータと関連するシンタックス要素とのビットストリームを受信する(170)。シンタックス要素のうちの1つ又は複数に基づいて、ビデオデコーダ30の色予測処理ユニット86は、3D色予測を実施するために色域スケーラビリティのための3Dルックアップテーブルを生成し得る。3Dルックアップテーブルは、コード化されるべきビデオデータのためのPPS中で信号伝達され得、PPSによって参照される1つ又は複数のピクチャに適用される。PPSは、ビデオデータの拡張レイヤ中の1つ又は複数の拡張レイヤピクチャと、ビデオデータの1つ又は複数の参照レイヤ中の1つ又は複数のコロケート参照レイヤピクチャとを参照し得る。例えば、各3Dルックアップテーブルは、参照レイヤ中に含まれるコロケート参照レイヤピクチャに基づいて、拡張レイヤ中に含まれる拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するために使用され得る。参照レイヤは、拡張レイヤよりも、ビデオデータのベースレイヤ及び/又は下位レイヤを備え得る。
[0200]本開示の技法によれば、色予測処理ユニット86は、3Dルックアップテーブルの入力ビット深度をビデオデータの参照レイヤ中の参照レイヤピクチャの色成分のビット深度に等しくなるように決定する(172)。このようにして、3Dルックアップテーブルの入力ビット深度は、拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するための変換のために3Dルックアップテーブルに入力され得る、参照レイヤピクチャの色成分のビット深度に等しくなる。
[0201]一例では、色予測処理ユニット86は、参照レイヤピクチャのルーマ成分のビット深度に等しくなるように制約された、3Dルックアップテーブルの入力ルーマ成分のための第1のビット深度を示す第1のシンタックス要素を受信し、参照レイヤピクチャのクロマ成分のビット深度に等しくなるように制約された、3Dルックアップテーブルの入力クロマ成分のための第2のビット深度を示す第2のシンタックス要素を受信し得る。別の例では、色予測処理ユニット86は、参照レイヤピクチャのルーマ成分のビット深度に等しくなるように3Dルックアップテーブルの入力ルーマ成分のための第1のビット深度を独立して導出し、参照レイヤピクチャのクロマ成分のビット深度に等しくなるように3Dルックアップテーブルの入力クロマ成分のための第2のビット深度を独立して導出し得る。
[0202]幾つかの例では、色予測処理ユニット86はまた、3Dルックアップテーブルの出力ビット深度を、両端値を含めて、参照レイヤピクチャの色成分のビット深度と、拡張レイヤピクチャの色成分のビット深度との間の範囲内になるように決定し得る。例えば、色予測処理ユニット86は、3Dルックアップテーブルの出力ビット深度を拡張レイヤピクチャの色成分のビット深度に等しくなるように決定し得る。
[0203]一例では、色予測処理ユニット86は、参照レイヤピクチャのルーマ成分のビット深度以上であり拡張レイヤピクチャのルーマ成分のビット深度以下になるように制約された、3Dルックアップテーブルの出力ルーマ成分のための第3のビット深度を示す第3のシンタックス要素を受信し、参照レイヤピクチャのクロマ成分のビット深度以上であり拡張レイヤピクチャのクロマ成分のビット深度以下になるように制約された、3Dルックアップテーブルの出力クロマ成分のための第4のビット深度を示す第4のシンタックス要素を受信し得る。別の例では、色予測処理ユニット86は、参照レイヤピクチャのルーマ成分のビット深度以上であり拡張レイヤピクチャのルーマ成分のビット深度以下になるように、3Dルックアップテーブルの出力ルーマ成分のための第3のビット深度を独立して導出し、参照レイヤピクチャのクロマ成分のビット深度以上であり拡張レイヤピクチャのクロマ成分のビット深度以下になるように、3Dルックアップテーブルの出力クロマ成分のための第4のビット深度を独立して導出し得る。
[0204]色予測処理ユニット86は、次いで、ビデオデータの参照レイヤ用の第1の色域からビデオデータの拡張レイヤ用の第2の色域に色成分を変換するために3Dルックアップテーブルを参照レイヤピクチャの色成分に適用する(174)。色成分を変換することは、参照レイヤのビット深度を拡張レイヤのビット深度に変換することを含み得る。色予測処理ユニット86は、変換された色成分に基づいてビデオデータの拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成する(176)。ビデオデコーダ30は、次いで、3Dルックアップテーブルを使用して生成されたレイヤ間参照ピクチャに基づいて拡張レイヤピクチャにおいてビデオブロックを復号する(178)。
[0205]図17は、少なくとも1つの決定された参照レイヤ中の参照ピクチャのみに対して制約付き適用を用いて3D色予測を実施するように構成されたビデオエンコーダの例示的な動作を示すフローチャートである。図17の例示的な動作は、本明細書では、図2のビデオエンコーダ20の色予測処理ユニット66によって実施されるものとして説明される。他の例では、動作は、図10の色予測処理ユニット144によって実施され得る。
[0206]ビデオエンコーダ20の色予測処理ユニット66は、3D色予測を実施するために色域スケーラビリティのための3Dルックアップテーブルを生成し得る。一例では、3Dルックアップテーブルは、コード化されるべきビデオデータのためのPPS中で信号伝達され得、PPSによって参照される1つ又は複数のピクチャに適用される。PPSは、ビデオデータの拡張レイヤ中の1つ又は複数の拡張レイヤピクチャと、ビデオデータの1つ又は複数の参照レイヤ中の1つ又は複数のコロケート参照レイヤピクチャとを参照し得る。参照レイヤは、拡張レイヤよりも、ビデオデータのベースレイヤ及び/又は下位レイヤを備え得る。
[0207]本開示の技法によれば、色予測処理ユニット66は、3Dルックアップテーブルのためにビデオデータの複数の参照レイヤのうちの少なくとも1つの参照レイヤを決定する(180)。色予測処理ユニット66は、次いで、ビデオデータの参照レイヤ用の第1の色域からビデオデータの拡張レイヤ用の第2の色域に色成分を変換するために、3Dルックアップテーブルを少なくとも1つの参照レイヤ中の参照レイヤピクチャの色成分に適用する(182)。色成分を変換することは、参照レイヤのビット深度を拡張レイヤのビット深度に変換することを含み得る。色予測処理ユニット66は、変換された色成分に基づいてビデオデータの拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成する(184)。
[0208]ビデオエンコーダ20は、3Dルックアップテーブルを使用して生成されたレイヤ間参照ピクチャに基づいて拡張レイヤピクチャにおいてビデオブロックを符号化する(186)。ビデオエンコーダ20は、次いで、3Dルックアップテーブルがそれに適用される少なくとも1つの参照レイヤを識別する少なくとも1つの参照レイヤIDを含む、符号化ビデオデータと関連するシンタックス要素とのビットストリームを信号伝達する(188)。一例では、ビデオエンコーダ20は、3Dルックアップテーブルが拡張レイヤピクチャのためにそれに適用される厳密に1つの参照レイヤを識別する、厳密に1つの参照レイヤIDを信号伝達し得る。この例では、色予測処理ユニット66は、3Dルックアップテーブルのために厳密に1つの参照レイヤを決定し、3Dルックアップテーブルをその厳密に1つの参照レイヤ中の参照レイヤピクチャの色成分に適用する。
[0209]別の例では、ビデオエンコーダ20は、3Dルックアップテーブルが拡張レイヤピクチャのためにそれに適用される2つ以上の参照レイヤを識別する2つ以上の参照レイヤIDを信号伝達し得る。この例では、色予測処理ユニット66は、3Dルックアップテーブルのための2つ以上の参照レイヤを決定し、2つ以上の参照レイヤの各々中の参照レイヤピクチャの色成分に3Dルックアップテーブルを適用し、2つ以上の参照レイヤからの変換された色成分の組合せに基づいて拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成する。
[0210]更なる一例では、拡張レイヤ中の第1の拡張レイヤピクチャについて、色予測処理ユニット66は、拡張レイヤ中の第1の拡張レイヤピクチャのための第1のレイヤ間参照ピクチャを生成するために3Dルックアップテーブルがそれに適用される第1の参照レイヤを識別する第1の参照レイヤIDを信号伝達し得る。表示順序又はコード化順序で第1の拡張レイヤピクチャに対して後続のピクチャであり得る拡張レイヤ中の第2の拡張レイヤピクチャについて、色予測処理ユニット66は、拡張レイヤ中の第2の拡張レイヤピクチャのための第2のレイヤ間参照ピクチャを生成するために3Dルックアップテーブルがそれに適用される複数の参照レイヤのうちの第2の参照レイヤを識別する第2の参照レイヤIDを信号伝達し得、ここで、第2の参照レイヤは第1の参照レイヤとは異なる。
[0211]図18は、少なくとも1つの識別された参照レイヤ中の参照ピクチャのみに対して制約付き適用を用いて3D色予測を実施するように構成されたビデオデコーダの例示的な動作を示すフローチャートである。図18の例示的な動作は、本明細書では、図3のビデオデコーダ30の色予測処理ユニット86によって実施されるものとして説明される。他の例では、動作は、図10の色予測処理ユニット144によって実施され得る。
[0212]ビデオデコーダ30は、3Dルックアップテーブルのための複数の参照レイヤのうちの少なくとも1つの参照レイヤを識別する少なくとも1つの参照レイヤIDを含む、符号化ビデオデータと関連するシンタックス要素とのビットストリームを受信する(190)。シンタックス要素のうちの1つ又は複数に基づいて、ビデオデコーダ30の色予測処理ユニット86は、3D色予測を実施するために色域スケーラビリティのための3Dルックアップテーブルを生成し得る。3Dルックアップテーブルは、コード化されるべきビデオデータのためのPPS中で信号伝達され、PPSによって参照される1つ又は複数のピクチャに適用され得る。PPSは、ビデオデータの拡張レイヤ中の1つ又は複数の拡張レイヤピクチャと、ビデオデータの1つ又は複数の参照レイヤ中の1つ又は複数のコロケート参照レイヤピクチャとを参照し得る。参照レイヤは、拡張レイヤよりも、ビデオデータのベースレイヤ及び/又は下位レイヤを備え得る。
[0213]本開示の技法によれば、ビットストリーム中で受信される3Dルックアップテーブルのための少なくとも1つの参照レイヤIDは、拡張レイヤ中に含まれる所与の拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成するために3Dルックアップテーブルがそれに適用されるビデオデータの参照レイヤのうちの少なくとも1つを識別する。色予測処理ユニット86は、次いで、ビデオデータの参照レイヤ用の第1の色域からビデオデータの拡張レイヤ用の第2の色域に色成分を変換するために、少なくとも1つの参照レイヤIDによって識別される少なくとも1つの参照レイヤ中の参照レイヤピクチャの色成分に3Dルックアップテーブルを適用する(192)。色成分を変換することは、参照レイヤのビット深度を拡張レイヤのビット深度に変換することを含み得る。色予測処理ユニット86は、変換された色成分に基づいてビデオデータの拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成する(194)。ビデオデコーダ30は、次いで、3Dルックアップテーブルを使用して生成されたレイヤ間参照ピクチャに基づいて拡張レイヤピクチャにおいてビデオブロックを復号する(196)。
[0214]一例では、ビデオデコーダ30の色予測処理ユニット86は、3Dルックアップテーブルが拡張レイヤピクチャのためにそれに適用される厳密に1つの参照レイヤを識別する、厳密に1つの参照レイヤIDを受信し得る。この例では、色予測処理ユニット86は、次いで、厳密に1つの参照レイヤIDによって識別される厳密に1つの参照レイヤ中の参照レイヤピクチャの色成分に3Dルックアップテーブルを適用する。
[0215]別の例では、ビデオデコーダ30の色予測処理ユニット86は、3Dルックアップテーブルが拡張レイヤピクチャのためにそれに適用される2つ以上の参照レイヤを識別する、2つ以上の参照レイヤIDを受信し得る。この例では、色予測処理ユニット86は、次いで、2つ以上の参照レイヤIDによって識別される2つ以上の参照レイヤの各々中の参照レイヤピクチャの色成分に3Dルックアップテーブルを適用し、2つ以上の参照レイヤからの変換された色成分の組合せに基づいて拡張レイヤピクチャのためのレイヤ間参照ピクチャを生成する。
[0216]更なる一例では、拡張レイヤ中の第1の拡張レイヤピクチャについて、色予測処理ユニット86は、拡張レイヤ中の第1の拡張レイヤピクチャのための第1のレイヤ間参照ピクチャを生成するために3Dルックアップテーブルがそれに適用される第1の参照レイヤを識別する第1の参照レイヤIDを受信し得る。表示順序又はコード化順序で第1の拡張レイヤピクチャに対して後続のピクチャであり得る拡張レイヤ中の第2の拡張レイヤピクチャについて、色予測処理ユニット86は、拡張レイヤ中の第2の拡張レイヤピクチャのための第2のレイヤ間参照ピクチャを生成するために3Dルックアップテーブルがそれに適用される複数の参照レイヤのうちの第2の参照レイヤを識別する第2の参照レイヤIDを受信し得、ここで、第2の参照レイヤは第1の参照レイヤとは異なる。
[0217]本開示の幾つかの態様について、説明のためにHEVC規格に関して説明した。ただし、本開示で説明した技法は、他の規格又はまだ開発されていないプロプライエタリなビデオコード化処理を含む、他のビデオコード化処理にとって有用であり得る。
[0218]本開示で説明したビデオコーダは、ビデオエンコーダ又はビデオデコーダを指すことがある。同様に、ビデオコード化単位はビデオエンコーダ又はビデオデコーダを指すことがある。同様に、ビデオコード化は、適用な可能なとき、ビデオ符号化又はビデオ復号を指すことがある。
[0219]例によっては、本明細書で説明した技法のうちのいずれかの、幾つかの動作又はイベントは、異なる順序で実施され得、追加、マージ、又は完全に除外され得る(例えば、全ての説明した動作又はイベントが、本技法の実施のために必要であるとは限らない)ことを認識されたい。その上、幾つかの例では、動作又はイベントは、連続的にではなく、例えば、マルチスレッド処理、割込み処理、又は複数のプロセッサを通して同時に実施され得る。
[0220]1つ又は複数の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つ又は複数の命令又はコードとして、コンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得るか、又は、例えば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、(1)非一時的である有形コンピュータ可読記憶媒体、又は(2)信号若しくは搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コード及び/又はデータ構造を取り出すために、1つ又は複数のコンピュータあるいは1つ又は複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
[0221]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROM若しくは他の光ディスクストレージ、磁気ディスクストレージ、若しくは他の磁気記憶装置、フラッシュメモリ、又は、命令若しくはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、命令が、ウェブサイト、サーバ、又は他のリモート発信源から、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、又は赤外線、無線、及びマイクロ波などのワイヤレス技術を使用して送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、又は赤外線、無線、及びマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又は他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク(disk)及びディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)及びBlu−rayディスク(disc)を含み、ここで、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
[0222]命令は、1つ又は複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、あるいは他の等価な集積回路又はディスクリート論理回路など、1つ又は複数のプロセッサによって実行され得る。従って、本明細書で使用する「プロセッサ」という用語は、上記の構造又は本明細書で説明した技法の実装に好適な任意の他の構造のいずれかを指し得る。更に、幾つかの態様では、本明細書で説明した機能は、符号化及び復号のために構成されるか、又は複合コーデックに組み込まれる、専用ハードウェア及び/又はソフトウェアモジュール内で提供され得る。また、本技法は、1つ又は複数の回路又は論理要素において完全に実装され得る。
[0223]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)又はICのセット(例えば、チップセット)を含む、多種多様な機器又は装置において実装され得る。本開示では、様々な構成要素、モジュール、又はユニットについて、開示する技法を実施するように構成された機器の機能的態様を強調するように説明したが、異なるハードウェアユニットによる実現を必ずしも必要としない。むしろ、上記で説明したように、様々なユニットは、好適なソフトウェア及び/又はファームウェアとともに、上記で説明した1つ又は複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わされるか、又は相互動作ハードウェアユニットの集合によって提供され得る。
[0224]様々な例について説明した。これら及び他の例は以下の特許請求の範囲内にある。
以下に、本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオデータを復号する方法であって、前記方法が、
色域スケーラビリティのための3次元(3D)ルックアップテーブルのために少なくとも1つの参照レイヤ識別子(ID)を受信することと、前記少なくとも1つの参照レイヤIDが、前記ビデオデータの複数の参照レイヤのうちの少なくとも1つの参照レイヤを識別し、
前記ビデオデータの前記参照レイヤ用の第1の色域から前記ビデオデータの拡張レイヤ用の第2の色域に色成分を変換するために、前記少なくとも1つの参照レイヤIDによって識別される前記少なくとも1つの参照レイヤ中の参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することと、
変換された前記色成分に基づいて前記ビデオデータの前記拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成することと、
前記3Dルックアップテーブルを使用して生成された前記レイヤ間参照ピクチャに基づいて前記拡張レイヤピクチャのビデオブロックを復号することと
を備える、方法。
[C2]
前記3Dルックアップテーブルのために前記少なくとも1つの参照レイヤIDを受信することが、厳密に1つの参照レイヤを識別する厳密に1つの参照レイヤIDを受信することを備える、C1に記載の方法。
[C3]
前記3Dルックアップテーブルを適用することが、前記厳密に1つの参照レイヤIDによって識別される前記厳密に1つの参照レイヤ中の参照レイヤピクチャの色成分に前記3Dルックアップテーブルを適用することを備える、C2に記載の方法。
[C4]
前記3Dルックアップテーブルのために前記少なくとも1つの参照レイヤIDを受信することが、2つ以上の参照レイヤを識別する2つ以上の参照レイヤIDを受信することを備える、C1に記載の方法。
[C5]
前記3Dルックアップテーブルを適用することが、前記2つ以上の参照レイヤの参照レイヤピクチャの色成分を変換するために、前記2つ以上の参照レイヤIDによって識別される前記2つ以上の参照レイヤの各々中の前記参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することを備え、
前記レイヤ間参照ピクチャを生成することが、前記2つ以上の参照レイヤからの変換された前記色成分の組合せに基づいて前記レイヤ間参照ピクチャを生成することを備える、C4に記載の方法。
[C6]
前記少なくとも1つの参照レイヤIDを受信することは、前記拡張レイヤ中の第1の拡張レイヤピクチャのための第1のレイヤ間参照ピクチャを生成するために前記3Dルックアップテーブルがそれに適用される第1の参照レイヤを識別する第1の参照レイヤIDを受信することを備え、前記方法が、
前記ビデオデータの前記複数の参照レイヤのうちの第2の参照レイヤを識別する第2の参照レイヤIDを受信することと、前記第2の参照レイヤが前記第1の参照レイヤとは異なり、
前記第2の参照レイヤの参照レイヤピクチャの色成分を変換するために、前記第2の参照レイヤ中の前記参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することと、
変換された前記色成分に基づいて前記ビデオデータの前記拡張レイヤにおいて第2の拡張レイヤピクチャのために第2のレイヤ間参照ピクチャを生成することと、前記第2の拡張レイヤが前記第1の拡張レイヤとは異なり、
前記3Dルックアップテーブルを使用して生成された前記第2のレイヤ間参照ピクチャに基づいて前記第2の拡張レイヤピクチャのビデオブロックを復号することと
を更に備える、C1に記載の方法。
[C7]
ビデオデータを符号化する方法であって、前記方法が、
色域スケーラビリティのための3次元(3D)ルックアップテーブルのために前記ビデオデータの複数の参照レイヤのうちの少なくとも1つの参照レイヤを決定することと、 前記ビデオデータの前記参照レイヤ用の第1の色域から前記ビデオデータの拡張レイヤ用の第2の色域に色成分を変換するために、前記少なくとも1つの参照レイヤ中の参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することと、
変換された前記色成分に基づいて前記ビデオデータの前記拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成することと、
前記3Dルックアップテーブルを使用して生成された前記レイヤ間参照ピクチャに基づいて前記拡張レイヤピクチャのビデオブロックを符号化することと、
前記少なくとも1つの参照レイヤを識別する少なくとも1つの参照レイヤ識別子(ID)を信号伝達することと
を備える、方法。
[C8]
前記少なくとも1つの参照レイヤIDを信号伝達することが、厳密に1つの参照レイヤを識別する厳密に1つの参照レイヤIDを信号伝達することを備える、C7に記載の方法。
[C9]
前記少なくとも1つの参照レイヤを決定することが、前記3Dルックアップテーブルのために前記厳密に1つの参照レイヤを決定することを備え、
前記3Dルックアップテーブルを適用することが、前記厳密に1つの参照レイヤ中の参照レイヤピクチャの色成分に前記3Dルックアップテーブルを適用することを備える、C8に記載の方法。
[C10]
前記少なくとも1つの参照レイヤIDを信号伝達することが、2つ以上参照レイヤを識別する2つ以上の参照レイヤIDを信号伝達することを備える、C7に記載の方法。
[C11]
前記少なくとも1つの参照レイヤを決定することが、前記3Dルックアップテーブルのために前記2つ以上の参照レイヤを決定することを備え、
前記3Dルックアップテーブルを適用することが、前記2つ以上の参照レイヤの参照レイヤピクチャの色成分を変換するために、前記2つ以上の参照レイヤの各々中の前記参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することを備え、 前記レイヤ間参照ピクチャを生成することが、前記2つ以上の参照レイヤからの前記変換された色成分の組合せに基づいて前記レイヤ間参照ピクチャを生成することを備える、C10に記載の方法。
[C12]
前記少なくとも1つの参照レイヤIDを信号伝達することは、前記拡張レイヤ中の第1の拡張レイヤピクチャのための第1のレイヤ間参照ピクチャを生成するために前記3Dルックアップテーブルがそれに適用される第1の参照レイヤを識別する第1の参照レイヤIDを信号伝達することを備え、前記方法は、
前記ビデオデータの前記複数の参照レイヤのうちの第2の参照レイヤを識別する第2の参照レイヤIDを決定することと、前記第2の参照レイヤが前記第1の参照レイヤとは異なり、
前記第2の参照レイヤの参照レイヤピクチャの色成分を変換するために、前記第2の参照レイヤ中の前記参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することと、
変換された前記色成分に基づいて前記ビデオデータの前記拡張レイヤにおいて第2の拡張レイヤピクチャのために第2のレイヤ間参照ピクチャを生成することと、前記第2の拡張レイヤが前記第1の拡張レイヤとは異なり、
前記3Dルックアップテーブルを使用して生成された前記第2のレイヤ間参照ピクチャに基づいて前記第2の拡張レイヤピクチャのビデオブロックを符号化することと、
前記第2の参照レイヤを識別する前記第2の参照レイヤIDを信号伝達することと
を更に備える、C7に記載の方法。
[C13]
ビデオデータを記憶するように構成されたメモリと、
前記メモリと通信している1つ以上のプロセッサとを備え、前記1つ以上のプロセッサは、
色域スケーラビリティのための3次元(3D)ルックアップテーブルのために少なくとも1つの参照レイヤ識別子(ID)を受信することと、前記少なくとも1つの参照レイヤIDが、前記ビデオデータの複数の参照レイヤのうちの少なくとも1つの参照レイヤを識別し、
前記ビデオデータの前記参照レイヤ用の第1の色域から前記ビデオデータの拡張レイヤ用の第2の色域に色成分を変換するために、前記少なくとも1つの参照レイヤIDによって識別される前記少なくとも1つの参照レイヤ中の参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することと、
変換された前記色成分に基づいて前記ビデオデータの前記拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成することと、
前記3Dルックアップテーブルを使用して生成された前記レイヤ間参照ピクチャに基づいて前記拡張レイヤピクチャのビデオブロックを復号することと
を行うように構成された、ビデオ復号機器。
[C14]
前記1つ以上のプロセッサが、厳密に1つの参照レイヤを識別する厳密に1つの参照レイヤIDを受信するように構成された、C13に記載の機器。
[C15]
前記1つ以上のプロセッサが、前記厳密に1つの参照レイヤIDによって識別される前記厳密に1つの参照レイヤ中の参照レイヤピクチャの色成分に前記3Dルックアップテーブルを適用するように構成された、C14に記載の機器。
[C16]
前記1つ以上のプロセッサが、2つ以上参照レイヤを識別する2つ以上の参照レイヤIDを受信するように構成された、C13に記載の機器。
[C17]
前記1つ以上のプロセッサが、
前記2つ以上の参照レイヤの参照レイヤピクチャの色成分を変換するために、前記2つ以上の参照レイヤIDによって識別される前記2つ以上の参照レイヤの各々中の前記参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することと、
前記2つ以上の参照レイヤからの前記変換された色成分の組合せに基づいて前記レイヤ間参照ピクチャを生成することと
を行うように構成された、C16に記載の機器。
[C18]
前記1つ以上のプロセッサは、
前記拡張レイヤ中の第1の拡張レイヤピクチャのための第1のレイヤ間参照ピクチャを生成するために前記3Dルックアップテーブルがそれに適用される前記複数の参照レイヤのうちの第1の参照レイヤを識別する第1の参照レイヤIDを受信することと、
前記ビデオデータの前記複数の参照レイヤのうちの第2の参照レイヤを識別する第2の参照レイヤIDを受信することと、前記第2の参照レイヤが前記第1の参照レイヤとは異なり、
前記第2の参照レイヤの参照レイヤピクチャの色成分を変換するために、前記第2の参照レイヤ中の前記参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することと、
変換された前記色成分に基づいて前記ビデオデータの前記拡張レイヤにおいて第2の拡張レイヤピクチャのために第2のレイヤ間参照ピクチャを生成することと、前記第2の拡張レイヤが前記第1の拡張レイヤとは異なり、
前記3Dルックアップテーブルを使用して生成された前記第2のレイヤ間参照ピクチャに基づいて前記第2の拡張レイヤピクチャのビデオブロックを復号することと
を行うように構成された、C13に記載の機器。
[C19]
ビデオデータを記憶するように構成されたメモリと、
前記メモリと通信している1つ以上のプロセッサとを備え、前記1つ以上のプロセッサが、
色域スケーラビリティのための3次元(3D)ルックアップテーブルのために前記ビデオデータの複数の参照レイヤのうちの少なくとも1つの参照レイヤを決定することと、 前記ビデオデータの前記参照レイヤ用の第1の色域から前記ビデオデータの拡張レイヤ用の第2の色域に色成分を変換するために、前記少なくとも1つの参照レイヤ中の参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することと、
変換された前記色成分に基づいて前記ビデオデータの前記拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成することと、
前記3Dルックアップテーブルを使用して生成された前記レイヤ間参照ピクチャに基づいて前記拡張レイヤピクチャのビデオブロックを符号化することと、
前記少なくとも1つの参照レイヤを識別する少なくとも1つの参照レイヤ識別子(ID)を信号伝達することと
を行うように構成された、ビデオ符号化機器。
[C20]
前記1つ以上のプロセッサが、厳密に1つの参照レイヤを識別する厳密に1つの参照レイヤIDを信号伝達するように構成された、C19に記載の機器。
[C21]
前記1つ以上のプロセッサが、
前記3Dルックアップテーブルのために前記厳密に1つの参照レイヤを決定することと、
前記厳密に1つの参照レイヤ中の参照レイヤピクチャの色成分に前記3Dルックアップテーブルを適用すること
を行うように構成された、C20に記載の機器。
[C22]
前記1つ以上のプロセッサが、2つ以上参照レイヤを識別する2つ以上の参照レイヤIDを信号伝達するように構成された、C19に記載の機器。
[C23]
前記1つ以上のプロセッサが、
前記3Dルックアップテーブルのために前記2つ以上の参照レイヤを決定することと、 前記2つ以上の参照レイヤの参照レイヤピクチャの色成分を変換するために、前記2つ以上の参照レイヤの各々中の前記参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することと、
前記2つ以上の参照レイヤからの前記変換された色成分の組合せに基づいて前記レイヤ間参照ピクチャを生成することと
を行うように構成された、C22に記載の機器。
[C24]
前記1つ以上のプロセッサは、
前記拡張レイヤ中の第1の拡張レイヤピクチャのための第1のレイヤ間参照ピクチャを生成するために前記3Dルックアップテーブルがそれに適用される前記複数の参照レイヤのうちの第1の参照レイヤを識別する第1の参照レイヤIDを信号伝達することと、
前記ビデオデータの前記複数の参照レイヤのうちの第2の参照レイヤを識別する第2の参照レイヤIDを決定することと、前記第2の参照レイヤが前記第1の参照レイヤとは異なり、
前記第2の参照レイヤの参照レイヤピクチャの色成分を変換するために、前記第2の参照レイヤ中の前記参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することと、
変換された前記色成分に基づいて前記ビデオデータの前記拡張レイヤにおいて第2の拡張レイヤピクチャのために第2のレイヤ間参照ピクチャを生成することと、前記第2の拡張レイヤが前記第1の拡張レイヤとは異なり、
前記3Dルックアップテーブルを使用して生成された前記第2のレイヤ間参照ピクチャに基づいて前記第2の拡張レイヤピクチャのビデオブロックを符号化することと、
前記第2の参照レイヤを識別する前記第2の参照レイヤIDを信号伝達することと
を行うように構成された、C19に記載の機器。
[C25]
色域スケーラビリティのための3次元(3D)ルックアップテーブルのために少なくとも1つの参照レイヤ識別子(ID)を受信するための手段と、前記少なくとも1つの参照レイヤIDが、前記ビデオデータの複数の参照レイヤのうちの少なくとも1つの参照レイヤを識別し、
前記ビデオデータの前記参照レイヤ用の第1の色域から前記ビデオデータの拡張レイヤ用の第2の色域に色成分を変換するために、前記少なくとも1つの参照レイヤIDによって識別される前記少なくとも1つの参照レイヤ中の参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用するための手段と、
変換された前記色成分に基づいて前記ビデオデータの前記拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成するための手段と、
前記3Dルックアップテーブルを使用して生成された前記レイヤ間参照ピクチャに基づいて前記拡張レイヤピクチャのビデオブロックを復号するための手段と
を備える、ビデオ復号機器。
[C26]
ビデオデータを復号するための命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されたとき、
色域スケーラビリティのための3次元(3D)ルックアップテーブルのために少なくとも1つの参照レイヤ識別子(ID)を受信することと、前記少なくとも1つの参照レイヤIDが、前記ビデオデータの複数の参照レイヤのうちの少なくとも1つの参照レイヤを識別し、
前記ビデオデータの前記参照レイヤ用の第1の色域から前記ビデオデータの拡張レイヤ用の第2の色域に色成分を変換するために、前記少なくとも1つの参照レイヤIDによって識別される前記少なくとも1つの参照レイヤ中の参照レイヤピクチャの前記色成分に前記3Dルックアップテーブルを適用することと、
変換された前記色成分に基づいて前記ビデオデータの前記拡張レイヤにおいて拡張レイヤピクチャのためにレイヤ間参照ピクチャを生成することと、
前記3Dルックアップテーブルを使用して生成された前記レイヤ間参照ピクチャに基づいて前記拡張レイヤピクチャのビデオブロックを復号することと
を1つ以上のプロセッサに行わせる、コンピュータ可読記憶媒体。