JP2014527336A

JP2014527336A - ３次元ビデオコーデックにおける深度マップのためのスライスヘッダ予測

Info

Publication number: JP2014527336A
Application number: JP2014522911A
Authority: JP
Inventors: チェン、イン; カークゼウィックズ、マルタ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2011-07-22
Filing date: 2012-07-20
Publication date: 2014-10-09
Anticipated expiration: 2032-07-20
Also published as: ES2548778T3; KR20140046028A; RU2014106718A; BR112014001461B1; US11496760B2; RU2562419C1; EP2735150B1; CA2842554C; CN103703778A; US20130022113A1; BR112014001461A2; WO2013016225A1; CN103703778B; EP2735150A1; KR101733852B1; JP5805871B2; CA2842554A1

Abstract

一例では、ビデオコーダは、第１のスライスをコーディングするように構成され、第１のスライスは、テクスチャスライスと対応する深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表す完全なシンタックス要素を備えるスライスヘッダを有する。ビデオコーダはさらに、第１のスライスのスライスヘッダから、第２のスライスのための共通のシンタックス要素を決定するように構成される。ビデオコーダはまた、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスをコーディングした後で第２のスライスをコーディングするように構成され、第２のスライスは、第１のスライスではないテクスチャスライスと深度スライスのうちの１つを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。

Description

優先権の主張

本出願は、その各々の全体が参照により本明細書に組み込まれる、２０１１年７月２２日に出願された米国仮出願第６１／５１０，７３８号、２０１１年８月１１日に出願された米国仮出願第６１／５２２，５８４号、２０１１年１１月２６日に出願された米国仮出願第６１／５６３，７７２号、および２０１２年４月１３日に出願された米国仮出願第６１／６２４，０３１号の利益を主張する。

本開示は、ビデオコーディングの分野に関し、たとえば、３次元ビデオデータをコーディングに関する。

[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、無線電話ハンドセットなどのワイヤレス通信デバイス、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップコンピュータ、デスクトップコンピュータ、デジタルカメラ、デジタル記録デバイス、ビデオゲームデバイス、ビデオゲームコンソールなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、デジタルビデオをより効率的に送信および受信するために、ＭＰＥＧ−２、ＭＰＥＧ−４、またはＨ．２６４／ＭＰＥＧ−４、Ｐａｒｔ１０、ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ（ＡＶＣ）などのビデオ圧縮技法を実装する。ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するために、空間的予測と時間的予測とを実行する。

[0004]ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するために、空間的予測および／または時間的予測を実行する。ブロックベースのビデオコーディングでは、ビデオフレームまたはスライスは、マクロブロックに区分され得る。各マクロブロックは、さらに区分され得る。イントラコーディングされた（Ｉ）フレームまたはスライス中のマクロブロックは、隣接するマクロブロックに関する空間的予測を使用して符号化される。インターコーディングされた（ＰまたはＢ）フレームまたはスライス中のマクロブロックは、同じフレームまたはスライス中の隣接するマクロブロックに関する空間的予測、あるいは他の参照フレームに関する時間的予測を使用し得る。

[0005]ビデオデータが符号化された後、ビデオデータは送信または記憶のためにパケット化され得る。ビデオデータは、ＡＶＣのような、国際標準化機構（ＩＳＯ）ベースのメディアファイルフォーマットおよびその拡張など、種々の規格のいずれかに準拠するビデオファイルにアセンブルされ得る。

[0006]Ｈ．２６４／ＡＶＣに基づく新しいビデオコーディング規格を開発するために、取り組みが行われている。１つのそのような規格は、Ｈ．２６４／ＡＶＣのスケーラブルな拡張であるスケーラブルビデオコーディング（ＳＶＣ）規格である。別の規格は、Ｈ．２６４／ＡＶＣのマルチビュー拡張になったマルチビュービデオコーディング（ＭＶＣ）である。ＭＶＣの共同草案は、ＪＶＴ−ＡＢ２０４、「ＪｏｉｎｔＤｒａｆｔ８．０ｏｎＭｕｌｔｉｖｉｅｗＶｉｄｅｏＣｏｄｉｎｇ」、２８^th ＪＶＴｍｅｅｔｉｎｇ、Ｈａｎｎｏｖｅｒ、Ｇｅｒｍａｎｙ、２００８年７月に記載されており、これは、ｈｔｔｐ：／／ｗｆｔｐ３．ｉｔｕ．ｉｎｔ／ａｖ−ａｒｃｈ／ｊｖｔ−ｓｉｔｅ／２００８＿０７＿Ｈａｎｎｏｖｅｒ／ＪＶＴ−ＡＢ２０４．ｚｉｐにおいて入手可能である。ＡＶＣ規格のあるバージョンが、ＪＶＴ−ＡＤ００７、「Ｅｄｉｔｏｒｓ’ ｄｒａｆｔｒｅｖｉｓｉｏｎｔｏＩＴＵ−ＴＲｅｃ．Ｈ．２６４｜ＩＳＯ／ＩＥＣ１４４９６−１０ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ − ｉｎｐｒｅｐａｒａｔｉｏｎｆｏｒＩＴＵ−ＴＳＧ１６ＡＡＰＣｏｎｓｅｎｔ（ｉｎｉｎｔｅｇｒａｔｅｄｆｏｒｍ）」、３０ｔｈＪＶＴｍｅｅｔｉｎｇ、Ｇｅｎｅｖａ、ＣＨ、２００９年２月」に記載されており、これは、ｈｔｔｐ：／／ｗｆｔｐ３．ｉｔｕ．ｉｎｔ／ａｖ−ａｒｃｈ／ｊｖｔ−ｓｉｔｅ／２００９＿０１＿Ｇｅｎｅｖａ／ＪＶＴ−ＡＤ００７．ｚｉｐから入手可能である。この文書は、ＳＶＣとＭＶＣとをＡＶＣ仕様に組み込んでいる。

[0007]本開示は全般に、３次元（３Ｄ）ビデオレンダリングをサポートするための技法を説明する。具体的には、本開示の技法は、３Ｄビデオコンテンツをコーディングし復号することに関する。本開示はまた、ビデオデータのコーディングされたブロックユニットためのシグナリング技法を提案する。たとえば、本開示は、テクスチャビュー成分のスライスヘッダに含まれるシンタックス要素を、対応する深度ビュー成分のために再使用することを提案する。加えて、本開示は、深度ビュー成分のスライスヘッダ情報中のシンタックス要素を、テクスチャビュー成分のために再使用することを提案する。

[0008]３Ｄコーデックでは、ある特定の時間インスタンスにおけるビデオデータの各ビューのビュー成分は、テクスチャビュー成分と深度ビュー成分とを含み得る。テクスチャビュー成分は、ルミナンス（Ｙ）成分と、クロミナンス（ＣｂおよびＣｒ）成分とを含み得る。ルミナンス（輝度）成分およびクロミナンス（色）成分は、本明細書では「テクスチャ」成分と総称される。深度ビュー成分は、画像の深度マップからのものであり得る。３Ｄ画像レンダリングでは、深度マップは、たとえば対応するテクスチャ成分のための、深度値を表す深度成分を含む。深度ビュー成分は、ある与えられた視点からの仮想的なビューを生成するために使用され得る。

[0009]深度成分およびテクスチャ成分のシンタックス要素は、コーディングされたブロックユニットによってシグナリングされ得る。本開示では単に「コーディングされたブロック」とも呼ばれるコーディングされたブロックユニットは、ＩＴＵ−ＴＨ．２６４／ＡＶＣ（ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ）におけるマクロブロックまたはＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ）のコーディングユニットに対応し得る。

[0010]一態様では、復号する方法は、テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することを含み、テクスチャスライスは、前記符号化された１つまたは複数のブロックと、テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備える。方法はさらに、テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することを含み、深度スライスは、深度情報の１つまたは複数のコーディングされたブロックと、深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、深度ビュー成分とテクスチャビュー成分の両方は、ビューとアクセスユニットとに属する。方法はさらに、第１のスライスを復号することと、第１のスライスは、テクスチャスライスと深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表す完全なシンタックス要素を備えるスライスヘッダを有し、第１のスライスのスライスヘッダから第２のスライスのための共通のシンタックス要素を決定することと、を備える。方法はさらに、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスをコーディングした後で第２のスライスを復号すること、をさらに含み得、第２のスライスは、第１のスライスではないテクスチャスライスと深度スライスのうちの１つを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。

[0011]別の態様では、データを復号するためのデバイスは、テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、テクスチャスライスは、符号化された１つまたは複数のブロックと、テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、深度スライスは、深度情報の１つまたは複数のコーディングされたブロックと、深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、深度ビュー成分とテクスチャビュー成分の両方は、ビューとアクセスユニットとに属し、第１のスライスを復号することと、第１のスライスは、テクスチャスライスと深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表す完全なシンタックス要素を備えるスライスヘッダを有し、第１のスライスのスライスヘッダから第２のスライスのための共通のシンタックス要素を決定することと、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスを復号した後で第２のスライスを復号することと、第２のスライスは、第１のスライスではないテクスチャスライスと深度スライスのうちの１つを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、を行うように構成される、ビデオデコーダを含む。

[0012]別の態様では、コンピュータプログラム製品は、実行されると、ビデオ復号デバイスのプロセッサに、テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信させる命令を記憶した、コンピュータ可読記憶媒体を備え、テクスチャスライスは、符号化された１つまたは複数のブロックと、テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備える。命令はさらに、ビデオ復号デバイスのプロセッサに、テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信させ、深度スライスは、深度情報の１つまたは複数のコーディングされたブロックと、深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、深度ビュー成分とテクスチャビュー成分の両方は、ビューとアクセスユニットとに属する。命令はさらに、ビデオ復号デバイスのプロセッサに、第１のスライスを復号することと、第１のスライスが、テクスチャスライスと深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、第１のスライスのスライスヘッダから第２のスライスのための共通のシンタックス要素を決定することと、を行わせる。命令はさらに、ビデオ復号デバイスのプロセッサに、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスを復号した後で第２のスライスを復号させ、第２のスライスは、第１のスライスではないテクスチャスライスと深度スライスのうちの１つを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。

[0013]別の態様では、テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信するための手段を備えるデバイスが提供され、テクスチャスライスは、符号化された１つまたは複数のブロックと、テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備える。デバイスはさらに、テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信するための手段を備え、深度スライスは、深度情報の１つまたは複数のコーディングされたブロックと、深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、深度ビュー成分とテクスチャビュー成分の両方が、ビューとアクセスユニットとに属する。デバイスはさらに、第１のスライスを復号するための手段を備え、第１のスライスは、テクスチャスライスと深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。デバイスはさらに、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスをコーディングした後で第２のスライスを復号するための手段を備え、第２のスライスは、第１のスライスではないテクスチャスライスと深度スライスのうちの１つを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。

[0014]一態様では、符号化する方法は、テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することを含み、テクスチャスライスは、符号化された１つまたは複数のブロックと、テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備える。方法はさらに、テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することを含み、深度スライスは、深度情報の１つまたは複数のコーディングされたブロックと、深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、深度ビュー成分とテクスチャビュー成分の両方が、ビューとアクセスユニットとに属する。方法はさらに、第１のスライスを符号化することと、第１のスライスは、テクスチャスライスと深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、第１のスライスのスライスヘッダから第２のスライスのための共通のシンタックス要素を決定することと、を備える。方法はさらに、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスを符号化した後で第２のスライスを符号化することを含んでよく、第２のスライスは、第１のスライスではないテクスチャスライスと深度スライスのうちの１つを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。

[0015]別の態様では、データを符号化するためのデバイスは、テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、テクスチャスライスは、符号化された１つまたは複数のブロックと、テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、深度情報の１つまたは複数のコーディングされたブロックと、深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、深度ビュー成分とテクスチャビュー成分の両方は、ビューとアクセスユニットとに属する、を行うように構成されるビデオエンコーダを含む。ビデオエンコーダはさらに、第１のスライスを符号化することと、第１のスライスは、テクスチャスライスと深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、第１のスライスをスライスヘッダから第２のスライスのための共通のシンタックス要素を決定することと、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスを符号化した後で第２のスライスを符号化することと、第２のスライスは、第１のスライスではないテクスチャスライスと深度スライスのうちの１つを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、を行うように構成される。

[0016]別の態様では、コンピュータプログラム製品は、実行されると、ビデオ符号化デバイスのプロセッサに、テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信させる命令を記憶した、コンピュータ可読記憶媒体を備え、テクスチャスライスは、符号化された１つまたは複数のブロックと、テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備える。命令はさらに、ビデオ符号化デバイスのプロセッサに、テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信させ、深度スライスは、深度情報の１つまたは複数のコーディングされたブロックと、深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、深度ビュー成分とテクスチャビュー成分の両方は、ビューとアクセスユニットとに属する。命令はさらに、ビデオ符号化デバイスのプロセッサに、第１のスライスを符号化することと、第１のスライスは、テクスチャスライスと深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、第１のスライスのスライスヘッダから第２のスライスのための共通のシンタックス要素を決定することと、を行わせる。命令はさらに、ビデオ符号化デバイスのプロセッサに、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスを復号した後で第２のスライスを符号化させ、第２のスライスは、第１のスライスではないテクスチャスライスと深度スライスのうちの１つを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。

[0017]別の態様では、テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信するための手段を備えるデバイスが提供され、テクスチャスライスは、符号化された１つまたは複数のブロックと、テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備える。デバイスはさらに、テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信するための手段を備え、深度スライスは、深度情報の１つまたは複数のコーディングされたブロックと、深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、深度ビュー成分とテクスチャビュー成分の両方は、ビューとアクセスユニットとに属する。デバイスはさらに、第１のスライスを復号するための手段を備え、第１のスライスは、テクスチャスライスと深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。デバイスはさらに、第１のスライスのスライスヘッダから、第２のスライスのための共通のシンタックス要素を決定するための手段を備える。デバイスはさらに、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスを終了した後で第２のスライスを符号化するための手段を備え、第２のスライスは、第１のスライスではないテクスチャスライスと深度スライスのうちの１つを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。

[0018]本開示で説明される技法は、ハードウェア、ソフトウェア、ファームウェア、またはその任意の組合せで実装され得る。ソフトウェアで実装される場合、ソフトウェアは、マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、またはデジタル信号プロセッサ（ＤＳＰ）、あるいは他の等価の集積回路またはディスクリート論理回路など、１つまたは複数のプロセッサを指すことがあるプロセッサで実行され得る。本技法を実行する命令を備えるソフトウェアは、最初にコンピュータ可読媒体に記憶され、プロセッサによってロードされて実行され得る。

[0019]したがって、本開示はまた、プロセッサに、本開示で説明される種々の技法のいずれかを実行させる命令を備えるコンピュータ可読媒体を企図する。場合によっては、コンピュータ可読媒体はコンピュータプログラム製品の一部をなしてよく、コンピュータプログラム製品は、製造業者に販売され、かつ／またはデバイス中で使用され得る。コンピュータプログラム製品はコンピュータ可読媒体を含むことがあり、場合によってはパッケージング材料を含むこともある。

[0020]本開示はまた、情報を搬送する電磁信号にも適用され得る。たとえば、電磁信号は、参照サンプルのサブ整数ピクセルのための値を補間するために使用されるフルピクセルサポートに関係する情報を備え得る。いくつかの例では、信号は、本明細書で説明される技法を実装するデバイスから生成され、または、そのようなデバイスによって送信され得る。他の例では、本開示は、本明細書で説明される技法を実装するデバイスにおいて受信され得る信号に適用され得る。

[0021]本開示の１つまたは複数の態様の詳細が、添付の図面および以下の説明に記載される。本開示で説明される技法の他の特徴、目的、および利点は、これらの説明および図面、ならびに特許請求の範囲から明らかになろう。

本開示の技法による、ビデオ符号化および復号システムの一例を示すブロック図。本開示の技法による、図１のビデオエンコーダの例をさらに詳しく示すブロック図。本開示の技法による、マルチビュービデオコーディングのためのＭＶＣ予測構造の一例の図。本開示の技法による、ビデオエンコーダの例示的な動作を示す流れ図。本開示の技法による、図１のビデオデコーダの例をさらに詳しく示すブロック図。本開示の技法による、ビデオデコーダの例示的な動作を示す流れ図。

[0028]本開示は、少なくともビデオ符号化処理またはビデオ復号処理の少なくともインター予測段階において、エンコーダが適用できデコーダが使用できる、シグナリング技法を説明する。説明される技法は、３次元（３Ｄ）ビデオコンテンツのコーディングに関する。３Ｄビデオコンテンツは、たとえば、マルチビュービデオプラス深度（ＭＶＤ）のコーディングされたブロックとして表され得る。すなわち、これらの技法は、マルチビュービデオコーディング（ＭＶＣ）ビットストリームのいずれかまたはすべてのビューが、深度情報をさらに含み得る、ＭＶＣビットストリームに似ているビットストリームを符号化または復号するために適用され得る。

[0029]より具体的には、本開示によるいくつかの技法は、テクスチャビュー成分と深度ビュー成分とを有する、少なくとも１つの２次元画像の受信を伴う。いくつかのテクスチャビュー成分および深度ビュー成分は、単一のコーディングされたブロックへと一緒に符号化されてよく、または別個のブロックとして符号化されてよい。画像は、画像のスライスへと分割され得る。テクスチャビュー成分をコーディングするためのシンタックス要素は、スライスヘッダにおいてシグナリングされ得る。深度ビュー成分のためのいくつかのシンタックス要素は、深度ビュー成分に対応するテクスチャビュー成分のためのシンタックス要素から予測され得る。本開示の技法は、２次元ビデオデータのための推定された深度マップデータに基づいて、２次元ビデオデータから３次元ビデオデータをレンダリングするために使用されるデータの、符号化、復号、およびシグナリングに関する。いくつかの例では、テクスチャビュー成分は、深度情報を符号化するために使用されるものとは異なる技法を使用して符号化される。本開示では、「コーディング」という用語は、符号化と復号のいずれかまたは両方を指し得る。

[0030]深度推定と仮想ビュー合成とに基づくビデオ変換が、３Ｄ画像を作成するために、たとえば３Ｄビデオ用途のために使用される。特に、シーンの３Ｄビューを作成するために、シーンの仮想ビューが使用され得る。シーンの既存のビューに基づくシーンの仮想ビューの生成は、従来、仮想ビューを合成する前にオブジェクト深度値を推定することによって達成される。深度推定は、ステレオペアまたはモノスコープコンテンツから、オブジェクトとカメラ平面との間の絶対距離または相対距離を推定する処理である。本明細書で使用される場合、深度情報は、深度マップ（たとえば、ピクセルごとの深度値）またはパララックスマップ（たとえば、ピクセルごとの水平視差）など、３次元ビデオを形成する際に有用な情報を含む。

[0031]グレーレベルの画像深度マップによって通常表される推定深度情報は、深度画像ベースレンダリング（ＤＩＢＲ：depth image based rendering）技法を使用して、仮想ビューの任意の角度を生成するために使用され得る。マルチビューシーケンスが効率的なビュー間圧縮という課題に直面する、従来の３次元テレビジョン（３ＤＴＶ）システムと比較して、深度マップベースのシステムは、効率的に符号化され得る（１つまたは複数の）深度マップとともに１つまたは少数のビューのみを送信することによって帯域幅の使用量を低減し得る。深度マップベースの変換において使用される（１つまたは複数の）深度マップは、（１つまたは複数の）深度マップがビュー合成において使用される前に、エンドユーザによって（たとえば、スケーリングを通じて）制御可能であり得る。異なる量の知覚される深度をもつ、カスタマイズされた仮想ビューが生成され得る。また、深度の推定は、１ビューの２Ｄコンテンツのみが利用可能であるモノスコープビデオを使用して実行され得る。

[0032]本明細書で説明される技法は、同じビューの同じ位置にあるテクスチャビュー成分のためのスライスヘッダに記憶されるシンタックス要素から、深度ビュー成分のためのシンタックス要素を予測するために適用され得る。たとえば、深度スライスおよびテクスチャスライスに共通のシンタックス要素の値は、関連する深度ビュー成分のためのスライスではなく、テクスチャビュー成分のためのスライスヘッダに含まれ得る。すなわち、ビデオエンコーダまたはデコーダは、テクスチャビュー成分のためのスライスヘッダ中の、深度スライスおよびテクスチャスライスに共通のシンタックス要素をコーディングすることができ、共通のシンタックス要素は、深度ビュー成分のためのスライスヘッダには存在しない。たとえば、テクスチャビュー成分のためのスライスヘッダにおいて、第１のシンタックス要素のために、第１の値が与えられ得る。深度ビュー成分のためのスライスヘッダはまた、第１のシンタックス要素を共有し、これは、第１のシンタックス要素がテクスチャスライスヘッダと深度スライスヘッダの両方に共通であることを意味する。深度ビュー成分のための第１のシンタックス要素は、第２の値を有する。しかしながら、深度ビュー成分のためのスライスヘッダは、第１のシンタックス要素を含まない。本明細書で説明される技法によれば、第１のシンタックス要素の第２の値は、第１の値から予測され得る。

[0033]いくつかの例では、ピクチャパラメータセット（ＰＰＳ）のＩＤおよびスライスのデルタ量子化パラメータ（ＱＰ）のみが、深度ビュー成分のスライスヘッダに対してシグナリングされる。他の例では、参照ピクチャリスト構築のさらなる情報が、ＰＰＳの識別情報およびデルタＱＰに加えてシグナリングされる。他のシンタックス要素は、テクスチャビュー成分のスライスヘッダから受け継がれ、または決定される。いくつかの例では、共通のシンタックス要素の値は、対応するシンタックス要素と同一になるように設定される。すなわち、深度ビュー成分のスライスヘッダのための他のシンタックス要素は、対応するテクスチャビュー成分のためのスライスヘッダにおける対応する値と等しくなるように設定される。

[0034]別の例では、コーディングされたブロック（マクロブロックまたはコーディングユニット）の開始位置がさらにシグナリングされる。すなわち、深度情報のスライスのスライスヘッダは、スライスの最初のブロック（たとえば、最初のマクロブロックまたはＣＵ）の位置をシグナリングし、スライスヘッダのための他のシンタックスデータ（対応するテクスチャ情報を含むスライスの対応するシンタックスデータと等しくなるように決定され得る）をシグナリングしない。スライスの開始位置がシグナリングされない場合、いくつかの例では開始位置は０であると推測される。深度ビュー成分のｆｒａｍｅ＿ｎｕｍおよびＰＯＣ値が、さらにシグナリングされ得る。深度ビュー成分のために使用される１つまたは複数のループフィルタパラメータが、テクスチャビュー成分のためにシグナリングされる１つまたは複数のループフィルタパラメータと同一かどうかを示すための、フラグが使用される。

[0035]ブロックベースのインターコーディングは、ビデオシーケンスの連続するコーディングされたユニットのビデオブロック間の時間的冗長性を低減または除去するために時間的予測を利用するコーディング技法である。コーディングされたユニットは、ビデオフレーム、ビデオフレームのスライス、ピクチャのグループ、または符号化されるビデオブロックの別の定義されたユニットを備え得る。インターコーディングの場合、ビデオエンコーダは、２つ以上の隣接するコーディングされたユニットのビデオブロック間の動きを推定するために、動き推定と動き補償とを実行する。動き推定のための技法を使用して、ビデオエンコーダは、１つまたは複数の参照フレームまたは他のコーディングされたユニット中の対応する予測ビデオブロックに対するビデオブロックの変位を示す、動きベクトルを生成する。動き補償のための技法を使用して、ビデオエンコーダは、１つまたは複数の参照フレームまたは他のコーディングされたユニットから予測ビデオブロックを生成するために、動きベクトルを使用する。動き補償の後、ビデオエンコーダは、コーディングされている元のビデオブロックから予測ビデオブロックを減算することによって、残差ビデオブロックを計算する。

[0036]参照ビュー成分（ＲＶＣ：reference view component）は、複数のテクスチャまたは深度スライスを含み得る。いくつかの例では、参照ビュー成分が複数のスライスを備える場合、同じ位置にあるスライスが、現在のスライスのシンタックス要素を決定する際に使用され得る。あるいは、ＲＶＣ中の最初のスライスが、現在のスライスのシンタックス要素を決定するために使用され得る。他の例では、ＲＶＣ中別のスライスが、現在のスライスの共通のシンタックス要素を決定するために使用され得る。

[0037]図１は、本開示の技法による、ビデオ符号化および復号システム１０の一例を示すブロック図である。図１の例に示されるように、システム１０は、リンク１５を介して、符号化されたビデオを宛先デバイス１４に送信するソースデバイス１２を含む。リンク１６は、ソースデバイス１２から宛先デバイス１４に符号化されたビデオデータを移動することが可能な、任意のタイプの媒体またはデバイスを備え得る。一例では、リンク１６は、ソースデバイス１２が、符号化されたビデオデータをリアルタイムで宛先デバイス１４に直接送信することを可能にするための、通信媒体を備える。符号化されたビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス１４に送信され得る。通信媒体は、高周波（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路など、任意のワイヤレスまたは有線通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットのようなグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス１２から宛先デバイス１４への通信を可能にするために有用であり得る、ルータ、スイッチ、基地局、または任意の他の機器を含み得る。

[0038]ソースデバイス１２および宛先デバイス１４は、広範囲のデバイスのいずれかを備え得る。いくつかの例では、ソースデバイス１２および宛先デバイス１４のいずれかまたはその両方は、ワイヤレスハンドセット、いわゆるセルラー無線電話、または衛星無線電話などのワイヤレス通信デバイス、あるいは、リンク１５を介してビデオ情報を通信することができ、その場合、リンク１５がワイヤレスである、任意のワイヤレスデバイスを備え得る。しかしながら、テクスチャ情報と深度情報の両方を含むビデオデータのブロックをコーディングすることに関する本開示の技法は、必ずしもワイヤレスの用途または設定に限定されるとは限らない。本技法はまた、物理ワイヤ、光ファイバーまたは他の物理媒体もしくはワイヤレス媒体を介して通信するデバイスを含む、広範囲の他の設定およびデバイスにおいて有用であり得る。加えて、本符号化技法または復号技法は、必ずしも他のデバイスと通信するとは限らないスタンドアロンデバイスにおいても適用され得る。たとえば、ビデオデコーダ２８は、デジタルメディアプレーヤまたは他のデバイス内に存在し、ストリーミング、ダウンロードまたは記憶媒体を介して、符号化されたビデオデータを受信することができる。したがって、互いに通信しているソースデバイス１２および宛先デバイス１４の図は、例示的な実装形態の例示のために与えられるものであり、一般に種々の環境、適用例または実装形態におけるビデオコーディングに適用可能であり得る、本開示において説明される技法に対する制限として見なされるべきでない。

[0039]図１の例では、ソースデバイス１２は、ビデオソース２０と、深度処理ユニット２１と、ビデオエンコーダ２２と、出力インターフェース２４とを含む。宛先デバイス１４は、入力インターフェース２６と、ビデオデコーダ２８と、ディスプレイデバイス３０とを含む。本開示によれば、ソースデバイス１２のビデオエンコーダ２２は、ビデオ符号化処理の一部として本開示の技法のうちの１つまたは複数を適用するように構成され得る。同様に、宛先デバイス１４のビデオデコーダ２８は、ビデオ復号処理の一部として本開示の技法のうちの１つまたは複数を適用するように構成され得る。

[0040]ビデオエンコーダ２２はまた、残差ブロックの通信に関連するビットレートをさらに低減するために、変換処理と、量子化処理と、エントロピーコーディング処理とを適用し得る。変換技法は、離散コサイン変換（ＤＣＴ）または概念的に同様の処理を備え得る。代替的に、ウェーブレット変換、整数変換、または他のタイプの変換が使用され得る。ＤＣＴ処理では、一例として、ピクセル値のセットが、周波数領域におけるピクセル値のエネルギーを表す変換係数に変換される。ビデオエンコーダ２２はまた、変換係数を量子化することができ、これは一般に、対応する変換係数に関連するビット数を低減する処理を伴うことができる。エントロピーコーディングは、ビットストリームへの出力のためにデータをまとめて圧縮する１つまたは複数の処理を含んでよく、圧縮されたデータは、たとえば、一連のコーディングモードと、動き情報と、コーディングされたブロックパターンと、量子化された変換係数とを含み得る。エントロピーコーディングの例には、限定はされないが、コンテキスト適応可変長コーディング（ＣＡＶＬＣ：context adaptive variable length coding）およびコンテキスト適応バイナリ算術コーディング（ＣＡＢＡＣ：context adaptive binary arithmetic coding）がある。

[0041]コーディングされたビデオブロックは、予測ブロックを生成または識別するために使用され得る予測情報と、元のブロックを再現するために予測ブロックに適用され得るデータの残差ブロックとによって表され得る。予測情報は、データの予測ブロックを識別するために使用される１つまたは複数の動きベクトルを備え得る。動きベクトルを使用して、ビデオデコーダ２８は、残差ブロックをコーディングするために使用された予測ブロックを復元することが可能であり得る。したがって、残差ブロックのセットと動きベクトルのセット（場合によってはいくつかの追加のシンタックス）とが与えられれば、ビデオデコーダ２８は、最初に符号化されたビデオフレームを復元することができる。連続するビデオフレームまたは他のタイプのコーディングされたユニットはしばしば類似しているので、動き推定と動き補償とに基づくインターコーディングは、過大なデータ損失を伴わずに比較的大量の圧縮を達成することができる。符号化されたビデオシーケンスは、残差データのブロックと、（インター予測符号化されたときの）動きベクトルと、イントラ予測のためのイントラ予測モードの指示と、シンタックス要素とを備え得る。

[0042]ビデオエンコーダ２２はまた、共通のフレームまたはスライスの隣接するビデオブロックに対してビデオブロックを符号化するために、イントラ予測技法を利用し得る。このようにして、ビデオエンコーダ２２はブロックを空間的に予測する。ビデオエンコーダ２２は、一般に様々な空間的予測方向に対応する、種々のイントラ予測モードで構成され得る。動き推定の場合と同様に、ビデオエンコーダ２２は、ブロックのルミナンス成分に基づいてイントラ予測モードを選択し、次いで、ブロックのクロミナンス成分を符号化するためにイントラ予測モードを再使用するように構成され得る。その上、本開示の技法によれば、ビデオエンコーダ２２は、イントラ予測モードを再使用して、ブロックの深度成分を符号化することができる。

[0043]動きおよびイントラ予測モードの情報を再使用してブロックの深度成分を符号化することによって、これらの技法は、深度マップを符号化する処理を簡略化することができる。その上、本明細書で説明される技法は、ビットストリーム効率を改善することができる。すなわち、ビットストリームは、深度ビュー成分のスライスのためのスライスヘッダ中で追加のシンタックス要素をシグナリングするのではなく、テクスチャビュー成分のためのスライスヘッダ中でいくつかのシンタックス要素を一度示すだけでよい。

[0044]任意選択で、テクスチャビュー成分はまた、同じ方法で、対応する深度ビュー成分を再使用することができる。

[0045]ここでも、図１の示されるシステム１０は一例にすぎない。本開示の様々な技法は、ブロックベースの予測符号化をサポートする任意の符号化デバイスによって、またはブロックベースの予測復号をサポートする任意の復号デバイスによって実行され得る。ソースデバイス１２および宛先デバイス１４は、ソースデバイス１２が宛先デバイス１４に送信するためのコーディングされたビデオデータを生成するような、コーディングデバイスの例にすぎない。場合によっては、デバイス１２および１６は、デバイス１２および１６の各々がビデオ符号化コンポーネントとビデオ復号コンポーネントとを含むように、実質的に対称的に動作し得る。したがって、システム１０は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスト、またはビデオ電話のための、ビデオデバイス１２とビデオデバイス１６との間の一方向または双方向のビデオ送信をサポートし得る。

[0046]ソースデバイス１２のビデオソース２０は、ビデオカメラ、あらかじめキャプチャされたビデオを含んでいるビデオアーカイブ、またはビデオコンテンツプロバイダからのビデオフィードのような、ビデオキャプチャデバイスを含む。あるいは、ビデオソース２０は、ソースビデオとしてのコンピュータグラフィックスベースのデータ、あるいは、ライブビデオ、アーカイブされたビデオ、および／またはコンピュータで生成されたビデオの組合せを生成し得る。場合によっては、ビデオソース２０がビデオカメラである場合、ソースデバイス１２および宛先デバイス１４は、いわゆるカメラ付き電話またはビデオ電話、あるいは、タブレットコンピューティングデバイスなど、ビデオデータを操作するように構成された他のモバイルデバイスを形成し得る。各々の場合において、キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータで生成されたビデオは、ビデオエンコーダ２２によって符号化され得る。ビデオソース２０は、ビューをキャプチャし、それを深度処理ユニット２１に与える。

[0047]ビデオソース２０は、ビュー２中のオブジェクトのための深度画像の計算のために、ビュー２を深度処理ユニット２１に与える。いくつかの例では、ビュー２は２つ以上のビューを備える。深度画像は、ビデオソース２０によってキャプチャされたビュー２中のオブジェクトに対して決定される。深度処理ユニット２１は、ビュー２の画像中のオブジェクトの深度値を自動的に計算するように構成される。たとえば、深度処理ユニット２１は、ルミナンス情報に基づいて、オブジェクトの深度値を計算する。いくつかの例では、深度処理ユニット２１は、ユーザから深度情報を受信するように構成される。いくつかの例では、ビデオソース２０は、異なる視点におけるシーンの２つのビューをキャプチャし、次いで、２つのビュー中のオブジェクトの間の視差に基づいて、シーン中のオブジェクトに対する深度情報を計算する。様々な例では、ビデオソース２０は、標準的な２次元カメラ、シーンの立体ビューを提供する２カメラシステム、シーンの複数のビューをキャプチャするカメラアレイ、または１つのビューと深度情報とをキャプチャするカメラを備える。

[0048]深度処理ユニット２１は、テクスチャビュー成分４と深度ビュー成分６とをビデオエンコーダ２２に提供する。深度処理ユニット２１はまた、ビュー２をビデオエンコーダ２２に直接提供することができる。深度情報６は、ビュー２のための深度マップ画像を備える。深度マップ画像は、表示されるべきエリア（たとえば、ブロック、スライス、またはフレーム）に関連するピクセルの各領域の深度値のマップを備え得る。ピクセルの領域は、単一のピクセル、または、１つまたは複数のピクセルのグループを含む。深度マップのいくつかの例は、ピクセルごとに１つの深度成分を有する。他の例では、ピクセルごとに複数の深度成分がある。深度マップは、たとえば、他の以前にコーディングされた深度データに対するイントラ予測またはインター予測を使用して、テクスチャデータと実質的に同様の方式でコーディングされ得る。他の例では、深度マップは、テクスチャデータがコーディングされるのとは異なる方式でコーディングされる。

[0049]いくつかの例では、深度マップは推定され得る。２つ以上のビューが存在するとき、深度マップを推定するためにステレオマッチングが使用され得る。しかしながら、２Ｄから３Ｄへの変換では、深度を推定することはより難しくなり得る。とはいえ、様々な方法によって推定された深度マップが、深度画像ベースレンダリング（ＤＩＢＲ：Depth-Image-Based-Rendering）に基づく３Ｄレンダリングのために使用され得る。

[0050]ビデオソース２０はシーンの複数のビューを与え得るが、深度処理ユニット２１は、複数のビューに基づいて深度情報を計算することができ、ソースデバイス１２は一般に、１つのビューとシーンの各ビューについての深度情報とを送信することができる。

[0051]ビュー２がデジタル静止ピクチャであるとき、ビデオエンコーダ２２は、たとえば、ＪｏｉｎｔＰｈｏｔｏｇｒａｐｈｉｃＥｘｐｅｒｔｓＧｒｏｕｐ（ＪＰＥＧ）画像としてビュー２を符号化するように構成され得る。ビュー２がビデオデータのフレームであるとき、ビデオエンコーダ２２は、たとえば、ＭｏｔｉｏｎＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）、国際標準化機構（ＩＳＯ）／国際電気標準会議（ＩＥＣ）ＭＰＥＧ−１Ｖｉｓｕａｌ、ＩＳＯ／ＩＥＣＭＰＥＧ−２Ｖｉｓｕａｌ、ＩＳＯ／ＩＥＣＭＰＥＧ−４Ｖｉｓｕａｌ、国際電気通信連合（ＩＴＵ）Ｈ．２６１、ＩＴＵ−ＴＨ．２６２、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４、Ｈ．２６４ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ（ＡＶＣ）、（Ｈ．２６５とも呼ばれる）来たるＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ）規格、または他のビデオ符号化規格のような、ビデオコーディング規格に従って、第１のビュー５０を符号化するように構成される。ビデオエンコーダ２２は、コーディングされたブロック８を形成するために、符号化された画像とともに深度情報６を含めてよく、コーディングされたブロック８は、深度情報６とともに符号化された画像データを含む。ビデオエンコーダ２２は、コーディングされたブロック８を出力インターフェース２４に渡す。コーディングされたブロック８は、リンク１５を介して、コーディングされたブロック８とともにシグナリング情報を含むビットストリームにおいて、入力インターフェース２６に転送され得る。

[0052]符号化されたビデオ情報は、テクスチャ成分４と深度情報６とを含む。テクスチャ成分４は、ビデオ情報のルミナンス（ルーマ）成分とクロミナンス（クロマ）成分とを含み得る。ルーマ成分は一般に輝度を表し、クロミナンス成分は一般に色の色相を表す。深度処理ユニット２１は、ビュー２の深度マップから深度情報６を抽出する。ビデオエンコーダ２２は、テクスチャビュー成分４と深度ビュー成分６とを、符号化されたビデオデータの単一のコーディングされたブロック８へと符号化することができる。同様に、ビデオエンコーダ２２は、ルーマ成分のための動きまたはイントラ予測モードの情報がクロマ成分および深度成分に対して再使用されるように、ブロックを符号化することができる。テクスチャビュー成分のために使用されるシンタックス要素は、深度ビュー成分のための同様のシンタックス要素を予測するために使用され得る。

[0053]いくつかの例では、深度マップビュー成分は、対応するテクスチャビュー成分がビュー間予測技法を使用して符号化される場合であっても、ビュー間予測技法を使用して符号化されなくてよい。たとえば、深度マップビュー成分は、対応するテクスチャビュー成分がビュー間予測を使用して予測される場合、ビュー内予測を使用して予測され得る。たとえば、テクスチャビュー成分をビュー間予測することは、テクスチャビュー成分に対応するビューとは異なるビューのデータから、テクスチャビュー情報を予測する。対照的に、深度ビュー情報をビュー内予測することは、深度ビュー情報に対応するビューと同じビューのデータから、深度情報を予測する。

[0054]異なる予測技法を使用していても、深度マップビュー成分のいくつかのシンタックス要素は、対応するテクスチャビュー成分のスライスヘッダ中の対応するシンタックス要素から予測され得る。しかしながら、深度マップビュー成分に対するスライスヘッダ情報は、参照ピクチャリスト構築に関連する情報を含み得る。すなわち、参照ピクチャリスト構築に関連する情報は、深度マップビュー成分のためのスライスヘッダ中でシグナリングされ得る。たとえば、使用される参照ピクチャの数と、深度マップビュー成分を予測するためにどの参照ピクチャが使用されるかの指示とが、深度マップビュー成分のためのスライスヘッダにおいてシグナリングされ得る。同様の情報も、対応するテクスチャビュー成分のためのスライスヘッダにおいてシグナリングされ得る。

[0055]いくつかの例では、ソースデバイス１２は、たとえば、符号分割多元接続（ＣＤＭＡ）または別の通信規格のような通信規格に従って、コーディングされたブロック８を変調する、モデムを含む。モデムは、信号変調のために設計された様々なミキサ、フィルタ、増幅器または他のコンポーネントを含み得る。出力インターフェース２４は、増幅器と、フィルタと、１つまたは複数のアンテナとを含む、データを送信するために設計された回路を含み得る。コーディングされたブロック８は、出力インターフェース２４およびリンク１５を介して、宛先デバイス１４に送信される。いくつかの例では、通信チャネル上で送信するのではなく、ソースデバイス１２は、デジタルビデオディスク（ＤＶＤ）、ブルーレイ（登録商標）ディスク、フラッシュドライブなどの記憶デバイス３２上に、テクスチャ成分と深度成分とを有するブロックを含む、符号化されたビデオデータを記憶する。

[0056]宛先デバイス１４の入力インターフェース２６は、リンク１５を介して情報を受信する。いくつかの例では、宛先デバイス１４は、情報を復調するモデムを含む。出力インターフェース２４と同様に、入力インターフェース２６は、増幅器と、フィルタと、１つまたは複数のアンテナとを含む、データを受信するために設計された回路を含み得る。いくつかの例では、出力インターフェース２４および／または入力インターフェース２６は、受信回路と送信回路の両方を含む単一の送受信機コンポーネント内に組み込まれ得る。モデムは、信号復調のために設計された様々なミキサ、フィルタ、増幅器または他のコンポーネントを含み得る。いくつかの例では、モデムは、変調と復調の両方を実行するためのコンポーネントを含み得る。

[0057]また、ビデオエンコーダ２２によって実行されるビデオ符号化処理は、動き推定と動き補償とを含み得るインター予測符号化中、およびイントラ予測符号化中に、本明細書で説明される技法のうちの１つまたは複数を実装し得る。ビデオデコーダ２８によって実行されるビデオ復号処理もまた、復号処理の動き補償段階中にそのような技法を実行し得る。

[0058]「コーダ」という用語は、本明細書では、ビデオ符号化またはビデオ復号を実行する専用のコンピュータデバイスまたは装置を指すために使用される。「コーダ」という用語は一般に、任意のビデオエンコーダ、ビデオデコーダ、または複合エンコーダ／デコーダ（コーデック）を指す。「コーディング」という用語は、符号化または復号を指す。「コーディングされたブロック」、「コーディングされたブロックユニット」または「コーディングされたユニット」という用語は、フレーム全体、フレームのスライス、ビデオデータのブロック、または使用されるコーディング技法に従って定義される別の単独で復号可能なユニットなど、ビデオフレームの単独で復号可能な任意のユニットを指し得る。

[0059]ディスプレイデバイス３０は、復号されたビデオデータをユーザに対して表示し、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、種々の１つまたは複数のディスプレイデバイスのいずれかを備え得る。いくつかの例では、ディスプレイデバイス３０は、３次元再生が可能なデバイスに対応する。たとえば、ディスプレイデバイス３０は、閲覧者によって着用される眼鏡類とともに使用される立体視ディスプレイを備え得る。眼鏡類は、能動的な眼鏡を備えてよく、その場合、ディスプレイデバイス３０は、能動的な眼鏡のレンズの交互のシャッタリングと同期して、異なるビューの画像を高速に入れ替える。あるいは、眼鏡類は、受動的な眼鏡を備えてよく、その場合、ディスプレイデバイス３０は、異なるビューからの画像を同時に表示し、受動的な眼鏡は、異なるビュー間でフィルタリングするために概ね直交方向に偏光された偏光レンズを含み得る。

[0060]図１の例では、リンク１５は、高周波（ＲＦ）スペクトルまたは１つまたは複数の物理的伝送線路など、ワイヤレスまたは有線の任意の通信媒体、あるいはワイヤレスおよび有線の媒体の任意の組合せを備え得る。リンク１５は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットのようなグローバルネットワークなど、パケットベースのネットワークの一部を形成し得る。リンク１５は一般に、ビデオデータをソースデバイス１２から宛先デバイス１４に送信するのに適切な任意の通信媒体、または様々な通信媒体の集合体を表す。リンク１５は、ソースデバイス１２から宛先デバイス１４への通信を支援するのに有用であり得る、ルータ、スイッチ、基地局、または任意の他の機器を含み得る。

[0061]ビデオエンコーダ２２およびビデオデコーダ２８は、代替的にＭＰＥＧ−４、Ｐａｒｔ１０、ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ（ＡＶＣ）として説明されるＩＴＵ−ＴＨ．２６４規格のような、ビデオ圧縮規格に従って動作し得る。ビデオエンコーダ２２およびビデオデコーダ２８によって使用され得るＩＴＵＨ．２６４／ＡＶＣ規格に基づく追加のビデオ圧縮規格には、ＩＴＵＨ．２６４／ＡＶＣ規格のスケーラブルな拡張であるスケーラブルビデオコーディング（ＳＶＣ）規格がある。ビデオエンコーダ２２およびビデオデコーダ２８がそれに従って動作し得る別の規格には、ＩＴＵＨ．２６４／ＡＶＣ規格のマルチビュー拡張であるマルチビュービデオコーディング（ＭＶＣ）規格がある。しかしながら、本開示の技法は、いかなる特定のビデオコーディング規格にも限定されない。

[0062]いくつかの態様では、ビデオエンコーダ２２およびビデオデコーダ２８は、それぞれオーディオエンコーダおよびオーディオデコーダと統合されてよく、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するための適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含み得る。適用可能な場合、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

[0063]ビデオエンコーダ２２およびビデオデコーダ２８は各々、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せとして実装され得る。本開示の技法のうちのいずれかまたはすべてがソフトウェアで実装されるとき、実装するデバイスは、ソフトウェアのための命令を記憶および／または実行するためのハードウェア、たとえば、命令を記憶するためのメモリおよび命令を実行するための１つまたは複数の処理ユニットをさらに含み得る。ビデオエンコーダ２２およびビデオデコーダ２８の各々は１つまたは複数のエンコーダまたはデコーダ中に含まれてよく、そのいずれかは、符号化機能と復号機能とを与える複合コーデックの一部として、それぞれのモバイルデバイス、加入者デバイス、ブロードキャストデバイス、サーバなどに統合され得る。

[0064]ビデオシーケンスは、一般に、ビデオピクチャとも呼ばれる一連のビデオフレームを含む。ビデオエンコーダ２２は、ビデオデータを符号化するために、個々のビデオフレーム内のビデオブロックに対して動作する。ビデオブロックは、サイズが一定であっても変化してもよく、指定されたコーディング規格に応じてサイズが異なることがある。各ビデオフレームは、一連の１つまたは複数のスライスを含む。ＩＴＵ−ＴＨ．２６４規格では、たとえば、各スライスは一連のマクロブロックを含み、マクロブロックは複数のサブブロックへと構成され得る。Ｈ．２６４規格は、ルーマ成分については１６×１６、８×８、または４×４、およびクロマ成分については８×８のように、２次元（２Ｄ）ビデオ符号化のための様々なブロックサイズのイントラ予測をサポートし、さらに、ルーマ成分については１６×１６、１６×８、８×１６、８×８、８×４、４×８および４×４、およびクロマ成分については対応するスケーリングされたサイズのように、様々なブロックサイズのインター予測をサポートする。ビデオブロックは、ピクセルデータのブロック、または、たとえば離散コサイン変換（ＤＣＴ）もしくは概念的に同様の変換処理などの変換処理の後の変換係数のブロックを備え得る。これらの技法は、３Ｄビデオに拡張され得る。

[0065]ビデオブロックは、小さいほどより良い解像度が得られ、高い詳細レベルを含むビデオフレームの位置特定に使用され得る。一般に、マクロブロックおよび様々なサブブロックはビデオブロックであると見なされ得る。加えて、スライスは、マクロブロックおよび／またはサブブロックのような、一連のビデオブロックであると見なされ得る。各スライスは、ビデオフレームの単独で復号可能なユニットであり得る。あるいは、フレーム自体が復号可能なユニットであってよく、またはフレームの他の部分が復号可能なユニットとして定義されてよい。

[0066]ＩＴＵ−ＴＨ．２６４規格の２Ｄマクロブロックは、深度マップまたはパララックスマップからの深度情報を、そのビデオフレームまたはスライスのための関連するルーマ成分およびクロマ成分（すなわち、テクスチャ成分）とともに符号化することによって、３Ｄに拡張され得る。（仮想変位マッピングまたはオフセットマッピングとも呼ばれる）パララックスマッピングは、ピクセル位置におけるビュー角度と高さマップとの関数に基づいて、ピクセル位置におけるテクスチャビュー成分を変位させる。ビデオエンコーダ２２は深度情報を単色（monochromatic）ビデオとして符号化し得る。

[0067]コーディングされるブロックのようなビデオブロックを符号化するために、ビデオエンコーダ２２は、イントラ予測またはインター予測を実行して、１つまたは複数の予測ブロックを生成する。ビデオエンコーダ２２は、符号化されるべき元のビデオブロックから予測ブロックを減算して、残差ブロックを生成する。したがって、残差ブロックは、コーディングされているブロックと予測ブロックとの間のピクセルごとの差分を表し得る。ビデオエンコーダ２２は、残差ブロックに対して変換を実行して、変換係数のブロックを生成し得る。イントラまたはインターベースの予測コーディングおよび変換技法の後、ビデオエンコーダ２２は変換係数を量子化し得る。量子化は、一般に、係数を表すために使用されるデータ量をできるだけ低減するために係数を量子化する処理を指す。量子化の後、コンテキスト適応可変長コーディング（ＣＡＶＬＣ）またはコンテキスト適応バイナリ算術コーディング（ＣＡＢＡＣ）のような、エントロピーコーディング方法に従ってエントロピーコーディングが実行され得る。ビデオエンコーダ２２によって実行される符号化処理の追加の詳細が、図２に関して以下で説明される。

[0068]ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ）と現在呼ばれる、新しいビデオコーディング規格を開発するための取り組みが現在進行中である。この来たる規格はＨ．２６５とも呼ばれる。この規格化の取り組みは、ＨＥＶＣＴｅｓｔＭｏｄｅｌ（ＨＭ）と呼ばれるビデオコーディングデバイスのモデルに基づく。ＨＭは、たとえば、ＩＴＵ−ＴＨ．２６４／ＡＶＣによるデバイスに勝るビデオコーディングデバイスのいくつかの能力を仮定する。たとえば、Ｈ．２６４は９つのイントラ予測符号化モードを提供するが、ＨＭは３３個ものイントラ予測符号化モードを提供する。ＨＥＶＣは、本明細書で説明されるように、スライスヘッダ情報技法をサポートするように拡張され得る。

[0069]ＨＭでは、ビデオデータのブロックをコーディングユニット（ＣＵ）と呼ぶ。ビットストリーム内のシンタックスデータが、ピクセルの数に関して最大のコーディングユニットである、最大コーディングユニット（ＬＣＵ：largest coding unit）を定義し得る。一般に、ＣＵは、ＣＵがサイズの差異を有さないことを除いて、Ｈ．２６４のマクロブロックと同様の目的を有する。ＨＭ規格によれば、コーディングされるブロックはＣＵであり得る。したがって、ＣＵは、サブＣＵに分割され得る。一般に、本開示におけるＣＵへの言及は、ピクチャの最大コーディングユニット（ＬＣＵ）またはＬＣＵのサブＣＵを指し得る。ＬＣＵはサブＣＵに分割されてよく、各サブＣＵはサブＣＵに分割されてよい。ビットストリームのシンタックスデータは、ＣＵ深さと呼ばれる、ＬＣＵが分割され得る最大回数を定義し得る。それに応じて、ビットストリームは最小コーディングユニット（ＳＣＵ）も定義し得る。本開示ではまた、ＣＵ、予測ユニット（ＰＵ）、または変換ユニット（ＴＵ）のいずれかを指すために「ブロック」という用語を使用する。

[0070]ＬＣＵは、４分木データ構造と関連付けられ得る。一般に、４分木データ構造はＣＵごとに１つのノードを含み、ルートノードはＬＣＵに対応する。ＣＵが４つのサブＣＵに分割される場合、ＣＵに対応するノードは４つのリーフノードを含み、リーフノードの各々はサブＣＵのうちの１つに対応する。４分木データ構造の各ノードは、対応するＣＵのシンタックスデータを与え得る。たとえば、４分木のノードは、そのノードに対応するＣＵがサブＣＵに分割されるかどうかを示す分割フラグを含み得る。ＣＵのシンタックス要素は、再帰的に定義されてよく、ＣＵがサブＣＵに分割されるかどうかに依存し得る。

[0071]分割されないＣＵは、１つまたは複数の予測ユニット（ＰＵ）を含み得る。一般に、ＰＵは、対応するＣＵの全部または一部分を表し、そのＰＵの参照サンプルを取り出すためのデータを含む。たとえば、ＰＵがイントラモード符号化されるとき、ＰＵは、ＰＵのイントラ予測モードを表すデータを含み得る。別の例として、ＰＵがインターモード符号化されるとき、ＰＵは、ＰＵの動きベクトルを定義するデータを含み得る。動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度（たとえば、１／４ピクセル精度もしくは１／８ピクセル精度）、動きベクトルが指す参照フレーム、および／または動きベクトルの参照リスト（たとえば、リスト０もしくはリスト１）を表し得る。動きベクトルはまた、テクスチャビュー成分と深度ビュー成分とについて異なる解像度を有するものとして扱われ得る。（１つまたは複数の）ＰＵを定義するＣＵのデータはまた、たとえば、ＣＵを１つまたは複数のＰＵに区分することを表し得る。区分モードは、ＣＵがコーディングされないか、イントラ予測モード符号化されるか、またはインター予測モード符号化されるかによって異なり得る。

[0072]１つまたは複数のＰＵを有するＣＵはまた、１つまたは複数の変換ユニット（ＴＵ）を含み得る。ＰＵを使用した予測の後に、ビデオエンコーダ２２は、ＰＵに対応するＣＵの部分の残差値を計算し得る。残差値は、変換され、走査され、量子化され得る。ＴＵは、必ずしもＰＵのサイズに制限されるとは限らない。したがって、ＴＵは、同じＣＵの対応するＰＵよりも大きいことも小さいこともある。いくつかの例では、ＴＵの最大サイズは、対応するＣＵのサイズに対応し得る。

[0073]上で述べられたように、イントラ予測は、あるピクチャの現在のＣＵのＰＵを、同じピクチャの以前コーディングされたＣＵから予測することを含む。より具体的には、ビデオエンコーダ２２は、特定のイントラ予測モードを使用して、あるピクチャの現在のＣＵをイントラ予測し得る。ＨＭエンコーダは、最高で３３個のイントラ予測モードで構成され得る。したがって、方向性イントラ予測モードと方向性変換との間の１対１のマッピングをサポートするために、ＨＭエンコーダおよびデコーダは、サポートされる各変換サイズについて６６個の行列を記憶する必要があろう。さらに、すべての３３個のイントラ予測モードがサポートされるブロックサイズは、比較的大きなブロック、たとえば、３２×３２ピクセル、６４×６４ピクセル、またはより一層大きなピクセルであり得る。

[0074]宛先デバイス１４において、ビデオデコーダ２８が、符号化されたビデオデータ８を受信する。ビデオデコーダ２８は、量子化された係数を得るために、ＣＡＶＬＣまたはＣＡＢＡＣのようなエントロピーコーディング方法に従って、コーディングされたブロックのような、受信された符号化されたビデオデータ８をエントロピー復号する。ビデオデコーダ２８は、逆量子化（inverse quantization）（逆量子化（de-quantization））機能と逆変換機能とを適用して、ピクセル領域中で残差ブロックを復元する。ビデオデコーダ２８はまた、符号化されたビデオデータ中に含まれる（たとえば、コーディングモード、動きベクトル、フィルタ係数を定義するシンタックスなどの）制御情報またはシンタックス情報に基づいて、予測ブロックを生成する。ビデオデコーダ２８は、予測ブロックと復元された残差ブロックとの和を計算して、表示のための復元されたビデオブロックを生成する。ビデオデコーダ２８によって実行される例示的な復号処理の追加の詳細が、図５に関して以下で説明される。

[0075]本明細書で説明されるように、Ｙはルミナンスを表すことができ、ＣｂおよびＣｒは３次元ＹＣｂＣｒ色空間のクロミナンスの２つの異なる値（たとえば、青および赤の色相）を表すことができ、Ｄは深度情報を表すことができる。いくつかの例では、各ピクセル位置は、３次元色空間に対する３つのピクセル値と、ピクセル位置の深度に対する１つのピクセル値とを実際に定義し得る。他の例では、クロマ成分あたり、異なる数のルーマ成分が存在し得る。たとえば、クロマ成分あたり、４つのルーマ成分が存在し得る。加えて、深度成分とテクスチャ成分とは、異なる解像度を有し得る。そのような例では、テクスチャビュー成分（たとえば、ルーマ成分）と深度ビュー成分との間には、１対１の関係はないことがある。しかしながら、本開示の技法は、簡単のために１次元に関する予測に言及し得る。技法が１次元のピクセル値に関して説明される限り、同様の技法が他の次元に拡張され得る。具体的には、本開示の一態様によれば、ビデオエンコーダ２２および／またはビデオデコーダ２８は、ピクセルのブロックを取得することができ、ピクセルのブロックは、テクスチャビュー成分と深度ビュー成分とを含む。

[0076]いくつかの例では、ビデオエンコーダ２２およびビデオデコーダ２８は、動き補償中に１つまたは複数の補間フィルタリング技法を使用し得る。すなわち、ビデオエンコーダ２２および／またはビデオデコーダ２８は、フル整数ピクセル位置のセットを備えるフィルタサポートに補間フィルタを適用し得る。

[0077]宛先デバイス１４のビデオデコーダ２８は、テクスチャビュー成分に関連するシンタックス要素を含む追加の情報とともに、符号化されたビデオビットストリームの一部として、１つまたは複数のコーディングされたブロックを受信する。ビデオデコーダ２８は、コーディングされたブロック８およびシンタックス要素に基づいて、３Ｄ再生のためにビデオデータをレンダリングすることができる。本開示の技法によれば、また以下でより詳しく論じられるように、テクスチャビュー成分４のためにシグナリングされるシンタックス要素は、深度ビュー成分６のためのシンタックス要素を予測するために使用され得る。シンタックス要素は、テクスチャビュー成分４のためのスライスヘッダにおいてシグナリングされ得る。深度ビュー成分６のための対応するシンタックス要素は、テクスチャビュー成分４のための関連するシンタックス要素から決定され得る。

[0078]深度マップ成分と、スライスの１つまたは複数のテクスチャ成分のうちの１つとの間の、量子化パラメータ差分のような、深度ビュー成分６のためのいくつかのシンタックス要素は、深度ビュー成分６のためのスライスヘッダにおいてシグナリングされ得る。属性はまた、深度ビュー成分のために使用されるループフィルタパラメータがテクスチャビュー成分のためにシグナリングされるようなループフィルタパラメータと同じかどうかを示す、スライスレベル中のフラグであり得る。他の例では、シンタックス要素は、シーケンスレベルで（たとえば、シーケンスパラメータセット（ＳＰＳ）データ構造において）、ピクチャレベルで（たとえば、ピクチャパラメータセット（ＰＰＳ）データ構造またはフレームヘッダにおいて）、またはブロックレベルで（たとえば、ブロックヘッダにおいて）、スライスレベル（たとえば、スライスヘッダ）に加えてシグナリングされ得る。

[0079]図２は、図１のビデオエンコーダ２２のある例をさらに詳しく示すブロック図である。ビデオエンコーダ２２は、本開示の技法と矛盾することなく、深度ビュー成分のためのシンタックス要素を予測するために使用され得るテクスチャビュー成分のためのシンタックス要素をシグナリングする、ブロックユニットを符号化する。ビデオエンコーダ２２は、本明細書では「コーダ」と呼ばれる、専用のビデオコンピュータデバイスまたは装置の一例である。図２に示されるように、ビデオエンコーダ２２は、ソースデバイス１２のビデオエンコーダ２２に対応する。しかしながら、他の例では、ビデオエンコーダ２２は、異なるデバイスに対応し得る。さらなる例では、（たとえば、他のエンコーダ／デコーダ（コーデック）などの）他のユニットも、ビデオエンコーダ２２によって実行されるものと同様の技法を実行することができる。

[0080]ビデオエンコーダ２２は、ビデオフレーム内のブロックのイントラコーディングとインターコーディングの少なくとも１つを実行し得るが、説明を簡単にするために、イントラコーディングコンポーネントは図２に示されていない。イントラコーディングは、空間的予測を利用して、所与のビデオフレーム内のビデオの空間的冗長性を低減または除去する。インターコーディングは、時間的予測を利用して、ビデオシーケンスの隣接フレーム内のビデオの時間的冗長性を低減または除去する。イントラモード（Ｉモード）は、空間ベースの圧縮モードを指し得る。予測（Ｐモード）または双方向（Ｂモード）などのインターモードは、時間ベースの圧縮モードを指し得る。本開示の技法は、インターコーディング中およびイントラコーディング中に適用される。しかしながら、説明を簡単かつ容易にするために、空間的予測ユニットなどのイントラコーディングユニットは、図２に示されていない。

[0081]図２に示されるように、ビデオエンコーダ２２は、符号化されるべきビデオフレーム内のビデオブロックを受信する。一例では、ビデオエンコーダ２２は、テクスチャビュー成分４と深度ビュー成分６とを受信する。別の例では、ビデオエンコーダは、ビデオソース２０からビュー２を受信する。

[0082]図２の例では、ビデオエンコーダ２２は、予測処理ユニット３２と、予測コーディングユニット（ＭＣＵ）と、マルチビュービデオプラス深度（ＭＶＤ）ユニット３３と、メモリ３４と、第１の加算機４８と、変換処理ユニット３８と、量子化ユニット４０と、エントロピーコーディングユニット４６とを含む。ビデオブロックの復元のために、ビデオエンコーダ２２はまた、逆量子化ユニット４２と、逆変換処理ユニット４４と、第２の加算機５１と、デブロッキングユニット４３とを含む。デブロッキングユニット４３は、復元されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタリングする、デブロッキングフィルタである。ビデオエンコーダ２２中に含まれる場合、デブロッキングユニット４３は通常、第２の加算機５１の出力をフィルタリングする。デブロッキングユニット４３は、１つまたは複数のテクスチャビュー成分に対するデブロッキング情報を決定し得る。デブロッキングユニット４３はまた、深度マップ成分に対するデブロッキング情報を決定し得る。いくつかの例では、１つまたは複数のテクスチャ成分に対するデブロッキング情報は、深度マップ成分に対するデブロッキング情報とは異なり得る。一例では、図２に示されるように、変換処理ユニット３８は、ＨＥＶＣに関する「ＴＵ」ではなく、機能ブロックを表す。

[0083]マルチビュービデオプラス深度（ＭＶＤ）ユニット３３は、テクスチャビュー成分４および深度ビュー成分６のような、テクスチャ成分と深度情報とを備える１つまたは複数のビデオブロック（図２において「ビデオブロック」と標識された）を受信する。ＭＶＤユニット３３は、ブロックユニット中の深度成分を符号化するための機能をビデオエンコーダ２２に与える。ＭＶＤユニット３３は、予測処理ユニット３２が深度情報を処理することを可能にするフォーマットで、テクスチャビュー成分と深度ビュー成分とを、組み合わせて、または別々に、予測処理ユニット３２に与える。ＭＶＤユニット３３はまた、深度ビュー成分がビデオブロックに含まれていることを、変換処理ユニット３８にシグナリングすることができる。他の例では、ビデオエンコーダ２２の各ユニット、たとえば、予測処理ユニット３２、変換処理ユニット３８、量子化ユニット４０、エントロピーコーディングユニット４６などが、テクスチャビュー成分に加えて深度情報を処理するための機能を備える。

[0084]一般に、動き補償ユニット３７が、あるブロックの深度成分の予測される値を計算するとき、そのブロックのルミナンス成分のために計算された動きベクトルを再使用するように構成されるという点で、ビデオエンコーダ２２は、クロミナンス情報と同様の方式で深度情報を符号化する。同様に、ビデオエンコーダ２２のイントラ予測ユニットは、イントラ予測を使用して深度ビュー成分を符号化するとき、ルミナンス成分のために選択されたイントラ予測モードを使用する（すなわち、ルミナンス成分の分析に基づいて）ように構成され得る。

[0085]予測処理ユニット３２は、動き推定（ＭＥ）ユニット３５と動き補償（ＭＣ）ユニット３７とを含む。予測処理ユニット３２は、ピクセル位置の深度情報を、テクスチャ成分とともに予測する。（本明細書では「フィルタ３９」と呼ばれる）１つまたは複数の補間フィルタ３９は、予測処理ユニット３２中に含められてよく、動き推定および／または動き補償の一部として補間を実行するために、ＭＥユニット３５とＭＣユニット３７の一方または両方によって起動されてよい。補間フィルタ３９は、実際は、多数の様々なタイプの補間および補間タイプフィルタリングを支援するための、複数の様々なフィルタを表し得る。したがって、予測処理ユニット３２は複数の補間または補間様フィルタを含み得る。

[0086]符号化処理中に、ビデオエンコーダ２２は、（図２では「ビデオブロック」と標識された）コーディングされるべきビデオブロックを受信し、予測処理ユニット３２は、インター予測コーディングを実行して（図２では「予測ブロック」と標識された）予測ブロックを生成する。予測ブロックは、テクスチャビュー成分と深度ビュー情報の両方を含む。具体的には、ＭＥユニット３５は、動き推定を実行してメモリ３４中の予測ブロックを識別することができ、ＭＣユニット３７は、動き補償を実行して予測ブロックを生成することができる。

[0087]動き推定は通常、ビデオブロックの動きを推定する、動きベクトルを生成する処理と考えられる。動きベクトルは、たとえば、現在のフレーム（または、他のコーディングされたユニット）内のコーディングされるべきブロックに対する、予測フレームまたは参照フレーム（または、他のコーディングされたユニット、たとえばスライス）内の予測ブロックの変位を示し得る。動きベクトルは、フル整数ピクセル精度またはサブ整数ピクセル精度を有し得る。たとえば、動きベクトルの水平成分と垂直成分の両方が、それぞれのフル整数成分とサブ整数成分とを有し得る。参照フレーム（または参照フレームの部分）は、時間的に、現在のビデオブロックが属するビデオフレーム（またはビデオフレームの部分）より前にまたは後に位置し得る。動き補償は通常、メモリ３４から予測ブロックをフェッチまたは生成する処理と考えられ、動き推定によって決定された動きベクトルに基づいて、予測データを補間し、または場合によっては生成することを含み得る。

[0088]ＭＥユニット３５は、コーディングされるべきビデオブロックを１つまたは複数の参照フレーム（たとえば、前のフレームおよび／または後続のフレーム）の参照ブロックと比較することによって、そのビデオブロックのための少なくとも１つの動きベクトルを計算する。参照フレームのためのデータは、メモリ３４に記憶され得る。ＭＥユニット３５は、分数ピクセル、分数ペル、サブ整数、またはサブピクセル動き推定と呼ばれることがある分数ピクセル精度を用いて、動き推定を実行し得る。分数ピクセル動き推定では、ＭＥユニット３５は、整数ピクセル位置以外の位置に対する変位を示す動きベクトルを計算する。したがって、動きベクトルは、分数ピクセル精度、たとえば、１／２ピクセル精度、１／４ピクセル精度、１／８ピクセル精度、または他の分数ピクセル精度を有し得る。このようにして、分数ピクセル動き推定により、予測処理ユニット３２は、整数ピクセル（または、フルピクセル）位置よりも高い精度を用いて動きを推定することが可能になり、したがって、予測処理ユニット３２は、より正確な予測ブロックを生成する。分数ピクセル動き推定は、予測処理ユニット３２が、第１の解像度で深度情報を予測し、第２の解像度でテクスチャ成分を予測することを可能にする。たとえば、テクスチャ成分はフルピクセル精度で予測されるが、深度情報は２分の１ピクセル精度で予測される。他の例では、動きベクトルの他の解像度が、深度情報およびテクスチャ成分に対して使用され得る。

[0089]ＭＥユニット３５は、動き推定処理中に任意の必要な補間のために、１つまたは複数のフィルタ３９を起動することができる。いくつかの例では、メモリ３４は、サブ整数ピクセルのための補間された値を記憶することができ、この補間された値は、たとえば、フィルタ３９を使用して加算器５１によって計算され得る。たとえば、加算器５１は、フィルタ３９を、メモリ３４に記憶されるべき復元されたブロックに適用し得る。

[0090]予測処理ユニット３２が予測ブロックを生成すると、ビデオエンコーダ２２は、コーディングされている元のビデオブロックから予測ブロックを減算することによって、（図２で「残差ブロック」と標識された）残差ビデオブロックを形成する。この減算は、元のビデオブロック中のテクスチャ成分と予測ブロック中のテクスチャ成分との間で、ならびに元のビデオブロック中の深度情報に対して、または予測ブロック中の深度情報からの深度マップに対して行われ得る。加算器４８は、この減算演算を実行する１つまたは複数のコンポーネントを表す。

[0091]変換処理ユニット３８は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換などの変換を残差ブロックに適用し、残差変換ブロック係数を備えるビデオブロックを生成する。変換処理ユニット３８は、ＨＥＶＣによって定義されたＣＵのＴＵとは対照的に、変換をビデオデータのブロックの残差係数に適用するビデオエンコーダ２２のコンポーネントを表すことを理解されたい。変換処理ユニット３８は、たとえば、概念的にＤＣＴと同様である、Ｈ．２６４規格によって定義される変換などの他の変換を実行することができる。そのような変換には、たとえば、方向性変換（カルーネンレーベ（Karhunen-Loeve）定理変換など）、ウェーブレット変換、整数変換、サブバンド変換、または他のタイプの変換が含まれる。いずれの場合も、変換処理ユニット３８は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換処理ユニット３８は、同じタイプの変換を、対応する残差ブロック中の、テクスチャ成分と深度情報との両方に適用し得る。各テクスチャ成分および深度成分に対して、別々の残差ブロックがあることになる。変換は、残差情報をピクセル領域から周波数領域に変換する。

[0092]量子化ユニット４０は、ビットレートをさらに低減するために残差変換係数を量子化する。量子化処理は、係数の一部またはすべてに関連するビット深度を低減することができる。量子化ユニット４０は、深度画像コーディング残余を量子化することができる。量子化の後、エントロピーコーディングユニット４６が、量子化された変換係数をエントロピーコーディングする。たとえば、エントロピーコーディングユニット４６は、ＣＡＶＬＣ、ＣＡＢＡＣ、または別のエントロピーコーディング方法を実行することができる。

[0093]エントロピーコーディングユニット４６はまた、予測処理ユニット３２、または量子化ユニット４０などのビデオエンコーダ２２の他のコンポーネントから取得された、１つまたは複数の動きベクトルとサポート情報とをコーディングし得る。１つまたは複数の予測シンタックス要素は、コーディングモード、１つまたは複数の動きベクトルについてのデータ（たとえば、水平および垂直成分、参照リスト識別子、リストインデックス、ならびに／あるいは動きベクトル解像度シグナリング情報）、使用された補間技法の指示、フィルタ係数のセット、ルーマ成分の解像度に対する深度画像の相対解像度の指示、深度画像コーディング残余の量子化行列、深度画像のためのデブロッキング情報、または予測ブロックの生成に関連する他の情報を含み得る。これらの予測シンタックス要素は、シーケンスレベルにおいてまたはピクチャレベルにおいて与えられ得る。

[0094]１つまたは複数のシンタックス要素はまた、ルーマ成分と深度成分との間の量子化パラメータ（ＱＰ）差分を含み得る。ＱＰ差分は、スライスレベルにおいてシグナリングされてよく、テクスチャビュー成分のためのスライスヘッダに含まれてよい。また、深度ビュー成分のコーティングされたブロックのパターン、深度ビュー成分のデルタＱＰ、動きベクトル差分、または予測ブロックの生成に関連する他の情報を含む、他のシンタックス要素が、コーディングされたブロックユニットのレベルでシグナリングされ得る。動きベクトル差分は、目標動きベクトルとテクスチャ成分の動きベクトルとの間のデルタ値として、または、目標動きベクトル（すなわち、コーディングされているブロックの動きベクトル）とブロック（たとえば、ＣＵのＰＵ）のための隣接する動きベクトルからの予測子との間のデルタ値として、シグナリングされ得る。エントロピーコーディングユニット４６によるエントロピーコーディングの後、符号化されたビデオおよびシンタックス要素は、別のデバイスに送信されてよく、あるいは、後で送信するかまたは取り出すために（たとえば、メモリ３４中に）アーカイブされてよい。

[0095]逆量子化ユニット４２および逆変換処理ユニット４４は、それぞれ逆量子化および逆変換を適用して、たとえば、参照ブロックとして後で使用するために、ピクセル領域中で残差ブロックを復元する。復元された残差ブロック（図２で「復元された残差ブロック」と標識された）は、変換処理ユニット３８に提供される残差ブロックの復元されたバージョンを表し得る。復元された残差ブロックは、量子化演算および逆量子化演算によって生じた細部の損失により、加算器４８によって生成された残差ブロックとは異なり得る。加算器５１は、復元された残差ブロックを、予測処理ユニット３２によって生成された動き補償された予測ブロックに加算して、メモリ３４に記憶するための復元されたビデオブロックを生成する。復元されたビデオブロックは、後続のビデオフレームまたは後続のコーディングされたユニット中のブロックユニットをその後コーディングするために使用され得る参照ブロックとして、予測処理ユニット３２によって使用され得る。

[0096]このようにして、ビデオエンコーダ２２は、画像のビューを示すビュー成分を備えるコーディングされたブロックユニットを受信することと、ビュー成分は、１つまたは複数のテクスチャビュー成分と深度ビュー成分とを備え、テクスチャシンタックス要素を含む１つまたは複数のテクスチャビュー成分のためのテクスチャスライスヘッダを生成することと、深度ビュー成分のための深度シンタックス要素はテクスチャスライスヘッダ中のテクスチャシンタックス要素から決定され得、を行うように構成されるビデオエンコーダの例を表す。

[0097]いくつかの場合には、テクスチャビュー成分と深度ビュー成分のコーディングに関する情報は、コーディングされたビットストリーム中に含めるための、１つまたは複数のシンタックス要素として示される。いくつかの例では、深度スライスヘッダは、開始マイクロブロック、スライスタイプ、使用されるべきピクチャパラメータセット（ＰＰＳ）、スライスの初期ＱＰとＰＰＳにおいてシグナリングされたＱＰとの間のデルタＱＰ、参照ピクチャの順序（ｆｒａｍｅ＿ｎｕｍとして表される）、および現在のピクチャ（ＰＯＣ）の表示順序のうちの少なくとも１つを含む、シンタックス要素を備える。深度スライスヘッダはまた、参照ピクチャリスト構築および関連するシンタックス要素、メモリ管理制御動作および関連するシンタックス要素、ならびに重み付け予測および関連するシンタックス要素のうちの、少なくとも１つを備え得る。

[0098]図３は、マルチビュービデオコーディングのためのＭＶＣ（ＭＶＣ）予測構造の一例の図である。ＭＶＣは、Ｈ．２６４／ＡＶＣの拡張である。ＭＶＣ予測構造は、各ビュー内のピクチャ間予測とビュー間予測の両方を含む。図３では、予測は矢印によって示され、ここで矢印の終点のオブジェクトは、予測の基準のために矢印の始点のオブジェクトを使用する。図３のＭＶＣ予測構造は、時間順の（time-first）復号順序構成とともに使用され得る。時間順の復号順序では、各アクセスユニットは、１つの出力時間インスタンスに対するすべてのビューのコーディングされたピクチャを含むように定義され得る。アクセスユニットの復号順序は、出力または表示順序と同一ではないこともある。

[0099]ＭＶＣでは、ビュー間予測は視差動き補償によってサポートされ、視差動き補償は、Ｈ．２６４／ＡＶＣ動き補償のシンタックスを使用するが、異なるビュー中のピクチャが参照ピクチャとして置かれることを可能にする。２つのビューのコーディングも、ＭＶＣによってサポートされ得る。ＭＶＣエンコーダは、３Ｄビデオ入力として３つ以上のビューをとらえることができ、ＭＶＣデコーダは、マルチビューの表現を復号することができる。ＭＶＣデコーダを有するレンダラは、複数のビューを伴う３Ｄビデオコンテンツを復号することができる。

[0100]同じアクセスユニット中の（すなわち、同じ時間インスタンスを伴う）ピクチャは、ＭＶＣにおいてビュー間予測され得る。非ベースビューの１つの中のピクチャをコーディングするとき、ピクチャが異なるビュー中にあるが同じ時間インスタンスを伴う場合、そのピクチャは参照ピクチャリストに追加され得る。ビュー間予測の参照ピクチャは、任意のインター予測の参照ピクチャと同様に、参照ピクチャリストの任意の位置に置かれ得る。

[0101]ＭＶＣでは、別のビュー中のビュー成分がインター予測の参照であるかのように、ビュー間予測が実現され得る。可能性のあるビュー間の参照は、シーケンスパラメータセット（ＳＰＳ）のＭＶＣ拡張においてシグナリングされ得る。可能性のあるビュー間の参照は、参照ピクチャリスト構築処理によって修正されてよく、これによって、インター予測またはビュー間予測の参照の順序を柔軟にできる。

[0102]対照的に、ＨＥＶＣでは、スライスヘッダは、Ｈ．２６４／ＡＶＣにおける設計原則と同様の設計原則に従う。加えて、ＨＥＶＣスライスヘッダは、現在のＨＥＶＣ仕様における適応ループフィルタ（ＡＬＦ）パラメータシンタックスを含み得る。いくつかの例では、深度スライスヘッダは、１つまたは複数の適応ループフィルタパラメータを備える。

[0103]３ＤＶコーデックでは、ある特定の時間インスタンスにおける各ビューのビュー成分は、テクスチャビュー成分と深度ビュー成分とを含み得る。スライス構造は、誤りに耐える目的で、すなわち、誤り耐性を実現するために、使用され得る。しかしながら、深度ビュー成分は、対応するテクスチャビュー成分が正しく受信されたときしか、意味がないことがある。深度ビュー成分のためのすべてのシンタックス要素を含めて、深度ビュー成分のＮＡＬユニットのためのスライスヘッダは比較的大きくなり得る。深度スライスヘッダのサイズは、テクスチャビュー成分のためのテクスチャスライスヘッダ中のシンタックス要素からいくつかのシンタックス要素を予測することによって、低減され得る。

[0104]ビットストリームは、たとえば、図１のソースデバイス１２と宛先デバイス１４との間で、マルチビュービデオプラス深度ブロックユニットとシンタックス要素とを転送するために使用され得る。ビットストリームは、コーディング規格ＩＴＵＨ．２６４／ＡＶＣに準拠することができ、特に、マルチビュービデオコーディング（ＭＶＣ）ビットストリーム構造に従う。すなわち、いくつかの例では、ビットストリームは、Ｈ．２６４／ＡＶＣのＭＶＣ拡張に準拠する。他の例では、ビットストリームは、ＨＥＶＣのマルチビュー拡張または別の規格のマルチビュー拡張に準拠する。さらに他の例では、他のコーディング規格が使用される。

[0105]典型的なＭＶＣビットストリーム順序（復号順序）構成は、時間順コーディングである。各アクセスユニットは、１つの出力時間インスタンスのためのすべてのビューのコーディングされたピクチャを含むように定義される。アクセスユニットの復号順序は、出力または表示順序と同じであることも同じでないこともある。一般に、ＭＶＣ予測は、各ビュー内のピクチャ間予測とビュー間予測の両方を含み得る。ＭＶＣでは、ビュー間予測は視差動き補償によってサポートされてよく、視差動き補償は、Ｈ．２６４／ＡＶＣ動き補償のシンタックスを使用するが、異なるビュー中のピクチャが参照ピクチャとして使用されることを可能にする。

[0106]２つのビューのコーディングがＭＶＣによってサポートされる。ＭＶＣの利点の１つは、ＭＶＣエンコーダが３Ｄビデオ入力として３つ以上のビューをとらえることができ、また、ＭＶＣデコーダが２つのビューをマルチビュー表現へと復号することができることである。したがって、ＭＶＣデコーダをもつレンダラは、３Ｄビデオコンテンツを、複数のビューを有するものとして扱い得る。以前は、ＭＶＣは、補足エンハンスメント情報（ＳＥＩ）メッセージ（ステレオ情報または空間インターリービングピクチャ）を用いるＨ．２６４／ＡＶＣと同様に、深度マップ入力を処理しなかった。

[0107]Ｈ．２６４／ＡＶＣ規格では、ＮｅｔｗｏｒｋＡｂｓｔｒａｃｔｉｏｎＬａｙｅｒ（ＮＡＬ）ユニットは、ビデオ電話、ストレージ、またはストリーミングビデオなどの用途に対処する「ネットワークフレンドリーな」ビデオ表現を与えるように定義される。ＮＡＬユニットは、ＶｉｄｅｏＣｏｄｉｎｇＬａｙｅｒ（ＶＣＬ）ＮＡＬユニットと非ＶＣＬＮＡＬユニットとに分類され得る。ＶＣＬユニットは、コア圧縮エンジンを含んでよく、ブロックレベルと、マクロブロック（ＭＢ）レベルと、スライスレベルとを備え得る。他のＮＡＬユニットは非ＶＣＬＮＡＬユニットである。

[0108]２Ｄビデオ符号化の例では、各ＮＡＬユニットは、１バイトのＮＡＬユニットヘッダと可変サイズのペイロードとを含む。ＮＡＬユニットタイプを指定するために、５ビットが使用される。ＮＡＬユニットが他のピクチャ（ＮＡＬユニット）によって参照されることに関してどのくらい重要かを示す、ｎａｌ＿ｒｅｆ＿ｉｄｃのために３ビットが使用される。たとえば、ｎａｌ＿ｒｅｆ＿ｉｄｃを０に等しく設定することは、ＮＡＬユニットがインター予測のために使用されないことを意味する。Ｈ．２６４／ＡＶＣが、スケーラブルビデオコーディング（ＳＶＣ）規格のような、３Ｄビデオ符号化を含むように拡張されるとき、ＮＡＬヘッダは２Ｄの状況のＮＡＬヘッダと同様であり得る。たとえば、ＮＡＬユニットヘッダ中の１つまたは複数のビットは、ＮＡＬユニットが４コンポーネントのＮＡＬユニットであることを識別するために使用される。

[0109]ＮＡＬユニットヘッダは、ＭＶＣＮＡＬユニットのためにも使用され得る。しかしながら、ＭＶＣでは、ＮＡＬユニットヘッダ構造は、前置ＮＡＬユニットおよびＭＶＣコーデッドスライスＮＡＬユニットを除いて保持され得る。ＭＶＣコーデッドスライスＮＡＬユニットは、４バイトヘッダと、図１のコーディングされたブロック８などのブロックユニットを含み得るＮＡＬユニットペイロードとを備え得る。ＭＶＣＮＡＬユニットヘッダ中のシンタックス要素は、ｐｒｉｏｒｉｔｙ＿ｉｄと、ｔｅｍｐｏｒａｌ＿ｉｄと、ａｎｃｈｏｒ＿ｐｉｃ＿ｆｌａｇと、ｖｉｅｗ＿ｉｄと、ｎｏｎ＿ｉｄｒ＿ｆｌａｇと、ｉｎｔｅｒ＿ｖｉｅｗ＿ｆｌａｇとを含み得る。他の例では、他のシンタックス要素がＭＶＣＮＡＬユニットヘッダ中に含まれる。

[0110]シンタックス要素ａｎｃｈｏｒ＿ｐｉｃ＿ｆｌａｇは、ピクチャがアンカーピクチャであるのか非アンカーピクチャであるのかを示し得る。アンカーピクチャと出力順序（すなわち、表示順序）でそれに続くすべてのピクチャとは、復号順序（すなわち、ビットストリーム順序）で前のピクチャを復号することなく正しく復号されることが可能であり、したがってランダムアクセスポイントとして使用され得る。アンカーピクチャと非アンカーピクチャとは異なる依存性を有してよく、その両方がシーケンスパラメータセット中でシグナリングされ得る。

[0111]ＭＶＣにおいて定義されているビットストリーム構造は、ｖｉｅｗ＿ｉｄおよびｔｅｍｐｏｒａｌ＿ｉｄという２つのシンタックス要素によって特徴づけられ得る。シンタックス要素ｖｉｅｗ＿ｉｄは各ビューの識別子を示し得る。ＮＡＬユニットヘッダ中のこの識別子は、デコーダにおけるＮＡＬユニットの容易な識別と、表示のための復号されたビューの高速アクセスとを可能にする。シンタックス要素ｔｅｍｐｏｒａｌ＿ｉｄは、時間スケーラビリティ階層を示し、またはフレームレートを間接的に示し得る。たとえば、より小さい最大ｔｅｍｐｏｒａｌ＿ｉｄ値をもつＮＡＬユニットを含む動作ポイントは、より大きい最大ｔｅｍｐｏｒａｌ＿ｉｄ値をもつ動作ポイントよりも低いフレームレートを有し得る。より高いｔｅｍｐｏｒａｌ＿ｉｄ値をもつコーディングされたピクチャは通常、ビュー内のより低いｔｅｍｐｏｒａｌ＿ｉｄ値をもつコーディングされたピクチャに依存するが、より高いｔｅｍｐｏｒａｌ＿ｉｄをもついずれのコーディングされたピクチャにも依存しないことがある。

[0112]ＮＡＬユニットヘッダ中のシンタックス要素ｖｉｅｗ＿ｉｄおよびｔｅｍｐｏｒａｌ＿ｉｄは、ビットストリーム抽出と適応の両方のために使用され得る。シンタックス要素ｐｒｉｏｒｉｔｙ＿ｉｄは、単純な一経路ビットストリーム適応処理のために主に使用され得る。シンタックス要素ｉｎｔｅｒ＿ｖｉｅｗ＿ｆｌａｇは、このＮＡＬユニットが、異なるビュー中の別のＮＡＬユニットをビュー間予測するために使用されるかどうかを示し得る。

[0113]ＭＶＣはまた、シーケンスパラメータセット（ＳＰＳ）を利用し、ＳＰＳＭＶＣ拡張を含み得る。パラメータセットは、Ｈ．２６４／ＡＶＣではシグナリングのために使用される。シーケンスパラメータセットは、シーケンスレベルのヘッダ情報を備える。ピクチャパラメータセット（ＰＰＳ）は、まれに変化するピクチャレベルのヘッダ情報を備える。パラメータセットがある場合、このまれに変化する情報は、シーケンスごとまたはピクチャごとに常には繰り返されず、したがってコーディング効率が改善される。さらに、パラメータセットの使用は、ヘッダ情報の帯域外送信を可能にし、誤り耐性のための冗長送信の必要を回避する。帯域外送信のいくつかの例では、パラメータセットＮＡＬユニットは、他のＮＡＬユニットとは異なるチャネル上で送信される。ＭＶＣでは、ビュー依存性は、ＳＰＳＭＶＣ拡張においてシグナリングされ得る。すべてのビュー間予測は、ＳＰＳＭＶＣ拡張によって規定された範囲内で行われ得る。

[0114]いくつかの従来の３Ｄビデオ符号化技法では、たとえばＹＣｂＣｒ色空間中の色成分が、１つまたは複数のＮＡＬユニット中でコーディングされ、一方深度画像が、１つまたは複数の別個のＮＡＬユニット中でコーディングされるように、コンテンツがコーディングされる。しかしながら、いずれの単一のＮＡＬユニットもアクセスユニットのテクスチャおよび深度画像のコーディングされたサンプルを含まない場合、いくつかの問題が起こり得る。たとえば、３Ｄビデオデコーダでは、各フレームのテクスチャと深度画像の両方を復号した後、深度マップおよびテクスチャに基づくビューレンダリングが、仮想ビューを生成するためにアクティブにされることが予想される。深度画像のＮＡＬユニットおよびアクセスユニットのテクスチャのＮＡＬユニットが順番にコーディングされる場合、ビューレンダリングは、アクセスユニット全体が復号されるまで開始できない。このことは、３Ｄビデオがレンダリングされるのにかかる時間の増大につながり得る。

[0115]さらに、テクスチャ画像および関連する深度マップ画像は、コーデック中の様々なレベル、たとえば、シーケンスレベル、ピクチャレベル、スライスレベル、およびブロックレベルで、何らかの情報を共有し得る。この情報を２つのＮＡＬユニットへとコーディングすることで、情報を共有または予測する際に、余剰の実装負荷が生じ得る。したがって、エンコーダは、フレームに対して２回、すなわちテクスチャのために１回、深度マップのためにもう１回、動き推定を実行する必要があり得る。同様に、デコーダは、フレームに対して２回、動き補償を実行する必要があり得る。

[0116]本明細書で説明されるように、３Ｄビデオをサポートするための技法が、ＭＶＣなどの既存の規格に追加される。マルチビュービデオプラス深度（ＭＶＤ）が、３Ｄビデオ処理のためにＭＶＣに追加され得る。３Ｄビデオ符号化技法は、たとえば、ビュー角度をスムーズに変更するために、あるいは、たとえばデバイスの仕様またはユーザ選好に基づき得る、収束または深度の知覚の後方または前方への調整のために、既存のビデオ規格により多くの柔軟性と拡張性とを与え得る。また、コーディング規格は、３Ｄビデオ中の仮想ビューの生成のために深度マップを利用するように拡張され得る。

[0117]図４は、本開示の技法による、ビデオコーダの例示的な動作を示す流れ図である。いくつかの例では、ビデオコーダは、図１および図２に示されるビデオエンコーダ２２のような、ビデオエンコーダである。他の例では、ビデオコーダは、図１および図５に示されるビデオデコーダ２８のような、ビデオデコーダである。ビデオコーダは、テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダを備える、テクスチャスライスを受信する（１０２）。たとえば、ビデオコーダは、テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信し、テクスチャスライスが、符号化された１つまたは複数のブロックと、テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備える。方法はさらに、深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダを備える、深度スライスを受信することを含む（１０４）。たとえば、ビデオコーダは、テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信し、深度スライスは、深度情報の１つまたは複数のコーディングされたブロックと、深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備える。いくつかの例では、深度ビュー成分およびテクスチャビュー成分はともに、１つのビューおよび１つのアクセスユニットに属する。

[0118]方法はさらに、第１のスライスをコーディングすることを備え、第１のスライスは、テクスチャスライスと深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する（１０６）。たとえば、ビデオエンコーダ２２は、第１のスライスを符号化し、第１のスライスは、テクスチャスライスと深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。一例では、スライスヘッダは、関連するスライスをコーディングするために使用されるすべてのシンタックス要素を備える。別の例では、ビデオデコーダ２８は、第１のスライスを復号し、第１のスライスが、テクスチャスライスと深度スライスのうちの１つを備え、第１のスライスは、第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。

[0119]方法はさらに、第１のスライスのスライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することを備える（１０８）。さらに、方法は、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスをコーディングした後に第２のスライスをコーディングすることを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する（１１０）。たとえば、ビデオエンコーダ２２は、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスをコーディングした後で第２のスライスを符号化することができ、第２のスライスは、第１のスライスではないテクスチャスライスと深度スライスのうちの１つを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。同様に、ビデオデコーダ２８は、決定された共通のシンタックス要素に少なくとも部分的に基づいて、第１のスライスをコーディングした後で第２のスライスを復号することができ、第２のスライスは、第１のスライスではないテクスチャスライスと深度スライスのうちの１つを備え、第２のスライスは、第１のスライスに共通のシンタックス要素の値を除く、第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する。

[0120]他の例では、方法はさらに、どのシンタックス要素がシーケンスパラメータセット中の第２のスライスのスライスヘッダにおいて明示的にシグナリングされるかということの指示をシグナリングすることを備える。

[0121]他の例では、少なくとも１つの深度シンタックス要素が、深度ビュー成分のスライスヘッダにおいて決定されシグナリングされる。少なくとも１つの深度シンタックス要素は、ピクチャパラメータセットの識別子、スライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分、コーディングされるブロックユニットの開始位置、参照ピクチャの順序、または、深度ビュー成分の現在のピクチャの表示順序を含み得る。たとえば、第２のスライスのスライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える。別の例では、第２のスライスのスライスヘッダは、第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える。別の例では、第２のスライスのスライスヘッダは、コーディングされるブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える。さらに、第２のスライスのスライスヘッダは、第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備え得る。別の例では、第２のスライスのスライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える。

[0122]コーディングされるブロックユニットの開始位置は、コーディングされるブロックの開始位置が、テクスチャスライスヘッダまたは深度スライスヘッダにおいてシグナリングされない場合、０であると決定され得る。少なくとも１つのテクスチャビュー成分のためのループフィルタパラメータがシグナリングされてよく、深度ビュー成分のために使用されるループフィルタパラメータを示すフラグセットは、少なくとも１つのテクスチャビュー成分のためのループフィルタパラメータと同じである。たとえば、第２のスライスのスライスヘッダは、第２のスライスのための、デブロッキングフィルタパラメータに関連するシンタックス要素と、適応ループフィルタリングパラメータに関連するシンタックス要素の少なくとも１つを備える。

[0123]別の例では、テクスチャ情報を表すビデオデータの１つまたは複数のブロックは、ビュー間予測を使用して符号化されるが、フレームの対応する部分のための深度値は、ビュー内予測を使用して符号化される。テクスチャビュー成分と深度ビュー成分とを有するビデオフレームは、第１のビューに対応し得る。テクスチャ情報を表すビデオデータの１つまたは複数のブロックを符号化することは、第２のビューのデータに対するテクスチャ情報を表すビデオデータのブロックの少なくとも１つの少なくともある部分を予測することを含んでよく、第２のビューは第１のビューとは異なる。フレームのその部分の深度値を表す深度情報を符号化することはさらに、第１のビューのデータに対する深度値を表す深度情報の少なくともある部分を予測することを備える。深度スライスヘッダはさらに、深度マップビュー成分のための参照ピクチャリスト構築を表すシンタックス要素をシグナリングすることができる。

[0124]表１は、シーケンスパラメータセット（ＳＰＳ）ＭＶＣ拡張を示す。ビュー間参照は、ＳＰＳにおいてシグナリングされてよく、参照ピクチャリスト構築処理によって変更されてよく、このことは、インター予測またはビュー間予測の参照の柔軟な順序を可能にする。

[0125]シーケンスレベルにおけるインジケータは、深度ビュー成分が同じビュー中の対応するテクスチャビュー成分からどのように予測されるかを規定し得る。深度マップのためのシーケンスパラメータセットでは、以下のシンタックスがシグナリングされ得る。

[0126]テクスチャ情報を表すビデオデータの１つまたは複数のブロックはビュー間予測を使用して符号化されるが、フレームの対応する部分のための深度値はビュー内予測を使用して符号化される例では、ｎｕｍ＿ｒｅｆ＿ｉｄｘ＿ａｃｔｉｖｅ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇおよびｒｅｆ＿ｐｉｃ＿ｌｉｓｔ＿ｒｅｏｒｄｅｒｉｎｇが、深度マップビュー成分のためのスライスヘッダにおいてシグナリングされ得る。

[0127]表２は、深度スライスのためのスライスヘッダの例示的なシンタックステーブルを与える。シンタックス要素ｐｒｅ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃは、シンタックス要素が、次の方法で、テクスチャビュー成分のスライスヘッダと深度ビュー成分のスライスヘッダとの間で再使用されることを規定する。ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃを０に等しく設定することは、テクスチャビュー成分の任意のスライスヘッダと対応する深度ビュー成分との間に予測がないことを示す。深度マップビュー成分の対応するテクスチャビュー成分は、同じビュー内の同じ時間インスタンスにおけるテクスチャビュー成分を指すことに留意されたい。

[0128]ｐｒｅ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃを３に等しく設定することは、深度ビュー成分ＮＡＬユニットのピクチャパラメータセットとデルタＱＰとがスライスヘッダにおいてシグナリングされ、一方、深度ビュー成分ＮＡＬユニットの他のスライスレベルシンタックス要素が対応するテクスチャビュー成分のシンタックス要素と同一であるかそれから予測可能であることを示す。

[0129]ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃを２に等しく設定することは、深度ビュー成分ＮＡＬユニットのピクチャパラメータセットおよびデルタＱＰ、さらには、最初のＭＢまたはＣＵの位置が深度スライスヘッダにおいてシグナリングされ、一方、他のシンタックス要素が同じビューの同じ位置にあるテクスチャビュー成分の対応するシンタックス要素と同じであるかそれから予測可能であることを示す。

[0130]ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃを１に等しく設定することは、深度ビュー成分ＮＡＬユニットのピクチャパラメータセットおよびデルタＱＰ、最初のＭＢまたはＣＵの位置、ならびにｆｒａｍｅ＿ｎｕｍおよびＰＯＣの値がスライスヘッダにおいてシグナリングされ、一方、他のシンタックス要素が同じビューの同じ位置にあるテクスチャビュー成分の対応するシンタックス要素と同じであるかそれから予測可能であることを示す。一例では、ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃが３に等しい場合、ｆｉｒｓｔ＿ｍｂ＿ｉｎ＿ｓｌｉｃｅは、０に等しい値を有すると推測される。一方、ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃが３未満である場合、ｆｉｒｓｔ＿ｍｂ＿ｉｎ＿ｓｌｉｃｅの値は、表２において示されるように、明示的にシグナリングされ得る。

[0131]表２にも示されるように、ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃは、１未満の値を有し、エントロピースライスフラグおよびスライスタイプがシグナリングされる。エントロピースライスフラグは、対応するスライスがエントロピースライスかどうか、すなわち、他のスライスのコンテキストへの参照を伴わずにスライスがエントロピーコーディングされるかどうかを示す、値を有する。したがって、コンテキストモデルは、各エントロピースライスの開始時に初期化またはリセットされ得る。スライスタイプは、スライスのタイプ、たとえば、Ｉ、Ｐ、またはＢを示す。さらに、ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃが１未満の値を有する場合、スライスヘッダは、スライスのブロックが（たとえば、フィールドインターリービングコーディングのために）フィールドコーディングされるかどうかを示す。

[0132]表３は、深度ビュー成分に基づいて、ＨＥＶＣのためのスライスヘッダの１つの例示的な設計を与える。この例では、ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃが３に等しい場合、ｆｉｒｓｔ＿ｔｂ＿ｉｎ＿ｓｌｉｃｅは、０に等しい値を有すると推測されることに留意されたい。

[0133]表４は、深度スライスのスライスヘッダの例示的なシンタックステーブルである。表４は、深度ビュー成分のためのシンタックスの再使用をさらに示すための、深度スライスヘッダシンタックスの１つの例示的な設計を与える。この例では、シーケンスレベルにおけるインジケータは、深度ビュー成分が同じビュー中の対応するテクスチャビュー成分からどのように予測されるかを規定する。

[0134]深度マップのためのそのようなシーケンスパラメータセットでは、以下のシンタックスがシグナリングされ得る。

[0135]ｐｒｅ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃシンタックス要素は、テクスチャビュー成分のスライスヘッダと深度ビュー成分のスライスヘッダとの間でのシンタックス要素の再使用を規定する。たとえば、ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃを０に等しく設定することは、テクスチャビュー成分の任意のスライスヘッダと対応する深度ビュー成分との間に予測がないことを示す。ｐｒｅ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃを３に等しく設定することは、深度ビュー成分ＮＡＬユニットのピクチャパラメータセットとデルタＱＰとがスライスヘッダにおいてシグナリングされ、一方、深度ビュー成分ＮＡＬユニットの他のスライスレベルシンタックス要素が対応するテクスチャビュー成分のシンタックス要素と同一であるかそれから予測されることを示す。

[0136]ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃを２に等しく設定することは、深度ビュー成分ＮＡＬユニットのピクチャパラメータセットおよびデルタＱＰ、さらには、最初のＭＢまたはＣＵの位置がスライスヘッダにおいてシグナリングされ、一方、他のシンタックス要素が同じビューの同じ位置にあるテクスチャビュー成分の対応するシンタックス要素と同じであるかそれから予測されることを示す。ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃを１に等しく設定することは、深度ビュー成分ＮＡＬユニットのピクチャパラメータセットおよびデルタＱＰ、最初のＭＢまたはＣＵの位置、ならびにｆｒａｍｅ＿ｎｕｍおよびＰＯＣの値がスライスヘッダにおいてシグナリングされ、一方、他のシンタックス要素が同じビューの同じ位置にあるテクスチャビュー成分の対応するシンタックス要素と同じであるかそれから予測されることを示す。

[0137]シンタックスフラグｐｒｅｄ＿ｄｅｆａｕｌｔ＿ｓｙｎｔａｘ＿ｆｌａｇは、深度マップビュー成分のスライスヘッダのシンタックス要素が、同じ位置にあるテクスチャビュー成分のシンタックス要素から予測されるかどうかを示す。一例では、ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃが０に等しい場合、ｐｒｅｄ＿ｄｅｆａｕｌｔ＿ｓｙｎｔａｘ＿ｆｌａｇは０であると推測される。ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃが３に等しく、ｐｒｅｄ＿ｄｅｆａｕｌｔ＿ｓｙｎｔａｘ＿ｆｌａｇが１である場合、この例では、ｆｉｒｓｔ＿ｍｂ＿ｉｎ＿ｓｌｉｃｅは０に等しい。

[0138]表５は、深度ビュー成分に基づく、ＨＥＶＣのためのスライスヘッダの例示的なシンタックステーブルである。表５の例では、ｐｒｅｄ＿ｄｅｆａｕｌｔ＿ｓｙｎｔａｘ＿ｆｌａｇは、深度マップビュー成分のスライスヘッダのシンタックス要素が、同じ位置にあるテクスチャビュー成分のシンタックス要素から予測されるかどうかを示す。ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃが０に等しい場合、フラグｐｒｅｄ＿ｄｅｆａｕｌｔ＿ｓｙｎｔａｘ＿ｆｌａｇは０であると推測される。ｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃが３に等しく、ｐｒｅｄ＿ｄｅｆａｕｌｔ＿ｓｙｎｔａｘ＿ｆｌａｇが１である場合、この例では、ｆｉｒｓｔ＿ｔｂ＿ｉｎ＿ｓｌｉｃｅは０に等しい。

[0139]スライスヘッダ予測が可能である場合、スライスＡがスライスＢに基づき、スライスＡとＢのいずれかが深度スライスであり他方がテクスチャスライスであり、それらが同じ時間インスタンスのビューに属するのであれば、以下のこのうちの１つ、すなわち、スライスＢを含むピクチャ中のすべてのスライスが同じスライスヘッダを有すること、スライスＡ中の任意のＭＢがスライスＢ中に同じ位置にあるＭＢを有すること、または、スライスＡ中の任意のＭＢがスライスＢを含むピクチャのスライスＣ中に同じ位置にあるＭＢを有する場合、スライスＣはスライスＢと同じスライスヘッダを有さなければならない、のうちの１つが満たされるという、示唆があることに留意されたい。

[0140]あるいは、深度ビュー成分に対して、説明された技法の異なる実装形態は、次のようであってよい。表６は、スライスヘッダの深度への拡張の例を与える。

[0141]この例では、シンタックス要素ｓａｍｅＲｅｆＰｉｃＬｉｓｔは、ＳＰＳレベルまたはＰＰＳレベルから導出され、またはそれらのレベルにおいてシグナリングされる。たとえば、ＳＰＳにおいてシグナリングされるｄｉｓａｂｌｅ＿ｄｅｐｔｈ＿ｉｎｔｅｒ＿ｖｉｅｗ＿ｆｌａｇは、深度に対するビュー間予測が不可能であるかどうかを示す。

[0142]テクスチャビュー成分に対して、説明される技法の別の実装形態は、表７において示されるようなものであってよい。この例では、テクスチャビュー成分のためのテクスチャスライスヘッダのシンタックス要素は、深度ビュー成分のための深度スライスヘッダの相関するシンタックス要素から予測され得る。

[0143]同様に、この例では、シンタックス要素ｓａｍｅＲｅｆＰｉｃＬｉｓｔは、ＳＰＳレベルまたはＰＰＳレベルから導出され、またはそれらのレベルにおいてシグナリングされる。

[0144]あるいは、そのようなフラグは、表８に示されるように、スライスヘッダにおいて明示的にシグナリングされてよい。

[0145]シンタックス要素ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｐｒｅｄｉｃｔｉｏｎ＿ｆｌａｇは、テクスチャから深度への、または深度からテクスチャへのスライスヘッダ予測が可能であるかどうかを示す。すなわち、テクスチャスライスと深度スライスの少なくとも１つは、スライスヘッダ予測がテクスチャスライスヘッダから深度スライスヘッダへのものか、または深度スライスヘッダからテクスチャスライスヘッダへのものかを示す、シンタックス要素を備える。

[0146]あるいは、スライスレベルフラグまたは他のインジケータが、どの程度までスライス予測が適用されるかを規定する。これらのインジケータの例には、参照ピクチャリスト構築シンタックス要素が予測されるかどうか、ｓｌｉｃｅ＿ｑｐ＿ｄｅｌｔａが予測されるかどうか、および加重予測シンタックス要素が予測されるかどうかがある。

[0147]いくつかの例では、ループフィルタに関連するシンタックス要素が予測されるかどうかも示される。ループフィルタに関連するシンタックス要素が予測されない場合、それらのシンタックス要素が存在するかどうかを示すためのさらなるフラグが、深度スライスヘッダに含まれる。

[0148]あるいは、デブロッキングフィルタをシグナリングするために使用される別のフラグｄｅｂｌｏｃｋｉｎｇ＿ｐｒｅｄ＿ｆｌａｇが、デブロッキングフィルタパラメータに対して、ｐｒｅｄ＿ｄｅｆａｕｌｔ＿ｓｙｎｔａｘ＿ｆｌａｇまたはｐｒｅｄ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｃｏｌｏｃａｔｅｄ＿ｉｄｃの代わりに使用され得る。このフラグは、同じスライスヘッダまたはＰＰＳまたはＳＰＳにおいてシグナリングされる。表９は、深度ビュー成分に基づく、ＨＥＶＣのためのスライスヘッダの例示的なシンタックステーブルを示す。ＨＥＶＣの状況では、ＡＬＦがテクスチャビュー成分と深度ビュー成分の両方に対して使用されない場合を除き、深度ビュー成分のＡＬＦパラメータは、対応するテクスチャビュー成分のＡＬＦパラメータと同じであるとは考えられない。

[0149]図５は、本開示の技法による、図１のビデオデコーダ２８の例をさらに詳しく示すブロック図である。ビデオデコーダ２８は、本明細書では「コーダ」と呼ばれる、専用のビデオコンピュータデバイスまたは装置の一例である。図５に示されるように、ビデオデコーダ２８は、宛先デバイス１４のビデオデコーダ２８に対応する。しかしながら、他の例では、ビデオデコーダ２８は、異なるデバイスに対応する。さらなる例では、（たとえば、他のエンコーダ／デコーダ（コーデック）などの）他のユニットも、ビデオデコーダ２８と同様の技法を実行することができる。

[0150]ビデオデコーダ２８は、量子化された係数と予測シンタックス要素とを生成するために、受信されたビットストリームをエントロピー復号するエントロピー復号ユニット５２を含む。ビットストリームは、３Ｄビデオとシンタックス要素とをレンダリングするための、各ピクセル位置のためのテクスチャ成分と深度成分とを有するコーディングされたブロックを含む。予測シンタックス要素には、コーディングモード、１つまたは複数の動きベクトル、使用された補間技法を識別する情報、補間フィルタリングにおいて使用するための係数、および、予測ブロックの生成に関連する他の情報が含まれる。

[0151]予測シンタックス要素、たとえば係数は、予測処理ユニット５５に転送される。予測処理ユニット５５は、深度シンタックス予測モジュール６６を含む。固定フィルタの係数に対して、または互いに対して、係数をコーディングするために予測が使用される場合、予測処理ユニット５５は、実際の係数を定義するためにシンタックス要素を復号する。深度シンタックス予測モジュール６６は、テクスチャビュー成分のためのテクスチャシンタックス要素から、深度ビュー成分のための深度シンタックス要素を予測する。

[0152]量子化が予測シンタックス要素のいずれかに適用される場合、逆量子化ユニット５６は、そのような量子化を除去する。逆量子化ユニット５６は、符号化されたビットストリーム中のコーディングされたブロックの各ピクセル位置のための深度成分とテクスチャ成分とを別様に扱い得る。たとえば、深度成分がテクスチャ成分と別様に量子化された場合、逆量子化ユニット５６は、深度成分とテクスチャ成分とを別々に処理する。たとえば、フィルタ係数は、本開示に従って予測コーディングされ、量子化されてよく、この場合、逆量子化ユニット５６は、そのような係数を予測的に復号し、逆量子化するために、ビデオデコーダ２８によって使用される。

[0153]予測処理ユニット５５は、ビデオエンコーダ２２の予測処理ユニット３２に関して上で詳しく説明されたのとほとんど同じ方法で、メモリ６２に記憶された予測シンタックス要素と１つまたは複数の以前に復号されたブロックとに基づいて、予測データを生成する。具体的には、予測処理ユニット５５は、動き補償中に、本開示のマルチビュービデオプラス深度技法のうちの１つまたは複数を実行して、深度成分に加えてテクスチャ成分を組み込む予測ブロックを生成する。予測ブロック（ならびにコーディングされたブロック）は、深度成分とテクスチャ成分とでは異なる解像度を有し得る。たとえば、深度成分は１／４ピクセル精度を有するが、テクスチャ成分はフル整数ピクセル精度を有する。したがって、本開示の技法のうちの１つまたは複数は、予測ブロックを生成する際に、ビデオデコーダ２８によって使用される。いくつかの例では、予測処理ユニット５５は、本開示の補間および補間様フィルタリング技法のために使用されるフィルタを備える、動き補償ユニットを含み得る。動き補償コンポーネントは、説明を簡単かつ容易にするために図５には示されない。

[0154]逆量子化ユニット５６は、量子化された係数を逆量子化（inverse quantize）、すなわち、逆量子化（de-quantize）する。逆量子化処理は、Ｈ．２６４復号のために、または任意の他の復号規格のために定義された処理である。逆変換処理ユニット５８は、ピクセル領域における残差ブロックを生成するために、変換係数に逆変換、たとえば逆ＤＣＴまたは概念的に同様の逆変換処理を適用する。加算器６４は、残差ブロックを、予測処理ユニット５５によって生成された対応する予測ブロックと加算して、ビデオエンコーダ２２によって符号化された元のブロックの復元されたバージョンを形成する。必要に応じて、ブロッキネスアーティファクトを除去するために、デブロッキングフィルタも適用して、復号されたブロックをフィルタリングする。復号されたビデオブロックは次いで、メモリ６２に記憶され、メモリ６２は、その後の動き補償のための参照ブロックを与え、また、（図１のデバイス２８などの）ディスプレイデバイスを駆動するために復号されたビデオを生成する。

[0155]復号されたビデオは、３Ｄビデオをレンダリングするために使用され得る。３Ｄビデオは、３次元仮想ビューを備え得る。ブロック中の各ピクセルについての水平オフセット（水平視差）を決定するために、深度情報が使用される。オクルージョン処理も、仮想ビューを生成するために実行され得る。深度ビュー成分のためのシンタックス要素は、テクスチャビュー成分のためのシンタックス要素から予測され得る。

[0156]図６は、本開示の技法による、ビデオデコーダの例示的な動作を示す流れ図である。図６の処理は、図４の符号化処理とは逆の復号処理と考えられ得る。図６は、図５のビデオデコーダ２８の観点から説明されるが、他のデバイスでも同様の技法を実行し得る。

[0157]ビデオデコーダ２８のようなビデオデコーダは、ビデオデータのフレームの少なくともある部分のテクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信し、テクスチャスライスが、符号化された１つまたは複数のブロックと、テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備える（１２２）。ビデオデコーダは、テクスチャビュー成分に対応する深度ビュー成分のための深度スライスを受信し、深度スライスは、符号化された深度情報と、深度スライスとテクスチャスライスに共通のシンタックス要素の値を除く、深度スライスの特性を表す少なくとも１つのシンタックス要素を備える深度スライスヘッダとを備える（１２４）。ビデオデコーダは、深度スライスとテクスチャスライスに共通のシンタックス要素の値から、深度スライスとテクスチャスライスの少なくとも１つのシンタックス要素を予測する（１２６）。

[0158]他の例では、少なくとも１つの深度シンタックス要素が、深度ビュー成分のスライスヘッダにおいて決定されシグナリングされる。少なくとも１つの深度シンタックス要素は、ピクチャパラメータセットの識別子、スライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分、コーディングされるブロックユニットの開始位置、参照ピクチャの順序、および、深度ビュー成分の現在のピクチャの表示順序のうちの少なくとも１つを含む。コーディングされるブロックユニットの開始位置は、コーディングされるブロックの開始位置が、テクスチャスライスヘッダまたは深度スライスヘッダにおいてシグナリングされない場合、０であると決定される。少なくとも１つのテクスチャビュー成分のためのループフィルタパラメータがシグナリングされてよく、深度ビュー成分のために使用されるループフィルタパラメータを示すフラグセットは、少なくとも１つのテクスチャビュー成分のためのループフィルタパラメータと同じである。

[0159]別の例では、ビデオデコーダ２８は、ビュー間予測技法を使用してテクスチャビュー成分を予測し、ビュー内予測技法を使用して深度ビュー成分を予測する。ビデオデコーダ２８は、深度ビュー成分のための参照ピクチャリスト構築を表すシンタックス要素をさらに備える深度スライスヘッダを受信する。テクスチャビュー成分および深度ビュー成分が第１のビューに対応する例では、テクスチャビュー成分を復号することは、第２のビューのデータに対して、テクスチャビュー成分の少なくともある部分を予測することを含む。第２のビューは、第１のビューとは異なる。いくつかの例では、深度ビュー成分を復号することは、第１のビューのデータに対して、深度ビュー成分の少なくともある部分を予測することを含み得る。

[0160]１つまたは複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、１つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を支援する任意の媒体を含む、データ記憶媒体または通信媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は一般に、（１）非一時的である有形コンピュータ可読記憶媒体、あるいは（２）信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明された技法の実装のための命令、コードおよび／またはデータ構造を取り出すために１つまたは複数のコンピュータあるいは１つまたは複数のプロセッサによってアクセスされ得る、任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含み得る。

[0161]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは、命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用されコンピュータによってアクセスされ得る、任意の他の媒体を備え得る。同様に、いかなる接続も適切にコンピュータ可読媒体と呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まないが、代わりに非一時的な有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザディスク（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびブルーレイディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。

[0162]命令は、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）などの１つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、あるいは他の等価な集積回路またはディスクリート論理回路によって実行され得る。したがって、本明細書で使用される「プロセッサ」という用語は、前述の構造のいずれか、または本明細書で説明される技法の実装に適切な任意の他の構造を指し得る。加えて、いくつかの態様では、本明細書で説明された機能は、符号化および復号のために構成された専用のハードウェアおよび／またはソフトウェアモジュール内で与えられてよく、あるいは複合コーデックに組み込まれてよい。また、本技法は、１つまたは複数の回路または論理要素中で完全に実装され得る。

[0163]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）、またはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示される技法を実行するように構成されたデバイスの機能的態様を強調するために、様々なコンポーネント、モジュール、またはユニットが説明されたが、それらのコンポーネント、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要はない。むしろ、上で説明されたように、様々なユニットが、適切なソフトウェアおよび／またはファームウェアとともに、上で説明された１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられてよく、または相互動作可能なハードウェアユニットの集合によって与えられてよい。

[0164]本開示の様々な例が説明された。これらおよび他の例は、以下の特許請求の範囲内に入る。

[0164]本開示の様々な例が説明された。これらおよび他の例は、以下の特許請求の範囲内に入る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［１］ビデオデータを処理する方法であって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを復号することと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスの前記スライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスをコーディングした後で前記第２のスライスを復号することと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、方法。
［２］前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、［１］に記載の方法。
［３］前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、［１］に記載の方法。
［４］前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、［１］に記載の方法。
［５］前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、［１］に記載の方法。
［６］前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、［１］に記載の方法。
［７］前記第１のスライスは前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記方法は、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定することをさらに備える、［１］に記載の方法。
［８］前記第２のスライスの前記スライスヘッダは、前記第２のスライスのための、デブロッキングフィルタパラメータに関連するシンタックス要素と、適応ループフィルタリングパラメータに関連するシンタックス要素とのうちの少なくとも１つを備える、［１］に記載の方法。
［９］どのシンタックス要素がシーケンスパラメータセット中の前記第２のスライスの前記スライスヘッダにおいて明示的にシグナリングされるかということの指示をシグナリングすることをさらに備える、［１］に記載の方法。
［１０］データを復号するためのデバイスであって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを復号することと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスの前記スライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスを復号した後で前記第２のスライスを復号することと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、
を行うように構成されるビデオデコーダを備えるデバイス。
［１１］前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、［１０］に記載のデバイス。
［１２］前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、［１０］に記載のデバイス。
［１３］前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、［１０］に記載のデバイス。
［１４］前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、［１０］に記載のデバイス。
［１５］前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、［１０］に記載のデバイス。
［１６］前記第１のスライスは前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記ビデオデコーダは、さらに、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定するように構成される、［１０］に記載のデバイス。
［１７］前記第２のスライスの前記スライスヘッダは、前記第２のスライスのための、デブロッキングフィルタパラメータに関連するシンタックス要素と、適応ループフィルタリングパラメータに関連するシンタックス要素の少なくとも１つを備える、［１０］に記載のデバイス。
［１８］前記ビデオコーダは、さらに、どのシンタックス要素がシーケンスパラメータセット中の前記第２のスライスの前記スライスヘッダにおいて明示的にシグナリングされるかということの指示をシグナリングするように構成される、［１０］に記載のデバイス。
［１９］命令を記憶したコンピュータ可読記憶媒体を備えるコンピュータプログラム製品であって、前記命令は、実行されると、ビデオ復号デバイスのプロセッサに、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを復号することと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスのスライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスを復号した後で前記第２のスライスを復号することと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、
を行わせるコンピュータプログラム製品。
［２０］前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、［１９］に記載のコンピュータ可読記憶媒体。
［２１］前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、［１９］に記載のコンピュータ可読記憶媒体。
［２２］前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、［１９］に記載のコンピュータ可読記憶媒体。
［２３］前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、［１９］に記載のコンピュータ可読記憶媒体。
［２４］前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、［１９］に記載のコンピュータ可読記憶媒体。
［２５］前記第１のスライスは前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記命令はさらに、ビデオ復号デバイスのプロセッサに、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定させる、［１９］に記載のコンピュータ可読記憶媒体。
［２６］ビデオデータを処理するためのデバイスであって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信する手段と、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信する手段と、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを復号する手段と、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスの前記スライスヘッダから、第２のスライスのための共通のシンタックス要素を決定する手段と、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスをコーディングした後で前記第２のスライスを復号する手段と、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、デバイス。
［２７］前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、［２６］に記載のデバイス。
［２８］ビデオデータを符号化する方法であって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを符号化することと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスの前記スライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスを符号化した後で前記第２のスライスを符号化することと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、
を備える方法。
［２９］前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、［２８］に記載の方法。
［３０］前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、［２８］に記載の方法。
［３１］前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、［２８］に記載の方法。
［３２］前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、［２８］に記載の方法。
［３３］前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、［２８］に記載の方法。
［３４］前記第１のスライスは前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記方法は、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定することをさらに備える、［２８］に記載の方法。
［３５］前記第２のスライスの前記スライスヘッダは、前記第２のスライスのための、デブロッキングフィルタパラメータに関連するシンタックス要素と、適応ループフィルタリングパラメータに関連するシンタックス要素の少なくとも１つを備える、［２８］に記載の方法。
［３６］どのシンタックス要素がシーケンスパラメータセット中の前記第２のスライスの前記スライスヘッダにおいて明示的にシグナリングされるかということの指示をシグナリングすることをさらに備える、［２８］に記載の方法。
［３７］データを符号化するためのデバイスであって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを符号化することと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスの前記スライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスを符号化した後で前記第２のスライスを符号化することと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、
を行うように構成されるビデオエンコーダを備える、デバイス。
［３８］前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、［３７］に記載のデバイス。
［３９］前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、［３７］に記載のデバイス。
［４０］前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、［３７］に記載のデバイス。
［４１］前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、［３７］に記載のデバイス。
［４２］前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、［３７］に記載のデバイス。
［４３］前記第１のスライスは前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記ビデオエンコーダは、さらに、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定するように構成される、［３７］に記載のデバイス。
［４４］前記第２のスライスの前記スライスヘッダは、前記第２のスライスのための、デブロッキングフィルタパラメータに関連するシンタックス要素と、適応ループフィルタリングパラメータに関連するシンタックス要素の少なくとも１つを備える、［３７］に記載のデバイス。
［４５］前記ビデオエンコーダは、さらに、
どのシンタックス要素がシーケンスパラメータセット中の前記第２のスライスの前記スライスヘッダにおいて明示的にシグナリングされるかということの指示をシグナリングするように構成される、［３７］に記載のデバイス。
［４６］命令を記憶したコンピュータ可読記憶媒体を備えるコンピュータプログラム製品であって、前記命令は、実行されると、ビデオ符号化デバイスのプロセッサに、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスをコーディングすることと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスのスライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスをコーディングした後で前記第２のスライスをコーディングすることと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、
を行わせるコンピュータプログラム製品。
［４７］前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、［４６］に記載のコンピュータ可読記憶媒体。
［４８］前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、［４６］に記載のコンピュータ可読記憶媒体。
［４９］前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、［４６］に記載のコンピュータ可読記憶媒体。
［５０］前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、［４６］に記載のコンピュータ可読記憶媒体。
［５１］前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、［４６］に記載のコンピュータ可読記憶媒体。
［５２］前記第１のスライスが前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記命令は、さらに、ビデオ符号化デバイスのプロセッサに、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定させる、［４６］に記載のコンピュータ可読記憶媒体。
［５３］ビデオデータを処理するためのデバイスであって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信する手段と、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信する手段と、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方が、ビューとアクセスユニットとに属し、
第１のスライスを符号化する手段と、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスのスライスヘッダから、第２のスライスのための共通のシンタックス要素を決定する手段と、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスを符号化した後で前記第２のスライスを符号化する手段と、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を繰り返すことなく、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、デバイス。
［５４］前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、［５３］に記載のデバイス。

Claims

ビデオデータを処理する方法であって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを復号することと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスの前記スライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスをコーディングした後で前記第２のスライスを復号することと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、方法。
前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項１に記載の方法。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項１に記載の方法。
前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項１に記載の方法。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、請求項１に記載の方法。
前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、請求項１に記載の方法。
前記第１のスライスは前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記方法は、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定することをさらに備える、請求項１に記載の方法。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスのための、デブロッキングフィルタパラメータに関連するシンタックス要素と、適応ループフィルタリングパラメータに関連するシンタックス要素とのうちの少なくとも１つを備える、請求項１に記載の方法。
どのシンタックス要素がシーケンスパラメータセット中の前記第２のスライスの前記スライスヘッダにおいて明示的にシグナリングされるかということの指示をシグナリングすることをさらに備える、請求項１に記載の方法。
データを復号するためのデバイスであって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを復号することと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスの前記スライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスを復号した後で前記第２のスライスを復号することと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、
を行うように構成されるビデオデコーダを備えるデバイス。
前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項１０に記載のデバイス。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項１０に記載のデバイス。
前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項１０に記載のデバイス。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、請求項１０に記載のデバイス。
前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、請求項１０に記載のデバイス。
前記第１のスライスは前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記ビデオデコーダは、さらに、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定するように構成される、請求項１０に記載のデバイス。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスのための、デブロッキングフィルタパラメータに関連するシンタックス要素と、適応ループフィルタリングパラメータに関連するシンタックス要素の少なくとも１つを備える、請求項１０に記載のデバイス。
前記ビデオコーダは、さらに、どのシンタックス要素がシーケンスパラメータセット中の前記第２のスライスの前記スライスヘッダにおいて明示的にシグナリングされるかということの指示をシグナリングするように構成される、請求項１０に記載のデバイス。
命令を記憶したコンピュータ可読記憶媒体を備えるコンピュータプログラム製品であって、前記命令は、実行されると、ビデオ復号デバイスのプロセッサに、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを復号することと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスのスライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスを復号した後で前記第２のスライスを復号することと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、
を行わせるコンピュータプログラム製品。
前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項１９に記載のコンピュータ可読記憶媒体。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項１９に記載のコンピュータ可読記憶媒体。
前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項１９に記載のコンピュータ可読記憶媒体。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、請求項１９に記載のコンピュータ可読記憶媒体。
前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、請求項１９に記載のコンピュータ可読記憶媒体。
前記第１のスライスは前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記命令はさらに、ビデオ復号デバイスのプロセッサに、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定させる、請求項１９に記載のコンピュータ可読記憶媒体。
ビデオデータを処理するためのデバイスであって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信する手段と、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信する手段と、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを復号する手段と、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスの前記スライスヘッダから、第２のスライスのための共通のシンタックス要素を決定する手段と、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスをコーディングした後で前記第２のスライスを復号する手段と、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、デバイス。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項２６に記載のデバイス。
ビデオデータを符号化する方法であって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを符号化することと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスの前記スライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスを符号化した後で前記第２のスライスを符号化することと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、
を備える方法。
前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項２８に記載の方法。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項２８に記載の方法。
前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項２８に記載の方法。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、請求項２８に記載の方法。
前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、請求項２８に記載の方法。
前記第１のスライスは前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記方法は、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定することをさらに備える、請求項２８に記載の方法。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスのための、デブロッキングフィルタパラメータに関連するシンタックス要素と、適応ループフィルタリングパラメータに関連するシンタックス要素の少なくとも１つを備える、請求項２８に記載の方法。
どのシンタックス要素がシーケンスパラメータセット中の前記第２のスライスの前記スライスヘッダにおいて明示的にシグナリングされるかということの指示をシグナリングすることをさらに備える、請求項２８に記載の方法。
データを符号化するためのデバイスであって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスを符号化することと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスの前記スライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスを符号化した後で前記第２のスライスを符号化することと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、
を行うように構成されるビデオエンコーダを備える、デバイス。
前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項３７に記載のデバイス。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項３７に記載のデバイス。
前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項３７に記載のデバイス。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、請求項３７に記載のデバイス。
前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、請求項３７に記載のデバイス。
前記第１のスライスは前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記ビデオエンコーダは、さらに、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定するように構成される、請求項３７に記載のデバイス。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスのための、デブロッキングフィルタパラメータに関連するシンタックス要素と、適応ループフィルタリングパラメータに関連するシンタックス要素の少なくとも１つを備える、請求項３７に記載のデバイス。
前記ビデオエンコーダは、さらに、
どのシンタックス要素がシーケンスパラメータセット中の前記第２のスライスの前記スライスヘッダにおいて明示的にシグナリングされるかということの指示をシグナリングするように構成される、請求項３７に記載のデバイス。
命令を記憶したコンピュータ可読記憶媒体を備えるコンピュータプログラム製品であって、前記命令は、実行されると、ビデオ符号化デバイスのプロセッサに、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信することと、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信することと、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方は、１つのビューと１つのアクセスユニットとに属し、
第１のスライスをコーディングすることと、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスのスライスヘッダから、第２のスライスのための共通のシンタックス要素を決定することと、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスをコーディングした後で前記第２のスライスをコーディングすることと、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を除く、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、
を行わせるコンピュータプログラム製品。
前記第２のスライスの前記スライスヘッダは、参照しているピクチャパラメータセットの識別情報の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項４６に記載のコンピュータ可読記憶媒体。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項４６に記載のコンピュータ可読記憶媒体。
前記第２のスライスの前記スライスヘッダは、前記コーディングされたブロックの開始位置の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項４６に記載のコンピュータ可読記憶媒体。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスのフレーム番号と、ピクチャ順序カウントのうちの少なくとも１つを備える、請求項４６に記載のコンピュータ可読記憶媒体。
前記第２のスライスの前記スライスヘッダは、参照ピクチャリスト構築に関連するシンタックス要素、各リストに対するアクティブな参照フレームの数、参照ピクチャリスト修正シンタックステーブル、および予測重みテーブルのうちの少なくとも１つを備える、請求項４６に記載のコンピュータ可読記憶媒体。
前記第１のスライスが前記テクスチャスライスを備え、前記第２のスライスは前記深度スライスを備え、前記命令は、さらに、ビデオ符号化デバイスのプロセッサに、
前記深度ビュー成分の開始位置が前記テクスチャスライスヘッダまたは前記深度スライスヘッダにおいてシグナリングされない場合、前記深度スライスの開始位置を０であると決定させる、請求項４６に記載のコンピュータ可読記憶媒体。
ビデオデータを処理するためのデバイスであって、
テクスチャ情報を表すビデオデータの１つまたは複数のコーディングされたブロックと関連付けられるテクスチャビュー成分のテクスチャスライスを受信する手段と、前記テクスチャスライスは、前記符号化された１つまたは複数のブロックと、前記テクスチャスライスの特性を表すシンタックス要素を備えるテクスチャスライスヘッダとを備え、
前記テクスチャビュー成分に対応する深度情報の１つまたは複数のコーディングされたブロックと関連付けられる深度ビュー成分の深度スライスを受信する手段と、前記深度スライスは、深度情報の前記１つまたは複数のコーディングされたブロックと、前記深度スライスの特性を表すシンタックス要素を備える深度スライスヘッダとを備え、前記深度ビュー成分と前記テクスチャビュー成分の両方が、ビューとアクセスユニットとに属し、
第１のスライスを符号化する手段と、前記第１のスライスは、前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第１のスライスは、前記第１のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有し、
前記第１のスライスのスライスヘッダから、第２のスライスのための共通のシンタックス要素を決定する手段と、
前記決定された共通のシンタックス要素に少なくとも部分的に基づいて、前記第１のスライスを符号化した後で前記第２のスライスを符号化する手段と、前記第２のスライスは、前記第１のスライスではない前記テクスチャスライスと前記深度スライスのうちの１つを備え、前記第２のスライスは、前記第１のスライスに共通のシンタックス要素の値を繰り返すことなく、前記第２のスライスの特性を表すシンタックス要素を備えるスライスヘッダを有する、デバイス。
前記第２のスライスの前記スライスヘッダは、前記第２のスライスの量子化パラメータとピクチャパラメータセット中でシグナリングされる量子化パラメータとの間の量子化パラメータ差分の、少なくとも１つのシグナリングされるシンタックス要素を備える、請求項５３に記載のデバイス。