JP2015526973A

JP2015526973A - Ｈｅｖｃおよび拡張のためのビデオパラメータセット

Info

Publication number: JP2015526973A
Application number: JP2015520661A
Authority: JP
Inventors: チェン、イン; ワン、イェ−クイ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2012-07-02
Filing date: 2013-07-02
Publication date: 2015-09-10
Anticipated expiration: 2033-07-02
Also published as: TW201412128A; JP6775952B2; KR101799165B1; BR122017006773B1; PH12014502783A1; MY168860A; IL236071B; CA2877658A1; WO2014008290A1; KR102006531B1; AU2013286730A1; US20140003492A1; US20140003491A1; IL236071A0; SG11201408118YA; TW201415895A; BR122017006773A2; AU2013286730B2; JP6400660B2; JP6416086B2

Abstract

ビデオコーダが、ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信することと、ビデオデータ中で、ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信することと、ビデオデータ中で、ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信することと、１つまたは複数のシンタックス要素に基づいて、第１のパラメータセットに関連するビデオブロックの第１のセットと、第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることとを行うように構成され得る。

Description

[0001]本出願は、その各々の内容全体が参照により本明細書に組み込まれる、
２０１２年７月２日に出願された米国仮出願第６１／６６７，３８７号、
２０１２年７月９日に出願された米国仮出願第６１／６６９，５８７号、および
２０１３年３月１５日に出願された米国仮出願第６１／７９８，１３５号
に関する。

[0002]本開示は、ビデオデータの処理に関し、より詳細には、本開示では、ビデオデータのパラメータセットを生成し、処理することに関係する技法について説明する。

[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４、Ｐａｒｔ１０、アドバンストビデオコーディング（ＡＶＣ：Advanced Video Coding）、現在開発中の高効率ビデオコーディング（ＨＥＶＣ：High Efficiency Video Coding）規格によって定義された規格、およびそのような規格の拡張に記載されているビデオ圧縮技法などのビデオ圧縮技法を実装する。ビデオデバイスは、そのようなビデオ圧縮技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶し得る。

[0004]ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するために空間的（イントラピクチャ）予測および／または時間的（インターピクチャ）予測を実行する。ブロックベースのビデオコーディングでは、ビデオスライス（すなわち、ビデオフレームまたはビデオフレームの一部分）はビデオブロックに区分され得、これらのビデオブロックは、ツリーブロック、コーディングユニット（ＣＵ）および／またはコーディングノードと呼ばれることもある。ピクチャのイントラコード化（Ｉ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化（ＰまたはＢ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。

[0005]空間的予測または時間的予測は、コーディングされるべきブロックの予測ブロックを生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコード化ブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化ブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて、残差変換係数が得られ得、その残差変換係数は、次いで量子化され得る。量子化変換係数は、最初は２次元アレイで構成され、変換係数の１次元ベクトルを生成するために走査され得、なお一層の圧縮を達成するために、エントロピーコーディングが適用され得る。

[0006]本開示では、ビデオコーディングにおけるパラメータセットの設計技法について説明し、より詳細には、本開示では、ビデオパラメータセット（ＶＰＳ：video parameter set）に関係する技法について説明する。

[0007]一例では、ビデオデータを復号する方法は、ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ：hypothetical reference decoder）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信することと、ビデオデータ中で、ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信することと、ビデオデータ中で、ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信することと、１つまたは複数のシンタックス要素に基づいて、第１のパラメータセットに関連するビデオブロックの第１のセットと、第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることとを含む。

[0008]別の例では、ビデオデータを符号化する方法は、ビデオパラメータセット中に含めるために、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を生成することと、ビデオデータ中に含めるために、ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを生成することと、ビデオデータ中に含めるために、ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを生成することと、１つまたは複数のシンタックス要素に基づいて、第１のパラメータセットに関連するビデオブロックの第１のセットと、第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることとを含む。

[0009]別の例では、ビデオデータを処理するためのデバイスは、ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信することと、ビデオデータ中で、ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信することと、ビデオデータ中で、ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信することと、１つまたは複数のシンタックス要素に基づいて、第１のパラメータセットに関連するビデオブロックの第１のセットと、第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることとを行うように構成されたビデオデコーダを含む。

[0010]別の例では、ビデオデータを処理するためのデバイスは、ビデオパラメータセット中に含めるために、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を生成することと、ビデオデータ中に含めるために、ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを生成することと、ビデオデータ中に含めるために、ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを生成することと、１つまたは複数のシンタックス要素に基づいて、第１のパラメータセットに関連するビデオブロックの第１のセットと、第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることとを行うように構成されたビデオエンコーダを含む。

[0011]別の例では、ビデオデータを処理するためのデバイスは、ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信するための手段と、ビデオデータ中で、ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信するための手段と、ビデオデータ中で、ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信するための手段と、１つまたは複数のシンタックス要素に基づいて、第１のパラメータセットに関連するビデオブロックの第１のセットと、第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングするための手段とを含む。

[0012]別の例では、１つまたは複数のプロセッサによって実行されたとき、その１つまたは複数のプロセッサに、ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信することと、ビデオデータ中で、ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信することと、ビデオデータ中で、ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信することと、１つまたは複数のシンタックス要素に基づいて、第１のパラメータセットに関連するビデオブロックの第１のセットと、第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることとを行わせる命令を記憶したコンピュータ可読記憶媒体。

[0013]１つまたは複数の例の詳細を添付の図面および以下の説明に記載する。他の特徴、目的、および利点は、その説明および図面、ならびに特許請求の範囲から明らかになろう。

[0014]本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0015]例示的なＭＶＣ復号順序を示す概念図。 [0016]例示的なＭＶＣの時間的予測およびビュー間予測構造を示す概念図。 [0017]本開示で説明する技法を実装し得る例示的なビデオエンコーダを示すブロック図。 [0018]本開示で説明する技法を実装し得る例示的なビデオデコーダを示すブロック図。 [0019]ネットワークの一部を形成するデバイスの例示的なセットを示すブロック図。 [0020]本開示の技法による、パラメータセットを処理するための例示的な方法を示すフローチャート。 [0021]本開示の技法による、パラメータセットを生成するための例示的な方法を示すフローチャート。 [0022]本開示の技法による、パラメータセットを復号するための例示的な方法を示すフローチャート。 [0023]本開示の技法による、パラメータセットを処理するための例示的な方法を示すフローチャート。 [0024]本開示の技法による、パラメータセットを生成するための例示的な方法を示すフローチャート。 [0025]本開示の技法による、パラメータセットを処理するための例示的な方法を示すフローチャート。 [0026]本開示の技法による、パラメータセットを生成するための例示的な方法を示すフローチャート。

[0027]本開示では、ビデオコーディングにおけるパラメータセットの設計技法について説明し、より詳細には、本開示では、ビデオパラメータセット（ＶＰＳ）に関係する技法について説明する。ＶＰＳに加えて、パラメータセットの他の例としては、いくつかの例を挙げれば、シーケンスパラメータセット（ＳＰＳ：sequence parameter set）、ピクチャパラメータセット（ＰＰＳ：picture parameter set）、および適応パラメータセット（ＡＰＳ：adaptation parameter set）がある。

[0028]ビデオエンコーダはビデオデータを符号化する。ビデオデータは１つまたは複数のピクチャを含み得、それらのピクチャの各々はビデオの一部を形成する静止画像である。ビデオエンコーダがビデオデータを符号化するとき、ビデオエンコーダは、ビデオデータのコード化表現を形成するビットのシーケンスを含むビットストリームを生成する。ビットストリームはコード化ピクチャおよび関連するデータを含み得、ここで、コード化ピクチャはピクチャのコード化表現を指す。関連するデータは、ＶＰＳ、ＳＰＳ、ＰＰＳ、およびＡＰＳを含む様々なタイプのパラメータセット、ならびに潜在的に他のシンタックス構造を含み得る。ＳＰＳは、全ビデオシーケンスに対して有効であるデータを搬送するために使用されるが、ＰＰＳは、ピクチャごとに有効な情報を搬送する。ＡＰＳは、同じくピクチャごとに有効であるピクチャ適応情報を搬送するが、ＰＰＳ中の情報よりも頻繁に変化することが予想される。

[0029]ＨＥＶＣもＶＰＳを導入しており、ＨＥＶＣワーキングドラフトはＶＰＳについて次のように述べている。

ビデオパラメータセット（ＶＰＳ）：各スライスセグメントヘッダ中で見つけられるｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄシンタックス要素によって参照されるピクチャパラメータセット中で見つけられる、ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄシンタックス要素によって参照されるシーケンスパラメータセット中で見つけられるｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄシンタックス要素のコンテンツによって判断される、０個以上のコード化ビデオシーケンス全体に適用されるシンタックス要素を含んでいるシンタックス構造。

[0030]このようにして、ＶＰＳはコード化ビデオシーケンス全体に適用されるので、ＶＰＳは頻度に変化しないシンタックス要素を含む。ＨＥＶＣのいくつかのバージョンにおけるＶＰＳ、ＳＰＳ、ＰＰＳ、およびＡＰＳ機構は、頻度に変化しない情報の送信をコード化ビデオブロックデータの送信から分離する。ＶＰＳ、ＳＰＳ、ＰＰＳ、およびＡＰＳは、いくつかの適用例では、「アウトオブバンド（out-of-band）」で搬送され得、すなわち、コード化ビデオデータを含んでいるユニットとともにトランスポートされないことがある。アウトオブバンド送信は、一般に信頼でき、インバンド送信に対して信頼性の改善のために望ましいことがある。ＨＥＶＣＷＤ７では、ＶＰＳ、ＳＰＳ、ＰＰＳ、またはＡＰＳの識別子（ＩＤ）はパラメータセットごとにコーディングされ得る。各ＳＰＳはＳＰＳＩＤとＶＰＳＩＤとを含み、各ＰＰＳはＰＰＳＩＤとＳＰＳＩＤとを含み、各スライスヘッダは、ＰＰＳＩＤと、場合によってはＡＰＳＩＤとを含む。このようにして、ＩＤは、異なる事例において使用されるべき適切なパラメータセットを識別するために使用され得る。

[0031]上記で紹介したように、ビデオエンコーダは一般にビデオデータを符号化し、デコーダは一般にビデオデータを復号する。しかしながら、エンコーダおよびデコーダは、ビデオデータを処理するために使用される唯一のデバイスではない。たとえば、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部としてビデオがトランスポートされるとき、ルーティングデバイスおよび他のそのようなデバイスは、ビデオデータをソースから宛先デバイスに送出するためにビデオデータを処理し得る。メディアアウェアネットワーク要素（ＭＡＮＥ）と呼ばれることがある、特殊なルーティングデバイスは、ビデオデータのコンテンツに基づいて様々なルーティング機能を実行し得る。ビデオデータのコンテンツを判断し、これらのルーティング機能を実行するために、ＭＡＮＥは、ＶＰＳまたはＳＰＳ中の情報など、符号化ビットストリーム中の情報にアクセスし得る。

[0032]パラメータセットにおいて、いくつかのシンタックス要素は固定ビット数を使用してコーディングされるが、いくつかのシンタックス要素は可変ビット数を使用してコーディングされる。可変長のシンタックス要素を処理するために、デバイスはエントロピー復号機能を必要とし得る。しかしながら、エントロピー復号を実行することは、ＭＡＮＥまたは他のネットワーク要素のために望ましくない複雑さレベルを導入し得る。本開示で紹介する一技法によれば、ネットワーク要素がエントロピー復号を用いないで復号され得るシンタックス要素を識別するのを助けるために、ＶＰＳなどのパラメータセット中にオフセットシンタックス要素が含まれ得る。オフセットシンタックス要素は、固定長シンタックス要素によって先行され得る。オフセットシンタックス要素は、その場合、可変長シンタックス要素を使用してコーディングされるべきであるパラメータセット中のシンタックス要素を識別し得る。オフセットシンタックス要素を使用して、ＭＡＮＥなどのデバイスは、可変の長さのコード化シンタックス要素をスキップし、固定長シンタックス要素を処理するのを再開し得る。オフセットシンタックス要素は、スキップされるべきであるパラメータセット内のバイト数を識別することによって、スキップされるべきシンタックス要素を識別し得る。これらのスキップされるバイトは、スキップされるシンタックス要素に対応し得る。上述のように、スキップされるシンタックス要素は可変長コード化シンタックス要素を含み得、また、固定長コード化シンタックス要素を含み得る。

[0033]このコンテキストでは、シンタックス要素をスキップすることは、ＭＡＮＥが、可変長でコーディングされるシンタックス要素のパースまたは他の処理を回避し得ることを意味する。したがって、ＭＡＮＥは、本来ならエントロピー復号を必要とし得るいくつかのシンタックス要素をスキップしながら、エントロピー復号を実行する必要なしにＶＰＳ中のいくつかのシンタックス要素（たとえば、固定長要素）を処理することができる。様々な例ではいくつかの固定長シンタックス要素もスキップされ得るので、ＭＡＮＥによってスキップされるシンタックス要素は可変長シンタックス要素に限定されない。ビデオデコーダは、オフセットシンタックス要素を受信すると、シンタックス要素のうちの１つまたは複数を本質的に無視するように構成され得、これは、ビデオデコーダが、ＭＡＮＥによってスキップされたシンタックス要素をパースおよび処理するのを回避し得ることを意味する。

[0034]オフセットシンタックス要素の使用により、たとえば、ＭＡＮＥがエントロピー復号を実行する必要をなくすことによって、ＭＡＮＥがパラメータセットの部分を処理するために必要とされる複雑さが低減され得る。さらに、オフセットシンタックス要素の使用により、本開示で提案するように、パラメータセットのための階層フォーマットの使用が可能になり得る。階層フォーマットの一例として、ＶＰＳにおいて、ベースレイヤとエンハンスメントレイヤとのためのシンタックス要素をＶＰＳ内で相互混合させる代わりに、ベースレイヤのすべてのまたは実質的にすべてのシンタックス要素は、第１のエンハンスメントレイヤのすべてのまたは実質的にすべてのシンタックス要素に先行し得、それらのシンタックス要素は、今度は、第２のエンハンスメントレイヤのためのすべてのまたは実質的にすべてのシンタックス要素に先行し得、以下同様である。本開示で紹介するオフセットシンタックス要素を使用して、ＭＡＮＥは、ベースレイヤのためのいくつかの固定長シンタックス要素を処理し、ベースレイヤのためのいくつかの可変長シンタックス要素をスキップし、第１のエンハンスメントレイヤのためのいくつかの固定長シンタックス要素を処理し、第１のエンハンスメントレイヤのためのいくつかの可変長シンタックス要素をスキップし、第２のエンハンスメントレイヤのためのいくつかの固定長シンタックス要素を処理し得、以下同様である。ビデオデコーダは、ＭＡＮＥによってスキップされたシンタックス要素をパースし、処理するように構成され得る。

[0035]オフセットシンタックス要素の使用により、さらに、ビデオコーディング規格への将来の拡張が可能になり得る。たとえば、（たとえば、ＨＥＶＣへの将来の拡張に従って）他のタイプの可変長コード化情報がビットストリームに追加された場合でも、そのような可変長要素のスキップを可能にするために１つまたは複数のオフセットシンタックス要素が定義され得る。言い換えれば、１つまたは複数のオフセットシンタックス要素は、ビットストリーム内の固定長シンタックス要素のロケーションを識別するために使用され得、オフセットシンタックス要素は、たとえば、ＭＡＮＥによって、復号が回避され得るビットストリーム中の他の要素の追加を考慮するように変更され得る。

[0036]本開示は、さらに、ＳＰＳなどの別のパラメータセット中にとは対照的に、ビデオパラメータセット中にセッションネゴシエーションに関係するシンタックス要素を含めることを提案する。ＶＰＳ中にセッションネゴシエーションに関係するシンタックス要素を含めることによって、特に、ＶＰＳがシングルレイヤのみについての情報とは対照的に、ビデオの多重レイヤについての情報を記述するとき、シグナリングオーバーヘッドが低減されることが可能になり得る。その上、本開示は、セッションネゴシエーションシンタックス要素のために固定長シンタックス要素を使用することを提案し、固定長セッションネゴシエーションシンタックス要素はどんな可変長シンタックス要素の前にも位置し得る。可変長のシンタックス要素を処理するために、デバイスは、エントロピー復号を実行することが可能である必要がある。しかしながら、エントロピー復号を実行することは、ＭＡＮＥのために望ましくない複雑さレベルを導入し得る。したがって、どんな可変長シンタックス要素よりも前にＶＰＳ中に存在する固定長シンタックス要素を使用することによって、ＭＡＮＥは、エントロピー復号を実行する必要なしにセッションネゴシエーションのためのシンタックス要素をパースすることが可能であり得る。

[0037]以下の表２に、ＶＰＳ中に含まれ得るセッションネゴシエーション関係のシンタックス要素の例を示す。セッション否定についての情報の例としては、情報識別プロファイル、ティア、およびレベルがある。ＨＥＶＣワーキングドラフトは、プロファイル、ティア、およびレベルについて以下のように説明している。

「プロファイル」は、この勧告｜国際規格によって指定されたビットストリームシンタックス全体のサブセットである。所与のプロファイルのシンタックスによって課される限界内で、復号されたピクチャの指定されたサイズなど、ビットストリーム中のシンタックス要素がとる値に応じて、エンコーダおよびデコーダのパフォーマンスの極めて大きい変動を必要とする可能性が依然としてある。多くの適用例において、現在、特定のプロファイル内でシンタックスのすべての仮定的使用を処理することが可能なデコーダを実装することは実際的でもなく、経済的でもない。

この問題に対処するために、各プロファイル内で「ティア」および「レベル」が指定される。ティアのレベルは、ビットストリーム中のシンタックス要素の値に課された制約の指定セットである。これらの制約は、値に関する単純な制限であり得る。代替的に、それらは、値の演算の組合せ（たとえば、ピクチャの幅×ピクチャの高さ×毎秒復号されるピクチャの数）に関する制約の形態をとり得る。下位ティアのために指定されたレベルは、上位ティアのために指定されたレベルよりも制約される。

[0038]クライアントとＭＡＮＥとの間のセッションネゴシエーション中に、クライアントは、あるプロファイル、レベル、および／またはティアに従ってコーディングされたビデオデータのＭＡＮＥにおける利用可能性について照会し得る。ＭＡＮＥは、プロファイル、レベル、およびティア情報を含む、ＶＰＳの第１の部分（すなわち固定長コード化部分）をパースすることが可能であり得る。ＭＡＮＥにおいて利用可能な動作点のうち、適切な動作点がクライアントによって選定され得、ＭＡＮＥは、セッションがネゴシエートされた後に、対応するパッケージをクライアントに転送することができる。

[0039]本開示は、さらに、ＳＰＳなどの別のパラメータセット中にとは対照的に、ビデオパラメータセット中に仮想リファレンスデコーダ（ＨＲＤ：hypothetical reference decoder）を識別するためのシンタックス要素を含めることを提案する。ＨＲＤパラメータは、符号化プロセスが生じ得る準拠ＮＡＬユニットストリームまたは準拠バイトストリームの変動性に関する制約を指定する仮想デコーダモデルを識別する。２つのタイプのＨＲＤパラメータセット（ＮＡＬＨＲＤパラメータおよびＶＣＬＨＲＤパラメータ）がＶＰＳ中に含まれ得る。ＮＡＬＨＲＤパラメータはタイプＩＩビットストリーム準拠に関係するが、ＶＣＬＨＲＤパラメータはすべてのビットストリーム準拠に関係する。ＨＲＤ準拠に従う２つのタイプのビットストリーム間で現在区別されたＨＥＶＣ。第１のものはタイプＩビットストリームと呼ばれ、ビットストリーム中に、ＶＣＬＮＡＬユニットと、すべてのアクセスユニットのためのフィラーデータＮＡＬユニットとのみを含んでいるＮＡＬユニットストリームを指す。第２のタイプのビットストリームはタイプＩＩビットストリームと呼ばれ、ビットストリーム中に、ＶＣＬＮＡＬユニットと、すべてのアクセスユニットのためのフィラーデータＮＡＬユニットと、さらに他のタイプの追加のＮＡＬユニットとを含んでいる。

[0040]本開示の技法は、シングルレイヤコーディングにおいて、ならびにスケーラブルおよびマルチビュービデオコーディングに対して適用され得る。レイヤは、たとえば、空間スケーラブルレイヤ、品質スケーラブルレイヤ、テクスチャビュー、または深度ビューであり得る。ＨＥＶＣでは、レイヤは、概して、すべてが特定のレイヤＩＤ値を有する、ビデオコーディングレイヤ（ＶＣＬ：video coding layer）ＮＡＬユニットと、関連する非ＶＣＬＮＡＬユニットとのセットを指す。レイヤは、第１のレイヤが下位レイヤを含んでいることがあるという意味で、階層的であり得る。サブビットストリーム抽出プロセスの動作によって別のビットストリームから作成されるビットストリーム内で表されるレイヤのセットを指すために、レイヤセットが時々使用される。動作点は、概して、別のビットストリームとのサブビットストリーム抽出プロセスの動作によって別のビットストリームから作成されるビットストリームを指す。動作点は、レイヤセット中のすべてのレイヤを含み得、あるいはレイヤセットのサブセットとして形成されるビットストリームであり得る。

[0041]図１は、本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システム１０を示すブロック図である。図１に示すように、システム１０は、宛先デバイス１４によって後で復号されるべき符号化ビデオデータを生成するソースデバイス１２を含む。符号化ビデオデータは、メディアアウェアネットワーク要素（ＭＡＮＥ）２９によってソースデバイス１２から宛先デバイス１４にルーティングされ得る。ソースデバイス１２および宛先デバイス１４は、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス１２および宛先デバイス１４は、ワイヤレス通信のために装備され得る。

[0042]システム１０は、異なるビデオコーディング規格、プロプライエタリ規格、またはマルチビューコーディングの任意の他の方法に従って動作し得る。たとえば、ビデオエンコーダ２０およびビデオデコーダ３０は、ＩＴＵ−ＴＨ．２６１、ＩＳＯ／ＩＥＣＭＰＥＧ−１Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６２またはＩＳＯ／ＩＥＣＭＰＥＧ−２Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ−４Ｖｉｓｕａｌ、ならびにそのスケーラブルビデオコーディング（ＳＶＣ：Scalable Video Coding）拡張とマルチビュービデオコーディング（ＭＶＣ：Multiview Video Coding）拡張とを含む（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとしても知られている）ＩＴＵ−ＴＨ．２６４などを含むビデオ圧縮規格に従って動作し得る。ＭＶＣ拡張の最近の公的に入手可能な共同ドラフトは、「Advanced video coding for generic audiovisual services」、ＩＴＵ−Ｔ勧告Ｈ．２６４、２０１０年３月に記載されている。ＭＶＣ拡張のさらに最近の公的に入手可能な共同ドラフトは、「Advanced video coding for generic audiovisual services」、ＩＴＵ−Ｔ勧告Ｈ．２６４、２０１１年６月に記載されている。ＭＶＣ拡張の現在の共同ドラフトは、２０１２年１月時点で承認されている。

[0043]さらに、ＩＴＵ−Ｔビデオコーディングエキスパーツグループ（ＶＣＥＧ）とＩＳＯ／ＩＥＣモーションピクチャエキスパーツグループ（ＭＰＥＧ）とのビデオコーディング共同研究部会（ＪＣＴ−ＶＣ）によって現在開発中の新しいビデオコーディング規格、すなわち、高効率ビデオコーディング（ＨＥＶＣ）規格がある。以下でＨＥＶＣＷＤ７と呼ぶ、ＨＥＶＣの最近のワーキングドラフト（ＷＤ）が、２０１３年７月１日現在、http://phenix.int-evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v6.zipから入手可能である。

[0044]ＨＥＶＣ規格の開発は進行中であり、ＨＥＶＣＷＤ９と呼ばれる、ＨＥＶＣのより新しいワーキングドラフト（ＷＤ）は、２０１３年７月１日現在、http://phenix.int-evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC-K1003-v10.zipから入手可能である。説明の目的で、ビデオエンコーダ２０およびビデオデコーダ３０について、ＨＥＶＣ規格またはＨ．２６４規格およびそのような規格の拡張のコンテキストにおいて説明する。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例としては、ＭＰＥＧ−２およびＩＴＵ−ＴＨ．２６３がある。Ｏｎ２ＶＰ６／ＶＰ７／ＶＰ８と呼ばれるものなど、プロプライエタリコーディング技法もまた、本明細書で説明する技法のうちの１つまたは複数を実装し得る。「ＨＥＶＣＷｏｒｋｉｎｇＤｒａｆｔ１０」または「ＨＥＶＣＷＤ１０」と呼ばれる、次回のＨＥＶＣ規格のより新しいドラフトは、２０１３年７月１日現在、http://phenix.int-evry.fr/jct/doc_end_user/documents/13_Incheon/wg11/JCTVC-M0432-v3.zipから入手可能である、ブロスら、「Editors’ proposed corrections to HEVC version 1」、ＩＴＵ−ＴＳＧ１６ＷＰ３とＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１とのビデオコーディング共同研究部会（ＪＣＴ−ＶＣ）、第１３回会合、仁川、大韓民国、２０１３年４月に記載されており、その内容全体が参照により本明細書に組み込まれる。

[0045]本開示の技法は、ＨＥＶＣベースの３Ｄビデオコーディング（３Ｄ−ＨＥＶＣ）を含む、いくつかのＭＶＣおよび／または３Ｄビデオコーディング規格に潜在的に適用可能である。本開示の技法はまた、Ｈ．２６４／３Ｄ−ＡＶＣおよびＨ．２６４／ＭＶＣ＋Ｄビデオコーディング規格、またはそれらの拡張、ならびに他のコーディング規格に適用可能であり得る。本開示の技法について、時々、特定のビデオコーディング規格に関してまたはその規格の用語を使用して説明することがあるが、そのような説明は、説明する技法がその特定の規格のみに限定されることを意味するものと解釈されるべきでない。

[0046]宛先デバイス１４は、リンク１６を介して復号されるべき符号化ビデオデータを受信し得る。リンク１６は、ソースデバイス１２から宛先デバイス１４に符号化ビデオデータを移動することが可能な任意のタイプの媒体またはデバイスを備え得る。一例では、リンク１６は、ソースデバイス１２が、符号化ビデオデータをリアルタイムで宛先デバイス１４に直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス１４に送信され得る。通信媒体は、無線周波数（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス１２から宛先デバイス１４への通信を可能にするために有用であり得る、ルータ、スイッチ、基地局、または任意の他の機器を含み得る。リンク１６は、ソースデバイス１２から宛先デバイス１４にビデオデータをルーティングする、ＭＡＮＥ２９などの１つまたは複数のＭＡＮＥを含み得る。

[0047]代替的に、符号化データは、出力インターフェース２２からストレージデバイス２７に出力され得る。同様に、符号化データは、入力インターフェースによってストレージデバイス２７からアクセスされ得る。ストレージデバイス２７は、ハードドライブ、Ｂｌｕ−ｒａｙ（登録商標）ディスク、ＤＶＤ、ＣＤ−ＲＯＭ、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散したまたはローカルでアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイス２７は、ソースデバイス１２によって生成された符号化ビデオを保持し得るファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス１４は、ストリーミングまたはダウンロードを介して、ストレージデバイス２７から、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス１４に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバとしては、（たとえば、ウェブサイト用の）ウェブサーバ、ＦＴＰサーバ、ネットワーク接続ストレージ（ＮＡＳ）デバイス、またはローカルディスクドライブがある。宛先デバイス１４は、インターネット接続を含む、任意の標準のデータ接続を通じて符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適である、ワイヤレスチャネル（たとえば、Ｗｉ−Ｆｉ（登録商標）接続）、ワイヤード接続（たとえば、ＤＳＬ、ケーブルモデムなど）、または両方の組合せを含み得る。ストレージデバイス２７からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。ストレージデバイス２７から取り出されたビデオデータは、ＭＡＮＥ２９などの１つまたは複数のＭＡＮＥを使用して宛先デバイス１４にルーティングされ得る。

[0048]本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム１０は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および／またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。

[0049]図１の例では、ソースデバイス１２は、ビデオソース１８と、ビデオエンコーダ２０と、出力インターフェース２２とを含む。ビデオエンコーダ２０は、たとえば、本開示で説明するオフセットシンタックスを生成し得る。場合によっては、出力インターフェース２２は、変調器／復調器（モデム）および／または送信機を含み得る。ソースデバイス１２において、ビデオソース１８は、たとえばビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および／またはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどのソース、あるいはそのようなソースの組合せを含み得る。一例として、ビデオソース１８がビデオカメラである場合、ソースデバイス１２および宛先デバイス１４は、いわゆるカメラフォンまたはビデオフォンを形成し得る。ただし、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび／またはワイヤード適用例に適用され得る。

[0050]キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオは、ビデオエンコーダ１２によって符号化され得る。符号化ビデオデータは、ソースデバイス２０の出力インターフェース２２を介して宛先デバイス１４に直接送信され得る。符号化ビデオデータは、さらに（または代替として）、復号および／または再生のための宛先デバイス１４または他のデバイスによる後のアクセスのためにストレージデバイス２７上に記憶され得る。

[0051]宛先デバイス１４は、入力インターフェース２８と、ビデオデコーダ３０と、ディスプレイデバイス３２とを含む。ビデオデコーダ３０は、本開示で説明するオフセットシンタックス要素をパースし得る。上記で説明したように、ビデオデコーダ３０は、いくつかの事例ではオフセットシンタックス要素を無視し得、このようにして、ビデオデコーダ３０は、ＭＡＮＥによってスキップされたシンタックス要素をパースすることが可能になる。いくつかの例では、入力インターフェース２８は、受信機および／またはモデムを含み得る。宛先デバイス１４の入力インターフェース２８は、リンク１６を介して符号化ビデオデータを受信する。リンク１６を介して通信され、またはストレージデバイス２７上に与えられた符号化ビデオデータは、ビデオデータを復号する際に、ビデオデコーダ３０など、ビデオデコーダが使用するためのビデオエンコーダ２０によって生成される様々なシンタックス要素を含み得る。そのようなシンタックス要素は、通信媒体上で送信されるか、記憶媒体上に記憶されるか、またはファイルサーバ上に記憶される符号化ビデオデータとともに含まれ得る。

[0052]ディスプレイデバイス３２は、宛先デバイス１４と一体化されるかまたはその外部にあり得る。いくつかの例では、宛先デバイス１４は、一体型ディスプレイデバイスを含み、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス１４はディスプレイデバイスであり得る。概して、ディスプレイデバイス３２は、復号ビデオデータをユーザに対して表示し、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。

[0053]図１には示されていないが、いくつかの態様では、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれオーディオエンコーダおよびオーディオデコーダと統合され得、適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含んで、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理し得る。適用可能な場合、いくつかの例では、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

[0054]ビデオエンコーダ２０およびビデオデコーダ３０はそれぞれ、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、１つまたは複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行し得る。ビデオエンコーダ２０およびビデオデコーダ３０の各々は１つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ／デコーダ（コーデック）の一部として統合され得る。

[0055]ＪＣＴ−ＶＣは、ＨＥＶＣ規格の開発に取り組んでいる。ＨＥＶＣ規格化の取り組みは、ＨＥＶＣテストモデル（ＨＭ）と呼ばれるビデオコーディングデバイスの発展的モデルに基づく。ＨＭは、たとえば、ＩＴＵ−ＴＨ．２６４／ＡＶＣに従う既存のデバイスに対してビデオコーディングデバイスのいくつかの追加の能力を仮定する。たとえば、Ｈ．２６４は９つのイントラ予測符号化モードを与えるが、ＨＭは３３個ものイントラ予測符号化モードを与え得る。

[0056]概して、ＨＭのワーキングモデルは、ビデオフレームまたはピクチャが、ルーマサンプルとクロマサンプルの両方を含む一連のツリーブロックまたは最大コーディングユニット（ＬＣＵ）に分割され得ることを記述する。ツリーブロックは、Ｈ．２６４規格のマクロブロックと同様の目的を有する。スライスは、コーディング順序でいくつかの連続するツリーブロックを含む。ビデオフレームまたはピクチャは、１つまたは複数のスライスに区分され得る。各ツリーブロックは、４分木に従ってコーディングユニット（ＣＵ）に分割され得る。たとえば、４分木のルートノードとしてのツリーブロックは、４つの子ノードに分割され得、各子ノードは、次に、親ノードとなり、別の４つの子ノードに分割され得る。４分木のリーフノードとしての、最終的な、分割されていない子ノードは、コーディングノード、すなわち、コード化ビデオブロックを備える。コード化ビットストリームに関連するシンタックスデータは、ツリーブロックが分割され得る最大回数を定義し得、コーディングノードの最小サイズをも定義し得る。

[0057]ＣＵは、コーディングノードと、コーディングノードに関連する予測ユニット（ＰＵ）および変換ユニット（ＴＵ）とを含む。ＣＵのサイズは、コーディングノードのサイズに対応し、形状が方形でなければならない。ＣＵのサイズは、８×８ピクセルから最大６４×６４以上のピクセルを有するツリーブロックのサイズまでに及び得る。各ＣＵは、１つまたは複数のＰＵと、１つまたは複数のＴＵとを含んでいることがある。ＣＵに関連するシンタックスデータは、たとえば、ＣＵを１つまたは複数のＰＵに区分することを記述し得る。区分モードは、ＣＵが、スキップモード符号化またはダイレクトモード符号化されるか、イントラ予測モード符号化されるか、あるいはインター予測モード符号化されるかの間で異なり得る。ＰＵは、形状が非方形になるように区分され得る。ＣＵに関連するシンタックスデータは、たとえば、４分木に従って、ＣＵを１つまたは複数のＴＵに区分することも記述し得る。ＴＵは、形状が方形または非方形であり得る。

[0058]ＨＥＶＣ規格は、ＣＵごとに異なり得るＴＵに従う変換を可能にする。ＴＵは、一般に、区分されたＬＣＵについて定義された所与のＣＵ内のＰＵのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。ＴＵは、一般にＰＵと同じサイズであるかまたはＰＵよりも小さい。いくつかの例では、ＣＵに対応する残差サンプルは、「残差４分木」（ＲＱＴ：residual quad tree）として知られる４分木構造を使用して、より小さいユニットに再分割され得る。ＲＱＴのリーフノードは変換ユニット（ＴＵ）と呼ばれることがある。ＴＵに関連するピクセル差分値は、変換されて変換係数が生成され得、その変換係数は量子化され得る。

[0059]概して、ＰＵは、予測プロセスに関係するデータを含む。たとえば、ＰＵがイントラモード符号化されるとき、ＰＵは、ＰＵについてのイントラ予測モードを記述するデータを含み得る。別の例として、ＰＵがインターモード符号化されるとき、ＰＵは、ＰＵの動きベクトルを定義するデータを含み得る。ＰＵの動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度（たとえば、１／４ピクセル精度もしくは１／８ピクセル精度）、動きベクトルが指す参照ピクチャ、および／または動きベクトルの参照ピクチャリスト（たとえば、リスト０、リスト１、もしくはリストＣ）を記述し得る。

[0060]概して、ＴＵは、変換プロセスと量子化プロセスとのために使用される。１つまたは複数のＰＵを有する所与のＣＵは、１つまたは複数の変換ユニット（ＴＵ）をも含み得る。予測の後に、ビデオエンコーダ２０は、ＰＵに対応する残差値を計算し得る。残差値は、エントロピーコーディングのためのシリアル化変換係数（serialized transform coefficient）を生成するために、ＴＵを使用して変換係数に変換され、量子化され、走査され得るピクセル差分値を備える。本開示では、一般に、ＣＵのコーディングノードを指すために「ビデオブロック」という用語を使用する。いくつかの特定の場合において、本開示では、コーディングノードならびにＰＵおよびＴＵを含む、ツリーブロック、すなわち、ＬＣＵまたはＣＵを指す「ビデオブロック」という用語をも使用し得る。

[0061]ビデオシーケンスは、一般に、一連のビデオフレームまたはピクチャを含む。ピクチャのグループ（ＧＯＰ）は、概して、一連の１つまたは複数のビデオピクチャを備える。ＧＯＰは、ＧＯＰ中に含まれるいくつかのピクチャを記述するシンタックスデータを、ＧＯＰのヘッダ中、ピクチャのうちの１つまたは複数のヘッダ中、または他の場所に含み得る。各ピクチャのスライスは、それぞれのスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ２０は、一般に、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックはＣＵ内のコーディングノードに対応し得る。ビデオブロックは、固定サイズまたは可変サイズを有し得、指定のコーディング規格に応じてサイズが異なり得る。

[0062]一例として、ＨＭは、様々なＰＵサイズでの予測をサポートする。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ＨＭは、２Ｎ×２ＮまたはＮ×ＮのＰＵサイズでのイントラ予測をサポートし、２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、またはＮ×Ｎの対称的なＰＵサイズでのインター予測をサポートする。ＨＭはまた、２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズでのインター予測のための非対称区分をサポートする。非対称区分では、ＣＵの一方向は区分されないが、他の方向は２５％と７５％とに区分される。２５％の区分に対応するＣＵの部分は、「ｎ」とその後ろに付く「Ｕｐ」、「Ｄｏｗｎ」、「Ｌｅｆｔ」、または「Ｒｉｇｈｔ」という表示によって示される。したがって、たとえば、「２Ｎ×ｎＵ」は、上部の２Ｎ×０．５ＮＰＵと下部の２Ｎ×１．５ＮＰＵとで水平方向に区分された２Ｎ×２ＮＣＵを指す。

[0063]本開示では、「Ｎ×Ｎ（NxN）」および「Ｎ×Ｎ（N by N）」は、垂直寸法および水平寸法に関するビデオブロックのピクセル寸法、たとえば、１６×１６（16x16）ピクセルまたは１６×１６（16 by 16）ピクセルを指すために互換的に使用され得る。概して、１６×１６ブロックは、垂直方向に１６ピクセルを有し（ｙ＝１６）、水平方向に１６ピクセルを有する（ｘ＝１６）。同様に、Ｎ×Ｎブロックは、概して、垂直方向にＮピクセルを有し、水平方向にＮピクセルを有し、ただし、Ｎは非負整数値を表す。ブロック中のピクセルは行と列に構成され得る。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要があるとは限らない。たとえば、ブロックはＮ×Ｍピクセルを備え得、ただし、Ｍは必ずしもＮに等しいとは限らない。

[0064]ＣＵのＰＵを使用したイントラ予測コーディングまたはインター予測コーディングの後に、ビデオエンコーダ２０は、ＣＵのＴＵのための残差データを計算し得る。ＰＵは、（ピクセル領域とも呼ばれる）空間領域においてピクセルデータを備え得、ＴＵは、変換、たとえば、残差ビデオデータへの離散コサイン変換（ＤＣＴ）、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、ＰＵに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ２０は、ＣＵのための残差データを含むＴＵを形成し、次いで、ＴＵを変換して、ＣＵの変換係数を生成し得る。

[0065]変換係数を生成するための任意の変換の後に、ビデオエンコーダ２０は、変換係数の量子化を実行し得る。量子化は、概して、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を行うプロセスを指す。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。たとえば、量子化中にｎビット値がｍビット値に切り捨てられ得、ただし、ｎはｍよりも大きい。

[0066]いくつかの例では、ビデオエンコーダ２０は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ２０は適応型走査を実行し得る。量子化変換係数を走査して１次元ベクトルを形成した後に、ビデオエンコーダ２０は、たとえば、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ：context adaptive variable length coding）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ：context adaptive binary arithmetic coding）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ：syntax-based context-adaptive binary arithmetic coding）、確率間隔区分エントロピー（ＰＩＰＥ：Probability Interval Partitioning Entropy）コーディング、または別のエントロピー符号化方法に従って１次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ２０はまた、ビデオデータを復号する際にビデオデコーダ３０が使用するための符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。

[0067]ＣＡＢＡＣを実行するために、ビデオエンコーダ２０は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、たとえば、シンボルの隣接値が非０であるか否かに関係し得る。ＣＡＶＬＣを実行するために、ビデオエンコーダ２０は、送信されるべきシンボルに対して可変長コードを選択し得る。ＶＬＣにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構成され得る。このようにして、ＶＬＣの使用は、たとえば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。確率判断は、シンボルに割り当てられたコンテキストに基づき得る。

[0068]本開示では、シングルレイヤコーディングならびにスケーラブルおよびマルチビューコーディングにおいて相互互換様式で適用され得る、ビデオパラメータセットとシーケンスパラメータセットの両方を含む、パラメータセットの設計方法について説明する。マルチビュービデオコーディング（ＭＶＣ）はＨ．２６４／ＡＶＣの拡張である。ＭＶＣ仕様について以下で手短に説明する。

[0069]図２は、本開示で説明する１つまたは複数の例による、例示的なＭＶＣの符号化または復号の順序を示すグラフィック図である。たとえば、図２に示された復号順序構成は、時間優先コーディングと呼ばれる。図２では、Ｓ０〜Ｓ７はそれぞれ、マルチビュービデオの異なるビューを指す。Ｔ０〜Ｔ８はそれぞれ、１つの出力時間インスタンスを表す。アクセスユニットは、１つの出力時間インスタンスについてのすべてのビューのコード化ピクチャを含み得る。たとえば、第１のアクセスユニットは、時間インスタンスＴ０についてのビューＳ０〜Ｓ７（すなわち、ピクチャ０〜７）のすべてを含み、第２のアクセスユニットは、時間インスタンスＴ１についてのビューＳ０〜Ｓ７（すなわち、ピクチャ８〜１５）のすべてを含み、以下同様である。この例では、ピクチャ０〜７は、同じ時間インスタンス（すなわち、時間インスタンスＴ０）におけるものであり、ピクチャ８〜１５は、同じ時間インスタンス（すなわち、時間インスタンスＴ１）におけるものである。同じ時間インスタンスをもつピクチャは概して同時に表示され、３Ｄボリュームを包含する画像を閲覧者に知覚させるものは、同じ時間インスタンスのピクチャ内のオブジェクト間の水平視差と、場合によっては何らかの垂直視差である。

[0070]図２では、ビューの各々はピクチャのセットを含む。たとえば、ビューＳ０はピクチャ０、８、１６、２４、３２、４０、４８、５６、および６４のセットを含み、ビューＳ１はピクチャ１、９、１７、２５、３３、４１、４９、５７、および６５のセットを含み、以下同様である。各セットは２つのピクチャを含み、一方のピクチャはテクスチャビューコンポーネントと呼ばれ、他方のピクチャは深度ビューコンポーネントと呼ばれる。ビューのピクチャのセット内のテクスチャビューコンポーネントおよび深度ビューコンポーネントは、互いに対応すると見なされ得る。たとえば、ビューのピクチャのセット内のテクスチャビューコンポーネントは、そのビューのピクチャのセット内の深度ビューコンポーネントに対応すると見なされ得、その逆も同様である（すなわち、深度ビューコンポーネントはセット中のそれのテクスチャビューコンポーネントに対応し、その逆も同様である）。本開示で使用する、テクスチャビューコンポーネントと、対応する深度ビューコンポーネントとは、単一のアクセスユニットの同じビューの一部であると見なされ得る。

[0071]テクスチャビューコンポーネントは、表示される実際の画像コンテンツを含む。たとえば、テクスチャビューコンポーネントは、ルーマ（Ｙ）成分と、クロマ（ＣｂおよびＣｒ）成分とを含み得る。深度ビューコンポーネントは、それの対応するテクスチャビューコンポーネント中のピクセルの相対深度を示し得る。一例として、深度ビューコンポーネントは、ルーマ値のみを含むグレースケール画像と同様であり得る。言い換えれば、深度ビューコンポーネントは、画像コンテンツを搬送するのではなく、テクスチャビューコンポーネント中のピクセルの相対深度の測度を与え得る。

[0072]深度ビューコンポーネント中の純白のピクセルに対応するピクセル値は、対応するテクスチャビューコンポーネント中のそれの対応する１つまたは複数のピクセルが閲覧者から見てより近いことを示し得、深度ビューコンポーネント中の純黒のピクセルに対応するピクセル値は、対応するテクスチャビューコンポーネント中のそれの対応する１つまたは複数のピクセルが閲覧者から見てより遠いことを示し得る。黒と白との中間にあるグレーの様々な色合いに対応するピクセル値は、異なる深度レベルを示す。たとえば、深度ビューコンポーネント中の濃いグレーのピクセルは、テクスチャビューコンポーネント中のそれの対応するピクセルが、深度ビューコンポーネント中のより薄いグレーのピクセルよりも遠いことを示す。ピクセルの深度を識別するためには、グレースケールと同様にただ１つのピクセル値が必要とされるので、深度ビューコンポーネントはただ１つのピクセル値を含み得る。したがって、深度をコーディングするとき、クロマ成分に類似する値は必要とされない。

[0073]深度を識別するためにルーマ値（たとえば、強度値）のみを使用する深度ビューコンポーネントが説明のために与えられ、限定するものと見なされるべきではない。他の例では、テクスチャビューコンポーネント中のピクセルの相対深度を示すために任意の技法が利用され得る。

[0074]ＭＶＣによれば、テクスチャビューコンポーネントは、同じビュー中のテクスチャビューコンポーネントから、あるいは１つまたは複数の異なるビュー中のテクスチャビューコンポーネントからインター予測される。テクスチャビューコンポーネントは、「ビデオブロック」と呼ばれ、Ｈ．２６４コンテキストでは一般に「マクロブロック」と呼ばれる、ビデオデータのブロック中でコーディングされ得る。

[0075]ＭＶＣでは、Ｈ．２６４／ＡＶＣ動き補償のシンタックスを使用するが、異なるビュー中のピクチャが、コーディングされているピクチャを予測するための参照ピクチャとして使用されることを可能にする視差動き補償により、ビュー間予測がサポートされる。２つのビューのコーディングもＭＶＣによってサポートされ得る。ＭＶＣの１つの潜在的利点は、ＭＶＣエンコーダが３Ｄビデオ入力として３つ以上のビューをとることができ、またＭＶＣデコーダが、キャプチャされたビデオのそのようなマルチビュー表現を復号することができるということである。ＭＶＣデコーダをもつどんなレンダラも、３つ以上のビューをもつ３Ｄビデオコンテンツを処理し得る。

[0076]ＭＶＣでは、同じアクセスユニット中の（すなわち、同じ時間インスタンスをもつ）ピクチャ間でビュー間予測が可能になる。非ベースビュ中のピクチャをコーディングするとき、ピクチャが異なるビュー中にあるが同じ時間インスタンスをもつ場合、そのピクチャは参照ピクチャリストに追加され得る。ビュー間予測参照ピクチャは、任意のインター予測参照ピクチャと同様に、参照ピクチャリストの任意の位置に置かれ得る。

[0077]図３は、例示的なＭＶＣ予測パターンを示す概念図である。図３の例では、（ビューＩＤ「Ｓ０」〜「Ｓ７」を有する）８つのビューが示され、１２個の時間ロケーション（「Ｔ０」〜「Ｔ１１」）がビューごとに示されている。すなわち、図３中の各行はビューに対応し、各列は時間ロケーションを示す。図３の例では、大文字「Ｂ」および小文字「ｂ」は、異なるコーディング方法ではなく、ピクチャ間の異なる階層関係を示すために使用される。概して、大文字の「Ｂ」ピクチャは、小文字の「ｂ」フレームよりも予測階層が比較的高い。

[0078]図３では、ビューＳ０はベースビューと見なされ得、ビューＳ１〜Ｓ７は従属ビューと見なされ得る。ベースビューは、ビュー間予測されないピクチャを含む。ベースビュー中のピクチャは、同じビュー内の他のピクチャに対してインター予測され得る。たとえば、ビューＳ０中のピクチャのいずれも、ビューＳ１〜Ｓ７のいずれの中のピクチャに対してもインター予測され得ないが、ビューＳ０中のピクチャのいくつかは、ビューＳ０中の他のピクチャに対してインター予測され得る。

[0079]従属ビューは、ビュー間予測されるピクチャを含む。たとえば、ビューＳ１〜Ｓ７の各々は、別のビュー中のピクチャに対してインター予測される少なくとも１つのピクチャを含む。従属ビュー中のピクチャは、ベースビュー中のピクチャに対してインター予測され得るか、または他の従属ビュー中のピクチャに対してインター予測され得る。

[0080]ベースビューと１つまたは複数の従属ビューの両方を含むビデオストリームは、異なるタイプのビデオデコーダによって復号可能であり得る。たとえば、１つの基本タイプのビデオデコーダは、ベースビューのみを復号するように構成され得る。さらに、別のタイプのビデオデコーダは、ビューＳ０〜Ｓ７の各々を復号するように構成され得る。ベースビューと従属ビューの両方を復号するように構成されたデコーダは、マルチビューコーディングをサポートするデコーダと呼ばれることがある。

[0081]図３中のピクチャは、図３中の各行および各列の交点で示される。ＭＶＣ拡張をもつＨ．２６４／ＡＶＣ規格は、ビデオの一部分を表すためにフレームという用語を使用し得るが、ＨＥＶＣ規格は、ビデオの一部分を表すためにピクチャという用語を使用し得る。本開示では、ピクチャという用語とフレームという用語とを互換的に使用する。

[0082]図３のピクチャは、対応するピクチャがイントラコーティングされる（すなわち、Ｉフレームである）か、一方向に（すなわち、Ｐフレームとして）インターコーティングされるか、または複数の方向に（すなわち、Ｂフレームとして）インターコーティングされるかを指定する、文字を含む陰影付きブロックを使用して示されている。概して、予測は矢印によって示され、ここで矢印の終点のピクチャは、予測参照のために矢印の始点のピクチャを使用する。たとえば、時間ロケーションＴ０にあるビューＳ２のＰピクチャは、時間ロケーションＴ０にあるビューＳ０のＩピクチャから予測される。

[0083]シングルビュービデオ符号化の場合と同様に、マルチビュービデオコーディングビデオシーケンスのピクチャは、異なる時間ロケーションにあるピクチャに対して予測符号化され得る。たとえば、時間ロケーションＴ１にあるビューＳ０のＢピクチャは、時間ロケーションＴ０にあるビューＳ０のＩピクチャからそのＢピクチャに向けられた矢印を有し、その矢印は、ｂピクチャがＩピクチャから予測されることを示す。しかしながら、さらに、マルチビュービデオ符号化のコンテキストにおいて、ピクチャはビュー間予測され得る。すなわち、ビューコンポーネント（たとえば、テクスチャビューコンポーネント）は、参照のために他のビュー中のビューコンポーネントを使用することができる。ＭＶＣでは、たとえば、別のビュー中のビューコンポーネントがインター予測参照であるかのように、ビュー間予測が実現される。潜在的なビュー間参照は、シーケンスパラメータセット（ＳＰＳ）ＭＶＣ拡張においてシグナリングされ、インター予測またはビュー間予測参照のフレキシブルな順序付けを可能にする参照ピクチャリスト構成プロセスによって変更され得る。

[0084]図３は、ビュー間予測の様々な例を与える。図３の例では、ビューＳ１のピクチャは、ビューＳ１の異なる時間ロケーションにあるピクチャから予測されるものとして、ならびに同じ時間ロケーションにあるビューＳ０およびＳ２のピクチャからビュー間予測されるものとして示されている。たとえば、時間ロケーションＴ１にあるビューＳ１のＢピクチャは、時間ロケーションＴ０およびＴ２にあるビューＳ１のＢピクチャの各々、ならびに時間ロケーションＴ１にあるビューＳ０およびビューＳ２のＢピクチャから予測される。

[0085]図３はまた、異なるレベルの陰影を使用して予測階層の変形形態を示し、ここで、より大きい量の陰影の（すなわち、比較的より暗い）フレームは、より少ない陰影を有する（すなわち、比較的より明るい）フレームよりも予測階層が高い。たとえば、図３のすべてのＩピクチャは完全な陰影を用いて示されているが、Ｐピクチャはよりいくぶん明るい陰影を有し、Ｂピクチャ（および小文字のｂピクチャ）は、互いに対して様々なレベルの陰影を有するが、ＰピクチャおよびＩピクチャの陰影よりも常に明るい。

[0086]概して、予測階層が比較的高いピクチャは、階層が比較的より低いピクチャを復号する前に復号されなければならないという点で、予測階層はビュー順序インデックスに関係し得る。階層が比較的より高いそれらのピクチャは、階層が比較的低いピクチャの復号中に参照ピクチャとして使用され得る。ビュー順序インデックスは、アクセスユニット中のビューコンポーネントの復号順序を示すインデックスである。Ｈ．２６４／ＡＶＣ（ＭＶＣ追補）の付属書類Ｈにおいて規定されているように、ビュー順序インデックスは、シーケンスパラメータセット（ＳＰＳ）のＭＶＣ拡張において暗示されている。ＳＰＳでは、各インデックスｉについて、対応するｖｉｅｗ＿ｉｄがシグナリングされる。ビューコンポーネントの復号は、ビュー順序インデックスの昇順に従い得る。すべてのビューが提示された場合、ビュー順序インデックスは、０からｎｕｍ＿ｖｉｅｗｓ＿ｍｉｎｕｓ＿１までの連続する順序になっている。

[0087]このようにして、参照ピクチャとして使用されるピクチャは、その参照ピクチャに従属するピクチャの前に復号される。ビュー順序インデックスは、アクセスユニット中のビューコンポーネントの復号順序を示すインデックスである。各ビュー順序インデックスｉについて、対応するｖｉｅｗ＿ｉｄがシグナリングされる。ビューコンポーネントの復号は、ビュー順序インデックスの昇順に従う。すべてのビューが提示された場合、ビュー順序インデックスのセットは、０からビューの全数よりも１少ない数までの連続的な順序付きセットを備え得る。

[0088]階層の等しいレベルにあるいくつかのピクチャの場合、復号順序は、互いに重要でないことがある。たとえば、時間ロケーションＴ０にあるビューＳ０のＩピクチャは、時間ロケーションＴ０にあるビューＳ２のＰピクチャのための参照ピクチャとして使用され得、そのＰピクチャは、今度は、時間ロケーションＴ０にあるビューＳ４のＰピクチャのための参照ピクチャとして使用され得る。したがって、時間ロケーションＴ０にあるビューＳ０のＩピクチャは、時間ロケーションＴ０にあるビューＳ２のＰピクチャの前に復号されるべきであり、そのＰピクチャは、今度は、時間ロケーションＴ０にあるビューＳ４のＰピクチャの前に復号されるべきである。しかしながら、ビューＳ１およびＳ３は予測のために互いに従属しないので、ビューＳ１とビューＳ３との間で、復号順序は重要でない。代わりに、ビューＳ１およびＳ３は、予測階層がより高い他のビューのみから予測される。その上、ビューＳ１がビューＳ０およびＳ２の後に復号される限り、ビューＳ１はビューＳ４の前に復号され得る。

[0089]このようにして、ビューＳ０〜Ｓ７を記述するために階層順序が使用され得る。本開示では、表記「ＳＡ＞ＳＢ」は、ビューＳＡがビューＳＢの前に復号されるべきであることを意味する。この表記を使用すると、図２の例では、Ｓ０＞Ｓ２＞Ｓ４＞Ｓ６＞Ｓ７である。また、図２の例に関して、Ｓ０＞Ｓ１、Ｓ２＞Ｓ１、Ｓ２＞Ｓ３、Ｓ４＞Ｓ３、Ｓ４＞Ｓ５、およびＳ６＞Ｓ５である。この階層順序付けに違反しないビューのための任意の復号順序が可能である。したがって、この階層順序付けに基づく限定をもつ、多くの異なる復号順序が可能である。

[0090]次にＳＰＳＭＶＣ拡張について説明する。ビューコンポーネントは、参照のために他のビュー中のビューコンポーネントを使用することができ、これはビュー間予測と呼ばれる。ＭＶＣでは、別のビュー中のビューコンポーネントがインター予測の参照であるかのように、ビュー間予測が実現される。しかしながら、潜在的なビュー間参照は、（以下のシンタックステーブル、表１に示すように）シーケンスパラメータセット（ＳＰＳ）ＭＶＣ拡張においてシグナリングされ、インター予測またはビュー間予測参照のフレキシブルな順序付けを可能にする参照ピクチャリスト構成プロセスによって変更され得る。ビデオエンコーダ２０は、表１に示すようにシンタックスを生成するように構成されたビデオエンコーダのエクス例を表し、ビデオデコーダ３０は、そのようなシンタックスをパースし、処理するように構成されたビデオデコーダの一例を表す。

[0091]ＳＰＳＭＶＣ拡張では、ビューごとに、参照ピクチャリスト０と参照ピクチャリスト１とを形成するために使用され得るビューの数がシグナリングされる。ＳＰＳＭＶＣ拡張においてシグナリングされるアンカーピクチャについての予測関係は、同じビューの（ＳＰＳＭＶＣ拡張においてシグナリングされる）非アンカーピクチャについての予測関係とは異なり得る。

[0092]次にＨＥＶＣのパラメータセットについて説明する。ＨＥＶＣＷＤ７では、ＨＥＶＣにおけるビデオ、シーケンス、ピクチャおよび適応パラメータセット機構は、頻度に変化しない情報の送信をコード化ブロックデータの送信から分離する。ビデオ、シーケンス、ピクチャおよび適応パラメータセットは、いくつかの適用例では、「アウトオブバンド」で搬送され得、すなわち、コード化ビデオデータを含んでいるユニットとともにトランスポートされないことがある。アウトオブバンド送信は一般に信頼できる。

[0093]ＨＥＶＣＷＤ７では、ビデオシーケンスパラメータセット（ＶＰＳ：video sequence parameter set）、シーケンスパラメータセット（ＳＰＳ）、ピクチャパラメータセット（ＰＰＳ）または適応パラメータセット（ＡＰＳ）の識別子は、可変長シンタックス要素「ｕｅ（ｖ）」を使用してコーディングされる。各ＳＰＳはＳＰＳＩＤとＶＰＳＩＤとを含み、各ＰＰＳはＰＰＳＩＤとＳＰＳＩＤとを含み、各スライスヘッダは、ＰＰＳＩＤと、場合によってはＡＰＳＩＤとを含む。

[0094]ＨＥＶＣＷＤ７においてビデオパラメータセット（ＶＰＳ）はサポートされるが、シーケンスレベル情報パラメータの大部分は依然としてＳＰＳ中にのみ存在する。ＷＤ７のＶＰＳ設計のいくつかの問題または潜在的欠点が存在する。一例として、ＳＰＳ中に含まれている情報のかなりの量が、すべてのＳＰＳについて同じであるか、あるいは少なくとも２つのＳＰＳについて同じであり得る。ＳＰＳ中のこの情報を複製することは、より高い帯域幅を必要とする。（少なくともＶＰＳ、ＳＰＳおよびＰＰＳを含む）パラメータセットはアウトオブバンドでシグナリングされる必要があり得る。インバンドでシグナリングされる場合、ランダムアクセスポイントにおいてそれぞれ同調するためにそのようなビットレート増加が有効である。

[0095]第２の例として、潜在的なＨＥＶＣ拡張において、ＡＶＣと同様の設計原理に従う場合、動作点記述情報の大部分がＳＰＳまたはＶＰＳ中に含まれないことがあり、代わりに、ＳＥＩメッセージがセッション初期化およびネゴシエーションのために使用され得る。したがって、ＭＡＮＥは、上述の目的のためにＳＰＳ、ＶＰＳ、およびＳＥＩメッセージをパースするように要求され得る。第３の例として、ＷＤ７においてＳＰＳ中に存在する何らかの情報が、ＨＥＶＣ拡張において変更または削除され得る。

[0096]上記で説明した潜在的問題に対処するために、本開示は、ＶＰＳまたは他のパラメータセットを含む、パラメータセットの設計のためのいくつかの技法を提案する。たとえば、本開示で説明する技法によれば、全コード化ビデオシーケンスについて一般に同じである情報がＶＰＳ中に存在し得る一方で、ＳＰＳレベルが変化し得るシンタックス要素のみがＳＰＳ中に存在し得る。他のシンタックス要素は、ＶＰＳ中にすでに存在する場合、ＳＰＳから除外され得る。

[0097]本開示の技法の別の例として、セッションネゴシエーションに関係する情報がＶＰＳ中に存在し得る。セッションネゴシエーションに関係する情報の例としては、プロファイル情報、レベル情報、フレーム解像度情報、フレームレート情報、およびビットレート情報、ならびに他の情報がある。本開示の技法の別の例として、ＶＰＳは、セッションネゴシエーションにとって重要である動作点情報をパースすることが、ベースレイヤまたはビューと、エンハンスメントレイヤまたはビューの両方についての情報を潜在的に含めて、可変長コーディングを必要としない方法で設計され得る。ＶＰＳ中のシンタックス要素は、グループごとに、ＨＥＶＣ拡張が０個以上のインスタンスを与え得、ＨＥＶＣ拡張における動作点がインデックスのみを参照するようにグループ化され得る。

[0098]ＶＰＳ、ＳＰＳ、ビデオユーザビリティ情報（ＶＵＩ：video usability information）、ならびにＨＲＤパラメータおよびスライスヘッダのためのシンタックスおよびセマンティクスの様々な例を以下に与える。表２〜表６に第１の例を示す。上記に記載した表１はＶＰＳシンタックスの一例を示している。表２〜表６中の、ならびに本開示における他の表中の「記述子」の列は、各シンタックス要素のビット数を識別し、ただし、ビット数を示す「ｖ」は可変であり得る。「記述子」の列中の数値は、固定ビット数を使用してシンタックス要素が搬送されることを示す。たとえば、「ｕ（８）」は８の固定ビット数をもつシンタックス要素を表すが、「ｕｅ（ｖ）」は可変ビット数をもつシンタックス要素を表す。記述子ｕｅ（ｖ）をもつシンタックス要素をパースするために、（ビデオデコーダまたはＭＡＮＥなどの）パースデバイスは、そのようなシンタックス要素を復号し解釈するために、エントロピーコーディングを実装する必要があり得る。

[0099]次に、上記の表２に示したものなど、ビデオパラメータセットＲＢＳＰセマンティクスについて説明する。表２中のシンタックス要素ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄは、ビデオパラメータセットの識別情報を与える。ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値を使用して、ＳＰＳなどの別のシンタックス構造が特定のＶＰＳをアクティブにすることができる。たとえば、例示的なＳＰＳシンタックス構造を示す表３もシンタックス要素ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄを含む。ＳＰＳ中のシンタックス要素ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値に基づいて、その同じ値をもつ特定のＶＰＳが、ＳＰＳに関連するビデオブロックをコーディングするためにアクティブにされ得る。一般に、複数のＳＰＳが同じＶＰＳに関連付けられることになる。一例として、ビデオデコーダ３０が、ビデオデータ中で、シンタックス要素ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの第１の値を含む第１のＳＰＳを受信し得、ビデオデコーダ３０はまた、シンタックス要素ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの同じ値を含む第２のＳＰＳを受信し得る。第１のＳＰＳは、ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを含む第１のシンタックス構造であり得、第２のＳＰＳは、ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを含む第２のシンタックス構造であり得る。ビデオデコーダ３０は、同じＶＰＳからのパラメータに基づいて、第１のＳＰＳと第２のＳＰＳの両方に関連付けられたビデオブロックを復号する。

[0100]シンタックス要素ｐｒｏｆｉｌｅ＿ｓｐａｃｅ、ｐｒｏｆｉｌｅ＿ｉｄｃ、ｐｒｏｆｉｌｅ＿ｃｏｍｐａｔａｂｉｌｉｔｙ＿ｆｌａｇ［ｉ］、ｃｏｎｓｔｒａｉｎｔ＿ｆｌａｇｓ、ｌｅｖｅｌ＿ｉｄｃ、ｂｉｔ＿ｄｅｐｔｈ＿ｌｕｍａ＿ｍｉｎｕｓ８、ｂｉｔ＿ｄｅｐｔｈ＿ｃｈｒｏｍａ＿ｍｉｎｕｓ８、ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃ、ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｃｒｏｐｐｉｎｇ＿ｆｌａｇ、ｐｉｃ＿ｃｒｏｐ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｉｃ＿ｃｒｏｐ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｉｃ＿ｃｒｏｐ＿ｔｏｐ＿ｏｆｆｓｅｔ、ｐｉｃ＿ｃｒｏｐ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ、ｔｅｍｐｏｒａｌ＿ｉｄ＿ｎｅｓｔｉｎｇ＿ｆｌａｇおよびｓｅｐａｒａｔｅ＿ｃｏｌｏｕｒ＿ｐｌａｎｅ＿ｆｌａｇは、ＷＤ７において規定されているシーケンスパラメータセット中の同じシンタックス要素名をもつシンタックス要素の同じセマンティクスを有するが、本開示の提案する技法に従ってＳＰＳからＶＰＳに移動されている。

[0101]シンタックス要素ｐｒｏｆｉｌｅ＿ｓｐａｃｅは、シンタックス要素ｐｒｏｆｉｌｅ＿ｉｄｃを解釈するためのコンテキストを識別し、シンタックス要素ｐｒｏｆｉｌｅ＿ｉｄｃはプロファイルのグループを識別する。シンタックス要素ｐｒｏｆｉｌｅ＿ｃｏｍｐａｔａｂｉｌｉｔｙ＿ｆｌａｇ［ｉ］は、ビデオデータがｐｒｏｆｉｌｅ［ｉ］と互換性があるかどうかを識別し得る。ビデオデコーダ３０は、たとえば、ビデオデータ中で、ｐｒｏｆｉｌｅ＿ｓｐａｃｅとｐｒｏｆｉｌｅ＿ｉｄｃとの値を受信し、ｐｒｏｆｉｌｅ＿ｓｐａｃｅの値に基づいて、シンタックス要素ｐｒｏｆｉｌｅ＿ｉｄｃを解釈するためのコンテキストを識別し得る。ｐｒｏｆｉｌｅ＿ｉｄｃの解釈された値に基づいて、ビデオデコーダ３０は、プロファイルのグループを識別することができ、プロファイルごとに、ビデオデコーダ３０は、シンタックス要素ｐｒｏｆｉｌｅ＿ｃｏｍｐａｔａｂｉｌｉｔｙ＿ｆｌａｇ［ｉ］の値を受信して、ビデオデータがｐｒｏｆｉｌｅ［ｉ］と互換性があるかどうかを識別することができる。シンタックス要素ｐｒｏｆｉｌｅ＿ｉｄｃは、たとえば、３２個の関連するフラグを有し得、各フラグはプロファイルの特定の態様を示す。たとえば、フラグは、同じプロファイルを仮定すれば、１つの特定のコーディングまたはプロセスツールがオンにされるかオフされるかを示し得る。

[0102]シンタックス要素ｌｅｖｅｌ＿ｉｄｃは、ビデオデータに関連する最大レベルを識別し、シンタックス要素ｌｅｖｅｌ＿ｌｏｗｅｒ＿ｔｅｍｐｏｒａｌ＿ｌａｙｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ビデオデータの時間レイヤが最大レベルよりも低いレベルを有するかどうかを識別する。１に等しく設定されたシンタックス要素ｌｅｖｅｌ＿ｌｏｗｅｒ＿ｔｅｍｐｏｒａｌ＿ｌａｙｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｌｅｖｅｌ＿ｉｄｃ＿ｔｅｍｐｏｒａｌ＿ｓｕｂｓｅｔ［ｉ］が存在し得ることを指定する。０に等しく設定されたシンタックス要素ｌｅｖｅｌ＿ｌｏｗｅｒ＿ｔｅｍｐｏｒａｌ＿ｌａｙｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｌｅｖｅｌ＿ｉｄｃ＿ｔｅｍｐｏｒａｌ＿ｓｕｂｓｅｔ［ｉ］が存在しないことを指定する。シンタックス要素ｌｅｖｅｌ＿ｉｄｃ＿ｔｅｍｐｏｒａｌ＿ｓｕｂｓｅｔ［ｉ］は、ｔｅｍｐｏｒａｌ＿ｉｄがｉ以下であるすべてのＮＡＬユニットからなるビットストリームサブセットが適合するレベルを指定する。

[0103]ビデオデコーダ３０は、たとえば、１に等しく設定されたシンタックス要素ｌｅｖｅｌ＿ｌｏｗｅｒ＿ｔｅｍｐｏｒａｌ＿ｌａｙｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇを受信したことに応答して、シンタックス要素ｌｅｖｅｌ＿ｉｄｃ＿ｔｅｍｐｏｒａｌ＿ｓｕｂｓｅｔ［ｉ］を受信し得る。シンタックス要素ｌｅｖｅｌ＿ｉｄｃ＿ｔｅｍｐｏｒａｌ＿ｓｕｂｓｅｔ［ｉ］は、ｔｅｍｐｏｒａｌｌａｙｅｒ［ｉ］が適合するレベルを識別するために存在し得る。

[0104]シンタックス要素ｖｐｓ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｎｅｓｔｉｎｇ＿ｆｌａｇ、ｖｐｓ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｎｅｓｔｉｎｇ＿ｆｌａｇ、ｖｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇする［ｉ］、ｖｐｓ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ｉ］、およびｖｐｓ＿ｍａｘ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ［ｉ］は、ＨＥＶＣＷＤ７のシーケンスパラメータセット中に、それぞれ以下のシンタックス要素、すなわち、ｓｐｓ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｎｅｓｔｉｎｇ＿ｆｌａｇ、ｓｐｓ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｎｅｓｔｉｎｇ＿ｆｌａｇ、ｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ［ｉ］、ｓｐｓ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ｉ］、ｓｐｓ＿ｍａｘ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ［ｉ］の同じセマンティクスを有する。

[0105]シンタックス要素ｎｅｘｔ＿ｅｓｓｅｎｔｉａｌ＿ｉｎｆｏ＿ｂｙｔｅ＿ｏｆｆｓｅｔは、本開示で紹介するオフセットシンタックス要素の一例である。シンタックス要素ｎｅｘｔ＿ｅｓｓｅｎｔｉａｌ＿ｉｎｆｏ＿ｂｙｔｅ＿ｏｆｆｓｅｔは、ＮＡＬユニットの始端から始まる、ＶＰＳＮＡＬユニット中のプロファイルおよびレベル情報と他の固定長コード化情報との次のセットのバイトオフセットを指定する。ＭＡＮＥ２９は、たとえば、シンタックス要素ｎｅｘｔ＿ｅｓｓｅｎｔｉａｌ＿ｉｎｆｏ＿ｂｙｔｅ＿ｏｆｆｓｅｔを受信し、シンタックス要素ｎｅｘｔ＿ｅｓｓｅｎｔｉａｌ＿ｉｎｆｏ＿ｂｙｔｅ＿ｏｆｆｓｅｔによって示されるバイト数を判断し得、この判断されたバイト数に基づいて、ＭＡＮＥ２９は、可変長シンタックス要素ｐｉｃ＿ｃｒｏｐ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｉｃ＿ｃｒｏｐ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｉｃ＿ｃｒｏｐ＿ｔｏｐ＿ｏｆｆｓｅｔ、ｐｉｃ＿ｃｒｏｐ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔなど、表２に示された１つまたは複数可変長コード化シンタックス要素と、表２に示された他の可変長シンタックス要素とをスキップし得る。ただし、ビデオデコーダ３０は、シンタックス要素ｎｅｘｔ＿ｅｓｓｅｎｔｉａｌ＿ｉｎｆｏ＿ｂｙｔｅ＿ｏｆｆｓｅｔを受信すると、シンタックス要素の値を無視し得る。したがって、シンタックス要素ｎｅｘｔ＿ｅｓｓｅｎｔｉａｌ＿ｉｎｆｏ＿ｂｙｔｅ＿ｏｆｆｓｅｔをパースした後に、ビデオデコーダ３０は、表２に示された可変長シンタックス要素ｐｉｃ＿ｃｒｏｐ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｉｃ＿ｃｒｏｐ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｉｃ＿ｃｒｏｐ＿ｔｏｐ＿ｏｆｆｓｅｔ、ｐｉｃ＿ｃｒｏｐ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔと、他の可変長シンタックス要素とをパースし続け得る。

[0106]ＨＥＶＣ仕様の将来の拡張、たとえば、スケーラブルコーディング拡張または３ＤＶ拡張において、非ベースレイヤまたはビューについてのＶＰＳ情報は、ベースレイヤまたはビューについてのＶＰＳ情報の後にＶＰＳＮＡＬユニット中に含められ得る。非ベースレイヤまたはビューについてのＶＰＳ情報はまた、セッションネゴシエーションのために必須のコード化プロファイル、レベル、および他の情報など、固定長シンタックス要素で開始し得る。ｎｅｘｔ＿ｅｓｓｅｎｔｉａｌ＿ｉｎｆｏ＿ｂｙｔｅ＿ｏｆｆｓｅｔによって指定されたビットオフセットを使用して、ＭＡＮＥ２９は、エントロピー復号を実行する必要なしに、ＶＰＳＮＡＬユニット中でその必須情報の位置を特定し、アクセスし得る。ビデオデータをトランスポートし、処理するように構成されたいくつかのネットワークエンティティ（たとえばＭＡＮＥ２９）は、エントロピー復号のために装備されていないことがある。しかしながら、本開示で説明するようにオフセットシンタックス要素を使用して、そのようなネットワークエンティティは依然として、パラメータセットのいくつかの態様を処理し、ビデオデータのルーティング決定を行うときにその処理されたシンタックス要素中に含まれている情報を使用することができる。ルーティング決定を行うときにネットワークエンティティが処理し得る情報の一例としては、セッションネゴシエーションに関係する情報がある。

[0107]シンタックス要素ｎａｌ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］およびｖｃｌ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ＷＤ７のＶＵＩパラメータ中に存在するが、ｉ番目の時間レイヤ表現に適用可能である、ｎａｌ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇおよびｖｃｌ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇと同様のセマンティックを有する。シンタックス要素ｎａｌ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、たとえば、ビットレート、コード化ピクチャバッファ（ＣＰＢ：ｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ）サイズ、および初期ＣＰＢ削除遅延（ｉｎｉｔｉａｌ＿ｃｐｂ＿ｒｅｍｏｖａｌ＿ｄｅｌａｙ＿ｌｅｎｇｔｈ＿ｍｉｎｕｓ１）、ＣＰＢ削除遅延（ｃｐｂ＿ｒｅｍｏｖａｌ＿ｄｅｌａｙ＿ｌｅｎｇｔｈ＿ｍｉｎｕｓ１）、ＤＰＢ出力遅延（ｄｐｂ＿ｏｕｔｐｕｔ＿ｄｅｌａｙ＿ｌｅｎｇｔｈ＿ｍｉｎｕｓ１）、および時間オフセット長（ｔｉｍｅ＿ｏｆｆｓｅｔ＿ｌｅｎｇｔｈ）など、ＨＲＤパラメータかどうかをシグナリングし得る。シンタックス要素は、たとえば、ビデオ日付のビットレートが固定であるか可変であるかを示すシンタックス要素（ｃｂｒ＿ｆｌａｇ）を含み得る。

[0108]シンタックス要素ｌｏｗ＿ｄｅｌａｙ＿ｈｒｄ＿ｆｌａｇは、ＤＰＢからの復号ユニットの削除時間を示すために使用され得る。１に等しいシンタックス要素ｓｕｂ＿ｐｉｃ＿ｃｐｂ＿ｐａｒａｍｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、サブピクチャレベルＣＰＢ削除遅延パラメータが存在し、ＣＰＢがアクセスユニットレベルまたはサブピクチャレベルで動作し得ることを指定し得る。０に等しいシンタックス要素ｓｕｂ＿ｐｉｃ＿ｃｐｂ＿ｐａｒａｍｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、サブピクチャレベルＣＰＢ削除遅延パラメータが存在せず、ＣＰＢがアクセスユニットレベルで動作することを指定し得る。シンタックス要素ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｓｕｂ＿ｔｉｃｋは、サブピクチャクロックティックカウンタの１増分（サブピクチャクロックティックと呼ばれる）に対応する周波数ｔｉｍｅ＿ｓｃａｌｅＨｚで動作するクロックの時間単位の数を表す。上記で説明したＨＲＤパラメータは、すべての時間レイヤ表現に適用可能であり得る。

[0109]１に等しく設定されたシンタックス要素ｖｕｉ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ＶＰＳ中にｖｕｉ＿ｖｐｓ（）シンタックス構造が存在することを指定する。０に等しく設定されたこのフラグは、ｖｕｉ＿ｖｐｓ（）シンタックス要素が存在しないことを指定する。シンタックス要素ｎｕｍ＿ｖｐｓ＿ｓｈｏｒｔ＿ｔｅｒｍ＿ｒｅｆ＿ｐｉｃ＿ｓｅｔｓは、ビデオパラメータセット中で指定される短期参照ピクチャセットの数を指定する。１に等しく設定されたシンタックス要素ｂｉｔｒａｔｅ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ビデオパラメータセット中にｉ番目の時間レイヤについてのビットレート情報が存在することを指定する。０に設定されたシンタックス要素ｂｉｔｒａｔｅ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ＶＰＳ中にｉ番目の時間レイヤについてのビットレート情報が存在しないことを指定する。

[0110]１に設定されたシンタックス要素ｆｒｍ＿ｒａｔｅ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ビデオパラメータセット中にｉ番目の時間レイヤについてのフレームレート情報が存在することを指定する。０に等しく設定されたシンタックス要素ｆｒｍ＿ｒａｔｅ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ビデオパラメータセット中にｉ番目の時間レイヤについてのフレームレート情報が存在しないことを指定する。

[0111]シンタックス要素ａｖｇ＿ｂｉｔｒａｔｅ［ｉ］は、ｉ番目の時間レイヤ表現の平均ビットレートを示す。ビット毎秒でのｉ番目の時間レイヤ表現の平均ビットレートはＢｉｔＲａｔｅＢＰＳ（ａｖｇ＿ｂｉｔｒａｔｅ［ｉ］）によって与えられ、ただし、関数ＢｉｔＲａｔｅＢＰＳ（）は次式によって指定される。

[0112]この平均ビットレートは、ＨＥＶＣ規格の付属書類Ｃにおいて規定されているアクセスユニット削除時間に従って導出され得る。以下において、ｂＴｏｔａｌは、ｉ番目の時間レイヤ表現のすべてのＮＡＬユニット中のビット数であり、ｔ₁は、ＶＰＳが適用される最初のアクセスユニットの（秒での）削除時間であり、ｔ₂は、ＶＰＳが適用される（復号順序で）最後のアクセスユニットの（秒での）削除時間である。

[0113]ｘがａｖｇ＿ｂｉｔｒａｔｅ［ｉ］の値を指定する場合、以下が適用される。

− ｔ₁がｔ₂に等しくない場合、以下の条件が真であり得る。

− 他の場合（ｔ₁がｔ₂に等しい）、以下の条件が真であり得る。

[0114]シンタックス要素ｍａｘ＿ｂｉｔｒａｔｅ＿ｌａｙｅｒ［ｉ］は、付属書類Ｃにおいて規定されているアクセスユニット削除時間の、任意の１秒時間ウィンドウ中のｉ番目の時間レイヤ表現のビットレートについての上限を示す。ビット毎秒での現在スケーラブルレイヤのビットレートの上限はＢｉｔＲａｔｅＢＰＳ（ｍａｘ＿ｂｉｔｒａｔｅ＿ｌａｙｅｒ［ｉ］）によって与えられ、ただし、関数ＢｉｔＲａｔｅＢＰＳ（）は式Ｇ−３６９において指定されている。このビットレート値は、ＨＥＶＣ規格の付属書類Ｃにおいて規定されているアクセスユニット削除時間に従って導出され得る。以下において、ｔ₁は（秒での）任意の時点であり、ｔ₂は、ｔ₁＋ｍａｘ＿ｂｉｔｒａｔｅ＿ｃａｌｃ＿ｗｉｎｄｏｗ［ｉ］÷１００に等しく設定され、ｂＴｏｔａｌは、アクセスユニットに属する現在スケーラブルレイヤのすべてのＮＡＬユニット中のビット数であり、削除時間は、ｔ₁よりも大きいかまたはそれに等しく、ｔ₂よりも小さい。ｘがｍａｘ＿ｂｉｔｒａｔｅ＿ｌａｙｅｒ［ｉ］の値を指定する場合、ｔ₁のすべての値について以下の条件に従い得る。

[0115]シンタックス要素ｃｏｎｓｔａｎｔ＿ｆｒｍ＿ｒａｔｅ＿ｉｄｃ［ｉ］は、ｉ番目の時間レイヤ表現のフレームレートが固定であるかどうかを示す。以下において、時間セグメントｔＳｅｇは、現在時間レイヤ表現の、復号順序で２つ以上の連続するアクセスユニットの任意のセットであり、ｆＴｏｔａｌ（ｔＳｅｇ）は、時間セグメントｔＳｅｇ中のピクチャの数であり、ｔ₁（ｔＳｅｇ）は、時間セグメントｔＳｅｇの（復号順序で）最初のアクセスユニットの（秒での）削除時間であり、ｔ₂（ｔＳｅｇ）は、時間セグメントｔＳｅｇの（復号順序で）最後のアクセスユニットの（秒での）削除時間であり、ａｖｇＦＲ（ｔＳｅｇ）は、時間セグメントｔＳｅｇ中の平均フレームレートであり、次式によって与えられる。

[0116]ｉ番目の時間レイヤ表現がただ１つのアクセスユニットを含んでいるか、またはａｖｇＦＲ（ｔＳｅｇ）の値がｉ番目の時間レイヤ表現のすべての時間セグメントにわたって一定である場合、フレームレートは固定であり、そうでない場合、フレームレートは固定でない。０に等しく設定されたシンタックス要素ｃｏｎｓｔａｎｔ＿ｆｒｍ＿ｒａｔｅ＿ｉｄｃ［ｉ］は、ｉ番目の時間レイヤ表現のフレームレートが固定でないことを示す。１に等しく設定されたシンタックス要素ｃｏｎｓｔａｎｔ＿ｆｒｍ＿ｒａｔｅ＿ｉｄｃ［ｉ］は、ｉ番目の時間レイヤ表現のフレームレートが固定であることを示す。

[0117]２に等しく設定されたシンタックス要素ｃｏｎｓｔａｎｔ＿ｆｒｍ＿ｒａｔｅ＿ｉｄｃ［ｉ］は、ｉ番目の時間レイヤ表現のフレームレートが固定であることも固定でないこともあることを示す。ｃｏｎｓｔａｎｔ＿ｆｒｍ＿ｒａｔｅ＿ｉｄｃ［ｉ］の値は、両端値を含む０〜２の範囲内にあり得る。

[0118]シンタックス要素ａｖｇ＿ｆｒｍ＿ｒａｔｅ［ｉ］は２５６秒ごとのフレームの単位での、ｉ番目の時間レイヤ表現の平均フレームレートを示す。ｆＴｏｔａｌがｉ番目の時間レイヤ表現におけるピクチャの数である場合、ｔ₁は、ＶＰＳが適用される最初のアクセスユニットの（秒での）削除時間であり、ｔ₂は、ＶＰＳが適用される（復号順序で）最後のアクセスユニットの（秒での）削除時間であり、以下が適用される。

[0119]ｔ₁がｔ₂に等しくない場合、以下の条件が真であり得る。

他の場合（ｔ₁がｔ₂に等しい）、以下の条件が真であり得る。

[0120]次にＶＵＩパラメータセマンティクスについて説明する。ＶＵＩパラメータ中の各シンタックス要素は、ＷＤ７において規定されているＶＵＩパラメータシンタックス中の同じ名前をもつシンタックス要素と同じセマンティクスを有する。

[0121]次にシーケンスパラメータセットＲＢＳＰセマンティクスについて説明する。１に等しく設定されたシンタックス要素ｕｓｅ＿ｒｐｓ＿ｆｒｏｍ＿ｖｐｓ＿ｆｌａｇは、シーケンスパラメータセット中に含まれる短期参照ピクチャセットが、参照されるビデオパラメータセット中に含まれる短期参照ピクチャセットに対して加法的であることを指定する。０に等しく設定されたシンタックス要素ｕｓｅ＿ｒｐｓ＿ｆｒｏｍ＿ｖｐｓ＿ｆｌａｇは、シーケンスパラメータセット中に含まれる短期参照ピクチャセットが、参照されるビデオパラメータセット中に含まれる短期参照ピクチャセットをオーバーライドすることを指定する。

[0122]代替的に、シンタックス要素ｎｕｍ＿ｓｈｏｒｔ＿ｔｅｒｍ＿ｒｅｆ＿ｐｉｃ＿ｓｅｔｓはＳＰＳ中に存在しないことがあり、０に等しく設定されると常に推論され得る。代替的に、シンタックス要素ｕｓｅ＿ｒｐｓ＿ｆｒｏｍ＿ｖｐｓ＿ｆｌａｇは存在しないことがあり、１に等しく設定されると常に推論され得る。代替的に、シンタックス要素ｕｓｅ＿ｒｐｓ＿ｆｒｏｍ＿ｖｐｓ＿ｆｌａｇは存在しないことがあり、０に等しく設定されると常に推論され得る。

[0123]変数ＮｕｍＳｈｏｒｔＴｅｒｍＲｅｆＰｉｃＳｅｔｓは以下のように導出され得る。

[0124]次にスライスヘッダセマンティクスについて説明する。シンタックス要素ｓｈｏｒｔ＿ｔｅｒｍ＿ｒｅｆ＿ｐｉｃ＿ｓｅｔ＿ｉｄｘは、現在ピクチャの参照ピクチャセットの作成のために使用され得るアクティブシーケンスパラメータセット中で指定される短期参照ピクチャセットのリストへのインデックスを指定する。シンタックス要素ｓｈｏｒｔ＿ｔｅｒｍ＿ｒｅｆ＿ｐｉｃ＿ｓｅｔ＿ｉｄｘはＣｅｉｌ（Ｌｏｇ２（ＮｕｍＳｈｏｒｔＴｅｒｍＲｅｆＰｉｃＳｅｔｓ））個のビットによって表され得る。ｓｈｏｒｔ＿ｔｅｒｍ＿ｒｅｆ＿ｐｉｃ＿ｓｅｔ＿ｉｄｘの値は、両端値を含む０からｎｕｍ＿ｓｈｏｒｔ＿ｔｅｒｍ＿ｒｅｆ＿ｐｉｃ＿ｓｅｔｓ−１の範囲内にあり得、ここで、ｎｕｍ＿ｓｈｏｒｔ＿ｔｅｒｍ＿ｒｅｆ＿ｐｉｃ＿ｓｅｔｓはアクティブシーケンスパラメータセットからのシンタックス要素である。

[0125]変数ＳｔＲｐｓＩｄｘは以下のように導出され得る。

[0126]０に等しく設定されたシンタックス要素ｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｉｄｃは、コード化ビデオシーケンス中のどんなピクチャによって参照される各ピクチャパラメータセットも、０に等しく設定されたｔｉｌｅｓ＿ｏｒ＿ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｉｄｃを有することを示す。１に等しく設定されたシンタックス要素ｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｉｄｃは、コード化ビデオシーケンス中のどんなピクチャによって参照される各ピクチャパラメータセットも、存在するとき、シンタックス要素ｎｕｍ＿ｔｉｌｅ＿ｃｏｌｕｍｎｓ＿ｍｉｎｕｓ１、ｎｕｍ＿ｔｉｌｅ＿ｒｏｗｓ＿ｍｉｎｕｓ１、ｕｎｉｆｏｒｍ＿ｓｐａｃｉｎｇ＿ｆｌａｇ、ｃｏｌｕｍｎ＿ｗｉｄｔｈ［ｉ］、ｒｏｗ＿ｈｅｉｇｈｔ［ｉ］およびｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの同じ値を有することを示す。２に等しく設定されたシンタックス要素ｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｉｄｃｇは、コード化ビデオシーケンス中のピクチャによって参照される異なるピクチャパラメータセット中のタイルシンタックス要素が同じ値を有することも有しないこともあることを示す。ｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｉｄｃの値は、両端値を含む０〜２の範囲内にあり得る。シンタックス要素ｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｆｌａｇが存在しないとき、それは２に等しいことが推論される。

[0127]１に等しく設定されたシンタックス要素ｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｆｌａｇのシグナリングは、コード化ビデオシーケンス中の各ピクチャが、同じ方法で分配されるタイルの同じ数を有するという、デコーダに対する保証であり得、これは、マルチスレッド復号の場合における作業負荷割振りのために有用であり得る。

[0128]次に、上記で説明した第１の例と同様である第２の例について説明する。この第２の例では、ＳＰＳ中に残っていているシンタックス要素は、ＶＰＳ中に存在し、条件付きでＳＰＳ中に存在し得る。この例によるＶＰＳおよびＳＰＳのシンタックスおよびセマンティクスは変更され、表７〜表９において以下で説明する。

[0129]次に、随意のＳＰＳパラメータセマンティクスについて説明する。このシンタックス構造におけるシンタックス要素およびシンタックス構造のセマンティクスは、第１の例において指定されているように同じシンタックス要素名をもつＳＰＳ中のシンタックス要素と同じセマンティクスを有する。

[0130]次にシーケンスパラメータセットＲＢＳＰセマンティクスについて説明する。１に等しく設定されたシンタックス要素ｓｐｓ＿ｐａｒａｍｅｔｅｒｓ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇは、シーケンスパラメータセット中で指定されているｐｃｍ＿ｅｎａｂｌｅｄ＿ｆｌａｇからｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｉｄｃまでのシンタックス要素およびシンタックス構造の値が、参照されるビデオパラメータセット中で指定されている同じシンタックス要素およびシンタックス構造の値をオーバーライドすることを指定する。０に等しく設定されたシンタックス要素ｓｐｓ＿ｐａｒａｍｅｔｅｒｓ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇは、参照されるビデオパラメータセット中で指定されているｐｃｍ＿ｅｎａｂｌｅｄ＿ｆｌａｇからｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｉｄｃまでのシンタックス要素およびシンタックス構造の値が使用中である。

[0131]表７に示されたシンタックス要素ｎｅｘｔ＿ｅｓｓｅｎｔｉａｌ＿ｂｙｔｅ＿ｏｆｆｓｅｔは、表２に関して上記で説明した方法でＭＡＮＥ２９および／またはビデオデコーダ３０によって処理され、パースされ得る。同様に、シンタックス要素ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ、ｐｒｏｆｉｌｅ＿ｉｄｃ、およびｐｒｏｆｉｌｅ＿ｓｐａｃｅも、上記で説明した方法でビデオエンコーダ２０によって生成され、ビデオデコーダ３０によって処理され、パースされ得る。

[0132]第３の例は第１の例のスーパーセットである。この第３の例では、シンタックスは、拡張を実装するのがより容易になる様式で設計され得る。さらに、この例ではＶＰＳの拡張がサポートされ得る。第１の例における相対物と厳密に同じであるシンタックステーブルのシンタックス設計またはセマンティクス設計は存在しない。第３の例について、表１０〜表１９を参照しながら以下で説明する。

[0133]次にビデオパラメータセットＲＢＳＰセマンティクスについて説明する。シンタックス要素ｂｙｔｅ＿ａｌｌｉｇｎｅｄ＿ｂｉｔｓは、ｎｕｍ＿ａｄｄｉｔｉｏｎａｌ＿ｐｒｏｆｉｌｅ＿ｌｅｖｅｌ＿ｉｎｆｏより前のＶＰＳＮＡＬユニット中のビットをバイト整合させる可能なビットを指定する。シンタックス要素ｂｙｔｅ＿ａｌｌｉｇｎｅｄ＿ｂｉｔｓは、両端値を含む０〜７の範囲内にある。シンタックス要素ｎｕｍ＿ａｄｄｉｔｉｏｎａｌ＿ｐｒｏｆｉｌｅ＿ｌｅｖｅｌ＿ｉｎｆｏは、ＶＰＳ中に存在する追加のプロファイルおよびレベル情報テーブルの数を指定する。シンタックス要素ｎｕｍ＿ａｄｄｉｔｉｏｎａｌ＿ｒｅｐ＿ｆｒｏｍａｔ＿ｉｎｆｏは、ＶＰＳ中に存在する追加の表現フォーマット情報テーブルの数を指定する。シンタックス要素ｎｕｍ＿ａｄｄｉｔｉｏｎａｌ＿ｄｅｐｅｎｄｅｎｃｙ＿ｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔｓは、時間スケーラビリティにかかわらず、ビットストリーム中にさらに存在する従属性動作点の数を指定する。各従属性動作点は時間サブ動作点を含み得、その各々は同じレイヤ構造を有する。シンタックス要素ｅｘｔｅｎｓｉｏｎ＿ｔｙｐｅは、現在ビットストリームの拡張のタイプを指定し、ただし、０は３ＤＶに対応し、１はＳＶＣに対応する。シンタックス要素ｐｒｏｆｉｌｅ＿ｌｅｖｅｌ＿ｉｎｄｅｘ［ｋ］は、現在のｋ番目の従属性動作点についてＶＰＳ中でシグナリングされるレベル情報テーブルへのインデックスを示す。シンタックス要素ｒｅｆ＿ｆｏｒｍａｔ＿ｉｎｄｅｘは、現在のｋ番目の従属性動作点についてＶＰＳ中でシグナリングされる表現フォーマット情報テーブルへのインデックスを示す。

[0134]シンタックス要素ａｐｐｌｉｃａｂｌｅ＿ｌｏｗｅｓｔ＿ｔｅｍｐｏｒａｌ＿ｉｄ［ｋ］およびａｐｐｌｉｃａｂｌｅ＿ｈｉｇｈｅｓｔ＿ｔｅｍｐｏｒａｌ＿ｉｄ［ｋ］は、それぞれ、ｋ番目の従属性動作点のシグナリングされる時間サブ動作点に対応する最も低いｔｅｍｐｏｒａｌ＿ｉｄ値および最も高いｔｅｍｐｏｒａｌ＿ｉｄ値を指定する。代替的に、シンタックス要素ａｐｐｌｉｃａｂｌｅ＿ｌｏｗｅｓｔ＿ｔｅｍｐｏｒａｌ＿ｉｄ［ｋ］およびａｐｐｌｉｃａｂｌｅ＿ｈｉｇｈｅｓｔ＿ｔｅｍｐｏｒａｌ＿ｉｄ［ｋ］は両方ともシグナリングされず、それぞれ０およびｖｐｓ＿ｍａｘ＿ｔｅｍｐｏｒａｌ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１に等しいと推論される。代替的に、シンタックス要素ａｐｐｌｉｃａｂｌｅ＿ｌｏｗｅｓｔ＿ｔｅｍｐｏｒａｌ＿ｉｄ［ｋ］はシグナリングされず、０に等しいと推論される。代替的に、シンタックス要素ａｐｐｌｉｃａｂｌｅ＿ｈｉｇｈｅｓｔ＿ｔｅｍｐｏｒａｌ＿ｉｄ［ｋ］はシグナリングされず、ｖｐｓ＿ｍａｘ＿ｔｅｍｐｏｒａｌ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１に等しいと推論される。

[0135]１に等しいシンタックス要素ｄｅｐｔｈ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｋ］は、現在の３ＤＶ従属性動作点が深度を含んでいることを示す。０に等しいこのフラグは、現在の３ＤＶ動作点が深度を含んでいないことを示す。代替的に、シンタックス要素ｄｅｐｔｈ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｋ］はシグナリングされず、したがって、深度ＶＣＬＮＡＬユニットがｌａｙｅｒ＿ｉｄ＿ｐｌｕｓｔ１に従属することを示す。

[0136]シンタックス要素ｎｕｍ＿ｔａｒｇｅｔ＿ｏｕｔｐｕｔ＿ｖｉｅｗｓ＿ｍｉｎｕｓ１［ｋ］＋１は、ｋ番目の従属性動作点におけるターゲット出力ビューの数を指定する。シンタックス要素ｎｕｍ＿ｄｅｐｅｄｅｎｔ＿ｌａｙｅｒｓ［ｋ］は、現在のｋ番目の従属性動作点を復号するための従属レイヤの数を示す。シンタックス要素ｌａｙｅｒ＿ｉｄ［ｋ］［ｊ］は、ｋ番目の従属性動作点のｊ番目のターゲット出力ビューのｌａｙｅｒ＿ｉｄを示す。シンタックス要素ｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｉｄ［ｋ］［ｊ］は、ｋ番目の従属性動作点のｊ番目の従属ビューのｌａｙｅｒ＿ｉｄを示す。一代替形態では、フラグが、ｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｉｄ［ｋ］［ｊ］の直後に、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｔ＿ｆｌａｇ［ｋ］［ｊ］としてシグナリングされる。

[0137]シンタックス要素ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｔ＿ｆｌａｇ［ｋ］［ｊ］は、ｊ番目の従属ビューが、インターバイＲＰＳを導出するために使用されるべき直接従属ビューであるかどうかを示す。シンタックス要素ｌａｙｅｒ＿ｉｄ［ｋ］は、現在のｋ番目の（ＳＶＣ）従属性動作点の最も高いｌａｙｅｒ＿ｉｄを示す。代替的に、ｎｕｍ＿ｔａｒｇｅｔ＿ｏｕｔｐｕｔ＿ｖｉｅｗｓ＿ｍｉｎｕｓ１［ｋ］、ｎｕｍ＿ｄｅｐｅｄｅｎｔ＿ｌａｙｅｒｓ［ｋ］、ｌａｙｅｒ＿ｉｄ［ｋ］［ｊ］およびｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｉｄ［ｋ］［ｊ］はｕｅ（ｖ）としてシグナリングされ得る。

[0138]シンタックス要素ｎｕｍ＿ａｄｄｉｔｉｏｎａｌ＿ｖｕｉ＿ｖｐｓ＿ｓｅｔ＿ｉｎｆｏは、ＶＰＳ中に存在する追加のＶＵＩＶＰＳセットテーブルの数を指定し得る。

[0139]プロファイルおよびレベル情報テーブルセマンティクスについて、シンタックス要素ｐｒｏｆｉｌｅＬｅｖｅｌＩｎｆｏＩｄｘが、プロファイルおよびレベル情報テーブルのインデックスを示す。表現フォーマット情報テーブルセマンティクスについて、シンタックス要素ｒｅｐＦｏｒｍａｔＩｎｆｏＩｄｘが、表現フォーマット情報テーブルのインデックスを示す。

[0140]表７に示されたシンタックス要素ｎｅｘｔ＿ｅｓｓｅｎｔｉａｌ＿ｂｙｔｅ＿ｏｆｆｓｅｔは、表２に関して上記で説明した方法でＭＡＮＥ２９および／またはビデオデコーダ３０によって処理され、パースされ得る。

[0141]ＶＵＩＶＰＳセットテーブルセマンティクスについて、シンタックス要素ｖｕｉＶｐｓＳｅｔＩｎｄｅｘが、ＶＵＩＶＰＳセットテーブルのインデックスを示す。

[0142]代替的に、各ビューのビュー従属性が、以下のようにＳＰＳ中でシグナリングされ得る。

[0143]シンタックス要素ｎｕｍ＿ｒｅｆｅｒｅｎｃｅ＿ｖｉｅｗｓは、ビュー間ＲＰＳサブセットを構成するために使用されるテクスチャまたは深度ビューの最大数を示す。シンタックス要素ｒｅｆ＿ｖｉｅｗ＿ｌａｙｅｒ＿ｉｄ［ｉ］は、ビュー間ＲＰＳサブセット中のｉ番目のビュー間（のみの）参照ピクチャを示すために使用されるｉ番目のテクスチャ／深度ビューのｌａｙｅｒ＿ｉｄを識別する。

[0144]代替的に、ＶＰＳ拡張は以下のようにシグナリングされ得る。シンタックス要素ｅｘｔｅｎｓｉｏｎ＿ｔｙｐｅがＳＶＣを示すとき、シンタックス要素ｎｕｍ＿ａｄｄｉｔｉｏｎａｌ＿ｄｅｐｅｎｄｅｎｃｙ＿ｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔｓはシグナリングされないが、ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１に等しくなるように導出される。アクセスユニット内のＶＣＬＮＡＬユニットがｌａｙｅｒ＿ｉｄの非降順にあるという制約が与えられる。ＭＶＣでは、シンタックス要素ｌａｙｅｒ＿ｉｄがｖｉｅｗ＿ｉｄｘに等しい。３ＤＶでは、シンタックス要素ｖｉｅｗ＿ｉｄｘは、ｌａｙｅｒ＿ｉｄによってｖｉｅｗ＿ｉｄｘ＝（ｌａｙｅｒ＿ｉｄｘ＞＞１）のように計算され得る。

[0145]１に等しく設定されたシンタックス要素ｄｅｐｔｈ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、深度を含んでいる動作点があり得ることを示す。０に等しく設定されたシンタックス要素ｄｅｐｔｈ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、どの動作点も深度を含んでいないことを示す。

[0146]シンタックス要素ｎｕｍ＿ｔａｒｇｅｔ＿ｏｕｔｐｕｔ＿ｖｉｅｗｓ＿ｍｉｎｕｓ１［ｋ］＋１は、ｋ番目の従属性動作点におけるターゲット出力ビューの数を指定するために使用され得る。シンタックス要素ｎｕｍ＿ｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒｓ［ｋ］は、現在のｋ番目の従属性動作点を復号するための従属レイヤの数を示すために使用され得る。ｄｅｐｔｈ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが１に等しく設定されたとき、従属レイヤは、深度ビューまたはテクスチャビューのいずれかであるか両方であり得る。シンタックス要素ｌａｙｅｒ＿ｉｄ［ｋ］［ｊ］は、ｋ番目の従属性動作点のｊ番目のターゲット出力テクスチャビューのｌａｙｅｒ＿ｉｄを示す。テクスチャビューに関連付けられた深度ビューのｌａｙｅｒ＿ｉｄは、存在する場合、ｌａｙｅｒ＿ｉｄ［ｋ］［ｊ］＋１である。

[0147]代替的に、ｌａｙｅｒ＿ｉｄ［ｋ］［ｊ］の代わりにシンタックス要素ｖｉｅｗ＿ｉｄｘ［ｋ］［ｊ］がターゲット出力ビューごとにシグナリングされ得る。ｖｉｅｗ＿ｉｄｘ［ｋ］［ｊ］ごとに、対応するテクスチャビューのｌａｙｅｒ＿ｉｄは（ｖｉｅｗ＿ｉｄｘ［ｋ］［ｊ］＜＜ｄｅｐｔｈ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ）である。ｄｅｐｔｈ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｋ］が１に等しい場合、対応する深度ビューのｌａｙｅｒ＿ｉｄは（ｖｉｅｗ＿ｉｄｘ［ｋ］［ｊ］＜＜ｄｅｐｔｈ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ）＋１であり、それは、この場合ｄｅｐｔｈ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが１でなければならないので、（ｖｉｅｗ＿ｉｄｘ［ｋ］［ｊ］＜＜１）＋１である。代替的に、シンタックス要素ｌａｙｅｒ＿ｉｄ［ｋ］［ｊ］はｖｉｅｗ＿ｉｄｘ［ｋ］［ｊ］に変更され得、ｕ（ｖ）コーディングされ、ただし長さは５−ｄｅｐｔｈ＿ｐｒｅｓｅｎｔ＿ｆｌａｇである。代替的に、シンタックス要素ｌａｙｅｒ＿ｉｄ［ｋ］［ｊ］はｖｉｅｗ＿ｉｄｘ［ｋ］［ｊ］に変更され得、ｕ（ｖ）コーディングされ、ただし長さは５−ｄｅｐｔｈ＿ｉｎｃｌｕｄｅｄ［ｋ］である。

[0148]第４の例は、第２の例のスーパーセットである。シンタックスは拡張フレンドリーな方法で設計される。さらに、この例ではＶＰＳの拡張が行われる。第２の例における相対物と厳密に同じであるシンタックステーブルのシンタックス設計またはセマンティクス設計は存在しない。

[0149]表２１に示されたシンタックス要素ｎｅｘｔ＿ｅｓｓｅｎｔｉａｌ＿ｂｙｔｅ＿ｏｆｆｓｅｔは、表２に関して上記で説明した方法でＭＡＮＥ２９および／またはビデオデコーダ３０によって処理され、パースされ得る。

[0150]図４は、本開示で説明する技法を実装し得る例示的なビデオエンコーダ２０を示すブロック図である。ビデオエンコーダ２０は、たとえば、表１〜表２１に関して上記で説明したシンタックス構造を生成し得る。ビデオエンコーダ２０は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実行し得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間的冗長性を低減または除去するために時間的予測に依拠する。イントラモード（Ｉモード（登録商標））は、いくつかの空間ベースの圧縮モードのいずれかを指し得る。単方向予測（Ｐモード）または双方向予測（Ｂモード）などのインターモードは、いくつかの時間ベースの圧縮モードのいずれかを指し得る。

[0151]図４の例では、ビデオエンコーダ２０は、区分ユニット３５と、予測処理ユニット４１と、フィルタユニット６３と、ピクチャメモリ６４と、加算器５０と、変換処理ユニット５２と、量子化ユニット５４と、エントロピー符号化ユニット５６とを含む。予測処理ユニット４１は、動き推定ユニット４２と、動き補償ユニット４４と、イントラ予測処理ユニット４６とを含む。ビデオブロック再構成のために、ビデオエンコーダ２０はまた、逆量子化ユニット５８と、逆変換処理ユニット６０と、加算器６２とを含む。フィルタユニット６３は、デブロッキングフィルタ、適応ループフィルタ（ＡＬＦ：adaptive loop filter）、およびサンプル適応オフセット（ＳＡＯ：sample adaptive offset）フィルタなど、１つまたは複数のループフィルタを表すものとする。図４ではフィルタユニット６３はループ内フィルタであるとして示されているが、他の構成では、フィルタユニット６３はループ後フィルタとして実装され得る。図４はまた、ビデオエンコーダ２０によって生成された符号化ビデオデータに対して追加の処理を実行し得る後処理デバイス５７を示す。オフセットシンタックス要素をもつパラメータセットを生成することを含む本開示の技法は、いくつかの事例ではビデオエンコーダ２０によって実装され得る。しかしながら、他の事例では、本開示の技法は後処理デバイス５７によって実装され得る。

[0152]図４に示すように、ビデオエンコーダ２０はビデオデータを受信し、区分ユニット３５はデータをビデオブロックに区分する。この区分は、たとえば、ＬＣＵおよびＣＵの４分木構造に応じて、スライス、タイル、または他のより大きいユニットへの区分、ならびにビデオブロック区分をも含み得る。ビデオエンコーダ２０は、概して、符号化されるべきビデオスライス内のビデオブロックを符号化する構成要素を示す。スライスは、複数のビデオブロックに（および、場合によっては、タイルと呼ばれるビデオブロックのセットに）分割され得る。予測処理ユニット４１は、誤差結果（たとえば、コーディングレートおよびひずみレベル）に基づいて現在ビデオブロックのために、複数のイントラコーディングモードのうちの１つ、または複数のインターコーディングモードのうちの１つなど、複数の可能なコーディングモードのうちの１つを選択し得る。予測処理ユニット４１は、得られたイントラコード化ブロックまたはインターコード化ブロックを、残差ブロックデータを生成するために加算器５０に与え、参照ピクチャとして使用するための符号化ブロックを再構成するために加算器６２に与え得る。

[0153]予測処理ユニット４１内のイントラ予測処理ユニット４６は、空間圧縮を行うために、コーディングされるべき現在ブロックと同じフレームまたはスライス中の１つまたは複数の隣接ブロックに対して現在ビデオブロックのイントラ予測コーディングを実行し得る。予測処理ユニット４１内の動き推定ユニット４２および動き補償ユニット４４は、時間圧縮を行うために、１つまたは複数の参照ピクチャ中の１つまたは複数の予測ブロックに対して現在ビデオブロックのインター予測コーディングを実行する。

[0154]動き推定ユニット４２は、ビデオシーケンスの所定のパターンに従ってビデオスライスのためのインター予測モードを判断するように構成され得る。所定のパターンは、シーケンス中のビデオスライスをＰスライス、ＢスライスまたはＧＰＢスライスに指定し得る。動き推定ユニット４２と動き補償ユニット４４とは、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット４２によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、参照ピクチャ内の予測ブロックに対する現在ビデオフレームまたはピクチャ内のビデオブロックのＰＵの変位を示し得る。

[0155]予測ブロックは、絶対差分和（ＳＡＤ：sum of absolute difference）、２乗差分和（ＳＳＤ：sum of square difference）、または他の差分メトリックによって判断され得るピクセル差分に関して、コーディングされるべきビデオブロックのＰＵにぴったり一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ２０は、ピクチャメモリ６４に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ２０は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定ユニット４２は、フルピクセル位置と分数ピクセル位置とに対する動き探索を実行し、分数ピクセル精度で動きベクトルを出力し得る。

[0156]動き推定ユニット４２は、ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライスにおけるビデオブロックのＰＵのための動きベクトルを計算する。参照ピクチャは、第１の参照ピクチャリスト（リスト０）または第２の参照ピクチャリスト（リスト１）から選択され得、それらの参照ピクチャリストの各々は、ピクチャメモリ６４に記憶された１つまたは複数の参照ピクチャを識別する。動き推定ユニット４２は、計算された動きベクトルをエントロピー符号化ユニット５６と動き補償ユニット４４とに送る。

[0157]動き補償ユニット４４によって実行される動き補償は、動き推定によって判断された動きベクトルに基づいて予測ブロックをフェッチまたは生成すること、場合によってはサブピクセル精度への補間を実行することを伴い得る。現在ビデオブロックのＰＵのための動きベクトルを受信すると、動き補償ユニット４４は、参照ピクチャリストのうちの１つにおいて動きベクトルが指す予測ブロックの位置を特定し得る。ビデオエンコーダ２０は、コーディングされている現在ビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって残差ビデオブロックを形成する。ピクセル差分値は、ブロックの残差データを形成し、ルーマ差分成分とクロマ差分成分の両方を含み得る。加算器５０は、この減算演算を実行する１つまたは複数の構成要素を表す。動き補償ユニット４４はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ３０が使用するための、ビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。

[0158]イントラ予測処理ユニット４６は、上記で説明したように、動き推定ユニット４２と動き補償ユニット４４とによって実行されるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測処理ユニット４６は、現在ブロックを符号化するために使用すべきイントラ予測モードを判断し得る。いくつかの例では、イントラ予測処理ユニット４６は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在ブロックを符号化し得、イントラ予測処理ユニット４６（または、いくつかの例では、モード選択ユニット４０）は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。たとえば、イントラ予測処理ユニット４６は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ（または誤差）の量、ならびに符号化ブロックを生成するために使用されるビットレート（すなわち、ビット数）を判断する。イントラ予測処理ユニット４６は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを判断するために、様々な符号化ブロックのひずみおよびレートから比を計算し得る。

[0159]いずれの場合も、ブロックのためのイントラ予測モードを選択した後に、イントラ予測処理ユニット４６は、ブロックのための選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット５６に与え得る。エントロピー符号化ユニット５６は、本開示の技法に従って、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ２０は、送信ビットストリーム中に、複数のイントラ予測モードインデックステーブルおよび複数の変更されたイントラ予測モードインデックステーブル（コードワードマッピングテーブルとも呼ばれる）と、様々なブロックの符号化コンテキストの定義と、コンテキストの各々について使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、および変更されたイントラ予測モードインデックステーブルの指示とを含み得る構成データを含め得る。

[0160]予測処理ユニット４１が、インター予測またはイントラ予測のいずれかを介して、現在ビデオブロックのための予測ブロックを生成した後に、ビデオエンコーダ２０は、現在ビデオブロックから予測ブロックを減算することによって残差ビデオブロックを形成する。残差ブロック中の残差ビデオデータは、１つまたは複数のＴＵ中に含まれ、変換処理ユニット５２に適用され得る。変換処理ユニット５２は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換などの変換を使用して、残差ビデオデータを残差変換係数に変換する。変換処理ユニット５２は、残差ビデオデータをピクセル領域から周波数領域などの変換領域に変換し得る。

[0161]変換処理ユニット５２は、得られた変換係数を量子化ユニット５４に送り得る。量子化ユニット５４は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化ユニット５４は、次いで、量子化変換係数を含む行列の走査を実行し得る。代替的に、エントロピー符号化ユニット５６が走査を実行し得る。

[0162]量子化の後に、エントロピー符号化ユニット５６は、量子化変換係数をエントロピー符号化する。たとえば、エントロピー符号化ユニット５６は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コーディングあるいは別のエントロピー符号化方法または技法を実行し得る。エントロピー符号化ユニット５６によるエントロピー符号化の後に、符号化ビットストリームは、ビデオデコーダ３０に送信されるか、あるいはビデオデコーダ３０が後で送信するかまたは取り出すためにアーカイブされ得る。エントロピー符号化ユニット５６はまた、コード化されている現在ビデオスライスのための動きベクトルと他のシンタックス要素とをエントロピー符号化し得る。

[0163]逆量子化ユニット５８および逆変換処理ユニット６０は、それぞれ逆量子化および逆変換を適用して、参照ピクチャの参照ブロックとして後で使用するために、ピクセル領域において残差ブロックを再構成する。動き補償ユニット４４は、残差ブロックを参照ピクチャリストのうちの１つ内の参照ピクチャのうちの１つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット４４はまた、再構成された残差ブロックに１つまたは複数の補間フィルタを適用して、動き推定において使用するサブ整数ピクセル値を計算し得る。加算器６２は、再構築された残差ブロックを動き補償ユニット４４によって生成された動き補償予測ブロックに加算して、ピクチャメモリ６４に記憶するための参照ブロックを生成する。参照ブロックは、後続のビデオフレームまたはピクチャ中のブロックをインター予測するために、動き推定ユニット４２および動き補償ユニット４４によって参照ブロックとして使用され得る。

[0164]このように、図４のビデオエンコーダ２０は、表１〜表２１において上記で説明したシンタックスを生成するように構成されたビデオエンコーダの一例を表す。ビデオエンコーダ２０は、たとえば、上記で説明したようにＶＰＳ、ＳＰＳ、ＰＰＳ、およびＡＰＳパラメータセットを生成し得る。一例では、ビデオエンコーダ２０は、１つまたは複数の初期固定長シンタックス要素と、それに続くオフセットシンタックス要素とを含むコード化ビデオデータのためのパラメータセットを生成し得る。１つまたは複数の初期固定長シンタックス要素は、たとえば、セッションネゴシエーションに関係する情報を含み得る。オフセットシンタックス要素は、パラメータセットがＭＡＮＥによって処理されるときにスキップされるべきバイト数を示し得る。スキップされるべき数のバイトは、たとえば、１つまたは複数の可変長シンタックス要素を含み得る。ビデオエンコーダ２０は、パラメータセット中に、スキップされるバイトに続いて、追加の固定長シンタックス要素を含み得る。追加の固定長シンタックス要素は、たとえば、ビデオデータの別のレイヤに関係する情報を含み得る。一例では、初期固定長シンタックス要素は、ベースレイヤのためのセッションネゴシエーションに関係する情報を含み得るが、追加の固定長シンタックス要素は、非ベースレイヤのためのセッションネゴシエーションに関係する情報を含み得る。

[0165]ビデオエンコーダ２０は、１つまたは複数の可変長シンタックス要素をコーディングするために使用されるビット数に基づいてオフセットシンタックス要素の値を判断し得る。たとえば、第１のＶＰＳについて、スキップされるべきシンタックス要素が、２ビット、３ビット、および５ビットという３つの固定長シンタックス要素、ならびに２ビット、４ビット、５ビット、および３ビットという４つの可変長シンタックス要素を含むと仮定する。この例では、固定長シンタックス要素は合計１０ビットを含むが、可変長シンタックス要素は合計１４ビットを含む。したがって、第１のＶＰＳについて、ビデオエンコーダ２０は、２４ビット（たとえば３バイト）がスキップされるべきであることを含めて、オフセットシンタックス要素の値を２４に設定し得る。第２のＶＰＳについては、固定シンタックス要素のビット数は同じく１０になるが、可変長シンタックス要素のために使用されるビット数は異なり得る。したがって、第２のＶＰＳについて、ビデオエンコーダ２０は、オフセットシンタックス要素のための値を異なる値に設定し得る。

[0166]本開示の技法について、概してビデオエンコーダ２０に関して説明したが、上述のように、本開示の技法のいくつかは後処理デバイス５７によっても実装され得る。たとえば、後処理デバイス５７は、ビデオエンコーダ２０によって生成されたビデオデータの複数のレイヤのためのＶＰＳを生成し得る。

[0167]図５は、本開示で説明する技法を実装し得る例示的なビデオデコーダ３０を示すブロック図である。ビデオデコーダ３０たとえば、表１〜表２１に関して上記で説明したシンタックス構造を処理し、パースするように構成され得る。図５の例では、ビデオデコーダ３０は、エントロピー復号ユニット８０と、予測処理ユニット８１と、逆量子化ユニット８６と、逆変換処理ユニット８８と、加算器９０と、フィルタユニット９１と、ピクチャメモリ９２とを含む。予測処理ユニット８１は、動き補償ユニット８２と、イントラ予測処理ユニット８４とを含む。ビデオデコーダ３０は、いくつかの例では、図４のビデオエンコーダ２０に関して説明した符号化パスとは概して逆の復号パスを実行し得る。

[0168]復号プロセス中に、ビデオデコーダ３０は、ビデオエンコーダ２０から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ３０は、ネットワークエンティティ７９から符号化ビデオビットストリームを受信し得る。ネットワークエンティティ７９は、たとえば、上記で説明した技法のうちの１つまたは複数を実装するように構成されたサーバ、ＭＡＮＥ、ビデオエディタ／スプライサ、または他のそのようなデバイスであり得る。ネットワークエンティティ７９は、ビデオエンコーダ２０を含むことも、含まないこともある。上記で説明したように、本開示で説明する技法のいくつかは、ネットワークエンティティ７９が符号化ビデオビットストリームをビデオデコーダ３０に送信するより前にネットワークエンティティ７９によって実装され得る。いくつかのビデオ復号システムでは、ネットワークエンティティ７９およびビデオデコーダ３０は別個のデバイスの部分であり得るが、他の事例では、ネットワークエンティティ７９に関して説明する機能は、ビデオデコーダ３０を備える同じデバイスによって実行され得る。

[0169]ネットワークエンティティ７９は、ビデオビットストリームに関連するパラメータセットのための１つまたは複数の初期シンタックス要素を処理することと、パラメータセット中で、パラメータセット内でスキップされるべきシンタックス要素を識別するパラメータセットのためのオフセットシンタックス要素を受信することと、オフセットシンタックス要素に基づいて、パラメータセット内のシンタックス要素をスキップすることとを行うように構成されたビデオ処理デバイスの一例を表す。ネットワークエンティティ７９はまた、パラメータセット中の１つまたは複数の追加のシンタックス要素を処理し得る。１つまたは複数の追加のシンタックス要素は、パラメータセット中のスキップされるシンタックス要素の後にある。

[0170]復号プロセス中に、ビデオデコーダ３０は、ビデオエンコーダ２０から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオブロックは、たとえば、図１のＭＡＮＥ２９または図５のネットワークエンティティ７９など、１つまたは複数のＭＡＮＥを介してビデオエンコーダ２０からビデオデコーダ３０にルーティングされ得る。ビデオデコーダ３０のエントロピー復号ユニット８０は、ビットストリームをエントロピー復号して、量子化係数、動きベクトル、および他のシンタックス要素を生成する。エントロピー復号ユニット８０は、予測処理ユニット８１に動きベクトルと他のシンタックス要素とを転送する。ビデオデコーダ３０は、ビデオスライスレベルおよび／またはビデオブロックレベルでシンタックス要素を受信し得る。

[0171]上記で紹介したように、エントロピー復号ユニット８０は、ＶＰＳ、ＳＰＳ、ＰＰＳ、およびＡＰＳなど、または複数のパラメータセット中の固定長シンタックス要素と可変長シンタックス要素の両方を処理し、パースし得る。パラメータセットのうちの１つまたは複数、たとえばＶＰＳ中で、ビデオデコーダ３０は、本開示で説明するオフセットシンタックス要素を受信し得る。オフセットシンタックス要素を受信したことに応答して、ビデオデコーダ３０は、オフセットシンタックス要素の値を本質的に無視することができる。たとえば、ビデオデコーダ３０は、オフセットシンタックス要素を受信し得るが、いかなるシンタックス要素をもスキップすることなしにオフセットシンタックス要素に後続する、可変長シンタックス要素を含むシンタックス要素を復号し続け得る。

[0172]ビデオスライスがイントラコード化（Ｉ）スライスとしてコーディングされたとき、予測処理ユニット８１のイントラ予測処理ユニット８４は、シグナリングされたイントラ予測モードと、現在フレームまたはピクチャの前に復号されたブロックからのデータとに基づいて、現在ビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化（すなわち、Ｂ、ＰまたはＧＰＢ）スライスとしてコーディングされたとき、予測処理ユニット８１の動き補償ユニット８２は、エントロピー復号ユニット８０から受信された動きベクトルおよび他のシンタックス要素に基づいて、現在ビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの１つ内の参照ピクチャのうちの１つから生成され得る。ビデオデコーダ３０は、ピクチャメモリ９２に記憶された参照ピクチャに基づいて、デフォルトの構成技法を使用して、参照フレームリスト、すなわち、リスト０およびリスト１を構成し得る。

[0173]動き補償ユニット８２は、動きベクトルと他のシンタックス要素とをパースすることによって現在ビデオスライスのビデオブロックのための予測情報を判断し、その予測情報を使用して、復号されている現在ビデオブロックのための予測ブロックを生成する。たとえば、動き補償ユニット８２は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード（たとえば、イントラまたはインター予測）、インター予測スライスタイプ（たとえば、Ｂスライス、Ｐスライス、またはＧＰＢスライス）、スライスの参照ピクチャリストのうちの１つまたは複数についての構成情報、スライスの各インター符号化ビデオブロックについての動きベクトル、スライスの各インターコード化ビデオブロックについてのインター予測ステータス、および現在ビデオスライス中のビデオブロックを復号するための他の情報を判断するために、受信されたシンタックス要素のいくつかを使用する。

[0174]動き補償ユニット８２はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット８２は、ビデオブロックの符号化中にビデオエンコーダ２０によって使用された補間フィルタを使用して、参照ブロックのサブ整数ピクセルの補間値を計算し得る。この場合、動き補償ユニット８２は、受信されたシンタックス要素からビデオエンコーダ２０によって使用された補間フィルタを判断し、その補間フィルタを使用して予測ブロックを生成し得る。

[0175]逆量子化ユニット８６は、ビットストリーム中で与えられ、エントロピー復号ユニット８０によって復号された量子化変換係数を逆量子化（inverse quantize）、すなわち、逆量子化（de-quantize）する。逆量子化プロセスは、量子化の程度を判断し、同様に、適用されるべき逆量子化の程度を判断するための、ビデオスライス中の各ビデオブロックについてビデオエンコーダ２０によって計算される量子化パラメータの使用を含み得る。逆変換ユニット８８は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば、逆ＤＣＴ、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。

[0176]動き補償ユニット８２が、動きベクトルと他のシンタックス要素とに基づいて現在ビデオブロックのための予測ブロックを生成した後に、ビデオデコーダ３０は、逆変換処理ユニット８８からの残差ブロックを動き補償ユニット８２によって生成された対応する予測ブロックと加算することによって、復号ビデオブロックを形成する。加算器９０は、この加算演算を実行する１つまたは複数の構成要素を表す。所望される場合、ピクセル遷移を平滑化するか、またはさもなければビデオ品質を改善するために、（コーディングループ内またはコーディングループ後の）ループフィルタも使用され得る。フィルタユニット９１は、デブロッキングフィルタ、適応ループフィルタ（ＡＬＦ）、およびサンプル適応オフセット（ＳＡＯ）フィルタなど、１つまたは複数のループフィルタを表すものとする。図５ではフィルタユニット９１はループ内フィルタであるとして示されているが、他の構成では、フィルタユニット９１はループ後フィルタとして実装され得る。所与のフレームまたはピクチャ中の復号ビデオブロックは、次いで、その後の動き補償のために使用される参照ピクチャを記憶するピクチャメモリ９２に記憶される。ピクチャメモリ９２はまた、図１のディスプレイデバイス３２などのディスプレイデバイス上に後で提示するために、復号ビデオを記憶する。

[0177]このように、図５のビデオデコーダ３０は、表１〜表２１において上記で説明したシンタックスをパースするように構成されたビデオデコーダの一例を表す。ビデオデコーダ３０は、たとえば、上記で説明したようにＶＰＳ、ＳＰＳ、ＰＰＳ、およびＡＰＳパラメータセットをパースし得る。

[0178]図６は、ネットワーク１５０の一部を形成するデバイスの例示的なセットを示すブロック図である。この例では、ネットワーク１５０は、ルーティングデバイス１５４Ａ、１５４Ｂ（ルーティングデバイス１５４）と、トランスコーディングデバイス１５６とを含む。ルーティングデバイス１５４およびトランスコーディングデバイス１５６は、ネットワーク１５０の一部を形成し得る少数のデバイスを表すものである。スイッチ、ハブ、ゲートウェイ、ファイアウォール、ブリッジ、および他のそのようなデバイスなどの他のネットワークデバイスも、ネットワーク１５０内に含まれ得る。その上、サーバデバイス１５２とクライアントデバイス１５８との間にネットワーク経路に沿って追加のネットワークデバイスが与えられ得る。いくつかの例では、サーバデバイス１５２はソースデバイス１２（図１）に対応し得るが、クライアントデバイス１５８は宛先デバイス１４（図１）に対応し得る。ルーティングデバイス１５４は、たとえば、メディアデータを駆逐するように構成されたＭＡＮＥであり得る。

[0179]概して、ルーティングデバイス１５４は、ネットワーク１５０を介してネットワークデータを交換するための１つまたは複数のルーティングプロトコルを実装する。概して、ルーティングデバイス１５４は、ネットワーク１５０を介したルートを発見するためにルーティングプロトコルを実行する。そのようなルーティングプロトコルを実行することによって、ルーティングデバイス１５４Ｂは、それ自体からルーティングデバイス１５４Ａを介してサーバデバイス１５２へ至るネットワークルートを発見し得る。図６の様々なデバイスは、本開示の技法を実装し得るデバイスの例を表している。ルーティングデバイス１５４は、たとえば、本開示に従ってＶＰＳなどのパラメータセットのシンタックス要素をパースするように構成されたメディアアウェアネットワーク要素であり得る。たとえば、ルーティングデバイス１５４は、ＶＰＳ中で１つまたは複数の初期固定長シンタックス要素を受信し、その固定長シンタックス要素をパースし、処理し得る。初期固定長シンタックス要素は、たとえば、セッションネゴシエーションに関係するシンタックス要素であり得る。ルーティングデバイス１５４はまた、ＶＰＳ中で、オフセットシンタックス要素を受信し得る。オフセットシンタックス要素は、スキップされるべきバイト数を識別し得る。ルーティングデバイス１５４は、指定されたバイト数をスキップすることができ、指定されたバイト数をスキップした後に、ＶＰＳ内の固定長シンタックス要素をパースし、処理すること再開することができる。ルーティングデバイス１５４はエントロピー復号演算を実行することができないので、スキップされるバイトは、ルーティングデバイス１５４がパースすることができない１つまたは複数の可変長シンタックス要素を含み得る。

[0180]図７は、本開示の技法に従ってどのようにオフセットシンタックス要素を処理すべきかの一例を示すフローチャートである。図７の技法について、図１のＭＡＮＥ２９、または図６のルーティングデバイス１５４のうちの１つなど、ネットワークデバイスに関して説明する。ネットワークエンティティは、ビデオビットストリームに関連するパラメータセットのための１つまたは複数の初期シンタックス要素を処理する（１７１）。１つまたは複数の初期シンタックス要素は、さらに固定長シンタックス要素を含み、オフセットシンタックス要素に先行し得る。１つまたは複数の初期シンタックス要素は、セッションネゴシエーションに関係する情報を含むシンタックス要素を含み得る。さらに、１つまたは複数の初期シンタックス要素は、ビデオデータのベースレイヤのためのシンタックス要素を備え、１つまたは複数の追加のシンタックス要素は、ビデオデータの非ベースレイヤのためのシンタックス要素を備える。

[0181]ネットワークエンティティは、ビデオビットストリーム中でパラメータセットのためのオフセットシンタックス要素を受信する（１７２）。オフセットシンタックス要素は、パラメータセット内でスキップされるべきビット数を識別する。オフセットシンタックス要素は、たとえば、ビデオパラメータセットの一部であり得る。スキップされるべき数のビットは、たとえば、可変長コーディングを使用してコーディングされる１つまたは複数のシンタックス要素に対応し得る。オフセットシンタックス要素に基づいて、ネットワークエンティティは、パラメータセット内のビット数をスキップする（１７３）。ネットワークエンティティは、パラメータセット中の１つまたは複数の追加のシンタックス要素を処理する（１７４）。１つまたは複数の追加のシンタックス要素は、パラメータセット中でスキップされるビット数の後にある。１つまたは複数の追加のシンタックス要素は追加の固定長シンタックス要素であり得、１つまたは複数の追加のシンタックス要素は、オフセットシンタックス要素に後続し、スキップされるべきビットに後続し得る。

[0182]図８は、本開示の技法に従ってどのようにオフセットシンタックス要素を処理すべきかの一例を示すフローチャートである。図８の技法について、ビデオデータを符号化するかまたは符号化ビデオデータを処理するように構成されたビデオ処理デバイスに関して説明する。において符号化ビデオデータを処理するように構成されたビデオ処理デバイスの例としては、図１および図４のビデオエンコーダ２０、ならびに図４の後処理デバイス５７を含む。ビデオ処理デバイスは、ビデオビットストリームに関連するパラメータセットのための１つまたは複数の初期シンタックス要素を生成する（１８１）。１つまたは複数の初期シンタックス要素は固定長シンタックス要素を含み得、１つまたは複数の初期シンタックス要素はオフセットシンタックス要素に先行し得る。１つまたは複数の初期シンタックス要素は、セッションネゴシエーションに関係する情報を含むシンタックス要素を含み得る。１つまたは複数の初期シンタックス要素は、ビデオデータのベースレイヤのためのシンタックス要素を含み得、１つまたは複数の追加のシンタックス要素は、ビデオデータの非ベースレイヤのためのシンタックス要素を含み得る。

[0183]ビデオ処理デバイスは、パラメータセットのためのオフセットシンタックス要素を生成する（１８２）。オフセットシンタックス要素は、パラメータセット内でスキップされるべきビット数を識別し得る。オフセットシンタックス要素はビデオパラメータセットの一部であり得る。ビデオ処理デバイスは、スキップされるべき１つまたは複数のシンタックス要素を生成する（１８３）。スキップされるべきビットは、スキップされるべき１つまたは複数のシンタックス要素を含む。スキップされるべき１つまたは複数のシンタックス要素は、可変長コーディングを使用してコーディングされる１つまたは複数のシンタックス要素を含み得る。ビデオ処理デバイスは、パラメータセット中に１つまたは複数の追加のシンタックス要素を生成する（１８４）。１つまたは複数の追加のシンタックス要素は、パラメータセット中でスキップされるべきビット数の後にある。１つまたは複数の追加のシンタックス要素は追加の固定長シンタックス要素を含み得、１つまたは複数の追加のシンタックス要素は、オフセットシンタックス要素に後続し、スキップされるべきビットに後続し得る。

[0184]図９は、本開示の技法に従ってどのようにオフセットシンタックス要素を復号すべきかの一例を示すフローチャートである。図９の技法について、図１および図５のビデオデコーダ３０など、ビデオデコーダに関して説明する。ビデオデコーダは、ビデオビットストリームに関連するパラメータセットのための１つまたは複数の初期シンタックス要素を復号する（１９１）。ビデオデコーダは、ビデオビットストリーム中でパラメータセットのためのオフセットシンタックス要素を受信する（１９２）。オフセットシンタックス要素は、パラメータセット内でスキップされるべきビット数を識別する。ビデオデコーダは、スキップされるべきビットを復号する（１９３）。いくつかの例では、ビデオデコーダは、エントロピー復号を実行して、スキップされるべきビット中に含まれる可変長シンタックス要素を復号することによって、スキップされるべきビットを復号する。ＭＡＮＥなどのビデオ処理デバイスによってビデオデータが処理されているとき、ビットはスキップされるべきであるが、ビデオデータを復号するためにそれらのビットが必要であり得るので、ビデオデコーダは、たとえば、スキップされるべきビットを復号し得る。ビデオデコーダとは対照的に、ＭＡＮＥは、ビデオデータを完全に復号する必要なしにビデオデータに対してある処理を実行するために、ビットをスキップし得る。いくつかの事例では、ＭＡＮＥは、ビデオデータを復号するために必要なすべての能力を所有さえしないことがある。

[0185]図１０は、本開示の技法に従ってどのようにＶＰＳを処理すべきかの一例を示すフローチャートである。図１０の技法について、一般的なビデオ処理デバイスに関して説明する。ビデオ処理デバイスは、図１のＭＡＮＥ２９、または図６のルーティングデバイス１５４のうちの１つなど、ネットワークデバイスに対応し得る。ビデオ処理デバイスはさらに、図１および図４のビデオデコーダ３０など、ビデオデコーダに対応し得る。ビデオ処理デバイスは、ビデオパラメータセット中で、セッションネゴシエーションに関係する情報を含む１つまたは複数のシンタックス要素を受信する（２０１）。ビデオ処理デバイスは、ビデオデータ中で、ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信する（２０２）。第１のシーケンスパラメータセットは、ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを含む第１のシンタックス構造を備える。ビデオ処理デバイスは、ビデオデータ中で、ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信する（２０３）。第２のシーケンスパラメータセットは、ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを含む第２のシンタックス構造を備える。ビデオ処理デバイスは、１つまたは複数のシンタックス要素に基づいて、第１のパラメータセットに関連するビデオブロックの第１のセットと、第２のパラメータセットに関連するビデオブロックの第２のセットとを処理する（２０４）。

[0186]１つまたは複数のシンタックス要素は、たとえば、固定長シンタックス要素であり得、ビデオパラメータセット中で、どんな可変長コード化シンタックス要素にも先行し得る。１つまたは複数のシンタックス要素は、ビデオコーディング規格のプロファイルを識別するシンタックス要素を含み得る。１つまたは複数のシンタックス要素は、さらにまたは代替的に、ビデオコーディング規格のレベルを識別するシンタックス要素を含み得る。そのレベルは、たとえば、ビデオコーディング規格のプロファイルに関連する複数のレベルのうちの１つに対応し得る。

[0187]１つまたは複数のシンタックス要素は、第１のシンタックス要素と第２のシンタックス要素とを含み得る。第１のシンタックス要素は、第２のシンタックス要素を解釈するためのコンテキストを識別し得、第２のシンタックス要素はプロファイルのグループを識別し得る。ビデオ処理デバイスは、ビデオパラメータセット中で、１つまたは複数の互換性フラグを受信し得、それらの各々はプロファイルのグループからのプロファイルに関連付けられる。１つまたは複数の互換性フラグの各々の値は、ビデオデータが、プロファイルのグループからの関連するプロファイルと互換性があるかどうかを識別し得る。

[0188]１つまたは複数のシンタックス要素はまた、ビデオデータに関連する最大時間レベルを識別する第１のシンタックス要素と、ビデオデータの時間レイヤが、最大時間レベルよりも低いレベルを有するかどうかを識別する第２のシンタックス要素とを含み得る。第２のシンタックス要素が、ビデオデータの時間レイヤが最大時間レベルよりも低いレベルを有することを示すことに応答して、ビデオ処理デバイスは、参照すべきデータの１つまたは複数の時間レイヤのためのレベルを識別する追加のシンタックス要素を受信し得る。

[0189]ビデオ処理デバイスがビデオデコーダである事例では、ビデオデコーダは、ビデオブロックの第１のセットと、ビデオブロックの第２のセットとを復号し得る。ビデオ処理デバイスがＭＡＮＥである事例では、ＭＡＮＥは、クライアントデバイスに、ビデオブロックの第１のセットと、ビデオブロックの第２のセットとを転送し得る。

[0190]図１１は、本開示の技法に従ってどのようにＶＰＳ中に含めるためのシンタックス要素を生成すべきかの一例を示すフローチャートである。図８の技法について、ビデオデータを符号化するかまたは符号化ビデオデータを処理するように構成されたビデオ処理デバイスに関して説明する。において符号化ビデオデータを処理するように構成されたビデオ処理デバイスの例としては、図１および図４のビデオエンコーダ２０、ならびに図４の後処理デバイス５７を含む。ビデオ処理デバイスは、ビデオパラメータセット中に含めるために、セッションネゴシエーションに関係する情報を含む１つまたは複数のシンタックス要素を生成する（２１１）。ビデオ処理デバイスは、ビデオデータ中に含めるために、ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを生成する（２１２）。第１のシーケンスパラメータセットは、ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを含む第１のシンタックス構造を備える。ビデオ処理デバイスは、ビデオデータ中に含めるために、ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを生成する（２１３）。第２のシーケンスパラメータセットは、ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを含む第２のシンタックス構造を備える。ビデオ処理デバイスは、１つまたは複数のシンタックス要素に基づいて、第１のパラメータセットに関連するビデオブロックの第１のセットと、第２のパラメータセットに関連するビデオブロックの第２のセットとを符号化する（２１４）。

[0191]１つまたは複数のシンタックス要素は、たとえば、固定長シンタックス要素であり得、ビデオパラメータセット中で、どんな可変長コード化シンタックス要素にも先行し得る。１つまたは複数のシンタックス要素は、ビデオコーディング規格のプロファイルを識別するシンタックス要素を含み得る。１つまたは複数のシンタックス要素は、さらにまたは代替的に、ビデオコーディング規格のレベルを識別するシンタックス要素を含み得る。そのレベルは、たとえば、ビデオコーディング規格のプロファイルに関連する複数のレベルのうちの１つに対応し得る。

[0192]１つまたは複数のシンタックス要素は、第１のシンタックス要素と第２のシンタックス要素とを含み得る。第１のシンタックス要素は、第２のシンタックス要素を解釈するためのコンテキストを識別し得、第２のシンタックス要素はプロファイルのグループを識別し得る。ビデオ処理デバイスは、ビデオパラメータセット中で、１つまたは複数の互換性フラグを受信し得、それらの各々はプロファイルのグループからのプロファイルに関連付けられる。１つまたは複数の互換性フラグの各々の値は、ビデオデータが、プロファイルのグループからの関連するプロファイルと互換性があるかどうかを識別し得る。

[0193]１つまたは複数のシンタックス要素はまた、ビデオデータに関連する最大時間レベルを識別する第１のシンタックス要素と、ビデオデータの時間レイヤが、最大時間レベルよりも低いレベルを有するかどうかを識別する第２のシンタックス要素とを含み得る。第２のシンタックス要素が、ビデオデータの時間レイヤが最大時間レベルよりも低いレベルを有することを示すことに応答して、ビデオ処理デバイスは、参照すべきデータの１つまたは複数の時間レイヤのためのレベルを識別する追加のシンタックス要素を受信し得る。

[0194]図１２は、本開示の技法に従ってどのようにＶＰＳを処理すべきかの一例を示すフローチャートである。図１２の技法について、一般的なビデオ処理デバイスに関して説明する。ビデオ処理デバイスは、図１のＭＡＮＥ２９、または図６のルーティングデバイス１５４のうちの１つなど、ネットワークデバイスに対応し得る。ビデオ処理デバイスはさらに、図１および図４のビデオデコーダ３０など、ビデオデコーダに対応し得る。ビデオ処理デバイスは、ビデオパラメータセット中で、ＨＲＤパラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信する（２２１）。ビデオ処理デバイスは、ビデオデータ中で、ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信する（２２２）。第１のシーケンスパラメータセットは、ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを含む第１のシンタックス構造を備える。ビデオ処理デバイスは、ビデオデータ中で、ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信する（２２３）。第２のシーケンスパラメータセットは、ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを含む第２のシンタックス構造を備える。ビデオ処理デバイスは、１つまたは複数のシンタックス要素に基づいて、第１のパラメータセットに関連するビデオブロックの第１のセットと、第２のパラメータセットに関連するビデオブロックの第２のセットとを処理する（２２４）。

[0195]図１３は、本開示の技法に従ってどのようにＶＰＳ中に含めるためのシンタックス要素を生成すべきかの一例を示すフローチャートである。図１３の技法について、ビデオデータを符号化するかまたは符号化ビデオデータを処理するように構成されたビデオ処理デバイスに関して説明する。において符号化ビデオデータを処理するように構成されたビデオ処理デバイスの例としては、図１および図４のビデオエンコーダ２０、ならびに図４の後処理デバイス５７を含む。ビデオ処理デバイスは、ビデオパラメータセット中に含めるために、ＨＲＤパラメータに関係する情報を含む１つまたは複数のシンタックス要素を生成する（２３１）。ビデオ処理デバイスは、ビデオデータ中に含めるために、ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを生成する（２３２）。第１のシーケンスパラメータセットは、ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを含む第１のシンタックス構造を備える。ビデオ処理デバイスは、ビデオデータ中に含めるために、ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを生成する（２３３）。第２のシーケンスパラメータセットは、ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを含む第２のシンタックス構造を備える。ビデオ処理デバイスは、１つまたは複数のシンタックス要素に基づいて、第１のパラメータセットに関連するビデオブロックの第１のセットと、第２のパラメータセットに関連するビデオブロックの第２のセットとを符号化する（２３４）。

[0196]１つまたは複数の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、１つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応するコンピュータ可読記憶媒体、あるいは、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、（１）非一時的である有形コンピュータ可読記憶媒体、あるいは（２）信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コードおよび／またはデータ構造を取り出すために、１つまたは複数のコンピュータあるいは１つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。

[0197]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびＢｌｕ−ｒａｙディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。

[0198]命令は、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）などの１つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、あるいは他の等価な集積回路またはディスクリート論理回路によって実行され得る。したがって、本明細書で使用する「プロセッサ」という用語は、上記の構造、または本明細書で説明した技法の実装に好適な他の構造のいずれかを指すことがある。さらに、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成された専用ハードウェアおよび／またはソフトウェアモジュール内に与えられ得、あるいは複合コーデックに組み込まれ得る。また、本技法は、１つまたは複数の回路または論理要素中に十分に実装され得る。

[0199]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）またはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示する技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび／またはファームウェアとともに、上記で説明した１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作ハードウェアユニットの集合によって与えられ得る。

[0200]様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。

[0200]様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。
以下に本願出願当初の特許請求の範囲を付記する。
[Ｃ１] ビデオデータを復号する方法であって、前記方法が、
ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信することと、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信することと、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信することと、
前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることと
を備える、方法。
[Ｃ２] 前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、Ｃ１に記載の方法。
[Ｃ３] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、Ｃ１に記載の方法。
[Ｃ４] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、Ｃ１に記載の方法。
[Ｃ５] 前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、Ｃ４に記載の方法。
[Ｃ６] 前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、Ｃ４に記載の方法。
[Ｃ７] 前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、Ｃ４に記載の方法。
[Ｃ８] 前記ビデオデータが２つ以上の時間レイヤを備え、前記方法が、
前記ビデオパラメータセット中で、前記時間レイヤの各々のための仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信すること
をさらに備える、Ｃ４に記載の方法。
[Ｃ９] ビデオデータを符号化する方法であって、前記方法が、
ビデオパラメータセット中に含めるために、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を生成することと、
前記ビデオデータ中に含めるために、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを生成することと、
前記ビデオデータ中に含めるために、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを生成することと、
前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることと
を備える、方法。
[Ｃ１０] 前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、Ｃ９に記載の方法。
[Ｃ１１] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、Ｃ９に記載の方法。
[Ｃ１２] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、Ｃ９に記載の方法。
[Ｃ１３] 前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、Ｃ１２に記載の方法。
[Ｃ１４] 前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、Ｃ１２に記載の方法。
[Ｃ１５] 前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、Ｃ１２に記載の方法。
[Ｃ１６] 前記ビデオデータが２つ以上の時間レイヤを備え、前記方法が、
前記ビデオパラメータセット中で、前記時間レイヤの各々のための仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信すること
をさらに備える、Ｃ１２に記載の方法。
[Ｃ１７] ビデオデータを処理するためのデバイスであって、前記デバイスが、
ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信することと、前記ビデオデータ中で、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信することと、前記ビデオデータ中で、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信することと、前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることとを行うように構成されたビデオデコーダ
を備える、デバイス。
[Ｃ１８] 前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、Ｃ１７に記載のデバイス。
[Ｃ１９] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、Ｃ１７に記載のデバイス。
[Ｃ２０] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、Ｃ１７に記載のデバイス。
[Ｃ２１] 前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、Ｃ２０に記載のデバイス。
[Ｃ２２] 前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、Ｃ２０に記載のデバイス。
[Ｃ２３] 前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、Ｃ２０に記載のデバイス。
[Ｃ２４] 前記ビデオデータが２つ以上の時間レイヤを備え、前記ビデオデコーダが、前記ビデオパラメータセット中で、前記時間レイヤの各々のためのＨＲＤパラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信するようにさらに構成された、Ｃ２０に記載のデバイス。
[Ｃ２５] ビデオデータを処理するためのデバイスであって、前記デバイスが、
ビデオパラメータセット中に含めるために、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を生成することと、前記ビデオデータ中に含めるために、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを生成することと、前記ビデオデータ中に含めるために、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを生成することと、前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることとを行うように構成されたビデオエンコーダ
を備える、デバイス。
[Ｃ２６] 前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、Ｃ２５に記載のデバイス。
[Ｃ２７] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、Ｃ２５に記載のデバイス。
[Ｃ２８] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、Ｃ２５に記載のデバイス。
[Ｃ２９] 前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、Ｃ２８に記載のデバイス。
[Ｃ３０] 前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、Ｃ２８に記載のデバイス。
[Ｃ３１] 前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、Ｃ２８に記載のデバイス。
[Ｃ３２] 前記ビデオデータが２つ以上の時間レイヤを備え、前記方法が、
前記ビデオパラメータセット中で、前記時間レイヤの各々のための仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信すること
をさらに備える、Ｃ２８に記載のデバイス。
[Ｃ３３] 前記デバイスが、
集積回路と、
マイクロプロセッサと、
ビデオデコーダを備えるワイヤレス通信デバイスと
のうちの少なくとも１つを備える、Ｃ２５に記載のデバイス。
[Ｃ３４] ビデオデータを処理するためのデバイスであって、前記デバイスが、
ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信するための手段と、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信するための手段と、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信するための手段と、
前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングするための手段と
を備える、デバイス。
[Ｃ３５] 前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、Ｃ３４に記載のデバイス。
[Ｃ３６] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、Ｃ３４に記載のデバイス。
[Ｃ３７] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、Ｃ３４に記載のデバイス。
[Ｃ３８] 前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、Ｃ３７に記載のデバイス。
[Ｃ３９] 前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、Ｃ３７に記載のデバイス。
[Ｃ４０] 前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、Ｃ３７に記載のデバイス。
[Ｃ４１] 前記ビデオデータが２つ以上の時間レイヤを備え、前記デバイスが、
前記ビデオパラメータセット中で、前記時間レイヤの各々のための仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信するための手段
をさらに備える、Ｃ３７に記載のデバイス。
[Ｃ４２] １つまたは複数のプロセッサによって実行されたとき、前記１つまたは複数のプロセッサに、
ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信することと、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信することと、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信することと、
前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることと
を行わせる命令を記憶したコンピュータ可読記憶媒体。
[Ｃ４３] 前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、Ｃ４２に記載のコンピュータ可読記憶媒体。
[Ｃ４４] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、Ｃ４２に記載のコンピュータ可読記憶媒体。
[Ｃ４５] ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、Ｃ４２に記載のコンピュータ可読記憶媒体。
[Ｃ４６] 前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、Ｃ４５に記載のコンピュータ可読記憶媒体。
[Ｃ４７] 前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、Ｃ４５に記載のコンピュータ可読記憶媒体。
[Ｃ４８] 前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、Ｃ４５に記載のコンピュータ可読記憶媒体。
[Ｃ４９] 前記ビデオデータが２つ以上の時間レイヤを備え、前記コンピュータ可読記憶媒体が、実行されたとき、前記１つまたは複数のプロセッサに、前記ビデオパラメータセット中で、前記時間レイヤの各々のための仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信させるさらなる命令を記憶する、Ｃ４５に記載のコンピュータ可読記憶媒体。

Claims

ビデオデータを復号する方法であって、前記方法が、
ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信することと、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信することと、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信することと、
前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることと
を備える、方法。
前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、請求項１に記載の方法。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、請求項１に記載の方法。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、請求項１に記載の方法。
前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、請求項４に記載の方法。
前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、請求項４に記載の方法。
前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、請求項４に記載の方法。
前記ビデオデータが２つ以上の時間レイヤを備え、前記方法が、
前記ビデオパラメータセット中で、前記時間レイヤの各々のための仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信すること
をさらに備える、請求項４に記載の方法。
ビデオデータを符号化する方法であって、前記方法が、
ビデオパラメータセット中に含めるために、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を生成することと、
前記ビデオデータ中に含めるために、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを生成することと、
前記ビデオデータ中に含めるために、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを生成することと、
前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることと
を備える、方法。
前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、請求項９に記載の方法。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、請求項９に記載の方法。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、請求項９に記載の方法。
前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、請求項１２に記載の方法。
前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、請求項１２に記載の方法。
前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、請求項１２に記載の方法。
前記ビデオデータが２つ以上の時間レイヤを備え、前記方法が、
前記ビデオパラメータセット中で、前記時間レイヤの各々のための仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信すること
をさらに備える、請求項１２に記載の方法。
ビデオデータを処理するためのデバイスであって、前記デバイスが、
ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信することと、前記ビデオデータ中で、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信することと、前記ビデオデータ中で、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信することと、前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることとを行うように構成されたビデオデコーダ
を備える、デバイス。
前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、請求項１７に記載のデバイス。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、請求項１７に記載のデバイス。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、請求項１７に記載のデバイス。
前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、請求項２０に記載のデバイス。
前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、請求項２０に記載のデバイス。
前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、請求項２０に記載のデバイス。
前記ビデオデータが２つ以上の時間レイヤを備え、前記ビデオデコーダが、前記ビデオパラメータセット中で、前記時間レイヤの各々のためのＨＲＤパラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信するようにさらに構成された、請求項２０に記載のデバイス。
ビデオデータを処理するためのデバイスであって、前記デバイスが、
ビデオパラメータセット中に含めるために、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を生成することと、前記ビデオデータ中に含めるために、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを生成することと、前記ビデオデータ中に含めるために、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを生成することと、前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることとを行うように構成されたビデオエンコーダ
を備える、デバイス。
前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、請求項２５に記載のデバイス。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、請求項２５に記載のデバイス。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、請求項２５に記載のデバイス。
前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、請求項２８に記載のデバイス。
前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、請求項２８に記載のデバイス。
前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、請求項２８に記載のデバイス。
前記ビデオデータが２つ以上の時間レイヤを備え、前記方法が、
前記ビデオパラメータセット中で、前記時間レイヤの各々のための仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信すること
をさらに備える、請求項２８に記載のデバイス。
前記デバイスが、
集積回路と、
マイクロプロセッサと、
ビデオデコーダを備えるワイヤレス通信デバイスと
のうちの少なくとも１つを備える、請求項２５に記載のデバイス。
ビデオデータを処理するためのデバイスであって、前記デバイスが、
ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信するための手段と、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信するための手段と、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信するための手段と、
前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングするための手段と
を備える、デバイス。
前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、請求項３４に記載のデバイス。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、請求項３４に記載のデバイス。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、請求項３４に記載のデバイス。
前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、請求項３７に記載のデバイス。
前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、請求項３７に記載のデバイス。
前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、請求項３７に記載のデバイス。
前記ビデオデータが２つ以上の時間レイヤを備え、前記デバイスが、
前記ビデオパラメータセット中で、前記時間レイヤの各々のための仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信するための手段
をさらに備える、請求項３７に記載のデバイス。
１つまたは複数のプロセッサによって実行されたとき、前記１つまたは複数のプロセッサに、
ビデオパラメータセット中で、仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信することと、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第１のシンタックス要素を備える第１のシーケンスパラメータセットを受信することと、
前記ビデオデータ中で、前記ビデオパラメータセットを識別する第２のシンタックス要素を備える第２のシーケンスパラメータセットを受信することと、
前記１つまたは複数のシンタックス要素に基づいて、前記第１のパラメータセットに関連するビデオブロックの第１のセットと、前記第２のパラメータセットに関連するビデオブロックの第２のセットとをコーディングすることと
を行わせる命令を記憶したコンピュータ可読記憶媒体。
前記第１のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の全ピクチャに適用されるシンタックス要素の第１のグループを備える第１のシンタックス構造を備え、前記第２のシーケンスパラメータセットが、前記ビデオデータの１つまたは複数の異なる全ピクチャに適用されるシンタックス要素の第２のグループを備える第２のシンタックス構造を備える、請求項４２に記載のコンピュータ可読記憶媒体。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータがデフォルトＨＲＤパラメータであることを示すシンタックス要素を備える、請求項４２に記載のコンピュータ可読記憶媒体。
ＨＲＤパラメータに関係する情報を含む前記１つまたは複数のシンタックス要素は、前記ビデオデータのための前記ＨＲＤパラメータが前記ビデオデータ中でシグナリングされることを示すシンタックス要素を備える、請求項４２に記載のコンピュータ可読記憶媒体。
前記１つまたは複数のシンタックス要素が、前記ビデオデータのビットレートを示すシンタックス要素を備える、請求項４５に記載のコンピュータ可読記憶媒体。
前記１つまたは複数のシンタックス要素は、前記ビデオデータのビットレートが固定であるか可変であるかを示すシンタックス要素を備える、請求項４５に記載のコンピュータ可読記憶媒体。
前記１つまたは複数のシンタックス要素が、コード化ピクチャバッファ管理のための１つまたは複数のシンタックス要素を備える、請求項４５に記載のコンピュータ可読記憶媒体。
前記ビデオデータが２つ以上の時間レイヤを備え、前記コンピュータ可読記憶媒体が、実行されたとき、前記１つまたは複数のプロセッサに、前記ビデオパラメータセット中で、前記時間レイヤの各々のための仮想リファレンスデコーダ（ＨＲＤ）パラメータに関係する情報を含む１つまたは複数のシンタックス要素を受信させるさらなる命令を記憶する、請求項４５に記載のコンピュータ可読記憶媒体。