JP2015531570A

JP2015531570A - ビデオコーダの動作点のためのレイヤ識別子の向上したシグナリング

Info

Publication number: JP2015531570A
Application number: JP2015534814A
Authority: JP
Inventors: ワン、イェ−クイ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2012-10-02
Filing date: 2013-10-01
Publication date: 2015-11-02
Anticipated expiration: 2033-10-01
Also published as: RU2656827C2; CA2884881C; BR112015007273A2; AU2013327493A1; PH12015500613B1; CN104685890A; ES2856099T3; TWI610557B; KR20150065839A; TWI566582B; CA2884881A1; CN104685890B; HUE052661T2; RU2015116166A; KR101865453B1; EP2904789A1; SG10201702549TA; JP6345675B2; SG11201501641XA; TW201429255A

Abstract

ビデオデータを処理するためのデバイスは、ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を受信し、最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを受信し、フラグの値に基づいて、第１のレイヤが動作点に含まれるかどうかを決定する。【選択図】図６

Description

関連出願

[0001] 本出願は２０１２年１０月２日に出願された米国仮特許出願第６１／７０９，０９４号の利益を主張するもので、その全内容が参照により本明細書に組み込まれる。

[0002] 本開示は一般にビデオデータを処理することに関し、より詳細には、ビデオデータにおいて使用される動作点を処理することに関する。

[0003] デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４、Ｐａｒｔ１０、アドバンストビデオコーディング（ＡＶＣ）、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）規格によって定義された規格、およびそのような規格の拡張に記述されるビデオコーディング技法のような、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶し得る。

[0004] ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間的（イントラピクチャ）予測および／または時間的（インターピクチャ）予測を含む。ブロックベースのビデオコーディングの場合、ビデオスライス（例えば、ビデオフレームまたはビデオフレームの一部分）が、ツリーブロック、コーディングユニット（ＣＵ）および／またはコーディングノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコーディングされた（Ｉ）スライス中のビデオブロックは、同じピクチャ中の近隣ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコーディングされた（ＰまたはＢ）スライス中のビデオブロックは、同じピクチャ中の近隣ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。

[0005] 空間的予測または時間的予測は、コーディングされるべきブロックの予測ブロックを生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコーディングブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコーディングブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコーディングブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて残差変換係数をもたらすことができ、その残差変換係数は、次いで量子化できる。量子化変換係数は、最初に２次元アレイで構成され、変換係数の１次元ベクトルを生成するために走査でき、なお一層の圧縮を達成するためにエントロピーコーディングを適用できる。

[0006] 一般に、本開示は、ビデオコーディングにおいて動作点に関するレイヤ識別子をシグナリングするための技法について説明する。

[0007] 一例では、ビデオデータを処理する方法が、ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を受信することと、最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを受信することと、フラグの値に基づいて、第１のレイヤが動作点に含まれるかどうかを決定することとを含む。

[0008] 別の例では、ビデオデータを処理するためのデバイスが、１つまたは複数のプロセッサを含み、１つまたは複数のプロセッサは、ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を受信し、最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを受信し、フラグの値に基づいて、第１のレイヤが動作点に含まれるかどうかを決定するように構成される。

[0009] 別の例では、ビデオデータを処理するための装置が、ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を受信するための手段と、最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを受信するための手段と、フラグの値に基づいて、第１のレイヤが動作点に含まれるかどうかを決定するための手段とを含む。

[0010] 別の例では、非一時的コンピュータ可読記憶媒体が、複数の命令を記憶し、これら命令が１つまたは複数のプロセッサによって実行されると、１つまたは複数のプロセッサに、ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を受信させ、最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを受信させ、フラグの値に基づいて、第１のレイヤが動作点に含まれるかどうかを決定させる。

[0011] 別の例では、ビデオデータを符号化する方法が、ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を生成することと、最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを生成することとを含み、ここにおいてフラグの値は第１のレイヤが動作点に含まれるかどうかをシグナリングする。

[0012] 別の例では、ビデオコーディングデバイスがビデオ符号器を含み、ビデオ符号器は、ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を生成し、最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを生成するように構成され、ここにおいてフラグの値は第１のレイヤが動作点に含まれるかどうかをシグナリングする。

[0013] 別の例では、ビデオコーディングのための装置が、ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を生成するための手段と、最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを生成するための手段とを含み、ここにおいてフラグの値は第１のレイヤが動作点に含まれるかどうかをシグナリングする。

[0014] 別の例では、非一時的コンピュータ可読媒体が、複数の命令を記憶し、これら命令が１つまたは複数のプロセッサによって実行されると、１つまたは複数のプロセッサに、ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を生成させ、最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを生成させ、ここにおいてフラグの値は第１のレイヤが動作点に含まれるかどうかをシグナリングする。

[0015] １つまたは複数の例の詳細が、添付の図面および以下の説明に記述される。他の特徴、目的、および利点は、その説明および図面、並びに特許請求の範囲から明らかになるはずである。

本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。本開示で説明する技法を実装し得る例示的なビデオエンコーダを示すブロック図。本開示で説明する技法を実装し得る例示的なビデオデコーダを示すブロック図。ネットワークの一部を形成するデバイスの例示的な組を示すブロック図。本開示に記述される技法に従ってビデオデータを符号化するための例示的な方法を示すフローチャート。本開示に記述される技法に従ってビデオデータを処理するための例示的な方法を示すフローチャート。

詳細な説明
[0022] 本開示は、ビデオコーディング（すなわち、ビデオデータの符号化および／または復号）に関し、より詳細にはビデオ処理で使用される動作点シンタックスに関する。一般に、本開示は、ビデオコーディングにおいて動作点に関するレイヤ識別子をシグナリングするための技法について説明する。動作点は、時間的におよび／または複数のレイヤもしくはビューに関して拡張性のある元のビットストリームから抽出され得るサブビットストリームを指す。サブビットストリームは、レイヤ識別子（すなわち、レイヤＩＤ）およびビットストリームの動作点を識別する時間的サブレイヤ識別子（すなわち、時間ＩＤ）の値に基づいてビットストリームから抽出され得る。一般に、本開示は、レイヤ識別子およびレイヤＩＤという用語を使用して空間レイヤおよび／またはビューの識別子を指し、一方、時間的サブレイヤ識別子および時間的ＩＤは、時間的サブレイヤの識別子を指す。

[0023] 動作点は、例えば、ビットストリーム内で、ビデオパラメータセット（ＶＰＳ）などのパラメータセットにおいてシグナリングされ得る。動作点の各々では、動作点シンタックス構造が、例えば、ビデオ符号器によって生成され、所与の動作点のサブビットストリームに属するビットストリーム内のネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別するために使用されるレイヤ識別子の組を指定する。このようにして、メディアアウェアネットワークエンティティ（ＭＡＮＥ）などのネットワークエンティティは、所与の動作点のサブビットストリームを構成するＮＡＬユニットを元のビットストリームから抽出するために、ＮＡＬユニットヘッダを構文解析(parse)できる。ビットストリームにおける各ＮＡＬユニットは、レイヤＩＤおよび時間的ＩＤを含むことができ、レイヤＩＤおよび時間的ＩＤを構文解析することによって、ＭＡＮＥは、特定の動作点のためのＮＡＬユニットを識別できる。

[0024] 本開示の技法は、動作点のためのレイヤＩＤのシグナリングを向上させることによって、動作点に関連付けられたシグナリング情報の効率を向上させることができる。以下でさらに詳細に説明する本開示の一例の技法によれば、最大レイヤＩＤのためのレイヤ識別値（すなわちレイヤＩＤ）がシグナリングされ得、追加のレイヤＩＤの存在が一連のフラグとしてシグナリングされ得る。例えば、ビットストリームは、様々な時間的および空間的解像度の６つのサブストリームを含み、各サブストリームはレイヤＩＤを有すると仮定する。最大レイヤＩＤ値がビットストリームにおいてシグナリングされ得る。この例では、最大レイヤＩＤ値が９であり、これは、動作点に含まれ得るレイヤＩＤ０から９を有する１０のレイヤが潜在的に存在することを意味する。動作点のための残りのレイヤＩＤ値は、９つのフラグを使用してシグナリングされ得、ここで第１のフラグは、レイヤＩＤ値０が存在するかどうかを示し、第２のフラグは、レイヤＩＤ値１が存在するかどうかを示すなど、レイヤＩＤ値８が存在するかどうかを示す最後のフラグまで以下同様である。このように、レイヤＩＤ値２、５、および９をシグナリングするために、値９が最初にシグナリングされ得、次いでフラグ００１００１０００のシーケンスが続き、ここで第３のビットの１は、レイヤＩＤ値２が存在することを示し、第６のビットの１は、レイヤＩＤ値５が存在することを示す。レイヤＩＤをシグナリングするための他の技法についても、本開示で説明する。

[0025] 本開示は、一般に、ビデオコーディングという用語を使用して、ビデオ符号化またはビデオ復号のいずれかを指す。本開示は、ビデオ処理という用語も使用し、これは、一般に、ビデオコーディングを含むが、例えば、ビデオデータ構文解析、ビデオデータルーティング、ビデオビットストリームスプライシング、および他のそのようなプロセスなど、他のタイプのビデオ処理も含むものとする。ビデオコーダは、一般に、ビデオデータを符号化および／または復号するデバイスを指すと考えられ、一方、ビデオプロセッサまたはビデオ処理デバイスは、ビデオデータをコード化し、しかし、ビデオデータにおいて他のプロセスを行うデバイスも指すと考えられ得る。

[0026] 図１は、本開示で説明するレイヤＩＤをシグナリングするための技法を利用し得る例示的なビデオ符号化および復号システム１０を示すブロック図である。図１に示すように、システム１０は、宛先デバイス１４によって後で復号されるべき符号化ビデオデータを生成するソースデバイス１２を含む。符号化されたビデオデータは、ネットワークデバイス１３を介してソースデバイス１２から宛先デバイス１４に送られ得、これらは、ネットワークデバイスのより大きいネットワークの一部であり得る。ソースデバイス１２および宛先デバイス１４は、デスクトップコンピュータ、ノートブック（例えば、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス１２および宛先デバイス１４は、ワイヤレス通信のために装備され得る。

[0027] 図１の例では、ソースデバイス１２が、ビデオソース１８と、ビデオエンコーダ２０と、出力インターフェース２２とを含む。宛先デバイス１４は、入力インターフェース２８と、ビデオデコーダ３０と、ディスプレイデバイス３２とを含む。他の例では、ソースデバイス１２および宛先デバイス１４が、他のコンポーネントまたは構成を含み得る。例えば、ソースデバイス１２は、外部カメラなどの外部ビデオソース１８からビデオデータを受信し得る。同様に、宛先デバイス１４は、内蔵ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。

[0028] 図１の図示のシステム１０は一例にすぎない。本開示の技法は、任意のデジタルビデオコーディングおよび／または処理デバイスによって行われ得る。概して、本技法はビデオ符号化デバイスまたはビデオ復号デバイスによって行われるが、本技法は、一般に「コーデック」と呼ばれるビデオエンコーダ／デコーダによっても行われ得る。さらに、本開示の技法は、ビデオプリプロセッサによっても行われ得る。ソースデバイス１２および宛先デバイス１４は、ソースデバイス１２が宛先デバイス１４に送信するためのコード化ビデオデータを生成するようなコーディングデバイスの例にすぎない。いくつかの例では、デバイス１２、１４が、デバイス１２、１４の各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称的に動作し得る。従って、システム１０は、例えば、ビデオストリーミング、ビデオ再生、ビデオブロードキャストまたはビデオ電話のための、ビデオデバイス１２とビデオデバイス１４との間の一方向または双方向のビデオ送信をサポートできる。

[0029] 一例では、ソースデバイス１２のビデオ符号器２０が、ビデオデータのビットストリームを生成できる。ビデオデータのＶＰＳは、ビットストリームのサブビットストリームに対応する複数の動作点を定義できる。ビデオ符号器２０は、特定の動作点に含まれるレイヤおよび時間的サブレイヤを識別する動作点シンタックスを含むことができる。ＶＰＳにおける動作点シンタックスは、動作点のための最大レイヤＩＤ値の表示並びに１つまたは複数のフラグを含むことができる。フラグは、最大レイヤＩＤ未満のレイヤＩＤを有するレイヤが動作点に含まれるかどうかを示す。従って、最大レイヤＩＤおよびフラグを有するＶＰＳを受信すると、ネットワークデバイス１３は、動作点のためのＮＡＬユニットを識別し、これらＮＡＬユニットを宛先デバイス１４に送ることができる。ＮＡＬユニットを受信すると、宛先デバイス１４のビデオ復号器３０は、符号化されたビデオデータを復号できる。ビデオ復号器３０は、ネットワークデバイス１３と同様にしてＶＰＳに含まれる動作点シンタックスを潜在的に構文解析できる。例えば、ビデオ復号器３０は、全ての予想されるレイヤが受信されたかどうかを調べる、または適用するための仮定的参照復号器（ＨＲＤ：hypothetical reference decoder）パラメータのセットを決定するために、動作点シンタックスを構文解析できる。

[0030] ソースデバイス１２のビデオソース１８は、ビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされたビデオを含むビデオアーカイブ、および／またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。さらなる代替として、ビデオソース１８は、ソースビデオとしてのコンピュータグラフィックスベースのデータ、またはライブビデオとアーカイブビデオとコンピュータ生成ビデオとの組合せを生成し得る。場合によっては、ビデオソース１８がビデオカメラである場合、ソースデバイス１２および宛先デバイス１４は、いわゆるカメラ付き携帯電話またはビデオ電話を形成できる。但し、上述のように、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび／またはワイヤード適用例に適用され得る。

[0031] 各場合において、キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成ビデオは、ビデオエンコーダ２０によって符号化され得る。符号化ビデオデータは、ソースデバイス１２の出力インターフェース２２を介して宛先デバイス１４に直接送信され得る。符号化ビデオデータは、さらに（または代替として）、復号および／または再生のための宛先デバイス１４または他のデバイスによる後のアクセスのためにストレージデバイス上に記憶され得る。

[0032] リンク１６は、ワイヤレスブロードキャストもしくはワイヤードネットワーク送信などの一時的媒体、またはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、Ｂｌｕ−ｒａｙ（登録商標）ディスク、または他のコンピュータ可読媒体などの記憶媒体（すなわち、非一時的記憶媒体）を含み得る。いくつかの例では、ネットワークサーバが、ソースデバイス１２から符号化ビデオデータを受信し、例えば、ネットワーク送信を介して、その符号化ビデオデータを宛先デバイス１４に与え得る。同様に、ディスクスタンピング設備などの媒体製造設備のコンピューティングデバイスは、ソースデバイス１２から符号化ビデオデータを受信し、その符号化ビデオデータを含むディスクを生成し得る。従って、様々な例では、リンク１６が、様々な形態の１つまたは複数のコンピュータ可読媒体を含むと理解され得る。リンク１６は、ソースデバイス１２から宛先デバイス１４に符号化ビデオデータを動かすことが可能な任意のタイプの媒体またはデバイスを備え得る。一例で、リンク１６は、ソースデバイス１２が符号化ビデオデータを宛先デバイス１４にリアルタイムで直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス１４に送信され得る。通信媒体は、無線周波数（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス１２から宛先デバイス１４への通信を可能にするために有用であり得るルータ、スイッチ、基地局、または任意の他の機器を含み得る。

[0033] 宛先デバイス１４の入力インターフェース２８は、コンピュータ可読媒体であり得るリンク１６から情報を受信する。リンク１６からの情報は、ビデオエンコーダ２０によって定義され、またビデオデコーダ３０によって使用される、ブロックおよび他のコード化ユニット、例えば、ＧＯＰの特性および／または処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。ディスプレイデバイス３２は、宛先デバイス１４と一体化されるか、またはその外部にあり得る。ディスプレイデバイス３２は、復号ビデオデータをユーザに対して表示し、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなどの、様々なディスプレイデバイスのいずれかを備え得る。

[0034] 代替的に、いくつかの例では、符号化データが、出力インターフェース２２からストレージデバイス３４に出力され得る。同様に、符号化データは、入力インターフェースによってストレージデバイス３４からアクセスされ得る。ストレージデバイス３４は、ハードドライブ、ブルーレイ（登録商標）ディスク、ＤＶＤ、ＣＤ−ＲＯＭ、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイス３４が、ソースデバイス１２によって生成された符号化ビデオを保持し得るファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス１４は、ストリーミングまたはダウンロードを介してストレージデバイス３４から、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス１４に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバは、（例えば、ウェブサイトのための）ウェブサーバ、ＦＴＰサーバ、ネットワーク接続ストレージ（ＮＡＳ）デバイス、またはローカルディスクドライブを含む。宛先デバイス１４は、インターネット接続を含む、任意の標準のデータ接続を介して符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル（例えば、Ｗｉ−Ｆｉ（登録商標）接続）、ワイヤード接続（例えば、ＤＳＬ、ケーブルモデムなど）、または両方の組合せを含み得る。ストレージデバイス３４からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。

[0035] 本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、ストリーミングビデオ送信（例えば、インターネットを介して）、ストレージ用デジタルビデオのデータ記憶媒体上への符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例などの、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム１０が、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および／またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。

[0036] ビデオエンコーダ２０およびビデオデコーダ３０は各々、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理回路、ソフトウェア、ハードウェア、ファームウェアのような、様々な好適なエンコーダまたはデコーダ回路のうちのいずれか、あるいはこれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非時間的コンピュータ可読媒体にこのソフトウェアのための複数の命令を記憶し、１つまたは複数のプロセッサを使用してこれら命令をハードウェアで実行し、本開示の技法を行い得る。ビデオエンコーダ２０およびビデオデコーダ３０の各々は１つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれもが該当のデバイスにおいて複合エンコーダ／デコーダ（コーデック）の一部として統合され得る。ビデオエンコーダ２０および／またはビデオデコーダ３０を含むデバイスは、集積回路、マイクロプロセッサ、および／またはセルラー電話などのワイヤレス通信デバイスを備え得る。

[0037] ビデオエンコーダ２０およびビデオデコーダ３０は、現在開発中のＨＥＶＣ規格などのビデオコーディング規格に従って動作し得、ＨＥＶＣテストモデル（ＨＭ）に準拠し得る。「ＨＥＶＣＷｏｒｋｉｎｇＤｒａｆｔ８」または「ＷＤ８」と呼ばれる近く公開のＨＥＶＣ規格の草案は、文書ＪＣＴＶＣ−Ｊ１００３＿ｄ７、Ｂｒｏｓｓら、「Ｈｉｇｈｅｆｆｉｃｉｅｎｃｙｖｉｄｅｏｃｏｄｉｎｇ（ＨＥＶＣ）ｔｅｘｔｓｐｅｃｉｆｉｃａｔｉｏｎｄｒａｆｔ８」、ＩＴＵ−ＴＳＧ１６ＷＰ３およびＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１のＪｏｉｎｔＣｏｌｌａｂｏｒａｔｉｖｅＴｅａｍｏｎＶｉｄｅｏＣｏｄｉｎｇ（ＪＣＴ−ＶＣ）、第１０回会議：ストックホルム、スウェーデン、２０１２年７月に記述される。ＨＥＶＣ規格のＷｏｒｋｉｎｇＤｒａｆｔ８は、参照によりその全てが本明細書に組み込まれる。「ＨＥＶＣＷｏｒｋｉｎｇＤｒａｆｔ１０」または「ＷＤ１０」と呼ばれるＨＥＶＣ規格の別の最近のドラフトは、文書ＪＣＴＶＣ−Ｌ１００３ｖ３４、Ｂｒｏｓｓら、「Ｈｉｇｈｅｆｆｉｃｉｅｎｃｙｖｉｄｅｏｃｏｄｉｎｇ（ＨＥＶＣ）ｔｅｘｔｓｐｅｃｉｆｉｃａｔｉｏｎｄｒａｆｔ１０（ＦＤＩＳ＆ＬａｓｔＣａｌｌ）」、ＩＴＵ−ＴＳＧ１６ＷＰ３とＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１のＪｏｉｎｔＣｏｌｌａｂｏｒａｔｉｖｅＴｅａｍｏｎＶｉｄｅｏＣｏｄｉｎｇ（ＪＣＴ−ＶＣ）、第１２回会合：ジュネーブ、スイス、２０１３年１月１４〜２３日に記述される。ＷＤ１０は、参照によりその全てが本明細書に組み込まれる。

[0038] 代替的に、ビデオエンコーダ２０およびビデオデコーダ３０は、代替的にＭＰＥＧ−４、Ｐａｒｔ１０、アドバンストビデオコーディング（ＡＶＣ）と呼ばれるＩＴＵ−ＴＨ．２６４規格などの、他のプロプライエタリ規格または業界規格、あるいはそのような規格の拡張に従って動作し得る。但し、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオコーディング規格の他の例には、ＭＰＥＧ−２およびＩＴＵ−ＴＨ．２６３がある。いくつかの態様では、ビデオエンコーダ２０およびビデオデコーダ３０が、各々オーディオエンコーダおよびオーディオデコーダと統合され得、適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含んで、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理できる。適用可能な場合、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠できる。

[0039] ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４（ＡＶＣ）規格は、ＪｏｉｎｔＶｉｄｅｏＴｅａｍ（ＪＶＴ）として知られる共同パートナーシップの成果として、ＩＳＯ／ＩＥＣＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）とともにＩＴＵ−ＴＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔｓＧｒｏｕｐ（ＶＣＥＧ）によって策定された。いくつかの態様では、本開示で説明する技法が、一般にＨ．２６４規格に準拠するデバイスに適用できる。Ｈ．２６４規格は、ＩＴＵ−Ｔ研究グループによる２００５年３月付けのＩＴＵ−Ｔ勧告Ｈ．２６４「ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇｆｏｒｇｅｎｅｒｉｃａｕｄｉｏｖｉｓｕａｌｓｅｒｖｉｃｅｓ」に記述されており、本明細書ではＨ．２６４規格またはＨ．２６４仕様、あるいはＨ．２６４／ＡＶＣ規格または仕様と呼ぶ。ＪｏｉｎｔＶｉｄｅｏＴｅａｍ（ＪＶＴ）はＨ．２６４／ＭＰＥＧ−４ＡＶＣへの拡張に取り組み続けている。

[0040] ＪＣＴ−ＶＣは、ＨＥＶＣ規格の開発に取り組んでいる。ＨＥＶＣ規格化の取り組みは、ＨＥＶＣテストモデル（ＨＭ）と呼ばれるビデオコーディングデバイスの発展的モデルに基づく。ＨＭは、例えば、ＩＴＵ−ＴＨ．２６４／ＡＶＣに従う既存のデバイスに対してビデオコーディングデバイスのいくつかの追加の能力を仮定する。例えば、Ｈ．２６４は９つのイントラ予測符号化モードを提供するが、ＨＭは３３個ものイントラ予測符号化モードを提供し得る。

[0041] 一般に、ＨＭの作業モデルは、ビデオフレームまたはピクチャが、ルーマとクロマの両方のサンプルを含む一連のツリーブロックまたは最大コーディングユニット（ＬＣＵ）に分割され得ることを記述する。ビットストリーム内のシンタックスデータが、ピクセルの数に関して最大コーディングユニットであるＬＣＵのサイズを定義し得る。スライスは、コーディング順序でいくつかの連続するツリーブロックを含む。ビデオフレームまたはピクチャは、１つまたは複数のスライスに区分され得る。各ツリーブロックは、４分木に従って複数のコーディングユニット（ＣＵ）に分割され得る。一般に、４分木データ構造はＣＵごとに１つのノードを含み、ルートノードはツリーブロックに対応する。ＣＵが４つのサブＣＵに分割された場合、ＣＵに対応するノードは４つのリーフノードを含み、リーフノードの各々はサブＣＵのうちの１つに対応する。

[0042] ４分木データ構造の各ノードは、対応するＣＵのシンタックスデータを与え得る。例えば、４分木のノードは、そのノードに対応するＣＵがサブＣＵに分割されるかどうかを示す分割フラグを含み得る。ＣＵのシンタックス要素は、再帰的に定義され得、ＣＵがサブＣＵに分割されるかどうかに依存し得る。ＣＵがさらに分割されない場合、そのＣＵはリーフＣＵと呼ばれる。本開示では、元のリーフＣＵの明示的分割が存在しない場合でも、リーフＣＵの４つのサブＣＵをリーフＣＵとも呼ぶ。例えば、１６×１６サイズのＣＵがさらに分割されない場合、この１６×１６ＣＵが決して分割されなくても、４つの８×８サブＣＵをリーフＣＵとも呼ぶ。

[0043] ＣＵは、ＣＵがサイズ差異を有さないことを除いて、Ｈ．２６４規格のマクロブロックと同様の目的を有する。例えば、ツリーブロックは、４つの子ノード（サブＣＵとも呼ばれる）に分割され得、各子ノードは、今度は親ノードとなり、別の４つの子ノードに分割され得る。４分木のリーフノードと呼ばれる、最後の分割されていない子ノードは、リーフＣＵとも呼ばれるコーディングノードを備える。コーディングビットストリームに関連するシンタックスデータは、最大ＣＵ深さと呼ばれる、ツリーブロックが分割され得る最大回数を定義し得、コーディングノードの最小サイズも定義し得る。それに応じて、ビットストリームは最小コーディングユニット（ＳＣＵ：smallest coding unit）をも定義し得る。本開示では、ＨＥＶＣのコンテキストにおけるＣＵ、ＰＵ、またはＴＵ、あるいは他の規格のコンテキストにおける同様のデータ構造（例えば、Ｈ．２６４／ＡＶＣにおけるマクロブロックおよびそれのサブブロック）のいずれかを指すために「ブロック」という用語を使用する。

[0044] ＣＵは、コーディングノードと、コーディングノードに関連する予測ユニット（ＰＵ：prediction unit）および変換ユニット（ＴＵ：transform unit）とを含む。ＣＵのサイズは、コーディングノードのサイズに対応し、形状が方形でなければならない。ＣＵのサイズは、８×８ピクセルから最大６４×６４以上のピクセルを有するツリーブロックのサイズまでに及び得る。各ＣＵは、１つまたは複数のＰＵと、１つまたは複数のＴＵとを含み得る。ＣＵに関連するシンタックスデータは、例えば、ＣＵを１つまたは複数のＰＵに区分することを記述し得る。区分モードは、ＣＵが、スキップモード符号化またはダイレクトモード符号化されるか、イントラ予測モード符号化されるか、あるいはインター予測モード符号化されるかによって異なり得る。ＰＵは、形状が非方形になるように区分され得る。ＣＵに関連するシンタックスデータは、例えば、４分木に従って、ＣＵを１つまたは複数のＴＵに区分することも記述し得る。ＴＵは、形状が正方形または非正方形（例えば、矩形）であり得る。

[0045] ＨＥＶＣ規格は、ＣＵごとに異なり得るＴＵに従った変換を可能にする。ＴＵは、一般に、区分されたＬＣＵについて定義された所与のＣＵ内のＰＵのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。ＴＵは、一般にＰＵと同じサイズであるかまたはＰＵよりも小さい。いくつかの例では、ＣＵに対応する残差サンプルが、「残差４分木」（ＲＱＴ：residual quad tree）として知られる４分木構造を使用して、より小さいユニットに再分割され得る。ＲＱＴのリーフノードは変換ユニット（ＴＵ）と呼ばれることがある。ＴＵに関連するピクセル差分値は、量子化され得る変換係数を生成するために変換され得る。

[0046] リーフＣＵは、１つまたは複数の予測ユニット（ＰＵ）を含むことができる。一般に、ＰＵは、対応するＣＵの全部または一部に対応する空間的エリアを表し、そのＰＵ用の参照サンプルを取り出すためのデータを含むことができる。その上、ＰＵは、予測に関係するデータを含む。例えば、ＰＵがイントラモード符号化されるとき、ＰＵのデータは、ＰＵに対応するＴＵのイントラ予測モードを記述するデータを含み得る、残差４分木（ＲＱＴ）中に含まれ得る。別の例として、ＰＵがインターモード符号化されるとき、ＰＵは、ＰＵのための１つまたは複数の動きベクトルを定義するデータを含み得る。ＰＵの動きベクトルを定義するデータは、例えば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度（例えば、１／４ピクセル精度もしくは１／８ピクセル精度）、動きベクトルが指す参照ピクチャ、および／または動きベクトルの参照ピクチャリスト（例えば、リスト０、リスト１、もしくはリストＣ）を記述し得る。

[0047] １つまたは複数のＰＵを有するリーフＣＵはまた、１つまたは複数の変換ユニット（ＴＵ）を含み得る。変換ユニットは、上述したように、（ＴＵ４分木構造とも呼ばれる）ＲＱＴを使用して指定され得る。例えば、分割フラグは、リーフＣＵが４つの変換ユニットに分割されるかどうかを示し得る。次いで、各変換ユニットは、さらに、さらなるサブＴＵに分割され得る。ＴＵがさらに分割されないとき、そのＴＵはリーフＴＵと呼ばれ得る。概して、イントラコーディングの場合、リーフＣＵに属する全てのリーフＴＵは同じイントラ予測モードを共有する。すなわち、概して、リーフＣＵの全てのＴＵの予測値を計算するために同じイントラ予測モードが適用される。イントラコーディングの場合、ビデオエンコーダは、イントラ予測モードを使用して各リーフＴＵの残差値を、ＴＵに対応するＣＵの一部と元のブロックとの間の差分として計算し得る。ＴＵは、必ずしもＰＵのサイズに制限されるとは限らない。従って、ＴＵはＰＵよりも大きくまたは小さくなり得る。イントラコーディングの場合、ＰＵは、同じＣＵについて対応するリーフＴＵとコロケートされ得る。いくつかの例では、リーフＴＵの最大サイズが、対応するリーフＣＵのサイズに対応し得る。

[0048] さらに、複数のリーフＣＵのＴＵはまた、残差４分木（ＲＱＴ）と呼ばれる、該当の４分木データ構造に関連付けられ得る。すなわち、リーフＣＵは、リーフＣＵがどのようにＴＵに区分されるかを示す４分木を含み得る。ＴＵ４分木のルートノードは概してリーフＣＵに対応し、ＣＵ４分木のルートノードは概してツリーブロック（またはＬＣＵ）に対応する。分割されないＲＱＴのＴＵはリーフＴＵと呼ばれる。概して、本開示では、特に明記しない限り、リーフＣＵおよびリーフＴＵに言及するためにそれぞれＣＵおよびＴＵという用語を使用する。

[0049] ビデオシーケンスは、一般に、一連のビデオフレームまたはピクチャを含む。ピクチャグループ（ＧＯＰ）は、概して、ビデオピクチャのうちの一連の１つまたは複数を備える。ＧＯＰは、ＧＯＰ中に含まれるいくつかのピクチャを記述するシンタックスデータを、ＧＯＰのヘッダ中、ピクチャのうちの１つまたは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、該当するスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ２０は、一般に、ビデオデータを符号化するために個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックは、ＣＵ内のコーディングノードに対応し得る。ビデオブロックは、サイズを固定することも変更することもでき、指定のコーディング規格に応じてサイズが異なることがある。

[0050] 一例として、ＨＭは、様々なＰＵサイズでの予測をサポートする。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ＨＭは、２Ｎ×２ＮまたはＮ×ＮのＰＵサイズでのイントラ予測をサポートし、２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、またはＮ×Ｎの対称的なＰＵサイズでのインター予測をサポートする。ＨＭはまた、２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズでのインター予測のための非対称区分をサポートする。非対称区分で、ＣＵの一方向は区分されないが、他の方向は２５％と７５％とに区分される。２５％の区分に対応するＣＵの部分は、「ｎ」とその後ろに付く「Ｕｐ」、「Ｄｏｗｎ」、「Ｌｅｆｔ」、または「Ｒｉｇｈｔ」という表示によって示される。従って、例えば、「２Ｎ×ｎＵ」は、上部の２Ｎ×０．５ＮＰＵと下部の２Ｎ×１．５ＮＰＵとで水平方向に区分された２Ｎ×２ＮＣＵを指す。

[0051] 本開示では、「Ｎ×Ｎ（NxN）」および「Ｎ×Ｎ（N by N）」が、垂直寸法および水平寸法に関するビデオブロックのピクセル寸法、例えば、１６×１６（16x16）ピクセルまたは１６×１６（16 by 16）ピクセルを指すために互換的に使用され得る。一般に、１６×１６ブロックは、垂直方向に１６ピクセルを有し（ｙ＝１６）、水平方向に１６ピクセルを有する（ｘ＝１６）。同様に、Ｎ×Ｎブロックは、一般に、垂直方向にＮピクセルを有し、水平方向にＮピクセルを有し、ここでＮは非負整数値を表す。ブロック内のピクセルは行と列で構成できる。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要があるとは限らない。例えば、ブロックはＮ×Ｍピクセルを備えてよく、但し、Ｍは必ずしもＮに等しいとは限らない。

[0052] ＣＵのＰＵを使用したイントラ予測コーディングまたはインター予測コーディングの後、ビデオエンコーダ２０は、ＣＵのＴＵのための残差データを計算し得る。ＰＵは、（ピクセル領域とも呼ばれる）空間領域において予測ピクセルデータを生成する方法またはモードを記述するシンタックスデータを備え得、ＴＵは、変換、例えば、残差ビデオデータへの離散コサイン変換（ＤＣＴ）、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、ＰＵに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ２０は、ＣＵのための残差データを含むＴＵを形成し、次いで、ＴＵを変換して、ＣＵの変換係数を生成し得る。

[0053] 変換係数を生成するための任意の変換の後に、ビデオエンコーダ２０は、変換係数の量子化を行い得る。量子化は、概して、さらなる圧縮を提供する、係数を表すために使用されるデータの量をできるだけ低減するために変換係数を量子化するプロセスを指す。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。例えば、量子化中にｎビット値がｍビット値に切り捨てられ得、但し、ｎはｍよりも大きい。

[0054] 量子化の後に、ビデオエンコーダは、変換係数を走査して、量子化変換係数を含む２次元行列から１次元ベクトルを生成し得る。走査は、より高いエネルギー（従ってより低い周波数）の係数をアレイの前方に配置し、より低いエネルギー（従ってより高い周波数）の係数をアレイの後方に配置するように設計され得る。いくつかの例では、ビデオエンコーダ２０が、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ２０が適応走査を行い得る。量子化変換係数を走査して１次元ベクトルを形成した後に、ビデオエンコーダ２０は、例えば、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ：context-adaptive variable length coding）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ：context-adaptive binary arithmetic coding）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ：syntax-based context-adaptive binary arithmetic coding）、確率間隔区分エントロピー（ＰＩＰＥ：Probability Interval Partitioning Entropy）コーディング、または別のエントロピー符号化方法に従って１次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ２０はまた、ビデオデータを復号する際にビデオデコーダ３０が使用するための符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。

[0055] ＣＡＢＡＣを行うために、ビデオエンコーダ２０は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、例えば、シンボルの隣接値が非０であるか否かに関係し得る。ＣＡＶＬＣを行うために、ビデオエンコーダ２０は、送信されるべきシンボルのための可変長コードを選択し得る。ＶＬＣにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構成され得る。このようにして、ＶＬＣの使用は、例えば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。確率判断は、シンボルに割り当てられるコンテキストに基づき得る。

[0056] ビデオエンコーダ２０は、さらに、ブロックベースのシンタックスデータ、フレームベースのシンタックスデータ、およびＧＯＰベースのシンタックスデータなどのシンタックスデータを、例えば、フレームヘッダ、ブロックヘッダ、スライスヘッダ、またはＧＯＰヘッダ中でビデオデコーダ３０に送り得る。ＧＯＰシンタックスデータは、該当するＧＯＰ中のいくつかのフレームを記述し得、フレームシンタックスデータは、対応するフレームを符号化するために使用される符号化／予測モードを示し得る。

[0057] ＨＥＶＣは、例えば広範なアプリケーション、ビットレート、解像度、品質、およびサービスに適合するなど、それらに対応するためのものであるという点で、一般的であるように設計されている。ＨＥＶＣによって潜在的にサービスされるアプリケーションは、とりわけ、デジタルストレージ媒体、テレビ放送、およびリアルタイム通信を含む。ＨＥＶＣを作成する最中に、一般的なアプリケーションからの様々要件が考慮され、必要なアルゴリズム要素が開発され、これらは単一のシンタックスに組み込まれている。従って、ＨＥＶＣは、異なるアプリケーションの中のビデオデータ交換を容易にする。しかしながら、ＨＥＶＣの全シンタックスの実装の実用性を考慮すると、シンタックスの限られた数のサブセットが「プロファイル」および「レベル」によっても規定される。

[0058] 「プロファイル」は、ＨＥＶＣによって指定されたビットストリームシンタックス全体のサブセットとして定義される。所与のプロファイルのシンタックスによって課される限界内で、復号ピクチャの指定サイズなど、ビットストリーム内のシンタックス要素によってとられる値に応じて、エンコーダおよびデコーダのパフォーマンスの極めて大きい変動を必要とする可能性が依然としてある。多くの適用例において、現在、特定のプロファイル内でシンタックスの全ての仮定的使用を処理することが可能なデコーダを実装することは実用的でもなく、経済的でもない。

[0059] この問題に対処するために、各プロファイル内で「ティア」および「レベル」が指定され得る。ティアのレベルは、ビットストリーム内の複数のシンタックス要素の値に課された複数の制約条件の指定された組である。これら制約条件は、値に関する単純な制限であり得る。あるいは、これら制約条件は、値の演算の組合せ（例えば、ピクチャの幅×ピクチャの高さ×毎秒復号されるピクチャの数）に関する制約の形態をとり得る。下位ティアのために指定されたレベルは、上位ティアのために指定されたレベルよりも制約される。全てのプロファイルに関してレベルの同じ組が定義され、各レベルの定義のほとんどの態様が様々なプロファイルにわたって共通である。個々の実装形態は、指定された制約条件内で、各サポートされるプロファイルの異なるレベルをサポートし得る。異なるコンテキストでは、レベルが、スケーリングの前の変換係数の値である。プロファイルおよびレベルは、高効率ビデオコーディング（ＨＥＶＣ）ＷｏｒｋｉｎｇＤｒａｆｔ８（ＷＤ８）の付属書類Ａに詳細に記述される。

[0060] ＨＥＶＣＷＤ８に準拠するコード化ビデオコンテンツは、共通のシンタックスを使用する。完全なシンタックスのサブセットを実現するために、ビットストリーム中に後に生じるシンタックス要素の有無をシグナリングする、フラグ、パラメータ、および他のシンタックス要素が、ビットストリーム中に含まれる。

[0061] ＨＥＶＣＷＤ８は、ＴｅｍｐｏｒａｌＩｄ変数の特定の値を有するビデオコーディングレイヤ（ＶＣＬ）ネットワークアブストラクションレイヤ（ＮＡＬ）ユニットと、関連する非ＶＣＬＮＡＬユニットとからなる時間的スケーラブルビットストリームの時間的スケーラブルレイヤとしてサブレイヤを定義する。ＨＥＶＣＷＤ８は、特定のサブレイヤおよび下位のサブレイヤのＮＡＬユニットからなるビットストリームのサブセットとしてサブレイヤ表現をさらに定義する。

[0062] ＨＥＶＣ８のサブクローズ１０．１は、ビットストリームサブセットと、サブビットストリームを生成するための抽出プロセスとを記述する。サブクローズ１０．１について以下に述べる。

１０．１サブビットストリーム抽出プロセス
これは、０〜６の範囲内の任意の値に等しいｔＩｄＴａｒｇｅｔと、値０を含むｔａｒｇｅｔＤｅｃＬａｙｅｒＩｄＳｅｔとを有するこのサブクローズにおいて指定されるプロセスの出力に含まれる任意のサブビットストリームが、この勧告｜国際規格に合致することになるビットストリームの適合の要件である。

注釈−適合ビットストリームは、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓが０に等しく、ＴｅｍｐｏｒａｌＩｄが０に等しい１つまたは複数のコード化スライスのＮＡＬユニットを含む。このプロセスへの入力は、可変ｔＩｄＴａｒｇｅｔおよびリストｔａｒｇｅｔＤｅｃＬａｙｅｒＩｄＳｅｔである。

このプロセスの出力は、サブビットストリームである。このサブビットストリームは、ｔａｒｇｅｔＤｅｃＬａｙｅｒＩｄＳｅｔ中の値のうちではなくｔＩｄＴａｒｇｅｔまたはｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓよりも大きいＴｅｍｐｏｒａｌＩｄを有する全てのＮＡＬユニットをビットストリームから除去することによって導出される。

[0063] 一般に、ＨＥＶＣＷＤ８は、レイヤ識別子およびビットストリームの動作点を識別する時間的サブレイヤ識別子の値に基づいてビットストリームからサブビットストリームを抽出することを記述する。

[0064] 動作点は、一般に、ＯｐＬａｙｅｒＩｄＳｅｔとして示されるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値と、ＯｐＴｉｄとして示されるＴｅｍｐｏｒａｌＩｄ値との組によって識別され、入力としてのＯｐＴｉｄおよびＯｐＬａｙｅｒＩｄＳｅｔを用いてＨＥＶＣＷＤ８のサブクローズ１０．１中に指定されたサブビットストリーム抽出プロセスの出力として導出された関連のビットストリームサブセットは、独立して復号可能である。簡単な動作点モードは、一般に、動作点ごとに、ＯｐＬａｙｅｒＩｄＳｅｔがｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの特定の値と、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの特定の値未満のｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの他の全ての値を含み、これら値のみを含む動作点モードであると考えられる。

[0065] 以下の表１は、ＶＰＳのローバイトシーケンスペイロード（ＲＢＳＰ）シンタックスおよびセマンティックスの一例を示す。

[0066] １に等しく設定されたシンタックス要素「ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｉ］」は、簡単な動作点モードがｉ番目のｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ＿ｌａｙｅｒ＿ｉｄｓ（）ｓｙｎａｘ構造のために使用されることを指定する。０に等しく設定されたシンタックス要素「ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｉ］」は、簡単な動作点モードがｉ番目のｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（）ｓｙｎａｘ構造のために使用されないことを指定する。

[0067] ｉがｊに等しくない場合、シンタックス構造ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（ｉ、ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１）およびｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（ｊ、ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１）の任意の２つのインスタンスは、同じ内容を有さない可能性がある。

[0068] 以下の表２は、プロファイル、レイヤ、並びにレベルシンタックスおよびセマンティックスの一例を示す。

[0069] １に等しく設定されるシンタックス要素「ｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］」は、ＰｒｏｆｉｌｅＰｒｅｓｅｎｔＦｌａｇが１に等しいとき、プロファイル情報が、ｉに等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤの表現のためのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造に存在することを指定する。０に等しいｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、プロファイル情報が、ｉに等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤの表現のためのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造に存在しないことを指定する。存在しないとき、ｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］の値は、０に等しいと推測される。

[0070] １に等しく設定されるシンタックス要素「ｓｕｂ＿ｌａｙｅｒ＿ｌｅｖｅｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］」は、レベル情報が、ｉに等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤの表現のためのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造に存在することを指定する。０に等しいｓｕｂ＿ｌａｙｅｒ＿ｌｅｖｅｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、レベル情報が、ｉに等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤの表現のためのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造に存在しないことを指定する。

[0071] シンタックス要素「ｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｉ］」および「ｓｕｂ＿ｌａｙｅｒ＿ｌｅｖｅｌ＿ｉｄｃ［ｉ］」は、それぞれｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃおよびｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃと同じセマンティックスを有するが、ｉに等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤの表現に適用される。

[0072] 以下の表３は、動作点シンタックスおよびセマンティックスの一例を示す。

[0073] ｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（ｏｐＩｄｘ）シンタックス構造は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の組を指定する。

[0074] シンタックス要素「ｏｐ＿ｆｉｒｓｔ＿ｐｒｅｓｅｎｔ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］」は、ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｏｐＩｄｘ］が０に等しく設定されるとき、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの第１の（すなわち０番目の）値を指定する。「ｏｐ＿ｆｉｒｓｔ＿ｐｒｅｓｅｎｔ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］」は、ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｏｐＩｄｘ］が１に等しいとき、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの最大値を指定する。

[0075] シンタックス要素「ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］」＋１は、ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｏｐＩｄｘ］が０に等しいとき、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの数を指定する。ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］は、６３以下である。

[0076] シンタックス要素「ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｄｅｌｔａ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］［ｉ］」＋１は、ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｏｐＩｄｘ］が０に等しいとき、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓのｉ番目の値とｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの（ｉ−１）番目の値との間の差を指定する。ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｄｅｌｔａ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］［ｉ］の値は、両端値を含む０から６３までの範囲内である。

[0077] 変数ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］は、次のように導出される。

ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［０］は、０に等しいと推測される。

[0078] 変数ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］は、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内である場合、次のように導出される。

ＯｐＬａｙｅｒＩｄ［０］［０］の値は、０に等しいと推測される。

[0079] ｉがｊに等しくなく、ｉとｊの両方が両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内であるとき、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］の値は、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｊ］に等しくない。

[0080] ｏｐＩｄｘ１がｏｐＩｄｘ２に等しくない場合、任意の２組、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ１］とＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ２］とは、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の同じ組を含まないである。

[0081] ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔは、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内の場合、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］に等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値を含み、これら値のみを含むように設定される。

[0082] 代替の動作点シンタックスおよびセマンティックスが、表４および以下に記述される。

[0083] ｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（ｏｐＩｄｘ）シンタックス構造は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の組を指定する。

[0084] シンタックス要素「ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］」＋１は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの数を指定する。ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］は、６３以下である。存在しないとき、ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］の値は、０に等しいと推測される。

[0085] この仕様に準拠するビットストリームにおいて、ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］は、０に等しい。ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］の値がこの仕様のこのバージョンで０に等しいことを必要とするが、復号器によって他の値がｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］シンタックスに現れることができる。

[0086] シンタックス構造「ｏｐ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］［ｉ］」は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値のｉ番目の値を指定する。

[0087] 変数ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］は、次のように導出される。

[0088] 変数ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］は、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内である場合、次のように導出される。

[0089] ｉがｊに等しくなく、ｉとｊの両方が両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内であるとき、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］の値は、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｊ］に等しくない。

[0090] ｏｐＩｄｘ１がｏｐＩｄｘ２に等しくない場合、任意の２組、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ１］とＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ２］とは、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の同じ組を含まない。

[0091] ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔは、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内の場合、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］に等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値を含み、これら値のみを含むように設定される。

[0092] ＪＣＴＶＣ−Ｋ０２０４（参照により本明細書に組み込まれ、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｎｔ−ｅｖｒｙ．ｆｒ／ｊｃｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／１１＿Ｓｈａｎｇｈａｉ／ｗｇ１１／ＪＣＴＶＣ−Ｋ０２０４−ｖ１．ｚｉｐで入手可能である）は、以下のシンタックスおよびセマンティックスによって説明したように動作点の修正されたシグナリングを提供している。

[0093] １に等しく設定されたシンタックス要素「ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ｏｐ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］」は、レイヤｉが動作点ｏｐＩｄｘに存在することを指定し、０に等しく設定されたシンタックス要素「ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ｏｐ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］」は、レイヤｉが動作点ｏｐＩｄｘに存在しないことを指定する。

[0094] 動作点のシグナリングのための既存の方法は、いくつかの潜在的な欠点を有し得る。例えば、動作点のシグナリングのための既存の方法は、ＨＥＶＣＷＤ８において指定されたように、ｕｅ（ｖ）コーディングを使用してエントロピーコード化シンタックス要素を有する、またはビデオパラメータセット（ＶＰＳ）においてシグナリングされる、ｍａｘ＿ｎｕｍ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１よりも大きいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値（すなわちレイヤＩＤ）のシグナリングをサポートしない。

[0095] 本開示は、これらの潜在的な欠点のうちのいくつかに潜在的に対処できる様々な技法を提案する。１つのそのような技法において、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の最大値（すなわち最大レイヤＩＤ値）が最初にシグナリングされ、次いで、フラグのリストが続き、フラグは各々、最大レイヤＩＤ値未満のレイヤＩＤの特定の値を有するレイヤが、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるかどうかを指定する。別の技法では、Ｍ個のフラグのリストがシグナリングされ、フラグは各々、特定の可能なレイヤＩＤ値を有するレイヤがビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるかどうかを指定する。Ｍの値は、任意のビットストリームにおける可能な異なるレイヤＩＤの合計数に等しい。例えば、Ｍは２^Nに等しくてもよく、ここで、Ｎはｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ（すなわちレイヤＩＤ）を表すために使用されるビットの数である。さらに別の技法では、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の最大値（すなわち最大レイヤＩＤ値）がシグナリングされる。簡単な動作点モードが使用されていない場合、フラグのリストがシグナリングされ、フラグは各々、最大レイヤＩＤ値未満のレイヤＩＤの特定の値を有するレイヤが、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるかどうかを指定する。

[0096] 次に、上記の技法のいくつかの詳細な例が説明される。以下で説明する例は、一般に、ＨＥＶＣＷＤ８に従い、従って、以下で完全には説明しない態様は、ＨＥＶＣＷＤ８の場合と同じであると見なされ得る。

[0097] 第１の例のための動作点シンタックスおよびセマンティックスは、以下の表６に示される。

[0098] ｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（ｏｐＩｄｘ）シンタックス構造は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の組を指定する。

[0099] シンタックス要素「ｏｐ＿ｍａｘ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］」は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの最大値を指定する。表６は、動作点ごとにシグナリングされるシンタックス要素「ｏｐ＿ｍａｘ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］」を示すが、これは、例えばシーケンスパラメータセットまたはＶＰＳなど、符号化されたビットストリーム中の他の場所にもシグナリングされ得る。

[0100] ０に等しく設定されたシンタックス要素「ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］」は、ｉに等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの値がビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれないことを指定する。１に等しい「ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］」は、ｉに等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの値がビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれることを指定する。全てのｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］の合計は、ｉが両端値を含む０からｏｐ＿ｍａｘ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］−１までの場合、ｍａｘ＿ｎｕｍ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１以下である。

[0101] 変数ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］および変数ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］は、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内である場合、次のように導出される。

[0102] ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［０］は、０に等しいと推測される。ＯｐＬａｙｅｒＩｄ［０］［０］の値は、０に等しいと推測される。

[0103] ｏｐＩｄｘ１がｏｐＩｄｘ２に等しくない場合、任意の２組、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ１］とＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ２］とは、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の同じ組を含まない。

[0104] ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔは、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内の場合、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］に等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値を含み、これら値のみを含むように設定される。

[0105] 上記の例に戻って参照すると、ビットストリームは、様々な時間的および空間的解像度の６つのストリームを含み、各サブストリームはレイヤＩＤを有すると仮定する。ｏｐＩｄｘによって識別される動作点について、最大レイヤＩＤ値は、シンタックス要素「ｏｐ＿ｍａｘ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］」の値として、ビットストリームにおいてシグナリングされ得る。この例では、ｏｐ＿ｍａｘ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］は９に等しいように、最大レイヤＩＤ値が９であると仮定する。残りのレイヤＩＤ値は、９つのフラグを使用してシグナリングされ得、第１のフラグは、レイヤＩＤ値０が存在するかどうかを示し、第２のフラグは、レイヤＩＤ値１が存在するかどうかを示すなど、以下同様である。このように、レイヤＩＤ値２、５、および１０をシグナリングするために、値１０が最初にシグナリングされ得、次いでフラグ００１００１０００のシーケンスが続き、ここで第３のビットの１は、レイヤＩＤ値２が存在することを示し、第６のビットの１は、レイヤＩＤ値５が存在することを示す。表６のシンタックスを使用して、フラグ００１００１０００のシーケンスは、次のように取得される。ｉ＝０では、ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］のためのフラグの値が、０である。ｉ＝１では、ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］のためのフラグの値が、０である。ｉ＝３では、ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］のためのフラグの値が、０である。ｉ＝４では、ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］のためのフラグの値が、０である。ｉ＝５では、ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］のためのフラグの値が、１である。ｉ＝６では、ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］のためのフラグの値が、０である。ｉ＝７では、ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］のためのフラグの値が、０である。ｉ＝８では、ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］のためのフラグの値が、０である。ｉ＝９では、ｉの値がｏｐ＿ｍａｘ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］以上であり、これはまた９に等しい。従って、ビデオ復号器は、最後のフラグが受信されたと決定できる。

[0106] 第２の例の技法のための動作点シンタックスおよびセマンティックスは、以下の表７に示される。

[0107] ｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（ｏｐＩｄｘ）シンタックス構造は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の組を指定する。

[0108] ０に等しく設定されたシンタックス要素「ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］」は、ｉに等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの値がビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれないことを指定する。１に等しい「ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］」は、ｉに等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの値がビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれることを指定する。全てのｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］の合計は、ｉが両端値を含む０から６３までの場合、ｍａｘ＿ｎｕｍ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１以下である。

[0109] 変数ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］および変数ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］は、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内である場合、次のように導出される。

[0110] ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［０］は、０に等しいと推測される。ＯｐＬａｙｅｒＩｄ［０］［０］の値は、０に等しいと推測される。

[0111] ｏｐＩｄｘ１がｏｐＩｄｘ２に等しくない場合、任意の２組、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ１］とＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ２］とは、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の同じ組を含まない。

[0112] ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔは、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内の場合、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］に等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値を含み、これら値のみを含むように設定される。

[0113] 第３の例のための動作点シンタックスおよびセマンティックスは、以下の表８に示される。この例では、表８に示すように、また、後述のように、ＶＰＳ構文およびセマンティックスも変更される。

[0114] １に等しく設定されたシンタックス要素「ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｉ］」は、簡単な動作点モードがｉ番目のｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（）ｓｙｎａｘ構造のために使用されることを指定する。０に等しい「ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｉ］」は、簡単な動作点モードがｉ番目のｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（）ｓｙｎａｘ構造のために使用されないことを指定する。

[0115] ｉがｊに等しくない場合、シンタックス構造ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（ｉ、ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１）およびｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（ｊ、ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１）の任意の２つのインスタンスは、同じ内容を有さない。

[0116] 表９に示されるｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（ｏｐＩｄｘ）シンタックス構造は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の組を指定する。

[0117] シンタックス要素「ｏｐ＿ｍａｘ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］」は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの最大値を指定する。

[0118] ０に等しく設定されたシンタックス要素「ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］」は、ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｏｐＩｄｘ］が０に等しいとき、ｉに等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの値がビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれないことを指定する。１に等しいｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］は、ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｏｐＩｄｘ］が０に等しいとき、ｉに等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの値がビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれることを指定する。全てのｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｉｎｃｕｄｅｄ＿ｆｌａｇ［ｏｐＩｄｘ］［ｉ］の合計は、ｉが両端値を含む０からｏｐ＿ｍａｘ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］−１までの場合、ｍａｘ＿ｎｕｍ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１以下である。

[0119] 変数ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］および変数ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］は、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内である場合、次のように導出される。

[0120] ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［０］は、０に等しいと推測される。ＯｐＬａｙｅｒＩｄ［０］［０］の値は、０に等しいと推測される。

[0121] ｏｐＩｄｘ１がｏｐＩｄｘ２に等しくない場合、任意の２組、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ１］とＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ２］とは、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の同じ組を含まない。

[0122] ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔは、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内の場合、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］に等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値を含み、これら値のみを含むように設定される。

[0123] 図２は、本開示で説明する技法を実装し得るビデオエンコーダ２０の一例を示すブロック図である。ビデオエンコーダ２０は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを行い得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間的冗長性を低減または除去するために時間的予測に依拠する。イントラモード（Ｉモード）は、いくつかの空間ベースのコーディングモードのいずれかを指し得る。単方向予測（Ｐモード）または双方向予測（Ｂモード）などのインターモードは、いくつかの時間ベースのコーディングモードのいずれかを指し得る。

[0124] 図２に示されるように、ビデオエンコーダ２０は、符号化されるべきビデオフレーム内の現在のビデオブロックを受信する。図２の例では、ビデオエンコーダ２０が、モード選択ユニット４０と、参照フレームメモリ６４と、加算器５０と、変換処理ユニット５２と、量子化ユニット５４と、エントロピー符号化ユニット５６とを含む。モード選択ユニット４０は、今度は、動き補償ユニット４４と、動き推定ユニット４２と、イントラ予測処理ユニット４６と、区分ユニット４８とを含む。ビデオブロックの復元のために、ビデオエンコーダ２０はまた、逆量子化ユニット５８と、逆変換処理ユニット６０と、加算器６２とを含む。復元されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタリングする、デブロッキングフィルタも含まれ得る。所望される場合、デブロッキングフィルタは一般に、加算器６２の出力をフィルタリングすることになる。また、デブロッキングフィルタに加えて追加のフィルタ（ループ内またはループ後）が使用され得る。そのようなフィルタは、簡潔のために示されていないが、所望される場合、（ループ内フィルタとして）加算器５０の出力をフィルタ処理し得る。

[0125] 符号化プロセス中に、ビデオエンコーダ２０はコーディングされるべきビデオフレームまたはスライスを受信する。フレームまたはスライスは複数のビデオブロックに分割され得る。動き推定ユニット４２および動き補償ユニット４４は、時間的な予測を行うために、１つまたは複数の参照フレーム中の１つまたは複数のブロックに対する受信されたビデオブロックのインター予測コーディングを行う。イントラ予測処理ユニット４６は代替的に、空間的な予測を行うために、コーディングされるべきブロックと同じフレームまたはスライス中の１つまたは複数の隣接ブロックに対して受信されたビデオブロックのイントラ予測コーディングを行い得る。ビデオエンコーダ２０は、例えば、ビデオデータのブロックごとに適切なコーディングモードを選択するために、複数のコーディングパスを行い得る。

[0126] その上、区分ユニット４８は、以前のコーディングパスにおける以前の区分方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分し得る。例えば、区分ユニット４８は、初めにフレームまたはスライスをＬＣＵに区分し、レートひずみ分析（例えば、レートひずみ最適化）に基づいてＬＣＵの各々をサブＣＵに区分し得る。モード選択ユニット４０は、さらに、ＬＣＵをサブＣＵに区分することを示す４分木データ構造を生成し得る。４分木のリーフノードＣＵは、１つまたは複数のＰＵと、１つまたは複数のＴＵとを含み得る。

[0127] モード選択ユニット４０は、例えば、誤差結果に基づいて、コーディングモード、すなわち、イントラまたはインターのうちの１つを選択でき、残差ブロックデータを生成するために、得られたイントラコーディングされたブロックまたはインターコーディングされたブロックを加算器５０に与え、参照フレームとして使用するための符号化されたブロックを復元するために、得られたイントラコーディングされたブロックまたはインターコーディングされたブロックを加算器６２に与える。モード選択ユニット４０はまた、動きベクトル、イントラモードインジケータ、パーティション情報、および他のそのようなシンタックス情報などのシンタックス要素をエントロピー符号化ユニット５６に与える。

[0128] 動き推定ユニット４２と動き補償ユニット４４とは、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット４２によって行われる動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、例えば、現在のフレーム（または他のコード化ユニット）内でコーディングされている現在のブロックに対する参照フレーム（または他のコード化ユニット）内の予測ブロックに対する現在のビデオフレームまたはピクチャ内のビデオブロックのＰＵの変位を示し得る。予測ブロックは、絶対値差分和（ＳＡＤ）、２乗差分和（ＳＳＤ）、または他の差分尺度によって決定され得るピクセル差分に関して、コーディングされるブロックに精密に一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ２０が、参照フレームメモリ６４に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。例えば、ビデオエンコーダ２０は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置、または他の分数ピクセル位置の値を補間し得る。従って、動き推定ユニット４２は、フルピクセル位置と分数ピクセル位置とに対する動き探索を行い、分数ピクセル精度で動きベクトルを出力し得る。

[0129] 動き推定ユニット４２は、ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライス中のビデオブロックのＰＵについての動きベクトルを計算する。参照ピクチャは、第１の参照ピクチャリスト（リスト０）または第２の参照ピクチャリスト（リスト１）から選択され得、これら参照ピクチャリストの各々は、参照フレームメモリ６４に記憶された１つまたは複数の参照ピクチャを識別する。動き推定ユニット４２は、計算された動きベクトルをエントロピー符号化ユニット５６と動き補償ユニット４４とに送る。

[0130] 動き補償ユニット４４によって行われる動き補償は、動き推定ユニット４２によって判断された動きベクトルに基づいて予測ブロックをフェッチまたは生成することに関与し得る。この場合も、いくつかの例では、動き推定ユニット４２と動き補償ユニット４４とが機能的に統合され得る。現在のビデオブロックのＰＵのための動きベクトルを受信すると、動き補償ユニット４４は、参照ピクチャリストのうちの１つにおいて動きベクトルが指す予測ブロックの位置を特定し得る。加算器５０は、以下で説明するように、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。概して、動き推定ユニット４２はルーマ成分に対して動き推定を行い、動き補償ユニット４４は、クロマ成分とルーマ成分の両方のためにルーマ成分に基づいて計算された動きベクトルを使用する。モード選択ユニット４０はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ３０が使用するためのビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。

[0131] イントラ予測処理ユニット４６は、上述したように、動き推定ユニット４２と動き補償ユニット４４とによって行われるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測処理ユニット４６は、現在ブロックを符号化するために使用すべきイントラ予測モードを判断し得る。いくつかの例では、イントラ予測ユニット処理４６が、例えば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在ブロックを符号化し得、イントラ予測ユニット処理４６（または、いくつかの例では、モード選択ユニット４０）が、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。

[0132] 例えば、イントラ予測処理ユニット４６は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ（または誤差）の量、並びに符号化ブロックを生成するために使用されるビットレート（すなわち、ビット数）を判断する。イントラ予測処理ユニット４６は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを判断するために、様々な符号化ブロックのひずみおよびレートから比率を計算し得る。

[0133] ブロック用のイントラ予測モードを選択した後、イントラ予測処理ユニット４６は、ブロック用に選択されたイントラ予測モードを示す情報を、エントロピー符号化ユニット５６に提供できる。エントロピー符号化ユニット５６は、選択されたイントラ予測モードを示す情報を符号化できる。ビデオエンコーダ２０は、（コードワードマッピングテーブルとも呼ばれる）複数のイントラ予測モードインデックステーブルおよび複数の修正されたイントラ予測モードインデックステーブルと、様々なブロック用の符号化コンテキストの定義と、最確イントラ予測モードの指示とを含む送信されたビットストリーム構成データの中に、コンテキストの各々について使用する、イントラ予測モードインデックステーブルと修正されたイントラ予測モードインデックステーブルとを含めることができる。

[0134] ビデオエンコーダ２０は、コーディングされている元のビデオブロックから、モード選択ユニット４０からの予測データを減算することによって、残差ビデオブロックを形成する。加算器５０は、この減算動作を行う１つまたは複数の構成要素を表す。変換処理ユニット５２は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換などの変換を残差ブロックに適用し、残差変換係数値を備えるビデオブロックを生成する。変換処理ユニット５２は、ＤＣＴと概念的に同様である他の変換を行い得る。ウェーブレット変換、整数変換、サブバンド変換または他のタイプの変換も使用され得る。いずれの場合も、変換処理ユニット５２は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、残差情報をピクセル値領域から周波数領域などの変換領域に変換し得る。変換処理ユニット５２は、得られた変換係数を量子化ユニット５４に送り得る。

[0135] 量子化ユニット５４は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化ユニット５４が、次いで、量子化変換係数を含む行列の走査を行い得る。代替的に、エントロピー符号化ユニット５６が走査を行い得る。

[0136] 量子化の後、エントロピー符号化ユニット５６は、量子化変換係数をエントロピーコーディングする。例えば、エントロピー符号化ユニット５６は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コーディングまたは別のエントロピーコーディング技法を行い得る。コンテキストベースエントロピーコーディングの場合、コンテキストは隣接ブロックに基づき得る。エントロピー符号化ユニット５６によるエントロピーコーディングの後、符号化ビットストリームは、別のデバイス（例えば、ビデオデコーダ３０）に送信されるか、または後で送信するかもしくは取り出すためにアーカイブできる。

[0137] 逆量子化ユニット５８および逆変換処理ユニット６０は、それぞれ逆量子化および逆変換を適用して、例えば参照ブロックとして後で使用するために、ピクセル領域中で残差ブロックを再構成する。動き補償ユニット４４は、残差ブロックを参照フレームメモリ６４のフレームのうちの１つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット４４はまた、再構成された残差ブロックに１つまたは複数の補間フィルタを適用して、動き推定において使用するサブ整数ピクセル値を計算し得る。加算器６２は、再構成された残差ブロックを、動き補償ユニット４４によって生成された動き補償予測ブロックに加算して、参照フレームメモリ６４に記憶するための再構成されたビデオブロックを生成する。再構成されたビデオブロックは、後続のビデオフレーム中のブロックをインターコーディングするために動き推定ユニット４２および動き補償ユニット４４によって参照ブロックとして使用され得る。

[0138] 図３は、本開示で説明する技法を実装し得るビデオデコーダ３０の一例を示すブロック図である。図３の例では、ビデオデコーダ３０が、エントロピー復号ユニット７０と、動き補償ユニット７２と、イントラ予測処理ユニット７４と、逆量子化ユニット７６と、逆変換処理ユニット７８と、参照フレームメモリ８２と、加算器８０とを含む。ビデオデコーダ３０は、いくつかの例では、図２に示すように、ビデオエンコーダ２０に関して説明した符号化パスとは概して逆の復号パスを行い得る。

[0139] 復号プロセス中に、ビデオデコーダ３０は、ビデオエンコーダ２０から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ３０は、ネットワークエンティティ２９から符号化ビデオビットストリームを受信できる。ネットワークエンティティ２９は、例えば、サーバ、メディアアウェアネットワーク要素（ＭＡＮＥ）、ビデオエディタ／スプライサ、または上述した技法のうちの１つもしくは複数を実装するように構成された他のそのようなデバイスであり得る。ネットワークエンティティ２９は、本開示の技法を行うように構成された外部手段を含み得る。上述のように、本開示で説明する技法のいくつかは、ネットワークエンティティ２９が符号化ビデオビットストリームをビデオデコーダ３０に送信する前にネットワークエンティティ２９によって実装され得る。いくつかのビデオ復号システムでは、ネットワークエンティティ２９およびビデオデコーダ３０が別個のデバイスの一部であり得るが、他の事例では、ネットワークエンティティ２９に関して説明する機能が、ビデオデコーダ３０を備える同じデバイスによって行われ得る。

[0140] 一例では、ネットワークエンティティ２９が、スケーラブルであり、および／または多重レイヤまたはビューを含むビデオデータの元のビットストリームを記憶または受信できる。元のビットストリームでは、パラメータセット、例えばＶＰＳが、上述した動作点シンタックスを含むことができる。動作点シンタックスは、ネットワークエンティティ２９によって、どのレイヤが動作点に存在するかを識別するために使用され得る。元のビットストリームから、ネットワークエンティティ２９は、ＶＰＳに含まれる動作点シンタックスに基づいて、および望ましいこと、またはビデオ復号器３０によって要求されたことに基づいて、複数の動作点（すなわちサブビットストリーム）のうちの１つを選択する。選択された動作点に対応するサブビットストリームのために、ネットワークエンティティ２９は、ビデオ復号器３０に、そのビットストリームを備えるＶＬＣＮＡＬユニットおよび非ＶＣＬＮＡＬユニットを転送でき、他のＮＡＬユニットを転送しない。

[0141] ＶＰＳにおいて識別される特定の動作点のために、ネットワークエンティティ２９は、ビットストリームのための最大レイヤＩＤ値の表示を受信し、最大レイヤＩＤ値未満のレイヤＩＤ値を有するレイヤのための一連のフラグを受信できる。フラグの値に基づいて、ネットワークエンティティ２９は、どのレイヤが動作点に含まれるかを決定できる。例えば、最大のレイヤＩＤの値がＭである場合、レイヤＭは動作点に含まれる。レイヤＭ−１では、ネットワークエンティティ２９が、フラグを受信し、この場合、フラグの第１の値（例えば１または０）は、レイヤＭ−１が動作点に含まれることを示し、フラグの第２の値（例えば０または１）は、レイヤＭ−１が動作点に含まれないことを示す。レイヤＭ−２では、ネットワークエンティティ２９が、第２のフラグを受信し、この場合、第２のフラグの第１の値（例えば１または０）は、レイヤＭ−２が動作点に含まれることを示し、第２のフラグの第２の値（例えば０または１）は、レイヤＭ−２が動作点に含まれないことを示す。ネットワークエンティティ２９は、レイヤ０まで全ての残りのレイヤのためのフラグを同様に受信できる。従って、最大のレイヤＩＤの値がＭである場合、ネットワークエンティティ２９は、レイヤ０からＭ−１までの全てのフラグを受信できる。

[0142] ビデオ復号器３０のエントロピー復号ユニット７０は、量子化係数、動きベクトルまたはイントラ予測モードインジケータ、および上述した動作点シンタックスなど他のシンタックス要素を生成するために、ネットワークエンティティ２９によって提供されるビットストリームをエントロピー復号する。エントロピー復号ユニット７０は、動きベクトルと他のシンタックス要素とを動き補償ユニット７２に転送する。ビデオ復号器３０は、符号化されたビットストリームの異なる部分の異なるシンタックス要素を受信できる。例えば、いくつかのシンタックス要素は、ＶＰＳレベル、ＳＰＳレベル、またはＡＰＳレベルで受信され、一方、他のシンタックス要素は、ビデオスライスレベルおよび／またはビデオブロックレベルで受信され得る。

[0143] ビデオスライスがイントラコード化（Ｉ）スライスとしてコーディングされるとき、イントラ予測処理ユニット７４は、シグナリングされたイントラ予測モードと、現在フレームまたはピクチャの、前に復号されたブロックからのデータとに基づいて、現在ビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコーディングされた（すなわち、Ｂ、ＰまたはＧＰＢ）スライスとしてコーディングされるとき、動き補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルと他のシンタックス要素とに基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストの１つの中の参照ピクチャの１つから生成され得る。ビデオデコーダ３０は、参照フレームメモリ８２に記憶された参照ピクチャに基づいて、デフォルトの構成技法を使用して、参照フレームリスト、すなわち、リスト０およびリスト１を構成し得る。

[0144] 動き補償ユニット７２は、動きベクトルと他のシンタックス要素とを解析することによって現在ビデオスライスのビデオブロックについての予測情報を判断し、予測情報を使用して、復号されている現在ビデオブロックのための予測ブロックを生成する。例えば、動き補償ユニット７２は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード（例えば、イントラまたはインター予測）と、インター予測スライスタイプ（例えば、ＢスライスまたはＰスライス）と、スライスの参照ピクチャリストのうちの１つまたは複数についての構成情報と、スライスの各インター符号化ビデオブロックについての動きベクトルと、スライスの各インターコーディングビデオブロックについてのインター予測ステータスと、現在ビデオスライス中のビデオブロックを復号するための他の情報とを判断するために、受信されたシンタックス要素のいくつかを使用する。

[0145] 動き補償ユニット７２はまた、補間フィルタに基づいて補間を行い得る。動き補償ユニット７２は、ビデオブロックの符号化中にビデオエンコーダ２０によって使用された補間フィルタを使用して、参照ブロックのサブ整数ピクセルの補間値を計算し得る。この場合、動き補償ユニット７２は、受信されたシンタックス要素からビデオエンコーダ２０によって使用された補間フィルタを判断し、その補間フィルタを使用して予測ブロックを生成し得る。

[0146] 逆量子化ユニット７６は、ビットストリーム中で与えられ、エントロピー復号ユニット７０によって復号された量子化変換係数を逆量子化（inverse quantize）、すなわち、逆量子化（de-quantize）する。逆量子化プロセスは、ビデオスライス中の各ビデオブロックについてビデオデコーダ３０によって計算される量子化パラメータＱＰ_Yを使用して量子化の程度を判断し、同様に、適用すべき逆量子化の程度を判断することを含み得る。逆変換処理ユニット７８は、逆変換、例えば、逆ＤＣＴ、逆整数変換、または概念的に同様の逆変換処理を変換係数に適用して、ピクセル領域において残差ブロックを生成する。

[0147] 動き補償ユニット７２が、動きベクトルと他のシンタックス要素とに基づいて現在ビデオブロックのための予測ブロックを生成した後、ビデオデコーダ３０は、逆変換処理ユニット７８からの残差ブロックを動き補償ユニット７２によって生成された対応する予測ブロックと加算することによって、復号されたビデオブロックを形成する。加算器９０は、この加算動作を行う１つまたは複数の構成要素を表す。所望される場合、ブロッキネスアーティファクトを除去するために、復号ブロックをフィルタ処理するためにデブロッキングフィルタも適用され得る。ピクセル遷移を平滑化するか、またはさもなければビデオ品質を改善するために、（コーディングループ内またはコーディングループ後の）他のループフィルタも使用され得る。所与のフレームまたはピクチャの復号されたビデオブロックは、次いで、その後の動き補償のために使用される参照ピクチャを記憶する参照フレームメモリ８２に記憶される。参照フレームメモリ８２はまた、図１のディスプレイデバイス３２などのディスプレイデバイス上での後の表示のために、復号されたビデオを記憶する。

[0148] 図４は、ネットワーク１００の一部を形成するデバイスの例示的な組を示すブロック図である。この例では、ネットワーク１００が、ルーティングデバイス１０４Ａ、１０４Ｂ（ルーティングデバイス１０４）とトランスコーディングデバイス１０６とを含む。ルーティングデバイス１０４およびトランスコーディングデバイス１０６は、ネットワーク１００の一部を形成し得る少数のデバイスを表すことが意図される。スイッチ、ハブ、ゲートウェイ、ファイアウォール、ブリッジ、および他のそのようなデバイスなどの他のネットワークデバイスも、ネットワーク１００内に含まれ得る。さらに、サーバデバイス１０２とクライアントデバイス１０８との間にネットワーク経路に沿って追加のネットワークデバイスが提供され得る。いくつかの例では、サーバデバイス１０２がソースデバイス１２（図１）に対応し得るが、クライアントデバイス１０８は宛先デバイス１４（図１）に対応し得る。

[0149] 一般に、ルーティングデバイス１０４は、ネットワーク１００を介してネットワークデータを交換するための１つまたは複数のルーティングプロトコルを実装する。いくつかの例では、ルーティングデバイス１０４が、プロキシまたはキャッシュ動作を行うように構成され得る。従って、一部の例では、ルーティングデバイス１０４がプロキシデバイスと呼ばれ得る。概して、ルーティングデバイス１０４は、ネットワーク１００を介したルートを発見するためにルーティングプロトコルを実行する。そのようなルーティングプロトコルを実行することによって、ルーティングデバイス１０４Ｂは、それ自体からルーティングデバイス１０４Ａを介してサーバデバイス１０２へ至るネットワークルートを発見できる。

[0150] ルーティングデバイス１０４およびトランスコーディングデバイス１０６は、本開示で説明する技法を実施できるデバイスの例である。例えば、サーバデバイス１０２からクライアントデバイス１０８までのルーティングビデオデータの一部として、ルーティングデバイス１０４および／またはトランスコーディングデバイス１０６は、動作点シンタックスを含むＶＰＳシンタックスを受信できる。動作点シンタックスは、例えば、ビットストリームのための最大レイヤＩＤ値を含む。ルーティングデバイス１０４およびトランスコーディングデバイス１０６は、さらに、動作点シンタックスにおいて、最大レイヤＩＤ値未満のレイヤＩＤを有するレイヤのための１つまたは複数のフラグを受信できる。最大レイヤＩＤ値およびフラグに基づいて、ルーティングデバイス１０４およびトランスコーディングデバイス１０６は、動作点に含まれるレイヤを決定でき、従って、動作点のサブビットストリームを備えるＮＡＬユニットを識別できる。

[0151] 図５は、本開示の技法によるビデオデータを符号化する例示的な方法を示す。図５の技法について、ビデオ符号器２０など、ビデオ符号器に関して説明する。ビデオ符号器２０は、符号化されたビデオデータのビットストリームにおいて、ビットストリームのための最大レイヤＩＤ値の表示を生成できる（１５２）。ビデオ符号器２０は、最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグも生成し得る（１５４）。最大レイヤＩＤおよびフラグの表示は、例えば、ＶＰＳに含まれる動作点シンタックスの一部とすることができる。

[0152] 図６は、本開示の技法によるビデオデータを処理する例示的な方法を示す。図６の技法は、図１および図３のビデオ復号器３０などのビデオ復号器に対応し得る、または、例えば図１のネットワークデバイス１３、図３のネットワークエンティティ２９、または図４のルーティングデバイス１０４またはトランスコーディングデバイス１０６など、ネットワークデバイスまたはネットワークエンティティに対応し得る、ビデオ処理デバイスを参照しながら説明する。ビデオ処理デバイスは、符号化されたビデオデータのビットストリームにおいて、ビットストリームのための最大レイヤＩＤ値の表示を受信できる（１６２）。ビデオ処理デバイスは、最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグも受信し得る（１６４）。フラグの値に基づいて、ビデオ処理デバイスは、フラグの値に基づいて、第１のレイヤが動作点に含まれるかどうかを決定できる（１６６）。

[0153] 例によっては、本明細書で説明された技法のうちいずれかの、いくつかの行為またはイベントは、異なるシーケンスで行われる可能性があり、追加され、統合され、または完全に除外され得る（例えば、全ての説明された行為またはイベントが、本技法の実施のために必要であるとは限らない）ことを認識されたい。さらに、いくつかの例では、行為またはイベントが、連続的にではなく、同時に、例えば、マルチスレッド処理、割込み処理、または複数のプロセッサを通じて行われ得る。

[0154] １つまたは複数の例では、説明された機能が、ハードウェア、ソフトウェア、ファームウェア、またはこれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、１つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、例えば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含むデータ記憶媒体または通信媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、（１）非一時的である有形コンピュータ可読記憶媒体、あるいは（２）信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための複数の命令、コードおよび／またはデータ構造を取り出すために１つまたは複数のコンピュータあるいは１つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含み得る。

[0155] 限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは複数の命令または複数のデータ構造の形式で所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。但し、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびブルーレイディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。

[0156] 複数の命令は、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）などの１つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、あるいは他の等価な集積回路またはディスクリート論理回路によって実行され得る。従って、本明細書で使用する「プロセッサ」という用語は、前述の構造、または本明細書で説明する技法の実装に好適な他の構造のいずれかを指す。さらに、いくつかの態様では、本明細書で説明した機能が、符号化および復号のために構成された専用のハードウェアおよび／またはソフトウェアモジュール内に与えられ得、あるいは複合コーデックに組み込まれ得る。また、本技法は、１つまたは複数の回路または論理要素中に十分に実装され得る。

[0157] 本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）、またはＩＣのセット（例えば、チップセット）を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示する技法を行うように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、これら構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上述したように、様々なユニットが、好適なソフトウェアおよび／またはファームウェアとともに、上述した１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作ハードウェアユニットの集合によって与えられ得る。

[0158] 様々な例について説明してきた。これらおよび他の例は以下の特許請求の範囲内に入る。

Claims

ビデオデータを処理する方法であって、
ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を受信することと、
前記最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを受信することと、
前記フラグの値に基づいて、前記第１のレイヤが動作点に含まれるかどうかを決定することと
を備える方法。
ゼロと前記最大レイヤＩＤ−１との間の各レイヤＩＤ値のフラグを受信すること、ここにおいて各フラグの値は各レイヤが前記動作点に含まれるかどうかを示す、
をさらに備える請求項１に記載の方法。
前記フラグの第１の値は前記第１のレイヤが前記動作点に含まれることを示し、前記フラグの第２の値は前記第１のレイヤが前記動作点に存在しないことを示す、請求項１に記載の方法。
前記動作点は動作点識別値を備え、前記動作点識別値は前記ビデオデータにおいて識別される１組の復号パラメータに関連付けられる、請求項１に記載の方法。
ビデオパラメータセットが前記最大レイヤ識別（ＩＤ）値および前記フラグの前記表示を備える、請求項１に記載の方法。
前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を受信することは、前記最大レイヤＩＤ値を識別するシンタックス要素を受信することを備える、請求項１に記載の方法。
前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を受信することは、最大可能レイヤＩＤ値を決定することを備える、請求項１に記載の方法。
前記方法がメディアアウェアネットワーク要素（ＭＡＮＥ）によって行われ、前記方法は、
前記第１のレイヤが前記動作点に含まれることに応答して、レイヤＩＤシンタックス要素を備えるネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別すること、ここにおいて前記レイヤＩＤシンタックス要素の値が前記第１のレイヤに対応する、をさらに備える請求項１に記載の方法。
ビデオデータを処理するためのデバイスであって、前記デバイスは１つまたは複数のプロセッサを備え、前記１つまたは複数のプロセッサは、ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を受信し、前記最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを受信し、前記フラグの値に基づいて、前記第１のレイヤが動作点に含まれるかどうかを決定するように構成される、デバイス。
前記１つまたは複数のプロセッサは、さらに、ゼロと前記最大レイヤＩＤ−１との間の各レイヤＩＤ値のフラグを受信する、ここにおいて各フラグの値は各レイヤが前記動作点に含まれるかどうかを示すように構成される、請求項９に記載のデバイス。
前記フラグの第１の値は前記第１のレイヤが前記動作点に含まれることを示し、前記フラグの第２の値は前記第１のレイヤが前記動作点に存在しないことを示す、請求項９に記載のデバイス。
前記動作点は動作点識別値を備え、前記動作点識別値は前記ビデオデータにおいて識別される１組の復号パラメータに関連付けられる、請求項９に記載のデバイス。
ビデオパラメータセットが前記最大レイヤ識別（ＩＤ）値および前記フラグの前記表示を備える、請求項９に記載のデバイス。
前記１つまたは複数のプロセッサは、前記最大レイヤＩＤ値を識別するシンタックス要素を受信することによって、前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を受信するように構成される、請求項９に記載のデバイス。
前記１つまたは複数のプロセッサは、最大可能レイヤＩＤ値を決定することによって、前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を受信するように構成される、請求項９に記載のデバイス。
前記デバイスはメディアアウェアネットワーク要素（ＭＡＮＥ）を備え、前記１つまたは複数のプロセッサは、さらに前記第１のレイヤが前記動作点に含まれることに応答して、レイヤＩＤシンタックス要素を備えるネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別するように構成され、ここにおいて前記レイヤＩＤシンタックス要素の値は前記第１のレイヤに対応する、請求項９に記載のデバイス。
前記デバイスは、
集積回路と、
マイクロプロセッサと、
前記ビデオデコーダを含むワイヤレス通信デバイスとのうちの少なくとも１つを備える、請求項９に記載のデバイス。
ビデオデータを処理するための装置であって、
ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を受信するための手段と、
前記最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを受信するための手段と、
前記フラグの値に基づいて、前記第１のレイヤが動作点に含まれるかどうかを決定するための手段と
を備える装置。
ゼロと前記最大レイヤＩＤ−１との間の各レイヤＩＤ値のフラグを受信するための手段をさらに備え、ここにおいて各フラグの値は各レイヤが前記動作点に含まれるかどうかを示す、請求項１８に記載の装置。
前記フラグの第１の値は前記第１のレイヤが前記動作点に含まれることを示し、前記フラグの第２の値は前記第１のレイヤが前記動作点に存在しないことを示す、請求項１８に記載の装置。
前記動作点は動作点識別値を備え、前記動作点識別値は前記ビデオデータにおいて識別される１組の復号パラメータに関連付けられる、請求項１８に記載の装置。
ビデオパラメータセットが前記最大レイヤ識別（ＩＤ）値および前記フラグの前記表示を備える、請求項１８に記載の装置。
前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を受信するための前記手段は、前記最大レイヤＩＤ値を識別するシンタックス要素を受信するための手段を備える、請求項１８に記載の装置。
前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を受信するための前記手段は、最大可能レイヤＩＤ値を決定するための手段を備える、請求項１８に記載の装置。
前記装置はメディアアウェアネットワーク要素（ＭＡＮＥ）を備え、前記装置は、前記第１のレイヤが前記動作点に含まれることに応答して、レイヤＩＤシンタックス要素を備えるネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別するための手段をさらに備え、ここにおいて前記レイヤＩＤシンタックス要素の値は前記第１のレイヤに対応する、請求項１８に記載の装置。
１つまたは複数のプロセッサによって実行されると、前記１つまたは複数のプロセッサに、
ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を受信させ、
前記最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを受信させ、
前記フラグの値に基づいて、前記第１のレイヤが動作点に含まれるかどうかを決定させる、複数の命令を記憶した非一時的コンピュータ可読記憶媒体。
前記１つまたは複数のプロセッサに、
ゼロと前記最大レイヤＩＤ−１との間の各レイヤＩＤ値のフラグを受信させるように構成される複数の命令をさらに記憶し、ここにおいて各フラグの値は各レイヤが前記動作点に含まれるかどうかを示す、請求項２６に記載の非一時的コンピュータ可読記憶媒体。
前記フラグの第１の値は前記第１のレイヤが前記動作点に含まれることを示し、前記フラグの第２の値は前記第１のレイヤが前記動作点に存在しないことを示す、請求項２６に記載の非一時的コンピュータ可読媒体。
前記動作点は動作点識別値を備え、前記動作点識別値は前記ビデオデータにおいて識別される１組の復号パラメータに関連付けられる、請求項２６に記載の非一時的コンピュータ可読媒体。
ビデオパラメータセットが前記最大レイヤ識別（ＩＤ）値および前記フラグの前記表示を備える、請求項２６に記載の非一時的コンピュータ可読媒体。
前記１つまたは複数のプロセッサは、前記最大レイヤＩＤ値を識別するシンタックス要素を受信することによって、前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を受信する、請求項２６に記載の非一時的コンピュータ可読媒体。
前記１つまたは複数のプロセッサは、最大可能レイヤＩＤ値を決定することによって、前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を受信する、請求項２６に記載の非一時的コンピュータ可読媒体。
前記１つまたは複数のプロセッサに、
前記第１のレイヤが前記動作点に含まれることに応答して、レイヤＩＤシンタックス要素を備えるネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別させる複数の命令をさらに記憶し、ここにおいて前記レイヤＩＤシンタックス要素の値は前記第１のレイヤに対応する、請求項２６に記載の非一時的コンピュータ可読媒体。
ビデオデータを符号化する方法であって、
ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を生成することと、
前記最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを生成することとを備え、ここにおいて前記フラグの値は前記第１のレイヤが動作点に含まれるかどうかをシグナリングする、方法。
ゼロと前記最大レイヤＩＤ−１との間の各レイヤＩＤ値のフラグを生成することをさらに備え、ここにおいて各フラグの値は各レイヤが前記動作点に含まれるかどうかを示す、請求項３４に記載の方法。
前記フラグの第１の値は前記第１のレイヤが前記動作点に含まれることを示し、前記フラグの第２の値は前記第１のレイヤが前記動作点に存在しないことを示す、請求項３４に記載の方法。
前記動作点は動作点識別値を備え、前記動作点識別値は前記ビデオデータにおいて識別される１組の復号パラメータに関連付けられる、請求項３４に記載の方法。
ビデオパラメータセットを生成することをさらに備え、ここにおいて前記ビデオパラメータセットは前記最大レイヤ識別（ＩＤ）値および前記フラグの前記表示を備える、る請求項３４に記載の方法。
前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を生成することは、前記最大レイヤＩＤ値を識別するシンタックス要素を生成することを備える、請求項３４に記載の方法。
前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を受信することは、最大可能レイヤＩＤ値を決定することを備える、請求項３４に記載の方法。
前記方法はビデオ符号器によって行われる、請求項３４に記載の方法。
ビデオコーディングデバイスであって、
前記デバイスはビデオ符号器を備え、前記ビデオ符号器は、ビットストリームのための最大レイヤ識別（ＩＤ）値の表示を生成し、前記最大レイヤＩＤ値未満のレイヤＩＤ値を有する第１のレイヤのためのフラグを生成するように構成され、ここにおいて前記フラグの値は前記第１のレイヤが動作点に含まれるかどうかをシグナリングする、ビデオコーディングデバイス。
前記ビデオ符号器はさらにゼロと前記最大レイヤＩＤ−１との間の各レイヤＩＤ値のフラグを生成するように構成され、ここにおいて各フラグの値は各レイヤが前記動作点に含まれるかどうかを示す、請求項４２に記載のビデオコーディングデバイス。
前記フラグの第１の値は前記第１のレイヤが前記動作点に含まれることを示し、前記フラグの第２の値は前記第１のレイヤが前記動作点に存在しないことを示す、請求項４２に記載のビデオコーディングデバイス。
前記動作点は動作点識別値を備え、前記動作点識別値は前記ビデオデータにおいて識別される１組の復号パラメータに関連付けられる、請求項４２に記載のビデオコーディングデバイス。
前記ビデオ符号器はさらにビデオパラメータセットを生成するように構成され、ここにおいて前記ビデオパラメータセットは前記最大レイヤ識別（ＩＤ）値および前記フラグの前記表示を備える、請求項４２に記載のビデオコーディングデバイス。
前記ビデオコーダは、前記最大レイヤＩＤ値を識別するシンタックス要素を生成することによって、前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を生成するように構成される、請求項４２に記載のビデオコーディングデバイス。
前記ビデオ符号器は、最大可能レイヤＩＤ値を決定することによって、前記ビットストリームのための前記最大レイヤＩＤ値の前記表示を生成するように構成される、請求項４２に記載のビデオコーディングデバイス。
前記方法は、ビデオ符号器によって行われる、請求項４２に記載のビデオコーディングデバイス。