JP6608374B2

JP6608374B2 - ビデオ情報のスケーラブルコーディングのためのデバイスおよび方法

Info

Publication number: JP6608374B2
Application number: JP2016547995A
Authority: JP
Inventors: ラマスブラモニアン、アダルシュ・クリシュナン; ワン、イェ−クイ; チェン、イン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-10-14
Filing date: 2014-10-14
Publication date: 2019-11-20
Anticipated expiration: 2034-10-14
Also published as: EP3058728B1; KR20160072123A; JP2016533698A; CN105637862B; US20150103887A1; MX2016004643A; MX2016004634A; CN105637863A; ES2834481T3; WO2015057683A1; WO2015057704A1; EP3058728A1; KR20160072124A; CN105637862A; EP3058727A1; JP2016537930A; MX369062B; KR102329656B1; US20150103878A1

Description

[0001]本開示は、ビデオコーディングおよび圧縮の分野に関し、詳細には、スケーラブルビデオコーディング（ＳＶＣ：scalable video coding）、マルチビュービデオコーディング（ＭＶＣ：multiview video coding）、または３Ｄビデオコーディング（３ＤＶ）に関する。

[0002]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、携帯電話または衛星無線電話、ビデオ遠隔会議デバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４，Ｐａｒｔ１０，アドバンストビデオコーディング（ＡＶＣ）、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）規格によって定義された規格、およびそのような規格の拡張に記載されているもののような、ビデオ圧縮技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶し得る。

[0003]ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するために、空間（イントラピクチャ）予測および／または時間（インターピクチャ）予測を実行する。ブロックベースのビデオコーディングの場合、ビデオスライス（たとえば、ビデオフレーム、ビデオフレームの一部分など）が、ツリーブロック、コーディングユニット（ＣＵ：coding unit）および／またはコーディングノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコーディングされる（Ｉ）スライスの中のビデオブロックは、同じピクチャの中の隣接ブロック中の参照サンプルに対する空間予測を使用して符号化される。ピクチャのインターコーディングされる（ＰまたはＢ）スライスの中のビデオブロックは、同じピクチャの中の隣接ブロック中の参照サンプルに対する空間予測、または他の参照ピクチャにおける参照サンプルに対する時間予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。

[0004]空間予測または時間予測により、コーディングされるべきブロックのための予測ブロックが生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコーディングされたブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化ブロックは、イントラコーディングモードおよび残差データに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換され、残差変換係数をもたらす場合があり、その残差変換係数は、次いで量子化される場合がある。最初に２次元アレイで構成された量子化変換係数は、変換係数の１次元ベクトルを生成するためにスキャンされ得、なお一層の圧縮を達成するために、エントロピー符号化が適用され得る。

[0005]スケーラブルビデオコーディング（ＳＶＣ）は、参照レイヤ（ＲＬ：reference layer）と呼ばれることがあるベースレイヤ（ＢＬ：base layer）と、１つまたは複数のスケーラブルエンハンスメントレイヤ（ＥＬ：enhancement layer）とが使用されるビデオコーディングを指す。ＳＶＣでは、ベースレイヤは、ベースレベルの品質でビデオデータを搬送することができる。１つまたは複数のエンハンスメントレイヤは、たとえば、より高い空間レベル、時間レベル、および／または信号対雑音（ＳＮＲ：signal-to-noise）レベルをサポートするために、追加のビデオデータを搬送することができる。エンハンスメントレイヤは、前に符号化されたレイヤに対して定義され得る。たとえば、最下位レイヤはＢＬとして働き得、最上位レイヤはＥＬとして働き得る。中間レイヤは、ＥＬまたはＲＬのいずれか、あるいはその両方として働き得る。たとえば、中間レイヤ（たとえば、最下位レイヤでもなく最上位レイヤでもないレイヤ）は、ベースレイヤまたは介在エンハンスメントレイヤ（intervening enhancement layer）などの中間レイヤの下のレイヤのためのＥＬであり得、同時に、中間レイヤの上の１つまたは複数のエンハンスメントレイヤのためのＲＬとして働き得る。同様に、ＨＥＶＣ規格のマルチビューまたは３Ｄ拡張では、複数のビューがあり得、１つのビューの情報は、別のビューの情報（たとえば、動き推定、動きベクトル予測および／または他の冗長）をコーディング（たとえば、符号化または復号）するために利用され得る。

[0006]復号されるピクチャは、（たとえば、それらが表示され得、または他のピクチャを予測するために使用され得るように）復号ピクチャバッファ（ＤＰＢ）に記憶される。出力されるべきピクチャは、「出力用に必要とされる」としてマークされてよく、他のピクチャを予測するために使用されるべきピクチャは、「参照として使用される」としてマークされてよい。「出力用に必要とされる」としても「参照用に使用される」としてもマークされない復号ピクチャは、それらが復号プロセスによって除去されるまでＤＰＢの中に存在してよい。出力順序適合の復号器では、ピクチャをＤＰＢから除去するプロセスが、しばしば、「出力用に必要とされる」としてマークされているピクチャの出力の直後にくる。出力およびその後の除去のプロセスは、「バンピング」と呼ばれることがある。

[0007]さらに、これらのピクチャが「出力用に必要とされる」としてマークされていることがあっても、復号器がＤＰＢの中のピクチャを出力せずに除去し得る状況もあり得る。たとえば、ビットストリームの中間にあるいくつかのランダムアクセスポイントピクチャに対して、そのようなピクチャをコーディングする時間において、ＤＰＢの中のすべてのピクチャが除去され得る。

[0008]しかしながら、マルチレイヤビットストリームのコンテキストにおいて、アラインされないＩＲＡＰピクチャをビットストリームの中に有する可能性を伴うと、同じアクセスユニットの他のピクチャがランダムアクセスポイントピクチャでないことがあり、したがって、ＤＰＢの中のピクチャのうちのいくつかを使用する必要があり得るので、ＤＰＢの中のすべてのピクチャがそのようなランダムアクセスポイントピクチャに対して除去される場合に面倒な事態が起こり得る。

[0009]したがって、ランダムアクセスピクチャが複数のレイヤにわたってアラインされないときにＤＰＢをフラッシングするための改善されたコーディング方法が望まれる。

[0010]本開示のシステム、方法、およびデバイスは、いくつかの発明的態様をそれぞれ有し、それらの態様は、１つとして、本明細書で開示する望ましい属性を単独で担うものではない。

[0011]一態様では、ビデオ情報をコーディング（たとえば、符号化または復号）するように構成された装置は、メモリユニットと、メモリユニットと通信しているプロセッサとを含む。メモリユニットは、ベースレイヤ（ＢＬ）およびエンハンスメントレイヤ（ＥＬ）に関連付けられたビデオ情報を記憶するように構成され、ＢＬは、第１のアクセスユニットの中にＢＬピクチャを有し、ＥＬは、第１のアクセスユニットの中にＥＬピクチャを有し、ＢＬピクチャは、それに関連付けられたフラグを有する。プロセッサは、ＢＬピクチャに関連付けられたフラグの値を決定し、フラグの値に基づいて、（１）ＥＬピクチャがコーディングされる前に、復号ピクチャバッファ（ＤＰＢ）の中の１つまたは複数のＥＬピクチャを、１つまたは複数のＥＬピクチャを出力することなく除去すること、または（２）ＤＰＢの中の１つまたは複数のＥＬピクチャを、１つまたは複数のＥＬピクチャを出力することなく除去することを控えることのうちの１つを実行するように構成される。

[0012]別の態様では、ビデオ情報を符号化する方法は、第１のアクセスユニットの中のＢＬピクチャに関連付けられたフラグの値を決定することと、フラグの値に基づいて、（１）第１のアクセスユニットの中のＥＬピクチャがコーディングされる前に、復号ピクチャバッファ（ＤＰＢ）の中の１つまたは複数のＥＬピクチャを、１つまたは複数のＥＬピクチャを出力することなく除去すること、または（２）ＤＰＢの中の１つまたは複数のＥＬピクチャを、１つまたは複数のＥＬピクチャを出力することなく除去することを控えることのうちの１つを実行することとを備える。

[0013]別の態様では、非一時的コンピュータ可読媒体は、実行されたとき、装置にプロセスを実行させるコードを備える。プロセスは、ベースレイヤ（ＢＬ）およびエンハンスメントレイヤ（ＥＬ）に関連付けられたビデオ情報を記憶することと、ＢＬは、第１のアクセスユニットの中にＢＬピクチャを有し、ＥＬは、第１のアクセスユニットの中にＥＬピクチャを有し、ここにおいて、ＢＬピクチャは、それに関連付けられたフラグを有する、ＢＬピクチャに関連付けられたフラグの値を決定することと、フラグの値に基づいて、（１）ＥＬピクチャがコーディングされる前に、復号ピクチャバッファ（ＤＰＢ）の中の１つまたは複数のＥＬピクチャを、１つまたは複数のＥＬピクチャを出力することなく除去すること、または（２）ＤＰＢの中の１つまたは複数のＥＬピクチャを、１つまたは複数のＥＬピクチャを出力することなく除去することを控えることのうちの１つを実行することとを含む。

[0014]別の態様では、ビデオ情報をコーディングするように構成されたビデオコーディングデバイスは、ベースレイヤ（ＢＬ）およびエンハンスメントレイヤ（ＥＬ）に関連付けられたビデオ情報を記憶するための手段と、ＢＬは、第１のアクセスユニットの中にＢＬピクチャを有し、ＥＬは、第１のアクセスユニットの中にＥＬピクチャを有し、ここにおいて、ＢＬピクチャは、それに関連付けられたフラグを有する、ＢＬピクチャに関連付けられたフラグの値を決定するための手段と、フラグの値に基づいて、（１）ＥＬピクチャがコーディングされる前に、復号ピクチャバッファ（ＤＰＢ）の中の１つまたは複数のＥＬピクチャを、１つまたは複数のＥＬピクチャを出力することなく除去すること、または（２）ＤＰＢの中の１つまたは複数のＥＬピクチャを、１つまたは複数のＥＬピクチャを出力することなく除去することを控えることのうちの１つを実行するための手段とを備える。

本開示で説明する態様による技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。本開示で説明する態様による技法を実行し得る別の例示的なビデオ符号化および復号システムを示すブロック図。本開示で説明する態様による技法を実装し得るビデオ符号化器の一例を示すブロック図。本開示で説明する態様による技法を実装し得るビデオ符号化器の一例を示すブロック図。本開示で説明する態様による技法を実装し得るビデオ復号器の一例を示すブロック図。本開示で説明する態様による技法を実装し得るビデオ復号器の一例を示すブロック図。本開示の一実施形態による、異なるレイヤの中のピクチャの例示的な構成を示すブロック図。本開示の一実施形態による、ビデオ情報をコーディングする方法を示すフローチャート。本開示の一実施形態による、ビデオ情報をコーディングする方法を示すフローチャート。

[0024]本明細書に記載されるいくつかの実施形態は、ＨＥＶＣ（高効率ビデオコーディング）などのアドバンストビデオコーデックのコンテキストにおけるスケーラブルビデオコーディングのためのレイヤ間予測に関する。より具体的には、本開示は、ＨＥＶＣのスケーラブルビデオコーディング（ＳＶＣ）拡張におけるレイヤ間予測の実行を改善するためのシステムおよび方法に関する。

[0025]以下の説明では、いくつかの実施形態に関係するＨ．２６４／ＡＶＣ技法が記載され、ＨＥＶＣ規格および関係する技法も説明される。ＨＥＶＣ規格および／またはＨ．２６４規格のコンテキストにおいて、いくつかの実施形態が本明細書に記載されるが、本明細書で開示されるシステムおよび方法が任意の適切なビデオコーディング規格に適用可能であり得ることを、当業者なら諒解されよう。たとえば、本明細書で開示される実施形態は、以下の規格、すなわち、ＩＴＵ−ＴＨ．２６１、ＩＳＯ／ＩＥＣＭＰＥＧ−１ビジュアル、ＩＴＵ−ＴＨ．２６２もしくはＩＳＯ／ＩＥＣＭＰＥＧ−２ビジュアル、ＩＴＵ−ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ−４ビジュアル、およびそのスケーラブルビデオコーディング（ＳＶＣ）およびマルチビュービデオコーディング（ＭＶＣ）拡張を含むＩＴＵ−ＴＨ．２６４（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとも呼ばれる）のうちの、１つまたは複数に適用可能であり得る。

[0026]ＨＥＶＣは、概して、多くの点で、前のビデオコーディング規格のフレームワークに従う。ＨＥＶＣにおける予測の単位は、いくつかの前のビデオコーディング規格における単位（たとえば、マクロブロック）とは異なる。事実上、マクロブロックの概念は、いくつかの前のビデオコーディング規格において理解されているように、ＨＥＶＣ中に存在しない。マクロブロックは、他の考えられる利益の中でも高いフレキシビリティを与え得る、４分木スキームに基づく階層構造と置き換えられる。たとえば、ＨＥＶＣスキーム内で、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ：Prediction Unit）、および変換ユニット（ＴＵ：Transform Unit）という３つのタイプのブロックが定義される。ＣＵは領域分割の基本単位を指すことがある。ＣＵはマクロブロックの概念に類似するとみなされてよいが、ＨＥＶＣは、ＣＵの最大サイズを制限せず、コンテンツ適応性を改善するために４つの等しいサイズのＣＵへの再帰的分割を可能にし得る。ＰＵは、インター／イントラ予測の基本単位とみなされてよく、単一のＰＵは、不規則なイメージパターンを効率的にコーディングするために、複数の任意形状区分を含み得る。ＴＵは、変換の基本単位とみなされてよい。ＴＵはＰＵとは無関係に定義され得るが、ＴＵのサイズはＴＵが属するＣＵのサイズに限定されることがある。３つの異なる概念へのブロック構造のこの分離は、各ユニットがそのユニットのそれぞれの役割に従って最適化されることを可能にし得、このことはコーディング効率の改善をもたらし得る。

[0027]単に説明の目的で、本明細書で開示するいくつかの実施形態について、２つのレイヤのみ（たとえば、ベースレイヤなどの下位レイヤ、およびエンハンスメントレイヤなどの上位レイヤ）を含む例を用いて説明する。そのような例が複数のベースレイヤおよび／またはエンハンスメントレイヤを含む構成に適用可能であり得ることを理解されたい。さらに、説明を簡単にするために、以下の開示は、いくつかの実施形態に関して「フレーム」または「ブロック」という用語を含む。しかしながら、これらの用語は、限定的であることを意味しない。たとえば、以下で説明する技法は、ブロック（たとえば、ＣＵ、ＰＵ、ＴＵ、マクロブロックなど）、スライス、フレームなどの、任意の適切なビデオユニットとともに使用され得る。

ビデオコーディング規格

[0028]ビデオ画像、ＴＶ画像、静止画像、またはビデオレコーダもしくはコンピュータによって生成された画像などの、デジタル画像は、水平ラインおよび垂直ラインで構成されたピクセルまたはサンプルからなり得る。単一の画像中のピクセルの数は一般に数万個である。各ピクセルは、一般に、ルミナンス情報とクロミナンス情報とを含んでいる。圧縮がなければ、画像符号化器から画像復号器に搬送されるべき情報の純粋な量は、リアルタイム画像伝送を不可能にすることになる。送信されるべき情報の量を低減するために、ＪＰＥＧ、ＭＰＥＧおよびＨ．２６３規格など、いくつかの異なる圧縮方法が開発された。

[0029]ビデオコーディング規格は、ＩＴＵ−ＴＨ．２６１と、ＩＳＯ／ＩＥＣＭＰＥＧ−１ビジュアルと、ＩＴＵ−ＴＨ．２６２またはＩＳＯ／ＩＥＣＭＰＥＧ−２ビジュアルと、ＩＴＵ−ＴＨ．２６３と、ＩＳＯ／ＩＥＣＭＰＥＧ−４ビジュアルと、それのスケーラブルビデオコーディング（ＳＶＣ）およびマルチビュービデオコーディング（ＭＶＣ）拡張を含む（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとも呼ばれる）ＩＴＵ−ＴＨ．２６４とを含む。

[0030]さらに、新しいビデオコーディング規格、すなわち、高効率ビデオコーディング（ＨＥＶＣ）が、ＩＴＵ−Ｔビデオコーディングエキスパートグループ（ＶＣＥＧ：Video Coding Experts Group）とＩＳＯ／ＩＥＣモーションピクチャエキスパートグループ（ＭＰＥＧ）とのジョイントコラボレーションチームオンビデオコーディング（ＪＣＴ−ＶＣ：Joint Collaboration Team on Video Coding）によって開発されている。ＨＥＶＣドラフト１０についての完全引用は、文書ＪＣＴＶＣ−Ｌ１００３、Ｂｒｏｓｓら、「ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ）ＴｅｘｔＳｐｅｃｉｆｉｃａｔｉｏｎＤｒａｆｔ１０」、ＩＴＵ−ＴＳＧ１６ＷＰ３およびＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１のジョイントコラボレーティブチームオンビデオコーディング（ＪＣＴ−ＶＣ）、第１２回会合：ジュネーブ、スイス、２０１３年１月１４日〜２０１３年１月２３日である。ＨＥＶＣへのマルチビュー拡張、すなわち、ＭＶ−ＨＥＶＣ、およびＳＨＶＣと名付けられたＨＥＶＣへのスケーラブル拡張も、ＪＣＴ−３Ｖ（ＩＴＵ−Ｔ／ＩＳＯ／ＩＥＣジョイントコラボレーティブチームオン３Ｄビデオコーディング拡張開発）およびＪＣＴ−ＶＣによって、それぞれ開発されている。

[0031]新規のシステム、装置、および方法の様々な態様は、これ以降、添付図面を参照しながら、より十分に説明される。しかしながら、本開示は、多くの異なる形態で実施可能であり、本開示の全体を通して示される任意の特定の構造または機能に限定されるものと解釈されるべきでない。むしろ、本開示が、入念で完全であり、本開示の範囲を当業者に十分に伝達するように、これらの態様が提供される。本明細書の教示に基づいて、本開示の範囲は、本開示の他の態様と無関係に実装されるにせよ、本開示の他の態様と組み合わせて実装されるにせよ、本明細書で開示する新規のシステム、装置、および方法のいかなる態様をもカバーするものであることを、当業者なら諒解されたい。たとえば、本明細書に記載される任意の数の態様を使用して装置が実装されてよく、または方法が実施されてもよい。さらに、本開示の範囲は、本明細書に記載する本開示の様々な態様に加えてまたはそれらの態様以外に、他の構造、機能、または構造および機能を使用して実施されるそのような装置または方法をカバーするものとする。本明細書で開示する任意の態様は、特許請求の範囲の１つまたは複数の要素により実施されてもよいことを理解されたい。

[0032]特定の態様について本明細書で説明するが、これらの態様の多くの変形および置換は本開示の範囲内に入る。好ましい態様のいくつかの利益および利点が述べられるが、本開示の範囲は、特定の利益、使用、または目的に限定されることを意図しない。むしろ、本開示の態様は、異なるワイヤレス技術、システム構成、ネットワーク、および伝送プロトコルに広く適用可能なものであり、そのうちのいくつかが図面および好ましい態様の以下の説明において例として示される。詳細な説明および図面は、限定的ではなく、本開示の例示にすぎず、本開示の範囲は、添付の特許請求の範囲およびその均等物によって定義される。

[0033]添付の図面は、例を示す。添付の図面内で参照番号によって示される要素は、以下の説明において同様の参照番号で示される要素に対応する。本開示では、序数語（たとえば、「第１の」、「第２の」、「第３の」など）で始まる名前を有する要素は、必ずしもそれらの要素が特定の順序を有することを暗示するとは限らない。むしろ、そのような序数語は、同じまたは同様のタイプの、異なる要素を指すために使用されるにすぎない。

ビデオコーディングシステム

[0034]図１Ａは、本開示で説明する態様による技法を利用し得る例示的なビデオコーディングシステム１０を示すブロック図である。本明細書で使用し説明する「ビデオコーダ」という用語は、総称的にビデオ符号化器とビデオ復号器の両方を指す。本開示では、「ビデオコーディング」または「コーディング」という用語は、ビデオ符号化とビデオ復号とを総称的に指すことがある。ビデオ符号化器およびビデオ復号器に加えて、本出願に記載される態様は、トランスコーダ（たとえば、ビットストリームを復号し別のビットストリームを再符号化することができるデバイス）およびミドルボックス（たとえば、ビットストリームを修正、変換、および／または別のやり方で操作することができるデバイス）などの、他の関係するデバイスに拡張され得る。

[0035]図１Ａに示すように、ビデオコーディングシステム１０は、宛先モジュール１４によって後で復号されるべき符号化ビデオデータを生成するソースモジュール１２を含む。図１Ａの例では、ソースモジュール１２および宛先モジュール１４は別個のデバイス上にある− 詳細には、ソースモジュール１２はソースデバイスの部分であり、宛先モジュール１４は宛先デバイスの部分である。しかしながら、ソースおよび宛先モジュール１２、１４が、図１Ｂの例に示すように、同じデバイス上にあってもよく、または同じデバイスの部分であってもよいことに留意されたい。

[0036]もう一度図１Ａを参照すると、ソースモジュール１２および宛先モジュール１４は、デスクトップコンピュータ、ノートブック（たとえば、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲のデバイスのいずれかを備え得る。場合によっては、ソースモジュール１２および宛先モジュール１４はワイヤレス通信のために装備され得る。

[0037]宛先モジュール１４は、リンク１６を介して、復号されるべき符号化ビデオデータを受信し得る。リンク１６は、ソースモジュール１２から宛先モジュール１４に符号化ビデオデータを動かすことが可能な任意のタイプの媒体またはデバイスを備え得る。図１Ａの例では、リンク１６は、ソースモジュール１２が、符号化ビデオデータをリアルタイムで宛先モジュール１４に直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され得、宛先モジュール１４に送信され得る。通信媒体は、無線周波数（ＲＦ）スペクトルまたは１つもしくは複数の物理伝送線路などの、任意のワイヤレス通信媒体または有線通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワークなどのパケットベースのネットワーク、またはインターネットなどのグローバルネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースモジュール１２から宛先モジュール１４への通信を容易にするために有用であり得る、任意の他の機器を含み得る。

[0038]代替的に、符号化データは出力インターフェース２２から、オプションの記憶デバイス３１に出力され得る。同様に、符号化データは、入力インターフェース２８によって記憶デバイス３１からアクセスされ得る。記憶デバイス３１は、ハードドライブ、フラッシュメモリ、揮発性もしくは不揮発性のメモリ、または符号化ビデオデータを記憶するための任意の他の適切なデジタル記憶媒体などの、様々な分散されたまたは局所的にアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる例では、記憶デバイス３１は、ソースモジュール１２によって生成された符号化ビデオを保持し得るファイルサーバまたは別の中間記憶デバイスに相当し得る。宛先モジュール１４は、記憶されているビデオデータに、記憶デバイス３１からストリーミングまたはダウンロードを介してアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶することができ、その符号化ビデオデータを宛先モジュール１４に送信することができる、任意のタイプのサーバであり得る。例示的なファイルサーバは、ウェブサーバ（たとえば、ウェブサイトのための）、ＦＴＰサーバ、ネットワーク接続記憶（ＮＡＳ）デバイス、または局所的なディスクドライブを含む。宛先モジュール１４は、インターネット接続を含む任意の標準的なデータ接続を通じて、符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適である、ワイヤレスチャネル（たとえば、Ｗｉ−Ｆｉ（登録商標）接続）、有線接続（たとえば、ＤＳＬ、ケーブルモデムなど）、またはその両方の組合せを含み得る。記憶デバイス３１からの符号化ビデオデータの伝送は、ストリーミング伝送、ダウンロード伝送、またはその両方の組合せであり得る。

[0039]本開示の技法は、ワイヤレスの用途または設定に限定されない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信（たとえば、動的適応ストリーミングオーバーＨＴＴＰ（ＤＡＳＨ：dynamic adaptive streaming over HTTP）など）、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、ビデオコーディングシステム１０は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および／またはビデオ電話などの用途をサポートするために、単方向または双方向のビデオ送信をサポートするように構成され得る。

[0040]図１Ａの例では、ソースモジュール１２は、ビデオソース１８と、ビデオ符号化器２０と、出力インターフェース２２とを含む。場合によっては、出力インターフェース２２は変調器／復調器（モデム）および／または送信機を含み得る。ソースモジュール１２において、ビデオソース１８は、ビデオキャプチャデバイス、たとえばビデオカメラ、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および／またはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどのソース、あるいはそのようなソースの組合せを含み得る。一例として、図１Ｂの例に示すように、ビデオソース１８がビデオカメラである場合、ソースモジュール１２および宛先モジュール１４は、いわゆるカメラ付き電話またはビデオ電話を形成し得る。しかしながら、本開示に記載される技法は、概してビデオコーディングに適用可能であり得、ワイヤレスアプリケーションおよび／または有線アプリケーションに適用され得る。

[0041]キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオは、ビデオ符号化器２０によって符号化され得る。符号化ビデオデータは、ソースモジュール１２の出力インターフェース２２を介して、宛先モジュール１４に直接送信され得る。符号化ビデオデータは、さらに（または代替的に）、復号および／または再生のための宛先モジュール１４または他のデバイスによる後のアクセスのために、記憶デバイス３１に記憶され得る。図１Ａおよび図１Ｂに示すビデオ符号化器２０は、図２Ａに示すビデオ符号化器２０、図２Ｂに示すビデオ符号化器２３、または本明細書に記載される任意の他のビデオ符号化器を備えてよい。

[0042]図１Ａの例では、宛先モジュール１４は、入力インターフェース２８と、ビデオ復号器３０と、ディスプレイデバイス３２とを含む。場合によっては、入力インターフェース２８は、受信機および／またはモデムを含み得る。宛先モジュール１４の入力インターフェース２８は、符号化ビデオデータを、リンク１６を介して受信し得る。リンク１６を介して通信され、または記憶デバイス３１上に提供された符号化ビデオデータは、ビデオデータを復号する際のビデオ復号器３０などのビデオ復号器による使用のために、ビデオ符号化器２０によって生成された様々なシンタックス要素を含み得る。そのようなシンタックス要素は、通信媒体上で送信されるか、記憶媒体に記憶されるか、またはファイルサーバに記憶される符号化ビデオデータに含まれ得る。図１Ａおよび図１Ｂに示すビデオ復号器３０は、図３Ａに示すビデオ復号器３０、図３Ｂに示すビデオ復号器３３、または本明細書に記載される任意の他のビデオ復号器を備えてよい。

[0043]ディスプレイデバイス３２は、宛先モジュール１４と一体化されるか、またはその外部にあり得る。いくつかの例では、宛先モジュール１４は、一体型ディスプレイデバイスを含み得、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先モジュール１４はディスプレイデバイスであり得る。概して、ディスプレイデバイス３２は、復号ビデオデータをユーザに対して表示し、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。

[0044]関係する態様では、図１Ｂは、例示的なビデオ符号化および復号システム１０’を示し、ここにおいて、ソースおよび宛先モジュール１２、１４は、デバイスまたはユーザデバイス１１上にあり、またはその部分である。デバイス１１は、「スマート」フォンなどの電話ハンドセットであり得る。デバイス１１は、ソースおよび宛先モジュール１２、１４と動作可能に通信しているオプションのコントローラ／プロセッサモジュール１３を含み得る。図１Ｂのシステム１０’は、ビデオ符号化器２０と出力インターフェース２２との間にビデオ処理ユニット２１をさらに含み得る。いくつかの実装形態では、ビデオ処理ユニット２１は、図１Ｂに示すように別個のユニットであるが、他の実施態様では、ビデオ処理ユニット２１は、ビデオ符号化器２０および／またはプロセッサ／コントローラモジュール１３の部分として実装され得る。システム１０’は、また、ビデオシーケンスの中で対象のオブジェクトを追跡することができるオプションの追跡器２９を含み得る。追跡されるべきオブジェクトまたは対象は、本開示の１つまたは複数の態様に関して説明する技法によって、セグメント化され得る。関係する態様では、追跡することは、ディスプレイデバイス３２によって単独で、または追跡器２９と一緒に実行され得る。図１Ｂのシステム１０’およびその構成要素は、図１Ａのシステム１０およびその構成要素と場合によっては類似である。

[0045]ビデオ符号化器２０およびビデオ復号器３０は、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）規格など、ビデオ圧縮規格に従って動作し得、ＨＥＶＣテストモデル（ＨＭ）に準拠し得る。代替的に、ビデオ符号化器２０およびビデオ復号器３０は、代替的にＭＰＥＧ−４，Ｐａｒｔ１０，アドバンストビデオコーディング（ＡＶＣ）と呼ばれるＩＴＵ−ＴＨ．２６４規格など、他の独自の規格または業界規格、あるいはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例は、ＭＰＥＧ−２およびＩＴＵ−ＴＨ．２６３を含む。

[0046]図１Ａおよび図１Ｂの例に示されないが、ビデオ符号化器２０およびビデオ復号器３０は各々、オーディオ符号化器およびオーディオ復号器と統合されてよく、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するための適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含み得る。適用可能な場合、いくつかの例では、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

[0047]ビデオ符号化器２０およびビデオ復号器３０は各々、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せなどの様々な適切な符号化器回路のいずれかとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、適切な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し得、本開示の技法を実行するために、１つまたは複数のプロセッサを使用して、命令をハードウェアで実行し得る。ビデオ符号化器２０およびビデオ復号器３０の各々は、１つまたは複数の符号化器または復号器に含まれ得、そのいずれも、それぞれのデバイスにおいて複合符号化器／復号器（コーデック）の一部として統合され得る。

ビデオコーディングプロセス

[0048]上記で簡略に述べられたように、ビデオ符号化器２０はビデオデータを符号化する。ビデオデータは、１つまたは複数のピクチャを備え得る。ピクチャの各々は、ビデオの一部を形成する静止画像である。いくつかの事例では、ピクチャは、ビデオ「フレーム」と呼ばれることがある。ビデオ符号化器２０がビデオデータを符号化するとき、ビデオ符号化器２０は、ビットストリームを生成し得る。ビットストリームは、ビデオデータのコーディングされた表現を形成するビットのシーケンスを含み得る。ビットストリームは、コード化ピクチャと、関連するデータとを含み得る。コード化ピクチャは、ピクチャのコーディングされた表現である。

[0049]ビットストリームを生成するために、ビデオ符号化器２０は、ビデオデータ中の各ピクチャに対して符号化演算を実行し得る。ビデオ符号化器２０がピクチャに対して符号化演算を実行するとき、ビデオ符号化器２０は、一連のコード化ピクチャと、関連するデータとを生成し得る。関連するデータは、ビデオパラメータセット（ＶＰＳ：video parameter set）と、シーケンスパラメータセットと、ピクチャパラメータセットと、適応パラメータセットと、他のシンタックス構造とを含み得る。シーケンスパラメータセット（ＳＰＳ：sequence parameter set）は、ピクチャの０個以上のシーケンスに適用可能なパラメータを含み得る。ピクチャパラメータセット（ＰＰＳ：picture parameter set）は、０個以上のピクチャに適用可能なパラメータを含み得る。適応パラメータセット（ＡＰＳ：adaptation parameter set）は、０個以上のピクチャに適用可能なパラメータを含み得る。ＡＰＳ中のパラメータは、ＰＰＳ中のパラメータよりも変化する可能性が高いパラメータであり得る。

[0050]コード化ピクチャを生成するために、ビデオ符号化器２０は、ピクチャを等しいサイズのビデオブロックに区分し得る。ビデオブロックはサンプルの２次元アレイであり得る。ビデオブロックの各々は、ツリーブロックに関連付けられる。いくつかの事例では、ツリーブロックは、最大コーディングユニット（ＬＣＵ：largest coding unit）と呼ばれることがある。ＨＥＶＣのツリーブロックは、Ｈ．２６４／ＡＶＣのような従来の規格のマクロブロックに、広い意味で類似し得る。しかしながら、ツリーブロックは、特定のサイズに必ずしも限定されず、１つまたは複数のコーディングユニット（ＣＵ）を含み得る。ビデオ符号化器２０は、ツリーブロックのビデオブロックを、ＣＵに関連付けられたビデオブロックに区分するために、４分木区分を使用し得、したがって、「ツリーブロック」という名前である。

[0051]いくつかの例では、ビデオ符号化器２０は、ピクチャを複数のスライスに区分し得る。スライスの各々は、整数個のＣＵを含み得る。いくつかの事例では、スライスは、整数個のツリーブロックを備える。他の事例では、スライスの境界は、ツリーブロック内にあり得る。

[0052]ピクチャに対して符号化演算を実行することの一部として、ビデオ符号化器２０は、ピクチャの各スライスに対して符号化演算を実行し得る。ビデオ符号化器２０がスライスに対して符号化演算を実行するとき、ビデオ符号化器２０は、スライスに関連付けられた符号化データを生成し得る。スライスに関連付けられた符号化データは、「コード化スライス」と呼ばれることがある。

[0053]コード化スライスを生成するために、ビデオ符号化器２０は、スライス中の各ツリーブロックに対して符号化演算を実行し得る。ビデオ符号化器２０がツリーブロックに対して符号化演算を実行するとき、ビデオ符号化器２０は、コーディングされたツリーブロックを生成し得る。コーディングされたツリーブロックは、ツリーブロックの符号化されたバージョンを表すデータを備え得る。

[0054]ビデオ符号化器２０がコード化スライスを生成するとき、ビデオ符号化器２０は、ラスタスキャン順序に従って、スライス中のツリーブロックに対して符号化演算を実行（たとえば、符号化）し得る。たとえば、ビデオ符号化器２０は、スライス中のツリーブロックの一番上の行にわたって左から右に進み、次いでツリーブロックの次の下の行にわたって左から右に進み、以下同様に進む順序で、ビデオ符号化器２０がスライス中のツリーブロックの各々を符号化するまで、スライスのツリーブロックを符号化し得る。

[0055]ラスタスキャン順序に従ってツリーブロックを符号化した結果として、所与のツリーブロックの上および左のツリーブロックは符号化されていることがあるが、所与のツリーブロックの下および右のツリーブロックはまだ符号化されていない。したがって、ビデオ符号化器２０は、所与のツリーブロックを符号化するとき、所与のツリーブロックの上および左のツリーブロックを符号化することによって生成される情報にアクセスすることが可能であり得る。しかしながら、ビデオ符号化器２０は、所与のツリーブロックを符号化するとき、所与のツリーブロックの下および右のツリーブロックを符号化することによって生成される情報にアクセスできないことがある。

[0056]コーディングされたツリーブロックを生成するために、ビデオ符号化器２０は、ビデオブロックを徐々により小さいビデオブロックに分割するために、ツリーブロックのビデオブロック上で４分木区分を再帰的に実行し得る。より小さいビデオブロックの各々は、異なるＣＵに関連付けられ得る。たとえば、ビデオ符号化器２０は、ツリーブロックのビデオブロックを４つの等しいサイズのサブブロックに区分し得、サブブロックのうちの１つまたは複数を４つの等しいサイズのサブサブブロックに区分し得、以下同様である。区分されたＣＵは、そのビデオブロックが他のＣＵに関連付けられたビデオブロックに区分されているＣＵであり得る。区分されていないＣＵは、そのビデオブロックが他のＣＵに関連付けられたビデオブロックに区分されていないＣＵであり得る。

[0057]ビットストリーム中の１つまたは複数のシンタックス要素は、ビデオ符号化器２０がツリーブロックのビデオブロックを区分し得る最大の回数を示し得る。ＣＵのビデオブロックは形状が正方形であり得る。ＣＵのビデオブロックのサイズ（たとえば、ＣＵのサイズ）は、８×８のピクセルから、最大で６４×６４以上のピクセルを有するツリーブロックのビデオブロックのサイズ（たとえば、ツリーブロックのサイズ）までわたり得る。

[0058]ビデオ符号化器２０は、ｚスキャン順序に従って、ツリーブロックの各ＣＵに対して符号化演算を実行（たとえば、符号化）し得る。言い換えれば、ビデオ符号化器２０は、左上のＣＵと、右上のＣＵと、左下のＣＵと、次いで右下のＣＵとを、その順序で符号化し得る。ビデオ符号化器２０が、区分されているＣＵに対して符号化演算を実行するとき、ビデオ符号化器２０は、ｚスキャン順序に従って、区分されているＣＵのビデオブロックのサブブロックに関連付けられたＣＵを符号化し得る。言い換えれば、ビデオ符号化器２０は、左上のサブブロックに関連付けられたＣＵと、右上のサブブロックに関連付けられたＣＵと、左下のサブブロックに関連付けられたＣＵと、次いで右下のサブブロックに関連付けられたＣＵとを、その順序で符号化し得る。

[0059]ｚスキャン順序に従ってツリーブロックのＣＵを符号化した結果として、所与のＣＵの上、左上、右上、左、および左下のＣＵは符号化されていることがある。所与のＣＵの下または右のＣＵはまだ符号化されていない。したがって、ビデオ符号化器２０は、所与のＣＵを符号化するとき、所与のＣＵに隣接するいくつかのＣＵを符号化することによって生成される情報にアクセスすることが可能であり得る。しかしながら、ビデオ符号化器２０は、所与のＣＵを符号化するとき、所与のＣＵに隣接する他のＣＵを符号化することによって生成される情報にアクセスできないことがある。

[0060]ビデオ符号化器２０が、区分されていないＣＵを符号化するとき、ビデオ符号化器２０は、ＣＵに対する１つまたは複数の予測ユニット（ＰＵ）を生成し得る。ＣＵのＰＵの各々は、ＣＵのビデオブロック内の異なるビデオブロックに関連付けられ得る。ビデオ符号化器２０は、ＣＵの各ＰＵに対して予測ビデオブロックを生成し得る。ＰＵの予測ビデオブロックは、サンプルのブロックであり得る。ビデオ符号化器２０は、ＰＵのための予測ビデオブロックを生成するために、イントラ予測またはインター予測を使用し得る。

[0061]ビデオ符号化器２０がＰＵの予測ビデオブロックを生成するためにイントラ予測を使用するとき、ビデオ符号化器２０は、ＰＵに関連付けられたピクチャの復号サンプルに基づいて、ＰＵの予測ビデオブロックを生成し得る。ビデオ符号化器２０がＣＵのＰＵの予測ビデオブロックを生成するためにイントラ予測を使用する場合、ＣＵはイントラ予測されたＣＵである。ビデオ符号化器２０がＰＵの予測ビデオブロックを生成するためにインター予測を使用するとき、ビデオ符号化器２０は、ＰＵに関連付けられたピクチャ以外の１つまたは複数のピクチャの復号サンプルに基づいて、ＰＵの予測ビデオブロックを生成し得る。ビデオ符号化器２０がＣＵのＰＵの予測ビデオブロックを生成するためにインター予測を使用する場合、ＣＵはインター予測されたＣＵである。

[0062]さらに、ビデオ符号化器２０がＰＵのための予測ビデオブロックを生成するためにインター予測を使用するとき、ビデオ符号化器２０は、ＰＵのための動き情報を生成し得る。ＰＵのための動き情報は、ＰＵの１つまたは複数の参照ブロックを示し得る。ＰＵの各参照ブロックは、参照ピクチャ内のビデオブロックであり得る。参照ピクチャは、ＰＵに関連付けられたピクチャ以外のピクチャであり得る。いくつかの事例では、ＰＵの参照ブロックは、ＰＵの「参照サンプル」と呼ばれることもある。ビデオ符号化器２０は、ＰＵの参照ブロックに基づいて、ＰＵのための予測ビデオブロックを生成し得る。

[0063]ビデオ符号化器２０がＣＵの１つまたは複数のＰＵのための予測ビデオブロックを生成した後、ビデオ符号化器２０は、ＣＵのＰＵのための予測ビデオブロックに基づいて、ＣＵに対する残差データを生成し得る。ＣＵの残差データは、ＣＵのＰＵのための予測ビデオブロック中のサンプルと、ＣＵの元のビデオブロック中のサンプルとの差分を示し得る。

[0064]さらに、区分されていないＣＵに対して符号化演算を実行することの一部として、ビデオ符号化器２０は、ＣＵの残差データを、ＣＵの変換ユニット（ＴＵ）に関連付けられた残差データの１つまたは複数のブロック（たとえば、残差ビデオブロック）に区分するために、ＣＵの残差データに対して再帰的な４分木区分を実行し得る。ＣＵの各ＴＵは、異なる残差ビデオブロックに関連付けられ得る。

[0065]ビデオ符号化器２０は、ＴＵに関連付けられた変換係数ブロック（たとえば、変換係数のブロック）を生成するために、ＴＵに関連付けられた残差ビデオブロックに１つまたは複数の変換を適用し得る。概念的に、変換係数ブロックは変換係数の２次元（２Ｄ）行列であり得る。

[0066]変換係数ブロックを生成した後、ビデオ符号化器２０は、変換係数ブロックに対して量子化プロセスを実行し得る。量子化は、概して、変換係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を実現するプロセスを指す。量子化プロセスは、変換係数の一部または全部に関連するビット深度を低減し得る。たとえば、量子化中に、ｎビット変換係数はｍビット変換係数に切り捨てられ得、ここで、ｎはｍよりも大きい。

[0067]ビデオ符号化器２０は、各ＣＵを、量子化パラメータ（ＱＰ）値に関連付け得る。ＣＵに関連付けられたＱＰ値は、ビデオ符号化器２０が、ＣＵに関連付けられた変換係数ブロックをどのように量子化するかを決定し得る。ビデオ符号化器２０は、ＣＵに関連付けられたＱＰ値を調整することによって、ＣＵに関連付けられた変換係数ブロックに適用される量子化の程度を調整し得る。

[0068]ビデオ符号化器２０が変換係数ブロックを量子化した後、ビデオ符号化器２０は、量子化された変換係数ブロックの中で変換係数を表すシンタックス要素のセットを生成し得る。ビデオ符号化器２０は、これらのシンタックス要素のうちのいくつかに、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ：Context Adaptive Binary Arithmetic Coding）演算などのエントロピー符号化演算を適用し得る。コンテンツ適応型可変長コーディング（ＣＡＶＬＣ：content adaptive variable length coding）、確率間隔区分エントロピー（ＰＩＰＥ：probability interval partitioning entropy）コーディング、または他のバイナリ算術コーディングなど、他のエントロピーコーディング技法も使用され得る。

[0069]ビデオ符号化器２０によって生成されるビットストリームは、一連のネットワークアブストラクションレイヤ（ＮＡＬ：Network Abstraction Layer）ユニットを含み得る。ＮＡＬユニットの各々は、ＮＡＬユニット中のデータのタイプのインジケーションと、データを含むバイトとを含む、シンタックス構造であり得る。たとえば、ＮＡＬユニットは、ビデオパラメータセット、シーケンスパラメータセット、ピクチャパラメータセット、コード化スライス、補足エンハンスメント情報（ＳＥＩ：supplemental enhancement information）、アクセスユニットデリミタ、フィラーデータ、または別のタイプのデータを表すデータを含み得る。ＮＡＬユニット中のデータは、様々なシンタックス構造を含み得る。

[0070]ビデオ復号器３０は、ビデオ符号化器２０によって生成されたビットストリームを受信し得る。ビットストリームは、ビデオ符号化器２０によって符号化されたビデオデータのコーディングされた表現を含み得る。ビデオ復号器３０がビットストリームを受信すると、ビデオ復号器３０は、ビットストリームに対して構文解析動作を実行し得る。ビデオ復号器３０が構文解析動作を実行するとき、ビデオ復号器３０は、ビットストリームからシンタックス要素を抽出し得る。ビデオ復号器３０は、ビットストリームから抽出されたシンタックス要素に基づいて、ビデオデータのピクチャを再構成し得る。シンタックス要素に基づいてビデオデータを再構成するためのプロセスは、一般に、シンタックス要素を生成するためにビデオ符号化器２０によって実行されるプロセスの逆であり得る。

[0071]ビデオ復号器３０がＣＵに関連付けられたシンタックス要素を抽出した後、ビデオ復号器３０は、シンタックス要素に基づいて、ＣＵのＰＵのための予測ビデオブロックを生成し得る。さらに、ビデオ復号器３０は、ＣＵのＴＵに関連付けられた変換係数ブロックを逆量子化し得る。ビデオ復号器３０は、ＣＵのＴＵに関連付けられた残差ビデオブロックを再構成するために、変換係数ブロックに対して逆変換を実行し得る。予測ビデオブロックを生成し、残差ビデオブロックを再構成した後、ビデオ復号器３０は、予測ビデオブロックおよび残差ビデオブロックに基づいて、ＣＵのビデオブロックを再構成し得る。このようにして、ビデオ復号器３０は、ビットストリーム中のシンタックス要素に基づいて、ＣＵのビデオブロックを再構成し得る。

ビデオ符号化器

[0072]図２Ａは、本開示で説明する態様による技法を実装し得るビデオ符号化器の一例を示すブロック図である。ビデオ符号化器２０は、ＨＥＶＣの場合など、ビデオフレームの単一のレイヤを処理するように構成され得る。さらに、ビデオ符号化器２０は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。一例として、予測処理ユニット１００は、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。別の実施形態では、ビデオ符号化器２０は、本開示で説明する技法のいずれかまたはすべてを実行するように構成されたオプションのレイヤ間予測ユニット１２８を含む。他の実施形態では、レイヤ間予測は、予測処理ユニット１００（たとえば、インター予測ユニット１２１および／またはイントラ予測ユニット１２６）によって実行され得、その場合、レイヤ間予測ユニット１２８は省略され得る。しかしながら、本開示の態様はそのように限定されない。いくつかの例では、本開示で説明する技法は、ビデオ符号化器２０の様々な構成要素間で共有され得る。いくつかの例では、追加または代替として、プロセッサ（図示せず）が、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。

[0073]説明の目的で、本開示は、ＨＥＶＣコーディングのコンテキストにおいてビデオ符号化器２０を説明する。しかしながら、本開示の技法は、他のコーディング規格または方法に適用可能であり得る。図２Ａに示す例は、シングルレイヤコーデックのためのものである。しかしながら、図２Ｂに関してさらに説明するように、ビデオ符号化器２０の一部または全部は、マルチレイヤコーデックの処理のために複製され得る。

[0074]ビデオ符号化器２０は、ビデオスライス内のビデオブロックのイントラコーディングとインターコーディングとを実行し得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために、空間予測に依拠する。インターコーディングは、ビデオシーケンスの隣接するフレーム内またはピクチャ内のビデオの時間的冗長性を低減または除去するために時間予測に依拠する。イントラモード（Ｉモード）は、いくつかの空間ベースのコーディングモードのいずれかを参照し得る。単方向予測（Ｐモード）または双方向予測（Ｂモード）などのインターモードは、いくつかの時間ベースのコーディングモードのいずれかを参照し得る。

[0075]図２Ａの例では、ビデオ符号化器２０は複数の機能構成要素を含む。ビデオ符号化器２０の機能構成要素は、予測処理ユニット１００と、残差生成ユニット１０２と、変換処理ユニット１０４と、量子化ユニット１０６と、逆量子化ユニット１０８と、逆変換ユニット１１０と、再構成ユニット１１２と、フィルタユニット１１３と、復号ピクチャバッファ１１４と、エントロピー符号化ユニット１１６とを含む。予測処理ユニット１００は、インター予測ユニット１２１と、動き推定ユニット１２２と、動き補償ユニット１２４と、イントラ予測ユニット１２６と、レイヤ間予測ユニット１２８とを含む。他の例では、ビデオ符号化器２０は、より多いか、より少ないか、または異なる機能構成要素を含み得る。さらに、動き推定ユニット１２２および動き補償ユニット１２４は、高度に統合され得るが、図２Ａの例では、説明の目的で別々に表されている。

[0076]ビデオ符号化器２０は、ビデオデータを受信し得る。ビデオ符号化器２０は、様々なソースからビデオデータを受信し得る。たとえば、ビデオ符号化器２０は、ビデオソース１８（たとえば、図１Ａまたは図１Ｂに示す）または別のソースからビデオデータを受信し得る。ビデオデータは、一連のピクチャを表し得る。ビデオデータを符号化するために、ビデオ符号化器２０は、ピクチャの各々に対して符号化演算を実行し得る。ピクチャに対して符号化演算を実行することの一部として、ビデオ符号化器２０は、ピクチャの各スライスに対して符号化演算を実行し得る。スライスに対して符号化演算を実行することの一部として、ビデオ符号化器２０は、スライス中のツリーブロックに対して符号化演算を実行し得る。

[0077]ツリーブロックに対して符号化演算を実行することの一部として、予測処理ユニット１００は、ビデオブロックを徐々により小さいビデオブロックに分割するために、ツリーブロックのビデオブロックに対して４分木区分を実行し得る。より小さいビデオブロックの各々は、異なるＣＵに関連付けられ得る。たとえば、予測処理ユニット１００は、ツリーブロックのビデオブロックを４つの等しいサイズのサブブロックに区分し得、サブブロックのうちの１つまたは複数を４つの等しいサイズのサブサブブロックに区分し得、以下同様である。

[0078]ＣＵに関連付けられたビデオブロックのサイズは、８×８サンプルから、最大で６４×６４サンプル以上のツリーブロックのサイズにまでわたり得る。本開示では、「Ｎ×Ｎ」および「ＮｂｙＮ」は、垂直方向の寸法および水平方向の寸法に関するビデオブロックのサンプルの寸法、たとえば、１６×１６サンプルまたは１６ｂｙ１６サンプルを指すために、互換的に使用され得る。一般に、１６×１６のビデオブロックは、垂直方向に１６個のサンプルを有し（ｙ＝１６）、水平方向に１６個のサンプルを有する（ｘ＝１６）。同様に、Ｎ×Ｎのブロックは、一般に、垂直方向にＮ個のサンプルを有し、水平方向にＮ個のサンプルを有し、ここで、Ｎは非負整数値を表す。

[0079]さらに、ツリーブロックに対して符号化演算を実行することの一部として、予測処理ユニット１００は、ツリーブロック用の階層的な４分木データ構造を生成し得る。たとえば、ツリーブロックは、４分木データ構造のルートノードに対応し得る。予測処理ユニット１００がツリーブロックのビデオブロックを４つのサブブロックに区分する場合、ルートノードは、４分木データ構造中に４つの子ノードを有する。子ノードの各々は、サブブロックのうちの１つに関連付けられたＣＵに対応する。予測処理ユニット１００がサブブロックのうちの１つを４つのサブサブブロックに区分する場合、サブブロックに関連付けられたＣＵに対応するノードは、サブサブブロックのうちの１つに関連付けられたＣＵに各々が対応する、４つの子ノードを有し得る。

[0080]４分木データ構造の各ノードは、対応するツリーブロックまたはＣＵのシンタックスデータ（たとえば、シンタックス要素）を含み得る。たとえば、４分木の中のノードは、そのノードに対応するＣＵのビデオブロックが４つのサブブロックに区分（たとえば、分割）されているかどうかを示すスプリットフラグを含み得る。ＣＵのためのシンタックス要素は、再帰的に定義され得、ＣＵのビデオブロックがサブブロックに分割されているかどうかに依存し得る。ビデオブロックが区分されていないＣＵは、４分木データ構造におけるリーフノードに対応し得る。コーディングされたツリーブロックは、対応するツリーブロック用の４分木データ構造に基づくデータを含み得る。

[0081]ビデオ符号化器２０は、ツリーブロックの区分されていない各ＣＵに対して符号化演算を実行し得る。ビデオ符号化器２０が、区分されていないＣＵに対して符号化演算を実行するとき、ビデオ符号化器２０は、区分されていないＣＵの符号化された表現を表すデータを生成する。

[0082]ＣＵに対して符号化演算を実行することの一部として、予測処理ユニット１００は、ＣＵの１つまたは複数のＰＵの中で、ＣＵのビデオブロックを区分し得る。ビデオ符号化器２０およびビデオ復号器３０は、様々なＰＵサイズをサポートし得る。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ビデオ符号化器２０およびビデオ復号器３０は、２Ｎ×２ＮまたはＮ×ＮのＰＵサイズ、および２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、Ｎ×Ｎ、２Ｎ×ｎＵ、ｎＬ×２Ｎ、ｎＲ×２Ｎ、または同様の対称ＰＵサイズでのインター予測とをサポートし得る。ビデオ符号化器２０およびビデオ復号器３０は、２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズに対する非対称区分もサポートし得る。いくつかの例では、予測処理ユニット１００は、ＣＵのビデオブロックの辺に直角に接触しない境界に沿ってＣＵのＰＵの間でＣＵのビデオブロックを区分するように、幾何学的な区分を実行し得る。

[0083]インター予測ユニット１２１は、ＣＵの各ＰＵに対してインター予測を実行し得る。インター予測は、時間圧縮を実現し得る。ＰＵに対してインター予測を実行するために、動き推定ユニット１２２は、ＰＵのための動き情報を生成し得る。動き補償ユニット１２４は、ＰＵベースの動き情報およびＣＵに関連付けられたピクチャ以外のピクチャ（たとえば、参照ピクチャ）の復号サンプルのための、予測ビデオブロックを生成し得る。本開示では、動き補償ユニット１２４によって生成される予測ビデオブロックは、インター予測ビデオブロックと呼ばれることがある。

[0084]スライスは、Ｉスライス、Ｐスライス、またはＢスライスであり得る。動き推定ユニット１２２および動き補償ユニット１２４は、ＰＵがＩスライス中にあるのか、Ｐスライス中にあるのか、それともＢスライス中にあるのかに応じて、ＣＵのＰＵのための異なる演算を実行し得る。Ｉスライス中では、すべてのＰＵがイントラ予測される。したがって、ＰＵがＩスライス中にある場合、動き推定ユニット１２２および動き補償ユニット１２４は、ＰＵに対してインター予測を実行しない。

[0085]ＰＵがＰスライス中にある場合、ＰＵを含むピクチャは、「リスト０」と呼ばれる参照ピクチャのリストに関連付けられる。リスト０中の参照ピクチャの各々は、他のピクチャのインター予測のために使用され得るサンプルを含む。動き推定ユニット１２２がＰスライス中のＰＵに関して動き推定演算を実行するとき、動き推定ユニット１２２は、ＰＵのための参照ブロックについて、リスト０中の参照ピクチャを探索し得る。ＰＵの参照ブロックは、ＰＵのビデオブロック中のサンプルに最も密接に対応するサンプルのセット、たとえば、サンプルのブロックであり得る。動き推定ユニット１２２は、参照ピクチャ中のサンプルのセットがどの程度密接にＰＵのビデオブロック中のサンプルに対応するかを決定するために、様々なメトリックを使用し得る。たとえば、動き推定ユニット１２２は、絶対差分の和（ＳＡＤ：sum of absolute difference）、２乗差分の和（ＳＳＤ：sum of square difference）、または他の差分メトリックによって、参照ピクチャ中のサンプルのセットがどの程度密接にＰＵのビデオブロック中のサンプルに対応するかを決定し得る。

[0086]Ｐスライス中のＰＵの参照ブロックを識別した後、動き推定ユニット１２２は、参照ブロックを含んでいる、リスト０中の参照ピクチャを示す参照インデックスと、ＰＵと参照ブロックとの間の空間変位を示す動きベクトルとを生成し得る。様々な例において、動き推定ユニット１２２は、動きベクトルを異なる精度に生成し得る。たとえば、動き推定ユニット１２２は、１／４サンプル精度、１／８サンプル精度、または他の分数のサンプル精度で動きベクトルを生成し得る。分数のサンプル精度の場合、参照ブロック値は、参照ピクチャ中の整数位置のサンプル値から補間され得る。動き推定ユニット１２２は、ＰＵの動き情報として、参照インデックスと動きベクトルとを出力し得る。動き補償ユニット１２４は、ＰＵの動き情報によって識別された参照ブロックに基づいて、ＰＵの予測ビデオブロックを生成し得る。

[0087]ＰＵがＢスライス中にある場合、ＰＵを含むピクチャは、「リスト０」および「リスト１」と呼ばれる参照ピクチャの２つのリストに関連付けられ得る。いくつかの例では、Ｂスライスを含むピクチャは、リスト０とリスト１の組合せである、リストの組合せと関連付けられ得る。

[0088]さらに、ＰＵがＢスライス中にある場合、動き推定ユニット１２２は、ＰＵのための単方向予測または双方向予測を実行し得る。動き推定ユニット１２２がＰＵのための単方向予測を実行するとき、動き推定ユニット１２２は、ＰＵのための参照ブロックについて、リスト０またはリスト１の参照ピクチャを探索し得る。動き推定ユニット１２２は、次いで、参照ブロックを含む、リスト０またはリスト１中の参照ピクチャを示す参照インデックスと、ＰＵと参照ブロックとの間の空間変位を示す動きベクトルとを生成し得る。動き推定ユニット１２２は、ＰＵの動き情報として、参照インデックスと、予測方向インジケータと、動きベクトルとを出力し得る。予測方向インジケータは、参照インデックスが、リスト０中の参照ピクチャを示すのか、それともリスト１中の参照ピクチャを示すのかを示し得る。動き補償ユニット１２４は、ＰＵの動き情報によって示された参照ブロックに基づいて、ＰＵの予測ビデオブロックを生成し得る。

[0089]動き推定ユニット１２２がＰＵのための双方向予測を実行するとき、動き推定ユニット１２２は、ＰＵのための参照ブロックについて、リスト０中の参照ピクチャを探索し得、また、ＰＵのための別の参照ブロックについて、リスト１中の参照ピクチャを探索し得る。動き推定ユニット１２２は、次いで、参照ブロックを含む、リスト０およびリスト１中の参照ピクチャを示す参照インデックスと、参照ブロックとＰＵとの間の空間変位を示す動きベクトルとを生成し得る。動き推定ユニット１２２は、ＰＵの動き情報として、ＰＵの参照インデックスと動きベクトルとを出力し得る。動き補償ユニット１２４は、ＰＵの動き情報によって示された参照ブロックに基づいて、ＰＵの予測ビデオブロックを生成し得る。

[0090]いくつかの事例では、動き推定ユニット１２２は、ＰＵのための動き情報のフルセットをエントロピー符号化ユニット１１６に出力しない。そうではなく、動き推定ユニット１２２は、別のＰＵの動き情報を参照して、ＰＵの動き情報をシグナリングし得る。たとえば、動き推定ユニット１２２は、ＰＵの動き情報が、隣接ＰＵの動き情報と十分に類似していると決定し得る。この例では、動き推定ユニット１２２は、ＰＵに関連付けられたシンタックス構造において、ＰＵが隣接ＰＵと同じ動き情報を有することをビデオ復号器３０に示す値を示し得る。別の例では、動き推定ユニット１２２は、ＰＵに関連付けられたシンタックス構造において、隣接ＰＵと動きベクトル差分（ＭＶＤ）とを識別し得る。動きベクトル差分は、ＰＵの動きベクトルと、示される隣接ＰＵの動きベクトルとの差分を示す。ビデオ復号器３０は、ＰＵの動きベクトルを決定するために、示された隣接ＰＵの動きベクトルと、動きベクトル差分とを使用し得る。第２のＰＵの動き情報をシグナリングするときに第１のＰＵの動き情報を参照することによって、ビデオ符号化器２０は、より少数のビットを使用して、第２のＰＵの動き情報をシグナリングすることが可能であり得る。

[0091]図５および図６に関して以下でさらに説明するように、予測処理ユニット１００は、図５および図６に示される方法を実行することによってＰＵ（または他の参照レイヤブロックおよび／またはエンハンスメントレイヤブロックまたはビデオユニット）をコーディング（たとえば、符号化または復号）するように構成され得る。たとえば、（たとえば、動き推定ユニット１２２および／または動き補償ユニット１２４を介した）インター予測ユニット１２１、イントラ予測ユニット１２６、またはレイヤ間予測ユニット１２８は、一緒にまたは別々に、図５および図６に示される方法を実行するように構成され得る。

[0092]ＣＵに対して符号化演算を実行することの一部として、イントラ予測ユニット１２６は、ＣＵのＰＵに対してイントラ予測を実行し得る。イントラ予測は、空間圧縮を実現し得る。イントラ予測ユニット１２６がＰＵに対してイントラ予測を実行するとき、イントラ予測ユニット１２６は、同じピクチャ中の他のＰＵの復号サンプルに基づいて、ＰＵのための予測データを生成し得る。ＰＵのための予測データは、予測ビデオブロックと様々なシンタックス要素とを含み得る。イントラ予測ユニット１２６は、Ｉスライス、Ｐスライス、およびＢスライス中のＰＵに対してイントラ予測を実行し得る。

[0093]ＰＵに対してイントラ予測を実行するために、イントラ予測ユニット１２６は、ＰＵのための予測データの複数のセットを生成するために、複数のイントラ予測モードを使用し得る。イントラ予測ユニット１２６がＰＵのための予測データのセットを生成するためにイントラ予測モードを使用するとき、イントラ予測ユニット１２６は、イントラ予測モードと関連する方向および／または勾配で、隣接ＰＵのビデオブロックからＰＵのビデオブロックにわたってサンプルを延ばし得る。ＰＵ、ＣＵ、およびツリーブロックについて左から右、上から下の符号化順序を仮定すると、隣接ＰＵは、ＰＵの上、右上、左上、または左にあり得る。イントラ予測ユニット１２６は、ＰＵのサイズに応じて、様々な数のイントラ予測モード、たとえば、３３個の方向性イントラ予測モードを使用し得る。

[0094]予測処理ユニット１００は、動き補償ユニット１２４によってＰＵのために生成された予測データ、またはイントラ予測ユニット１２６によってＰＵのために生成された予測データの中から、ＰＵのための予測データを選択し得る。いくつかの例では、予測処理ユニット１００は、予測データのセットのレート／ひずみメトリックに基づいて、ＰＵのための予測データを選択する。

[0095]予測処理ユニット１００がイントラ予測ユニット１２６によって生成された予測データを選択する場合、予測処理ユニット１００は、ＰＵのための予測データを生成するために使用されたイントラ予測モード、たとえば、選択されたイントラ予測モードをシグナリングし得る。予測処理ユニット１００は、選択されたイントラ予測モードを様々な方法でシグナリングし得る。たとえば、選択されたイントラ予測モードは、隣接ＰＵのイントラ予測モードと同じであることが起こり得る。言い換えれば、隣接ＰＵのイントラ予測モードは、現在ＰＵに対して最確モードであり得る。したがって、予測処理ユニット１００は、選択されたイントラ予測モードが隣接ＰＵのイントラ予測モードと同じであることを示すためのシンタックス要素を生成し得る。

[0096]上記で説明したように、ビデオ符号化器２０は、レイヤ間予測ユニット１２８を含み得る。レイヤ間予測ユニット１２８は、ＳＶＣにおいて利用可能である１つまたは複数の異なるレイヤ（たとえば、ベースレイヤまたは参照レイヤ）を使用して、現在ブロック（たとえば、ＥＬ中の現在ブロック）を予測するように構成される。そのような予測は、レイヤ間予測と呼ばれることがある。レイヤ間予測ユニット１２８は、レイヤ間冗長性を低減するための予測方法を利用し、それによって、コーディング効率を改善し、計算リソース要件を低減する。レイヤ間予測のいくつかの例は、レイヤ間イントラ予測と、レイヤ間動き予測と、レイヤ間残差予測とを含む。レイヤ間イントラ予測は、エンハンスメントレイヤ中の現在ブロックを予測するために、ベースレイヤの中でコロケートされているブロックの再構成を使用する。レイヤ間動き予測は、エンハンスメントレイヤ中の動作を予測するために、ベースレイヤの動き情報を使用する。レイヤ間残差予測は、エンハンスメントレイヤの残差を予測するために、ベースレイヤの残差を使用する。レイヤ間予測スキームの各々について、以下でより詳細に説明する。

[0097]予測処理ユニット１００がＣＵのＰＵのための予測データを選択した後、残差生成ユニット１０２は、ＣＵのビデオブロックからＣＵのＰＵの予測ビデオブロックを差し引くこと（たとえば、マイナス符号によって示される）によって、ＣＵの残差データを生成し得る。ＣＵの残差データは、ＣＵのビデオブロック中のサンプルの異なるサンプル成分に対応する２Ｄ残差ビデオブロックを含み得る。たとえば、残差データは、ＣＵのＰＵの予測ビデオブロック中のサンプルのルミナンス成分と、ＣＵの元のビデオブロック中のサンプルのルミナンス成分との間の差分に対応する、残差ビデオブロックを含み得る。さらに、ＣＵの残差データは、ＣＵのＰＵの予測ビデオブロック中のサンプルのクロミナンス成分と、ＣＵの元のビデオブロック中のサンプルのクロミナンス成分との間の差分に対応する、残差ビデオブロックを含み得る。

[0098]予測処理ユニット１００は、ＣＵの残差ビデオブロックをサブブロックに区分するために、４分木区分を実行し得る。分割されていない各残差ビデオブロックは、ＣＵの異なるＴＵに関連付けられ得る。ＣＵのＴＵに関連付けられる残差ビデオブロックのサイズおよび位置は、ＣＵのＰＵに関連付けられたビデオブロックのサイズおよび位置に基づいてもよく、または基づかなくてもよい。「残差４分木」（ＲＱＴ）と呼ばれる４分木構造は、残差ビデオブロックの各々に関連付けられたノードを含み得る。ＣＵのＴＵは、ＲＱＴのリーフノードに対応し得る。

[0099]変換処理ユニット１０４は、ＴＵに関連付けられた残差ビデオブロックに１つまたは複数の変換を適用することによって、ＣＵの各ＴＵのための１つまたは複数の変換係数ブロックを生成し得る。変換係数ブロックの各々は、変換係数の２Ｄ行列であり得る。変換処理ユニット１０４は、ＴＵに関連付けられた残差ビデオブロックに様々な変換を適用し得る。たとえば、変換処理ユニット１０４は、離散コサイン変換（ＤＣＴ）、方向変換、または概念的に類似の変換を、ＴＵに関連付けられた残差ビデオブロックに適用し得る。

[00100]変換処理ユニット１０４が、ＴＵに関連付けられた変換係数ブロックを生成した後、量子化ユニット１０６は、変換係数ブロック中の変換係数を量子化し得る。量子化ユニット１０６は、ＣＵに関連付けられたＱＰ値に基づいて、ＣＵのＴＵに関連付けられた変換係数ブロックを量子化し得る。

[00101]ビデオ符号化器２０は、様々な方法でＱＰ値をＣＵに関連付け得る。たとえば、ビデオ符号化器２０は、ＣＵに関連付けられたツリーブロックに対して、レートひずみ分析を実行し得る。レートひずみ分析では、ビデオ符号化器２０は、ツリーブロックに対して符号化演算を複数回実行することによって、ツリーブロックの複数のコーディングされた表現を生成し得る。ビデオ符号化器２０が、ツリーブロックの異なる符号化表現を生成するとき、ビデオ符号化器２０は、異なるＱＰ値をＣＵに関連付け得る。最小のビットレートおよびひずみメトリックを有するツリーブロックのコーディングされた表現で所与のＱＰ値がＣＵに関連付けられるとき、ビデオ符号化器２０は、所与のＱＰ値がＣＵに関連付けられることをシグナリングし得る。

[00102]逆量子化ユニット１０８および逆変換ユニット１１０は、変換係数ブロックから残差ビデオブロックを再構成するために、それぞれ、逆量子化と逆変換とを変換係数ブロックに適用し得る。再構成ユニット１１２は、ＴＵに関連付けられた再構成されたビデオブロックを生成するために、再構成された残差ビデオブロックを、予測処理ユニット１００によって生成された１つまたは複数の予測ビデオブロックからの対応するサンプルに追加し得る。このようにＣＵの各ＴＵについてビデオブロックを再構成することによって、ビデオ符号化器２０は、ＣＵのビデオブロックを再構成し得る。

[00103]再構成ユニット１１２がＣＵのビデオブロックを再構成した後、フィルタユニット１１３は、ＣＵに関連付けられたビデオブロックにおけるブロッキングアーティファクトを低減するために、デブロッキング演算を実行し得る。１つまたは複数のデブロッキング演算を実行した後、フィルタユニット１１３は、ＣＵの再構成されたビデオブロックを復号ピクチャバッファ１１４に記憶し得る。動き推定ユニット１２２および動き補償ユニット１２４は、後続のピクチャのＰＵに対してインター予測を実行するために、再構成されたビデオブロックを含む参照ピクチャを使用し得る。さらに、イントラ予測ユニット１２６は、ＣＵと同じピクチャ中の他のＰＵに対してイントラ予測を実行するために、復号ピクチャバッファ１１４の中の再構成されたビデオブロックを使用し得る。

[00104]エントロピー符号化ユニット１１６は、ビデオ符号化器２０の他の機能構成要素からデータを受信し得る。たとえば、エントロピー符号化ユニット１１６は、量子化ユニット１０６から変換係数ブロックを受信し得、予測処理ユニット１００からシンタックス要素を受信し得る。エントロピー符号化ユニット１１６がデータを受信すると、エントロピー符号化ユニット１１６は、エントロピー符号化データを生成するために、１つまたは複数のエントロピー符号化演算を実行し得る。たとえば、ビデオ符号化器２０は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）演算、ＣＡＢＡＣ演算、変数間（Ｖ２Ｖ：variable-to-variable）レングスコーディング演算、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ：syntax-based context-adaptive binary arithmetic coding）演算、確率間隔区分エントロピー（ＰＩＰＥ）コーディング演算、または別のタイプのエントロピー符号化演算をデータに対して実行し得る。エントロピー符号化ユニット１１６は、エントロピー符号化データを含むビットストリームを出力し得る。

[00105]データに対してエントロピー符号化演算を実行することの一部として、エントロピー符号化ユニット１１６は、コンテキストモデルを選択し得る。エントロピー符号化ユニット１１６がＣＡＢＡＣ演算を実行している場合、コンテキストモデルは、特定の値を有する特定のビンの確率の推定値を示し得る。ＣＡＢＡＣのコンテキストでは、「ビン」という用語は、シンタックス要素の２値化されたバージョンのビットを指すために使用される。

マルチレイヤビデオ符号化器

[00106]図２Ｂは、本開示で説明する態様による技法を実装し得るマルチレイヤビデオ符号化器２３の一例を示すブロック図である。ビデオ符号化器２３は、ＳＨＶＣおよびマルチビューコーディングの場合など、マルチレイヤビデオフレームを処理するように構成され得る。さらに、ビデオ符号化器２３は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。

[00107]ビデオ符号化器２３はビデオ符号化器２０Ａとビデオ符号化器２０Ｂとを含み、それらの各々はビデオ符号化器２０として構成され得、ビデオ符号化器２０に関して上記で説明した機能を実行し得る。さらに、参照番号の再利用によって示されるように、ビデオ符号化器２０Ａおよび２０Ｂは、ビデオ符号化器２０としてのシステムおよびサブシステムのうちの少なくともいくつかを含み得る。ビデオ符号化器２３は、２つのビデオ符号化器２０Ａおよび２０Ｂを含むように示されるが、ビデオ符号化器２３は、そのように限定されず、任意の数のビデオ符号化器２０のレイヤを含み得る。いくつかの実施形態では、ビデオ符号化器２３は、アクセスユニット中の各ピクチャまたは各フレームに対してビデオ符号化器２０を含み得る。たとえば、５つのピクチャを含むアクセスユニットは、５つの符号化器レイヤを含むビデオ符号化器によって処理または符号化され得る。いくつかの実施形態では、ビデオ符号化器２３は、アクセスユニット中のフレームよりも多くの符号化器レイヤを含み得る。いくつかのそのような場合では、ビデオ符号化器のレイヤのうちのいくつかは、いくつかのアクセスユニットを処理するときに非アクティブであり得る。

[00108]ビデオ符号化器２０Ａおよび２０Ｂに加えて、ビデオ符号化器２３は、リサンプリングユニット９０を含み得る。リサンプリングユニット９０は、場合によっては、たとえば、エンハンスメントレイヤを作成するために、受信されたビデオフレームのベースレイヤをアップサンプリングし得る。リサンプリングユニット９０は、フレームの受信されたベースレイヤに関連付けられた特定の情報をアップサンプリングし得るが、他の情報をアップサンプリングしないことがある。たとえば、リサンプリングユニット９０は、ベースレイヤの空間サイズまたはピクセルの数をアップサンプリングし得るが、スライスの数またはピクチャ順序カウントは一定のままであり得る。場合によっては、リサンプリングユニット９０は、受信されたビデオを処理しないことがあり、および／またはオプションであり得る。たとえば、場合によっては、予測処理ユニット１００は、アップサンプリングを実行し得る。いくつかの実施形態では、リサンプリングユニット９０は、レイヤをアップサンプリングし、スライス境界ルールおよび／またはラスタスキャンルールのセットに準拠するように、１つまたは複数のスライスを再編成、再定義、修正、または調整するように構成される。アクセスユニット中のベースレイヤまたは下位レイヤをアップサンプリングするものとして主に説明したが、場合によっては、リサンプリングユニット９０は、レイヤをダウンサンプリングし得る。たとえば、ビデオのストリーミング中に帯域幅が低減した場合、フレームは、アップサンプリングされるのではなく、ダウンサンプリングされ得る。

[00109]リサンプリングユニット９０は、下位レイヤ符号化器（たとえば、ビデオ符号化器２０Ａ）の復号ピクチャバッファ１１４からピクチャまたはフレーム（またはピクチャに関連付けられたピクチャ情報）を受信し、ピクチャ（または受信されたピクチャ情報）をアップサンプリングするように構成され得る。このアップサンプリングされたピクチャは、次いで、下位レイヤ符号化器と同じアクセスユニット中のピクチャを符号化するように構成された、上位レイヤ符号化器（たとえば、ビデオ符号化器２０Ｂ）の予測処理ユニット１００に供給され得る。場合によっては、上位レイヤ符号化器は、下位レイヤ符号化器から除去された１つのレイヤである。他の場合には、図２Ｂのレイヤ０ビデオ符号化器とレイヤ１符号化器との間に、１つまたは複数の上位レイヤ符号化器があり得る。

[00110]場合によっては、リサンプリングユニット９０は、省略またはバイパスされ得る。そのような場合、ビデオ符号化器２０Ａの復号ピクチャバッファ１１４からのピクチャは、直接、または少なくともリサンプリングユニット９０に供給されずに、ビデオ符号化器２０Ｂの予測処理ユニット１００に供給され得る。たとえば、ビデオ符号化器２０Ｂに供給されたビデオデータ、およびビデオ符号化器２０Ａの復号ピクチャバッファ１１４からの参照ピクチャが、同じサイズまたは解像度である場合、参照ピクチャは、いかなるリサンプリングも伴わずにビデオ符号化器２０Ｂに供給され得る。

[00111]いくつかの実施形態では、ビデオ符号化器２３は、ビデオ符号化器２０Ａにビデオデータを供給する前に、ダウンサンプリングユニット９４を使用して下位レイヤ符号化器に供給されるべきビデオデータをダウンサンプリングする。代替的に、ダウンサンプリングユニット９４は、ビデオデータをアップサンプリングまたはダウンサンプリングすることが可能なリサンプリングユニット９０であり得る。また他の実施形態では、ダウンサンプリングユニット９４は省略され得る。

[00112]図２Ｂに示すように、ビデオ符号化器２３は、マルチプレクサ９８、すなわちｍｕｘをさらに含み得る。ｍｕｘ９８は、ビデオ符号化器２３から合成ビットストリームを出力することができる。合成ビットストリームは、ビデオ符号化器２０Ａおよび２０Ｂの各々からビットストリームを取ることと、所与の時間において出力されるビットストリームを交替することとによって、作成され得る。場合によっては、２つの（または、３つ以上のビデオ符号化器レイヤの場合には、より多くの）ビットストリームからのビットが一度に１ビットずつ交替され得るが、多くの場合、ビットストリームは別様に合成される。たとえば、出力ビットストリームは、選択されたビットストリームを一度に１ブロックずつ交替することによって作成され得る。別の例では、出力ビットストリームは、ビデオ符号化器２０Ａおよび２０Ｂの各々から非１：１比のブロックを出力することによって作成され得る。たとえば、２つのブロックは、ビデオ符号化器２０Ａから出力された各ブロックについてビデオ符号化器２０Ｂから出力され得る。いくつかの実施形態では、ｍｕｘ９８からの出力ストリームはプリプログラムされ得る。他の実施形態では、ｍｕｘ９８は、ソースモジュール１２を含むソースデバイス上のプロセッサからなど、ビデオ符号化器２３の外部のシステムから受信された制御信号に基づいて、ビデオ符号化器２０Ａ、２０Ｂからのビットストリームを合成し得る。制御信号は、ビデオソース１８からのビデオの解像度またはビットレートに基づいて、リンク１６の帯域幅に基づいて、ユーザに関連するサブスクリプション（たとえば、有料サブスクリプション対無料サブスクリプション）に基づいて、またはビデオ符号化器２３から望まれる解像度出力を決定するための他のファクタに基づいて生成され得る。

ビデオ復号器

[00113]図３Ａは、本開示で説明する態様による技法を実装し得るビデオ復号器の一例を示すブロック図である。ビデオ復号器３０は、ＨＥＶＣの場合など、ビデオフレームの単一のレイヤを処理するように構成され得る。さらに、ビデオ復号器３０は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。一例として、動き補償ユニット１６２および／またはイントラ予測ユニット１６４は、本開示で説明する技法のうちのいずれかまたはすべてを実行するように構成され得る。一実施形態では、ビデオ復号器３０は、本開示で説明する技法のいずれかまたはすべてを実行するように構成されたレイヤ間予測ユニット１６６をオプションとして含み得る。他の実施形態では、レイヤ間予測は、予測処理ユニット１５２（たとえば、動き補償ユニット１６２および／またはイントラ予測ユニット１６４）によって実行され得、その場合、レイヤ間予測ユニット１６６は省略され得る。しかしながら、本開示の態様はそのように限定されない。いくつかの例では、本開示で説明する技法は、ビデオ復号器３０の様々な構成要素の間で共有され得る。いくつかの例では、追加または代替として、プロセッサ（図示せず）が、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。

[00114]説明の目的で、本開示は、ＨＥＶＣコーディングのコンテキストにおいてビデオ復号器３０を説明する。しかしながら、本開示の技法は他のコーディング規格または方法に適用可能であり得る。図３Ａに示す例は、シングルレイヤコーデックのためのものである。しかしながら、図３Ｂに関してさらに説明するように、ビデオ復号器３０の一部または全部は、マルチレイヤコーデックの処理のために複製され得る。

[00115]図３Ａの例では、ビデオ復号器３０は複数の機能構成要素を含む。ビデオ復号器３０の機能構成要素は、エントロピー復号ユニット１５０と、予測処理ユニット１５２と、逆量子化ユニット１５４と、逆変換ユニット１５６と、再構成ユニット１５８と、フィルタユニット１５９と、復号ピクチャバッファ１６０とを含む。予測処理ユニット１５２は、動き補償ユニット１６２と、イントラ予測ユニット１６４と、レイヤ間予測ユニット１６６とを含む。いくつかの例では、ビデオ復号器３０は、図２Ａのビデオ符号化器２０に関して説明された符号化経路とは全般に逆の復号経路を実行し得る。他の例では、ビデオ復号器３０は、より多いか、より少ないか、または異なる機能構成要素を含み得る。

[00116]ビデオ復号器３０は、符号化ビデオデータを備えるビットストリームを受信し得る。ビットストリームは、複数のシンタックス要素を含み得る。ビデオ復号器３０がビットストリームを受信すると、エントロピー復号ユニット１５０は、ビットストリームに対して構文解析動作を実行し得る。ビットストリームに対して構文解析動作を実行した結果として、エントロピー復号ユニット１５０は、ビットストリームからシンタックス要素を抽出し得る。構文解析動作を実行することの一部として、エントロピー復号ユニット１５０は、ビットストリーム中のエントロピー符号化シンタックス要素をエントロピー復号し得る。予測処理ユニット１５２、逆量子化ユニット１５４、逆変換ユニット１５６、再構成ユニット１５８、およびフィルタユニット１５９は、ビットストリームから抽出されたシンタックス要素に基づいて、復号ビデオデータを生成する再構成演算を実行し得る。

[00117]上記で説明したように、ビットストリームは、一連のＮＡＬユニットを備え得る。ビットストリームのＮＡＬユニットは、ビデオパラメータセットＮＡＬユニット、シーケンスパラメータセットＮＡＬユニット、ピクチャパラメータセットＮＡＬユニット、ＳＥＩＮＡＬユニットなどを含み得る。ビットストリームに対して構文解析動作（parsing operation）を実行することの一部として、エントロピー復号ユニット１５０は、シーケンスパラメータセットＮＡＬユニットからのシーケンスパラメータセット、ピクチャパラメータセットＮＡＬユニットからのピクチャパラメータセット、ＳＥＩＮＡＬユニットからのＳＥＩデータなどを抽出しエントロピー復号する、構文解析動作を実行し得る。

[00118]さらに、ビットストリームのＮＡＬユニットは、コード化スライスＮＡＬユニットを含み得る。ビットストリームに対して構文解析動作を実行することの一部として、エントロピー復号ユニット１５０は、コード化スライスＮＡＬユニットからコード化スライスを抽出しエントロピー復号する、構文解析動作を実行し得る。コード化スライスの各々は、スライスヘッダとスライスデータとを含み得る。スライスヘッダは、スライスに関するシンタックス要素を含み得る。スライスヘッダ中のシンタックス要素は、スライスを含むピクチャに関連付けられたピクチャパラメータセットを識別するシンタックス要素を含み得る。エントロピー復号ユニット１５０は、スライスヘッダを復元するために、コード化スライスヘッダ中のシンタックス要素に対してＣＡＢＡＣ復号演算などのエントロピー復号演算を実行し得る。

[00119]コード化スライスＮＡＬユニットからスライスデータを抽出することの一部として、エントロピー復号ユニット１５０は、スライスデータ中のコーディングされたＣＵからシンタックス要素を抽出する構文解析動作を実行し得る。抽出されたシンタックス要素は、変換係数ブロックに関連付けられたシンタックス要素を含み得る。エントロピー復号ユニット１５０は、次いで、シンタックス要素のうちのいくつかに対してＣＡＢＡＣ復号演算を実行し得る。

[00120]エントロピー復号ユニット１５０が、区分されていないＣＵに対して構文解析動作を実行した後、ビデオ復号器３０は、区分されていないＣＵに対して再構成演算を実行し得る。区分されていないＣＵに対して再構成演算を実行するために、ビデオ復号器３０は、ＣＵの各ＴＵに対して再構成演算を実行し得る。ＣＵの各ＴＵについて再構成演算を実行することによって、ビデオ復号器３０は、ＣＵに関連付けられた残差ビデオブロックを再構成し得る。

[00121]ＴＵに対して再構成演算を実行することの一部として、逆量子化ユニット１５４は、ＴＵに関連付けられた変換係数ブロックを逆量子化（inverse quantize）、たとえば、逆量子化（de-quantize）し得る。逆量子化ユニット１５４は、ＨＥＶＣのために提案された、またはＨ．２６４復号規格によって定義された逆量子化処理と同様の方法で、変換係数ブロックを逆量子化し得る。逆量子化ユニット１５４は、量子化の程度を決定し、同様に、逆量子化ユニット１５４が適用すべき逆量子化の程度を決定するために、変換係数ブロックのＣＵに関してビデオ符号化器２０によって計算される量子化パラメータＱＰを使用し得る。

[00122]逆量子化ユニット１５４が変換係数ブロックを逆量子化した後、逆変換ユニット１５６は、変換係数ブロックに関連付けられたＴＵのための残差ビデオブロックを生成し得る。逆変換ユニット１５６は、ＴＵのための残差ビデオブロックを生成するために、変換係数ブロックに逆変換を適用し得る。たとえば、逆変換ユニット１５６は、変換係数ブロックに、逆ＤＣＴ、逆整数変換、逆カルーネンレーベ変換（ＫＬＴ：Karhunen-Loeve transform）、逆回転変換、逆方向変換、または別の逆変換を適用し得る。いくつかの例では、逆変換ユニット１５６は、ビデオ符号化器２０からのシグナリングに基づいて、変換係数ブロックに適用すべき逆変換を決定し得る。そのような例では、逆変換ユニット１５６は、変換係数ブロックに関連付けられたツリーブロックの４分木のルートノードにおいてシグナリングされた変換に基づいて、逆変換を決定し得る。他の例では、逆変換ユニット１５６は、ブロックサイズ、コーディングモードなど、１つまたは複数のコーディング特性から逆変換を推定し得る。いくつかの例では、逆変換ユニット１５６はカスケード逆変換を適用し得る。

[00123]いくつかの例では、動き補償ユニット１６２は、補間フィルタに基づく補間を実行することによって、ＰＵの予測ビデオブロックを改良し得る。サブサンプル精度を有する動き補償のために使用されるべき補間フィルタ用の識別子は、シンタックス要素に含まれ得る。動き補償ユニット１６２は、参照ブロックのサブ整数サンプルについての補間値を計算するために、ＰＵの予測ビデオブロックの生成中にビデオ符号化器２０によって使用された同じ補間フィルタを使用し得る。動き補償ユニット１６２は、受信されたシンタックス情報に従って、ビデオ符号化器２０によって使用された補間フィルタを決定し得、予測ビデオブロックを生成するためにその補間フィルタを使用し得る。

[00124]図５および図６に関して以下でさらに説明するように、予測処理ユニット１５２は、図５および図６に示される方法を実行することによってＰＵ（または他の参照レイヤブロックおよび／またはエンハンスメントレイヤブロックまたはビデオユニット）をコーディング（たとえば、符号化または復号）し得る。たとえば、動き補償ユニット１６２、イントラ予測ユニット１６４、またはレイヤ間予測ユニット１６６は、一緒にまたは別々に、図５および図６に示される方法を実行するように構成され得る。

[00125]ＰＵが、イントラ予測を使用して符号化される場合、イントラ予測ユニット１６４は、ＰＵのための予測ビデオブロックを生成するためにイントラ予測を実行し得る。たとえば、イントラ予測ユニット１６４は、ビットストリーム中のシンタックス要素に基づいて、ＰＵのためのイントラ予測モードを決定し得る。ビットストリームは、ＰＵのイントラ予測モードを決定するためにイントラ予測ユニット１６４が使用し得るシンタックス要素を含み得る。

[00126]いくつかの事例では、イントラ予測ユニット１６４が現在ＰＵのイントラ予測モードを決定するために別のＰＵのイントラ予測モードを使用するべきであることを、シンタックス要素が示し得る。たとえば、現在ＰＵのイントラ予測モードが隣接ＰＵのイントラ予測モードと同じであることが起こり得る。言い換えれば、隣接ＰＵのイントラ予測モードは、現在ＰＵに対して最確モードであり得る。したがって、この例では、ビットストリームは、ＰＵのイントラ予測モードが隣接ＰＵのイントラ予測モードと同じであることを示す、小さいシンタックス要素を含み得る。イントラ予測ユニット１６４は、次いで、空間的に隣接するＰＵのビデオブロックに基づいてＰＵのための予測データ（たとえば、予測サンプル）を生成するために、イントラ予測モードを使用し得る。

[00127]上記で説明したように、ビデオ復号器３０もレイヤ間予測ユニット１６６を含み得る。レイヤ間予測ユニット１６６は、ＳＶＣにおいて利用可能である１つまたは複数の異なるレイヤ（たとえば、ベースレイヤまたは参照レイヤ）を使用して、現在ブロック（たとえば、ＥＬ中の現在ブロック）を予測するように構成される。そのような予測は、レイヤ間予測と呼ばれることがある。レイヤ間予測ユニット１６６は、レイヤ間冗長性を低減するための予測方法を利用し、それによって、コーディング効率を改善し、計算リソース要件を低減する。レイヤ間予測のいくつかの例は、レイヤ間イントラ予測と、レイヤ間動き予測と、レイヤ間残差予測とを含む。レイヤ間イントラ予測は、エンハンスメントレイヤ中の現在ブロックを予測するために、ベースレイヤの中でコロケートされているブロックの再構成を使用する。レイヤ間動き予測は、エンハンスメントレイヤ中の動作を予測するために、ベースレイヤの動き情報を使用する。レイヤ間残差予測は、エンハンスメントレイヤの残差を予測するために、ベースレイヤの残差を使用する。レイヤ間予測スキームの各々について、以下でより詳細に説明する。

[00128]再構成ユニット１５８は、ＣＵのビデオブロックを再構成するために、ＣＵのＴＵに関連付けられた残差ビデオブロックおよびＣＵのＰＵの予測ビデオブロック、たとえば、適用可能なとき、イントラ予測データまたはインター予測データのいずれかを使用し得る。したがって、ビデオ復号器３０は、ビットストリーム中のシンタックス要素に基づいて予測ビデオブロックと残差ビデオブロックとを生成し得、予測ビデオブロックと残差ビデオブロックとに基づいてビデオブロックを生成し得る。

[00129]再構成ユニット１５８がＣＵのビデオブロックを再構成した後、フィルタユニット１５９は、ＣＵに関連したブロッキングアーティファクトを低減するためにデブロッキング演算を実行し得る。フィルタユニット１５９が、ＣＵに関連したブロッキングアーティファクトを低減するためにデブロッキング演算を実行した後、ビデオ復号器３０は、ＣＵのビデオブロックを復号ピクチャバッファ１６０に記憶し得る。復号ピクチャバッファ１６０は、次の動き補償、イントラ予測、および図１Ａまたは図１Ｂのディスプレイデバイス３２などのディスプレイデバイス上での提示のために、参照ピクチャを提供し得る。たとえば、ビデオ復号器３０は、復号ピクチャバッファ１６０の中のビデオブロックに基づいて、他のＣＵのＰＵに対して、イントラ予測演算またはインター予測演算を実行し得る。

マルチレイヤ復号器

[00130]図３Ｂは、本開示で説明する態様による技法を実装し得るマルチレイヤビデオ復号器３３の一例を示すブロック図である。ビデオ復号器３３は、ＳＨＶＣおよびマルチビューコーディングの場合など、マルチレイヤビデオフレームを処理するように構成され得る。さらに、ビデオ復号器３３は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。

[00131]ビデオ復号器３３は、ビデオ復号器３０Ａとビデオ復号器３０Ｂとを含み、それらの各々はビデオ復号器３０として構成され得、ビデオ復号器３０に関して上記で説明した機能を実行し得る。さらに、参照番号の再利用によって示されるように、ビデオ復号器３０Ａおよび３０Ｂは、ビデオ復号器３０としてのシステムおよびサブシステムのうちの少なくともいくつかを含み得る。ビデオ復号器３３は、２つのビデオ復号器３０Ａおよび３０Ｂを含むように示されるが、ビデオ復号器３３は、そのように限定されず、任意の数のビデオ復号器３０のレイヤを含み得る。いくつかの実施形態では、ビデオ復号器３３はアクセスユニット中の各ピクチャまたは各フレームに対してビデオ復号器３０を含み得る。たとえば、５つのピクチャを含むアクセスユニットは、５つの復号器レイヤを含むビデオ復号器によって処理または復号され得る。いくつかの実施形態では、ビデオ復号器３３は、アクセスユニット中のフレームよりも多くの復号器レイヤを含み得る。いくつかのそのような場合では、ビデオ復号器のレイヤのうちのいくつかは、いくつかのアクセスユニットを処理するときに非アクティブであり得る。

[00132]ビデオ復号器３０Ａおよび３０Ｂに加えて、ビデオ復号器３３は、アップサンプリングユニット９２を含み得る。いくつかの実施形態では、アップサンプリングユニット９２は、フレームまたはアクセスユニットのための参照ピクチャリストに追加されるべきエンハンストレイヤを作成するために、受信されたビデオフレームのベースレイヤをアップサンプリングし得る。このエンハンストレイヤは、復号ピクチャバッファ１６０に記憶され得る。いくつかの実施形態では、アップサンプリングユニット９２は、図２Ａのリサンプリングユニット９０に関して説明した実施形態の一部または全部を含むことができる。いくつかの実施形態では、アップサンプリングユニット９２は、レイヤをアップサンプリングし、スライス境界ルールおよび／またはラスタスキャンルールのセットに準拠するように、１つまたは複数のスライスを再編成、再定義、修正、または調整するように構成される。場合によっては、アップサンプリングユニット９２は、受信されたビデオフレームのレイヤをアップサンプリングおよび／またはダウンサンプリングするように構成されたリサンプリングユニットであり得る。

[00133]アップサンプリングユニット９２は、下位レイヤ復号器（たとえば、ビデオ復号器３０Ａ）の復号ピクチャバッファ１６０からピクチャまたはフレーム（またはピクチャに関連付けられたピクチャ情報）を受信し、ピクチャ（または受信されたピクチャ情報）をアップサンプリングするように構成され得る。このアップサンプリングされたピクチャは、次いで、下位レイヤ復号器と同じアクセスユニット中のピクチャを復号するように構成された、上位レイヤ復号器（たとえば、ビデオ復号器３０Ｂ）の予測処理ユニット１５２に供給され得る。場合によっては、上位レイヤ復号器は、下位レイヤ復号器から除去された１つのレイヤである。他の場合には、図３Ｂのレイヤ０復号器とレイヤ１復号器との間に、１つまたは複数の上位レイヤ復号器があり得る。

[00134]場合によっては、アップサンプリングユニット９２は、省略またはバイパスされ得る。そのような場合、ビデオ復号器３０Ａの復号ピクチャバッファ１６０からのピクチャは、直接、または少なくともアップサンプリングユニット９２に供給されずに、ビデオ復号器３０Ｂの予測処理ユニット１５２に供給され得る。たとえば、ビデオ復号器３０Ｂに供給されたビデオデータ、およびビデオ復号器３０Ａの復号ピクチャバッファ１６０からの参照ピクチャが、同じサイズまたは解像度である場合、参照ピクチャは、アップサンプリングを伴わずにビデオ復号器３０Ｂに供給され得る。さらに、いくつかの実施形態では、アップサンプリングユニット９２は、ビデオ復号器３０Ａの復号ピクチャバッファ１６０から受信された参照ピクチャを、アップサンプリングまたはダウンサンプリングするように構成されたリサンプリングユニット９０であり得る。

[00135]図３Ｂに示すように、ビデオ復号器３３は、デマルチプレクサ９９、すなわちｄｅｍｕｘをさらに含み得る。ｄｅｍｕｘ９９は、符号化ビデオビットストリームを複数のビットストリームに分割することができ、ｄｅｍｕｘ９９によって出力された各ビットストリームは、異なるビデオ復号器３０Ａおよび３０Ｂに供給される。複数のビットストリームは、ビットストリームを受信することによって作成され得、ビデオ復号器３０Ａおよび３０Ｂの各々は、所与の時間においてビットストリームの一部分を受信する。場合によっては、ｄｅｍｕｘ９９において受信されるビットストリームからのビットは、ビデオ復号器の各々（たとえば、図３Ｂの例ではビデオ復号器３０Ａおよび３０Ｂ）の間で、一度に１ビットずつ交替され得るが、多くの場合、ビットストリームは別様に分割される。たとえば、ビットストリームは、一度に１ブロックずつビットストリームを受信するビデオ復号器を交替することによって分割され得る。別の例では、ビットストリームは、非１：１比のブロックによって、ビデオ復号器３０Ａおよび３０Ｂの各々に分割され得る。たとえば、２つのブロックは、ビデオ復号器３０Ａに供給される各ブロックについてビデオ復号器３０Ｂに供給され得る。いくつかの実施形態では、ｄｅｍｕｘ９９によるビットストリームの分割は、プリプログラムされ得る。他の実施形態では、ｄｅｍｕｘ９９は、宛先モジュール１４を含む宛先デバイス上のプロセッサからなど、ビデオ復号器３３の外部のシステムから受信された制御信号に基づいてビットストリームを分割し得る。制御信号は、入力インターフェース２８からのビデオの解像度またはビットレートに基づいて、リンク１６の帯域幅に基づいて、ユーザに関連付けられたサブスクリプション（たとえば、有料サブスクリプション対無料サブスクリプション）に基づいて、またはビデオ復号器３３によって取得可能な解像度を決定するための他のファクタに基づいて生成され得る。

イントラランダムアクセスポイント（ＩＲＡＰ）ピクチャ

[00136]いくつかのビデオコーディングスキームは、ビットストリームが、ビットストリームの中でそれらのランダムアクセスポイントに先行するいかなるピクチャも復号する必要なく、それらのランダムアクセスポイントのいずれかから始めて復号され得るような、様々なランダムアクセスポイントをビットストリーム全体にわたって提供し得る。そのようなビデオコーディングスキームでは、出力順序においてランダムアクセスポイントに追従するすべてのピクチャ（たとえば、ランダムアクセスポイントを提供するピクチャと同じアクセスユニットの中にあるピクチャを含む）は、ランダムアクセスポイントに先行するいかなるピクチャも使用することなく正しく復号され得る。たとえば、ビットストリームの一部分が送信の間または復号の間に失われても、復号器は、次のランダムアクセスポイントから始めてビットストリームの復号を再開することができる。ランダムアクセスのサポートは、たとえば、動的なストリーミングサービス、シーク動作、チャネル切替えなどを容易にし得る。

[00137]いくつかのコーディングスキームでは、そのようなランダムアクセスポイントは、イントラランダムアクセスポイント（ＩＲＡＰ）ピクチャと呼ばれるピクチャによって提供され得る。たとえば、ｌａｙｅｒＢの中にあり復号順序においてａｕＡに先行するアクセスユニット（「ａｕＢ」）の中に含まれるランダムアクセスポイント（または、ａｕＡの中に含まれるランダムアクセスポイント）を有するｌａｙｅｒＡの各参照レイヤ（「ｌａｙｅｒＢ」）（たとえば、ｌａｙｅｒＡを予測するために使用されるレイヤである参照レイヤ）に関して出力順序においてａｕＢに追従するｌａｙｅｒＡの中のピクチャ（ａｕＢの中に位置するそれらのピクチャを含む）が、ａｕＢに先行するｌａｙｅｒＡの中のいかなるピクチャも復号する必要なく正しく復号可能であるように、アクセスユニット（「ａｕＡ」）の中に含まれるエンハンスメントレイヤ（「ｌａｙｅｒＡ」）の中のランダムアクセスポイント（たとえば、エンハンスメントレイヤＩＲＡＰピクチャによって提供される）は、レイヤ特有のランダムアクセスを提供し得る。

[00138]ＩＲＡＰピクチャは、イントラ予測（たとえば、他のピクチャを参照することなくコーディングされる）および／またはレイヤ間予測を使用してコーディングされ得、たとえば、瞬時復号器リフレッシュ（ＩＤＲ：instantaneous decoder refresh）ピクチャと、クリーンランダムアクセス（ＣＲＡ：clean random access）ピクチャと、ブロークンリンクアクセス（ＢＬＡ：broken link access）ピクチャとを含み得る。ビットストリームの中にＩＤＲピクチャがあるとき、復号順序においてＩＤＲピクチャに先行するすべてのピクチャは、ＩＤＲピクチャに追従するピクチャによる予測のために使用されない。ビットストリームの中にＣＲＡピクチャがあるとき、ＣＲＡピクチャに追従するピクチャは、復号順序においてＣＲＡピクチャに先行するピクチャを予測のために使用してよく、または使用しなくてもよい。復号順序においてＣＲＡピクチャに追従するが、復号順序においてＣＲＡピクチャに先行するピクチャを使用するピクチャは、ランダムアクセススキップドリーディング（ＲＡＳＬ：random access skipped leading）ピクチャと呼ばれることがある。復号順序においてＩＲＡＰピクチャに追従するとともに出力順序においてそれに先行することができる別のタイプのピクチャは、復号順序においてＩＲＡＰピクチャに先行するいかなるピクチャへの参照も含まないことがあるランダムアクセス復号可能リーディング（ＲＡＤＬ：random access decodable leading）ピクチャである。ＣＲＡピクチャに先行するピクチャが利用可能でない場合、ＲＡＳＬピクチャは復号器によって廃棄されてよい。ＢＬＡピクチャは、（たとえば、２つのビットストリームが互いに接合され、ＢＬＡピクチャが復号順序において第２のビットストリームの最初のピクチャであるので）ＢＬＡピクチャに先行するピクチャが復号器にとって利用可能でない場合があることを、復号器に示す。ＩＲＡＰピクチャであるベースレイヤのピクチャ（たとえば、０としてのレイヤＩＤを有する）を含むアクセスユニット（たとえば、複数のレイヤにわたって同じ出力時間に関連付けられたすべてのコード化ピクチャからなるピクチャのグループ）は、ＩＲＡＰアクセスユニット
と呼ばれることがある。

ＩＲＡＰピクチャのクロスレイヤアライメント

[00139]ＳＶＣでは、ＩＲＡＰピクチャは、異なるレイヤにわたってアラインされる（たとえば、同じアクセスユニットに含まれる）ように要求されなくてよい。たとえば、ＩＲＡＰピクチャがアラインされるように要求されるのであれば、少なくとも１つのＩＲＡＰピクチャを含むいかなるアクセスユニットもＩＲＡＰピクチャのみを含むはずである。一方、ＩＲＡＰピクチャがアラインされるよう要求されないのであれば、単一のアクセスユニットの中で、１つのピクチャ（たとえば、第１のレイヤの中の）がＩＲＡＰピクチャであってよく、別のピクチャ（たとえば、第２のレイヤの中の）が非ＩＲＡＰピクチャであってよい。ビットストリームの中にそのようなアラインされないＩＲＡＰピクチャを有することは、いくつかの利点をもたらすことがある。たとえば、２レイヤビットストリームの中で、エンハンスメントレイヤの中よりも多くのＩＲＡＰピクチャがベースレイヤの中にある場合、ブロードキャストおよびマルチキャストの適用例において、小さい同調遅延および高いコーディング効率が達成され得る。

[00140]いくつかのビデオコーディングスキームでは、ピクチャ順序カウント（ＰＯＣ：picture order count）が、復号ピクチャが表示される相対的な順序を追跡するために使用され得る。そのようなコーディングスキームのうちのいくつかは、いくつかのタイプのピクチャがビットストリームの中に出現するときはいつでも、ＰＯＣ値をリセット（たとえば、０またはビットストリームの中でシグナリングされたいくつかの値に）させ得る。たとえば、ある種のＩＲＡＰピクチャのＰＯＣ値がリセットされてよく、復号順序においてそれらのＩＲＡＰピクチャに先行する他のピクチャのＰＯＣ値もリセットさせる。ＩＲＡＰピクチャが異なるレイヤにわたってアラインされるように要求されないとき、このことが問題となり得る。たとえば、あるピクチャ（「ｐｉｃＡ」）がＩＲＡＰピクチャであり同じアクセスユニットの中の別のピクチャ（「ｐｉｃＢ」）がＩＲＡＰピクチャでないとき、ｐｉｃＡがＩＲＡＰピクチャであることに起因してリセットされる、ｐｉｃＡを含むレイヤの中のピクチャ（「ｐｉｃＣ」）のＰＯＣ値は、ｐｉｃＢを含むレイヤの中のリセットされないピクチャ（「ｐｉｃＤ」）のＰＯＣ値と異なることがあり、ここで、ｐｉｃＣおよびｐｉｃＤは同じアクセスユニットの中にある。このことは、それらが同じアクセスユニット（たとえば、同じ出力時間）に属していても、ｐｉｃＣおよびｐｉｃＤが異なるＰＯＣ値を有することを引き起こす。したがって、この例では、ｐｉｃＣおよびｐｉｃＤのＰＯＣ値を導出するための導出プロセスは、ＰＯＣ値およびアクセスユニットの定義と一致するＰＯＣ値を生成するように修正され得る。

レイヤ初期化ピクチャ（ＬＩＰ）

[00141]いくつかのコーディングスキームでは、レイヤ初期化ピクチャ（「ＬＩＰピクチャ」）は、１に設定されたＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇフラグ（たとえば、１に設定される場合はＲＡＳＬピクチャが出力されないことを示し、０に設定される場合はＲＡＳＬピクチャが出力されることを示すフラグ）を有するＩＲＡＰピクチャであるピクチャ、またはベースレイヤのピクチャ（たとえば、ビットストリームの中で定義される０としてのレイヤＩＤまたは最小のレイヤＩＤを有するピクチャ）が１に設定されたＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇをその中に有するＩＲＡＰアクセスユニットである初期ＩＲＡＰアクセスユニットが含まれるピクチャとして定義され得る。

[00142]いくつかの実施形態では、ＳＰＳは、各ＬＩＰピクチャにおいてアクティベートされ得る。たとえば、１に設定されたＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇフラグを有する各ＩＲＡＰピクチャ、または初期ＩＲＡＰアクセスユニットの中に含まれる各ピクチャ、前にアクティベートされたＳＰＳと異なってよい（たとえば、異なるピクチャ解像度を規定するなど）新しいＳＰＳ。しかしながら、ＬＩＰピクチャがＩＲＡＰピクチャ（たとえば、初期ＩＲＡＰアクセスユニットの中に含まれる任意のピクチャ）でなく、初期ＩＲＡＰアクセスユニットの中のベースレイヤのピクチャが０に設定されたフラグＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグ（たとえば、１に設定される場合はクロスレイヤランダムアクセススキップピクチャが出力されないことを示し、０に設定される場合はクロスレイヤランダムアクセススキップピクチャが出力されることを示すフラグ）を有するＩＤＲピクチャである場合では、ＬＩＰピクチャが新しいＳＰＳをアクティベートさせることを許容するべきでない。そのような場合では、そのようなＬＩＰピクチャにおいて新しいＳＰＳがアクティベートされる場合、詳細には、新しいＳＰＳのＳＰＳＲＢＳＰのコンテンツが初期ＩＲＡＰアクセスユニットの前にあらかじめアクティブであったＳＰＳのコンテンツと異なるとき、異なるピクチャ解像度および誤り耐性において問題となることがある。たとえば、新しいＳＰＳは、解像度を更新し、異なるサイズのピクチャを参照するための時間予測を使用することがある。

ピクチャのバンピングおよびフラッシング

[00143]復号されるピクチャは、（たとえば、それらが表示され得、または他のピクチャを予測するために使用され得るように）復号ピクチャバッファ（ＤＰＢ）に記憶される。出力されるべきピクチャは、「出力用に必要とされる」としてマークされてよく、他のピクチャを予測するために使用されるべきピクチャは、「参照用に使用される」としてマークされてよい。「出力用に必要とされる」としても「参照用に使用される」としてもマークされない復号ピクチャ（たとえば、最初に「参照用に使用される」または「出力用に必要とされる」としてマークされたが、その後、「参照用に使用されない」または「出力用に必要とされない」としてマークされたピクチャ）は、それらが復号プロセスによって除去されるまでＤＰＢの中に存在し得る。出力順序適合の復号器では、ピクチャをＤＰＢから除去するプロセスが、しばしば、「出力用に必要とされる」としてマークされているピクチャの出力の直後にくる。出力およびその後の除去のプロセスは、「バンピング」と呼ばれることがある。

[00144]これらのピクチャが「出力用に必要とされる」としてマークされていることがあっても、復号器がＤＰＢの中のピクチャを出力することなく除去し得る状況もある。本明細書での説明を簡単にするために、ＩＲＡＰピクチャを復号する時間においてＤＰＢの中に存在する復号ピクチャは、（復号ピクチャが「出力用に必要とされる」または「参照用に使用される」としてマークされているかどうかにかかわらず）ＩＲＡＰピクチャに関連付けられた「遅れＤＰＢピクチャ」、またはＩＲＡＰピクチャの「関連遅れＤＰＢピクチャ」と呼ばれる。そのような状況のいくつかの例が、ＨＥＶＣのコンテキストにおいて以下に説明される。

[00145]一例では、「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するＣＲＡピクチャがビットストリームの中間に存在するとき（たとえば、ビットストリームの中の最初のピクチャでない）、ＣＲＡピクチャに関連付けられた遅れＤＰＢピクチャは、出力されないことになり、ＤＰＢから除去されることになる。２つのビットストリームが互いに接合され、後者のビットストリームの最初のピクチャが「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するＣＲＡピクチャである接合ポイントにおいて、そのような状況が起こる可能性が高い。別の例では、「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するとともにＣＲＡピクチャでない（たとえば、ＩＤＲピクチャ）ＩＲＡＰピクチャｐｉｃＡがビットストリームの中間に存在し、ピクチャの解像度がｐｉｃＡにおいて変化するとき（たとえば、新しいＳＰＳのアクティベートを伴って）、関連遅れＤＰＢピクチャがＤＰＢを占有し続ける場合、ｐｉｃＡから始まるピクチャの復号が、たとえば、バッファオーバーフローに起因して問題となり得るので、ｐｉｃＡの関連遅れＤＰＢピクチャは、それらが出力され得る前にＤＰＢから除去されてよい。この場合では、ｐｉｃＡに関連付けられたｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇ（たとえば、１に設定される場合は前に復号されＤＰＢに記憶されたピクチャが出力されることなくＤＰＢから除去されるべきであることを示し、０に設定される場合は前に復号されＤＰＢに記憶されたピクチャが出力されることなくＤＰＢから除去されるべきでないことを示すフラグ）の値は、符号化器またはスプライサによって「１」としての値に等しく設定されるべきであり、または、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇ（たとえば、ビットストリームの中に含まれる情報に基づいて決定され得る導出値）は、遅れピクチャをＤＰＢの外へ出力することなくフラッシングするように、復号器によって「１」としての値に等しいものとして導出されてよい。接合動作が、図４に関して以下でさらに説明される。

[00146]関連遅れＤＰＢピクチャを出力することなくＤＰＢから除去するこのプロセスは、「フラッシング」と呼ばれることがある。上述されない状況においても、復号器がＩＲＡＰピクチャの関連ＤＰＢ遅れピクチャをフラッシングするように、ＩＲＡＰピクチャは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値を「１」としての値に等しく規定してよい。

接合ポイントを含むビットストリーム

[00147]図４を参照すると、接合ポイントを有する例示的なビットストリームが記載される。図４は、接合するビットストリーム４１０および４２０によって作り出されたマルチレイヤビットストリーム４００を示す。ビットストリーム４１０は、エンハンスメントレイヤ（ＥＬ）４１０Ａとベースレイヤ（ＢＬ）４１０Ｂとを含み、ビットストリーム４２０は、ＥＬ４２０ＡとＢＬ４２０Ｂとを含む。ＥＬ４１０ＡはＥＬピクチャ４１２Ａを含み、ＢＬ４１０ＢはＢＬピクチャ４１２Ｂを含む。ＥＬ４２０Ａは、ＥＬピクチャ４２２Ａ、４２４Ａ、および４２６Ａを含み、ＢＬ４２０Ｂは、ＢＬピクチャ４２２Ｂ、４２４Ｂ、および４２６Ｂを含む。マルチレイヤビットストリーム４００は、アクセスユニット（ＡＵ）４３０〜４６０をさらに含む。ＡＵ４３０は、ＥＬピクチャ４１２ＡとＢＬピクチャ４１２Ｂとを含み、ＡＵ４４０は、ＥＬピクチャ４２２ＡとＢＬピクチャ４２２Ｂとを含み、ＡＵ４５０は、ＥＬピクチャ４２４ＡとＢＬピクチャ４２４Ｂとを含み、ＡＵ４６０は、ＥＬピクチャ４２６ＡとＢＬピクチャ４２６Ｂとを含む。図４の例では、ＢＬピクチャ４２２ＢはＩＲＡＰピクチャであり、ＡＵ４４０の中の対応するＥＬピクチャ４２２Ａは、末尾のピクチャ（たとえば、非ＩＲＡＰピクチャ）であり、したがって、ＡＵ４４０はアラインされないＩＲＡＰＡＵである。また、ＡＵ４４０が接合ポイント４７０の直後にくるアクセスユニットであることに留意されたい。

[00148]図４の例は２つの異なるビットストリームが互いに接合される場合を示すが、いくつかの実施形態では、ビットストリームの一部分が除去されるときに接合ポイントが存在することがある。たとえば、ビットストリームは部分Ａ、Ｂ、およびＣを有し得、部分Ｂは部分ＡとＣとの間にある。部分Ｂがビットストリームから除去される場合、残りの部分ＡおよびＣは互いに接合され得、それらが互いに接合される点は接合ポイントと呼ばれることがある。より一般に、本出願で説明されるような接合ポイントは、１つまたは複数のシグナリングまたは導出されたパラメータまたはフラグが所定の値を有するとき、存在するとみなされてよい。たとえば、接合ポイントが特定のロケーションにおいて存在するという特定のインジケーションを受信しなければ、復号器は、フラグ（たとえば、ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇ）の値を決定し得、フラグの値に基づいて本出願に記載される１つまたは複数の技法を実行し得る。

マルチレイヤのコンテキストにおけるピクチャのフラッシング

[00149]ピクチャをフラッシングするプロセスは、マルチレイヤビットストリームにおいても関連する。より具体的には、それは初期ＩＲＡＰアクセスユニットに属するすべてのピクチャと関連し、初期ＩＲＡＰアクセスユニットの中にないＩＲＡＰピクチャとも関連する。上述されたように、ＳＨＶＣおよびＭＶ−ＨＥＶＣなどのいくつかの既存の実装形態では、ＩＲＡＰアクセスユニットは、「０」としての値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＩＲＡＰピクチャを含むアクセスユニットとして定義され得（アクセスユニットの中の他のピクチャがＩＲＡＰピクチャであるかどうかにかかわらず）、初期ＩＲＡＰアクセスユニットは、「０」としての値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するとともに「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するＩＲＡＰピクチャを含むアクセスユニットとして定義され得る（再び、アクセスユニットの中の他のピクチャがＩＲＡＰピクチャであるかどうかにかかわらず）。

[00150]ＳＨＶＣおよびＭＶ−ＨＥＶＣにおいて、アラインされないＩＲＡＰピクチャをアクセスユニットの中に有する可能性（たとえば、アクセスユニットはＩＲＡＰピクチャと非ＩＲＡＰピクチャの両方を含み得る）を伴うと、ＨＥＶＣのコンテキストにおいて前のセクションで説明した状況は、ＳＨＶＣ／ＭＶ−ＨＥＶＣビットストリームの異なるレイヤにおいて起こり得る。たとえば、「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するＣＲＡピクチャｐｉｃＡは、エンハンスメントレイヤにおいてｐｉｃＡと同じレイヤの中にＣＲＡピクチャを有していない初期ＩＲＡＰアクセスユニットを用いて開始するビットストリームの中間に（たとえば、ビットストリームの第１のアクセスユニットの中でない）存在し得る。また、ピクチャの解像度変更は、ベースレイヤの解像度が変化しないアクセスユニットにおけるエンハンスメントレイヤの中で、またはその逆に、ＩＲＡＰピクチャにおいて発生し得る。類似の状況が、異なるＤＰＢサイズに対して起こり得る。

ＳＶＣおよびＭＶＣにおけるピクチャのフラッシング

[00151]ＳＶＣの単一ループコーディング設計に起因して、いわゆる中粒度スケーラビリティ（ＭＧＳ）が使用される場合を除いて、アクセスユニットあたり１つの再構成ピクチャのみがＤＰＢの中に挿入される（その場合では、ＤＰＢに記憶されるいわゆるキーピクチャアクセスユニットからの２つの復号ピクチャが存在し得る）。しかしながら、各アクセスユニットの中で、最上位レイヤの復号ピクチャのみが出力され得る。ＤＰＢを管理するための動作は、ピクチャのフラッシングを含み、したがって、主にベースレイヤの復号ピクチャはエンハンスメントレイヤを予測するためにＤＰＢの中に存在することが必要とされないので、最上位レイヤの中のピクチャのみに関係する。

[00152]ＭＶＣでは、１つを越えるビューがターゲット出力ビューであり得、それらが同じレイヤの中のビューコンポーネントを予測するために必要とされなくても、他のレイヤの中のビューコンポーネントを予測するために維持される必要がある復号ビューコンポーネントであり得る。したがって、１つを越えるビューからのビューコンポーネントが、ＤＰＢの中に存在し得る。フラグｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇが、各ＩＤＲビューコンポーネントに対してシグナリングされ（たとえば、非ベースビューのＩＤＲビューコンポーネントが「０」としての値に等しいｎｏｎ＿ｉｄｒ＿ｆｌａｇを用いてシグナリングされる）、ビューコンポーネントのフラッシングは、レイヤ特有（またはビュー特有）である。ＭＶＣでは、簡単のため、ＭＶＣにおけるアクセスユニットの中のＩＤＲビューコンポーネントはアラインされる。たとえば、アクセスユニットの中のあるビューコンポーネントがＩＤＲビューコンポーネントである場合、そのアクセスユニットの中のすべてのビューコンポーネントもＩＤＲビューコンポーネントである。したがって、フラッシング動作はまた、動作がビュー／レイヤ特有であり得ても、ビットストリームの中のすべてのビューにわたって実行される。

ＳＨＶＣおよびＭＶ−ＨＥＶＣにおけるピクチャのフラッシング

[00153]フラッシングがＳＨＶＣおよびＭＶ−ＨＥＶＣにおける現在の設計のもとで発生すると、ＤＰＢの中のすべてのピクチャは、出力（たとえば、表示）されることなく除去される。ビットストリームの中の１つのレイヤのみのピクチャがフラッシングされることは可能でなく（ベースレイヤのみがビットストリームの中に存在するときの自明な場合を除いて）、したがって、フラッシングはレイヤ特有でない。

出力タイミング適合

[00154]いくつかの実装形態では（たとえば、ＳＨＶＣ、ＭＶ−ＨＥＶＣなど）、出力タイミング適合に関して、ピクチャのＤＰＢからの出力および除去は、以下に説明されるように実行される。フラッシングプロセスと関連する部分は、《イタリック体》（《》内はイタリック体である）で示される。以下の例では、呼び出されるピクチャの除去は、ＨＥＶＣ規格のセクションＦ．１３．３．２に規定されるように各レイヤに特有である。

Ｃ．３．２ピクチャのＤＰＢからの除去
現在のピクチャの復号の前の（ただし、現在のピクチャの第１のスライスのスライスヘッダをパースした後の）、ピクチャのＤＰＢからの除去は、アクセスユニットｎ（現在のピクチャを含む）の第１の復号ユニットのＣＰＢ除去時間において瞬時に起こり、次のように進む。
− サブクローズ８．３．２で規定されるようなＲＰＳのための復号プロセスが呼び出される。
− 《現在のピクチャが１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有しピクチャ０でないＩＲＡＰピクチャであるとき、以下の順序付けられたステップが適用される。
１．変数ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが、テスト対象の復号器に対して次のように導出される。
− 現在のピクチャがＣＲＡピクチャである場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは１に等しく設定される（ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず）。
− そうでない場合、アクティブなＳＰＳから導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値が、先行するピクチャに対してアクティブなＳＰＳからそれぞれ導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値と異なる場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず、テスト対象の復号器によって１に設定されてよい（ただし、設定されるべきでない）。
注− これらの条件下ではＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇをｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定することが好ましいが、テスト対象の復号器は、この場合にはＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇを１に設定することが許容される。
− そうでない場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定される。
２．ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値が１に等しいとき、ＤＰＢの中のすべてのピクチャ記憶バッファが、それらが含んでいるピクチャを出力することなく空にされるように、テスト対象の復号器に対して導出されるＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値がＨＲＤに対して適用され、ＤＰＢフルネスは０に等しく設定される。》（《》内はイタリック体である）
− 以下の条件の両方がＤＰＢの中の任意のピクチャｋに対して真であるとき、ＤＰＢの中のすべてのそのようなピクチャｋはＤＰＢから除去される。
− ピクチャｋが、「参照用に使用されない」としてマークされている。
− ピクチャｋが、０に等しいＰｉｃＯｕｔｐｕｔＦｌａｇを有するか、またはそれのＤＰＢ出力時間が現在のピクチャｎの第１の復号ユニット（復号ユニットｍとして示す）のＣＰＢ除去時間以下である、すなわち、ＤｐｂＯｕｔｐｕｔＴｉｍｅ［ｋ］がＣｐｂＲｅｍｏｖａｌＴｉｍｅ（ｍ）以下である。
− ＤＰＢから除去される各ピクチャに対して、ＤＰＢフルネスは１だけデクリメントされる。
Ｆ．１３．３．２ピクチャのＤＰＢからの除去
サブクローズＣ．３．２における仕様は、ｎｕｈ＿ｌａｙｅｒ＿ｉｄとしての特定の値を有する復号ピクチャの各セットに対して、以下の修正とともに別個に適用される。
− 「現在のピクチャの復号の前の（ただし、現在のピクチャの第１のスライスのスライスヘッダをパースした後の）、ピクチャのＤＰＢからの除去は、アクセスユニットｎ（現在のピクチャを含む）の第１の復号ユニットのＣＰＢ除去時間において瞬時に起こり、次のように進む。」を、「現在のピクチャの復号の前の（ただし、現在のピクチャの第１のスライスのスライスヘッダをパースした後の）、ピクチャのＤＰＢからの除去は、ピクチャｎの第１の復号ユニットのＣＰＢ除去時間において瞬時に起こり、次のように進む。」に置き換える。

出力順序適合

[00155]いくつかの実装形態では（たとえば、ＳＨＶＣ、ＭＶ−ＨＥＶＣなど）、出力順序適合に関して、ピクチャのＤＰＢからの出力および除去は、以下に説明されるように実行される。フラッシングプロセスと関連する部分は、《イタリック体》（《》内はイタリック体である）で示される。以下の例では、ピクチャの除去は、呼び出されたとき、すべてのレイヤに対して実行される。

Ｆ．１３．５．２．２ピクチャのＤＰＢからの出力および除去
現在のピクチャの復号の前の（ただし、現在のピクチャの第１のスライスのスライスヘッダをパースした後の）、ピクチャのＤＰＢからの出力および除去は、現在のピクチャの第１の復号ユニットがＣＰＢから除去されたときに瞬時に起こり、次のように進む。
サブクローズＦ．８．３．２で規定されるようなＲＰＳのための復号プロセスが呼び出される。
− 《現在のピクチャが１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有し、０に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有し、ピクチャ０でないＩＲＡＰピクチャである場合、以下の順序付けられたステップが適用される。
１．変数ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが、テスト対象の復号器に対して次のように導出される。
− 現在のピクチャがＣＲＡピクチャである場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは１に等しく設定される（ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず）。
− そうでない場合、アクティブなＳＰＳから導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値が、先行するピクチャに対してアクティブなＳＰＳからそれぞれ導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値と異なる場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず、テスト対象の復号器によって１に設定されてよい（ただし、設定されるべきでない）。
注− これらの条件下ではＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇをｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定することが好ましいが、テスト対象の復号器は、この場合にはＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇを１に設定することが許容される。
− そうでない場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定される。
２．テスト対象の復号器に対して導出されるＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値が次のようにＨＲＤに対して適用される。
− ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが１に等しい場合、ＤＰＢの中のすべてのピクチャ記憶バッファはそれらが含んでいるピクチャを出力することなく空にされ、ＤＰＢフルネスは０に等しく設定される。
− そうでない場合（ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが０に等しい）、「出力用に必要とされない」および「参照用に使用されない」としてマークされているピクチャを含むすべてのピクチャ記憶バッファは空にされ（出力せずに）、ＤＰＢの中のすべての空でないピクチャ記憶バッファは、サブクローズＦ．１３．５．２．４で規定される「バンピング」プロセスを繰り返し呼び出すことによって空にされ、ＤＰＢフルネスは０に等しく設定される。》（《》内はイタリック体である）
− そうでない場合（現在のピクチャが、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するか、または０に等しくないｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＩＲＡＰピクチャでない）、「出力用に必要とされない」および「参照用に使用されない」としてマークされているピクチャを含むすべてのピクチャ記憶バッファは空にされる（出力せずに）。空にされた各ピクチャ記憶バッファに対して、ＤＰＢフルネスは１だけデクリメントされる。変数ｃｕｒｒＬａｙｅｒＩｄは現在の復号ピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄに等しく設定され、以下の条件のうちの１つまたは複数が真であるとき、空にされた各追加のピクチャ記憶バッファに対してＤＰＢフルネスを１だけさらにデクリメントしながら、以下の条件のいずれも真でなくなるまでサブクローズＦ．１３．５．２．４で規定される「バンピング」プロセスが繰り返し呼び出される。
− 「出力用に必要とされる」としてマークされているＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャの数は、アクティブなＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しくないとき）ｓｐｓ＿ｍａｘ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ＨｉｇｈｅｓｔＴｉｄ］よりも大きい。
− アクティブなＳＰＳ（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳのｓｐｓ＿ｍａｘ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］は０に等しくなく、それに対して関連した変数ＰｉｃＬａｔｅｎｃｙＣｏｕｎｔ［ｃｕｒｒＬａｙｅｒＩｄ］が、アクティブなＳＰＳから（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳから導出されるＳｐｓＭａｘＬａｔｅｎｃｙＰｉｃｔｕｒｅｓ［ＨｉｇｈｅｓｔＴｉｄ］以上である「出力用に必要とされる」としてマークされているＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する少なくとも１つのピクチャが存在する。
− ＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャの数は、アクティブなＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳからのｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］＋１以上である。

出力タイミング適合および出力順序適合の比較

[00156]上述されたように、出力タイミング適合および出力順序適合は、ともに同じフラッシングの挙動をもたらさないことがある。たとえば、出力タイミング適合復号器に関して、フラッシングは、ビットストリームの中のレイヤの最初のピクチャでなく「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有する、レイヤの中の各ピクチャに対して呼び出される。フラッシングが呼び出されると、ＤＰＢの中のそのレイヤのすべての復号ピクチャがフラッシングされる。一方、出力順序適合復号器に関して、フラッシングは、ビットストリームの中の最初のピクチャでなく「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有する、ベースレイヤの中のピクチャのみに対して呼び出される。フラッシングが呼び出されると、ＤＰＢの中のすべてのレイヤのすべての復号ピクチャがフラッシングされる。

[00157]２つのレイヤを有するビットストリームでは、ＩＲＡＰピクチャでありＩＲＡＰＡＵに属さない、ＥＬの中のＬＩＰピクチャが異なる解像度をアクティベートさせ、ＢＬピクチャが非ＩＲＡＰＡＵ（たとえば、ＩＲＡＰピクチャでない）の中にあることに起因してＢＬの解像度がこのＡＵにおいて変更できないとき、ピクチャのレイヤ特有のフラッシングが望まれることがある。ここで、ＥＬからのピクチャのみがフラッシングされるべきであり、ＢＬからのピクチャはフラッシングされるべきでない。この機能は、出力順序適合に対して利用可能でない。

[00158]２つのレイヤを有するビットストリームでは、アクセスユニットが、ＩＤＲピクチャであるＢＬピクチャと、非ＩＲＡＰピクチャであるＥＬピクチャとを含む場合において、ＢＬピクチャの解像度はそのアクセスユニットにおいて更新され得るが、ＥＬピクチャの解像度は更新されない。そのような場合では、フラッシングはＢＬからのピクチャのみに対して実行されるべきであり、ＥＬピクチャはフラッシングされるべきでない。この機能は、出力順序適合に対して利用可能でない。

出力タイミング適合および出力順序適合のＳＰＳアクティベーション

[00159]「０」としての値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＳＰＳが、１つを越えるレイヤを有するビットストリームの中の、「０」としての値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する最後のＶＣＬＮＡＬユニットの後のアクセスユニットの中に存在し、復号順序において追従するアクセスユニットがアクセスユニットデリミタ（たとえば、０よりも大きいｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を有するさらなるＶＣＬＮＡＬユニットがビットストリームの中に存在することを示す）を有するとき、ＢＬのみを含む出力レイヤセットを用いて抽出されるビットストリームは、非適合であり得る。たとえば、抽出されるビットストリームは、それのＶＣＬＮＡＬユニットのすべての後にＳＰＳＮＡＬユニットを含み得る。そのようなＳＰＳＮＡＬユニットは、未結合ＳＰＳと呼ばれることがある。復号器は、通常、ＳＰＳＮＡＬユニットを処理した後、ビットストリームの中で追従するべきさらなるＶＣＬＮＡＬユニットを処理することを予期する。したがって、いくつかのコーディングスキームでは、そのような未結合ＳＰＳは、非適合なビットストリームをもたらすことがある。

例示的な実施形態

[00160]上述されたいくつかの問題に対処するために使用され得るいくつかの方法が、以下に説明される。これらの方法のうちのいくつかは独立に適用されてよく、それらのうちのいくつかは組み合わせて適用されてよい。加えて、本明細書で説明される方法のうちの１つまたは複数を実施するために使用され得る例示的なシンタックスおよびセマンティクスも、以下で提供される。本明細書で説明される方法のうちの１つまたは複数を実施するために組み込まれ得る追加と削除とを示すために、ＨＥＶＣ規格のいくつかの部分が転載されるとき、そのような修正は、それぞれ《イタリック体》（《》内はイタリック体である）および取り消し線（下線は取り消し線を表す）で示される。

ピクチャのレイヤ特有フラッシング

[00161]いくつかの実施形態では、ピクチャのフラッシングは、復号器適合の両方のタイプ（たとえば、出力タイミング適合および出力順序適合）に関するレイヤ特有の方式で実行される。フラッシングプロセスは、「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有する各ＩＲＡＰピクチャにおいて、および各ＬＩＰピクチャにおいて（たとえば、「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇと、「０」としての値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄとを有するＩＲＡＰピクチャのみにおいて発生する代わりに）発生し得る（または、発生することが可能であり得る）。

前のピクチャの出力を示すフラグのシグナリング

[00162]いくつかの実施形態では、フラグｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇは、ＢＬの中のすべてのＩＲＡＰピクチャ（たとえば、「０」としての値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する）に対してシグナリングされ、フラグｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇは、「０」としての値に等しくないｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するすべてのＶＣＬＮＡＬユニットのスライスセグメントヘッダの中でシグナリングされる。上記で説明したように、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇは、前に復号およびＤＰＢに記憶されたピクチャが出力されることなくＤＰＢから除去されるべきであるかどうかを示し得る。他の実施形態では、フラグｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇは、すべてのＶＣＬＮＡＬユニットのスライスセグメントヘッダの中でシグナリングされる。

[00163]現在のピクチャがＥＬの中にある（たとえば、「０」としての値よりも大きいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する）場合、普通はｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇがシグナリングされる前に検査され得る条件（たとえば、現在のピクチャがＩＲＡＰピクチャであるかどうか）は、スキップされ得る。たとえば、フラグｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇは、ビットストリームの中に存在する各ＥＬに対してシグナリングされ得る。フラグｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇは、シンタックステーブルにおける元の位置に存在し得る（たとえば、条件が満たされているかどうかを検査する余分なステップを伴わない）。現在のピクチャがＩＲＡＰピクチャでないＢＬピクチャ（たとえば、「０」としての値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する）である場合、フラグｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇ（または、類似のインジケーションおよび／または機能を有する別のフラグ）は、スライスヘッダの中の予約済みビットのうちの１つ、またはスライスヘッダ拡張の一部のいずれかとして存在し得る。現在のピクチャがＢＬピクチャ（たとえば、「０」としての値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する）でありＩＲＡＰピクチャである場合、フラグｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇのシグナリングは変更されないままとなり得る。

アクセスユニット条件に基づくピクチャの出力

[00164]いくつかの実施形態では、変数ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇ（たとえば、ＤＰＢがフラッシングされる前にＤＰＢの中のピクチャを出力するべきか否かを決定するために復号器によって導出される値）は、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇおよび他の条件に基づいて、少なくともＩＲＡＰピクチャでないすべてのＬＩＰピクチャに対して導出される。たとえば、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇは、ビットストリームの中でシグナリングされる値であってよく、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ビットストリームの中に含まれる情報に基づいて符号化器によって導出される値であってよい。復号器は、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値および他の条件に基づいてＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値を導出し得、次いで、ピクチャを出力するか否かを決定するためにＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの導出値を使用し得る。いくつかの実施形態では、ＩＲＡＰピクチャでない各ＬＩＰピクチャｐｉｃＡに関するＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値は、ｐｉｃＡを含むアクセスユニットに属し、「０」としての値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有し、「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するＩＲＡＰピクチャに関連付けられたＮｏＣｌＲａｓＯｕｔｐｕｔＦｌａｇの値に基づいて推定され得る。いくつかの実施形態では、フラグＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、現在のアクセスユニットが、２つの異なるビットストリームが互いに縫合される接合ポイントを備えるかどうかを示し得る。

[00165]いくつかの実施形態では、ＮｏＣｌＲａｓＯｕｔｐｕｔＦｌａｇおよびＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇは、ビットストリームの中に含まれる情報に基づいて導出される変数であり得る。たとえば、ＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇは、すべてのＩＲＡＰピクチャ（たとえば、ＢＬおよび／またはＥＬの中の）に対して導出され得、ＮｏＣｌＲａｓＯｕｔｐｕｔＦｌａｇは、最下位レイヤのピクチャ（たとえば、ＢＬピクチャ）のみに対して導出され得る。ＮｏＣｌＲａｓＯｕｔｐｕｔＦｌａｇおよびＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇの各々の値は、ビットストリームの中のいくつかのピクチャが、いくつかの参照ピクチャの非利用可能性に起因して正しく復号可能でない場合があることを示し得る。参照ピクチャのそのような非利用可能性は、ランダムアクセスポイントにおいて発生し得る。クロスレイヤランダムアクセススキップ（ＣＬ−ＲＡＳ）ピクチャは、いくつかの点で、ＲＡＳＬピクチャのマルチレイヤ対応である。復号器がランダムアクセスポイント（たとえば、ＢＬＩＲＡＰピクチャを有するアクセスユニット）においてビットストリームの復号を開始し、アクセスユニットの中のＥＬピクチャがＩＲＡＰピクチャでない場合、そのＥＬピクチャはＣＬ−ＲＡＳピクチャである。ＥＬの中のすべてのピクチャは、ＩＲＡＰピクチャがＥＬの中に発生するまでＣＬ−ＲＡＳピクチャ（たとえば、復号可能だが、正しく復号可能ではない）であり得る。そのようなＥＬＩＲＡＰピクチャがビットストリームの中で提供されるとき、ＥＬは初期化されたと言われることがある。

[00166]たとえば、図４の例では、ＥＬピクチャ４２２ＡはＩＲＡＰピクチャでないＬＩＰピクチャであってよく、ＢＬピクチャ４２２Ｂはそれに関連付けられたフラグＮｏＣｌＲａｓＯｕｔｐｕｔＦｌａｇを有するＩＲＡＰピクチャであってよい。この例では、ＥＬピクチャ４２２Ａに関連付けられたＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値は、ＢＬピクチャ４２２Ｂに関連付けられたＮｏＣｌＲａｓＯｕｔｐｕｔＦｌａｇの値に基づいて推定され得る。たとえば、ＮｏＣｌＲａｓＯｕｔｐｕｔＦｌａｇが「１」としての値に等しい場合、ＥＬピクチャ４２２Ａに対するＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇはまた、「１」としての値に設定されてよく、それらがＤＰＢから除去される前にＤＰＢの中のピクチャを出力させない。一方、ＮｏＣｌＲａｓＯｕｔｐｕｔＦｌａｇが「０」としての値に等しい場合、ＥＬピクチャ４２２Ａに対するＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇはまた、「０」としての値に設定されてよく、出力の後でＤＰＢの中のピクチャをＤＰＢから除去させる。

アクセスユニット条件に基づいてピクチャを出力するための例示的なフローチャート

[00167]図５を参照すると、ＤＰＢをフラッシングするための例示的なルーチンが記載される。図５は、本開示の一実施形態による、ビデオ情報をコーディングするための方法５００を示すフローチャートである。図５に示すステップは、符号化器（たとえば、図２Ａまたは図２Ｂに示すビデオ符号化器）、復号器（たとえば、図３Ａまたは図３Ｂに示すビデオ復号器）、または任意の他の構成要素によって実行され得る。便宜上、方法５００について、符号化器、復号器、または別の構成要素であり得る、コーダによって実行されるものとして説明する。

[00168]方法５００は、ブロック５０１において開始する。ブロック５０５において、コーダは、ピクチャが接合ポイントの非ＩＲＡＰピクチャであるかどうかを決定する。たとえば、コーダは、ピクチャが接合ポイントの直後にくるアクセスユニットの中にある非ＩＲＡＰピクチャであるかどうかを決定し得る。いくつかの実施形態では、特定のピクチャが接合ポイントの直後にくるアクセスユニットの中にあるかどうかは、フラグとしてシグナリングまたは処理され得る。そのような実施形態では、１としてのフラグ値は、ピクチャが接合ポイントの直後にくるアクセスユニットの中にあることを示し得、０としてのフラグ値は、ピクチャが接合ポイントの直後にくるアクセスユニットの中にないことを示し得る。コーダが、ピクチャが接合ポイントの非ＩＲＡＰピクチャでないと決定する場合、方法５００はブロック５１０に進む。コーダが、ピクチャが接合ポイントの非ＩＲＡＰピクチャであると決定する場合、方法５００はブロック５１５に進む。

[00169]ブロック５１０において、コーダは、ＤＰＢからピクチャを除去する前に、ＤＰＢの中のピクチャを出力する。ブロック５１５において、コーダは、ピクチャを出力することなく、ＤＰＢの中のピクチャを除去する。方法５００は、５１５において終了する。

[00170]上記で説明したように、図２Ａのビデオ符号化器２０、図２Ｂのビデオ符号化器２３、図３Ａのビデオ復号器３０、または図３Ｂのビデオ復号器３３（たとえば、レイヤ間予測ユニット１２８および／またはレイヤ間予測ユニット１６６）のうちの１つまたは複数の構成要素は、ピクチャが接合ポイントの非ＩＲＡＰピクチャであるかどうかを決定すること、ならびにピクチャを出力すること、および／またはＤＰＢからピクチャを除去することなどの、本開示で説明する技法のいずれかを実施するために使用され得る。

ＤＰＢフラッシング方法の組合せ

[00171]いくつかの実施形態では、フラッシングプロセスは、それがＩＲＡＰピクチャでもあるＥＬピクチャのうちの１つの中で呼び出されるときのみ、レイヤ特有である。フラッシングプロセスが「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するＢＬに属するＩＲＡＰピクチャにおいて呼び出されると、すべてのレイヤにわたるすべてのピクチャは、ＤＰＢからフラッシングされ得る。

ネットワークアブストラクションレイヤ（ＮＡＬ）ユニットおよびパラメータセット

[00172]上記で説明したように、符号化器または復号器によって使用されるパラメータは、それらが利用され得るコーディングレベルに基づいてパラメータセットへグループ化され得る。たとえば、ビットストリームの中の１つまたは複数のコード化ビデオシーケンスによって利用されるパラメータは、ビデオパラメータセット（ＶＰＳ）の中に含まれてよく、コード化ビデオシーケンスの中の１つまたは複数のピクチャによって利用されるパラメータは、シーケンスパラメータセット（ＳＰＳ）の中に含まれてよい。同様に、ピクチャの中の１つまたは複数のスライスによって利用されるパラメータは、ピクチャパラメータセット（ＰＰＳ）の中に含まれてよく、単一のスライスに特有である他のパラメータは、スライスヘッダの中に含まれてよい。そのようなパラメータセットは、所与のレイヤに対してパラメータセットＮＡＬユニット（たとえば、ＳＰＳＮＡＬユニット、ＰＰＳＮＡＬユニットなど）によってアクティベートされ得る（または、アクティブであるとして示され得る）。ＮＡＬユニットは、ローバイトシーケンスペイロード（ＲＢＳＰ：raw byte sequence payload）とＮＡＬユニットヘッダとを備える。ＲＢＳＰは、パラメータセットＩＤ（たとえば、ＳＰＳＩＤ）を規定し得、ＮＡＬユニットヘッダは、どのレイヤがＳＰＳを使用し得るかを示し得るレイヤＩＤを規定し得る。

[00173]場合によっては、所与のレイヤによって使用され得る、または所与のレイヤに対してアクティベートされ得る特定のパラメータセットのビットストリームの中で、複数のインスタンスを提供することが有益であり得る。たとえば、特定のパラメータセットが所与のレイヤに対してすでにアクティベートされた後でさえも、特定のパラメータセットのさらなるインスタンスは、所与のレイヤによる使用のためにビットストリームの中で提供され得る。ビットストリームがそのようなＳＰＳのさらなるインスタンスを含むとき、前にシグナリングされた特定のパラメータセットが失われても、復号器は、その後シグナリングされる特定のパラメータセットを所与のレイヤに対して使用し得る。

[00174]しかしながら、いくつかのコーディングスキームでは、パラメータセットのそのようなさらなるインスタンス（たとえば、反復ＳＰＳ）がビットストリームの中で提供されるとき、パラメータセット（たとえば、ＳＰＳＮＡＬユニット）のコンテンツは、パラメータセットのすべての前のインスタンスと同一であることが求められ得る。たとえば、ビットストリームがベースレイヤとエンハンスメントレイヤとを備える場合、ＳＰＳＮＡＬユニットがビットストリームの中で提供された後、ベースレイヤとエンハンスメントレイヤの両方がＳＰＳを参照し得る。ベースレイヤのすべてのＮＡＬユニット（たとえば、ＶＣＬＮＡＬユニット）がビットストリームの中で提供された後、たとえば、誤り耐性を改善するために、ＳＰＳをビットストリームの中で再び提供することが望ましい状況があり得る。そのような状況では、後続のＳＰＳＮＡＬユニットは、ビットストリームの中で前に提供されたＳＰＳＮＡＬユニットと同じコンテンツを有することが必要とされ得る。ＳＰＳＮＡＬユニットはどのレイヤがＳＰＳＮＡＬユニットを使用し得るかを示すためのレイヤＩＤを規定し得るので、上述された例では、後続のＳＰＳＮＡＬユニットが単にエンハンスメントレイヤによって使用されることがあっても、後続のＳＰＳＮＡＬユニットは、ベースレイヤとエンハンスメントレイヤの両方がＳＰＳを使用し得ることを示し得る前に提供されたＳＰＳＮＡＬユニットと同じレイヤＩＤを規定することが、ビットストリーム制約によって必要とされ得る。ＳＰＳＮＡＬユニットの両方が、異なるレイヤによって使用されながら同じレイヤＩＤを規定した場合、復号プロセスの間に問題が起こり得る。

[00175]たとえば、特定のビットストリームがベースレイヤとエンハンスメントレイヤとを有する場合、ここで、ベースレイヤおよびエンハンスメントレイヤの両方は同じＳＰＳを参照する。ＥＬがＢＬよりも高いフレームレートを有する場合、ビットストリームの中の最後の少数のアクセスユニットは、ＥＬピクチャのみを含みＢＬピクチャを含まないことがある。そのような例では、最後の少数のアクセスユニットのうちの１つが反復ＳＰＳＮＡＬユニットを含んだ場合、上述されたビットストリーム制約は、ＳＰＳＮＡＬユニットのレイヤＩＤを、ＳＰＳをアクティベートする前のＳＰＳＮＡＬユニットと同じであるように強制し得る（たとえば、コーダは、そのようなビットストリーム制約が適用可能であると決定し得、コード化ビットストリームがビットストリーム制約に適合するようにビットストリーム制約に忠実に従い得る）。たとえば、そのような前のＳＰＳＮＡＬユニットはベースレイヤによって使用されることがあり、前のＳＰＳＮＡＬユニットは、ベースレイヤがＳＰＳを使用し得ることを示す０としてのレイヤＩＤ値を有してよい。そのような場合では、反復ＳＰＳＮＡＬユニットがベースレイヤによって使用されるべきと意味されなくても、反復ＳＰＳＮＡＬユニットのレイヤＩＤはまた、「０」としての値に等しくなければならないことになる。この例で、復号器がビットストリームのベースレイヤを抽出しようと試みる場合（たとえば、０としてのレイヤＩＤを有するすべてのＮＡＬユニットを取ることによって）、得られたビットストリームは、反復ＳＰＳＮＡＬユニットをビットストリームの終わりにおいて有することになる。復号器は、反復ＳＰＳＮＡＬユニットを処理すると、反復ＳＰＳＮＡＬユニットが次のアクセスユニット（または、コード化ビデオシーケンス）の始まりをシグナリングすると仮定することがあるので、このことは問題となり得る。そのような問題を回避するために、符号化器は、ビットストリームの中に後続のＳＰＳＮＡＬユニットをまったく提供しないことを決定してよく、それによって、反復ＳＰＳＮＡＬユニットに関連する潜在的な利益を断念する。

シーケンスパラメータセット（ＳＰＳ）ローバイトシーケンスペイロード（ＲＢＳＰ）のアクティベーション

[00176]ＳＰＳＲＢＳＰは、１つまたは複数のピクチャパラメータセット（ＰＰＳ）ＲＢＳＰ、またはアクティブなパラメータセットＳＥＩメッセージを含む１つまたは複数のＳＥＩＮＡＬユニットによって参照され得るパラメータを含む。各ＳＰＳＲＢＳＰは、最初に、復号プロセスの開始においていかなるレイヤに対してもアクティブでないとみなされてよい。各レイヤに対して、多くて１つのＳＰＳＲＢＳＰが、復号プロセスの間の所与の瞬間においてアクティブであるとみなされ、特定のレイヤに対する任意の特定のＳＰＳＲＢＳＰのアクティベーションは、もしあれば、その特定のレイヤに対して前にアクティブであったＳＰＳＲＢＳＰのデアクティベーションをもたらす。

[00177]１つのＳＰＳＲＢＳＰが、１つを越えるレイヤに対してアクティブなＳＰＳＲＢＳＰであってよい。たとえば、ベースレイヤおよびエンハンスメントレイヤが、３としてのＳＰＳＩＤを有するＳＰＳを参照するＰＰＳを参照するピクチャをともに含む場合、３としてのＳＰＳＩＤを有するＳＰＳは、参照レイヤとエンハンスメントレイヤの両方に対してアクティブなＳＰＳＲＢＳＰである。

[00178]ＳＰＳＲＢＳＰ（たとえば、特定のＳＰＳＩＤを有する）が、ＸとしてのレイヤＩＤ（たとえば、ｎｕｈ＿ｌａｙｅｒ＿ｉｄ）を有する特定の非ベースレイヤ（たとえば、非ゼロのレイヤＩＤ値または０よりも大きいレイヤＩＤを有する）に対してすでにアクティブでなく、ＳＰＳＲＢＳＰがピクチャパラメータセット（ＰＰＳ）ＲＢＳＰの中で参照されるとき、ＳＰＳＲＢＳＰは、特定の非ベースレイヤに対してアクティベートされる。このＳＰＳは、それが特定の非ベースレイヤに対する別のＳＰＳＲＢＳＰのアクティベーションによってデアクティベートされるまで、特定の非ベースレイヤに対してアクティブなＳＰＳＲＢＳＰとして参照されてよい。

パラメータセットのアクティベーション

[00179]上記で説明したように、いくつかのコーディングスキームでは、レイヤ初期化ピクチャ（「ＬＩＰピクチャ」）は、（１）１に設定されたＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇフラグ（たとえば、ＲＡＳＬピクチャが出力されるべきかどうかを示すフラグ）を有するＩＲＡＰピクチャであるピクチャ、または（２）ベースレイヤのピクチャ（たとえば、０としてのレイヤＩＤまたはビットストリームの中で定義される最小のレイヤＩＤを有するピクチャ）が１に設定されたＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するＩＲＡＰアクセスユニットである初期ＩＲＡＰアクセスユニットが含まれるピクチャとして定義される。

[00180]いくつかの実施形態では、ＳＰＳは、各ＬＩＰピクチャにおいてアクティベートされ得る。たとえば、１に設定されたＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇフラグを有する各ＩＲＡＰピクチャ、または初期ＩＲＡＰアクセスユニットの中に含まれる各ピクチャは、新しいＳＰＳをアクティベートさせることができ、新しいＳＰＳは、前にアクティベートされた（たとえば、ピクチャサイズなどの異なるパラメータを有する）ＳＰＳと同じであってよく、異なってもよい。さらに、ＳＰＳがアクティベートされた後、同じＳＰＳのさらなるインスタンスが、ビットストリームの中で提供されてよい。ＳＰＳのそのような反復インスタンス（または、反復ＳＰＳ）は、前に提供されたＳＰＳが失われ、またはビットストリームから落とされた場合、バックアップＳＰＳとして働くことによって誤り耐性を改善し得る。

ビットストリームの中で反復ＳＰＳを提供するための例示的なフローチャート

[00181]図６は、本開示の一実施形態による、ビデオ情報をコーディングするための方法６００を示すフローチャートである。図６に示すステップは、符号化器（たとえば、図２Ａまたは図２Ｂに示すビデオ符号化器）、復号器（たとえば、図３Ａまたは図３Ｂに示すビデオ復号器）、または任意の他の構成要素によって実行され得る。便宜上、方法６００について、符号化器、復号器、または別の構成要素であり得る、コーダによって実行されるものとして説明する。

[00182]方法６００は、ブロック６０１において開始する。ブロック６０５において、コーダは、そのＳＰＳが第１のビデオレイヤおよび第２のビデオレイヤに対してアクティベートされ得るというインジケーションを有するシーケンスパラメータセット（ＳＰＳ）を、ビットストリームの中で提供する。たとえば、第１のビデオレイヤはベースレイヤであってよく、第２のビデオレイヤはエンハンスメントレイヤであってよい。第２のビデオレイヤは、第１のビデオレイヤと異なるレイヤＩＤを有する任意のレイヤであってよい。ＳＰＳは、ビットストリームの中で、レイヤＩＤとＳＰＳＩＤとを有するＳＰＳＮＡＬユニットの形態で提供され得る。たとえば、ＳＰＳＮＡＬユニットは、ＳＰＳが第１および第２のビデオレイヤの両方に対してアクティベートされ得ることを示すレイヤＩＤを有してよい。いくつかの実施形態では、ＳＰＳのレイヤＩＤが０としての値を有する場合、ＳＰＳは、「０」としての値以上のレイヤＩＤを有する任意のレイヤに対してアクティベートされ得る。たとえば、ベースレイヤが０としてのレイヤＩＤを有しエンハンスメントレイヤが１としてのレイヤＩＤを有する場合では、ＳＰＳのレイヤＩＤが０としての値を有する場合、ＳＰＳは、ベースレイヤとエンハンスメントレイヤの両方によってアクティベートされ得る。

[00183]ブロック６１０において、コーダは、そのＳＰＳが第２のビデオレイヤに対してアクティベートされ得るが第１のビデオレイヤに対してアクティベートされないというインジケーションを有する同じＳＰＳ（たとえば、前に提供されたＳＰＳＮＡＬユニットと同じＳＰＳＩＤを有するＳＰＳＮＡＬユニットである反復ＳＰＳ）を、ビットストリームの中で提供する。たとえば、反復ＳＰＳＮＡＬユニットは、前に提供されたＳＰＳＮＡＬユニットと異なるレイヤＩＤを有してよい。ベースレイヤが０としてのレイヤＩＤを有しエンハンスメントレイヤが１としてのレイヤＩＤを有する場合では、反復ＳＰＳのレイヤＩＤが１としての値を有する場合、反復ＳＰＳは、エンハンスメントレイヤ（たとえば、１としてのレイヤＩＤ値を有する）によってアクティベートされ得るが、ベースレイヤ（たとえば、０としてのレイヤＩＤ値を有する）によってアクティベートされ得ない。前に提供されたＳＰＳと同じＳＰＳＩＤを有するが異なるレイヤＩＤを有する反復ＳＰＳを提供することは、１つまたは複数の下位レイヤ（たとえば、ベースレイヤ）のすべてのＶＣＬＮＡＬユニットが提供された後、反復ＳＰＳがビットストリームの中で提供される場合、有用であり得る。１つまたは複数の下位レイヤに対して反復ＳＰＳがアクティベートされるべきでないことを示すレイヤＩＤを有する反復ＳＰＳを提供することによって、１つまたは複数の下位レイヤがビットストリームから抽出されるとき、その結果得られる抽出されたビットストリームは反復ＳＰＳを含まないことになり、すべてのＶＣＬＮＡＬユニットが反復ＳＰＳの前に提供されたので、反復ＳＰＳは下位レイヤにとって必要とされない。方法６００は、６１５において終了する。

[00184]上記で説明したように、図２Ａのビデオ符号化器２０、図２Ｂのビデオ符号化器２３、図３Ａのビデオ復号器３０、または図３Ｂのビデオ復号器３３（たとえば、レイヤ間予測ユニット１２８および／またはレイヤ間予測ユニット１６６）のうちの１つまたは複数の構成要素は、ＳＰＳが第１のビデオレイヤおよび第２のビデオレイヤに対してアクティベートされ得るというインジケーションを有するシーケンスパラメータセット（ＳＰＳ）をビットストリームの中で提供すること、およびＳＰＳが第２のビデオレイヤに対してアクティベートされ得るが第１のビデオレイヤに対してアクティベートされ得ないというインジケーションを有する同じＳＰＳをビットストリームの中で提供することなどの、本開示で説明する技法のいずれかを実施するために使用され得る。

[00185]方法６００では、図６に示すブロックのうちの１つまたは複数は削除される（たとえば、実行されない）ことがあり、および／または方法が実行される順序は入れ替えられることがある。いくつかの実施形態では、さらなるブロックが方法６００に追加されてよい。方法６００はＳＰＳを参照しながら説明されたが、方法６００に関して説明された技法がＶＰＳ、ＰＰＳ、およびスライスヘッダなどの他のパラメータセットに拡張および適用され得ることが理解されるべきである。したがって、本開示の実施形態は、図６に示す例に限定されず、または図６に示す例によって限定されず、他の変形が本開示の趣旨から逸脱することなく実施され得る。

反復ＳＰＳに関するビットストリーム制約

[00186]いくつかの実施形態では、ＳＰＳＮＡＬユニット（たとえば、反復ＳＰＳ）が、前にシグナリングされたＳＰＳと同じＳＰＳＩＤ値（たとえば、ｓｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ）を含むとき、反復ＳＰＳがアクティブなＳＰＳが依然としてアクティブなままであることをそれに対して必要とされる最後のコード化ピクチャに追従するとともに、同じＳＰＳＩＤ値（たとえば、ｓｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ）を有するＳＰＳをアクティベートさせる第１のＮＡＬユニットに先行しない限り、反復ＳＰＳＮＡＬユニットのＳＰＳＲＢＳＰは前にシグナリングされたＳＰＳＮＡＬユニットのコンテンツと同じコンテンツを有するべきであることを、ビットストリーム制約は規定し得る。

例示的な実装形態＃１

[00187]以下に記載される実施形態では、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値は、すべてのＶＣＬＮＡＬユニットのスライスセグメントヘッダの中でシグナリングされる。本明細書で説明される方法のうちの１つまたは複数を実施するために組み込まれ得る追加と削除とを示すために、ＨＥＶＣ規格のいくつかの部分が転載されるとき、そのような修正は、それぞれ《イタリック体》および取り消し線で示される（《》内はイタリック体であり、下線は、取り消し線を示す）。

スライスセグメントヘッダシンタックス

[00188]以下の例示的なシンタックスは、本明細書で説明される実施形態のうちの１つまたは複数を実施するために使用され得る。ＨＥＶＣ規格における既存の言葉への追加は、《イタリック体》で示される（《》内はイタリック体である）。

スライスセグメントヘッダセマンティクス
[00189]以下の例示的なセマンティクスは、本明細書で説明される実施形態のうちの１つまたは複数を実施するために使用され得る。ＨＥＶＣ規格における既存の言葉への追加およびそこからの削除は、それぞれ、《イタリック体》および取り消し線で示される（《》内はイタリック体であり、下線は、取り消し線を示す）。
ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇは、付属書類Ｃにおいて規定されるようなビットストリームの中の第１のピクチャ《アクセスユニットの中に含まれ》ないＩＤＲまたは《、》ＢＬＡピクチャ、《またはＬＩＰ》の復号の後の、復号ピクチャバッファの中の前に復号されたピクチャの出力に影響を及ぼす（《》内はイタリック体であり、下線は、取り消し線を示す）。

[00190]一実施形態では、ｂａｓｅ＿ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇは、ＩＲＡＰでないＢＬピクチャに対して、それがＬＩＰピクチャであることを可能にするようにシグナリングされ得る。
《ｂａｓｅ＿ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇは、付属書類Ｃにおいて規定されるようなビットストリームの中の第１のアクセスユニットの中に含まれないレイヤ初期化ピクチャの復号の後の、復号ピクチャバッファの中の前に復号されたピクチャの出力に影響を及ぼす。》（《》内はイタリック体である）存在するとき、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇはｂａｓｅ＿ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定される。

[00191]別の実施形態では、ｂａｓｅ＿ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇはシグナリングされない。

アクティベーションプロセスへの変更

[00192]現在のＨＥＶＣ規格におけるアクティベーションプロセス（たとえば、セクションＦ．７．４．２．４．２）は以下に示すように修正され、プロセスの残部は同じである。ＨＥＶＣ規格における既存の言葉への追加は、《イタリック体》で示される（《》内はイタリック体である）。
アクティブなレイヤのＳＰＳＲＢＳＰに対してｓｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄとしての値を含むいかなるＳＰＳＮＡＬユニットも、それがアクティブなレイヤのＳＰＳがアクティブであることをそれに対して必要とされる最後のコード化ピクチャに追従するとともに、ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄとしての同じ値のＳＰＳをアクティベートさせる第１のＮＡＬユニットに先行しない限り、アクティブなレイヤの《ＳＰＳＲＢＳＰの》コンテンツと同じＳＰＳＲＢＳＰのコンテンツを有していなければならない（《》内はイタリック体である）。

[00193]いくつかの実施形態では、類似の制約が、ビデオパラメータセット（ＶＰＳ）およびピクチャパラメータセット（ＰＰＳ）などの他のパラメータセットに追加されることがある。

ピクチャのＤＰＢからの除去への変更

[00194]以下の例示的なテキストは、本明細書で説明される実施形態のうちの１つまたは複数を実施するために使用され得る。ＨＥＶＣ規格における既存の言葉への追加およびそこからの削除は、それぞれ、《イタリック体》および取り消し線で示される（《》内はイタリック体であり、下線は、取り消し線を示す）。

Ｃ．３．２ピクチャのＤＰＢからの除去
現在のピクチャの復号の前の（ただし、現在のピクチャの第１のスライスのスライスヘッダをパースした後の）、ピクチャのＤＰＢからの除去は、アクセスユニットｎ（現在のピクチャを含む）の第１の復号ユニットのＣＰＢ除去時間において瞬時に起こり、次のように進む。
− サブクローズ８．３．２で規定されるようなＲＰＳのための復号プロセスが呼び出される。
− 現在のピクチャが１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するＩＲＡＰピクチャ《ＬＩＰ（または、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有し、０に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＩＲＡＰピクチャ）がピクチャ０でない》とき、以下の順序付けられたステップが適用される（《》内はイタリック体であり、下線は、取り消し線を示す）。
１．変数ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが、テスト対象の復号器に対して次のように導出される。
− 現在のピクチャがＣＲＡピクチャである場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは１に等しく設定される（ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず）。
− そうでない場合、《現在のピクチャの》アクティブなＳＰＳから導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値が、《現在のピクチャと同じレイヤＩＤを有する》先行するピクチャに対してアクティブなＳＰＳからそれぞれ導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値と異なる場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず、テスト対象の復号器によって１に設定されてよい（ただし、設定されるべきでない）（《》内はイタリック体である）。
注− これらの条件下ではＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇをｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定することが好ましいが、テスト対象の復号器は、この場合にはＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇを１に設定することが許容される。
− そうでない場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定される。
２．ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値が１に等しいとき、ＤＰＢの中に《あり》、《現在のピクチャのそれと同じｎｕｈ＿ｌａｙｅｒ＿ｉｄとしての値を有するピクチャを含む》すべてのピクチャ記憶バッファが、それらが含んでいるピクチャを出力することなく空にされるように、テスト対象の復号器に対して導出されるＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値がＨＲＤに対して適用され、ＤＰＢフルネスは０に等しく設定《除去されたピクチャの数だけデクリメントされる》（《》内はイタリック体であり、下線は、取り消し線を示す）。
− 以下の条件の両方がＤＰＢの中の任意のピクチャｋに対して真であるとき、ＤＰＢの中のすべてのそのようなピクチャｋはＤＰＢから除去される。
− ピクチャｋが、「参照用に使用されない」としてマークされている。
− ピクチャｋが、０に等しいＰｉｃＯｕｔｐｕｔＦｌａｇを有するか、またはそれのＤＰＢ出力時間が現在のピクチャｎの第１の復号ユニット（復号ユニットｍとして示す）のＣＰＢ除去時間以下である、すなわち、ＤｐｂＯｕｔｐｕｔＴｉｍｅ［ｋ］がＣｐｂＲｅｍｏｖａｌＴｉｍｅ（ｍ）以下である。
− ＤＰＢから除去される各ピクチャに対して、ＤＰＢフルネスは１だけデクリメントされる。

ピクチャのＤＰＢからの出力および除去への変更

[00195]以下の例示的なテキストは、本明細書で説明される実施形態のうちの１つまたは複数を実施するために使用され得る。ＨＥＶＣ規格における既存の言葉への追加およびそこからの削除は、それぞれ、《イタリック体》および取り消し線で示される（《》内はイタリック体であり、下線は、取り消し線を示す）。

Ｆ．１３．５．２．２ピクチャのＤＰＢからの出力および除去
現在のピクチャの復号の前の（ただし、現在のピクチャの第１のスライスのスライスヘッダをパースした後の）ＤＰＢからのピクチャの出力および削除は、現在のピクチャの第１の復号ユニットがＣＰＢから削除された時に瞬時に起こり、次のように進む。
サブクローズＦ．８．３．２で規定されるようなＲＰＳのための復号プロセスが呼び出される。
− 現在のピクチャが１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有し、０に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＩＲＡＰピクチャピクチャ０でない《ＬＩＰ（または、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有し、０に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＩＲＡＰ）》である場合、以下の順序付けられたステップが適用される（《》内はイタリック体であり、下線は、取り消し線を示す）。
１．変数ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが、テスト対象の復号器に対して次のように導出される。
− 現在のピクチャがＣＲＡピクチャである場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは（ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず）１に等しく設定される。
− そうでない場合、《現在のピクチャの》アクティブなＳＰＳから導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値が、《現在のピクチャと同じレイヤＩＤを有する》先行するピクチャに対してアクティブなＳＰＳからそれぞれ導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値と異なる場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず、テスト対象の復号器によって１に設定されてよい（ただし、設定されるべきでない）（《》内はイタリック体である）。
注− これらの条件下ではＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇをｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定することが好ましいが、テスト対象の復号器は、この場合にはＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇを１に設定することが許容される。
− そうでない場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定される。
２．テスト対象の復号器に対して導出されるＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値が次のようにＨＲＤに対して適用される。
− ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが１に等しい場合、ＤＰＢの中に《あり、現在のピクチャのそれと同じｎｕｈ＿ｌａｙｅｒ＿ｉｄとしての値を有するピクチャを含む》すべてのピクチャ記憶バッファは、それらが含んでいるピクチャを出力することなく空にされ、ＤＰＢフルネスは、０に等しく設定《除去されたピクチャの数だけデクリメントされる》（《》内はイタリック体であり、下線は、取り消し線を示す）。
− そうでない場合（ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが０に等しい）、「出力用に必要とされない」および「参照用に使用されない」としてマークされているピクチャを含むすべてのピクチャ記憶バッファは空にされ（出力せずに）、ＤＰＢの中のすべての空でないピクチャ記憶バッファは、サブクローズＦ．１３．５．２．４で規定される「バンピング」プロセスを繰り返し呼び出すことによって空にされ、ＤＰＢフルネスは０に等しく設定される。
− そうでない場合（現在のピクチャが、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するか、または０に等しくないｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＩＲＡＰピクチャでない）、「出力用に必要とされない」および「参照用に使用されない」としてマークされているピクチャを含むすべてのピクチャ記憶バッファは空にされる（出力せずに）。空にされた各ピクチャ記憶バッファに対して、ＤＰＢフルネスは１だけデクリメントされる。変数ｃｕｒｒＬａｙｅｒＩｄは現在の復号ピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄに等しく設定され、以下の条件のうちの１つまたは複数が真であるとき、空にされた各追加のピクチャ記憶バッファに対してＤＰＢフルネスを１だけさらにデクリメントしながら、以下の条件のいずれも真でなくなるまでサブクローズＦ．１３．５．２．４で規定される「バンピング」プロセスが繰り返し呼び出される。
− 「出力用に必要とされる」としてマークされているＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャの数は、アクティブなＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しくないとき）ｓｐｓ＿ｍａｘ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ＨｉｇｈｅｓｔＴｉｄ］よりも大きい。
− アクティブなＳＰＳ（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳのｓｐｓ＿ｍａｘ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］は０に等しくなく、それに対して関連した変数ＰｉｃＬａｔｅｎｃｙＣｏｕｎｔ［ｃｕｒｒＬａｙｅｒＩｄ］が、アクティブなＳＰＳから（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳから導出されるＳｐｓＭａｘＬａｔｅｎｃｙＰｉｃｔｕｒｅｓ［ＨｉｇｈｅｓｔＴｉｄ］以上である「出力用に必要とされる」としてマークされているＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する少なくとも１つのピクチャが存在する。
− ＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャの数は、アクティブなＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳからのｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］＋１以上である。

例示的な実装形態＃２

[00196]以下に記載される実施形態では、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇはＩＲＡＰピクチャのみに対してシグナリングされ、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するすべてのＩＲＡＰピクチャに対して導出され、ＬＩＰピクチャであるすべての非ＩＲＡＰピクチャに対してＮｏＣｌＲａｓＯｕｔｐｕｔＦｌａｇとしての値に基づいて推定される。

ピクチャのＤＰＢからの除去への変更

[00197]以下の例示的なテキストは、本明細書で説明される実施形態のうちの１つまたは複数を実施するために使用され得る。ＨＥＶＣ規格における既存の言葉への追加およびそこからの削除は、それぞれ、《イタリック体》および取り消し線で示される（《》内はイタリック体であり、下線は、取り消し線を示す）。

Ｃ．３．２ピクチャのＤＰＢからの除去
現在のピクチャの復号の前の（ただし、現在のピクチャの第１のスライスのスライスヘッダをパースした後の）、ピクチャのＤＰＢからの除去は、アクセスユニットｎ（現在のピクチャを含む）の第１の復号ユニットのＣＰＢ除去時間において瞬時に起こり、次のように進む。
− サブクローズ８．３．２で規定されるようなＲＰＳのための復号プロセスが呼び出される。
− 現在のピクチャが１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するＩＲＡＰピクチャピクチャ０でない《ＬＩＰ（または、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有し、０に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＩＲＡＰピクチャ）》であるとき、以下の順序付けられたステップが適用される（《》内はイタリック体であり、下線は、取り消し線を示す）。
１．変数ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが、テスト対象の復号器に対して次のように導出される。
− 現在のピクチャが《１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有する》ＣＲＡピクチャである場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは１に等しく設定される（ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず）。
− そうでない場合、《現在のピクチャの》アクティブなＳＰＳから導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値が、《現在のピクチャと同じレイヤＩＤを有する》先行するピクチャに対してアクティブなＳＰＳからそれぞれ導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値と異なる場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず、テスト対象の復号器によって１に設定されてよい（ただし、設定されるべきでない）（《》内はイタリック体である）。
注− これらの条件下ではＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇをｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定することが好ましいが、テスト対象の復号器は、この場合にはＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇを１に設定することが許容される。
− そうでない場合、《現在のピクチャがＩＲＡＰピクチャである場合》、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇはｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定される（《》内はイタリック体である）。
− 《そうでない場合、現在のピクチャ（ＬＩＰである）がＩＲＡＰピクチャでなく現在のアクセスユニットの中の０に等しいＩＲＡＰピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄに関連付けられたＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇが１に等しい場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは１に等しく設定される。
− そうでない場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、０に等しく設定される。》（《》内はイタリック体である）
２．ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値が１に等しいとき、ＤＰＢの中に《あり、現在のピクチャのそれと同じｎｕｈ＿ｌａｙｅｒ＿ｉｄとしての値を有するピクチャを含む》すべてのピクチャ記憶バッファが、それらが含んでいるピクチャを出力することなく空にされるように、テスト対象の復号器に対して導出されるＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値がＨＲＤに対して適用され、ＤＰＢフルネスは、０に等しく設定《除去されたピクチャの数だけデクリメントされる》（《》内はイタリック体であり、下線は、取り消し線を示す）。
− 以下の条件の両方がＤＰＢの中の任意のピクチャｋに対して真であるとき、ＤＰＢの中のすべてのそのようなピクチャｋはＤＰＢから除去される。
− ピクチャｋが、「参照用に使用されない」としてマークされている。
− ピクチャｋが、０に等しいＰｉｃＯｕｔｐｕｔＦｌａｇを有するか、またはそれのＤＰＢ出力時間が現在のピクチャｎの第１の復号ユニット（復号ユニットｍとして示す）のＣＰＢ除去時間以下である、すなわち、ＤｐｂＯｕｔｐｕｔＴｉｍｅ［ｋ］がＣｐｂＲｅｍｏｖａｌＴｉｍｅ（ｍ）以下である。
− ＤＰＢから除去される各ピクチャに対して、ＤＰＢフルネスは１だけデクリメントされる。

ピクチャのＤＰＢからの出力および除去への変更

[00198]以下の例示的なテキストは、本明細書で説明される実施形態のうちの１つまたは複数を実施するために使用され得る。ＨＥＶＣ規格における既存の言葉への追加およびそこからの削除は、それぞれ、《イタリック体》および取り消し線で示される（《》内はイタリック体であり、下線は、取り消し線を示す）。

Ｆ．１３．５．２．２ピクチャのＤＰＢからの出力および除去
現在のピクチャの復号の前の（ただし、現在のピクチャの第１のスライスのスライスヘッダをパースした後の）ＤＰＢからのピクチャの出力および削除は、現在のピクチャの第１の復号ユニットがＣＰＢから削除された時に瞬時に起こり、次のように進む。
サブクローズＦ．８．３．２で規定されるようなＲＰＳのための復号プロセスが呼び出される。
− 現在のピクチャが１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するＩＲＡＰピクチャピクチャ０でない《ＬＩＰ（または、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有し、０に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＩＲＡＰピクチャ）》である場合、以下の順序付けられたステップが適用される（《》内はイタリック体であり、下線は、取り消し線を示す）。
１．変数ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが、テスト対象の復号器に対して次のように導出される。
− 現在のピクチャがＣＲＡピクチャである場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは（ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず）１に等しく設定される。
− そうでない場合、《現在のピクチャの》アクティブなＳＰＳから導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値が、《現在のピクチャと同じレイヤＩＤを有する》先行するピクチャに対してアクティブなＳＰＳからそれぞれ導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値と異なる場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず、テスト対象の復号器によって１に設定されてよい（ただし、設定されるべきでない）（《》内はイタリック体である）。
注− これらの条件下ではＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇをｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定することが好ましいが、テスト対象の復号器は、この場合にはＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇを１に設定することが許容される。
− そうでない場合、《現在のピクチャがＩＲＡＰピクチャである場合》、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇはｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定される（《》内はイタリック体である）。
− そうでない場合、《現在のピクチャ（ＬＩＰである）がＩＲＡＰピクチャでなく現在のアクセスユニットの中の０に等しいＩＲＡＰピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄに関連付けられたＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇが１に等しい場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは１に等しく設定される。
− 《そうでない場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、０に等しく設定される。》（《》内はイタリック体である）
２．テスト対象の復号器に対して導出されるＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値が次のようにＨＲＤに対して適用される。
− ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが１に等しい場合、ＤＰＢの中に《あり、現在のピクチャのそれに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャを含む》すべてのピクチャ記憶バッファはそれらが含んでいるピクチャを出力することなく空にされ、ＤＰＢフルネスは０に等しく設定《除去されたピクチャの数だけデクリメントされる》（《》内はイタリック体であり、下線は、取り消し線を示す）。
− そうでない場合（ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが０に等しい）、「出力用に必要とされない」および「参照用に使用されない」としてマークされているピクチャを含むすべてのピクチャ記憶バッファは空にされ（出力せずに）、ＤＰＢの中のすべての空でないピクチャ記憶バッファは、サブクローズＦ．１３．５．２．４で規定される「バンピング」プロセスを繰り返し呼び出すことによって空にされ、ＤＰＢフルネスは０に等しく設定される。
− そうでない場合（現在のピクチャが、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するか、または０に等しくないｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＩＲＡＰピクチャでない）、「出力用に必要とされない」および「参照用に使用されない」としてマークされているピクチャを含むすべてのピクチャ記憶バッファは空にされる（出力せずに）。空にされた各ピクチャ記憶バッファに対して、ＤＰＢフルネスは１だけデクリメントされる。変数ｃｕｒｒＬａｙｅｒＩｄは現在の復号ピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄに等しく設定され、以下の条件のうちの１つまたは複数が真であるとき、空にされた各追加のピクチャ記憶バッファに対してＤＰＢフルネスを１だけさらにデクリメントしながら、以下の条件のいずれも真でなくなるまでサブクローズＦ．１３．５．２．４で規定される「バンピング」プロセスが繰り返し呼び出される。
− 「出力用に必要とされる」としてマークされているＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャの数は、アクティブなＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しくないとき）ｓｐｓ＿ｍａｘ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ＨｉｇｈｅｓｔＴｉｄ］よりも大きい。
− アクティブなＳＰＳ（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳのｓｐｓ＿ｍａｘ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］は０に等しくなく、それに対して関連した変数ＰｉｃＬａｔｅｎｃｙＣｏｕｎｔ［ｃｕｒｒＬａｙｅｒＩｄ］が、アクティブなＳＰＳから（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳから導出されるＳｐｓＭａｘＬａｔｅｎｃｙＰｉｃｔｕｒｅｓ［ＨｉｇｈｅｓｔＴｉｄ］以上である「出力用に必要とされる」としてマークされているＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する少なくとも１つのピクチャが存在する。
− ＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャの数は、アクティブなＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳからのｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］＋１以上である。

[00199]いくつかの実施形態では、出力タイミング適合と出力順序適合の両方において、現在のピクチャがＩＲＡＰピクチャでないＬＩＰピクチャであるとき、またＩＲＡＰピクチャであり、「０」としての値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有し、現在のアクセスユニットの中にある別のピクチャに関連付けられたＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇが「１」としての値に等しいとき、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、「０」としての値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する現在のＡＵの中のＩＲＡＰピクチャのＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇに等しく設定される。

例示的な実装形態＃３

[00200]以下に記載される実施形態では、「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有する非ＢＬＩＲＡＰピクチャを復号する時間におけるピクチャのフラッシングは、レイヤ特有の方式で実行されるように規定される。「１」としての値に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するＢＬＩＲＡＰピクチャを復号する時間においてフラッシングが行われるとき、フラッシング動作は、すべてのレイヤにわたって実行されるように規定される。たとえば、すべてのフラッシングは、非ベースレイヤ（たとえば、エンハンスメントレイヤ）に対してレイヤ特有であるが、ベースレイヤに関して実行されるフラッシング動作は非ベースレイヤの中のピクチャをフラッシングしてよい。

ピクチャのＤＰＢからの除去への変更

[00201]以下の例示的なテキストは、本明細書で説明される実施形態のうちの１つまたは複数を実施するために使用され得る。ＨＥＶＣ規格における既存の言葉への追加およびそこからの削除は、それぞれ、《イタリック体》および取り消し線で示される（《》内はイタリック体であり、下線は、取り消し線を示す）。

Ｃ．３．２ピクチャのＤＰＢからの除去
現在のピクチャの復号の前の（ただし、現在のピクチャの第１のスライスのスライスヘッダをパースした後の）、ピクチャのＤＰＢからの除去は、アクセスユニットｎ（現在のピクチャを含む）の第１の復号ユニットのＣＰＢ除去時間において瞬時に起こり、次のように進む。
− サブクローズ８．３．２で規定されるようなＲＰＳのための復号プロセスが呼び出される。
− 現在のピクチャが、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有し、《０に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有し、ピクチャ０でないＩＲＡＰピクチャであるとき、または１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有し、０に等しくないｎｕｈ＿ｌａｙｅｒ＿ｉｄを有し、初期ＩＲＡＰＡＵに属さないＩＲＡＰピクチャである》とき、以下の順序付けられたステップが適用される（《》内はイタリック体である）。
１．変数ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが、テスト対象の復号器に対して次のように導出される。
− 現在のピクチャが、《０に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する》ＣＲＡピクチャである場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは１に等しく設定される（ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず）（《》内はイタリック体である）。
− そうでない場合、《現在のピクチャの》アクティブなＳＰＳから導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値が、《現在のピクチャと同じレイヤＩＤを有する》先行するピクチャに対してアクティブなＳＰＳからそれぞれ導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値と異なる場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず、テスト対象の復号器によって１に設定されてよい（ただし、設定されるべきでない）（《》内はイタリック体である）。
注− これらの条件下ではＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇをｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定することが好ましいが、テスト対象の復号器は、この場合にはＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇを１に設定することが許容される。
− 他の場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇはｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定される。
１．テスト対象の復号器に対して導出されるＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値が《次のように》ＨＲＤに対して適用される。その結果として、（《》内はイタリック体であり、下線は、取り消し線を示す）
− ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値が１に等しく《現在のピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄが０に等しい場合》とき、ＤＰＢの中のすべてのピクチャ記憶バッファはそれらが含んでいるピクチャを出力することなく空にされ、ＤＰＢフルネスは０に等しく設定される（《》内はイタリック体であり、下線は、取り消し線を示す）。
− 《そうでない場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが１に等しく現在のピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄが０に等しくない場合、ＤＰＢの中にあり、現在のピクチャのそれに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャを含むすべてのピクチャ記憶バッファが空にされ、ＤＰＢフルネスは除去されたピクチャの数だけデクリメントされる。》（《》内はイタリック体である）
− 以下の条件の両方がＤＰＢの中の任意のピクチャｋに対して真であるとき、ＤＰＢの中のすべてのそのようなピクチャｋはＤＰＢから除去される。
− ピクチャｋが、「参照用に使用されない」としてマークされている。
− ピクチャｋが、０に等しいＰｉｃＯｕｔｐｕｔＦｌａｇを有するか、またはそれのＤＰＢ出力時間が現在のピクチャｎの第１の復号ユニット（復号ユニットｍとして示す）のＣＰＢ除去時間以下である、すなわち、ＤｐｂＯｕｔｐｕｔＴｉｍｅ［ｋ］がＣｐｂＲｅｍｏｖａｌＴｉｍｅ（ｍ）以下である。
− ＤＰＢから除去される各ピクチャに対して、ＤＰＢフルネスは１だけデクリメントされる。

ピクチャのＤＰＢからの出力および除去への変更

[00202]以下の例示的なテキストは、本明細書で説明される実施形態のうちの１つまたは複数を実施するために使用され得る。ＨＥＶＣ規格における既存の言葉への追加およびそこからの削除は、それぞれ、《イタリック体》および取り消し線で示される（《》内はイタリック体であり、下線は、取り消し線を示す）。
Ｆ．１３．５．２．２ピクチャのＤＰＢからの出力および除去
現在のピクチャの復号の前の（ただし、現在のピクチャの第１のスライスのスライスヘッダをパースした後の）ＤＰＢからのピクチャの出力および削除は、現在のピクチャの第１の復号ユニットがＣＰＢから削除された時に瞬時に起こり、次のように進む。
サブクローズＦ．８．３．２で規定されるようなＲＰＳのための復号プロセスが呼び出される。
− 現在のピクチャが、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有し、０に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有し、ピクチャ０でないＩＲＡＰピクチャである場合、《または１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有し、０に等しくないｎｕｈ＿ｌａｙｅｒ＿ｉｄを有し、初期ＩＲＡＰＡＵに属さないＩＲＡＰピクチャ》である場合、以下の順序付けられたステップが適用される（《》内はイタリック体である）。
１．変数ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが、テスト対象の復号器に対して次のように導出される。
− 現在のピクチャが、０に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＣＲＡピクチャである場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは１に等しく設定される（ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず）。
− そうでない場合、《現在のピクチャの》アクティブなＳＰＳから導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値が、《現在のピクチャと同じレイヤＩＤを有する》先行するピクチャに対してアクティブなＳＰＳからそれぞれ導出されるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、またはｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］の値と異なる場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇの値にかかわらず、テスト対象の復号器によって１に設定されてよい（ただし、設定されるべきでない）（《》内はイタリック体である）。
注− これらの条件下ではＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇをｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定することが好ましいが、テスト対象の復号器は、この場合にはＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇを１に設定することが許容される。
− 他の場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇはｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇに等しく設定される。
２．テスト対象の復号器に対して導出されるＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇの値が次のようにＨＲＤに対して適用される。
− ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが１に等しく《現在のピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄが０に等しい》場合、ＤＰＢの中のすべてのピクチャ記憶バッファはそれらが含んでいるピクチャを出力することなく空にされ、ＤＰＢフルネスは０に等しく設定される（《》内はイタリック体である）。
− 《そうでない場合、ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが１に等しく現在のピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄが０に等しくない場合、ＤＰＢの中にあり、現在のピクチャのそれに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャを含むすべてのピクチャ記憶バッファが空にされ、ＤＰＢフルネスは除去されたピクチャの数だけデクリメントされる。》（《》内はイタリック体である）
− そうでない場合（ＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇが０に等しい）、「出力用に必要とされない」および「参照用に使用されない」としてマークされているピクチャを含むすべてのピクチャ記憶バッファは空にされ（出力せずに）、ＤＰＢの中のすべての空でないピクチャ記憶バッファは、サブクローズＦ．１３．５．２．４で規定される「バンピング」プロセスを繰り返し呼び出すことによって空にされ、ＤＰＢフルネスは０に等しく設定される。
− そうでない場合（現在のピクチャが、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有するか、または０に等しくないｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＩＲＡＰピクチャでない）、「出力用に必要とされない」および「参照用に使用されない」としてマークされているピクチャを含むすべてのピクチャ記憶バッファは空にされる（出力せずに）。空にされた各ピクチャ記憶バッファに対して、ＤＰＢフルネスは１だけデクリメントされる。変数ｃｕｒｒＬａｙｅｒＩｄは現在の復号ピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄに等しく設定され、以下の条件のうちの１つまたは複数が真であるとき、空にされた各追加のピクチャ記憶バッファに対してＤＰＢフルネスを１だけさらにデクリメントしながら、以下の条件のいずれも真でなくなるまでサブクローズＦ．１３．５．２．４で規定される「バンピング」プロセスが繰り返し呼び出される。
− 「出力用に必要とされる」としてマークされているＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャの数は、アクティブなＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しくないとき）ｓｐｓ＿ｍａｘ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ＨｉｇｈｅｓｔＴｉｄ］よりも大きい。
− アクティブなＳＰＳ（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳのｓｐｓ＿ｍａｘ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］は０に等しくなく、それに対して関連した変数ＰｉｃＬａｔｅｎｃｙＣｏｕｎｔ［ｃｕｒｒＬａｙｅｒＩｄ］が、アクティブなＳＰＳから（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳから導出されるＳｐｓＭａｘＬａｔｅｎｃｙＰｉｃｔｕｒｅｓ［ＨｉｇｈｅｓｔＴｉｄ］以上である「出力用に必要とされる」としてマークされているＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する少なくとも１つのピクチャが存在する。
− ＤＰＢの中のｃｕｒｒＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャの数は、アクティブなＳＰＳからの（ｃｕｒｒＬａｙｅｒＩｄが０に等しいとき）またはｃｕｒｒＬａｙｅｒＩｄの値に対してアクティブなレイヤのＳＰＳからのｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］＋１以上である。

他の考慮事項

[00203]本明細書で開示された情報および信号は、多種多様な技術および技法のいずれかを使用して表され得る。たとえば、上記の説明全体にわたって参照され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁場もしくは磁性粒子、光場もしくは光学粒子、またはそれらの任意の組合せによって表され得る。

[00204]本明細書で開示された実施形態に関して記載された様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、または両方の組合せとして実装され得る。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的な構成要素、ブロック、モジュール、回路、およびステップが、概してそれらの機能に関して上記で説明されている。そのような機能性が、ハードウェアまたはソフトウェアのどちらとして実施されるのかは、特定の応用例と、システム全体に課せられる設計制約とに依存する。当業者は、特定の適用例ごとに様々な方法で記載された機能を実装し得るが、そのような実装の決定が、本発明の範囲からの逸脱を引き起こすと解釈されるべきではない。

[00205]本明細書に記載された技術は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せに実装され得る。そのような技法は、汎用コンピュータ、ワイヤレス通信デバイスハンドセット、またはワイヤレス通信デバイスハンドセットおよび他のデバイスにおける適用例を含む複数の用途を有する集積回路デバイスなどの、様々なデバイスのいずれかにおいて実装され得る。モジュールまたは構成要素として記載された任意の特徴は、集積論理デバイス内で一緒に、または個別であるが相互運用可能な論理デバイスとして別々に実装され得る。ソフトウェアに実装された場合、本技法は、実行されたとき、上記で説明された方法のうちの１つまたは複数を実行する命令を含むプログラムコードを備えるコンピュータ可読データ記憶媒体によって、少なくとも部分的に実現され得る。コンピュータ可読データ記憶媒体は、パッケージング材料を含むことがあるコンピュータプログラム製品の一部を形成し得る。コンピュータ可読媒体は、同期型ダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）などのランダムアクセスメモリ（ＲＡＭ）、読取り専用メモリ（ＲＯＭ）、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）、電気消去可能プログラマブル読取り専用メモリ（ＥＥＰＲＯＭ（登録商標））、フラッシュメモリ、磁気または光学データ記憶媒体などの、メモリまたはデータ記憶媒体を備え得る。本技法は、追加または代替として、伝搬信号または電波などの、命令またはデータ構造の形態でプログラムコードを搬送または伝達し、コンピュータによってアクセスされ、読み取られ、および／または実行され得るコンピュータ可読通信媒体によって、少なくとも部分的に実現され得る。

[00206]プログラムコードは、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）などの１つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルロジックアレイ（ＦＰＧＡ）、または他の等価の集積回路もしくはディスクリート論理回路を含み得るプロセッサによって実行され得る。そのようなプロセッサは、本開示に記載された技法のいずれかを実行するように構成され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサはまた、コンピューティングデバイスの組合せ、たとえば、ＤＳＰとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと連携する１つまたは複数のマイクロプロセッサ、あるいは任意の他のそのような構成として実装され得る。したがって、本明細書で使用する「プロセッサ」という用語は、上記の構造、上記の構造の任意の組合せ、または本明細書に記載された技法の実装に適した任意の他の構造もしくは装置のいずれかを指し得る。さらに、いくつかの態様では、本明細書に記載された機能は、符号化および復号のために構成された専用のソフトウェアモジュールもしくはハードウェアモジュール内に提供され得るか、または複合ビデオ符号化器／復号器（コーデック）に組み込まれ得る。また、本技法は、１つまたは複数の回路または論理要素で十分に実装され得る。

[00207]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）またはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置で実装され得る。様々なコンポーネント、モジュール、またはユニットは、開示されている技術を実行するように構成されたデバイスの機能的態様を強調するように本開示において説明されているが、異なるハードウェアユニットによる実現を必ずしも必要としない。むしろ、上記で説明したように、様々なユニットが、適切なソフトウェアおよび／またはファームウェアとともに、上記で説明した１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作可能なハードウェアユニットの集合によって与えられ得る。

[00208]本発明の様々な実施形態について説明した。これらおよび他の実施形態は、以下の特許請求の範囲内に入る。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
ビデオ情報をコーディングするように構成された装置であって、
ベースレイヤ（ＢＬ）およびエンハンスメントレイヤ（ＥＬ）に関連付けられたビデオ情報を記憶するように構成されたメモリユニット、前記ＢＬは、第１のアクセスユニットの中にＢＬピクチャを有し、前記ＥＬは、前記第１のアクセスユニットの中にＥＬピクチャを有し、前記ＢＬピクチャは、それに関連付けられたフラグを有する、と、
前記メモリユニットと通信しているプロセッサと
を備え、前記プロセッサは、
前記ＢＬピクチャに関連付けられた前記フラグの値を決定することと、
前記フラグの前記値に基づいて、（１）前記ＥＬピクチャがコーディングされる前に、復号ピクチャバッファ（ＤＰＢ）の中の１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去すること、または（２）前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを控えることのうちの１つを実行することと
を行うように構成される、装置。
［Ｃ２］
前記ＢＬピクチャに関連付けられた前記フラグは、前記第１のアクセスユニットが、２つのビットストリームが前記ＢＬと前記ＥＬとを備える単一のビットストリームへと互いに接合される接合ポイントの直後にくるかどうかを示す、
Ｃ１に記載の装置。
［Ｃ３］
前記プロセッサは、前記フラグの前記値が前記第１のアクセスユニットが接合ポイントの直後にくることを示すと決定することに基づいて、前記ＥＬピクチャがコーディングされる前に、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを行うようにさらに構成される、
Ｃ１に記載の装置。
［Ｃ４］
前記プロセッサは、前記フラグの前記値が前記第１のアクセスユニットが接合ポイントの直後にこないことを示すと決定することに基づいて、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを控えることを行うようにさらに構成される、
Ｃ１に記載の装置。
［Ｃ５］
前記ＥＬピクチャは、イントラランダムアクセスポイント（ＩＲＡＰ）ピクチャでない、
Ｃ１に記載の装置。
［Ｃ６］
前記第１のアクセスユニットは、初期ＩＲＡＰアクセスユニットである、
Ｃ１に記載の装置。
［Ｃ７］
前記ＢＬピクチャは、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有する、
Ｃ１に記載の装置。
［Ｃ８］
前記ＢＬピクチャに関連付けられた前記フラグは、ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇである、
Ｃ１に記載の装置。
［Ｃ９］
前記ＢＬピクチャは、ＩＲＡＰピクチャである、
Ｃ１に記載の装置。
［Ｃ１０］
前記ＢＬピクチャは、前記ビデオ情報に対して使用されるすべてのレイヤＩＤのうちの最小のレイヤＩＤに関連付けられる、
Ｃ１に記載の装置。
［Ｃ１１］
符号化器を備え、前記プロセッサは、ビットストリームの中の前記ビデオ情報を符号化することを行うようにさらに構成される、
Ｃ１に記載の装置。
［Ｃ１２］
復号器を備え、前記プロセッサは、ビットストリームの中の前記ビデオ情報を復号することを行うようにさらに構成される、
Ｃ１に記載の装置。
［Ｃ１３］
コンピュータ、ノートブック、ラップトップコンピュータ、タブレットコンピュータ、セットトップボックス、電話ハンドセット、スマートフォン、スマートパッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、および車載コンピュータのうちの１つまたは複数からなるグループの中から選択されたデバイスを備える、
Ｃ１に記載の装置。
［Ｃ１４］
ビデオ情報を符号化する方法であって、
第１のアクセスユニットの中のＢＬピクチャに関連付けられたフラグの値を決定することと、
前記フラグの前記値に基づいて、（１）前記第１のアクセスユニットの中のＥＬピクチャがコーディングされる前に、復号ピクチャバッファ（ＤＰＢ）の中の１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去すること、または（２）前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを控えることのうちの１つを実行することと
を備える、方法。
［Ｃ１５］
前記ＢＬピクチャに関連付けられた前記フラグは、前記第１のアクセスユニットが、２つのビットストリームが前記ＢＬと前記ＥＬとを備える単一のビットストリームへと互いに接合される接合ポイントの直後にくるかどうかを示す、
Ｃ１４に記載の方法。
［Ｃ１６］
（１）前記フラグの前記値が前記第１のアクセスユニットが接合ポイントの直後にくることを示すと決定することに基づいて、前記ＥＬピクチャがコーディングされる前に、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去すること、または（２）前記フラグの前記値が前記第１のアクセスユニットが接合ポイントの直後にこないことを示すと決定することに基づいて、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを控えることのうちの少なくとも１つを、さらに備える、
Ｃ１４に記載の方法。
［Ｃ１７］
前記ＥＬピクチャは、イントラランダムアクセスポイント（ＩＲＡＰ）ピクチャでない、
Ｃ１４に記載の方法。
［Ｃ１８］
前記第１のアクセスユニットは、初期ＩＲＡＰアクセスユニットである、
Ｃ１４に記載の方法。
［Ｃ１９］
前記ＢＬピクチャは、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有する、
Ｃ１４に記載の方法。
［Ｃ２０］
前記ＢＬピクチャに関連付けられた前記フラグは、ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇである、
Ｃ１４に記載の方法。
［Ｃ２１］
前記ＢＬピクチャは、ＩＲＡＰピクチャである、
Ｃ１４に記載の方法。
［Ｃ２２］
前記ＢＬピクチャは、前記ビデオ情報に対して使用されるすべてのレイヤＩＤのうちの最小のレイヤＩＤに関連付けられる、
Ｃ１４に記載の方法。
［Ｃ２３］
実行されたとき、装置に、
ベースレイヤ（ＢＬ）およびエンハンスメントレイヤ（ＥＬ）に関連付けられたビデオ情報を記憶することと、前記ＢＬは、第１のアクセスユニットの中にＢＬピクチャを有し、前記ＥＬは、前記第１のアクセスユニットの中にＥＬピクチャを有し、ここにおいて、前記ＢＬピクチャは、それに関連付けられたフラグを有する、
前記ＢＬピクチャに関連付けられた前記フラグの値を決定することと、
前記フラグの前記値に基づいて、（１）前記ＥＬピクチャがコーディングされる前に、復号ピクチャバッファ（ＤＰＢ）の中の１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去すること、または（２）前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを控えることのうちの１つを実行することと
を備えるプロセスを実行させるコードを備える非一時的コンピュータ可読媒体。
［Ｃ２４］
前記ＢＬピクチャに関連付けられた前記フラグは、前記第１のアクセスユニットが、２つのビットストリームが前記ＢＬと前記ＥＬとを備える単一のビットストリームへと互いに接合される接合ポイントの直後にくるかどうかを示す、
Ｃ２３に記載のコンピュータ可読媒体。
［Ｃ２５］
前記プロセスは、（１）前記フラグの前記値が前記第１のアクセスユニットが接合ポイントの直後にくることを示すと決定することに基づいて、前記ＥＬピクチャがコーディングされる前に、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去すること、または（２）前記フラグの前記値が前記第１のアクセスユニットが接合ポイントの直後にこないことを示すと決定することに基づいて、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを控えることのうちの少なくとも１つをさらに備える、
Ｃ２３に記載のコンピュータ可読媒体。
［Ｃ２６］
ビデオ情報をコーディングするように構成されたビデオコーディングデバイスであって、
ベースレイヤ（ＢＬ）およびエンハンスメントレイヤ（ＥＬ）に関連付けられたビデオ情報を記憶するための手段、前記ＢＬは、第１のアクセスユニットの中にＢＬピクチャを有し、前記ＥＬは、前記第１のアクセスユニットの中にＥＬピクチャを有し、前記ＢＬピクチャは、それに関連付けられたフラグを有する、と、
前記ＢＬピクチャに関連付けられた前記フラグの値を決定するための手段と、
前記フラグの前記値に基づいて、（１）前記ＥＬピクチャがコーディングされる前に、復号ピクチャバッファ（ＤＰＢ）の中の１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去すること、または（２）前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを控えることのうちの１つを実行するための手段と
を備える、ビデオコーディングデバイス。
［Ｃ２７］
前記ＢＬピクチャに関連付けられた前記フラグは、前記第１のアクセスユニットが、２つのビットストリームが前記ＢＬと前記ＥＬとを備える単一のビットストリームへと互いに接合される接合ポイントの直後にくるかどうかを示す、
Ｃ２６に記載のビデオコーディングデバイス。
［Ｃ２８］
（１）前記フラグの前記値が前記第１のアクセスユニットが接合ポイントの直後にくることを示すと決定することに基づいて、前記ＥＬピクチャがコーディングされる前に、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去するための手段、または（２）前記フラグの前記値が前記第１のアクセスユニットが接合ポイントの直後にこないことを示すと決定することに基づいて、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを控えるための手段のうちの少なくとも１つを、さらに備える、
Ｃ２６に記載のビデオコーディングデバイス。

Claims

ビデオ情報をコーディングするように構成された装置であって、
ベースレイヤ（ＢＬ）およびエンハンスメントレイヤ（ＥＬ）に関連付けられたビデオ情報を記憶するように構成されたメモリユニット、前記ＢＬは、第１のアクセスユニットの中にＢＬピクチャを有し、前記ＥＬは、前記第１のアクセスユニットの中にＥＬピクチャを有し、前記ＢＬピクチャは、それに関連付けられたフラグを有し、前記ＢＬピクチャは、前記ビデオ情報に対して使用されるすべてのレイヤＩＤのうちの最小のレイヤＩＤに関連付けられる、と、
前記メモリユニットと通信しているプロセッサと
を備え、前記プロセッサは、
前記ＢＬピクチャに関連付けられたＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグの値が第１の値に等しいかどうかを決定すること、ここにおいて、前記ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグは、クロスレイヤランダムアクセススキップ（ＣＬ−ＲＡＳ）ピクチャが出力されるかどうかを示す、と、
前記ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグの前記値が前記第１の値に等しいと決定した場合、ＤＰＢの中の１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャの出力の後で除去することと
を行うように構成される、装置。
前記ＥＬピクチャに関連付けられ、前記ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグの値に基づいて推定されるＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、前記第１のアクセスユニットが、２つのビットストリームが前記ＢＬと前記ＥＬとを備える単一のビットストリームへと互いに接合される接合ポイントの直後にくるかどうかをさらに示す、
請求項１に記載の装置。
前記プロセッサは、前記ＥＬピクチャがＩＲＡＰピクチャでなく、前記ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグの前記値が１に等しいとの決定に基づいて、前記ＥＬピクチャがコーディングされる前に、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを行うようにさらに構成される、
請求項１に記載の装置。
前記プロセッサは、前記ＥＬピクチャがＩＲＡＰピクチャでなく、前記ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグの前記値が１に等しくないとの決定に基づいて、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを控えることを行うようにさらに構成される、
請求項１に記載の装置。
前記ＥＬピクチャは、レイヤ初期化ピクチャ（ＬＩＰ）である、
請求項１に記載の装置。
前記第１のアクセスユニットは、初期ＩＲＡＰアクセスユニットである、
請求項１に記載の装置。
前記ＢＬピクチャは、１に等しいＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇを有する、
請求項１に記載の装置。
前記ＢＬピクチャは、ＩＲＡＰピクチャである、
請求項１に記載の装置。
前記装置は、符号化器または復号器を備え、前記プロセッサは、ビットストリームの中の前記ビデオ情報を符号化または復号することを行うようにさらに構成される、
請求項１に記載の装置。
ビデオ情報を符号化する方法であって、
第１のアクセスユニットの中のＢＬピクチャに関連付けられたＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグの値が第１の値に等しいかどうかを決定すること、ここにおいて、前記ＢＬピクチャは、前記ビデオ情報に対して使用されるすべてのレイヤＩＤのうちの最小のレイヤＩＤに関連付けられ、前記ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグは、クロスレイヤランダムアクセススキップ（ＣＬ−ＲＡＳ）ピクチャが出力されるかどうかを示す、と、
前記ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグの前記値が前記第１の値に等しいと決定した場合、ＤＰＢの中の１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャの出力の後で除去することのうちの１つを実行することと
を備える、方法。
前記ＥＬピクチャに関連付けられ、前記ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグの値に基づいて推定されるＮｏＯｕｔｐｕｔＯｆＰｒｉｏｒＰｉｃｓＦｌａｇは、前記第１のアクセスユニットが、２つのビットストリームが前記ＢＬと前記ＥＬとを備える単一のビットストリームへと互いに接合される接合ポイントの直後にくるかどうかを示す、
請求項１０に記載の方法。
（１）前記ＥＬピクチャがＩＲＡＰピクチャでなく、前記ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグの前記値が１に等しいとの決定に基づいて、前記ＥＬピクチャがコーディングされる前に、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去すること、または（２）前記ＥＬピクチャがＩＲＡＰピクチャでなく、前記ＮｏＣｌｒａｓＯｕｔｐｕｔＦｌａｇフラグの前記値が１に等しくないと決定することに基づいて、前記ＤＰＢの中の前記１つまたは複数のＥＬピクチャを、前記１つまたは複数のＥＬピクチャを出力することなく除去することを控えることのうちの少なくとも１つを、さらに備える、
請求項１０に記載の方法。
前記ＥＬピクチャは、レイヤ初期化ピクチャ（ＬＩＰ）である、
請求項１０に記載の方法。
前記ＢＬピクチャは、ＩＲＡＰピクチャである、
請求項１０に記載の方法。
実行されたとき、装置に、請求項１０乃至１４のいずれか一項に記載の方法を実行することを行わせるコードを備える、非一時的コンピュータ可読媒体。