JP6158422B2

JP6158422B2 - アラインされていないｉｒａｐピクチャを含み得るマルチレイヤビットストリームのクロスレイヤｐｏｃアラインメント

Info

Publication number: JP6158422B2
Application number: JP2016506678A
Authority: JP
Inventors: チェン、イン; ワン、イェ−クイ; ラマスブラモニアン、アダルシュ・クリシュナン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-04-08
Filing date: 2014-04-07
Publication date: 2017-07-05
Anticipated expiration: 2034-04-07
Also published as: BR112015025639A2; JP2016518776A; CN105122814B; EP2984844A1; US20140301439A1; WO2014168872A1; BR112015025639B1; HUE047299T2; KR101818831B1; BR112015025639A8; CN105122814A; EP2984844B1; ES2773276T3; US9532052B2; KR20150140732A

Description

関連出願

[0001]本出願は、各々の内容全体が参照により本明細書に組み込まれる、２０１３年４月８日に出願された米国仮出願第６１／８０９，８５５号、および２０１３年７月１５日に出願された米国仮出願第６１／８４６，５３２号の利益を主張する。

[0002]本開示は、ビデオコーディングに関する。

[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップコンピュータまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、携帯電話または衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４、Ｐａｒｔ１０、アドバンストビデオコーディング（ＡＶＣ）、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）規格によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法など、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶し得る。

[0004]ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間的（イントラピクチャ）予測および／または時間的（インターピクチャ）予測を含む。ブロックベースのビデオコーディングでは、ビデオスライス（たとえば、ビデオフレームまたはビデオフレームの一部）は、ツリーブロック、コーディングユニット（ＣＵ）、および／またはコーディングノードと呼ばれることもある、ビデオブロックに区分され得る。ピクチャのイントラコード化（Ｉ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化（ＰまたはＢ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。

[0005]空間的予測または時間的予測によって、コーディングされるべきブロックの予測ブロックが生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコーディングされたブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化ブロックは、イントラコーディングモードおよび残差データに応じて符号化される。さらなる圧縮を行うために、残差データがピクセル領域から変換領域に変換されて残差変換係数が得られてよく、次いでこれらの係数が量子化されてよい。最初に２次元アレイで構成される量子化された変換係数は、変換係数の１次元ベクトルを生成するために走査されてよく、なお一層の圧縮を達成するためにエントロピーコーディングが適用されてよい。

[0006]一般に、本開示は、ピクチャのピクチャオーダーカウント（ＰＯＣ：picture order count）値がリセットされるべきかどうかを示すピクチャのシンタックス要素をコード化するための技法について記載する。特に、ビデオコーダ（たとえば、ビデオエンコーダまたはビデオデコーダなど）は、非イントラランダムアクセスポイント（ＩＲＡＰ）ピクチャが、たとえば、異なるビデオコーディングレイヤなど、ＩＲＡＰピクチャを含むアクセスユニットに含まれるとき、非ＩＲＡＰピクチャのＰＯＣ値がリセットされるべきであることを示す値をコード化することができる。このように、本開示の技法は、異なるビデオコーディングレイヤのピクチャの中でＰＯＣ値がアラインされることをも確実にしながら、異なるビデオコーディングレイヤにわたるＩＲＡＰピクチャの非アラインメントをサポートすることができる。

[0007]一例では、ビデオデータを復号する方法は、ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すかどうかを決定することと、ＰＯＣ値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、ＰＯＣ値の一部がゼロに等しくなるように、ＰＯＣ値の少なくとも一部をリセットすることと、リセットされたＰＯＣ値を使用してビデオデータを復号することとを含む。

[0008]別の例では、ビデオデータを符号化する方法は、ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部をゼロの値にリセットすべきかどうかを決定することと、ＰＯＣ値の少なくとも一部をリセットすることを決定することに応答して、ＰＯＣ値の一部がゼロに等しくなるように、ＰＯＣ値の少なくとも一部をリセットすることと、ＰＯＣ値の少なくとも一部がゼロの値にリセットされるべきであることを示すシンタックス要素の値を符号化し、リセットされたＰＯＣ値を使用してビデオデータを符号化することとを含む。

[0009]別の例では、ビデオデータをコード化するためのデバイスは、ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化し、ＰＯＣ値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、ＰＯＣ値の一部がゼロに等しくなるように、ＰＯＣ値の少なくとも一部をリセットし、リセットされたＰＯＣ値を使用してビデオデータをコード化するように構成されたビデオコーダを含む。

[0010]別の例では、ビデオデータをコード化するためのデバイスは、ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化するための手段と、ＰＯＣ値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、ＰＯＣ値の一部がゼロに等しくなるように、ＰＯＣ値の少なくとも一部をリセットするための手段と、リセットされたＰＯＣ値を使用してビデオデータをコード化するための手段とを含む。

[0011]別の例では、コンピュータ可読記憶媒体は、命令がその上に記憶されており、命令は、実行されると、プログラマブルプロセッサに、ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化させ、ＰＯＣ値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、ＰＯＣ値の一部がゼロに等しくなるように、ＰＯＣ値の少なくとも一部をリセットさせ、リセットされたＰＯＣ値を使用してビデオデータをコード化させる。

[0012]１つまたは複数の例の詳細は、添付図面および発明の詳細な説明で以下に示される。他の特徴、目的および利点は、発明の詳細な説明および図面から、ならびに特許請求の範囲から明らかになるであろう。

本開示で説明する１つまたは複数の例による、例示的なビデオ符号化システムとビデオ復号システムとを示すブロック図。本開示で説明する技法を実施し得る例示的なビデオエンコーダを示すブロック図。本開示で説明する技法を実施し得る例示的なビデオデコーダを示すブロック図。コード化ビデオピクチャのシーケンスを示す概念図。本開示の技法による、ビデオデータを符号化する例示的な方法を示すフローチャート。本開示の技法による、ビデオデータを復号する例示的な方法を示すフローチャート。

[0019]本開示は、同じピクチャオーダーカウント（ＰＯＣ）値がクロスレイヤアラインされることが保証されるように、新しいコード化ビデオシーケンスを開始することができるアラインされないイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャをサポートするための技法について記載する。技法は、マルチレイヤコーディングにおいて適用され得る。いくつかの開示された方法は、単一レイヤビデオコーディングにも適用され得る。

[0020]特に、アラインされないＩＲＡＰピクチャは、アクセスユニットが異なるビデオコーディングレイヤにＩＲＡＰピクチャと非ＩＲＡＰピクチャの両方を含む状況で起こる。コード化ビデオシーケンス（ＣＶＳ）におけるピクチャは、そのＣＶＳにおけるそれぞれのピクチャを一意に識別するＰＯＣ値を有する。ピクチャのＰＯＣ値は、一般に、同じＣＶＳにおける他のピクチャに対するピクチャの出力順序を示す。ＩＲＡＰピクチャは、０のＰＯＣ値を有する。したがって、アラインされないＩＲＡＰピクチャは、アクセスユニットが異なるＰＯＣ値を有するピクチャを含むことにつながる。

[0021]しかしながら、ＰＯＣ値は、レイヤ間参照ピクチャを識別するために使用される。すなわち、レイヤ間予測（すなわち、ビュー間予測）を使用してピクチャがコード化されるとき、ビデオデコーダが参照ピクチャを識別することができるように、参照ピクチャのＰＯＣ値がシグナリングされる。ＰＯＣ値がアラインされている場合、すなわち、参照ピクチャのＰＯＣ値が現在のピクチャのＰＯＣ値と同じであるとき、現在のピクチャがレイヤ間予測されることを決定することは簡単である。ビデオコーディングレイヤ間のピクチャの正しくアラインされていないＰＯＣ値は、参照ピクチャの識別をより困難にする。さらに、アクセスユニット境界は、検出が困難となり、エラーを起こしやすい可能性がある。

[0022]したがって、本開示は、共通のアクセスユニットにおけるピクチャのＰＯＣ値がクロスアラインされることをも確実にしながら、アラインされないＩＲＡＰピクチャを可能にするための技法について記載する。特に、シンタックス要素は、ピクチャのＰＯＣ値の少なくとも一部がリセットされる（すなわち、ゼロの値に設定される）べきであることを示し得る。たとえば、ビデオエンコーダは、アクセスユニットがあるレイヤにおけるＩＲＡＰピクチャと、別の異なるレイヤにおける非ＩＲＡＰピクチャとを含むことを決定することができる。したがって、ビデオエンコーダは、非ＩＲＡＰピクチャのＰＯＣ値がリセットされるべきであることをシグナリングし得る。ビデオデコーダは、非ＩＲＡＰピクチャのＰＯＣ値をリセットすることができ、非ＩＲＡＰピクチャと同じビデオコーディングレイヤにおける他のピクチャのＰＯＣ値を変更することもできる。すなわち、ビデオデコーダは、非ＩＲＡＰピクチャのＰＯＣ値と同じレイヤおよび同じＣＶＳにおける他のピクチャのＰＯＣ値との間の差が、非ＩＲＡＰピクチャのＰＯＣ値をリセットした後に一定のままであるように、これらの他のピクチャのＰＯＣ値を変更することができる。

[0023]このようにしてＰＯＣ値を調整することによって、共通のアクセスユニットにおけるすべてのピクチャが同じＰＯＣ値を有することが確実にされ得、さらに、ＩＲＡＰピクチャは、アラインされる必要がない。したがって、アクセスユニット境界の検出は、単純化され、よりエラー耐性（error resilient）を持つようになり得、レイヤ間参照ピクチャの識別も単純化され得る。

[0024]ビデオコーディング規格は、ＩＴＵ−ＴＨ．２６１と、ＩＳＯ／ＩＥＣＭＰＥＧ−１Ｖｉｓｕａｌと、ＩＴＵ−ＴＨ．２６２またはＩＳＯ／ＩＥＣＭＰＥＧ−２Ｖｉｓｕａｌと、ＩＴＵ−ＴＨ．２６３と、ＩＳＯ／ＩＥＣＭＰＥＧ−４Ｖｉｓｕａｌと、それのスケーラブルビデオコーディング（ＳＶＣ）およびマルチビュービデオコーディング（ＭＶＣ）拡張を含む（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとしても知られる）ＩＴＵ−ＴＨ．２６４とを含む。

[0025]最近、新しいビデオコーディング規格、すなわち高効率ビデオコーディング（ＨＥＶＣ）の設計が、ＩＴＵ−ＴＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔｓＧｒｏｕｐ（ＶＣＥＧ）およびＩＳＯ／ＩＥＣＭｏｔｉｏｎＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）のＪｏｉｎｔＣｏｌｌａｂｏｒａｔｉｏｎＴｅａｍｏｎＶｉｄｅｏＣｏｄｉｎｇ（ＪＣＴ−ＶＣ）によって確定された。以下でＨＥＶＣＷＤ１０と呼ぶ、最新のＨＥＶＣドラフト仕様が、http://phenix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zipから入手可能である。

[0026]また、ＨＥＶＣのマルチビュー拡張、すなわちＭＶ−ＨＥＶＣがＪＣＴ−３Ｖによって開発されている。以下でＭＶ−ＨＥＶＣＷＤ３と呼ぶ、ＭＶ−ＨＥＶＣの最近のワーキングドラフト（ＷＤ）は、http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/3_Geneva/wg11/JCT3V-C1004-v4.zipから入手可能である。

[0027]ＳＨＶＣと称するＨＥＶＣのスケーラブル拡張も、ＪＣＴ−ＶＣによって開発されている。以下でＳＨＶＣＷＤ１と呼ぶ、ＳＨＶＣの最近のワーキングドラフト（ＷＤ）が、http://phenix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1008-v1.zipから入手可能である。

[0028]本明細書は、（コード化）ピクチャ、アクセスユニット（ＡＵ）、ＩＲＡＰＡＵ、コード化ビデオシーケンス（ＣＶＳ）、およびビットストリームの以下の概念を想定するが、これらの方法は、これらの仮定の一部が変更される場合も適用される。
−（コード化）ピクチャ：現在の（コード化）ピクチャの定義と同様、コード化ピクチャは、ＳＶＣにおけるレイヤ表現、ＭＶＣにおけるビュー構成要素、およびＭＶＣ＋Ｄにおけるテクスチャまたは深さビュー構成要素に等しい。
− アクセスユニット：ＳＶＣおよびＭＶＣと同様、ＡＵは、同じ出力時間およびそれらの関連の非ＶＣＬＮＡＬユニットに関連するすべてのコード化ピクチャから成る。
− ＩＲＡＰアクセスユニット：すべてのコード化ピクチャがＩＲＡＰピクチャであるアクセスユニット。
− コード化ビデオシーケンス（ＣＶＳ）：ＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇが１に等しいＩＲＡＰアクセスユニットと、その後に、ＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇが１に等しいＩＲＡＰアクセスユニットである以後のアクセスユニットまで、ただしその以後のアクセスユニットを含まない、のすべての以後のアクセスユニットを含む、ＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇが１に等しいＩＲＡＰアクセス可能ユニットではない０個以上のアクセスユニットとで、復号順に構成されるアクセスユニットのシーケンスである。
○ 用語がＨＥＶＣＷＤ１０の場合と同じであることに留意されたい。
− ビットストリーム：１つまたは複数のＣＶＳの表現を形成するＮＡＬユニットストリームまたはバイトストリームの形のビットのシーケンス。
○ ビットストリームにおける第１のＡＵは、（上記で定義されたように）ＩＲＡＰＡＵであるものとする。

[0029]瞬間デコーダリフレッシュ（ＩＤＲ）ピクチャ、クリーンランダムアクセス（ＣＲＡ）ピクチャ、およびリンク切断アクセス（ＢＬＡ）ピクチャは、まとめてＩＲＡＰピクチャと呼ばれる。ＩＲＡＰピクチャのクロスレイヤアラインメントを必要とすることは、いくつかの有利な使用シナリオを否認することになる。たとえば、２レイヤビットストリームにおいて、拡張レイヤよりもベースレイヤにより多くのＩＲＡＰピクチャがあるとき、ブロードキャストおよびマルチキャストの用途で、低遅延同調と同時に、高コーディング効率が達成され得る。したがって、アラインされないＩＲＡＰピクチャを可能にすることが望ましい。

[0030]しかしながら、あるピクチャ（ｐｉｃＡ）が、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャであり、同じアクセスユニットにおける別のピクチャ（ｐｉｃＢ）が、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャではないとき、ｐｉｃＡを含むレイヤにおけるピクチャ（ｐｉｃＣ）のＰＯＣ値は、ｐｉｃＢを含むレイヤにおけるピクチャ（ｐｉｃＤ）のＰＯＣ値とは異なり得、ここにおいて、ｐｉｃＣおよびｐｉｃＤは、同じアクセスユニットにあり、ｐｉｃＣはｐｉｃＡであってもよく、またはそうでなくてもよい（および、したがって、ｐｉｃＤはｐｉｃＢであってもよく、またはそうでなくてもよい）。これは、NoRaslOutputFlagが１に等しい各ＩＲＡＰピクチャが、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャのためにシグナリングまたは導出されるＰＯＣの最下位ビット（ＬＳＢ）に等しくなるようにＰＯＣ値をリセットするためである。

[0031]これによって、ＰＯＣ値がクロスアラインされるときと比較して、レイヤ間予測によるマルチレイヤビデオコーディングにおける参照ピクチャの識別ではより困難になる。たとえば、ＭＶ−ＨＥＶＣＷＤ３では、ＰＯＣは、レイヤ間参照ピクチャを識別するために、２次元識別のうちの１つとして使用される。

[0032]さらに、このことは、アクセスユニット（ＡＵ）境界検出をより困難にし、エラー耐性がなくなる。たとえば、ＡＵ１が、それぞれベースレイヤと拡張レイヤにおけるｐｉｃＡとｐｉｃＢとから成り、ＡＵ２が、それぞれベースレイヤと拡張レイヤにおけるｐｉｃＣとｐｉｃＤとから成り、ＡＵ１は、復号順でＡＵ２に先行すると仮定する。次いで、ｐｉｃＢとｐｉｃＣの両方が紛失した場合、受信されたｐｉｃＡおよびｐｉｃＤがコード化ピクチャに基づいて２つの異なるＡＵに属することを、デコーダが認識する方法がない。同じ例で、ＡＵ２が拡張レイヤにおけるｐｉｃＤのみから成り、一方ｐｉｃＣが決して存在しない場合、１つのピクチャ、すなわちｐｉｃＢのみが紛失したときでも、同じ問題が起きることになる。

[0033]本開示は、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャの非クロスアラインメントを可能にすると同時に、すべてのＡＵについてのＰＯＣ値のクロスアラインメントをそれと同時に提供する技法について記載する。

[0034]図１は、本開示で説明する１つまたは複数の例による、例示的なビデオ符号化システムとビデオ復号システムとを示すブロック図である。たとえば、システム１０はソースデバイス１２と宛先デバイス１４とを含む。ソースデバイス１２および宛先デバイス１４は、本開示で説明する技法を実装するように構成される。いくつかの例では、システム１０は、たとえば、ＷＤ１０およびその拡張、たとえばＭＶ−ＨＥＶＣＷＤ３、ＳＨＶＣＷＤ１などに記載されている拡張などに記載されるように、ＨＥＶＣ規格に従って符号化されるビデオデータなど、符号化されたビデオデータの符号化、送信、記憶、復号、および／または提示をサポートするように構成され得る。しかしながら、本開示に記載された技法は、他のビデオコーディング規格または他の拡張に適用可能であり得る。

[0035]図１に示されるように、システム１０は、宛先デバイス１４によって後の時間で復号されるべき符号化されたビデオデータを生成するソースデバイス１２を含む。ソースデバイス１２および宛先デバイス１４は、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備える場合がある。場合によっては、ソースデバイス１２および宛先デバイス１４はワイヤレス通信のために装備され得る。

[0036]宛先デバイス１４は、リンク１６を介して、復号されるべき符号化されたビデオデータを受信し得る。リンク１６は、ソースデバイス１２から宛先デバイス１４に符号化されたビデオデータを移すことが可能な任意のタイプの媒体またはデバイスを備えることができる。一例では、リンク１６は、ソースデバイス１２が、符号化されたビデオデータをリアルタイムで宛先デバイス１４に直接送信することを可能にするための通信媒体を備え得る。符号化されたビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス１４に送信され得る。通信媒体は、高周波（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワークなどのパケットベースのネットワーク、またはインターネットなどのグローバルネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス１２から宛先デバイス１４への通信を促進するために有用であり得る、任意の他の機器を含み得る。

[0037]代替的に、符号化されたデータは、出力インターフェース２２からストレージデバイス３４に出力され得る。同様に、符号化されたデータは、入力インターフェースによってストレージデバイス３４からアクセスされ得る。ストレージデバイス３４は、ハードドライブ、Ｂｌｕ−ｒａｙ（登録商標）ディスク、ＤＶＤ、ＣＤ−ＲＯＭ、フラッシュメモリ、揮発性もしくは不揮発性メモリ、または符号化されたビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散したまたはローカルでアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイス３４は、ソースデバイス１２によって生成された符号化されたビデオを保持できるファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス１４は、ストリーミングまたはダウンロードを介して、ストレージデバイス３４から記憶されたビデオデータにアクセスすることができる。ファイルサーバは、符号化されたビデオデータを記憶し、その符号化されたビデオデータを宛先デバイス１４に送信することが可能な任意のタイプのサーバとすることができる。例示的なファイルサーバは、ウェブサーバ（たとえば、ウェブサイトのための）、ＦＴＰサーバ、ネットワーク接続記憶（ＮＡＳ）デバイス、または局所的なディスクドライブを含む。宛先デバイス１４は、インターネット接続を含む任意の標準的なデータ接続を通じて、符号化されたビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化されたビデオデータにアクセスするのに適しているワイヤレスチャネル（たとえば、Ｗｉ−Ｆｉ（登録商標）接続）、ワイヤード接続（たとえば、ＤＳＬ、ケーブルモデムなど）、または両方の組合せを含むことができる。ストレージデバイス３４からの符号化されたビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。

[0038]本開示の技法は、ワイヤレスの用途または設定には限定されない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の用途などの様々なマルチメディアの用途のいずれかをサポートするビデオコーディングに適用することができる。いくつかの例では、システム１０は、ビデオストリーミング、ビデオプレイバック、ビデオブロードキャスティングおよび／またはビデオ電話通信などの適用例をサポートするために、一方向または二方向のビデオ伝送をサポートするように構成され得る。

[0039]図１の例では、ソースデバイス１２は、ビデオソース１８と、ビデオエンコーダ２０と、出力インターフェース２２とを含む。場合によっては、出力インターフェース２２は、変調器／復調器（モデム）および／または送信機を含んでよい。ソースデバイス１２において、ビデオソース１８は、ビデオキャプチャデバイス、たとえばビデオカメラ、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および／もしくはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムのようなソース、またはそのようなソースの組合せを含み得る。一例として、ビデオソース１８がビデオカメラである場合、ソースデバイス１２および宛先デバイス１４は、いわゆるカメラ付き電話またはビデオ電話を形成することができる。しかし、本開示に記載された技法は、ビデオコーディング全般に適用可能であってよく、ワイヤレスアプリケーションおよび／または有線アプリケーションに適用されてよい。

[0040]キャプチャされたビデオ、プリキャプチャされたビデオ、またはコンピュータにより生成されたビデオは、ビデオエンコーダ２０によって符号化され得る。符号化されたビデオデータは、ソースデバイス１２の出力インターフェース２２を介して宛先デバイス１４に直接送信され得る。符号化されたビデオデータはさらに（または代替として）、以後の宛先デバイス１４またはその他の装置によるアクセス、復号、および／または再生が可能なようにストレージデバイス３４上に記憶されてよい。

[0041]宛先デバイス１４は、入力インターフェース２８と、ビデオデコーダ３０と、ディスプレイデバイス３２とを含む。場合によっては、入力インターフェース２８は、受信機および／またはモデムを含んでよい。宛先デバイス１４の入力インターフェース２８は、リンク１６を介して、符号化されたビデオデータを受信する。リンク１６を介して通信され、またはストレージデバイス３４上に提供された符号化されたビデオデータは、ビデオデータを復号する際にビデオデコーダ３０などのビデオデコーダが使用するための、ビデオエンコーダ２０によって生成された様々なシンタックス要素を含み得る。そのようなシンタックス要素は、通信媒体上で送信され記憶媒体上に記憶される符号化されたビデオデータとともに含まれ得、またはファイルサーバを記憶した。

[0042]ディスプレイデバイス３２は、宛先デバイス１４と一体化されること、またはその外部に存在することがある。いくつかの例では、宛先デバイス１４は、集積ディスプレイデバイスを含むことができ、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス１４はディスプレイデバイスであってよい。一般に、ディスプレイデバイス３２は、復号されたビデオデータをユーザに表示し、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなどの様々なディスプレイデバイスのいずれかを備える場合がある。

[0043]ビデオエンコーダ２０およびビデオデコーダ３０は、代替的にＭＰＥＧ４、Ｐａｒｔ１０、アドバンストビデオコーディング（ＡＶＣ）と呼ばれるＩＴＵ−ＴＨ．２６４規格などのビデオ圧縮規格、またはそのような規格の拡張に従って動作し得る。代替的に、ビデオエンコーダ２０およびビデオデコーダ３０は、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）規格、ＨＥＶＣ規格の拡張など他のプロプライエタリ規格または業界規格に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例としては、ＭＰＥＧ−２およびＩＴＵ−ＴＨ．２６３がある。

[0044]図１には示されていないが、いくつかの態様では、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれオーディオエンコーダおよびデコーダと統合され得、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するために、適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含み得る。ＭＵＸ−ＤＥＭＵＸユニットは、適用可能な場合、いくつかの例において、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータプロトコル（ＵＤＰ）などの他のプロトコルに適合してよい。

[0045]本開示の技法によれば、ビデオエンコーダ２０およびビデオデコーダ３０は、ピクチャのピクチャオーダーカウント（ＰＯＣ）値が部分的にまたは完全にリセットされるべきかどうかを示すシンタックス要素の値をコード化するように構成され得る。部分的なリセットは、ＰＯＣ値の一部、たとえば、最上位ビット（ＭＳＢ）のみをゼロに等しくなるように設定することに対応し得る。完全なリセットは、ＰＯＣ値のすべてのビットをゼロに等しくなるように設定することに対応し得る。したがって、ピクチャのＰＯＣ値が部分的にまたは完全にリセットされるべきであることをシンタックス要素が示すとき、ビデオデコーダ３０は、ＰＯＣ値の対応するビットをゼロにリセットすることができる。

[0046]加えて、ビデオデコーダ３０は、ＰＯＣ値がリセットされたピクチャと同じレイヤにおける他のピクチャのＰＯＣ値のビットも、これらの他のピクチャのＰＯＣ値間の差が、リセット後とリセットの前と同じままであるように設定し得る。たとえば、Ｎ個の他のピクチャの各々について、ビデオデコーダ３０は、差Ｄ_iを決定することができ、ここにおいて、ｉは、両端値を含む０とＮ−１との間であり、これらの他のピクチャのうちの１つを表す。この例では、ビデオデコーダ３０は、Ｄ_i＝ＰＯＣ_base−ＰＯＣ_iを計算することができ、ここにおいて、「ｂａｓｅ」とは、ＰＯＣ値がリセットされたピクチャを指す。次いで、ビデオデコーダ３０は、ＰＯＣ_{i_decremented}＋Ｄ_i＝ＰＯＣ_{base_reset}となるようにデクリメントし得、ここにおいて、ＰＯＣ_{i_decremented}は、ピクチャｉのデクリメントされたＰＯＣ値を表し、ＰＯＣ_{base_reset}は、ＰＯＣ_baseのリセット値を表す。リセットされるべきピクチャのＰＯＣ値がゼロに設定される例において、ビデオデコーダ３０は、ピクチャの最初の（すなわち、リセットの前の）ＰＯＣ値だけ、同じＣＶＳおよび同じビデオコーディングレイヤにおける他のピクチャのＰＯＣ値をデクリメントし得る。代替的に、ビデオデコーダ３０は、同じＣＶＳおよび同じビデオコーディングレイヤにおける他のピクチャのＰＯＣ値を、ＰＯＣ値がリセットされるべきピクチャの最初のＰＯＣ値と他のピクチャのＰＯＣ値との間の差（すなわち、Ｄ_iに等しい）に等しくなるように設定することができる。

[0047]１組の例では、第１のフラグは、ＰＯＣ値がＰＯＣの最下位ビット（ＬＳＢ）に等しくなるようにリセットされる、すなわち、ＰＯＣの最上位ビット（ＭＳＢ）が０に等しくなるようにリセットされるかどうかを指定するために、スライスヘッダに追加され、そうである場合、同じレイヤおよび復号ピクチャバッファ（ＤＰＢ）における現在のピクチャおよび任意のピクチャのＰＯＣ値間の差は、第１のフラグが別の場合を示す場合と同じままであるように、現在のピクチャと同じレイヤ、およびＤＰＢにおけるすべてのピクチャのＰＯＣ値がデクリメントされる。

[0048]この組の例では、第２のフラグは、ＰＯＣＬＳＢが０に等しくなるようにリセットされるかどうかを指定するために、スライスヘッダに追加され得る。第１のフラグとともに使用されるとき、第２のフラグは、エンコーダが異なるレイヤにおけるピクチャのＰＯＣＬＳＢの異なる値を自由に割り振ることができるようにする。この組の例は、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャの非クロスアラインメントを可能にすると同時に、すべてのＡＵについてのＰＯＣ値のクロスアラインメントをそれと同時に保証し、ここにおいて、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャは、ＩＲＡＰピクチャの３つのタイプ、すなわち、ＩＤＲ、ＣＲＡ、およびＢＬＡピクチャのうちの任意のものであり得る。

[0049]別の組の例では、ＩＤＲピクチャがアクセスユニットにおいてアラインされないとき、そのＡＵにおける少なくとも１つのピクチャがＩＤＲピクチャである場合、ＩＤＲピクチャと同様に、あるアクセスユニットにおけるすべてのピクチャのＰＯＣ値が０に設定されることが提案される。これは、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャの非クロスアラインメントを可能にすると同時に、すべてのＡＵについてのＰＯＣ値のクロスアラインメントをそれと同時に保証し、ここにおいて、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャは、ＩＲＡＰピクチャである。より具体的には、以下は、この組の例に当てはまる。
１．フラグ、すなわち、idr_au_present_flagは、たとえば、slice_reserved_flag[ i ]を有するスライスヘッダの最初にシグナリングされるビットの一部であるスライスヘッダでシグナリングされる。
ａ．nuh_layer_idが０よりも大きいピクチャでは、それがＩＤＲピクチャについて行われるとき、１に等しいフラグは、ＰＯＣ値が０にリセットされることを示し、０に等しいフラグは、ＰＯＣ値がリセットされないことを示す。
２．ＩＤＲピクチャでは、このフラグは、他の目的のために使用され得る、または、１となるように予約され得る、または、欠けているが、１に等しいと推測され得る。

[0050]両方の組の例について、nuh_layer_idが０に等しいピクチャでは、フラグは、ＨＥＶＣバージョン１のデコーダ（ＨＥＶＣＷＤ１０に基づく１レイヤ２Ｄデコーダ）ではどんな効果も現れず、したがって、デコーダは、フラグを無視する。

[0051]以下、これらの例示的な技法の詳細な実施形態の様々な例について説明する。以下では、規格の提案された変更が強調されており、イタリック体のテキストは、追加を表し、［ｒｅｍｏｖｅｄ：“”］は、規格の以前のバージョンに関する削除を表す。一般に、ビデオエンコーダ２０および／またはビデオデコーダ３０は、本開示の技法を実行するように構成され得る。本開示は、「ビデオコーダ」をこれらの技法を実行するものとして説明する。ビデオエンコーダという用語は、ビデオエンコーダ２０のようなビデオエンコーダ、または、ビデオデコーダ３０のようなビデオデコーダを指し得ることを理解されたい。同様に、「ビデオコーディング」という用語は、ビデオ符号化および／またはビデオ復号を指すことがある。ビデオエンコーダ２０またはビデオデコーダ３０などのビデオコーダは、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。いくつかの技法がビデオデコーダの観点から記載されている場合、ビデオエンコーダは、同じまたは類似の（たとえば、逆の）技法を実行することができる。同様に、いくつかの技法がビデオエンコーダの観点から記載されている場合、ビデオデコーダは、同じまたは類似の（たとえば、逆の）技法を実行することができる。

[0052]以下、本開示の技法による第１の例について説明する。この例は、以下、実施例１と呼ばれる。以下のシンタックスおよびセマンティクスは、一般に、ＨＥＶＣＷＤ１０における対応するセクションを指す。上述のように、強調は、提案された追加を示し、取り消し線は、提案された削除を示す。
例１

[0053]以下、一般のスライスセグメントヘッダのシンタックスおよびセマンティクスについて最初に説明する。

[0054]以下、一般のスライスセグメントヘッダのセマンティクスについて説明する。上述のように、イタリック体のテキストは、提案された追加を示し、［ｒｅｍｏｖｅｄ：“”］は、提案された削除を示す。変更されていないシンタックス要素のセマンティクスは、規格の以前のバージョンに記載されているセマンティクスと同じのままであり得る。

[0055]１に等しいpoc_msb_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントがslice_pic_order_cnt_lsbに等しいことを指定する。０に等しいpoc_msb_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントがslice_pic_order_cnt_lsbに等しくても等しくなくてもよいことを指定する。

[0056]存在するとき、現在のピクチャはNoRaslOutputFlagが１に等しいＩＲＡＰピクチャではなく、現在のアクセスユニットにおける少なくとも１つのピクチャはNoRaslOutputFlagが１に等しいＩＲＡＰピクチャであるとき、poc_msb_reset_flagの値は１に等しいものとする。

[0057]存在しないとき、poc_msb_reset_flagの値は０に等しくなると推測される。

[0058]１に等しいpoc_lsb_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントが０に等しいことを指定する。０に等しいpoc_lsb_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントが０に等しくても等しくなくてもよいことを指定する。

[0059]存在するとき、現在のピクチャはＩＤＲピクチャではなく、現在のアクセスユニットにおける少なくとも１つのピクチャがＩＤＲピクチャであるとき、poc_lsb_reset_flagの値は１に等しいものとする。

[0060]存在しないとき、poc_lsb_reset_flagの値は０に等しくなると推測される。

[0061]したがって、ビデオエンコーダ２０は、ＩＲＡＰピクチャではなく、たとえば、異なるビデオコーディングレイヤにおいてＩＲＡＰピクチャを含むアクセスユニットにあるピクチャについて１の値を有するように、poc_msb_reset_flagを設定することができる。同様に、ビデオデコーダ３０は、ＩＲＡＰピクチャではないピクチャについて１の値を受信すると、ピクチャのＰＯＣ値のＭＳＢの値をリセットし、必要に応じて同じレイヤおよび同じコード化ビデオシーケンスにおける他のピクチャのＰＯＣ値を調整することができる。

[0062]以下、一般の復号プロセスのセマンティクスについて説明する。ビデオデコーダ３０は、後述するように、ビデオデータを復号するように構成され得る。ビデオエンコーダ２０は、後述されるものに対する逆のプロセスに従ってビデオデータを符号化するように構成され得る。上述のように、以下の変更は、ＨＥＶＣＷＤ１０の対応する部分に関して行われ得る。イタリック体のテキストは、提案された追加を示し、［ｒｅｍｏｖｅｄ：“”］は、提案された削除を示す。
一般の復号プロセス
このプロセスへの入力は、ビットストリームである。このプロセスの出力は、復号されたピクチャのリストである。
復号されるＮＡＬユニットのnuh_layer_id値のリストをnuh_layer_id値の昇順に指定するレイヤ識別子リストTargetDecLayerIdListは、次のように指定される。
− 本明細書において指定されていない何らかの外部手段が、TargetDecLayerIdListを設定するために利用可能である場合、TargetDecLayerIdListは、外部手段によって設定される。
− それ以外の場合、復号プロセスが、Ｃ．１項に指定されたように、ビットストリームコンフォーマンステストで呼び出される場合、TargetDecLayerIdListは、Ｃ．１項に指定されたように設定される。
− それ以外の場合、TargetDecLayerIdListは、０に等しい１つのnuh_layer_id値のみを含む。
復号される最も高い時間的サブレイヤを識別する変数HighestTidは、次のように指定される。
− 本明細書において指定されていない何らかの外部手段が、HighestTidを設定するために利用可能である場合、HighestTidは、外部手段によって設定される。
− それ以外の場合、復号プロセスが、Ｃ．１項に指定されたように、ビットストリームコンフォーマンステストで呼び出される場合、HighestTidは、Ｃ．１項に指定されたように設定される。
− それ以外の場合、HighestTidは、sps_max_sub_layers_minus１に等しくなるように設定される。
１０節で指定されるサブビットストリーム抽出プロセスは、ビットストリーム、HighestTid、およびTargetDecLayerIdListが入力として適用され、出力は、BitstreamToDecodeと呼ばれるビットストリームに割り当てられる。
この項の残りに指定される復号プロセスは、現在のピクチャと呼ばれ、BitstreamToDecodeで変数CurrPicによって示される各コード化ピクチャに適用される。
chroma_format_idcの値に応じて、現在のピクチャのサンプルアレイの数は、次のように示される。
− chroma_format_idcが０に等しい場合、現在のピクチャは、１つのサンプルアレイＳ_Lから成る。
− それ以外の場合（chroma_format_idcが０に等しくない場合）、現在のピクチャは、３つのサンプルアレイＳ_L、Ｓ_Cb、Ｓ_Crから成る。
現在のピクチャの復号プロセスは、７節からシンタックス要素および大文字の変数を入力として取得する。各ＮＡＬユニットにおける各シンタックス要素のセマンティクスを解釈するとき、「ビットストリーム」という用語（またはその一部、たとえば、ビットストリームのＣＶＳ）は、BitstreamToDecode（またはその一部）を指す。
復号プロセスは、すべてのデコーダが数値的に同一のクロッピングされた復号ピクチャを生成するように指定される。（指定されるように、正しい出力順序または出力タイミングを有する）本明細書で説明するプロセスによって生成されるものに対する同一のクロッピングされた復号ピクチャを生成する任意の復号プロセスは、本明細書の復号プロセス要件に適合する。
現在のピクチャがＩＲＡＰピクチャであるとき、以下のことが当てはまる。
− 現在のピクチャがＩＤＲピクチャまたはＢＬＡピクチャである場合、変数NoRaslOutputFlagは１に等しくなるように設定される。
− それ以外の場合（現在のピクチャがＣＲＡピクチャである場合）、以下のことが当てはまる。
− 現在のピクチャが復号順でビットストリームにおける第１のピクチャである場合、または、復号順でシーケンスＮＡＬユニットの最後に続く第１のピクチャである場合、同じアクセスユニットにおけるすべてのピクチャは、ＣＲＡピクチャであるものとし、変数NoRaslOutputFlagは１に等しくなるように設定される。
− それ以外の場合、本明細書において指定されていない何らかの外部手段が、変数HandleCraAsBlaFlagを現在のピクチャのある値に設定するために利用可能である場合、変数HandleCraAsBlaFlagは、外部手段によって与えられた値に等しくなるように設定され、変数NoRaslOutputFlagは、HandleCraAsBlaFlagに等しくなるように設定される。この場合、現在のアクセスユニットにおける１つの非ＣＲＡピクチャがあるとき、現在のピクチャのHandleCraAsBlaFlagの値は１に等しくないものとする。
− それ以外の場合、変数HandleCraAsBlaFlagは０に等しくなるように設定され、変数NoRaslOutputFlagは０に等しくなるように設定される。
現在のピクチャが０に等しいnuh_layer_idを有するとき、８．１．１項に指定されるように、nuh_layer_idが０に等しいコード化ピクチャについての復号プロセスが呼び出される。

[0063]以下、nuh_layer_idが０に等しいコード化ピクチャについての復号プロセスのセマンティクスについて説明する。ビデオデコーダ３０は、後述するように、ビデオデータを復号するように構成され得る。ビデオエンコーダ２０は、後述されるものに対する逆のプロセスに従ってビデオデータを符号化するように構成され得る。
nuh_layer_idが０に等しいコード化ピクチャについての復号プロセス
現在のピクチャが、ＢＬＡ＿Ｗ＿ＬＰに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するＢＬＡピクチャであるか、またはＣＲＡピクチャであるとき、以下のことが当てはまる。
− 本明細書において指定されていない何らかの外部手段が、変数UseAltCpbParamsFlagをある値に設定するために利用可能である場合、UseAltCpbParamsFlagは、外部手段によって与えられた値に等しくなるように設定される。
− それ以外の場合、ＵｓｅＡｌｔＣｐｂＰａｒａｍｓＦｌａｇの値は０に等しくなるように設定される。
［ｒｅｍｏｖｅｄ：「現在のピクチャがＩＲＡＰピクチャであるとき、以下のことが当てはまる。
− 特定のnuh_layer_idを有する現在のピクチャがＩＤＲピクチャ、ＢＬＡピクチャ、復号順でビットストリームにおけるその特定のnuh_layer_idを有する第１のピクチャ、または復号順でシーケンスＮＡＬユニットの最後に続くその特定のnuh_layer_idを有する第１のピクチャである場合、変数ＮｏNoRaslOutputFlagは、１に等しくなるように設定される。
− それ以外の場合、本明細書において指定されていない何らかの外部手段が、変数HandleCraAsBlaFlagを現在のピクチャのある値に設定するために利用可能である場合、変数HandleCraAsBlaFlagは、外部手段によって与えられた値に等しく設定され、変数NoRaslOutputFlagは、HandleCraAsBlaFlagに等しくなるように設定される。
− それ以外の場合、変数HandleCraAsBlaFlagは０に等しくなるように設定され、変数NoRaslOutputFlagは０に等しくなるように設定される。”］
separate_colour_plane_flagの値に応じて、復号プロセスは、次のように構築される。
− separate_colour_plane_flagが０に等しい場合、復号プロセスは、出力される現在のピクチャに関して、単一回呼び出される。
− それ以外の場合（separate_colour_plane_flagが１に等しい）、復号プロセスは、３回呼び出される。復号プロセスへの入力は、colour_plane_idの同じ値を有するコード化ピクチャのすべてのＮＡＬユニットである。colour_plane_idの特定の値を有するＮＡＬユニットの復号プロセスは、あたかもcolour_plane_idのその特定の値を有するモノクロカラーフォーマットを有するＣＶＳのみがビットストリームに存在するかのように指定される。３つの復号プロセスの各々の出力は、現在のピクチャの３つのサンプルアレイのうちの１つに割り当てられ、０、１、および２に等しいcolour_plane_idを有するＮＡＬユニットがそれぞれＳ_L、Ｓ_Cb、およびＳ_Crに割り当てられる。
注意−separate_colour_plane_flagが１に等しく、chroma_format_idcが３に等しいとき、変数ChromaArrayTypeが０に等しいものとして導出される。復号プロセスでは、この変数の値が評価され、モノクロピクチャ（chroma_format_idcが０に等しいとき）のものと同一の動作をもたらす。
復号プロセスは、現在のピクチャＣｕｒｒＰｉｃについて、次のように動作する。
１．ＮＡＬユニットの復号は、８．２項に指定されている。
２．８．３項におけるプロセスは、スライスセグメントレイヤ以上におけるシンタックス要素を使用した以下の復号処理を指定する。
− ピクチャオーダーカウントに関する変数および関数は、８．３．１項で導出される。これは、ピクチャの第１のスライスセグメントについてのみ、呼び出される必要がある。
− ８．３．２項におけるＲＰＳについての復号プロセスが呼び出され、ここにおいて、参照ピクチャは、「参照のために使用されない」または「長期の参照のために使用される」として標識され得る。これは、ピクチャの第１のスライスセグメントについてのみ、呼び出される必要がある。
− 現在のピクチャがＢＬＡピクチャである、またはNoRaslOutputFlagが１に等しいＣＲＡピクチャであるとき、８．３．３項に指定されている利用不可能な参照ピクチャを生成するための復号プロセスが呼び出され、これは、ピクチャの第１のスライスセグメントのためだけに呼び出される必要がある。
− PicOutputFlagは、次のように設定される。
− 現在のピクチャがＲＡＳＬピクチャであり、関連のＩＲＡＰピクチャのNoRaslOutputFlagが１に等しい場合、PicOutputFlagは、０に等しくなるように設定される。
− それ以外の場合、PicOutputFlagはpic_output_flagに等しくなるように設定される。
− 各ＰまたはＢスライスのための復号プロセスの最初に、８．３．４項に指定されている参照ピクチャリスト構造のための復号プロセスは、参照ピクチャリスト０（RefPicList０）の導出のために、およびＢスライスを復号化するとき、参照ピクチャリスト１（RefPicList１）の導出のために呼び出される。
３．８．４、８．５、８．６、および８．７項におけるプロセスは、すべてのシンタックス構造レイヤにおけるシンタックス要素を使用した復号プロセスを指定する。ピクチャのコード化スライスがピクチャのコーディングツリーユニットごとにスライスセグメントデータを含むことがビットストリームコンフォーマンスの要件であり、したがって、ピクチャのスライスへの分割、スライスのスライスセグメントへの分割、およびスライスセグメントのコーディングツリーユニットへの分割は、ピクチャの区分を形成する。
４．現在のピクチャのすべてのスライスが復号された後、復号されたピクチャは、「短期の参照のために使用される」として標識される。

[0064]以下、ピクチャオーダーカウントについての復号プロセスのセマンティクスについて説明する。
ピクチャオーダーカウントについての復号プロセス
このプロセスの出力は、PicOrderCntValであり、現在のピクチャのピクチャオーダーカウントである。
ピクチャオーダーカウントは、マージモードおよび動きベクトル予測で動きパラメータを導出するため、およびデコーダコンフォーマンスチェックのために、ピクチャを識別するために使用される（Ｃ．５項を参照）。
各コード化ピクチャは、PicOrderCntValと示されるピクチャオーダーカウント変数に関連付けられる。
現在のピクチャが、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャでないとき、変数prevPicOrderCntLsbおよびprevPicOrderCntMsbは、次のように導出される。
− prevTid0Picが、０に等しいTemporalIdおよび現在のピクチャのnuh_layer_idに等しいnuh_layer_idを有し、ＲＡＳＬピクチャ、ＲＡＤＬピクチャ、またはサブレイヤ非参照ピクチャではない復号順の前のピクチャであるとし、prevPicOrderCntが、prevTid0PicのPicOrderCntValに等しいとする。
− 変数prevPicOrderCntLsbは、prevPicOrderCnt＆（MaxPicOrderCntLsb−１）に等しくなるように設定される［ｒｅｍｏｖｅｄ：“prevTid0Picのslice_pic_order_cnt_lsb”］。
− 変数prevPicOrderCntMsbは、prevPicOrderCnt−prevPicOrderCntLsbに等しくなるように設定される［ｒｅｍｏｖｅｄ：“prevTid0PicのPicOrderCntMsb”］。
現在のピクチャの変数ＰｉｃＯｒｄｅｒＣｎｔＭｓｂは次のように導出される。
− 現在のピクチャが、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャである場合、PicOrderCntMsbは０に等しくなるように設定される。
− それ以外の場合、PicOrderCntMsbは次のように導出される。

PicOrderCntValは次のように導出される。

注意１−slice_pic_order_cnt_lsbがＩＤＲピクチャについて０であると推測されるので、すべてのＩＤＲピクチャは、０に等しいPicOrderCntValを有し、prevPicOrderCntLsbとprevPicOrderCntMsbの両方は、０に等しくなるように設定される。
poc_msb_reset_flagが１に等しいとき、ＤＰＢにあり、現在のピクチャと同じレイヤに属する各ピクチャのPicOrderCntValは、PicOrderCntMsbだけデクリメントされる。
poc_lsb_reset_flagが１に等しいとき、ＤＰＢにあり、現在のピクチャと同じレイヤに属する各ピクチャのPicOrderCntValは、slice_pic_order_cnt_lsbだけデクリメントされる。
PicOrderCntValの値は、両端値を含む２³¹〜２³¹−１の範囲内であるものとする。あるＣＶＳにおいて、同じレイヤの任意の２つのコード化ピクチャのPicOrderCntVal値は、同じでないものとする。
関数PicOrderCnt（picX）は、次のように指定される。
PicOrderCnt（picX）＝ピクチャpicXのPicOrderCntVal (8-3)
関数DiffPicOrderCnt（picA，picB）は、次のように指定される。
DiffPicOrderCnt（picA，picB）＝PicOrderCnt（picA）− PicOrderCnt（picB） (8-4)
ビットストリームは、両端値を含む−２¹⁵〜２¹⁵−１の範囲内ではない、復号プロセスにおいて使用されるDiffPicOrderCnt（picA，picB）の値を生じるデータを含まないものとする。
注意２−Ｘを現在のピクチャとし、ＹおよびＺを同じシーケンス中の２つの他のピクチャとし、ＹおよびＺは、DiffPicOrderCnt（Ｘ，Ｙ）とDiffPicOrderCnt（Ｘ，Ｚ）の両方が正であり、または両方が負であるとき、Ｘからの同じ出力順方向であると見なされる。
参照ピクチャセットのための復号プロセス
このプロセスは、スライスヘッダの復号の後で、ただしどのコーディングユニットの復号にも先立って、および８．３．３項において指定されるようなスライスの参照ピクチャリスト構築のための復号プロセスに先立って、ピクチャごとに一度呼び出される。このプロセスは、「参照のために使用されない」または「長期の参照のために使用される」として標識されているＤＰＢにおける１つまたは複数の参照ピクチャをもたらし得る。
注意１−ＲＰＳは、現在および将来のコード化ピクチャの復号プロセスにおいて使用される、参照ピクチャの絶対的記述である。ＲＰＳシグナリングは、ＲＰＳに含まれるすべての参照ピクチャが明確にリストされるという点で、明示的である。
ＤＰＢにおける復号されたピクチャは、「参照のために使用されない」、「短期の参照のために使用される」、または「長期の参照のために使用される」と標識され得るが、復号プロセスの動作の間の所与の瞬間にはこれら３つの間の１つのみマークされ得る。これらの標識のうちの１つをピクチャに割り当てることは、適用可能であるとき、これらの標識のうちの別のものを暗黙的に除去する。ピクチャが「参照のために使用される」ものとして標識されるものとして言及される場合、このことは、「短期の参照のために使用される」または「長期の参照のために使用される」（ただし両方ではない）ものとして標識されているピクチャに集合的に言及する。
現在のピクチャが、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャであるとき、（あるとしたら）現在ＤＰＢにあるすべての参照ピクチャは、「参照のために使用されない」として標識される。
短期参照ピクチャは、そのPicOrderCntVal値によって識別される。長期参照ピクチャは、そのPicOrderCntVal値またはそれらのslice_pic_order_cnt_lsb値によって識別される。
ピクチャオーダーカウント値の５つのリストは、ＲＰＳを導出するために構築される。これらの５つのリストは、それぞれ要素のNumPocStCurrBefore、NumPocStCurrAfter、NumPocLtFoll、NumPocLtCurr、およびNumPocLtFoll番号を有するPocStCurrBefore、PocStCurrAfter、PocStFoll, PocLtCurr、およびPocLtFollである。５つのリストおよび５つの変数は、次のように導出される。
− 現在のピクチャがＩＤＲピクチャである場合、PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr、およびPocLtFoll areがすべて空に設定され、NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr、およびNumPocLtFollがすべて０に等しくなるように設定される。
− それ以外の場合、以下が適用される。

ここで、PicOrderCntValは、８．３．１項において指定されている現在のピクチャのピクチャオーダーカウントである。
注意２−両端値を含む０〜num_short_term_ref_pic_sets−１の範囲内にあるCurrRpsIdxの値は、アクティブなＳＰＳからの短期ＲＰＳ候補が使用されていることを示し、ここにおいて、CurrRpsIdxは、アクティブなＳＰＳにおいてシグナリングされる短期ＲＰＳ候補のリストへの短期ＲＰＳ候補のインデックスである。num_short_term_ref_pic_setsに等しいCurrRpsIdxは、現在のピクチャの短期ＲＰＳがスライスヘッダで直接シグナリングされることを示す。
両端値を含む０〜NumPocLtCurr−１の範囲内にある各ｉについて、CurrDeltaPocMsbPresentFlag［ｉ］が１に等しいとき、以下の条件が適用されることが、ビットストリームコンフォーマンスの要件である。
例２

[0065]以下の説明は、本開示による第２の例を指す。以下のシンタックスおよびセマンティクスは、一般に、ＨＥＶＣＷＤ１０における対応するセクションを指す。上述のように、イタリック体のテキストは、提案された追加を示し、［ｒｅｍｏｖｅｄ：“”］は、提案された削除を示す。

[0066]以下、一般のスライスセグメントヘッダのシンタックスおよびセマンティクスについて最初に説明する。

[0067]代替的に、シンタックスは次のように示され得る。

[0068]以下、一般のスライスセグメントヘッダのセマンティクスについて説明する。
一般のスライスセグメントヘッダセマンティクス
１に等しいpoc_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントが０に等しいことを指定する。０に等しいpoc_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントが０に等しくても等しくなくてもよいことを指定する。
存在するとき、現在のピクチャがＩＤＲピクチャではなく、現在のアクセスユニットにおける少なくとも１つのピクチャがＩＤＲピクチャであるとき、poc_reset_flagの値は１に等しいものとする。
存在しないとき、poc_reset_flagの値は０に等しくなると推測される。

[0069]したがって、ビデオエンコーダ２０は、ＩＲＡＰピクチャではなく、たとえば、異なるビデオコーディングレイヤにおいてＩＲＡＰピクチャを含むアクセスユニットにあるピクチャについて１の値を有するように、poc_reset_flagを設定することができる。同様に、ビデオデコーダ３０は、ＩＲＡＰピクチャでないピクチャについて１の値を受信すると、ピクチャのＰＯＣ値をリセットし、必要に応じて同じレイヤおよび同じコード化ビデオシーケンスにおける他のピクチャのＰＯＣ値を調整することができる。

[0070]以下、この第２の例による提案された復号プロセスの変更について説明する。
復号プロセスの変更
スライス復号プロセス
８．３．１ピクチャオーダーカウントのための復号プロセス
このプロセスの出力は、ＰｉｃＯｒｄｅｒＣｎｔＶａｌであり、現在のピクチャのピクチャオーダーカウントである。
ピクチャオーダーカウントは、マージモードおよび動きベクトル予測で動きパラメータを導出するため、およびデコーダコンフォーマンスチェックのために、ピクチャを識別するために使用される（Ｃ．５項を参照）。
各コード化ピクチャは、PicOrderCntValと示されるピクチャオーダーカウント変数に関連付けられる。
現在のピクチャが、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャでないとき、変数prevPicOrderCntLsbおよびprevPicOrderCntMsbは、次のように導出される。
− prevTid0Picが、０に等しいTemporalIdおよび現在のピクチャのnuh_layer_id に等しいnuh_layer_idを有し、ＲＡＳＬピクチャ、ＲＡＤＬピクチャ、またはサブレイヤ非参照ピクチャではない復号順の前のピクチャであるとし、prevPicOrderCntが、prevTid0PicのPicOrderCntValに等しいとする。
− 変数prevPicOrderCntLsbは、prevPicOrderCnt＆（MaxPicOrderCntLsb−１）に等しくなるように設定される［ｒｅｍｏｖｅｄ：“prevTid0Picのslice_pic_order_cnt_lsb”］。
− 変数prevPicOrderCntMsbは、prevPicOrderCnt−prevPicOrderCntLsbに等しくなるように設定される［ｒｅｍｏｖｅｄ：“prevTid0PicのPicOrderCntMsb”］。
現在のピクチャの変数PicOrderCntMsbは次のように導出される。
− 現在のピクチャが、NoRaslOutputFlagが１に等しいＩＲＡＰピクチャである場合、PicOrderCntMsbは０に等しくなるように設定される。
− それ以外の場合、PicOrderCntMsbは次のように導出される。

PicOrderCntValは次のように導出される。
PicOrderCntVal＝PicOrderCntMsb＋slice_pic_order_cnt_lsb (8-2)
注意１−slice_pic_order_cnt_lsbがＩＤＲピクチャについて０であると推測されるので、すべてのＩＤＲピクチャは、０に等しいPicOrderCntValを有し、prevPicOrderCntLsbとprevPicOrderCntMsbの両方は、０に等しくなるように設定される。
poc_reset_flagが１に等しいとき、以下が順番に適用される。
− ＤＰＢにあり、現在のピクチャと同じレイヤに属する各ピクチャのPicOrderCntValは、PicOrderCntValだけデクリメントされる。
− PicOrderCntValは０に設定される。
PicOrderCntValの値は、両端値を含む２³¹〜２³¹−１の範囲内であるものとする。あるＣＶＳにおいて、同じレイヤの任意の２つのコード化ピクチャのためのPicOrderCntVal値は、同じでないものとする。
関数PicOrderCnt（picX）は、次のように指定される。
PicOrderCnt（picX）＝ピクチャpicXのPicOrderCntVal (8-3)
関数DiffPicOrderCnt（picA，picB）は、次のように指定される。
DiffPicOrderCnt（picA, picB）＝PicOrderCnt（picA）−PicOrderCnt（picB） (8-4)
ビットストリームは、両端値を含む−２¹⁵〜２¹⁵−１の範囲内ではない、復号プロセスにおいて使用されるDiffPicOrderCnt（picA，picB）の値を生じるデータを含まないものとする。
注意２−Ｘを現在のピクチャとし、ＹおよびＺを同じシーケンス中の２つの他のピクチャとし、ＹおよびＺは、DiffPicOrderCnt（Ｘ，Ｙ）とDiffPicOrderCnt（Ｘ，Ｚ）の両方が正であり、または両方が負であるとき、Ｘからの同じ出力順方向であると見なされる。

[0071]この例における参照ピクチャセットのための復号プロセスは、実施例１について説明したものと同じであり得る。

[0072]このようにして、ビデオエンコーダ２０は、ピクチャのＰＯＣ値の少なくとも一部がリセットされるべきかどうかを示すシンタックス要素（たとえば、poc_msb_reset_flagまたはpoc_reset_flag）のための値を設定するように構成され得る。上記で説明したように、ビデオエンコーダ２０は、少なくとも１つのＩＲＡＰピクチャを含むアクセスユニットにピクチャが含まれるとき、ＰＯＣ値がリセットされるべきであることを示すためにシンタックス要素の値を設定するように構成され得る。ビデオデコーダ３０は、同様に、ピクチャのＰＯＣ値の少なくとも一部（または全ＰＯＣ値）をリセットすべきかどうかを、シンタックス要素の値から決定することができる。たとえば、シンタックス要素がpoc_msb_reset_flagである場合、ビデオデコーダ３０は、ピクチャのＰＯＣ値のＭＳＢをリセットすることができる。シンタックス要素がpoc_reset_flagである場合、ビデオデコーダ３０は、ピクチャの全ＰＯＣ値をリセットすることができる。

[0073]加えて、ビデオエンコーダ２０およびビデオデコーダ３０は、調整されるべきＰＯＣ値に対するＰＯＣ値間の差がリセットの前と後で一定のままであるように、同じレイヤおよび同じコード化ビデオシーケンス（ＣＶＳ）における他のピクチャのＰＯＣ値を調整することができる。このように、ビデオエンコーダ２０が、レイヤ間予測を使用してピクチャのブロックを符号化するとき、（上述したＰＯＣ調整の後の）ピクチャがＮのＰＯＣ値を有する場合、ブロックは、ＮのＰＯＣ値を使用して参照ピクチャを識別することができる。すなわち、調整の後、アクセスユニットにおける各ピクチャは、同じＰＯＣ値を有する。

[0074]さらに、ビデオデコーダ３０は、アクセスユニットの境界を検出するように構成され得る。

[0075]ビデオエンコーダ２０およびビデオデコーダ３０は各々、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せなどの様々な適切なエンコーダ回路のいずれかとして実装され得る。技法が部分的にソフトウェアで実施される場合、デバイスは、ソフトウェアのための命令を、適当な、非一時的なコンピュータ可読媒体に記憶し、本開示の技法を実行するための１つまたは複数のプロセッサを使用して、ハードウェアで命令を実行し得る。ビデオエンコーダ２０およびビデオデコーダ３０の各々は、１つまたは複数のエンコーダまたはデコーダに含まれ得、そのいずれかは、組み合わされたエンコーダ／デコーダ（コーデック）の一部として、それぞれのデバイスに統合され得る。

[0076]ビデオエンコーダ２０およびビデオデコーダ３０は各々、一般に、上述したように、ＨＥＶＣＷＤ１０、ＭＶ−ＨＥＶＣＷＤ３、および／またはＳＨＶＣＷＤ１、あるいは本開示で説明する技法が有用である他の類似の規格または拡張に適合して動作し得る。ＨＥＶＣ規格は、たとえば、ＩＴＵ−ＴＨ．２６４／ＡＶＣに従う既存のデバイスに対して、ビデオコーディングデバイスのいくつかの付加された機能を規定する。たとえば、Ｈ．２６４は、９つのイントラ予測符号化モードを提供するが、ＨＥＶＣ規格は、３３ものイントラ予測符号化モードを提供し得る。

[0077]概して、ビデオフレームまたはピクチャは、ルーマサンプルとクロマサンプルの両方を含む一連のツリーブロックまたは最大コーディングユニット（ＬＣＵ）に分割され得る。ＨＥＶＣコーディングプロセスにおけるツリーブロックは、Ｈ．２６４規格のマクロブロックと同様の目的を有する。スライスは、いくつかの連続したツリーブロックを、コーディングの順序で含む。ビデオフレームまたはピクチャは、１つまたは複数のスライスに区分化される場合がある。各ツリーブロックは、４分木に従って、コーディングユニット（ＣＵ）に分割され得る。たとえば、４分木のルートノードとしてのツリーブロックは、４つの子ノードに分割され得、各子ノードは、次に、親ノードとなり、別の４つの子ノードに分割され得る。４分木のリーフノードとしての、最終的な、分割されていない子ノードは、コーディングノード（すなわち、コーディングされたビデオブロック）を備える。コード化ビットストリームに関連付けられたシンタックスデータは、ツリーブロックが分割され得る最大回数を定義することができ、コーディングノードの最小サイズも定義することができる。

[0078]ＣＵは、コーディングノードと、コーディングノードに関連する予測ユニット（ＰＵ：prediction unit）および変換ユニット（ＴＵ：transform unit）とを含む。ＣＵのサイズは、コーディングノードのサイズに対応し、形状において正方形でなければならない。ＣＵのサイズは、８×８ピクセルから、最大で６４×６４ピクセルまたはそれを越えるツリーブロックのサイズまで変動し得る。各ＣＵは、１つまたは複数のＰＵと、１つまたは複数のＴＵとを含んでいることがある。ＣＵと関連したシンタックスデータは、たとえば、ＣＵの１つまたは複数のＰＵへの区分を記述し得る。区分モードは、ＣＵがスキップであるか、または、ダイレクトモードで符号化されるか、イントラ予測モードで符号化されるか、もしくはインター予測モードで符号化されるかの間で、異なり得る。ＰＵは、形状において非正方形に区分されてもよい。ＣＵと関連したシンタックスデータは、また、たとえば、ＣＵの１つまたは複数のＴＵへの、４分木に従う区分を記述し得る。ＴＵは、形状が方形または非方形であり得る。

[0079]ＨＥＶＣ規格は、ＣＵごとに異なり得るＴＵに従う変換を可能にする。ＴＵは、通常、区分されたＬＣＵのために定義された、所与のＣＵ内のＰＵのサイズに基づいてサイズ変更されるが、これは常にそうであるとは限らない。ＴＵは、通常、ＰＵと同じサイズであるか、またはＰＵよりも小さい。いくつかの例では、ＣＵに対応する残差サンプルは、「残差４分木」（ＲＱＴ）と呼ばれる４分木構造を使用して、より小さいユニットにさらに分割され得る。ＲＱＴのリーフノードは変換ユニット（ＴＵ）と呼ばれることがある。ＴＵと関連したピクセル差分の値は、変換係数を生成するために変換され得、変換係数は量子化され得る。

[0080]概して、ＰＵは、予測プロセスに関係するデータを含む。たとえば、ＰＵがイントラモード符号化されるとき、ＰＵは、そのＰＵ用のイントラ予測モードを記述するデータを含む場合がある。別の例として、ＰＵがインターモード符号化されるとき、ＰＵは、そのＰＵ用の動きベクトルを定義するデータを含む場合がある。ＰＵの動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度（たとえば、１／４ピクセル精度もしくは１／８ピクセル精度）、動きベクトルが指す参照ピクチャ、および／または動きベクトル用の参照ピクチャリスト（たとえば、RefPicList0（Ｌ０）もしくはRefPicList1（Ｌ１））を記述することができる。

[0081]概して、ＴＵは、変換プロセスと量子化プロセスとのために使用される。１つまたは複数のＰＵを有する所与のＣＵは、１つまたは複数の変換ユニット（ＴＵ）を含む場合もある。予測の後に、ビデオエンコーダ２０は、ＰＵに対応する残差値を計算し得る。残差値は、エントロピーコーディングのためのシリアル化変換係数を生成するために、ＴＵを使用して変換係数に変換され、量子化され、走査され得るピクセル差分値を備える。本開示では、一般に、ＣＵのコーディングノードを指すために「ビデオブロック」という用語を使用する。いくつかの特定の場合において、本開示では、コーディングノードならびにＰＵおよびＴＵを含む、ツリーブロック、すなわち、ＬＣＵまたはＣＵを指すためにも「ビデオブロック」という用語を使用し得る。

[0082]たとえば、ＨＥＶＣ規格に従うビデオコーディングでは、ビデオフレームがコーディングユニット（ＣＵ）と予測ユニット（ＰＵ）と変換ユニット（ＴＵ）とに区分され得る。ＣＵは、概して、ビデオ圧縮のために様々なコーディングツールが適用される基本ユニットとして働く画像領域を指す。ＣＵは、一般に正方形の形状を有し、たとえば、ＩＴＵ−ＴＨ．２６４などの他のビデオコーディング規格の下でのいわゆる「マクロブロック」と同様であると見なされ得る。

[0083]より良いコーディング効率を達成するために、ＣＵは、それが含んでいるビデオデータに応じて可変サイズを有し得る。すなわち、ＣＵは、より小さいブロックまたはサブＣＵに区分または「分割」され得、その各々はＣＵと呼ばれることもある。さらに、サブＣＵに分割されない各ＣＵは、それぞれ、ＣＵの予測および変換のために１つまたは複数のＰＵとＴＵとにさらに区分され得る。

[0084]ＰＵは、Ｈ．２６４などの他のビデオコーディング規格の下でのいわゆるブロックのパーティションと同様であると見なされ得る。ＰＵは、「残差」係数を生成するためにブロックについての予測が実行されるベースである。ＣＵの残差係数は、ＣＵのビデオデータと、ＣＵの１つまたは複数のＰＵを使用して決定されたＣＵについての予測データとの間の差を表す。詳細には、１つまたは複数のＰＵは、ＣＵが予測のためにどのように区分されるかを指定し、ＣＵの各パーティション内に含まれているビデオデータを予測するためにどの予測モードが使用されるかを指定する。

[0085]ＣＵの１つまたは複数のＴＵは、ＣＵのための残差変換係数のブロックを生成するために、ブロックにどの変換が適用されるかに基づいて、ＣＵの残差係数のブロックのパーティションを指定する。１つまたは複数のＴＵはまた、適用される変換のタイプに関連し得る。変換は、残差係数をピクセル領域または空間領域から周波数領域などの変換領域に変換する。さらに、１つまたは複数のＴＵは、量子化残差変換係数のブロックを生成するために残差変換係数の得られたブロックにどの量子化が適用されるかに基づいてパラメータを指定し得る。残差変換係数は、場合によっては、係数を表すために使用されるデータの量を低減するために量子化され得る。

[0086]ＣＵは、一般に、Ｙとして示される１つのルミナンス成分とＵおよびＶとして示される２つのクロミナンス成分とを含む。言い換えれば、サブＣＵにさらに分割されない所与のＣＵは、Ｙ成分とＵ成分とＶ成分とを含み得、その各々は、前に説明したように、ＣＵの予測および変換のために１つまたは複数のＰＵとＴＵとにさらに区分され得る。たとえば、ビデオサンプリングフォーマットに応じて、サンプルの数で表されるＵ成分およびＶ成分のサイズは、Ｙ成分のサイズと同じであるかまたはそれとは異なり得る。したがって、予測、変換、および量子化に関して上記で説明した技法は、所与のＣＵのＹ成分、Ｕ成分およびＶ成分の各々について実行され得る。

[0087]ＣＵを符号化するために、ＣＵの１つまたは複数のＰＵに基づいて、ＣＵのための１つまたは複数の予測子が最初に導出される。予測子は、ＣＵについての予測データを含んでいる参照ブロックであり、前に説明したように、ＣＵのための対応するＰＵに基づいて導出される。たとえば、ＰＵは、予測データが決定される際の対象となるＣＵのパーティションと、予測データを決定するために使用される予測モードとを示す。予測子は、イントラ（Ｉ）予測（すなわち、空間的予測）モードまたはインター（ＰまたはＢ）予測（すなわち、時間的予測）モードのいずれかを通して導出され得る。したがって、いくつかのＣＵは、同じフレーム中の隣接参照ブロックまたはＣＵに対する空間的予測を使用してイントラコーディング（Ｉ）され得るが、一方他のＣＵは、他のフレーム中の参照ブロックまたはＣＵに対してインターコーディング（ＰまたはＢ）され得る。

[0088]ＣＵの１つまたは複数のＰＵに基づいて１つまたは複数の予測子を識別するときに、１つまたは複数のＰＵに対応するＣＵの元のビデオデータと１つまたは複数の予測子中に含まれているＣＵについての予測データとの間の差が計算される。予測残差とも呼ばれるこの差は、残差係数を備え、前に説明したように、１つまたは複数のＰＵと１つまたは複数の予測子とによって指定されたＣＵの部分間のピクセル差分を指す。残差係数は、概して、１つまたは複数のＰＵのＣＵに対応する２次元（２Ｄ）アレイに構成される。

[0089]さらなる圧縮を達成するために、予測残差は、概して、たとえば、離散コサイン変換（ＤＣＴ：discrete cosine transform）、整数変換、カルーネンレーベ（Karhunen-Loeve）（Ｋ−Ｌ）変換、または別の変換を使用して変換される。変換は、同じく前に説明したように、空間領域中の予測残差、すなわち、残差係数を変換領域、たとえば、周波数領域中の残差変換係数に変換する。変換係数はまた、概して、ＣＵの１つまたは複数のＴＵに対応する２Ｄアレイに構成される。さらなる圧縮のために、残差変換係数は、同じく前に説明したように、場合によっては、係数を表すために使用されるデータの量を低減するために量子化され得る。

[0090]またさらなる圧縮を達成するために、エントロピーコーダは、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ：Context Adaptive Binary Arithmetic Coding）、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ：Context Adaptive Variable Length Coding）、確率間隔区分エントロピーコーディング（ＰＩＰＥ：Probability Interval Partitioning Entropy Coding）、または別のエントロピーコーディング方法を使用して、得られた残差変換係数を後で符号化する。エントロピーコーディングは、他のＣＵと比較して、係数によって表される、ＣＵのビデオデータに固有の統計的冗長性を低減または除去することによって、このさらなる圧縮を達成し得る。

[0091]ビデオシーケンスは、一般に、一連のビデオフレームまたはピクチャを含む。ピクチャグループ（ＧＯＰ）は、一般に、ビデオピクチャのうちの一連の１つまたは複数を備える。ＧＯＰは、ＧＯＰのヘッダの中、１つまたは複数のピクチャのヘッダの中、またはその他の所にシンタックスデータを含み得、シンタックスデータは、ＧＯＰに含まれるいくつかのピクチャを記述する。ピクチャの各スライスは、それぞれのスライスのための符号化モードを記述するスライスシンタックスデータを含む場合がある。ビデオエンコーダ２０は、通常、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに作用する。ビデオブロックは、ＣＵ内のコーディングノードに対応する場合がある。ビデオブロックは、固定のまたは変化するサイズを有し得、規定されたコーディング規格に従って、サイズは異なり得る。

[0092]一例として、ＨＥＶＣは、様々なＰＵサイズでの予測をサポートする。特定のＣＵのサイズが２Ｎ×２Ｎとすれば、ＨＥＶＣは、２Ｎ×２ＮまたはＮ×ＮのＰＵサイズでのイントラ予測、および２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、またはＮ×Ｎの対称なＰＵサイズでのインター予測をサポートする。ＨＥＶＣは、また、２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズでのインター予測のための、非対称な区分をサポートする。非対称な区分では、ＣＵの一方向は区分されず、一方他の方向は２５％および７５％に区分される。ＣＵの２５％パーティションに対応する部分は、「ｎ」、ならびにそれに続く「Ｕｐ」、「Ｄｏｗｎ」、「Ｌｅｆｔ」、または「Ｒｉｇｈｔ」の表示によって示される。したがって、たとえば、「２Ｎ×ｎＵ」は、上部で２Ｎ×０．５ＮのＰＵ、および下部で２Ｎ×１．５ＮのＰＵに水平に区分される２Ｎ×２ＮのＣＵを参照する。

[0093]本開示では、「Ｎ×Ｎ」および「ＮｂｙＮ」は、垂直および水平の寸法の観点からビデオブロックのピクセル寸法を参照するために、たとえば、１６×１６ピクセルまたは１６ｂｙ１６ピクセルのように、互換的に使用され得る。一般に、１６×１６ブロックは、垂直方向に１６ピクセル（ｙ＝１６）、および水平方向に１６ピクセル（ｘ＝１６）を有する。同様に、Ｎ×Ｎブロックは、一般に、垂直方向にＮピクセル、および水平方向にＮピクセルを有し、ここでＮは、非負の整数値を表す。ブロックのピクセルは、行および列に配列され得る。さらに、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要はない。たとえば、ブロックは、ＮｘＭピクセルを備え得、ここで、Ｍは、必ずしもＮに等しいとは限らない。

[0094]ＣＵのＰＵを使用するイントラ予測またはインター予測のコーディングの後で、ビデオエンコーダ２０は、ＣＵのＴＵに対する残差データを計算し得る。ＰＵは、（ピクセル領域とも呼ばれる）空間領域においてピクセルデータを備え得、ＴＵは、変換、たとえば、残差ビデオデータへの離散コサイン変換（ＤＣＴ）、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、ＰＵに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ２０は、ＣＵに対する残差データを含むＴＵを形成し、次いで、ＣＵのための変換係数を生成するためにＴＵを変換し得る。

[0095]変換係数を生成するための任意の変換の後で、ビデオエンコーダ２０は、変換係数の量子化を実行し得る。量子化は、一般に、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を実現するプロセスを指す。量子化プロセスは、係数の一部または全部に関連付けられたビット深度を低減させることができる。たとえば、ｎビットの値は、量子化中にｍビットの値に端数を丸められてよく、ここで、ｎはｍよりも大きい。

[0096]いくつかの例では、ビデオエンコーダ２０は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ２０は適応走査を実施し得る。量子化変換係数を走査して１次元のベクトルを形成した後、ビデオエンコーダ２０は、たとえば、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ：syntax-based context-adaptive binary arithmetic coding）、確率間隔区分エントロピー（ＰＩＰＥ）コーディングまたは別のエントロピー符号化の方法に従って、１次元のベクトルをエントロピー符号化し得る。ビデオエンコーダ２０は、また、ビデオデコーダ３０によるビデオデータの復号での使用のために、符号化ビデオデータと関連したシンタックス要素をエントロピー符号化する。

[0097]ＣＡＢＡＣを実行するために、ビデオエンコーダ２０は、コンテキストモデル内のコンテキストを、送信されるべきシンボルに割り当て得る。コンテキストは、たとえば、シンボルの隣接する値がゼロ以外であるか否かに関係し得る。ＣＡＶＬＣを実行するために、ビデオエンコーダ２０は、送信されるべきシンボルに対する可変長符号を選択し得る。ＶＬＣの中の符号語は、比較的に短い符号が、より起こりそうなシンボルに対応し、一方より長い符号が、より起こりそうでないシンボルに対応するように、再構築され得る。このようにして、ＶＬＣの使用により、たとえば、送信されるべき各シンボルに対して等長の符号語を使用することを越える、ビットの節約が達成され得る。起こりそうなことの決定は、シンボルに割り当てられたコンテキストに基づき得る。

[0098]ビデオエンコーダ２０およびビデオデコーダ３０は、本開示の例示的な技法を実装するように構成され得る。ビデオエンコーダ２０およびビデオデコーダ３０は、一般にビデオコーダと呼ばれることがある。

[0099]たとえば、ビデオデコーダ３０は、現在のピクチャのピクチャオーダーカウント（ＰＯＣ）値が、現在のピクチャのＰＯＣ値の１組の最下位ビット（ＬＳＢ）に等しくなるようにリセットされるかどうかを指定する第１のシンタックス要素を受信し、現在のピクチャのＰＯＣ値が現在のピクチャのＰＯＣ値のＬＳＢの組に等しくなるようにリセットされることを第１のシンタックス要素が指定するとき、現在のピクチャのＰＯＣ値と、同じレイヤにおけるピクチャのうちの任意のもののＰＯＣ値との間の差が、現在のピクチャのＰＯＣ値がリセットされる前と同じままであるように、現在のピクチャと同じコーディングレイヤにおける他のピクチャのＰＯＣ値をデクリメントし、デクリメントされたＰＯＣ値を使用して、現在のピクチャの少なくとも一部と他のピクチャとを復号するように構成され得る。他のピクチャは、短期参照ピクチャと長期参照ピクチャとを含み得、ビデオデコーダ３０は、短期参照ピクチャおよび長期参照ピクチャのＰＯＣ値をデクリメントし得る。

[0100]現在のピクチャのＰＯＣ値がＰＯＣ値のＬＳＢの組に等しくなるようにリセットされることを第１のシンタックス要素が指定するとき、ビデオデコーダ３０は、現在のピクチャのＰＯＣ値とＤＰＢにおけるピクチャのうちの任意のもののＰＯＣ値との間の差が、現在のピクチャのＰＯＣ値がリセットされる前と同じままであるように、復号ピクチャバッファ（ＤＰＢ）における他のピクチャのＰＯＣ値をデクリメントすることができる。

[0101]現在のピクチャのＰＯＣ値が現在のピクチャのＰＯＣ値のＬＳＢの組に等しくなるようにリセットされることを第１のシンタックス要素が指定するとき、現在のピクチャのＰＯＣ値の最上位ビット（ＭＳＢ）は、ゼロにリセットされる。一例では、現在のピクチャのＰＯＣ値のＬＳＢおよびＭＳＢは、相互排他的である。

[0102]いくつかの例では、ビデオデコーダ３０は、現在のピクチャのＰＯＣ値のＬＳＢがゼロにリセットされるかどうかを指定する第２のシンタックス要素を受信することができる。第１および／または第２のシンタックス要素は各々、フラグでもよく、シンタックス要素の一方または両方は、スライスヘッダにおいて受信され得る。現在のピクチャは、ＩＤＲ、ＣＲＡ、またはＢＬＡピクチャのうちの１つを備え得る。

[0103]別の例では、ビデオデコーダ３０は、現在のピクチャのピクチャオーダーカウント（ＰＯＣ）値がゼロに等しくなるようにリセットされるかどうかを指定する第１のシンタックス要素を受信し、現在のピクチャのＰＯＣ値がゼロに等しくなるようにリセットされることを第１のシンタックス要素が指定するとき、現在のピクチャがレイヤ０よりも大きいレイヤにある場合、現在のピクチャをゼロに等しくなるようにリセットし、リセットされたＰＯＣ値を使用して、現在のピクチャを復号するように構成され得る。

[0104]一例では、現在のピクチャは、非ＩＤＲピクチャである。シンタックス要素は、たとえばidr_au_present_flagなどのフラグを備え得る。シンタックス要素は、スライスヘッダにおいて受信され得る。現在のピクチャがＩＤＲピクチャであるとき、シンタックス要素は、現在のピクチャのＰＯＣ値がゼロに等しくなるようにリセットされることを常に指定する。

[0105]ビデオエンコーダ２０は、本開示の例に従って方法を実行するようにも構成され得る。たとえば、ビデオエンコーダ２０は、現在のピクチャのピクチャオーダーカウント（ＰＯＣ）値が、現在のピクチャのＰＯＣ値の１組の最下位ビット（ＬＳＢ）に等しくなるようにリセットされるかどうかを指定する第１のシンタックス要素を生成し、現在のピクチャのＰＯＣ値が現在のピクチャのＰＯＣ値のＬＳＢの組に等しくなるようにリセットされることを第１のシンタックス要素が指定するとき、現在のピクチャのＰＯＣ値と、同じレイヤにおけるピクチャのうちの任意のもののＰＯＣ値との間の差が、現在のピクチャのＰＯＣ値がリセットされる前と同じままであるように、現在のピクチャと同じコーディングレイヤにおける他のピクチャのＰＯＣ値をデクリメントし、デクリメントされたＰＯＣ値を使用して、現在のピクチャの少なくとも一部と他のピクチャとを符号化するように構成され得る。

[0106]現在のピクチャのＰＯＣ値がＰＯＣ値のＬＳＢの組に等しくなるようにリセットされることを第１のシンタックス要素が指定するとき、ビデオエンコーダ２０は、現在のピクチャのＰＯＣ値とＤＰＢにおけるピクチャのうちの任意のもののＰＯＣ値との間の差が、現在のピクチャのＰＯＣ値がリセットされる前と同じままであるように、復号ピクチャバッファ（ＤＰＢ）における他のピクチャのＰＯＣ値をデクリメントすることができる。

[0107]現在のピクチャのＰＯＣ値が現在のピクチャのＰＯＣ値のＬＳＢの組に等しくなるようにリセットされることを第１のシンタックス要素が指定するとき、現在のピクチャのＰＯＣ値の最上位ビット（ＭＳＢ）は、ゼロにリセットされる。一例では、現在のピクチャのＰＯＣ値のＬＳＢおよびＭＳＢは、相互排他的である。

[0108]ビデオエンコーダ２０は、現在のピクチャのＰＯＣ値のＬＳＢがゼロにリセットされるかどうかを指定する第２のシンタックス要素を生成することができる。第１および／または第２のシンタックス要素は各々、フラグでもよく、シンタックス要素の一方または両方は、スライスヘッダにおいて受信され得る。現在のピクチャは、ＩＤＲ、ＣＲＡ、またはＢＬＡピクチャのうちの１つを備え得る。

[0109]別の例では、ビデオエンコーダ２０は、現在のピクチャのピクチャオーダーカウント（ＰＯＣ）値がゼロに等しくなるようにリセットされるかどうかを指定する第１のシンタックス要素を生成し、現在のピクチャのＰＯＣ値がゼロに等しくなるようにリセットされることを第１のシンタックス要素が指定するとき、現在のピクチャがレイヤ０よりも大きいレイヤにある場合、現在のピクチャをゼロに等しくなるようにリセットし、リセットされたＰＯＣ値を使用して、現在のピクチャを復号するように構成され得る。現在のピクチャは、非ＩＤＲピクチャとすることができる。シンタックス要素は、たとえばidr_au_present_flagなどのフラグを備え得、フラグは、スライスヘッダにおいてシグナリングされ得る。ピクチャがＩＤＲピクチャであるとき、シンタックス要素は、現在のピクチャのＰＯＣ値がゼロに等しくなるようにリセットされることを常に指定する。

[0110]図２は、本開示で説明する技法を実施し得る例示的なビデオエンコーダ２０を示すブロック図である。ビデオエンコーダ２０は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実行してよい。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接するフレーム内またはピクチャ内のビデオの、時間的な冗長性を低減または除去するために、時間的予測に依拠する。イントラモード（Ｉモード）は、いくつかの空間ベースの圧縮モードのいずれかを指し得る。単方向予測（Ｐモード）または双予測（Ｂモード）などのインターモードは、いくつかの時間ベースの圧縮モードのいずれかを指すことがある。

[0111]図２の例では、ビデオエンコーダ２０は、区分ユニット４０と、予測処理ユニット４２と、参照ピクチャメモリ６４と、加算器５０と、変換処理ユニット５２と、量子化処理ユニット５４と、エントロピー符号化ユニット５６とを含む。予測処理ユニット４２は、動き推定ユニット４４と、動き補償ユニット４６と、イントラ予測ユニット４８とを含む。ビデオエンコーダ２０は、ビデオブロック再構成に関して、逆量子化処理ユニット５８と、逆変換処理ユニット６０と、加算器６２も含む。再構成されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタ処理するために、デブロッキングフィルタ（図２に図示せず）も含まれ得る。所望であれば、デブロッキングフィルタは、通常、加算器６２の出力をフィルタするはずである。デブロッキングフィルタに加えて追加的なループフィルタ（インループまたはポストループ）が使用されてもよい。

[0112]様々な例では、ビデオエンコーダ２０のユニットは、本開示の技法を実行する役割を担い得る。また、一部の例では、本開示の技術は、ビデオエンコーダ２０のユニットの１つまたは複数の中で分割され得る。

[0113]図２に示されているように、ビデオエンコーダ２０はビデオデータを受信し、区分ユニット４０はデータをビデオブロックに区分する。この区分はまた、たとえば、ＬＣＵおよびＣＵの４分木構造に従って、ビデオブロック区分と同様に、スライス、タイル、または他のより大きいユニットへの区分をも含み得る。ビデオエンコーダ２０は概して、符号化すべきビデオスライス内のビデオブロックを符号化する構成要素を示す。スライスは、複数のビデオブロック（場合によってはタイルと呼ばれるビデオブロックの組）に分割されてよい。予測処理ユニット４２は、現在のビデオブロックに関して、エラー結果（たとえば、コーディングレートおよび歪みレベル）に基づいて、複数のイントラコーディングモードのうちの１つまたは複数のインターコーディングモードのうちの１つなど、複数の可能なコーディングモードのうちの１つを選択してよい。予測処理ユニット４２は、得られたイントラコーディング済みブロックまたはインターコーディング済みブロックを加算器５０に供給して残差ブロックを生成し、加算器６２に供給して参照ピクチャとして使用できる符号化ブロックを再構成する。

[0114]予測処理ユニット４２内のイントラ予測ユニット４８は、空間圧縮を行うために、コーディングされるべき現在のブロックと同じピクチャまたはスライス中の１つまたは複数の隣接ブロックに対する現在のビデオブロックのイントラ予測コーディングを実行し得る。予測処理ユニット４２内の動き推定ユニット４４および動き補償ユニット４６は、時間圧縮を行うために、１つまたは複数の参照ピクチャ中の１つまたは複数の予測ブロックに対して現在ビデオブロックのインター予測コーディングを実行する。

[0115]動き推定ユニット４４は、ビデオシーケンスの所定のパターンに従ってビデオスライスのためのインター予測モードを決定するように構成され得る。動き推定ユニット４４と動き補償ユニット４６とは、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット４４によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、参照ピクチャ内の予測ブロックに対する現在ビデオフレームまたはピクチャ内のビデオブロックのＰＵの変位を示し得る。

[0116]予測ブロックは、絶対差分和（ＳＡＤ：sum of absolute difference）、２乗差分和（ＳＳＤ：sum of square difference）、または他の差分メトリックによって決定され得るピクセル差分に関して、コーディングされるべきビデオブロックのＰＵにぴったり一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ２０は、参照ピクチャメモリ６４に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ２０は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定ユニット４４は、フルピクセル位置と分数ピクセル位置とに関して動き探索を実行し、分数ピクセル精度で動きベクトルを出力し得る。

[0117]動き推定ユニット４４は、ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライスの中のビデオブロックのＰＵに対する動きベクトルを計算する。参照ピクチャは、第１の参照ピクチャリスト（リスト０）または第２の参照ピクチャリスト（リスト１）から選択されてよく、それらの参照ピクチャリストの各々は、参照ピクチャメモリ６４に記憶された１つまたは複数の参照ピクチャを識別する。動き推定ユニット４４は、計算された動きベクトルをエントロピー符号化ユニット５６と動き補償ユニット４６とに送る。

[0118]動き補償ユニット４６によって実施される動き補償は、動き推定によって決定された動きベクトルに基づいて予測ブロックをフェッチまたは生成すること、場合によってはサブピクセル精度への補間を実施することを伴い得る。現在のビデオブロックのＰＵの動きベクトルを受信すると、動き補償ユニット４６は、動きベクトルが参照ピクチャリストのうちの１つにおいて指す予測ブロックの位置を特定し得る。ビデオエンコーダ２０は、コーディングされている現在ビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって残差ビデオブロックを形成する。ピクセル差分値は、ブロックの残差データを形成し、ルーマおよびクロマの両方の差分成分を含み得る。加算器５０は、この減算演算を実行する構成要素を表す。動き補償ユニット４６はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ３０により使用するための、ビデオブロックおよびビデオスライスと関連付けられるシンタックス要素を生成することができる。

[0119]さらに、いくつかの場合には、予測処理ユニット４２は、レイヤ間予測を使用してピクチャのブロックを予測することを決定し得る。たとえば、マルチビュービデオデータでは、予測処理ユニット４２は、ビュー間予測を使用して別のビューのピクチャからあるビューのピクチャのブロックを予測することを決定し得る。ビュー間予測の場合、動き推定ユニット４４は、ブロック視差動きベクトル（disparity motion vector）を計算することができ、ここにおいて、視差動きベクトルは、一般に、参照ビューのピクチャにおける参照ブロックの位置を識別する。別の例として、スケーラブルビデオコーディングでは、予測処理ユニット４２は、レイヤ間予測を使用して別のレイヤのピクチャからあるレイヤのピクチャのブロックを予測することを決定し得る。

[0120]レイヤ間予測（ビューは１種類のレイヤと考えられ得るという点で、ビュー間予測を含む）は、同じレイヤにおける、しかし、異なる時間的インスタンスのピクチャにおけるブロックよりもむしろ、異なるレイヤにおける参照ブロックを指す運動ベクトルの使用を伴い得る。一般に、レイヤ間予測は、レイヤ間予測を使用して予測されるブロックを含むピクチャと同じアクセスユニットのピクチャを使用して実行される。したがって、インター予測されたブロックの動きパラメータは、たとえば、ピクチャオーダーカウント（ＰＯＣ）値を使用して参照ピクチャを識別することができる。

[0121]一般に、レイヤ間コーディング拡張（たとえば、ＨＥＶＣに対するマルチビューおよびスケーラブル拡張）の技法は、ＰＯＣ値がアラインされるという仮定、すなわち、同じアクセスユニットにおけるすべてのピクチャは同じＰＯＣ値を有するという仮定に基づいている。これを達成するために、従来の技法は、イントラランダムアクセスポイント（ＩＲＡＰ）ピクチャもアラインしている。しかしながら、上述のように、ＩＲＡＰピクチャのアラインメントを強制することは、いくつかの有利な使用シナリオを妨害する。

[0122]したがって、本開示の技法によれば、予測処理ユニット４２は、必ずしも異なるレイヤの間のすべてのＩＲＡＰピクチャをアラインするとは限らない。すなわち、予測処理ユニット４２は、非ＩＲＡＰピクチャとしてＩＲＡＰピクチャを含むアクセスユニットの少なくとも１つのピクチャをコード化することを決定し得る。しかしながら、予測処理ユニット４２は、異なるレイヤのピクチャ間のＰＯＣ値をアラインすることを維持しながら、ＩＲＡＰピクチャの非アラインメントを達成するために、本開示の技法を使用することができる。このようにして、予測処理ユニット４２は、ピクチャのレイヤ間予測されたブロックが異なるレイヤにおける参照ピクチャを適切に参照することができることを確実にし得、ここにおいて、参照ピクチャは、ＩＲＡＰピクチャをアラインすることなく、レイヤ間予測されたブロックを含むピクチャと同じＰＯＣ値を有する。

[0123]特に、本開示の技法によれば、予測処理ユニット４２は、ＩＲＡＰピクチャを含むアクセスユニットのために符号化されるピクチャを受信することができる。すなわち、ビデオエンコーダ２０は、ＩＲＡＰピクチャを含むベースレイヤ（または他のレイヤ）を前に符号化し、たとえば、ＩＤＲ、ＣＲＡ、またはＢＬＡピクチャなど、ＩＲＡＰピクチャとしてＩＲＡＰピクチャを符号化することを決定している可能性がある。しかしながら、ビデオエンコーダ２０は、次いで、非ＩＲＡＰピクチャとして別のレイヤに一緒に置かれたピクチャ（すなわち、同じアクセスユニットにおけるピクチャ）を符号化することを決定することができる。

[0124]ＩＲＡＰピクチャと同じアクセスユニットにある非ＩＲＡＰピクチャとしてピクチャを符号化することを決定した後、ビデオエンコーダ２０は、非ＩＲＡＰピクチャのＰＯＣ値の少なくとも一部がゼロの値にリセットされるべきであることを示すシンタックス要素の値を設定することができる。ＰＯＣ値の少なくとも一部は、ＰＯＣ値の最上位ビット（ＭＳＢ）のみ、または全ＰＯＣ値（すなわち、ＰＯＣ値のすべてのビット）を含み得る。シンタックス要素は、たとえば、上記の実施例１のｐｏｃ＿ｍｓｂ＿ｒｅｓｅｔ＿ｆｌａｇまたは上記の実施例２のｐｏｃ＿ｒｅｓｅｔ＿ｆｌａｇを備え得る。

[0125]ビデオエンコーダ２０は、非ＩＲＡＰピクチャとしてピクチャを符号化することを決定した後、ピクチャのＰＯＣ値をリセットすることもできる。さらに、ビデオエンコーダ２０は、ピクチャと同じレイヤ、およびピクチャと同じコード化ビデオシーケンスにある参照ピクチャメモリ６４におけるピクチャのＰＯＣ値をリセットすることができる。特に、これらのピクチャのＰＯＣ値をリセットすることは、現在のピクチャのＰＯＣ値とこれらの他のピクチャのＰＯＣ値との間の差がリセットの前および後と同じままであることを確実にすることを含み得る。したがって、参照ピクチャメモリ６４におけるピクチャがＮの現在のピクチャのＰＯＣ値に対するＰＯＣ値の差がある場合、ビデオエンコーダ２０は、ＰＯＣ値が現在のピクチャのリセットされたＰＯＣ値−Ｎに等しくなるように、参照ピクチャメモリ６４におけるピクチャのＰＯＣ値をリセットすることができる。

[0126]このようにして、レイヤ間予測を使用してその後のピクチャ（たとえば、同じレイヤまたはその後符号化されたレイヤのピクチャ）を符号化するとき、ビデオエンコーダ２０は、参照ピクチャを参照するレイヤ間予測されたブロックを含むピクチャのＰＯＣ値に等しい参照ピクチャのＰＯＣ値を使用して参照ピクチャを識別するシンタックスデータを符号化することができる。

[0127]イントラ予測ユニット４８は、上記で説明したように、動き推定ユニット４４と動き補償ユニット４６とによって実施されるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測ユニット４８は、現在ブロックを符号化するために使用すべきイントラ予測モードを決定し得る。いくつかの例では、イントラ予測ユニット４８は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在のブロックを符号化することができ、イントラ予測ユニット４８は、テストされたモードから使用するのに適切なイントラ予測モードを選択することができる。たとえば、イントラ予測ユニット４８は、様々なテストされたイントラ予測モードに対して、レート歪み分析を使用してレート歪みの値を計算し、テストされたモードの中から最良のレート歪み特性を有するイントラ予測モードを選択し得る。レート歪み分析は、一般に、符号化されたブロックと、符号化ブロックを生成するために符号化される、元の符号化されていないブロックとの間のある量の歪み（すなわち、エラー）、および、符号化ブロックを生成するために使用されるビットレート（すなわち、いくつかのビット）を決定する。イントラ予測ユニット４８は、どのイントラ予測モードがブロックについて最良のレート歪み値を呈するかを判断するために、様々な符号化されたブロックの歪みおよびレートから比率を計算し得る。

[0128]いずれの場合も、ブロックのイントラ予測モードを選択した後に、イントラ予測ユニット４８は、ブロックについての選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット５６に提供し得る。エントロピー符号化ユニット５６は、本開示の技法に従って、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ２０は、送信ビットストリーム中に、複数のイントラ予測モードインデックステーブルおよび複数の変更されたイントラ予測モードインデックステーブル（コードワードマッピングテーブルとも呼ばれる）と、様々なブロックの符号化コンテキストの定義と、コンテキストの各々について使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、および変更されたイントラ予測モードインデックステーブルの指示とを含み得る構成データを含め得る。

[0129]予測処理ユニット４２が、インター予測またはイントラ予測のいずれかを介して、現在のビデオブロックのための予測ブロックを生成した後、ビデオエンコーダ２０は、現在のビデオブロックから予測ブロックを減算することによって残差ビデオブロックを形成する。残差ブロック中の残差ビデオデータは、１つまたは複数のＴＵ中に含まれ、変換処理ユニット５２に適用され得る。変換処理ユニット５２は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換などの変換を使用して、残差ビデオデータを残差変換係数に変換する。変換処理ユニット５２は、残差ビデオデータをピクセル領域から周波数領域などの変換領域に変換してよい。

[0130]変換処理ユニット５２は、得られた変換係数を量子化処理ユニット５４に送ってよい。量子化処理ユニット５４は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化処理ユニット５４は、次いで、量子化変換係数を含む行列の走査を実行し得る。代替的に、エントロピー符号化ユニット５６が走査を実行し得る。

[0131]量子化の後に、エントロピー符号化ユニット５６は、量子化変換係数をエントロピー符号化する。たとえば、エントロピー符号化ユニット５６は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コーディングまたは別のエントロピー符号化方法もしくは技法を実施し得る。エントロピー符号化ユニット５６によるエントロピー符号化に続いて、符号化ビットストリームは、ビデオデコーダ３０に送信されるか、あるいはビデオデコーダ３０が後で送信するかまたは取り出すためにアーカイブされ得る。エントロピー符号化ユニット５６はまた、コーディングされている現在のビデオスライスについての動きベクトルと他のシンタックス要素とをエントロピー符号化することができる。

[0132]逆量子化処理ユニット５８および逆変換処理ユニット６０は、参照ピクチャの参照ブロックとして後で使用する目的でピクセル領域において残差ブロックを再構成するために、それぞれ逆量子化および逆変換を適用する。動き補償ユニット４６は、参照ピクチャリストのうちの１つ内の参照ピクチャのうちの１つの予測ブロックに残差ブロックを加算することによって参照ブロックを計算し得る。動き補償ユニット４６はまた、動き推定において使用するためのサブ整数ピクセル値を計算するために、再構成された残差ブロックに１つまたは複数の補間フィルタを適用し得る。加算器６２は、参照ピクチャメモリ６４に記憶するための参照ブロックを生成するために、再構成された残差ブロックを動き補償ユニット４６によって生成された動き補償予測ブロックに加算する。参照ブロックは、後続のビデオフレームまたはピクチャ中のブロックをインター予測するために、動き推定ユニット４４と動き補償ユニット４６とによって参照ブロックとして使用され得る。

[0133]このようにして、ビデオエンコーダ２０は、ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化し、ＰＯＣ値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、ＰＯＣ値の一部がゼロに等しくなるように、ＰＯＣ値の少なくとも一部をリセットし、リセットされたＰＯＣ値を使用して、ビデオデータをコード化するように構成されるビデオコーダの一例を表す。

[0134]図３は、本開示で説明する技法を実施し得る例示的なビデオデコーダ３０を示すブロック図である。図３の例では、ビデオデコーダ３０は、エントロピー復号ユニット７０と、予測処理ユニット７１と、逆量子化処理ユニット７６と、逆変換ユニット７８と、加算器８０と、参照ピクチャメモリ８２とを含む。予測処理ユニット７１は、動き補償ユニット７２と、イントラ予測ユニット７４とを含む。ビデオデコーダ３０は、いくつかの例では、図２からのビデオエンコーダ２０に関して説明した符号化パスとは概して逆の復号パスを実行し得る。

[0135]様々な例で、ビデオデコーダ３０の１つのユニットは、本開示の技法を実行する役割を担い得る。また、一部の例では、本開示の技術は、ビデオ復号器３０のユニットの１つまたは複数の中で分割することができる。

[0136]復号プロセス中に、ビデオデコーダ３０は、符号化されたビデオスライスのビデオブロックおよび関連するシンタックス要素を表現する符号化されたビデオビットストリームを、ビデオエンコーダ２０から受信する。ビデオデコーダ３０のエントロピー復号ユニット７０は、量子化係数と、動きベクトルと、他のシンタックス要素とを生成するために、ビットストリームをエントロピー復号する。エントロピー復号ユニット７０は、動きベクトルと他のシンタックス要素とを予測処理ユニット７１に転送する。ビデオデコーダ３０は、ビデオスライスレベルおよび／またはビデオブロックレベルでシンタックス要素を受信し得る。

[0137]ビデオスライスがイントラコーディングされた（Ｉ）スライスとしてコーディングされるとき、予測処理ユニット７１のイントラ予測ユニット７４は、シグナリングされたイントラ予測モードと、現在のフレームまたはピクチャの、前に復号されたブロックからのデータとに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオピクチャがインターコーディングされた（すなわち、Ｂ、またはＰ）スライスとしてコーディングされるとき、予測処理ユニット７１の動き補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルおよび他のシンタックス要素に基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの１つの中の、参照ピクチャのうちの１つから生成され得る。ビデオデコーダ３０は、参照ピクチャメモリ８２に記憶された参照ピクチャに基づいて、デフォルトの構成技法または任意の他の技法を使用して、参照ピクチャリスト、すなわち、リスト０とリスト１とを構成し得る。

[0138]動き補償ユニット７２は、動きベクトルと他のシンタックス要素とを解析することによって現在のビデオスライスのビデオブロックについての予測情報を決定し、復号されている現在のビデオブロックのための予測ブロックを生成するために、予測情報を使用する。たとえば、動き補償ユニット７２は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード（たとえば、イントラ予測またはインター予測）と、インター予測スライスタイプ（たとえば、ＢスライスまたはＰスライス）と、スライスの参照ピクチャリストのうちの１つまたは複数についての構成情報と、スライスの各インター符号化されたビデオブロックのための動きベクトルと、スライスの各インターコーディングされたビデオブロックについてのインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、受信されたシンタックス要素のいくつかを使用する。

[0139]動き補償ユニット７２はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット７２は、参照ブロックのサブ整数ピクセルのための補間された値を計算するために、ビデオブロックの符号化中にビデオエンコーダ２０によって使用された補間フィルタを使用し得る。このケースでは、動き補償ユニット７２は、受信したシンタックス要素からビデオエンコーダ２０で使用された補間フィルタを決定し、補間フィルタを使用して予測ブロックを生成し得る。

[0140]本開示の技法によれば、エントロピー復号ユニット７０は、ピクチャの第１のピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきかどうかを示すシンタックス要素の値を復号し得る。シンタックス要素は、たとえば、上記の実施例１のpoc_msb_reset_flagまたは上記の実施例２のpoc_reset_flagを備え得る。ビデオデコーダ３０は、次いで、ＰＯＣ値がリセットされるべきであることを示す値をシンタックス要素が有するとき、ＰＯＣ値の少なくとも一部をリセットすることができる。たとえば、ビデオデコーダ３０は、ＰＯＣ値の少なくとも一部のビット（たとえば、poc_reset_flagの最上位ビットまたはpoc_reset_flagのすべてのビット）をゼロに等しくなるように設定することができる。

[0141]さらに、ビデオデコーダ３０は、参照ピクチャメモリ８２における他のピクチャのＰＯＣ値も調整し得る（すなわち、同じビデオコーディングレイヤおよび同じコード化ビデオシーケンスにあるピクチャ）。たとえば、ビデオデコーダ３０は、ＰＯＣ値とリセットがシグナリングされたＰＯＣ値との間の差がリセット前と同じままであるように、他のピクチャのＰＯＣ値をデクリメントすることができる。したがって、参照ピクチャメモリ８２におけるピクチャがＮの現在のピクチャのＰＯＣ値に対するＰＯＣ値の差がある場合、ビデオデコーダ３０は、ＰＯＣ値が現在のピクチャのリセットされたＰＯＣ値−Ｎに等しいように、参照ピクチャメモリ８２におけるピクチャのＰＯＣ値をリセットすることができる。

[0142]一般に、インター予測されるビデオブロックは、インター予測が時間的であるかレイヤ間（たとえば、ビュー間）であるかにかかわらず、参照ブロックを識別するシンタックス要素を含み得る。本開示の技法によれば、インター予測されたブロックのシンタックス要素は、上記で説明したように、リセットの後の参照ピクチャのＰＯＣ値を使用して、参照ピクチャを識別することができる。したがって、ビデオデコーダ３０は、インター予測のために、動き情報としてシグナリングされるとき、参照ピクチャを識別するＰＯＣ値を調整する必要はない。

[0143]逆量子化処理ユニット７６は、ビットストリーム中で与えられ、エントロピー復号ユニット７０によって復号された、量子化変換係数を逆量子化（inverse quantize）、すなわち、逆量子化する。逆量子化プロセスは、ビデオエンコーダ２０によって算出された量子化パラメータをビデオスライス内のビデオブロックごとに使用して、適用すべき量子化の程度を求め、同様に、適用すべき逆量子化の程度を求めることを含んでよい。逆変換処理ユニット７８は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば、逆ＤＣＴ、逆整数変換、または概念的に同様の逆変換処理を変換係数に適用する。

[0144]動き補償ユニット７２が、動きベクトルと他のシンタックス要素とに基づいて現在ビデオブロックのための予測ブロックを生成した後に、ビデオデコーダ３０は、逆変換処理ユニット７８からの残差ブロックを動き補償ユニット７２によって生成された対応する予測ブロックと加算することによって、復号ビデオブロックを形成する。加算器８０は、この加算演算を実行する１つまたは複数の構成要素を表す。所望される場合、ブロッキネスアーティファクトを除去するために復号されたブロックをフィルタ処理するデブロッキングフィルタも適用され得る。他のループフィルタ（コーディングループの中、またはコーディングループの後のいずれか）も、ピクセルの変化を平滑化し、または他の方法でビデオ品質を改善するために使用され得る。所与のフレームまたはピクチャの復号ビデオブロックは、次いで、参照ピクチャメモリ８２に記憶され、これは後続の動き補償のために使用される参照ピクチャを記憶する。参照ピクチャメモリ８２はまた、復号ビデオを図１のディスプレイデバイス３２などのディスプレイデバイス上に後で表示できるように記憶する。

[0145]いくつかの例では、本開示で説明する技法の１つまたは複数の態様は、たとえばメディアアウェアネットワーク要素（ＭＡＮＥ）、ストリーム適応プロセッサ、スプライシングプロセッサ、または編集プロセッサなど、中間ネットワークデバイスによって実行され得る。たとえば、そのような中間デバイスは、本開示で説明するように、様々なシグナリングのうちの任意のものを生成するように構成され得る。たとえば、そのような中間デバイスは、現在のピクチャのピクチャオーダーカウント（ＰＯＣ）値が、現在のピクチャのＰＯＣ値の１組の最下位ビット（ＬＳＢ）に等しくなるようにリセットされるかどうかを指定する第１のシンタックス要素を受信し、現在のピクチャのＰＯＣ値が現在のピクチャのＰＯＣ値のＬＳＢの組に等しくなるようにリセットされることを第１のシンタックス要素が指定するとき、現在のピクチャのＰＯＣ値と、同じレイヤにおけるピクチャのうちの任意のもののＰＯＣ値との間の差が、現在のピクチャのＰＯＣ値がリセットされる前と同じままであるように、現在のピクチャと同じコーディングレイヤにおける他のピクチャのＰＯＣ値をデクリメントし、デクリメントされたＰＯＣ値を使用して、現在のピクチャの少なくとも一部と他のピクチャとを復号するように構成され得る。

[0146]別の例では、そのような中間デバイスは、現在のピクチャのピクチャオーダーカウント（ＰＯＣ）値がゼロに等しくなるようにリセットされるかどうかを指定する第１のシンタックス要素を受信し、現在のピクチャのＰＯＣ値がゼロに等しくなるようにリセットされることを第１のシンタックス要素が指定するとき、現在のピクチャがレイヤ０よりも大きいレイヤにある場合、現在のピクチャをゼロに等しくなるようにリセットし、リセットされたＰＯＣ値を使用して、現在のピクチャを復号するように構成され得る。

[0147]このようにして、ビデオデコーダ３０は、ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化し、ＰＯＣ値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、ＰＯＣ値の一部がゼロに等しくなるように、ＰＯＣ値の少なくとも一部をリセットし、リセットされたＰＯＣ値を使用して、ビデオデータをコード化するように構成されるビデオコーダの一例を表す。

[0148]図４は、コード化ビデオピクチャ１００〜１３２のシーケンスを示す概念図である。ピクチャは、階層予測構造内の位置を示すために異なる陰影を付けられている。たとえば、ピクチャ１００、１１６、および１３２は、ピクチャ１００、１１６、１３２が階層予測構造の最上位にあることを表すために黒の陰影を付けられている。ピクチャ１００、１１６、１３２は、たとえば、単一の方向にある他のピクチャ（たとえば、Ｐピクチャ）から予測されるイントラコード化ピクチャまたはインターコード化ピクチャを備え得る。イントラコード化の場合、ピクチャ１００、１１６、１３２は同じピクチャ内のデータからのみ予測される。インターコード化の場合、ピクチャ１１６は、たとえば、ピクチャ１１６からピクチャ１００への破線矢印で示すように、ピクチャ１００のデータに対してコーディングされ得る。ピクチャ１１６、１３２は、それぞれ、ピクチャグループ（ＧＯＰ）１３４、１３６のキーピクチャを形成する。

[0149]ピクチャ１０８、１２４は、それらが、符号化階層においてピクチャ１００、１１６、および１３２の次であることを示すために暗い陰影を付けられている。ピクチャ１０８、１２４は、双方向、インターモード予測符号化ピクチャを備え得る。たとえば、ピクチャ１０８はピクチャ１００および１１６のデータから予測され得、ピクチャ１２４はピクチャ１１６および１３２から予測され得る。ピクチャ１０４、１１２、１２０、および１２８は、それらが、符号化階層においてピクチャ１０８および１２４の次であることを示すために、明るい陰影を付けられている。ピクチャ１０４、１１２、１２０、および１２８はまた、双方向、インターモード予測符号化ピクチャを備え得る。たとえば、ピクチャ１０４はピクチャ１００および１０８から予測され得、ピクチャ１１２はピクチャ１０８および１１６から予測され得、ピクチャ１２０はピクチャ１１６および１２４から予測され得、ピクチャ１２８はピクチャ１２４および１３２から予測され得る。

[0150]最後に、ピクチャ１０２、１０６、１１０、１１４、１１８、１２２、１２６、および１３０は、これらのピクチャが符号化階層において最下位であることを示すために白い陰影を付けられている。ピクチャ１０２、１０６、１１０、１１４、１１８、１２２、１２６、および１３０はまた、双方向、インターモード予測符号化ピクチャであり得る。ピクチャ１０２はピクチャ１００および１０４から予測され得、ピクチャ１０６はピクチャ１０４および１０８から予測され得、ピクチャ１１０はピクチャ１０８および１１２から予測され得、ピクチャ１１４はピクチャ１１２および１１６から予測され得、ピクチャ１１８はピクチャ１１６および１２０から予測され得、ピクチャ１２２はピクチャ１２０および１２４から予測され得、ピクチャ１２６はピクチャ１２４および１２８から予測され得、ピクチャ１３０はピクチャ１２８および１３２から予測され得る。

[0151]ピクチャ１００〜１３２は表示順序で示されている。すなわち、復号に続き、ピクチャ１００はピクチャ１０２の前に表示され、ピクチャ１０２はピクチャ１０４の前に表示され、以下同様である。しかしながら、符号化階層により、ピクチャ１００〜１３２は異なる順序で復号され得る。さらに、符号化された後、ピクチャ１００〜１３２は、ピクチャ１００〜１３２のための符号化データを含むビットストリーム中に復号順序で構成され得る。たとえば、ピクチャ１１６は、ＧＯＰ１３４のピクチャのうち最後に表示され得る。しかしながら、符号化階層により、ピクチャ１１６はＧＯＰ１３４のうち最初に復号され得る。すなわち、ピクチャ１０８を適切に復号するために、たとえば、ピクチャ１１６は、ピクチャ１０８のための参照ピクチャとして働くために、最初に復号される必要があり得る。同様に、ピクチャ１０８はピクチャ１０４、１０６、１１０、および１１２のための参照フレームとして働き得、したがって、ピクチャ１０４、１０６、１１０、および１１２の前に復号される必要があり得る。

[0152]ピクチャが表示される時間は、プレゼンテーション時間と呼ばれることがあり、ピクチャが復号される時間は復号時間と呼ばれることがある。復号時間およびプレゼンテーション時間は、概して、同じシーケンスの他のピクチャに対する時間的順序の指示を与える。ピクチャの復号時間とピクチャのプレゼンテーション時間との間の差は、ピクチャのためのピクチャ並べ替え遅延と呼ばれることがある。

[0153]本開示の技術によれば、ピクチャのうちの１つが、（異なるビデオコーディングレイヤの）ＩＲＡＰピクチャも含むアクセスユニットに含まれる非ＩＲＡＰピクチャであるとき、ビデオコーダ（たとえば、ビデオエンコーダ２０および／またはビデオデコーダ３０）は、ビデオコーディングレイヤにおけるピクチャのＰＯＣ値を調整することができる。たとえば、ピクチャ１３２がＰピクチャであり、ＩＲＡＰピクチャである別のビデオコーディングレイヤのピクチャとコロケートされる（すなわち、ピクチャと同じアクセスユニットに含まれる）と仮定する。この例では、ピクチャ１３２は、ＩＲＡＰピクチャと同じアクセスユニットに含まれる非ＩＲＡＰピクチャである（それがインターコード化されるので）。

[0154]したがって、上記に記載した例を続けると、ビデオコーダは、ピクチャ１３２のＰＯＣ値がリセットされるべきであることを示すシンタックス要素の値をコード化する。すなわち、シンタックス要素は、ピクチャ１３２のＰＯＣ値の少なくとも一部が（ゼロの値に）リセットされるべきであることを示すことになる。したがって、ビデオコーダは、ピクチャ１３２のＰＯＣ値を調整することができる。たとえば、シンタックス要素がpoc_msb_reset_flagである上記で説明した実施例１によれば、ビデオコーダは、ピクチャ１３２のＰＯＣ値の最上位ビット（ＭＳＢ）をゼロに等しくなるように設定することになる。別の例として、シンタックス要素がpoc_reset_flagである上記で説明した実施例２によれば、ビデオコーダは、ピクチャ１３２の全ＰＯＣ値をゼロに等しくなるように設定することになる。

[0155]ビデオコーダは、他のピクチャのＰＯＣ値を調整することもできる。たとえば、そのピクチャ１００および１１６が前にコーディングされたと仮定すると、ビデオコーダは、ピクチャ１３２のリセットされたＰＯＣ値に基づいて、ピクチャ１００および１１６のＰＯＣ値を調整することができる。図４の例では、ピクチャ１３２のＰＯＣ値は、ピクチャ１１６のＰＯＣ値よりも８大きく、ピクチャ１００のＰＯＣ値よりも１６大きい。実施例２では、全ＰＯＣ値がリセットされる場合、ビデオコーダは、ピクチャ１００のＰＯＣ値を−１６（負の１６）に等しくなるように、ピクチャ１１６のＰＯＣ値を−８（負の８）に等しくなるように調整することができる。このようにして、ピクチャ１３２とピクチャ１００および１１６とのＰＯＣ値の間の差は、ＰＯＣ値がリセットされる前に対して、ＰＯＣ値がリセットされた後、一定のままであり得る。

[0156]上記の例は、ピクチャ１３２をコード化するとき、これらのピクチャが復号ピクチャバッファ（ＤＰＢ）にすでに存在するという仮定に基づいて、ピクチャ１００および１１６のＰＯＣ値を変更することを説明した。いくつかの場合には、ピクチャ１０２〜１１４もＤＰＢに存在してもよく、この場合、ビデオコーダは同様にピクチャ１０２〜１１４のＰＯＣ値を調整することができる。しかしながら、ピクチャ１１８〜１３０はピクチャ１３２から従属し得るので、ピクチャ１３２がリセットされるべきとき、ピクチャ１１８〜１３０がＤＰＢに存在しないことが予想される。すなわち、ピクチャ１１８〜１３０は、ピクチャ１３２の復号順よりも後である復号順を有する。したがって、ビデオコーダは、ピクチャ１１８〜１３０のＰＯＣ値を調整する必要はない。いくつかの例では、ピクチャ１０２〜１１４も、ピクチャ１３２の復号順よりも後である復号順を有し得る。

[0157]図５は、本開示の技法による、ビデオデータを符号化する例示的な方法を示すフローチャートである。ビデオエンコーダ２０は、図５の方法を実行するものとして記載される。ただし、他のコーディングデバイスが、この方法または同様の方法を実行するように構成され得ることを理解されたい。さらに、本方法のステップは、異なる順序で、または並行して実行され得、いくつかのステップは追加または省略され得る。

[0158]図５の例では、ビデオエンコーダ２０は、第１のビデオコーディングレイヤのピクチャを最初に符号化する（１５０）。上記で説明したように、レイヤは、スケーラブルビデオコーディングレイヤまたはマルチビュービデオコーディングのビューに対応し得る。このコンテキストでの「第１の」という用語の使用は、順序を示すというよりむしろ名目であるものとし、いくつかの例ではビデオエンコーダ２０は、図５に関して述べられる第１のレイヤより前に、１つまたは複数の追加のビデオコーディングレイヤを符号化している可能性がある。第１のビデオコーディングレイヤのピクチャの符号化は、一般に、イントラランダムアクセスポイント（ＩＲＡＰ）ピクチャとして、第１のレイヤのいくつかのピクチャを符号化し、（時間的であるかレイヤ間であるかにかかわらず）たとえばインター予測されたピクチャなど、非ＩＲＡＰピクチャとして別のピクチャを符号化することを伴う。

[0159]次いで、ビデオエンコーダ２０は、第１のビデオコーディングレイヤのＩＲＡＰピクチャとコロケートされる第２のビデオコーディングレイヤのピクチャを決定し得る（１５２）。しかしながら、ビデオエンコーダ２０は、第２のビデオコーディングレイヤのこのピクチャを非ＩＲＡＰピクチャとして符号化することを決定し得る（１５４）。たとえば、ビデオエンコーダ２０は、時間的インター予測、および／またはレイヤ間（たとえば、ビュー間）予測を使用してピクチャを符号化することを決定することができる。

[0160]ピクチャが非ＩＲＡＰピクチャであり、しかし、ＩＲＡＰピクチャとコロケートされる（たとえば、ＩＲＡＰピクチャと同じアクセスユニットに含まれる）結果として、ビデオエンコーダ２０は、ピクチャのＰＯＣ値の少なくとも一部がリセットされるべきであることを示すシンタックス要素の値を符号化することができる（１５６）。たとえば、シンタックス要素は、上記で説明した実施例１のpoc_msb_reset_flag、または上記で説明した実施例２のpoc_reset_flagを備え得る。さらに、ビデオエンコーダ２０は、ピクチャ、同じレイヤおよび同じコード化ビデオシーケンスにある前に符号化されたピクチャのＰＯＣ値を調整することができる（１５８）。特に、ビデオエンコーダ２０は、他のピクチャのＰＯＣ値と現在のピクチャのＰＯＣ値との間の差が、現在のピクチャのＰＯＣ値をリセットした後リセット前と同じままであるように、他のピクチャのＰＯＣ値を調整することができる。

[0161]ビデオエンコーダ２０はさらに、ピクチャを符号化することができる（１６０）。すなわち、ピクチャのブロックごとに、ビデオエンコーダ２０は、ブロックを（時間的またはレイヤ間予測を使用して）イントラ予測するかインター予測するかを決定することができる。ビデオエンコーダ２０は、次いで、ピクチャを復号することができ（１６２）、復号されたピクチャを復号ピクチャバッファ（ＤＰＢ）、たとえば、参照ピクチャメモリ６４に記憶することができる。ビデオエンコーダ２０は、次いで、復号されたピクチャに対して、（たとえば、後のコーディング順を有する同じレイヤにおけるピクチャ、または異なるレイヤの同じアクセスユニットにおけるピクチャなど）次のピクチャの一部を符号化し得る（１６６）。復号されたピクチャを識別するために、ビデオエンコーダ２０は、次のピクチャのブロックの動き情報として、復号されたピクチャのリセットされたＰＯＣ値を符号化することができる（１６８）。

[0162]このようにして、図５の方法は、ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部をゼロの値にリセットすべきかどうかを決定することと、ＰＯＣ値の少なくとも一部をリセットすることを決定することに応答して、第１のＰＯＣ値の一部がゼロに等しくなるように、ＰＯＣ値の少なくとも一部をリセットすることと、ＰＯＣ値の少なくとも一部がゼロの値にリセットされるべきであることを示すシンタックス要素の値を符号化することと、リセットされたＰＯＣ値を使用してビデオデータを符号化することとを含む方法の一例を表す。

[0163]図６は、本開示の技法による、ビデオデータを復号する例示的な方法を示すフローチャートである。ビデオデコーダ３０は、図６の方法を実行するものとして記載される。ただし、他のコーディングデバイスが、この方法または同様の方法を実行するように構成され得ることを理解されたい。さらに、本方法のステップは、異なる順序で、または並行して実行され得、いくつかのステップは追加または省略され得る。

[0164]図６の例では、ビデオデコーダ３０は、第１のビデオコーディングレイヤのピクチャを最初に復号する（１８０）。上記で説明したように、レイヤは、スケーラブルビデオコーディングレイヤまたはマルチビュービデオコーディングのビューに対応し得る。このコンテキストでの「第１の」という用語の使用は、順序を示すというよりむしろ名目であるものとし、いくつかの例では、ビデオデコーダ３０は、図６に関して述べられる第１のレイヤより前に、１つまたは複数の追加のビデオコーディングレイヤを復号している可能性がある。第１のビデオコーディングレイヤのピクチャの復号は、一般に、イントラランダムアクセスポイント（ＩＲＡＰ）ピクチャとして、第１のレイヤのいくつかのピクチャを復号し、（時間的であるかレイヤ間であるかにかかわらず）たとえばインター予測されたピクチャなど、非ＩＲＡＰピクチャとして別のピクチャを復号することを伴う。

[0165]次いで、ビデオデコーダ３０は、ピクチャのＰＯＣ値の少なくとも一部がリセットされるべきであることを示す第１のビデオコーディングレイヤのＩＲＡＰピクチャとコロケートされる（すなわち、同じアックセスユニットにある）第２のビデオコーディングレイヤのピクチャのシンタックス要素を復号することができる（１８２）。たとえば、シンタックス要素は、上記で説明した実施例１のpoc_msb_reset_flag、または上記で説明した実施例２のpoc_reset_flagを備え得る。このシンタックス要素の値に基づいて、ビデオデコーダ３０は、ピクチャのＰＯＣ値と、同じレイヤおよび同じコード化ビデオシーケンスにある前に復号されたピクチャのＰＯＣ値とを調整することができる（１８４）。特に、ビデオデコーダ３０は、他のピクチャのＰＯＣ値と現在のピクチャのＰＯＣ値との間の差が、現在のピクチャのＰＯＣ値をリセットした後リセット前と同じままであるように、他のピクチャのＰＯＣ値を調整することができる。

[0166]ビデオデコーダ３０はまた、ピクチャを復号することができ（１８６）、復号されたピクチャを復号ピクチャバッファ（ＤＰＢ）、たとえば、参照ピクチャメモリ８２に記憶することができる（１８８）。ピクチャを復号することは、イントラ予測、時間的インター予測、および／またはレイヤ間予測を使用してピクチャのブロックを復号することを含み得る。レイヤ間予測を実行するとき、ビデオデコーダ３０は、現在のピクチャのリセットされたＰＯＣ値に等しい別のレイヤ（たとえば、第１のレイヤにおけるＩＲＡＰピクチャ）における参照ピクチャのＰＯＣ値を復号することができる。時間的インター予測を実行するとき、ビデオデコーダ３０は、ＤＰＢにおける参照ピクチャのＰＯＣ値を復号することができ、ここにおいて、復号されたＰＯＣ値は、ＤＰＢにおける前に復号されたピクチャのうちの１つの調整されたＰＯＣ値のうちの１つに対応し得る。

[0167]さらに、ビデオデコーダ３０は、その後復号されるべきピクチャの参照ピクチャとして、復号ピクチャを使用することができる。すなわち、ビデオデコーダ３０は、次のピクチャのブロックの動き情報（たとえば、動きパラメータ）として、復号されたピクチャのリセットされたＰＯＣ値を復号することができる（１９０）。その後のピクチャは、第２のレイヤにおける次のピクチャ、または異なるレイヤのピクチャ（たとえば、復号ピクチャと同じアクセスユニットにおけるピクチャ）でもよい。いずれにせよ、復号された動き情報は、復号ピクチャのＰＯＣ値への参照を含み得、これは、復号ピクチャのためのリセットされたＰＯＣ値（すなわち、リセットより前のピクチャのＰＯＣ値でない）に対応する。次のピクチャのブロックの動き情報としてこの復号されたＰＯＣ値に基づいて、ビデオデコーダ３０は、復号ピクチャに対する次のピクチャのブロックを復号することができる（１９２）。

[0168]このようにして、図６の方法は、ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すかどうかを決定することと、ＰＯＣ値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、ＰＯＣ値の一部がゼロに等しくなるように、ＰＯＣ値の少なくとも一部をリセットすることと、リセットされたＰＯＣ値を使用してビデオデータを復号することとを含む方法の一例を表す。

[0169]１つまたは複数の例では、述べられた機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで、実施されてもよい。ソフトウェアで実施される場合、諸機能は、１つまたは複数の命令またはコードとして、コンピュータ可読媒体を介して記憶または伝送され得、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの、有形の媒体に相当するコンピュータ可読記憶媒体、またはコンピュータプログラムの、ある場所から別の場所への、たとえば、通信プロトコルによる転送を促進する任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、一般に、（１）非一時的である有形のコンピュータ可読記憶媒体または（２）信号もしくはキャリア波などの通信媒体に相当し得る。データ記憶媒体は、本開示に記載される技法の実施のために、１つもしくは複数のコンピュータまたは１つもしくは複数のプロセッサによって、命令、コードおよび／またはデータ構造を取り出すためにアクセスされ得る、任意の利用できる媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含むことできる。

[0170]例として、それに限定されず、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭもしくは他の光ディスク記憶装置、磁気ディスク記憶装置もしくは他の磁気記憶デバイス、フラッシュメモリ、または命令もしくはデータ構造の形態で所望のプログラムコードを記憶するために使用可能であり、コンピュータによってアクセス可能な他の任意の媒体を備えることができる。同様に、いかなる接続も、コンピュータ可読媒体と当然のことながら呼ばれる。たとえば、命令が、ウェブサイト、サーバ、または他の遠隔ソースから、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して伝送される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、マイクロ波などのワイヤレス技術は、媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、キャリア波、信号、または他の一時的な媒体を含まないが、代わりに、非一時的な、有形の記憶媒体を対象とすることを理解されたい。本明細書において、ディスク（disk）およびディスク（disc）は、コンパクトディスク（ＣＤ）、レーザーディスク（登録商標）、光ディスク、デジタルバーサタイルディスク（ＤＶＤ）、フロッピー（登録商標）ディスクおよびブルーレイ（登録商標）ディスクを含み、この場合、ディスク（disk）は、通常、磁気的にデータを再生し、一方ディスク（disc）は、レーザーを用いてデータを光学的に再生する。上述したものの組合せも、コンピュータ可読媒体の範囲の中に含められるべきである。

[0171]命令は、１つまたは複数のデジタルシグナルプロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、または他の同等の統合された、もしくは個別の論理回路などの、１つまたは複数のプロセッサによって実行され得る。したがって、「プロセッサ」という用語は、本明細書において、前述の構造のうちの任意のものまたは本明細書に記載される技法の実施のために適当な任意の他の構造を参照し得る。加えて、いくつかの態様では、本明細書に記載される機能性は、符号化および復号のために構成され、または組み合わされたコーデックに組み込まれる、専用のハードウェア内および／またはソフトウェアモジュール内で提供され得る。また、技法は、１つまたは複数の回路または論理素子内で完全に実施されてよい。

[0172]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）、またはＩＣのセット（たとえば、チップセット）を含む多種多様なデバイスまたは装置において実施されてよい。様々な構成要素、モジュール、またはユニットは、開示された技法を実行するように構成されるデバイスの機能上の態様を強調するために、本開示に記載されるが、必ずしも異なるハードウェアユニットによる実現を求めるとは限らない。むしろ、上述したように、様々なユニットは、コーデックハードウェアユニットの中で組み合わされ、または、上述される１つまたは複数のプロセッサを含む、適当なソフトウェアおよび／またはファームウェアと一緒に相互作用するハードウェアユニットが集まったものによって提供され得る。

[0173]様々な例が、述べられた。これらおよび他の例は、以下の特許請求の範囲の範囲内である。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
ビデオデータを復号する方法であって、
ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すかどうかを決定することと、
前記ＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記ＰＯＣ値の前記一部がゼロに等しくなるように、前記ＰＯＣ値の少なくとも前記一部をリセットすることと、
前記リセットされたＰＯＣ値を使用してビデオデータを復号することと
を備える方法。
［Ｃ２］
前記シンタックス要素の前記値は、前記ＰＯＣ値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記方法は、前記ＰＯＣ値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記ＰＯＣ値のすべてのビットがゼロに等しくなるように前記ＰＯＣ値をリセットすることをさらに備える、
Ｃ１に記載の方法。
［Ｃ３］
前記ピクチャは、第１のピクチャを備え、前記方法は、前記第１のピクチャを第１のビデオコーディングレイヤに含み、第２のピクチャを第２のビデオコーディングレイヤに含むアクセスユニットを受信することをさらに備え、前記第２のビデオコーディングレイヤは、前記第１のビデオコーディングレイヤとは異なり、前記ＰＯＣ値をリセットする前には、前記第１のピクチャの前記ＰＯＣ値は、前記第２のピクチャの第２のＰＯＣ値とは異なる、
Ｃ１に記載の方法。
［Ｃ４］
前記第１のピクチャの前記ＰＯＣをリセットすることは、前記リセット後、前記第１のピクチャの前記ＰＯＣ値は、前記第２のピクチャの前記ＰＯＣ値に等しくなるように、前記第１のピクチャの前記ＰＯＣ値をリセットすることを備える、
Ｃ３に記載の方法。
［Ｃ５］
前記第２のピクチャは、NoRaslOutputFlagシンタックス要素が１に等しいイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャを備え、前記第１のピクチャが非ＩＲＡＰピクチャを備える、
Ｃ３に記載の方法。
［Ｃ６］
前記ＩＲＡＰピクチャは、瞬時デコーダリフレッシュ（ＩＤＲ）ピクチャ、クリーンランダムアクセス（ＣＲＡ）ピクチャ、またはリンク切断アクセス（ＢＬＡ）ピクチャのうちの１つを備える、
Ｃ５に記載の方法。
［Ｃ７］
前記アクセスユニットは、前記第１のビデオコーディングレイヤおよび前記第２のビデオコーディングレイヤとは異なる第３のビデオコーディングレイヤにおける第３のピクチャをさらに含み、前記リセットされたＰＯＣ値を使用してビデオデータを復号することが、ブロックが前記リセットされたＰＯＣ値の参照を含むとき、前記第１のピクチャに対するレイヤ間予測を使用して前記第３のピクチャの前記ブロックを復号することを備える、
Ｃ３に記載の方法。
［Ｃ８］
前記ピクチャは、第１のピクチャを備え、前記ＰＯＣ値は、第１のＰＯＣ値を備え、前記方法は、前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、
第２のピクチャの第２のＰＯＣ値を決定すること、ここにおいて、前記第１のピクチャおよび前記第２のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
前記第１のＰＯＣ値と前記第２のＰＯＣ値との間の第１の差を決定することと、
デクリメントされた第２のＰＯＣ値と前記リセットされた第１のＰＯＣ値との間の第２の差が前記第１の差に等しいように前記第２のＰＯＣ値をデクリメントすることと
をさらに備える、Ｃ１に記載の方法。
［Ｃ９］
前記ピクチャは、第１のピクチャを備え、前記ＰＯＣ値は、第１のＰＯＣ値を備え、前記方法は、前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、
前記ピクチャを有する共通のビデオコーディングレイヤにおける複数の他のピクチャのＰＯＣ値を決定することと、
前記第１のＰＯＣ値と前記他のピクチャの前記ＰＯＣ値との間の差を決定することと、
デクリメントされたＰＯＣ値と前記リセットされた第１のＰＯＣ値との間のそれぞれの差が前記第１のＰＯＣ値と前記他のピクチャの前記ＰＯＣ値との間の前記それぞれの決定された差に等しくなるように、前記他のピクチャの前記ＰＯＣ値をデクリメントすることと
をさらに備える、Ｃ１に記載の方法。
［Ｃ１０］
参照ピクチャセットのデータは、前記他のピクチャが短期参照ピクチャであるか長期参照ピクチャであるかを示し、前記ＰＯＣ値をデクリメントすることは、
前記短期参照ピクチャの前記ＰＯＣ値をデクリメントすることと、
前記長期参照ピクチャの前記ＰＯＣ値をデクリメントすることと
を備える、Ｃ９に記載の方法。
［Ｃ１１］
前記シンタックス要素は、ＰＯＣリセットフラグである、
Ｃ１に記載の方法。
［Ｃ１２］
前記シンタックス要素を含むスライスヘッダを復号することをさらに備える、
Ｃ１に記載の方法。
［Ｃ１３］
前記一部は、前記ＰＯＣ値の最上位ビット（ＭＳＢ）を備える、
Ｃ１に記載の方法。
［Ｃ１４］
ビデオデータを符号化する方法であって、
ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部をゼロの値にリセットすべきかどうかを決定することと、
前記ＰＯＣ値の前記少なくとも一部をリセットすることを決定することに応答して、前記第１のＰＯＣ値の前記一部がゼロに等しくなるように、前記ＰＯＣ値の少なくとも前記一部をリセットし、前記ＰＯＣ値の少なくとも前記一部がゼロの前記値にリセットされるべきことを示すシンタックス要素の値を符号化することと、
前記リセットされたＰＯＣ値を使用してビデオデータを符号化することと
を備える方法。
［Ｃ１５］
前記シンタックス要素の前記値は、前記ＰＯＣ値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記方法は、前記ＰＯＣ値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記ＰＯＣ値のすべてのビットがゼロに等しくなるように前記ＰＯＣ値をリセットすることをさらに備える、
Ｃ１４に記載の方法。
［Ｃ１６］
前記ピクチャは、第１のピクチャを備え、前記方法は、前記第１のピクチャを第１のビデオコーディングレイヤに含み、第２のピクチャを第２のビデオコーディングレイヤに含むアクセスユニットを形成することをさらに備え、前記第２のビデオコーディングレイヤは、前記第１のビデオコーディングレイヤとは異なり、前記ＰＯＣ値をリセットする前には、前記第１のピクチャの前記ＰＯＣ値は、前記第２のピクチャの第２のＰＯＣ値とは異なる、
Ｃ１４に記載の方法。
［Ｃ１７］
前記第２のピクチャは、NoRaslOutputFlagシンタックス要素が１に等しいイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャを備え、前記第１のピクチャが非ＩＲＡＰピクチャを備えるとき、リセットすべきかどうかを決定することは、前記ＰＯＣ値をリセットすることを決定することを備える、
Ｃ１６に記載の方法。
［Ｃ１８］
前記アクセスユニットを形成することは、前記第１のビデオコーディングレイヤおよび前記第２のビデオコーディングレイヤとは異なる第３のビデオコーディングレイヤにおける第３のピクチャを含むように前記アクセスユニットを形成することをさらに備え、前記リセットされたＰＯＣ値を使用してビデオデータを符号化することは、
前記第１のピクチャに対してレイヤ間予測を使用して前記第３のピクチャのブロックを符号化することと、
前記リセットされたＰＯＣ値を参照するために、前記ブロックのシンタックス要素を符号化することと
を備える、Ｃ１６に記載の方法。
［Ｃ１９］
前記ピクチャは、第１のピクチャを備え、前記ＰＯＣ値は、第１のＰＯＣ値を備え、前記方法は、前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、
第２のピクチャの第２のＰＯＣ値を決定すること、前記第１のピクチャおよび前記第２のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
前記第１のＰＯＣ値と前記第２のＰＯＣ値との間の第１の差を決定することと、
デクリメントされた第２のＰＯＣ値と前記リセットされた第１のＰＯＣ値との間の第２の差が前記第１の差に等しいように前記第２のＰＯＣ値をデクリメントすることと
をさらに備える、Ｃ１４に記載の方法。
［Ｃ２０］
ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化することと、前記ＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記ＰＯＣ値の前記一部がゼロに等しくなるように、前記ＰＯＣ値の少なくとも前記一部をリセットすることと、前記リセットされたＰＯＣ値を使用してビデオデータをコード化することと
を行うように構成されるビデオコーダを備える、ビデオデータをコード化するためのデバイス。
［Ｃ２１］
前記シンタックス要素の前記値は、前記ＰＯＣ値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記ビデオコーダは、前記ＰＯＣ値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記ＰＯＣ値のすべてのビットがゼロに等しくなるように前記ＰＯＣ値をリセットすることを行うようにさらに構成される、
Ｃ２０に記載のデバイス。
［Ｃ２２］
前記ピクチャは、第１のピクチャを備え、前記ビデオコーダは、前記第１のピクチャを第１のビデオコーディングレイヤに含み、第２のピクチャを第２のビデオコーディングレイヤに含むアクセスユニットをコード化することを行うように構成され、前記第２のビデオコーディングレイヤは、前記第１のビデオコーディングレイヤとは異なり、前記ＰＯＣ値をリセットする前には、前記第１のピクチャの前記ＰＯＣ値は、前記第２のピクチャの第２のＰＯＣ値とは異なる、
Ｃ２０に記載のデバイス。
［Ｃ２３］
前記第２のピクチャは、NoRaslOutputFlagシンタックス要素が１に等しいイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャを備え、前記第１のピクチャは、瞬間デコーダリフレッシュ（ＩＤＲ）ピクチャ、クリーンランダムアクセス（ＣＲＡ）ピクチャ、または切断ンリンクアクセス（ＢＬＡ）ピクチャのうちの１つを備える非ＩＲＡＰピクチャを備える、
Ｃ２２に記載のデバイス。
［Ｃ２４］
前記アクセスユニットは、前記第１のビデオコーディングレイヤおよび前記第２のビデオコーディングレイヤとは異なる第３のビデオコーディングレイヤにおける第３のピクチャをさらに含み、前記リセットされたＰＯＣ値を使用してビデオデータをコード化するために、前記ビデオコーダは、ブロックが前記リセットされたＰＯＣ値の参照を含むとき、前記第１のピクチャに対するレイヤ間予測を使用して前記第３のピクチャの前記ブロックをコード化することを行うように構成される、
Ｃ２２に記載のデバイス。
［Ｃ２５］
前記ピクチャは、第１のピクチャを備え、前記ＰＯＣ値は、第１のＰＯＣ値を備え、前記ビデオコーダは、前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、第２のピクチャの第２のＰＯＣ値を決定すること、ここにおいて、前記第１のピクチャおよび前記第２のピクチャは、共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、前記第１のＰＯＣ値と前記第２のＰＯＣ値との間の第１の差を決定することと、デクリメントされた第２のＰＯＣ値と前記リセットされた第１のＰＯＣ値との間の第２の差が前記第１の差に等しくなるように、前記第２のＰＯＣ値をデクリメントすることと
を行うように構成される、Ｃ２０に記載のデバイス。
［Ｃ２６］
前記シンタックス要素は、ＰＯＣリセットフラグである、
Ｃ２０に記載のデバイス。
［Ｃ２７］
前記デバイスは、前記リセットされたＰＯＣ値を使用してビデオデータを復号するように構成されたビデオデコーダを備える、
Ｃ２０に記載のデバイス。
［Ｃ２８］
前記デバイスは、前記リセットされたＰＯＣ値を使用してビデオデータを符号化するように構成されたビデオエンコーダを備える、
Ｃ２０に記載のデバイス。
［Ｃ２９］
前記デバイスが、
集積回路、
マイクロプロセッサ、および
ワイヤレス通信デバイス
のうちの少なくとも１つを備える、Ｃ２０に記載のデバイス。
［Ｃ３０］
ビデオデータをコード化するためのデバイスであって、
ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化するための手段と、
前記ＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記ＰＯＣ値の前記一部がゼロに等しくなるように、前記ＰＯＣ値の少なくとも前記一部をリセットするための手段と、
前記リセットされたＰＯＣ値を使用してビデオデータをコード化するための手段と
を備えるデバイス。
［Ｃ３１］
前記シンタックス要素の前記値は、前記ＰＯＣ値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記リセットするための手段は、前記ＰＯＣ値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記ＰＯＣ値のすべてのビットがゼロに等しくなるように前記ＰＯＣ値をリセットするための手段を備える、
Ｃ３０に記載のデバイス。
［Ｃ３２］
前記ピクチャは、第１のピクチャを備え、前記第１のピクチャを第１のビデオコーディングレイヤに含み、第２のピクチャを第２のビデオコーディングレイヤに含むアクセスユニットをコード化するための手段をさらに備え、前記第２のビデオコーディングレイヤは、前記第１のビデオコーディングレイヤとは異なり、前記ＰＯＣ値をリセットする前には、前記第１のピクチャの前記ＰＯＣ値は、前記第２のピクチャの第２のＰＯＣ値とは異なる、
Ｃ３０に記載のデバイス。
［Ｃ３３］
前記第２のピクチャは、NoRaslOutputFlagシンタックス要素が１に等しいイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャを備え、前記第１のピクチャが、瞬間デコーダリフレッシュ（ＩＤＲ）ピクチャ、クリーンランダムアクセス（ＣＲＡ）ピクチャ、または切断ンリンクアクセス（ＢＬＡ）ピクチャのうちの１つを備える非ＩＲＡＰピクチャを備える、
Ｃ３２に記載のデバイス。
［Ｃ３４］
前記アクセスユニットは、前記第１のビデオコーディングレイヤおよび前記第２のビデオコーディングレイヤとは異なる第３のビデオコーディングレイヤにおける第３のピクチャをさらに含み、前記リセットされたＰＯＣ値を使用してビデオデータを前記コード化するための手段は、ブロックが前記リセットされたＰＯＣ値の参照を含むとき、前記第１のピクチャに対するレイヤ間予測を使用して前記第３のピクチャの前記ブロックをコード化するための手段を備える、
Ｃ３２に記載のデバイス。
［Ｃ３５］
前記ピクチャは、第１のピクチャを備え、前記ＰＯＣ値は、第１のＰＯＣ値を備え、
前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、第２のピクチャの第２のＰＯＣ値を決定するための手段、ここにおいて、前記第１のピクチャおよび前記第２のピクチャが、共通のビデオコーディングレイヤおよび共通コード化ビデオシーケンスにある、と、
前記第１のＰＯＣ値と前記第２のＰＯＣ値との間の第１の差を決定するための手段と、
デクリメントされた第２のＰＯＣ値と前記リセットされた第１のＰＯＣ値との間の第２の差が前記第１の差に等しいように前記第２のＰＯＣ値をデクリメントするための手段と
をさらに備える、Ｃ３０に記載のデバイス。
［Ｃ３６］
前記シンタックス要素は、ＰＯＣリセットフラグである、
Ｃ３０に記載のデバイス。
［Ｃ３７］
命令を記憶したコンピュータ可読記憶媒体であって、前記命令が、実行されると、ビデオデータをコード化するためのデバイスのプロセッサに、
ピクチャのピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化することと、
前記ＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記ＰＯＣ値の前記一部がゼロに等しくなるように、前記ＰＯＣ値の少なくとも前記一部をリセットすることと、
前記リセットされたＰＯＣ値を使用してビデオデータをコード化することと
を行わせる、コンピュータ可読記憶媒体。
［Ｃ３８］
前記シンタックス要素の前記値は、前記ＰＯＣ値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記プロセッサに、前記ＰＯＣ値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記ＰＯＣ値のすべてのビットがゼロに等しくなるように前記ＰＯＣ値をリセットすることを行わせる命令をさらに備える、
Ｃ３７に記載のコンピュータ可読記憶媒体。
［Ｃ３９］
前記ピクチャは、第１のピクチャを備え、前記プロセッサに、前記第１のピクチャを第１のビデオコーディングレイヤに含み、第２のピクチャを第２のビデオコーディングレイヤに含むアクセスユニットをコード化させる命令をさらに備え、前記第２のビデオコーディングレイヤは、前記第１のビデオコーディングレイヤとは異なり、前記ＰＯＣ値をリセットする前には、前記第１のピクチャの前記ＰＯＣ値は、前記第２のピクチャの第２のＰＯＣ値とは異なる、
Ｃ３７に記載のコンピュータ可読記憶媒体。
［Ｃ４０］
前記第２のピクチャは、NoRaslOutputFlagシンタックス要素が１に等しいイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャを備え、前記第１のピクチャが、瞬間デコーダリフレッシュ（ＩＤＲ）ピクチャ、クリーンランダムアクセス（ＣＲＡ）ピクチャ、または切断ンリンクアクセス（ＢＬＡ）ピクチャのうちの１つを備える非ＩＲＡＰピクチャを備える、
Ｃ３９に記載のコンピュータ可読記憶媒体。
［Ｃ４１］
前記アクセスユニットは、前記第１のビデオコーディングレイヤおよび前記第２のビデオコーディングレイヤとは異なる第３のビデオコーディングレイヤにおける第３のピクチャをさらに含み、前記プロセッサに、前記リセットされたＰＯＣ値を使用してビデオデータをコード化させる前記命令は、前記プロセッサに、ブロックが前記リセットされたＰＯＣ値の参照を含むとき、前記第１のピクチャに対するレイヤ間予測を使用して前記第３のピクチャの前記ブロックをコード化することを行わせる命令を備える、
Ｃ３９に記載のコンピュータ可読記憶媒体。
［Ｃ４２］
前記ピクチャは、第１のピクチャを備え、前記ＰＯＣ値は、第１のＰＯＣ値を備え、前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、前記プロセッサに、
第２のピクチャの第２のＰＯＣ値を決定すること、ここにおいて、前記第１のピクチャおよび前記第２のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
前記第１のＰＯＣ値と前記第２のＰＯＣ値との間の第１の差を決定することと、
デクリメントされた第２のＰＯＣ値と前記リセットされた第１のＰＯＣ値との間の第２の差が前記第１の差に等しいように前記第２のＰＯＣ値をデクリメントすることと
を行わせる命令をさらに備える、Ｃ３７に記載のコンピュータ可読記憶媒体。
［Ｃ４３］
前記シンタックス要素は、ＰＯＣリセットフラグである、
Ｃ３７に記載のコンピュータ可読記憶媒体。

Claims

ビデオデータを復号する方法であって、
第１のピクチャの第１のピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すかどうかを決定することと、
前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、
リセットされた第１のＰＯＣ値の前記一部がゼロに等しくなるように、前記第１のＰＯＣ値の少なくとも前記一部をリセットすることと、
第２のピクチャの第２のＰＯＣ値を決定すること、ここにおいて、前記第１のピクチャおよび前記第２のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
前記第１のＰＯＣ値と前記第２のＰＯＣ値との間の第１の差を決定することと、
デクリメントされた第２のＰＯＣ値と前記リセットされた第１のＰＯＣ値との間の第２の差が前記第１の差に等しいように前記第２のＰＯＣ値をデクリメントすることと、
前記リセットされた第１のＰＯＣ値および前記デクリメントされた第２のＰＯＣ値を使用してビデオデータを復号することと
を備える方法。
前記シンタックス要素の前記値は、前記第１のＰＯＣ値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記方法は、前記第１のＰＯＣ値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第１のＰＯＣ値のすべてのビットがゼロに等しくなるように前記第１のＰＯＣ値をリセットすることをさらに備える、
請求項１に記載の方法。
前記第１のピクチャを第１のビデオコーディングレイヤに含み、第３のピクチャを第２のビデオコーディングレイヤに含むアクセスユニットを受信することをさらに備え、前記第１のビデオコーディングレイヤは、前記共通のビデオコーディングレイヤを備え、前記第２のビデオコーディングレイヤは、前記第１のビデオコーディングレイヤとは異なり、前記第１のＰＯＣ値をリセットする前には、前記第１のピクチャの前記第１のＰＯＣ値は、前記第３のピクチャの第３のＰＯＣ値とは異なる、
請求項１に記載の方法。
前記第１のピクチャの前記第１のＰＯＣ値をリセットすることは、前記リセット後、前記第１のピクチャの前記リセットされた第１のＰＯＣ値は、前記第３のピクチャの前記第３のＰＯＣ値に等しくなるように、前記第１のピクチャの前記第１のＰＯＣ値をリセットすることを備える、
請求項３に記載の方法。
前記第３のピクチャは、NoRaslOutputFlagシンタックス要素が１に等しいイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャを備え、前記第１のピクチャが非ＩＲＡＰピクチャを備える、
請求項３に記載の方法。
前記ＩＲＡＰピクチャは、瞬時デコーダリフレッシュ（ＩＤＲ）ピクチャ、クリーンランダムアクセス（ＣＲＡ）ピクチャ、またはリンク切断アクセス（ＢＬＡ）ピクチャのうちの１つを備える、
請求項５に記載の方法。
前記アクセスユニットは、前記第１のビデオコーディングレイヤおよび前記第２のビデオコーディングレイヤとは異なる第３のビデオコーディングレイヤにおける第４のピクチャをさらに含み、前記リセットされた第１のＰＯＣ値を使用してビデオデータを復号することが、ブロックが前記リセットされた第１のＰＯＣ値の参照を含むとき、前記第１のピクチャに対するレイヤ間予測を使用して前記第４のピクチャの前記ブロックを復号することを備える、
請求項３に記載の方法。
前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、
前記第１のピクチャを有する前記共通のビデオコーディングレイヤにおける複数の他のピクチャのＰＯＣ値を決定すること、ここにおいて、前記複数の他のピクチャは、前記第１のピクチャおよび前記第２のピクチャ以外のピクチャを含む、と、
前記第１のＰＯＣ値と前記他のピクチャの前記ＰＯＣ値との間の差を決定することと、
デクリメントされたＰＯＣ値と前記リセットされた第１のＰＯＣ値との間のそれぞれの差が前記第１のＰＯＣ値と前記他のピクチャの前記ＰＯＣ値との間の前記それぞれの決定された差に等しくなるように、前記他のピクチャの前記ＰＯＣ値をデクリメントすることと
をさらに備える、請求項１に記載の方法。
参照ピクチャセットのデータは、前記他のピクチャが短期参照ピクチャであるか長期参照ピクチャであるかを示し、前記ＰＯＣ値をデクリメントすることは、
前記短期参照ピクチャの前記ＰＯＣ値をデクリメントすることと、
前記長期参照ピクチャの前記ＰＯＣ値をデクリメントすることと
を備える、請求項８に記載の方法。
前記シンタックス要素は、ＰＯＣリセットフラグを備える、
請求項１に記載の方法。
前記シンタックス要素を含むスライスヘッダを復号することをさらに備える、
請求項１に記載の方法。
前記一部は、前記第１のＰＯＣ値の最上位ビット（ＭＳＢ）を備える、
請求項１に記載の方法。
ビデオデータを符号化する方法であって、
第１のピクチャの第１のピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部をゼロの値にリセットすべきかどうかを決定することと、
前記第１のＰＯＣ値の前記少なくとも一部をリセットすることを決定することに応答して、
リセットされた第１のＰＯＣ値の前記一部がゼロに等しくなるように、前記第１のＰＯＣ値の少なくとも前記一部をリセットすることと、
前記第１のＰＯＣ値の少なくとも前記一部がゼロの前記値にリセットされるべきことを示すシンタックス要素の値を符号化することと、
第２のピクチャの第２のＰＯＣ値を決定すること、ここにおいて、前記第１のピクチャおよび前記第２のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
前記第１のＰＯＣ値と前記第２のＰＯＣ値との間の第１の差を決定することと、
デクリメントされた第２のＰＯＣ値と前記リセットされた第１のＰＯＣ値との間の第２の差が前記第１の差に等しいように前記第２のＰＯＣ値をデクリメントすることと、
前記リセットされた第１のＰＯＣ値および前記デクリメントされた第２のＰＯＣ値を使用してビデオデータを符号化することと
を備える方法。
前記シンタックス要素の前記値は、前記第１のＰＯＣ値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記方法は、前記第１のＰＯＣ値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第１のＰＯＣ値のすべてのビットがゼロに等しくなるように前記第１のＰＯＣ値をリセットすることをさらに備える、
請求項１３に記載の方法。
前記第１のピクチャを第１のビデオコーディングレイヤに含み、第３のピクチャを第２のビデオコーディングレイヤに含むアクセスユニットを形成することをさらに備え、前記第１のビデオコーディングレイヤは、前記共通のビデオコーディングレイヤを備え、前記第２のビデオコーディングレイヤは、前記第１のビデオコーディングレイヤとは異なり、前記ＰＯＣ値をリセットする前には、前記第１のピクチャの前記第１のＰＯＣ値は、前記第３のピクチャの第３のＰＯＣ値とは異なる、
請求項１３に記載の方法。
前記第３のピクチャは、NoRaslOutputFlagシンタックス要素が１に等しいイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャを備え、前記第１のピクチャが非ＩＲＡＰピクチャを備えるとき、リセットすべきかどうかを決定することは、前記第１のＰＯＣ値をリセットすることを決定することを備える、
請求項１５に記載の方法。
前記アクセスユニットを形成することは、前記第１のビデオコーディングレイヤおよび前記第２のビデオコーディングレイヤとは異なる第３のビデオコーディングレイヤにおける第４のピクチャを含むように前記アクセスユニットを形成することをさらに備え、前記リセットされた第１のＰＯＣ値を使用してビデオデータを符号化することは、
前記第１のピクチャに対してレイヤ間予測を使用して前記第４のピクチャのブロックを符号化することと、
前記リセットされた第１のＰＯＣ値を参照するために、前記ブロックのシンタックス要素を符号化することと
を備える、請求項１５に記載の方法。
ビデオデータをコード化するためのデバイスであって、
ビデオデータを記憶するように構成されたメモリと、
第１のピクチャの第１のピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化することと、
前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、
リセットされた第１のＰＯＣ値の前記一部がゼロに等しくなるように、前記第１のＰＯＣ値の少なくとも前記一部をリセットすることと、
第２のピクチャの第２のＰＯＣ値を決定すること、ここにおいて、前記第１のピクチャおよび前記第２のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
前記第１のＰＯＣ値と前記第２のＰＯＣ値との間の第１の差を決定することと、
デクリメントされた第２のＰＯＣ値と前記リセットされた第１のＰＯＣ値との間の第２の差が前記第１の差に等しいように前記第２のＰＯＣ値をデクリメントすることと、
前記リセットされた第１のＰＯＣ値および前記デクリメントされた第２のＰＯＣ値を使用して前記ビデオデータをコード化することと
を行うように構成されるビデオコーダと
を備える、ビデオデータをコード化するためのデバイス。
前記シンタックス要素の前記値は、前記第１のＰＯＣ値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記ビデオコーダは、前記第１のＰＯＣ値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第１のＰＯＣ値のすべてのビットがゼロに等しくなるように前記第１のＰＯＣ値をリセットすることを行うようにさらに構成される、
請求項１８に記載のデバイス。
前記ビデオコーダは、前記第１のピクチャを第１のビデオコーディングレイヤに含み、第３のピクチャを第２のビデオコーディングレイヤに含むアクセスユニットをコード化することを行うように構成され、前記第１のビデオコーディングレイヤは、前記共通のビデオコーディングレイヤを備え、前記第２のビデオコーディングレイヤは、前記第１のビデオコーディングレイヤとは異なり、前記第１のＰＯＣ値をリセットする前には、前記第１のピクチャの前記第１のＰＯＣ値は、前記第３のピクチャの第３のＰＯＣ値とは異なる、
請求項１８に記載のデバイス。
前記第３のピクチャは、NoRaslOutputFlagシンタックス要素が１に等しいイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャを備え、前記第１のピクチャは、非ＩＲＡＰピクチャを備える、
請求項２０に記載のデバイス。
前記アクセスユニットは、前記第１のビデオコーディングレイヤおよび前記第２のビデオコーディングレイヤとは異なる第３のビデオコーディングレイヤにおける第４のピクチャをさらに含み、前記リセットされた第１のＰＯＣ値を使用してビデオデータをコード化するために、前記ビデオコーダは、ブロックが前記リセットされた第１のＰＯＣ値の参照を含むとき、前記第１のピクチャに対するレイヤ間予測を使用して前記第４のピクチャの前記ブロックをコード化することを行うように構成される、
請求項２０に記載のデバイス。
前記シンタックス要素は、ＰＯＣリセットフラグを備える、
請求項１８に記載のデバイス。
前記ビデオコーダは、前記リセットされた第１のＰＯＣ値を使用して前記ビデオデータを復号するように構成されたビデオデコーダを備える、
請求項１８に記載のデバイス。
前記ビデオコーダは、前記リセットされた第１のＰＯＣ値を使用して前記ビデオデータを符号化するように構成されたビデオエンコーダを備える、
請求項１８に記載のデバイス。
前記デバイスが、
集積回路、
マイクロプロセッサ、および
ワイヤレス通信デバイス
のうちの少なくとも１つを備える、請求項１８に記載のデバイス。
ビデオデータをコード化するためのデバイスであって、
第１のピクチャの第１のピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化するための手段と、
前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第１のＰＯＣ値の前記一部がゼロに等しくなるように、前記第１のＰＯＣ値の少なくとも前記一部をリセットするための手段と、
前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、第２のピクチャの第２のＰＯＣ値を決定するための手段、ここにおいて、前記第１のピクチャおよび前記第２のピクチャが、共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
前記第１のＰＯＣ値と前記第２のＰＯＣ値との間の第１の差を決定するための手段と、
デクリメントされた第２のＰＯＣ値と前記リセットされた第１のＰＯＣ値との間の第２の差が前記第１の差に等しいように前記第２のＰＯＣ値をデクリメントするための手段と、
前記リセットされた第１のＰＯＣ値および前記デクリメントされた第２のＰＯＣ値を使用してビデオデータをコード化するための手段と
を備えるデバイス。
前記シンタックス要素の前記値は、前記第１のＰＯＣ値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記リセットするための手段は、前記第１のＰＯＣ値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第１のＰＯＣ値のすべてのビットがゼロに等しくなるように前記第１のＰＯＣ値をリセットするための手段を備える、
請求項２７に記載のデバイス。
前記第１のピクチャを第１のビデオコーディングレイヤに含み、第３のピクチャを第２のビデオコーディングレイヤに含むアクセスユニットをコード化するための手段をさらに備え、前記第１のビデオコーディングレイヤは、前記共通のビデオコーディングレイヤを備え、前記第２のビデオコーディングレイヤは、前記第１のビデオコーディングレイヤとは異なり、前記第１のＰＯＣ値をリセットする前には、前記第１のピクチャの前記第１のＰＯＣ値は、前記第３のピクチャの第３のＰＯＣ値とは異なる、
請求項２７に記載のデバイス。
前記第３のピクチャは、NoRaslOutputFlagシンタックス要素が１に等しいイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャを備え、前記第１のピクチャが、非ＩＲＡＰピクチャを備える、
請求項２９に記載のデバイス。
前記アクセスユニットは、前記第１のビデオコーディングレイヤおよび前記第２のビデオコーディングレイヤとは異なる第３のビデオコーディングレイヤにおける第４のピクチャをさらに含み、前記リセットされた第１のＰＯＣ値を使用してビデオデータを前記コード化するための手段は、ブロックが前記リセットされた第１のＰＯＣ値の参照を含むとき、前記第１のピクチャに対するレイヤ間予測を使用して前記第４のピクチャの前記ブロックをコード化するための手段を備える、
請求項２９に記載のデバイス。
前記シンタックス要素は、ＰＯＣリセットフラグを備える、
請求項２７に記載のデバイス。
命令を記憶したコンピュータ可読記憶媒体であって、前記命令が、実行されると、ビデオデータをコード化するためのデバイスのプロセッサに、
第１のピクチャの第１のピクチャオーダーカウント（ＰＯＣ）値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化することと、
前記第１のＰＯＣ値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、
リセットされた第１のＰＯＣ値の前記一部がゼロに等しくなるように、前記第１のＰＯＣ値の少なくとも前記一部をリセットすることと、
第２のピクチャの第２のＰＯＣ値を決定すること、ここにおいて、前記第１のピクチャおよび前記第２のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
前記第１のＰＯＣ値と前記第２のＰＯＣ値との間の第１の差を決定することと、
デクリメントされた第２のＰＯＣ値と前記リセットされた第１のＰＯＣ値との間の第２の差が前記第１の差に等しいように前記第２のＰＯＣ値をデクリメントすることと、
前記リセットされた第１のＰＯＣ値および前記デクリメントされた第２のＰＯＣ値を使用してビデオデータをコード化することと
を行わせる、コンピュータ可読記憶媒体。
前記シンタックス要素の前記値は、前記第１のＰＯＣ値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記プロセッサに、前記第１のＰＯＣ値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第１のＰＯＣ値のすべてのビットがゼロに等しくなるように前記第１のＰＯＣ値をリセットすることを行わせる命令をさらに備える、
請求項３３に記載のコンピュータ可読記憶媒体。
前記プロセッサに、前記第１のピクチャを第１のビデオコーディングレイヤに含み、第３のピクチャを第２のビデオコーディングレイヤに含むアクセスユニットをコード化させる命令をさらに備え、前記第１のビデオコーディングレイヤは、前記共通のビデオコーディングレイヤを備え、前記第２のビデオコーディングレイヤは、前記第１のビデオコーディングレイヤとは異なり、前記第１のＰＯＣ値をリセットする前には、前記第１のピクチャの前記第１のＰＯＣ値は、前記第３のピクチャの第３のＰＯＣ値とは異なる、
請求項３３に記載のコンピュータ可読記憶媒体。
前記第３のピクチャは、NoRaslOutputFlagシンタックス要素が１に等しいイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャを備え、前記第１のピクチャが、非ＩＲＡＰピクチャを備える、
請求項３５に記載のコンピュータ可読記憶媒体。
前記アクセスユニットは、前記第１のビデオコーディングレイヤおよび前記第２のビデオコーディングレイヤとは異なる第３のビデオコーディングレイヤにおける第４のピクチャをさらに含み、前記プロセッサに、前記リセットされた第１のＰＯＣ値を使用してビデオデータをコード化させる前記命令は、前記プロセッサに、ブロックが前記リセットされた第１のＰＯＣ値の参照を含むとき、前記第１のピクチャに対するレイヤ間予測を使用して前記第４のピクチャの前記ブロックをコード化することを行わせる命令を備える、
請求項３５に記載のコンピュータ可読記憶媒体。
前記シンタックス要素は、ＰＯＣリセットフラグを備える、
請求項３３に記載のコンピュータ可読記憶媒体。