JP2016507956A

JP2016507956A - ビデオコーディングにおける時間スケーラビリティを伴うプログレッシブ精緻化

Info

Publication number: JP2016507956A
Application number: JP2015550460A
Authority: JP
Inventors: ワン、イェ−クイ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2012-12-30
Filing date: 2013-12-16
Publication date: 2016-03-10
Anticipated expiration: 2033-12-16
Also published as: JP6337009B2; US9294777B2; PT2939427T; TWI540884B; CN104969555A; ES2605392T3; DK2939427T3; EP2939427B1; KR20150103111A; EP2939427A1; SI2939427T1; HUE030828T2; TW201440498A; CN104969555B; WO2014105485A1; PL2939427T3; KR101672152B1; US20140185670A1

Abstract

ビデオデータを復号する例示的な方法は、符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を受信することと、受信された情報に基づいて、プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかを復号することとを含む。

Description

[0001]本出願は、その内容全体が参照により本明細書に組み込まれる、２０１２年１２月３０日に出願された米国仮出願第６１／７４７，３４７号の利益を主張する。

[0002]本開示は、ビデオコーディングに関し、より詳細には、ビデオデータのプログレッシブ精緻化（progressive refinement）のための技法に関する。

[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップコンピュータまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、携帯電話または衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４、Ｐａｒｔ１０、アドバンストビデオコーディング（ＡＶＣ）、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）規格によって定義された規格、およびそのような規格の拡張に記載されているビデオ圧縮技法などのビデオ圧縮技法を実装する。ビデオデバイスは、そのようなビデオ圧縮技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶することができる。

[0004]ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するために、空間的（イントラピクチャ）予測および／または時間的（インターピクチャ）予測を実行する。ブロックベースのビデオコーディングのために、ビデオスライス（すなわち、ビデオフレームまたはビデオフレームの一部）が複数のビデオブロックに区分化される場合があり、これらはツリーブロック、コーディングユニット（ＣＵ）および／またはコーディングノードと呼ばれる場合もある。ピクチャのイントラコーディングされた（Ｉ）スライス内のビデオブロックは、同じピクチャにおける隣接ブロック内の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコーティングされた（ＰまたはＢ）スライス内のビデオブロックは、同じピクチャにおける隣接ブロック内の参照サンプルに対する空間的予測、または他の参照ピクチャにおける参照サンプルに対する時間的予測を使用することができる。ピクチャはフレームと呼ばれる場合があり、参照ピクチャは参照フレームと呼ばれる場合がある。

[0005]空間的予測または時間的予測により、コーディングされるべきブロック用の予測ブロックがもたらされる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコーディングされたブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコーディングされたブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコーディングされたブロックは、イントラコーディングモードおよび残差データに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて、残差変換係数がもたらされ得るし、次いで、残差変換係数は量子化され得る。量子化変換係数は、最初は２次元アレイで構成され、変換係数の１次元ベクトルを生成するために走査され得るし、なお一層の圧縮を達成するために、エントロピーコーディングが適用され得る。

[0006]一般に、本開示は、時間スケーラビリティを伴う、ビデオのビットストリーム内のビデオデータのプログレッシブ精緻化のための技法を記載する。

[0007]一例では、ビデオデータを復号する方法は、符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を受信することと、受信された情報に基づいてプログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかを復号することとを含む。

[0008]別の例では、ビデオデータを符号化する方法は、プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内の複数のピクチャのうちの少なくともいくつかのピクチャを符号化することと、符号化ビットストリーム内のプログレッシブ精緻化セグメントの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を生成することとを含む。

[0009]別の例では、ビデオデータをコーディングするためのデバイスは、符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定することと、プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかをコーディングすることとを行うように構成されたビデオコーダを含む。

[0010]別の例では、コンピュータ可読記憶媒体は、実行されたとき、符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定することと、プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかをコーディングすることとを、コンピューティングデバイスのプログラマブルプロセッサに行わせる命令を記憶している。

[0011]別の例では、ビデオデータをコーディングするためのデバイスは、符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定するための手段と、プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかをコーディングするための手段とを含む。

[0012]１つまたは複数の例の詳細が、添付の図面および以下の説明に記載されている。他の特徴、目的、および利点は、その説明および図面から、ならびに特許請求の範囲から明らかになろう。

[0013]本開示に記載される１つまたは複数の技法を実装することができる例示的なビデオ符号化および復号システムを示すブロック図。 [0014]本開示に記載される１つまたは複数の技法を実装することができる例示的なビデオエンコーダを示すブロック図。 [0015]本開示に記載される１つまたは複数の技法を実装することができる例示的なビデオデコーダを示すブロック図。 [0016]例示的なプログレッシブ精緻化セグメントと対応するベースピクチャとを示す概念図。 [0017]本開示の１つまたは複数の態様により、プログレッシブ精緻化を用いて符号化ビデオデータを復号するために、ビデオデコーダおよび／またはその構成要素が実行することができる例示的なプロセスを示すフローチャート。 [0018]本開示の１つまたは複数の態様により、プログレッシブ精緻化を用いて符号化ビデオデータを符号化するために、ビデオエンコーダおよび／またはその構成要素が実行することができる例示的なプロセスを示すフローチャート。

[0019]一般に、本開示の技法は、コード化ビデオデータの時間スケーラビリティをサポートしながら、プログレッシブ精緻化を使用してビデオデータをコーディングすることに関する。本開示の様々な例によれば、ビデオコーディングデバイスは、時間スケーラビリティをサポートしながらプログレッシブ精緻化を可能にするために、ＡＶＣ規格とＨＥＶＣ規格の両方によってサポートされる補足エンハンスメント情報（ＳＥＩ）機構によって提供されるメッセージを使用することができる。このようにして、本開示の技法は、時間スケーラビリティをサポートするためにプログレッシブ精緻化ベースのコーディングを強化しながら、ビデオコーディングデバイスが既存のハードウェア、ソフトウェア、および通信基盤を活用することを可能にする潜在的な利点を提供することができる。

[0020]「ＨＥＶＣＷｏｒｋｉｎｇＤｒａｆｔ１０」または「ＷＤ１０」と呼ばれるＨＥＶＣ規格の最近のドラフトは、文書ＪＣＴＶＣ−Ｌ１００３ｖ３４、Ｂｒｏｓｓら、「Ｈｉｇｈｅｆｆｉｃｉｅｎｃｙｖｉｄｅｏｃｏｄｉｎｇ（ＨＥＶＣ）ｔｅｘｔｓｐｅｃｉｆｉｃａｔｉｏｎｄｒａｆｔ１０（ｆｏｒＦＤＩＳ＆ＬａｓｔＣａｌｌ）」、ＩＴＵ−ＴＳＧ１６ＷＰ３とＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１のＪｏｉｎｔＣｏｌｌａｂｏｒａｔｉｖｅＴｅａｍｏｎＶｉｄｅｏＣｏｄｉｎｇ（ＪＣＴ−ＶＣ）、第１２回会合：スイスジュネーブ、２０１３年１月１４〜２３日に記載されおり、この文書は、２０１３年６月６日現在、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｎｔ−ｅｖｒｙ．ｆｒ／ｊｃｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／１２＿Ｇｅｎｅｖａ／ｗｇ１１／ＪＣＴＶＣ−Ｌ１００３−ｖ３４．ｚｉｐからダウンロード可能である。

ＷＤ１０の内容全体は、参照により本明細書に組み込まれる。

ＡＶＣ（ＩＴＵ−Ｔ）Ｈ．２６４規格は、ＩＴＵ−Ｔ研究グループによる２００５年３月付けのＩＴＵ−Ｔ勧告Ｈ．２６４，ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇｆｏｒｇｅｎｅｒｉｃａｕｄｉｏｖｉｓｕａｌｓｅｒｖｉｃｅｓに記載されており、本明細書ではＨ．２６４規格もしくはＨ．２６４仕様、またはＨ．２６４／ＡＶＣ規格もしくは仕様と呼ばれる場合がある。共同ビデオ部会（ＪＶＴ）は、Ｈ．２６４／ＭＰＥＧ−４ＡＶＣへの拡張に取り組み続けている。

[0021]以下でＨＥＶＣＷＤ９と呼ばれる、ＨＥＶＣの別の最近のワーキングドラフト（ＷＤ）は、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｎｔ−ｅｖｒｙ．ｆｒ／ｊｃｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／１１＿Ｓｈａｎｇｈａｉ／ｗｇ１１／ＪＣＴ−ＶＣ−Ｋ１００３−ｖ８．ｚｉｐから入手可能である。ＨＥＶＣＷＤ９（Ｂｒｏｓｓら、「Ｈｉｇｈｅｆｆｉｃｉｅｎｃｙｖｉｄｅｏｃｏｄｉｎｇ（ＨＥＶＣ）ｔｅｘｔｓｐｅｃｉｆｉｃａｔｉｏｎｄｒａｆｔ９」、ＤｏｃｕｍｅｎｔＪＣＴＶＣ−Ｋ１００３＿ｖ７、第１１回会合：中国上海、２０１２年１０月１０〜１９日、ページ２９０）の内容全体は、参照により本明細書に組み込まれる。

[0022]ＡＶＣ規格とＨＥＶＣ規格の両方は、プログレッシブ精緻化を使用するビデオデータのコーディングをサポートする。プログレッシブ精緻化により、復号順序で配列されたピクチャのシーケンスまたはシリーズなどの、ピクチャのセットをデバイスがコーディングすることが可能になり得る。そのようなピクチャのシーケンスは、本明細書では「プログレッシブ精緻化セグメント」と呼ばれる。プログレッシブ精緻化セグメントは、各々が特定のピクチャ（たとえば、「ベースピクチャ」）の精緻化されたバージョンを表す２つ以上の符号化ピクチャを含む場合がある。そのピクチャは、品質、または空間フォーマットなどの他の特性に関して精緻化され得る。一般に、プログレッシブ精緻化セグメントの符号化ピクチャは、動きベースの予測を使用してベースピクチャから予測される場合はない。ビデオコーディングデバイスは、「プログレッシブ精緻化セグメント開始」ＳＥＩメッセージおよび「プログレッシブ精緻化セグメント終了」ＳＥＩメッセージなどの特定のＳＥＩメッセージを使用して、プログレッシブ精緻化セグメントの境界を決定することができる。

[0023]加えて、ＡＶＣ規格とＨＥＶＣ規格の両方は、ビデオビットストリームの時間スケーラビリティをサポートする。時間スケーラビリティにより、符号化ビデオデータのサブセットが符号化ビデオデータの完全なビットストリームから抽出され得るとビデオコーディングデバイスが決定することが可能になり得る。時間スケーラビリティに従って完全なビットストリームから抽出された、そのような符号化ビデオデータ（たとえば、符号化ピクチャ）のサブセットは、「時間サブセット」と呼ばれる場合がある。次に、ＡＶＣ規格およびＨＥＶＣ規格によってサポートされる時間スケーラビリティにより、様々な数の符号化ピクチャを含む様々な時間サブセットなどの、完全なビットストリームからの複数の時間サブセットをビデオコーディングデバイスが決定することが可能になり得る。より低い、または「より粗い」時間サブセットは、完全なビットストリームからのより少ない数の符号化ピクチャを含む場合があり、より低いピクチャレートまたはフレームレートを表す場合がある。反対に、より高い、または「より細かい」時間サブセットは、完全なビットストリームからのより多い数の符号化ピクチャを含む場合があり、より高いピクチャレートまたはフレームレートを表す場合がある。

[0024]時間的にスケーラブルなビットストリームにプログレッシブ精緻化ベースのコーディングの既存の実装形態を適用するように構成されたビデオコーディングデバイスは、プログレッシブ精緻化セグメントに関する１つまたは複数の潜在的な不正確さに遭遇するか、またはそれを提示する可能性がある。たとえば、プログレッシブ精緻化の既存の実装形態によれば、プログレッシブ精緻化セグメント開始ＳＥＩメッセージに含まれるシンタックス要素は、プログレッシブ精緻化セグメントを形成する、連続する符号化ピクチャの数を示すことができる。

[0025]その結果、時間サブセットがシグナリングされる事例では、ＳＥＩメッセージのシンタックス要素によって示されたプログレッシブ精緻化セグメント内の連続する符号化ピクチャの数は、不正確である可能性がある。より詳細には、時間サブセットは完全なビットストリームよりも少ない数の符号化ピクチャを表すので、元のプログレッシブ精緻化セグメントの１つまたは複数の符号化ピクチャは、存在しない可能性がある。しかしながら、プログレッシブ精緻化セグメント内のピクチャの数を示すシンタックス要素は、抽出された時間サブセットの対応するプログレッシブ精緻化セグメント内の符号化ピクチャの削減された数を反映するように、動的に更新されない場合がある。したがって、ビットストリーム用のプログレッシブ精緻化セグメントを形成する、連続する符号化ピクチャの数と、そのビットストリームの時間サブセットの対応するセグメント内の連続する符号化ピクチャの数との間に不一致が存在する可能性がある。

[0026]時間的にスケーラブルなビットストリームに関するプログレッシブ精緻化ベースのコーディングのそのような不正確さを軽減または潜在的に除去するために、本開示の技法は、ビデオコーディングデバイスが、プログレッシブ精緻化セグメントの最後の符号化ピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を使用して、プログレッシブ精緻化セグメントの境界を決定することを可能にすることができる。たとえば、プログレッシブ精緻化セグメントの各符号化ピクチャは、固定されたＰＯＣ値に関連付けられ得る。結果として、情報（たとえば、シンタックス要素）は、セグメントが完全なビットストリームの時間サブセットに含まれているかどうかにかかわらず、セグメントの最後の符号化ピクチャの正確な識別情報を提供することができる。本技法の一実装形態では、情報は、ベースピクチャとプログレッシブ精緻化セグメントの最後の符号化ピクチャとのそれぞれのＰＯＣ値の間の差分（すなわち「デルタＰＯＣ」）を示すことができる。本技法の別の実装形態によれば、情報は、ベースピクチャとプログレッシブ精緻化セグメントの最後の符号化ピクチャとのそれぞれのＰＯＣ値のそれぞれの最下位ビット（ＬＳＢ）の間の差分を示すことができる。

[0027]図１は、本開示に記載される技法を利用することができる例示的なビデオ符号化および復号システム１０を示すブロック図である。図１に示されたように、システム１０は、宛先デバイス１４によって後で復号されるべき符号化ビデオデータを生成するソースデバイス１２を含む。ソースデバイス１２および宛先デバイス１４は、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備える場合がある。場合によっては、ソースデバイス１２および宛先デバイス１４は、ワイヤレス通信に対応する場合がある。

[0028]宛先デバイス１４は、リンク１６を介して復号されるべき符号化ビデオデータを受信することができる。リンク１６は、ソースデバイス１２から宛先デバイス１４に符号化ビデオデータを移動することが可能な任意のタイプの媒体またはデバイスを備える場合がある。一例では、リンク１６は、ソースデバイス１２が符号化ビデオデータをリアルタイムに宛先デバイス１４に直接送信することを可能にするために、通信媒体を備える場合がある。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス１４に送信される場合がある。通信媒体は、無線周波数（ＲＦ）スペクトルまたは１つもしくは複数の物理伝送線路などの任意のワイヤレスまたは有線の通信媒体を備える場合がある。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなどのパケットベースネットワークの一部を形成する場合がある。通信媒体は、ソースデバイス１２から宛先デバイス１４への通信を容易にするために有用であり得る、ルータ、スイッチ、基地局、または任意の他の機器を含む場合がある。

[0029]代替として、符号化データは、出力インターフェース２２からストレージデバイス３１に出力される場合がある。同様に、符号化データは、入力インターフェースによってストレージデバイス３１からアクセスされる場合がある。ストレージデバイス３１は、ハードドライブ、ブルーレイ（登録商標）ディスク、ＤＶＤ、ＣＤ−ＲＯＭ、フラッシュメモリ、揮発性メモリもしくは不揮発性メモリ、または符号化ビデオデータを記憶するための任意の他の適切なデジタル記憶媒体などの、様々な分散された、またはローカルにアクセスされるデータ記憶媒体のいずれかを含む場合がある。さらなる一例では、ストレージデバイス３１は、ソースデバイス１２によって生成された符号化ビデオを保持することができるファイルサーバまたは別の中間ストレージデバイスに対応する場合がある。宛先デバイス１４は、ストリーミングまたはダウンロードを介して、ストレージデバイス３１から記憶されたビデオデータにアクセスすることができる。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス１４に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバには、（たとえば、ウェブサイト用の）ウェブサーバ、ＦＴＰサーバ、ネットワーク接続ストレージ（ＮＡＳ）デバイス、またはローカルディスクドライブが含まれる。宛先デバイス１４は、インターネット接続を含む、任意の標準的なデータ接続を介して符号化ビデオデータにアクセスすることができる。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに適しているワイヤレスチャネル（たとえば、Ｗｉ−Ｆｉ（登録商標）接続）、有線接続（たとえば、ＤＳＬ、ケーブルモデムなど）、または両方の組合せを含むことができる。ストレージデバイス３１からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。

[0030]本開示の技法は、必ずしもワイヤレスの適用例または設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例などの、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用される場合がある。いくつかの例では、システム１０は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および／またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成される場合がある。

[0031]図１の例では、ソースデバイス１２は、ビデオソース１８と、ビデオエンコーダ２０と、出力インターフェース２２とを含む。場合によっては、出力インターフェース２２は、変調器／復調器（モデム）および／または送信機を含む場合がある。ソースデバイス１２において、ビデオソース１８は、ビデオキャプチャデバイス、たとえばビデオカメラ、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するビデオフィードインターフェース、および／もしくはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどのソース、またはそのようなソースの組合せを含む場合がある。一例として、ビデオソース１８がビデオカメラである場合、ソースデバイス１２および宛先デバイス１４は、いわゆるカメラ付き電話またはビデオ電話を形成することができる。しかしながら、本開示に記載される技法は、概してビデオコーディングに適用可能であり得るし、ワイヤレスおよび／または有線の適用例に適用され得る。

[0032]キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオは、ビデオエンコーダ２０によって符号化され得る。符号化ビデオデータは、ソースデバイス１２の出力インターフェース２２を介して宛先デバイス１４に直接送信され得る。符号化ビデオデータは、さらに（または代替的に）、復号および／または再生のための宛先デバイス１４または他のデバイスによる後のアクセスのために、ストレージデバイス３１上に記憶される場合がある。

[0033]宛先デバイス１４は、入力インターフェース２８と、ビデオデコーダ３０と、ディスプレイデバイス３２とを含む。場合によっては、入力インターフェース２８は、受信機および／またはモデムを含む場合がある。宛先デバイス１４の入力インターフェース２８は、リンク１６を介して符号化ビデオデータを受信する。リンク１６を介して通信されるか、またはストレージデバイス３１上に提供された符号化ビデオデータは、ビデオデータを復号する際に、ビデオデコーダ３０などのビデオデコーダが使用するための、ビデオエンコーダ２０によって生成された様々なシンタックス要素を含む場合がある。そのようなシンタックス要素は、通信媒体上で送信されるか、記憶媒体上に記憶されるか、またはファイルサーバに記憶される、符号化ビデオデータとともに含まれる場合がある。

[0034]ディスプレイデバイス３２は、宛先デバイス１４と一体化されるか、またはその外部に存在する場合がある。いくつかの例では、宛先デバイス１４は、一体型ディスプレイデバイスを含み、また、外部ディスプレイデバイスとインターフェースするように構成される場合がある。他の例では、宛先デバイス１４はディスプレイデバイスであり得る。一般に、ディスプレイデバイス３２は、復号されたビデオデータをユーザに表示し、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなどの様々なディスプレイデバイスのいずれかを備える場合がある。

[0035]ビデオエンコーダ２０およびビデオデコーダ３０は、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）規格などのビデオ圧縮規格に従って動作することができ、ＨＥＶＣテストモデル（ＨＭ）に準拠することができる。代替として、ビデオエンコーダ２０およびビデオデコーダ３０は、代替的にＭＰＥＧ−４、Ｐａｒｔ１０、アドバンストビデオコーディング（ＡＶＣ）と呼ばれるＩＴＵ−ＴＨ．２６４規格などの、他のプロプライエタリ規格もしくは業界規格、またはそのような規格の拡張に従って動作することができる。しかしながら、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例には、ＭＰＥＧ−２およびＩＴＵ−ＴＨ．２６３が含まれる。

[0036]図１には示されていないが、いくつかの態様では、ビデオエンコーダ２０およびビデオデコーダ３０は、各々オーディオエンコーダおよびオーディオデコーダと統合され得るし、共通のデータストリームまたは別個のデータストリーム内のオーディオとビデオの両方の符号化を処理するために、適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含む場合がある。適用可能な場合、いくつかの例では、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠することができる。

[0037]ビデオエンコーダ２０およびビデオデコーダ３０は、各々１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せなどの、様々な適切なエンコーダ回路のいずれかとして実装される場合がある。本技法が部分的にソフトウェアに実装されるとき、デバイスは、適切な非一時的コンピュータ可読媒体にソフトウェア用の命令を記憶し、本開示の技法を実行するために、１つまたは複数のプロセッサを使用してその命令をハードウェア内で実行することができる。ビデオエンコーダ２０およびビデオデコーダ３０の各々は、１つまたは複数のエンコーダまたはデコーダに含まれる場合があり、そのいずれかは、それぞれのデバイスにおいて複合エンコーダ／デコーダ（コーデック）の一部として統合される場合がある。

[0038]ＪＣＴ−ＶＣは、ＨＥＶＣ規格の開発に取り組んでいる。ＨＥＶＣ規格化の取り組みは、ＨＥＶＣテストモデル（ＨＭ）と呼ばれるビデオコーディングデバイスの発展的モデルに基づく。ＨＭは、たとえば、ＩＴＵ−ＴＨ．２６４／ＡＶＣに従う既存のデバイスに対してビデオコーディングデバイスのいくつかの追加の能力を仮定する。たとえば、Ｈ．２６４は９つのイントラ予測符号化モードを提供するが、ＨＭは３３個ものイントラ予測符号化モードを提供することができる。

[0039]一般に、ＨＭの作業モデルは、ビデオフレームまたはピクチャが、ルーマサンプルとクロマサンプルの両方を含む一連のツリーブロックまたは最大コーディングユニット（ＬＣＵ）に分割され得ることを記述する。ツリーブロックは、Ｈ．２６４規格のマクロブロックと同様の目的を有する。スライスは、コーディング順序でいくつかの連続するツリーブロックを含む。ビデオフレームまたはピクチャは、１つまたは複数のスライスに区分化される場合がある。各ツリーブロックは、４分木に従ってコーディングユニット（ＣＵ）に分割される場合がある。たとえば、４分木のルートノードとしてのツリーブロックは、４つの子ノードに分割される場合があり、各子ノードは、次に、親ノードとなり、別の４つの子ノードに分割される場合がある。４分木のリーフノードとしての最終的な分割されていない子ノードは、コーディングノード、すなわち、コード化ビデオブロックを備える。コード化ビットストリームに関連付けられたシンタックスデータは、ツリーブロックが分割され得る最大回数を定義することができ、コーディングノードの最小サイズも定義することができる。

[0040]ＣＵは、１つのルーマコーディングブロックと、２つのクロマコーディングブロックとを含む場合がある。ＣＵは、関連する予測ユニット（ＰＵ）と変換ユニット（ＴＵ）とを有する場合がある。ＰＵの各々は、１つのルーマ予測ブロックと、２つのクロマ予測ブロックとを含む場合があり、ＴＵの各々は、１つのルーマ変換ブロックと、２つのクロマ変換ブロックとを含む場合がある。コーディングブロックの各々は、同じ予測が当てはまるサンプルに対するブロックを備える、１つまたは複数の予測ブロックに区分化される場合がある。コーディングブロックの各々は、同じ変換が適用されるサンプルのブロックを備える、１つまたは複数の変換ブロックに区分化される場合もある。

[0041]ＣＵのサイズは、一般に、コーディングノードのサイズに対応し、通常、形状が方形である。ＣＵのサイズは、８×８のピクセルから最大６４×６４またはそれ以上のピクセルを有する、ツリーブロックのサイズまで及ぶ場合がある。各ＣＵは、１つまたは複数のＰＵと、１つまたは複数のＴＵとを定義することができる。ＣＵに含まれるシンタックスデータは、たとえば、コーディングブロックを１つまたは複数の予測ブロックに区分化することを記述することができる。区分化モードは、ＣＵが、スキップモード符号化もしくはダイレクトモード符号化されるか、イントラ予測モード符号化されるか、またはインター予測モード符号化されるかによって異なる場合がある。予測ブロックは、形状が方形または非方形になるように区分化される場合がある。ＣＵに含まれるシンタックスデータは、たとえば、４本木に従って、コーディングブロックを１つまたは複数の変換ブロックに区分化することも記述することができる。変換ブロックは、形状が方形または非方形になるように区分化される場合がある。

[0042]ＨＥＶＣ規格は、様々なＣＵについて異なる場合があるＴＵに従う変換を可能にする。ＴＵは、通常、区分化されたＬＣＵについて定義された所与のＣＵ内のＰＵのサイズに基づいてサイズが決定されるが、常にそうであるとは限らない。ＴＵは、通常、ＰＵと同じサイズであるか、またはＰＵよりも小さい。いくつかの例では、ＣＵに対応する残差サンプルは、「残差４分木」（ＲＱＴ）として知られる４分木構造を使用して、より小さいユニットに再分割される場合がある。ＲＱＴのリーフノードはＴＵを表すことができる。ＴＵに関連付けられたピクセル差分値は、変換係数を生成するために変換され得るし、その変換係数は量子化され得る。

[0043]一般に、ＰＵは、予測プロセスに関係するデータを含む。たとえば、ＰＵがイントラモード符号化されるとき、ＰＵは、そのＰＵ用のイントラ予測モードを記述するデータを含む場合がある。別の例として、ＰＵがインターモード符号化されるとき、ＰＵは、そのＰＵ用の動きベクトルを定義するデータを含む場合がある。ＰＵ用の動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルについての解像度（たとえば、１／４ピクセル精度もしくは１／８ピクセル精度）、動きベクトルが指す参照ピクチャ、および／または動きベクトル用の参照ピクチャリスト（たとえば、リスト０、リスト１、もしくはリストＣ）を記述することができる。

[0044]一般に、ＴＵは、変換プロセスおよび量子化プロセスのために使用される。１つまたは複数のＰＵを有する所与のＣＵは、１つまたは複数のＴＵを含む場合もある。予測に続いて、ビデオエンコーダ２０は、ＰＵに従ってコーディングノードによって識別されたビデオブロックから残差値を計算することができる。コーディングノードは、次いで、元のビデオブロックではなく残差値を参照するように更新される。残差値はピクセル差分値を備え、ピクセル差分値は、エントロピーコーディングのための直列化変換係数を生成するためにＴＵ内で指定された変換と他の変換情報とを使用して変換係数に変換され、量子化され、走査される場合がある。コーディングノードは、これらの直列化変換係数を指すようにもう一度更新される場合がある。本開示は、通常、ＣＵのコーディングノードを指すために、「ビデオブロック」という用語を使用する。いくつかの特定の場合には、本開示は、コーディングノードならびにＰＵおよびＴＵを含む、ツリーブロック、すなわち、ＬＣＵまたはＣＵを指すために、「ビデオブロック」という用語を使用する場合もある。

[0045]ビデオシーケンスは、通常、一連のビデオフレームまたはピクチャを含む。ピクチャのグループ（ＧＯＰ）は、一般に、ビデオピクチャのうちの一連の１つまたは複数を備える。ＧＯＰは、ＧＯＰに含まれるピクチャの数を記述するシンタックスデータを、ＧＯＰのヘッダ内、ピクチャのうちの１つまたは複数のヘッダ内、または他の場所に含む場合がある。ピクチャの各スライスは、それぞれのスライスのための符号化モードを記述するスライスシンタックスデータを含む場合がある。ビデオエンコーダ２０は、通常、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックは、ＣＵ内のコーディングノードに対応する場合がある。ビデオブロックは、固定サイズまたは可変サイズを有する場合があり、指定されたコーディング規格に応じてサイズが異なる場合がある。

[0046]一例として、ＨＭは、様々なＰＵサイズでの予測をサポートする。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ＨＭは、ＰＵサイズが２Ｎ×２ＮまたはＮ×Ｎのイントラ予測と、対称のＰＵサイズが２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、またはＮ×Ｎのインター予測とをサポートする。ＨＭはまた、２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズでのインター予測のための非対称区分化をサポートする。非対称区分化では、ＣＵの一方向は区分化されないが、他の方向は２５％と７５％とに区分化される。２５％の区分に対応するＣＵの部分は、「ｎ」とその後ろに付く「Ｕｐ」、「Ｄｏｗｎ」、「Ｌｅｆｔ」、または「Ｒｉｇｈｔ」という指示によって示される。したがって、たとえば、「２Ｎ×ｎＵ」は、上部の２Ｎ×０．５ＮのＰＵおよび下部の２Ｎ×１．５ＮのＰＵで水平方向に区分化された２Ｎ×２ＮのＣＵを指す。

[0047]本開示では、「Ｎ×Ｎ（NxN）」および「Ｎ×Ｎ（N by N）」は、垂直寸法および水平寸法に関するビデオブロックのピクセル寸法、たとえば、１６×１６（16x16）ピクセルまたは１６×１６（16 by 16）ピクセルを指すために互換的に使用される場合がある。一般に、１６×１６ブロックは、垂直方向に１６個のピクセルを有し（ｙ＝１６）、水平方向に１６個のピクセルを有する（ｘ＝１６）。同様に、Ｎ×Ｎブロックは、一般に、垂直方向にＮピクセルを有し、水平方向にＮピクセルを有し、Ｎは非負整数値を表す。ブロック内のピクセルは行と列に構成され得る。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要はない。たとえば、ブロックはＮ×Ｍピクセルを備える場合があり、ここで、Ｍは必ずしもＮに等しいとは限らない。

[0048]ＣＵのＰＵを使用したイントラ予測コーディングまたはインター予測コーディングの後、ビデオエンコーダ２０は、ＣＵのＴＵによって指定された変換が適用される残差データを計算することができる。残差データは、符号化されていないピクチャのピクセルと、ＣＵに対応する予測値との間のピクセル差分に対応する場合がある。ビデオエンコーダ２０は、ＣＵのための残差データを形成し、次いで、変換係数を生成するために残差データを変換することができる。

[0049]変換係数を生成するための任意の変換に続いて、ビデオエンコーダ２０は、変換係数の量子化を実行することができる。量子化は、一般に、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を実現するプロセスを指す。量子化プロセスは、係数の一部または全部に関連付けられたビット深度を低減させることができる。たとえば、ｎビット値は量子化中にｍビット値に切り捨てられ得るし、ここで、ｎはｍよりも大きい。

[0050]いくつかの例では、ビデオエンコーダ２０は、量子化された変換係数を走査して、エントロピー符号化され得る直列化されたベクトルを生成するために、所定の走査順序を利用することができる。他の例では、ビデオエンコーダ２０は適応走査を実行することができる。量子化変換係数を走査して１次元ベクトルを形成した後に、ビデオエンコーダ２０は、たとえば、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分化エントロピー（ＰＩＰＥ）コーディング、または別のエントロピー符号化方法に従って、１次元ベクトルをエントロピー符号化することができる。ビデオエンコーダ２０はまた、ビデオデータを復号する際にビデオデコーダ３０が使用するための、符号化ビデオデータに関連付けられたシンタックス要素をエントロピー符号化することができる。

[0051]ＣＡＢＡＣを実行するために、ビデオエンコーダ２０は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当てることができる。コンテキストは、たとえば、シンボルの隣接値が非０であるか否かに関係する場合がある。

ＣＡＶＬＣを実行するために、ビデオエンコーダ２０は、送信されるべきシンボル用の可変長コードを選択することができる。ＶＬＣにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構築される場合がある。このようにして、ＶＬＣを使用すると、たとえば、送信されるべきシンボルごとに等長コードワードを使用するよりも、ビット節約を実現することができる。確率決定は、シンボルに割り当てられたコンテキストに基づく場合がある。

[0052]ビデオエンコーダ２０およびビデオデコーダ３０のうちの一方または両方は、時間的にスケーラブルなビットストリームをサポートしながら、プログレッシブ精緻化を使用してビデオデータをコーディングするために、本開示の技法を実装することができる。ビデオエンコーダ２０は、プログレッシブ精緻化セグメントを形成するために、ピクチャのシリーズまたはシーケンスを符号化するように構成される場合があるか、または場合によっては動作可能であり得る。次に、ビデオエンコーダ２０は、符号化ビデオビットストリームの一部として、プログレッシブ精緻化セグメントをビデオデコーダ３０にシグナリングすることができる。

[0053]ビデオエンコーダ２０およびビデオデコーダ３０のうちの一方または両方は、復号順序でベースピクチャの直後にくる一連のピクチャとして、プログレッシブ精緻化セグメントを識別することができる。プログレッシブ精緻化セグメントを識別するために、ビデオエンコーダ２０および／またはビデオデコーダ３０は、プログレッシブ精緻化セグメント開始ＳＥＩメッセージがベースピクチャの直後にくると決定することができる。加えて、プログレッシブ精緻化セグメントのピクチャは、動き情報を使用して、直接的または間接的にベースピクチャから予測されない。いくつかの例では、プログレッシブ精緻化セグメントの各ピクチャは、プログレッシブ精緻化シーケンスの先行するピクチャよりも、定義された増分する品質の精緻化を表す。

[0054]たとえば、プログレッシブ精緻化セグメントの最初のピクチャは、ベースピクチャと比較して、定義された増分の品質の精緻化を表すことができる。次に、プログレッシブ精緻化セグメントの２番目のピクチャは、プログレッシブ精緻化セグメントの最初のピクチャに対して、定義された増分の品質の精緻化を表すことができる。様々な例では、定義された増分は、プログレッシブ精緻化セグメント全体にわたって同じままの場合があるか、またはプログレッシブ精緻化セグメント内の様々なピクチャの遷移で異なる場合がある。このようにして、プログレッシブ精緻化セグメントは、全体として、ベースピクチャよりも均一な一連の品質の精緻化を表すことができる。

[0055]ビデオエンコーダ２０は、ベースピクチャを符号化することができ、次に、プログレッシブ精緻化セグメントの各ピクチャの直前にくる符号化ピクチャに、増分する品質の精緻化を加えることによって、プログレッシブ精緻化セグメントを符号化することができる。加えて、ビデオエンコーダ２０は、１つまたは複数の補足エンハンスメント情報（ＳＥＩ）メッセージを使用して、プログレッシブ精緻化セグメントの境界をシグナリングすることができる。たとえば、ビデオエンコーダ２０は、たとえば、プログレッシブ精緻化セグメント内の最初のピクチャの直前に「プログレッシブ精緻化セグメント開始」ＳＥＩメッセージを使用して、プログレッシブ精緻化セグメントの開始境界をシグナリングすることができる。同様に、ビデオエンコーダ２０は、たとえば、プログレッシブ精緻化セグメント内の最後のピクチャの直後にくる「プログレッシブ精緻化セグメント終了」ＳＥＩメッセージを使用して、プログレッシブ精緻化セグメントの終了境界をシグナリングすることができる。ＨＥＶＣワーキングドラフト（たとえば、「ＷＤ９」）でサポートされるＳＥＩメッセージの概要が、下記の表１に示される。

[0056]ＨＥＶＣＷＤ９でサポートされるプログレッシブ精緻化セグメント開始ＳＥＩメッセージ用のシンタックスおよびセマンティックスが、下記のシンタックス表１に示される。

[0057]記載されたように、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの開始を指定するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを符号化することができる。対応して、ビデオデコーダ３０は、受信された符号化ビデオビットストリームを復号する間に、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号し、たとえば、符号化されたプログレッシブ精緻化セグメント内の最初のピクチャを識別するために、符号化されたプログレッシブ精緻化セグメントの開始を決定することができる。復号順序に従ってプログレッシブ精緻化セグメント内の連続するピクチャのセットをシグナリングするビデオエンコーダ２０に基づいて、ビデオデコーダ３０は、シグナリングされた順序でプログレッシブ精緻化セグメントを復号することができる。加えて、いくつかの例では、ビデオエンコーダ２０は、出力順序で連続する符号化ピクチャのセットとして、プログレッシブ精緻化セグメントを生成し、シグナリングすることができる。これらの例では、ビデオデコーダ３０は、出力順序でプログレッシブ精緻化セグメントを復号することもできる。

[0058]プログレッシブ精緻化セグメント開始ＳＥＩメッセージに含まれる「ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄ」シンタックス要素は、プログレッシブ精緻化セグメントの連続するピクチャ間の増分する品質の精緻化を定義する、プログレッシブ精緻化動作を識別することができる。たとえば、ビデオエンコーダ２０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値を、０で始まり、（２＾３２−２）で終わり、両端値を含む数値範囲内に設定することができる。より詳細には、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの連続するピクチャ間の増分する品質の精緻化を定義する、特定のプログレッシブ精緻化動作を示すように、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値を設定することができる。

[0059]次に、ビデオデコーダ３０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素のシグナリングされた値を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。加えて、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最初の符号化ピクチャを復号するために、シグナリングされた符号化ベースピクチャに適用されるプログレッシブ精緻化動作を決定するために、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値を使用することができる。

[0060]同様に、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最後のピクチャを除いて、プログレッシブ精緻化セグメントの各ピクチャに、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素によって示されたプログレッシブ精緻化動作を適用することができる。言い換えれば、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最初のピクチャで始まり、プログレッシブ精緻化セグメントの最後から２番目のピクチャで終わる、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値によって識別された動作を反復的に適用することができる。より詳細には、符号化ベースピクチャ、およびプログレッシブ精緻化セグメントの最初から最後から２番目までの符号化ピクチャの各々に、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値によって識別された精緻化動作を適用することによって、ビデオデコーダ３０は、プログレッシブ精緻化セグメント全体を復号することができる。

[0061]加えて、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを符号化する際に、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントを作り上げる符号化ピクチャのタグ付けされたセットに含まれる符号化ピクチャの数を示すように、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の値を設定することができる。より詳細には、ビデオエンコーダ２０がｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の値を非ゼロ値に設定する事例では、プログレッシブ精緻化セグメントに含まれる符号化ピクチャの数は、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の値プラス１に等しくなり得る。

[0062]次に、ビデオデコーダ３０は、プログレッシブ精緻化セグメント全体を復号するのに必要なプログレッシブ精緻化動作の反復的適用の数を決定するために、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の値を使用することができる。より詳細には、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最初の符号化ピクチャを復号するために、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値によって示されたプログレッシブ精緻化動作をベースピクチャに適用することができる。加えて、ビデオデコーダ３０は、復号順序でベースピクチャの直後にくる一連の符号化ピクチャに、同じプログレッシブ精緻化動作を反復的に適用することができる。

[0063]より詳細には、ビデオデコーダ３０は、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の値に等しい数の連続する符号化ピクチャに、識別されたプログレッシブ精緻化動作を反復的に適用することができる。ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素は、プログレッシブ精緻化セグメントに含まれる符号化ピクチャの総数よりも１つ少ない値を示すので、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの、最後の符号化ピクチャを除いて、各符号化ピクチャにプログレッシブ精緻化動作を反復的に適用することができる。言い換えれば、ビデオデコーダ３０は、符号化ベースピクチャ、およびプログレッシブ精緻化セグメントの最初の項目で始まり、プログレッシブ精緻化セグメントの最後から２番目の項目で終わる一連の符号化ピクチャに、同じプログレッシブ精緻化動作を適用するために、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素およびｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素によって示された値を適用することができる。

[0064]加えて、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの終了を指定または場合によっては示すために、「プログレッシブ精緻化セグメント終了」ＳＥＩメッセージを符号化し、シグナリングすることができる。いくつかの例では、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャとともに、またはその後で、プログレッシブ精緻化セグメント終了ＳＥＩメッセージをシグナリングすることができる。ＨＥＶＣＷＤ９でサポートされるプログレッシブ精緻化セグメント終了ＳＥＩメッセージ用のシンタックスおよびセマンティックスが、下記のシンタックス表２に示される。

[0065]上記のシンタックス表２に示されたように、ビデオエンコーダ２０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素を含めるように、プログレッシブ精緻化セグメント終了ＳＥＩメッセージを生成することができる。より詳細には、ビデオエンコーダ２０は、現在のプログレッシブ精緻化セグメント用の対応するプログレッシブ精緻化セグメント開始ＳＥＩメッセージ内で指定されたｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値と同じ値に、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値を設定することができる。記載されたように、ビデオエンコーダ２０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値を、０で始まり、（２＾３２−２）で終わり、両端値を含む数値範囲内に設定することができる。

[0066]次に、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの終了境界を決定するために、符号化ビデオビットストリーム内で受信された符号化されたプログレッシブ精緻化セグメント終了ＳＥＩメッセージを復号することができる。特に、ビデオデコーダ３０は、プログレッシブ精緻化セグメント終了ＳＥＩメッセージの検出に基づいて、符号化ビデオビットストリーム内でシグナリングされた次の符号化ピクチャを復号するために、プログレッシブ精緻化動作の適用を停止するように決定することができる。一例として、ビデオデコーダ３０は、符号化ビデオビットストリーム内でシグナリングされた先行する符号化ピクチャからの動き情報を使用して、プログレッシブ精緻化セグメントに続く最初の符号化ピクチャが予測されると決定することができる。

[0067]加えて、ＨＥＶＣＷＤ９によれば、ビデオエンコーダ２０およびビデオデコーダ３０のうちの一方または両方は、符号化ビデオビットストリームの時間スケーラビリティをサポートすることができる。たとえば、ビデオエンコーダ２０およびビデオデコーダ３０は、様々な符号化ビデオビットストリームによって提供される様々なピクチャレート（または「フレームレート」）をサポートすることができる。たとえば、完全な符号化ビデオビットストリームよりも低い時間ピクチャレートをサポートするために、ビデオエンコーダ２０は、完全な符号化ビデオビットストリームのサブセットをシグナリングすることができる。特定の例では、ビデオエンコーダ２０は、完全な符号化ビデオビットストリームに含まれる符号化ピクチャのサブセットをシグナリングすることができる。言い換えれば、シグナリングされた符号化ピクチャのサブセットは、完全な符号化ビデオビットストリームと比較して、少なくとも１つのより少ない符号化ピクチャを含む場合がある。より低いピクチャレートをサポートするためにビデオエンコーダ２０によってシグナリングされる符号化ピクチャのサブセットは、本明細書では「時間サブセット」または「サブビットストリーム」と呼ばれる。

[0068]ビデオエンコーダ２０は、符号化ビデオビットストリームの時間スケーラビリティを介して提供される様々なピクチャレートに従って、様々な時間サブセットをシグナリングすることができる。一例では、ビデオエンコーダ２０は、完全な符号化ビデオビットストリームの第１の時間サブセットをシグナリングすることによって、低いピクチャレートをサポートすることができる。この例によれば、ビデオエンコーダ２０は、第１の時間サブセットよりも多い少なくとも１つの符号化ピクチャだが、完全な符号化ビデオビットストリームよりも少ない少なくとも１つの符号化ピクチャを含む、第２の時間サブセットをシグナリングすることによって、中間のピクチャレートをサポートすることができる。この例では、ビデオエンコーダ２０は、完全な符号化ビデオビットストリームの全体（たとえば、符号化ピクチャの完全なセット）をシグナリングすることによって、可能な限り高いピクチャレートをシグナリングすることができる。

[0069]しかしながら、ビデオエンコーダ２０がＨＥＶＣＷＤ９に従って時間サブセットの一部としてプログレッシブ精緻化セグメントをシグナリングする事例では、ビデオエンコーダ２０は、プログレッシブ精緻化セグメント開始ＳＥＩメッセージに含まれるｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１の値を動的に更新するように構成されない場合がある。結果として、ビデオエンコーダ２０は、潜在的に、時間的にスケーリングされたプログレッシブ精緻化セグメントに含まれる符号化ピクチャの不正確なカウントをシグナリングする可能性がある。より詳細には、完全な符号化ビデオビットストリームから時間サブセットまたはサブビットストリームを生成する際に、ビデオエンコーダ２０は、時間サブセット内のプログレッシブ精緻化セグメントに対応するピクチャの数がピクチャの完全なセット用に提供されたピクチャの数よりも少ないように、完全なビットストリームから１つまたは複数の符号化ピクチャを除去することができる。

[0070]いくつかのシナリオでは、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントに含まれる１つまたは複数の符号化ピクチャを除去することができる。ビデオエンコーダ２０が完全なビットストリームを時間的にスケーリングするためにプログレッシブ精緻化セグメントから１つまたは複数の符号化ピクチャを除去するシナリオでは、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素は正しくない値を表す可能性がある。より詳細には、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の値は、完全なビットストリーム内で表されたように、１つだけ減らされた元のプログレッシブ精緻化セグメント内の符号化ピクチャの数を示す場合がある。しかしながら、このシナリオでは、時間的にスケーリングされたプログレッシブ精緻化セグメントは、完全なビットストリームの元のプログレッシブ精緻化セグメントよりも少ない数の符号化ピクチャを含む場合がある。その結果、ビデオエンコーダは、時間的にスケーリングされたプログレッシブ精緻化セグメントに関して、正しくない値を有するｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素を生成し、シグナリングする可能性がある。

[0071]次に、ビデオデコーダ３０は、符号化プログレッシブ精緻化開始ＳＥＩメッセージを復号し、それにより、時間的にスケーリングされたプログレッシブ精緻化セグメントに関して、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素によって示された正しくない値を取得する可能性がある。結果として、ビデオデコーダ３０は、時間的にスケーリングされたプログレッシブ精緻化セグメント内の符号化ピクチャの数を超える数の連続する符号化ピクチャに、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄによって識別されたプログレッシブ精緻化動作を適用する可能性がある。いくつかのそのような例では、ビデオデコーダ３０は、プログレッシブ精緻化動作のみを使用して符号化ピクチャを復号する場合があり、ここで実際には、符号化ピクチャは、ベースピクチャの品質の精緻化を表さないか、または動きベースの予測などの他の修正に加えて品質の精緻化を表す。

[0072]時間的にスケーリングされたプログレッシブ精緻化セグメントに関して上述された潜在的な不正確さを軽減または除去するために、ビデオエンコーダ２０および／またはビデオデコーダ３０は、本開示の１つまたは複数の技法を実装することができる。本明細書に記載された技法のいくつかの実装形態では、ビデオエンコーダ２０およびビデオデコーダ３０は、符号化ビデオビットストリームが時間サブセットか完全なビットストリームかにかかわらず、符号化ビデオビットストリーム内のプログレッシブ精緻化セグメントの境界を識別するために、プログレッシブ精緻化セグメントの最後の項目のピクチャ順序カウント（ＰＯＣ）値を使用することができる。符号化ピクチャのＰＯＣ値は固定値であり得るので、ビデオデコーダ３０は、シグナリングされた符号化ピクチャの数に基づいてプログレッシブ精緻化セグメントの終了境界のＰＯＣ値を導出することが必要ではない場合がある。

[0073]代わりに、本明細書に記載された技法のいくつかの実装形態によれば、ビデオデコーダ３０は、セグメントの最後の符号化ピクチャを復号するときに、セグメントの最後の符号化ピクチャのＰＯＣ値に基づいて、プログレッシブ精緻化シーケンスの終了境界を検出することができる。様々な例では、符号化ビデオビットストリーム内のセグメントの最後のピクチャのＰＯＣ値を示す情報を生成し、シグナリングすることによって、ビデオエンコーダ２０によって符号化された情報により、ビデオデコーダ３０がセグメントの最後の符号化ピクチャを検出することが可能になり得る。

[0074]様々な例では、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値を示す情報を含めるように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを修正するために、本開示の１つまたは複数の技法を実装することができる。いくつかの例では、ビデオエンコーダ２０は、プログレッシブ精緻化セグメント開始ＳＥＩメッセージ内に、プログレッシブ精緻化セグメント内の最後の符号化ピクチャのＰＯＣ値を直接的または間接的に示す１つまたは複数のシンタックス要素を含めるように構成される場合がある。

[0075]１つのそのような実装形態によれば、ビデオエンコーダ２０は、ベースピクチャのＰＯＣ値とプログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値との間の差分を示すために、「デルタＰＯＣ」値を示すシンタックスを生成することができる。別のそのような実装形態によれば、ビデオエンコーダ２０は、ベースピクチャおよびプログレッシブ精緻化セグメントの最後のピクチャのそれぞれの最下位ビット（ＬＳＢ）の間の差分を示す「デルタＬＳＢ」値を示すシンタックス要素を生成することができる。

[0076]本開示の１つまたは複数の態様により、その中にビデオエンコーダ２０がデルタＰＯＣシンタックス要素を含めることができる、プログレッシブ精緻化セグメント開始ＳＥＩメッセージの一例についてのシンタックスおよびセマンティックスが、下記のシンタックス表３に記載される。

[0077]シンタックス表３の例では、デルタＰＯＣシンタックス要素が「ｐｉｃ＿ｏｒｄｅｒ＿ｃｎｔ＿ｄｅｌｔａ」によって示される。ビデオエンコーダ２０がデルタＰＯＣシンタックス要素をシグナリングする実装形態では、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャを決定するために、シグナリングされたデルタＰＯＣシンタックス要素の値を使用することができる。より詳細には、ビデオデコーダ３０は、プログレッシブ精緻化セグメント開始ＳＥＩメッセージの検出に基づいて、プログレッシブ精緻化セグメントの開始を検出することができる。加えて、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値を取得するために、ベースピクチャのＰＯＣ値にデルタＰＯＣシンタックス要素の値を加えることができる。次に、ビデオデコーダ３０は、ビデオデコーダ３０がセグメントの最後のピクチャを検出するまで、ベースピクチャに続く一連の符号化ピクチャの各々に、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値によって示されたプログレッシブ精緻化動作を反復的に適用することができる。特に、ビデオデコーダ３０は、デルタＰＯＣシンタックス要素の値に基づいて導出された最後のピクチャのＰＯＣ値に基づいて、プログレッシブ精緻化セグメントの最後のピクチャを検出することができる。

[0078]同様に、ビデオエンコーダ２０がデルタＬＳＢシンタックス要素をシグナリングする実装形態では、ビデオデコーダ３０は、ベースピクチャのＰＯＣ値のＬＳＢにデルタＬＳＢシンタックス要素の値を加えることができる。ベースピクチャのＰＯＣ値のＬＳＢにデルタＬＳＢシンタックス要素の値を加えることによって、ビデオデコーダ３０は、プログレッシブ精緻化セグメント内の最後の符号化ピクチャのＰＯＣ値のＬＳＢを取得することができる。次に、プログレッシブ精緻化セグメント内の最後の符号化ピクチャのＰＯＣ値の取得されたＬＳＢを使用して、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの終了境界を検出することができる。

[0079]より詳細には、ビデオデコーダ３０は、ビデオデコーダ３０がセグメントの最後の符号化ピクチャを検出するまで、識別されたプログレッシブ精緻化動作を反復的に適用することによって、プログレッシブ精緻化セグメントを作り上げる一連の符号化ピクチャを復号することができる。ＰＯＣ値のＬＳＢを使用してプログレッシブ精緻化セグメント内の最後の符号化ピクチャを検出すると、ビデオデコーダ３０は、プログレッシブ精緻化セグメント開始ＳＥＩメッセージ内で指定されたパラメータによる復号（すなわち、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値によって識別された動作）を停止することができる。

[0080]上述された技法のうちの１つまたは複数を実装することによって、ビデオエンコーダ２０およびビデオデコーダ３０のうちの一方または両方は、符号化ビデオビットストリームの時間スケーラビリティをサポートしながら、プログレッシブ精緻化を使用するビデオコーディングを実装することができる。様々な例によれば、プログレッシブ精緻化セグメントが元々決定されたよりも少ないピクチャを含めるように時間的にスケーリングされたかどうかにかかわらず、ビデオエンコーダ２０および／またはビデオデコーダ３０は、プログレッシブ精緻化セグメントの境界を決定するために、ＰＯＣ値などの固定情報を使用することができる。

[0081]このように、ソースデバイス１２および宛先デバイス１４のうちの一方または両方は、ビデオコーダ、すなわち、それぞれビデオエンコーダ２０およびビデオデコーダ３０を備える、ビデオデータをコーディングするためのデバイスの一例であり得る。加えて、上述された技法によれば、ビデオエンコーダ２０およびビデオデコーダ３０のうちの一方または両方は、符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定することと、プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかをコーディングすることとを行うように構成されたビデオコーダの例であり得る。

[0082]加えて、いくつかの例では、決定された情報は、プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値と、プログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値との間の差分を示すデルタＰＯＣ値を含む。いくつかの例では、決定された情報は、プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値のＬＳＢと、プログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値のＬＳＢとの間の差分を示す最下位ビット（ＬＳＢ）のデルタを含む。いくつかの例では、決定された情報は、プログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値を含む。

[0083]本明細書に記載された技法のいくつかの実装形態によれば、情報を決定するために、ビデオエンコーダ２０および／またはビデオデコーダ３０は、符号化ビットストリームに含まれる補足エンハンスメント情報（ＳＥＩ）メッセージに少なくとも部分的に基づいて、情報を決定するように構成される場合がある。１つのそのような例では、ＳＥＩメッセージは、プログレッシブ精緻化セグメントの開始境界を示すプログレッシブ精緻化セグメント開始ＳＥＩメッセージを備える。

[0084]本明細書に記載された技法によるいくつかの例では、ビデオエンコーダ２０および／またはビデオデコーダ３０は、符号化ビデオストリーム内で符号化ピクチャがプログレッシブ精緻化セグメントの直前にくると決定するように、さらに構成される場合がある。１つのそのような例では、プログレッシブ精緻化シーケンスの直前にくる符号化ピクチャと比較して、プログレッシブ精緻化シーケンス内の複数のピクチャの各々が品質の精緻化を定義する。

[0085]本開示の技法のいくつかの実装形態によれば、プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかをコーディングするために、ビデオエンコーダ２０および／またはビデオデコーダ３０は、プログレッシブ精緻化セグメント内の最後のピクチャを除いて、プログレッシブ精緻化セグメント内の各ピクチャにプログレッシブ精緻化動作を適用するように構成される場合がある。いくつかの実装形態では、ビデオエンコーダ２０および／またはビデオデコーダ３０は、集積回路、マイクロプロセッサ、ならびに、ビデオエンコーダ２０およびビデオデコーダ３０のうちのそれぞれ１つまたは両方を備える通信デバイスのうちの少なくとも１つを含む場合がある。いくつかの例では、ビデオエンコーダ２０は、符号化ビデオデータを復号するように構成される場合がある。

[0086]図２は、本開示の１つまたは複数の態様により、ビデオデータを符号化するための技法を実装することができるビデオエンコーダ２０の一例を示すブロック図である。ビデオエンコーダ２０は、ビデオスライス内のビデオブロックのイントラコーディングとインターコーディングとを実行することができる。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオにおける空間的冗長性を低減または除去するために、空間的予測に依存する。インターコーディングは、ビデオシーケンスの隣接するフレームまたはピクチャ内のビデオにおける時間的冗長性を低減または除去するために、時間的予測に依存する。イントラモード（Ｉモード（登録商標））は、いくつかの空間ベースのコーディングモードのいずれかを指す場合がある。単方向予測（Ｐモード）または双方向予測（Ｂモード）などのインターモードは、いくつかの時間ベースのコーディングモードのいずれかを指す場合がある。

[0087]図２に示されたように、ビデオエンコーダ２０は、符号化されるべきビデオフレーム内の現在ビデオブロックを受信する。図２の例では、ビデオエンコーダ２０は、予測処理ユニット４０と、参照フレームメモリ６４と、加算器５０と、変換処理ユニット５２と、量子化ユニット５４と、エントロピー符号化ユニット５６とを含む。次に、予測処理ユニット４１は、動き補償ユニット４４と、動き推定ユニット４２と、イントラ予測ユニット４６と、パーティションユニット４８とを含む。ビデオブロック復元のために、ビデオエンコーダ２０はまた、逆量子化ユニット５８と、逆変換ユニット６０と、加算器６２とを含む。ブロック境界をフィルタ処理して復元されたビデオからブロッキネスアーティファクトを除去するために、デブロッキングフィルタ（図２に示されず）が含まれる場合もある。必要な場合、デブロッキングフィルタは、通常、加算器６２の出力をフィルタ処理することになる。デブロッキングフィルタに加えて、（ループ内またはループ後の）追加のフィルタが使用される場合もある。そのようなフィルタは簡潔のために示されていないが、必要な場合、（ループ内フィルタとして）加算器６２の出力をフィルタ処理することができる。

[0088]符号化プロセス中に、ビデオエンコーダ２０は、コーディングされるべきビデオフレームまたはスライスを受信する。フレームまたはスライスは、予測処理ユニット４１によって複数のビデオブロックに分割される場合がある。動き推定ユニット４２および動き補償ユニット４４は、時間予測を実現するために、１つまたは複数の参照フレーム内の１つまたは複数のブロックに対して、受信されたビデオブロックのインター予測コーディングを実行する。イントラ予測ユニット４６は、代替として、空間予測を実現するために、コーディングされるべきブロックと同じフレームまたはスライス内の１つまたは複数の隣接ブロックに対して、受信されたビデオブロックのイントラ予測コーディングを実行することができる。ビデオエンコーダ２０は、たとえば、ビデオデータのブロックごとに適切なコーディングモードを選択するために、複数のコーディングパスを実行することができる。

[0089]その上、パーティションユニット４８は、以前のコーディングパスにおける以前の区分化方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分化することができる。たとえば、パーティションユニット４８は、最初にフレームまたはスライスをＬＣＵに区分化し、レートひずみ分析（たとえば、レートひずみ最適化）に基づいてＬＣＵの各々をサブＣＵに区分化することができる。予測処理ユニット４０は、ＬＣＵをサブＣＵに区分化することを示す４分木データ構造をさらに生成することができる。４分木のリーフノードＣＵは、１つまたは複数のＰＵと１つまたは複数のＴＵとを含む場合がある。

[0090]予測処理ユニット４０は、たとえば、誤差結果に基づいてコーディングモード、すなわち、イントラまたはインターのうちの１つを選択することができ、残差ブロックデータを生成するために、得られたイントラコード化ブロックまたはインターコード化ブロックを加算器５０に供給し、参照フレームとして使用するための符号化ブロックを復元するために、得られたイントラコード化ブロックまたはインターコード化ブロックを加算器６２に供給する。予測処理ユニット４０はまた、動きベクトル、イントラモードインジケータ、パーティション情報、および他のそのようなシンタックス情報などのシンタックス要素を、エントロピー符号化ユニット５６に供給する。予測処理ユニット４０は、レートひずみ分析を使用して、１つまたは複数のインターモードを選択することができる。

[0091]動き推定ユニット４２および動き補償ユニット４４は、高度に統合される場合があるが、概念的な目的のために別々に示してある。動き推定ユニット４２によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、現在フレーム（または他のコード化ユニット）内でコーディングされている現在ブロックに対する参照フレーム（または他のコード化ユニット）内の予測ブロックに対する、現在ビデオフレームまたはピクチャ内のビデオブロックのＰＵの変位を示すことができる。予測ブロックは、絶対値差分和（ＳＡＤ）、２乗差分和（ＳＳＤ）、または他の差分メトリックによって決定され得るピクセル差分に関して、コーディングされるべきブロックにぴったり一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ２０は、参照フレームメモリ６４に記憶された参照ピクチャのサブ整数ピクセル位置についての値を計算することができる。たとえば、ビデオエンコーダ２０は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置、または他の分数ピクセル位置の値を補間することができる。したがって、動き推定ユニット４２は、フルピクセル位置および分数ピクセル位置に対する動き探索を実行し、分数ピクセル精度で動きベクトルを出力することができる。

[0092]動き推定ユニット４２は、ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライス内のビデオブロックのＰＵ用の動きベクトルを計算する。参照ピクチャは、第１の参照ピクチャリスト（リスト０）または第２の参照ピクチャリスト（リスト１）から選択される場合があり、それらの参照ピクチャリストの各々は、参照ピクチャメモリ６４に記憶された１つまたは複数の参照ピクチャを識別する。動き推定ユニット４２は、計算された動きベクトルをエントロピー符号化ユニット５６および動き補償ユニット４４に送る。

[0093]動き補償ユニット４４によって実行される動き補償は、動き推定ユニット４２によって決定された動きベクトルに基づいて、予測ブロックをフェッチまたは生成することに関与する場合がある。同じく、いくつかの例では、動き推定ユニット４２および動き補償ユニット４４は、機能的に統合される場合がある。現在ビデオブロックのＰＵ用の動きベクトルを受信すると、動き補償ユニット４４は、動きベクトルが参照ピクチャリストのうちの１つの中で指す予測ブロックの位置を特定することができる。加算器５０は、以下で説明されるように、コーディングされている現在ビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。一般に、動き推定ユニット４２は、ルーマコーディングブロックに対して動き推定を実行し、動き補償ユニット４４は、クロマコーディングブロックとルーマコーディングブロックの両方のための、ルーマコーディングブロックに基づいて計算された動きベクトルを使用する。予測処理ユニット４０はまた、ビデオスライスのビデオブロックを復号する際に、ビデオデコーダ３０が使用するための、ビデオブロックおよびビデオスライスに関連付けられたシンタックス要素を生成することができる。

[0094]イントラ予測ユニット４６は、上述されたように、動き推定ユニット４２および動き補償ユニット４４によって実行されるインター予測の代替として、現在ブロックをイントラ予測することができる。特に、イントラ予測ユニット４６は、現在ブロックを符号化するために使用するイントラ予測モードを決定することができる。いくつかの例では、イントラ予測ユニット４６は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在ブロックを符号化することができ、イントラ予測ユニット４６（または、いくつかの例では、予測処理ユニット４０）は、テストされたモードから使用するのに適切なイントラ予測モードを選択することができる。

[0095]たとえば、イントラ予測ユニット４６は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択することができる。レートひずみ分析は、一般に、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ（または誤差）の量、ならびに符号化ブロックを生成するために使用されるビットレート（すなわち、ビット数）を決定する。イントラ予測ユニット４６は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを決定するために、様々な符号化ブロックについてのひずみおよびレートから比率を計算することができる。

[0096]ブロックのためのイントラ予測モードを選択した後に、イントラ予測ユニット４６は、ブロックのための選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット５６に供給することができる。エントロピー符号化ユニット５６は、選択されたイントラ予測モードを示す情報を符号化することができる。ビデオエンコーダ２０は、送信されるビットストリームに、（コードワードマッピングテーブルとも呼ばれる）複数のイントラ予測モードインデックステーブルおよび複数の修正されたイントラ予測モードインデックステーブルと、様々なブロック用の符号化コンテキストの定義と、コンテキストの各々に対して使用する、最確イントラ予測モード、イントラ予測モードインデックステーブル、および修正されたイントラ予測モードインデックステーブルの指示とを含む場合がある、構成データを含めることができる。

[0097]ビデオエンコーダ２０は、コーディングされている元のビデオブロックから、モード選択ユニット４０からの予測データを減算することによって、残差ビデオブロックを形成する。加算器５０は、この減算演算を実行する１つまたは複数の構成要素を表す。変換処理ユニット５２は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換などの変換を残差ブロックに適用し、残差変換係数値を含むビデオブロックを生成する。変換処理ユニット５２は、ＤＣＴと概念的に同様である他の変換を実行することができる。ウェーブレット変換、整数変換、サブバンド変換、または他のタイプの変換も使用され得る。いずれの場合も、変換処理ユニット５２は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、残差情報をピクセル値領域から周波数領域などの変換領域に変換することができる。変換処理ユニット５２は、得られた変換係数を量子化ユニット５４に送ることができる。量子化ユニット５４は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連付けられたビット深度を低減することができる。量子化の程度は、量子化パラメータを調整することによって修正され得る。いくつかの例では、量子化ユニット５４は、次いで、量子化変換係数を含む行列の走査を実行することができる。代替として、エントロピー符号化ユニット５６が走査を実行する場合がある。

[0098]量子化に続いて、エントロピー符号化ユニット５６は、量子化変換係数をエントロピーコーディングする。たとえば、エントロピー符号化ユニット５６は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分化エントロピー（ＰＩＰＥ）コーディング、または別のエントロピーコーディング技法を実行することができる。コンテキストベースエントロピーコーディングの場合、コンテキストは隣接ブロックに基づく場合がある。エントロピー符号化ユニット５６によるエントロピーコーディングに続いて、符号化ビットストリームは、別のデバイス（たとえば、ビデオデコーダ３０）に送信されるか、または後で送信するかもしくは取り出すために保管される場合がある。

[0099]逆量子化ユニット５８および逆変換ユニット６０は、たとえば、参照ブロックとして後で使用するための、ピクセル領域内の残差ブロックを復元するために、それぞれ、逆量子化および逆変換を適用する。動き補償ユニット４４は、残差ブロックを参照フレームメモリ６４のフレームのうちの１つの予測ブロックに加算することによって、参照ブロックを計算することができる。動き補償ユニット４４はまた、動き推定で使用するためのサブ整数ピクセル値を計算するために、復元された残差ブロックに１つまたは複数の補間フィルタを適用することができる。加算器６２は、参照フレームメモリ６４に記憶するための復元されたビデオブロックを生成するために、動き補償ユニット４４によって生成された動き補償予測ブロックに復元された残差ブロックを加算する。復元されたビデオブロックは、後続のビデオフレーム内のブロックをインターコーディングするために、動き推定ユニット４２および動き補償ユニット４４によって参照ブロックとして使用される場合がある。

[0100]ビデオエンコーダ２０の様々な構成要素は、ビデオビットストリームの時間スケーラビリティをサポートしながら、プログレッシブ精緻化を使用してビデオデータを符号化するために、本開示の１つまたは複数の技法を実装するように構成される場合がある。たとえば、ビデオエンコーダ２０は、より少ない符号化ピクチャを含めるようにセグメントが時間的にスケーリングされたかどうかにかかわらず、受信デバイス（たとえば、ビデオデコーダまたはその構成要素）がプログレッシブ精緻化セグメントの開始境界と終了境界とを決定することを可能にする補足エンハンスメント情報（ＳＥＩ）メッセージなどの、ＳＥＩメッセージを生成しシグナリングするために、本技法のうちの１つまたは複数を実装することができる。一例では、予測処理ユニット４０は、本開示の１つまたは複数の態様により、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成するように構成される場合がある。

[0101]ビデオエンコーダ２０は、ＨＥＶＣＷＤ９、ＡＶＣ、または他のビデオコーディング規格に従って、符号化ビデオビットストリームにメタデータを含めるように構成される場合がある。様々な例では、ビデオエンコーダ２０は、シグナリングされた符号化ビデオビットストリームを復号するために、デコーダによって必要とされないメタデータを含める場合がある。いくつかの例として、ビデオエンコーダ２０は、ビデオデコーダがピクチャの出力タイミングを決定し、１つまたは複数のピクチャに関連するディスプレイ情報を決定し、損失情報を検出し、検出された損失を隠匿および／または修正することを可能にするメタデータをシグナリングすることができる。

[0102]加えて、ビデオエンコーダ２０は、符号化ビデオビットストリーム内でシグナリングされた特定のアクセスユニット（ＡＵ）内の任意の数のＳＥＩネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを生成することができる。次に、ビデオエンコーダ２０は、特定のＳＥＩＮＡＬユニットに任意の数のＳＥＩメッセージを含めることができる。上記の表１は、ＨＥＶＣＷＤ９に従って、ビデオエンコーダ２０が生成することができる様々なＳＥＩメッセージを列挙し、列挙されたＳＥＩメッセージの対応する使用法／目的を列挙する。

[0103]ビデオエンコーダ２０は、符号化ビデオビットストリーム内のプログレッシブ精緻化セグメントを生成し、シグナリングするように、構成される場合があるか、または場合によっては動作可能であり得る。図１に関して記載されたように、プログレッシブ精緻化セグメントは、ＨＥＶＣＷＤ９に従って、復号順序で一連の符号化ピクチャを含む場合がある。いくつかの例では、プログレッシブ精緻化セグメント内の一連の符号化ピクチャは、出力順序に従って配列される場合もある。特に、プログレッシブ精緻化セグメントの各符号化ピクチャは、復号順序でプログレッシブ精緻化セグメントの直前にくる符号化ピクチャと比較して、増分し累積する品質の精緻化を表すことができる。

[0104]ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの開始境界を示すために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージをシグナリングすることができる。上記のシンタックス表１に示されたように、ビデオエンコーダ２０は、ＨＥＶＣＷＤ９に従って、プログレッシブ精緻化セグメント開始ＳＥＩメッセージに、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素とｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素とを含めることができる。ＨＥＶＣＷＤ９に従って、ビデオエンコーダ２０は、１つまたは複数の条件が満足されるまで、プログレッシブ精緻化セグメントが続く（たとえば、符号化ビットストリーム内の各々の次の符号化ピクチャが先行する符号化ピクチャよりも単独で品質の精緻化である）と決定することができる。たとえば、ビデオエンコーダ２０は、以下の条件のうちの１つが満足されるまで、プログレッシブ精緻化セグメントが続くと決定することができる。

− ビデオエンコーダ２０が新しいコード化ビデオシーケンスの開始を決定する。

− ビデオエンコーダ２０が符号化ビデオビットストリームの終了を決定する。

− ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の値がゼロよりも大きく、復号順序で次のスライスの（「ｐｉｃ＿ｏｒｄｅｒ＿ｃｎｔ＿ｌｓｂ」によって示された）ＰＯＣ値の最下位ビットが以下の式の出力に等しいと、ビデオエンコーダ２０が決定する：（ｃｕｒｒＰｉｃＯｒｄｅｒＣｎｔＬｓｂ＋ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１＋１）％ＭａｘＰｉｃＯｒｄｅｒＣｎｔＬｓｂ、ここで、ｃｕｒｒＰｉｃＯｒｄｅｒＣｎｔＬｓｂはＳＥＩメッセージを含んでいるアクセスユニット内のピクチャのｐｉｃ＿ｏｒｄｅｒ＿ｃｎｔ＿ｌｓｂの値である。「％」演算子は、整数除算演算の余りの値をもたらすモジュロ演算を示す。

− ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１の値がゼロに等しく、現在プログレッシブ精緻化セグメント開始ＳＥＩメッセージ内のｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄ値と同じｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄ値を有するプログレッシブ精緻化セグメント終了ＳＥＩメッセージが符号化されたと、ビデオエンコーダ２０が決定する。

[0105]加えて、ビデオエンコーダ２０は、プログレッシブ精緻化セグメント開始ＳＥＩメッセージと、ゼロに等しい値を有する「ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ」シンタックス要素とを含めるようにＳＥＩＮＡＬユニットを生成することによって、現在ＡＵにおいてＳＥＩＮＡＬユニットが復号順序で最初のビデオコーディングレイヤ（ＶＣＬ）ＮＡＬユニットに先行することをデコーダに示すことができる。ビデオエンコーダ２０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値を、０で始まり、（２＾３２−２）で終わり、両端値を含む数値範囲内に設定することができる。たとえば、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントに関連する特定のプログレッシブ精緻化動作を識別するために、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素を、両端値を含む０から２５５および両端値を含む５１２から（２＾３１−１）の範囲内の値に設定することができる。言い換えれば、上述された範囲内でｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素に割り当てられた任意の値は、ＨＥＶＣＷＤ９でサポートされる特定のプログレッシブ精緻化動作に関連付けられる場合がある。

[0106]一方、両端値を含む２５６から５１１および両端値を含む２＾３１から（２＾３２−２）の範囲内に入るｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値は、ＩＴＵ−Ｔおよび／またはＩＳＯ／ＩＥＣが将来使用するために確保される。より詳細には、ビデオエンコーダ２０が上述された確保された範囲のうちの１つの中の値にｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素を設定した場合、ビデオデコーダなどの、ビットストリームを受信するデバイスは、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素を無視することができる。特に、このシンタックス要素を無視するために、ビデオデコーダは、受信された符号化ビデオビットストリームからｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素を除去し、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素を破棄することができる。

[0107]記載されたように、ビデオエンコーダ２０および／またはその構成要素は、ＨＥＶＣＷＤ９などに従って、符号化ビデオビットストリームの時間スケーラビリティをサポートするように構成される場合がある。たとえば、ビデオエンコーダ２０は、復号デバイスまたは中間デバイスなどの受信デバイスがそこからサブビットストリームを抽出することができる、完全な符号化ビデオビットストリームを生成することができる。たとえば、ストリーミングサーバまたはメディアを意識したネットワーク要素（「ＭＡＮＥ」）などの中間デバイスは、完全な符号化ビデオビットストリームに含まれる符号化ピクチャの完全なセットから、符号化ピクチャの時間サブセットを抽出することができる。いくつかの例では、時間サブセットは、完全な符号化ビデオビットストリームに含まれる符号化ピクチャの完全なセットの真のサブセットを表すことができる。これらの例によれば、完全な符号化ビデオビットストリームは、時間サブセットのあらゆる符号化ピクチャと、その時間サブセットに含まれない少なくとも１つの追加の符号化ピクチャとを含む場合がある。

[0108]時間スケーラビリティによる様々なピクチャレートをサポートするために、中間デバイスは、完全な符号化ビデオビットストリームに含まれる符号化ピクチャの完全なセットから、様々なピクチャカウントの時間サブセットを抽出するように構成される場合がある。（たとえば、様々なピクチャレートをサポートするために）中間デバイスによって抽出された各々の異なる時間サブセットは、単独で復号可能な時間サブセットまたはサブビットストリームを表すことができる。言い換えれば、完全な符号化ビデオビットストリームから抽出された時間的にスケーリングされたサブビットストリームを受信するビデオデコーダは、完全な符号化ビデオビットストリームに含まれるが、サブビットストリームから除外される情報などの、いかなる追加のデータもなしに、符号化ピクチャの時間サブセットを復号することができる。

[0109]ＨＥＶＣＷＤ９に従って、ビデオエンコーダ２０によって生成された完全な符号化ビデオビットストリームは、いくつかの時間サブレイヤを含む場合がある。加えて、ビデオエンコーダ２０によって生成された各ＮＡＬユニットは、対応する「ＴｅｍｐｏｒａｌＩｄ」値によって示された特定のサブレイヤに属する場合がある。たとえば、ビデオエンコーダ２０は、ＮＡＬユニットのＴｅｍｐｏｒａｌＩｄの値を、対応する「ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１」シンタックス要素の値マイナス１に等しく設定することができる。加えて、ビデオエンコーダ２０は、単一のピクチャのすべてのＶＣＬＮＡＬユニットが単一のサブレイヤ（すなわち、同じサブレイヤ）に属すると決定することができる。言い換えれば、ビデオエンコーダ２０は、符号化ピクチャ自体が符号化ピクチャに関連付けられたＮＡＬユニットに対応する特定のサブレイヤに属するように、ピクチャを符号化することができる。

[0110]たとえば、ＨＥＶＣＷＤ９に従って、ビデオエンコーダ２０は、ビットストリームの下位サブレイヤの復号プロセスがビットストリームの上位サブレイヤ内のデータに依存しないように、符号化ビデオビットストリームを生成することができる。加えて、中間デバイスは、完全なビットストリームから、特定の値よりも高いＴｅｍｐｏｒａｌＩｄ値に関連付けられたすべてのＮＡＬユニットを除去することによって、ＨＥＶＣＷＤ９に準拠する完全なビットストリームからサブビットストリームを生成することができる。次に、このようにして生成されたサブビットストリームは、それ自体、ＨＥＶＣＷＤ９に準拠するビットストリームを表すことができる。ビデオエンコーダ２０および／またはその１つもしくは複数の構成要素は、ＨＥＶＣＷＤ９に対するビットストリーム準拠（たとえば、バッファ制限）についてのすべての条件が、完全な符号化ビデオビットストリームおよび所与のそのサブレイヤについて満たされることを保証することができる。

[0111]記載されたように、完全な符号化ビデオビットストリームを時間的にスケーリングする際に、中間デバイスは、完全な符号化ビデオビットストリームから符号化ピクチャの時間サブセットを抽出することができる。たとえば、時間サブセットは、完全な符号化ビデオビットストリーム内でシグナリングされた符号化ピクチャの真のサブセットであり得るし、したがって、中間デバイスは、サブビットストリームを生成するために、完全な符号化ビットストリームから１つまたは複数の符号化ピクチャを除去することができる。例では、中間デバイスは、プログレッシブ精緻化セグメントに含まれる１つまたは複数の符号化ピクチャを除去することができる。しかしながら、これらの例では、中間デバイスは、時間的にスケーリングされたプログレッシブ精緻化セグメントに含まれる符号化ピクチャの数における変更（すなわち、削減）を反映するように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージ内でシグナリングされたデータを更新するように構成されていない場合がある。言い換えれば、中間デバイスは、潜在的に、ビデオデコーダなどの受信デバイスに、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の正しくない値をシグナリングする可能性がある。次に、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の正しくない値を通信することによって、中間デバイスは、時間的にスケーリングされたプログレッシブ精緻化セグメントの終端の後のピクチャを復号するために、プログレッシブ精緻化動作を適用することをビデオデコーダに行わせる可能性がある。

[0112]符号化ビデオビットストリーム内でプログレッシブ精緻化セグメントの終端の後に位置するピクチャの誤った復号を軽減または除去するために、ビデオエンコーダ２０は、本開示の１つまたは複数の技法を実装することができる。本技法のいくつかの実装形態によれば、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値をビデオデコーダが決定することを可能にする情報を含めるように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成することができる。ＰＯＣ値は、符号化ビデオビットストリーム内でシグナリングされる特定の符号化ピクチャに関連付けられた固定値を表すことができ、したがって、時間スケーリングにかかわらず、特定の符号化ピクチャを識別することができる。

[0113]たとえば、プログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値を導出することによって、符号化ビデオビットストリームを受信するビデオデコーダは、最後の符号化ピクチャを正確に識別することができる。より詳細には、ビデオデコーダは、中間デバイスが時間的にスケーリングされたプログレッシブ精緻化セグメントを有するかどうかにかかわらず、プログレッシブ精緻化セグメントの最後の符号化ピクチャを識別することができる。中間デバイスがプログレッシブ精緻化セグメントを時間的にスケーリングする例では、中間デバイスがプログレッシブ精緻化セグメントを時間的にスケーリングする範囲にかかわらず、ビデオデコーダは、プログレッシブ精緻化セグメントの最後のピクチャを正確に識別することができる。言い換えれば、中間デバイスが時間スケーリングを使用して生成するピクチャレートにかかわらず、ビデオデコーダは、プログレッシブ精緻化セグメントの最後の符号化ピクチャ（すなわち、終了境界）を識別することができる。

[0114]本明細書に記載された技法の様々な実装形態によれば、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャに関連付けられたＰＯＣ値を決定するためにデコーダが使用することができる情報を含めるように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成することができる。一実装形態では、ビデオエンコーダ２０は、「デルタＰＯＣ」値を示すデータを含めるように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成することができる。より詳細には、ビデオエンコーダ２０は、デルタＰＯＣ値がベースピクチャのＰＯＣ値とプログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値との間の差分を示すように、デルタＰＯＣ値を生成することができる。

[0115]ビデオエンコーダ２０によって生成された符号化ビデオビットストリームを受信するビデオデコーダは、対応するプログレッシブ精緻化セグメントの開始境界（たとえば、最初の符号化ピクチャ）を検出するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを使用することができる。加えて、ビデオデコーダは、ベースピクチャ（たとえば、復号順序で開始境界の直前にくる符号化ピクチャ）のＰＯＣ値にデルタＰＯＣ値を加えることによって、プログレッシブ精緻化セグメントの終了境界（たとえば、最後の符号化ピクチャ）を決定することができる。たとえば、ベースピクチャのＰＯＣ値にデルタＰＯＣ値を加えることによって、ビデオデコーダは、プログレッシブ精緻化セグメントの終了境界のＰＯＣ値を導出することができる。

[0116]記載されたように、特定の符号化ピクチャのＰＯＣ値は、符号化ピクチャに関連付けられた固定値であり得るし、復号順序における符号化ピクチャの位置を示すことができる。プログレッシブ精緻化セグメントの終了境界のＰＯＣ値をそれから導出するデータをデコーダに供給することによって、ビデオエンコーダ２０は、中間デバイスがプログレッシブ精緻化セグメントを時間的にスケーリングするかどうかにかかわらず、また中間デバイスがプログレッシブ精緻化セグメントを時間的にスケーリングする大きさによって、プログレッシブ精緻化セグメントの終了境界をデコーダが決定することを可能にすることができる。ビデオエンコーダ２０は、上記のシンタックス表３に示された「ｐｉｃ＿ｏｒｄｅｒ＿ｃｎｔ＿ｄｅｌｔａ」シンタックス要素の形態で、デルタＰＯＣをシグナリングすることができる。様々な例では、ビデオエンコーダ２０は、プログレッシブ精緻化セグメント開始ＳＥＩメッセージ内で、またはベースピクチャのそれぞれのスライスに関連付けられた１つもしくは複数のスライスヘッダ内で、ｐｉｃ＿ｏｒｄｅｒ＿ｃｎｔ＿ｄｅｌｔａシンタックス要素をシグナリングすることができる。このようにして、ビデオエンコーダ２０は、符号化ビデオビットストリームの時間スケーラビリティをサポートしながら、対応するプログレッシブ精緻化動作を使用してプログレッシブ精緻化シーケンスをデコーダが復号することを可能にするために、本開示の１つまたは複数の技法を実装することができる。

[0117]プログレッシブ精緻化セグメントの終了境界のＰＯＣ値に関連付けられたデータを含めるように、ビデオエンコーダ２０がプログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成するいくつかの実装形態によれば、ビデオエンコーダ２０は、プログレッシブ精緻化セグメント開始ＳＥＩメッセージ内に最下位ビット（ＬＳＢ）のデルタを含めることができる。これらの実装形態では、ビデオエンコーダ２０は、ベースピクチャのＰＯＣ値のＬＳＢ値とプログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値のＬＳＢ値との間の差分を示すように、ＬＳＢのデルタを生成することができる。

[0118]次に、ビデオエンコーダ２０は、ベースピクチャのＰＯＣ値のＬＳＢにＬＳＢのデルタを加えることによって、符号化ビデオビットストリームを受信するデコーダが、プログレッシブ精緻化セグメントの終了境界のＰＯＣ値を導出することを可能にすることができる。たとえば、ビデオエンコーダ２０は、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の代わりに、ＬＳＢのデルタを示すシンタックス要素を含めるように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成することができる。いくつかの実装形態によれば、ビデオエンコーダ２０は、ベースピクチャのそれぞれのスライスに関連付けられた１つまたは複数のスライスヘッダの一部として、そのシンタックス要素をシグナリングすることができる。

[0119]ＬＳＢのデルタを示すシンタックス要素を含めることによって、エントロピー符号化ユニット５６は、中間デバイスがプログレッシブ精緻化セグメントを時間的にスケーリングするかどうかにかかわらず、また中間デバイスがプログレッシブ精緻化セグメントを時間的にスケーリングする大きさによって、プログレッシブ精緻化セグメントの終了境界をデコーダが決定することを可能にすることができる。たとえば、ＬＳＢのデルタをシグナリングすることによって、ビデオエンコーダ２０は、デコーダがプログレッシブ精緻化セグメントの終了境界のＰＯＣ値を導出し、それにより、終了境界に関連付けられた固定値を使用して終了境界を識別することを可能にすることができる。このようにして、ビデオエンコーダ２０は、符号化ビデオビットストリームの時間スケーラビリティをサポートしながら、対応するプログレッシブ精緻化動作を使用してプログレッシブ精緻化シーケンスをデコーダが復号することを可能にするために、本開示の１つまたは複数の技法を実装することができる。

[0120]本明細書に記載された技法の他の実装形態によれば、ビデオエンコーダ２０は、１）ベースピクチャのＴｅｍｐｏｒａｌＩｄ値以下のＴｅｍｐｏｒａｌＩｄ値に関連付けられた、２）ベースピクチャのプログレッシブな品質の精緻化を表す、連続する符号化ピクチャの数を示すデータを含めるように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成することができる。いくつかの例では、減少するＴｅｍｐｏｒａｌＩｄ値は、復号順序に従った符号化ビデオビットストリーム内の前進を示すことができる。たとえば、プログレッシブ精緻化セグメントの最初の符号化ピクチャは、ベースピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有することができる。次に、プログレッシブ精緻化セグメントの２番目の符号化ピクチャは、プログレッシブ精緻化セグメントの最初の符号化ピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有することができる、以下同様。

[0121]ベースピクチャは、現在アクセスユニットに含まれる符号化ピクチャであり得るし、ベースピクチャは、復号順序でプログレッシブ精緻化セグメントの最初の符号化ピクチャの直前にくる場合がある。いくつかの例では、ベースピクチャは、出力順序でプログレッシブ精緻化セグメントの最初の符号化ピクチャの直前にくる場合もある。いくつかのそのような例では、プログレッシブ精緻化セグメントは、復号順序と出力順序の両方で連続する一連の符号化ピクチャを含む場合がある。

[0122]本明細書に記載された技法のこれらの実装形態によれば、ビデオエンコーダ２０は、ベースピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有し、ならびにベースピクチャのプログレッシブな品質の精緻化を表す、連続する符号化ピクチャの数を示すデータを含めるように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成することができる。たとえば、情報は、プログレッシブ精緻化セグメントを作り上げるシーケンス内の符号化ピクチャの数を示す場合がある。これらの実装形態では、中間デバイスは、上記に列挙された条件を満足する、連続する符号化ピクチャの数を決定することができる。たとえば、中間デバイスは、完全な符号化ビデオビットストリームから抽出された符号化ピクチャの各時間サブセットに関する条件を満足する、連続する符号化ピクチャの数を決定することができる。

[0123]上記の条件を満足する、連続する符号化ピクチャの数を決定することによって、中間デバイスがプログレッシブ精緻化セグメントを時間的にスケーリングするシナリオにおいても、中間デバイスは、プログレッシブ精緻化セグメントから利用可能な符号化ピクチャの数をより正確に決定することができる。次に、中間デバイスは、ベースピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有し、ならびにベースピクチャのプログレッシブな品質の精緻化を表す、連続する符号化ピクチャの決定された数を通信することができる。様々な例では、ビデオエンコーダ２０は、ベースピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有し、ならびにベースピクチャのプログレッシブな品質の精緻化を表す、連続する符号化ピクチャの決定された数を示すシンタックス要素を含めるように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成することができる。たとえば、ビデオエンコーダ２０は、上記のシンタックス表１に示されたｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の代わりに、決定された数を示すシンタックス要素を含めるように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成することができる。いくつかの例では、ビデオエンコーダ２０は、ベースピクチャのそれぞれのスライスに関連付けられた１つまたは複数のスライスヘッダの一部として、決定された数を示すシンタックス要素をシグナリングすることができる。

[0124]ビデオエンコーダ２０は、ベースピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有し、ベースピクチャのプログレッシブな品質の精緻化を表す、連続する符号化ピクチャの数をシグナリングすることによって、プログレッシブ精緻化セグメントの正確な長さをビデオデコーダに供給することができる。一例として、プログレッシブ精緻化セグメント開始ＳＥＩメッセージの一部として上述された情報をシグナリングすることによって、ビデオエンコーダ２０は、中間デバイスがプログレッシブ精緻化セグメントを時間的にスケーリングするかどうかにかかわらず、プログレッシブ精緻化セグメントの長さを受信デコーダに供給することができる。次に、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを受信するデコーダは、デコーダがプログレッシブ精緻化セグメントを時間的にスケーリングするかどうかにかかわらず、またデコーダがプログレッシブ精緻化セグメントを時間的にスケーリングする大きさによって、プログレッシブ精緻化セグメントの長さを決定するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージに含まれるシンタックス要素を利用することができる。このようにして、ビデオエンコーダ２０は、１）ベースピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有し、２）ベースピクチャのプログレッシブな品質の精緻化を表す、連続する符号化ピクチャの数をシグナリングし、それにより、ビデオ復号デバイスが時間的にスケーラブルなビデオビットストリームをサポートしながら、プログレッシブ精緻化セグメントを復号することを可能にするために、本開示の１つまたは複数の技法を実装することができる。

[0125]図２に関して記載されたように、ビデオエンコーダ２０および／またはその構成要素は、ビデオデータを符号化する方法を実施することができ、その方法は、プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内の複数のピクチャのうちの少なくともいくつかのピクチャを符号化することと、符号化ビットストリーム内のプログレッシブ精緻化セグメントの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を生成することとを含む。ビデオエンコーダ２０に関して上述された方法のいくつかの例示的な実装形態では、生成された情報は、プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値と、プログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値との間の差分を示すデルタＰＯＣ値を含む。ビデオエンコーダ２０に関して上述された方法のいくつかの例示的な実装形態によれば、生成された情報は、プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値のＬＳＢと、プログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値のＬＳＢとの間の差分を示す最下位ビット（ＬＳＢ）のデルタを含む。ビデオエンコーダ２０に関して上述された方法の一例では、生成された情報は、プログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値を含む。

[0126]ビデオエンコーダ２０に関して上述された方法のいくつかの実装形態によれば、情報を生成することは、符号化ビットストリーム内でシグナリングされるべき補足エンハンスメント情報（ＳＥＩ）メッセージに情報を含めることを備える。１つのそのような実装形態では、ＳＥＩメッセージは、プログレッシブ精緻化セグメントの開始境界を示すプログレッシブ精緻化セグメント開始ＳＥＩメッセージを備える。ビデオエンコーダ２０に関して上述された方法のいくつかの実装形態によれば、方法は、符号化ピクチャが符号化ビデオストリーム内でプログレッシブ精緻化セグメントの直前にくると決定することをさらに含むことができる。１つのそのような実装形態では、プログレッシブ精緻化シーケンスの直前にくる符号化ピクチャと比較して、プログレッシブ精緻化シーケンス内の各ピクチャが品質の精緻化を定義する。

[0127]ビデオエンコーダ２０に関して上述された方法のいくつかの例では、方法は、プログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャを検出することと、プログレッシブ精緻化動作に従った符号化を停止することとをさらに備えることができる。ビデオエンコーダ２０に関して上述された方法のいくつかの実装形態によれば、プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかを符号化することは、プログレッシブ精緻化セグメント内の最後のピクチャを除いて、プログレッシブ精緻化セグメント内の各ピクチャにプログレッシブ精緻化動作を適用することを備える。

[0128]いくつかの例では、ビデオエンコーダ２０は、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどの、ビデオデータをコーディングするためのデバイスに含まれる場合がある。これらまたは他の例では、ビデオデータをコーディングするためのそのようなデバイスは、集積回路、マイクロプロセッサ、および、ビデオエンコーダ２０を含む通信デバイスのうちの１つまたは複数を含む場合がある。いくつかの例では、ビデオエンコーダ２０は、符号化ビデオデータをエントロピー復号することなどを介して、符号化ビデオデータを復号するように構成される場合もある。

[0129]図３は、本開示の１つまたは複数の態様により、ビデオデータを復号するための技法を実装することができるビデオデコーダ３０の一例を示すブロック図である。図３の例では、ビデオデコーダ３０は、エントロピー復号ユニット７０と、動き補償ユニット７２と、イントラ予測ユニット７４と、逆量子化ユニット７６と、逆変換ユニット７８と、加算器８０と、参照ピクチャメモリ８２とを含む。図２の例では、ビデオデコーダ３０は予測ユニット７１を含み、次に、予測ユニット７１は、動き補償ユニット７２とイントラ予測ユニット７４とを含む。ビデオデコーダ３０は、いくつかの例では、ビデオエンコーダ２０（図２）に関して記載された符号化パスとは全体的に反転した復号パスを実行することができる。動き補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルに基づいて予測データを生成することができ、イントラ予測ユニット７４は、エントロピー復号ユニット７０から受信されたイントラ予測モードインジケータに基づいて予測データを生成することができる。

[0130]図３に示された実装形態では、ビデオデコーダ３０は、ネットワーク要素６８に結合される。様々な例では、ネットワーク要素６８は、メディアを意識したネットワーク要素（すなわち「ＭＡＮＥ」）、ストリーミングサーバ、またはネットワークヘッドエンドデバイスなどの、様々なデバイスを含む場合があるか、それらであり得るか、またはそれらの一部であり得る。たとえば、ネットワーク要素６８は、ビデオエンコーダ２０によってシグナリングされた符号化ビデオビットストリームを受信し、符号化ビデオビットストリームを時間的にスケーリングするように構成される場合がある。この例では、ネットワーク要素６８は、時間的にスケーリングされたビットストリームをビデオデコーダ３０に中継することができる。図３の例ではビデオデコーダ３０の外部に示されているが、様々な例では、ネットワーク要素６８は、
[0131]一例として、ネットワーク要素６８は、受信された符号化ビデオビットストリームに含まれる符号化ピクチャの完全なセットから符号化ピクチャの時間サブセットを抽出することができる。ネットワーク要素６８によって受信される符号化ビデオビットストリームは、本明細書では「完全な符号化ビデオビットストリーム」と呼ばれる場合がある。加えて、ネットワーク要素６８によって抽出された時間サブセットは、完全な符号化ビデオビットストリームに含まれる符号化ピクチャの完全なセットの真のサブセットを表すことができる。言い換えれば、ネットワーク要素６８によって受信された完全な符号化ビデオビットストリームは、時間サブセットのあらゆる符号化ピクチャと、その時間サブセットに含まれない少なくとも１つの追加の符号化ピクチャとを含む場合がある。

[0132]時間スケーラビリティによる様々なピクチャレートをサポートするために、ネットワーク要素６８は、完全な符号化ビデオビットストリームに含まれる符号化ピクチャの完全なセットから、様々なピクチャカウントの時間サブセットを抽出するように構成される場合がある。（たとえば、様々なピクチャレートをサポートするために）ネットワーク要素６８によって抽出された各々の異なる時間サブセットは、単独で復号可能な時間サブセットまたはサブビットストリームを表すことができる。言い換えれば、ネットワーク要素６８によって抽出された時間的にスケーリングされたサブビットストリームを受信するビデオデコーダ３０などのデバイスは、完全な符号化ビデオビットストリームに含まれるが、サブビットストリームから除外される情報などの、いかなる追加のデータもなしに、符号化ピクチャの時間サブセットを復号することができる。

[0133]ネットワーク要素６８は、ＨＥＶＣＷＤ９に従って、ビデオエンコーダ２０によってシグナリングされた完全な符号化ビデオビットストリームが、いくつかの時間サブレイヤを含むと決定することができる。加えて、ネットワーク要素６８は、ビデオエンコーダ２０によってシグナリングされた各ＮＡＬユニットが、対応する「ＴｅｍｐｏｒａｌＩｄ」値によって示された特定のサブレイヤに属すると決定することができる。たとえば、ネットワーク要素６８は、ＮＡＬユニットのＴｅｍｐｏｒａｌＩｄの値が、対応する「ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１」シンタックス要素の値マイナス１に等しいと決定することができる。加えて、この例では、ネットワーク要素６８は、単一のピクチャのすべてのＶＣＬＮＡＬユニットが単一のサブレイヤ（すなわち、同じサブレイヤ）に属すると決定することができる。言い換えれば、ネットワーク要素６８は、特定の符号化ピクチャ自体が、符号化ピクチャに関連付けられたＮＡＬユニットに対応する特定のサブレイヤに属すると決定することができる。

[0134]たとえば、ＨＥＶＣＷＤ９に従って、ビデオエンコーダ２０は、（たとえば、ネットワーク要素６８によって抽出された）ビットストリームの下位サブレイヤの復号プロセスが、ビットストリームの上位サブレイヤ内のデータに依存しないように、符号化ビデオビットストリームを生成することができる。ネットワーク要素６８は、完全なビットストリームから、特定の値よりも高いＴｅｍｐｏｒａｌＩｄ値に関連付けられたすべてのＮＡＬユニットを除去することによって、ＨＥＶＣＷＤ９に準拠する完全なビットストリームからサブビットストリームを抽出することができる。次に、このようにしてネットワーク要素６８によって抽出されたサブビットストリームは、それ自体、ＨＥＶＣＷＤ９に準拠するビットストリームを表すことができる。ビデオエンコーダ２０および／またはその１つもしくは複数の構成要素は、ＨＥＶＣＷＤ９に対するビットストリーム準拠（たとえば、バッファ制限）についてのすべての条件が、各サブビットストリームについて満たされることを保証することができる。

[0135]記載されたように、完全な符号化ビデオビットストリームを時間的にスケーリングする際に、ネットワーク要素６８は、完全な符号化ビデオビットストリームから符号化ピクチャの時間サブセットを抽出することができる。たとえば、時間サブセットは、完全な符号化ビデオビットストリーム内でシグナリングされた符号化ピクチャの真のサブセットであり得るし、したがって、ネットワーク要素６８は、サブビットストリームを生成するために、完全な符号化ビットストリームから１つまたは複数の符号化ピクチャを除去することができる。例では、ネットワーク要素６８は、プログレッシブ精緻化セグメントに含まれる１つまたは複数の符号化ピクチャを除去することができる。

[0136]しかしながら、これらの例では、ネットワーク要素６８は、時間的にスケーリングされたプログレッシブ精緻化セグメントに含まれる符号化ピクチャの数における変更（すなわち、削減）を反映するように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージ内でシグナリングされたデータを更新するように構成されていない場合がある。言い換えれば、ネットワーク要素６８は、潜在的に、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の正しくない値をビデオデコーダ３０に中継する可能性がある。次に、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の正しくない値を中継することによって、ネットワーク要素６８は、時間的にスケーリングされたプログレッシブ精緻化セグメントの終端の後のピクチャを復号するために、プログレッシブ精緻化動作を適用することをビデオデコーダ３０に行わせる可能性がある。

[0137]復号プロセス中に、ビデオデコーダ３０は、ビデオエンコーダ２０から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ３０のエントロピー復号ユニット７０は、量子化係数、動きベクトル、またはイントラ予測モードインジケータと、他のシンタックス要素とを生成するために、ビットストリームをエントロピー復号する。エントロピー復号ユニット７０は、動きベクトルと他のシンタックス要素とを動き補償ユニット７２に転送する。ビデオデコーダ３０は、ビデオスライスレベルおよび／またはビデオブロックレベルで、シンタックス要素を受信することができる。

[0138]ビデオスライスがイントラコード化（Ｉ）スライスとしてコーディングされるとき、イントラ予測ユニット７４は、シグナリングされたイントラ予測モードと、現在フレームまたはピクチャの以前に復号されたブロックからのデータとに基づいて、現在ビデオスライスのビデオブロック用の予測データを生成することができる。ビデオフレームがインターコード化（すなわち、Ｂ、Ｐ、またはＧＰＢ）スライスとしてコーディングされるとき、動き補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルと他のシンタックス要素とに基づいて、現在ビデオスライスのビデオブロック用の予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの１つの中の参照ピクチャのうちの１つから生成される場合がある。ビデオデコーダ３０は、参照ピクチャメモリ８２に記憶された参照ピクチャに基づいて、デフォルトの構築技法を使用して、参照フレームリスト、すなわち、リスト０とリスト１とを構築することができる。

[0139]動き補償ユニット７２は、動きベクトルと他のシンタックス要素とを解析することによって、現在ビデオスライスのビデオブロックについての予測情報を決定し、復号されている現在ビデオブロック用の予測ブロックを生成するために、予測情報を使用する。たとえば、動き補償ユニット７２は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード（たとえば、イントラ予測またはインター予測）と、インター予測スライスタイプ（たとえば、Ｂスライス、Ｐスライス、またはＧＰＢスライス）と、スライス用の参照ピクチャリストのうちの１つまたは複数についての構築情報と、スライスのインター符号化ビデオブロックごとの動きベクトルと、スライスのインターコード化ビデオブロックごとのインター予測ステータスと、現在ビデオスライス内のビデオブロックを復号するための他の情報とを決定するために、受信されたシンタックス要素のうちのいくつかを使用する。

[0140]動き補償ユニット７２はまた、補間フィルタに基づいて補間を実行することができる。動き補償ユニット７２は、参照ブロックのサブ整数ピクセルについての補間された値を計算するために、ビデオブロックの符号化中にビデオエンコーダ２０によって使用された補間フィルタを使用することができる。この場合、動き補償ユニット７２は、受信されたシンタックス要素からビデオエンコーダ２０によって使用された補間フィルタを決定し、予測ブロックを生成するためにその補間フィルタを使用することができる。

[0141]逆量子化ユニット７６は、ビットストリーム内で供給され、エントロピー復号ユニット７０によって復号された量子化変換係数を逆量子化（inverse quantize）、すなわち逆量子化（de-quantize）する。逆量子化プロセスは、量子化の程度を決定し、同様に、適用されるべき逆量子化の程度を決定するために、ビデオスライス内のビデオブロックごとにビデオデコーダ３０によって計算された量子化パラメータＱＰＹの使用を含む場合がある。

[0142]逆変換ユニット７８は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば、逆ＤＣＴ、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。

[0143]動き補償ユニット７２が、動きベクトルと他のシンタックス要素とに基づいて現在ビデオブロック用の予測ブロックを生成した後、ビデオデコーダ３０は、逆変換ユニット７８からの残差ブロックを動き補償ユニット７２によって生成された対応する予測ブロックと加算することによって、復号ビデオブロックを形成する。加算器８０は、この加算演算を実行する１つまたは複数の構成要素を表す。必要な場合、ブロッキネスアーティファクトを除去するために、復号ブロックをフィルタ処理するデブロッキングフィルタが適用される場合もある。ピクセル遷移を平滑化するために、または場合によってはビデオ品質を改善するために、他のループフィルタが（コーディングループ中またはコーディングループ後のいずれかで）使用される場合もある。所与のフレームまたはピクチャ内の復号ビデオブロックは、次いで、その後の動き補償のために使用される参照ピクチャを記憶する参照ピクチャメモリ８２に記憶される。参照ピクチャメモリ８２はまた、図１のディスプレイデバイス３２などのディスプレイデバイス上での後の提示のために、復号ビデオを記憶する。

[0144]ビデオデコーダ３０およびその様々な構成要素は、時間的にスケーラブルなビデオビットストリームをサポートしながら、プログレッシブ精緻化セグメントを復号するために、本開示の技法を実装することができる。一例として、エントロピー復号ユニット７０は、ビデオデコーダ３０に関して下記に記載される１つまたは複数の機能を実装することができる。記載されたように、ビデオデコーダ３０は、ビデオエンコーダによってシグナリングされた符号化ビデオビットストリームを受信することができる。様々な例では、ビデオデコーダ３０は、時間スケーラビリティに従ってネットワーク要素６８が抽出することができる、完全な符号化ビデオビットストリームまたはサブビットストリームを受信することができる。より詳細には、時間的にスケーリングされたサブビットストリームは、完全な符号化ビデオビットストリームに含まれる符号化ピクチャのセットから抽出された符号化ピクチャのサブセットを含む場合がある。時間スケーラビリティに従ってネットワーク要素６８によって抽出されるピクチャのサブセットは、本明細書では「時間サブセット」と呼ばれる場合がある。いくつかの例では、ネットワーク要素６８によって抽出された時間サブセットは、完全な符号化ビデオビットストリーム内の符号化ピクチャの真のサブセットを表すことができる。言い換えれば、これらの例によれば、完全な符号化ビデオビットストリームは、時間サブセットのあらゆる符号化ピクチャと、その時間サブセットに含まれない少なくとも１つの追加の符号化ピクチャとを含む場合がある。

[0145]加えて、ＨＥＶＣＷＤ９、ＡＶＣ、または他のビデオコーディング規格に従って、ビデオデコーダ３０は、受信された符号化ビデオビットストリームに含まれるメタデータを復号するように、構成される場合があるか、または場合によっては動作可能であり得る。様々な例では、ＨＥＶＣＷＤ９に従って、ビデオデコーダ３０は、符号化ビットストリーム内でシグナリングされた符号化ピクチャを復号するために必要ではないメタデータを復号する可能性がある。様々な例では、ビデオデコーダ３０は、ピクチャ出力タイミング、および１つまたは複数のピクチャに関連する表示情報のうちの１つまたは複数を決定するために、メタデータを復号することができる。これらおよび他の例では、ビデオデコーダ３０は、損失情報を検出し、１つまたは複数の検出された損失を隠匿および／または修正するために、メタデータを復号することができる。

[0146]いくつかの例では、たとえば、ＨＥＶＣＷＤ９に従って、ビデオデコーダ３０は、受信された符号化ビデオビットストリーム内でシグナリングされた特定のアクセスユニット（ＡＵ）内の１つまたは複数の補足エンハンスメント情報（ＳＥＩ）ネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを復号することができる。加えて、ビデオデコーダ３０は、受信された符号化ビデオビットストリーム内でシグナリングされた単一のＳＥＩＮＡＬユニットに含まれる１つまたは複数のＳＥＩメッセージを復号することができる。上記の表１は、ＨＥＶＣＷＤ９に従って、ビデオデコーダ３０が受信し、（たとえば、エントロピー復号ユニット７０を使用して）復号することができる様々なＳＥＩメッセージの例を列挙し、列挙されたＳＥＩメッセージの対応する使用法／目的を列挙する。

[0147]加えて、ビデオデコーダ３０は、受信された符号化ビデオビットストリーム内でシグナリングされたプログレッシブ精緻化セグメントを復号するように、構成される場合があるか、または場合によっては動作可能であり得る。図１に関して記載されたように、プログレッシブ精緻化セグメントは、ＨＥＶＣＷＤ９に従って、復号順序で一連の符号化ピクチャを含む場合がある。いくつかの例では、プログレッシブ精緻化セグメント内の一連の符号化ピクチャは、出力順序に従って配列される場合もある。様々なシナリオでは、プログレッシブ精緻化セグメントの各符号化ピクチャは、ベースピクチャ（たとえば、復号順序で開始境界の直前にくる符号化ピクチャ）よりも品質の精緻化を表すことができる。１つのそのようなシナリオでは、プログレッシブ精緻化セグメントの各符号化ピクチャは、復号順序でプログレッシブ精緻化セグメントの直前にくる符号化ピクチャと比較して、増分し累積する品質の精緻化を表すことができる。

[0148]ビデオデコーダ３０は、エントロピー復号ユニット７０によって提供される１つまたは複数の機能を実装することなどによって、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。復号されたプログレッシブ精緻化セグメント開始ＳＥＩメッセージに基づいて、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの開始境界を検出することができる。上記のシンタックス表１に示されたように、ビデオデコーダ３０は、ＨＥＶＣＷＤ９に従って、シグナリングされたプログレッシブ精緻化セグメント開始ＳＥＩメッセージ内のｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素とｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素とを復号することができる。ＨＥＶＣＷＤ９に従って、ビデオデコーダ３０は、１つまたは複数の条件が満足されるまで、プログレッシブ精緻化セグメントが続く（たとえば、符号化ビットストリーム内の各々の次の符号化ピクチャが単独で先行する符号化ピクチャを越える品質の精緻化である）と決定することができる。たとえば、ビデオデコーダ３０は、以下の条件のうちの１つが満足されるまで、プログレッシブ精緻化セグメントが続くと決定することができる。

− ビデオデコーダ３０が新しいコード化ビデオシーケンスの開始を検出する。

− ビデオデコーダ３０が符号化ビデオビットストリームの終了を検出する。

− シグナリングされたｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の値がゼロよりも大きく、復号順序で次のスライスの（「ｐｉｃ＿ｏｒｄｅｒ＿ｃｎｔ＿ｌｓｂ」によって示された）ＰＯＣ値の最下位ビットが以下の式の結果に等しいと、ビデオデコーダ３０が決定する：（ｃｕｒｒＰｉｃＯｒｄｅｒＣｎｔＬｓｂ＋ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１＋１）％ＭａｘＰｉｃＯｒｄｅｒＣｎｔＬｓｂ、ここで、ｃｕｒｒＰｉｃＯｒｄｅｒＣｎｔＬｓｂはＳＥＩメッセージを含んでいるアクセスユニット内のピクチャのｐｉｃ＿ｏｒｄｅｒ＿ｃｎｔ＿ｌｓｂの値である。「％」演算子は、整数除算演算の余りの値をもたらすモジュロ演算を示す。

− シグナリングされたｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１の値がゼロに等しく、現在のプログレッシブ精緻化セグメント開始ＳＥＩメッセージ内のｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄ値と同じｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄ値を有するシグナリングされたプログレッシブ精緻化セグメント終了ＳＥＩメッセージが復号されたと、ビデオデコーダ３０が決定する。

[0149]加えて、ビデオデコーダ３０は、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを含むシグナリングされたＳＥＩＮＡＬユニットが、ゼロに等しい値を有する「ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ」シンタックス要素を含むとき、シグナリングされたＳＥＩＮＡＬユニットが、復号順序で、現在ＡＵ内の最初のＶＣＬＮＡＬユニットに先行すると決定することができる。プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号する際に、ビデオデコーダ３０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値が、０で始まり、（２＾３２−２）で終わり、両端値を含む数値範囲内に入ると決定することができる。

[0150]たとえば、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素が、両端値を含む０から２５５および両端値を含む５１２から（２＾３１−１）の範囲内の値を有するとビデオデコーダ３０が決定した場合、ビデオデコーダ３０は、プログレッシブ精緻化セグメントに関連する特定のプログレッシブ精緻化動作を識別する、検出された値に使用することができる。言い換えれば、上述された範囲内でｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素に割り当てられた任意の値は、ＨＥＶＣＷＤ９でサポートされる特定のプログレッシブ精緻化動作に関連付けられる場合がある。次に、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素が上述された範囲の１つの中の値を有する場合、ビデオデコーダ３０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値によって識別された特定のプログレッシブ精緻化動作を使用して、プログレッシブ精緻化セグメントの各符号化ピクチャを復号することができる。

[0151]一方、両端値を含む２５６から５１１および両端値を含む２＾３１から（２＾３２−２）の範囲内に入るｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値は、ＩＴＵ−Ｔおよび／またはＩＳＯ／ＩＥＣが将来使用するために確保される。ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素が上述された確保された範囲の１つの中の値に等しいことをビデオデコーダ３０が検出した場合、ビデオデコーダ３０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素を無視することができる。特に、このシンタックス要素を無視するために、ビデオデコーダ３０は、受信された符号化ビデオビットストリームからｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素を除去し、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素を無視することができる。

[0152]記載されたように、ビデオデコーダ３０および／またはその構成要素は、ＨＥＶＣＷＤ９などに従って、符号化ビデオビットストリームの時間スケーラビリティをサポートするように構成される場合がある。たとえば、ビデオデコーダ３０は、ネットワーク要素６８が完全な符号化ビデオビットストリームから抽出し、ビデオデコーダ３０に通信したサブビットストリームを受信することができる。この例では、ネットワーク要素６８は、完全な符号化ビデオビットストリームに含まれる符号化ピクチャの完全なセットから符号化ピクチャの時間サブセットを抽出し、サブビットストリームの一部として時間サブセットをビデオデコーダ３０に供給することができる。たとえば、時間サブセットは、完全な符号化ビデオビットストリームに含まれる符号化ピクチャの完全なセットの真のサブセットを表すことができる。時間サブセットが符号化ピクチャの完全なセットの真のサブセットを表すシナリオでは、完全な符号化ビデオビットストリームは、時間サブセットのあらゆる符号化ピクチャ用のデータと、時間サブセットに含まれない少なくとも１つの追加の符号化ピクチャ用のデータとを含む場合がある。

[0153]時間スケーラビリティに従って様々な時間ピクチャレートをサポートするために、ビデオデコーダ３０は、ネットワーク要素６８が完全な符号化ビデオビットストリームから抽出することができる様々なサブビットストリームなどの、様々なピクチャレートのサブビットストリームを受信し復号するように構成される場合がある。より詳細には、様々なピクチャカウントの時間サブセットを含む様々なサブビットストリームは、様々なピクチャレートを表すことができる。時間スケーラビリティをサポートするために、ビデオデコーダ３０は、ピクチャレートにかかわらず、単独で復号可能なビットストリームとして任意のサブビットストリームを復号することができる。言い換えれば、ビデオデコーダ３０は、完全な符号化ビデオビットストリームに含まれるが、特定のサブビットストリームから除外される情報などの、いかなる追加のデータもなしに、符号化ピクチャの特定の時間サブセットを復号することができる。

[0154]ビデオデコーダ３０がビデオ符号化デバイスによってシグナリングされた完全な符号化ビデオビットストリームを受信する例では、完全な符号化ビデオビットストリームは、１つまたは複数の時間サブレイヤを含む場合がある。加えて、ビデオデコーダ３０によって受信および／または復号された各ＮＡＬユニットは、対応する「ＴｅｍｐｏｒａｌＩｄ」値によって示された特定のサブレイヤに属する場合がある。より詳細には、ビデオデコーダ３０は、ＮＡＬユニットのＴｅｍｐｏｒａｌＩｄの値を、シグナリングされた対応する「ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１」シンタックス要素の値マイナス１に等しいように決定することができる。加えて、ビデオデコーダ３０は、単一のピクチャのすべてのシグナリングされたＶＣＬＮＡＬユニットが単一のサブレイヤ（すなわち、同じサブレイヤ）に属すると決定することができる。言い換えれば、ビデオデコーダ３０は、符号化ピクチャ自体が符号化ピクチャに関連付けられたＮＡＬユニットに対応する特定のサブレイヤに属するとの決定に基づいて、符号化ピクチャを復号することができる。

[0155]たとえば、ＨＥＶＣＷＤ９に従って、ビデオデコーダ３０は、ビットストリームの下位サブレイヤの復号プロセスがビットストリームの上位サブレイヤ内のデータに依存しないように、シグナリングされた符号化ビデオビットストリームを復号することができる。ネットワーク要素６８は、完全なビットストリームから、特定の値よりも高いＴｅｍｐｏｒａｌＩｄ値に関連付けられたすべてのＮＡＬユニットを除去することによって、完全なビットストリームからサブビットストリームを生成することができる。ビデオ符号化デバイスは、ＨＥＶＣＷＤ９に対するビットストリーム準拠（たとえば、バッファ制限）についてのすべての条件が、完全なビットストリームに関して、したがって、ネットワーク要素６８が完全なビットストリームから抽出することができるサブビットストリームごとに、満たされることを保証することができる。次に、ビデオデコーダ３０は、復号プロセスに対するいかなる変更もなしに、ならびにハードウェア基盤および／またはソフトウェア基盤に対するいかなる変更も必要とせずに、いかなるシグナリングされたサブビットストリームも復号することができる。言い換えれば、ビデオデコーダ３０は、完全な符号化ビデオビットストリームを復号することに対応する方式で、ＨＥＶＣＷＤ９に従って時間スケーラビリティをサポートしながら、シグナリングされたサブビットストリームを復号することができる。

[0156]記載されたように、完全な符号化ビデオビットストリームを時間的にスケーリングする際に、ネットワーク要素６８は、完全な符号化ビデオビットストリームから符号化ピクチャの時間サブセットを抽出することができる。より詳細には、時間サブセットは、完全な符号化ビデオビットストリーム内でシグナリングされた符号化ピクチャの真のサブセットであり得るし、したがって、ネットワーク要素６８は、サブビットストリームを生成するために、完全な符号化ビットストリームから１つまたは複数の符号化ピクチャを除去することができる。例では、ネットワーク要素６８は、プログレッシブ精緻化セグメントに含まれる１つまたは複数の符号化ピクチャを除去することができる。ビデオデコーダ３０は、潜在的に、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の正しくない値を受信する可能性がある。ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の正しくない値を復号し、潜在的に適用することによって、ビデオデコーダ３０は、時間的にスケーリングされたプログレッシブ精緻化セグメントの終了境界の後に位置するピクチャを復号するために、プログレッシブ精緻化動作を適用する可能性がある。

[0157]符号化ビデオビットストリーム内でプログレッシブ精緻化セグメントの終端の後に位置するピクチャの誤った復号を軽減または除去するために、ビデオデコーダ３０および／またはエントロピー復号ユニット７０などのその構成要素は、本開示の１つまたは複数の技法を実装することができる。本技法のいくつかの実装形態によれば、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。ＰＯＣ値は、符号化ビデオビットストリーム内でシグナリングされる特定の符号化ピクチャに関連付けられた固定値を表すことができ、したがって、符号化ビデオビットストリームのいかなる時間スケーリングにもかかわらず、ビデオデコーダ３０への特定の符号化ピクチャを識別することができる。

[0158]たとえば、プログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値を導出することによって、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャをより正確に識別することができる。より詳細には、ビデオデコーダ３０は、ビデオデコーダ３０が時間的にスケーリングされたプログレッシブ精緻化セグメントを受信したかどうかにかかわらず、プログレッシブ精緻化セグメントの最後の符号化ピクチャを識別することができる。ビデオデコーダ３０が時間的にスケーリングされたビデオデコーダ３０のプログレッシブ精緻化セグメントを受信するシナリオでは、ビデオデコーダ３０は、プログレッシブ精緻化セグメントが時間的にスケーリングされた範囲にかかわらず、プログレッシブ精緻化セグメントの最後のピクチャをより正確に識別することができる。言い換えれば、ビデオデコーダ３０は、受信された符号化ビデオビットストリームのピクチャレートにかかわらず、プログレッシブ精緻化セグメントの最後の符号化ピクチャ（すなわち、終了境界）を識別することができる。

[0159]本明細書に記載された技法の様々な実装形態によれば、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャに関連付けられたＰＯＣ値を決定するためにビデオデコーダ３０が使用することができる情報を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。一実装形態では、ビデオデコーダ３０は、「デルタＰＯＣ」値を示すデータを取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。より詳細には、デルタＰＯＣ値は、ベースピクチャのＰＯＣ値とプログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値との間の差分を示すことができる。

[0160]次に、ビデオデコーダ３０は、対応するプログレッシブ精緻化セグメントの開始境界（たとえば、最初の符号化ピクチャ）を検出するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを使用することができる。加えて、ビデオデコーダ３０は、ベースピクチャ（たとえば、復号順序で開始境界の直前にくる符号化ピクチャ）のＰＯＣ値にデルタＰＯＣ値を加えることによって、プログレッシブ精緻化セグメントの終了境界（たとえば、最後の符号化ピクチャ）を決定することができる。たとえば、ベースピクチャのＰＯＣ値にデルタＰＯＣ値を加えることによって、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの終了境界のＰＯＣ値を導出することができる。

[0161]記載されたように、特定の符号化ピクチャのＰＯＣ値は、符号化ピクチャに関連付けられた固定値であり得るし、復号順序における符号化ピクチャの位置を示すことができる。プログレッシブ精緻化セグメントの終了境界のＰＯＣ値をそれから導出するデータを取得することによって、ビデオデコーダ３０は、ネットワーク要素６８がプログレッシブ精緻化セグメントを時間的にスケーリングするかどうかにかかわらず、またネットワーク要素６８がプログレッシブ精緻化セグメントを時間的にスケーリングする大きさによって、プログレッシブ精緻化セグメントの終了境界を決定することができる。ビデオデコーダ３０は、上記のシンタックス表３に示された「ｐｉｃ＿ｏｒｄｅｒ＿ｃｎｔ＿ｄｅｌｔａ」シンタックス要素からデルタＰＯＣ値を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。このようにして、ビデオデコーダ３０は、符号化ビデオビットストリームの時間スケーラビリティをサポートしながら、対応するプログレッシブ精緻化動作を使用してプログレッシブ精緻化シーケンスを復号するために、本開示の１つまたは複数の技法を実装することができる。

[0162]プログレッシブ精緻化セグメントの終了境界のＰＯＣ値に関連付けられたデータを取得するために、ビデオデコーダ３０がプログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号するいくつかの実装形態によれば、ビデオデコーダ３０は、復号されたプログレッシブ精緻化セグメント開始ＳＥＩメッセージから最下位ビット（ＬＳＢ）のデルタを取得することができる。これらの実装形態では、ビデオデコーダ３０は、ベースピクチャのＰＯＣ値のＬＳＢ値とプログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値のＬＳＢ値との間の差分を決定するために、ＬＳＢのデルタを使用することができる。

[0163]次に、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの終了境界のＰＯＣ値を導出するために、ＬＳＢのデルタを使用することができる。より詳細には、ビデオデコーダ３０は、ベースピクチャのＰＯＣ値のＬＳＢにＬＳＢのデルタを加えることができる。一例では、ビデオデコーダ３０は、ｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の代わりに、ＬＳＢのデルタを示すシンタックス要素を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。

[0164]ＬＳＢのデルタを示すシンタックス要素を取得することによって、ビデオデコーダ３０は、ネットワーク要素６８がプログレッシブ精緻化セグメントを時間的にスケーリングするかどうかにかかわらず、またネットワーク要素６８がプログレッシブ精緻化セグメントを時間的にスケーリングする大きさによって、プログレッシブ精緻化セグメントの終了境界を決定することができる。たとえば、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの終了境界のＰＯＣ値を導出するために、復号されたシンタックス要素の値を適用することができる。ビデオデコーダ３０は、プログレッシブ精緻化セグメントを復号するときに、終了境界に関連付けられた固定値を使用して終了境界を識別するために、導出されたＰＯＣ値を使用することができる。このようにして、ビデオデコーダ３０は、符号化ビデオビットストリームの時間スケーラビリティをサポートしながら、対応するプログレッシブ精緻化動作を使用してプログレッシブ精緻化シーケンスを復号するために、本開示の１つまたは複数の技法を実装することができる。

[0165]本明細書に記載された技法の他の実装形態によれば、ビデオデコーダ３０は、１）ベースピクチャのＴｅｍｐｏｒａｌＩｄ値以下のＴｅｍｐｏｒａｌＩｄ値に関連付けられた、２）ベースピクチャのプログレッシブな品質の精緻化を表す、連続する符号化ピクチャの数を示すデータを取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。より詳細には、減少するＴｅｍｐｏｒａｌＩｄ値は、復号順序に従った符号化ビデオビットストリーム内の前進を示すことができる。たとえば、プログレッシブ精緻化セグメントの最初の符号化ピクチャは、ベースピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有することができる。次に、プログレッシブ精緻化セグメントの２番目の符号化ピクチャは、プログレッシブ精緻化セグメントの最初の符号化ピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有することができる、以下同様。

[0166]ベースピクチャは、現在アクセスユニットに含まれる符号化ピクチャであり得るし、ベースピクチャは、復号順序でプログレッシブ精緻化セグメントの最初の符号化ピクチャの直前にくる場合がある。いくつかの例では、ベースピクチャは、出力順序でプログレッシブ精緻化セグメントの最初の符号化ピクチャの直前にくる場合もある。いくつかのそのような例では、プログレッシブ精緻化セグメントは、復号順序と出力順序の両方で連続する一連の符号化ピクチャを含む場合がある。

[0167]本明細書に記載された技法のこれらの実装形態によれば、ビデオデコーダ３０は、ベースピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有し、ならびにベースピクチャのプログレッシブな品質の精緻化を表す、連続する符号化ピクチャの数を示すデータを取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。たとえば、ビデオデコーダ３０によって取得された情報は、プログレッシブ精緻化セグメントを作り上げるシーケンス内の符号化ピクチャの数を示すことができる。これらの実装形態では、ビデオデコーダ３０は、ネットワーク要素６８から、上記に列挙された条件を満足する、連続する符号化ピクチャの数を受信することができる。より詳細には、ネットワーク要素６８は、ネットワーク要素６８が完全な符号化ビデオビットストリームから抽出した符号化ピクチャの時間サブセットごとに個別に条件を満足する、連続する符号化ピクチャの数を決定することができる。次に、ネットワーク要素６８は、上記に列挙された条件を満足する、連続する符号化ピクチャの数をビデオデコーダ３０に通信することができる。

[0168]上記の条件を満足する、連続する符号化ピクチャの受信された数を適用することによって、ビデオデコーダ３０は、ネットワーク要素６８がプログレッシブ精緻化セグメントを時間的にスケーリングするシナリオにおいても、プログレッシブ精緻化セグメントの長さをより正確に決定することができる。次に、ビデオデコーダ３０は、符号化ビデオビットストリームがサブビットストリームを表す（たとえば、符号化ピクチャの時間サブセットを表す）か否かにかかわらず、符号化ビデオビットストリームの一部として、条件を満足する、連続する符号化ピクチャの数を取得することができる。様々な例では、ビデオデコーダ３０は、上記の条件を満足する、連続する符号化ピクチャの決定された数を示すシンタックス要素を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成することができる。たとえば、ビデオデコーダ３０は、上記のシンタックス表１に示されたｎｕｍ＿ｒｅｆｉｎｅｍｅｎｔ＿ｓｔｅｐｓ＿ｍｉｎｕｓ１シンタックス要素の代わりに、決定された数を示すシンタックス要素を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。

[0169]ビデオデコーダ３０は、ベースピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有し、ベースピクチャのプログレッシブな品質の精緻化を表す、連続する符号化ピクチャの数を取得することによって、プログレッシブ精緻化セグメントの長さをより正確に決定することができる。加えて、符号化されたプログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することの一部として、上述された情報を取得することによって、ビデオデコーダ３０は、ネットワーク要素６８がプログレッシブ精緻化セグメントを時間的にスケーリングするかどうかにかかわらず、プログレッシブ精緻化セグメントの長さを正確に決定することができる。たとえば、ビデオデコーダ３０は、ネットワーク要素６８がプログレッシブ精緻化セグメントを時間的にスケーリングするかどうかにかかわらず、またネットワーク要素６８がプログレッシブ精緻化セグメントを時間的にスケーリングする大きさによって、プログレッシブ精緻化セグメントの長さを決定するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージから取得されたシンタックス要素を利用することができる。このようにして、ビデオデコーダ３０は、１）ベースピクチャのＴｅｍｐｏｒａｌＩｄ値よりも小さいＴｅｍｐｏｒａｌＩｄ値を有し、２）ベースピクチャのプログレッシブな品質の精緻化を表す、連続する符号化ピクチャの数を決定するために、本開示の１つまたは複数の技法を実装することができ、それにより、ビデオ復号デバイスが時間的にスケーラブルなビデオビットストリームをサポートしながら、プログレッシブ精緻化セグメントを復号することを可能にする。

[0170]図３に関して記載されたように、ビデオデコーダ３０および／またはその構成要素は、ビデオデータを復号する方法を実行することができ、その方法は、符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を受信することと、受信された情報に基づいてプログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかを復号することとを含む。ビデオデコーダ３０に関して上述された方法のいくつかの例示的な実装形態では、受信された情報は、プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値と、プログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値との間の差分を示すデルタＰＯＣ値を含む。ビデオデコーダ３０に関して上述された方法のいくつかの例示的な実装形態によれば、受信された情報は、プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値のＬＳＢと、プログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値のＬＳＢとの間の差分を示す最下位ビット（ＬＳＢ）のデルタを含む。ビデオデコーダ３０に関して上述された方法の一例では、受信された情報は、プログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値を含む。

[0171]ビデオデコーダ３０に関して上述された方法のいくつかの実装形態によれば、情報を受信することは、符号化ビットストリームに含まれる補足エンハンスメント情報（ＳＥＩ）メッセージ内の情報を受信することを備える。１つのそのような実装形態では、ＳＥＩメッセージは、プログレッシブ精緻化セグメントの開始境界を示すプログレッシブ精緻化セグメント開始ＳＥＩメッセージを備える。ビデオデコーダ３０に関して上述された方法のいくつかの実装形態によれば、方法は、符号化ピクチャが符号化ビットストリーム内でプログレッシブ精緻化セグメントの直前にくると決定することをさらに含む場合がある。１つのそのような実装形態では、プログレッシブ精緻化シーケンスの直前にくる符号化ピクチャと比較して、プログレッシブ精緻化シーケンス内の複数のピクチャの各々は、品質の精緻化を定義する。

[0172]ビデオデコーダ３０に関して上述された方法のいくつかの例では、方法は、受信された情報を使用してプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャを検出することと、プログレッシブ精緻化動作に従った復号を停止することとをさらに備える場合がある。ビデオデコーダ３０に関して上述された方法のいくつかの実装形態によれば、受信された情報に基づいてプログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかを復号することは、プログレッシブ精緻化セグメント内の最後のピクチャを除いて、プログレッシブ精緻化セグメント内の各ピクチャにプログレッシブ精緻化動作を適用することを備える場合がある。

[0173]様々な例では、ビデオデコーダ３０は、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどの、ビデオデータをコーディングするためのデバイスに含まれる場合がある。例では、ビデオデータをコーディングするためのそのようなデバイスは、集積回路、マイクロプロセッサ、および、ビデオデコーダ３０を含む通信デバイスのうちの１つまたは複数を含む場合がある。

[0174]図４は、本開示の１つまたは複数の態様による、例示的なプログレッシブ精緻化セグメント９４と対応するベースピクチャ９２とを示す概念図である。より詳細には、図４は、ベースピクチャ９２とプログレッシブ精緻化セグメント９４とを含むピクチャシーケンス９０を示す。次に、プログレッシブ精緻化セグメント９４は、プログレッシブ精緻化ピクチャ９４Ａ〜９４Ｎを含む。プログレッシブ精緻化ピクチャ９４Ａ〜９４Ｎの各々は、ベースピクチャ９２の品質の精緻化を表すことができる。様々な例では、品質の精緻化は、本開示によれば、コード化ピクチャと元のピクチャとの間のひずみの量をプログレッシブに低減する観点からの精緻化を表すことができる。たとえば、プログレッシブ精緻化ピクチャ９４Ａ〜９４Ｎの各々は、ベースピクチャ９２が含まない残差データを含む場合がある。加えて、プログレッシブ精緻化ピクチャ９４Ａ〜９４Ｎの各々は、ベースピクチャ９２からのいかなる動きベースの予測も表さずに、ベースピクチャ９２の品質の精緻化を表すことができる。

[0175]より詳細には、プログレッシブ精緻化セグメント９４は、連続する復号順序で一連の符号化ピクチャを表すことができる。いくつかの例では、プログレッシブ精緻化セグメント９４に含まれる一連の符号化ピクチャは、連続する出力順序にある場合もある。加えて、プログレッシブ精緻化セグメント９４は、ピクチャごとの増分によって定義された、ベースピクチャ９２に関する連続的な品質の精緻化を表すことができる。たとえば、プログレッシブ精緻化セグメント９４の最初のピクチャであるプログレッシブ精緻化ピクチャ９４Ａは、あらかじめ定義された増分だけベースピクチャ８２を越える品質の精緻化を表すことができる。次に、プログレッシブ精緻化セグメント９４の２番目のピクチャであるプログレッシブ精緻化ピクチャ９４Ｂは、あらかじめ定義された増分だけプログレッシブ精緻化ピクチャ９４Ａを越える品質の精緻化を表すことができる、以下同様。このようにして、プログレッシブ精緻化セグメント９４は、ベースピクチャ９２を越える反復的な品質の精緻化を表すことができ、最後の符号化ピクチャ（プログレッシブ精緻化ピクチャ９４Ｎ）は、あらかじめ定義された精緻化の増分のすべての反復にわたって累積された品質の精緻化を表す。

[0176]たとえば、ビデオデコーダ３０は、復号順序で前のピクチャにプログレッシブ精緻化動作を適用することによって、プログレッシブ精緻化セグメント９４を復号することができる。より詳細には、ビデオデコーダ３０は、ビデオエンコーダ２０によってシグナリングされた符号化ビデオビットストリームの一部として、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを受信することができる。加えて、ビデオデコーダ３０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値を取得するために、受信されたプログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。次に、ビデオデコーダ３０は、それを用いてプログレッシブ精緻化セグメント９４を復号する特定のプログレッシブ精緻化動作を決定するために、取得されたｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄの値を使用することができる。ビデオデコーダ３０は、ベースピクチャ９２、およびプログレッシブ精緻化ピクチャ９４Ｎ（すなわち、最後のピクチャ）を除くプログレッシブ精緻化セグメント９４の各ピクチャに、決定されたプログレッシブ精緻化動作を適用することができる。より詳細には、ビデオデコーダ３０は、いかなる動き予測も適用せずに、ベースピクチャ９２、および最後から２番目のピクチャにかけてのプログレッシブ精緻化セグメント９４の各ピクチャに、プログレッシブ精緻化動作を適用することができる。

[0177]加えて、ビデオデコーダ３０は、符号化ビデオビットストリームの時間スケーラビリティをサポートしながら、プログレッシブ精緻化セグメント９４を復号するために、本開示の１つまたは複数の技法を実装することができる。たとえば、ビデオデコーダ３０は、プログレッシブ精緻化セグメント９４の最後のピクチャ（たとえば、プログレッシブ精緻化ピクチャ９４Ｎ）のピクチャ順序カウント（ＰＯＣ）値を示す情報を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。プログレッシブ精緻化セグメント開始ＳＥＩメッセージは、符号化ビデオビットストリーム内で、ベースピクチャ９２に関連巣付けられた符号化データの直後に位置する場合がある。特定のピクチャのＰＯＣ値は、低減されたピクチャレートを実現するために符号化ビデオビットストリームが時間的にスケーリングされたかどうかにかかわらず、符号化ビデオビットストリーム内の特定のピクチャの位置を示すことができる。たとえば、ビデオデコーダ３０は、受信された符号化ビデオビットストリームの他の位置に関連する情報に依存することなく、ピクチャの割り当てられたＰＯＣ値によって符号化ピクチャを識別することができる。

[0178]いくつかの例では、ビデオデコーダ３０は、プログレッシブ精緻化ピクチャ９４ＮのＰＯＣ値を示す情報を取得するために、プログレッシブ精緻化セグメント９４に関連付けられたプログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。たとえば、ビデオデコーダ３０は、ＳＥＩメッセージに含まれるシンタックス要素の値を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。より詳細には、この事例では、ビデオデコーダ３０は、復号されたシンタックス要素から、プログレッシブ精緻化ピクチャ９４Ｎに関連付けられたＰＯＣ値を取得することができる。

[0179]次に、ビデオデコーダ３０が対応するシンタックス要素によって識別されたＰＯＣ値を検出するまで、ビデオデコーダ３０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値によって識別されたプログレッシブ精緻化動作を反復的に適用することによって、プログレッシブ精緻化セグメント９４を復号することができる。プログレッシブ精緻化セグメント開始ＳＥＩメッセージの対応するシンタックス要素によって識別されたＰＯＣ値を検出すると、ビデオデコーダ３０は、ビデオデコーダ３０が（図４の例では、プログレッシブ精緻化ピクチャ９４Ｎによって示された）プログレッシブ精緻化セグメント９４の終了境界に到達したと決定することができる。ビデオデコーダ３０がプログレッシブ精緻化セグメント９４の終了境界に到達したとの決定に基づいて、ビデオデコーダ３０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素によって示された精緻化動作のみに基づくビットストリームの符号化ピクチャの復号を停止することができる。

[0180]本開示の技法の他の実装形態によれば、ビデオデコーダ３０は、デルタＰＯＣシンタックス要素を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。ビデオデコーダ３０は、プログレッシブ精緻化セグメント９４の終了境界を示すプログレッシブ精緻化ピクチャ９４Ｎの終了境界のＰＯＣ値を決定するために、デルタＰＯＣシンタックス要素の値を使用することができる。より詳細には、ビデオデコーダ３０は、プログレッシブ精緻化ピクチャ９４ＮのＰＯＣ値を決定するために、ベースピクチャ９２のＰＯＣ値にデルタＰＯＣの値を加えることができる。次に、ビデオデコーダ３０は、復号プロセスにおいて、ビデオデコーダ３０がプログレッシブ精緻化セグメント９４の終了境界にいつ到達したかを検出するために、プログレッシブ精緻化ピクチャ９４Ｎの決定されたＰＯＣ値を使用することができる。デルタＰＯＣ値を使用して、ビデオデコーダ３０がプログレッシブ精緻化セグメント９４の終了境界に到達したと決定したことに基づいて、ビデオデコーダ３０は、プログレッシブ精緻化による復号を停止することができる。

[0181]本明細書に記載された技法の他の例示的な実装形態では、ビデオデコーダ３０は、最下位ビット（ＬＳＢ）のデルタを示すシンタックス要素を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。ビデオデコーダ３０は、符号化ビデオビットストリームに関する復号プロセス中に、プログレッシブ精緻化ピクチャ９４Ｎを検出するために、ＬＳＢ値のデルタを使用することができる。より詳細には、ビデオデコーダ３０は、プログレッシブ精緻化セグメント９４の終了境界を形成するプログレッシブ精緻化ピクチャ９４ＮのＰＯＣ値のＬＳＢを導出するために、ベースピクチャ９２のＰＯＣ値のＬＳＢにＬＳＢ値のデルタを加えることができる。

[0182]次に、ビデオデコーダ３０は、ベースピクチャ９２にｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素によって識別されたプログレッシブ精緻化動作を適用することのみによって、プログレッシブ精緻化ピクチャ９４Ａを復号し、ビデオデコーダ３０が導出されたＬＳＢ値を有するＰＯＣ値に関連付けられたピクチャを識別するまで、精緻化動作を適用し続けることによって、復号順序で次のピクチャを復号し続けることができる。一例では、ビデオデコーダ３０は、プログレッシブ精緻化セグメント９４の直前にくるピクチャに精緻化動作を反復的に適用することによって、プログレッシブ精緻化ピクチャ９４Ａ〜９４Ｎの各々を復号することができる。別の例では、ビデオデコーダ３０は、ベースピクチャ９２にプログレッシブ精緻化動作またはその変形形態を適用することによって、プログレッシブ精緻化ピクチャ９４Ａ〜９４Ｎの各々を復号することができる。加えて、導出されたＬＳＢを有するＰＯＣ値をもつピクチャを検出すると、ビデオデコーダ３０は、符号化ビデオビットストリームの復号プロセスにおいて、ビデオデコーダ３０がプログレッシブ精緻化セグメント９４の終了境界（すなわち、プログレッシブ精緻化ピクチャ９４Ｎ）に到達したと決定することができる。デルタＰＯＣ値を使用して、ビデオデコーダ３０がプログレッシブ精緻化セグメント９４の終了境界に到達したと決定したことに基づいて、ビデオデコーダ３０は、ビデオデコーダ３０がプログレッシブ精緻化セグメントの復号を完了したと決定することができる。

[0183]図５は、本開示の１つまたは複数の態様により、符号化ビデオデータを復号するために、ビデオデコーダ３０および／またはその構成要素が実行することができる例示的なプロセス１００を示すフローチャートである。プロセス１００は、ビデオデコーダ３０が符号化ビデオビットストリーム内でシグナリングされた次の符号化ピクチャを識別する（１０２）ときに始まる場合がある。より詳細には、ビデオデコーダ３０は、復号順序に従って、いくつかの例では出力順序に従って、符号化ビデオビットストリーム内でシグナリングされた次の符号化ピクチャを検出することができる。

[0184]加えて、ビデオデコーダ３０は、識別された符号化ピクチャが復号順序でプログレッシブ精緻化セグメントの直前にくるかどうかを決定することができる（１０４）。より詳細には、符号化ピクチャがプログレッシブ精緻化セグメントの直前にくるかどうかを決定することによって、ビデオデコーダ３０は、符号化ピクチャがプログレッシブ精緻化セグメント用のベースピクチャを形成したか否かを決定することができる。たとえば、ビデオデコーダ３０は、符号化ピクチャをエントロピー復号すること、およびプログレッシブ精緻化セグメント開始ＳＥＩメッセージが符号化ビデオビットストリーム内で符号化の直後に位置するかどうかを決定することによって、符号化ピクチャがベースピクチャであるかどうかを決定することができる。ビデオデコーダ３０が符号化ピクチャの直後に位置するプログレッシブ精緻化セグメント開始ＳＥＩメッセージを検出した場合、ビデオデコーダ３０は、符号化ピクチャがプログレッシブ精緻化セグメント用のベースピクチャを形成したと決定することができる。

[0185]直近に復号されたピクチャがプログレッシブ精緻化セグメント用のベースピクチャではないとビデオデコーダ３０が決定した場合（１０４の「いいえ」分岐）、ビデオデコーダ３０は、（効果的に１０２に戻って）符号化ビデオビットストリーム内でシグナリングされた、復号順序で次の符号化ピクチャを識別し、復号プロセスを続行することができる。一方、直近に復号されたピクチャがプログレッシブ精緻化セグメント用のベースピクチャであるとビデオデコーダ３０が決定した場合（１０４の「はい」分岐）、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値を示すデータを検出することができる（１０６）。

[0186]様々な実装形態では、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値を示すデータを取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。たとえば、ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値を示す１つまたは複数のシンタックス要素を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。様々な例では、ビデオデコーダ３０は、直接的または間接的のいずれかで、ＰＯＣ値を決定するためにシンタックス要素を使用することができる。より詳細には、シンタックス要素は、直接ビデオデコーダ３０にＰＯＣ値を示すことができるか、またはプログレッシブ精緻化セグメント内の最後の符号化ピクチャのＰＯＣ値を導出するデータをビデオデコーダ３０に供給することができる。一例として、ビデオデコーダ３０は、ベースピクチャのＰＯＣ値とプログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値との間の差分を示すデルタＰＯＣ値のうちの１つまたは複数を示すシンタックス要素を復号することができる。別の例として、ビデオデコーダ３０は、ベースピクチャのＰＯＣ値のＬＳＢとプログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値のＬＳＢとの間の差分を示すＬＳＢのデルタを示すシンタックス要素を復号することができる。

[0187]加えて、ビデオデコーダ３０は、プログレッシブ精緻化セグメントに関連付けられたプログレッシブ精緻化動作を決定することができる（１０８）。より詳細には、ビデオデコーダ３０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素を取得するために、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを復号することができる。次に、ビデオデコーダ３０は、プログレッシブ精緻化セグメントを復号するために使用されるプログレッシブ精緻化動作を識別するために、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値を使用することができる。たとえば、ビデオデコーダ３０は、ｐｒｏｇｒｅｓｓｉｖｅ＿ｒｅｆｉｎｅｍｅｎｔ＿ｉｄシンタックス要素の値に基づいて、ベースピクチャ９２に関連する復号されたビデオデータに残差データを追加することによって、プログレッシブ精緻化ピクチャ９４Ａ〜９４Ｎのうちの１つまたは複数を復号することができる。

[0188]ビデオデコーダ３０は、プログレッシブ精緻化セグメントの最後のピクチャのＰＯＣ値を示すデータと、識別されたプログレッシブ精緻化動作とを使用して、プログレッシブ精緻化セグメントを復号することができる（１１０）。より詳細には、ビデオデコーダ３０がプログレッシブ精緻化セグメントの最後の符号化ピクチャに関連付けられたＰＯＣ値（またはそのＬＳＢ）を検出するまで、ビデオデコーダ３０は、ベースピクチャおよび復号順序で後にくる各ピクチャに、識別されたプログレッシブ精緻化動作を反復的に適用することができる。たとえば、プログレッシブ精緻化動作を反復的に適用するためには、ビデオデコーダ３０は、セグメントの各々の連続する符号化ピクチャからの追加データを決定し、セグメントの所与のピクチャのビット深度に追加するために追加データを使用することができる。ＰＯＣは、符号化ビデオビットストリームの時間スケーリングによって影響を受けない固定値であり得る。結果として、ビデオデコーダ３０は、時間的にスケーラブルなビデオビットストリームもサポートしながら、ＨＥＶＣＷＤ９で定義されたプログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメントを復号するために、ＰＯＣ指示データと識別されたプログレッシブ精緻化動作とを使用することができる。

[0189]図６は、本開示の１つまたは複数の態様により、ビデオデータを符号化するために、ビデオエンコーダ２０および／またはその構成要素が実行することができる例示的なプロセス１２０を示すフローチャートである。プロセス１２０は、ビデオエンコーダ２０がビットストリームの次の符号化ピクチャを形成する（１２２）ときに始まる場合がある。たとえば、ビデオエンコーダ２０は、次の符号化ピクチャを形成するために、受信されたビデオデータの次のピクチャをエントロピー符号化することができる。加えて、ビデオエンコーダ２０は、直近に符号化されたピクチャが復号順序でプログレッシブ精緻化セグメントの直前にくるかどうかを決定することができる（１２４）。

[0190]言い換えれば、ビデオエンコーダ２０は、直近に符号化されたピクチャがプログレッシブ精緻化セグメント用のベースピクチャであるかどうかを決定することができる。ビデオエンコーダ２０は、復号順序で直近に符号化されたピクチャの直後にくる一連のピクチャが、直近に符号化されたピクチャに関するいかなる動き予測も定義せずに、直近に符号化されたピクチャに関する品質の精緻化を定義する前に、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを挿入すべきかどうかを決定することができる。直近に符号化されたピクチャがプログレッシブ精緻化セグメント用のベースピクチャではないとビデオエンコーダ２０が決定した場合（１２４の「いいえ」分岐）、ビデオエンコーダ２０は、符号化ビデオビットストリーム内でシグナリングされるべき次の符号化ピクチャを形成することができる。

[0191]一方、直近に符号化されたピクチャがプログレッシブ精緻化セグメントのベースピクチャであるとビデオエンコーダ２０が決定した場合、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値を示すデータを符号化することができる（１２６）。たとえば、ビデオエンコーダ２０は、ビデオ復号デバイスがそれを用いてプログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値を決定することができる情報を含む、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを符号化するために、本開示の技法を実装することができる。一例では、ビデオエンコーダ２０は、シンタックス要素の形態などで、プログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値を直接示すデータを含めることができる。他の例では、ビデオエンコーダ２０は、ＰＯＣ値を導出するためにビデオ復号デバイスが使用することができるデータを含めることができる。

[0192]いくつかの例では、ビデオエンコーダ２０は、プログレッシブ精緻化セグメント開始ＳＥＩメッセージ内に、ｐｉｃ＿ｏｒｄｅｒ＿ｃｎｔ＿ｄｅｌｔａシンタックス要素を含めることができる。たとえば、ビデオエンコーダ２０は、ベースピクチャおよびプログレッシブ精緻化セグメントの最後の符号化ピクチャのそれぞれのＰＯＣ値の間の差分を示すように、ｐｉｃ＿ｏｒｄｅｒ＿ｃｎｔ＿ｄｅｌｔａシンタックス要素を生成することができる。別の例として、ビデオエンコーダ２０は、ＳＥＩメッセージ内にＬＳＢのデルタを示すシンタックス要素を含めることができる。この例では、ビデオエンコーダ２０は、ベースピクチャおよびプログレッシブ精緻化セグメントの最後の符号化ピクチャのそれぞれのＰＯＣ値のＬＳＢの間の差分を示すように、ＬＳＢのデルタを生成することができる。ビデオエンコーダ２０は、ｐｉｃ＿ｏｒｄｅｒ＿ｃｎｔ＿ｄｅｌｔａシンタックス要素およびＬＳＢのデルタシンタックス要素のうちの一方または両方の値を使用して、プログレッシブ精緻化セグメントの終了境界（すなわち、最後の符号化ピクチャ）をビデオ復号デバイスが検出することを可能にすることができる。

[0193]加えて、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値を示すデータ、およびプログレッシブ精緻化セグメントに関連付けられたプログレッシブ精緻化動作に基づいて、プログレッシブ精緻化セグメントを符号化することができる。たとえば、ビデオエンコーダ２０は、直後にくる符号化ピクチャにプログレッシブ精緻化動作を適用することによって、プログレッシブ精緻化セグメントの各ピクチャを符号化することができる。ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの最後の符号化ピクチャのＰＯＣ値（またはそのＬＳＢ）の検出に基づいて、プログレッシブ精緻化セグメントの終了境界を検出することができる。プログレッシブ精緻化セグメントの終了境界の検出に基づいて、ビデオエンコーダ２０は、プログレッシブ精緻化動作のみを使用して次のピクチャを符号化することを停止することができる。

[0194]ビデオエンコーダ２０は、符号化ビデオビットストリームをシグナリングすることができる。より詳細には、ビデオエンコーダ２０は、ベースピクチャに関連するデータと、上述されたシンタックス要素のうちの１つまたは複数を含むプログレッシブ精緻化セグメント開始ＳＥＩメッセージと、プログレッシブ精緻化セグメントとを含めるように、符号化ビデオビットストリームをシグナリングすることができる。いくつかの例では、中間デバイスは、完全な符号化ビデオビットストリームを時間的にスケーリングすることなどによって、サブビットストリームを抽出することができる。これらの例では、ビデオエンコーダ２０は、プログレッシブ精緻化セグメントの終了境界のＰＯＣ値を示すデータを含めるように、プログレッシブ精緻化セグメント開始ＳＥＩメッセージを生成し、シグナリングするので、ビデオエンコーダ２０は、時間スケーリングにかかわらず、それによってセグメントを復号する正確なデータをビデオ復号デバイスに供給することができる。ビデオエンコーダ２０は、符号化ビデオビットストリームの時間スケーラビリティをサポートしながら、プログレッシブ精緻化セグメントを符号化し、その復号を可能にするために、本開示の技法を実装することができる。

[0195]このようにして、ビデオデコーダ３０またはビデオエンコーダ２０のいずれかは、ビデオデータをコーディングするためのデバイスの一例であり得るし、そのデバイスは、符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定するための手段と、プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかをコーディングするための手段とを含む。

[0196]加えて、このようにして、宛先デバイス１４またはソースデバイス１２のいずれかは、実行されたとき、符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定することと、プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内のピクチャのうちの少なくともいくつかをコーディングすることとを、コンピューティングデバイスのプログラマブルプロセッサに行わせる命令を記憶したコンピュータ可読記憶媒体を含むか、またはそれに結合されたコンピューティングデバイスの一例であり得る。

[0197]１つまたは複数の例では、記載された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せに実装される場合がある。ソフトウェアに実装される場合、機能は、１つもしくは複数の命令もしくはコードとしてコンピュータ可読媒体上に記憶されるか、またはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行される場合がある。コンピュータ可読媒体は、データ記憶媒体などの有形媒体、様々なコンピュータ可読ストレージデバイス、または、たとえば通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体に対応する、コンピュータ可読記憶媒体を含む場合がある。このようにして、コンピュータ可読媒体は、一般に、（１）非一時的である有形コンピュータ可読記憶媒体、または、（２）信号もしくは搬送波などの通信媒体に対応する場合がある。データ記憶媒体は、本開示に記載された技法を実施するための命令、コードおよび／またはデータ構造を取り出すために、１つもしくは複数のコンピュータ、または１つもしくは複数のプロセッサによってアクセスされ得る任意の入手可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含む場合がある。

[0198]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭもしくは他の光ディスクストレージ、磁気ディスクストレージもしくは他の磁気ストレージデバイス、フラッシュメモリ、または、命令もしくはデータ構造の形態の所望のプログラムコードを記憶するために使用され得るし、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）、およびブルーレイディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザーで光学的に再生する。上記の組合せも、コンピュータ可読媒体の範囲内に含まれるべきである。

[0199]命令は、１つもしくは複数のデジタル信号プロセッサ（ＤＳＰ）などの１つもしくは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、または他の均等な集積回路もしくはディスクリート論理回路によって実行される場合がある。したがって、本明細書で使用する「プロセッサ」という用語は、上記の構造、または本明細書に記載された技法の実装に適した任意の他の構造のうちのいずれかを指す場合がある。加えて、いくつかの態様では、本明細書に記載された機能は、符号化および復号のために構成された専用のハードウェアモジュールおよび／もしくはソフトウェアモジュール内に設けられる場合があるか、または複合コーデックに組み込まれる場合がある。また、本技法は、１つまたは複数の回路または論理要素に完全に実装され得る。

[0200]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）、またはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置に実装される場合がある。開示された技法を実行するように構成されたデバイスの機能的態様を強調するために、様々な構成要素、モジュール、またはユニットが本開示に記載されたが、それらの構成要素、モジュール、またはユニットは、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上述されたように、適切なソフトウェアおよび／またはファームウェアと連携して、様々なユニットは、コーデックハードウェアユニットにおいて組み合わされる場合があるか、または上述された１つまたは複数のプロセッサを含む、相互動作可能なハードウェアユニットの集合体よって提供される場合がある。

[0201]様々な例が記載された。これらおよび他の例は、以下の特許請求の範囲内にある。

[0201]様々な例が記載された。これらおよび他の例は、以下の特許請求の範囲内にある。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］ビデオデータを復号する方法であって、
符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を受信することと、
前記受信された情報に基づいて、プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかを復号することと
を備える、方法。
［Ｃ２］前記受信された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値と、前記プログレッシブ精緻化セグメントの前記最後のピクチャの前記ＰＯＣ値との間の差分を示すデルタＰＯＣ値を含む、Ｃ１に記載の方法。
［Ｃ３］前記受信された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値のＬＳＢと、前記プログレッシブ精緻化セグメントの前記最後のピクチャのＰＯＣ値のＬＳＢとの間の差分を示す最下位ビット（ＬＳＢ）のデルタを含む、Ｃ１に記載の方法。
［Ｃ４］前記受信された情報が、前記プログレッシブ精緻化セグメントの前記最後のピクチャに割り当てられたＰＯＣ値を含む、Ｃ１に記載の方法。
［Ｃ５］前記情報を受信することが、前記符号化ビットストリームに含まれる補足エンハンスメント情報（ＳＥＩ）メッセージ内の前記情報を受信することを備える、Ｃ１に記載の方法。
［Ｃ６］前記ＳＥＩメッセージが、前記プログレッシブ精緻化セグメントの開始境界を示すプログレッシブ精緻化セグメント開始ＳＥＩメッセージを備える、Ｃ５に記載の方法。
［Ｃ７］符号化ビデオビットストリーム内で前記プログレッシブ精緻化セグメントの直前にくる符号化ピクチャが、前記プログレッシブ精緻化セグメントに対するベースピクチャを備えると決定すること
をさらに備える、Ｃ１に記載の方法。
［Ｃ８］前記プログレッシブ精緻化シーケンス内の前記複数の符号化ピクチャの各々が、前記プログレッシブ精緻化シーケンス内の前記それぞれのピクチャの直前にくる前記符号化ピクチャと比較して、コーディングされるべきピクチャの品質の精緻化を定義する、Ｃ７に記載の方法。
［Ｃ９］前記受信された情報を使用して、前記プログレッシブ精緻化セグメント内の前記複数のピクチャのうちの前記最後のピクチャを検出することと、
前記プログレッシブ精緻化動作に従った復号を停止することと
をさらに備える、Ｃ１に記載の方法。
［Ｃ１０］前記受信された情報に基づいて、前記プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかを復号することが、
前記プログレッシブ精緻化セグメント内の前記最後のピクチャを除いて、前記プログレッシブ精緻化セグメント内の各ピクチャに前記プログレッシブ精緻化動作を適用することを備える、
Ｃ１に記載の方法。
［Ｃ１１］ビデオデータを符号化する方法であって、
プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内の複数のピクチャのうちの少なくともいくつかのピクチャを符号化することと、
符号化ビットストリーム内の前記プログレッシブ精緻化セグメントの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を生成することと
を備える、方法。
［Ｃ１２］前記生成された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値と、前記プログレッシブ精緻化セグメントの前記最後のピクチャの前記ＰＯＣ値との間の差分を示すデルタＰＯＣ値を含む、Ｃ１１に記載の方法。
［Ｃ１３］前記生成された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値のＬＳＢと、前記プログレッシブ精緻化セグメントの前記最後のピクチャのＰＯＣ値のＬＳＢとの間の差分を示す最下位ビット（ＬＳＢ）のデルタを含む、Ｃ１１に記載の方法。
［Ｃ１４］前記生成された情報が、前記プログレッシブ精緻化セグメントの前記最後のピクチャに割り当てられたＰＯＣ値を含む、Ｃ１１に記載の方法。
［Ｃ１５］前記情報を生成することが、前記符号化ビデオビットストリーム内でシグナリングされるべき補足エンハンスメント情報（ＳＥＩ）メッセージ内に前記情報を含めることを備える、Ｃ１１に記載の方法。
［Ｃ１６］前記ＳＥＩメッセージが、前記プログレッシブ精緻化セグメントの開始境界を示すプログレッシブ精緻化セグメント開始ＳＥＩメッセージを備える、Ｃ１５に記載の方法。
［Ｃ１７］符号化ビデオビットストリーム内で前記プログレッシブ精緻化セグメントの直前にくる符号化ピクチャが、前記プログレッシブ精緻化セグメントに対するベースピクチャを備えると決定すること
をさらに備える、Ｃ１１に記載の方法。
［Ｃ１８］前記プログレッシブ精緻化シーケンス内の前記複数の符号化ピクチャの各々が、前記プログレッシブ精緻化シーケンス内の前記それぞれのピクチャの直前にくる前記符号化ピクチャと比較して、コーディングされるべきピクチャの品質の精緻化を定義する、Ｃ１７に記載の方法。
［Ｃ１９］前記プログレッシブ精緻化セグメント内の前記複数のピクチャのうちの前記最後のピクチャを検出することと、
前記プログレッシブ精緻化動作に従った符号化を停止することと
をさらに備える、Ｃ１１に記載の方法。
［Ｃ２０］前記プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかを符号化することが、
前記プログレッシブ精緻化セグメント内の前記最後のピクチャを除いて、前記プログレッシブ精緻化セグメント内の各ピクチャに前記プログレッシブ精緻化動作を適用することを備える、
Ｃ１１に記載の方法。
［Ｃ２１］ビデオデータをコーディングするためのデバイスであって、
符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定することと、
プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかをコーディングすることと
を行うように構成されたビデオコーダを備える、デバイス。
［Ｃ２２］前記デバイスが、
集積回路、
マイクロプロセッサ、および
前記ビデオコーダを備える通信デバイス
のうちの少なくとも１つを備える、Ｃ２１に記載のデバイス。
［Ｃ２３］前記決定された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値と、前記プログレッシブ精緻化セグメントの前記最後のピクチャの前記ＰＯＣ値との間の差分を示すデルタＰＯＣ値を含む、Ｃ２１に記載のデバイス。
［Ｃ２４］前記決定された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値のＬＳＢと、前記プログレッシブ精緻化セグメントの前記最後のピクチャのＰＯＣ値のＬＳＢとの間の差分を示す最下位ビット（ＬＳＢ）のデルタを含む、Ｃ２１に記載のデバイス。
［Ｃ２５］前記決定された情報が、前記プログレッシブ精緻化セグメントの前記最後のピクチャに割り当てられたＰＯＣ値を含む、Ｃ２１に記載のデバイス。
［Ｃ２６］前記情報を決定するために、前記ビデオコーダが、
前記符号化ビットストリームに含まれる補足エンハンスメント情報（ＳＥＩ）メッセージに少なくとも部分的に基づいて、前記情報を決定すること
を行うように構成された、Ｃ２１に記載のデバイス。
［Ｃ２７］前記ＳＥＩメッセージが、前記プログレッシブ精緻化セグメントの開始境界を示すプログレッシブ精緻化セグメント開始ＳＥＩメッセージを備える、Ｃ２６に記載のデバイス。
［Ｃ２８］前記ビデオコーダが、
符号化ビデオビットストリーム内で前記プログレッシブ精緻化セグメントの直前にくる符号化ピクチャが、前記プログレッシブ精緻化セグメントに対するベースピクチャを備えると決定すること
を行うようにさらに構成された、Ｃ２１に記載のデバイス。
［Ｃ２９］前記プログレッシブ精緻化シーケンス内の前記複数の符号化ピクチャの各々が、前記プログレッシブ精緻化シーケンス内の前記それぞれのピクチャの直前にくる前記符号化ピクチャと比較して、コーディングされるべきピクチャの品質の精緻化を定義する、Ｃ２８に記載のデバイス。
［Ｃ３０］前記ビデオコーダが、
前記受信された情報を使用して、前記プログレッシブ精緻化セグメント内の前記複数のピクチャのうちの前記最後のピクチャを検出することと、
前記プログレッシブ精緻化動作に従ったコーディングを停止することと
を行うようにさらに構成された、Ｃ２１に記載のデバイス。
［Ｃ３１］前記プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかをコーディングするために、前記ビデオコーダが、
前記プログレッシブ精緻化セグメント内の前記最後のピクチャを除いて、前記プログレッシブ精緻化セグメント内の各ピクチャに前記プログレッシブ精緻化動作を適用すること
を行うように構成された、Ｃ２１に記載のデバイス。
［Ｃ３２］前記ビデオコーダがビデオデコーダを備える、Ｃ２１に記載のデバイス。
［Ｃ３３］前記ビデオデコーダが、
前記受信された情報を使用して、前記プログレッシブ精緻化セグメント内の前記複数のピクチャのうちの前記最後のピクチャを検出することと、
前記プログレッシブ精緻化動作に従った復号を停止することと
を行うようにさらに構成された、Ｃ３２に記載のデバイス。
［Ｃ３４］前記ビデオコーダがビデオエンコーダを備える、Ｃ２１に記載のデバイス。
［Ｃ３５］前記プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかをコーディングするために、前記ビデオエンコーダが、
符号化ビットストリーム内の前記プログレッシブ精緻化セグメントの前記最後のピクチャの前記ＰＯＣ値を示す情報を生成すること
を行うように構成された、Ｃ３４に記載のデバイス。
［Ｃ３６］実行されたとき、
符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定することと、
プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかをコーディングすることと
をコンピューティングデバイスのプログラマブルプロセッサに行わせる命令を記憶した、コンピュータ可読記憶媒体。
［Ｃ３７］ビデオデータをコーディングするためのデバイスであって、
符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定するための手段と、
プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかをコーディングするための手段と
を備える、デバイス。

Claims

ビデオデータを復号する方法であって、
符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を受信することと、
前記受信された情報に基づいて、プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかを復号することと
を備える、方法。
前記受信された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値と、前記プログレッシブ精緻化セグメントの前記最後のピクチャの前記ＰＯＣ値との間の差分を示すデルタＰＯＣ値を含む、請求項１に記載の方法。
前記受信された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値のＬＳＢと、前記プログレッシブ精緻化セグメントの前記最後のピクチャのＰＯＣ値のＬＳＢとの間の差分を示す最下位ビット（ＬＳＢ）のデルタを含む、請求項１に記載の方法。
前記受信された情報が、前記プログレッシブ精緻化セグメントの前記最後のピクチャに割り当てられたＰＯＣ値を含む、請求項１に記載の方法。
前記情報を受信することが、前記符号化ビットストリームに含まれる補足エンハンスメント情報（ＳＥＩ）メッセージ内の前記情報を受信することを備える、請求項１に記載の方法。
前記ＳＥＩメッセージが、前記プログレッシブ精緻化セグメントの開始境界を示すプログレッシブ精緻化セグメント開始ＳＥＩメッセージを備える、請求項５に記載の方法。
符号化ビデオビットストリーム内で前記プログレッシブ精緻化セグメントの直前にくる符号化ピクチャが、前記プログレッシブ精緻化セグメントに対するベースピクチャを備えると決定すること
をさらに備える、請求項１に記載の方法。
前記プログレッシブ精緻化シーケンス内の前記複数の符号化ピクチャの各々が、前記プログレッシブ精緻化シーケンス内の前記それぞれのピクチャの直前にくる前記符号化ピクチャと比較して、コーディングされるべきピクチャの品質の精緻化を定義する、請求項７に記載の方法。
前記受信された情報を使用して、前記プログレッシブ精緻化セグメント内の前記複数のピクチャのうちの前記最後のピクチャを検出することと、
前記プログレッシブ精緻化動作に従った復号を停止することと
をさらに備える、請求項１に記載の方法。
前記受信された情報に基づいて、前記プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかを復号することが、
前記プログレッシブ精緻化セグメント内の前記最後のピクチャを除いて、前記プログレッシブ精緻化セグメント内の各ピクチャに前記プログレッシブ精緻化動作を適用することを備える、
請求項１に記載の方法。
ビデオデータを符号化する方法であって、
プログレッシブ精緻化動作に従ってプログレッシブ精緻化セグメント内の複数のピクチャのうちの少なくともいくつかのピクチャを符号化することと、
符号化ビットストリーム内の前記プログレッシブ精緻化セグメントの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を生成することと
を備える、方法。
前記生成された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値と、前記プログレッシブ精緻化セグメントの前記最後のピクチャの前記ＰＯＣ値との間の差分を示すデルタＰＯＣ値を含む、請求項１１に記載の方法。
前記生成された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値のＬＳＢと、前記プログレッシブ精緻化セグメントの前記最後のピクチャのＰＯＣ値のＬＳＢとの間の差分を示す最下位ビット（ＬＳＢ）のデルタを含む、請求項１１に記載の方法。
前記生成された情報が、前記プログレッシブ精緻化セグメントの前記最後のピクチャに割り当てられたＰＯＣ値を含む、請求項１１に記載の方法。
前記情報を生成することが、前記符号化ビデオビットストリーム内でシグナリングされるべき補足エンハンスメント情報（ＳＥＩ）メッセージ内に前記情報を含めることを備える、請求項１１に記載の方法。
前記ＳＥＩメッセージが、前記プログレッシブ精緻化セグメントの開始境界を示すプログレッシブ精緻化セグメント開始ＳＥＩメッセージを備える、請求項１５に記載の方法。
符号化ビデオビットストリーム内で前記プログレッシブ精緻化セグメントの直前にくる符号化ピクチャが、前記プログレッシブ精緻化セグメントに対するベースピクチャを備えると決定すること
をさらに備える、請求項１１に記載の方法。
前記プログレッシブ精緻化シーケンス内の前記複数の符号化ピクチャの各々が、前記プログレッシブ精緻化シーケンス内の前記それぞれのピクチャの直前にくる前記符号化ピクチャと比較して、コーディングされるべきピクチャの品質の精緻化を定義する、請求項１７に記載の方法。
前記プログレッシブ精緻化セグメント内の前記複数のピクチャのうちの前記最後のピクチャを検出することと、
前記プログレッシブ精緻化動作に従った符号化を停止することと
をさらに備える、請求項１１に記載の方法。
前記プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかを符号化することが、
前記プログレッシブ精緻化セグメント内の前記最後のピクチャを除いて、前記プログレッシブ精緻化セグメント内の各ピクチャに前記プログレッシブ精緻化動作を適用することを備える、
請求項１１に記載の方法。
ビデオデータをコーディングするためのデバイスであって、
符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定することと、
プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかをコーディングすることと
を行うように構成されたビデオコーダを備える、デバイス。
前記デバイスが、
集積回路、
マイクロプロセッサ、および
前記ビデオコーダを備える通信デバイス
のうちの少なくとも１つを備える、請求項２１に記載のデバイス。
前記決定された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値と、前記プログレッシブ精緻化セグメントの前記最後のピクチャの前記ＰＯＣ値との間の差分を示すデルタＰＯＣ値を含む、請求項２１に記載のデバイス。
前記決定された情報が、前記プログレッシブ精緻化セグメントの直前にくるピクチャのＰＯＣ値のＬＳＢと、前記プログレッシブ精緻化セグメントの前記最後のピクチャのＰＯＣ値のＬＳＢとの間の差分を示す最下位ビット（ＬＳＢ）のデルタを含む、請求項２１に記載のデバイス。
前記決定された情報が、前記プログレッシブ精緻化セグメントの前記最後のピクチャに割り当てられたＰＯＣ値を含む、請求項２１に記載のデバイス。
前記情報を決定するために、前記ビデオコーダが、
前記符号化ビットストリームに含まれる補足エンハンスメント情報（ＳＥＩ）メッセージに少なくとも部分的に基づいて、前記情報を決定すること
を行うように構成された、請求項２１に記載のデバイス。
前記ＳＥＩメッセージが、前記プログレッシブ精緻化セグメントの開始境界を示すプログレッシブ精緻化セグメント開始ＳＥＩメッセージを備える、請求項２６に記載のデバイス。
前記ビデオコーダが、
符号化ビデオビットストリーム内で前記プログレッシブ精緻化セグメントの直前にくる符号化ピクチャが、前記プログレッシブ精緻化セグメントに対するベースピクチャを備えると決定すること
を行うようにさらに構成された、請求項２１に記載のデバイス。
前記プログレッシブ精緻化シーケンス内の前記複数の符号化ピクチャの各々が、前記プログレッシブ精緻化シーケンス内の前記それぞれのピクチャの直前にくる前記符号化ピクチャと比較して、コーディングされるべきピクチャの品質の精緻化を定義する、請求項２８に記載のデバイス。
前記ビデオコーダが、
前記受信された情報を使用して、前記プログレッシブ精緻化セグメント内の前記複数のピクチャのうちの前記最後のピクチャを検出することと、
前記プログレッシブ精緻化動作に従ったコーディングを停止することと
を行うようにさらに構成された、請求項２１に記載のデバイス。
前記プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかをコーディングするために、前記ビデオコーダが、
前記プログレッシブ精緻化セグメント内の前記最後のピクチャを除いて、前記プログレッシブ精緻化セグメント内の各ピクチャに前記プログレッシブ精緻化動作を適用すること
を行うように構成された、請求項２１に記載のデバイス。
前記ビデオコーダがビデオデコーダを備える、請求項２１に記載のデバイス。
前記ビデオデコーダが、
前記受信された情報を使用して、前記プログレッシブ精緻化セグメント内の前記複数のピクチャのうちの前記最後のピクチャを検出することと、
前記プログレッシブ精緻化動作に従った復号を停止することと
を行うようにさらに構成された、請求項３２に記載のデバイス。
前記ビデオコーダがビデオエンコーダを備える、請求項２１に記載のデバイス。
前記プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかをコーディングするために、前記ビデオエンコーダが、
符号化ビットストリーム内の前記プログレッシブ精緻化セグメントの前記最後のピクチャの前記ＰＯＣ値を示す情報を生成すること
を行うように構成された、請求項３４に記載のデバイス。
実行されたとき、
符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定することと、
プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかをコーディングすることと
をコンピューティングデバイスのプログラマブルプロセッサに行わせる命令を記憶した、コンピュータ可読記憶媒体。
ビデオデータをコーディングするためのデバイスであって、
符号化ビットストリーム内のプログレッシブ精緻化セグメント内の複数のピクチャのうちの最後のピクチャのピクチャ順序カウント（ＰＯＣ）値を示す情報を決定するための手段と、
プログレッシブ精緻化動作に従って前記プログレッシブ精緻化セグメント内の前記ピクチャのうちの少なくともいくつかをコーディングするための手段と
を備える、デバイス。