JP6158422B2 - アラインされていないirapピクチャを含み得るマルチレイヤビットストリームのクロスレイヤpocアラインメント - Google Patents

アラインされていないirapピクチャを含み得るマルチレイヤビットストリームのクロスレイヤpocアラインメント Download PDF

Info

Publication number
JP6158422B2
JP6158422B2 JP2016506678A JP2016506678A JP6158422B2 JP 6158422 B2 JP6158422 B2 JP 6158422B2 JP 2016506678 A JP2016506678 A JP 2016506678A JP 2016506678 A JP2016506678 A JP 2016506678A JP 6158422 B2 JP6158422 B2 JP 6158422B2
Authority
JP
Japan
Prior art keywords
picture
value
poc value
poc
reset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016506678A
Other languages
English (en)
Other versions
JP2016518776A (ja
JP2016518776A5 (ja
Inventor
チェン、イン
ワン、イェ−クイ
ラマスブラモニアン、アダルシュ・クリシュナン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2016518776A publication Critical patent/JP2016518776A/ja
Publication of JP2016518776A5 publication Critical patent/JP2016518776A5/ja
Application granted granted Critical
Publication of JP6158422B2 publication Critical patent/JP6158422B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/68Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving the insertion of resynchronisation markers into the bitstream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

関連出願
[0001]本出願は、各々の内容全体が参照により本明細書に組み込まれる、2013年4月8日に出願された米国仮出願第61/809,855号、および2013年7月15日に出願された米国仮出願第61/846,532号の利益を主張する。
[0002]本開示は、ビデオコーディングに関する。
[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップコンピュータまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、携帯電話または衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4、Part10、アドバンストビデオコーディング(AVC)、現在開発中の高効率ビデオコーディング(HEVC)規格によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法など、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および/または記憶し得る。
[0004]ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間的(イントラピクチャ)予測および/または時間的(インターピクチャ)予測を含む。ブロックベースのビデオコーディングでは、ビデオスライス(たとえば、ビデオフレームまたはビデオフレームの一部)は、ツリーブロック、コーディングユニット(CU)、および/またはコーディングノードと呼ばれることもある、ビデオブロックに区分され得る。ピクチャのイントラコード化(I)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化(PまたはB)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。
[0005]空間的予測または時間的予測によって、コーディングされるべきブロックの予測ブロックが生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコーディングされたブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化ブロックは、イントラコーディングモードおよび残差データに応じて符号化される。さらなる圧縮を行うために、残差データがピクセル領域から変換領域に変換されて残差変換係数が得られてよく、次いでこれらの係数が量子化されてよい。最初に2次元アレイで構成される量子化された変換係数は、変換係数の1次元ベクトルを生成するために走査されてよく、なお一層の圧縮を達成するためにエントロピーコーディングが適用されてよい。
[0006]一般に、本開示は、ピクチャのピクチャオーダーカウント(POC:picture order count)値がリセットされるべきかどうかを示すピクチャのシンタックス要素をコード化するための技法について記載する。特に、ビデオコーダ(たとえば、ビデオエンコーダまたはビデオデコーダなど)は、非イントラランダムアクセスポイント(IRAP)ピクチャが、たとえば、異なるビデオコーディングレイヤなど、IRAPピクチャを含むアクセスユニットに含まれるとき、非IRAPピクチャのPOC値がリセットされるべきであることを示す値をコード化することができる。このように、本開示の技法は、異なるビデオコーディングレイヤのピクチャの中でPOC値がアラインされることをも確実にしながら、異なるビデオコーディングレイヤにわたるIRAPピクチャの非アラインメントをサポートすることができる。
[0007]一例では、ビデオデータを復号する方法は、ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すかどうかを決定することと、POC値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、POC値の一部がゼロに等しくなるように、POC値の少なくとも一部をリセットすることと、リセットされたPOC値を使用してビデオデータを復号することとを含む。
[0008]別の例では、ビデオデータを符号化する方法は、ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部をゼロの値にリセットすべきかどうかを決定することと、POC値の少なくとも一部をリセットすることを決定することに応答して、POC値の一部がゼロに等しくなるように、POC値の少なくとも一部をリセットすることと、POC値の少なくとも一部がゼロの値にリセットされるべきであることを示すシンタックス要素の値を符号化し、リセットされたPOC値を使用してビデオデータを符号化することとを含む。
[0009]別の例では、ビデオデータをコード化するためのデバイスは、ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化し、POC値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、POC値の一部がゼロに等しくなるように、POC値の少なくとも一部をリセットし、リセットされたPOC値を使用してビデオデータをコード化するように構成されたビデオコーダを含む。
[0010]別の例では、ビデオデータをコード化するためのデバイスは、ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化するための手段と、POC値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、POC値の一部がゼロに等しくなるように、POC値の少なくとも一部をリセットするための手段と、リセットされたPOC値を使用してビデオデータをコード化するための手段とを含む。
[0011]別の例では、コンピュータ可読記憶媒体は、命令がその上に記憶されており、命令は、実行されると、プログラマブルプロセッサに、ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化させ、POC値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、POC値の一部がゼロに等しくなるように、POC値の少なくとも一部をリセットさせ、リセットされたPOC値を使用してビデオデータをコード化させる。
[0012]1つまたは複数の例の詳細は、添付図面および発明の詳細な説明で以下に示される。他の特徴、目的および利点は、発明の詳細な説明および図面から、ならびに特許請求の範囲から明らかになるであろう。
本開示で説明する1つまたは複数の例による、例示的なビデオ符号化システムとビデオ復号システムとを示すブロック図。 本開示で説明する技法を実施し得る例示的なビデオエンコーダを示すブロック図。 本開示で説明する技法を実施し得る例示的なビデオデコーダを示すブロック図。 コード化ビデオピクチャのシーケンスを示す概念図。 本開示の技法による、ビデオデータを符号化する例示的な方法を示すフローチャート。 本開示の技法による、ビデオデータを復号する例示的な方法を示すフローチャート。
[0019]本開示は、同じピクチャオーダーカウント(POC)値がクロスレイヤアラインされることが保証されるように、新しいコード化ビデオシーケンスを開始することができるアラインされないイントラランダムアクセスポイント(IRAP)ピクチャをサポートするための技法について記載する。技法は、マルチレイヤコーディングにおいて適用され得る。いくつかの開示された方法は、単一レイヤビデオコーディングにも適用され得る。
[0020]特に、アラインされないIRAPピクチャは、アクセスユニットが異なるビデオコーディングレイヤにIRAPピクチャと非IRAPピクチャの両方を含む状況で起こる。コード化ビデオシーケンス(CVS)におけるピクチャは、そのCVSにおけるそれぞれのピクチャを一意に識別するPOC値を有する。ピクチャのPOC値は、一般に、同じCVSにおける他のピクチャに対するピクチャの出力順序を示す。IRAPピクチャは、0のPOC値を有する。したがって、アラインされないIRAPピクチャは、アクセスユニットが異なるPOC値を有するピクチャを含むことにつながる。
[0021]しかしながら、POC値は、レイヤ間参照ピクチャを識別するために使用される。すなわち、レイヤ間予測(すなわち、ビュー間予測)を使用してピクチャがコード化されるとき、ビデオデコーダが参照ピクチャを識別することができるように、参照ピクチャのPOC値がシグナリングされる。POC値がアラインされている場合、すなわち、参照ピクチャのPOC値が現在のピクチャのPOC値と同じであるとき、現在のピクチャがレイヤ間予測されることを決定することは簡単である。ビデオコーディングレイヤ間のピクチャの正しくアラインされていないPOC値は、参照ピクチャの識別をより困難にする。さらに、アクセスユニット境界は、検出が困難となり、エラーを起こしやすい可能性がある。
[0022]したがって、本開示は、共通のアクセスユニットにおけるピクチャのPOC値がクロスアラインされることをも確実にしながら、アラインされないIRAPピクチャを可能にするための技法について記載する。特に、シンタックス要素は、ピクチャのPOC値の少なくとも一部がリセットされる(すなわち、ゼロの値に設定される)べきであることを示し得る。たとえば、ビデオエンコーダは、アクセスユニットがあるレイヤにおけるIRAPピクチャと、別の異なるレイヤにおける非IRAPピクチャとを含むことを決定することができる。したがって、ビデオエンコーダは、非IRAPピクチャのPOC値がリセットされるべきであることをシグナリングし得る。ビデオデコーダは、非IRAPピクチャのPOC値をリセットすることができ、非IRAPピクチャと同じビデオコーディングレイヤにおける他のピクチャのPOC値を変更することもできる。すなわち、ビデオデコーダは、非IRAPピクチャのPOC値と同じレイヤおよび同じCVSにおける他のピクチャのPOC値との間の差が、非IRAPピクチャのPOC値をリセットした後に一定のままであるように、これらの他のピクチャのPOC値を変更することができる。
[0023]このようにしてPOC値を調整することによって、共通のアクセスユニットにおけるすべてのピクチャが同じPOC値を有することが確実にされ得、さらに、IRAPピクチャは、アラインされる必要がない。したがって、アクセスユニット境界の検出は、単純化され、よりエラー耐性(error resilient)を持つようになり得、レイヤ間参照ピクチャの識別も単純化され得る。
[0024]ビデオコーディング規格は、ITU−T H.261と、ISO/IEC MPEG−1 Visualと、ITU−T H.262またはISO/IEC MPEG−2 Visualと、ITU−T H.263と、ISO/IEC MPEG−4 Visualと、それのスケーラブルビデオコーディング(SVC)およびマルチビュービデオコーディング(MVC)拡張を含む(ISO/IEC MPEG−4 AVCとしても知られる)ITU−T H.264とを含む。
[0025]最近、新しいビデオコーディング規格、すなわち高効率ビデオコーディング(HEVC)の設計が、ITU−T Video Coding Experts Group(VCEG)およびISO/IEC Motion Picture Experts Group(MPEG)のJoint Collaboration Team on Video Coding(JCT−VC)によって確定された。以下でHEVC WD10と呼ぶ、最新のHEVCドラフト仕様が、http://phenix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zipから入手可能である。
[0026]また、HEVCのマルチビュー拡張、すなわちMV−HEVCがJCT−3Vによって開発されている。以下でMV−HEVC WD3と呼ぶ、MV−HEVCの最近のワーキングドラフト(WD)は、http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/3_Geneva/wg11/JCT3V-C1004-v4.zipから入手可能である。
[0027]SHVCと称するHEVCのスケーラブル拡張も、JCT−VCによって開発されている。以下でSHVC WD1と呼ぶ、SHVCの最近のワーキングドラフト(WD)が、http://phenix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1008-v1.zipから入手可能である。
[0028]本明細書は、(コード化)ピクチャ、アクセスユニット(AU)、IRAP AU、コード化ビデオシーケンス(CVS)、およびビットストリームの以下の概念を想定するが、これらの方法は、これらの仮定の一部が変更される場合も適用される。
−(コード化)ピクチャ:現在の(コード化)ピクチャの定義と同様、コード化ピクチャは、SVCにおけるレイヤ表現、MVCにおけるビュー構成要素、およびMVC+Dにおけるテクスチャまたは深さビュー構成要素に等しい。
− アクセスユニット:SVCおよびMVCと同様、AUは、同じ出力時間およびそれらの関連の非VCL NALユニットに関連するすべてのコード化ピクチャから成る。
− IRAPアクセスユニット:すべてのコード化ピクチャがIRAPピクチャであるアクセスユニット。
− コード化ビデオシーケンス(CVS):NoRaslOutputFlagが1に等しいIRAPアクセスユニットと、その後に、NoRaslOutputFlagが1に等しいIRAPアクセスユニットである以後のアクセスユニットまで、ただしその以後のアクセスユニットを含まない、のすべての以後のアクセスユニットを含む、NoRaslOutputFlagが1に等しいIRAPアクセス可能ユニットではない0個以上のアクセスユニットとで、復号順に構成されるアクセスユニットのシーケンスである。
○ 用語がHEVC WD10の場合と同じであることに留意されたい。
− ビットストリーム:1つまたは複数のCVSの表現を形成するNALユニットストリームまたはバイトストリームの形のビットのシーケンス。
○ ビットストリームにおける第1のAUは、(上記で定義されたように)IRAP AUであるものとする。
[0029]瞬間デコーダリフレッシュ(IDR)ピクチャ、クリーンランダムアクセス(CRA)ピクチャ、およびリンク切断アクセス(BLA)ピクチャは、まとめてIRAPピクチャと呼ばれる。IRAPピクチャのクロスレイヤアラインメントを必要とすることは、いくつかの有利な使用シナリオを否認することになる。たとえば、2レイヤビットストリームにおいて、拡張レイヤよりもベースレイヤにより多くのIRAPピクチャがあるとき、ブロードキャストおよびマルチキャストの用途で、低遅延同調と同時に、高コーディング効率が達成され得る。したがって、アラインされないIRAPピクチャを可能にすることが望ましい。
[0030]しかしながら、あるピクチャ(picA)が、NoRaslOutputFlagが1に等しいIRAPピクチャであり、同じアクセスユニットにおける別のピクチャ(picB)が、NoRaslOutputFlagが1に等しいIRAPピクチャではないとき、picAを含むレイヤにおけるピクチャ(picC)のPOC値は、picBを含むレイヤにおけるピクチャ(picD)のPOC値とは異なり得、ここにおいて、picCおよびpicDは、同じアクセスユニットにあり、picCはpicAであってもよく、またはそうでなくてもよい(および、したがって、picDはpicBであってもよく、またはそうでなくてもよい)。これは、NoRaslOutputFlagが1に等しい各IRAPピクチャが、NoRaslOutputFlagが1に等しいIRAPピクチャのためにシグナリングまたは導出されるPOCの最下位ビット(LSB)に等しくなるようにPOC値をリセットするためである。
[0031]これによって、POC値がクロスアラインされるときと比較して、レイヤ間予測によるマルチレイヤビデオコーディングにおける参照ピクチャの識別ではより困難になる。たとえば、MV−HEVC WD3では、POCは、レイヤ間参照ピクチャを識別するために、2次元識別のうちの1つとして使用される。
[0032]さらに、このことは、アクセスユニット(AU)境界検出をより困難にし、エラー耐性がなくなる。たとえば、AU1が、それぞれベースレイヤと拡張レイヤにおけるpicAとpicBとから成り、AU2が、それぞれベースレイヤと拡張レイヤにおけるpicCとpicDとから成り、AU1は、復号順でAU2に先行すると仮定する。次いで、picBとpicCの両方が紛失した場合、受信されたpicAおよびpicDがコード化ピクチャに基づいて2つの異なるAUに属することを、デコーダが認識する方法がない。同じ例で、AU2が拡張レイヤにおけるpicDのみから成り、一方picCが決して存在しない場合、1つのピクチャ、すなわちpicBのみが紛失したときでも、同じ問題が起きることになる。
[0033]本開示は、NoRaslOutputFlagが1に等しいIRAPピクチャの非クロスアラインメントを可能にすると同時に、すべてのAUについてのPOC値のクロスアラインメントをそれと同時に提供する技法について記載する。
[0034]図1は、本開示で説明する1つまたは複数の例による、例示的なビデオ符号化システムとビデオ復号システムとを示すブロック図である。たとえば、システム10はソースデバイス12と宛先デバイス14とを含む。ソースデバイス12および宛先デバイス14は、本開示で説明する技法を実装するように構成される。いくつかの例では、システム10は、たとえば、WD10およびその拡張、たとえばMV−HEVC WD3、SHVC WD1などに記載されている拡張などに記載されるように、HEVC規格に従って符号化されるビデオデータなど、符号化されたビデオデータの符号化、送信、記憶、復号、および/または提示をサポートするように構成され得る。しかしながら、本開示に記載された技法は、他のビデオコーディング規格または他の拡張に適用可能であり得る。
[0035]図1に示されるように、システム10は、宛先デバイス14によって後の時間で復号されるべき符号化されたビデオデータを生成するソースデバイス12を含む。ソースデバイス12および宛先デバイス14は、デスクトップコンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備える場合がある。場合によっては、ソースデバイス12および宛先デバイス14はワイヤレス通信のために装備され得る。
[0036]宛先デバイス14は、リンク16を介して、復号されるべき符号化されたビデオデータを受信し得る。リンク16は、ソースデバイス12から宛先デバイス14に符号化されたビデオデータを移すことが可能な任意のタイプの媒体またはデバイスを備えることができる。一例では、リンク16は、ソースデバイス12が、符号化されたビデオデータをリアルタイムで宛先デバイス14に直接送信することを可能にするための通信媒体を備え得る。符号化されたビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス14に送信され得る。通信媒体は、高周波(RF)スペクトルあるいは1つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワークなどのパケットベースのネットワーク、またはインターネットなどのグローバルネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス12から宛先デバイス14への通信を促進するために有用であり得る、任意の他の機器を含み得る。
[0037]代替的に、符号化されたデータは、出力インターフェース22からストレージデバイス34に出力され得る。同様に、符号化されたデータは、入力インターフェースによってストレージデバイス34からアクセスされ得る。ストレージデバイス34は、ハードドライブ、Blu−ray(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、揮発性もしくは不揮発性メモリ、または符号化されたビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散したまたはローカルでアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイス34は、ソースデバイス12によって生成された符号化されたビデオを保持できるファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス14は、ストリーミングまたはダウンロードを介して、ストレージデバイス34から記憶されたビデオデータにアクセスすることができる。ファイルサーバは、符号化されたビデオデータを記憶し、その符号化されたビデオデータを宛先デバイス14に送信することが可能な任意のタイプのサーバとすることができる。例示的なファイルサーバは、ウェブサーバ(たとえば、ウェブサイトのための)、FTPサーバ、ネットワーク接続記憶(NAS)デバイス、または局所的なディスクドライブを含む。宛先デバイス14は、インターネット接続を含む任意の標準的なデータ接続を通じて、符号化されたビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化されたビデオデータにアクセスするのに適しているワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、ワイヤード接続(たとえば、DSL、ケーブルモデムなど)、または両方の組合せを含むことができる。ストレージデバイス34からの符号化されたビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。
[0038]本開示の技法は、ワイヤレスの用途または設定には限定されない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の用途などの様々なマルチメディアの用途のいずれかをサポートするビデオコーディングに適用することができる。いくつかの例では、システム10は、ビデオストリーミング、ビデオプレイバック、ビデオブロードキャスティングおよび/またはビデオ電話通信などの適用例をサポートするために、一方向または二方向のビデオ伝送をサポートするように構成され得る。
[0039]図1の例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む。場合によっては、出力インターフェース22は、変調器/復調器(モデム)および/または送信機を含んでよい。ソースデバイス12において、ビデオソース18は、ビデオキャプチャデバイス、たとえばビデオカメラ、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および/もしくはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムのようなソース、またはそのようなソースの組合せを含み得る。一例として、ビデオソース18がビデオカメラである場合、ソースデバイス12および宛先デバイス14は、いわゆるカメラ付き電話またはビデオ電話を形成することができる。しかし、本開示に記載された技法は、ビデオコーディング全般に適用可能であってよく、ワイヤレスアプリケーションおよび/または有線アプリケーションに適用されてよい。
[0040]キャプチャされたビデオ、プリキャプチャされたビデオ、またはコンピュータにより生成されたビデオは、ビデオエンコーダ20によって符号化され得る。符号化されたビデオデータは、ソースデバイス12の出力インターフェース22を介して宛先デバイス14に直接送信され得る。符号化されたビデオデータはさらに(または代替として)、以後の宛先デバイス14またはその他の装置によるアクセス、復号、および/または再生が可能なようにストレージデバイス34上に記憶されてよい。
[0041]宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。場合によっては、入力インターフェース28は、受信機および/またはモデムを含んでよい。宛先デバイス14の入力インターフェース28は、リンク16を介して、符号化されたビデオデータを受信する。リンク16を介して通信され、またはストレージデバイス34上に提供された符号化されたビデオデータは、ビデオデータを復号する際にビデオデコーダ30などのビデオデコーダが使用するための、ビデオエンコーダ20によって生成された様々なシンタックス要素を含み得る。そのようなシンタックス要素は、通信媒体上で送信され記憶媒体上に記憶される符号化されたビデオデータとともに含まれ得、またはファイルサーバを記憶した。
[0042]ディスプレイデバイス32は、宛先デバイス14と一体化されること、またはその外部に存在することがある。いくつかの例では、宛先デバイス14は、集積ディスプレイデバイスを含むことができ、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス14はディスプレイデバイスであってよい。一般に、ディスプレイデバイス32は、復号されたビデオデータをユーザに表示し、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなどの様々なディスプレイデバイスのいずれかを備える場合がある。
[0043]ビデオエンコーダ20およびビデオデコーダ30は、代替的にMPEG4、Part10、アドバンストビデオコーディング(AVC)と呼ばれるITU−T H.264規格などのビデオ圧縮規格、またはそのような規格の拡張に従って動作し得る。代替的に、ビデオエンコーダ20およびビデオデコーダ30は、現在開発中の高効率ビデオコーディング(HEVC)規格、HEVC規格の拡張など他のプロプライエタリ規格または業界規格に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例としては、MPEG−2およびITU−T H.263がある。
[0044]図1には示されていないが、いくつかの態様では、ビデオエンコーダ20およびビデオデコーダ30は、それぞれオーディオエンコーダおよびデコーダと統合され得、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するために、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含み得る。MUX−DEMUXユニットは、適用可能な場合、いくつかの例において、ITU H.223マルチプレクサプロトコル、またはユーザデータプロトコル(UDP)などの他のプロトコルに適合してよい。
[0045]本開示の技法によれば、ビデオエンコーダ20およびビデオデコーダ30は、ピクチャのピクチャオーダーカウント(POC)値が部分的にまたは完全にリセットされるべきかどうかを示すシンタックス要素の値をコード化するように構成され得る。部分的なリセットは、POC値の一部、たとえば、最上位ビット(MSB)のみをゼロに等しくなるように設定することに対応し得る。完全なリセットは、POC値のすべてのビットをゼロに等しくなるように設定することに対応し得る。したがって、ピクチャのPOC値が部分的にまたは完全にリセットされるべきであることをシンタックス要素が示すとき、ビデオデコーダ30は、POC値の対応するビットをゼロにリセットすることができる。
[0046]加えて、ビデオデコーダ30は、POC値がリセットされたピクチャと同じレイヤにおける他のピクチャのPOC値のビットも、これらの他のピクチャのPOC値間の差が、リセット後とリセットの前と同じままであるように設定し得る。たとえば、N個の他のピクチャの各々について、ビデオデコーダ30は、差Diを決定することができ、ここにおいて、iは、両端値を含む0とN−1との間であり、これらの他のピクチャのうちの1つを表す。この例では、ビデオデコーダ30は、Di=POCbase−POCiを計算することができ、ここにおいて、「base」とは、POC値がリセットされたピクチャを指す。次いで、ビデオデコーダ30は、POCi_decremented+Di=POCbase_resetとなるようにデクリメントし得、ここにおいて、POCi_decrementedは、ピクチャiのデクリメントされたPOC値を表し、POCbase_resetは、POCbaseのリセット値を表す。リセットされるべきピクチャのPOC値がゼロに設定される例において、ビデオデコーダ30は、ピクチャの最初の(すなわち、リセットの前の)POC値だけ、同じCVSおよび同じビデオコーディングレイヤにおける他のピクチャのPOC値をデクリメントし得る。代替的に、ビデオデコーダ30は、同じCVSおよび同じビデオコーディングレイヤにおける他のピクチャのPOC値を、POC値がリセットされるべきピクチャの最初のPOC値と他のピクチャのPOC値との間の差(すなわち、Diに等しい)に等しくなるように設定することができる。
[0047]1組の例では、第1のフラグは、POC値がPOCの最下位ビット(LSB)に等しくなるようにリセットされる、すなわち、POCの最上位ビット(MSB)が0に等しくなるようにリセットされるかどうかを指定するために、スライスヘッダに追加され、そうである場合、同じレイヤおよび復号ピクチャバッファ(DPB)における現在のピクチャおよび任意のピクチャのPOC値間の差は、第1のフラグが別の場合を示す場合と同じままであるように、現在のピクチャと同じレイヤ、およびDPBにおけるすべてのピクチャのPOC値がデクリメントされる。
[0048]この組の例では、第2のフラグは、POC LSBが0に等しくなるようにリセットされるかどうかを指定するために、スライスヘッダに追加され得る。第1のフラグとともに使用されるとき、第2のフラグは、エンコーダが異なるレイヤにおけるピクチャのPOC LSBの異なる値を自由に割り振ることができるようにする。この組の例は、NoRaslOutputFlagが1に等しいIRAPピクチャの非クロスアラインメントを可能にすると同時に、すべてのAUについてのPOC値のクロスアラインメントをそれと同時に保証し、ここにおいて、NoRaslOutputFlagが1に等しいIRAPピクチャは、IRAPピクチャの3つのタイプ、すなわち、IDR、CRA、およびBLAピクチャのうちの任意のものであり得る。
[0049]別の組の例では、IDRピクチャがアクセスユニットにおいてアラインされないとき、そのAUにおける少なくとも1つのピクチャがIDRピクチャである場合、IDRピクチャと同様に、あるアクセスユニットにおけるすべてのピクチャのPOC値が0に設定されることが提案される。これは、NoRaslOutputFlagが1に等しいIRAPピクチャの非クロスアラインメントを可能にすると同時に、すべてのAUについてのPOC値のクロスアラインメントをそれと同時に保証し、ここにおいて、NoRaslOutputFlagが1に等しいIRAPピクチャは、IRAPピクチャである。より具体的には、以下は、この組の例に当てはまる。
1. フラグ、すなわち、idr_au_present_flagは、たとえば、slice_reserved_flag[ i ]を有するスライスヘッダの最初にシグナリングされるビットの一部であるスライスヘッダでシグナリングされる。
a.nuh_layer_idが0よりも大きいピクチャでは、それがIDRピクチャについて行われるとき、1に等しいフラグは、POC値が0にリセットされることを示し、0に等しいフラグは、POC値がリセットされないことを示す。
2. IDRピクチャでは、このフラグは、他の目的のために使用され得る、または、1となるように予約され得る、または、欠けているが、1に等しいと推測され得る。
[0050]両方の組の例について、nuh_layer_idが0に等しいピクチャでは、フラグは、HEVCバージョン1のデコーダ(HEVC WD10に基づく1レイヤ2Dデコーダ)ではどんな効果も現れず、したがって、デコーダは、フラグを無視する。
[0051]以下、これらの例示的な技法の詳細な実施形態の様々な例について説明する。以下では、規格の提案された変更が強調されており、イタリック体のテキストは、追加を表し、[removed:“”]は、規格の以前のバージョンに関する削除を表す。一般に、ビデオエンコーダ20および/またはビデオデコーダ30は、本開示の技法を実行するように構成され得る。本開示は、「ビデオコーダ」をこれらの技法を実行するものとして説明する。ビデオエンコーダという用語は、ビデオエンコーダ20のようなビデオエンコーダ、または、ビデオデコーダ30のようなビデオデコーダを指し得ることを理解されたい。同様に、「ビデオコーディング」という用語は、ビデオ符号化および/またはビデオ復号を指すことがある。ビデオエンコーダ20またはビデオデコーダ30などのビデオコーダは、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。いくつかの技法がビデオデコーダの観点から記載されている場合、ビデオエンコーダは、同じまたは類似の(たとえば、逆の)技法を実行することができる。同様に、いくつかの技法がビデオエンコーダの観点から記載されている場合、ビデオデコーダは、同じまたは類似の(たとえば、逆の)技法を実行することができる。
[0052]以下、本開示の技法による第1の例について説明する。この例は、以下、実施例1と呼ばれる。以下のシンタックスおよびセマンティクスは、一般に、HEVC WD10における対応するセクションを指す。上述のように、強調は、提案された追加を示し、取り消し線は、提案された削除を示す。
例1
[0053]以下、一般のスライスセグメントヘッダのシンタックスおよびセマンティクスについて最初に説明する。
Figure 0006158422
[0054]以下、一般のスライスセグメントヘッダのセマンティクスについて説明する。上述のように、イタリック体のテキストは、提案された追加を示し、[removed:“”]は、提案された削除を示す。変更されていないシンタックス要素のセマンティクスは、規格の以前のバージョンに記載されているセマンティクスと同じのままであり得る。
[0055]1に等しいpoc_msb_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントがslice_pic_order_cnt_lsbに等しいことを指定する。0に等しいpoc_msb_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントがslice_pic_order_cnt_lsbに等しくても等しくなくてもよいことを指定する。
[0056]存在するとき、現在のピクチャはNoRaslOutputFlagが1に等しいIRAPピクチャではなく、現在のアクセスユニットにおける少なくとも1つのピクチャはNoRaslOutputFlagが1に等しいIRAPピクチャであるとき、poc_msb_reset_flagの値は1に等しいものとする。
[0057]存在しないとき、poc_msb_reset_flagの値は0に等しくなると推測される。
[0058]1に等しいpoc_lsb_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントが0に等しいことを指定する。0に等しいpoc_lsb_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントが0に等しくても等しくなくてもよいことを指定する。
[0059]存在するとき、現在のピクチャはIDRピクチャではなく、現在のアクセスユニットにおける少なくとも1つのピクチャがIDRピクチャであるとき、poc_lsb_reset_flagの値は1に等しいものとする。
[0060]存在しないとき、poc_lsb_reset_flagの値は0に等しくなると推測される。
[0061]したがって、ビデオエンコーダ20は、IRAPピクチャではなく、たとえば、異なるビデオコーディングレイヤにおいてIRAPピクチャを含むアクセスユニットにあるピクチャについて1の値を有するように、poc_msb_reset_flagを設定することができる。同様に、ビデオデコーダ30は、IRAPピクチャではないピクチャについて1の値を受信すると、ピクチャのPOC値のMSBの値をリセットし、必要に応じて同じレイヤおよび同じコード化ビデオシーケンスにおける他のピクチャのPOC値を調整することができる。
[0062]以下、一般の復号プロセスのセマンティクスについて説明する。ビデオデコーダ30は、後述するように、ビデオデータを復号するように構成され得る。ビデオエンコーダ20は、後述されるものに対する逆のプロセスに従ってビデオデータを符号化するように構成され得る。上述のように、以下の変更は、HEVC WD10の対応する部分に関して行われ得る。イタリック体のテキストは、提案された追加を示し、[removed:“”]は、提案された削除を示す。
一般の復号プロセス
このプロセスへの入力は、ビットストリームである。このプロセスの出力は、復号されたピクチャのリストである。
復号されるNALユニットのnuh_layer_id値のリストをnuh_layer_id値の昇順に指定するレイヤ識別子リストTargetDecLayerIdListは、次のように指定される。
− 本明細書において指定されていない何らかの外部手段が、TargetDecLayerIdListを設定するために利用可能である場合、TargetDecLayerIdListは、外部手段によって設定される。
− それ以外の場合、復号プロセスが、C.1項に指定されたように、ビットストリームコンフォーマンステストで呼び出される場合、TargetDecLayerIdListは、C.1項に指定されたように設定される。
− それ以外の場合、TargetDecLayerIdListは、0に等しい1つのnuh_layer_id値のみを含む。
復号される最も高い時間的サブレイヤを識別する変数HighestTidは、次のように指定される。
− 本明細書において指定されていない何らかの外部手段が、HighestTidを設定するために利用可能である場合、HighestTidは、外部手段によって設定される。
− それ以外の場合、復号プロセスが、C.1項に指定されたように、ビットストリームコンフォーマンステストで呼び出される場合、HighestTidは、C.1項に指定されたように設定される。
− それ以外の場合、HighestTidは、sps_max_sub_layers_minus1に等しくなるように設定される。
10節で指定されるサブビットストリーム抽出プロセスは、ビットストリーム、HighestTid、およびTargetDecLayerIdListが入力として適用され、出力は、BitstreamToDecodeと呼ばれるビットストリームに割り当てられる。
この項の残りに指定される復号プロセスは、現在のピクチャと呼ばれ、BitstreamToDecodeで変数CurrPicによって示される各コード化ピクチャに適用される。
chroma_format_idcの値に応じて、現在のピクチャのサンプルアレイの数は、次のように示される。
− chroma_format_idcが0に等しい場合、現在のピクチャは、1つのサンプルアレイSLから成る。
− それ以外の場合(chroma_format_idcが0に等しくない場合)、現在のピクチャは、3つのサンプルアレイSL、SCb、SCrから成る。
現在のピクチャの復号プロセスは、7節からシンタックス要素および大文字の変数を入力として取得する。各NALユニットにおける各シンタックス要素のセマンティクスを解釈するとき、「ビットストリーム」という用語(またはその一部、たとえば、ビットストリームのCVS)は、BitstreamToDecode(またはその一部)を指す。
復号プロセスは、すべてのデコーダが数値的に同一のクロッピングされた復号ピクチャを生成するように指定される。(指定されるように、正しい出力順序または出力タイミングを有する)本明細書で説明するプロセスによって生成されるものに対する同一のクロッピングされた復号ピクチャを生成する任意の復号プロセスは、本明細書の復号プロセス要件に適合する。
現在のピクチャがIRAPピクチャであるとき、以下のことが当てはまる。
− 現在のピクチャがIDRピクチャまたはBLAピクチャである場合、変数NoRaslOutputFlagは1に等しくなるように設定される。
− それ以外の場合(現在のピクチャがCRAピクチャである場合)、以下のことが当てはまる。
− 現在のピクチャが復号順でビットストリームにおける第1のピクチャである場合、または、復号順でシーケンスNALユニットの最後に続く第1のピクチャである場合、同じアクセスユニットにおけるすべてのピクチャは、CRAピクチャであるものとし、変数NoRaslOutputFlagは1に等しくなるように設定される。
− それ以外の場合、本明細書において指定されていない何らかの外部手段が、変数HandleCraAsBlaFlagを現在のピクチャのある値に設定するために利用可能である場合、変数HandleCraAsBlaFlagは、外部手段によって与えられた値に等しくなるように設定され、変数NoRaslOutputFlagは、HandleCraAsBlaFlagに等しくなるように設定される。この場合、現在のアクセスユニットにおける1つの非CRAピクチャがあるとき、現在のピクチャのHandleCraAsBlaFlagの値は1に等しくないものとする。
− それ以外の場合、変数HandleCraAsBlaFlagは0に等しくなるように設定され、変数NoRaslOutputFlagは0に等しくなるように設定される。
現在のピクチャが0に等しいnuh_layer_idを有するとき、8.1.1項に指定されるように、nuh_layer_idが0に等しいコード化ピクチャについての復号プロセスが呼び出される。
[0063]以下、nuh_layer_idが0に等しいコード化ピクチャについての復号プロセスのセマンティクスについて説明する。ビデオデコーダ30は、後述するように、ビデオデータを復号するように構成され得る。ビデオエンコーダ20は、後述されるものに対する逆のプロセスに従ってビデオデータを符号化するように構成され得る。
nuh_layer_idが0に等しいコード化ピクチャについての復号プロセス
現在のピクチャが、BLA_W_LPに等しいnal_unit_typeを有するBLAピクチャであるか、またはCRAピクチャであるとき、以下のことが当てはまる。
− 本明細書において指定されていない何らかの外部手段が、変数UseAltCpbParamsFlagをある値に設定するために利用可能である場合、UseAltCpbParamsFlagは、外部手段によって与えられた値に等しくなるように設定される。
− それ以外の場合、UseAltCpbParamsFlagの値は0に等しくなるように設定される。
[removed:「現在のピクチャがIRAPピクチャであるとき、以下のことが当てはまる。
− 特定のnuh_layer_idを有する現在のピクチャがIDRピクチャ、BLAピクチャ、復号順でビットストリームにおけるその特定のnuh_layer_idを有する第1のピクチャ、または復号順でシーケンスNALユニットの最後に続くその特定のnuh_layer_idを有する第1のピクチャである場合、変数NoNoRaslOutputFlagは、1に等しくなるように設定される。
− それ以外の場合、本明細書において指定されていない何らかの外部手段が、変数HandleCraAsBlaFlagを現在のピクチャのある値に設定するために利用可能である場合、変数HandleCraAsBlaFlagは、外部手段によって与えられた値に等しく設定され、変数NoRaslOutputFlagは、HandleCraAsBlaFlagに等しくなるように設定される。
− それ以外の場合、変数HandleCraAsBlaFlagは0に等しくなるように設定され、変数NoRaslOutputFlagは0に等しくなるように設定される。”]
separate_colour_plane_flagの値に応じて、復号プロセスは、次のように構築される。
− separate_colour_plane_flagが0に等しい場合、復号プロセスは、出力される現在のピクチャに関して、単一回呼び出される。
− それ以外の場合(separate_colour_plane_flagが1に等しい)、復号プロセスは、3回呼び出される。復号プロセスへの入力は、colour_plane_idの同じ値を有するコード化ピクチャのすべてのNALユニットである。colour_plane_idの特定の値を有するNALユニットの復号プロセスは、あたかもcolour_plane_idのその特定の値を有するモノクロカラーフォーマットを有するCVSのみがビットストリームに存在するかのように指定される。3つの復号プロセスの各々の出力は、現在のピクチャの3つのサンプルアレイのうちの1つに割り当てられ、0、1、および2に等しいcolour_plane_idを有するNALユニットがそれぞれSL、SCb、およびSCrに割り当てられる。
注意−separate_colour_plane_flagが1に等しく、chroma_format_idcが3に等しいとき、変数ChromaArrayTypeが0に等しいものとして導出される。復号プロセスでは、この変数の値が評価され、モノクロピクチャ(chroma_format_idcが0に等しいとき)のものと同一の動作をもたらす。
復号プロセスは、現在のピクチャCurrPicについて、次のように動作する。
1. NALユニットの復号は、8.2項に指定されている。
2. 8.3項におけるプロセスは、スライスセグメントレイヤ以上におけるシンタックス要素を使用した以下の復号処理を指定する。
− ピクチャオーダーカウントに関する変数および関数は、8.3.1項で導出される。これは、ピクチャの第1のスライスセグメントについてのみ、呼び出される必要がある。
− 8.3.2項におけるRPSについての復号プロセスが呼び出され、ここにおいて、参照ピクチャは、「参照のために使用されない」または「長期の参照のために使用される」として標識され得る。これは、ピクチャの第1のスライスセグメントについてのみ、呼び出される必要がある。
− 現在のピクチャがBLAピクチャである、またはNoRaslOutputFlagが1に等しいCRAピクチャであるとき、8.3.3項に指定されている利用不可能な参照ピクチャを生成するための復号プロセスが呼び出され、これは、ピクチャの第1のスライスセグメントのためだけに呼び出される必要がある。
− PicOutputFlagは、次のように設定される。
− 現在のピクチャがRASLピクチャであり、関連のIRAPピクチャのNoRaslOutputFlagが1に等しい場合、PicOutputFlagは、0に等しくなるように設定される。
− それ以外の場合、PicOutputFlagはpic_output_flagに等しくなるように設定される。
− 各PまたはBスライスのための復号プロセスの最初に、8.3.4項に指定されている参照ピクチャリスト構造のための復号プロセスは、参照ピクチャリスト0(RefPicList0)の導出のために、およびBスライスを復号化するとき、参照ピクチャリスト1(RefPicList1)の導出のために呼び出される。
3. 8.4、8.5、8.6、および8.7項におけるプロセスは、すべてのシンタックス構造レイヤにおけるシンタックス要素を使用した復号プロセスを指定する。ピクチャのコード化スライスがピクチャのコーディングツリーユニットごとにスライスセグメントデータを含むことがビットストリームコンフォーマンスの要件であり、したがって、ピクチャのスライスへの分割、スライスのスライスセグメントへの分割、およびスライスセグメントのコーディングツリーユニットへの分割は、ピクチャの区分を形成する。
4. 現在のピクチャのすべてのスライスが復号された後、復号されたピクチャは、「短期の参照のために使用される」として標識される。
[0064]以下、ピクチャオーダーカウントについての復号プロセスのセマンティクスについて説明する。
ピクチャオーダーカウントについての復号プロセス
このプロセスの出力は、PicOrderCntValであり、現在のピクチャのピクチャオーダーカウントである。
ピクチャオーダーカウントは、マージモードおよび動きベクトル予測で動きパラメータを導出するため、およびデコーダコンフォーマンスチェックのために、ピクチャを識別するために使用される(C.5項を参照)。
各コード化ピクチャは、PicOrderCntValと示されるピクチャオーダーカウント変数に関連付けられる。
現在のピクチャが、NoRaslOutputFlagが1に等しいIRAPピクチャでないとき、変数prevPicOrderCntLsbおよびprevPicOrderCntMsbは、次のように導出される。
− prevTid0Picが、0に等しいTemporalIdおよび現在のピクチャのnuh_layer_idに等しいnuh_layer_idを有し、RASLピクチャ、RADLピクチャ、またはサブレイヤ非参照ピクチャではない復号順の前のピクチャであるとし、prevPicOrderCntが、prevTid0PicのPicOrderCntValに等しいとする。
− 変数prevPicOrderCntLsbは、prevPicOrderCnt&(MaxPicOrderCntLsb−1)に等しくなるように設定される[removed:“prevTid0Picのslice_pic_order_cnt_lsb”]。
− 変数prevPicOrderCntMsbは、prevPicOrderCnt−prevPicOrderCntLsbに等しくなるように設定される[removed:“prevTid0PicのPicOrderCntMsb”]。
現在のピクチャの変数PicOrderCntMsbは次のように導出される。
− 現在のピクチャが、NoRaslOutputFlagが1に等しいIRAPピクチャである場合、PicOrderCntMsbは0に等しくなるように設定される。
− それ以外の場合、PicOrderCntMsbは次のように導出される。
Figure 0006158422
PicOrderCntValは次のように導出される。
Figure 0006158422
注意1−slice_pic_order_cnt_lsbがIDRピクチャについて0であると推測されるので、すべてのIDRピクチャは、0に等しいPicOrderCntValを有し、prevPicOrderCntLsbとprevPicOrderCntMsbの両方は、0に等しくなるように設定される。
poc_msb_reset_flagが1に等しいとき、DPBにあり、現在のピクチャと同じレイヤに属する各ピクチャのPicOrderCntValは、PicOrderCntMsbだけデクリメントされる。
poc_lsb_reset_flagが1に等しいとき、DPBにあり、現在のピクチャと同じレイヤに属する各ピクチャのPicOrderCntValは、slice_pic_order_cnt_lsbだけデクリメントされる。
PicOrderCntValの値は、両端値を含む231〜231−1の範囲内であるものとする。あるCVSにおいて、同じレイヤの任意の2つのコード化ピクチャのPicOrderCntVal値は、同じでないものとする。
関数PicOrderCnt(picX)は、次のように指定される。
PicOrderCnt(picX)=ピクチャpicXのPicOrderCntVal (8-3)
関数DiffPicOrderCnt(picA,picB)は、次のように指定される。
DiffPicOrderCnt(picA,picB)=PicOrderCnt(picA)− PicOrderCnt(picB) (8-4)
ビットストリームは、両端値を含む−215〜215−1の範囲内ではない、復号プロセスにおいて使用されるDiffPicOrderCnt(picA,picB)の値を生じるデータを含まないものとする。
注意2−Xを現在のピクチャとし、YおよびZを同じシーケンス中の2つの他のピクチャとし、YおよびZは、DiffPicOrderCnt(X,Y)とDiffPicOrderCnt(X,Z)の両方が正であり、または両方が負であるとき、Xからの同じ出力順方向であると見なされる。
参照ピクチャセットのための復号プロセス
このプロセスは、スライスヘッダの復号の後で、ただしどのコーディングユニットの復号にも先立って、および8.3.3項において指定されるようなスライスの参照ピクチャリスト構築のための復号プロセスに先立って、ピクチャごとに一度呼び出される。このプロセスは、「参照のために使用されない」または「長期の参照のために使用される」として標識されているDPBにおける1つまたは複数の参照ピクチャをもたらし得る。
注意1−RPSは、現在および将来のコード化ピクチャの復号プロセスにおいて使用される、参照ピクチャの絶対的記述である。RPSシグナリングは、RPSに含まれるすべての参照ピクチャが明確にリストされるという点で、明示的である。
DPBにおける復号されたピクチャは、「参照のために使用されない」、「短期の参照のために使用される」、または「長期の参照のために使用される」と標識され得るが、復号プロセスの動作の間の所与の瞬間にはこれら3つの間の1つのみマークされ得る。これらの標識のうちの1つをピクチャに割り当てることは、適用可能であるとき、これらの標識のうちの別のものを暗黙的に除去する。ピクチャが「参照のために使用される」ものとして標識されるものとして言及される場合、このことは、「短期の参照のために使用される」または「長期の参照のために使用される」(ただし両方ではない)ものとして標識されているピクチャに集合的に言及する。
現在のピクチャが、NoRaslOutputFlagが1に等しいIRAPピクチャであるとき、(あるとしたら)現在DPBにあるすべての参照ピクチャは、「参照のために使用されない」として標識される。
短期参照ピクチャは、そのPicOrderCntVal値によって識別される。長期参照ピクチャは、そのPicOrderCntVal値またはそれらのslice_pic_order_cnt_lsb値によって識別される。
ピクチャオーダーカウント値の5つのリストは、RPSを導出するために構築される。これらの5つのリストは、それぞれ要素のNumPocStCurrBefore、NumPocStCurrAfter、NumPocLtFoll、NumPocLtCurr、およびNumPocLtFoll番号を有するPocStCurrBefore、PocStCurrAfter、PocStFoll, PocLtCurr、およびPocLtFollである。5つのリストおよび5つの変数は、次のように導出される。
− 現在のピクチャがIDRピクチャである場合、PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr、およびPocLtFoll areがすべて空に設定され、NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr、およびNumPocLtFollがすべて0に等しくなるように設定される。
− それ以外の場合、以下が適用される。
Figure 0006158422
ここで、PicOrderCntValは、8.3.1項において指定されている現在のピクチャのピクチャオーダーカウントである。
注意2−両端値を含む0〜num_short_term_ref_pic_sets−1の範囲内にあるCurrRpsIdxの値は、アクティブなSPSからの短期RPS候補が使用されていることを示し、ここにおいて、CurrRpsIdxは、アクティブなSPSにおいてシグナリングされる短期RPS候補のリストへの短期RPS候補のインデックスである。num_short_term_ref_pic_setsに等しいCurrRpsIdxは、現在のピクチャの短期RPSがスライスヘッダで直接シグナリングされることを示す。
両端値を含む0〜NumPocLtCurr−1の範囲内にある各iについて、CurrDeltaPocMsbPresentFlag[i]が1に等しいとき、以下の条件が適用されることが、ビットストリームコンフォーマンスの要件である。
例2
[0065]以下の説明は、本開示による第2の例を指す。以下のシンタックスおよびセマンティクスは、一般に、HEVC WD10における対応するセクションを指す。上述のように、イタリック体のテキストは、提案された追加を示し、[removed:“”]は、提案された削除を示す。
[0066]以下、一般のスライスセグメントヘッダのシンタックスおよびセマンティクスについて最初に説明する。
Figure 0006158422
[0067]代替的に、シンタックスは次のように示され得る。
Figure 0006158422
[0068]以下、一般のスライスセグメントヘッダのセマンティクスについて説明する。
一般のスライスセグメントヘッダセマンティクス
1に等しいpoc_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントが0に等しいことを指定する。0に等しいpoc_reset_flagは、現在のピクチャのための導出されたピクチャオーダーカウントが0に等しくても等しくなくてもよいことを指定する。
存在するとき、現在のピクチャがIDRピクチャではなく、現在のアクセスユニットにおける少なくとも1つのピクチャがIDRピクチャであるとき、poc_reset_flagの値は1に等しいものとする。
存在しないとき、poc_reset_flagの値は0に等しくなると推測される。
[0069]したがって、ビデオエンコーダ20は、IRAPピクチャではなく、たとえば、異なるビデオコーディングレイヤにおいてIRAPピクチャを含むアクセスユニットにあるピクチャについて1の値を有するように、poc_reset_flagを設定することができる。同様に、ビデオデコーダ30は、IRAPピクチャでないピクチャについて1の値を受信すると、ピクチャのPOC値をリセットし、必要に応じて同じレイヤおよび同じコード化ビデオシーケンスにおける他のピクチャのPOC値を調整することができる。
[0070]以下、この第2の例による提案された復号プロセスの変更について説明する。
復号プロセスの変更
スライス復号プロセス
8.3.1 ピクチャオーダーカウントのための復号プロセス
このプロセスの出力は、PicOrderCntValであり、現在のピクチャのピクチャオーダーカウントである。
ピクチャオーダーカウントは、マージモードおよび動きベクトル予測で動きパラメータを導出するため、およびデコーダコンフォーマンスチェックのために、ピクチャを識別するために使用される(C.5項を参照)。
各コード化ピクチャは、PicOrderCntValと示されるピクチャオーダーカウント変数に関連付けられる。
現在のピクチャが、NoRaslOutputFlagが1に等しいIRAPピクチャでないとき、変数prevPicOrderCntLsbおよびprevPicOrderCntMsbは、次のように導出される。
− prevTid0Picが、0に等しいTemporalIdおよび現在のピクチャのnuh_layer_id に等しいnuh_layer_idを有し、RASLピクチャ、RADLピクチャ、またはサブレイヤ非参照ピクチャではない復号順の前のピクチャであるとし、prevPicOrderCntが、prevTid0PicのPicOrderCntValに等しいとする。
− 変数prevPicOrderCntLsbは、prevPicOrderCnt&(MaxPicOrderCntLsb−1)に等しくなるように設定される[removed:“prevTid0Picのslice_pic_order_cnt_lsb”]。
− 変数prevPicOrderCntMsbは、prevPicOrderCnt−prevPicOrderCntLsbに等しくなるように設定される[removed:“prevTid0PicのPicOrderCntMsb”]。
現在のピクチャの変数PicOrderCntMsbは次のように導出される。
− 現在のピクチャが、NoRaslOutputFlagが1に等しいIRAPピクチャである場合、PicOrderCntMsbは0に等しくなるように設定される。
− それ以外の場合、PicOrderCntMsbは次のように導出される。
Figure 0006158422
PicOrderCntValは次のように導出される。
PicOrderCntVal=PicOrderCntMsb+slice_pic_order_cnt_lsb (8-2)
注意1−slice_pic_order_cnt_lsbがIDRピクチャについて0であると推測されるので、すべてのIDRピクチャは、0に等しいPicOrderCntValを有し、prevPicOrderCntLsbとprevPicOrderCntMsbの両方は、0に等しくなるように設定される。
poc_reset_flagが1に等しいとき、以下が順番に適用される。
− DPBにあり、現在のピクチャと同じレイヤに属する各ピクチャのPicOrderCntValは、PicOrderCntValだけデクリメントされる。
− PicOrderCntValは0に設定される。
PicOrderCntValの値は、両端値を含む231〜231−1の範囲内であるものとする。あるCVSにおいて、同じレイヤの任意の2つのコード化ピクチャのためのPicOrderCntVal値は、同じでないものとする。
関数PicOrderCnt(picX)は、次のように指定される。
PicOrderCnt(picX)=ピクチャpicXのPicOrderCntVal (8-3)
関数DiffPicOrderCnt(picA,picB)は、次のように指定される。
DiffPicOrderCnt(picA, picB)=PicOrderCnt(picA)−PicOrderCnt(picB) (8-4)
ビットストリームは、両端値を含む−215〜215−1の範囲内ではない、復号プロセスにおいて使用されるDiffPicOrderCnt(picA,picB)の値を生じるデータを含まないものとする。
注意2−Xを現在のピクチャとし、YおよびZを同じシーケンス中の2つの他のピクチャとし、YおよびZは、DiffPicOrderCnt(X,Y)とDiffPicOrderCnt(X,Z)の両方が正であり、または両方が負であるとき、Xからの同じ出力順方向であると見なされる。
[0071]この例における参照ピクチャセットのための復号プロセスは、実施例1について説明したものと同じであり得る。
[0072]このようにして、ビデオエンコーダ20は、ピクチャのPOC値の少なくとも一部がリセットされるべきかどうかを示すシンタックス要素(たとえば、poc_msb_reset_flagまたはpoc_reset_flag)のための値を設定するように構成され得る。上記で説明したように、ビデオエンコーダ20は、少なくとも1つのIRAPピクチャを含むアクセスユニットにピクチャが含まれるとき、POC値がリセットされるべきであることを示すためにシンタックス要素の値を設定するように構成され得る。ビデオデコーダ30は、同様に、ピクチャのPOC値の少なくとも一部(または全POC値)をリセットすべきかどうかを、シンタックス要素の値から決定することができる。たとえば、シンタックス要素がpoc_msb_reset_flagである場合、ビデオデコーダ30は、ピクチャのPOC値のMSBをリセットすることができる。シンタックス要素がpoc_reset_flagである場合、ビデオデコーダ30は、ピクチャの全POC値をリセットすることができる。
[0073]加えて、ビデオエンコーダ20およびビデオデコーダ30は、調整されるべきPOC値に対するPOC値間の差がリセットの前と後で一定のままであるように、同じレイヤおよび同じコード化ビデオシーケンス(CVS)における他のピクチャのPOC値を調整することができる。このように、ビデオエンコーダ20が、レイヤ間予測を使用してピクチャのブロックを符号化するとき、(上述したPOC調整の後の)ピクチャがNのPOC値を有する場合、ブロックは、NのPOC値を使用して参照ピクチャを識別することができる。すなわち、調整の後、アクセスユニットにおける各ピクチャは、同じPOC値を有する。
[0074]さらに、ビデオデコーダ30は、アクセスユニットの境界を検出するように構成され得る。
[0075]ビデオエンコーダ20およびビデオデコーダ30は各々、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せなどの様々な適切なエンコーダ回路のいずれかとして実装され得る。技法が部分的にソフトウェアで実施される場合、デバイスは、ソフトウェアのための命令を、適当な、非一時的なコンピュータ可読媒体に記憶し、本開示の技法を実行するための1つまたは複数のプロセッサを使用して、ハードウェアで命令を実行し得る。ビデオエンコーダ20およびビデオデコーダ30の各々は、1つまたは複数のエンコーダまたはデコーダに含まれ得、そのいずれかは、組み合わされたエンコーダ/デコーダ(コーデック)の一部として、それぞれのデバイスに統合され得る。
[0076]ビデオエンコーダ20およびビデオデコーダ30は各々、一般に、上述したように、HEVC WD10、MV−HEVC WD3、および/またはSHVC WD1、あるいは本開示で説明する技法が有用である他の類似の規格または拡張に適合して動作し得る。HEVC規格は、たとえば、ITU−T H.264/AVCに従う既存のデバイスに対して、ビデオコーディングデバイスのいくつかの付加された機能を規定する。たとえば、H.264は、9つのイントラ予測符号化モードを提供するが、HEVC規格は、33ものイントラ予測符号化モードを提供し得る。
[0077]概して、ビデオフレームまたはピクチャは、ルーマサンプルとクロマサンプルの両方を含む一連のツリーブロックまたは最大コーディングユニット(LCU)に分割され得る。HEVCコーディングプロセスにおけるツリーブロックは、H.264規格のマクロブロックと同様の目的を有する。スライスは、いくつかの連続したツリーブロックを、コーディングの順序で含む。ビデオフレームまたはピクチャは、1つまたは複数のスライスに区分化される場合がある。各ツリーブロックは、4分木に従って、コーディングユニット(CU)に分割され得る。たとえば、4分木のルートノードとしてのツリーブロックは、4つの子ノードに分割され得、各子ノードは、次に、親ノードとなり、別の4つの子ノードに分割され得る。4分木のリーフノードとしての、最終的な、分割されていない子ノードは、コーディングノード(すなわち、コーディングされたビデオブロック)を備える。コード化ビットストリームに関連付けられたシンタックスデータは、ツリーブロックが分割され得る最大回数を定義することができ、コーディングノードの最小サイズも定義することができる。
[0078]CUは、コーディングノードと、コーディングノードに関連する予測ユニット(PU:prediction unit)および変換ユニット(TU:transform unit)とを含む。CUのサイズは、コーディングノードのサイズに対応し、形状において正方形でなければならない。CUのサイズは、8×8ピクセルから、最大で64×64ピクセルまたはそれを越えるツリーブロックのサイズまで変動し得る。各CUは、1つまたは複数のPUと、1つまたは複数のTUとを含んでいることがある。CUと関連したシンタックスデータは、たとえば、CUの1つまたは複数のPUへの区分を記述し得る。区分モードは、CUがスキップであるか、または、ダイレクトモードで符号化されるか、イントラ予測モードで符号化されるか、もしくはインター予測モードで符号化されるかの間で、異なり得る。PUは、形状において非正方形に区分されてもよい。CUと関連したシンタックスデータは、また、たとえば、CUの1つまたは複数のTUへの、4分木に従う区分を記述し得る。TUは、形状が方形または非方形であり得る。
[0079]HEVC規格は、CUごとに異なり得るTUに従う変換を可能にする。TUは、通常、区分されたLCUのために定義された、所与のCU内のPUのサイズに基づいてサイズ変更されるが、これは常にそうであるとは限らない。TUは、通常、PUと同じサイズであるか、またはPUよりも小さい。いくつかの例では、CUに対応する残差サンプルは、「残差4分木」(RQT)と呼ばれる4分木構造を使用して、より小さいユニットにさらに分割され得る。RQTのリーフノードは変換ユニット(TU)と呼ばれることがある。TUと関連したピクセル差分の値は、変換係数を生成するために変換され得、変換係数は量子化され得る。
[0080]概して、PUは、予測プロセスに関係するデータを含む。たとえば、PUがイントラモード符号化されるとき、PUは、そのPU用のイントラ予測モードを記述するデータを含む場合がある。別の例として、PUがインターモード符号化されるとき、PUは、そのPU用の動きベクトルを定義するデータを含む場合がある。PUの動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度(たとえば、1/4ピクセル精度もしくは1/8ピクセル精度)、動きベクトルが指す参照ピクチャ、および/または動きベクトル用の参照ピクチャリスト(たとえば、RefPicList0(L0)もしくはRefPicList1(L1))を記述することができる。
[0081]概して、TUは、変換プロセスと量子化プロセスとのために使用される。1つまたは複数のPUを有する所与のCUは、1つまたは複数の変換ユニット(TU)を含む場合もある。予測の後に、ビデオエンコーダ20は、PUに対応する残差値を計算し得る。残差値は、エントロピーコーディングのためのシリアル化変換係数を生成するために、TUを使用して変換係数に変換され、量子化され、走査され得るピクセル差分値を備える。本開示では、一般に、CUのコーディングノードを指すために「ビデオブロック」という用語を使用する。いくつかの特定の場合において、本開示では、コーディングノードならびにPUおよびTUを含む、ツリーブロック、すなわち、LCUまたはCUを指すためにも「ビデオブロック」という用語を使用し得る。
[0082]たとえば、HEVC規格に従うビデオコーディングでは、ビデオフレームがコーディングユニット(CU)と予測ユニット(PU)と変換ユニット(TU)とに区分され得る。CUは、概して、ビデオ圧縮のために様々なコーディングツールが適用される基本ユニットとして働く画像領域を指す。CUは、一般に正方形の形状を有し、たとえば、ITU−T H.264などの他のビデオコーディング規格の下でのいわゆる「マクロブロック」と同様であると見なされ得る。
[0083]より良いコーディング効率を達成するために、CUは、それが含んでいるビデオデータに応じて可変サイズを有し得る。すなわち、CUは、より小さいブロックまたはサブCUに区分または「分割」され得、その各々はCUと呼ばれることもある。さらに、サブCUに分割されない各CUは、それぞれ、CUの予測および変換のために1つまたは複数のPUとTUとにさらに区分され得る。
[0084]PUは、H.264などの他のビデオコーディング規格の下でのいわゆるブロックのパーティションと同様であると見なされ得る。PUは、「残差」係数を生成するためにブロックについての予測が実行されるベースである。CUの残差係数は、CUのビデオデータと、CUの1つまたは複数のPUを使用して決定されたCUについての予測データとの間の差を表す。詳細には、1つまたは複数のPUは、CUが予測のためにどのように区分されるかを指定し、CUの各パーティション内に含まれているビデオデータを予測するためにどの予測モードが使用されるかを指定する。
[0085]CUの1つまたは複数のTUは、CUのための残差変換係数のブロックを生成するために、ブロックにどの変換が適用されるかに基づいて、CUの残差係数のブロックのパーティションを指定する。1つまたは複数のTUはまた、適用される変換のタイプに関連し得る。変換は、残差係数をピクセル領域または空間領域から周波数領域などの変換領域に変換する。さらに、1つまたは複数のTUは、量子化残差変換係数のブロックを生成するために残差変換係数の得られたブロックにどの量子化が適用されるかに基づいてパラメータを指定し得る。残差変換係数は、場合によっては、係数を表すために使用されるデータの量を低減するために量子化され得る。
[0086]CUは、一般に、Yとして示される1つのルミナンス成分とUおよびVとして示される2つのクロミナンス成分とを含む。言い換えれば、サブCUにさらに分割されない所与のCUは、Y成分とU成分とV成分とを含み得、その各々は、前に説明したように、CUの予測および変換のために1つまたは複数のPUとTUとにさらに区分され得る。たとえば、ビデオサンプリングフォーマットに応じて、サンプルの数で表されるU成分およびV成分のサイズは、Y成分のサイズと同じであるかまたはそれとは異なり得る。したがって、予測、変換、および量子化に関して上記で説明した技法は、所与のCUのY成分、U成分およびV成分の各々について実行され得る。
[0087]CUを符号化するために、CUの1つまたは複数のPUに基づいて、CUのための1つまたは複数の予測子が最初に導出される。予測子は、CUについての予測データを含んでいる参照ブロックであり、前に説明したように、CUのための対応するPUに基づいて導出される。たとえば、PUは、予測データが決定される際の対象となるCUのパーティションと、予測データを決定するために使用される予測モードとを示す。予測子は、イントラ(I)予測(すなわち、空間的予測)モードまたはインター(PまたはB)予測(すなわち、時間的予測)モードのいずれかを通して導出され得る。したがって、いくつかのCUは、同じフレーム中の隣接参照ブロックまたはCUに対する空間的予測を使用してイントラコーディング(I)され得るが、一方他のCUは、他のフレーム中の参照ブロックまたはCUに対してインターコーディング(PまたはB)され得る。
[0088]CUの1つまたは複数のPUに基づいて1つまたは複数の予測子を識別するときに、1つまたは複数のPUに対応するCUの元のビデオデータと1つまたは複数の予測子中に含まれているCUについての予測データとの間の差が計算される。予測残差とも呼ばれるこの差は、残差係数を備え、前に説明したように、1つまたは複数のPUと1つまたは複数の予測子とによって指定されたCUの部分間のピクセル差分を指す。残差係数は、概して、1つまたは複数のPUのCUに対応する2次元(2D)アレイに構成される。
[0089]さらなる圧縮を達成するために、予測残差は、概して、たとえば、離散コサイン変換(DCT:discrete cosine transform)、整数変換、カルーネンレーベ(Karhunen-Loeve)(K−L)変換、または別の変換を使用して変換される。変換は、同じく前に説明したように、空間領域中の予測残差、すなわち、残差係数を変換領域、たとえば、周波数領域中の残差変換係数に変換する。変換係数はまた、概して、CUの1つまたは複数のTUに対応する2Dアレイに構成される。さらなる圧縮のために、残差変換係数は、同じく前に説明したように、場合によっては、係数を表すために使用されるデータの量を低減するために量子化され得る。
[0090]またさらなる圧縮を達成するために、エントロピーコーダは、コンテキスト適応型バイナリ算術コーディング(CABAC:Context Adaptive Binary Arithmetic Coding)、コンテキスト適応型可変長コーディング(CAVLC:Context Adaptive Variable Length Coding)、確率間隔区分エントロピーコーディング(PIPE:Probability Interval Partitioning Entropy Coding)、または別のエントロピーコーディング方法を使用して、得られた残差変換係数を後で符号化する。エントロピーコーディングは、他のCUと比較して、係数によって表される、CUのビデオデータに固有の統計的冗長性を低減または除去することによって、このさらなる圧縮を達成し得る。
[0091]ビデオシーケンスは、一般に、一連のビデオフレームまたはピクチャを含む。ピクチャグループ(GOP)は、一般に、ビデオピクチャのうちの一連の1つまたは複数を備える。GOPは、GOPのヘッダの中、1つまたは複数のピクチャのヘッダの中、またはその他の所にシンタックスデータを含み得、シンタックスデータは、GOPに含まれるいくつかのピクチャを記述する。ピクチャの各スライスは、それぞれのスライスのための符号化モードを記述するスライスシンタックスデータを含む場合がある。ビデオエンコーダ20は、通常、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに作用する。ビデオブロックは、CU内のコーディングノードに対応する場合がある。ビデオブロックは、固定のまたは変化するサイズを有し得、規定されたコーディング規格に従って、サイズは異なり得る。
[0092]一例として、HEVCは、様々なPUサイズでの予測をサポートする。特定のCUのサイズが2N×2Nとすれば、HEVCは、2N×2NまたはN×NのPUサイズでのイントラ予測、および2N×2N、2N×N、N×2N、またはN×Nの対称なPUサイズでのインター予測をサポートする。HEVCは、また、2N×nU、2N×nD、nL×2N、およびnR×2NのPUサイズでのインター予測のための、非対称な区分をサポートする。非対称な区分では、CUの一方向は区分されず、一方他の方向は25%および75%に区分される。CUの25%パーティションに対応する部分は、「n」、ならびにそれに続く「Up」、「Down」、「Left」、または「Right」の表示によって示される。したがって、たとえば、「2N×nU」は、上部で2N×0.5NのPU、および下部で2N×1.5NのPUに水平に区分される2N×2NのCUを参照する。
[0093]本開示では、「N×N」および「N by N」は、垂直および水平の寸法の観点からビデオブロックのピクセル寸法を参照するために、たとえば、16×16ピクセルまたは16by16ピクセルのように、互換的に使用され得る。一般に、16×16ブロックは、垂直方向に16ピクセル(y=16)、および水平方向に16ピクセル(x=16)を有する。同様に、N×Nブロックは、一般に、垂直方向にNピクセル、および水平方向にNピクセルを有し、ここでNは、非負の整数値を表す。ブロックのピクセルは、行および列に配列され得る。さらに、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要はない。たとえば、ブロックは、NxMピクセルを備え得、ここで、Mは、必ずしもNに等しいとは限らない。
[0094]CUのPUを使用するイントラ予測またはインター予測のコーディングの後で、ビデオエンコーダ20は、CUのTUに対する残差データを計算し得る。PUは、(ピクセル領域とも呼ばれる)空間領域においてピクセルデータを備え得、TUは、変換、たとえば、残差ビデオデータへの離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、PUに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ20は、CUに対する残差データを含むTUを形成し、次いで、CUのための変換係数を生成するためにTUを変換し得る。
[0095]変換係数を生成するための任意の変換の後で、ビデオエンコーダ20は、変換係数の量子化を実行し得る。量子化は、一般に、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を実現するプロセスを指す。量子化プロセスは、係数の一部または全部に関連付けられたビット深度を低減させることができる。たとえば、nビットの値は、量子化中にmビットの値に端数を丸められてよく、ここで、nはmよりも大きい。
[0096]いくつかの例では、ビデオエンコーダ20は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ20は適応走査を実施し得る。量子化変換係数を走査して1次元のベクトルを形成した後、ビデオエンコーダ20は、たとえば、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC:syntax-based context-adaptive binary arithmetic coding)、確率間隔区分エントロピー(PIPE)コーディングまたは別のエントロピー符号化の方法に従って、1次元のベクトルをエントロピー符号化し得る。ビデオエンコーダ20は、また、ビデオデコーダ30によるビデオデータの復号での使用のために、符号化ビデオデータと関連したシンタックス要素をエントロピー符号化する。
[0097]CABACを実行するために、ビデオエンコーダ20は、コンテキストモデル内のコンテキストを、送信されるべきシンボルに割り当て得る。コンテキストは、たとえば、シンボルの隣接する値がゼロ以外であるか否かに関係し得る。CAVLCを実行するために、ビデオエンコーダ20は、送信されるべきシンボルに対する可変長符号を選択し得る。VLCの中の符号語は、比較的に短い符号が、より起こりそうなシンボルに対応し、一方より長い符号が、より起こりそうでないシンボルに対応するように、再構築され得る。このようにして、VLCの使用により、たとえば、送信されるべき各シンボルに対して等長の符号語を使用することを越える、ビットの節約が達成され得る。起こりそうなことの決定は、シンボルに割り当てられたコンテキストに基づき得る。
[0098]ビデオエンコーダ20およびビデオデコーダ30は、本開示の例示的な技法を実装するように構成され得る。ビデオエンコーダ20およびビデオデコーダ30は、一般にビデオコーダと呼ばれることがある。
[0099]たとえば、ビデオデコーダ30は、現在のピクチャのピクチャオーダーカウント(POC)値が、現在のピクチャのPOC値の1組の最下位ビット(LSB)に等しくなるようにリセットされるかどうかを指定する第1のシンタックス要素を受信し、現在のピクチャのPOC値が現在のピクチャのPOC値のLSBの組に等しくなるようにリセットされることを第1のシンタックス要素が指定するとき、現在のピクチャのPOC値と、同じレイヤにおけるピクチャのうちの任意のもののPOC値との間の差が、現在のピクチャのPOC値がリセットされる前と同じままであるように、現在のピクチャと同じコーディングレイヤにおける他のピクチャのPOC値をデクリメントし、デクリメントされたPOC値を使用して、現在のピクチャの少なくとも一部と他のピクチャとを復号するように構成され得る。他のピクチャは、短期参照ピクチャと長期参照ピクチャとを含み得、ビデオデコーダ30は、短期参照ピクチャおよび長期参照ピクチャのPOC値をデクリメントし得る。
[0100]現在のピクチャのPOC値がPOC値のLSBの組に等しくなるようにリセットされることを第1のシンタックス要素が指定するとき、ビデオデコーダ30は、現在のピクチャのPOC値とDPBにおけるピクチャのうちの任意のもののPOC値との間の差が、現在のピクチャのPOC値がリセットされる前と同じままであるように、復号ピクチャバッファ(DPB)における他のピクチャのPOC値をデクリメントすることができる。
[0101]現在のピクチャのPOC値が現在のピクチャのPOC値のLSBの組に等しくなるようにリセットされることを第1のシンタックス要素が指定するとき、現在のピクチャのPOC値の最上位ビット(MSB)は、ゼロにリセットされる。一例では、現在のピクチャのPOC値のLSBおよびMSBは、相互排他的である。
[0102]いくつかの例では、ビデオデコーダ30は、現在のピクチャのPOC値のLSBがゼロにリセットされるかどうかを指定する第2のシンタックス要素を受信することができる。第1および/または第2のシンタックス要素は各々、フラグでもよく、シンタックス要素の一方または両方は、スライスヘッダにおいて受信され得る。現在のピクチャは、IDR、CRA、またはBLAピクチャのうちの1つを備え得る。
[0103]別の例では、ビデオデコーダ30は、現在のピクチャのピクチャオーダーカウント(POC)値がゼロに等しくなるようにリセットされるかどうかを指定する第1のシンタックス要素を受信し、現在のピクチャのPOC値がゼロに等しくなるようにリセットされることを第1のシンタックス要素が指定するとき、現在のピクチャがレイヤ0よりも大きいレイヤにある場合、現在のピクチャをゼロに等しくなるようにリセットし、リセットされたPOC値を使用して、現在のピクチャを復号するように構成され得る。
[0104]一例では、現在のピクチャは、非IDRピクチャである。シンタックス要素は、たとえばidr_au_present_flagなどのフラグを備え得る。シンタックス要素は、スライスヘッダにおいて受信され得る。現在のピクチャがIDRピクチャであるとき、シンタックス要素は、現在のピクチャのPOC値がゼロに等しくなるようにリセットされることを常に指定する。
[0105]ビデオエンコーダ20は、本開示の例に従って方法を実行するようにも構成され得る。たとえば、ビデオエンコーダ20は、現在のピクチャのピクチャオーダーカウント(POC)値が、現在のピクチャのPOC値の1組の最下位ビット(LSB)に等しくなるようにリセットされるかどうかを指定する第1のシンタックス要素を生成し、現在のピクチャのPOC値が現在のピクチャのPOC値のLSBの組に等しくなるようにリセットされることを第1のシンタックス要素が指定するとき、現在のピクチャのPOC値と、同じレイヤにおけるピクチャのうちの任意のもののPOC値との間の差が、現在のピクチャのPOC値がリセットされる前と同じままであるように、現在のピクチャと同じコーディングレイヤにおける他のピクチャのPOC値をデクリメントし、デクリメントされたPOC値を使用して、現在のピクチャの少なくとも一部と他のピクチャとを符号化するように構成され得る。
[0106]現在のピクチャのPOC値がPOC値のLSBの組に等しくなるようにリセットされることを第1のシンタックス要素が指定するとき、ビデオエンコーダ20は、現在のピクチャのPOC値とDPBにおけるピクチャのうちの任意のもののPOC値との間の差が、現在のピクチャのPOC値がリセットされる前と同じままであるように、復号ピクチャバッファ(DPB)における他のピクチャのPOC値をデクリメントすることができる。
[0107]現在のピクチャのPOC値が現在のピクチャのPOC値のLSBの組に等しくなるようにリセットされることを第1のシンタックス要素が指定するとき、現在のピクチャのPOC値の最上位ビット(MSB)は、ゼロにリセットされる。一例では、現在のピクチャのPOC値のLSBおよびMSBは、相互排他的である。
[0108]ビデオエンコーダ20は、現在のピクチャのPOC値のLSBがゼロにリセットされるかどうかを指定する第2のシンタックス要素を生成することができる。第1および/または第2のシンタックス要素は各々、フラグでもよく、シンタックス要素の一方または両方は、スライスヘッダにおいて受信され得る。現在のピクチャは、IDR、CRA、またはBLAピクチャのうちの1つを備え得る。
[0109]別の例では、ビデオエンコーダ20は、現在のピクチャのピクチャオーダーカウント(POC)値がゼロに等しくなるようにリセットされるかどうかを指定する第1のシンタックス要素を生成し、現在のピクチャのPOC値がゼロに等しくなるようにリセットされることを第1のシンタックス要素が指定するとき、現在のピクチャがレイヤ0よりも大きいレイヤにある場合、現在のピクチャをゼロに等しくなるようにリセットし、リセットされたPOC値を使用して、現在のピクチャを復号するように構成され得る。現在のピクチャは、非IDRピクチャとすることができる。シンタックス要素は、たとえばidr_au_present_flagなどのフラグを備え得、フラグは、スライスヘッダにおいてシグナリングされ得る。ピクチャがIDRピクチャであるとき、シンタックス要素は、現在のピクチャのPOC値がゼロに等しくなるようにリセットされることを常に指定する。
[0110]図2は、本開示で説明する技法を実施し得る例示的なビデオエンコーダ20を示すブロック図である。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実行してよい。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接するフレーム内またはピクチャ内のビデオの、時間的な冗長性を低減または除去するために、時間的予測に依拠する。イントラモード(Iモード)は、いくつかの空間ベースの圧縮モードのいずれかを指し得る。単方向予測(Pモード)または双予測(Bモード)などのインターモードは、いくつかの時間ベースの圧縮モードのいずれかを指すことがある。
[0111]図2の例では、ビデオエンコーダ20は、区分ユニット40と、予測処理ユニット42と、参照ピクチャメモリ64と、加算器50と、変換処理ユニット52と、量子化処理ユニット54と、エントロピー符号化ユニット56とを含む。予測処理ユニット42は、動き推定ユニット44と、動き補償ユニット46と、イントラ予測ユニット48とを含む。ビデオエンコーダ20は、ビデオブロック再構成に関して、逆量子化処理ユニット58と、逆変換処理ユニット60と、加算器62も含む。再構成されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタ処理するために、デブロッキングフィルタ(図2に図示せず)も含まれ得る。所望であれば、デブロッキングフィルタは、通常、加算器62の出力をフィルタするはずである。デブロッキングフィルタに加えて追加的なループフィルタ(インループまたはポストループ)が使用されてもよい。
[0112]様々な例では、ビデオエンコーダ20のユニットは、本開示の技法を実行する役割を担い得る。また、一部の例では、本開示の技術は、ビデオエンコーダ20のユニットの1つまたは複数の中で分割され得る。
[0113]図2に示されているように、ビデオエンコーダ20はビデオデータを受信し、区分ユニット40はデータをビデオブロックに区分する。この区分はまた、たとえば、LCUおよびCUの4分木構造に従って、ビデオブロック区分と同様に、スライス、タイル、または他のより大きいユニットへの区分をも含み得る。ビデオエンコーダ20は概して、符号化すべきビデオスライス内のビデオブロックを符号化する構成要素を示す。スライスは、複数のビデオブロック(場合によってはタイルと呼ばれるビデオブロックの組)に分割されてよい。予測処理ユニット42は、現在のビデオブロックに関して、エラー結果(たとえば、コーディングレートおよび歪みレベル)に基づいて、複数のイントラコーディングモードのうちの1つまたは複数のインターコーディングモードのうちの1つなど、複数の可能なコーディングモードのうちの1つを選択してよい。予測処理ユニット42は、得られたイントラコーディング済みブロックまたはインターコーディング済みブロックを加算器50に供給して残差ブロックを生成し、加算器62に供給して参照ピクチャとして使用できる符号化ブロックを再構成する。
[0114]予測処理ユニット42内のイントラ予測ユニット48は、空間圧縮を行うために、コーディングされるべき現在のブロックと同じピクチャまたはスライス中の1つまたは複数の隣接ブロックに対する現在のビデオブロックのイントラ予測コーディングを実行し得る。予測処理ユニット42内の動き推定ユニット44および動き補償ユニット46は、時間圧縮を行うために、1つまたは複数の参照ピクチャ中の1つまたは複数の予測ブロックに対して現在ビデオブロックのインター予測コーディングを実行する。
[0115]動き推定ユニット44は、ビデオシーケンスの所定のパターンに従ってビデオスライスのためのインター予測モードを決定するように構成され得る。動き推定ユニット44と動き補償ユニット46とは、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット44によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、参照ピクチャ内の予測ブロックに対する現在ビデオフレームまたはピクチャ内のビデオブロックのPUの変位を示し得る。
[0116]予測ブロックは、絶対差分和(SAD:sum of absolute difference)、2乗差分和(SSD:sum of square difference)、または他の差分メトリックによって決定され得るピクセル差分に関して、コーディングされるべきビデオブロックのPUにぴったり一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ20は、参照ピクチャメモリ64に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ20は、参照ピクチャの1/4ピクセル位置、1/8ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定ユニット44は、フルピクセル位置と分数ピクセル位置とに関して動き探索を実行し、分数ピクセル精度で動きベクトルを出力し得る。
[0117]動き推定ユニット44は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライスの中のビデオブロックのPUに対する動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)または第2の参照ピクチャリスト(リスト1)から選択されてよく、それらの参照ピクチャリストの各々は、参照ピクチャメモリ64に記憶された1つまたは複数の参照ピクチャを識別する。動き推定ユニット44は、計算された動きベクトルをエントロピー符号化ユニット56と動き補償ユニット46とに送る。
[0118]動き補償ユニット46によって実施される動き補償は、動き推定によって決定された動きベクトルに基づいて予測ブロックをフェッチまたは生成すること、場合によってはサブピクセル精度への補間を実施することを伴い得る。現在のビデオブロックのPUの動きベクトルを受信すると、動き補償ユニット46は、動きベクトルが参照ピクチャリストのうちの1つにおいて指す予測ブロックの位置を特定し得る。ビデオエンコーダ20は、コーディングされている現在ビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって残差ビデオブロックを形成する。ピクセル差分値は、ブロックの残差データを形成し、ルーマおよびクロマの両方の差分成分を含み得る。加算器50は、この減算演算を実行する構成要素を表す。動き補償ユニット46はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ30により使用するための、ビデオブロックおよびビデオスライスと関連付けられるシンタックス要素を生成することができる。
[0119]さらに、いくつかの場合には、予測処理ユニット42は、レイヤ間予測を使用してピクチャのブロックを予測することを決定し得る。たとえば、マルチビュービデオデータでは、予測処理ユニット42は、ビュー間予測を使用して別のビューのピクチャからあるビューのピクチャのブロックを予測することを決定し得る。ビュー間予測の場合、動き推定ユニット44は、ブロック視差動きベクトル(disparity motion vector)を計算することができ、ここにおいて、視差動きベクトルは、一般に、参照ビューのピクチャにおける参照ブロックの位置を識別する。別の例として、スケーラブルビデオコーディングでは、予測処理ユニット42は、レイヤ間予測を使用して別のレイヤのピクチャからあるレイヤのピクチャのブロックを予測することを決定し得る。
[0120]レイヤ間予測(ビューは1種類のレイヤと考えられ得るという点で、ビュー間予測を含む)は、同じレイヤにおける、しかし、異なる時間的インスタンスのピクチャにおけるブロックよりもむしろ、異なるレイヤにおける参照ブロックを指す運動ベクトルの使用を伴い得る。一般に、レイヤ間予測は、レイヤ間予測を使用して予測されるブロックを含むピクチャと同じアクセスユニットのピクチャを使用して実行される。したがって、インター予測されたブロックの動きパラメータは、たとえば、ピクチャオーダーカウント(POC)値を使用して参照ピクチャを識別することができる。
[0121]一般に、レイヤ間コーディング拡張(たとえば、HEVCに対するマルチビューおよびスケーラブル拡張)の技法は、POC値がアラインされるという仮定、すなわち、同じアクセスユニットにおけるすべてのピクチャは同じPOC値を有するという仮定に基づいている。これを達成するために、従来の技法は、イントラランダムアクセスポイント(IRAP)ピクチャもアラインしている。しかしながら、上述のように、IRAPピクチャのアラインメントを強制することは、いくつかの有利な使用シナリオを妨害する。
[0122]したがって、本開示の技法によれば、予測処理ユニット42は、必ずしも異なるレイヤの間のすべてのIRAPピクチャをアラインするとは限らない。すなわち、予測処理ユニット42は、非IRAPピクチャとしてIRAPピクチャを含むアクセスユニットの少なくとも1つのピクチャをコード化することを決定し得る。しかしながら、予測処理ユニット42は、異なるレイヤのピクチャ間のPOC値をアラインすることを維持しながら、IRAPピクチャの非アラインメントを達成するために、本開示の技法を使用することができる。このようにして、予測処理ユニット42は、ピクチャのレイヤ間予測されたブロックが異なるレイヤにおける参照ピクチャを適切に参照することができることを確実にし得、ここにおいて、参照ピクチャは、IRAPピクチャをアラインすることなく、レイヤ間予測されたブロックを含むピクチャと同じPOC値を有する。
[0123]特に、本開示の技法によれば、予測処理ユニット42は、IRAPピクチャを含むアクセスユニットのために符号化されるピクチャを受信することができる。すなわち、ビデオエンコーダ20は、IRAPピクチャを含むベースレイヤ(または他のレイヤ)を前に符号化し、たとえば、IDR、CRA、またはBLAピクチャなど、IRAPピクチャとしてIRAPピクチャを符号化することを決定している可能性がある。しかしながら、ビデオエンコーダ20は、次いで、非IRAPピクチャとして別のレイヤに一緒に置かれたピクチャ(すなわち、同じアクセスユニットにおけるピクチャ)を符号化することを決定することができる。
[0124]IRAPピクチャと同じアクセスユニットにある非IRAPピクチャとしてピクチャを符号化することを決定した後、ビデオエンコーダ20は、非IRAPピクチャのPOC値の少なくとも一部がゼロの値にリセットされるべきであることを示すシンタックス要素の値を設定することができる。POC値の少なくとも一部は、POC値の最上位ビット(MSB)のみ、または全POC値(すなわち、POC値のすべてのビット)を含み得る。シンタックス要素は、たとえば、上記の実施例1のpoc_msb_reset_flagまたは上記の実施例2のpoc_reset_flagを備え得る。
[0125]ビデオエンコーダ20は、非IRAPピクチャとしてピクチャを符号化することを決定した後、ピクチャのPOC値をリセットすることもできる。さらに、ビデオエンコーダ20は、ピクチャと同じレイヤ、およびピクチャと同じコード化ビデオシーケンスにある参照ピクチャメモリ64におけるピクチャのPOC値をリセットすることができる。特に、これらのピクチャのPOC値をリセットすることは、現在のピクチャのPOC値とこれらの他のピクチャのPOC値との間の差がリセットの前および後と同じままであることを確実にすることを含み得る。したがって、参照ピクチャメモリ64におけるピクチャがNの現在のピクチャのPOC値に対するPOC値の差がある場合、ビデオエンコーダ20は、POC値が現在のピクチャのリセットされたPOC値−Nに等しくなるように、参照ピクチャメモリ64におけるピクチャのPOC値をリセットすることができる。
[0126]このようにして、レイヤ間予測を使用してその後のピクチャ(たとえば、同じレイヤまたはその後符号化されたレイヤのピクチャ)を符号化するとき、ビデオエンコーダ20は、参照ピクチャを参照するレイヤ間予測されたブロックを含むピクチャのPOC値に等しい参照ピクチャのPOC値を使用して参照ピクチャを識別するシンタックスデータを符号化することができる。
[0127]イントラ予測ユニット48は、上記で説明したように、動き推定ユニット44と動き補償ユニット46とによって実施されるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測ユニット48は、現在ブロックを符号化するために使用すべきイントラ予測モードを決定し得る。いくつかの例では、イントラ予測ユニット48は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在のブロックを符号化することができ、イントラ予測ユニット48は、テストされたモードから使用するのに適切なイントラ予測モードを選択することができる。たとえば、イントラ予測ユニット48は、様々なテストされたイントラ予測モードに対して、レート歪み分析を使用してレート歪みの値を計算し、テストされたモードの中から最良のレート歪み特性を有するイントラ予測モードを選択し得る。レート歪み分析は、一般に、符号化されたブロックと、符号化ブロックを生成するために符号化される、元の符号化されていないブロックとの間のある量の歪み(すなわち、エラー)、および、符号化ブロックを生成するために使用されるビットレート(すなわち、いくつかのビット)を決定する。イントラ予測ユニット48は、どのイントラ予測モードがブロックについて最良のレート歪み値を呈するかを判断するために、様々な符号化されたブロックの歪みおよびレートから比率を計算し得る。
[0128]いずれの場合も、ブロックのイントラ予測モードを選択した後に、イントラ予測ユニット48は、ブロックについての選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット56に提供し得る。エントロピー符号化ユニット56は、本開示の技法に従って、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ20は、送信ビットストリーム中に、複数のイントラ予測モードインデックステーブルおよび複数の変更されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)と、様々なブロックの符号化コンテキストの定義と、コンテキストの各々について使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、および変更されたイントラ予測モードインデックステーブルの指示とを含み得る構成データを含め得る。
[0129]予測処理ユニット42が、インター予測またはイントラ予測のいずれかを介して、現在のビデオブロックのための予測ブロックを生成した後、ビデオエンコーダ20は、現在のビデオブロックから予測ブロックを減算することによって残差ビデオブロックを形成する。残差ブロック中の残差ビデオデータは、1つまたは複数のTU中に含まれ、変換処理ユニット52に適用され得る。変換処理ユニット52は、離散コサイン変換(DCT)または概念的に同様の変換などの変換を使用して、残差ビデオデータを残差変換係数に変換する。変換処理ユニット52は、残差ビデオデータをピクセル領域から周波数領域などの変換領域に変換してよい。
[0130]変換処理ユニット52は、得られた変換係数を量子化処理ユニット54に送ってよい。量子化処理ユニット54は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化処理ユニット54は、次いで、量子化変換係数を含む行列の走査を実行し得る。代替的に、エントロピー符号化ユニット56が走査を実行し得る。
[0131]量子化の後に、エントロピー符号化ユニット56は、量子化変換係数をエントロピー符号化する。たとえば、エントロピー符号化ユニット56は、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディングまたは別のエントロピー符号化方法もしくは技法を実施し得る。エントロピー符号化ユニット56によるエントロピー符号化に続いて、符号化ビットストリームは、ビデオデコーダ30に送信されるか、あるいはビデオデコーダ30が後で送信するかまたは取り出すためにアーカイブされ得る。エントロピー符号化ユニット56はまた、コーディングされている現在のビデオスライスについての動きベクトルと他のシンタックス要素とをエントロピー符号化することができる。
[0132]逆量子化処理ユニット58および逆変換処理ユニット60は、参照ピクチャの参照ブロックとして後で使用する目的でピクセル領域において残差ブロックを再構成するために、それぞれ逆量子化および逆変換を適用する。動き補償ユニット46は、参照ピクチャリストのうちの1つ内の参照ピクチャのうちの1つの予測ブロックに残差ブロックを加算することによって参照ブロックを計算し得る。動き補償ユニット46はまた、動き推定において使用するためのサブ整数ピクセル値を計算するために、再構成された残差ブロックに1つまたは複数の補間フィルタを適用し得る。加算器62は、参照ピクチャメモリ64に記憶するための参照ブロックを生成するために、再構成された残差ブロックを動き補償ユニット46によって生成された動き補償予測ブロックに加算する。参照ブロックは、後続のビデオフレームまたはピクチャ中のブロックをインター予測するために、動き推定ユニット44と動き補償ユニット46とによって参照ブロックとして使用され得る。
[0133]このようにして、ビデオエンコーダ20は、ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化し、POC値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、POC値の一部がゼロに等しくなるように、POC値の少なくとも一部をリセットし、リセットされたPOC値を使用して、ビデオデータをコード化するように構成されるビデオコーダの一例を表す。
[0134]図3は、本開示で説明する技法を実施し得る例示的なビデオデコーダ30を示すブロック図である。図3の例では、ビデオデコーダ30は、エントロピー復号ユニット70と、予測処理ユニット71と、逆量子化処理ユニット76と、逆変換ユニット78と、加算器80と、参照ピクチャメモリ82とを含む。予測処理ユニット71は、動き補償ユニット72と、イントラ予測ユニット74とを含む。ビデオデコーダ30は、いくつかの例では、図2からのビデオエンコーダ20に関して説明した符号化パスとは概して逆の復号パスを実行し得る。
[0135]様々な例で、ビデオデコーダ30の1つのユニットは、本開示の技法を実行する役割を担い得る。また、一部の例では、本開示の技術は、ビデオ復号器30のユニットの1つまたは複数の中で分割することができる。
[0136]復号プロセス中に、ビデオデコーダ30は、符号化されたビデオスライスのビデオブロックおよび関連するシンタックス要素を表現する符号化されたビデオビットストリームを、ビデオエンコーダ20から受信する。ビデオデコーダ30のエントロピー復号ユニット70は、量子化係数と、動きベクトルと、他のシンタックス要素とを生成するために、ビットストリームをエントロピー復号する。エントロピー復号ユニット70は、動きベクトルと他のシンタックス要素とを予測処理ユニット71に転送する。ビデオデコーダ30は、ビデオスライスレベルおよび/またはビデオブロックレベルでシンタックス要素を受信し得る。
[0137]ビデオスライスがイントラコーディングされた(I)スライスとしてコーディングされるとき、予測処理ユニット71のイントラ予測ユニット74は、シグナリングされたイントラ予測モードと、現在のフレームまたはピクチャの、前に復号されたブロックからのデータとに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオピクチャがインターコーディングされた(すなわち、B、またはP)スライスとしてコーディングされるとき、予測処理ユニット71の動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルおよび他のシンタックス要素に基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの1つの中の、参照ピクチャのうちの1つから生成され得る。ビデオデコーダ30は、参照ピクチャメモリ82に記憶された参照ピクチャに基づいて、デフォルトの構成技法または任意の他の技法を使用して、参照ピクチャリスト、すなわち、リスト0とリスト1とを構成し得る。
[0138]動き補償ユニット72は、動きベクトルと他のシンタックス要素とを解析することによって現在のビデオスライスのビデオブロックについての予測情報を決定し、復号されている現在のビデオブロックのための予測ブロックを生成するために、予測情報を使用する。たとえば、動き補償ユニット72は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード(たとえば、イントラ予測またはインター予測)と、インター予測スライスタイプ(たとえば、BスライスまたはPスライス)と、スライスの参照ピクチャリストのうちの1つまたは複数についての構成情報と、スライスの各インター符号化されたビデオブロックのための動きベクトルと、スライスの各インターコーディングされたビデオブロックについてのインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、受信されたシンタックス要素のいくつかを使用する。
[0139]動き補償ユニット72はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット72は、参照ブロックのサブ整数ピクセルのための補間された値を計算するために、ビデオブロックの符号化中にビデオエンコーダ20によって使用された補間フィルタを使用し得る。このケースでは、動き補償ユニット72は、受信したシンタックス要素からビデオエンコーダ20で使用された補間フィルタを決定し、補間フィルタを使用して予測ブロックを生成し得る。
[0140]本開示の技法によれば、エントロピー復号ユニット70は、ピクチャの第1のピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきかどうかを示すシンタックス要素の値を復号し得る。シンタックス要素は、たとえば、上記の実施例1のpoc_msb_reset_flagまたは上記の実施例2のpoc_reset_flagを備え得る。ビデオデコーダ30は、次いで、POC値がリセットされるべきであることを示す値をシンタックス要素が有するとき、POC値の少なくとも一部をリセットすることができる。たとえば、ビデオデコーダ30は、POC値の少なくとも一部のビット(たとえば、poc_reset_flagの最上位ビットまたはpoc_reset_flagのすべてのビット)をゼロに等しくなるように設定することができる。
[0141]さらに、ビデオデコーダ30は、参照ピクチャメモリ82における他のピクチャのPOC値も調整し得る(すなわち、同じビデオコーディングレイヤおよび同じコード化ビデオシーケンスにあるピクチャ)。たとえば、ビデオデコーダ30は、POC値とリセットがシグナリングされたPOC値との間の差がリセット前と同じままであるように、他のピクチャのPOC値をデクリメントすることができる。したがって、参照ピクチャメモリ82におけるピクチャがNの現在のピクチャのPOC値に対するPOC値の差がある場合、ビデオデコーダ30は、POC値が現在のピクチャのリセットされたPOC値−Nに等しいように、参照ピクチャメモリ82におけるピクチャのPOC値をリセットすることができる。
[0142]一般に、インター予測されるビデオブロックは、インター予測が時間的であるかレイヤ間(たとえば、ビュー間)であるかにかかわらず、参照ブロックを識別するシンタックス要素を含み得る。本開示の技法によれば、インター予測されたブロックのシンタックス要素は、上記で説明したように、リセットの後の参照ピクチャのPOC値を使用して、参照ピクチャを識別することができる。したがって、ビデオデコーダ30は、インター予測のために、動き情報としてシグナリングされるとき、参照ピクチャを識別するPOC値を調整する必要はない。
[0143]逆量子化処理ユニット76は、ビットストリーム中で与えられ、エントロピー復号ユニット70によって復号された、量子化変換係数を逆量子化(inverse quantize)、すなわち、逆量子化する。逆量子化プロセスは、ビデオエンコーダ20によって算出された量子化パラメータをビデオスライス内のビデオブロックごとに使用して、適用すべき量子化の程度を求め、同様に、適用すべき逆量子化の程度を求めることを含んでよい。逆変換処理ユニット78は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば、逆DCT、逆整数変換、または概念的に同様の逆変換処理を変換係数に適用する。
[0144]動き補償ユニット72が、動きベクトルと他のシンタックス要素とに基づいて現在ビデオブロックのための予測ブロックを生成した後に、ビデオデコーダ30は、逆変換処理ユニット78からの残差ブロックを動き補償ユニット72によって生成された対応する予測ブロックと加算することによって、復号ビデオブロックを形成する。加算器80は、この加算演算を実行する1つまたは複数の構成要素を表す。所望される場合、ブロッキネスアーティファクトを除去するために復号されたブロックをフィルタ処理するデブロッキングフィルタも適用され得る。他のループフィルタ(コーディングループの中、またはコーディングループの後のいずれか)も、ピクセルの変化を平滑化し、または他の方法でビデオ品質を改善するために使用され得る。所与のフレームまたはピクチャの復号ビデオブロックは、次いで、参照ピクチャメモリ82に記憶され、これは後続の動き補償のために使用される参照ピクチャを記憶する。参照ピクチャメモリ82はまた、復号ビデオを図1のディスプレイデバイス32などのディスプレイデバイス上に後で表示できるように記憶する。
[0145]いくつかの例では、本開示で説明する技法の1つまたは複数の態様は、たとえばメディアアウェアネットワーク要素(MANE)、ストリーム適応プロセッサ、スプライシングプロセッサ、または編集プロセッサなど、中間ネットワークデバイスによって実行され得る。たとえば、そのような中間デバイスは、本開示で説明するように、様々なシグナリングのうちの任意のものを生成するように構成され得る。たとえば、そのような中間デバイスは、現在のピクチャのピクチャオーダーカウント(POC)値が、現在のピクチャのPOC値の1組の最下位ビット(LSB)に等しくなるようにリセットされるかどうかを指定する第1のシンタックス要素を受信し、現在のピクチャのPOC値が現在のピクチャのPOC値のLSBの組に等しくなるようにリセットされることを第1のシンタックス要素が指定するとき、現在のピクチャのPOC値と、同じレイヤにおけるピクチャのうちの任意のもののPOC値との間の差が、現在のピクチャのPOC値がリセットされる前と同じままであるように、現在のピクチャと同じコーディングレイヤにおける他のピクチャのPOC値をデクリメントし、デクリメントされたPOC値を使用して、現在のピクチャの少なくとも一部と他のピクチャとを復号するように構成され得る。
[0146]別の例では、そのような中間デバイスは、現在のピクチャのピクチャオーダーカウント(POC)値がゼロに等しくなるようにリセットされるかどうかを指定する第1のシンタックス要素を受信し、現在のピクチャのPOC値がゼロに等しくなるようにリセットされることを第1のシンタックス要素が指定するとき、現在のピクチャがレイヤ0よりも大きいレイヤにある場合、現在のピクチャをゼロに等しくなるようにリセットし、リセットされたPOC値を使用して、現在のピクチャを復号するように構成され得る。
[0147]このようにして、ビデオデコーダ30は、ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化し、POC値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、POC値の一部がゼロに等しくなるように、POC値の少なくとも一部をリセットし、リセットされたPOC値を使用して、ビデオデータをコード化するように構成されるビデオコーダの一例を表す。
[0148]図4は、コード化ビデオピクチャ100〜132のシーケンスを示す概念図である。ピクチャは、階層予測構造内の位置を示すために異なる陰影を付けられている。たとえば、ピクチャ100、116、および132は、ピクチャ100、116、132が階層予測構造の最上位にあることを表すために黒の陰影を付けられている。ピクチャ100、116、132は、たとえば、単一の方向にある他のピクチャ(たとえば、Pピクチャ)から予測されるイントラコード化ピクチャまたはインターコード化ピクチャを備え得る。イントラコード化の場合、ピクチャ100、116、132は同じピクチャ内のデータからのみ予測される。インターコード化の場合、ピクチャ116は、たとえば、ピクチャ116からピクチャ100への破線矢印で示すように、ピクチャ100のデータに対してコーディングされ得る。ピクチャ116、132は、それぞれ、ピクチャグループ(GOP)134、136のキーピクチャを形成する。
[0149]ピクチャ108、124は、それらが、符号化階層においてピクチャ100、116、および132の次であることを示すために暗い陰影を付けられている。ピクチャ108、124は、双方向、インターモード予測符号化ピクチャを備え得る。たとえば、ピクチャ108はピクチャ100および116のデータから予測され得、ピクチャ124はピクチャ116および132から予測され得る。ピクチャ104、112、120、および128は、それらが、符号化階層においてピクチャ108および124の次であることを示すために、明るい陰影を付けられている。ピクチャ104、112、120、および128はまた、双方向、インターモード予測符号化ピクチャを備え得る。たとえば、ピクチャ104はピクチャ100および108から予測され得、ピクチャ112はピクチャ108および116から予測され得、ピクチャ120はピクチャ116および124から予測され得、ピクチャ128はピクチャ124および132から予測され得る。
[0150]最後に、ピクチャ102、106、110、114、118、122、126、および130は、これらのピクチャが符号化階層において最下位であることを示すために白い陰影を付けられている。ピクチャ102、106、110、114、118、122、126、および130はまた、双方向、インターモード予測符号化ピクチャであり得る。ピクチャ102はピクチャ100および104から予測され得、ピクチャ106はピクチャ104および108から予測され得、ピクチャ110はピクチャ108および112から予測され得、ピクチャ114はピクチャ112および116から予測され得、ピクチャ118はピクチャ116および120から予測され得、ピクチャ122はピクチャ120および124から予測され得、ピクチャ126はピクチャ124および128から予測され得、ピクチャ130はピクチャ128および132から予測され得る。
[0151]ピクチャ100〜132は表示順序で示されている。すなわち、復号に続き、ピクチャ100はピクチャ102の前に表示され、ピクチャ102はピクチャ104の前に表示され、以下同様である。しかしながら、符号化階層により、ピクチャ100〜132は異なる順序で復号され得る。さらに、符号化された後、ピクチャ100〜132は、ピクチャ100〜132のための符号化データを含むビットストリーム中に復号順序で構成され得る。たとえば、ピクチャ116は、GOP134のピクチャのうち最後に表示され得る。しかしながら、符号化階層により、ピクチャ116はGOP134のうち最初に復号され得る。すなわち、ピクチャ108を適切に復号するために、たとえば、ピクチャ116は、ピクチャ108のための参照ピクチャとして働くために、最初に復号される必要があり得る。同様に、ピクチャ108はピクチャ104、106、110、および112のための参照フレームとして働き得、したがって、ピクチャ104、106、110、および112の前に復号される必要があり得る。
[0152]ピクチャが表示される時間は、プレゼンテーション時間と呼ばれることがあり、ピクチャが復号される時間は復号時間と呼ばれることがある。復号時間およびプレゼンテーション時間は、概して、同じシーケンスの他のピクチャに対する時間的順序の指示を与える。ピクチャの復号時間とピクチャのプレゼンテーション時間との間の差は、ピクチャのためのピクチャ並べ替え遅延と呼ばれることがある。
[0153]本開示の技術によれば、ピクチャのうちの1つが、(異なるビデオコーディングレイヤの)IRAPピクチャも含むアクセスユニットに含まれる非IRAPピクチャであるとき、ビデオコーダ(たとえば、ビデオエンコーダ20および/またはビデオデコーダ30)は、ビデオコーディングレイヤにおけるピクチャのPOC値を調整することができる。たとえば、ピクチャ132がPピクチャであり、IRAPピクチャである別のビデオコーディングレイヤのピクチャとコロケートされる(すなわち、ピクチャと同じアクセスユニットに含まれる)と仮定する。この例では、ピクチャ132は、IRAPピクチャと同じアクセスユニットに含まれる非IRAPピクチャである(それがインターコード化されるので)。
[0154]したがって、上記に記載した例を続けると、ビデオコーダは、ピクチャ132のPOC値がリセットされるべきであることを示すシンタックス要素の値をコード化する。すなわち、シンタックス要素は、ピクチャ132のPOC値の少なくとも一部が(ゼロの値に)リセットされるべきであることを示すことになる。したがって、ビデオコーダは、ピクチャ132のPOC値を調整することができる。たとえば、シンタックス要素がpoc_msb_reset_flagである上記で説明した実施例1によれば、ビデオコーダは、ピクチャ132のPOC値の最上位ビット(MSB)をゼロに等しくなるように設定することになる。別の例として、シンタックス要素がpoc_reset_flagである上記で説明した実施例2によれば、ビデオコーダは、ピクチャ132の全POC値をゼロに等しくなるように設定することになる。
[0155]ビデオコーダは、他のピクチャのPOC値を調整することもできる。たとえば、そのピクチャ100および116が前にコーディングされたと仮定すると、ビデオコーダは、ピクチャ132のリセットされたPOC値に基づいて、ピクチャ100および116のPOC値を調整することができる。図4の例では、ピクチャ132のPOC値は、ピクチャ116のPOC値よりも8大きく、ピクチャ100のPOC値よりも16大きい。実施例2では、全POC値がリセットされる場合、ビデオコーダは、ピクチャ100のPOC値を−16(負の16)に等しくなるように、ピクチャ116のPOC値を−8(負の8)に等しくなるように調整することができる。このようにして、ピクチャ132とピクチャ100および116とのPOC値の間の差は、POC値がリセットされる前に対して、POC値がリセットされた後、一定のままであり得る。
[0156]上記の例は、ピクチャ132をコード化するとき、これらのピクチャが復号ピクチャバッファ(DPB)にすでに存在するという仮定に基づいて、ピクチャ100および116のPOC値を変更することを説明した。いくつかの場合には、ピクチャ102〜114もDPBに存在してもよく、この場合、ビデオコーダは同様にピクチャ102〜114のPOC値を調整することができる。しかしながら、ピクチャ118〜130はピクチャ132から従属し得るので、ピクチャ132がリセットされるべきとき、ピクチャ118〜130がDPBに存在しないことが予想される。すなわち、ピクチャ118〜130は、ピクチャ132の復号順よりも後である復号順を有する。したがって、ビデオコーダは、ピクチャ118〜130のPOC値を調整する必要はない。いくつかの例では、ピクチャ102〜114も、ピクチャ132の復号順よりも後である復号順を有し得る。
[0157]図5は、本開示の技法による、ビデオデータを符号化する例示的な方法を示すフローチャートである。ビデオエンコーダ20は、図5の方法を実行するものとして記載される。ただし、他のコーディングデバイスが、この方法または同様の方法を実行するように構成され得ることを理解されたい。さらに、本方法のステップは、異なる順序で、または並行して実行され得、いくつかのステップは追加または省略され得る。
[0158]図5の例では、ビデオエンコーダ20は、第1のビデオコーディングレイヤのピクチャを最初に符号化する(150)。上記で説明したように、レイヤは、スケーラブルビデオコーディングレイヤまたはマルチビュービデオコーディングのビューに対応し得る。このコンテキストでの「第1の」という用語の使用は、順序を示すというよりむしろ名目であるものとし、いくつかの例ではビデオエンコーダ20は、図5に関して述べられる第1のレイヤより前に、1つまたは複数の追加のビデオコーディングレイヤを符号化している可能性がある。第1のビデオコーディングレイヤのピクチャの符号化は、一般に、イントラランダムアクセスポイント(IRAP)ピクチャとして、第1のレイヤのいくつかのピクチャを符号化し、(時間的であるかレイヤ間であるかにかかわらず)たとえばインター予測されたピクチャなど、非IRAPピクチャとして別のピクチャを符号化することを伴う。
[0159]次いで、ビデオエンコーダ20は、第1のビデオコーディングレイヤのIRAPピクチャとコロケートされる第2のビデオコーディングレイヤのピクチャを決定し得る(152)。しかしながら、ビデオエンコーダ20は、第2のビデオコーディングレイヤのこのピクチャを非IRAPピクチャとして符号化することを決定し得る(154)。たとえば、ビデオエンコーダ20は、時間的インター予測、および/またはレイヤ間(たとえば、ビュー間)予測を使用してピクチャを符号化することを決定することができる。
[0160]ピクチャが非IRAPピクチャであり、しかし、IRAPピクチャとコロケートされる(たとえば、IRAPピクチャと同じアクセスユニットに含まれる)結果として、ビデオエンコーダ20は、ピクチャのPOC値の少なくとも一部がリセットされるべきであることを示すシンタックス要素の値を符号化することができる(156)。たとえば、シンタックス要素は、上記で説明した実施例1のpoc_msb_reset_flag、または上記で説明した実施例2のpoc_reset_flagを備え得る。さらに、ビデオエンコーダ20は、ピクチャ、同じレイヤおよび同じコード化ビデオシーケンスにある前に符号化されたピクチャのPOC値を調整することができる(158)。特に、ビデオエンコーダ20は、他のピクチャのPOC値と現在のピクチャのPOC値との間の差が、現在のピクチャのPOC値をリセットした後リセット前と同じままであるように、他のピクチャのPOC値を調整することができる。
[0161]ビデオエンコーダ20はさらに、ピクチャを符号化することができる(160)。すなわち、ピクチャのブロックごとに、ビデオエンコーダ20は、ブロックを(時間的またはレイヤ間予測を使用して)イントラ予測するかインター予測するかを決定することができる。ビデオエンコーダ20は、次いで、ピクチャを復号することができ(162)、復号されたピクチャを復号ピクチャバッファ(DPB)、たとえば、参照ピクチャメモリ64に記憶することができる。ビデオエンコーダ20は、次いで、復号されたピクチャに対して、(たとえば、後のコーディング順を有する同じレイヤにおけるピクチャ、または異なるレイヤの同じアクセスユニットにおけるピクチャなど)次のピクチャの一部を符号化し得る(166)。復号されたピクチャを識別するために、ビデオエンコーダ20は、次のピクチャのブロックの動き情報として、復号されたピクチャのリセットされたPOC値を符号化することができる(168)。
[0162]このようにして、図5の方法は、ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部をゼロの値にリセットすべきかどうかを決定することと、POC値の少なくとも一部をリセットすることを決定することに応答して、第1のPOC値の一部がゼロに等しくなるように、POC値の少なくとも一部をリセットすることと、POC値の少なくとも一部がゼロの値にリセットされるべきであることを示すシンタックス要素の値を符号化することと、リセットされたPOC値を使用してビデオデータを符号化することとを含む方法の一例を表す。
[0163]図6は、本開示の技法による、ビデオデータを復号する例示的な方法を示すフローチャートである。ビデオデコーダ30は、図6の方法を実行するものとして記載される。ただし、他のコーディングデバイスが、この方法または同様の方法を実行するように構成され得ることを理解されたい。さらに、本方法のステップは、異なる順序で、または並行して実行され得、いくつかのステップは追加または省略され得る。
[0164]図6の例では、ビデオデコーダ30は、第1のビデオコーディングレイヤのピクチャを最初に復号する(180)。上記で説明したように、レイヤは、スケーラブルビデオコーディングレイヤまたはマルチビュービデオコーディングのビューに対応し得る。このコンテキストでの「第1の」という用語の使用は、順序を示すというよりむしろ名目であるものとし、いくつかの例では、ビデオデコーダ30は、図6に関して述べられる第1のレイヤより前に、1つまたは複数の追加のビデオコーディングレイヤを復号している可能性がある。第1のビデオコーディングレイヤのピクチャの復号は、一般に、イントラランダムアクセスポイント(IRAP)ピクチャとして、第1のレイヤのいくつかのピクチャを復号し、(時間的であるかレイヤ間であるかにかかわらず)たとえばインター予測されたピクチャなど、非IRAPピクチャとして別のピクチャを復号することを伴う。
[0165]次いで、ビデオデコーダ30は、ピクチャのPOC値の少なくとも一部がリセットされるべきであることを示す第1のビデオコーディングレイヤのIRAPピクチャとコロケートされる(すなわち、同じアックセスユニットにある)第2のビデオコーディングレイヤのピクチャのシンタックス要素を復号することができる(182)。たとえば、シンタックス要素は、上記で説明した実施例1のpoc_msb_reset_flag、または上記で説明した実施例2のpoc_reset_flagを備え得る。このシンタックス要素の値に基づいて、ビデオデコーダ30は、ピクチャのPOC値と、同じレイヤおよび同じコード化ビデオシーケンスにある前に復号されたピクチャのPOC値とを調整することができる(184)。特に、ビデオデコーダ30は、他のピクチャのPOC値と現在のピクチャのPOC値との間の差が、現在のピクチャのPOC値をリセットした後リセット前と同じままであるように、他のピクチャのPOC値を調整することができる。
[0166]ビデオデコーダ30はまた、ピクチャを復号することができ(186)、復号されたピクチャを復号ピクチャバッファ(DPB)、たとえば、参照ピクチャメモリ82に記憶することができる(188)。ピクチャを復号することは、イントラ予測、時間的インター予測、および/またはレイヤ間予測を使用してピクチャのブロックを復号することを含み得る。レイヤ間予測を実行するとき、ビデオデコーダ30は、現在のピクチャのリセットされたPOC値に等しい別のレイヤ(たとえば、第1のレイヤにおけるIRAPピクチャ)における参照ピクチャのPOC値を復号することができる。時間的インター予測を実行するとき、ビデオデコーダ30は、DPBにおける参照ピクチャのPOC値を復号することができ、ここにおいて、復号されたPOC値は、DPBにおける前に復号されたピクチャのうちの1つの調整されたPOC値のうちの1つに対応し得る。
[0167]さらに、ビデオデコーダ30は、その後復号されるべきピクチャの参照ピクチャとして、復号ピクチャを使用することができる。すなわち、ビデオデコーダ30は、次のピクチャのブロックの動き情報(たとえば、動きパラメータ)として、復号されたピクチャのリセットされたPOC値を復号することができる(190)。その後のピクチャは、第2のレイヤにおける次のピクチャ、または異なるレイヤのピクチャ(たとえば、復号ピクチャと同じアクセスユニットにおけるピクチャ)でもよい。いずれにせよ、復号された動き情報は、復号ピクチャのPOC値への参照を含み得、これは、復号ピクチャのためのリセットされたPOC値(すなわち、リセットより前のピクチャのPOC値でない)に対応する。次のピクチャのブロックの動き情報としてこの復号されたPOC値に基づいて、ビデオデコーダ30は、復号ピクチャに対する次のピクチャのブロックを復号することができる(192)。
[0168]このようにして、図6の方法は、ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すかどうかを決定することと、POC値の一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すとき、POC値の一部がゼロに等しくなるように、POC値の少なくとも一部をリセットすることと、リセットされたPOC値を使用してビデオデータを復号することとを含む方法の一例を表す。
[0169]1つまたは複数の例では、述べられた機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで、実施されてもよい。ソフトウェアで実施される場合、諸機能は、1つまたは複数の命令またはコードとして、コンピュータ可読媒体を介して記憶または伝送され得、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの、有形の媒体に相当するコンピュータ可読記憶媒体、またはコンピュータプログラムの、ある場所から別の場所への、たとえば、通信プロトコルによる転送を促進する任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、一般に、(1)非一時的である有形のコンピュータ可読記憶媒体または(2)信号もしくはキャリア波などの通信媒体に相当し得る。データ記憶媒体は、本開示に記載される技法の実施のために、1つもしくは複数のコンピュータまたは1つもしくは複数のプロセッサによって、命令、コードおよび/またはデータ構造を取り出すためにアクセスされ得る、任意の利用できる媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含むことできる。
[0170]例として、それに限定されず、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMもしくは他の光ディスク記憶装置、磁気ディスク記憶装置もしくは他の磁気記憶デバイス、フラッシュメモリ、または命令もしくはデータ構造の形態で所望のプログラムコードを記憶するために使用可能であり、コンピュータによってアクセス可能な他の任意の媒体を備えることができる。同様に、いかなる接続も、コンピュータ可読媒体と当然のことながら呼ばれる。たとえば、命令が、ウェブサイト、サーバ、または他の遠隔ソースから、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して伝送される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、または赤外線、無線、マイクロ波などのワイヤレス技術は、媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、キャリア波、信号、または他の一時的な媒体を含まないが、代わりに、非一時的な、有形の記憶媒体を対象とすることを理解されたい。本明細書において、ディスク(disk)およびディスク(disc)は、コンパクトディスク(CD)、レーザーディスク(登録商標)、光ディスク、デジタルバーサタイルディスク(DVD)、フロッピー(登録商標)ディスクおよびブルーレイ(登録商標)ディスクを含み、この場合、ディスク(disk)は、通常、磁気的にデータを再生し、一方ディスク(disc)は、レーザーを用いてデータを光学的に再生する。上述したものの組合せも、コンピュータ可読媒体の範囲の中に含められるべきである。
[0171]命令は、1つまたは複数のデジタルシグナルプロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または他の同等の統合された、もしくは個別の論理回路などの、1つまたは複数のプロセッサによって実行され得る。したがって、「プロセッサ」という用語は、本明細書において、前述の構造のうちの任意のものまたは本明細書に記載される技法の実施のために適当な任意の他の構造を参照し得る。加えて、いくつかの態様では、本明細書に記載される機能性は、符号化および復号のために構成され、または組み合わされたコーデックに組み込まれる、専用のハードウェア内および/またはソフトウェアモジュール内で提供され得る。また、技法は、1つまたは複数の回路または論理素子内で完全に実施されてよい。
[0172]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)、またはICのセット(たとえば、チップセット)を含む多種多様なデバイスまたは装置において実施されてよい。様々な構成要素、モジュール、またはユニットは、開示された技法を実行するように構成されるデバイスの機能上の態様を強調するために、本開示に記載されるが、必ずしも異なるハードウェアユニットによる実現を求めるとは限らない。むしろ、上述したように、様々なユニットは、コーデックハードウェアユニットの中で組み合わされ、または、上述される1つまたは複数のプロセッサを含む、適当なソフトウェアおよび/またはファームウェアと一緒に相互作用するハードウェアユニットが集まったものによって提供され得る。
[0173]様々な例が、述べられた。これらおよび他の例は、以下の特許請求の範囲の範囲内である。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオデータを復号する方法であって、
ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すかどうかを決定することと、
前記POC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記POC値の前記一部がゼロに等しくなるように、前記POC値の少なくとも前記一部をリセットすることと、
前記リセットされたPOC値を使用してビデオデータを復号することと
を備える方法。
[C2]
前記シンタックス要素の前記値は、前記POC値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記方法は、前記POC値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記POC値のすべてのビットがゼロに等しくなるように前記POC値をリセットすることをさらに備える、
C1に記載の方法。
[C3]
前記ピクチャは、第1のピクチャを備え、前記方法は、前記第1のピクチャを第1のビデオコーディングレイヤに含み、第2のピクチャを第2のビデオコーディングレイヤに含むアクセスユニットを受信することをさらに備え、前記第2のビデオコーディングレイヤは、前記第1のビデオコーディングレイヤとは異なり、前記POC値をリセットする前には、前記第1のピクチャの前記POC値は、前記第2のピクチャの第2のPOC値とは異なる、
C1に記載の方法。
[C4]
前記第1のピクチャの前記POCをリセットすることは、前記リセット後、前記第1のピクチャの前記POC値は、前記第2のピクチャの前記POC値に等しくなるように、前記第1のピクチャの前記POC値をリセットすることを備える、
C3に記載の方法。
[C5]
前記第2のピクチャは、NoRaslOutputFlagシンタックス要素が1に等しいイントラランダムアクセスポイント(IRAP)ピクチャを備え、前記第1のピクチャが非IRAPピクチャを備える、
C3に記載の方法。
[C6]
前記IRAPピクチャは、瞬時デコーダリフレッシュ(IDR)ピクチャ、クリーンランダムアクセス(CRA)ピクチャ、またはリンク切断アクセス(BLA)ピクチャのうちの1つを備える、
C5に記載の方法。
[C7]
前記アクセスユニットは、前記第1のビデオコーディングレイヤおよび前記第2のビデオコーディングレイヤとは異なる第3のビデオコーディングレイヤにおける第3のピクチャをさらに含み、前記リセットされたPOC値を使用してビデオデータを復号することが、ブロックが前記リセットされたPOC値の参照を含むとき、前記第1のピクチャに対するレイヤ間予測を使用して前記第3のピクチャの前記ブロックを復号することを備える、
C3に記載の方法。
[C8]
前記ピクチャは、第1のピクチャを備え、前記POC値は、第1のPOC値を備え、前記方法は、前記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、
第2のピクチャの第2のPOC値を決定すること、ここにおいて、前記第1のピクチャおよび前記第2のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
前記第1のPOC値と前記第2のPOC値との間の第1の差を決定することと、
デクリメントされた第2のPOC値と前記リセットされた第1のPOC値との間の第2の差が前記第1の差に等しいように前記第2のPOC値をデクリメントすることと
をさらに備える、C1に記載の方法。
[C9]
前記ピクチャは、第1のピクチャを備え、前記POC値は、第1のPOC値を備え、前記方法は、前記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、
前記ピクチャを有する共通のビデオコーディングレイヤにおける複数の他のピクチャのPOC値を決定することと、
前記第1のPOC値と前記他のピクチャの前記POC値との間の差を決定することと、
デクリメントされたPOC値と前記リセットされた第1のPOC値との間のそれぞれの差が前記第1のPOC値と前記他のピクチャの前記POC値との間の前記それぞれの決定された差に等しくなるように、前記他のピクチャの前記POC値をデクリメントすることと
をさらに備える、C1に記載の方法。
[C10]
参照ピクチャセットのデータは、前記他のピクチャが短期参照ピクチャであるか長期参照ピクチャであるかを示し、前記POC値をデクリメントすることは、
前記短期参照ピクチャの前記POC値をデクリメントすることと、
前記長期参照ピクチャの前記POC値をデクリメントすることと
を備える、C9に記載の方法。
[C11]
前記シンタックス要素は、POCリセットフラグである、
C1に記載の方法。
[C12]
前記シンタックス要素を含むスライスヘッダを復号することをさらに備える、
C1に記載の方法。
[C13]
前記一部は、前記POC値の最上位ビット(MSB)を備える、
C1に記載の方法。
[C14]
ビデオデータを符号化する方法であって、
ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部をゼロの値にリセットすべきかどうかを決定することと、
前記POC値の前記少なくとも一部をリセットすることを決定することに応答して、前記第1のPOC値の前記一部がゼロに等しくなるように、前記POC値の少なくとも前記一部をリセットし、前記POC値の少なくとも前記一部がゼロの前記値にリセットされるべきことを示すシンタックス要素の値を符号化することと、
前記リセットされたPOC値を使用してビデオデータを符号化することと
を備える方法。
[C15]
前記シンタックス要素の前記値は、前記POC値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記方法は、前記POC値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記POC値のすべてのビットがゼロに等しくなるように前記POC値をリセットすることをさらに備える、
C14に記載の方法。
[C16]
前記ピクチャは、第1のピクチャを備え、前記方法は、前記第1のピクチャを第1のビデオコーディングレイヤに含み、第2のピクチャを第2のビデオコーディングレイヤに含むアクセスユニットを形成することをさらに備え、前記第2のビデオコーディングレイヤは、前記第1のビデオコーディングレイヤとは異なり、前記POC値をリセットする前には、前記第1のピクチャの前記POC値は、前記第2のピクチャの第2のPOC値とは異なる、
C14に記載の方法。
[C17]
前記第2のピクチャは、NoRaslOutputFlagシンタックス要素が1に等しいイントラランダムアクセスポイント(IRAP)ピクチャを備え、前記第1のピクチャが非IRAPピクチャを備えるとき、リセットすべきかどうかを決定することは、前記POC値をリセットすることを決定することを備える、
C16に記載の方法。
[C18]
前記アクセスユニットを形成することは、前記第1のビデオコーディングレイヤおよび前記第2のビデオコーディングレイヤとは異なる第3のビデオコーディングレイヤにおける第3のピクチャを含むように前記アクセスユニットを形成することをさらに備え、前記リセットされたPOC値を使用してビデオデータを符号化することは、
前記第1のピクチャに対してレイヤ間予測を使用して前記第3のピクチャのブロックを符号化することと、
前記リセットされたPOC値を参照するために、前記ブロックのシンタックス要素を符号化することと
を備える、C16に記載の方法。
[C19]
前記ピクチャは、第1のピクチャを備え、前記POC値は、第1のPOC値を備え、前記方法は、前記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、
第2のピクチャの第2のPOC値を決定すること、前記第1のピクチャおよび前記第2のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
前記第1のPOC値と前記第2のPOC値との間の第1の差を決定することと、
デクリメントされた第2のPOC値と前記リセットされた第1のPOC値との間の第2の差が前記第1の差に等しいように前記第2のPOC値をデクリメントすることと
をさらに備える、C14に記載の方法。
[C20]
ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化することと、前記POC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記POC値の前記一部がゼロに等しくなるように、前記POC値の少なくとも前記一部をリセットすることと、前記リセットされたPOC値を使用してビデオデータをコード化することと
を行うように構成されるビデオコーダを備える、ビデオデータをコード化するためのデバイス。
[C21]
前記シンタックス要素の前記値は、前記POC値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記ビデオコーダは、前記POC値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記POC値のすべてのビットがゼロに等しくなるように前記POC値をリセットすることを行うようにさらに構成される、
C20に記載のデバイス。
[C22]
前記ピクチャは、第1のピクチャを備え、前記ビデオコーダは、前記第1のピクチャを第1のビデオコーディングレイヤに含み、第2のピクチャを第2のビデオコーディングレイヤに含むアクセスユニットをコード化することを行うように構成され、前記第2のビデオコーディングレイヤは、前記第1のビデオコーディングレイヤとは異なり、前記POC値をリセットする前には、前記第1のピクチャの前記POC値は、前記第2のピクチャの第2のPOC値とは異なる、
C20に記載のデバイス。
[C23]
前記第2のピクチャは、NoRaslOutputFlagシンタックス要素が1に等しいイントラランダムアクセスポイント(IRAP)ピクチャを備え、前記第1のピクチャは、瞬間デコーダリフレッシュ(IDR)ピクチャ、クリーンランダムアクセス(CRA)ピクチャ、または切断ンリンクアクセス(BLA)ピクチャのうちの1つを備える非IRAPピクチャを備える、
C22に記載のデバイス。
[C24]
前記アクセスユニットは、前記第1のビデオコーディングレイヤおよび前記第2のビデオコーディングレイヤとは異なる第3のビデオコーディングレイヤにおける第3のピクチャをさらに含み、前記リセットされたPOC値を使用してビデオデータをコード化するために、前記ビデオコーダは、ブロックが前記リセットされたPOC値の参照を含むとき、前記第1のピクチャに対するレイヤ間予測を使用して前記第3のピクチャの前記ブロックをコード化することを行うように構成される、
C22に記載のデバイス。
[C25]
前記ピクチャは、第1のピクチャを備え、前記POC値は、第1のPOC値を備え、前記ビデオコーダは、前記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、第2のピクチャの第2のPOC値を決定すること、ここにおいて、前記第1のピクチャおよび前記第2のピクチャは、共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、前記第1のPOC値と前記第2のPOC値との間の第1の差を決定することと、デクリメントされた第2のPOC値と前記リセットされた第1のPOC値との間の第2の差が前記第1の差に等しくなるように、前記第2のPOC値をデクリメントすることと
を行うように構成される、C20に記載のデバイス。
[C26]
前記シンタックス要素は、POCリセットフラグである、
C20に記載のデバイス。
[C27]
前記デバイスは、前記リセットされたPOC値を使用してビデオデータを復号するように構成されたビデオデコーダを備える、
C20に記載のデバイス。
[C28]
前記デバイスは、前記リセットされたPOC値を使用してビデオデータを符号化するように構成されたビデオエンコーダを備える、
C20に記載のデバイス。
[C29]
前記デバイスが、
集積回路、
マイクロプロセッサ、および
ワイヤレス通信デバイス
のうちの少なくとも1つを備える、C20に記載のデバイス。
[C30]
ビデオデータをコード化するためのデバイスであって、
ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化するための手段と、
前記POC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記POC値の前記一部がゼロに等しくなるように、前記POC値の少なくとも前記一部をリセットするための手段と、
前記リセットされたPOC値を使用してビデオデータをコード化するための手段と
を備えるデバイス。
[C31]
前記シンタックス要素の前記値は、前記POC値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記リセットするための手段は、前記POC値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記POC値のすべてのビットがゼロに等しくなるように前記POC値をリセットするための手段を備える、
C30に記載のデバイス。
[C32]
前記ピクチャは、第1のピクチャを備え、前記第1のピクチャを第1のビデオコーディングレイヤに含み、第2のピクチャを第2のビデオコーディングレイヤに含むアクセスユニットをコード化するための手段をさらに備え、前記第2のビデオコーディングレイヤは、前記第1のビデオコーディングレイヤとは異なり、前記POC値をリセットする前には、前記第1のピクチャの前記POC値は、前記第2のピクチャの第2のPOC値とは異なる、
C30に記載のデバイス。
[C33]
前記第2のピクチャは、NoRaslOutputFlagシンタックス要素が1に等しいイントラランダムアクセスポイント(IRAP)ピクチャを備え、前記第1のピクチャが、瞬間デコーダリフレッシュ(IDR)ピクチャ、クリーンランダムアクセス(CRA)ピクチャ、または切断ンリンクアクセス(BLA)ピクチャのうちの1つを備える非IRAPピクチャを備える、
C32に記載のデバイス。
[C34]
前記アクセスユニットは、前記第1のビデオコーディングレイヤおよび前記第2のビデオコーディングレイヤとは異なる第3のビデオコーディングレイヤにおける第3のピクチャをさらに含み、前記リセットされたPOC値を使用してビデオデータを前記コード化するための手段は、ブロックが前記リセットされたPOC値の参照を含むとき、前記第1のピクチャに対するレイヤ間予測を使用して前記第3のピクチャの前記ブロックをコード化するための手段を備える、
C32に記載のデバイス。
[C35]
前記ピクチャは、第1のピクチャを備え、前記POC値は、第1のPOC値を備え、
前記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、第2のピクチャの第2のPOC値を決定するための手段、ここにおいて、前記第1のピクチャおよび前記第2のピクチャが、共通のビデオコーディングレイヤおよび共通コード化ビデオシーケンスにある、と、
前記第1のPOC値と前記第2のPOC値との間の第1の差を決定するための手段と、
デクリメントされた第2のPOC値と前記リセットされた第1のPOC値との間の第2の差が前記第1の差に等しいように前記第2のPOC値をデクリメントするための手段と
をさらに備える、C30に記載のデバイス。
[C36]
前記シンタックス要素は、POCリセットフラグである、
C30に記載のデバイス。
[C37]
命令を記憶したコンピュータ可読記憶媒体であって、前記命令が、実行されると、ビデオデータをコード化するためのデバイスのプロセッサに、
ピクチャのピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化することと、
前記POC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記POC値の前記一部がゼロに等しくなるように、前記POC値の少なくとも前記一部をリセットすることと、
前記リセットされたPOC値を使用してビデオデータをコード化することと
を行わせる、コンピュータ可読記憶媒体。
[C38]
前記シンタックス要素の前記値は、前記POC値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記プロセッサに、前記POC値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、前記POC値のすべてのビットがゼロに等しくなるように前記POC値をリセットすることを行わせる命令をさらに備える、
C37に記載のコンピュータ可読記憶媒体。
[C39]
前記ピクチャは、第1のピクチャを備え、前記プロセッサに、前記第1のピクチャを第1のビデオコーディングレイヤに含み、第2のピクチャを第2のビデオコーディングレイヤに含むアクセスユニットをコード化させる命令をさらに備え、前記第2のビデオコーディングレイヤは、前記第1のビデオコーディングレイヤとは異なり、前記POC値をリセットする前には、前記第1のピクチャの前記POC値は、前記第2のピクチャの第2のPOC値とは異なる、
C37に記載のコンピュータ可読記憶媒体。
[C40]
前記第2のピクチャは、NoRaslOutputFlagシンタックス要素が1に等しいイントラランダムアクセスポイント(IRAP)ピクチャを備え、前記第1のピクチャが、瞬間デコーダリフレッシュ(IDR)ピクチャ、クリーンランダムアクセス(CRA)ピクチャ、または切断ンリンクアクセス(BLA)ピクチャのうちの1つを備える非IRAPピクチャを備える、
C39に記載のコンピュータ可読記憶媒体。
[C41]
前記アクセスユニットは、前記第1のビデオコーディングレイヤおよび前記第2のビデオコーディングレイヤとは異なる第3のビデオコーディングレイヤにおける第3のピクチャをさらに含み、前記プロセッサに、前記リセットされたPOC値を使用してビデオデータをコード化させる前記命令は、前記プロセッサに、ブロックが前記リセットされたPOC値の参照を含むとき、前記第1のピクチャに対するレイヤ間予測を使用して前記第3のピクチャの前記ブロックをコード化することを行わせる命令を備える、
C39に記載のコンピュータ可読記憶媒体。
[C42]
前記ピクチャは、第1のピクチャを備え、前記POC値は、第1のPOC値を備え、前記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、前記プロセッサに、
第2のピクチャの第2のPOC値を決定すること、ここにおいて、前記第1のピクチャおよび前記第2のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
前記第1のPOC値と前記第2のPOC値との間の第1の差を決定することと、
デクリメントされた第2のPOC値と前記リセットされた第1のPOC値との間の第2の差が前記第1の差に等しいように前記第2のPOC値をデクリメントすることと
を行わせる命令をさらに備える、C37に記載のコンピュータ可読記憶媒体。
[C43]
前記シンタックス要素は、POCリセットフラグである、
C37に記載のコンピュータ可読記憶媒体。

Claims (38)

  1. ビデオデータを復号する方法であって、
    第1のピクチャの第1のピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであることをシンタックス要素の値が示すかどうかを決定することと、
    前記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、
    リセットされた第1のPOC値の前記一部がゼロに等しくなるように、前記第1のPOC値の少なくとも前記一部をリセットすることと、
    第2のピクチャの第2のPOC値を決定すること、ここにおいて、前記第1のピクチャおよび前記第2のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
    前記第1のPOC値と前記第2のPOC値との間の第1の差を決定することと、
    デクリメントされた第2のPOC値と前記リセットされた第1のPOC値との間の第2の差が前記第1の差に等しいように前記第2のPOC値をデクリメントすることと、
    前記リセットされた第1のPOC値および前記デクリメントされた第2のPOC値を使用してビデオデータを復号することと
    を備える方法。
  2. 前記シンタックス要素の前記値は、前記第1のPOC値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記方法は、前記第1のPOC値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第1のPOC値のすべてのビットがゼロに等しくなるように前記第1のPOC値をリセットすることをさらに備える、
    請求項1に記載の方法。
  3. 記第1のピクチャを第1のビデオコーディングレイヤに含み、第のピクチャを第2のビデオコーディングレイヤに含むアクセスユニットを受信することをさらに備え、前記第1のビデオコーディングレイヤは、前記共通のビデオコーディングレイヤを備え、前記第2のビデオコーディングレイヤは、前記第1のビデオコーディングレイヤとは異なり、前記第1のPOC値をリセットする前には、前記第1のピクチャの前記第1のPOC値は、前記第のピクチャの第のPOC値とは異なる、
    請求項1に記載の方法。
  4. 前記第1のピクチャの前記第1のPOCをリセットすることは、前記リセット後、前記第1のピクチャの前記リセットされた第1のPOC値は、前記第のピクチャの前記第3のPOC値に等しくなるように、前記第1のピクチャの前記第1のPOC値をリセットすることを備える、
    請求項3に記載の方法。
  5. 前記第のピクチャは、NoRaslOutputFlagシンタックス要素が1に等しいイントラランダムアクセスポイント(IRAP)ピクチャを備え、前記第1のピクチャが非IRAPピクチャを備える、
    請求項3に記載の方法。
  6. 前記IRAPピクチャは、瞬時デコーダリフレッシュ(IDR)ピクチャ、クリーンランダムアクセス(CRA)ピクチャ、またはリンク切断アクセス(BLA)ピクチャのうちの1つを備える、
    請求項5に記載の方法。
  7. 前記アクセスユニットは、前記第1のビデオコーディングレイヤおよび前記第2のビデオコーディングレイヤとは異なる第3のビデオコーディングレイヤにおける第のピクチャをさらに含み、前記リセットされた第1のPOC値を使用してビデオデータを復号することが、ブロックが前記リセットされた第1のPOC値の参照を含むとき、前記第1のピクチャに対するレイヤ間予測を使用して前記第のピクチャの前記ブロックを復号することを備える、
    請求項3に記載の方法。
  8. 記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、
    前記第1のピクチャを有する前記共通のビデオコーディングレイヤにおける複数の他のピクチャのPOC値を決定すること、ここにおいて、前記複数の他のピクチャは、前記第1のピクチャおよび前記第2のピクチャ以外のピクチャを含む、と、
    前記第1のPOC値と前記他のピクチャの前記POC値との間の差を決定することと、
    デクリメントされたPOC値と前記リセットされた第1のPOC値との間のそれぞれの差が前記第1のPOC値と前記他のピクチャの前記POC値との間の前記それぞれの決定された差に等しくなるように、前記他のピクチャの前記POC値をデクリメントすることと
    をさらに備える、請求項1に記載の方法。
  9. 参照ピクチャセットのデータは、前記他のピクチャが短期参照ピクチャであるか長期参照ピクチャであるかを示し、前記POC値をデクリメントすることは、
    前記短期参照ピクチャの前記POC値をデクリメントすることと、
    前記長期参照ピクチャの前記POC値をデクリメントすることと
    を備える、請求項に記載の方法。
  10. 前記シンタックス要素は、POCリセットフラグを備える、
    請求項1に記載の方法。
  11. 前記シンタックス要素を含むスライスヘッダを復号することをさらに備える、
    請求項1に記載の方法。
  12. 前記一部は、前記第1のPOC値の最上位ビット(MSB)を備える、
    請求項1に記載の方法。
  13. ビデオデータを符号化する方法であって、
    第1のピクチャの第1のピクチャオーダーカウント(POC)値の少なくとも一部をゼロの値にリセットすべきかどうかを決定することと、
    前記第1のPOC値の前記少なくとも一部をリセットすることを決定することに応答して、
    リセットされた第1のPOC値の前記一部がゼロに等しくなるように、前記第1のPOC値の少なくとも前記一部をリセットすることと
    前記第1のPOC値の少なくとも前記一部がゼロの前記値にリセットされるべきことを示すシンタックス要素の値を符号化することと、
    第2のピクチャの第2のPOC値を決定すること、ここにおいて、前記第1のピクチャおよび前記第2のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
    前記第1のPOC値と前記第2のPOC値との間の第1の差を決定することと、
    デクリメントされた第2のPOC値と前記リセットされた第1のPOC値との間の第2の差が前記第1の差に等しいように前記第2のPOC値をデクリメントすることと、
    前記リセットされた第1のPOC値および前記デクリメントされた第2のPOC値を使用してビデオデータを符号化することと
    を備える方法。
  14. 前記シンタックス要素の前記値は、前記第1のPOC値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記方法は、前記第1のPOC値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第1のPOC値のすべてのビットがゼロに等しくなるように前記第1のPOC値をリセットすることをさらに備える、
    請求項13に記載の方法。
  15. 記第1のピクチャを第1のビデオコーディングレイヤに含み、第のピクチャを第2のビデオコーディングレイヤに含むアクセスユニットを形成することをさらに備え、前記第1のビデオコーディングレイヤは、前記共通のビデオコーディングレイヤを備え、前記第2のビデオコーディングレイヤは、前記第1のビデオコーディングレイヤとは異なり、前記POC値をリセットする前には、前記第1のピクチャの前記第1のPOC値は、前記第のピクチャの第のPOC値とは異なる、
    請求項13に記載の方法。
  16. 前記第のピクチャは、NoRaslOutputFlagシンタックス要素が1に等しいイントラランダムアクセスポイント(IRAP)ピクチャを備え、前記第1のピクチャが非IRAPピクチャを備えるとき、リセットすべきかどうかを決定することは、前記第1のPOC値をリセットすることを決定することを備える、
    請求項15に記載の方法。
  17. 前記アクセスユニットを形成することは、前記第1のビデオコーディングレイヤおよび前記第2のビデオコーディングレイヤとは異なる第3のビデオコーディングレイヤにおける第のピクチャを含むように前記アクセスユニットを形成することをさらに備え、前記リセットされた第1のPOC値を使用してビデオデータを符号化することは、
    前記第1のピクチャに対してレイヤ間予測を使用して前記第のピクチャのブロックを符号化することと、
    前記リセットされた第1のPOC値を参照するために、前記ブロックのシンタックス要素を符号化することと
    を備える、請求項15に記載の方法。
  18. ビデオデータをコード化するためのデバイスであって、
    ビデオデータを記憶するように構成されたメモリと、
    第1のピクチャの第1のピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化することと、
    前記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、
    リセットされた第1のPOC値の前記一部がゼロに等しくなるように、前記第1のPOC値の少なくとも前記一部をリセットすることと、
    第2のピクチャの第2のPOC値を決定すること、ここにおいて、前記第1のピクチャおよび前記第2のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
    前記第1のPOC値と前記第2のPOC値との間の第1の差を決定することと、
    デクリメントされた第2のPOC値と前記リセットされた第1のPOC値との間の第2の差が前記第1の差に等しいように前記第2のPOC値をデクリメントすることと、
    前記リセットされた第1のPOC値および前記デクリメントされた第2のPOC値を使用して前記ビデオデータをコード化することと
    を行うように構成されるビデオコーダ
    を備える、ビデオデータをコード化するためのデバイス。
  19. 前記シンタックス要素の前記値は、前記第1のPOC値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記ビデオコーダは、前記第1のPOC値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第1のPOC値のすべてのビットがゼロに等しくなるように前記第1のPOC値をリセットすることを行うようにさらに構成される、
    請求項18に記載のデバイス。
  20. 記ビデオコーダは、前記第1のピクチャを第1のビデオコーディングレイヤに含み、第のピクチャを第2のビデオコーディングレイヤに含むアクセスユニットをコード化することを行うように構成され、前記第1のビデオコーディングレイヤは、前記共通のビデオコーディングレイヤを備え、前記第2のビデオコーディングレイヤは、前記第1のビデオコーディングレイヤとは異なり、前記第1のPOC値をリセットする前には、前記第1のピクチャの前記第1のPOC値は、前記第のピクチャの第のPOC値とは異なる、
    請求項18に記載のデバイス。
  21. 前記第のピクチャは、NoRaslOutputFlagシンタックス要素が1に等しいイントラランダムアクセスポイント(IRAP)ピクチャを備え、前記第1のピクチャは、非IRAPピクチャを備える、
    請求項20に記載のデバイス。
  22. 前記アクセスユニットは、前記第1のビデオコーディングレイヤおよび前記第2のビデオコーディングレイヤとは異なる第3のビデオコーディングレイヤにおける第4のピクチャをさらに含み、前記リセットされた第1のPOC値を使用してビデオデータをコード化するために、前記ビデオコーダは、ブロックが前記リセットされた第1のPOC値の参照を含むとき、前記第1のピクチャに対するレイヤ間予測を使用して前記第のピクチャの前記ブロックをコード化することを行うように構成される、
    請求項20に記載のデバイス。
  23. 前記シンタックス要素は、POCリセットフラグを備える、
    請求項18に記載のデバイス。
  24. 前記ビデオコーダは、前記リセットされた第1のPOC値を使用して前記ビデオデータを復号するように構成されたビデオデコーダを備える、
    請求項18に記載のデバイス。
  25. 前記ビデオコーダは、前記リセットされた第1のPOC値を使用して前記ビデオデータを符号化するように構成されたビデオエンコーダを備える、
    請求項18に記載のデバイス。
  26. 前記デバイスが、
    集積回路、
    マイクロプロセッサ、および
    ワイヤレス通信デバイス
    のうちの少なくとも1つを備える、請求項18に記載のデバイス。
  27. ビデオデータをコード化するためのデバイスであって、
    第1のピクチャの第1のピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化するための手段と、
    前記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第1のPOC値の前記一部がゼロに等しくなるように、前記第1のPOC値の少なくとも前記一部をリセットするための手段と、
    前記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素が示すとき、第2のピクチャの第2のPOC値を決定するための手段、ここにおいて、前記第1のピクチャおよび前記第2のピクチャが、共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
    前記第1のPOC値と前記第2のPOC値との間の第1の差を決定するための手段と、
    デクリメントされた第2のPOC値と前記リセットされた第1のPOC値との間の第2の差が前記第1の差に等しいように前記第2のPOC値をデクリメントするための手段と、
    前記リセットされた第1のPOC値および前記デクリメントされた第2のPOC値を使用してビデオデータをコード化するための手段と
    を備えるデバイス。
  28. 前記シンタックス要素の前記値は、前記第1のPOC値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記リセットするための手段は、前記第1のPOC値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第1のPOC値のすべてのビットがゼロに等しくなるように前記第1のPOC値をリセットするための手段を備える、
    請求項27に記載のデバイス。
  29. 記第1のピクチャを第1のビデオコーディングレイヤに含み、第のピクチャを第2のビデオコーディングレイヤに含むアクセスユニットをコード化するための手段をさらに備え、前記第1のビデオコーディングレイヤは、前記共通のビデオコーディングレイヤを備え、前記第2のビデオコーディングレイヤは、前記第1のビデオコーディングレイヤとは異なり、前記第1のPOC値をリセットする前には、前記第1のピクチャの前記第1のPOC値は、前記第のピクチャの第のPOC値とは異なる、
    請求項27に記載のデバイス。
  30. 前記第のピクチャは、NoRaslOutputFlagシンタックス要素が1に等しいイントラランダムアクセスポイント(IRAP)ピクチャを備え、前記第1のピクチャが、非IRAPピクチャを備える、
    請求項29に記載のデバイス。
  31. 前記アクセスユニットは、前記第1のビデオコーディングレイヤおよび前記第2のビデオコーディングレイヤとは異なる第3のビデオコーディングレイヤにおける第のピクチャをさらに含み、前記リセットされた第1のPOC値を使用してビデオデータを前記コード化するための手段は、ブロックが前記リセットされた第1のPOC値の参照を含むとき、前記第1のピクチャに対するレイヤ間予測を使用して前記第のピクチャの前記ブロックをコード化するための手段を備える、
    請求項29に記載のデバイス。
  32. 前記シンタックス要素は、POCリセットフラグを備える、
    請求項27に記載のデバイス。
  33. 命令を記憶したコンピュータ可読記憶媒体であって、前記命令が、実行されると、ビデオデータをコード化するためのデバイスのプロセッサに、
    第1のピクチャの第1のピクチャオーダーカウント(POC)値の少なくとも一部がゼロの値にリセットされるべきであるかどうかを示すシンタックス要素の値をコード化することと、
    前記第1のPOC値の前記一部がゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、
    リセットされた第1のPOC値の前記一部がゼロに等しくなるように、前記第1のPOC値の少なくとも前記一部をリセットすることと、
    第2のピクチャの第2のPOC値を決定すること、ここにおいて、前記第1のピクチャおよび前記第2のピクチャが共通のビデオコーディングレイヤおよび共通のコード化ビデオシーケンスにある、と、
    前記第1のPOC値と前記第2のPOC値との間の第1の差を決定することと、
    デクリメントされた第2のPOC値と前記リセットされた第1のPOC値との間の第2の差が前記第1の差に等しいように前記第2のPOC値をデクリメントすることと、
    前記リセットされた第1のPOC値および前記デクリメントされた第2のPOC値を使用してビデオデータをコード化することと
    を行わせる、コンピュータ可読記憶媒体。
  34. 前記シンタックス要素の前記値は、前記第1のPOC値の前記一部を含むすべてのビットがゼロの前記値にリセットされるべきであるかどうかを示し、前記プロセッサに、前記第1のPOC値のすべてのビットがゼロの前記値にリセットされるべきであることを前記シンタックス要素の前記値が示すとき、リセットされた第1のPOC値のすべてのビットがゼロに等しくなるように前記第1のPOC値をリセットすることを行わせる命令をさらに備える、
    請求項33に記載のコンピュータ可読記憶媒体。
  35. 記プロセッサに、前記第1のピクチャを第1のビデオコーディングレイヤに含み、第のピクチャを第2のビデオコーディングレイヤに含むアクセスユニットをコード化させる命令をさらに備え、前記第1のビデオコーディングレイヤは、前記共通のビデオコーディングレイヤを備え、前記第2のビデオコーディングレイヤは、前記第1のビデオコーディングレイヤとは異なり、前記第1のPOC値をリセットする前には、前記第1のピクチャの前記第1のPOC値は、前記第のピクチャの第のPOC値とは異なる、
    請求項33に記載のコンピュータ可読記憶媒体。
  36. 前記第のピクチャは、NoRaslOutputFlagシンタックス要素が1に等しいイントラランダムアクセスポイント(IRAP)ピクチャを備え、前記第1のピクチャが、非IRAPピクチャを備える、
    請求項35に記載のコンピュータ可読記憶媒体。
  37. 前記アクセスユニットは、前記第1のビデオコーディングレイヤおよび前記第2のビデオコーディングレイヤとは異なる第3のビデオコーディングレイヤにおける第のピクチャをさらに含み、前記プロセッサに、前記リセットされた第1のPOC値を使用してビデオデータをコード化させる前記命令は、前記プロセッサに、ブロックが前記リセットされた第1のPOC値の参照を含むとき、前記第1のピクチャに対するレイヤ間予測を使用して前記第のピクチャの前記ブロックをコード化することを行わせる命令を備える、
    請求項35に記載のコンピュータ可読記憶媒体。
  38. 前記シンタックス要素は、POCリセットフラグを備える、
    請求項33に記載のコンピュータ可読記憶媒体。
JP2016506678A 2013-04-08 2014-04-07 アラインされていないirapピクチャを含み得るマルチレイヤビットストリームのクロスレイヤpocアラインメント Active JP6158422B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361809855P 2013-04-08 2013-04-08
US61/809,855 2013-04-08
US201361846532P 2013-07-15 2013-07-15
US61/846,532 2013-07-15
US14/245,115 US9532052B2 (en) 2013-04-08 2014-04-04 Cross-layer POC alignment for multi-layer bitstreams that may include non-aligned IRAP pictures
US14/245,115 2014-04-04
PCT/US2014/033172 WO2014168872A1 (en) 2013-04-08 2014-04-07 Cross-layer poc alignment for multi-layer bitstreams that may include non-aligned irap pictures

Publications (3)

Publication Number Publication Date
JP2016518776A JP2016518776A (ja) 2016-06-23
JP2016518776A5 JP2016518776A5 (ja) 2017-03-16
JP6158422B2 true JP6158422B2 (ja) 2017-07-05

Family

ID=51654433

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016506678A Active JP6158422B2 (ja) 2013-04-08 2014-04-07 アラインされていないirapピクチャを含み得るマルチレイヤビットストリームのクロスレイヤpocアラインメント

Country Status (9)

Country Link
US (1) US9532052B2 (ja)
EP (1) EP2984844B1 (ja)
JP (1) JP6158422B2 (ja)
KR (1) KR101818831B1 (ja)
CN (1) CN105122814B (ja)
BR (1) BR112015025639B1 (ja)
ES (1) ES2773276T3 (ja)
HU (1) HUE047299T2 (ja)
WO (1) WO2014168872A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9571834B2 (en) * 2011-09-22 2017-02-14 Lg Electronics Inc. Method and apparatus for signaling image information, and decoding method and apparatus using same
EP2983363A4 (en) * 2013-04-05 2016-10-19 Samsung Electronics Co Ltd MULTI-LAYER VIDEO ENCODING METHOD FOR RANDOM ACCESS AND DEVICE THEREFOR, AND MULTI-LAYER VIDEO DECODING METHOD FOR RANDOM ACCESS AND DEVICE THEREOF
US9525883B2 (en) * 2013-07-15 2016-12-20 Qualcomm Incorporated Cross-layer alignment of intra random access point pictures
KR20150043222A (ko) * 2013-10-12 2015-04-22 삼성전자주식회사 멀티 레이어 비디오 부호화 방법 및 그 장치, 멀티 레이어 비디오 복호화 방법 및 그 장치
CN105659599B (zh) * 2013-10-14 2019-04-12 瑞典爱立信有限公司 可缩放视频中的图序计数对齐
US9979971B2 (en) 2013-10-14 2018-05-22 Qualcomm Incorporated Device and method for scalable coding of video information
US9628820B2 (en) 2013-11-19 2017-04-18 Qualcomm Incorporated POC value design for multi-layer video coding
US9674544B2 (en) 2013-11-25 2017-06-06 Qualcomm Incorporated POC value design for multi-layer video coding
US9942546B2 (en) 2013-12-12 2018-04-10 Qualcomm Incorporated POC value design for multi-layer video coding
CN104754347B (zh) * 2013-12-26 2019-05-17 中兴通讯股份有限公司 视频图像序号的编码、解码方法及装置、电子设备
CN104754358B (zh) * 2013-12-27 2019-02-19 中兴通讯股份有限公司 码流的生成和处理方法、装置及系统
WO2015105399A1 (ko) * 2014-01-13 2015-07-16 삼성전자 주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치.
US11388441B2 (en) 2014-03-18 2022-07-12 Qualcomm Incorporated Derivation of SPS temporal ID nesting information for multi-layer bitstreams
CN112118454B (zh) * 2019-06-20 2023-02-24 腾讯美国有限责任公司 视频解码方法、设备和计算机可读存储介质
US11166038B2 (en) * 2019-06-20 2021-11-02 Tencent America LLC Method for support of scalability with adaptive picture resolution
WO2021061025A1 (en) * 2019-09-24 2021-04-01 Huawei Technologies Co., Ltd. An encoder, a decoder with picture order counter derivation
US11770498B2 (en) 2020-09-29 2023-09-26 Lemon Inc. Supplemental enhancement information for multi-layer video streams

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013048311A1 (en) * 2011-09-27 2013-04-04 Telefonaktiebolaget L M Ericsson (Publ) Decoders and methods thereof for managing pictures in video decoding process
KR20130037161A (ko) * 2011-10-05 2013-04-15 한국전자통신연구원 스케일러블 비디오 코딩을 위한 향상된 계층간 움직임 정보 예측 방법 및 그 장치
US20150063463A1 (en) * 2012-04-15 2015-03-05 Samsung Electronics Co., Ltd. Method and device for coding multi-layer video, and method and device for decoding multi-layer video
US9807421B2 (en) * 2013-04-05 2017-10-31 Sharp Kabushiki Kaisha NAL unit type restrictions
US9591321B2 (en) * 2013-04-07 2017-03-07 Dolby International Ab Signaling change in output layer sets

Also Published As

Publication number Publication date
BR112015025639A2 (pt) 2017-07-18
JP2016518776A (ja) 2016-06-23
CN105122814B (zh) 2018-10-26
EP2984844A1 (en) 2016-02-17
US20140301439A1 (en) 2014-10-09
WO2014168872A1 (en) 2014-10-16
BR112015025639B1 (pt) 2023-03-28
HUE047299T2 (hu) 2020-04-28
KR101818831B1 (ko) 2018-01-15
BR112015025639A8 (pt) 2020-06-23
CN105122814A (zh) 2015-12-02
EP2984844B1 (en) 2019-11-13
ES2773276T3 (es) 2020-07-10
US9532052B2 (en) 2016-12-27
KR20150140732A (ko) 2015-12-16

Similar Documents

Publication Publication Date Title
JP6158422B2 (ja) アラインされていないirapピクチャを含み得るマルチレイヤビットストリームのクロスレイヤpocアラインメント
JP6400660B2 (ja) Hevcおよび拡張のためのビデオパラメータセット
JP6141386B2 (ja) 深度範囲パラメータのシグナリング
JP6400691B2 (ja) ビデオコーディングにおけるサブ復号ピクチャバッファ(サブdpb)ベースのdpb動作のためのシグナリング
JP6580576B2 (ja) ビデオ情報のスケーラブルコーディングのためのデバイスおよび方法
JP6297670B2 (ja) ハイレベルシンタックスのみのスケーラブルビデオコーディングのための、レイヤ間参照ピクチャ制限
JP6513650B2 (ja) ビデオコーディングのための復号ピクチャバッファ動作
JP6285024B2 (ja) マルチレイヤビデオコーディングのためのレイヤ間予測シグナリングに対する最適化
JP6441354B2 (ja) マルチレイヤビデオコーディングのためのpoc値設計
JP2018125863A (ja) ビデオプロパティの指示
US9525883B2 (en) Cross-layer alignment of intra random access point pictures
JP2016519509A (ja) Irapアクセスユニットおよびビットストリーム切替えおよびスプライシング
JP2017523685A (ja) イントラブロックコピーイングのためのブロックベクトルコーディング
JP6495268B2 (ja) パラメータセット内のビューidビット深度のシグナリング
US9813736B2 (en) Inter-view dependency type in MV-HEVC
JP6453355B2 (ja) マルチレイヤビデオコーディングのためのpoc値設計
JP6434044B2 (ja) ビデオ情報のスケーラブルコード化のための機器及び方法
JP2017514354A (ja) マルチレイヤ・ビデオコーディングのためのpoc値設計
JP6242904B2 (ja) マルチビュー、3次元(3d)およびスケーラブルメディアビットストリームのためのサブビットストリーム抽出
JP2016509436A (ja) レイヤ間シンタックス予測制御
JP6479798B2 (ja) マルチレイヤビデオコーディングのためのpoc値設計

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170213

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170213

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170213

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170424

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170607

R150 Certificate of patent or registration of utility model

Ref document number: 6158422

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250