JP6209772B2 - シグナリングを用いたビデオデコーダ - Google Patents

シグナリングを用いたビデオデコーダ Download PDF

Info

Publication number
JP6209772B2
JP6209772B2 JP2015533777A JP2015533777A JP6209772B2 JP 6209772 B2 JP6209772 B2 JP 6209772B2 JP 2015533777 A JP2015533777 A JP 2015533777A JP 2015533777 A JP2015533777 A JP 2015533777A JP 6209772 B2 JP6209772 B2 JP 6209772B2
Authority
JP
Japan
Prior art keywords
picture
poc
equal
slice
msb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015533777A
Other languages
English (en)
Other versions
JP2016507910A (ja
Inventor
サーチン ジー. デシュパンダ
サーチン ジー. デシュパンダ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2016507910A publication Critical patent/JP2016507910A/ja
Application granted granted Critical
Publication of JP6209772B2 publication Critical patent/JP6209772B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

関連出願の相互参照
なし。
本発明は、ビデオ符号化および/または復号に関する。
デジタルビデオは通常、一連の画像またはフレームとして表され、そのそれぞれが画素の配列を含む。各画素は、輝度および/または色情報等の情報を含む。多くの場合には、各画素は3色のセットとして表され、各色を8ビット色値で定義することができる。
例えばH.264/MPEG‐4AVC(H.264/AVC)等のビデオ符号化技術は通常、複雑さが増すのと引き換えに、より高い符号化効率を提供する。ビデオ符号化技術に関する画質要求の高まりおよび画像解像度要求の高まりも、符号化の複雑度を高める。並列復号に適したビデオデコーダにより、復号プロセスの速度を改善し、メモリ要求を低減することができ、並列符号化に適したビデオエンコーダにより、符号化プロセスの速度を改善し、メモリ要求を低減することができる。
いずれも参照により全体として本明細書に組み込まれる、H.264/MPEG‐4AVC[ITU‐T VCEGおよびISO/IEC MPEGの合同ビデオチーム(Joint Video Team)、「H.264:一般視聴覚サービスのための高度ビデオ符号化(Advanced video coding for generic audiovisual services)」、ITU‐T Rec.H.264およびISO/IEC14496‐10(MPEG4‐Part10)、2007年11月]、および同様に、JCT‐VC、[「検討中のテストモデル案(Draft Test Model Under Consideration)」、JCTVC‐A205、JCT‐VCミーティング、ドレスデン、2010年4月(JCT‐VC)]は、圧縮効率のためにビデオシーケンス内の参照ピクチャに基づいてピクチャを復号するビデオコーデック(エンコーダ/デコーダ)の仕様書である。
本発明の以上およびその他の目的、特徴および利点は、本発明の以下の詳細な説明を添付の図面に関連して考慮すれば、より容易に理解されるであろう。
本発明の一実施形態は、ビデオビットストリームを復号する方法であって、該ビデオビットストリームから参照ピクチャセットパラメータを受信するステップと;該参照ピクチャセットに基づきインター予測を用いて現ピクチャを復号するステップと;将来のインター予測のために参照される該復号されたピクチャを復号ピクチャバッファに格納するステップとを含み、該参照ピクチャセットは、少なくとも、(a)参照ピクチャのピクチャオーダーカウント(POC;picture order count)の最下位ビット(LSB;least significant bit)の選択された数にそれぞれ基づく1つ以上の参照ピクチャ識別子と;(b)該参照ピクチャのPOCのMSBを決定する後続データが存在するか否かを指定するフラグとを用いることにより復号され、該後続データは、以下の条件(i)該復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLtに等しい参照ピクチャを1つより多く有すること、および(ii)条件(i)を満たすピクチャの後、TemporalId値が0であり、サブストリームのトレイリングピクチャまたは参照ピクチャである、復号順で最初のピクチャまでを含む、復号順で後続するピクチャ、のうちの1つを満たすピクチャにつき存在する、方法を開示する。
H.264/AVCビデオエンコーダを示した図である。 H.264/AVCビデオデコーダを示した図である。 例示的なスライス構造を示した図である。 別の例示的なスライス構造を示した図である。 エントロピースライスの再構築を示した図である。 図5のエントロピースライスの一部の再構築を示した図である。 省略されたLSBカウント値を用いたエントロピースライスの再構築を示した図である。 長期ピクチャ値を用いたエントロピースライスの再構築を示した図である。 長期ピクチャ値を用いて最初の先行フレームを選択することによるエントロピースライスの再構築を示した図である。 同じ最下位ビットカウント値を有する重複長期ピクチャフレームを用いることによるエントロピースライスの再構築を示した図である。 参照フレームを選択するための技術を示した図である。 参照フレームを選択するための技術を示した図である。 参照フレームを選択するための別の技術を示した図である。 参照フレームを選択するための別の技術を示した図である。 参照フレームを選択するための別の技術を示した図である。 参照フレームを選択するための別の技術を示した図である。 delta_poc_msb_present_flag[i]が1に設定されるピクチャを示した図である。
本明細書に記載される実施形態は、符号化/復号を用いる任意のビデオコーダ/デコーダ(コーデック)に対応しうるが、例示的実施形態は、単に説明の目的で、H.264/AVCエンコーダおよびH.264/AVCデコーダに関して記載される。多くのビデオ符号化技術は、ブロックベースのハイブリッドビデオ符号化アプローチに基づき、情報源符号化技術は、フレーム間とも考えうるピクチャ間予測、フレーム内とも考えうるピクチャ内予測、および予測残差の変換符号化のハイブリッドである。フレーム間予測は時間的冗長性を利用し、フレーム内および予測残差の変換符号化は空間的冗長性を利用することができる。
図1は、電子デバイス102の例示的なエンコーダ104を示したブロック図である。電子デバイス102内に含まれるものとして示された要素の1つ以上は、ハードウェアおよび/またはソフトウェアで実装されうることに注意しなければならない。例えば、電子デバイス102はエンコーダ104を含むが、エンコーダ104は、ハードウェアおよび/またはソフトウェアで実装されればよい。
電子デバイス102は、供給器134を含んでもよい。供給器134は、ピクチャまたは画像データ(例えばビデオ)をソース106としてエンコーダ104に供給することができる。供給器134の非限定的な例には、画像センサ、メモリ、通信インタフェース、ネットワークインタフェース、無線受信器、ポート、ビデオフレームコンテンツ、前に符号化されたビデオコンテンツ、符号化されていないビデオコンテンツなどが含まれる。
ソース106が、フレーム内予測モジュールおよび再構築バッファ140に供給されうる。ソース106は、動き推定および動き補償モジュール166に、さらに減算モジュール146にも供給されうる。
フレーム内予測モジュールおよび再構築バッファ140は、ソース106および再構築データ180に基づいて、イントラモード情報148およびイントラ信号142を発生させうる。動き推定および動き補償モジュール166は、ソース106と参照ピクチャバッファ196の信号198とに基づいて、インターモード情報168およびインター信号144を発生させうる。
参照ピクチャバッファ196の信号198は、参照ピクチャバッファ196に格納された1つ以上の参照ピクチャからのデータを含みうる。参照ピクチャバッファ196は、RPSインデックス初期化モジュール108も含みうる。初期化モジュール108は、RPSのバッファリングおよびリスト構築に対応する参照ピクチャを処理しうる。
エンコーダ104は、モードにしたがってイントラ信号142とインター信号144との間で選択することができる。イントラ符号化モードにおいてピクチャ内の空間的特徴を利用するために、イントラ信号142を使用することができる。インター符号化モードにおいてピクチャ間の時間的特徴を利用するために、インター信号144を使用することができる。一方、イントラ符号化モードは、イントラ信号142が減算モジュール146に供給され、イントラモード情報158がエントロピー符号化モジュール160に供給されればよい。一方、インター符号化モードは、インター信号144が減算モジュール146に供給され、インターモード情報168がエントロピー符号化モジュール160に供給されればよい。
予測残差148を生成するために、減算モジュール146で(モードに応じて)イントラ信号142またはインター信号144のいずれかが、ソース106から減算される。予測残差148は、変換モジュール150に供給される。変換モジュール150は、予測残差148を圧縮して、量子化モジュール154に供給される変換信号152を生成することができる。量子化モジュール154は、変換信号152を量子化して、変換・量子化された係数(TQC;transformed and quantized coefficient)156を生成する。
TQC156は、エントロピー符号化モジュール160および逆量子化モジュール170に供給される。逆量子化モジュール170は、TQC156に逆量子化を行って、逆変換モジュール174に供給される逆量子化信号172を生成する。逆変換モジュール174は、逆量子化信号172を伸張して、再構築モジュール178に供給される伸張信号176を生成する。
再構築モジュール178は、伸張信号176に基づいて再構築データ180を生成することができる。例えば再構築モジュール178は、(修正された)ピクチャを再構築することができる。再構築データ180は、デブロッキングフィルタ182に、そしてイントラ予測モジュールおよび再構築バッファ140に、供給されればよい。デブロッキングフィルタ182は、再構築データ180に基づいて、フィルタされた信号184を生成しうる。
フィルタされた信号184は、サンプル適応オフセット(SAO;sample adaptive offset)モジュール186に供給されればよい。SAOモジュール186は、エントロピー符号化モジュール160に供給されるSAO情報188と、適応ループフィルタ(ALF;adaptive loop filter)192に供給されるSAO信号190とを生成しうる。ALF192は、参照ピクチャバッファ196に供給されるALF信号194を生成する。ALF信号194は、参照ピクチャとして使用することができる1つ以上のピクチャからのデータを含みうる。
エントロピー符号化モジュール160は、TQC156を符号化して、ビットストリーム114を生成しうる。また、エントロピー符号化モジュール160は、コンテキスト適応型可変長符号化(CAVLC;Context‐Adaptive Variable Length Coding)またはコンテキスト適応型2値算術符号化(CABAC;Context‐Adaptive Binary Arithmetic Coding)を用いてTQC156を符号化しうる。特に、エントロピー符号化モジュール160は、イントラモード情報158、インターモード情報168およびSAO情報188のうちの1つ以上に基づいてTQC156を符号化しうる。ビットストリーム114は、符号化ピクチャデータを含みうる。エンコーダは、一般にマクロブロックと呼ばれるブロックのシーケンスとしてフレームを符号化することが多い。
HEVC等のビデオ圧縮に関わる量子化は、ある範囲の値を1つの値に圧縮することにより達成される、損失を伴う圧縮技術である。量子化パラメータ(QP;quantization parameter)は、再構築されたビデオの品質および圧縮率の両方に基づいて量子化を行うために使用される所定のスケーリングパラメータである。ブロックタイプは、HEVCにおいて所与のブロックの特徴をブロックサイズおよびその色情報に基づいて表すように定義される。QP、解像度情報、およびブロックタイプは、エントロピー符号化の前に決定されればよい。例えば、電子デバイス102(例えばエンコーダ104)がQP、解像度情報、およびブロックタイプを決定し、これらがエントロピー符号化モジュール160に供給されればよい。
エントロピー符号化モジュール160は、TQC156のブロックに基づいてブロックサイズを決定してもよい。例えばブロックサイズは、1次元のTQCのブロックに沿ったTQC156の数であればよい。換言すれば、TQCのブロックの中のTQC156の数は、ブロックサイズの2乗に等しければよい。例えば、TQCのブロックの中のTQC156の数の平方根としてブロックサイズが決定されればよい。解像度は、画素幅x画素高さとして定義できる。解像度情報には、ピクチャの幅、ピクチャの高さ、または両方の画素数を含みうる。ブロックサイズは、1次元のTQCの2Dブロックに沿ったTQC156の数として定義できる。
一部の構成では、ビットストリーム114は、別の電子デバイスに伝送されてもよい。例えば、ビットストリーム114は、通信インタフェース、ネットワークインタフェース、無線伝送器、ポートなどに供給されればよい。例えば、ビットストリーム114は、LAN、インターネット、携帯電話基地局などを介して別の電子デバイスへ伝送されればよい。ビットストリーム114は、追加的または代替的に電子デバイス102または他の電子デバイスのメモリに格納されてもよい。
図2は、電子デバイス202上の例示的なデコーダ212を示したブロック図である。デコーダ212は、電子デバイス202に含まれていてもよい。例えばデコーダ212は、HEVCデコーダであればよい。デコーダ212および/またはデコーダ212に含まれるものとして図示された要素の1つ以上は、ハードウェアおよび/またはソフトウェアで実装されてもよい。デコーダ212は、復号のためにビットストリーム214(例えばビットストリーム214に含まれる1つ以上の符号化されたピクチャ)を受信すればよい。一部の構成では、受信ビットストリーム214は、受信スライスヘッダ、受信PPS、受信バッファ記述情報等の、受信オーバーヘッド情報を含めばよい。ビットストリーム214に含まれる符号化されたピクチャは、1つ以上の符号化された参照ピクチャおよび/または1つ以上の他の符号化されたピクチャを含めばよい。
(ビットストリーム214に含まれる1つ以上の符号化されたピクチャの中の)受信シンボルは、エントロピー復号モジュール268によってエントロピー復号され、これにより動き情報信号270ならびに量子化、スケーリングおよび/または変換された係数272が生成される。
動き情報信号270は、動き補償モジュール274で、フレームメモリ278からの参照フレーム信号298の一部分と組み合わされ、それによってフレーム間予測信号282を生成しうる。量子化、デスケーリングおよび/または変換された係数272は、逆モジュール262によって逆量子化、スケーリングおよび逆変換され、それによって復号された残差信号284を生成しうる。復号された残差信号284は、結合信号286を生成するために予測信号292に加算されうる。予測信号292は、フレーム間予測信号282か、またはフレーム内予測モジュール288によって生成されたフレーム内予測信号290のいずれかから選択された信号であればよい。いくつかの構成において、この信号選択は、ビットストリーム214に基づいてもよい(例えば、ビットストリーム214によって制御される)。
フレーム内予測信号290は、(例えば、現フレームにおいて)前に復号された結合信号292からの情報から予測できる。結合信号292は、さらにデブロッキングフィルタ294によりフィルタされればよい。結果として生じるフィルタされた信号296は、フレームメモリ278に書き込まれればよい。結果として生じるフィルタされた信号296は、復号されたピクチャを含みうる。
フレームメモリ778は、本明細書に記載されるDPBを含みうる。DPBは、短期または長期参照フレームとして保持されうる1つ以上の復号されたピクチャを含みうる。フレームメモリ278は、復号されたピクチャに対応するオーバーヘッド情報も含みうる。例えばフレームメモリ278は、スライスヘッダ、PPS情報、サイクルパラメータ、バッファ記述情報などを含めばよい。これらの情報の1つ以上は、エンコーダ(例えばエンコーダ104)からシグナリングされてもよい。フレームメモリ278は、復号されたピクチャ718を供給しうる。
複数のマクロブロックを含む入力ピクチャは、1つまたはいくつかのスライスに分割されうる。エンコーダおよびデコーダで使用される参照ピクチャが同じであり、デブロッキングフィルタリングがスライス境界を越える情報を使用しないならば、スライスが表すピクチャのエリア内のサンプルの値は、他のスライスからのデータを使用せずに適切に復号できる。したがって、あるスライスのエントロピー復号およびマクロブロック再構築は、他のスライスに依存しない。特に、各スライスの開始時にエントロピー符号化状態がリセットされればよい。他のスライスのデータは、エントロピー復号および再構築の両方のための近傍利用可能性を定義する際に利用不可能としてマークされればよい。スライスは、並列にエントロピー復号および再構築されればよい。イントラ予測および動きベクトル予測は、スライスの境界を越えられないのが好ましい。対して、デブロッキングフィルタリングは、スライス境界を越える情報を使用してもよい。
図3は、水平方向に11個のマクロブロック、垂直方向に9個のマクロブロックを含む、例示的ビデオピクチャ90を示す(9個の例示的なマクロブロックが91〜99と標識されている)。図3は、「スライス#0」と示された第1のスライス89、「スライス#1」と示された第2のスライス88、および「スライス#2」と示された第3のスライス87の、3つの例示的なスライスを示す。H.264/AVCデコーダは、3つのスライス87、88、89を並列に復号および再構築しうる。各スライスが、走査線順に逐次伝送されてもよい。各スライスの復号/再構築処理の始めに、エントロピー復号268が初期化またはリセットされ、他のスライスのマクロブロックが、エントロピー復号およびマクロブロック再構築のいずれにも利用不可能としてマークされる。したがって、「スライス#1」の中のあるマクロブロック、例えば93と標識されたマクロブロックについて、「スライス#0」の中のマクロブロック(例えば91および92と標識されたマクロブロック)をエントロピー復号または再構築のために使用することはできない。一方、「スライス#1」の中にあるマクロブロック、例えば95と標識されたマクロブロックについて、「スライス#1」の中の他のマクロブロック(例えば93および94と標識されたマクロブロック)をエントロピー復号または再構築のために使用することはできる。したがって、エントロピー復号およびマクロブロック再構築は、スライス内で順次進行する。スライスがフレキシブルマクロブロック順序付け(FMO;flexible macroblock ordering)を用いて定義されない限り、スライス内のマクロブロックは、ラスタ走査順に処理される。
フレキシブルマクロブロック順序付けは、スライスグループを定義して、1つのピクチャがどのようにスライスに分割されるかを変更する。スライスグループ内のマクロブロックは、マクロブロック対スライスグループマップにより定義され、マクロブロック対スライスグループマップは、ピクチャパラメータセットのコンテンツおよびスライスヘッダ中の追加情報によってシグナリングされる。マクロブロック対スライスグループマップは、ピクチャ内の各マクロブロックに対するスライスグループ識別番号からなる。スライスグループ識別番号は、関連するマクロブロックがどのスライスグループに属するかを指定する。各スライスグループは、1つ以上のスライスに分割することができ、スライスは、特定のスライスグループのマクロブロックのセット内でラスタ走査順に処理される同じスライスグループ内の一連のマクロブロックである。エントロピー復号およびマクロブロック再構築は、スライスグループ内で順次進行する。
図4は、「スライスグループ#0」と示された第1のスライスグループ86、「スライスグループ#1」と示された第2のスライスグループ85、および「スライスグループ#2」と示された第3のスライスグループ84の3つのスライスグループへの、例示的なマクロブロックの割り当てを示す。これらのスライスグループ84、85、86は、ピクチャ90の中の2つの前景領域および1つの背景領域にそれぞれ関連付けられる。
ピクチャは、1つ以上のスライスに分割されてもよく、エンコーダおよびデコーダで使用される参照ピクチャが同一であるならば、スライスは、当該スライスが表すピクチャのエリア内のサンプルの値を、他のスライスからのデータを用いずに正しく再構築できるという点で、自己完結的である。スライス内の全ての再構築されたマクロブロックは、再構築のための近傍の定義において利用可能である。
スライスは、1つより多くのエントロピースライスに分割されてもよく、エントロピースライスは、当該エントロピースライスが表すピクチャのエリアを、他のエントロピースライスからのデータを用いずに正しくエントロピー復号できるという点で、自己完結的である。各エントロピースライスの復号開始時に、エントロピー復号268がリセットされればよい。他のエントロピースライス中のデータは、エントロピー復号のための近傍利用可能性を定義する際に利用不可能としてマークされうる。
ピクチャを復号するために構成されたデバイスは、現ピクチャを含む一連のピクチャを含むビットストリームを取得または別途受信する。デバイスは、現ピクチャまたはビットストリームにおいてピクチャがシグナリングされる順序で現ピクチャに後続するピクチャの復号に使用できる他のフレームの識別のために使用できる、参照ピクチャセット(RPS)パラメータをさらに取得する。
RPSは、現フレームに関連する参照ピクチャのセットの識別を提供する。RPSは、現ピクチャのインター予測に使用できる、復号順で現ピクチャより前の参照ピクチャを識別し、および/または現ピクチャのインター予測に使用できる、復号順で現ピクチャの後の参照ピクチャを識別しうる。例えば、システムがフレーム1、3、5を受信し、5が3を参照に使用し、エンコーダがフレーム1をフレーム7の予測に使用する場合、5のRPSは、フレーム1がフレーム5の参照に使用されなくても、フレーム3および1の両方をフレームメモリ278に維持するようシグナリングしうる。一実施形態では、5のRPSは、[−2 −4]であればよい。加えて、フレームメモリ278は、表示ピクチャバッファ、または同等にDPBと呼称されてもよい。
RPSは、後の使用のために復号ピクチャバッファ(DPB;decoded picture buffer)に少なくとも限られた持続時間にわたり保持されるべき1つ以上の参照ピクチャを記述する。このRPSの識別は、各ピクチャのスライスヘッダに、ピクチャとともに、および/またはピクチャ群とともに、含まれればよい。加えて、RPSのリストが、ピクチャパラメータセット(PPS;picture parameter set)で送信されてもよい。そして、スライスヘッダは、そのスライスでの使用をシグナリングするために、PPSで送信されるRPSの1つを指せばよい。例えば、ピクチャ群のRPSが、ピクチャパラメータセット(PPS)においてシグナリングされればよい。現フレームのRPSの一部ではない、DPBの任意のピクチャは、「参照のために用いられない」ものとしてマークされればよい。
DPBは、デコーダで再構築された(例えば復号された)ピクチャを格納するために使用されうる。これらの格納されたピクチャはその後、例えばインター予測技術において使用することができる。また、DPB内のピクチャは、ピクチャオーダーカウント(POC)に関連付けられればよい。POCは、各符号化ピクチャに関連付けられ、出力順におけるピクチャ位置の増加に伴って増加する値を有する、変数とすることができる。換言すると、POCは、ピクチャを表示のために正しい順番で送るためにデコーダにより使用されうる。POCは、参照ピクチャリストの構築中の参照ピクチャの識別および復号された参照ピクチャの識別にも使用されうる。さらに、POCは、エンコーダからデコーダへの伝送中に失われたピクチャの識別に使用されうる。
図5を参照すると、エンコーダからデコーダに供給されるフレームのセット300の一例が示されている。各フレームは、関連するPOC310を有していればよい。図のように、POCは、負の数から大きな正数までインクリメントしてもよい。一部の実施形態では、POCは、ゼロからより大きな正数までインクリメントするだけでもよい。POCは、典型的にはフレーム毎に1ずつインクリメントされるが、1つ以上のPOCがスキップされ、または他の方法で省略される場合もある。例えば、エンコーダ中のフレームのセットのPOCは、0、1、2、3、4、5などとすることができる。例えば、エンコーダ中の同じフレームのセットまたは別のフレームのセットのPOCが、0、1、2、4、5などであり、POC3がスキップされ、または他の方法で省略されてもよい。
POCが十分に大きくなるのに伴い、POCを用いて各フレームを識別するために多数のビットが必要となるであろう。エンコーダは、各フレームを識別するために、4ビットなど、POCの最下位ビット(LSB)の選択された数を使用することにより、特定のPOCを識別するために使用されるビット数を削減することができる。現フレームを復号するために用いられる参照フレームは、現フレームの時間的に近くに位置することが多いため、この識別技術は適切であり、システムの計算複雑度の低減およびビデオのビットレートの全体的削減がもたらされる。ピクチャを識別するために使用するLSBの数は、ビットストリームにおいてデコーダにシグナリングされてもよい。
図のように、POCのLSBの選択された数が4の場合、LSBが4ビットであり、LSBインデックスは16値(2^4)毎に繰り返す。したがって、フレーム0は0の値を有するLSBを有し、フレーム1は1の値を有するLSBを有し、・・・、フレーム14は14の値を有するLSBを有し、フレーム15は15の値を有するLSBを有する。しかし、フレーム16は再び0の値を有するLSBを有し、フレーム17は再び1の値を有するLSBを有し、フレーム20は4の値を有するLSBを有する。LSB識別子(一般にPOCのLSB、または同等にPOC LSBとも呼称される)は、LSB=POC%16の特徴を有していればよく、%は、16(2^最下位ビットの数、ここでは4)で割った後の余りである。同様に、POCを識別するためのLSBの選択された数がNビットである場合、LSB識別子は、LSB=POC%(2^N)の特徴を有していればよく、2^Nは、2のN乗を示す。フレームを識別するためにビットストリームにPOCを含めるより、エンコーダがデコーダへのビットストリームにおいてLSBインデックス(一般にPOCのLSB、または同等にPOC LSBとも呼称される)を供給するのが好ましい。
現フレームまたは現フレームの後のフレームのインター予測に用いられる参照フレームは、相対(例えばデルタ)参照(例えばdeltaPOCおよびcurrentPOCを使用して)または絶対参照(例えばPOCを使用して)のいずれかを用いてRPSにより識別できる。例えば、POC5 310により識別され、LSB5 320としてビットストリームでデコーダにシグナリングされるフレームは、[−5,−2,−1]の関連するRPS330を有しうる。RPS値の意味は後述する。
図5の一部を示した図6を参照すると、[−5,−2,−1]のRPSは、5つ前のフレーム320、2つ前のフレーム321、および1つ前のフレーム322を含むフレームを指す。このRPSはさらに、図6に示すように、それぞれ0、3、および4のPOC値を指す。RPSは、現フレームのPOC値と、前のフレームのPOC値との間の差を指すのが典型的である。例えば、5のPOC値を有する現フレームについての[−5,−2,−1]のRPSは、5−5=0;5−2=3;および5−1=4のPOC値を有するフレームを指す。本明細書の例には示していないが、RPSは、将来のフレームも含むことができることに注意されたい。これらの将来のフレームは、RPSにおいて正のデルタPCO値を用いて示されることとなる。
1つ以上のPOC値がスキップされ、または別途ビットストリームの一部で省略される場合など、POC値が連続していない場合、図7に示されるように、現フレームのPOC値と前のフレームのPOC値との間の差は、前のフレームと現フレームとの間に出力されるフレームの数と異なりうる。RPSは、フレームとともに供給される、またはフレームのセットとともに供給されるなど、任意の適切な様式でビットストリームにおいてシグナリングされればよい。
図8を参照すると、参照フレームをシグナリングするための別の技術は、一般に長期ピクチャと呼ばれる絶対参照をフレームに関連するRPSにおいて用いることである。参照フレームが絶対参照を用いてシグナリングされるか相対参照を用いてシグナリングされるかに応じて、動きベクトル予測技術等の復号処理が異なりうる。絶対参照(便宜上LTと呼ぶ)は、前のフレームまたは後続フレーム等の参照フレームに関連する特定のLSBカウント値を指す。例えば、LT=3(LT3)の絶対参照は、POC LSB値が3の参照フレームを指す。したがって、[LT3,−5]のRPSは、POC LSB値が3の参照フレーム、およびPOCが現フレームのPOCマイナス5に等しい参照フレームを指す。図8では、このRPSは、POCが3に等しい参照フレーム444、およびPOCが0に等しい参照フレーム320に対応する。典型的には、LT3は、POC LSB値が3に等しい、現フレームより前の最初のフレームを指す。一実施形態では、LT3は、POC LSB値が3である、出力順で現フレームより前の最初のフレームを指す。第二の実施形態では、LT3は、POC LSB値が3である、伝送順で現フレームより前の最初のフレームを指す。このようなシステムは、多くのビットストリームに適するが、LSBカウント値が3の直前のフレームとは異なる、LSBカウント値が3のフレームを選択するために十分に強力ではない。
図9を参照すると、例えばエンコーダがフレーム31(POC=31)を符号化しており、システムが、POC LSB=0(LT0)の長期ピクチャの使用をシグナリングする場合、フレーム16(POC=16)がLSB=0である1つ前のフレームであることから、このシグナリングはフレーム16(POC=16)を指す(A)。しかし、エンコーダが、同様に0のLSBカウント値を持つ長期ピクチャフレーム0をシグナリングしたかったとしても、このように1つ前のフレームを参照するスキームでは達成できない。この限界を克服するための一つの技術は、長期フレームLSBまたはPOC LSBをシグナリングするために使用される最下位ビットの数を増加させることである。このような最下位ビット数の増加は可能であるが、その結果、相当の追加ビットがビットストリームに追加される。
ビットストリームに追加される追加ビットがより少なくなる、より好適な技術は、対応するPOC LSB値を持つ1つ前のフレームとは異なる長期ピクチャをシグナリングすることである。例えば、システムは、[LT0|2]として絶対参照を有する現フレームのRPSを指示しうる。ここで0は、POC LSBカウント値を指し、2は、POC LSBカウント値が0に等しい前のフレームのうちで使用すべきフレームを指し、ここでは2つ前の0のPOC LSB値(例えば図9のフレーム0)を指す。2つ目の参照が含まれない場合、システムは、直前のPOC LSB=0[LT0]のフレーム(例えば図9のフレーム16)にデフォルトすればよい。
多くの場合、絶対参照を用いて対応するPOC LSB値を持つ最初の直前のフレームではないフレームをシグナリングする要求の発生頻度は比較的稀であろう。絶対参照を用いて対応するPOC LSB値を持つ最初の直前のフレームとは異なるフレームをシグナリングする能力を可能にしながら、使用すべきフレームを示す全体のビットレートをさらに削減するために、システムは、重複技術を使用することができる。例えば、RPSが[LT0,LT0|3]のように構築されればよい。同じRPS信号内のLT0の重複は、POC LSB値が0の異なるフレーム、ここでは3つ前に生じる0のPOC LSB値を使用するようデコーダにシグナリングする。一般に、特定のPOC LSB値が特定のPOC LSB値のサイクルに含まれない可能性を除けば、所望のPOC LSB値は、指示された前のフレームの発生に対応する。
図10を参照すると、重複技術は、以下のように示すことができる。RPSは、POC LSB値を有する長期ピクチャの信号を含む(400)(例えば[LT3])。同じRPSは、同じPOC LSB値を有する長期ピクチャの別の信号を含む(410)(例えば[LT3,LT3])。同じRPSは、所望のフレームの位置を示す、同じLSBカウント値(410)を有する2番目の長期ピクチャの別の信号を含む(420)[LT3,LT3|2]。
所望のフレームの位置のシグナリングは、任意の適切な様式で行われればよい。例えば図11を参照すると、所望のフレームの位置は、現フレームに対していくつか前のPOC LSB値のサイクル、例えば3つ前のサイクル等であればよい。例えば図12を参照すると、位置は、現フレームからオフセットしたフレーム数の絶対値に基づいてもよい。例えば図13を参照すると、位置は、所望のPOC LSB値を持つ最初の直前のフレームに対して数サイクル前のPOC LSB値に基づいてもよい。例えば図14を参照すると、位置は、所望のPOC LSB値を持つ最初の直前のフレームに対してオフセットしたフレーム数の絶対値に基づいてもよい。
そのような技術の一つの実装例は、以下のシンタックスを使用しうる。
1に等しいfirst_slice_segment_in_pic_flagは、スライスセグメントが復号順でピクチャの最初のスライスセグメントであることを指定する。0に等しいfirst_slice_segment_in_pic_flagは、スライスセグメントが復号順でピクチャの最初のスライスセグメントではないことを指定する。
no_output_of_prior_pics_flagは、復号ピクチャバッファ内の前に復号されたピクチャが、IDRまたはBLAピクチャの復号後にいかに処理されるかを指定する。現ピクチャがCRAピクチャであるとき、または現ピクチャがビットストリームの最初のピクチャであるIDRまたはBLAピクチャであるときには、no_output_of_prior_pics_flagの値は、復号プロセスに影響を与えない。現ピクチャがビットストリームの最初のピクチャではないIDRまたはBLAピクチャであり、アクティブシーケンスパラメータセットから導出されるpic_width_in_luma_samplesもしくはpic_height_in_luma_samplesまたはsps_max_dec_pic_buffering[HighestTid]の値が、先行するピクチャに関してアクティブなシーケンスパラメータセットから導出されるpic_width_in_luma_samplesもしくはpic_height_in_luma_samplesまたはsps_max_dec_pic_buffering[HighestTid]の値と異なるときには、no_output_of_prior_pics_flagの実際値に関わらず、1に等しいno_output_of_prior_pics_flagがデコーダによって推定(されるべきではないが)される。ここで、HighestTidは、最大時間識別子値を指す。
slice_pic_parameter_set_idは、使用中のピクチャパラメータセットのpps_pic_parameter_setの値を指定する。slice_pic_parameter_set_idの値は、両端値を含めて、0から63までの範囲内にあるものとする。
1に等しいdependent_slice_segment_flagは、存在しない各スライスセグメントヘッダのシンタックス要素の値が、スライスヘッダ中の対応するスライスセグメントヘッダのシンタックス要素の値に等しいと推定されることを指定する。dependent_slice_segment_flagが存在しない場合、dependent_slice_segment_flagの値は0に等しいと推定される。
変数SliceAddrRSは、次のように導出される。dependent_slice_segment_flagが0に等しければ、SliceAddrRSは、slice_segment_addressに等しく設定される。そうでない場合は、SliceAddrRSは、符号化ツリーブロックアドレスがctbAddrTStoRS[ctbAddrRStoTS[slice_segment_address]−1]である符号化ツリーブロックを含む先行スライスセグメントのSliceAddrRSに等しく設定される。
slice_segment_addressは、ピクチャの符号化ツリーブロックのラスタスキャンにおける、スライスセグメントの最初の符号化ツリーブロックのアドレスを指定する。slice_segment_addressシンタックス要素の長さは、Ceil(Log2(PicSizeInCtbsY))ビットである。slice_segment_addressの値は、両端値を含めて、1からPicSizeInCtbsY−1までの範囲内にあるものとし、slice_segment_addressの値は、同じ符号化ピクチャの他のいずれの符号化スライスセグメントのNALユニットのslice_segment_addressの値とも等しくないものとする。slice_segment_addressが存在しないとき、slice_segment_addressは0に等しいと推定される。
変数CtbAddrInRSは、ピクチャの符号化ツリーブロックラスタスキャンにおける符号化ツリーブロックアドレスを指定し、slice_segment_addressに等しく設定される。変数CtbAddrInTSは、タイルスキャンにおける符号化ツリーブロックアドレスを指定し、CtbAddrRStoTS[CtbAddrInRS]に等しく設定される。変数CuQpDeltaは、cu_qp_delta_absを含む符号化ユニットについての輝度信号量子化パラメータとその予測値との間の差分を指定し、0に等しく設定される。
slice_reserved_undetermined_flag[i]は、将来のITU‐T|ISO/IECによる規格のためにリザーブされたセマンティクスおよび値を有する。デコーダは、slice_reserved_undetermined_flag[i]の存在および値を無視するものとする。
slice_typeは、以下のテーブルにしたがってスライスの符号化タイプを指定する。
nal_unit_typeが、両端値を含めて16から23までの範囲内の値を有するとき(RAPピクチャ)、slice_typeは2に等しいものとする。
sps_max_dec_pic_buffering[TemporalId]が0に等しいとき、slice_typeは2に等しいものとする。
pic_output_flagは、復号ピクチャの出力および削除プロセスに影響する。pic_output_flagが存在しないとき、pic_output_flagは1に等しいものと推定される。
colour_plane_idは、separate_colour_plane_flagが1に等しいときの、現スライスRBSPに関連する色平面を指定する。colour_plane_idの値は、両端値を含めて0から2までの範囲内にあるものとする。0、1、および2に等しいcolour_plane_idはそれぞれ、Y、CbおよびCr平面に対応する。
pic_order_cnt_lsbは、現ピクチャについてのピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りを指定する。pic_order_cnt_lsbシンタックス要素の長さは、log2_max_pic_order_cnt_lsb_minus4+4ビットである。pic_order_cnt_lsbの値は、両端値を含めて、0からMaxPicOrderCntLsb−1までの範囲内にあるものとする。pic_order_cnt_lsbが存在しないとき、ほとんどの場合pic_order_cnt_lsbは0に等しいものと推定される。
1に等しいshort_term_ref_pic_set_sps_flagは、現ピクチャの短期参照ピクチャセットが、アクティブシーケンスパラメータセット内のシンタックス要素を使用して作成されることを指定する。0に等しいshort_term_ref_pic_set_sps_flagは、現ピクチャの短期参照ピクチャセットが、スライスヘッダ内のshort_term_ref_pic_set()シンタックス構造のシンタックス要素を使用して作成されることを指定する。
short_term_ref_pic_set_idxは、現ピクチャの参照ピクチャセットの作成に使用されるアクティブシーケンスパラメータセットにおいて指定された短期参照ピクチャセットのリストに対するインデックスを指定する。シンタックス要素short_term_ref_pic_set_idxは、Ceil(Log2(num_short_term_ref_pic_sets))ビットにより表される。short_term_ref_pic_set_idxが存在しない場合、short_term_ref_pic_set_idxの値は0に等しいものと推定される。short_term_ref_pic_set_idxの値は、両端値を含めて、0からnum_short_term_ref_pic_sets−1までの範囲内にあるものとする。
変数StRpsIdxは、以下のように導出される:short_term_ref_pic_set_sps_flagが1に等しい場合、StRpsIdxは、short_term_ref_pic_set_idxに等しく設定される。そうでない場合は、StRpsIdxは、num_short_term_ref_pic_setsに等しく設定される。
num_long_term_spsは、現ピクチャの長期参照ピクチャセットに含まれる、アクティブシーケンスパラメータセットにおいて指定される候補長期参照ピクチャの数を指定する。num_long_term_spsの値は、両端値を含めて、0からMin(num_long_term_ref_pics_sps,sps_max_dec_pic_buffering[sps_max_sub_layers_minus1]−NumNegativePics[StRpsIdx]−NumPositivePics[StRpsIdx])までの範囲内にあるものとする。num_long_term_spsが存在しない場合、num_long_term_spsの値は0に等しいものと推定される。
num_long_term_picsは、現ピクチャの長期参照ピクチャセットに含まれる、スライスヘッダにおいて指定される長期参照ピクチャの数を指定する。num_long_term_picsの値は、両端値を含めて、0からsps_max_dec_pic_buffering[sps_max_sub_layers_minus1]−NumNegativePics[StRpsIdx]−NumPositivePics[StRpsIdx]−num_long_term_spsまでの範囲内にあるものとする。存在しない場合、num_long_term_picsの値は0に等しいものと推定される。
lt_idx_sps[i]は、現ピクチャの長期参照ピクチャセットに含まれるピクチャの特定のために、アクティブシーケンスパラメータセットにおいて指定された候補長期参照ピクチャのリストに対するインデックスを指定する。lt_idx_sps[i]を表すために使用されるビットの数は、Ceil(Log2(num_long_term_ref_pics_sps))に等しい。存在しない場合、lt_idx_sps[i]の値は0に等しいものと推定される。lt_idx_sps[i]の値は、両端値を含めて、0からnum_long_term_ref_pics_sps−1までの範囲内にあるものとする。
poc_lsb_lt[i]は、現ピクチャの長期参照ピクチャセットに含まれるi番目の長期参照ピクチャのピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りの値を指定する。poc_lsb_lt[i]シンタックス要素の長さは、log2_max_pic_order_cnt_lsb_minus4+4ビットである。
0に等しいused_by_curr_pic_lt_flag[i]は、現ピクチャの長期参照ピクチャセットに含まれるi番目の長期参照ピクチャが、現ピクチャによる参照のために用いられないことを指定する。
変数PocLsbLt[i]およびUsedByCurrPicLt[i]は、以下のように導出される。iがnum_long_term_sps未満であれば、PocLsbLt[i]は、lt_ref_pic_poc_lsb_sps[lt_idx_sps[i]]に等しく設定され、UsedByCurrPicLt[i]は、used_by_curr_pic_lt_sps_flag[lt_idx_sps[i]]に等しく設定される。そうでない場合は、PocLsbLt[i]は、poc_lsb_lt[i]に等しく設定され、UsedByCurrPicLt[i]は、used_by_curr_pic_lt_flag[i]に等しく設定される。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。
delta_poc_msb_cycle_lt[i]は、現ピクチャの長期参照ピクチャセットに含まれるi番目の長期参照ピクチャのピクチャオーダーカウント値の最上位ビットの値を決定するために用いられる。delta_poc_msb_cycle_lt[i]が存在しないとき、delta_poc_msb_cycle_lt[i]は0に等しいものと推定される。
変数DeltaPocMSBCycleLt[i]は、以下のように導出される:
長期参照ピクチャセットに関して、復号プロセスが以下のように行われうる:
このプロセスは、ピクチャ毎に1回、スライスヘッダの復号の後であるが、任意の符号化ユニットの復号より前およびスライスの参照ピクチャリスト構築のための復号プロセスより前に、呼び出される。このプロセスの結果、DPBの1つ以上の参照ピクチャが、「参照のために用いられない」または「長期参照のために用いられる」ものとしてマークされうる。
参照ピクチャセットは、現在および将来の符号化ピクチャの復号プロセスで使用される参照ピクチャの絶対記述であることに注意されたい。参照ピクチャセットシグナリングは、参照ピクチャセットに含まれる全ての参照ピクチャが明示的にリストされるという意味で、明示的である。
ピクチャは、「参照のために用いられない」、「短期参照のために用いられる」、または「長期参照のために用いられる」ものとしてマークされうるが、これら3つの中の1つとしてのみマークされる。ピクチャにこれらのマーキングのうちの1つを割り当てることにより、これらのマーキングのうちの別のマーキングが、適用可能な場合に黙示的に削除される。ピクチャが「参照のために用いられる」ものとしてマークされていると言うときには、「短期参照のために用いられる」または「長期参照のために用いられる」ものとしてマークされたピクチャ(両方ではない)を集合的に指す。
現ピクチャがビットストリームの最初のピクチャであるとき、DPBは空のピクチャのセットに初期化される。
現ピクチャがIDRピクチャまたはBLAピクチャであるとき、現在DPB内にある全ての参照ピクチャ(もしあれば)が、「参照のために用いられない」ものとしてマークされる。
短期参照ピクチャは、そのPicOrderCntVal値により識別される。長期参照ピクチャは、そのPicOrderCntVal値またはpic_order_cnt_lsb値により識別される。
参照ピクチャセットを導出するために、ピクチャオーダーカウント値の5つのリストが構築される;NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr、およびNumPocLtFollの要素数をそれぞれ有する、PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurrおよびPocLtFollである。
現ピクチャがIDRピクチャである場合、PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr、およびPocLtFollは全て空に設定され、NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr、およびNumPocLtFollは全て0に設定される。
そうでない場合は、ピクチャオーダーカウント値の5つのリストおよびエントリ数の導出に以下が適用される。


ここでPicOrderCntValは、現ピクチャのピクチャオーダーカウントである。
代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されると、復号順でそれ以降のピクチャから、0のTemporalId値を有し、TRAIL_R、TSA_R、STSA_Rのうちの1つであるNALユニットタイプを有する復号順で最初のピクチャまでを含む、全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。
さらに別の実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されると、復号順でそれ以降のピクチャから、0のTemporalId値を有し、TRAIL_Rのうちの1つであるNALユニットタイプを有する復号順で最初のピクチャまでを含む全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。
さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されると、復号順でそれ以降のピクチャから、0のTemporalId値を有し、TRAIL_R、TSA_R、STSA_R、RADL_R、RASL_Rのうちの1つであるNALユニットタイプを有する復号順で最初のピクチャまでを含む全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。
さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されると、復号順でそれ以降のピクチャから、0のTemporalId値を有する復号順で最初のピクチャまでを含む全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。
さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されると、0より大きいTemporalId値を有するかまたはTRAIL_N、TSA_N、STSA_N、RADL_N、RASL_N、RSV_VCL_N10、RSV_VCL_N12もしくはRSV_VCL_N14のうちの1つであるNALユニットタイプを有する復号順で後続する全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。
さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されたら、復号順でそれ以降のピクチャから、0に等しい時間識別子値を有し、参照ピクチャとして使用されるか、または個別に破棄できない復号順で最初のピクチャまでを含む全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。
さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0のTemporalId値を有し、TRAIL_Rのうちの1つであるNALユニットタイプを有する、現ピクチャ以降の復号順で最初のピクチャまでを含む全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。
さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0のTemporalId値を有し、TRAIL_R、TSA_R、STSA_Rのうちの1つであるNALユニットタイプを有する、現ピクチャ以降の復号順で最初のピクチャまでを含む全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。
さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0のTemporalId値を有し、TRAIL_R、TSA_R、STSA_R、RADL_R、RASL_Rのうちの1であるNALユニットタイプを有する、現ピクチャ以降の復号順で最初のピクチャまでを含む全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。
さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0より大きいTemporalId値を有するかまたはTRAIL_N、TSA_N、STSA_N、RADL_N、RASL_N、RSV_VCL_N10、RSV_VCL_N12もしくはRSV_VCL_N14のうちの1つであるNALユニットタイプを有する全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。
さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0のTemporalId値を有する、現ピクチャ以降の復号順で最初のピクチャまでを含む全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。
さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0のTemporalId値を有し、参照ピクチャとして使用されるか、または個別に破棄できない、現ピクチャ以降の復号順で最初のピクチャまでを含む全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。
ここでnal_unit_typeは、以下のセマンティクスにより定義される。
nal_unit_typeは、以下のテーブルyに指定されるようにNALユニットに含まれるRBSPデータ構造のタイプを指定する。

ここで、以下の定義が適用される。
アクセスユニット:特定の分類ルールにしたがって互いに関連し、復号順で連続し、正確に1つの符号化ピクチャを含む、NALユニットのセット。
アクセスユニットは、符号化ピクチャの符号化スライスセグメントのNALユニットを含むのに加え、符号化ピクチャのスライスセグメントを含まない他のNALユニットも含みうる。アクセスユニットの復号の結果、常に復号されたピクチャが生じる。
関連非VCL NALユニット:特定のVCL NALユニットが非VCL NALユニットの関連VCL NALユニットである、非VCL NALユニット。
関連RAPピクチャ:復号順で前のRAPピクチャ(あれば)。
関連VCL NALユニット:nal_unit_typeがEOS_NUT、EOB_NUT、FD_NUT、またはSUFFIX_SEI_NUTに等しく、またはRSV_NVCL45からRSV_NVCL47の範囲内にあり、もしくはUNSPEC48からUNSPEC63の範囲内にある非VCL NALユニットについては、復号順で先行するVCL NALユニット;nal_unit_typeが他の値に等しい非VCL NALユニットについては、復号順で次のVCL NALユニット。
ブロークンリンクアクセス(BLA;broken link access)アクセスユニット:符号化ピクチャがBLAピクチャであるアクセスユニット。
ブロークンリンクアクセス(BLA)ピクチャ:各スライスセグメントがBLA_W_LP、BLA_W_RADLまたはBLA_N_LPに等しいnal_unit_typeを有するRAPピクチャ。
BLAピクチャはIスライスのみを含み、復号順でビットストリームの最初のピクチャでもよいし、またはビットストリームの後の方で現れてもよい。各BLAピクチャは、新たな符号化ビデオシーケンスを開始し、復号プロセスに対してIDRピクチャと同じ影響を持つ。しかし、BLAピクチャは、空でない参照ピクチャセットを指定するシンタックス要素を含む。BLAピクチャがBLA_W_LPに等しいnal_unit_typeを有するときには、ビットストリーム中に存在しないピクチャの参照を含みうるためにデコーダにより出力されず復号できないかもしれない関連RASLピクチャを該BLAピクチャが有しうる。BLAピクチャがBLA_W_LPに等しいnal_unit_typeを有するときには、該BLAピクチャは復号されるよう指定された関連RADLピクチャも有しうる。BLAピクチャがBLA_W_RADLに等しいnal_unit_typeを有するときには、関連RASLピクチャを有しないが、復号されるよう指定された関連RADLピクチャを有しうる。BLAピクチャがBLA_N_LPに等しいnal_unit_typeを有するときには、関連リーディングピクチャを有しない。
クリーンランダムアクセス(CRA;clean random access)アクセスユニット:符号化ピクチャがCRAピクチャであるアクセスユニット。
クリーンランダムアクセス(CRA)ピクチャ:各スライスセグメントがCRA_NUTに等しいnal_unit_typeを有するRAPピクチャ。
CRAピクチャはIスライスのみを含み、復号順でビットストリームの最初のピクチャでもよいし、またはビットストリームの後の方で現れてもよい。CRAピクチャは、関連RADLまたはRASLピクチャを有しうる。CRAピクチャが、復号順でビットストリームの最初のピクチャであるときには、そのCRAピクチャは、復号順で符号化ビデオシーケンスの最初のピクチャであり、関連RASLピクチャは、ビットストリーム中に存在しないピクチャの参照を含みうるためにデコーダにより出力されず復号できないかもしれない。
フィラーデータNALユニット:nal_unit_typeがFD_NUTに等しいNALユニット。
瞬時復号リフレッシュ(IDR;instantaneous decoding refresh)アクセスユニット:符号化ピクチャがIDRピクチャであるアクセスユニット。
瞬時復号リフレッシュ(IDR)ピクチャ:各スライスセグメントがIDR_W_RADLまたはIDR_N_LPに等しいnal_unit_typeを有するRAPピクチャ。
IDRピクチャはIスライスのみを含み、復号順でビットストリームの最初のピクチャであってもよいし、またはビットストリームの後の方で現れてもよい。各IDRピクチャは、復号順で符号化ビデオシーケンスの最初のピクチャである。IDRピクチャがIDR_W_RADLに等しいnal_unit_typeを有するときには、該IDRピクチャは関連RADLピクチャを有しうる。IDRピクチャがIDR_N_LPに等しいnal_unit_typeを有するときには、該IDRピクチャは関連リーディングピクチャを有しない。IDRピクチャは、関連RASLピクチャを有しない。
長期参照ピクチャ:「長期参照のために用いられる」ものとしてマークされたピクチャ。
長期参照ピクチャセット:長期参照ピクチャを含みうる2つの参照ピクチャセットリスト。
ネットワーク抽象化層(NAL;network abstraction layer)ユニット:続くデータのタイプの指示およびそのデータを必要に応じてエミュレーション防止バイトがちりばめられたRBSPの形で含むバイトを含むシンタックス構造。
ネットワーク抽象化層(NAL)ユニットストリーム:一連のNALユニット。
非参照ピクチャ:「参照のために用いられない」ものとしてマークされたピクチャ。
非参照ピクチャは、復号順で後続のピクチャの復号プロセスにおけるインター予測のために使用できないサンプルを含む。
ピクチャパラメータセット(PPS):各スライスセグメントヘッダに含まれるシンタックス要素により定義されるゼロ以上の符号化ピクチャ全体に適用されるシンタックス要素を含むシンタックス構造。
プレフィックスSEI NALユニット:PREFIX_SEI_NUTに等しいnal_unit_typeを有するSEI NALユニット。
ランダムアクセス復号可能リーディング(RADL;random access decodable leading)アクセスユニット:符号化ピクチャがRADLピクチャであるアクセスユニット。
ランダムアクセス復号可能リーディング(RADL)ピクチャ:各スライスセグメントがRADL_NUTに等しいnal_unit_typeを有する符号化ピクチャ。
全てのRADLピクチャは、リーディングピクチャである。RADLピクチャは、同じ関連RAPピクチャのトレイリングピクチャの復号プロセスのために参照ピクチャとして用いられない。存在する場合、全てのRADLピクチャは、復号順で同じ関連RAPピクチャの全てのトレイリングピクチャに先行する。
ランダムアクセスポイント(RAP;random access point)アクセスユニット:符号化ピクチャがRAPピクチャであるアクセスユニット。
ランダムアクセスポイント(RAP)ピクチャ:各スライスセグメントが両端値を含めて7から12までの範囲内のnal_unit_typeを有する符号化ピクチャ。
RAPピクチャはIスライスのみを含み、BLAピクチャ、CRAピクチャまたはIDRピクチャでありうる。ビットストリームの最初のピクチャは、RAPピクチャでなければならない。必要なパラメータセットをアクティブ化が必要な際に利用できるならば、復号順でRAPピクチャに先行するいずれのピクチャの復号プロセスも行わずに、RAPピクチャおよび復号順で後続する全ての非RASLピクチャを適切に復号することができる。RAPピクチャではないIスライスのみを含むピクチャもストリーム中に存在しうる。
ランダムアクセススキップリーディング(RASL;random access skipped leading)アクセスユニット:符号化ピクチャがRASLピクチャであるアクセスユニット。
ランダムアクセススキップリーディング(RASL)ピクチャ:各スライスセグメントがRASL_NUTに等しいnal_unit_typeを有する符号化ピクチャ。
全てのRASLピクチャは、関連BLAまたはCRAピクチャのリーディングピクチャである。関連RAPピクチャがBLAピクチャであるか、またはビットストリームの最初の符号化ピクチャであるとき、RASLピクチャは、ビットストリームに存在しないピクチャの参照を含みうるために出力されず適切に復号できないかもしれない。RASLピクチャは、非RASLピクチャの復号プロセスのための参照ピクチャとして用いられない。存在する場合、全てのRASLピクチャは、復号順で同じ関連RAPピクチャの全てのトレイリングピクチャに先行する。
ローバイトシーケンスペイロード(RBSP;raw byte sequence payload):NALユニットにカプセル化された整数のバイト数を含むシンタックス構造。RBSPは、空であるか、またはRBSPストップビットを従え、0に等しいゼロ以上の後続ビットを従えたシンタックス要素を含むデータビットのストリングの形式を有する。
ローバイトシーケンスペイロード(RBSP)ストップビット:ローバイトシーケンスペイロード(RBSP)内のデータビットのストリングの後に存在する1に等しいビット。RBSPの終端からRBSP内の最後の0ではないビットであるRBSPストップビットを探索することにより、RBSP内のデータビットのストリングの終端の位置を特定できる。
参照ピクチャ:短期参照ピクチャまたは長期参照ピクチャであるピクチャ。
参照ピクチャは、復号順で後続するピクチャの復号プロセスにおけるインター予測に使用されうるサンプルを含む。
シーケンスパラメータセット(SPS):各スライスセグメントヘッダに含まれるシンタックス要素により参照されるピクチャパラメータセットに含まれるシンタックス要素の内容により決定される、ゼロ以上の符号化ビデオシーケンス全体に適用されるシンタックス要素を含むシンタックス構造。
短期参照ピクチャ:「短期参照のために用いられる」ものとしてマークされたピクチャ。
段階的時間サブレイヤアクセス(STSA:step‐wise temporal sub‐layer access)アクセスユニット:符号化ピクチャがSTSAピクチャであるアクセスユニット。
段階的時間サブレイヤアクセス(STSA)ピクチャ:各スライスセグメントがSTSA_RまたはSTSA_Nに等しいnal_unit_typeを有する符号化ピクチャ。
STSAピクチャは、当該STSAピクチャと同じTemporalIdのピクチャをインター予測参照に使用しない。STSAピクチャと同じTemporalIdを有する復号順でSTSAピクチャに続くピクチャは、STSAピクチャと同じTemporalIdを有する復号順でSTSAピクチャより前のピクチャを、インター予測参照に使用しない。STSAピクチャは、当該STSAピクチャで直近下位のサブレイヤから当該STSAピクチャを含むサブレイヤへの上方切り替えを可能にする。STSAピクチャは、0より大きいTemporalIdを有しなければならない。
サフィックスSEI NALユニット:SUFFIX_SEI_NUTに等しいnal_unit_typeを有するSEI NALユニット。
補足的な付加情報(SEI;supplemental enhancement information)NALユニット:PREFIX_SEI_NUTまたはSUFFIX_SEI_NUTに等しいnal_unit_typeを有するNALユニット。
時間サブレイヤアクセス(TSA:temporal sub‐layer access)アクセスユニット:符号化ピクチャがTSAピクチャであるアクセスユニット。
時間サブレイヤアクセス(TSA)ピクチャ:各スライスセグメントがTSA_RまたはTSA_Nに等しいnal_unit_typeを有する符号化ピクチャ。
TSAピクチャおよび復号においてTSAピクチャに続くピクチャは、TSAピクチャのTemporalId以上のTemporalIdのピクチャをインター予測参照に使用しない。TSAピクチャは、当該TSAピクチャで直近下位のサブレイヤから当該TSAピクチャを含むサブレイヤまたは任意のより上位のサブレイヤへの上方切り替えを可能にする。TSAピクチャは、0より大きいTemporalIdを有しなければならない。
トレイリングピクチャ:出力順で関連RAPピクチャに続くピクチャ。
ビデオ符号化レイヤ(VCL;video coding layer)NALユニット:VCL NALユニットとして分類されるnal_unit_typeのリザーブド値を有する符号化スライスセグメントNALユニットおよびNALユニットのサブセットの集合名。
ビデオパラメータセット(VPS;video parameter set):各スライスセグメントヘッダに含まれるシンタックス要素により参照されるピクチャパラメータセットに含まれるシンタックス要素により参照されるシーケンスパラメータセットに含まれるシンタックス要素の内容により決定される、ゼロ以上の符号化ビデオシーケンス全体に適用されるシンタックス要素を含むシンタックス構造。
ここで、時間識別子値は、以下のように定義される。
nuh_temporal_id_plus1−1は、NALユニットの時間識別子を指定する。nuh_temporal_id_plus1の値は、0に等しくないものとする。
変数TemporalIdは、
TemporalId=nuh_temporal_id_plus1−1として指定される。
nal_unit_typeが、両端値を含めて16から23までの範囲内にある場合(RAPピクチャの符号化スライスセグメント)、TemporalIdは0に等しいものとする;そうでない場合は、nal_unit_typeがTSA_R、TSA_N、STSA_RまたはSTSA_Nに等しいとき、TemporalIdは0に等しくないものとする。
TemporalIdの値は、アクセスユニットの全てのVCL NALユニットにつき同じとする。アクセスユニットのTemporalIdの値は、当該アクセスユニットのVCL NALユニットのTemporalIdの値である。
例えば図15を参照すると、ピクチャBに関して、復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい1つより多くの参照ピクチャがあり、そのためdelta_poc_msb_present_flag[i]は1に等しくなる。そして、本明細書に記載される実施形態にしたがって、delta_poc_msb_present_flag[i]は、ピクチャCおよびDについても1に等しく設定される。ピクチャDは、TemporalId=0に帰属するため、復号順でDに後続するピクチャは、それらの後続ピクチャに関して復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい1つより多くの参照ピクチャがない限り、delta_poc_msb_present_flag[i]を1に設定する必要はない。
以上の明細書において使用される用語および表現は、制限ではなく説明のための用語として使用され、このような用語および表現の使用には、図と共に記載された特徴またはその一部の等価物を除外する意図はなく、本発明の範囲は、以下の請求の範囲のみにより制限されることが理解されよう。

Claims (1)

  1. ビデオビットストリームを復号する方法であって、
    前記ビデオビットストリームから参照ピクチャセットパラメータを受信するステップと;
    前記参照ピクチャセットに基づきインター予測を用いて現ピクチャを復号するステップと;
    将来のインター予測のために参照される前記復号されたピクチャを復号ピクチャバッファに格納するステップと
    を含み、
    前記参照ピクチャセットは、少なくとも
    (a)参照ピクチャのピクチャオーダカウント(POC)の最下位ビット(LSB)の値にそれぞれ基づく、1つ以上の参照ピクチャ識別子であって、最下位ビットの前記値は、選択されたビット数によって表される、1つ以上の参照ピクチャ識別子と;
    (b)前記参照ピクチャの前記POCのMSBを決定する後続データが存在するか否かを指定するフラグと
    を用いることにより復号され、前記後続データは、以下の条件
    (i)前記復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLtに等しい1つより多くの参照ピクチャを有すること、および
    (ii)前記条件(i)を満たすピクチャの後、0のTemporalId値を有し、サブストリームのトレイリングピクチャまたは参照ピクチャである復号順で最初のピクチャまでを含む、前記復号順で後続するピクチャ
    のうちの1つを満たすピクチャにつき存在する、方法。
JP2015533777A 2013-01-15 2014-01-14 シグナリングを用いたビデオデコーダ Active JP6209772B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361752937P 2013-01-15 2013-01-15
US61/752,937 2013-01-15
PCT/JP2014/000120 WO2014112354A1 (en) 2013-01-15 2014-01-14 Video decoder with signaling

Publications (2)

Publication Number Publication Date
JP2016507910A JP2016507910A (ja) 2016-03-10
JP6209772B2 true JP6209772B2 (ja) 2017-10-11

Family

ID=51165122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015533777A Active JP6209772B2 (ja) 2013-01-15 2014-01-14 シグナリングを用いたビデオデコーダ

Country Status (6)

Country Link
US (4) US9674524B2 (ja)
EP (1) EP2946558B1 (ja)
JP (1) JP6209772B2 (ja)
CN (1) CN104919803B (ja)
HK (1) HK1214708A1 (ja)
WO (1) WO2014112354A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10674171B2 (en) * 2011-09-27 2020-06-02 Telefonaktiebolaget Lm Ericsson (Publ) Decoders and methods thereof for managing pictures in video decoding process
KR101981712B1 (ko) 2012-11-21 2019-05-24 엘지전자 주식회사 영상 디코딩 방법 및 이를 이용하는 장치
WO2014109607A1 (ko) * 2013-01-10 2014-07-17 삼성전자 주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
PL3119089T3 (pl) * 2013-01-16 2018-11-30 Telefonaktiebolaget Lm Ericsson (Publ) Dekoder i koder do kodowania sekwencji wideo
EP2987326B1 (en) * 2013-04-17 2020-09-02 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
US9894370B2 (en) * 2014-03-24 2018-02-13 Qualcomm Incorporated Generic use of HEVC SEI messages for multi-layer codecs
US9854261B2 (en) 2015-01-06 2017-12-26 Microsoft Technology Licensing, Llc. Detecting markers in an encoded video signal
US10097836B2 (en) * 2015-09-28 2018-10-09 Samsung Electronics Co., Ltd. Method and device to mark a reference picture for video coding
US11595652B2 (en) 2019-01-28 2023-02-28 Op Solutions, Llc Explicit signaling of extended long term reference picture retention
AU2019297829B2 (en) * 2018-07-01 2022-10-06 FG Innovation Company Limited Systems and methods for signaling picture order count values for pictures included in coded video
EP4336832A3 (en) 2018-08-17 2024-05-22 Huawei Technologies Co., Ltd. Reference picture management in video coding
BR112021012708A2 (pt) * 2018-12-31 2021-09-14 Huawei Technologies Co., Ltd. Método e aparelho de modelagem linear de componente cruzado para predição intra
CN113597768A (zh) * 2019-01-28 2021-11-02 Op方案有限责任公司 扩展长期参考图片保留的在线和离线选择
MX2021009140A (es) * 2019-02-01 2021-10-13 Fraunhofer Ges Forschung Codec de video que permite el acceso aleatorio a subimágenes o regiones y concepto para la composición de video usando el mismo.
US10986353B2 (en) * 2019-03-15 2021-04-20 Tencent America LLC Decoded picture buffer management for video coding
MX2021013537A (es) * 2019-05-06 2022-02-03 Huawei Tech Co Ltd Salida de imágenes previas para imágenes que inician una nueva secuencia de video codificada en codificación de video.
WO2020226991A1 (en) * 2019-05-06 2020-11-12 Futurewei Technologies, Inc. Hypothetical reference decoder for gradual decoding refresh
BR112022000292A2 (pt) 2019-07-08 2022-02-22 Huawei Tech Co Ltd Tratamento de múltiplos tamanhos de imagem e janelas de conformidade para reamostragem de imagem de referência em codificação de vídeo
CA3152298A1 (en) * 2019-09-24 2021-04-01 Ye-Kui Wang Support of mixed irap and non-irap pictures within an access unit in multi-layer video bitstreams
CN114830662B (zh) * 2019-12-27 2023-04-14 阿里巴巴(中国)有限公司 用于对图像执行逐步解码刷新处理的方法和系统
KR20220155277A (ko) 2020-03-16 2022-11-22 바이트댄스 아이엔씨 스케일러블 비디오 코딩의 랜덤 액세스 포인트 액세스 유닛
CN115668943A (zh) * 2020-03-23 2023-01-31 Lg电子株式会社 基于混合nal单元类型的图像编码/解码方法和设备及存储比特流的记录介质
EP4115611A4 (en) * 2020-03-30 2023-06-28 ByteDance Inc. Slice type in video coding
US11206428B1 (en) 2020-07-14 2021-12-21 Tencent America LLC Method and apparatus for frequency-dependent joint component secondary transform

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101496407B (zh) * 2006-07-06 2013-02-06 汤姆逊许可证公司 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置
WO2012023817A2 (ko) * 2010-08-18 2012-02-23 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법, 및 참조픽처 인덱싱 장치 및 방법
WO2012052968A1 (en) * 2010-10-20 2012-04-26 Nokia Corporation Method and device for video coding and decoding
US9516379B2 (en) * 2011-03-08 2016-12-06 Qualcomm Incorporated Buffer management in video codecs
KR101911012B1 (ko) * 2011-04-26 2018-12-19 엘지전자 주식회사 참조 픽쳐 리스트 관리 방법 및 이러한 방법을 사용하는 장치
US9591318B2 (en) * 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US9420307B2 (en) * 2011-09-23 2016-08-16 Qualcomm Incorporated Coding reference pictures for a reference picture set
US10674171B2 (en) * 2011-09-27 2020-06-02 Telefonaktiebolaget Lm Ericsson (Publ) Decoders and methods thereof for managing pictures in video decoding process
MX346477B (es) * 2011-10-28 2017-03-22 Samsung Electronics Co Ltd Método para inter-predicción y dispositivo para el mismo, y método para compensación de movimiento y dispositivo para el mismo.
US10003817B2 (en) * 2011-11-07 2018-06-19 Microsoft Technology Licensing, Llc Signaling of state information for a decoded picture buffer and reference picture lists
KR102615301B1 (ko) 2011-11-11 2023-12-19 엘지전자 주식회사 영상 정보 전송 방법 및 장치와 이를 이용한 복호화 방법 및 장치
US9648321B2 (en) * 2011-12-02 2017-05-09 Qualcomm Incorporated Coding picture order count values identifying long-term reference frames
US20130188709A1 (en) 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
US9532055B2 (en) * 2012-04-16 2016-12-27 Microsoft Technology Licensing, Llc Constraints and unit types to simplify video random access
EP2839659A1 (en) 2012-04-16 2015-02-25 Telefonaktiebolaget LM Ericsson (PUBL) Encoder, decoder and methods thereof for video encoding and decoding
WO2014006854A1 (en) 2012-07-01 2014-01-09 Sharp Kabushiki Kaisha Device for signaling a long-term reference picture in a parameter set
WO2014056150A1 (en) * 2012-10-09 2014-04-17 Nokia Corporation Method and apparatus for video coding
US20140140406A1 (en) * 2012-11-16 2014-05-22 General Instrument Corporation Devices and methods for processing of non-idr related syntax for high efficiency video coding (hevc)
US9900609B2 (en) * 2013-01-04 2018-02-20 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding

Also Published As

Publication number Publication date
CN104919803B (zh) 2017-09-12
US20190208224A1 (en) 2019-07-04
EP2946558A1 (en) 2015-11-25
CN104919803A (zh) 2015-09-16
US9674524B2 (en) 2017-06-06
EP2946558B1 (en) 2020-04-29
US20170208342A1 (en) 2017-07-20
US20160345024A1 (en) 2016-11-24
US10230979B2 (en) 2019-03-12
US20140198857A1 (en) 2014-07-17
EP2946558A4 (en) 2016-09-14
JP2016507910A (ja) 2016-03-10
WO2014112354A1 (en) 2014-07-24
HK1214708A1 (zh) 2016-07-29
US10027978B2 (en) 2018-07-17

Similar Documents

Publication Publication Date Title
JP6209772B2 (ja) シグナリングを用いたビデオデコーダ
US11582446B2 (en) Device for decoding a video bitstream
US9807421B2 (en) NAL unit type restrictions
US10057569B2 (en) Alignment of picture order count
EP2901702B1 (en) Signaling scalability information in a parameter set
US20140192894A1 (en) Implicit signaling of scalability dimension identifier information in a parameter set
US20130272398A1 (en) Long term picture signaling
EP2923488B1 (en) Signaling scalability information in a parameter set

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20160107

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170815

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170822

R150 Certificate of patent or registration of utility model

Ref document number: 6209772

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250