JP2016507910A - Video decoder using signaling - Google Patents

Video decoder using signaling Download PDF

Info

Publication number
JP2016507910A
JP2016507910A JP2015533777A JP2015533777A JP2016507910A JP 2016507910 A JP2016507910 A JP 2016507910A JP 2015533777 A JP2015533777 A JP 2015533777A JP 2015533777 A JP2015533777 A JP 2015533777A JP 2016507910 A JP2016507910 A JP 2016507910A
Authority
JP
Japan
Prior art keywords
picture
poc
equal
msb
slice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015533777A
Other languages
Japanese (ja)
Other versions
JP6209772B2 (en
Inventor
サーチン ジー. デシュパンダ
サーチン ジー. デシュパンダ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2016507910A publication Critical patent/JP2016507910A/en
Application granted granted Critical
Publication of JP6209772B2 publication Critical patent/JP6209772B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ビデオビットストリームを復号する方法であって、該ビデオビットストリームから参照ピクチャセットパラメータを受信するステップと;該参照ピクチャセットに基づきインター予測を用いて現ピクチャを復号するステップと;将来のインター予測のために参照される該復号されたピクチャを復号ピクチャバッファに格納するステップとを含み、該参照ピクチャセットは、少なくとも(a)参照ピクチャのピクチャオーダカウント(POC)の最下位ビット(LSB)の選択された数にそれぞれ基づく、1つ以上の参照ピクチャ識別子と;(b)該参照ピクチャのPOCのMSBを決定する後続データが存在するか否かを指定するフラグとを用いることにより復号され、該後続データは、以下の条件(i)該復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLtに等しい1つより多くの参照ピクチャを有すること、および(ii)条件(i)を満たすピクチャの後、0のTemporalId値を有し、サブストリームのトレイリングピクチャまたは参照ピクチャである復号順で最初のピクチャまでを含む、復号順で後続するピクチャ、のうちの1つを満たすピクチャにつき存在する、方法。A method of decoding a video bitstream, receiving reference picture set parameters from the video bitstream; decoding a current picture using inter prediction based on the reference picture set; Storing the decoded picture referenced for decoding in a decoded picture buffer, wherein the reference picture set selects at least (a) the least significant bit (LSB) of the picture order count (POC) of the reference picture Decoded by using one or more reference picture identifiers based on each of the number of received pictures; and (b) a flag that specifies whether there is subsequent data that determines the MSB of the POC of the reference picture Subsequent data has the following condition (i): Sub-trailing trailing picture with 0 TemporalId value after the picture satisfying condition (i), and (ii) the remainder satisfying condition (i) Or a method that exists for a picture that satisfies one of the following pictures in decoding order, including a reference picture up to the first picture in decoding order.

Description

関連出願の相互参照
なし。
Cross-reference of related applications None.

本発明は、ビデオ符号化および/または復号に関する。   The present invention relates to video encoding and / or decoding.

デジタルビデオは通常、一連の画像またはフレームとして表され、そのそれぞれが画素の配列を含む。各画素は、輝度および/または色情報等の情報を含む。多くの場合には、各画素は3色のセットとして表され、各色を8ビット色値で定義することができる。   Digital video is typically represented as a series of images or frames, each containing an array of pixels. Each pixel includes information such as luminance and / or color information. In many cases, each pixel is represented as a set of three colors, and each color can be defined with an 8-bit color value.

例えばH.264/MPEG‐4AVC(H.264/AVC)等のビデオ符号化技術は通常、複雑さが増すのと引き換えに、より高い符号化効率を提供する。ビデオ符号化技術に関する画質要求の高まりおよび画像解像度要求の高まりも、符号化の複雑度を高める。並列復号に適したビデオデコーダにより、復号プロセスの速度を改善し、メモリ要求を低減することができ、並列符号化に適したビデオエンコーダにより、符号化プロセスの速度を改善し、メモリ要求を低減することができる。   For example, H.C. Video coding techniques such as H.264 / MPEG-4 AVC (H.264 / AVC) typically provide higher coding efficiency at the expense of increased complexity. Increasing image quality requirements and image resolution requirements for video encoding techniques also increase the complexity of encoding. A video decoder suitable for parallel decoding can improve the speed of the decoding process and reduce memory requirements, and a video encoder suitable for parallel coding improves the speed of the encoding process and reduces memory requirements be able to.

いずれも参照により全体として本明細書に組み込まれる、H.264/MPEG‐4AVC[ITU‐T VCEGおよびISO/IEC MPEGの合同ビデオチーム(Joint Video Team)、「H.264:一般視聴覚サービスのための高度ビデオ符号化(Advanced video coding for generic audiovisual services)」、ITU‐T Rec.H.264およびISO/IEC14496‐10(MPEG4‐Part10)、2007年11月]、および同様に、JCT‐VC、[「検討中のテストモデル案(Draft Test Model Under Consideration)」、JCTVC‐A205、JCT‐VCミーティング、ドレスデン、2010年4月(JCT‐VC)]は、圧縮効率のためにビデオシーケンス内の参照ピクチャに基づいてピクチャを復号するビデオコーデック(エンコーダ/デコーダ)の仕様書である。   Each of which is incorporated herein by reference in its entirety. H.264 / MPEG-4AVC [joint video team of ITU-T VCEG and ISO / IEC MPEG, “H.264: Advanced video coding for generic audios” ITU-T Rec. H. H.264 and ISO / IEC 14496-10 (MPEG4-Part10), November 2007], and similarly, JCT-VC, ["Draft Test Model Under Consideration", JCTVC-A205, JCT- VC Meeting, Dresden, April 2010 (JCT-VC)] is a video codec (encoder / decoder) specification that decodes pictures based on reference pictures in a video sequence for compression efficiency.

本発明の以上およびその他の目的、特徴および利点は、本発明の以下の詳細な説明を添付の図面に関連して考慮すれば、より容易に理解されるであろう。   The above and other objects, features and advantages of the present invention will be more readily understood when the following detailed description of the invention is considered in conjunction with the accompanying drawings.

本発明の一実施形態は、ビデオビットストリームを復号する方法であって、該ビデオビットストリームから参照ピクチャセットパラメータを受信するステップと;該参照ピクチャセットに基づきインター予測を用いて現ピクチャを復号するステップと;将来のインター予測のために参照される該復号されたピクチャを復号ピクチャバッファに格納するステップとを含み、該参照ピクチャセットは、少なくとも、(a)参照ピクチャのピクチャオーダーカウント(POC;picture order count)の最下位ビット(LSB;least significant bit)の選択された数にそれぞれ基づく1つ以上の参照ピクチャ識別子と;(b)該参照ピクチャのPOCのMSBを決定する後続データが存在するか否かを指定するフラグとを用いることにより復号され、該後続データは、以下の条件(i)該復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLtに等しい参照ピクチャを1つより多く有すること、および(ii)条件(i)を満たすピクチャの後、TemporalId値が0であり、サブストリームのトレイリングピクチャまたは参照ピクチャである、復号順で最初のピクチャまでを含む、復号順で後続するピクチャ、のうちの1つを満たすピクチャにつき存在する、方法を開示する。   One embodiment of the present invention is a method of decoding a video bitstream, receiving a reference picture set parameter from the video bitstream; decoding a current picture using inter prediction based on the reference picture set Storing the decoded picture referenced for future inter prediction in a decoded picture buffer, the reference picture set comprising at least (a) a picture order count (POC) of a reference picture; one or more reference picture identifiers each based on a selected number of least significant bits (LSB) of picture order count (LSB); and (b) subsequent data determining the MSB of the POC of the reference picture Whether finger And the subsequent data has more than one reference picture with the remainder of dividing the picture order count by MaxPicOrderCntLsb in the decoded picture buffer equal to PocLsbLt: (Ii) After the picture satisfying the condition (i), the temporalId value is 0, and the trailing picture or reference picture of the substream, including the first picture in the decoding order and subsequent pictures in the decoding order Disclose methods that exist for pictures that satisfy one of them.

H.264/AVCビデオエンコーダを示した図である。H. 2 is a diagram illustrating a H.264 / AVC video encoder. FIG. H.264/AVCビデオデコーダを示した図である。H. 2 is a diagram illustrating a H.264 / AVC video decoder. FIG. 例示的なスライス構造を示した図である。FIG. 3 shows an exemplary slice structure. 別の例示的なスライス構造を示した図である。FIG. 5 illustrates another exemplary slice structure. エントロピースライスの再構築を示した図である。It is the figure which showed reconstruction of the entropy slice. 図5のエントロピースライスの一部の再構築を示した図である。FIG. 6 is a diagram illustrating reconstruction of a part of the entropy slice of FIG. 5. 省略されたLSBカウント値を用いたエントロピースライスの再構築を示した図である。It is the figure which showed reconstruction of the entropy slice using the abbreviated LSB count value. 長期ピクチャ値を用いたエントロピースライスの再構築を示した図である。It is the figure which showed reconstruction of the entropy slice using a long-term picture value. 長期ピクチャ値を用いて最初の先行フレームを選択することによるエントロピースライスの再構築を示した図である。FIG. 6 is a diagram illustrating restructuring of an entropy slice by selecting a first preceding frame using a long-term picture value. 同じ最下位ビットカウント値を有する重複長期ピクチャフレームを用いることによるエントロピースライスの再構築を示した図である。FIG. 5 shows the reconstruction of entropy slices by using overlapping long-term picture frames having the same least significant bit count value. 参照フレームを選択するための技術を示した図である。It is the figure which showed the technique for selecting a reference frame. 参照フレームを選択するための技術を示した図である。It is the figure which showed the technique for selecting a reference frame. 参照フレームを選択するための別の技術を示した図である。FIG. 6 shows another technique for selecting a reference frame. 参照フレームを選択するための別の技術を示した図である。FIG. 6 shows another technique for selecting a reference frame. 参照フレームを選択するための別の技術を示した図である。FIG. 6 shows another technique for selecting a reference frame. 参照フレームを選択するための別の技術を示した図である。FIG. 6 shows another technique for selecting a reference frame. delta_poc_msb_present_flag[i]が1に設定されるピクチャを示した図である。It is the figure which showed the picture in which delta_poc_msb_present_flag [i] is set to 1.

本明細書に記載される実施形態は、符号化/復号を用いる任意のビデオコーダ/デコーダ(コーデック)に対応しうるが、例示的実施形態は、単に説明の目的で、H.264/AVCエンコーダおよびH.264/AVCデコーダに関して記載される。多くのビデオ符号化技術は、ブロックベースのハイブリッドビデオ符号化アプローチに基づき、情報源符号化技術は、フレーム間とも考えうるピクチャ間予測、フレーム内とも考えうるピクチャ内予測、および予測残差の変換符号化のハイブリッドである。フレーム間予測は時間的冗長性を利用し、フレーム内および予測残差の変換符号化は空間的冗長性を利用することができる。   Although the embodiments described herein may correspond to any video coder / decoder (codec) that uses encoding / decoding, the exemplary embodiments are described in H.264 only for illustrative purposes. H.264 / AVC encoder and H.264 The H.264 / AVC decoder will be described. Many video coding techniques are based on a block-based hybrid video coding approach, and source coding techniques involve inter-picture prediction that can be considered between frames, intra-picture prediction that can be considered as intra-frame, and transformation of prediction residuals. It is a hybrid of encoding. Interframe prediction can use temporal redundancy, and intraframe and transform residual prediction coding can use spatial redundancy.

図1は、電子デバイス102の例示的なエンコーダ104を示したブロック図である。電子デバイス102内に含まれるものとして示された要素の1つ以上は、ハードウェアおよび/またはソフトウェアで実装されうることに注意しなければならない。例えば、電子デバイス102はエンコーダ104を含むが、エンコーダ104は、ハードウェアおよび/またはソフトウェアで実装されればよい。   FIG. 1 is a block diagram illustrating an exemplary encoder 104 of electronic device 102. It should be noted that one or more of the elements shown as included in the electronic device 102 may be implemented in hardware and / or software. For example, the electronic device 102 includes an encoder 104, which may be implemented in hardware and / or software.

電子デバイス102は、供給器134を含んでもよい。供給器134は、ピクチャまたは画像データ(例えばビデオ)をソース106としてエンコーダ104に供給することができる。供給器134の非限定的な例には、画像センサ、メモリ、通信インタフェース、ネットワークインタフェース、無線受信器、ポート、ビデオフレームコンテンツ、前に符号化されたビデオコンテンツ、符号化されていないビデオコンテンツなどが含まれる。   The electronic device 102 may include a supplier 134. The supplier 134 can supply picture or image data (eg, video) as the source 106 to the encoder 104. Non-limiting examples of the supplier 134 include an image sensor, memory, communication interface, network interface, wireless receiver, port, video frame content, previously encoded video content, unencoded video content, etc. Is included.

ソース106が、フレーム内予測モジュールおよび再構築バッファ140に供給されうる。ソース106は、動き推定および動き補償モジュール166に、さらに減算モジュール146にも供給されうる。   Source 106 may be provided to an intra-frame prediction module and reconstruction buffer 140. Source 106 may also be provided to motion estimation and motion compensation module 166 and also to subtraction module 146.

フレーム内予測モジュールおよび再構築バッファ140は、ソース106および再構築データ180に基づいて、イントラモード情報148およびイントラ信号142を発生させうる。動き推定および動き補償モジュール166は、ソース106と参照ピクチャバッファ196の信号198とに基づいて、インターモード情報168およびインター信号144を発生させうる。   Intraframe prediction module and reconstruction buffer 140 may generate intra mode information 148 and intra signal 142 based on source 106 and reconstruction data 180. Motion estimation and motion compensation module 166 may generate inter-mode information 168 and inter signal 144 based on source 106 and signal 198 in reference picture buffer 196.

参照ピクチャバッファ196の信号198は、参照ピクチャバッファ196に格納された1つ以上の参照ピクチャからのデータを含みうる。参照ピクチャバッファ196は、RPSインデックス初期化モジュール108も含みうる。初期化モジュール108は、RPSのバッファリングおよびリスト構築に対応する参照ピクチャを処理しうる。   The signal 198 in the reference picture buffer 196 may include data from one or more reference pictures stored in the reference picture buffer 196. Reference picture buffer 196 may also include an RPS index initialization module 108. The initialization module 108 may process reference pictures corresponding to RPS buffering and list construction.

エンコーダ104は、モードにしたがってイントラ信号142とインター信号144との間で選択することができる。イントラ符号化モードにおいてピクチャ内の空間的特徴を利用するために、イントラ信号142を使用することができる。インター符号化モードにおいてピクチャ間の時間的特徴を利用するために、インター信号144を使用することができる。一方、イントラ符号化モードは、イントラ信号142が減算モジュール146に供給され、イントラモード情報158がエントロピー符号化モジュール160に供給されればよい。一方、インター符号化モードは、インター信号144が減算モジュール146に供給され、インターモード情報168がエントロピー符号化モジュール160に供給されればよい。   The encoder 104 can select between the intra signal 142 and the inter signal 144 according to the mode. Intra signal 142 can be used to take advantage of spatial features in a picture in intra coding mode. The inter signal 144 can be used to take advantage of temporal features between pictures in the inter coding mode. On the other hand, in the intra coding mode, the intra signal 142 may be supplied to the subtraction module 146 and the intra mode information 158 may be supplied to the entropy coding module 160. On the other hand, in the inter coding mode, the inter signal 144 may be supplied to the subtraction module 146 and the inter mode information 168 may be supplied to the entropy coding module 160.

予測残差148を生成するために、減算モジュール146で(モードに応じて)イントラ信号142またはインター信号144のいずれかが、ソース106から減算される。予測残差148は、変換モジュール150に供給される。変換モジュール150は、予測残差148を圧縮して、量子化モジュール154に供給される変換信号152を生成することができる。量子化モジュール154は、変換信号152を量子化して、変換・量子化された係数(TQC;transformed and quantized coefficient)156を生成する。   To generate the prediction residual 148, either the intra signal 142 or the inter signal 144 is subtracted from the source 106 (depending on the mode) at the subtraction module 146. The prediction residual 148 is supplied to the conversion module 150. The transform module 150 can compress the prediction residual 148 to generate a transformed signal 152 that is provided to the quantization module 154. The quantization module 154 quantizes the transformed signal 152 to generate a transformed and quantized coefficient (TQC) 156.

TQC156は、エントロピー符号化モジュール160および逆量子化モジュール170に供給される。逆量子化モジュール170は、TQC156に逆量子化を行って、逆変換モジュール174に供給される逆量子化信号172を生成する。逆変換モジュール174は、逆量子化信号172を伸張して、再構築モジュール178に供給される伸張信号176を生成する。   The TQC 156 is supplied to the entropy encoding module 160 and the inverse quantization module 170. The inverse quantization module 170 performs inverse quantization on the TQC 156 to generate an inverse quantization signal 172 supplied to the inverse transform module 174. The inverse transform module 174 decompresses the inverse quantized signal 172 to generate a decompressed signal 176 that is supplied to the reconstruction module 178.

再構築モジュール178は、伸張信号176に基づいて再構築データ180を生成することができる。例えば再構築モジュール178は、(修正された)ピクチャを再構築することができる。再構築データ180は、デブロッキングフィルタ182に、そしてイントラ予測モジュールおよび再構築バッファ140に、供給されればよい。デブロッキングフィルタ182は、再構築データ180に基づいて、フィルタされた信号184を生成しうる。   The reconstruction module 178 can generate the reconstruction data 180 based on the decompressed signal 176. For example, the reconstruction module 178 can reconstruct a (modified) picture. Reconstruction data 180 may be provided to deblocking filter 182 and to intra prediction module and reconstruction buffer 140. Deblocking filter 182 may generate filtered signal 184 based on reconstruction data 180.

フィルタされた信号184は、サンプル適応オフセット(SAO;sample adaptive offset)モジュール186に供給されればよい。SAOモジュール186は、エントロピー符号化モジュール160に供給されるSAO情報188と、適応ループフィルタ(ALF;adaptive loop filter)192に供給されるSAO信号190とを生成しうる。ALF192は、参照ピクチャバッファ196に供給されるALF信号194を生成する。ALF信号194は、参照ピクチャとして使用することができる1つ以上のピクチャからのデータを含みうる。   The filtered signal 184 may be provided to a sample adaptive offset (SAO) module 186. The SAO module 186 may generate SAO information 188 that is supplied to the entropy encoding module 160 and a SAO signal 190 that is supplied to an adaptive loop filter (ALF) 192. The ALF 192 generates an ALF signal 194 that is supplied to the reference picture buffer 196. The ALF signal 194 may include data from one or more pictures that can be used as reference pictures.

エントロピー符号化モジュール160は、TQC156を符号化して、ビットストリーム114を生成しうる。また、エントロピー符号化モジュール160は、コンテキスト適応型可変長符号化(CAVLC;Context‐Adaptive Variable Length Coding)またはコンテキスト適応型2値算術符号化(CABAC;Context‐Adaptive Binary Arithmetic Coding)を用いてTQC156を符号化しうる。特に、エントロピー符号化モジュール160は、イントラモード情報158、インターモード情報168およびSAO情報188のうちの1つ以上に基づいてTQC156を符号化しうる。ビットストリーム114は、符号化ピクチャデータを含みうる。エンコーダは、一般にマクロブロックと呼ばれるブロックのシーケンスとしてフレームを符号化することが多い。   Entropy encoding module 160 may encode TQC 156 to generate bitstream 114. The entropy coding module 160 uses context-adaptive variable length coding (CAVLC) or context-adaptive binary arithmetic coding (CABAC) using context-adaptive binary arithmetic coding (CBAC15). Can be encoded. In particular, entropy encoding module 160 may encode TQC 156 based on one or more of intra mode information 158, inter mode information 168, and SAO information 188. The bitstream 114 can include encoded picture data. Encoders often encode frames as a sequence of blocks, commonly referred to as macroblocks.

HEVC等のビデオ圧縮に関わる量子化は、ある範囲の値を1つの値に圧縮することにより達成される、損失を伴う圧縮技術である。量子化パラメータ(QP;quantization parameter)は、再構築されたビデオの品質および圧縮率の両方に基づいて量子化を行うために使用される所定のスケーリングパラメータである。ブロックタイプは、HEVCにおいて所与のブロックの特徴をブロックサイズおよびその色情報に基づいて表すように定義される。QP、解像度情報、およびブロックタイプは、エントロピー符号化の前に決定されればよい。例えば、電子デバイス102(例えばエンコーダ104)がQP、解像度情報、およびブロックタイプを決定し、これらがエントロピー符号化モジュール160に供給されればよい。   Quantization associated with video compression, such as HEVC, is a lossy compression technique that is achieved by compressing a range of values into a single value. A quantization parameter (QP) is a predetermined scaling parameter used to perform quantization based on both the quality of the reconstructed video and the compression rate. A block type is defined to represent the characteristics of a given block in HEVC based on block size and its color information. The QP, resolution information, and block type may be determined before entropy coding. For example, the electronic device 102 (eg, the encoder 104) may determine the QP, resolution information, and block type, and these may be supplied to the entropy encoding module 160.

エントロピー符号化モジュール160は、TQC156のブロックに基づいてブロックサイズを決定してもよい。例えばブロックサイズは、1次元のTQCのブロックに沿ったTQC156の数であればよい。換言すれば、TQCのブロックの中のTQC156の数は、ブロックサイズの2乗に等しければよい。例えば、TQCのブロックの中のTQC156の数の平方根としてブロックサイズが決定されればよい。解像度は、画素幅x画素高さとして定義できる。解像度情報には、ピクチャの幅、ピクチャの高さ、または両方の画素数を含みうる。ブロックサイズは、1次元のTQCの2Dブロックに沿ったTQC156の数として定義できる。   Entropy encoding module 160 may determine the block size based on the block of TQC 156. For example, the block size may be the number of TQC 156 along a one-dimensional TQC block. In other words, the number of TQC 156 in the block of TQC may be equal to the square of the block size. For example, the block size may be determined as the square root of the number of TQC 156 in the block of TQC. Resolution can be defined as pixel width x pixel height. The resolution information can include picture width, picture height, or the number of pixels of both. Block size can be defined as the number of TQCs 156 along a 2D block of one-dimensional TQC.

一部の構成では、ビットストリーム114は、別の電子デバイスに伝送されてもよい。例えば、ビットストリーム114は、通信インタフェース、ネットワークインタフェース、無線伝送器、ポートなどに供給されればよい。例えば、ビットストリーム114は、LAN、インターネット、携帯電話基地局などを介して別の電子デバイスへ伝送されればよい。ビットストリーム114は、追加的または代替的に電子デバイス102または他の電子デバイスのメモリに格納されてもよい。   In some configurations, the bitstream 114 may be transmitted to another electronic device. For example, the bit stream 114 may be supplied to a communication interface, a network interface, a wireless transmitter, a port, and the like. For example, the bit stream 114 may be transmitted to another electronic device via a LAN, the Internet, a mobile phone base station, or the like. The bitstream 114 may additionally or alternatively be stored in the memory of the electronic device 102 or other electronic device.

図2は、電子デバイス202上の例示的なデコーダ212を示したブロック図である。デコーダ212は、電子デバイス202に含まれていてもよい。例えばデコーダ212は、HEVCデコーダであればよい。デコーダ212および/またはデコーダ212に含まれるものとして図示された要素の1つ以上は、ハードウェアおよび/またはソフトウェアで実装されてもよい。デコーダ212は、復号のためにビットストリーム214(例えばビットストリーム214に含まれる1つ以上の符号化されたピクチャ)を受信すればよい。一部の構成では、受信ビットストリーム214は、受信スライスヘッダ、受信PPS、受信バッファ記述情報等の、受信オーバーヘッド情報を含めばよい。ビットストリーム214に含まれる符号化されたピクチャは、1つ以上の符号化された参照ピクチャおよび/または1つ以上の他の符号化されたピクチャを含めばよい。   FIG. 2 is a block diagram illustrating an exemplary decoder 212 on the electronic device 202. The decoder 212 may be included in the electronic device 202. For example, the decoder 212 may be a HEVC decoder. Decoder 212 and / or one or more of the elements illustrated as included in decoder 212 may be implemented in hardware and / or software. Decoder 212 may receive bitstream 214 (eg, one or more encoded pictures included in bitstream 214) for decoding. In some configurations, the received bitstream 214 may include reception overhead information such as a received slice header, received PPS, and received buffer description information. The encoded pictures included in the bitstream 214 may include one or more encoded reference pictures and / or one or more other encoded pictures.

(ビットストリーム214に含まれる1つ以上の符号化されたピクチャの中の)受信シンボルは、エントロピー復号モジュール268によってエントロピー復号され、これにより動き情報信号270ならびに量子化、スケーリングおよび/または変換された係数272が生成される。   Received symbols (in one or more encoded pictures included in bitstream 214) are entropy decoded by entropy decoding module 268, which results in motion information signal 270 and quantized, scaled and / or transformed. A coefficient 272 is generated.

動き情報信号270は、動き補償モジュール274で、フレームメモリ278からの参照フレーム信号298の一部分と組み合わされ、それによってフレーム間予測信号282を生成しうる。量子化、デスケーリングおよび/または変換された係数272は、逆モジュール262によって逆量子化、スケーリングおよび逆変換され、それによって復号された残差信号284を生成しうる。復号された残差信号284は、結合信号286を生成するために予測信号292に加算されうる。予測信号292は、フレーム間予測信号282か、またはフレーム内予測モジュール288によって生成されたフレーム内予測信号290のいずれかから選択された信号であればよい。いくつかの構成において、この信号選択は、ビットストリーム214に基づいてもよい(例えば、ビットストリーム214によって制御される)。   Motion information signal 270 may be combined with a portion of reference frame signal 298 from frame memory 278 at motion compensation module 274, thereby generating inter-frame prediction signal 282. Quantized, descaled and / or transformed coefficients 272 may be inverse quantized, scaled and inverse transformed by inverse module 262, thereby producing a decoded residual signal 284. The decoded residual signal 284 can be added to the predicted signal 292 to generate a combined signal 286. The prediction signal 292 may be a signal selected from either the inter-frame prediction signal 282 or the intra-frame prediction signal 290 generated by the intra-frame prediction module 288. In some configurations, this signal selection may be based on the bitstream 214 (eg, controlled by the bitstream 214).

フレーム内予測信号290は、(例えば、現フレームにおいて)前に復号された結合信号292からの情報から予測できる。結合信号292は、さらにデブロッキングフィルタ294によりフィルタされればよい。結果として生じるフィルタされた信号296は、フレームメモリ278に書き込まれればよい。結果として生じるフィルタされた信号296は、復号されたピクチャを含みうる。   The intra-frame prediction signal 290 can be predicted from information from the previously decoded combined signal 292 (eg, in the current frame). The combined signal 292 may be further filtered by the deblocking filter 294. The resulting filtered signal 296 may be written to the frame memory 278. The resulting filtered signal 296 may include a decoded picture.

フレームメモリ778は、本明細書に記載されるDPBを含みうる。DPBは、短期または長期参照フレームとして保持されうる1つ以上の復号されたピクチャを含みうる。フレームメモリ278は、復号されたピクチャに対応するオーバーヘッド情報も含みうる。例えばフレームメモリ278は、スライスヘッダ、PPS情報、サイクルパラメータ、バッファ記述情報などを含めばよい。これらの情報の1つ以上は、エンコーダ(例えばエンコーダ104)からシグナリングされてもよい。フレームメモリ278は、復号されたピクチャ718を供給しうる。   Frame memory 778 may include a DPB as described herein. The DPB may include one or more decoded pictures that can be held as short-term or long-term reference frames. Frame memory 278 may also include overhead information corresponding to the decoded picture. For example, the frame memory 278 may include a slice header, PPS information, cycle parameters, buffer description information, and the like. One or more of these pieces of information may be signaled from an encoder (eg, encoder 104). Frame memory 278 may provide decoded picture 718.

複数のマクロブロックを含む入力ピクチャは、1つまたはいくつかのスライスに分割されうる。エンコーダおよびデコーダで使用される参照ピクチャが同じであり、デブロッキングフィルタリングがスライス境界を越える情報を使用しないならば、スライスが表すピクチャのエリア内のサンプルの値は、他のスライスからのデータを使用せずに適切に復号できる。したがって、あるスライスのエントロピー復号およびマクロブロック再構築は、他のスライスに依存しない。特に、各スライスの開始時にエントロピー符号化状態がリセットされればよい。他のスライスのデータは、エントロピー復号および再構築の両方のための近傍利用可能性を定義する際に利用不可能としてマークされればよい。スライスは、並列にエントロピー復号および再構築されればよい。イントラ予測および動きベクトル予測は、スライスの境界を越えられないのが好ましい。対して、デブロッキングフィルタリングは、スライス境界を越える情報を使用してもよい。   An input picture including multiple macroblocks may be divided into one or several slices. If the reference pictures used by the encoder and decoder are the same and deblocking filtering does not use information across slice boundaries, the value of the sample in the area of the picture that the slice represents uses data from other slices Can be properly decrypted. Thus, entropy decoding and macroblock reconstruction for one slice are independent of other slices. In particular, the entropy coding state may be reset at the start of each slice. Other slice data may be marked as unavailable when defining neighborhood availability for both entropy decoding and reconstruction. Slices may be entropy decoded and reconstructed in parallel. Intra prediction and motion vector prediction preferably do not cross slice boundaries. In contrast, deblocking filtering may use information across slice boundaries.

図3は、水平方向に11個のマクロブロック、垂直方向に9個のマクロブロックを含む、例示的ビデオピクチャ90を示す(9個の例示的なマクロブロックが91〜99と標識されている)。図3は、「スライス#0」と示された第1のスライス89、「スライス#1」と示された第2のスライス88、および「スライス#2」と示された第3のスライス87の、3つの例示的なスライスを示す。H.264/AVCデコーダは、3つのスライス87、88、89を並列に復号および再構築しうる。各スライスが、走査線順に逐次伝送されてもよい。各スライスの復号/再構築処理の始めに、エントロピー復号268が初期化またはリセットされ、他のスライスのマクロブロックが、エントロピー復号およびマクロブロック再構築のいずれにも利用不可能としてマークされる。したがって、「スライス#1」の中のあるマクロブロック、例えば93と標識されたマクロブロックについて、「スライス#0」の中のマクロブロック(例えば91および92と標識されたマクロブロック)をエントロピー復号または再構築のために使用することはできない。一方、「スライス#1」の中にあるマクロブロック、例えば95と標識されたマクロブロックについて、「スライス#1」の中の他のマクロブロック(例えば93および94と標識されたマクロブロック)をエントロピー復号または再構築のために使用することはできる。したがって、エントロピー復号およびマクロブロック再構築は、スライス内で順次進行する。スライスがフレキシブルマクロブロック順序付け(FMO;flexible macroblock ordering)を用いて定義されない限り、スライス内のマクロブロックは、ラスタ走査順に処理される。   FIG. 3 shows an exemplary video picture 90 that includes 11 macroblocks in the horizontal direction and 9 macroblocks in the vertical direction (9 exemplary macroblocks are labeled 91-99). . FIG. 3 shows a first slice 89 labeled “Slice # 0”, a second slice 88 labeled “Slice # 1”, and a third slice 87 labeled “Slice # 2”. Three exemplary slices are shown. H. The H.264 / AVC decoder can decode and reconstruct the three slices 87, 88, 89 in parallel. Each slice may be sequentially transmitted in the scanning line order. At the beginning of the decoding / reconstruction process for each slice, entropy decoding 268 is initialized or reset, and macroblocks in other slices are marked as unavailable for both entropy decoding and macroblock reconstruction. Thus, for a macroblock in “slice # 1”, eg, the macroblock labeled 93, the macroblocks in “slice # 0” (eg, the macroblocks labeled 91 and 92) are entropy decoded or It cannot be used for reconstruction. On the other hand, for macroblocks in “slice # 1”, eg, macroblocks labeled 95, other macroblocks in “slice # 1” (eg, macroblocks labeled 93 and 94) are entropy. Can be used for decryption or reconstruction. Thus, entropy decoding and macroblock reconstruction proceed sequentially within a slice. Unless the slice is defined using flexible macroblock ordering (FMO), the macroblocks in the slice are processed in raster scan order.

フレキシブルマクロブロック順序付けは、スライスグループを定義して、1つのピクチャがどのようにスライスに分割されるかを変更する。スライスグループ内のマクロブロックは、マクロブロック対スライスグループマップにより定義され、マクロブロック対スライスグループマップは、ピクチャパラメータセットのコンテンツおよびスライスヘッダ中の追加情報によってシグナリングされる。マクロブロック対スライスグループマップは、ピクチャ内の各マクロブロックに対するスライスグループ識別番号からなる。スライスグループ識別番号は、関連するマクロブロックがどのスライスグループに属するかを指定する。各スライスグループは、1つ以上のスライスに分割することができ、スライスは、特定のスライスグループのマクロブロックのセット内でラスタ走査順に処理される同じスライスグループ内の一連のマクロブロックである。エントロピー復号およびマクロブロック再構築は、スライスグループ内で順次進行する。   Flexible macroblock ordering defines slice groups and changes how a picture is divided into slices. Macroblocks within a slice group are defined by a macroblock-to-slice group map, which is signaled by the contents of the picture parameter set and additional information in the slice header. The macroblock-to-slice group map includes a slice group identification number for each macroblock in the picture. The slice group identification number specifies which slice group the associated macroblock belongs to. Each slice group can be divided into one or more slices, where a slice is a series of macroblocks within the same slice group that are processed in raster scan order within a set of macroblocks of a particular slice group. Entropy decoding and macroblock reconstruction proceed sequentially within a slice group.

図4は、「スライスグループ#0」と示された第1のスライスグループ86、「スライスグループ#1」と示された第2のスライスグループ85、および「スライスグループ#2」と示された第3のスライスグループ84の3つのスライスグループへの、例示的なマクロブロックの割り当てを示す。これらのスライスグループ84、85、86は、ピクチャ90の中の2つの前景領域および1つの背景領域にそれぞれ関連付けられる。   FIG. 4 shows a first slice group 86 indicated as “slice group # 0”, a second slice group 85 indicated as “slice group # 1”, and a first slice group 85 indicated as “slice group # 2”. 3 shows exemplary macroblock assignments of three slice groups 84 to three slice groups. These slice groups 84, 85, 86 are associated with two foreground regions and one background region in the picture 90, respectively.

ピクチャは、1つ以上のスライスに分割されてもよく、エンコーダおよびデコーダで使用される参照ピクチャが同一であるならば、スライスは、当該スライスが表すピクチャのエリア内のサンプルの値を、他のスライスからのデータを用いずに正しく再構築できるという点で、自己完結的である。スライス内の全ての再構築されたマクロブロックは、再構築のための近傍の定義において利用可能である。   A picture may be divided into one or more slices, and if the reference pictures used in the encoder and decoder are the same, the slice will return the value of the sample in the area of the picture that the slice represents It is self-contained in that it can be reconstructed correctly without using data from the slice. All reconstructed macroblocks in the slice are available in the neighborhood definition for reconstruction.

スライスは、1つより多くのエントロピースライスに分割されてもよく、エントロピースライスは、当該エントロピースライスが表すピクチャのエリアを、他のエントロピースライスからのデータを用いずに正しくエントロピー復号できるという点で、自己完結的である。各エントロピースライスの復号開始時に、エントロピー復号268がリセットされればよい。他のエントロピースライス中のデータは、エントロピー復号のための近傍利用可能性を定義する際に利用不可能としてマークされうる。   A slice may be divided into more than one entropy slice, which can correctly entropy decode the area of a picture that the entropy slice represents without using data from other entropy slices, Self-contained. The entropy decoding 268 may be reset at the start of decoding of each entropy slice. Data in other entropy slices may be marked as unavailable when defining neighborhood availability for entropy decoding.

ピクチャを復号するために構成されたデバイスは、現ピクチャを含む一連のピクチャを含むビットストリームを取得または別途受信する。デバイスは、現ピクチャまたはビットストリームにおいてピクチャがシグナリングされる順序で現ピクチャに後続するピクチャの復号に使用できる他のフレームの識別のために使用できる、参照ピクチャセット(RPS)パラメータをさらに取得する。   A device configured to decode a picture obtains or otherwise receives a bitstream that includes a series of pictures including the current picture. The device further obtains a reference picture set (RPS) parameter that can be used to identify other frames that can be used to decode a picture that follows the current picture in the order in which the picture is signaled in the current picture or bitstream.

RPSは、現フレームに関連する参照ピクチャのセットの識別を提供する。RPSは、現ピクチャのインター予測に使用できる、復号順で現ピクチャより前の参照ピクチャを識別し、および/または現ピクチャのインター予測に使用できる、復号順で現ピクチャの後の参照ピクチャを識別しうる。例えば、システムがフレーム1、3、5を受信し、5が3を参照に使用し、エンコーダがフレーム1をフレーム7の予測に使用する場合、5のRPSは、フレーム1がフレーム5の参照に使用されなくても、フレーム3および1の両方をフレームメモリ278に維持するようシグナリングしうる。一実施形態では、5のRPSは、[−2 −4]であればよい。加えて、フレームメモリ278は、表示ピクチャバッファ、または同等にDPBと呼称されてもよい。   The RPS provides identification of a set of reference pictures associated with the current frame. RPS identifies a reference picture before the current picture in decoding order that can be used for inter prediction of the current picture and / or identifies a reference picture after the current picture in decoding order that can be used for inter prediction of the current picture Yes. For example, if the system receives frames 1, 3, 5, 5 uses 3 as a reference, and the encoder uses frame 1 for prediction of frame 7, an RPS of 5 will cause frame 1 to reference frame 5. Even if not used, both frames 3 and 1 may be signaled to be maintained in the frame memory 278. In one embodiment, the RPS of 5 may be [−2−4]. In addition, the frame memory 278 may be referred to as a display picture buffer, or equivalently DPB.

RPSは、後の使用のために復号ピクチャバッファ(DPB;decoded picture buffer)に少なくとも限られた持続時間にわたり保持されるべき1つ以上の参照ピクチャを記述する。このRPSの識別は、各ピクチャのスライスヘッダに、ピクチャとともに、および/またはピクチャ群とともに、含まれればよい。加えて、RPSのリストが、ピクチャパラメータセット(PPS;picture parameter set)で送信されてもよい。そして、スライスヘッダは、そのスライスでの使用をシグナリングするために、PPSで送信されるRPSの1つを指せばよい。例えば、ピクチャ群のRPSが、ピクチャパラメータセット(PPS)においてシグナリングされればよい。現フレームのRPSの一部ではない、DPBの任意のピクチャは、「参照のために用いられない」ものとしてマークされればよい。   The RPS describes one or more reference pictures to be retained for at least a limited duration in a decoded picture buffer (DPB) for later use. This RPS identification may be included in the slice header of each picture together with the picture and / or together with the picture group. In addition, a list of RPSs may be sent in a picture parameter set (PPS). The slice header may then point to one of the RPSs transmitted in the PPS in order to signal usage in that slice. For example, the RPS of the picture group may be signaled in the picture parameter set (PPS). Any picture in the DPB that is not part of the RPS of the current frame may be marked as “not used for reference”.

DPBは、デコーダで再構築された(例えば復号された)ピクチャを格納するために使用されうる。これらの格納されたピクチャはその後、例えばインター予測技術において使用することができる。また、DPB内のピクチャは、ピクチャオーダーカウント(POC)に関連付けられればよい。POCは、各符号化ピクチャに関連付けられ、出力順におけるピクチャ位置の増加に伴って増加する値を有する、変数とすることができる。換言すると、POCは、ピクチャを表示のために正しい順番で送るためにデコーダにより使用されうる。POCは、参照ピクチャリストの構築中の参照ピクチャの識別および復号された参照ピクチャの識別にも使用されうる。さらに、POCは、エンコーダからデコーダへの伝送中に失われたピクチャの識別に使用されうる。   The DPB can be used to store pictures reconstructed (eg, decoded) at the decoder. These stored pictures can then be used, for example, in inter prediction techniques. In addition, a picture in the DPB may be associated with a picture order count (POC). The POC may be a variable associated with each coded picture and having a value that increases with increasing picture position in output order. In other words, the POC can be used by the decoder to send the pictures in the correct order for display. The POC may also be used for identification of reference pictures during construction of the reference picture list and identification of decoded reference pictures. Furthermore, POC can be used to identify pictures lost during transmission from the encoder to the decoder.

図5を参照すると、エンコーダからデコーダに供給されるフレームのセット300の一例が示されている。各フレームは、関連するPOC310を有していればよい。図のように、POCは、負の数から大きな正数までインクリメントしてもよい。一部の実施形態では、POCは、ゼロからより大きな正数までインクリメントするだけでもよい。POCは、典型的にはフレーム毎に1ずつインクリメントされるが、1つ以上のPOCがスキップされ、または他の方法で省略される場合もある。例えば、エンコーダ中のフレームのセットのPOCは、0、1、2、3、4、5などとすることができる。例えば、エンコーダ中の同じフレームのセットまたは別のフレームのセットのPOCが、0、1、2、4、5などであり、POC3がスキップされ、または他の方法で省略されてもよい。   Referring to FIG. 5, an example of a set 300 of frames supplied from an encoder to a decoder is shown. Each frame only needs to have an associated POC 310. As shown, the POC may be incremented from a negative number to a large positive number. In some embodiments, the POC may only increment from zero to a larger positive number. The POC is typically incremented by 1 for each frame, but one or more POCs may be skipped or otherwise omitted. For example, the POC of the set of frames in the encoder can be 0, 1, 2, 3, 4, 5, etc. For example, the POC of the same set of frames or another set of frames in the encoder may be 0, 1, 2, 4, 5, etc., and POC3 may be skipped or otherwise omitted.

POCが十分に大きくなるのに伴い、POCを用いて各フレームを識別するために多数のビットが必要となるであろう。エンコーダは、各フレームを識別するために、4ビットなど、POCの最下位ビット(LSB)の選択された数を使用することにより、特定のPOCを識別するために使用されるビット数を削減することができる。現フレームを復号するために用いられる参照フレームは、現フレームの時間的に近くに位置することが多いため、この識別技術は適切であり、システムの計算複雑度の低減およびビデオのビットレートの全体的削減がもたらされる。ピクチャを識別するために使用するLSBの数は、ビットストリームにおいてデコーダにシグナリングされてもよい。   As the POC becomes sufficiently large, a large number of bits will be required to identify each frame using the POC. The encoder reduces the number of bits used to identify a particular POC by using a selected number of least significant bits (LSBs) of the POC, such as 4 bits, to identify each frame be able to. Since the reference frame used to decode the current frame is often located close in time to the current frame, this identification technique is appropriate, reducing the computational complexity of the system and the overall video bit rate. Reduction. The number of LSBs used to identify a picture may be signaled to the decoder in the bitstream.

図のように、POCのLSBの選択された数が4の場合、LSBが4ビットであり、LSBインデックスは16値(2^4)毎に繰り返す。したがって、フレーム0は0の値を有するLSBを有し、フレーム1は1の値を有するLSBを有し、・・・、フレーム14は14の値を有するLSBを有し、フレーム15は15の値を有するLSBを有する。しかし、フレーム16は再び0の値を有するLSBを有し、フレーム17は再び1の値を有するLSBを有し、フレーム20は4の値を有するLSBを有する。LSB識別子(一般にPOCのLSB、または同等にPOC LSBとも呼称される)は、LSB=POC%16の特徴を有していればよく、%は、16(2^最下位ビットの数、ここでは4)で割った後の余りである。同様に、POCを識別するためのLSBの選択された数がNビットである場合、LSB識別子は、LSB=POC%(2^N)の特徴を有していればよく、2^Nは、2のN乗を示す。フレームを識別するためにビットストリームにPOCを含めるより、エンコーダがデコーダへのビットストリームにおいてLSBインデックス(一般にPOCのLSB、または同等にPOC LSBとも呼称される)を供給するのが好ましい。   As shown in the figure, when the selected number of POC LSBs is 4, the LSB is 4 bits and the LSB index repeats every 16 values (2 ^ 4). Thus, frame 0 has an LSB with a value of 0, frame 1 has an LSB with a value of 1, ..., frame 14 has an LSB with a value of 14, and frame 15 has 15 LSB with value. However, frame 16 again has an LSB with a value of 0, frame 17 again has an LSB with a value of 1, and frame 20 has an LSB with a value of 4. The LSB identifier (generally also referred to as POC LSB, or equivalently POC LSB), should only have the characteristics LSB = POC% 16, where% is 16 (2 ^ number of least significant bits, here This is the remainder after dividing by 4). Similarly, if the selected number of LSBs for identifying POC is N bits, the LSB identifier only needs to have the characteristics LSB = POC% (2 ^ N), where 2 ^ N is 2 to the Nth power. Rather than including POC in the bitstream to identify the frame, it is preferred that the encoder supply an LSB index (commonly referred to as POC LSB, or equivalently POC LSB) in the bitstream to the decoder.

現フレームまたは現フレームの後のフレームのインター予測に用いられる参照フレームは、相対(例えばデルタ)参照(例えばdeltaPOCおよびcurrentPOCを使用して)または絶対参照(例えばPOCを使用して)のいずれかを用いてRPSにより識別できる。例えば、POC5 310により識別され、LSB5 320としてビットストリームでデコーダにシグナリングされるフレームは、[−5,−2,−1]の関連するRPS330を有しうる。RPS値の意味は後述する。   The reference frame used for inter prediction of the current frame or a frame after the current frame is either a relative (eg delta) reference (eg using deltaPOC and currentPOC) or an absolute reference (eg using POC). And can be identified by RPS. For example, a frame identified by POC5 310 and signaled to the decoder in the bitstream as LSB5 320 may have an associated RPS 330 of [-5, -2, -1]. The meaning of the RPS value will be described later.

図5の一部を示した図6を参照すると、[−5,−2,−1]のRPSは、5つ前のフレーム320、2つ前のフレーム321、および1つ前のフレーム322を含むフレームを指す。このRPSはさらに、図6に示すように、それぞれ0、3、および4のPOC値を指す。RPSは、現フレームのPOC値と、前のフレームのPOC値との間の差を指すのが典型的である。例えば、5のPOC値を有する現フレームについての[−5,−2,−1]のRPSは、5−5=0;5−2=3;および5−1=4のPOC値を有するフレームを指す。本明細書の例には示していないが、RPSは、将来のフレームも含むことができることに注意されたい。これらの将来のフレームは、RPSにおいて正のデルタPCO値を用いて示されることとなる。   Referring to FIG. 6 showing a part of FIG. 5, the RPS of [−5, −2, −1] includes the fifth previous frame 320, the second previous frame 321, and the previous previous frame 322. Refers to the containing frame. This RPS further refers to POC values of 0, 3, and 4, respectively, as shown in FIG. RPS typically refers to the difference between the POC value of the current frame and the POC value of the previous frame. For example, an RPS of [-5, -2, -1] for a current frame with a POC value of 5 is a frame with POC values of 5-5 = 0; 5-2 = 3; and 5-1 = 4 Point to. Note that although not shown in the examples herein, the RPS may also include future frames. These future frames will be indicated with a positive delta PCO value in the RPS.

1つ以上のPOC値がスキップされ、または別途ビットストリームの一部で省略される場合など、POC値が連続していない場合、図7に示されるように、現フレームのPOC値と前のフレームのPOC値との間の差は、前のフレームと現フレームとの間に出力されるフレームの数と異なりうる。RPSは、フレームとともに供給される、またはフレームのセットとともに供給されるなど、任意の適切な様式でビットストリームにおいてシグナリングされればよい。   If the POC values are not consecutive, such as when one or more POC values are skipped or omitted separately in part of the bitstream, the POC value of the current frame and the previous frame, as shown in FIG. May be different from the number of frames output between the previous frame and the current frame. The RPS may be signaled in the bitstream in any suitable manner, such as supplied with a frame or supplied with a set of frames.

図8を参照すると、参照フレームをシグナリングするための別の技術は、一般に長期ピクチャと呼ばれる絶対参照をフレームに関連するRPSにおいて用いることである。参照フレームが絶対参照を用いてシグナリングされるか相対参照を用いてシグナリングされるかに応じて、動きベクトル予測技術等の復号処理が異なりうる。絶対参照(便宜上LTと呼ぶ)は、前のフレームまたは後続フレーム等の参照フレームに関連する特定のLSBカウント値を指す。例えば、LT=3(LT3)の絶対参照は、POC LSB値が3の参照フレームを指す。したがって、[LT3,−5]のRPSは、POC LSB値が3の参照フレーム、およびPOCが現フレームのPOCマイナス5に等しい参照フレームを指す。図8では、このRPSは、POCが3に等しい参照フレーム444、およびPOCが0に等しい参照フレーム320に対応する。典型的には、LT3は、POC LSB値が3に等しい、現フレームより前の最初のフレームを指す。一実施形態では、LT3は、POC LSB値が3である、出力順で現フレームより前の最初のフレームを指す。第二の実施形態では、LT3は、POC LSB値が3である、伝送順で現フレームより前の最初のフレームを指す。このようなシステムは、多くのビットストリームに適するが、LSBカウント値が3の直前のフレームとは異なる、LSBカウント値が3のフレームを選択するために十分に強力ではない。   Referring to FIG. 8, another technique for signaling a reference frame is to use an absolute reference, commonly referred to as a long-term picture, in the RPS associated with the frame. Depending on whether the reference frame is signaled using an absolute reference or relative reference, the decoding process such as a motion vector prediction technique may be different. Absolute reference (referred to as LT for convenience) refers to a specific LSB count value associated with a reference frame, such as a previous frame or a subsequent frame. For example, an absolute reference with LT = 3 (LT3) refers to a reference frame with a POC LSB value of 3. Thus, the RPS of [LT3, -5] refers to a reference frame with a POC LSB value of 3 and a reference frame with POC equal to POC minus 5 of the current frame. In FIG. 8, this RPS corresponds to a reference frame 444 with a POC equal to 3 and a reference frame 320 with a POC equal to 0. Typically, LT3 refers to the first frame before the current frame with a POC LSB value equal to 3. In one embodiment, LT3 refers to the first frame prior to the current frame in output order with a POC LSB value of 3. In the second embodiment, LT3 refers to the first frame prior to the current frame in transmission order, with a POC LSB value of 3. Such a system is suitable for many bitstreams, but is not powerful enough to select a frame with an LSB count value of 3, which is different from the previous frame with an LSB count value of 3.

図9を参照すると、例えばエンコーダがフレーム31(POC=31)を符号化しており、システムが、POC LSB=0(LT0)の長期ピクチャの使用をシグナリングする場合、フレーム16(POC=16)がLSB=0である1つ前のフレームであることから、このシグナリングはフレーム16(POC=16)を指す(A)。しかし、エンコーダが、同様に0のLSBカウント値を持つ長期ピクチャフレーム0をシグナリングしたかったとしても、このように1つ前のフレームを参照するスキームでは達成できない。この限界を克服するための一つの技術は、長期フレームLSBまたはPOC LSBをシグナリングするために使用される最下位ビットの数を増加させることである。このような最下位ビット数の増加は可能であるが、その結果、相当の追加ビットがビットストリームに追加される。   Referring to FIG. 9, for example, if the encoder is encoding frame 31 (POC = 31) and the system signals the use of a long-term picture with POC LSB = 0 (LT0), then frame 16 (POC = 16) Since this is the previous frame with LSB = 0, this signaling points to frame 16 (POC = 16) (A). However, even if the encoder wants to signal a long-term picture frame 0 having an LSB count value of 0, it cannot be achieved by a scheme that refers to the previous frame in this way. One technique for overcoming this limitation is to increase the number of least significant bits used to signal the long-term frame LSB or POC LSB. Such an increase in the number of least significant bits is possible, but as a result, considerable additional bits are added to the bitstream.

ビットストリームに追加される追加ビットがより少なくなる、より好適な技術は、対応するPOC LSB値を持つ1つ前のフレームとは異なる長期ピクチャをシグナリングすることである。例えば、システムは、[LT0|2]として絶対参照を有する現フレームのRPSを指示しうる。ここで0は、POC LSBカウント値を指し、2は、POC LSBカウント値が0に等しい前のフレームのうちで使用すべきフレームを指し、ここでは2つ前の0のPOC LSB値(例えば図9のフレーム0)を指す。2つ目の参照が含まれない場合、システムは、直前のPOC LSB=0[LT0]のフレーム(例えば図9のフレーム16)にデフォルトすればよい。   A more preferred technique in which fewer additional bits are added to the bitstream is to signal a different long-term picture than the previous frame with a corresponding POC LSB value. For example, the system may indicate the RPS of the current frame with an absolute reference as [LT0 | 2]. Here, 0 indicates the POC LSB count value, 2 indicates the frame to be used among the previous frames whose POC LSB count value is equal to 0, and here, the POC LSB value of the previous 0 (for example, FIG. 9 frame 0). If the second reference is not included, the system may default to the previous POC LSB = 0 [LT0] frame (eg, frame 16 in FIG. 9).

多くの場合、絶対参照を用いて対応するPOC LSB値を持つ最初の直前のフレームではないフレームをシグナリングする要求の発生頻度は比較的稀であろう。絶対参照を用いて対応するPOC LSB値を持つ最初の直前のフレームとは異なるフレームをシグナリングする能力を可能にしながら、使用すべきフレームを示す全体のビットレートをさらに削減するために、システムは、重複技術を使用することができる。例えば、RPSが[LT0,LT0|3]のように構築されればよい。同じRPS信号内のLT0の重複は、POC LSB値が0の異なるフレーム、ここでは3つ前に生じる0のPOC LSB値を使用するようデコーダにシグナリングする。一般に、特定のPOC LSB値が特定のPOC LSB値のサイクルに含まれない可能性を除けば、所望のPOC LSB値は、指示された前のフレームの発生に対応する。   In many cases, the frequency of requests to signal a frame that is not the first previous frame with the corresponding POC LSB value using an absolute reference will be relatively rare. In order to further reduce the overall bit rate indicating the frame to use, while allowing the ability to signal a frame different from the first previous frame with the corresponding POC LSB value using an absolute reference, the system Duplicate techniques can be used. For example, the RPS may be constructed as [LT0, LT0 | 3]. The overlap of LT0 in the same RPS signal signals to the decoder to use a different frame with a POC LSB value of 0, here a POC LSB value of 0 occurring three times before. In general, the desired POC LSB value corresponds to the occurrence of the indicated previous frame, except that a specific POC LSB value may not be included in a cycle of a specific POC LSB value.

図10を参照すると、重複技術は、以下のように示すことができる。RPSは、POC LSB値を有する長期ピクチャの信号を含む(400)(例えば[LT3])。同じRPSは、同じPOC LSB値を有する長期ピクチャの別の信号を含む(410)(例えば[LT3,LT3])。同じRPSは、所望のフレームの位置を示す、同じLSBカウント値(410)を有する2番目の長期ピクチャの別の信号を含む(420)[LT3,LT3|2]。   Referring to FIG. 10, the overlap technique can be shown as follows. The RPS includes a long-term picture signal having a POC LSB value (400) (eg, [LT3]). The same RPS includes another signal of a long-term picture having the same POC LSB value (410) (eg, [LT3, LT3]). The same RPS includes another signal of the second long-term picture having the same LSB count value (410) indicating the position of the desired frame (420) [LT3, LT3 | 2].

所望のフレームの位置のシグナリングは、任意の適切な様式で行われればよい。例えば図11を参照すると、所望のフレームの位置は、現フレームに対していくつか前のPOC LSB値のサイクル、例えば3つ前のサイクル等であればよい。例えば図12を参照すると、位置は、現フレームからオフセットしたフレーム数の絶対値に基づいてもよい。例えば図13を参照すると、位置は、所望のPOC LSB値を持つ最初の直前のフレームに対して数サイクル前のPOC LSB値に基づいてもよい。例えば図14を参照すると、位置は、所望のPOC LSB値を持つ最初の直前のフレームに対してオフセットしたフレーム数の絶対値に基づいてもよい。   Signaling of the desired frame location may be done in any suitable manner. For example, referring to FIG. 11, the position of a desired frame may be a cycle of a POC LSB value several times before the current frame, for example, three cycles before. For example, referring to FIG. 12, the position may be based on the absolute value of the number of frames offset from the current frame. For example, referring to FIG. 13, the position may be based on the POC LSB value several cycles before the first previous frame with the desired POC LSB value. For example, referring to FIG. 14, the position may be based on the absolute value of the number of frames offset with respect to the first previous frame having the desired POC LSB value.

そのような技術の一つの実装例は、以下のシンタックスを使用しうる。
One implementation of such a technique may use the following syntax:

1に等しいfirst_slice_segment_in_pic_flagは、スライスセグメントが復号順でピクチャの最初のスライスセグメントであることを指定する。0に等しいfirst_slice_segment_in_pic_flagは、スライスセグメントが復号順でピクチャの最初のスライスセグメントではないことを指定する。   First_slice_segment_in_pic_flag equal to 1 specifies that the slice segment is the first slice segment of the picture in decoding order. First_slice_segment_in_pic_flag equal to 0 specifies that the slice segment is not the first slice segment of the picture in decoding order.

no_output_of_prior_pics_flagは、復号ピクチャバッファ内の前に復号されたピクチャが、IDRまたはBLAピクチャの復号後にいかに処理されるかを指定する。現ピクチャがCRAピクチャであるとき、または現ピクチャがビットストリームの最初のピクチャであるIDRまたはBLAピクチャであるときには、no_output_of_prior_pics_flagの値は、復号プロセスに影響を与えない。現ピクチャがビットストリームの最初のピクチャではないIDRまたはBLAピクチャであり、アクティブシーケンスパラメータセットから導出されるpic_width_in_luma_samplesもしくはpic_height_in_luma_samplesまたはsps_max_dec_pic_buffering[HighestTid]の値が、先行するピクチャに関してアクティブなシーケンスパラメータセットから導出されるpic_width_in_luma_samplesもしくはpic_height_in_luma_samplesまたはsps_max_dec_pic_buffering[HighestTid]の値と異なるときには、no_output_of_prior_pics_flagの実際値に関わらず、1に等しいno_output_of_prior_pics_flagがデコーダによって推定(されるべきではないが)される。ここで、HighestTidは、最大時間識別子値を指す。   no_output_of_prior_pics_flag specifies how a previously decoded picture in the decoded picture buffer is processed after decoding an IDR or BLA picture. When the current picture is a CRA picture, or when the current picture is an IDR or BLA picture that is the first picture of a bitstream, the value of no_output_of_prior_pics_flag does not affect the decoding process. The current picture is an IDR or BLA picture that is not the first picture of the bitstream and pic_width_in_luma_samples or pic_height_in_luma_samples or sps_max_dec_pic_buffering derived from the active sequence parameter set is derived from the value that is derived from the active sequence leading picture set value No_output_of_prior_pic if different from pic_width_in_luma_samples or pic_height_in_luma_samples or sps_max_dec_pic_buffering [HighestTid] Regardless of the actual value of _flag, equal to 1 no_output_of_prior_pics_flag is (should not be) estimated by the decoder is the. Here, HighestTid indicates the maximum time identifier value.

slice_pic_parameter_set_idは、使用中のピクチャパラメータセットのpps_pic_parameter_setの値を指定する。slice_pic_parameter_set_idの値は、両端値を含めて、0から63までの範囲内にあるものとする。   The slice_pic_parameter_set_id specifies the value of pps_pic_parameter_set of the picture parameter set being used. It is assumed that the value of slice_pic_parameter_set_id is in the range from 0 to 63 including both end values.

1に等しいdependent_slice_segment_flagは、存在しない各スライスセグメントヘッダのシンタックス要素の値が、スライスヘッダ中の対応するスライスセグメントヘッダのシンタックス要素の値に等しいと推定されることを指定する。dependent_slice_segment_flagが存在しない場合、dependent_slice_segment_flagの値は0に等しいと推定される。   The dependent_slice_segment_flag equal to 1 specifies that the value of the syntax element of each non-existent slice segment header is estimated to be equal to the value of the syntax element of the corresponding slice segment header in the slice header. When dependent_slice_segment_flag does not exist, the value of dependent_slice_segment_flag is estimated to be equal to zero.

変数SliceAddrRSは、次のように導出される。dependent_slice_segment_flagが0に等しければ、SliceAddrRSは、slice_segment_addressに等しく設定される。そうでない場合は、SliceAddrRSは、符号化ツリーブロックアドレスがctbAddrTStoRS[ctbAddrRStoTS[slice_segment_address]−1]である符号化ツリーブロックを含む先行スライスセグメントのSliceAddrRSに等しく設定される。   The variable SliceAddrRS is derived as follows. If dependent_slice_segment_flag is equal to 0, SliceAddrRS is set equal to slice_segment_address. Otherwise, SliceAddrRS is set equal to SliceAddrRS of the preceding slice segment containing the coding tree block whose coding tree block address is ctbAddrTStoRS [ctbAddrRStoTS [slice_segment_address] -1].

slice_segment_addressは、ピクチャの符号化ツリーブロックのラスタスキャンにおける、スライスセグメントの最初の符号化ツリーブロックのアドレスを指定する。slice_segment_addressシンタックス要素の長さは、Ceil(Log2(PicSizeInCtbsY))ビットである。slice_segment_addressの値は、両端値を含めて、1からPicSizeInCtbsY−1までの範囲内にあるものとし、slice_segment_addressの値は、同じ符号化ピクチャの他のいずれの符号化スライスセグメントのNALユニットのslice_segment_addressの値とも等しくないものとする。slice_segment_addressが存在しないとき、slice_segment_addressは0に等しいと推定される。   The slice_segment_address specifies the address of the first coding tree block of the slice segment in the raster scan of the coding tree block of the picture. The length of the slice_segment_address syntax element is Ceil (Log2 (PicSizeInCtbsY)) bits. The value of slice_segment_address is in the range from 1 to PicSizeInCtbsY-1 including both end values, and the value of slice_segment_address is the value of slice_segment_address of the NAL unit of any other coded slice segment of the same coded picture. Neither shall be equal. When slice_segment_address does not exist, slice_segment_address is estimated to be equal to zero.

変数CtbAddrInRSは、ピクチャの符号化ツリーブロックラスタスキャンにおける符号化ツリーブロックアドレスを指定し、slice_segment_addressに等しく設定される。変数CtbAddrInTSは、タイルスキャンにおける符号化ツリーブロックアドレスを指定し、CtbAddrRStoTS[CtbAddrInRS]に等しく設定される。変数CuQpDeltaは、cu_qp_delta_absを含む符号化ユニットについての輝度信号量子化パラメータとその予測値との間の差分を指定し、0に等しく設定される。   A variable CtbAddrInRS designates an encoding tree block address in an encoding tree block raster scan of a picture, and is set equal to slice_segment_address. The variable CtbAddrInTS specifies the coding tree block address in tile scan and is set equal to CtbAddrRStoTS [CtbAddrInRS]. The variable CuQpDelta specifies the difference between the luminance signal quantization parameter and its predicted value for the coding unit including cu_qp_delta_abs and is set equal to 0.

slice_reserved_undetermined_flag[i]は、将来のITU‐T|ISO/IECによる規格のためにリザーブされたセマンティクスおよび値を有する。デコーダは、slice_reserved_undetermined_flag[i]の存在および値を無視するものとする。   slice_reserved_undetermined_flag [i] has reserved semantics and values for future ITU-T | ISO / IEC standards. The decoder shall ignore the presence and value of slice_reserved_undetermined_flag [i].

slice_typeは、以下のテーブルにしたがってスライスの符号化タイプを指定する。   The slice_type specifies the coding type of the slice according to the following table.

nal_unit_typeが、両端値を含めて16から23までの範囲内の値を有するとき(RAPピクチャ)、slice_typeは2に等しいものとする。   When nal_unit_type has a value in the range from 16 to 23 including both end values (RAP picture), slice_type is assumed to be equal to 2.

sps_max_dec_pic_buffering[TemporalId]が0に等しいとき、slice_typeは2に等しいものとする。   When sps_max_dec_pic_buffering [TemporalId] is equal to 0, slice_type is assumed to be equal to 2.

pic_output_flagは、復号ピクチャの出力および削除プロセスに影響する。pic_output_flagが存在しないとき、pic_output_flagは1に等しいものと推定される。   pic_output_flag affects the decoding picture output and deletion process. When pic_output_flag does not exist, pic_output_flag is estimated to be equal to 1.

colour_plane_idは、separate_colour_plane_flagが1に等しいときの、現スライスRBSPに関連する色平面を指定する。colour_plane_idの値は、両端値を含めて0から2までの範囲内にあるものとする。0、1、および2に等しいcolour_plane_idはそれぞれ、Y、CbおよびCr平面に対応する。   color_plane_id specifies the color plane associated with the current slice RBSP when separate_color_plane_flag is equal to 1. The value of color_plane_id is assumed to be in the range from 0 to 2 including both end values. A color_plane_id equal to 0, 1, and 2 corresponds to the Y, Cb, and Cr planes, respectively.

pic_order_cnt_lsbは、現ピクチャについてのピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りを指定する。pic_order_cnt_lsbシンタックス要素の長さは、log2_max_pic_order_cnt_lsb_minus4+4ビットである。pic_order_cnt_lsbの値は、両端値を含めて、0からMaxPicOrderCntLsb−1までの範囲内にあるものとする。pic_order_cnt_lsbが存在しないとき、ほとんどの場合pic_order_cnt_lsbは0に等しいものと推定される。   pic_order_cnt_lsb specifies the remainder obtained by dividing the picture order count for the current picture by MaxPicOrderCntLsb. The length of the pic_order_cnt_lsb syntax element is log2_max_pic_order_cnt_lsb_minus4 + 4 bits. It is assumed that the value of pic_order_cnt_lsb is in the range from 0 to MaxPicOrderCntLsb-1, including both end values. When pic_order_cnt_lsb is not present, in most cases pic_order_cnt_lsb is estimated to be equal to zero.

1に等しいshort_term_ref_pic_set_sps_flagは、現ピクチャの短期参照ピクチャセットが、アクティブシーケンスパラメータセット内のシンタックス要素を使用して作成されることを指定する。0に等しいshort_term_ref_pic_set_sps_flagは、現ピクチャの短期参照ピクチャセットが、スライスヘッダ内のshort_term_ref_pic_set()シンタックス構造のシンタックス要素を使用して作成されることを指定する。   Short_term_ref_pic_set_sps_flag equal to 1 specifies that a short-term reference picture set for the current picture is created using syntax elements in the active sequence parameter set. Short_term_ref_pic_set_sps_flag equal to 0 specifies that a short-term reference picture set for the current picture is created using the syntax element of the short_term_ref_pic_set () syntax structure in the slice header.

short_term_ref_pic_set_idxは、現ピクチャの参照ピクチャセットの作成に使用されるアクティブシーケンスパラメータセットにおいて指定された短期参照ピクチャセットのリストに対するインデックスを指定する。シンタックス要素short_term_ref_pic_set_idxは、Ceil(Log2(num_short_term_ref_pic_sets))ビットにより表される。short_term_ref_pic_set_idxが存在しない場合、short_term_ref_pic_set_idxの値は0に等しいものと推定される。short_term_ref_pic_set_idxの値は、両端値を含めて、0からnum_short_term_ref_pic_sets−1までの範囲内にあるものとする。   short_term_ref_pic_set_idx specifies an index to the list of short-term reference picture sets specified in the active sequence parameter set used to create the reference picture set for the current picture. The syntax element short_term_ref_pic_set_idx is represented by the Ceil (Log2 (num_short_term_ref_pic_sets)) bit. If short_term_ref_pic_set_idx does not exist, the value of short_term_ref_pic_set_idx is estimated to be equal to zero. It is assumed that the value of short_term_ref_pic_set_idx is in a range from 0 to num_short_term_ref_pic_sets-1, including both end values.

変数StRpsIdxは、以下のように導出される:short_term_ref_pic_set_sps_flagが1に等しい場合、StRpsIdxは、short_term_ref_pic_set_idxに等しく設定される。そうでない場合は、StRpsIdxは、num_short_term_ref_pic_setsに等しく設定される。   The variable StRpsIdx is derived as follows: If short_term_ref_pic_set_sps_flag is equal to 1, StRpsIdx is set equal to short_term_ref_pic_set_idx. Otherwise, StRpsIdx is set equal to num_short_term_ref_pic_sets.

num_long_term_spsは、現ピクチャの長期参照ピクチャセットに含まれる、アクティブシーケンスパラメータセットにおいて指定される候補長期参照ピクチャの数を指定する。num_long_term_spsの値は、両端値を含めて、0からMin(num_long_term_ref_pics_sps,sps_max_dec_pic_buffering[sps_max_sub_layers_minus1]−NumNegativePics[StRpsIdx]−NumPositivePics[StRpsIdx])までの範囲内にあるものとする。num_long_term_spsが存在しない場合、num_long_term_spsの値は0に等しいものと推定される。   num_long_term_sps specifies the number of candidate long-term reference pictures specified in the active sequence parameter set included in the long-term reference picture set of the current picture. The value of num_long_term_sps is 0 to Min (num_long_term_ref_pics_sps, sps_max_dec_pic_buffering [sps_max_sub_layers_minus1]-NumNegativePixSxPsPs]. If num_long_term_sps does not exist, the value of num_long_term_sps is estimated to be equal to zero.

num_long_term_picsは、現ピクチャの長期参照ピクチャセットに含まれる、スライスヘッダにおいて指定される長期参照ピクチャの数を指定する。num_long_term_picsの値は、両端値を含めて、0からsps_max_dec_pic_buffering[sps_max_sub_layers_minus1]−NumNegativePics[StRpsIdx]−NumPositivePics[StRpsIdx]−num_long_term_spsまでの範囲内にあるものとする。存在しない場合、num_long_term_picsの値は0に等しいものと推定される。   num_long_term_pics specifies the number of long-term reference pictures specified in the slice header included in the long-term reference picture set of the current picture. The value of num_long_term_pics is between 0 and sps_max_dec_pic_buffering [sps_max_sub_layers_minus1] -NumNegativePics [StRpsIdx] _NumPosids_sx_sx_Pix_Psx] If not, the value of num_long_term_pics is estimated to be equal to 0.

lt_idx_sps[i]は、現ピクチャの長期参照ピクチャセットに含まれるピクチャの特定のために、アクティブシーケンスパラメータセットにおいて指定された候補長期参照ピクチャのリストに対するインデックスを指定する。lt_idx_sps[i]を表すために使用されるビットの数は、Ceil(Log2(num_long_term_ref_pics_sps))に等しい。存在しない場合、lt_idx_sps[i]の値は0に等しいものと推定される。lt_idx_sps[i]の値は、両端値を含めて、0からnum_long_term_ref_pics_sps−1までの範囲内にあるものとする。   lt_idx_sps [i] specifies an index to the list of candidate long-term reference pictures specified in the active sequence parameter set in order to identify the pictures included in the long-term reference picture set of the current picture. The number of bits used to represent lt_idx_sps [i] is equal to Ceil (Log2 (num_long_term_ref_pics_sps)). If not, the value of lt_idx_sps [i] is estimated to be equal to 0. The value of lt_idx_sps [i] is assumed to be within a range from 0 to num_long_term_ref_pics_sps−1 including both end values.

poc_lsb_lt[i]は、現ピクチャの長期参照ピクチャセットに含まれるi番目の長期参照ピクチャのピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りの値を指定する。poc_lsb_lt[i]シンタックス要素の長さは、log2_max_pic_order_cnt_lsb_minus4+4ビットである。   poc_lsb_lt [i] specifies a remainder value obtained by dividing the picture order count of the i-th long-term reference picture included in the long-term reference picture set of the current picture by MaxPicOrderCntLsb. The length of the poc_lsb_lt [i] syntax element is log2_max_pic_order_cnt_lsb_minus4 + 4 bits.

0に等しいused_by_curr_pic_lt_flag[i]は、現ピクチャの長期参照ピクチャセットに含まれるi番目の長期参照ピクチャが、現ピクチャによる参照のために用いられないことを指定する。   Used_by_curr_pic_lt_flag [i] equal to 0 specifies that the i-th long-term reference picture included in the long-term reference picture set of the current picture is not used for reference by the current picture.

変数PocLsbLt[i]およびUsedByCurrPicLt[i]は、以下のように導出される。iがnum_long_term_sps未満であれば、PocLsbLt[i]は、lt_ref_pic_poc_lsb_sps[lt_idx_sps[i]]に等しく設定され、UsedByCurrPicLt[i]は、used_by_curr_pic_lt_sps_flag[lt_idx_sps[i]]に等しく設定される。そうでない場合は、PocLsbLt[i]は、poc_lsb_lt[i]に等しく設定され、UsedByCurrPicLt[i]は、used_by_curr_pic_lt_flag[i]に等しく設定される。   The variables PocLsbLt [i] and UsedByCurrPicLt [i] are derived as follows. If i is less than num_long_term_sps, PocLsbLt [i] is set equal to lt_ref_pic_poc_lsb_sps [lt_idx_sps [i]] and UsedByCurrPicLt [p] is set to used_by_curr_pic_ps Otherwise, PocLsbLt [i] is set equal to poc_lsb_lt [i], and UsedByCurrPicLt [i] is set equal to used_by_curr_pic_lt_flag [i].

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. Delta_poc_msb_present_flag [i] is equal to 1 when there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i].

delta_poc_msb_cycle_lt[i]は、現ピクチャの長期参照ピクチャセットに含まれるi番目の長期参照ピクチャのピクチャオーダーカウント値の最上位ビットの値を決定するために用いられる。delta_poc_msb_cycle_lt[i]が存在しないとき、delta_poc_msb_cycle_lt[i]は0に等しいものと推定される。   delta_poc_msb_cycle_lt [i] is used to determine the value of the most significant bit of the picture order count value of the i-th long-term reference picture included in the long-term reference picture set of the current picture. When delta_poc_msb_cycle_lt [i] does not exist, delta_poc_msb_cycle_lt [i] is estimated to be equal to zero.

変数DeltaPocMSBCycleLt[i]は、以下のように導出される:
The variable DeltaPocMSBCycleLt [i] is derived as follows:

長期参照ピクチャセットに関して、復号プロセスが以下のように行われうる:   For a long-term reference picture set, the decoding process can be performed as follows:

このプロセスは、ピクチャ毎に1回、スライスヘッダの復号の後であるが、任意の符号化ユニットの復号より前およびスライスの参照ピクチャリスト構築のための復号プロセスより前に、呼び出される。このプロセスの結果、DPBの1つ以上の参照ピクチャが、「参照のために用いられない」または「長期参照のために用いられる」ものとしてマークされうる。   This process is invoked once per picture, after the decoding of the slice header, but before the decoding of any coding unit and before the decoding process for building the reference picture list of the slice. As a result of this process, one or more reference pictures of the DPB may be marked as “not used for reference” or “used for long-term reference”.

参照ピクチャセットは、現在および将来の符号化ピクチャの復号プロセスで使用される参照ピクチャの絶対記述であることに注意されたい。参照ピクチャセットシグナリングは、参照ピクチャセットに含まれる全ての参照ピクチャが明示的にリストされるという意味で、明示的である。   Note that the reference picture set is an absolute description of the reference picture used in the decoding process of the current and future coded pictures. Reference picture set signaling is explicit in the sense that all reference pictures included in the reference picture set are explicitly listed.

ピクチャは、「参照のために用いられない」、「短期参照のために用いられる」、または「長期参照のために用いられる」ものとしてマークされうるが、これら3つの中の1つとしてのみマークされる。ピクチャにこれらのマーキングのうちの1つを割り当てることにより、これらのマーキングのうちの別のマーキングが、適用可能な場合に黙示的に削除される。ピクチャが「参照のために用いられる」ものとしてマークされていると言うときには、「短期参照のために用いられる」または「長期参照のために用いられる」ものとしてマークされたピクチャ(両方ではない)を集合的に指す。   A picture may be marked as "not used for reference", "used for short-term reference", or "used for long-term reference", but only marked as one of these three Is done. By assigning one of these markings to a picture, another of these markings is implicitly deleted when applicable. When a picture is said to be marked as “used for reference”, a picture marked as “used for short-term reference” or “used for long-term reference” (but not both) Collectively.

現ピクチャがビットストリームの最初のピクチャであるとき、DPBは空のピクチャのセットに初期化される。   When the current picture is the first picture in the bitstream, the DPB is initialized to an empty set of pictures.

現ピクチャがIDRピクチャまたはBLAピクチャであるとき、現在DPB内にある全ての参照ピクチャ(もしあれば)が、「参照のために用いられない」ものとしてマークされる。   When the current picture is an IDR picture or a BLA picture, all reference pictures (if any) currently in the DPB are marked as “not used for reference”.

短期参照ピクチャは、そのPicOrderCntVal値により識別される。長期参照ピクチャは、そのPicOrderCntVal値またはpic_order_cnt_lsb値により識別される。   A short-term reference picture is identified by its PicOrderCntVal value. A long-term reference picture is identified by its PicOrderCntVal value or pic_order_cnt_lsb value.

参照ピクチャセットを導出するために、ピクチャオーダーカウント値の5つのリストが構築される;NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr、およびNumPocLtFollの要素数をそれぞれ有する、PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurrおよびPocLtFollである。   To derive the reference picture set, five lists of picture order count values are built; NumPocStCurrBefore, NumPocStCurrAfter, NumPocStFoll, NumPocStFoll, NumPocLtCurr, NumPocLtCurr, NumPocLtCurr, and NumPocLtFoll. .

現ピクチャがIDRピクチャである場合、PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr、およびPocLtFollは全て空に設定され、NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr、およびNumPocLtFollは全て0に設定される。   If the current picture is an IDR picture, PocStCurrBefore, PocStCurrAfter, PocStFoll, PocLtCurr, PocLtCur, and PocLtFall are all set to empty, NumPocStCurrBefore, NumPocStCurBefore, NumPocStCureBefore.

そうでない場合は、ピクチャオーダーカウント値の5つのリストおよびエントリ数の導出に以下が適用される。


ここでPicOrderCntValは、現ピクチャのピクチャオーダーカウントである。
Otherwise, the following applies to the derivation of the five lists of picture order count values and the number of entries.


Here, PicOrderCntVal is a picture order count of the current picture.

代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In an alternative embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i]:

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されると、復号順でそれ以降のピクチャから、0のTemporalId値を有し、TRAIL_R、TSA_R、STSA_Rのうちの1つであるNALユニットタイプを有する復号順で最初のピクチャまでを含む、全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. Delta_poc_msb_present_flag [i] is equal to 1 when there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i]. If delta_poc_msb_present_flag [i] is set equal to 1 for the current picture based on the above conditions, it has a TemporalId value of 0 from the subsequent pictures in decoding order, and is one of TRAIL_R, TSA_R, STSA_R. It is assumed that delta_poc_msb_present_flag [i] is set to 1 for all pictures including the first picture in decoding order having a certain NAL unit type.

さらに別の実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In yet another embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i].

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されると、復号順でそれ以降のピクチャから、0のTemporalId値を有し、TRAIL_Rのうちの1つであるNALユニットタイプを有する復号順で最初のピクチャまでを含む全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. Delta_poc_msb_present_flag [i] is equal to 1 when there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i]. If delta_poc_msb_present_flag [i] is set equal to 1 for the current picture based on the above conditions, a NAL unit type that has a TemporalId value of 0 and is one of TRAIL_R from subsequent pictures in decoding order. It is assumed that delta_poc_msb_present_flag [i] is set to 1 for all pictures including the first picture in the decoding order.

さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In a further alternative embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i]:

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されると、復号順でそれ以降のピクチャから、0のTemporalId値を有し、TRAIL_R、TSA_R、STSA_R、RADL_R、RASL_Rのうちの1つであるNALユニットタイプを有する復号順で最初のピクチャまでを含む全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. Delta_poc_msb_present_flag [i] is equal to 1 when there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i]. If delta_poc_msb_present_flag [i] is set equal to 1 for the current picture based on the above-mentioned conditions, it has a TemporalId value of 0 from the subsequent pictures in decoding order, and among TRAIL_R, TSA_R, STSA_R, RADL_R, and RASL_R It is assumed that delta_poc_msb_present_flag [i] is set to 1 for all pictures including the first picture in the decoding order having the NAL unit type that is one of the above.

さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In a further alternative embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i]:

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されると、復号順でそれ以降のピクチャから、0のTemporalId値を有する復号順で最初のピクチャまでを含む全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. Delta_poc_msb_present_flag [i] is equal to 1 when there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i]. If delta_poc_msb_present_flag [i] is set equal to 1 for the current picture based on the above conditions, for all pictures including from the subsequent picture in decoding order to the first picture in decoding order having a TemporalId value of 0 , Delta_poc_msb_present_flag [i] is set to 1.

さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In a further alternative embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i]:

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されると、0より大きいTemporalId値を有するかまたはTRAIL_N、TSA_N、STSA_N、RADL_N、RASL_N、RSV_VCL_N10、RSV_VCL_N12もしくはRSV_VCL_N14のうちの1つであるNALユニットタイプを有する復号順で後続する全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. Delta_poc_msb_present_flag [i] is equal to 1 when there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i]. If delta_poc_msb_present_flag [i] is set equal to 1 for the current picture based on the above conditions, it has a TemporalId value greater than 0 or TRAIL_N, TSA_N, STSA_N, RADL_N, RASL_N, RSV_VCL_N10, RSV_VCL_N12, RSV_VCL_N It is assumed that delta_poc_msb_present_flag [i] is set to 1 for all pictures that follow in decoding order with a NAL unit type.

さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In a further alternative embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i]:

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、delta_poc_msb_present_flag[i]は1に等しいものとする。上述の条件に基づいて現ピクチャにつきdelta_poc_msb_present_flag[i]が1に等しく設定されたら、復号順でそれ以降のピクチャから、0に等しい時間識別子値を有し、参照ピクチャとして使用されるか、または個別に破棄できない復号順で最初のピクチャまでを含む全てのピクチャにつき、delta_poc_msb_present_flag[i]が1に設定されるものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. Delta_poc_msb_present_flag [i] is equal to 1 when there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i]. If delta_poc_msb_present_flag [i] is set equal to 1 for the current picture based on the above conditions, it has a time identifier value equal to 0 from the subsequent pictures in decoding order and is used as a reference picture or individually It is assumed that delta_poc_msb_present_flag [i] is set to 1 for all pictures including the first picture in the decoding order that cannot be discarded.

さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In a further alternative embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i]:

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0のTemporalId値を有し、TRAIL_Rのうちの1つであるNALユニットタイプを有する、現ピクチャ以降の復号順で最初のピクチャまでを含む全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. If there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i], the current picture and the pictures following the current picture in decoding order have a TemporalId value of 0. Delta_poc_msb_present_flag [i] is equal to 1 for all pictures having a NAL unit type that is one of TRAIL_R and including the first picture in the decoding order after the current picture.

さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In a further alternative embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i]:

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0のTemporalId値を有し、TRAIL_R、TSA_R、STSA_Rのうちの1つであるNALユニットタイプを有する、現ピクチャ以降の復号順で最初のピクチャまでを含む全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. If there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i], the current picture and the pictures following the current picture in decoding order have a TemporalId value of 0. Delta_poc_msb_present_flag [i] is equal to 1 for all pictures having the NAL unit type that is one of TRAIL_R, TSA_R, and STSA_R and including the first picture in the decoding order after the current picture.

さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In a further alternative embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i]:

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0のTemporalId値を有し、TRAIL_R、TSA_R、STSA_R、RADL_R、RASL_Rのうちの1であるNALユニットタイプを有する、現ピクチャ以降の復号順で最初のピクチャまでを含む全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. If there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i], the current picture and the pictures following the current picture in decoding order have a TemporalId value of 0. Delta_poc_msb_present_flag [i] is equal to 1 for all pictures having a NAL unit type that is one of TRAIL_R, TSA_R, STSA_R, RADL_R, and RASL_R and including the first picture in the decoding order after the current picture. And

さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In a further alternative embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i]:

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0より大きいTemporalId値を有するかまたはTRAIL_N、TSA_N、STSA_N、RADL_N、RASL_N、RSV_VCL_N10、RSV_VCL_N12もしくはRSV_VCL_N14のうちの1つであるNALユニットタイプを有する全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. When the decoded picture buffer has more than one reference picture in which the remainder obtained by dividing the picture order count by MaxPicOrderCntLsb is equal to PocLsbLt [i], a TemporalId value greater than 0 is obtained from the current picture and the pictures after the current picture in decoding order. Delta_poc_msb_present_flag is equal to delta_poc_msb_present_flag for all pictures having a NAL unit type of TRAIL_N, TSA_N, STSA_N, RADL_N, RASL_N, RSV_VCL_N10, RSV_VCL_N12 or RSV_VCL_N14.

さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In a further alternative embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i]:

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0のTemporalId値を有する、現ピクチャ以降の復号順で最初のピクチャまでを含む全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. When there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i], the current picture and the pictures following the current picture in decoding order have a TemporalId value of 0. Delta_poc_msb_present_flag [i] is assumed to be equal to 1 for all pictures including the first picture in the decoding order after the current picture.

さらなる代替的実施形態においては、delta_poc_msb_present_flag[i]につき以下のセマンティクスを定義することができる。   In a further alternative embodiment, the following semantics can be defined for delta_poc_msb_present_flag [i]:

1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定する。復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい参照ピクチャが1つより多くあるとき、現ピクチャと、復号順で現ピクチャ以降のピクチャから、0のTemporalId値を有し、参照ピクチャとして使用されるか、または個別に破棄できない、現ピクチャ以降の復号順で最初のピクチャまでを含む全てのピクチャとにつき、delta_poc_msb_present_flag[i]は1に等しいものとする。   Delta_poc_msb_present_flag [i] equal to 1 specifies that delta_poc_msb_cycle_lt [i] exists. Delta_poc_msb_present_flag [i] equal to 0 specifies that delta_poc_msb_cycle_lt [i] does not exist. If there is more than one reference picture in the decoded picture buffer with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i], the current picture and the pictures following the current picture in decoding order have a TemporalId value of 0. Delta_poc_msb_present_flag [i] is equal to 1 for all pictures including the first picture in the decoding order after the current picture that can be used as reference pictures or cannot be discarded individually.

ここでnal_unit_typeは、以下のセマンティクスにより定義される。   Here, nal_unit_type is defined by the following semantics.

nal_unit_typeは、以下のテーブルyに指定されるようにNALユニットに含まれるRBSPデータ構造のタイプを指定する。

nal_unit_type specifies the type of the RBSP data structure included in the NAL unit as specified in the table y below.

ここで、以下の定義が適用される。   Here, the following definitions apply:

アクセスユニット:特定の分類ルールにしたがって互いに関連し、復号順で連続し、正確に1つの符号化ピクチャを含む、NALユニットのセット。   Access unit: A set of NAL units that are related to each other according to a specific classification rule, are consecutive in decoding order, and contain exactly one coded picture.

アクセスユニットは、符号化ピクチャの符号化スライスセグメントのNALユニットを含むのに加え、符号化ピクチャのスライスセグメントを含まない他のNALユニットも含みうる。アクセスユニットの復号の結果、常に復号されたピクチャが生じる。   The access unit may include other NAL units that do not include the slice segment of the encoded picture in addition to the NAL unit of the encoded slice segment of the encoded picture. The decoding of the access unit always results in a decoded picture.

関連非VCL NALユニット:特定のVCL NALユニットが非VCL NALユニットの関連VCL NALユニットである、非VCL NALユニット。   Associated non-VCL NAL unit: A non-VCL NAL unit in which a particular VCL NAL unit is an associated VCL NAL unit of a non-VCL NAL unit.

関連RAPピクチャ:復号順で前のRAPピクチャ(あれば)。   Associated RAP picture: previous RAP picture (if any) in decoding order.

関連VCL NALユニット:nal_unit_typeがEOS_NUT、EOB_NUT、FD_NUT、またはSUFFIX_SEI_NUTに等しく、またはRSV_NVCL45からRSV_NVCL47の範囲内にあり、もしくはUNSPEC48からUNSPEC63の範囲内にある非VCL NALユニットについては、復号順で先行するVCL NALユニット;nal_unit_typeが他の値に等しい非VCL NALユニットについては、復号順で次のVCL NALユニット。   Associated VCL NAL unit: nal_unit_type is equal to EOS_NUT, EOB_NUT, FD_NUT, or SUFFIX_SEI_NUT, or is in the range of RSV_NVCL45 to RSV_NVCL47, or in the range of UNSPEC48 to UNSPEC63, V NAL unit; for non-VCL NAL units with nal_unit_type equal to other values, the next VCL NAL unit in decoding order.

ブロークンリンクアクセス(BLA;broken link access)アクセスユニット:符号化ピクチャがBLAピクチャであるアクセスユニット。   Broken link access (BLA) access unit: An access unit in which the coded picture is a BLA picture.

ブロークンリンクアクセス(BLA)ピクチャ:各スライスセグメントがBLA_W_LP、BLA_W_RADLまたはBLA_N_LPに等しいnal_unit_typeを有するRAPピクチャ。   Broken Link Access (BLA) picture: A RAP picture in which each slice segment has nal_unit_type equal to BLA_W_LP, BLA_W_RADL or BLA_N_LP.

BLAピクチャはIスライスのみを含み、復号順でビットストリームの最初のピクチャでもよいし、またはビットストリームの後の方で現れてもよい。各BLAピクチャは、新たな符号化ビデオシーケンスを開始し、復号プロセスに対してIDRピクチャと同じ影響を持つ。しかし、BLAピクチャは、空でない参照ピクチャセットを指定するシンタックス要素を含む。BLAピクチャがBLA_W_LPに等しいnal_unit_typeを有するときには、ビットストリーム中に存在しないピクチャの参照を含みうるためにデコーダにより出力されず復号できないかもしれない関連RASLピクチャを該BLAピクチャが有しうる。BLAピクチャがBLA_W_LPに等しいnal_unit_typeを有するときには、該BLAピクチャは復号されるよう指定された関連RADLピクチャも有しうる。BLAピクチャがBLA_W_RADLに等しいnal_unit_typeを有するときには、関連RASLピクチャを有しないが、復号されるよう指定された関連RADLピクチャを有しうる。BLAピクチャがBLA_N_LPに等しいnal_unit_typeを有するときには、関連リーディングピクチャを有しない。   A BLA picture contains only I slices and may be the first picture of the bitstream in decoding order or may appear later in the bitstream. Each BLA picture starts a new encoded video sequence and has the same effect on the decoding process as an IDR picture. However, the BLA picture includes a syntax element that specifies a non-empty reference picture set. When a BLA picture has nal_unit_type equal to BLA_W_LP, the BLA picture may have an associated RASL picture that may not be output and decoded by the decoder because it may include a reference to a picture that does not exist in the bitstream. When a BLA picture has nal_unit_type equal to BLA_W_LP, the BLA picture may also have an associated RADL picture designated to be decoded. When a BLA picture has nal_unit_type equal to BLA_W_RADL, it does not have an associated RASL picture but may have an associated RADL picture designated to be decoded. When a BLA picture has nal_unit_type equal to BLA_N_LP, it does not have an associated leading picture.

クリーンランダムアクセス(CRA;clean random access)アクセスユニット:符号化ピクチャがCRAピクチャであるアクセスユニット。   Clean Random Access (CRA) access unit: An access unit in which the coded picture is a CRA picture.

クリーンランダムアクセス(CRA)ピクチャ:各スライスセグメントがCRA_NUTに等しいnal_unit_typeを有するRAPピクチャ。   Clean Random Access (CRA) picture: A RAP picture in which each slice segment has nal_unit_type equal to CRA_NUT.

CRAピクチャはIスライスのみを含み、復号順でビットストリームの最初のピクチャでもよいし、またはビットストリームの後の方で現れてもよい。CRAピクチャは、関連RADLまたはRASLピクチャを有しうる。CRAピクチャが、復号順でビットストリームの最初のピクチャであるときには、そのCRAピクチャは、復号順で符号化ビデオシーケンスの最初のピクチャであり、関連RASLピクチャは、ビットストリーム中に存在しないピクチャの参照を含みうるためにデコーダにより出力されず復号できないかもしれない。   A CRA picture may contain only I slices and may be the first picture of the bitstream in decoding order, or it may appear later in the bitstream. A CRA picture may have an associated RADL or RASL picture. When a CRA picture is the first picture of a bitstream in decoding order, the CRA picture is the first picture of an encoded video sequence in decoding order, and the associated RASL picture is a reference to a picture that does not exist in the bitstream May not be output and cannot be decoded by the decoder.

フィラーデータNALユニット:nal_unit_typeがFD_NUTに等しいNALユニット。   Filler data NAL unit: NAL unit whose nal_unit_type is equal to FD_NUT.

瞬時復号リフレッシュ(IDR;instantaneous decoding refresh)アクセスユニット:符号化ピクチャがIDRピクチャであるアクセスユニット。   Instantaneous decoding refresh (IDR) access unit: An access unit whose coded picture is an IDR picture.

瞬時復号リフレッシュ(IDR)ピクチャ:各スライスセグメントがIDR_W_RADLまたはIDR_N_LPに等しいnal_unit_typeを有するRAPピクチャ。   Instantaneous decoding refresh (IDR) picture: A RAP picture in which each slice segment has nal_unit_type equal to IDR_W_RADL or IDR_N_LP.

IDRピクチャはIスライスのみを含み、復号順でビットストリームの最初のピクチャであってもよいし、またはビットストリームの後の方で現れてもよい。各IDRピクチャは、復号順で符号化ビデオシーケンスの最初のピクチャである。IDRピクチャがIDR_W_RADLに等しいnal_unit_typeを有するときには、該IDRピクチャは関連RADLピクチャを有しうる。IDRピクチャがIDR_N_LPに等しいnal_unit_typeを有するときには、該IDRピクチャは関連リーディングピクチャを有しない。IDRピクチャは、関連RASLピクチャを有しない。   An IDR picture includes only I slices and may be the first picture of the bitstream in decoding order or may appear later in the bitstream. Each IDR picture is the first picture of the encoded video sequence in decoding order. When an IDR picture has nal_unit_type equal to IDR_W_RADL, the IDR picture may have an associated RADL picture. When an IDR picture has nal_unit_type equal to IDR_N_LP, the IDR picture does not have an associated leading picture. An IDR picture does not have an associated RASL picture.

長期参照ピクチャ:「長期参照のために用いられる」ものとしてマークされたピクチャ。   Long-term reference picture: A picture marked as “used for long-term reference”.

長期参照ピクチャセット:長期参照ピクチャを含みうる2つの参照ピクチャセットリスト。   Long-term reference picture sets: Two reference picture set lists that may contain long-term reference pictures.

ネットワーク抽象化層(NAL;network abstraction layer)ユニット:続くデータのタイプの指示およびそのデータを必要に応じてエミュレーション防止バイトがちりばめられたRBSPの形で含むバイトを含むシンタックス構造。   Network abstraction layer (NAL) unit: A syntax structure that includes a byte that includes an indication of the type of data that follows and an RBSP that is interspersed with emulation prevention bytes as needed.

ネットワーク抽象化層(NAL)ユニットストリーム:一連のNALユニット。   Network abstraction layer (NAL) unit stream: A series of NAL units.

非参照ピクチャ:「参照のために用いられない」ものとしてマークされたピクチャ。   Non-reference picture: A picture marked as “not used for reference”.

非参照ピクチャは、復号順で後続のピクチャの復号プロセスにおけるインター予測のために使用できないサンプルを含む。   Non-reference pictures include samples that cannot be used for inter prediction in the decoding process of subsequent pictures in decoding order.

ピクチャパラメータセット(PPS):各スライスセグメントヘッダに含まれるシンタックス要素により定義されるゼロ以上の符号化ピクチャ全体に適用されるシンタックス要素を含むシンタックス構造。   Picture Parameter Set (PPS): A syntax structure that includes syntax elements that apply to the entire coded picture of zero or more defined by the syntax elements included in each slice segment header.

プレフィックスSEI NALユニット:PREFIX_SEI_NUTに等しいnal_unit_typeを有するSEI NALユニット。   Prefix SEI NAL unit: SEI NAL unit with nal_unit_type equal to PREFIX_SEI_NUT.

ランダムアクセス復号可能リーディング(RADL;random access decodable leading)アクセスユニット:符号化ピクチャがRADLピクチャであるアクセスユニット。   Random access decodable reading (RADL) access unit: An access unit whose coded picture is a RADL picture.

ランダムアクセス復号可能リーディング(RADL)ピクチャ:各スライスセグメントがRADL_NUTに等しいnal_unit_typeを有する符号化ピクチャ。   Random access decodable leading (RADL) picture: A coded picture in which each slice segment has nal_unit_type equal to RADL_NUT.

全てのRADLピクチャは、リーディングピクチャである。RADLピクチャは、同じ関連RAPピクチャのトレイリングピクチャの復号プロセスのために参照ピクチャとして用いられない。存在する場合、全てのRADLピクチャは、復号順で同じ関連RAPピクチャの全てのトレイリングピクチャに先行する。   All RADL pictures are leading pictures. The RADL picture is not used as a reference picture for the decoding process of the trailing picture of the same associated RAP picture. If present, all RADL pictures precede all trailing pictures of the same associated RAP picture in decoding order.

ランダムアクセスポイント(RAP;random access point)アクセスユニット:符号化ピクチャがRAPピクチャであるアクセスユニット。   Random access point (RAP) access unit: An access unit whose coded picture is a RAP picture.

ランダムアクセスポイント(RAP)ピクチャ:各スライスセグメントが両端値を含めて7から12までの範囲内のnal_unit_typeを有する符号化ピクチャ。   Random access point (RAP) picture: A coded picture in which each slice segment has nal_unit_type in the range of 7 to 12 including both end values.

RAPピクチャはIスライスのみを含み、BLAピクチャ、CRAピクチャまたはIDRピクチャでありうる。ビットストリームの最初のピクチャは、RAPピクチャでなければならない。必要なパラメータセットをアクティブ化が必要な際に利用できるならば、復号順でRAPピクチャに先行するいずれのピクチャの復号プロセスも行わずに、RAPピクチャおよび復号順で後続する全ての非RASLピクチャを適切に復号することができる。RAPピクチャではないIスライスのみを含むピクチャもストリーム中に存在しうる。   A RAP picture includes only an I slice and may be a BLA picture, a CRA picture, or an IDR picture. The first picture of the bitstream must be a RAP picture. If the required parameter set is available when activation is required, the RAP picture and all non-RASL pictures that follow it in decoding order are processed without performing the decoding process of any pictures that precede the RAP picture in decoding order. It can be decoded properly. Pictures that contain only I slices that are not RAP pictures may also be present in the stream.

ランダムアクセススキップリーディング(RASL;random access skipped leading)アクセスユニット:符号化ピクチャがRASLピクチャであるアクセスユニット。   Random access skipped leading (RASL) access unit: An access unit whose coded picture is a RASL picture.

ランダムアクセススキップリーディング(RASL)ピクチャ:各スライスセグメントがRASL_NUTに等しいnal_unit_typeを有する符号化ピクチャ。   Random Access Skip Reading (RASL) picture: A coded picture in which each slice segment has nal_unit_type equal to RASL_NUT.

全てのRASLピクチャは、関連BLAまたはCRAピクチャのリーディングピクチャである。関連RAPピクチャがBLAピクチャであるか、またはビットストリームの最初の符号化ピクチャであるとき、RASLピクチャは、ビットストリームに存在しないピクチャの参照を含みうるために出力されず適切に復号できないかもしれない。RASLピクチャは、非RASLピクチャの復号プロセスのための参照ピクチャとして用いられない。存在する場合、全てのRASLピクチャは、復号順で同じ関連RAPピクチャの全てのトレイリングピクチャに先行する。   All RASL pictures are leading pictures of related BLA or CRA pictures. When the associated RAP picture is a BLA picture or the first coded picture of a bitstream, the RASL picture may not be output and decoded properly because it may contain references to pictures that are not present in the bitstream . RASL pictures are not used as reference pictures for the decoding process of non-RASL pictures. If present, all RASL pictures precede all trailing pictures of the same associated RAP picture in decoding order.

ローバイトシーケンスペイロード(RBSP;raw byte sequence payload):NALユニットにカプセル化された整数のバイト数を含むシンタックス構造。RBSPは、空であるか、またはRBSPストップビットを従え、0に等しいゼロ以上の後続ビットを従えたシンタックス要素を含むデータビットのストリングの形式を有する。   Raw byte sequence payload (RBSP): A syntax structure containing an integer number of bytes encapsulated in a NAL unit. The RBSP is empty or has the form of a string of data bits that includes a syntax element followed by an RBSP stop bit and followed by zero or more subsequent bits equal to zero.

ローバイトシーケンスペイロード(RBSP)ストップビット:ローバイトシーケンスペイロード(RBSP)内のデータビットのストリングの後に存在する1に等しいビット。RBSPの終端からRBSP内の最後の0ではないビットであるRBSPストップビットを探索することにより、RBSP内のデータビットのストリングの終端の位置を特定できる。   Raw Byte Sequence Payload (RBSP) stop bit: A bit equal to 1 present after a string of data bits in the Raw Byte Sequence Payload (RBSP). By searching for the RBSP stop bit that is the last non-zero bit in the RBSP from the end of the RBSP, the position of the end of the string of data bits in the RBSP can be identified.

参照ピクチャ:短期参照ピクチャまたは長期参照ピクチャであるピクチャ。   Reference picture: A picture that is a short-term reference picture or a long-term reference picture.

参照ピクチャは、復号順で後続するピクチャの復号プロセスにおけるインター予測に使用されうるサンプルを含む。   A reference picture includes samples that can be used for inter prediction in the decoding process of pictures that follow in decoding order.

シーケンスパラメータセット(SPS):各スライスセグメントヘッダに含まれるシンタックス要素により参照されるピクチャパラメータセットに含まれるシンタックス要素の内容により決定される、ゼロ以上の符号化ビデオシーケンス全体に適用されるシンタックス要素を含むシンタックス構造。   Sequence parameter set (SPS): A syntax applied to the entire encoded video sequence of zero or more determined by the content of the syntax element included in the picture parameter set referenced by the syntax element included in each slice segment header. A syntax structure containing tax elements.

短期参照ピクチャ:「短期参照のために用いられる」ものとしてマークされたピクチャ。   Short-term reference picture: A picture marked as “used for short-term reference”.

段階的時間サブレイヤアクセス(STSA:step‐wise temporal sub‐layer access)アクセスユニット:符号化ピクチャがSTSAピクチャであるアクセスユニット。   Step-wise temporal sub-layer access (STSA) access unit: An access unit whose coded picture is an STSA picture.

段階的時間サブレイヤアクセス(STSA)ピクチャ:各スライスセグメントがSTSA_RまたはSTSA_Nに等しいnal_unit_typeを有する符号化ピクチャ。   Staged temporal sublayer access (STSA) picture: A coded picture in which each slice segment has nal_unit_type equal to STSA_R or STSA_N.

STSAピクチャは、当該STSAピクチャと同じTemporalIdのピクチャをインター予測参照に使用しない。STSAピクチャと同じTemporalIdを有する復号順でSTSAピクチャに続くピクチャは、STSAピクチャと同じTemporalIdを有する復号順でSTSAピクチャより前のピクチャを、インター予測参照に使用しない。STSAピクチャは、当該STSAピクチャで直近下位のサブレイヤから当該STSAピクチャを含むサブレイヤへの上方切り替えを可能にする。STSAピクチャは、0より大きいTemporalIdを有しなければならない。   The STSA picture does not use the same TemporalId picture as the STSA picture for inter prediction reference. A picture that follows the STSA picture in the decoding order having the same TemporalId as the STSA picture does not use a picture preceding the STSA picture in the decoding order having the same TemporalId as the STSA picture for inter prediction reference. The STSA picture enables upward switching from a sublayer immediately below the STSA picture to a sublayer including the STSA picture. An STSA picture must have a TemporalId greater than zero.

サフィックスSEI NALユニット:SUFFIX_SEI_NUTに等しいnal_unit_typeを有するSEI NALユニット。   Suffix SEI NAL unit: SEI NAL unit with nal_unit_type equal to SUFIX_SEI_NUT.

補足的な付加情報(SEI;supplemental enhancement information)NALユニット:PREFIX_SEI_NUTまたはSUFFIX_SEI_NUTに等しいnal_unit_typeを有するNALユニット。   Supplemental enhancement information (SEI) NAL unit: NAL unit with nal_unit_type equal to PREFIX_SEI_NUT or SUFFIX_SEI_NUT.

時間サブレイヤアクセス(TSA:temporal sub‐layer access)アクセスユニット:符号化ピクチャがTSAピクチャであるアクセスユニット。   Temporary sub-layer access (TSA) access unit: An access unit whose coded picture is a TSA picture.

時間サブレイヤアクセス(TSA)ピクチャ:各スライスセグメントがTSA_RまたはTSA_Nに等しいnal_unit_typeを有する符号化ピクチャ。   Temporal sublayer access (TSA) picture: A coded picture in which each slice segment has nal_unit_type equal to TSA_R or TSA_N.

TSAピクチャおよび復号においてTSAピクチャに続くピクチャは、TSAピクチャのTemporalId以上のTemporalIdのピクチャをインター予測参照に使用しない。TSAピクチャは、当該TSAピクチャで直近下位のサブレイヤから当該TSAピクチャを含むサブレイヤまたは任意のより上位のサブレイヤへの上方切り替えを可能にする。TSAピクチャは、0より大きいTemporalIdを有しなければならない。   The TSA picture and the picture following the TSA picture in decoding do not use a TemporalId picture equal to or higher than the TemporalId of the TSA picture for inter prediction reference. The TSA picture enables upward switching from a sublayer immediately below the TSA picture to a sublayer including the TSA picture or any higher sublayer. A TSA picture must have a TemporalId greater than zero.

トレイリングピクチャ:出力順で関連RAPピクチャに続くピクチャ。   Trailing picture: A picture that follows an associated RAP picture in output order.

ビデオ符号化レイヤ(VCL;video coding layer)NALユニット:VCL NALユニットとして分類されるnal_unit_typeのリザーブド値を有する符号化スライスセグメントNALユニットおよびNALユニットのサブセットの集合名。   Video coding layer (VCL) NAL unit: A set name of a subset of a coded slice segment NAL unit and a NAL unit having a reserved value of nal_unit_type classified as a VCL NAL unit.

ビデオパラメータセット(VPS;video parameter set):各スライスセグメントヘッダに含まれるシンタックス要素により参照されるピクチャパラメータセットに含まれるシンタックス要素により参照されるシーケンスパラメータセットに含まれるシンタックス要素の内容により決定される、ゼロ以上の符号化ビデオシーケンス全体に適用されるシンタックス要素を含むシンタックス構造。   Video parameter set (VPS): Depending on the content of the syntax element included in the sequence parameter set referenced by the syntax element included in the picture parameter set referenced by the syntax element included in each slice segment header A syntax structure that includes syntax elements that are applied to the entire determined zero or more encoded video sequence.

ここで、時間識別子値は、以下のように定義される。   Here, the time identifier value is defined as follows.

nuh_temporal_id_plus1−1は、NALユニットの時間識別子を指定する。nuh_temporal_id_plus1の値は、0に等しくないものとする。   nuh_temporal_id_plus1-1 specifies the time identifier of the NAL unit. The value of nuh_temporal_id_plus1 is not equal to 0.

変数TemporalIdは、   The variable TemporalId is

TemporalId=nuh_temporal_id_plus1−1として指定される。   It is specified as TemporalId = nuh_temporal_id_plus1-1.

nal_unit_typeが、両端値を含めて16から23までの範囲内にある場合(RAPピクチャの符号化スライスセグメント)、TemporalIdは0に等しいものとする;そうでない場合は、nal_unit_typeがTSA_R、TSA_N、STSA_RまたはSTSA_Nに等しいとき、TemporalIdは0に等しくないものとする。   If nal_unit_type is in the range from 16 to 23 including both end values (encoded slice segment of RAP picture), TemporalId shall be equal to 0; otherwise, nal_unit_type will be TSA_R, TSA_N, STSA_R or When equal to STSA_N, TemporalId shall not be equal to zero.

TemporalIdの値は、アクセスユニットの全てのVCL NALユニットにつき同じとする。アクセスユニットのTemporalIdの値は、当該アクセスユニットのVCL NALユニットのTemporalIdの値である。   The value of TemporalId is the same for all VCL NAL units of the access unit. The TemporalId value of the access unit is the TemporalId value of the VCL NAL unit of the access unit.

例えば図15を参照すると、ピクチャBに関して、復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい1つより多くの参照ピクチャがあり、そのためdelta_poc_msb_present_flag[i]は1に等しくなる。そして、本明細書に記載される実施形態にしたがって、delta_poc_msb_present_flag[i]は、ピクチャCおよびDについても1に等しく設定される。ピクチャDは、TemporalId=0に帰属するため、復号順でDに後続するピクチャは、それらの後続ピクチャに関して復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLt[i]に等しい1つより多くの参照ピクチャがない限り、delta_poc_msb_present_flag[i]を1に設定する必要はない。   For example, referring to FIG. 15, for picture B, the decoded picture buffer has more than one reference picture with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt [i], so delta_poc_msb_present_flag [i] is equal to 1 Become. And according to the embodiments described herein, delta_poc_msb_present_flag [i] is set equal to 1 for pictures C and D. Since picture D belongs to TemporalId = 0, the pictures following D in decoding order are obtained from the one in which the remainder obtained by dividing the picture order count by MaxPicOrderCntLsb in the decoded picture buffer for those subsequent pictures is equal to PocLsbLt [i] Delta_poc_msb_present_flag [i] need not be set to 1 unless there are many reference pictures.

以上の明細書において使用される用語および表現は、制限ではなく説明のための用語として使用され、このような用語および表現の使用には、図と共に記載された特徴またはその一部の等価物を除外する意図はなく、本発明の範囲は、以下の請求の範囲のみにより制限されることが理解されよう。   The terms and expressions used in the foregoing specification are used as explanatory terms, not as limitations, and the use of such terms and expressions may include features described in conjunction with the drawings or equivalents thereof. It is understood that there is no intent to exclude and that the scope of the present invention is limited only by the following claims.

Claims (1)

ビデオビットストリームを復号する方法であって、
前記ビデオビットストリームから参照ピクチャセットパラメータを受信するステップと;
前記参照ピクチャセットに基づきインター予測を用いて現ピクチャを復号するステップと;
将来のインター予測のために参照される前記復号されたピクチャを復号ピクチャバッファに格納するステップと
を含み、
前記参照ピクチャセットは、少なくとも
(a)参照ピクチャの前記ピクチャオーダカウント(POC)の最下位ビット(LSB)の選択された数にそれぞれ基づく、1つ以上の参照ピクチャ識別子と;
(b)前記参照ピクチャの前記POCの前記MSBを決定する後続データが存在するか否かを指定するフラグと
を用いることにより復号され、前記後続データは、以下の条件
(i)前記復号ピクチャバッファにピクチャオーダーカウントをMaxPicOrderCntLsbで割った余りがPocLsbLtに等しい1つより多くの参照ピクチャを有すること、および
(ii)前記条件(i)を満たす前記ピクチャの後、0のTemporalId値を有し、サブストリームのトレイリングピクチャまたは参照ピクチャである前記復号順で最初のピクチャまでを含む、前記復号順で後続するピクチャ
のうちの1つを満たす前記ピクチャにつき存在する、方法。
A method for decoding a video bitstream comprising:
Receiving a reference picture set parameter from the video bitstream;
Decoding a current picture using inter prediction based on the reference picture set;
Storing the decoded picture referenced for future inter prediction in a decoded picture buffer;
The reference picture set includes at least (a) one or more reference picture identifiers each based on a selected number of least significant bits (LSB) of the picture order count (POC) of a reference picture;
(B) is decoded by using a flag that specifies whether or not there is subsequent data for determining the MSB of the POC of the reference picture, and the subsequent data is: (i) the decoded picture buffer Having more than one reference picture with the remainder of dividing the picture order count by MaxPicOrderCntLsb equal to PocLsbLt, and (ii) having a TemporalId value of 0 after the picture satisfying condition (i) A method present for the picture that satisfies one of the following pictures in decoding order, including up to the first picture in decoding order that is a trailing picture or reference picture of a stream.
JP2015533777A 2013-01-15 2014-01-14 Video decoder using signaling Active JP6209772B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361752937P 2013-01-15 2013-01-15
US61/752,937 2013-01-15
PCT/JP2014/000120 WO2014112354A1 (en) 2013-01-15 2014-01-14 Video decoder with signaling

Publications (2)

Publication Number Publication Date
JP2016507910A true JP2016507910A (en) 2016-03-10
JP6209772B2 JP6209772B2 (en) 2017-10-11

Family

ID=51165122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015533777A Active JP6209772B2 (en) 2013-01-15 2014-01-14 Video decoder using signaling

Country Status (6)

Country Link
US (4) US9674524B2 (en)
EP (1) EP2946558B1 (en)
JP (1) JP6209772B2 (en)
CN (1) CN104919803B (en)
HK (1) HK1214708A1 (en)
WO (1) WO2014112354A1 (en)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013048311A1 (en) * 2011-09-27 2013-04-04 Telefonaktiebolaget L M Ericsson (Publ) Decoders and methods thereof for managing pictures in video decoding process
WO2014081226A1 (en) 2012-11-21 2014-05-30 엘지전자 주식회사 Image decoding method and apparatus using same
WO2014109607A1 (en) * 2013-01-10 2014-07-17 삼성전자 주식회사 Method and apparatus for coding multilayer video, method and apparatus for decoding multilayer video
PL2946556T3 (en) * 2013-01-16 2017-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Decoder and encoder and methods for coding of a video sequence
WO2014170547A1 (en) * 2013-04-17 2014-10-23 Nokia Corporation An apparatus, a method and a computer program for video coding and decoding
US10178397B2 (en) * 2014-03-24 2019-01-08 Qualcomm Incorporated Generic use of HEVC SEI messages for multi-layer codecs
US9854261B2 (en) * 2015-01-06 2017-12-26 Microsoft Technology Licensing, Llc. Detecting markers in an encoded video signal
US10097836B2 (en) * 2015-09-28 2018-10-09 Samsung Electronics Co., Ltd. Method and device to mark a reference picture for video coding
US11595652B2 (en) 2019-01-28 2023-02-28 Op Solutions, Llc Explicit signaling of extended long term reference picture retention
EP4280607A3 (en) * 2018-07-01 2024-02-21 Sharp Kabushiki Kaisha Systems and methods for signaling picture order count values for pictures included in coded video
BR112021002483A2 (en) 2018-08-17 2021-07-27 Huawei Technologies Co., Ltd. management of reference images in video encoding
MX2021007999A (en) 2018-12-31 2021-10-22 Huawei Tech Co Ltd Method and apparatus of cross-component linear modeling for intra prediction.
EP3918801A4 (en) * 2019-01-28 2022-06-15 OP Solutions, LLC Online and offline selection of extended long term reference picture retention
EP3918789A1 (en) * 2019-02-01 2021-12-08 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Video codec allowing sub-picture or region wise random access and concept for video composition using the same
US10986353B2 (en) * 2019-03-15 2021-04-20 Tencent America LLC Decoded picture buffer management for video coding
MX2021013535A (en) * 2019-05-06 2022-01-31 Huawei Tech Co Ltd Recovery point signaling in video coding.
EP3957067A4 (en) * 2019-05-06 2022-06-22 Huawei Technologies Co., Ltd. Output of prior pictures for pictures starting a new coded video sequence in video coding
CN116419000A (en) 2019-07-08 2023-07-11 华为技术有限公司 Processing of multiple image size and conformance windows for reference image resampling in video coding
BR122022009501A2 (en) * 2019-09-24 2022-07-26 Huawei Technologies Co., Ltd. ENCODING METHOD IMPLEMENTED BY A VIDEO ENCODER, NON-TRANSITORY COMPUTER READable MEDIUM, ENCODING DEVICE AND SYSTEM
CN116506635B (en) * 2019-12-27 2024-01-12 阿里巴巴(中国)有限公司 Method and system for performing progressive decoding refresh processing on an image
WO2021188453A1 (en) * 2020-03-16 2021-09-23 Bytedance Inc. Gradual decoding refresh access unit in scalable video coding
JP7492023B2 (en) 2020-03-23 2024-05-28 エルジー エレクトロニクス インコーポレイティド Image encoding/decoding method and device based on hybrid NAL unit type, and recording medium for storing bitstreams
KR20220160576A (en) * 2020-03-30 2022-12-06 바이트댄스 아이엔씨 Slice types in video coding
US11206428B1 (en) 2020-07-14 2021-12-21 Tencent America LLC Method and apparatus for frequency-dependent joint component secondary transform

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101611633B (en) * 2006-07-06 2012-10-03 汤姆逊许可证公司 Method and apparatus for decoupling frame number and/or picture order count (poc) for multi-view video encoding and decoding
WO2012023817A2 (en) * 2010-08-18 2012-02-23 에스케이텔레콤 주식회사 Image encoding/decoding device and method, and reference picture indexing device and method
US20120269275A1 (en) * 2010-10-20 2012-10-25 Nokia Corporation Method and device for video coding and decoding
US9516379B2 (en) * 2011-03-08 2016-12-06 Qualcomm Incorporated Buffer management in video codecs
CN103621091A (en) 2011-04-26 2014-03-05 Lg电子株式会社 Method for managing a reference picture list, and apparatus using same
US9591318B2 (en) * 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US10034018B2 (en) * 2011-09-23 2018-07-24 Velos Media, Llc Decoded picture buffer management
WO2013048311A1 (en) * 2011-09-27 2013-04-04 Telefonaktiebolaget L M Ericsson (Publ) Decoders and methods thereof for managing pictures in video decoding process
CN107231560B (en) * 2011-10-28 2020-03-13 三星电子株式会社 Method and apparatus for inter-frame prediction and method and apparatus for motion compensation
US10003817B2 (en) * 2011-11-07 2018-06-19 Microsoft Technology Licensing, Llc Signaling of state information for a decoded picture buffer and reference picture lists
KR102332492B1 (en) 2011-11-11 2021-12-01 엘지전자 주식회사 Method and device for transmitting image information, and decoding method and device using same
US9432665B2 (en) 2011-12-02 2016-08-30 Qualcomm Incorporated Coding least significant bits of picture order count values identifying long-term reference pictures
US20130188709A1 (en) 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
WO2013158024A1 (en) 2012-04-16 2013-10-24 Telefonaktiebolaget L M Ericsson (Publ) Encoder, decoder and methods thereof for video encoding and decoding
US9532055B2 (en) * 2012-04-16 2016-12-27 Microsoft Technology Licensing, Llc Constraints and unit types to simplify video random access
US10230972B2 (en) 2012-07-01 2019-03-12 Sharp Kabushiki Kaisha Device for signaling a long-term reference picture in a parameter set
WO2014056150A1 (en) * 2012-10-09 2014-04-17 Nokia Corporation Method and apparatus for video coding
US20140140406A1 (en) * 2012-11-16 2014-05-22 General Instrument Corporation Devices and methods for processing of non-idr related syntax for high efficiency video coding (hevc)
US9900609B2 (en) * 2013-01-04 2018-02-20 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ADARSH K. RAMASUBRAMONIAN, YE-KUI WANG, RAJAN JOSHI, YING CHEN, AHG13: SIGNALLING OF LONG-TERM REFERENCE PICTURES IN THE SLICE HEADER, JPN6016047077, 11 July 2012 (2012-07-11) *
BENJAMIN BROSS, WOO-JIN HAN, JENS-RAINER OHM, GARY J. SULLIVAN, THOMAS WIEGAND, HIGH EFFICIENCY VIDEO CODING (HEVC) TEXT SPECIFICATION DRAFT 9, JPN6016047072, 18 December 2012 (2012-12-18), pages pp.39, 80, 98-102 *
HENDRY, BYEONG MOON JEON, AHG9: ON RPS DERIVATION AND MARKING PROCESS FOR LONG-TERM REFERENCE PICTURES, JPN6016047075, 11 January 2013 (2013-01-11) *

Also Published As

Publication number Publication date
US10027978B2 (en) 2018-07-17
EP2946558A1 (en) 2015-11-25
CN104919803B (en) 2017-09-12
US9674524B2 (en) 2017-06-06
EP2946558B1 (en) 2020-04-29
US10230979B2 (en) 2019-03-12
US20160345024A1 (en) 2016-11-24
WO2014112354A1 (en) 2014-07-24
US20190208224A1 (en) 2019-07-04
CN104919803A (en) 2015-09-16
HK1214708A1 (en) 2016-07-29
US20170208342A1 (en) 2017-07-20
JP6209772B2 (en) 2017-10-11
US20140198857A1 (en) 2014-07-17
EP2946558A4 (en) 2016-09-14

Similar Documents

Publication Publication Date Title
JP6209772B2 (en) Video decoder using signaling
US11582446B2 (en) Device for decoding a video bitstream
US9807421B2 (en) NAL unit type restrictions
US10057569B2 (en) Alignment of picture order count
EP2901702B1 (en) Signaling scalability information in a parameter set
US20140192894A1 (en) Implicit signaling of scalability dimension identifier information in a parameter set
US20130272398A1 (en) Long term picture signaling
EP2923488B1 (en) Signaling scalability information in a parameter set

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20160107

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170815

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170822

R150 Certificate of patent or registration of utility model

Ref document number: 6209772

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250