JP2017034729A - Dynamic image predictive decoding method and dynamic image predictive decoding device - Google Patents
Dynamic image predictive decoding method and dynamic image predictive decoding device Download PDFInfo
- Publication number
- JP2017034729A JP2017034729A JP2016224323A JP2016224323A JP2017034729A JP 2017034729 A JP2017034729 A JP 2017034729A JP 2016224323 A JP2016224323 A JP 2016224323A JP 2016224323 A JP2016224323 A JP 2016224323A JP 2017034729 A JP2017034729 A JP 2017034729A
- Authority
- JP
- Japan
- Prior art keywords
- nal
- pictures
- decoding
- picture
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 230000002123 temporal effect Effects 0.000 claims abstract description 39
- 238000007796 conventional method Methods 0.000 abstract description 5
- 238000013461 design Methods 0.000 abstract description 2
- 230000001172 regenerating effect Effects 0.000 abstract 2
- 230000015654 memory Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 1
- 241000906446 Theraps Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Abstract
Description
本発明は、動画像予測復号方法及び動画像予測復号装置に関するものである。 The present invention relates to a moving picture predictive decoding method and a moving picture predictive decoding apparatus.
従来の動画像圧縮技術では、ビットストリームはネットワーク・アブストラクション・レイヤー(NAL)ユニットにカプセル化される。NALユニットは自己完結したパケットを提供し、ビデオ・レイヤーに異なるネットワーク環境における同一性を与える。NALユニットのヘッダにはシステム・レイヤーで必要となる情報が含まれている。NALユニットのヘッダはパケットネットワークにおけるパケットヘッダの一部となり、メディア・アウェア・ネットワーク・エレメンツ(MANEs)によって動作するようになるように設計されている。 In a conventional moving image compression technique, a bit stream is encapsulated in a network abstraction layer (NAL) unit. NAL units provide self-contained packets, giving the video layer identity in different network environments. The header of the NAL unit includes information necessary for the system layer. The header of the NAL unit becomes part of the packet header in the packet network and is designed to work with Media Aware Network Elements (MANEs).
従来技術のNALユニットヘッダは以下のシンタックス・エレメンツを含んでいる。nal_ref_flagは、そのNALユニットが他のNALユニットの復号処理において参照に用いられるか否かを指示する。nal_unit_typeはNALユニットによって伝達される内容の型を指示する。NALユニットはパラメータ・セット、符号化スライス、サプリメンタル・エンハンスメント・インフォメーション(SEI)メッセージなどの情報を含む。temporal_idはNALユニットの時間識別子を指示する。 The prior art NAL unit header includes the following syntax elements: nal_ref_flag indicates whether or not the NAL unit is used for reference in the decoding process of another NAL unit. nal_unit_type indicates the type of content conveyed by the NAL unit. The NAL unit contains information such as parameter sets, coded slices, supplemental enhancement information (SEI) messages. temporal_id indicates the time identifier of the NAL unit.
従来技術は非特許文献1に記載されている。
The prior art is described in
MANEsがパケットの冒頭で最小限のバイト数を調べるように設計されているように、NALユニットヘッダは限られた資源である。従来技術においては、NALユニットヘッダは2バイトに過ぎない。それゆえ、NALユニットヘッダの全てのシンタックスエレメントは重要であり、可能な限り数多くの、かつ、他のシンタックスエレメントとは相関のない情報を伝達するべきである。 The NAL unit header is a limited resource, as MANEs are designed to look at the minimum number of bytes at the beginning of a packet. In the prior art, the NAL unit header is only 2 bytes. Therefore, all syntax elements of the NAL unit header are important and should convey as much information as possible and uncorrelated with other syntax elements.
大部分のNALユニットタイプの場合、nal_ref_flagは固定値に設定される必要があるため、nal_ref_flagは必要とされない。非特許文献1に記載の仕様において、nal_ref_flagが0または1の値をとりうるNALユニットタイプは3種類のみである。仕様で定義されているその他のNALユニットタイプではnal_ref_flagの値は固定されている。これを表1に示す。
表1は、nal_unit_typeの値(NAL unit type range列)とnal_ref_flagが取りうる値(Possible nal_ref_flag列)との対応を示す表である。ここで、nal_unit_typeの値が1、2、あるいは3であるNALユニットタイプは、nal_ref_flagの値として0あるいは1をとりうる。残りのNALユニットタイプはリザーブされている、あるいは仕様化されていない。
For most NAL unit types, nal_ref_flag is not required because nal_ref_flag needs to be set to a fixed value. In the specification described in
Table 1 is a table showing the correspondence between the value of nal_unit_type (NAL unit type range column) and the value that nal_ref_flag can take (Possible nal_ref_flag column). Here, the NAL unit type whose nal_unit_type value is 1, 2, or 3 can take 0 or 1 as the value of nal_ref_flag. The remaining NAL unit types are reserved or not specified.
このようにnal_ref_flagの値が、nal_unit_typeの値に応じて一意に決定される場合においても、従来手法ではnal_ref_flag及びnal_unit_typeのそれぞれにビットを割り当てており、非効率な設計となっている。 Thus, even when the value of nal_ref_flag is uniquely determined according to the value of nal_unit_type, in the conventional method, bits are assigned to each of nal_ref_flag and nal_unit_type, which is an inefficient design.
上述の課題を解決するための解決策はNALユニットヘッダでnal_ref_flagを明示的に送らずに、NALユニットタイプから暗示することである。NALユニットの内容が、参照ピクチャあるいは非参照ピクチャになりうる3通りのNALユニットタイプについて、nal_ref_flagが1であることを暗示する3通りのNALユニットタイプを追加する。元の3通りのNALユニットタイプについては、nal_ref_flagが0であることを暗示している。 The solution to solve the above problem is to imply from the NAL unit type without explicitly sending nal_ref_flag in the NAL unit header. Three types of NAL unit types implying that nal_ref_flag is 1 are added to the three types of NAL unit types whose contents of the NAL unit can be reference pictures or non-reference pictures. For the original three NAL unit types, nal_ref_flag is 0.
上述の課題を解決するために、本発明に係る動画像予測復号方法は、動画像予測復号装置により実行される動画像予測復号方法であって、動画像を構成する複数のピクチャのための圧縮画像データであって、リファレンス・ピクチャ・セット(RPS)を含み、NALユニットヘッダ情報とともにNALユニットにカプセル化された圧縮画像データを入力する入力ステップと、NALユニットヘッダ情報及びRPSを復号し、圧縮画像データを再生画像データとして復元する復号ステップと、を含み、動画像を構成する複数のピクチャは、複数のテンポラル・レイヤに分類され、RPSは、関連するピクチャの画面間予測に使われるピクチャの組を識別し、NALユニットヘッダ情報は、再生画像データが、同じテンポラル・レイヤの他のピクチャを復号する際に画面間予測に使われるか否かを一意に示すnal_unit_typeを含み、他のピクチャのRPSは、同じテンポラル・レイヤの非参照ピクチャを含まない。 In order to solve the above-described problem, a moving picture predictive decoding method according to the present invention is a moving picture predictive decoding method executed by a moving picture predictive decoding apparatus, and compresses a plurality of pictures constituting a moving picture. An input step for inputting compressed image data encapsulated in a NAL unit together with NAL unit header information, including reference picture set (RPS), and decoding and compressing the NAL unit header information and RPS A plurality of pictures constituting the moving image are classified into a plurality of temporal layers, and the RPS is a picture used for inter-picture prediction of related pictures. The NAL unit header information indicates that the reproduced image data has other pixels in the same temporal layer. Includes nal_unit_type uniquely indicating whether used for inter-picture prediction in decoding tea, the RPS other pictures free of non-reference picture in the same temporal layer.
本発明に係る動画像予測復号方法におけるNALユニットヘッダ情報は、再生画像データが、同じテンポラル・レイヤの後続のピクチャの復号での画面間予測に復号順で使われるか否かを一意に示すnal_unit_typeを含み、復号順の後続のピクチャのRPSは、同じテンポラル・レイヤの非参照ピクチャを含まないこととしてもよい。 The NAL unit header information in the video predictive decoding method according to the present invention includes nal_unit_type that uniquely indicates whether the reproduced image data is used in decoding order for inter-screen prediction in decoding of subsequent pictures of the same temporal layer. RPS of subsequent pictures in decoding order may not include non-reference pictures of the same temporal layer.
本発明に係る動画像予測復号装置は、動画像を構成する複数のピクチャのための圧縮画像データであって、リファレンス・ピクチャ・セット(RPS)を含み、NALユニットヘッダ情報とともにNALユニットにカプセル化された圧縮画像データを入力する入力手段と、NALユニットヘッダ情報及びRPSを復号し、圧縮画像データを再生画像データとして復元する復号手段と、を具備し、動画像を構成する複数のピクチャは、複数のテンポラル・レイヤに分類され、RPSは、関連するピクチャの画面間予測に使われるピクチャの組を識別し、NALユニットヘッダ情報は、再生画像データが、同じテンポラル・レイヤの他のピクチャを復号する際に画面間予測に使われるか否かを一意に示すnal_unit_typeを含み、他のピクチャのRPSは、同じテンポラル・レイヤの非参照ピクチャを含まない。 The moving picture predictive decoding apparatus according to the present invention is compressed image data for a plurality of pictures constituting a moving picture, includes a reference picture set (RPS), and is encapsulated in a NAL unit together with NAL unit header information. A plurality of pictures constituting a moving image, comprising: input means for inputting the compressed image data, and decoding means for decoding the NAL unit header information and RPS and restoring the compressed image data as reproduced image data. Classified into multiple temporal layers, the RPS identifies the set of pictures used for inter-picture prediction of related pictures, and the NAL unit header information decodes other pictures in the same temporal layer that the reconstructed image data Nal_unit_type that uniquely indicates whether or not to use for inter-screen prediction when Kucha the RPS does not include the non-reference picture in the same temporal layer.
本発明に係る動画像予測復号装置におけるNALユニットヘッダ情報は、再生画像データが、同じテンポラル・レイヤの後続のピクチャの復号での画面間予測に復号順で使われるか否かを一意に示すnal_unit_typeを含み、復号順の後続のピクチャのRPSは、同じテンポラル・レイヤの非参照ピクチャを含まないこととしてもよい。 The NAL unit header information in the moving picture predictive decoding apparatus according to the present invention includes nal_unit_type that uniquely indicates whether or not the reproduced image data is used in the decoding order for inter-picture prediction in decoding of subsequent pictures of the same temporal layer. RPS of subsequent pictures in decoding order may not include non-reference pictures of the same temporal layer.
本発明の効果は、nal_ref_flagに使われているビットを節約し、他の指示情報として利用可能にすることである。これはNALユニットヘッダのより効率的な利用である。もうひとつの利用法は、NALユニットタイプを6ビットから7ビットに拡張できることである。現時点では利用可能な64通りのnal_unit_typeの値の半分には既存のNALユニットタイプが割り当てられており、32通りのnal_unit_typeの値についてはリザーブされ、将来新しいNALユニットタイプを規定する際に利用可能である。これらリザーブされたNALユニットタイプの値のうち3つを使い、かつNALユニットタイプのビット数を7ビットに拡張することで、将来的に93通り(128−32−3=93)の更なるNALユニットを規定することができる。 The effect of the present invention is to save bits used in nal_ref_flag and make them available as other instruction information. This is a more efficient use of the NAL unit header. Another use is that the NAL unit type can be expanded from 6 bits to 7 bits. At present, half of the 64 available nal_unit_type values are assigned the existing NAL unit type, and the 32 nal_unit_type values are reserved and can be used when defining a new NAL unit type in the future. By using three of these reserved NAL unit type values and expanding the number of bits of the NAL unit type to 7 bits, 93 (128-32-3 = 93) additional NAL units will be added in the future. Can be prescribed.
以下、本発明の実施の形態について、図1から図10を用いて説明する。 Hereinafter, embodiments of the present invention will be described with reference to FIGS.
まず、本発明による動画像予測符号化方法について説明する。図1は本発明の実施形態による動画像予測符号化装置を示すブロック図である。101は入力端子、102はブロック分割器、103は予測信号生成器、104はフレームメモリ、105は減算器、106は変換器、107は量子化器、108は逆量子化器、109は逆変換器、110は加算器、111はエントロピー符号化器、112は出力端子、113は入力端子である。入力端子101は入力手段に対応する。減算器105と変換器106と量子化器107とエントロピー符号化器111とは符号化手段に対応する。逆量子化器108、逆変換器109と加算器110は復号手段に対応する。
First, the video predictive coding method according to the present invention will be described. FIG. 1 is a block diagram showing a video predictive coding apparatus according to an embodiment of the present invention. 101 is an input terminal, 102 is a block divider, 103 is a prediction signal generator, 104 is a frame memory, 105 is a subtractor, 106 is a converter, 107 is a quantizer, 108 is a dequantizer, and 109 is an inverse transform , 110 is an adder, 111 is an entropy encoder, 112 is an output terminal, and 113 is an input terminal. The
以上のように構成された動画像予測符号化装置について、以下その動作を述べる。複数枚の画像からなる動画像の信号は入力端子101に入力される。符号化の対象となる画像はブロック分割器102にて、複数の領域に分割される。本発明による実施形態では、8x8の画素からなるブロックに分割されるが、それ以外のブロックの大きさまたは形に分割してもよい。次に符号化処理の対象となる領域(以下対象ブロックとよぶ)に対して、予測信号を生成する。本発明による実施形態では、2種類の予測方法が用いられる。すなわち画面間予測と画面内予測である。
The operation of the video predictive coding apparatus configured as described above will be described below. A moving image signal composed of a plurality of images is input to the
画面間予測では、過去に符号化されたのちに復元された再生画像を参照画像として、この参照画像から対象ブロックに対する誤差の最も小さい予測信号を与える動き情報を求める。この処理は動き検出とよばれる。また場合に応じて、対象ブロックを再分割し、再分割された小領域に対し画面間予測方法を決定してもよい。この場合、各種の分割方法の中から、対象ブロック全体に対し最も効率のよい分割方法及びそれぞれの動き情報を決定する。本発明による実施形態では、予測信号生成器103にて行われ、対象ブロックはラインL102、参照画像はL104経由で入力される。参照画像としては、過去に符号化され復元された複数の画像を参照画像として用いる。詳細は従来の技術であるMPEG−2、4、H.264のいずれかの方法と同じである。このように決定された動き情報及び小領域の分割方法はラインL112経由でエントロピー符号化器111に送られ符号化した上で出力端子112から送出される。また複数の参照画像の中で、予測信号がどの参照画像から取得するかに関する情報(リファレンス・インデックス)もラインL112経由でエントロピー符号化器111に送られる。予測信号生成器103では、小領域の分割方法及びそれぞれの小領域に対応する、参照画像と動き情報をもとにフレームメモリ104から参照画像信号を取得し、予測信号を生成する。このように生成された画面間予測信号はラインL103経由で減算器105に送られる。
In inter-screen prediction, a reproduction image that has been encoded in the past and then restored is used as a reference image, and motion information that gives a prediction signal with the smallest error for the target block is obtained from this reference image. This process is called motion detection. Further, according to circumstances, the target block may be subdivided, and the inter-screen prediction method may be determined for the subdivided small area. In this case, the most efficient division method and the respective motion information are determined from the various division methods for the entire target block. In the embodiment according to the present invention, the
画面内予測では、対象ブロックに空間的に隣接する既再生の画素値を用いて画面内予測信号を生成する。具体的には予測信号生成器103では、フレームメモリ104から同じ画面内にある既再生の画素信号を取得し、これらの信号を外挿することによって画面内予測信号を生成する。外挿の方法に関する情報はラインL112経由でエントロピー符号化器111に送られ符号化した上で出力端子112から送出される。このように生成された画面内予測信号は減算器105に送られる。予測信号生成器103における画面内の予測信号生成方法は、従来の技術であるH.264の方法と同じである。上述のように求められた画面間予測信号と画面内予測信号に対し、誤差の最も小さいものが選択され、減算器105に送られる。
In intra-screen prediction, an intra-screen prediction signal is generated using already reproduced pixel values spatially adjacent to the target block. Specifically, the
減算器105にて対象ブロックの信号(ラインL102経由)から予測信号(ラインL103経由)を引き算し、残差信号を生成する。この残差信号は変換器106にて離散コサイン変換され、その各係数は量子化器107にて量子化される。最後にエントロピー符号化器111にて量子化された変換係数を符号化して、予測方法に関する情報とともに出力端子112より送出される。
The
後続の対象ブロックに対する画面内予測もしくは画面間予測を行うために、圧縮された対象ブロックの信号は逆処理し復元される。すなわち、量子化された変換係数は逆量子化器108にて逆量子化されたのちに逆変換器109にて逆離散コサイン変換され、残差信号を復元する。加算器110にて復元された残差信号とラインL103から送られた予測信号とを加算し、対象ブロックの信号を再生し、フレームメモリ104に格納する。本実施の形態では変換器106と逆変換器109を用いているが、これらの変換器に代わるほかの変換処理を用いてもよい。場合によって、変換器106と逆変換器109がなくてもよい。
In order to perform intra prediction or inter prediction for the subsequent target block, the compressed signal of the target block is inversely processed and restored. That is, the quantized transform coefficient is inversely quantized by the
入力端子113より各画像の表示順番情報や画像を符号化するタイプ(画面内予測符号化、画面間予測符号化、双方向予測符号化)、NALユニットタイプに関する情報が入力され、これらの情報に基づいて予測信号生成器103が動作する。またこれらの情報はラインL113を経由してエントロピー符号化器111に送られ、符号化した上で出力端子112から送出される。NALユニットタイプを符号化するためのエントロピー符号化器111の動作については後述する。
Information about the display order of each image, the type for encoding the image (intra-screen predictive coding, inter-screen predictive coding, bi-directional predictive coding), and information about the NAL unit type are input from the
次に本発明による動画像予測復号方法について説明する。図2は本発明の実施形態による画像予測復号装置のブロック図を示す。201は入力端子、202はデータ解析器、203は逆量子化器、204は逆変換器、205は加算器、206は出力端子、207はフレームメモリ、208は予測信号生成器、209はフレームメモリ管理器である。入力端子201は入力手段に対応する。データ解析器202と逆量子化器203と逆変換器204と加算器205とは復号手段に対応する。復号手段としてそれ以外のものを用いてもよい。また逆変換器204がなくてもよい。
Next, the video predictive decoding method according to the present invention will be described. FIG. 2 shows a block diagram of an image predictive decoding apparatus according to an embodiment of the present invention. 201 is an input terminal, 202 is a data analyzer, 203 is an inverse quantizer, 204 is an inverse transformer, 205 is an adder, 206 is an output terminal, 207 is a frame memory, 208 is a prediction signal generator, and 209 is a frame memory It is a manager. The
以上のように構成された動画像予測復号装置について、以下その動作を述べる。上述した方法で圧縮符号化された圧縮データは入力端子201から入力される。この圧縮データには、画像を複数のブロックに分割された対象ブロックを予測し符号化された残差信号及び予測信号の生成に関連する情報などが含まれている。予測信号の生成に関連する情報として、NALユニットタイプに加え、画面間予測の場合はブロック分割に関する情報(ブロックのサイズ)や、動き情報と上述のリファレンス・インデックスに関する情報が含まれ、画面内予測の場合は周辺の既再生の画素から外挿方法に関する情報が含まれている。
The operation of the video predictive decoding apparatus configured as described above will be described below. The compressed data compressed and encoded by the method described above is input from the
データ解析器202にて、圧縮データから対象ブロックの残差信号、NALユニットタイプを含む予測信号の生成に関連する情報、量子化パラメータ、画像の表示順番情報を抽出する。データ解析器202におけるNALユニットタイプ抽出のための動作については後述する。対象ブロックの残差信号は逆量子化器203にて量子化パラメータ(ラインL202経由)をもとに逆量子化される。その結果は逆変換器204にて逆離散コサイン変換される。
The data analyzer 202 extracts the residual signal of the target block, information related to the generation of the prediction signal including the NAL unit type, the quantization parameter, and the display order information of the image from the compressed data. The operation for extracting the NAL unit type in the
次にラインL206経由で、対象画像の表示順番情報、画像の符号化タイプNALユニットタイプ、およびリファレンス・インデックスなど予測信号の生成に関連する情報が予測信号生成器208に送られる。予測信号生成器208では、予測信号の生成に関連する情報をもとに、フレームメモリ207にアクセスし、複数の参照画像の中から参照信号を取得し(ラインL207経由)予測信号を生成する。この予測信号はラインL208経由で加算器205に送られ、復元された残差信号に加算され、対象ブロック信号を再生し、ラインL205経由で出力端子206から出力すると同時にフレームメモリ207に格納される。
Next, information related to the generation of the prediction signal, such as the display order information of the target image, the image encoding type NAL unit type, and the reference index, is sent to the
フレームメモリ207には、後続の画像の復号・再生に用いられる再生画像が格納されている。
The
表2および表3は、NALユニットヘッダの2バイトの使用形態に関する2通りのシンタックスの選択肢を示す表である。
表2および表3において、Descriptor列の括弧内の数字は、対応する項目が有するビット数を表す。
Tables 2 and 3 are tables showing two syntax options related to the usage pattern of 2 bytes of the NAL unit header.
In Tables 2 and 3, the numbers in parentheses in the Descriptor column represent the number of bits that the corresponding item has.
表2のNALユニットヘッダシンタックスでは、nal_ref_flagはリザーブドビット(reserved)に置き換わっている。このビットは現在の復号装置では無視されるが、将来の復号装置のために新たな意味やセマンティクスを割り当てることができる。なお、表2におけるビットの配置は説明のために過ぎず、リザーブドビットは2バイトのヘッダ内の他の場所に配置してもよい。 In the NAL unit header syntax of Table 2, nal_ref_flag is replaced with a reserved bit (reserved). This bit is ignored by current decoders, but new meanings and semantics can be assigned for future decoders. Note that the bit arrangement in Table 2 is for illustrative purposes only, and the reserved bits may be arranged elsewhere in the 2-byte header.
表3のNALユニットヘッダシンタックスでは、nal_unit_typeに7ビットが割り当てられており、最大128通りの異なるnal_unit_typeを規定することができる。なお、本実施形態においてはnal_unit_typeに7ビットを割り当てることを選択したが、nal_ref_flagで節約されたビットは、temporal_idに割り当てられてもよい。 In the NAL unit header syntax of Table 3, 7 bits are assigned to nal_unit_type, and up to 128 different nal_unit_types can be defined. In this embodiment, it is selected that 7 bits are assigned to nal_unit_type, but the bits saved by nal_ref_flag may be assigned to temporal_id.
表4に本実施形態におけるNALユニットタイプを示す。
表4は、nal_unit_typeの値から推定されるnal_ref_flagの値を示す表である。NALユニットタイプは表4の2列目に示されるように、複数のカテゴリにグループ分けすることができる。そのカテゴリとは下記の通りである。1)RAPスライス(RAP slice):ランダム・アクセス・ピクチャの符号化スライスを含んでいるNALユニット
2)TLAスライス(TLA slice):テンポラル・レイヤー・アクセスの符号化スライスを含んでいるNALユニット
3)TFDスライス(TFD slice):ディスカードのためのタグ付けがされたピクチャの符号化スライスを含んでいるNALユニット
4)その他のスライス(Other slice):上記のいずれでもない符号化スライスを含んでいるNALユニット
5)パラメータ・セット(Parameter Set):ビデオ、シーケンス、ピクチャの適応パラメータセットを含んでいるNALユニット
6)インフォメーション(Information):アクセス・デリミタ、フィラーデータ、あるいはサプリメンタル・エンハンスメント・インフォメーション(SEI)を含んでいるNALユニット
Table 4 shows NAL unit types in the present embodiment.
Table 4 is a table showing the value of nal_ref_flag estimated from the value of nal_unit_type. NAL unit types can be grouped into multiple categories as shown in the second column of Table 4. The categories are as follows. 1) RAP slice: NAL unit 2 containing coded slice of random access picture 2) TLA slice: NAL unit 3 containing coded slice of temporal layer access 3) TFD slice (TFD slice): NAL unit 4 containing coded slice of tagged picture for discarding Other slice: containing coded slice that is not any of the above NAL unit 5) Parameter Set: NAL unit 6 containing adaptive parameter set of video, sequence, picture. Information: Information: Access delimiter, filler data, or supplemental enhancement information (SEI). ) Comprising at which NAL unit
本実施形態では、nal_unit_type(ピクチャタイプ)の値として9、10、11に対応する3通りの新しいNALユニットタイプが従来技術のnal_unit_typeに追加される。これらのnal_unit_typeの値をもつNALユニットは、それぞれnal_unit_typeの値として1、2、3をもつNALユニットと同じスライスタイプを含む。nal_unit_type:1は非RAP、非TFDかつ非TLAピクチャの符号化スライスを含み、nal_unit_type:2はTFDピクチャの符号化スライスを含み、nal_unit_type:3は非TFDのTLAピクチャの符号化スライスを含んでいる。
従来技術との違いは、本実施形態において、値1、2、3が非参照ピクチャに属する符号化スライスであり、値9、10、11が非参照ピクチャに属する符号化スライスであることである。
In this embodiment, three new NAL unit types corresponding to 9, 10, and 11 are added to the nal_unit_type of the prior art as values of nal_unit_type (picture type). These NAL units having the value of nal_unit_type include the same slice type as the NAL units having 1, 2, and 3 as values of nal_unit_type, respectively. nal_unit_type: 1 contains non-RAP, non-TFD and non-TLA picture coding slices, nal_unit_type: 2 contains TFD picture coding slices, nal_unit_type: 3 contains non-TFD TLA picture coding slices .
The difference from the prior art is that, in this embodiment, values 1, 2, and 3 are coded slices belonging to non-reference pictures, and values 9, 10, and 11 are coded slices belonging to non-reference pictures. .
なおそれぞれのカテゴリに割り当てられる値は、上記に限定されない。さらには、それぞれのカテゴリをいくつかのサブカテゴリに拡張し、表4におけるリザーブされた値を用いて、新規の値をそれらのサブカテゴリに割り当ててもよい。 The values assigned to the respective categories are not limited to the above. In addition, each category may be expanded into several subcategories and the reserved values in Table 4 may be used to assign new values to those subcategories.
図3に本実施形態におけるNALユニットヘッダの符号化のための動画像予測符号化装置の動作を示す。ステップ110において、動画像予測符号化装置はパケット化されるビデオデータを取得する。ステップ120において、常に0に固定されているNALユニットの最初のビットを符号化する。ステップ130において、nal_unit_typeを決定し、符号化する。ステップ140において、temporal_idを符号化し、ステップ150において、リザーブされている5ビット(reserved_one_5bits)を符号化し、NALユニットヘッダを完結させる。ステップ160において、残りのペイロード(payload)をパケット化し、処理を終了する。
FIG. 3 shows the operation of the video predictive encoding apparatus for encoding the NAL unit header in this embodiment. In
図4に上述のステップ130におけるnal_unit_typeの決定及び符号化における処理の詳細を示す。
FIG. 4 shows details of the process for determining and encoding nal_unit_type in
ステップ210において、動画像予測符号化装置はパケット化されるデータがランダム・アクセス・ピクチャ(RAP)のいずれかに属する符号化スライスであるか否かを判定し、RAPのいずれかに属する符号化スライスである場合(YES)はステップ220に進む。そうでない場合(NO)はステップ230に進む。
In
ステップ220において、動画像予測符号化装置はRAPタイプに応じて、nal_ref_flagが1であることを暗示する4から8までのnal_unit_typeを符号化し、ステップ140に進む。
In
ステップ230において、動画像予測符号化装置はパケット化されるデータがパラメータ・セットであるか否かを判定し、パラメータ・セットである場合(YES)はステップ240に進む。そうでない場合(NO)はステップ250に進む。
In
ステップ240において、動画像予測符号化装置はパラメータ・セットに応じて、nal_ref_flagが1であることを暗示する25から28までのnal_unit_typeを符号化し、ステップ140に進む。
In
ステップ250において、動画像予測符号化装置はパケット化されるデータがインフォメーション・データであるか否かを判定し、インフォメーション・データである場合(YES)はステップ260に進む。そうでない場合(NO)はステップ270に進む。
In
ステップ260において、動画像予測符号化装置はインフォメーション・タイプに応じて、nal_ref_flagが0であることを暗示する29から31までのnal_unit_typeを符号化し、ステップ140に進む。
In
ステップ270において、動画像予測符号化装置はパケット化されるデータが参照ピクチャであるか否かを判定し、参照ピクチャである場合(YES)はステップ280に進む。そうでない場合(NO)はステップ290に進む。ここで、参照ピクチャであるか否かの判定は、予測信号生成器から出力されるピクチャ間の参照情報に基づいて行われる。
In
ステップ270における条件分岐は以下の通りでもよい。ステップ270においては、ビデオデータは参照ピクチャや非参照ピクチャかのいずれかでなくてはならない。ステップ270において、動画像予測符号化装置はピクチャが参照ピクチャであるか否かを判定し、参照ピクチャである場合(YES)はステップ280に進む。そうでない場合(NO)はステップ290に進む。
The conditional branch in
ステップ280において、動画像予測符号化装置はスライスタイプに応じて、nal_ref_flagが1であることを暗示する9から11までのnal_unit_typeを符号化し、ステップ140に進む。
In
ステップ290において、動画像予測符号化装置はスライスタイプに応じて、nal_ref_flagが0であることを暗示する1から3までのnal_unit_typeを符号化し、ステップ140に進む。
In
図5に、本実施形態におけるNALユニットヘッダの復号のための動画像予測復号装置の動作を示す。ステップ310において、動画像予測復号装置は復号のための次のパケットを取得する。ステップ320において、常に0に固定されているNALユニットの最初のビット(forbidden_zero_bit)を復号する。ステップ330において、nal_unit_typeを復号し、nal_ref_flagの値を設定する。ステップ340において、temporal_idを復号し、ステップ350において、リザーブされている5ビット(reserved_one_5bits)を復号し、NALユニットヘッダを完結させる。ステップ360において、残りのペイロードをパケットから読み出し、処理を終了する。
FIG. 5 shows the operation of the video predictive decoding apparatus for decoding the NAL unit header in this embodiment. In
図6に、上述のステップ330におけるnal_unit_typeの復号及びnal_ref_flagの値の設定における処理の詳細を示す。
FIG. 6 shows details of processing in the decoding of nal_unit_type and the setting of the value of nal_ref_flag in
ステップ400において、動画像予測復号装置はNALユニットヘッダを復号することで、nal_unit_typeの値を取得する。
In
ステップ410において、動画像予測復号装置はnal_unit_typeの値が1から3までのいずれかであるか否かを判定し、1から3までのいずれかである場合(YES)はNALユニットが非参照ピクチャの符号化スライスのひとつを含んでおり、ステップ420に進む。そうでない場合(NO)はステップ430に進む。
In
ステップ420において、動画像予測復号装置はnal_ref_flagの値を0に設定し、ステップ340に進む。
In
ステップ430において、動画像予測復号装置はnal_unit_typeの値が4から11までのいずれかであるか否かを判定し、4から11までのいずれかである場合(YES)はNALユニットがランダム・アクセス・ピクチャの符号化スライス、あるいは参照ピクチャの符号化スライスのひとつを含んでおり、ステップ440に進む。そうでない場合(NO)はステップ450に進む。
In
ステップ450において、動画像予測復号装置はnal_ref_flagの値を1に設定し、ステップ340に進む。
In
ステップ450において、動画像予測復号装置はnal_unit_typeの値が25から28までのいずれかであるか否かを判定し、25から28までのいずれかである場合(YES)はNALユニットがパラメータ・セットを含んでおり、ステップ460に進む。そうでない場合(NO)はステップ470に進む。
In
ステップ460において、動画像予測復号装置はnal_ref_flagの値を1に設定し、ステップ340に進む。
In
ステップ470において、動画像予測復号装置はnal_unit_typeの値が29から31までのいずれかであるか否かを判定し、29から31までのいずれかである場合(YES)はNALユニットがインフォメーション・データを含んでおり、ステップ480に進む。そうでない場合(NO)はnal_unit_typeは無効な値であり、ステップ490に進む。
In
ステップ480において、動画像予測復号装置はnal_ref_flagの値を0に設定し、ステップ340に進む。
In
ステップ490において、動画像予測復号装置はnal_ref_flagの値は未定義とし、ステップ340に進む。
In
本実施形態において、上述したnal_ref_flagの設定は論理的な判定を通じたものであるが、nal_unit_typeをインデックスとしたnal_ref_flagの参照テーブルを用いて、nal_ref_flagの値を設定してもよい。表5は、nal_unit_typeをインデックスとしたnal_ref_flagの参照テーブルの一例である。
表5では、nal_ref_flagの32通りのエントリーは表4の最終列と同様の値に設定されている。
In the present embodiment, the above-described setting of nal_ref_flag is through logical determination, but the value of nal_ref_flag may be set using a nal_ref_flag reference table with nal_unit_type as an index. Table 5 is an example of a reference table of nal_ref_flag using nal_unit_type as an index.
In Table 5, 32 kinds of entries of nal_ref_flag are set to values similar to those in the last column of Table 4.
なお、上述したnal_ref_flagの推定あるいは設定方法は動画像予測復号装置に限定されず、MANEsにも適用可能である。 Note that the above-described estimation or setting method of nal_ref_flag is not limited to the moving picture predictive decoding apparatus, and can be applied to MANEs.
本実施形態において、動画像予測復号装置はnal_ref_flagの設定を行わないことを選択し、復号されたピクチャが参照ピクチャであるか否かを決定する際に、nal_unit_typeの値を直接使用してもよい。これは論理的な表現を用いると以下のように説明される。当該ピクチャのnal_unit_typeが1、2、または3である場合、当該ピクチャは非参照ピクチャである。そうでない場合、当該ピクチャは参照ピクチャであり、他のピクチャが参照に用いるため保存される。 In this embodiment, the video predictive decoding apparatus may select not to set nal_ref_flag, and may directly use the value of nal_unit_type when determining whether or not the decoded picture is a reference picture. . This can be explained as follows using a logical expression. When the nal_unit_type of the picture is 1, 2, or 3, the picture is a non-reference picture. Otherwise, the picture is a reference picture and is saved for use by other pictures for reference.
本実施形態では、参照ピクチャ並びに非参照ピクチャの定義は映像全体に対して適用される。しかしながら、映像が、より高いテンポラル・レイヤのピクチャを捨てる、選択フレームドロップの処理が行われた場合には、この定義はもはや正確ではない可能性がある。 In the present embodiment, the definition of the reference picture and the non-reference picture is applied to the entire video. However, this definition may no longer be accurate if a selection frame drop process is performed in which the video discards higher temporal layer pictures.
そのような状況においては、いくつかの参照ピクチャは実際には参照されないピクチャになりうる。これを回避するために、nal_unit_typeが9、10、11である参照ピクチャ、並びにnal_unit_typeが1、2、3である非参照ピクチャは以下のように定義してもよい。 In such a situation, some reference pictures may become pictures that are not actually referenced. In order to avoid this, reference pictures with nal_unit_type of 9, 10, and 11 and non-reference pictures with nal_unit_type of 1, 2, and 3 may be defined as follows.
参照ピクチャとは前記ピクチャと同じテンポラル・レイヤの他のいずれかのピクチャによって画面間予測のために使用されるピクチャである。 A reference picture is a picture used for inter-screen prediction by any other picture in the same temporal layer as the picture.
非参照ピクチャとは前記ピクチャと同じテンポラル・レイヤの他のいずれのピクチャによっても画面間予測のために使用されないピクチャである。 A non-reference picture is a picture that is not used for inter-screen prediction by any other picture in the same temporal layer as the picture.
非特許文献1に記載の従来法においては、画面間予測はどのピクチャが画面間予測のために利用可能かを規定するリファレンス・ピクチャ・セット(RPS)の中身によって指示される。それゆえ、上述の定義は下記のように記載してもよい。
In the conventional method described in
非参照ピクチャ(nal_unit_typeが1、2または3)は前記ピクチャと同じテンポラル・レイヤの他のいずれのピクチャのRPSにも含まれない。 A non-reference picture (nal_unit_type is 1, 2 or 3) is not included in the RPS of any other picture in the same temporal layer as the picture.
参照ピクチャ(nal_unit_typeが9、10または11)とは前記ピクチャと同じテンポラル・レイヤの他のいずれかのピクチャのRPSに含まれる。 The reference picture (nal_unit_type is 9, 10 or 11) is included in the RPS of any other picture in the same temporal layer as the picture.
コンピュータを上述の動画像予測符号化装置及び動画像予測復号装置として機能させるための本発明に係る動画像予測符号化プログラム及び動画像予測復号プログラムは、プログラムとして記録媒体に格納されて提供される。記録媒体としては、フロッピー(登録商標)ディスク、CD−ROM、DVD、あるいはROM等の記録媒体、あるいは半導体メモリ等が例示される。 A moving picture predictive coding program and a moving picture predictive decoding program according to the present invention for causing a computer to function as the above-described moving picture predictive coding apparatus and moving picture predictive decoding apparatus are provided as a program stored in a recording medium. . Examples of the recording medium include a floppy (registered trademark) disk, a CD-ROM, a DVD, a ROM, or a recording medium, or a semiconductor memory.
図7は、記録媒体に記録されたプログラムを実行するためのコンピュータのハードウェア構成を示す図であり、図8は、記録媒体に記憶されたプログラムを実行するためのコンピュータの斜視図である。コンピュータとして、CPUを具備しソフトウエアによる処理や制御を行なうDVDプレーヤ、セットトップボックス、携帯電話などを含む。 FIG. 7 is a diagram showing a hardware configuration of a computer for executing a program recorded on the recording medium, and FIG. 8 is a perspective view of the computer for executing the program stored on the recording medium. Examples of the computer include a DVD player, a set-top box, a mobile phone, and the like that have a CPU and perform processing and control by software.
図7に示すように、コンピュータ30は、フロッピー(登録商標)ディスクドライブ装置、CD−ROMドライブ装置、DVDドライブ装置等の読取装置12と、オペレーティングシステムを常駐させた作業用メモリ(RAM)14と、記録媒体10に記憶されたプログラムを記憶するメモリ16と、ディスプレイといった表示装置18と、入力装置であるマウス20及びキーボード22と、データ等の送受を行うための通信装置24と、プログラムの実行を制御するCPU26とを備えている。コンピュータ30は、記録媒体10が読取装置12に挿入されると、読取装置12から記録媒体10に格納された動画像予測符号化・復号プログラムにアクセス可能になり、当該動画像予測符号化・復号プログラムによって、本発明による動画像予測符号化装置・復号装置として動作することが可能になる。
As shown in FIG. 7, the
図8に示すように、動画像予測符号化プログラムもしくは動画像復号プログラは、搬送波に重畳されたコンピュータデータ信号40としてネットワークを介して提供されるものであってもよい。この場合、コンピュータ30は、通信装置24によって受信した動画像予測符号化プログラムもしくは動画像予測復号プログラをメモリ16に格納し、当該動画像予測符号化プログラムもしくは動画像予測復号プログラムを実行することができる。
As shown in FIG. 8, the video predictive encoding program or video decoding program may be provided via a network as a computer data signal 40 superimposed on a carrier wave. In this case, the
具体的には、図9に示す通り、動画像予測符号化プログラムP100は、動画像を構成する複数の画像を入力する入力モジュールP101と、画像を、画面内予測もしくは画面間予測のいずれかのプログラムで符号化し、圧縮画像データを生成し、パケットヘッダ情報とともにパケット化する符号化モジュールP102と、を具備し、パケットヘッダ情報は、ピクチャタイプを含み、符号化モジュールP102は、ピクチャタイプを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する、ことを特徴とする動画像予測符号化プログラムである。 Specifically, as illustrated in FIG. 9, the moving image predictive encoding program P100 includes an input module P101 that inputs a plurality of images constituting a moving image, and the image is either in-screen prediction or inter-screen prediction. An encoding module P102 that encodes by a program to generate compressed image data and packetizes the packet header information, and the packet header information includes a picture type, and the encoding module P102 encodes the picture type It is a moving picture predictive encoding program characterized by determining so that the converted picture data may be uniquely used for reference when decoding other pictures.
同様に、図10に示す通り、動画像予測復号プログラムP200は、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、パケットヘッダ情報とともにパケット化された、圧縮画像データを入力する入力モジュールP201と、パケットヘッダ情報及び圧縮画像データを復元する復号モジュールP202と、を具備し、パケットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すピクチャタイプを含み、復号モジュールP202は、ピクチャタイプに基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定することを特徴とする動画像予測復号プログラムである。 Similarly, as illustrated in FIG. 10, the moving picture predictive decoding program P200 encodes a plurality of pictures constituting a moving picture by either intra-screen prediction or inter-screen prediction, and packetizes the packet header information. In addition, an input module P201 for inputting compressed image data and a decoding module P202 for restoring packet header information and compressed image data are provided, and the restored picture data is used for decoding other pictures by the packet header information. The decoding module P202 includes a picture type that uniquely indicates whether or not to be used for reference, and the decoding module P202 uses the restored picture data based on the picture type for reference when decoding other pictures. It is a moving picture predictive decoding program characterized by determining whether to use.
復号モジュールP202は、ピクチャタイプと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴としてもよい。 The decoding module P202 is based on a pre-stored correspondence table in which picture types are associated with information indicating whether or not the restored picture data is used for reference when decoding other pictures. It may be characterized in that it is determined whether the restored picture data is used for reference when decoding other pictures.
上述の課題を解決するために、本発明に係る動画像予測符号化装置は、動画像を構成する複数の画像を入力する入力手段と、画像を、画面内予測もしくは画面間予測のいずれかの方法で符号化し、圧縮画像データを生成し、パケットヘッダ情報とともにパケット化する符号化手段と、を具備し、パケットヘッダ情報は、ピクチャタイプを含み、符号化手段は、ピクチャタイプを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する、ことを特徴とする。 In order to solve the above-described problem, a moving image predictive coding apparatus according to the present invention includes an input unit that inputs a plurality of images constituting a moving image, and the image is either in-screen prediction or inter-screen prediction. Encoding means for generating compressed image data and packetizing together with packet header information, wherein the packet header information includes a picture type, and the encoding means is encoded with the picture type. The picture data is determined so as to uniquely indicate whether or not the picture data is used for reference when decoding other pictures.
また、本発明に係る動画像予測復号装置は、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、パケットヘッダ情報とともにパケット化された、圧縮画像データを入力する入力手段と、パケットヘッダ情報及び圧縮画像データを復元する復号手段と、を具備し、パケットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すピクチャタイプを含み、復号手段は、ピクチャタイプに基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。 The video predictive decoding apparatus according to the present invention is a compressed image that is encoded by either intra-screen prediction or inter-screen prediction and packetized together with packet header information for a plurality of images constituting the video. Input means for inputting data, and decoding means for restoring packet header information and compressed image data. The packet header information is used for reference when the restored picture data is decoded by other pictures. The decoding means determines whether or not the restored picture data is used for reference when decoding other pictures based on the picture type, including a picture type that uniquely indicates whether or not it is used It is characterized by.
また、本発明に係る動画像予測復号装置における復号手段は、ピクチャタイプと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。 The decoding means in the video predictive decoding apparatus according to the present invention corresponds to the picture type and information indicating whether or not the restored picture data is used for reference when decoding other pictures. Based on the pre-stored correspondence table attached, it is determined whether the restored picture data is used for reference when decoding other pictures.
本発明に係る動画像予測符号化方法は、動画像を構成する複数の画像を入力する入力ステップと、画像を、画面内予測もしくは画面間予測のいずれかの方法で符号化し、圧縮画像データを生成し、パケットヘッダ情報とともにパケット化する符号化ステップと、を具備し、パケットヘッダ情報は、ピクチャタイプを含み、符号化ステップは、ピクチャタイプを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する、ことを特徴とする。 A moving image predictive encoding method according to the present invention includes an input step of inputting a plurality of images constituting a moving image, the image is encoded by any one of intra prediction or inter prediction, and compressed image data is encoded. An encoding step of generating and packetizing together with the packet header information, wherein the packet header information includes a picture type, and the encoding step includes the picture type, the encoded picture data includes other pictures. It is characterized in that it is determined so as to uniquely indicate whether or not it is used for reference when decoding.
本発明に係る動画像予測復号方法は、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、パケットヘッダ情報とともにパケット化された、圧縮画像データを入力する入力ステップと、パケットヘッダ情報及び圧縮画像データを復元する復号ステップと、を具備し、パケットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すピクチャタイプを含み、復号ステップは、ピクチャタイプに基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。 The moving image predictive decoding method according to the present invention is a method of decoding compressed image data encoded by either intra-screen prediction or inter-screen prediction and packetized together with packet header information for a plurality of images constituting a moving image. An input step for inputting, and a decoding step for restoring packet header information and compressed image data. The packet header information is used for reference when the restored picture data is decoded by another picture. The decoding step determines whether the restored picture data is used for reference when decoding other pictures, based on the picture type, It is characterized by that.
本発明に係る動画像予測復号方法における復号ステップは、ピクチャタイプと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。 In the decoding step in the video predictive decoding method according to the present invention, the picture type is associated with information indicating whether or not the restored picture data is used for reference when decoding other pictures. Based on a correspondence table stored in advance, it is determined whether the restored picture data is used for reference when decoding other pictures.
本発明に係る動画像予測符号化プログラムは、動画像を構成する複数の画像を入力する入力モジュールと、画像を、画面内予測もしくは画面間予測のいずれかのプログラムで符号化し、圧縮画像データを生成し、パケットヘッダ情報とともにパケット化する符号化モジュールと、を具備し、パケットヘッダ情報は、ピクチャタイプを含み、符号化モジュールは、ピクチャタイプを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する、ことを特徴とする。 A moving image predictive encoding program according to the present invention includes an input module that inputs a plurality of images constituting a moving image, and the image is encoded with either an intra-screen prediction or an inter-screen prediction program. An encoding module that generates and packetizes the packet header information, the packet header information includes a picture type, the encoding module includes a picture type, and the encoded picture data includes other pictures. It is characterized in that it is determined so as to uniquely indicate whether or not it is used for reference when decoding.
本発明に係る動画像予測復号プログラムは、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、パケットヘッダ情報とともにパケット化された、圧縮画像データを入力する入力モジュールと、パケットヘッダ情報及び圧縮画像データを復元する復号モジュールと、を具備し、パケットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すピクチャタイプを含み、復号モジュールは、ピクチャタイプに基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。 The moving picture predictive decoding program according to the present invention encodes compressed image data encoded by either intra-screen prediction or inter-screen prediction and packetized together with packet header information for a plurality of images constituting a moving image. An input module for inputting and a decoding module for restoring packet header information and compressed image data are provided, and the packet header information is used for reference when the restored picture data is decoded by other pictures. A decoding module that uniquely indicates whether or not, based on the picture type, the decoding module determines whether the restored picture data is used for reference when decoding other pictures, It is characterized by that.
本発明に係る動画像予測復号プログラムにおける復号モジュールは、ピクチャタイプと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。 The decoding module in the video predictive decoding program according to the present invention associates a picture type with information indicating whether or not the restored picture data is used for reference when decoding other pictures. Based on a correspondence table stored in advance, it is determined whether the restored picture data is used for reference when decoding other pictures.
上述の課題を解決するために、本発明に係る動画像予測符号化装置は、動画像を構成する複数のピクチャを入力する入力手段と、ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化手段と、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、nal_unit_typeを含み、符号化手段は、nal_unit_typeを、符号化されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する。 In order to solve the above-described problem, a moving picture predictive coding apparatus according to the present invention includes an input unit that inputs a plurality of pictures constituting a moving picture, encodes the pictures, generates compressed picture data, and generates a NAL unit. Encoding means for encapsulating the NAL unit together with header information, and the plurality of pictures constituting the moving image are classified into a plurality of temporal layers, the NAL unit header information includes nal_unit_type, and the encoding means includes: , Nal_unit_type is determined to uniquely indicate whether the encoded picture data is used for reference when decoding other pictures of the same temporal layer.
また、本発明に係る動画像予測復号装置は、動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力手段と、NALユニットヘッダ情報及び圧縮画像データを復元する復号手段と、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、復元されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、復号手段は、nal_unit_typeに基づいて、圧縮画像データを復元する。 The video predictive decoding apparatus according to the present invention includes an input unit that inputs compressed image data in which a plurality of pictures constituting a video is encoded and encapsulated in a NAL unit together with NAL unit header information; Decoding means for restoring unit header information and compressed image data, and a plurality of pictures constituting a moving image are classified into a plurality of temporal layers, and the restored picture data is the same as the NAL unit header information. The decoding means includes nal_unit_type that uniquely indicates whether the picture is used for reference when decoding other pictures in the temporal layer, and the decoding means restores the compressed image data based on nal_unit_type.
本発明に係る動画像予測符号化方法は、動画像を構成する複数のピクチャを入力する入力ステップと、ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化ステップと、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、nal_unit_typeを含み、符号化ステップは、nal_unit_typeを、符号化されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する。 The moving picture predictive coding method according to the present invention includes an input step for inputting a plurality of pictures constituting a moving picture, a picture is coded, compressed picture data is generated, and is encapsulated in a NAL unit together with NAL unit header information. A plurality of pictures constituting a moving image are classified into a plurality of temporal layers, the NAL unit header information includes nal_unit_type, and the encoding step includes nal_unit_type encoded pictures. It is determined to uniquely indicate whether the data is used for reference in decoding other pictures of the same temporal layer.
本発明に係る動画像予測復号方法は、動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力ステップと、NALユニットヘッダ情報及び圧縮画像データを復元する復号ステップと、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、復元されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、復号ステップは、nal_unit_typeに基づいて、圧縮画像データを復元する。 The video predictive decoding method according to the present invention includes an input step of inputting compressed image data in which a plurality of pictures constituting a video are encoded and encapsulated in a NAL unit together with NAL unit header information, and a NAL unit header A decoding step for restoring information and compressed image data, wherein a plurality of pictures constituting a moving image are classified into a plurality of temporal layers, and the NAL unit header information includes the same temporal It includes nal_unit_type that uniquely indicates whether it is used for reference when decoding other pictures of the layer, and the decoding step restores the compressed image data based on nal_unit_type.
本発明に係る動画像予測符号化プログラムは、動画像を構成する複数のピクチャを入力する入力モジュールと、ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化モジュールと、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、nal_unit_typeを含み、符号化モジュールは、nal_unit_typeを、符号化されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する。 A moving picture predictive coding program according to the present invention encodes a picture by inputting an input module that inputs a plurality of pictures constituting the moving picture, generates compressed image data, and encapsulates the NAL unit together with NAL unit header information. A plurality of pictures constituting a moving image are classified into a plurality of temporal layers, the NAL unit header information includes nal_unit_type, and the encoding module encodes nal_unit_type. It is determined to uniquely indicate whether the data is used for reference in decoding other pictures of the same temporal layer.
本発明に係る動画像予測復号プログラムは、動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力モジュールと、NALユニットヘッダ情報及び圧縮画像データを復元する復号モジュールと、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、復元されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、復号モジュールは、nal_unit_typeに基づいて、圧縮画像データを復元する。 The moving picture predictive decoding program according to the present invention includes an input module for inputting compressed image data in which a plurality of pictures constituting a moving picture are encoded and encapsulated in the NAL unit together with NAL unit header information, and a NAL unit header. A decoding module that restores information and compressed image data, wherein a plurality of pictures constituting a moving image are classified into a plurality of temporal layers, and the NAL unit header information includes the same temporal The decoding module restores the compressed image data based on nal_unit_type, including nal_unit_type that uniquely indicates whether or not the picture is used for reference when decoding other pictures of the layer.
本発明に係る動画像予測符号化装置は、動画像を構成する複数のピクチャを入力する入力手段と、ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化手段と、を具備し、NALユニットヘッダ情報は、nal_unit_typeを含み、符号化手段は、nal_unit_typeを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する。 The moving picture predictive coding apparatus according to the present invention inputs a plurality of pictures constituting a moving picture, encodes the pictures, generates compressed picture data, and encapsulates the NAL units together with NAL unit header information. Encoding means, the NAL unit header information includes nal_unit_type, and the encoding means uses nal_unit_type to determine whether encoded picture data is used for reference when decoding other pictures. It is determined so as to uniquely indicate whether or not.
本発明に係る動画像予測復号装置は、動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力手段と、NALユニットヘッダ情報及び圧縮画像データを復元する復号手段と、を具備し、NALユニットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、復号手段は、nal_unit_typeに基づいて、圧縮画像データを復号する。 The moving picture predictive decoding apparatus according to the present invention includes an input means for inputting compressed image data in which a plurality of pictures constituting a moving picture are encoded and encapsulated in a NAL unit together with NAL unit header information, and a NAL unit header. Decoding means for restoring information and compressed image data, and the NAL unit header information uniquely indicates whether the restored picture data is used for reference when decoding other pictures. nal_unit_type is included, and the decoding unit decodes the compressed image data based on nal_unit_type.
本発明に係る動画像予測復号装置における復号手段は、nal_unit_typeと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、圧縮画像データを復号することとしてもよい。 The decoding means in the moving picture predictive decoding apparatus according to the present invention has previously associated nal_unit_type and information indicating whether or not the restored picture data is used for reference when decoding other pictures. The compressed image data may be decoded based on the stored correspondence table.
本発明に係る動画像予測符号化方法は、動画像を構成する複数のピクチャを入力する入力ステップと、ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化ステップと、を具備し、NALユニットヘッダ情報は、nal_unit_typeを含み、符号化ステップは、nal_unit_typeを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する。 The moving picture predictive coding method according to the present invention includes an input step for inputting a plurality of pictures constituting a moving picture, a picture is coded, compressed picture data is generated, and is encapsulated in a NAL unit together with NAL unit header information. The NAL unit header information includes nal_unit_type, and the encoding step uses nal_unit_type to determine whether the encoded picture data is used for reference when decoding other pictures. It is determined so as to uniquely indicate whether or not.
本発明に係る動画像予測復号方法は、動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力ステップと、NALユニットヘッダ情報及び圧縮画像データを復元する復号ステップと、を具備し、NALユニットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、復号ステップは、nal_unit_typeに基づいて、圧縮画像データを復号する。 The video predictive decoding method according to the present invention includes an input step of inputting compressed image data in which a plurality of pictures constituting a video are encoded and encapsulated in a NAL unit together with NAL unit header information, and a NAL unit header A decoding step for restoring information and compressed image data, and the NAL unit header information uniquely indicates whether the restored picture data is used for reference when decoding other pictures. nal_unit_type is included, and the decoding step decodes the compressed image data based on nal_unit_type.
本発明に係る動画像予測復号方法における復号ステップは、nal_unit_typeと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、圧縮画像データを復号することとしてもよい。 In the decoding step in the video predictive decoding method according to the present invention, nal_unit_type is associated with information indicating whether or not the restored picture data is used for reference when decoding other pictures. The compressed image data may be decoded based on the stored correspondence table.
101…入力端子、102…ブロック分割器、103…予測信号生成器、104…フレームメモリ、105…減算器、106…変換器、107…量子化器、108…逆量子化器、109…逆変換器、110…加算器、111…エントロピー符号化器、112…出力端子、113…入力端子、201…入力端子、202…データ解析器、203…逆量子化器、204…逆変換器、205…加算器、206…出力端子、207…フレームメモリ、208…予測信号生成器。
DESCRIPTION OF
Claims (4)
動画像を構成する複数のピクチャのための圧縮画像データであって、リファレンス・ピクチャ・セット(RPS)を含み、NALユニットヘッダ情報とともにNALユニットにカプセル化された圧縮画像データを入力する入力ステップと、
前記NALユニットヘッダ情報及び前記RPSを復号し、前記圧縮画像データを再生画像データとして復元する復号ステップと、
を含み、
前記動画像を構成する前記複数のピクチャは、複数のテンポラル・レイヤに分類され、
前記RPSは、関連するピクチャの画面間予測に使われるピクチャの組を識別し、
前記NALユニットヘッダ情報は、前記再生画像データが、同じテンポラル・レイヤの他のピクチャを復号する際に画面間予測に使われるか否かを一意に示すnal_unit_typeを含み、
前記他のピクチャの前記RPSは、同じテンポラル・レイヤの非参照ピクチャを含まない、
動画像予測復号方法。 A video predictive decoding method executed by a video predictive decoding device,
An input step for inputting compressed image data for a plurality of pictures constituting a moving image, including a reference picture set (RPS) and encapsulated in a NAL unit together with NAL unit header information; ,
A decoding step of decoding the NAL unit header information and the RPS, and restoring the compressed image data as reproduced image data;
Including
The plurality of pictures constituting the moving image are classified into a plurality of temporal layers,
The RPS identifies a set of pictures used for inter-picture prediction of related pictures;
The NAL unit header information includes nal_unit_type that uniquely indicates whether or not the reproduced image data is used for inter-screen prediction when decoding other pictures of the same temporal layer.
The RPS of the other pictures does not include non-reference pictures of the same temporal layer;
Video predictive decoding method.
復号順の前記後続のピクチャの前記RPSは、同じテンポラル・レイヤの非参照ピクチャを含まない、
請求項1に記載の動画像予測復号方法。 The NAL unit header information includes nal_unit_type that uniquely indicates whether the reproduced image data is used in decoding order for inter-picture prediction in decoding of subsequent pictures of the same temporal layer,
The RPS of the subsequent pictures in decoding order does not include non-reference pictures of the same temporal layer;
The moving picture predictive decoding method according to claim 1.
前記NALユニットヘッダ情報及び前記RPSを復号し、前記圧縮画像データを再生画像データとして復元する復号手段と、
を具備し、
前記動画像を構成する前記複数のピクチャは、複数のテンポラル・レイヤに分類され、
前記RPSは、関連するピクチャの画面間予測に使われるピクチャの組を識別し、
前記NALユニットヘッダ情報は、前記再生画像データが、同じテンポラル・レイヤの他のピクチャを復号する際に画面間予測に使われるか否かを一意に示すnal_unit_typeを含み、
前記他のピクチャの前記RPSは、同じテンポラル・レイヤの非参照ピクチャを含まない、
動画像予測復号装置。 Input means for inputting compressed image data for a plurality of pictures constituting a moving image, including a reference picture set (RPS) and encapsulated in a NAL unit together with NAL unit header information ,
Decoding means for decoding the NAL unit header information and the RPS and restoring the compressed image data as reproduced image data;
Comprising
The plurality of pictures constituting the moving image are classified into a plurality of temporal layers,
The RPS identifies a set of pictures used for inter-picture prediction of related pictures;
The NAL unit header information includes nal_unit_type that uniquely indicates whether or not the reproduced image data is used for inter-screen prediction when decoding other pictures of the same temporal layer.
The RPS of the other pictures does not include non-reference pictures of the same temporal layer;
Video predictive decoding apparatus.
復号順の前記後続のピクチャの前記RPSは、同じテンポラル・レイヤの非参照ピクチャを含まない、
請求項3に記載の動画像予測復号装置。
The NAL unit header information includes nal_unit_type that uniquely indicates whether the reproduced image data is used in decoding order for inter-picture prediction in decoding of subsequent pictures of the same temporal layer,
The RPS of the subsequent pictures in decoding order does not include non-reference pictures of the same temporal layer;
The moving picture predictive decoding apparatus according to claim 3.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016224323A JP6272979B2 (en) | 2016-11-17 | 2016-11-17 | Moving picture predictive decoding method and moving picture predictive decoding apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016224323A JP6272979B2 (en) | 2016-11-17 | 2016-11-17 | Moving picture predictive decoding method and moving picture predictive decoding apparatus |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016022435A Division JP6046843B2 (en) | 2016-02-09 | 2016-02-09 | Moving picture predictive coding apparatus, moving picture predictive coding method, moving picture predictive decoding apparatus, and moving picture predictive decoding method |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018000129A Division JP6430045B2 (en) | 2018-01-04 | 2018-01-04 | Video predictive encoding method and video predictive decoding method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017034729A true JP2017034729A (en) | 2017-02-09 |
JP6272979B2 JP6272979B2 (en) | 2018-01-31 |
Family
ID=57986495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016224323A Active JP6272979B2 (en) | 2016-11-17 | 2016-11-17 | Moving picture predictive decoding method and moving picture predictive decoding apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6272979B2 (en) |
-
2016
- 2016-11-17 JP JP2016224323A patent/JP6272979B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP6272979B2 (en) | 2018-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019206084B2 (en) | Video predictive encoding device, video predictive encoding method, video predictive encoding program, video predictive decoding device, video predictive decoding method, and video predictive decoding program | |
JP5698644B2 (en) | Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program | |
JP6430045B2 (en) | Video predictive encoding method and video predictive decoding method | |
JP6272979B2 (en) | Moving picture predictive decoding method and moving picture predictive decoding apparatus | |
JP6046843B2 (en) | Moving picture predictive coding apparatus, moving picture predictive coding method, moving picture predictive decoding apparatus, and moving picture predictive decoding method | |
JP5711416B2 (en) | Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6272979 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |