JP5950726B2 - Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program - Google Patents
Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program Download PDFInfo
- Publication number
- JP5950726B2 JP5950726B2 JP2012146095A JP2012146095A JP5950726B2 JP 5950726 B2 JP5950726 B2 JP 5950726B2 JP 2012146095 A JP2012146095 A JP 2012146095A JP 2012146095 A JP2012146095 A JP 2012146095A JP 5950726 B2 JP5950726 B2 JP 5950726B2
- Authority
- JP
- Japan
- Prior art keywords
- description information
- buffer description
- information
- decoding
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 134
- 238000012545 processing Methods 0.000 claims description 25
- 238000003672 processing method Methods 0.000 claims description 17
- 230000015654 memory Effects 0.000 description 38
- 238000007726 management method Methods 0.000 description 30
- 238000013469 resistive pulse sensing Methods 0.000 description 17
- 230000014509 gene expression Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013144 data compression Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Description
本発明は、動画像予測符号化方法、装置及びプログラム、並びに、動画像予測復号方法、装置及びプログラムに関するもので、とりわけ、画面間の予測符号化に用いられる参照画像のバッファ内の記述に関するものである。 The present invention relates to a moving picture predictive coding method, apparatus and program, and a moving picture predictive decoding method, apparatus and program, and particularly relates to a description in a buffer of a reference picture used for predictive coding between screens. It is.
動画像データの伝送や蓄積を効率よく行うために、圧縮符号化技術が用いられる。動画像の場合ではMPEG1〜4やH.261〜H.264の方式が広く用いられている。 In order to efficiently transmit and store moving image data, a compression encoding technique is used. In the case of moving images, MPEG1-4 and H.264 are used. 261-H. H.264 is widely used.
これらの符号化方式では、符号化の対象となる画像を複数のブロックに分割した上で符号化・復号処理を行う。符号化効率を高めるため下記のような予測符号化方法が用いられる。画面内の予測符号化では、対象ブロックと同じ画面内にある隣接する既再生の画像信号(過去に圧縮された画像データを復元したもの)を用いて予測信号を生成した上で、それを対象ブロックの信号から引き算した差分信号を符号化する。画面間の予測符号化では、対象ブロックと異なる画面内にある既再生の画像信号を参照し、信号の変位を検索し、その動いた分を補償して予測信号を生成し、それを対象ブロックの信号から引き算した差分信号を符号化する。動きの検索・補償を行うために参照される既再生の画像を、参照画像という。 In these encoding methods, encoding / decoding processing is performed after an image to be encoded is divided into a plurality of blocks. In order to increase the encoding efficiency, the following predictive encoding method is used. In predictive coding within a screen, a predicted signal is generated using an adjacent reproduced image signal (reconstructed image data compressed in the past) in the same screen as the target block, and then the target signal is processed. The differential signal subtracted from the block signal is encoded. In predictive coding between screens, reference is made to a previously-reproduced image signal in a different screen from the target block, signal displacement is searched, the motion is compensated, and a predicted signal is generated, and the target block is generated. The difference signal subtracted from the signal is encoded. An already reproduced image that is referred to for motion search / compensation is referred to as a reference image.
非特許文献1に示される画面間予測符号化では、対象ブロックに対する予測信号は、過去に符号化した上で再生された複数の参照画像を参照し、動き検索しながら誤差の最も少ない画像信号を最適な予測信号として選択する。対象ブロックの画素信号とこの最適な予測信号との差分を求め、離散コサイン変換を施し、量子化した上でエントロピー符号化する。同時に、対象ブロックに対する最適な予測信号をどの参照画像から取得するかに関する情報(「参照インデックス」という)、および当該最適な予測信号を参照画像のどの領域から取得するかに関する情報(「動きベクトル」という)も合わせて符号化する。非特許文献1では、再生された複数枚の画像(例えば4ないし5枚)が参照画像としてフレームメモリまたは再生画像バッファ(decoded picture buffer、以下「DBP」ともいう)に格納されている。
In the inter-screen predictive coding shown in
複数枚の参照画像の管理方法として、再生された複数の画像の中で最も古い参照画像(即ち、時間的に一番長い間バッファ内にあるもの)が占領する領域をバッファから開放し、最近に復号された再生画像を参照画像として格納する手法もあるが、非特許文献1には対象画像に最適な参照画像を柔軟に用意する参照画像の管理方法が開示されている。
As a method of managing a plurality of reference images, an area occupied by the oldest reference image (that is, the one that has been in the buffer for the longest time) among a plurality of reproduced images is released from the buffer. Although there is a method of storing the decoded image as a reference image, Non-Patent
非特許文献1によれば、バッファに格納する複数参照画像の組を記述する情報(Reference picture set、以下「RPS」とよぶ、バッファ記述情報ともよぶ)を各対象画像の符号化データに付加して符号化する。RPS情報には、対象画像並びにそれ以降の画像の処理(符号化または復号)に必要とする複数の参照画像のピクチャ番号に関連する情報が記載されている。符号化装置もしくは復号装置では、RPS情報に従い、指定された再生画像をバッファ(フレームメモリ)に格納するようにバッファが管理される。一方、指定されていない再生画像はバッファから消してよい。非特許文献1では、対象画像を1つ以上の区間に分割したスライスと呼ばれる単位で画面内符号化/復号と画面間符号化/復号を切り替えられるため、スライスのヘッダ情報にてRPS情報を符号化/復号する。スライスについては、非特許文献1に記載されている。
According to Non-Patent
RPS情報は、対象画像を識別するピクチャ番号(picture output count、以下「POC」とよぶ)と、対象画面の画面間予測に使われる複数の参照画像を識別するPOCとの間の関連を示す情報にて構成される。この関連情報は、各参照画像のPOCと対象画像のPOCとの差分であり、本明細書ではDeltaPocと表す。 The RPS information is information indicating a relationship between a picture number for identifying a target image (picture output count, hereinafter referred to as “POC”) and a POC for identifying a plurality of reference images used for inter-screen prediction of the target screen. Consists of. This related information is the difference between the POC of each reference image and the POC of the target image, and is represented as DeltaPoc in this specification.
図9と図10でRPS情報の例を説明する。図9は、対象画像と各対象画像を処理する際にフレームメモリ内にある複数参照画像の状態を示す。各升目には、画像を識別するPOCが書かれている。例えば、行1610では、POC=32の対象画像を処理(符号化または復号)する際に、フレームメモリにPOC=18,20,22,24の参照画像が格納されていることを意味する。また、図9に対するRPSを図10に示す。1701はRPS情報を識別するための識別子idxを示し、1704の下にある各升目はRPS情報の要素であるDeltaPocの値を示す。
An example of RPS information will be described with reference to FIGS. FIG. 9 shows a target image and a state of a plurality of reference images in the frame memory when each target image is processed. Each cell has a POC that identifies the image. For example, in
RPS情報の符号化には、2つの方法がある。1つは、インターRPS(Inter RPS method)と呼び、既符号化/復号のRPSを参照し、符号化対象のRPSと既符号化のRPSとの関係を予測符号化/復号する方法である。2つは、イントラRPS(Intra RPS method)と呼び、符号化対象のRPSに含まれるDeltaPocの数と値を参照なしで符号化/復号する方法である。本明細書では、1つのRPSに含まれるDeltaPocの組をDeltaPoc[idx][i]と示す。ここで、iはフレームメモリに格納されるi番目の参照画像を示しており、idxは、特定のRPSを識別するための番号を示す。以下では、[i]を省略して記載する場合がある。 There are two methods for encoding RPS information. One is a method called inter RPS (Inter RPS method), which refers to pre-encoded / decoded RPS and predictively encodes / decodes the relationship between the RPS to be encoded and the pre-encoded RPS. The second is called an intra RPS (Intra RPS method), which encodes / decodes the number and value of DeltaPoc included in the RPS to be encoded without reference. In this specification, a set of DeltaPocs included in one RPS is denoted as DeltaPoc [idx] [i]. Here, i indicates the i-th reference image stored in the frame memory, and idx indicates a number for identifying a specific RPS. In the following description, [i] may be omitted.
非対称文献1では、複数スライスに関するRPS情報をまとめて、共通に適用する復号処理のパラメータを運ぶSPS(sequence parameter set)情報に含めて符号化/復号する。スライスヘッダでは、SPSにて符号化/復号したRPS情報の識別子idxを符号化/復号するか、新たなRPS情報を符号化/復号する。
In
図7に、識別子idxで識別されるRPS情報を符号化/復号するためのシンタックステーブルshort_term_ref_pic_set(idx)を示す。SPSで符号化/復号するRPS情報の個数はnum_short_term_ref_pic_setsとしてSPSにて符号化/復号される。つまり、RPSの識別情報idxは0からnum_short_term_ref_pic_sets-1の値で識別される。 FIG. 7 shows a syntax table short_term_ref_pic_set (idx) for encoding / decoding RPS information identified by an identifier idx. The number of RPS information encoded / decoded by SPS is encoded / decoded by SPS as num_short_term_ref_pic_sets. That is, the RPS identification information idx is identified by a value from 0 to num_short_term_ref_pic_sets-1.
inter_ref_pic_set_prediction_flag (R100)は、idxで識別される符号化/復号対象のRPS情報の符号化/復号方法がイントラRPSかインターRPSかを識別するためのシンタックス要素である。このフラグが0の場合には、イントラRPS法でDeltaPoc[idx][i]が符号化/復号される。つまり、符号化/復号対象のRPSに含まれる参照画像の個数と各参照画像に対応するDeltaPocの値を符号化/復号する。例えば、図10のidx=0で識別されるRPS(1710)をイントラRPSで符号化/復号する場合には、DeltaPosの個数4と4個のDeltaPocの値(−14、−12、−10、−8)が符号化/復号される。 inter_ref_pic_set_prediction_flag (R100) is a syntax element for identifying whether the encoding / decoding method of the RPS information to be encoded / decoded identified by idx is intra RPS or inter RPS. When this flag is 0, DeltaPoc [idx] [i] is encoded / decoded by the intra RPS method. That is, the number of reference images included in the RPS to be encoded / decoded and the value of DeltaPoc corresponding to each reference image are encoded / decoded. For example, when RPS (1710) identified by idx = 0 in FIG. 10 is encoded / decoded with intra RPS, the number of DeltaPos is 4 and the value of 4 DeltaPocs (−14, −12, −10, -8) is encoded / decoded.
inter_ref_pic_set_prediction_flag (R100)が1の場合には、既符号化/復号のRPS情報を参照するインターRPSでDeltaPoc[idx][i]が符号化/復号される。delta_idx_minus1(R110)は、インターRPSの予測処理にて参照するRPS情報の識別子RIdxを特定するためのシンタックス要素である。RIdxは式(1)にて復元される。
RIdx=idx‐(delta_idx_minus1+1) (1)
When inter_ref_pic_set_prediction_flag (R100) is 1, DeltaPoc [idx] [i] is encoded / decoded with inter RPS referring to RPS information of already encoded / decoded. delta_idx_minus1 (R110) is a syntax element for specifying the identifier RIdx of the RPS information referred to in the inter-RPS prediction process. RIdx is restored by equation (1).
RIdx = idx- (delta_idx_minus1 + 1) (1)
シンタックス要素delta_rps_signとabs_delta_rps_minus1 (R120)から、2つのRPSの差分値DeltaRPSが式(2)で導出される。DeltaRPSは、RIdxで識別されるRPSのDeltaPocの組と符号化/復号対象のidxで識別されるDeltaPocの組との差分値を示す。例えば、図10で、RIdx=1、idx=2の場合には、その差分値2がDeltaRPSとして符号化/復号される。つまり、delta_rps_sign=0、abs_delta_rps_minus1=1が符号化/復号される。
DeltaRPS=(1‐(delta_rps_sign<<1))*(abs_delta_rps_minus1+1) (2)
From the syntax elements delta_rps_sign and abs_delta_rps_minus1 (R120), the difference value DeltaRPS between the two RPSs is derived by equation (2). DeltaRPS indicates a difference value between a DeltaPoc set of RPS identified by RIdx and a DeltaPoc set identified by idx to be encoded / decoded. For example, in FIG. 10, when RIdx = 1 and idx = 2, the
DeltaRPS = (1- (delta_rps_sign << 1)) * (abs_delta_rps_minus1 + 1) (2)
シンタックス要素R130にて、idxで識別されるRPS情報、すなわちDeltaPoc[idx][i]が導出される。具体的には、NumDeltaPocs[RIdx]は、RIdxで識別されるRPS情報に含まれるDeltaPocの個数(図10の1702)を示しており、DeltaPoc[idx][0]からDeltaPoc[idx][NumDeltaPocs[RIdx]]がfor文による繰り返し処理にて導出される。 In syntax element R130, RPS information identified by idx, that is, DeltaPoc [idx] [i] is derived. Specifically, NumDeltaPocs [RIdx] indicates the number of DeltaPocs (1702 in FIG. 10) included in the RPS information identified by RIdx, and DeltaPoc [idx] [0] to DeltaPoc [idx] [NumDeltaPocs [ RIdx]] is derived by iterative processing using a for statement.
used_by_curr_pic_flag[i]は、i番目の参照画像を対象画像の符号化/復号に利用するか否かを示しており、use_delta_flag[i]は、i番目のDeltaPosの導出にDeltaPoc[RIdx][i]を利用するか否かを示している。ここで、used_by_curr_pic_flag[i]が1の場合、use_delta_flag[i]は1となる。use_delta_flag[i]が1の場合、DeltaPoc[idx][i]は式(3)で導出され、use_delta_flag[i]が0の場合、DeltaPoc[idx][i]は式(4)で導出される。
DeltaPoc[idx][i]=DeltaPoc[RIdx][i]+DeltaRPS (3)
DeltaPoc[idx][i]=DeltaRPS (4)
例えば、図10で、RIdx=1、idx=2の場合には、i=0, 1, 2ではuse_delta_flag[i]=1となり、i=3ではuse_delta_flag[i]=0となる。
used_by_curr_pic_flag [i] indicates whether or not the i-th reference image is used for encoding / decoding the target image, and use_delta_flag [i] is DeltaPoc [RIdx] [i] for derivation of the i-th DeltaPos Indicates whether or not to use. Here, when used_by_curr_pic_flag [i] is 1, use_delta_flag [i] is 1. When use_delta_flag [i] is 1, DeltaPoc [idx] [i] is derived from Equation (3), and when use_delta_flag [i] is 0, DeltaPoc [idx] [i] is derived from Equation (4). .
DeltaPoc [idx] [i] = DeltaPoc [RIdx] [i] + DeltaRPS (3)
DeltaPoc [idx] [i] = DeltaRPS (4)
For example, in FIG. 10, when RIdx = 1 and idx = 2, use_delta_flag [i] = 1 when i = 0, 1, 2, and use_delta_flag [i] = 0 when i = 3.
スライスヘッダにて、新たなRPS情報を符号化/復号する場合には、SPSにて利用されていないidx番号であるnum_short_term_ref_pic_setsをシンタックステーブルの入力値として用いる。つまり、シンタックステーブルshort_term_ref_pic_set(num_short_term_ref_pic_sets)を符号化/復号する。 When new RPS information is encoded / decoded in the slice header, num_short_term_ref_pic_sets which is an idx number not used in the SPS is used as an input value of the syntax table. That is, the syntax table short_term_ref_pic_set (num_short_term_ref_pic_sets) is encoded / decoded.
背景技術で示したRPSの予測手法(インターRPS)は、あらゆるRPSのパターンを表現できる一般的で効率的な方法である。一方、復号装置では、圧縮データのビット列を解析して各要素を復元するとき、過去に復号されたデータの影響を受けずにビット列を解析できると処理が簡易となる。 The RPS prediction method (inter-RPS) shown in the background art is a general and efficient method that can express any RPS pattern. On the other hand, in the decoding device, when restoring each element by analyzing the bit string of the compressed data, the process becomes simple if the bit string can be analyzed without being influenced by the data decoded in the past.
背景技術で示したインターRPSでは、図7に示すシンタックステーブルに、NumDeltaPocs[RIdx]が含まれている。この値は、RIdxによって変化するため、データ解析器がこのRIdxを取得しないと、復号すべき要素(used_by_curr_pic_flagやuse_delta_flag)の数が分からない。そのため、背景技術で示したインターRPSは好ましい方法ではあるが、実用上は圧縮データのビット列の解析処理が複雑になる場合がある。 In the inter-RPS shown in the background art, NumDeltaPocs [RIdx] is included in the syntax table shown in FIG. Since this value changes depending on RIdx, the number of elements (used_by_curr_pic_flag and use_delta_flag) to be decoded is not known unless the data analyzer acquires this RIdx. Therefore, although inter-RPS shown in the background art is a preferable method, in practice, analysis processing of a bit string of compressed data may be complicated.
本発明は上記実情に鑑みてなされたものであり、インターRPSの符号化に要するビット数を削減することにより符号化データの構成を簡潔にし、復号装置における符号化データの解析処理を簡易化することを目的とする。 The present invention has been made in view of the above circumstances, and by simplifying the structure of encoded data by reducing the number of bits required for inter-RPS encoding, the analysis processing of the encoded data in the decoding apparatus is simplified. For the purpose.
本発明に係る動画像予測符号化装置は、動画像を構成する複数の画像を入力する入力手段と、画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化手段と、圧縮画像データを復号し、再生画像に復元する復号手段と、再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上格納する画像格納手段と、画像格納手段を制御するバッファ管理手段と、を具備し、バッファ管理手段は、画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、参照バッファ記述情報の参照画像のピクチャ番号と前記対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、参照バッファ記述情報の各要素と差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した3以上のモードから、対象バッファ記述情報を生成するモード情報を選択し、符号化手段は、識別情報、差分値、モード情報を符号化し、3以上のモードには、少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、3以上のモードは、それぞれ、予測バッファ記述情報から対象バッファ記述情報を生成する異なる処理方法を指し示すことを特徴とする。 The moving image predictive coding apparatus according to the present invention includes an input unit that inputs a plurality of images constituting a moving image, and a predictive code using a plurality of images decoded and reproduced after the images have been coded in the past as reference images. Encoding means for generating compressed image data, decoding means for decoding compressed image data and restoring it to a reproduced image, and one or more reproduced images as reference images used to encode subsequent images Image storage means for storing, and buffer management means for controlling the image storage means, the buffer management means being different from the target buffer description information related to a plurality of reference images used when predictively encoding an image The buffer description information similar to the target buffer description information is searched as reference buffer description information from a plurality of encoded buffer description information, and the reference buffer description information is identified. Generating different information, calculating a difference value between the picture number of the reference image of the reference buffer description information and the picture number of the target image of the target buffer description information, and predicting buffer description from each element and the difference value of the reference buffer description information Information is generated, mode information for generating target buffer description information is selected from three or more modes prepared for generating new buffer description information based on the prediction buffer description information, and the encoding means identifies The information, difference value, and mode information are encoded, and the three or more modes include at least three modes of a first mode, a second mode, and a third mode that perform different processes. Each of the three or more modes is characterized by indicating different processing methods for generating the target buffer description information from the prediction buffer description information .
この動画像予測符号化装置では、背景技術に示したuse_delta_flagのようにRPS情報の各要素に関わる指示情報を符号化する必要がないため、RPS情報の圧縮データをより効率良く符号化することが可能となる。また、対象バッファ記述情報を生成するための方法であって発生頻度が高い方法を、シンタックス要素として予め複数用意しておくことにより、少ない符号要素で効率良く対象バッファ記述情報を符号化することができる。よって、本発明によれば、インターRPSの符号化に要するビット数を削減することにより、符号化データの構成を簡潔にすることができる。 In this moving image predictive encoding device, it is not necessary to encode the instruction information related to each element of the RPS information as in the use_delta_flag shown in the background art, so that the compressed data of the RPS information can be encoded more efficiently. It becomes possible. Also, by preparing in advance a plurality of methods for generating the target buffer description information that are frequently generated as syntax elements, the target buffer description information can be efficiently encoded with a small number of code elements. Can do. Therefore, according to the present invention, the configuration of encoded data can be simplified by reducing the number of bits required for inter-RPS encoding.
また、本発明に係る動画像予測符号化装置において、複数のモードの1つが、予測バッファ記述情報に新要素として差分値を加える処理を行うものであることが好ましい。 In the video predictive coding apparatus according to the present invention, it is preferable that one of the plurality of modes performs a process of adding a difference value as a new element to the prediction buffer description information.
また、本発明に係る動画像予測符号化装置において、複数のモードの1つが、予測バッファ記述情報の要素のうち、値が最小値あるいは最大値の要素を差分値に置き換える処理を行うものであることが好ましい。 In the video predictive coding apparatus according to the present invention, one of the plurality of modes performs processing for replacing the element having the minimum value or the maximum value among the elements of the prediction buffer description information with the difference value. It is preferable.
また、本発明に係る動画像予測符号化装置において、複数のモードの1つが、予測バッファ記述情報を対象バッファ記述情報とする処理を行うものであることが好ましい。 In the moving picture predictive coding apparatus according to the present invention, it is preferable that one of the plurality of modes performs processing using the prediction buffer description information as target buffer description information.
また、本発明に係る動画像予測復号装置は、動画像を構成する複数の画像のそれぞれに対し、過去に復号・再生された複数の画像を参照画像として予測符号化されたデータと、複数の参照画像に関するバッファ記述情報の符号化データとを含む圧縮画像データを入力する入力手段と、圧縮画像データを復号し、再生画像に復元する復号手段と、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納手段と、画像格納手段を制御するバッファ管理手段と、を具備し、復号手段は、再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、参照バッファ記述情報に関するピクチャ番号と対象バッファ記述情報に関するピクチャ番号との差分値を復号し、参照バッファ記述情報と差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、対象バッファ記述情報の復元に用いるモード情報を復号し、予測バッファ記述情報とモード情報に基づいて、対象バッファ記述情報を復号し、バッファ管理手段は、復号された対象バッファ記述情報をもとに画像格納手段を制御し、3以上のモードには、少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、3以上のモードは、それぞれ、予測バッファ記述情報から対象バッファ記述情報を生成する異なる処理方法を指し示し、復号手段は、圧縮画像データを復号してモード情報を復号し、当該モード情報が指し示す処理方法にて、予測バッファ記述情報から対象バッファ記述情報を復号する、ことを特徴とする。 In addition, the video predictive decoding device according to the present invention includes, for each of a plurality of images constituting a video, data that is predictively encoded using a plurality of images decoded and reproduced in the past as reference images, Input means for inputting compressed image data including encoded data of buffer description information relating to a reference image, decoding means for decoding the compressed image data and restoring the reproduced image, and decoding the reproduced image and subsequent images An image storage means for storing one or more reference images used as the reference image, and a buffer management means for controlling the image storage means. The decoding means relates to a plurality of reference images used when decoding the reproduced image. In order to decode the target buffer description information, decoded buffer description information that is different from the target buffer description information and is used for decoding the target buffer description information. Prediction information generated by decoding identification information identifying information as reference buffer description information, decoding a difference value between a picture number related to reference buffer description information and a picture number related to target buffer description information, and the reference buffer description information and the difference value From the three or more modes prepared for generating new buffer description information based on the buffer description information, mode information used for restoring the target buffer description information is decoded, and based on the prediction buffer description information and the mode information, The buffer management means decodes the target buffer description information, and the buffer management means controls the image storage means based on the decoded target buffer description information . The three or more modes include at least a first mode for performing different processes from each other, Three modes of the second mode and the third mode are included, and three or more modes are respectively The decoding means indicates the different processing method for generating the target buffer description information from the measurement buffer description information, the decoding means decodes the compressed image data, decodes the mode information, and from the prediction buffer description information by the processing method indicated by the mode information. The target buffer description information is decoded .
この動画像予測復号装置では、予測バッファ記述情報から対象バッファ記述情報に含まれる要素の個数を取得しなくても、バッファ記述情報に関する圧縮データを解析することができる。また、対象バッファ記述情報を生成するための方法であって発生頻度が高い方法を、シンタックス要素として予め複数用意しておくことにより、少ない符号要素で効率良く対象バッファ記述情報を復号することができる。よって、本発明によれば、復号装置における符号化データの解析処理を簡易化することができる。 In this moving picture predictive decoding apparatus, compressed data related to buffer description information can be analyzed without obtaining the number of elements included in the target buffer description information from the prediction buffer description information. Also, by preparing a plurality of methods for generating the target buffer description information and having a high occurrence frequency as syntax elements in advance, the target buffer description information can be efficiently decoded with a small number of code elements. it can. Therefore, according to the present invention, the analysis processing of the encoded data in the decoding device can be simplified.
また、本発明に係る動画像予測復号装置において、複数のモードの1つが、予測バッファ記述情報に新要素として差分値を加える処理を行うものであることが好ましい。 In the video predictive decoding apparatus according to the present invention, it is preferable that one of the plurality of modes performs a process of adding a difference value as a new element to the prediction buffer description information.
また、本発明に係る動画像予測復号装置において、複数のモードの1つが、予測バッファ記述情報の要素のうち、値が最小値あるいは最大値の要素を差分値に置き換える処理を行うものであることが好ましい。 Further, in the video predictive decoding device according to the present invention, one of the plurality of modes performs processing for replacing the element having the minimum value or the maximum value among the elements of the prediction buffer description information with the difference value. Is preferred.
また、本発明に係る動画像予測復号装置において、複数のモードの1つが、予測バッファ記述情報を対象バッファ記述情報とする処理を行うものであることが好ましい。 In the video predictive decoding apparatus according to the present invention, it is preferable that one of the plurality of modes performs processing using the prediction buffer description information as target buffer description information.
また、本発明に係る動画像予測符号化方法は、動画像を構成する複数の画像を入力する入力ステップと、画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化ステップと、圧縮画像データを復号し、再生画像に復元する復号ステップと、再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、画像格納手段を制御するバッファ管理ステップと、を具備し、バッファ管理ステップにおいて、画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、参照バッファ記述情報の参照画像のピクチャ番号と対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、参照バッファ記述情報と差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した3以上のモードから、対象バッファ記述情報を生成するモード情報を選択し、符号化ステップにおいて、識別情報、差分値、モード情報を符号化し、3以上のモードには、少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、3以上のモードは、それぞれ、予測バッファ記述情報から対象バッファ記述情報を生成する異なる処理方法を指し示すことを特徴とする。 The video predictive encoding method according to the present invention includes an input step of inputting a plurality of images constituting a video, and a plurality of images decoded and reproduced after encoding the images in the past as reference images. An encoding step for predictive encoding and generating compressed image data, a decoding step for decoding compressed image data and restoring it to a reproduced image, and a reproduced image as a reference image used for encoding subsequent images One or more image storage steps stored by the image storage means, and a buffer management step for controlling the image storage means. In the buffer management step, a plurality of reference images used when predictively encoding the image Buffer description information similar to the target buffer description information is referred to from a plurality of encoded buffer description information different from the target buffer description information. Search information as the buffer description information, generating identification information for identifying the reference buffer description information, calculating a difference value between the picture number of the reference image in the reference buffer description information and the picture number of the target image in the target buffer description information, Mode for generating target buffer description information from three or more modes prepared for generating prediction buffer description information from reference buffer description information and difference values and generating new buffer description information based on the prediction buffer description information In the encoding step, the identification information, the difference value, and the mode information are encoded, and the three or more modes include at least a first mode, a second mode, and a third mode that perform at least different processes. The three modes are included. Each of the three or more modes generates target buffer description information from the prediction buffer description information. Wherein the point to different processing methods that.
また、本発明に係る動画像予測符号化プログラムは、動画像を構成する複数の画像を入力する入力モジュールと、画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化モジュールと、圧縮画像データを復号し、再生画像に復元する復号モジュールと、再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上格納する画像格納モジュールと、画像格納モジュールを制御するバッファ管理モジュールと、を具備し、バッファ管理モジュールは、画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、前記対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、参照バッファ記述情報の参照画像のピクチャ番号と対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、参照バッファ記述情報と差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した複数のモードから、対象バッファ記述情報を生成するモード情報を選択し、符号化モジュールは、識別情報、差分値、モード情報を符号化することを特徴とする。 The moving image predictive encoding program according to the present invention includes an input module that inputs a plurality of images constituting a moving image, and a plurality of images that have been decoded and reproduced after having previously encoded the images as reference images. An encoding module that performs predictive encoding and generates compressed image data, a decoding module that decodes compressed image data and restores the image to a reproduced image, and a reproduced image as a reference image used to encode subsequent images An image storage module that stores at least one image, and a buffer management module that controls the image storage module. The buffer management module includes target buffer description information relating to a plurality of reference images used when predictively encoding an image, and The buffer description information similar to the target buffer description information is referred to from a plurality of encoded buffer description information different from each other. Search information as the buffer description information, generating identification information for identifying the reference buffer description information, calculating a difference value between the picture number of the reference image in the reference buffer description information and the picture number of the target image in the target buffer description information, Mode information for generating target buffer description information from a plurality of modes prepared for generating prediction buffer description information from reference buffer description information and difference values, and generating new buffer description information based on the prediction buffer description information And the encoding module encodes the identification information, the difference value, and the mode information.
当該動画像予測符号化方法及び動画像予測符号化プログラムは、上述の動画像予測符号化装置と同様な効果を奏することができる。 The moving picture predictive coding method and the moving picture predictive coding program can achieve the same effects as the above-described moving picture predictive coding apparatus.
また、本発明に係る動画像予測復号方法は、動画像を構成する複数の画像のそれぞれに対し、過去に復号・再生された複数の画像を参照画像として予測符号化されたデータと、複数の参照画像に関するバッファ記述情報の符号化データとを含む圧縮画像データを入力する入力ステップと、圧縮画像データを復号し、再生画像に復元する復号ステップと、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、画像格納手段を制御するバッファ管理ステップと、を具備し、復号ステップにおいて、再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、参照バッファ記述情報に関するピクチャ番号と対象バッファ記述情報に関するピクチャ番号との差分値を復号し、参照バッファ記述情報と差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、対象バッファ記述情報の復元に用いるモード情報を復号し、予測バッファ記述情報とモード情報に基づいて、対象バッファ記述情報を復号し、バッファ管理ステップにおいて、復号された対象バッファ記述情報をもとに画像格納手段を制御し、3以上のモードには、少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、3以上のモードは、それぞれ、予測バッファ記述情報から対象バッファ記述情報を生成する異なる処理方法を指し示し、復号ステップでは、圧縮画像データを復号してモード情報を復号し、当該モード情報が指し示す処理方法にて、予測バッファ記述情報から対象バッファ記述情報を復号する、ことを特徴とする。また、第1のモードは、予測バッファ記述情報に新要素として前記差分値を加える処理を行うモードであり、第2のモードは、予測バッファ記述情報の要素のうち、所定の要素を前記差分値に置き換える処理を行うモードであり、第3のモードは、予測バッファ記述情報を対象バッファ記述情報とする処理を行うモードであってもよい。また、第2のモードは、予測バッファ記述情報の要素のうち、値が最小値あるいは最大値の要素を前記差分値に置き換える処理を行うモードであってもよい。また、復号ステップでは、対象バッファ記述情報にて管理される再生画像が、対象画像の予測処理に利用されるか、或いは、将来の画像の予測処理に利用されるか、を示す利用情報の組をモード情報として復号してもよい。また、3以上のモードは、それぞれ、2ビット又は3ビット以上の情報から一意に特定され、復号ステップでは、前述の2ビット又は3ビット以上の情報から、少なくとも3つ以上のモードを選択して利用してもよい。 In addition, the moving picture predictive decoding method according to the present invention includes, for each of a plurality of pictures constituting a moving picture, a plurality of data that are predictively encoded using a plurality of pictures decoded and reproduced in the past as reference pictures, An input step for inputting compressed image data including encoded data of buffer description information relating to a reference image, a decoding step for decoding the compressed image data and restoring it to a reproduced image, and for decoding the reproduced image and subsequent images One or more reference images used for the image storage, an image storage step for storing by the image storage means, and a buffer management step for controlling the image storage means, and a plurality of reference images used for decoding the reproduced image in the decoding step In order to decode the target buffer description information related to the reference image, the decoded buffer description information is different from the target buffer description information. Decoding the identification information for identifying the buffer description information used for decoding the target buffer description information as the reference buffer description information, decoding the difference value between the picture number related to the reference buffer description information and the picture number related to the target buffer description information. Decoding mode information used for restoring the target buffer description information from three or more modes prepared for generating new buffer description information based on the buffer description information and the prediction buffer description information generated from the difference value; Based on the prediction buffer description information and the mode information, the target buffer description information is decoded. In the buffer management step, the image storage means is controlled based on the decoded target buffer description information. , A first mode, a second mode, and a third mode for performing different processes Three modes are included, and each of the three or more modes indicates different processing methods for generating the target buffer description information from the prediction buffer description information. In the decoding step, the compressed image data is decoded to decode the mode information. The target buffer description information is decoded from the prediction buffer description information by the processing method indicated by the mode information. The first mode is a mode in which the difference value is added as a new element to the prediction buffer description information, and the second mode is a predetermined element among the elements of the prediction buffer description information. The third mode may be a mode for performing processing using the prediction buffer description information as target buffer description information. In addition, the second mode may be a mode in which, among the elements of the prediction buffer description information, a process of replacing an element having a minimum value or a maximum value with the difference value. In the decoding step, a set of usage information indicating whether the reproduced image managed by the target buffer description information is used for prediction processing of the target image or for prediction processing of a future image. May be decoded as mode information. Each of the three or more modes is uniquely identified from information of 2 bits or 3 bits, and in the decoding step, at least 3 modes are selected from the information of 2 bits or 3 bits or more. May be used.
また、本発明に係る動画像予測復号プログラムは、動画像を構成する複数の画像のそれぞれに対し、過去に復号・再生された複数の画像を参照画像として予測符号化されたデータと、複数の参照画像に関するバッファ記述情報の符号化データとを含む圧縮画像データを入力する入力モジュールと、圧縮画像データを復号し、再生画像に復元する復号モジュールと、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納モジュールと、画像格納モジュールを制御するバッファ管理モジュールと、を具備し、復号モジュールは、再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、参照バッファ記述情報に関するピクチャ番号と前記対象バッファ記述情報に関するピクチャ番号との差分値を復号し、参照バッファ記述情報と前記差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、対象バッファ記述情報の復元に用いるモード情報を復号し、予測バッファ記述情報と前記モード情報に基づいて、対象バッファ記述情報を復号し、バッファ管理モジュールは、復号された対象バッファ記述情報をもとに画像格納モジュールを制御し、3以上のモードには、少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、3以上のモードは、それぞれ、予測バッファ記述情報から対象バッファ記述情報を生成する異なる処理方法を指し示し、復号手段は、圧縮画像データを復号してモード情報を復号し、当該モード情報が指し示す処理方法にて、予測バッファ記述情報から対象バッファ記述情報を復号する、ことを特徴とする。 In addition, the moving picture predictive decoding program according to the present invention includes, for each of a plurality of pictures constituting a moving picture, a plurality of pieces of data that are predictively encoded using a plurality of pictures decoded and reproduced in the past as reference pictures, An input module for inputting compressed image data including encoded data of buffer description information relating to a reference image, a decoding module for decoding the compressed image data and restoring it to a reproduced image, and for decoding the reproduced image and subsequent images An image storage module for storing one or more reference images used for the image storage, and a buffer management module for controlling the image storage module, and the decoding module is related to a plurality of reference images used for decoding the reproduced image. In order to decode the target buffer description information, the decoded buffer description information is different from the target buffer description information. Decoding identification information for identifying buffer description information used for decoding buffer description information as reference buffer description information; decoding a difference value between a picture number related to reference buffer description information and a picture number related to the target buffer description information; and Decoding mode information used to restore the target buffer description information from three or more modes prepared for generating new buffer description information based on the description information and the prediction buffer description information generated from the difference value; The target buffer description information is decoded based on the prediction buffer description information and the mode information, and the buffer management module controls the image storage module based on the decoded target buffer description information . At least a first mode, a second mode, and a third mode for performing different processes from each other Three modes are included, and each of the three or more modes indicates different processing methods for generating the target buffer description information from the prediction buffer description information, and the decoding means decodes the compressed image data to obtain the mode information. And the target buffer description information is decoded from the prediction buffer description information by the processing method indicated by the mode information .
当該動画像予測復号方法及び動画像予測復号プログラムは、上述の動画像予測復号装置と同様な効果を奏することができる。 The moving picture predictive decoding method and the moving picture predictive decoding program can achieve the same effects as the above-described moving picture predictive decoding apparatus.
本発明のReference picture set(RPS)の符号化/復号方法によれば、インターRPSの符号化に要するビット数がさらに削減される。また、符号化データの構成が簡潔になるため、復号装置における符号化データの解析処理が簡易化される。 According to the reference picture set (RPS) encoding / decoding method of the present invention, the number of bits required for inter-RPS encoding is further reduced. In addition, since the configuration of the encoded data is simplified, the analysis processing of the encoded data in the decoding device is simplified.
以下、本発明の実施の形態について、図1から図14を用いて説明する。 Hereinafter, embodiments of the present invention will be described with reference to FIGS.
図1は本発明の実施形態による動画像予測符号化装置100を示すブロック図である。図1に示すように、動画像予測符号化装置100は、入力端子101、ブロック分割器102、予測信号生成器103、フレームメモリ104、減算器105、変換器106、量子化器107、逆量子化器108、逆変換器109、加算器110、エントロピー符号化器111、出力端子112、およびバッファ管理器114を備える。入力端子101は特許請求の範囲に記載された「入力手段」に対応する。減算器105、変換器106、量子化器107とエントロピー符号化器111は、特許請求の範囲に記載された「符号化手段」に対応する。また、逆量子化器108、逆変換器109と加算器110は、特許請求の範囲に記載された「復号手段」に対応する。フレームメモリ104は「画像格納手段」、バッファ管理器114は「バッファ管理手段」に対応する。
FIG. 1 is a block diagram showing a moving picture predictive coding apparatus 100 according to an embodiment of the present invention. As shown in FIG. 1, the moving image predictive encoding device 100 includes an
以上のように構成された動画像予測符号化装置100について、以下その動作を述べる。複数枚の画像からなる動画像の信号は入力端子101に入力される。符号化の対象となる画像はブロック分割器102にて、複数の領域に分割される。本発明による実施形態では、8x8の画素からなるブロックに分割されるが、それ以外のブロックの大きさまたは形に分割してもよい。また、複数のブロックサイズや形が1画面に混在してもよい。次に符号化処理の対象となる領域(以下対象ブロックとよぶ)に対して、予測信号を生成する。本発明による実施形態では、画面間予測と画面内予測の2種類の予測方法を用いる。
The operation of the moving picture predictive coding apparatus 100 configured as described above will be described below. A moving image signal composed of a plurality of images is input to the
画面間予測では、過去に符号化されたのちに復元された再生画像を参照画像として、この参照画像から対象ブロックに対する誤差の最も小さい予測信号を与える動き情報を求める。また場合に応じて、対象ブロックを再分割し、再分割された小領域に対し画面間予測方法を決定してもよい。この場合、各種の分割方法の中から、対象ブロック全体に対し最も効率のよい分割方法及びそれぞれの動き情報を決定する。本発明による実施形態では、予測信号生成器103にて行われ、対象ブロックはラインL102、参照画像はL104経由で入力される。参照画像としては、過去に符号化され復元された複数枚の画像を参照画像として用いる。詳細は従来の技術であるH.264あるいは非特許文献1に示した方法と同じである。このように決定された動き情報及び小領域の分割方法はラインL112経由でエントロピー符号化器111に送られ符号化した上で出力端子112から送出される。また複数の参照画像の中で、予測信号がどの参照画像から取得するかに関する情報(リファレンスインデックス)もラインL112経由でエントロピー符号化器111に送られる。なお、本発明による実施形態では、3枚ないし6枚の再生画像をフレームメモリ104に格納し、参照画像として用いる。予測信号生成器103では、小領域の分割方法及びそれぞれの小領域に対応する、参照画像と動き情報をもとにフレームメモリ104から参照画像信号を取得し、予測信号を生成する。このように生成された画面間予測信号はラインL103経由で減算器105に送られる。
In inter-screen prediction, a reproduction image that has been encoded in the past and restored as a reference image is used as a reference image to obtain motion information that gives a prediction signal with the smallest error for the target block. Further, according to circumstances, the target block may be subdivided, and the inter-screen prediction method may be determined for the subdivided small area. In this case, the most efficient division method and the respective motion information are determined from the various division methods for the entire target block. In the embodiment according to the present invention, the
画面内予測では、対象ブロックに空間的に隣接する既再生の画素値を用いて画面内予測信号を生成する。具体的には予測信号生成器103では、フレームメモリ104から同じ画面内にある既再生の画素信号を取得し、これらの信号を外挿することによって画面内予測信号を生成する。外挿の方法に関する情報はラインL112経由でエントロピー符号化器111に送られ符号化した上で出力端子112から送出される。このように生成された画面内予測信号は減算器105に送られる。予測信号生成器103における画面内の予測信号生成方法は、従来の技術であるH.264あるいは非特許文献1に示した方法と同じである。上述のように求められた画面間予測信号と画面内予測信号に対し、誤差の最も小さいものが選択され、減算器105に送られる。
In intra-screen prediction, an intra-screen prediction signal is generated using already reproduced pixel values spatially adjacent to the target block. Specifically, the
減算器105にて対象ブロックの信号(ラインL102経由)から予測信号(ラインL103経由)を引き算し、残差信号を生成する。この残差信号は変換器106にて離散コサイン変換され、各変換係数は量子化器107にて量子化される。最後にエントロピー符号化器111にて量子化された変換係数を符号化して、予測方法に関する情報とともに出力端子112より送出される。
The
後続の対象ブロックに対する画面内予測もしくは画面間予測を行うために、圧縮された対象ブロックの信号は逆処理し復元される。すなわち、量子化された変換係数は逆量子化器108にて逆量子化されたのちに逆変換器109にて逆離散コサイン変換され、残差信号を復元する。加算器110にて復元された残差信号とラインL103から送られた予測信号とを加算し、対象ブロックの信号を再生し、フレームメモリ104に格納する。本実施の形態では変換器106と逆変換器109を用いているが、これらの変換器に代わるほかの変換処理を用いてもよい。場合によって、変換器106と逆変換器109がなくてもよい。
In order to perform intra prediction or inter prediction for the subsequent target block, the compressed signal of the target block is inversely processed and restored. That is, the quantized transform coefficient is inversely quantized by the
フレームメモリ104は有限なものであり、すべての再生画像を格納することは不可能である。後続の画像の符号化に用いられる再生画像のみフレームメモリ104に格納される。このフレームメモリ104を制御するのがバッファ管理器114である。入力端子113より各画像の出力順序を示す情報(POC、picture output count)や当該画像を符号化するタイプ(画面内予測符号化、画面間予測符号化)が入力され、この情報に基づいてバッファ管理器114が動作する。バッファ管理器114によって生成される情報であり、バッファに格納されている複数の参照画像の組を記述する情報であるReference picture set (RPS)情報や、各画像のPOC情報はラインL114経由でエントロピー符号化器111に送られ、符号化した上で圧縮された画像データとともに出力される。本発明によるバッファ管理器114の処理方法については後述する。
The
次に、本発明による動画像予測復号方法について説明する。図2は本発明の実施形態による動画像予測復号装置200のブロック図を示す。図2に示すように、動画像予測復号装置200は、入力端子201、データ解析器202、逆量子化器203、逆変換器204、加算器205、予測信号生成器208、フレームメモリ207、出力端子206、およびバッファ管理器209を備える。入力端子201は、特許請求の範囲に記載された「入力手段」に対応する。データ解析器202、逆量子化器203と逆変換器204は、特許請求の範囲に記載された「復号手段」に対応する。復号手段としては上記以外のものを用いてもよい。また逆変換器204がなくてもよい。フレームメモリ207は「画像格納手段」、バッファ管理器209は「バッファ管理手段」に対応する。
Next, the video predictive decoding method according to the present invention will be described. FIG. 2 shows a block diagram of a video predictive decoding apparatus 200 according to an embodiment of the present invention. As shown in FIG. 2, the moving picture predictive decoding apparatus 200 includes an
以上のように構成された動画像予測復号装置200について、以下その動作を述べる。上述した方法で圧縮符号化された圧縮データは入力端子201から入力される。この圧縮データには、画像を複数のブロックに分割された対象ブロックを予測し符号化された残差信号及び予測信号の生成に関連する情報が含まれている。予測信号の生成に関連する情報として、画面間予測の場合はブロック分割に関する情報(ブロックのサイズ)や、動き情報と上述のPOC情報が含まれ、画面内予測の場合は周辺の既再生の画素から外挿方法に関する情報が含まれている。また、圧縮データにはフレームメモリ207を制御するためのRPS情報も含まれている。
The operation of the video predictive decoding apparatus 200 configured as described above will be described below. The compressed data compressed and encoded by the method described above is input from the
データ解析器202は、圧縮データから対象ブロックの残差信号、予測信号の生成に関連する情報、量子化パラメータ、画像のPOC情報を抽出する。対象ブロックの残差信号は逆量子化器203にて量子化パラメータ(ラインL202経由)をもとに逆量子化される。その結果は逆変換器204にて逆離散コサイン変換される。
The data analyzer 202 extracts the residual signal of the target block, information related to generation of the prediction signal, the quantization parameter, and the POC information of the image from the compressed data. The residual signal of the target block is inversely quantized by the
次に、ラインL206b経由で予測信号の生成に関連する情報が予測信号生成器208に送られる。予測信号生成器208では、予測信号の生成に関連する情報に基づいて、フレームメモリ207にアクセスし、複数の参照画像の中から参照信号を取得し予測信号を生成する。この予測信号はラインL208経由で加算器205に送られ、復元された残差信号に加算され、対象ブロック信号を再生し、ラインL205経由で出力すると同時にフレームメモリ207に格納される。
Next, information related to the generation of the prediction signal is sent to the
フレームメモリ207には、後続の画像の復号・再生に用いられる再生画像が格納されている。バッファ管理器209はフレームメモリ207を制御する。バッファ管理器209は、ラインL206a経由で送られるRPS情報と画像の符号化タイプに関する情報に基づいて動作する。本発明によるバッファ管理器209の制御方法については後述する。
The
次に、図8と図3と図5を用いて、RPS情報によるバッファ管理器(図1の114と図2の209)の制御方法ならびにエントロピー符号化器111とデータ解析器202におけるRPS情報の符号化/復号方法を説明していくが、図面の説明準備のため、RPS情報と、そのデータ圧縮方法の考え方について先に説明する。
Next, the control method of the buffer manager (114 in FIG. 1 and 209 in FIG. 2) by the RPS information and the RPS information in the
まず、RPS情報について説明する。本発明の実施形態によるバッファ管理器114(209)では、再生画像バッファ(decoded picture buffer、「DBP」ともいう)、つまりフレームメモリ104(207)を、それに格納する複数の参照画像の組を記述する情報(Reference picture set、以下「RPS」とよぶ、バッファ記述情報ともよぶ)に基づいて管理する。すなわちRPS情報がバッファ管理情報として機能する。そして、RPS情報は図1のエントロピー符号化器111ならびに図2のデータ解析器にて符号化/復号される。
First, RPS information will be described. In the buffer manager 114 (209) according to the embodiment of the present invention, a reproduced picture buffer (also referred to as “DBP”), that is, a frame memory 104 (207), describes a set of a plurality of reference images stored therein. Management based on information (Reference picture set, hereinafter referred to as “RPS”, also referred to as buffer description information). That is, the RPS information functions as buffer management information. The RPS information is encoded / decoded by the
RPS情報は、フレームメモリ207に格納されると共に対象画像あるいは未来に符号化/復号される画像の画面間予測で利用される複数の参照画像を識別するピクチャ番号(picture output count、以下「POC」とよぶ)と、対象画像を識別するPOC番号との関連(差分)を示す情報である。
The RPS information is stored in the
図9と図10でRPS情報の例を説明する。本明細書では、1つの参照画像のPOCと対象画像のPOCの関係をDeltaPocと表す。図9は、対象画像と各対象画像を処理する際にフレームメモリ207内にある複数参照画像の状態を示す。各升目には、画像を識別するPOCが書かれている。例えば、行1610では、POC=32の対象画像を処理(符号化または復号)する際に、フレームメモリにPOC=18,20,22,24の参照画像が格納されていることを意味する。また、図9に対するRPSを図10に示す。1701はRPS情報を識別するための識別子idxを示し、1704の下にある各升目はRPS情報の要素であるDeltaPocの値を示す。
An example of RPS information will be described with reference to FIGS. In this specification, the relationship between the POC of one reference image and the POC of the target image is represented as DeltaPoc. FIG. 9 shows the state of a plurality of reference images in the
次に、RPS情報のデータ圧縮方法の考え方について、概要を説明する。図9に示すように、フレームメモリ207に格納される参照画像の組はフレームを跨いで互いに似通っている。そこで、本実施形態の符号化装置では、複数枚の対象画像のそれぞれに対するRPS情報をまとめて複数個生成し、共通に適用する復号処理のパラメータを運ぶSPS(sequence parameter set)情報またはPPS(picture parameter set)情報の一部として送る。復号装置ではSPS情報またはPPS情報からRPS情報を抽出し、各対象画像の圧縮データ(例えばスライスヘッダのデータ)に指定された一つのRPS情報に基づいて、フレームメモリ内にある参照画像を用意した上で復号・再生処理を行う。RPS情報に記載されていない参照画像はフレームメモリから消され、それ以降参照画像として用いることができない。
Next, an outline of the concept of the data compression method of RPS information will be described. As shown in FIG. 9, the sets of reference images stored in the
上記のとおり、フレームメモリ管理のため対象画像毎に一つのRPS情報を利用するが、非特許文献1の符号化/復号方法では、対象画像を1つ以上の区間に分割したスライス(この単位で画面内符号化/復号と画面間符号化/復号を切り替えられる)のヘッダ情報にて、1つのRPS情報を指示する。スライスについては、非特許文献1に記載されている。
As described above, one RPS information is used for each target image for frame memory management. However, in the encoding / decoding method of
本発明においては、RPS情報は、ピクチャヘッダあるいはスライスヘッダ単位で1つのRPS情報を指示する。対象画像で利用するRPS情報を指示する方法は2つある。1つは、SPSまたはPPSにて符号化/復号したRPS情報の識別子idxをピクチャヘッダあるいはスライスヘッダにて符号化/復号することにより指示する。2つは、新たなRPS情報をピクチャヘッダあるいはスライスヘッダにて符号化/復号する。 In the present invention, the RPS information indicates one RPS information for each picture header or slice header. There are two methods for instructing RPS information used in the target image. One is instructed by encoding / decoding an identifier idx of RPS information encoded / decoded by SPS or PPS using a picture header or a slice header. Second, new RPS information is encoded / decoded by a picture header or a slice header.
SPS/PPSあるいはピクチャ/スライスヘッダで符号化/復号される新たなRPS情報の符号化/復号には2つの方法がある。1つは、インターRPS(Inter RPS method)と呼び、既符号化/復号のRPSを参照し、符号化対象のRPSと既符号化のRPSとの関係を予測符号化/復号する方法である。2つは、イントラRPS(Intra RPS method)と呼び、符号化/復号対象のRPSに含まれるDeltaPocの個数と値を参照なしで符号化/復号する。本明細書では、1つのRPSに含まれるDeltaPocの組をDeltaPoc[idx][i]と示す。ここで、iはフレームメモリに格納されるi番目の参照画像を示しており、idxは、特定のRPSを識別するための番号(識別子)を示す。なお、以下では[i]を省略して記載する場合がある。 There are two methods for encoding / decoding new RPS information encoded / decoded by SPS / PPS or picture / slice header. One is a method called inter RPS (Inter RPS method), which refers to pre-encoded / decoded RPS and predictively encodes / decodes the relationship between the RPS to be encoded and the pre-encoded RPS. The second is called intra RPS (Intra RPS method), which encodes / decodes the number and value of DeltaPocs included in the RPS to be encoded / decoded without reference. In this specification, a set of DeltaPocs included in one RPS is denoted as DeltaPoc [idx] [i]. Here, i represents the i-th reference image stored in the frame memory, and idx represents a number (identifier) for identifying a specific RPS. In the following description, [i] may be omitted.
次に、図8と図3と図5を用いて、RPS情報によるバッファ管理器(図1の114と図2の209)の制御方法ならびにエントロピー符号化器111とデータ解析器202におけるRPS情報の符号化/復号方法を説明する。
Next, the control method of the buffer manager (114 in FIG. 1 and 209 in FIG. 2) by the RPS information and the RPS information in the
図8は、idxで識別される新たなRPS情報を符号化/復号するためのシンタックステーブルshort_term_ref_pic_set(idx)を示す。SPSあるいはPPSで符号化/復号するRPS情報の個数はnum_short_term_ref_pic_setsとしてSPSまたはPPSにて符号化/復号される。つまり、SPSまたはPPSにて符号化/復号されるRPS情報は、識別子idx(idxは0からnum_short_term_ref_pic_sets-1の範囲の整数)で識別される。 FIG. 8 shows a syntax table short_term_ref_pic_set (idx) for encoding / decoding new RPS information identified by idx. The number of RPS information encoded / decoded by SPS or PPS is encoded / decoded by SPS or PPS as num_short_term_ref_pic_sets. That is, RPS information encoded / decoded by SPS or PPS is identified by an identifier idx (idx is an integer in the range of 0 to num_short_term_ref_pic_sets-1).
inter_ref_pic_set_prediction_flag (R200)は、idxで識別される符号化/復号対象のRPS情報の符号化/復号方法がイントラRPSかインターRPSかを識別するためのシンタックス要素である。このフラグが0の場合には、イントラRPS法でDeltaPoc[idx]が符号化/復号される。つまり、符号化/復号対象のRPSに含まれる参照画像の個数と各参照画像に対応するDeltaPocの値を符号化/復号する。例えば、図10のidx=0で識別されるRPS(1710)をイントラRPSで符号化/復号する場合には、DeltaPosの個数4と4個のDeltaPocの値(−14、−12、−10、−8)が符号化/復号される。 inter_ref_pic_set_prediction_flag (R200) is a syntax element for identifying whether the encoding / decoding method of the RPS information to be encoded / decoded identified by idx is intra RPS or inter RPS. When this flag is 0, DeltaPoc [idx] is encoded / decoded by the intra RPS method. That is, the number of reference images included in the RPS to be encoded / decoded and the value of DeltaPoc corresponding to each reference image are encoded / decoded. For example, when RPS (1710) identified by idx = 0 in FIG. 10 is encoded / decoded with intra RPS, the number of DeltaPos is 4 and the value of 4 DeltaPocs (−14, −12, −10, -8) is encoded / decoded.
inter_ref_pic_set_prediction_flag (R200)が1の場合には、既符号化/復号のRPS情報を参照するインターRPSでDeltaPoc[idx][i]が符号化/復号される。delta_idx_minus1(R210)は、インターRPSの予測処理にて参照するRPS情報の識別子RIdxを特定するためのシンタックス要素である。RIdxは式(5)にて復元される。
RIdx=idx‐(delta_idx_minus1+1) (5)
When inter_ref_pic_set_prediction_flag (R200) is 1, DeltaPoc [idx] [i] is encoded / decoded by inter-RPS that refers to RPS information of already encoded / decoded information. delta_idx_minus1 (R210) is a syntax element for specifying the identifier RIdx of the RPS information referred to in the inter-RPS prediction process. RIdx is restored by equation (5).
RIdx = idx- (delta_idx_minus1 + 1) (5)
シンタックス要素delta_rps (R220)は、正または負の整数であり、RIdxで識別されるRPSのDeltaPocの組と符号化/復号対象のidxで識別されるDeltaPocの組との差分値DeltaRPSを示す。なお、delta_rpsは図7のシンタックス要素R120(abs_delta_rps_minus1とdelta_rps_sign)で示したように、その絶対値と正負の符号に分けて符号化/復号するようにしてもよい。
DeltaRPS = delta_rps (6)
例えば、図10で、RIdx=1、idx=2の場合には、その差分値2がdelta_rpsとして符号化/復号される。対象となるRPSの各要素DeltaPoc[idx][i]とその個数NumDeltaPocs[idx]は式(7)、式(8)に示すように算出される。NumDeltaPocs[idx]は、idxで識別されるRPS情報に含まれるDeltaPocの個数(図10の1702)を示す。また式(7)にて算出されるDeltaPoc[idx][i]と後述するinter_rps_modeにて最終的な対象RPS情報が決定するため,式(7)のDeltaPoc[idx][i]は,対象RPS情報(対象バッファ記述情報)に対する予測RPS情報(予測バッファ記述情報)の位置づけとなる。
DeltaPoc[idx][i]=DeltaPoc[RIdx][i]+DeltaRPS (7)
ここで、i=0 to (NumDeltaPocs[RIdx]-1)
NumDeltaPocs[idx] = NumDeltaPocs[RIdx] (8)
The syntax element delta_rps (R220) is a positive or negative integer, and indicates a difference value DeltaRPS between the DeltaPoc set of RPS identified by RIdx and the DeltaPoc set identified by idx to be encoded / decoded. Note that delta_rps may be encoded / decoded separately as shown in the syntax element R120 (abs_delta_rps_minus1 and delta_rps_sign) in FIG.
DeltaRPS = delta_rps (6)
For example, in FIG. 10, when RIdx = 1 and idx = 2, the
DeltaPoc [idx] [i] = DeltaPoc [RIdx] [i] + DeltaRPS (7)
Where i = 0 to (NumDeltaPocs [RIdx] -1)
NumDeltaPocs [idx] = NumDeltaPocs [RIdx] (8)
シンタックス要素inter_rps_mode(R230)は、本発明の重要な特徴である。本発明では、対象となるRPS情報(idxで識別、対象RPS情報や対象バッファ記述情報ともよぶ)を、参照するRPS(RIdxで識別、参照RPS情報や参照バッファ記述情報ともよぶ)に基づいて導出する方法を複数用意する。より具体的には式(7)と式(8)から最終的な対象RPS情報を生成するための方法を予め複数用意する。この際、発生頻度が高い方法をinter_rps_modeとして用意することにより、図7で説明したシンタックスと比較して少ない符号要素で効率良くRPS情報を符号化/復号できる。また、このとき、inter_rps_mode(R230)の符号化/復号においては、図7のシンタックス要素R130のように参照RPSの要素(DeltaPoc)の個数NumDeltaPocs[RIdx]を必要としない。
ここでは、inter_rps_modeを1ビット信号(2つのモード)とする。
The syntax element inter_rps_mode (R230) is an important feature of the present invention. In the present invention, target RPS information (identified by idx, also called target RPS information or target buffer description information) is derived based on RPS to be referenced (identified by RIdx, also called reference RPS information or reference buffer description information). Prepare multiple methods to do this. More specifically, a plurality of methods for generating final target RPS information from Formula (7) and Formula (8) are prepared in advance. At this time, by preparing a method having a high occurrence frequency as inter_rps_mode, it is possible to efficiently encode / decode RPS information with fewer code elements than the syntax described in FIG. At this time, in the encoding / decoding of inter_rps_mode (R230), the number NumDeltaPocs [RIdx] of the reference RPS elements (DeltaPoc) is not required unlike the syntax element R130 of FIG.
Here, inter_rps_mode is a 1-bit signal (two modes).
inter_rps_modeが0のときは、式(7)と式(8)に加えて、式(9)と式(10)を実施し、1つの新たなDeltaPocを対象RPS情報に追加する。
DeltaPoc[idx][NumDeltaPocs[RIdx]]=DeltaRPS (9)
NumDeltaPocs[idx] = NumDeltaPocs[RIdx]+1 (10)
例えば、図10で、RIdx=1としたとき、idx=2のRPS情報はdelta_idx_minus1=0、delta_rps=2、inter_rps_mode=0とすることで実現できる。
inter_rps_modeが1のときは、式(7)と式(8)に加えて、予め設定した条件を満たすDeltaPoc[idx][j]の値をDeltaRPSに置き換える。条件jとしては、例えば、DeltaPoc[idx][j]の値が最大となるjが選ばれる。条件jの決定方法はこれに限定されない。jの値を符号化/復号するようにしてもよいし、予めjの値を決めておいてもよいし、idx、delta_rps, delta_idx_munus1などの情報からjの値を決めてよい。
When inter_rps_mode is 0, in addition to Expression (7) and Expression (8), Expression (9) and Expression (10) are performed, and one new DeltaPoc is added to the target RPS information.
DeltaPoc [idx] [NumDeltaPocs [RIdx]] = DeltaRPS (9)
NumDeltaPocs [idx] = NumDeltaPocs [RIdx] +1 (10)
For example, when RIdx = 1 in FIG. 10, the RPS information with idx = 2 can be realized by setting delta_idx_minus1 = 0, delta_rps = 2, and inter_rps_mode = 0.
When inter_rps_mode is 1, in addition to Expressions (7) and (8), the value of DeltaPoc [idx] [j] that satisfies a preset condition is replaced with DeltaRPS. As the condition j, for example, j that maximizes the value of DeltaPoc [idx] [j] is selected. The method for determining the condition j is not limited to this. The value of j may be encoded / decoded, the value of j may be determined in advance, or the value of j may be determined from information such as idx, delta_rps, and delta_idx_munus1.
上記では、inter_rps_modeを1ビット信号(2モード)としたが、これに限定されない。例えば、図13の1300に示すように2ビット情報(4モード)とし、DeltaPoc[idx][j]の値が最小となるjについてDeltaPoc[idx][j]の値をDeltaRPSに置き換えるモードや、式(7)と式(8)の結果を変更せずにそのまま対象RPS情報とするモードを追加してもよい。また、図14の1400に示すように値が最大あるいは最小となる要素(DeltaPoc)を対象RPSから削除するモードや、値が最大あるいは最小となる要素のみを対象RPSの残すモードや、値が負のDeltaPocのみを対象RPSに残すモードを加えても良い。モードの数やモードの飲み合わせは限定されない。9個のモードを用いても良いし、9個からいくつかを選択して利用してもよい。利用するモードをSPS情報またはPPS情報に含めて指示するようにしてもよい。 In the above, inter_rps_mode is a 1-bit signal (2 modes), but is not limited thereto. For example, as shown in 1300 in FIG. 13, 2-bit information (4 modes) is used, and a mode in which the value of DeltaPoc [idx] [j] is replaced with DeltaRPS for j where the value of DeltaPoc [idx] [j] is minimum, A mode in which the results of Expression (7) and Expression (8) are not changed and the target RPS information is used as it is may be added. Further, as shown by 1400 in FIG. 14, the mode in which the element having the maximum or minimum value (DeltaPoc) is deleted from the target RPS, the mode in which only the element having the maximum or minimum value is left in the target RPS, or the value is negative. A mode may be added in which only the DeltaPoc is left in the target RPS. The number of modes and mode drinking are not limited. Nine modes may be used, or some of the nine modes may be selected and used. The mode to be used may be instructed by including it in the SPS information or the PPS information.
なお、スライスヘッダにて、新たなRPS情報を符号化/復号する場合には、SPSまたはPPSにて利用されていないidx番号であるnum_short_term_ref_pic_setsをシンタックステーブルの入力値として用いる。つまり、シンタックステーブルshort_term_ref_pic_set(num_short_term_ref_pic_sets)を符号化/復号する。 When new RPS information is encoded / decoded in the slice header, num_short_term_ref_pic_sets, which is an idx number not used in SPS or PPS, is used as an input value of the syntax table. That is, the syntax table short_term_ref_pic_set (num_short_term_ref_pic_sets) is encoded / decoded.
次に、図3と図5を用いて、バッファ管理器(図1の114と図2の209)ならびにエントロピー符号化器111とデータ解析器202の動作を説明する。
Next, operations of the buffer manager (114 in FIG. 1 and 209 in FIG. 2), the
図3は本発明の実施形態による動画像予測符号化装置100のバッファ管理器114ならびにエントロピー符号化器111における1つのRPS情報の符号化方法を示す流れ図である。
FIG. 3 is a flowchart showing one RPS information encoding method in the
図3のステップ510では、バッファ管理器114が、インターRPS法を用いた対象RPSの符号化に適した参照RPSが存在するかを判断する。なお、対象RPSの符号化に適した参照RPSとは、対象RPSに類似するRPSを有する参照RPSをいい、RPSが類似するか否かは、例えば、DeltaPocの個数やDeltaPocの値の相違により、類似を判断するようにしてもよいが、これに限るものではなく、符号化効率の高くなるような参照RPSを選択するようにすることが好ましい。ステップ510の詳細は図4にて後述する。
In
ステップ510にて、バッファ管理器114がインターRPS法(バッファ記述情報予測符号化)を用いた対象RPSの符号化に適した参照RPSが存在しないと判断した場合には、ステップ570に進む。ステップ570では、バッファ管理器114がinter_rps_prediction_flagを0に設定し、エントロピー符号化器111がinter_rps_prediction_flagをエントロピー符号化する。次にステップ580にて、バッファ管理114が対象RPSに含まれるDeltaPocの個数と値をエントロピー符号化器111で符号化し、処理を終了する。
If the
ステップ510にて、バッファ管理器114がインターRPS法(バッファ記述情報予測符号化方法)を用いた対象RPSの符号化に適した参照RPSが存在すると判断した場合には、バッファ管理器114は、RIdxとDeltaRPSと図13に示すinter_rps_mode(図4ではModeと示す)を導出し、ステップ520に進む。ここでは、図13を例とするがinter_rps_modeの種類は図13に限定されない。ステップ520では、バッファ管理器114がinter_rps_prediction_flagを1に設定し、エントロピー符号化器111がinter_rps_prediction_flagをエントロピー符号化する。ステップ530では、バッファ管理器114が対象RPSのインターRPS法に適したRPSとして選択した参照RPSを識別する識別子RIdxと対象RPSを識別するidxの差分値delta_idx_minus1(=idx ‐ RIdx ‐ 1)である識別情報を、エントロピー符号化器111にて符号化する。なお、ステップ530では、識別情報として、差分値delta_idx_minus1を符号化しているが、符号化される識別情報はこれに限定されず、参照RPSを識別可能なものであればよく、例えば、参照RPSを識別する識別子RIdxを識別情報として符号化してもよい。ステップ540では、バッファ管理器114にて導出したdelta_rpsをDeltaRPSとしてエントロピー符号化器111が符号化する。なお、delta_rpsは図7のシンタックス要素R120(abs_delta_rps_minus1とdelta_rps_sign)で示したように、その絶対値と正負の符号に分けて符号化するようにしてもよい。最後に、ステップ550では、バッファ管理器114にて導出したinter_rps_modeをエントロピー符号化器111が符号化する。なお、エントロピー符号化器111における各符号化要素のエントロピー符号化方法は限定されないが、可変長符号化や算術符号化が適用できる。
If the
図4は、図3のステップ510の処理の詳細を示す流れ図である。RPS情報の符号化/復号に用いるシンタックステーブルの各符号化要素を導出するためのバッファ管理器114の処理を示す。
FIG. 4 is a flowchart showing details of the processing in
ステッ610では、対象RPSのインターRPS予測に用いる参照RPSの複数候補に未調査のRPS情報があるかを判定する。未調査の参照RPS候補がない場合には、ステップ680に進み、インターRPS予測を用いた対象RPSの符号化に適した参照RPSが存在ないと判断する。その結果に基づき、図3のステップ570に進む。
未調査の参照RPS候補が残っている場合には、ステップ620に進む。ステップ620では、次のRPS候補を識別する識別子RIdxを取得し、対象画像のRPSと参照RPS候補に関連するPOCの差分値DeltaRPSを、式(11)にて算出し、ステップ630に進む。
DeltaRPS = POCReference - POCCurrent (11)
ここで、POCCurrentは対象RPSに関するPOC番号、POCReferenceは参照RPS候補のPOC番号を示す。例えば、図10で対象RPSが1712、参照RPSの候補が1711の場合には、POCCurrent=26(図9の1612)、POCReference=28(図9の1611)、DeltaRPS=2となる。
ステップ630では、対象RPSの予測値である予測RPS(予測バッファ記述情報とよぶ)として、DeltaPocPred[ i ]が式(12)にて算出される。ここで、iは0からN-1で変化し、Nの値は、参照RPSの数NumDeltaPocs[RIdx]となる。
DeltaPocPred[ i ] = DeltaPoc[ RIdx ][ i ] + DeltaRPS (12)
In
If unexamined reference RPS candidates remain, the process proceeds to step 620. In
DeltaRPS = POCReference-POCCurrent (11)
Here, POCCurrent indicates the POC number related to the target RPS, and POCReference indicates the POC number of the reference RPS candidate. For example, when the target RPS is 1712 and the reference RPS candidate is 1711 in FIG. 10, POCCurrent = 26 (1612 in FIG. 9), POCReference = 28 (1611 in FIG. 9), and DeltaRPS = 2.
In
DeltaPocPred [i] = DeltaPoc [RIdx] [i] + DeltaRPS (12)
次にステップ640では、予測RPSと対象RPSを比較し、一致する場合には、ステップ650にてMode=inter_rps_mode=3と設定し、図3のステップ520に進む。一致しない場合は、ステップ631に進む。
Next, in
ステップ631では、予測RPSにDeltaPocPred[N]=DeltaRPSを新要素として加える。ステップ641では、更新した予測RPSと対象RPSを比較し、一致する場合には、ステップ651にてMode=inter_rps_mode=0と設定し、図3のステップ520に進む。一致しない場合は、ステップ632に進む。
In
ステップ632では、予測RPSから値が最小となるDeltaPocと対応するindexを検出し、DeltaPocPred[index]=DeltaRPSとして検出したDeltaPocをDeltaRPSの値に置き換える。ステップ642では、更新した予測RPSと対象RPSを比較し、一致する場合には、ステップ652にてMode=inter_rps_mode=1と設定し、図3のステップ520に進む。一致しない場合は、ステップ632に進む。
In
ステップ633では、予測RPSから値が最大となるDeltaPocと対応するindexを検出し、DeltaPocPred[index]=DeltaRPSとして検出したDeltaPocをDeltaRPSの値に置き換える。ステップ643では、更新した予測RPSと対象RPSを比較し、一致する場合には、ステップ653にてMode=inter_rps_mode=2と設定し、図3のステップ520に進む。一致しない場合は、ステップ610に進む。
In
なお、エントロピー符号化器111では、図3と図4にて求めたnum_short_term_ref_pic_sets個のRPS情報DeltaPoc[°k°][°i°](k=0- num_short_term_ref_pic_sets-1,i = 0- NumDeltaPocs[k]-1)をSPS情報あるいはPPS情報の一部として他の圧縮データと併せて送出する。図1の入力端子113より指定された一つのRPS情報DeltaPoc[m]に基づいて、バッファ管理器114がフレームメモリ104内にある参照画像を用意した上で符号化処理を行う。受信側では、各画像の圧縮データのヘッダ(ピクチャヘッダあるいはスライスヘッダ)に付加されるRPS情報の識別子mに基づいてバッファ管理器209がフレームメモリ207内にある参照画像を用意した上で復号処理を行う。num_short_term_ref_pic_sets個のRPS情報にDeltaPoc[m]が存在しない場合には、short_term_ref_pic_set(num_short_term_ref_pic_sets)で示されるシンタックスにより、新たなRPS情報としてDeltaPoc[m]を符号化する。そのため、本発明の実施形態では、スライスヘッダあるいはピクチャヘッダにて、新たなRPS情報を送るかRPS情報の識別子mを送るかを指示するフラグが併せて送られる。
In the
図5は本発明の実施形態による動画像予測復号装置200のバッファ管理器209ならびにデータ解析器202における1つのRPS情報の復号方法を示す流れ図である。
FIG. 5 is a flowchart showing a method of decoding one RPS information in the
ステップ310にて、データ解析器209が対象RPSをイントラRPS法で復号するかインターRPS法(バッファ記述情報予測復号方法)で復号するかを指示する情報inter_rps_prediction_flagを復号する。そして、inter_rps_prediction_flagの復号値が0の場合には、ステップ380に進み、復号値が1の場合にはステップ330に進む。
In
ステップ380では、データ解析器202とバッファ管理器209がイントラRPS法で対象RPSを復元する。
In
ステップ330、340、350では、データ解析器202がインターRPS法に基づいて、delta_idx_minus1と delta_rpsとinter_rps_modeをそれぞれエントロピー復号し、バッファ管理器209に送る。このとき,delta_rpsは図7のシンタックス要素R120(abs_delta_rps_minus1とdelta_rps_sign)で示したように、その絶対値と正負の符号に分けて復号するようにしてもよい。なお、各要素のエントロピー復号方法は限定されないが、可変長復号や算術復号が適用できる。また、符号化装置側において、識別情報として、識別子RIdxを採用した場合には、この符号化された識別子RIdxを復号する。
ステップ360では、バッファ管理器209が、復号したdelta_idx_minus1と delta_rpsとinter_rps_modeから対象RPSを復元する。ステップ360の詳細を図6にて説明する。
In
In
図6は、図5のステップ360の処理の詳細を示す流れ図である。バッファ管理器209における対象RPS情報の復元処理を示す。
FIG. 6 is a flowchart showing details of the process in
ステップ410では、復号されたdelta_idx_minus1と対象RPS情報を識別する識別子idxから参照RPSを識別する識別子RIdxを式(5)に基づいて復元する。
RIdx=idx‐(delta_idx_minus1+1) (5)
また、復号されたdelta_rpsからDeltaRPSを式(6)に基づいて復元する。
DeltaRPS = delta_rps (6)
さらに、復号されたinter_rps_modeからModeの値を復元する。
In
RIdx = idx- (delta_idx_minus1 + 1) (5)
Also, DeltaRPS is restored from the decoded delta_rps based on Equation (6).
DeltaRPS = delta_rps (6)
Further, the value of Mode is restored from the decoded inter_rps_mode.
次にステップ420では、復号されたDeltaRPSから、N個のDeltaPocを式(7)と式(8)に基づいて復元する。
DeltaPoc[idx][i]=DeltaPoc[RIdx][i]+DeltaRPS (7)
ここで、i=0 to N-1(=NumDeltaPocs[RIdx]-1)
NumDeltaPocs[idx] = NumDeltaPocs[RIdx] (8)
ここで,式(7)にて算出されるDeltaPoc[idx][i]とModeにて最終的な対象RPS情報が決定するため,式(7)のDeltaPoc[idx][i]は,対象RPS情報(対象バッファ記述情報)に対する予測RPS情報(予測バッファ記述情報)の位置づけとなる。
Next, in
DeltaPoc [idx] [i] = DeltaPoc [RIdx] [i] + DeltaRPS (7)
Where i = 0 to N-1 (= NumDeltaPocs [RIdx] -1)
NumDeltaPocs [idx] = NumDeltaPocs [RIdx] (8)
Here, since the final target RPS information is determined by DeltaPoc [idx] [i] calculated in Equation (7) and Mode, DeltaPoc [idx] [i] in Equation (7) is the target RPS. This is the positioning of predicted RPS information (predicted buffer description information) with respect to information (target buffer description information).
ステップ430では、Modeが0であるかを判断する。Modeが0の場合には、ステップ440に進み、DeltaPoc[idx]の新たな要素として、DeltaPoc[idx][N]=DeltaRPSを対象RPSに加える。DeltaPoc[idx][NumDeltaPocs[RIdx]]=DeltaRPS (9)
NumDeltaPocs[idx] = NumDeltaPocs[RIdx]+1 (10)
Modeが0でない場合には、ステップ450に進む。
In
NumDeltaPocs [idx] = NumDeltaPocs [RIdx] +1 (10)
If Mode is not 0, the process proceeds to step 450.
ステップ450では、Modeが1であるかを判断する。Modeが1の場合には、ステップ460に進み、DeltaPoc[idx][0]からDeltaPoc[idx][N-1]のうち、値が最小の要素(DeltaPoc)をDeltaRPSに置き換える。値が最小の要素を識別する識別子がjの場合、DeltaPoc[idx][j]=DeltaRPSとなる。Modeが1でない場合には、ステップ470に進む。
In
ステップ470では、Modeが2であるかを判断する。Modeが2の場合には、ステップ480に進み、DeltaPoc[idx][0]からDeltaPoc[idx][N-1]のうち、値が最大の要素(DeltaPoc)をDeltaRPSに置き換える。値が最大の要素を識別する識別子がjの場合、DeltaPoc[idx][j]=DeltaRPSとなる。Modeが2でない場合には、ステップ420で復元したDeltaPoc[idx]とNumDeltaPocs[idx]を変更せずに出力する(Mode=3)。
In
図5と図6に示した処理により、図2のデータ解析器202は、圧縮データから1つのRPS情報に関するデータを抽出して復号できる。データ解析器202とバッファ管理器209は、符号化データ内のSPS情報あるいはPPS情報の部分からK個のRPS情報DeltaPoc[k][°i°](k=0 - K-1, i=0 - NumDeltaPocs[k]-1)を復号する。Kの値は、例えばnum_short_term_ref_pic_setsとしてSPS情報あるいはPPS情報にて復号される。
5 and FIG. 6, the data analyzer 202 in FIG. 2 can extract and decode data related to one RPS information from the compressed data. The
各画像を復元する際には、対象画像の圧縮データのヘッダ(ピクチャヘッダあるいはスライスヘッダ)に付加される識別子idxにて指示されるDeltaPoc[idx]に基づいて、バッファ管理器209がフレームメモリ207内にある参照画像を用意した上で、復号・再生処理を行う。なお、SPS情報にて用意されたRPS情報に対象画像の復号に適したRPS情報がない場合には、新たなRPS情報をスライスヘッダあるいはピクチャヘッダで受信する。そのため、本発明の実施形態では、新たなRPS情報を復号するかRPS情報の識別子を復号するかを指示するフラグを先に復号する。
When restoring each image, the
このように、本発明によるバッファ記述情報(RPS情報)を符号化・復号する方法によれば、inter_rps_modeにより、予測RPS(参照RPSとDeltaRPSから生成)から対象RPSを生成する方法が分かるため、データ解析器202は、参照RPS情報に含まれる要素の個数を取得しなくても、RPS情報に関する圧縮データを解析できる。また、背景技術に示したuse_delta_flagのようにRPS情報の各要素に関わる指示情報を符号化する必要がないため、RPS情報の圧縮データをより効率良く符号化することが可能となる。
As described above, according to the method for encoding / decoding the buffer description information (RPS information) according to the present invention, the method for generating the target RPS from the predicted RPS (generated from the reference RPS and the DeltaRPS) can be determined by inter_rps_mode. The
さらに本発明では、背景技術のused_by_curr_pic_flag[i]、つまり、対象RPS情報にて管理される各再生画像が対象画像の予測処理に利用されるか、将来の画像の予測処理に利用されるかを示す利用情報の組をモード情報として符号化/復号できるようにinter_rps_modeを拡張することも可能である。 Furthermore, in the present invention, used_by_curr_pic_flag [i] of the background art, that is, whether each reproduced image managed by the target RPS information is used for the target image prediction process or for the future image prediction process. It is also possible to extend inter_rps_mode so that the set of usage information shown can be encoded / decoded as mode information.
具体的には、RPS情報に利用情報used_by_curr_pic_flagを加える。参照RPS情報を識別する識別子RIdxが復元されるとバッファ管理器は、RIdxで識別される参照RPSの各再生画像の利用情報を、対象RPSの各再生画像の利用情報にコピーする。そして、DeltaPocの値がDeltaRPSとなる利用情報(図13ではMode=0の新たに追加するDeltaPocに対応する参照画像の利用情報やMode=1か2の特定のDeltaPocに対応する利用情報)をinter_rps_modeの値に基づいて符号化/復号する(図13では、inter_rps_modeが0, 1, 2のとき符号化/復号する)。あるいは、新たに追加されるDeltaPocに対応する再生画像のused_by_curr_pic_flagの値をinter_rps_modeにて指示するモードや、特定のDeltaPoc(例えば、最大値のDeltaPocや最小値のDeltaPoc)に対応する再生画像のused_by_curr_pic_flagの値を変更するモードを元のinter_rps_modeに組み合わせて用意してもよい。また、利用情報used_by_curr_pic_flagのパターンを示すモード情報をinter_rps_modeと別に用意してもよい。 Specifically, usage information used_by_curr_pic_flag is added to RPS information. When the identifier RIdx that identifies the reference RPS information is restored, the buffer manager copies the usage information of each playback image of the reference RPS identified by RIdx to the usage information of each playback image of the target RPS. Then, the usage information (the usage information of the reference image corresponding to the newly added DeltaPoc with Mode = 0 or the usage information corresponding to the specific DeltaPoc with Mode = 1 or 2 in FIG. 13) in which the value of DeltaPoc is DeltaRPS is inter_rps_mode. (In FIG. 13, encoding / decoding is performed when inter_rps_mode is 0, 1, 2). Alternatively, the mode in which the value of used_by_curr_pic_flag of the playback image corresponding to the newly added DeltaPoc is indicated by inter_rps_mode, or the used_by_curr_pic_flag of the playback image corresponding to a specific DeltaPoc (for example, the maximum DeltaPoc or the minimum DeltaPoc) A mode for changing the value may be prepared in combination with the original inter_rps_mode. Further, mode information indicating a pattern of usage information used_by_curr_pic_flag may be prepared separately from inter_rps_mode.
コンピュータを上記の動画像予測符号化装置100として機能させるための動画像予測符号化プログラムは、記録媒体に格納されて提供可能とされている。具体的には、動画像予測符号化プログラムは、動画像を構成する複数の画像を入力する入力モジュールと、画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化モジュールと、圧縮画像データを復号し、再生画像に復元する復号モジュールと、再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上格納する画像格納モジュールと、画像格納モジュールを制御するバッファ管理モジュールと、を具備し、バッファ管理モジュールは、画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、参照バッファ記述情報の参照画像のピクチャ番号と対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、参照バッファ記述情報と差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した複数のモードから、対象バッファ記述情報を生成するモード情報を選択し、符号化モジュールは、識別情報、差分値、モード情報を符号化することを特徴とする動画像予測符号化プログラムである。 A moving picture predictive coding program for causing a computer to function as the moving picture predictive coding apparatus 100 is stored in a recording medium and can be provided. Specifically, the moving image predictive encoding program predicts an input module for inputting a plurality of images constituting a moving image, and a plurality of images decoded and reproduced after encoding the images as reference images. An encoding module that encodes and generates compressed image data, a decoding module that decodes the compressed image data and restores it to a reproduced image, and a reproduced image as one reference image used to encode subsequent images An image storage module for storing the above, and a buffer management module for controlling the image storage module. The buffer management module is the target buffer description information related to a plurality of reference images used when predictively encoding an image. From different encoded buffer description information, the buffer description information similar to the target buffer description information is referred to as the reference buffer description information. And generating identification information for identifying the reference buffer description information, calculating a difference value between the picture number of the reference image of the reference buffer description information and the picture number of the target image of the target buffer description information, and the reference buffer description Generate prediction buffer description information from the information and the difference value, and select mode information for generating target buffer description information from a plurality of modes prepared for generating new buffer description information based on the prediction buffer description information. The encoding module is a video predictive encoding program characterized by encoding identification information, a difference value, and mode information.
同様に、コンピュータを上記の動画像予測復号装置200として機能させるための動画像予測復号プログラムは、記録媒体に格納されて提供可能とされている。具体的には、動画像予測復号プログラムは、動画像を構成する複数の画像のそれぞれに対し、過去に復号・再生された複数の画像を参照画像として予測符号化されたデータと、複数の参照画像に関するバッファ記述情報の符号化データとを含む圧縮画像データを入力する入力モジュールと、圧縮画像データを復号し、再生画像に復元する復号モジュールと、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納モジュールと、画像格納モジュールを制御するバッファ管理モジュールと、を具備し、復号モジュールは、再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、参照バッファ記述情報に関するピクチャ番号と対象バッファ記述情報に関するピクチャ番号との差分値を復号し、参照バッファ記述情報と差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された複数のモードから、対象バッファ記述情報の復元に用いるモード情報を復号し、予測バッファ記述情報とモード情報に基づいて、対象バッファ記述情報を復号し、バッファ管理モジュールは、復号された対象バッファ記述情報をもとに画像格納モジュールを制御することを特徴とする動画像予測復号プログラムである。記録媒体としては、フレキシブルディスク、CD−ROM、DVD、あるいはROM等の記録媒体、又は半導体メモリ等が例示される。 Similarly, a moving picture predictive decoding program for causing a computer to function as the moving picture predictive decoding apparatus 200 can be provided by being stored in a recording medium. Specifically, the moving image predictive decoding program performs prediction encoding on a plurality of images that have been decoded and reproduced in the past as reference images and a plurality of references for each of a plurality of images constituting the moving image. An input module for inputting compressed image data including encoded data of buffer description information relating to an image, a decoding module for decoding the compressed image data and restoring it to a reproduced image, and for decoding the reproduced image and subsequent images An image storage module that stores one or more reference images to be used, and a buffer management module that controls the image storage module. The decoding module is a target related to a plurality of reference images used when decoding a reproduction image. In order to decode the buffer description information, decoded buffer description information different from the target buffer description information, Decoding identification information for identifying buffer description information used for decoding buffer description information as reference buffer description information, decoding a difference value between a picture number related to reference buffer description information and a picture number related to target buffer description information, and a reference buffer description Decoding mode information used to restore the target buffer description information from a plurality of modes prepared to generate new buffer description information based on the prediction buffer description information generated from the information and the difference value, and the prediction buffer description The target buffer description information is decoded based on the information and the mode information, and the buffer management module controls the image storage module based on the decoded target buffer description information. . Examples of the recording medium include a recording medium such as a flexible disk, a CD-ROM, a DVD, or a ROM, or a semiconductor memory.
図11は、記録媒体に記録されたプログラムを実行するためのコンピュータ30のハードウェア構成を示す図であり、図12は、記録媒体に記憶されたプログラムを実行するためのコンピュータ30の斜視図である。ここでのコンピュータ30は、CPUを具備しソフトウエアによる情報処理や制御を行うDVDプレーヤ、セットトップボックス、携帯電話などを広く含む。
FIG. 11 is a diagram illustrating a hardware configuration of a
図12に示すように、コンピュータ30は、フレキシブルディスクドライブ装置、CD−ROMドライブ装置、DVDドライブ装置等の読み取り装置12と、オペレーティングシステムを常駐させた作業用メモリ(RAM)14と、記録媒体10に記憶されたプログラムを記憶するメモリ16と、ディスプレイといった表示装置18と、入力装置であるマウス20及びキーボード22と、データ等の送受を行うための通信装置24と、プログラムの実行を制御するCPU26とを備えている。記録媒体10が読み取り装置12に挿入されると、コンピュータ30は、読み取り装置12から記録媒体10に格納された動画像予測符号化プログラムにアクセス可能になり、当該動画像予測符号化プログラムによって上記の動画像予測符号化装置100として動作することが可能になる。同様に、記録媒体10が読み取り装置12に挿入されると、コンピュータ30は、読み取り装置12から記録媒体10に格納された動画像予測復号プログラムにアクセス可能になり、当該動画像予測復号プログラムによって上記の動画像予測復号装置200として動作することが可能になる。
As shown in FIG. 12, a
次に、本発明に係る動画像予測符号化装置100及び動画像予測復号装置200の作用効果について説明する。 Next, the operational effects of the video predictive coding device 100 and the video predictive decoding device 200 according to the present invention will be described.
この動画像予測符号化装置100において、バッファ管理器114は、複数の符号化済みバッファ記述情報から、対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、具体的には、インターRPS法を用いた対象RPSの符号化に適した参照RPSが存在するかを判断する。そして、バッファ管理部114は、この参照RPS(該参照バッファ記述情報)を識別する識別情報(差分値delta_idx_minus1又は識別子RIdx)を生成する。
In the video predictive encoding device 100, the
つぎに、バッファ管理部114は、参照RPS(参照バッファ記述情報)の参照画像のPOC(ピクチャ番号)と対象PRS(対象バッファ記述情報)の対象画像のPOC(ピクチャ番号)との差分値であるDeltaRPSを算出し、参照RPSの各要素と差分値DelatRPSから予想RPS(予測バッファ記述情報)を生成する。そして、予測RPSに基づいて新たなバッファ記述情報を生成するために用意した複数のinter_rps_mode(モード情報)から、対象バッファ記述情報を生成するMODE(モード情報)を選択し、エントロピー符号化器111は、差分値delta_idx_minus1又は識別子RIdx(識別情報)、DeltaRPS(差分値)、MODE(モード情報)を符号化する。
Next, the
これにより、背景技術に示したuse_delta_flagのようにRPS情報の各要素に関わる指示情報を符号化する必要がないため、RPS情報の圧縮データをより効率良く符号化することが可能となる。また、対象バッファ記述情報を生成するための方法であって発生頻度が高い方法を、シンタックス要素として予め複数用意しておくことにより、少ない符号要素で効率良く対象バッファ記述情報を符号化することができる。よって、本発明によれば、インターRPSの符号化に要するビット数を削減することにより、符号化データの構成を簡潔にすることができる。 Thereby, unlike the use_delta_flag shown in the background art, it is not necessary to encode the instruction information related to each element of the RPS information, so that the compressed data of the RPS information can be encoded more efficiently. Also, by preparing in advance a plurality of methods for generating the target buffer description information that are frequently generated as syntax elements, the target buffer description information can be efficiently encoded with a small number of code elements. Can do. Therefore, according to the present invention, the configuration of encoded data can be simplified by reducing the number of bits required for inter-RPS encoding.
この動画像予測復号装置200において、データ解析器202は、参照RPS(該参照バッファ記述情報)を識別する識別情報、参照RPS(参照バッファ記述情報)の参照画像のPOC(ピクチャ番号)と対象PRS(対象バッファ記述情報)の対象画像のPOC(ピクチャ番号)との差分値であるDeltaRPS(差分値)、対象バッファ記述情報を生成するMODE(モード情報)を復号する。
In this video predictive decoding apparatus 200, the
そして、このデータ解析器202は、予想RPS(予測バッファ記述情報)とMODE(モード情報)に基づいて、対象RPS(対象バッファ記述情報)を復号し、バッファ管理器114は、復号された対象RPS(対象バッファ記述情報)に基づいて、フレームメモリ104を制御する。
Then, the
これにより、予測バッファ記述情報から対象バッファ記述情報に含まれる要素の個数を取得しなくても、バッファ記述情報に関する圧縮データを解析することができる。また、対象バッファ記述情報を生成するための方法であって発生頻度が高い方法を、シンタックス要素として予め複数用意しておくことにより、少ない符号要素で効率良く対象バッファ記述情報を復号することができる。よって、本発明によれば、復号装置における符号化データの解析処理を簡易化することができる。 Accordingly, the compressed data related to the buffer description information can be analyzed without obtaining the number of elements included in the target buffer description information from the prediction buffer description information. Also, by preparing a plurality of methods for generating the target buffer description information and having a high occurrence frequency as syntax elements in advance, the target buffer description information can be efficiently decoded with a small number of code elements. it can. Therefore, according to the present invention, the analysis processing of the encoded data in the decoding device can be simplified.
100…動画像予測符号化装置、101…入力端子、102…ブロック分割器、103…予測信号生成器、104…フレームメモリ、105…減算器、106…変換器、107…量子化器、108…逆量子化器、109…逆変換器、110…加算器、111…エントロピー符号化器、112…出力端子、114…バッファ管理器、200…動画像予測復号装置、201…入力端子、202…データ解析器、203…逆量子化器、204…逆変換器、205…加算器、206…出力端子、207…フレームメモリ、208…予測信号生成器、209…バッファ管理器。
DESCRIPTION OF SYMBOLS 100 ... Moving image predictive coding apparatus, 101 ... Input terminal, 102 ... Block divider, 103 ... Prediction signal generator, 104 ... Frame memory, 105 ... Subtractor, 106 ... Converter, 107 ... Quantizer, 108 ...
Claims (8)
前記圧縮画像データを復号し、再生画像に復元する復号ステップと、
前記再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、
前記画像格納手段を制御するバッファ管理ステップと、を具備し、
前記復号ステップにおいて、
前記再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、
前記参照バッファ記述情報に関するピクチャ番号と前記対象バッファ記述情報に関するピクチャ番号との差分値を復号し、
前記参照バッファ記述情報と前記差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、前記対象バッファ記述情報の復元に用いるモード情報を復号し、
前記予測バッファ記述情報と前記モード情報に基づいて、前記対象バッファ記述情報を復号し、
前記バッファ管理ステップにおいて、
復号された前記対象バッファ記述情報をもとに前記画像格納手段を制御し、
前記3以上のモードには、
少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、
前記3以上のモードは、
それぞれ、前記予測バッファ記述情報から前記対象バッファ記述情報を生成する異なる処理方法を指し示し、
前記復号ステップでは、
前記圧縮画像データを復号して前記モード情報を復号し、当該モード情報が指し示す前記処理方法にて、前記予測バッファ記述情報から前記対象バッファ記述情報を復号する、ことを特徴とする動画像予測復号方法。 For each of a plurality of images constituting a moving image, data that is predictively encoded using a plurality of images decoded and reproduced in the past as reference images, and encoded data of buffer description information related to the plurality of reference images An input step for inputting compressed image data;
A decoding step of decoding the compressed image data and restoring the reproduced image;
An image storage step of storing the reproduced image as one or more reference images used for decoding subsequent images by an image storage means;
A buffer management step for controlling the image storage means,
In the decoding step,
Decoded buffer description information different from the target buffer description information and used for decoding the target buffer description information in order to decode the target buffer description information related to a plurality of reference images used when decoding the reproduced image Decoding identification information identifying buffer description information as reference buffer description information;
Decoding a difference value between a picture number related to the reference buffer description information and a picture number related to the target buffer description information;
Mode information used to restore the target buffer description information from three or more modes prepared for generating new buffer description information based on the prediction buffer description information generated from the reference buffer description information and the difference value Decrypt
Decoding the target buffer description information based on the prediction buffer description information and the mode information;
In the buffer management step,
Controlling the image storage means based on the decoded target buffer description information;
The three or more modes include
At least three modes including a first mode, a second mode, and a third mode that perform different processes from each other are included.
The three or more modes are:
Each indicating a different processing method for generating the target buffer description information from the prediction buffer description information;
In the decoding step,
Decoding the compressed image data, decoding the mode information, and decoding the target buffer description information from the prediction buffer description information by the processing method indicated by the mode information. Method.
前記第2のモードは、前記予測バッファ記述情報の要素のうち、所定の要素を前記差分値に置き換える処理を行うモードであり、
前記第3のモードは、前記予測バッファ記述情報を前記対象バッファ記述情報とする処理を行うモードである、請求項1に記載の動画像予測復号方法。 The first mode is a mode for performing a process of adding the difference value as a new element to the prediction buffer description information,
The second mode is a mode for performing a process of replacing a predetermined element among the elements of the prediction buffer description information with the difference value;
The moving image predictive decoding method according to claim 1, wherein the third mode is a mode for performing processing using the prediction buffer description information as the target buffer description information.
前記対象バッファ記述情報にて管理される前記再生画像が、対象画像の予測処理に利用されるか、或いは、将来の画像の予測処理に利用されるか、を示す利用情報の組をモード情報として復号する、請求項1〜3のいずれか一項に記載の動画像予測復号方法。 In the decoding step,
A mode information is a set of usage information indicating whether the reproduced image managed by the target buffer description information is used for a target image prediction process or a future image prediction process. decoding, the moving picture prediction decoding method according to any one of claims 1 to 3.
前記圧縮画像データを復号し、再生画像に復元する復号手段と、
前記再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納手段と、
前記画像格納手段を制御するバッファ管理手段と、を具備し、
前記復号手段は、
前記再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、
前記参照バッファ記述情報に関するピクチャ番号と前記対象バッファ記述情報に関するピクチャ番号との差分値を復号し、
前記参照バッファ記述情報と前記差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、前記対象バッファ記述情報の復元に用いるモード情報を復号し、
前記予測バッファ記述情報と前記モード情報に基づいて、前記対象バッファ記述情報を復号し、
前記バッファ管理手段は、
復号された前記対象バッファ記述情報をもとに前記画像格納手段を制御し、
前記3以上のモードには、
少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、
前記3以上のモードは、
それぞれ、前記予測バッファ記述情報から前記対象バッファ記述情報を生成する異なる処理方法を指し示し、
前記復号手段は、
前記圧縮画像データを復号して前記モード情報を復号し、当該モード情報が指し示す前記処理方法にて、前記予測バッファ記述情報から前記対象バッファ記述情報を復号する、ことを特徴とする動画像予測復号装置。 For each of a plurality of images constituting a moving image, data that is predictively encoded using a plurality of images decoded and reproduced in the past as reference images, and encoded data of buffer description information related to the plurality of reference images An input means for inputting compressed image data;
Decoding means for decoding the compressed image data and restoring the reproduced image;
Image storage means for storing one or more of the reproduced images as reference images used for decoding subsequent images;
Buffer management means for controlling the image storage means,
The decoding means includes
Decoded buffer description information different from the target buffer description information and used for decoding the target buffer description information in order to decode the target buffer description information related to a plurality of reference images used when decoding the reproduced image Decoding identification information identifying buffer description information as reference buffer description information;
Decoding a difference value between a picture number related to the reference buffer description information and a picture number related to the target buffer description information;
Mode information used to restore the target buffer description information from three or more modes prepared for generating new buffer description information based on the prediction buffer description information generated from the reference buffer description information and the difference value Decrypt
Decoding the target buffer description information based on the prediction buffer description information and the mode information;
The buffer management means includes
Controlling the image storage means based on the decoded target buffer description information;
The three or more modes include
At least three modes including a first mode, a second mode, and a third mode that perform different processes from each other are included.
The three or more modes are:
Each indicating a different processing method for generating the target buffer description information from the prediction buffer description information;
The decoding means includes
Decoding the compressed image data, decoding the mode information, and decoding the target buffer description information from the prediction buffer description information by the processing method indicated by the mode information. apparatus.
前記圧縮画像データを復号し、再生画像に復元する復号モジュールと、
前記再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納モジュールと、
前記画像格納モジュールを制御するバッファ管理モジュールと、を具備し、
前記復号モジュールは、
前記再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、
前記参照バッファ記述情報に関するピクチャ番号と前記対象バッファ記述情報に関するピクチャ番号との差分値を復号し、
前記参照バッファ記述情報と前記差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、前記対象バッファ記述情報の復元に用いるモード情報を復号し、
前記予測バッファ記述情報と前記モード情報に基づいて、前記対象バッファ記述情報を復号し、
前記バッファ管理モジュールは、
復号された前記対象バッファ記述情報をもとに前記画像格納モジュールを制御し、
前記3以上のモードには、
少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、
前記3以上のモードは、
それぞれ、前記予測バッファ記述情報から前記対象バッファ記述情報を生成する異なる処理方法を指し示し、
前記復号モジュールは、
前記圧縮画像データを復号して前記モード情報を復号し、当該モード情報が指し示す前記処理方法にて、前記予測バッファ記述情報から前記対象バッファ記述情報を復号する、ことを特徴とする動画像予測復号プログラム。 For each of a plurality of images constituting a moving image, data that is predictively encoded using a plurality of images decoded and reproduced in the past as reference images, and encoded data of buffer description information related to the plurality of reference images An input module for inputting compressed image data;
A decoding module that decodes the compressed image data and restores the reproduced image;
An image storage module that stores one or more of the reproduced images as reference images used to decode subsequent images;
A buffer management module for controlling the image storage module;
The decryption module is
Decoded buffer description information different from the target buffer description information and used for decoding the target buffer description information in order to decode the target buffer description information related to a plurality of reference images used when decoding the reproduced image Decoding identification information identifying buffer description information as reference buffer description information;
Decoding a difference value between a picture number related to the reference buffer description information and a picture number related to the target buffer description information;
Mode information used to restore the target buffer description information from three or more modes prepared for generating new buffer description information based on the prediction buffer description information generated from the reference buffer description information and the difference value Decrypt
Decoding the target buffer description information based on the prediction buffer description information and the mode information;
The buffer management module includes:
Controlling the image storage module based on the decoded target buffer description information;
The three or more modes include
At least three modes including a first mode, a second mode, and a third mode that perform different processes from each other are included.
The three or more modes are:
Each indicating a different processing method for generating the target buffer description information from the prediction buffer description information;
The decryption module is
Decoding the compressed image data, decoding the mode information, and decoding the target buffer description information from the prediction buffer description information by the processing method indicated by the mode information. program.
前記画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化ステップと、
前記圧縮画像データを復号し、再生画像に復元する復号ステップと、
前記再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、
前記画像格納手段を制御するバッファ管理ステップと、を具備し、
前記バッファ管理ステップにおいて、
前記画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、前記対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、
前記参照バッファ記述情報の参照画像のピクチャ番号と前記対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、
前記参照バッファ記述情報と前記差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した3以上のモードから、前記対象バッファ記述情報を生成するモード情報を選択し、
前記符号化ステップにおいて、
前記識別情報、前記差分値、前記モード情報を符号化し、
前記3以上のモードには、
少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、
前記3以上のモードは、
それぞれ、前記予測バッファ記述情報から前記対象バッファ記述情報を生成する異なる処理方法を指し示すことを特徴とする動画像予測符号化方法。 An input step for inputting a plurality of images constituting the moving image;
An encoding step for predictively encoding a plurality of images decoded and reproduced after being encoded in the past as reference images, and generating compressed image data;
A decoding step of decoding the compressed image data and restoring the reproduced image;
An image storage step of storing one or more of the reproduced images as reference images used to encode subsequent images by an image storage means;
A buffer management step for controlling the image storage means,
In the buffer management step,
Buffer description information similar to the target buffer description information from a plurality of encoded buffer description information different from target buffer description information related to a plurality of reference images used when predictively encoding the image is referred to as a reference buffer description Searching as information, generating identification information identifying the reference buffer description information,
Calculating a difference value between a picture number of a reference image of the reference buffer description information and a picture number of a target image of the target buffer description information;
The prediction buffer description information is generated from the reference buffer description information and the difference value, and the target buffer description information is obtained from three or more modes prepared for generating new buffer description information based on the prediction buffer description information. Select the mode information to generate,
In the encoding step,
Encode the identification information, the difference value, and the mode information,
The three or more modes include
At least three modes including a first mode, a second mode, and a third mode that perform different processes from each other are included.
The three or more modes are:
A moving picture predictive coding method characterized by indicating a different processing method for generating the target buffer description information from the prediction buffer description information.
前記画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化手段と、
前記圧縮画像データを復号し、再生画像に復元する復号手段と、
前記再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上格納する画像格納手段と、
前記画像格納手段を制御するバッファ管理手段と、を具備し、
前記バッファ管理手段は、
前記画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、前記対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、
前記参照バッファ記述情報の参照画像のピクチャ番号と前記対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、
前記参照バッファ記述情報と前記差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した3以上のモードから、前記対象バッファ記述情報を生成するモード情報を選択し、
前記符号化手段は、
前記識別情報、前記差分値、前記モード情報を符号化し、
前記3以上のモードには、
少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、
前記3以上のモードは、
それぞれ、前記予測バッファ記述情報から前記対象バッファ記述情報を生成する異なる処理方法を指し示すことを特徴とする動画像予測符号化装置。 Input means for inputting a plurality of images constituting a moving image;
Encoding means for predictively encoding a plurality of images decoded and reproduced after being encoded in the past as reference images, and generating compressed image data;
Decoding means for decoding the compressed image data and restoring the reproduced image;
Image storage means for storing one or more of the reproduced images as reference images used to encode subsequent images;
Buffer management means for controlling the image storage means,
The buffer management means includes
Buffer description information similar to the target buffer description information from a plurality of encoded buffer description information different from target buffer description information related to a plurality of reference images used when predictively encoding the image is referred to as a reference buffer description Searching as information, generating identification information identifying the reference buffer description information,
Calculating a difference value between a picture number of a reference image of the reference buffer description information and a picture number of a target image of the target buffer description information;
The prediction buffer description information is generated from the reference buffer description information and the difference value, and the target buffer description information is obtained from three or more modes prepared for generating new buffer description information based on the prediction buffer description information. Select the mode information to generate,
The encoding means includes
Encode the identification information, the difference value, and the mode information,
The three or more modes include
At least three modes including a first mode, a second mode, and a third mode that perform different processes from each other are included.
The three or more modes are:
A moving picture predictive coding apparatus characterized by indicating a different processing method for generating the target buffer description information from the prediction buffer description information, respectively.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012146095A JP5950726B2 (en) | 2012-06-28 | 2012-06-28 | Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012146095A JP5950726B2 (en) | 2012-06-28 | 2012-06-28 | Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014011586A JP2014011586A (en) | 2014-01-20 |
JP5950726B2 true JP5950726B2 (en) | 2016-07-13 |
Family
ID=50107911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012146095A Expired - Fee Related JP5950726B2 (en) | 2012-06-28 | 2012-06-28 | Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5950726B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG10201610882XA (en) * | 2012-06-29 | 2017-02-27 | Sony Corp | Encoding device and encoding method |
KR102585975B1 (en) | 2018-09-12 | 2023-10-05 | 후아웨이 테크놀러지 컴퍼니 리미티드 | Index signaling for reference picture list structure |
-
2012
- 2012-06-28 JP JP2012146095A patent/JP5950726B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014011586A (en) | 2014-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6726340B2 (en) | Image predictive decoding method | |
EP2445215B1 (en) | Dynamic image encoding device and dynamic image decoding device | |
JP5586101B2 (en) | Image predictive encoding device, image predictive encoding method, image predictive encoding program, image predictive decoding device, image predictive decoding method, and image predictive decoding program | |
JP5950726B2 (en) | Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program | |
EP3177019B1 (en) | Motion video prediction decoding method, and motion video prediction decoding device | |
KR20140029369A (en) | Image predict coding device, image predict coding method, image predict coding program, image predict decoding device, image predict decoding method, and image predict decoding program | |
JP6862522B2 (en) | Moving image coding device and moving image decoding device | |
JP6717993B2 (en) | Image predictive decoding method and image predictive decoding apparatus | |
CA3091658C (en) | Video encoding apparatus, video decoding apparatus and related methods | |
JP5957558B2 (en) | Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program | |
KR20180054693A (en) | Method and apparatus for encoding and decoding a video signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160517 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160607 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5950726 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |