JP5950726B2 - Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program - Google Patents

Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program Download PDF

Info

Publication number
JP5950726B2
JP5950726B2 JP2012146095A JP2012146095A JP5950726B2 JP 5950726 B2 JP5950726 B2 JP 5950726B2 JP 2012146095 A JP2012146095 A JP 2012146095A JP 2012146095 A JP2012146095 A JP 2012146095A JP 5950726 B2 JP5950726 B2 JP 5950726B2
Authority
JP
Japan
Prior art keywords
description information
buffer description
information
decoding
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012146095A
Other languages
Japanese (ja)
Other versions
JP2014011586A (en
Inventor
鈴木 芳典
芳典 鈴木
ブン チュンセン
チュンセン ブン
タン ティオ ケン
ティオ ケン タン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2012146095A priority Critical patent/JP5950726B2/en
Publication of JP2014011586A publication Critical patent/JP2014011586A/en
Application granted granted Critical
Publication of JP5950726B2 publication Critical patent/JP5950726B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、動画像予測符号化方法、装置及びプログラム、並びに、動画像予測復号方法、装置及びプログラムに関するもので、とりわけ、画面間の予測符号化に用いられる参照画像のバッファ内の記述に関するものである。   The present invention relates to a moving picture predictive coding method, apparatus and program, and a moving picture predictive decoding method, apparatus and program, and particularly relates to a description in a buffer of a reference picture used for predictive coding between screens. It is.

動画像データの伝送や蓄積を効率よく行うために、圧縮符号化技術が用いられる。動画像の場合ではMPEG1〜4やH.261〜H.264の方式が広く用いられている。   In order to efficiently transmit and store moving image data, a compression encoding technique is used. In the case of moving images, MPEG1-4 and H.264 are used. 261-H. H.264 is widely used.

これらの符号化方式では、符号化の対象となる画像を複数のブロックに分割した上で符号化・復号処理を行う。符号化効率を高めるため下記のような予測符号化方法が用いられる。画面内の予測符号化では、対象ブロックと同じ画面内にある隣接する既再生の画像信号(過去に圧縮された画像データを復元したもの)を用いて予測信号を生成した上で、それを対象ブロックの信号から引き算した差分信号を符号化する。画面間の予測符号化では、対象ブロックと異なる画面内にある既再生の画像信号を参照し、信号の変位を検索し、その動いた分を補償して予測信号を生成し、それを対象ブロックの信号から引き算した差分信号を符号化する。動きの検索・補償を行うために参照される既再生の画像を、参照画像という。   In these encoding methods, encoding / decoding processing is performed after an image to be encoded is divided into a plurality of blocks. In order to increase the encoding efficiency, the following predictive encoding method is used. In predictive coding within a screen, a predicted signal is generated using an adjacent reproduced image signal (reconstructed image data compressed in the past) in the same screen as the target block, and then the target signal is processed. The differential signal subtracted from the block signal is encoded. In predictive coding between screens, reference is made to a previously-reproduced image signal in a different screen from the target block, signal displacement is searched, the motion is compensated, and a predicted signal is generated, and the target block is generated. The difference signal subtracted from the signal is encoded. An already reproduced image that is referred to for motion search / compensation is referred to as a reference image.

非特許文献1に示される画面間予測符号化では、対象ブロックに対する予測信号は、過去に符号化した上で再生された複数の参照画像を参照し、動き検索しながら誤差の最も少ない画像信号を最適な予測信号として選択する。対象ブロックの画素信号とこの最適な予測信号との差分を求め、離散コサイン変換を施し、量子化した上でエントロピー符号化する。同時に、対象ブロックに対する最適な予測信号をどの参照画像から取得するかに関する情報(「参照インデックス」という)、および当該最適な予測信号を参照画像のどの領域から取得するかに関する情報(「動きベクトル」という)も合わせて符号化する。非特許文献1では、再生された複数枚の画像(例えば4ないし5枚)が参照画像としてフレームメモリまたは再生画像バッファ(decoded picture buffer、以下「DBP」ともいう)に格納されている。   In the inter-screen predictive coding shown in Non-Patent Document 1, the prediction signal for the target block refers to a plurality of reference images encoded and reproduced in the past, and an image signal with the least error is obtained while performing motion search. Select as the optimal prediction signal. The difference between the pixel signal of the target block and the optimal prediction signal is obtained, subjected to discrete cosine transform, quantized, and entropy encoded. At the same time, information on which reference image an optimal prediction signal for the target block is acquired (referred to as “reference index”) and information on which region of the reference image the optimal prediction signal is acquired from (“motion vector”) Are also encoded. In Non-Patent Document 1, a plurality of reproduced images (for example, 4 to 5 images) are stored as reference images in a frame memory or a reproduced picture buffer (hereinafter also referred to as “DBP”).

複数枚の参照画像の管理方法として、再生された複数の画像の中で最も古い参照画像(即ち、時間的に一番長い間バッファ内にあるもの)が占領する領域をバッファから開放し、最近に復号された再生画像を参照画像として格納する手法もあるが、非特許文献1には対象画像に最適な参照画像を柔軟に用意する参照画像の管理方法が開示されている。   As a method of managing a plurality of reference images, an area occupied by the oldest reference image (that is, the one that has been in the buffer for the longest time) among a plurality of reproduced images is released from the buffer. Although there is a method of storing the decoded image as a reference image, Non-Patent Document 1 discloses a reference image management method that flexibly prepares a reference image optimal for a target image.

非特許文献1によれば、バッファに格納する複数参照画像の組を記述する情報(Reference picture set、以下「RPS」とよぶ、バッファ記述情報ともよぶ)を各対象画像の符号化データに付加して符号化する。RPS情報には、対象画像並びにそれ以降の画像の処理(符号化または復号)に必要とする複数の参照画像のピクチャ番号に関連する情報が記載されている。符号化装置もしくは復号装置では、RPS情報に従い、指定された再生画像をバッファ(フレームメモリ)に格納するようにバッファが管理される。一方、指定されていない再生画像はバッファから消してよい。非特許文献1では、対象画像を1つ以上の区間に分割したスライスと呼ばれる単位で画面内符号化/復号と画面間符号化/復号を切り替えられるため、スライスのヘッダ情報にてRPS情報を符号化/復号する。スライスについては、非特許文献1に記載されている。   According to Non-Patent Document 1, information describing a set of multiple reference images stored in a buffer (reference picture set, hereinafter referred to as “RPS”, also referred to as buffer description information) is added to the encoded data of each target image. To encode. In the RPS information, information related to picture numbers of a plurality of reference images required for processing (encoding or decoding) of the target image and subsequent images is described. In the encoding device or the decoding device, the buffer is managed so as to store the designated reproduced image in the buffer (frame memory) according to the RPS information. On the other hand, playback images that are not designated may be deleted from the buffer. In Non-Patent Document 1, since intra-screen coding / decoding and inter-screen coding / decoding can be switched in units called slices obtained by dividing the target image into one or more sections, RPS information is encoded using the header information of the slices. Convert / decrypt. The slice is described in Non-Patent Document 1.

RPS情報は、対象画像を識別するピクチャ番号(picture output count、以下「POC」とよぶ)と、対象画面の画面間予測に使われる複数の参照画像を識別するPOCとの間の関連を示す情報にて構成される。この関連情報は、各参照画像のPOCと対象画像のPOCとの差分であり、本明細書ではDeltaPocと表す。   The RPS information is information indicating a relationship between a picture number for identifying a target image (picture output count, hereinafter referred to as “POC”) and a POC for identifying a plurality of reference images used for inter-screen prediction of the target screen. Consists of. This related information is the difference between the POC of each reference image and the POC of the target image, and is represented as DeltaPoc in this specification.

図9と図10でRPS情報の例を説明する。図9は、対象画像と各対象画像を処理する際にフレームメモリ内にある複数参照画像の状態を示す。各升目には、画像を識別するPOCが書かれている。例えば、行1610では、POC=32の対象画像を処理(符号化または復号)する際に、フレームメモリにPOC=18,20,22,24の参照画像が格納されていることを意味する。また、図9に対するRPSを図10に示す。1701はRPS情報を識別するための識別子idxを示し、1704の下にある各升目はRPS情報の要素であるDeltaPocの値を示す。   An example of RPS information will be described with reference to FIGS. FIG. 9 shows a target image and a state of a plurality of reference images in the frame memory when each target image is processed. Each cell has a POC that identifies the image. For example, in row 1610, it means that reference images of POC = 18, 20, 22, 24 are stored in the frame memory when processing (encoding or decoding) a target image of POC = 32. FIG. 10 shows an RPS corresponding to FIG. 1701 indicates an identifier idx for identifying RPS information, and each cell below 1704 indicates a value of DeltaPoc which is an element of RPS information.

RPS情報の符号化には、2つの方法がある。1つは、インターRPS(Inter RPS method)と呼び、既符号化/復号のRPSを参照し、符号化対象のRPSと既符号化のRPSとの関係を予測符号化/復号する方法である。2つは、イントラRPS(Intra RPS method)と呼び、符号化対象のRPSに含まれるDeltaPocの数と値を参照なしで符号化/復号する方法である。本明細書では、1つのRPSに含まれるDeltaPocの組をDeltaPoc[idx][i]と示す。ここで、iはフレームメモリに格納されるi番目の参照画像を示しており、idxは、特定のRPSを識別するための番号を示す。以下では、[i]を省略して記載する場合がある。   There are two methods for encoding RPS information. One is a method called inter RPS (Inter RPS method), which refers to pre-encoded / decoded RPS and predictively encodes / decodes the relationship between the RPS to be encoded and the pre-encoded RPS. The second is called an intra RPS (Intra RPS method), which encodes / decodes the number and value of DeltaPoc included in the RPS to be encoded without reference. In this specification, a set of DeltaPocs included in one RPS is denoted as DeltaPoc [idx] [i]. Here, i indicates the i-th reference image stored in the frame memory, and idx indicates a number for identifying a specific RPS. In the following description, [i] may be omitted.

非対称文献1では、複数スライスに関するRPS情報をまとめて、共通に適用する復号処理のパラメータを運ぶSPS(sequence parameter set)情報に含めて符号化/復号する。スライスヘッダでは、SPSにて符号化/復号したRPS情報の識別子idxを符号化/復号するか、新たなRPS情報を符号化/復号する。   In Asymmetric Literature 1, RPS information related to a plurality of slices is collected and encoded / decoded by being included in SPS (sequence parameter set) information carrying parameters of decoding processing applied in common. In the slice header, the identifier idx of the RPS information encoded / decoded by SPS is encoded / decoded, or new RPS information is encoded / decoded.

図7に、識別子idxで識別されるRPS情報を符号化/復号するためのシンタックステーブルshort_term_ref_pic_set(idx)を示す。SPSで符号化/復号するRPS情報の個数はnum_short_term_ref_pic_setsとしてSPSにて符号化/復号される。つまり、RPSの識別情報idxは0からnum_short_term_ref_pic_sets-1の値で識別される。   FIG. 7 shows a syntax table short_term_ref_pic_set (idx) for encoding / decoding RPS information identified by an identifier idx. The number of RPS information encoded / decoded by SPS is encoded / decoded by SPS as num_short_term_ref_pic_sets. That is, the RPS identification information idx is identified by a value from 0 to num_short_term_ref_pic_sets-1.

inter_ref_pic_set_prediction_flag (R100)は、idxで識別される符号化/復号対象のRPS情報の符号化/復号方法がイントラRPSかインターRPSかを識別するためのシンタックス要素である。このフラグが0の場合には、イントラRPS法でDeltaPoc[idx][i]が符号化/復号される。つまり、符号化/復号対象のRPSに含まれる参照画像の個数と各参照画像に対応するDeltaPocの値を符号化/復号する。例えば、図10のidx=0で識別されるRPS(1710)をイントラRPSで符号化/復号する場合には、DeltaPosの個数4と4個のDeltaPocの値(−14、−12、−10、−8)が符号化/復号される。   inter_ref_pic_set_prediction_flag (R100) is a syntax element for identifying whether the encoding / decoding method of the RPS information to be encoded / decoded identified by idx is intra RPS or inter RPS. When this flag is 0, DeltaPoc [idx] [i] is encoded / decoded by the intra RPS method. That is, the number of reference images included in the RPS to be encoded / decoded and the value of DeltaPoc corresponding to each reference image are encoded / decoded. For example, when RPS (1710) identified by idx = 0 in FIG. 10 is encoded / decoded with intra RPS, the number of DeltaPos is 4 and the value of 4 DeltaPocs (−14, −12, −10, -8) is encoded / decoded.

inter_ref_pic_set_prediction_flag (R100)が1の場合には、既符号化/復号のRPS情報を参照するインターRPSでDeltaPoc[idx][i]が符号化/復号される。delta_idx_minus1(R110)は、インターRPSの予測処理にて参照するRPS情報の識別子RIdxを特定するためのシンタックス要素である。RIdxは式(1)にて復元される。
RIdx=idx‐(delta_idx_minus1+1) (1)
When inter_ref_pic_set_prediction_flag (R100) is 1, DeltaPoc [idx] [i] is encoded / decoded with inter RPS referring to RPS information of already encoded / decoded. delta_idx_minus1 (R110) is a syntax element for specifying the identifier RIdx of the RPS information referred to in the inter-RPS prediction process. RIdx is restored by equation (1).
RIdx = idx- (delta_idx_minus1 + 1) (1)

シンタックス要素delta_rps_signとabs_delta_rps_minus1 (R120)から、2つのRPSの差分値DeltaRPSが式(2)で導出される。DeltaRPSは、RIdxで識別されるRPSのDeltaPocの組と符号化/復号対象のidxで識別されるDeltaPocの組との差分値を示す。例えば、図10で、RIdx=1、idx=2の場合には、その差分値2がDeltaRPSとして符号化/復号される。つまり、delta_rps_sign=0、abs_delta_rps_minus1=1が符号化/復号される。
DeltaRPS=(1‐(delta_rps_sign<<1))*(abs_delta_rps_minus1+1) (2)
From the syntax elements delta_rps_sign and abs_delta_rps_minus1 (R120), the difference value DeltaRPS between the two RPSs is derived by equation (2). DeltaRPS indicates a difference value between a DeltaPoc set of RPS identified by RIdx and a DeltaPoc set identified by idx to be encoded / decoded. For example, in FIG. 10, when RIdx = 1 and idx = 2, the difference value 2 is encoded / decoded as DeltaRPS. That is, delta_rps_sign = 0 and abs_delta_rps_minus1 = 1 are encoded / decoded.
DeltaRPS = (1- (delta_rps_sign << 1)) * (abs_delta_rps_minus1 + 1) (2)

シンタックス要素R130にて、idxで識別されるRPS情報、すなわちDeltaPoc[idx][i]が導出される。具体的には、NumDeltaPocs[RIdx]は、RIdxで識別されるRPS情報に含まれるDeltaPocの個数(図10の1702)を示しており、DeltaPoc[idx][0]からDeltaPoc[idx][NumDeltaPocs[RIdx]]がfor文による繰り返し処理にて導出される。   In syntax element R130, RPS information identified by idx, that is, DeltaPoc [idx] [i] is derived. Specifically, NumDeltaPocs [RIdx] indicates the number of DeltaPocs (1702 in FIG. 10) included in the RPS information identified by RIdx, and DeltaPoc [idx] [0] to DeltaPoc [idx] [NumDeltaPocs [ RIdx]] is derived by iterative processing using a for statement.

used_by_curr_pic_flag[i]は、i番目の参照画像を対象画像の符号化/復号に利用するか否かを示しており、use_delta_flag[i]は、i番目のDeltaPosの導出にDeltaPoc[RIdx][i]を利用するか否かを示している。ここで、used_by_curr_pic_flag[i]が1の場合、use_delta_flag[i]は1となる。use_delta_flag[i]が1の場合、DeltaPoc[idx][i]は式(3)で導出され、use_delta_flag[i]が0の場合、DeltaPoc[idx][i]は式(4)で導出される。
DeltaPoc[idx][i]=DeltaPoc[RIdx][i]+DeltaRPS (3)
DeltaPoc[idx][i]=DeltaRPS (4)
例えば、図10で、RIdx=1、idx=2の場合には、i=0, 1, 2ではuse_delta_flag[i]=1となり、i=3ではuse_delta_flag[i]=0となる。
used_by_curr_pic_flag [i] indicates whether or not the i-th reference image is used for encoding / decoding the target image, and use_delta_flag [i] is DeltaPoc [RIdx] [i] for derivation of the i-th DeltaPos Indicates whether or not to use. Here, when used_by_curr_pic_flag [i] is 1, use_delta_flag [i] is 1. When use_delta_flag [i] is 1, DeltaPoc [idx] [i] is derived from Equation (3), and when use_delta_flag [i] is 0, DeltaPoc [idx] [i] is derived from Equation (4). .
DeltaPoc [idx] [i] = DeltaPoc [RIdx] [i] + DeltaRPS (3)
DeltaPoc [idx] [i] = DeltaRPS (4)
For example, in FIG. 10, when RIdx = 1 and idx = 2, use_delta_flag [i] = 1 when i = 0, 1, 2, and use_delta_flag [i] = 0 when i = 3.

スライスヘッダにて、新たなRPS情報を符号化/復号する場合には、SPSにて利用されていないidx番号であるnum_short_term_ref_pic_setsをシンタックステーブルの入力値として用いる。つまり、シンタックステーブルshort_term_ref_pic_set(num_short_term_ref_pic_sets)を符号化/復号する。   When new RPS information is encoded / decoded in the slice header, num_short_term_ref_pic_sets which is an idx number not used in the SPS is used as an input value of the syntax table. That is, the syntax table short_term_ref_pic_set (num_short_term_ref_pic_sets) is encoded / decoded.

B. Bross et. al., “High efficiency videocoding (HEVC) text specification draft 7”, Joint Collaborative Team on VideoCoding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, JCTVC-I1003, 9thMeeting: Geneva, Switzerland, 27th April ‐7th May, 2012.B. Bross et. Al., “High efficiency videocoding (HEVC) text specification draft 7”, Joint Collaborative Team on VideoCoding (JCT-VC) of ITU-T SG16 WP3 and ISO / IEC JTC1 / SC29 / WG11, JCTVC-I1003 , 9thMeeting: Geneva, Switzerland, 27th April -7th May, 2012.

背景技術で示したRPSの予測手法(インターRPS)は、あらゆるRPSのパターンを表現できる一般的で効率的な方法である。一方、復号装置では、圧縮データのビット列を解析して各要素を復元するとき、過去に復号されたデータの影響を受けずにビット列を解析できると処理が簡易となる。   The RPS prediction method (inter-RPS) shown in the background art is a general and efficient method that can express any RPS pattern. On the other hand, in the decoding device, when restoring each element by analyzing the bit string of the compressed data, the process becomes simple if the bit string can be analyzed without being influenced by the data decoded in the past.

背景技術で示したインターRPSでは、図7に示すシンタックステーブルに、NumDeltaPocs[RIdx]が含まれている。この値は、RIdxによって変化するため、データ解析器がこのRIdxを取得しないと、復号すべき要素(used_by_curr_pic_flagやuse_delta_flag)の数が分からない。そのため、背景技術で示したインターRPSは好ましい方法ではあるが、実用上は圧縮データのビット列の解析処理が複雑になる場合がある。   In the inter-RPS shown in the background art, NumDeltaPocs [RIdx] is included in the syntax table shown in FIG. Since this value changes depending on RIdx, the number of elements (used_by_curr_pic_flag and use_delta_flag) to be decoded is not known unless the data analyzer acquires this RIdx. Therefore, although inter-RPS shown in the background art is a preferable method, in practice, analysis processing of a bit string of compressed data may be complicated.

本発明は上記実情に鑑みてなされたものであり、インターRPSの符号化に要するビット数を削減することにより符号化データの構成を簡潔にし、復号装置における符号化データの解析処理を簡易化することを目的とする。   The present invention has been made in view of the above circumstances, and by simplifying the structure of encoded data by reducing the number of bits required for inter-RPS encoding, the analysis processing of the encoded data in the decoding apparatus is simplified. For the purpose.

本発明に係る動画像予測符号化装置は、動画像を構成する複数の画像を入力する入力手段と、画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化手段と、圧縮画像データを復号し、再生画像に復元する復号手段と、再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上格納する画像格納手段と、画像格納手段を制御するバッファ管理手段と、を具備し、バッファ管理手段は、画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、参照バッファ記述情報の参照画像のピクチャ番号と前記対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、参照バッファ記述情報の各要素と差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した3以上のモードから、対象バッファ記述情報を生成するモード情報を選択し、符号化手段は、識別情報、差分値、モード情報を符号化し、3以上のモードには、少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、3以上のモードは、それぞれ、予測バッファ記述情報から対象バッファ記述情報を生成する異なる処理方法を指し示すことを特徴とする。 The moving image predictive coding apparatus according to the present invention includes an input unit that inputs a plurality of images constituting a moving image, and a predictive code using a plurality of images decoded and reproduced after the images have been coded in the past as reference images. Encoding means for generating compressed image data, decoding means for decoding compressed image data and restoring it to a reproduced image, and one or more reproduced images as reference images used to encode subsequent images Image storage means for storing, and buffer management means for controlling the image storage means, the buffer management means being different from the target buffer description information related to a plurality of reference images used when predictively encoding an image The buffer description information similar to the target buffer description information is searched as reference buffer description information from a plurality of encoded buffer description information, and the reference buffer description information is identified. Generating different information, calculating a difference value between the picture number of the reference image of the reference buffer description information and the picture number of the target image of the target buffer description information, and predicting buffer description from each element and the difference value of the reference buffer description information Information is generated, mode information for generating target buffer description information is selected from three or more modes prepared for generating new buffer description information based on the prediction buffer description information, and the encoding means identifies The information, difference value, and mode information are encoded, and the three or more modes include at least three modes of a first mode, a second mode, and a third mode that perform different processes. Each of the three or more modes is characterized by indicating different processing methods for generating the target buffer description information from the prediction buffer description information .

この動画像予測符号化装置では、背景技術に示したuse_delta_flagのようにRPS情報の各要素に関わる指示情報を符号化する必要がないため、RPS情報の圧縮データをより効率良く符号化することが可能となる。また、対象バッファ記述情報を生成するための方法であって発生頻度が高い方法を、シンタックス要素として予め複数用意しておくことにより、少ない符号要素で効率良く対象バッファ記述情報を符号化することができる。よって、本発明によれば、インターRPSの符号化に要するビット数を削減することにより、符号化データの構成を簡潔にすることができる。   In this moving image predictive encoding device, it is not necessary to encode the instruction information related to each element of the RPS information as in the use_delta_flag shown in the background art, so that the compressed data of the RPS information can be encoded more efficiently. It becomes possible. Also, by preparing in advance a plurality of methods for generating the target buffer description information that are frequently generated as syntax elements, the target buffer description information can be efficiently encoded with a small number of code elements. Can do. Therefore, according to the present invention, the configuration of encoded data can be simplified by reducing the number of bits required for inter-RPS encoding.

また、本発明に係る動画像予測符号化装置において、複数のモードの1つが、予測バッファ記述情報に新要素として差分値を加える処理を行うものであることが好ましい。   In the video predictive coding apparatus according to the present invention, it is preferable that one of the plurality of modes performs a process of adding a difference value as a new element to the prediction buffer description information.

また、本発明に係る動画像予測符号化装置において、複数のモードの1つが、予測バッファ記述情報の要素のうち、値が最小値あるいは最大値の要素を差分値に置き換える処理を行うものであることが好ましい。   In the video predictive coding apparatus according to the present invention, one of the plurality of modes performs processing for replacing the element having the minimum value or the maximum value among the elements of the prediction buffer description information with the difference value. It is preferable.

また、本発明に係る動画像予測符号化装置において、複数のモードの1つが、予測バッファ記述情報を対象バッファ記述情報とする処理を行うものであることが好ましい。   In the moving picture predictive coding apparatus according to the present invention, it is preferable that one of the plurality of modes performs processing using the prediction buffer description information as target buffer description information.

また、本発明に係る動画像予測復号装置は、動画像を構成する複数の画像のそれぞれに対し、過去に復号・再生された複数の画像を参照画像として予測符号化されたデータと、複数の参照画像に関するバッファ記述情報の符号化データとを含む圧縮画像データを入力する入力手段と、圧縮画像データを復号し、再生画像に復元する復号手段と、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納手段と、画像格納手段を制御するバッファ管理手段と、を具備し、復号手段は、再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、参照バッファ記述情報に関するピクチャ番号と対象バッファ記述情報に関するピクチャ番号との差分値を復号し、参照バッファ記述情報と差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、対象バッファ記述情報の復元に用いるモード情報を復号し、予測バッファ記述情報とモード情報に基づいて、対象バッファ記述情報を復号し、バッファ管理手段は、復号された対象バッファ記述情報をもとに画像格納手段を制御し、3以上のモードには、少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、3以上のモードは、それぞれ、予測バッファ記述情報から対象バッファ記述情報を生成する異なる処理方法を指し示し、復号手段は、圧縮画像データを復号してモード情報を復号し、当該モード情報が指し示す処理方法にて、予測バッファ記述情報から対象バッファ記述情報を復号する、ことを特徴とする。 In addition, the video predictive decoding device according to the present invention includes, for each of a plurality of images constituting a video, data that is predictively encoded using a plurality of images decoded and reproduced in the past as reference images, Input means for inputting compressed image data including encoded data of buffer description information relating to a reference image, decoding means for decoding the compressed image data and restoring the reproduced image, and decoding the reproduced image and subsequent images An image storage means for storing one or more reference images used as the reference image, and a buffer management means for controlling the image storage means. The decoding means relates to a plurality of reference images used when decoding the reproduced image. In order to decode the target buffer description information, decoded buffer description information that is different from the target buffer description information and is used for decoding the target buffer description information. Prediction information generated by decoding identification information identifying information as reference buffer description information, decoding a difference value between a picture number related to reference buffer description information and a picture number related to target buffer description information, and the reference buffer description information and the difference value From the three or more modes prepared for generating new buffer description information based on the buffer description information, mode information used for restoring the target buffer description information is decoded, and based on the prediction buffer description information and the mode information, The buffer management means decodes the target buffer description information, and the buffer management means controls the image storage means based on the decoded target buffer description information . The three or more modes include at least a first mode for performing different processes from each other, Three modes of the second mode and the third mode are included, and three or more modes are respectively The decoding means indicates the different processing method for generating the target buffer description information from the measurement buffer description information, the decoding means decodes the compressed image data, decodes the mode information, and from the prediction buffer description information by the processing method indicated by the mode information. The target buffer description information is decoded .

この動画像予測復号装置では、予測バッファ記述情報から対象バッファ記述情報に含まれる要素の個数を取得しなくても、バッファ記述情報に関する圧縮データを解析することができる。また、対象バッファ記述情報を生成するための方法であって発生頻度が高い方法を、シンタックス要素として予め複数用意しておくことにより、少ない符号要素で効率良く対象バッファ記述情報を復号することができる。よって、本発明によれば、復号装置における符号化データの解析処理を簡易化することができる。   In this moving picture predictive decoding apparatus, compressed data related to buffer description information can be analyzed without obtaining the number of elements included in the target buffer description information from the prediction buffer description information. Also, by preparing a plurality of methods for generating the target buffer description information and having a high occurrence frequency as syntax elements in advance, the target buffer description information can be efficiently decoded with a small number of code elements. it can. Therefore, according to the present invention, the analysis processing of the encoded data in the decoding device can be simplified.

また、本発明に係る動画像予測復号装置において、複数のモードの1つが、予測バッファ記述情報に新要素として差分値を加える処理を行うものであることが好ましい。   In the video predictive decoding apparatus according to the present invention, it is preferable that one of the plurality of modes performs a process of adding a difference value as a new element to the prediction buffer description information.

また、本発明に係る動画像予測復号装置において、複数のモードの1つが、予測バッファ記述情報の要素のうち、値が最小値あるいは最大値の要素を差分値に置き換える処理を行うものであることが好ましい。   Further, in the video predictive decoding device according to the present invention, one of the plurality of modes performs processing for replacing the element having the minimum value or the maximum value among the elements of the prediction buffer description information with the difference value. Is preferred.

また、本発明に係る動画像予測復号装置において、複数のモードの1つが、予測バッファ記述情報を対象バッファ記述情報とする処理を行うものであることが好ましい。   In the video predictive decoding apparatus according to the present invention, it is preferable that one of the plurality of modes performs processing using the prediction buffer description information as target buffer description information.

また、本発明に係る動画像予測符号化方法は、動画像を構成する複数の画像を入力する入力ステップと、画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化ステップと、圧縮画像データを復号し、再生画像に復元する復号ステップと、再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、画像格納手段を制御するバッファ管理ステップと、を具備し、バッファ管理ステップにおいて、画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、参照バッファ記述情報の参照画像のピクチャ番号と対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、参照バッファ記述情報と差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した3以上のモードから、対象バッファ記述情報を生成するモード情報を選択し、符号化ステップにおいて、識別情報、差分値、モード情報を符号化し、3以上のモードには、少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、3以上のモードは、それぞれ、予測バッファ記述情報から対象バッファ記述情報を生成する異なる処理方法を指し示すことを特徴とする。 The video predictive encoding method according to the present invention includes an input step of inputting a plurality of images constituting a video, and a plurality of images decoded and reproduced after encoding the images in the past as reference images. An encoding step for predictive encoding and generating compressed image data, a decoding step for decoding compressed image data and restoring it to a reproduced image, and a reproduced image as a reference image used for encoding subsequent images One or more image storage steps stored by the image storage means, and a buffer management step for controlling the image storage means. In the buffer management step, a plurality of reference images used when predictively encoding the image Buffer description information similar to the target buffer description information is referred to from a plurality of encoded buffer description information different from the target buffer description information. Search information as the buffer description information, generating identification information for identifying the reference buffer description information, calculating a difference value between the picture number of the reference image in the reference buffer description information and the picture number of the target image in the target buffer description information, Mode for generating target buffer description information from three or more modes prepared for generating prediction buffer description information from reference buffer description information and difference values and generating new buffer description information based on the prediction buffer description information In the encoding step, the identification information, the difference value, and the mode information are encoded, and the three or more modes include at least a first mode, a second mode, and a third mode that perform at least different processes. The three modes are included. Each of the three or more modes generates target buffer description information from the prediction buffer description information. Wherein the point to different processing methods that.

また、本発明に係る動画像予測符号化プログラムは、動画像を構成する複数の画像を入力する入力モジュールと、画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化モジュールと、圧縮画像データを復号し、再生画像に復元する復号モジュールと、再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上格納する画像格納モジュールと、画像格納モジュールを制御するバッファ管理モジュールと、を具備し、バッファ管理モジュールは、画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、前記対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、参照バッファ記述情報の参照画像のピクチャ番号と対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、参照バッファ記述情報と差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した複数のモードから、対象バッファ記述情報を生成するモード情報を選択し、符号化モジュールは、識別情報、差分値、モード情報を符号化することを特徴とする。   The moving image predictive encoding program according to the present invention includes an input module that inputs a plurality of images constituting a moving image, and a plurality of images that have been decoded and reproduced after having previously encoded the images as reference images. An encoding module that performs predictive encoding and generates compressed image data, a decoding module that decodes compressed image data and restores the image to a reproduced image, and a reproduced image as a reference image used to encode subsequent images An image storage module that stores at least one image, and a buffer management module that controls the image storage module. The buffer management module includes target buffer description information relating to a plurality of reference images used when predictively encoding an image, and The buffer description information similar to the target buffer description information is referred to from a plurality of encoded buffer description information different from each other. Search information as the buffer description information, generating identification information for identifying the reference buffer description information, calculating a difference value between the picture number of the reference image in the reference buffer description information and the picture number of the target image in the target buffer description information, Mode information for generating target buffer description information from a plurality of modes prepared for generating prediction buffer description information from reference buffer description information and difference values, and generating new buffer description information based on the prediction buffer description information And the encoding module encodes the identification information, the difference value, and the mode information.

当該動画像予測符号化方法及び動画像予測符号化プログラムは、上述の動画像予測符号化装置と同様な効果を奏することができる。   The moving picture predictive coding method and the moving picture predictive coding program can achieve the same effects as the above-described moving picture predictive coding apparatus.

また、本発明に係る動画像予測復号方法は、動画像を構成する複数の画像のそれぞれに対し、過去に復号・再生された複数の画像を参照画像として予測符号化されたデータと、複数の参照画像に関するバッファ記述情報の符号化データとを含む圧縮画像データを入力する入力ステップと、圧縮画像データを復号し、再生画像に復元する復号ステップと、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、画像格納手段を制御するバッファ管理ステップと、を具備し、復号ステップにおいて、再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、参照バッファ記述情報に関するピクチャ番号と対象バッファ記述情報に関するピクチャ番号との差分値を復号し、参照バッファ記述情報と差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、対象バッファ記述情報の復元に用いるモード情報を復号し、予測バッファ記述情報とモード情報に基づいて、対象バッファ記述情報を復号し、バッファ管理ステップにおいて、復号された対象バッファ記述情報をもとに画像格納手段を制御し、3以上のモードには、少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、3以上のモードは、それぞれ、予測バッファ記述情報から対象バッファ記述情報を生成する異なる処理方法を指し示し、復号ステップでは、圧縮画像データを復号してモード情報を復号し、当該モード情報が指し示す処理方法にて、予測バッファ記述情報から対象バッファ記述情報を復号する、ことを特徴とする。また、第1のモードは、予測バッファ記述情報に新要素として前記差分値を加える処理を行うモードであり、第2のモードは、予測バッファ記述情報の要素のうち、所定の要素を前記差分値に置き換える処理を行うモードであり、第3のモードは、予測バッファ記述情報を対象バッファ記述情報とする処理を行うモードであってもよい。また、第2のモードは、予測バッファ記述情報の要素のうち、値が最小値あるいは最大値の要素を前記差分値に置き換える処理を行うモードであってもよい。また、復号ステップでは、対象バッファ記述情報にて管理される再生画像が、対象画像の予測処理に利用されるか、或いは、将来の画像の予測処理に利用されるか、を示す利用情報の組をモード情報として復号してもよい。また、3以上のモードは、それぞれ、2ビット又は3ビット以上の情報から一意に特定され、復号ステップでは、前述の2ビット又は3ビット以上の情報から、少なくとも3つ以上のモードを選択して利用してもよい。 In addition, the moving picture predictive decoding method according to the present invention includes, for each of a plurality of pictures constituting a moving picture, a plurality of data that are predictively encoded using a plurality of pictures decoded and reproduced in the past as reference pictures, An input step for inputting compressed image data including encoded data of buffer description information relating to a reference image, a decoding step for decoding the compressed image data and restoring it to a reproduced image, and for decoding the reproduced image and subsequent images One or more reference images used for the image storage, an image storage step for storing by the image storage means, and a buffer management step for controlling the image storage means, and a plurality of reference images used for decoding the reproduced image in the decoding step In order to decode the target buffer description information related to the reference image, the decoded buffer description information is different from the target buffer description information. Decoding the identification information for identifying the buffer description information used for decoding the target buffer description information as the reference buffer description information, decoding the difference value between the picture number related to the reference buffer description information and the picture number related to the target buffer description information. Decoding mode information used for restoring the target buffer description information from three or more modes prepared for generating new buffer description information based on the buffer description information and the prediction buffer description information generated from the difference value; Based on the prediction buffer description information and the mode information, the target buffer description information is decoded. In the buffer management step, the image storage means is controlled based on the decoded target buffer description information. , A first mode, a second mode, and a third mode for performing different processes Three modes are included, and each of the three or more modes indicates different processing methods for generating the target buffer description information from the prediction buffer description information. In the decoding step, the compressed image data is decoded to decode the mode information. The target buffer description information is decoded from the prediction buffer description information by the processing method indicated by the mode information. The first mode is a mode in which the difference value is added as a new element to the prediction buffer description information, and the second mode is a predetermined element among the elements of the prediction buffer description information. The third mode may be a mode for performing processing using the prediction buffer description information as target buffer description information. In addition, the second mode may be a mode in which, among the elements of the prediction buffer description information, a process of replacing an element having a minimum value or a maximum value with the difference value. In the decoding step, a set of usage information indicating whether the reproduced image managed by the target buffer description information is used for prediction processing of the target image or for prediction processing of a future image. May be decoded as mode information. Each of the three or more modes is uniquely identified from information of 2 bits or 3 bits, and in the decoding step, at least 3 modes are selected from the information of 2 bits or 3 bits or more. May be used.

また、本発明に係る動画像予測復号プログラムは、動画像を構成する複数の画像のそれぞれに対し、過去に復号・再生された複数の画像を参照画像として予測符号化されたデータと、複数の参照画像に関するバッファ記述情報の符号化データとを含む圧縮画像データを入力する入力モジュールと、圧縮画像データを復号し、再生画像に復元する復号モジュールと、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納モジュールと、画像格納モジュールを制御するバッファ管理モジュールと、を具備し、復号モジュールは、再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、参照バッファ記述情報に関するピクチャ番号と前記対象バッファ記述情報に関するピクチャ番号との差分値を復号し、参照バッファ記述情報と前記差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、対象バッファ記述情報の復元に用いるモード情報を復号し、予測バッファ記述情報と前記モード情報に基づいて、対象バッファ記述情報を復号し、バッファ管理モジュールは、復号された対象バッファ記述情報をもとに画像格納モジュールを制御し、3以上のモードには、少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、3以上のモードは、それぞれ、予測バッファ記述情報から対象バッファ記述情報を生成する異なる処理方法を指し示し、復号手段は、圧縮画像データを復号してモード情報を復号し、当該モード情報が指し示す処理方法にて、予測バッファ記述情報から対象バッファ記述情報を復号する、ことを特徴とする。 In addition, the moving picture predictive decoding program according to the present invention includes, for each of a plurality of pictures constituting a moving picture, a plurality of pieces of data that are predictively encoded using a plurality of pictures decoded and reproduced in the past as reference pictures, An input module for inputting compressed image data including encoded data of buffer description information relating to a reference image, a decoding module for decoding the compressed image data and restoring it to a reproduced image, and for decoding the reproduced image and subsequent images An image storage module for storing one or more reference images used for the image storage, and a buffer management module for controlling the image storage module, and the decoding module is related to a plurality of reference images used for decoding the reproduced image. In order to decode the target buffer description information, the decoded buffer description information is different from the target buffer description information. Decoding identification information for identifying buffer description information used for decoding buffer description information as reference buffer description information; decoding a difference value between a picture number related to reference buffer description information and a picture number related to the target buffer description information; and Decoding mode information used to restore the target buffer description information from three or more modes prepared for generating new buffer description information based on the description information and the prediction buffer description information generated from the difference value; The target buffer description information is decoded based on the prediction buffer description information and the mode information, and the buffer management module controls the image storage module based on the decoded target buffer description information . At least a first mode, a second mode, and a third mode for performing different processes from each other Three modes are included, and each of the three or more modes indicates different processing methods for generating the target buffer description information from the prediction buffer description information, and the decoding means decodes the compressed image data to obtain the mode information. And the target buffer description information is decoded from the prediction buffer description information by the processing method indicated by the mode information .

当該動画像予測復号方法及び動画像予測復号プログラムは、上述の動画像予測復号装置と同様な効果を奏することができる。   The moving picture predictive decoding method and the moving picture predictive decoding program can achieve the same effects as the above-described moving picture predictive decoding apparatus.

本発明のReference picture set(RPS)の符号化/復号方法によれば、インターRPSの符号化に要するビット数がさらに削減される。また、符号化データの構成が簡潔になるため、復号装置における符号化データの解析処理が簡易化される。   According to the reference picture set (RPS) encoding / decoding method of the present invention, the number of bits required for inter-RPS encoding is further reduced. In addition, since the configuration of the encoded data is simplified, the analysis processing of the encoded data in the decoding device is simplified.

本発明の実施形態による動画像予測符号化装置を示すブロック図である。It is a block diagram which shows the moving image predictive coding apparatus by embodiment of this invention. 本発明の実施形態による動画像予測復号装置を示すブロック図である。It is a block diagram which shows the moving image predictive decoding apparatus by embodiment of this invention. 本発明の実施形態による動画像予測符号化装置におけるバッファ管理方法とRPS情報の符号化方法を示す流れ図である。5 is a flowchart illustrating a buffer management method and an RPS information encoding method in the video predictive encoding device according to the embodiment of the present invention. 本発明の実施形態による動画像予測符号化装置におけるバッファ管理方法の詳細を示す流れ図である。It is a flowchart which shows the detail of the buffer management method in the moving image predictive coding apparatus by embodiment of this invention. 本発明の実施形態による動画像予測復号装置におけるバッファ管理方法とRPS情報の復号方法を示す流れ図である。5 is a flowchart showing a buffer management method and a RPS information decoding method in the video predictive decoding device according to the embodiment of the present invention. 本発明の実施形態による動画像予測復号装置におけるバッファ管理方法の詳細を示す流れ図である。It is a flowchart which shows the detail of the buffer management method in the moving image predictive decoding apparatus by embodiment of this invention. 従来のRPS情報を符号化/復号するためのシンタックステーブルを示す図である。FIG. 10 is a diagram illustrating a syntax table for encoding / decoding conventional RPS information. 本発明の実施形態によるRPS情報を符号化/復号するためのシンタックステーブルを示す図である。FIG. 6 is a diagram illustrating a syntax table for encoding / decoding RPS information according to an embodiment of the present invention. 対象画像と各対象画像を処理する際にフレームメモリ内にある複数参照画像の状態を示す一例である。It is an example which shows the state of the reference image in a frame memory when processing a target image and each target image. 図9の例から求められるRPS情報を示す表である。10 is a table showing RPS information obtained from the example of FIG. 9. 記録媒体に記録されたプログラムを実行するためのコンピュータのハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of the computer for performing the program recorded on the recording medium. 記録媒体に記憶されたプログラムを実行するためのコンピュータの斜視図である。It is a perspective view of a computer for executing a program stored in a recording medium. 図8のinter_rps_modeの例を説明する図である。It is a figure explaining the example of inter_rps_mode of FIG. 図8のinter_rps_modeの別例を説明する図である。It is a figure explaining another example of inter_rps_mode of FIG.

以下、本発明の実施の形態について、図1から図14を用いて説明する。   Hereinafter, embodiments of the present invention will be described with reference to FIGS.

図1は本発明の実施形態による動画像予測符号化装置100を示すブロック図である。図1に示すように、動画像予測符号化装置100は、入力端子101、ブロック分割器102、予測信号生成器103、フレームメモリ104、減算器105、変換器106、量子化器107、逆量子化器108、逆変換器109、加算器110、エントロピー符号化器111、出力端子112、およびバッファ管理器114を備える。入力端子101は特許請求の範囲に記載された「入力手段」に対応する。減算器105、変換器106、量子化器107とエントロピー符号化器111は、特許請求の範囲に記載された「符号化手段」に対応する。また、逆量子化器108、逆変換器109と加算器110は、特許請求の範囲に記載された「復号手段」に対応する。フレームメモリ104は「画像格納手段」、バッファ管理器114は「バッファ管理手段」に対応する。   FIG. 1 is a block diagram showing a moving picture predictive coding apparatus 100 according to an embodiment of the present invention. As shown in FIG. 1, the moving image predictive encoding device 100 includes an input terminal 101, a block divider 102, a prediction signal generator 103, a frame memory 104, a subtractor 105, a converter 106, a quantizer 107, an inverse quantum, and the like. , An adder 110, an entropy encoder 111, an output terminal 112, and a buffer manager 114. The input terminal 101 corresponds to “input means” recited in the claims. The subtractor 105, the converter 106, the quantizer 107, and the entropy encoder 111 correspond to “encoding means” recited in the claims. The inverse quantizer 108, the inverse transformer 109, and the adder 110 correspond to “decoding means” recited in the claims. The frame memory 104 corresponds to “image storage means”, and the buffer manager 114 corresponds to “buffer management means”.

以上のように構成された動画像予測符号化装置100について、以下その動作を述べる。複数枚の画像からなる動画像の信号は入力端子101に入力される。符号化の対象となる画像はブロック分割器102にて、複数の領域に分割される。本発明による実施形態では、8x8の画素からなるブロックに分割されるが、それ以外のブロックの大きさまたは形に分割してもよい。また、複数のブロックサイズや形が1画面に混在してもよい。次に符号化処理の対象となる領域(以下対象ブロックとよぶ)に対して、予測信号を生成する。本発明による実施形態では、画面間予測と画面内予測の2種類の予測方法を用いる。   The operation of the moving picture predictive coding apparatus 100 configured as described above will be described below. A moving image signal composed of a plurality of images is input to the input terminal 101. An image to be encoded is divided into a plurality of regions by the block divider 102. In the embodiment according to the present invention, the block is divided into 8 × 8 pixels, but may be divided into other block sizes or shapes. A plurality of block sizes and shapes may be mixed on one screen. Next, a prediction signal is generated for a region to be encoded (hereinafter referred to as a target block). In the embodiment according to the present invention, two types of prediction methods, inter-screen prediction and intra-screen prediction, are used.

画面間予測では、過去に符号化されたのちに復元された再生画像を参照画像として、この参照画像から対象ブロックに対する誤差の最も小さい予測信号を与える動き情報を求める。また場合に応じて、対象ブロックを再分割し、再分割された小領域に対し画面間予測方法を決定してもよい。この場合、各種の分割方法の中から、対象ブロック全体に対し最も効率のよい分割方法及びそれぞれの動き情報を決定する。本発明による実施形態では、予測信号生成器103にて行われ、対象ブロックはラインL102、参照画像はL104経由で入力される。参照画像としては、過去に符号化され復元された複数枚の画像を参照画像として用いる。詳細は従来の技術であるH.264あるいは非特許文献1に示した方法と同じである。このように決定された動き情報及び小領域の分割方法はラインL112経由でエントロピー符号化器111に送られ符号化した上で出力端子112から送出される。また複数の参照画像の中で、予測信号がどの参照画像から取得するかに関する情報(リファレンスインデックス)もラインL112経由でエントロピー符号化器111に送られる。なお、本発明による実施形態では、3枚ないし6枚の再生画像をフレームメモリ104に格納し、参照画像として用いる。予測信号生成器103では、小領域の分割方法及びそれぞれの小領域に対応する、参照画像と動き情報をもとにフレームメモリ104から参照画像信号を取得し、予測信号を生成する。このように生成された画面間予測信号はラインL103経由で減算器105に送られる。   In inter-screen prediction, a reproduction image that has been encoded in the past and restored as a reference image is used as a reference image to obtain motion information that gives a prediction signal with the smallest error for the target block. Further, according to circumstances, the target block may be subdivided, and the inter-screen prediction method may be determined for the subdivided small area. In this case, the most efficient division method and the respective motion information are determined from the various division methods for the entire target block. In the embodiment according to the present invention, the prediction signal generator 103 inputs the target block via the line L102 and the reference image via L104. As the reference image, a plurality of images encoded and restored in the past are used as the reference image. For details, see the conventional technology H.264. H.264 or the method shown in Non-Patent Document 1. The motion information and the small area dividing method determined in this way are sent to the entropy encoder 111 via the line L112, encoded, and sent out from the output terminal 112. In addition, information (reference index) on which reference image the prediction signal is acquired from among a plurality of reference images is also sent to the entropy encoder 111 via the line L112. In the embodiment according to the present invention, 3 to 6 reproduced images are stored in the frame memory 104 and used as reference images. The prediction signal generator 103 acquires a reference image signal from the frame memory 104 based on the reference image and motion information corresponding to each small region dividing method and each small region, and generates a prediction signal. The inter-screen prediction signal generated in this way is sent to the subtractor 105 via the line L103.

画面内予測では、対象ブロックに空間的に隣接する既再生の画素値を用いて画面内予測信号を生成する。具体的には予測信号生成器103では、フレームメモリ104から同じ画面内にある既再生の画素信号を取得し、これらの信号を外挿することによって画面内予測信号を生成する。外挿の方法に関する情報はラインL112経由でエントロピー符号化器111に送られ符号化した上で出力端子112から送出される。このように生成された画面内予測信号は減算器105に送られる。予測信号生成器103における画面内の予測信号生成方法は、従来の技術であるH.264あるいは非特許文献1に示した方法と同じである。上述のように求められた画面間予測信号と画面内予測信号に対し、誤差の最も小さいものが選択され、減算器105に送られる。   In intra-screen prediction, an intra-screen prediction signal is generated using already reproduced pixel values spatially adjacent to the target block. Specifically, the prediction signal generator 103 acquires already reproduced pixel signals in the same screen from the frame memory 104 and extrapolates these signals to generate an in-screen prediction signal. Information regarding the extrapolation method is sent to the entropy encoder 111 via the line L112, encoded, and sent from the output terminal 112. The intra-screen prediction signal generated in this way is sent to the subtractor 105. The prediction signal generation method in the screen in the prediction signal generator 103 is a conventional technique of H.264. H.264 or the method shown in Non-Patent Document 1. The inter-screen prediction signal and the intra-screen prediction signal obtained as described above are selected with the smallest error and sent to the subtractor 105.

減算器105にて対象ブロックの信号(ラインL102経由)から予測信号(ラインL103経由)を引き算し、残差信号を生成する。この残差信号は変換器106にて離散コサイン変換され、各変換係数は量子化器107にて量子化される。最後にエントロピー符号化器111にて量子化された変換係数を符号化して、予測方法に関する情報とともに出力端子112より送出される。   The subtractor 105 subtracts the prediction signal (via the line L103) from the signal of the target block (via the line L102) to generate a residual signal. The residual signal is subjected to discrete cosine transform by a transformer 106, and each transform coefficient is quantized by a quantizer 107. Finally, the transform coefficient quantized by the entropy encoder 111 is encoded and transmitted from the output terminal 112 together with information on the prediction method.

後続の対象ブロックに対する画面内予測もしくは画面間予測を行うために、圧縮された対象ブロックの信号は逆処理し復元される。すなわち、量子化された変換係数は逆量子化器108にて逆量子化されたのちに逆変換器109にて逆離散コサイン変換され、残差信号を復元する。加算器110にて復元された残差信号とラインL103から送られた予測信号とを加算し、対象ブロックの信号を再生し、フレームメモリ104に格納する。本実施の形態では変換器106と逆変換器109を用いているが、これらの変換器に代わるほかの変換処理を用いてもよい。場合によって、変換器106と逆変換器109がなくてもよい。   In order to perform intra prediction or inter prediction for the subsequent target block, the compressed signal of the target block is inversely processed and restored. That is, the quantized transform coefficient is inversely quantized by the inverse quantizer 108 and then inverse discrete cosine transformed by the inverse transformer 109 to restore the residual signal. The residual signal restored by the adder 110 and the prediction signal sent from the line L103 are added, and the signal of the target block is reproduced and stored in the frame memory 104. In the present embodiment, converter 106 and inverse converter 109 are used, but other conversion processes in place of these converters may be used. In some cases, the converter 106 and the inverse converter 109 may be omitted.

フレームメモリ104は有限なものであり、すべての再生画像を格納することは不可能である。後続の画像の符号化に用いられる再生画像のみフレームメモリ104に格納される。このフレームメモリ104を制御するのがバッファ管理器114である。入力端子113より各画像の出力順序を示す情報(POC、picture output count)や当該画像を符号化するタイプ(画面内予測符号化、画面間予測符号化)が入力され、この情報に基づいてバッファ管理器114が動作する。バッファ管理器114によって生成される情報であり、バッファに格納されている複数の参照画像の組を記述する情報であるReference picture set (RPS)情報や、各画像のPOC情報はラインL114経由でエントロピー符号化器111に送られ、符号化した上で圧縮された画像データとともに出力される。本発明によるバッファ管理器114の処理方法については後述する。   The frame memory 104 is finite and cannot store all reproduced images. Only the reproduced image used for encoding the subsequent image is stored in the frame memory 104. A buffer manager 114 controls the frame memory 104. Information (POC, picture output count) indicating the output order of each image and the type for encoding the image (intra-screen predictive coding, inter-screen predictive coding) are input from the input terminal 113, and the buffer is based on this information. The manager 114 operates. Reference picture set (RPS) information, which is information generated by the buffer manager 114 and describes a set of a plurality of reference images stored in the buffer, and POC information of each image are entropy via a line L114. The data is sent to the encoder 111 and output together with the encoded image data after being encoded. The processing method of the buffer manager 114 according to the present invention will be described later.

次に、本発明による動画像予測復号方法について説明する。図2は本発明の実施形態による動画像予測復号装置200のブロック図を示す。図2に示すように、動画像予測復号装置200は、入力端子201、データ解析器202、逆量子化器203、逆変換器204、加算器205、予測信号生成器208、フレームメモリ207、出力端子206、およびバッファ管理器209を備える。入力端子201は、特許請求の範囲に記載された「入力手段」に対応する。データ解析器202、逆量子化器203と逆変換器204は、特許請求の範囲に記載された「復号手段」に対応する。復号手段としては上記以外のものを用いてもよい。また逆変換器204がなくてもよい。フレームメモリ207は「画像格納手段」、バッファ管理器209は「バッファ管理手段」に対応する。   Next, the video predictive decoding method according to the present invention will be described. FIG. 2 shows a block diagram of a video predictive decoding apparatus 200 according to an embodiment of the present invention. As shown in FIG. 2, the moving picture predictive decoding apparatus 200 includes an input terminal 201, a data analyzer 202, an inverse quantizer 203, an inverse transformer 204, an adder 205, a prediction signal generator 208, a frame memory 207, and an output. A terminal 206 and a buffer manager 209 are provided. The input terminal 201 corresponds to “input means” recited in the claims. The data analyzer 202, the inverse quantizer 203, and the inverse transformer 204 correspond to “decoding means” recited in the claims. A decoding means other than those described above may be used. Further, the inverse converter 204 may not be provided. The frame memory 207 corresponds to “image storage means”, and the buffer manager 209 corresponds to “buffer management means”.

以上のように構成された動画像予測復号装置200について、以下その動作を述べる。上述した方法で圧縮符号化された圧縮データは入力端子201から入力される。この圧縮データには、画像を複数のブロックに分割された対象ブロックを予測し符号化された残差信号及び予測信号の生成に関連する情報が含まれている。予測信号の生成に関連する情報として、画面間予測の場合はブロック分割に関する情報(ブロックのサイズ)や、動き情報と上述のPOC情報が含まれ、画面内予測の場合は周辺の既再生の画素から外挿方法に関する情報が含まれている。また、圧縮データにはフレームメモリ207を制御するためのRPS情報も含まれている。   The operation of the video predictive decoding apparatus 200 configured as described above will be described below. The compressed data compressed and encoded by the method described above is input from the input terminal 201. The compressed data includes a residual signal encoded by predicting a target block obtained by dividing an image into a plurality of blocks, and information related to generation of a prediction signal. Information related to the generation of the prediction signal includes information related to block division (block size) in the case of inter-screen prediction, motion information and the above-mentioned POC information, and in the case of intra-screen prediction, the surrounding already reproduced pixels. Contains information on extrapolation methods. The compressed data also includes RPS information for controlling the frame memory 207.

データ解析器202は、圧縮データから対象ブロックの残差信号、予測信号の生成に関連する情報、量子化パラメータ、画像のPOC情報を抽出する。対象ブロックの残差信号は逆量子化器203にて量子化パラメータ(ラインL202経由)をもとに逆量子化される。その結果は逆変換器204にて逆離散コサイン変換される。   The data analyzer 202 extracts the residual signal of the target block, information related to generation of the prediction signal, the quantization parameter, and the POC information of the image from the compressed data. The residual signal of the target block is inversely quantized by the inverse quantizer 203 based on the quantization parameter (via the line L202). The result is subjected to inverse discrete cosine transform by an inverse transformer 204.

次に、ラインL206b経由で予測信号の生成に関連する情報が予測信号生成器208に送られる。予測信号生成器208では、予測信号の生成に関連する情報に基づいて、フレームメモリ207にアクセスし、複数の参照画像の中から参照信号を取得し予測信号を生成する。この予測信号はラインL208経由で加算器205に送られ、復元された残差信号に加算され、対象ブロック信号を再生し、ラインL205経由で出力すると同時にフレームメモリ207に格納される。   Next, information related to the generation of the prediction signal is sent to the prediction signal generator 208 via the line L206b. The prediction signal generator 208 accesses the frame memory 207 based on information related to generation of a prediction signal, acquires a reference signal from a plurality of reference images, and generates a prediction signal. This prediction signal is sent to the adder 205 via the line L208, added to the restored residual signal, reproduces the target block signal, and is output via the line L205 and stored in the frame memory 207 at the same time.

フレームメモリ207には、後続の画像の復号・再生に用いられる再生画像が格納されている。バッファ管理器209はフレームメモリ207を制御する。バッファ管理器209は、ラインL206a経由で送られるRPS情報と画像の符号化タイプに関する情報に基づいて動作する。本発明によるバッファ管理器209の制御方法については後述する。   The frame memory 207 stores a reproduced image used for decoding / reproducing subsequent images. The buffer manager 209 controls the frame memory 207. The buffer manager 209 operates based on the RPS information sent via the line L206a and information on the image coding type. A method for controlling the buffer manager 209 according to the present invention will be described later.

次に、図8と図3と図5を用いて、RPS情報によるバッファ管理器(図1の114と図2の209)の制御方法ならびにエントロピー符号化器111とデータ解析器202におけるRPS情報の符号化/復号方法を説明していくが、図面の説明準備のため、RPS情報と、そのデータ圧縮方法の考え方について先に説明する。   Next, the control method of the buffer manager (114 in FIG. 1 and 209 in FIG. 2) by the RPS information and the RPS information in the entropy encoder 111 and the data analyzer 202 will be described with reference to FIGS. The encoding / decoding method will be described, but RPS information and the concept of the data compression method will be described first in preparation for explaining the drawings.

まず、RPS情報について説明する。本発明の実施形態によるバッファ管理器114(209)では、再生画像バッファ(decoded picture buffer、「DBP」ともいう)、つまりフレームメモリ104(207)を、それに格納する複数の参照画像の組を記述する情報(Reference picture set、以下「RPS」とよぶ、バッファ記述情報ともよぶ)に基づいて管理する。すなわちRPS情報がバッファ管理情報として機能する。そして、RPS情報は図1のエントロピー符号化器111ならびに図2のデータ解析器にて符号化/復号される。   First, RPS information will be described. In the buffer manager 114 (209) according to the embodiment of the present invention, a reproduced picture buffer (also referred to as “DBP”), that is, a frame memory 104 (207), describes a set of a plurality of reference images stored therein. Management based on information (Reference picture set, hereinafter referred to as “RPS”, also referred to as buffer description information). That is, the RPS information functions as buffer management information. The RPS information is encoded / decoded by the entropy encoder 111 in FIG. 1 and the data analyzer in FIG.

RPS情報は、フレームメモリ207に格納されると共に対象画像あるいは未来に符号化/復号される画像の画面間予測で利用される複数の参照画像を識別するピクチャ番号(picture output count、以下「POC」とよぶ)と、対象画像を識別するPOC番号との関連(差分)を示す情報である。   The RPS information is stored in the frame memory 207 and is a picture number (picture output count, hereinafter referred to as “POC”) that identifies a plurality of reference images used for inter-screen prediction of a target image or an image to be encoded / decoded in the future. This is information indicating a relationship (difference) between the POC number for identifying the target image.

図9と図10でRPS情報の例を説明する。本明細書では、1つの参照画像のPOCと対象画像のPOCの関係をDeltaPocと表す。図9は、対象画像と各対象画像を処理する際にフレームメモリ207内にある複数参照画像の状態を示す。各升目には、画像を識別するPOCが書かれている。例えば、行1610では、POC=32の対象画像を処理(符号化または復号)する際に、フレームメモリにPOC=18,20,22,24の参照画像が格納されていることを意味する。また、図9に対するRPSを図10に示す。1701はRPS情報を識別するための識別子idxを示し、1704の下にある各升目はRPS情報の要素であるDeltaPocの値を示す。   An example of RPS information will be described with reference to FIGS. In this specification, the relationship between the POC of one reference image and the POC of the target image is represented as DeltaPoc. FIG. 9 shows the state of a plurality of reference images in the frame memory 207 when the target image and each target image are processed. Each cell has a POC that identifies the image. For example, in row 1610, it means that reference images of POC = 18, 20, 22, 24 are stored in the frame memory when processing (encoding or decoding) a target image of POC = 32. FIG. 10 shows an RPS corresponding to FIG. 1701 indicates an identifier idx for identifying RPS information, and each cell below 1704 indicates a value of DeltaPoc which is an element of RPS information.

次に、RPS情報のデータ圧縮方法の考え方について、概要を説明する。図9に示すように、フレームメモリ207に格納される参照画像の組はフレームを跨いで互いに似通っている。そこで、本実施形態の符号化装置では、複数枚の対象画像のそれぞれに対するRPS情報をまとめて複数個生成し、共通に適用する復号処理のパラメータを運ぶSPS(sequence parameter set)情報またはPPS(picture parameter set)情報の一部として送る。復号装置ではSPS情報またはPPS情報からRPS情報を抽出し、各対象画像の圧縮データ(例えばスライスヘッダのデータ)に指定された一つのRPS情報に基づいて、フレームメモリ内にある参照画像を用意した上で復号・再生処理を行う。RPS情報に記載されていない参照画像はフレームメモリから消され、それ以降参照画像として用いることができない。   Next, an outline of the concept of the data compression method of RPS information will be described. As shown in FIG. 9, the sets of reference images stored in the frame memory 207 are similar to each other across the frames. Therefore, in the encoding apparatus of the present embodiment, a plurality of RPS information for each of a plurality of target images is generated collectively, and SPS (sequence parameter set) information or PPS (picture parameter) that carries parameters for decoding processing to be applied in common. parameter set) sent as part of the information. In the decoding device, RPS information is extracted from SPS information or PPS information, and a reference image in the frame memory is prepared based on one RPS information specified in compressed data (for example, slice header data) of each target image. Decoding and playback processing is performed above. Reference images not described in the RPS information are erased from the frame memory and cannot be used as reference images thereafter.

上記のとおり、フレームメモリ管理のため対象画像毎に一つのRPS情報を利用するが、非特許文献1の符号化/復号方法では、対象画像を1つ以上の区間に分割したスライス(この単位で画面内符号化/復号と画面間符号化/復号を切り替えられる)のヘッダ情報にて、1つのRPS情報を指示する。スライスについては、非特許文献1に記載されている。   As described above, one RPS information is used for each target image for frame memory management. However, in the encoding / decoding method of Non-Patent Document 1, a slice obtained by dividing the target image into one or more sections (in this unit) One RPS information is indicated by the header information (switching between intra-screen encoding / decoding and inter-screen encoding / decoding). The slice is described in Non-Patent Document 1.

本発明においては、RPS情報は、ピクチャヘッダあるいはスライスヘッダ単位で1つのRPS情報を指示する。対象画像で利用するRPS情報を指示する方法は2つある。1つは、SPSまたはPPSにて符号化/復号したRPS情報の識別子idxをピクチャヘッダあるいはスライスヘッダにて符号化/復号することにより指示する。2つは、新たなRPS情報をピクチャヘッダあるいはスライスヘッダにて符号化/復号する。   In the present invention, the RPS information indicates one RPS information for each picture header or slice header. There are two methods for instructing RPS information used in the target image. One is instructed by encoding / decoding an identifier idx of RPS information encoded / decoded by SPS or PPS using a picture header or a slice header. Second, new RPS information is encoded / decoded by a picture header or a slice header.

SPS/PPSあるいはピクチャ/スライスヘッダで符号化/復号される新たなRPS情報の符号化/復号には2つの方法がある。1つは、インターRPS(Inter RPS method)と呼び、既符号化/復号のRPSを参照し、符号化対象のRPSと既符号化のRPSとの関係を予測符号化/復号する方法である。2つは、イントラRPS(Intra RPS method)と呼び、符号化/復号対象のRPSに含まれるDeltaPocの個数と値を参照なしで符号化/復号する。本明細書では、1つのRPSに含まれるDeltaPocの組をDeltaPoc[idx][i]と示す。ここで、iはフレームメモリに格納されるi番目の参照画像を示しており、idxは、特定のRPSを識別するための番号(識別子)を示す。なお、以下では[i]を省略して記載する場合がある。   There are two methods for encoding / decoding new RPS information encoded / decoded by SPS / PPS or picture / slice header. One is a method called inter RPS (Inter RPS method), which refers to pre-encoded / decoded RPS and predictively encodes / decodes the relationship between the RPS to be encoded and the pre-encoded RPS. The second is called intra RPS (Intra RPS method), which encodes / decodes the number and value of DeltaPocs included in the RPS to be encoded / decoded without reference. In this specification, a set of DeltaPocs included in one RPS is denoted as DeltaPoc [idx] [i]. Here, i represents the i-th reference image stored in the frame memory, and idx represents a number (identifier) for identifying a specific RPS. In the following description, [i] may be omitted.

次に、図8と図3と図5を用いて、RPS情報によるバッファ管理器(図1の114と図2の209)の制御方法ならびにエントロピー符号化器111とデータ解析器202におけるRPS情報の符号化/復号方法を説明する。   Next, the control method of the buffer manager (114 in FIG. 1 and 209 in FIG. 2) by the RPS information and the RPS information in the entropy encoder 111 and the data analyzer 202 will be described with reference to FIGS. An encoding / decoding method will be described.

図8は、idxで識別される新たなRPS情報を符号化/復号するためのシンタックステーブルshort_term_ref_pic_set(idx)を示す。SPSあるいはPPSで符号化/復号するRPS情報の個数はnum_short_term_ref_pic_setsとしてSPSまたはPPSにて符号化/復号される。つまり、SPSまたはPPSにて符号化/復号されるRPS情報は、識別子idx(idxは0からnum_short_term_ref_pic_sets-1の範囲の整数)で識別される。   FIG. 8 shows a syntax table short_term_ref_pic_set (idx) for encoding / decoding new RPS information identified by idx. The number of RPS information encoded / decoded by SPS or PPS is encoded / decoded by SPS or PPS as num_short_term_ref_pic_sets. That is, RPS information encoded / decoded by SPS or PPS is identified by an identifier idx (idx is an integer in the range of 0 to num_short_term_ref_pic_sets-1).

inter_ref_pic_set_prediction_flag (R200)は、idxで識別される符号化/復号対象のRPS情報の符号化/復号方法がイントラRPSかインターRPSかを識別するためのシンタックス要素である。このフラグが0の場合には、イントラRPS法でDeltaPoc[idx]が符号化/復号される。つまり、符号化/復号対象のRPSに含まれる参照画像の個数と各参照画像に対応するDeltaPocの値を符号化/復号する。例えば、図10のidx=0で識別されるRPS(1710)をイントラRPSで符号化/復号する場合には、DeltaPosの個数4と4個のDeltaPocの値(−14、−12、−10、−8)が符号化/復号される。   inter_ref_pic_set_prediction_flag (R200) is a syntax element for identifying whether the encoding / decoding method of the RPS information to be encoded / decoded identified by idx is intra RPS or inter RPS. When this flag is 0, DeltaPoc [idx] is encoded / decoded by the intra RPS method. That is, the number of reference images included in the RPS to be encoded / decoded and the value of DeltaPoc corresponding to each reference image are encoded / decoded. For example, when RPS (1710) identified by idx = 0 in FIG. 10 is encoded / decoded with intra RPS, the number of DeltaPos is 4 and the value of 4 DeltaPocs (−14, −12, −10, -8) is encoded / decoded.

inter_ref_pic_set_prediction_flag (R200)が1の場合には、既符号化/復号のRPS情報を参照するインターRPSでDeltaPoc[idx][i]が符号化/復号される。delta_idx_minus1(R210)は、インターRPSの予測処理にて参照するRPS情報の識別子RIdxを特定するためのシンタックス要素である。RIdxは式(5)にて復元される。
RIdx=idx‐(delta_idx_minus1+1) (5)
When inter_ref_pic_set_prediction_flag (R200) is 1, DeltaPoc [idx] [i] is encoded / decoded by inter-RPS that refers to RPS information of already encoded / decoded information. delta_idx_minus1 (R210) is a syntax element for specifying the identifier RIdx of the RPS information referred to in the inter-RPS prediction process. RIdx is restored by equation (5).
RIdx = idx- (delta_idx_minus1 + 1) (5)

シンタックス要素delta_rps (R220)は、正または負の整数であり、RIdxで識別されるRPSのDeltaPocの組と符号化/復号対象のidxで識別されるDeltaPocの組との差分値DeltaRPSを示す。なお、delta_rpsは図7のシンタックス要素R120(abs_delta_rps_minus1とdelta_rps_sign)で示したように、その絶対値と正負の符号に分けて符号化/復号するようにしてもよい。
DeltaRPS = delta_rps (6)
例えば、図10で、RIdx=1、idx=2の場合には、その差分値2がdelta_rpsとして符号化/復号される。対象となるRPSの各要素DeltaPoc[idx][i]とその個数NumDeltaPocs[idx]は式(7)、式(8)に示すように算出される。NumDeltaPocs[idx]は、idxで識別されるRPS情報に含まれるDeltaPocの個数(図10の1702)を示す。また式(7)にて算出されるDeltaPoc[idx][i]と後述するinter_rps_modeにて最終的な対象RPS情報が決定するため,式(7)のDeltaPoc[idx][i]は,対象RPS情報(対象バッファ記述情報)に対する予測RPS情報(予測バッファ記述情報)の位置づけとなる。
DeltaPoc[idx][i]=DeltaPoc[RIdx][i]+DeltaRPS (7)
ここで、i=0 to (NumDeltaPocs[RIdx]-1)
NumDeltaPocs[idx] = NumDeltaPocs[RIdx] (8)
The syntax element delta_rps (R220) is a positive or negative integer, and indicates a difference value DeltaRPS between the DeltaPoc set of RPS identified by RIdx and the DeltaPoc set identified by idx to be encoded / decoded. Note that delta_rps may be encoded / decoded separately as shown in the syntax element R120 (abs_delta_rps_minus1 and delta_rps_sign) in FIG.
DeltaRPS = delta_rps (6)
For example, in FIG. 10, when RIdx = 1 and idx = 2, the difference value 2 is encoded / decoded as delta_rps. Each RPS element DeltaPoc [idx] [i] and the number NumDeltaPocs [idx] of the target RPS are calculated as shown in equations (7) and (8). NumDeltaPocs [idx] indicates the number of DeltaPocs included in the RPS information identified by idx (1702 in FIG. 10). In addition, since the final target RPS information is determined by DeltaPoc [idx] [i] calculated by Expression (7) and inter_rps_mode described later, DeltaPoc [idx] [i] of Expression (7) is the target RPS. This is the positioning of predicted RPS information (predicted buffer description information) with respect to information (target buffer description information).
DeltaPoc [idx] [i] = DeltaPoc [RIdx] [i] + DeltaRPS (7)
Where i = 0 to (NumDeltaPocs [RIdx] -1)
NumDeltaPocs [idx] = NumDeltaPocs [RIdx] (8)

シンタックス要素inter_rps_mode(R230)は、本発明の重要な特徴である。本発明では、対象となるRPS情報(idxで識別、対象RPS情報や対象バッファ記述情報ともよぶ)を、参照するRPS(RIdxで識別、参照RPS情報や参照バッファ記述情報ともよぶ)に基づいて導出する方法を複数用意する。より具体的には式(7)と式(8)から最終的な対象RPS情報を生成するための方法を予め複数用意する。この際、発生頻度が高い方法をinter_rps_modeとして用意することにより、図7で説明したシンタックスと比較して少ない符号要素で効率良くRPS情報を符号化/復号できる。また、このとき、inter_rps_mode(R230)の符号化/復号においては、図7のシンタックス要素R130のように参照RPSの要素(DeltaPoc)の個数NumDeltaPocs[RIdx]を必要としない。
ここでは、inter_rps_modeを1ビット信号(2つのモード)とする。
The syntax element inter_rps_mode (R230) is an important feature of the present invention. In the present invention, target RPS information (identified by idx, also called target RPS information or target buffer description information) is derived based on RPS to be referenced (identified by RIdx, also called reference RPS information or reference buffer description information). Prepare multiple methods to do this. More specifically, a plurality of methods for generating final target RPS information from Formula (7) and Formula (8) are prepared in advance. At this time, by preparing a method having a high occurrence frequency as inter_rps_mode, it is possible to efficiently encode / decode RPS information with fewer code elements than the syntax described in FIG. At this time, in the encoding / decoding of inter_rps_mode (R230), the number NumDeltaPocs [RIdx] of the reference RPS elements (DeltaPoc) is not required unlike the syntax element R130 of FIG.
Here, inter_rps_mode is a 1-bit signal (two modes).

inter_rps_modeが0のときは、式(7)と式(8)に加えて、式(9)と式(10)を実施し、1つの新たなDeltaPocを対象RPS情報に追加する。
DeltaPoc[idx][NumDeltaPocs[RIdx]]=DeltaRPS (9)
NumDeltaPocs[idx] = NumDeltaPocs[RIdx]+1 (10)
例えば、図10で、RIdx=1としたとき、idx=2のRPS情報はdelta_idx_minus1=0、delta_rps=2、inter_rps_mode=0とすることで実現できる。
inter_rps_modeが1のときは、式(7)と式(8)に加えて、予め設定した条件を満たすDeltaPoc[idx][j]の値をDeltaRPSに置き換える。条件jとしては、例えば、DeltaPoc[idx][j]の値が最大となるjが選ばれる。条件jの決定方法はこれに限定されない。jの値を符号化/復号するようにしてもよいし、予めjの値を決めておいてもよいし、idx、delta_rps, delta_idx_munus1などの情報からjの値を決めてよい。
When inter_rps_mode is 0, in addition to Expression (7) and Expression (8), Expression (9) and Expression (10) are performed, and one new DeltaPoc is added to the target RPS information.
DeltaPoc [idx] [NumDeltaPocs [RIdx]] = DeltaRPS (9)
NumDeltaPocs [idx] = NumDeltaPocs [RIdx] +1 (10)
For example, when RIdx = 1 in FIG. 10, the RPS information with idx = 2 can be realized by setting delta_idx_minus1 = 0, delta_rps = 2, and inter_rps_mode = 0.
When inter_rps_mode is 1, in addition to Expressions (7) and (8), the value of DeltaPoc [idx] [j] that satisfies a preset condition is replaced with DeltaRPS. As the condition j, for example, j that maximizes the value of DeltaPoc [idx] [j] is selected. The method for determining the condition j is not limited to this. The value of j may be encoded / decoded, the value of j may be determined in advance, or the value of j may be determined from information such as idx, delta_rps, and delta_idx_munus1.

上記では、inter_rps_modeを1ビット信号(2モード)としたが、これに限定されない。例えば、図13の1300に示すように2ビット情報(4モード)とし、DeltaPoc[idx][j]の値が最小となるjについてDeltaPoc[idx][j]の値をDeltaRPSに置き換えるモードや、式(7)と式(8)の結果を変更せずにそのまま対象RPS情報とするモードを追加してもよい。また、図14の1400に示すように値が最大あるいは最小となる要素(DeltaPoc)を対象RPSから削除するモードや、値が最大あるいは最小となる要素のみを対象RPSの残すモードや、値が負のDeltaPocのみを対象RPSに残すモードを加えても良い。モードの数やモードの飲み合わせは限定されない。9個のモードを用いても良いし、9個からいくつかを選択して利用してもよい。利用するモードをSPS情報またはPPS情報に含めて指示するようにしてもよい。   In the above, inter_rps_mode is a 1-bit signal (2 modes), but is not limited thereto. For example, as shown in 1300 in FIG. 13, 2-bit information (4 modes) is used, and a mode in which the value of DeltaPoc [idx] [j] is replaced with DeltaRPS for j where the value of DeltaPoc [idx] [j] is minimum, A mode in which the results of Expression (7) and Expression (8) are not changed and the target RPS information is used as it is may be added. Further, as shown by 1400 in FIG. 14, the mode in which the element having the maximum or minimum value (DeltaPoc) is deleted from the target RPS, the mode in which only the element having the maximum or minimum value is left in the target RPS, or the value is negative. A mode may be added in which only the DeltaPoc is left in the target RPS. The number of modes and mode drinking are not limited. Nine modes may be used, or some of the nine modes may be selected and used. The mode to be used may be instructed by including it in the SPS information or the PPS information.

なお、スライスヘッダにて、新たなRPS情報を符号化/復号する場合には、SPSまたはPPSにて利用されていないidx番号であるnum_short_term_ref_pic_setsをシンタックステーブルの入力値として用いる。つまり、シンタックステーブルshort_term_ref_pic_set(num_short_term_ref_pic_sets)を符号化/復号する。   When new RPS information is encoded / decoded in the slice header, num_short_term_ref_pic_sets, which is an idx number not used in SPS or PPS, is used as an input value of the syntax table. That is, the syntax table short_term_ref_pic_set (num_short_term_ref_pic_sets) is encoded / decoded.

次に、図3と図5を用いて、バッファ管理器(図1の114と図2の209)ならびにエントロピー符号化器111とデータ解析器202の動作を説明する。   Next, operations of the buffer manager (114 in FIG. 1 and 209 in FIG. 2), the entropy encoder 111, and the data analyzer 202 will be described with reference to FIGS.

図3は本発明の実施形態による動画像予測符号化装置100のバッファ管理器114ならびにエントロピー符号化器111における1つのRPS情報の符号化方法を示す流れ図である。   FIG. 3 is a flowchart showing one RPS information encoding method in the buffer manager 114 and the entropy encoder 111 of the video predictive encoding device 100 according to the embodiment of the present invention.

図3のステップ510では、バッファ管理器114が、インターRPS法を用いた対象RPSの符号化に適した参照RPSが存在するかを判断する。なお、対象RPSの符号化に適した参照RPSとは、対象RPSに類似するRPSを有する参照RPSをいい、RPSが類似するか否かは、例えば、DeltaPocの個数やDeltaPocの値の相違により、類似を判断するようにしてもよいが、これに限るものではなく、符号化効率の高くなるような参照RPSを選択するようにすることが好ましい。ステップ510の詳細は図4にて後述する。   In step 510 of FIG. 3, the buffer manager 114 determines whether there is a reference RPS suitable for encoding the target RPS using the inter-RPS method. Note that the reference RPS suitable for encoding the target RPS refers to a reference RPS having an RPS similar to the target RPS, and whether or not the RPS is similar depends on, for example, the number of DeltaPocs and the value of the DeltaPoc. Although similarity may be determined, the present invention is not limited to this, and it is preferable to select a reference RPS that increases coding efficiency. Details of step 510 will be described later with reference to FIG.

ステップ510にて、バッファ管理器114がインターRPS法(バッファ記述情報予測符号化)を用いた対象RPSの符号化に適した参照RPSが存在しないと判断した場合には、ステップ570に進む。ステップ570では、バッファ管理器114がinter_rps_prediction_flagを0に設定し、エントロピー符号化器111がinter_rps_prediction_flagをエントロピー符号化する。次にステップ580にて、バッファ管理114が対象RPSに含まれるDeltaPocの個数と値をエントロピー符号化器111で符号化し、処理を終了する。   If the buffer manager 114 determines in step 510 that there is no reference RPS suitable for encoding the target RPS using the inter RPS method (buffer description information predictive encoding), the process proceeds to step 570. In step 570, the buffer manager 114 sets inter_rps_prediction_flag to 0, and the entropy encoder 111 performs entropy encoding on inter_rps_prediction_flag. Next, at step 580, the buffer management 114 encodes the number and value of DeltaPocs included in the target RPS by the entropy encoder 111, and the process ends.

ステップ510にて、バッファ管理器114がインターRPS法(バッファ記述情報予測符号化方法)を用いた対象RPSの符号化に適した参照RPSが存在すると判断した場合には、バッファ管理器114は、RIdxとDeltaRPSと図13に示すinter_rps_mode(図4ではModeと示す)を導出し、ステップ520に進む。ここでは、図13を例とするがinter_rps_modeの種類は図13に限定されない。ステップ520では、バッファ管理器114がinter_rps_prediction_flagを1に設定し、エントロピー符号化器111がinter_rps_prediction_flagをエントロピー符号化する。ステップ530では、バッファ管理器114が対象RPSのインターRPS法に適したRPSとして選択した参照RPSを識別する識別子RIdxと対象RPSを識別するidxの差分値delta_idx_minus1(=idx ‐ RIdx ‐ 1)である識別情報を、エントロピー符号化器111にて符号化する。なお、ステップ530では、識別情報として、差分値delta_idx_minus1を符号化しているが、符号化される識別情報はこれに限定されず、参照RPSを識別可能なものであればよく、例えば、参照RPSを識別する識別子RIdxを識別情報として符号化してもよい。ステップ540では、バッファ管理器114にて導出したdelta_rpsをDeltaRPSとしてエントロピー符号化器111が符号化する。なお、delta_rpsは図7のシンタックス要素R120(abs_delta_rps_minus1とdelta_rps_sign)で示したように、その絶対値と正負の符号に分けて符号化するようにしてもよい。最後に、ステップ550では、バッファ管理器114にて導出したinter_rps_modeをエントロピー符号化器111が符号化する。なお、エントロピー符号化器111における各符号化要素のエントロピー符号化方法は限定されないが、可変長符号化や算術符号化が適用できる。   If the buffer manager 114 determines in step 510 that there is a reference RPS suitable for encoding the target RPS using the inter-RPS method (buffer description information predictive coding method), the buffer manager 114 RIdx, DeltaRPS, and inter_rps_mode shown in FIG. 13 (shown as Mode in FIG. 4) are derived, and the process proceeds to step 520. Here, FIG. 13 is taken as an example, but the type of inter_rps_mode is not limited to FIG. 13. In step 520, the buffer manager 114 sets inter_rps_prediction_flag to 1, and the entropy encoder 111 entropy encodes inter_rps_prediction_flag. In Step 530, the difference value delta_idx_minus1 (= idx−RIdx−1) between the identifier RIdx for identifying the reference RPS selected by the buffer manager 114 as the RPS suitable for the inter-RPS method of the target RPS and the idx for identifying the target RPS. The identification information is encoded by the entropy encoder 111. In step 530, the difference value delta_idx_minus1 is encoded as the identification information. However, the identification information to be encoded is not limited to this, and any information that can identify the reference RPS may be used. The identifier RIdx for identifying may be encoded as identification information. In step 540, the entropy encoder 111 encodes delta_rps derived by the buffer manager 114 as DeltaRPS. Note that delta_rps may be encoded by dividing it into its absolute value and positive / negative sign as shown by the syntax element R120 (abs_delta_rps_minus1 and delta_rps_sign) in FIG. Finally, in step 550, the entropy encoder 111 encodes inter_rps_mode derived by the buffer manager 114. Note that the entropy encoding method of each encoding element in the entropy encoder 111 is not limited, but variable length encoding or arithmetic encoding can be applied.

図4は、図3のステップ510の処理の詳細を示す流れ図である。RPS情報の符号化/復号に用いるシンタックステーブルの各符号化要素を導出するためのバッファ管理器114の処理を示す。   FIG. 4 is a flowchart showing details of the processing in step 510 of FIG. The process of the buffer manager 114 for deriving each encoding element of the syntax table used for encoding / decoding of RPS information is shown.

ステッ610では、対象RPSのインターRPS予測に用いる参照RPSの複数候補に未調査のRPS情報があるかを判定する。未調査の参照RPS候補がない場合には、ステップ680に進み、インターRPS予測を用いた対象RPSの符号化に適した参照RPSが存在ないと判断する。その結果に基づき、図3のステップ570に進む。
未調査の参照RPS候補が残っている場合には、ステップ620に進む。ステップ620では、次のRPS候補を識別する識別子RIdxを取得し、対象画像のRPSと参照RPS候補に関連するPOCの差分値DeltaRPSを、式(11)にて算出し、ステップ630に進む。
DeltaRPS = POCReference - POCCurrent (11)
ここで、POCCurrentは対象RPSに関するPOC番号、POCReferenceは参照RPS候補のPOC番号を示す。例えば、図10で対象RPSが1712、参照RPSの候補が1711の場合には、POCCurrent=26(図9の1612)、POCReference=28(図9の1611)、DeltaRPS=2となる。
ステップ630では、対象RPSの予測値である予測RPS(予測バッファ記述情報とよぶ)として、DeltaPocPred[ i ]が式(12)にて算出される。ここで、iは0からN-1で変化し、Nの値は、参照RPSの数NumDeltaPocs[RIdx]となる。
DeltaPocPred[ i ] = DeltaPoc[ RIdx ][ i ] + DeltaRPS (12)
In step 610, it is determined whether there are unexamined RPS information among a plurality of reference RPS candidates used for inter-RPS prediction of the target RPS. If there is no unexamined reference RPS candidate, the process proceeds to step 680, and it is determined that there is no reference RPS suitable for encoding the target RPS using inter RPS prediction. Based on the result, the process proceeds to step 570 in FIG.
If unexamined reference RPS candidates remain, the process proceeds to step 620. In step 620, the identifier RIdx for identifying the next RPS candidate is acquired, and the difference value DeltaRPS between the RPS of the target image and the POC related to the reference RPS candidate is calculated by equation (11), and the process proceeds to step 630.
DeltaRPS = POCReference-POCCurrent (11)
Here, POCCurrent indicates the POC number related to the target RPS, and POCReference indicates the POC number of the reference RPS candidate. For example, when the target RPS is 1712 and the reference RPS candidate is 1711 in FIG. 10, POCCurrent = 26 (1612 in FIG. 9), POCReference = 28 (1611 in FIG. 9), and DeltaRPS = 2.
In step 630, DeltaPocPred [i] is calculated by Equation (12) as a predicted RPS (referred to as prediction buffer description information) that is a predicted value of the target RPS. Here, i varies from 0 to N−1, and the value of N is the number of reference RPSs NumDeltaPocs [RIdx].
DeltaPocPred [i] = DeltaPoc [RIdx] [i] + DeltaRPS (12)

次にステップ640では、予測RPSと対象RPSを比較し、一致する場合には、ステップ650にてMode=inter_rps_mode=3と設定し、図3のステップ520に進む。一致しない場合は、ステップ631に進む。   Next, in step 640, the predicted RPS and the target RPS are compared. If they match, Mode = inter_rps_mode = 3 is set in step 650, and the process proceeds to step 520 in FIG. If not, the process proceeds to step 631.

ステップ631では、予測RPSにDeltaPocPred[N]=DeltaRPSを新要素として加える。ステップ641では、更新した予測RPSと対象RPSを比較し、一致する場合には、ステップ651にてMode=inter_rps_mode=0と設定し、図3のステップ520に進む。一致しない場合は、ステップ632に進む。   In step 631, DeltaPocPred [N] = DeltaRPS is added as a new element to the predicted RPS. In step 641, the updated predicted RPS is compared with the target RPS, and if they match, Mode = inter_rps_mode = 0 is set in step 651, and the process proceeds to step 520 in FIG. If not, the process proceeds to Step 632.

ステップ632では、予測RPSから値が最小となるDeltaPocと対応するindexを検出し、DeltaPocPred[index]=DeltaRPSとして検出したDeltaPocをDeltaRPSの値に置き換える。ステップ642では、更新した予測RPSと対象RPSを比較し、一致する場合には、ステップ652にてMode=inter_rps_mode=1と設定し、図3のステップ520に進む。一致しない場合は、ステップ632に進む。   In step 632, the index corresponding to the DeltaPoc having the smallest value is detected from the predicted RPS, and the DeltaPoc detected as DeltaPocPred [index] = DeltaRPS is replaced with the value of DeltaRPS. In Step 642, the updated predicted RPS and the target RPS are compared. If they match, Mode = inter_rps_mode = 1 is set in Step 652, and the process proceeds to Step 520 in FIG. If not, the process proceeds to Step 632.

ステップ633では、予測RPSから値が最大となるDeltaPocと対応するindexを検出し、DeltaPocPred[index]=DeltaRPSとして検出したDeltaPocをDeltaRPSの値に置き換える。ステップ643では、更新した予測RPSと対象RPSを比較し、一致する場合には、ステップ653にてMode=inter_rps_mode=2と設定し、図3のステップ520に進む。一致しない場合は、ステップ610に進む。   In step 633, the index corresponding to the DeltaPoc having the maximum value is detected from the predicted RPS, and the DeltaPoc detected as DeltaPocPred [index] = DeltaRPS is replaced with the value of DeltaRPS. In step 643, the updated predicted RPS is compared with the target RPS, and if they match, Mode = inter_rps_mode = 2 is set in step 653, and the process proceeds to step 520 in FIG. If not, the process proceeds to step 610.

なお、エントロピー符号化器111では、図3と図4にて求めたnum_short_term_ref_pic_sets個のRPS情報DeltaPoc[°k°][°i°](k=0- num_short_term_ref_pic_sets-1,i = 0- NumDeltaPocs[k]-1)をSPS情報あるいはPPS情報の一部として他の圧縮データと併せて送出する。図1の入力端子113より指定された一つのRPS情報DeltaPoc[m]に基づいて、バッファ管理器114がフレームメモリ104内にある参照画像を用意した上で符号化処理を行う。受信側では、各画像の圧縮データのヘッダ(ピクチャヘッダあるいはスライスヘッダ)に付加されるRPS情報の識別子mに基づいてバッファ管理器209がフレームメモリ207内にある参照画像を用意した上で復号処理を行う。num_short_term_ref_pic_sets個のRPS情報にDeltaPoc[m]が存在しない場合には、short_term_ref_pic_set(num_short_term_ref_pic_sets)で示されるシンタックスにより、新たなRPS情報としてDeltaPoc[m]を符号化する。そのため、本発明の実施形態では、スライスヘッダあるいはピクチャヘッダにて、新たなRPS情報を送るかRPS情報の識別子mを送るかを指示するフラグが併せて送られる。   In the entropy encoder 111, num_short_term_ref_pic_sets pieces of RPS information DeltaPoc [° k °] [° i °] (k = 0-num_short_term_ref_pic_sets-1, i = 0-NumDeltaPocs [k ] -1) is sent together with other compressed data as part of SPS information or PPS information. Based on one RPS information DeltaPoc [m] designated from the input terminal 113 in FIG. 1, the buffer manager 114 prepares a reference image in the frame memory 104 and performs an encoding process. On the receiving side, the buffer manager 209 prepares a reference image in the frame memory 207 based on the identifier m of RPS information added to the compressed data header (picture header or slice header) of each image, and then performs decoding processing. I do. When DeltaPoc [m] does not exist in num_short_term_ref_pic_sets RPS information, DeltaPoc [m] is encoded as new RPS information with the syntax indicated by short_term_ref_pic_set (num_short_term_ref_pic_sets). Therefore, in the embodiment of the present invention, a flag indicating whether to send new RPS information or RPS information identifier m is also sent in the slice header or picture header.

図5は本発明の実施形態による動画像予測復号装置200のバッファ管理器209ならびにデータ解析器202における1つのRPS情報の復号方法を示す流れ図である。   FIG. 5 is a flowchart showing a method of decoding one RPS information in the buffer manager 209 and the data analyzer 202 of the moving picture predictive decoding apparatus 200 according to the embodiment of the present invention.

ステップ310にて、データ解析器209が対象RPSをイントラRPS法で復号するかインターRPS法(バッファ記述情報予測復号方法)で復号するかを指示する情報inter_rps_prediction_flagを復号する。そして、inter_rps_prediction_flagの復号値が0の場合には、ステップ380に進み、復号値が1の場合にはステップ330に進む。   In step 310, the data analyzer 209 decodes information inter_rps_prediction_flag indicating whether the target RPS is decoded by the intra RPS method or the inter RPS method (buffer description information predictive decoding method). When the decoded value of inter_rps_prediction_flag is 0, the process proceeds to step 380, and when the decoded value is 1, the process proceeds to step 330.

ステップ380では、データ解析器202とバッファ管理器209がイントラRPS法で対象RPSを復元する。   In step 380, the data analyzer 202 and the buffer manager 209 restore the target RPS by the intra RPS method.

ステップ330、340、350では、データ解析器202がインターRPS法に基づいて、delta_idx_minus1と delta_rpsとinter_rps_modeをそれぞれエントロピー復号し、バッファ管理器209に送る。このとき,delta_rpsは図7のシンタックス要素R120(abs_delta_rps_minus1とdelta_rps_sign)で示したように、その絶対値と正負の符号に分けて復号するようにしてもよい。なお、各要素のエントロピー復号方法は限定されないが、可変長復号や算術復号が適用できる。また、符号化装置側において、識別情報として、識別子RIdxを採用した場合には、この符号化された識別子RIdxを復号する。
ステップ360では、バッファ管理器209が、復号したdelta_idx_minus1と delta_rpsとinter_rps_modeから対象RPSを復元する。ステップ360の詳細を図6にて説明する。
In steps 330, 340, and 350, the data analyzer 202 entropy-decodes delta_idx_minus1, delta_rps, and inter_rps_mode based on the inter RPS method, and sends the result to the buffer manager 209. At this time, as indicated by the syntax element R120 (abs_delta_rps_minus1 and delta_rps_sign) in FIG. 7, delta_rps may be decoded by dividing it into its absolute value and positive / negative sign. The entropy decoding method for each element is not limited, but variable length decoding or arithmetic decoding can be applied. Further, when the identifier RIdx is adopted as identification information on the encoding device side, the encoded identifier RIdx is decoded.
In step 360, the buffer manager 209 restores the target RPS from the decoded delta_idx_minus1, delta_rps, and inter_rps_mode. Details of step 360 will be described with reference to FIG.

図6は、図5のステップ360の処理の詳細を示す流れ図である。バッファ管理器209における対象RPS情報の復元処理を示す。   FIG. 6 is a flowchart showing details of the process in step 360 of FIG. The restoration process of the target RPS information in the buffer manager 209 is shown.

ステップ410では、復号されたdelta_idx_minus1と対象RPS情報を識別する識別子idxから参照RPSを識別する識別子RIdxを式(5)に基づいて復元する。
RIdx=idx‐(delta_idx_minus1+1) (5)
また、復号されたdelta_rpsからDeltaRPSを式(6)に基づいて復元する。
DeltaRPS = delta_rps (6)
さらに、復号されたinter_rps_modeからModeの値を復元する。
In step 410, the identifier RIdx that identifies the reference RPS is restored based on the equation (5) from the decoded delta_idx_minus1 and the identifier idx that identifies the target RPS information.
RIdx = idx- (delta_idx_minus1 + 1) (5)
Also, DeltaRPS is restored from the decoded delta_rps based on Equation (6).
DeltaRPS = delta_rps (6)
Further, the value of Mode is restored from the decoded inter_rps_mode.

次にステップ420では、復号されたDeltaRPSから、N個のDeltaPocを式(7)と式(8)に基づいて復元する。
DeltaPoc[idx][i]=DeltaPoc[RIdx][i]+DeltaRPS (7)
ここで、i=0 to N-1(=NumDeltaPocs[RIdx]-1)
NumDeltaPocs[idx] = NumDeltaPocs[RIdx] (8)
ここで,式(7)にて算出されるDeltaPoc[idx][i]とModeにて最終的な対象RPS情報が決定するため,式(7)のDeltaPoc[idx][i]は,対象RPS情報(対象バッファ記述情報)に対する予測RPS情報(予測バッファ記述情報)の位置づけとなる。
Next, in step 420, N DeltaPocs are restored from the decoded DeltaRPS based on Equation (7) and Equation (8).
DeltaPoc [idx] [i] = DeltaPoc [RIdx] [i] + DeltaRPS (7)
Where i = 0 to N-1 (= NumDeltaPocs [RIdx] -1)
NumDeltaPocs [idx] = NumDeltaPocs [RIdx] (8)
Here, since the final target RPS information is determined by DeltaPoc [idx] [i] calculated in Equation (7) and Mode, DeltaPoc [idx] [i] in Equation (7) is the target RPS. This is the positioning of predicted RPS information (predicted buffer description information) with respect to information (target buffer description information).

ステップ430では、Modeが0であるかを判断する。Modeが0の場合には、ステップ440に進み、DeltaPoc[idx]の新たな要素として、DeltaPoc[idx][N]=DeltaRPSを対象RPSに加える。DeltaPoc[idx][NumDeltaPocs[RIdx]]=DeltaRPS (9)
NumDeltaPocs[idx] = NumDeltaPocs[RIdx]+1 (10)
Modeが0でない場合には、ステップ450に進む。
In step 430, it is determined whether Mode is zero. If Mode is 0, the process proceeds to step 440, and DeltaPoc [idx] [N] = DeltaRPS is added to the target RPS as a new element of DeltaPoc [idx]. DeltaPoc [idx] [NumDeltaPocs [RIdx]] = DeltaRPS (9)
NumDeltaPocs [idx] = NumDeltaPocs [RIdx] +1 (10)
If Mode is not 0, the process proceeds to step 450.

ステップ450では、Modeが1であるかを判断する。Modeが1の場合には、ステップ460に進み、DeltaPoc[idx][0]からDeltaPoc[idx][N-1]のうち、値が最小の要素(DeltaPoc)をDeltaRPSに置き換える。値が最小の要素を識別する識別子がjの場合、DeltaPoc[idx][j]=DeltaRPSとなる。Modeが1でない場合には、ステップ470に進む。   In step 450, it is determined whether Mode is 1. If Mode is 1, the process proceeds to step 460, and the element (DeltaPoc) having the smallest value among DeltaPoc [idx] [0] to DeltaPoc [idx] [N-1] is replaced with DeltaRPS. When the identifier for identifying the element having the smallest value is j, DeltaPoc [idx] [j] = DeltaRPS. If Mode is not 1, the process proceeds to step 470.

ステップ470では、Modeが2であるかを判断する。Modeが2の場合には、ステップ480に進み、DeltaPoc[idx][0]からDeltaPoc[idx][N-1]のうち、値が最大の要素(DeltaPoc)をDeltaRPSに置き換える。値が最大の要素を識別する識別子がjの場合、DeltaPoc[idx][j]=DeltaRPSとなる。Modeが2でない場合には、ステップ420で復元したDeltaPoc[idx]とNumDeltaPocs[idx]を変更せずに出力する(Mode=3)。   In step 470, it is determined whether Mode is 2. When Mode is 2, the process proceeds to step 480, and the element (DeltaPoc) having the maximum value among DeltaPoc [idx] [0] to DeltaPoc [idx] [N-1] is replaced with DeltaRPS. When the identifier for identifying the element having the maximum value is j, DeltaPoc [idx] [j] = DeltaRPS. If Mode is not 2, the DeltaPoc [idx] and NumDeltaPocs [idx] restored in step 420 are output without change (Mode = 3).

図5と図6に示した処理により、図2のデータ解析器202は、圧縮データから1つのRPS情報に関するデータを抽出して復号できる。データ解析器202とバッファ管理器209は、符号化データ内のSPS情報あるいはPPS情報の部分からK個のRPS情報DeltaPoc[k][°i°](k=0 - K-1, i=0 - NumDeltaPocs[k]-1)を復号する。Kの値は、例えばnum_short_term_ref_pic_setsとしてSPS情報あるいはPPS情報にて復号される。   5 and FIG. 6, the data analyzer 202 in FIG. 2 can extract and decode data related to one RPS information from the compressed data. The data analyzer 202 and the buffer manager 209 calculate K pieces of RPS information DeltaPoc [k] [° i °] (k = 0−K−1, i = 0) from the SPS information or PPS information portion in the encoded data. -Decode NumDeltaPocs [k] -1). The value of K is decoded by SPS information or PPS information as num_short_term_ref_pic_sets, for example.

各画像を復元する際には、対象画像の圧縮データのヘッダ(ピクチャヘッダあるいはスライスヘッダ)に付加される識別子idxにて指示されるDeltaPoc[idx]に基づいて、バッファ管理器209がフレームメモリ207内にある参照画像を用意した上で、復号・再生処理を行う。なお、SPS情報にて用意されたRPS情報に対象画像の復号に適したRPS情報がない場合には、新たなRPS情報をスライスヘッダあるいはピクチャヘッダで受信する。そのため、本発明の実施形態では、新たなRPS情報を復号するかRPS情報の識別子を復号するかを指示するフラグを先に復号する。   When restoring each image, the buffer manager 209 uses the frame memory 207 based on DeltaPoc [idx] indicated by the identifier idx added to the header (picture header or slice header) of the compressed data of the target image. After the reference image inside is prepared, decoding / reproduction processing is performed. If there is no RPS information suitable for decoding the target image in the RPS information prepared in the SPS information, new RPS information is received by a slice header or a picture header. Therefore, in the embodiment of the present invention, the flag indicating whether to decode new RPS information or the identifier of RPS information is decoded first.

このように、本発明によるバッファ記述情報(RPS情報)を符号化・復号する方法によれば、inter_rps_modeにより、予測RPS(参照RPSとDeltaRPSから生成)から対象RPSを生成する方法が分かるため、データ解析器202は、参照RPS情報に含まれる要素の個数を取得しなくても、RPS情報に関する圧縮データを解析できる。また、背景技術に示したuse_delta_flagのようにRPS情報の各要素に関わる指示情報を符号化する必要がないため、RPS情報の圧縮データをより効率良く符号化することが可能となる。   As described above, according to the method for encoding / decoding the buffer description information (RPS information) according to the present invention, the method for generating the target RPS from the predicted RPS (generated from the reference RPS and the DeltaRPS) can be determined by inter_rps_mode. The analyzer 202 can analyze the compressed data related to the RPS information without acquiring the number of elements included in the reference RPS information. Further, since it is not necessary to encode the instruction information related to each element of the RPS information as in the use_delta_flag shown in the background art, it becomes possible to encode the compressed data of the RPS information more efficiently.

さらに本発明では、背景技術のused_by_curr_pic_flag[i]、つまり、対象RPS情報にて管理される各再生画像が対象画像の予測処理に利用されるか、将来の画像の予測処理に利用されるかを示す利用情報の組をモード情報として符号化/復号できるようにinter_rps_modeを拡張することも可能である。   Furthermore, in the present invention, used_by_curr_pic_flag [i] of the background art, that is, whether each reproduced image managed by the target RPS information is used for the target image prediction process or for the future image prediction process. It is also possible to extend inter_rps_mode so that the set of usage information shown can be encoded / decoded as mode information.

具体的には、RPS情報に利用情報used_by_curr_pic_flagを加える。参照RPS情報を識別する識別子RIdxが復元されるとバッファ管理器は、RIdxで識別される参照RPSの各再生画像の利用情報を、対象RPSの各再生画像の利用情報にコピーする。そして、DeltaPocの値がDeltaRPSとなる利用情報(図13ではMode=0の新たに追加するDeltaPocに対応する参照画像の利用情報やMode=1か2の特定のDeltaPocに対応する利用情報)をinter_rps_modeの値に基づいて符号化/復号する(図13では、inter_rps_modeが0, 1, 2のとき符号化/復号する)。あるいは、新たに追加されるDeltaPocに対応する再生画像のused_by_curr_pic_flagの値をinter_rps_modeにて指示するモードや、特定のDeltaPoc(例えば、最大値のDeltaPocや最小値のDeltaPoc)に対応する再生画像のused_by_curr_pic_flagの値を変更するモードを元のinter_rps_modeに組み合わせて用意してもよい。また、利用情報used_by_curr_pic_flagのパターンを示すモード情報をinter_rps_modeと別に用意してもよい。   Specifically, usage information used_by_curr_pic_flag is added to RPS information. When the identifier RIdx that identifies the reference RPS information is restored, the buffer manager copies the usage information of each playback image of the reference RPS identified by RIdx to the usage information of each playback image of the target RPS. Then, the usage information (the usage information of the reference image corresponding to the newly added DeltaPoc with Mode = 0 or the usage information corresponding to the specific DeltaPoc with Mode = 1 or 2 in FIG. 13) in which the value of DeltaPoc is DeltaRPS is inter_rps_mode. (In FIG. 13, encoding / decoding is performed when inter_rps_mode is 0, 1, 2). Alternatively, the mode in which the value of used_by_curr_pic_flag of the playback image corresponding to the newly added DeltaPoc is indicated by inter_rps_mode, or the used_by_curr_pic_flag of the playback image corresponding to a specific DeltaPoc (for example, the maximum DeltaPoc or the minimum DeltaPoc) A mode for changing the value may be prepared in combination with the original inter_rps_mode. Further, mode information indicating a pattern of usage information used_by_curr_pic_flag may be prepared separately from inter_rps_mode.

コンピュータを上記の動画像予測符号化装置100として機能させるための動画像予測符号化プログラムは、記録媒体に格納されて提供可能とされている。具体的には、動画像予測符号化プログラムは、動画像を構成する複数の画像を入力する入力モジュールと、画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化モジュールと、圧縮画像データを復号し、再生画像に復元する復号モジュールと、再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上格納する画像格納モジュールと、画像格納モジュールを制御するバッファ管理モジュールと、を具備し、バッファ管理モジュールは、画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、参照バッファ記述情報の参照画像のピクチャ番号と対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、参照バッファ記述情報と差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した複数のモードから、対象バッファ記述情報を生成するモード情報を選択し、符号化モジュールは、識別情報、差分値、モード情報を符号化することを特徴とする動画像予測符号化プログラムである。   A moving picture predictive coding program for causing a computer to function as the moving picture predictive coding apparatus 100 is stored in a recording medium and can be provided. Specifically, the moving image predictive encoding program predicts an input module for inputting a plurality of images constituting a moving image, and a plurality of images decoded and reproduced after encoding the images as reference images. An encoding module that encodes and generates compressed image data, a decoding module that decodes the compressed image data and restores it to a reproduced image, and a reproduced image as one reference image used to encode subsequent images An image storage module for storing the above, and a buffer management module for controlling the image storage module. The buffer management module is the target buffer description information related to a plurality of reference images used when predictively encoding an image. From different encoded buffer description information, the buffer description information similar to the target buffer description information is referred to as the reference buffer description information. And generating identification information for identifying the reference buffer description information, calculating a difference value between the picture number of the reference image of the reference buffer description information and the picture number of the target image of the target buffer description information, and the reference buffer description Generate prediction buffer description information from the information and the difference value, and select mode information for generating target buffer description information from a plurality of modes prepared for generating new buffer description information based on the prediction buffer description information. The encoding module is a video predictive encoding program characterized by encoding identification information, a difference value, and mode information.

同様に、コンピュータを上記の動画像予測復号装置200として機能させるための動画像予測復号プログラムは、記録媒体に格納されて提供可能とされている。具体的には、動画像予測復号プログラムは、動画像を構成する複数の画像のそれぞれに対し、過去に復号・再生された複数の画像を参照画像として予測符号化されたデータと、複数の参照画像に関するバッファ記述情報の符号化データとを含む圧縮画像データを入力する入力モジュールと、圧縮画像データを復号し、再生画像に復元する復号モジュールと、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納モジュールと、画像格納モジュールを制御するバッファ管理モジュールと、を具備し、復号モジュールは、再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、参照バッファ記述情報に関するピクチャ番号と対象バッファ記述情報に関するピクチャ番号との差分値を復号し、参照バッファ記述情報と差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された複数のモードから、対象バッファ記述情報の復元に用いるモード情報を復号し、予測バッファ記述情報とモード情報に基づいて、対象バッファ記述情報を復号し、バッファ管理モジュールは、復号された対象バッファ記述情報をもとに画像格納モジュールを制御することを特徴とする動画像予測復号プログラムである。記録媒体としては、フレキシブルディスク、CD−ROM、DVD、あるいはROM等の記録媒体、又は半導体メモリ等が例示される。   Similarly, a moving picture predictive decoding program for causing a computer to function as the moving picture predictive decoding apparatus 200 can be provided by being stored in a recording medium. Specifically, the moving image predictive decoding program performs prediction encoding on a plurality of images that have been decoded and reproduced in the past as reference images and a plurality of references for each of a plurality of images constituting the moving image. An input module for inputting compressed image data including encoded data of buffer description information relating to an image, a decoding module for decoding the compressed image data and restoring it to a reproduced image, and for decoding the reproduced image and subsequent images An image storage module that stores one or more reference images to be used, and a buffer management module that controls the image storage module. The decoding module is a target related to a plurality of reference images used when decoding a reproduction image. In order to decode the buffer description information, decoded buffer description information different from the target buffer description information, Decoding identification information for identifying buffer description information used for decoding buffer description information as reference buffer description information, decoding a difference value between a picture number related to reference buffer description information and a picture number related to target buffer description information, and a reference buffer description Decoding mode information used to restore the target buffer description information from a plurality of modes prepared to generate new buffer description information based on the prediction buffer description information generated from the information and the difference value, and the prediction buffer description The target buffer description information is decoded based on the information and the mode information, and the buffer management module controls the image storage module based on the decoded target buffer description information. . Examples of the recording medium include a recording medium such as a flexible disk, a CD-ROM, a DVD, or a ROM, or a semiconductor memory.

図11は、記録媒体に記録されたプログラムを実行するためのコンピュータ30のハードウェア構成を示す図であり、図12は、記録媒体に記憶されたプログラムを実行するためのコンピュータ30の斜視図である。ここでのコンピュータ30は、CPUを具備しソフトウエアによる情報処理や制御を行うDVDプレーヤ、セットトップボックス、携帯電話などを広く含む。   FIG. 11 is a diagram illustrating a hardware configuration of a computer 30 for executing a program recorded on a recording medium. FIG. 12 is a perspective view of the computer 30 for executing a program stored on the recording medium. is there. The computer 30 here includes a wide range of DVD players, set-top boxes, mobile phones, and the like that have a CPU and perform information processing and control by software.

図12に示すように、コンピュータ30は、フレキシブルディスクドライブ装置、CD−ROMドライブ装置、DVDドライブ装置等の読み取り装置12と、オペレーティングシステムを常駐させた作業用メモリ(RAM)14と、記録媒体10に記憶されたプログラムを記憶するメモリ16と、ディスプレイといった表示装置18と、入力装置であるマウス20及びキーボード22と、データ等の送受を行うための通信装置24と、プログラムの実行を制御するCPU26とを備えている。記録媒体10が読み取り装置12に挿入されると、コンピュータ30は、読み取り装置12から記録媒体10に格納された動画像予測符号化プログラムにアクセス可能になり、当該動画像予測符号化プログラムによって上記の動画像予測符号化装置100として動作することが可能になる。同様に、記録媒体10が読み取り装置12に挿入されると、コンピュータ30は、読み取り装置12から記録媒体10に格納された動画像予測復号プログラムにアクセス可能になり、当該動画像予測復号プログラムによって上記の動画像予測復号装置200として動作することが可能になる。   As shown in FIG. 12, a computer 30 includes a reading device 12 such as a flexible disk drive device, a CD-ROM drive device, a DVD drive device, a working memory (RAM) 14 in which an operating system is resident, and a recording medium 10. A memory 16 for storing programs stored therein, a display device 18 such as a display, a mouse 20 and a keyboard 22 as input devices, a communication device 24 for transmitting and receiving data and the like, and a CPU 26 for controlling execution of the programs. And. When the recording medium 10 is inserted into the reading device 12, the computer 30 can access the moving image predictive encoding program stored in the recording medium 10 from the reading device 12, and the moving image predictive encoding program performs the above operation. It becomes possible to operate as the moving image predictive encoding device 100. Similarly, when the recording medium 10 is inserted into the reading device 12, the computer 30 can access the moving image predictive decoding program stored in the recording medium 10 from the reading device 12, and the moving image predictive decoding program performs the above operation. It becomes possible to operate as the moving picture predictive decoding apparatus 200.

次に、本発明に係る動画像予測符号化装置100及び動画像予測復号装置200の作用効果について説明する。   Next, the operational effects of the video predictive coding device 100 and the video predictive decoding device 200 according to the present invention will be described.

この動画像予測符号化装置100において、バッファ管理器114は、複数の符号化済みバッファ記述情報から、対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、具体的には、インターRPS法を用いた対象RPSの符号化に適した参照RPSが存在するかを判断する。そして、バッファ管理部114は、この参照RPS(該参照バッファ記述情報)を識別する識別情報(差分値delta_idx_minus1又は識別子RIdx)を生成する。   In the video predictive encoding device 100, the buffer manager 114 searches the reference buffer description information for buffer description information similar to the target buffer description information from a plurality of encoded buffer description information. It is determined whether there is a reference RPS suitable for encoding the target RPS using the inter-RPS method. Then, the buffer management unit 114 generates identification information (difference value delta_idx_minus1 or identifier RIdx) for identifying the reference RPS (the reference buffer description information).

つぎに、バッファ管理部114は、参照RPS(参照バッファ記述情報)の参照画像のPOC(ピクチャ番号)と対象PRS(対象バッファ記述情報)の対象画像のPOC(ピクチャ番号)との差分値であるDeltaRPSを算出し、参照RPSの各要素と差分値DelatRPSから予想RPS(予測バッファ記述情報)を生成する。そして、予測RPSに基づいて新たなバッファ記述情報を生成するために用意した複数のinter_rps_mode(モード情報)から、対象バッファ記述情報を生成するMODE(モード情報)を選択し、エントロピー符号化器111は、差分値delta_idx_minus1又は識別子RIdx(識別情報)、DeltaRPS(差分値)、MODE(モード情報)を符号化する。   Next, the buffer management unit 114 is a difference value between the POC (picture number) of the reference image of the reference RPS (reference buffer description information) and the POC (picture number) of the target image of the target PRS (target buffer description information). DeltaRPS is calculated, and predicted RPS (predicted buffer description information) is generated from each element of the reference RPS and the difference value DelatRPS. Then, MODE (mode information) for generating the target buffer description information is selected from a plurality of inter_rps_mode (mode information) prepared for generating new buffer description information based on the predicted RPS, and the entropy encoder 111 The difference value delta_idx_minus1 or the identifier RIdx (identification information), DeltaRPS (difference value), and MODE (mode information) are encoded.

これにより、背景技術に示したuse_delta_flagのようにRPS情報の各要素に関わる指示情報を符号化する必要がないため、RPS情報の圧縮データをより効率良く符号化することが可能となる。また、対象バッファ記述情報を生成するための方法であって発生頻度が高い方法を、シンタックス要素として予め複数用意しておくことにより、少ない符号要素で効率良く対象バッファ記述情報を符号化することができる。よって、本発明によれば、インターRPSの符号化に要するビット数を削減することにより、符号化データの構成を簡潔にすることができる。   Thereby, unlike the use_delta_flag shown in the background art, it is not necessary to encode the instruction information related to each element of the RPS information, so that the compressed data of the RPS information can be encoded more efficiently. Also, by preparing in advance a plurality of methods for generating the target buffer description information that are frequently generated as syntax elements, the target buffer description information can be efficiently encoded with a small number of code elements. Can do. Therefore, according to the present invention, the configuration of encoded data can be simplified by reducing the number of bits required for inter-RPS encoding.

この動画像予測復号装置200において、データ解析器202は、参照RPS(該参照バッファ記述情報)を識別する識別情報、参照RPS(参照バッファ記述情報)の参照画像のPOC(ピクチャ番号)と対象PRS(対象バッファ記述情報)の対象画像のPOC(ピクチャ番号)との差分値であるDeltaRPS(差分値)、対象バッファ記述情報を生成するMODE(モード情報)を復号する。   In this video predictive decoding apparatus 200, the data analyzer 202 includes identification information for identifying a reference RPS (reference buffer description information), a POC (picture number) of a reference image of the reference RPS (reference buffer description information), and a target PRS. DeltaRPS (difference value) that is a difference value between the target image (target buffer description information) and the POC (picture number) of the target image, and MODE (mode information) that generates target buffer description information are decoded.

そして、このデータ解析器202は、予想RPS(予測バッファ記述情報)とMODE(モード情報)に基づいて、対象RPS(対象バッファ記述情報)を復号し、バッファ管理器114は、復号された対象RPS(対象バッファ記述情報)に基づいて、フレームメモリ104を制御する。   Then, the data analyzer 202 decodes the target RPS (target buffer description information) based on the predicted RPS (predicted buffer description information) and MODE (mode information), and the buffer manager 114 reads the decoded target RPS. The frame memory 104 is controlled based on (target buffer description information).

これにより、予測バッファ記述情報から対象バッファ記述情報に含まれる要素の個数を取得しなくても、バッファ記述情報に関する圧縮データを解析することができる。また、対象バッファ記述情報を生成するための方法であって発生頻度が高い方法を、シンタックス要素として予め複数用意しておくことにより、少ない符号要素で効率良く対象バッファ記述情報を復号することができる。よって、本発明によれば、復号装置における符号化データの解析処理を簡易化することができる。   Accordingly, the compressed data related to the buffer description information can be analyzed without obtaining the number of elements included in the target buffer description information from the prediction buffer description information. Also, by preparing a plurality of methods for generating the target buffer description information and having a high occurrence frequency as syntax elements in advance, the target buffer description information can be efficiently decoded with a small number of code elements. it can. Therefore, according to the present invention, the analysis processing of the encoded data in the decoding device can be simplified.

100…動画像予測符号化装置、101…入力端子、102…ブロック分割器、103…予測信号生成器、104…フレームメモリ、105…減算器、106…変換器、107…量子化器、108…逆量子化器、109…逆変換器、110…加算器、111…エントロピー符号化器、112…出力端子、114…バッファ管理器、200…動画像予測復号装置、201…入力端子、202…データ解析器、203…逆量子化器、204…逆変換器、205…加算器、206…出力端子、207…フレームメモリ、208…予測信号生成器、209…バッファ管理器。
DESCRIPTION OF SYMBOLS 100 ... Moving image predictive coding apparatus, 101 ... Input terminal, 102 ... Block divider, 103 ... Prediction signal generator, 104 ... Frame memory, 105 ... Subtractor, 106 ... Converter, 107 ... Quantizer, 108 ... Inverse quantizer 109 ... Inverse transformer 110 ... Adder 111 ... Entropy encoder 112 ... Output terminal 114 ... Buffer manager 200 ... Video predictive decoding device 201 ... Input terminal 202 ... Data Analyzer, 203 ... Inverse quantizer, 204 ... Inverse transformer, 205 ... Adder, 206 ... Output terminal, 207 ... Frame memory, 208 ... Predictive signal generator, 209 ... Buffer manager.

Claims (8)

動画像を構成する複数の画像のそれぞれに対し、過去に復号・再生された複数の画像を参照画像として予測符号化されたデータと、複数の参照画像に関するバッファ記述情報の符号化データとを含む圧縮画像データを入力する入力ステップと、
前記圧縮画像データを復号し、再生画像に復元する復号ステップと、
前記再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、
前記画像格納手段を制御するバッファ管理ステップと、を具備し、
前記復号ステップにおいて、
前記再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、
前記参照バッファ記述情報に関するピクチャ番号と前記対象バッファ記述情報に関するピクチャ番号との差分値を復号し、
前記参照バッファ記述情報と前記差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、前記対象バッファ記述情報の復元に用いるモード情報を復号し、
前記予測バッファ記述情報と前記モード情報に基づいて、前記対象バッファ記述情報を復号し、
前記バッファ管理ステップにおいて、
復号された前記対象バッファ記述情報をもとに前記画像格納手段を制御し、
前記3以上のモードには、
少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、
前記3以上のモードは、
それぞれ、前記予測バッファ記述情報から前記対象バッファ記述情報を生成する異なる処理方法を指し示し、
前記復号ステップでは、
前記圧縮画像データを復号して前記モード情報を復号し、当該モード情報が指し示す前記処理方法にて、前記予測バッファ記述情報から前記対象バッファ記述情報を復号する、ことを特徴とする動画像予測復号方法。
For each of a plurality of images constituting a moving image, data that is predictively encoded using a plurality of images decoded and reproduced in the past as reference images, and encoded data of buffer description information related to the plurality of reference images An input step for inputting compressed image data;
A decoding step of decoding the compressed image data and restoring the reproduced image;
An image storage step of storing the reproduced image as one or more reference images used for decoding subsequent images by an image storage means;
A buffer management step for controlling the image storage means,
In the decoding step,
Decoded buffer description information different from the target buffer description information and used for decoding the target buffer description information in order to decode the target buffer description information related to a plurality of reference images used when decoding the reproduced image Decoding identification information identifying buffer description information as reference buffer description information;
Decoding a difference value between a picture number related to the reference buffer description information and a picture number related to the target buffer description information;
Mode information used to restore the target buffer description information from three or more modes prepared for generating new buffer description information based on the prediction buffer description information generated from the reference buffer description information and the difference value Decrypt
Decoding the target buffer description information based on the prediction buffer description information and the mode information;
In the buffer management step,
Controlling the image storage means based on the decoded target buffer description information;
The three or more modes include
At least three modes including a first mode, a second mode, and a third mode that perform different processes from each other are included.
The three or more modes are:
Each indicating a different processing method for generating the target buffer description information from the prediction buffer description information;
In the decoding step,
Decoding the compressed image data, decoding the mode information, and decoding the target buffer description information from the prediction buffer description information by the processing method indicated by the mode information. Method.
前記第1のモードは、前記予測バッファ記述情報に新要素として前記差分値を加える処理を行うモードであり、
前記第2のモードは、前記予測バッファ記述情報の要素のうち、所定の要素を前記差分値に置き換える処理を行うモードであり、
前記第3のモードは、前記予測バッファ記述情報を前記対象バッファ記述情報とする処理を行うモードである、請求項1に記載の動画像予測復号方法。
The first mode is a mode for performing a process of adding the difference value as a new element to the prediction buffer description information,
The second mode is a mode for performing a process of replacing a predetermined element among the elements of the prediction buffer description information with the difference value;
The moving image predictive decoding method according to claim 1, wherein the third mode is a mode for performing processing using the prediction buffer description information as the target buffer description information.
前記第2のモードは、前記予測バッファ記述情報の要素のうち、値が最小値あるいは最大値の要素を前記差分値に置き換える処理を行うモードである請求項1又は2に記載の動画像予測復号方法。   3. The video predictive decoding according to claim 1, wherein the second mode is a mode for performing a process of replacing an element having a minimum value or a maximum value among the elements of the prediction buffer description information with the difference value. Method. 前記復号ステップでは、
前記対象バッファ記述情報にて管理される前記再生画像が、対象画像の予測処理に利用されるか、或いは、将来の画像の予測処理に利用されるか、を示す利用情報の組をモード情報として復号する、請求項1〜3のいずれか一項に記載の動画像予測復号方法。
In the decoding step,
A mode information is a set of usage information indicating whether the reproduced image managed by the target buffer description information is used for a target image prediction process or a future image prediction process. decoding, the moving picture prediction decoding method according to any one of claims 1 to 3.
動画像を構成する複数の画像のそれぞれに対し、過去に復号・再生された複数の画像を参照画像として予測符号化されたデータと、複数の参照画像に関するバッファ記述情報の符号化データとを含む圧縮画像データを入力する入力手段と、
前記圧縮画像データを復号し、再生画像に復元する復号手段と、
前記再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納手段と、
前記画像格納手段を制御するバッファ管理手段と、を具備し、
前記復号手段は、
前記再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、
前記参照バッファ記述情報に関するピクチャ番号と前記対象バッファ記述情報に関するピクチャ番号との差分値を復号し、
前記参照バッファ記述情報と前記差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、前記対象バッファ記述情報の復元に用いるモード情報を復号し、
前記予測バッファ記述情報と前記モード情報に基づいて、前記対象バッファ記述情報を復号し、
前記バッファ管理手段は、
復号された前記対象バッファ記述情報をもとに前記画像格納手段を制御し、
前記3以上のモードには、
少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、
前記3以上のモードは、
それぞれ、前記予測バッファ記述情報から前記対象バッファ記述情報を生成する異なる処理方法を指し示し、
前記復号手段は、
前記圧縮画像データを復号して前記モード情報を復号し、当該モード情報が指し示す前記処理方法にて、前記予測バッファ記述情報から前記対象バッファ記述情報を復号する、ことを特徴とする動画像予測復号装置。
For each of a plurality of images constituting a moving image, data that is predictively encoded using a plurality of images decoded and reproduced in the past as reference images, and encoded data of buffer description information related to the plurality of reference images An input means for inputting compressed image data;
Decoding means for decoding the compressed image data and restoring the reproduced image;
Image storage means for storing one or more of the reproduced images as reference images used for decoding subsequent images;
Buffer management means for controlling the image storage means,
The decoding means includes
Decoded buffer description information different from the target buffer description information and used for decoding the target buffer description information in order to decode the target buffer description information related to a plurality of reference images used when decoding the reproduced image Decoding identification information identifying buffer description information as reference buffer description information;
Decoding a difference value between a picture number related to the reference buffer description information and a picture number related to the target buffer description information;
Mode information used to restore the target buffer description information from three or more modes prepared for generating new buffer description information based on the prediction buffer description information generated from the reference buffer description information and the difference value Decrypt
Decoding the target buffer description information based on the prediction buffer description information and the mode information;
The buffer management means includes
Controlling the image storage means based on the decoded target buffer description information;
The three or more modes include
At least three modes including a first mode, a second mode, and a third mode that perform different processes from each other are included.
The three or more modes are:
Each indicating a different processing method for generating the target buffer description information from the prediction buffer description information;
The decoding means includes
Decoding the compressed image data, decoding the mode information, and decoding the target buffer description information from the prediction buffer description information by the processing method indicated by the mode information. apparatus.
動画像を構成する複数の画像のそれぞれに対し、過去に復号・再生された複数の画像を参照画像として予測符号化されたデータと、複数の参照画像に関するバッファ記述情報の符号化データとを含む圧縮画像データを入力する入力モジュールと、
前記圧縮画像データを復号し、再生画像に復元する復号モジュールと、
前記再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納モジュールと、
前記画像格納モジュールを制御するバッファ管理モジュールと、を具備し、
前記復号モジュールは、
前記再生画像を復号する際に用いられる複数の参照画像に関わる対象バッファ記述情報を復号するために、対象バッファ記述情報とは異なる復号済みのバッファ記述情報であって対象バッファ記述情報の復号に用いるバッファ記述情報を参照バッファ記述情報として識別する識別情報を復号し、
前記参照バッファ記述情報に関するピクチャ番号と前記対象バッファ記述情報に関するピクチャ番号との差分値を復号し、
前記参照バッファ記述情報と前記差分値から生成される予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意された3以上のモードから、前記対象バッファ記述情報の復元に用いるモード情報を復号し、
前記予測バッファ記述情報と前記モード情報に基づいて、前記対象バッファ記述情報を復号し、
前記バッファ管理モジュールは、
復号された前記対象バッファ記述情報をもとに前記画像格納モジュールを制御し、
前記3以上のモードには、
少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、
前記3以上のモードは、
それぞれ、前記予測バッファ記述情報から前記対象バッファ記述情報を生成する異なる処理方法を指し示し、
前記復号モジュールは、
前記圧縮画像データを復号して前記モード情報を復号し、当該モード情報が指し示す前記処理方法にて、前記予測バッファ記述情報から前記対象バッファ記述情報を復号する、ことを特徴とする動画像予測復号プログラム。
For each of a plurality of images constituting a moving image, data that is predictively encoded using a plurality of images decoded and reproduced in the past as reference images, and encoded data of buffer description information related to the plurality of reference images An input module for inputting compressed image data;
A decoding module that decodes the compressed image data and restores the reproduced image;
An image storage module that stores one or more of the reproduced images as reference images used to decode subsequent images;
A buffer management module for controlling the image storage module;
The decryption module is
Decoded buffer description information different from the target buffer description information and used for decoding the target buffer description information in order to decode the target buffer description information related to a plurality of reference images used when decoding the reproduced image Decoding identification information identifying buffer description information as reference buffer description information;
Decoding a difference value between a picture number related to the reference buffer description information and a picture number related to the target buffer description information;
Mode information used to restore the target buffer description information from three or more modes prepared for generating new buffer description information based on the prediction buffer description information generated from the reference buffer description information and the difference value Decrypt
Decoding the target buffer description information based on the prediction buffer description information and the mode information;
The buffer management module includes:
Controlling the image storage module based on the decoded target buffer description information;
The three or more modes include
At least three modes including a first mode, a second mode, and a third mode that perform different processes from each other are included.
The three or more modes are:
Each indicating a different processing method for generating the target buffer description information from the prediction buffer description information;
The decryption module is
Decoding the compressed image data, decoding the mode information, and decoding the target buffer description information from the prediction buffer description information by the processing method indicated by the mode information. program.
動画像を構成する複数の画像を入力する入力ステップと、
前記画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化ステップと、
前記圧縮画像データを復号し、再生画像に復元する復号ステップと、
前記再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、
前記画像格納手段を制御するバッファ管理ステップと、を具備し、
前記バッファ管理ステップにおいて、
前記画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、前記対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、
前記参照バッファ記述情報の参照画像のピクチャ番号と前記対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、
前記参照バッファ記述情報と前記差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した3以上のモードから、前記対象バッファ記述情報を生成するモード情報を選択し、
前記符号化ステップにおいて、
前記識別情報、前記差分値、前記モード情報を符号化し、
前記3以上のモードには、
少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、
前記3以上のモードは、
それぞれ、前記予測バッファ記述情報から前記対象バッファ記述情報を生成する異なる処理方法を指し示すことを特徴とする動画像予測符号化方法。
An input step for inputting a plurality of images constituting the moving image;
An encoding step for predictively encoding a plurality of images decoded and reproduced after being encoded in the past as reference images, and generating compressed image data;
A decoding step of decoding the compressed image data and restoring the reproduced image;
An image storage step of storing one or more of the reproduced images as reference images used to encode subsequent images by an image storage means;
A buffer management step for controlling the image storage means,
In the buffer management step,
Buffer description information similar to the target buffer description information from a plurality of encoded buffer description information different from target buffer description information related to a plurality of reference images used when predictively encoding the image is referred to as a reference buffer description Searching as information, generating identification information identifying the reference buffer description information,
Calculating a difference value between a picture number of a reference image of the reference buffer description information and a picture number of a target image of the target buffer description information;
The prediction buffer description information is generated from the reference buffer description information and the difference value, and the target buffer description information is obtained from three or more modes prepared for generating new buffer description information based on the prediction buffer description information. Select the mode information to generate,
In the encoding step,
Encode the identification information, the difference value, and the mode information,
The three or more modes include
At least three modes including a first mode, a second mode, and a third mode that perform different processes from each other are included.
The three or more modes are:
A moving picture predictive coding method characterized by indicating a different processing method for generating the target buffer description information from the prediction buffer description information.
動画像を構成する複数の画像を入力する入力手段と、
前記画像を、過去に符号化した後に復号・再生された複数の画像を参照画像として予測符号化し、圧縮画像データを生成する符号化手段と、
前記圧縮画像データを復号し、再生画像に復元する復号手段と、
前記再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上格納する画像格納手段と、
前記画像格納手段を制御するバッファ管理手段と、を具備し、
前記バッファ管理手段は、
前記画像を予測符号化する際に用いられる複数の参照画像に係る対象バッファ記述情報とは異なる、複数の符号化済みバッファ記述情報から、前記対象バッファ記述情報に類似するバッファ記述情報を参照バッファ記述情報として探索し、該参照バッファ記述情報を識別する識別情報を生成し、
前記参照バッファ記述情報の参照画像のピクチャ番号と前記対象バッファ記述情報の対象画像のピクチャ番号との差分値を算出し、
前記参照バッファ記述情報と前記差分値から予測バッファ記述情報を生成し、該予測バッファ記述情報に基づいて新たなバッファ記述情報を生成するために用意した3以上のモードから、前記対象バッファ記述情報を生成するモード情報を選択し、
前記符号化手段は、
前記識別情報、前記差分値、前記モード情報を符号化し、
前記3以上のモードには、
少なくとも、互いに異なる処理を行う第1のモード、第2のモード、及び第3のモードの3つのモードが含まれており、
前記3以上のモードは、
それぞれ、前記予測バッファ記述情報から前記対象バッファ記述情報を生成する異なる処理方法を指し示すことを特徴とする動画像予測符号化装置。
Input means for inputting a plurality of images constituting a moving image;
Encoding means for predictively encoding a plurality of images decoded and reproduced after being encoded in the past as reference images, and generating compressed image data;
Decoding means for decoding the compressed image data and restoring the reproduced image;
Image storage means for storing one or more of the reproduced images as reference images used to encode subsequent images;
Buffer management means for controlling the image storage means,
The buffer management means includes
Buffer description information similar to the target buffer description information from a plurality of encoded buffer description information different from target buffer description information related to a plurality of reference images used when predictively encoding the image is referred to as a reference buffer description Searching as information, generating identification information identifying the reference buffer description information,
Calculating a difference value between a picture number of a reference image of the reference buffer description information and a picture number of a target image of the target buffer description information;
The prediction buffer description information is generated from the reference buffer description information and the difference value, and the target buffer description information is obtained from three or more modes prepared for generating new buffer description information based on the prediction buffer description information. Select the mode information to generate,
The encoding means includes
Encode the identification information, the difference value, and the mode information,
The three or more modes include
At least three modes including a first mode, a second mode, and a third mode that perform different processes from each other are included.
The three or more modes are:
A moving picture predictive coding apparatus characterized by indicating a different processing method for generating the target buffer description information from the prediction buffer description information, respectively.
JP2012146095A 2012-06-28 2012-06-28 Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program Expired - Fee Related JP5950726B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012146095A JP5950726B2 (en) 2012-06-28 2012-06-28 Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012146095A JP5950726B2 (en) 2012-06-28 2012-06-28 Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program

Publications (2)

Publication Number Publication Date
JP2014011586A JP2014011586A (en) 2014-01-20
JP5950726B2 true JP5950726B2 (en) 2016-07-13

Family

ID=50107911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012146095A Expired - Fee Related JP5950726B2 (en) 2012-06-28 2012-06-28 Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program

Country Status (1)

Country Link
JP (1) JP5950726B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG10201610882XA (en) * 2012-06-29 2017-02-27 Sony Corp Encoding device and encoding method
KR102585975B1 (en) 2018-09-12 2023-10-05 후아웨이 테크놀러지 컴퍼니 리미티드 Index signaling for reference picture list structure

Also Published As

Publication number Publication date
JP2014011586A (en) 2014-01-20

Similar Documents

Publication Publication Date Title
JP6726340B2 (en) Image predictive decoding method
EP2445215B1 (en) Dynamic image encoding device and dynamic image decoding device
JP5586101B2 (en) Image predictive encoding device, image predictive encoding method, image predictive encoding program, image predictive decoding device, image predictive decoding method, and image predictive decoding program
JP5950726B2 (en) Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program
EP3177019B1 (en) Motion video prediction decoding method, and motion video prediction decoding device
KR20140029369A (en) Image predict coding device, image predict coding method, image predict coding program, image predict decoding device, image predict decoding method, and image predict decoding program
JP6862522B2 (en) Moving image coding device and moving image decoding device
JP6717993B2 (en) Image predictive decoding method and image predictive decoding apparatus
CA3091658C (en) Video encoding apparatus, video decoding apparatus and related methods
JP5957558B2 (en) Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program
KR20180054693A (en) Method and apparatus for encoding and decoding a video signal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160607

R150 Certificate of patent or registration of utility model

Ref document number: 5950726

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees