JP2005151167A - Encoding apparatus and encoding program for predicting movement compensation - Google Patents

Encoding apparatus and encoding program for predicting movement compensation Download PDF

Info

Publication number
JP2005151167A
JP2005151167A JP2003385713A JP2003385713A JP2005151167A JP 2005151167 A JP2005151167 A JP 2005151167A JP 2003385713 A JP2003385713 A JP 2003385713A JP 2003385713 A JP2003385713 A JP 2003385713A JP 2005151167 A JP2005151167 A JP 2005151167A
Authority
JP
Japan
Prior art keywords
reference index
image
encoding
picture
procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003385713A
Other languages
Japanese (ja)
Inventor
Hideki Takehara
英樹 竹原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2003385713A priority Critical patent/JP2005151167A/en
Publication of JP2005151167A publication Critical patent/JP2005151167A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To suppress the amount of encoding relative to reference indexes to be assigned to reference images in a movement compensation predicting apparatus using a plurality of reference images. <P>SOLUTION: A movement-related information processing part 118 counts the number of each of reference indexes relative to the image to be encoded. The amount of encoding A is obtained under the assignment condition of predetermined encoding bits concerning each reference index, and the amount of encoding B is obtained under the assignment condition where the number of the encoding bits of each reference index is made to correspond to the number of the reference indexes by ascending/descending order relation. In the case of A-B>α, the reference indexes are each changed to meet the assignment condition used in obtaining B and encoded under the condition by an entropy encoder 104. Then a multiplexer 105 incorporates the change information to the high-order hierarchy of multiplex image data. A(α) is defined as the amount of encoding of the change information. In the case of A-B≤α, encoding is performed under the predetermined assignment condition without performing changing. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は動画像情報を高能率符号化する動き補償予測符号化に関連した技術であって、特に、動き補償予測のために複数の参照画像を用いる場合に、各参照画像を示す参照インデックスに係る符号量を抑制するための改良に関する。   The present invention is a technique related to motion compensated predictive coding that performs high-efficiency coding of moving picture information, and in particular, when a plurality of reference pictures are used for motion compensated prediction, a reference index indicating each reference picture is used. The present invention relates to an improvement for suppressing the code amount.

動画像の符号化技術の国際標準方式であるMPEG(Moving Picture Experts Group)やH.263等では、フレーム間予測符号化を基本として、動き補償予測とDCT(Discrete Cosine Transform)を組み合わせたハイブリッド符号化方式が主流をなしており、マルチメディア情報通信の分野等で広範に実施されている。   In MPEG (Moving Picture Experts Group), H.263, etc., which are international standards for moving picture coding technology, a hybrid code combining motion compensation prediction and DCT (Discrete Cosine Transform) based on inter-frame prediction coding. The mainstreaming method is widely used in the field of multimedia information communication.

フレーム間予測符号化では、メモリに記憶させた前フレームの画像信号が現フレームの画像信号に対する予測信号として用いられ、両フレーム間の差分に相当する予測誤差信号が符号化される。
それに対して、動き補償予測では、前フレームと現フレームから画像のブロック毎の動きベクトルを求め、その動きベクトルを用いて前フレームを補正して現フレームに対する予測画像を生成し、その予測画像と現フレームの画像との差分をとって予測誤差を求め、前記の動きベクトルと予測誤差信号を符号化する。
即ち、動き補償予測によれば、画像の動領域の予測精度を向上させて発生する情報量の削減を図れると共に画像品質の向上を実現でき、高能率符号化方式において必須技術である。
In inter-frame predictive encoding, the image signal of the previous frame stored in the memory is used as a predictive signal for the image signal of the current frame, and a prediction error signal corresponding to the difference between both frames is encoded.
On the other hand, in motion compensation prediction, a motion vector for each block of an image is obtained from the previous frame and the current frame, the previous frame is corrected using the motion vector, and a predicted image for the current frame is generated. A prediction error is obtained by taking a difference from the image of the current frame, and the motion vector and the prediction error signal are encoded.
That is, according to motion compensation prediction, it is possible to reduce the amount of information generated by improving the prediction accuracy of a moving region of an image and improve image quality, which is an essential technique in a high-efficiency encoding method.

そして、動き補償予測においては、例えば、下記特許文献1に示されるように使用する参照画像を複数の中から選択して符号化する方法があるが、その場合には、動き補償されるブロック毎に動きベクトルとその動きベクトルが参照している参照画像を示す参照インデックスを符号化する必要がある。   In motion-compensated prediction, for example, there is a method of selecting and encoding a reference image to be used from among a plurality of reference images as shown in Patent Document 1 below. It is necessary to encode a motion vector and a reference index indicating a reference image referred to by the motion vector.

以下、前記のように複数の参照画像を用いて動き補償予測を行う方式の符号化装置について説明しておく。
その符号化装置は、図3の機能ブロック図に示す構成を備えており、時系列で入力されるフレーム画像を、フレーム内符号化画像(I0ピクチャ)、I0ピクチャから前方向予測符号化された画像(P1ピクチャ)、I0ピクチャ又はP1ピクチャを選択して前方向予測符号化された画像(P2ピクチャ)、前記の各ピクチャ(I0,P1,P2)のいずれかを選択して前方向予測符号化された画像(P3ピクチャ)として順次符号化し、符号化過程で得られる付帯情報等とともに多重化したビットストリームとして伝送路へ出力するものである。
尚、前方向予測符号化における各画像タイプの参照関係は図4のようになる。
Hereinafter, an encoding apparatus that performs motion compensation prediction using a plurality of reference images as described above will be described.
The coding apparatus has the configuration shown in the functional block diagram of FIG. 3, and a frame image input in time series is subjected to forward predictive coding from an intra-frame coded image (I0 picture) and I0 picture. Select a picture (P1 picture), an I0 picture or a P1 picture, and a picture (P2 picture) that has been forward-predicted and coded, and select any one of the pictures (I0, P1, P2). Are sequentially encoded as a converted image (P3 picture), and output to the transmission path as a bit stream multiplexed with accompanying information and the like obtained in the encoding process.
Note that the reference relationship of each image type in forward prediction encoding is as shown in FIG.

先ず、入力フレーム画像100をI0ピクチャに符号化するフレーム内符号化モードでは、スイッチ101aがx側に接続されており、スイッチ112aは非接続状態になっている。
このモードでは、入力フレーム画像100に対して直交変換器102で8×8画素ブロック単位での直交変換処理が施され、その処理で得られた係数を量子化器103に与え、量子化器103では所定の量子化ステップ数で前記係数データを量子化し、固定長の符号となった係数をエントロピー符号化器104と逆量子化器110へ出力する。
First, in the intra-frame coding mode in which the input frame image 100 is coded into an I0 picture, the switch 101a is connected to the x side and the switch 112a is in a disconnected state.
In this mode, the orthogonal transform process is performed on the input frame image 100 by the orthogonal transform unit 102 in units of 8 × 8 pixel blocks, and the coefficient obtained by the process is given to the quantizer 103. Then, the coefficient data is quantized with a predetermined number of quantization steps, and the fixed length code is output to the entropy encoder 104 and the inverse quantizer 110.

エントロピー符号化器104では2次元の8×8個の係数を1次元に変換してその係数を予め定められている方法によって符号化する。
そして、多重器105では、エントロピー符号化した符号列と共に、量子化器103から得られる付帯情報をヘッダ情報として多重化し、符号化ビットストリーム120として伝送路へ出力する。
尚、I0ピクチャはフレーム内符号化処理によるものであるため、動き検出器117と動き補償予測器116は動作せず、動きベクトル等の付帯情報は存在しない。
The entropy encoder 104 converts the two-dimensional 8 × 8 coefficients into one dimension and encodes the coefficients by a predetermined method.
The multiplexer 105 multiplexes the incidental information obtained from the quantizer 103 together with the entropy-encoded code string as header information, and outputs the multiplexed information as a coded bit stream 120 to the transmission path.
Since the I0 picture is obtained by intraframe coding processing, the motion detector 117 and the motion compensation predictor 116 do not operate, and there is no additional information such as a motion vector.

一方、逆量子化器110へ出力された量子化後のデータは、逆量子化器110と逆直交変換器111によって前記の直交変換器102と量子化器103の逆処理が施されて元の入力フレーム画像100が再生され、その再生画像が画像メモリ113にセーブされた後、ループフィルタ114でブロックノイズを低減化させて画像メモリ115にセーブされる。   On the other hand, the quantized data output to the inverse quantizer 110 is subjected to the inverse processing of the orthogonal transformer 102 and the quantizer 103 by the inverse quantizer 110 and the inverse orthogonal transformer 111 to obtain the original data. After the input frame image 100 is reproduced and the reproduced image is saved in the image memory 113, the block noise is reduced by the loop filter 114 and saved in the image memory 115.

次に、入力フレーム画像100を前方向予測符号化画像(P1ピクチャ,P2ピクチャ,P3ピクチャ)に符号化するモードでは、スイッチ101aがy側に接続され、スイッチ112aは接続状態となる。
この符号化モードでは、入力フレーム画像(現フレーム画像)100は動き検出器117と減算器101へ入力されている。
動き検出器117は、入力フレーム画像100を分割して得られる各ターゲットブロック(16×16画素又は8×8画素)について、画像メモリ115にセーブされている参照画像との相関を探査して動きベクトルを求めると共に、その動きベクトルを求めた参照画像に係る参照インデックスを付与し、動き補償予測器116がそれらと前記参照画像信号とから画像間予測信号を生成して減算器101へ出力する。
但し、動き検出器117と動き補償予測器116の詳細な機能は後述することとし、ここでは減算器101より後段の処理について先に説明する。
Next, in a mode in which the input frame image 100 is encoded into a forward prediction encoded image (P1 picture, P2 picture, P3 picture), the switch 101a is connected to the y side, and the switch 112a is in a connected state.
In this encoding mode, the input frame image (current frame image) 100 is input to the motion detector 117 and the subtractor 101.
The motion detector 117 searches for a correlation with the reference image saved in the image memory 115 for each target block (16 × 16 pixels or 8 × 8 pixels) obtained by dividing the input frame image 100 to perform motion. A vector is obtained, and a reference index related to the reference image for which the motion vector is obtained is assigned.
However, detailed functions of the motion detector 117 and the motion compensation predictor 116 will be described later. Here, processing subsequent to the subtracter 101 will be described first.

減算器101では、入力フレーム画像100の前記ターゲットブロックの画像信号と動き補償予測器116から得られている画像間予測信号との差分が求められ、予測誤差信号としてスイッチ101aを介して直交変換器102へ出力される。
そして、直交変換器102と量子化器103による処理は、その直交変換の対象が予測誤差信号であり前方向予測符号化された画像データが得られるだけであって、基本的には前記フレーム内符号化モードと同様である。
ただ、エントロピー符号化器104と多重器105で前記符号化画像データと付帯情報を符号化・多重化して符号化ビットストリーム120を構成する際には、量子化器103から得られる付帯情報と共に、動き検出器117が求めた動きベクトルと参照インデックス等の付帯情報も符号化されてヘッダ情報として多重化される。
In the subtractor 101, a difference between the image signal of the target block of the input frame image 100 and the inter-picture prediction signal obtained from the motion compensation predictor 116 is obtained, and an orthogonal transformer is obtained as a prediction error signal via the switch 101a. 102.
The processing performed by the orthogonal transformer 102 and the quantizer 103 is only to obtain the prediction error signal and the image data that has been subjected to the forward prediction encoding, and basically the intra-frame processing is performed. This is the same as the encoding mode.
However, when the encoded bit stream 120 is formed by encoding and multiplexing the encoded image data and the auxiliary information by the entropy encoder 104 and the multiplexer 105, along with the auxiliary information obtained from the quantizer 103, The additional information such as the motion vector obtained by the motion detector 117 and the reference index is also encoded and multiplexed as header information.

一方、量子化器103から逆量子化器110側へ入力された量子化後の係数データについては、逆量子化器110と逆直交変換器111によって前記の直交変換器102と量子化器103の逆処理が施されるため、減算器101の出力である予測誤差信号が復元される。
そして、スイッチ112aが接続状態であるため、復元された予測誤差信号には加算器112によって動き補償予測器116の予測信号が加算されて元のターゲットブロックの画像が再生され、その再生画像が画像メモリ113にセーブされることになる。
On the other hand, the quantized coefficient data input from the quantizer 103 to the inverse quantizer 110 side is processed by the orthogonal transformer 102 and the quantizer 103 by the inverse quantizer 110 and the inverse orthogonal transformer 111. Since the inverse process is performed, the prediction error signal that is the output of the subtractor 101 is restored.
Since the switch 112a is in the connected state, the prediction signal of the motion compensation predictor 116 is added to the restored prediction error signal by the adder 112 to reproduce the image of the original target block, and the reproduced image is the image. It will be saved in the memory 113.

そして、前記手順は1フレーム中の各ターゲットブロックについて順次実行され、1フレーム分の全ターゲットブロックについて再生画像が得られた段階で、画像メモリ113の画像データを読み出し、ループフィルタ114でブロックノイズを低減化させて画像メモリ115にセーブする。   The procedure is sequentially executed for each target block in one frame, and when reproduced images are obtained for all target blocks for one frame, the image data in the image memory 113 is read out, and block noise is detected by the loop filter 114. The image is reduced and saved in the image memory 115.

ところで、画像メモリ115は最大で3フレーム分の再生画像をFIFO(First-in First-out)方式で記憶するメモリであり、1回のフレーム内符号化モードと3回の前方向予測符号化モードとを交互に設定することにより、I0ピクチャへの符号化に際しては直前の3フレーム分に係るP1ピクチャとP2ピクチャとP3ピクチャの再生画像が、P1ピクチャへの符号化に際しては直前の3フレーム分に係るP2ピクチャとP3ピクチャとI0ピクチャの再生画像が、P2ピクチャの符号化に際しては直前の3フレーム分に係るP3ピクチャとI0ピクチャとP1ピクチャの再生画像が、P3ピクチャの符号化に際しては直前の3フレーム分に係るI0ピクチャとP1ピクチャとP2ピクチャの再生画像がセーブされることになる。   Incidentally, the image memory 115 is a memory that stores a maximum of three frames of reproduced images in a first-in first-out (FIFO) system, and includes one intra-frame coding mode and three forward prediction coding modes. Are alternately set, the P1 picture, the P2 picture, and the P3 picture corresponding to the previous three frames are encoded in the I0 picture, and the previous three frames are encoded in the P1 picture. The P2 picture, the P3 picture, and the I0 picture are related to the P2 picture, the P3 picture is encoded with the P3 picture, the I0 picture, and the P1 picture that are immediately before the P3 picture. The reproduced images of the I0 picture, the P1 picture, and the P2 picture related to the three frames are saved.

ここで、上記で簡単に触れた動き検出器117と動き補償予測器116の機能について詳細に説明する。
動き検出器117と動き補償予測器116が動作するのは前方向予測符号化モードの場合だけであり、図4に示したように、P1ピクチャへの符号化時にはI0ピクチャの再生画像のみを、P2ピクチャへの符号化時にはI0ピクチャ又はP1ピクチャの再生画像を、P3ピクチャへの符号化時にはI0ピクチャ、P1ピクチャ又はP2ピクチャの再生画像のいずれかを、ぞれぞれの参照画像とする。
そして、動き検出器117では、前方向予測符号化モードにおける前記符号化画像タイプによって画像メモリ115にセーブされている3フレーム分の再生画像(候補参照画像)の内から前記条件で参照画像を選択する。
Here, the functions of the motion detector 117 and the motion compensation predictor 116 that have been briefly described above will be described in detail.
The motion detector 117 and the motion compensated predictor 116 operate only in the forward predictive encoding mode. As shown in FIG. 4, only the reproduced image of the I0 picture is encoded at the time of encoding into the P1 picture. When encoding to a P2 picture, a playback image of the I0 picture or P1 picture is used as a reference image, and when encoding to a P3 picture, any of the playback images of the I0 picture, P1 picture, or P2 picture is used as a reference image.
Then, the motion detector 117 selects a reference image under the above conditions from among three frames of reproduced images (candidate reference images) saved in the image memory 115 according to the encoded image type in the forward predictive encoding mode. To do.

例えば、P3ピクチャへの符号化時には、3つの候補参照画像(I0ピクチャ、P1ピクチャ又はP2ピクチャの再生画像)を入力フレーム画像100側のターゲットブロックと同一サイズ(16×16画素又は8×8画素)の参照ブロックに分割し、入力フレーム画像100のターゲットブロック毎に、各候補参照画像内の各参照ブロックを1/2画素ずつ一定範囲内で(例えば、16×16画素の場合であれば±15画素分)移動させて前記ターゲットブロックとのブロックマッチングをとり、絶対誤差和(又は二乗誤差和)が最も小さくなる参照ブロックの移動を動きベクトルとして求めると共に、その参照ブロックを含む参照画像に予め対応付けられている参照インデックスを付与する。
即ち、動き検出器117は、入力フレーム画像100の各ターゲットブロックについて前記条件に基づく動きベクトルを求め、その動きベクトルを求めるために用いた参照画像の参照インデックスを与える。
その場合、参照インデックスはP3ピクチャに対して時間的に近い順から順に対応付けられており、図4に示すように、P2,P1,I0の各ピクチャに係る参照画像に対して、それぞれ「0」,「1」,「2」の参照インデックスが対応付けられる。
また、次の表1に示すように、各参照インデックスにはそれぞれ“0”,“10”,“110”の符号ビットが割り当てられる。

Figure 2005151167
For example, when encoding into a P3 picture, three candidate reference images (reproduced images of an I0 picture, a P1 picture, or a P2 picture) are the same size as the target block on the input frame image 100 side (16 × 16 pixels or 8 × 8 pixels) ), And for each target block of the input frame image 100, each reference block in each candidate reference image is ½ pixel within a certain range (for example, ± 16 pixels in the case of 16 × 16 pixels). 15 pixels) is moved to perform block matching with the target block, and the movement of the reference block having the smallest absolute error sum (or square error sum) is obtained as a motion vector. Assign the associated reference index.
That is, the motion detector 117 obtains a motion vector based on the above condition for each target block of the input frame image 100, and gives a reference index of the reference image used for obtaining the motion vector.
In that case, the reference index is associated with the P3 picture in order from the closest to the time, and as shown in FIG. 4, “0” is assigned to the reference images related to the pictures P2, P1, and I0. , “1” and “2” are associated with each other.
Further, as shown in the following Table 1, code bits “0”, “10”, and “110” are assigned to each reference index, respectively.
Figure 2005151167

尚、前記ではP3ピクチャへの符号化時について説明したが、動きベクトルの求め方はP1ピクチャやP2ピクチャへの符号化時においても同様である。
但し、P1ピクチャへの符号化時における参照画像はI0ピクチャの再生画像だけであるために参照インデックスはその参照画像に対する「0」だけであり、P2ピクチャへの符号化時における参照画像はI0ピクチャとP1ピクチャの再生画像となるため、それぞれに「1」,「0」の参照インデックスが対応付けられる。
In the above description, the encoding to the P3 picture has been described. However, the method for obtaining the motion vector is the same when encoding to the P1 picture or the P2 picture.
However, since the reference picture at the time of encoding to the P1 picture is only the reproduced picture of the I0 picture, the reference index is only “0” for the reference picture, and the reference picture at the time of encoding to the P2 picture is the I0 picture. And P1 picture reproduction images, the reference indexes “1” and “0” are associated with each other.

次に、動き補償予測器116は、動き検出器117から与えられる動きベクトルと参照インデックスに基づいて、画像メモリ115にセーブされている各候補参照画像の前記サイズの画素ブロックを移動させることにより画像間予測信号を得る。
そして、減算器101においてその画像間予測信号と入力画像信号との差分(予測誤差)が演算されて直交変換器102へ出力されることは、上記のとおりである。
また、前記のように動き検出器117が求めた動きベクトルや参照インデックスの付帯情報がエントロピー符号化器104と多重器105へ転送され、所定の規則に基づいた符号化(参照インデックスは表1の規則による符号化)と多重化が行われて符号化ビットストリーム120として出力されることも上記と同様であるが、エントロピー符号化器104での参照インデックスに対する符号ビットの割り当てに際しては、前記の表1に示すように、各参照インデックス「0」,「1」,「2」にそれぞれ“0”,“10”,“110”が割り当てられる。
Next, the motion compensation predictor 116 moves the pixel block of the size of each candidate reference image saved in the image memory 115 on the basis of the motion vector and the reference index given from the motion detector 117. Inter prediction signal is obtained.
Then, as described above, the subtractor 101 calculates the difference (prediction error) between the inter-picture prediction signal and the input image signal and outputs it to the orthogonal transformer 102.
Also, the motion vector obtained by the motion detector 117 and the additional information of the reference index as described above are transferred to the entropy encoder 104 and the multiplexer 105 and encoded based on a predetermined rule (the reference index is shown in Table 1). (Encoding by rule) and multiplexing are performed and output as an encoded bit stream 120 in the same manner as described above. However, when assigning code bits to a reference index in the entropy encoder 104, the above table is used. As shown in FIG. 1, “0”, “10”, and “110” are assigned to the reference indexes “0”, “1”, and “2”, respectively.

特開平11−239351号公報JP 11-239351 A

ところで、従来の動き補償予測符号化装置では、動き検出器117において、参照インデックスの値が入力画像に対して時間的に近い参照画像から昇順となるように対応付けられており、エントロピー符号化器104においては参照インデックスの値が小さいほどその符号化ビットのビット数が小さくなるように割り当てられている。
これは、動画像では一般に時間的に近い画像ほど相関性が高く、動き補償予測においても、符号化対象画像に対して時間的に最も近い参照画像が選択されることが多いからであり、前記のような割り当て条件に基づく符号化によって参照インデックスの符号化量を低減化できるからである。
By the way, in the conventional motion compensated predictive coding apparatus, the motion detector 117 associates the reference index value with the reference image that is temporally closer to the input image in ascending order, and the entropy encoder. In 104, the smaller the reference index value is, the smaller the number of coded bits is assigned.
This is because, in moving images, images that are closer in time generally have higher correlation, and in motion compensated prediction, a reference image that is closest in time to an encoding target image is often selected. This is because the encoding amount of the reference index can be reduced by encoding based on the allocation condition as described above.

しかしながら、例えば、画面全体が周期的にフラッシュしている動画像や、手振れなどによる細かな動きがあるような動画像においては、符号化対象画像の直前の参照画像ではなく、他の参照画像と高い相関性を持つ場合がある。
そして、そのような場合に参照画像に対する参照インデックスの対応付けを一律に適用していると、参照インデックスの符号量が予想外に大きくなるという欠点がある。
However, for example, in a moving image in which the entire screen is periodically flashed or a moving image in which there is a fine movement due to camera shake or the like, it is not a reference image immediately before the encoding target image but another reference image. May have high correlation.
In such a case, if the correspondence of the reference index to the reference image is uniformly applied, there is a disadvantage that the code amount of the reference index becomes unexpectedly large.

そこで、本発明は、参照画像に対する参照インデックスの対応付け関係を適応的に変更して符号化ビットの割り当て条件を変化させることにより、参照インデックスに係る符号量を減少させる動き補償予測符号化装置を提供することを目的として創作された。   Therefore, the present invention provides a motion compensated predictive coding apparatus that reduces the code amount related to the reference index by adaptively changing the association relationship of the reference index with the reference image to change the coding bit allocation condition. It was created for the purpose of providing.

本発明は、符号化対象画像を所定サイズのターゲットブロックに分割し、前記符号化対象画像より前に符号化処理された画像データを逆処理して複数の参照画像を再生し、それらの内から2以上の参照画像を参照して符号化画像を生成するモードでは、前記ターゲットブロック毎に前記参照画像中のブロックから最も近似したものを求めて動きベクトルを検出し、前記ターゲットブロック毎の動きベクトルと前記参照画像とを用いた動き補償予測によって画像間予測データを求めた後、その画像間予測データと前記符号化対象画像との差分である予測誤差を求め、前記各参照画像に対して前記符号化対象画像に時間的に近い方から昇順番号となる各参照インデックスを付与すると共に、前記各参照インデックスに対する符号を前記昇順番号に対応させて符号量が大きくなる条件で割り当てるようにして、前記予測誤差と前記各動きベクトルと前記各参照インデックスとを符号化した階層構造の多重化画像データを出力する動き補償予測符号化装置において、前記符号化対象画像に係る各参照インデックスの数をカウントするカウント手段と、前記カウント手段が求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量との乗算値の和を演算する第1演算手段と、前記カウント手段が求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量とを昇順/降順の逆関係で対応付けた場合の乗算値の和を演算する第2演算手段と、前記第1演算手段が求めた値から前記第2演算手段が求めた値を差し引いた差分が所定値より大きい場合には、前記各参照インデックスの番号を前記カウント手段が求めた各参照インデックスの数の降順に付与される昇順番号に変更し、前記差分が前記所定値以下である場合には、前記各参照インデックスは既定の付与番号のままとする参照インデックス制御手段と、前記参照インデックス制御手段が前記各参照インデックスの番号を変更した場合に、その変更情報を前記多重化画像データの上位階層中に符号化する設定情報符号化手段とを具備したことを特徴とする動き補償予測符号化装置に係る。   The present invention divides an encoding target image into target blocks of a predetermined size, reversely processes image data encoded before the encoding target image, and reproduces a plurality of reference images. In a mode in which an encoded image is generated with reference to two or more reference images, a motion vector is detected by obtaining a closest approximation from the blocks in the reference image for each target block, and a motion vector for each target block is detected. And inter-image prediction data by motion compensated prediction using the reference image, and then obtaining a prediction error that is a difference between the inter-image prediction data and the encoding target image, and for each reference image Each reference index that is an ascending order from the temporally closer to the encoding target image is assigned, and a code for each reference index is assigned to the ascending order And a motion compensated predictive coding apparatus for outputting multiplexed image data having a hierarchical structure in which the prediction error, each motion vector, and each reference index are encoded, so as to be allocated under a condition that the code amount increases accordingly. A counting means for counting the number of each reference index relating to the encoding target image; and a multiplication value of the number of each reference index obtained by the counting means and the code amount of the code assigned to each reference index. Multiplication when first calculation means for calculating the sum, the number of each reference index obtained by the counting means and the code amount of the code assigned to each reference index are associated in an ascending / descending order inverse relationship A second calculation means for calculating a sum of values, and a difference obtained by subtracting the value obtained by the second calculation means from the value obtained by the first calculation means. If greater than the value, the number of each reference index is changed to an ascending order number given in descending order of the number of each reference index obtained by the counting means, and if the difference is less than or equal to the predetermined value, Reference index control means for maintaining each reference index as a predetermined assigned number, and when the reference index control means changes the number of each reference index, the change information is stored in the upper hierarchy of the multiplexed image data. The present invention relates to a motion-compensated predictive coding apparatus characterized by comprising setting information coding means for performing coding.

本発明の動き補償予測符号化装置では、カウント手段によって符号化対象画像に係る各参照インデックスの数を求めておき、第1演算手段が既定条件による各参照画像の参照インデックスと各参照インデックスに割り当てられた符号量との関係に基づいて全ての参照インデックスに係る符号量を試算し、第2演算手段がカウント手段で求められた各参照インデックスの数と各参照インデックスの符号量とを昇順/降順の逆関係で対応付けた場合における全ての参照インデックスに係る符号量を試算する。
そして、参照インデックス制御手段は、第2演算手段が求めた符号量の方が第1演算手段が求めた符号量よりも小さく、その差が所定値より大きい場合には、各参照インデックスの番号をカウント手段が求めた各参照インデックスの数の降順に付与される昇順番号に変更することにより、参照インデックスに係る符号量が第2演算手段の求めた符号量になるようにし、逆の場合には、各参照インデックスの番号を変更することなく、第1演算手段が求めた符号量になるようにする。
即ち、ターゲットブロックに係る動きベクトルの検出に際して、より多く参照された参照画像の参照インデックスにより小さい符号量の符号を割り当てられるようにして、全ての参照インデックスについて合計した符号化量の低減化を図っている。
また、そのような割り当て設定を行ったことは、設定情報符号化手段が多重化画像データの上位階層中に変更情報を符号化しておくことで判別できるようにしている。
尚、前記「所定値」は、設定情報符号化手段が変更情報を符号化した際の符号量以上の値として設定すれば合理的であり、また各種条件でその値が変動するような場合にはその符号量の最大値や平均値を採用してもよい。
In the motion compensated predictive coding apparatus of the present invention, the number of each reference index related to the encoding target image is obtained by the counting means, and the first calculation means assigns the reference index of each reference picture and each reference index according to a predetermined condition. Based on the relationship with the obtained code amount, the code amount related to all the reference indexes is estimated, and the number of each reference index obtained by the second calculating means and the code amount of each reference index are calculated in ascending / descending order. The amount of codes related to all reference indexes in the case of association with the inverse relationship is calculated.
The reference index control means determines the reference index number when the code amount obtained by the second computing means is smaller than the code quantity obtained by the first computing means and the difference is larger than a predetermined value. By changing to the ascending order number given in descending order of the number of each reference index obtained by the counting means, the code amount related to the reference index becomes the code quantity obtained by the second computing means, and vice versa The code amount obtained by the first calculation means is set without changing the number of each reference index.
In other words, when detecting a motion vector related to a target block, a code having a smaller code amount is assigned to a reference index of a reference image that has been referred to more frequently, thereby reducing the total coding amount for all reference indexes. ing.
Further, such setting of assignment can be determined by encoding the change information in the upper layer of the multiplexed image data by the setting information encoding means.
The “predetermined value” is reasonable if it is set as a value that is greater than or equal to the amount of code when the setting information encoding means encodes the change information, and when the value fluctuates under various conditions. May adopt the maximum value or the average value of the code amount.

前記発明における各手段の処理はコンピュータによって実行させることができ、その場合のプログラムは、前記符号化対象画像に係る各参照インデックスの数をカウントする第1手順と、前記第1手順で求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量との乗算値の和を演算する第2手順と、前記第1手順で求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量とを昇順/降順の逆関係で対応付けた乗算値の和を演算する第3手順と、前記第2手順で求めた値から前記第3手順で求めた値を差し引いた差分が所定値より大きい場合には、前記各参照インデックスの番号を前記第1手順で求めた各参照インデックスの数の降順に付与される昇順番号に変更し、前記差分が前記所定値以下である場合には、前記各参照インデックスは既定の付与番号のままとする第4手順と、前記第4手順で前記各参照インデックスの番号を変更した場合に、その変更情報を前記多重化画像データの上位階層中に符号化する第5手順とを実行させるものとなる。   The processing of each means in the invention can be executed by a computer, and the program in that case includes a first procedure for counting the number of each reference index related to the encoding target image, and each of the steps obtained in the first procedure. A second procedure for calculating a sum of multiplication values of the number of reference indexes and the code amount of the code assigned to each reference index; the number of each reference index obtained in the first procedure and the assignment to each reference index A third procedure for calculating the sum of multiplication values in which the code amount of the code is associated in an ascending / descending order inverse relationship, and the value obtained in the third procedure from the value obtained in the second procedure. If the subtracted difference is larger than a predetermined value, the number of each reference index is changed to an ascending order number given in descending order of the number of each reference index obtained in the first procedure, If the difference is less than or equal to the predetermined value, the reference number remains the default assigned number, and the change is made when the number of each reference index is changed in the fourth step. A fifth procedure for encoding information into the upper layer of the multiplexed image data is executed.

本発明は、複数の候補参照画像を用いる動き補償予測符号化装置において、各参照画像を示す参照インデックスに係る符号量を既定条件の場合と参照頻度の高い参照インデックスに小さい符号化ビット数を与える条件の場合とで試算し、適応的に参照インデックスを変更することにより各参照インデックスに対する符号ビットの割り当て条件を変化させて、参照インデックスに係る符号量を低減化させる。   The present invention provides a motion-compensated predictive coding apparatus that uses a plurality of candidate reference images, and assigns a small number of coding bits to a reference index having a high reference frequency and a code amount related to a reference index indicating each reference image. Trial calculation is performed according to the conditions, and by changing the reference index adaptively, the code bit allocation condition for each reference index is changed to reduce the code amount related to the reference index.

以下、本発明の動き補償予測符号化装置の実施形態を図1及び図2に基づいて詳細に説明する。
図1はこの実施形態に係る符号化装置の機能ブロック回路図であり、同図と図3とを比較すれば明らかなように、動き検出器117から多重器105へ付帯情報を転送する回路中に動き付帯情報処理部118が付加されている点が異なるだけである。
そして、前記のように、入力フレーム画像(符号化対象画像)をP2ピクチャ又はP3ピクチャへ符号化する場合には、動き検出器117が各ターゲットブロック(16×16画素又は8×8画素)について動きベクトルを求めた際に、いずれの参照画像を選択したかを参照インデックスで示すようにしているが、この符号化装置の特徴は、動き付帯情報処理部118とエントロピー符号化器104によって、各参照画像の選択状態を確認して参照インデックスを変更し、各参照インデックスに対する符号化ビットの割り当て条件を変化させる点にあり、他のデータ処理動作については背景技術の欄で説明した符号化装置と同様である。
従って、ここでは主に前記特徴的機能に関連した動作ついて説明することとし、他のデータ処理動作の説明は省略する。
Hereinafter, an embodiment of a motion compensated prediction encoding apparatus according to the present invention will be described in detail with reference to FIGS. 1 and 2.
FIG. 1 is a functional block circuit diagram of the encoding apparatus according to this embodiment. As is apparent from a comparison between FIG. 3 and FIG. 3, in the circuit for transferring incidental information from the motion detector 117 to the multiplexer 105. The only difference is that the motion-accompanying information processing unit 118 is added.
As described above, when the input frame image (encoding target image) is encoded into the P2 picture or the P3 picture, the motion detector 117 performs the processing for each target block (16 × 16 pixels or 8 × 8 pixels). When a motion vector is obtained, which reference image is selected is indicated by a reference index. The feature of this encoding device is that each of the motion-accompanying information processing unit 118 and the entropy encoder 104 Checking the selection state of the reference image, changing the reference index, and changing the allocation condition of the encoded bit for each reference index. Other data processing operations are the same as the encoding apparatus described in the background section. It is the same.
Therefore, the operation related to the characteristic function will be mainly described here, and description of other data processing operations will be omitted.

図2のフローチャートは、動き付帯情報処理部118とエントロピー符号化器104が前記機能を実行する動作手順を示す。
但し、このフローチャートは入力フレーム画像をP3ピクチャへ符号化する場合に関するものであり、背景技術の欄で説明したように、画像メモリ115にはI0ピクチャとP1ピクチャとP2ピクチャの再生画像が3つの候補参照画像としてセーブされている。
The flowchart of FIG. 2 shows an operation procedure in which the motion-accompanying information processing unit 118 and the entropy encoder 104 execute the function.
However, this flowchart relates to a case where an input frame image is encoded into a P3 picture. As described in the background art section, the image memory 115 has three reproduced images of the I0 picture, the P1 picture, and the P2 picture. Saved as a candidate reference image.

先ず、動き検出器117は、入力フレーム画像のターゲットブロック毎に、動きベクトルと、その動きベクトルを求めた参照画像に係る前記表1に基づいた参照インデックスを求めるが、動き付帯情報処理部118は全てのターゲットブロックに係るそれらのデータを内蔵メモリに一旦セーブする(S11)。
そして、動き付帯情報処理部118では各参照インデックス[i](i=0,1,2)の個数N(i)をカウントする(S12)。
First, the motion detector 117 obtains a motion vector and a reference index based on the reference image related to the reference image for which the motion vector is obtained for each target block of the input frame image. Those data relating to all target blocks are temporarily saved in the internal memory (S11).
Then, the motion-accompanying information processing unit 118 counts the number N (i) of each reference index [i] (i = 0, 1, 2) (S12).

そして、入力フレーム画像をP3ピクチャへ符号化する場合の各参照インデックス[i]に対する符号化ビット数B(i)の割り当て条件は前記表1に示す対応関係で与えられており、動き付帯情報処理部118は各参照インデックス[i]の個数N(i)と前記符号化ビット数B(i)とを用いて、既定の条件で全ての参照インデックスを符号化した場合の符号量A=N(0)*B(0)+N(1)*B(1)+N(2)*B(2)を試算する(S13)。   The condition for assigning the number of encoded bits B (i) to each reference index [i] when the input frame image is encoded into a P3 picture is given by the correspondence shown in Table 1 above. The unit 118 uses the number N (i) of each reference index [i] and the number of encoded bits B (i) to code the amount of code A = N (when all reference indexes are encoded under a predetermined condition. 0) * B (0) + N (1) * B (1) + N (2) * B (2) is estimated (S13).

また、動き付帯情報処理部118は各参照インデックス[i]の個数N(i)の降順を求め、その順がN(a)≧N(b)≧N(c)[但し、a,b,c∈0,1,2]であったとすると、符号量B=N(a)*B(0)+N(b)*B(1)+N(c)*B(2)を求める(S14,S15)。
即ち、各参照インデックスの符号化ビット数B(i)と各参照インデックスの数N(i)とを昇順と降順の関係で対応付けた場合の乗算値の和を演算し、その対応付け関係に基づいた符号量Bを試算する。
The motion-accompanying information processing unit 118 obtains the descending order of the number N (i) of each reference index [i], and the order is N (a) ≧ N (b) ≧ N (c) [where a, b, If cε0, 1, 2], the code amount B = N (a) * B (0) + N (b) * B (1) + N (c) * B (2) is obtained (S14, S15). ).
That is, the sum of the multiplication values when the number of encoded bits B (i) of each reference index and the number N (i) of each reference index are associated with each other in ascending order and descending order is calculated. Based on the code amount B, a trial calculation is performed.

次に、動き付帯情報処理部118では、符号量Aから符号量Bを差し引いた値を求め、その値が所定値αより大きいか否かを判断する(S16)。
ここで、αは後記するエントロピー符号化器104での参照インデックスの変更情報を符号化する場合の符号量に相当する。
Next, the motion-accompanying information processing unit 118 obtains a value obtained by subtracting the code amount B from the code amount A, and determines whether the value is larger than a predetermined value α (S16).
Here, α corresponds to a code amount in the case of encoding reference index change information in the entropy encoder 104 described later.

そして、(A−B)>αの比較結果が得られた場合には、参照インデックス[i]の変更を行い、0をaに、1をbに、2をcに変更した後、各ターゲットブロックに係る動きベクトルと前記変更後の各参照インデックス[i](i=a,b,c)、及び参照インデックスの変更通知情報をエントロピー符号化器104へ出力する(S16→S17,18)。
即ち、動き付帯情報処理部118では、参照インデックス[i](i=0,1,2)をそれらの個数N(i)の降順に対応するように変更してエントロピー符号化器104へ出力する。
If a comparison result of (A−B)> α is obtained, the reference index [i] is changed, and after changing 0 to a, 1 to b, and 2 to c, each target The motion vector related to the block, each changed reference index [i] (i = a, b, c), and reference index change notification information are output to the entropy encoder 104 (S16 → S17, 18).
That is, the motion-accompanying information processing unit 118 changes the reference index [i] (i = 0, 1, 2) so as to correspond to the descending order of the number N (i) and outputs it to the entropy encoder 104. .

ところで、エントロピー符号化器104では参照インデックス[i]に対する符号ビットの割り当てを前記表1の関係で行うようにしているため、変更後の参照インデックス[i](i=a,b,c)による割り当てがなされると、3種の参照インデックスのカウント数の降順に符号化ビット“0”,“10”,“110”を割り当てて、全てのターゲットブロックに係る参照インデックスを符号化することになる。
換言すれば、参照頻度の高い参照画像(カウント数が多い参インデックス[i])に対して少ない符号化ビット数が割り当てられて、それだけ参照インデックス全体の符号量を低減化できることになる。
Incidentally, since the entropy encoder 104 assigns code bits to the reference index [i] according to the relationship shown in Table 1, the reference index [i] (i = a, b, c) after the change is used. When the allocation is performed, the encoding bits “0”, “10”, “110” are allocated in descending order of the count numbers of the three types of reference indexes, and the reference indexes related to all the target blocks are encoded. .
In other words, a small number of encoded bits is assigned to a reference image with a high reference frequency (reference index [i] with a large number of counts), and the code amount of the entire reference index can be reduced accordingly.

具体的には、例えば、I0ピクチャ,P1ピクチャ,P2ピクチャに係る参照画像を参照しているターゲットブロックの数がそれぞれ120,30,70であったとすると、符号量A及び符号量Bはそれぞれ次式で与えられ、
A=70*3+30*2+120*1=390(ビット)
B=120*1+70*2+30*3=350(ビット)
参照インデックスを変更した場合の方が符号量を低減化する上で有利である。
但し、参照インデックスの変更通知情報がエントロピー符号化器104で符号化された場合に、その符号量αが入力フレーム画像全体の符号量に加算されるため、前記のように(A−B)>αの条件下に参照インデックスの変更を行うこととしている。
この場合、αを10ビットとすれば、参照インデックスの変更処理がなされることになり、A−(B+α)=30ビット分の符号量を削減できることになる。
Specifically, for example, if the number of target blocks referring to the reference images related to the I0 picture, the P1 picture, and the P2 picture are 120, 30, and 70, respectively, the code amount A and the code amount B are respectively Given by
A = 70 * 3 + 30 * 2 + 120 * 1 = 390 (bit)
B = 120 * 1 + 70 * 2 + 30 * 3 = 350 (bit)
Changing the reference index is more advantageous in reducing the amount of codes.
However, when the reference index change notification information is encoded by the entropy encoder 104, the code amount α is added to the code amount of the entire input frame image, so that (AB)> The reference index is changed under the condition of α.
In this case, if α is 10 bits, the reference index is changed, and the code amount for A− (B + α) = 30 bits can be reduced.

そして、エントロピー符号化器104では、前記のように変更後の参照インデックスに対して符号化ビットを割り当てて、動きベクトルやその他の付帯情報と共に符号化し、多重器105が階層構造のビットストリーム120を構成して出力させることになるが、多重器105では前記変更通知情報に基づいてその多重化画像データの上位階層(例えば、シーケンス層やピクチャ層やスライス層)に前記割り当て条件の変更情報を符号化して組み込んでおく(S19)。   Then, the entropy encoder 104 allocates encoded bits to the changed reference index as described above, encodes it together with motion vectors and other incidental information, and the multiplexer 105 generates the hierarchical bit stream 120. According to the change notification information, the multiplexer 105 encodes the assignment condition change information in the upper layer (for example, the sequence layer, the picture layer, and the slice layer) of the multiplexed image data based on the change notification information. (S19).

一方、ステップS16において(A−B)≦αであった場合には、動き付帯情報処理部118はセーブした動きベクトルや参照インデックス[i]をエントロピー符号化器104へそのまま出力し、エントロピー符号化器104では前記表1の参照インデックス[i](i=0,1,2)と符号化ビットの対応関係による既定の割り当て条件で符号化を行う(S16→S20,S21)。   On the other hand, if (A−B) ≦ α in step S16, the motion-accompanying information processing unit 118 outputs the saved motion vector and the reference index [i] to the entropy encoder 104 as they are, and performs entropy encoding. The unit 104 performs encoding under a predetermined allocation condition based on the correspondence relationship between the reference index [i] (i = 0, 1, 2) in Table 1 and encoded bits (S16 → S20, S21).

以上のように、入力フレーム画像をP3ピクチャへ符号化する場合について説明したが、P2ピクチャへ符号化する場合においてもI0ピクチャ又はP1ピクチャの再生画像を候補参照画像とするため、その場合にも動き付帯情報処理部118とエントロピー符号化器104において上記手順に準じた参照インデックスの変更処理を行うことにより符号量の低減化が図れる。   As described above, the case where the input frame image is encoded into the P3 picture has been described. However, even when the input frame image is encoded into the P2 picture, the reproduced image of the I0 picture or the P1 picture is used as a candidate reference image. The code amount can be reduced by performing the reference index changing process according to the above procedure in the motion-related information processing unit 118 and the entropy encoder 104.

また、上記の動き補償予測符号化装置においてエントロピー符号化器104を算術符号化器とした場合においては、各参照インデックスに対して次の表2に示すようなビン列を割り当てることができる。

Figure 2005151167
その場合、ビン列の長さは必ずしもビット数とは一致しないが、動き付帯情報処理部118は、上記の場合と同様に、符号量A=N(0)*Bin(0)+N(1)*Bin(1)+N(2)*Bin(2)として試算し、各参照インデックス[i]に係る個数N(i)の降順を求め、その順序がN(a)≧N(b)≧N(c)[但し、a,b,c∈0,1,2]であれば、符号量B=N(a)*Bin(0)+N(b)*Bin(1)+N(c)*Bin(2)を求め、以下同様の処理を行う。
更に、より正確な符号量を試算する場合には、前記のような演算ではなく、実際に算術符号化を行った結果に基づいて参照インデックスの並び替えを行うか否かを決定するような方法も採用できる。 When the entropy encoder 104 is an arithmetic encoder in the motion compensated predictive encoding apparatus, a bin sequence as shown in Table 2 below can be assigned to each reference index.
Figure 2005151167
In this case, the length of the bin string does not necessarily match the number of bits, but the motion-accompanying information processing unit 118 performs the code amount A = N (0) * Bin (0) + N (1) as in the above case. * Bin (1) + N (2) * Bin (2) is calculated and the descending order of the number N (i) related to each reference index [i] is obtained, and the order is N (a) ≧ N (b) ≧ N (c) [where a, b, c ∈ 0, 1, 2], the code amount B = N (a) * Bin (0) + N (b) * Bin (1) + N (c) * Bin (2) is obtained, and the same processing is performed thereafter.
Furthermore, when calculating a more accurate code amount, a method for determining whether or not to reorder the reference indexes based on the result of actual arithmetic coding, instead of the above-described calculation. Can also be adopted.

尚、この実施形態及び背景技術の欄では、図1や図3に示したように動き補償予測符号化装置を機能ブロックで表現しているが、その全体をDSP(Digital Signal Processor)等のマイクロコンピュータ回路で構成し、図2の手順をプログラムによって実行させることも可能である。
その場合のプログラムは、記録媒体による提供方式だけでなく、インターネット等の通信ネットワークを介してダウンロードさせる方式で提供されてもよい。
In the column of this embodiment and the background art, the motion compensated predictive coding apparatus is represented by functional blocks as shown in FIGS. 1 and 3, but the whole is represented by a micro signal processor such as a DSP (Digital Signal Processor). It is also possible to configure with a computer circuit and to execute the procedure of FIG. 2 by a program.
The program in that case may be provided not only by a recording medium but also by a method of downloading via a communication network such as the Internet.

本発明の実施形態に係る動き補償予測符号化装置の機能ブロック回路図である。It is a functional block circuit diagram of a motion compensation predictive coding apparatus according to an embodiment of the present invention. 動き付帯情報処理部と多重器の動作手順を示すフローチャートである。It is a flowchart which shows the operation | movement procedure of a motion attendant information processing part and a multiplexer. 従来技術に係る動き補償予測符号化装置の機能ブロック回路図である。It is a functional block circuit diagram of the motion compensation predictive coding apparatus according to the prior art. 動き補償予測符号化における各画像タイプの参照関係を示す図である。It is a figure which shows the reference relationship of each image type in motion compensation prediction encoding.

符号の説明Explanation of symbols

100…入力画像(入力フレーム画像)、101…減算器、101a,112a…スイッチ、102…直交変換器、103…量子化器、104…エントロピー符号化器、105…多重器、110…逆量子化器、111…逆直交変換器、112…加算器、113,115…画像メモリ、114…ループフィルタ、116…動き補償予測器、117…動き検出器、118…動き付帯情報処理部、120…符号出力(符号化ビットストリーム)。
DESCRIPTION OF SYMBOLS 100 ... Input image (input frame image), 101 ... Subtractor, 101a, 112a ... Switch, 102 ... Orthogonal transformer, 103 ... Quantizer, 104 ... Entropy encoder, 105 ... Multiplexer, 110 ... Inverse quantization 111: inverse orthogonal transformer, 112 ... adder, 113, 115 ... image memory, 114 ... loop filter, 116 ... motion compensation predictor, 117 ... motion detector, 118 ... motion-accompanying information processing unit, 120 ... sign Output (encoded bitstream).

Claims (2)

符号化対象画像を所定サイズのターゲットブロックに分割し、前記符号化対象画像より前に符号化処理された画像データを逆処理して複数の参照画像を再生し、それらの内から2以上の参照画像を参照して符号化画像を生成するモードでは、前記ターゲットブロック毎に前記参照画像中のブロックから最も近似したものを求めて動きベクトルを検出し、前記ターゲットブロック毎の動きベクトルと前記参照画像とを用いた動き補償予測によって画像間予測データを求めた後、その画像間予測データと前記符号化対象画像との差分である予測誤差を求め、前記各参照画像に対して前記符号化対象画像に時間的に近い方から昇順番号となる各参照インデックスを付与すると共に、前記各参照インデックスに対する符号を前記昇順番号に対応させて符号量が大きくなる条件で割り当てるようにして、前記予測誤差と前記各動きベクトルと前記各参照インデックスとを符号化した階層構造の多重化画像データを出力する動き補償予測符号化装置において、
前記符号化対象画像に係る各参照インデックスの数をカウントするカウント手段と、
前記カウント手段が求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量との乗算値の和を演算する第1演算手段と、
前記カウント手段が求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量とを昇順/降順の逆関係で対応付けた場合の乗算値の和を演算する第2演算手段と、
前記第1演算手段が求めた値から前記第2演算手段が求めた値を差し引いた差分が所定値より大きい場合には、前記各参照インデックスの番号を前記カウント手段が求めた各参照インデックスの数の降順に付与される昇順番号に変更し、前記差分が前記所定値以下である場合には、前記各参照インデックスは既定の付与番号のままとする参照インデックス制御手段と、
前記参照インデックス制御手段が前記各参照インデックスの番号を変更した場合に、その変更情報を前記多重化画像データの上位階層中に符号化する設定情報符号化手段と
を具備したことを特徴とする動き補償予測符号化装置。
The encoding target image is divided into target blocks of a predetermined size, the image data encoded before the encoding target image is inversely processed to reproduce a plurality of reference images, and two or more references from among them are reproduced. In a mode in which an encoded image is generated with reference to an image, a motion vector is detected by obtaining a closest approximation from the blocks in the reference image for each target block, and the motion vector and the reference image for each target block are detected. After obtaining inter-picture prediction data by motion compensated prediction using the above, a prediction error that is a difference between the inter-picture prediction data and the encoding target image is obtained, and the encoding target picture is obtained for each reference picture In addition to assigning each reference index that becomes an ascending order from the one closer to the time, a code for each reference index is associated with the ascending order number. As allocated under the condition that the amount of issue is large, in the prediction error and the motion compensated predictive coding apparatus which outputs the multiplexed image data of the hierarchical structure and the respective reference indices and each motion vector is coded,
Counting means for counting the number of each reference index relating to the encoding target image;
First computing means for computing a sum of multiplication values of the number of each reference index obtained by the counting means and the code amount of the code assigned to each reference index;
Second computing means for computing the sum of multiplication values when the number of each reference index obtained by the counting means and the code amount of the code assigned to each reference index are associated with each other in ascending / descending order. When,
When the difference obtained by subtracting the value obtained by the second computing means from the value obtained by the first computing means is larger than a predetermined value, the number of each reference index obtained by the counting means is determined as the number of each reference index. Change to the ascending order number given in descending order of the reference index control means, if the difference is less than or equal to the predetermined value, the reference index control means to leave each reference index as a default assignment number;
And a setting information encoding unit that encodes the change information in an upper layer of the multiplexed image data when the reference index control unit changes the number of each reference index. Compensated predictive coding apparatus.
符号化対象画像を所定サイズのターゲットブロックに分割し、前記符号化対象画像より前に符号化処理された画像データを逆処理して複数の参照画像を再生し、それらの内から2以上の参照画像を参照して符号化画像を生成するモードでは、前記ターゲットブロック毎に前記参照画像中のブロックから最も近似したものを求めて動きベクトルを検出し、前記ターゲットブロック毎の動きベクトルと前記参照画像とを用いた動き補償予測によって画像間予測データを求めた後、その画像間予測データと前記符号化対象画像との差分である予測誤差を求め、前記各参照画像に対して前記符号化対象画像に時間的に近い方から昇順番号となる各参照インデックスを付与すると共に、前記各参照インデックスに対する符号を前記昇順番号に対応させて符号量が大きくなる条件で割り当てるようにして、前記予測誤差と前記各動きベクトルと前記各参照インデックスとを符号化した階層構造の多重化画像データを出力する動き補償予測符号化装置としてコンピュータを機能させるためのプログラムであって、
前記符号化対象画像に係る各参照インデックスの数をカウントする第1手順と、
前記第1手順で求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量との乗算値の和を演算する第2手順と、
前記第1手順で求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量とを昇順/降順の逆関係で対応付けた乗算値の和を演算する第3手順と、
前記第2手順で求めた値から前記第3手順で求めた値を差し引いた差分が所定値より大きい場合には、前記各参照インデックスの番号を前記第1手順で求めた各参照インデックスの数の降順に付与される昇順番号に変更し、前記差分が前記所定値以下である場合には、前記各参照インデックスは既定の付与番号のままとする第4手順と、
前記第4手順で前記各参照インデックスの番号を変更した場合に、その変更情報を前記多重化画像データの上位階層中に符号化する第5手順と
をコンピュータに実行させることを特徴とする動き補償予測符号化プログラム。
The encoding target image is divided into target blocks of a predetermined size, the image data encoded before the encoding target image is inversely processed to reproduce a plurality of reference images, and two or more references from among them are reproduced. In a mode in which an encoded image is generated with reference to an image, a motion vector is detected by obtaining a closest approximation from the blocks in the reference image for each target block, and the motion vector and the reference image for each target block are detected. After obtaining inter-picture prediction data by motion compensated prediction using the above, a prediction error that is a difference between the inter-picture prediction data and the encoding target image is obtained, and the encoding target picture is obtained for each reference picture In addition to assigning each reference index that becomes an ascending order from the one closer to the time, a code for each reference index is associated with the ascending order number. The computer functions as a motion-compensated predictive coding apparatus that outputs multiplexed image data having a hierarchical structure in which the prediction error, each motion vector, and each reference index are encoded, so that the prediction error, the motion vector, and the reference index are encoded. A program for
A first procedure for counting the number of each reference index related to the encoding target image;
A second procedure for calculating a sum of multiplication values of the number of each reference index obtained in the first procedure and the code amount of the code assigned to each reference index;
A third procedure for calculating a sum of multiplication values in which the number of each reference index obtained in the first procedure and the code amount of the code assigned to each reference index are associated in an ascending / descending order inverse relationship;
When the difference obtained by subtracting the value obtained in the third procedure from the value obtained in the second procedure is larger than a predetermined value, the number of each reference index is the number of each reference index obtained in the first procedure. Changing to ascending order numbers assigned in descending order, and if the difference is less than or equal to the predetermined value, the fourth procedure leaving each reference index as a default assignment number;
When the number of each reference index is changed in the fourth procedure, the computer executes a fifth procedure for encoding the change information in an upper layer of the multiplexed image data. Predictive coding program.
JP2003385713A 2003-11-14 2003-11-14 Encoding apparatus and encoding program for predicting movement compensation Pending JP2005151167A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003385713A JP2005151167A (en) 2003-11-14 2003-11-14 Encoding apparatus and encoding program for predicting movement compensation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003385713A JP2005151167A (en) 2003-11-14 2003-11-14 Encoding apparatus and encoding program for predicting movement compensation

Publications (1)

Publication Number Publication Date
JP2005151167A true JP2005151167A (en) 2005-06-09

Family

ID=34693681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003385713A Pending JP2005151167A (en) 2003-11-14 2003-11-14 Encoding apparatus and encoding program for predicting movement compensation

Country Status (1)

Country Link
JP (1) JP2005151167A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008148315A (en) * 2006-12-08 2008-06-26 Matsushita Electric Ind Co Ltd Method and apparatus for reconstructing image
WO2012096176A1 (en) * 2011-01-12 2012-07-19 Panasonic Corporation Methods and apparatuses for encoding and decoding video using multiple reference pictures
US8818121B2 (en) 2012-02-21 2014-08-26 Kabushiki Kaisha Toshiba Motion detector, image processing device, and image processing system
JPWO2013136365A1 (en) * 2012-03-14 2015-07-30 株式会社東芝 Multi-view image encoding apparatus and method, and multi-view image decoding apparatus and method
US10841573B2 (en) 2011-02-08 2020-11-17 Sun Patent Trust Methods and apparatuses for encoding and decoding video using multiple reference pictures

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008148315A (en) * 2006-12-08 2008-06-26 Matsushita Electric Ind Co Ltd Method and apparatus for reconstructing image
WO2012096176A1 (en) * 2011-01-12 2012-07-19 Panasonic Corporation Methods and apparatuses for encoding and decoding video using multiple reference pictures
JP2014508428A (en) * 2011-01-12 2014-04-03 パナソニック株式会社 Moving picture encoding method, moving picture decoding method, moving picture encoding apparatus, and moving picture decoding apparatus using a plurality of reference pictures
JP2017204884A (en) * 2011-01-12 2017-11-16 サン パテント トラスト Decoding device
US10027957B2 (en) 2011-01-12 2018-07-17 Sun Patent Trust Methods and apparatuses for encoding and decoding video using multiple reference pictures
US10841573B2 (en) 2011-02-08 2020-11-17 Sun Patent Trust Methods and apparatuses for encoding and decoding video using multiple reference pictures
US8818121B2 (en) 2012-02-21 2014-08-26 Kabushiki Kaisha Toshiba Motion detector, image processing device, and image processing system
JPWO2013136365A1 (en) * 2012-03-14 2015-07-30 株式会社東芝 Multi-view image encoding apparatus and method, and multi-view image decoding apparatus and method

Similar Documents

Publication Publication Date Title
CN101406056B (en) Method of reducing computations in intra-prediction and mode decision processes in a digital video encoder
KR100763179B1 (en) Method for compressing/Reconstructing motion vector of unsynchronized picture and apparatus thereof
JP4724351B2 (en) Image encoding apparatus, image encoding method, image decoding apparatus, image decoding method, and communication apparatus
KR100681370B1 (en) Predicting motion vectors for fields of forward-predicted interlaced video frames
JP3072035B2 (en) Two-stage video film compression method and system
KR100853931B1 (en) Video coding apparatus and recording medium
KR20040047977A (en) Spatial scalable compression
JPWO2002080567A1 (en) Image signal quantization apparatus and method
JPH07143494A (en) Coding method for moving image
JP2006511164A (en) Elastic memory
JP2005151167A (en) Encoding apparatus and encoding program for predicting movement compensation
JP2007221201A (en) Moving image coding apparatus and program
JP4859265B2 (en) Method and apparatus for encoding by luminance evaluation
JP2002262293A (en) Moving image decoder and moving image decoding method
JP3963296B2 (en) Video transmission rate conversion device
JP4169767B2 (en) Encoding method
JP4243286B2 (en) Encoding method
KR100744435B1 (en) An improved early detection of all-zero dct coefficients for fast video encoding
JP4361665B2 (en) Transcoding method and transcoding apparatus for moving image encoded data
KR100240620B1 (en) Method and apparatus to form symmetric search windows for bidirectional half pel motion estimation
JP2010166275A (en) Image encoding device
KR20060034294A (en) Encoding method and device
JP2007020216A (en) Encoding apparatus, encoding method, filtering apparatus and filtering method
JPH11155147A (en) Image reproduction method, image coder, and image coding method
JP3985567B2 (en) Encoding device and encoding method