JP2005151167A - Encoding apparatus and encoding program for predicting movement compensation - Google Patents
Encoding apparatus and encoding program for predicting movement compensation Download PDFInfo
- Publication number
- JP2005151167A JP2005151167A JP2003385713A JP2003385713A JP2005151167A JP 2005151167 A JP2005151167 A JP 2005151167A JP 2003385713 A JP2003385713 A JP 2003385713A JP 2003385713 A JP2003385713 A JP 2003385713A JP 2005151167 A JP2005151167 A JP 2005151167A
- Authority
- JP
- Japan
- Prior art keywords
- reference index
- image
- encoding
- picture
- procedure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は動画像情報を高能率符号化する動き補償予測符号化に関連した技術であって、特に、動き補償予測のために複数の参照画像を用いる場合に、各参照画像を示す参照インデックスに係る符号量を抑制するための改良に関する。 The present invention is a technique related to motion compensated predictive coding that performs high-efficiency coding of moving picture information, and in particular, when a plurality of reference pictures are used for motion compensated prediction, a reference index indicating each reference picture is used. The present invention relates to an improvement for suppressing the code amount.
動画像の符号化技術の国際標準方式であるMPEG(Moving Picture Experts Group)やH.263等では、フレーム間予測符号化を基本として、動き補償予測とDCT(Discrete Cosine Transform)を組み合わせたハイブリッド符号化方式が主流をなしており、マルチメディア情報通信の分野等で広範に実施されている。 In MPEG (Moving Picture Experts Group), H.263, etc., which are international standards for moving picture coding technology, a hybrid code combining motion compensation prediction and DCT (Discrete Cosine Transform) based on inter-frame prediction coding. The mainstreaming method is widely used in the field of multimedia information communication.
フレーム間予測符号化では、メモリに記憶させた前フレームの画像信号が現フレームの画像信号に対する予測信号として用いられ、両フレーム間の差分に相当する予測誤差信号が符号化される。
それに対して、動き補償予測では、前フレームと現フレームから画像のブロック毎の動きベクトルを求め、その動きベクトルを用いて前フレームを補正して現フレームに対する予測画像を生成し、その予測画像と現フレームの画像との差分をとって予測誤差を求め、前記の動きベクトルと予測誤差信号を符号化する。
即ち、動き補償予測によれば、画像の動領域の予測精度を向上させて発生する情報量の削減を図れると共に画像品質の向上を実現でき、高能率符号化方式において必須技術である。
In inter-frame predictive encoding, the image signal of the previous frame stored in the memory is used as a predictive signal for the image signal of the current frame, and a prediction error signal corresponding to the difference between both frames is encoded.
On the other hand, in motion compensation prediction, a motion vector for each block of an image is obtained from the previous frame and the current frame, the previous frame is corrected using the motion vector, and a predicted image for the current frame is generated. A prediction error is obtained by taking a difference from the image of the current frame, and the motion vector and the prediction error signal are encoded.
That is, according to motion compensation prediction, it is possible to reduce the amount of information generated by improving the prediction accuracy of a moving region of an image and improve image quality, which is an essential technique in a high-efficiency encoding method.
そして、動き補償予測においては、例えば、下記特許文献1に示されるように使用する参照画像を複数の中から選択して符号化する方法があるが、その場合には、動き補償されるブロック毎に動きベクトルとその動きベクトルが参照している参照画像を示す参照インデックスを符号化する必要がある。
In motion-compensated prediction, for example, there is a method of selecting and encoding a reference image to be used from among a plurality of reference images as shown in
以下、前記のように複数の参照画像を用いて動き補償予測を行う方式の符号化装置について説明しておく。
その符号化装置は、図3の機能ブロック図に示す構成を備えており、時系列で入力されるフレーム画像を、フレーム内符号化画像(I0ピクチャ)、I0ピクチャから前方向予測符号化された画像(P1ピクチャ)、I0ピクチャ又はP1ピクチャを選択して前方向予測符号化された画像(P2ピクチャ)、前記の各ピクチャ(I0,P1,P2)のいずれかを選択して前方向予測符号化された画像(P3ピクチャ)として順次符号化し、符号化過程で得られる付帯情報等とともに多重化したビットストリームとして伝送路へ出力するものである。
尚、前方向予測符号化における各画像タイプの参照関係は図4のようになる。
Hereinafter, an encoding apparatus that performs motion compensation prediction using a plurality of reference images as described above will be described.
The coding apparatus has the configuration shown in the functional block diagram of FIG. 3, and a frame image input in time series is subjected to forward predictive coding from an intra-frame coded image (I0 picture) and I0 picture. Select a picture (P1 picture), an I0 picture or a P1 picture, and a picture (P2 picture) that has been forward-predicted and coded, and select any one of the pictures (I0, P1, P2). Are sequentially encoded as a converted image (P3 picture), and output to the transmission path as a bit stream multiplexed with accompanying information and the like obtained in the encoding process.
Note that the reference relationship of each image type in forward prediction encoding is as shown in FIG.
先ず、入力フレーム画像100をI0ピクチャに符号化するフレーム内符号化モードでは、スイッチ101aがx側に接続されており、スイッチ112aは非接続状態になっている。
このモードでは、入力フレーム画像100に対して直交変換器102で8×8画素ブロック単位での直交変換処理が施され、その処理で得られた係数を量子化器103に与え、量子化器103では所定の量子化ステップ数で前記係数データを量子化し、固定長の符号となった係数をエントロピー符号化器104と逆量子化器110へ出力する。
First, in the intra-frame coding mode in which the
In this mode, the orthogonal transform process is performed on the
エントロピー符号化器104では2次元の8×8個の係数を1次元に変換してその係数を予め定められている方法によって符号化する。
そして、多重器105では、エントロピー符号化した符号列と共に、量子化器103から得られる付帯情報をヘッダ情報として多重化し、符号化ビットストリーム120として伝送路へ出力する。
尚、I0ピクチャはフレーム内符号化処理によるものであるため、動き検出器117と動き補償予測器116は動作せず、動きベクトル等の付帯情報は存在しない。
The
The
Since the I0 picture is obtained by intraframe coding processing, the
一方、逆量子化器110へ出力された量子化後のデータは、逆量子化器110と逆直交変換器111によって前記の直交変換器102と量子化器103の逆処理が施されて元の入力フレーム画像100が再生され、その再生画像が画像メモリ113にセーブされた後、ループフィルタ114でブロックノイズを低減化させて画像メモリ115にセーブされる。
On the other hand, the quantized data output to the inverse quantizer 110 is subjected to the inverse processing of the
次に、入力フレーム画像100を前方向予測符号化画像(P1ピクチャ,P2ピクチャ,P3ピクチャ)に符号化するモードでは、スイッチ101aがy側に接続され、スイッチ112aは接続状態となる。
この符号化モードでは、入力フレーム画像(現フレーム画像)100は動き検出器117と減算器101へ入力されている。
動き検出器117は、入力フレーム画像100を分割して得られる各ターゲットブロック(16×16画素又は8×8画素)について、画像メモリ115にセーブされている参照画像との相関を探査して動きベクトルを求めると共に、その動きベクトルを求めた参照画像に係る参照インデックスを付与し、動き補償予測器116がそれらと前記参照画像信号とから画像間予測信号を生成して減算器101へ出力する。
但し、動き検出器117と動き補償予測器116の詳細な機能は後述することとし、ここでは減算器101より後段の処理について先に説明する。
Next, in a mode in which the
In this encoding mode, the input frame image (current frame image) 100 is input to the
The
However, detailed functions of the
減算器101では、入力フレーム画像100の前記ターゲットブロックの画像信号と動き補償予測器116から得られている画像間予測信号との差分が求められ、予測誤差信号としてスイッチ101aを介して直交変換器102へ出力される。
そして、直交変換器102と量子化器103による処理は、その直交変換の対象が予測誤差信号であり前方向予測符号化された画像データが得られるだけであって、基本的には前記フレーム内符号化モードと同様である。
ただ、エントロピー符号化器104と多重器105で前記符号化画像データと付帯情報を符号化・多重化して符号化ビットストリーム120を構成する際には、量子化器103から得られる付帯情報と共に、動き検出器117が求めた動きベクトルと参照インデックス等の付帯情報も符号化されてヘッダ情報として多重化される。
In the
The processing performed by the
However, when the encoded
一方、量子化器103から逆量子化器110側へ入力された量子化後の係数データについては、逆量子化器110と逆直交変換器111によって前記の直交変換器102と量子化器103の逆処理が施されるため、減算器101の出力である予測誤差信号が復元される。
そして、スイッチ112aが接続状態であるため、復元された予測誤差信号には加算器112によって動き補償予測器116の予測信号が加算されて元のターゲットブロックの画像が再生され、その再生画像が画像メモリ113にセーブされることになる。
On the other hand, the quantized coefficient data input from the
Since the switch 112a is in the connected state, the prediction signal of the
そして、前記手順は1フレーム中の各ターゲットブロックについて順次実行され、1フレーム分の全ターゲットブロックについて再生画像が得られた段階で、画像メモリ113の画像データを読み出し、ループフィルタ114でブロックノイズを低減化させて画像メモリ115にセーブする。
The procedure is sequentially executed for each target block in one frame, and when reproduced images are obtained for all target blocks for one frame, the image data in the
ところで、画像メモリ115は最大で3フレーム分の再生画像をFIFO(First-in First-out)方式で記憶するメモリであり、1回のフレーム内符号化モードと3回の前方向予測符号化モードとを交互に設定することにより、I0ピクチャへの符号化に際しては直前の3フレーム分に係るP1ピクチャとP2ピクチャとP3ピクチャの再生画像が、P1ピクチャへの符号化に際しては直前の3フレーム分に係るP2ピクチャとP3ピクチャとI0ピクチャの再生画像が、P2ピクチャの符号化に際しては直前の3フレーム分に係るP3ピクチャとI0ピクチャとP1ピクチャの再生画像が、P3ピクチャの符号化に際しては直前の3フレーム分に係るI0ピクチャとP1ピクチャとP2ピクチャの再生画像がセーブされることになる。
Incidentally, the
ここで、上記で簡単に触れた動き検出器117と動き補償予測器116の機能について詳細に説明する。
動き検出器117と動き補償予測器116が動作するのは前方向予測符号化モードの場合だけであり、図4に示したように、P1ピクチャへの符号化時にはI0ピクチャの再生画像のみを、P2ピクチャへの符号化時にはI0ピクチャ又はP1ピクチャの再生画像を、P3ピクチャへの符号化時にはI0ピクチャ、P1ピクチャ又はP2ピクチャの再生画像のいずれかを、ぞれぞれの参照画像とする。
そして、動き検出器117では、前方向予測符号化モードにおける前記符号化画像タイプによって画像メモリ115にセーブされている3フレーム分の再生画像(候補参照画像)の内から前記条件で参照画像を選択する。
Here, the functions of the
The
Then, the
例えば、P3ピクチャへの符号化時には、3つの候補参照画像(I0ピクチャ、P1ピクチャ又はP2ピクチャの再生画像)を入力フレーム画像100側のターゲットブロックと同一サイズ(16×16画素又は8×8画素)の参照ブロックに分割し、入力フレーム画像100のターゲットブロック毎に、各候補参照画像内の各参照ブロックを1/2画素ずつ一定範囲内で(例えば、16×16画素の場合であれば±15画素分)移動させて前記ターゲットブロックとのブロックマッチングをとり、絶対誤差和(又は二乗誤差和)が最も小さくなる参照ブロックの移動を動きベクトルとして求めると共に、その参照ブロックを含む参照画像に予め対応付けられている参照インデックスを付与する。
即ち、動き検出器117は、入力フレーム画像100の各ターゲットブロックについて前記条件に基づく動きベクトルを求め、その動きベクトルを求めるために用いた参照画像の参照インデックスを与える。
その場合、参照インデックスはP3ピクチャに対して時間的に近い順から順に対応付けられており、図4に示すように、P2,P1,I0の各ピクチャに係る参照画像に対して、それぞれ「0」,「1」,「2」の参照インデックスが対応付けられる。
また、次の表1に示すように、各参照インデックスにはそれぞれ“0”,“10”,“110”の符号ビットが割り当てられる。
That is, the
In that case, the reference index is associated with the P3 picture in order from the closest to the time, and as shown in FIG. 4, “0” is assigned to the reference images related to the pictures P2, P1, and I0. , “1” and “2” are associated with each other.
Further, as shown in the following Table 1, code bits “0”, “10”, and “110” are assigned to each reference index, respectively.
尚、前記ではP3ピクチャへの符号化時について説明したが、動きベクトルの求め方はP1ピクチャやP2ピクチャへの符号化時においても同様である。
但し、P1ピクチャへの符号化時における参照画像はI0ピクチャの再生画像だけであるために参照インデックスはその参照画像に対する「0」だけであり、P2ピクチャへの符号化時における参照画像はI0ピクチャとP1ピクチャの再生画像となるため、それぞれに「1」,「0」の参照インデックスが対応付けられる。
In the above description, the encoding to the P3 picture has been described. However, the method for obtaining the motion vector is the same when encoding to the P1 picture or the P2 picture.
However, since the reference picture at the time of encoding to the P1 picture is only the reproduced picture of the I0 picture, the reference index is only “0” for the reference picture, and the reference picture at the time of encoding to the P2 picture is the I0 picture. And P1 picture reproduction images, the reference indexes “1” and “0” are associated with each other.
次に、動き補償予測器116は、動き検出器117から与えられる動きベクトルと参照インデックスに基づいて、画像メモリ115にセーブされている各候補参照画像の前記サイズの画素ブロックを移動させることにより画像間予測信号を得る。
そして、減算器101においてその画像間予測信号と入力画像信号との差分(予測誤差)が演算されて直交変換器102へ出力されることは、上記のとおりである。
また、前記のように動き検出器117が求めた動きベクトルや参照インデックスの付帯情報がエントロピー符号化器104と多重器105へ転送され、所定の規則に基づいた符号化(参照インデックスは表1の規則による符号化)と多重化が行われて符号化ビットストリーム120として出力されることも上記と同様であるが、エントロピー符号化器104での参照インデックスに対する符号ビットの割り当てに際しては、前記の表1に示すように、各参照インデックス「0」,「1」,「2」にそれぞれ“0”,“10”,“110”が割り当てられる。
Next, the
Then, as described above, the
Also, the motion vector obtained by the
ところで、従来の動き補償予測符号化装置では、動き検出器117において、参照インデックスの値が入力画像に対して時間的に近い参照画像から昇順となるように対応付けられており、エントロピー符号化器104においては参照インデックスの値が小さいほどその符号化ビットのビット数が小さくなるように割り当てられている。
これは、動画像では一般に時間的に近い画像ほど相関性が高く、動き補償予測においても、符号化対象画像に対して時間的に最も近い参照画像が選択されることが多いからであり、前記のような割り当て条件に基づく符号化によって参照インデックスの符号化量を低減化できるからである。
By the way, in the conventional motion compensated predictive coding apparatus, the
This is because, in moving images, images that are closer in time generally have higher correlation, and in motion compensated prediction, a reference image that is closest in time to an encoding target image is often selected. This is because the encoding amount of the reference index can be reduced by encoding based on the allocation condition as described above.
しかしながら、例えば、画面全体が周期的にフラッシュしている動画像や、手振れなどによる細かな動きがあるような動画像においては、符号化対象画像の直前の参照画像ではなく、他の参照画像と高い相関性を持つ場合がある。
そして、そのような場合に参照画像に対する参照インデックスの対応付けを一律に適用していると、参照インデックスの符号量が予想外に大きくなるという欠点がある。
However, for example, in a moving image in which the entire screen is periodically flashed or a moving image in which there is a fine movement due to camera shake or the like, it is not a reference image immediately before the encoding target image but another reference image. May have high correlation.
In such a case, if the correspondence of the reference index to the reference image is uniformly applied, there is a disadvantage that the code amount of the reference index becomes unexpectedly large.
そこで、本発明は、参照画像に対する参照インデックスの対応付け関係を適応的に変更して符号化ビットの割り当て条件を変化させることにより、参照インデックスに係る符号量を減少させる動き補償予測符号化装置を提供することを目的として創作された。 Therefore, the present invention provides a motion compensated predictive coding apparatus that reduces the code amount related to the reference index by adaptively changing the association relationship of the reference index with the reference image to change the coding bit allocation condition. It was created for the purpose of providing.
本発明は、符号化対象画像を所定サイズのターゲットブロックに分割し、前記符号化対象画像より前に符号化処理された画像データを逆処理して複数の参照画像を再生し、それらの内から2以上の参照画像を参照して符号化画像を生成するモードでは、前記ターゲットブロック毎に前記参照画像中のブロックから最も近似したものを求めて動きベクトルを検出し、前記ターゲットブロック毎の動きベクトルと前記参照画像とを用いた動き補償予測によって画像間予測データを求めた後、その画像間予測データと前記符号化対象画像との差分である予測誤差を求め、前記各参照画像に対して前記符号化対象画像に時間的に近い方から昇順番号となる各参照インデックスを付与すると共に、前記各参照インデックスに対する符号を前記昇順番号に対応させて符号量が大きくなる条件で割り当てるようにして、前記予測誤差と前記各動きベクトルと前記各参照インデックスとを符号化した階層構造の多重化画像データを出力する動き補償予測符号化装置において、前記符号化対象画像に係る各参照インデックスの数をカウントするカウント手段と、前記カウント手段が求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量との乗算値の和を演算する第1演算手段と、前記カウント手段が求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量とを昇順/降順の逆関係で対応付けた場合の乗算値の和を演算する第2演算手段と、前記第1演算手段が求めた値から前記第2演算手段が求めた値を差し引いた差分が所定値より大きい場合には、前記各参照インデックスの番号を前記カウント手段が求めた各参照インデックスの数の降順に付与される昇順番号に変更し、前記差分が前記所定値以下である場合には、前記各参照インデックスは既定の付与番号のままとする参照インデックス制御手段と、前記参照インデックス制御手段が前記各参照インデックスの番号を変更した場合に、その変更情報を前記多重化画像データの上位階層中に符号化する設定情報符号化手段とを具備したことを特徴とする動き補償予測符号化装置に係る。 The present invention divides an encoding target image into target blocks of a predetermined size, reversely processes image data encoded before the encoding target image, and reproduces a plurality of reference images. In a mode in which an encoded image is generated with reference to two or more reference images, a motion vector is detected by obtaining a closest approximation from the blocks in the reference image for each target block, and a motion vector for each target block is detected. And inter-image prediction data by motion compensated prediction using the reference image, and then obtaining a prediction error that is a difference between the inter-image prediction data and the encoding target image, and for each reference image Each reference index that is an ascending order from the temporally closer to the encoding target image is assigned, and a code for each reference index is assigned to the ascending order And a motion compensated predictive coding apparatus for outputting multiplexed image data having a hierarchical structure in which the prediction error, each motion vector, and each reference index are encoded, so as to be allocated under a condition that the code amount increases accordingly. A counting means for counting the number of each reference index relating to the encoding target image; and a multiplication value of the number of each reference index obtained by the counting means and the code amount of the code assigned to each reference index. Multiplication when first calculation means for calculating the sum, the number of each reference index obtained by the counting means and the code amount of the code assigned to each reference index are associated in an ascending / descending order inverse relationship A second calculation means for calculating a sum of values, and a difference obtained by subtracting the value obtained by the second calculation means from the value obtained by the first calculation means. If greater than the value, the number of each reference index is changed to an ascending order number given in descending order of the number of each reference index obtained by the counting means, and if the difference is less than or equal to the predetermined value, Reference index control means for maintaining each reference index as a predetermined assigned number, and when the reference index control means changes the number of each reference index, the change information is stored in the upper hierarchy of the multiplexed image data. The present invention relates to a motion-compensated predictive coding apparatus characterized by comprising setting information coding means for performing coding.
本発明の動き補償予測符号化装置では、カウント手段によって符号化対象画像に係る各参照インデックスの数を求めておき、第1演算手段が既定条件による各参照画像の参照インデックスと各参照インデックスに割り当てられた符号量との関係に基づいて全ての参照インデックスに係る符号量を試算し、第2演算手段がカウント手段で求められた各参照インデックスの数と各参照インデックスの符号量とを昇順/降順の逆関係で対応付けた場合における全ての参照インデックスに係る符号量を試算する。
そして、参照インデックス制御手段は、第2演算手段が求めた符号量の方が第1演算手段が求めた符号量よりも小さく、その差が所定値より大きい場合には、各参照インデックスの番号をカウント手段が求めた各参照インデックスの数の降順に付与される昇順番号に変更することにより、参照インデックスに係る符号量が第2演算手段の求めた符号量になるようにし、逆の場合には、各参照インデックスの番号を変更することなく、第1演算手段が求めた符号量になるようにする。
即ち、ターゲットブロックに係る動きベクトルの検出に際して、より多く参照された参照画像の参照インデックスにより小さい符号量の符号を割り当てられるようにして、全ての参照インデックスについて合計した符号化量の低減化を図っている。
また、そのような割り当て設定を行ったことは、設定情報符号化手段が多重化画像データの上位階層中に変更情報を符号化しておくことで判別できるようにしている。
尚、前記「所定値」は、設定情報符号化手段が変更情報を符号化した際の符号量以上の値として設定すれば合理的であり、また各種条件でその値が変動するような場合にはその符号量の最大値や平均値を採用してもよい。
In the motion compensated predictive coding apparatus of the present invention, the number of each reference index related to the encoding target image is obtained by the counting means, and the first calculation means assigns the reference index of each reference picture and each reference index according to a predetermined condition. Based on the relationship with the obtained code amount, the code amount related to all the reference indexes is estimated, and the number of each reference index obtained by the second calculating means and the code amount of each reference index are calculated in ascending / descending order. The amount of codes related to all reference indexes in the case of association with the inverse relationship is calculated.
The reference index control means determines the reference index number when the code amount obtained by the second computing means is smaller than the code quantity obtained by the first computing means and the difference is larger than a predetermined value. By changing to the ascending order number given in descending order of the number of each reference index obtained by the counting means, the code amount related to the reference index becomes the code quantity obtained by the second computing means, and vice versa The code amount obtained by the first calculation means is set without changing the number of each reference index.
In other words, when detecting a motion vector related to a target block, a code having a smaller code amount is assigned to a reference index of a reference image that has been referred to more frequently, thereby reducing the total coding amount for all reference indexes. ing.
Further, such setting of assignment can be determined by encoding the change information in the upper layer of the multiplexed image data by the setting information encoding means.
The “predetermined value” is reasonable if it is set as a value that is greater than or equal to the amount of code when the setting information encoding means encodes the change information, and when the value fluctuates under various conditions. May adopt the maximum value or the average value of the code amount.
前記発明における各手段の処理はコンピュータによって実行させることができ、その場合のプログラムは、前記符号化対象画像に係る各参照インデックスの数をカウントする第1手順と、前記第1手順で求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量との乗算値の和を演算する第2手順と、前記第1手順で求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量とを昇順/降順の逆関係で対応付けた乗算値の和を演算する第3手順と、前記第2手順で求めた値から前記第3手順で求めた値を差し引いた差分が所定値より大きい場合には、前記各参照インデックスの番号を前記第1手順で求めた各参照インデックスの数の降順に付与される昇順番号に変更し、前記差分が前記所定値以下である場合には、前記各参照インデックスは既定の付与番号のままとする第4手順と、前記第4手順で前記各参照インデックスの番号を変更した場合に、その変更情報を前記多重化画像データの上位階層中に符号化する第5手順とを実行させるものとなる。 The processing of each means in the invention can be executed by a computer, and the program in that case includes a first procedure for counting the number of each reference index related to the encoding target image, and each of the steps obtained in the first procedure. A second procedure for calculating a sum of multiplication values of the number of reference indexes and the code amount of the code assigned to each reference index; the number of each reference index obtained in the first procedure and the assignment to each reference index A third procedure for calculating the sum of multiplication values in which the code amount of the code is associated in an ascending / descending order inverse relationship, and the value obtained in the third procedure from the value obtained in the second procedure. If the subtracted difference is larger than a predetermined value, the number of each reference index is changed to an ascending order number given in descending order of the number of each reference index obtained in the first procedure, If the difference is less than or equal to the predetermined value, the reference number remains the default assigned number, and the change is made when the number of each reference index is changed in the fourth step. A fifth procedure for encoding information into the upper layer of the multiplexed image data is executed.
本発明は、複数の候補参照画像を用いる動き補償予測符号化装置において、各参照画像を示す参照インデックスに係る符号量を既定条件の場合と参照頻度の高い参照インデックスに小さい符号化ビット数を与える条件の場合とで試算し、適応的に参照インデックスを変更することにより各参照インデックスに対する符号ビットの割り当て条件を変化させて、参照インデックスに係る符号量を低減化させる。 The present invention provides a motion-compensated predictive coding apparatus that uses a plurality of candidate reference images, and assigns a small number of coding bits to a reference index having a high reference frequency and a code amount related to a reference index indicating each reference image. Trial calculation is performed according to the conditions, and by changing the reference index adaptively, the code bit allocation condition for each reference index is changed to reduce the code amount related to the reference index.
以下、本発明の動き補償予測符号化装置の実施形態を図1及び図2に基づいて詳細に説明する。
図1はこの実施形態に係る符号化装置の機能ブロック回路図であり、同図と図3とを比較すれば明らかなように、動き検出器117から多重器105へ付帯情報を転送する回路中に動き付帯情報処理部118が付加されている点が異なるだけである。
そして、前記のように、入力フレーム画像(符号化対象画像)をP2ピクチャ又はP3ピクチャへ符号化する場合には、動き検出器117が各ターゲットブロック(16×16画素又は8×8画素)について動きベクトルを求めた際に、いずれの参照画像を選択したかを参照インデックスで示すようにしているが、この符号化装置の特徴は、動き付帯情報処理部118とエントロピー符号化器104によって、各参照画像の選択状態を確認して参照インデックスを変更し、各参照インデックスに対する符号化ビットの割り当て条件を変化させる点にあり、他のデータ処理動作については背景技術の欄で説明した符号化装置と同様である。
従って、ここでは主に前記特徴的機能に関連した動作ついて説明することとし、他のデータ処理動作の説明は省略する。
Hereinafter, an embodiment of a motion compensated prediction encoding apparatus according to the present invention will be described in detail with reference to FIGS. 1 and 2.
FIG. 1 is a functional block circuit diagram of the encoding apparatus according to this embodiment. As is apparent from a comparison between FIG. 3 and FIG. 3, in the circuit for transferring incidental information from the
As described above, when the input frame image (encoding target image) is encoded into the P2 picture or the P3 picture, the
Therefore, the operation related to the characteristic function will be mainly described here, and description of other data processing operations will be omitted.
図2のフローチャートは、動き付帯情報処理部118とエントロピー符号化器104が前記機能を実行する動作手順を示す。
但し、このフローチャートは入力フレーム画像をP3ピクチャへ符号化する場合に関するものであり、背景技術の欄で説明したように、画像メモリ115にはI0ピクチャとP1ピクチャとP2ピクチャの再生画像が3つの候補参照画像としてセーブされている。
The flowchart of FIG. 2 shows an operation procedure in which the motion-accompanying
However, this flowchart relates to a case where an input frame image is encoded into a P3 picture. As described in the background art section, the
先ず、動き検出器117は、入力フレーム画像のターゲットブロック毎に、動きベクトルと、その動きベクトルを求めた参照画像に係る前記表1に基づいた参照インデックスを求めるが、動き付帯情報処理部118は全てのターゲットブロックに係るそれらのデータを内蔵メモリに一旦セーブする(S11)。
そして、動き付帯情報処理部118では各参照インデックス[i](i=0,1,2)の個数N(i)をカウントする(S12)。
First, the
Then, the motion-accompanying
そして、入力フレーム画像をP3ピクチャへ符号化する場合の各参照インデックス[i]に対する符号化ビット数B(i)の割り当て条件は前記表1に示す対応関係で与えられており、動き付帯情報処理部118は各参照インデックス[i]の個数N(i)と前記符号化ビット数B(i)とを用いて、既定の条件で全ての参照インデックスを符号化した場合の符号量A=N(0)*B(0)+N(1)*B(1)+N(2)*B(2)を試算する(S13)。
The condition for assigning the number of encoded bits B (i) to each reference index [i] when the input frame image is encoded into a P3 picture is given by the correspondence shown in Table 1 above. The
また、動き付帯情報処理部118は各参照インデックス[i]の個数N(i)の降順を求め、その順がN(a)≧N(b)≧N(c)[但し、a,b,c∈0,1,2]であったとすると、符号量B=N(a)*B(0)+N(b)*B(1)+N(c)*B(2)を求める(S14,S15)。
即ち、各参照インデックスの符号化ビット数B(i)と各参照インデックスの数N(i)とを昇順と降順の関係で対応付けた場合の乗算値の和を演算し、その対応付け関係に基づいた符号量Bを試算する。
The motion-accompanying
That is, the sum of the multiplication values when the number of encoded bits B (i) of each reference index and the number N (i) of each reference index are associated with each other in ascending order and descending order is calculated. Based on the code amount B, a trial calculation is performed.
次に、動き付帯情報処理部118では、符号量Aから符号量Bを差し引いた値を求め、その値が所定値αより大きいか否かを判断する(S16)。
ここで、αは後記するエントロピー符号化器104での参照インデックスの変更情報を符号化する場合の符号量に相当する。
Next, the motion-accompanying
Here, α corresponds to a code amount in the case of encoding reference index change information in the
そして、(A−B)>αの比較結果が得られた場合には、参照インデックス[i]の変更を行い、0をaに、1をbに、2をcに変更した後、各ターゲットブロックに係る動きベクトルと前記変更後の各参照インデックス[i](i=a,b,c)、及び参照インデックスの変更通知情報をエントロピー符号化器104へ出力する(S16→S17,18)。
即ち、動き付帯情報処理部118では、参照インデックス[i](i=0,1,2)をそれらの個数N(i)の降順に対応するように変更してエントロピー符号化器104へ出力する。
If a comparison result of (A−B)> α is obtained, the reference index [i] is changed, and after changing 0 to a, 1 to b, and 2 to c, each target The motion vector related to the block, each changed reference index [i] (i = a, b, c), and reference index change notification information are output to the entropy encoder 104 (S16 → S17, 18).
That is, the motion-accompanying
ところで、エントロピー符号化器104では参照インデックス[i]に対する符号ビットの割り当てを前記表1の関係で行うようにしているため、変更後の参照インデックス[i](i=a,b,c)による割り当てがなされると、3種の参照インデックスのカウント数の降順に符号化ビット“0”,“10”,“110”を割り当てて、全てのターゲットブロックに係る参照インデックスを符号化することになる。
換言すれば、参照頻度の高い参照画像(カウント数が多い参インデックス[i])に対して少ない符号化ビット数が割り当てられて、それだけ参照インデックス全体の符号量を低減化できることになる。
Incidentally, since the
In other words, a small number of encoded bits is assigned to a reference image with a high reference frequency (reference index [i] with a large number of counts), and the code amount of the entire reference index can be reduced accordingly.
具体的には、例えば、I0ピクチャ,P1ピクチャ,P2ピクチャに係る参照画像を参照しているターゲットブロックの数がそれぞれ120,30,70であったとすると、符号量A及び符号量Bはそれぞれ次式で与えられ、
A=70*3+30*2+120*1=390(ビット)
B=120*1+70*2+30*3=350(ビット)
参照インデックスを変更した場合の方が符号量を低減化する上で有利である。
但し、参照インデックスの変更通知情報がエントロピー符号化器104で符号化された場合に、その符号量αが入力フレーム画像全体の符号量に加算されるため、前記のように(A−B)>αの条件下に参照インデックスの変更を行うこととしている。
この場合、αを10ビットとすれば、参照インデックスの変更処理がなされることになり、A−(B+α)=30ビット分の符号量を削減できることになる。
Specifically, for example, if the number of target blocks referring to the reference images related to the I0 picture, the P1 picture, and the P2 picture are 120, 30, and 70, respectively, the code amount A and the code amount B are respectively Given by
A = 70 * 3 + 30 * 2 + 120 * 1 = 390 (bit)
B = 120 * 1 + 70 * 2 + 30 * 3 = 350 (bit)
Changing the reference index is more advantageous in reducing the amount of codes.
However, when the reference index change notification information is encoded by the
In this case, if α is 10 bits, the reference index is changed, and the code amount for A− (B + α) = 30 bits can be reduced.
そして、エントロピー符号化器104では、前記のように変更後の参照インデックスに対して符号化ビットを割り当てて、動きベクトルやその他の付帯情報と共に符号化し、多重器105が階層構造のビットストリーム120を構成して出力させることになるが、多重器105では前記変更通知情報に基づいてその多重化画像データの上位階層(例えば、シーケンス層やピクチャ層やスライス層)に前記割り当て条件の変更情報を符号化して組み込んでおく(S19)。
Then, the
一方、ステップS16において(A−B)≦αであった場合には、動き付帯情報処理部118はセーブした動きベクトルや参照インデックス[i]をエントロピー符号化器104へそのまま出力し、エントロピー符号化器104では前記表1の参照インデックス[i](i=0,1,2)と符号化ビットの対応関係による既定の割り当て条件で符号化を行う(S16→S20,S21)。
On the other hand, if (A−B) ≦ α in step S16, the motion-accompanying
以上のように、入力フレーム画像をP3ピクチャへ符号化する場合について説明したが、P2ピクチャへ符号化する場合においてもI0ピクチャ又はP1ピクチャの再生画像を候補参照画像とするため、その場合にも動き付帯情報処理部118とエントロピー符号化器104において上記手順に準じた参照インデックスの変更処理を行うことにより符号量の低減化が図れる。
As described above, the case where the input frame image is encoded into the P3 picture has been described. However, even when the input frame image is encoded into the P2 picture, the reproduced image of the I0 picture or the P1 picture is used as a candidate reference image. The code amount can be reduced by performing the reference index changing process according to the above procedure in the motion-related
また、上記の動き補償予測符号化装置においてエントロピー符号化器104を算術符号化器とした場合においては、各参照インデックスに対して次の表2に示すようなビン列を割り当てることができる。
更に、より正確な符号量を試算する場合には、前記のような演算ではなく、実際に算術符号化を行った結果に基づいて参照インデックスの並び替えを行うか否かを決定するような方法も採用できる。
When the
Furthermore, when calculating a more accurate code amount, a method for determining whether or not to reorder the reference indexes based on the result of actual arithmetic coding, instead of the above-described calculation. Can also be adopted.
尚、この実施形態及び背景技術の欄では、図1や図3に示したように動き補償予測符号化装置を機能ブロックで表現しているが、その全体をDSP(Digital Signal Processor)等のマイクロコンピュータ回路で構成し、図2の手順をプログラムによって実行させることも可能である。
その場合のプログラムは、記録媒体による提供方式だけでなく、インターネット等の通信ネットワークを介してダウンロードさせる方式で提供されてもよい。
In the column of this embodiment and the background art, the motion compensated predictive coding apparatus is represented by functional blocks as shown in FIGS. 1 and 3, but the whole is represented by a micro signal processor such as a DSP (Digital Signal Processor). It is also possible to configure with a computer circuit and to execute the procedure of FIG. 2 by a program.
The program in that case may be provided not only by a recording medium but also by a method of downloading via a communication network such as the Internet.
100…入力画像(入力フレーム画像)、101…減算器、101a,112a…スイッチ、102…直交変換器、103…量子化器、104…エントロピー符号化器、105…多重器、110…逆量子化器、111…逆直交変換器、112…加算器、113,115…画像メモリ、114…ループフィルタ、116…動き補償予測器、117…動き検出器、118…動き付帯情報処理部、120…符号出力(符号化ビットストリーム)。
DESCRIPTION OF
Claims (2)
前記符号化対象画像に係る各参照インデックスの数をカウントするカウント手段と、
前記カウント手段が求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量との乗算値の和を演算する第1演算手段と、
前記カウント手段が求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量とを昇順/降順の逆関係で対応付けた場合の乗算値の和を演算する第2演算手段と、
前記第1演算手段が求めた値から前記第2演算手段が求めた値を差し引いた差分が所定値より大きい場合には、前記各参照インデックスの番号を前記カウント手段が求めた各参照インデックスの数の降順に付与される昇順番号に変更し、前記差分が前記所定値以下である場合には、前記各参照インデックスは既定の付与番号のままとする参照インデックス制御手段と、
前記参照インデックス制御手段が前記各参照インデックスの番号を変更した場合に、その変更情報を前記多重化画像データの上位階層中に符号化する設定情報符号化手段と
を具備したことを特徴とする動き補償予測符号化装置。 The encoding target image is divided into target blocks of a predetermined size, the image data encoded before the encoding target image is inversely processed to reproduce a plurality of reference images, and two or more references from among them are reproduced. In a mode in which an encoded image is generated with reference to an image, a motion vector is detected by obtaining a closest approximation from the blocks in the reference image for each target block, and the motion vector and the reference image for each target block are detected. After obtaining inter-picture prediction data by motion compensated prediction using the above, a prediction error that is a difference between the inter-picture prediction data and the encoding target image is obtained, and the encoding target picture is obtained for each reference picture In addition to assigning each reference index that becomes an ascending order from the one closer to the time, a code for each reference index is associated with the ascending order number. As allocated under the condition that the amount of issue is large, in the prediction error and the motion compensated predictive coding apparatus which outputs the multiplexed image data of the hierarchical structure and the respective reference indices and each motion vector is coded,
Counting means for counting the number of each reference index relating to the encoding target image;
First computing means for computing a sum of multiplication values of the number of each reference index obtained by the counting means and the code amount of the code assigned to each reference index;
Second computing means for computing the sum of multiplication values when the number of each reference index obtained by the counting means and the code amount of the code assigned to each reference index are associated with each other in ascending / descending order. When,
When the difference obtained by subtracting the value obtained by the second computing means from the value obtained by the first computing means is larger than a predetermined value, the number of each reference index obtained by the counting means is determined as the number of each reference index. Change to the ascending order number given in descending order of the reference index control means, if the difference is less than or equal to the predetermined value, the reference index control means to leave each reference index as a default assignment number;
And a setting information encoding unit that encodes the change information in an upper layer of the multiplexed image data when the reference index control unit changes the number of each reference index. Compensated predictive coding apparatus.
前記符号化対象画像に係る各参照インデックスの数をカウントする第1手順と、
前記第1手順で求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量との乗算値の和を演算する第2手順と、
前記第1手順で求めた各参照インデックスの数と各参照インデックスに割り当てられている前記符号の符号量とを昇順/降順の逆関係で対応付けた乗算値の和を演算する第3手順と、
前記第2手順で求めた値から前記第3手順で求めた値を差し引いた差分が所定値より大きい場合には、前記各参照インデックスの番号を前記第1手順で求めた各参照インデックスの数の降順に付与される昇順番号に変更し、前記差分が前記所定値以下である場合には、前記各参照インデックスは既定の付与番号のままとする第4手順と、
前記第4手順で前記各参照インデックスの番号を変更した場合に、その変更情報を前記多重化画像データの上位階層中に符号化する第5手順と
をコンピュータに実行させることを特徴とする動き補償予測符号化プログラム。
The encoding target image is divided into target blocks of a predetermined size, the image data encoded before the encoding target image is inversely processed to reproduce a plurality of reference images, and two or more references from among them are reproduced. In a mode in which an encoded image is generated with reference to an image, a motion vector is detected by obtaining a closest approximation from the blocks in the reference image for each target block, and the motion vector and the reference image for each target block are detected. After obtaining inter-picture prediction data by motion compensated prediction using the above, a prediction error that is a difference between the inter-picture prediction data and the encoding target image is obtained, and the encoding target picture is obtained for each reference picture In addition to assigning each reference index that becomes an ascending order from the one closer to the time, a code for each reference index is associated with the ascending order number. The computer functions as a motion-compensated predictive coding apparatus that outputs multiplexed image data having a hierarchical structure in which the prediction error, each motion vector, and each reference index are encoded, so that the prediction error, the motion vector, and the reference index are encoded. A program for
A first procedure for counting the number of each reference index related to the encoding target image;
A second procedure for calculating a sum of multiplication values of the number of each reference index obtained in the first procedure and the code amount of the code assigned to each reference index;
A third procedure for calculating a sum of multiplication values in which the number of each reference index obtained in the first procedure and the code amount of the code assigned to each reference index are associated in an ascending / descending order inverse relationship;
When the difference obtained by subtracting the value obtained in the third procedure from the value obtained in the second procedure is larger than a predetermined value, the number of each reference index is the number of each reference index obtained in the first procedure. Changing to ascending order numbers assigned in descending order, and if the difference is less than or equal to the predetermined value, the fourth procedure leaving each reference index as a default assignment number;
When the number of each reference index is changed in the fourth procedure, the computer executes a fifth procedure for encoding the change information in an upper layer of the multiplexed image data. Predictive coding program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003385713A JP2005151167A (en) | 2003-11-14 | 2003-11-14 | Encoding apparatus and encoding program for predicting movement compensation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003385713A JP2005151167A (en) | 2003-11-14 | 2003-11-14 | Encoding apparatus and encoding program for predicting movement compensation |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005151167A true JP2005151167A (en) | 2005-06-09 |
Family
ID=34693681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003385713A Pending JP2005151167A (en) | 2003-11-14 | 2003-11-14 | Encoding apparatus and encoding program for predicting movement compensation |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005151167A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008148315A (en) * | 2006-12-08 | 2008-06-26 | Matsushita Electric Ind Co Ltd | Method and apparatus for reconstructing image |
WO2012096176A1 (en) * | 2011-01-12 | 2012-07-19 | Panasonic Corporation | Methods and apparatuses for encoding and decoding video using multiple reference pictures |
US8818121B2 (en) | 2012-02-21 | 2014-08-26 | Kabushiki Kaisha Toshiba | Motion detector, image processing device, and image processing system |
JPWO2013136365A1 (en) * | 2012-03-14 | 2015-07-30 | 株式会社東芝 | Multi-view image encoding apparatus and method, and multi-view image decoding apparatus and method |
US10841573B2 (en) | 2011-02-08 | 2020-11-17 | Sun Patent Trust | Methods and apparatuses for encoding and decoding video using multiple reference pictures |
-
2003
- 2003-11-14 JP JP2003385713A patent/JP2005151167A/en active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008148315A (en) * | 2006-12-08 | 2008-06-26 | Matsushita Electric Ind Co Ltd | Method and apparatus for reconstructing image |
WO2012096176A1 (en) * | 2011-01-12 | 2012-07-19 | Panasonic Corporation | Methods and apparatuses for encoding and decoding video using multiple reference pictures |
JP2014508428A (en) * | 2011-01-12 | 2014-04-03 | パナソニック株式会社 | Moving picture encoding method, moving picture decoding method, moving picture encoding apparatus, and moving picture decoding apparatus using a plurality of reference pictures |
JP2017204884A (en) * | 2011-01-12 | 2017-11-16 | サン パテント トラスト | Decoding device |
US10027957B2 (en) | 2011-01-12 | 2018-07-17 | Sun Patent Trust | Methods and apparatuses for encoding and decoding video using multiple reference pictures |
US10841573B2 (en) | 2011-02-08 | 2020-11-17 | Sun Patent Trust | Methods and apparatuses for encoding and decoding video using multiple reference pictures |
US8818121B2 (en) | 2012-02-21 | 2014-08-26 | Kabushiki Kaisha Toshiba | Motion detector, image processing device, and image processing system |
JPWO2013136365A1 (en) * | 2012-03-14 | 2015-07-30 | 株式会社東芝 | Multi-view image encoding apparatus and method, and multi-view image decoding apparatus and method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101406056B (en) | Method of reducing computations in intra-prediction and mode decision processes in a digital video encoder | |
KR100763179B1 (en) | Method for compressing/Reconstructing motion vector of unsynchronized picture and apparatus thereof | |
JP4724351B2 (en) | Image encoding apparatus, image encoding method, image decoding apparatus, image decoding method, and communication apparatus | |
KR100681370B1 (en) | Predicting motion vectors for fields of forward-predicted interlaced video frames | |
JP3072035B2 (en) | Two-stage video film compression method and system | |
KR100853931B1 (en) | Video coding apparatus and recording medium | |
KR20040047977A (en) | Spatial scalable compression | |
JPWO2002080567A1 (en) | Image signal quantization apparatus and method | |
JPH07143494A (en) | Coding method for moving image | |
JP2006511164A (en) | Elastic memory | |
JP2005151167A (en) | Encoding apparatus and encoding program for predicting movement compensation | |
JP2007221201A (en) | Moving image coding apparatus and program | |
JP4859265B2 (en) | Method and apparatus for encoding by luminance evaluation | |
JP2002262293A (en) | Moving image decoder and moving image decoding method | |
JP3963296B2 (en) | Video transmission rate conversion device | |
JP4169767B2 (en) | Encoding method | |
JP4243286B2 (en) | Encoding method | |
KR100744435B1 (en) | An improved early detection of all-zero dct coefficients for fast video encoding | |
JP4361665B2 (en) | Transcoding method and transcoding apparatus for moving image encoded data | |
KR100240620B1 (en) | Method and apparatus to form symmetric search windows for bidirectional half pel motion estimation | |
JP2010166275A (en) | Image encoding device | |
KR20060034294A (en) | Encoding method and device | |
JP2007020216A (en) | Encoding apparatus, encoding method, filtering apparatus and filtering method | |
JPH11155147A (en) | Image reproduction method, image coder, and image coding method | |
JP3985567B2 (en) | Encoding device and encoding method |