JP5004877B2 - Image encoder, image decoder, image encoding method, image decoding method, and program - Google Patents
Image encoder, image decoder, image encoding method, image decoding method, and program Download PDFInfo
- Publication number
- JP5004877B2 JP5004877B2 JP2008147407A JP2008147407A JP5004877B2 JP 5004877 B2 JP5004877 B2 JP 5004877B2 JP 2008147407 A JP2008147407 A JP 2008147407A JP 2008147407 A JP2008147407 A JP 2008147407A JP 5004877 B2 JP5004877 B2 JP 5004877B2
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- wyner
- ziv
- auxiliary information
- slepian
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は、画像符号化器及び画像復号化器及び画像符号化方法及び画像復号化方法及びプログラムに係り、特に、軽量符号化や多視点画像の符号化、すなわち、互いを独立に符号化する必要のあるシステム、及び、無線やインターネット等の損失が発生するネットワーク通信システムの画像符号化器及び画像復号化器及び画像符号化方法及び画像復号化方法及びプログラムに関する。 The present invention relates to an image encoder, an image decoder, an image encoding method, an image decoding method, and a program, and in particular, lightweight encoding and multi-view image encoding, that is, encoding each other independently. The present invention relates to an image encoder, an image decoder, an image encoding method, an image decoding method, and a program of a necessary system and a network communication system in which loss such as wireless or Internet occurs.
近年、アナログ信号システムからディジタル信号システムへと移行しており、ディジタル画像の需要が増加している。しかし、ディジタル画像はそのままではデータ量が膨大になることから、画像を効率的に圧縮する符号化技術が重要なものになっており、国際標準アルゴリズムが広く用いられている。例としてティジタルTVにはMPEG-2が用いられており、Blu-ray Discの規格にはH.264/AVCが用いられている。これらの画像圧縮アルゴリズムの具体的な圧縮アルゴリズムは、まず、エンコーダ側では動き補償(MC)が行われ、時間的な信号の冗長性が除去され、その後、離散コサイン変換(DCT)等の周波数変換により空間的な信号の冗長性が除去された後に、エントロピー符号化が行われる。デコーダ側は真逆の処理を行うことにより復号される。 In recent years, there has been a shift from analog signal systems to digital signal systems, and the demand for digital images has increased. However, since a digital image has a huge amount of data as it is, an encoding technique for efficiently compressing the image is important, and an international standard algorithm is widely used. As an example, MPEG-2 is used for digital TV, and H.264 / AVC is used for the Blu-ray Disc standard. The specific compression algorithm of these image compression algorithms is such that motion compensation (MC) is first performed on the encoder side, temporal signal redundancy is removed, and then frequency conversion such as discrete cosine transform (DCT) is performed. Thus, entropy coding is performed after the redundancy of the spatial signal is removed. The decoder side performs decoding by performing the reverse process.
一方、近年、Distributed Video Coding (DVC)と呼ばれる新しいパラダイムの映像符号化方式が注目されている。DVCは、Distributed Source Coding (DSC)の原理をビデオ符号化に応用したものである。DSCは、図8に示すように、複数の相関のある情報源に対して互いを観測することなく分散して符号化し、受信側ではそれらの各データを一括して復号するシステムである。DSCはもともと、1970年代にSlepianとWolfにより確立されたSlepian-Wolf定理(例えば、非特許文献1参照)及び、WynerとZivにより確立されたWyner-Ziv定理(例えば、非特許文献2参照)に基づいている。Slepian-Wolf定理は、2つの情報源を分散符号化した場合における無歪状態で復号できる許容圧縮レート領域を与えたものであり、Wyner-Ziv定理は2つの情報源において1つの情報源に歪が発生した場合についてレート歪領域を与えたものである。これらの定理により、分散して符号化する場合の圧縮限界は、Slepian-Wolf定理及びWyner-Ziv定理の条件の範囲内にてではあるが、分散しなかった場合と等しいことが証明されている。近年では、Turbo符号を用いてSlepian-Wolf定理やWyner-Ziv定理で与えられた限界にどの程度迫れるかが研究されている(例えば、非特許文献3、非特許文献4参照)。
On the other hand, in recent years, a new paradigm video encoding method called Distributed Video Coding (DVC) has attracted attention. DVC is an application of the principle of Distributed Source Coding (DSC) to video coding. As shown in FIG. 8, the DSC is a system in which a plurality of correlated information sources are distributed and encoded without observing each other, and each data is decoded on the receiving side. DSC was originally developed in the 1970s by the Slepian-Wolf theorem established by Slepian and Wolf (for example, see Non-Patent Document 1) and the Wyner-Ziv theorem established by Wyner and Ziv (for example, Non-Patent Document 2). Is based. The Slepian-Wolf theorem gives an allowable compression rate region that can be decoded without distortion when two information sources are distributedly encoded. The Wyner-Ziv theorem distorts one information source in two information sources. A rate distortion region is given in the case of occurrence of From these theorems, it is proved that the compression limit when encoding in a distributed manner is within the range of the conditions of the Slepian-Wolf theorem and the Wyner-Ziv theorem, but is the same as the case without the dispersion. . In recent years, research has been conducted on how close to the limits given by the Slepian-Wolf theorem and Wyner-Ziv theorem using Turbo codes (see, for example, Non-Patent
DSCの理論を映像符号化に応用したDVCは、その分散性から、軽量エンコーダ、ロバスト符号化及び多視点映像符号化などへの応用が期待されている。例えば、近年標準化された動画像の圧縮アルゴリズムは、圧縮効率こそ高くはなっているが、それに伴い演算量も膨大になっている。H.264では大量の演算処理が必要であり、MPEG-2に比べて演算処理量は5〜10倍程度増加することが知られている。この大量の演算処理は複雑なフレーム間予測や可変マクロブックサイズの最適化等に必要な演算であり、エンコーダ側において必要となる。これに対して、たとえデコーダ側の演算処理は増えたとしてもエンコーダ側の処理が少ない方が好ましいという要求がセンサカメラや携帯電話の動画処理などのアプリケーションでは考えられる。DVCでは、エンコーダ側の高負荷演算処理をデコーダ側に移行した符号化方式であり、軽量エンコーダが実現できる。 DVC, which applies DSC theory to video coding, is expected to be applied to lightweight encoders, robust coding, and multi-view video coding because of its dispersibility. For example, a compression algorithm for moving images that has been standardized in recent years has a high compression efficiency, but the amount of computation has also become enormous. H.264 requires a large amount of arithmetic processing, and it is known that the arithmetic processing amount increases by about 5 to 10 times compared to MPEG-2. This large amount of arithmetic processing is necessary for complicated inter-frame prediction, variable macro book size optimization, and the like, and is necessary on the encoder side. On the other hand, even if the arithmetic processing on the decoder side increases, there is a demand for applications such as sensor camera and mobile phone video processing that it is preferable that the processing on the encoder side be less. DVC is an encoding method in which heavy load calculation processing on the encoder side is shifted to the decoder side, and a lightweight encoder can be realized.
従来、MPEGに代表される符号化方式では予測誤差信号を情報源符号器を用いて圧縮/伸張していたが、DVCではKeyフレームからの補足情報を作成することによりWyner-Zivフレームの予測信号を生成し、その予測誤差信号をある種のエラーと捉え、通信路符号器でエラーを訂正することで圧縮/伸張を行う。しかし、Keyフレームからの補助情報の作成において、補足情報が外れた場合にパリティビットの再送等を行う必要があり、符号化効率も低下する。したがって、DVCにおいて、符号化効率を向上させるためには、予測精度の高い補助情報を作成することが重要となる。 Conventionally, in an encoding method typified by MPEG, a prediction error signal is compressed / decompressed using an information source encoder. In DVC, a prediction signal of a Wyner-Ziv frame is created by creating supplementary information from a Key frame. , The prediction error signal is regarded as a certain type of error, and the channel encoder corrects the error to perform compression / decompression. However, in the creation of auxiliary information from the Key frame, it is necessary to retransmit parity bits and the like when supplementary information is lost, and the coding efficiency also decreases. Therefore, in order to improve coding efficiency in DVC, it is important to create auxiliary information with high prediction accuracy.
DVCの実際の構成方法は種々あげられるが、図9に示すように、Wyner-Zivフレームの符号化及び復号にターボ符号を用いた方法が提案されている(例えば、非特許文献5参照)。さらに、符号化効率を改善するために、上記の非特許文献5の技術における画素領域DVCを拡張した変換領域DVCが提案されている(例えば、非特許文献6参照)。この変換領域DVCでは、DCTを用いることより信号の空間的冗長性を除去し、画素領域DVCと比較して符号化効率を改善している。 Although there are various methods for configuring DVC, as shown in FIG. 9, a method using a turbo code for encoding and decoding a Wyner-Ziv frame has been proposed (see, for example, Non-Patent Document 5). Furthermore, in order to improve encoding efficiency, a transform area DVC in which the pixel area DVC in the technique of Non-Patent Document 5 described above is extended has been proposed (see Non-Patent Document 6, for example). In this transform area DVC, the spatial redundancy of the signal is removed by using DCT, and the coding efficiency is improved as compared with the pixel area DVC.
また、DCTに代わりウェーブレット変換を用いたウェーブレット領域DVCも提案されている(例えば、非特許文献7参照)。ウェーブレット領域DVCは、画素領域DVCと比較して符号化効率に優れることが報告されており、DCT領域DVCにはない解像度スケーラビリティやSNRスケーラビリティといった優れた特徴も有している。
上記で述べたようにDVCは多視点映像符号化やIPネットワーク等のベストエフォート型の通信システムに対する符号化として効果が期待されている。しかし、DVCはMPEGなどエンコーダ側で冗長性を除去する方式に比べるとまだまだ符号化効率が悪いという問題がある。 As described above, the DVC is expected to be effective as a coding for a best-effort communication system such as multi-view video coding or IP network. However, DVC has a problem that encoding efficiency is still lower than a method such as MPEG which removes redundancy on the encoder side.
本発明は、上記の点に鑑みなされたもので、高い符号化効率を実現可能な画像符号化器及び画像復号化器及び画像符号化方法及び画像復号化方法及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and an object thereof is to provide an image encoder, an image decoder, an image encoding method, an image decoding method, and a program capable of realizing high encoding efficiency. To do.
図1は、本発明の原理構成図である。 FIG. 1 is a principle configuration diagram of the present invention.
本発明(請求項1)は、ウェーブレット領域Distributed Video Coding (DVC)を用いて動画像フレームを符号化する画像符号化器であって、
入力されたKeyフレームを符号化する符号化手段35と、
入力されたWyner-Zivフレームをウェーブレット領域に変換するDWT110と、
ウェーブレット領域の信号を量子化し、最低周波数帯域のサブバンドをビットプレーンに分割する量子化手段120と、
復号器200からのモード切替判定結果に基づいて、量子化手段120からの出力のエントロピー符号化を行うエントロピー符号化手段150と、
復号器か200らのモード切替判定結果に基づいて、量子化手段120により取得したビットプレーンについてWyner-Ziv符号化を行うSlepian-Wolf符号化手段140と、
復号器200から取得したモード判定結果に基づいて量子化手段120からの出力をエントロピー符号化手段150または、Slepian-Wolf符号化手段140のいずれかに振り分けるデマルチプレクサ130と、を有し、
Slepian-Wolf符号化手段140は、
復号器に、Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報の相関を表す指標であるSAD(Sum of Absolute Differences)を計算した結果、それらのSADの中で最も小さな値のSADが得られる補助情報を該復号器から取得して符号化を行う手段を含み、
デマルチプレクサ130は、
復号器200から取得した、復号済みサブバンドLLsのMAD(Mean Absolute Difference)とSADが、MAD<μSAD(但し、μは定数)の場合は、エントロピー符号化手段150に符号化を指示し、MAD≧μSADの場合には、Wyner-Ziv符号化を行うSlepian-Wolf符号化手段140に符号化を指示する手段を含む。
The present invention (claim 1) is an image encoder for encoding a moving image frame using a wavelet domain Distributed Video Coding (DVC),
Encoding means 35 for encoding the input key frame;
A
Quantizing means 120 for quantizing a wavelet domain signal and dividing subbands of the lowest frequency band into bit planes;
An
A Slepian-Wolf
A
Slepian-Wolf encoding means 140
Low frequency band divided into small rectangular blocks when the decoder has auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction, and bidirectional prediction of Wyner-Ziv frames As a result of calculating SAD (Sum of Absolute Differences), which is an index representing the correlation between each decoded subband LL s and each auxiliary information, the auxiliary information for obtaining the smallest SAD among those SADs is decoded. Means for obtaining and encoding from a container,
The
When MAD (Mean Absolute Difference) and SAD of the decoded subband LL s obtained from the
本発明(請求項2)は、ウェーブレット領域DVCを用いて動画像フレームを復号化する画像復号化器であって、
入力されたKeyフレームを復号する復号手段44と、
Wyner-Zivフレームについて、前向き予測、後ろ向き予測の両方向の予測による推定値をs回DWT変換することにより第sステージの最低周波数のサブバンドLL L である補助情報を生成する補助情報生成手段210と、
Wyner-Zivフレームの最低周波数帯域のサブバンドを、補助情報を用いて再構成する再構成手段260と、
Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs,HHsを、それぞれ矩形の小ブロックに分割し、小ブロック毎にエントロピー符号化または、Wyner-Ziv符号化を行うかの判定を行い、モード判定結果を符号化器に送るモード判定手段270と、
Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs、高周波数帯域のサブバンドHHsのフレーム内符号化されたブロックをエントロピー復号化するエントロピー復号化手段290と、
Wyner-Ziv符号化されたブロックをSlepian-Wolf復号化するSlepian-Wolf復号化手段240と、を有し、
Slepian-Wolf復号化手段240は、
Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報の相関を表す指標であるSADを計算した結果、それらのSADの中で最も小さな値のSADが得られる補助情報を用いて復号化を行う手段を含み、
モード判定手段270は、
復号済みサブバンドLLsのMADとSADが、MAD<μSAD(但し、μは定数)の場合は、エントロピー符号化を行い、MAD≧μSADの場合には、Wyner-Ziv符号化を行うものと判定する手段を含む。
The present invention (Claim 2 ) is an image decoder for decoding a moving image frame using a wavelet domain DVC,
Decoding means 44 for decoding the input Key frame;
Auxiliary information generating means 210 for generating auxiliary information which is a subband LL L of the lowest frequency of the s-th stage by performing s times DWT conversion on the estimated value of the forward prediction and the backward prediction for the Wyner-Ziv frame. ,
Reconstructing means 260 for reconstructing the subband of the lowest frequency band of the Wyner-Ziv frame using auxiliary information;
The subbands LH s , HL s , and HH s in the middle and high frequency bands in the wavelet stage s of the Wyner-Ziv frame are divided into small rectangular blocks, and entropy coding or Wyner-Ziv coding is performed for each small block. Mode determination means 270 for determining whether to perform the determination and sending the mode determination result to the encoder;
Wyner-Ziv subbands high and high frequency bands in the wavelet first s stage frame LH s, HL s, the
And Slepian-Wolf decoding means 240 for Slepian-Wolf decoding the Wyner-Ziv encoded block,
Slepian-Wolf decoding means 240
When there is auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction, and bidirectional prediction of Wyner-Ziv frame, the decoded sub-band of the low frequency band divided into rectangular small blocks As a result of calculating SAD, which is an index indicating the correlation between the band LL s and each auxiliary information, including means for performing decoding using auxiliary information from which SAD having the smallest value among those SADs is obtained,
The mode determination means 270
If the MAD and SAD of the decoded subband LL s are MAD <μSAD (where μ is a constant), entropy coding is performed. If MAD ≧ μSAD, Wyner-Ziv coding is determined. Means to do.
本発明(請求項3)は、ウェーブレット領域DVCを用いて動画像フレームを符号化する画像符号化器であって、
入力されたKeyフレームを符号化する符号化手段と、
入力されたWyner-Zivフレームをウェーブレット領域に変換するDWT(Discrete Wavelet Transform)と、
ウェーブレット領域の信号を量子化し、最低周波数帯域のサブバンドをビットプレーンに分割する量子化手段と、
復号器からのモード切替判定結果に基づいて、量子化手段からの出力のエントロピー符号化を行うエントロピー符号化手段と、
復号器からのモード切替判定結果に基づいて、量子化手段により取得したビットプレーンについてWyner-Ziv符号化を行うSlepian-Wolf符号化手段と、
復号器から取得したモード判定結果に基づいて量子化手段からの出力をエントロピー符号化手段または、Slepian-Wolf符号化手段のいずれかに振り分けるデマルチプレクサと、を有し、
Slepian-Wolf符号化手段は、
復号器に、Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報のMSEを計算した結果、それらのMSEの中で最も小さなMSE(Mean Square Error)が得られる補助情報を該復号器から取得して符号化を行う手段を含み、
デマルチプレクサは、
復号器から取得した、低周波数帯域の復号済みサブバンドLLsの分散σとMSEが、σ<μMSE(但し、μは定数)の場合は、エントロピー符号化手段に符号化を指示し、σ≧μMSEの場合には、Wyner-Ziv符号化を行うSlepian-Wolf符号化手段に符号化を指示する手段を含む。
The present invention (claim 3) is an image encoder for encoding a moving image frame using a wavelet domain DVC,
Encoding means for encoding the input Key frame;
DWT (Discrete Wavelet Transform) that transforms the input Wyner-Ziv frame into the wavelet domain,
Quantizing means for quantizing the wavelet domain signal and dividing the subband of the lowest frequency band into bit planes;
Entropy encoding means for performing entropy encoding of the output from the quantization means based on the mode switching determination result from the decoder;
Based on the mode switching determination result from the decoder, the Slepian-Wolf encoding means for performing Wyner-Ziv encoding on the bit plane acquired by the quantization means,
A demultiplexer that distributes the output from the quantization means to either the entropy encoding means or the Slepian-Wolf encoding means based on the mode determination result obtained from the decoder,
Slepian-Wolf encoding means
Low frequency band divided into small rectangular blocks when the decoder has auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction, and bidirectional prediction of Wyner-Ziv frames As a result of calculating MSEs of the decoded subbands LL s and the respective auxiliary information, auxiliary information from which the smallest MSE (Mean Square Error) among those MSEs is obtained is obtained from the decoder and encoded. Including means,
The demultiplexer
If the variance σ and MSE of the decoded subband LL s in the low frequency band obtained from the decoder are σ <μMSE (where μ is a constant), the entropy coding means is instructed to encode, and σ ≧ In the case of μMSE, it includes means for instructing encoding to the Slepian-Wolf encoding means for performing Wyner-Ziv encoding.
本発明(請求項4)は、ウェーブレット領域DVCを用いて動画像フレームを復号化する画像復号化器であって、
入力されたKeyフレームを復号する復号手段と、
Wyner-Zivフレームについて、前向き予測、後ろ向き予測の両方向の予測による推定値をs回DWT変換することにより第sステージの最低周波数のサブバンドLL L である補助情報を生成する補助情報生成手段と、
Wyner-Zivフレームの最低周波数帯域のサブバンドを、補助情報を用いて再構成する再構成手段と、
Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs,高周波数帯域のサブバンドHHsを、それぞれ矩形の小ブロックに分割し、小ブロック毎にエントロピー符号化または、Wyner-Ziv符号化を行うかの判定を行い、モード判定結果を符号化器に送るモード判定手段と、
Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs,高周波数帯域のサブバンドHHsのフレーム内符号化されたブロックをエントロピー復号化するエントロピー復号化手段と、
Wyner-Ziv符号化されたブロックをSlepian-Wolf復号化するSlepian-Wolf復号化手段と、を有し、
Slepian-Wolf復号化手段は、
Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報のMSEを計算した結果、それらのMSEの中で最も小さなMSEが得られる補助情報を用いて復号化を行う手段を含み、
モード判定手段は、
低周波数帯域の復号済みサブバンドLLsの分散σとMSEが、σ<μMSE(但し、μは定数)の場合は、エントロピー符号化を行い、σ≧μMSEの場合には、Wyner-Ziv符号化を行うものと判定する手段を含む。
The present invention (Claim 4 ) is an image decoder for decoding a moving image frame using a wavelet domain DVC,
Decryption means for decrypting the input Key frame;
For the Wyner-Ziv frame, auxiliary information generating means for generating auxiliary information that is the subband LL L of the lowest frequency of the s-stage by performing s times DWT conversion on the estimated value by the forward prediction and the backward prediction in both directions ,
Reconstruction means for reconstructing the subband of the lowest frequency band of the Wyner-Ziv frame using auxiliary information;
The middle and high frequency band subbands LH s and HL s and the high frequency band subband HH s in the wavelet stage s of the Wyner-Ziv frame are each divided into rectangular small blocks, and entropy coding is performed for each small block, or Mode determination means for determining whether to perform Wyner-Ziv encoding and sending a mode determination result to the encoder;
Wyner-Ziv subbands high and high frequency bands in the wavelet first s stage frame LH s, and HL s, entropy decoding unit entropy decodes the coded blocks in the frame of the sub-band HH s in the high frequency band,
And Slepian-Wolf decoding means for Slepian-Wolf decoding the Wyner-Ziv encoded block,
Slepian-Wolf decoding means
When there is auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction, and bidirectional prediction of Wyner-Ziv frame, the decoded sub-band of the low frequency band divided into rectangular small blocks As a result of calculating the MSE of the band LL s and each auxiliary information, including means for decoding using the auxiliary information that can obtain the smallest MSE among those MSEs,
The mode judgment means is
Entropy coding is performed when the variance σ and MSE of the decoded subband LL s in the low frequency band is σ <μMSE (where μ is a constant), and Wyner-Ziv coding when σ ≧ μMSE. Means for determining that the operation is to be performed.
図2は、本発明の原理を説明するための図である。 FIG. 2 is a diagram for explaining the principle of the present invention.
本発明(請求項5)は、ウェーブレット領域DVCを用いて動画像フレームを符号化する画像符号化方法であって、
符号化手段が、入力されたKeyフレームを符号化する符号化ステップ(ステップ1)と、
DWTが、入力されたWyner-Zivフレームをウェーブレット領域に変換するウェーブレット変換ステップ(ステップ2)と、
量子化手段が、ウェーブレット領域の信号を量子化し、最低周波数帯域のサブバンドをビットプレーンに分割する量子化ステップ(ステップ3)と、
デマルチプレクサが、復号器からのモード判定結果に基づいて量子化手段からの出力をエントロピー符号化手段または、Slepian-Wolf符号化手段のいずれかに振り分ける振り分けステップ(ステップ4、ステップ5)と、
エントロピー符号化手段が、量子化手段からの出力のエントロピー符号化を行うエントロピー符号化ステップ(ステップ6)と、
Slepian-Wolf符号化手段が、復号器からのモード切替判定結果に基づいて、量子化手段により取得したビットプレーンについてWyner-Ziv符号化を行うSlepian-Wolf符号化ステップ(ステップ7)と、を行い、
振り分けステップ(ステップ5)において、
復号器に、Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報の相関を表す指標であるSADを取得し、該復号済みサブバンドLLのMADと該SADが、MAD<μSAD(但し、μは定数)の場合は、エントロピー符号化手段に符号化を指示し、MAD≧μSADの場合には、Wyner-Ziv符号化を行うSlepian-Wolf符号化手段に符号化を指示し、
Slepian-Wolf符号化ステップ(ステップ7)において、
SADの中で最も小さな値のSADが得られる補助情報を該復号器から取得して符号化を行う。
The present invention (Claim 5 ) is an image encoding method for encoding a moving image frame using a wavelet domain DVC,
An encoding step (step 1) in which the encoding means encodes the input key frame;
A wavelet transform step (step 2) in which the DWT transforms the input Wyner-Ziv frame into a wavelet domain;
A quantization step (step 3) in which the quantization means quantizes the wavelet domain signal and divides the subband of the lowest frequency band into bit planes;
A distribution step (
An entropy encoding means for performing entropy encoding of the output from the quantization means (step 6);
The Slepian-Wolf encoding means performs a Slepian-Wolf encoding step (Step 7) for performing Wyner-Ziv encoding on the bit plane obtained by the quantization means based on the mode switching determination result from the decoder. ,
In the sorting step (step 5),
Low frequency band divided into small rectangular blocks when the decoder has auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction, and bidirectional prediction of Wyner-Ziv frames get the decoded subband LL s of SAD is an index representing a correlation of the respective auxiliary information, MAD and the SAD of the decoded sub-band LL is, MAD <μSAD (where, mu is a constant) in the case of Instructing encoding to the entropy encoding means, and if MAD ≧ μSAD, instructing encoding to the Slepian-Wolf encoding means for performing Wyner-Ziv encoding ,
In the Slepian-Wolf encoding step (Step 7),
Auxiliary information for obtaining the SAD having the smallest value among the SADs is obtained from the decoder and encoded .
本発明(請求項6)は、ウェーブレット領域DVCを用いて動画像フレームを復号化する画像復号化方法であって、
復号手段が、入力されたKeyフレームを復号する復号ステップと、
補助情報生成手段が、Wyner-Zivフレームについて、前向き予測、後ろ向き予測の両方向の予測による推定値をs回DWT変換することにより第sステージの最低周波数のサブバンドLL L である補助情報を生成する補助情報生成ステップと、
再構成手段が、Wyner-Zivフレームの最低周波数帯域のサブバンドを、補助情報を用いて再構成する再構成ステップと、
モード判定手段が、Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs、高周波数帯域のサブバンドHHsを、それぞれ矩形の小ブロックに分割し、小ブロック毎にエントロピー符号化または、Wyner-Ziv符号化を行うかの判定を行い、モード判定結果を符号化器に送るモード判定ステップと、
エントロピー復号化手段が、Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs、高周波数帯域のサブバンドHHsのフレーム内符号化されたブロックをエントロピー復号化するエントロピー復号化ステップと、
Slepian-Wolf復号化手段が、Wyner-Ziv符号化されたブロックをSlepian-Wolf復号化するSlepian-Wolf復号化ステップと、を行い、
モード判定ステップにおいて、
Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報の相関を表す指標であるSADを取得し、該復号済みサブバンドLLsのMADと該SADが、MAD<μSAD(但し、μは定数)の場合は、エントロピー符号化を行い、MAD≧μSADの場合には、Wyner-Ziv符号化を行うものと判定し、
Slepian-Wolf復号化ステップにおいて、
SADの中で最も小さな値のSADが得られる補助情報を用いて復号化を行う。
The present invention (Claim 6) is an image decoding method for decoding a moving image frame using a wavelet domain DVC,
A decoding step in which the decoding means decodes the input Key frame;
Auxiliary information generation means generates auxiliary information that is the subband LL L of the lowest frequency of the s-th stage by performing DWT transformation on the estimated value of the forward prediction and the backward prediction for the Wyner-Ziv frame s times. An auxiliary information generation step;
A reconstruction means for reconstructing the subband of the lowest frequency band of the Wyner-Ziv frame using auxiliary information;
The mode judging means divides the sub-bands LH s and HL s in the medium and high frequency band and the sub-band HH s in the high frequency band in the wavelet stage s of the Wyner-Ziv frame into small rectangular blocks. A mode determination step of determining whether to perform entropy encoding or Wyner-Ziv encoding and sending a mode determination result to the encoder;
Entropy decoding means, to high and high frequency band of the subband LH s, HL s, entropy decoding the intra-coded blocks of the subband HH s in the high frequency band in wavelet first s stage of Wyner-Ziv frames An entropy decoding step;
Slepian-Wolf decoding means performs a Slepian-Wolf decoding step of Slepian-Wolf decoding a Wyner-Ziv encoded block;
In the mode determination step,
When there is auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction, and bidirectional prediction of Wyner-Ziv frame, the decoded sub-band of the low frequency band divided into rectangular small blocks get the band LL s and SAD is an index representing a correlation of the respective auxiliary information, MAD and the SAD of the decoded subband LL s is the case of MAD <μSAD (where, mu is a constant), entropy coding If MAD ≧ μSAD, it is determined that Wyner-Ziv encoding is performed ,
In the Slepian-Wolf decoding step,
Decoding is performed using auxiliary information that can obtain the SAD having the smallest value among the SADs .
本発明(請求項7)は、ウェーブレット領域DVCを用いて動画像フレームを符号化する画像符号化方法であって、
符号化手段が、入力されたKeyフレームを符号化する符号化ステップと、
DWTが、入力されたWyner-Zivフレームをウェーブレット領域に変換するウェーブレット変換ステップと、
量子化手段が、ウェーブレット領域の信号を量子化し、最低周波数帯域のサブバンドをビットプレーンに分割する量子化ステップと、
エントロピー符号化手段が、復号器からのモード切替判定結果に基づいて、量子化手段からの出力のエントロピー符号化を行うエントロピー符号化ステップと、
Slepian-Wolf復号化手段が、復号器からのモード切替判定結果に基づいて、量子化手段により取得したビットプレーンについてWyner-Ziv符号化を行うSlepian-Wolf符号化ステップと、
デマルチプレクサが、復号器から取得したモード判定結果に基づいて量子化手段からの出力をエントロピー符号化手段または、Slepian-Wolf符号化手段のいずれかに振り分ける振り分けステップと、を行い、
振り分けステップにおいて、
復号器に、Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、該復号器から矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報のMSEを計算した結果を取得し、該復号済みサブバンドLLsの分散σと該MSEが、σ<μMSE(但し、μは定数)の場合は、エントロピー符号化手段に符号化を指示し、σ≧μMSEの場合には、Wyner-Ziv符号化を行うSlepian-Wolf符号化手段に符号化を指示し、
Slepian-Wolf符号化ステップにおいて、
MSEの中で最も小さなMSE(Mean Square Error)が得られる補助情報を該復号器から取得して符号化を行う。
The present invention (Claim 7 ) is an image encoding method for encoding a moving image frame using a wavelet domain DVC,
An encoding step in which the encoding means encodes the input Key frame;
A wavelet transform step in which DWT transforms the input Wyner-Ziv frame into a wavelet domain;
A quantization means for quantizing a signal in the wavelet domain and dividing a subband of the lowest frequency band into bit planes;
An entropy encoding means for performing entropy encoding of the output from the quantization means based on the mode switching determination result from the decoder;
Slepian-Wolf decoding means, based on the mode switching determination result from the decoder, Slepian-Wolf encoding step for performing Wyner-Ziv encoding on the bit plane obtained by the quantization means;
A demultiplexer performs a distribution step of distributing the output from the quantization means to either the entropy encoding means or the Slepian-Wolf encoding means based on the mode determination result obtained from the decoder;
In the sorting step,
When the decoder has auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction, and bidirectional prediction of Wyner-Ziv frames, it is divided into rectangular small blocks from the decoder. low frequency band of the decoded subband LL s and each MSE of auxiliary information to get the result of the calculation, the variance sigma and the MSE of the decoded subband LL s is, σ <μMSE (where, mu is a constant and ) Instruct the encoding to the entropy encoding means, and in the case of σ ≧ μMSE, instruct the encoding to the Slepian-Wolf encoding means to perform Wyner-Ziv encoding,
In the Slepian-Wolf encoding step,
Auxiliary information that provides the smallest MSE (Mean Square Error) among the MSEs is obtained from the decoder and encoded .
本発明(請求項8)は、ウェーブレット領域DVCを用いて動画像フレームを復号化する画像復号化方法であって、
復号手段が、入力されたKeyフレームを復号する復号ステップと、
補助情報生成手段が、Wyner-Zivフレームについて、前向き予測、後ろ向き予測の両方向の予測による推定値をs回DWT変換することにより第sステージの最低周波数のサブバンドLL L である補助情報を生成する補助情報生成ステップと、
再構成手段が、Wyner-Zivフレームの最低周波数帯域のサブバンドを、補助情報を用いて再構成する再構成ステップと、
モード判定手段が、Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs、高周波数帯域のサブバンドHHsを、それぞれ矩形の小ブロックに分割し、小ブロック毎にエントロピー符号化または、Wyner-Ziv符号化を行うかの判定を行い、モード判定結果を符号化器に送るモード判定ステップと、
エントロピー復号化手段が、Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs、高周波数帯域のサブバンドHHsのフレーム内符号化されたブロックをエントロピー復号化するエントロピー復号化ステップと、
Slepian-Wolf復号化手段が、Wyner-Ziv符号化されたブロックをSlepian-Wolf復号化するSlepian-Wolf復号化ステップと、を行い、
モード判定ステップにおいて、
Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報のMSEを計算した結果を取得し、該復号済みサブバンドLLsの分散σと該MSEが、σ<μMSE(但し、μは定数)の場合は、エントロピー符号化を行い、σ≧μMSEの場合には、Wyner-Ziv符号化を行うものと判定し、
Slepian-Wolf復号化ステップにおいて、
MSEの中で最も小さなMSEが得られる補助情報を用いて復号化を行う、
The present invention (Claim 8 ) is an image decoding method for decoding a moving image frame using a wavelet domain DVC,
A decoding step in which the decoding means decodes the input Key frame;
Auxiliary information generation means generates auxiliary information that is the subband LL L of the lowest frequency of the s-th stage by performing DWT transformation on the estimated value of the forward prediction and the backward prediction for the Wyner-Ziv frame s times. An auxiliary information generation step;
A reconstruction means for reconstructing the subband of the lowest frequency band of the Wyner-Ziv frame using auxiliary information;
The mode judging means divides the sub-bands LH s and HL s in the medium and high frequency band and the sub-band HH s in the high frequency band in the wavelet stage s of the Wyner-Ziv frame into small rectangular blocks. A mode determination step of determining whether to perform entropy encoding or Wyner-Ziv encoding and sending a mode determination result to the encoder;
Entropy decoding means, to high and high frequency band of the subband LH s, HL s, entropy decoding the intra-coded blocks of the subband HH s in the high frequency band in wavelet first s stage of Wyner-Ziv frames An entropy decoding step;
Slepian-Wolf decoding means performs a Slepian-Wolf decoding step of Slepian-Wolf decoding a Wyner-Ziv encoded block ;
In the mode determination step,
When there is auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction, and bidirectional prediction of Wyner-Ziv frame, the decoded sub-band of the low frequency band divided into rectangular small blocks Gets the results of calculating the MSE band LL s and each of the auxiliary information, the variance σ and the MSE of the decoded subband LL s is the case σ of <μMSE (where, mu is a constant), entropy coding When σ ≧ μMSE, it is determined that Wyner-Ziv encoding is performed ,
In the Slepian-Wolf decoding step,
Decodes using auxiliary information that gives the smallest MSE among MSEs,
本発明(請求項9)は、請求項1または3記載の符号化器を構成する各手段としてコンピュータを機能させるための画像符号化プログラムである。
The present invention (Claim 9 ) is an image encoding program for causing a computer to function as each means constituting the encoder according to
本発明(請求項10)は、請求項2または4記載の復号器を構成する手段としてコンピュータを機能させるための画像復号化プログラムである。
The present invention (Claim 10) is an image decoding program for causing a computer to function as means constituting the decoder according to
上述のように、本発明によれば、複数の相関がある情報源(多視点画像等)に対して互いの情報源を分散符号化し、受信側で一括復号するDistributed Video Coding(DVC)において、映像フレームを構成するKeyフレームとWyner-Zivフレームのうち、Wyner-Zivフレームを符号化する際に、その中高周波数帯のサブバンドを矩形ブロックに分割し、その各々について2つの指標Mean Absolute Difference (MAD)、Sun of Absolute Difference(SAD)によってエントロピー符号化を行うか、Slepian-Wolf符号化を行うかを判定し、送信側に送出することにより、Wyner-Zivフレームの予測値の精度を向上させると共に、Distributed Video Coding(DVC)の高符号化効率を実現することが可能となる。 As described above, according to the present invention, in Distributed Video Coding (DVC) in which each information source is distributedly encoded with respect to a plurality of correlated information sources (such as multi-viewpoint images) and collectively decoded on the receiving side, Of the Key frame and Wyner-Ziv frame that composes the video frame, when encoding the Wyner-Ziv frame, the sub-band of the middle and high frequency band is divided into rectangular blocks, and each of them has two indices Mean Absolute Difference ( MAD), Sun of Absolute Difference (SAD) is used to determine whether entropy encoding or Slepian-Wolf encoding is to be performed, and the accuracy of the prediction value of the Wyner-Ziv frame is improved by sending it to the transmission side At the same time, it is possible to realize high encoding efficiency of Distributed Video Coding (DVC).
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
最初に、画素領域DVCと従来のウェーブレット領域DVCの動作原理について説明する。 First, the operation principle of the pixel area DVC and the conventional wavelet area DVC will be described.
[画素領域DVC]
一般的に、DVCにおいて、映像フレームはKeyフレーム及びWyner-Zivフレームに分割される。ここでは、簡単化のために、Keyフレームには奇数フレームX2n±1を割り当て、Wyner-Zivフレームには偶数フレームX2nを割り当てる。
[Pixel area DVC]
In general, in DVC, a video frame is divided into a Key frame and a Wyner-Ziv frame. Here, for simplicity, assign the odd frame X 2n ± 1 for Key frames, it allocates the even frame X 2n are the Wyner-Ziv frames.
以下、前述の図9の画素領域DVCの構成を用いて説明する。同図は、前述の非特許文献5において提案された画素領域DVCの例である。Keyフレームは、JPEGなど従来のフレーム内符号器11により符号化される。Wyner-ZivフレームX2nは、量子化器12で一様量子化され、量子化された信号はビットプレーンに分割された後、Splepian-Wolf符号器13に送られる。各ビットプレーンは最上位ビット(MSB: Most Significant Bit)からSlepian-Wolf符号器13に送られ、それぞれのビットプレーンに対して十分なシンドロームビットが生成される。そして、それぞれのビットプレーンが順々にバッファ132に蓄えられ、デコーダ側からのリクエストにより上位ビットプレーンから順々にシンドロームビットを送信する。
Hereinafter, description will be made using the configuration of the pixel region DVC of FIG. 9 described above. This figure is an example of the pixel region DVC proposed in Non-Patent Document 5 described above. The Key frame is encoded by a
一方、デコーダ側では、KeyフレームX2n±1から動き補償を用いてブロック単位の補助情報(Side Information)Y2nが次式(1)で作成される。 On the other hand, on the decoder side, block unit auxiliary information (Side Information) Y 2n is created from the Key frame X 2n ± 1 using motion compensation by the following equation (1).
次に、ビット尤度を推定し、Slepian-Wolf復号器133にそのビット尤度を与える。ビット尤度は、一般にWyner-ZivフレームX2nと補助情報Y2nのウェーブレット領域間の差分信号、すなわち、予測誤差信号はラプラス分布で近似されることから次式を用いて推定される。
Next, the bit likelihood is estimated, and the bit likelihood is given to the Slepian-
最後に、復号されたビットプレーンは再構成器24に送られ、補助情報Y2nを用いて次式で再構成される。
Finally, the decoded bit plane is sent to the
[ウェーブレット領域DVC]
次にウェーブレット領域DVCについて説明する。
[Wavelet domain DVC]
Next, the wavelet area DVC will be described.
符号化効率を改善するために、Girodらは前述の非特許文献5に示される技術の画素領域DVCを拡張した変換領域DVCを提案している(例えば、非特許文献6)。この変換領域DVCでは、DCTを用いることにより信号の空間的冗長性を除去し、画素領域DVCと比較して符号化効率を改善している。また、DCTの代わりにウェーブレット変換を用いたウェーブレット領域DVCも提案されている(例えば、非特許文献7)。ここでは、ウェーブレット領域DVCについて説明する。図3にウェーブレット領域DVCの原理構成を示す。画素領域DVCとの違いは、画素領域で行っていた通信路符号器によるエラー訂正を、ウェーブレット領域で行っている点である。 In order to improve the encoding efficiency, Girod et al. Have proposed a transform area DVC that is an extension of the pixel area DVC of the technique shown in Non-Patent Document 5 (for example, Non-Patent Document 6). In this transform area DVC, the spatial redundancy of the signal is removed by using DCT, and the coding efficiency is improved as compared with the pixel area DVC. A wavelet domain DVC using wavelet transform instead of DCT has also been proposed (for example, Non-Patent Document 7). Here, the wavelet area DVC will be described. FIG. 3 shows the principle configuration of the wavelet domain DVC. The difference from the pixel area DVC is that error correction by the channel encoder performed in the pixel area is performed in the wavelet area.
ウェーブレット領域DVCでは、Wyner-ZivフレームX2nは、離散ウェーブレット変換DWT31によりウェーブレット領域に変換された後、量子化器32で各サブバンドの信号は2M≦{0,4,8,16,32,64,128,256,…}のレベルに一様量子化される。量子化された信号は、サブビットプレーン分割部33でビットプレーンに分割された後、各サブバンド毎にSlepian-Wolf符号器34に送られる。
In the wavelet domain DVC, the Wyner-Ziv frame X 2n is converted into the wavelet domain by the discrete
一方、デコーダ側では、KeyフレームX2n±1から動き補償を用いてブロック単位に予測値Y2nが作成される。ここで動き補償処理は、画素領域DVCと同じ手法を用いる。 On the other hand, on the decoder side, a predicted value Y 2n is created for each block from the Key frame X 2n ± 1 using motion compensation. Here, the motion compensation process uses the same technique as that of the pixel region DVC.
予測値Y2nは、離散ウェーブレット変換DWT46によりウェーブレット領域に変換された後、補助情報として用いられる。次に、ビット尤度を推定しSlepian-Wolf復号器41にビット尤度を与える。ビット尤度は、一般にWyner-ZivフレームX2nと予測値Y2nのウェーブレット領域間の差分信号、すなわち、ラプラス分布で近似され、画素領域DVCと同様な方法で推定される。復号されたビットプレーンは再構成器42に送られ、補助情報を用いて再構成される。再構成された信号は、IDWT43において、最後に逆離散ウェーブレット変換IDWTが施され、出力される。
The predicted value Y 2n is used as auxiliary information after being converted into a wavelet region by the discrete wavelet transform DWT 46. Next, the bit likelihood is estimated and the bit likelihood is given to the Slepian-
以下に、本発明のウェーブレット領域DVCについて説明する。 The wavelet region DVC of the present invention will be described below.
画素領域DVCからウェーブレット領域DVCかに関わらず、DVCの符号化効率は、復号器で生成される補足情報の予測制度に大きく依存する。DVCでは、Keyフレームより作成される補足情報をWyner-Zivフレームの予測信号とし、補助情報とWyner-Zivフレームの予測誤差信号をある種のエラーと捉え、通信路符号器でエラーを訂正することで圧縮/復号を行う。補足情報が外れた場合には、パリティビットの再送等を行う必要があり、符号化効率も低下する。従って、予測精度の高い補助情報を与えることが必要となる。この補助情報の生成において、上記の画素領域DVCやウェーブレット領域DVC並びにDCT領域のDVC(例えば、非特許文献6)など従来の変換領域DVCでは、補助情報をKeyフレームのみの情報によって生成している。それは、復号器では、Wyner-Zivフレームの情報がないことに起因している。 Regardless of whether the pixel area DVC or the wavelet area DVC, the encoding efficiency of the DVC depends largely on the prediction system of the supplementary information generated by the decoder. In DVC, supplementary information created from a Key frame is used as a Wyner-Ziv frame prediction signal, and the auxiliary information and the Wyner-Ziv frame prediction error signal are regarded as a certain type of error, and the channel encoder corrects the error. Compress / decode with. If the supplementary information is lost, it is necessary to retransmit the parity bit and the like, and the coding efficiency also decreases. Therefore, it is necessary to provide auxiliary information with high prediction accuracy. In the generation of the auxiliary information, in the conventional conversion area DVC such as the pixel area DVC, the wavelet area DVC, and the DCT area DVC (for example, Non-Patent Document 6), the auxiliary information is generated only by information of the Key frame. . This is due to the fact that there is no Wyner-Ziv frame information in the decoder.
本発明では、より推定精度の高い補助情報を与えるために、ウェーブレット領域の信号を低周波帯域のサブバンドから高周波帯域に向けて復号する過程で、低周波数帯域の復号されたサブバンドを利用し、より推定精度の高い補助情報を与える手法を示す。また、補助情報の推定制度が悪いと判断された場合には、ハフマン符号や算術符号化などのエントロピー符号化を用いる。 In the present invention, in order to provide auxiliary information with higher estimation accuracy, the decoded subband of the low frequency band is used in the process of decoding the signal in the wavelet domain from the subband of the low frequency band toward the high frequency band. A method for providing auxiliary information with higher estimation accuracy will be described. If it is determined that the auxiliary information estimation system is poor, entropy coding such as Huffman coding or arithmetic coding is used.
図4は、本発明の一実施の形態におけるウェーブレット領域DVCの構成を示す。 FIG. 4 shows the configuration of the wavelet region DVC in one embodiment of the present invention.
同図に示す符号器100は、DWT110、量子化器120、デマルチプレクサ130、Slepian-Wolf符号器140、エントロピー符号器150から構成される。また、復号器200は、補助情報生成器210、DWT220、Slepian-Wolf復号器240、マルチプレクサ250、再構成器260、モード判定器270、IDWT280、エントロピー復号器290から構成される。
The
同図に示すDVCと従来のDVCのウェーブレット領域DVCとの違いは、Wyner-Zivフレームの信号を符号化する際に、エントロピー符号化か、または、Slepian-Wolf符号化かを判断する機能が付加されている点と、Slepian-Wolfと判定された場合でも、複数の補助情報の中で、予測精度が高いと判定される補助情報を選択する機能を有するモード判定器270が設けられている点である。以下に具体的な動作手順を示す。
The difference between the DVC shown in the figure and the conventional DVC wavelet domain DVC is the addition of a function that determines whether entropy encoding or Slepian-Wolf encoding is used when encoding a Wyner-Ziv frame signal. And a
図6は、本発明の一実施の形態における符号化・復号化のシーケンスチャートである。 FIG. 6 is a sequence chart of encoding / decoding according to an embodiment of the present invention.
ステップ101)符号器200側において、入力されたKeyフレームX2n±1をJPEG2000など従来のフレーム内符号器を用いて符号化する。
Step 101) On the
ステップ102)符号器200側において、入力されたWyner-ZivフレームX2nを離散ウェーブレット変換DWT110によりウェーブレット領域に変換する。図5は、2レベルのウェーブレット変換の例を示している。その後、それぞれウェーブレット領域の信号は、量子化器120で2M≦(0,4,8,16,32,64,128,256,…)のレベルに一様に量子化される。
Step 102) On the
ステップ103)復号器200側において、符号器100から入力された符号化されたKeyフレームX2n±1を、フレーム内復号器を用いて復号する。
Step 103) On the
ステップ104)復号器200側において、補助情報生成器210は、Wyner-Zivフレームの補助情報を作成する。そのために、前述の非特許文献6に記載されている技術などに示す動き補償補間、平均補間、あるいは外挿補間を用いて、ブロック単位にWyner-Zivフレーム信号X2nの推定値
Step 104) On the
次に、DWT220において、 Next, in DWT220,
ステップ105)符号器100において、Wyner-Zivフレームに関して、上記のステップ102において一様に量子化器120で量子化された最低周波数帯域のサブバンドLLLは、デマルチプレクサ130でビットプレーンに分割された後、Slepian-Wolf符号器140に送られる。
Step 105) In the
ステップ106)復号器200において、Wyner-zivフレームの最低周波数帯域のサブバンドLLLに関して、
Step 106) In the
ステップ107)復号器200において、Wyner-Zivフレームの中高周波数帯域のサブバンドLHs,HLs,HHsは、それぞれ矩形の小ブロックに分割され、小ブロック毎にエントロピー符号化、または、Wyner-Ziv符号化を行う。モード判定器270における、エントロピー符号化を行うか、Wyner-Ziv符号化を行うかのモード切替の判定は、低周波数帯域の復号済みサブバンドLLs'と、補助情報生成器210及びDWT220で生成された補助情報
Step 107) In the
モード判定器270における、モード切替の判定は、各ブロック毎に行われるが、これはウェーブレット変換の帯域相関を利用しており、サブバンドLLsのある小ブロックが、隣接するKeyフレームのサブバンドLLsの小ブロックと相関が高ければ(低ければ)、Wyner-ZivフレームのサブバンドLHs、HLs、HHsの空間的に対応する小ブロックも、隣接するKeyフレームのサブバンドLHs、HLs、HHsの空間的に対応する小ブロックとで相関が高い(低い)性質を利用している。図7に小ブロックの空間的対応関係を示す。
Mode switching in the
(a)MAD (Mean Absolute Difference)
復号済みサブバンドLL'sのブロックB内の信号の空間的滑らかさを表す指標であり、次式により計算する。
(A) MAD (Mean Absolute Difference)
It is an index representing the spatial smoothness of the signal in the block B of the decoded subband LL 's, is calculated by the following equation.
(b)SAD (Sum of Absolute differences)
2つ目の指標は、復号済みサブバンドLL'sと補助情報との相関を表す指標であり、次式により計算する。
(B) SAD (Sum of Absolute differences)
The second index is an index representing the correlation between the decoded subband LL's and the auxiliary information, and is calculated by the following equation.
モード判定器270において、以上の式(10)と式(11)の2つの指標を用いて、エントロピー符号器150でエントロピー符号化を行う、または、Slepian-Wolf符号器140でSlepian-Wolf符号化を行うかの判定は、以下のように行われる。
In the
(a)MAD<μSAD(但し、μは定数)の場合は、エントロピー符号化を行う。 (A) If MAD <μSAD (where μ is a constant), entropy coding is performed.
(b)mad≧Μsadの場合には、Slepian-Wolf符号化を行う。Slepian-Wolf符号化を行う際には、補助情報として、式(11)を最小化する補助情報を用いる。例えば、SAD=SADfの場合には、LHs,,HLs,HHsの補助情報として、それぞれ (B) When mad ≧ Μsad, Slepian-Wolf encoding is performed. When Slepian-Wolf encoding is performed, auxiliary information that minimizes Equation (11) is used as auxiliary information. For example, when SAD = SAD f , as auxiliary information of LH s , HL s , HH s , respectively
得られたモード切替の判定結果を、フィードバックチャネルを通して、符号器100に送る。
The obtained mode switching determination result is sent to the
ステップ108)符号器100では、Wyner-Zivフレームの第sステージにおける高周波数帯域のサブバンドLHs,HLs,HHsに関して、復号器200より送られてきたモード切替の判定結果を元に、各ブロッ毎にエントロピー符号器150によるエントロピー符号化またはSlepian-Wolf符号器140によるSlepian-Wolf符号化を行う。エントロピー符号化として、ハフマン符号化や算術符号化を用いる。Slepian-Wolf符号化として、LDPCやターボ符号化を用いる。
Step 108) In the
ステップ109)復号器200において、Wyner-Zivフレームの第sステージにおける高周波帯域のサブバンドLHs,HLs,HHsに関して、フレーム内符号化されたブロックは、エントロピー復号器290でエントロピー復号を行う。Wyner-Ziv符号化されたブロックは、Slepian-Wolf復号器240でSlepian-Wolf復号処理が実行される。このSlepian-Wolf復号処理は、従来のウェーブレット領域DVCと同じ方法を用いる。第sステージの全ての小ブロックに対して、以上の復号処理を行う。
Step 109) In the
ステップ110) IDWT280で1レベルの逆離散ウェーブレット変換を施す。s=s−1とする。
Step 110) The
ステップ111)上記のステップ110の処理を原画像が復号されるレベルまでステップ107以降の処理を繰り返す。
Step 111) Repeat the processing in
なお、上記の図4に示す符号器及び復号器の各構成要素の動作をプログラムとして構築し、符号化器及び復号器として利用されるコンピュータにインストールして実行させることが可能である。 Note that the operation of each component of the encoder and decoder shown in FIG. 4 can be constructed as a program, and can be installed and executed in a computer used as the encoder and decoder.
また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。 Further, the constructed program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and can be installed or distributed in a computer.
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
本発明は、ウェーブレット領域を用いて動画像フレームを符号化/復号化するシステムに適用可能である。 The present invention can be applied to a system for encoding / decoding a moving image frame using a wavelet region.
11 コンベンショナルイントラフレーム符号器
12 量子化器
13 Slepian-Wolf符号器
21 コンベンショナルイントラフレーム復号器
22 記述または補間部
24 再構成器
31 DWT
32 量子化部
33 サブバンドビットプレーン分割部
34 Slepian-Wolf符号器
35 符号化手段
41 Slepian-Wolf復号器
42 再構成器
43 IDWT
44 復号手段
45 補助情報生成器
46 DWT
100 符号器
110 DWT
120 量子化器
130 デマルチプレクサ
131 ターボ符号器
132 バッファ
133 ターボ復号器(Slepian-Wolf復号器)
140 Slepian-Wolf符号化手段、Slepian-Wolf符号器
150 エントロピー符号化手段、エントロピー符号器
200 復号器
210 補助情報生成手段、補助情報生成器
220 DWT
240 Slepian-Wolf復号手段、Slepian-Wolf復号器
250 マルチプレクサ
260 再構成手段、再構成器
270 モード判定手段、モード判定器
280 IDWT
290 エントロピー復号器
11 Conventional
32
44 Decoding means 45 Auxiliary information generator 46 DWT
120
140 Slepian-Wolf encoding means, Slepian-
240 Slepian-Wolf decoding means, Slepian-
290 Entropy Decoder
Claims (10)
入力されたKeyフレームを符号化する符号化手段と、
入力されたWyner-Zivフレームをウェーブレット領域に変換するDWT(Discrete Wavelet Transform)と、
前記ウェーブレット領域の信号を量子化し、最低周波数帯域のサブバンドをビットプレーンに分割する量子化手段と、
復号器からのモード切替判定結果に基づいて、前記量子化手段からの出力のエントロピー符号化を行うエントロピー符号化手段と、
前記復号器からの前記モード切替判定結果に基づいて、前記量子化手段により取得した前記ビットプレーンについてWyner-Ziv符号化を行うSlepian-Wolf符号化手段と、
前記復号器から取得した前記モード判定結果に基づいて前記量子化手段からの出力を前記エントロピー符号化手段または、Slepian-Wolf符号化手段のいずれかに振り分けるデマルチプレクサと、を有し、
前記Slepian-Wolf符号化手段は、
前記復号器に、前記Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報の相関を表す指標であるSAD(Sum of Absolute Differences)を計算した結果、それらのSADの中で最も小さな値のSADが得られる補助情報を該復号器から取得して符号化を行う手段を含み、
前記デマルチプレクサは、
前記復号器から取得した、前記復号済みサブバンドLLsのMAD(Mean Absolute Difference)と前記SADが、MAD<μSAD(但し、μは定数)の場合は、前記エントロピー符号化手段に符号化を指示し、MAD≧μSADの場合には、Wyner-Ziv符号化を行う前記Slepian-Wolf符号化手段に符号化を指示する手段を含む
ことを特徴とする画像符号化器。 An image encoder for encoding a moving image frame using a wavelet domain Distributed Video Coding (DVC),
Encoding means for encoding the input Key frame;
DWT (Discrete Wavelet Transform) that transforms the input Wyner-Ziv frame into the wavelet domain,
Quantizing means for quantizing the wavelet domain signal and dividing the subband of the lowest frequency band into bit planes;
Entropy encoding means for performing entropy encoding of the output from the quantization means based on the mode switching determination result from the decoder;
Based on the mode switching determination result from the decoder, Slepian-Wolf encoding means for performing Wyner-Ziv encoding on the bit plane acquired by the quantization means;
A demultiplexer that distributes the output from the quantization means to either the entropy encoding means or the Slepian-Wolf encoding means based on the mode determination result obtained from the decoder,
The Slepian-Wolf encoding means is
When the decoder has auxiliary information that is four subbands obtained by performing discrete wavelet transform on forward prediction, backward prediction, and bidirectional prediction of the Wyner-Ziv frame, As a result of calculating SAD (Sum of Absolute Differences), which is an index indicating the correlation between the decoded subband LL s of the frequency band and each auxiliary information, auxiliary information that gives the smallest value of SAD among those SADs Means for obtaining and encoding from the decoder;
The demultiplexer
Obtained from the decoder, the SAD and MAD (Mean Absolute Difference) of the decoded subband LL s is the case of MAD <μSAD (where, mu is a constant), instructs the encoding to the entropy coding means In the case of MAD ≧ μSAD, the image encoder includes means for instructing encoding to the Slepian-Wolf encoding means for performing Wyner-Ziv encoding.
入力されたKeyフレームを復号する復号手段と、
Wyner-Zivフレームについて、前向き予測、後ろ向き予測の両方向の予測による推定値をs回DWT変換することにより第sステージの最低周波数のサブバンドLL L である補助情報を生成する補助情報生成手段と、
前記Wyner-Zivフレームの最低周波数帯域のサブバンドを、前記補助情報を用いて再構成する再構成手段と、
前記Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs,HHsを、それぞれ矩形の小ブロックに分割し、小ブロック毎にエントロピー符号化または、Wyner-Ziv符号化を行うかの判定を行い、モード判定結果を符号化器に送るモード判定手段と、
前記Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs、高周波数帯域のサブバンドHHsのフレーム内符号化されたブロックをエントロピー復号化するエントロピー復号化手段と、
Wyner-Ziv符号化されたブロックをSlepian-Wolf復号化するSlepian-Wolf復号化手段と、を有し、
前記Slepian-Wolf復号化手段は、
前記Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報の相関を表す指標であるSADを計算した結果、それらのSADの中で最も小さな値のSADが得られる補助情報を用いて復号化を行う手段を含み、
前記モード判定手段は、
前記復号済みサブバンドLLsのMADと前記SADが、MAD<μSAD(但し、μは定数)の場合は、エントロピー符号化を行い、MAD≧μSADの場合には、Wyner-Ziv符号化を行うものと判定する手段を含む
ことを特徴とする画像復号化器。 An image decoder for decoding a moving image frame using a wavelet domain DVC,
Decryption means for decrypting the input Key frame;
For the Wyner-Ziv frame, auxiliary information generating means for generating auxiliary information that is the subband LL L of the lowest frequency of the s-stage by performing s times DWT conversion on the estimated value by the forward prediction and the backward prediction in both directions ,
Reconstructing means for reconstructing the subband of the lowest frequency band of the Wyner-Ziv frame using the auxiliary information;
The subbands LH s , HL s , and HH s in the middle and high frequency bands in the wavelet stage s of the Wyner-Ziv frame are divided into small rectangular blocks, and entropy coding or Wyner-Ziv coding is performed for each small block. Mode determination means for determining whether to perform the mode determination, and sending the mode determination result to the encoder;
The Wyner-Ziv subbands high and high frequency bands in the wavelet first s stage frame LH s, and HL s, entropy decoding unit entropy decodes the coded blocks in the frame of the sub-band HH s in the high frequency band ,
And Slepian-Wolf decoding means for Slepian-Wolf decoding the Wyner-Ziv encoded block,
The Slepian-Wolf decoding means is:
When there is auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction and bi-directional prediction of the Wyner-Ziv frame, the low frequency band divided into small rectangular blocks has been decoded. As a result of calculating SAD, which is an index indicating the correlation between subband LL s and each auxiliary information, including means for decoding using auxiliary information from which SAD having the smallest value among those SADs is obtained,
The mode determination means includes
When the MAD and the SAD of the decoded subband LL s are MAD <μSAD (where μ is a constant), entropy coding is performed, and when MAD ≧ μSAD, Wyner-Ziv coding is performed. picture decoder characterized in that it comprises means for determining the.
入力されたKeyフレームを符号化する符号化手段と、
入力されたWyner-Zivフレームをウェーブレット領域に変換するDWT(Discrete Wavelet Transform)と、
前記ウェーブレット領域の信号を量子化し、最低周波数帯域のサブバンドをビットプレーンに分割する量子化手段と、
復号器からのモード切替判定結果に基づいて、前記量子化手段からの出力のエントロピー符号化を行うエントロピー符号化手段と、
前記復号器からの前記モード切替判定結果に基づいて、前記量子化手段により取得した前記ビットプレーンについてWyner-Ziv符号化を行うSlepian-Wolf符号化手段と、
前記復号器から取得した前記モード判定結果に基づいて前記量子化手段からの出力を前記エントロピー符号化手段または、Slepian-Wolf符号化手段のいずれかに振り分けるデマルチプレクサと、を有し、
前記Slepian-Wolf符号化手段は、
前記復号器に、前記Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報のMSEを計算した結果、それらのMSEの中で最も小さなMSE(Mean Square Error)が得られる補助情報を該復号器から取得して符号化を行う手段を含み、
前記デマルチプレクサは、
前記復号器から取得した、低周波数帯域の復号済みサブバンドLLsの分散σと前記MSEが、σ<μMSE(但し、μは定数)の場合は、前記エントロピー符号化手段に符号化を指示し、σ≧μMSEの場合には、Wyner-Ziv符号化を行う前記Slepian-Wolf符号化手段に符号化を指示する手段を含む
ことを特徴とする画像符号化器。 An image encoder for encoding a moving image frame using a wavelet domain DVC,
Encoding means for encoding the input Key frame;
DWT (Discrete Wavelet Transform) that transforms the input Wyner-Ziv frame into the wavelet domain,
Quantizing means for quantizing the wavelet domain signal and dividing the subband of the lowest frequency band into bit planes;
Entropy encoding means for performing entropy encoding of the output from the quantization means based on the mode switching determination result from the decoder;
Based on the mode switching determination result from the decoder, Slepian-Wolf encoding means for performing Wyner-Ziv encoding on the bit plane acquired by the quantization means;
A demultiplexer that distributes the output from the quantization means to either the entropy encoding means or the Slepian-Wolf encoding means based on the mode determination result obtained from the decoder,
The Slepian-Wolf encoding means is
When the decoder has auxiliary information that is four subbands obtained by performing discrete wavelet transform on forward prediction, backward prediction, and bidirectional prediction of the Wyner-Ziv frame, As a result of calculating the decoded subband LL s of the frequency band and the MSE of each auxiliary information, auxiliary information that obtains the smallest MSE (Mean Square Error) among those MSEs is obtained from the decoder and encoded. Including means for performing
The demultiplexer
If the variance σ of the decoded subband LL s in the low frequency band obtained from the decoder and the MSE are σ <μMSE (where μ is a constant), the entropy encoding means is instructed to perform encoding. , Σ ≧ μMSE, an image encoder comprising means for instructing encoding to the Slepian-Wolf encoding means for performing Wyner-Ziv encoding.
入力されたKeyフレームを復号する復号手段と、
Wyner-Zivフレームについて、前向き予測、後ろ向き予測の両方向の予測による推定値をs回DWT変換することにより第sステージの最低周波数のサブバンドLL L である補助情報を生成する補助情報生成手段と、
前記Wyner-Zivフレームの最低周波数帯域のサブバンドを、前記補助情報を用いて再構成する再構成手段と、
前記Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs,高周波数帯域のサブバンドHHsを、それぞれ矩形の小ブロックに分割し、小ブロック毎にエントロピー符号化または、Wyner-Ziv符号化を行うかの判定を行い、モード判定結果を符号化器に送るモード判定手段と、
前記Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs,高周波数帯域のサブバンドHHsのフレーム内符号化されたブロックをエントロピー復号化するエントロピー復号化手段と、
Wyner-Ziv符号化されたブロックをSlepian-Wolf復号化するSlepian-Wolf復号化手段と、を有し、
前記Slepian-Wolf復号化手段は、
前記Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報のMSEを計算した結果、それらのMSEの中で最も小さなMSEが得られる補助情報を用いて復号化を行う手段を含み、
前記モード判定手段は、
前記低周波数帯域の復号済みサブバンドLLsの分散σと前記MSEが、σ<μMSE(但し、μは定数)の場合は、エントロピー符号化を行い、σ≧μMSEの場合には、Wyner-Ziv符号化を行うものと判定する手段を含む
ことを特徴とする画像復号化器。 An image decoder for decoding a moving image frame using a wavelet domain DVC,
Decryption means for decrypting the input Key frame;
For the Wyner-Ziv frame, auxiliary information generating means for generating auxiliary information that is the subband LL L of the lowest frequency of the s-stage by performing s times DWT conversion on the estimated value by the forward prediction and the backward prediction in both directions ,
Reconstructing means for reconstructing the subband of the lowest frequency band of the Wyner-Ziv frame using the auxiliary information;
The middle and high frequency band subbands LH s and HL s and the high frequency band subband HH s in the wavelet stage s of the Wyner-Ziv frame are each divided into rectangular small blocks, and entropy coding or , Mode determination means for determining whether to perform Wyner-Ziv encoding and sending a mode determination result to the encoder;
The Wyner-Ziv subbands high and high frequency bands in the wavelet first s stage frame LH s, and HL s, entropy decoding unit entropy decodes the coded blocks in the frame of the sub-band HH s in the high frequency band ,
And Slepian-Wolf decoding means for Slepian-Wolf decoding the Wyner-Ziv encoded block,
The Slepian-Wolf decoding means is:
When there is auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction and bi-directional prediction of the Wyner-Ziv frame, the low frequency band divided into small rectangular blocks has been decoded. As a result of calculating the MSE of the subband LL s and each auxiliary information, including means for decoding using the auxiliary information that can obtain the smallest MSE among those MSEs,
The mode determination means includes
If the variance σ of the decoded subband LL s in the low frequency band and the MSE are σ <μMSE (where μ is a constant), entropy coding is performed, and if σ ≧ μMSE, Wyner-Ziv picture decoder characterized in that it comprises means for determining as to perform encoding.
符号化手段が、入力されたKeyフレームを符号化する符号化ステップと、
DWTが、入力されたWyner-Zivフレームをウェーブレット領域に変換するウェーブレット変換ステップと、
量子化手段が、前記ウェーブレット領域の信号を量子化し、最低周波数帯域のサブバンドをビットプレーンに分割する量子化ステップと、
デマルチプレクサが、前記復号器からの前記モード判定結果に基づいて前記量子化手段からの出力を前記エントロピー符号化手段または、Slepian-Wolf符号化手段のいずれかに振り分ける振り分けステップと、
エントロピー符号化手段が、前記量子化手段からの出力のエントロピー符号化を行うエントロピー符号化ステップと、
Slepian-Wolf符号化手段が、前記復号器からの前記モード切替判定結果に基づいて、前記量子化手段により取得した前記ビットプレーンについてWyner-Ziv符号化を行うSlepian-Wolf符号化ステップと、を行い、
前記振り分けステップにおいて、
前記復号器に、前記Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報の相関を表す指標であるSADを取得し、該復号済みサブバンドLLのMADと該SADが、MAD<μSAD(但し、μは定数)の場合は、前記エントロピー符号化手段に符号化を指示し、MAD≧μSADの場合には、Wyner-Ziv符号化を行う前記Slepian-Wolf符号化手段に符号化を指示し、
前記Slepian-Wolf符号化ステップにおいて、
前記SADの中で最も小さな値のSADが得られる補助情報を該復号器から取得して符号化を行う
ことを特徴とする画像符号化方法。 An image encoding method for encoding a moving image frame using a wavelet domain DVC,
An encoding step in which the encoding means encodes the input Key frame;
A wavelet transform step in which DWT transforms the input Wyner-Ziv frame into a wavelet domain;
A quantization means for quantizing the signal in the wavelet domain and dividing a subband of the lowest frequency band into bit planes;
A demultiplexer that distributes the output from the quantization means to either the entropy encoding means or the Slepian-Wolf encoding means based on the mode determination result from the decoder;
An entropy encoding means for performing entropy encoding of the output from the quantization means;
Slepian-Wolf encoding means performs a Slepian-Wolf encoding step of performing Wyner-Ziv encoding on the bit plane acquired by the quantization means based on the mode switching determination result from the decoder. ,
In the sorting step,
When the decoder has auxiliary information that is four subbands obtained by performing discrete wavelet transform on forward prediction, backward prediction, and bidirectional prediction of the Wyner-Ziv frame, get the SAD is an index representing a correlation of the decoded subband LL s and the respective auxiliary information frequency band, MAD and the SAD of the decoded sub-band LL is, MAD <μSAD (but, mu is a constant) In this case, the entropy encoding means is instructed to encode, and in the case of MAD ≧ μSAD, the Slepian-Wolf encoding means for performing Wyner-Ziv encoding is instructed to encode ,
In the Slepian-Wolf encoding step,
An image encoding method characterized in that auxiliary information for obtaining a SAD having the smallest value among the SADs is acquired from the decoder and encoded.
復号手段が、入力されたKeyフレームを復号する復号ステップと、
補助情報生成手段が、Wyner-Zivフレームについて、前向き予測、後ろ向き予測の両方向の予測による推定値をs回DWT変換することにより第sステージの最低周波数のサブバンドLL L である補助情報を生成する補助情報生成ステップと、
再構成手段が、前記Wyner-Zivフレームの最低周波数帯域のサブバンドを、前記補助情報を用いて再構成する再構成ステップと、
モード判定手段が、前記Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs、高周波数帯域のサブバンドHHsを、それぞれ矩形の小ブロックに分割し、小ブロック毎にエントロピー符号化または、Wyner-Ziv符号化を行うかの判定を行い、モード判定結果を符号化器に送るモード判定ステップと、
エントロピー復号化手段が、前記Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs、高周波数帯域のサブバンドHHsのフレーム内符号化されたブロックをエントロピー復号化するエントロピー復号化ステップと、
Slepian-Wolf復号化手段が、Wyner-Ziv符号化されたブロックをSlepian-Wolf復号化するSlepian-Wolf復号化ステップと、を行い、
前記モード判定ステップにおいて、
前記Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報の相関を表す指標であるSADを取得し、該復号済みサブバンドLLsのMADと該SADが、MAD<μSAD(但し、μは定数)の場合は、エントロピー符号化を行い、MAD≧μSADの場合には、Wyner-Ziv符号化を行うものと判定し、
前記Slepian-Wolf復号化ステップにおいて、
前記SADの中で最も小さな値のSADが得られる補助情報を用いて復号化を行う、
ことを特徴とする画像復号化方法。 An image decoding method for decoding a moving image frame using a wavelet domain DVC,
A decoding step in which the decoding means decodes the input Key frame;
Auxiliary information generation means generates auxiliary information that is the subband LL L of the lowest frequency of the s-th stage by performing DWT transformation on the estimated value of the forward prediction and the backward prediction for the Wyner-Ziv frame s times. An auxiliary information generation step;
Reconstructing means for reconstructing a subband of the lowest frequency band of the Wyner-Ziv frame using the auxiliary information;
The mode determination means divides the subbands LH s and HL s of the medium and high frequency band and the subband HH s of the high frequency band in the wavelet s stage of the Wyner-Ziv frame into small rectangular blocks, and Determining whether to perform entropy encoding or Wyner-Ziv encoding, and sending a mode determination result to the encoder;
Entropy decoding means, the Wyner-Ziv subbands high and high frequency bands in the wavelet first s stage frame LH s, HL s, entropy decoding the intra-coded blocks of the subband HH s in the high frequency band Entropy decoding step,
Slepian-Wolf decoding means performs a Slepian-Wolf decoding step of Slepian-Wolf decoding a Wyner-Ziv encoded block;
In the mode determination step,
When there is auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction and bi-directional prediction of the Wyner-Ziv frame, the low frequency band divided into small rectangular blocks has been decoded. get the subband LL s and SAD is an index representing a correlation of the respective auxiliary information, MAD and the SAD of the decoded subband LL s is, MAD <If μSAD (but, mu is a constant), entropy If MAD ≧ μSAD, it is determined that Wyner-Ziv encoding is performed .
In the Slepian-Wolf decoding step,
Decoding is performed using auxiliary information from which the SAD having the smallest value among the SADs is obtained.
An image decoding method characterized by the above.
符号化手段が、入力されたKeyフレームを符号化する符号化ステップと、
DWTが、入力されたWyner-Zivフレームをウェーブレット領域に変換するウェーブレット変換ステップと、
量子化手段が、前記ウェーブレット領域の信号を量子化し、最低周波数帯域のサブバンドをビットプレーンに分割する量子化ステップと、
エントロピー符号化手段が、復号器からのモード切替判定結果に基づいて、前記量子化手段からの出力のエントロピー符号化を行うエントロピー符号化ステップと、
Slepian-Wolf復号化手段が、前記復号器からの前記モード切替判定結果に基づいて、前記量子化手段により取得した前記ビットプレーンについてWyner-Ziv符号化を行うSlepian-Wolf符号化ステップと、
デマルチプレクサが、前記復号器から取得した前記モード判定結果に基づいて前記量子化手段からの出力を前記エントロピー符号化手段または、Slepian-Wolf符号化手段のいずれかに振り分ける振り分けステップと、を行い、
前記振り分けステップにおいて、
前記復号器に、前記Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、該復号器から矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報のMSEを計算した結果を取得し、該復号済みサブバンドLLsの分散σと該MSEが、σ<μMSE(但し、μは定数)の場合は、前記エントロピー符号化手段に符号化を指示し、σ≧μMSEの場合には、Wyner-Ziv符号化を行う前記Slepian-Wolf符号化手段に符号化を指示し、
前記Slepian-Wolf符号化ステップにおいて、
前記MSEの中で最も小さなMSE(Mean Square Error)が得られる補助情報を該復号器から取得して符号化を行う、
ことを特徴とする画像符号化方法。 An image encoding method for encoding a moving image frame using a wavelet domain DVC,
An encoding step in which the encoding means encodes the input Key frame;
A wavelet transform step in which DWT transforms the input Wyner-Ziv frame into a wavelet domain;
A quantization means for quantizing the signal in the wavelet domain and dividing a subband of the lowest frequency band into bit planes;
An entropy encoding unit performs entropy encoding of an output from the quantization unit based on a mode switching determination result from a decoder; and
Slepian-Wolf encoding means, based on the mode switching determination result from the decoder, Slepian-Wolf encoding step for performing Wyner-Ziv encoding on the bit plane acquired by the quantization means;
A demultiplexer performs a distribution step of distributing the output from the quantization means to either the entropy encoding means or the Slepian-Wolf encoding means based on the mode determination result acquired from the decoder,
In the sorting step,
When the decoder has auxiliary information, which is four subbands obtained by performing discrete wavelet transform on forward prediction, backward prediction, and bidirectional prediction of the Wyner-Ziv frame, a small rectangular block is output from the decoder. the MSE of the divided low frequency band decoded subband LL s and each of the auxiliary information to obtain the result of calculation, the variance sigma and the MSE of the decoded subband LL s is, σ <μMSE (where, mu Is a constant), the encoding is instructed to the entropy encoding means, and in the case of σ ≧ μMSE, the encoding is instructed to the Slepian-Wolf encoding means for performing Wyner-Ziv encoding,
In the Slepian-Wolf encoding step,
Auxiliary information for obtaining the smallest MSE (Mean Square Error) in the MSE is obtained from the decoder and encoded.
An image encoding method characterized by the above.
復号手段が、入力されたKeyフレームを復号する復号ステップと、
補助情報生成手段が、Wyner-Zivフレームについて、前向き予測、後ろ向き予測の両方向の予測による推定値をs回DWT変換することにより第sステージの最低周波数のサブバンドLL L である補助情報を生成する補助情報生成ステップと、
再構成手段が、前記Wyner-Zivフレームの最低周波数帯域のサブバンドを、前記補助情報を用いて再構成する再構成ステップと、
モード判定手段が、前記Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs、高周波数帯域のサブバンドHHsを、それぞれ矩形の小ブロックに分割し、小ブロック毎にエントロピー符号化または、Wyner-Ziv符号化を行うかの判定を行い、モード判定結果を符号化器に送るモード判定ステップと、
エントロピー復号化手段が、前記Wyner-Zivフレームのウェーブレット第sステージにおける中高周波数帯域のサブバンドLHs,HLs、高周波数帯域のサブバンドHHsのフレーム内符号化されたブロックをエントロピー復号化するエントロピー復号化ステップと、
Slepian-Wolf復号化手段が、Wyner-Ziv符号化されたブロックをSlepian-Wolf復号化するSlepian-Wolf復号化ステップと、を行い、
前記モード判定ステップにおいて、
前記Wyner-Zivフレームの前向き予測、後ろ向き予測、両方向予測を離散ウェーブレット変換して得られた4つのサブバンドである補助情報がある場合に、矩形の小ブロックに分割された低周波数帯域の復号済みサブバンドLL s とそれぞれの補助情報のMSEを計算した結果を取得し、該復号済みサブバンドLLsの分散σと該MSEが、σ<μMSE(但し、μは定数)の場合は、エントロピー符号化を行い、σ≧μMSEの場合には、Wyner-Ziv符号化を行うものと判定し、
前記Slepian-Wolf復号化ステップにおいて、
前記MSEの中で最も小さなMSEが得られる補助情報を用いて復号化を行う、
ことを特徴とする画像復号化方法。 An image decoding method for decoding a moving image frame using a wavelet domain DVC,
A decoding step in which the decoding means decodes the input Key frame;
Auxiliary information generation means generates auxiliary information that is the subband LL L of the lowest frequency of the s-th stage by performing DWT transformation on the estimated value of the forward prediction and the backward prediction for the Wyner-Ziv frame s times. An auxiliary information generation step;
Reconstructing means for reconstructing a subband of the lowest frequency band of the Wyner-Ziv frame using the auxiliary information;
The mode determination means divides the subbands LH s and HL s of the medium and high frequency band and the subband HH s of the high frequency band in the wavelet s stage of the Wyner-Ziv frame into small rectangular blocks, and Determining whether to perform entropy encoding or Wyner-Ziv encoding, and sending a mode determination result to the encoder;
Entropy decoding means, the Wyner-Ziv subbands high and high frequency bands in the wavelet first s stage frame LH s, HL s, entropy decoding the intra-coded blocks of the subband HH s in the high frequency band Entropy decoding step,
Slepian-Wolf decoding means performs a Slepian-Wolf decoding step of Slepian-Wolf decoding a Wyner-Ziv encoded block ;
In the mode determination step,
When there is auxiliary information that is four subbands obtained by discrete wavelet transform of forward prediction, backward prediction and bi-directional prediction of the Wyner-Ziv frame, the low frequency band divided into small rectangular blocks has been decoded. Gets the results of calculating the subband LL s and MSE of each of the auxiliary information, the variance σ and the MSE of the decoded subband LL s is the case σ of <μMSE (where, mu is a constant), entropy coding If σ ≧ μMSE, it is determined that Wyner-Ziv encoding is performed ,
In the Slepian-Wolf decoding step,
Decoding using auxiliary information that provides the smallest MSE among the MSEs,
An image decoding method characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008147407A JP5004877B2 (en) | 2008-06-04 | 2008-06-04 | Image encoder, image decoder, image encoding method, image decoding method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008147407A JP5004877B2 (en) | 2008-06-04 | 2008-06-04 | Image encoder, image decoder, image encoding method, image decoding method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009296277A JP2009296277A (en) | 2009-12-17 |
JP5004877B2 true JP5004877B2 (en) | 2012-08-22 |
Family
ID=41544052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008147407A Expired - Fee Related JP5004877B2 (en) | 2008-06-04 | 2008-06-04 | Image encoder, image decoder, image encoding method, image decoding method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5004877B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5484377B2 (en) * | 2011-02-23 | 2014-05-07 | 日本電信電話株式会社 | Decoding device and decoding method |
JP5484378B2 (en) * | 2011-02-23 | 2014-05-07 | 日本電信電話株式会社 | Encoding apparatus, encoding and decoding system, encoding method, and encoding and decoding method |
US8428379B2 (en) * | 2011-08-25 | 2013-04-23 | Mitsubishi Electric Research Laboratories, Inc. | Method for distributed source coding of wavelet coefficients in zerotrees |
JP5811823B2 (en) * | 2011-12-12 | 2015-11-11 | 沖電気工業株式会社 | Video encoding apparatus, system, and program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7400774B2 (en) * | 2002-09-06 | 2008-07-15 | The Regents Of The University Of California | Encoding and decoding of digital data using cues derivable at a decoder |
US7860158B2 (en) * | 2004-08-27 | 2010-12-28 | Mitsubishi Electric Research Laboratories Inc. | Coding correlated images using syndrome bits |
US20060048038A1 (en) * | 2004-08-27 | 2006-03-02 | Yedidia Jonathan S | Compressing signals using serially-concatenated accumulate codes |
JP2007074306A (en) * | 2005-09-06 | 2007-03-22 | Nippon Telegr & Teleph Corp <Ntt> | Apparatus for generating supplementary pixel, decoding system, decoding method, image coding communication system, decoding program and computer-readable recording medium |
JP4515378B2 (en) * | 2005-11-14 | 2010-07-28 | 日本電信電話株式会社 | Image decoding apparatus, program, and computer-readable recording medium |
-
2008
- 2008-06-04 JP JP2008147407A patent/JP5004877B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009296277A (en) | 2009-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5957561B2 (en) | Video encoding / decoding method and apparatus using large size transform unit | |
KR100703749B1 (en) | Method for multi-layer video coding and decoding using residual re-estimation, and apparatus for the same | |
KR101425602B1 (en) | Method and apparatus for encoding/decoding image | |
JP4819024B2 (en) | Image encoding / decoding method and system | |
CN101107857A (en) | Fine granularity scalable video encoding and decoding method and apparatus capable of controlling deblocking | |
JP6210948B2 (en) | Image estimation method | |
KR102312337B1 (en) | AI encoding apparatus and operating method for the same, and AI decoding apparatus and operating method for the same | |
KR100843080B1 (en) | Video transcoding method and apparatus thereof | |
KR20100035364A (en) | Apparatus and method for distributed video encoding and decoding using adaptive quantization | |
Majid et al. | Visual saliency based redundancy allocation in HEVC compatible multiple description video coding | |
JP5004877B2 (en) | Image encoder, image decoder, image encoding method, image decoding method, and program | |
JP4515378B2 (en) | Image decoding apparatus, program, and computer-readable recording medium | |
KR100813001B1 (en) | Video Encoding and Decoding Apparatus and Methods using Separation of Amplitude and Sign of a differential image signal | |
KR20100082700A (en) | Wyner-ziv coding and decoding system and method | |
Taieb et al. | Spatial correlation-based side information refinement for distributed video coding | |
KR101146138B1 (en) | Temporal scalabel video encoder | |
Tonomura et al. | Distributed video coding using JPEG 2000 coding scheme | |
Badem et al. | Transform domain residual coding technique for distributed video coding | |
KR20110070687A (en) | Encoding apparatus and method capable of multi-dimension transforming and quantization, and decoding apparatus and method | |
Lee | Efficient bit rate control method for distributed video coding system | |
KR101653827B1 (en) | Apparatus of Video Coding, Apparatus of Video Decoding, Method of Video Coding and Method of Video Decoding | |
Miyazawa et al. | Coding efficiency improvement on distributed video coding utilizing super resolution approach | |
KR101307469B1 (en) | Video encoder, video decoder, video encoding method, and video decoding method | |
KR101334269B1 (en) | Method for distributed video encoding and decoding dependent on the number of bit planes | |
Chien et al. | AQT-DVC: adaptive quantization for transform-domain distributed video coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100817 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110726 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120515 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120522 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150601 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5004877 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |