JP4522951B2 - Moving picture encoding method and apparatus, decoding method and apparatus, moving picture processing program, and computer-readable recording medium - Google Patents
Moving picture encoding method and apparatus, decoding method and apparatus, moving picture processing program, and computer-readable recording medium Download PDFInfo
- Publication number
- JP4522951B2 JP4522951B2 JP2006007716A JP2006007716A JP4522951B2 JP 4522951 B2 JP4522951 B2 JP 4522951B2 JP 2006007716 A JP2006007716 A JP 2006007716A JP 2006007716 A JP2006007716 A JP 2006007716A JP 4522951 B2 JP4522951 B2 JP 4522951B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- decoding
- frame
- inter
- encoded data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、動画像符号化方法及び装置及び復号化方法及び装置及び動画像処理プログラム及びコンピュータ読み取り可能な記録媒体に係り、特に、動画像を効率よく伝送、復号するための動画像符号化方法及び装置及び復号化方法及び装置及び動画像処理プログラム及びコンピュータ読み取り可能な記録媒体に関する。 The present invention relates to a moving image encoding method and apparatus, a decoding method and apparatus, a moving image processing program, and a computer-readable recording medium, and in particular, a moving image encoding method for efficiently transmitting and decoding a moving image. The present invention relates to an apparatus, a decoding method and apparatus, a moving image processing program, and a computer-readable recording medium.
原画像を無歪みで再生できる可逆符号化は、医療、美術、印刷などの高精細な画像が要求される静止画像の領域において特に必要とされ、様々な手法が提案されている(例えば、非特許文献1,2,3参照)。
Lossless encoding that can reproduce an original image without distortion is particularly necessary in the field of still images that require high-definition images such as medical, art, and printing, and various methods have been proposed (for example, non-coding). (See
一方、動画像に対しては非可逆符号化の研究が活発に行われてきたが、近年はディジタル放送やディジタルシネマのアーカイブ、編集などにおいて動画像可逆符号化が必要とされている。 On the other hand, research on lossy coding has been actively conducted on moving images, but in recent years, lossless coding of moving images is required in digital broadcasting and digital cinema archiving and editing.
可逆符号化法は、静止画像を対象として様々な手法が提案されており、国際標準符号化としてJPEG-LS(非特許文献1参照)、JPEG2000ロスレスモード(非特許文献2参照)等の規格がある。 As the lossless encoding method, various methods have been proposed for still images. As international standard encoding, standards such as JPEG-LS (see Non-Patent Document 1), JPEG2000 lossless mode (see Non-Patent Document 2), and the like. is there.
JPEG-LSは、非線形予測符号化とコンテクストモデリングに基づく方式で画像の局所的性質変化に追従した予測が可能であり、JPEG2000ロスレスモードと比較して演算が高速で符号化効率に優れる(例えば、非特許文献4参照)。 JPEG-LS is a method based on non-linear predictive coding and context modeling that can predict changes following local changes in the image, and is faster and more efficient in coding than JPEG2000 lossless mode (for example, Non-patent document 4).
一方、JPEG2000は、解像度スケーラビリティやSNRスケーラビリティをはじめ画像の領域毎に圧縮率を可変にできるROI(Region Of Interest)機能などJPEG-LSにはない様々な高度な機能を持つ。 On the other hand, JPEG2000 has various advanced functions that JPEG-LS does not have, such as resolution scalability and SNR scalability, and ROI (Region Of Interest) function that can change the compression rate for each image area.
一方、符号化効率の観点からすると、フレーム間相関を利用することが望ましく、より高い圧縮率が得られると予想される。フレーム間相関を利用した可逆動画像符号化法は、解像度スケーラビリティ機能は持たないものの、フレーム間相関の除去に動き補償を用いて符号化効率を改善した手法である(例えば、非特許文献5,6参照)。
On the other hand, from the viewpoint of coding efficiency, it is desirable to use inter-frame correlation, and it is expected that a higher compression rate can be obtained. The lossless video coding method using inter-frame correlation is a technique that improves the coding efficiency by using motion compensation to remove inter-frame correlation, although it does not have a resolution scalability function (for example, Non-Patent
また、フレーム間相関を利用した可逆動画像符号化法は、解像度スケーラビリティ機能を有し、符号化効率に優れる機能がある(例えば、非特許文献7参照)。ウェーブレット変換と予測符号化を組み合わせたハイブリッド符号化であり、ウェーブレットの最低周波数帯域で適応的にフレーム内相関とフレーム間相関を除去し、低演算量で効率よくエントロピーを低減する。これは、自然画像が最低周波数帯域間でフレーム間相関が強く、それ以外の帯域では弱い性質を利用している。この方法は、多重解像度可逆ビデオ符号化法MLVC(Multiresolution Lossless Video Coding)と呼ばれている。 In addition, the lossless video encoding method using inter-frame correlation has a resolution scalability function and a function that is excellent in encoding efficiency (for example, see Non-Patent Document 7). It is a hybrid coding that combines wavelet transform and predictive coding, and adaptively removes intra-frame correlation and inter-frame correlation in the lowest frequency band of the wavelet, thereby efficiently reducing entropy with a small amount of computation. This utilizes the property that a natural image has a strong inter-frame correlation between the lowest frequency bands and is weak in other bands. This method is called multiresolution lossless video coding (MLVC).
一方で、各周波数帯域間のフレーム間相関は高い周波数帯域では弱い傾向にあるものの、その大きさは一定ではなく画像によって異なる。MLVCを拡張し対象画像の統計的性質に応じてフレーム内相関とフレーム間相関を除去する帯域を適応的に変化させることにより符号化効率を改善した手法が提案されている(例えば、非特許文献8参照)。 On the other hand, although the inter-frame correlation between the frequency bands tends to be weak in the high frequency band, the magnitude is not constant and varies depending on the image. A method has been proposed in which the encoding efficiency is improved by extending MLVC and adaptively changing the band for removing intra-frame correlation and inter-frame correlation according to the statistical properties of the target image (for example, non-patent literature) 8).
この方法は、多重解像度可変可逆ビデオ符号化法Ex-MLVC(Extended Multiresolution Lossless Video Coding)と呼ばれている。
しかしながら、MLVC、 Ex-MLVCの両手法とも、空間解像度スケーラビリティを有するものの、符号化データの効率的な伝送順序については規定していない。なお、空間解像度スケーラビリティを有するとは、一つの符号化ビットストリームから異なる空間解像度の画像を段階的に復号化可能であることを示す。 However, although both MLVC and Ex-MLVC methods have spatial resolution scalability, they do not define an efficient transmission order of encoded data. Note that having spatial resolution scalability indicates that images of different spatial resolutions can be decoded step by step from one encoded bit stream.
本発明は、上記の点に鑑みなされたもので、空間解像度スケーラビリティを有する動画像可逆符号化・復号化において、符号化データを効率的に伝送することが可能な動画像符号化方法及び装置及び復号化方法及び装置及び動画像処理プログラム及びコンピュータ読み取り可能な記録媒体を提供することを目的とする。 The present invention has been made in view of the above points, and a moving image encoding method and apparatus capable of efficiently transmitting encoded data in moving image lossless encoding / decoding having spatial resolution scalability, and It is an object to provide a decoding method and apparatus, a moving image processing program, and a computer-readable recording medium.
図1は、本発明の原理を説明するための図である。 FIG. 1 is a diagram for explaining the principle of the present invention.
本発明(請求項1)は、入力された原画像をウェーブレット変換により帯域分割し(ステップ1)、分割された帯域毎にフレーム内およびフレーム間予測を画素毎に行う動画像符号化方法であって、
復号化側において原画像と同じ解像度で再生する場合に、
符号化手段において、帯域分割手段により分割された帯域の符号化対象画素近傍信号のフレーム間相関が、所定の閾値より大きい場合には(ステップ2、Yes)、フレーム間予測を行い(ステップ3)、該フレーム間相関が所定の閾値より小さい場合には(ステップ2、No)、フレーム内予測を行い(ステップ4)、符号化する符号化ステップと、
Nを正の整数でウェーブレット分割レベル数おし、kを1以上N以下の整数として、符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に伝送する第1の伝送ステップ(ステップ5)と、
最低周波数帯域より高い周波数帯域HLk、LHk、HHkの符号化されたデータを2番目以降に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に伝送する第2の伝送ステップ(ステップ6)と、からなる。
The present invention (Claim 1) is a moving picture encoding method in which an input original image is band-divided by wavelet transform (step 1), and intra-frame and inter-frame prediction is performed for each pixel for each divided band. And
When playing back at the same resolution as the original image on the decoding side,
In the encoding means, inter-frame correlation of the band coded pixel neighborhood signal divided by the band dividing means, if greater than Jo Tokoro threshold performed (
For each encoded frame, where N is a positive integer, the number of wavelet division levels, and k is an integer between 1 and N,
A first transmission step (step 5) for transmitting encoded data of the lowest frequency band LLN first;
Second transmission step of transmitting encoded data of frequency bands HLk, LHk, and HHk higher than the lowest frequency band in order of increasing the ratio of the number of processing times to intra-frame prediction of inter-frame prediction of each band. (Step 6) .
本発明(請求項2)は、請求項1記載の動画像符号化方法により符号化されたデータを原画像と同じ解像度で再生するために復号する動画像復号化方法であって、
Nを正の整数でウェーブレット分割レベル数とし、kを1以上N以下の整数として、復号化手段において、符号化されたデータを符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に復号する第1の復号ステップ(ステップ7)と、
最低周波数帯域より高い周波数帯域HLk、LHk、HHkの符号化されたデータを2番目以降に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に復号する第2の復号ステップ(ステップ8)と、からなる。
The present invention (Claim 2) is a moving picture decoding method for decoding data encoded by the moving picture encoding method according to
With N being a positive integer and the number of wavelet division levels, and k being an integer of 1 to N, the decoding means encodes the encoded data for each encoded frame,
A first decoding step (step 7) for first decoding the encoded data of the lowest frequency band LLN;
Second decoding step of decoding encoded data of frequency bands HLk, LHk, and HHk higher than the lowest frequency band in order from the second to the largest in the ratio of the number of processing times to intra-frame prediction of inter-frame prediction of each band (Step 8) .
本発明(請求項3)は、入力された原画像をウェーブレット変換により帯域分割し、分割された帯域毎にフレーム内およびフレーム間予測を画素毎に行う動画像符号化方法であって、
復号化側において原画像の1/2n倍の解像度毎に段階的に再生する場合に、
符号化手段において、帯域分割手段により分割された帯域の符号化対象画素近傍信号のフレーム間相関が所定の閾値より大きい場合には、フレーム間予測を行い、該フレーム間相関が所定の閾値より小さい場合には、フレーム内予測を行い、符号化する符号化ステップと、
Nを正の整数でウェーブレット分割レベル数とし、kを1以上(N−1)以下の整数として、符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に伝送する第1の伝送ステップと、
第Nレベルの3つの周波数帯域HLN、LHN、HHNの符号化されたデータを2ないし4番目に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に伝送する第2の伝送ステップと、
第Nレベルの3つの周波数帯域HLN、LHN、HHNより高い周波数帯域HLk、LHk、HHkの符号化されたデータを5番目以降に、低周波数帯域から高周波数帯域の順にレベル毎に、かつ同一レベル内では、HLk、LHk、HHkの順番に伝送する第3の伝送ステップと、からなる。
The present invention (Claim 3) is a moving image encoding method for dividing an input original image by wavelet transform and performing intra-frame and inter-frame prediction for each divided band for each pixel,
When playing back in stages for each resolution of 1/2 n times the original image on the decoding side,
In the encoding means, when the inter-frame correlation of the encoding target pixel neighboring signal in the band divided by the band dividing means is larger than a predetermined threshold, inter-frame prediction is performed, and the inter-frame correlation is smaller than the predetermined threshold. A coding step of performing intra-frame prediction and coding;
For each encoded frame, where N is a positive integer and the number of wavelet division levels, and k is an integer between 1 and (N−1),
A first transmission step of transmitting encoded data of the lowest frequency band LLN first;
The encoded data of the three frequency bands HLN, LHN, and HHN of the Nth level are transmitted from the second to the fourth, in the order of the ratio of the number of processing times with respect to the intraframe prediction of the interframe prediction of each band. A transmission step;
Three frequency bands HLN of the N levels, LHN, HHN higher frequency band HLk, LHk, the fifth and subsequent encoded data for HHK, for each level in order of the high frequency band from a low frequency band, and the same level Includes a third transmission step for transmitting in the order of HLk, LHk, and HHk.
本発明(請求項4)は、請求項3記載の動画像符号化方法により符号化されたデータを原画像の1/2n倍の解像度毎に段階的に再生するために復号する動画像復号化方法であって、
Nを正の整数でウェーブレット分割レベル数とし、kを1以上(N−1)以下の整数として、復号化手段において、符号化されたデータを符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に復号する第1の復号ステップと、
第Nレベルの3つの周波数帯域HLN、LHN、HHNの符号化されたデータを2ないし4番目に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に復号する第2の復号ステップと、
第Nレベルの3つの周波数帯域HLN、LHN、HHNより高い周波数帯域HLk、LHk、HHkの符号化されたデータを5番目以降に、低周波数帯域から高周波数帯域の順にレベル毎に、かつ同一レベル内ではHLk、LHk、HHkの順番に復号する第3の復号ステップと、からなる。
The present invention (Claim 4) is a moving picture decoding for decoding data encoded by the moving picture encoding method according to claim 3 in order to reproduce it step by step at a resolution of 1/2 n times the original image. A method of
With N being a positive integer and the number of wavelet division levels, and k being an integer not less than 1 and not more than (N−1), the decoding means encodes the encoded data for each encoded frame.
A first decoding step of first decoding encoded data of the lowest frequency band LLN;
Three frequency bands HLN of the N levels, LHN, 4th 2 to the encoded data HHN, the Gosuru restored sequentially ratio of the number of processing times is larger for the intra prediction of the prediction between bands of the
Three frequency bands HLN of the N levels, LHN, HHN higher frequency band HLk, LHk, the fifth and subsequent encoded data for HHK, for each level in order of the high frequency band from a low frequency band, and the same level Includes a third decoding step for decoding in the order of HLk, LHk, and HHk.
図2は、本発明の原理構成図である。 FIG. 2 is a principle configuration diagram of the present invention.
本発明(請求項5)は、入力された原画像をウェーブレット変換により帯域分割する帯域分割手段20を有し、分割された帯域毎にフレーム内およびフレーム間予測を画素毎に行う動画像符号化装置であって、
復号化側において原画像と同じ解像度で再生する場合に、
帯域分割手段20により分割された帯域の符号化対象画素近傍信号のフレーム間相関が所定の閾値より大きい場合には、フレーム間予測を行い、該フレーム間相関が所定の閾値より小さい場合には、フレーム内予測を行い、符号化する符号化手段30と、
Nを正の整数でウェーブレット分割レベル数とし、kを1以上N以下の整数として、符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に伝送する第1の伝送手段51と、
最低周波数帯域より高い周波数帯域HLk、LHk、HHkの符号化されたデータを2番目以降に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に伝送する第2の伝送手段52と、を有する。
The present invention (Claim 5) has a band dividing means 20 for dividing a band of an input original image by wavelet transform, and performs moving picture coding for performing intra-frame and inter-frame prediction for each divided band for each pixel. A device,
When playing back at the same resolution as the original image on the decoding side,
If the inter-frame correlation of the divided band coded pixel sensor signal of the band dividing means 20 is constant greater than threshold Tokoro performs interframe prediction, if between the frame correlation is smaller than the predetermined threshold Encoding means 30 for performing intra-frame prediction and encoding;
For each encoded frame, where N is a positive integer and the number of wavelet division levels, and k is an integer between 1 and N,
A first transmission means 51 for first transmitting encoded data of the lowest frequency band LLN;
Second transmission means for transmitting encoded data of frequency bands HLk, LHk, and HHk higher than the lowest frequency band in order from the second to the largest in the ratio of the number of processing times to intra-frame prediction of inter-frame prediction of each
本発明(請求項6)は、請求項5記載の動画像符号化装置により符号化されたデータを原画像と同じ解像度で再生するために復号する動画像復号化装置であって、
Nを正の整数でウェーブレット分割レベル数とし、kを1以上N以下の整数として、符号化されたデータを符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に復号する第1の復号手段61と、
最低周波数帯域より高い周波数帯域HLk、LHk、HHkの符号化されたデータを2番目以降に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に復号する第2の復号手段62と、を有する。
The present invention (Claim 6) is a moving picture decoding apparatus for decoding data encoded by the moving picture encoding apparatus according to
For each frame in which the encoded data is encoded, where N is a positive integer and the number of wavelet division levels, k is an integer between 1 and N ,
First decoding means 61 for first decoding encoded data of the lowest frequency band LLN;
Second decoding means for decoding the encoded data of the frequency bands HLk, LHk, and HHk higher than the lowest frequency band in the descending order of the ratio of the number of processing times to intra-frame prediction of inter-frame prediction of each band. 62 .
本発明(請求項7)は、入力された原画像をウェーブレット変換により帯域分割する帯域分割手段を有し、分割された帯域毎にフレーム内およびフレーム間予測を画素毎に行う動画像符号化装置であって、
復号側において原画像の1/2n倍の解像度毎に段階的に再生する場合に、
帯域分割手段により分割された帯域の符号化対象画素近傍信号のフレーム間相関が所定の閾値より大きい場合には、フレーム間予測を行い、該フレーム間相関が所定の閾値より小さい場合には、フレーム内予測を行い、符号化する符号化手段と、
Nを正の整数でウェーブレット分割レベル数とし、kを1以上(N−1)以下の整数として、符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に伝送する第1の伝送手段と、
第Nレベルの3つの周波数帯域HLN、LHN、HHNの符号化されたデータを2ないし4番目に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に伝送する第2の伝送手段と、
第Nレベルの3つの周波数帯域HLN、LHN、HHNより高い周波数帯域HLk、LHk、HHkの符号化されたデータを5番目以降に、低周波数帯域から高周波数帯域の順にレベル毎に、かつ同一レベル内では、HLk、LHk、HHkの順番に伝送する第3の伝送手段と、を有する。
The present invention (Claim 7) has a band dividing means for dividing an input original image into bands by wavelet transform, and a moving picture coding apparatus that performs intra-frame and inter-frame prediction for each divided band for each pixel. Because
When playing back in stages for each resolution of 1/2 n times the original image on the decoding side,
When the inter-frame correlation of the encoding target pixel neighborhood signal of the band divided by the band dividing unit is larger than a predetermined threshold, inter-frame prediction is performed, and when the inter-frame correlation is smaller than the predetermined threshold, Encoding means for performing intra prediction and encoding;
For each encoded frame, where N is a positive integer and the number of wavelet division levels, and k is an integer between 1 and (N−1),
First transmission means for transmitting encoded data of the lowest frequency band LLN first;
The encoded data of the three frequency bands HLN, LHN, and HHN of the Nth level are transmitted from the second to the fourth, in the order of the ratio of the number of processing times with respect to the intraframe prediction of the interframe prediction of each band. Transmission means;
Three frequency bands HLN of the N levels, LHN, HHN higher frequency band HLk, LHk, the fifth and subsequent encoded data for HHK, for each level in order of the high frequency band from a low frequency band, and the same level Includes third transmission means for transmitting in the order of HLk, LHk, and HHk.
本発明(請求項8)は、請求項7記載の動画像符号化装置により符号化されたデータを原画像の1/2n倍の解像度に段階的に再生するために復号する動画像復号化装置であって、
Nを正の整数でウェーブレット分割レベル数とし、kを1以上(N−1)以下の整数として、符号化されたデータを符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に復号する第1の復号手段と、
第Nレベルの3つの周波数帯域HLN、LHN、HHNの符号化されたデータを2ないし4番目に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に復号する第2の復号手段と、
第Nレベルの3つの周波数帯域HLN、LHN、HHNより高い周波数帯域HLk、LHk、HHkの符号化されたデータを5番目以降に、低周波数帯域から高周波数帯域の順にレベル毎に、かつ、同一レベル内ではHLk、LHk、HHkの順番に復号する第3の復号手段と、を有する。
According to the present invention (Claim 8), video decoding is performed so that the data encoded by the video encoding apparatus according to Claim 7 is decoded so as to be reproduced stepwise to a resolution of 1/2 n times the original image. A device,
For each frame in which the encoded data is encoded, where N is a positive integer and the number of wavelet division levels, k is an integer of 1 to (N-1),
First decoding means for first decoding the encoded data of the lowest frequency band LLN;
Decode second to fourth encoded data of the three frequency bands HLN, LHN, and HHN of the Nth level in descending order of the ratio of the number of processing times to intraframe prediction of interframe prediction of each band Decryption means;
The encoded data of the frequency bands HLk, LHk, and HHk higher than the three frequency bands HLN, LHN, and HHN of the Nth level are the same for each level in the order from the fifth frequency band to the high frequency band. Within the level , there is a third decoding means for decoding in the order of HLk, LHk, and HHk.
本発明(請求項9)は、コンピュータを、請求項5乃至8のいずれか1項に記載の動画像処理装置として機能させる動画像処理プログラムである。
The present invention (Claim 9) is a moving image processing program that causes a computer to function as the moving image processing apparatus according to any one of
本発明(請求項10)は、コンピュータを、請求項5乃至8のいずれか1項に記載の動画像処理装置として機能させるプログラムを格納したコンピュータ読み取り可能な記録媒体である。
The present invention (Claim 10) is a computer-readable recording medium storing a program that causes a computer to function as the moving image processing apparatus according to any one of
上記のように本発明によれば、空間解像度スケーラビリティを有する動画像可逆符号化方法・復号化方法において、符号化データの効率的な段階的伝送を実現することができる。 As described above, according to the present invention, efficient stepwise transmission of encoded data can be realized in a moving image lossless encoding method / decoding method having spatial resolution scalability.
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[第1の実施の形態]
本実施の形態では、Ex-MLVCにおける符号化データの効率的な段階的伝送方法について説明する。以下では、Ex-MLVCの基礎であるMLVCの可逆符号化器を用いて説明する。
[First embodiment]
In the present embodiment, an efficient stepwise transmission method of encoded data in Ex-MLVC will be described. In the following, description will be made using the MLVC lossless encoder which is the basis of Ex-MLVC.
図3は、本発明の第1の実施の形態におけるMLVCの可逆符号化器の構成を示す。 FIG. 3 shows the configuration of the MLVC lossless encoder according to the first embodiment of the present invention.
同図に示すMLVC可逆符号化器は、可逆カラー変換部10、可逆ウェーブレット変換部20、時空間適応予測符号化部30、エントロピー符号化部40及び多重化部50から構成される。
The MLVC lossless encoder shown in the figure includes a lossless
可逆カラー変換部10は、入力された原画像のカラー成分間の相関を減少させ、その信号を可逆ウェーブレット変換部20に出力する。
The reversible
可逆ウェーブレット変換部20は、可逆フィルタを用いて、入力された動画像の信号を帯域分割し、解像度スケーラビリティを実現すると共に、フレーム内相関を減少させ、最低周波数帯域を時空間適用予測符号化部30に出力し、最低周波数帯域以外はエントロピー符号化部40に出力する。最低周波数帯域以外の信号については、フレーム間相関が弱く、時間計算の増加に対する符号化効率の向上率が小さいことを考慮して時空間適応予測符号化は行わない。
The reversible
時空間適応予測符号化部30は、符号化対象画素近傍信号のフレーム間相関が所定の値より大きい場合はフレーム間予測を行い、フレーム間創刊が所定の値より小さい場合にはフレーム内予測を行い符号化し、多重化部50に出力する。
The space-time adaptive
エントロピー符号化部40は、最低周波数帯域以外の信号に対してはエントロピー符号化を行い、多重化部50に出力する。
The
多重化部50は、時空間適応予測符号化部30とエントロピー符号化部40からの信号を多重化して、符号化ビットストリームを復号化器に出力する。
The multiplexing
本実施の形態では、ランダムアクセス機能を実現するために、適当な間隔でフレーム内符号化(Inter-coded picture:Iフレーム)を行う。フレーム内符号化間の画像の集まりはGOP(Group Of Pictures)と呼ばれ、本実施の形態では、フレーム内符号化とフレーム間予測符号化フレーム(Predictive-coded picture:Pフレーム)の2種類のフレームにより構成する。 In this embodiment, in order to realize a random access function, intra-frame coding (Inter-coded picture: I frame) is performed at an appropriate interval. A collection of images between intra-frame coding is called GOP (Group Of Pictures), and in this embodiment, two types of intra-frame coding and inter-frame prediction coded frames (predictive-coded pictures: P frames) are used. Consists of frames.
本実施の形態では、解像度スケーラビリティ実現の容易さから、可逆ウェーブレット変換部20の変換方式としてウェーブレットを用いる。可逆符号化を実現するために、(5,3)可逆フィルタ(例えば、A.R. Calderbank et. al., "Wavelet transforms that map integers to integers," vol. E85-A, no.8, pp.1822-1830, Aug. 2002.)を使用し、画像の縦横方向で同一のものを用いる。ウェーブレット分割の方法は、1次元ウェーブレット変換を画像の縦横各方向に独立に施すことにより画像を4つの周波数帯域に分割し、最低周波数を担う周波数帯域を再帰的に4つの周波数帯域に分割するMallat分割(例えば、S.G. Mallat, "A Theory for multiresolution signal decomposition: The wavelet representation," IEEE Trans. Pattern Analysis & Machine Intelligence, vol. 11, pp. 674-693, July 1989)を用いる。
In this embodiment, a wavelet is used as the conversion method of the reversible
図4に2レベルのMallat分割の例を示す。当該可逆ウェーブレット変換部20では、最低周波数帯域(LL)の信号を時空間適応予測符号化部30に出力し、それ以外の帯域の信号をエントロピー符号化部40に出力する。
FIG. 4 shows an example of two-level Mallat division. The reversible
可逆符号化に関する静止画像国際標準規格JPEG-LSは、非線形予測符号化とコンテクストモデリングに基づく方式で画像の局所的な性質変化に追従した予測が可能であり、JPEG2000ロスレスモードと比較して演算が高速で符号化効率に優れることが知られている。MLVCでは、JPEG-LSで用いられている非線形予測器を3次元間予測に拡張することにより、高い符号化効率を実現している。 JPEG-LS, the international standard for still images related to lossless encoding, is capable of prediction that follows changes in local properties of an image using a method based on nonlinear predictive encoding and context modeling. Compared with JPEG2000 lossless mode, It is known that the coding efficiency is excellent at high speed. MLVC achieves high coding efficiency by extending the nonlinear predictor used in JPEG-LS to inter-dimensional prediction.
MLVCの時空間適応予測符号化部30は、図5に示すような構成を有する。時空間適応予測符号化部30は、2次元予測器31、3次元予測器32、動き推定部33、相関係数計算部34、シフト演算子35、エントロピー符号化部36から構成され、予測符号化法を最低周波数帯域の信号に適用する。Iフレームおいては、2次元予測器31(フレーム内相関を除去)を適用する。また、符号化効率を高めるため、Pフレームにおいては、2次元予測器31と3次元予測器32(フレーム内相関とフレーム間相関を同時に除去)を適応的に切り替え、残差信号を生成する。MLVCでは、この方法を「時空間適応予測符号化」と呼ぶ。
The MLVC spatio-temporal adaptive
当該時空間適応予測符号化部30における2次元予測器31と3次元予測器32の切り換えは、相関係数計算部34において、図6に示す現フレームa内の近傍信号値x1〜x4と参照フレームb内の近傍信号値y1〜y4の相関係数Rを計算して決定する。ここでy1〜y4は、動き推定部33の動き推定の結果をもとにシフト演算子35によりシフトした信号列を用いる。相関係数計算部34において相関係数を求め、相関係数がある閾値Th以上の場合、フレーム間相関が大きいと判断し、3次元予測器32を用いる。それ以外は2次元予測器31を用いる。
Switching between the two-
つまり、
・相関係数R<Thの場合は2次元予測器31を用いる。
・相関係数R≧Thの場合は3次元予測器32を用いる。
That means
When the correlation coefficient R < Th , the two-
• For the correlation coefficient R ≧ T h is used three-
但し、 However,
1)2次元予測:
本発明では、画像の局所的な性質変化に追従した予測を行うため、予め用意された複数の予測器を適応的に切り替える非線形予測器を用いる。ここでは、JPEG-LSと同じ非線形予測器を利用する。JPEG-LSでは、3種類の予測器を、符号化対象画素近傍信号の状態により切り換え、残差信号を生成する。縦方向及び横方向にエッジがあると判断された場合は、それぞれのエッジ方向に隣接する1画素を用いて予測し、輝度変化が滑らかであると判断した場合は隣接する3画素を用いて予測する。
1) Two-dimensional prediction:
In the present invention, a non-linear predictor that adaptively switches among a plurality of predictors prepared in advance is used in order to perform prediction following a local property change of an image. Here, the same nonlinear predictor as JPEG-LS is used. In JPEG-LS, three types of predictors are switched according to the state of the encoding target pixel neighborhood signal to generate a residual signal. When it is determined that there are edges in the vertical direction and the horizontal direction, prediction is performed using one pixel adjacent to each edge direction, and when it is determined that the luminance change is smooth, prediction is performed using three adjacent pixels. To do.
2)3次元予測:
3次元予測の場合にも2次元予測と同様に、符号化対象画素の近傍信号値の状態により予測器を切り換える非線形予測を行う。縦方向または横方向にエッジがあると判断された場合は、現フレームa及び参照フレームbのそれぞれのエッジ方向に隣接する信号を用いて予測する。エッジの方向は、参照フレームbの縦方向の差分絶対値│y0−y3│と横方向の差分絶対値│y0−y1│を比較して、ある閾値よりも大きい方向をエッジと判断する。縦方向のエッジ(以下の条件iの場合)と判断された場合は、現フレームa及び参照フレームbとの縦方向の信号x3,y0,y3に関して、2次元予測と同様な方法で予測信号を選択する。横方向のエッジ(以下の条件iiの場合)の場合も同様な方法で予測器を選択する。エッジでないと判断された場合には、近傍の3画素(x1,x3,y0)の平均値を予測値とする。
2) 3D prediction:
In the case of three-dimensional prediction, similarly to the two-dimensional prediction, non-linear prediction is performed in which the predictor is switched depending on the state of the neighborhood signal value of the pixel to be encoded. When it is determined that there is an edge in the vertical direction or the horizontal direction, prediction is performed using signals adjacent to each edge direction of the current frame a and the reference frame b. As for the edge direction, the absolute difference value | y 0 −y 3 | in the vertical direction of the reference frame b is compared with the absolute difference value | y 0 −y 1 | in the horizontal direction. to decide. When it is determined that the edge is in the vertical direction (in the case of the following condition i), the vertical signals x 3 , y 0 , and y 3 with the current frame a and the reference frame b are processed in the same manner as in the two-dimensional prediction. Select the prediction signal. In the case of a horizontal edge (in the case of condition ii below), a predictor is selected by the same method. If it is determined not to be an edge, the average value of three neighboring pixels (x 1 , x 3 , y 0 ) is used as the predicted value.
条件i:│y0−y1│−│y0−y3│>Tの場合: Condition i: When │y 0 -y 1 │-│y 0 -y 3 │> T:
Ex-MLVCでは、更なる符号化効率の向上を目的として、時空間適応予測符号化の適応帯域を画像の統計的性質に応じて適応的に変化させるモデルを提供している。 Ex-MLVC provides a model that adaptively changes the adaptive band of spatio-temporal adaptive predictive coding according to the statistical properties of the image for the purpose of further improving the coding efficiency.
Ex-MLVCでは、最低周波数帯域については、MLVCと同様に、時空間適応予測符号化部30で時空間適応予測処理を行い、それ以外の帯域においては、フレーム間相関が強い帯域では、時空間適応予測処理を行い、弱い帯域ではエントロピー符号化部30でウェーブレット係数を直接符号化する。但し、
1)計算量をできるだけ低く抑え、
2)付加情報量をなくす、
ために各帯域において直接フレーム間相関は計算しない。
In Ex-MLVC, for the lowest frequency band, the spatio-temporal adaptive
1) Keep the amount of calculation as low as possible,
2) Eliminate the amount of additional information
Therefore, the inter-frame correlation is not directly calculated in each band.
図7に示すように、ウェーブレット係数が最低周波数帯域を基準にして同一方向の帯域間には相関があることを利用して、1レベル低い周波数帯域での3次元予測と2次元予測の処理回数の比率に応じて切り換えを行う。 As shown in FIG. 7, using the fact that wavelet coefficients have a correlation between bands in the same direction with reference to the lowest frequency band, the number of processing times of three-dimensional prediction and two-dimensional prediction in a frequency band one level lower Switching is performed according to the ratio.
1)1レベル低周波数帯のRinter≧THの場合は、時空間適応予測を行う。 1) When R inter ≧ TH in the 1-level low frequency band, space-time adaptive prediction is performed.
2)1レベル低周波数帯のRinter<THの場合は、ウェーブレット係数符号化を行う。
但し、
2) When R inter <TH in the 1-level low frequency band, wavelet coefficient coding is performed.
However,
Rinterの値が大きい場合は、3次元予測器32の処理回数が多いことを表す。即ち、フレーム間相関が強いことを意味している。また、上記の1)、2)のTHは所定の閾値を表す。
When the value of R inter is large, it indicates that the number of processing times of the three-
次に、帯域単位処理手順について説明する。 Next, the bandwidth unit processing procedure will be described.
可逆ウェーブレット変換部20におけるウェーブレット分割レベル数が「2」の場合を例に説明する。
The case where the number of wavelet division levels in the reversible
図8は、本発明の第1の実施の形態における時空間適応予測の帯域単位処理を説明するための図(帯域分割=2レベル)である。同図に示す矢印の方向に向かって、時空間適応予測処理を行うか否かを判断する。 FIG. 8 is a diagram (band division = 2 levels) for explaining band unit processing of space-time adaptive prediction in the first embodiment of the present invention. It is determined whether or not the spatiotemporal adaptive prediction processing is performed in the direction of the arrow shown in FIG.
図9は、本発明の第1の実施の形態における帯域単位の処理手順を示す。 FIG. 9 shows a processing procedure for each band in the first embodiment of the present invention.
まず、最初に、Ex-MLVCでは、最低周波数帯域LL2においては、MLVCと同様に時空間適応予測符号化部30で時空間適応予測処理を行う。全ての処理が終了後、Rinterを計算する(ステップ101)。
First, in Ex-MLVC, in the lowest frequency band LL2, the space-time adaptive
RInter≧THの場合(ステップ102、Yes)、HL2、LH2、HH2帯域において時空間適応予測処理を行う(ステップ103,106,109)。RInter<THの場合(ステップ102、No)は終了する。
When R Inter ≧ TH (
時空間適応予測処理を行った場合は、時空間適用予測符号化部30の相関係数計算部34において、HL2、LH2、HH2帯域のそれぞれについて、RInterを計算する。それぞれの帯域においてRInter≧THの条件を満たすか否かを判断し(ステップ104,107,110)、HL1、LH1、HH1帯域において時空間適用予測処理を行うかどうかを決定する。
When the spatiotemporal adaptive prediction process is performed, the correlation
次に、小ブロック単位処理手順について説明する。 Next, the small block unit processing procedure will be described.
ウェーブレット変換領域おいては、各周波数帯の同じ空間位置に対応する成分は相関が強いことが知られている。この性質を利用して、小ブロック単位で時空間適用予測を行うかどうかの判断を行う。 In the wavelet transform region, it is known that components corresponding to the same spatial position in each frequency band have a strong correlation. Using this property, it is determined whether to perform space-time application prediction in small blocks.
図10は、本発明の第1の実施の形態における時空間適応予測ブロック単位の処理を説明するための図である。同図では、分割レベル数が「2」の場合の処理方向を示している。 FIG. 10 is a diagram for explaining processing in units of space-time adaptive prediction blocks in the first embodiment of the present invention. In the figure, the processing direction when the number of division levels is “2” is shown.
図11は、本発明の第1の実施の形態におけるブロック単位の処理手順を示す。 FIG. 11 shows a processing procedure for each block in the first embodiment of the present invention.
処理手順は、図9に示す方法をブロック毎に行い、全ブロック数(N)になるまで繰り返す。 For the processing procedure, the method shown in FIG. 9 is performed for each block and is repeated until the total number of blocks (N) is reached.
これにより、画像の局所的性質に追従させることが可能となり、符号化効率が改善する。 Thereby, it becomes possible to follow the local property of the image, and the coding efficiency is improved.
以上の帯域単位処理または小ブロック単位処理により生成された残差信号またはウェーブレット係数は、エントロピー符号化部40により、符号化データとして出力される。
The residual signal or wavelet coefficient generated by the above band unit processing or small block unit processing is output as encoded data by the
Ex-MLVCでは、スケーラビリティ機能により伝送時や復号時の時間優先度を自由に設定できる。スケーラビリティの単位として、C:色、R:空間解像度の2つを定義している。 In Ex-MLVC, the time priority at the time of transmission and decoding can be freely set by the scalability function. Two scalability units are defined: C: color and R: spatial resolution.
図12は、本発明の第1の実施の形態における空間解像度を優先的に並べたRC構造の例を示す。但し、これは1例であり、LLやHHなどの各成分をどのような順序で、符号化器による伝送あるいは、復号化器で復号するかはユーザに任されており、Ex-MLVCでは規定していない。ここでは、空間解像度の各成分(LL2、HL2、LH2、…)を効率よく、伝送並びに復号する順序について述べる。本発明では、空間解像度スケーラビリティを実現する際に、
1)原画像と同じ解像度で再生する場合;
2)原画像の1/2n倍の解像度毎に段階的に再生する場合;
の2つの技術を提供する。
FIG. 12 shows an example of an RC structure in which the spatial resolutions are preferentially arranged in the first embodiment of the present invention. However, this is an example, and it is up to the user to determine the order in which the components such as LL and HH are transmitted by the encoder or decoded by the decoder. Not done. Here, the order in which each component (LL2, HL2, LH2,...) Of spatial resolution is efficiently transmitted and decoded will be described. In the present invention, when realizing spatial resolution scalability,
1) When playing back at the same resolution as the original image;
2) When reproducing in stages at resolutions of 1/2 n times the original image;
The following two technologies are provided.
まず、本実施の形態では、上記の1)の場合について説明する。 First, in the present embodiment, the above case 1) will be described.
Iピクチャの場合、その伝送(符号化器)または復号(復号化器)する順序は固定であり、以下の2つの条件を満たすように並べる。 In the case of an I picture, the transmission (encoder) or decoding (decoder) order is fixed, and the pictures are arranged so as to satisfy the following two conditions.
・低周波数帯域から高周波数帯域;
・同一レベル内の周波数帯域では、HL→LH→HH;
図12(a)にはウェーブレットレベル=2の場合のRCデータ構造を示す。図13(a)には、図12(a)に対応するウェーブレット領域での順序を示す。
・ Low frequency band to high frequency band;
・ In frequency band within the same level , HL → LH → HH;
FIG. 12A shows an RC data structure when the wavelet level = 2. FIG. 13A shows the order in the wavelet region corresponding to FIG.
また、Pピクチャの場合は、以下の条件を満たすように並べ替えを行う。 In the case of a P picture, rearrangement is performed so as to satisfy the following conditions.
・1番目は、最低周波数帯域LLN(但し、Nは正の整数でウェーブレット分割レベル数);
・2番目以降の周波数帯域は、RInterの降順;
即ち、符号化器の多重化部50から伝送(出力)する際には、予めメモリ等に格納された上記の条件を参照して、最低周波数帯域LLN以外は、RInterが大きい周波数帯域ほど先に伝送する。同様に、復号化器でも、予め上記の条件が格納されたメモリ等を参照して、最低周波数帯域LLN以外は、RInterが大きい周波数帯域ほど先に復号する。
-The first is the lowest frequency band LLN (where N is a positive integer and the number of wavelet division levels);
・ The second and subsequent frequency bands are in descending order of R Inter ;
That is, in transmitting from the multiplexing
ここで、RInterは、3次元予測器32及び2次元予測器31の処理回数比率を表し、RInterが大きいほど、3次元予測器32の処理回数が多いことを意味している。即ち、上記の条件は、3次元予測器32が2次元予測器31よりも符号化効率に大きく寄与することを前提としている。
Here, R Inter represents the ratio of the number of processing times of the three-
ウェーブレット分割レベル数が「2」で、RInterの大きさに関して、
・HL2→LH2→HL1→HH2→LH1→HH1
の場合、周波数帯域の伝送または復号の順序は、図12(b)ならびに、図13(b)のようになる。
Number wavelet division level is "2", with respect to the size of the R Inter,
・ HL2 → LH2 → HL1 → HH2 → LH1 → HH1
In this case, the order of frequency band transmission or decoding is as shown in FIG. 12B and FIG. 13B.
[第2の実施の形態]
第2の実施の形態として、上記の空間解像度スケーラビリティを実現する際の「2)の原画像の1/2nの解像度毎に段階的に再生する場合」について説明する。
[Second Embodiment]
As the second embodiment, a case of “2) stepwise reproduction for each 1/2 n resolution of the original image when realizing the spatial resolution scalability” will be described.
Iピクチャに関しては、前述の「1)原画像と同じ解像度で再生する場合」と同じ基準のもと、固定した順序に並べる。Pピクチャの場合は、以下の条件を満たすように並べ替えを行う。 The I pictures are arranged in a fixed order based on the same criteria as in “1) When reproducing at the same resolution as the original image” described above. In the case of a P picture, rearrangement is performed so as to satisfy the following conditions.
・低周波数帯域から高周波数帯域;
・1番目は、最低周波数帯域LLN(但し、Nは正の整数でウェーブレット分割レベル数);
・2−4番目は、HLN、LHN、HHNに関してRInterの降順;
・5番目以降の順番は、各レベル内の周波数帯域HL、LH、HHを、対応するレベルのHL、LH、HHの順序;
に準じる。
・ Low frequency band to high frequency band;
-The first is the lowest frequency band LLN (where N is a positive integer and the number of wavelet division levels);
・ 2-4th is descending order of R Inter for HLN, LHN, HHN;
- 5 th and subsequent order, the frequency band HL in each level, LH, and HH, corresponding, Relais bell HL, LH, and HH sequence;
According to
ウェーブレット分割レベル数が「2」でRInterの大きさに関して、
・HL2→LH2→HH2
の場合、各周波数帯域の符号化器における伝送または、復号化器における復号の順序は、図12(c)並びに図13(c)のようになる。つまり、多重化部50は、予め上記の条件が格納されたメモリ等を参照して符号化ビットストリームを伝送する。また、復号化器においても、予め上記の条件が格納されたメモリ等を参照して、入力されたデータを復号する。
Regarding the size of R Inter when the number of wavelet division levels is “2”,
・ HL2 → LH2 → HH2
In this case, the order of transmission in the encoder of each frequency band or decoding in the decoder is as shown in FIG. 12 (c) and FIG. 13 (c). That is, the multiplexing
また、上記の符号化器及び復号化器の動作をプログラムとして構築し、符号化器、復号化器として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。 In addition, the operations of the encoder and decoder described above can be constructed as a program, installed in a computer used as an encoder and decoder, executed, or distributed via a network. is there.
また、構築されたプログラムをハードディスク装置や、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納しておき、コンピュータにインストールする、または、配布することが可能である。 Further, the constructed program can be stored in a portable storage medium such as a hard disk device or a flexible disk / CD-ROM, and installed in a computer or distributed.
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
本発明は、動画像の符号化・復号化技術に適用可能である。 The present invention is applicable to a moving image encoding / decoding technique.
10 可逆カラー変換部
20 可逆ウェーブレット変換部、帯域分割手段
30 時空間適応予測符号化部、符号化手段
40 エントロピー符号化部
50 多重化部
51 第1の伝送手段
52 第2の伝送手段
61 第1の復号手段
62 第2の復号手段
31 2次元予測器
32 3次元予測器
33 動き推定部
34 シフト演算子
DESCRIPTION OF
Claims (10)
復号化側において原画像と同じ解像度で再生する場合に、
符号化手段において、帯域分割手段により分割された帯域の符号化対象画素近傍信号のフレーム間相関が所定の閾値より大きい場合には、フレーム間予測を行い、該フレーム間相関が所定の閾値より小さい場合には、フレーム内予測を行い、符号化する符号化ステップと、
Nを正の整数でウェーブレット分割レベル数とし、kを1以上N以下の整数として、符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に伝送する第1の伝送ステップと、
前記最低周波数帯域より高い周波数帯域HLk、LHk、HHkの符号化されたデータを2番目以降に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に伝送する第2の伝送ステップと、
からなることを特徴とする動画像符号化方法。 A moving image encoding method in which an input original image is band-divided by wavelet transform, and intra-frame and inter-frame prediction is performed for each pixel for each divided band,
When playing back at the same resolution as the original image on the decoding side,
In the encoding means, when the inter-frame correlation of the encoding target pixel neighboring signal in the band divided by the band dividing means is larger than a predetermined threshold, inter-frame prediction is performed, and the inter-frame correlation is smaller than the predetermined threshold. A coding step of performing intra-frame prediction and coding;
For each encoded frame, where N is a positive integer and the number of wavelet division levels, and k is an integer between 1 and N,
A first transmission step of transmitting encoded data of the lowest frequency band LLN first;
Second transmission for transmitting encoded data of frequency bands HLk, LHk, and HHk higher than the lowest frequency band in order from the second to the largest in the ratio of the number of processing times to intra-frame prediction of inter-frame prediction of each band. Steps,
A moving image encoding method comprising:
Nを正の整数でウェーブレット分割レベル数とし、kを1以上N以下の整数として、復号化手段において、前記符号化されたデータを符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に復号する第1の復号ステップと、
前記最低周波数帯域より高い周波数帯域HLk、LHk、HHkの符号化されたデータを2番目以降に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に復号する第2の復号ステップと、
からなることを特徴とする動画像復号化方法。 A video decoding method for decoding data encoded by the video encoding method according to claim 1 in order to reproduce the data at the same resolution as an original image,
In the decoding means, N is a positive integer and the number of wavelet division levels, k is an integer of 1 to N, and the encoded data is encoded for each encoded frame.
A first decoding step of first decoding encoded data of the lowest frequency band LLN;
Second decoding for decoding the encoded data of the frequency bands HLk, LHk, and HHk higher than the lowest frequency band in the order of the ratio of the number of processing times with respect to the intra-frame prediction of the inter-frame prediction of each band. Steps,
A moving picture decoding method comprising:
復号化側において原画像の1/2n倍の解像度毎に段階的に再生する場合に、
符号化手段において、帯域分割手段により分割された帯域の符号化対象画素近傍信号のフレーム間相関が所定の閾値より大きい場合には、フレーム間予測を行い、該フレーム間相関が所定の閾値より小さい場合には、フレーム内予測を行い、符号化する符号化ステップと、
Nを正の整数でウェーブレット分割レベル数とし、kを1以上(N−1)以下の整数として、符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に伝送する第1の伝送ステップと、
第Nレベルの3つの周波数帯域HLN、LHN、HHNの符号化されたデータを2ないし4番目に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に伝送する第2の伝送ステップと、
前記第Nレベルの3つの周波数帯域HLN、LHN、HHNより高い周波数帯域HLk、LHk、HHkの符号化されたデータを5番目以降に、低周波数帯域から高周波数帯域の順にレベル毎に、かつ同一レベル内では、HLk、LHk、HHkの順番に伝送する第3の伝送ステップと、
からなることを特徴とする動画像符号化方法。 A moving image encoding method in which an input original image is band-divided by wavelet transform, and intra-frame and inter-frame prediction is performed for each pixel for each divided band,
When playing back in stages for each resolution of 1/2 n times the original image on the decoding side,
In the encoding means, when the inter-frame correlation of the encoding target pixel neighboring signal in the band divided by the band dividing means is larger than a predetermined threshold, inter-frame prediction is performed, and the inter-frame correlation is smaller than the predetermined threshold. A coding step of performing intra-frame prediction and coding;
For each encoded frame, where N is a positive integer and the number of wavelet division levels, and k is an integer between 1 and (N−1),
A first transmission step of transmitting encoded data of the lowest frequency band LLN first;
The encoded data of the three frequency bands HLN, LHN, and HHN of the Nth level are transmitted from the second to the fourth, in the order of the ratio of the number of processing times with respect to the intraframe prediction of the interframe prediction of each band. A transmission step;
The encoded data of the frequency bands HLk, LHk, and HHk higher than the three frequency bands HLN, LHN, and HHN of the Nth level are the same for each level in order from the fifth frequency to the high frequency band. Within the level , a third transmission step for transmitting in the order of HLk, LHk, HHk;
A moving image encoding method comprising:
Nを正の整数でウェーブレット分割レベル数とし、kを1以上(N−1)以下の整数として、復号化手段において、前記符号化されたデータを符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に復号する第1の復号ステップと、
第Nレベルの3つの周波数帯域HLN、LHN、HHNの符号化されたデータを2ないし4番目に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に復号する第2の復号ステップと、
前記第Nレベルの3つの周波数帯域HLN、LHN、HHNより高い周波数帯域HLk、LHk、HHkの符号化されたデータを5番目以降に、低周波数帯域から高周波数帯域の順にレベル毎に、かつ同一レベル内ではHLk、LHk、HHkの順番に復号する第3の復号ステップと、
からなることを特徴とする動画像復号化方法。 A video decoding method for decoding data encoded by the video encoding method according to claim 3 in order to reproduce it step by step at a resolution of 1/2 n times the original image,
In the decoding unit, N is a positive integer and the number of wavelet division levels, k is an integer of 1 to (N-1), and the encoded data is encoded for each frame.
A first decoding step of first decoding encoded data of the lowest frequency band LLN;
Three frequency bands HLN of the N levels, LHN, 4th 2 to the encoded data HHN, the Gosuru restored sequentially ratio of the number of processing times is larger for the intra prediction of the prediction between bands of the frame 2 Decryption step of
The encoded data of the frequency bands HLk, LHk, and HHk higher than the three frequency bands HLN, LHN, and HHN of the Nth level are the same for each level in order from the fifth frequency to the high frequency band. A third decoding step for decoding in the order of HLk, LHk, HHk within the level ;
A moving picture decoding method comprising:
復号化側において原画像と同じ解像度で再生する場合に、
前記帯域分割手段により分割された帯域の符号化対象画素近傍信号のフレーム間相関が、所定の閾値より大きい場合には、フレーム間予測を行い、該フレーム間相関が所定の閾値より小さい場合には、フレーム内予測を行い、符号化する符号化手段と、
Nを正の整数でウェーブレット分割レベル数とし、kを1以上N以下の整数として、符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に伝送する第1の伝送手段と、
前記最低周波数帯域より高い周波数帯域HLk、LHk、HHkの符号化されたデータを2番目以降に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に伝送する第2の伝送手段と、
を有することを特徴とする動画像符号化装置。 A moving image encoding apparatus having band dividing means for dividing an input original image by wavelet transform, and performing intra-frame and inter-frame prediction for each divided band for each pixel,
When playing back at the same resolution as the original image on the decoding side,
When the inter-frame correlation of the encoding target pixel neighboring signal of the band divided by the band dividing unit is larger than a predetermined threshold, inter-frame prediction is performed, and when the inter-frame correlation is smaller than the predetermined threshold Encoding means for performing intra-frame prediction and encoding;
For each encoded frame, where N is a positive integer and the number of wavelet division levels, and k is an integer between 1 and N,
First transmission means for transmitting encoded data of the lowest frequency band LLN first;
Second transmission for transmitting encoded data of frequency bands HLk, LHk, and HHk higher than the lowest frequency band in order of increasing the ratio of the number of processing times to intra-frame prediction of inter-frame prediction of each band. Means,
A moving picture encoding apparatus comprising:
Nを正の整数でウェーブレット分割レベル数とし、kを1以上N以下の整数として、前記符号化されたデータを符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に復号する第1の復号手段と、
前記最低周波数帯域より高い周波数帯域HLk、LHk、HHkの符号化されたデータを2番目以降に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に復号する第2の復号手段と、
を有することを特徴とする動画像復号化装置。 A video decoding device that decodes data encoded by the video encoding device according to claim 5 in order to reproduce the data at the same resolution as the original image,
For each frame in which the encoded data is encoded, where N is a positive integer and the number of wavelet division levels, k is an integer between 1 and N,
First decoding means for first decoding the encoded data of the lowest frequency band LLN;
Second decoding for decoding the encoded data of the frequency bands HLk, LHk, and HHk higher than the lowest frequency band in the order of the ratio of the number of processing times with respect to the intra-frame prediction of the inter-frame prediction of each band. Means,
A moving picture decoding apparatus comprising:
復号側において原画像の1/2n倍の解像度毎に段階的に再生する場合に、
前記帯域分割手段により分割された帯域の符号化対象画素近傍信号のフレーム間相関が所定の閾値より大きい場合には、フレーム間予測を行い、該フレーム間相関が所定の閾値より小さい場合には、フレーム内予測を行い、符号化する符号化手段と、
Nを正の整数でウェーブレット分割レベル数とし、kを1以上(N−1)以下の整数として、符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に伝送する第1の伝送手段と、
第Nレベルの3つの周波数帯域HLN、LHN、HHNの符号化されたデータを2ないし4番目に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に伝送する第2の伝送手段と、
前記第Nレベルの3つの周波数帯域HLN、LHN、HHNより高い周波数帯域HLk、LHk、HHkの符号化されたデータを5番目以降に、低周波数帯域から高周波数帯域の順にレベル毎に、かつ同一レベル内では、HLk、LHk、HHkの順番に伝送する第3の伝送手段と、
を有することを特徴とする動画像符号化装置。 A moving image encoding apparatus having band dividing means for dividing an input original image by wavelet transform, and performing intra-frame and inter-frame prediction for each divided band for each pixel,
When playing back in stages for each resolution of 1/2 n times the original image on the decoding side,
When the inter-frame correlation of the encoding target pixel neighboring signal of the band divided by the band dividing unit is larger than a predetermined threshold, inter-frame prediction is performed, and when the inter-frame correlation is smaller than the predetermined threshold, Encoding means for performing intra-frame prediction and encoding;
For each encoded frame, where N is a positive integer and the number of wavelet division levels, and k is an integer between 1 and (N−1),
First transmission means for transmitting encoded data of the lowest frequency band LLN first;
The encoded data of the three frequency bands HLN, LHN, and HHN of the Nth level are transmitted from the second to the fourth, in the order of the ratio of the number of processing times with respect to the intraframe prediction of the interframe prediction of each band. Transmission means;
The encoded data of the frequency bands HLk, LHk, and HHk higher than the three frequency bands HLN, LHN, and HHN of the Nth level are the same for each level in order from the fifth frequency to the high frequency band. Within the level , a third transmission means for transmitting in the order of HLk, LHk, HHk;
A moving picture encoding apparatus comprising:
Nを正の整数でウェーブレット分割レベル数とし、kを1以上(N−1)以下の整数として、前記符号化されたデータを符号化された各フレーム毎に、
最低周波数帯域LLNの符号化されたデータを1番目に復号する第1の復号手段と、
第Nレベルの3つの周波数帯域HLN、LHN、HHNの符号化されたデータを2ないし4番目に、各帯域のフレーム間予測のフレーム内予測に対する処理回数の比率が大きい順番に復号する第2の復号手段と、
前記第Nレベルの3つの周波数帯域HLN、LHN、HHNより高い周波数帯域HLk、LHk、HHkの符号化されたデータを5番目以降に、低周波数帯域から高周波数帯域の順にレベル毎に、かつ、同一レベル内ではHLk、LHk、HHkの順番に復号する第3の復号手段と、
を有することを特徴とする動画像復号化装置。 A moving picture decoding apparatus that decodes data encoded by the moving picture encoding apparatus according to claim 7 in order to reproduce it step by step to a resolution of 1/2 n times the original image,
For each frame in which the encoded data is encoded, where N is a positive integer and the number of wavelet division levels, k is an integer of 1 to (N-1),
First decoding means for first decoding the encoded data of the lowest frequency band LLN;
Decode second to fourth encoded data of the three frequency bands HLN, LHN, and HHN of the Nth level in descending order of the ratio of the number of processing times to intraframe prediction of interframe prediction of each band Decryption means;
The encoded data of the frequency bands HLk, LHk, and HHk higher than the three frequency bands HLN, LHN, and HHN of the Nth level for the fifth and subsequent levels, from the low frequency band to the high frequency band for each level , and Third decoding means for decoding in the order of HLk, LHk, HHk within the same level ;
A moving picture decoding apparatus comprising:
請求項5乃至8のいずれか1項に記載の動画像処理装置として機能させることを特徴とする動画像処理プログラム。 Computer
9. A moving image processing program that causes the moving image processing apparatus according to claim 5 to function.
請求項5乃至8のいずれか1項に記載の動画像処理装置として機能させるプログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。 Computer
A computer-readable recording medium storing a program that functions as the moving image processing apparatus according to any one of claims 5 to 8.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006007716A JP4522951B2 (en) | 2006-01-16 | 2006-01-16 | Moving picture encoding method and apparatus, decoding method and apparatus, moving picture processing program, and computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006007716A JP4522951B2 (en) | 2006-01-16 | 2006-01-16 | Moving picture encoding method and apparatus, decoding method and apparatus, moving picture processing program, and computer-readable recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007189622A JP2007189622A (en) | 2007-07-26 |
JP4522951B2 true JP4522951B2 (en) | 2010-08-11 |
Family
ID=38344469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006007716A Expired - Fee Related JP4522951B2 (en) | 2006-01-16 | 2006-01-16 | Moving picture encoding method and apparatus, decoding method and apparatus, moving picture processing program, and computer-readable recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4522951B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012129949A (en) * | 2010-12-17 | 2012-07-05 | Toshiba Corp | Image encoding method and device, and image decoding method and device |
WO2015052388A1 (en) * | 2013-10-10 | 2015-04-16 | Sas I-Ces (Innovative Compression Engineering Solutions) | Method for encoding a matrix, in particular a matrix representative of a still or video image, using a wavelet transform, with numbers of wavelet levels that vary according to the image and different quantization factors for each wavelet level |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003116140A (en) * | 2001-10-04 | 2003-04-18 | Nippon Telegr & Teleph Corp <Ntt> | Moving picture reversible coding method and its decoding method, and apparatus for the same |
-
2006
- 2006-01-16 JP JP2006007716A patent/JP4522951B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003116140A (en) * | 2001-10-04 | 2003-04-18 | Nippon Telegr & Teleph Corp <Ntt> | Moving picture reversible coding method and its decoding method, and apparatus for the same |
Also Published As
Publication number | Publication date |
---|---|
JP2007189622A (en) | 2007-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102343371B1 (en) | Video encoding apparatus for performing intra-prediction based on directionality of neighboring block, video decoding apparatus and video decoding method for performing the same | |
KR100678958B1 (en) | Deblocking filtering method considering intra BL mode, and video encoder/decoder based on multi-layer using the method | |
KR100667806B1 (en) | Method and apparatus for video encoding and decoding | |
JP4991699B2 (en) | Scalable encoding and decoding methods for video signals | |
KR101708265B1 (en) | Apparatus and method for image coding and decoding | |
EP1737243A2 (en) | Video coding method and apparatus using multi-layer based weighted prediction | |
JP4429968B2 (en) | System and method for increasing SVC compression ratio | |
JP2008522537A (en) | Multi-layer video encoding method, decoding method and apparatus using the method | |
KR20060080107A (en) | Deblocking filtering method considering intra bl mode, and video encoder/decoder based on multi-layer using the method | |
EP1515561A1 (en) | Method and apparatus for 3-D sub-band video coding | |
JP5768180B2 (en) | Image decoding method and image decoding apparatus | |
KR100809603B1 (en) | Method and Apparatus for video coding on pixel-wise prediction | |
JPH11122617A (en) | Image compression | |
KR102105323B1 (en) | A method for adaptive illuminance compensation based on object and an apparatus using it | |
WO2006046550A1 (en) | Image encoding method and device, image decoding method, and device | |
EP1841235A1 (en) | Video compression by adaptive 2D transformation in spatial and temporal direction | |
JP4522951B2 (en) | Moving picture encoding method and apparatus, decoding method and apparatus, moving picture processing program, and computer-readable recording medium | |
KR101086724B1 (en) | ?? Deciding Method of H.264/AVC Encoder using Complexity of Frame, and H.264/AVC Encoder implementing the same | |
JP2006246351A (en) | Image coding unit and image decoding unit | |
JP4153774B2 (en) | Video encoding method, decoding method thereof, and apparatus thereof | |
JP2004320437A (en) | Data processor, encoder and their methods | |
JP2011045138A (en) | Method for decoding image | |
JP4667424B2 (en) | Image decoding device | |
JP4385928B2 (en) | Scalable video encoding / decoding method and system | |
JP2005184525A (en) | Image processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091201 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100302 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100506 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100525 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100526 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4522951 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130604 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140604 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |