JP4231386B2 - Resolution scalable decoding method and apparatus - Google Patents
Resolution scalable decoding method and apparatus Download PDFInfo
- Publication number
- JP4231386B2 JP4231386B2 JP2003372995A JP2003372995A JP4231386B2 JP 4231386 B2 JP4231386 B2 JP 4231386B2 JP 2003372995 A JP2003372995 A JP 2003372995A JP 2003372995 A JP2003372995 A JP 2003372995A JP 4231386 B2 JP4231386 B2 JP 4231386B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- resolution
- image
- signal
- bands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Description
本発明は、解像度スケーラブル復号化方法及び装置に係り、特に、動画像を効率良く伝送、蓄積するための解像度スケーラブル復号化方法及び装置に関する。 The present invention relates to a resolution scalable decoding method and apparatus, and more particularly, to a resolution scalable decoding method and apparatus for efficiently transmitting and storing moving images.
画像符号化の国際標準規格として、
(1) 動画像を対象としたMPEG(例えば、非特許文献1参照):
(2) 静止画像を対象としたJPEG2000(例えば、非特許文献2参照):
はよく知られている。MPEGは動き補償とDCTを用いた手法で、フレーム間相関とフレーム相関を効率よく除去することにより高い符号化効率を実現している。一方、JPEG2000は、ウェーブレット交換とEBCOTと呼ばれる埋め込み型のエントロピー符号化を用いた手法であり、フレーム間相関を利用していないためMPEGと比較すると符号化効率は劣るものの、MPEGにはない空間・SNRスケーラビリティなど様々な有効な機能を持つ。動画像への適用も可能としたMotionJPEG2000も提案されており、JPEG2000と同様な機能を持つ。
As an international standard for image coding,
(1) MPEG for moving images (for example, see Non-Patent Document 1):
(2) JPEG2000 for still images (for example, see Non-Patent Document 2):
Is well known. MPEG is a technique using motion compensation and DCT, and achieves high coding efficiency by efficiently removing inter-frame correlation and frame correlation. On the other hand, JPEG2000 is a technique that uses wavelet exchange and embedded entropy coding called EBCOT, and does not use inter-frame correlation. It has various effective functions such as SNR scalability. MotionJPEG2000, which can be applied to moving images, has also been proposed and has the same functions as JPEG2000.
JPEG2000で用いられるスケーラビリティは埋め込み型と呼ばれ、符号器は一度符号化するのみで、個々の解像度に応じて圧縮データを作り直す必要がない。単一の圧縮ファイルから、様々な解像度・SNRの復号画像が得られ、ファイルの容量の削減、計算量の軽減にもつながる。図21は、JPEG2000の解像度スケーラビリティ機能を示したものである。原画像の解像度がK×Lの場合、復号器ではK/2n×L/2nの解像度の画像が復元可能となる。しかしながら、通常、復号側で必要とされる画像の解像度は、原画像の大きさの1/2n倍のみにとどまらない。そこで、より一般的な有理数倍(原画像に対して、N/M倍、但し、M,Nは正の整数)の解像度で復元可能な埋め込み型の符号化法も検討されている。 The scalability used in JPEG2000 is called an embedded type, and the encoder only encodes once, and there is no need to regenerate compressed data according to individual resolutions. Decoded images of various resolutions and SNRs can be obtained from a single compressed file, leading to reduction in file capacity and reduction in calculation amount. FIG. 21 shows the resolution scalability function of JPEG2000. When the resolution of the original image is K × L, the decoder can restore an image having a resolution of K / 2 n × L / 2 n . However, normally, the resolution of the image required on the decoding side is not limited to 1/2 n times the size of the original image. Therefore, an embedded coding method that can be restored at a resolution of a more general rational number (N / M times the original image, where M and N are positive integers) has been studied.
この方法の一例として、本発明の発明者らにより、M帯域分割フィルタバンクとN帯域合成ファイルバンクならびにEBCOTと呼ばれる埋め込み型のエントロピー符号化法を用いて、有理数倍の空間解像度で復号が可能な符号化方法及び復号化方法も提案されている。しかしながら、国際標準規格JPEG2000との互換性は全くなく、新たにエンコーダならびにデコーダを実装する必要がある。 As an example of this method, the inventors of the present invention can decode with an M-band division filter bank, an N-band synthesis file bank, and an embedded entropy coding method called EBCOT with a rational multiple of spatial resolution. Encoding methods and decoding methods have also been proposed. However, there is no compatibility with the international standard JPEG2000, and it is necessary to newly install an encoder and a decoder.
また、JPEG2000(PartI)互換モデルは、エンコーダならびにデコーダともにJPEG2000と互換性を持ち、かつ、(有理数倍(N/2D倍)の空間解像度画像が復号可能である(例えば、非特許文献3参照)。図22にシステム構成図を示す。この方式では、JPEG2000によって1/2Uの多重解像度画像を得た後、必要とする解像度の直上の解像度画像出力にデシメーションフィルタ(フィルタリングによるN/2U倍の解像度変換)を適用する。この方法では、一度、JPEG2000デコーダによって1/2U(ここで、1/2U>N/2D)の解像度画像を復号することから、N/2D倍の解像度画像に不必要な高周波成分も伝送することになり、符号化効率の観点から好ましくない。例えば、N/2D=5/8のとき、一度JPEG2000デコーダによって原画像と同じ解像度画像を復号することから、全帯域のデータを伝送する必要がある。
本発明では、エンコーダならびにデコーダともにJPEG2000(PartII)と互換性を保ちつつ、符号化効率に優れるN/2D倍の解像度で復号可能な復号化方法を提案する。JPEG2000(PartI)互換モデル(田邊集、渡辺裕、富永英義、“Motion JPEG2000における最適解像度変換法の検討”、オーディオビジュアル復号情報処理40−4、(2003,3,7))では、一度、JPEG2000デコーダによって1/2U(ここで、1/2U>N/2D)の解像度画像を復号することから、N/2D倍の解像度画像に不必要な高周波成分も伝送することになり、符号化効率の観点から好ましくない。 The present invention proposes a decoding method capable of decoding at a resolution of N / 2D times which is excellent in encoding efficiency while maintaining compatibility with JPEG2000 (Part II) for both the encoder and the decoder. JPEG2000 (PartI) compatible model (Tanabe Shu, Hiroshi Watanabe, Hideyoshi Tominaga, “Examination of Optimal Resolution Conversion Method in Motion JPEG2000”, Audio Visual Decoding Information Processing 40-4, (2003, 3, 7)) 1/2 U (here, 1/2 U> N / 2 D) by the decoder from decoding the resolution images, will be N / 2 D times unwanted high frequency component resolution images also transmitted, This is not preferable from the viewpoint of encoding efficiency.
本発明は、上記の点に鑑みなされたもので、N/2D倍の解像度画像に必要な周波数成分のみを伝送することでN/2D倍の解像度変換を実現可能な解像度スケーラブル復号化方法及び装置を提供することを目的とする。 The present invention has been made in view of the above points, and a resolution scalable decoding method capable of realizing N / 2D times resolution conversion by transmitting only frequency components necessary for N / 2D times resolution images. And an apparatus.
図1は、本発明の原理を説明するための図である。 FIG. 1 is a diagram for explaining the principle of the present invention.
本発明(請求項1)は、ウェーブレットフィルタにより原画像を2D個の帯域に等分割され、符号化されたデータを復号化する、解像度スケーラブル復号化方法において、
符号化装置で符号化された圧縮データのN + 1 帯域以上の信号を廃棄し、
廃棄された以外の信号について低域から2U帯域(Uは、N<2Uを満たす最小の整数)を合成し、
N/2U倍の解像度変換を行い、N/2D倍の解像度画像を生成し、
拡大率N倍の零次ホールド法と低域ウェーブレットフィルタによるデシメーションを、U回多段接続する。
The present invention (Claim 1) is a resolution scalable decoding method in which an original image is equally divided into 2D bands by a wavelet filter, and encoded data is decoded.
Discard the N + 1 band or higher signal of the compressed data encoded by the encoder,
2 U band (U is the smallest integer satisfying N <2 U ) is synthesized from the low band for signals other than discarded,
N / 2 U times resolution conversion is performed, N / 2 D times resolution image is generated,
Decimation by a zero-order hold method with an enlargement ratio of N times and a low-frequency wavelet filter is connected in U stages.
本発明(請求項2)は、ウェーブレットフィルタにより原画像を2D個の帯域に等分割され、符号化されたデータを復号化する、解像度スケーラブル復号化方法において、
符号化装置で符号化された圧縮データのN+1帯域以上の信号を廃棄し、
廃棄された以外の信号について低域から2U帯域(Uは、N<2Uを満たす最小の整数)を合成し、
N/2U倍の解像度変換を行い、N/2D倍の解像度画像を生成し、
1:Nのアップサンプリングと(1/2U)に帯域制限するLPFならびに2U:1ダウンサンプリングを行う。
The present invention (Claim 2) is a resolution scalable decoding method in which an original image is equally divided into 2D bands by a wavelet filter, and encoded data is decoded.
Discard the signal of N + 1 band or more of the compressed data encoded by the encoding device,
2 U band (U is the smallest integer satisfying N <2 U ) is synthesized from the low band for signals other than discarded,
N / 2 U times resolution conversion is performed, N / 2 D times resolution image is generated,
1: N upsampling, LPF band limiting to (1/2 U ) and 2 U : 1 downsampling are performed.
図2は、本発明の原理構成図である。 FIG. 2 is a principle configuration diagram of the present invention.
本発明(請求項3)は、ウェーブレットフィルタにより原画像を2D個の帯域に等分割され、符号化されたデータを復号化する、解像度スケーラブル復号化装置であって、
符号化手段において符号化された圧縮データが入力されると、N+1帯域以上の信号を廃棄する信号廃棄手段と、
前記信号廃棄手段で廃棄された以外の信号について、低域から2U帯域(Uは、N<2Uを満たす最小の整数)を合成する帯域合成手段と、
前記帯域合成手段で合成した後、N/2U倍の解像度変換を行い、N/2D倍の解像度画像を生成する解像度変換手段と、を有し、
拡大率N倍の零次ホールド法と低域ウェーブレットフィルタによるデシメーションを、U回多段接続する。
The present invention (Claim 3) is a resolution scalable decoding device that decodes encoded data by equally dividing an original image into 2D bands by a wavelet filter,
When the compressed data encoded by the encoding means is input, a signal discarding means for discarding a signal of N + 1 band or more,
Band synthesis means for synthesizing 2 U bands (U is the smallest integer satisfying N <2 U ) from a low frequency band for signals other than those discarded by the signal discarding means;
Resolution conversion means for performing N / 2 U times resolution conversion and generating an N / 2 D times resolution image after being synthesized by the band synthesizing means,
Decimation by a zero-order hold method with an enlargement ratio of N times and a low-frequency wavelet filter is connected in U stages.
本発明(請求項4)は、ウェーブレットフィルタにより原画像を2D個の帯域に等分割され、符号化されたデータを復号化する、解像度スケーラブル復号化装置であって、
符号化手段において符号化された圧縮データが入力されると、N+1帯域以上の信号を廃棄する信号廃棄手段と、
前記信号廃棄手段で廃棄された以外の信号について、低域から2U帯域(Uは、N<2Uを満たす最小の整数)を合成する帯域合成手段と、
前記帯域合成手段で合成した後、N/2U倍の解像度変換を行い、N/2D倍の解像度画像を生成する解像度変換手段と、
1:Nのアップサンプリングと(1/2U)に帯域制限するLPFならびに、2U:1ダウンサンプリングを行う手段を有する。
The present invention (Claim 4) is a resolution scalable decoding device that decodes encoded data by equally dividing an original image into 2D bands by a wavelet filter,
When the compressed data encoded by the encoding means is input, a signal discarding means for discarding a signal of N + 1 band or more,
Band synthesis means for synthesizing 2 U bands (U is the smallest integer satisfying N <2 U ) from a low frequency band for signals other than those discarded by the signal discarding means;
A resolution converting means for performing N / 2 U times resolution conversion after synthesizing by the band synthesizing means, and generating an N / 2 D times resolution image;
It has an LPF that limits the bandwidth to 1: N and (1/2 U ), and means for performing 2 U : 1 downsampling.
本発明によれば、画像の効率の良い符号化ができ、少ないディスク容量で保存が可能となる。空間解像度スケーラビリティを有するために、画像表示機器の性能や用途に応じた空間解像度で画像を復号することが可能である。低域から任意の帯域まで復号すると原画像よりも低い空間解像度の画像を再生でき、全てのデータを復号すると、原画像と同じ解像度の画像が再生される。画像表示機器の性能や用途に応じて、原画像よりも低い空間解像度の画像を再生したい場合は、必要な帯域までに対応する符号化データの復号のみが必要とされる。原画像と同じ解像度の画像を再生して解像度変換を行うよりも処理時間が短く、また、符号化ビットストリームを伝送する場合は必要なデータのみを伝送すればよいため、伝送レートも小さくなる。 According to the present invention, it is possible to efficiently encode an image and to store it with a small disk capacity. Since it has spatial resolution scalability, it is possible to decode an image with a spatial resolution according to the performance and application of the image display device. When decoding from a low band to an arbitrary band, an image having a spatial resolution lower than that of the original image can be reproduced. When all data is decoded, an image having the same resolution as the original image is reproduced. When it is desired to reproduce an image having a spatial resolution lower than that of the original image according to the performance and application of the image display device, only decoding of the encoded data corresponding to the necessary band is required. The processing time is shorter than when the resolution conversion is performed by reproducing an image having the same resolution as the original image, and only the necessary data needs to be transmitted when transmitting the encoded bit stream, and the transmission rate is also reduced.
以下、図面と共に、本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図3は、本発明の一実施の形態における有理数倍の変換が可能な解像度スケーラビリティ機能を示す。符号化器100では、解像度がK×Lの画像を符号化し、単一の圧縮データを生成する。復号化器200では、N/2D倍解像度変換に必要な圧縮データの一部のビットストリームを取り出すことで、解像度が原画像の有理数倍、すなわち、N/2D倍(但し、N,Dは正の整数)の画像を得ることができる。 FIG. 3 shows a resolution scalability function capable of rational number conversion in an embodiment of the present invention. The encoder 100 encodes an image with a resolution of K × L and generates a single compressed data. The decoder 200 extracts a bit stream of a part of the compressed data necessary for N / 2D double resolution conversion, so that the resolution is a rational multiple of the original image, that is, N / 2 D times (however, N, D Is a positive integer).
[第1の実施の形態]
本実施の形態では、任意の有理数倍の空間解像度で復号可能とする符号器/復号化器について説明する。
[First embodiment]
In this embodiment, an encoder / decoder capable of decoding at an arbitrary rational number multiple spatial resolution will be described.
図4は、本発明の第1の実施の形態における符号化器の基本構成を示す。同図に示す符号化器100は、等帯域分割部110、量子化部111、スケーラブル復号を可能とする埋め込み型エントロピー符号器EBCOT112から構成される。 FIG. 4 shows a basic configuration of the encoder according to the first embodiment of the present invention. The encoder 100 shown in the figure includes an equal band dividing unit 110, a quantizing unit 111, and an embedded entropy encoder EBCOT 112 that enables scalable decoding.
入力された原画像は、等帯域分割部110において、2D個の等帯域に分割される。分割には、JPEG2000(PartIならびにPartII)において規定されるウェーブレットフィルタ(例;ウェーブレット97非可逆フィルタ、ウェーブレット53可逆フィルタ)を用いる。JPEG2000PartIにおいては、帯域分割としてウェーブレット変換を用いている。ウェーブレット変換は、図5に示すMallat分割と呼ばれる分割法により帯域分割を行う。Mallat分割では、1次元の2分割フィルタを用いて低域方向に次々と分割することによって、入力信号を複数の帯域に分割することができる。D回分割することによって、原画像に対して1/2Dの大きさの空間解像度を持つ画像まで分割可能となる。この処理を、水平方向および垂直方向にそれぞれ施す。復号器200側では、低域側から順次復号する。U回復号することによって、原画像に対して2U/2D=1/2n倍の大きさの空間解像度を持つ画像が復元できる。 The input original image is divided into 2D equal bands by the equal band dividing unit 110. For the division, a wavelet filter (eg, wavelet 97 irreversible filter, wavelet 53 reversible filter) defined in JPEG2000 (Part I and Part II) is used. In JPEG2000PartI, wavelet transform is used as band division. In the wavelet transform, band division is performed by a division method called Mallat division shown in FIG. In Mallat division, an input signal can be divided into a plurality of bands by successively dividing in a low frequency direction using a one-dimensional two-division filter. By dividing D times, it is possible to divide an image having a spatial resolution of 1 / 2D with respect to the original image. This process is performed in the horizontal direction and the vertical direction, respectively. On the decoder 200 side, decoding is performed sequentially from the low frequency side. By decoding U times, an image having a spatial resolution of 2 U / 2 D = 1/2 n times the original image can be restored.
一方、JPEG2000(PartII)では、任意の帯域分割法を選択することが可能である。本発明においては、図6に示すように、低域側だけでなく高域側に対しても同様にウェーブレットフィルタを再帰的に適用し、等帯域に画像を分割する。それぞれ、ほぼ2π/2Dの帯域幅を持ち、原画像を等間隔な帯域に分割する。比較のため、図7には、Mallat分割と等帯域分割による画像分割例を示す。 On the other hand, in JPEG2000 (Part II), an arbitrary band division method can be selected. In the present invention, as shown in FIG. 6, the wavelet filter is applied recursively not only to the low frequency side but also to the high frequency side to divide the image into equal bands. Each has a bandwidth of approximately 2π / 2D and divides the original image into equally spaced bands. For comparison, FIG. 7 shows an example of image division by Mallat division and equal band division.
分割された信号は、量子化部111によって量子化され、埋め込み型のエントロピー符号器EBCOT112によって圧縮データを生成する。埋め込み型のエントロピー符号器とは、復号器200側において、圧縮データの一部分を取り出すだけで自由に復号画像の空間解像度やSNRを設定できる機能を実現するエントロピー符号化法である。なお、エントロピー符号化EBCOT112を用いることによって、圧縮データ量の制御が量子化を行わなくても可能であるために、量子化は省略可能である。 The divided signal is quantized by the quantizing unit 111 and compressed data is generated by the embedded entropy encoder EBCOT 112. The embedded entropy encoder is an entropy encoding method that realizes a function that allows the decoder 200 to freely set the spatial resolution and SNR of a decoded image by simply extracting a part of the compressed data. Note that by using the entropy encoding EBCOT 112, it is possible to control the amount of compressed data without performing quantization, and thus quantization can be omitted.
図8は、本発明の第1の実施の形態における復号化器の基本構成を示す。 FIG. 8 shows a basic configuration of the decoder according to the first embodiment of the present invention.
当該復号化器200は、任意の有理数倍の空間解像度で復号可能なスケーラブル復号化器である。 The decoder 200 is a scalable decoder capable of decoding with an arbitrary rational multiple of spatial resolution.
同図に示す復号化器200は、ビットストリーム抽出部220、埋め込み型エントロピーEBCOT復号化部221、逆量子化部222、N帯域合成部223、解像度変換部224から構成される。 The decoder 200 shown in the figure includes a bit stream extraction unit 220, an embedded entropy EBCOT decoding unit 221, an inverse quantization unit 222, an N-band synthesis unit 223, and a resolution conversion unit 224.
ビットストリーム抽出部220においては、入力された圧縮データからN/2D倍の空間解像度を復号するのに必要なデータのみを取り出し、埋め込み型エントロピーEBCOT復号部221において、エントロピー復号化を行う。EBCOT復号化部(器)とは、埋め込み型のエントロピーEBCOT符号器112により圧縮されたデータを復号するもので、圧縮データの一部分を取り出すだけで自由に復号画像の空間解像度やSNRを設定できるエントロピー復号化法を用いる。復号画像の空間解像度が原画像に対してN/2D倍の場合、等帯域分割されたフィルタバンクの低周波数帯域側からN個の帯域分のデータのみをEBCOT復号化する。復号されたデータは、逆量子化部222において、低周波数帯域側からN帯域分の信号を復号する。 The bit stream extraction unit 220 extracts only data necessary for decoding the N / 2D times spatial resolution from the input compressed data, and the embedded entropy EBCOT decoding unit 221 performs entropy decoding. The EBCOT decoding unit (decoder) decodes the data compressed by the embedded entropy EBCOT encoder 112. Entropy that can freely set the spatial resolution and SNR of the decoded image by extracting only a part of the compressed data. Decryption method is used. When the spatial resolution of the decoded image is N / 2D times that of the original image, only the data for N bands from the low frequency band side of the equal-band divided filter bank is EBCOT decoded. From the decoded data, the inverse quantization unit 222 decodes signals for N bands from the low frequency band side.
図9には、分割数が2レベルの場合の帯域分割部と帯域合成部の関係を図示してある。 FIG. 9 illustrates the relationship between the band dividing unit and the band synthesizing unit when the number of divisions is two levels.
この場合、2D=4,N=3であり、合成フィルタバンク(N帯域合成部223)においては、低周波側の3つの帯域を合成する。このとき、合成フィルタバンク出力画像の解像度は原画像と同じサイズになるが、原画像と合成フィルタバンク出力のスペクトルは、図10のようになり、合成フィルタバンク出力の信号は、高周波数帯域の信号が破棄されたものになる。なお、例題では、合成フィルタバンク出力画像の解像度は原画像と同じサイズになるものの、伝送すべきデータは低周波側の3帯域分でよく、符号化効率の観点から望ましいといえる。一方、同じように2D=4、N=3の場合、JPEG2000(PartI)互換モデル(田邊集、渡辺裕、富永英義、“Motion JPEG2000における最適解像度変換法の検討”、オーディオビジュアル復号情報処理40−4、(2003,3,7))では、4つの全帯域の信号を伝送する必要があり、余分なデータを伝送することになる。なお、合成フィルタバンクでは、必ずしも原画像と同じ解像度まで復号する必要はなく、以下の条件を満たすUステージ分だけ復号すればよい。 In this case, 2 D = 4 and N = 3, and the synthesis filter bank (N band synthesis unit 223) synthesizes the three bands on the low frequency side. At this time, the resolution of the synthesized filter bank output image is the same size as the original image, but the spectrum of the original image and the synthesized filter bank output is as shown in FIG. 10, and the synthesized filter bank output signal is in the high frequency band. The signal will be discarded. In the example, although the resolution of the synthesized filter bank output image is the same size as the original image, the data to be transmitted may be three bands on the low frequency side, which is desirable from the viewpoint of coding efficiency. On the other hand, when 2D = 4 and N = 3, the JPEG2000 (PartI) compatible model (Tanabe Shu, Hiroshi Watanabe, Hideyoshi Tominaga, “Examination of Optimal Resolution Conversion Method in Motion JPEG2000”, Audio Visual Decoding Information Processing 40 −4, (2003, 3, 7)), it is necessary to transmit signals of all four bands, and extra data will be transmitted. In the synthesis filter bank, it is not always necessary to decode up to the same resolution as the original image, and only U stages satisfying the following conditions may be decoded.
U<2Uを満たす最小の整数値U:
例えば、N=1,2のとき、U=1
N=3,4のとき、U=2
N=5〜8のとき、U=3
合成フィルタバンクのステージ数は、符号化器200の分割数(すなわち2D)には依存せず、Nによってのみ決まることがわかる。
Smallest integer value U satisfying U <2 U:
For example, when N = 1, 2, U = 1
When N = 3, 4, U = 2
When N = 5-8, U = 3
It can be seen that the number of stages of the synthesis filter bank does not depend on the number of divisions of the encoder 200 (that is, 2 D ) and is determined only by N.
最後に、N帯域合成部223の出力画像は、解像度変換部224において処理され、N/M倍の解像度画像が得られる。解像度変換には、これまでに提案された種々の方法を用いることができる。なお、N帯域合成部223の出力画像は、N/M解像度画像に不必要な高周波成分が破棄された信号であるため、解像度変換時に発生するエリアジングの影響を極力抑えることができる。 Finally, the output image of the N band synthesizing unit 223 is processed in the resolution converting unit 224, and an N / M times resolution image is obtained. Various methods proposed so far can be used for resolution conversion. Note that the output image of the N-band synthesizing unit 223 is a signal in which a high-frequency component unnecessary for the N / M resolution image is discarded, so that the influence of aliasing that occurs during resolution conversion can be suppressed as much as possible.
後述する第3の実施の形態においては、解像度変換法として、拡大率N倍の零次ホールド法とJPEG2000において規定される低域ウェーブレットフィルタによるデシメーションを多段接続した例を示す。 In a third embodiment to be described later, as a resolution conversion method, an example is shown in which a zero-order hold method with an enlargement ratio of N times and decimation by a low-frequency wavelet filter defined in JPEG2000 are connected in multiple stages.
なお、圧縮されたデータは、JPEG2000(PartII)互換であることから、図8の下部分に示すJPEG2000PartIIデコーダにより復号することが可能である。但し、その場合には、復号される画像の解像度は2U/2Dに限定される。 Since the compressed data is compatible with JPEG2000 (Part II), it can be decoded by the JPEG 2000 Part II decoder shown in the lower part of FIG. However, in that case, the resolution of the image to be decoded is limited to 2U / 2D .
[第2の実施の形態]
本実施の形態では、N/2U倍の解像度変換を実現する方法について説明する。
[Second Embodiment]
In the present embodiment, a method for realizing N / 2 U times resolution conversion will be described.
図11は、本発明の第2の実施の形態における零次ホールド法とウェーブレットフィルタの多段接続による(N/2U)倍解像度変換を示す図であり、零次ホールド法とウェーブレットフィルタによりデシメーションを2U回多段接続した例である。 FIG. 11 is a diagram showing (N / 2 U ) double resolution conversion by multi-stage connection of a zero-order hold method and a wavelet filter in the second embodiment of the present invention, and decimation is performed by the zero-order hold method and the wavelet filter. This is an example of 2 U multistage connection.
この手法の特徴は、JPEG2000で規定されたウェーブレットフィルタのみを用いるだけでN/2U倍の解像度変換が実現できる点にあり、新たにデシメーションフィルタを用意する必要がない。 The feature of this method is that a resolution conversion of N / 2 U times can be realized by using only the wavelet filter defined by JPEG2000, and it is not necessary to prepare a new decimation filter.
零次ホールド法は、信号をN倍に拡大する方法であり、図12に示すように原信号をN回並べることにより実現できるシンプルな方法である。この零次ホールド法は、N倍のアップサンプリングとフィルタ
H(z)=1+z−1+…+z−(n−1)
によるフィルタ処理として解釈できる。アップサンプリングは、隣接する信号間に零値サンプルを挿入する操作であり、N倍のアップサンプリングでは、N−1個の零値を挿入することにより原信号の解像度をN倍に拡大する。H(z)の振幅特性は、図12の右側部に示すように緩やかな低域通過特性を示す。従って零次ホールドは緩やかな低域通過フィルタを用いた画像拡大法と理解できる。
The zero-order hold method is a method of enlarging a signal N times, and is a simple method that can be realized by arranging original signals N times as shown in FIG. This zero-order hold method uses N-times upsampling and a filter H (z) = 1 + z −1 +... + Z − (n−1)
Can be interpreted as filtering by Upsampling is an operation of inserting zero-value samples between adjacent signals. In N-times upsampling, the resolution of the original signal is increased to N-times by inserting N−1 zero values. The amplitude characteristic of H (z) shows a gentle low-pass characteristic as shown on the right side of FIG. Therefore, the zero-order hold can be understood as an image enlargement method using a gentle low-pass filter.
図13に零次ホールド法によるスペクトル特性図を示す。図10の右側部分のスペクトル特性を持つ信号を入力した場合、まず、N倍のアップサンプリングによって帯域が3倍に拡がり、高域にイメージング成分が発生する。その信号に対して緩やかな低域通過フィルタH(z)を施すことに相当することから、その出力は高域信号が抑圧された形となる。 FIG. 13 shows a spectrum characteristic diagram by the zero-order hold method. When a signal having the spectral characteristics shown in the right part of FIG. 10 is input, first, the band is expanded three times by N-times upsampling, and an imaging component is generated in the high band. Since this corresponds to applying a gentle low-pass filter H (z) to the signal, the output has a form in which the high-frequency signal is suppressed.
次に、ウェーブレットフィルタの多段接続によるデシメーション処理を行う。まず、低域ウェーブレットフィルタを施し、その後、2:1のダウンサンプリングを行う。低域ウェーブレットフィルタにより信号帯域は半分となり、ダウンサンプリングにより解像度が半分となる。同時にエリアジング成分が発生する(図14参照)。このウェーブレットフィルタを用いた2:1のデシメーション処理をU段従属接続することにより、解像度を1/2Uに縮小することが可能となる。 Next, decimation processing by multistage connection of wavelet filters is performed. First, a low-frequency wavelet filter is applied, and then 2: 1 downsampling is performed. The signal band is halved by the low-frequency wavelet filter, and the resolution is halved by downsampling. At the same time, aliasing components are generated (see FIG. 14). It is possible to reduce the resolution to 1/2 U by U-stage cascade connection of 2: 1 decimation processing using this wavelet filter.
[第3の実施の形態]
本実施の形態では、N/2U倍の解像度を表現する方法として、1/2U倍に帯域制限するLPFを用いた手法について説明する。
[Third Embodiment]
In the present embodiment, as a method for expressing N / 2 U times resolution, a method using an LPF that limits the bandwidth to 1/2 U times will be described.
図15は、本発明の第3の実施の形態における1/2U帯域制限したLPF処理による解像度変換方法を示す。 FIG. 15 shows a resolution conversion method by LPF processing with 1/2 U band limitation in the third embodiment of the present invention.
この方法では、1:Nのアップサンプリングと(1/2U)に帯域制限するLPFならびに、2U:1ダウンサンプリングを用いる。まず、1:Nのアップサンプリングにより信号をN倍に拡大し、次にLPFを施し、信号帯域を1/2Uに制限する。その後、2U:1ダウンサンプリングを行い、解像度を1/2Uに縮小する。 This method uses an upsampling of 1: N, an LPF that is band limited to (1/2 U ), and 2 U : 1 downsampling. First, the signal is expanded N times by 1: N upsampling, and then LPF is applied to limit the signal band to 1/2 U. Thereafter, 2 U : 1 downsampling is performed, and the resolution is reduced to 1/2 U.
図16に同手法によるスペクトル特性を示す。図10の右側部のスペクトル特性をもつ信号を入力した場合、まず、N倍のアップサンプリングによって帯域が3倍に拡がり、高域に折り返し成分が発生する。その後、1/2U倍に帯域制限するLPFを施し2U:1ダウンサンプリングを行うことにより、1/2Uに帯域され、1/2U倍に縮小された画像を得ることができる。但し、1/2U倍に帯域制限する理想的なLPFは存在しないことから、ダウンサンプリングによるエリアジングの影響を避けることができない。 FIG. 16 shows spectral characteristics obtained by this method. When a signal having a spectral characteristic on the right side in FIG. 10 is input, first, the band is expanded three times by N-times upsampling, and a folded component is generated in the high band. Thereafter, 2 U performs LPF that band-limits to 1/2 U fold: by performing 1 down-sampling is bandwidth 1/2 U, it is possible to obtain a reduced image in 1/2 U times. However, since there is no ideal LPF that limits the bandwidth to 1/2 U times, the influence of aliasing due to downsampling cannot be avoided.
[第4の実施の形態]
本実施の形態では、符号化したときに復号可能な解像度について説明する。
[Fourth Embodiment]
In the present embodiment, resolution that can be decoded when encoded will be described.
一例として、1920×1080のHDTV画像を本発明を用いて符号化したときに復号可能な解像度について述べる。 As an example, a resolution that can be decoded when a 1920 × 1080 HDTV image is encoded using the present invention will be described.
比較のために、JPEG2000で符号化した場合の例を図17に示す。分割レベル数を3とすると、復号可能な解像度は縦横それぞれ原画像の1/2n(n=1,2,4)であることから、
・240×135
・480×270
・960×540
・1902×1080
画素となる。そのために、広く流通するSDTV画像が復号できない。
For comparison, FIG. 17 shows an example of encoding with JPEG2000. When the number of division levels is 3, the decodable resolution is 1/2 n (n = 1, 2, 4) of the original image in the vertical and horizontal directions.
・ 240 × 135
・ 480 × 270
・ 960 × 540
・ 1902 × 1080
It becomes a pixel. For this reason, widely distributed SDTV images cannot be decoded.
一方、1920×1080のHDTV画像を、本発明により符号化したときに復号可能な解像度を図18に示す。復号可能な最小の解像度が上記のJPEG2000と同じ解像度となるように、分割数を3と設定した。このとき、復号可能な最小の解像度は、240×135画素となり、一般的に、240m×135n(但し、n,mは正の整数。n=1,2,…,8、m=1,2,…8)画素の画像が復号可能となる。この場合、広く流通する
・720×405(SDTV、上下に黒入れ)
・1920×1080(HDTV)
の画像が、単一の圧縮ファイルから容易に復号可能となる。
On the other hand, FIG. 18 shows the resolution that can be decoded when a 1920 × 1080 HDTV image is encoded according to the present invention. The number of divisions was set to 3 so that the minimum decodable resolution was the same as that of JPEG2000. At this time, the minimum decodable resolution is 240 × 135 pixels, and generally 240 m × 135 n (where n and m are positive integers, n = 1, 2,..., 8, m = 1, 2). ,... 8) A pixel image can be decoded. In this case, it is widely distributed. 720 x 405 (SDTV, black on top and bottom)
・ 1920 × 1080 (HDTV)
Can be easily decoded from a single compressed file.
以下に、上記で説明した解像度スケラーブル符号化/復号化の有効性を検証する。 The effectiveness of the resolution scalable encoding / decoding described above will be verified below.
以下のシミュレーションでは、対象画像は、画像サイズが1920×1080(pixels),
ビット数が8(bits/pixel)のディジタルシネマ用テキスト画像(ダンス、湖、パーティー、貴族)、「T.Nakachi, T. Sawabe, T. Fujii and T. Fujii, ”Multiresolution lossless video codiong using inter/intra frame adaptive prediction,” IEICE Trans. on Fundamentals, vol.E85-A, no.8, pp.1822-1830, Aug. 2002.」と図19に示すサーキュラゾーンプレートを用いた。サーキュラゾーンプレートは、次式により算出され、低域から高域までの周波数成分の影響を調べることができる。
In the following simulation, the target image has an image size of 1920 × 1080 (pixels),
Digital cinema text images with 8 bits (pixels / pixel) (dance, lake, party, nobility), “T.Nakachi, T. Sawabe, T. Fujii and T. Fujii,” Multiresolution lossless video codiong using inter / Intra frame adaptive prediction, “IEICE Trans. on Fundamentals, vol. E85-A, no. 8, pp. 1822-1830, Aug. 2002.” and the circular zone plate shown in FIG. 19 were used. The circular zone plate is calculated by the following equation, and the influence of frequency components from the low range to the high range can be examined.
表1に、N/2D=3/4倍の解像度変換を行った場合のPSNR[dB]を示した。分割レベル数はD=2、分析フィルタバンクにおいては(5,3)可逆フィルタを使用し、N倍拡大法として、それぞれ1)N倍アップサンプリング、2)零次ホールド法、3)直線補間法を、1/2D倍縮小において、(a)(9,7)非可逆LPF、(b)(5,3)可逆LPFを用いた場合を示している。 Table 1 shows PSNR [dB] when N / 2D = 3/4 times resolution conversion is performed. The number of division levels is D = 2, and the analysis filter bank uses (5, 3) reversible filters, and N-times enlargement methods are 1) N-times upsampling, 2) zero-order hold method, and 3) linear interpolation method, respectively. This shows a case where (a) (9, 7) irreversible LPF and (b) (5, 3) reversible LPF are used in 1 / 2D reduction.
表2にN/2D=5/8倍の解像度変換を行った場合のPSNR[dB]を示した。 Table 2 shows PSNR [dB] when N / 2D = 5/8 times resolution conversion is performed.
例えば、N倍に拡大処理する方法として、上述の実施の形態で示した零時ホールド法やアップサンプリング法のほか、他の画像拡大手法(例えば、直線補間法、ニアレストネイバー法、バイリニア法、バイキュービック法)を適用可能である。 For example, as a method of enlarging N times, in addition to the zero hold method and the upsampling method described in the above embodiment, other image enlargement methods (for example, linear interpolation method, nearest neighbor method, bilinear method, Bicubic method) can be applied.
なお、本発明は、上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。 The present invention is not limited to the above-described embodiments and examples, and various modifications and applications are possible within the scope of the claims.
本発明は、動画像の復号化技術に適用可能である。 The present invention is applicable to a moving picture decoding technique.
100 符号化器
110 等帯域分割部
111 量子化部
112 EBCOT
200 復号化器、復号装置
220 ビットストリーム抽出部
221 EBCOT復号部、信号廃棄手段
222 逆量子化部
223 N帯域合成部、帯域合成手段
224 解像度変換部、解像度変換手段
225 EBCOT復号部
226 逆量子化部
227 帯域合成部
100 Encoder 110 Equal Band Division Unit 111 Quantization Unit 112 EBCOT
200 Decoder, Decoder 220 Bitstream Extractor 221 EBCOT Decoder, Signal Discarding Unit 222 Inverse Quantizer 223 N-band Synthesizer, Band Synthesizer 224 Resolution Converter, Resolution Converter 225 EBCOT Decoder 226 Inverse Quantization 227 Band synthesis unit
Claims (4)
符号化装置で符号化された圧縮データのN + 1 帯域以上の信号を廃棄し、
廃棄された以外の信号について低域から2U帯域(Uは、N<2Uを満たす最小の整数)を合成し、
N/2U倍の解像度変換を行い、N/2D倍の解像度画像を生成し、
拡大率N倍の零次ホールド法と低域ウェーブレットフィルタによるデシメーションを、U回多段接続することを特徴とする解像度スケーラブル復号化方法。 In a resolution scalable decoding method, in which an original image is equally divided into 2D bands by a wavelet filter and encoded data is decoded,
Discard the N + 1 band or higher signal of the compressed data encoded by the encoder,
2 U band (U is the smallest integer satisfying N <2 U ) is synthesized from the low band for signals other than discarded,
N / 2 U times resolution conversion is performed, N / 2 D times resolution image is generated,
A resolution scalable decoding method, characterized in that decimation by a zero-order hold method with an enlargement factor of N times and a low-frequency wavelet filter are connected in U stages.
符号化装置で符号化された圧縮データのN+1帯域以上の信号を廃棄し、
廃棄された以外の信号について低域から2U帯域(Uは、N<2Uを満たす最小の整数)を合成し、
N/2U倍の解像度変換を行い、N/2D倍の解像度画像を生成し、
1:Nのアップサンプリングと(1/2U)に帯域制限するLPFならびに2U:1ダウンサンプリングを行うことを特徴とする解像度スケーラブル復号化方法。 In a resolution scalable decoding method, in which an original image is equally divided into 2D bands by a wavelet filter and encoded data is decoded,
Discard the signal of N + 1 band or more of the compressed data encoded by the encoding device,
2 U band (U is the smallest integer satisfying N <2 U ) is synthesized from the low band for signals other than discarded,
N / 2 U times resolution conversion is performed, N / 2 D times resolution image is generated,
A resolution scalable decoding method characterized by performing 1: N upsampling, LPF band-limiting to (1/2 U ) and 2 U : 1 downsampling.
符号化手段において符号化された圧縮データが入力されると、N+1帯域以上の信号を廃棄する信号廃棄手段と、
前記信号廃棄手段で廃棄された以外の信号について、低域から2U帯域(Uは、N<2Uを満たす最小の整数)を合成する帯域合成手段と、
前記帯域合成手段で合成した後、N/2U倍の解像度変換を行い、N/2D倍の解像度画像を生成する解像度変換手段と、を有し、
拡大率N倍の零次ホールド法と低域ウェーブレットフィルタによるデシメーションを、U回多段接続することを特徴とする解像度スケーラブル復号化装置。 A resolution scalable decoding device for equally dividing an original image into 2D bands by a wavelet filter and decoding encoded data,
When the compressed data encoded by the encoding means is input, a signal discarding means for discarding a signal of N + 1 band or more,
Band synthesis means for synthesizing 2 U bands (U is the smallest integer satisfying N <2 U ) from a low frequency band for signals other than those discarded by the signal discarding means;
Resolution conversion means for performing N / 2 U times resolution conversion and generating an N / 2 D times resolution image after being synthesized by the band synthesizing means,
A resolution scalable decoding apparatus characterized in that decimation by a zero-order hold method with an enlargement ratio of N times and a low-frequency wavelet filter are connected in U stages.
符号化手段において符号化された圧縮データが入力されると、N+1帯域以上の信号を廃棄する信号廃棄手段と、
前記信号廃棄手段で廃棄された以外の信号について、低域から2U帯域(Uは、N<2Uを満たす最小の整数)を合成する帯域合成手段と、
前記帯域合成手段で合成した後、N/2U倍の解像度変換を行い、N/2D倍の解像度画像を生成する解像度変換手段と、
1:Nのアップサンプリングと(1/2U)に帯域制限するLPFならびに、2U:1ダウンサンプリングを行う手段を有することを特徴とする解像度スケーラブル復号化装置。 A resolution scalable decoding device for equally dividing an original image into 2D bands by a wavelet filter and decoding encoded data,
When the compressed data encoded by the encoding means is input, a signal discarding means for discarding a signal of N + 1 band or more,
Band synthesis means for synthesizing 2 U bands (U is the smallest integer satisfying N <2 U ) from a low frequency band for signals other than those discarded by the signal discarding means;
A resolution converting means for performing N / 2 U times resolution conversion after synthesizing by the band synthesizing means, and generating an N / 2 D times resolution image;
1. A resolution scalable decoding apparatus comprising: an LPF for band-limiting to 1: N and (1/2 U ) and means for performing 2 U : 1 down-sampling.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003372995A JP4231386B2 (en) | 2003-10-31 | 2003-10-31 | Resolution scalable decoding method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003372995A JP4231386B2 (en) | 2003-10-31 | 2003-10-31 | Resolution scalable decoding method and apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005136873A JP2005136873A (en) | 2005-05-26 |
JP4231386B2 true JP4231386B2 (en) | 2009-02-25 |
Family
ID=34649215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003372995A Expired - Fee Related JP4231386B2 (en) | 2003-10-31 | 2003-10-31 | Resolution scalable decoding method and apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4231386B2 (en) |
-
2003
- 2003-10-31 JP JP2003372995A patent/JP4231386B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005136873A (en) | 2005-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4656190B2 (en) | Information processing apparatus and method | |
JP4409276B2 (en) | Multiresolution video display method and video encoder | |
Taubman et al. | JPEG2000: Standard for interactive imaging | |
KR100664928B1 (en) | Video coding method and apparatus thereof | |
JP4844741B2 (en) | Moving picture coding apparatus and moving picture decoding apparatus, method and program thereof | |
JP2010528555A (en) | Video signal processing method and apparatus | |
JP2012095310A (en) | Transform domain subsampling for video transcoding | |
KR20150068402A (en) | Video compression method | |
JPH06311496A (en) | Method and device for transmitting picture signal | |
JP3613983B2 (en) | Image generating apparatus and method, and electronic still camera | |
JP6484097B2 (en) | Video encoding apparatus, video decoding apparatus, video encoding method, video decoding method, video encoding program, and video decoding program | |
CN116762338A (en) | Video encoding using preprocessing | |
US20100172419A1 (en) | Systems and methods for compression, transmission and decompression of video codecs | |
US8031782B2 (en) | Systems and methods for compression, transmission and decompression of video codecs | |
JP4231386B2 (en) | Resolution scalable decoding method and apparatus | |
JP4762486B2 (en) | Multi-resolution video encoding and decoding | |
JP2000125293A (en) | Wavelet decoder and its method | |
JP6388476B2 (en) | Encoding apparatus and program | |
JP2004147096A (en) | Encoding method | |
JP4385928B2 (en) | Scalable video encoding / decoding method and system | |
JP3087864B2 (en) | HDTV signal subband encoding method | |
GB2455979A (en) | Video processing using quincunx sub-sampling | |
KR0171749B1 (en) | A compatible encoder | |
KR20020035726A (en) | Image compression and expansion method based on jpeg using wavelet transform | |
JPH06350990A (en) | Picture data compression processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060414 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080603 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080725 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080812 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081008 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20081022 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081118 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081205 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4231386 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121212 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121212 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131212 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |