WO2004064405A1 - 符号化方法及び復号化方法及び符号化装置及び復号化装置 - Google Patents

符号化方法及び復号化方法及び符号化装置及び復号化装置 Download PDF

Info

Publication number
WO2004064405A1
WO2004064405A1 PCT/JP2004/000154 JP2004000154W WO2004064405A1 WO 2004064405 A1 WO2004064405 A1 WO 2004064405A1 JP 2004000154 W JP2004000154 W JP 2004000154W WO 2004064405 A1 WO2004064405 A1 WO 2004064405A1
Authority
WO
WIPO (PCT)
Prior art keywords
encoding
decoding
original image
resolution
dividing
Prior art date
Application number
PCT/JP2004/000154
Other languages
English (en)
French (fr)
Inventor
Takayuki Nakachi
Tomoko Sawabe
Tetsurou Fujii
Original Assignee
Nippon Telegraph And Telephone Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph And Telephone Corporation filed Critical Nippon Telegraph And Telephone Corporation
Priority to JP2005507673A priority Critical patent/JPWO2004064405A1/ja
Priority to US10/512,075 priority patent/US9264736B2/en
Priority to EP04701679.5A priority patent/EP1585338B8/en
Publication of WO2004064405A1 publication Critical patent/WO2004064405A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Definitions

  • the present invention relates to an encoding method, a decoding method, an encoding device, and a decoding device, and in particular, to an encoding method, an encoding method, an encoding device, and a decoding device for efficiently transmitting and storing an image.
  • MPEG Moving Picture Experts Group
  • MPEG is a technique that uses motion compensation and DCT (Discrete Cosine Transform) to achieve high coding efficiency by efficiently removing inter-frame correlation and frame correlation.
  • JP EG 2000 is a method that uses wavelet transform and embedded edge-to-peak coding called EB COT, and does not use inter-frame correlation. Although it is inefficient, it has various effective functions such as space ⁇ ⁇ SNR (Signal-to-Noise Ratio) scalability that MPEG does not have.
  • Motion JPEG 2000 which can be applied to moving images, has also been proposed, and has a function similar to that of JPEG 2000.
  • FIG. 1 shows the resolution scalability function of JPEG 2000. If the resolution of the original image is KXL, a decoder, K> in 2 n XL / 2 n of the resolution of the image can be restored c above JPEG 2 0 0 0, images of a resolution smaller than the original image It can be restored, but its resolution is limited to 12 n (n is a positive integer) of the original image. However, usually, the resolution of the image required by the decoding side, there is a problem that Todoma should not be only 1 2 n times the original image resolution. Disclosure of the invention
  • the present invention has been made in view of the above points, and has as its object to provide an embedded coding and decoding technique that enables a decoded image to be obtained with a more general resolution. I do.
  • the above object is an encoding method for encoding an original image, in which a division step of dividing an input original image into M (M is an integer and M> 2) equal bands. And a coding step of coding a signal obtained by dividing an original image into equal bands using an embedded type ent-pea coding method.
  • the resolution is not limited to 1/2 n times the resolution of the original image on the decoding side. Images can be obtained.
  • the encoded data obtained in the encoding step includes information of resolution levels defined in order from a low frequency band side in a plurality of divided bands.
  • the encoded data may include resolution level information for each of a vertical direction and a horizontal direction of the image.
  • the above object is an encoding method for encoding an original image, comprising: a transforming step of transforming the input original image into a plurality of coefficients by orthogonal transformation; And an encoding step of encoding using the entropy encoding method of (1).
  • the encoded data obtained in the encoding step includes resolution level information defined in order from a low frequency component side in frequency components corresponding to the plurality of coefficients.
  • the above problem is to decode coded data at a resolution of N / M times (M and N are integers and 1 ⁇ N ⁇ M and M> 2) the original image.
  • Coded data obtained by dividing an original image into M equal bands and receiving coded data from the coded data.
  • a decoding step that takes out N signals from the low frequency band side and decodes them by the event-to-peak decoding method, and a band synthesizing step that combines the decoded N signals. It is also solved by the coding method.
  • the method further comprises: obtaining a resolution of the original image and a predetermined resolution. Calculating the value of N suitable for the predetermined resolution using the resolution of the original image and the number of divisions M. You may.
  • the above problem is to decode coded data at a resolution of N / M times (M and N are integers and 1 ⁇ N ⁇ M and M> 2) the original image.
  • a decoding method having a decoding step of extracting N signals from the low-frequency component side and decoding the extracted signals by an event-to-peak decoding method, and a combining step of combining the decoded N signals. Is also resolved.
  • an apparatus provided with means for executing each step in the above method. Further, in the above method A program for causing a computer to execute each step and a computer-readable recording medium on which the program is recorded are provided.
  • FIG. 1 is a diagram showing the JPEG 2000 resolution scalability.
  • FIG. 2 is a diagram illustrating a resolution scalability function capable of performing conversion by a rational number according to an embodiment of the present invention.
  • FIG. 3 is a basic configuration diagram of the scalable encoder according to the first embodiment of the present invention.
  • FIG. 4 is a flowchart for explaining the operation of the scalable encoder according to the first embodiment.
  • FIG. 5 is a basic configuration diagram of a scalable decoder according to the second embodiment of the present invention.
  • FIG. 6 is a flowchart for explaining the operation of the scalable decoder according to the second embodiment.
  • FIG. 7 is a configuration diagram of an encoder using a filter bank and EBCOT according to the third embodiment of the present invention.
  • FIG. 8 is a diagram for explaining M a1 at t division.
  • FIG. 9 is a diagram for explaining N / M-fold resolution conversion using a filter bank according to the third embodiment of the present invention.
  • FIG. 10 is a diagram for explaining Ma 11 at at division and equal band division according to the third embodiment of the present invention.
  • FIG. 11 is a diagram showing a spatial resolution level in JPEG 2000 according to the third embodiment of the present invention.
  • FIG. 12 is a diagram showing an RPCL data structure.
  • FIG. 13 is a diagram showing a spatial resolution level according to the third embodiment of the present invention.
  • FIG. 14 is a diagram showing an RPCL data structure for realizing spatial resolution scalability according to the third embodiment of the present invention.
  • FIG. 15 is a diagram illustrating an example in which the resolution levels are set at irregular intervals.
  • FIG. 16 is a diagram illustrating an example where the conversion ratio in the vertical direction and the conversion ratio in the horizontal direction of an image are different.
  • FIG. 17 is a configuration diagram of a decoder using a filter bank and EBCOT according to the fourth embodiment of the present invention.
  • FIG. 18 is a diagram showing the relationship between the resolution level and the resolution in the fourth embodiment of the present invention.
  • FIG. 19 is a configuration diagram of a general equal-division filter bank when resolution conversion is not performed.
  • FIG. 20 is a flowchart for automatically calculating a required resolution level.
  • Figure 21 is an example of the required resolution level calculated when the conversion ratio in the vertical and horizontal directions is different.
  • FIG. 22 is a configuration diagram of an encoder according to the fifth embodiment of the present invention.
  • FIG. 23 is a diagram for describing a band division method according to the fifth embodiment.
  • FIG. 24 is a diagram illustrating a method of defining a spatial resolution level according to the fifth embodiment.
  • FIG. 25 is a configuration diagram of the decoder according to the sixth embodiment of the present invention.
  • FIG. 26 is a diagram for describing processing in the band combining unit of the decoder according to the sixth embodiment.
  • FIG. 3 is a diagram for describing image luminosity.
  • FIG. 28 is a diagram illustrating a resolvable resolution level when an HDTV image is encoded according to the seventh embodiment of the present invention.
  • Figure 29 shows the original image used in the simulation.
  • FIG. 30 shows a decoded image in the simulation.
  • FIG. 31 is a table showing the code size and the PSNR characteristics of the decoded image in the simulation. BEST MODE FOR CARRYING OUT THE INVENTION
  • FIG. 2 shows a resolution scalability function according to an embodiment of the present invention.
  • the encoding unit encodes an image with a resolution of KXL to generate single compressed data.
  • the decoding unit extracts a part of the bit stream of the compressed data so that the resolution as shown in the figure is a rational multiple of the original image, that is, N / M times (where M and N are integers, And, 1 ⁇ N ⁇ M and M> 2) images can be obtained.
  • a part of the coded code for extracting an image that is a rational number multiple of the original image is extracted on the decoding part side. Is also good.
  • the framework of this alternative example is the same as J PEG 200.
  • a part of the encoded code may be extracted in a relay device connected by a transmission unit between the encoding unit and the decoding unit.
  • FIG. 3 shows the basic configuration of a scalable encoder that generates compressed data that can be decoded at an arbitrary rational multiple of the spatial resolution according to the first embodiment of the present invention.
  • the scalable encoder shown in FIG. 1 includes an equal-band splitting unit 10, a quantizing unit 11, and an embedded-type ent-peak coding unit 12 ( see the flowchart of FIG. The operation of the scalable encoder will be described.
  • the input original image is divided into M equal bands by the equal band dividing unit 10 (step 1).
  • filter banks P. Vaidyanathan, “Multi-rate signal processing and filter banks”, Science and Technology Publishing, January 2001
  • orthogonal transforms Fumitaka Ono, Yutaka Watanabe. Basic technology for liquefaction ", Corona, March 1998.
  • orthogonal transforms see, for example, “Yukie Akutsu, Hiroyuki Kobayashi, Hitoshi Kiya," A Method for Evaluating Resolution Transformation Using Orthogonal Transformation, Filterbank and Wavelet Transform, "IEICE Technical Report. DSP 9 3 _ 2 6 ".
  • the divided signal is quantized by a quantization unit 11 (step 2), and embedded in an entropy encoding unit 12, EBCOT (IS0 / IEC 15444-1 JPEG2000 Part I: Core coding system, 2000- 12-15) and EZBC (ST Hsiang and JW Woods,
  • the embedded ent-speech encoder 12 is an entropy encoder that generates encoded data that enables scalable decoding on the decoder side.
  • FIG. 5 shows a basic configuration of a scalable decoder according to the second embodiment of the present invention.
  • the scalable decoder according to the second embodiment is a decoder that decodes the compressed data generated by the encoder according to the first embodiment at an arbitrary rational multiple of the spatial resolution.
  • the scalable decoder shown in FIG. 1 is composed of an embedded ent speech decoder 20, an inverse quantizer 21, and a band combiner 22. The operation of the scalable decoder will be described with reference to the flowchart of FIG.
  • the embedded entropy decoding unit 20 extracts N / M band data from the low frequency band side of the input compressed data (step 4), and performs entropy decoding (step 5). ).
  • the inverse quantization unit 21 inversely quantizes the signal decoded by the embedded type speech decoding unit (step 6).
  • the band synthesizing unit 22 synthesizes the signals dequantized by the dequantizing unit 21 and outputs an image (step 7).
  • an orthogonal transformer such as a filter bank or an inverse DCT transform (IDCT) can be used depending on the image division method on the encoder side.
  • IDCT inverse DCT transform
  • an encoder will be described in the case where a filter bank is used as an equal-band dividing unit and EBCOT is used as an embedded-type entrance-peak coding method.
  • FIG. 7 shows a configuration of an encoder according to the third embodiment of the present invention.
  • the encoder shown in the figure is an equal band using equal division analysis filter puncture. It is composed of an area dividing section 30, a quantizing section 31, and an embedded type ent-peak coding section 32 to 34.
  • JP EG 2000 uses wavelet transform as band division.
  • band division is performed by a division method called “Ma 11 at division” shown in FIG.
  • the input signal can be divided into a plurality of bands by dividing the input signal one after another in the low frequency direction using a one-dimensional two-part filter.
  • D times As shown in the upper diagram (40) in FIG. 8, it becomes possible to divide the original image into an image having a spatial resolution of 1 / 2D . This process is performed in the horizontal and vertical directions, respectively.
  • the equal division analysis filter bank shown in the left part (50) of FIG. 9 is used for band division.
  • the equal division analysis filter bank the original image is divided into M equal bands using M filters having the same bandwidth. The final output is obtained by thinning the output of each filter to 1 / M (downsampling).
  • FIG. 10 shows Ma 11 at division (60) according to JPEG 20000 and equal band division (61) according to the present invention.
  • the output signal of the equal band division unit 30 is quantized. Since the entropy coding unit (EB COT coding processing unit) 32 to 34 can control the amount of compressed data without performing quantization, quantization can be omitted. .
  • EBC OT is a type of embedded event speech coding method.
  • the entropy coding unit 32 to 34 by EB COT First, in the coefficient bit modeling unit 32, the image is divided into code blocks.
  • Each bit plane is decomposed into sub-planes (three passes) and divided one after another, and the arithmetic coding unit 33 performs arithmetic coding using the path as a minimum unit.
  • Arithmetic coded data can be truncated (post quantization) with the path as the smallest unit. Control of the code amount is possible only by this post-processing.
  • the encoding code bucketing section 34 the compressed data encoded by arithmetic encoding is packetized and transmitted as an encoded stream.
  • Hierarchical coding such as spatial resolution and SNR scalability can be realized by assigning a certain priority to the above-mentioned path units and controlling the temporal priority at the time of decoding.
  • the priority is
  • the layer is a criterion based on SNR, and JP EG 2000 can divide encoded data from an upper layer to a lower layer. By decoding sequentially from the upper layer to the lower layer, the quality of image quality is improved step by step.
  • the spatial resolution level achieves spatial resolution scalability.
  • the spatial resolution level (70) is R, as shown in FIG. Is decomposed into 3 Tsunore bell R have R 2. This resolution level is used as one of the priorities for decoding. It is possible to control to increase the resolution sequentially from the lowest frequency band. Also, when the RGB signals are encoded respectively, R, There is room for selecting the order in which G and B are decoded.
  • the decoding of the spatial position of the image (the image of the specific area) can be prioritized.
  • the order of decoding can be controlled, and the quality of the reproduced image can be controlled.
  • JP EG 2000 four patterns are prepared.
  • FIG. 12 shows the data structure.
  • the RPCL data structure for realizing spatial resolution scalability is composed of resolution (80), position (81), color (82), and layer (83).
  • R. The size of 1 Z4 of the original image by decoding the data, the 1/2 the size of the original image by Rukoto be decoded to data, the same image resolution as the original image by decoding to data of R 2 Is obtained.
  • the resolution level (90) is set as shown in FIG. 13 in order to enable decoding at NZM times the resolution of the original image.
  • the data structure sets the resolution (101), position (102), color (103), and layer (104) as shown in Fig.14.
  • the decoder decodes R 0 , R x , R 2 , and R 3 sequentially to enable decoding of 14, 2/4, 34 of the original image and images of the same size as the original image in order. It becomes. Therefore, an image having a size of 34, which is not possible with JPEG 2000, with respect to the size of the original image, can be obtained.
  • the resolution levels may be set at unequal intervals as shown in FIG. In this case, on the decoding side, 1 Z4, 34 and And the same size image as the original image can be sequentially decoded.
  • the number of divisions in the vertical and horizontal directions is individually set in the band division unit of the encoder, and the resolution level is determined accordingly.
  • Fig. 16 shows a case where the number of divisions in the vertical direction is 3 and the number of divisions in the horizontal direction is 4.
  • the equal-band dividing unit 30 divides an image into three and four parts in the vertical and horizontal directions, respectively. Thereafter, for each band divided, c sets a resolution level, as shown in FIG. 1 6
  • the decoding side for example, R. . Extracting only 1/3 times vertically. 1/4 times wide images can be decoded. Also R. 0, R 0 1, R. 2, R 1 0, R, by extracting the R 1 2, longitudinally 2Z 3 times, that Do is possible conversion ratio such laterally 3/4 times to decode the different images.
  • the resolution levels are different at equal intervals as shown in FIG. 13, at uneven intervals as shown in FIG. 15, or different in the vertical and horizontal directions as shown in FIG. 16. There are various patterns such as cases. In any case, in order to enable decoding by the decoder, information on the resolution level is described in the header of the data structure of RLCP shown in FIG. 14 and the like.
  • the information item (1) is a flag for determining whether the resolution level in the vertical (X) and horizontal (Y) directions is the same or different. different 1 if they are the same, 0 if they are the same.
  • the information item in (2) is the number of band division levels.
  • the information item in (3) is the number of resolution levels.
  • Information items of (4) is intended to be added only when M ⁇ L R, indicating the number of bands included in the resolution level R (i).
  • FIG. 17 shows a configuration of a decoder according to the fourth embodiment of the present invention. Show. This decoder decodes the compressed data encoded in the third embodiment, and outputs a decoded image.
  • the decoder shown in the figure is a decoding unit of the embedded type ET-COP EB COT (EB COT decoding processing unit) 110-: L 12, an inverse quantization unit 1 13, equal-division synthesis filter puncture It consists of a band synthesis unit 1 1 4 force.
  • ET-COP EB COT EB COT decoding processing unit 110-: L 12
  • an inverse quantization unit 1 13 equal-division synthesis filter puncture It consists of a band synthesis unit 1 1 4 force.
  • the decoding unit has an encoded code extraction unit 110, an arithmetic decoding unit 111, and a coefficient bit modeling decoding unit 112.
  • the encoded code extraction unit 110 extracts the data given priority in encoding by an amount necessary for decoding.
  • Figure 18 shows the relationship (120) between the resolution of the decoded image and the resolution level. R to get 1/4 size image of original image. Only to get a 2/4 size image R. To obtain an image of 3/4 size with resolution levels of,, R. , The resolution level of the R 1 (R 2, to obtain an image of the original image and the sub I's R., R!, Extracts the resolution level of Te to base of R 2, R 3.
  • the compressed data is subjected to arithmetic decoding by the arithmetic decoding unit 111, coefficient bit modeling decoding by the coefficient bit modeling decoding unit 112, inverse quantization by the inverse quantization unit 113, and band synthesis. Input to the section 1 1 4.
  • the band synthesizing unit 114 restores the image by the same number of filter punctures as the band dividing unit, as shown in FIG.
  • the signal up-sampled by M times passes through each synthesis filter with a bandwidth of 2 ⁇ / ⁇ ⁇ ⁇ ⁇ , and is added to obtain an output.
  • the spatial resolution of the output image is equal to the spatial resolution of the original image.
  • the composition filter bank is configured as shown in the right figure (51) in FIG. That is, the resolution conversion of ⁇ / ⁇ can be realized by using the ⁇ division synthesis filter bank. ⁇ times the upsampled signal. Each signal passes through each synthesis filter with a bandwidth of 2 ⁇ ⁇ ⁇ and is added to obtain an output. At this time, the image has a spatial resolution of ⁇ / ⁇ times the resolution of the original image.
  • the decoder may automatically calculate from the resolution of the display device on the decoding side.
  • a method of automatically calculating will be described.
  • the information (1) to (4) in the header and the resolution of the original image are required.
  • the header By writing in the header in addition to the information in 1) to (4), all the above information can be obtained from the header. Note that, instead of using the header, transmission and reception of the above information may be performed on the application side that uses the encoder and the decoder.
  • a calculation method in the case where the number of divisions in the vertical and horizontal directions is equal and the resolution levels are set at equal intervals as shown in Fig. 13 is shown. It is assumed that the aspect ratio of the original image and the decoded image (the vertical and horizontal resolution ratio of the image) is the same.
  • the resolution of the display device provided on the decoding side is X (vertical) X Y (horizontal).
  • the required resolution level at this time is calculated by the procedure shown in the flowchart of FIG.
  • step 11 the size of the resolution corresponding to one resolution level is calculated.
  • step 12 the resolution of the decoded image is compared with the resolution corresponding to one resolution level calculated in step 11, and the resolution of the decoded image is set to the resolution corresponding to one resolution level. If it is less than or equal to, set the required resolution level to R. And the process ends.
  • One decoded image resolution If the resolution is larger than the resolution corresponding to the resolution level, the process proceeds to step 13.
  • Steps 11 to 13 is performed independently in the horizontal direction as ⁇ in the vertical direction.
  • the required maximum resolution level indexes in the vertical and horizontal directions are defined as ma X RX and max RY, respectively, the required resolution levels are as shown in Fig. 21.
  • the encoder When the compressed data is extracted not by the decoder but by the encoder, the encoder obtains the resolution of the display device screen on the decoder side and calculates the resolution level to be extracted.
  • FIG. 22 shows the configuration of the encoder according to the present embodiment.
  • the encoder shown in the figure has a band splitting unit 150 by DCT, a quantizing unit 151, and an embedded type ent-peak coding unit (152 to 154).
  • a band division method in band division section 150 of the present embodiment will be described with reference to FIG.
  • DCT band division the original image is divided into small blocks of the size of MXM, and DCT conversion is performed in small block units.
  • the quantization unit 151 the DCT coefficient is quantized.
  • control of the amount of compressed data does not perform quantization. Since quantization is possible, quantization can be omitted.
  • Embedded type The processing in the entropy encoding unit is basically the same as the processing described in the third embodiment.
  • the spatial resolution level is defined as shown in FIG.
  • the resolution level is set for each small block (MXM-order DCT conversion), and R is applied from the low-frequency DCT coefficient to the high-frequency DCT coefficient. , R, ...
  • Figure 25 shows the configuration.
  • the decoder shown in the figure is composed of an EBCOT decoding processing section 16 0 to 16 2, an inverse quantization section 16 3, a band synthesis section 164 using IDCT (inverse DCT transform), and a brightness adjustment section 1 65. Have.
  • compressed data given priority in encoding is extracted by an amount necessary for decoding.
  • the extracted compressed data is subjected to arithmetic decoding, coefficient bit modeling decoding, inverse quantization, and input to a band synthesis unit (IDCT) 164.
  • IDCT band synthesis unit
  • the order of encoding and decoding is set equal. That is, the inverse conversion of the MXM DCT conversion is the MXM IDCT conversion.
  • the processing described in the first to sixth embodiments is performed by It can be realized by using hardware such as hardware, or it can be realized by a program.
  • the processing described in each embodiment may be programmed, and the program may be installed and executed on a computer including a CPU, a memory, a hard disk, a communication device, and the like.
  • the program can be recorded on a recording medium such as a CD-ROM or a memory and distributed.
  • FIG. 28 shows resolutions at which a 1920 ⁇ 1080 HDTV image can be decoded when encoded by the present invention.
  • the number of divisions in the horizontal direction was set to 8 levels, and the number of divisions in the vertical direction was set to 9 levels so that the minimum resolvable resolution was almost the same as the resolution of JPEG 2000 above.
  • Image can be easily decoded from a single compressed file.
  • FIG. 29 shows the decoded image.
  • the coding parameters in the simulation are as follows: analysis filter bank band division number: 4 x 4, synthesis filter bank band division number: 1 x 1, 2 x 2, 3 x 3, number of tyres: 1, number of layers: 1 , Code block size: 6 4 X 6 4.
  • the compression rate in the encoder is 1/5, and the code size after compression is 127,05 bytes.
  • FIG. 31 shows the code size of the decoded image in the simulation and the PSNR (Peak Signal to Noise Ratio) characteristics compared with the reference image corresponding to each resolution.
  • the reference image is an image obtained by ideally performing image resolution conversion.
  • the value in parentheses is the number of bits bpp (bits per pixel) converted per pixel, and is the value obtained by dividing the number of bits required to decode each resolution image by each resolution.
  • good PSNR characteristics are obtained, and it can be seen that the decoded image obtained by the method of the present invention has little degradation.
  • the present invention efficient image encoding can be performed, and storage can be performed with a small disk capacity. Since it has spatial resolution scalability, it is possible to decode images at a spatial resolution that matches the performance and use of the image display device. Decoding from the low band to an arbitrary band enables reproduction of an image with a lower spatial resolution than the original image, and decoding of all data reproduces an image with the same resolution as the original image. Depending on the performance and application of the image display device, When an image with a lower spatial resolution is to be reproduced, only decoding of the coded data corresponding to the required band is required.
  • the processing time is shorter than that of reconstructing an image with the same resolution as the original image and converting the resolution, and when transmitting an encoded bitstream, only the necessary data needs to be transmitted. Also become smaller. Also, a decoded image having a resolution other than 1Z2n times the resolution of the original image can be obtained.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Abstract

符号化装置が、原画像をM個(Mは整数であり、かつ、M>2)の等帯域に分割し、分割した信号を、埋め込み型のエントロピー符号化方法を用いて符号化する。復号化装置は、前記符号化装置により符号化された符号化データを受信し、当該符号化データから、分割された複数の信号のうち低周波数帯域側からN個分の信号を取り出してエントロピー復号化方法により復号化し、復号化されたN個分の信号を合成し、原画像に対してN/M倍(M、Nは整数であり、かつ、1≦N≦M、かつ、M>2)の解像度の復号画像を得る。

Description

明細書 符号化方法及ぴ復号化方法及び符号化装置及び複号化装置 技術分野
本発明は、 符号化方法及び複号化方法及び符号化装置及び復号 化装置に係り、 特に、 画像を効率よく伝送、 蓄積するための符号 化方法及び複号化方法及び符号化装置及び復号化装置に関する。 背景技術
従来、 画像符号化の国際標準規格として、
( 1 ) 動画像を対象とした M P E G (Moving Picture Expert s Group) (例えば、 "映像メディア学会編 「MP EG」 、 オーム 社、 1 9 9 6年 4月" 参照) ;
( 2) 静止画像を対象とした J P E G 2 0 0 0 (例えば、
"IS0/IEC 15444-1 JPEG2000 Parti: Core coding system, 200 0-12-15" 参照) ; はよく知られている。
MP EGは、 動き捕償と D CT (離散コサイン変換) を用いた 手法で、 フレーム間相関とフレーム相関を効率よく除去すること により高い符号化効率を実現している。 一方、 J P EG 2 0 0 0 はウェーブレツ ト変換と E B COTと呼ばれる埋め込み型のェン ト口ピー符号化を用いた手法であり、 フレーム間相関を利用して ないため MP E Gと比較すると符号化効率は劣るものの、 MP E Gにはない空間 ' S NR (Signal- to - Noise Ratio)スケーラビリ ティなど様々な有効な機能を持つ。 動画像への適用も可能とした Motion J P E G 2 0 0 0も提案されており、 J P EG 2 0 0 0と 同様な機能を持つ。
J P EG 2 0 0 0で用いられるスケーラビリティは、 埋め込み 型と呼ばれ、 符号器は一度符号化するのみで個々の解像度に応じ て圧縮データを作りなおす必要がない。 単一の圧縮ファイルから, 様々な解像度 ' S NRの復号画像が得られ、 ファイル容量の削減, 計算量の軽減にもつながる。 図 1は、 J P E G 2 0 0 0の解像度 スケーラピリティ機能を示す。 原画像の解像度が K X Lの場合、 復号器では、 K> 2 n X L/ 2 nの解像度の画像が復元可能となる c 上記の J P E G 2 0 0 0では、 原画像よりも小さい解像度の画 像が復元可能であるが、 その解像度は原画像の 1 2 n (nは正 の整数) に限定される。 しかしながら、 通常、 復号側で必要とさ れる画像の解像度は、 原画像の解像度の 1 2 n倍のみにとどま らないという問題がある。 発明の開示
本発明は、 上記の点に鑑みなされたもので、 より一般的な解像 度で復号画像を得ることを可能とする埋め込み型の符号化及ぴ復 号化の技術を提供することを目的とする。
上記の目的は、 原画像の符号化を行う符号化方法であって、 入 力された原画像を M個 (Mは整数であり、 かつ、 M> 2) の等帯 域に分割する分割ステップと、 原画像を等帯域に分割して得られ た信号を、 埋め込み型のェント口ピー符号化方法を用いて符号化 する符号化ステップとを有する符号化方法により解決される。
本発明によれば、 原画像を等帯域に分割し、 埋め込み型のェン トロピー符号化方法を用いて符号化するので、 復号側で原画像の 解像度の 1 / 2 n倍に限られない解像度の画像を得ることができ る。
なお、 前記符号化ステップにおいて得られる符号化データは、 分割された複数の帯域において低周波数帯域側から順に定義され た解像度レベルの情報を含む。
また、 前記符号化データは、 画像の縦方向と横方向のそれぞれ について、 解像度レベルの情報を含むようにしてもよい。 また、 上記の課題は、 原画像の符号化を行う符号化方法であつ て、 入力された原画像を直交変換により複数の係数に変換する変 換ステップと、 前記複数の係数を、 埋 込み型のエン トロ ピー符 号化方法を用いて符号化する符号化ステップとを有する符号化方 法によっても解決.される。
前記符号化ステップにおいて得られる符号化データは、 前記複 数の係数に対応する周波数成分において低周波数成分側から順に 定義された解像度レベルの情報を含む。
また、 上記の課題は、 原画像に対して N /M倍 (M、 Nは整数 であり、 かつ、 1≤N≤M、 かつ、 M > 2 ) の解像度で符号化デ 一タを復号するための複号化方法であって、 原画像を M個の等帯 域に分割して符号化された符号化データを受信し、 当該符号化デ ータから、 分割された複数の信号のうち低周波数帯域側から N個 分の信号を取り出してェント口ピー復号化方法により複号化する 複号化ステップと、 復号化された N個分の信号を合成する帯域合 成ステップとを有する複号化方法によっても解決される。
上記の方法において、 原画像の解像度と所定の解像度を取得し. 当該所定の解像度に適した前記 Nの値を、 原画像の解像度と前記 分割数 Mを用いて算出する算出ステップを更に有してもよい。
また、 上記の課題は、 原画像に対して N /M倍 (M、 Nは整数 であり、 かつ、 1≤N≤M、 かつ、 M > 2 ) の解像度で符号化デ 一タを復号するための復号化方法であって、 原画像を M個の周波 数成分の係数に分割して符号化された符号化データを受信し、 当 該符号化データから、 分割された複数の信号のうち低周波数成分 側から N個分の信号を取り出してェント口ピー復号化方法により 復号化する復号化ステップと、 復号化された N個分の信号を合成 する合成ステップとを有する複号化方法によっても解決される。
また、 本発明によれば、 上記の方法における各ステップを実行 する手段を備えた装置が提供される。 更に、 上記の方法における 各ステップをコンピュータに実行きせるプログラムと、 そのプロ グラムを記録したコンピュータ読み取り可能な記録媒体が提供さ れる。
上記のように、 本発明によれば、 原画像の解像度の 1 Z 2 n倍 以外の大きさの解像度を持つ復号画像を得ることができる。 図面の簡単な説明
図 1は、 J P E G 2 0 0 0解像度スケーラビリティを示す図で ある。
図 2は、 本発明の一実施の形態における有理数倍の変換が可能 な解像度スケーラビリティ機能を示す図である。
図 3は、 本発明の第 1の実施の形態におけるスケーラブル符号 器の基本構成図である。
図 4は、 第 1の実施の形態におけるスケーラブル符号器の動作 を説明するためのフローチャートである。
図 5は、 本発明の第 2の実施の形態におけるスケーラブル復号 器の基本構成図である。
図 6は、 第 2の実施の形態におけるスケーラブル復号器の動作 を説明するためのフローチヤ一トである。
図 7は、 本発明の第 3の実施の形態におけるフィルタバンク と E B C O Tを用いた符号器の構成図である。
図 8は、 M a 1 1 a t分割を説明するための図である。
図 9は、 本発明の第 3の実施の形態におけるフィルタバンクを 用いた N /M倍解像度変換を説明するための図である。
図 1 0は、 本発明の第 3の実施の形態における M a 1 1 a t分 割と等帯域分割を説明するための図である。
図 1 1は、 本発明の第 3の実施の形態の J P E G 2 0 0 0にお ける空間解像度レベルを示す図である。
図 1 2は、 R P C Lデータ構造を示す図である。 図 1 3は、 本発明の第 3の実施の形態における空間解像度レべ ルを示す図である。
図 1 4は、 本発明の第 3の実施の形態における空間解像度スケ ーラピリティを実現する R P C Lデータ構造を示す図である。 図 1 5は、 解像度レベルを不等間隔に設定した例を示す図であ る。
図 1 6は、 画像の縦方向の変換比率と横方向の変換比率が異な る場合の例を示す図である。
図 1 7は、 本発明の第 4の実施の形態におけるフィルタバンク と E B C O Tを用いた復号器の構成図である。
図 1 8は、 本発明の第 4の実施の形態における解像度レベルと 解像度の関係を示す図である。
図 1 9は、 解像度変換を行わない場合の一般的な等分割フィル タバンクの構成図である。
図 2 0は、 自動的に必要な解像度レベルを算出するためのフロ 一チヤ一トである。
図 2 1は、 縦方向と横方向の変換比率が異なる場合において算 出された必要な解像度レベルの例である。
図 2 2は、 本発明の第 5の実施の形態における符号器の構成図 である。
図 2 3は、 第 5の実施の形態における帯域分割方法を説明する ための図である。
図 2 4は、 第 5の実施の形態における空間解像度レベルの定義 方法を示す図である。
図 2 5は、 本発明の第 6の実施の形態における復号器の構成図 である。
図 2 6は、 第 6の実施の形態における復号器の帯域合成部にお ける処理を説明するための図である。
図 2 7は、 J P E G 2 0 0 0で符号化した場合に復号可能な解 像度について説明するための図である。
図 2 8は、 本発明の第 7の実施の形態における H D T V画像を 符号化したときの復号可能な解像度レベルを示す図である。
図 2 9は、 シミ ュレーショ ンで使用した原画像である。
図 3 0は、 シミ ュレーショ ンでの復号画像である。
図 3 1は、 シミュレーションにおける復号画像のコードサイズ と P S N R特性を示す表である。 発明を実施するための最良の形態
以下、 図面と共に本発明の実施の形態について説明する。
最初に、 本発明における解像度スケーラピリティ機能について 説明する。
図 2は、 本発明の一実施の形態における解像度スケーラビリテ ィ機能を示す。 同図に示す符号化システムでは、 解像度が K X L の画像を符号化部が符号化し、 単一の圧縮データを生成する。 復 号化部では、 この圧縮データの一部のビッ トストリームを取り出 すことで、 同図に示すような解像度が原画像の有理数倍すなわち N /M倍 (M、 Nは整数であり、 かつ、 1≤N≤M、 かつ、 M > 2 ) の画像を得ることができる。
なお、 原画像の有理数倍の画像を得るための符号化コードの一 部の抽出の場所について、 本例では、 復号化部側で行っているが 別の例として、 符号化部側で行ってもよい。 この別の例の枠組み は J P E G 2 0 0 0と同じである。 また、 更なる別例として、 符 号化部と復号化部との間に伝送手段で接続された中継装置におい て、 当該符号化コードの一部の抽出を行ってもよい。
[第 1の実施の形態]
図 3は、 本発明の第 1の実施の形態における、 任意の有理数倍 の空間解像度で復号可能とする圧縮データを生成するスケーラブ ル符号器の基本構成を示す。 同図に示すスケーラブル符号器は、 等帯域分割部 1 0、 量子化 部 1 1、 埋め込み型のェント口ピー符号化部 1 2から構成される ( 図 4のフローチヤ一トを参照して、 このスケーラブル符号器の動 作について説明する。
入力された原画像は、 等帯域分割部 1 0において、 M個の等帯 域に分割される (ステップ 1 ) 。 分割には、 フィルタバンク (P. Vaidyanathan, 「マルチレー ト信号処理とフィルタバンク」 , 科 学技術出版, 2 0 0 1年 1 1月) や直交変換 (小野文孝, 渡辺裕. 「国際標準画像符号化の基礎技術」 , コロナ社, 1 9 9 8年 3月 ) などを用いる。 なお、 フィルタバンク と直交変換については、 例えば、 "阿久津幸恵、 小林弘幸、 貴家仁志、 「直交変換、 フィ ルタバンクおょぴウェーブレツ ト変換を用いた解像度変換の一評 価法」 、 信学技報 D S P 9 3 _ 2 6 " にも記載されている。
分割された信号は量子化部 1 1によって量子化され (ステップ 2 ) 、 埋め込み型のエン トロ ピー符号化部 1 2において、 E B C O T ( IS0/IEC 15444-1 JPEG2000 Part I: Core coding system, 2000 - 12 - 15 ) や E Z B C ( S. T. Hsiang and J. W. Woods,
"Embedded vi deo coding using invertibl e motion compensated 3-D subband/wavelet fi lter bank, " Signal Processing: Image Communication, vol. 16, May 2001, pp. 705-724) などの埋め込 み型のェント口ピー符号方法によって圧縮データを生成する '(ス テツプ 3 ) 。
埋め込み型ェント口ピー符号化部 1 2は、 復号器側においてス ケーラブル復号を可能とする符号化データを生成するェントロピ 一符号器である。
なお、 等帯域分割部 1 0 と して、 フィルタバンクを用いる場合 の符号器の詳細を第 3の実施の形態で説明し、 等帯域分割部 1 0 として、 直交変換器を用いる場合の符号器の詳細を第 5の実施の 形態で説明する。 [第 2の実施の形態]
図 5は、 本発明の第 2の実施の形態におけるスケーラブル復号 器の基本構成を示す。 第 2の実施の形態におけるスケーラブル復 号器は、 第 1の実施の形態の符号器で生成した圧縮データを、 任 意の有理数倍の空間解像度で復号する復号器である。
同図に示すスケーラブル復号器は、 埋め込み型ェント口ピー復 号化部 2 0、 逆量子化部 2 1、 帯域合成部 2 2から構成される。 図 6のフローチヤ一トを参照して、 このスケーラブル復号器の動 作について説明する。
埋め込み型エン トロピー複号化部 2 0においては、 入力された 圧縮データのうち低周波数帯域側から N /M分の帯域のデータを 抽出し (ステップ 4 ) 、 エン トロピー復号化を行う (ステップ 5 ) 。
逆量子化部 2 1において、 埋め込み型ェント口ピー複号化部で 復号化された信号を逆量子化する (ステップ 6 ) 。 帯域合成部 2 2においては、 逆量子化部 2 1で逆量子化された信号を合成し画 像を出力する (ステップ 7 ) 。
帯域合成部 2 2としては、 符号器側の画像分割方法に応じて、 フィルタバンクもしくは逆 D C T変換 ( I D C T ) などの直交変 換器を用いることができる。 フィルタパンクを用いる場合の復号 器の詳細を第 4の実施の形態で説明し、 直交変換器を用いる場合 の復号器の詳細を第 6の実施の形態で説明する。
[第 3の実施の形態]
本実施の形態では、 等帯域分割部としてフィルタバンクを用い 埋め込み型のェント口ピー符号化方法として E B C O Tを用いた 場合の符号器について説明する。
図 7は、 本発明の第 3の実施の形態における符号器の構成を示 す。
同図に示す符号器は、 等分割分析フィルタパンクを用いた等帯 域分割部 3 0、 量子化部 3 1、 埋め込み型のェント口ピー符号化 部 3 2〜 34から構成される。
J P EG 20 00においては、 帯域分割としてウェーブレツ ト 変換を用いている。 ウェーブレッ ト変換は、 図 8に示す 「Ma 1 1 a t分割」 と呼ばれる分割法により帯域分割を行う。 Ma 1 1 a t分割では、 1次元の 2分割フィルタを用いて低域方向に次々 に分割することによって、 入力信号を複数の帯域に分割すること ができる。 図 8の上図 (40) に示すように D回分割することに よって、 原画像に対して 1 / 2 Dの大きさの空間解像度を持つ画 像まで分割可能となる。 この処理を、 水平方向及び垂直方向にそ れぞれ施す。 復号側では図 8の下図 (4 1 ) に示すように低域側 から順次復号する。 U回復号することによって、 原画像に対して 2U/ 2 D= 1 / 2 n倍の大きさの空間解像度を持つ画像が復元で さる。
一方、 本発明においては、 帯域分割として図 9の左部分 (5 0 ) に示す等分割分析フィルタバンクを用いる。 等分割分析フィル タバンクにおいては、 帯域幅が等しい M個のフィルタを用いて、 原画像を M個の等帯域に分割する。 それぞれのフィルタの出力を 1/Mに間引く (ダウンサンプリング) ことによって最終的な出 力を得る。 なお、 比較のため図 1 0には、 J P EG 20 00によ る Ma 1 1 a t分割 (6 0) と、 本発明による等帯域分割 (6 1 ) を示している。
図 7の量子化部 3 1においては、 等帯域分割部 3 0の出力信号 を量子化する。 なお、 エン トロピー符号化部 (E B COT符号化 処理部) 3 2〜 34を用いることによって、 圧縮データ量の制御 が量子化を行わなくても可能であるために、 量子化は省略可能で ある。
E B C OTは、 埋め込み型のェント口ピー符号化方法の一種で ある。 E B COTによるェントロピー符号化部 3 2 ~ 34では、 まず、 係数ビッ トモデリング部 3 2において、 画像を、 • コードブロック分割
• ビッ トプレーン分割
•各ビッ トプレーンのサブプレーン (3つのパス) への分解 と次々に分割し、 算術符号化部 3 3において、 パスを最小単位と して算術符号化する。 算術符号化されたデータは、 パスを最小単 位としてビットを切捨てる (ポス ト量子化) ことができる。 符号 量の制御は、 このポスト処理だけで可能となる。 そして、 符号化 コードバケツト化部 34において、 算術符号化により符号化され た圧縮データがパケット化され、 符号ス ト リームとして送信され る。
空間解像度や S NRスケーラビリティなどの階層符号化は、 上 記のパス単位にある程度優先度を付け、 復号時の時間的優先度を 制御することにより実現できる。 優先度としては、
· L : レイヤ (S NRレべノレ)
• R : 空間解像度レベル
• P :位置
• C : 色成分
の 4つがある。
レイヤは、 S N Rに基づく基準であり、 J P EG 200 0では 符号化されたデータを上位レイヤから下位レイヤに分割すること ができる。 上位レイヤから下位レイャへ向かって順次復号するこ とによって、 画質の品質を段階的に改善する。 空間解像度レベル は、 空間解像度のスケーラビリティを実現する。 図 1 0のように 2レベルにゥヱーブレッ ト変換が施された場合、 空間解像度レべ ル ( 70) は、 図 1 1に示すように、 R。, Rい R2の 3つのレ ベルに分解される。 この解像度レベルを復号時の優先順位の一つ として使用する。 最低周波数帯域から順次解像度を上げる制御が 可能となる。 また、 RGB信号をそれぞれ符号化した場合、 R, G, Bをそれぞれどのような順番で復号するかに選択の余地があ る。 さらに、 画像の空間的位置 (特定領域の画像) の復号を優先 することができる。 上記の 4つの優先度をどのように並べるかに よって、 復号時の順序を制御でき、 再生画像の品質を制御するこ とができる。 J P EG 2 0 0 0では、 4つのパターンが用意され ている。
1 ) L R C P
2 ) R L C P
3 ) P C R L
4 ) C P R L
段階的復号を可能とする空間解像度スケーラビリティは、 2) R L C Pのパターンによって可能となる。 そのデータ構造を図 1 2に示す。 図 1 2に示すように空間解像度スケーラビリティを実 現する R P C Lデータ構造は、 解像度 (8 0) 、 位置 (8 1 ) 、 色 (8 2) 、 レイヤ (8 3) からなる。 R。のデータを復号する ことによって原画像の 1 Z4の大きさ、 のデータまで復号す ることによって原画像の 1 / 2の大きさ、 R2のデータまで復号 することで原画像と同じ解像度の画像が得られる。
本発明では、 原画像に対して NZM倍の解像度で復号を可能と するため、 解像度レベル (9 0) を図 1 3のように設定する。 こ のとき、 データ構造は、 図 1 4のように、 解像度 ( 1 0 1 ) 、 位 置 ( 1 0 2) 、 色 ( 1 0 3) 、 レイヤ ( 1 04) を設定する。 復 号器において、 R0, R x, R2, R 3まで順次復号することで原 画像の 1 4、 2/4 , 3 4及び原画像と同サイズ画像を、 順 次復号することが可能となる。 従って、 J P EG 2 0 00では不 可能な、 原画像のサイズに対して 3 4のサイズの画像が得られ る。
なお、 解像度レベルは図 1 5に示すように不等間隔に設定して もよい。 この場合、 復号側において原画像の 1 Z4、 3 4およ び原画像と同サイズ画像を順次復号することが可能となる。
また、 画像の縦方向の変換比率と横方向の変換比率を変えるこ とも可能である。 その際には、 符号器の帯域分割部にて縦方向と 横方向の分割数を個別に設定し、 それに対応して解像度レベルを 決定する。
例として、 縦方向の分割数を 3、 横方向の分割数を 4の場合を 図 1 6に示す。 まず、 等帯域分割部 3 0によって、 画像を縦およ ぴ横方向にそれぞれ 3分割および 4分割する。 その後、 分割され た各帯域に対して、 図 1 6に示すように解像度レベルを設定する c この場合、 復号側では、 例えば R。。のみを抽出すると縦 1 / 3倍. 横 1 /4倍の画像を復号できる。 また、 R。0、 R 0 1、 R。2、 R 1 0、 R 、 R 1 2を抽出することで、 縦方向に 2Z 3倍、 横方向に 3 / 4倍といった変換比率が異なった画像を復号することが可能とな る。
上述したように、 解像度レベルは、 図 1 3に示すように等間隔 の場合や、 図 1 5に示すように不等間隔の場合、 あるいは図 1 6 に示すように縦方向と横方向で異なる場合など種々のパターンが 存在する。 いずれの場合にも、 復号器で復号可能とするために、 図 1 4等に示した R L C Pのデータ構造におけるヘッダに解像度 レベルに関する情報が記述される。
解像度レベルに関してへッダに記述される情報項目を以下に示 す。
( 1 ) X Y : 1 o r 0
K 2 ) Decomposition Level:
、3 ) Number of Resolution Levels: L R
( 4 ) Number of subbands included in Resolution Level i:
Number_R(i) ( i = 0 , 1 , - - · , LR- 1 )
( 1 ) の情報項目は、 縦方向 (X) と横方向 (Y) の解像度レ ベルが同じか異なるかを判断するためのフラッグである。 異なる 場合は 1、 同じ場合は 0となる。 ( 2) の情報項目は、 帯域分割 レベルの数である。 (3) の情報項目は、 解像度レベルの数であ る。 (4) の情報項目は、 M≠ LRの場合のみに追加されるもの であり、 解像度レベル R ( i ) に含まれる帯域数を示す。
縦方向と横方向の解像度レベルが異なる場合は、 縦方向と横方 向のそれぞれに対して、 縦方向→横方向の順序で、 上記 (2) 、 (3) 、 (4) の情報を記述する。 - 例として、 解像度レベルがそれぞれ図 1 3、 図 1 5、 図 1 6 (右側) のように与えられたとき、 上記ヘッダ情報は以下となる [図 1 3の場合]
( 1 ) X Y = 0
( 2 ) M = 4
(3) LR = 4
[図 1 5の場合]
( 1 ) X Y = 0
( 2 ) M = 4
(3) LR = 3
( 4 ) Number_R(0) = 1 Number_R(l) = 2 , Number_R(2) =
[図 1 6の場合]
( 1 ) X Y 1
(2) Μ = 3
(3) LR = 3
(4) Μ = 4
(5) LR = 4
[第 4の実施の形態]
本実施の形態では、 帯域合成部としてフィルタパンクを、 また. 埋め込み型ェント口ピー符号化として E B C OTを用いた復号器 を説明する。
図 1 7は、 本発明の第 4の実施の形態における復号器の構成を 示す。 この復号器は、 前述の第 3の実施の形態において符号化し た圧縮データを復号化し、 復号画像を出力する。
同図に示す復号器は、 埋め込み型ェント口ピー符号化 E B CO Tの復号部 (E B COT復号処理部) 1 1 0〜: L 1 2、 逆量子化 部 1 1 3、 等分割合成フィルタパンクによる帯域合成部 1 1 4力 ら構成されている。
復号部は、 符号化コード抽出部 1 1 0、 算術復号部 1 1 1、 係 数ビッ トモデリング復号部 1 1 2を有している。
符号化コード抽出部 1 1 0においては、 符号化において優先付 けされたデータを復号に必要な量だけ取り出す。 図 1 8には、 復 号画像の解像度と解像度レベルとの関係 ( 1 20) を示す。 原画 像の 1 / 4サイズの画像を得るには R。のみ、 2/4のサイズの 画像を得るには R。, の解像度レベルを、 3/4のサイズの画 像を得るには、 R。, R 1 ( R2の解像度レベルを、 原画像と同サ ィズの画像を得るには R。, R !, R 2, R3のすベての解像度レ ベルを抽出する。 抽出された圧縮データは、 算術復号化部 1 1 1 で算術復号され、 係数ビッ トモデリング復号部 1 1 2で係数ビッ トモデリング復号され、 逆量子化部 1 1 3で逆量子化された後、 帯域合成部 1 1 4へ入力される。
通常、 解像度変換を行わない場合には、 帯域合成部 1 1 4では. 図 1 9に示すように、 帯域分割部と等しい数のフィルタパンクに よって画像が復元される。 M倍にアップサンプルされた信号は、 それぞれ 2 π/Μの帯域幅を持つ各合成フィルタを通り、 加算さ れ出力を得る。 この場合、 出力画像の空間解像度は原画像の空間 解像度に等しい。
原画像に対して Ν /Μ倍の解像度の画像を得るためには、 合成 フィルタバンクを図 9の右図 (5 1 ) に示す構成にする。 即ち、 Ν/Μ倍の解像度変換は、 Ν分割合成フィルタバンクを用いるこ とによって実現できる。 Ν倍にアップサンプリングされた信号は. それぞれ 2 π Ζ Νの帯域幅を持つ各合成フィルタを通り、 加算さ れ、 出力を得る。 このとき、 原画像の Ν /Μ倍の解像度の空間解 像度を持つ画像となる。
さて、 図 1 7の符号化コード抽出部 1 1 0において、 圧縮デー タの必要な部分だけを抽出する際に、 どの解像度レベルのデータ を抽出するかは、 復号器に明示的に指定してもよいし、 復号側の 表示装置の解像度から復号器が自動的に算出するようにしてもよ い。 以下、 自動的に算出する方法について説明する。
必要な解像度レベルを計算するには、 ヘッダにおける ( 1 ) 〜 ( 4 ) の情報、 及び原画像の解像度 (Κ (縦) X L (横) ) が必 要となるが、 原画像の解像度も ( 1 ) 〜 ( 4 ) の情報に加えてへ ッダに記述しておくことにより、 ヘッダから上記の全ての情報を 取得できる。 なお、 ヘッダを用いる代わりに、 上記の情報の送受 信を、 符号器、 復号器を利用するアプリケーショ ン側で行っても よい。
ここでは、 最も一般的な例として、 図 1 3のよ うに縦方向と横 方向の分割数が等しく、 解像度レベルを等間隔に設定した場合の 計算方法を示す。 なお、 原画像と復号画像のアスペク ト比 (画像 の縦と横の解像度比率) は同じであると仮定する。 また、 復号側 で与えられる表示装置の解像度は X (縦) X Y (横) であるとす る。
このとき必要な解像度レベルは、 図 2 0のフローチヤ一トに示 す手順により計算される。
まず、 ステップ 1 1において、 1つの解像度レベルに対応する 解像度の大きさを算出する。 次に、 ステップ 1 2において、 復号 画像の解像度とステップ 1 1で算出した 1つの解像度レベルに対 応する解像度の大きさとを比較し、 復号画像の解像度が 1つの解 像度レベルに対応する解像度の大きさ以下であれば、 必要な解像 度レベルを R。として処理を終了する。 復号画像の解像度が 1つ の解像度レベルに対応する解像度の大きさよ り大きい場合にはス テツプ 1 3に進む。
ステップ 1 3において、 必要な最大解像度レベルのィンデック ス ma x Rを算出する。 なお、 r o u n d () は切捨て演算子で ある。 そして、 ステップ 1 4において、 必要な解像度レベル =R ο» Ri. · · ·, Rma xRを決定し、 処理を終了する。
なお、 図 1 6に示すように縦方向と横方向の変換比率が異なる 場合には、 ステップ 1 1〜ステップ 1 3の処理を縦方向ならぴに 横方向に独立に行う。 このとき、 縦方向ならびに横方向に関して 必要な最大解像度レベルのィンデッタスをそれぞれ m a X RXな らびに m a x RYと定義すると、 必要な解像度レベルは図 2 1に 示す通り となる。
なお、 圧縮データの抽出を復号器でなく、 符号器側で行う場合 には、 符号器側が復号器側の表示装置画面の解像度を取得し、 抽 出すべき解像度レベルを算出する。
[第 5の実施の形態]
本実施の形態では、 画像分割方法として D CTを用いた場合の 符号器について説明する。 図 22に、 本実施の形態の符号器の構 成を示す。
同図に示す符号器は、 D C Tによる帯域分割部 1 5 0、 量子化 部 1 5 1、 埋め込み型のェント口ピー符号化部 ( 1 5 2〜 1 54 ) を有している。
本実施の形態の帯域分割部 1 5 0における帯域分割方法を図 2 3を参照して説明する。 DC Tによる帯域分割では、 原画像を M XMの大きさの小ブロックに分割し、 小ブロック単位で D C T変 換を行う。 量子化部 1 5 1においては、 D CT係数を量子化する, なお、 第 3の実施の形態と同様、 符号化方法として E B COTを 用いることによって、 圧縮データ量の制御が量子化を行わなくて も可能であるために、 量子化は省略可能である。 埋め込み型のェ ントロピー符号化部における処理は、 第 3の実施の形態で説明し た処理と基本的に同じである。
D CT変換によつて帯域分割を行った場合、 空間解像度レベル は、 図 24のように定義する。 各小ブロック (MXM次の D CT 変換) 単位で、 それぞれ解像度レベルの設定を行い、 低周波の D CT係数から高周波の DCT係数へ向かって、 R。、 R 、 · · ·
RM- iと設定する。
[第 6の実施の形態]
本実施の形態では、 第 5の実施の形態に示す符号器により符号 化した圧縮データを復号する復号器について説明する。 図 2 5に その構成を示す。
同図に示す復号器は、 E B C O T復号処理部 1 6 0〜 1 6 2、 逆量子化部 1 6 3、 I DCT (逆 D CT変換) による帯域合成部 1 64、 輝度調整部 1 6 5を有している。
E B C O T復号処理部の中の符号化コード抽出部 1 6 0におい ては、 第 4の実施の形態と同様にして、 符号化において優先付け られた圧縮データを復号に必要な量だけ抽出する。 抽出された圧 縮データは、 算術復号、 係数ビッ トモデリ ング復号され、 逆量子 化の後、 帯域合成部 ( I D C T) 1 64へ入力される。
解像度変換を伴わない通常の D C T変換→ I D C T変換では、 符号化と復号化の次数は等しく設定する。 すなわち、 MXMの D CT変換の逆変換は、 MXMの I D C T変換となる。
一方、 本発明では、 原画像に対して N/M倍の解像度の画像を 得るために、 図 2 6に示すように低域側の N XN個の D C T係数 に対して、 N XN次の I D C T変換を行う。 なお、 NXN個以外 の係数は破棄する。 この処理を各小プロックごとに行う。 最後に 輝度調整部 1 6 5で輝度調整を行い、 原画像の NZM倍の空間解 像度を持つ画像を出力する。
なお、 第 1〜第 6の実施の形態で説明した処理は、 論理回路か らなるハードウヱァを用いて実現することもできるし、 プログラ ムにより実現することもできる。 プログラムで実現する場合、 各 実施の形態で説明した処理内容をプログラム化し、 そのプログラ ムを、 C PU、 メモリ、 ハードディスク、 通信装置等を備えたコ ンピュータにインス トールし、 実行すればよい。 また、 当該プロ グラムを CD— ROM、 メモリ等の記録媒体に記録し、 配布する こともできる。
[第 7の実施の形態]
本実施の形態では、 本発明の適用例について説明する。 一例と して、 1 9 2 0 X 1 0 8 0画素の HD T V画像を、 本発明の方法 で符号化したときに復号可能な解像度について説明する。 比較の ために、 J P E G 2 0 0 0で符号化した場合の例を図 2 7に示す。 分割レベル数を 3とすると、 復号可能な解像度は縦横それぞれ原 画像の l /2 n (n = l, 2, 3 ) であることから、 復号可能な 解像度は、
• 2 4 0 X 1 3 5
- 4 8 0 X 2 70 *
• 9 6 0 X 5 40
- 1 9 0 2 X 1 0 8 0
となる。 このために、 広く流通する S DTV画像を復号できない。 一方、 1 9 20 X 1 0 8 0の HDTV画像を、 本発明により符 号化したときに復号可能な解像度を図 2 8に示す。 復号可能な最 小の解像度が上記の J P EG 2 0 0 0とほぼ同じ解像度となるよ うに、 横方向の分割数を 8 レベル、 縦方向の分割数を 9 レベルに 設定した。 このとき、 復号可能な最小の解像度は、 2 4 0 X 1 2 0画素となり、 一般的に 24 0 mX 1 2 0 n (但し、 n, mは正 の整数、 n = l, 2 , …, 8, m= l, 2, …, 9 ) 画素の画像 が復号可能となる。 この場合、 広く流通する
• 7 2 0 X 3 6 0 (SDTV, 上下に黒入れ) • 9 6 0 X 4 8 0 (SDTV, 左右を力ット)
- 1 44 0 X 7 2 0 ( 7 2 0 p , 7 2 0 i )
• 1 9 2 0 X 1 0 8 0 (HDTV)
の画像が、 単一の圧縮ファイルから容易に復号可能となる。
次に、 本発明の方法を用いたシミ ュレーショ ン結果を示す。 シ ミュレーションでは、 図 2 9に示す原画像 ( S I D B A標準画 像) を、 本発明の符号化方法で符号化し、 本発明の復号化方法に より種々の解像度で復号した。 図 3 0に復号画像を示す。 シミュ レーショ ンにおける符号化パラメータは、 分析フィルタバンクの 帯域分割数: 4 X 4、 合成フィルタバンクの帯域分割数: 1 X 1、 2 X 2、 3 X 3、 タイノレ数: 1、 レイヤ数: 1、 コードブロック の大きさ : 6 4 X 6 4である。 符号器における圧縮レートは 1 / 5であり、 圧縮後のコードサイズは 1 2 7 0 5バイ トである。
また、 図 3 1に、 シミ ュレーショ ンにおける復号画像のコード サイズと、 各解像度に対応する参照画像と比較した P S NR (Pe ak Signal to Noise Ratio) 特性を示す。 ここで、 参照画像は理 想的に画像の解像度変換を行うことにより得られる画像である。 なお、 かっこ内の値は、 1画素あたりに換算したビッ ト数 b p p (bits per pixel) であり、 各解像度画像を復号するのに必要な ビッ ト数を各解像度で割った値である。 図 3 1に示すように、 良 好な P S NR特性が得られており、 本発明の方法により得られた 復号画像は劣化が小さいことがわかる。
上述のように、 本発明によれば、 効率の良い画像符号化ができ、 少ないディスク容量で保存が可能になる。 空間解像度スケーラビ リティを有するために、 画像表示機器の性能や用途に応じた空間 解像度で画像を復号することが可能である。 低域から任意の帯域 まで復号すると原画像よりも低い空間解像度の画像を再生でき、 すべてのデータを復号すると、 原画像と同じ解像度の画像が再生 される。 また、 画像表示機器の性能や用途に応じて、 原画像より も低い空間解像度の画像を再生する場合は、 必要な帯域までに対 応する符号化データの復号のみが必要とされる。 原画像と同じ解 像度の画像を再生して解像度変換を行うよりも処理時間が短く、 また、 符号化ビッ トス トリームを伝送する場合は必要なデータの みを伝送すればよいため、 伝送レー トも小さくなる。 また、 原画 像の解像度の 1 Z 2 n倍以外の大きさの解像度を持つ復号画像を 得ることができる。
なお、 本発明は、 上記の実施例に限定されることなく、 特許請 求の範囲内で種々変更 ·応用が可能である。

Claims

請求の範囲
1. 原画像の符号化を行う符号化方法であって、
入力された原画像を M個 (Mは整数であり、 かつ、 M> 2) の 等帯域に分割する分割ステップと、
原画像を等帯域に分割して得られた信号を、 埋め込み型のェン ト口ピー符号化方法を用いて符号化する符号化ステップと を有することを特徴とする符号化方法。
2. 前記分割ステップにより得られた信号を量子化する量子化ス テツプを更に有し、 前記符号化ステップにおいて、 当該量子化ス テツプにより得られた信号を符号化する請求項 1に記載の符号化 方法。
3. 前記分割ステップにおいて、 等分割フィルタバンク用い、 前 記符号化ステップにおいて、 静止画像国際標準 J PEG 2 0 0 0 で用いられている E B C OTを用いる請求項 1に記載の符号化方 法。
4. 前記符号化ステップにおいて得られる符号化データは、 分割 された複数の帯域において低周波数帯域側から順に定義された解 像度レベルの情報を含む請求項 1に記載の符号化方法。
5. 前記符号化データは、 画像の縦方向と横方向のそれぞれにつ いて、 解像度レベルの情報を含む請求項 4に記載の符号化方法。
6. 原画像の符号化を行う符号化方法であって、
入力された原画像を直交変換により複数の係数に変換する変換 ステップと、 前記複数の係数を、 埋め込み型のエントロピー符号化方法を用 いて符号化する符号化ステップと
を有することを特徴とする符号化方法。
7. 前記符号化ステップにおいて得られる符号化データは、 前記 複数の係数に対応する周波数成分において低周波数成分側から順 に定義された解像度レベルの情報を含む請求項 6に記載の符号化 方法。
8. 原画像に対して N/M倍 (M、 Nは整数であり、 かつ、 1≤ N≤M, かつ、 M> 2) の解像度で符号化データを復号するため の複号化方法であって、
原画像を M個の等帯域に分割して符号化された符号化データを 受信し、 当該符号化データから、 分割された複数の信号のうち低 周波数帯域側から N個分の信号を取り出してェント口ピー復号化 方法により復号化する複号化ステップと、
複号化された N個分の信号を合成する帯域合成ステップと を有することを特徴とする復号化方法。
9. 前記復号化ステップにより得られた信号を逆量子化する逆量 子化ステップを更に有し、 前記帯域合成ステップにおいて、 当該 逆量子化ステップにより得られた信号を合成する請求項 8に記載 の複号化方法。
1 0. 前記複号化ステップにおけるエントロピー復号化方法とし て静止画像国際標準 J P EG 2 00 0で用いられている E B C O Tを用い、 前記帯域合成ステップにおいて等分割フィルタバンク を用いる請求項 8に記載の復号化方法。
1 1. 原画像の解像度と所定の解像度を取得し、 当該所定の解像 度に適した前記 Nの値を、 原画像の解像度と前記分割数 Mを用い て算出する算出ステップを更に有する請求項 8に記載の復号化方 法。
1 2. 原画像に対して N/M倍 (M、 Nは整数であり、 かつ、 1 ≤N≤M, かつ、 M> 2) の解像度で符号化データを復号するた めの復号化方法であって、
原画像を M個の周波数成分の係数に分割して符号化された符号 化データを受信し、 当該符号化データから、 分割された複数の信 号のうち低周波数成分側から N個分の信号を取り出してェントロ ピー復号化方法により復号化する複号化ステップと、
復号化された N個分の信号を合成する合成ステップと を有することを特徴とする複号化方法。
1 3. 原画像の符号化を行う符号化装置であって、
入力された原画像を M個 (Mは整数であり、 かつ、 M> 2) の 等帯域に分割する分割手段と、
原画像を等帯域に分割して得られた信号を、 埋め込み型のェン ト口ピー符号化方法を用いて符号化する符号化手段と
を有することを特徴とする符号化装置。
1 4. 前記分割手段により得られた信号を量子化する量子化手段 を更に有し、 前記符号化手段において、 当該量子化手段により得 られた信号を符号化する請求項 1 3に記載の符号化装置。
1 5. 前記分割手段において、 等分割フィルタバンク用い、 前記 符号化手段において、 静止画像国際標準 J P EG 2000で用い られている EB COTを用いる請求項 1 3に記載の符号化装置。
1 6 . 前記符号化手段において得られる符号化データは、 分割さ れた複数の帯域において低周波数帯域側から順に定義された解像 度レベルの情報を含む請求項 1 3に記載の符号化装置。
1 7 . 前記符号化データは、 画像の縦方向と横方向のそれぞれに ついて、 解像度レベルの情報を含む請求項 1 6に記載の符号化装
1 8 . 原画像の符号化を行う符号化装置であって、
入力された原画像を直交変換により複数の係数に変換する変換 手段と、
前記複数の係数を、 埋め込み型のェント口ピー符号化方法を用 いて符号化する符号化手段と
を有することを特徴とする符号化装置。
1 9 . 前記符号化手段において得られる符号化データは、 前記複 数の係数に対応する周波数成分において低周波数成分側から順に 定義された解像度レベルの情報を含む請求項 1 8に記載の符号化
2 0 . 原画像に対して N /M倍 (M、 Nは整数であり、 かつ、 1 ≤ N≤M , かつ、 M〉 2 ) の解像度で符号化データを復号するた めの複号化装置であって、
原画像を M個の等帯域に分割して符号化された符号化データを 受信し、 当該符号化データから、 分割された複数の信号のうち低 周波数帯域側から N個分の信号を取り出してェントロピー複号化 方法により復号化する復号化手段と、
復号化された N個分の信号を合成する帯域合成手段と を有することを特徴とする複号化装置。
2 1. 前記復号化手段により得られた信号を逆量子化する逆量子 化手段を更に有し、 前記帯域合成手段において、 当該逆量子化手 段により得られた信号を合成する請求項 20に記載の複号化装置 c
2 2. 前記復号化手段におけるェント口ピー復号化方法として静 止画像国際標準 J P EG 20 00で用いられている EB COTを 用い、 前記帯域合成手段において等分割フィルタパンクを用いる 請求項 2 0に記載の複号化装置。
2 3. 原画像の解像度と所定の解像度を取得し、 当該所定の解像 度に適した前記 Nの値を、 原画像の解像度と前記分割数 Mを用い て算出する算出手段を更に有する請求項 20に記載の複号化装置 c
24. 原画像に対して N/M倍 (M、 Nは整数であり、 かつ、 1 ≤N≤M, かつ、 M> 2) の解像度で符号化データを復号するた めの複号化装置であって、
原画像を M個の周波数成分の係数に分割して符号化された符号 化データを受信し、 当該符号化データから、 分割された複数の信 号のうち低周波数成分側から N個分の信号を取り出してェントロ ピー復号化方法により復号化する復号化手段と、
復号化された N個分の信号を合成する合成手段と
を有することを特徴とする復号化装置。
2 5. 原画像の符号化処理をコンピュータに実行させるプロダラ ムであって、
入力された原画像を M個 (Mは整数であり、 かつ、 M> 2) の 等帯域に分割する分割手順と、 原画像を等帯域に分割して得られた信号を、 埋め込み型のェン ト口ピー符号化方法を用いて符号化する符号化手順と
をコンピュータに実行させるプログラム。
2 6 . 前記分割手順により得られた信号を量子化する量子化手順 を更に有し、 前記符号化手順において、 当該量子化手順により得 られた信号を符号化する請求項 2 5に記載のプログラム。
2 7 . 原画像の符号化処理をコンピュータに実行させるプロダラ ムであって、
入力された原画像を直交変換により複数の係数に変換する変換 手順と、
前記複数の係数を、 埋め込み型のェント口ピー符号化方法を用 いて符号化する符号化手順と
をコンピュータに実行させるプログラム。
2 8 . 原画像に対して N ZM倍 (M、 Nは整数であり、 かつ、 1 ≤ N≤M , かつ、 M > 2 ) の解像度で符号化データを復号する復 号化処理をコンピュータに実行させるプログラムであって、 原画像を M個の等帯域に分割して符号化された符号化データを 受信し、 当該符号化データから、 分割された複数の信号のうち低 周波数帯域側から N個分の信号を取り出してェントロピー復号化 方法により復号化する複号化手順と、
復号化された N個分の信号を合成する帯域合成手順と
をコンピュータに実行させるプログラム。
2 9 . 前記復号化手順により得られた信号を逆量子化する逆量子 化手順を更に有し、 前記帯域合成手順において、 当該逆量子化手 順により得られた信号を合成する請求項 2 8に記載のプログラム
3 0 . 原画像に対して N /M倍 (M、 Nは整数であり、 かつ、 1 ≤N≤M , かつ、 M > 2 ) の解像度で符号化データを復号する復 号化処理をコンピュータに実行させるプログラムであって、 原画像を M個の周波数成分の係数に分割して符号化された符号 化データを受信し、 当該符号化データから、 分割された複数の信 号のうち低周波数成分側から N個分の信号を取り出してェント口 ピー復号化方法により復号化する復号化手順と、
複号化された N個分の信号を合成する合成手順と
をコンピュータに実行させるプログラム。
3 1 . 原画像の符号化処理をコンピュータに実行させるプロダラ ムを記録したコンピュータ読み取り可能な記録媒体であって、 入力された原画像を M個 (Mは整数であり、 かつ、 M〉 2 ) の 等帯域に分割する分割手順と、
原画像を等帯域に分割して得られた信号を、 埋め込み型のェン ト口ピー符号化方法を用いて符号化する符号化手順と
をコンピュータに実行させるプログラムを記録したコンビユー タ読み取り可能な記録媒体。
3 2 . 前記分割手順により得られた信号を量子化する量子化手順 を更に有し、 前記符号化手順において、 当該量子化手順により得 られた信号を符号化する請求項 3 1に記載のプログラムを記録し たコンピュータ読み取り可能な記録媒体。
3 3 . 原画像の符号化処理をコンピュータに実行させるプロダラ ムを記録したコンピュータ読み取り可能な記録媒体であって、 入力された原画像を直交変換により複数の係数に変換する変換 手順と、
前記複数の係数を、 埋め込み型のエン トロピー符号化方法を用 いて符号化する符号化手順と
をコンピュータに実行させるプログラムを記録したコンビユー タ読み取り可能な記録媒体。
3 4 . 原画像に対して N /M倍 (M、 Nは整数であり、 かつ、 1 ≤N≤M、 かつ、 M > 2 ) の解像度で符号化データを復号する復 号化処理をコンピュータに実行させるプログラムを記録したコン ピュータ読み取り可能な記録媒体であって、
原画像を M個の等帯域に分割して符号化された符号化データを 受信し、 当該符号化データから、 分割された複数の信号のうち低 周波数帯域側から N個分の信号を取り出してェントロピー複号化 方法により復号化する復号化手順と、
復号化された N個分の信号を合成する帯域合成手順と をコンピュータに実行させるプログラムを記録したコンビユー タ読み取り可能な記録媒体。
3 5 . 前記復号化手順により得られた信号を逆量子化する逆量子 化手順を更に有し、 前記帯域合成手順において、 当該逆量子化手 順により得られた信号を合成する請求項 3 4に記載のプログラム を記録したコンピュータ読み取り可能な記録媒体。
3 6 . 原画像に対して N /M倍 (M、 Nは整数であり、 かつ、 1 ≤N≤M , かつ、 M > 2 ) の解像度で符号化データを復号する復 号化処理をコンピュータに実行させるプログラムを記録したコン ピュータ読み取り可能な記録媒体であって、
原画像を M個の周波数成分の係数に分割して符号化された符号 化データを受信し、 当該符号化データから、 分割された複数の信 号のうち低周波数成分側から N個分の信号を取り出してェント口 ピー復号化方法により復号化する ¾号化手順と、
複号化された N個分の信号を合成する合成手順と
をコンピュータに実行させるプログラムを記録したコンピュー タ読み取り可能な記録媒体。
PCT/JP2004/000154 2003-01-14 2004-01-13 符号化方法及び復号化方法及び符号化装置及び復号化装置 WO2004064405A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005507673A JPWO2004064405A1 (ja) 2003-01-14 2004-01-13 符号化方法及び復号化方法及び符号化装置及び復号化装置
US10/512,075 US9264736B2 (en) 2003-01-14 2004-01-13 Encoding method, decoding method, encoding device, and decoding device
EP04701679.5A EP1585338B8 (en) 2003-01-14 2004-01-13 Decoding method and decoding device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003-006390 2003-01-14
JP2003006390 2003-01-14

Publications (1)

Publication Number Publication Date
WO2004064405A1 true WO2004064405A1 (ja) 2004-07-29

Family

ID=32709063

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2004/000154 WO2004064405A1 (ja) 2003-01-14 2004-01-13 符号化方法及び復号化方法及び符号化装置及び復号化装置

Country Status (5)

Country Link
US (1) US9264736B2 (ja)
EP (1) EP1585338B8 (ja)
JP (2) JPWO2004064405A1 (ja)
CN (1) CN100394800C (ja)
WO (1) WO2004064405A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7627180B2 (en) * 2004-02-17 2009-12-01 Toa Corporation Image compression apparatus
JP2007142614A (ja) * 2005-11-16 2007-06-07 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラム及び情報記録媒体
WO2008067472A2 (en) * 2006-11-29 2008-06-05 President And Fellows Of Harvard College A new spatio-spectral sampling paradigm for imaging and a novel color filter array design
WO2008067479A1 (en) * 2006-11-29 2008-06-05 President And Fellows Of Harvard College A framework for wavelet-based analysis and processing of color filter array images with applications to denoising and demosaicing
US8611418B2 (en) * 2006-11-30 2013-12-17 Lsi Corporation Decoding a progressive JPEG bitstream as a sequentially-predicted hybrid video bitstream
CN101420609B (zh) * 2007-10-24 2010-08-25 华为终端有限公司 视频编码、解码方法及视频编码器、解码器
US20110144969A1 (en) 2009-12-11 2011-06-16 International Business Machines Corporation High-Frequency Entropy Extraction From Timing Jitter
WO2011126277A2 (en) 2010-04-05 2011-10-13 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
WO2011126282A2 (en) 2010-04-05 2011-10-13 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US9049450B2 (en) 2010-04-05 2015-06-02 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on internal bit depth increment, and method and apparatus for decoding video based on internal bit depth increment
CN102118616A (zh) * 2011-02-24 2011-07-06 深圳市同洲电子股份有限公司 图片解码方法及图片解码器
CN102547291B (zh) * 2012-02-08 2014-07-23 中国电影科学技术研究所 基于fpga的jpeg2000图像解码装置及方法
CN109451312A (zh) * 2018-11-05 2019-03-08 深圳威尔视觉传媒有限公司 方便视频解码的视频处理方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04245863A (ja) * 1991-01-31 1992-09-02 Nec Corp 階層表現された信号の符号化方式
JP2000197052A (ja) * 1998-12-29 2000-07-14 Sony Corp ウェ―ブレット符号化装置及び方法並びに復号装置及び方法
JP2002165098A (ja) * 2000-11-27 2002-06-07 Sony Corp 画像符号化装置及び画像符号化方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02113775A (ja) 1988-10-24 1990-04-25 Nec Corp 画像信号の符号化方法とその装置
JP3403724B2 (ja) 1990-08-20 2003-05-06 株式会社東芝 画像再生装置及び方法
SE512291C2 (sv) * 1997-09-23 2000-02-28 Ericsson Telefon Ab L M Inbäddad DCT-baserad stillbildskodningsalgoritm
US6587590B1 (en) * 1998-02-02 2003-07-01 The Trustees Of The University Of Pennsylvania Method and system for computing 8×8 DCT/IDCT and a VLSI implementation
AUPP855899A0 (en) * 1999-02-09 1999-03-04 Motorola Australia Pty Ltd A method of providing a signal extension for a finite length signal and apparatus therefor
JP2000244743A (ja) * 1999-02-23 2000-09-08 Sony Corp フィルタバンク構成方法及びフィルタバンク装置
AUPR222500A0 (en) 2000-12-21 2001-01-25 Unisearch Limited Method for efficient scalable compression of video
US6895121B2 (en) * 2001-07-03 2005-05-17 Eastman Kodak Company Method for utilizing subject content analysis for producing a compressed bit stream from a digital image
GB2405061B (en) * 2001-12-05 2005-05-18 Matsushita Electric Ind Co Ltd Multirate digital transceiver
JP3575466B2 (ja) * 2002-02-21 2004-10-13 ソニー株式会社 エントロピ符号化/復号装置
JP3743384B2 (ja) * 2002-04-19 2006-02-08 ソニー株式会社 画像符号化装置及び方法、並びに画像復号装置及び方法
JP4181802B2 (ja) * 2002-06-28 2008-11-19 キヤノン株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04245863A (ja) * 1991-01-31 1992-09-02 Nec Corp 階層表現された信号の符号化方式
JP2000197052A (ja) * 1998-12-29 2000-07-14 Sony Corp ウェ―ブレット符号化装置及び方法並びに復号装置及び方法
JP2002165098A (ja) * 2000-11-27 2002-06-07 Sony Corp 画像符号化装置及び画像符号化方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FUKUHARA TAKAHIRO: "Kirei na gazo ni JPEG-2000", NIKKEI ELECTRONICS, vol. 783, 20 November 2000 (2000-11-20), pages 161 - 170, XP002903771 *
See also references of EP1585338A4 *
YEONG-AN JEONG ET AL., A DCT-BASED EMBEDDED IMAGE CODER USING WAVELET STRUCTURE OF DCT FOR VERY LOW BIT RATE VIDEO CODEC, vol. 44, no. 3, 1 August 1998 (1998-08-01), pages 500 - 508

Also Published As

Publication number Publication date
US9264736B2 (en) 2016-02-16
CN100394800C (zh) 2008-06-11
EP1585338B1 (en) 2014-09-03
EP1585338A4 (en) 2010-06-16
JPWO2004064405A1 (ja) 2006-05-18
US20050244068A1 (en) 2005-11-03
CN1698386A (zh) 2005-11-16
EP1585338B8 (en) 2014-11-19
JP4124792B2 (ja) 2008-07-23
JP2006304329A (ja) 2006-11-02
EP1585338A1 (en) 2005-10-12

Similar Documents

Publication Publication Date Title
JP4124792B2 (ja) 符号化方法及び復号化方法及び符号化装置及び復号化装置
JP5026965B2 (ja) ベースレイヤを含むビットストリームをプリデコーディング、デコーディングする方法及び装置
JP5014989B2 (ja) 基礎階層を利用するフレーム圧縮方法、ビデオコーディング方法、フレーム復元方法、ビデオデコーディング方法、ビデオエンコーダ、ビデオデコーダ、および記録媒体
KR100664928B1 (ko) 비디오 코딩 방법 및 장치
JP4409276B2 (ja) 多重解像度映像表示の方法及び映像符号器
JP3743384B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
KR100703774B1 (ko) 인트라 코딩을 선택적으로 적용하여 인트라 bl 예측모드의 비디오 신호를 인코딩 및 디코딩하는 방법 및 장치
US20060159359A1 (en) Fine granularity scalable video encoding and decoding method and apparatus capable of controlling deblocking
JP4844741B2 (ja) 動画像符号化装置及び動画像復号装置と、その方法及びプログラム
US20060013311A1 (en) Video decoding method using smoothing filter and video decoder therefor
Xing et al. Arbitrarily shaped video-object coding by wavelet
KR100834749B1 (ko) 스케일러블 비디오 스트림 재생장치 및 그 방법
AU2004314092B2 (en) Video/image coding method and system enabling region-of-interest
JP2001045475A (ja) 映像信号階層化符号化装置と映像信号階層化復号化装置及びプログラム記録媒体
KR100855466B1 (ko) 비디오 코딩 및 디코딩 방법, 및 이를 위한 장치
WO2006046550A1 (ja) 画像符号化方法および装置、ならびに画像復号方法および装置
JPH08294119A (ja) 画像符号化/復号化装置
WO2007083312A2 (en) Method and apparatus for a multidimensional discrete multiwavelet transform
KR100897640B1 (ko) 동화상 부호화 장치 및 동화상 복호 장치와, 그 방법 및 프로그램이 기록된 컴퓨터 판독가능한 기록 매체
KR20140071809A (ko) 비디오 데이터의 처리 방법 및 장치
JP4385928B2 (ja) スケーラブル動画像符号化・復号化方法及びシステム
JP3869303B2 (ja) 画像復号化方法及び装置
JPH09182074A (ja) 画像信号符号化方法及び装置、画像信号復号方法及び装置
JP2003023634A (ja) 画像符号化/復号化方法及び装置
WO2006078107A2 (en) Fine granularity scalable video encoding and decoding method and apparatus capable of controlling deblocking

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2005600056

Country of ref document: JP

AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

WWE Wipo information: entry into national phase

Ref document number: 10512075

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2004701679

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 20048002196

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 2004701679

Country of ref document: EP