WO2017142360A1 - Image encoding and decoding method, and image encoder and image decoder using same - Google Patents

Image encoding and decoding method, and image encoder and image decoder using same Download PDF

Info

Publication number
WO2017142360A1
WO2017142360A1 PCT/KR2017/001800 KR2017001800W WO2017142360A1 WO 2017142360 A1 WO2017142360 A1 WO 2017142360A1 KR 2017001800 W KR2017001800 W KR 2017001800W WO 2017142360 A1 WO2017142360 A1 WO 2017142360A1
Authority
WO
WIPO (PCT)
Prior art keywords
dynamic range
range image
image
domain data
dct
Prior art date
Application number
PCT/KR2017/001800
Other languages
French (fr)
Korean (ko)
Inventor
권오진
최승철
Original Assignee
세종대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020170015839A external-priority patent/KR20170098163A/en
Application filed by 세종대학교산학협력단 filed Critical 세종대학교산학협력단
Priority to US15/999,734 priority Critical patent/US20190089955A1/en
Publication of WO2017142360A1 publication Critical patent/WO2017142360A1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Definitions

  • the present invention relates to an image encoding and decoding technique, and more particularly,
  • the present invention relates to a method of encoding and decoding HDR High Dynamic Range (JPEG) backward compatible, and to an image encoder and an image decoder using the same.
  • JPEG High Dynamic Range
  • An image can generally be represented by a limited number of bits that represent a limited range of values to represent a luminance signal.
  • the most common digital image formats currently in use use 24-bit (so-called 24-bit format) to store color and luminance information at each pixel in the image. For example, each value of red, green, and blue (Red, Green, and Blue) for a pixel may be stored in a range of 1 byte (8 bits). These images are called low dynamic range (LDR) images.
  • LDR low dynamic range
  • the brightness of light that can be detected by humans has a certain range.
  • the ratio of the darkest and the brightest light that can be detected is called the dynamic range.
  • the dynamic range In the 10-3 dynamic range of the brightness (luminance) that is easy for a person to recognize 10 cd / m 2 (candel a / m ') , while the conventional RGB color to use conventional expression by eight bits per
  • TMO tone-mapping operator
  • the legacy-JPEG (Legacy-JPEG) standard (ISO / IEC 10918) still dominates the photography market.
  • this standard does not support HDR images.
  • advanced image coding standards such as JPEG 2000 (IS0 / IEC 15444) or JPEG XR (ISO / IEC 29199) provide HDR image support, the adoption of HDR image coding by these standards is expected to be positive on the market. It is not becoming.
  • JPEG Commission (SC29WG1) recognizes that the main cause of this phenomenon is due to lack of backward compatibility with L-JPEG, which is already a tool chain in the market, a new image encoding called JPEG XT (ISO / IEC 18477). Standardization work has been initiated. Three profiles called profiles A, B and C have been proposed for JPEG XT.
  • An object of the present invention for solving the above problems is to provide an image encoding method compatible with backward JPEG.
  • Another object of the present invention for solving the above problems is to provide an image decoding method compatible with JPEG backwards.
  • Another object of the present invention for solving the above problems is to provide an image encoder that is backward compatible JPEG.
  • Another object of the present invention for solving the above problems is to provide an image decoder compatible with JPEG reverse direction.
  • An image encoding method for achieving the above object, the step of converting a first dynamic range image to a second dynamic range image, and encoding a second dynamic range image to generate a base layer code stream Deriving DC screte cosine transform (DCT) domain data for the second dynamic range image, deriving DCT domain data for the first dynamic range image, DCT for the second dynamic range image DCT diagram replacement paper for domain data and the first dynamic range image (rule 126) Deriving prediction coefficients related to the first dynamic range image from the main data, and using the DCT domain data for the second dynamic range image and the prediction coefficients related to the first dynamic range image, the prediction DCT for the first dynamic range image. Deriving domain data.
  • DCT DC screte cosine transform
  • the first dynamic range image may be an HDR image
  • the second dynamic range image may be an LDR image
  • Deriving the prediction coefficients related to the first dynamic range image may include using the correlation of the DCT domain data for the first dynamic range image with respect to the DCT domain data for the second dynamic range image.
  • the method may include calculating image related prediction coefficients.
  • the image encoding method uses at least one residual coefficient by using the DCT domain data for the second dynamic range image and the predictive DCT domain data for the dynamic range image derived from the prediction coefficients related to the thrust dynamic range image.
  • the method may further include generating and generating a residual layer codestream including the first dynamic range image related prediction coefficient and the at least one residual coefficient.
  • the generating of the base layer codestream may include converting the first layer dynamic range image into the second dynamic range image by performing a tone-mapping operation on the first dynamic range image.
  • Generating the base layer codestream also includes color transforming the second dynamic range image, DCT transforming the color transformed image, quantizing the DCT transformed image, and entropy the quantized image.
  • Alternative paper for encoding steps (Article 126) It may include.
  • the image quality coefficient used in the quantization of the DCT transformed image may be the same as the image quality coefficient used for quantization of the residual coefficient.
  • deriving DCT domain data for the second dynamic range image may include performing inverse quantization on the quantized DCT transformed image.
  • the AC coefficient of the DCT domain data for the first dynamic range image and the AC coefficient of the DCT domain data for the second dynamic range image are expressed as a function such as a polynomial, an exponential function, a logarithmic function, and a trigonometric function. It can have a correlation.
  • the DC coefficient of the DCT domain data for the first dynamic range image has a correlation represented by a prediction curve including a plurality of intervals with respect to the DC coefficient of the DCT domain data for the second dynamic range image, Each interval of the prediction curve may be defined by the same or different functions such as polynomials, exponential functions, logarithmic functions, trigonometric functions, and the like.
  • a method of decoding an image comprising: receiving a residual layer codestream including a first dynamic range image related prediction coefficient, receiving a base layer codestream, Decoding the received base layer code stream to generate a second dynamic range image; deriving DCT domain data for the second dynamic range image; deriving a residual DCT domain data; Image-related prediction coefficients and the second dynamic range already substituted (Article 126) Calculating predictive DCT domain data for the first dynamic range image from the DCT domain data for the digital image; adding the residual DCT domain data and the predictive DCT domain data for the first dynamic range image to add the DCT for the first dynamic range image. Reconstructing domain data, and decoding the DCT domain data for the first dynamic range image to generate a first dynamic range image.
  • the first dynamic range image may be an HDR image
  • the second dynamic range image may be an LDR image
  • Computing the predictive DCT domain data for the first dynamic range image may include deriving a first dynamic range image related prediction coefficient from the residual codestream and the DCT domain data for the second dynamic range image. 1 may include applying a function by the prediction coefficients related to the dynamic range image.
  • a method of decoding an image comprising: receiving a residual layer codestream including a first dynamic range image related prediction coefficient, receiving a base layer codestream, Deriving spatial domain data for a low 12 dynamic range image by performing an inverse -DCT lnverse Discrete Cosine Transform on the received base layer code stream, wherein the first dynamic range image ⁇ : series prediction coefficients and the first Calculating predictive spatial domain data for the first dynamic range image from spatial domain data for the dynamic range image, performing inverse-DCT transformation on the residual signal included in the residual layer codestream, and The spatial prediction data related to the first dynamic range image and the inverse-DCT transformed residual scene replacement paper (Rule 12) Article 6) Reconstructing the first dynamic range image from the call.
  • the first dynamic range image may be an HDR image
  • the second dynamic range image may be an LDR image
  • the step of calculating the predictive spatial domain data for the first dynamic range image may include deriving a first dynamic range image related prediction coefficient from the residual codestream and storing the predicted spatial domain data for the second dynamic range image. 1 1 may include applying a function by the prediction coefficients related to the dynamic range image.
  • an image encoder converts a first dynamic range image into a second dynamic range image and encodes a second dynamic range image to generate a base layer codestream.
  • a base layer processor to generate, an inverse quantizer for deriving DCT domain data by performing inverse quantization on the second dynamic range image quantized by the base layer processor, and deriving DCT domain data for the first dynamic range image
  • an enhancement layer processor for deriving a prediction coefficient related to the first dynamic range image from the DCT domain data for the second dynamic range image and the DCT domain data for the first dynamic range image.
  • the first dynamic range image may be an HDR image
  • the second dynamic range image may be an LDR image.
  • the enhancement layer processor is configured to utilize the correlation of the DCT domain data for the first dynamic range image with respect to the DCT domain data for the second dynamic range image to predict the first dynamic range image and the first dynamic range.
  • Example Alternative Paper for Images (Article 126) It may include a predictor for calculating side DCT domain data.
  • the enhancement layer processor may also generate at least one residual coefficient using the DCT domain data for the second dynamic range image and the prediction DCT domain data for the first dynamic range image derived from the prediction coefficients related to the first dynamic range image. And a residual layer codestream including the first dynamic range image related prediction coefficient and the at least one residual coefficient.
  • the image quality coefficient used for quantization of the second dynamic range image performed by the base layer processor may be the same as the image quality coefficient used for quantization of the residual coefficient performed by the enhancement layer processor.
  • the base layer processor may include a tone-mapping operator that performs a tone-mapping operation on a first dynamic range image and converts the second dynamic range image into a color. And a color converter for converting, a DCT converter for DCT converting the color converted image, a quantizer for quantizing the DCT converted image, and an entropy encoder for entropy encoding the quantized image.
  • an image decoder receives a base layer codestream, decodes the base layer codestream, and decodes DCT domain data for a second dynamic range image.
  • an image decoder receives a base layer codestream and performs entropy decoding, inverse-quantization, and inverse-DCT transform on the base layer codestream.
  • JPEG backward compatible HDR image encoding and decoding that utilizes the correlation of the HDR image to the tone-mapped LDR image in the DCT domain can be provided. It can improve the encoding and decoding performance.
  • FIG. 1 is a block diagram of a JPEG XT encoding system.
  • FIG. 2 is a block diagram of a block diagram of an HDR image encoder according to an embodiment of the present invention (rule 126) All.
  • FIG. 3 is a block diagram of an HDR image decoder according to an embodiment of the present invention.
  • FIG. 4 illustrates a plurality of image samples for explaining an experimental result of the HDR image encoding method and the decoding method according to an embodiment of the present invention.
  • FIG. 5 is an exemplary diagram illustrating a distribution of AC coefficients for various TM0s according to an embodiment of the present invention.
  • FIG. 6 is an exemplary diagram illustrating a distribution of DC coefficients for various TM0s according to an embodiment of the present invention.
  • FIG. 7 is a graph illustrating a concept of deriving a predictive HDR DC value according to another embodiment of the present invention.
  • FIG. 8 is a block diagram of an HDR image decoder according to another embodiment of the present invention.
  • FIG. 9 is a flowchart illustrating an encoding method according to an embodiment of the present invention.
  • FIG. 10 is an operation flowchart of a decoding method according to an embodiment of the present invention.
  • FIG. 11 is an operational flowchart of a decoding method according to another embodiment of the present invention. [Best form for implementation of the invention]
  • first, second, A, and B may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another.
  • the first component may be referred to as a second component without departing from the scope of the present invention, and similarly, the second component may also be referred to as the first component.
  • the JPEG XT encoding system shown in FIG. 1 can be applied for profiles A, B and C.
  • the JPEG XT encoding system includes a tone-mapping operator 10, an inverse -TMO (ll), a residual image generator 40, in addition to a legacy-JPEG encoder 20 and a legacy-JPEG decoder 30. And residual image encoder 50.
  • the JPEG XT encoding system including these detailed configurations outputs data of two layers, a base layer codestream and an enhancement layer, that is, a residual-layer codestream.
  • HDR images input to the JPEG XT encoding system are converted to tone-mapped LDR images by the tonemapping operator (10), color converters, DCT converters, and alternative paper (Article 126).
  • the enhancement layer (i.e., residual layer) codestream is a signal whose HDR image is output via the tonemapping operator (10), legacy -JPEG encoder (20), legacy -JPEG decoder (30), and inverse -TMO (ll). And a residual image generator 40 and a residual image encoder 50 that generate the residual image by using the HDR signal as an input.
  • the residual image encoder 50 and the quantizer, two image quality coefficients q and Q are used, respectively. Also, the choice of TM0 is given to the user, so any TM0 can be used with JPEG XT. Conversely, the TMO (ll) information may be included in the residual layer codestream used when reconstructing the HDR version of the residual layer decoder ⁇ LDR codestream.
  • 2 is a block diagram of an HDR image encoder according to an embodiment of the present invention.
  • An image encoder includes a tone mapping operator 100 and a legacy -JPEG encoder 200. Tone mapping operator 100 and legacy-JPEG encoder 200 may be referred to herein as a base layer processor.
  • the image encoder also does not include a legacy -JPEG decoder, unlike the JPEG XT encoder described with reference to FIG. 1, but instead includes a scaler 301, a color converter 310, a DCT converter 320. , Enhancement layer processor 300 and quantizer 330, entropy encoder 340, and HDR predictor 350, and de-quantization replacement sheet (Rule 126) And group 331.
  • a legacy -JPEG decoder unlike the JPEG XT encoder described with reference to FIG. 1, but instead includes a scaler 301, a color converter 310, a DCT converter 320. , Enhancement layer processor 300 and quantizer 330, entropy encoder 340, and HDR predictor 350, and de-quantization replacement sheet (Rule 126) And group 331.
  • An image encoder converts a first dynamic range image into a second dynamic range image, and encodes a second dynamic range image to generate a base layer code stream, wherein the base layer processor Inverse quantizer deriving DCT domain data by performing inverse quantization on the second dynamic range image quantized by D, and deriving DCT domain data for the first dynamic range image, and DCT for the second dynamic range image. And an enhancement layer processor for deriving a first dynamic range image related prediction coefficient from domain data and DCT domain data for the first dynamic range image.
  • the first dynamic range image may be represented using a larger amount of data than the second dynamic range image
  • the first dynamic range image may be an HDR image
  • the second dynamic range image may be an LDR image
  • the enhancement layer processor 300 is a predictor that calculates prediction coefficients related to the U dynamic range image by utilizing the correlation of the DCT domain data for the first dynamic range image with respect to the DCT domain data for the second dynamic range image.
  • the enhancement layer processor may also generate at least one residual coefficient using the DCT domain data for the first dynamic range image and the first dynamic range image related prediction coefficients, and the first dynamic range.
  • a residual layer codestream including the image related prediction coefficients and the at least one residual coefficient is generated.
  • Other JPEG backward-compatible HDR image coding may be implemented.
  • base layer encoding is applied in the same manner as the existing profile. That is, the HDR image input to the image encoder according to the present invention is tone-mapped by the tone mapping operator (TM0) 100 to be converted into an LDR image, a color converter 210, a DCT converter 220, a quantizer 230, constructs a base layer codestream compressed by legacy-JPEG encoder 200 including entropy encoder 240 and providing legacy-JPEG backward compatibility.
  • TM0 tone mapping operator
  • the tone mapping operator (100) may be referred to as dynamic range compression, and converts an image HDR image into an 8-bit LDR image by tone mapping an image HDR image without losing the features and details such as edge information from the original image. .
  • the color converter 210 converts the LDR image represented by RGB (Red-Green-Blue) to YCbCr.
  • DCT converter 220 performs an 8x8 block-based DCT transform on the image data represented by YCbCr.
  • DCT is one of techniques widely used for frequency conversion of an image and converts image data in the spatial domain into image data in the frequency domain using a cosine basis.
  • the resulting DC and AC components i.e., the DC coefficient and the AC coefficient are obtained.
  • the quantizer 230 receives the transform coefficient changed in the frequency domain by the DCT 220 as an input value and maps it to a discrete value. Data loss occurs during the quantization process, and continuous or large amounts of input data are mapped to a few discrete symbols after quantization.
  • entropy encoder 240 receives the output of quantizer 230 and performs entropy encoding.
  • entropy encoding alternative paper (Article 126) Is lossless compression, and is a process of minimizing the amount of data necessary for representation by variably allocating the length of a symbol according to the occurrence probability of the symbol.
  • the residual idling coding according to the exemplary embodiment of the present invention illustrated in FIG. 2 is clearly distinguished from the residual layer coding illustrated in FIG. 1.
  • the input HDR image is input to the scaler 301.
  • Scaler 301 scales the range of pixel values of the input HDR image to the LDR image range, where scaling is a uniform and reversible f loat ing-point scaling operation.
  • the color representation of the LDR image is converted into a YCbCr representation by the color converter 310 and an 8x8 block-based DCT is performed by the DCT converter 320.
  • One of the main features of HDR image coding proposed by the present invention is to perform HDR prediction based on the DCT coefficients of the tone-mapped LDR image encoded in the base layer, and each DCT coefficient of the input HDR image, and to estimate prediction coefficients and residuals. It is a configuration to generate a hierarchical code stream.
  • the HDR predictor 350 shown in FIG. 2 plays this role.
  • the HDR predictor 350 outputs the output of the inverse quantizer 331, which inversely quantizes the data output by the quantizer 230 in the encoder 200, that is, the DCT of the ton-mapped LDR image. Receive a coefficient as input. HDR predictor 350 also receives the DCT coefficients of the input HDR image as another input to derive the predictive HDR DCT coefficients and the prediction coefficients. The difference between the DCT coefficients of the input HDR image and the predictive HDR DCT coefficients forms a residual DCT coefficient. The residual DCT coefficients are quantized by quantizer 330 and entropy coded by entropy encoder 340.
  • quantizer 330 replacement paper (rule 126) Is the same as the quantizer 230 in the encoder, entropy encoder 340 and also performs the same role as the entropy encoder 240 in the encoder.
  • the image quality coefficient q used in the base layer may be used in the same way for the residual layer.
  • the finally generated residual layer codestream is composed of prediction coefficients estimated by the HDR predictor 350 and entropy coded residual DCT coefficients.
  • the DCT converter 220 of the base layer encoding process and the DCT converter 320 of the residual layer encoding process perform DCT conversion on the basis of blocks on the Y, Cb, and Cr color elements of the input image, and the resulting DCT coefficients. Are rearranged into one-dimensional vectors in zigzag order.
  • the k-th DCT coefficient in the first block of the input HDR image output by the DCT converter 320 is denoted by d, and the tone output by the de-quantizer 331.
  • the de-quantized DCT coefficients of the mapped LDR image are indicated by O). Also,
  • HDR predictor 350 is based on C ⁇ O) for each Y, Cb and Cr color element.
  • FIG. 1 is a block diagram of an HDR image decoder according to an embodiment of the present invention.
  • HDR image decoding which is a reverse operation of HDR image encoding, according to the present invention, can be described.
  • the HDR image decoder of the present invention may include a base layer decoder 400 and an enhancement layer decoder 500 that process legacy-JPEG compatible base layer codestreams.
  • the base layer decoder 400 receives the base layer codestream, decodes the base layer codestream, derives DCT domain data for the second dynamic range image, and generates a second dynamic range image.
  • the enhancement layer decoder 500 receives the residual layer codestream including the first dynamic range image related prediction coefficients, derives the first dynamic range image related prediction coefficients and the residual DCT domain data, and the first dynamic range image. in DCT-domain data for the relevant prediction coefficients and the shop second dynamic range image portion emitter said first calculates the predicted DCT domain data for the dynamic range image, the first dynamic range already and the predicted DCT domain data as to whether "residual DCT Sum domain data
  • Enhancement layer decoder 500 includes an HDR predictor 550, an entropy decoder 540, an inverse-quantizer 530, an inverse color transformer 510, and an inverse-scaler 501 that process a residual layer codestream. It may include.
  • base layer decoding is performed by a legacy legacy-JPEG decoder 400, and a legacy-JPEG decoder 400 includes an entropy decoder 410, an inverse-quantizer 420, and an inverse DCT converter 430. , And inverse-color converter 440.
  • the basic trade-off codestream input to the image decoder of FIG. 3 is converted into a quantized stream through an entropy decoder 410 and c DR j ⁇ transformed into a DCT domain via an inverse quantizer 420. .
  • Data in the DCT domain is converted into an LDR image, which is finally expressed in RGB, via an inverse DCT converter 430 and an inverse-color converter 440.
  • the prediction coefficients included in the residual layer codestream are input to the HDR predictor 550, and the residual tradeoff codestream passes through an entropy decoder 540 and an inverse-quantizer 530, which is a DCT coefficient of the residual signal ⁇ . Is converted to).
  • the HDR predictor 550 receives as input input prediction coefficients included in ⁇ ⁇ ) ( ⁇ ) and the residual layer codestream, and derives the predictive HDR DCT coefficients through HDR prediction.
  • the HDR predictor 550 located in the decoder uses a prediction coefficient included in the residual layer codestream to replace the encoder stage shown in FIG. 2 (rule 126).
  • the HDR predictor 350 derives the same HDR DCT coefficients as the predicted HDR DCT coefficients.
  • the DCT coefficients of the residual signal and the predicted HDR DCT coefficients c ⁇ M (A-) are summed to form f ⁇ in the form of a reconstructed HDR DCT coefficients, and the reconstructed HDR DCT coefficients are inverse2 "transformers (520), inverse- Finally, the image is finally restored to the HDR image through the color converter 510 and the inverse scaler 501. As described with reference to the embodiment of FIGS. From the point of view, there is a difference from the existing profile described in FIG.
  • profiles A and B generate their residual images in the form of an image divided by an HDR original image at each pixel in tone-mapped LDR images
  • profile C generates an HDR original image and a tone-mapped LDR image. Take the difference image as the residual image.
  • the present invention generates residual data in the DCT domain.
  • the L-JPEG decoding process is not required in the JPEG XT encoding according to the present invention, which means an effect of reducing the encoding time.
  • the existing prop ⁇ uses two quality factors.
  • Fig. 4 (a) shows the resultant image of uniformly quantizing the HDR sample image for display purposes and Fig. 5 (b) shows the tone-mapped LDR image using the TM0 technique proposed by Reinhard et al. .
  • TM0s were selected from among several selectable TM0 techniques, and the correlation between ⁇ and C ⁇ Ar) in the DC coefficient and AC coefficient was examined.
  • Alternative Paper (Article 126 of the Rules) 5 is an exemplary diagram illustrating a distribution of AC coefficients for various TM0s according to an embodiment of the present invention.
  • the five TM0 techniques used in FIG. 5 are expressed as "Reinhard02”, “Drago03”, “iCAM06”, “Mant iuk08” and "Mai ll”. Also, the image quality factor q was preset to 70. In experiments with different image quality factors, the same distribution was observed. Therefore, the effects of other image quality factors in designing the HDR predictor were negligible.
  • FIG. 5 shows the AC coefficient distribution for C ′ IDR (k) of c ⁇ O) for various TM0 techniques.
  • the horizontal axis means ⁇ O
  • the vertical axis means ⁇ '()
  • the ⁇ element is black
  • the Cb element is blue
  • the Ci- element is represented by red.
  • the correlation between the AC coefficients of the DCT domain data for the first dynamic range image and the AC coefficients of the DCT domain data for the second dynamic range image according to the present invention is not limited to the first-order polynomial function.
  • it may be expressed as a polynomial, an exponential function, a logarithmic function, a trigonometric function, and the like.
  • the AC coefficient related prediction may be performed for each of the Y, Cb, and Cr color elements, which may be defined by Equation 1 below.
  • aAC may mean a coefficient that minimizes a mean square error (MSE) between C ⁇ O) and C ⁇ A.
  • MSE mean square error
  • Alternative Paper (Article 126 of the Rules) 6 is an exemplary diagram illustrating a distribution of DC coefficients for various TM0s according to an embodiment of the present invention.
  • the five TM0 techniques used in FIG. 6 are “Reinhard02”,
  • the image quality factor q was also set to 70 in advance.
  • the DC coefficient of the image reflects the averaged pixel value in units of blocks and TM0 serves to improve the dynamic range of luminance.
  • the distribution can be interpreted as a global aspect of the reverse behavior of TM0 adopted for each image.
  • the distributions of Y, Cb and Cr for C ⁇ M (0) vs C ⁇ O) are different, they show a very high correlation of C ⁇ O) for c ⁇ A (0 ).
  • ce (O) for each color element of Y, Cb, and Cr is predicted by a cubic equation function of C ′ IDR (0) defined by Equation 2 below.
  • Equation 2 Alternative Paper (Article 126 of the Rules)
  • a) C, b, c and d may refer to coefficients that minimize the mean square error (MSE, mean square error) between c 'lmA and e ⁇ ). That is, HDR prediction according to an embodiment of the present invention may be performed by using a least square method.
  • MSE mean square error
  • FIG. 7 is a graph illustrating a concept of dividing a predicted HDR DC value into intervals according to another embodiment of the present invention.
  • the X axis is an LDR DC coefficient value
  • the y axis is a predictive HDR DC coefficient value
  • a range of values of the LDR DC coefficient is —1024 to 1023.
  • the coefficients ⁇ , b, c, and d of Equation 2 can be obtained using the least square method. From the point on the prediction curve defined by these coefficients, find the point (pl, p2) whose vertical distance from the point on the starting line and the end point of the prediction curve is the maximum in the positive and negative directions. Can be set as the reference point for dividing the section. If the cubic equation and the straight line do not meet, pl and p2 can be arbitrarily designated as -200, 200. However, it does not limit pl, p2 to -200 and 200.
  • the curve defined by the cubic equation is divided into three sections based on pl and p2, and the optimum prediction curve coefficients are extracted for each section.
  • Equation 3 One equation may be defined as Equation 3 below.
  • Equation 3 ⁇ ,, bi (C l , ⁇ are the coefficients for interval 1 (-1024 to pi) and a DCl are the coefficients for interval 2 (pi to p2), and in interval 3 (p2 to 1024) Coefficients.
  • FIG. 8 is a block diagram of an HDR image decoder according to another embodiment of the present invention.
  • FIG. 8 illustrates a decoder according to another embodiment different from the HDR image decoder according to the embodiment shown in FIG. 3, wherein the decoder shown in FIG. 8 spatially stores a residual layer codestream encoded using the HDR predictor in the DCT domain. Process on the domain. Therefore, the decoder according to the present embodiment replaces the residual data represented by the DCT domain with the spatial map (Article 26). Switch to main and perform HDR prediction in the spatial domain.
  • the HDR image decoder includes a decoder 400 for processing a legacy -JPEG compatible base layer codestream and a spatial domain predictor (for processing a residual layer codestream). 551, an enhancement layer decoder 500 including an entropy decoder 540, an inverse-quantizer 530, an inverse-color converter 510, and an inverse-scaler 501.
  • the base layer decoding is performed by the legacy legacy-JPEG decoder 400, and the legacy-JPEG decoder 400 includes an entropy decoder 410, an inverse-quantizer 420, and an inverse DCT converter ( 430, and an inverted-color converter 440.
  • the base layer codestream input to the image decoder of FIG. 8 is converted into a quantized stream through an entropy decoder 410 and an IDR (J) — transform represented by the DCT domain via an inverse quantizer 420.
  • c (A is converted to lDR (ik ⁇ ) via an inverse DCT converter 430 and converted to an LDR image that is finally expressed in RGB via an inverse-color converter 440.
  • the prediction coefficients included in the residual layer codestream are input to the spatial domain predictor 551, and the residual layer codestream is passed through an entropy decoder 540 and an inverse-quantizer 530, which is a low DCT coefficient of the residual signal. And the DCT coefficients of the residual signal are transformed to via an inverse-DCT converter 521. (w) is added to the output of the spatial domain predictor 551, input to the inverse-color converter 510, and finally reconstructed into an HDR image via the inverse-scaler 510.
  • the spatial domain predictor 551 receives the prediction coefficients included in the residual layer codestream received from the encoder and the inverse-DCT transformed base layer data ' lDR as input and performs HDR prediction.
  • Equation 4 IDCT ⁇ E '(ik ⁇ + IDCT ⁇ C! ⁇ () ⁇ where f Ot) is the residual signal and the DCT coefficient carried over the residual layer stream.
  • ⁇ () in Equation 4 an inverse -DCT operation may be performed on e i HD .
  • Equation 4 the second and third terms of Equation 4 are performed by performing inverse -DCT transform on HDR ov ⁇ , which is a signal predicted through the HDR predictor, and performing inverse -DCT transform. Expand to represent the value of the image. Therefore, the HDR image ⁇ reconstructed in the spatial domain may be generated as the sum of the reconstructed residual image and the reconstructed predictive HDR image.
  • Equation 4 is developed to reconstruct an HDR image in a spatial domain of a residual layer codestream encoded using an HDR predictor in a DCT domain.
  • Equation 5 _. ⁇ (0) —
  • Equation 4 the equation o ⁇ t) is decomposed into a DC component and an AC component as shown in Equation 6 below to calculate fflc ⁇ ) ⁇ .
  • nii means the i-th element of the 8x8 block containing m.
  • 1 ′ (input value) input to the inverse color converter 510 in FIG. 8 may be expressed by Equation 7 below.
  • ⁇ (, «) represents the result of performing IDCT on the residual signal
  • Equation 64 is a value calculated by the spatial domain predictor 551 as a result of predicting the HDR value by using the reconstructed LDR value mass (,?).
  • Equation 8 Equation 8
  • 1 In one embodiment of the invention shown in FIG. 8, 1 is ("- ⁇ AC) and 5 is
  • FIG. 9 is a flowchart illustrating an encoding method according to an embodiment of the present invention.
  • An encoding method first converts a first dynamic range image into a second dynamic range image (S910), and encodes a second dynamic range image to generate a basic layer code stream (S920).
  • the first dynamic range image may be an HDR image
  • the second dynamic range image may be an LDR image.
  • step S920 of generating a base layer codestream may be performed by performing a tone-mapping operation on a first dynamic range image to convert the second dynamic range image to a second dynamic range image.
  • Color converting the range image DCT converting the color converted image, quantizing the DCT converted image, and entropy encoding the quantized image.
  • DCT domain data for the second dynamic range image is derived (S930), and DCT domain data for the first dynamic range image is derived (S940).
  • Deriving DCT domain data for the first dynamic range image (S940) includes scaling to the second dynamic range image data range, color converting the scaled image, and DCT converting the color converted image. It may include.
  • steps S930 and S930 are described as being sequentially executed, but two steps may be performed simultaneously, step S930 may be executed first, and step S940 may be performed later.
  • the two steps may be executed simultaneously or sequentially after the two steps may be changed depending on the characteristics of the steps described in FIG. 9.
  • a DCT domain data of the derived second dynamic range image and DCT domain data of the first dynamic range image are used to derive a prediction coefficient related to the first dynamic range image (S950).
  • Alternative Paper (Article 126 of the Rules)
  • the prediction coefficient related to the first dynamic range image may be calculated by using the correlation of the DCT domain data for the first dynamic range image with respect to the DCT domain data for the second dynamic range image.
  • the AC coefficients of the DCT domain data for the first dynamic range image and the AC coefficients of the DCT domain data for the second dynamic range image may include a linear polynomial, an exponential function, a logarithmic function, a trigonometric function, and the like. It can have a correlation expressed as a function.
  • the DC coefficient of the DCT domain data for the first dynamic range image and the DC coefficient of the DCT domain data for the second dynamic range image have a correlation represented by a prediction curve including a plurality of intervals.
  • Each interval of the prediction curve can be defined by the same or different functions such as polynomials, exponential functions, logarithmic functions, and trigonometric functions.
  • the prediction DCT domain data for the first dynamic range image is derived using the DCT domain data for the second dynamic range image and the prediction coefficients related to the first dynamic range image.
  • Generate one residual coefficient S960.
  • the residual coefficient may be a DCT coefficient
  • the first dynamic range may be defined as a difference value between the DCT domain data for the unknown and the predicted DCT domain data related to the first dynamic range image.
  • a residual layer codestream including a first dynamic range image-related prediction coefficient and the at least one residual coefficient is generated (S970).
  • the residual layer codestream may include prediction coefficients.
  • Alternative Paper (Article 126 of the Rules)
  • the base layer code stream and the residual layer code stream are transmitted to the decoder (S980). 10 is an operation flowchart of a decoding method according to an embodiment of the present invention.
  • the decoding method according to an embodiment of the present invention may be performed by the image decoder illustrated in FIG. 3, but the operation subject is not limited thereto.
  • the decoder receives a residual layer code stream including the first dynamic range image related prediction coefficients (S1010).
  • the decoder also receives a base layer codestream (S1020) and decodes the received base layer codestream to generate a second dynamic range image (S1030).
  • steps S1010 and S1020 are described as being sequentially executed, but two steps may be performed simultaneously, step S1020 may be executed first, and step S1010 may be performed later.
  • the two steps may be executed simultaneously or the order of two steps shown sequentially may be changed according to the characteristics of the steps described in FIG. 10.
  • the decoder derives DCT domain data for the second dynamic range image (S1040), and predicts the first dynamic range image from the prediction coefficients related to the first dynamic range image and the DCT domain data for the second dynamic range image. Derived DCT domain data (S1050).
  • the decoder finally reconstructs the first dynamic range image by converting the DCT domain data for the first dynamic range image (S1060).
  • DCT domain data for the first dynamic range image S1060
  • one dynamic alternative paper is processed through inverse-DCT conversion, inverse-color conversion, and inverse-scale. Convert DCT domain data for an image.
  • 11 is an operational flowchart of a decoding method according to another embodiment of the present invention.
  • the decoding method according to an embodiment of the present invention may be performed by the image decoder illustrated in FIG. 8, but the operation subject is not limited thereto.
  • the decoder receives a residual layer code stream including the first dynamic range image related prediction coefficients (S1110).
  • the decoder also receives a base layer codestream (S1120) and performs inverse-DCT transformation on the received base layer codestream to derive spatial domain data for the second dynamic range image (S1130).
  • steps S1110 and S1120 are described as being sequentially executed, but the two steps may be performed simultaneously, or step S1120 may be executed first and step S1110 may be performed later.
  • the two steps may be executed simultaneously or sequentially after the two steps may be changed according to the characteristics of the steps described in FIG. 11.
  • the decoder then calculates the first dynamic range image-related prediction spatial domain data from the first dynamic range image-related prediction coefficients and the spatial domain data for the second dynamic range image (S1140).
  • the decoder performs inverse -DCT transform on the residual signal included in the residual layer codestream (S1150), and extracts the first dynamic range image from the prediction space data for the first dynamic range image and the inverse -DCT transformed residual signal. Reconfigure (S1160).
  • the encoding performance can usually vary depending on the sample image and TM0 adopted.
  • three sample images of "01”, “02", and “03 '' and five TM0 techniques were selected, as shown in Figs. 5 and 6, and a total of 15 cases were tested. And the same conclusion was reached for the performance comparison.
  • Mantel et al. Evaluated the subjective image quality index of Signal_to-noi se rat io (SNR), Mean relative square error (MRSE), and HDR-VDP-2 to determine the subjective quality of HDR images compressed with JPEG XT profiles. And the result of the objective image quality comparison evaluation. This shows that the MRSE quality assessment index provides the most obvious results when using JPEG XT.
  • SNR Signal_to-noi se rat io
  • MRSE Mean relative square error
  • HDR-VDP-2 HDR-VDP-2
  • Cho i et al. Evaluated the performance of the JPEG XT profile by comparing the correlation between the coding performance and the various TM0 profiles using the PSNR quality evaluation index.
  • PSNR, SSIM, HDR-VDP-2 and MRSE-base SNR were selected for performance comparison, and the PSNR and MRSE-based SNR used in the present invention can be identified through the following notation and definition.
  • the program provided by the authors of each quality index was used for the evaluation when using SS IM and HDR-VDP-2.
  • M and N are the vertical and horizontal image size
  • an image encoding / decoding system to which the present invention is applicable is not limited to JPEG. That is, the present invention may be applicable to any system or apparatus as long as the MPEG system capable of encoding and decoding a video or the encoding or decoding system or apparatus for an image including a still image or a video. Operation of the encoding method and the decoding method according to an embodiment of the present invention can be implemented as a computer-readable program or code on a computer-readable recording medium.
  • Computer-readable recording media include all kinds of recording devices that store data that can be read by a computer system. Also computer readable
  • the computer-readable recording medium may include a hardware device specifically configured to store and execute program instructions, such as a ROM, a RAM, a flash memory, or the like.
  • Program instructions can include high-level language code that can be executed by a computer using an interpreter, as well as machine code such as that produced by a compiler.
  • While some aspects of the invention have been described in the context of a device, it may also represent a description according to the method in which the block or the device is characterized by a method step or a feature of the method step. Similarly, aspects described in the context of the method may also be characterized by the feature of the block or item being interacted with.
  • Some or all of the method steps may be performed by (or using) a hardware device such as, for example, a microprocessor, a programmable computer, or an electronic circuit. In some embodiments, one or more of the most significant method steps may be performed by such an apparatus.
  • a programmable logic device eg, a field programmable gate array
  • the field programmable gate array may operate in conjunction with a microprocessor to perform one of the methods described herein.
  • the methods are preferably performed by any hardware device.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Disclosed is an image encoder comprising: a basic layer processor for converting a first dynamic range image into a second dynamic range image, and encoding the second dynamic range image so as to generate a basic layer code stream; an inverse quantizer for inversely quantizing the second dynamic range image quantized by the basic layer processor, and deriving DCT domain data; and an enhancement layer processor for deriving DCT domain data for the first dynamic range image, and deriving a first dynamic range image-related prediction coefficient from DCT domain data for the second dynamic range image and the DCT domain data for the first dynamic range image. According to the present invention, encoding and decoding, using the correlation of the first dynamic range image data and the second dynamic image data, of an HDR image having JPEG backward-compatibility can be provided such that encoding and decoding performance can be improved.

Description

【명세서】  【Specification】
【발명의 명칭]  [Name of invention]
이미지 부호화 및 복호화 방법, 이를 이용하는 이미지 부호화기 및 이미지 복호화기  Image encoding and decoding method, image encoder and image decoder using the same
【기술분야】  Technical Field
본 발명은 이미지 부호화 및 복호화 기술에 관한 것으로, 더욱 상세하게는, The present invention relates to an image encoding and decoding technique, and more particularly,
JPEG 역방향의 호환이 가능한 HDR High Dynamic Range) 이미지 부호화 및 복호화 방법, 이를 이용하는 이미지 부호화기 및 이미지 복호화기에 관한 것이다. The present invention relates to a method of encoding and decoding HDR High Dynamic Range (JPEG) backward compatible, and to an image encoder and an image decoder using the same.
【배경기술]  Background technology
이미지는 일반적으로 휘도 신호를 나타내기 위해 제한된 범위의 값들에 대웅 하는 제한된 수의 비트들로 표현될 수 있다. 현재 사용되고 있는 가장 일반적인 디 지털 이미지 포맷은 이미지 내의 각 픽셀 (pixel )에 색채와 휘도 ( luminance) 정보를 저장하기 위해 24비트 (소위 24비트 포맷)를 사용한다. 예를 들면, 픽셀에 대한 적 색, 녹색, 청색 (Red , Green 및 Blue) 각각의 값은 1 바이트 (8 비트) 범위로 저장될 수 있다. 이러한 이미지들을 저 동적 범위 (Low Dynami c Range , 이하 'LDR' ) 이미 지라고 부른다.  An image can generally be represented by a limited number of bits that represent a limited range of values to represent a luminance signal. The most common digital image formats currently in use use 24-bit (so-called 24-bit format) to store color and luminance information at each pixel in the image. For example, each value of red, green, and blue (Red, Green, and Blue) for a pixel may be stored in a range of 1 byte (8 bits). These images are called low dynamic range (LDR) images.
인간이 감지할 수 있는 빛의 밝기는 일정한 범위를 가지는데, 감지할 수 있 는 가장 어두운 밝기와 가장 밝은 밝기의 비율을 동적 범위 (Dynami c Range)라 한 다. 인간이 인지할 수 있는 휘도 ( luminance)의 동적 범위가 10—3 에서 10 cd/m2 (candel a/ m' )까지인 반면, RGB 컬러 표현당 전통적인 8 비트를 사용하는 통상의 The brightness of light that can be detected by humans has a certain range. The ratio of the darkest and the brightest light that can be detected is called the dynamic range. In the 10-3 dynamic range of the brightness (luminance) that is easy for a person to recognize 10 cd / m 2 (candel a / m ') , while the conventional RGB color to use conventional expression by eight bits per
대체용지 (규칙 저 126조) 디지털 카메라 /디스플레이의 동적 범위는 오로지 대략 102 cd/m2로 한정된다. 다행히 카메라 산업에서는, LDR 이미지에서, 12 비트 또는 16 비트 등과 같 이 고 -비트 -깊이 (high-bit-depth)로 각 RGB 컬러를 나타내는 고 동적 범위 (High Dynamic Range, 이하 'HDR' ) 이미지로의 전환이 시작되고 있다. Alternative Paper (Article 126 of the Rules) The dynamic range of the digital camera / display is only limited to approximately 10 2 cd / m 2 . Fortunately, in the camera industry, in LDR images, high dynamic range ('HDR') images representing each RGB color at high-bit-depth, such as 12-bit or 16-bit, etc. Conversion is beginning.
HDR 이미지를 디스플레이 하는 것 역시 고—비트 -깊이 출력 디바이스가 요구 된다. 하지만, 대부분의 기존 출력 디바이스는 아직 LDR에 머물러 있고, 이미지 산 ¾에서 입력과 출력 디바이스 간의 이러한 불균형 상태는 수년간지속될 것으로 예 상된다. 기존 디스플레이 상에 HDR 이미지를 시각화하기 위한 해결방안으로 HDR 이 미지를 LDR 이미지로 변환하는 톤 -매핑 연산자 (TMO, tone-mapping operator )를 사 용하는 방법이 제안되었다.  Displaying HDR images also requires a high-bit-depth output device. However, most existing output devices are still in LDR, and this imbalance between input and output devices in image mounts is expected to last for years. As a solution for visualizing HDR images on existing displays, a method using a tone-mapping operator (TMO) has been proposed that converts HDR images into LDR images.
한편, 이미지 부호화에 있어서, 레거시 -JPEG( legacy- JPEG: L-JPEG) 표 준 ( ISO/IEC 10918)은 아직까지 사진 시장을 지배하고 있다. 그러나, 이 표준은 HDR 이미지를 지원하지 않는다. 비록 JPEG 2000 ( IS0/IEC 15444) 또는 JPEG XR ( ISO/IEC 29199)과 같은 진보된 이미지 부호화 표준은 HDR 이미지 지원을 제공하고 는 있지만, 시장에서 이 표준들의 HDR 이미지 부호화 채택이 긍정적인 면으로 예상 되고 있지 않다.  On the other hand, in image coding, the legacy-JPEG (Legacy-JPEG) standard (ISO / IEC 10918) still dominates the photography market. However, this standard does not support HDR images. Although advanced image coding standards such as JPEG 2000 (IS0 / IEC 15444) or JPEG XR (ISO / IEC 29199) provide HDR image support, the adoption of HDR image coding by these standards is expected to be positive on the market. It is not becoming.
JPEG 위원회 (SC29WG1)는 이러한 현상의 주요 원인이 이미 시장에서 도구의 사슬로 형성되어 있는 L-JPEG과의 역방향 호환성이 부족한데 기인한 것임을 인식하 여 JPEG XT( ISO/IEC 18477)로 불리는 새로운 이미지 부호화 표준화 작업을 개시한 바 있다. 프로파일 A, B 및 C로 불리는 3개의 프로파일이 JPEG XT를 위해 제안되었  The JPEG Commission (SC29WG1) recognizes that the main cause of this phenomenon is due to lack of backward compatibility with L-JPEG, which is already a tool chain in the market, a new image encoding called JPEG XT (ISO / IEC 18477). Standardization work has been initiated. Three profiles called profiles A, B and C have been proposed for JPEG XT.
대체용지 (규칙저 126조) 으며, 이들 프로파일 간에는 잔차 이미지를 생성하고 부호화하기 위한 방법에 차이 점이 존재한다. Alternative Paper (Article 126 of the Rules) There is a difference between these profiles in the method for generating and encoding the residual image.
살펴본 바와 같이, 기존의 JPEG XT 시스템은 역호환이 가능한 HDR 이미지 부 호화를 제공하고 있으나 성능 면에서 만족할만한 성과를 보여주지 못하고 있다. 【발명의 상세한 설명】  As can be seen, the existing JPEG XT system provides backward compatible HDR image encoding, but has not shown satisfactory performance. [Detailed Description of the Invention]
【기술적 과제】  [Technical problem]
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, JPEG 역방향의 호환 이 가능한 이미지 부호화 방법을 제공하는 데 있다.  An object of the present invention for solving the above problems is to provide an image encoding method compatible with backward JPEG.
상기와 같은 문제점을 해결하기 위한 본 발명의 다른 목적은, JPEG 역방향의 호환이 가능한 이미지 복호화 방법을 제공하는 데 있다.  Another object of the present invention for solving the above problems is to provide an image decoding method compatible with JPEG backwards.
상기와 같은 문제점을 해결하기 위한 본 발명의 또 다른 목적은, JPEG 역방 향의 호환이 가능한 이미지 부호화기를 제공하는 데 있다.  Another object of the present invention for solving the above problems is to provide an image encoder that is backward compatible JPEG.
상기와 같은 문제점을 해결하기 위한 본 발명의 또 다른 목적은, JPEG 역방 향의 호환이 가능한 이미지 복호화기를 제공하는 데 있다.  Another object of the present invention for solving the above problems is to provide an image decoder compatible with JPEG reverse direction.
【기술적 해결방법】  Technical Solution
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 이미지 부호화 방법 은, 제 1 동적범위 이미지를 제 2 동적범위 이미지로 변환하고, 제 2 동적범위 이미 지를 인코딩하여 기본 계층 코드스트림을 생성하는 단계, 상기 제 2 동적범위 이미 지에 대한 DCT(Di screte Cos ine Transform) 도메인 데이터를 도출하는 단계, 상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터를 도출하는 단계, 상기 제 2 동적범 위 이미지에 대한 DCT 도메인 데이터 및 상기 계 1 동적범위 이미지에 대한 DCT 도 대체용지 (규칙 저 126조) 메인 데이터로부터 계 1 동적범위 이미지 관련 예측 계수를 도출하는 단계, 및 상기 제 2 동적 범위 이미지에 대한 DCT 도메인 데이터 및 상기 제 1 동적범위 이미지 관련 예측 계수를 이용하여 계 1 동적범위 이미지에 대한 예측 DCT 도메인 데이터 를 도출하는 단계를 포함한다. An image encoding method according to an embodiment of the present invention for achieving the above object, the step of converting a first dynamic range image to a second dynamic range image, and encoding a second dynamic range image to generate a base layer code stream Deriving DC screte cosine transform (DCT) domain data for the second dynamic range image, deriving DCT domain data for the first dynamic range image, DCT for the second dynamic range image DCT diagram replacement paper for domain data and the first dynamic range image (rule 126) Deriving prediction coefficients related to the first dynamic range image from the main data, and using the DCT domain data for the second dynamic range image and the prediction coefficients related to the first dynamic range image, the prediction DCT for the first dynamic range image. Deriving domain data.
여기서, 제 1 동적범위 이미지는 HDR 이미지이고, 상기 제 2 동적범위 이미지 는 LDR 이미지일 수 있다.  Here, the first dynamic range image may be an HDR image, and the second dynamic range image may be an LDR image.
상기 제 1 동적범위 이미지 관련 예측 계수를 도출하는 단계는, 상기 제 2 동 적범위 이미지에 대한 DCT 도메인 데이터에 대한 상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 상관성을 활용하여 상기 계 1 동적범위 이미지 관련 예측 계수 를 산출하는 단계를 포함할 수 있다.  Deriving the prediction coefficients related to the first dynamic range image may include using the correlation of the DCT domain data for the first dynamic range image with respect to the DCT domain data for the second dynamic range image. The method may include calculating image related prediction coefficients.
상기 이미지 부호화 방법은 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데 이터 및 상기 제丄동적범위 이미지 관련 예측 계수로부터 도출한 제]_ 동적범위 이미 지에 대한 예측 DCT 도메인 데이터를 이용해 적어도 하나의 잔차 계수를 생성하는 단계 및 제 1 동적범위 이미지 관련 예측 계수 및 상기 적어도 하나의 잔차 계수를 포함하는 잔차 계층 코드스트림을 생성하는 단계를 더 포함할 수 있다.  The image encoding method uses at least one residual coefficient by using the DCT domain data for the second dynamic range image and the predictive DCT domain data for the dynamic range image derived from the prediction coefficients related to the thrust dynamic range image. The method may further include generating and generating a residual layer codestream including the first dynamic range image related prediction coefficient and the at least one residual coefficient.
상기 기본 계층 코드스트림을 생성하는 단계는, 제 1 동적범위 이미지에 대해 톤 -매핑 연산을 수행하여 상기 계 2 동적범위 이미지로 변환하는 단계를 포함할 수 있다.  The generating of the base layer codestream may include converting the first layer dynamic range image into the second dynamic range image by performing a tone-mapping operation on the first dynamic range image.
상기 기본 계층 코드스트림을 생성하는 단계는 또한, 상기 제 2 동적범위 이 미지를 컬러 변환하는 단계, 컬러 변환된 이미지를 DCT 변환하는 단계, DCT 변환된 이미지를 양자화하는 단계 및 상기 양자화된 이미지를 엔트로피 인코딩하는 단계를 대체용지 (규칙 저 126조) 포함할 수 있다. Generating the base layer codestream also includes color transforming the second dynamic range image, DCT transforming the color transformed image, quantizing the DCT transformed image, and entropy the quantized image. Alternative paper for encoding steps (Article 126) It may include.
이때, 상기 DCT 변환된 이미지를 양자화하는 단계에서 사용되는 화질계수는 상기 잔차 계수에 대한 양자화에 사용되는 화질계수와 동일할 수 있다.  In this case, the image quality coefficient used in the quantization of the DCT transformed image may be the same as the image quality coefficient used for quantization of the residual coefficient.
추가적으로, 상기 제 2 동적범위 이미지에 대한 DCT도메인 데이터를 도출하는 단계는, 상기 양자화된 DCT 변환된 이미지에 대해 역양자화를 수행하는 단계를 포 함할 수 있다.  Additionally, deriving DCT domain data for the second dynamic range image may include performing inverse quantization on the quantized DCT transformed image.
이 때, 상기 게 1 동적범위 이미지에 대한 DCT 도메인 데이터의 AC 계수와 상 기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터의 AC 계수는 다항식, 지수 함 수, 로그 함수, 삼각 함수 등의 함수로 표현되는 상관성을 가질 수 있다. 또한, 상 기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 DC 계수는 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터의 DC 계수에 대하여 복수의 구간을 포함하는 예 측 곡선으로 표현되는 상관성을 가지며, 상기 예측 곡선의 각 구간은 동일 또는 서 로 다른 다항식, 지수 함수, 로그 함수, 삼각 함수 등의 함수에 의해 정의될 수 있 다. 본 발명의 다른 목적을 달성하기 위한 본 발명의 일 실시예에 따른 이미지 복호화 방법은 제 1 동적범위 이미지 관련 예측 계수를 포함하는 잔차 계층 코드스 트림을 수신하는 단계, 기본 계층 코드스트림을 수신하고, 수신한 기본 계층 코드 스트림을 디코딩하여 제 2 동적범위 이미지를 생성하는 단계, 상기 제 2 동적범위 이 미지에 대한 DCT 도메인 데이터를 도출하는 단계, 잔차 DCT 도메인 데이터를 도출 하는 단계, 상기 제 1 동적범위 이미지 관련 예측 계수 및 상기 제 2 동적범위 이미 대체용지 (규칙저 126조) 지에 대한 DCT 도메인 데이터로부터 제 1 동적범위 이미지에 대한 예측 DCT 도메인 데이터를 산출하는 단계, 상기 잔차 DCT 도메인 데이터와 상기 제 1 동적범위 이미 지에 대한 예측 DCT 도메인 데이터를 합하여 제 1 동적범위 이미지에 대한 DCT 도메 인 데이터를 재구성하는 단계, 및 상기 제 1 동적범위 이미지에 대한 DCT 도메인 데 이터를 디코딩하여 제 1 동적범위 이미지를 생성하는 단계를 포함한다. In this case, the AC coefficient of the DCT domain data for the first dynamic range image and the AC coefficient of the DCT domain data for the second dynamic range image are expressed as a function such as a polynomial, an exponential function, a logarithmic function, and a trigonometric function. It can have a correlation. In addition, the DC coefficient of the DCT domain data for the first dynamic range image has a correlation represented by a prediction curve including a plurality of intervals with respect to the DC coefficient of the DCT domain data for the second dynamic range image, Each interval of the prediction curve may be defined by the same or different functions such as polynomials, exponential functions, logarithmic functions, trigonometric functions, and the like. In accordance with another aspect of the present invention, there is provided a method of decoding an image, the method comprising: receiving a residual layer codestream including a first dynamic range image related prediction coefficient, receiving a base layer codestream, Decoding the received base layer code stream to generate a second dynamic range image; deriving DCT domain data for the second dynamic range image; deriving a residual DCT domain data; Image-related prediction coefficients and the second dynamic range already substituted (Article 126) Calculating predictive DCT domain data for the first dynamic range image from the DCT domain data for the digital image; adding the residual DCT domain data and the predictive DCT domain data for the first dynamic range image to add the DCT for the first dynamic range image. Reconstructing domain data, and decoding the DCT domain data for the first dynamic range image to generate a first dynamic range image.
여기서, 제 1 동적범위 이미지는 HDR 이미지이고, 상기 제 2 동적범위 이미지 는 LDR 이미지일 수 있다.  Here, the first dynamic range image may be an HDR image, and the second dynamic range image may be an LDR image.
상기 제 1 동적범위 이미지에 대한 예측 DCT도메인 데이터를 산출하는 단계 는 상기 잔차 코드스트림으로부터 제 1 동적범위 이미지 관련 예측 계수를 도출하 는 단계 및 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터에 상기 제 1 동 적범위 이미지 관련 예측 계수에 의한 함수를 적용하는 단계를 포함할 수 있다. 본 발명의 다른 목적을 달성하기 위한 본 발명의 다른 실시예에 따른 이미지 복호화 방법은 제 1 동적범위 이미지 관련 예측 계수를 포함하는 잔차 계층 코드스 트림을 수신하는 단계, 기본 계층 코드스트림을 수신하고, 수신한 기본 계층 코드 스트림에 대해 역 -DCT lnverse Discrete Cos ine Transform) 변환을 수행하여 저 12 동적범위 이미지에 대한 공간 도메인 데이터를 도출하는 단계, 상기 제 1 동적범위 이미지 괸:련 예측 계수 및 상기 제 2동적범위 이미지에 대한 공간 도메인 데이터로 부터 상기 제 1 동적범위 이미지에 대한 예측 공간 도메인 데이터를 산출하는 단계, 상기 잔차 계층 코드스트림에 포함된 잔차 신호에 대해 역 -DCT 변환을 수행하는 단 계 및 상기 제 1 동적범위 이미지 관련 공간 예측 데이터 및 역 -DCT 변환된 잔차 신 대체용지 (규칙 저 126조) 호로부터 제 1 동적범위 이미지를 재구성하는 단계를 포함할 수 있다. Computing the predictive DCT domain data for the first dynamic range image may include deriving a first dynamic range image related prediction coefficient from the residual codestream and the DCT domain data for the second dynamic range image. 1 may include applying a function by the prediction coefficients related to the dynamic range image. In accordance with another aspect of the present invention, there is provided a method of decoding an image, the method comprising: receiving a residual layer codestream including a first dynamic range image related prediction coefficient, receiving a base layer codestream, Deriving spatial domain data for a low 12 dynamic range image by performing an inverse -DCT lnverse Discrete Cosine Transform on the received base layer code stream, wherein the first dynamic range image 련: series prediction coefficients and the first Calculating predictive spatial domain data for the first dynamic range image from spatial domain data for the dynamic range image, performing inverse-DCT transformation on the residual signal included in the residual layer codestream, and The spatial prediction data related to the first dynamic range image and the inverse-DCT transformed residual scene replacement paper (Rule 12) Article 6) Reconstructing the first dynamic range image from the call.
여기서, 제 1 동적범위 이미지는 HDR 이미지이고, 상기 제 2 동적범위 이미지 는 LDR 이미지일 수 있다.  Here, the first dynamic range image may be an HDR image, and the second dynamic range image may be an LDR image.
상기 제 1 동적범위 이미지에 대한 예측 공간 도메인 데이터를 산출하는 단 계는 상기 잔차 코드스트림으로부터 제 1 동적범위 이미지 관련 예측 계수를 도출 하는 단계 및 상기 게 2 동적범위 이미지에 대한 공간 도메인 데이터에 상기 저 1 1 동적범위 이미지 관련 예측 계수에 의한 함수를 적용하는 단계를 포함할 수 있다. 본 발명의 또 다른 목적을 달성하기 위한 본 발명의 일 실시예에 따른 이미 지 부호화기는 제 1 동적범위 이미지를 제 2 동적범위 이미지로 변환하고, 제 2 동적 범위 이미지를 인코딩하여 기본 계층 코드스트림을 생성하는 기본계층 프로세서, 상기 기본계층 프로세서에 의해 양자화된 제 2 동적범위 이미지에 대해 역양자화를 수행하여 DCT 도메인 데이터를 도출하는 역양자화기, 및 상기 제 1 동적범위 이미지 에 대한 DCT 도메인 데이터를 도출하고, 상기 제 2 동적범위 이미지에 대한 DCT 도 메인 데이터 및 상기 계 1 동적범위 이미지에 대한 DCT 도메인 데이터로부터 제 1 동 적범위 이미지 관련 예측 계수를 도출하는 향상계층 프로세서를 포함할 수 있다. 여기서, 상기 제 1 동적범위 이미지는 HDR 이미지이고, 상기 제 2 동적범위 이 미지는 LDR 이미지일 수 있다.  The step of calculating the predictive spatial domain data for the first dynamic range image may include deriving a first dynamic range image related prediction coefficient from the residual codestream and storing the predicted spatial domain data for the second dynamic range image. 1 1 may include applying a function by the prediction coefficients related to the dynamic range image. In accordance with another aspect of the present invention, an image encoder converts a first dynamic range image into a second dynamic range image and encodes a second dynamic range image to generate a base layer codestream. A base layer processor to generate, an inverse quantizer for deriving DCT domain data by performing inverse quantization on the second dynamic range image quantized by the base layer processor, and deriving DCT domain data for the first dynamic range image And an enhancement layer processor for deriving a prediction coefficient related to the first dynamic range image from the DCT domain data for the second dynamic range image and the DCT domain data for the first dynamic range image. Here, the first dynamic range image may be an HDR image, and the second dynamic range image may be an LDR image.
상기 향상계층 프로세서는, 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데 이터에 대한 상기 제 1 동적범위 이미지에 대한 DCT도메인 데이터의 상관성을 활용 하여 상기 제 1 동적범위 이미지 관련 예측 계수와 계 1 동적범위 이미지에 대한 예 대체용지 (규칙저 126조) 측 DCT도메인 데이터를 산출하는 예측기를 포함할 수 있다. The enhancement layer processor is configured to utilize the correlation of the DCT domain data for the first dynamic range image with respect to the DCT domain data for the second dynamic range image to predict the first dynamic range image and the first dynamic range. Example Alternative Paper for Images (Article 126) It may include a predictor for calculating side DCT domain data.
상기 향상계층 프로세서는 또한, 제 2 동적범위 이미지에 대한 DCT 도메인 데 이터 및 상기 제 1동적범위 이미지 관련 예측 계수로부터 도출한 제 1 동적범위 이미 지에 대한 예측 DCT 도메인 데이터를 이용해 적어도 하나의 잔차 계수를 생성하고, 상기 제 1 동적범위 이미지 관련 예측 계수 및 상기 적어도 하나의 잔차 계수를 포 함하는 잔차계층 코드스트림을 생성할 수 있다.  The enhancement layer processor may also generate at least one residual coefficient using the DCT domain data for the second dynamic range image and the prediction DCT domain data for the first dynamic range image derived from the prediction coefficients related to the first dynamic range image. And a residual layer codestream including the first dynamic range image related prediction coefficient and the at least one residual coefficient.
여기서, 상기 기본계층 프로세서에 의해 수행되는 상기 제 2 동적범위 이미지 에 대한 양자화에 사용되는 화질계수는 상기 향상계층 프로세서에 의해 수행되는 잔차 계수에 대한 양자화에 사용되는 화질계수와 동일할 수 있다.  Here, the image quality coefficient used for quantization of the second dynamic range image performed by the base layer processor may be the same as the image quality coefficient used for quantization of the residual coefficient performed by the enhancement layer processor.
한편, 상기 기본계층 프로세서는, 제 1 동적범위 이미지에 대해 톤 -매핑 연산 을 수행하여 상기 제 2 동적범위 이미지로 변환하는 톤 -매핑 연산자를 포함할 수 있 으며, 상기 제 2 동적범위 이미지를 컬러 변환하는 컬러 변환기, 컬러 변환된 이미 지를 DCT 변환하는 DCT 변환기, DCT 변환된 이미지를 양자화하는 양자화기 및 상기 양자화된 이미지를 엔트로피 인코딩하는 엔트로피 인코더를 포함할 수 있다. 본 발명의 또 다른 목적을 달성하기 위한 본 발명의 다른 실시예에 따른 이 미지 복호화기는, 기본 계층 코드스트림을 수신하여, 상기 기본 계층 코드스트림을 디코딩하고 제 2 동적범위 이미지에 대한 DCT 도메인 데이터를 도출하며 제 2 동적범 위 이미지를 생성하는 기본계층 디코더 및 제 1 동적범위 이미지 관련 예측 계수를 포함하는 잔차 계층 코드스트림을 수신하고, 상기 제 1 동적범위 이미지 관련 예측 계수 및 상기 제 2동적범위 이미지에 대한 DCT 도메인 데이터로부터 상기 제 1 동적 대체용지 (규칙저 126조) 범위 이미지에 대한 DCT 도메인 데이터를 산출하며, 상기 게 1 동적범위 이미지에 대한 DCT 도메인 데이터에 대해 역 -DCT변환을 수행하여 제 1 동적범위 이미지를 재 구성하는 향상계층 디코더를 포함할 수 있다. 본 발명의 또 다른 목적을 달성하기 위한 본 발명의 또 다른 실시예에 따른 이미지 복호화기는, 기본 계층 코드스트림을 수신하여, 상기 기본 계층 코드스트림 에 대해 엔트로피 디코딩, 역-양자화 및 역 -DCT변환을 수행하여 제 2 동적범위 이미 지를 도출하는 기본계층 디코더 및 제 1 동적범위 이미지 관련 예측 계수 및 잔차 신호를 포함하는 잔차 계층 코드스트림을 수신하고, 상기 계 1 동적범위 이미지 관 련 예측 계수 및 상기 제 2동적범위 이미지에 대한 공간 도메인 데이터로부터 상기 제 1 동적범위 이미지 관련 공간 예측 데이터를 산출하며, 상기 제 1 동적범위 이미 지 관련 공간 예측 데이터 및 역 -DCT 변환된 잔차 신호로부터 제 1 동적범위 이미지 를 재구성하는 향상계층 디코더를 포함할 수 있다. The base layer processor may include a tone-mapping operator that performs a tone-mapping operation on a first dynamic range image and converts the second dynamic range image into a color. And a color converter for converting, a DCT converter for DCT converting the color converted image, a quantizer for quantizing the DCT converted image, and an entropy encoder for entropy encoding the quantized image. According to another aspect of the present invention, an image decoder according to another embodiment of the present invention receives a base layer codestream, decodes the base layer codestream, and decodes DCT domain data for a second dynamic range image. Receive a residual layer codestream including a base layer decoder for generating a second dynamic range image and prediction coefficients related to the first dynamic range image, and receiving prediction coefficients related to the first dynamic range image and the second dynamic range image From the DCT domain data for the first dynamic replacement sheet (Rule 126) The DCT domain data of the range image may be calculated, and the enhancement layer decoder may reconstruct the first dynamic range image by performing inverse-DCT transformation on the DCT domain data of the first dynamic range image. According to still another aspect of the present invention, an image decoder according to another embodiment of the present invention receives a base layer codestream and performs entropy decoding, inverse-quantization, and inverse-DCT transform on the base layer codestream. Receiving a residual layer codestream including a base layer decoder and a first dynamic range image-related prediction coefficient and a residual signal to derive a second dynamic range image, and performing the first dynamic range image-related prediction coefficient and the second Calculating spatial prediction data related to the first dynamic range image from spatial domain data for a dynamic range image, and reconstructing a first dynamic range image from the first dynamic range image related spatial prediction data and an inverse-DCT transformed residual signal It may include an enhancement layer decoder.
【발명의 효과】  【Effects of the Invention】
상술한 바와 같은 본 발명의 HDR 이미지 부호화 방법 및 복호화 방법에 따르 면, DCT 도메인에서 톤-매핑된 LDR 이미지에 대한 HDR 이미지의 상관성을 활용하는 JPEG 역방향의 호환이 가능한 HDR 이미지 부호화 및 복호화를 제공할 수 있어 부호 화 및 복호화 성능을 향상시킬 수 있다.  According to the HDR image encoding method and decoding method of the present invention as described above, JPEG backward compatible HDR image encoding and decoding that utilizes the correlation of the HDR image to the tone-mapped LDR image in the DCT domain can be provided. It can improve the encoding and decoding performance.
【도면의 간단한 설명】  [Brief Description of Drawings]
도 1은 JPEG XT부호화 시스템의 블록 구성도이다.  1 is a block diagram of a JPEG XT encoding system.
도 2는 본 발명의 일 실시예에 따른 HDR 이미지 부호화기의 블록 구성도이 대체용지 (규칙 저 126조) 다. 2 is a block diagram of a block diagram of an HDR image encoder according to an embodiment of the present invention (rule 126) All.
도 3은 본 발명의 일 실시예에 따른 HDR 이미지 복호화기의 블록 구성도이 다.  3 is a block diagram of an HDR image decoder according to an embodiment of the present invention.
도 4는 본 발명의 실시예에 따른 HDR 이미지 부호화 방법 및 복호화 방법의 실험 결과를 설명하기 위한 복수의 이미지 샘플들을 나타낸다.  4 illustrates a plurality of image samples for explaining an experimental result of the HDR image encoding method and the decoding method according to an embodiment of the present invention.
도 5는 본 발명의 실시예에 따른 다양한 TM0에 대한 AC 계수의 분포를 나타 내는 예시도이다.  5 is an exemplary diagram illustrating a distribution of AC coefficients for various TM0s according to an embodiment of the present invention.
도 6은 본 발명의 일 실시예에 따른 다양한 TM0에 대한 DC 계수의 분포를 나 타내는 예시도이다.  6 is an exemplary diagram illustrating a distribution of DC coefficients for various TM0s according to an embodiment of the present invention.
도 7은 본 발명의 다른 실시예에 따라 예측 HDR DC 값을 도출하는 개념을 설 명하기 위한 그래프이다.  7 is a graph illustrating a concept of deriving a predictive HDR DC value according to another embodiment of the present invention.
도 8은 본 발명의 다른 실시예에 따른 HDR 이미지 복호화기의 블록 구성도이 다.  8 is a block diagram of an HDR image decoder according to another embodiment of the present invention.
도 9는 본 발명의 일 실시예에 따른 인코딩 방법의 동작 순서도이다.  9 is a flowchart illustrating an encoding method according to an embodiment of the present invention.
도 10은 본 발명의 일 실시예에 따른 디코딩 방법의 동작 순서도이다.  10 is an operation flowchart of a decoding method according to an embodiment of the present invention.
도 11은 본 발명의 다른 실시예에 따른 디코딩 방법의 동작 순서도이다. 【발명의 실시를 위한 최선의 형태】  11 is an operational flowchart of a decoding method according to another embodiment of the present invention. [Best form for implementation of the invention]
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발 명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것 대체용지 (규칙저 126조) 으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소 에 대해 사용하였다. As the invention allows for various changes and numerous embodiments, particular embodiments will be illustrated in the drawings and described in detail in the written description. However, this is not intended to limit the present invention to specific embodiments, and includes all changes, equivalents, and substitutes included in the spirit and technical scope of the present invention. Should be understood. In describing the drawings, similar reference numerals are used for similar elements.
제 1, 제 2, A , B 등의 용어는 다양한 구성요소들을 설명하는 데 사용될 수 있 지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들 은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 계 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소도 제 1 구성요소로 명명될 수 있다. 및 /또 는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.  Terms such as first, second, A, and B may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, the first component may be referred to as a second component without departing from the scope of the present invention, and similarly, the second component may also be referred to as the first component. The terms and / or include any combination of a plurality of related items or a plurality of related items.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있 을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이 다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접 속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이 해되어야 할 것이다.  When a component is said to be "connected" or "connected" to another component, it may be directly connected or connected to that other component, but other components may be present in the middle. It should be understood. On the other hand, when a component is said to be "directly connected" or "directly connected" to another component, it should be understood that no other component exists in the middle.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것 으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르 게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지 다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징 들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 대체용지 (규칙저 126조) 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. The terminology used herein is for the purpose of describing particular example embodiments only and is not intended to be limiting of the invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, the terms "comprise" or "have" are intended to indicate that there is a feature, number, step, action, component, part, or combination thereof described in the specification, one or more other The presence or substitution of features, numbers, steps, actions, components, parts or combinations thereof (Rule 126) It should be understood that the possibility of addition is not excluded in advance.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일 치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않 는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. 이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다 . 도 1은 JPEG XT부호화 시스템의 블록 구성도이다.  Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art. Terms such as those defined in the commonly used dictionaries should be construed as having meanings consistent with the meanings in the context of the related art, and, unless expressly defined in the present application, in ideal or overly formal meanings. Not interpreted. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. 1 is a block diagram of a JPEG XT encoding system.
도 1에 도시된 JPEG XT부호화 시스템은 프로파일 A, B 및 C 에 대해 적용될 수 있다.  The JPEG XT encoding system shown in FIG. 1 can be applied for profiles A, B and C.
도 1에 도시된 바와 같이 JPEG XT 부호화 시스템은 레거시 -JPEG 인코더 (20) 및 레거시 -JPEG 디코더 (30) 외에 톤매핑 연산자 ( 10), 역 -TMO( ll) , 잔차 이미지 생 성기 (40), 및 잔차 이미지 인코더 (50)를 포함한다.  As shown in FIG. 1, the JPEG XT encoding system includes a tone-mapping operator 10, an inverse -TMO (ll), a residual image generator 40, in addition to a legacy-JPEG encoder 20 and a legacy-JPEG decoder 30. And residual image encoder 50.
이러한 세부 구성들을 포함하는 JPEG XT 부호화 시스템은 기본 계층 코드스 트림과 향상 계층, 즉 잔차 -계층 코드스트림의 두 가지 계층의 데이터를 출력한다.  The JPEG XT encoding system including these detailed configurations outputs data of two layers, a base layer codestream and an enhancement layer, that is, a residual-layer codestream.
JPEG XT 부호화 시스템으로 입력되는 HDR 이미지는 톤매핑 연산자 ( 10)에 의 해 톤-매핑되어 (tone-mapped) LDR 이미지로 변환되고, 컬러 변환기, DCT 변환기, 대체용지 (규칙 저 126조) 양자화기, 엔트로피 인코더를 포함하는 레거시 -JPEG 인코더에 의해 압축되고 레거 시 -JPEG 역방향 호환성을 제공하는 기본 계층 코드스트림을 구성한다. HDR images input to the JPEG XT encoding system are converted to tone-mapped LDR images by the tonemapping operator (10), color converters, DCT converters, and alternative paper (Article 126). Composes a base layer codestream that is compressed by a legacy -JPEG encoder, including a quantizer and an entropy encoder, and provides legacy -JPEG backward compatibility.
향상 계층 (즉, 잔차 계층) 코드스트림은, HDR 이미지가 톤매핑 연산자 ( 10) , 레거시 -JPEG 인코더 (20), 레거시 -JPEG 디코더 (30), 역 -TMO( ll)를 거쳐 출력되는 신 호 및 HDR 신호를 입력으로 하여 잔차 이미지를 생성하는 잔차 이미지 생성기 (40) 및 잔차 이미지 인코더 (50)를 거쳐 생성된다.  The enhancement layer (i.e., residual layer) codestream is a signal whose HDR image is output via the tonemapping operator (10), legacy -JPEG encoder (20), legacy -JPEG decoder (30), and inverse -TMO (ll). And a residual image generator 40 and a residual image encoder 50 that generate the residual image by using the HDR signal as an input.
이때 , 레거시 -JPEG 인코더 (20)와 잔차 이미지 인코더 (50)와 양자화기에서는 각각 q와 Q 2개의 화질 계수가 사용된다. 또한, TM0에 대한 선택권은 사용자에게 주어지는데, 따라서, 어떠한 TM0도 JPEG XT와 함께 사용 가능하다. 역ᅳ TMO( ll) 정 보는 잔차 계층 복호화기기^ LDR 코드스트림의 HDR 버전을 재구성할 때 사용하는 잔 차 계층 코드스트림에 포함될 수 있다. 도 2는 본 발명의 일 실시예에 따른 HDR 이미지 부호화기의 블록 구성도이 다.  At this time, in the legacy -JPEG encoder 20, the residual image encoder 50, and the quantizer, two image quality coefficients q and Q are used, respectively. Also, the choice of TM0 is given to the user, so any TM0 can be used with JPEG XT. Conversely, the TMO (ll) information may be included in the residual layer codestream used when reconstructing the HDR version of the residual layer decoder → LDR codestream. 2 is a block diagram of an HDR image encoder according to an embodiment of the present invention.
본 발명의 일 실시예에 따른 이미지 부호화기는, 톤매핑 연산자 ( 100) 및 레 거시 -JPEG 인코더 (200)를 포함한다. 본 명세서에서 톤매핑 연산자 ( 100) 및 레거시- JPEG 인코더 (200)는 기본계층 프로세서로 지칭될 수 있다.  An image encoder according to an embodiment of the present invention includes a tone mapping operator 100 and a legacy -JPEG encoder 200. Tone mapping operator 100 and legacy-JPEG encoder 200 may be referred to herein as a base layer processor.
본 발명의 일 실시예에 따른 이미지 부호화기는 또한, 도 1을 통해 살펴본 JPEG XT 부호화기와 달리 레거시 -JPEG 디코더를 포함하지 않으며, 대신 스케일 러 (301), 컬러 변환기 (310) , DCT 변환기 (320), 양자화기 (330) , 엔트로피 인코 더 (340), 및 HDR 예측기 (350)를 포함하는 향상계층 프로세서 (300) 및 역-양자화 대체용지 (규칙 저 126조) 기 (331)를 포함할 수 있다. The image encoder according to an embodiment of the present invention also does not include a legacy -JPEG decoder, unlike the JPEG XT encoder described with reference to FIG. 1, but instead includes a scaler 301, a color converter 310, a DCT converter 320. , Enhancement layer processor 300 and quantizer 330, entropy encoder 340, and HDR predictor 350, and de-quantization replacement sheet (Rule 126) And group 331.
본 발명의 일 실시예에 따른 이미지 부호화기는 제 1 동적범위 이미지를 제 2 동적범위 이미지로 변환하고, 제 2 동적범위 이미지를 인코딩하여 기본 계층 코드스 트림을 생성하는 기본계층 프로세서, 상기 기본계층 프로세서에 의해 양자화된 제 2 동적범위 이미지에 대해 역양자화를 수행하여 DCT 도메인 데이터를 도출하는 역양 자화기 및 상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터를 도출하고, 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터 및 상기 제 1 동적범위 이미지에 대 한 DCT 도메인 데이터로부터 제 1 동적범위 이미지 관련 예측 계수를 도출하는 향상 계층 프로세서를 포함할 수 있다.  An image encoder according to an embodiment of the present invention converts a first dynamic range image into a second dynamic range image, and encodes a second dynamic range image to generate a base layer code stream, wherein the base layer processor Inverse quantizer deriving DCT domain data by performing inverse quantization on the second dynamic range image quantized by D, and deriving DCT domain data for the first dynamic range image, and DCT for the second dynamic range image. And an enhancement layer processor for deriving a first dynamic range image related prediction coefficient from domain data and DCT domain data for the first dynamic range image.
여기서, 제 1 동적범위 이미지는 제 2 동적범위 이미지보다 많은 양의 데이터 를 이용해 표현되며, 제 1동적범위 이미지는 HDR 이미지이고 상기 제 2 동적범위 이 미지는 LDR 이미지일 수 있다.  Here, the first dynamic range image may be represented using a larger amount of data than the second dynamic range image, the first dynamic range image may be an HDR image, and the second dynamic range image may be an LDR image.
여기서, 향상계층 프로세서 (300)는, 제 2 동적범위 이미지에 대한 DCT 도메인 데이터에 대한 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 상관성을 활용하 여 거 U 동적범위 이미지 관련 예측 계수를 산출하는 예측기 (350)를 포함할 수 있 다- 향상계층 프로세서는 또한, 계 1 동적범위 이미지에 대한 DCT 도메인 데이터 및 제 1동적범위 이미지 관련 예측 계수를 이용해 적어도 하나의 잔차 계수를 생성 하고, 제 1 동적범위 이미지 관련 예측 계수 및 상기 적어도 하나의 잔차 계수를 포 함하는 잔차계층 코드스트림을 생성한다. 도 2에 도시된 바와 같은 이미지 부호화기의 일 실시예를 통해 본 발명에 따 대체용지 (규칙저 126조) 른 JPEG 역방향-호환가능 HDR 이미지 부호화를 구현할 수 있다. Here, the enhancement layer processor 300 is a predictor that calculates prediction coefficients related to the U dynamic range image by utilizing the correlation of the DCT domain data for the first dynamic range image with respect to the DCT domain data for the second dynamic range image. The enhancement layer processor may also generate at least one residual coefficient using the DCT domain data for the first dynamic range image and the first dynamic range image related prediction coefficients, and the first dynamic range. A residual layer codestream including the image related prediction coefficients and the at least one residual coefficient is generated. Alternative paper according to the present invention through an embodiment of the image encoder as shown in Figure 2 (rule 126) Other JPEG backward-compatible HDR image coding may be implemented.
도 2에서 기본 계층 부호화는 기존의 프로파일과 동일하게 적용된다. 즉, 본 발명에 따른 이미지 부호화기로 입력되는 HDR 이미지는 톤매핑 연산자 (TM0) (100)에 의해 톤-매핑되어 LDR 이미지로 변환되고, 컬러 변환기 (210), DCT 변환기 (220), 양 자화기 (230), 엔트로피 인코더 (240)를 포함하는 레거시 -JPEG 인코더 (200)에 의해 압축되고 레거시 -JPEG 역방향 호환성을 제공하는 기본 계층 코드스트림을 구성한 다.  In FIG. 2, base layer encoding is applied in the same manner as the existing profile. That is, the HDR image input to the image encoder according to the present invention is tone-mapped by the tone mapping operator (TM0) 100 to be converted into an LDR image, a color converter 210, a DCT converter 220, a quantizer 230, constructs a base layer codestream compressed by legacy-JPEG encoder 200 including entropy encoder 240 and providing legacy-JPEG backward compatibility.
여기서, 톤매핑 연산자 ( 100)는 동적 범위의 압축이라고 할 수 있으며, 원래 이미지에서 에지 정보 등의 특징 및 디테일 등을 잃지 않는 선에서 이미지 HDR 이 미지를 톤매핑하여 8-비트 LDR 이미지로 변환한다.  Here, the tone mapping operator (100) may be referred to as dynamic range compression, and converts an image HDR image into an 8-bit LDR image by tone mapping an image HDR image without losing the features and details such as edge information from the original image. .
컬러 변환기 (210)는 RGB (Red-Green-Blue )로 표현되는 LDR 이미지를 YCbCr 변 환한다. DCT 변환기 (220)는 YCbCr 로 표현된 이미지 데이터에 대해 8x8 블록 -기반 DCT 변환을 수행한다. 여기서, DCT는 영상의 주파수 변환에 널리 사용되는 기법 중 하나로 코사인 기저를 사용하여 공간 도메인의 이미지 데이터를 주파수 도메인의 이미지 데이터로 변환한다. DCT 변환이 수행되면 결과값으로 DC 및 AC 성분, 즉, DC 계수 및 AC 계수가 얻어진다.  The color converter 210 converts the LDR image represented by RGB (Red-Green-Blue) to YCbCr. DCT converter 220 performs an 8x8 block-based DCT transform on the image data represented by YCbCr. Here, DCT is one of techniques widely used for frequency conversion of an image and converts image data in the spatial domain into image data in the frequency domain using a cosine basis. When the DCT conversion is performed, the resulting DC and AC components, i.e., the DC coefficient and the AC coefficient are obtained.
양자화기 (230)는 DCT(220)에 의해 주파수 도메인으로 변경된 변환 계수를 입 력 값으로 수신하여 이산적인 (di screte) 값으로 매핑하는 역할을 수행한다. 양자화 과정에서 데이터 손실이 발생하게 되며 연속 또는 대량의 입력 데이터는 양자화 이 후 소수의 이산적인 심볼로 매핑된다. 또한, 엔트로피 인코더 (240)는 양자화 기 (230)의 출력을 수신하여 엔트로피 부호화를 수행한다. 여기서, 엔트로피 부호화 대체용지 (규칙 저 126조) 는 무손실 압축이며, 심볼의 발생 확률에 따라 심볼의 길이를 가변적으로 할당하여 표현에 필요한 데이터양을 최소화하는 과정이다. The quantizer 230 receives the transform coefficient changed in the frequency domain by the DCT 220 as an input value and maps it to a discrete value. Data loss occurs during the quantization process, and continuous or large amounts of input data are mapped to a few discrete symbols after quantization. In addition, entropy encoder 240 receives the output of quantizer 230 and performs entropy encoding. Here, entropy encoding alternative paper (Article 126) Is lossless compression, and is a process of minimizing the amount of data necessary for representation by variably allocating the length of a symbol according to the occurrence probability of the symbol.
한편, 도 2에 도시된 본 발명의 일 실시예에 따른 잔차 계충 (res idual l ayer ) 부호화는 도 1에 도시된 잔차 계층 부호화와는 확연히 구분된다.  Meanwhile, the residual idling coding according to the exemplary embodiment of the present invention illustrated in FIG. 2 is clearly distinguished from the residual layer coding illustrated in FIG. 1.
우선, 입력 HDR 이미지는 스케일러 (301)로 입력된다. 스케일러 (301)는 입력 HDR 이미지의 픽셀값의 범위를 LDR 이미지 범위로 스케일한다, 여기서, 스케일링 은 균일하고 가역적인 부동-소수점 ( f loat ing-point ) 스케일링 작업이다. 스케일링 작업이 완료되면 , 컬러 변환기 (310)에 의해 LDR 이미지의 컬러 표현이 YCbCr 표현 으로 변환되고 DCT 변환기 (320)에 의해 8x8 불록 -기반 DCT가 수행된다.  First, the input HDR image is input to the scaler 301. Scaler 301 scales the range of pixel values of the input HDR image to the LDR image range, where scaling is a uniform and reversible f loat ing-point scaling operation. When the scaling operation is complete, the color representation of the LDR image is converted into a YCbCr representation by the color converter 310 and an 8x8 block-based DCT is performed by the DCT converter 320.
본 발명에서 제안하는 HDR 이미지 부호화의 주요 특징 중 하나는, 기본 계층 에서 인코딩된 톤-매핑된 LDR 이미지의 DCT 계수, 그리고 입력 HDR 이미지의 각 DCT 계수에 기반하여 HDR 예측을 수행하고 예측 계수 및 잔차 계층 코드스트림을 생성하는 구성이다. 관련하여, 도 2에 도시된 HDR 예측기 (350)가: 이러한 역할을 수 행한다.  One of the main features of HDR image coding proposed by the present invention is to perform HDR prediction based on the DCT coefficients of the tone-mapped LDR image encoded in the base layer, and each DCT coefficient of the input HDR image, and to estimate prediction coefficients and residuals. It is a configuration to generate a hierarchical code stream. In this regard, the HDR predictor 350 shown in FIG. 2 plays this role.
HDR 예측기 (350)는 인코더 (200) 내 양자화기 (230)가 출력하는 데이터를 역- 양자화하는 역-양자화기 (331)의 출력, 즉, 톤-매핑된 ( ton-mapped) LDR 이미지의 DCT 계수를 입력으로 수신한다. HDR 예측기 (350)는 또한, 입력 HDR 이미지의 DCT 계수를 또 다른 입력으로 수신하여 , 예측 HDR DCT 계수와 예측 계수를 도출한다. 입력 HDR 이미지의 DCT 계수와 예측 HDR DCT 계수 사이의 차분은 잔 차 (res idual ) DCT 계수를 형성한다. 잔차 DCT 계수는 양자화기 (330)에 의해 양자화 되고, 엔트로피 인코더 (340)에 의해 엔트로피 부호화된다. 여기서, 양자화기 (330) 대체용지 (규칙 저 126조) 는 인코더 내 양자화기 (230)와 동일한 역할을 수행하며, 엔트로피 인코더 (340) 또 한 인코더 내 엔트로피 인코더 (240)와 동일한 역할을 수행한다. The HDR predictor 350 outputs the output of the inverse quantizer 331, which inversely quantizes the data output by the quantizer 230 in the encoder 200, that is, the DCT of the ton-mapped LDR image. Receive a coefficient as input. HDR predictor 350 also receives the DCT coefficients of the input HDR image as another input to derive the predictive HDR DCT coefficients and the prediction coefficients. The difference between the DCT coefficients of the input HDR image and the predictive HDR DCT coefficients forms a residual DCT coefficient. The residual DCT coefficients are quantized by quantizer 330 and entropy coded by entropy encoder 340. Here, quantizer 330 replacement paper (rule 126) Is the same as the quantizer 230 in the encoder, entropy encoder 340 and also performs the same role as the entropy encoder 240 in the encoder.
여기서, 또 한가지 주목해야 할 점은 도 1을 통해 살펴본 기존의 프로파일에 서는 기본 계층 부호화 및 잔차 계층 부호화에 각각 2개의 화질 계수가 사용된 반 면, 도 2에 도시된 본 발명의 일 실시예에 따른 HDR 이미지 부호화 시스템에서는 기본 계층에 사용된 화질 계수 q가 잔차 계층에 대해서도 동일하게 사용될 수 있다 는 점이다.  Here, another point to note is that in the existing profile described with reference to FIG. 1, two image quality coefficients are used for base layer coding and residual layer coding, respectively, in the embodiment of the present invention shown in FIG. According to the HDR image coding system, the image quality coefficient q used in the base layer may be used in the same way for the residual layer.
최종적으로 생성되는 잔차 계층 코드스트림은 HDR 예측기 (350)를 통해 추산 된 예측 계수들과 엔트로피 부호화된 잔차 DCT 계수로 구성되어 있다.  The finally generated residual layer codestream is composed of prediction coefficients estimated by the HDR predictor 350 and entropy coded residual DCT coefficients.
한편, 기본 계층 부호화 과정의 DCT 변환기 (220) 및 잔차 계층 부호화 과정 의 DCT 변환기 (320)는 입력되는 이미지의 각 Y, Cb 및 Cr 컬러 요소를 블록 기반으 로 DCT 변환하며, 그 결과 얻어진 DCT 계수는 지그재그 순서로 1—차원 백터로 재배 열된다.  Meanwhile, the DCT converter 220 of the base layer encoding process and the DCT converter 320 of the residual layer encoding process perform DCT conversion on the basis of blocks on the Y, Cb, and Cr color elements of the input image, and the resulting DCT coefficients. Are rearranged into one-dimensional vectors in zigzag order.
도 2에서 DCT 변환기 (320)에 의해 출력되는 입력 HDR 이미지의 1번째 블록 내 k번째 DCT 계수는 d 로 표기하며, 역―양자화기 (331)에 의해 출력되는 톤  In FIG. 2, the k-th DCT coefficient in the first block of the input HDR image output by the DCT converter 320 is denoted by d, and the tone output by the de-quantizer 331.
-매핑된 LDR 이미지의 역-양자화된 DCT 계수는 O)로 표기되어 있다. 또한, The de-quantized DCT coefficients of the mapped LDR image are indicated by O). Also,
C ^0)와 (0)는 DC 계수로 정의하고' k가 0이 아닌 c'^^ 와 '醒 (Jc) 를 AC 계수라고 정의한다. C ^ 0) and (0) is defined as defined and 'k is not 0, c' and ^ ^ '醒(Jc), the AC coefficients by the DC coefficient.
HDR 예측기 (350)는 각 Y, Cb 및 Cr 컬러 요소에 대하여 C ^ O) 에 기반하  HDR predictor 350 is based on C ^ O) for each Y, Cb and Cr color element.
대체용지 (규칙저 126조) 여 C^DR C 를 예측한다. 본 발명에 따른 예측을 위해, DC와 AC 두 가지 형태의 계 수에 대하여 e'i lc 및 C' ( 의 상관성을 활용한다. HDR 예측기 (350)에 의해 수행되는 예측 계수의 추산과 관련해서는 아래 도 5 내지 7을 통해 상세히 설명한 다. 도 3은 본 발명의 일 실시예에 따른 HDR 이미지 복호화기의 블록 구성도이 다. Alternative Paper (Article 126 of the Rules) Predict C ^ DR C. For the prediction according to the present invention, DC and AC utilizes the correlation between e 'i lc and C' (with respect to both types of system can Below regard to the estimate of the prediction coefficients performed by the HDR predictor 350 It will be described in detail with reference to Figures 5 to 7. Figure 3 is a block diagram of an HDR image decoder according to an embodiment of the present invention.
도 3을 통해 본 발명에 따른 HDR 이미지 부호화의 역동작인 HDR 이미지 복호 화를 설명할 수 있다.  3, HDR image decoding, which is a reverse operation of HDR image encoding, according to the present invention, can be described.
도 3에 도시된 바와 같이 본 발명의 HDR 이미지 복호화기는 레거시 -JPEG 호 환 가능 기본계층 코드스트림을 처리하는 기본계층 디코더 (400) 및 향상계층 디코 더 (500)를 포함할 수 있다.  As shown in FIG. 3, the HDR image decoder of the present invention may include a base layer decoder 400 and an enhancement layer decoder 500 that process legacy-JPEG compatible base layer codestreams.
기본계층 디코더 (400)는 기본 계층 코드스트림을 수신하여, 상기 기본 계층 코드스트림을 디코딩하고 제 2 동적범위 이미지에 대한 DCT 도메인 데이터를 도출하 며 제 2 동적범위 이미지를 생성한다. 향상계층 디코더 (500)는 제 1 동적범위 이미지 관련 예측 계수를 포함하는 잔차 계층 코드스트림을 수신하여 , 상기 제 1 동적범위 이미지 관련 예측 계수 및 잔차 DCT 도메인 데이터를 도출하고, 상기 제 1 동적범위 이미지 관련 예측 계수 및 상기 게 2동적범위 이미지에 대한 DCT 도메인 데이터로부 터 상기 제 1 동적범위 이미지에 대한 예측 DCT 도메인 데이터를 산출하며 , 상기 제 1 동적범위 이미'지에 대한 예측 DCT 도메인 데이터와 잔차 DCT 도메인 데이터를 합 The base layer decoder 400 receives the base layer codestream, decodes the base layer codestream, derives DCT domain data for the second dynamic range image, and generates a second dynamic range image. The enhancement layer decoder 500 receives the residual layer codestream including the first dynamic range image related prediction coefficients, derives the first dynamic range image related prediction coefficients and the residual DCT domain data, and the first dynamic range image. in DCT-domain data for the relevant prediction coefficients and the shop second dynamic range image portion emitter said first calculates the predicted DCT domain data for the dynamic range image, the first dynamic range already and the predicted DCT domain data as to whether "residual DCT Sum domain data
대체용지 (규칙 저 126조) 하여 제 1 동적범위 이미지에 대한 DCT도메인 데이터를 재구성한다. Alternative Paper (Article 126 of the Rules) To reconstruct the DCT domain data for the first dynamic range image.
향상계층 디코더 (500)는, 잔차 계층 코드스트림을 처리하는 HDR 예측 기 (550) , 엔트로피 디코더 (540) , 역-양자화기 (530) , 역컬러변환기 (510) 및 역 -스케 일러 (501)를 포함할 수 있다.  Enhancement layer decoder 500 includes an HDR predictor 550, an entropy decoder 540, an inverse-quantizer 530, an inverse color transformer 510, and an inverse-scaler 501 that process a residual layer codestream. It may include.
도 3에서 기본계층 복호화는 기존의 레거시 -JPEG 디코더 (400)에 의해 수행되 며, 레거시—JPEG 디코더 (400)는 엔트로피 디코더 (410), 역-양자화기 (420) , 역 DCT 변환기 (430) , 및 역—컬러 변환기 (440)를 포함하여 구성될 수 있다.  In FIG. 3, base layer decoding is performed by a legacy legacy-JPEG decoder 400, and a legacy-JPEG decoder 400 includes an entropy decoder 410, an inverse-quantizer 420, and an inverse DCT converter 430. , And inverse-color converter 440.
도 3의 이미지 복호화기로 입력되는 기본 계충 코드스트림은 엔트로피 디코 더 (410)를 거쳐 양자화된 형태의 스트림으로 변환되며 , 역-양자화기 (420)를 거쳐 DCT 도메인으로 표현되는 c DR j ^ 변환된다. DCT 도메인의 데이터는 역 DCT 변환 기 (430) 및 역 -컬러 변환기 (440)를 거쳐 최종적으로 RGB로 표현되는 LDR 이미지로 변환된다. The basic trade-off codestream input to the image decoder of FIG. 3 is converted into a quantized stream through an entropy decoder 410 and c DR j ^ transformed into a DCT domain via an inverse quantizer 420. . Data in the DCT domain is converted into an LDR image, which is finally expressed in RGB, via an inverse DCT converter 430 and an inverse-color converter 440.
한편, 잔차 계층 코드스트림에 포함된 예측 계수들은 HDR 예측기 (550)로 입 력되며, 잔차 계충 코드스트림은 엔트로피 디코더 (540) 및 역-양자화기 (530)를 거 쳐 잔차 신호의 DCT 계수인 ^ )로 변환된다. 또한, HDR 예측기 (550)는 ο ^) (Α-) 및 잔차 계층 코드스트림에 포함된 예측 계수들을 입력으로 수신하고, HDR 예측을 통해 예측 HDR DCT 계수 를 도 출한다. On the other hand, the prediction coefficients included in the residual layer codestream are input to the HDR predictor 550, and the residual tradeoff codestream passes through an entropy decoder 540 and an inverse-quantizer 530, which is a DCT coefficient of the residual signal ^. Is converted to). In addition, the HDR predictor 550 receives as input input prediction coefficients included in ο ^ ) (Α−) and the residual layer codestream, and derives the predictive HDR DCT coefficients through HDR prediction.
복호화기 내에 위치하는 본 발명의 일 실시예에 따른 HDR 예측기 (550)는 잔 차 계층 코드스트림에 포함된 예측 계수들을 이용하여, 도 2에 도시된 인코더 단의 대체용지 (규칙저 126조) HDR 예측기 (350)가 도출하는 예측 HDR DCT 계수와 동일한 HDR DCT 계수를 도출한 다. The HDR predictor 550 according to an embodiment of the present invention located in the decoder uses a prediction coefficient included in the residual layer codestream to replace the encoder stage shown in FIG. 2 (rule 126). The HDR predictor 350 derives the same HDR DCT coefficients as the predicted HDR DCT coefficients.
잔차 신호의 DCT 계수 및 예측 HDR DCT 계수 c ^M (A-) 는 합산되어 복원된 HDR DCT 계수 형태인 f ^가 되고, 복원된 HDR DCT 계수는 역二0 " 변환 기 (520) , 역 -컬러 변환기 (510), 및 역―스케일러 (501)를 거쳐 최종적으로 HDR 이미 지로 복원된다. 도 2 및 도 3의 실시예를 통해 살펴본 바와 같이 본 발명에 따른 HDR 이미지 부호화 방법 및 복호화 방법은 아래 두 가지 관점에서 도 1에서 설명한 기존의 프 로파일과 차이가 있다. The DCT coefficients of the residual signal and the predicted HDR DCT coefficients c ^ M (A-) are summed to form f ^ in the form of a reconstructed HDR DCT coefficients, and the reconstructed HDR DCT coefficients are inverse2 "transformers (520), inverse- Finally, the image is finally restored to the HDR image through the color converter 510 and the inverse scaler 501. As described with reference to the embodiment of FIGS. From the point of view, there is a difference from the existing profile described in FIG.
첫번째로, 기존의 프로파일은 공간 도메인에 그들의 잔차 이미지를 생성한 다. 그리하여, 종래에는 도 1에 도시된 바과 같이 JPEG XT 부호화에 있어서 완전 한 ( ful l ) L-JPEG 복호화 과정이 요구되었다.  First, existing profiles create their residual images in the spatial domain. Thus, conventionally, as shown in FIG. 1, a full L-JPEG decoding process is required in JPEG XT encoding.
또한, 종래의 프로파일 A 및 B는 각 픽셀 별로 톤-매핑된 LDR 이미지로 각 픽셀에서 HDR 원본 이미지를 나눈 이미지 형태로 그들의 잔차 이미지를 생성하고, 프로파일 C는 HDR 원본 이미지와 톤-매핑된 LDR 이미지간의 차이가 나는 이미지를 잔차 이미지로 취한다. 하지만, 본 발명은 DCT 도메인에서 잔차 데이터를 생성한 다. 또한, L-JPEG 복호화 과정은 본 발명에 따른 JPEG XT 부호화에서 요구되지 않 으며, 이는 곧 부호화 시간의 감축이라는 효과를 의미한다.  In addition, conventional profiles A and B generate their residual images in the form of an image divided by an HDR original image at each pixel in tone-mapped LDR images, and profile C generates an HDR original image and a tone-mapped LDR image. Take the difference image as the residual image. However, the present invention generates residual data in the DCT domain. In addition, the L-JPEG decoding process is not required in the JPEG XT encoding according to the present invention, which means an effect of reducing the encoding time.
두번째로, 기존의 프로파 ^은 2개의 화질계수 (Qual i ty Factor )를 사용한다.  Secondly, the existing prop ^ uses two quality factors.
대체용지 (규칙 저 126조) 하나는 기본 계층을 위해, 또 다른 하나는 잔차 계층을 위해 사용되며, 도 1에 도 시된 같이 각각 q 및 Q로 나타낸다. 전문 사용자는 효율적인 이미지 부호화를 위하 여 이 두 화질계수의 가장 최적의 조합을 찾을 수 있을 것이지만, 이러한 접근은 일반 사용자들에게는 까다로울 것이다. 본 발명은 기본 및 잔차 계층를 함께 부호 화하기 위하여 부호율 대비 왜곡 (rate-distort ion)을 최적화하는 단 하나의 화질계 수를 사용할 수 있도록 함으로써, 사용자 편의성을 증대시킨다. 도 4는 본 발명의 실시예에 따른 HDR 이미지 부호화 방법 및 복호화 방법의 실험 결과를 설명하기 위한 복수의 이미지들을 나타낸다. Alternative Paper (Article 126 of the Rules) One is used for the base layer and the other for the residual layer, denoted q and Q, respectively, as shown in FIG. Professional users will find the best combination of these two quality factors for efficient image coding, but this approach will be tricky for the average user. The present invention enhances user convenience by enabling the use of only one image quality coefficient that optimizes rate-distort ions to code the base and residual layers together. 4 illustrates a plurality of images for explaining an experimental result of the HDR image encoding method and the decoding method according to an embodiment of the present invention.
본 발명에 따른 DC 계수 및 AC 계수에 있어서 c M 0t) 및 d腿 엑 상관 성을 확인하기 위해 도 4의 상단 (a)에 도시된 바와 같은 3 개의 서로 다른 HDR 샘 플 이미지를 이용하였다. Three different HDR sample images as shown in (a) of FIG. 4 were used to confirm c M 0t) and d 腿 ex correlations in the DC and AC coefficients according to the present invention.
도 4의 (a)는 디스플레이할 목적으로 HDR 샘플 이미지를 균일하게 양자화한 결과 이미지를 나타낸 것이고ᅳ 도 5의 (b)는 Reinhard 등에 의해 제안된 TM0 기법 을 사용하여 톤-매핑된 LDR 이미지를 나타낸다.  Fig. 4 (a) shows the resultant image of uniformly quantizing the HDR sample image for display purposes and Fig. 5 (b) shows the tone-mapped LDR image using the TM0 technique proposed by Reinhard et al. .
도 4의 각 HDR 샘플 이미지에 대한 실험을 통해 대상 이미지가 달라지는 경 우에도 본 발명에 따른 HDR 예측기 설계에 있어 동일한 결론에 도달함을 확인할 수 있었다.  Experiments on the HDR sample images of FIG. 4 show that the same conclusions are reached in the design of the HDR predictor according to the present invention even when the target image is changed.
추가적으로, 본 발명에서는 선택 가능한 여러 TM0 기법 중 5개의 TM0를 선별 하여, DC 계수 및 AC 계수에 있어서 飄 및 C^^Ar)의 상관도를 실험하였다.  In addition, in the present invention, five TM0s were selected from among several selectable TM0 techniques, and the correlation between 飄 and C ^^ Ar) in the DC coefficient and AC coefficient was examined.
대체용지 (규칙 저 126조) 도 5은 본 발명의 실시예에 따른 다양한 TM0에 대한 AC 계수의 분포를 나타 내는 예시도이다. Alternative Paper (Article 126 of the Rules) 5 is an exemplary diagram illustrating a distribution of AC coefficients for various TM0s according to an embodiment of the present invention.
도 5에서 사용되는 5개의 TM0 기법은 "Reinhard02" , "Drago03" , " iCAM06" , "Mant iuk08" 및 "Mai ll"으로 표현하였다. 또한, 화질계수 q는 70으로 미리 설정하 였다. 다른 화질계수를 가진 실험들에서도 동일한 분포가 관찰되는 것을 확인할 수 있었다. 따라서, HDR 예측기를 설계하는 데 있어서 다른 화질계수에 의한 효과는 무시할 만한 수준이었음을 밝혀 둔다.  The five TM0 techniques used in FIG. 5 are expressed as "Reinhard02", "Drago03", "iCAM06", "Mant iuk08" and "Mai ll". Also, the image quality factor q was preset to 70. In experiments with different image quality factors, the same distribution was observed. Therefore, the effects of other image quality factors in designing the HDR predictor were negligible.
보다 구체적으로, 도 5는 다양한 TM0 기법에 대한 c ^ O) 의 C 'IDR (k) 에 대한 AC 계수 분포를 보여준다. 도 5에 도시된 각 그래프에서 수평축은 ^^ O)을 의미하고 수직축은 Γ' ( 를 의미하며 , Υ 요소는 검은색, Cb 요소는 푸른색 , Ci- 요소는 붉은색으로 표현되었다. More specifically, FIG. 5 shows the AC coefficient distribution for C ′ IDR (k) of c ^ O) for various TM0 techniques. In each graph illustrated in FIG. 5, the horizontal axis means ^^ O), the vertical axis means Γ '(), the Υ element is black, the Cb element is blue, and the Ci- element is represented by red.
도 5를 통해 Y, Cb 및 Cr 컬러 요소 모두에 대해 c^^(A-)의 AC 계수는 iZDK (A-) 의 AC 계수와 매우 밀접한 상관관계가 있음을 확인할 수 있다. 좀더 구체 적으로, e! w JO 으로 표현되는 수평축을 X라 하고 ) 로 표현되는 수직축 을 y라고 할 때, 예를 들어, "01" 이미지에 대해 "Reinhard02" TM0 기법이 사용된 경우 각 컬러 요소에 대해 y=0.55x, y=0.28x , y=0.42x 등으로 표현 가능한 관계식 이 도출되었다. It can be seen from FIG. 5 that the AC coefficient of c ^^ (A-) is closely correlated with the AC coefficient of i ZDK (A-) for all Y, Cb and Cr color elements. More specifically, e ! If the horizontal axis represented by w is X and the vertical axis represented by y is y , for example, if the "Reinhard02" TM0 technique is used for the "01" image, then y = 0.55x, for each color element, A relation that can be expressed as y = 0.28x and y = 0.42x is derived.
또한, 이미지가 변경되거나 적용되는 TM0 기법이 변경되면 c^^O)의 AC 계수 및 ei 의 AC 계수 간의 상관관계' 즉' d麗 및 의 AC 계 Also, if the image is changed or the TM0 technique applied is changed, the correlation between the AC coefficient of c ^^ O) and the AC coefficient of e i ', ie, the AC system of d 麗 and
대체용지 (규칙저 126조) 수 분포 또한 변화함을 확인할 수 있다. 예를 들어, "03" 이미지는 모든 TM0 기법 에 대하여 다른 샘플 이미지보다 더 넓게 퍼진 분포를 나타내며, iCAM06 TM0 기법 의 경우는 다른 모든 샘플 이미지의 다른 TM0 기법보다 더 넓게 퍼진 분포를 나타 냄을 알 수 있다. Alternative Paper (Article 126 of the Rules) The number distribution also changes. For example, it can be seen that the "03" image shows a wider distribution than all other sample images for all TM0 techniques, and the iCAM06 TM0 technique shows a wider distribution than all other TM0 techniques for all other sample images. have.
하지만, Y, Cb 및 Cr 컬러 요소 모두에 대해 C^ A:)의 AC 계수와 Cl l R(k-) 의 AC 계수 간에는 매우 밀접한 상관관계가 있음은 명확하며, 본 발명의 일 실시예에서는 샘플 이미지와 TM0 케이스에 대하여 c DR c ^ 1차 다항식 함수 로 C ^ 근사치를 정의할 수 있다. 하지만, 본 발명에 따른 제 1 동적범위 이 미지에 대한 DCT 도메인 데이터의 AC 계수 및 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터의 AC 계수 간의 상관성이 1차 다항식 함수로만 제한되는 것은 아니며, 예를 들면, 다항식, 지수 함수, 로그 함수, 삼각 함수 등으로도 표현될 수 있다. However, Y, there is a close correlation between the AC coefficients of the AC coefficient C ^ A :) and C l l R (k-) for both Cb and Cr color component relationships and is clear, in one embodiment of the present invention The C ^ approximation can be defined with the c DR c ^ linear polynomial function for the sample image and TM0 case. However, the correlation between the AC coefficients of the DCT domain data for the first dynamic range image and the AC coefficients of the DCT domain data for the second dynamic range image according to the present invention is not limited to the first-order polynomial function. For example, it may be expressed as a polynomial, an exponential function, a logarithmic function, a trigonometric function, and the like.
따라서, 본 실시예에서는 아래 수학식 1에 의해 정의될 수 있는, 각 Y, Cb 및 Cr 컬러 요소에 대한 AC 계수 관련 예측을 수행할 수 있다.  Therefore, in the present embodiment, the AC coefficient related prediction may be performed for each of the Y, Cb, and Cr color elements, which may be defined by Equation 1 below.
【수학식 1】  [Equation 1]
.,: Λ; „.1.,: Λ; „. 1
ΰ纏 - ^G' gyC^ 수학식 1에서, aAC 는 C^^O)와 C^ A 사이의 평균제곱오차 (MSE, mean square error)를 최소화하는 계수를 의미할 수 있다. AC-^ G 'gyC ^ In Equation 1, aAC may mean a coefficient that minimizes a mean square error (MSE) between C ^^ O) and C ^ A.
대체용지 (규칙 저 126조) 도 6은 본 발명의 일 실시예에 따른 다양한 TM0에 대한 DC 계수의 분포를 나 타내는 예시도이다. Alternative Paper (Article 126 of the Rules) 6 is an exemplary diagram illustrating a distribution of DC coefficients for various TM0s according to an embodiment of the present invention.
도 5과 마찬가지로, 도 6에서 사용되는 5개의 TM0 기법은 "Reinhard02", As in FIG. 5, the five TM0 techniques used in FIG. 6 are “Reinhard02”,
"Drago03", "iCAM06", "Mantiuk08" 및 "Mai 11" 이다. 또한, 화질계수 q 또한 70으 로 미리 설정하였다. "Drago03", "iCAM06", "Mantiuk08" and "Mai 11". Also, the image quality factor q was also set to 70 in advance.
도 6은 다양한 TM0에 대한 e 및 ( ^(0)의 DC 분포를 나타내며,
Figure imgf000026_0001
및 C^^O)의 DC 분포는 도 5를 통해 살펴본 ᅳ) 및 C^e 의
6 shows the DC distribution of e and (^ (0) for various TM0;
Figure imgf000026_0001
And C ^^ O), the DC distribution of the examined eu) and C ^ e through 5
AC 계수 분포와는 상당히 다름을 확인할 수 있다. It can be seen that it is quite different from the AC coefficient distribution.
도 6에서 이미지의 DC 계수가 블록 단위의 평균화된 픽셀 값을 반영하고 TM0 가 휘도의 동적 범위를 향상시키는 역할을 수행하는 것에 기반하여, Y 요소의
Figure imgf000026_0002
분포는 각 이미지에 대하여 채택된 TM0의 역동작의 글로벌한 양상으로 해석할 수 있다. 비록 C^M(0) 대 C^ O) 에 대한 Y, Cb 및 Cr의 분포 형상이 서로 다르기는 하나, c^A(0)에 대한 C^^O) 의 매우 높은 상관성을 보 여준다.
In FIG. 6, the DC coefficient of the image reflects the averaged pixel value in units of blocks and TM0 serves to improve the dynamic range of luminance.
Figure imgf000026_0002
The distribution can be interpreted as a global aspect of the reverse behavior of TM0 adopted for each image. Although the distributions of Y, Cb and Cr for C ^ M (0) vs C ^ O) are different, they show a very high correlation of C ^ O) for c ^ A (0 ).
따라서, 본 발명의 일 실시예에 따르면, 아래 수학식 2에 의해 정의되는 C'IDR (0) 의 3차 방정식 함수로 각 Y, Cb 및 Cr의 컬러 요소에 대한 c e(O) 을 예측한다. Therefore, according to an embodiment of the present invention, ce (O) for each color element of Y, Cb, and Cr is predicted by a cubic equation function of C ′ IDR (0) defined by Equation 2 below.
【수학식 2]
Figure imgf000026_0003
대체용지 (규칙 저 126조) 수학식 2에서, a )C , b, c 및 d는 c'lmA 와 e^ ) 사이의 평균 제곱 오차 (MSE , mean square error )를 최소화하는 계수를 의미할 수 있다. 즉, 본 발명 의 일 실시예에 따른 HDR 예측은 최소자승법을 활용해 이루어질 수 있다.
[Equation 2]
Figure imgf000026_0003
Alternative Paper (Article 126 of the Rules) In Equation 2, a) C, b, c and d may refer to coefficients that minimize the mean square error (MSE, mean square error) between c 'lmA and e ^). That is, HDR prediction according to an embodiment of the present invention may be performed by using a least square method.
Y , Cb 및 Cr 3개의 요소 각각에 대한 ^조 a j3C , ό, c 및 ^의 5개의 상수 로 정의될 수 있는 총 15개의 실제 값으로 구성되는 예측 계수는, 잔차 계층 코드 스트림에 추가적으로 포함될 수 있다. 도 7은 본 발명의 다른 실시예에 따라 예측 HDR DC 값을 구간으로 나누어 도 출하는 개념을 설명하기 위한 그래프이다. The prediction coefficients, which consist of a total of 15 real values that can be defined as five constants of the symbols a j3C , ό, c, and ^ for each of the three elements Y, Cb, and Cr, can be additionally included in the residual layer code stream. have. FIG. 7 is a graph illustrating a concept of dividing a predicted HDR DC value into intervals according to another embodiment of the present invention.
도 7의 실시예에서 X축은 LDR DC 계수 값이고, y 축은 예측 HDR DC 계수 값 이며, LDR DC 계수가 가질 수 있는 값의 범위는 —1024 ~ 1023 이다.  In the embodiment of FIG. 7, the X axis is an LDR DC coefficient value, the y axis is a predictive HDR DC coefficient value, and a range of values of the LDR DC coefficient is —1024 to 1023.
앞서 도 6을 통해 수학식 2의 계수 ^ , b, c 및 d는 최소 자승법 (Least- Squares Method)을 이용하여 구해질 수 있음을 살펴보았다. 이들 계수에 의해 정의 되는 예측 곡선 상의 점으로부터, 예측 곡선의 시작과 끝점을 잇는 직선까지의 수 직 거리가 양 (+)과 음 (-)의 방향으로 최대인 점 (pl , p2)를 찾아, 구간을 나누는 기준점으로 설정할 수 있다. 만약, 3차 방정식과 직선이 만나지 않는 경우 pl , p2 를 -200, 200으로 임의 지정할 수 있다. 하지만, pl , p2를 -200 및 200으로 제한하 는 것은 아니다.  6, the coefficients ^, b, c, and d of Equation 2 can be obtained using the least square method. From the point on the prediction curve defined by these coefficients, find the point (pl, p2) whose vertical distance from the point on the starting line and the end point of the prediction curve is the maximum in the positive and negative directions. Can be set as the reference point for dividing the section. If the cubic equation and the straight line do not meet, pl and p2 can be arbitrarily designated as -200, 200. However, it does not limit pl, p2 to -200 and 200.
도 7의 그래프를 보면, 3차 방정식으로 정의되는 곡선이 pl , p2를 기준으로 3개의 구간으로 구분되며, 각 구간 별로 개별적으로 최적의 예측 곡선 계수를 추출  Referring to the graph of FIG. 7, the curve defined by the cubic equation is divided into three sections based on pl and p2, and the optimum prediction curve coefficients are extracted for each section.
대체용지 (규칙저 126조) 할 수 있다. 도 7에 도시된 일 실시예에 따라 정의되 Alternative Paper (Article 126 of the Rules) can do. Defined according to one embodiment shown in FIG.
한 방정식은 아래 수학식 3과 같이 정의될 수 있다. One equation may be defined as Equation 3 below.
【수학식 3】  [Equation 3]
Figure imgf000028_0001
Figure imgf000028_0001
수학식 3에서, α , , bi ( C l , ^은 구간 1 (-1024 ~ pi )에 대한 계수들이고 aDCl 는 구간 2 (pi ~ p2)에 대한 계수들이고. 간 3 (p2 ~ 1024)에 대한 계수들이다. In Equation 3, α ,, bi (C l , ^ are the coefficients for interval 1 (-1024 to pi) and a DCl are the coefficients for interval 2 (pi to p2), and in interval 3 (p2 to 1024) Coefficients.
다만, 수학식 3에서 정의한 3개의 구간은 예시적인 것에 불과할 뿐이며ᅳ 본 발명에 따른 예측 함수는 임의의 N 개 구간으로 구분될 수 있으며, 각 구간은 다양 한 형태, 예를 들면, 다항식, 지수 함수. 로그 함수, 삼각 함수 둥에 의해 정의되 는 형태를 갖는 예측 함수로서 정의될 수 도 8은 본 발명의 다른 실시예에 따른 HDR 이미지 복호화기의 블록 구성도이 다.  However, the three intervals defined in Equation 3 are merely exemplary, and the prediction function according to the present invention may be divided into any N intervals, and each interval may have various forms, for example, a polynomial or an exponential function. . Can be defined as a logarithmic function, a prediction function having a form defined by a trigonometric function round FIG. 8 is a block diagram of an HDR image decoder according to another embodiment of the present invention.
도 8은 도 3에 도시된 실시예에 따른 HDR 이미지 복호화기와는 다른 실시예 에 따른 복호화기를 도시하며, 도 8에 도시된 복호화기는 DCT 도메인에서 HDR 예측 기를 이용하여 부호화된 잔차 계층 코드스트림을 공간 도메인에서 처리한다. 따라 서, 본 실시예에 따른 복호화기는 DCT 도메인으로 표현되는 잔차 데이터를 공간 도 대체용지 (규칙 제 26조) 메인으로 전환하며, 공간 도메인에서 HDR 예측을 수행한다. FIG. 8 illustrates a decoder according to another embodiment different from the HDR image decoder according to the embodiment shown in FIG. 3, wherein the decoder shown in FIG. 8 spatially stores a residual layer codestream encoded using the HDR predictor in the DCT domain. Process on the domain. Therefore, the decoder according to the present embodiment replaces the residual data represented by the DCT domain with the spatial map (Article 26). Switch to main and perform HDR prediction in the spatial domain.
도 8에 도시된 본 발명의 다른 실시예에 따른 HDR 이미지 복호화기는, 레거 시 -JPEG 호환 가능 기본 계층 코드스트림을 처리하는 디코더 (400) 및 잔차 계층 코 드스트림의 처리를 위해, 공간 도메인 예측기 (551) , 엔트로피 디코더 (540), 역-양 자화기 (530) , 역 -컬러 변환기 (510) 및 역-스케일러 (501)를 포함하는 향상계층 디코 더 (500)를 포함할 수 있다.  The HDR image decoder according to another embodiment of the present invention illustrated in FIG. 8 includes a decoder 400 for processing a legacy -JPEG compatible base layer codestream and a spatial domain predictor (for processing a residual layer codestream). 551, an enhancement layer decoder 500 including an entropy decoder 540, an inverse-quantizer 530, an inverse-color converter 510, and an inverse-scaler 501.
도 8의 실시예에서도 기본 계층 복호화는 기존의 레거시 -JPEG 디코더 (400)에 의해 수행되며 , 레거시 -JPEG 디코더 (400)는 엔트로피 디코더 (410), 역-양자화 기 (420) , 역 DCT 변환기 (430), 및 역—컬러 변환기 (440)를 포함하여 구성될 수 있다. 도 8의 이미지 복호화기로 입력되는 기본 계층 코드스트림은 엔트로피 디코 더 (410)를 거쳐 양자화된 형태의 스트림으로 변환되며, 역-양자화기 (420)를 거쳐 DCT 도메인으로 표현되는 IDR (J ) — 변환된다. c (A 는 역— DCT 변환기 (430)를 거쳐 ' lDR (ikᅳ 로 변환되며, 역 -컬러 변환기 (440)를 거쳐 최종적으로 RGB로 표현되 는 LDR 이미지로 변환된다. In the embodiment of FIG. 8, the base layer decoding is performed by the legacy legacy-JPEG decoder 400, and the legacy-JPEG decoder 400 includes an entropy decoder 410, an inverse-quantizer 420, and an inverse DCT converter ( 430, and an inverted-color converter 440. The base layer codestream input to the image decoder of FIG. 8 is converted into a quantized stream through an entropy decoder 410 and an IDR (J) — transform represented by the DCT domain via an inverse quantizer 420. do. c (A is converted to lDR (ik ᅳ) via an inverse DCT converter 430 and converted to an LDR image that is finally expressed in RGB via an inverse-color converter 440.
한편, 잔차 계층 코드스트림에 포함된 예측 계수들은 공간 도메인 예측 기 (551)로 입력되며 , 잔차 계층 코드스트림은 엔트로피 디코더 (540) 및 역-양자화 기 (530)를 거쳐 잔차 신호의 DCT 계수인 로 변환되고, 잔차 신호의 DCT 계수 는 역 -DCT 변환기 (521)를 거쳐 로 변환된다. (w) 는 공간 도메인 예측 기 (551)의 출력과 더해져 역 -컬러 변환기 (510)로 입력되고 역-스케일러 (510)를 거 쳐 최종적으로 HDR 이미지로 복원된다. 대체용지 (규칙저 126조) 좀더 구체적으로, 공간 도메인 예측기 (551)는 부호화기로부터 수신한 잔차 계층 코드스트림에 포함된 예측 계수들 및 역 -DCT 변환된 기본 계층 데이터 'lDR 을 입력으로 수신하여 HDR 예측을 수행한다. On the other hand, the prediction coefficients included in the residual layer codestream are input to the spatial domain predictor 551, and the residual layer codestream is passed through an entropy decoder 540 and an inverse-quantizer 530, which is a low DCT coefficient of the residual signal. And the DCT coefficients of the residual signal are transformed to via an inverse-DCT converter 521. (w) is added to the output of the spatial domain predictor 551, input to the inverse-color converter 510, and finally reconstructed into an HDR image via the inverse-scaler 510. Alternative Paper (Article 126 of the Rules) More specifically, the spatial domain predictor 551 receives the prediction coefficients included in the residual layer codestream received from the encoder and the inverse-DCT transformed base layer data ' lDR as input and performs HDR prediction.
관련하여, 도 3에 도시된 DCT 도메인에서 복원된 HDR 이미지의 DCT 계수 C. 'HDR (k) 에 대하여 역 -DCT( IDCT) 변환을 수행한 결과는 도 8에 도시된 („ 와 동일하고, 공간 도메인의 을 DCT 도메인의 c ^ it)에 대한 연산으로 표현 하면 아래 수학식 4와 같이 표현할 수 있다. In relation to this, the result of performing inverse-DCT (IDCT) transformation on the DCT coefficient C. ' HDR (k) of the HDR image reconstructed in the DCT domain shown in FIG. 3 is the same as If the expression of the spatial domain of c ^ it) of the DCT domain can be expressed as Equation 4 below.
【수학식 4】  [Equation 4]
X1HDR OO = IDCT{C!HDR i )} X 1 HDR OO = IDCT {C ! H D R i)}
= IDCT{Er(k) + C1HOR (k)} = IDCT {E r (k) + C 1 HOR (k)}
= IDCT{E'(ik^} + IDCT{C!腿 ( )} 여기서, f Ot)는 잔차 계층 드스트림을 통해 전달되는 잔차 신호와 DCT 계 수이다. 수학식 4에서 ^^ ( )의 도출을 위해 ei HD 에 대해서 역 -DCT 동작을 수행하면 된다. = IDCT {E '(ik ^} + IDCT {C! 腿 ()} where f Ot) is the residual signal and the DCT coefficient carried over the residual layer stream. In order to derive ^^ () in Equation 4 , an inverse -DCT operation may be performed on e i HD .
한편, 수학식 4의 두번째 및 세번째 항에 대해서는 본 발명의 일 실시예에 따른 HDR 예측기를 통해 예측되는 신호인 HDR o v^ 에 대해 역 -DCT 변환을 수행하 고, 역 -DCT 변환이 수행된 잔차 이미지의 값으로 표현할 수 있도록 전개한다. 따라 서 , 공간 도메인에서 복원된 HDR 이미지 γ 는 복원된 잔차 이미지와 복원된 예측 HDR 이미지의 합으로 생성할 수 있다.  Meanwhile, the second and third terms of Equation 4 are performed by performing inverse -DCT transform on HDR ov ^, which is a signal predicted through the HDR predictor, and performing inverse -DCT transform. Expand to represent the value of the image. Therefore, the HDR image γ reconstructed in the spatial domain may be generated as the sum of the reconstructed residual image and the reconstructed predictive HDR image.
대체용지 (규칙 저 126조) DCT 도메인에서 HDR 예측기를 이용하여 부호화된 잔차 계층 코드스트림을 공간 도메인에서 HDR 이미지를 복원하기 위하여 수학식 4를 전개한다. Alternative Paper (Article 126 of the Rules) Equation 4 is developed to reconstruct an HDR image in a spatial domain of a residual layer codestream encoded using an HDR predictor in a DCT domain.
먼저 , _ .^^(0)—를 구.라 하면, 아래의 수학식 5와 같이 정리될 수 있 First, _. ^^ (0) — can be summarized as in Equation 5 below.
【수학식 5] [Equation 5]
/Of
a DC a DC
Figure imgf000031_0001
다시 수학식 4로 돌아가, fflc^^ )}를 산출하기 위해 아래 수학식 6과 같 o ^^ t)를 DC 성분 및 AC 성분으로 분해한다.
Figure imgf000031_0001
Returning to Equation 4, the equation o ^^ t) is decomposed into a DC component and an AC component as shown in Equation 6 below to calculate fflc ^^)}.
대체용지 (규칙 제 26조) 【수학식 6 ] Alternative Site (Article 26) [Equation 6]
수학식 6에서 nii 는 m이 포함된 8x8 블록의 i번째 요소를 의미한다. 전개된 수식을 통하여 기존 DCT 도메인에서의 복호화 과정이 역 -DCT 변환을 수행한 공간 도메인의 픽셀 값을 이용하여 복호화 할 수 있음을 확인하였다. 이를 통해 본 발명 의 일 실시예에 따른 공간 도메인에서의 복호화 과정은 도 8에 도시된 복호화기를 통해 수행될 수 있다.  In Equation 6 nii means the i-th element of the 8x8 block containing m. Through the developed equation, it was confirmed that the decoding process in the existing DCT domain can be decoded using the pixel value of the spatial domain in which the inverse-DCT transform is performed. Through this, the decoding process in the spatial domain according to an embodiment of the present invention may be performed by the decoder shown in FIG. 8.
정리하면, 도 8에서 역 -컬러 변환기 ( 510 )로의 입력 값인 ; 1腿 ( 은 아래 수학식 7로 표현될 수 있다. In summary, 1 ′ (input value) input to the inverse color converter 510 in FIG. 8 may be expressed by Equation 7 below.
대체용지 (규칙 제 26조) 【수학식 7】 Alternative Site (Article 26) [Equation 7]
X麵 (쩨 ( ) + 64 ∑x (m aACX LM(m X 麵 (쩨 () + 64 ∑ x ( ma AC X LM ( m
여기서' ^(,«) 은 잔차 신호에 대한 IDCT 수행 결과를 나타내고, Where ^ (, «) represents the result of performing IDCT on the residual signal,
1DC - AC)1 DC- AC )
Figure imgf000033_0001
Figure imgf000033_0001
64 은 복원된 LDR 값 괴 (,„)을 이용하여 HDR 값을 예측한 결과로 공간 도메인 예측기 (551)에 의해 산출되는 값이다. 본 발명에 따른 공간적 도메인에서의 HDR 예측 방법을 좀더 포괄적인 개념으 로 정리하면 아래의 수학식 8로 표현할 수 있다. 【수학식 8]
Figure imgf000033_0002
64 is a value calculated by the spatial domain predictor 551 as a result of predicting the HDR value by using the reconstructed LDR value mass (,?). When the HDR prediction method in the spatial domain according to the present invention is summarized in a more comprehensive concept, it may be expressed by Equation 8 below. [Equation 8]
Figure imgf000033_0002
ϊ=1 도 8에 도시된 본 발명의 일 실시예에서는, 1 가 (" - ^AC) 이고, 5가  ϊ = 1 In one embodiment of the invention shown in FIG. 8, 1 is ("-^ AC) and 5 is
64 aAC 인 경우의 공간 도메인의 복호화 방법에 대한 실시예를 설명하고 있으며, 본 발명의 다른 실시예에 따르면 A와 B의 값은 다른 여러 값으로 대체될 수 있다. 64, and a description and an embodiment of a decoding method in the spatial domain in the case of AC, in accordance with another embodiment of the values A and B of the present invention may be replaced with a different value.
도 9는 본 발명의 일 실시예에 따른 인코딩 방법의 동작 순서도이다. 도 9에 도시된 인코딩 방법은 도 2에 도시된 부호화기에 의해 수행될 수 있 으나, 동작 주체가 그에 한정되는 것은 아니다. 9 is a flowchart illustrating an encoding method according to an embodiment of the present invention. The encoding method shown in Fig. 9, but may be performed by the encoder shown in Figure 2, it is not the operation subject is not limited thereto.
대체용지 (규칙 제 26조) 본 발명의 일 실시예에 따른 인코딩 방법은 우선, 제 1 동적범위 이미지를 제 2 동적범위 이미지로 변환하고 (S910) , 계 2 동적범위 이미지를 인코딩하여 기본 계 층 코드스트림을 생성한다 (S920) . 여기서, 제 1 동적범위 이미지는 HDR 이미지이고, 상기 제 2 동적범위 이미지는 LDR 이미지일 수 있다. Alternative Site (Article 26) An encoding method according to an embodiment of the present invention first converts a first dynamic range image into a second dynamic range image (S910), and encodes a second dynamic range image to generate a basic layer code stream (S920). . Here, the first dynamic range image may be an HDR image, and the second dynamic range image may be an LDR image.
도 9에 상세히 도시하지는 않았으나, 기본 계층 코드스트림을 생성하는 단 계 (S920)는, 제 1 동적범위 이미지에 대해 톤 -매핑 연산을 수행하여 상기 제 2 동적 범위 이미지로 변환하는 단계, 제 2 동적범위 이미지를 컬러 변환하는 단계, 컬러 변환된 이미지를 DCT 변환하는 단계, DCT 변환된 이미지를 양자화하는 단계, 상기 양자화된 이미지를 엔트로피 인코딩하는 단계를 포함할 수 있다.  Although not shown in detail in FIG. 9, step S920 of generating a base layer codestream may be performed by performing a tone-mapping operation on a first dynamic range image to convert the second dynamic range image to a second dynamic range image. Color converting the range image, DCT converting the color converted image, quantizing the DCT converted image, and entropy encoding the quantized image.
이후, 제 2 동적범위 이미지에 대한 DCT도메인 데이터를 도출하고 (S930) , 제 1 동적범위 이미지에 대한 DCT 도메인 데이터를 도출한다 (S940) . 제 1 동적범위 이미 지에 대한 DCT 도메인 데이터를 도출하는 단계 (S940)는 제 2 동적범위 이미지 데이 터 범위로 스케일하는 단계, 스케일링 이미지를 컬러 변환하는 단계, 및 컬러 변환 된 이미지를 DCT 변환하는 단계를 포함할 수 있다. 여기서, 설명의 편의를 위해 단 계 S930 및 S930이 순차적으로 실행되는 것으로 기재하였으나, 두 단계는 동시에 수행될 수도 있고, 단계 S930이 먼저 실행되고 단계 S940이 이후에 수행될 수도 있 다. 또한, 특별히 언급하지 아니하여도 도 9에 기재된 단계들의 특성에 따라 두 단 계가 동시에 실행되거나 순차적으로 도시된 두 단계의 선후가 변경될 수도 있다. 도출된 제 2 동적범위 이미지에 대한 DCT 도메인 데이터 및 상기 계 1 동적범 위 이미지에 대한 DCT 도메인 데이터를 이용해 제 1 동적범위 이미지 관련 예측 계 수를 도출한다 (S950) . 대체용지 (규칙 저 126조) 거] 1 동적범위 이미지 관련 예측 계수는, 제 2 동적범위 이미지에 대한 DCT 도 메인 데이터에 대한 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 상관성을 활 용하여 산출될 수 있다. Thereafter, DCT domain data for the second dynamic range image is derived (S930), and DCT domain data for the first dynamic range image is derived (S940). Deriving DCT domain data for the first dynamic range image (S940) includes scaling to the second dynamic range image data range, color converting the scaled image, and DCT converting the color converted image. It may include. Here, for convenience of description, steps S930 and S930 are described as being sequentially executed, but two steps may be performed simultaneously, step S930 may be executed first, and step S940 may be performed later. In addition, even if not specifically mentioned, the two steps may be executed simultaneously or sequentially after the two steps may be changed depending on the characteristics of the steps described in FIG. 9. A DCT domain data of the derived second dynamic range image and DCT domain data of the first dynamic range image are used to derive a prediction coefficient related to the first dynamic range image (S950). Alternative Paper (Article 126 of the Rules) The prediction coefficient related to the first dynamic range image may be calculated by using the correlation of the DCT domain data for the first dynamic range image with respect to the DCT domain data for the second dynamic range image.
여기서, 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 AC 계수 및 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터의 AC 계수는 1차 다항식을 포함하 여 다항식, 지수 함수, 로그 함수, 삼각 함수 등의 함수로 표현되는 상관성을 가질 수 있다.  Here, the AC coefficients of the DCT domain data for the first dynamic range image and the AC coefficients of the DCT domain data for the second dynamic range image may include a linear polynomial, an exponential function, a logarithmic function, a trigonometric function, and the like. It can have a correlation expressed as a function.
또한, 상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 DC 계수 및 상 기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터의 DC 계수는 복수의 구간을 포 함하는 예측 곡선으로 표현되는 상관성을 가지며, 상기 예측 곡선의 각 구간은 동 일 또는 서로 다른 다항식, 지수 함수, 로그 함수, 삼각 함수 등의 함수에 의해 정 의될 수 있다.  In addition, the DC coefficient of the DCT domain data for the first dynamic range image and the DC coefficient of the DCT domain data for the second dynamic range image have a correlation represented by a prediction curve including a plurality of intervals. Each interval of the prediction curve can be defined by the same or different functions such as polynomials, exponential functions, logarithmic functions, and trigonometric functions.
제 1 동적범위 이미지 관련 예측 계수가 도출되면, 제 2 동적범위 이미지에 대 한 DCT 도메인 데이터 및 게 1동적범위 이미지 관련 예측 계수를 이용해 제 1 동적 범위 이미지에 대한 예측 DCT 도메인 데이터를 도출하여, 적어도 하나의 잔차 계수 를 생성한다 (S960) . 여기서, 잔차 계수는 DCT 계수일 수 있으며, 제 1 동적범위 이 '미지에 대한 DCT 도메인 데이터 및 제 1동적범위 이미지 관련 예측 DCT 도메인 테이 터의 차이 값으로 정의될 수 있다.  When the prediction coefficients related to the first dynamic range image are derived, the prediction DCT domain data for the first dynamic range image is derived using the DCT domain data for the second dynamic range image and the prediction coefficients related to the first dynamic range image. Generate one residual coefficient (S960). Here, the residual coefficient may be a DCT coefficient, and the first dynamic range may be defined as a difference value between the DCT domain data for the unknown and the predicted DCT domain data related to the first dynamic range image.
잔차 계수가 생성되면, 제 1 동적범위 이미지 관련 예측 계수 및 상기 적어도 하나의 잔차 계수를 포함하는 잔차 계층 코드스트림을 생성한다 (S970) . 여기서, 잔 차 계층 코드스트림은 예측 계수를 포함할 수 있다. 대체용지 (규칙 저 126조) 잔차계층 코드스트림이 생성되면, 기본계층 코드스트림 및 잔차 계층 코드스 트림을 디코더 단으로 전송한다 (S980) . 도 10은 본 발명의 일 실시예에 따른 디코딩 방법의 동작 순서도이다. When the residual coefficient is generated, a residual layer codestream including a first dynamic range image-related prediction coefficient and the at least one residual coefficient is generated (S970). Here, the residual layer codestream may include prediction coefficients. Alternative Paper (Article 126 of the Rules) When the residual layer code stream is generated, the base layer code stream and the residual layer code stream are transmitted to the decoder (S980). 10 is an operation flowchart of a decoding method according to an embodiment of the present invention.
본 발명의 일 실시예에 따른 디코딩 방법은 도 3에 도시된 이미지 복호화기 에 의해 수행될 수 있으나, 동작 주체가 그에 한정되는 것은 아니다.  The decoding method according to an embodiment of the present invention may be performed by the image decoder illustrated in FIG. 3, but the operation subject is not limited thereto.
복호화기는 제 1 동적범위 이미지 관련 예측 계수를 포함하는 잔차 계층 코드 스트림을 수신한다 (S1010) . 복호화기는 또한, 기본 계층 코드스트림을 수신하 고 (S1020) , 수신한 기본 계층 코드스트림을 디코딩하여 제 2 동적범위 이미지를 생 성한다 (S1030) . 여기서, 설명의 편의를 위해 단계 S1010 및 S1020이 순차적으로 실 행되는 것으로 기재하였으나, 두 단계는 동시에 수행될 수도 있고, 단계 S1020아 먼저 실행되고 단계 S1010이 이후에 수행될 수도 있다. 또한, 특별히 언급하지 아 니하여도 도 10 기재된 단계들의 특성에 따라 두 단계가 동시에 실행되거나 순차적 으로 도시된 두 단계의 선후가 변경될 수도 있다.  The decoder receives a residual layer code stream including the first dynamic range image related prediction coefficients (S1010). The decoder also receives a base layer codestream (S1020) and decodes the received base layer codestream to generate a second dynamic range image (S1030). Here, for convenience of description, steps S1010 and S1020 are described as being sequentially executed, but two steps may be performed simultaneously, step S1020 may be executed first, and step S1010 may be performed later. In addition, even if not specifically mentioned, the two steps may be executed simultaneously or the order of two steps shown sequentially may be changed according to the characteristics of the steps described in FIG. 10.
복호화기는 제 2 동적범위 이미지에 대한 DCT 도메인 데이터를 도출하 고 (S1040) , 제 1 동적범위 이미지 관련 예측 계수 및 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터로부터 상기 제 1 동적범위 이미지에 대한 예측 DCT 도메인 데이터를 도출한다 (S1050) .  The decoder derives DCT domain data for the second dynamic range image (S1040), and predicts the first dynamic range image from the prediction coefficients related to the first dynamic range image and the DCT domain data for the second dynamic range image. Derived DCT domain data (S1050).
복호화기는 최종적으로, 계 1 동적범위 이미지에 대한 DCT 도메인 데이터를 변환하여 제 1 동적범위 이미지를 재구성한다 (S1060) . 이때, 제 1 동적범위 이미지의 재구성을 위해 역 -DCT 변환, 역 -컬러 변환, 역—스케일 등의 절차를 거쳐 게 1 동적 대체용지 (규칙저 126조) 이미지에 대한 DCT도메인 데이터를 변환한다. 도 11은 본 발명의 다른 실시예에 따른 디코딩 방법의 동작 순서도이다. 본 발명의 일 실시예에 따른 디코딩 방법은 도 8에 도시된 이미지 복호화기 에 의해 수행될 수 있으나, 동작 주체가 그에 한정되는 것은 아니다. The decoder finally reconstructs the first dynamic range image by converting the DCT domain data for the first dynamic range image (S1060). At this time, for reconstruction of the first dynamic range image, one dynamic alternative paper is processed through inverse-DCT conversion, inverse-color conversion, and inverse-scale. Convert DCT domain data for an image. 11 is an operational flowchart of a decoding method according to another embodiment of the present invention. The decoding method according to an embodiment of the present invention may be performed by the image decoder illustrated in FIG. 8, but the operation subject is not limited thereto.
복호화기는 제 1 동적범위 이미지 관련 예측 계수를 포함하는 잔차 계층 코드 스트림을 수신한다 (S1110) . 복호화기는 또한, 기본 계층 코드스트림을 수신하 고 (S1120) , 수신한 기본 계층 코드스트림에 대해 역 -DCT 변환을 수행하여 제 2 동적 범위 이미지에 대한 공간 도메인 데이터를 도출한다 (S1130) . 여기서, 설명의 편의 를 위해 단계 S1110 및 S1120이 순차적으로 실행되는 것으로 기재하였으나, 두 단 계는 동시에 수행될 수도 있고, 단계 S1120이 먼저 실행되고 단계 S1110이 이후에 수행될 수도 있다. 또한, 특별히 언급하지 아니하여도 도 11에 기재된 단계들의 특 성에 따라 두 단계가 동시에 실행되거나 순차적으로 도시된 두 단계의 선후가 변경 될 수도 있다.  The decoder receives a residual layer code stream including the first dynamic range image related prediction coefficients (S1110). The decoder also receives a base layer codestream (S1120) and performs inverse-DCT transformation on the received base layer codestream to derive spatial domain data for the second dynamic range image (S1130). Here, for convenience of description, steps S1110 and S1120 are described as being sequentially executed, but the two steps may be performed simultaneously, or step S1120 may be executed first and step S1110 may be performed later. In addition, even if not specifically mentioned, the two steps may be executed simultaneously or sequentially after the two steps may be changed according to the characteristics of the steps described in FIG. 11.
복호화기는 이후, 제 1 동적범위 이미지 관련 예측 계수 및 제 2 동적범위 이 미지에 대한 공간 도메인 데이터로부터 제 1 동적범위 이미지 관련 예측 공간 도메 인 데이터를 산출한다 (S1140) . 복호화기는 잔차 계층 코드스트림에 포함된 잔차 신호에 대해 역 -DCT 변환을 수행하고 (S1150) , 제 1 동적범위 이미지에 대한 예측 공 간 데이터 및 역 -DCT 변환된 잔차 신호로부터 제 1 동적범위 이미지를 재구성한 다 (S1160) .  The decoder then calculates the first dynamic range image-related prediction spatial domain data from the first dynamic range image-related prediction coefficients and the spatial domain data for the second dynamic range image (S1140). The decoder performs inverse -DCT transform on the residual signal included in the residual layer codestream (S1150), and extracts the first dynamic range image from the prediction space data for the first dynamic range image and the inverse -DCT transformed residual signal. Reconfigure (S1160).
대체용지 (규칙 저 126조) 상술한 실시예들을 통해 살펴본 바와 같은 본 발명에 따른 HDR 이미지 부호 화의 성능과 기존에 제안된 JPEG XT 프로파일 부호화의 성능을 비교하는 실험을 실 시하였다. Alternative Paper (Article 126 of the Rules) Experiments comparing the performance of the HDR image encoding according to the present invention and the performance of the proposed JPEG XT profile encoding as described above have been performed.
부호화 성능은 보통의 경우 채택한 샘플 이미지와 TM0에 따라 변동될 수 있 다. 따라서, 도 5 및 6에서와 같이 "01", "02" , 및 "03' '의 3개의 샘플 이미지와 5 개의 TM0 기법을 선택하여 총 15 케이스를 실험하였다. 또한 다른 샘플 이미지에 대하여 실험을 수행했으며 성능 비교에 대하여서는 같은 결론에 도달하였다.  The encoding performance can usually vary depending on the sample image and TM0 adopted. Thus, three sample images of "01", "02", and "03 '' and five TM0 techniques were selected, as shown in Figs. 5 and 6, and a total of 15 cases were tested. And the same conclusion was reached for the performance comparison.
또한 객관적인 비교를 위해 4개의 이미지 화질평가 지수를 사용하였다. 관련 하여 최근, 여러 연구자들이 JPEG XT 프로파일의 성능을 평가하였다. Hanhart 등은 JPEG XT 프로파일을 사용한 HDR 이미지 압축의 질을 관찰하기 위하여 13 개 화질평 가 지수를 사용하였다. 이 평가는 'HDR visible di f ference predictor 2 '가 (腿 - VDP-2) HDR 이미지에 가장 알맞은 화질평가 지수라는 결론을 내렸다.  In addition, four image quality evaluation indices were used for objective comparison. In recent years, several researchers have evaluated the performance of JPEG XT profiles. Hanhart et al. Used 13 picture quality indexes to observe the quality of HDR image compression using the JPEG XT profile. This evaluation concluded that 'HDR visible dif ference predictor 2' (腿-VDP-2) is the best quality index for HDR images.
보다 구체적으로, Mantel 등은 SNR(Signal_to-noi se rat io) , MRSE(Mean relat ive square error ) , 및 HDR-VDP-2의 객관적 화질평가 지수를 평가하여 JPEG XT 프로파일로 압축된 HDR 이미지의 주관적 및 객관적인 화질 비교 평가의 결과를 보여준다. 이를 통해, JPEG XT를 사용함에 있어 MRSE 화질평가 지수가 가장 확실한 결과를 제공한다는 것을 보여 주었다.  More specifically, Mantel et al. Evaluated the subjective image quality index of Signal_to-noi se rat io (SNR), Mean relative square error (MRSE), and HDR-VDP-2 to determine the subjective quality of HDR images compressed with JPEG XT profiles. And the result of the objective image quality comparison evaluation. This shows that the MRSE quality assessment index provides the most obvious results when using JPEG XT.
Valenzise 등은 HDR—VDP-2 화질평가 지수의 성능을 PSNR(Peak SNR)의 성능 및 SSIM(Structural Simi lar i ty Index Metr ic) 성능과 바교하였다. 이는 HDR 이미 지의 역방향 호환성 HDR 이미지 부호화에 초점을 맞춘 것으로 이러한 연구를 통해 PSNR 및 SSIM 화질평가 지수 모두 HDR 이미지 부호화에 대한 이미지 복원 충실도를 대체용지 (규칙 제 26조) 측정하는 데 효과적으로 적용될 수 있다는 것으로 결론지었다. Valenzise et al. Compared the performance of HDR-VDP-2 quality index with the performance of Peak SNR (PSNR) and the Structural Similar Index Index (SSIM). This focuses on backward-compatible HDR image coding of HDR images. Through these studies, both PSNR and SSIM quality indexes replace the image reconstruction fidelity for HDR image coding (Article 26). It is concluded that it can be effectively applied to measure.
Cho i 등은 PSNR 화질평가 지수를 사용하여 부호화 성능과 다양한 TM0에 의한 프로파일들의 상관도를 비교함으로써 JPEG XT 프로파일의 성능을 평가하였다.  Cho i et al. Evaluated the performance of the JPEG XT profile by comparing the correlation between the coding performance and the various TM0 profiles using the PSNR quality evaluation index.
본 발명에서는 성능 비교를 위하여 PSNR , SSIM , HDR-VDP-2 및 MRSE-base SNR 을 선택하였으며, 본 발명에서 사용된 PSNR 및 MRSE-based SNR은 아래 표기 및 정 의를 통해 확인할 수 있다. SS IM 및 HDR-VDP-2를 사용한 경우의 평가를 위해 각 화 질평가 지수의 저자가 제공하는 프로그램이 사용되었다.  In the present invention, PSNR, SSIM, HDR-VDP-2 and MRSE-base SNR were selected for performance comparison, and the PSNR and MRSE-based SNR used in the present invention can be identified through the following notation and definition. The program provided by the authors of each quality index was used for the evaluation when using SS IM and HDR-VDP-2.
표기 (Notat ions)
Figure imgf000039_0001
원래 이미지, 여기 서 , M 및 N은 수직 및 수평 이미지 크기
Notat ions
Figure imgf000039_0001
Original image, here, M and N are the vertical and horizontal image size
xr m,n),x (m.n) x r m, n), x (mn)
이미지 X의 위치 (ηι, η) 에 위치하는 화소 의 빨간색, 녹색, 파란색 성분  Red, green, and blue components of the pixel at position (ηι, η) of image X
X = {[ ("? , n), xs (m, n), xb(m, n)] } X = {[("?, n), x s (m, n), x b (m, n)]}
원래 이미지 x의 부호화된 버전 정의 (Def ini t ion)  Define a coded version of the original image x (Def ini t ion)
PSNR PSNR
대체용지 (규칙 제 26조)
Figure imgf000040_0001
Alternative Site (Article 26)
Figure imgf000040_0001
1  One
and舰( , ) =  and 舰 (,) =
MRSE-based SNRMRSE-based SNR
Figure imgf000040_0002
where MRdt{A , Λ) = - · > — -ᅳ"― ~ ~.,
Figure imgf000040_0002
where MRdt (A, Λ) =-·> —-ᅳ "― ~ ~.,
상술한 본 발명의 여러 실시예들은 주로 JPEG 시스템을 대상으로 기술되었으 나, 본 발명이 적용 가능한 이미지 부호화 복호화 시스템이 JPEG에 한정되는 것은 아니다. 즉, 본 발명은 동영상 부호화 및 복호화가 가능한 MPEG 시스템, 또는 정지 영상 또는 동영상을 포함하는 이미지에 대한 부호화 또는 복호화 시스템 또는 장치 라면 어떠한 시스템 또는 장치에도 적용 가능하다 할 것이다. 본 발명의 실시예에 따른 부호화 방법 및 복호화 방법의 동작은 컴퓨터로 읽 을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 프로그램 또는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 또한 컴퓨터가 읽을 Although the above-described embodiments of the present invention have been described mainly for a JPEG system, an image encoding / decoding system to which the present invention is applicable is not limited to JPEG. That is, the present invention may be applicable to any system or apparatus as long as the MPEG system capable of encoding and decoding a video or the encoding or decoding system or apparatus for an image including a still image or a video. Operation of the encoding method and the decoding method according to an embodiment of the present invention can be implemented as a computer-readable program or code on a computer-readable recording medium. Computer-readable recording media include all kinds of recording devices that store data that can be read by a computer system. Also computer readable
대체용지 (규칙 제 26조) 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산 방식으로 컴퓨터로 읽을 수 있는 프로그램 또는 코드가 저장되고 실행될 수 있다. Alternative Site (Article 26) Recordable media may be distributed over network coupled computer systems so that computer readable programs or code are stored and executed in a distributed fashion.
또한, 컴퓨터가 읽을 수 있는 기록매체는 롬 (rom) , 램 (ram) , 플래시 메모 리 ( f lash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함할 수 있다. 프로그램 명령은 컴파일러 (compi ler )에 의해 만 들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 ( interpreter ) 등을 사용해 서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다.  In addition, the computer-readable recording medium may include a hardware device specifically configured to store and execute program instructions, such as a ROM, a RAM, a flash memory, or the like. Program instructions can include high-level language code that can be executed by a computer using an interpreter, as well as machine code such as that produced by a compiler.
본 발명의 일부 측면들은 장치의 문맥에서 설명되었으나, 그것은 상웅하는 방법에 따른 설명 또한 나타낼 수 있고, 여기서 블록 또는 장치는 방법 단계 또는 방법 단계의 특징에 상웅한다. 유사하게, 방법의 문맥에서 설명된 측면들은 또한 상웅하는 블록 또는 아이템 또는 상읓하는 장치의 특징으로 나타낼 수 있다. 방법 단계들의 몇몇 또는 전부는 예를 들어, 마이크로프로세서, 프로그램 가능한 컴퓨터 또는 전자 회로와 같은 하드웨어 장치에 의해 (또는 이용하여) 수행될 수 있다. 몇 몇의 실시예에서, 가장 증요한 방법 단계들의 하나 이상은 이와 같은 장치에 의해 수행될 수 있다.  While some aspects of the invention have been described in the context of a device, it may also represent a description according to the method in which the block or the device is characterized by a method step or a feature of the method step. Similarly, aspects described in the context of the method may also be characterized by the feature of the block or item being interacted with. Some or all of the method steps may be performed by (or using) a hardware device such as, for example, a microprocessor, a programmable computer, or an electronic circuit. In some embodiments, one or more of the most significant method steps may be performed by such an apparatus.
실시예들에서, 프로그램 가능한 로직 장치 (예를 들어, 필드 프로그머블 게이 트 어레이)가 여기서 설명된 방법들의 기능의 일부 또는 전부를 수행하기 위해 사 용될 수 있다. 실시예들에서, 필드 프로그머블 게이트 어레이는 여기서 설명된 방 법들 중 하나를 수행하기 위한 마이크로프로세서와 함께 작동할 수 있다. 일반적으 로, 방법들은 어떤 하드웨어 장치에 의해 수행되는 것이 바람직하다.  In embodiments, a programmable logic device (eg, a field programmable gate array) may be used to perform some or all of the functionality of the methods described herein. In embodiments, the field programmable gate array may operate in conjunction with a microprocessor to perform one of the methods described herein. In general, the methods are preferably performed by any hardware device.
이상 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야 대체용지 (규칙저 126조) 의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으 로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음 을 이해할 수 있을 것이다. As described above with reference to a preferred embodiment of the present invention, the substitute paper of the technical field (Article 126) Those skilled in the art will appreciate that various modifications and changes can be made in the present invention without departing from the spirit and scope of the invention as set forth in the claims below.
대체용지 (규칙 저 126조) Alternative Paper (Article 126 of the Rules)

Claims

【청구의 범위】 [Range of request]
【청구항 1】  [Claim 1]
제 1 동적범위 이미지를 제 2 동적범위 이미지로 변환하고, 제 2 동적범위 이 미지를 인코딩하여 기본 계층 코드스트림을 생성하는 단계;  Converting the first dynamic range image into a second dynamic range image and encoding the second dynamic range image to generate a base layer codestream;
상기 제 2 동적범위 이미지에 대한 DCKDiscrete Cosine Transform) 도메인 데이터를 도출하는 단계;  Deriving DCKDiscrete Cosine Transform) domain data for the second dynamic range image;
상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터를 도출하는 단계; 및 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터 및 상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 상관성을 이용하여 제 1 동적범위 이미지 관련 예측 계수를 도출하는 단계를 포함하는 이미지 부호화 방법.  Deriving DCT domain data for the first dynamic range image; And deriving prediction coefficients related to the first dynamic range image by using the correlation between the DCT domain data for the second dynamic range image and the DCT domain data for the first dynamic range image.
【청구항 2】  [Claim 2]
청구항 1에 있어서,  The method according to claim 1,
상기 제 1 동적범위 이미지는 HDR High Dynamic Range) 이미지이고, 상기 제 2 동적범위 이미지는 LDR(High Dynamic Range) 이미지인, 이미지 부호화 방법 .  And the first dynamic range image is an HDR high dynamic range (LDR) image and the second dynamic range image is a high dynamic range (LDR) image.
【청구항 3】  [Claim 3]
청구항 1에 있어서,  The method according to claim 1,
상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터 및 상기 제 1동적범위 이미지 관련 예측 계수로부터 도출한 제 1 동적범위 이미지에 대한 예측 DCT 도메인 데이터를 이용해 적어도 하나의 잔차 계수를 생성하는 단계; 및  Generating at least one residual coefficient using the DCT domain data for the second dynamic range image and the prediction DCT domain data for the first dynamic range image derived from the prediction coefficients related to the first dynamic range image; And
제 1 동적범위 이미지 관련 예측 계수 및 상기 적어도 하나의 잔차 계수를 포 함하는 잔차 계층 코드스트림을 생성하는 단계를 더 포함하는, 이미지 부호화 방 대체용지 (규칙 저 126조) 법. Generating a residual layer codestream comprising a first dynamic range image-related prediction coefficient and the at least one residual coefficient (Rule 126). method.
【청구항 4】  [Claim 4]
청구항 1에 있어서,  The method according to claim 1,
상기 기본 계층 코드스트림을 생성하는 단계는,  Generating the base layer code stream,
상기 제 2 동적범위 이미지를 컬러 변환하는 단계;  Color converting the second dynamic range image;
컬러 변환된 이미지를 DCT 변환하는 단계 ;  DCT converting the color converted image;
DCT 변환된 이미지를 양자화하는 단계; 및  Quantizing the DCT transformed image; And
상기 양자화된 이미지를 엔트로피 인코딩하는 단계를 포함하는, 이미지 부호 화 방법 .  Entropy encoding the quantized image.
【청구항 5】  [Claim 5]
청구항 4에 있어서 ,  The method according to claim 4,
상기 DCT 변환된 이미지를 양자화하는 단계에서 사용되는 화질계수는 잔차 DCT 도메인 데이터에 대한 양자화에 사용되는 화질계수와 동일한, 이미지 부호화 방법.  And an image quality coefficient used in quantizing the DCT transformed image is the same as the image quality coefficient used for quantization of residual DCT domain data.
【청구항 6】  [Claim 6]
청구항 4에 있어서, The method according to claim 4 ,
상기 제 2 동적범위 이미지에 대한 DCT도메인 데이터를 도출하는 단계는, 상 기 양자화된 이미지에 대해 역양자화를 수행하는 단계를 포함하는, 이미지 부호화 방법.  Deriving DCT domain data for the second dynamic range image comprises performing inverse quantization on the quantized image.
【청구항 7]  [Claim 7]
청구항 1에 있어서, 대체용지 (규칙 저 126조) 상기 제 1 동적범위 이미지에 대한 DCT도메인 데이터의 AC 계수 및 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터의 AC 계수는 다항식, 지수 함수, 로그 함수, 또는 삼각 함수로 표현되는 상관성을 갖는, 이미지 부호화 방법. Alternative paper according to claim 1 (Rule 126) An AC coefficient of DCT domain data for the first dynamic range image and an AC coefficient of DCT domain data for the second dynamic range image, having a correlation represented by a polynomial, an exponential function, a logarithmic function, or a trigonometric function Way.
【청구항 8]  [Claim 8]
청구항 1에 있어서,  The method according to claim 1,
상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 DC 계수 및 상기 저 12 동적범위 이미지에 대한 DCT 도메인 데이터의 DC 계수는 복수의 구간을 포함하는 예측 곡선으로 표현되는 상관성을 가지며, 상기 예측 곡선의 각 구간은 동일 또는 서로 다른 다항식, 지수 함수, 로그 함수, 또는 삼각 함수에 의해 정의되는, 이미 지 부호화 방법 .  The DC coefficients of the DCT domain data for the first dynamic range image and the DC coefficients of the DCT domain data for the low 12 dynamic range image have a correlation represented by a prediction curve including a plurality of intervals. An interval is defined by the same or different polynomials, exponential functions, logarithmic functions, or trigonometric functions.
【청구항 9】  [Claim 9]
저 U 동적범위 이미지 관련 예측 계수를 포함하는 잔차 계층 코드스트림을 수 신하는 단계 ;  Receiving a residual layer codestream comprising low U dynamic range image related prediction coefficients;
기본 계층 코드스트림을 수신하고, 수신한 기본 계층 코드스트림을 디코딩하 여 제 2 동적범위 이미지를 생성하는 단계;  Receiving a base layer codestream, decoding the received base layer codestream to generate a second dynamic range image;
상기 제 2 동적범위 이미지에 대한 DCT(Di screte Cosine Transform) 도메인 데이터를 도출하는 단계;  Deriving DCS (Discrete Cosine Transform) domain data for the second dynamic range image;
상기 제 1 동적범위 이미지 관련 예측 계수 및 상기 제 2동적범위 이미지에 대 한 DCT 도메인 데이터로부터 상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터 를 산출하는 단계; 및  Calculating DCT domain data for the first dynamic range image from the prediction coefficients related to the first dynamic range image and the DCT domain data for the second dynamic range image; and
상기 제 1 동적범위 이미지에 대한 DCT도메인 데이터로부터 제 1 동적범위 이 대체용지 (규칙 저 126조) 미지를 재구성하는 단계를 포함하는, 이미지 복호화 방법. Alternative paper from the DCT domain data for the first dynamic range image (Rule 126) And reconstructing the image.
【청구항 10】  [Claim 10]
청구항 9에 있어서,  The method according to claim 9,
상기 제 1 동적범위 이미지는 HDR High Dynami c Range) 이미지이고 상기 제 2 동적범위 이미지는 LDRCHigh Dynami c Range) 이미지인, 이미지 복호화 방법 .  And the first dynamic range image is an HDR High Dynami c Range image and the second dynamic range image is an LDRC High Dynami c Range image.
【청구항 111  [Claim 111]
청구항 9에 있어서,  The method according to claim 9,
상기 계 1 동적범위 이미지에 대한 DCT 도메인 데이터를 산출하는 단계는, 상기 잔차 계층 코드스트림으로부터 상기 제 1 동적범위 이미지 관련 예측 계 수 및 잔차 DCT 도메인 데이터를 도출하는 단계;  Computing DCT domain data for the first dynamic range image comprises: deriving a prediction coefficient and a residual DCT domain data related to the first dynamic range image from the residual layer codestream;
상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터 및 상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 상관성을 이용하여, 상기 제 1 동적범위 이미지 관련 예측 계수 및 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터로부터 상 기 제 1 동적범위 이미지에 대한 예측 DCT 도메인 데이터를 산출하는 단계; 및  By using the correlation between the DCT domain data for the second dynamic range image and the DCT domain data for the first dynamic range image, the prediction coefficients related to the first dynamic range image and the DCT domain data for the second dynamic range image Calculating predicted DCT domain data for the first dynamic range image from; And
상기 제 1 동적범위 이미지에 대한 예측 DCT도메인 데이터 및 상기 잔차 DCT 도메인 데이터로부터 제 1 동적범위 이미지에 대한 복원 DCT 도메인 데이터를 산출 하는 단계를 포함하는, 이미지 복호화 방법.  Calculating reconstructed DCT domain data for a first dynamic range image from the predicted DCT domain data for the first dynamic range image and the residual DCT domain data.
【청구항 12】  [Claim 12]
청구항 11에 있어서,  The method according to claim 11,
상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 AC 계수 및 상기 저 12 동적범위 이미지에 대한 DCT 도메인 데이터의 AC 계수는 다항식, 지수 함수, 로그 대체용지 (규칙 저 126조) 함수, 또는 삼각 함수로 표현되는 상관성을 갖는, 이미지 복호화 방법. AC coefficients of DCT domain data for the first dynamic range image and AC coefficients of DCT domain data for the low 12 dynamic range image are polynomial, exponential function, logarithmic paper (rule 126). An image decoding method having a correlation expressed as a function or a trigonometric function.
【청구항 13]  [Claim 13]
청구항 11에 있어서,  The method according to claim 11,
상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 DC 계수 및 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터의 DC 계수는 복수의 구간을 포함하는 예측 곡선으로 표현되는 상관성을 가지며, 상기 예측 곡선의 각 구간은 동일 또는 서로 다른 다항식, 지수 함수, 로그 함수, 또는 삼각 함수에 의해 정의되는, 이미 지 복호화 방법 .  The DC coefficient of the DCT domain data for the first dynamic range image and the DC coefficient of the DCT domain data for the second dynamic range image have a correlation represented by a prediction curve including a plurality of intervals, and the angle of the prediction curve The interval is defined by the same or different polynomials, exponential functions, logarithm functions, or trigonometric functions.
【청구항 14】  [Claim 14]
제 1 동적범위 이미지를 제 2 동적범위 이미지로 변환하고, 제 2 동적범위 이미 지를 인코딩하여 기본 계층 코드스트림을 생성하는 기본계층 프로세서;  A base layer processor that converts the first dynamic range image into a second dynamic range image and encodes the second dynamic range image to generate a base layer codestream;
상기 기본계층 프로세서에 의해 양자화된 제 2 동적범위 이미지에 대해 역양 자화를 수행하여 DCT(Di screte Cos ine Transform) 도메인 데이터를 도출하는 역양 자화기 ; 및  An inverse quantizer for performing inverse quantization on the second dynamic range image quantized by the base layer processor to derive DCS domain data; And
상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터를 도출하고, 상기 저 12 동적범위 이미지에 대한 DCT 도메인 데이터 및 상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터로부터 계 1 동적범위 이미지 관련 예측 계수를 도출하며, 상기 제 1동적범위 이미지 관련 예측 계수 및 상기 제 2 동적범위 이미지에 대한 DCT 도메 인 데이터로부터 잔차 계층 코드스트림을 생성하는, 향상계층 프로세서를 포함하는 이미지 부호화기 .  Derive DCT domain data for the first dynamic range image, derive a first dynamic range image related prediction coefficient from DCT domain data for the low 12 dynamic range image and DCT domain data for the first dynamic range image, And an enhancement layer processor for generating a residual layer codestream from the DCT domain data for the first dynamic range image and the prediction coefficients associated with the first dynamic range image.
【청구항 15】 대체용지 (규칙저 126조) 청구항 14에 있어서, 【Claim 15】 Alternative Sites (Article 126 of the Rules) The method according to claim 14,
상기 향상계층 프로세서는,  The enhancement layer processor,
상기 제 2 .동적범위 이미지에 대한 DCT 도메인 데이터 및 상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 상관성을 이용하여 상기 제 1 동적범위 이미지 관련 예측 계수를 산출하는 예측기를 포함하는, 이미지 부호화기.  And a predictor for calculating a prediction coefficient related to the first dynamic range image using the correlation of the DCT domain data for the second dynamic range image and the DCT domain data for the first dynamic range image.
【청구항 16]  [Claim 16]
청구항 14에 있어서,  The method according to claim 14,
상기 향상계층 프로세서는,  The enhancement layer processor,
상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터 및 상기 제 1동적범위 이미지 관련 예측 계수로부터 도출한 제 1 동적범위 이미지에 대한 예측 DCT 도메인 데이터를 이용해 적어도 하나의 잔차 계수를 생성하고, 상기 제 1 동적범위 이미지 관련 예측 계수 및 적어도 하나의 잔차 계수를 포함하는 잔차계층 코드스트림을 생 성하는, 이미지 부호화기ᅳ  Generate at least one residual coefficient using the DCT domain data for the second dynamic range image and the prediction DCT domain data for the first dynamic range image derived from the prediction coefficients related to the first dynamic range image, An image encoder for generating a residual layer codestream comprising range image related prediction coefficients and at least one residual coefficient.
【청구항 17】  [Claim 17]
청구항 16에 있어서,  The method according to claim 16,
상기 기본계층 프로세서에 의해 수행되는 상기 계 2 동적범위 이미지에 대한 양자화에 사용되는 화질계수는 상기 향상계층 프로세서에 의해 수행되는 잔차 DCT 도메인 데이터에 대한 양자화에 사용되는 화질계수와 동일한, 이미지 부호화기.  And an image quality factor used for quantization of the layer 2 dynamic range image performed by the base layer processor is the same as a quality factor used for quantization of residual DCT domain data performed by the enhancement layer processor.
【청구항 18】 [Claim 18]
청구항 14에 있어서,  The method according to claim 14,
상기 기본계층 프로세서는, 대체용지 (규칙 저 126조) 상기 제 2 동적범위 이미지를 컬러 변환하는 컬러 변환기; The base layer processor is a substitute sheet (rule 126). A color converter for color converting the second dynamic range image;
컬러 변환된 이미지를 DCT 변환하는 DCT 변환기 ;  A DCT converter for DCT converting color converted images;
DCT 변환된 이미지를 양자화하는 양자화기; 및  A quantizer for quantizing the DCT transformed image; And
상기 양자화된 이미지를 엔트로피 인코딩하는 엔트로피 인코더를 포함하는, 이미지 부호화기 .  And an entropy encoder for entropy encoding the quantized image.
【청구항 19]  [Claim 19]
제 1 동적범위 이미지 관련 예측 계수를 포함하는 잔차 계층 코드스트림을 수 신하는 단계;  Receiving a residual layer codestream comprising a first dynamic range image related prediction coefficient;
기본 계층 코드스트림을 수신하고, 수신한 기본 계층 코드스트림에 대해 역- DCT( Inverse Di screte Cos ine Transform) 변환을 수행하여 제 2 동적범위 이미지에 대한 공간 도메인 데이터를 도출하는 단계; 및  Receiving a base layer codestream and performing inverse DCS transform on the received base layer codestream to derive spatial domain data for a second dynamic range image; And
상기 제 1 동적범위 이미지 관련 예측 계수 및 상기 제 2동적범위 이미지에 대 한 공간 도메인 데이터로부터 제 1 동적범위 이미지에 대한 공간 도메인 데이터를 산출하는 단계를 포함하는, 이미지 복호화 방법.  Calculating spatial domain data for a first dynamic range image from the prediction coefficients associated with the first dynamic range image and the spatial domain data for the second dynamic range image.
【청구항 20】  [Claim 20]
청구항 19에 있어서,  The method according to claim 19,
상기 제 1 동적범위 이미지는 HDR(High Dynamic Range) 이미지이고, 상기 제 2 동적범위 이미지는 LDR(High Dynami c Range) 이미지인, 이미지 복호화 방법 .  The first dynamic range image is a high dynamic range (HDR) image, and the second dynamic range image is a high dynamic range (LDR) image.
【청구항 21]  [Claim 21]
청구항 19에 있어서,  The method according to claim 19,
상기 계 1 동적범위 이미지에 대한 공간 도메인 데이터를 산출하는 단계는, 대체용지 (규칙 저 126조) 상기 잔차 계층 코드스트림에 포함된 잔차 신호에 대해 역 -DCT 변환을 수행 하는 단계; Computing the spatial domain data for the first dynamic range image, substitute paper (Article 126) Performing inverse-DCT transform on the residual signal included in the residual layer codestream;
제 2 동적범위 이미지에 대한 DCT 도메인 데이터 및 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 상관성을 이용하여, 상기 제 1 동적범위 이미지 관련 예 측 계수 및 상기 제 2 동적범위 이미지에 대한 공간 도메인 데이터로부터 제 1 동 적범위 이미지에 대한 예측 공간 도메인 데이터를 산출하는 단계 ; 및  From the correlation of the DCT domain data for the second dynamic range image and the DCT domain data for the first dynamic range image, from the spatial domain data for the first dynamic range image and the prediction coefficients for the second dynamic range image Calculating predictive spatial domain data for the first dynamic range image; And
상기 제 1 동적범위 이미지에 대한 예측 공간 도메인 데이터 및 역 -DCT 변환 된 잔차 신호로부터 제 1 동적범위 이미지를 재구성하는 단계를 포함하는, 이미지 복호화 방법 .  Reconstructing a first dynamic range image from the predictive spatial domain data and the inverse -DCT transformed residual signal for the first dynamic range image.
【청구항 22]  [Claim 22]
청구항 19에 있어서,  The method according to claim 19,
상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 AC 계수 및 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터의 AC 계수는 다항식, 지수 함수, 로그 함수, 또는 삼각 함수로 표현되는 상관성을 갖는, 이미지 복호화 방법.  AC coefficients of DCT domain data for the first dynamic range image and AC coefficients of DCT domain data for the second dynamic range image have correlations expressed as polynomials, exponential functions, logarithmic functions, or trigonometric functions. Way.
【청구항 23】  [Claim 23]
청구항 19에 있어서,  The method according to claim 19,
상기 제 1 동적범위 이미지에 대한 DCT 도메인 데이터의 DC 계수 및 상기 제 2 동적범위 이미지에 대한 DCT 도메인 데이터의 DC 계수는 복수의 구간을 포함하는 예측 곡선으로 표현되는 상관성을 가지며, 상기 예측 곡선의 각 구간은 동일 또는 서로 다른 다항식, 지수 함수, 로그 함수, 또는 삼각 함수에 의해 정의되는, 이미 지 복호화 방법 . 대체용지 (규칙 저 126조)  The DC coefficients of the DCT domain data for the first dynamic range image and the DC coefficients of the DCT domain data for the second dynamic range image have a correlation represented by a prediction curve including a plurality of intervals, the angles of the prediction curves An interval is defined by the same or different polynomials, exponential functions, logarithmic functions, or trigonometric functions. Alternative Paper (Article 126 of the Rules)
PCT/KR2017/001800 2016-02-19 2017-02-17 Image encoding and decoding method, and image encoder and image decoder using same WO2017142360A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US15/999,734 US20190089955A1 (en) 2016-02-19 2017-02-17 Image encoding method, and image encoder and image decoder using same

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
KR10-2016-0019859 2016-02-19
KR20160019859 2016-02-19
KR10-2016-0064515 2016-05-26
KR20160064515 2016-05-26
KR10-2017-0015839 2017-02-03
KR1020170015839A KR20170098163A (en) 2016-02-19 2017-02-03 Image encoding and decoding methods, encoder and decoder using the methods

Publications (1)

Publication Number Publication Date
WO2017142360A1 true WO2017142360A1 (en) 2017-08-24

Family

ID=59626168

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/001800 WO2017142360A1 (en) 2016-02-19 2017-02-17 Image encoding and decoding method, and image encoder and image decoder using same

Country Status (1)

Country Link
WO (1) WO2017142360A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070026525A (en) * 2004-04-23 2007-03-08 브라이트사이드 테크놀로지즈 아이엔씨. Encoding, decoding and representing high dynamic range images
US20080008235A1 (en) * 2006-07-10 2008-01-10 Segall Christopher A Methods and Systems for Conditional Transform-Domain Residual Accumulation
US20080193032A1 (en) * 2007-02-08 2008-08-14 Christopher Andrew Segall Methods and Systems for Coding Multiple Dynamic Range Images
KR20080107389A (en) * 2006-01-23 2008-12-10 막스-플랑크-게젤샤프트 츄어 푀르더룽 데어 비쎈샤프텐 에.파우. High dynamic range codecs
US20140205009A1 (en) * 2013-01-21 2014-07-24 The Regents Of The University Of California Method and apparatus for spatially scalable video compression and transmission

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070026525A (en) * 2004-04-23 2007-03-08 브라이트사이드 테크놀로지즈 아이엔씨. Encoding, decoding and representing high dynamic range images
KR20080107389A (en) * 2006-01-23 2008-12-10 막스-플랑크-게젤샤프트 츄어 푀르더룽 데어 비쎈샤프텐 에.파우. High dynamic range codecs
US20080008235A1 (en) * 2006-07-10 2008-01-10 Segall Christopher A Methods and Systems for Conditional Transform-Domain Residual Accumulation
US20080193032A1 (en) * 2007-02-08 2008-08-14 Christopher Andrew Segall Methods and Systems for Coding Multiple Dynamic Range Images
US20140205009A1 (en) * 2013-01-21 2014-07-24 The Regents Of The University Of California Method and apparatus for spatially scalable video compression and transmission

Similar Documents

Publication Publication Date Title
KR101261526B1 (en) An video encoding/decoding method and apparatus
JP6245888B2 (en) Encoder and encoding method
US8666186B1 (en) Lossy compression of high dynamic range video
US6987890B2 (en) Producing and encoding rate-distortion information allowing optimal transcoding of compressed digital image
US8422804B2 (en) Compressed domain system and method for compression gains in encoded data
JPH10327403A (en) Method for optimizing compression of image data accompanying automatic selection of compression condition
Nageswara et al. Image compression using discrete cosine transform
JP2016226001A (en) Decoder and decoding method
CN104322063B (en) Method, system and the computer readable storage medium of video stream compression
US8396313B2 (en) Image compression and decompression using the PIXON method
Richter Backwards compatible coding of high dynamic range images with JPEG
JP5909149B2 (en) COLOR CONVERTER, ENCODER AND DECODER, AND PROGRAM THEREOF
Messaoudi et al. DCT-based color image compression algorithm using adaptive block scanning
US9787985B2 (en) Reduction of spatial predictors in video compression
Kumar et al. Human visual system based enhanced AMBTC for color image compression using interpolation
JP2003188733A (en) Encoding method and arrangement
RU2683614C2 (en) Encoder, decoder and method of operation using interpolation
US20190089955A1 (en) Image encoding method, and image encoder and image decoder using same
US10536697B2 (en) Method for re-encoding image and apparatus therefor
CN104282030A (en) Image compression device and method
Zaid et al. HDR image compression with optimized JPEG coding
WO2017142360A1 (en) Image encoding and decoding method, and image encoder and image decoder using same
Yu et al. Adaptive PQ: Adaptive perceptual quantizer for HEVC main 10 profile-based HDR video coding
CN113141506A (en) Deep learning-based image compression neural network model, and method and device thereof
JP4241517B2 (en) Image encoding apparatus and image decoding apparatus

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17753521

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17753521

Country of ref document: EP

Kind code of ref document: A1