KR101024282B1 - Apparatus and method for image reproduction in compressed domain - Google Patents
Apparatus and method for image reproduction in compressed domain Download PDFInfo
- Publication number
- KR101024282B1 KR101024282B1 KR1020090104149A KR20090104149A KR101024282B1 KR 101024282 B1 KR101024282 B1 KR 101024282B1 KR 1020090104149 A KR1020090104149 A KR 1020090104149A KR 20090104149 A KR20090104149 A KR 20090104149A KR 101024282 B1 KR101024282 B1 KR 101024282B1
- Authority
- KR
- South Korea
- Prior art keywords
- value
- block
- transform
- dct
- dct block
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 239000011159 matrix material Substances 0.000 claims abstract description 29
- 238000006243 chemical reaction Methods 0.000 claims abstract description 8
- 230000006872 improvement Effects 0.000 claims description 57
- 238000013139 quantization Methods 0.000 claims description 18
- 230000009466 transformation Effects 0.000 claims description 16
- 238000000354 decomposition reaction Methods 0.000 claims description 14
- 230000001131 transforming effect Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 description 33
- 230000006870 function Effects 0.000 description 29
- 230000003595 spectral effect Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 9
- 230000006835 compression Effects 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000016776 visual perception Effects 0.000 description 2
- 241000255925 Diptera Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
Description
본 발명은 압축 영역에서의 영상 복원 장치 및 방법에 관한 것으로, 이산 코사인 변환에 의해 압축된 영상의 변환 계수를 처리하여 압축 영상을 복원하는 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for image restoration in a compressed region, and more particularly, to an apparatus and method for reconstructing a compressed image by processing transform coefficients of an image compressed by discrete cosine transform.
인터넷과 멀티미디어의 출현으로 인해 정보가 압축되고 네트워크의 한정된 대역에서 전달될 수 있게 되었다. 데이터 압축을 위한 변환 기법들 중에서 이산 코사인 변환(Discrete Cosine Transform)은 우수한 에너지 집중성 및 최소 상관성 특징을 보이기 때문에 가장 널리 사용되는 방법이다. DCT는 JPEG 및 MPEG과 같은 정지 영상 및 비디오 시퀀스(sequence)의 압축을 위한 표준에서 사용되고 있다.The advent of the Internet and multimedia has made it possible for information to be compressed and delivered in a limited band of networks. Among the transformation techniques for data compression, discrete cosine transform is the most widely used method because of its excellent energy concentration and minimal correlation. DCT is used in standards for the compression of still images and video sequences such as JPEG and MPEG.
압축 영역에서의 영상 개선, 즉 동적 영역 압축(dynamic range compression) 및 대비 개선(contrast enhancement)은 DCT에 의해 압축된 영상의 변환 계수에 대해 직접 수행된다. 이러한 압축 영역에서의 영상 품질 개선 방법으로는 α-루팅(rooting) 기법, 수정된 언샤프 마스킹(modified unsharp masking) 기법 및 멀티 스케일 대비 측정(multi-scale contrast measure) 기법 등이 있다.Image enhancement in the compressed region, ie dynamic range compression and contrast enhancement, is performed directly on the transform coefficients of the image compressed by the DCT. Image quality improvement methods in such a compressed region include an α-rooting technique, a modified unsharp masking technique, and a multi-scale contrast measure technique.
이와 같은 압축 영역 처리 비법들은 계산의 복잡도가 낮고, 영상의 주파수 합성의 관찰 및 조절이 용이하다는 장점을 가진다. 그러나 이러한 기법들은 블록 경계에서의 불필요한 에지와 같은 블록 현상(block artifacts)을 가져올 수 있으며, 영상의 모든 부분을 동시에 개선할 수 없다는 단점이 보고되고 있다.Such compressed region processing methods have advantages of low computational complexity and easy observation and adjustment of frequency synthesis of an image. However, these techniques can lead to block artifacts such as unnecessary edges at the block boundary, and it is reported that all parts of the image cannot be improved at the same time.
따라서 DCT 압축 영역에서 블록 현상과 같은 인공적인 현상을 억제하고 압축 영상의 화질을 개선하여 효과적으로 영상을 복원할 수 있는 방법이 필요하다.Therefore, there is a need for a method for effectively restoring an image by suppressing an artificial phenomenon such as a block phenomenon in the DCT compression region and improving the quality of the compressed image.
본 발명이 이루고자 하는 기술적 과제는, 원본 영상에 대한 이산 코사인 변환에 의해 생성된 복수의 DCT 블록을 구성하는 변환 계수의 값을 변형하여 원본 영상의 밝기 정보 및 디테일 정보를 개선하는 영상 복원 장치 및 방법을 제공하는 데 있다.The technical problem to be achieved by the present invention, image reconstruction apparatus and method for improving the brightness information and detail information of the original image by modifying the value of the transform coefficient constituting a plurality of DCT blocks generated by the discrete cosine transform on the original image To provide.
본 발명이 이루고자 하는 다른 기술적 과제는, 원본 영상에 대한 이산 코사인 변환에 의해 생성된 복수의 DCT 블록을 구성하는 변환 계수의 값을 변형하여 원본 영상의 밝기 정보 및 디테일 정보를 개선하는 영상 복원 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.Another technical problem to be solved by the present invention is an image restoration method for improving brightness information and detail information of an original image by modifying values of transform coefficients constituting a plurality of DCT blocks generated by discrete cosine transform on the original image. The present invention provides a computer-readable recording medium that records a program for execution on a computer.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 압축 영역에서의 영상 복원 장치는, 원본 영상이 복수의 단위 블록으로 분할되고 각각의 단위 블록에 이산 코사인 변환 및 양자화 변환이 수행되어 생성된 복수의 DCT 블록을 입력받는 압축 영상 입력부; 상기 DCT 블록을 사전에 설정된 변환 매트릭스에 의해 분해하여 상기 DCT 블록을 구성하는 변환 계수들의 주파수 분포와 동일한 주파수 분포를 가지는 복수의 서브 블록을 생성하는 블록 분해부; 상기 서브 블록을 구성하는 변환 계수들 중에서 DC 성분에 해당하는 변환 계수의 값을 비선형 함수인 제1변환함수에 의해 변형하여 상기 원본 영상의 어두운 영역 및 밝은 영역에서의 밝기 정보를 개 선하는 밝기 정보 개선부; 상기 서브 블록을 구성하는 변환 계수들 중에서 AC 성분에 해당하는 변환 계수의 값을 비선형 함수인 제2변환함수에 의해 변형하여 상기 원본 영상에 포함된 디테일 정보를 개선하는 디테일 정보 개선부; 및 상기 DCT 블록으로부터 생성된 모든 서브 블록에 대하여 상기 변환 계수들의 값이 변형되면 변형된 변환 계수들로 이루어진 서브 블록들에 대해 상기 변환 매트릭스의 역 매트릭스를 적용하여 변형 DCT 블록으로 재구성하는 블록 재구성부;를 구비한다.In order to achieve the above technical problem, the apparatus for reconstructing an image in the compressed region according to the present invention includes a plurality of generated original images divided into a plurality of unit blocks and discrete cosine transform and quantization transform are performed on each unit block. A compressed image input unit receiving a DCT block; A block decomposition unit for generating a plurality of sub-blocks having a frequency distribution equal to a frequency distribution of transform coefficients constituting the DCT block by decomposing the DCT block by a predetermined transform matrix; Brightness information for improving the brightness information in the dark region and the bright region of the original image by modifying the value of the transform coefficient corresponding to the DC component among the transform coefficients constituting the sub-block by the first transform function which is a nonlinear function Improvement unit; A detail information improving unit for modifying a value of a transform coefficient corresponding to an AC component among the transform coefficients constituting the sub-block by a second transform function which is a nonlinear function to improve detail information included in the original image; And a block reconstruction unit configured to reconstruct a transformed DCT block by applying an inverse matrix of the transform matrix to subblocks formed of transformed transform coefficients when values of the transform coefficients are transformed for all subblocks generated from the DCT block. It includes;
상기의 다른 기술적 과제를 달성하기 위한, 본 발명에 따른 압축 영역에서의 영상 복원 방법은, (a) 원본 영상이 복수의 단위 블록으로 분할되고 각각의 단위 블록에 이산 코사인 변환 및 양자화 변환이 수행되어 생성된 복수의 DCT 블록을 입력받는 단계; (b) 상기 DCT 블록을 사전에 설정된 변환 매트릭스에 의해 분해하여 상기 DCT 블록을 구성하는 변환 계수들의 주파수 분포와 동일한 주파수 분포를 가지는 복수의 서브 블록을 생성하는 단계; (c) 상기 서브 블록을 구성하는 변환 계수들 중에서 DC 성분에 해당하는 변환 계수의 값을 비선형 함수인 제1변환함수에 의해 변형하여 상기 원본 영상의 어두운 영역 및 밝은 영역에서의 밝기 정보를 개선하는 단계; (d) 상기 서브 블록을 구성하는 변환 계수들 중에서 AC 성분에 해당하는 변환 계수의 값을 비선형 함수인 제2변환함수에 의해 변형하여 상기 원본 영상에 포함된 디테일 정보를 개선하는 단계; 및 (e) 상기 DCT 블록으로부터 생성된 모든 서브 블록에 대하여 상기 변환 계수들의 값이 변형되면 변형된 변환 계수들로 이루어진 서브 블록들에 대해 상기 변환 매트릭스의 역 매트릭스를 적용하여 변형 DCT 블록으로 재구성하는 단계;를 갖는다.In order to achieve the above technical problem, an image reconstruction method in a compressed region according to the present invention includes: (a) an original image is divided into a plurality of unit blocks, and discrete cosine transform and quantization transform are performed on each unit block. Receiving a plurality of generated DCT blocks; (b) generating a plurality of subblocks having a frequency distribution equal to a frequency distribution of transform coefficients constituting the DCT block by decomposing the DCT block by a predetermined transform matrix; (c) transforming a value of a transform coefficient corresponding to a DC component among the transform coefficients constituting the sub-block by a first transform function that is a nonlinear function to improve brightness information in a dark region and a bright region of the original image; step; (d) modifying a value of a transform coefficient corresponding to an AC component among transform coefficients constituting the sub-block by a second transform function which is a nonlinear function to improve detail information included in the original image; And (e) reconstructing a transformed DCT block by applying an inverse matrix of the transform matrix to subblocks formed of transformed transform coefficients when values of the transform coefficients are transformed for all subblocks generated from the DCT block. Step;
본 발명에 따른 압축 영역에서의 영상 복원 장치 및 방법에 의하면, DCT 블록을 분해하여 생성된 서브 블록을 구성하는 변환 계수의 값을 변형시킴으로써, 압축 영역에서 원본 영상을 처리하였을 때 발생할 수 있는 링잉 현상 및 블록 현상 등을 제거할 수 있다. 또한 서브 블록을 구성하는 변환 계수들 중에서 DC 성분에 해당하는 변환 계수 및 AC 성분에 해당하는 변환 계수의 값을 별개의 방법으로 변형함으로써 원본 영상의 밝기 정보 및 디테일 정보를 효과적으로 개선할 수 있다.According to the apparatus and method for image reconstruction in a compressed region according to the present invention, a ringing phenomenon that may occur when the original image is processed in the compressed region by modifying a value of a transform coefficient constituting a subblock generated by decomposing a DCT block. And block phenomenon can be eliminated. In addition, by transforming the values of the transform coefficients corresponding to the DC component and the transform coefficient corresponding to the AC component among the transform coefficients constituting the sub-block in a separate method, it is possible to effectively improve the brightness information and the detail information of the original image.
이하에서 첨부된 도면들을 참조하여 본 발명에 따른 압축 영역에서의 영상 복원 장치 및 방법의 바람직한 실시예에 대해 상세하게 설명한다.Hereinafter, with reference to the accompanying drawings will be described in detail a preferred embodiment of the image restoration apparatus and method in a compressed region according to the present invention.
도 1은 본 발명에 따른 압축 영역에서의 영상 복원 장치에 대한 바람직한 실시예의 구성을 도시한 블록도이다.1 is a block diagram showing the configuration of a preferred embodiment of an image restoration apparatus in a compressed region according to the present invention.
도 1을 참조하면, 본 발명에 따른 영상 복원 장치는 압축 영상 입력부(110), 블록 분해부(120), 밝기정보 개선부(130), 세부정보 개선부(140) 및 블록 재구성부(150)를 구비한다.Referring to FIG. 1, the apparatus for reconstructing an image according to the present invention includes a compressed
압축 영상 입력부(110)는 원본 영상이 복수의 단위 블록으로 분할되고 각각의 단위 블록에 이산 코사인 변환 및 양자화 변환이 수행되어 생성된 복수의 DCT 블록을 입력받는다.The compressed
DCT 기반의 영상 압축에서 원본 영상은 먼저 8×8화소의 크기를 가지는 일련의 단위 블록들로 분할된다. 다음으로 각 단위 블록은 순방향(forward) DCT에 의해 공간 주파수 영역에서의 DCT 블록으로 변환된다. 공간 주파수 영역으로 변환된 DCT 블록은 단위 블록을 구성하는 화소들에 대응하는 8×8개의 DCT 변환 계수들로 구성된다.In DCT-based image compression, the original image is first divided into a series of unit blocks having a size of 8x8 pixels. Each unit block is then transformed into a DCT block in the spatial frequency domain by a forward DCT. The DCT block transformed into the spatial frequency domain is composed of 8 × 8 DCT transform coefficients corresponding to the pixels constituting the unit block.
하나의 DCT 블록을 구성하는 DCT 변환 계수들의 값은 다음의 수학식 1로 표현되는 변환 수식에 의해 단위 블록의 각 화소로부터 얻어진다.The values of the DCT transform coefficients constituting one DCT block are obtained from each pixel of the unit block by a transform equation represented by
여기서, X(u,v)는 DCT 블록에서 (u,v) 위치에 해당하는 변환 계수의 값, x(i,j)는 단위 블록에서 DCT 블록의 (u,v) 위치에 대응하는 (i,j) 위치에서의 화소값이고, c(·) 값은 다음과 같이 결정된다.Here, X (u, v) is the value of the transform coefficient corresponding to the (u, v) position in the DCT block, and x (i, j) is the (i, v) position corresponding to the (u, v) position of the DCT block in the unit block. , j) is a pixel value at the position, and the c (·) value is determined as follows.
8×8 크기의 하나의 DCT 블록에서 X(0,0)은 DC 성분에 해당하는 변환 계수이고, 63개의 나머지는 AC 성분에 해당하는 변환 계수이다. 도 2는 64개의 DCT 기본 함수(basis function)를 도시한 도면이다. 이러한 기본 함수들은 좌측 상단으로부터 우측 하단으로 갈수록 공간 주파수가 증가하는 순서에 따라 정렬되며, 도 2에 표시된 동일한 숫자끼리 서로 연결한 직선이 통과하는 위치의 변환 계수들은 동일한 주파수 밴드에 속하는 것으로 본다. 따라서 하나의 DCT 블록을 구성하는 64개의 변환 계수들은 14개의 주파수 밴드로 분류될 수 있다. 위 수학식 1에서 X(u,v)는 도 2의 기본 함수들 중에서 u번째 행 v번째 열에 위치하는 기본 함수로부터의 기여도를 나타낸다.In one DCT block of
DCT가 수행된 후 각 DCT 블록의 64개의 변환 계수들은 양자화되고, 지그재그 스캔 방향으로 정렬된 후 엔트로피 코딩된다. 모든 DCT 블록에 대해 이러한 과정이 수행되어 압축 영상이 얻어지게 된다. 엔트로피 코딩은 0으로 이루어진 긴 문자열이 효과적으로 압축되는 런렝스(run-length) 코딩 방법이다. 양자화된 각각의 DCT 블록에 대한 엔트로피 코딩에 의해 각 블록에는 아주 적은 개수의 0이 아닌 변환 계수들만 남아있게 된다.After DCT is performed, 64 transform coefficients of each DCT block are quantized, aligned in a zigzag scan direction, and then entropy coded. This process is performed for all DCT blocks to obtain a compressed image. Entropy coding is a run-length coding method in which a long string of zeros is effectively compressed. Entropy coding for each quantized DCT block leaves only a small number of nonzero transform coefficients in each block.
디코딩 과정에 의해 원본 영상을 복원하기 위해서는 앞에서 설명한 영상 압축 과정이 역으로 수행된다. 즉, 압축 영상은 먼저 엔트로피 디코딩되고, 양자화 매개변수에 의해 역 양자화되어 복수의 DCT 블록이 얻어진다. 각각의 DCT 블록에 대해서는 역 DCT(inverse DCT)가 수행되어 단위 블록이 얻어진다. 역 DCT는 다음의 수학식 2와 같이 나타낼 수 있다.In order to restore the original image by the decoding process, the above-described image compression process is reversed. That is, the compressed image is first entropy decoded and inversely quantized by the quantization parameter to obtain a plurality of DCT blocks. For each DCT block, an inverse DCT is performed to obtain a unit block. The inverse DCT can be expressed as
여기서, X(u,v)는 DCT 블록에서 (u,v) 위치에 해당하는 변환 계수의 값, x(i,j)는 복원된 단위 블록에서 DCT 블록의 (u,v) 위치에 대응하는 (i,j) 위치에서의 화소값이다.Where X (u, v) corresponds to the value of the transform coefficient corresponding to the (u, v) position in the DCT block, and x (i, j) corresponds to the (u, v) position of the DCT block in the restored unit block Pixel value at position (i, j).
본 발명에 따른 영상 복원 장치의 압축 영상 입력부(110)는 역 양자화 및 역 DCT가 수행되기 이전의 DCT 블록을 입력받음으로써 원본 영상의 압축 영역에 대하여 이하의 복원 과정을 수행한다.The compressed
블록 분해부(120)는 DCT 블록을 사전에 설정된 변환 매트릭스에 의해 분해하여 DCT 블록을 구성하는 변환 계수들의 주파수 분포와 동일한 주파수 분포를 가지는 복수의 서브 블록을 생성한다.The
DCT 블록 간의 공간적인 관계를 1차원으로 설명하기 위해 {x(i)}(i=0,1,…,MN-1)를 길이가 MN인 시퀀스(sequence)라 한다. 이러한 시퀀스는 각각 N개의 데이터를 포함하는 M개의 블록(또는 서브시퀀스)으로 나누어질 수 있다. 블록 DCT 공간에서는 N-포인트 DCT가 각각의 블록에 적용될 수 있다. 따라서 p번째 DCT 블록에 대한 N-포인트 DCT는 다음의 수학식 3과 같이 표현된다.In order to explain the spatial relationship between DCT blocks in one dimension, {x (i)} (i = 0, 1, ..., MN-1) is referred to as a sequence having a length MN. This sequence may be divided into M blocks (or subsequences) each containing N data. In the block DCT space, an N-point DCT may be applied to each block. Therefore, the N-point DCT for the p-th DCT block is expressed by
여기서, Cp(u)는 M개의 블록 중에서 p번째 블록의 u번째 데이터에 대한 N-포인트 DCT에 의해 얻어진 변환계수, N은 p번째 블록에 포함된 데이터의 개수이고, c(u)는 수학식 1에서와 동일하게 결정되는 값이다.Here, C p (u) is a transform coefficient obtained by the N-point DCT of the u-th data of the p-th block among the M blocks, N is the number of data contained in the p-th block, c (u) is mathematics The value is determined in the same manner as in
한편, 시퀀스 x(i)에 대한 MN-포인트 DCT는 다음의 수학식 4와 같이 표현된다.On the other hand, the MN-point DCT for the sequence x (i) is expressed by the following equation (4).
여기서, C(u)는 MN개의 데이터 중에서 u번째 데이터에 대한 MN-포인트 DCT에 의해 얻어진 변환계수이다.Here, C (u) is a conversion coefficient obtained by the MN-point DCT for the u-th data among the MN pieces of data.
수학식 3과 같이 표현된 블록 DCT 변환은 MN개의 기저 벡터의 집합에 의한 시퀀스 {x(i)}의 직교정규(orthonormal) 확장이며, MN개의 기저 벡터는 각각 N-포인트 DCT의 기저 벡터로부터 얻어진다. 따라서 N-포인트 DCT 변환계수로 이루어진 M개의 블록들은 역변환 가능한(invertible) 선형 변환에 의해 MN-포인트 DCT 변환계수로 변환할 수 있다. 다시 말하면, N-포인트 DCT 블록들의 시퀀스인 {Ck (N)}(k=0,1,…M-1)과 그에 대응하는 MN-포인트 DCT의 합성 DCT C( MN )에 대해 MN×MN 크기의 변환 매트릭스 A (M,N)이 존재한다. 이는 다음 수학식 5와 같이 표현된다.The block DCT transform represented by
이와 같은 1차원에서의 분석은 2차원으로 확장될 수 있다. 즉, DCT 블록 C ( LN ×MN)를 각각 N×N의 크기를 가지는 L×M 개의 DCT 블록들로 분해할 경우 다음의 수학식 6이 사용된다.Such analysis in one dimension can be extended in two dimensions. That is, when the DCT block C ( LN × MN) is decomposed into L × M DCT blocks each having a size of N × N,
DCT 블록의 분해를 위해 사용되는 변환 매트릭스는 다음과 같이 주어질 수 있다.The transformation matrix used for decomposition of the DCT block may be given as follows.
변환 매트릭스와 그의 역 매트릭스는 희소(sparse) 매트릭스이다. 따라서 일반적인 매트릭스 곱셈에 요구되는 것보다 적은 수의 곱셈과 덧셈만을 수행하면 된다.The transformation matrix and its inverse matrix are sparse matrices. Therefore, you only need to do fewer multiplications and additions than required for normal matrix multiplication.
이상에서 설명한 것과 같은 방법에 의해 블록 분해부(120)는 DCT 블록들을 각각 복수의 서브 블록으로 분해할 수 있다. 압축 영상 입력부(110)가 입력받은 DCT 블록들 중에서 ω번째 DCT 블록을 라 하면, DCT 블록이 8×8 크기이므로 는 4×4 크기의 네 개의 서브 블록들로 분해된다. ω번째 DCT 블록으로부터 생성된 네 개의 서브 블록은 각각 , , , 이며, 간단하게 (p,q=0,1)와 같이 표현할 수 있다.By the same method as described above, the
하나의 DCT 블록으로부터 생성되는 네 개의 서브 블록은 DCT 블록 분해를 정의하는 수학식 6을 이용하여 다음 수학식 7과 같이 얻어진다.Four sub-blocks generated from one DCT block are obtained as shown in
여기서, 매트릭스 A(2,4)는 앞에서 정의한 것과 동일하다.Here, matrix A (2, 4) is the same as defined above.
이때 서브 블록의 크기를 더 작게 하여 하나의 DCT 블록으로부터 더 많은 개수의 서브 블록이 생성되도록 할 수도 있으나, 큰 에지 주변의 블록 현상을 적절히 제거하면서도 원본 영상의 화질을 개선하기 위해서는 4×4 크기로 하는 것이 가장 바람직하다.In this case, the size of the subblock may be made smaller so that a larger number of subblocks can be generated from one DCT block. Most preferably.
다음으로 밝기 정보 개선부(130)는 서브 블록을 구성하는 변환 계수들 중에서 DC 성분에 해당하는 변환 계수의 값을 비선형 함수인 제1변형함수에 의해 변형하여 원본 영상의 어두운 영역 및 밝은 영역에서의 밝기 정보를 개선한다. 이러한 과정은 하나의 DCT 블록으로부터 생성된 복수의 서브 블록에 대해 순차적으로 수행된다.Next, the brightness
원본 영상이 생성될 때 사용된 광원의 방향 또는 세기 등에 의해 원본 영상에는 아주 밝은 영역 또는 아주 어두운 영역이 나타날 수 있으며, 이러한 영역들에 포함된 객체는 그 형태를 알아보기 힘들 정도로 디테일 정보가 손실되어 있다. 밝기 정보 개선부(130)는 이와 같이 원본 영상에서 아주 어두운 영역 및 아주 밝은 영역에 포함된 디테일 정보를 복원하여 밝기 정보를 개선하고자 하는 것이다. 이러 한 과정은 레티넥스(Retinex) 이론을 바탕으로 한다.Due to the direction or intensity of the light source used when the original image is generated, very bright areas or very dark areas may appear in the original image, and the objects included in these areas lose detail information so that their shape is difficult to recognize. have. The brightness
레티넥스 이론은 영상의 조도(illumination) 성분과 반사율(reflectance) 성분을 분리하고, 이들 성분을 변경하여 질감 디테일(texture detail)의 가시성(visibility)을 증가시킨다. 그와 유사하게 본 발명에서는 영상의 휘도(luminance) 데이터를 밝기와 디테일 성분의 조합으로 구성한다. 조도 성분은 밝기에 밀접하게 연관되고 반사율 성분은 영상의 디테일에 기여하기 때문이다. 이를 수학적으로 표현하면 영상의 각 화소 x(i,j)는 밝기 b(i,j)와 디테일 d(i,j)의 점 대 점의 합산으로 다음의 수학식 8과 같이 나타낼 수 있다.Retinex theory separates the illumination and reflectance components of an image and alters these components to increase the visibility of texture detail. Similarly, in the present invention, luminance data of an image is composed of a combination of brightness and detail components. This is because the illuminance component is closely related to the brightness and the reflectance component contributes to the detail of the image. In mathematical terms, each pixel x (i, j) of the image may be expressed as
다음으로 밝기 성분과 디테일 성분의 값은 영상의 동적 영역과 디테일을 위해 조절된다. 구체적으로, 밝기 성분은 DCT 변환 계수의 DC 성분을 이용하여 와 같이 추정된다. 밝기는 영상 전체에 걸쳐 부드럽게 변화한다고 가정하기 때문이다. 반면 DCT 변환 계수의 AC 성분은 영상의 디테일 정보로 표현될 수 있다. 다음으로 디테일 성분의 추정인 는 입력된 휘도 성분인 x(i,j)와 추정된 밝기 성분인 사이의 차에 의해 결정된다.Next, the values of the brightness and detail components are adjusted for the dynamic range and detail of the image. Specifically, the brightness component using the DC component of the DCT conversion coefficient It is estimated as This is because the brightness changes smoothly throughout the image. On the other hand, the AC component of the DCT transform coefficient may be represented as detail information of an image. Next, an estimate of the detail component Is an input luminance component x (i, j) and an estimated luminance component It is determined by the difference between.
추정된 밝기 성분인 는 다음으로 동적 영역 압축, 즉 밝기 정보 개선을 위해 비선형 함수인 G(·)에 의해 변형된다. 그러나 동적 영역 압축만을 기초로 한 영상 복원은 대비가 낮은 장면과 같이 원하지 않는 결과를 초래할 수 있다. 이 러한 문제를 해결하기 위한 것이 영상의 디테일 정보 개선이다. 영상의 대비 개선을 위한 디테일 정보 개선은 추정된 디테일 성분인 에 대해 또 다른 비선형 함수인 F(·)를 적용함으로써 수행된다. 최종적으로 결과 영상 O(i,j)는 변형된 밝기 성분과 개선된 디테일 성분의 합으로 다음의 수학식 9와 같이 얻어진다.The estimated brightness component Is then transformed by a nonlinear function, G (·), for dynamic domain compression, i.e. brightness information improvement. However, image reconstruction based only on dynamic region compression can have undesirable consequences, such as low contrast scenes. The solution to this problem is to improve the detail information of the image. Detail information enhancement to improve the contrast of the image This is done by applying another nonlinear function, F (·), to. Finally, the resultant image O (i, j) is obtained as shown in
얻어진 결과 영상은 입력 영상에 동적 영역 압축 및 디테일 정보 개선이 수행되어 개선된 결과를 나타낸다.The obtained result image is improved by performing dynamic region compression and detail information on the input image.
이상에서 검토한 바와 같이 주파수 영역에서의 영상 품질 개선은 영상의 DC 성분 및 AC 성분에 대해 서로 별개로 수행된다. 이러한 과정은 본 발명에도 동일하게 적용된다. 즉, 본 발명에서는 DCT 블록을 분해하여 얻어진 서브 블록들 각각을 구성하는 변환 계수들을 DC 성분 및 AC 성분으로 나누고, 각각의 성분에 대해 서로 다른 과정을 수행함으로써 원본 영상의 품질을 개선하게 된다.As discussed above, image quality improvement in the frequency domain is performed separately for the DC component and the AC component of the image. This process applies equally to the present invention. That is, the present invention improves the quality of the original image by dividing transform coefficients constituting each of the sub-blocks obtained by decomposing the DCT block into DC and AC components, and performing different processes on the respective components.
먼저 밝기 정보 개선부(130)는 각각의 서브 블록을 구성하는 변환 계수들 중에서 DC 성분에 해당하는 변환 계수에 G(·)와 같은 비선형 함수를 적용하여 원본 영상의 밝기 정보를 개선한다.First, the brightness
블록 분해부(120)에 의해 DCT 블록이 분해되어 생성된 4×4 크기의 서브 블록은 각각 16개의 변환 계수를 포함하고 있다. 앞에서 도 2를 참조하여 설명한 바와 같이 하나의 DCT 블록을 구성하는 64개의 변환 계수들은 모두 14개의 주파수 밴 드로 분류될 수 있었다. 이를 서브 블록에 대해 적용하면, 서브 블록을 구성하는 16개의 변환 계수들은 공간 주파수 특성에 따라 7개의 주파수 밴드로 분류된다.The 4 × 4 subblocks generated by the DCT block decomposition by the
도 3은 7개의 주파수 밴드로 분류되는 서브 블록의 형태를 도시한 도면이다. 변환 계수들은 도 2에서와 마찬가지로 좌측 상단에서 우측 하단으로 갈수록 공간 주파수가 증가하는 순서로 배열되며, 도 3에 표시된 대각 방향의 직선이 통과하는 위치의 변환 계수들은 동일한 주파수 밴드에 포함된다. 숫자는 주파수 밴드의 번호를 나타낸 것이다. 7개의 주파수 밴드의 집합은 다음의 수학식 10과 같이 나타낼 수 있다.3 is a diagram illustrating a form of a sub block classified into seven frequency bands. The conversion coefficients are arranged in the order of increasing spatial frequency from the upper left to the lower right as in FIG. 2, and the transform coefficients at positions through which the diagonal lines shown in FIG. 3 pass are included in the same frequency band. The numbers represent the number of frequency bands. The set of seven frequency bands may be represented by
여기서, φn은 n개의 주파수 밴드로 이루어진 집합이고, ψn은 n번째 주파수 밴드이다.Here, φ n is a set consisting of n frequency bands, and ψ n is an nth frequency band.
또한, 각각의 주파수 밴드 ψn은 서브 블록을 구성하는 변환 계수인 (n=u+v)의 집합으로, 다음 수학식 11과 같이 표현된다. 또한 동일한 주파수 밴드에 포함된 DCT 변환 계수들은 유사한 공간 주파수 특성을 가진다.In addition, each frequency band ψ n is a transform coefficient constituting the subblock. A set of (n = u + v), which is represented by the following equation (11). In addition, DCT transform coefficients included in the same frequency band have similar spatial frequency characteristics.
밝기 정보 개선부(130)에 의해 값이 변형되는 DC 성분의 변환 계수는 이 중 에서 n=0에 해당하는 주파수 밴드에 포함된 한 개의 변환 계수, 즉 이다.The transform coefficient of the DC component whose value is modified by the brightness
밝기 정보 개선부(130)에 의한 원본 영상의 밝기 정보 개선은 원본 영상에서 어두운 영역 및 밝은 영역에 포함된 객체의 디테일 정보를 명확하게 나타내기 위한것이다. 즉, 밝기 정보 개선을 통해 원본 영상의 동적 영역(dynamic range)을 압축할 수 있다.The improvement of the brightness information of the original image by the brightness
동적 영역 압축의 목적은 신호의 자연스러운 동적 영역을 더 작은 영역으로 매핑하는 것이다. 이는 영상의 지역 밝기를 변형함으로써 이루어질 수 있다. 앞에서 설명한 바와 같이 영상의 밝기는 영상 전체에 걸쳐 부드럽게 변화하며, 따라서 압축 영상에서 각각의 블록의 평균값인 DC 성분은 지역 밝기 를 나타내는 것으로 볼 수 있다. 동적 영역을 압축하기 위해 본 발명에서는 영상의 DC 성분의 값을 조절하고 압축된 입력 영상에서 가장 어두운 부분 및 가장 밝은 부분의 세부정보를 개선한다.The purpose of dynamic region compression is to map the natural dynamic region of the signal into smaller regions. This can be done by modifying the local brightness of the image. As mentioned earlier, the brightness of the image changes smoothly throughout the image, so the DC component, the average of each block in the compressed image, is local brightness. It can be seen as representing. In order to compress the dynamic region, the present invention adjusts the value of the DC component of the image and improves the details of the darkest part and the brightest part of the compressed input image.
본 발명에서 원본 영상의 밝기 개선을 위해 사용되는 단위인 4×4 크기의 서브 블록의 평균값 m은 과 같이 산출된다. 여기서 은 하나의 DCT 블록으로부터 생성된 서브 블록들 중 pq번째 서브 블록의 DC 성분의 값이다. 다음으로 지역 밝기 는 영상의 어두운 영역에서 비선형 함수를 적용하여 로 변형되는데, 이는 다음의 수학식 14와 같이 표현된다.In the present invention, the average value m of 4 × 4 subblocks, which is a unit used to improve the brightness of the original image, is It is calculated as here Is the value of the DC component of the pq-th subblock among subblocks generated from one DCT block. Next, local brightness Applies a nonlinear function in the dark areas of the image Is transformed into
여기서, Imax는 원본 영상의 최대 밝기값(예를 들면, 8비트 입력 영상에 대해서는 255)이고, γ는 영상의 개선 정도를 조절하기 위해 사용자에 의해 결정되어 입력되는 조절값이다. 실험적으로, 영상의 가장 어두운 영역 및 가장 밝은 영역의 세부정보를 개선하기 위해서는 γ>1로 설정되는 것이 바람직하다.Here, I max is the maximum brightness value of the original image (for example, 255 for the 8-bit input image), and γ is an adjustment value determined and input by the user to adjust the degree of improvement of the image. Experimentally, in order to improve the details of the darkest and brightest areas of the image, it is preferable to set γ> 1.
도 4는 γ의 값이 서로 다르게 설정되었을 때 입력값과 출력값의 관계를 도시한 그래프이다. 도 4를 참조하면, γ가 1일 때에는 입력값과 출력값이 동일하게 나타나며, γ의 값이 커질수록 낮은 입력값은 높은 출력값으로, 높은 입력값은 낮은 출력값으로 변환된다. 즉, γ의 값이 커지면 밝기 성분의 개선 정도가 더 커진다는 것을 의미한다. 이와 같이 밝기 성분의 개선 정도를 참고하여 γ의 값을 적절한 값으로 설정할 수 있다.4 is a graph showing a relationship between an input value and an output value when the value of γ is set differently. Referring to FIG. 4, when γ is 1, the input value and the output value are the same, and as the value of γ increases, the low input value is converted into a high output value, and the high input value is converted into a low output value. In other words, the larger the value of γ, the greater the degree of improvement of the brightness component. In this way, the value of gamma may be set to an appropriate value with reference to the degree of improvement of the brightness component.
원본 영상의 어두운 영역에 대해 밝기 정보가 개선된 영상은 다음의 수학식 13과 같이 표현할 수 있다.An image in which brightness information is improved for a dark region of an original image may be expressed as in
여기서, Od(i,j)는 어두운 영역에서 밝기 정보가 개선된 영상이고, Qpq(0,0) 은 pq번째 서브 블록의 DC 성분 에 적용되는 양자화 매개변수이다.Here, O d (i, j) is an image in which brightness information is improved in a dark region, and Q pq (0, 0) is a DC component of the pq-th subblock. Quantization parameter applied to.
어두운 영역에서의 밝기 정보를 개선함으로써 영상의 조도 성분이 정규화된다. 밝은 영역에 대한 밝기 정보 개선은 어두운 영역에서와 유사하게 다음의 수학식 14에 의해 이루어진다.The luminance component of the image is normalized by improving the brightness information in the dark area. Improvement of the brightness information for the bright area is made by the following equation (14), similarly to the dark area.
여기서, Ob(i,j)는 밝은 영역에서의 밝기 정보가 개선된 영상이다. 수학식 14는 입력 영상의 역 영상(inverse image)에 대해 수학식 13과 유사한 과정을 적용하여 밝은 영역의 세부정보를 개선하는 것을 나타낸다. 구체적으로, 주어진 매핑 곡선 을 사용하여 밝은 영역을 개선하기 위해, 밝기값을 반전시키고 강조한다. 다음으로, 변형된 값은 최대 밝기값인 Imax로부터 차감되어 밝은 영역으로 다시 변환된 후 압축된다.Here, O b (i, j) is an image in which brightness information in a bright area is improved.
어두운 영역과 밝은 영역 모두에서 밝기 정보가 개선되는 경우에는 수학식 13과 수학식 14가 합쳐져 다음의 수학식 15와 같이 각각의 서브 블록에서 DC 성분에 해당하는 변환 계수의 값이 변형된 영상이 얻어진다.When the brightness information is improved in both the dark and the bright areas,
여기서, Q-1[·]은 역 양자화 과정을 나타낸 것이고, 은 각 서브 블록의 DC 성분에 대해 이상에서 설명한 것과 같은 밝기 정보 개선 과정을 적용하여 얻어진 변형된 DC 성분을 나타낸 것이다.Where Q −1 [·] represents the inverse quantization process, Denotes a modified DC component obtained by applying the brightness information improvement process as described above with respect to the DC component of each sub-block.
한편, 밝기 정보의 개선 정도를 조절하기 위해 입력되는 값인 γ의 값은 서브 블록에 포함된 컨텐츠, 즉 고주파 성분의 양에 따라 적응적으로 조절할 수 있다. γ의 값을 조절함으로써 영상의 복원 과정 후에 큰 에지에 걸쳐서 나타나는 블록 현상과 오버슈팅(overshooting) 현상을 줄일 수 있다. 압축 영상 입력부(110)로 입력된 DCT 블록들 중 ω번째 DCT 블록의 pq번째 서브 블록에 대한 개선값(enhancement value)은 다음 수학식 16에 의해 산출된다.On the other hand, the value of γ, which is an input value for adjusting the degree of improvement of the brightness information, may be adaptively adjusted according to the content included in the subblock, that is, the amount of high frequency components. By adjusting the value of γ, it is possible to reduce block phenomenon and overshooting phenomenon appearing over a large edge after the image reconstruction process. An enhancement value of the pq-th subblock of the ω-th DCT block among the DCT blocks input to the compressed
여기서, γ는 사용자로부터 입력받은 값이고, 는 pq번째 서브 블록에 포함된 고주파 성분의 양을 나타내는 표준편차 값이다. 의 값은 서브 블록을 분석하고 큰 에지 주변의 블록 현상을 감소시키기 위해 사용된다.Here, γ is a value input from the user, Is a standard deviation value representing the amount of high frequency components included in the pq-th subblock. The value of is used to analyze the subblock and reduce the block phenomenon around the large edge.
수학식 16에서 의 값은 ω번째 DCT 블록 내의 pq번째 서브 블록에 대한 분산 으로부터 얻어지며, 은 다음의 수학식 17에 의해 산출된다.In equation (16) Is the variance for the pqth subblock in the ωth DCT block Obtained from Is calculated by the following equation (17).
이와 같이 서브 블록의 분산은 서브 블록을 구성하는 변환 계수들 중 AC 성분에 해당하는 변환 계수들을 이용하여 직접 산출할 수 있다.As such, the variance of the subblock may be directly calculated by using transform coefficients corresponding to an AC component among the transform coefficients constituting the subblock.
또한 수학식 16에 포함된 함수 f(·)는 어떤 상태에서 다른 상태로 부드럽게 전환하도록 하는 가중 함수에 해당하며, 사다리꼴 형태의 응답을 가진다. 가중 함수 f(·)는 다음의 수학식 18과 같이 정의된다.In addition, the function f (·) included in Equation 16 corresponds to a weighting function for smoothly transitioning from one state to another, and has a trapezoidal response. The weight function f (·) is defined as in Equation 18 below.
여기서, 다른 상태로의 전환을 나타내는 기준값들인 τx는 실험적으로 결정되며, 적은 디테일 정보를 포함하는 서브 블록들 및 서브 블록에 포함된 노이즈 성분을 처리할 수 있는 값으로 설정된다.Here, τ x , which are reference values indicating transition to another state, is determined experimentally, and is set to a value capable of processing sub-blocks containing less detail information and noise components included in the sub-block.
밝기 정보 개선부(130)는 사용자로부터 입력된 γ의 값을 기초로 수학식 16에 의해 각각의 서브 블록에 대해 개별적으로 결정된 개선값 을 사용하여 낮은 주파수 밴드에 포함된 강한 에지에 영향을 주지 않고 높은 주파수 밴드 내의 디테일 정보를 적응적으로 개선할 수 있다.The brightness
그런데 는 각각의 서브 블록의 컨텐츠 구성에 의해 개별적으로 결정되는 것으로, 이웃하는 서브 블록들을 고려하지 않으므로 블록 현상을 오히려 심화시킬 우려가 있다. 이를 해결하기 위해 의 값은 입력 영상에서 네 개의 이웃하는 서브 블록들을 기초로 스무딩될 수 있다. 도 5에는 개선값의 스무딩을 위해 사용되는 이웃 서브 블록들의 예가 도시되어 있다.By the way Since is determined individually by the content configuration of each sub-block, since neighboring sub-blocks are not taken into consideration, there is a concern that the block phenomenon will be deepened. To solve this The value of may be smoothed based on four neighboring subblocks in the input image. 5 shows an example of neighboring subblocks used for smoothing the improvement value.
현재 서브 블록 및 그와 이웃하는 네 개의 서브 블록들의 현재 개선값들의 집합을 라 한다. 그리고 이웃하는 네 개의 서브 블록들을 참조하여 현재 서브 블록의 개선값을 스무딩시켜 얻어진 평균 개선값은 다음의 수학식 19에 의해 얻어진다.The current set of improvement values of the current subblock and its four neighboring subblocks It is called. The average improvement value obtained by smoothing the improvement value of the current sub block with reference to four neighboring sub blocks is obtained by the following equation (19).
여기서, 는 ω번째 DCT 블록의 pq번째 서브 블록에 대한 평균 개선값, 11×5는 1×5 크기의 모든 원소가 1인 매트릭스, 그리고 는 집합 에 포함된 원소들, 즉 서브 블록들의 개수이다.here, Is the mean improvement value for the pq-th subblock of the ωth DCT block, 1 1 × 5 is a matrix of all elements of
밝기 정보 개선부(130)는 이상에서 설명한 바와 같이 복수의 서브 블록 각각에 대하여 DC 성분에 해당하는 변환 계수를 변형시킴으로써 원본 영상의 밝기 정보를 개선하여 원본 영상의 밝은 영역 및 어두운 영역에서 객체의 디테일 정보를 명확하게 할 수 있다.As described above, the brightness
디테일 정보 개선부(140)는 서브 블록을 구성하는 변환 계수들 중에서 AC 성분에 해당하는 변환 계수의 값을 비선형 함수인 제2변환함수에 의해 변형하여 원본 영상에 포함된 디테일 정보를 개선한다. 디테일 정보 개선은 DCT 블록이 분해되어 생성된 복수의 서브 블록에 대해 순차적으로 수행되며, 밝기 정보 개선부(130)에 의한 DC 성분의 변형 과정이 수행된 후에 이루어질 수 있다.The detail
디테일 정보 개선부(140)에 의한 변형의 대상이 되는 변환 계수들은 앞에서 설명한 서브 블록의 7개의 주파수 밴드들 중에서 n=0인 주파수 밴드를 제외한 나머지 주파수 밴드들을 구성하는 변환 계수이며, 각각의 변환 계수에는 F(·)와 같은 비선형 함수가 적용된다.The transform coefficients to be transformed by the detail
먼저 각각의 주파수 밴드에 포함된 변환 계수들의 개수는 다음의 수학식 20과 같이 표현할 수 있다.First, the number of transform coefficients included in each frequency band may be expressed as in Equation 20 below.
여기서, N(ψn)은 n번째 주파수 밴드에 포함된 변환 계수의 개수이다.Here, N (ψ n ) is the number of transform coefficients included in the n th frequency band.
원본 영상으로부터 생성된 ω번째 DCT 블록의 pq번째 서브 블록 내에서 n번째 주파수 밴드에 대한 스펙트럴 컨텐츠(spectral content)는 n번째 주파수 밴드에 이전 주파수 밴드들에 비해 얼마나 많은 고주파 성분이 포함되어 있는지를 나타낸다. n번째 주파수 밴드에 대한 스펙트럴 컨텐츠 값은 변환 계수들로 이루어진 주파수 밴드들의 낮은 스펙트럴 컨텐츠 에너지에 대한 높은 스펙트럴 컨텐츠 에너지의 비에 의해 정의되며, 다음의 수학식 21에 의해 산출된다.The spectral content for the nth frequency band in the pqth subblock of the ωth DCT block generated from the original image indicates how many high frequency components are included in the nth frequency band compared to the previous frequency bands. Indicates. The spectral content value for the n th frequency band is defined by the ratio of the high spectral content energy to the low spectral content energy of the frequency bands of the transform coefficients, which is calculated by Equation 21 below.
여기서, 는 ω번째 DCT 블록의 pq번째 서브 블록 내에서 n번째 주파수 밴드에 대한 스펙트럴 컨텐츠 값이고, ||·||F 2는 프로베니우스 놈(Frobenius norm)의 제곱이다. 수학식 21의 우변에서 분자는 n번째 주파수 밴드의 평균 에너지를 나타내며, 분모는 n번째 밴드보다 주파수가 낮은 주파수 밴드들의 평균 에너지를 나타낸다.here, Is the spectral content value for the nth frequency band in the pqth subblock of the ωth DCT block, and || · || F 2 is the square of Frobenius norm. On the right side of Equation 21, the numerator represents the average energy of the n th frequency band, and the denominator represents the average energy of the frequency bands lower than the n th band.
이러한 스펙트럴 컨텐츠 값은 원본 영상의 디테일 정보 개선을 위해 변형된다. 스펙트럴 컨텐츠 값의 변형을 위해서는 각각의 서브 블록에 따라 서로 다른 값으로 적용되는 개선 인자(enhancement factor)가 사용된다.This spectral content value is modified to improve detail information of the original image. In order to change the spectral content value, an enhancement factor is applied to different values according to each subblock.
pq번째 서브 블록에 대한 개선 인자(enhancement factor) λpq는 pq번째 서브 블록에서 변형 전의 DC 성분의 변환 계수 값에 대한 변형된 DC 성분의 변환 계수 값의 비를 사용하여 다음의 수학식 22와 같이 나타낼 수 있다.The enhancement factor λ pq for the pq-th subblock is expressed by Equation 22 using the ratio of the transform coefficient value of the transformed DC component to the transform coefficient value of the DC component before transformation in the pq-th subblock. Can be represented.
여기서, δ=0.01은 의 값이 0인 경우를 대비하여 사용되는 값이다.Where δ = 0.01 This value is used in case the value of is 0.
원본 영상의 디테일 정보 개선, 즉 대비 개선은 먼저 앞에서 설명한 스펙트 럴 컨텐츠 값의 개선 인자에 의한 변형으로 설명할 수 있다. ω번째 DCT 블록의 pq번째 서브 블록에서 n번째 주파수 밴드에 대한 변형된 스펙트럴 컨텐츠 값은 다음의 수학식 23과 같이 정의된다.The improvement of detail information of the original image, that is, the improvement of contrast, may be described as a modification by the improvement factor of the spectral content value described above. The modified spectral content value for the nth frequency band in the pqth subblock of the ωth DCT block is defined as in Equation 23 below.
여기서, n=0인 주파수 밴드는 DC 성분을 나타내는 것이므로 n의 범위는 1 이상이 된다.Here, the frequency band where n = 0 represents a DC component, so the range of n is 1 or more.
스펙트럴 컨텐츠 의 값은 수학식 21에 의해 산출되므로 수학식 21을 수학식 23에 대입하고 정리하면 다음의 수학식 24와 같이 표현된다.Spectral Content Since the value of is calculated by Equation 21, substituting Equation 21 into Equation 23 and arranging it is expressed as Equation 24 below.
여기서, 개선된 AC 성분의 에너지 비인 는 다음의 수학식 25와 같이 정의된다.Where the energy ratio of the improved AC component is Is defined as in Equation 25 below.
에너지 비 의 값은 변형 전의 서브 블록과 AC 성분에 해당하는 변환 계수의 값이 변형된 서브 블록에서 n번째 주파수 밴드보다 낮은 주파수의 주파수 밴드들 전체에 대해 산출된 에너지의 합의 비이다.Energy rain Is a ratio of the sum of energy calculated for all frequency bands of frequencies lower than the nth frequency band in the subblock before transformation and the subblock in which the value of the transform coefficient corresponding to the AC component is modified.
최종적으로, 디테일 정보가 개선된 DCT 변환 계수의 값은 다음의 수학식 26에 의해 산출된다.Finally, the value of the DCT transform coefficient with improved detail information is calculated by the following equation (26).
여기서, 는 pq번째 서브 블록에서 (u,v)의 위치에 해당하는 변형된 변환 계수의 값, 는 ω번째 DCT 블록의 pq번째 서브 블록에서 n(=u+v)번째 주파수 밴드에 적용되는 개선 인자의 값, 는 ω번째 DCT 블록의 pq번째 서브 블록에서 n(=u+v)번째 주파수 밴드에 대한 에너지 비, 그리고 는 ω번째 DCT 블록으로부터 얻어진 pq번째 서브 블록에서 (u,v)의 위치에 해당하는 변형 전 변환 계수의 값이다.here, Is the value of the transformed transform coefficient corresponding to the position of (u, v) in the pq-th subblock, Is the value of the enhancement factor applied to the n (= u + v) th frequency band in the pqth subblock of the ωth DCT block, Is the energy ratio for the n (= u + v) th frequency band in the pqth subblock of the ωth DCT block, and Is the value of the transform coefficient before transformation corresponding to the position of (u, v) in the pq-th subblock obtained from the ω-th DCT block.
수학식 26에서 에너지 비 는 4×4 크기의 서브 블록에 대한 것으로, 8×8 크기의 DCT 블록에 적용되는 경우에 비해 중요도가 크지 않다. 서브 블록의 크기가 작으므로 각 주파수 밴드에 포함된 고주파 성분의 변화가 거의 없다고 볼 수 있기 때문이다. 따라서 의 값을 1로 근사화시키면 수학식 26은 다음 수학식 27과 같이 간소화된다.Energy ratio in (26) Is for a 4 × 4 subblock, which is not as important as the case where it is applied to an 8 × 8 DCT block. This is because the size of the subblock is small, so that there is little change in the high frequency components included in each frequency band. therefore When the value of is approximated to 1, Equation 26 is simplified as in Equation 27 below.
즉, 에너지 비의 근사화에 의해 디테일 정보의 개선 과정을 간소화시키면, 각 서브 블록에서 AC 성분에 해당하는 변환 계수에 해당 서브 블록의 밝기 정보의 개선 정도를 나타내는 개선 인자를 곱하여 변환 계수의 값을 변형할 수 있다.That is, if the improvement process of the detail information is simplified by approximating the energy ratio, the transform coefficient value is modified by multiplying the transform coefficient corresponding to the AC component in each sub block by an improvement factor indicating the degree of improvement of the brightness information of the corresponding sub block. can do.
한편, 에너지 비 의 값은 서브 블록 내에서 AC 성분에 해당하는 변환 계수의 변형 과정을 종료시키는 기준으로 사용될 수도 있다. 즉, 디테일 정보 개선부(140)는 현재 서브 블록에서 AC 성분에 해당하는 변환 계수의 변형 과정을 수행할 주파수 밴드가 n=4 이상이고 (n=u+v)이면 현재 서브 블록에 대한 디테일 정보 개선 과정을 종료할 수 있다. 고주파 성분에 해당하는 주파수 밴드일수록 디테일 정보의 개선 효과가 크지 않으며, 에너지 비가 이전 주파수 밴드에서 산출된 값과 동일하다면 변환 계수의 값을 변형하여도 개선 전의 영상과 차이가 없기 때문에 계산량을 감소시키기 위해서이다.Meanwhile, energy rain The value of may be used as a criterion for terminating the transformation process of the transform coefficient corresponding to the AC component in the subblock. That is, the detail
이상에서 설명한 밝기 정보 개선 과정 및 디테일 정보 개선 과정에 의해 변형된 DCT 변환 계수들로 이루어진 복수의 서브 블록은 수학식 7에서 설명한 DCT 블록 분해 과정을 역으로 적용하여 하나의 DCT 블록으로 재구성됨으로써 영상 개선 과정이 종료된다.The plurality of sub-blocks composed of the DCT transform coefficients modified by the brightness information improvement process and the detail information improvement process described above are reconstructed into one DCT block by applying the DCT block decomposition process described in
그러나 변형된 변환 계수의 값이 변형 전 변환 계수의 값에 비해 지나치게 크게 달라지는 경우에는 원본 영상의 과도한 개선으로 인해 링잉(ringing) 현상이나 블록 현상과 같은 부작용이 에지 주변에서 발생할 수 있다. 따라서 변형된 변환 계수의 값에 제약조건을 적용하여 일정 범위를 벗어나지 않도록 하는 것이 바람직하다. 변환 계수에 대한 제약조건의 적용은 다음의 수학식 28에 의해 수행된다.However, if the value of the transformed transform coefficient is too large compared to the value of the transform coefficient before deformation, side effects such as ringing or block phenomenon may occur around the edge due to excessive improvement of the original image. Therefore, it is desirable to apply a constraint to the value of the transformed transform coefficient so as not to be out of a certain range. Application of the constraint on the transform coefficient is performed by the following equation (28).
여기서, 는 제약조건이 적용된 변환 계수, 는 변형된 변환 계수이고, 제약조건에 해당하는 및 의 값은here, Is a transform coefficient with constraints, Is the transformed transform coefficient, which corresponds to the constraint And The value of
와 같이 정의된다. Is defined as:
α 및 β의 값은 실험적으로 결정되며, α=β=5로 설정되었을 때 가장 바람직한 결과를 얻을 수 있다.The values of α and β are determined experimentally and the most desirable results can be obtained when α = β = 5.
블록 재구성부(150)는 DCT 블록들로부터 생성된 모든 서브 블록에 대하여 변환 계수들의 값이 변형되면, 변형된 값의 변환 계수들로 이루어진 서브 블록들에 대해 변환 매트릭스의 역 매트릭스를 적용하여 변형 DCT 블록으로 재구성한다.When the values of transform coefficients are transformed for all subblocks generated from DCT blocks, the
수학식 28과 같이 제약조건이 적용된 변환 계수들을 포함하는 서브 블록들은 8×8 크기의 변형 DCT 블록으로 재구성되며, 이는 수학식 7을 역으로 적용함으로써 수행될 수 있다. 즉, 네 개의 서브 블록으로부터 하나의 변형 DCT 블록을 생성하는 과정은 다음의 수학식 29로 표현된다.Subblocks including the transform coefficients to which constraints are applied, such as Equation 28, are reconstructed into 8 × 8 transform DCT blocks, which may be performed by applying
여기서 A(2,4)는 앞에서 정의된 것과 동일한 매트릭스이다.Where A (2,4) is the same matrix as defined above.
이와 같이 얻어진 변형 DCT 블록에 대해 큰 에지 주변의 링잉 현상과 모스키토 잡음(mosquito noise)과 같은 디테일 정보 개선의 부작용 현상을 제거하기 위해 추가적인 과정이 더 이루어질 수 있다. 이는 입력된 DCT 블록에서 변환 계수 값이 0인 위치에 대응하는 위치의 변형된 변환 계수 값을 0으로 바꾸는 과정이다. 즉, 변형 DCT 블록을 구성하는 변환 계수들 중에서 입력된 DCT 블록에서 0에 해당하는 변환 계수와 동일한 위치의 변환 계수의 값은 0으로 변형된다.For the modified DCT block thus obtained, an additional process may be further performed to eliminate side effects of ringing around a large edge and detail information improvement such as mosquito noise. This is a process of changing the transformed transform coefficient value at the position corresponding to the position where the transform coefficient value is 0 in the input DCT block to 0. That is, the value of the transform coefficient at the same position as the transform coefficient corresponding to 0 in the input DCT block among the transform coefficients constituting the modified DCT block is transformed to 0.
압축 영상 입력부(110)로 입력된 DCT 블록들은 순차적으로 정렬되며, 블록 분해부(120)는 가장 앞서는 DCT 블록으로부터 하나씩 분해하여 해당 DCT 블록에 대응하는 서브 블록들을 생성한다. 이때 블록 분해부(120)는 이전 DCT 블록이 분해되어 밝기 정보 개선부(130) 및 디테일 정보 개선부(140)에 의해 원본 영상의 품질 개선 과정이 수행되고 마지막으로 블록 재구성부(150)에 의해 이전 DCT 블록에 대응하는 변형 DCT 블록이 생성되면 이전 DCT 블록에 뒤따르는 DCT 블록을 분해하게 된다. 즉, 하나의 DCT 블록이 분해되고 그로부터 생성된 서브 블록들에 대해 순차적으로 원본 영상의 밝기 정보 및 디테일 정보를 개선하는 과정이 수행된 후, 변형된 변환 계수들로 이루어진 서브 블록들이 변형 DCT 블록으로 재구성되면 다음 DCT 블록이 분해되어 동일한 과정이 반복되는 것이다.The DCT blocks input to the compressed
최종적으로 모든 DCT 블록에 대응하는 변형 DCT 블록이 생성되면 변형 DCT 블록에 대해 역 양자화 및 역 DCT가 수행되어 다음의 수학식 30으로 표현되는 결과 영상이 얻어진다. 즉, 결과 영상은 원본 영상에서 밝기 성분 및 디테일 성분이 개선된 영상이다.Finally, when a modified DCT block corresponding to all DCT blocks is generated, inverse quantization and inverse DCT are performed on the modified DCT block to obtain a resultant image represented by Equation 30 below. That is, the resultant image is an image in which brightness and detail components are improved in the original image.
도 6은 본 발명에 따른 압축 영역에서의 영상 복원 방법에 대한 바람직한 실시예의 수행과정을 도시한 흐름도이다.6 is a flowchart illustrating a process of performing a preferred embodiment of an image reconstruction method in a compressed region according to the present invention.
도 6을 참조하면, 압축 영상 입력부(110)는 원본 영상이 복수의 단위 블록으로 분할되고 각각의 단위 블록에 이산 코사인 변환(DCT) 및 양자화 변환이 수행되어 생성된 복수의 DCT 블록을 입력받는다(S610). 블록 분해부(120)는 순차적으로 정렬된 DCT 블록들을 사전에 설정된 변환 매트릭스에 의해 하나씩 분해하여 DCT 블록을 구성하는 변환 계수들의 주파수 분포와 동일한 주파수 분포를 가지는 복수의 서브 블록을 생성한다(S620).Referring to FIG. 6, the compressed
밝기 정보 개선부(130)는 서브 블록을 구성하는 변환 계수들 중에서 DC 성분에 해당하는 변환 계수의 값을 비선형 함수인 제1변환함수에 의해 변형하여 원본 영상의 어두운 영역 및 밝은 영역에서의 밝기 정보를 개선한다(S630). 또한 디테일 정보 개선부(140)는 서브 블록을 구성하는 변환 계수들 중에서 AC 성분에 해당하는 변환 계수의 값을 비선형 함수인 제2변환함수에 의해 변형하여 원본 영상에 포함된 디테일 정보를 개선한다(S640). DC 성분 및 AC 성분의 변형 과정은 하나의 DCT 블록으로부터 생성된 복수의 서브 블록에 대해 순차적으로 반복하여 이루어진다.The brightness
블록 재구성부(150)는 DCT 블록으로부터 생성된 모든 서브 블록에 대하여 변 환 계수들의 값이 변형되면(S650) 변형된 변환 계수들로 이루어진 서브 블록들에 대해 변환 매트릭스의 역 매트릭스를 적용하여 변형 DCT 블록으로 재구성한다(S660). 입력받은 복수의 DCT 블록 모두에 대응하는 변형 DCT 블록이 생성되지 않은 경우에는(S670) 블록 분해부(120)가 다음의 DCT 블록을 분해하여 서브 블록들을 생성하며, 앞에서 설명한 과정이 반복된다. 복수의 DCT 블록 모두에 대응하는 변형 DCT 블록이 생성되면(S670) 원본 영상의 품질 개선 과정이 종료되며, 변형 DCT 블록들에 대해 역 양자화 변환 및 역 DCT가 수행되어 원본 영상의 밝기 정보 및 디테일 정보가 개선된 결과 영상이 얻어진다.When the values of the transform coefficients are transformed with respect to all subblocks generated from the DCT block (S650), the
본 발명의 성능을 평가하기 위한 실험을 수행하였다. 실험을 위한 원본 영상으로는 웹상에서 얻을 수 있는 높은 동적 영역의 이미지가 사용되었다. 또한 복수의 실험 영상에 걸친 일관성을 위해 사용자로부터 입력받는 γ의 값, 그리고 기준값들인 τ1, τ2, τ3 및 τ4의 초기값은 각각 1.95, 0.625, 10, 40 및 80으로 설정되었다. 여기서, 앞에서 설명한 바와 같이 γ는 사용자에 의해 입력되는 값이고, 나머지 값들은 영상의 작은 디테일 정보를 개선하기 위해 경험적으로 얻어지는 값이다. Experiments were conducted to evaluate the performance of the present invention. The original image for the experiment was a high dynamic range image available on the web. In addition, the initial values of γ and the reference values τ 1 , τ 2 , τ 3, and τ 4 , which are input from the user, are set to 1.95, 0.625, 10, 40, and 80, respectively, for consistency across a plurality of experimental images. Here, as described above, γ is a value input by the user, and the remaining values are empirically obtained to improve small detail information of the image.
다시 말하면, 원본 영상에서 컨텐츠를 포함하는 어둡거나 밝은 영역은 의 값이 τ2와 τ3 사이의 범위에 포함됨에 따라 충분히 개선되지만, 평탄한 영역 또는 큰 에지가 존재하는 영역은 상대적으로 덜 개선된다. 나아가 τ2의 값을 10으로 설정한 것은 주어진 DCT 변환 계수들의 값을 적절하게 조절하기 위한 것이다. 나머지 값들은 비트 연산에 의해 τ1=(τ2>>4), τ3=(τ2<<2), 그리고 τ4=(τ2<<3)과 같이 결정된 것이다. 본 실험에서는 실험 영상이 컬러 영상인 경우에도 휘도 성분만 사용되었다.In other words, dark or light areas in the original image that contain content While sufficiently improved as the value of falls in the range between τ 2 and τ 3 , areas where flat areas or large edges exist are relatively less improved. Furthermore, setting the value of τ 2 to 10 is to properly adjust the values of given DCT transform coefficients. The remaining values are determined by bit operation as τ 1 = (τ 2 >> 4), τ 3 = (τ 2 << 2), and τ 4 = (τ 2 << 3). In this experiment, only the luminance component was used even when the experimental image was a color image.
본 발명의 성능을 평가하기 위해 기존의 영상 품질 개선 방법인 히스토그램 평활화(histogram equalization), α-루팅 알고리즘(α-rooting algorithm) 및 다중 스케일 대비 개선 알고리즘(multi-scale contrast enhancement algorithm)이 본 발명과의 비교를 위해 사용되었다. 이 세 가지 기법들 중에서 히스토그램 평활화는 영상의 대비 개선을 위해 널리 사용되는 방법이고, 나머지 두 개의 알고리즘은 본 발명에서와 유사하게 AC 성분을 사용하여 압축 영역에서 영상의 디테일 정보를 개선하는 방법이다. 본 발명과 α-루팅 알고리즘, 그리고 다중 스케일 대비 개선 알고리즘의 주된 차이점은 본 발명을 제외한 나머지 두 개의 알고리즘에서는 DC 성분의 값은 변형시키지 않으며, 수학식 21에 의해 정의되는 영상의 스펙트럴 컨텐츠 값을 사용하지 않는다는 점이다.In order to evaluate the performance of the present invention, conventional image quality improvement methods such as histogram equalization, α-rooting algorithm, and multi-scale contrast enhancement algorithm are used. Was used for comparison. Among these three techniques, histogram smoothing is a widely used method for improving contrast of an image, and the remaining two algorithms are methods for improving detail information of an image in a compressed region using an AC component similarly to the present invention. The main difference between the present invention, the α-routing algorithm, and the multi-scale contrast enhancement algorithm is that the two components except for the present invention do not modify the DC component value, and the spectral content value of the image defined by Equation 21 is calculated. Is not used.
본 발명과 위 세 가지 기법들 간의 성능 비교를 위해서는 PSNR과 왕(Wang)의 품질 척도가 사용되었다. PSNR은 원본 영상과 개선된 결과 영상 간의 차이를 수치적으로 나타내며, 왕의 품질 척도는 블록 현상이나 블러링(blurring) 현상과 같은 사람의 시지각 인자를 기초로 하는 영상의 특징을 나타낸다.PSNR and Wang's quality measures were used for the performance comparison between the present invention and the above three techniques. The PSNR numerically represents the difference between the original image and the improved result image, and the King's quality scale represents the characteristics of the image based on human visual perception factors such as block or blurring.
도 7은 기존의 방법과 본 발명에 의한 영상 품질 개선의 결과를 나타낸 도면이다. 기존의 방법은 본 발명에서의 영상 개선 과정을 서브 블록이 아닌 DCT 블록 에 적용한 방법이다. 즉, DCT 블록의 분해 과정이 사용되지 않는다. 도 7의 (a) 및 (b)에서 확대된 부분을 살펴보면, 기존의 방법을 사용한 경우에는 본 발명을 적용한 경우에 비해 영상의 큰 에지를 따라 블록 현상이 현저하게 나타난 것을 확인할 수 있다. 이는 기존의 방법에서는 본 발명에서 사용하는 4×4 크기의 서브 블록에 비해 네 배의 크기를 가지는 8×8 크기의 DCT 블록을 사용하기 때문이다. 또한 본 발명을 사용한 경우에는 기존의 방법을 사용한 경우에 비해 디테일 정보들이 보다 명확하게 표현되었다.7 is a view showing the results of the image quality improvement according to the conventional method and the present invention. The existing method is a method in which the image enhancement process of the present invention is applied to a DCT block rather than a sub block. In other words, the decomposition process of the DCT block is not used. Looking at the enlarged portion in (a) and (b) of Figure 7, it can be seen that the block phenomenon appeared remarkably along the large edge of the image compared to the case of using the present invention when using the conventional method. This is because the conventional method uses an 8 × 8 DCT block having four times the size of the 4 × 4 subblock used in the present invention. In addition, in the case of using the present invention, detailed information is more clearly expressed than in the case of using the conventional method.
도 8은 본 발명을 다양한 영상에 적용한 실험 결과를 나타낸 도면이다. 도 8의 좌측에 위치하는 영상들은 원본 영상이며, 각각의 원본 영상의 우측에는 본 발명을 적용하여 얻어진 결과 영상이 나타나 있다. 먼저 도 8의 (a) 및 (b)를 참조하면, 본 발명을 적용함으로써 영상의 전체에 걸쳐, 특히 좌측 상단 및 우측 하단 부분의 밝기를 향상시킬 수 있다. 또한 도 8의 (c)는 햇빛에 의해 영상의 우측이 좌측에 비해 밝게 나타난 영상이다. 이 영상에 본 발명을 적용하여 얻어진 도 8의 (d)는 어두운 영역의 디테일 정보가 명확히 나타난 결과를 보여준다. 특히 영상 좌측에 위치하는 나무의 줄기가 선명하게 보이도록 개선되었다. 도 8의 (e)는 강한 빛에 의해 어두운 부분의 디테일 정보가 상당 부분 손실된 영상을 보여준다. 본 발명을 적용함으로써, 도 8의 (f)와 같이 탑의 구조물을 분간할 수 있을 정도로 개선되었음을 확인할 수 있다. 마지막으로 도 8의 (g) 및 (h)를 참조하면, 강한 햇빛으로 인해 나타난 영상의 지나치게 밝거나 어두운 영역의 디테일 정보가 뚜렷하게 복원된 결과를 나타낸다.8 is a diagram illustrating an experimental result of applying the present invention to various images. The images positioned on the left side of FIG. 8 are original images, and the resulting images obtained by applying the present invention are shown on the right side of each original image. Referring first to (a) and (b) of FIG. 8, the brightness of the upper left and lower right portions may be improved over the entire image by applying the present invention. In addition, FIG. 8C shows an image in which the right side of the image is brighter than the left side due to sunlight. FIG. 8 (d) obtained by applying the present invention to this image shows a result in which the detail information of the dark region is clearly shown. In particular, the trunk of the tree located on the left side of the image has been improved. 8 (e) shows an image in which the detail information of the dark part is largely lost by the strong light. By applying the present invention, it can be confirmed that the improvement of the structure of the tower can be distinguished as shown in (f) of FIG. Finally, referring to FIGS. 8G and 8H, detailed information of an excessively bright or dark region of an image due to strong sunlight is clearly restored.
서로 다른 영상 품질 개선 알고리즘의 양적인 성능을 측정하기 위해 PSNR 및 왕의 품질 척도를 사용한 실험이 높은 동적 영역의 이미지에 대해 수행되었다. 동일한 원본 영상에 대해 다양한 알고리즘을 적용한 결과가 도 9에 도시되어 있다. 도 9의 (a)에 나타난 원본 영상은 아주 밝은 영역 및 어두운 영역에서 디테일 정보가 손실되어 있다. 도 9의 (b)는 개선된 히스토그램 평활화 알고리즘의 한 형태인 최소 평균 밝기 에러 바이-히스토그램 평활화(minimum mean brightness error bi-histogram equalization : MMEBHE)에 의해 얻어진 결과 영상으로, 영상의 개선이 과도하게 이루어져 지나치게 어두워지거나 밝아진 영역이 나타난다. α-루팅 알고리즘에 의해 얻어진 도 9의 (c)의 영상은 원본 영상과 거의 동일하게 나타난다. 대비 측정 알고리즘(contrast measure algorithm)에 의해 얻어진 도 9의 (d)의 영상에는 블록 현상이 심하게 나타난다. 8×8 DCT 블록을 사용한 기존의 방법을 적용하여 얻어진 도 9의 (e)의 영상은 좀 더 나은 결과를 보이지만 큰 에지 주변에서 의사(spurious) 에지가 발생한다. 마지막으로 도 9의 (f)를 참조하면, 본 발명을 원본 영상에 적용함으로써 어두운 영역 및 밝은 영역의 디테일 정보가 이전의 방법들에 비해 더 많이 복원되었음을 확인할 수 있다.In order to measure the quantitative performance of different image quality improvement algorithms, experiments using PSNR and Wang's quality scale were performed on high dynamic range images. The results of applying various algorithms to the same original image are shown in FIG. 9. In the original image shown in (a) of FIG. 9, detail information is lost in a very bright area and a dark area. FIG. 9B is a resultant image obtained by minimum mean brightness error bi-histogram equalization (MMEBHE), which is a form of an improved histogram smoothing algorithm. Areas that are too dark or too bright appear. The image of FIG. 9C obtained by the α-routing algorithm appears almost identical to the original image. In the image of FIG. 9 (d) obtained by a contrast measure algorithm, a block phenomenon is severely shown. The image of FIG. 9E obtained by applying the conventional method using an 8 × 8 DCT block shows better results, but spurious edges occur around a large edge. Finally, referring to FIG. 9 (f), it can be confirmed that, by applying the present invention to the original image, the detail information of the dark region and the bright region is restored more than the previous methods.
다음으로 영상 개선의 품질을 수치적으로 측정하기 위해 MMEBHE(알고리즘1), α-루팅 알고리즘(알고리즘2), 대비 측정 알고리즘(알고리즘3), 8×8 DCT 블록을 사용하는 기존 방법(알고리즘4) 및 본 발명을 비교하였다. 다섯 가지 기법의 성능은 PSNR 및 왕의 척도에 의해 측정되었다. 각각의 수치는 서로 다른 양자화 레벨을 사용하여 측정된 것이다(Q30, Q50, Q75 및 Q95). 작은 값이 더 많이 압축될 수 있도록 다음의 수학식 31과 같이 품질 인자를 사용하여 양자화 매개변수를 조절할 수 있다.Next, MMEBHE (Algorithm 1), α-Routing Algorithm (Algorithm 2), Contrast Measurement Algorithm (Algorithm 3), and 8 x 8 DCT blocks (Algorithm 4) to numerically measure the quality of image enhancement. And the present invention was compared. The performance of the five techniques was measured by PSNR and the King's scale. Each figure is measured using different quantization levels (Q 30 , Q 50 , Q 75 and Q 95 ). The quantization parameter can be adjusted using the quality factor as shown in Equation 31 so that a smaller value can be compressed more.
다음의 표 1 및 표 2는 각각 PSNR 및 품질 척도에 의해 측정된 각 알고리즘들의 성능을 나타낸 것이다. 각 원본 영상에서 얻어진 최대값은 굵은 글씨로 강조되어 표시되었다.Tables 1 and 2 below show the performance of each algorithm measured by PSNR and quality measures, respectively. Maximum values from each original image are highlighted in bold.
63.0/71.862.6 / 68.4 /
63.0 / 71.8
85.0/86.685.0 / 86.6
68.8/68.768.8 / 68.8 /
68.8 / 68.7
71.4/71.471.3 / 71.3 /
71.4 / 71.4
74.4/74.774.1 / 74.2 /
74.4 / 74.7
72.2/73.971.0 / 71.2 /
72.2 / 73.9
80.1/82.980.1 / 82.9
63.6/63.564.0 / 63.8 /
63.6 / 63.5
67.5/67.467.7 / 67.6 /
67.5 / 67.4
72.6/73.571.8 / 72.1 /
72.6 / 73.5
68.1/68.168.0 / 68.7 /
68.1 / 68.1
82.4/85.482.4 / 85.4
65.6/65.366.0 / 65.8 /
65.6 / 65.3
67.3/67.167.6 / 67.5 /
67.3 / 67.1
71.6/72.471.2 / 71.3 /
71.6 / 72.4
68.1/69.469.3 / 69.8 /
68.1 / 69.4
75.4/77.775.4 / 77.7
62.9/64.164.0 / 63.6 /
62.9 / 64.1
70.2/71.570.4 / 70.4 /
70.2 / 71.5
73.1/73.872.0 / 72.3 /
73.1 / 73.8
70.0/73.772.4 / 73.1 /
70.0 / 73.7
82.6/85.282.6 / 85.2
66.9/66.767.3 / 67.1 /
66.9 / 66.7
67.8/67.668.0 / 67.9 /
67.8 / 67.6
70.6/71.370.2 / 70.3 /
70.6 / 71.3
68.3/71.468.7 / 70.2 /
68.3 / 71.4
81.1/83.681.1 / 83.6
65.5/65.666.0 / 65.8 /
65.5 / 65.6
68.8/69.069.0 / 68.9 /
68.8 / 69.0
72.5/73.171.8 / 72.0 /
72.5 / 73.1
20.3/21.218.4 / 19.1 /
20.3 / 21.2
19.5/20.417.9 / 18.6 /
19.5 / 20.4
21.2/22.319.3 / 20.1 /
21.2 / 22.3
21.6/23.021.6 / 23.0
19.7/20.618.2 / 18.8 /
19.7 / 20.6
19.1/19.917.5 / 18.1 /
19.1 / 19.9
19.6/20.518.0 / 18.6 /
19.6 / 20.5
20.8/22.020.8 / 22.0
19.9/21.017.9 / 18.7 /
19.9 / 21.0
19.3/20.317.4 / 18.1 /
19.3 / 20.3
19.3/20.417.5 / 18.2 /
19.3 / 20.4
20.7/22.320.7 / 22.3
20.4/20.418.5 / 19.2 /
20.4 / 20.4
19.9/19.717.9 / 18.6 /
19.9 / 19.7
21.3/21.419.4 / 20.0 /
21.3 / 21.4
22.0/21.922.0 / 21.9
19.7/20.717.7 / 18.5 /
19.7 / 20.7
19.1/20.017.2 / 18.0 /
19.1 / 20.0
19.3/20.317.4 / 18.1 /
19.3 / 20.3
20.1/21.820.1 / 21.8
20.0/20.818.1 / 18.9 /
20.0 / 20.8
19.4/20.117.6 / 18.3 /
19.4 / 20.1
20.1/21.018.3 / 19.0 /
20.1 / 21.0
21.0/22.221.0 / 22.2
PSNR과 품질 척도의 값은 영상의 품질이 높을수록 더 큰 값을 나타낸다. 표 1 및 표 2를 참조하면, PSNR에 있어서는 α-루팅 알고리즘(알고리즘2)이 가장 높은 값을 보이지만 품질 척도에 있어서는 본 발명이 가장 높은 값을 보이는 것을 알 수 있다.The higher the quality of the image, the larger the PSNR and quality scale. Referring to Tables 1 and 2, it can be seen that the α-routing algorithm (algorithm 2) shows the highest value in PSNR, but the present invention shows the highest value in quality measure.
위 실험 결과를 요약하여 각각의 알고리즘에 대한 측정값의 평균을 다음의 표 3에 나타내었다.Summarizing the above experimental results, the average of the measured values for each algorithm is shown in Table 3 below.
먼저 PSNR의 경우에는 α-루팅 알고리즘에 대한 수치가 가장 높고 그 다음이 본 발명에 대한 수치이다. 그러나 PSNR은 원본 영상과 복원된 결과 영상 사이의 차이만을 기반으로 측정되며, 복원된 영상이 시각적 정보를 더 많이 포함하고 있는지 여부에 대하여는 측정하지 않는다. 한편, 왕의 품질 척도의 경우에는 본 발명에서 가장 높은 수치를 보인다. 왕의 품질 척도는 영상의 개선 품질을 측정할 때 블록 현상 및 블러링 효과와 같은 사람의 시지각 인자를 고려하기 때문에 본 발명이 주어진 영상에 상대적으로 작은 변화를 초래하면서도 만족할 만한 개선 결과를 가져올 수 있음을 의미한다.In the case of PSNR, the numerical value for the α-rooting algorithm is the highest, followed by the numerical value for the present invention. However, the PSNR is measured based only on the difference between the original image and the reconstructed result image, and does not measure whether the reconstructed image contains more visual information. On the other hand, the king's quality scale shows the highest value in the present invention. The King's quality scale considers human visual perception factors such as block phenomena and blurring effects when measuring the improvement quality of an image, so that the present invention can produce a satisfactory improvement while bringing relatively small changes to a given image. It means that there is.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The present invention can also be embodied as computer-readable codes on a computer-readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored. Examples of the computer-readable recording medium include a ROM, a RAM, a CD-ROM, a magnetic tape, a floppy disk, an optical data storage device, and the like, and may be implemented in the form of a carrier wave (for example, transmission via the Internet) . The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.
이상에서 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.Although the preferred embodiments of the present invention have been shown and described above, the present invention is not limited to the specific preferred embodiments described above, and the present invention belongs to the present invention without departing from the gist of the present invention as claimed in the claims. Various modifications can be made by those skilled in the art, and such changes are within the scope of the claims.
도 1은 본 발명에 따른 압축 영역에서의 영상 복원 장치에 대한 바람직한 실시예의 구성을 도시한 블록도,1 is a block diagram showing the configuration of a preferred embodiment of an image reconstruction apparatus in a compressed region according to the present invention;
도 2는 64개의 DCT 기본 함수를 도시한 도면,2 shows 64 DCT basic functions,
도 3은 7개의 주파수 밴드로 분류되는 서브 블록의 형태를 도시한 도면,3 is a diagram illustrating a form of a sub block classified into seven frequency bands;
도 4는 영상의 개선 정도를 조절하는 γ의 값이 서로 다르게 설정되었을 때 입력값과 출력값의 관계를 도시한 그래프,4 is a graph illustrating a relationship between an input value and an output value when the value of γ for adjusting the degree of improvement of an image is set differently;
도 5는 개선값의 스무딩을 위해 사용되는 이웃 서브 블록들의 예를 도시한 도면,5 shows an example of neighboring subblocks used for smoothing an improvement value;
도 6은 본 발명에 따른 압축 영역에서의 영상 복원 방법에 대한 바람직한 실시예의 수행과정을 도시한 흐름도,6 is a flowchart illustrating a process of performing a preferred embodiment of an image reconstruction method in a compressed region according to the present invention;
도 7은 기존의 방법과 본 발명에 의한 영상 품질 개선의 결과를 나타낸 도면,7 is a view showing the results of image quality improvement according to the conventional method and the present invention,
도 8은 본 발명을 다양한 영상에 적용한 실험 결과를 나타낸 도면, 그리고,8 is a view showing the experimental results of applying the present invention to various images, and
도 9는 동일한 원본 영상에 대해 다양한 알고리즘을 적용한 결과를 나타낸 도면이다.9 is a diagram illustrating a result of applying various algorithms to the same original image.
Claims (19)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090104149A KR101024282B1 (en) | 2009-10-30 | 2009-10-30 | Apparatus and method for image reproduction in compressed domain |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090104149A KR101024282B1 (en) | 2009-10-30 | 2009-10-30 | Apparatus and method for image reproduction in compressed domain |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101024282B1 true KR101024282B1 (en) | 2011-03-29 |
Family
ID=43939297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090104149A KR101024282B1 (en) | 2009-10-30 | 2009-10-30 | Apparatus and method for image reproduction in compressed domain |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101024282B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013157825A1 (en) * | 2012-04-16 | 2013-10-24 | 한국전자통신연구원 | Method and device for encoding/decoding image |
KR20140004838A (en) * | 2012-07-02 | 2014-01-14 | 삼성전자주식회사 | Apparatus and method for transforming a brightness of a image data in a terminal |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100244546B1 (en) | 1990-02-27 | 2000-02-01 | 러셀 비. 밀러 | Adaptive block size image compression method and system |
US20030235248A1 (en) | 2002-06-21 | 2003-12-25 | Changick Kim | Hybrid technique for reducing blocking and ringing artifacts in low-bit-rate coding |
JP2006340163A (en) | 2005-06-03 | 2006-12-14 | Kawasaki Microelectronics Kk | Image compression apparatus |
KR20070036382A (en) * | 2005-09-29 | 2007-04-03 | 엘지전자 주식회사 | A display apparatus and method of controlling a display apparatus |
-
2009
- 2009-10-30 KR KR1020090104149A patent/KR101024282B1/en not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100244546B1 (en) | 1990-02-27 | 2000-02-01 | 러셀 비. 밀러 | Adaptive block size image compression method and system |
US20030235248A1 (en) | 2002-06-21 | 2003-12-25 | Changick Kim | Hybrid technique for reducing blocking and ringing artifacts in low-bit-rate coding |
JP2006340163A (en) | 2005-06-03 | 2006-12-14 | Kawasaki Microelectronics Kk | Image compression apparatus |
KR20070036382A (en) * | 2005-09-29 | 2007-04-03 | 엘지전자 주식회사 | A display apparatus and method of controlling a display apparatus |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101979681B1 (en) | 2012-04-16 | 2019-05-17 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR20220151140A (en) * | 2012-04-16 | 2022-11-14 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR101952182B1 (en) | 2012-04-16 | 2019-02-26 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR101527445B1 (en) * | 2012-04-16 | 2015-06-11 | 한국전자통신연구원 | Method and apparatus for image encoding/decoding |
US9571841B2 (en) | 2012-04-16 | 2017-02-14 | Electronics And Telecommunications Research Institute | Method and device for encoding/decoding image |
KR101726680B1 (en) | 2012-04-16 | 2017-04-13 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
WO2013157825A1 (en) * | 2012-04-16 | 2013-10-24 | 한국전자통신연구원 | Method and device for encoding/decoding image |
KR101868122B1 (en) * | 2012-04-16 | 2018-06-18 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR20180068920A (en) * | 2012-04-16 | 2018-06-22 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR20180068921A (en) * | 2012-04-16 | 2018-06-22 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR20180068918A (en) * | 2012-04-16 | 2018-06-22 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR20180068919A (en) * | 2012-04-16 | 2018-06-22 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
US10057579B2 (en) | 2012-04-16 | 2018-08-21 | Electronics And Telecommunications Research Institute | Method and device for encoding/decoding image |
KR101952183B1 (en) | 2012-04-16 | 2019-02-26 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR102583640B1 (en) | 2012-04-16 | 2023-09-27 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR20130116845A (en) * | 2012-04-16 | 2013-10-24 | 한국전자통신연구원 | Method and apparatus for image encoding/decoding |
KR20170042526A (en) * | 2012-04-16 | 2017-04-19 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR20190053827A (en) * | 2012-04-16 | 2019-05-20 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
US10448018B2 (en) | 2012-04-16 | 2019-10-15 | Electronics And Telecommunications Research Institute | Method and device for encoding/decoding image |
US10455234B2 (en) | 2012-04-16 | 2019-10-22 | Electronics And Telecommunications Research Institute | Method and device for encoding/decoding image |
US10455232B2 (en) | 2012-04-16 | 2019-10-22 | Electronics And Telecommunications Research Institute | Method and device for encoding/decoding image |
US10455233B2 (en) | 2012-04-16 | 2019-10-22 | Electronics And Telecommunications Research Institute | Method and device for encoding/decoding image |
US10477213B2 (en) | 2012-04-16 | 2019-11-12 | Electronics And Telecommunications Research Institute | Method and device for encoding/decoding image |
KR102152975B1 (en) | 2012-04-16 | 2020-09-07 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR20200105787A (en) * | 2012-04-16 | 2020-09-09 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
US10924742B2 (en) | 2012-04-16 | 2021-02-16 | Electronics And Telecommunications Research Institute | Method and device for encoding/decoding image |
KR102349176B1 (en) | 2012-04-16 | 2022-01-10 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR20220006134A (en) * | 2012-04-16 | 2022-01-14 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR102462009B1 (en) | 2012-04-16 | 2022-11-03 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
KR101952184B1 (en) | 2012-04-16 | 2019-02-26 | 한국전자통신연구원 | Method for image encoding and computer readable redording meduim thereof |
US11553183B2 (en) | 2012-04-16 | 2023-01-10 | Electronics And Telecommunications Research Institute | Method and device for encoding/decoding image |
KR20140004838A (en) * | 2012-07-02 | 2014-01-14 | 삼성전자주식회사 | Apparatus and method for transforming a brightness of a image data in a terminal |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lee | An efficient content-based image enhancement in the compressed domain using retinex theory | |
US7965900B2 (en) | Processing an input image to reduce compression-related artifacts | |
JP5289659B2 (en) | Adaptive block size DCT image compression based on variance | |
EP2051524A1 (en) | Image enhancement considering the prediction error | |
JP4987480B2 (en) | Conversion to remove image noise | |
JP4468367B2 (en) | Reduce artifacts in compressed images | |
US7760805B2 (en) | Method of enhancing images extracted from video | |
Hassan et al. | Color image compression based on DCT, differential pulse coding modulation, and adaptive shift coding | |
Ernawan et al. | Bit allocation strategy based on psychovisual threshold in image compression | |
US20020191695A1 (en) | Interframe encoding method and apparatus | |
Sengar et al. | Color image enhancement by scaling the discrete wavelet transform coefficients | |
KR101024282B1 (en) | Apparatus and method for image reproduction in compressed domain | |
Lee | Content-based image enhancement in the compressed domain based on multi-scale α-rooting algorithm | |
Komatsu et al. | Super-resolution decoding of JPEG-compressed image data with the shrinkage in the redundant DCT domain | |
Malo et al. | The role of perceptual contrast non-linearities in image transform quantization | |
US20190089955A1 (en) | Image encoding method, and image encoder and image decoder using same | |
Zaid et al. | HDR image compression with optimized JPEG coding | |
Poolakkachalil et al. | Comparative analysis of lossless compression techniques in efficient DCT-based image compression system based on Laplacian Transparent Composite Model and An Innovative Lossless Compression Method for Discrete-Color Images | |
JP2545302B2 (en) | High efficiency encoder | |
Itier et al. | Interval-valued JPEG decompression for artifact suppression | |
Algazi et al. | Preprocessing for improved performance in image and video coding | |
JP3722169B2 (en) | Image processing apparatus and image processing method | |
Lee | Compressed image reproduction based on block decomposition | |
Neethu et al. | Improved quality of JPEG compressed image using approximate K-SVD algorithm | |
CN116980626A (en) | Adaptive JPEG lossless transcoding method, system, equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20131231 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20150417 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160119 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |