KR100937378B1 - Method, computer program product and device for processing of still images in the compressed domain - Google Patents
Method, computer program product and device for processing of still images in the compressed domain Download PDFInfo
- Publication number
- KR100937378B1 KR100937378B1 KR1020077016575A KR20077016575A KR100937378B1 KR 100937378 B1 KR100937378 B1 KR 100937378B1 KR 1020077016575 A KR1020077016575 A KR 1020077016575A KR 20077016575 A KR20077016575 A KR 20077016575A KR 100937378 B1 KR100937378 B1 KR 100937378B1
- Authority
- KR
- South Korea
- Prior art keywords
- linear
- image data
- function
- image
- subbands
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004590 computer program Methods 0.000 title claims description 12
- 238000012545 processing Methods 0.000 title description 52
- 238000001914 filtration Methods 0.000 claims abstract description 27
- 238000012886 linear function Methods 0.000 claims description 55
- 230000008859 change Effects 0.000 claims description 19
- 238000009499 grossing Methods 0.000 claims description 10
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 238000003384 imaging method Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000003860 storage Methods 0.000 abstract description 7
- 238000004422 calculation algorithm Methods 0.000 abstract description 6
- 230000009466 transformation Effects 0.000 abstract description 6
- 230000008901 benefit Effects 0.000 abstract description 3
- 230000006835 compression Effects 0.000 description 32
- 238000007906 compression Methods 0.000 description 32
- 230000006870 function Effects 0.000 description 21
- 230000001413 cellular effect Effects 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 239000003990 capacitor Substances 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000010267 cellular communication Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 238000003706 image smoothing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/10—Image enhancement or restoration using non-spatial domain filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20064—Wavelet transform [DWT]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
본 발명은 압축 도메인에서 이미지 데이터의 조작 및 특히 필터링에 관련된다. 본 발명은 웨이브릿 기반의 변환 알고리즘으로 공간 도메인에서 이미지 데이터로부터 변환된 압축 도메인에 이미지 데이터를 조작할 수 있게 하는 방법 및 장치를 제공한다. 본 발명의 개념의 이점은 장치에서 계산 능력, 스토리지, 메모리 및 전력 소모인 근원적인 제약(constraint)들이 이미지 조작/ 필터링을 위해 적절할 수 있도록, 필터링 시간을 가속화하는 것이다. The present invention relates to the manipulation and especially filtering of image data in the compressed domain. The present invention provides a method and apparatus for manipulating image data in a compressed domain transformed from image data in a spatial domain with a wavelet based transformation algorithm. An advantage of the inventive concept is to speed up the filtering time so that the underlying constraints of the computational power, storage, memory and power consumption in the device may be appropriate for image manipulation / filtering.
Description
본 발명은 이미지 처리 분야에 관련된다. 특히 본 발명은 압축 도메인에서 스틸 이미지 처리에 관련된다. The present invention relates to the field of image processing. In particular the invention relates to still image processing in the compressed domain.
증가하는 수의 휴대용 장치들은 오디오 및 비디오로 동작하는 멀티미디어 애플리케이션들을 특징으로 한다. 이런 멀티미디어 애플리케이션들은 점점 고객들을 끌고, 그들은 열성적으로 새로운 멀티미디어 특징(feature)들의 사용을 즐긴다. 특히 휴대용 전화들 및 셀룰러 전화들의 시장은 멀티미디어 특징 장치들의 빠른 수용을 예증한다. 즉 이미지 캡처 성능이 있는 휴대용 전화들인, 이미징(imaging) 전화들은 한 클래스의 휴대용 전화들을 나타내고, 그것은 이런 제품 클래스의 도입 이후 주목할만한 단기간 내에 표준(standard)을 나타내는 가장 좋은 방법이다. 이미징 전화들의 성공적인 발전은 필적하는 디지털 카메라들의 성공을 수반한다. An increasing number of portable devices feature multimedia applications that operate with audio and video. These multimedia applications are increasingly attracting customers and they enthusiastically enjoy the use of new multimedia features. In particular, the market for portable telephones and cellular telephones illustrates the rapid acceptance of multimedia feature devices. That is, imaging phones, which are portable phones with image capture capability, represent a class of portable phones, which is the best way to represent a standard in a remarkable short time after the introduction of this product class. Successful development of imaging phones involves the success of comparable digital cameras.
현재까지, 특히 이미지 캡처 애플리케이션들, 주소 레코딩/ 캡처 퀄러티(quality), 메모리 요구(requirement)들, 스트리밍 성능(capability)(비트 레이트 요구들(requirements)), 및 재생/ 디스플레이 성능인, 멀티미디어 애플리케이션 들의 분야에서 발전하였다. 대응하여, 멀티미디어 애플리케이션들 상에서 대부분의 연구는 압축 표준들, 합성 이슈(issue)들, 스토리지 표현(representation)들, 및 센서 디자인들에 초점을 맞추고 있다. 예를 들어, (명도 조정, 콘트라스트 증강, 및 샤프닝 같은) 편집, 필터링, 컴포징(composing) 및 특정 효과 구현(special effect implementation)을 포함하는 이미지 조작과 같은 디지털 이미지들을 처리하는 기술들의 분야는 경시되고 있다. To date, especially of multimedia applications, which are image capture applications, address recording / capture quality, memory requirements, streaming capability (bit rate requirements), and playback / display performance. Developed in the field. Correspondingly, most research on multimedia applications focuses on compression standards, compositing issues, storage representations, and sensor designs. For example, the field of techniques for processing digital images, such as image manipulation including editing, filtering, composing, and special effect implementation (such as brightness adjustment, contrast enhancement, and sharpening) is neglected. It is becoming.
이미지 처리 분야에 대한 경시는, 이미지 처리에 요구되는, 즉 계산 복잡도(computational complexity)인, 복잡도 및 데이터 볼륨(volume)에 기초한다. 전형적으로, 휴대용 장치들은 이미지들의 무선의 수신/ 전송, 스트리밍 성능 등을 포함하는 이미지 핸들링에 생기는 요구들 뿐만 아니라, 특히 계산 능력(computational power) 및 스토리지 용량인, 이런 휴대용 장치들의 제한들을 충족시키는 압축 모드에서 디지털 이미지들을 다룬다. 복잡도 때문에, 이미지 처리는 현재 워크스테이션들 및 퍼스널 컴퓨터들 상에서 구현되는 전형적인 태스크(task)이다. 이런 강력한 처리 장치들은 압축 모드에서 디지털 이미지의 복원을 포함하는 폭력 침입(brute-force) 알고리즘들을 동작하게 허용하고, 압축해제된(uncompressed) 도메인에서 이미지를 처리, 즉 조작하게 허용하고, 최종적으로는 압축 모드에서 조작된 디지털 이미지를 다시 얻기 위해 조작된 이미지를 압축하게 허용한다. 앞에서 말한 바와 같이, 이미지 압축을 위해 사용되는 현대의 압축 기법들은 주로, 디지털 이미지의 화질 저하 없이 또는 받아들일 만한 한계 내로 화질이 저하된 압축을 얻기 위해 고도의 계산의 복잡도를 수용하는 압축 모드에서의 디지 털 이미지의 최종 결과 크기를 얻기 위해 최적화된다. The disregard for the field of image processing is based on complexity and data volume, which is required for image processing, i.e. computational complexity. Typically, portable devices have compression that meets the limitations of such portable devices, in particular computational power and storage capacity, as well as the demands placed on image handling, including wireless reception / transmission, streaming performance, etc. of images. Handle digital images in mode. Because of the complexity, image processing is a typical task currently implemented on workstations and personal computers. These powerful processing devices allow the operation of brute-force algorithms, including the reconstruction of digital images in compression mode, the processing of images in the uncompressed domain, ie manipulation, and finally Allows to compress the manipulated image to regain the manipulated digital image in compression mode. As mentioned earlier, modern compression techniques used for image compression are mainly in compression mode, which accepts a high degree of computational complexity to obtain a deteriorated compression without degrading the digital image or within acceptable limits. It is optimized to obtain the final result size of the digital image.
그럼에도 불구하고, 멀티미디어 애플리케이션들의 점진적인 수용은 오늘날 강력한 홈(home) 컴퓨터 장비에서 이용할 수 있는 이미지 조작에 대한 사용자들/ 고객들의 요구를 조종할(drive) 수 있다.Nevertheless, the gradual acceptance of multimedia applications can drive the needs of users / customers for image manipulation available on today's powerful home computer equipment.
따라서, 제한된 계산 능력 및 제한된 스토리지 용랑을 포함하는 제한된 처리 성능을 갖는 처리 장치들에 디지털 이미지들의 효율적인 조작, 편집, 처리를 위한 효율적인 기술들 및 방법론들을 제공할 필요가 있다. 특히, 제시된 기술들 및 방법들은 이미지들을 조작, 편집 및 처리할 때 명도 조정(brightness adjustment), 콘트라스트 증강(contrast enhnacement), 필터링(filtering) 및 샤프닝(sharpening)과 같은 사용자가 원하는 효과들을 이미지들에 적용한다. Accordingly, there is a need to provide efficient techniques and methodologies for efficient manipulation, editing and processing of digital images to processing devices having limited processing power, including limited computing power and limited storage capacity. In particular, the presented techniques and methods incorporate user-desired effects, such as brightness adjustment, contrast enhnacement, filtering and sharpening, into the images when manipulating, editing, and processing the images. Apply.
본 발명의 목적은 디지털 이미지 처리 오퍼레이션(operation)들 전에 복원 및 디지털 이미지 처리 오퍼레이션들 후에 재압축을 포함하는 종래의 요구들을 극복하기 위해, 압축 도메인에서의 디지털 이미지 조작 및 편집 각각의 의미에서, 디지털 이미지 처리를 위한 기술들 및 방법들을 제공함으로써 해결된다. 본 발명의 주요 이점은 상당히 감소된 계산 복잡도이다. It is an object of the present invention to overcome the conventional needs of reconstruction before digital image processing operations and recompression after digital image processing operations. It is solved by providing techniques and methods for image processing. The main advantage of the present invention is the significantly reduced computational complexity.
본 발명의 제 1 양상에 따라, 압축 도메인에서 이미지 데이터를 변경하기 위한 방법이 제공된다. 압축된 이미지 데이터, 즉 압축 도메인에서의 이미지 데이터는 공간 도메인(spatial domain)에서의 이미지 데이터(예를 들어, 이미지 캡처 센서(image capturing sensor)에 의해 제공됨)로부터 얻는데, 이는 웨이브릿 변환 및 특히 이산 웨이브릿 변환(discrete wavelet transform, DWT)과 같은 서브밴드(subband) 기반의 변환을 이용하는 인코더에 의한다. 미래의 표준으로 예상되는 전형적인 인코더는 JPEG 2000 인코더이다. 본 발명은 리니어(linear) 필터 함수로 적용할 수 있는, (원본) 리니어 함수 를 제공한다. 리니어 함수 는 피가수(summand)들 및 인자들의 어떤 일차 결합(linear combination )으로 구성된다. 이것은 리니어 함수가 는 0, 하나 또는 그 이상의 리니어 오프셋들 를 포함하고, 0, 하나, 또는 그 이상의 리니어 스케일링 인자들 을 포함함을 의미한다. 예를 들어, 이미지 데이터의 이미지 표현(representation)에서의 함수 특정 필터링 효과(function specific filtering effect)를 얻기 위해, 상기 이미지 데이터에 적용할 수 있는 리니어 함수 가 공간 도메인에 제공된다. 리니어 함수 는 압축 도메인 내부로 변환되고, 그 변환된 후에 변환된 리니어 함수 는 변환된 이미지 데이터의 특정 서브밴드들, 예를 들어 상기 압축된 이미지 데이터의 베이스 밴드(base-band, LL) 또는 압축된 이미지 데이터의 정의된 수의 서브밴드들 상에 적용된다. According to a first aspect of the invention, a method for modifying image data in a compressed domain is provided. Compressed image data, i.e. image data in the compression domain, is obtained from image data in the spatial domain (eg provided by an image capturing sensor), which is a wavelet transform and in particular discrete By an encoder using a subband based transform such as a discrete wavelet transform (DWT). A typical encoder anticipated as a future standard is the JPEG 2000 encoder. The invention is a (original) linear function, which can be applied as a linear filter function. To provide. Linear function Is composed of some linear combination of sumands and arguments. This is a linear function Is zero, one or more linear offsets Zero, one, or more linear scaling factors It means to include. For example, a linear function that can be applied to the image data to obtain a function specific filtering effect in the image representation of the image data. Is provided in the spatial domain. Linear function Is transformed into the compression domain, and then converted linear function Is applied on specific subbands of transformed image data, for example a base-band (LL) of the compressed image data or a defined number of subbands of compressed image data.
변환된 리니어 함수 의 애플리케이션의 결과로 근사치(approximation)가 얻어질 수 있다. 애플리케이션을 위해 선택된 변환된 이미지의 서브밴드들의 수는 결과인 근사치의 퀄러티(quality)를 결정함을 주의해야된다. 더 많은 서브밴드들이 선택될수록, 변환된 리니어 함수 애플리케이션의 결과 생기는 최종 이미지 표현에 더 가깝게 되고, 상기 최종 이미지 표현은 공간 도메인에서 이미지 데이터에 리니어 함수 를 적용함으로써 얻어지는 이미지 표현에 대응한다. 양쪽의 결과 이미지 표현들(즉, 변환된 리니어 함수를 압축 도메인에서 그리고 공간 도메인에서 원본 함수를 각각 적용함으로써 얻어지는) 사이의 차이점들은 보통은 중요하지 않다. 그러므로 상기 압축된 이미지 데이터의 특정 서브밴드들에서만 그리고 특히 베이스 밴드(LL)에 변환된 리니어 함수 를 적용하는 것은 빠른 계산 속도의 이점이 있는 좋은 근사치를 나타낸다. 당업자는 베이스밴드(LL 서브밴드)가 결과인 짧은 계산 처리 시간을 지원하는, 해상도가 감소된 압축해제된 이미지 데이터(공간 영역에서의 이미지 데이터에 대응함)를 표현함을 예상할 수 있다. Transformed linear function Approximation can be obtained as a result of the application of. Note that the number of subbands in the transformed image selected for the application determines the quality of the resulting approximation. The more subbands are selected, the transformed linear function Closer to the final image representation resulting from the application, the final image representation being a linear function on the image data in the spatial domain Corresponds to the image representation obtained by applying. The differences between both resulting image representations (ie, by applying the transformed linear function in the compression domain and in the spatial domain respectively) are usually insignificant. Therefore, a linear function transformed only in certain subbands of the compressed image data and in particular in the baseband LL. Applying a good approximation has the advantage of fast computational speed. One skilled in the art can expect that the baseband (LL subband) represents a reduced resolution decompressed image data (corresponding to image data in the spatial domain) that supports the resulting short computational processing time.
본 발명의 제2 양상에 따라, 압축 도메인에서 이미지 데이터를 변경하기 위한 컴퓨터 프로그램 생성물이 제공된다. 컴퓨터 프로그램 생성물은 컴퓨터 판독가능 매체에 기록된 컴퓨터 로직(logic)을 갖는 컴퓨터 판독가능 매체를 포함하고, 그것은 처리 장치에 의해 실행되는 명령들로 구성된 코드 섹션(section)들을 포함한다. 본 발명은 (원본) 리니어 함수 를 제공한다. 리니어 함수 는 피가수들 및 인자들의 어느 일차 결합으로 구성된다. 이것은, 리니어 함수 가 0, 하나 또는 그 이상의 리니어 오프셋들 및, 0, 하나, 또는 그 이상의 리니어 스케일링 인자들 로 구성됨을 의미한다. 본 발명은 이미지 데이터의 이미지 표현에서의 함수 특정 필터링 효과를 얻기 위해 공간 도메인에서 상기 이미지 데이터에 적용할 수 있는 리니어 함수 를 제공한다. 한 코드 섹션은 변환된 리니어 함수 가 결과로서 생기도록, 리니어 함수 를 압축 도메인 내부로 변환할 수 있게 한다. 추가의 코드 섹션은 상기 변환된 리니어 함수 를 특정한 미리 정해진 수의 압축된 이미지 데이터의 서브밴드들, 특히, 압축된 이미지 데이터의 베이스 밴드(LL) 상에 적용하도록 구성된다. According to a second aspect of the invention, a computer program product for modifying image data in a compressed domain is provided. The computer program product includes a computer readable medium having computer logic recorded on the computer readable medium, which includes code sections composed of instructions executed by a processing device. The present invention (original) linear function To provide. Linear function Consists of any first combination of singers and factors. This is a linear function Is zero, one or more linear offsets And zero, one, or more linear scaling factors It means that it consists of. The present invention is a linear function applicable to the image data in the spatial domain to obtain a function specific filtering effect in the image representation of the image data To provide. One section of code is a converted linear function Is a linear function To convert into a compressed domain. An additional section of code is used to convert the linear function Is applied to a particular predetermined number of subbands of compressed image data, in particular baseband LL of compressed image data.
본 발명의 제3 양상에 따라, 이미지 캡처 성능이 있는 소비자 전자(Consumer Electronics, CE)가 제공된다. 이미지 데이터 핸들링을 위해 상기 장치는 인코더를 포함하고, 인코더는 예를 들어, 웨이브릿 변환, 특히 이산 웨이브릿 변환(DWT), 및 좀 더 자세히는 JPEG 2000 코덱과 같은 서브밴드 기반의 변환을 이용한다. 인코더는 공간 도메인에서의 이미지 데이터가 압축 도메인에서의 이미지 데이터로 변환할 수 있도록 하고, 이는 미가공(raw) 이미지 데이터 저장과는 다르게 스토리지 볼륨을 절약할 수 있다. 상기 이미지 장치는 리니어 함수를 포함한다. 리니어 함수 는 어떤 피가수(summand)들 및 인자들의 일차 결합(linear combination)으로도 구성된다. 이것은 리니어 함수가 는 0, 하나 또는 그 이상의 리니어 오프셋들 를 포함하고, 0, 하나, 또는 그 이상의 리니어 스케일링 인자들 을 포함함을 의미한다. 본 발명은 예를 들어, 이미지 데이터의 이미지 표현(representation)에 있어서 함수 특정 필터링 효과(function specific filtering effect)를 얻기 위해, 공간 도메인에서 상기 이미지 데이터에 적용할 수 있는 리니어 함수 를 제공한다. 이미지 조작 모듈은 상기 변환된 리니어 함수 가 결과로서 생기도록, 리니어 함수 를 압축 도메인 내부로 변환하도록 구성된다. 또한 이미지 조작 모듈은 변환된 리니어 함수 를 압축된 이미지 데이터의 특정 서브밴드들, 예를 들어 압축된 이미지 데이터의 베이스 밴드 상에 적용할 수 있게 한다. According to a third aspect of the invention, consumer electronics (CE) with image capture capability is provided. The apparatus comprises an encoder for image data handling, which uses for example wavelet transforms, in particular discrete wavelet transforms (DWTs), and more particularly subband based transforms such as the JPEG 2000 codec. The encoder allows the image data in the spatial domain to be converted to the image data in the compressed domain, which can save storage volume unlike raw image data storage. The image device is a linear function It includes. Linear function Consists of a linear combination of any summands and arguments. This is a linear function Is zero, one or more linear offsets Zero, one, or more linear scaling factors It means to include. The present invention is a linear function applicable to the image data in the spatial domain, for example, to obtain a function specific filtering effect in the image representation of the image data. To provide. The image manipulation module converts the linear function Is a linear function Is converted into the compression domain. The image manipulation module also converts linear functions Can be applied on specific subbands of compressed image data, for example on a base band of compressed image data.
본 발명의 나머지 및 추가의 양상들이 다음 설명 및 첨부된 도면들에 의해 명백해질 것이다. The remainder and further aspects of the present invention will become apparent from the following description and the accompanying drawings.
도 1a은 본 발명의 실시 예에 따라 이미지 캡처 성능이 있는 제1 실시 예인 휴대용 CE(Consumer Electronics) 장치를 개략적으로 도시하는 도면. 1A schematically illustrates a portable CE (Consumer Electronics) device as a first embodiment with image capture capability in accordance with an embodiment of the present invention.
도 1b는 본 발명의 실시 예에 따라 이미지 캡처 성능이 있는 제2 실시 예인 휴대용 CE 장치를 개략적으로 도시한 도면. 1B schematically illustrates a portable CE device as a second embodiment having image capture capability in accordance with an embodiment of the present invention.
도 2는 아트 이미지 변조 오퍼레이션의 전형적인 심플한 상태를 도시하는 도면. 2 illustrates a typical simple state of art image modulation operation.
도 3은 본 발명의 실시 예에 따른, 스틸 이미지 압축/ 복원을 위한 웨이브릿 변환 인코더 및 웨이브릿 변환 디코더의 오퍼레이션 모듈들을 개략적으로 도시하는 도면. 3 is a diagram schematically illustrating operation modules of a wavelet transform encoder and a wavelet transform decoder for still image compression / reconstruction according to an embodiment of the present invention;
도 4는 디지털 이미지의 3 레벨 웨이브릿 변환이 결과로서 생기는 서브밴 드(sub-band) 분할 및 주파수 필터링을 수반하는 웨이브릿 변환을 개략적으로 도시하는 도면.4 schematically illustrates a wavelet transform involving sub-band segmentation and frequency filtering resulting from a three level wavelet transform of a digital image;
도 5는 도 3의 웨이브릿 변환 인코더를 위한 예시적인 주파수 분해를 개략적으로 도시하는 도면. 5 schematically illustrates an example frequency decomposition for the wavelet transform encoder of FIG. 3.
도 5b는 도 3의 웨이브릿 변환 인코더를 위한 예시적인 주파수 합성을 개략적으로 도시하는 도면. FIG. 5B schematically illustrates an exemplary frequency synthesis for the wavelet transform encoder of FIG. 3. FIG.
도 6은 본 발명의 실시 예에 따른 명도 조정들의 영향을 받은 이미지의 히스토그램 다이어그램들에서 시프트들을 개략적으로 도시하는 도면. 6 schematically illustrates shifts in histogram diagrams of an image affected by brightness adjustments in accordance with an embodiment of the invention.
도 7은 구역들 및 코드 블록들로 다시 나뉘는 디지털 이미지의 3 레벨 웨이브릿 변환을 개략적으로 도시하는 도면. 7 schematically illustrates a three level wavelet transform of a digital image divided into zones and code blocks.
도 8은 본 발명의 실시 예에 따른 스칼라 덧셈(summation)/ 뺄셈(subtraction)에 의한 이미지 조정의 오퍼레이션 시퀀스를 개략적으로 도시하는 도면. FIG. 8 schematically illustrates an operation sequence of image adjustment by scalar summation / subtraction according to an embodiment of the present invention. FIG.
도 9는 본 발명의 실시 예에 따른 LL 서브밴드의 비트 플레인 코딩들을 개략적으로 도시하는 도면. 9 is a schematic illustration of bit plane codings of an LL subband according to an embodiment of the invention.
도 10은 본 발명의 실시 예에 따른 콘트라스트 증강들의 영향을 받는 이미지의 히스토그램 다이어그램들에서 시프트들을 개략적으로 도시하는 도면.FIG. 10 schematically illustrates shifts in histogram diagrams of an image affected by contrast enhancements in accordance with an embodiment of the present invention. FIG.
도 11은 본 발명의 실시 예에 따른 예시적인 콘트라스트 스트레칭(stretching) 변환을 개략적으로 도시하는 도면. FIG. 11 is a schematic illustration of an exemplary contrast stretching transformation in accordance with an embodiment of the invention. FIG.
도 12는 본 발명의 실시 예에 따른 스칼라 곱셈/ 나눗셈에 의한 이미지 변 조의 오퍼레이션 시퀀스를 개략적으로 도시하는 도면. FIG. 12 schematically illustrates an operation sequence of image modulation by scalar multiplication / division according to an embodiment of the present invention. FIG.
도 13은 본 발명의 실시 예에 따른 이미지 변조 모듈의 예시적인 구현을 도시하는 도면. 13 illustrates an example implementation of an image modulation module according to an embodiment of the invention.
아래의 다양한 실시 예들의 설명에서, 본 발명의 일부를 형성하는 첨부된 도면들을 참조하고, 이것은 본 발명이 수행되는 다양한 실시 예들을 도시하는 예로서 보여진다. 다른 실시 예들이 이용될 수 있고, 본 발명의 범위를 벗어남이 없이 구조적이고 기능적인 변경들을 할 수 있음이 이해되어야 한다. 동일한 참조 번호들이 유사하거나 동일한 부분들을 참조하는 도면들 및 설명들에 사용된다. In the following description of the various embodiments, reference is made to the accompanying drawings that form a part hereof, which is shown by way of illustration of various embodiments in which the invention is performed. It is to be understood that other embodiments may be utilized and structural and functional changes may be made without departing from the scope of the present invention. Like reference numerals are used in the drawings and the descriptions that refer to similar or identical parts.
도 1a의 블록도는 휴대용 소비자 전자(consumer electronic, CE) 장치(100)의 주요 구조적 컴포넌트(component)들을 도시하고, 그것은 예시적으로 본 발명에 사용되는 어떤 종류의 휴대용 소비자 전자(CE) 장치에라도 나타낼 수 있다. 본 발명이 도시된 CE 장치(100) 또는 어느 다른 특정 종류의 휴대용 CE 장치에도 제한되지 않음을 이해하여야 한다. 도시된 휴대용 CE 장치(100)는 예시적으로 카메라 폰으로 수행되고, 그것은 전형적으로 이미지 캡처 센서(image capturing sensor)에 의한 이미지 캡처 성능이 있는 셀룰러 폰을 나타낸다. The block diagram of FIG. 1A shows the main structural components of a portable consumer electronic (CE)
특히, 장치(100)는 중앙 처리 유닛(central processing unit, CPU)(110), 데이터 스토리지(120), 애플리케이션 스토리지(130), (도시되지 않은) 무선 주파수 안테나가 있는 셀룰러 무선 주파수 인터페이스(cellular radio frequency interface, I/F)(180) 및 가입자 식별 모듈(subscriber identification module; SIM)(170)을 포함하는 셀룰러 통신 수단, 오디오 입력/출력(I/O) 수단(140)(전형적으로 마이크 및 확성기), 키 입력 제어기(Ctrl)가 있는 키들, 키패드 및/ 또는 키보드(150), 및 디스플레이 제어기(Ctrl)가 있는 디스플레이(160)를 포함하는 사용자 인터페이스 입력/ 출력 수단들, 이미지 프로젝션(projection)을 위한 전형적인 (도시되지 않은) 옵틱(optic)들이 있는 (도시되지 않은) CCD (charge- coupled device) 센서 (도시되지 않음)를 포함하는 이미지 캡처 센서(10), 및 이미지 핸들링(handling)을 위해 요구되는 몇몇의 독립적 및 종속적 모듈들과 컴포넌트들의 예시적인 구현을 나타내는 이미지 처리(processing) 모듈(20)을 포함하는 프로세서 기반의 또는 마이크로제어기 기반의 장치로서 구체화된다.In particular, the
CE 장치(100)의 오퍼레이션은 전형적으로 CE 장치의 특징(feature)들 및 기능을 사용자에게 이용하게 함으로써, CE 장치의 특징들 및 기능을 제어하는 오퍼레이션 시스템 또는 기본적인 제어 애플리케이션에 기초한 중앙 처리 유닛(CPU)(100)에 의해 제어된다. 디스플레이 및 디스플레이 제어기(Ctrl)(160)는 중앙 처리 유닛(CPU)(110)에 의해 제어되고 사용자에게 정보를 제공한다. 키패드 및 키패드 제어기(Ctrl)(150)는 사용자가 정보를 입력할 수 있게 제공된다. 키패드를 통해 입력된 정보는 키패드 제어기(Ctrl)에 의해 중앙 처리 유닛(CPU)(110)에 제공되고, 그것은 입력 정보에 따라 명령받고, 그리고/ 혹은 제어될 수 있다. 오디오 입력/출력(I/O) 수단(140)은 적어도 오디오 신호를 재생하기 위한 스피커 및 오디오 신호를 레코딩(recording)하기 위한 마이크를 포함한다. 중앙 처리 유닛(CPU)(110)은 예를 들어 오디오 데이터가 전송 및 저장(storing)에 대해 적절한 포맷을 갖고 있 는 경우, 오디오 출력 신호들로의 오디오 데이터의 변환 및 오디오 데이터로의 오디오 입력 신호들의 변환을 제어할 수 있다. 디지털 오디오를 오디오 신호로 그리고 그 반대로의 오디오 신호의 변환은 전통적으로 디지털/ 아날로그 및 아날로그/ 디지털 회로에 의해 지원된다. The operation of the
추가적으로, 도 1a에 도시된 본 발명의 특정 실시 예에 따른 휴대용 CE 장치(100)는 선택적으로 무선 주파수 안테나에 연결된 셀룰러 인터페이스(I/F)(180)를 포함하고, 가입자 식별 모듈(SIM)(170)과 동작 가능하다. 셀룰러 인터페이스(I/F)(180)는 셀룰러 안테나로부터 신호들을 수신, 신호들을 디코딩(decode), 신호들을 복조, 및 신호들을 베이스밴드 주파수로 바꾸는 셀룰러 트랜시버로서 설치된다. 셀룰러 인터페이스(180)는 무선(over-the-air) 인터페이스를 제공하고, 그것은 가입자 식별 모듈(subscriber identification module, SIM)에 연결되어, 공중 육상 이동 통신망(public land mobile network, PLMN) 중 무선 접속망(radio access network, RAN)의 대응하는 기지국(base station, BS)과의 셀룰러 통신을 서비스한다. 셀룰러 인터페이스(I/F)(180)의 출력은 따라서 중앙 처리 유닛(CPU)(110)에 의한 추가의 처리를 요구할 수 있는 데이터 스트림으로 구성된다. 셀룰러 트랜시버로 설치된 셀룰러 인터페이스(I/F)(180)는 중앙 처리 유닛(CPU)으로부터 데이터를 수신하도록 또한 구성되고, 그것은 무선(over-the-air) 인터페이스를 통해 무선접속망(RAN)의 기지국(BS)으로 전송된다. 따라서, 셀룰러 인터페이스(I/F)(180)는 데이터를 인코딩, 변조 및 상향 변환하여 무선 주파수 신호로 구체화한다. 셀룰러 안테나는 그 후에 그 결과인 무선 주파수를 공중 육상 이동 통신 망(public land mobile network, PLMN) 중 무선 접속망(random access network; RAN)의 기지국(BS)으로 전송한다. Additionally,
이미지 캡처 센서(10)는 전형적으로 전하 결합 소자(charge-coupled device, CCD) 및 옵틱(optic)들로 구현된다. 픽셀들로된 그리드(grid)들을 포함하는 전하 결합 소자(CCD)들은 디지털 카메라들, 디지털 광학 스캐너들 및 디지털 비디오 카메라들 내에서 빛 감지 장치(light-sensing device)들로서 디지털 이미지 캡처에 사용된다. 각각의 커패시터가 그 위치에서 빛의 세기에 비례하여 전하를 축적하도록 하면서, 이미지는 커패시터 어레이(capacitor array, CCD) 상에서 옵틱들(단일 렌즈 또는 하나 이상의 렌즈들의 배열(arrangement))에 의해 프로젝트된다. 디지털 비디오 및 디지털 스틸(still) 카메라들에서 사용되는 2차원 어레이는 전체 이미지 또는 전체 이미지의 사각형 부분을 캡처한다. 어레이가 이미지에 나타난 후에는, 제어 회로는 각각의 커패시터가 자신의 콘텐츠를 이웃하는 커패시터에게 전송하도록 한다. 어레이에서 마지막 커패시터는 전하를 전압으로 변환하는 증폭기로 자체의 전하를 덤프한다(dump). 이 과정을 반복함으로써, 제어 회로는 어레이의 전체 콘텐츠들을 다양한 전압들로 변환하고, 이미지 처리 모듈(20)에 의한 추가의 핸들링을 위해 원본(raw) 이미지 데이터를 샘플링하고(sample), 디지털화하고, 제공한다. 이미지 처리 모듈(20)로 CE 장치(100)의 사용자는 스틸 디지털 이미지들을 찍을 수 있고 결과적으로는 비디오 시퀀스(sequence)들 또한 찍을 수 있다. 통상적으로, 원본 이미지 데이터는 이미지 처리 모듈(20)에 의해 압축되고 데이터 스토리지 내에 저장된다. 이미지 처리 모듈(20)은 다른 것들 중에서도 코덱들, 즉 스틸 디지 털 이미지 처리(및 비디오 처리)에 요구되는 코딩 및 인코딩 모듈들을 구현하고, 이미지 처리 모듈(20)의 구현되는 컴포넌트들은 바람직하게는 소프트웨어 애플리케이션 컴포넌트들이고, 그 오퍼레이션은 특정 하드웨어 구현에 의해 지원되고, 이미지 처리 모듈(20)의 처리 성능 및 기능을 향상시키는데 유리하다. Image capture sensor 10 is typically implemented with charge-coupled devices (CCDs) and optics. Charge coupled devices (CCDs) comprising grids of pixels are used for digital image capture as light-sensing devices in digital cameras, digital optical scanners and digital video cameras. The image is projected by optics (a single lens or an arrangement of one or more lenses) on a capacitor array (CCD), allowing each capacitor to accumulate charge in proportion to the light intensity at that location. Two-dimensional arrays used in digital video and digital still cameras capture the entire image or rectangular portions of the entire image. After the array appears in the image, the control circuitry causes each capacitor to transfer its content to a neighboring capacitor. The last capacitor in the array dumps its charge to an amplifier that converts it to voltage. By repeating this process, the control circuit converts the entire contents of the array into various voltages, samples the raw image data for further handling by the image processing module 20, digitizes it, to provide. The image processing module 20 allows the user of the
최근에 CMOS 이미지 센서들이 대중화되어서 일반적으로 이미지 캡처의 경우, CCD들을 대체한다. CMOS 이미지 센서들은 모든 칩제조에 주된 기술인, CMOS 제조 공정을 이용하여 생산될 수 있고, CMOS 이미지 센서들은 제조 비용이 싸고, 신호 컨디셔닝(conditioning) 회로가 동일한 장치에 포함될 수 있다. 본 발명이 어느 특정 이미지 캡처 센서 유형에 제한되지 않음이 이해되어야 한다. 전형적인 대안적 휴대용 CE 장치들은 PDA들(personal digital assistants), 핸드헬드 컴퓨터들 등을 포함할 수 있고, 그것은 이미지 캡처 센서들을 구비하고 이미지 처리 성능을 가질 수 있다. CE 장치들에 따른 이런 전형적인 마이크로 제어기의 구현은 당업계에 주지되어 있으므로, 상세한 구현들은 본 발명의 구현 범위 밖이다. Recently CMOS image sensors have become popular and generally replace CCDs in the case of image capture. CMOS image sensors can be produced using a CMOS fabrication process, which is the dominant technology in all chip manufacturing, and CMOS image sensors can be inexpensive to manufacture and can be included in devices with the same signal conditioning circuitry. It should be understood that the present invention is not limited to any particular image capture sensor type. Typical alternative portable CE devices may include personal digital assistants, handheld computers, and the like, which may have image capture sensors and have image processing capability. Since the implementation of such a typical microcontroller in accordance with CE devices is well known in the art, the detailed implementations are outside the implementation scope of the present invention.
도 1b의 블록도는 휴대용 소비자 전자(CE) 장치(101)의 주요 구조적 컴포넌트들을 도시하고, 본 발명에 이용가능한 어떤 종류의 휴대용 소비자 전자(CE) 장치도 예시적으로 나타낼 수 있다. The block diagram of FIG. 1B shows the main structural components of the portable consumer electronics (CE) device 101, and may illustratively represent any kind of portable consumer electronics (CE) device available in the present invention.
도시된 휴대용 CE 장치(101)는 예시적으로 사용자가 디지털 이미지 캡처를 할 수 있게 하는 디지털 카메라로서 수행된다. 특히, 장치(101)는 마이크로 제어기(μC), 이미지 데이터 스토리지(121), 키 입력 제어기(Ctrl)(151)를 통해, 마이크로 제어기(μC)(111)와 커플링된 키들 및 디스플레이 제어기(Ctrl)(161)가 있는 디스플레이를 포함하는 사용자 인터페이스 입력/ 출력 수단, 이미지 프로젝션을 위해 (도시되지 않은) 옵틱들이 있는 (도시되지 않은) 전형적인 CCD(charge-coupled device) 또는 CMOS 이미지 센서를 포함하는 이미지 캡처 센서(10), 및 이미지 핸들링(handling)에 요구되는 예시적인 몇몇의 종속적 및 독립적 모듈들 및 컴포넌트들의 구현(implentation)을 나타내는 이미지 처리 모듈(20)을 포함하는 마이크로 제어기(micro-controller)(μC) 기반의 장치로 구체화된다. CE 장치(101)의 오퍼레이션은 마이크로 제어기 (μC)(111)에 의해 제어되고, 그것은 구현된 컴포넌트들의 오퍼레이션을 제어한다. 사용자는 키 입력에 의해 CE 장치(101)와 상호작용할 수 있고, 그것은 CE 장치(101)의 기능들에 영향을 준다. 전통적으로, 이런 CE 장치들(101)은 처리기반의 CE 장치와는 다르게 자체의 오퍼레이션들이 고정되어 있다. 디지털 카메라들의 구현은 당업계에 주지되어 있고, 구현의 세부사항들은 본 발명의 구현의 범위 밖이다. The illustrated portable CE device 101 is illustratively performed as a digital camera that allows a user to capture digital images. In particular, the device 101 is connected to the microcontroller (μC) 111 via the microcontroller (μC), the image data storage 121, the key input controller (Ctrl) 151 and the display controller (Ctrl). User interface input / output means including a display with 161, an image comprising a typical charge-coupled device (CCD) or CMOS image sensor (not shown) with optics (not shown) for image projection Micro-controller comprising a capture sensor 10 and an image processing module 20 representing the implementation of some exemplary dependent and independent modules and components required for image handling ( is embodied in μC) based devices. The operation of the CE device 101 is controlled by the microcontroller (μC) 111, which controls the operation of the implemented components. The user can interact with the CE device 101 by key input, which affects the functions of the CE device 101. Traditionally, these CE devices 101 have their operations fixed, unlike processing-based CE devices. The implementation of digital cameras is well known in the art, and the details of the implementation are outside the scope of the implementation of the present invention.
그럼에도 불구하고, 하드와이어드(hard-wired) 또는 소프트웨어적 애플리케이션에 기반을 둔 이미지 캡처 센서(10)의 구현은 동일한 기능을 사용자에게 제공할 수 있다. 추가의 설명은 본 발명의 개념에 중점을 둘 것이고, 이는 (이미지 처리 모듈(20) 내에 구현된 도 1a, 도 1b를 참조하여) CE 장치들(100, 101) 내에 구현된 이미지 처리에 일반적으로 관련된다. 특히, 본 발명의 개념은 이미지 조작( manipulation), 편집(editing), 필터링(filterting), 등에 관련되고, 그것은 사용자 명령(instruction)에 따라 동작하거나, 자동적으로 및/ 또는 독립적으로 또한 동작할 수 있다. 도 2를 참조하여, 이미지 조작, 편집, 필터링 등의 전형적인 프로 세스가 도시될 것이다. 이미지가 주어지고, 사용자가 이미지를 콘트라스트 증강( contrast enhancement)를 위해 조정하길 원한다고 가정한다. 명도 조정(brightness adjustment), 콘트라스트 증강 또는 칼라(color) 필터링과 같은, 전형적인 단순한 이미지 증강 및/ 또는 처리 오퍼레이션들은 CE 장치들(100) 내에서 압축된 이미지 표현의 완전한(full) 디코딩, 공간 도메인(spatial domain)에서 이런 오퍼레이션들의 응용, 및 압축된 이미지 표현을 위해, 편집/ 변경된 이미지의 완전한 재압축을 요구한다. 휴대용 CE 장치들의 경우, 계산 능력(computational power) 및 메모리에 제한되고, 이런 이미지 처리 오퍼레이션들은 특히 이미지가 높은 해상도를 가진다면, 계산에 있어 비용이 들 수 있다. 계산 능력 및 메모리의 영역은 계산 시간, 계산 부하(computin load), 모듈에 대한 권한부여(module empowerment)(모듈이 선택적인 활성화/ 비활성화의 경우)로 인한 전기적 전력 소모 뿐만 아니라 휴대용 CE 장치들의 무게 및 크기의 관점에서, 그런 휴대용 CE 장치들의 전체적인 디자인을 결정한다. 이와 같이, 본 발명이 관련된 전형적인 종류의 휴대용 CD 장치들을 생산하는, 디지털 카메라 제조업자 및 카메라 휴대폰 제조업자들은 그들이 갖는 이미지들의 해상도를 증가시키려고 경쟁하는 것에 주목해야 한다. Nevertheless, the implementation of the image capture sensor 10 based on hard-wired or software applications may provide the user with the same functionality. Further description will focus on the concepts of the present invention, which is generally directed to image processing implemented within
현재, 휴대폰들의 경우 2메가 픽셀의 센서들까지 있고, 전형적인 디지털 카메라들의 경우 5메가 픽셀의 센서들까지 있다. 이런 수치들은 더 늘어날 전망이다. 편집/ 처리 이미지들에서, 사용자들은 일반적으로 명암을 조정하고, 콘트라스트를 개선하고, 이미지들의 화질(visual quality)을 향상시키기 위해 다른 필터링 오퍼레이션들을 적용한다. 전술된 바와 같이, 이런 오퍼레이션들은 상당한 시간 및 전 력이 들 수 있는 조정된 디지털 이미지들을 복원 및 재압축하여 수행된다. 극히 작은 크기의 칼라 디지털 이미지를 압축하는 것은 (사용된 압축 알고리즘의 계산의 복잡도 및 휴대용 CD 장치에 의해 제공된 계산 능력에 따라) 약 1 유닛의 시간이 걸릴 수 있다고 가정한다. 칼라 이미지 크기를 예를 들어, VGA (640x480 pixels)로 증가시키면 대응하는 압축시간이 약 4배가 된다. 단순한 선형 확장(linear extension)인 이런 관찰 결과들은 1 메가 픽셀의 칼라 디지털 이미지 당 인코딩 시간은 (극히 작은 크기의 칼라 디지털 이미지에 비교해) 13배 이상으로 증가될 수 있음을 나타낸다. 사실상, 이미지 해상도에서 1 메가 픽셀씩 증가하면 입출력 해상도 요인에 따라, 인코딩 시간이 추가로 증가한다. Currently, there are up to 2 megapixel sensors for cell phones and up to 5 megapixel sensors for typical digital cameras. These figures are expected to increase further. In edited / processed images, users generally apply other filtering operations to adjust contrast, improve contrast, and improve the visual quality of the images. As mentioned above, these operations are performed by reconstructing and recompressing the adjusted digital images, which can be of significant time and power. It is assumed that compressing an extremely small sized color digital image can take about 1 unit of time (depending on the computational complexity provided by the portable CD device and the complexity of the computation of the compression algorithm used). Increasing the color image size, for example, to VGA (640x480 pixels), results in about four times the corresponding compression time. These observations, which are just linear extensions, indicate that the encoding time per color digital image of one mega pixel can be increased by more than 13 times (compared to very small color digital images). In fact, increasing by 1 megapixel in image resolution further increases encoding time, depending on input and output resolution factors.
아래에서, JPEG 2000 압축 알고리즘은, JPEG 보다 우수한 이미지 압축과 해상도 및 퀄리티에 있어서 축소, 확대 능력(scalability)과 같은 이미지 애플리케이션들을 위한 새로운 중요한 특징들 때문에 향후 표준 압축 알고리즘이 될 것이다. 도 3은 개략적으로 JPEG 2000 복원(디코딩으로 또한 지칭될 수 있음)뿐만 아니라 JPEG 2000 압축(인코딩으로도 지칭될 수 있음)을 도시한다. In the following, the JPEG 2000 compression algorithm will become the standard compression algorithm in the future due to better image compression than JPEG and new important features for image applications such as scaling and scaling in resolution and quality. 3 schematically illustrates JPEG 2000 compression (which may also be referred to as encoding) as well as JPEG 2000 reconstruction (which may also be referred to as decoding).
전형적인 JPEG 2000 인코더(200)의 오퍼레이션 흐름도가 도 3으로부터 얻을 수 있다. 압축 시퀀스(compressing sequence) 전의 인코더(200)의 (도시되지 않은)제1 모듈은 별개의 모듈이고, 그것의 기능은 상당한 크기의 디지털 이미지들을 위해 관습적으로 요구되는 다루기 쉬운 크기로 이미지를 자르는 것이고, 그 디지털 이미지들은 동일한 크기의 공간적으로 오버래핑되지 않은 타일(tile)들로 분리된다. 그 후에 각각의 컴포넌트는 별개로 처리된다. 아래에, 상관 해 제(decorrelation) 단계 모듈(210)이 주어지고, 그것의 기능은 디지털 칼라 이미지의 칼라 컴포넌트들을 상관 해제하는 것이다. 특정 칼라 이미지들 내에, 멀티컴포넌트 이미지들의 경우, 컴포넌트들을 상관 해제하기 위해 컴포넌트 변환(transform)이 수행된다. 예를 들어, RGB (red, green and blue) 컴포넌트들을 가진 칼라 이미지는 YCrCb (Luminance, Chrominance red and Chrominance blue) 또는 RCT (reversible component transform) 컴포넌트 공간으로 변환될 수 있다. (디지털 이미지 및 디지털 이미지의 컴포넌트들 각각의) 이미지 데이터는 변환 모듈(220)에 제공되고, 변환 모듈(220)은 이미지 데이터를 웨이브렛 도메인(wavelet domain)으로 변환시키도록 구성된다. 변환 후에, 웨이브렛 도메인 내의 이미지 데이터는 양자화 모듈(330)에 의해 양자화된다. 그 후에, 양자화 오퍼레이션의 결과인 양자화된 계수들은 로컬라이즈된(localized) 공간 및 해상도 액세스를 쉽게 하기 위해 엔트로피(entropy) 인코딩 모듈(240)에 의해 재그룹화(regroup)된다. An operation flow diagram of a typical JPEG 2000 encoder 200 can be obtained from FIG. 3. The first module (not shown) of the encoder 200 before the compression sequence is a separate module, the function of which is to crop the image to the manageable size customarily required for significant size digital images. The digital images are separated into spatially nonoverlapping tiles of the same size. Each component is then processed separately. Below, a decorrelation step module 210 is given, whose function is to de-correlate color components of the digital color image. Within certain color images, in the case of multicomponent images, component transform is performed to uncorrelate the components. For example, a color image with RGB (red, green and blue) components can be transformed into Luminance, Chrominance red and Chrominance blue (YCrCb) or reversible component transform (RCT) component space. Image data (each of the digital image and components of the digital image) is provided to a conversion module 220, which is configured to convert the image data into a wavelet domain. After the transformation, image data in the wavelet domain is quantized by
양자화된 계수들의 각각의 서브밴드(subband)는 오버래핑되지 않은 직사각형 블록들로 나뉜다. 3개의 공간적으로 함께 위치한 직사각형들(주어진 해상도 레벨에서 각각의 서브밴드 중 하나의 서브밴드)이 패킷 파티션(packet partition)을 형성한다. 각각의 패킷 파티션은 추가로 코드 블록들로 나뉘고, 각각의 코드 블록들은 레이트 일그러짐 커브(rate-distortion curve)를 가진 임베디드 비트 스트림으로 압축된다. 코드 블록들의 임베디드 비트 스트림은 비트 스트림 어셈블러(assembler) 모듈(250)에 의해 패킷들로 어셈블되고, 각각의 패킷들은 하나의 공간 위치(location)에서 하나의 해상도 레벨의 퀄리티 증가(quality increment)를 나타낸다. 전체 이미지에서 하나의 퀄리티 증가인 레이어가 최대한의 해상도에 있도록, 레이어는 전체 타일들 및 전체 컴포넌트들의 전체 해상도 레벨들의 전체 패킷 파티션들로부터 패킷들을 모아서 형성된다. 최종 JPEG 2000 비트 스트림은 다중 레이어들로 구성될 수 있다는 것을 알아야한다. Each subband of the quantized coefficients is divided into rectangular blocks that are not overlapped. Three spatially located rectangles (one of each subband at a given resolution level) form a packet partition. Each packet partition is further divided into code blocks, each code block being compressed into an embedded bit stream with a rate-distortion curve. The embedded bit stream of the code blocks is assembled into packets by the bit
유사하게, 전형적인 JPEG 2000 디코더(300)의 오퍼레이션 흐름도는 또한 도 3으로부터 얻을 수 있다. JPEG 2000 압축된 이미지 표현의 디코딩 및 복원은 JPEG 2000 인코더(200)를 참조하여 위에서 설명된 각각의 모듈 기능들에 관해 역기능들을 수행하는 모듈들을 제공한다. 압축된 이미지 표현이 비트 스트림 파싱(parsing) 모듈(310)에 제공되고, 비트 스트림 파싱(parsing) 모듈(310)은 요구되는 컴포넌트들 및 타일들 및 최종적으로는 그 속에 어셈블된 패킷들 내에 포함된 코드블록들을 분리 및/ 또는 추출한다. 엔트로피 디코딩 모듈(320)은 엔트로피 인코딩 모듈(310)에 의해 얻은 재그룹화(regroup)를 반대로 하도록(reverse) 구성된다. Similarly, an operational flow diagram of a typical JPEG 2000 decoder 300 can also be obtained from FIG. 3. Decoding and reconstruction of the JPEG 2000 compressed image representation provides modules that perform inverse functions with respect to each of the module functions described above with reference to the JPEG 2000 encoder 200. A compressed image representation is provided to the bit stream parsing module 310, which is included in the required components and tiles and finally packets assembled therein. Separate and / or extract code blocks. Entropy decoding module 320 is configured to reverse the regrouping obtained by entropy encoding module 310.
역 양자화 모듈(330)은 양자화된 계수들로부터 웨이브릿 도메인 내에 있는 이미지 데이터를 재구성하고 웨이브릿 도메인 내에 이미지 데이터는 역 변환 모듈(340)에 제공되고, 역 변환 모듈(340)은 역 웨이브릿 변환을 수행하여 공간 도메인 내에 이미지 데이터가 생기도록 구성된다. 그 후에 역 상관 해제 단계 모듈(350)은 상관 해제된 컴포넌트들을 재변환한다. 이것은, 예를 들어, YCrCb (Luminance, Chrominance red and Chrominance blue) 또는 RCT (reversible component transform) 컴포넌트 공간 내의 칼라 이미지가 RGB (red, green and blue) 컴포넌트들이 있는 칼라 이미지로 변환되는 것을 의미한다. 이미지 크기 때 문에 공간적으로 동일한 크기의 오버래핑되지 않은 타일들로 분리하는 경우, 상관 해제 단계 모듈(350)에 잇따른 디코더(300)의 (도시되지 않은) 최종 모듈은 디코딩 동안에 별개로 처리되는 컴포넌트들을 합병한다.
JPEG 2000 은 표준화된 이미지 압축 알고리즘이고, JPEG(Joint Photographic Experts Group)에서 개발되어왔고 ISO(International Standards Organization)에 의해 ISO/IEC 15444-1 :2000으로서 발행되었고, 이것은 배경기술로서 참조 병합됨을 주의해야한다. JPEG 2000 표준에 따른 인코딩/ 압축은 JPEG 2000 표준에 따른 디코딩/ 복원에 비해 약 1.2배 걸린다. 인코딩의 경우, 아래의 숫자들은 각 오퍼레이션이 걸리는 시간의 대략적인 퍼센티지들이다(리스트는 총망라한 것이 아니라, 즉 단지 주요 요인(contribution)들만 언급한 것이다)Note that JPEG 2000 is a standardized image compression algorithm, developed by the Joint Photographic Experts Group (JPEG) and published by the International Standards Organization (ISO) as ISO / IEC 15444-1: 2000, which is incorporated by reference as a background art. do. Encoding / compression according to the JPEG 2000 standard takes about 1.2 times compared to decoding / decompression according to the JPEG 2000 standard. For encoding, the numbers below are approximate percentages of how long each operation takes (the list is not exhaustive, i.e. it only mentions the main contributions).
- 이미지 데이터 독취(reading) :~5% Image data reading: ~ 5%
- (필요하다면) 칼라 상관 해제 : ~5%-Unnecessary color (if necessary): ~ 5%
- 웨이브릿 변환 : ~ 10%Wavelet Transformation: ~ 10%
실행될 분해(decomposition)의 개수에 따라 비트들을 변경할 수 있음 Bits can change depending on the number of decompositions to be performed
- 엔트로피 코딩: 70%Entropy Coding: 70%
타겟이 되는 픽셀 당 비트들에 따라 변할 수 있음. Can vary depending on the bits per pixel being targeted.
JPEG 2000 표준은 비트 플레인(bit-plane) 기반의 인코더. The JPEG 2000 standard is a bit-plane based encoder.
이미지 퀄리티 및 계산 복잡도는 인코딩할 비트 플레인들의 수를 증가시킴에 따라 증가함 Image quality and computational complexity increase with increasing number of bit planes to encode
- 할당율 및 비트 스트림 어셈블리: ~10%Allocation rate and bit stream assembly: ~ 10%
복원의 경우, 오퍼레이션들은 본질상 대칭적인 계산 능력을 요구한다((리스트는 총망라한 것이 아니라, 즉 단지 주요 요인(contribution)들만 언급한 것이다)In the case of reconstruction, operations require symmetric computational power in nature (the list is not exhaustive, ie only mentions the main contributions).
- 비트 스트림 파싱: ~5%Bitstream parsing: ~ 5%
- (필요하다면) 역 칼라 상관 해제: ~5%Reverse color disassociation (if needed): ~ 5%
- 역 웨이브릿 변환: ~10%Inverse Wavelet Conversion: ~ 10%
실행될 분해(decomposition)의 개수에 따라 비트들을 변경할 수 있음 Bits can change depending on the number of decompositions to be performed
- 역 엔트로피 디코딩: ~70%Reverse entropy decoding: ~ 70%
타겟이되는 픽셀 당 비트들에 따라 변할 수 있음. Can change depending on the bits per pixel being targeted.
JPEG 2000 표준은 비트 플레인(bit-plane) 기반의 코더. The JPEG 2000 standard is a bit-plane based coder.
이미지 퀄리티 및 계산 복잡도는 각각 인코딩 및 디코딩할 비트 플레인들의 수를 증가시킴에 따라 증가함 Image quality and computational complexity increase with increasing number of bit planes to encode and decode, respectively
- 이미지 데이터를 쓰기:~10%.-Write image data: ~ 10%.
처리 오퍼레이션들의 성능을 증가시키기 위해, 이미지 콘텐츠를 변경시킨 후에 이미지를 재인코딩하는(re-encoding) 것을 회피할 필요가 있다. 이것은 기본적으로 인코딩 프로세스, 즉 엔트로피 코딩 및 디코딩 프로세스들에서 주요 요인들을 회피하는 것을 의미한다. 도 2뿐만 아니라 전술한 열거에서 알 수 있듯이, 계산 시간에서 상당한 이득을 얻으면서, 원본 이미지를 변경하여 변경된 이미지를 만들려는 오퍼레이션들을 수행하는 것은 엔트로피 코딩/ 디코딩 부분을 가능한 한 회피하는 것을 필요로 한다. 계산 복잡도의 관점에서, 엔트로피 인코딩/ 디코딩은 장애가 된다. 계산 비용에서 상당한 이득은 동일한 것을 회피함으로써 얻을 수 있다. In order to increase the performance of processing operations, it is necessary to avoid re-encoding the image after changing the image content. This basically means avoiding the main factors in the encoding process, ie the entropy coding and decoding processes. As can be seen from the enumeration described above, as well as in FIG. 2, performing operations to change the original image to produce a modified image, while gaining significant gains in computation time, requires avoiding the entropy coding / decoding portion as much as possible. . In terms of computational complexity, entropy encoding / decoding is an obstacle. Significant gains in computational cost can be obtained by avoiding the same.
애플리케이션에서 가장 많이 존재하는 고성능의 이미지 인코더들은 변환 기반의 코더들이다. 변환은 픽셀들을 상관 해제하고 픽셀들의 에너지를 적은(small) 수의 계수들로 압축하여 변환 계수들의 효율적인 코딩이 되게한다. 대부분의 에너지가 약간 큰 변환 계수들로 압축되기 때문에, 엔트로피 코딩 스킴은 효율적으로 그것들을 인코딩하는데 사용될 수 있다. The most common high performance image encoders in an application are transform-based coders. The transform de-correlates the pixels and compresses the energy of the pixels into a small number of coefficients for efficient coding of the transform coefficients. Since most of the energy is compressed into slightly larger transform coefficients, an entropy coding scheme can be used to encode them efficiently.
웨이브릿 변환은 전체 이미지 상에 작용한다(또는 큰 칼라 이미지의 경우, 이미지의 일부, 컴포넌트의 한 타일) 예를 들어 이산(discrete) 코사인 변환의 경우보다 더 나은 에너지 압축을 제공하고, 코딩 후에 어떤 블로킹(blocking) 아티팩트(artifact)도 없다. 도 4에 도시된 것과 같이, 게다가, 웨이브릿 변환은 이미지를 L 레벨의 다이어딕(dyadic) 웨이브릿 피라미드로 분해한다. 결과로서 생기는 웨이브릿 계수는 쉽게 해상도의 면에서 스케일링될 수 있다: 가장 세밀한(finest) M 레벨들에서 웨이브릿 계수들을 사용하지 않고, 이미지는 원본 이미지보다 2M 배 작게 재구성될 수 있다. 웨이브릿 변환의 다중 해상도 성능은 스케일링 가능한 이미지 코딩에 그것을 이상적으로 알맞게 유도한다. The wavelet transform acts on the entire image (or part of the image, one tile of a component in the case of a large color image), providing better energy compression than in the case of discrete cosine transforms, There are no blocking artifacts. In addition, the wavelet transform decomposes the image into L level dyadic wavelet pyramids, as shown in FIG. 4. The resulting wavelet coefficients can be easily scaled in terms of resolution: the image can be reconstructed 2 M times smaller than the original image, without using wavelet coefficients at the finest M levels. The multiresolution capability of the wavelet transform makes it ideally suited for scalable image coding.
웨이브릿은, 저역 통과 계수들이 긴 데이터 세그먼트(segment)의 저속 변경을 나타내고, 고역 통과 계수들이 짧은 데이터 세그먼트에서 로컬라이즈된 변경을 나타내는 신호 표현이다. 1차원의 웨이브릿 변환의 프레이윅(framework)이 도면 5a 및 5b에 도시된다. 입력 로우(input row)는 저역 및 고역 통과 분해(analysis) 유한 임펄스 응답(finite impulse response, FIR) 필터를 통해서 분해될 수 있고, 필 터링한 결과를 인자(factor) 2로 서브샘플링한다(sub sample). 원본 입력 열을 재구성하기 위해서, 저역 통과 및 고역 통과 계수들은 인자(factor) 2로 업샘플링(sample)되고, 또 다른 저역 및 고역 합성 FIR 필터 쌍을 통해 통과한다. A wavelet is a signal representation in which low pass coefficients represent a slow change in a long data segment and high pass coefficients represent a localized change in a short data segment. The framework of the one-dimensional wavelet transform is shown in Figures 5a and 5b. The input row can be resolved through low and high pass analysis finite impulse response (FIR) filters, and subsamples the filtered result by
아래의 섹션들은 디지털 이미지들 상에서 수행되는 조작 오퍼레이션들의 수학적 표기를 소개할 것이다. 표기 목적 하에, 원본이미지는 로 명시되고, 결과인 조작된(처리된, 편집된 등) 이미지는 로 명시된다. The sections below will introduce the mathematical notation of the manipulation operations performed on digital images. For the purpose of marking, the original image The resulting manipulated (processed, edited, etc.) image is It is specified as.
명도 조정- 스칼라 추가/ 삭감( Brightness Adjustment - scalar addition / subtraction)Brightness Adjustment-scalar addition / subtraction
이 이미지 조작 오퍼레이션에서, 및 사이의 관계는 아래와 같이 주어진다:In this image manipulation operation, And The relationship between is given by:
이 때, , 한 세트의 정수들이다. 예를 들어, 전형적인 디지털 칼라 이미지들은 8비트의 휘도(luminance) 표현을 가질 수 있고, 휘도는 256개의 상이한 레벨들을 가질 수 있고; 따라서 D = [- 255, 255]이다. 만약 인 방정식(1)이 D의 범위를 초과한다면, D에서 가장 가까운 값으로 잘려진다. At this time, , A set of integers. For example, typical digital color images may have an 8-bit luminance representation, and the luminance may have 256 different levels; Thus D = [-255, 255]. if If Eq. (1) exceeds the range of D, it is truncated to the nearest value of D.
조건은 명도의 증가와 동일하고, 따라서 이미지를 더 밝게 하며, 은 명도의 감소와 동일하고, 따라서 이미지를 더 어둡게 만든다. 디지털 이 미지 상에서 명도 조정의 효과는 명도 오퍼레이션(operation) 전 및 후에 이미지의 히스토그램(histogram)을 봄으로서 알 수 있다(도 6). 아래의 섹션들은 압축 도메인 내에 디지털 이미지들 상에서 명도 오퍼레이션을 적용하는 방법을 논의한다. 공간 도메인에서 이미지의 이미지 데이터를 또 다른 추가의(more) 에너지 콤팩트(compact) 도메인 속으로 변환하기 위해, JPEG 2000 표준은 웨이브릿 변환을 이용한다. 표준의 베이스 라인에서, 허용되는 필터들은 5-3 또는 9-7 웨이브릿 필터들 중의 하나이다; 분해 유형은 다이어딕이다(dyadic)(또한, Mallat으로 알려짐) The condition is equal to the increase in brightness, thus making the image brighter, Is equivalent to a decrease in brightness, thus darkening the image. The effect of brightness adjustment on the digital image can be seen by looking at the histogram of the image before and after the brightness operation (FIG. 6). The sections below discuss how to apply lightness operations on digital images within the compression domain. In order to convert image data of an image in the spatial domain into another more energy compact domain, the JPEG 2000 standard uses wavelet transform. In the standard baseline, the allowed filters are one of 5-3 or 9-7 wavelet filters; The decomposition type is dyadic (also known as Mallat)
공간 도메인으로부터 웨이브릿 도메인(즉 지정(designation) 압축 도메인과 같음) 으로 (아래에 설명이 있는) 명도 및 콘트라스트 오퍼레이션들을 번역하는데 (translate) 요구되는 오퍼레이션들을 결정하기 위해, 우선적으로 아래에서 간략하게 정의될 이산 웨이브릿 변환(iscrete wavelet transform, DWT)으로 주지된 변환 오퍼레이션을 이해하는 것이 필요하다. In order to determine the operations required to translate brightness and contrast operations (described below) from the spatial domain to the wavelet domain (i.e., like the designation compression domain), we first define briefly below It is necessary to understand the transform operations known as discrete wavelet transforms (DWTs).
어느 연속 함수 는 아래의 전개식에 의해 표현될 수 있고, 스케일링(scaling) 함수 및 그 함수의 웨이브릿 도함수(derivative)들의 식으로 정의될 수 있다. :Which continuous function Can be expressed by the following expression, and can be defined by the expression of the scaling function and its wavelet derivatives. :
이때, 및 는 각각 스케일링 및 웨이브릿 계수들이고, 및 는 각각 스케일링 및 웨이브릿 함수들이다. 이 전개식에서, 제1 서메이션(summation)은 스케일에서 의 낮은 해상도 또는 정밀하지 않은 근사값을 나타내는 함수를 준다. 제2 서메이션에서 각 증가하는 에 대해, 더 높은 또는 더 정밀한 해상도 함수가 추가되고, 이것은 디테일(detail)을 증가시킨다. 위의 웨이브릿 전개식에서 계수들 및 의 세트는 함수 의 이산 웨이브릿 변환(discrete wavelet transform, DWT)이라고 지칭된다. At this time, And Are the scaling and wavelet coefficients, respectively, And Are the scaling and wavelet functions, respectively. In this development, the first summation is On the scale Gives a function that represents a low resolution or inexact approximation of. Increasing in the second summation For, a higher or more precise resolution function is added, which increases the detail. Coefficients in Wavelet Expansion And Set of functions Is referred to as a discrete wavelet transform (DWT).
아래의 2개의 관계식에 의해, 스케일에서 스케일링 및 웨이브릿 계수들은 스케일에서의 스케일링 계수들에 관련된다 :By the following two relations, In scaling, the scaling and wavelet coefficients Relates to scaling factors at scale:
위의 방정식들은 더 높은 스케일에서의 스케일링 계수들은 각각 스케일링 및 웨이브릿 필터들인 및 과 함께, 하위 스케일들에서의 웨이브릿 및 스케일링 계수들 또는 이산 웨이브릿 변환 계수들을 계산하는데 사용될 수 있다. The above equations indicate that the scaling factors at higher scale are scaling and wavelet filters, respectively. And Together, it can be used to calculate wavelet and scaling coefficients or discrete wavelet transform coefficients at lower scales.
사실상, 원본 해상도에서의 이산 신호는 스케일링 계수들에 대응한다고 가정한다. 따라서, 가 원본 해상도에서 스케일이라면, In fact, it is assumed that the discrete signal at the original resolution corresponds to the scaling factors. therefore, If is scale at original resolution,
하위 스케일들에서 이산 웨이브릿 변환 계수들은 아래의 방정식을 사용하여 얻어진다. Discrete wavelet transform coefficients at lower scales are obtained using the equation below.
신호의 DWT 을 공식화함으로써, 웨이브릿 도메인에서 명도 조정이 적용가능하다. 위에서 언급한 바와 같이, 공간 도메인에서 명도 오퍼레이션은 아래에 대응한다.:By formulating the DWT of the signal, brightness adjustment is applicable in the wavelet domain. As mentioned above, the brightness operation in the spatial domain corresponds to:
이때, 상수 는 이미지(원본 공간 해상도)의 레벨에서 적용되는 명도 오프셋을 의미한다. 명도 오퍼레이션을 거친 신호를 의미하는 프라임 기호를 사용하여, 상이한 스케일들 에서 웨이브릿 도메인 내의 대응하는 명도 오퍼레이션이 스케일링 및 웨이브릿 계수들(이산 웨이브릿 변환 (DWT) 계수들)의 항으로 아래와 같이 주어진다. Where constant Of the image (original space resolution) The brightness offset applied at the level. Prime means the signal after the brightness operation Using scales, different scales The corresponding brightness operation in the wavelet domain is given in terms of scaling and wavelet coefficients (discrete wavelet transform (DWT) coefficients) as follows.
스케일에서: On the scale:
방정식 (5) 및 (8)을 사용하여, Using equations (5) and (8),
스케일에서: On the scale:
이때, At this time,
스케일에서: On the scale:
이 때, At this time,
이런 형식으로 나아가서 , 인 일반적인 스케일의 경우, 스케일 계수들은 아래와 같이 주어진다: Going into this format, For a typical scale with, the scale factors are given by:
이때, At this time,
바꾸어 말하면, 웨이브릿 도메인에서 명도 오퍼레이션은 항(term) 을 스케일링 계수들인 에 더함으로써 수행될 수 있다. 항 은 스케일링 필터를 의미한다. In other words, the brightness operation in the wavelet domain is term Scaling factors Can be performed by adding to. term Means a scaling filter.
웨이브릿 계수들인 의 값을 구하기 위해 유사한 분석을 할 수 있다. 간결하게 하기 위해 그리고 반복을 회피하기 위해(분석이 매우 유사하므로), 분석의 모든 단계들을 열거하지 않고 최종 결과만 제공할 것이다. 인 일반적인 스케일의 경우, 웨이브릿 계수들은 아래와 같이 주어진다:Wavelet coefficients Similar analysis can be done to find the value of. For brevity and to avoid repetition (since the analysis is very similar), we will not list all the steps of the analysis and only provide the final result. For a general scale of, the wavelet coefficients are given by:
이때, At this time,
바꾸어 말하면, 웨이브릿 도메인에서 명도 오퍼레이션은 항 (term) 을 웨이브릿 계수들 에 합함으로써 수행될 수 있다. 항 은 웨이브릿 필터를 의미한다. In other words, the brightness operation in the wavelet domain is term Wavelet coefficients Can be performed by term Means wavelet filter.
항 은 웨이브릿 도메인 내에 이미지에서 DC 시프트를 나타낸다. 웨이브릿 변환된 계수들은 모든 서브밴드들에서 원본 웨이브릿 변환 이미지로부터 변경된다. 그러나, 대부분의 에너지가 변환된 이미지의 LL 서브밴드에 집중되기 때문에, 공간 도메인에서 명도 오퍼레이션의 제1의 알맞은(good) 근사치를 얻기 위해 오직 LL 서브밴드에서만 이런 변경을 적용하는 것으로 충분하다. 따라서, 공간 도메인에서 DC 인자의 덧셈(/뺄셈)은 웨이브릿 도메인의 베이스 밴드(LL 서브밴드)에서 대응하는 DC 인자의 덧셈(/뺄셈)과 대략 동일하다. term Denotes a DC shift in the image within the wavelet domain. The wavelet transformed coefficients are changed from the original wavelet transformed image in all subbands. However, since most of the energy is concentrated in the LL subbands of the transformed image, it is sufficient to apply this change only in the LL subbands to obtain the first good approximation of the brightness operation in the spatial domain. Thus, the addition (/ subtraction) of the DC factor in the spatial domain is approximately equal to the addition (/ subtraction) of the corresponding DC factor in the baseband (LL subband) of the wavelet domain.
따라서, 제1 단계로서, 공간 도메인에서 명도조정을 적용하는 대신에 웨이브릿 도메인에서 명도 조정이 적용가능하다. 여기서, 이 수행(performance)에서 이득은 대략 10 내지 15% 이다(이산 웨이브릿 변환이 위에서 도시된 것처럼 손실이 크지 않기 때문임). 다른 대역들의 디코딩이 수행되지 않는다면, 이때 이득은 아래에서 설명되는 것처럼, 10배 이상이다. 여기서 대략의 변경은 LL 서브밴드에서만 생긴다. 따라서 다른 서브밴드들에서 재 인코드할 필요가 없다. 대역 간의(inter-band) 어느 상관(correlation)도 사용하지 않는, 서브밴드 인코딩 및 특히 웨이브릿 변환(예를 들어, 이산 웨이브릿 변환)에 기초한 JPEG 2000 표준 및 다른 인코더들은 다른 대역들에 대해서도 동일한 코드 스트림(stream)들을 유지하게 할 수 있다. Thus, as a first step, instead of applying brightness adjustment in the spatial domain, brightness adjustment in the wavelet domain is applicable. Here, the gain in this performance is approximately 10-15% (since the discrete wavelet transform is not as large as shown above). If decoding of other bands is not performed, then the gain is more than 10 times, as described below. The approximate change here only occurs in the LL subband. Therefore, there is no need to re-encode in other subbands. The JPEG 2000 standard and other encoders based on subband encoding and in particular wavelet transform (eg discrete wavelet transform), which do not use any inter-band correlation, are the same for other bands. To maintain code streams.
따라서, 수행은 압축 도메인에서 이미지 데이터 내 LL 서브밴드만을 변경함으로써 상당히 향상될 수 있다. Thus, performance can be significantly improved by changing only the LL subbands in the image data in the compression domain.
양자화 이후에, (이산 웨이브릿 변환으로부터 생긴) 각각의 서브밴드는 직사각형 블록들, 즉 오버래핑되지 않는 직사각형들로 나뉨을 유의하라. 3개의 공간적으로 연속인 직사각형들(각각의 해상도 레벨에서 각각의 서브 밴드로부터 하나의 서브밴드)은 패킷 파티션(partion) 장소 또는 구역(precinct)을 포함한다; 도 7 참조. 각각의 패킷 파티션 장소는 "코드 블록들"로 지칭되는 오버래핑되지 않은 직사각형들로 나뉘고, 그것은 위에서 도 2를 참조하여 설명된 엔트로피 코더로의 입력을 형성한다. 각각의 코드블록의 코딩된 데이터는 코드 스트림에서 하나 이상의 계층들을 통해 분배된다. 디코더가 각 계층에 차례로 포함된 코드 블록 요인들을 디코딩할 수 있도록, 각 계층은 연속적 및 단조적으로 이미지 퀄리티를 향상시킨다. 특정 타일, 계층, 컴포넌트, 해상도, 및 구역을 나타내는 데이터는 패킷으로 지칭되는 연속 세그먼트 내의 코드 스트림에서 나타난다. 패킷 데이터는 8 비트(1 바이 트)를 경계로 정렬된다. LL, HL, LH, 및 HH 서브밴드들로부터 요인이 그 순서로 나타나도록 패킷 내의 데이터가 정렬된다. 각 서브밴드에서, 코드 블록 요인들은 래스터(raster) 순서로 나타나고, 관련된 구역에 의해 형성되는 범위 내에 제한된다. 구역에 제한된, 관련된 서브밴드들로부터 샘플들을 포함하는 이런 코드블록들만이 패킷 내에 표현된다. Note that after quantization, each subband (from the discrete wavelet transform) is divided into rectangular blocks, that is, rectangles that do not overlap. Three spatially consecutive rectangles (one subband from each subband at each resolution level) contain a packet partition location or precinct; See FIG. 7. Each packet partition location is divided into non-overlapping rectangles called "code blocks", which form an input to the entropy coder described with reference to FIG. 2 above. The coded data of each codeblock is distributed over one or more layers in the code stream. Each layer improves image quality continuously and monotonically so that the decoder can decode the code block factors contained in each layer in turn. Data representing a particular tile, layer, component, resolution, and region appears in a code stream within a continuous segment called a packet. Packet data is aligned on 8 bits (1 byte) boundary. The data in the packet is ordered so that the factors from the LL, HL, LH, and HH subbands appear in that order. In each subband, code block factors appear in raster order and are limited within the range formed by the associated zone. Only those code blocks that contain samples from related subbands, limited to a region, are represented in a packet.
1.2 메가 픽셀과 동일한, 1280x960 픽셀의 해상도를 갖는 디지털 이미지를 가정한다. 5 레벨에서 이 이미지를 분해해서 640x480, 320x240, 160x120, 80x60, 및 40x30 픽셀 크기의 서브밴드들이 되게 할 수 있다. 이 이미지를 압축하기 위해 이용된 코드 블록들이 32x32 픽셀인 경우(가장 일반적인 블록 크기로 사용됨), 이 이미지 내에 코드 블록들의 수는 1200 블록들일 수 있다. LL 서브밴드에서 블록들은 단지 4개이다. 단지 이런 4개의 블록들이 변경되고, 나머지는 변경이 없는 경우, 이때는 엔트로피 코딩된 블록 데이터의 0.33% (= 4/1200)만이 변경되어야 한다. 이미지 독취 오퍼레이션을 생략할 때, 칼라 변환 오퍼레이션, 웨이브릿 변환 오퍼레이션 및 엔트로피 코딩 오퍼레이션의 0.33% 및 비트 스트림 형성 오퍼레이션의 일부들을 수행하는 것은 전체 시간을 전체 이미지를 재인코딩하는 시간의 10%보다 적게 감소시킨다. Assume a digital image with a resolution of 1280x960 pixels, equal to 1.2 mega pixels. At five levels, this image can be broken down into subbands of 640x480, 320x240, 160x120, 80x60, and 40x30 pixel dimensions. If the code blocks used to compress this image are 32x32 pixels (used in the most common block size), the number of code blocks in this image may be 1200 blocks. There are only four blocks in the LL subband. If only these four blocks are changed and the rest are unchanged, then only 0.33% (= 4/1200) of the entropy coded block data should be changed. When omitting image read operations, performing 0.33% of color transform operations, wavelet transform operations, and entropy coding operations and parts of bitstream forming operations reduce the overall time to less than 10% of the time to re-encode the entire image. Let's do it.
고 해상도 이미지들의 경우, 동일한 분석이 여전히 적용된다. 사실상 LL 서브밴드가 전체 이미지의 더 적은 일부(fraction)일 수 있기 때문에, 처리 시간에서 상당한 이득이 얻어질 수 있다. 게다가, 비트 스트림 형성 오퍼레이션은 계산 능력을 덜 필요로 할 수 있다. 이런 오퍼레이션의 결과로서 비트 스트림 형성 오퍼레이 션에서 요구되는 변화들은 아래에 도 8을 참조하여 설명되고, 도 8은 본 발명의 실시 예에 따른 LL 서브밴드 변경을 위한 오퍼레이션 시퀀스를 개략적으로 도시한다. For high resolution images, the same analysis still applies. In fact, since the LL subband can be a smaller fraction of the entire image, significant gains in processing time can be obtained. In addition, bit stream forming operations may require less computational power. The changes required in the bit stream forming operation as a result of this operation are described below with reference to FIG. 8, which schematically illustrates an operation sequence for LL subband change according to an embodiment of the invention.
도 8을 참조하면, 오퍼레이션(S90)에서, 변경될 디지털 이미지의 LL 서브밴드가 제공된다. Referring to FIG. 8, in operation S90, the LL subband of the digital image to be changed is provided.
LL 서브밴드에서 모든 코드 블록들은 재인코딩(re-encoding) 되어야한다(즉 제1 서브 오퍼레이션(S100)). LL 서브밴드를 재인코딩하기 위한 2개의 가능성들이 있다. 제1 가능성은 오퍼레이션(S101, S102, S103)을 포함하는 도시된 오퍼레이션 시퀀스의 제1 갈림(branch)에 도시되고, 제2 가능성은 오퍼레이션(S104, S105, S106)을 포함하는 도시된 오퍼레이션 시퀀스의 제2 갈림에 도시된다. All code blocks in the LL subband must be re-encoded (ie, the first sub-operation S100). There are two possibilities for re-encoding the LL subband. The first possibility is shown in the first branch of the depicted operation sequence comprising operations S101, S102, S103, and the second possibility is shown in the depicted operation sequence comprising operations S104, S105, S106. It is shown at the second fork.
제1 갈림을 참조하면, 전체 LL 서브밴드가 재인코딩된다. LL 서브밴드는 어떤 역 웨이브릿 변환도 요구하지 않는다. Referring to the first split, the entire LL subband is re-encoded. The LL subband does not require any inverse wavelet transform.
복원된 데이터는 디코딩될 수 있고, 방정식들 (12) 내지 (15)에 따라, 스칼라 합(또는 차)을 적용한 후에 서브밴드 내에 위치할 수 있다. DC 시프트 값을 나타내는 은 양의 또는 음의 값일 수 있음을 유의하라. The reconstructed data can be decoded and placed in the subband after applying the scalar sum (or difference), according to equations (12) to (15). Indicating a DC shift value Note that can be a positive or negative value.
제2 갈림을 참조하면, LL 서브밴드는 블록들의 부분들을 디코딩하고 그것들을 재 인코딩함으로써 부분적으로 재 인코딩된다. 합해지거나 빼질 DC 시프트 값을 나타내는 은 도 9에서 도시된 바와 같이, 비트 플레인 로부터 시작할 수 있다. 명도를 조정할 때, 합해지거나 빼질 DC 시프트 값은 대부분 원본 샘플 값의 일부이다. 따라서, 개의 최하위 비트 프레인들만이 방정식 (12) 내지 (15)에 따라 변경될 수 있다. 모든 제1 (는 최상위비트(most significant bit)를 나타냄)은 동일하게 남아있을 수 있다. 결과적으로, 즉 최하위 비트 플레인들(last significant bit-planes)인, 변경에 고려되는 이런 비트 플레인들만이 디코딩, 조작, 재인코딩될 수 있고, 이것은 부분적 디코딩을 의미한다. 그렇지 않으면, 즉 DC 시프트 인자가 원본 샘플 값의 일부가 아니라면, 계산은 위에서 설명된 제1 갈림에 도시된 것과 같이 방정식 (12) 내지 (15)에 따라 수행되어야 한다. JPEG 2000 표준 또는 어느 다른 서브밴드 기반의 인코더의 인코딩 스피드를 추가로 증가시키기 위해, 압축 성능에서 약간의 하락을 희생하여 선택적 연산 인코딩이 생략될 수 있고 대신에 비트 플레인들이 미가공(raw) 비트들에 송신될 수 있다. Referring to the second fork, the LL subbands are partially re-encoded by decoding portions of the blocks and re-encoding them. Represents a DC shift value to sum or subtract Is a bit plane, as shown in FIG. You can start from When adjusting the brightness, the DC shift values to be summed or subtracted are mostly part of the original sample value. therefore, Only the least significant bit planes can be changed according to equations (12) through (15). All first ( Denotes the most significant bit) may remain the same. As a result, i.e. Only those bit planes that are considered for modification, which are the last significant bit-planes, can be decoded, manipulated, and re-encoded, which means partial decoding. Otherwise, ie if the DC shift factor is not part of the original sample value, the calculation must be performed according to equations (12) to (15) as shown in the first branch described above. In order to further increase the encoding speed of the JPEG 2000 standard or any other subband based encoder, the optional computational encoding may be omitted at the expense of a slight drop in compression performance, instead. Bit planes may be sent in raw bits.
제2 서브오퍼레이션(S110)에서 변경된 블록들을 포함하는 모든 패킷들이 변화될 필요가 있다. 이런 블록들에 속하는 압축된 데이터가 포함되고 패킷 헤더(header)들이 예를 들어, 오퍼레이션들(S111, S112)에서 변경된다. All packets including the changed blocks in the second suboperation S110 need to be changed. Compressed data pertaining to these blocks is included and packet headers are changed in operations S111 and S112, for example.
오퍼레이션(S124)에서, 헤더 정보는 데이터 산입(inclusion)때문에 업데이트되어야 한다. 아래의 오퍼레이션은 필요한 패킷 헤더 변경에 관련된 것을 더 상세하게 나타낸다. In operation S124, the header information must be updated due to data inclusion. The operations below show more detail relating to the necessary packet header changes.
패킷 헤더에서 "산입 / 불산입" 비트: 즉 변경된 블록이 LL 서브밴드에서 패킷 내에 있다면, 원본 비트 스트림에서 변경된 블록이 중요하지 않음(또는 무의미함)에 반하여 어떤 비트 플레인에서는 중요하게(또는 무의미함) 되도록, 산입 비트 는 변경되어야 한다. "Input / non-input" bits in the packet header: i.e. if a changed block is in a packet in the LL subband, the changed block in the original bit stream is not significant (or meaningless), whereas in some bit planes it is significant (or meaningless) The calculation bit shall be changed.
코드 블록 산입 정보(태그 트리들에서 코딩됨)는 변경되어야 한다. Code block calculation information (coded in tag trees) must be changed.
변경된 코드 블록들에서 빈 비트 플레인들의 수는 업데이트가 필요하다. The number of empty bit planes in modified code blocks needs to be updated.
명도 조정이 압축된 데이터를 변경시키기 때문에 코드 블록 길이가 변화될 필요가 있을 것이다. The code block length will need to be changed because brightness adjustments change the compressed data.
패킷 헤더들에서 변경들은 복잡도가 매우 낮다. JPEG 2000 표준은 비트 스트림에서 변경될 필요가 있는 이런 패킷들만을 액세스하는 효과를(effect)를 도입하는 애플리케이션을 허용하는 랜덤 액세스 특징을 제공한다. 상기 애플리케이션은. 그럼에도 불구하고, 애플리케이션이 여전히 새로운 레이트 일그러짐 최적화를 수행하기를 원한다면, 낮은 복잡도로 행할 수 있다. 이런 변경들은 최악의 시나리오의 경우의 인코딩 시간의 대략 5%와 동일하다고 예측된다. 대략적으로 인자 20에 의한 가속이 따라서 제안될 수 있다. Changes in packet headers are very low in complexity. The JPEG 2000 standard provides a random access feature that allows an application to introduce the effect of accessing only those packets that need to be changed in the bit stream. The application is. Nevertheless, if the application still wants to perform new rate distortion optimization, it can do so with low complexity. These changes are expected to equal approximately 5% of the encoding time for the worst case scenario. Approximately acceleration by factor 20 can thus be proposed.
그레이스케일(grayscale) 이미지들의 경우, 명도 조정은 단일한 컴포넌트 이미지 자체에 적용된다. 칼라 이미지들의 경우, 명도 조정은 이미지의 휘도 컴포넌트에만 적용된다. 크로미넌스(chrominance) 컴포넌트들은 변화될 필요가 없다. In the case of grayscale images, the brightness adjustment is applied to the single component image itself. For color images, the brightness adjustment only applies to the luminance component of the image. Chrominance components do not need to be changed.
근사치가 방정식 (12) 내지 (15)에서 정의된 것과 같이 추가의 서브밴드들로의 DC 시프트 값을 나타내는 의 적용을 확장함으로써(extend) 향상될 수 있음을 유의해야 한다. The approximation represents the DC shift value to additional subbands as defined in equations (12) to (15). It should be noted that this can be improved by extending the application of.
콘트라스트 조정-스칼라 곱셈/ 나눗셈(Contrast Adjustment - scalar multiplication / division)Contrast Adjustment-scalar multiplication / division
콘트라스트 조작에서, 오퍼레이션은 이미지의 히스토그램을 확장(stretching)/ 축소하는(contracting) 것에 기초한다. 예시적인 콘트라스트 조작은 도 10에 도시된다. 이미지의 히스토그램은 이미지에서 그레이 레벨들의 발생 빈도를 나타낸다. 히스토그램을 어떤 속성(property)에 대해 모델링하는 것은 원하는 효과들을 달성할 수 있게 한다. In contrast manipulation, the operation is based on stretching / contracting the histogram of the image. An exemplary contrast manipulation is shown in FIG. 10. The histogram of the image represents the frequency of occurrence of gray levels in the image. Modeling the histogram on any property allows you to achieve the desired effects.
가 이미지 의 히스토그램을 나타낸다고 하자. 그러면, 는 밀도( intensity) 를 갖는 의 픽셀들의 수를 나타낸다. 히스토그램 변조의 관점에서, 원하는 히스토그램 를 갖는 이미지 가 발생될 것이다. 이것은 이미지 로부터 를 얻기 위해 를 로 맵핑할(map) 수 있는 함수/ 변환을 찾음으로써 달성될 수 있다. Autumn image Let's assume that we represent a histogram. then, Is intensity Having Represents the number of pixels. In terms of histogram modulation, the desired histogram Image with Will be generated. This is an image from To get To This can be accomplished by finding a function / transformation that can be mapped to.
콘트라스트 조정을 적용하는 대중적인 선형적인 방법은 이미지의 휘도 밀도에 아래의 변환을 적용하는 것이다. (cf. 도 11)A popular linear way to apply contrast adjustment is to apply the following transformation to the luminance density of an image. (cf. Fig. 11)
이때, 전형적으로 이다. 및 파라미터들은 이미지의 어두운 도메인들, 중간 도메인들, 및 밝은 도메인들에 각각 대응하고, 이미지에서 상대적인 콘트라스트 조정을 결정한다. 콘트라스트 확장의 경우, 이고, 콘트라스트 축소의 경우, 이다. 따라서, 콘트라스트 조정은 적절한 인자(들)을 적용하여 픽셀들의 휘도 밀도를 단순히 스케일링함으로써 적용될 수 있음을 알 수 있다. Typically at this time to be. And The parameters correspond to dark domains, intermediate domains, and bright domains of the image, respectively, and determine a relative contrast adjustment in the image. For contrast expansion, , For contrast reduction, to be. Thus, it can be seen that contrast adjustment can be applied by simply scaling the luminance density of the pixels by applying the appropriate factor (s).
콘트라스트 조정하는 더 단순한 방법은 전체 이미지에 대한 단일한 콘트라스트 조정 인자 를 사용하는 것이다. 가 이미지 픽셀들의 휘도 밀도들의 평균이라면, 이때 다음 식이 성립한다:A simpler way to adjust contrast is to use a single contrast adjustment factor for the entire image. Is to use If is the average of the luminance densities of the image pixels, then the following equation holds:
명도 오퍼레이션을 위해 위에서 행해진 것과 유사한 분석이 행해질 것이다. 공간 도메인에서 콘트라스트 조정 방정식은 아래와 같이 주어진다. An analysis similar to that done above for the lightness operation will be performed. The contrast adjustment equation in the spatial domain is given by
이때, At this time,
이때, 상수 는 이미지(원본 공간 해상도)의 레벨에 적용된다. Where constant Of the image (original space resolution) Applies to the level.
프라임 심볼을 콘트라스트 오퍼레이션을 거친 신호를 나타내기 위해 사용함으로써, 상이한 스케일들 에서 웨이브릿 도메인 내의 대응하는 콘트라스트 오퍼레이션은, 스케일링 및 웨이브릿 계수들(이산 웨이브릿 변환)의 항으로 아래와 같이 주어진다. Prime Different scales by using a symbol to represent a signal that has undergone contrast operation The corresponding contrast operation in the wavelet domain in is given below in terms of scaling and wavelet coefficients (discrete wavelet transform).
스케일에서: On the scale:
방정식들(5) 및 (18)을 사용하여,Using equations (5) and (18),
스케일에서: On the scale:
이때, At this time,
스케일에서: On the scale:
이때, At this time,
이런 형식으로 나아가서, 인 일반적인 스케일의 경우, 스케일 계수들은 아래와 같이 주어진다:Going into this format, For a typical scale with, the scale factors are given by:
이때, At this time,
바꾸어 말하면, 웨이브릿 도메인에서 콘트라스트 오퍼레이션은 콘트라스트 스케일링 인자 로 스케일링 계수들 을 스케일링하고 그것에 를 합함으로써 수행될 수 있다. 항 은 스케일링 필터를 의미한다. In other words, the contrast operation in the wavelet domain is a contrast scaling factor. Low scaling factors And scale it to Can be performed by summation. term Means a scaling filter.
웨이브릿 계수들 의 값을 구하기 위해 유사한 분석이 행해질 수 있다. 간결하게 하기 위해 그리고 반복을 회피하기 위해(분석이 매우 유사하므로), 분석의 모든 단계들을 열거하지 않고 최종 결과만 제공할 것이다. 인 일반적인 스케일의 경우, 웨이브릿 계수들은 아래와 같이 주어진다. Wavelet coefficients Similar analysis can be done to find the value of. For brevity and to avoid repetition (since the analysis is very similar), we will not list all the steps of the analysis and only provide the final result. For a typical scale, the wavelet coefficients are given by
이때, At this time,
바꾸어 말하면, 웨이브릿 도메인에서 콘트라스트 오퍼레이션은 콘트라스트 스케일링 인자 로 웨이브릿 계수들 를 스케일링하고 그것에 항을 합함으로써 수행될 수 있다. 항 웨이브릿 필터를 나타낸다. In other words, the contrast operation in the wavelet domain is a contrast scaling factor. Low wavelet coefficients And scale it to Can be performed by combining terms. term Represents a wavelet filter.
위의 방정식들로부터 알 수 있듯이, 웨이브릿 변환된 계수들은 모든 서브밴드들에서 원본 웨이브릿 이미지로부터 변경된다. 그러나, 에너지의 대부분이 변환된 이미지의 LL 서브밴드에 집중되기 때문에, 공간 도메인에서 콘트라스트 오퍼레이션의 제1의 알맞은 근사치를 얻기 위해 오직 LL 서브밴드에만 이런 변경을 적용하는 것으로 충분하다. 따라서, 공간 도메인에서 콘트라스트 인자 의 곱은 사실상 웨이블릿 도메인의 베이스밴드(LL 서브밴드)에서 그것의 변경과 대략 동일하다. 따라서, 공간 도메인에서 콘트라스트 조정을 적용하는 대신에, 웨이블릿 도메인에서의 콘트라스트 조정을 적용할 수 있다. 이런 수행에서 이득은 전에 설명한 바와 같이 대략 10에서 15%이다. As can be seen from the above equations, the wavelet transformed coefficients are changed from the original wavelet image in all subbands. However, since most of the energy is concentrated in the LL subbands of the transformed image, it is sufficient to apply this change only to the LL subbands to obtain a first reasonable approximation of the contrast operation in the spatial domain. Thus, contrast factor in the spatial domain The product of is substantially equal to its change in the baseband (LL subband) of the wavelet domain. Thus, instead of applying contrast adjustment in the spatial domain, it is possible to apply contrast adjustment in the wavelet domain. The gain in this performance is approximately 10 to 15% as described previously.
여기서 대략의 변경은 LL 서브밴드에서만 생긴다. 다른 서브밴드들을 재 인 코드하는 것은 따라서 필요하지 않다. 대역간 어느 상관도 사용하지 않는 JPEG 2000 표준 및 가능한 다른 서브밴드 코더 및 특히 웨이브릿 변환 인코더들을 다른 대역들에 대하여 동일한 코드 스트림들을 유지하게 할 수 있다. 따라서, 오퍼레이션 수행에서 상당한 향상이 LL 서브밴드의 압축된 데이터를 단순히 변경함으로써 얻어질 수 있다. 구현들(implentation) 및 복잡도 문제들이 관련되어 있는 한 , 유사한 논의들이 명도 조정 접근방식에서와 같이 여기에 다시 적용된다. 따라서, 콘트라스트 조정 오퍼레이션의 수행은 LL 서브밴드의 압축된 데이터를 단순히 변경함으로써 상당히 향상될 수 있다. The approximate change here only occurs in the LL subband. Re-encoding other subbands is therefore not necessary. The JPEG 2000 standard and possibly other subband coders and especially wavelet transform encoders, which do not use any correlation between bands, can keep the same code streams for different bands. Thus, a significant improvement in operation performance can be obtained by simply changing the compressed data of the LL subbands. As long as implementations and complexity issues are involved, similar discussions reapply here as in the brightness adjustment approach. Thus, the performance of contrast adjustment operations can be significantly improved by simply changing the compressed data of the LL subbands.
콘트라스트 조정의 복잡도 분석 및 구현(implementaion) 면모들은 명도 조정 접근 방식에 매우 유사한 접근 방식을 따르므로, 간결함을 위해 여기에 상세하게 반복되지는 않을 것이다. 도 12는 본 발명의 실시 예에 따른 LL 서브밴드 변경을 위한 오퍼레이션 시퀀스를 개략적으로 도시한다. Complexity analysis and implementation aspects of contrast adjustment follow an approach very similar to the brightness adjustment approach, and thus will not be repeated here for brevity. 12 schematically illustrates an operation sequence for LL subband change according to an embodiment of the present invention.
도 12를 참조하면, 오퍼레이션(S90)에서, 변경될 디지털 이미지의 LL 서브밴드가 제공된다. 12, in operation S90, the LL subband of the digital image to be changed is provided.
LL 서브밴드에 있는 모든 코드 블록들이 재 인코딩되어야 한다(즉, 제1 서브 오퍼레이션()). LL 서브밴드를 재인코딩하는 2개의 가능성들이 존재한다. 제1 가능성은 오퍼레이션들 , 및 을 포함하는 도시된 오퍼레이션 시퀀스의 제1 갈림 내에 도시되고, 제2 가능성은 오퍼레이션들 , 및 을 포함하는 도시된 오퍼레이션 시퀀스의 제2 갈림 내에 도시된다. All code blocks in the LL subband must be re-encoded (that is, the first sub-operation ( )). There are two possibilities for re-encoding the LL subband. The first possibility is operations , And Shown within a first fork of the illustrated operation sequence, the second possibility being operations , And It is shown within a second branch of the depicted operation sequence that includes.
제1 갈림의 오퍼레이션들을 참조하면, 전체 LL 서브밴드가 재 인코딩된다. LL 서브밴드는 어떤 역 웨이브릿 변환도 요구하지 않는다. 복원된 데이터는 디코딩될 수 있고 방정식들 (22) 내지 (25)에 따라, 스칼라 곱(또는 나눗셈) 및 합(또는 차)을 적용한 후에 서브밴드 내에 위치할 수 있다. 인자는 1보다 크거나 또는 작을 수 있고 (각각 곱셈 오퍼레이션 및 나눗셈 오퍼레이션과 동일함) 시프트 값을 나타내는 는 양의 또는 음의 값일 수 있다는 것을 유의하라.Referring to the operations of the first fork, the entire LL subband is re-encoded. The LL subband does not require any inverse wavelet transform. The reconstructed data can be decoded and placed in the subband after applying the scalar product (or division) and sum (or difference) according to equations (22) to (25). The argument can be greater than or less than 1 (equivalent to the multiplication and division operations, respectively) and represent a shift value. Note that can be a positive or negative value.
제2 갈림의 오퍼레이션들을 참조하여, LL 서브밴드는 블록들의 일부들을 디코딩하고 그것들을 재인코딩함으로써 부분적으로 재인코딩될 수 있다. 어떤 상황들 하에서, 즉 인자 및 합함수(summand) 에 따라 , 오퍼레이션 S105에 관해 위에서 주어진 논의에 유사한 변경이 비트플레인 로부터 시작할 수 있다. 따라서, 최하위 비트플레인만이 방정식들(22) 내지 (25)에 따라 변경될 수 있다. 모든 제1 (는 최상위 비트를 나타냄)은 동일하게 남을 수 있다. 결론적으로, 즉 최하위 비트 플레인들인, 변경에 고려되는 이런 비트 플레인들만이 디코딩될 수 있고, 조작될 수 있고, 재인코딩될 수 있고, 이것은 또한 부분적 디코딩을 의미한다. 그렇지 않으면, 계산은 위에서 설명된 제1 갈림에 도시된 것과 같이 방정식 (22) 내지 (25)에 따라 수행되어야 한다. 어느 웨이브릿 변환 베이스 인코더 뿐만 아니라 JPEG 2000 표준의 인코딩 스피드를 추가로 증가시 키기 위해, 압축 성능에서 약간의 하락을 희생하여 선택적 연산 인코딩이 생략될 수 있고 대신에 비트 플레인들이 미가공 비트들에 송신될 수 있다.With reference to the operations of the second fork, the LL subband can be partially re-encoded by decoding portions of the blocks and re-encoding them. Under certain circumstances, namely And summand In accordance with this, a similar change is made to the discussion given above with respect to operation S105. You can start from therefore, Only the least significant bitplane can be changed according to equations (22) to (25). All first ( Denotes the most significant bit) may remain the same. In conclusion, i.e. Only those bit planes that are considered for modification, which are the least significant bit planes, can be decoded, manipulated and re-encoded, which also means partial decoding. Otherwise, the calculation must be performed according to equations (22) to (25) as shown in the first branch described above. In order to further increase the encoding speed of the JPEG 2000 standard as well as any wavelet transform base encoder, the optional computational encoding may be omitted at the expense of a slight drop in compression performance. Bit planes may be transmitted in raw bits.
제2 서브오퍼레이션(S110)에서 변경된 블록들을 포함하는 모든 패킷들이 변화될 필요가 있다. 이런 블록들에 속하는 압축된 데이터가 포함되고 패킷 헤더(header)들이 예를 들어, 오퍼레이션들(S111, S112)에서 변경된다. All packets including the changed blocks in the second suboperation S110 need to be changed. Compressed data pertaining to these blocks is included and packet headers are changed in operations S111 and S112, for example.
또 하나의 오퍼레이션에서, 헤더 정보는 데이터 산입 때문에 업데이트되어야 한다. 아래의 오퍼레이션은 좀더 상세히 요구된 패킷 헤더 변경에 관련된다. In another operation, the header information must be updated due to data ingestion. The operation below relates to the required packet header change in more detail.
패킷 헤더에서 "산입 / 불산입" 비트: 즉 변경된 블록이 LL 서브밴드에서 패킷 내에 있다면, 원본 비트 스트림에서 변경된 블록이 중요하지 않음(또는 무의미함)에 반하여 어떤 비트 플레인에서는 중요(또는 무의미함)하게 되도록, 산입 비트는 변경되어야 한다. "Input / non-input" bits in the packet header: i.e. if the changed block is in a packet in the LL subband, the changed block in the original bit stream is not significant (or meaningless), whereas in some bit planes it is significant (or meaningless) In order to do that, the bit of the bit should be changed.
코드 블록 산입 정보(태그 트리들에서 코딩됨)는 변경되어야 한다. Code block calculation information (coded in tag trees) must be changed.
변경된 코드 블록들에서 빈 비트 플레인들의 수는 업데이트가 필요하다. The number of empty bit planes in modified code blocks needs to be updated.
명도 조정이 압축된 데이터를 변경시키기 때문에 코드 블록 길이가 변화될 것이다.The code block length will change because brightness adjustments change the compressed data.
방정식들(22) 내지 (25)에서 정의된 것처럼 추가의 서브밴드들을 위한 리니어 인자를 나타내는 의 애플리케이션을 확장함으로써 근사가 향상될 수 있음을 유의해야 한다. Indicating a linear factor for additional subbands as defined in equations (22) to (25) It should be noted that the approximation can be improved by extending the application of.
일반화 리니어 필터링(Generalized Linear Filtering)Generalized Linear Filtering
필터된 이미지 를 주는 입력 이미지 상에 일반화 N-tap 리니어 필터링은 아래와 같이 쓰여질 수 있다:Filtered image Input image The generalized N- tap linear filtering on the phase can be written as:
이때, 인덱스(index) 은 적절한(appropriete) 변환 에 의한 인덱스 쌍 에 관련된다. In this case, index Is the proper (appropriete) conversion Index pairs by Is related.
스케일링 파라미터들 는 tap의 필터의 필터 계수들이다. 방정식(26)은 스틸 이미지들의 리니어 필터링의 일반화된 형식이고 매우 다양한 리니어 이미지 필터링 오퍼레이션들을 설명하기 위해 사용될 수 있다. 이런 것들 중 가장 일반적인 것은 스무딩(smoothening)(저역 통과 필터링),샤프닝(sharpening)(고역 통과 필터링), 에버리징(averaging)(산술 평균 필터) 등이다. Scaling parameters Is Filter coefficients of the filter of tap. Equation 26 is a generalized form of linear filtering of still images and can be used to describe a wide variety of linear image filtering operations. The most common of these are smoothing (low pass filtering), sharpening (high pass filtering), averaging (arithmetic mean filter), and so on.
명도 및 콘트라스트 조정에 대한 논의로부터, 스틸 JPEG 2000 인코딩된 이미지의 픽셀 계수들의 합(또는 차) 및 곱셈(또는 스케일링) 모두가 압축 도메인에서 가능함을 알 수 있다. 방정식(26)으로부터, 일반화 리니어 필터링은 이런 2개의 기본적인 오퍼레이션들의 단순한 확장이고, 즉 원하는 효과들을 얻기 위해 유한한 수의 합 및 곱셈 오퍼레이션들로 리니어하게 분해될 수 있음을 알 수 있다. 따라서, 명도 및 콘트라스트 조정 상의 결과들 및 리니어 오퍼레이션들의 중첩의 정 리(superposition principle)에 의해, 어떤 리니어 이미지 처리 오퍼레이션도 본 발명의 개념을 사용하여 압축 도메인 내에서 수행될 수 있다. 특히 2개의 중요한 필터링 오퍼레이션들이 아래에 설명될 것이다.:From the discussion of brightness and contrast adjustments, it can be seen that both sum (or difference) and multiplication (or scaling) of pixel coefficients of a still JPEG 2000 encoded image are possible in the compression domain. From equation 26 it can be seen that generalized linear filtering is a simple extension of these two basic operations, i.e. it can be linearly decomposed into a finite number of sum and multiplication operations to obtain the desired effects. Thus, by the superposition principle of the results on brightness and contrast adjustment and the superposition of the linear operations, any linear image processing operation can be performed in the compression domain using the inventive concept. In particular, two important filtering operations will be described below:
샤프닝 오퍼레이션(Sharpening operation)Sharpening operation
샤프닝은 이미지가 전보다 더 뚜렷해(sharp) 보일 수 있도록, 이미지 내에 에지(edge)들이 강화되는(enhance) 이미지 처리 오퍼레이션이다. 이미지를 샤프닝하는 것은 이미지의 (에지들과 같은)고주파수 정보를 강화하는 것과 유사하다. 웨이브릿 변환된 이미지의 고주파수 서브밴드들 내에 웨이브릿 계수들은 에지들에 관련된 정보를 포함한다. 따라서, 고주파수 서브밴드들에서 계수들은 향상될 필요가 있다. 고주파수 서브밴드들에서 계수들이 웨이브릿 분해의 3개의 레벨들을 갖는 이미지를 가정한다(도 4). 변환된 이미지의 레벨 1에서 계수들은 이미지에서 가장 선명한 고주파수 콘텐츠를 나타내고, 다음 레벨(레벨 2)에서 계수들은 다음으로 가장 선명한 고주파수 콘텐츠를 나타내는 등이다. 따라서, 고주파수 정보를 향상시키기 위해서, 레벨 1에서 계수들이 가장 향상되어야 것이 불가피하다. 상수 인자 로 곱함으로써 계수가 향상될 수 있다. Sharpening is an image processing operation in which edges are enhanced within an image so that the image can look sharper than before. Sharpening an image is similar to enhancing high frequency information (such as edges) of an image. Wavelet coefficients in the high frequency subbands of the wavelet transformed image include information related to the edges. Thus, the coefficients in the high frequency subbands need to be improved. Assume an image where the coefficients in the high frequency subbands have three levels of wavelet decomposition (FIG. 4). The coefficients at
원하는 샤프닝 오퍼레이션의 강도에 의존하여, 다음 레벨의 서브밴드들에서 계수들은 또한 향상될 수 있다. 가벼운 샤프팅 오퍼레이션이 요구된다면, 레벨 1의 서브밴드들의 계수들만이 향상될 수 있다. 더 강한 샤프닝 오퍼레이션이 요구된다면, 그 레벨의 고주파수 서브밴드들을 향상시킬 수 있는 웨이브릿 피라미드의 가장 높은 레벨에 이를 때까지, 다음 레벨(레벨 2)의 서브밴드들에서 계수들이 향상될 수 있는 등등이다. 그러나, 저주파수 콘텐츠만을 포함하고 있기 때문에, 변환된 이미지의 LL 서브밴드는 변경되지 않는다. Depending on the strength of the desired sharpening operation, the coefficients in the next level of subbands can also be improved. If light shifting operations are required, only the coefficients of
변화된 계수들을 갖는 서브밴드들은 이전의 섹션들에서 전에 설명된 바와 같이 엔트로피 인코딩될 필요가 있다. 따라서, 가속에서의 이득은 변경되어야하는 서브밴드들의 수에 의존하고, 원하는 샤프닝 오퍼레이션의 강도에 차례로 의존한다. Subbands with changed coefficients need to be entropy encoded as previously described in the previous sections. Thus, the gain in acceleration depends on the number of subbands that must be changed and in turn on the strength of the desired sharpening operation.
스무딩 오퍼레이션(Smoothing operation)Smoothing operation
이미지 스무딩은 이미지의 고주파수 콘텐츠를 억제하는(suppress) 것과 유사하다. 웨이브릿 변환된 이미지의 고주파수 서브밴드들에서의 웨이브릿 계수들은 에지들에 관련된 정보 및 유사한 고주파수 정보를 포함한다. 이런 고주파수 정보를 억제함으로써, 에지들이 매끄러워질 수 있다. 따라서, JPEG 2000 표준에서 스무딩 오퍼레이션은 고주파수 서브밴드들에서 계수들을 억제함으로써 이뤄질 수 있다. 웨이브릿 분해의 3 레벨들을 가진 이미지를 가정한다(cf. 도 4). 변환된 이미지의 레벨 1에서 계수들은 이미지에서 가장 선명한 고주파수 콘텐츠를 나타내고, 다음 레벨(레벨 2)에서 계수들은 다음으로 가장 선명한 고주파수 콘텐츠를 나타내는 등등이다. 따라서, 고주파수 정보를 억제하기 위해서, 레벨 1에서 계수들이 가장 억제되어야 하는 것이 불가피하다. 그래서, 제1 스텝은 레벨 1의 계수들을 0과 동일하도록 억제하는 것이다. Image smoothing is similar to suppressing the high frequency content of an image. Wavelet coefficients in the high frequency subbands of the wavelet transformed image include information related to the edges and similar high frequency information. By suppressing this high frequency information, the edges can be smoothed. Thus, the smoothing operation in the JPEG 2000 standard can be achieved by suppressing the coefficients in the high frequency subbands. Assume an image with three levels of wavelet decomposition (cf. FIG. 4). The coefficients at
원하는 스무딩 오퍼레이션의 강도에 따라, 다음 레벨 서브밴드들에서 계수들이 또한 억제될 수 있다. 가벼운 스무딩 오퍼레이션이 요구된다면, 레벨 1의 서브 밴드들의 계수들만이 억제될 수 있다. 더 강한 스무딩 오퍼레이션이 요구된다면, 그 레벨의 고주파수 서브밴드들을 억제시킬 수 있는 웨이브릿 피라미드의 가장 높은 레벨에 이를 때까지, 다음 레벨(레벨 2)의 서브밴드들에서 계수들이 또한 억제될 수 있는 등등이다. 그러나, 변환된 이미지의 LL 서브밴드는 저주파수 콘텐츠만을 포함하고 있기 때문에, 변경되지 않는다. Depending on the strength of the desired smoothing operation, the coefficients in the next level subbands may also be suppressed. If a light smoothing operation is required, only the coefficients of
변화된 계수들을 갖는 서브밴드들이 이전의 섹션들에서 전에 설명된 바와 같이 엔트로피 코딩될 필요가 있다. 따라서, 가속에서 이득은 변경되어야하는 서브밴드들의 수에 의존하고, 원하는 스무딩 오퍼레이션의 강도에 차례로 의존한다. Subbands with changed coefficients need to be entropy coded as previously described in the previous sections. Thus, the gain in acceleration depends on the number of subbands that must be changed, and in turn on the strength of the desired smoothing operation.
구현 실시 예(Implementation embodiment)Implementation embodiment
도 13을 참조하면, 위에서 상세히 설명된 방법론의 예시적인 구현이 나타난다. 구현은 도 3에 도시된 JPEG 2000 인코더/ 디코더의 구현의 일부일 수 있고, 그것에 참조하여 위에서 상세하게 설명된다. 본 발명의 개념에 따라, 압축 도메인에서 이미지 데이터(즉, 인코딩된 도메인 또는 압축된 이미지 표현)는 비트스트림 파싱 모듈()에 제공되고, 그것은 압축 도메인에서 이미지 데이터의 LL 서브밴드의 공급을 가능하게 하는 도 8 및 도 12의 오퍼레이션들은 S90을 참조하여 정의된 것과 같이 특정 요구된 기능성(fuctionality)을 갖는 도 3의 비트 스트림 파싱 모듈(310)일 수 있다. 이때, LL 서브밴드의 이미지 데이터는 엔트로피 디코더( )에 제공되고, 그것은 도 8 및 도 12의 오퍼레이션들(, )을 참조하여 정의된 것과 같은, 특정 요구된 기능을 갖는 도 3의 엔트로피 디코더(320)일 수 있 다. 이미지 조작은 방정식(12) 내지 방정식(15) 및/ 또는 방정식(22) 내지 방정식(25)을 제공한다(각각 도 8 및 도 12의 각각의 오퍼레이션들( , ) 뿐만 아니라 오퍼레이션들(102, 105)) 참조). 조작(500) 이후에, 압축 도메인에서 변경된 이미지 데이터는 엔트로피 인코더()에 제공되고, 그것은 도 8 및 도 12의 오퍼레이션들(, )을 참조하여 정의된 것과 같이 특정 요구된 기능성을 갖는 도 3의 비트 스트림 파싱 모듈(240)일 수 있다. 마지막으로, 변경된 이미지 데이터는 변경된 이미지의 압축된 이미지 표현을 형성하기 위해 이미지 데이터로 재산입된다(re-included). 비트 스트림 어셈블리 모듈()은 재어셈블리(re-assembly)를 제공하고, 비트 스트림 어셈블리 모듈()은 도 8 및 도 12의 오퍼레이션(S110)을 참조하여 정의된 것과 같이 특정 요구된 기능을 갖는 도 3의 어셈블리 모듈()일 수 있다. Referring to FIG. 13, an exemplary implementation of the methodology described in detail above is shown. The implementation may be part of the implementation of the JPEG 2000 encoder / decoder shown in FIG. 3, described in detail above with reference to it. According to the inventive concept, image data (i.e., encoded domain or compressed image representation) in the compressed domain is converted into a bitstream parsing module (i.e. 8 and 12, which enable the supply of LL subbands of image data in the compression domain, the bits of FIG. 3 with specific required functionality as defined with reference to S90. Stream parsing module 310. At this time, the image data of the LL subband is entropy decoder ( ), Which is the operations of FIGS. 8 and 12 ( , May be the entropy decoder 320 of FIG. 3 with certain desired functionality, such as defined with reference to FIG. Image manipulation provides equations (12) to (15) and / or equations (22) to (25) (respective operations of FIGS. 8 and 12, respectively) , ) As well as operations 102, 105). After
도 1a 및 도 1b를 참조하여 설명된 것들 중의 하나와 같이, 도 13에 도시된 모듈들은 이미지 처리 모듈에서 바람직하게 구현된다. 당업자는 본 발명이 이산 웨이브렛 변환(DWT)에 따라 동작하는 JPEG 2000 표준을 참조하여 상세히 설명되었지만, 본 발명의 개념은 어느 서브밴드 기반의 인코딩 방법론에도 적용가능하고, 특히 웨이브릿 변환 인코딩으로 동작가능하다는 것을 예상할 수 있다. 결론적으로, 본 발명은 JPEG 2000 표준 및 이산 웨이브릿 변환 인코더들/ 디코더들 각각에 제한되는 것으로 이해해서는 안 된다. Like one described with reference to FIGS. 1A and 1B, the modules shown in FIG. 13 are preferably implemented in an image processing module. One skilled in the art has described the invention in detail with reference to the JPEG 2000 standard operating in accordance with Discrete Wavelet Transform (DWT), but the inventive concept is applicable to any subband based encoding methodology, in particular with wavelet transform encoding. You can expect it to be possible. In conclusion, it should not be understood that the present invention is limited to the JPEG 2000 standard and discrete wavelet transform encoders / decoders, respectively.
본 발명의 실시 예들에 연관되어 설명되고 본 발명의 실시 예에 따른 이미지 캡쳐 성능을 가진 CE 장치 내에 포함될 모듈들, 컴포넌트들, 및 기능성(fuctionality)들은 휴대용 CE 장치에서 포함될 수 있는 마이크로프로세서 또는 마이크로처리기와 같은, 데이터 처리 유닛으로 구성될 수 있음을 유의해야 한다. 또한, 모듈들, 컴포넌트들, 및 기능성들은, 하나 또는 복수의 데이터 처리 유닛들은 기능들 및 오퍼레이션들을 수행하는 필수적인 처리 오퍼레이션들을 실행하기 위한 명령들을 포함하는, 하나 또는 복수의 데이터 처리 유닛들(마이크로프로세서들, 마이크로제어기들 또는 애플리케이션 특정 집적 회로들(aplication specific integrated circuits, ASIC) 상에서 실행을 위한 코드 섹션으로 구성될 수 있다. 대안적으로 또는 추가적으로, 모듈들, 컴포넌트들, 및 기능성들 또는 그것의 일부 기능들은 애플리케이션 특정 집적 회로들(ASIC)과 같은 하나 이상의 하드웨어 모듈들에 기초하여 구현될 수 있다. 본 발명의 개념의 구현은 소프트웨어 및/ 또는 하드웨어 구현을 포함하는 어느 특정 구현에 제한되지 않는다. The modules, components, and functionalities described in connection with embodiments of the present invention and to be included in a CE device having image capture capability according to an embodiment of the present invention may be included in a portable CE device. It should be noted that, such as, may be configured as a data processing unit. In addition, the modules, components, and functionalities may include one or more data processing units (microprocessors), wherein the one or more data processing units include instructions for executing essential processing operations to perform functions and operations. Or microcontrollers or sections of code for execution on application specific integrated circuits (ASICs) Alternatively, or in addition, modules, components, and functionalities or portions thereof. The functions may be implemented based on one or more hardware modules, such as application specific integrated circuits (ASIC) The implementation of the inventive concept is not limited to any particular implementation, including software and / or hardware implementation.
본 발명의 몇몇 특징들 및 양상들이 제한으로서가 아니라 예시로서만 특정 실시 예들을 참조하여 도시되고 설명되었다. 당업자들은 개시된 실시 예들에 대한 대안적인 구현들 및 다양한 변경들이 본 발명의 범위 및 숙고 내에 있다는 것을 알고 있다. 따라서, 본 발명이 첨부된 청구항들의 범위에 의해서만 제한되는 것으로 의도된다. Some features and aspects of the invention have been shown and described with reference to specific embodiments only by way of example and not by way of limitation. Those skilled in the art are aware that alternative implementations and various changes to the disclosed embodiments are within the scope and contemplation of the invention. Accordingly, it is intended that the invention be limited only by the scope of the appended claims.
Claims (33)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/077,989 | 2005-03-11 | ||
US11/077,989 US7583844B2 (en) | 2005-03-11 | 2005-03-11 | Method, device, and system for processing of still images in the compressed domain |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070090253A KR20070090253A (en) | 2007-09-05 |
KR100937378B1 true KR100937378B1 (en) | 2010-01-20 |
Family
ID=36952977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077016575A KR100937378B1 (en) | 2005-03-11 | 2005-11-23 | Method, computer program product and device for processing of still images in the compressed domain |
Country Status (6)
Country | Link |
---|---|
US (1) | US7583844B2 (en) |
EP (1) | EP1856666A1 (en) |
JP (1) | JP2008533787A (en) |
KR (1) | KR100937378B1 (en) |
CN (1) | CN101116105B (en) |
WO (1) | WO2006095218A1 (en) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4129694B2 (en) * | 2006-07-19 | 2008-08-06 | ソニー株式会社 | Information processing apparatus and method, program, and recording medium |
US8295624B2 (en) | 2007-12-03 | 2012-10-23 | Ecole De Technologie Superieure | Method and system for generating a quality prediction table for quality-aware transcoding of digital images |
EP2210236B1 (en) | 2007-11-02 | 2018-07-11 | Ecole de Technologie Supérieure | System and method for predicting the file size of images subject to transformation by scaling and a change of quality-controlling parameters |
JPWO2009066677A1 (en) * | 2007-11-22 | 2011-04-07 | 日本電気株式会社 | Image processing device |
JP5181816B2 (en) * | 2008-05-12 | 2013-04-10 | 株式会社リコー | Image processing apparatus, image processing method, computer program, and information recording medium |
US8385971B2 (en) * | 2008-08-19 | 2013-02-26 | Digimarc Corporation | Methods and systems for content processing |
US8805110B2 (en) | 2008-08-19 | 2014-08-12 | Digimarc Corporation | Methods and systems for content processing |
US8300961B2 (en) * | 2008-12-12 | 2012-10-30 | Ecole De Technologie Superieure | Method and system for low complexity transcoding of images with near optimal quality |
KR20130050149A (en) * | 2011-11-07 | 2013-05-15 | 오수미 | Method for generating prediction block in inter prediction mode |
US9661331B2 (en) | 2013-03-18 | 2017-05-23 | Vantrix Corporation | Method and apparatus for signal encoding realizing optimal fidelity |
US10609405B2 (en) | 2013-03-18 | 2020-03-31 | Ecole De Technologie Superieure | Optimal signal encoding based on experimental data |
US9338450B2 (en) | 2013-03-18 | 2016-05-10 | Ecole De Technologie Superieure | Method and apparatus for signal encoding producing encoded signals of high fidelity at minimal sizes |
CN103530854A (en) * | 2013-10-15 | 2014-01-22 | 南通市牧井微电科技发展有限公司 | Spatial-domain filtering-based CBCT (Cone Beam Computed Tomography) panoramic image sharpening method |
JP6347078B2 (en) * | 2014-07-24 | 2018-06-27 | 国立研究開発法人土木研究所 | Deflection measuring method and deflection measuring apparatus |
GB2530311B (en) * | 2014-09-19 | 2017-01-11 | Imagination Tech Ltd | Data compression |
US10825213B2 (en) * | 2017-10-05 | 2020-11-03 | Adobe Inc. | Component-based digital image synchronization |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070026451A (en) * | 2004-03-10 | 2007-03-08 | 신드하라 슈퍼미디어, 인코포레이티드 | Methods and apparatuses for compressing digital image data with motion prediction |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR9508403A (en) * | 1994-07-14 | 1997-11-11 | Johnson Grace Company | Method and apparatus for image compression |
JPH08204957A (en) * | 1995-01-26 | 1996-08-09 | Dainippon Screen Mfg Co Ltd | Image processing method |
US6535666B1 (en) * | 1995-06-02 | 2003-03-18 | Trw Inc. | Method and apparatus for separating signals transmitted over a waveguide |
WO1998040842A1 (en) * | 1997-03-11 | 1998-09-17 | Computer Information And Sciences, Inc. | System and method for image compression and decompression |
JP3631609B2 (en) * | 1998-03-20 | 2005-03-23 | 株式会社リコー | Image processing apparatus and image processing method |
US6298166B1 (en) * | 1998-03-30 | 2001-10-02 | Seiko Epson Corporation | Image transformations in the compressed domain |
US6584111B1 (en) * | 1998-11-04 | 2003-06-24 | Northern Telecom Limited | ABR flow control using single bit congestion indication and wavelet transform filtering |
US6643406B1 (en) * | 1999-07-28 | 2003-11-04 | Polaroid Corporation | Method and apparatus for performing linear filtering in wavelet based domain |
US6725282B1 (en) * | 1999-09-07 | 2004-04-20 | Bath Iron Works | Method and apparatus for a wearable computer |
JP4209061B2 (en) * | 2000-02-09 | 2009-01-14 | 富士フイルム株式会社 | Image processing coding / decoding method, image processing coding / decoding system, image processing coding / decoding device, image processing decoding / decoding device, and recording medium |
US6985632B2 (en) | 2000-04-17 | 2006-01-10 | Canon Kabushiki Kaisha | Image processing system, image processing apparatus, and image processing method |
US6757429B2 (en) * | 2001-02-21 | 2004-06-29 | Boly Media Communications Inc. | Method of compressing digital images |
US6697521B2 (en) * | 2001-06-15 | 2004-02-24 | Nokia Mobile Phones Ltd. | Method and system for achieving coding gains in wavelet-based image codecs |
US7206459B2 (en) | 2001-07-31 | 2007-04-17 | Ricoh Co., Ltd. | Enhancement of compressed images |
US7085436B2 (en) | 2001-08-28 | 2006-08-01 | Visioprime | Image enhancement and data loss recovery using wavelet transforms |
US6504494B1 (en) * | 2001-11-06 | 2003-01-07 | Motorola, Inc. | Software, method and apparatus for rate controlled image compression |
US20040105590A1 (en) * | 2002-07-16 | 2004-06-03 | Hiroshi Akimoto | Method for still image compressing using filter bank based on non-separable wavelet basis |
JP4111268B2 (en) * | 2002-12-13 | 2008-07-02 | 株式会社リコー | Thumbnail image display method, server computer, client computer, and program |
US7548656B2 (en) | 2003-01-16 | 2009-06-16 | Konica Minolta Holdings, Inc. | Method and apparatus for processing image signals by applying a multi-resolution conversion processing for reducing the image size and applying a dyadic wavelet transform |
US7672523B2 (en) * | 2003-03-03 | 2010-03-02 | The Hong Kong University Of Science And Technology | Efficient rate allocation for multi-resolution coding of data |
CN1259640C (en) * | 2003-04-10 | 2006-06-14 | 中国科学院计算技术研究所 | Effective image compression and encryption amalgamation method |
US7200277B2 (en) * | 2003-07-01 | 2007-04-03 | Eastman Kodak Company | Method for transcoding a JPEG2000 compressed image |
US7760808B2 (en) * | 2005-06-21 | 2010-07-20 | Nokia Corporation | Image processing of DCT-based video sequences in compressed domain |
-
2005
- 2005-03-11 US US11/077,989 patent/US7583844B2/en not_active Expired - Fee Related
- 2005-11-23 CN CN2005800479655A patent/CN101116105B/en not_active Expired - Fee Related
- 2005-11-23 JP JP2008500281A patent/JP2008533787A/en active Pending
- 2005-11-23 EP EP05807168A patent/EP1856666A1/en not_active Withdrawn
- 2005-11-23 WO PCT/IB2005/003520 patent/WO2006095218A1/en not_active Application Discontinuation
- 2005-11-23 KR KR1020077016575A patent/KR100937378B1/en not_active IP Right Cessation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070026451A (en) * | 2004-03-10 | 2007-03-08 | 신드하라 슈퍼미디어, 인코포레이티드 | Methods and apparatuses for compressing digital image data with motion prediction |
Also Published As
Publication number | Publication date |
---|---|
CN101116105A (en) | 2008-01-30 |
US7583844B2 (en) | 2009-09-01 |
CN101116105B (en) | 2010-12-15 |
JP2008533787A (en) | 2008-08-21 |
US20060204118A1 (en) | 2006-09-14 |
KR20070090253A (en) | 2007-09-05 |
EP1856666A1 (en) | 2007-11-21 |
WO2006095218A1 (en) | 2006-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100937378B1 (en) | Method, computer program product and device for processing of still images in the compressed domain | |
Santa-Cruz et al. | JPEG 2000 performance evaluation and assessment | |
JP5506904B2 (en) | Method and system for improving compressed image chroma information | |
JP4148462B2 (en) | Image processing apparatus, electronic camera apparatus, and image processing method | |
US20140044193A1 (en) | A guaranteed-rate tiled memory-data compression | |
WO1999017257A2 (en) | System and method for compressing images using multi-threshold wavelet coding | |
Malvar et al. | Progressive-to-lossless compression of color-filter-array images using macropixel spectral-spatial transformation | |
EP1320267B1 (en) | Method of compressing digital images acquired in colour filter array (CFA) format | |
EP2304689A2 (en) | Compressed domain system and method for compression gains in encoded data | |
Hernandez-Cabronero et al. | Lossless compression of color filter array mosaic images with visualization via JPEG 2000 | |
JP2010141922A (en) | System and method for converting wavelet and computer program product | |
US9491476B2 (en) | Method and apparatus for deciding a video prediction mode | |
Lee et al. | Lossless compression of HDR color filter array image for the digital camera pipeline | |
Lee et al. | Lossless compression of CFA sampled image using decorrelated Mallat wavelet packet decomposition | |
Bazhyna | Image compression in digital cameras | |
KR20050018659A (en) | Wavelet transform system, method and computer program product | |
KR100619685B1 (en) | Method and apparatus of image transmitting control using wavelet coding for picturephone | |
Sevcenco et al. | Combined adaptive and averaging strategies for JPEG-based low bit-rate image coding | |
Malvar | Multiresolution transforms in modern image and video coding systems | |
Wang et al. | Novel wavelet coder for color image compression | |
JP2002094990A (en) | Image encoder and image encoding method, and decoder and decoding method | |
Lakshmi et al. | Image Compression of Radar Signals Using JPEG 2000 and DWT | |
Fortener | Implementation of post-compression rate distortion optimization within EBCOT in JPEG2000 | |
Devi et al. | Adaptive Transcoders for Video & Image Sequence Using Wavelet Transform | |
Skodras et al. | Compression of confocal microscopy images: a comparative study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121226 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |