KR20030021009A - Image compression method using block-based zerotree and quadtree - Google Patents

Image compression method using block-based zerotree and quadtree Download PDF

Info

Publication number
KR20030021009A
KR20030021009A KR1020010054428A KR20010054428A KR20030021009A KR 20030021009 A KR20030021009 A KR 20030021009A KR 1020010054428 A KR1020010054428 A KR 1020010054428A KR 20010054428 A KR20010054428 A KR 20010054428A KR 20030021009 A KR20030021009 A KR 20030021009A
Authority
KR
South Korea
Prior art keywords
block
coefficients
blocks
tree structure
tree
Prior art date
Application number
KR1020010054428A
Other languages
Korean (ko)
Inventor
김효준
이상욱
Original Assignee
김효준
이상욱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김효준, 이상욱 filed Critical 김효준
Priority to KR1020010054428A priority Critical patent/KR20030021009A/en
Publication of KR20030021009A publication Critical patent/KR20030021009A/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

PURPOSE: A method for compressing video using block-based zerotree and photograph tree structure is provided to efficiently encode insignificant coefficients covering a wide range and obtain an excellent property in a pyramid of a low level. CONSTITUTION: All blocks on a wavelet top level are repeatedly divided to find out significant blocks following a spacial orientation tree structure. A photograph tree structure division is executed while the significance of the found blocks related to a threshold value is evaluated, so that significant coefficients existing in a first block are found and coded until the block becomes small by the pixel. To the blocks which are judged as insignificant blocks, the photograph tree structure division is executed related to a current threshold value, in order of small size. Bits on a current bit plane of the significant coefficients are output, so that first found significant coefficients are restored to more accurate original values. The previous steps are repeated until a wanted bit rate or image quality is obtained, lowering the current threshold.

Description

블록 기반 제로트리와 사진나무구조를 이용한 영상 압축 방법{IMAGE COMPRESSION METHOD USING BLOCK-BASED ZEROTREE AND QUADTREE}Image Compression Method Using Block-Based Zero-Tree and Photo-Tree Structure {IMAGE COMPRESSION METHOD USING BLOCK-BASED ZEROTREE AND QUADTREE}

본 발명은 영상 압축 방법에 관한 것으로, 더욱 상세하게는 블록 기반 제로트리와 사진나무구조를 이용하여 비트 평면을 효율적으로 부호화함으로써 우수한 압축 성능을 제공하는 영상 압축 방법에 관한 것이다.The present invention relates to an image compression method, and more particularly, to an image compression method that provides excellent compression performance by efficiently encoding a bit plane using a block-based zero tree and a photographic tree structure.

근래 웨이블렛(wavelet) 이론이 소개되면서 웨이블렛 변환에 기반한 영상 부호화에 대한 연구가 많이 이루어지고 있다. 이것은 웨이블렛 변환이 에너지 압축과 공간-주파수 국지화와 같은 여러 유용한 특성을 제공함에 기인한 것이다.Recently, wavelet theory has been introduced, and many studies on image coding based on wavelet transform have been conducted. This is due to the wavelet transform providing several useful properties, such as energy compression and space-frequency localization.

Shapiro에 의해 제안된 EZW(Embedded Zerotree Wavelet) 방법은 공간-주파수 국지화, 주파수 대역간의 유사성, 주파수 대역에 따른 웨이블렛 계수의 크기 감소 등과 같은 웨이블렛 변환 후의 영상의 특성을 이용하여 효율성과 복잡도 면에서 두 가지 측면을 동시에 향상시키는 영상 압축 방법이다.The EZW (Embedded Zerotree Wavelet) method proposed by Shapiro uses two characteristics in terms of efficiency and complexity by using the characteristics of the image after wavelet transform, such as spatial-frequency localization, similarity between frequency bands, and size reduction of wavelet coefficients according to frequency bands. It is a video compression method to improve the side at the same time.

Said와 Pearlman에 의해 제안된 SPIHT(Set Partitioning In Hierarchical Trees) 방법은 중요도 지도(significance map)를 부호화하는데 새로운 집합 분할 방법을 사용하여, 산술 부호기(arithmetic coder)를 사용하지 않고도 EZW보다 우수한 성능을 보였다.The Set Partitioning In Hierarchical Trees (SPIHT) method proposed by Said and Pearlman uses a new set partitioning method to encode the importance map, which outperforms EZW without using an arithmetic coder. .

EZW와 SPIHT 두 방법 모두 중요도 지도를 부호화하기 위해 구조화된 계수 집합인 제로트리(zerotree)를 사용하여 중요하지 않은 웨이블렛 계수들이 주파수 대역간에 갖고 있는 상관성을 이용한다.Both the EZW and SPIHT methods use the correlation of non-significant wavelet coefficients between frequency bands using a zerotree, a structured set of coefficients, to encode the importance map.

한편, Servetto 등에 의해 제안된 MRWD(morphological representation of wavelet data) 방법과 Chai 등에 의해 제안된 SLCCA(significance-linked connected component analysis) 방법은 주파수 부대역(subband) 안에 중요한 웨이블렛 계수들이 군집형태를 이루는 특성과 부대역간에 중요한 계수들이 서로 관련되는 특성을 이용하여 중요도 지도를 효율적으로 부호화를 함으로써, 제로트리에 기반한 방법들에 필적하는 성능을 보였다.On the other hand, the morphological representation of wavelet data (MRWD) method proposed by Servetto et al. And the signal-linked connected component analysis (SLCCA) method proposed by Chai et al. Are characterized by clustering of wavelet coefficients that are important in the frequency subband. By efficiently encoding the importance map using the characteristics of the important coefficients between the subbands, the performance is comparable to the zero tree-based methods.

상기와 같은 두 종류의 접근방법은 웨이블렛 변환된 영상의 특성을 이용하여 중요도 지도를 효율적으로 부호화하는 것을 공통의 목표로 갖고 있지만 서로 다른 측면에서 알고리듬을 발전시켰다. 즉 위에 언급된 부호화 방법들은 주어진 비트 평면(bit plane)에서 웨이블렛 계수가 중요한지 아닌지를 최대한 압축하여 기술하는데 주안점을 두고 있는데, EZW와 SPIHT과 같은 제로트리에 기반한 방법들은 제로트리의 형태로 영인 계수(중요하지 않은 계수)를 효과적으로 부호화를 한 후 계수가 영인 영역들을 배제함으로서 영이 아닌 계수들의 위치를 파악하고, MRWD와 SLCCA방법은 군집하여 모여 있는 영이 아닌 계수들을 둘러싸는 계수들만을 부호화하여 그 안에 있는 계수들을 중요한 계수라고 파악하고 그 외의 영역들은 중요하지 않은 영역으로 파악한다.The above two approaches have the common goal of efficiently encoding importance maps using the properties of wavelet transformed images, but they have developed algorithms from different aspects. In other words, the coding methods mentioned above focus on compressing and describing whether or not wavelet coefficients are important in a given bit plane. Zero-tree-based methods such as EZW and SPIHT have zero-zero coefficients in the form of zero trees. After encoding the non-critical coefficients effectively, the non-zero coefficients are located by excluding the regions where the coefficients are zero, and the MRWD and SLCCA methods encode only coefficients that surround the clustered non-zero coefficients. Identify coefficients as important, and identify other areas as noncritical.

본 발명은 블록 기반 제로트리를 이용하여 주파수 대역에 걸쳐 상관성을 보이면서 존재하는 중요하지 않은 계수를 효과적으로 부호화하며 사진나무구조를 이용하여 블록 안에 있는 중요한 계수를 찾아내어 부호화함으로써 우수한 압축 성능을 갖는 영상 압축 방법을 제공하는 데 그 목적이 있다.The present invention uses block-based zerotree to efficiently encode non-essential coefficients that exist while showing correlations across frequency bands, and uses an image tree structure to find and encode important coefficients in a block, thereby compressing an image having excellent compression performance. The purpose is to provide a method.

이와 같은 목적을 실현하기 위한 본 발명에 따른 블록 기반 제로트리와 사진나무구조를 이용한 영상 압축 방법은, 웨이블렛 최상위 레벨상의 블록으로부터 파생된 공간 방향 나무구조를 반복적으로 분할하여 중요한 블록을 찾아내는 제 1 단계와, 상기 찾아낸 중요한 블록은 문턱치에 대하여 중요도를 평가하면서 그 블록에 사진나무구조 분할을 반복적으로 수행하여 처음 블록 안에 존재하는 중요한 계수들을 찾아 부호화하는 제 2 단계와, 상기 제 2 단계에서 이전 문턱치에 대하여 중요하지 않다고 판정된 블록들을 그 크기가 작은 순서대로 현재의 문턱치에 대하여 상기 제 2 단계를 수행하는 제 3 단계와, 이전의 문턱치에서 상기 제 2 단계에서 찾은 중요한 계수들의 현재의 비트 평면상의 비트를 출력하여 먼저 발견된 중요한 계수들을 더 정확한 원래의 값으로 복원하는 제 4 단계와, 현재의 문턱치를 연속적으로 낮추면서 원하는 비트율이나 영상 화질이 달성될 때까지 상기 제 1 단계 내지 제 4 단계를 반복하는 제 5 단계를 포함한다.An image compression method using a block-based zero tree and a photographic tree structure according to the present invention for realizing the above object is a first step of finding an important block by repeatedly dividing a spatial direction tree structure derived from a block on a wavelet top level. And a second step of finding and encoding the significant coefficients existing in the first block by repeatedly performing the photo-tree structure division on the block while evaluating the importance on the threshold. A third step of performing the second step with respect to the current threshold in order of decreasing magnitude, and the bits on the current bit plane of the significant coefficients found in the second step at the previous threshold; Outputs a more accurate circle of the important coefficients found first. And to the fourth step of restoring to a value, when achieving the desired bit rate and image quality, while reducing the current threshold value of a row and a fifth step of repeating the fourth step of the first stage to.

도 1은 공간 방향 나무구조에서의 부모-자식 관계를 나타낸 개념도,1 is a conceptual diagram showing a parent-child relationship in a spatial tree structure;

도 2는 본 발명에 따른 영상 압축 방법의 기본적인 블록 구조도.2 is a basic block structure diagram of an image compression method according to the present invention;

본 발명의 실시예로는 다수개가 존재할 수 있으며, 이하에서는 첨부한 도면을 참조하여 바람직한 실시예에 대하여 상세히 설명하기로 한다. 이 실시예를 통해 본 발명의 목적, 특징 및 이점들을 보다 잘 이해할 수 있게 된다.There may be a plurality of embodiments of the present invention. Hereinafter, preferred embodiments will be described in detail with reference to the accompanying drawings. This embodiment allows for a better understanding of the objects, features and advantages of the present invention.

본 발명은 블록 기반 제로트리와 사진나무구조를 이용하여 중요도 지도를 효율적으로 부호화하는 방법으로서, 본 발명에서 이용되는 블록 기반 제로트리는 계층적인 나무 구조의 각각의 노드를 구성하는 것이 웨이블렛 계수가 아니라 여러 계수들을 포함하고 있는 블록이다. 본 발명의 압축 방법은 넓은 범위에 걸쳐있는 영인 계수들을 블록기반 제로트리에 의하여 부호화하고 중요한 계수를 포함하고 있는 블록을 찾아낸다. 제로트리 부호화 과정에서 찾은 중요한 블록은 사진나무구조 방법에 의하여 블록을 단계적으로 분할하여 블록 안에 위치한 중요한 계수를 찾아낸다. 즉, 본 발명의 압축 방법은 제로트리 방법이 중요하지 않은 계수들을 효과적으로 부호화하는 특성을 이용하고, 중요한 블록을 사진나무구조로 분할하여 일반적으로 군집형태로 존재하는 중요한 계수들을 효과적으로 찾아 부호화하여 효과적으로 중요도 지도를 부호화하는 것이다.The present invention efficiently encodes the importance map using a block-based zero tree and a photo-tree structure. In the block-based zero tree used in the present invention, it is not a wavelet coefficient that constitutes each node of the hierarchical tree structure. A block containing coefficients. The compression method of the present invention encodes a wide range of zero coefficients by block-based zero tree and finds a block containing important coefficients. An important block found in the zero-tree coding process is to divide the block stepwise by the photo-tree structure method to find important coefficients located in the block. In other words, the compression method of the present invention utilizes a feature that effectively encodes coefficients that are not important for the zero tree method, divides an important block into a photo-tree structure, and effectively finds and encodes important coefficients generally present in a clustered form. Is to encode the map.

이와 같은 본 발명에 따른 압축 방법의 이해를 돕기 위하여 제로트리 부호화의 기본적인 방법과 여러 가지 용어들에 대해서 먼저 기술하기로 한다.In order to help understand the compression method according to the present invention as described above, the basic method and various terms of zero-tree coding will be described first.

제로트리 비트 평면 부호화는 웨이블렛 변환된 계수들을 효과적으로 부호화하는 방법 중 하나이다. 이 방법은 우수한 압축 성능 외에도 낮은 복잡도, 겹입된(embedded) 비트 스트림, 다중 해상도, 정확한 비트율 조절 등의 장점을 갖고 있으며, 이런 특성으로 인하여 제로트리 비트 평면 부호화가 최근 많이 연구되고 있다. 이 부호화 방법의 특징은 주파수 대역간의 중요한 계수들의 위치를 예측하기 위해서 웨이블렛 변환된 영상에서의 대역간 유사성을 이용한다는 것과 웨이블렛 계수들을 연속적으로 근사하여 양자화하는 데 있다.Zero-tree bit plane coding is one of the methods for efficiently encoding wavelet transformed coefficients. This method has advantages such as low complexity, embedded bit stream, multiple resolution, and accurate bit rate adjustment, in addition to excellent compression performance. Because of this property, zero-tree bit plane coding has been studied in recent years. The feature of this coding method is the use of interband similarity in the wavelet transformed image to predict the positions of important coefficients between frequency bands and the successive approximation of wavelet coefficients.

제로트리 비트 평면 부호화의 알고리듬에서 사용되는 용어와 부호화 과정을 좀 더 상세히 기술한다.The terminology and encoding process used in the algorithm of zerotree bitplane coding are described in more detail.

제로트리 비트 평면 부호화는 이산신호 웨이블렛 변환된 계수들에 적용하는 방법이다. 일반적으로 이산신호 웨이블렛 변환은 입력신호를 다양한 해상도를 나타내는 계층적인 주파수 부대역(subband) 별로 분할한다. 가장 성긴 부대역(최상위 레벨의 부대역)은 원 영상의 저주파 대역을 근사한 신호가 되며, 다른 부대역들은 근사 신호를 더 세밀하게 해주는 신호들이 된다. 웨이블렛 변환 같은 계층적인 대역 분할 시스템에서는 한 레벨 상의 모든 계수들을 더 낮은 레벨 상의 같은 방향에 있는 계수들의 집합과 연관시킬 수 있다. 이 관계에서 성긴 레벨 상의 계수들을 부모(parent)라고 부르고 낮은 레벨상의 같은 방향의 동일한 위치에 있는 계수들을 자식(children)이라고 부른다. 예를 들어 도 1은 부대역 LL2 상의 계수로부터 파생되는 웨이블렛 나무구조를 보여준다. 하나의 부모는 그 다음 레벨에서 4개의 자식을 갖게 되며, 그 각각의 자식들은 또한 그 다음 레벨에서 각각 4개의 자식들을 갖게된다. 따라서 주어진 부모 계수에 대하여 한 단계 낮은 레벨에서는 4개의 계수들, 그 다음 레벨에서는 16개의 계수들, 이런 식으로 계속해서 관계가 설정될 수 있는데 이런 아래 레벨들 상의 관련된 계수들을 자손(descendent)이라고 부른다.이렇게 웨이블렛 변환된 영상에서는 부모, 자식, 자손간에 관계가 설정되어 나무구조의 형태를 띄게 되는데 이런 구조를 공간 방향 나무구조(spatial orientation tree)라고 한다.Zero tree bit plane coding is a method applied to discrete signal wavelet transformed coefficients. In general, the discrete signal wavelet transform divides an input signal into hierarchical frequency subbands representing various resolutions. The sparse subbands (the top-level subbands) are approximations of the low frequency band of the original image, while the other subbands are the signals that make the approximate signal finer. Hierarchical band division systems, such as wavelet transforms, can associate all coefficients on one level with a set of coefficients in the same direction on a lower level. In this relationship, the coefficients on the sparse level are called parents, and the coefficients at the same location in the same direction on the lower level are called children. For example, FIG. 1 shows a wavelet tree structure derived from the coefficients on subband LL2. One parent will have four children at the next level, and each child will also have four children at the next level. Thus, for a given parent coefficient, four coefficients at one level lower, 16 coefficients at the next level, and so on can be established in this way, the related coefficients on these lower levels are called descendants. In this wavelet transformed image, a relationship is established between parent, child, and offspring, thus forming a tree structure. Such a structure is called a spatial orientation tree.

EZW에 의해 소개된 제로트리 방법은 공간 방향 나무구조에 기반한 것이다. 제로트리 구조는 만약 성긴 대역에서의 한 웨이블렛 계수가 주어진 문턱치 T에 대하여 중요하지 않다면(즉, 0으로 표현된다면), 그 아래 더 세밀한 대역에서의 같은 위치에 있는 계수들도 같은 문턱치 T에 대하여 중요하지 않을 확률이 매우 높은 점을 이용한다. EZW는 주어진 계수를 포함한 나무구조 상의 모든 계수가 주어진 문턱치 T에 대하여 중요하지 않다면 제로트리 심볼을 사용하여 나무구조 상의 모든 계수를 하나의 심볼로 부호화한다. SPIHT은 EZW와는 달리 주어진 계수와 그 계수로부터 파생된 나무구조를 개별적으로 각각 중요도를 판정하여 부호화한다. 문턱치 T는 보통 2^n으로 설정하므로 연속되는 문턱치 T는 n에 따른 비트 평면이 되며, 이 비트 평면 상에서 계수들이 중요한지 아닌지를 판정하여 부호화가 이루어지게 된다. 이때 한 비트 평면상에서의 계수의 중요도 정보를 나타내는 것을 중요도 지도(significance map)라고 한다. 중요하다고 판정된 계수들에 대해서는 연속적 근사 양자화 방법에 의하여 계속되는 비트 평면 별로 계수들이 보다 정확한 값으로 복원되도록 부호화한다.The zero-tree method introduced by EZW is based on the spatial direction tree structure. The zero-tree structure is important if a wavelet coefficient in the sparse band is not important for a given threshold T (i.e. expressed as 0), and the coefficients in the same position in the finer band below it are important for the same threshold T. Use points that are very unlikely. The EZW encodes all coefficients on the tree structure into one symbol using a zerotree symbol if all coefficients on the tree structure including the given coefficients are not important for the given threshold T. Unlike EZW, SPIHT determines the importance of each given coefficient and the tree structure derived from the coefficient. Since the threshold T is usually set to 2 ^ n, the successive threshold T becomes a bit plane according to n, and coding is performed by determining whether coefficients are important on this bit plane. In this case, representing the importance information of the coefficient on one bit plane is called a importance map. For coefficients determined to be important, the coefficients are coded so that the coefficients are restored to more accurate values for each bit plane which is continued by the continuous approximation quantization method.

이하, 도 2를 참조하여 본 발명에 따른 블록 기반 제로트리와 사진나무구조를 이용한 영상 압축 방법을 설명하기로 한다.Hereinafter, an image compression method using a block-based zero tree and a photo tree structure according to the present invention will be described with reference to FIG. 2.

본 발명에 따른 영상 압축 방법은 도 2의 기본적인 블록 구조도에 나타낸 바와 같이, 제로트리 단계, 사진나무구조 단계, 정밀화 단계로 이루어진다.As shown in the basic block structure diagram of FIG. 2, the image compression method according to the present invention comprises a zero tree step, a photo tree structure step, and a refinement step.

제로트리 단계에서는 공간 방향 나무구조를 따라 블록들을 중요도 테스트를 함으로써 웨이블렛 계수들의 블록들을 정렬하고, 결국 중요한 블록을 찾는다.In the zero-tree step, the blocks are ordered by the importance test of the blocks along the spatial direction tree structure, and finally, the significant blocks are found.

k는 음수가 아닌 정수 일 때, 블록은크기의 웨이블렛 계수를 담고 있다. 어떤 블록 B가 n에 대하여 다음과 같은 수학식 1을 만족한다면 그 블록은 중요하다고 정의되며, 주어진 블록이 수학식 1을 만족하지 않으면 그 블록은 중요하지 않다고 말한다.When k is a nonnegative integer, the block Contains wavelet coefficients of magnitude. If a block B satisfies Equation 1 for n, the block is defined as important, and if the given block does not satisfy Equation 1, the block is not important.

위 수학식 1에서는 웨이블렛 계수이고, (i,j)는 그 계수의 좌표를 나타낸다.In Equation 1 above Is a wavelet coefficient, and (i, j) represents the coordinates of that coefficient.

공간 방향 나무구조는 웨이블렛 변환된 영상의 대역간 유사성과 계수의 국지화를 이용하여 블록 그룹의 중요도를 평가하기 위해 도입된 것으로 도 1에서 보여지는 구조를 갖는다. 공간 방향 나무구조에서는 각 노드는 2 × 2개의 인접한 블록들로 이루어져 있고, 노드의 각 블록은 4개의 자식 블록을 갖는다. 단 웨이블렛 피라미드의 최상위 레벨에서는 노드 안의 하나의 블록(도 1에서 *로 표시된 블록)만은 아무 자식 블록도 갖지 않는다.The spatial tree structure is introduced to evaluate the importance of a block group by using the similarity between the bands of the wavelet transformed image and localization of coefficients, and has a structure shown in FIG. 1. In a spatial tree structure, each node consists of 2 × 2 adjacent blocks, and each block of nodes has four child blocks. At the top level of the wavelet pyramid, however, only one block in the node (the block marked with * in Figure 1) has no child blocks.

실제적으로 알고리듬을 구현할 때, 본 발명은 4개의 목록을 유지하게 되는데, 그 목록들은 각각 중요하지 않은 블록 목록(LIB), 중요하지 않은 블록 집합 목록(LIBS), 중요한 계수 목록(LSP), 사진나무구조 적용 블록 목록(LQB)이다.In practical implementation of the algorithm, the present invention maintains four lists, each of which has a list of unimportant blocks (LIB), a list of unimportant block sets (LIBS), a list of important coefficients (LSP), and a photograph tree. Structure Applied Block List (LQB).

초기화 단계에서는 LIB를 웨이블렛 피라미드의 최상위 레벨에 있는 모든크기의 블록들로, LIBS를 자손을 갖지 않는 블록을 제외한 최상위 레벨에 있는 모든 블록들로 초기화하고, LSP와 LQB는 비어있는 목록으로 설정한다.In the initialization phase, the LIB is placed at the top level of the wavelet pyramid. With blocks of size, LIBS is initialized with all blocks at the top level except blocks that have no descendants, and LSP and LQB are set to empty lists.

제로트리 단계에서 하는 기본적인 작용은 LIBS 상에 있는 블록 집합을 반복적으로 분할하여 각각의 중요하지 않은 블록과 전보다 더 작은 크기의 중요하지 않은 블록 집합을 찾아서 각각의 위치를 LIB와 LIBS에 알맞게 등재시키고, 결국에는 중요한 블록을 찾아내는 것이다. 일단 중요한 블록이 찾아지면 그 블록에 즉시 사진나무구조 블록 분할 과정을 적용한다.The basic action of the zerotree phase is to iteratively partition the block sets on the LIBS, find each non-critical block and a set of non-critical blocks of smaller size than before, and list each location in LIB and LIBS as appropriate. In the end, it's about finding important blocks. Once an important block is found, the block tree segmentation process is immediately applied to that block.

사진나무구조 블록 분할 과정은 문턱치 n에 대하여 블록의 중요도를 평가하면서 그 블록에 사진나무구조 분할을 수행한다. 만약 주어진 블록이 중요하다면, 그 블록은 블록의 4분의 1 크기를 갖는 더 작은 4개의 블록으로 분할된다. 이 4개의 블록들은 각각 다시 주어진 블록으로 설정되어 화소 단위로 작아질 때까지 반복적으로 처리된다. 이런 반복적인 과정에 의하여 처음 블록 안에 존재하는 중요한 계수들이 찾아지고 부호화되며, 이렇게 찾아진 중요한 계수들은 LSP 상에 등재된다. 이 과정 중에 중요하지 않다고 판정된 블록들은 LQB 상에 등재되며 사진나무구조 단계에서 다음의 더 낮은 문턱치에 대하여 다시 중요도 평가를 받게 된다.The photo-tree block partitioning process performs the photo-tree structure division on the block while evaluating the importance of the block against the threshold n. If a given block is important, the block is divided into four smaller blocks with one quarter the size of the block. These four blocks are each set to a given block again and repeatedly processed until they are reduced pixel by pixel. This iterative process finds and encodes the significant coefficients that exist in the first block, and the significant coefficients are found on the LSP. Blocks that are determined to be insignificant during this process will be listed on the LQB and reevaluated for the next lower threshold at the photographic tree structure stage.

사진나무구조 단계에서는 LQB 상에 등재된 중요하지 않은 블록들을 현재의 문턱치에 대하여 사진나무구조 블록분할을 수행하게 되는데, LQB 상에는 다양한 크기를 갖는 블록, 즉크기의 블록(여기서 k = 0, 1, ... , i - 1)이 존재할 수 있다. 이 블록들은 그 크기가 작은 순서대로 차례대로 처리를 한다. 즉 1 × 1 크기의 블록을 맨 먼저 처리를 하고 그 다음 2 × 2 크기의 블록들을 처리하는 순서이다. 크기가 작은 순으로 블록을 처리하는 이유는 LQB 상에 등재된 블록들은 모두 그 블록과 크기가 같은 인접 블록에 중요한 계수가 있을 경우에 생긴 블록들이다. 따라서 블록의 크기가 작을수록 그 블록이 연속되는 문턱치에서 먼저 중요한 계수를 담고 있을 가능성이 높기 때문이다.In the photo-tree structure step, the photo-tree structure block division is performed on the non-critical blocks listed on the LQB with respect to the current threshold. There may be blocks of size (where k = 0, 1, ..., i-1). These blocks are processed in order of decreasing size. In other words, the 1 × 1 block is processed first, followed by 2 × 2 blocks. The reason for processing the blocks in the order of the smallest size is that all the blocks listed on the LQB are generated when there is a significant coefficient in adjacent blocks of the same size as the block. Therefore, the smaller the block size, the higher the probability that the block contains important coefficients at successive thresholds.

사진나무구조 단계 후의 정밀화 단계에서는 이전의 문턱치에서 LSP 상에 등재된 계수들의 현재의 비트 평면상의 비트를 출력함으로써 먼저 발견된 중요한 계수들을 더 정확한 원래의 값으로 복원하게 한다. 이 세 단계는 현재의 문턱치를 연속적으로 2배 낮추면서 원하는 비트율이나 영상 화질이 달성될 때까지 반복된다. 이 때 각 단계에서 출력된 비트들은 엔트로피 부호기를 거치지 않고 바로 비트 스트림이 될 수도 있고, 엔트로피 부호기를 거쳐 비트율을 더욱 낮출 수 있다.The refinement step after the photo-tree structure step outputs the bits on the current bit plane of the coefficients listed on the LSP at the previous threshold to restore the first found significant coefficients to more accurate original values. These three steps are repeated until the desired bit rate or image quality is achieved while continuously lowering the current threshold twice. At this time, the bits output in each step may be a bit stream without passing through the entropy encoder, and the bit rate may be further lowered through the entropy encoder.

상기와 같은 본 발명의 영상 압축 방법을 각 단계별로 정리하면 다음과 같다.The image compression method of the present invention as described above is summarized as follows.

초기화 단계:Initialization Steps:

제 1 과정 -이 모든 웨이블렛 계수의 절대값보다 크도록 n을 설정한다.First course- Set n to be greater than the absolute value of all these wavelet coefficients.

제 2 과정 - LSP와 LQB는 비어있는 목록으로 설정하고, LIB와 LIBS는 웨이블렛 최상위 레벨상의 모든 블록들을 담는다. 단 LIBS에는 자손이 없는 블록은 제외한다.Step 2-LSP and LQB are set to empty lists, LIB and LIBS contain all blocks on the top level of the wavelet. LIBS excludes blocks without descendants.

사진나무구조 단계:Picture of wood structure steps:

제 3 과정 - LQB 상에 등재된 블록들을 블록의 크기가 작은 순서대로 사진나무구조 블록 분할 단계로 보낸다.Step 3-The blocks listed on the LQB are sent to the photo-tree block dividing step in the order of the smallest block size.

제로트리 단계:Zero Tree Steps:

제 4 과정 - LIB 상에 있는 모든 블록들에 대하여 중요도 판정을 한다. 블록이 중요하다면 그 블록을 LIB에서 삭제하고 사진나무구조 블록 분할 단계로 보낸다.Step 4-Make an importance determination on all the blocks on the LIB. If a block is important, delete the block from the LIB and send it to the split picture tree block.

제 5 과정 - LIBS 상에 있는 모든 블록에 대하여 그 블록의 자손들의 중요도 판정을 한다. 자손들 중 중요한 블록이 있다면 그 블록의 자식들에 대하여 중요도 판정을 한다. 자식들 중 중요한 블록은 사진나무구조 블록 분할 단계로 보내며, 자식들 중 중요하지 않은 블록은 LIB의 끝에 등재시킨다.Step 5-For every block on LIBS, the importance of the descendants of that block is determined. If any of the descendants are important, the children of that block are evaluated for importance. Important blocks of the children are sent to the photo-tree block division stage, and non-critical blocks of the children are listed at the end of the LIB.

제 6 과정 - 블록을 LIBS에서 삭제하고, 자식들의 자손이 존재한다면 자식들을 LIBS에 등재시킨다.Step 6-Delete the block from LIBS, and if there are children of the children, add the children to LIBS.

사진나무구조 블록 분할 단계:Picture of wood block dividing step:

제 7 과정 - 주어진 블록을 동일한 모양의 4개의 작은 블록으로 나누고 각각의 작은 블록에 대해 중요도 판정을 한다. 중요한 블록이 계수라면 제 8 과정으로 보내고, 그렇지 않다면 제 7 과정으로 보낸다. 중요하지 않은 블록은 LQB 상에 등재시킨다.Step 7-Divide a given block into four smaller blocks of the same shape and make an importance determination on each small block. If the significant block is a coefficient, it is sent to the eighth step, otherwise it is sent to the seventh step. Insignificant blocks are listed on the LQB.

제 8 과정 - 계수의 부호를 출력하고 계수를 LSP에 등재시킨다.Step 8-Output the sign of the coefficients and list them in the LSP.

정밀화 단계:Refinement Steps:

제 9 과정 - LSP 상에 등재된 계수들 중 마지막 제로트리 단계에서 등재된 계수를 제외하고 계수 크기의 n 번째 비트 평면상의 비트를 출력한다.Step 9-Output the bits on the n-th bit plane of the coefficient size except the coefficients listed in the last zero tree step among the coefficients listed on the LSP.

양자화 크기 갱신 단계:Quantization Size Update Steps:

제 10 과정 - n을 1만큼 줄이고 사진나무구조 단계로 간다.Step 10-Reduce n by 1 and go to the photo-tree structure step.

한편, 알고리듬의 구조상 사진나무구조 단계가 제로트리 단계 후에 오는 것이 자연스러운데, 그 이유는 사진나무구조 단계에서는 제로트리 단계에서 발견된 중요한 블록으로부터 발생되는 작은 블록을 처리하기 때문이다. 그러나 도 2에서 볼 수 있는 바와 같이 실제 구조에서는 사진나무구조 단계를 제로트리 단계 앞에 위치시킨다. 맨 처음 비트 평면에서는 LQB 상에 아무 블록도 존재하지 않기 때문에 사진나무구조 단계는 아무 비트를 출력하지 않게 되고, 계속되는 비트 평면에서는 이전 비트 평면에서의 제로트리 단계에서 발생하는 블록을 처리하게 된다. 이런 순서로 배치된 것은 사진나무구조 단계에서 발생하는 비트가 비트율-왜곡 측면에서 다른 단계에서의 비트보다 성능 향상이 더 높기 때문에 맨 처음으로 위치시킴으로 해서 전체적인 비트율-왜곡 곡선을 향상시킬 수 있기 때문이다.On the other hand, due to the structure of the algorithm, it is natural that the photo-tree structure step comes after the zero-tree step, because the photo-tree structure step processes small blocks that are generated from the important blocks found in the zero-tree step. However, in the actual structure as shown in Figure 2, the photographic tree structure step is placed before the zero tree step. Since there are no blocks on the LQB in the first bit plane, the phototree structure step outputs no bits, while the subsequent bit planes process the blocks that occur in the zero tree phase in the previous bit plane. This order is arranged because the bit that occurs in the photo-tree structure stage has a higher performance improvement than the bit in the other stages in terms of bit rate-distortion, so that the overall bit rate-distortion curve can be improved by positioning it first. .

본 발명에서 여러 번 수행되는 중요도 판정에서는 주어진 블록이나 자손들 중에 문턱치보다 큰 계수가 있을 경우에는 '1'을 출력하고 그렇지 않을 경우에는 '0'을 출력하게 된다. 계수의 부호를 출력할 때도 '0'과 '1'만을 출력하기 때문에 이런 출력 비트들은 바로 비트 스트림이 되어 전송되거나 저장할 수 있다. 하지만 엔트로피 부호기를 사용하여 비트율을 더욱 더 낮출 수 있는데, 본 발명에서는 엔트로피 부호기로 적응 산술 부호기를 사용하여 부호화 과정 중에 이용할 수 있는상관성을 이용하여 비트율을 더 낮춘다. 우선 제로트리 단계에서 각 블록과 그 블록의 자손들의 중요도 판정을 할 때, 인접한 블록들과 그 블록들의 자손들이 이전의 비트 평면에서 먼저 중요하다고 판정되었는지를 조건부로 설정하여 산술 부호화를 하고, 또한 사진나무구조 블록 분할을 수행할 때에도 분할되는 블록의 중요도 판정 시에 같은 크기의 인접한 블록 내에 먼저 발견된 중요한 계수들이 있는지에 따라 조건부 문맥(context)을 달리하여 산술 부호화를 한다.In the importance determination performed several times in the present invention, if there is a coefficient larger than the threshold value among the given blocks or descendants, '1' is outputted, otherwise '0' is outputted. When outputting the sign of a coefficient, only '0' and '1' are output, so these output bits can be transmitted and stored as a bit stream. However, the entropy coder can be used to further lower the bit rate. In the present invention, the adaptive arithmetic coder is used as the entropy coder to further reduce the bit rate using the correlation used during the encoding process. First, when determining the importance of each block and its descendants in the zero-tree step, arithmetic coding is performed by conditionally setting whether neighboring blocks and descendants of the blocks are determined to be important in the previous bit plane first, and also photographs. Even when performing tree block partitioning, arithmetic coding is performed by varying the conditional context depending on whether there are significant coefficients found first in adjacent blocks of the same size when determining the importance of the divided blocks.

상기와 같은 본 발명의 영상 압축 방법이 갖는 압축 효율은 다음의 실험결과로부터 쉽게 알 수 있다.The compression efficiency of the image compression method of the present invention as described above can be easily seen from the following experimental results.

실험 영상으로는 화소 당 8비트의 정밀도를 갖고, 512 × 512 크기의 흑백 영상인 바바라(Barbara) 인물 영상과 레나(Lena) 인물 영상을 사용하였고, 이 영상들은 9-7 Daubechies 필터를 사용하여 웨이블렛 변환을 하였다. 비트율은 실제 압축된 파일의 실제 크기로부터 계산되었고, 영상 화질은 실제 복원된 영상으로부터 계산된 PSNR(peak signal to noise ratio)에 의해 측정되었다.For the experimental images, Barbara portrait and Lena portrait images, which are black and white images of 512 × 512 size, with 8 bits per pixel precision, were used as wavelets using 9-7 Daubechies filter. The conversion was done. The bit rate was calculated from the actual size of the actual compressed file, and the image quality was measured by the peak signal to noise ratio (PSNR) calculated from the actual reconstructed image.

본 발명의 요지는 중요하지 않은 계수들에 대하여 갖고 있는 제로트리의 장점을 이용할 뿐만 아니라 중요한 계수들이 군집형태로 존재한다는 특성을 이용하는 것이다. 본 발명이 효과적이라는 것을 입증하기 위해서, 중요한 블록 안에 있는 계수들이 연속하여 문턱치가 감소되는 과정에서 어느 정도로 신속히 중요한 계수로 판명되는지를 조사하였다.The gist of the present invention is not only to take advantage of the zero tree that has insignificant coefficients, but also to take advantage of the property that important coefficients exist in clusters. In order to prove that the present invention is effective, we investigated how quickly the coefficients in the critical block turn out to be important coefficients in the course of successively decreasing the threshold.

아래의 표 1은 두 비트 평면에서의 블록 안의 중요한 계수의 비중표이다.Table 1 below shows the specific gravity of important coefficients in a block in two bit planes.

1번째비트 평면1st bit plane 2번째비트 평면2nd bit plane 3번째비트 평면3rd bit plane 4번째비트 평면4th bit plane 5번째비트 평면5th bit plane 처음 비트 평면 상에서의제로트리 단계Zero Tree Step on First Bit Plane 70.0 %70.0% 74.5 %74.5% 49.6 %49.6% 48.9 %48.9% 47.5 %47.5% 한 단계 낮은 비트 평면에서의사진나무구조 단계One step lower bit plane picture of wood structure step 68.4 %68.4% 62.9 %62.9% 45.9 %45.9% 46.0 %46.0% 42.7 %42.7% 두 비트 평면에서의중요한 계수의 총 비율Total ratio of significant coefficients in two bit planes 90.5 %90.5% 90.5 %90.5% 72.7 %72.7% 72.4 %72.4% 69.9 %69.9%

표 1은 바바라 인물 영상에 대해서 중요한 블록에 있는 계수들이 그 블록을 찾아낸 문턱치 상에서 제로트리 단계 중에 중요하다고 판명되어지는 비율과 그 다음 낮은 문턱치에서 사진나무구조 단계 중에 중요하다고 판명되어지는 비율을 나타낸다. 중요한 블록 안의 계수들의 45-70% 정도가 처음 문턱치에서 중요한 계수로 판명되어지고 그 나머지의 40-70% 정도가 다음 낮은 문턱치에서 중요하다고 판명되어진다. 결국 중요한 블록 안의 70-90% 정도의 계수들이 처음 혹은 그 다음 낮은 문턱치에서 중요하다고 판명되어진다. 따라서 일단 찾아낸 중요한 블록 안의 계수들은 처음 두 비트 평면에서 대부분 중요한 계수로 발견되기 때문에 연속되는 문턱치에서의 중요도 판정에 의한 비트 발생율이 크지 않게 된다. 그러므로 제안하는 알고리듬이 블록 기반 제로트리와 사진나무구조를 이용함으로써 중요한 계수들을 효과적으로 찾아냄을 알 수 있다.Table 1 shows the rate at which the coefficients in an important block are found to be important during the zero-tree phase on the threshold where the block is found, and the rate at the next lower threshold for the Barbara character image that is important during the photographic tree structure phase. About 45-70% of the coefficients in the critical block turn out to be important coefficients at the first threshold and about 40-70% of the remainder are important at the next lower threshold. Eventually, the coefficients of 70-90% in the critical blocks turn out to be important at the first or next lower threshold. Therefore, since the coefficients in the critical block once found are found as most important coefficients in the first two bit planes, the bit generation rate due to the importance determination at successive thresholds is not large. Therefore, we can find that the proposed algorithm effectively finds the important coefficients by using the block-based zero tree and the photo-tree structure.

아래의 표 2는 블록 크기에 변환에 의한 각 비트율에서의 영상 화질표이다.Table 2 below is a table of image quality at each bit rate by conversion to block size.

비트율블록크기Bit rate block size 0.125 bpp0.125 bpp 0.25 bpp0.25 bpp 0.5 bpp0.5 bpp 1.0 bpp1.0 bpp 2 × 22 x 2 24.39 dB24.39 dB 27.45 dB27.45 dB 31.56 dB31.56 dB 36.95 dB36.95 dB 4 × 44 × 4 24.57 dB24.57 dB 27.68 dB27.68 dB 31.70 dB31.70 dB 37.02 dB37.02 dB 8 × 88 × 8 24.62 dB24.62 dB 27.69 dB27.69 dB 31.71 dB31.71 dB 37.03 dB37.03 dB 16 × 1616 × 16 24.72 dB24.72 dB 27.71 dB27.71 dB 31.72 dB31.72 dB 37.04 dB37.04 dB

표 2는 바바라 인물 영상을 3 레벨로 웨이블렛 변환을 한 후 블록 크기를 다양한 크기로 변화시키면서 부호기의 성능을 평가한 것이다. 표 2에서 볼 수 있듯이 블록의 크기가 크면 클수록 같은 비트율에서 복원되는 영상의 화질이 더 우수한 것을 알 수 있다. 또한 비트율이 높을 때보다 낮은 비트율에서의 성능 차이가 더 커짐을 알 수 있다. 하지만 블록의 크기가 4 × 4 일 때부터 제안하는 부호기의 성능이 거의 포화 상태에 이르면서 블록의 크기가 더 커질 때 성능의 향상이 그다지 크지는 않다. 저비트율에서 블록 크기에 따른 성능차가 커지는 이유는 다음과 같다. 낮은 비트율일 때는 최상위 비트 평면 몇 개만을 부호화하게 되는데 이런 비트 평면에서는 중요하지 않은 계수들이 중요한 계수들보다 더 많이 존재하는데, 이런 경우 부호기는 중요하지 않은 계수들을 부호화하는데 많은 비트량을 소모하게 된다. 이때 블록의 크기가 클수록 중요하지 않은 계수들을 더 적은 수의 제로트리로 부호화를 할 수 있게되며, 이런 계수들을 부호화하는데 비트량을 감소할 수 있게된다. 감소한 만큼 중요한 계수들을 부호화하는데 비트를 더 사용할 수 있게되며, 결과적으로 복원되는 영상의 화질을 향상시키데 되는 것이다. 하지만 비트율이 높아질수록 비트 평면상의 중요한 계수의 비율이 많아지기 때문에 블록이 커짐에 따른 장점이 감소할 뿐만 아니라, 블록을 사진나무구조 분할하여 부호화하는데 더 많은 비트량이 필요하기 때문에, 고비트율에서는 블록의 크기에 따른 성능차가 크지 않게 된다.Table 2 shows the performance of the encoder by changing the block size to various sizes after wavelet transforming the Barbara portrait image to three levels. As shown in Table 2, the larger the block size, the better the image quality of the image reconstructed at the same bit rate. It can also be seen that the performance difference at lower bit rates is greater than at higher bit rates. However, since the performance of the proposed encoder is almost saturated since the block size is 4 × 4, the performance improvement is not so great when the block size becomes larger. The reason for the large performance difference according to the block size at the low bit rate is as follows. At low bit rates, only a few of the most significant bit planes are encoded. In these bit planes, there are more noncritical coefficients than important coefficients, in which case the encoder consumes a large amount of bits to encode noncritical coefficients. In this case, the larger the block size is, the less significant coefficients can be encoded by using a smaller number of zero trees, and the bit amount can be reduced in encoding such coefficients. As it decreases, more bits can be used to encode important coefficients, which in turn improves the quality of the reconstructed image. However, as the bit rate increases, the ratio of important coefficients on the bit plane increases, which not only reduces the advantage of the larger block, but also requires more bits to encode the block by dividing the picture tree structure. Performance difference according to size is not big.

아래의 표 3은 웨이블렛 피라미드 레벨에 따른 SPIHT와 본 발명의 성능 비교표이다.Table 3 below is a performance comparison table of the SPIHT and the present invention according to the wavelet pyramid level.

비트율피라미드레벨Bit rate pyramid level 0.125 bpp0.125 bpp 0.25 bpp0.25 bpp 0.5 bpp0.5 bpp 1.0 bpp1.0 bpp 3 레벨피라미드3 level pyramid SPIHTSPIHT 23.55 dB23.55 dB 26.46 dB26.46 dB 30.74 dB30.74 dB 36.32 dB36.32 dB 본 발명The present invention 24.62 dB24.62 dB 27.69 dB27.69 dB 31.71 dB31.71 dB 37.03 dB37.03 dB 5레벨피라미드5 level pyramid SPIHTSPIHT 24.95 dB24.95 dB 27.72 dB27.72 dB 31.65 dB31.65 dB 36.93 dB36.93 dB 본 발명The present invention 25.46 dB25.46 dB 28.22 dB28.22 dB 32.03 dB32.03 dB 37.22 dB37.22 dB

표 3은 바바라 인물 영상을 웨이블렛 변환할 때 분할되는 피라미드의 레벨을 달리한 후 8 × 8 블록을 사용한 제안 알고리듬과 SPIHT의 성능을 비교한 것이다. 두 가지 경우의 레벨에서 제안 알고리듬이 SPIHT보다 모두 우수한 결과를 보이는데, 피라미드 레벨이 5일 경우보다 피라미드 레벨이 3일 경우 제안하는 알고리듬이 SPIHT의 성능보다 더 우수한 결과를 보인다. 이는 SPIHT이 오로지 공간 방향 나무구조 상의 부모-자식 간의 관계를 이용한 제로트리만을 이용한 알고리듬인데 반해 본 발명은 제로트리 뿐만 아니라 사진나무구조 방법도 사용하기 때문이다. 피라미드 레벨이 작을 경우에는 공간 방향 나무구조를 이용하는 제로트리에 의해 얻을 수 있는 이득이 작기 때문에 이 관계만을 이용하는 SPHIT의 성능이 감소되지만, 제로트리 뿐만 아니라 사진나무구조를 이용하는 본 발명은 피라미드 레벨이 낮은 경우에도 우수한 성능을 보이는 것이다. 작은 영상일 경우에는 웨이블렛 변환할 때 피라미드 레벨이 높아짐에 따른 부담이 크지는 않지만, 영상이 커질수록 높은 레벨에서의 피라미드 분할의 계산량은 무시할 수 없게 되므로 본 발명은 더욱 효과적이 될 수 있다.Table 3 compares the performance of the proposed algorithm with 8 × 8 blocks and the performance of SPIHT after varying the levels of the divided pyramids when wavelet transforming Barbara portraits. At both levels, the proposed algorithm outperforms SPIHT. For the pyramid level 3, the proposed algorithm outperforms SPIHT. This is because SPIHT is an algorithm using only a zero tree using a parent-child relationship on a spatial tree structure, whereas the present invention uses not only a zero tree but also a photo tree structure method. If the pyramid level is small, the performance of SPHIT using only this relationship is reduced because the gain obtained by the zero tree using the spatial tree structure is small, but the present invention using the photo tree structure as well as the zero tree has a low pyramid level. Even if it shows excellent performance. In the case of a small image, the burden of increasing the pyramid level is not great when wavelet transforming. However, as the image is larger, the calculation amount of pyramid splitting at a higher level cannot be ignored.

아래의 표 4는 산술부호기 결합 유무에 따른 본 발명과 SPIHT의 성능 평가표이다.Table 4 below is a performance evaluation table of the present invention and SPIHT with or without arithmetic encoder binding.

비트율실험영상 및산술부호기 유무Bit rate experimental image and arithmetic encoder 0.125 bpp0.125 bpp 0.25 bpp0.25 bpp 0.5 bpp0.5 bpp 1.0 bpp1.0 bpp 바바라인물 영상Barbara Water Video 산술부호기무Arithmetic code SPIHTSPIHT 23.55 dB23.55 dB 26.46 dB26.46 dB 30.74 dB30.74 dB 36.32 dB36.32 dB 본 발명The present invention 24.62 dB24.62 dB 27.69 dB27.69 dB 31.71 dB31.71 dB 37.03 dB37.03 dB 산술부호기유Arithmetic code base oil SPIHTSPIHT 24.52 dB24.52 dB 27.59 dB27.59 dB 31.75 dB31.75 dB 37.23 dB37.23 dB 본 발명The present invention 24.90 dB24.90 dB 28.09 dB28.09 dB 32.19 dB32.19 dB 37.56 dB37.56 dB 레나인물 영상Lena portrait video 산술부호기무Arithmetic code SPIHTSPIHT 27.53 dB27.53 dB 32.01 dB32.01 dB 36.12 dB36.12 dB 39.66 dB39.66 dB 본 발명The present invention 29.72 dB29.72 dB 33.21 dB33.21 dB 36.62 dB36.62 dB 39.90 dB39.90 dB 산술부호기유Arithmetic code base oil SPIHTSPIHT 30.13 dB30.13 dB 33.54 dB33.54 dB 36.93 dB36.93 dB 40.28 dB40.28 dB 본 발명The present invention 30.13 dB30.13 dB 33.59 dB33.59 dB 36.97 dB36.97 dB 40.27 dB40.27 dB

표 4는 바바라 인물 영상과 레나 인물 영상에 대하여 블록 크기가 8 × 8로 설정한 본 발명과 SPIHT의 성능을 산술부호기와 결합했을 때와 아닐 때로 나누어 각각 평가한 것을 보여준다. 산술부호기를 결합하지 않을 때의 성능은 위에서 언급한 여러 특성들로 인해 본 발명이 SPIHT의 성능보다 더 우수하며, 특인 낮은 비트율일 때 더욱 성능 차이가 큰 것을 알 수 있다. 하지만 산술부호기를 결합했을 때의 두 부호기의 성능 차이는 감소하게 되며, 레나 인물 영상인 경우는 두 부호기의 성능이 거의 비슷한 것을 볼 수 있다. 이는 산술부호시에 SPIHT은 화소단위로 주변계수를 참조하여 산술 부호화함으로써 주변화소들과의 상관성을 효과적으로 이용할 수 있는 반면에, 본 발명은 블록 단위로 주변 블록들과의 상관성을 이용하므로 그 상관성이 화소단위일 때보다는 크지 않게 되어, 산술 부호기의 성능이 크지 않게 된다. 다른 측면으로 보면 본 발명이 산술 부호기를 거치기 이전에 블록 단위의 제로트리와 사진나무구조를 사용함으로써 먼저 화소들 간의 상관성을 이용한 것으로도 볼 수 있다. 또한 산술부호기의 결합이 전체적인 시스템의 복잡도를 높이게 되므로 산술부호기를 결합하지 않은 상태에서 우수한 성능을 보이는 본 발명이 유용한 측면을 가질 수 있다.Table 4 shows the evaluation of the performance of the present invention, which has a block size of 8 × 8 and SPIHT, when combined with an arithmetic encoder and when the Barbara portrait image and the Lena portrait image are divided. The performance without combining the arithmetic code shows that the present invention is superior to the performance of the SPIHT due to the above-mentioned characteristics, and the performance difference is greater at a particular low bit rate. However, when the arithmetic encoders are combined, the performance difference of the two encoders is reduced, and in the case of Lena portrait images, the performances of the two encoders are almost the same. In the arithmetic code, SPIHT is arithmetic coded by referring to peripheral coefficients in pixel units so that the correlation with peripheral pixels can be effectively used, whereas the present invention uses the correlation with neighboring blocks in block units. It is not larger than that of the pixel unit, and the performance of the arithmetic encoder is not large. In another aspect, the present invention may be regarded as using the correlation between pixels by first using a block tree and a tree structure before passing through an arithmetic encoder. In addition, since the combination of the arithmetic encoder increases the complexity of the overall system, the present invention showing excellent performance in the state in which the arithmetic encoder is not coupled may have a useful aspect.

전술한 바와 같이 본 발명은 블록 기반 제로트리 방법이 각 노드의 요소들이 계수가 아닌 블록인 제로트리 구조를 취함으로써 넓은 범위에 걸쳐 있는 중요하지 않은 계수들을 효과적으로 부호화를 하고, 사진나무구조 분할 방법을 사용하기 때문에 낮은 레벨의 피라미드에서도 우수한 성능을 보이며, 특히 낮은 비트율에서는 중요한 계수들을 부호화하는데 비트를 더 할당해 줄 수 있기 때문에 우수한 성능을 나타내는 효과가 있다.As described above, the present invention uses the block-based zero tree method to efficiently encode non-critical coefficients over a wide range by taking a zero-tree structure in which the elements of each node are blocks rather than coefficients. Because of its use, it shows excellent performance even at low level pyramids, especially at low bit rates, because it can allocate more bits to encode important coefficients.

Claims (2)

웨이블렛 변환된 영상의 중요도 지도를 부호화하는 방법에 있어서,In the method of encoding the importance map of the wavelet transformed image, 웨이블렛 최상위 레벨상의 모든 블록들을 반복적으로 분할하여 공간 방향 나무구조를 따라 중요한 블록을 찾아내는 제 1 단계;Firstly dividing all blocks on the wavelet top level to find important blocks along a spatial direction tree structure; 상기 찾아낸 중요한 블록은 문턱치에 대하여 중요도를 평가하면서 그 블록에 사진나무구조 분할을 수행하여 처음 블록 안에 존재하는 중요한 계수들을 찾아 부호화하되, 상기 사진나무구조 분할을 주어진 블록이 화소 단위로 작아질 때까지 반복하는 제 2 단계;The found significant block performs picture tree structure segmentation on the block while evaluating the importance of the threshold value, and finds and encodes the significant coefficients existing in the first block, until the given tree structure segment becomes smaller in pixels. Repeating a second step; 상기 제 2 단계에서 중요하지 않다고 판정된 블록들을 그 크기가 작은 순서대로 현재의 문턱치에 대하여 상기 제 2 단계를 수행하는 제 3 단계;A third step of performing the second step with respect to the current threshold in the order of the smallest size of the blocks determined to be insignificant in the second step; 이전의 문턱치에서 상기 제 2 단계에서 찾은 중요한 계수들의 현재의 비트 평면상의 비트를 출력하여 먼저 발견된 중요한 계수들을 더 정확한 원래의 값으로 복원하는 제 4 단계; 및A fourth step of outputting a bit on the current bit plane of the significant coefficients found in the second step at a previous threshold to restore the first found significant coefficients to a more accurate original value; And 현재의 문턱치를 연속적으로 낮추면서 원하는 비트율이나 영상 화질이 달성될 때까지 상기 제 1 단계 내지 제 4 단계를 반복하는 제 5 단계를 포함하는 블록 기반 제로트리와 사진나무구조를 이용한 영상 압축 방법.And a fifth step of repeating the first to fourth steps until a desired bit rate or image quality is achieved while continuously lowering a current threshold. 제 1 항에 있어서,The method of claim 1, 각 단계에서 출력된 비트들을 엔트로피 부호기를 이용하여 비트율을 더 낮춰비트 스트림으로 생성하는 제 6 단계를 더 포함하는 블록 기반 제로트리와 사진나무구조를 이용한 영상 압축 방법.And a sixth step of lowering the bit rate by using an entropy encoder to generate a bit stream using the entropy encoder.
KR1020010054428A 2001-09-05 2001-09-05 Image compression method using block-based zerotree and quadtree KR20030021009A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010054428A KR20030021009A (en) 2001-09-05 2001-09-05 Image compression method using block-based zerotree and quadtree

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010054428A KR20030021009A (en) 2001-09-05 2001-09-05 Image compression method using block-based zerotree and quadtree

Publications (1)

Publication Number Publication Date
KR20030021009A true KR20030021009A (en) 2003-03-12

Family

ID=27722588

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010054428A KR20030021009A (en) 2001-09-05 2001-09-05 Image compression method using block-based zerotree and quadtree

Country Status (1)

Country Link
KR (1) KR20030021009A (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5315670A (en) * 1991-11-12 1994-05-24 General Electric Company Digital data compression system including zerotree coefficient coding
US5412741A (en) * 1993-01-22 1995-05-02 David Sarnoff Research Center, Inc. Apparatus and method for compressing information
KR19980086694A (en) * 1997-05-01 1998-12-05 이또가 미찌야 Reversible Embedded Wavelet System
KR20000031283A (en) * 1998-11-02 2000-06-05 구자홍 Image coding device
EP1037468A1 (en) * 1999-03-08 2000-09-20 Texas Instruments Incorporated Image coding using embedded zerotree patterns and bitplanes

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5315670A (en) * 1991-11-12 1994-05-24 General Electric Company Digital data compression system including zerotree coefficient coding
US5412741A (en) * 1993-01-22 1995-05-02 David Sarnoff Research Center, Inc. Apparatus and method for compressing information
KR19980086694A (en) * 1997-05-01 1998-12-05 이또가 미찌야 Reversible Embedded Wavelet System
KR20000031283A (en) * 1998-11-02 2000-06-05 구자홍 Image coding device
EP1037468A1 (en) * 1999-03-08 2000-09-20 Texas Instruments Incorporated Image coding using embedded zerotree patterns and bitplanes

Similar Documents

Publication Publication Date Title
US6359928B1 (en) System and method for compressing images using multi-threshold wavelet coding
US6735342B2 (en) Video encoding method using a wavelet transform
US6519284B1 (en) Encoding method for the compression of a video sequence
Ponomarenko et al. DCT based high quality image compression
JP4111644B2 (en) Embedded encoding / decoding method and system
US6965700B2 (en) Embedded and efficient low-complexity hierarchical image coder and corresponding methods therefor
Cheng et al. Lossless to lossy dual-tree BEZW compression for hyperspectral images
Algazi et al. Analysis-based coding of image transform and subband coefficients
Li Image compression: The mathematics of JPEG 2000
US6795505B2 (en) Encoding method for the compression of a video sequence
US20020064231A1 (en) Video encoding method using a wavelet decomposition
CN108810534A (en) Method for compressing image based on direction Lifting Wavelet and improved SPIHIT under Internet of Things
Wang et al. High-fidelity image compression with multithreshold wavelet coding (MTWC)
Namuduri et al. Feature preserving image compression
Kim et al. Wavelet transform image compression using human visual characteristics and a tree structure with a height attribute
Sadashivappa et al. Performance analysis of image coding using wavelets
Abu-Hajar et al. Region of interest coding using partial-SPIHT
Kwon et al. Region adaptive subband image coding
KR20030021009A (en) Image compression method using block-based zerotree and quadtree
Li Image Compression-the Mechanics of the JPEG 2000
Wang et al. Coefficient statistic based modified spiht image compression algorithm
Wang et al. Modified SPIHT based image compression algorithm for hardware implementation
Dhavale et al. Discrete cosine transform based image compression
Jérôme et al. Optimal image compression based on sign and magnitude coding of wavelet coefficients
Mueller et al. Embedded Laplacian pyramid still image coding using zerotrees

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application