KR100582024B1 - Method for wavelet-based embedded video coding with 3-D block partition - Google Patents
Method for wavelet-based embedded video coding with 3-D block partition Download PDFInfo
- Publication number
- KR100582024B1 KR100582024B1 KR1020030099875A KR20030099875A KR100582024B1 KR 100582024 B1 KR100582024 B1 KR 100582024B1 KR 1020030099875 A KR1020030099875 A KR 1020030099875A KR 20030099875 A KR20030099875 A KR 20030099875A KR 100582024 B1 KR100582024 B1 KR 100582024B1
- Authority
- KR
- South Korea
- Prior art keywords
- wavelet
- dimensional
- wavelet transform
- coefficients
- absolute value
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/62—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding by frequency transforming in three dimensions
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은 웨이블렛 변환 기반 동영상 부호화를 위한 3차원 블록분할 방식에 관한 것으로, 보다 자세하게는 연속되는 입력 동영상 프레임에 공간상으로 2차원 웨이블렛 변환과 시간적으로 1차원 웨이블렛 변환을 가하는 웨이블렛 변환 기반 동영상 부호화를 위한 3차원 블록분할 방식에 관한 것이다.The present invention relates to a three-dimensional block division method for wavelet transform-based video encoding. More particularly, the present invention relates to a wavelet transform-based video encoding in which two-dimensional wavelet transform and one-dimensional wavelet transform are spatially applied to consecutive input video frames. It relates to a three-dimensional block division scheme for.
본 발명의 웨이블렛 변환 기반 동영상 부호화를 위한 3차원 블록분할 방식은 연속되는 입력 동영상 프레임에 공간상으로 2차원 웨이블렛 변환과 시간적으로 1차원 웨이블렛 변환을 가하는 단계; 움직임 예측 및 움직임 보상 과정 없이, 웨이블렛 계수들의 절대값에 대한 n번째 MSB를 부호화하는 단계; 초기의 n은 웨이블렛 변환된 계수들 중 절대값이 가장 큰 값의 2의 승수로 선택되며, 매 단계마다 n의 값은 하나씩 감소하는 단계; 웨이블렛 계수들을 2차원 공간과 1차원 시간적으로 서브 대역에 따라 초기의 3차원 블록으로 모으는 단계; 및 상기 3차원 블록 내의 모든 계수의 절대값에 대한 n번째 MSB가 0의 값을 가질 때까지 반복적으로 블록분할을 수행하는 단계로 이루어짐에 기술적 특징이 있다.The three-dimensional block division scheme for wavelet transform-based video encoding of the present invention comprises the steps of: applying a two-dimensional wavelet transform and a one-dimensional wavelet transform temporally to a continuous input video frame; Coding the n-th MSB for the absolute value of the wavelet coefficients without motion prediction and motion compensation; Initial n is selected as a multiplier of 2 whose absolute value is the largest among the wavelet transformed coefficients, and the value of n is decreased by one for each step; Collecting wavelet coefficients into an initial three-dimensional block according to subbands in two-dimensional space and one-dimensional temporally; And performing block division repeatedly until the nth MSB for the absolute value of all coefficients in the 3D block has a value of 0.
따라서, 본 발명의 웨이블렛 변환 기반 동영상 부호화를 위한 3차원 블록분할 방식을 사용하면, 현재 해외에서 높은 기술료를 지급하며 사용하고 있는 웨이블렛 기반 동영상 부호화기를 대체할 수 있다. 또한, 기존의 웨이블렛 기반 동영상 압축 기술보다 높은 압축 효과가 있다.Therefore, by using the 3D block division method for the wavelet transform-based video encoding of the present invention, it is possible to replace the wavelet-based video encoder currently being used while paying high technical fees abroad. In addition, there is a higher compression effect than the conventional wavelet-based video compression technology.
동영상 부호화, 웨이블렛, 3차원 블록분할, WaveletVideo Coding, Wavelet, 3D Block Division, Wavelet
Description
도 1은 3차원 웨이블렛 변환 계수의 "부모-자식간 상관관계"이다.1 is a "parent-child correlation" of three-dimensional wavelet transform coefficients.
도 2는 2차원 SPIHT 웨이블렛 변환 계수의 셋의 종류이다.2 is a type of a set of two-dimensional SPIHT wavelet transform coefficients.
도 3은 해당 셋의 타입에 따른 분할 오퍼레이션이다.3 is a partitioning operation according to the type of the set.
도 4는 본 발명에 의한 웨이블렛 변환 기반 동영상 부호화를 위한 3차원 블록분할 방식이다.4 is a 3D block division scheme for wavelet transform based video encoding according to the present invention.
본 발명은 웨이블렛 변환 기반 동영상 부호화를 위한 3차원 블록분할 방식에 관한 것으로, 보다 자세하게는 연속되는 입력 동영상 프레임에 공간상으로 2차원 웨이블렛 변환과 시간적으로 1차원 웨이블렛 변환을 가하는 웨이블렛 변환 기반 동영상 부호화를 위한 3차원 블록분할 방식에 관한 것이다.The present invention relates to a three-dimensional block division method for wavelet transform-based video encoding. More particularly, the present invention relates to a wavelet transform-based video encoding in which two-dimensional wavelet transform and one-dimensional wavelet transform are spatially applied to consecutive input video frames. It relates to a three-dimensional block division scheme for.
동영상 압축 방식들(video compression schemes)에 있어서, 시간 중복(temporal redundancy)의 감소는 2가지 유형의 접근법들에 의해 주로 달성된다. 첫번째 접근법인, 소위 '하이브리드' 또는 예측 접근법에서는, 현재 프레임의 예측은 이전에 송신된 프레임들에 기초하여 계산되고, 단지 예측 에러만이 내부-코딩(intra-coded)되고 송신된다. 두번째 접근법에서는, 시간 중복은 시간 변환(temporal transform), 즉 중복들을 제거하기 위한 공간 기술들과 유사한 3차원(또는 2차원+t) 접근에 의해 이용된다. 이 후자의 접근법에 따라, 프레임들의 시퀀스는 3차원 볼륨으로서 처리되고, 따라서, 정지영상 코딩에 종종 사용된 고전적인 서브 대역 분해(subband decomposition)는 분리할 수 있는 변환들, 예컨대, 필터 뱅크들(filter banks)에 의해 구현된 웨이블렛 또는 웨이블렛 패킷 변환들을 사용함으로써 3차원 공간-시간 데이터에 확장될 수 있다. In video compression schemes, the reduction of temporal redundancy is mainly achieved by two types of approaches. In the first approach, the so-called 'hybrid' or prediction approach, the prediction of the current frame is calculated based on previously transmitted frames, only the prediction error is intra-coded and transmitted. In the second approach, temporal overlap is used by a three-dimensional (or two-dimensional + t) approach similar to temporal transform, ie spatial techniques for removing duplicates. According to this latter approach, the sequence of frames is processed as a three-dimensional volume, so that the classical subband decomposition often used for still picture coding can be separated into transforms, for example filter banks ( It can be extended to three-dimensional space-time data by using wavelet or wavelet packet transforms implemented by filter banks.
분명히, 3차원 구조에서는 시간 및 공간 방향들에서 서로 다른 필터 뱅크들을 사용함으로써 고려될 수 있는 이방성(anisotropy)이 존재한다. 더 긴 필터들을 사용하는 부가된 지연이 바람직하지 않기 때문에 보통, 하르 필터들(Haar filters)이 시간 필터링에 사용된다. 더욱이, 그것들은 2-탭 필터들 및 경계들 효과(boundaries effect)를 나타내지 않는 최상의 완전한 재구성 직교 필터들이다. Clearly, there is anisotropy in the three-dimensional structure that can be considered by using different filter banks in the temporal and spatial directions. Usually, Haar filters are used for time filtering because the added delay using longer filters is undesirable. Moreover, they are the best complete reconstruction orthogonal filters that do not exhibit two-tap filters and boundaries effect.
이 3차원 코딩 방식의 코딩 효율성은 시간 분해의 각각의 레벨에서 낮은 시간 서브 대역들의 모션 추정/보상을 수행함으로써 개선될 수 있다. 3차원 서브 대역 분해는 프레임들의 보상된 그룹 상에 적용되고(프레임들의 이 그룹은 프레임들의 2개의 수의 파워, 보통 16을 포함해야 한다), 최종 시간 분해 레벨에서, 가장 낮은 시간 서브 대역에 2개의 프레임들이 존재한다. 시간 서브 대역들의 각각의 프 레임에서 공간 분해가 수행된다. The coding efficiency of this three-dimensional coding scheme can be improved by performing motion estimation / compensation of low time subbands at each level of time decomposition. Three-dimensional subband decomposition is applied on the compensated group of frames (this group of frames should contain the power of two numbers of frames, usually 16), and at the final time decomposition level, two in the lowest temporal subband. Frames exist. Spatial decomposition is performed in each frame of the temporal subbands.
데이터의 3차원 구조를 서브 대역 코딩하는 것은 공간 서브 대역 코딩 기술의 확장으로서 실현될 수 있다. 정지영상 압축을 위한 가장 효율적인 웨이블렛 변환 기반 방식 중 하나는, 1996년, 동영상 기술을 위한 회로들 및 시스템들에 관한 IEEE 회보(IEEE Transactions on Circuits and Systems for Video Technology), 6권, pp.243-250, 에이. 셰이드(A. Said) 및 더블유. 에이. 펄만(W. A. Pearlman)의 "예측적인 트리들의 세트 분할에 기초한 새로운 고속 효율적인 동영상 코덱(A new, fast, and efficient image codec based on set partitioning in hierarchical trees)"에서 상세한 방식으로 기술된 2차원 SPIHT(Set Partitioning In Hierarchical Trees) 알고리즘에 기초하고, 최근엔 3차원 구조들에 확장되었다. 3차원 코딩 기술에 사용된 기본 개념들은 다음과 같다. 동일 위치에 대응하는 공간-시간 트리들은 웨이블렛 도메인에 형성되고, 이어서, 이들 트리들에서의 웨이블렛 계수들은 그들의 절대값 크기들의 비트-플레인 표현에서 가장 중요한 비트의 레벨에 의해 규정된 세트들로 분할되고, 결국, 가장 높게 잔존하는 비트 플레인들이 코딩되고, 결과 비트들(resulting bits)은 송신된다. Subband coding the three-dimensional structure of the data can be realized as an extension of the spatial subband coding technique. One of the most efficient wavelet transform based schemes for still image compression is, IEEE Transactions on Circuits and Systems for Video Technology, 1996, Vol. 6, pp. 243- 250, a. A. Said and W. a. Two-dimensional SPIHT (Set as described in detail in WA Pearlman's "A new, fast, and efficient image codec based on set partitioning in hierarchical trees") Based on the Partitioning In Hierarchical Trees algorithm, it has recently been extended to three-dimensional structures. The basic concepts used in the 3D coding technique are as follows. Space-time trees corresponding to the same location are formed in the wavelet domain, and then the wavelet coefficients in these trees are divided into sets defined by the level of the most significant bit in the bit-plane representation of their absolute value magnitudes. In the end, the highest remaining bit planes are coded and the resulting bits are transmitted.
본래의 SPIHT 알고리즘은 직교 분해(orthogonal decomposition)의 가설에 기초한다. 이에 따라, 재구성 에러가 서브 대역 왜곡들의 합으로서 측정된 양자화 에러와 같다(이는 각각의 서브 대역의 에너지에 기초한 비트 묶음(bit budget)을 분산하는 것이 가능한 이유이다). 정지영상 및 동영상 코딩에서의 최상의 결과들이 직교 필터들이 아닌 쌍직교 필터들을 사용하여 달성됨을 또한 보여준다. 이는 쌍직교 필터들(biorthogonal filters)의 대칭이 그들의 부모들과 동일한 공간 위치에서 웨이블렛 계수들을 산출하기 때문이다. 그러나, 쌍직교 필터들이 양자화 에러의 L2 노름(norm)을 보호하지 않는 것과 같이, 직교 변환에 대해 추론된 비트 재분할(bit repartition)은 최소 재구성 에러를 유도하지 않는다. The original SPIHT algorithm is based on the hypothesis of orthogonal decomposition. Accordingly, the reconstruction error is equal to the quantization error measured as the sum of the subband distortions (this is why it is possible to distribute a bit budget based on the energy of each subband). It is also shown that the best results in still image and video coding are achieved using bi-orthogonal filters, not orthogonal filters. This is because the symmetry of biorthogonal filters yields wavelet coefficients at the same spatial location as their parents. However, as the biorthogonal filters do not protect the L 2 norm of quantization error, the inferred bit repartition for the orthogonal transform does not lead to a minimum reconstruction error.
웨이블렛(Wavelet) 변환을 이용하는 대표적인 동영상 부호화 방법에는 3차원 SPIHT이 있다. 3차원 SPIHT은 기존에 정지영상을 부호화하기 위해 제안되었던 2차원 SPIHT 부호화 방법을 3차원으로 확장하여 동영상을 부호화한다. 3차원 SPIHT에서는 기존의 동영상 부호화기와는 달리, 움직임 예측 및 움직임 보상을 사용하지 않는다. 대신에, 시간적인 중복성을 제거하기 위하여 3차원 웨이블렛 변환을 이용한다. 그런 후에, 도 1과 같은 부모 자식간 상관관계를 이용하여, 도 2와 같은 두 가지 형태의 웨이블렛 계수의 셋(Set)을 정의한다.Three-dimensional SPIHT is a representative video encoding method using wavelet transform. The 3D SPIHT encodes a video by extending the 2D SPIHT encoding method, which has been proposed for encoding still images, in three dimensions. Unlike conventional video encoders, 3D SPIHT does not use motion prediction and motion compensation. Instead, we use the three-dimensional wavelet transform to remove temporal redundancy. Then, two sets of wavelet coefficients as shown in FIG. 2 are defined using correlations between parent children as shown in FIG. 1.
정의된 웨이블렛 계수 셋은 단계적으로 감소하는 문턱치(Threshold)에 대하여 그 중요도가 판단된다. 문턱치는 해당되는 비트-평면에 대한 표준치로서, 2의 승수로 나타내어진다. 중요도의 판단기준은 셋 내의 계수들의 절대값 중 하나라도 문턱치보다 크기가 큰 계수가 있는지이다. 만약 셋 내의 계수들 중, 문턱치와 비교하여 하나라도 절대값 크기가 큰 계수가 있다면, 해당되는 셋은 중요하다고 판단된다. 반대의 경우에는 해당되는 셋은 중요하지 않다고 판단된다. 만약 어떤 셋이 중요하다고 판단되면, 해당 셋의 타입에 따라 도 3과 같이 분할된다.The defined wavelet coefficient set is determined for importance with respect to a threshold that gradually decreases. The threshold is a standard value for the corresponding bit-plane, expressed as a multiplier of two. The criterion of importance is whether any of the absolute values of the coefficients in the set is larger than the threshold. If at least one of the coefficients in the set has a larger absolute magnitude compared to the threshold, it is determined that the set is important. In the opposite case, the set is considered insignificant. If a set is determined to be important, it is divided according to the type of the set as shown in FIG. 3.
종래기술인 대한민국 공개특허 제2002-0064791호에는 "웨이블렛 분해에 기초한 비디오 인코딩 방법"에 대하여 개시되어 있다. 이것은 프레임들의 그룹들로 세분된 비디오 시퀀스를 인코딩하기 위한 방법에 관한 것이다. 그러나, 비록 3차원 SPIHT에서 사용된 셋 분할 방식을 이용하는 동영상 부호화 방법이 낮은 계산에 관한 복잡함과 높은 압축률을 제공하는 효율적인 방법이긴 하지만, 복잡한 영상을 부호화할 때에는 효율적이지 못한 문제점이 있었다.Korean Patent Laid-Open Publication No. 2002-0064791, which is a prior art, discloses a video encoding method based on wavelet decomposition. This relates to a method for encoding a video sequence subdivided into groups of frames. However, although the video coding method using the three segmentation method used in the 3D SPIHT is an efficient method for providing a low computational complexity and a high compression rate, there is a problem that is not efficient when encoding a complex image.
따라서, 본 발명은 상기와 같은 종래 기술의 제반 단점과 문제점을 해결하기 위한 것으로, 웨이블렛 변환 기반 동영상 부호화에 이용되었던 셋 분할 방식보다 동영상 압축률이 뛰어나고, 계위 부호화(Scalable Coding)를 지원하기에도 용이한 3차원 블록분할 방식을 제공함에 본 발명의 목적이 있다.
Accordingly, the present invention is to solve the above disadvantages and problems of the prior art, the video compression ratio is superior to the set segmentation method used for wavelet transform-based video coding, it is also easy to support scalable coding (Scalable Coding) It is an object of the present invention to provide a three-dimensional block division scheme.
본 발명의 상기 목적은 연속되는 입력 동영상 프레임에 공간상으로 2차원 웨이블렛 변환과 시간적으로 1차원 웨이블렛 변환을 가하는 단계; 움직임 예측 및 움직임 보상 과정 없이, 웨이블렛 계수들의 절대값에 대한 n번째 MSB를 부호화하는 단계; 초기의 n은 웨이블렛 계수들 중 절대값이 가장 큰 값의 2의 승수로 선택되며, 매 단계마다 n의 값은 하나씩 감소하는 단계; 웨이블렛 계수들을 2차원 공간과 1차원 시간적으로 서브 대역에 따라 초기의 3차원 블록으로 모으는 단계; 및 상기 3차원 블록 내의 모든 계수의 절대값에 대한 n번째 MSB가 0의 값을 가질 때까지 반복적으로 블록분할을 수행하는 단계로 이루어진 웨이블렛 변환 기반 동영상 부호화를 위한 3차원 블록분할 방식에 의해 달성된다.The object of the present invention is to apply a two-dimensional wavelet transform and a temporal one-dimensional wavelet transform in space to successive input video frames; Coding the n-th MSB for the absolute value of the wavelet coefficients without motion prediction and motion compensation; Initial n is selected as a multiplier of 2 whose absolute value is the largest among wavelet coefficients, and the value of n decreases by one in each step; Collecting wavelet coefficients into an initial three-dimensional block according to subbands in two-dimensional space and one-dimensional temporally; And performing block partitioning repeatedly until the n-th MSB of the absolute values of all coefficients in the three-dimensional block has a value of zero. .
본 발명의 상기 목적과 기술적 구성 및 그에 따른 작용효과에 관한 자세한 사항은 본 발명의 바람직한 실시예를 도시하고 있는 도면을 참조한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다.Details of the above object and technical configuration of the present invention and the effects thereof according to the present invention will be more clearly understood by the following detailed description with reference to the drawings showing preferred embodiments of the present invention.
3차원 SPIHT에서 사용한 셋 분할 방식을 이용하는 동영상 부호화기는 고주파 대역에 큰 절대값을 가지는 하나의 웨이블렛 계수를 부호화하기 위하여 많은 부호화 비트를 할당하여야 한다. 이것은, 복잡한 영상의 경우에는 3차원 SPIHT에서 이용한 부모-자식간 상관관계가 성립되지 못하기 때문이다. A video encoder using the set division method used in 3D SPIHT needs to allocate many coding bits in order to encode one wavelet coefficient having a large absolute value in a high frequency band. This is because the parent-child correlation used in the 3D SPIHT cannot be established in the case of a complex image.
본 발명의 3차원 블록분할 방식은 부모-자식간 상관관계가 사용되지 않는다. 대신에 대부분의 웨이블렛 계수들은 매우 작은 절대값을 가지며, 큰 절대값을 가지는 계수들은 특정 공간에 집중된다는 통계적인 특징을 이용한다. 따라서 복잡한 영상에 대해서도 3차원 SPIHT과 비교하여 높은 압축 성능을 유지할 수 있다.The three-dimensional block division scheme of the present invention does not use parent-child correlation. Instead, most wavelet coefficients take advantage of the statistical feature that they have very small absolute values, and those with large absolute values are concentrated in a specific space. Therefore, high compression performance can be maintained even for complex images compared to 3D SPIHT.
도 4는 본 발명에서 고안한 웨이블렛 변환 기반 동영상 부호화기를 위한 3차원 블록분할 방식을 도시한 것이다. 먼저, 연속되는 입력 동영상 프레임(Group Of Frame, GOF)에 공간상으로 2차원 웨이블렛 변환과 시간적으로 1차원 웨이블렛 변환을 가한다. 그런 후에, 움직임 예측 및 움직임 보상 과정 없이, n번째 MSB(Most Significant Bit)를 부호화 한다. 초기의 n은 웨이블렛 계수들 중 절대값이 가장 큰 값의 2의 승수로 선택되며, 매 단계마다 n의 값은 하나씩 감소한다. 그런데, 대부분의 웨이블렛 계수들은 아주 작은 절대값을 가진다. 따라서 이러한 계수들은 0으로 양자화해도 복원된 영상의 품질에 크게 영향을 미치지 않는다. 특히, 고주파 대역에서 비교적 큰 절대값을 가지는 계수의 발생 빈도는 매우 낮으므로, 이러한 계수에 대해서만 부호화를 수행하고, 그 위치정보를 수신 측에 전송하는 것이 합리적이다. 4 illustrates a three-dimensional block division scheme for a wavelet transform-based video encoder devised in the present invention. First, two-dimensional wavelet transform and temporal one-dimensional wavelet transform are applied to a continuous input video frame (GOF) in space. Thereafter, the nth MSB (Most Significant Bit) is encoded without motion prediction and motion compensation. The initial n is selected as a multiplier of 2 whose absolute value is the largest among the wavelet coefficients, and the value of n decreases by one every step. By the way, most wavelet coefficients have very small absolute values. Therefore, even if these coefficients are quantized to zero, they do not significantly affect the quality of the reconstructed image. In particular, since the frequency of occurrence of coefficients having a relatively large absolute value in the high frequency band is very low, it is reasonable to perform coding only on these coefficients and transmit the positional information to the receiving side.
이러한 처리를 효율적으로 수행하기 위해, 대부분의 웨이블렛 계수들은 매우 작은 절대값을 가지며, 큰 절대값을 가지는 계수들은 특정 공간에 집중된다는 통계적인 특징을 이용한다. 따라서 웨이블렛 계수들을 2차원 공간과 1차원 시간적으로 서브 대역에 따라 도 4의 왼쪽 그림과 같이 크기가 큰 초기의 3차원 블록으로 모은 후, 만약 3차원 블록 내의 모든 계수의 절대값에 대한 n번째 MSB가 0의 값을 가진다면, 하나의 비트를 할당하여 부호화를 수행한다. 반대로, 만약 3차원 블록 내의 하나의 계수라도 절대값에 대한 n번째 MSB가 1의 값을 가진다면, 도 4의 오른쪽 그림과 같이 블록 분할을 수행한다. 이러한 과정을 각 단계의 n에 대해 더 이상 블록 내의 웨이블렛 계수들의 절대값에 대한 MSB가 1의 값이 없다고 판단될 때까지 반복하여 동영상을 부호화할 수 있다.In order to perform this process efficiently, most wavelet coefficients use a statistical feature that they have very small absolute values, and those with large absolute values are concentrated in a specific space. Therefore, after wavelet coefficients are collected in two-dimensional space and one-dimensional temporal subbands into large initial three-dimensional blocks as shown in the left figure of FIG. If 0 has a value of 0, encoding is performed by allocating one bit. On the contrary, if the n-th MSB for the absolute value has a value of 1 even for one coefficient in the 3D block, block division is performed as shown in the right figure of FIG. This process may be repeated for n of each step until it is determined that the MSB for the absolute value of the wavelet coefficients in the block no longer has a value of 1.
본 발명의 기술은 동영상 부호화, 멀티미디어 전송, 입체영상, 의료영상 및 멀티미디어 특징 추출 분야에 적용될 수 있다. The technique of the present invention can be applied to the field of video encoding, multimedia transmission, stereoscopic image, medical image and multimedia feature extraction.
본 발명은 이상에서 살펴본 바와 같이 바람직한 실시예를 들어 도시하고 설명하였으나, 상기한 실시 예에 한정되지 아니하며 본 발명의 정신을 벗어나지 않는 범위 내에서 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변경과 수정이 가능할 것이다.The present invention has been shown and described with reference to the preferred embodiments as described above, but is not limited to the above embodiments and those skilled in the art without departing from the spirit of the present invention. Various changes and modifications will be possible.
따라서, 본 발명의 웨이블렛 변환 기반 동영상 부호화를 위한 3차원 블록분할 방식을 사용하면, 현재 해외에서 높은 기술료를 지급하며 사용하고 있는 웨이블 렛 기반 동영상 부호화기를 대체할 수 있다. 또한, 기존의 웨이블렛 기반 동영상 압축 기술보다 높은 압축 효과가 있다.
Therefore, by using the 3D block division method for wavelet transform-based video encoding of the present invention, it is possible to replace the wavelet-based video encoder currently being used while paying high technical fees abroad. In addition, there is a higher compression effect than the conventional wavelet-based video compression technology.
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030099875A KR100582024B1 (en) | 2003-12-30 | 2003-12-30 | Method for wavelet-based embedded video coding with 3-D block partition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030099875A KR100582024B1 (en) | 2003-12-30 | 2003-12-30 | Method for wavelet-based embedded video coding with 3-D block partition |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050068450A KR20050068450A (en) | 2005-07-05 |
KR100582024B1 true KR100582024B1 (en) | 2006-05-22 |
Family
ID=37259006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030099875A KR100582024B1 (en) | 2003-12-30 | 2003-12-30 | Method for wavelet-based embedded video coding with 3-D block partition |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100582024B1 (en) |
-
2003
- 2003-12-30 KR KR1020030099875A patent/KR100582024B1/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR20050068450A (en) | 2005-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1722838B (en) | Scalable video coding method and apparatus using base-layer | |
JP2003504987A (en) | Encoding method for compressing video sequence | |
US7042946B2 (en) | Wavelet based coding using motion compensated filtering based on both single and multiple reference frames | |
US7023923B2 (en) | Motion compensated temporal filtering based on multiple reference frames for wavelet based coding | |
US20030202599A1 (en) | Scalable wavelet based coding using motion compensated temporal filtering based on multiple reference frames | |
US20060013312A1 (en) | Method and apparatus for scalable video coding and decoding | |
WO2000072602A1 (en) | Multi-dimensional data compression | |
US6782051B2 (en) | Video encoding method based on a wavelet decomposition | |
CN102006483B (en) | Video coding and decoding method and device | |
Xiong et al. | Barbell lifting wavelet transform for highly scalable video coding | |
JP2006509410A (en) | Video encoding method and apparatus | |
US20060012680A1 (en) | Drift-free video encoding and decoding method, and corresponding devices | |
KR100582024B1 (en) | Method for wavelet-based embedded video coding with 3-D block partition | |
WO2003094526A2 (en) | Motion compensated temporal filtering based on multiple reference frames for wavelet coding | |
CN1689045A (en) | L-frames with both filtered and unfilterd regions for motion comensated temporal filtering in wavelet based coding | |
Zoghlami et al. | High-level implementation of Video compression chain coding based on MCTF lifting scheme | |
Basha et al. | Scalable Video Coding Using Accordion Discrete Wavelet Transform and Tucker Decomposition for Multimedia Applications | |
Seran et al. | Improved temporal filtering scheme to reduce delay and distortion fluctuation in 3-D wavelet based video coding | |
Akram et al. | Event based video coding architecture | |
KR20070028720A (en) | Motion image encoding system based on wavelet packet transform and the method thereof | |
Areekul et al. | Orientation adapted subband image compression | |
EP1554886A1 (en) | Drift-free video encoding and decoding method, and corresponding devices | |
Zhu et al. | Iterative Thresholding-Based Sparse Directional Representation for Efficient Low Bit-Rate Embedded Video Coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20110111 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |