KR100440567B1 - A method for forming binary plane for motion search and a motion estimating apparatus using the same - Google Patents

A method for forming binary plane for motion search and a motion estimating apparatus using the same Download PDF

Info

Publication number
KR100440567B1
KR100440567B1 KR10-2001-0068839A KR20010068839A KR100440567B1 KR 100440567 B1 KR100440567 B1 KR 100440567B1 KR 20010068839 A KR20010068839 A KR 20010068839A KR 100440567 B1 KR100440567 B1 KR 100440567B1
Authority
KR
South Korea
Prior art keywords
image
motion
binary plane
sub
binary
Prior art date
Application number
KR10-2001-0068839A
Other languages
Korean (ko)
Other versions
KR20030037587A (en
Inventor
이제일
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR10-2001-0068839A priority Critical patent/KR100440567B1/en
Publication of KR20030037587A publication Critical patent/KR20030037587A/en
Application granted granted Critical
Publication of KR100440567B1 publication Critical patent/KR100440567B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Abstract

본 발명은 웨이브렛 변환 영역에서 움직임 탐색 여부를 나타내는 이진 평면을 이용한 다중 해상도 움직임 추정방법에 관한 것으로, 웨이브렛 변환에 의해 입력 영상을 여러 해상도로 분할한 후, 연속 프레임간의 시간적 중복성을 이용하여 잠재적 움직임 영역을 나타내는 이진 평면을 구성하고, 이를 기반으로 다중 해상도 움직임 추정을 수행하는 단계를 포함하고 있다.The present invention relates to a multi-resolution motion estimation method using a binary plane that indicates whether a motion is searched in a wavelet transform region. After splitting an input image into various resolutions by wavelet transform, it is possible to use temporal redundancy between successive frames. Comprising a binary plane representing a motion region, and performing a multi-resolution motion estimation based on this.

본 발명에 의하면, 대역들간의 에너지 분포, 인간의 시각적 특징 그리고 움직임 탐색 계산량을 고려하여 계층에 따라 움직임 탐색 영역이 적응적으로 분포되게 함으로써 기존의 움직임 추정 방법을 사용할 때 발생하는 많은 계산량과 비트 수 그리고 움직임 탐색오류의 누적 등의 문제점을 본 발명에서 제안된 방법으로서 개선할 수 있으며, 이를 통해 화질의 저하 없이 수행시간이 빨라지는 효과를 얻을 수 있다.According to the present invention, a large amount of computation and number of bits generated when using a conventional motion estimation method by adaptively distributing a motion search region according to a layer in consideration of energy distribution between bands, human visual characteristics, and motion search computation amount In addition, problems such as accumulation of motion search errors can be improved by the method proposed in the present invention, and thus the execution time can be improved without deterioration of image quality.

Description

움직임 탐색을 위한 이진 평면 구성방법 및 이를 이용한 움직임 추정 장치{A METHOD FOR FORMING BINARY PLANE FOR MOTION SEARCH AND A MOTION ESTIMATING APPARATUS USING THE SAME}Binary plane construction method for motion search and motion estimation device using the same {A METHOD FOR FORMING BINARY PLANE FOR MOTION SEARCH AND A MOTION ESTIMATING APPARATUS USING THE SAME}

본 발명은 움직임 탐색을 위한 이진 평면 구성방법 및 이를 이용한 움직임추정 장치에 관한 것으로, 더욱 상세하게는 신호 및 영상처리, 동영상 압축 등의 분야에 적용되며, 웨이브렛 변환된 영상에서의 움직임 탐색을 위한 이진 평면 구성방법 및 이를 이용한 움직임 추정 장치에 관한 것이다.The present invention relates to a binary plane configuration method for a motion search and a motion estimation device using the same. More particularly, the present invention is applied to fields such as signal and image processing, video compression, and the like. A binary plane construction method and a motion estimation apparatus using the same.

일반적으로, 동영상은 공간 상관성과 시간 상관성을 동시에 가진다. 영상 압축은 이러한 영상 신호에 존재하는 상관성, 즉, 중복되는 부분을 제거하는 것이다. 더 구체적으로 살펴보면, 영상 신호에는 색성분 사이의 스펙트럼 상관성(spectral corelation), 프레임과 프레임 사이의 시간적 상관성(temporal corelation) 및 화면내 화소 사이의 공간적 상관성(spatial corelation) 등이 존재한다. 이 중에서도 시간 상관성이 가장 중요한 인자(factor)이기 때문에 연속하는 프레임 사이의 부호화를 통해 많은 양의 데이터를 압축할 수 있다.In general, a video has both spatial and temporal correlation. Image compression is the elimination of the correlation, i. In more detail, an image signal includes spectral correlation between color components, temporal correlation between frames and frames, and spatial correlation between pixels in a screen. Among these, since temporal correlation is the most important factor, a large amount of data can be compressed through encoding between successive frames.

프레임 간의 부호화 방법은 시간 상관성을 이용하여 연속 프레임 사이의 움직임을 추정하는 움직임 추정 과정, 추정된 움직임 정보를 이용한 움직임 보상 과정 및, 움직임 보상된 프레임과 현재 프레임 사이의 차이를 부호화하는 움직임 보상된 차영상 부호화 과정의 세 부분으로 구성된다.The encoding method between frames includes a motion estimation process for estimating motion between successive frames using time correlation, a motion compensation process using estimated motion information, and a motion compensated difference encoding a difference between the motion compensated frame and the current frame. It consists of three parts of the video encoding process.

동영상 부호화에서 움직임 추정 방법으로는 일반적으로 블록 정합 알고리즘(BMA : block matching algorithm)이 사용되는데, 이것은 이 알고리즘이 간단하여 하드웨어 구현이 용이하기 때문이다. 그러나, 대상 영상의 움직임에 대하여 적절한 탐색 영역과 블록의 크기를 결정하기 어렵고, 일정한 크기의 블록으로 나누어 움직임을 추정하기 때문에 구획화 현상이 발생하는 단점이 있다.In video coding, a block matching algorithm (BMA) is generally used as a motion estimation method because the algorithm is simple and hardware implementation is easy. However, it is difficult to determine the appropriate search area and the size of the block with respect to the motion of the target image, and the partitioning phenomenon occurs because the motion is estimated by dividing the block into a predetermined size block.

이러한 단점들을 제거하기 위하여, 웨이브렛 변환(wavelet transformation)을 이용하여 입력 영상을 다중 해상도(multi resolution)로 분할한 후, 분할된 영상에 대하여 계층적으로 움직임을 추정하는 방법들이 연구되고 있다.In order to remove these drawbacks, methods for estimating the hierarchical motion of the split image after dividing the input image into multi resolution using wavelet transformation have been studied.

신호 및 영상처리와 동영상 압축 등의 분야에서 최근 폭넓게 적용되고 있는 상기 웨이브렛 변환은 여러 가지 형태의 신호를 훨씬 더 효율적으로 표현할 수 있어서 압축비를 좋게 할 수 있기 때문에, 푸리에 변환(Fourier transformation)에 기반을 둔 기존의 신호처리 알고리즘에 비해 속도가 빠르고 시간 영역과 주파수 영역에서 신호의 국소화를 효율적으로 구현할 수 있다.The wavelet transform, which has recently been widely applied in the fields of signal and image processing and video compression, can express various types of signals much more efficiently, and thus can improve the compression ratio. Therefore, the wavelet transform is based on Fourier transformation. Compared to the conventional signal processing algorithms, it is faster and can implement localization of signals efficiently in time domain and frequency domain.

현재까지 알려진 웨이브렛 변환된 영상에서의 움직임 추정방법은 다중 해상도 움직임 추정 방법(MRME : multiresolution motion estimation)이 대표적인데, 이 방법에서는 기준 및 현재 프레임을 웨이브렛 변환하고 각 대역(subband)들 간의 움직임의 상관성을 이용하여, 기저 대역(base band)의 움직임 벡터로서 고해상도 계층의 움직임을 예측한다.The motion estimation method in wavelet transformed images known to date is representative of multi-resolution motion estimation (MRME). In this method, wavelet transforms a reference and a current frame and moves between subbands. Using the correlation of, the motion of the high resolution layer is predicted as a base band motion vector.

또한 대역들 간의 에너지 집중도를 고려하여 움직임 추정 블록의 크기를 해상도에 비례하여 가변시키면서 블록 정합 알고리즘을 실행하므로, 블록간의 고른 움직임 벡터가 구해져서 기존의 움직임 추정 방법들에 비해 블록화 현상을 많이 줄일수 있다.In addition, the block matching algorithm is executed by varying the size of the motion estimation block in proportion to the resolution in consideration of the energy concentration between the bands. Thus, an even motion vector is obtained between the blocks, which significantly reduces the blocking effect compared to the conventional motion estimation methods. have.

이하, 도 1 및 도 2를 참조하여 본 발명의 선행기술인 웨이브렛 변환 및 이를 이용한 다중 해상도 움직임 추정 방법에 대해 설명한다.Hereinafter, a wavelet transform and a multi-resolution motion estimation method using the same according to the present invention will be described with reference to FIGS. 1 and 2.

도1에는 원영상(original image)(S1)을 3계층의 해상도로 분해하고, 각 계층이 여러 개의 부영상들로 구성되어 있는 웨이브렛 변환된 영상의 계층적 구조가도시되어 있다. 원영상을 한번 웨이브렛 변환하면, 원영상의 1/4 크기이고 원영상의 저주파 성분을 가지는 부영상(sub-image)(S2)과, 원영상의 수평, 수직 및 대각선 방향의 고주파 성분을 가지는 3개의 부영상(W12, W22, W32)으로 분할되어 계층 1을 구성한다. 저주파 성분인 상기 부영상(S2)을 다시 웨이브렛 변환하면, 상기 부영상(S2)의 저주파 성분을 가지는 부영상(S4)과, 상기 부영상(S2)의 수평, 수직 및 대각선 방향의 고주파 성분을 가지는 3개의 부영상(W14, W24, W34)으로 다시 분할되어 계층 2를 구성한다. 상기 부영상(S4)을 한번 더 웨이브렛 변환하면, 상기 부영상(S4)의 저주파 성분을 갖는 부영상(S8)과, 상기 부영상(S4)의 수평, 수직 및 대각선 방향의 고주파 성분을 갖는 3개의 부영상(W18, W28, W38)으로 분할되어 계층 3을 구성한다. 여기서, 이러한 부영상들은 각 계층의 같은 방향성을 가지는 부영상들 사이에는 서로 상관성이 있으며, 가장 저해상도 영역에 있는 저주파 성분의 부영상(S8)이 가장 많은 에너지를 가지고 있고, 고해상도 영역으로 갈수록 고주파 성분의 부영상이 갖는 에너지가 작아진다.FIG. 1 illustrates a hierarchical structure of a wavelet transformed image in which an original image S1 is decomposed to three layers of resolution and each layer is composed of a plurality of sub-images. Once the original image is wavelet-converted, it has a sub-image (S2) that is 1/4 the size of the original image and has a low frequency component of the original image, and has high frequency components in the horizontal, vertical, and diagonal directions of the original image. It is divided into three sub-pictures W12, W22, and W32 to form layer 1. When the sub-image S2 which is a low frequency component is wavelet-converted again, the sub-image S4 having the low-frequency component of the sub-image S2 and the high-frequency components in the horizontal, vertical and diagonal directions of the sub-image S2 The sub-pictures W14, W24, and W34 having the subfields are subdivided to form layer 2. When the sub-image S4 is further wavelet transformed, the sub-image S8 having the low frequency component of the sub-image S4 and the high-frequency components in the horizontal, vertical and diagonal directions of the sub-image S4 are included. It is divided into three sub-pictures W18, W28, and W38 to form layer 3. Here, these sub-images are correlated with each other among sub-images having the same directionality of each layer, and the sub-image S8 of the low frequency component in the lowest resolution region has the most energy, and the high frequency component toward the high resolution region The energy of the sub-image becomes smaller.

도2에서는 다중 해상도 움직임 추정방법에 대하여 도시되어 있다. 다중 해상도 움직임 추정방법에서는, 기저대역 영상, 즉, 최상위 계층의 부영상(S8)에서 추정된 움직임 벡터(Vs8)를 나머지 고해상도 계층의 부영상들의 초기 움직임 벡터로서 이용하여 움직임을 추정한다. 원영상을 도1에서와 같이 M(도 1에서는 M=3임) 개의 계층으로 웨이브렛 변환한 후, M 해상도 계층의 각 부영상들을 소정의 화소 크기를 갖는 단위블록으로 분할하고, 최상위 계층에 속한 부영상(S8)의 각 블록에 대하여 블록 정합 알고리즘으로 움직임 추정을 실시한다. 이렇게 추정된 움직임 벡터(Vs8)는 같은 계층의 고주파 부영상으로 전이되고, 하위계층으로도 전이된다. 또한 고해상도 계층으로 갈수록, 즉, 하위 계층으로 갈수록 탐색블록의 크기도 각각 2배씩 증가되고, 각 부영상의 움직임 탐색 블록의 갯수는 해상도에 무관하게 같으며, 고해상도 계층의 움직임 벡터는 최상위 계층의 기저대역 영상(S8)의 움직임 벡터(Vs8)를 2배씩 스케일 한 것을 기본벡터로 사용하여, 그 벡터의 움직임 공간 근처에서 미소움직임 변위(△(x,y))를 추정한다.2 illustrates a multi-resolution motion estimation method. In the multi-resolution motion estimation method, the motion is estimated using the baseband image, that is, the motion vector V s8 estimated from the sub-image S8 of the highest layer, as an initial motion vector of the sub-images of the remaining high-resolution layers. After the original image is wavelet transformed into M (M = 3 in FIG. 1) layers as shown in FIG. 1, each sub-image of the M resolution layer is divided into a unit block having a predetermined pixel size, Motion estimation is performed on each block of the belonging sub-image S8 by a block matching algorithm. The estimated motion vector V s8 is transferred to a high frequency sub-image of the same layer and also to a lower layer. In addition, the size of the search block increases twice as the high resolution layer, that is, the lower layer, and the number of motion search blocks of each sub-picture is the same regardless of the resolution, and the motion vector of the high resolution layer is the baseband of the top layer. Using the scaled motion vector V s8 of the image S8 by 2 times as the base vector, the micro-movement displacement? (X, y) is estimated in the vicinity of the motion space of the vector.

이러한 다중 해상도 움직임 추정방법은 모든 부영상들에서 움직임 벡터를 구하고 이를 수신측에 전송해야 하므로 많은 계산량과 비트수를 필요로 하며, 초기 움직임 추정이 잘못될 경우에 하위 계층에서의 오류 누적 등의 문제를 내포하고 있다. 즉, 종래의 다중 해상도 움직임 추정방법에서는, 움직임 탐색의 계산량과 비트량을 감소시키기 위한 방안이 요청되고 있다.This multi-resolution motion estimation method requires a large amount of computation and a number of bits since a motion vector must be obtained from all sub-pictures and transmitted to the receiver, and a problem such as error accumulation in a lower layer when the initial motion estimation is wrong It implies That is, in the conventional multi-resolution motion estimation method, a method for reducing the amount of computation and the bit amount of the motion search has been requested.

한편, 계층적 움직임 추정 장치에서 움직임 추정된 상위 계층의 저주파 영상을 동일 계층의 웨이브렛 변환된 고주파 성분 영상과 합성하여 보상된 부영상을 만드는 절차를 반복함으로써 움직임 벡터를 정확하게 검출하기 위한 장치 및 방법이 "웨이브렛 변환된 부영상의 재합성을 통한 계층적 움직임 추정장치 및 방법"으로서 대한민국 특허공고 제10-252347호(2000년 1월 18일)(이하, "선행 특허 1"이라 함)에 공지되어 있다.Meanwhile, an apparatus and method for accurately detecting a motion vector by repeating a procedure of synthesizing a low-frequency image of a motion estimation higher layer with a wavelet transformed high-frequency component image of the same layer in a hierarchical motion estimation apparatus to produce a compensated sub-image This is a hierarchical motion estimation apparatus and method through the resynthesis of wavelet transformed sub-pictures. Korean Patent Publication No. 10-252347 (January 18, 2000) (hereinafter referred to as "prior patent 1") It is.

상기 선행 특허 1은 다수의 웨이브렛 변화부, 동일한 갯수의 계층적 역 웨이브렛 변환부 및 움직임 추정/보상부들을 포함하며, 상기 각각의 역 웨이브렛 변환부는 대응하는 웨이브렛 변환부로부터 제공되는 3개의 고주파 부영상과, 이 고주파 부영상과 동일 크기로 움직임 보상된 부영상을 합성하고, 합성된 영상을 역 웨이브렛 변환함으로써 복원된 영상을 생성하며, 각각의 움직임 추정/보상부는 대응하는 계층의 역 웨이브렛 변환부로부터 전달되는 복원된 영상의 움직임 벡터를 대응하는 계층의 과거 영상 웨이브렛 변환부의 저주파 부영상으로부터 추정하고, 움직임 보상하여 움직임 보상된 부영상을 생성한다.The preceding patent 1 includes a plurality of wavelet transform units, an equal number of hierarchical inverse wavelet transform units, and motion estimation / compensation units, each inverse wavelet transform unit being provided from a corresponding wavelet transform unit. High frequency sub-pictures and motion-compensated sub-pictures having the same size as the high-frequency sub-pictures, and reconstructed by inverse wavelet transforming the synthesized video, wherein each motion estimation / compensation unit The motion vector of the reconstructed image transmitted from the inverse wavelet transform unit is estimated from the low frequency sub-picture of the past image wavelet transform unit of the corresponding layer, and motion compensated to generate a motion compensated sub-image.

그러나, 상기 선행 특허 1은 움직임 벡터 추출의 정확성 향상에는 어느 정도 효과가 있으나, 움직임 탐색의 계산량을 감소시키는 것과는 관련이 없다.However, although the prior patent 1 has some effect on improving the accuracy of motion vector extraction, it is not related to reducing the calculation amount of motion search.

또한, 웨이브렛 변환 영역에서 움직임 탐색 블록의 크기를 가변함으로써 움직임 탐색 정보의 양과 계산량을 줄이기 위한 "2차원 영상의 웨이브렛 변환 영역에서 가변 블록 크기를 갖는 움직임 추정장치"가 대한민국 특허공고 제10-156958호(1998년 7월 27일)(이하, "선행 특허 2"라 함)에 공지되어 있다.In addition, a motion estimation apparatus having a variable block size in a wavelet transform region of a two-dimensional image to reduce the amount and calculation amount of motion search information by varying the size of the motion search block in the wavelet transform region is disclosed in Korean Patent Publication No. 10- 156958 (July 27, 1998) (hereinafter referred to as "prior patent 2").

상기 선행 특허 2는 움직임 탐색 계산량과 정보의 양을 감소시키기 위하여, 부영상을 큰 블록으로 나누고, 각 블록의 예측 오차값에 따라 블록을 반복적으로 쪼개어서 움직임 탐색 블록의 크기를 가변시키는 방식을 이용하고 있다.In order to reduce the amount of motion search calculation amount and information, the prior patent 2 uses a method of dividing a sub-picture into large blocks, and repeatedly dividing the blocks according to prediction error values of each block to vary the size of the motion search block. have.

그러나, 상기 선행 특허 2에 의한 방식은 부영상의 모든 영역에 대해 움직임 탐색을 수행하고, 단지, 블록의 크기만 변화시키므로, 모든 계층에서 동일한 움직임 탐색 블록을 가지게 된다. 따라서, 각 계층에 속한 부영상의 모든 영역에 대해 움직임 탐색을 수행함으로 인해, 움직임 탐색의 효율이 높지 않다고 하는 문제점이 있다.However, the method according to the prior patent 2 performs a motion search for all areas of the sub-picture, and only changes the size of the block, so that all layers have the same motion search block. Therefore, there is a problem that the efficiency of the motion search is not high because the motion search is performed for all regions of the sub-image belonging to each layer.

또한, 웨이브렛 변환과 웨이브렛 계수들의 성질을 이용하여 블록크기의 결정을 가변적으로 정함과 동시에, 제일 낮은 4개의 주파수 대역만을 이용하여 움직임 추정 보상을 함으로써 계산시간을 줄이고, 범용 동작 추정/보상 효과를 증가시키기 위한 "동영상 압축/복원 시스템에서의 효과적인 움직임 추정/보상 방법 및 시스템"이 대한민국 특허공보 제10-0223647호(1999년 7월 10일)(이하, "선행 특허 3"이라 함)에 공지되어 있다.In addition, the block size is determined variably using the wavelet transform and the properties of the wavelet coefficients, and the computation time is reduced by performing motion estimation compensation using only the lowest four frequency bands. "Effective Motion Estimation / Compensation Method and System in Video Compression / Restoration System" for Increasing the number of Korean Patent Publication No. 10-0223647 (July 10, 1999) (hereinafter referred to as "prior patent 3") Known.

상기 선행 특허 3은 부영상에 따라 움직임 탐색 블록의 크기를 직사각형, 또는 크게 변화시켜서 움직임을 탐색하는 방법이다. 따라서, 위 선행 특허 2와 마찬가지로, 부영상의 모든 영역에 대해 움직임 탐색을 수행하고, 단지 블록의 크기만을 변화시킨다. 따라서, 상기 선행 특허 3에서도, 각 계층에 속한 부영상의 모든 영역에 대해 움직임 탐색을 수행함으로 인하여, 움직임 탐색의 효율이 높지 않다고 하는 문제점이 있다. 또한, 상기 선행 특허 3에서는, 상위 계층의 부영상들에 대해 사용된 움직임 벡터를 하위 계층에서 그대로 전이시켜 사용함으로써, 하위 계층에서 오류의 누적이 발생할 수도 있는 문제점이 있다.The prior patent 3 is a method of searching for a motion by changing the size of a motion search block to a rectangle or a large size according to a sub-picture. Therefore, similar to the above Patent 2, the motion search is performed for all regions of the sub-picture, and only the size of the block is changed. Accordingly, even in the above-described Patent 3, there is a problem that the efficiency of the motion search is not high because the motion search is performed for all regions of the sub-image belonging to each layer. In addition, in the prior patent 3, by using the motion vector used for the sub-pictures of the upper layer as it is in the lower layer, there is a problem that may accumulate errors in the lower layer.

본 발명은 상기와 같은 문제점들을 해결하기 위한 것으로서, 웨이브렛 변환된 현재의 입력 영상과 직전 프레임의 기준 영상을 이용하여 움직임 탐색 여부를 결정하는 이진 평면이 구성되고, 상기 이진 평면은 상위 계층의 영상에서 움직임이 있는 영역에 대해서만 그 하위 계층의 영상에서 움직임을 탐색하도록 함으로써, 입력 영상의 계층에 따라 움직임 탐색 영역이 적응적으로 분포하게 하여 계산량과 비트수를 감소시키고, 움직임 탐색오류가 누적되는 문제를 해결할 수 있는 움직임 추정 장치를 제공하는 것을 목적으로 한다.The present invention is to solve the above problems, a binary plane for determining whether to search for motion using a wavelet transformed current input image and the reference image of the previous frame is configured, the binary plane is a higher layer image By searching for motion in the lower layer image only in the region of motion in, the motion search area is adaptively distributed according to the input image layer to reduce the amount of computation and the number of bits, and the motion search error is accumulated. An object of the present invention is to provide a motion estimation apparatus capable of solving the problem.

도 1은 웨이브렛 변환된 영상의 계층적 피라미드를 나타낸 도면.1 illustrates a hierarchical pyramid of a wavelet transformed image.

도 2는 일반적인 다중 해상도 움직임 추정 방법을 예시한 도면.2 is a diagram illustrating a general multi-resolution motion estimation method.

도 3은 본 발명에 따른 움직임 추정 장치의 블록 구성도.3 is a block diagram of a motion estimation apparatus according to the present invention;

도 4는 본 발명에 따른 이진 평면 구성방법의 순서도.Figure 4 is a flow chart of the binary plane configuration method according to the present invention.

도 5는 본 발명에 따른 이진 평면에서의 계층간 전이를 설명하는 도면.5 illustrates an interlayer transition in a binary plane according to the present invention.

* 도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

100 : 웨이브렛 변환부 200 : 이진 평면 구성부100: wavelet transform unit 200: binary plane configuration unit

300 : 움직임 탐색부 400 : 예측영상 합성부300: motion search unit 400: predictive image synthesis unit

500 : 프레임 저장부 600 : 기준영상 합성부500: frame storage unit 600: reference image synthesis unit

700 : 감산기700 subtractor

상기한 목적을 달성하기 위한 본 발명의 움직임 추정 장치는, 현재 프레임의 입력 영상을 다중 해상도의 계층적 구조를 갖는 부영상으로 변환시키는 웨이브렛 변환부; 직전 프레임의 영상을 기준 영상으로서 저장하고 있는 프레임 저장부; 상기 웨이브렛 변환된 현재 프레임의 기저 대역 영상과 직전 프레임의 대응하는 영상의 동일 위치 블록 간의 절대 평균차를 구하여 소정의 임계값과 비교한 후, 그 결과에 따라 잠재 움직임 영역인지를 설정함으로써 이진 평면을 구성하는 이진 평면 구성부; 상기 웨이브렛 변환된 현재 프레임의 영상, 상기 직전 프레임의 영상 및 상기 이진 평면을 입력받아, 상기 이진 평면에 의해 상기 현재 프레임 영상의 각 계층별 움직임을 탐색하여 움직임 벡터를 구하는 움직임 탐색부; 상기 움직임 벡터와 상기 이진 평면을 이용하여 예측 영상을 구하는 예측 영상 합성부; 및, 상기 웨이브렛 변환된 현재 프레임의 영상과 상기 예측 영상 사이의 차영상과, 상기 예측 영상을 이용하여 기준 영상을 합성하며, 상기 합성된 기준 영상을 직전 프레임의 기준 영상으로서 제공하는 기준 영상 합성부를 포함하는 것을 특징으로 한다.According to an aspect of the present invention, there is provided a motion estimation apparatus, including: a wavelet converter configured to convert an input image of a current frame into a sub-image having a hierarchical structure having a multi-resolution; A frame storage unit which stores an image of a previous frame as a reference image; The absolute average difference between the baseband image of the wavelet transformed current frame and the co-located block of the corresponding image of the previous frame is obtained, compared with a predetermined threshold value, and the binary plane is determined by setting a potential motion region according to the result. A binary planar configuration constituting part; A motion search unit which receives an image of the wavelet transformed current frame, an image of the previous frame, and the binary plane, and searches for motion of each layer of the current frame image by the binary plane to obtain a motion vector; A prediction image synthesizer configured to obtain a prediction image using the motion vector and the binary plane; And synthesizing a reference image using the difference image between the wavelet-converted current frame image and the predicted image and the predicted image, and providing the synthesized reference image as a reference image of a previous frame. It is characterized by including a wealth.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 설명한다.Hereinafter, exemplary embodiments of the present invention will be described with reference to the accompanying drawings.

먼저, 도 3에는 본 발명의 실시예에 따른 움직임 추정 장치가 도시되어 있다. 상기 도 3에 도시되어 있듯이, 본 발명의 움직임 추정 장치는 입력 영상을 받아들이는 웨이브렛 변환부(100); 직전 프레임의 영상을 기준 영상으로서 저장하고있는 프레임 저장부(500); 상기 웨이브렛 변환부(100)와 프레임 저장부(500)의 출력을 받아들여 이진 평면을 출력시키는 이진 평면 구성부(200); 상기 웨이브렛 변환부(100), 이진 평면 구성부(200) 및 프레임 저장부(500)의 출력을 받아들여 움직임 벡터를 출력시키는 움직임 탐색부(300); 상기 이진 평면 구성부(200), 움직임 탐색부(300) 및 프레임 저장부(500)의 출력을 받아들여 예측 영상을 출력시키는 예측 영상 합성부(400); 상기 웨이브렛 변환부(100)와 예측 영상 합성부(400)의 출력을 받아들여 둘 사이의 차영상을 출력시키는 감산기(700); 상기 예측 영상 합성부(400) 및 감산기(700)의 출력을 받아들여 기준 영상을 합성하고, 이를 상기 프레임 저장부(500)에 출력시키는 기준 영상 합성부(600)로 이루어진다.First, FIG. 3 illustrates a motion estimation apparatus according to an embodiment of the present invention. As shown in FIG. 3, the motion estimation apparatus of the present invention includes a wavelet converter 100 that receives an input image; A frame storage unit 500 which stores an image of a previous frame as a reference image; A binary plane configuration unit 200 which receives an output of the wavelet converter 100 and the frame storage unit 500 and outputs a binary plane; A motion search unit 300 which receives the output of the wavelet transform unit 100, the binary plane configuration unit 200, and the frame storage unit 500 and outputs a motion vector; A predictive image synthesizer 400 which receives the outputs of the binary plane configuration unit 200, the motion search unit 300, and the frame storage unit 500 and outputs a predicted image; A subtractor 700 which receives the output of the wavelet converter 100 and the predictive image synthesizer 400 and outputs a difference image between the wavelet converter 100 and the predicted image synthesizer 400; The reference image synthesizer 600 receives the outputs of the prediction image synthesizer 400 and the subtractor 700, synthesizes a reference image, and outputs the reference image to the frame storage 500.

동작이 시작되면, 움직임 추정의 대상인 현재의 프레임(frame)을 구성하는 영상 신호가 입력 영상으로서 상기 웨이브렛 변환부(100)에 입력된다. 웨이브렛 변환은 도 1을 참조하여 이미 설명된 바 있으며, 상기 웨이브렛 변환부(100)는 입력 영상을 도 1에 도시된 바와 같은 다중 해상도의 계층적 구조를 갖는 부영상들로 변환시킨다. 이러한 부영상들은 저주파 성분을 갖는 부영상에서 큰 에너지를 가지며, 고주파 성분을 갖는 부영상으로 갈수록 에너지가 작아지는 특성이 있다. 각 계층의 고주파 성분을 갖는 부영상들은 수평, 수직 및 대각선 성분을 갖는 부영상들로 이루어지는데, 이들 부영상들은 다른 계층의 동일 방향성을 가지는 부영상들과 각각 서로 깊은 관련성을 가지고 있다. 또한, 현재 프레임의 저주파 성분을 갖는 부영상과 직전 프레임의 저주파 성분을 갖는 부영상에서 동일 위치 블록 사이의 절대 평균차(MAD : mean absolute difference)가 소정의 임계값(threshold value)보다 작으면 전체 영상에서 중요한 의미를 갖지 않으며, 분해된 계층적 구조의 다른 부영상에서도 동일 방향, 동일 위치에 해당하는 절대 평균차가 중요한 의미를 갖지 않는다. 즉, 동영상 부호화에서는 연속되는 두개의 프레임 사이에서 많은 영역이 서로 일치하므로, 본 발명에서는 움직임이 있는지를 결정하기 위한 이진 평면을 구성하고, 움직임이 있는 영역에 대해서만 움직임을 탐색하도록 함으로써 계산량의 감소에 기여한다.When the operation is started, a video signal constituting a current frame, which is a target of motion estimation, is input to the wavelet converter 100 as an input video. The wavelet transform has been described above with reference to FIG. 1, and the wavelet transform unit 100 converts the input image into sub-images having a hierarchical structure having a multi-resolution as shown in FIG. 1. These sub-images have a large energy in the sub-image having a low frequency component, and the energy decreases toward the sub-image having a high frequency component. Sub-images having high frequency components of each layer are composed of sub-images having horizontal, vertical, and diagonal components, and these sub-images have deep correlations with sub-images having the same directionality of different layers. In addition, if the mean absolute difference (MAD) between the same position block is smaller than a predetermined threshold value in the sub-image having the low frequency component of the current frame and the low-frequency component of the previous frame, the entire image. In the other sub-images of the decomposed hierarchical structure, the absolute mean difference corresponding to the same direction and the same position does not have a significant meaning. That is, in video encoding, many regions coincide with each other between two consecutive frames, and according to the present invention, a binary plane for determining whether there is motion is formed, and the motion is searched for only the region where there is motion. Contribute.

이와 같이 웨이브렛 변환된 영상들은 이진 평면 구성부(200)와 움직임 탐색부(300)에 각각 입력된다. 한편, 프레임 저장부(500)에는 직전 프레임의 영상이 기준 영상으로서 저장되어 있다. 상기 이진 평면 구성부(200)는 상기 웨이브렛 변환된 현재 프레임의 영상과 상기 프레임 저장부(500)에 저장된 직전 프레임의 기준 영상을 이용하여 움직임 탐색 여부를 결정하기 위한 이진 평면을 구성한다.The wavelet-converted images are input to the binary planar component 200 and the motion searcher 300, respectively. Meanwhile, the frame storage unit 500 stores the image of the previous frame as a reference image. The binary plane configuration unit 200 configures a binary plane for determining whether to search for motion using the wavelet transformed image of the current frame and the reference image of the previous frame stored in the frame storage unit 500.

상기 이진 평면 구성부(200)에서는 먼저 기저대역의 이진 평면을 구성한다. 기저 대역의 이진 평면이란 최상위 계층의 저주파 성분을 갖는 부영상에 대한 이진 평면으로서, 본 발명에서는 M8(x,y)로 표현된다. 상기 이진 평면은 평면 좌표 x, y로 표현되는 임의의 위치 또는 블록에서의 잠재적 움직임 여부에 따라 "1" 또는 "0"으로 설정되어 있다. 보다 구체적으로, 현재 프레임의 최상위 계층 저주파 성분을 갖는 부영상(S8)과 직전 프레임의 이에 대응하는 부영상의 동일 위치 블록 간의 절대 평균차를 구하고, 이 절대 평균차가 문턱값보다 클 때에는 해당 위치를 잠재적 움직임 영역으로 판단함으로써, 상기 기저 대역의 이진 평면이 구성된다. 상기 기저 대역의 부영상을 제외한 나머지 계층의 부영상에 대한 이진 평면은, 상기 기저 대역에서의 이진 평면(M8)을 전이하여 이를 기본으로 한 후, 상기 이진 평면(M8)에서 잠재적 움직임 영역으로 판단된 블록에 대해서만 현재 프레임과 기준 프레임의 해당 부영상(Wij(x,y))에서의 절대 평균차를 소정의 임계값과 비교하고, 이 비교 결과에 따라 움직임 탐색 여부를 결정하도록 구성된다. 즉, 기저 대역의 부영상(S8)을 제외한 다른 부영상 및 나머지 계층의 부영상의 이진 평면은 기저 대역 부영상의 이진 평면에서 잠재적 움직임 영역인 것으로 판단된 블록에 대해서만 잠재적 움직임 영역인지 판단된다. 나중에 설명될 움직임 탐색은 이와 같이 구성된 이진 평면을 기초로 이루어지므로, 본 발명에 의해 움직임 탐색을 위한 계산량이 많이 감소하게 됨을 알 수 있다.The binary plane configuration unit 200 first configures a baseband binary plane. The baseband binary plane is a binary plane for a sub-image having a low frequency component of the uppermost layer, and is represented by M8 (x, y) in the present invention. The binary plane is set to " 1 " or " 0 " depending on potential movement in any position or block represented by plane coordinates x, y. More specifically, the absolute average difference between the same position block of the sub-image S8 having the highest hierarchical low frequency component of the current frame and the corresponding sub-picture of the previous frame is calculated, and if the absolute average difference is larger than the threshold, the corresponding position is potential. By judging by the motion region, the baseband binary plane is constructed. The binary plane for the sub-images of the other layers except for the baseband sub-picture is based on the transition of the binary plane M8 in the baseband, and is determined as a potential motion region in the binary plane M8. With respect to the blocks only, the absolute average difference between the current frame and the corresponding sub-picture Wij (x, y) of the reference frame is compared with a predetermined threshold value, and it is configured to determine whether to search for motion based on the comparison result. That is, it is determined whether the binary planes of other sub-images except the baseband sub-image S8 and the sub-layers of the remaining layers are potential motion regions only for blocks determined to be potential motion regions in the binary plane of the base-band sub-image. Since the motion search, which will be described later, is based on the binary plane configured as described above, it can be seen that the calculation amount for the motion search is greatly reduced by the present invention.

다음으로, 상기 움직임 탐색부(300)에서는 상기 웨이브렛 변환부(100)에서 출력되는 현재 프레임의 영상과 상기 프레임 저장부(500)에 기준 영상으로서 저장된 직전 프레임의 영상 및 상기 이진 평면 구성부(200)에서 구성된 이진 평면이 입력되어, 상기 이진 평면에 의해 현재 프레임 영상의 각 계층별 움직임을 탐색하여 움직임 벡터가 구해진다. 이때, 상기 움직임 탐색부(300)에서는 기저대역의 잠재적 움직임 영역에 대해 움직임 벡터가 구해지며, 다른 계층의 움직임 벡터는 해당 이진 평면의 잠재적 움직임 영역에 대해서만 움직임 벡터가 구해진다. 즉, 임의의 하위 계층에서는 해당 이진 평면의 잠재적 움직임 영역에 대해서만 기저대역의 움직임 벡터를 2배 스케일(scale) 한 후, 이를 기본 벡터로 사용하여 그 벡터의 움직임 공간 근처에서 미소 움직임 변위를 추정함으로써 움직임 벡터를 구한다.Next, the motion search unit 300 includes an image of the current frame output from the wavelet converter 100, an image of a previous frame stored as a reference image in the frame storage unit 500, and the binary plane component ( A binary plane configured at 200 is input, and a motion vector is obtained by searching for the motion of each layer of the current frame image by the binary plane. In this case, the motion search unit 300 obtains a motion vector for a potential motion region of the baseband, and a motion vector for a motion vector of another layer only for a potential motion region of the corresponding binary plane. That is, in any lower layer, the baseband motion vector is scaled only twice for the potential motion region of the corresponding binary plane, and then used as the base vector to estimate the micro motion displacement near the motion space of the vector. Find the motion vector.

예측 영상 합성부(400)에서는 상기 움직임 벡터와 이진 평면을 이용하여 예측 영상이 구해지며, 상기 예측 영상은 감산기(700)에 입력되어 상기 감산기(700)에 의해 현재 프레임의 웨이브렛 변환된 영상과의 차영상이 구해진다. 상기 기준 영상 합성부(600)에서는 상기 차영상과 예측 영상을 이용하여 기준 영상이 합성되며, 이 기준 영상은 합성된 기준 영상으로서 프레임 저장부(500)에 저장되며, 다음 프레임의 영상이 입력될 때, 바로 직전 프레임의 기준 영상으로서 제공된다.The prediction image synthesizer 400 obtains a prediction image by using the motion vector and the binary plane, and the prediction image is input to the subtractor 700 and wavelet-converted image of the current frame by the subtractor 700; Difference image is obtained. The reference image synthesizer 600 synthesizes a reference image by using the difference image and the prediction image. The reference image is stored in the frame storage unit 500 as a synthesized reference image, and an image of a next frame is input. Is provided as a reference image of the immediately preceding frame.

다음으로, 도 4 및 도 5를 참조하여 이진 평면의 구성 방법에 대해 보다 상세하게 설명한다.Next, the configuration method of the binary plane will be described in more detail with reference to FIGS. 4 and 5.

도 4를 참조하면, 이진 평면의 구성 방법은 크게 기저대역의 이진 평면을 구성하는 과정(10), 상기 기저 대역에서 구한 이진 평면을 동일 계층의 고주파 영역을 갖는 부영상 및 다른 계층의 부영상을 위한 이진 평면(Mij(x,y))으로 전이하는 과정(20), 상기 각 부영상에 대한 이진 평면을 재구성하는 과정(30) 및 모든 부영상에 대해 이진 평면을 구성하였는지를 판단하는 과정(40)으로 이루어진다.Referring to FIG. 4, in the method of configuring a binary plane, a process of constructing a baseband binary plane is largely performed (10), and a subpicture having a high frequency region of the same layer as a binary plane obtained from the baseband and a subpicture of another layer. A process of transitioning to a binary plane (Mij (x, y)) (20), a process of reconstructing a binary plane for each sub-image (30), and a process of determining whether a binary plane is configured for all sub-images (40) )

동작이 시작되면, 사용되는 변수(i, j)가 초기화되고, 현재 프레임의 기저대역 영상과 직전 프레임의 기준 영상의 동일 위치 블록 간의 절대 평균차(MAD S8(x,y))가 계산된다(11). 다음으로, 상기 구해진 절대 평균차(MAD S8(x,y))가 소정의 임계값(TH1)보다 큰지 판단된다(12). 상기 단계(12)에서 해당 절대 평균차(MAD S8(x,y))가 소정의 임계값(TH1)보다 크면, 잠재 움직임 영역인 것으로 판단하여 그 위치의 블록에 대한 이진 평면(M8(x,y))은 "1"로 설정된다(13). 상기 단계(12)에서 해당 절대 평균차(MAD S8(x,y))가 소정의 임계값(TH1)보다 작으면, 잠재 움직임 영역이 아닌 것으로 판단하여 그 위치의 블록에 대한 이진평면(M8(x,y))은 "0"으로 설정된다(14). 상기 기저대역 영상의 모든 블록에 대해 위 과정(10)이 수행되어 기저대역 영상에 대한 이진 평면(M8(x,y))이 구성된다.When the operation starts, the variables (i, j) used are initialized, and the absolute mean difference (MAD S8 (x, y)) between the baseband image of the current frame and the same position block of the reference image of the previous frame is calculated ( 11). Next, it is determined whether the obtained absolute average difference MAD S8 (x, y) is larger than a predetermined threshold value TH1 (12). In step 12, if the absolute mean difference MAD S8 (x, y) is greater than the predetermined threshold value TH1, it is determined that it is a potential motion area and the binary plane M8 (x, y)) is set to "1" (13). If the absolute mean difference MAD S8 (x, y) in step 12 is less than the predetermined threshold value TH1, it is determined that the potential average area is not the potential motion area, and the binary plane M8 (for the block at that position) is determined. x, y)) is set to " 0 " (14). The above process 10 is performed for all blocks of the baseband image to form a binary plane M8 (x, y) for the baseband image.

다음으로, 상기와 같이 구해진 기저 대역 영상에 대한 이진 평면(M8(x,y))은 최상위 계층의 고주파 영역을 갖는 부영상 및 다른 하위 계층의 부영상에 대한 이진 평면(Mij(x,y))으로 전이된다(20). 여기서, i는 해상도 계층을 나타내고, j는 수평, 수직 및 대각선 방향을 나타낸다. 도 5에는 이러한 기저 대역 영상에 대한 이진 평면(M8(x,y))이 수평, 수직 및 대각선 방향으로 전이되는 과정이 도시되어 있다.Next, the binary plane M8 (x, y) for the baseband image obtained as described above is the binary plane Mij (x, y) for the sub-image having the high frequency region of the highest layer and the sub-image of the other lower layer. (20). Where i represents the resolution hierarchy and j represents the horizontal, vertical and diagonal directions. FIG. 5 illustrates a process in which the binary plane M8 (x, y) for the baseband image is transferred in horizontal, vertical and diagonal directions.

다음으로, 변수(i, j)에 의해 지시되는 계층의 이진 평면(Mij(x,y))에 잠재 움직임 영역이 있는지 판단된다(31). 즉, 해당 이진 평면(Mij(x,y))이 "1"로 설정되어 있으면, 그 이진 평면(Mij(x,y))에는 잠재 움직임 영역이 존재하는 것이다. 상기 단계(31)에서 해당 이진 평면(Mij(x,y))이 "1"로 설정되어 있으면, 그 해당 이진 평면(Mij(x,y))을 재구성하기 위하여, 그 이진 평면(Mij(x,y))이 속하는 계층의 부영상(wij(x,y))에 대한 절대 평균차(MAD Wij(x,y))가 계산된다(32). 만약, 상기 단계(32)에서 해당 이진 평면(Mij(x,y))이 "0"으로 설정되어 있으면, 이진 평면의 재구성없이 그대로 사용해도 되므로, 단계(41)로 점프한다. 다음으로, 상기 구해진 절대 평균차(MAD Wij(x,y))가 소정의 임계값(TH2)보다 작은지 판단된다(33), 상기 단계(33)에서 상기 절대 평균차(MAD Wij(x,y))가 임계값(TH2)보다 작으면, 해당 이진 평면(Mij(x,y))은 잠재 움직임 영역이 아닌 것으로 판단하여 "0"으로 설정되며(34), 상기 단계(33)에서 상기 절대 평균차(MAD Wij(x,y))가 임계값(TH2)보다크면, 해당 이진 평면(Mij(x,y))이 잠재 움직임 영역으로 설정된 것이 올바르므로, 단계(41)로 점프한다. 즉, 상기 과정(30)에서는, 기저 대역을 제외한 나머지 부영상에 대한 이진 평면(Mij(x,y))을 재구성하는 것으로서, 이진 평면(Mij(x,y))이 "1"로 설정된 경우, 즉, 해당 이진 평면(Mij(x,y))의 임의의 블록에 잠재 움직임 영역이 있는 경우에 대해서만, 절대 평균차를 계산하고 이를 임계값과 비교하여 그 해당 블록의 이진 평면을 재구성한다. 이것은 동영상 압축의 시간 상관성, 즉, 연속하는 프레임 간에는, 웨이브렛 변환된 각 계층의 부영상 중에서 동일 방향성을 가지는 부영상들이 서로 깊은 관련성, 소위 중복성을 가지고 있다는 성질을 이용한 것이다.Next, it is determined whether there is a latent motion region in the binary plane (Mij (x, y)) of the hierarchy indicated by the variables (i, j) (31). That is, if the corresponding binary plane Mij (x, y) is set to "1", the potential motion region exists in the binary plane Mij (x, y). If the corresponding binary plane Mij (x, y) is set to "1" in step 31, the binary plane Mij (x) is used to reconstruct the corresponding binary plane Mij (x, y). and y)), the absolute mean difference (MAD Wij (x, y)) with respect to the sub-image wij (x, y) of the layer to which it belongs is calculated (32). If the corresponding binary plane (Mij (x, y)) is set to " 0 " in step 32, it can be used as it is without reconstruction of the binary plane, and jumps to step 41. Next, it is determined whether the obtained absolute mean difference MAD Wij (x, y) is smaller than a predetermined threshold value TH2 (33). In step 33, the absolute mean difference MAD Wij (x, If y)) is smaller than the threshold value TH2, the corresponding binary plane Mij (x, y) is determined to be not a potential motion area and is set to " 0 " (34). If the absolute average difference MAD Wij (x, y) is larger than the threshold TH2, it is correct that the corresponding binary plane Mij (x, y) is set to the latent motion region, and jumps to step 41. That is, in step 30, the binary plane Mij (x, y) for the remaining sub-images other than the baseband is reconstructed, and the binary plane Mij (x, y) is set to “1”. That is, only the case where there is a latent motion region in any block of the corresponding binary plane (Mij (x, y)), the absolute mean difference is calculated and compared with the threshold to reconstruct the binary plane of the corresponding block. This is based on the temporal correlation of video compression, that is, between successive frames, that sub-pictures having the same directionality among the sub-pictures of each layer of the wavelet transform have a deep correlation and so-called redundancy.

다음으로, 모든 부영상에 대해 이진 평면의 재구성 과정이 이루어졌는지 판단되고(41), 그렇지 않을 경우에는 변수(i,j)를 순차 증가시킨 후, 단계(20) 직전으로 점프하여 위 과정(20, 30)을 반복시키며, 상기 단계(41)에서 모든 부영상에 대해 이진 평면의 재구성 과정이 이루어졌으면, 이진 평면 구성 동작이 종료된다.Next, it is determined whether the reconstruction process of the binary plane has been performed for all the sub-images (41). Otherwise, the variables (i, j) are sequentially increased, and then jumps to just before step 20, the above process (20). , 30), and if the reconstruction of the binary plane has been performed for all the sub-images in step 41, the binary plane construction operation is terminated.

상기한 이진 평면 구성 방법은 컴퓨터 프로그램 등으로 구현되어 CD-ROM과 같은 기록매체에 저장한 형태로 판매 또는 사용될 수 있으리라는 점은 당업자가에게 자명한 사항이다.It will be apparent to those skilled in the art that the binary planar construction method described above may be embodied as a computer program or the like and sold or used in a form stored in a recording medium such as a CD-ROM.

이상 설명된 바와 같이, 본 발명에 따르면, 웨이브렛 변환을 이용한 다중 해상도 움직임 추정방법에서 움직임 탐색여부를 결정하는 이진 평면을 구성함에 있어서, 연속하는 프레임 간에는 웨이브렛 변환된 각 계층의 부영상 중에서 동일 방향성을 가지는 부영상들이 서로 중복성을 가지고 있다는 성질을 이용하여, 기저 대역 영상을 위한 이진 평면을 구성한 후, 그 하위 계층 부영상의 이진 평면은 상기 기저 대역 영상의 이진 평면에서 잠재 움직임 영역에 대해서만 재구성하도록 하고, 이러한 이진 평면을 이용하여 움직임 탐색을 행함으로써, 움직임 탐색 계산량을 효과적으로 감소시킬 수 있다. 또한, 기존의 방법을 사용할 때 발생하는 많은 계산량과 비트수 그리고 움직임 탐색오류의 누적과 같은 문제점을 개선시킬 수 있고, 이를 통해 화질의 저하 없이 수행시간이 빨라진다는 효과를 얻을 수 있다.As described above, according to the present invention, in constructing a binary plane for determining whether to search for motion in a multi-resolution motion estimation method using wavelet transform, the consecutive frames are the same among the sub-images of each layer of the wavelet transform. Using the property that the directional sub-images have redundancy with each other, after constructing a binary plane for the baseband image, the binary plane of the lower layer sub-image is reconstructed only for the potential motion region in the binary plane of the baseband image. Then, the motion search calculation amount can be effectively reduced by performing the motion search using this binary plane. In addition, problems such as a large amount of computation, a number of bits, and a cumulative motion search error that occur when using the conventional method can be improved, and thus the execution time can be improved without deterioration of image quality.

Claims (8)

현재 프레임의 입력 영상을 다중 해상도의 계층적 구조를 갖는 부영상으로 변환시키는 웨이브렛 변환부;A wavelet converting unit converting the input image of the current frame into a sub-image having a hierarchical structure of multiple resolutions; 직전 프레임의 영상을 기준 영상으로서 저장하고 있는 프레임 저장부;A frame storage unit which stores an image of a previous frame as a reference image; 상기 웨이브렛 변환된 현재 프레임의 기저 대역 영상과 직전 프레임의 대응하는 영상의 동일 위치 블록 간의 절대 평균차를 구하여 소정의 임계값과 비교한 후, 그 결과에 따라 잠재 움직임 영역인지를 설정함으로써 이진 평면을 구성하는 이진 평면 구성부;The absolute average difference between the baseband image of the wavelet transformed current frame and the co-located block of the corresponding image of the previous frame is obtained, compared with a predetermined threshold value, and the binary plane is determined by setting a potential motion region according to the result. A binary planar configuration constituting part; 상기 웨이브렛 변환된 현재 프레임의 영상, 상기 직전 프레임의 영상 및 상기 이진 평면을 입력받아, 상기 이진 평면에 의해 상기 현재 프레임 영상의 각 계층별 움직임을 탐색하여 움직임 벡터를 구하는 움직임 탐색부;A motion search unit which receives an image of the wavelet transformed current frame, an image of the previous frame, and the binary plane, and searches for motion of each layer of the current frame image by the binary plane to obtain a motion vector; 상기 움직임 벡터와 상기 이진 평면을 이용하여 예측 영상을 구하는 예측 영상 합성부;A prediction image synthesizer configured to obtain a prediction image using the motion vector and the binary plane; 상기 웨이브렛 변환된 현재 프레임의 영상과 상기 예측 영상 사이의 차영상을 구하는 감산기; 및A subtractor for obtaining a difference image between the image of the wavelet transformed current frame and the prediction image; And 상기 차영상과 상기 예측 영상을 이용하여 기준 영상을 합성하며, 상기 합성된 기준 영상을 직전 프레임의 기준 영상으로서 제공하는 기준 영상 합성부를 포함하는 것을 특징으로 하는 움직임 추정 장치.And a reference image synthesizer configured to synthesize a reference image by using the difference image and the predicted image, and to provide the synthesized reference image as a reference image of a previous frame. 제1항에 있어서,The method of claim 1, 상기 웨이브렛 변환된 현재 프레임의 영상은 최상위 계층의 저주파 성분을 갖는 기저 대역 영상, 최상위 계층의 고주파 성분을 갖는 부영상 및 나머지 하위 계층의 저주파 성분과 고주파 성분을 각각 갖는 부영상들로 이루어지는 것을 특징으로 하는 움직임 추정 장치.The wavelet transformed image of the current frame includes a baseband image having a low frequency component of a top layer, a subpicture having a high frequency component of a top layer, and a subpicture having a low frequency component and a high frequency component of a remaining lower layer, respectively. Motion estimation apparatus. 제1항 또는 제2항에 있어서,The method according to claim 1 or 2, 상기 이진 평면 구성부는The binary planar component 상기 웨이브렛 변환된 현재 프레임의 기저 대역 영상에 대한 이진 평면을 구성하고, 나머지 부영상에 대한 이진 평면은 상기 기저 대역 영상에 대한 이진 평면을 전이한 후, 그 전이된 이진 평면에 잠재 움직임 영역이 있는 경우에 대해서만 재구성되도록 하는 것을 특징으로 하는 움직임 추정 장치.A binary plane for the baseband image of the wavelet transformed current frame is configured, and a binary plane for the remaining sub-images transitions the binary plane for the baseband image, and then a potential motion region is defined in the transitioned binary plane. Motion reconstruction apparatus characterized in that the reconstruction only for the case. 삭제delete 웨이브렛 변환된 현재 프레임의 기저 대역 영상과 직전 프레임의 대응하는 영상의 동일 위치 블록 간의 절대 평균차를 구하여 소정의 임계값과 비교한 후, 그 결과에 따라 잠재 움직임 영역인지를 설정함으로써 이진 평면을 구성하는 제1과정;The absolute average difference between the baseband image of the wavelet transformed current frame and the co-located block of the corresponding image of the previous frame is obtained, compared with a predetermined threshold value, and then the binary plane is set by setting whether or not it is a potential motion region. A first process of constructing; 상기 기저 대역에서 얻어진 이진 평면을 동일 계층의 고주파 영역을 갖는 부영상 및 다른 계층의 부영상을 위한 이진 평면으로 전이하는 제2과정,A second process of transitioning a binary plane obtained in the baseband to a binary plane for a sub-image having a high frequency region of the same layer and a sub-image for another layer, 상기 각 부영상에 대한 이진 평면에서 잠재 움직임 영역이 있는 경우에 대해서만 이진 평면을 재구성하는 제3과정; 및Reconstructing a binary plane only for the case where there is a latent motion region in the binary plane for each sub-image; And 모든 부영상에 대해 이진 평면을 구성하였는지 판단하고, 모든 부영상에 대한 이진 평면이 구성되지 않았을 경우에는 위 제2과정 및 제3과정이 반복되도록 하는 제4과정을 포함하는 것을 특징으로 하는 움직임 탐색을 위한 이진 평면 구성 방법.Determining whether the binary plane is configured for all the sub-images, and if the binary plane for all the sub-images is not configured, a motion search comprising a fourth process for repeating the second and third processes above Binary Plane Configuration Method 제5항에 있어서,The method of claim 5, 상기한 제1과정은The first process described above 웨이브렛 변환된 현재 프레임의 기저 대역 영상과 직전 프레임의 대응하는 영상의 동일 위치 블록 간의 절대 평균차를 계산하는 제1단계;Calculating an absolute mean difference between the baseband image of the wavelet transformed current frame and the co-located block of the corresponding image of the previous frame; 상기 구해진 절대 평균차를 소정의 임계값과 비교하는 제2단계;A second step of comparing the obtained absolute average difference with a predetermined threshold value; 상기 비교 결과에 따라, 상기 절대 평균차가 소정의 임계값보다 큰 경우에는 잠재 움직임 영역으로 설정하고, 상기 절대 평균차가 소정의 임계값보다 작을 경우에는 잠재 움직임 영역이 아닌 것으로 설정하는 제3단계로 이루어지는 것을 특징으로 하는 움직임 탐색을 위한 이진 평면 구성 방법.According to the comparison result, if the absolute average difference is greater than a predetermined threshold value, and set as a potential motion area, if the absolute average difference is less than a predetermined threshold value is set to a third step of setting the non-potential motion area Binary plane configuration method for the movement search, characterized in that. 제5항에 있어서,The method of claim 5, 상기한 제3과정은The third process described above 상기 제2과정에서 전이된 각 이진 평면에 잠재 움직임 영역이 있는지를 판단하는 제4단계;A fourth step of determining whether there is a latent motion region in each binary plane transitioned in the second process; 상기 제4단계에서 잠재 움직임 영역이 있으면, 그 부영상의 현재 프레임과 직전 프레임 간의 절대 평균차를 계산하는 제5단계;A fifth step of calculating an absolute mean difference between the current frame and the immediately preceding frame of the sub-picture, if there is a latent motion region in the fourth step; 상기 제5단계에서 구해진 절대 평균차가 소정의 임계값보다 큰지를 판단하는 제6단계;A sixth step of determining whether the absolute average difference obtained in the fifth step is greater than a predetermined threshold value; 상기 제6단계에서 절대 평균차가 소정의 임계값보다 작으면, 해당하는 이진 평면에 잠재 움직임 영역이 존재하지 않는 것으로 설정하고, 상기 절대 평균차가 소정의 임계값보다 크면, 해당하는 이진 평면의 설정값을 그대로 사용하도록 하는 제7단계로 이루어지는 것을 특징으로 하는 움직임 탐색을 위한 이진 평면 구성 방법.In the sixth step, if the absolute mean difference is smaller than a predetermined threshold, the potential moving area is set not to exist in the corresponding binary plane. If the absolute mean difference is larger than the predetermined threshold, the set value of the corresponding binary plane is set. Method of constructing a binary plane for the motion search, characterized in that comprises a seventh step to use as is. 웨이브렛 변환된 현재 프레임의 기저 대역 영상과 직전 프레임의 대응하는 영상의 동일 위치 블록 간의 절대 평균차를 구하여 소정의 임계값과 비교한 후, 그 결과에 따라 잠재 움직임 영역인지를 설정함으로써 이진 평면을 구성하는 제1과정;The absolute average difference between the baseband image of the wavelet transformed current frame and the co-located block of the corresponding image of the previous frame is obtained, compared with a predetermined threshold value, and then the binary plane is set by setting whether or not it is a potential motion region. A first process of constructing; 상기 기저 대역에서 얻어진 이진 평면을 동일 계층의 고주파 영역을 갖는 부영상 및 다른 계층의 부영상을 위한 이진 평면으로 전이하는 제2과정,A second process of transitioning a binary plane obtained in the baseband to a binary plane for a sub-image having a high frequency region of the same layer and a sub-image for another layer, 상기 각 부영상에 대한 이진 평면에서 잠재 움직임 영역이 있는 경우에 대해서만 이진 평면을 재구성하는 제3과정; 및Reconstructing a binary plane only for the case where there is a latent motion region in the binary plane for each sub-image; And 모든 부영상에 대해 이진 평면을 구성하였는지 판단하고, 모든 부영상에 대한 이진 평면이 구성되지 않았을 경우에는 위 제2과정 및 제3과정이 반복되도록 하는 제4과정을 포함하는 움직임 탐색을 위한 이진 평면 구성 방법이 컴퓨터 프로그램 형태로 저장되어 있는 기록매체.It is determined whether a binary plane has been configured for all sub-images, and if a binary plane for all sub-images is not configured, a binary plane for motion search including a fourth process for repeating the second and third processes above. Recording medium in which the configuration method is stored in the form of a computer program.
KR10-2001-0068839A 2001-11-06 2001-11-06 A method for forming binary plane for motion search and a motion estimating apparatus using the same KR100440567B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2001-0068839A KR100440567B1 (en) 2001-11-06 2001-11-06 A method for forming binary plane for motion search and a motion estimating apparatus using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0068839A KR100440567B1 (en) 2001-11-06 2001-11-06 A method for forming binary plane for motion search and a motion estimating apparatus using the same

Publications (2)

Publication Number Publication Date
KR20030037587A KR20030037587A (en) 2003-05-14
KR100440567B1 true KR100440567B1 (en) 2004-07-21

Family

ID=29568152

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0068839A KR100440567B1 (en) 2001-11-06 2001-11-06 A method for forming binary plane for motion search and a motion estimating apparatus using the same

Country Status (1)

Country Link
KR (1) KR100440567B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101412928B1 (en) 2012-12-21 2014-07-02 중앙대학교 산학협력단 Method for estimating low power motion vector and apparatus using the same

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100713400B1 (en) * 2004-04-30 2007-05-04 삼성전자주식회사 H.263/mpeg video encoder for controlling using average histogram difference formula and its control method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990005283A (en) * 1997-06-30 1999-01-25 배순훈 Hierarchical Motion Estimation Method in Wavelet Transform Domain
KR20010032113A (en) * 1997-11-14 2001-04-16 추후보정 Apparatus and method for compressing video information

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990005283A (en) * 1997-06-30 1999-01-25 배순훈 Hierarchical Motion Estimation Method in Wavelet Transform Domain
KR20010032113A (en) * 1997-11-14 2001-04-16 추후보정 Apparatus and method for compressing video information

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101412928B1 (en) 2012-12-21 2014-07-02 중앙대학교 산학협력단 Method for estimating low power motion vector and apparatus using the same

Also Published As

Publication number Publication date
KR20030037587A (en) 2003-05-14

Similar Documents

Publication Publication Date Title
US5477272A (en) Variable-block size multi-resolution motion estimation scheme for pyramid coding
JP3847827B2 (en) Motion vector detection method
US6996176B1 (en) Motion estimation process and system using sparse search block-matching and integral protection
JP3655651B2 (en) Data processing device
JP2006521048A (en) Method and apparatus for encoding and decoding an image sequence by motion / texture decomposition and wavelet encoding
JP2002507339A (en) Hierarchical motion estimation execution method and apparatus using nonlinear pyramid
JPH10285602A (en) Dynamic sprite for encoding video data
JP2007026459A (en) Method and apparatus for global-to-local block motion estimation
JPH08265781A (en) Method and apparatus for determining movement vector
US6222882B1 (en) Adaptive motion estimation method of a luminance signal
KR19990005283A (en) Hierarchical Motion Estimation Method in Wavelet Transform Domain
KR100587562B1 (en) Method for motion estimation of video frame, and video encoder using the same
JP5237814B2 (en) Multi-stage link method for adaptive motion vector sampling in video compression
JP2005304005A (en) Method for motion estimation of video frame, and video encoder
JPH0955943A (en) Video signal encoding device
JP5717548B2 (en) Super-resolution auxiliary information generation device, encoding device, decoding device, and programs thereof
RU2487489C2 (en) Method of searching for displacement vectors in dynamic images
KR100212559B1 (en) The contour coding system and motion prediction method for object
JP4802885B2 (en) Motion vector detection apparatus and method, program, and recording medium
KR100440567B1 (en) A method for forming binary plane for motion search and a motion estimating apparatus using the same
JP5514132B2 (en) Image reduction device, image enlargement device, and program thereof
Aoun et al. Multiresolution motion estimation and compensation for video coding
JP4490351B2 (en) Inter-layer prediction processing method, inter-layer prediction processing apparatus, inter-layer prediction processing program, and recording medium therefor
KR100534419B1 (en) Moving vector expecting device of the wavelet conversion area and Method thereof
KR19980079373A (en) Local Relaxation Method for Predicting Optical Flow

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080701

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee