KR100639995B1

KR100639995B1 - 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법

Info

Publication number: KR100639995B1
Application number: KR1020050051088A
Authority: KR
Inventors: 김병규; 마평수; 김선태; 송석규
Original assignee: 한국전자통신연구원
Priority date: 2005-06-14
Filing date: 2005-06-14
Publication date: 2006-10-31
Also published as: US7869518B2; US20060280248A1

Abstract

본 발명은 일련의 비디오 영상 데이터에서 현재 프레임의 소정 블록에 대응하는 기준 블록을 이전 프레임의 검색창 내의 복수개의 블록 중에서 검출하여 움직임을 예측하는 고속 움직임 예측 장치 및 방법에 관한 것이다. 본 발명에 따른 고속 움직임 예측 장치는 SAD이 소정 임계치보다 큰지 판단하는 판단부, SAD 값이 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색부 및 최소 SAD 값을 지닌 지점이 현재 검색패턴의 중앙점과 상이한 경우, 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색부를 포함한다.

움직임 추정, 블록 정합, 패턴 검색, 단일모드 왜곡면

Description

블록 정합 기반의 고속 움직임 예측 장치 및 그 방법{Apparatus and method for fast motion estimation based on block matching algorithm}

도 1 은 종래의 적응적 루드 패턴 검색 기법을 이용하여 움직임 벡터를 결정시 국부적 최소점을 가진 예를 도시한다.

도 2 는 움직임 예측 기법이 포함된 일반적인 비디오 인코딩 과정도이다.

도 3 은 블록 정합 알고리듬의 개념을 도시한다.

도 4 는 인접한 두 프레임 사이에서 현재 프레임 I(t)의 블록 B_i(t)에 대해서 이전 프레임 I(t-1)에서의 검색 범위창(search range window)을 도시한다.

도 5 는 15*15 크기 영역의 검색 범위창을 도시한다.

도 6 은 실제 임의의 입력 프레임을 블록단위화부(200)에서 다수의 16*16 으로 분할한 블록을 비디오 코덱에서 차례로 처리하는 순서를 도시한다.

도 7 은 현재 블록 주변의 블록 정보를 사용하기 위하여 이웃 블록들의 위치에 따라 정의된 4가지 경우를 도시하고 있다.

도 8 은 본 발명에서 제안하는 고속 움직임 추정 방법을 실행하기 위한 흐름도이다.

도 9 는 적응적 루드 패턴 검색기법 중 초기 검색 단계 검색 패턴을 도시한 다.

도 10 은 적응적 루드 패턴 검색기법 중 정규 루드 검색 패턴(Unit-size rood pattern)을 도시한다.

도 11 는 단일 모드 왜곡면(uni-modal distortion surface) 가정에 의한 1차원적 도시이다.

도 12 는 쿼터 루드 검색 패턴(Quarter Rood Search Pattern)의 4 가지 경우를 도시한다.

도 13 은 해프 루드 검색 패턴(Half Rood Search Pattern)의 4 가지 경우를 도시한다.

도 14 는 검색 패턴 길이 조절에 의한 최적의 검색점을 찾는 일 실시예를 1차원적으로 도시한다.

도 15 은 본 발명의 개선된 적응적 루드 패턴 검색 기법을 이용하여 움직임 벡터를 결정하는 것을 도시한다.

도 16 은 고속 움직임 추정 장치의 개략도이다.

본 발명은 블록 정합 알고리듬을 이용한 실시간 비디오 압축을 위한 고속 움직임 추정 기법에 관한 것이다. 보다 상세히, 본 발명은 일련의 비디오 영상 데이터에서 현재 프레임의 소정 블록에 대응하는 기준 블록을 이전 프레임의 검색창 내 의 복수개의 블록 중에서 검출하여 움직임을 예측하는 고속 움직임 예측 장치 및 방법에 관한 것이다.

움직임 추정 기법 중 가장 많이 사용되는 블록 정합 알고리듬(block-matching algorithm)은 현재 프레임을 여러 개의 기준블록(reference block)으로 분할하여 이전 프레임의 검색 윈도우(search window)안에서 가장 닮은 블록을 찾아 기준블록에 대한 상대 위치를 움직임 벡터(motion vector)로 정한 후 두 블록간의 화소값 차이와 움직임 벡터만을 전송하는 기법으로 현재의 비디오 압축 표준 기술에서 주로 사용되고 있다.

블록 정합 알고리듬 중에서 완전탐색 알고리듬(full search algorithm)은 기준블록을 탐색영역 내의 모든 블록과 비교하는 방법으로 성능이 우수하고 데이터 흐름과 제어회로가 비교적 간단하다는 장점이 있으나, 탐색영역이 커질 경우 막대한 연산량을 필요로 하는 단점이 있다.

완전탐색 알고리듬의 이러한 단점을 보완하기 위해 많은 고속탐색 알고리듬(fast algorithm)이 제안되고 있다. 고속 패턴 검색 기법들은 대부분 움직임 벡터의 분포 특성을 활용하여 그 패턴을 생성함으로써 속도를 향상시키고 있다. 그 중에서 적응적 루드 패턴 검색기법은 매우 움직임 추정 속도가 빠르고 화질의 열화도 적은 방법으로 알려져 있다.

종래의 적응적 루드 패턴 검색기법은 두 가지의 정형화된 검색 패턴을 이용하였다. 즉 정교화 검색 단계에서 정규 루드 패턴(다이아몬드 패턴)을 이용하여 반복 검색을 수행하였다.

이러한 종래의 적응적 루드 패턴 기법은 움직임이 큰 비디오 시퀀스의 경우 실제 발생할 수 있는 국부적 최소점에 쉽게 포획됨으로써 화질의 열화를 심화시킬 수 있는 문제점이 있다.

도 1은 종래의 적응적 루드 패턴 검색 기법을 이용하여 움직임 벡터를 결정시 국부적 최소점을 가진 예를 도시한다.

먼저 초기 패턴(

)을 검색하고 최소점을 다음 검색의 원점(O¹)으로 두고 정규 루드 패턴을 적용하여 인접한 화소들(

)을 검색한다. 다시 최소점을 다음 검색의 원점(O²)으로 설정하고 인접한 화소들을 검색한다. 이렇게 반복하면 결국 최종점이 국부적 최소점(

)에 포획되어 에러 성분이 큰 상태에서 압축이 된다.

이러한 문제점은 비디오 코덱에서는 화질의 열화를 심하시키게 되므로 국부적 최소점에 포획되지 않는 기법이 요구된다.

본 발명은 종래의 두 단계의 검색 패턴을 지닌 적응적 루드 패턴 검색기법(adaptive rood pattern search)의 문제점을 해결하기 위하여, 종래의 적응적 루드 패턴 검색기법의 구조를 개선함으로써 화질의 열화가 거의 없이 검색 속도를 더욱 빠르게 하기 위하여 적응적 검색 길이 설정 기법과 단일모드 왜곡면(uni-modal distortion surface) 가정을 활용한 검색점의 수를 효과적으로 감소시킴으로써 실시간 비디오 압축을 위한 고속 움직임 추정 기법을 제공하고자 한다.

상기의 과제를 해결하기 위하여 본 발명의 바람직한 일 실시예에 따른 고속 움직임 예측 방법은 SAD 값이 소정 임계치보다 큰지 판단하는 단계; 상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색 단계;및 상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색단계;를 포함한다.

상기의 과제를 해결하기 위하여, 본 발명의 바람직한 일 실시예에 따른 고속 움직임 예측 장치는 현재 프레임의 현재 블록의 화소값과 이전 프레임 검색창에서 상기 현재 블록에 대응하는 기준 블럭의 화소값과의 차를 합산한 값(이하, SAD)이 소정 임계치보다 큰지 판단하는 판단부; 상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색부; 및 상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치 의 수 및 검색 패턴의 크기를 설정하는 반복 검색부;를 포함한다.

바람직하게, 상기 반복 검색부에서 상기 SAD 값은 최적의 움직임 벡터에서 멀어질수록 단조 증가하며, 상기 탐색 위치의 수 설정시 탐색위치에서 예측 가능한 단조 증가된 SAD 값을 지닌 지점은 제외하는 것을 특징으로 한다.

또한, 본 발명의 바람직한 일 실시예서 상기 반복 검색부는 반복 검색의 회수에 따라 상기 현재 검색 패턴의 크기가 역비례하여 감소하고, 상기 현재 검색 패턴의 크기는 소정 임계 크기 이상인 것을 특징으로 한다.

상기의 과제를 해결하기 위하여 본 발명의 바람직한 일 실시예는 고속 움직임 예측 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체을 포함한다.

이하 본 발명의 바람직한 실시예가 첨부된 도면들을 참조하여 설명될 것이다. 도면들 중 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 참조번호들 및 부호들로 나타내고 있음에 유의해야 한다.

하기에서 본 발명을 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.

도 2 을 참조하여 입력 비디오 신호를 압축하는 과정을 구체적으로 살펴보면 다음과 같다. 블록단위화부(200)는 입력된 비디오의 매 프레임을 블록 단위로 분할한다.

움직임 보상부(220)의 출력과 현재 프레임과의 뺄셈을 취하는 감산부(230), 감산부의 출력을 이산코사인변환부(Discrete cosine transform, 240)를 통과하여 변화시키고 양자화부(250)에서는 변환된 계수들을 양자화 한다.

양자화된 결과를 가변길이 부호화부(variable length coding, 160)를 이용하여 압축 스트림으로 생성한다. 그 후 원 영상으로 복원시키는 역양자화/역이산코사인 변환부(270)와 가산부(280)를 통과하여 영상을 원래의 영상으로 복원 시키고, 복원된 영상(이전 프레임)을 이용하여 움직임 추정부(290)에서 현재 프레임의 움직임을 추정하거나 예측한다.

도 3 은 블록 정합 알고리듬의 개념을 도시한다.

도 3에 도시된 바와 같이, 블록 정합 알고리듬은 현재 프레임을 N×M 크기를 갖는 여러 개의 작은 블록(이하, 기준블록)으로 나눈 다음, 각각의 기준블록을 이전 프레임의 정해진 영역(기준블록이 상하좌우로 -p에서 +(p-1) 화소만큼 이동한 영역, 이하 탐색영역이라 칭함)내에 있는 여러 개의블록과 비교하여 가장 닮은 블록(이하 정합블록이라 칭함)을 찾아내어, 기준블록에 대한 정합블록의 상대 위치를 움직임 벡터로 정하는 기법이다. 이러한 움직임 추정은 두 프레임 간의 상관성을 최대로 제거함으로써 전송해야 할 데이터를 줄이고자 하는 목적이 있다.

도 5 는 15*15 크기 영역의 검색 범위창을 도시한다.

실제 비디오 압축 시스템에서는 분할한 블록 단위로 처리를 수행하게 된다. 도 6에 도시된 방식은 일반적으로 순차 검색 방식이라 하며, B₁₁.B₁₂,...B_nm으로 순차적으로 좌측상향 방향에서 우측하향 방향으로 스캐닝 한 후 한 블록씩 처리하여 데이터를 압축한다.

도 6의 순차 검색 방식에서 스캐닝 된 좌측 상향 방향의 블록 정보들의 기 검출된 움직임 정보를 이용하여 현재 블록이 영상 프레임에서 어느 위치에서 검색되는 것이 타당한지 예측한다.

도 6 의 순차 검색 방식에서 스캐닝을 통해 얻은 움직임 벡터들의 정보를 활용하기 위하여 도 7 (a)~(d)의 4가지 경우로 분류한다.

도 7 (a) 경우는 하나의 좌-상 블록(m¹ _x,m¹ _y), 하나의 상 블록(m² _x,m² _y), 하나의 좌 블록(m⁴ _x,m⁴ _y), 그리고 하나의 우-상 블록(m³ _x, m³ _y)에 존재하는 움직임 벡터(mv^p _x, mv^p _y)를 예측을 위한 정보로 이용한다.

도 7 (b) 경우는 하나의 상 블록(m² _x,m² _y), 하나의 좌 블록(m⁴ _x,m⁴ _y), 그리고 하나의 우-상 블록(m³ _x, m³ _y)에 존재하는 움직임 벡터(mv^p _x, mv^p _y)를 예측을 위한 정보로 이용한다.

본 발명에서는 예측을 위한 정보로 이용하는 상기 블록들의 움직임 벡터의 중간 값(median value) 또는 평균값(average value)를 취함으로써 예측 움직임 벡터를 구한다.

초기 검색 패턴의 크기는 중간값을 이용할 경우 다음과 같이 구해진다.

L⁰ _x= mv^p _x= Median{mvⁱ _x} , i=1,2,3,4

L⁰ _y= mv^p _y= Median{mvⁱ _y} , i=1,2,3,4

이 때, 움직임 벡터를 예측하기 위해 이웃 블록을 이용하는 형태에 따라서 중간값 함수에서 이용할 수 있는 인접 블록의 움직임 벡터의 개수가 달라지게 된다.

예를 들어, 도 7(a)의 경우는 i= 1, 2, 3, 4 가 되고 도 7(b)의 경우에는 i= 2, 3, 4 가 된다.

초기 단계에서는 현재 검색창의 중심점(원점)에 대하여 현재 블록과 이전 프레임에서 현재 검색창에 대응하는 가장 닮은 정합블록 간의 화소차의 절대값의 합( 이하, "SAD(sum of absolute difference)"라 한다.)을 계산하여 기설정된 임계값(Th)와 비교한다(S810).

여기서, B_c(i,j)는 현재 움직임 추정을 위한 블록이고, B_r(i,j)는 이전 프레임에서 검색 범위 내의 위치에서의 해당 블록을 나타낸다.

SAD 가 임계값보다 적은 경우 현재의 원점을 최적의 움직임 벡터로 결정하고 더 이상의 검색은 수행하지 않는다(S811, S870). 즉, 현재 프레임이 이전 프레임과 비교할 때 영상의 움직임이 없는 정지 영상으로 간주하게 된다.

그러나, SAD 가 임계값보다 큰 경우 두 프레임 간에 물체나 배경의 이동이 있는 것으로 간주하여 프레임 간에 이동이 발생하였다고 판단하여 초기 검색단계를 수행한다(S820).

초기 검색단계에서는 도 10 에 도시된 바와 같이 이웃한 블록의 움직임 정보를 활용하여 구해진 예측된 움직임 벡터(Predicted MV(mv^p _x, mv^p _y) ) 정보를 이용하여 검색 패턴을 생성한다(S820).

원점, 루드 패턴 형태의 4개의 점 그리고 예측된 움직임 벡터 지점까지 모두 6개의 점을 검색한 이후 최소 SAD 값을 갖는 점을 추출한다.

추출된 최소 SAD를 지닌 지점이 현재 검색 패턴의 중앙점과 일치하는 경우 상기 중앙점이 움직임 벡터로 결정되고 검색은 중단된다(S831, S870).

그렇지 않은 경우 상기 추출된 최소 SAD점을 중앙으로 정렬한 후 반복 검색을 하게 된다(S832).

반복 검색 단계(S840)는 크게 원점 정렬 단계(S841), 적응적 패턴 설정 단계(S842), 적응적 패턴 크기 설정 단계(S843)를 포함한다.

원점 정렬 단계(S841)에서는 이전 단계에서 구해진 최소 SAD 점을 현재의 검색 패턴의 중앙으로 정렬한다.

적응적 패턴 설정 단계(S842)에서는 현재의 검색 윈도우의 중앙에서 어느 방향에 최소점이 검출되는가에 따라서 다음 검색 패턴을 쿼터 루드 검색 패턴(Quarter Rood Search Pattern) 또는 해프 루드 검색 패턴(Half Rood Search Pattern)의 형태로 검색한다.

즉, 적응적 패턴 설정부에서는 각 탐색점의 에러가 정확한 움직임 벡터에서 멀어질수록 커지는 것을 의미하는 단일 모드 왜곡면(uni-modal distortion surface) 가정에 의해 그 방향성을 고려하여 생성되는 쿼터 루드 검색 패턴과 해프 루드 검색 패턴으로 이루어지는 검색 패턴의 형태를 검색한다. 이에 대하여서는 이후에 보다 상세히 서술하겠다.

적응적 패턴 크기 설정 단계(S843)에서는 적응적 패턴 설정부에서 선택된 검색 패턴의 크기를 결정한다. 즉, 초기 검색 단계 이후에 바로 정규 루드 패턴(Unit-Size rood pattern)검색을 수행하는 것이 아니라, 적응적인 패턴의 크기를 사용한다. 이 때 사용되는 크기는 수학식 3~5 를 참고하여 설명하도록 한다.

여기서,

는 k 번째 반복 검색시에 사용되는 x축 및 y 축 방향 각각의 패턴 크기이다.

,

는 각각 k 번째 검색 패턴의 원점 x 성분과 k+1 번째 검색 패턴의 원점이면서 k 번째, k+1번째 검색 패턴에서 검출된 최소 SAD 점의 x 성분이다.

< > 는 현재 계산된 값을 정수로 근사화 하는 함수로서 화소 단위로 패턴 크기를 결정하기 위한 연산이다.

는 가중치로서 실제 어느 정도로 검색 영역의 크기를 감소시켜줄 것인가를 나타내는 값이며 다음의 조건을 만족하여야 한다.

가 1보다 큰 값을 갖는 경우, 패턴 크기의 감쇄가 약화되어 검색점의 수가 증가하게 될 수 있으므로 속도 향상이 예측되기 어렵다. 또한

가 0보다 작은 값을 갖는 경우, 초기 검색 이후 다음 반복 검색시에 정규 루드 패턴 크기가 되므로, 본 발명에서 사용하는 적응적인 패턴의 크기를 획득하기 어렵다.

따라서,

가 상기 수학식 4의 범위 내인 경우 검색 범위를 좁혀가는 기능을 수행하며, 실험적으로는 0.6에서 0.7 을 사용한다.

결과적으로 수학식 3과 수학식 4에 따라 큰 움직임을 지닌 비디오 시퀀스에서 반복 검색시 검색 루드 패턴의 크기가 1인 정규 루드 패턴(Unit-Size rood pattern)검색을 반복 수행하는 것이 아니라, 초기 검색 패턴 크기와 정규 검색 패턴 크기인 1 사이의 임의의 정수값을 지닌 패턴 크기 검색이 반복되면서 최종적으로 정규 크기인 1로 설정된 검색을 수행하게 된다.

또한 매 반복검색시 화소 단위의 패턴이 생성되어야 하므로, 구해진 패턴의 크기는 수학식 5를 만족하여야 한다.

상기 반복 검색 단계(S840)에서 결정된 검색 패턴 및 크기를 이용하여 최소 SAD 점을 검색한다(S850). 검색한 최소 SAD 점이 현재 검색 패턴의 중앙점인지 여부를 비교하고(S860), 중앙점인 경우에는 그 중앙점이 움직임 벡터(MV)로 결정되고 검색은 종료된다(S870, S880).

검색한 최소 SAD 점이 현재 검색 패턴의 중앙점이 아닌 경우 현재 최소 SAD 점을 중앙으로 정렬 한 후 반복 검색을 수행한다(S861, S840).

도 9 는 적응적 루드 패턴 검색기법 중 초기 검색 단계 검색 패턴을 도시한다.

도면에서 볼 수 있는 바와 같이 이전 단계에서 x_p ^k가 최소점으로 선택된 후 다음 단계 즉, k+1번째 검색에서는 좌우의 두 점중 -x_p ^k는 검색할 필요가 없는 점이 됨을 알 수 있다.

이 개념을 2차원적으로 확장하여 도시한 것이 도 12 및 도 13 이다.

즉 에러 표면의 방향성을 충분히 고려함으로써 방향성이 고려된 검색점만을 검색함으로써 검색점의 수를 감소시킬 수 있다. 이러한 검색점의 감소는 비디오 코덱에서 움직임 추정 부분의 계산 시간을 감소시켜 고속화 하는 기능을 한다.

적응적 패턴 설정부(S842)에서는 현재의 검색 윈도우 중앙에서 어느 방향에 최소점이 검출되는가에 따라서 다음 검색 패턴을 쿼터 루드 검색 패턴으로 할 것인지 해프 루드 검색 패턴으로 할 것인지를 정한다.

그럼으로써 종래에는 루드 패턴의 좌, 우, 상, 하의 4개의 검색점을 모두 검색하였으나, 상기 쿼터 루드 검색 패턴 내지 해프 루드 검색 패턴을 이용함으로써 루드 패턴의 4개 검색점들 중 일부만을 검색하여 최적의 검색점을 찾으므로 검색점의 수가 매 블록마다 평균 2~3개 정도의 감소됨을 볼 수 있다.

적응적 루드 패턴 검색기법 중 초기 검색 단계 검색 패턴이후 바로 정규 루드 패턴을 사용하지 않고 움직임이 큰 시퀀스에 대응하기 위해 검색 패턴의 크기를 검색 단계가 반복되는 단계별로 감소시킴으로써 국부적 최소점에 빠지지 않고 O¹ ->O² -> ...-> O⁵-> 최적의 해(

)에 도달하게 된다.

따라서, 본 발명에 의한 적응적 루드 패턴 검색 기법을 이용함으로써 최소의 에러로 현재 블록을 압축하게 되므로 화질이 향상되며, 본 발명에서는 이러한 개념을 2차원적으로 확장시켜서 이용한다.

개선된 적응적 루드 검색 기법을 이용하여 고속 움직임 추정 방법을

=0.6 인 일 실시예를 들어 구체적으로 설명하면 다음과 같다.

초기 검색단계에서는 먼저 O⁰점에 대한 SAD 값을 계산하고 기 설정된 임계값 (TH)과 비교하여 작은 값이면 움직임 벡터는 (0,0)으로 결정하고 아니면 <수학식 2>에 의해서 결정된 초기 패턴에 의한 검색을 수행한다.

도 15 에 도시된 6개의 점((

)원점, 루드 패턴 검색점, 예측된 벡터 지점)을 검색한다. 각 점에서 SAD 값을 계산하고 최소 SAD 값을 갖는 점을 다음 검색 단계의 원점으로 정렬한다. 도 15에서는 움직임 예측 벡터에 의한 지점(O¹)이 된다.

정렬된 원점을 이용하여, <수학식 3>에 의하여 패턴의 크기를 다음과 같이 구한다.

상기와 같이 패턴의 크기를 계산한 후, 제안된 패턴 중 원점 주위의 4개의 다이아몬드 형태의 점들 중 검은 색 다이아몬드 점(

)들만, 즉 쿼터 루드 검색 패턴에 해당하는 점들을 검색한다.

마찬가지로 최소 SAD 점을 검색하여 이 점을 다음 검색 시의 원점으로 정렬한다(O²). 최소 SAD 점이 현재의 검색 패턴의 원점이면 최소 SAD 점인 현재의 원점이 최적의 움직임 벡터가 되고, 그렇지 않으며 다시 반복검색을 수행한다.

정렬된 원점을 이용하여 위의 식에 의해서 패턴의 크기는 다음과 같이 구해진다.

또한, 제안된 패턴들 중에서 해프-루드 검색 패턴인 주의의 3개의 점(

)들을 검색한다. 마찬가지로 최소 SAD 점을 검색하여 이 점을 다음 검색 시의 원점으로 정렬한다. 최소 SAD 점이 현재의 검색 패턴의 원점이면, 최소 SAD 점인 현재의 원점이 최적의 움직임 벡터가 되고, 그렇지 않으면 다시 반복검색을 수행한다.

도 16 은 고속움직임 추정 장치의 개략도이다.

고속 움직임 추정 장치(1600)은 판단부(1610), 초기 검색부(1620), 반복 검색부(1630)로 구성된다. 또한 반복 검색부(1630)는 현재 검색 패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수를 결정하는 탐색 위치의 수 결정부(1640)와 검색 패턴 크기 설정부(1650)를 포함한다.

판단부(1610)에서는 현재 검색창의 중심점(원점)에 대하여 현재 블록과 이전 프레임에서 현재 검색창에 대응하는 가장 닮은 정합블록 간의 화소차의 SAD를 계산하여 기설정된 임계값(Th)과 비교한다.

SAD 가 임계값보다 적은 경우 현재의 원점을 최적의 움직임 벡터로 결정하고 더 이상의 검색은 수행하지 않는다.

초기 검색부(1620)는 SAD 가 임계값보다 큰 경우 두 프레임 간에 물체나 배경의 이동이 있는 것으로 간주하여 원점, 루드 패턴 형태의 4개의 점 그리고 예측된 움직임 벡터 지점까지 모두 6개의 점을 검색한 이후 최소 SAD 값을 갖는 점을 추출한다. 그 후 추출된 최소 SAD를 지닌 지점이 현재 검색 패턴의 중앙점과 일치하는 경우 상기 중앙점이 움직임 벡터로 결정되고 검색은 중단된다.

반복 검색부(1630)는 최소 SAD를 지닌 지점이 현재 검색 패턴의 중앙점과 일치하지 않는 경우 최소 SAD점을 중앙으로 정렬한 후 반복 검색을 수행한다.

이 때, 탐색 위치의 수 결정부(1640)는 현재의 검색 패턴의 중앙점이 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 최소점이 검출되는가에 따라서 다음 검색 패턴을 쿼터 루드 검색 패턴(Quarter Rood Search Pattern) 또는 해프 루드 검색 패턴(Half Rood Search Pattern)의 형태로 검색한다.

즉, 각 탐색점의 에러가 정확한 움직임 벡터에서 멀어질수록 커지는 것을 의미하는 단일 모드 왜곡면(uni-modal distortion surface) 가정에 의해 그 방향성을 고려하여 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 1,2,3,4 사분면에 위치하는 경우 2개의 탐색 위치의 수를 검출하는 쿼터 루드 검색 패턴을 이용하고, 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 x축 또는 y 축 상에 위치하는 경우 3개의 탐색 위치의 수를 검출하는 해프 루드 검색 패턴을 이용하여 검색한다.

검색 패턴 크기 설정부(1650)에서는 탐색 위치의 수 결정부(1640)에서 결정 된 패턴의 형태마다 검색 패턴의 크기를 결정한다. 이 때, 검색 패턴의 크기는 위에서 서술한 수학식 3~5 와 동일하며, 관련 설명은 이에 관한 부분에 기술된 바와 기술적 구성이 거의 동일하거나 유사한바, 이를 참고하기로 한다.

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

이상 도면과 명세서에서 최적 실시예들이 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

본 발명의 고속 움직임 예측 장치 및 고속 움직임 예측 방법은 블록기반 비 디오 압축 시스템에서 블록 단위별 움직임을 추정하는데 있어서 그 속도를 향상시킴으로써 소프트웨어적인 비디오 압축 시스템의 실시간 압축 기능을 향상시키는 효과를 발생한다.

또한 본 발명에서 제안된 검색 패턴의 형태와 크기를 적응적으로 설정함으로써 속도를 개선시키는 효과를 발생시키는 본 발명의 기법은 기존의 다른 고속 패턴 검색 기법인 3SS, E3SS, 4SS 등에도 적용이 가능하므로 기존의 블록 기반의 MPEG 계열 비디오 압축 시스템에서 적용이 가능한 효과가 발생한다.

본 발명에서는 매 검색 단계에서 이웃한 블록의 움직임 정보를 기초로 움직임 예측 정보를 활용하고, 적응적으로 검색 패턴을 해프 루드 검색 패턴 내지 쿼터루드 검색 패턴을 선택하며 각 검색 패턴의 그 크기를 조절함으로써 화질의 열화가 없이 검색점 수를 휠씬 효과적으로 감소시키는 효과가 발생한다.

또한 움직임이 큰 영상에 대해서도 매 반복 검색마다 패턴의 형태와 크기를 적응적으로 설정함으로써 기존의 기법들보다 좋은 화질을 유지하는 효과가 발생한다.

Claims

SAD 값이 소정 임계치보다 큰지 판단하는 단계;

상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색 단계;및

상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색단계;를 포함하는 것을 특징으로 하는 고속 움직임 예측 방법.
제 1 항에 있어서, 상기 반복 검색단계는

상기 SAD 값은 최적의 움직임 벡터에서 멀어질수록 단조 증가하며, 상기 탐색 위치의 수 설정시 탐색위치에서 예측 가능한 단조 증가된 SAD 값을 지닌 지점은 제외하는 것을 특징으로 하는 고속 움직임 예측 방법.
제 1 항에 있어서, 상기 반복 검색단계는

상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 1,2,3,4 사분면에 위치하는 경우 2 개의 탐색 위치의 수를 검출하는 쿼터 루드 검색 패턴을 이용하고,

상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 x 축 또는 y축 상에 위치하는 경우 3 개의 탐색 위치의 수를 검출하는 해프 루드 검색 패턴을 이용하는 것을 특징으로 하는 고속 움직임 예측 방법.
제 1 항에 있어서, 상기 반복 검색단계는

반복 검색의 회수에 따라 상기 현재 검색 패턴의 크기가 역비례하여 감소하며, 상기 현재 검색 패턴의 크기는 소정 임계 크기 이상인 것을 특징으로 하는 고속 움직임 예측 방법.
제 1 항에 있어서, 상기 반복 검색단계에서 상기 검색 패턴의 크기는

이며,

여기서, x축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 x 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 x성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값이고,

y 축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 y 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 y성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값인 것을 특징으로 하는 고속 움직임 예측 방법.
제 5 항에 있어서, k 번째 반복 검색시 x 축 및 y 축 검색 패턴의 크기는
것을 특징으로 하는 고속 움직임 예측 방법.
현재 프레임의 현재 블록의 화소값과 이전 프레임 검색창에서 상기 현재 블록에 대응하는 정합 블럭의 화소값과의 차를 합산한 값(이하, SAD)이 소정 임계치보다 큰지 판단하는 판단부;

상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색부; 및

상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색부;를 포함하는 것을 특징으로 하는 고속 움직임 예측 장치.
제 7 항에 있어서, 상기 현재 검색 패턴의 복수의 탐색 위치는

다이아몬드 형태의 4개의 검색점과, 원점 및 움직임 예측 지점을 포함하는 것을 특징으로 하는 고속 움직임 예측 장치.
제 7 항에 있어서, 상기 반복 검색부에서

상기 SAD 값은 최적의 움직임 벡터에서 멀어질수록 단조 증가하며, 상기 탐색 위치의 수 설정시 탐색위치에서 예측 가능한 단조 증가된 SAD 값을 지닌 지점은 제외하는 것을 특징으로 하는 고속 움직임 예측 장치.
제 7 항에 있어서, 상기 반복 검색부는

상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 1,2,3,4 사분면에 위치하는 경우 2 개의 탐색 위치의 수를 검출하는 쿼터 루드 검색 패턴을 이용하고,

상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 x 축 또는 y축 상에 위치하는 경우 3 개의 탐색 위치의 수를 검출하는 해프 루드 검색 패턴을 이용하는 것을 특징으로 하는 고속 움직임 예측 장치.
제 7 항에 있어서, 상기 반복 검색부는

반복 검색의 회수에 따라 상기 현재 검색 패턴의 크기가 역비례하여 감소하고, 상기 현재 검색 패턴의 크기는 소정 임계 크기 이상인 것을 특징으로 하는 고속 움직임 예측 장치.
제 7 항에 있어서, 상기 반복 검색부에서 상기 검색 패턴의 크기는

이며,

여기서, x축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 x 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 x성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값이고,

y 축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 y 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 y성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값인 것을 특징으로 하는 고속 움직임 예측 장치.
제 12 항에 있어서, k 번째 반복 검색시 x 축 및 y 축 검색 패턴의 크기는
것을 특징으로 하는 고속 움직임 예측 장치.