KR100639995B1 - 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법 - Google Patents

블록 정합 기반의 고속 움직임 예측 장치 및 그 방법 Download PDF

Info

Publication number
KR100639995B1
KR100639995B1 KR1020050051088A KR20050051088A KR100639995B1 KR 100639995 B1 KR100639995 B1 KR 100639995B1 KR 1020050051088 A KR1020050051088 A KR 1020050051088A KR 20050051088 A KR20050051088 A KR 20050051088A KR 100639995 B1 KR100639995 B1 KR 100639995B1
Authority
KR
South Korea
Prior art keywords
search
search pattern
pattern
point
center point
Prior art date
Application number
KR1020050051088A
Other languages
English (en)
Inventor
김병규
마평수
김선태
송석규
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020050051088A priority Critical patent/KR100639995B1/ko
Priority to US11/243,095 priority patent/US7869518B2/en
Application granted granted Critical
Publication of KR100639995B1 publication Critical patent/KR100639995B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/533Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2355Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 일련의 비디오 영상 데이터에서 현재 프레임의 소정 블록에 대응하는 기준 블록을 이전 프레임의 검색창 내의 복수개의 블록 중에서 검출하여 움직임을 예측하는 고속 움직임 예측 장치 및 방법에 관한 것이다. 본 발명에 따른 고속 움직임 예측 장치는 SAD이 소정 임계치보다 큰지 판단하는 판단부, SAD 값이 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색부 및 최소 SAD 값을 지닌 지점이 현재 검색패턴의 중앙점과 상이한 경우, 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색부를 포함한다.
움직임 추정, 블록 정합, 패턴 검색, 단일모드 왜곡면

Description

블록 정합 기반의 고속 움직임 예측 장치 및 그 방법{Apparatus and method for fast motion estimation based on block matching algorithm}
도 1 은 종래의 적응적 루드 패턴 검색 기법을 이용하여 움직임 벡터를 결정시 국부적 최소점을 가진 예를 도시한다.
도 2 는 움직임 예측 기법이 포함된 일반적인 비디오 인코딩 과정도이다.
도 3 은 블록 정합 알고리듬의 개념을 도시한다.
도 4 는 인접한 두 프레임 사이에서 현재 프레임 I(t)의 블록 Bi(t)에 대해서 이전 프레임 I(t-1)에서의 검색 범위창(search range window)을 도시한다.
도 5 는 15*15 크기 영역의 검색 범위창을 도시한다.
도 6 은 실제 임의의 입력 프레임을 블록단위화부(200)에서 다수의 16*16 으로 분할한 블록을 비디오 코덱에서 차례로 처리하는 순서를 도시한다.
도 7 은 현재 블록 주변의 블록 정보를 사용하기 위하여 이웃 블록들의 위치에 따라 정의된 4가지 경우를 도시하고 있다.
도 8 은 본 발명에서 제안하는 고속 움직임 추정 방법을 실행하기 위한 흐름도이다.
도 9 는 적응적 루드 패턴 검색기법 중 초기 검색 단계 검색 패턴을 도시한 다.
도 10 은 적응적 루드 패턴 검색기법 중 정규 루드 검색 패턴(Unit-size rood pattern)을 도시한다.
도 11 는 단일 모드 왜곡면(uni-modal distortion surface) 가정에 의한 1차원적 도시이다.
도 12 는 쿼터 루드 검색 패턴(Quarter Rood Search Pattern)의 4 가지 경우를 도시한다.
도 13 은 해프 루드 검색 패턴(Half Rood Search Pattern)의 4 가지 경우를 도시한다.
도 14 는 검색 패턴 길이 조절에 의한 최적의 검색점을 찾는 일 실시예를 1차원적으로 도시한다.
도 15 은 본 발명의 개선된 적응적 루드 패턴 검색 기법을 이용하여 움직임 벡터를 결정하는 것을 도시한다.
도 16 은 고속 움직임 추정 장치의 개략도이다.
본 발명은 블록 정합 알고리듬을 이용한 실시간 비디오 압축을 위한 고속 움직임 추정 기법에 관한 것이다. 보다 상세히, 본 발명은 일련의 비디오 영상 데이터에서 현재 프레임의 소정 블록에 대응하는 기준 블록을 이전 프레임의 검색창 내 의 복수개의 블록 중에서 검출하여 움직임을 예측하는 고속 움직임 예측 장치 및 방법에 관한 것이다.
움직임 추정 기법 중 가장 많이 사용되는 블록 정합 알고리듬(block-matching algorithm)은 현재 프레임을 여러 개의 기준블록(reference block)으로 분할하여 이전 프레임의 검색 윈도우(search window)안에서 가장 닮은 블록을 찾아 기준블록에 대한 상대 위치를 움직임 벡터(motion vector)로 정한 후 두 블록간의 화소값 차이와 움직임 벡터만을 전송하는 기법으로 현재의 비디오 압축 표준 기술에서 주로 사용되고 있다.
블록 정합 알고리듬 중에서 완전탐색 알고리듬(full search algorithm)은 기준블록을 탐색영역 내의 모든 블록과 비교하는 방법으로 성능이 우수하고 데이터 흐름과 제어회로가 비교적 간단하다는 장점이 있으나, 탐색영역이 커질 경우 막대한 연산량을 필요로 하는 단점이 있다.
완전탐색 알고리듬의 이러한 단점을 보완하기 위해 많은 고속탐색 알고리듬(fast algorithm)이 제안되고 있다. 고속 패턴 검색 기법들은 대부분 움직임 벡터의 분포 특성을 활용하여 그 패턴을 생성함으로써 속도를 향상시키고 있다. 그 중에서 적응적 루드 패턴 검색기법은 매우 움직임 추정 속도가 빠르고 화질의 열화도 적은 방법으로 알려져 있다.
종래의 적응적 루드 패턴 검색기법은 두 가지의 정형화된 검색 패턴을 이용하였다. 즉 정교화 검색 단계에서 정규 루드 패턴(다이아몬드 패턴)을 이용하여 반복 검색을 수행하였다.
이러한 종래의 적응적 루드 패턴 기법은 움직임이 큰 비디오 시퀀스의 경우 실제 발생할 수 있는 국부적 최소점에 쉽게 포획됨으로써 화질의 열화를 심화시킬 수 있는 문제점이 있다.
도 1은 종래의 적응적 루드 패턴 검색 기법을 이용하여 움직임 벡터를 결정시 국부적 최소점을 가진 예를 도시한다.
먼저 초기 패턴(
Figure 112005031408038-pat00001
)을 검색하고 최소점을 다음 검색의 원점(O1)으로 두고 정규 루드 패턴을 적용하여 인접한 화소들(
Figure 112005031408038-pat00002
)을 검색한다. 다시 최소점을 다음 검색의 원점(O2)으로 설정하고 인접한 화소들을 검색한다. 이렇게 반복하면 결국 최종점이 국부적 최소점(
Figure 112005031408038-pat00003
)에 포획되어 에러 성분이 큰 상태에서 압축이 된다.
이러한 문제점은 비디오 코덱에서는 화질의 열화를 심하시키게 되므로 국부적 최소점에 포획되지 않는 기법이 요구된다.
본 발명은 종래의 두 단계의 검색 패턴을 지닌 적응적 루드 패턴 검색기법(adaptive rood pattern search)의 문제점을 해결하기 위하여, 종래의 적응적 루드 패턴 검색기법의 구조를 개선함으로써 화질의 열화가 거의 없이 검색 속도를 더욱 빠르게 하기 위하여 적응적 검색 길이 설정 기법과 단일모드 왜곡면(uni-modal distortion surface) 가정을 활용한 검색점의 수를 효과적으로 감소시킴으로써 실시간 비디오 압축을 위한 고속 움직임 추정 기법을 제공하고자 한다.
상기의 과제를 해결하기 위하여 본 발명의 바람직한 일 실시예에 따른 고속 움직임 예측 방법은 SAD 값이 소정 임계치보다 큰지 판단하는 단계; 상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색 단계;및 상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색단계;를 포함한다.
상기의 과제를 해결하기 위하여, 본 발명의 바람직한 일 실시예에 따른 고속 움직임 예측 장치는 현재 프레임의 현재 블록의 화소값과 이전 프레임 검색창에서 상기 현재 블록에 대응하는 기준 블럭의 화소값과의 차를 합산한 값(이하, SAD)이 소정 임계치보다 큰지 판단하는 판단부; 상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색부; 및 상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치 의 수 및 검색 패턴의 크기를 설정하는 반복 검색부;를 포함한다.
바람직하게, 상기 반복 검색부에서 상기 SAD 값은 최적의 움직임 벡터에서 멀어질수록 단조 증가하며, 상기 탐색 위치의 수 설정시 탐색위치에서 예측 가능한 단조 증가된 SAD 값을 지닌 지점은 제외하는 것을 특징으로 한다.
또한, 본 발명의 바람직한 일 실시예서 상기 반복 검색부는 반복 검색의 회수에 따라 상기 현재 검색 패턴의 크기가 역비례하여 감소하고, 상기 현재 검색 패턴의 크기는 소정 임계 크기 이상인 것을 특징으로 한다.
상기의 과제를 해결하기 위하여 본 발명의 바람직한 일 실시예는 고속 움직임 예측 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체을 포함한다.
이하 본 발명의 바람직한 실시예가 첨부된 도면들을 참조하여 설명될 것이다. 도면들 중 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 참조번호들 및 부호들로 나타내고 있음에 유의해야 한다.
하기에서 본 발명을 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
도 2 는 움직임 예측 기법이 포함된 일반적인 비디오 인코딩 과정도이다.
도 2 을 참조하여 입력 비디오 신호를 압축하는 과정을 구체적으로 살펴보면 다음과 같다. 블록단위화부(200)는 입력된 비디오의 매 프레임을 블록 단위로 분할한다.
움직임 보상부(220)의 출력과 현재 프레임과의 뺄셈을 취하는 감산부(230), 감산부의 출력을 이산코사인변환부(Discrete cosine transform, 240)를 통과하여 변화시키고 양자화부(250)에서는 변환된 계수들을 양자화 한다.
양자화된 결과를 가변길이 부호화부(variable length coding, 160)를 이용하여 압축 스트림으로 생성한다. 그 후 원 영상으로 복원시키는 역양자화/역이산코사인 변환부(270)와 가산부(280)를 통과하여 영상을 원래의 영상으로 복원 시키고, 복원된 영상(이전 프레임)을 이용하여 움직임 추정부(290)에서 현재 프레임의 움직임을 추정하거나 예측한다.
도 3 은 블록 정합 알고리듬의 개념을 도시한다.
도 3에 도시된 바와 같이, 블록 정합 알고리듬은 현재 프레임을 N×M 크기를 갖는 여러 개의 작은 블록(이하, 기준블록)으로 나눈 다음, 각각의 기준블록을 이전 프레임의 정해진 영역(기준블록이 상하좌우로 -p에서 +(p-1) 화소만큼 이동한 영역, 이하 탐색영역이라 칭함)내에 있는 여러 개의블록과 비교하여 가장 닮은 블록(이하 정합블록이라 칭함)을 찾아내어, 기준블록에 대한 정합블록의 상대 위치를 움직임 벡터로 정하는 기법이다. 이러한 움직임 추정은 두 프레임 간의 상관성을 최대로 제거함으로써 전송해야 할 데이터를 줄이고자 하는 목적이 있다.
도 4 는 인접한 두 프레임 사이에서 현재 프레임 I(t)의 블록 Bi(t)에 대해서 이전 프레임 I(t-1)에서의 검색 범위창(search range window)을 도시한다.
도 5 는 15*15 크기 영역의 검색 범위창을 도시한다.
도 6 은 실제 임의의 입력 프레임을 블록단위화부(200)에서 다수의 16*16 으로 분할한 블록을 비디오 코덱에서 차례로 처리하는 순서를 도시한다.
실제 비디오 압축 시스템에서는 분할한 블록 단위로 처리를 수행하게 된다. 도 6에 도시된 방식은 일반적으로 순차 검색 방식이라 하며, B11.B12,...Bnm으로 순차적으로 좌측상향 방향에서 우측하향 방향으로 스캐닝 한 후 한 블록씩 처리하여 데이터를 압축한다.
도 7 은 현재 블록 주변의 블록 정보를 사용하기 위하여 이웃 블록들의 위치에 따라 정의된 4가지 경우를 도시하고 있다.
도 6의 순차 검색 방식에서 스캐닝 된 좌측 상향 방향의 블록 정보들의 기 검출된 움직임 정보를 이용하여 현재 블록이 영상 프레임에서 어느 위치에서 검색되는 것이 타당한지 예측한다.
도 6 의 순차 검색 방식에서 스캐닝을 통해 얻은 움직임 벡터들의 정보를 활용하기 위하여 도 7 (a)~(d)의 4가지 경우로 분류한다.
도 7 (a) 경우는 하나의 좌-상 블록(m1 x,m1 y), 하나의 상 블록(m2 x,m2 y), 하나의 좌 블록(m4 x,m4 y), 그리고 하나의 우-상 블록(m3 x, m3 y)에 존재하는 움직임 벡터(mvp x, mvp y)를 예측을 위한 정보로 이용한다.
도 7 (b) 경우는 하나의 상 블록(m2 x,m2 y), 하나의 좌 블록(m4 x,m4 y), 그리고 하나의 우-상 블록(m3 x, m3 y)에 존재하는 움직임 벡터(mvp x, mvp y)를 예측을 위한 정보로 이용한다.
본 발명에서는 예측을 위한 정보로 이용하는 상기 블록들의 움직임 벡터의 중간 값(median value) 또는 평균값(average value)를 취함으로써 예측 움직임 벡터를 구한다.
초기 검색 패턴의 크기는 중간값을 이용할 경우 다음과 같이 구해진다.
L0 x= mvp x = Median{mvi x} , i=1,2,3,4
L0 y= mvp y = Median{mvi y} , i=1,2,3,4
이 때, 움직임 벡터를 예측하기 위해 이웃 블록을 이용하는 형태에 따라서 중간값 함수에서 이용할 수 있는 인접 블록의 움직임 벡터의 개수가 달라지게 된다.
예를 들어, 도 7(a)의 경우는 i= 1, 2, 3, 4 가 되고 도 7(b)의 경우에는 i= 2, 3, 4 가 된다.
도 8 은 본 발명에서 제안하는 고속 움직임 추정 방법을 실행하기 위한 흐름도이다.
초기 단계에서는 현재 검색창의 중심점(원점)에 대하여 현재 블록과 이전 프레임에서 현재 검색창에 대응하는 가장 닮은 정합블록 간의 화소차의 절대값의 합( 이하, "SAD(sum of absolute difference)"라 한다.)을 계산하여 기설정된 임계값(Th)와 비교한다(S810).
Figure 112005031408038-pat00004
여기서, Bc(i,j)는 현재 움직임 추정을 위한 블록이고, Br(i,j)는 이전 프레임에서 검색 범위 내의 위치에서의 해당 블록을 나타낸다.
SAD 가 임계값보다 적은 경우 현재의 원점을 최적의 움직임 벡터로 결정하고 더 이상의 검색은 수행하지 않는다(S811, S870). 즉, 현재 프레임이 이전 프레임과 비교할 때 영상의 움직임이 없는 정지 영상으로 간주하게 된다.
그러나, SAD 가 임계값보다 큰 경우 두 프레임 간에 물체나 배경의 이동이 있는 것으로 간주하여 프레임 간에 이동이 발생하였다고 판단하여 초기 검색단계를 수행한다(S820).
초기 검색단계에서는 도 10 에 도시된 바와 같이 이웃한 블록의 움직임 정보를 활용하여 구해진 예측된 움직임 벡터(Predicted MV(mvp x, mvp y) ) 정보를 이용하여 검색 패턴을 생성한다(S820).
원점, 루드 패턴 형태의 4개의 점 그리고 예측된 움직임 벡터 지점까지 모두 6개의 점을 검색한 이후 최소 SAD 값을 갖는 점을 추출한다.
추출된 최소 SAD를 지닌 지점이 현재 검색 패턴의 중앙점과 일치하는 경우 상기 중앙점이 움직임 벡터로 결정되고 검색은 중단된다(S831, S870).
그렇지 않은 경우 상기 추출된 최소 SAD점을 중앙으로 정렬한 후 반복 검색을 하게 된다(S832).
반복 검색 단계(S840)는 크게 원점 정렬 단계(S841), 적응적 패턴 설정 단계(S842), 적응적 패턴 크기 설정 단계(S843)를 포함한다.
원점 정렬 단계(S841)에서는 이전 단계에서 구해진 최소 SAD 점을 현재의 검색 패턴의 중앙으로 정렬한다.
적응적 패턴 설정 단계(S842)에서는 현재의 검색 윈도우의 중앙에서 어느 방향에 최소점이 검출되는가에 따라서 다음 검색 패턴을 쿼터 루드 검색 패턴(Quarter Rood Search Pattern) 또는 해프 루드 검색 패턴(Half Rood Search Pattern)의 형태로 검색한다.
즉, 적응적 패턴 설정부에서는 각 탐색점의 에러가 정확한 움직임 벡터에서 멀어질수록 커지는 것을 의미하는 단일 모드 왜곡면(uni-modal distortion surface) 가정에 의해 그 방향성을 고려하여 생성되는 쿼터 루드 검색 패턴과 해프 루드 검색 패턴으로 이루어지는 검색 패턴의 형태를 검색한다. 이에 대하여서는 이후에 보다 상세히 서술하겠다.
적응적 패턴 크기 설정 단계(S843)에서는 적응적 패턴 설정부에서 선택된 검색 패턴의 크기를 결정한다. 즉, 초기 검색 단계 이후에 바로 정규 루드 패턴(Unit-Size rood pattern)검색을 수행하는 것이 아니라, 적응적인 패턴의 크기를 사용한다. 이 때 사용되는 크기는 수학식 3~5 를 참고하여 설명하도록 한다.
Figure 112005031408038-pat00005
Figure 112005031408038-pat00006
여기서,
Figure 112005031408038-pat00007
는 k 번째 반복 검색시에 사용되는 x축 및 y 축 방향 각각의 패턴 크기이다.
Figure 112005031408038-pat00008
,
Figure 112005031408038-pat00009
는 각각 k 번째 검색 패턴의 원점 x 성분과 k+1 번째 검색 패턴의 원점이면서 k 번째, k+1번째 검색 패턴에서 검출된 최소 SAD 점의 x 성분이다.
< > 는 현재 계산된 값을 정수로 근사화 하는 함수로서 화소 단위로 패턴 크기를 결정하기 위한 연산이다.
Figure 112005031408038-pat00010
는 가중치로서 실제 어느 정도로 검색 영역의 크기를 감소시켜줄 것인가를 나타내는 값이며 다음의 조건을 만족하여야 한다.
Figure 112005031408038-pat00011
Figure 112005031408038-pat00012
가 1보다 큰 값을 갖는 경우, 패턴 크기의 감쇄가 약화되어 검색점의 수가 증가하게 될 수 있으므로 속도 향상이 예측되기 어렵다. 또한
Figure 112005031408038-pat00013
가 0보다 작은 값을 갖는 경우, 초기 검색 이후 다음 반복 검색시에 정규 루드 패턴 크기가 되므로, 본 발명에서 사용하는 적응적인 패턴의 크기를 획득하기 어렵다.
따라서,
Figure 112005031408038-pat00014
가 상기 수학식 4의 범위 내인 경우 검색 범위를 좁혀가는 기능을 수행하며, 실험적으로는 0.6에서 0.7 을 사용한다.
결과적으로 수학식 3과 수학식 4에 따라 큰 움직임을 지닌 비디오 시퀀스에서 반복 검색시 검색 루드 패턴의 크기가 1인 정규 루드 패턴(Unit-Size rood pattern)검색을 반복 수행하는 것이 아니라, 초기 검색 패턴 크기와 정규 검색 패턴 크기인 1 사이의 임의의 정수값을 지닌 패턴 크기 검색이 반복되면서 최종적으로 정규 크기인 1로 설정된 검색을 수행하게 된다.
또한 매 반복검색시 화소 단위의 패턴이 생성되어야 하므로, 구해진 패턴의 크기는 수학식 5를 만족하여야 한다.
Figure 112005031408038-pat00015
상기 반복 검색 단계(S840)에서 결정된 검색 패턴 및 크기를 이용하여 최소 SAD 점을 검색한다(S850). 검색한 최소 SAD 점이 현재 검색 패턴의 중앙점인지 여부를 비교하고(S860), 중앙점인 경우에는 그 중앙점이 움직임 벡터(MV)로 결정되고 검색은 종료된다(S870, S880).
검색한 최소 SAD 점이 현재 검색 패턴의 중앙점이 아닌 경우 현재 최소 SAD 점을 중앙으로 정렬 한 후 반복 검색을 수행한다(S861, S840).
도 9 는 적응적 루드 패턴 검색기법 중 초기 검색 단계 검색 패턴을 도시한다.
도 10 은 적응적 루드 패턴 검색기법 중 정규 루드 검색 패턴(Unit-size rood pattern)을 도시한다.
도 11 는 단일 모드 왜곡면(uni-modal distortion surface) 가정에 의한 1차원적 도시이다.
도면에서 볼 수 있는 바와 같이 이전 단계에서 xp k가 최소점으로 선택된 후 다음 단계 즉, k+1번째 검색에서는 좌우의 두 점중 -xp k는 검색할 필요가 없는 점이 됨을 알 수 있다.
이 개념을 2차원적으로 확장하여 도시한 것이 도 12 및 도 13 이다.
즉 에러 표면의 방향성을 충분히 고려함으로써 방향성이 고려된 검색점만을 검색함으로써 검색점의 수를 감소시킬 수 있다. 이러한 검색점의 감소는 비디오 코덱에서 움직임 추정 부분의 계산 시간을 감소시켜 고속화 하는 기능을 한다.
도 12 는 쿼터 루드 검색 패턴(Quarter Rood Search Pattern)의 4 가지 경우를 도시한다.
도 13 은 해프 루드 검색 패턴(Half Rood Search Pattern)의 4 가지 경우를 도시한다.
적응적 패턴 설정부(S842)에서는 현재의 검색 윈도우 중앙에서 어느 방향에 최소점이 검출되는가에 따라서 다음 검색 패턴을 쿼터 루드 검색 패턴으로 할 것인지 해프 루드 검색 패턴으로 할 것인지를 정한다.
그럼으로써 종래에는 루드 패턴의 좌, 우, 상, 하의 4개의 검색점을 모두 검색하였으나, 상기 쿼터 루드 검색 패턴 내지 해프 루드 검색 패턴을 이용함으로써 루드 패턴의 4개 검색점들 중 일부만을 검색하여 최적의 검색점을 찾으므로 검색점의 수가 매 블록마다 평균 2~3개 정도의 감소됨을 볼 수 있다.
도 14 는 검색 패턴 길이 조절에 의한 최적의 검색점을 찾는 일 실시예를 1차원적으로 도시한다.
적응적 루드 패턴 검색기법 중 초기 검색 단계 검색 패턴이후 바로 정규 루드 패턴을 사용하지 않고 움직임이 큰 시퀀스에 대응하기 위해 검색 패턴의 크기를 검색 단계가 반복되는 단계별로 감소시킴으로써 국부적 최소점에 빠지지 않고 O1 ->O2 -> ...-> O5-> 최적의 해(
Figure 112005031408038-pat00016
)에 도달하게 된다.
따라서, 본 발명에 의한 적응적 루드 패턴 검색 기법을 이용함으로써 최소의 에러로 현재 블록을 압축하게 되므로 화질이 향상되며, 본 발명에서는 이러한 개념을 2차원적으로 확장시켜서 이용한다.
도 15 은 본 발명의 개선된 적응적 루드 패턴 검색 기법을 이용하여 움직임 벡터를 결정하는 것을 도시한다.
개선된 적응적 루드 검색 기법을 이용하여 고속 움직임 추정 방법을
Figure 112005031408038-pat00017
=0.6 인 일 실시예를 들어 구체적으로 설명하면 다음과 같다.
초기 검색단계에서는 먼저 O0점에 대한 SAD 값을 계산하고 기 설정된 임계값 (TH)과 비교하여 작은 값이면 움직임 벡터는 (0,0)으로 결정하고 아니면 <수학식 2>에 의해서 결정된 초기 패턴에 의한 검색을 수행한다.
도 15 에 도시된 6개의 점((
Figure 112005031408038-pat00018
)원점, 루드 패턴 검색점, 예측된 벡터 지점)을 검색한다. 각 점에서 SAD 값을 계산하고 최소 SAD 값을 갖는 점을 다음 검색 단계의 원점으로 정렬한다. 도 15에서는 움직임 예측 벡터에 의한 지점(O1)이 된다.
정렬된 원점을 이용하여, <수학식 3>에 의하여 패턴의 크기를 다음과 같이 구한다.
Figure 112005031408038-pat00019
상기와 같이 패턴의 크기를 계산한 후, 제안된 패턴 중 원점 주위의 4개의 다이아몬드 형태의 점들 중 검은 색 다이아몬드 점(
Figure 112005031408038-pat00020
)들만, 즉 쿼터 루드 검색 패턴에 해당하는 점들을 검색한다.
마찬가지로 최소 SAD 점을 검색하여 이 점을 다음 검색 시의 원점으로 정렬한다(O2). 최소 SAD 점이 현재의 검색 패턴의 원점이면 최소 SAD 점인 현재의 원점이 최적의 움직임 벡터가 되고, 그렇지 않으며 다시 반복검색을 수행한다.
정렬된 원점을 이용하여 위의 식에 의해서 패턴의 크기는 다음과 같이 구해진다.
Figure 112005031408038-pat00021
또한, 제안된 패턴들 중에서 해프-루드 검색 패턴인 주의의 3개의 점(
Figure 112005031408038-pat00022
)들을 검색한다. 마찬가지로 최소 SAD 점을 검색하여 이 점을 다음 검색 시의 원점으로 정렬한다. 최소 SAD 점이 현재의 검색 패턴의 원점이면, 최소 SAD 점인 현재의 원점이 최적의 움직임 벡터가 되고, 그렇지 않으면 다시 반복검색을 수행한다.
도 16 은 고속움직임 추정 장치의 개략도이다.
고속 움직임 추정 장치(1600)은 판단부(1610), 초기 검색부(1620), 반복 검색부(1630)로 구성된다. 또한 반복 검색부(1630)는 현재 검색 패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수를 결정하는 탐색 위치의 수 결정부(1640)와 검색 패턴 크기 설정부(1650)를 포함한다.
판단부(1610)에서는 현재 검색창의 중심점(원점)에 대하여 현재 블록과 이전 프레임에서 현재 검색창에 대응하는 가장 닮은 정합블록 간의 화소차의 SAD를 계산하여 기설정된 임계값(Th)과 비교한다.
SAD 가 임계값보다 적은 경우 현재의 원점을 최적의 움직임 벡터로 결정하고 더 이상의 검색은 수행하지 않는다.
초기 검색부(1620)는 SAD 가 임계값보다 큰 경우 두 프레임 간에 물체나 배경의 이동이 있는 것으로 간주하여 원점, 루드 패턴 형태의 4개의 점 그리고 예측된 움직임 벡터 지점까지 모두 6개의 점을 검색한 이후 최소 SAD 값을 갖는 점을 추출한다. 그 후 추출된 최소 SAD를 지닌 지점이 현재 검색 패턴의 중앙점과 일치하는 경우 상기 중앙점이 움직임 벡터로 결정되고 검색은 중단된다.
반복 검색부(1630)는 최소 SAD를 지닌 지점이 현재 검색 패턴의 중앙점과 일치하지 않는 경우 최소 SAD점을 중앙으로 정렬한 후 반복 검색을 수행한다.
이 때, 탐색 위치의 수 결정부(1640)는 현재의 검색 패턴의 중앙점이 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 최소점이 검출되는가에 따라서 다음 검색 패턴을 쿼터 루드 검색 패턴(Quarter Rood Search Pattern) 또는 해프 루드 검색 패턴(Half Rood Search Pattern)의 형태로 검색한다.
즉, 각 탐색점의 에러가 정확한 움직임 벡터에서 멀어질수록 커지는 것을 의미하는 단일 모드 왜곡면(uni-modal distortion surface) 가정에 의해 그 방향성을 고려하여 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 1,2,3,4 사분면에 위치하는 경우 2개의 탐색 위치의 수를 검출하는 쿼터 루드 검색 패턴을 이용하고, 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 x축 또는 y 축 상에 위치하는 경우 3개의 탐색 위치의 수를 검출하는 해프 루드 검색 패턴을 이용하여 검색한다.
검색 패턴 크기 설정부(1650)에서는 탐색 위치의 수 결정부(1640)에서 결정 된 패턴의 형태마다 검색 패턴의 크기를 결정한다. 이 때, 검색 패턴의 크기는 위에서 서술한 수학식 3~5 와 동일하며, 관련 설명은 이에 관한 부분에 기술된 바와 기술적 구성이 거의 동일하거나 유사한바, 이를 참고하기로 한다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이상 도면과 명세서에서 최적 실시예들이 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
본 발명의 고속 움직임 예측 장치 및 고속 움직임 예측 방법은 블록기반 비 디오 압축 시스템에서 블록 단위별 움직임을 추정하는데 있어서 그 속도를 향상시킴으로써 소프트웨어적인 비디오 압축 시스템의 실시간 압축 기능을 향상시키는 효과를 발생한다.
또한 본 발명에서 제안된 검색 패턴의 형태와 크기를 적응적으로 설정함으로써 속도를 개선시키는 효과를 발생시키는 본 발명의 기법은 기존의 다른 고속 패턴 검색 기법인 3SS, E3SS, 4SS 등에도 적용이 가능하므로 기존의 블록 기반의 MPEG 계열 비디오 압축 시스템에서 적용이 가능한 효과가 발생한다.
본 발명에서는 매 검색 단계에서 이웃한 블록의 움직임 정보를 기초로 움직임 예측 정보를 활용하고, 적응적으로 검색 패턴을 해프 루드 검색 패턴 내지 쿼터루드 검색 패턴을 선택하며 각 검색 패턴의 그 크기를 조절함으로써 화질의 열화가 없이 검색점 수를 휠씬 효과적으로 감소시키는 효과가 발생한다.
또한 움직임이 큰 영상에 대해서도 매 반복 검색마다 패턴의 형태와 크기를 적응적으로 설정함으로써 기존의 기법들보다 좋은 화질을 유지하는 효과가 발생한다.

Claims (13)

  1. SAD 값이 소정 임계치보다 큰지 판단하는 단계;
    상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색 단계;및
    상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색단계;를 포함하는 것을 특징으로 하는 고속 움직임 예측 방법.
  2. 제 1 항에 있어서, 상기 반복 검색단계는
    상기 SAD 값은 최적의 움직임 벡터에서 멀어질수록 단조 증가하며, 상기 탐색 위치의 수 설정시 탐색위치에서 예측 가능한 단조 증가된 SAD 값을 지닌 지점은 제외하는 것을 특징으로 하는 고속 움직임 예측 방법.
  3. 제 1 항에 있어서, 상기 반복 검색단계는
    상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 1,2,3,4 사분면에 위치하는 경우 2 개의 탐색 위치의 수를 검출하는 쿼터 루드 검색 패턴을 이용하고,
    상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 x 축 또는 y축 상에 위치하는 경우 3 개의 탐색 위치의 수를 검출하는 해프 루드 검색 패턴을 이용하는 것을 특징으로 하는 고속 움직임 예측 방법.
  4. 제 1 항에 있어서, 상기 반복 검색단계는
    반복 검색의 회수에 따라 상기 현재 검색 패턴의 크기가 역비례하여 감소하며, 상기 현재 검색 패턴의 크기는 소정 임계 크기 이상인 것을 특징으로 하는 고속 움직임 예측 방법.
  5. 제 1 항에 있어서, 상기 반복 검색단계에서 상기 검색 패턴의 크기는
    Figure 112005031408038-pat00023
    Figure 112005031408038-pat00024
    이며,
    여기서, x축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 x 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 x성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값이고,
    y 축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 y 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 y성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값인 것을 특징으로 하는 고속 움직임 예측 방법.
  6. 제 5 항에 있어서, k 번째 반복 검색시 x 축 및 y 축 검색 패턴의 크기는
    Figure 112005031408038-pat00025
    것을 특징으로 하는 고속 움직임 예측 방법.
  7. 현재 프레임의 현재 블록의 화소값과 이전 프레임 검색창에서 상기 현재 블록에 대응하는 정합 블럭의 화소값과의 차를 합산한 값(이하, SAD)이 소정 임계치보다 큰지 판단하는 판단부;
    상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색부; 및
    상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색부;를 포함하는 것을 특징으로 하는 고속 움직임 예측 장치.
  8. 제 7 항에 있어서, 상기 현재 검색 패턴의 복수의 탐색 위치는
    다이아몬드 형태의 4개의 검색점과, 원점 및 움직임 예측 지점을 포함하는 것을 특징으로 하는 고속 움직임 예측 장치.
  9. 제 7 항에 있어서, 상기 반복 검색부에서
    상기 SAD 값은 최적의 움직임 벡터에서 멀어질수록 단조 증가하며, 상기 탐색 위치의 수 설정시 탐색위치에서 예측 가능한 단조 증가된 SAD 값을 지닌 지점은 제외하는 것을 특징으로 하는 고속 움직임 예측 장치.
  10. 제 7 항에 있어서, 상기 반복 검색부는
    상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 1,2,3,4 사분면에 위치하는 경우 2 개의 탐색 위치의 수를 검출하는 쿼터 루드 검색 패턴을 이용하고,
    상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 x 축 또는 y축 상에 위치하는 경우 3 개의 탐색 위치의 수를 검출하는 해프 루드 검색 패턴을 이용하는 것을 특징으로 하는 고속 움직임 예측 장치.
  11. 제 7 항에 있어서, 상기 반복 검색부는
    반복 검색의 회수에 따라 상기 현재 검색 패턴의 크기가 역비례하여 감소하고, 상기 현재 검색 패턴의 크기는 소정 임계 크기 이상인 것을 특징으로 하는 고속 움직임 예측 장치.
  12. 제 7 항에 있어서, 상기 반복 검색부에서 상기 검색 패턴의 크기는
    Figure 112005031408038-pat00026
    Figure 112005031408038-pat00027
    이며,
    여기서, x축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 x 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 x성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값이고,
    y 축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 y 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 y성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값인 것을 특징으로 하는 고속 움직임 예측 장치.
  13. 제 12 항에 있어서, k 번째 반복 검색시 x 축 및 y 축 검색 패턴의 크기는
    Figure 112005031408038-pat00028
    것을 특징으로 하는 고속 움직임 예측 장치.
KR1020050051088A 2005-06-14 2005-06-14 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법 KR100639995B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020050051088A KR100639995B1 (ko) 2005-06-14 2005-06-14 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법
US11/243,095 US7869518B2 (en) 2005-06-14 2005-10-04 Fast motion estimation apparatus and method using block matching algorithm

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050051088A KR100639995B1 (ko) 2005-06-14 2005-06-14 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR100639995B1 true KR100639995B1 (ko) 2006-10-31

Family

ID=37524086

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050051088A KR100639995B1 (ko) 2005-06-14 2005-06-14 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법

Country Status (2)

Country Link
US (1) US7869518B2 (ko)
KR (1) KR100639995B1 (ko)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9743078B2 (en) 2004-07-30 2017-08-22 Euclid Discoveries, Llc Standards-compliant model-based video encoding and decoding
US20070199011A1 (en) * 2006-02-17 2007-08-23 Sony Corporation System and method for high quality AVC encoding
US7912129B2 (en) * 2006-03-16 2011-03-22 Sony Corporation Uni-modal based fast half-pel and fast quarter-pel refinement for video encoding
US20080137746A1 (en) * 2006-05-23 2008-06-12 Chang-Che Tsai Method for Predicting Performance of Patterns Used in Block Motion Estimation Procedures
US20080130749A1 (en) * 2006-05-23 2008-06-05 Chang-Che Tsai Method for Performing Pattern-Based Block Motion Estimation
US20070274390A1 (en) * 2006-05-23 2007-11-29 Chang-Che Tsai System for Performing Pattern-Based Block Motion Estimation
US20080002772A1 (en) * 2006-06-28 2008-01-03 Hong Kong Applied Science and Technology Research Institute Company Limited Motion vector estimation method
KR100912429B1 (ko) * 2006-11-09 2009-08-14 삼성전자주식회사 고속 움직임 추정을 위한 영상 검색 방법
US8804757B2 (en) * 2007-12-26 2014-08-12 Intel Corporation Configurable motion estimation
KR100949917B1 (ko) * 2008-05-28 2010-03-30 한국산업기술대학교산학협력단 적응적 인트라 예측을 통한 고속 부호화 방법 및 시스템
US8094714B2 (en) * 2008-07-16 2012-01-10 Sony Corporation Speculative start point selection for motion estimation iterative search
US8144766B2 (en) * 2008-07-16 2012-03-27 Sony Corporation Simple next search position selection for motion estimation iterative search
KR101299249B1 (ko) * 2008-08-29 2013-08-22 삼성테크윈 주식회사 디지털 촬영장치, 그 제어방법 및 제어방법을 실행시키기 위한 프로그램을 저장한 기록매체
WO2010036995A1 (en) * 2008-09-29 2010-04-01 Dolby Laboratories Licensing Corporation Deriving new motion vectors from existing motion vectors
US8363727B2 (en) * 2008-09-30 2013-01-29 Microsoft Corporation Techniques to perform fast motion estimation
TWI401970B (zh) * 2008-10-14 2013-07-11 Univ Nat Taiwan 在多媒體系統晶片設計中的低電量且高效率的快速移動評估超大型積體電路
TWI442775B (zh) * 2009-02-05 2014-06-21 Acer Inc 執行移動評估之低功率高效能視頻編碼方法
US8320454B2 (en) * 2009-02-12 2012-11-27 Ceva D.S.P. Ltd. Fast sub-pixel motion estimation
TWI389575B (zh) * 2009-02-18 2013-03-11 Acer Inc 即時嵌入式多媒體設計之移動評估方法
KR101661981B1 (ko) * 2009-11-09 2016-10-10 엘지전자 주식회사 영상표시장치 및 그 동작방법
US8488007B2 (en) * 2010-01-19 2013-07-16 Sony Corporation Method to estimate segmented motion
US8285079B2 (en) * 2010-03-19 2012-10-09 Sony Corporation Method for highly accurate estimation of motion using phase correlation
EP2559243B1 (en) * 2010-04-13 2014-08-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A video decoder and a video encoder using motion-compensated prediction
US8971634B2 (en) * 2012-10-26 2015-03-03 Texas Instruments Incorporated Approximate pyramidal search for fast displacement matching
CN103414899B (zh) * 2013-08-16 2016-05-25 武汉大学 一种视频编码的运动估计方法
US9621917B2 (en) * 2014-03-10 2017-04-11 Euclid Discoveries, Llc Continuous block tracking for temporal prediction in video encoding
US10091507B2 (en) 2014-03-10 2018-10-02 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
US10097851B2 (en) 2014-03-10 2018-10-09 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
KR102457617B1 (ko) * 2015-09-16 2022-10-21 한화테크윈 주식회사 영상 움직임 추정 방법 및 장치, 영상 안정화 방법 및 장치, 및 컴퓨터 기록매체
TWI733188B (zh) * 2019-09-11 2021-07-11 瑞昱半導體股份有限公司 用於獨立物件之運動估計的裝置以及方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0799658A (ja) 1993-08-03 1995-04-11 Sony Corp 動きベクトル検出装置
KR100286818B1 (ko) 1999-02-11 2001-04-16 이형도 실시간 영상압축을 위한 고속 움직임 예측방법
US7072398B2 (en) * 2000-12-06 2006-07-04 Kai-Kuang Ma System and method for motion vector generation and analysis of digital video clips
US6671319B1 (en) 1999-12-28 2003-12-30 Sony Corporation Methods and apparatus for motion estimation using neighboring macroblocks
US6563874B1 (en) 2000-06-23 2003-05-13 Hitachi America, Ltd. Fast search method for motion estimation
JP4064973B2 (ja) * 2005-03-23 2008-03-19 株式会社東芝 ビデオエンコーダ及びこれを用いた携帯無線端末装置
KR100860690B1 (ko) * 2007-01-26 2008-09-26 삼성전자주식회사 외부 메모리 액세스를 최소화하는 움직임 탐색 방법 및장치

Also Published As

Publication number Publication date
US7869518B2 (en) 2011-01-11
US20060280248A1 (en) 2006-12-14

Similar Documents

Publication Publication Date Title
KR100639995B1 (ko) 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법
US6081209A (en) Search system for use in compression
JP5281891B2 (ja) 適応的な動き検索範囲
EP1147668B1 (en) Improved motion estimation and block matching pattern
JP4002396B2 (ja) 動きベクトル決定方法及び装置
EP0705035B1 (en) Encoding data represented as a multi-dimensional array
US5760846A (en) Apparatus for estimating motion vectors for feature points of a video signal
RU2332809C2 (ru) Устройство кодирования изображения и способ для предсказания сдвига с использованием согласования поворота
KR0171118B1 (ko) 비디오신호 부호화 장치
US8340189B1 (en) Phase correlation based motion estimation in hybrid video compression
EP1228645B1 (en) Adaptive motion vector field coding
US7751482B1 (en) Phase correlation based motion estimation in hybrid video compression
US20020025001A1 (en) Method and apparatus for video coding
JP3655651B2 (ja) データ処理装置
KR20040062331A (ko) 동영상 압축 부호화를 위한 움직임 예측 방법과 그기록매체
US20090304090A1 (en) Method for Scalable Video Coding
KR20050119422A (ko) 움직임 보상에 기반한 입력 영상의 노이즈 예측 및 그장치와, 이를 사용한 노이즈 제거 및 동영상 부호화 방법,이를 수행하기 위한 프로그램이 기록된 기록 매체
KR100994768B1 (ko) 동영상 부호화를 위한 움직임 추정 방법 및 이를 구현하기위한 프로그램이 기록된 기록 매체
JP4417054B2 (ja) 離散コサイン変換係数を参照する動き推定方法及び装置
JP4494803B2 (ja) 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置
KR100723861B1 (ko) 고속 움직임 예측을 위한 고속 모드 검색 장치 및 방법
US20050226329A1 (en) Motion estimation method using multilevel succesive elimination algorithm
US7860165B2 (en) Framework for fine-granular computational-complexity scalable motion estimation
Srinivas et al. Adaptive Order Cross–Square–Hexagonal search and fuzzy tangential-weighted trade-off for H. 264 in motion estimation
Anandan et al. VIDEO COMPRESSION USING ARPS AND FAST DISCRETE CURVELET TRANSFORM FOR MOBILE DEVICES

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee