KR100639995B1 - 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법 - Google Patents
블록 정합 기반의 고속 움직임 예측 장치 및 그 방법 Download PDFInfo
- Publication number
- KR100639995B1 KR100639995B1 KR1020050051088A KR20050051088A KR100639995B1 KR 100639995 B1 KR100639995 B1 KR 100639995B1 KR 1020050051088 A KR1020050051088 A KR 1020050051088A KR 20050051088 A KR20050051088 A KR 20050051088A KR 100639995 B1 KR100639995 B1 KR 100639995B1
- Authority
- KR
- South Korea
- Prior art keywords
- search
- search pattern
- pattern
- point
- center point
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234309—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/43—Hardware specially adapted for motion estimation or compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/533—Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/57—Motion estimation characterised by a search window with variable size or shape
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2355—Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/812—Monomedia components thereof involving advertisement data
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은 일련의 비디오 영상 데이터에서 현재 프레임의 소정 블록에 대응하는 기준 블록을 이전 프레임의 검색창 내의 복수개의 블록 중에서 검출하여 움직임을 예측하는 고속 움직임 예측 장치 및 방법에 관한 것이다. 본 발명에 따른 고속 움직임 예측 장치는 SAD이 소정 임계치보다 큰지 판단하는 판단부, SAD 값이 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색부 및 최소 SAD 값을 지닌 지점이 현재 검색패턴의 중앙점과 상이한 경우, 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색부를 포함한다.
움직임 추정, 블록 정합, 패턴 검색, 단일모드 왜곡면
Description
도 1 은 종래의 적응적 루드 패턴 검색 기법을 이용하여 움직임 벡터를 결정시 국부적 최소점을 가진 예를 도시한다.
도 2 는 움직임 예측 기법이 포함된 일반적인 비디오 인코딩 과정도이다.
도 3 은 블록 정합 알고리듬의 개념을 도시한다.
도 4 는 인접한 두 프레임 사이에서 현재 프레임 I(t)의 블록 Bi(t)에 대해서 이전 프레임 I(t-1)에서의 검색 범위창(search range window)을 도시한다.
도 5 는 15*15 크기 영역의 검색 범위창을 도시한다.
도 6 은 실제 임의의 입력 프레임을 블록단위화부(200)에서 다수의 16*16 으로 분할한 블록을 비디오 코덱에서 차례로 처리하는 순서를 도시한다.
도 7 은 현재 블록 주변의 블록 정보를 사용하기 위하여 이웃 블록들의 위치에 따라 정의된 4가지 경우를 도시하고 있다.
도 8 은 본 발명에서 제안하는 고속 움직임 추정 방법을 실행하기 위한 흐름도이다.
도 9 는 적응적 루드 패턴 검색기법 중 초기 검색 단계 검색 패턴을 도시한 다.
도 10 은 적응적 루드 패턴 검색기법 중 정규 루드 검색 패턴(Unit-size rood pattern)을 도시한다.
도 11 는 단일 모드 왜곡면(uni-modal distortion surface) 가정에 의한 1차원적 도시이다.
도 12 는 쿼터 루드 검색 패턴(Quarter Rood Search Pattern)의 4 가지 경우를 도시한다.
도 13 은 해프 루드 검색 패턴(Half Rood Search Pattern)의 4 가지 경우를 도시한다.
도 14 는 검색 패턴 길이 조절에 의한 최적의 검색점을 찾는 일 실시예를 1차원적으로 도시한다.
도 15 은 본 발명의 개선된 적응적 루드 패턴 검색 기법을 이용하여 움직임 벡터를 결정하는 것을 도시한다.
도 16 은 고속 움직임 추정 장치의 개략도이다.
본 발명은 블록 정합 알고리듬을 이용한 실시간 비디오 압축을 위한 고속 움직임 추정 기법에 관한 것이다. 보다 상세히, 본 발명은 일련의 비디오 영상 데이터에서 현재 프레임의 소정 블록에 대응하는 기준 블록을 이전 프레임의 검색창 내 의 복수개의 블록 중에서 검출하여 움직임을 예측하는 고속 움직임 예측 장치 및 방법에 관한 것이다.
움직임 추정 기법 중 가장 많이 사용되는 블록 정합 알고리듬(block-matching algorithm)은 현재 프레임을 여러 개의 기준블록(reference block)으로 분할하여 이전 프레임의 검색 윈도우(search window)안에서 가장 닮은 블록을 찾아 기준블록에 대한 상대 위치를 움직임 벡터(motion vector)로 정한 후 두 블록간의 화소값 차이와 움직임 벡터만을 전송하는 기법으로 현재의 비디오 압축 표준 기술에서 주로 사용되고 있다.
블록 정합 알고리듬 중에서 완전탐색 알고리듬(full search algorithm)은 기준블록을 탐색영역 내의 모든 블록과 비교하는 방법으로 성능이 우수하고 데이터 흐름과 제어회로가 비교적 간단하다는 장점이 있으나, 탐색영역이 커질 경우 막대한 연산량을 필요로 하는 단점이 있다.
완전탐색 알고리듬의 이러한 단점을 보완하기 위해 많은 고속탐색 알고리듬(fast algorithm)이 제안되고 있다. 고속 패턴 검색 기법들은 대부분 움직임 벡터의 분포 특성을 활용하여 그 패턴을 생성함으로써 속도를 향상시키고 있다. 그 중에서 적응적 루드 패턴 검색기법은 매우 움직임 추정 속도가 빠르고 화질의 열화도 적은 방법으로 알려져 있다.
종래의 적응적 루드 패턴 검색기법은 두 가지의 정형화된 검색 패턴을 이용하였다. 즉 정교화 검색 단계에서 정규 루드 패턴(다이아몬드 패턴)을 이용하여 반복 검색을 수행하였다.
이러한 종래의 적응적 루드 패턴 기법은 움직임이 큰 비디오 시퀀스의 경우 실제 발생할 수 있는 국부적 최소점에 쉽게 포획됨으로써 화질의 열화를 심화시킬 수 있는 문제점이 있다.
도 1은 종래의 적응적 루드 패턴 검색 기법을 이용하여 움직임 벡터를 결정시 국부적 최소점을 가진 예를 도시한다.
먼저 초기 패턴( )을 검색하고 최소점을 다음 검색의 원점(O1)으로 두고 정규 루드 패턴을 적용하여 인접한 화소들( )을 검색한다. 다시 최소점을 다음 검색의 원점(O2)으로 설정하고 인접한 화소들을 검색한다. 이렇게 반복하면 결국 최종점이 국부적 최소점( )에 포획되어 에러 성분이 큰 상태에서 압축이 된다.
이러한 문제점은 비디오 코덱에서는 화질의 열화를 심하시키게 되므로 국부적 최소점에 포획되지 않는 기법이 요구된다.
본 발명은 종래의 두 단계의 검색 패턴을 지닌 적응적 루드 패턴 검색기법(adaptive rood pattern search)의 문제점을 해결하기 위하여, 종래의 적응적 루드 패턴 검색기법의 구조를 개선함으로써 화질의 열화가 거의 없이 검색 속도를 더욱 빠르게 하기 위하여 적응적 검색 길이 설정 기법과 단일모드 왜곡면(uni-modal distortion surface) 가정을 활용한 검색점의 수를 효과적으로 감소시킴으로써 실시간 비디오 압축을 위한 고속 움직임 추정 기법을 제공하고자 한다.
상기의 과제를 해결하기 위하여 본 발명의 바람직한 일 실시예에 따른 고속 움직임 예측 방법은 SAD 값이 소정 임계치보다 큰지 판단하는 단계; 상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색 단계;및 상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색단계;를 포함한다.
상기의 과제를 해결하기 위하여, 본 발명의 바람직한 일 실시예에 따른 고속 움직임 예측 장치는 현재 프레임의 현재 블록의 화소값과 이전 프레임 검색창에서 상기 현재 블록에 대응하는 기준 블럭의 화소값과의 차를 합산한 값(이하, SAD)이 소정 임계치보다 큰지 판단하는 판단부; 상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색부; 및 상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치 의 수 및 검색 패턴의 크기를 설정하는 반복 검색부;를 포함한다.
바람직하게, 상기 반복 검색부에서 상기 SAD 값은 최적의 움직임 벡터에서 멀어질수록 단조 증가하며, 상기 탐색 위치의 수 설정시 탐색위치에서 예측 가능한 단조 증가된 SAD 값을 지닌 지점은 제외하는 것을 특징으로 한다.
또한, 본 발명의 바람직한 일 실시예서 상기 반복 검색부는 반복 검색의 회수에 따라 상기 현재 검색 패턴의 크기가 역비례하여 감소하고, 상기 현재 검색 패턴의 크기는 소정 임계 크기 이상인 것을 특징으로 한다.
상기의 과제를 해결하기 위하여 본 발명의 바람직한 일 실시예는 고속 움직임 예측 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체을 포함한다.
이하 본 발명의 바람직한 실시예가 첨부된 도면들을 참조하여 설명될 것이다. 도면들 중 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 참조번호들 및 부호들로 나타내고 있음에 유의해야 한다.
하기에서 본 발명을 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
도 2 는 움직임 예측 기법이 포함된 일반적인 비디오 인코딩 과정도이다.
도 2 을 참조하여 입력 비디오 신호를 압축하는 과정을 구체적으로 살펴보면 다음과 같다. 블록단위화부(200)는 입력된 비디오의 매 프레임을 블록 단위로 분할한다.
움직임 보상부(220)의 출력과 현재 프레임과의 뺄셈을 취하는 감산부(230), 감산부의 출력을 이산코사인변환부(Discrete cosine transform, 240)를 통과하여 변화시키고 양자화부(250)에서는 변환된 계수들을 양자화 한다.
양자화된 결과를 가변길이 부호화부(variable length coding, 160)를 이용하여 압축 스트림으로 생성한다. 그 후 원 영상으로 복원시키는 역양자화/역이산코사인 변환부(270)와 가산부(280)를 통과하여 영상을 원래의 영상으로 복원 시키고, 복원된 영상(이전 프레임)을 이용하여 움직임 추정부(290)에서 현재 프레임의 움직임을 추정하거나 예측한다.
도 3 은 블록 정합 알고리듬의 개념을 도시한다.
도 3에 도시된 바와 같이, 블록 정합 알고리듬은 현재 프레임을 N×M 크기를 갖는 여러 개의 작은 블록(이하, 기준블록)으로 나눈 다음, 각각의 기준블록을 이전 프레임의 정해진 영역(기준블록이 상하좌우로 -p에서 +(p-1) 화소만큼 이동한 영역, 이하 탐색영역이라 칭함)내에 있는 여러 개의블록과 비교하여 가장 닮은 블록(이하 정합블록이라 칭함)을 찾아내어, 기준블록에 대한 정합블록의 상대 위치를 움직임 벡터로 정하는 기법이다. 이러한 움직임 추정은 두 프레임 간의 상관성을 최대로 제거함으로써 전송해야 할 데이터를 줄이고자 하는 목적이 있다.
도 4 는 인접한 두 프레임 사이에서 현재 프레임 I(t)의 블록 Bi(t)에 대해서 이전 프레임 I(t-1)에서의 검색 범위창(search range window)을 도시한다.
도 5 는 15*15 크기 영역의 검색 범위창을 도시한다.
도 6 은 실제 임의의 입력 프레임을 블록단위화부(200)에서 다수의 16*16 으로 분할한 블록을 비디오 코덱에서 차례로 처리하는 순서를 도시한다.
실제 비디오 압축 시스템에서는 분할한 블록 단위로 처리를 수행하게 된다. 도 6에 도시된 방식은 일반적으로 순차 검색 방식이라 하며, B11.B12,...Bnm으로 순차적으로 좌측상향 방향에서 우측하향 방향으로 스캐닝 한 후 한 블록씩 처리하여 데이터를 압축한다.
도 7 은 현재 블록 주변의 블록 정보를 사용하기 위하여 이웃 블록들의 위치에 따라 정의된 4가지 경우를 도시하고 있다.
도 6의 순차 검색 방식에서 스캐닝 된 좌측 상향 방향의 블록 정보들의 기 검출된 움직임 정보를 이용하여 현재 블록이 영상 프레임에서 어느 위치에서 검색되는 것이 타당한지 예측한다.
도 6 의 순차 검색 방식에서 스캐닝을 통해 얻은 움직임 벡터들의 정보를 활용하기 위하여 도 7 (a)~(d)의 4가지 경우로 분류한다.
도 7 (a) 경우는 하나의 좌-상 블록(m1 x,m1 y), 하나의 상 블록(m2 x,m2 y), 하나의 좌 블록(m4 x,m4 y), 그리고 하나의 우-상 블록(m3 x, m3 y)에 존재하는 움직임 벡터(mvp x, mvp y)를 예측을 위한 정보로 이용한다.
도 7 (b) 경우는 하나의 상 블록(m2 x,m2 y), 하나의 좌 블록(m4 x,m4 y), 그리고 하나의 우-상 블록(m3 x, m3 y)에 존재하는 움직임 벡터(mvp x, mvp y)를 예측을 위한 정보로 이용한다.
본 발명에서는 예측을 위한 정보로 이용하는 상기 블록들의 움직임 벡터의 중간 값(median value) 또는 평균값(average value)를 취함으로써 예측 움직임 벡터를 구한다.
초기 검색 패턴의 크기는 중간값을 이용할 경우 다음과 같이 구해진다.
L0 y= mvp y = Median{mvi y} , i=1,2,3,4
이 때, 움직임 벡터를 예측하기 위해 이웃 블록을 이용하는 형태에 따라서 중간값 함수에서 이용할 수 있는 인접 블록의 움직임 벡터의 개수가 달라지게 된다.
예를 들어, 도 7(a)의 경우는 i= 1, 2, 3, 4 가 되고 도 7(b)의 경우에는 i= 2, 3, 4 가 된다.
도 8 은 본 발명에서 제안하는 고속 움직임 추정 방법을 실행하기 위한 흐름도이다.
초기 단계에서는 현재 검색창의 중심점(원점)에 대하여 현재 블록과 이전 프레임에서 현재 검색창에 대응하는 가장 닮은 정합블록 간의 화소차의 절대값의 합( 이하, "SAD(sum of absolute difference)"라 한다.)을 계산하여 기설정된 임계값(Th)와 비교한다(S810).
여기서, Bc(i,j)는 현재 움직임 추정을 위한 블록이고, Br(i,j)는 이전 프레임에서 검색 범위 내의 위치에서의 해당 블록을 나타낸다.
SAD 가 임계값보다 적은 경우 현재의 원점을 최적의 움직임 벡터로 결정하고 더 이상의 검색은 수행하지 않는다(S811, S870). 즉, 현재 프레임이 이전 프레임과 비교할 때 영상의 움직임이 없는 정지 영상으로 간주하게 된다.
그러나, SAD 가 임계값보다 큰 경우 두 프레임 간에 물체나 배경의 이동이 있는 것으로 간주하여 프레임 간에 이동이 발생하였다고 판단하여 초기 검색단계를 수행한다(S820).
초기 검색단계에서는 도 10 에 도시된 바와 같이 이웃한 블록의 움직임 정보를 활용하여 구해진 예측된 움직임 벡터(Predicted MV(mvp x, mvp y) ) 정보를 이용하여 검색 패턴을 생성한다(S820).
원점, 루드 패턴 형태의 4개의 점 그리고 예측된 움직임 벡터 지점까지 모두 6개의 점을 검색한 이후 최소 SAD 값을 갖는 점을 추출한다.
추출된 최소 SAD를 지닌 지점이 현재 검색 패턴의 중앙점과 일치하는 경우 상기 중앙점이 움직임 벡터로 결정되고 검색은 중단된다(S831, S870).
그렇지 않은 경우 상기 추출된 최소 SAD점을 중앙으로 정렬한 후 반복 검색을 하게 된다(S832).
반복 검색 단계(S840)는 크게 원점 정렬 단계(S841), 적응적 패턴 설정 단계(S842), 적응적 패턴 크기 설정 단계(S843)를 포함한다.
원점 정렬 단계(S841)에서는 이전 단계에서 구해진 최소 SAD 점을 현재의 검색 패턴의 중앙으로 정렬한다.
적응적 패턴 설정 단계(S842)에서는 현재의 검색 윈도우의 중앙에서 어느 방향에 최소점이 검출되는가에 따라서 다음 검색 패턴을 쿼터 루드 검색 패턴(Quarter Rood Search Pattern) 또는 해프 루드 검색 패턴(Half Rood Search Pattern)의 형태로 검색한다.
즉, 적응적 패턴 설정부에서는 각 탐색점의 에러가 정확한 움직임 벡터에서 멀어질수록 커지는 것을 의미하는 단일 모드 왜곡면(uni-modal distortion surface) 가정에 의해 그 방향성을 고려하여 생성되는 쿼터 루드 검색 패턴과 해프 루드 검색 패턴으로 이루어지는 검색 패턴의 형태를 검색한다. 이에 대하여서는 이후에 보다 상세히 서술하겠다.
적응적 패턴 크기 설정 단계(S843)에서는 적응적 패턴 설정부에서 선택된 검색 패턴의 크기를 결정한다. 즉, 초기 검색 단계 이후에 바로 정규 루드 패턴(Unit-Size rood pattern)검색을 수행하는 것이 아니라, 적응적인 패턴의 크기를 사용한다. 이 때 사용되는 크기는 수학식 3~5 를 참고하여 설명하도록 한다.
< > 는 현재 계산된 값을 정수로 근사화 하는 함수로서 화소 단위로 패턴 크기를 결정하기 위한 연산이다.
가 1보다 큰 값을 갖는 경우, 패턴 크기의 감쇄가 약화되어 검색점의 수가 증가하게 될 수 있으므로 속도 향상이 예측되기 어렵다. 또한 가 0보다 작은 값을 갖는 경우, 초기 검색 이후 다음 반복 검색시에 정규 루드 패턴 크기가 되므로, 본 발명에서 사용하는 적응적인 패턴의 크기를 획득하기 어렵다.
결과적으로 수학식 3과 수학식 4에 따라 큰 움직임을 지닌 비디오 시퀀스에서 반복 검색시 검색 루드 패턴의 크기가 1인 정규 루드 패턴(Unit-Size rood pattern)검색을 반복 수행하는 것이 아니라, 초기 검색 패턴 크기와 정규 검색 패턴 크기인 1 사이의 임의의 정수값을 지닌 패턴 크기 검색이 반복되면서 최종적으로 정규 크기인 1로 설정된 검색을 수행하게 된다.
또한 매 반복검색시 화소 단위의 패턴이 생성되어야 하므로, 구해진 패턴의 크기는 수학식 5를 만족하여야 한다.
상기 반복 검색 단계(S840)에서 결정된 검색 패턴 및 크기를 이용하여 최소 SAD 점을 검색한다(S850). 검색한 최소 SAD 점이 현재 검색 패턴의 중앙점인지 여부를 비교하고(S860), 중앙점인 경우에는 그 중앙점이 움직임 벡터(MV)로 결정되고 검색은 종료된다(S870, S880).
검색한 최소 SAD 점이 현재 검색 패턴의 중앙점이 아닌 경우 현재 최소 SAD 점을 중앙으로 정렬 한 후 반복 검색을 수행한다(S861, S840).
도 9 는 적응적 루드 패턴 검색기법 중 초기 검색 단계 검색 패턴을 도시한다.
도 10 은 적응적 루드 패턴 검색기법 중 정규 루드 검색 패턴(Unit-size rood pattern)을 도시한다.
도 11 는 단일 모드 왜곡면(uni-modal distortion surface) 가정에 의한 1차원적 도시이다.
도면에서 볼 수 있는 바와 같이 이전 단계에서 xp k가 최소점으로 선택된 후 다음 단계 즉, k+1번째 검색에서는 좌우의 두 점중 -xp k는 검색할 필요가 없는 점이 됨을 알 수 있다.
이 개념을 2차원적으로 확장하여 도시한 것이 도 12 및 도 13 이다.
즉 에러 표면의 방향성을 충분히 고려함으로써 방향성이 고려된 검색점만을 검색함으로써 검색점의 수를 감소시킬 수 있다. 이러한 검색점의 감소는 비디오 코덱에서 움직임 추정 부분의 계산 시간을 감소시켜 고속화 하는 기능을 한다.
도 12 는 쿼터 루드 검색 패턴(Quarter Rood Search Pattern)의 4 가지 경우를 도시한다.
도 13 은 해프 루드 검색 패턴(Half Rood Search Pattern)의 4 가지 경우를 도시한다.
적응적 패턴 설정부(S842)에서는 현재의 검색 윈도우 중앙에서 어느 방향에 최소점이 검출되는가에 따라서 다음 검색 패턴을 쿼터 루드 검색 패턴으로 할 것인지 해프 루드 검색 패턴으로 할 것인지를 정한다.
그럼으로써 종래에는 루드 패턴의 좌, 우, 상, 하의 4개의 검색점을 모두 검색하였으나, 상기 쿼터 루드 검색 패턴 내지 해프 루드 검색 패턴을 이용함으로써 루드 패턴의 4개 검색점들 중 일부만을 검색하여 최적의 검색점을 찾으므로 검색점의 수가 매 블록마다 평균 2~3개 정도의 감소됨을 볼 수 있다.
도 14 는 검색 패턴 길이 조절에 의한 최적의 검색점을 찾는 일 실시예를 1차원적으로 도시한다.
적응적 루드 패턴 검색기법 중 초기 검색 단계 검색 패턴이후 바로 정규 루드 패턴을 사용하지 않고 움직임이 큰 시퀀스에 대응하기 위해 검색 패턴의 크기를 검색 단계가 반복되는 단계별로 감소시킴으로써 국부적 최소점에 빠지지 않고 O1 ->O2 -> ...-> O5-> 최적의 해()에 도달하게 된다.
따라서, 본 발명에 의한 적응적 루드 패턴 검색 기법을 이용함으로써 최소의 에러로 현재 블록을 압축하게 되므로 화질이 향상되며, 본 발명에서는 이러한 개념을 2차원적으로 확장시켜서 이용한다.
도 15 은 본 발명의 개선된 적응적 루드 패턴 검색 기법을 이용하여 움직임 벡터를 결정하는 것을 도시한다.
초기 검색단계에서는 먼저 O0점에 대한 SAD 값을 계산하고 기 설정된 임계값 (TH)과 비교하여 작은 값이면 움직임 벡터는 (0,0)으로 결정하고 아니면 <수학식 2>에 의해서 결정된 초기 패턴에 의한 검색을 수행한다.
도 15 에 도시된 6개의 점(( )원점, 루드 패턴 검색점, 예측된 벡터 지점)을 검색한다. 각 점에서 SAD 값을 계산하고 최소 SAD 값을 갖는 점을 다음 검색 단계의 원점으로 정렬한다. 도 15에서는 움직임 예측 벡터에 의한 지점(O1)이 된다.
정렬된 원점을 이용하여, <수학식 3>에 의하여 패턴의 크기를 다음과 같이 구한다.
상기와 같이 패턴의 크기를 계산한 후, 제안된 패턴 중 원점 주위의 4개의 다이아몬드 형태의 점들 중 검은 색 다이아몬드 점( )들만, 즉 쿼터 루드 검색 패턴에 해당하는 점들을 검색한다.
마찬가지로 최소 SAD 점을 검색하여 이 점을 다음 검색 시의 원점으로 정렬한다(O2). 최소 SAD 점이 현재의 검색 패턴의 원점이면 최소 SAD 점인 현재의 원점이 최적의 움직임 벡터가 되고, 그렇지 않으며 다시 반복검색을 수행한다.
정렬된 원점을 이용하여 위의 식에 의해서 패턴의 크기는 다음과 같이 구해진다.
또한, 제안된 패턴들 중에서 해프-루드 검색 패턴인 주의의 3개의 점( )들을 검색한다. 마찬가지로 최소 SAD 점을 검색하여 이 점을 다음 검색 시의 원점으로 정렬한다. 최소 SAD 점이 현재의 검색 패턴의 원점이면, 최소 SAD 점인 현재의 원점이 최적의 움직임 벡터가 되고, 그렇지 않으면 다시 반복검색을 수행한다.
도 16 은 고속움직임 추정 장치의 개략도이다.
고속 움직임 추정 장치(1600)은 판단부(1610), 초기 검색부(1620), 반복 검색부(1630)로 구성된다. 또한 반복 검색부(1630)는 현재 검색 패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수를 결정하는 탐색 위치의 수 결정부(1640)와 검색 패턴 크기 설정부(1650)를 포함한다.
판단부(1610)에서는 현재 검색창의 중심점(원점)에 대하여 현재 블록과 이전 프레임에서 현재 검색창에 대응하는 가장 닮은 정합블록 간의 화소차의 SAD를 계산하여 기설정된 임계값(Th)과 비교한다.
SAD 가 임계값보다 적은 경우 현재의 원점을 최적의 움직임 벡터로 결정하고 더 이상의 검색은 수행하지 않는다.
초기 검색부(1620)는 SAD 가 임계값보다 큰 경우 두 프레임 간에 물체나 배경의 이동이 있는 것으로 간주하여 원점, 루드 패턴 형태의 4개의 점 그리고 예측된 움직임 벡터 지점까지 모두 6개의 점을 검색한 이후 최소 SAD 값을 갖는 점을 추출한다. 그 후 추출된 최소 SAD를 지닌 지점이 현재 검색 패턴의 중앙점과 일치하는 경우 상기 중앙점이 움직임 벡터로 결정되고 검색은 중단된다.
반복 검색부(1630)는 최소 SAD를 지닌 지점이 현재 검색 패턴의 중앙점과 일치하지 않는 경우 최소 SAD점을 중앙으로 정렬한 후 반복 검색을 수행한다.
이 때, 탐색 위치의 수 결정부(1640)는 현재의 검색 패턴의 중앙점이 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 최소점이 검출되는가에 따라서 다음 검색 패턴을 쿼터 루드 검색 패턴(Quarter Rood Search Pattern) 또는 해프 루드 검색 패턴(Half Rood Search Pattern)의 형태로 검색한다.
즉, 각 탐색점의 에러가 정확한 움직임 벡터에서 멀어질수록 커지는 것을 의미하는 단일 모드 왜곡면(uni-modal distortion surface) 가정에 의해 그 방향성을 고려하여 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 1,2,3,4 사분면에 위치하는 경우 2개의 탐색 위치의 수를 검출하는 쿼터 루드 검색 패턴을 이용하고, 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 x축 또는 y 축 상에 위치하는 경우 3개의 탐색 위치의 수를 검출하는 해프 루드 검색 패턴을 이용하여 검색한다.
검색 패턴 크기 설정부(1650)에서는 탐색 위치의 수 결정부(1640)에서 결정 된 패턴의 형태마다 검색 패턴의 크기를 결정한다. 이 때, 검색 패턴의 크기는 위에서 서술한 수학식 3~5 와 동일하며, 관련 설명은 이에 관한 부분에 기술된 바와 기술적 구성이 거의 동일하거나 유사한바, 이를 참고하기로 한다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이상 도면과 명세서에서 최적 실시예들이 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
본 발명의 고속 움직임 예측 장치 및 고속 움직임 예측 방법은 블록기반 비 디오 압축 시스템에서 블록 단위별 움직임을 추정하는데 있어서 그 속도를 향상시킴으로써 소프트웨어적인 비디오 압축 시스템의 실시간 압축 기능을 향상시키는 효과를 발생한다.
또한 본 발명에서 제안된 검색 패턴의 형태와 크기를 적응적으로 설정함으로써 속도를 개선시키는 효과를 발생시키는 본 발명의 기법은 기존의 다른 고속 패턴 검색 기법인 3SS, E3SS, 4SS 등에도 적용이 가능하므로 기존의 블록 기반의 MPEG 계열 비디오 압축 시스템에서 적용이 가능한 효과가 발생한다.
본 발명에서는 매 검색 단계에서 이웃한 블록의 움직임 정보를 기초로 움직임 예측 정보를 활용하고, 적응적으로 검색 패턴을 해프 루드 검색 패턴 내지 쿼터루드 검색 패턴을 선택하며 각 검색 패턴의 그 크기를 조절함으로써 화질의 열화가 없이 검색점 수를 휠씬 효과적으로 감소시키는 효과가 발생한다.
또한 움직임이 큰 영상에 대해서도 매 반복 검색마다 패턴의 형태와 크기를 적응적으로 설정함으로써 기존의 기법들보다 좋은 화질을 유지하는 효과가 발생한다.
Claims (13)
- SAD 값이 소정 임계치보다 큰지 판단하는 단계;상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색 단계;및상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색단계;를 포함하는 것을 특징으로 하는 고속 움직임 예측 방법.
- 제 1 항에 있어서, 상기 반복 검색단계는상기 SAD 값은 최적의 움직임 벡터에서 멀어질수록 단조 증가하며, 상기 탐색 위치의 수 설정시 탐색위치에서 예측 가능한 단조 증가된 SAD 값을 지닌 지점은 제외하는 것을 특징으로 하는 고속 움직임 예측 방법.
- 제 1 항에 있어서, 상기 반복 검색단계는상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 1,2,3,4 사분면에 위치하는 경우 2 개의 탐색 위치의 수를 검출하는 쿼터 루드 검색 패턴을 이용하고,상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 x 축 또는 y축 상에 위치하는 경우 3 개의 탐색 위치의 수를 검출하는 해프 루드 검색 패턴을 이용하는 것을 특징으로 하는 고속 움직임 예측 방법.
- 제 1 항에 있어서, 상기 반복 검색단계는반복 검색의 회수에 따라 상기 현재 검색 패턴의 크기가 역비례하여 감소하며, 상기 현재 검색 패턴의 크기는 소정 임계 크기 이상인 것을 특징으로 하는 고속 움직임 예측 방법.
- 제 1 항에 있어서, 상기 반복 검색단계에서 상기 검색 패턴의 크기는여기서, x축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 x 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 x성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값이고,y 축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 y 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 y성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값인 것을 특징으로 하는 고속 움직임 예측 방법.
- 현재 프레임의 현재 블록의 화소값과 이전 프레임 검색창에서 상기 현재 블록에 대응하는 정합 블럭의 화소값과의 차를 합산한 값(이하, SAD)이 소정 임계치보다 큰지 판단하는 판단부;상기 SAD 값이 상기 소정 임계치보다 큰 경우, 현재 검색 패턴의 복수의 탐색 위치로부터 최소 SAD 값을 지닌 지점을 검색하고 상기 검색된 최소 SAD 값을 지닌 지점이 상기 현재 검색 패턴의 중앙점과 일치하는지 판단하는 초기 검색부; 및상기 최소 SAD 값을 지닌 지점이 상기 현재 검색패턴의 중앙점과 상이한 경우, 상기 최소 SAD 값이 위치된 지점을 현재 검색패턴의 중앙점으로 갱신하고 갱신된 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 어느 방향에 위치하는지에 따라 탐색 위치의 수 및 검색 패턴의 크기를 설정하는 반복 검색부;를 포함하는 것을 특징으로 하는 고속 움직임 예측 장치.
- 제 7 항에 있어서, 상기 현재 검색 패턴의 복수의 탐색 위치는다이아몬드 형태의 4개의 검색점과, 원점 및 움직임 예측 지점을 포함하는 것을 특징으로 하는 고속 움직임 예측 장치.
- 제 7 항에 있어서, 상기 반복 검색부에서상기 SAD 값은 최적의 움직임 벡터에서 멀어질수록 단조 증가하며, 상기 탐색 위치의 수 설정시 탐색위치에서 예측 가능한 단조 증가된 SAD 값을 지닌 지점은 제외하는 것을 특징으로 하는 고속 움직임 예측 장치.
- 제 7 항에 있어서, 상기 반복 검색부는상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 1,2,3,4 사분면에 위치하는 경우 2 개의 탐색 위치의 수를 검출하는 쿼터 루드 검색 패턴을 이용하고,상기 현재 검색패턴의 중앙점이 상기 이전 프레임의 검색창 내의 중앙점에 대하여 상대적으로 x 축 또는 y축 상에 위치하는 경우 3 개의 탐색 위치의 수를 검출하는 해프 루드 검색 패턴을 이용하는 것을 특징으로 하는 고속 움직임 예측 장치.
- 제 7 항에 있어서, 상기 반복 검색부는반복 검색의 회수에 따라 상기 현재 검색 패턴의 크기가 역비례하여 감소하고, 상기 현재 검색 패턴의 크기는 소정 임계 크기 이상인 것을 특징으로 하는 고속 움직임 예측 장치.
- 제 7 항에 있어서, 상기 반복 검색부에서 상기 검색 패턴의 크기는여기서, x축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 x 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 x성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값이고,y 축 검색 패턴의 크기는 k번째 검색 패턴의 중앙점 y 성분과 k+1 번째 검색 패턴의 중앙점이면서 동시에 k번째 검색 패턴에서 검출된 최소 SAD점인 y성분과의 절대값의 차이에 0과 1 사이의 가중치값을 곱한 결과값을 최대 정수로 근사화한 값인 것을 특징으로 하는 고속 움직임 예측 장치.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050051088A KR100639995B1 (ko) | 2005-06-14 | 2005-06-14 | 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법 |
US11/243,095 US7869518B2 (en) | 2005-06-14 | 2005-10-04 | Fast motion estimation apparatus and method using block matching algorithm |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050051088A KR100639995B1 (ko) | 2005-06-14 | 2005-06-14 | 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100639995B1 true KR100639995B1 (ko) | 2006-10-31 |
Family
ID=37524086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050051088A KR100639995B1 (ko) | 2005-06-14 | 2005-06-14 | 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7869518B2 (ko) |
KR (1) | KR100639995B1 (ko) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9743078B2 (en) | 2004-07-30 | 2017-08-22 | Euclid Discoveries, Llc | Standards-compliant model-based video encoding and decoding |
US20070199011A1 (en) * | 2006-02-17 | 2007-08-23 | Sony Corporation | System and method for high quality AVC encoding |
US7912129B2 (en) * | 2006-03-16 | 2011-03-22 | Sony Corporation | Uni-modal based fast half-pel and fast quarter-pel refinement for video encoding |
US20080137746A1 (en) * | 2006-05-23 | 2008-06-12 | Chang-Che Tsai | Method for Predicting Performance of Patterns Used in Block Motion Estimation Procedures |
US20080130749A1 (en) * | 2006-05-23 | 2008-06-05 | Chang-Che Tsai | Method for Performing Pattern-Based Block Motion Estimation |
US20070274390A1 (en) * | 2006-05-23 | 2007-11-29 | Chang-Che Tsai | System for Performing Pattern-Based Block Motion Estimation |
US20080002772A1 (en) * | 2006-06-28 | 2008-01-03 | Hong Kong Applied Science and Technology Research Institute Company Limited | Motion vector estimation method |
KR100912429B1 (ko) * | 2006-11-09 | 2009-08-14 | 삼성전자주식회사 | 고속 움직임 추정을 위한 영상 검색 방법 |
US8804757B2 (en) * | 2007-12-26 | 2014-08-12 | Intel Corporation | Configurable motion estimation |
KR100949917B1 (ko) * | 2008-05-28 | 2010-03-30 | 한국산업기술대학교산학협력단 | 적응적 인트라 예측을 통한 고속 부호화 방법 및 시스템 |
US8094714B2 (en) * | 2008-07-16 | 2012-01-10 | Sony Corporation | Speculative start point selection for motion estimation iterative search |
US8144766B2 (en) * | 2008-07-16 | 2012-03-27 | Sony Corporation | Simple next search position selection for motion estimation iterative search |
KR101299249B1 (ko) * | 2008-08-29 | 2013-08-22 | 삼성테크윈 주식회사 | 디지털 촬영장치, 그 제어방법 및 제어방법을 실행시키기 위한 프로그램을 저장한 기록매체 |
WO2010036995A1 (en) * | 2008-09-29 | 2010-04-01 | Dolby Laboratories Licensing Corporation | Deriving new motion vectors from existing motion vectors |
US8363727B2 (en) * | 2008-09-30 | 2013-01-29 | Microsoft Corporation | Techniques to perform fast motion estimation |
TWI401970B (zh) * | 2008-10-14 | 2013-07-11 | Univ Nat Taiwan | 在多媒體系統晶片設計中的低電量且高效率的快速移動評估超大型積體電路 |
TWI442775B (zh) * | 2009-02-05 | 2014-06-21 | Acer Inc | 執行移動評估之低功率高效能視頻編碼方法 |
US8320454B2 (en) * | 2009-02-12 | 2012-11-27 | Ceva D.S.P. Ltd. | Fast sub-pixel motion estimation |
TWI389575B (zh) * | 2009-02-18 | 2013-03-11 | Acer Inc | 即時嵌入式多媒體設計之移動評估方法 |
KR101661981B1 (ko) * | 2009-11-09 | 2016-10-10 | 엘지전자 주식회사 | 영상표시장치 및 그 동작방법 |
US8488007B2 (en) * | 2010-01-19 | 2013-07-16 | Sony Corporation | Method to estimate segmented motion |
US8285079B2 (en) * | 2010-03-19 | 2012-10-09 | Sony Corporation | Method for highly accurate estimation of motion using phase correlation |
EP2559243B1 (en) * | 2010-04-13 | 2014-08-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A video decoder and a video encoder using motion-compensated prediction |
US8971634B2 (en) * | 2012-10-26 | 2015-03-03 | Texas Instruments Incorporated | Approximate pyramidal search for fast displacement matching |
CN103414899B (zh) * | 2013-08-16 | 2016-05-25 | 武汉大学 | 一种视频编码的运动估计方法 |
US9621917B2 (en) * | 2014-03-10 | 2017-04-11 | Euclid Discoveries, Llc | Continuous block tracking for temporal prediction in video encoding |
US10091507B2 (en) | 2014-03-10 | 2018-10-02 | Euclid Discoveries, Llc | Perceptual optimization for model-based video encoding |
US10097851B2 (en) | 2014-03-10 | 2018-10-09 | Euclid Discoveries, Llc | Perceptual optimization for model-based video encoding |
KR102457617B1 (ko) * | 2015-09-16 | 2022-10-21 | 한화테크윈 주식회사 | 영상 움직임 추정 방법 및 장치, 영상 안정화 방법 및 장치, 및 컴퓨터 기록매체 |
TWI733188B (zh) * | 2019-09-11 | 2021-07-11 | 瑞昱半導體股份有限公司 | 用於獨立物件之運動估計的裝置以及方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0799658A (ja) | 1993-08-03 | 1995-04-11 | Sony Corp | 動きベクトル検出装置 |
KR100286818B1 (ko) | 1999-02-11 | 2001-04-16 | 이형도 | 실시간 영상압축을 위한 고속 움직임 예측방법 |
US7072398B2 (en) * | 2000-12-06 | 2006-07-04 | Kai-Kuang Ma | System and method for motion vector generation and analysis of digital video clips |
US6671319B1 (en) | 1999-12-28 | 2003-12-30 | Sony Corporation | Methods and apparatus for motion estimation using neighboring macroblocks |
US6563874B1 (en) | 2000-06-23 | 2003-05-13 | Hitachi America, Ltd. | Fast search method for motion estimation |
JP4064973B2 (ja) * | 2005-03-23 | 2008-03-19 | 株式会社東芝 | ビデオエンコーダ及びこれを用いた携帯無線端末装置 |
KR100860690B1 (ko) * | 2007-01-26 | 2008-09-26 | 삼성전자주식회사 | 외부 메모리 액세스를 최소화하는 움직임 탐색 방법 및장치 |
-
2005
- 2005-06-14 KR KR1020050051088A patent/KR100639995B1/ko not_active IP Right Cessation
- 2005-10-04 US US11/243,095 patent/US7869518B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7869518B2 (en) | 2011-01-11 |
US20060280248A1 (en) | 2006-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100639995B1 (ko) | 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법 | |
US6081209A (en) | Search system for use in compression | |
JP5281891B2 (ja) | 適応的な動き検索範囲 | |
EP1147668B1 (en) | Improved motion estimation and block matching pattern | |
JP4002396B2 (ja) | 動きベクトル決定方法及び装置 | |
EP0705035B1 (en) | Encoding data represented as a multi-dimensional array | |
US5760846A (en) | Apparatus for estimating motion vectors for feature points of a video signal | |
RU2332809C2 (ru) | Устройство кодирования изображения и способ для предсказания сдвига с использованием согласования поворота | |
KR0171118B1 (ko) | 비디오신호 부호화 장치 | |
US8340189B1 (en) | Phase correlation based motion estimation in hybrid video compression | |
EP1228645B1 (en) | Adaptive motion vector field coding | |
US7751482B1 (en) | Phase correlation based motion estimation in hybrid video compression | |
US20020025001A1 (en) | Method and apparatus for video coding | |
JP3655651B2 (ja) | データ処理装置 | |
KR20040062331A (ko) | 동영상 압축 부호화를 위한 움직임 예측 방법과 그기록매체 | |
US20090304090A1 (en) | Method for Scalable Video Coding | |
KR20050119422A (ko) | 움직임 보상에 기반한 입력 영상의 노이즈 예측 및 그장치와, 이를 사용한 노이즈 제거 및 동영상 부호화 방법,이를 수행하기 위한 프로그램이 기록된 기록 매체 | |
KR100994768B1 (ko) | 동영상 부호화를 위한 움직임 추정 방법 및 이를 구현하기위한 프로그램이 기록된 기록 매체 | |
JP4417054B2 (ja) | 離散コサイン変換係数を参照する動き推定方法及び装置 | |
JP4494803B2 (ja) | 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置 | |
KR100723861B1 (ko) | 고속 움직임 예측을 위한 고속 모드 검색 장치 및 방법 | |
US20050226329A1 (en) | Motion estimation method using multilevel succesive elimination algorithm | |
US7860165B2 (en) | Framework for fine-granular computational-complexity scalable motion estimation | |
Srinivas et al. | Adaptive Order Cross–Square–Hexagonal search and fuzzy tangential-weighted trade-off for H. 264 in motion estimation | |
Anandan et al. | VIDEO COMPRESSION USING ARPS AND FAST DISCRETE CURVELET TRANSFORM FOR MOBILE DEVICES |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |