KR100887524B1

KR100887524B1 - 모션 정보 코딩 및 디코딩 방법

Info

Publication number: KR100887524B1
Application number: KR1020027013631A
Authority: KR
Inventors: 빈센트 보트레유; 비트리세 페스퀴-포페스크
Original assignee: 코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date: 2001-02-13
Filing date: 2002-02-11
Publication date: 2009-03-09
Also published as: KR20020093032A; CN1248509C; WO2002065784A1; JP2004519167A; US20030076883A1; CN1457604A; EP1378124B1; EP1378124A1; US6825885B2; DE60204447T2; ATE297099T1; DE60204447D1

Abstract

본 발명은 이미지 시퀀스에 연관된 모션 정보를 코딩하는 방법에 관한 것으로, 각각의 이미지를 블록들로 세분하고 현재 블록의 예측으로서 시프트된 블록을 규정하기 위한 블록 매칭 알고리즘을 각각의 블록에 적용하는 단계를 포함하고, 상기 시프트된 블록과 현재 블록 사이의 모션 벡터는 상기 현재 블록에 연관된 예측된 벡터이고, 전체 현재 이미지에 대해 유사하게 예측된 모든 상기 모션 벡터들은 상기 현재 프레임에 연관된 모션 벡터 필드를 구성한다. 각각의 현재 프레임의 대해, 상기 연관된 모션 벡터 필드에 의해 구성된 모션 정보는 최종적으로 코딩된다. 본 발명에 따라, 코딩될 모션 벡터 C는 유형의 관계: P = α. S + β. T 에 의해 규정된 공간-시간 예측자 P에 의해 근사되며, 여기서, S 및 T는 각각 공간 및 시간 예측자들이고 (α, β)는 상기 공간 및 시간 예측자들에 각각 연관된 가중 계수들이다. 또한 본 발명은 대응하는 디코딩 방법에 관한 것이다.

모션 벡터 필드, 가중 계수, 공간-시간 예측자, 모션 정보

Description

모션 정보 코딩 및 디코딩 방법{Motion information coding and decoding method}

본 발명은 연속적인 프레임들로 분할된 비디오 시퀀스에 연관된 모션 정보의 코딩 방법으로서,

- 현재 프레임을 2차원 블록들(bidimensional blocks)로 세분하는 단계,

- 상기 현재 프레임의 각각의 현재 블록에 대해, 이전 프레임에서 블록 매칭 알고리즘에 의해 상기 현재 블록의 예측으로서 시프트된 블록을 선택하는 단계로서, 상기 시프트된 블록과 현재 블록 사이의 모션 벡터는 상기 현재 블록에 연관된 예측된 벡터이고, 전체 현재 프레임에 대해 유사하게 예측된 모든 상기 모션 벡터들은 상기 현재 프레임에 연관된 모션 벡터 필드를 구성하는, 상기 시프트된 블록 선택 단계, 및

- 각각의 현재 프레임에 대해, 코딩될 각각의 모션 벡터에 대하여 그에 관련된 예측자(predictor)를 수반하는 차동 엔코딩 기법에 의해 상기 연관된 모션 벡터 필드에 의해 구성된 모션 정보를 코딩하는 단계를 포함하는 상기 모션 정보 코딩 방법에 관한 것이다.

또한, 본 발명은 대응하는 엔코딩 디바이스, 이러한 코딩 방법에 따라 코딩된 모션 정보를 디코딩하는 방법, 및 대응하는 디코딩 디바이스에 관한 것이다. 나 중에 제공되는 본 발명의 한 구현에 대한 자세한 설명에 있어서, MPEG 계열의 표준들에 규정된 바와 같이, 2차원 블록들은 예를 들면, 매크로블록들이다.

디지털 비디오 압축을 위해 제안된 코딩 설계들은 일반적으로, 처리된 비디오 시퀀스의 연속적인 프레임들 사이의 시간적 리던던시(redundancy)를 감소시키기 위해 모션 추정 및 보상을 이용한다. 이러한 방법들에서, 모션 벡터들의 세트는 엔코딩쪽에서 결정되고 디코더로 전송된다. 대부분의 비디오 코딩 표준들은 모션 추정 동작을 위해 소위, 블록 매칭 알고리즘(BMA :block matching algorithm)을 이용하며, 이것은 1996년의 BBC Research and Development Report에 S.R Ely에 의한 "MPEG video coding : a basic tutorial introduction" 문서에 예로서 기술되어 있다. 도 1에 묘사된 상기 알고리즘은 현재 이미지 I_t의 각각의 블록 B_c에 대해 최상으로 매칭되는 이전 참조 이미지 I_t-1의 블록 B_r을 찾도록 노력하며, 상기 이전 블록은 블록 B_c의 위치 주위의 이러한 이전 이미지의 제한된 영역(또는 탐색 윈도우 SW(search window))에서만 탐색된다. 따라서, 현재 프레임의 각각의 블록 B_c에 대한 엔코더에서 결정된 모션 벡터들의 세트는 디코더에 보내져야 한다.

모션 벡터들을 전송하는데 필요한 비트율을 최소화하기 위해, 이러한 벡터들은 일반적으로, 이전에 결정된 모션 벡터들(또는 예측자들)에 대해 서로 다르게 엔코딩된다. 보다 정확히, 이전 블록들 B_r에서 현재 블록들 B_c까지의 모션을 기술하는 모션 벡터들의 엔코딩은 이전에 전송된 공간 전후에 기초한 예측 기법에 의해 실현된다. 모션 벡터들은 예측값에 대해 서로 다르며, 가변 길이 코드들을 이용하여 코딩된다.

본 발명의 제 1 목적은 이들 모션 벡터들의 개선된 예측을 포함하는 모션 벡터들을 코딩하는 방법을 제안하는 것이다.

이를 위해, 본 발명은 설명의 도입부에 정의한 바와 같은 코딩 방법에 관한 것이며, 그것은 또한, 각각의 현재 블록에 대해, 상기 차동 엔코딩 기법의 감산 연산에 이용되는 예측자가 다음 유형의 관계, 즉

P = α. S + β. T

에 의해 규정된 선형 조합에 의해 얻어진 공간-시간 예측자 P이며, 여기서, S 및 T는 각각 공간 및 시간 예측자들이고 (α, β)는 상기 공간 및 시간 예측자들에 각각 연관된 가중 계수들인 것을 특징으로 한다.

본 발명의 구현의 이점에 있어서, 가중 계수들의 선택에 대한 기준은 최소 평균 제곱(in the least means square sense)에서 코딩될 모션 벡터 C와 그 예측자 P 사이의 왜곡을 최소화하는 것, 즉 다음의 연산자를 최소화하는 것이며:

F = ∑[C - (α. S + β. T)]²,

여기서, 합산은 전체 모션 벡터 필드, 즉 현재 프레임의 모든 블록들에 대해 실행된다.

바람직하게, 공간 예측자는 현재 블록의 전후에서 선택된 모션 벡터 후보들의 세트에 대해 메디안 필터링(median filtering)을 적용함으로써 얻어지고, 상기 모션 벡터 후보들의 세트는 MPEG-4 표준을 따르는 공간 예측이 필요한 경우, 세 개의 모션 벡터 후보들을 포함한다.

시간 예측자는 이전에 전송된 모션 벡터 필드 내의 블록을 가리키도록(to point) 현재 블록의 모션 벡터에 대해 이미 결정된 공간 예측자를 재이용함으로써 결정될 수 있거나, 또는 공간 예측자의 계산 동안 이용된 공간 예측자 후보들을 메모리에 유지하고, 그것들로 현재 이미지에서 대응하는 블록들로부터 모션 벡터들이 결정될 시간 예측자에 대해 공간 예측자들로서 또한 보여질 수 있는 이전 이미지의 블록들까지 가리키며, 이전 모션 벡터 필드 내의 이들 공간 예측자들의 메디안 필터링을 구현함으로써 결정될 수 있으며, 얻어진 결과는 결정될 상기 시간 예측자이다.

본 발명의 다른 목적은 상기 코딩 방법에 의해 코딩된 모션 정보를 디코딩하는 방법을 제안하는 것이다.

이를 위해, 본 발명은 코딩 방법에 의해 전송 또는 저장 단계 전에 미리 코딩되고, 이미지 시퀀스에 대응하는 모션 정보를 디코딩하는 방법에 관한 것으로, 상기 코딩 방법은,

- 현재 이미지를 2차원 블록들로 세분하는 단계,

- 상기 현재 이미지의 각각의 현재 블록에 대해, 이전 이미지에서 블록 매칭 알고리즘에 의해 상기 현재 블록의 예측으로서 시프트된 블록을 선택하는 단계로 서, 상기 시프트된 블록과 현재 블록 사이의 모션 벡터는 상기 현재 블록에 연관된 예측된 벡터이고, 전체 현재 이미지에 대해 유사하게 예측된 모든 상기 모션 벡터들은 상기 현재 이미지에 연관된 모션 벡터 필드를 구성하는, 상기 시프트된 블록 선택 단계, 및

- 각각의 현재 이미지에 대해, 상기 연관된 모션 벡터 필드에 의해 구성된 모션 정보를 코딩하는 단계로서, 각각의 현재 블록에 대해 코딩될 모션 벡터 C는 다음 유형의 관계, 즉

P = α. S + β. T

에 의해 규정된 선형 조합에 의해 얻어진 공간-시간 예측자 P에 의해 근사되며:

여기서, S 및 T는 각각 공간 및 시간 예측자들이고 (α, β)는 상기 공간 및 시간 예측자들에 각각 연관된 가중 계수들인 상기 모션 정보 코딩 단계를 포함하고, 상기 디코딩 방법은,

- 시퀀스의 제 1 모션 벡터 필드에 대해, 공간 예측자들에만 기초된 제 1 유형의 디코딩 단계, 및

- 다른 모션 벡터 필드들에 대해, 이미 디코딩된 이전 모션 벡터 필드의 모션 벡터들, 디코딩될 현재 모션 벡터의 전후에 규정된 공간 벡터들, 및 전송된 가중 계수들 α및 β에 기초한 공간-시간 예측자 P의 계산을 포함하는 제 2 유형의 디코딩 단계의 두 가지 유형들의 디코딩 단계를 포함하는 것을 특징으로 한다.

도 1은 전통적인 블록 매칭 알고리즘을 설명한 도면.

도 2는 알려진 3차원(3D) 모션 추정 방법에 이용된 예측자들의 위치들을 도시한 도면.

도 3은 예측 기법에 의해 모션 벡터 엔코딩에 대한 공간 후보들의 가능한 위치들을 도시한 도면.

도 4는 모션 벡터 시간 예측자의 결정을 위한 제 1 해결책을 설명한 도면.

도 5는 모션 벡터 시간 예측자의 결정을 위한 제 2 해결책을 설명한 도면.

도 6은 본 발명에 따른 엔코딩 방법을 실행하도록 허용하는 엔코더의 구현을 설명한 도면.

도 7은 본 발명에 따른 디코딩 방법을 실행하도록 허용하는 디코더의 구현을 설명한 도면.

본 발명은 첨부한 도면들을 참조하여 예의 방법으로 기술될 것이다.

도 1을 참조하여 상기 설명한 바와 같이, 모션 추정은 이전 프레임에서의 제한된 탐색 영역 SW내에서 블록의 최상의 매칭 위치를 찾도록 노력하는 탐색 설계에 기초되며, 상기 매칭 위치는 예측자의 감산 및 가변 길이 엔코딩(VLC : variable length encoding) 이후, 엔코더에서 디코더로 전송되는 모션 벡터에 의한 각각의 블록(또는 MPEG 표준들의 경우, "매크로블록(macroblock)")에 대해 기술된다.

본 발명의 원리는 두개의 연속적인 모션 벡터 필드들 사이에서 관찰된 시간 상관 관계를 고려하여 부가적 동작이 예측에(각각의 현재 모션 벡터에 대응하는 서로 다른 값들의 가변 길이 코딩(VLC : variable length coding) 이전에 제공된) 도입되는 것이다. 시간 예측자들을 이용한 블록 기초된 모션 추정은 1993년 10월, IEEE Transactions on Circuits and Systems for Video Technology, Vol.3, n°5, 368 내지 379 페이지의 G.de Haan 등에 의한 "True motion estimation with 3D recursive block matching"에 예로서 이미 기술되어 있다. 3-D 순환 탐색(3-D recursive search)에 기초되는 이러한 기법은 도 2에 설명된 현재 블록 B_c의 전후 블록들 사이에 선택된 세 개의 공간 예측자 P1, P2, P3와, P1의 선형 조합 및 이전 처리된 블록의 최상의 후보인 하나의 부가적 공간 예측자와, 시간 예측자 P4(대응하는 모션 벡터가 이전 모션 벡터 필드에 속한다는 의미의 "시간(temporal)")인 그 가능한 구현들 중 하나에 이용된다.

통상적으로, 이전 작업들은 현재 모션 벡터를 서로 다르게 엔코딩하는 데에 단지 공간 예측자들만을 고려하였다. 16 x 16 픽셀 모션 벡터들(4개의 블록들을 포함한 매크로블록에 대한 하나의 모션 벡터)의 경우, 공간 예측은, 그러한 후보들 MV1, MV2, 및 MV3(따라서, 현재 모션 벡터에 대한 공간 예측자는 이러한 모션 벡터 후보들에 대해 메디안 필터링(median filtering) 동작을 실행함으로써 얻어진다.)의 가능한 위치들을 도시한 도 3의 예로 설명한 바와 같이, 현재 매크로블록의 전후에서 여러개의 모션 후보들(MPEG -4의 경우 3개)을 선택하는 것으로 구성되었다. 모션 벡터 엔코딩을 개선하기 위해, 엔코딩될 현재 매크로블록의 모션 벡터를 보다 잘 예측하도록 모션궤도(motion trajectory)를 따라 모션 벡터들 사이에 존재하는 상관관계를 활용하도록 제안한다.

도 4에 설명된 바와 같이, 현재 모션 벡터 필드 CMVF(current motion vector field)에 대해, 적절한 시간 예측자 P를 결정하기 위한 제 1 해결책은 이전에 전송된 모션 벡터 필드 PMVF(previously transmitted motion vector field) 내부의 매크로블록을 가리키도록 현재 매크로블록의 모션 벡터에 대해 이미 결정된 공간 예측자를 재이용할 수 있다. 또한, 불량 예측의 영향을 감소시키기 위해, 메디안 필터링 동작은 선택된 매크로블록 주위의 8개의 전후 매크로블록들에 대해 한번 더 실행될 수 있다.

예측자 P의 결정에 대한 제 2 해결책은, 도 5에 설명한 바와 같이, 공간 예측자의 계산 동안 이용된 공간 예측자 후보들 SPC(spatial predictor candidates)를 메모리에 유지하는 것이다. 이러한 모션 벡터 후보들은 현재 프레임의 매크로블록들로부터, 모션 벡터들이 결정되어야 하는 시간 예측자에 대해 공간 예측자들로서 또한 보여질 수 있는 이전 프레임의 매크로블록들까지 가리킨다. 따라서, 현재 모션 벡터에 대한 이러한 시간 예측자는 이전 모션 벡터 필드 내의 이러한 공간 예측자들의 메디안 필터링의 결과이다.

선택된 해결책이 무엇이든지, 공간-시간이라 불릴 수 있는 예측자 P는

P = α. S + β. T

상기 유형의 선형 조합에 의해 얻어진다:

여기서, S 및 T는 각각 상술된 바와 같이 결정된 공간 및 시간 예측자들이고 (α, β)는 상기 공간 및 시간 예측자들에 각각 연관된 가중 계수들이다. α및 β의 선택에 대한 가능한 기준은 최소 평균 제곱에서 원래의 모션 벡터 C와 그 예측자 P 사이의 왜곡을 최소화하는 것, 즉 연산자 F를 최소화하는 것이다 :

F = ∑[C - (α. S + β. T)]²,

여기서, 합산 ∑은 전체 모션 벡터 필드, 즉 현재 프레임( 이러한 가중 계수들 α및 β는 디코딩쪽을 향하여 전송될 필요가 있는데, 디코딩 디바이스가 그들을 계산하기 위해 대칭 동작들을 실행할 수 없기 때문이다: 따라서, 전체 전송 비용에 대해, 양호한 트레이드-오프는 시간 예측자에 의해 초래된 전송 이득과 각각의 모션 벡터 필드에 대한 두개의 값들(α, β)의 부가적 전송 비용 사이에 도달되어야 한다.)의 모든 매크로블록들을 포함함으로써 실행된다.

모션 벡터들은 일반적으로, DPCM(Differential Pulse Code Modulation) 기법으로 엔코딩되며, 그것은 입력과 국부적으로 디코딩된 이전 출력에 기초된 예측 사이의 차들(differences)만이 양자화되고 전송되며, VLC 테이블들을 이용하고 모션 벡터들에 대응하는 코딩된 데이터를 생성하는 엔트로피 코딩 단계가 뒤따른다. 상기 기술한 것과 같은 코딩 방법이 비디오 코딩 설계내에 이용되었을 때, 모션 벡터들에 대응하고 디코딩쪽에서 수신된 코딩된 데이터는 특히 디코딩되어야 한다. 그다음, 모션 벡터 재구성은 다음의 처리 단계들에 따라 실행된다:

- 제 1 모션 벡터 필드에 대해(즉, 어떤 전임자(predecessor)도 갖지 않는 것), 공간 예측자들에만 기초된 전통적인 디코딩 단계가 구현된다

- 다른 모션 벡터 필드들에 대해(즉, 시간 전임자들을 갖는 것들), 엔코더에 제공된 동작들이 유사하게 구현된다: 알고 있는 모션 벡터 시간 예측자들(이미 디코딩된 이전 모션 벡터 필드의 모션 벡터들이다), 공간 예측자들(= 디코딩될 현재 모션 벡터의 전후에 있는 모션 벡터들), 및 가중 계수들 α및 β(전송되었음), 엔코더쪽에서 이미 이용된 최종 예측자 P = α. S + β. T 이 계산되며, 그다음, 그것은 엔코더의 VLC 테이블들에 설정된 대응에 의해 현재 모션 벡터를 서로 다르게 디코딩하도록 허용한다.

상기 기술된 엔코딩 기법은 많은 엔코딩 설계들, 예를 들면 MPEG-4 비디오 엔코더에서 실행될 수 있다. 도 6은 그러한 엔코더의 설명을 제공한다: 입력 비디오 정보 VIF는 분할 회로(61)에 의해 비디오 오브젝트들(VOs)로 분할되고, 코딩 제어 회로(62)는 VOs이 전송될 것을 결정하며(예를 들면, 이용자 요구 또는 디코더의 성능들에 기초하여), 선택된 VOs는 그다음, 코딩 회로들(63a 내지 63n)에서 엔코딩되고(그밖의 것들과 관계없는 각각의 것), 그다음, 다중화기(64)는 얻어진( 및 서로 다른 VOs를 나타내는) n개의 비트스트림들을 단일 비디오 스트림으로 통합한다. 각각의 VO는 그것의 형태, 텍스쳐(texture), 및 모션 컴포넌트들에 의해 규정되고, 각각의 코딩 회로의 엔코딩 매카니즘은 형태, 텍스쳐, 및 모션 엔코딩 동작들을 실행해야 한다. 형태 및 텍스쳐 동작들은 2000년 1월, Signal Processing : Image Communication, vol.15, n°4-5, 365 내지 385페이지의 T.Ebrahimi 등에 의한 "MPEG-4 natural video coding - An overview"에서 예로서 기술된 바와 같이 실행된다. 모션 동작은 상기 기술된 모션 정보 코딩 방법을 구현함으로써 본 발명에 따라 실행될 수 있다.

유사하게, 상기 기술되고 본 발명에 따른 엔코딩 방법에 대응하는 디코딩 방법은 동일한 문서에 기술된 바와 같은 디코딩 설계에서 실행될 수 있다. 도 7은 상기 엔코딩 방법을 수행할 때 얻어진 것과 같은 코딩된 비트스트림을 수신하고 디코딩하도록 허용하는 디코더의 설명을 제공한다: 입력 비트스트림은 역다중화 회로(71)에서 먼저 역다중화되고, 이렇게 생성된, 서로 다른 서로 다른 VOs에 대응하는 역다중화된 엘리멘트리 스트림들(elementary streams)은 엘리멘트리 스트림들이 분해되어(parsed) 적절한 디코더들(형태 디코딩 회로(72), 텍스쳐 디코딩 회로(73), 모션 디코딩 회로(74))에 보내지고, VOs를 포함하는 원래의 장면을 재구성하도록 장면 설명 정보와 함께 디코딩된 데이터를 이용하는 재구성 회로(75)는 디스플레이된 비디오 이미지를 최종적으로 얻도록 허용한다. 본 발명에 따른 모션 정보 디코딩 방법은 상기 회로(74)에서 실행된다.

본 발명의 양호한 실시예들의 상기 설명은 설명 및 기술할 목적으로 제공되었다. 이것은 본 발명을 개시된 정규 형식으로 제한하거나 규명하기 위한 의도가 아니며, 명백히 많은 변형들 및 변화들이 본 발명의 범위 내에 포함되도록 의도되고 본 기술 분야의 숙련된 기술자들에게 명백하며 상기 가르침들로서 가능하다.

본 명세서에 기술된 디바이스들은, 하드웨어 또는 소프트웨어의 단일 아이템이 여러개의 기능들을 실행할 수 있다는 것 또는 하드웨어 및 소프트웨어 또는 둘다의 아이템들의 조립이 단일 기능을 실행한다는 것을 배제하지 않고, 하드웨어, 소프트웨어, 또는 하드웨어 및 소프트웨어의 조합으로 구현될 수 있음을 알 수 있다. 기술한 방법들 및 디바이스들은 본 명세서에 기술된 방법들을 실행하도록 적응된 컴퓨터 시스템 또는 다른 장치의 어떤 유형으로도 구현될 수 있다. 하드웨어 및 소프트웨어의 전형적인 조합은, 로드되고 실행될 때 본 명세서에 기술된 방법들을 실행하는 그러한 컴퓨터 시스템을 제어하는 컴퓨터 프로그램을 가진 일반적 목적의 컴퓨터 시스템일 수 있다. 대안적으로, 본 발명의 하나 또는 그 이상의 기능적 직무들을 실행하기 위한 특정화된 하드웨어를 포함하는 특정 용도 컴퓨터가 이용될 수 있다.

본 발명은 또한, 본 명세서에 기술된 방법들 및 기능들의 구현을 가능하게 하는 특징들 모두를 포함하고 -컴퓨터 시스템에 로드될 때- 이러한 방법들 및 기능들을 실행할 수 있는 컴퓨터 프로그램 제품에 임베디드할 수 있다. 컴퓨터 프로그램, 소프트웨어 프로그램, 프로그램, 프로그램 제품, 또는 소프트웨어는 명령들의 세트의 본 문맥 의미에서 코드 또는 표시(notation)의 어떠한 언어로 어떠한 표현으로 다음의 어느것 또는 둘다 후에 또는 바로 특정 기능을 실행하는 정보 처리 성능을 시스템이 가지도록 의도된다 :

(a) 다른 언어, 코드 또는 표시로 전환 및/또는,

(b) 서로 다른 자료 형태(material form)에서 재생

Claims

연속적인 프레임들로 분할된 비디오 시퀀스에 연관된 모션 정보를 코딩하는 방법으로서:

- 현재 프레임을 2차원 블록들로 세분하는 단계;

- 상기 현재 프레임의 각각의 현재 블록에 대해, 이전 프레임에서 블록 매칭 알고리즘에 의해 상기 현재 블록의 예측으로서 시프트된 블록을 선택하는 단계로서, 상기 시프트된 블록과 현재 블록 사이의 모션 벡터는 상기 현재 블록에 연관된 예측된 벡터이고, 전체 현재 프레임에 대해 유사하게 예측된 모든 상기 모션 벡터들은 상기 현재 프레임에 연관된 모션 벡터 필드를 구성하는, 상기 시프트된 블록 선택 단계; 및

- 각각의 현재 프레임에 대해, 코딩될 각각의 모션 벡터에 대하여 그에 관련된 예측자(predictor)를 수반하는 차동 엔코딩 기법에 의해 상기 연관된 모션 벡터 필드에 의해 구성된 모션 정보를 코딩하는 단계를 포함하고,

각각의 현재 블록에 대해, 상기 차동 엔코딩 기법의 감산 연산에 이용되는 상기 예측자는, 다음 유형의 관계:

P = α. S + β. T

에 의해 규정된 선형 조합에 의해 얻어진 공간-시간(spatio-temporal) 예측자 P이며:

여기서, S 및 T는 각각 공간 및 시간 예측자들이고 (α, β)는 상기 공간 및 시간 예측자들에 각각 연관된 가중 계수들인 것을 특징으로 하는, 모션 정보 코딩 방법.
제 1 항에 있어서, 상기 가중 계수들의 선택에 대한 기준은 코딩될 상기 모션 벡터 C와 최소 평균 제곱에서의 그 예측자 P 사이의 왜곡을 최소화하는 것, 즉 다음의 연산자:

F = ∑[C - (α. S + β. T)]²

를 최소로 하는 것이며,

여기서, 합산은 전체 모션 벡터 필드, 즉 상기 현재 프레임의 모든 블록들에 대해 실행되는 것을 특징으로 하는, 모션 정보 코딩 방법.
제 2 항에 있어서, 상기 공간 예측자는 상기 현재 블록의 전후에서 선택된 모션 벡터 후보들의 세트에 대해 메디안 필터링(median filtering)을 적용함으로써 얻어지는 것을 특징으로 하는, 모션 정보 코딩 방법.
제 3 항에 있어서, 상기 모션 벡터 후보들의 세트는 MPEG-4 표준에 따르는 공간 예측을 가지기 위해, 세 개의 모션 벡터 후보들을 포함하는 것을 특징으로 하는, 모션 정보 코딩 방법.
제 2 항에 있어서, 상기 시간 예측자는 이전에 전송된 모션 벡터 필드 내의 블록을 가리키도록 상기 현재 블록의 모션 벡터에 대해 이미 결정된 상기 공간 예측자를 재이용함으로써 결정되는 것을 특징으로 하는, 모션 정보 코딩 방법.
제 2 항에 있어서, 상기 시간 예측자는 상기 공간 예측자의 계산 동안 이용된 상기 공간 예측자 후보들을 메모리에 유지하고, 그것들로 상기 현재 이미지에서 대응하는 블록들로부터, 결정될 상기 시간 예측자에 대해 공간 예측자들로서 또한 모션 벡터들이 보여질 수 있는 상기 이전 이미지의 블록들까지 가리키며, 상기 이전 모션 벡터 필드 내의 이들 공간 예측자들의 메디안 필터링을 구현함으로써 결정되고, 상기 얻어진 결과는 결정될 상기 시간 예측자인 것을 특징으로 하는, 모션 정보 코딩 방법.
전송 또는 저장 전에 코딩 방법에 의해 미리 코딩된, 이미지 시퀀스에 대응하는 모션 정보를 디코딩하는 방법으로서,

상기 코딩 방법은:

- 현재 이미지를 2차원 블록들로 세분하는 단계;

- 상기 현재 이미지의 각각의 현재 블록에 대해, 이전 이미지에서 블록 매칭 알고리즘에 의해 상기 현재 블록의 예측으로서 시프트된 블록을 선택하는 단계로서, 상기 시프트된 블록과 현재 블록 사이의 모션 벡터는 상기 현재 블록에 연관된 예측된 벡터이고, 전체 현재 이미지에 대해 유사하게 예측된 모든 상기 모션 벡터들은 상기 현재 이미지에 연관된 모션 벡터 필드를 구성하는, 상기 시프트된 블록 선택 단계; 및

- 각각의 현재 이미지에 대해, 상기 연관된 모션 벡터 필드에 의해 구성된 상기 모션 정보를 코딩하는 단계를 포함하고,

각각의 현재 블록에 대해 코딩될 상기 모션 벡터 C는 다음 유형의 관계:

P = α. S + β. T

에 의해 규정된 선형 조합에 의해 얻어진 공간-시간 예측자 P에 의해 근사되고,

여기서, S 및 T는 각각 공간 및 시간 예측자들이고, (α, β)는 상기 공간 및 시간 예측자들에 각각 연관된 가중 계수들이며,

상기 디코딩 방법은 두 가지 유형의 디코딩 단계로서:

- 상기 시퀀스의 제 1 모션 벡터 필드에 대해, 공간 예측자들에만 기초한 제 1 유형의 디코딩 단계; 및

- 다른 모션 벡터 필드들에 대해, 이미 디코딩된 상기 이전 모션 벡터 필드의 모션 벡터들, 디코딩될 상기 현재 모션 벡터의 전후에 규정된 공간 예측자들, 및 상기 전송된 가중 계수들 α및 β에 기초한 상기 공간-시간 예측자 P의 계산을 포함하는 제 2 유형의 디코딩 단계를 포함하는 것을 특징으로 하는, 모션 정보 디코딩 방법.