KR20010072338A - 픽셀들을 가지는 디지털화 된 화상에서 동작을추정하기위한 방법 및 장치 - Google Patents

픽셀들을 가지는 디지털화 된 화상에서 동작을추정하기위한 방법 및 장치 Download PDF

Info

Publication number
KR20010072338A
KR20010072338A KR1020017001668A KR20017001668A KR20010072338A KR 20010072338 A KR20010072338 A KR 20010072338A KR 1020017001668 A KR1020017001668 A KR 1020017001668A KR 20017001668 A KR20017001668 A KR 20017001668A KR 20010072338 A KR20010072338 A KR 20010072338A
Authority
KR
South Korea
Prior art keywords
picture
block
image
search region
pixels
Prior art date
Application number
KR1020017001668A
Other languages
English (en)
Other versions
KR100367468B1 (ko
Inventor
판델유르겐
베제게로
외르텔노르베르트
Original Assignee
마이클 골위저, 호레스트 쉐퍼
인피네온 테크놀로지스 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이클 골위저, 호레스트 쉐퍼, 인피네온 테크놀로지스 아게 filed Critical 마이클 골위저, 호레스트 쉐퍼
Publication of KR20010072338A publication Critical patent/KR20010072338A/ko
Application granted granted Critical
Publication of KR100367468B1 publication Critical patent/KR100367468B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/533Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/223Analysis of motion using block-matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20052Discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Analysis (AREA)

Abstract

픽셀들은 화상 블록의 집단으로 배열된다. 상기 픽셀들은 적어도 제 1화상 영역과 제 2화상 영역으로 집단화 된다. 제 1검색 영역의 제 1동작 추정은 동작 벡터를 결정하기위해 실시된다. 제 2동작 추정은 제 2동작 벡터를 결정하기 위해서 제 2검색 영역에서 실시된다. 제 1검색 영역과 제 2검색 영역은 상이한 크기이다.

Description

픽셀들을 가지는 디지털화 된 화상에서 동작을 추정하기위한 방법 및 장치{METHOD AND DEVICE FOR ESTIMATING MOTION IN A DIGITIZED IMAGE WITH PIXELS}
이러한 방법은 [1]에 공지된 것이다.
[1]에서 움직임을 추정하는 방법에서, 동작 추정이 산출되는 디지털화 된 블록의 픽셀들은 화상 블록(picture block)으로 집단화 된다.
가능한 일치를 산출하는 동작 추정을 위해서 상기 화상 블록 내에 포함되는 코딩 정보의 유사성이 있는 그림 블록의 크기 영역을 결정하도록 검색 영역 내에서 상기 화상 내의 각 화상 블록에 대한 검색 영역이 기 설정될 수 있다.
다음에 이어지는 내용에서, 코딩 정보라는 용어는 각 픽셀에 대한 밝기 정보(휘도(luminance)값들) 또는 색상 정보(색차(chrominance)정보)를 의미한다.
이러한 목적으로, 선행하는 화상에서, 상기 선행하는 화상 내에 있는 상기 화상 블록 내의 위치를 기반으로, 상기 화상 블록 내에 포함되는 것들이 기 설정될 수 있는 크기(검색 영역)의 영역 내의 각 위치에 대해 형성되는 각 경우와 동일한수의 픽셀들을 가지는 해당하는 블록 크기의 영역과, 상기 사각형의 합 또는 상기 코딩 정보의 절대 차이는 상기 동작 추정이 수행되는 상기 화상 블록과 상기 선행하는 화상 내의 개별적인 영역 사이에 형성된다. 가장 일치되는 영역, 즉 최소 합의 값을 가지는 영역은 일치되는 화상 블록으로 간주되고, 상기 이전 화상의 "최적(best)" 영역과 화상 블록 간의 화상 블록 위치 내의 동작이 결정된다. 이러한 동작은 동작 벡터로 간주된다.
본 발명은 픽셀들을 가지는 디지털화 된 화상에서 동작을 추정하는 것에 관한 것이다.
본 발명의 예시적인 실시예가 다음의 글에서 자세히 설명될 것이며, 다음의 도면들에 예시된다.
도 1a에서 1c는 화상과 이전 화상의 묘사를 보이며, 여기서 본 발명이 기반으로 하는 원리가 예시된다.
도 2는 비디오 데이터가 코드화 되고, 전송되고, 디코드 되며 표시되는 수단에 대한 두 컴퓨터들, 카메라 그리고 화면의 배열을 보인다.
도 3은 디지털화 된 화상의 블록 기반 코딩을 위한 묘사를 보인다.
본 발명은 디지털화 된 화상의 동작 추정에 대한 동작 벡터를 코딩하는데 대해서 전체적으로 요구되는 전체 비트들의 수를 줄여서 동작을 추정하기위한 방법 및 장치를 제공하기위한 문제점에 관한 것이다.
상기 문제점은 독립 청구항의 특징에 따르는 방법과 구성으로 해결된다.
픽셀들을 가지는 디지털화 된 화상의 동작 추정에 대한 방법의 경우에 있어서, 상기 픽셀들은 화상 블록들로 집단화 된다. 상기 픽셀들은 적어도 제 1화상 영역과 제 2화상 영역으로 집단화 된다. 제 1동작 추정은 제 1화상 블록의 동작이 선행하는 프리디세서(predecessor) 화상의 상기 제 1화상 블록에 대한 비교 그리고/또는 후속하는 석세서(successor) 화상의 제 1화상 블록에 대한 비교로 설명되는 수단을 통해서 제 1동작 벡터를 결정하기위해 제 1화상 영역의 적어도 제 1화상 블록에 대한 제 1검색 영역에서 수행된다. 또한, 제 2동작 추정은 제 2화상 블록의 동작이 선행하는 프리디세서 화상의 상기 제 2화상 블록에 대한 비교 그리고/또는 후속하는 석세서 화상의 제 2화상 블록에 대한 비교로 설명되는 수단을 통해서 제2동작 벡터를 결정하기위해 제 2화상 영역의 적어도 제 2화상 블록에 대한 제 2검색 영역에서 수행된다. 상기 제 1검색 영역과 제 2검색 영역은 이 경우 상이한 크기들이다.
픽셀들을 가지는 디지털화 된 화상의 동작 추정을 위한 구성은 다음의 단계들이 수행될 수 있도록 설정된 프로세서를 가진다.
- 픽셀들은 화상 블록들로 집단화 되고,
- 상기 픽셀들은 적어도 제 1화상 영역과 제 2화상 영역으로 형성하기위해 집단화 되며,
- 제 1화상 블록의 동작은 선행하는 프리디세서 화상의 상기 제 1화상 블록에 대한 비교 그리고/또는 후속하는 석세서 화상의 제 1화상 블록에 대한 비교로 설명되는 수단을 통해서 제 1동작 벡터를 결정하기위해 제 1화상 영역의 적어도 제 1화상 블록에 대한 제 1검색 영역에서 제 1동작 추정을 수행하고,
- 제 2화상 블록의 동작은 선행하는 프리디세서 화상의 상기 제 2화상 블록에 대한 비교 그리고/또는 후속하는 석세서 화상의 제 2화상 블록에 대한 비교로 설명되는 수단을 통해서 제 2동작 벡터를 결정하기위해 제 2화상 영역의 적어도 제 2화상 블록에 대한 제 2검색 영역에서 제 2동작 추정을 수행하며 ,
- 상기 제 1검색 영역과 제 2검색 영역은 이 경우 상이한 크기들을 가진다.
동작 벡터들의 크기가 품질에 대한 요구들에 적절히 일치될 수 있고, 그래서 화상의 품질에 주관적인 인상(subjective impression)의 두드러진 질적 저하 없이, 예들 들어서, 단지 낮은 품질만이 요구되는 영역에서 아주 작은 검색 영역이 균일하게 제공되는 것으로, 본 발명은 압축된 비디오 데이터의 전송에 대해 요구되는 데이터 비율을 줄일 수 있다. 그래서, 이러한 검색 영역의 동작 벡터 최대 크기는 비교적 작으며, 그로인해 상기 동작 벡터를 코딩하는데 필요한 비트들의 수는 줄어든다.
본 발명에서는 상이한 크기의 검색 영역들이 화상 영역들 내의 화상 블록들의 움직임을 추정하기위한 화상 영역들로 사용되고, 그에 따라서 동작 벡터들을 코딩하기위해 요구되는 데이터 비율의 유연한 감소, 품질에 대한 일치의 결과를 가져온다는 것을 분명하게 볼 수 있다.
본 발명 이로운 개발들은 첨부되는 종속항들의 결과이다.
어떠한 개발은 제 1화상 블록과/또는 제 2화상 블록이 코드화 되는 수단을 통해서, 기 설정된 화상 품질에 맞추어 가변되는 제 1검색 영역과/또는 제 2검색 영역의 크기를 제공한다.
이러한 방식으로, 상기 검색 영역들을 제한하기 위한 측정이 설정되고, 이는 요구되는 화상 품질에 맞는 요구되는 데이터 비율을 줄이도록 한다.
어떠한 개발에서, 상기 개별적인 검색 영역의 크기를 결정하기위한 극단적으로 간단한 기준은 제 1화상 블록과/또는 제 2화상 블록이 양자화 되는 수단을 통한 양자화(quantization) 파라메터이다.
다른 개선은 상기 동작 벡터들의 가변 길이 코딩을 위해 사용되는 가변 길이 코딩을 위한 코드들이 저장된 다수의 테이블들을 제공하며, 그에 따라서 상기 비디오 데이터의 전송을 위한 상기 요구되는 데이터 비율이 더 줄어든다.
도 2는 화상 코딩, 비디오 데이터의 전송, 그리고 화상 디코딩을 보이는, 두 컴퓨터들(202, 208)과 카메라(201)를 포함하는 배열을 도시한다.
카메라(201)는 라인(219)을 통해서 제 1컴퓨터(202)와 연결된다. 상기 카메라(201)는 촬영된 화상(204)을 상기 제 1컴퓨터(202)로 전송한다. 상기 제 1컴퓨터(202)는 버스(218)를 통해 프레임 메모리(205)와 연결되는 제 1프로세서(203)를 가진다. 화상을 코딩하는 방법은 상기 제 1컴퓨터(202)의 제 1프로세서(203)에 의해서 수행된다. 이러한 방식으로, 코드화 된 비디오 데이터(206)는 케이블 또는 무선 경로인 것이 바람직한 통신 연결부(207)을 통해서 상기 제 1 컴퓨터(202)에서 제 2컴퓨터(208)로 전달된다. 상기 제 2컴퓨터(208)는 제 2프로세서(209)를 포함하며, 이는 버스(210)를 통해 프레임 메모리(211)와 연결된다. 화상을 디코딩 하는 방법은 제 2프로세서(209)에 의해서 수행된다.
제 1컴퓨터(202)와 제 2컴퓨터(208)는 개별적인 화면(212 또는 213)을 가지며, 그곳에 상기 비디오 데이터(204)가 표시된다. 키보드(214 또는 215) 혹은 컴퓨터 마우스(216 또는 217)가 바람직한 입력 유닛들은 상기 제 1컴퓨터(202)와 제 2컴퓨터(208) 모두에 개별적으로 제공된다.
상기 라인(219)을 통해 상기 카메라(201)에서 상기 제 1컴퓨터(202)로 전송되는 상기 비디오 데이터(204)는 시간 영역(time domain)에서의 데이터인 반면, 상기 통신 연결부(207)를 통해서 상기 제 1컴퓨터(202)에서 제 2컴퓨터(208)로 전송되는 데이터(206)는 스팩트럴 영역(spectral domain)의 비디오 데이터이다.
디코드 된 비디오 데이터는 화면(213)에 표시된다.
도 3은 H.263 표준([5] 참조)에 따라서 블록-기반 화상 코딩 방법을 수행하도록 하는 배열의 묘사를 도시한다.
연속적인 디지털화 된 화상을 가지면서 코드화 되는 비디오 데이터 스트림이 화상 코딩 유닛(301)에 제공된다. 상기 디지털화된 화상들은 매크로(macro) 블록들(302)로 나누어지며, 각 매크로 블록(302)은 16 x 16 픽셀들을 가진다. 상기 매크로 블록(302)은 화상 블록들(303, 304, 305 그리고 306)은 4개의 화상 블록들(303, 304, 305 그리고 306)을 가지며, 각 화상 블록은 8 x 8 픽셀들을 포함하고, 각기 휘도값들(밝기값들)이 할당된다. 또한, 각 매크로 블록(302)은 각 픽셀들에 할당되는 색차 값들(색상 정보, 색상 채도(color saturation))을 가지는 두개의 색차 블록들(307과 308)을 포함한다.
화상의 블록은 휘도값(=밝기), 제 1색차값 그리고 제 2색차값을 포함한다.이러한 경우, 상기 휘도값, 제 1색차값 그리고 제 2색차값은 색상값(color value)으로 간주된다.
상기 화상 블록들은 변환(transformation) 코딩 유닛(309)에 제공된다. 차이-화상(difference-picture) 코딩 동안, 이전 화상의 화상 블록에서 코딩되는 값들은 그 당시 코딩되는 화상 블록에서 감산되고, 차이-형성(difference-forming) 정보(310) 만이 상기 변환 코딩 유닛(이산 코사인 변환, DCT)(309)에 제공된다. 이러한 목적으로, 현재 매크로 블록(302)은 연결부(334)를 통해 동작 추정 유닛(329)에 제공된다. 이러한 변환 코딩 유닛(309)에서, 스팩트럴 계수들(311)은 상기 화상 블록 또는 코드화 되는 차이 화상 블록들에 대해서 형성되고, 그리고 양자화 유닛(312)에 제공된다.
양자화 된(quentized) 스팩트럴 계수들(313)은 검색 유닛(314)과 궤환 경로 상의 양자화 역변환부(inverse quentization) 모두에 제공된다. 예를 들어 "지그재그(zigzag)" 검색 방법과 같은 검색 방법을 이용하여, 이러한 목적으로 제공되는 엔트로피(entropy) 코딩 유닛(316)의 검색된 스팩트럴 계수들(332) 상에서 엔트로피 코딩이 실시된다. 상기 엔트로피-코드화 된 스팩트럴 계수들이 코드화 된 비디오 데이터(317)로서, 케이블이나 무선 경로가 바람직한 채널을 통해 디코더로 전송된다.
상기 양자화 역변환 유닛(315)에서 상기 양자화 된 스팩트럴 계수들(313)의 양자화 역변환이 실시된다. 이러한 방법으로 얻어지는 스팩트럴 계수들(318)은 상기 양자화 역변환 유닛(315)(이산 코사인 역변환, IDCT)에 제공된다. 재구성된 코딩값들(그리고 차이 코딩값들)(320)은 상기 차이-형성 모드의 가산기(321)에 제공된다. 상기 가산기(321) 역시 화상 블록에 대한 코딩값을 수신하고, 이는 동작 보상(motion compensation)이 한번 실시된 다음 이전 화상에서 얻어진다. 상기 가산기(321)는 프레임 메모리(323)에 저장되는 재구성된 화상 블록들(322)에서 사용된다.
상기 재구성된 화상 블록들(322)의 색차값들(324)은 상기 프레임 메모리(323)에서 동작 보상 유닛(325)으로 제공된다. 밝기값들(326)에 대해서, 이러한 목적으로 제공되는 보간(interpolation) 유닛(327)에서 보간법이 실시된다. 상기 보간법은 상기 개별적인 화상 블록에 포함되는 밝기값들의 수를 4배로 하는데 사용되는 것이 바람직하다. 상기 모든 밝기값들(328)은 상기 동작 보상 유닛(325) 뿐만 아니라 상기 동작 추정 유닛(329)에도 제공된다. 상기 동작 추정 유닛(329) 역시 상기 연결부(334)를 통해서 코드화 되는 개별적인 매크로 블록(16 x 16 픽셀들)에 대해서 상기 화상 블록들을 수신한다. 동작 추정은 상기 보간된 밝기값들("절반-픽셀 기반의 동작 추정")을 고려하면서, 상기 동작 추정 유닛(329)에서 실시된다.
상기 동작 추정의 결과는 선택된 매크로 블록이 상기 이전 화상에서의 선택된 매크로 블록의 위치에서 코딩되는 상기 매크로 블록(302)으로의 움직임을 표현하는 동작 벡터(330)이다.
상기 동작 추정 유닛(329)에 의해 정의되는 상기 매크로 블록에 관한 밝기 정보 및 색차 정보 모두는 상기 동작 벡터(330)를 통해 쉬프트(shift)되고, 상기매크로 블록(302)의 코딩값에서 감산된다(데이터 경로(231) 참조).
그래서, 상기 동작 추정은 두개의 동작 벡터 요소들(components)을 가지는 동작 벡터(330)의 결과를 가지며, 제 1방향 x와 제 2방향 y를 따르는 제 1동작 벡터 요소(BVx)와 제 2동작 벡터 요소(BVy)는 다음과 같다.
상기 동작 벡터(330)는 상기 화상 블록에 할당된다. 그래서, 도 3에 도시되는 상기 화상 코딩 유닛은 상기 모든 화상 블록들과 매크로 블록들에 대한 동작 벡터(330)를 제공한다.
도 1a는 도 3에서 예시되는 장치를 이용하여 코딩되도록 하는 디지털화 된 화상(100)을 도시한다.
상기 디지털화 된 화상(100)은 코딩 정보가 할당된 픽셀들(101)을 가진다.
상기 픽셀들(101)은 화상 블록들(102)로 집단화 된다. 상기 화상 블록들(102)은 제 1화상 영역(105)과 제 2화상 영역(106)으로 집단화 된다.
이후의 설명에서, 상기 제 1화상 영역(105)에서 요구되는 품질은 상기 제 2화상 영역(106)의 품질을 위해 요구되는 것보다 더 엄격하다고 가정한다.
상기 제 1화상 영역(105)의 제 1화상 블록(103)에 대해서 동작 추정이 실시된다. 이러한 결과, 제 1검색 영역(114)은 이전 화상 그리고/ 또는 후속 화상(110)에서 정의된다.
상기 제 1화상 블록과 같은 형태와 크기인 시작(starting) 영역(113)을 기반으로 하여, 상기 다음의 오류(E)는 결정되는 각 경우에 존재하며, 한 픽셀에 의해서 쉬프트되거나 상기 픽셀 분리의 단편 혹은 복수에 의해서(예를 들어서 픽셀의 절반(절반-픽셀 동작 추정)에 의해서) 쉬프트 되고, 쉬프트되는 각 경우 상기 시작 영역(113)은 다음을 통해 실시된다.
여기서
- i, j는 순차적인 표시들(indices)이다.
- n은 제 1방향에 따르는 제 1화상 블록의 픽셀들 수이다.
- m은 제 2방향에 따르는 제 1화상 블록의 픽셀들 수이다.
- xi,j는 상기 제 1화상 블록 내의 위치(i,j)에서의 픽셀에 대한 코딩 정보이다.
- yi,j는 해당하는 동작 벡터를 통해 쉬프트 된 상기 이전 화상의 해당 위치에서의 픽셀에 대한 코딩 정보이다.
상기 오류(E)는 상기 이전 화상(110)의 각 쉬프트를 위해 계산되고, 가장 낮은 값을 가지는 오류(E)가 있는 상기 쉬프트(=동작 벡터)로 부터의 상기 화상 블록은 상기 제 1화상 블록(103)과 가장 유사한 것으로 선택된다.
예시적인 실시예에서, 각 경우의 검색 영역은 상기 이전 화상(110)의 제 1화상 영역의 제 1화상 블록의 관련되는 위치들에 해당하는 시작 위치(113) 정도에서 수평 방향 및 수직방향 모두에서 4개 픽셀 간격을 포괄한다. 그래서 코드화 되는제 1동작 벡터(117)의 최대 크기는 이러한 경우픽셀 간격들이다(도 1b 참조).
도 1c는 제 2화상 영역(106)의 제 2화상 블록(104)에 대한 제 2동작 추정을 도시한다. 동작 추정의 목적에 대한 기본 절차는 상기 제 2동작 추정에 대해서도 상기 설명한 바와 같다.
제 2 동작 추정에 대해서, 상기 제 2 화상 영역(106)의 품질에 대한 요구사항이 상기 제 1화상 영역(105)에 대한 것보다 엄격하지 않으므로 제 2검색 영역(116)은 작아진다.
이러한 이유 때문에, 제 2검색 영역(116)의 크기는 시작 위치(115)에서부터 각 방향에 대해서 단지 2개 픽셀들이 된다. 그래서, 제 2화상 블록(104)에 대해서 코드화 되는 제 2동작 벡터(118)의 최대 크기는픽셀 간격들이다.
이러한 예제에서 상기 제 2 동작 벡터(118) 코딩에 필요한 연산은 상기 제 1동작 벡터(117)에 필요한 것에 비해 대단히 줄어든다는 것을 볼 수 있다.
이러한 예시적인 보기를 기반으로, 예시적인 실시예의 화상 블록에 대한 검색 영역 크기는 상기 이전 화상(100)을 코딩하는데 사용되는 양자화 단계들을 나타내는 양자화 파라메터에 달려있다.
검색 영역의 크기(S)는 다음과 같은 법칙을 통해 얻어진다.
S = 15 - QP/2
여기서,
- S는 검색 영역의 크기이다.
- QP는 양자화 파라메터이다.
상기 양자화 파라메터(QP) 는 H.263의 일반 헤더(header) 데이터에 포함되는 인수(factor)이며, 상기 양자화에 대한 시작값으로 사용된다.
그래서 상기 검색 영역의 크기(S)는 높은 화상 품질을 얻기위해 상기 양자화 파라메터(QP)가 작아질 수록 커진다.
상이한 값(different value)의 범위를 가지는 상이한 길이의 동작 벡터들에 대한 상이한 코드들을 가지는 표들의 수는 상기 동작 벡터들의 가변 길이 코딩에 사용된다.
상기 양자화 파라메터(QP)는 상기 검색 영역의 크기(S), 그리고 그로인한 상기 동작 벡터의 최대 길이에 일치하는 값의 범위를 가지는 가변 길이 코딩을 표의 구성원으로하는 가변 길이 코딩을 위한 표를 선택하는데 사용된다.
상기 설명된 예시적인 실시예에 대한 다수의 대안적인 예제들이 다음에 설명된다.
동작 추정의 종류 및 그로인해 형성되는 유사한 측정 방법은 본 발명과는 무관하다.
그래서, 예를 들어, 다음의 법칙 역시 상기 오류(E)를 형성하는 데 사용될 수 있다.
또한, 많은 경우에 있어서, 요구되는 데이터 비율의 더 많은 감소는 동작 보상에 대한 차이 화상들의 형성 중에 생성되는 오류 신호의 전송 없이 상기 동작 벡터 만을 전달하는 것으로 충분하다는 것이 도시된다.
본 발명은 상이한 크기의 검색 영역들이 상기 화상 영역들의 화상 블록들의 동작 추정에 대한 화상 영역들에 대해 사용되며, 그 결과 동작 벡터의 코딩에 필요한 데이터 비율의 유연한 감소, 품질에 대한 일치를 달성할 수 있다는 것을 명백하게 보일 수 있다.
다음의 출판물이 본 명세서에 언급되었다.
[1] ITU-T 권고 초안(Draft Recommendation) H.263, 낮은 비트율 통신을 위한 비디오 코딩, 1996년 5월.

Claims (12)

  1. 픽셀들을 가지는 디지털화 된 화상의 동작 추정을 위한 방법에 있어서,
    - 여기서 픽셀들은 화상 블록들로 집단화 되고,
    - 여기서 상기 픽셀은 적어도 제 1화상 영역과 제 2화상 영역으로 형성하기위해 집단화 되며,
    - 여기서 제 1화상 블록의 동작은 선행하는 프리디세서 화상의 상기 제 1화상 블록에 대한 비교 그리고/또는 후속하는 석세서 화상의 제 1화상 블록에 대한 비교로 설명되는 수단을 통해서 제 1동작 벡터를 결정하기위해 제 1화상 영역의 적어도 제 1화상 블록에 대한 제 1검색 영역에서 제 1동작 추정이 수행되고,
    - 여기서 제 2화상 블록의 동작은 선행하는 프리디세서 화상의 상기 제 2화상 블록에 대한 비교 그리고/또는 후속하는 석세서 화상의 제 2화상 블록에 대한 비교로 설명되는 수단을 통해서 제 2동작 벡터를 결정하기위해 제 2화상 영역의 적어도 제 2화상 블록에 대한 제 2검색 영역에서 제 2동작 추정이 수행되며, 그리고
    - 여기서 상기 제 1검색 영역과 제 2검색 영역은 이 경우 상이한 크기들을 가지는 것을 특징으로 하는 동작 추정 방법.
  2. 제 1항에 있어서,
    제 1화상 블록과/또는 제 2화상 블록이 코드화 되는 수단을 통해서, 제 1검색 영역과/또는 제 2검색 영역의 크기는 기 설정된 화상 품질에 맞추어 가변되는것을 특징으로 하는 동작 추정 방법.
  3. 제 2항에 있어서,
    제 1화상 블록과/또는 제 2화상 블록이 양자화 되는 수단을 통해서, 제 1검색 영역과/또는 제 2검색 영역의 크기는 양자화 파라메터에 따라 가변되는것을 특징으로 하는 동작 추정 방법.
  4. 제 1항에서 3항 중 어느 한 항에 있어서, 그 항은 상기 디지털화 된 화상을 코딩하는데 사용되는 것을 특징으로 하는 동작 추정 방법.
  5. 제 4항에 있어서,
    - 여기서 동작 벡터들의 가변 길이 코딩이 수행되고,
    - 여기서 가변 길이 코딩에 대한 다수의 코드들이 내부에 저장되는 상이한 표들이 가변 길이 코딩에 사용되는 것을 특징으로 하는 동작 추정 방법.
  6. 제 5항에 있어서,
    상기 표들은 상기 동작 벡터들의 최대 길이에 일치되는 것을 특징으로 하는 동작 추정 방법.
  7. 픽셀들을 가지는 디지털화 된 화상의 동작 추정을 위한 구성에 있어서,
    - 픽셀들은 화상 블록들로 집단화 되고,
    - 상기 픽셀들은 적어도 제 1화상 영역과 제 2화상 영역으로 형성하기위해 집단화 되며,
    - 제 1화상 블록의 동작은 선행하는 프리디세서 화상의 상기 제 1화상 블록에 대한 비교 그리고/또는 후속하는 석세서 화상의 제 1화상 블록에 대한 비교로 설명되는 수단을 통해서 제 1동작 벡터를 결정하기위해 제 1화상 영역의 적어도 제 1화상 블록에 대한 제 1검색 영역에서 제 1동작 추정을 수행하고,
    - 제 2화상 블록의 동작은 선행하는 프리디세서 화상의 상기 제 2화상 블록에 대한 비교 그리고/또는 후속하는 석세서 화상의 제 2화상 블록에 대한 비교로 설명되는 수단을 통해서 제 2동작 벡터를 결정하기위해 제 2화상 영역의 적어도 제 2화상 블록에 대한 제 2검색 영역에서 제 2동작 추정을 수행하며 ,
    - 상기 제 1검색 영역과 제 2검색 영역은 이 경우 상이한 크기들을 가지는,
    위와 같은 단계들이 수행될 수 있도록 설정된 프로세서를 가지는 것을 특징으로 하는 동작 추정 장치.
  8. 제 7항에 있어서,
    상기 프로세서는 제 1화상 블록과/또는 제 2화상 블록이 코드화 되는 수단을 통해서, 제 1검색 영역과/또는 제 2검색 영역의 크기는 기 설정된 화상 품질에 맞추어 가변되도록 설정되는 것을 특징으로 하는 동작 추정 장치.
  9. 제 8항에 있어서,
    상기 프로세서는 제 1화상 블록과/또는 제 2화상 블록이 양자화 되는 수단을 통해서, 제 1검색 영역과/또는 제 2검색 영역의 크기는 양자화 파라메터에 따라 가변되되도록 설정되는 것을 특징으로 하는 동작 추정 장치.
  10. 제 7항에서 9항 중 어느 한 항에 있어서, 그 항은 화상 코딩 디바이스로 사용되는 것을 특징으로 하는 동작 추정 장치.
  11. 제 7항에서 9항 중 어느 한 항에 있어서, 그 항은 화상 코딩 디바이스로 사용되며,
    상기 프로세서는,
    - 상기 동작 벡터들의 가변 길이 코딩이 수행되고,
    - 가변 길이 코딩에 대한 다수의 코드들이 내부에 저장되는 상이한 표들이 가변 길이 코딩에 사용되도록 설정되는 것을 특징으로 하는 동작 추정 장치.
  12. 제 11항에 있어서,
    상기 프로세서는,
    상기 표들이 상기 동작 벡터들의 최대 길이에 일치되도록 설정되는 것을 특징으로 하는 동작 추정 장치.
KR10-2001-7001668A 1998-08-07 1999-08-02 픽셀들을 가지는 디지털화 된 화상에서 동작을추정하기위한 방법 및 장치 KR100367468B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19835845A DE19835845A1 (de) 1998-08-07 1998-08-07 Verfahren und Anordnung zur Bewegungsschätzung in einem digitalisierten Bild mit Bildpunkten
DE19835845.8 1998-08-07

Publications (2)

Publication Number Publication Date
KR20010072338A true KR20010072338A (ko) 2001-07-31
KR100367468B1 KR100367468B1 (ko) 2003-01-10

Family

ID=7876858

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-7001668A KR100367468B1 (ko) 1998-08-07 1999-08-02 픽셀들을 가지는 디지털화 된 화상에서 동작을추정하기위한 방법 및 장치

Country Status (7)

Country Link
US (1) US7023916B1 (ko)
EP (1) EP1101196B1 (ko)
JP (1) JP3597781B2 (ko)
KR (1) KR100367468B1 (ko)
CN (1) CN1129870C (ko)
DE (2) DE19835845A1 (ko)
WO (1) WO2000008601A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10147535B4 (de) * 2001-09-26 2004-12-02 Sci-Worx Gmbh Vorrichtung zur Bewegungsschätzung und Bewegungsschätzungsablaufprogramm
JP4148041B2 (ja) * 2003-06-27 2008-09-10 ソニー株式会社 信号処理装置および信号処理方法、並びにプログラムおよび記録媒体
JP4798558B2 (ja) * 2005-08-11 2011-10-19 学校法人東京理科大学 動物体検出装置および動物体検出方法
US8311111B2 (en) 2008-09-11 2012-11-13 Google Inc. System and method for decoding using parallel processing
WO2011125211A1 (ja) 2010-04-08 2011-10-13 株式会社 東芝 画像符号化方法及び画像復号化方法
CN102378002B (zh) * 2010-08-25 2016-05-04 无锡中感微电子股份有限公司 动态调整搜索窗的方法及装置、块匹配方法及装置
US9100657B1 (en) 2011-12-07 2015-08-04 Google Inc. Encoding time management in parallel real-time video encoding
US9794574B2 (en) 2016-01-11 2017-10-17 Google Inc. Adaptive tile data size coding for video and image compression
US10542258B2 (en) 2016-01-25 2020-01-21 Google Llc Tile copying for video compression

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3733038C2 (de) 1987-09-30 1994-01-05 Siemens Ag Verfahren und Schaltungsanordnung zur Bilddatenreduktion für digitale Fernsehsignale
DE3837590A1 (de) 1988-11-05 1990-05-10 Ant Nachrichtentech Verfahren zum reduzieren der datenrate von digitalen bilddaten
US5537155A (en) 1994-04-29 1996-07-16 Motorola, Inc. Method for estimating motion in a video sequence
DE19509418A1 (de) 1995-03-16 1996-09-19 Thomson Brandt Gmbh Verfahren und Schaltungsanordnung zur Unterabtastung bei Bewegungsschätzung
US5768537A (en) 1996-02-22 1998-06-16 International Business Machines Corporation Scalable MPEG2 compliant video encoder
DE19633581C1 (de) 1996-08-20 1998-02-26 Siemens Ag Verfahren zur Auswahl eines wahrscheinlichen Bewegungsvektors für eine Echtzeitbewegungsschätzung bei Bewegtbildsequenzen

Also Published As

Publication number Publication date
WO2000008601A1 (de) 2000-02-17
US7023916B1 (en) 2006-04-04
CN1129870C (zh) 2003-12-03
CN1317125A (zh) 2001-10-10
DE19835845A1 (de) 2000-02-10
KR100367468B1 (ko) 2003-01-10
EP1101196B1 (de) 2002-03-20
EP1101196A1 (de) 2001-05-23
JP3597781B2 (ja) 2004-12-08
DE59901028D1 (de) 2002-04-25
JP2002522933A (ja) 2002-07-23

Similar Documents

Publication Publication Date Title
US11451793B2 (en) Parameterization for fading compensation
US6366705B1 (en) Perceptual preprocessing techniques to reduce complexity of video coders
KR100242406B1 (ko) 디지탈 비디오 동화상의 움직임 보상 방법
US7463684B2 (en) Fading estimation/compensation
US7609767B2 (en) Signaling for fading compensation
JP4412672B2 (ja) 補間された画素値を修正する方法
MXPA04010318A (es) Metodo y dispositivo para indicar parametros del cuantificador en un sistema de codificacion de video.
JP2004112818A (ja) 動きベクトルを符号化又は復号化する方法及び装置
CA2452632A1 (en) Method for sub-pixel value interpolation
JP2859830B2 (ja) ビデオ信号復号化装置
JP2007515115A (ja) 内挿される画素値の計算方法の改良
JP2010104063A (ja) 画素を有するデジタル化された画像の処理のための方法及び装置
JPH04219089A (ja) 画像符号化装置
KR100367468B1 (ko) 픽셀들을 가지는 디지털화 된 화상에서 동작을추정하기위한 방법 및 장치
US7068721B2 (en) Method and configuration for coding a digitized picture, and method and configuration for decoding a digitized picture
KR100240620B1 (ko) 양방향의 반화소 움직임 추정을 위한 대칭 탐색 윈도우를 형성하는 방법 및 장치
Choi et al. Adaptive image quantization using total variation classification
Cieplinski A review of image and video coding standards
AU2007237319B2 (en) Method for sub-pixel value interpolation

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Publication of correction
FPAY Annual fee payment

Payment date: 20061129

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee