KR20110028562A - 비디오 압축 방법 - Google Patents

비디오 압축 방법 Download PDF

Info

Publication number
KR20110028562A
KR20110028562A KR1020117005251A KR20117005251A KR20110028562A KR 20110028562 A KR20110028562 A KR 20110028562A KR 1020117005251 A KR1020117005251 A KR 1020117005251A KR 20117005251 A KR20117005251 A KR 20117005251A KR 20110028562 A KR20110028562 A KR 20110028562A
Authority
KR
South Korea
Prior art keywords
block
frame
filter
complexity
selecting
Prior art date
Application number
KR1020117005251A
Other languages
English (en)
Other versions
KR101131689B1 (ko
Inventor
아메르즈 에릭
반코스키 제임스
라반웨이 스코트
쉬우 야오유
밀러 댄
그레인지 아드리안
윌킨스 폴
Original Assignee
구글 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구글 인코포레이티드 filed Critical 구글 인코포레이티드
Publication of KR20110028562A publication Critical patent/KR20110028562A/ko
Application granted granted Critical
Publication of KR101131689B1 publication Critical patent/KR101131689B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명에 따르면, Y적어도 하나의 블록을 갖는 적어도 하나의 프레임을 갖으며 각 블록은 화소 어레이를 갖는, 비디오 데이터 압축 방법이 개시된다. 본 방법은 각 블록의 화소를 계수들로 변환하며 상기 계수들의 최적의 전송 순서를 생성한다. 본 방법은 상기 데이터 비트스트림을 분할하며 각 분할을 독립적으로 코딩함으로써 압축된 비디오 데이터를 처리하는 속도를 최적화한다. 본 방법은 각각의 주어진 블록에 관련된 적어도 하나의 메트릭에 의존하여 각각의 주어진 복수의 화소에 대해서 보간 방법을 선택함으로써 분할 화소 모션모션측한다. 본 방법은 또한 데이터 전송 동안에 질의 손실을 줄이기 위해서 단지 기준 프레임으로서 현재의 프레임 직전의 프레임 전의 프레임을 이용하여 현재의 프레임에 대한 에러 복구를 향상시킨다. 향상된 모션 벡터 코딩 역시 제공된다.

Description

비디오 압축 방법{VIDEO COMPRESSION METHOD}
본 출원은 2003년 5월 12일자 출원된 미합중국 임시특허출원 제60/469,187호 및 2003년 11월 14일자 출원된 미합중국 특허출원 제10/713,807호의 우선권을 주장한다.
본 발명은 비디오 데이터에 관한 것으로서, 특히, 비디오 데이터를 가능한 효율적으로 코딩, 디코딩, 압축 및 전송하는 방법들 및 시스템들에 관한 것이다.
데이터 전송은 보통은 대역폭 및 처리량 한도에 의해서 제한된다. 극소의 시간에 무한한 량의 정보를 전달 및 수신하는 것은 불가능하다. 전송되는 정보의 량 및 질을 극대화하기 위해서, 어떤 경우에는 정보가 전송시에 압축 또는 코드되며 수신시에는 압축해제 또는 디코드된다. 용량이 크지 않으면, 일반 텍스트는 쉽게 그리고 신속하게 전송된다. 그러나, 비디오 데이터는 컬러, 명도 및 때로는 스테레오 오디오 정보의 특징을 포함한다. 짧은 비디오 클립들을 정의하는데도 대용량의 데이터가 요구된다. 그러한 데이터의 전송 및 코딩은 가능한 효율적이어야 하는데, 즉, 전송할 정보가 가능한 적어야 한다.
비디오 압축은 일반적인 데이터 압축 기술의 부분집합으로서, 이에 따라서 신호는 수들의 더 작은 세트로 압착 또는 압축된다. 그러면 이러한 수들은 하드 드라이브상에서 더 적은 공간을 차지하거나, 또는 네트워크상에서 전송하는데 시간을 덜 차지하게 된다. 이 수들이 다시 사용되기 전에, 일련의 수들을 그 원래의(또는 적어도 유사한) 형태로 확장하기 위해서 하나의 압축해제 알고리즘이 적용된다.
비디오 압축은, 압축비 즉, 저장되거나 전송되는 일련의 수들에 적용될 수 있는 압착량을 증가시키기 위해서, 신호가 디지털화된 비디오로서 나타나는 것으로 알려져있다는 사실을 활용한다. 비디오 및 오디오의 대폭적인 압축은 데이터가 손실되는 손실 알고리즘(lossy algorithms), 즉 비가역적 알고리즘으로 간주된다. 왜냐하면 이들은 원래의 정보의 일부분이 폐기되거나 또는 잃어버리기 때문이다. 즉, 재구성된 수의 열들이 원래의 것과 정확히 일치하지 않는다. 이것은, 디지털화 과정의 해상도와 비교할 때, 우리가 비디오 및 오디오를 보는 정밀도가 완전하지 않기 때문에 허용된다. 비디오 신호가 약간 왜곡될 수는 있지만, 이 정도는 여전히 인식가능하다. 압축 알고리즘이 최소의 왜곡 또는 손실로 원래의 신호를 충실하게 재생하는 정도는 알고리즘의 성공의 척도이다.
비디오 및 오디오 신호들을 압축하는데는, 기술적인 문제 및 장치 비용을 포함하여, 여러 합리적인 이유가 있다. 한가지 우선적인 문제는 데이터 전송 비용이다. 인터넷이 21세기 동안 사실상의 데이터 전달 플랫폼으로 성숙함에 따라서, 비디오테이프, 영화, 및 방송과 같은 아날로그 매체는 인터넷 및 인터넷관련 기술에 기반을 둔 디지털 매체 인프라구조가 대신하게 될 것이다. 이러한 디지털 인프라구조는, 만일 요구되기만 하면, 지구상의 임의의 두 개의 컴퓨팅 장치 사이에 데이터가 전달되도록 한다. 그러나, 이러한 데이터가 전달될 수 있는 속도는 다수의 인자에 의존하게 된다. 제한되는 경우에는, 일세기 이상 전에 깔리고 아날로그 음성 통신에 사용되는 동선은 초당 9600 비트의 낮은 속도로 데이터를 전송하는 모뎀 기술(모뎀은 MOdulation/DEModulation을 의미한다)에 사용된다. 셀룰러와 같은 무선망에서 음성을 전달하는데 그와 유사한 속도가 사용된다. 최근에는, 케이블 모뎀, DSL, 및 위성 기술로 인해서 가정의 사용자들은 여섯 자리 데이터 속도(초당 100,00 내지 백만 비트)를 사용하게 되었다. 고급 응용에서는, 광 섬유는 기가비트 범위(초당 10억 비트)나 그 이상으로 데이터 속도를 가능하게 한다.
주어진 응용에 어떤 데이터 속도가 사용되든, 데이터 전송에는 비용이 든다. 현재, 인터넷상에서 일 메가바이트(8백만 비트)를 전송하는 비용은 보통은 낮은 용량의 경우에 어디서나 5센트부터이며, 매우 많은 용량의 경우에는 일 센트까지 떨어진다(이 숫자는 수신단부에서의 비용은 포함하지 않은 것이다). 그러므로, 하나의 장소에서 다른 장소로 일 메가바이트의 데이터를 전달하기 위한 비용은 항상 일 페니 이상이다.
비디오 데이터 압축 분야에서 많은 연구가 수행되었다. 본 발명의 양수인인, 뉴욕 클리프턴 파크 소재의 On2 Technologies(원래는 Duck Corporation으로 알려짐)은 이전에 VP3 및 VP5와 같은 코덱을 생산하였으며, Microsoft Corporation은 MPEG와 같은 코드를 생산하였다. 현재의 비디오 코덱의 특징 중에는, 이산 코사인 변환 압축, 엔트로피 코딩, 및 모션 벡터의 차분 코딩 포함된다. 또한 종래의 코덱은 기준 프레임을 활용하여, 데이터 패킷이 손실되거나 와전될 때 기준 프레임을 참조하여 데이터가 검색될 수 있다. 이러한 특징 모두 및 그에 따른 문제점들이 이하 더 상세히 논의된다.
DCT(이산 코사인 변환) 기반 비디오 압축 시스템에서, 8 x 8 화소 블록 또는 예측 에러신호 데이터는 한 세트의 64 주파수 계수(1개의 DC 값 및 63개의 AC 값들)로 변환되며, 이들은 한 세트의 토큰들로 양자화 및 변환된다.
전형적으로, 더 높은 주파수의 AC 계수들은 크기가 더 작으며, 따라서 양자화에 이어서 비제로(non zero)가 덜 될 것이다.(즉, 제로가 될 확률이 높다). 결과적으로, 토큰화되기 전에, 이 계수들은 종종 가장 낮은 주파수 계수(DC 값)으로 시작하여 가장 높은 주파수 AC 계수로 끝나는 오름차순으로 배열된다. 때때로 "지그재그 순서"라고도 하는 이러한 스캔 순서는 시작에서 비제로 값들을 함께 그룹화하며 끝에서 제로 값들로 그룹화하는 경향이 있으며 이렇게 하여 더 효율적인 압축을 수행한다.
그러나, 이처럼 고정된 스캔 순서는 좀처럼 최적이 아니다. 예를 들어, 비월된 비디오 자료를 인코딩할 때, 어떤 높은 주파수 계수들은 더 두드러진다. 이러한 사실은 코덱들(예를 들어, MPEG-2)의 예들이 있는 종래 기술에서 반영되는데, 이는 비월된 비디오를 코딩할 때 사용하기 위한 다른 대안적인 스캔 순서를 요구한다.
특정한 하드웨어 장치에 사용하기 위해 코덱을 최적화할 때, 다수의 태스크를 병렬로 수행하도록 장치가 제안할 수도 있는 임의의 설비의 완전한 사용을 보장하고, 디코드 과정의 개별 부분에 병목현상이 일어나는 정도를 제한하는 것이 중요하다.
본 발명의 비트스트림은, 대부분의 다른 비디오 코덱과 공통으로, 크게 말해서, 두 개의 주요 카테고리로 분할될 수 있는 엔트로피 코드 토큰들을 포함하는 것으로 기술되는데, 이 두개의 카테고리는 예측기(predictor) 또는 P 토큰들 및 예측(prediction) 에러 또는 E 토큰들이다. P 토큰들은 하나의 화상의 블록 또는 지역을 코드하는데 사용되는 방법 또는 모드를 설명하며, 프레임간의 모션(움직임)을 기술하는 토큰들이다. E 토큰들은 불완전한 예측으로부터 나오는 임의의 잔여 에러를 코드하는데 사용된다.
엔트로피 코딩은 이것에 의해 비트스트림 내의 특정 P 또는 E 토큰의 표시가 비트스트림 내의 그 토큰의 주파수 또는 그것이 특정 위치에서 발생할 가능성에 따라서 최적화되는 과정이다. 예를 들어, 매주 자주 발생하는 토큰은 자주 발생하지 않는 토큰보다 더 작은 비트 수를 사용하여 표시된다.
가장 일반적인 엔트로피 코딩 기술중 두가지는 허프만 코딩 및 산술 코딩이다. 허프만 코딩에서 각 토큰은 가변 길이 비트(또는 코드) 패턴에 의해서 표시된다. 산술 코딩은 계산이 더 복잡한 기술이지만 각 토큰에 대해서 전체 비트 수를 사용하는 제한사항이 없다. 산술 코더를 사용하여, 비트당 1/2의 평균 비용으로 매우 일반적인 토큰을 코드하는 것이 완벽하게 가능하다.
많은 멀티미디어 장치들은 엔트로피 코딩 작업에 매우 적합한 코프로세서 및 더 다양한 기능의 주 프로세서를 갖는다. 결국, 병렬화를 목적으로, 비트스트림의 인코딩 또는 디코딩 과정은 때로 엔트로피 관련 작업 및 논엔트로피 관련 작업으로 분할된다. 그러나, 주어진 비디오 클립에서, 데이터 속도가 증가함에 따라서, 인코드/디코드를 위한 토큰의 수는 급격히 상승하여 엔트로피 코딩에 병목현상이 일어날 수 있다.
종래의 비트스트림에서, 이러한 병목현상을 제거하기 위해서 엔트로피 코딩의 계산 부하를 재분배하는 것은 매우 어렵다. 특히, 디코드 측에서, 토큰들은 정상적으로는 한 번에 한개씩 이들이 인코드되는 순서로 디코드되어야 한다. 또한 프레임 레벨 이외의 방법들 또는 엔트로피 엔코딩(예를들면, 허프만 및 산술 코딩)을 혼합하는 것은 매우 어렵다.
관례에 따라, 대부분의 최근의 비디오 코덱은 차분 코딩 방법을 이용하여, 모션 벡터의 (x,y) 성분들을 코드한다. 즉, 각각의 벡터는 이전 벡터에 관련하여 코드된다. 예를 들어, 두 개의 벡터 (7,3) 및 (8,4)를 고려해 본다. 이 경우에 제 2 벡터는 (1,1)로서, 즉, (7+1, 3+1)로 인코드된다.
이러한 방법은, 모션 벡터가 코드되는 대부분의 블록들 또는 영역들이 그 이웃과 유사한 모션을 나타낼 때 매우 잘 적용된다. 이것은 때로 예를 들어 패닝(panning)의 경우로 나타날 수 있다. 그러나, 모션필드가 불규칙하거나 또는 상이한 모션 특성을 갖는 배경 및 전경 사이에 주기적인 변동이 있을 때에는 잘 적용되지 않는다.
대부분의 최근의 비디오 코덱에서, 모션예측은 압축 과정의 중요한 부분이다. 모션 예측은 화상의 물체나 영역의 모션들이 하나 이상의 프레임들에서 모델화되며 하나 이상의 "모션벡터들"이 이러한 모션을 표시하는 비트스트림으로 전달되는 과정이다. 대부분의 경우에 하나의 화상(image)에서 이 모션을 완벽하게 모델화하는 것은 불가능하여, 모션 정보에 더해서 잉여 에러 신호를 코드하는 것이 필요하다.
본질적으로, 각각의 모션 벡터는 인코드되어야 하는 현재 프레임 내의 영역과 유사한 이전에 인코드된 프레임 내의 영역을 지적한다. 잔여 에러 신호는 현재 프레임내의 실제 값으로부터 각 화소의 예측된 값을 감산함으로써 획득된다.
많은 현대의 비디오 코덱은 모션의 예측을 위한 지원을 서브 화소 정밀도로 제공함으로서, 예를 들면, 반 또는 사분의 일 화소 모션 추정을 제공함으로써 과정을 확장한다. 부분 화소 데이터 점들을 생성하기 위해서, 실제 (즉, 정렬된 풀 화소) 데이터 점들에 적용되는 보간 기능 또는 필터의 어떤 형태를 이용하는 것이 필요하다.
초기의 코덱은 일반적으로 첨부된 도 1에 도시된 바와 같이 간단한 쌍일차 보간을 사용하였다. 이 예에서, A,B,C 및 D는 완전한 화소 정렬 데이터 점들이며 x,y 및 z는 하프 화소 정렬 점들이다. 점 x는 X 방향의 정렬된 하프 화소이며 다음의 식을 이용하여 계산될 수 있다.
x = (A +B/2) (1)
점 y는 Y방향으로 정렬된 하프 화소이며 다음의 식을 이용하여 계산될 수 있다.
y = (A +C/2) (2)
점 z는 X 및 Y 방향으로 정렬된 하프 화소이며 다음 식을 이용하여 계산될 수 있다.
z = (A + B +C + D/2) (3)
후자의 코덱은, 쌍입방(쌍3차; bicubic) 필터들과 같은, 더 복잡한 보간 필터들의 사용으로 이동하는 경향이 있는데, 이는 화상의 손상을 덜 악화시키는 경향이 있다. 도 2에 도시된 예에서, x는 정렬된 두 개의 완전한 화소 점들 B 및 C 사이의 중간에 놓이는 하프 화소 점이다. 쌍입방 필터에 정수 근사를 사용할 때 다음 식을 이용하여 계산될 수 있다.
x = (-A + 9B +9C -D)/16 (4)
전술된 바와 같은 필터들이 더 예리한 모양의 결과를 생성하는 경향이 있지만, 여러 프레임상에서 반복하여 적용하면 어떤 상황에서는 오류 텍스쳐 또는 오류 외형과 같은 바람직하지 않은 구조물을 야기시킨다.
*신뢰성없는 또는 의문의 데이터 링크에서 압축된 비디오 데이터를 전송할 때, 비디오 코덱이 비트스트림 내의 에러에 극도로 민감함에 따라서, 데이터가 손실 또는 손상되는 것을 복구하기 위한 메카니즘이 존재하는 것이 중요하다.
그러한 링크들의 신뢰성있는 데이터 전송을 위한 여러 기술 및 프로토콜이 존재하며, 이들은 전형적으로 에러 검출, 및 어떤 유형의 에러가 수정되도록 하는 부가적인 데이터의 재전송 또는 사용에 의존한다. 많은 상황에서, 기존의 기술은 적합하지만, 제한된 대역 링크상에서 비디오 회의의 경우에 전술된 방법중 어느 것도 이상적이지 못하다. 손실된 데이터 패킷의 재전송은 실제적이지 않을 수 있는데 왜냐하면, 에러 수정 비트 또는 패킷의 사용이 대역폭이 이미 심각하게 제한되는 상황에서는 허용되지 않을 수 있는 반면에, 단부와 간부간 지연을 증가시킬 것이기 때문이다.
대안의 방법은 단순히 디코더에서 에러를 검출하고 그것을 인코더에 알리는 것이다. 인코더는 이어서 복구 프레임을 디코더로 전송할 수 있다. 이러한 방법은 링크상의 에러율이 예를 들어, 매 10-20 프레임당 하나 이상의 에러와 같이, 매우 높으면 적합하지 않을 수 있다.
복구 프레임의 가장 간단한 형태는 키 프레임 또는 인트라 온리(intra-only) 프레임이다. 이것은 이전의 프레임 또는 그 안의 데이터에 어떤 식으로든 의존하지 않는 프레임이다. 키 프레임과 관련된 문제는 이들이 보통은 비교적 크다는 것이다.
본 발명의 목적은 효율적이며 신뢰성있는 비디오 압축 방법 및 코덱을 제공하는 것이다.
본 발명의 또 다른 목적은 적응 방식으로 이산 코사인 변환을 수행할 수 있는 비디오 압축 방법 및 코덱을 제공하는 것이다.
본 발명의 또 다른 목적은 채용되는 하드웨어 장치의 자원을 최적화시키는 엔트로피 코딩을 수행하는 비디오 압축 방법 및 코덱을 제공하는 것이다.
본 발명의 또 다른 목적은 모션 벡터 코딩을 향상시키는 비디오 압축 방법 및 코덱을 제공하는 것이다.
본 발명의 또 다른 목적은 부분적인 화소 모션 예측을 정확하고 효율적으로 수행하는 비디오 압축 방법 및 코덱을 제공하는 것이다.
본 발명의 또 다른 목적은 비디오 회의 환경에서도, 에러 복구를 효율적으로 수행하는 비디오 압축 방법 및 코덱을 제공하는 것이다.
전술된 그리고 다른 목적들은 본 발명인, 적어도 하나의 블록을 갖는 적어도 하나의 프레임을 갖으며 각 블록은 화소 어레이를 갖는, 비디오 데이터 압축 방법에 의해서 달성된다. 본 발명의 방법은, Ⅰ) 각 블록의 화소를 계수들로 변환하며 상기 계수들의 최적의 전송 순서를 생성하는 단계;
Ⅱ) 상기 데이터 비트스트림을 분할하며 각 분할을 독립적으로 코딩함으로써 압축된 비디오 데이터를 처리하는 속도를 최적화하는 단계;
Ⅲ) 각각의 주어진 블록에 관련된 적어도 하나의 메트릭에 의존하여 각각의 주어진 복수의 화소에 대해서 보간 방법을 선택함으로써 분할 화소 이동을 예측하는 단계; 및
Ⅳ) 데이터 전송 동안에 질의 손실을 줄이기 위해서 단지 기준 프레임으로서 현재의 프레임 직전의 프레임 전의 프레임을 이용하여 현재의 프레임에 대한 에러 복구를 향상시키는 단계중 적어도 하나를 포함한다.
본 발명의 계수 재정렬 특징에 따라서, 본 발명이 방법은 각 블록의 화소들을, 각각 하나의 계수 위치와 하나의 값을 갖는 계수들로 변환하며, 각각의 계수 위치에 관련된 위치 값을 판단한다. 상기 계수들의 최적의 전송 순서는 각각의 계수 위치의 위치 값들을 기초로 생성되며, 상기 계수는 그처럼 판단된 순서로 전송된다. 바람직하게는, 이 계수들의 전송 순서는 비디오 데이터의 각 프레임에 대해서 동적으로 재정렬된다. 상기 변환 단계는 바람직하게는 상기 화소들을 이산 코사인 변환 계수들로 변환한다. 이 계수들의 전송 순서는 그 계수들과 함께 전송된다. 바람직하게는, 각각의 블록은 동일 수의 계수들과 계수 위치들을 갖으며, 각각의 대응하는 각각의 계수 위치는 동일 정보를 하나의 블록에서 다른 블록으로 옮긴다.
전송되는 데이터의 량을 감소시키기 위한 노력으로서, 계수 정렬 데이터의 전송은 프레임들 간의 계수정렬의 변화로 제한될 수 있다. 대안으로서 또는 부가하여, 전송 순서는 계수들의 대역로 합병되며, 각각의 대역은 전에 판단된 수의 랭크에 의해서 조직된 복수의 계수들을 갖는다. 이 경우에, 단지 대역 정보만이 계수들과 함께 전송될 수 있다. 바람직하게는, 단지 대역 정보만이 전송되는데 여기서 계수는 프레임간에 대역을 변경시킨다. 또 다른 대안으로서, 모든 대역 정보는 항상 전송될 수도 있다.
계수들을 재정렬하는 것은 또한 키 프레임의 준비를 포함할 수 있다. 본 발명은 항상 완전히 자기 인코드되며 이전 프레임으로부터 또는 이전 프레임에 대해서 정보를 요구하지 않는 키 프레임을 제공할 수 있다. 그러한 경우에, 인코더는 주어진 프레임이 키 프레임인지를 판단한다. 주어진 프레임이 키 프레임으로 판단될 때, 키 프레임에 대해서 계수들의 전체 전송 순서가 전송된다. 주어진 프레임이 키 프레임이 아니라고 판단될 때, 이전 프레임으로부터 주어진 프레임으로 계수들의 전송 순서의 변경만이 전송된다.
전술된 바와 같이, 본 발명은 데이터 비트스트림을 분할하고 각각의 분할을 독립적으로 코딩함으로써 압축된 비디오 데이터를 처리하는 속도의 최적화를 시도한다. 특히, 본 발명은 비디오 데이터를 적어도 두 개의 데이터 파티션으로 분할하며, 각 데이터 파티션에 대해서 최적의 엔트로피 코딩 방법을 선택한다. 이처럼 선택된 엔트로피 코딩 방법은 각각의 데이터 파티션에 적용된다. 일 실시예에서, 비디오 데이터는 예측기 토큰 데이터 파티션 및 에러 토큰 데이터 파티션으로 분할되며, 바람직하게는, 각각의 데이터 파티션에는 허프만 코딩 및 산술 코딩과 같은 상이한 엔트로피 코딩 방법이 사용된다. 상이한 데이터 파티션에 대한 여러 디코딩 과정들이 비동기 및/또는 독립적으로 수행될 수 있다. 이것은, 하드웨어에서 적어도 두 개의 서브프로세서를 제공하므로 수행될 수 있는데, 하나의 데이터 파티션은 하나의 서브프로세서에 의해서 디코드되며, 또 다른 데이터 파티션은 또 다른 서브프로세서에 의해서 디코드된다. 주어진 데이터 파티션에 대해서 사용되는 엔트로피 코딩 방법은 주어진 데이터 파티션의 크기에 기초할 수 있다.
이 방법 및 코덱의 하나의 바람직한 실시예에서, 예측기 토큰 데이터 파티션은 판독되어 예측기 블록으로 변환된다. 에러 토큰 데이터 파티션 역시 판독되어 계수로 변환되어 에러 블록으로 변환된다. 예측기 블록 및 에러 블록은 합산되어 화상 블록을 형성한다. 전술된 바와 같이, 적어도 두개의 서브프로세서를 제공하는 것이 바람직하며, 이 단계들중 일부는 하나의 서브프로세서에서 수행되며 단계들중 나머지는 또 다른 서브프로세서에서 수행되는 것이 바람직하다. 특히, 에러 토큰 데이터 파티션을 판독하며 에러 토큰 데이터 파티션을 계수로 변환하는 단계들은 바람직하게는 빠른 엔트로피 최적화 서브프로세서에 의해서 수행되며, 다른 단계들은 바람직하게는 범용 서브프로세서에 의해서 수행된다.
본 발명의 방법은 데이터 및 코드 캐시 미스들을 회피하는 방법으로 비트스트림의 디코더 수행을 최적화한다. 코드 캐시에 적합한 가능한 많은 고유의 디코더 코드의 기능들이 그곳에 저장된다. 이 단계로부터의 코드는 데이터 캐시에 적합한 가능한 많은 블록들에 대해서 실행된다. 디코더의 코드의 고유 기능의 다음 세트가 수집되며, 모든 비트스트림이 판독되었으며 데이터의 블록 각각이 생성되었을 때 까지 과정이 반복된다.
비트스트림의 디코더 수행을 최적화시키는 또 다른 특징은, 각각의 서브태스크를 분리된 처리기로 지정함으로써 서브프로세서의 활용을 최적화시키는 것이다. 바람직하게는, 에러 토큰들을 비트스트림으로 부터 판독하며 이들을 빠른 엔트로피 최적화 서브프로세서상의 계수들로 변형하는 디코더의 부분이 빠른 엔트로피 최적화 서브프로세서에서 실행된다. 예측기 토큰들을 비트스트림으로 부터 판독하며 이러한 토큰들로부터 필터된 예측기 블록을 생성하는 디코더의 부분이 메모리를 빨리 엑세스하여 서브프로세서상에서 실행된다. 상기 단계로부터의 변환 계수를 에러 신호로 변형하는 디코더의 부분은 변환 코더의 최적화된 수행을 갖는 서브프로세서상에서 실행되며, 예측기 블록을 에러 신호로 가산하는 디코더의 부분은 모션 보상을 위해 최적화되는 서브프로세서상에서 실행된다.
비디오 데이터는 두개의 데이터 파티션으로 분할될 수 있으며, 제 1 데이터 파티션은 상기 프레임의 제 1 영역을 나타내며 제 2 데이터 파티션은 상기 프레임의 제 2 영역을 나타낸다 (예를들면, 상반부 및 하반부 또는 좌반부 또는 우반부). 대안으로서, 비디오 데이터는 세 개의 데이터 파티션으로 분할될 수 있는데, 각각 프레임의 레벨, 순도 및 색상 정보인 세개의 데이터 파티션으로 분할할 수 있다. 또 다른 버전에서는, 세 개의 데이터 파티션이 각각 프레임의 시안, 마젠터, 및 황색 정보로 표시될 수 있다.
전술된 바와 같이, 본 발명은 각각의 주어진 블록에 관련된 적어도 하나의 메트릭에 의존하여 각각의 주어진 다수의 화소들에 대해서 보간 방법을 선택함으로써 부분 화소 모션을 예측하는 특징을 포함한다. 특히, 인코드하기 위해서 주어진 복수의 화소들과 연관된 적어도 하나의 메트릭의 값이 판단되며, 주어진 복수의 화소들을 인코딩하는 보간 방법은 판단된 적어도 하나의 메트릭의 값에 따라서 선택된다. 이 보간 방법은 인코드하기 위해서 주어진 복수의 화소들에 적용되며, 이 과정은 각각의 연속되는 복수의 화소들에 대한 단계들을 반복한다. 적어도 하나의 메트릭은 모션 벡터 길이 및 복잡성 인자 중 적어도 하나가 될 수 있다. 이 보간 방법은 쌍일차, 바이큐빅, 쿼드러틱 및 B-스플라인 보간을 포함할 수 있다. 주어진 복수의 화소들은 전체 프레임 또는 그 서브-부분이 될 수 있다. 상기 주어진 복수의 화소들과 연관된 모션 벡터 길이가 선정된 길이 값보다 짧으며 주어진 복수의 화소들과 연관된 복잡성 인자가 선정된 복잡성 값보다 큰 것으로 판단되면, 바이큐빅 보간이 선택된다. 선정된 길이의 값 및 선정된 복잡성 값이 바람직하게는 주어진 수의 복수의 화소들에서 한번에 설정되며, 가능하게는 프레임당 한번 설정된다.
복잡성 인자는 바람직하게는 주어진 다수의 화소들의 변동으로서, 다음과 같이 계산된다.
C = ( n∑xi 2-(∑xi)2 )/n2
전술된 바와 같이, 본 발명은 데이터 전송 동안에 질의 손실을 줄이기 위해서 기준 프레임만으로서 현재의 프레임 직전의 프레임에 앞서 하나의 프레임을 이용하여 현재의 프레임에 대한 에러 복구를 향상시키는 것을 포함한다. 특히, 본 발명은 손실 또는 손상된 패킷을 생성하는 라인상의 전송과 연관된 질의 손실을 감소시키기 위해서 주어진 프레임에 대해서 단지 기준 프레임으로서 마지막 프레임 전에 코드되는 프레임을 이용하는 것을 포함한다. 이 단계는 주기적 (매 F 프레임들) 및/또는 임의로(어떤 다른 기준에 기초하여) 제한된다.
본 발명의 이러한 특징은 비디오 회의에 매우 적합하다. 특히, 비디오 회의에 대한 각 당사자는 비디오 데이터의 프레임을 압축하여 압축된 비디오 데이터를 마크되는 패킷을 갖는 다른 당사자에 전송하여 패킷의 손실 및 손상이 검출되도록 한다. 임의의 당사자가 패킷이 손실 및 손상되는 것을 검출하면, 검출 당사자로 하여금 송신 당사자에게 신호를 전달하여 모든 나머지 당사자에 의해서 이미 성공적으로 수신 및 디코드된 기준 프레임을 이용하여 인코드된 업데이트 프레임을 송신하도록 한다.
본 발명은 바람직하게는 다음 방법으로 기준 프레임들을 사용할 수 있다. 비디오 프레임들 내의 고정된 간격 F가 인코더에 대해서 선택되어 디코더로 전송될 수 있다. 매 F번째 프레임이 이전에 인코드된 F번째 프레임만을 기준으로 사용하여 인코드된다. 이전 프레임을 기준으로 사용하여 매 F번째가 아닌 프레임을 인코딩한다. 비디오의 각 프레임이 디코더로 전송되어 손실 및 손상이 검출되도록 한다. 이 모든 단계들은 바람직하게는 인코더에서 발생된다. 디코더 측에서는, 코드된 비디오 데이터가 인코더로부터 수신되어 디코더에 의해서 디코드된다. 패킷이 손실되며 손실된 패킷이 비 F번째 프레임과 연관되면, 디코더는 손실된 패킷을 복구하기위해서 다음 F 번째 프레임을 대기한다.
또 다른 대안으로서, 본 발명은 이러한 그리고 이전의 코드된 프레임들로부터 취해진 통계의 메트릭에 의해서 판단된 주변 질보다 더 높게 주기적으로 및/또는 임의로 현재 프레임을 인코드하며 2차 기준 프레임으로서 후속되는 프레임들에 의해서 사용되도록 인코드된 현재의 프레임을 저장한다.
본 발명에 의한 비디오 압축 방법 및 코텍은 효율적이며 신뢰성있으며, 적응 방식으로 이산 코사인 변환을 수행할 수 있고, 채용되는 하드웨어 장치의 자원을 최적화시키는 엔트로피 코딩을 수행하며, 모션 벡터 코딩을 향상시키고, 부분적인 화소 모션 예측을 정확하고 효율적으로 수행하며, 비디오 회의 환경에서도 에러 복구를 효율적으로 수행한다.
이하 본 발명의 여러 가지 실시예를 설명하기로 한다.
동적 계수 재정렬(Dynamic Coefficient Reordering)
DCT (이산 코사인 변환) 기반 비디오 압축 시스템에서, 8×8 블록 화소 또는 예측 에러 신호 데이터는 일련의 64개의 파티션 계수 (1개의 DC값 및 63개의 AC값)로 변환되며, 그런 다음 일련의 토큰으로 양자화되고 변환된다.
전형적으로, 더 높은 파티션의 AC계수들은 크기가 더 작으며 이에 따라 양자화 이후 비제로(non zero)로 덜 될 것이다. 그 결과, 토큰화하기 전에, 계수들은 통상 가장 낮은 파티션 계수(DC값)로 시작하여 가장 높은 파티션 AC계수로 끝나는 올림차순으로 정렬된다. 이 스캔(주사) 순서는 가끔 "지그재그 순서"로 언급되며, 처음에 비제로 값들을 함께 그룹화하고, 끝에는 제로값들로 그룹화하며, 그렇게 함으로써 더 효율적인 압축을 용이하게 한다.
그러나, 이 고정된 주사 순서는 좀처럼 최적은 아니다. 예를 들면, 비월주사 방식의 비디오 자료를 인코딩할 때, 고파티션 계수들이 훨씬 더 두드러진다. 이 사실은 비월 주사 방식의 비디오를 코딩할 때 사용하는 선택 주사 순서를 위임하는 여러 코덱(예로써 MPEG-2)의 예들이 존재하는 선행기술에 반영되어 있다.
본 발명의 한가지 실시예는 코덱이 주사순서를 선택적으로 특별 주문하는 방법으로서, 여기서 계수들은 인코딩되므로 특정 데이터 집합의 특징들을 더 선택적으로 반영할 수 있다.
본 발명에 의하면, 코덱은 하나 이상의 비디오 프레임에서 DCT계수들의 각각에 대하여 제로 대 비제로 값들의 분포의 기록을 유지한다. 이 기록은 비제로될 가능성이 더 있는 계수들이 리스트에서 더 일찌기 나타나도록 하는 관용적인 주사 순서를 생성하는데 이용된다.
코덱은 각 계수에 대한 비제로값들의 평균 크기와 같은 부가 정보를 선택적으로 대조확인하고 이 부가 정보를 주사 순서를 최적화하는데 이용한다.
어떤 경우에는 하나의 새로운 관용 주사 순서를 전송하거나, 혹은 이전에 전송된 주사 순서를 갱신하는 비용은 개선된 계수 코딩 효율로부터 얻어지는 이득을 무효화할 수 있다. 따라서, 갱신이 순 이익을 제공하는지를 판단하기 위하여 비용 이득 분석이 필요할 수 있다.
이러한 분석 결과에 영향을 주는 주요 요인으로는 갱신 비용, 인코딩되는 블록(및 이에 의한 계수들)의 수, 및 새로운 주사 순서가 표준 주사 순서이거나 또는 이전에 인코딩된 주사 순서로부터 벗어나는 범위를 들 수 있다.
하나의 8×8 요소 DCT의 경우, '완전한' 관용 주사 순서 (즉, 64개 계수들의 각각에 대한 새로운 위치)를 코딩하기 위해서는, 384개의 비트(각각 64개 계수×6개 비트)가 필요하다. 코딩되는 블록들(이에 의한 계수들)의 수가 매우 크지 않거나, 혹은 최적 주사 순서가 디폴트 주사 순서(이는 표준 주사 순서 또는 이전에 인코딩된 하나이다)와 매우 상이하지 않는 한, 이 비용은 금지되지 않을 것이다. 이런 말 뒤의 이론적 근거는 디폴트 주사 순서가 관용적인 주사 순서와 유사하다면 매 블록을 코딩할 때 절약된 평균 비트수가 적을 것이며, 이에 따라서 매우 많은 블록들이 주사 순서를 갱신하는 경상비용(오버헤드)을 정당화하기 위하여 코딩되어야 한다. 역으로, 디폴트 주사 순서가 관용 주사 순서와 유사하지 않다면, 블록당 평균 절약은 높아질 것이다.
이 상황을 개선하는 간단한 방법은 변화들을 주사 순서로 코딩하는 것이다. 예를 들면, 각 계수들의 경우, 한 비트가 그 위치를 변경하였는지를 나타내기 위하여 그 한 비트를 그 주사 순서로 코딩하고, 그 다음 적절하다면 그 새로운 위치를 코딩한다. 이로써 더 낮은 갱신 비용을 초래하지만, 여기서의 최악의 상황 시나리오는 새로운 주사 순서가 모든 계수들에 대해 상이하다는 것이며, 이 경우 갱신 비용은 448 비트(64×7)일 것이다.
그러한 접근 방법의 유익한 실시예는 그 갱신 비용이 관용적이고 디폴트적인 주사순서가 가장 유사한 (및 이에 따라서 아마도 비용절약이 가장 낮은) 곳에서 가장 낮고, 그 관용적이고 디폴트적인 주사순서가 매우 유사하지 않을 때 가장 높다라는 것이다.
이러한 상황은 개별적인 계수들 또는 페어(쌍)로 존재하는 계수들의 수준에서 '비용 이득'을 고려함으로써 더욱 개선될 수 있다. 예를 들면, 2개의 계수들이 주사순서로 상호 근접해 있고, 비제로 값의 개연성이 두 개의 계수 모두 거의 동일한 경우를 고려한다. 2개의 계수들 중의 하나 또는 다른 하나에 대한 비제로값들의 수적 변화가 작을 때, 관용적인 주사순서로 2개의 계수들이 위치를 서로 바꾸도록 할 수 있다. 이런 변화를 인코딩하는 것은 14개의 비트(상기 갱신 모델을 가정)의 비용으로 2개의 계수들 모두에 대해 주사 위치를 갱신함을 의미한다. 그럼에도 불구하고 달성된 절약은 무시될 만하다.
이 문제는 특히 고차의 AC계수들에 대해서 타당하다. 여기서, 비제로값들의 파티션는 통상 매우 낮으며, 미세한 변화조차도 계수들의 주사순서상의 위치를 상당히 변화되도록 한다.
관용적인 주사 순서를 각 계수에 대하여 순전히 제로 대 비제로의 분포에 기초를 두는 것이 확실히 타당할 수 있지만, 적절한 다른 요인들이 있다. 전술한 바와 같이, 이들 중 하나의 요인은 비제로 값들의 평균 크기이다. 다른 하나는 어떤 경우에는 양의 상관관계가 하나 이상의 계수들의 값들 사이에 존재한다는 사실이다. 예를 들면, 저차수의 '순 수평'의 AC계수들과 고차수의 '순 수평'의 계수들 사이에 존재한다. 이 경우, 비제로값들의 보급상의 실질적인 차이가 존재하지 않는 한, 상기 저차수의 '순 수평'의 AC계수들과 고차수의 '순 수평'의 계수들이 그들의 원래의 차수(가장 낮은 파티션로부터 가장 높은 파티션)로 유지하는 것이 바람직할 수 있다.
본 발명에 의한 실시예의 바람직한 구성은 주사순서를 갱신하는 비용을 더욱 절약하면서 그러한 문제점들을 고려하는 것이다.
관용적인 주사 순서를 생성하는 과정은 폭넓게는 다음과 같다.
ㆍ DC계수는 항상 먼저 코딩된다 (위치 0).
ㆍ AC계수들을 각 계수에 대해 비제로인 값들의 비율에 기초하여 내림차순으로 정렬한다.
ㆍ 정렬된 리스트를 16개의 변수 크기의 대역(표 1 참조)로 분할한다.
ㆍ 각 대역안에서 지그-재그 주사 순서로 재정렬한다.
표 1에 도시한 바와 같이 16개 대역으로 서브분할하는 것은 일정 범위의 상이한 테스트 클립을 가지는 경험적인 관찰에 기초하고 있으나 반드시 최적이지는 않음을 유의하여야 한다.
바람직한 주사 순서 계수 대역들

대역

첫 번째 계수

마지막 계수

0

1

1

1

2

4

2

5

10

3

11

12

4

13

15

5

16

19

6

20

21

7

22

26

8

27

28

9

29

34

10

35

36

11

37

42

12

43

48

13

49

53

14

54

57

15

58

63
경험적인 실험들에 의하면, 이 대역 전략은 순전히 비제로인 값들의 비율에 기초한 주사순서를 사용하여 얻어지는 결과와 비교할 때 보통은 그 만큼 좋으며 가끔은 그 보다 더 좋다; 그 전에 갱신 비용이 고려된다.
두번째 장점은 주사순서를 갱신하는 비용은 크게 축소된다는 것이다. 왜냐하면 한 값이 한 대역에서 다른 대역으로 이동할 때 단지 그 값을 갱신할 필요가 있기 때문이다. 더욱이, 단지 4개의 비트가 대역내 변경을 코딩할 때 필요하다.
바람직한 구성에서 사용된 마지막 최적화는 몇몇 계수들이 다른 계수들보다는 훨씬 더 빈번하게 변화한다는 관찰에 기초한다. 예를 들면, 고차수의 AC계수들은 저차수의 계수들 보다 덜 자주 대역을 변경하는 경향이 있다.
하나의 특정 계수가 그 시간의 2%에서만 갱신되면, 예를 들면, 주어진 프레임상에서 그 한 비트가 갱신되었는지 아닌지를 나타내기 위하여 1비트를 사용하는 것은 무의미하다. 산술적인 코딩 기술를 사용하고 각 계수에 경험적으로 결정된 갱신 확률을 부가함으로써, 계수당 실질적으로 1비트 아래의 평균 갱신 비용을 얻을 수가 있다.
다음의 'C'코드 세그먼트는 본 발명의 실시예의 바람직한 구성의 상세사항을 지원한다.
Figure pat00001
Figure pat00002
Figure pat00003
Figure pat00004
인코더와 디코더 최적화를 용이하게 하기 위하여 독립 비트스트림 분할의 사용과 혼합 모드 엔트로피 코딩의 사용
*특정 하드웨어 장치의 코덱을 최적화할 때, 확실히 중요한 것은 그 장치가 다수의 임무를 병행하여 수행할 수 있는 자원을 충분히 사용하고, 그 디코딩 과정의 개별적인 부분들이 병목이 되는 범위를 제한하는 것이다.
대부분의 다른 비디오 코덱과 공통으로 본 발명의 비트스트림은 폭넓게 이야기하면 2가지 주요 카테고리로 분할될 수 있는 엔트로피 코딩된 토큰을 포함하는 것으로 설명될 수 있다.
예측 토큰(이하 P 토큰으로 언급). 예를 들면, 하나의 블록 또는 하나의 이미지의 영역을 코딩하는 데 이용된 방법 또는 모드를 설명하는 토큰들과 하나의 프레임과 다른 프레임 사이의 모션(동작)을 설명하는 토큰들.
예측 에러 신호 토큰(이하 E 토큰으로 언급). 분완전한 예측으로부터 초래되는 임의의 잔여 에러를 코딩하는데 사용된다.
엔트로피 코딩은 바트스트림내의 특정의 P 또는 E 토큰의 표시가 비트스트림내의 그 토큰의 파티션, 또는 그 토큰이 특정 위치에 발생할 가능성에 따라 최적화되는 과정이다. 예를 들면, 매우 빈번하게 발생하는 토큰은 빈번하지 않게 발생한 토큰 보다 더 작은 수의 비트를 이용하여 표시될 것이다.
2가지 가장 많이 사용하는 엔트로피 코딩은 허프만 코딩과 산술 코딩이다. 허프만 코딩에서 각 토큰은 가변장 패턴의 비트(또는 하나의 코드)로 표시된다. 산술 코딩은 더 계산적으로 복잡한 기법이나 각 토큰을 위하여 총 비트수를 사용하는 제약을 제거해준다. 산술 코더를 이용하면 하나의 비트의 1/2의 평균비용으로 매우 공통의 토큰을 완벽하게 코딩하는 것이 가능하다.
많은 멀티미디어 장치들은 엔트로피 코딩의 임무에 아주 적합한 코프로세서 및 더욱 다양한 주 프로세서를 구비한다. 따라서, 병행화 목적으로, 하나의 비트스트림을 인코딩 또는 디코딩하는 과정은 종종 엔트로피 관련 임무 및 비엔트로피 관련 임무로 분할된다.
그러나, 주어진 비디오 클립의 경우, 데이터 레이트(rate)가 증가할 때, 인코드/디코드하기 위한 토큰들의 수는 폭증하고, 엔트로피 코딩은 병목이될 수 있다.
종래의 비트스트림의 경우, 이 병목을 제거하기 위하여 엔트로피 코딩의 계산적인 부하를 재분배하는 것이 매우 어렵다. 특히, 디코드측에서, 그 토큰들은 한번에 하나씩 그리고 인코딩된 순서로 정상적으로 디코딩되어야 한다. 또한 프레임레벨 이외에 방법들 또는 엔트로피 인코딩(예로써 허프만 및 산술코딩)을 혼합하는 것은 극히 어렵다.
본 발명의 이러한 실시예에 의한 방법은 엔트로피 코딩의 계산적인 부하를 재분배하는 것이 더 쉽도록 하고, 비트스티림으로의 구조적인 변화를 통하여 혼합모드 엔트로피 코딩의 사용을 용이하게 하도록 설계된다.
본 발명의 방법에 따르면, 비트스트림 내의 각 프레임은 2개 또는 그 이상의 전체적으로 독립적인 데이터 파티션으로 분할된다. 이 파티션들은 병렬로 기입되거나 읽혀질 수 있고, 동일한 엔트로피 인코딩 메카니즘을 이용하는 것으로 구속되지 않는다. 이는 높은 비트 레이트에서 엔트로피 관련 병목을 피하기 위하여 엔코딩 또는 디코딩 과정을 최적화하는 것이 더 용이하도록 한다.
단일 프레임내에서 허프만과 산술 코딩 기법 모두, 또는 상기 2개를 혼합하여 사용하기 위한 능력은 인코더에게 달성된 압축량과 계산상의 복잡도 사이의 상반관계를 더욱 좋게 최적화하는 능력을 주는 것이다. 예를 들면, 하나의 인코더는 하나의 프레임의 원하는 크기가 주어진 임계치를 초과하는 경우 하나 또는 그 이상의 파티션들에서 덜 복잡한 허프만 방법을 사용하도록 구성될 수 있다.
본 발명의 실시예에 의한 특정한 구성에 따르면, 하나 또는 2개의 주 데이터 파티션들의 사용을 지원한다. 게다가 작은 헤더 파티션이 있다.
단일 데이터 파티션을 사용할 때, 코덱은 종래의 방법으로 행동한다. P 및 E 토큰들은 단일 데이터 파티션내에서 하나의 독점 산술 코더를 사용하여 코딩된다. 이 방법은 다소 오버헤드(프레임당 수개의 비트)가 낮으나 융통성은 낮은 편이다.
예를 들면:
파티션 1
(블록1) P, P, E, E, E
(블록2) P, E, E
(블록3) P, E, E, E, E
그러나, 두번째 경우에, P와 E토큰들은 파티션을 분리하게 위하여 기입된다.
파티션 1 파티션 2
(블록1) PP EEE
(블록2) P EE
(블록3) P EEEE
첫번째 파티션의 크기는 데이터 레이트만큼 변화하지 않는 편이고, 비교적 작기 때문에, 이 파티션은 항상 산술 코더를 사용하여 코딩된다. 두번째 파티션은 산술 코더 또는 허프만 코더 중의 하나를 이용하여 코딩될 수 있다.
두번째 파티션에서 허프만 또는 산술코딩의 선택은 프레임 레벨에서 통지될 수 있다. 바람직한 구성에서, 그 선택은 그 목표하는 디코도 플랫폼과 그 프레임의 비트의 계획된 크기의 실행을 통하여 이루어진다. 구체적으로, 디코더가 실시간으로 프레임을 디코딩하는 문제를 가지는 위험이 있는 경우, 만일 프레임 크기가 임계 번호 이상 증가하면, 허프만 방법이 사용된다.
또한 인코더의 실행은 실시간 인코딩이 요구되나, 주요 프레임(더 큰 편이고 다른 프레임상에 어떠한 의존성도 가지지 않는 편이다)을 가능한한 제외하고, 엔트로피 코딩의 비용은 보통 인코더에서 총 계산 비용보다 더 작은 부분이다.
다음의 'C'코드 세그먼트는 본 발명의 실시예의 바람직한 구성의 상세사항을 지원한다.
Figure pat00005
Figure pat00006
Figure pat00007
비디오 코덱에서 부분 화소 모션 예측을 향상시키기 위하여 복수의 필터의 사용
대부분의 현재의 비디오 코덱들의 경우, 모션 예측은 압축 과정의 중요한 부분이다. 모션 예측은 이미지의 객체 또는 영역들의 모션이 하나 이상의 프레임에 걸쳐 모델링되고 하나 이상의 '모션 벡터들'이 이 모션을 표현하기 위하여 비트스트림으로 전송되는 과정이다. 대부분의 경우에, 하나의 이미지 안에서 모션을 완벽하게 모델링하는 것은 불가능하므로, 모션 정보에 더하여 잔여 에러 신호를 코딩할 필요가 있다.
본질적으로, 각 모션 벡터는 인코딩될 현재 프레임 내의 영역과 유사한 이전에 인코딩된 프레임내의 한 영역을 가리킨다. 잔여 에러 신호는 현재 프레임내의 실제 값으로부터 각 화소의 예측값을 감산함으로써 얻어진다.
현재 사용되는 대부분의 비디오 코덱은 서브화소 정확도에 모션 예측 지원을 제공함으로써 그 과정을 확장하고 있다. 예를 들면, 반화소 또는 4분화소 모션 예측이다. 분수 화소 데이터 점들을 생성하기 위하여, 실제 (즉, 정렬된 전화소) 데이터 점들에 인가된 보간 기능 또는 필터의 어느 형태를 사용할 필요가 있다.
초기의 코덱은 일반적으로 단순한 쌍일차 보간법을 사용하였다.
A x B
y z
C D
이 예에서, A, B, C, D는 전화소 정렬된 데이터 점들이고, x, y, z는 반화소 정렬된 점들이다. 점 x는 X방향으로 정렬된 반화소이고 공식 x=(A+B/2)에 의하여 계산될 수 있다. 점 y는 Y방향으로 정렬된 반화소이고 공식 y=(A+C/2)에 의하여 계산될 수 있다. 점 z는 X와 Y방향으로 모두 정렬된 반화소이고 공식 z=(A+B+C+D/2)에 의하여 계산될 수 있다.
후기의 코덱은 이미지를 손상시키지 않는 편인 쌍입방 필터들과 같은 더 복잡한 보간 필터들의 사용으로 진행하고 있다. 다음의 예에서, x는 2개의 전화소 정렬된 점들 B와 C 사이의 반쯤 정도에 놓여있는 반화소 점이다. 쌍입방 필터에 양정수 근사법을 이용하여, 다음의 공식을 사용하여 x를 구할 수 있다.
x=(-A+9B+9C-D)/16
A B x C D
상기 언급한 필터와 같은 필터들은 더 가파르게 보이는 결과를 생성하는 편이지만, 어떤 상황들의 경우에는 여러개의 프레임에 대해 반복된 적용을 통하여 위조 조직 또는 위조 윤곽과 같은 달갑지 않은 아티팩트를 초래한다.
본 발명의 실시예에 따르는 방법에 의하면, 코덱이 필터링기법들을 혼합하여 사용하여, 더 최적인 분수 화소 예측을 생성하고, 클립레벨, 프레임레벨, 블록레벨, 또는 개별적인 화소들의 레벨에서 조차 이들 방법들 사이에서 선택하도록 한다.
바람직한 구성에서, 쌍일차 필터링만 사용하는지, 쌍입방 필터링만 사용하는지에 대한 매 프레임 단위로 선택할 수 있거나, 블록레벨에서 선택할 수 있도록 한다.
블록 또는 영역 레벨에서의 선택은 비트스트림안에서 비트들을 명료하게 신호함에 의하여 달성될 수 있으나, 바람직한 구성에서 비트스트림내에 이미 적용가능한 문맥상의 정보를 사용하고, 필터링될 예정인 전화소 정렬된 데이터 값들에 적용되어 측정된 복잡도에 의하여 선택된다.
모션 예측의 품질이 빈약한(예를 들면 이전의 프레임 재구성에서 하나의 블록에 대해 하나의 좋은 예측을 찾을 수가 없었다면), 쌍일차 필터링은 종종 최선의 선택이다. 구체적으로, 예측이 빈약하면, 쌍입방 필터의 두드러진 특징들은 잔여 에러신호의 조주파 내용의 증가를 일으키고 인코딩하는 것을 더욱 어렵게 한다.
비트스티림내의 비트들을 명확하게 신호하지 않는 경우, 여러가지 문맥상 적용가능 값들이 다소 어느 정도 범위까지는 빈약한 예측 품질로 상관되는 것으로 보여질 수 있다. 이들 중 가장 간단한 것은 모션 벡터 길이이다. 구체적으로 모션의 품질은 모션 벡터 길이의 증가함에 따라 줄어드는 편이다. 모션 필드의 부드러움(smoothness)은 다른 가능한 표시자(즉, 이웃하는 블록들의 모션 벡터들이 얼마나 유사한가)이다.
또한, 쌍일차 필터링은 벡터의 선택이 비신뢰적인 상황에서 더 선택적인 편이다(예를 들면, 이미지에서 매우 많은 상세가 존재하지 않으며 유사한 에러 점수들을 가지는 많은 후보 벡터들이 있는 경우). 특히, 상대적으로 납작하고 특징이 없는 영역으로 다수의 프레임에 걸쳐서 하나의 쌍입방 필터를 반복 적용하면, 원치않은 아티팩트를 낳게 된다.
바람직한 구성에서, 필터링방법을 선택할 때 2가지 요인들이 고려된다. 첫째는 모션 벡터의 길이이다. 둘째는 필터링될 일련의 전화소 정렬된 데이터점들을 분석함으로써 계산되고 측정된 복잡도 C이다.
쌍입방 필터링은 다음의 2가지 테스트조건들이 만족되는 경우에만 사용된다.
*1. 모션 벡터는 X 및 Y방향으로 모두 임계치 L보다 짧다.
2. 복잡도 C는 임계치 T 보다 크다.
바람직한 구성에서, C는 다음 공식에 의하여 계산된 일련의 n개의 데이터 점들 xi의 변형이다:
C = ( n∑xi 2-(∑xi)2 )/n2
바람직한 실시예에서, 복잡도 임계치 T와 모션 벡터 길이 임계치 L은 프레임당 한번씩 인코더에 의하여 설정될 수 있다.
다음의 'C'코드 세그먼트는 본 발명의 실시예의 바람직한 구성의 상세사항을 지원한다.
Figure pat00008
Figure pat00009
향상된 모션 벡터 코딩
기존에는 대부분의 비디오 코덱은 하나의 차분 코딩 스킴을 이용하여 하나의 모션 벡터의 (x, y)성분들을 코딩한다. 즉, 각 벡터는 이전의 벡터와 상대적으로 코딩된다. 예를 들면, 2개의 벡터 (7, 3) 과 (8, 4)를 고려한다. 이 경우, 두번째 벡터는 (1, 1), 즉 (7+1, 3+1)로 인코딩될 것이다.
이 구성은 모션 벡터가 코딩되는 대부분의 블록 또는 영역들이 그들과 이웃하는 블록 또는 영역들의 모션과 유사한 모션을 드러내는 경우 잘 작용한다. 이 구성은 가끔 예를 들면 패닝시 잘 작용할 것이라고 보여진다. 그러나, 모션 필드가 불규칙한 경우 또는 상이한 모션 특징들을 가지는 배경과 바탕영역들 사이에 빈번한 변화가 있는 곳에서는 잘 작용되지 않는다.
본 발명의 이러한 측면은 차분 코딩의 장점을 갖는 모션 벡터들을 인코딩하기 위한 대안적인 전략이며, 불규칙한 필드와 배경과 바탕 변화에 대하여 더 관대하다.
본 발명에 따르면, 코덱은 2개 또는 그 이상의 참조벡터를 유지하며, 그 참조벡터에 대하여 모션 벡터들이 인코딩될 수 있다. 코덱은 비트스트림 내에 비트들을 명확히 통지함으로써 이들 참조벡터들 사이에서 전환할 수 있으나, 바람직한 구성에서 그 판단은 블록들의 바로 이웃들에 의해 사용된 코딩 방법들과 모션 벡터들에 기초하여 이루어진다.
바람직한 구성에서, 하나의 블록은 하나의 인트라블록(어느 이전 프레임에도 의존되지 않음)으로서 코딩되거나, 또는 이전 프레임 재구성 또는 단지 주기적으로 갱신되는 선택적인 참조 프레임에 종속되는 인터 블록으로서 코딩될 수 있다.
이전 프레임 재구성 또는 선택적인 참조 프레임에 대한 코딩시, 본 발명은 다음의 코딩 모드 선택을 지원한다.
ㆍ 어떠한 모션 벡터도 없는 코드 (즉 내재하는 (0, 0) 벡터)
ㆍ 가장 '가까운' 이웃으로 동일한 벡터를 사용하는 코드
ㆍ '다음으로 가까운' 이웃으로서 동일한 벡터를 사용하는 코드
ㆍ 새로운 모션 벡터를 사용하는 코드
가장 가깝거나 다음으로 가까운 이웃을 정의할 때, 현재 블록으로서 동일한 참조 프레임에 대하여 코딩되는 블록들과 비제로 모션 벡터로 코딩되는 블록들만이 고려된다. 모든 다른 블록들은 무시된다.
다음으로 가까운 이웃을 정의할 때, 가장 가까운 이웃으로서 동일한 벡터로 코딩되는 블록들 또한 무시된다.
새로운 모션 벡터를 코딩할 때, 코덱은 참조 벡터로서 (0, 0) 또는 가장 가까운 벡터를 사용할 수 있다. 바람직한 실시예에서, 가장 가까운 벡터가 유도되는 블록이 현재 블록의 바로 왼쪽에 있는 블록이거나 바로 위쪽에 있는 블록이라면 (블록들이 좌측으로부터 우측으로 및 상부로부터 하부로 코딩된다고 가정할 때) 그 가장 가까운 벡터가 사용된다. 모든 다른 경우에, 새로운 벡터들은 (0, 0)에 대해서 코딩된다.
기본적인 방법에 대한 몇가지 확장이 가능하다. 가장 가깝고 다음으로 가까운 이웃들은 각각 현재 블록의 바로 왼쪽에 있는 블록이거나 바로 위쪽에 있는 블록이고, 그 2개의 벡터로부터 유도된 합성 벡터의 어떤 종류는 새로운 벡터를 코딩하기 위한 기준으로서 사용될 수 있다. 대안적으로, '가장 가까운'이란 말은 x 성분과 '다음으로 가까운' y 성분을 예측하는데 사용될 수 있다.
가장 가까우며 다음으로 가까운 이웃들은 각각 현재 블록의 바로 왼쪽에 있는 블록이거나 바로 위쪽에 있는 블록임을 가정할 때, 또다른 가능한 확장은 특별히 가장 가깝고 다음으로 가까운 벡터들이 유사하지 않은 경우를 고려하는 것이고, 그러한 경우에 x, y 또는 x와 y 모두에 대한 참조값으로서 0으로 복귀한다.
이 방법은 규칙적으로 또는 느리게 변하는 모션 필드가 존재하는 경우에 간단한 차분 코딩의 이익을 갖는다. 그러나, 특별히 '무벡터', '가장 가까운' 및 '다음으로 가까운' 모드들을 사용하면 배경과 바탕 사이의 변화를 더욱 효율적으로 코딩할 수 있게 하고, 복수의 코딩 원인들 사이에 자동으로 전환하는 능력은 불규칙한 모션 필드에 더욱 관대한 방법을 가져온다.
다음의 'C'코드 세그먼트는 본 발명의 실시예의 바람직한 구성의 상세사항을 지원한다.
Figure pat00010
Figure pat00011
Figure pat00012
에러 복구시 교번 참조(alternate reference) 프레임의 사용
압축된 비디오 데이터를 신뢰할 수 없는 데이터 링크에 전송할 때, 데이터가 유실되거나 손상되는 경우, 비디오 코덱들이 가끔 비트스트림내의 에러들에 극히 민감하므로 복구하기 위한 메카니즘이 존재하는 것이 중요하다.
여러 가지 기법과 프로토콜이 그러한 링크들로 데이터를 신뢰성있게 전송하기 위하여 존재하며, 이들은 전형적으로 에러 검출, 및 어떤 유형의 에러는 정정될 수 있도록 하는 추가 데이터 비트의 재전송 또는 사용에 의존한다.
많은 상황에서, 기존의 기법들은 적절하나, 제한된 대역폭 링크로 비디오 회의를 하는 경우에는 상술한 방법들 중의 어느 것도 이상적이지 않다. 유실된 데이터 패킷의 재전송은 증가된 단-대-단 지연을 초래할 것이기 때문에 실용적이지 않으며, 에러 정정 비트 또는 패킷을 사용하면 대역폭이 이미 심각하게 제한되는 상황에서는 수용될 수 없다.
대안적인 접근 방법은 간단하게는 디코더에서 에러를 검출하고 그 검출된 에러를 인코더에 보고하는 것이다. 그런 다음, 인코더는 디코더에 복구 프레임을 전송할 수 있다. 이 접근 방법은 링크상의 에러 레이트가 매우 높은 경우 적절하지 않음을 유의한다. 예를 들면, 매 10-20 프레임에서 하나의 에러 이상이다.
복구 프레임의 가장 간단한 형태는 키 프레임 또는 인트라 온리 프레임(intra only frame)이다. 이는 이전 프레임들 또는 그 프레임 안의 데이터에 의존되지 않는 프레임이다. 키 프레임의 문제는 통상 키 프레임들이 상대적으로 크다는 점이다.
본 발명의 주제는 코덱이 복구 프레임의 더욱 효율적인 코딩을 위하여 시적 점으로 사용될 수 있는 하나 또는 그 이상의 추가 참조 프레임(이전에 코딩된 프레임의 재구성 이외에)을 유지하는 메카니즘에 대한 것이다.
본 발명의 바람직한 구성에서, 코덱은 하나의 키 프레임이 있는 모든 경우, 및 선택적으로는 기타 시간에, 프레임 헤더내의 플래그 비트를 통하여 갱신되는 제2의 참조 프레임을 유지한다. 예를 들면, 인코더는 매 'X'초 마다 한번씩 또는 에러 복구 프레임이 인코딩될 때마다 제2 참조 프레임을 갱신하기를 선택할 수 있다.
제2 참조 프레임의 내용이 적어도 어떤 점에서 현재 프레임의 내용과 유사하다고 하면, 제2 참조 프레임에 대한 차분 코딩은 키 프레임을 코딩하는 경우 보다 훨씬 값싸게 될 수 있다.
하나 또는 그 이상의 교번 참조 프레임들이 압축 품질 또는 효율을 향상시키기 위하여 사용될 수 있는 여러 가지 방법들이 있다. 종래 기술에서 사용되는 한가지 명백한 용도는 2개 이상의 상이한 장면들 사이에 전후로 진동하는 비디오 시퀀스들에 존재한다. 예를 들면, 비디오가 인터뷰하는 사람과 받는 사람 사이에 전후로 전환하는 인터뷰를 고려하면, 각 카메라 각도의 기준선으로서 분리된 참조 프레임들을 저장함으로써, 특히 그 장면들이 실질적으로 상이한 경우에, 이들 참조 프레임들 사이에서 전후로 전환하는 비용은 크게 감소될 수 있다.
본 발명은 이런 방법으로 하나의 교번 참조 프레임을 사용하는 선택권을 가지는 한편, 본 발명의 주제는 압축된 비디오의 품질을 향상시키기 위하여 비디오내에 서서히 진행하는 변화가 존재하는 상황에서, 주기적으로 갱신된 교번 참조 프레임을 사용하는 것에 있다.
본 발명의 이러한 실시예에 의하면, 느린 패닝(카메라 이동) 또는 다른 그런 느린 점진적인 변화 중에, 인코더는 프레임들을 삽입하며, 그 프레임들은 주기적으로 주변을 둘러싸고 있는 프레임보다 상당히 높은 품질로 인코딩되고, 제2 또는 교번 참조 프레임이 갱신된다.
이들 더 높은 품질의 "제2 참조 갱신" 프레임들의 목적은 마지막 키 프레임 또는 마지막 제2 참조 갱신 이후 점증적으로 유실된 디테일(상세)을 복구하고, 순차 프레임들에 인터 프레임 예측을 위한 더 나은 기준을 제공하는 것에 있다. 품질(및 여기서는 데이터 레이트)을 주기적으로 증가시킴과 동시에 제2 참조 프레임을 갱신하는 전략은 모든 프레임들을 유사한 품질로 단순히 코딩하기 보다는 어떤 상황에서는 훨씬 또 좋은 비용/품질간의 상반관계(트레이드-오프)를 제공하는 것으로 보여진다.
제2 참조 갱신을 위한 적절한 간격을 결정하고 품질 또는 데이터 레이트가 부양되어야 하는 양을 결정하는 방법이 효과적인 발명의 구성에 중요하다.
본 발명의 실시예의 바람직한 구성에서, 여러 가지 요인들인 고려된다. 이 요인들은 다음과 같다:
ㆍ 모션 속도의 표시자로서 선행하는 수개의 프레임내에 모션 벡터의 평균 진폭
ㆍ 모션 필드가 상관되는 범위. 예를 들면 모션 벡터들은 모두 매우 유사하다.
ㆍ 제2 참조 프레임이 이전 수개 프레임들내의 이전의 프레임 복구에 우선하여 예측기로서 사용된 범위
ㆍ 주변 품질 또는 양자화기 설정
사용된 모션 벡터들의 평균 진폭이 높은 경우(더 빠른 모션을 나타냄), 제2 참조 갱신과 품질 부양기 사이의 간격은 모두 감소된다. 역으로, 모션이 느린 경우, 더 빠른 품질 부양과 더 긴 간격이 사용된다.
모션 필드가 높은 상관관계에 있는 경우, 즉 많은 유사한 벡터가 존재하는 경우, 제2 참조 프레임 갱신을 위한 품질 부양은 증가된다. 역으로, 모션 필드가 매우 빈약한 상관관계에 있는 경우, 그 부양 범위는 감소된다.
제2 참조 프레임이 이전 프레임 재구성에 우선하여 예측기로 빈번히 사용되는 경우, 품질 부양은 증가된다. 역으로 제2 참조 프레임이 빈번하게 사용되지 않는 경우, 품질 부양은 감소된다.
또한 품질 부양의 범위는 어느 정도까지는 주변 품질에 의존하며, 주변 품질이 낮을 때 더 큰 부양이 사용되고 주변 품질이 높을 때 더 작은 부양이 사용된다.
이하 의사 코드는 본 발명의 실시예의 바람직한 구성의 상세사항을 지원한다.
각 프레임에 대하여,
1/4 화소단위로 특정화된 X 와 Y 모션 벡터 성분 (AvX 와 AvY)의 평균 진폭의 계산
MotionSpeed=AvX 와 AvY의 더 큰 쪽
X 와 Y 모션 벡터 성분 (변화 X 와 변화 Y)의 변화 개수를 계산
MaxVariance=변화 X 와 변화 Y의 더 큰 쪽
MotionComplexity=MotionSpeed+(변화 X/4)+(변화Y/4)
*제2 참조 프레임 갱신이 이 프레임에서 수행되면,
그 프레임에서 예측된 품질 계수(실제로 양자화기 설정)에 기초하여 데이터 레이트 % 부양 개수(Boost)를 계산. 이는 품질 레벨이 매우 낮을 때 0%와 가장 높은 품질에서 +1250%로 변화할 수 있다.
인자가 MotionSpeed의 매우 작은 값의 경우 1과 MotionSpeed의 더 큰 값의 경우 0 사이에서 변하는 경우, Boost를 MotionSpeed와 곱한다.
추가 정정 인자를 제2 참조 프레임이 이전 수개의 프레임내에 사용된 범위에 기초하여 Boost에 인가한다. 이는 제2 참조 프레임이 이전 수개의 프레임에 전혀 사용되지 않은 경우에 1/16로부터, 그 제2 참조 프레임이 코딩된 블록의 15% 또는 그 이상에 사용된 경우에 1까지 변할 수 있다.
그 다음, 일련의 테스트를 적용하여 계산된 % 부양을 갖는 제2 참조 프레임을 진행하고 갱신할 것인지 아닌지를 결정한다.
주요 테스트들은 다음과 같다:
(Boost>MinBoostThreshold) 및
(MotionSpeed<MaxMotionSpeedThreshold) 및
(MaxVariance<MaxVarianceThreshold)
여기서, MinBoostThreshold, MaxMotionSpeedThreshold, 및 MaxVarianceThreshold 는 구성 파라미터이다.
본 발명은 가까운 이웃들의 하나에 의해 사용된 모션 벡터와 동일하다면, 한 블록의 모션 벡터가 더 값싸게 코딩되도록 하는 다수의 특수한 "모션 재사용" 모드를 갖는다. 더욱이, 테스트들이 적용되어 이들 모드들의 용도가 임계 레벨 아래로 떨어지는 경우를 줄여준다.
부양을 적용하고 제2 참조 프레임을 갱신하기 위한 판단이 이루어지면, 그 다음 프레임 데이터 레이트 목표를 기준선 값 +Boost%로 설정하고 다음 MotionSpeed에 기초한 다음 갱신까지 간격을 계산한다.
부양을 적용하지 않고 제2 참조 프레임을 갱신하지 않는 판단이 이루어지면, 프레임을 0% 데이터 레이트 부양으로 통상적으로 갱신한다.
그밖에, 제2 참조 프레임 갱신이 수행되지 않으면,
제2 참조 프레임이 마지막으로 갱신될 때 적용된 부양 레벨과 현재 갱신된 간격을 고려하여 감소된 프레임 데이터 레이트 목표를 계산한다.
부분 화소 예측을 생성하기 위한 대안적인 방법들 사이에서 선택하기 위한 재구성 에러 메트릭의 사용
많은 현대의 비디오 코덱은 부화소 정확도로 모션 예측을 지원한다. 예를 들면, 반화소 또는 4분화소 모션 추정이다. 부분 화소 데이터 점들을 생성하기 위하여, 실제(즉, 정렬된 전화소) 데이터 점들에 적용된 보간 기능 또는 필터의 형태를 이용할 필요가 있다.
초기의 코덱은 일반적으로 간단한 쌍일차 보간법을 사용하였다.
A x B
y z
C D
이러한 예에서, A, B, C 및 D는 전화소 정렬된 데이터 점들이고, x, y 및 z는 반화소 정렬된 점들이다.
* 점 x 는 X 방향으로 반화소 정렬되고, 공식 (A+B/2)을 사용하여 계산된다.
* 점 y 는 Y 방향으로 반화소 정렬되고, 공식 (A+C/2)을 사용하여 계산된다.
* 점 z 는 X 와 Y 방향으로 반화소 정렬되고, 공식 (A+B+C+D/2)을 사용하여 계산된다.
후기의 코덱은 이미지를 손상시키지 않는 편인 쌍입방 필터들과 같은 더 복잡한 보간 필터들의 사용으로 진행하고 있다. 다음의 예에서, x는 2개의 전화소 정렬된 점들 B와 C 사이의 반쯤 정도에 놓여있는 반화소 점이다. 공식 x=(-A+9B+9C-D)/16을 사용하여 x를 구할 수 있다.
A B x C D
상기 언급한 필터와 같은 필터들은 더 가파르게 보이는 결과를 생성하는 편이지만, 가끔은 여러 개의 프레임에 대해 반복된 적용을 통하여 조직 과장 또는 위조 윤곽과 같은 달갑지 않은 아티팩트(인공물)를 초래한다.
본 발명의 실시예에 따르는 방법에 의하면, 코덱이 쌍일차 및 쌍입방 필터링기법들을 혼합하여 사용하여, 더 최적인 분수 화소 예측을 계산하고, 프레임레벨, 또는 모션 벡터들이 적용되는 개별적인 블록들 또는 영역들의 레벨에서 이들 방법들 사이에서 선택하도록 한다.
블록 또는 영역 레벨의 선택은 비트스트림내의 비트들에 신호를 보냄으로써 달성될 수 있으나, 바람직한 구성에서는 그 선택은 필터링될 이전의 재구성된 이미지내의 화소들 집합에 적용된 복잡도 메트릭에 의하여 이루어진다.
본 발명에 따르면, 한 임계값 "T" 위의 복잡도 점수를 갖는 블록들 또는 영역들은 쌍입방 방법을 이용하여 필터링되는 한편, 더 낮은 복잡도 점수를 가지는 블록들 또는 영역들은 쌍일차 방법을 이용하여 필터링된다.
바람직한 구성에서, 복잡도 측정은 변화(variance)가 (n ?x2-( ?x2))/n2로서 정의되는 곳에서 필터링될 'n'개의 전화소 정렬된 데이터 점들의 집합의 변화이다.
바람직한 구성에서, 임계값 "T"는 프레임당 일회씩 갱신될 수 있다.

Claims (16)

  1. 제1 블록과, 제1 블록과 유사하고 이전에 인코딩된 프레임 내의 제2 블록과의 공간적 관계를 기술하는 적어도 하나의 프레임 내의 제1 블록에 대한 모션벡터를 결정하는 단계;
    제2 블록의 복잡도을 나타내는 복잡도 값을 결정하는 단계;
    모션벡터의 길이를 나타내는 길이값을 결정하는 단계;
    길이값 또는 복잡도값 중 적어도 하나에 기초하여 복수개의 필터로부터 필터를 선택하는 단계; 및
    예측기 블록을 유도하기 위해 이전에 인코딩된 프레임의 적어도 일부에 선택된 필터를 적용하는 단계;
    로 구성된 것을 특징으로 하는 복수개의 블록을 가진 적어도 하나의 프레임을 가진 비디오신호의 인코딩방법.
  2. 제 1 항에 있어서, 예측기 블록을 사용하여 제1 블록을 인코딩하는 단계를 더 포함하는 것을 특징으로 하는 비디오신호의 인코딩방법.
  3. 제 1 항에 있어서, 복수개의 필터는 적어도 하나의 쌍입방 필터와 쌍일차 필터를 포함하는 것을 특징으로 하는 비디오신호의 인코딩방법.
  4. 제 3 항에 있어서, 필터를 선택하는 단계는 길이값이 소정의 길이임계치를 초과하면 쌍일차 필터를 선택하는 것 더 포함하는 것을 특징으로 하는 비디오신호의 인코딩방법.
  5. 제 3 항 또는 제 4 항에 있어서, 필터를 선택하는 단계는, 길이값이 소정의 길이 임계치 이하이면 쌍입방 필터를 선택하는 것을 더 포함하는 것을 특징으로 하는 비디오신호의 인코딩방법.
  6. 제 3 항에 있어서, 길이값은 수평성분(X)와 수직성분(Y)을 포함하고, 필터를 선택하는 단계는 수평성분(X) 또는 수직성분(Y) 중의 적어도 하나가 소정의 길이임계치를 초과하면 쌍일차 필터를 선택하는 것을 특징으로 하는 비디오신호의 인코딩방법.
  7. 제 3 항에 있어서, 필터를 선택하는 단계는 복잡도값이 소정의 복잡도 임계치를 초과하면 쌍입방 필터를 선택하는 것을 더 포함하는 것을 특징으로 하는 비디오신호의 인코딩방법.
  8. 제 7 항에 있어서, 필터를 선택하는 단계는 복잡도값이 소정의 복잡도 임계치 이하이면 쌍일차 필터를 선택하는 것을 더 포함하는 것을 특징으로 하는 비디오신호의 인코딩방법.
  9. 제 3 항에 있어서, 필터를 선택하는 단계는 길이값이 소정의 길이 임계치 미만이고 복잡도값이 소정의 복잡도 임계치를 초과하면 쌍입방 필터를 선택하는 것을 더 포함하는 것을 특징으로 하는 비디오신호의 인코딩방법.
  10. 제 1 항에 있어서, 복잡도값을 결정하는 단계는;
    식 C = ( n∑xi 2-(∑xi)2 )/n2 , 여기서 C는 복잡도값
    으로 계산되는 제2 블록 내의 한 세트의 데이터 점xi의 변동을 결정하는 단계를 더 포함하는 것을 특징으로 하는 비디오신호의 인코딩방법.
  11. 제 10 항에 있어서, n은 16이고, 각각의 데이터점 xi는 제2 블록의 수평방향(X) 및 수직방향(Y)의 하나걸러식(every other)의 점인 것을 특징으로 하는 비디오신호의 인코딩방법.
  12. 메모리; 및
    메모리에 저장된 명령을 실행하도록 구성되어,
    제1 블록과, 제1 블록과 유사하고 이전에 인코딩된 프레임 내의 제2 블록과의 공간적 관계를 기술하는 적어도 하나의 프레임 내의 제1 블록에 대한 모션벡터를 결정하고,
    제2 블록의 복잡도을 나타내는 복잡도 값을 결정하고,
    모션벡터의 길이를 나타내는 길이값을 결정하고,
    길이값 또는 복잡도값 중 적어도 하나에 기초하여 복수개의 필터로부터 필터를 선택하고, 및
    예측기 블록을 유도하기 위해 이전에 인코딩된 프레임의 적어도 일부에 선택된 필터를 적용하는 프로세서로 구성된 것을 특징으로 하는 복수개의 블록을 가진 적어도 하나의 프레임을 가진 비디오신호의 인코딩장치.
  13. 제 12 항에 있어서, 복수개의 필터는 적어도 쌍입방 필터와 쌍일차 필터를 포함하는 것을 특징으로 하는 비디오신호의 인코딩장치.
  14. 제 13 항에 있어서, 상기 프로세서는 메모리에 저장된 명령을 실행하여,
    길이값이 소정의 길이 임계치를 초과하면 쌍일차 필터를 선택하고, 길이값이 소정의 길이 임계치 이하이면 쌍입방 필터를 선택하는 것을 특징으로 하는 비디오신호의 인코딩장치.
  15. 제 13 항 또는 제 14 항에 있어서, 상기 프로세서는 메모리에 저장된 명령을 실행하여,
    복잡도값이 소정의 복잡도 임계치를 초과하면 쌍입방 필터를 선택하고, 복잡도값이 소정의 복잡도 임계치 이하이면 쌍일차 필터를 선택하는 것을 특징으로 하는 비디오신호의 인코딩장치
  16. 제 13 항 또는 제 14 항에 있어서, 상기 프로세서는 메모리에 저장된 명령을 실행하여,
    식 C = ( n∑xi 2-(∑xi)2 )/n2 , 여기서 C는 복잡도값
    으로 계산되는 제2 블록 내의 한 세트의 데이터 점xi의 변동을 결정하는 것을 특징으로 하는 비디오신호의 인코딩장치.
KR1020117005251A 2003-05-12 2004-05-12 필터 선택을 이용한 비디오 압축 방법 KR101131689B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US46918703P 2003-05-12 2003-05-12
US60/469,187 2003-05-12
US10/713,807 US8824553B2 (en) 2003-05-12 2003-11-14 Video compression method
US10/713,807 2003-11-14
PCT/US2004/015025 WO2004102946A2 (en) 2003-05-12 2004-05-12 Video compression method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020057021588A Division KR101140947B1 (ko) 2003-05-12 2004-05-12 비디오 압축 방법

Publications (2)

Publication Number Publication Date
KR20110028562A true KR20110028562A (ko) 2011-03-18
KR101131689B1 KR101131689B1 (ko) 2012-04-23

Family

ID=33423828

Family Applications (6)

Application Number Title Priority Date Filing Date
KR1020057021588A KR101140947B1 (ko) 2003-05-12 2004-05-12 비디오 압축 방법
KR1020117005250A KR101133321B1 (ko) 2003-05-12 2004-05-12 비트스트림 파티션을 이용한 비디오 압축 방법
KR1020117005251A KR101131689B1 (ko) 2003-05-12 2004-05-12 필터 선택을 이용한 비디오 압축 방법
KR1020117005252A KR101118456B1 (ko) 2003-05-12 2004-05-12 에러복구를 위한 대체 참조프레임을 이용한 비디오 압축방법
KR1020117005249A KR101167006B1 (ko) 2003-05-12 2004-05-12 동적 계수 재정렬을 이용한 비디오 압축 방법
KR1020117005253A KR101118438B1 (ko) 2003-05-12 2004-05-12 향상된 품질을 위한 대체 참조프레임을 이용한 비디오 압축 방법

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020057021588A KR101140947B1 (ko) 2003-05-12 2004-05-12 비디오 압축 방법
KR1020117005250A KR101133321B1 (ko) 2003-05-12 2004-05-12 비트스트림 파티션을 이용한 비디오 압축 방법

Family Applications After (3)

Application Number Title Priority Date Filing Date
KR1020117005252A KR101118456B1 (ko) 2003-05-12 2004-05-12 에러복구를 위한 대체 참조프레임을 이용한 비디오 압축방법
KR1020117005249A KR101167006B1 (ko) 2003-05-12 2004-05-12 동적 계수 재정렬을 이용한 비디오 압축 방법
KR1020117005253A KR101118438B1 (ko) 2003-05-12 2004-05-12 향상된 품질을 위한 대체 참조프레임을 이용한 비디오 압축 방법

Country Status (7)

Country Link
US (8) US8824553B2 (ko)
EP (1) EP1656791A2 (ko)
JP (5) JP4568887B2 (ko)
KR (6) KR101140947B1 (ko)
CN (2) CN101454990B (ko)
CA (1) CA2525390C (ko)
WO (1) WO2004102946A2 (ko)

Families Citing this family (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6499060B1 (en) 1999-03-12 2002-12-24 Microsoft Corporation Media coding for loss recovery with remotely predicted data units
US7471724B2 (en) * 2003-06-23 2008-12-30 Vichip Corp. Limited Method and apparatus for adaptive multiple-dimensional signal sequences encoding/decoding
JP2006086964A (ja) * 2004-09-17 2006-03-30 Toshiba Corp ビットレート変換装置およびビットレート変換方法
US7817723B2 (en) * 2004-12-14 2010-10-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus and method of optimizing motion estimation parameters for encoding a video signal
US7324708B2 (en) * 2004-12-23 2008-01-29 Primax Electronics Ltd. Interpolation method for digital pictures
US8634413B2 (en) 2004-12-30 2014-01-21 Microsoft Corporation Use of frame caching to improve packet loss recovery
KR100727969B1 (ko) * 2005-08-27 2007-06-14 삼성전자주식회사 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체
KR100727970B1 (ko) * 2005-08-30 2007-06-13 삼성전자주식회사 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체
KR100667815B1 (ko) * 2005-09-22 2007-01-12 삼성전자주식회사 영상 부호화 및 복호화 장치와, 그 방법, 및 이를 수행하기위한 프로그램이 기록된 기록 매체
JP2007189518A (ja) * 2006-01-13 2007-07-26 Matsushita Electric Ind Co Ltd 信号処理装置、撮像装置、ネットワークカメラシステム及び映像システム
KR100834757B1 (ko) 2006-03-28 2008-06-05 삼성전자주식회사 엔트로피 부호화 효율을 향상시키는 방법 및 그 방법을이용한 비디오 인코더 및 비디오 디코더
JP5248802B2 (ja) * 2006-06-16 2013-07-31 カシオ計算機株式会社 動画符号化装置および動画符号化方法と、動画復号化装置および動画復号化方法と、動画記録装置
KR101086435B1 (ko) * 2007-03-29 2011-11-25 삼성전자주식회사 영상 데이터 스트림의 에러 검출 방법 및 그 장치
US20100325255A1 (en) * 2007-04-05 2010-12-23 Gene Cheung Data transmission system and method
US8605786B2 (en) * 2007-09-04 2013-12-10 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
US8542748B2 (en) 2008-03-28 2013-09-24 Sharp Laboratories Of America, Inc. Methods and systems for parallel video encoding and decoding
KR20100011628A (ko) * 2008-07-25 2010-02-03 삼성전자주식회사 코딩 방법 및 코딩 장치
US8311111B2 (en) * 2008-09-11 2012-11-13 Google Inc. System and method for decoding using parallel processing
US8325796B2 (en) * 2008-09-11 2012-12-04 Google Inc. System and method for video coding using adaptive segmentation
US8326075B2 (en) 2008-09-11 2012-12-04 Google Inc. System and method for video encoding using adaptive loop filter
US8385404B2 (en) 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
US20100074336A1 (en) * 2008-09-25 2010-03-25 Mina Goor Fractional motion estimation engine
CN102158678A (zh) * 2010-05-20 2011-08-17 王洪剑 一种运动向量场插值方法
EP3907999B1 (en) * 2010-09-02 2023-11-22 LG Electronics, Inc. Inter prediction
US8503528B2 (en) 2010-09-15 2013-08-06 Google Inc. System and method for encoding video using temporal filter
US8344917B2 (en) 2010-09-30 2013-01-01 Sharp Laboratories Of America, Inc. Methods and systems for context initialization in video coding and decoding
US9313514B2 (en) 2010-10-01 2016-04-12 Sharp Kabushiki Kaisha Methods and systems for entropy coder initialization
EP2606648A1 (en) 2010-10-05 2013-06-26 General instrument Corporation Coding and decoding utilizing adaptive context model selection with zigzag scan
US8611415B1 (en) 2010-11-15 2013-12-17 Google Inc. System and method for coding using improved motion estimation
US9532066B2 (en) * 2011-01-21 2016-12-27 Qualcomm Incorporated Motion vector prediction
KR101760333B1 (ko) * 2011-03-02 2017-07-21 삼성전자주식회사 다중 사용자 다중 안테나 전송에서 그룹 아이디 관리를 위한 타겟 단말 및 액세스 포인트의 통신 방법
FR2972588A1 (fr) 2011-03-07 2012-09-14 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
EP3139611A1 (en) * 2011-03-14 2017-03-08 HFI Innovation Inc. Method and apparatus for deriving temporal motion vector prediction
US8780971B1 (en) 2011-04-07 2014-07-15 Google, Inc. System and method of encoding using selectable loop filters
US8638854B1 (en) 2011-04-07 2014-01-28 Google Inc. Apparatus and method for creating an alternate reference frame for video compression using maximal differences
US8781004B1 (en) 2011-04-07 2014-07-15 Google Inc. System and method for encoding video using variable loop filter
US8780996B2 (en) 2011-04-07 2014-07-15 Google, Inc. System and method for encoding and decoding video data
US9154799B2 (en) 2011-04-07 2015-10-06 Google Inc. Encoding and decoding motion via image segmentation
CN102811346B (zh) * 2011-05-31 2015-09-02 富士通株式会社 编码模式选择方法和系统
JP5336004B2 (ja) * 2011-06-17 2013-11-06 パナソニック株式会社 動画像復号化装置
FR2977111A1 (fr) 2011-06-24 2012-12-28 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
CN102956027B (zh) * 2011-08-30 2016-08-03 安凯(广州)微电子技术有限公司 基于摄像头图像处理芯片的图像增强处理系统及处理方法
US8885706B2 (en) 2011-09-16 2014-11-11 Google Inc. Apparatus and methodology for a video codec system with noise reduction capability
BR112014010966A2 (pt) * 2011-11-08 2017-06-06 Samsung Electronics Co Ltd método para determinar vetor de movimento para previsão inter, aparelho determinador de vetor de movimento para previsão inter, e mídia de gravação legível por computador
US9247257B1 (en) 2011-11-30 2016-01-26 Google Inc. Segmentation based entropy encoding and decoding
US9100657B1 (en) 2011-12-07 2015-08-04 Google Inc. Encoding time management in parallel real-time video encoding
US9262670B2 (en) 2012-02-10 2016-02-16 Google Inc. Adaptive region of interest
US9131073B1 (en) 2012-03-02 2015-09-08 Google Inc. Motion estimation aided noise reduction
US9609341B1 (en) 2012-04-23 2017-03-28 Google Inc. Video data encoding and decoding using reference picture lists
WO2013162980A2 (en) 2012-04-23 2013-10-31 Google Inc. Managing multi-reference picture buffers for video data coding
GB2501535A (en) * 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
US9014266B1 (en) 2012-06-05 2015-04-21 Google Inc. Decimated sliding windows for multi-reference prediction in video coding
US9774856B1 (en) 2012-07-02 2017-09-26 Google Inc. Adaptive stochastic entropy coding
US9344729B1 (en) 2012-07-11 2016-05-17 Google Inc. Selective prediction signal filtering
US9509998B1 (en) 2013-04-04 2016-11-29 Google Inc. Conditional predictive multi-symbol run-length coding
US9756331B1 (en) 2013-06-17 2017-09-05 Google Inc. Advance coded reference prediction
GB2516426B (en) * 2013-07-17 2015-10-07 Gurulogic Microsystems Oy Encoder, decoder and method of operation using interpolation
CA2916892A1 (en) * 2013-07-22 2015-01-29 Sony Corporation Information processing apparatus and method
US11425395B2 (en) 2013-08-20 2022-08-23 Google Llc Encoding and decoding using tiling
US9392288B2 (en) 2013-10-17 2016-07-12 Google Inc. Video coding using scatter-based scan tables
US9179151B2 (en) 2013-10-18 2015-11-03 Google Inc. Spatial proximity context entropy coding
US10236906B2 (en) 2013-10-22 2019-03-19 Schlumberger Technology Corporation Compression and timely delivery of well-test data
US9942560B2 (en) 2014-01-08 2018-04-10 Microsoft Technology Licensing, Llc Encoding screen capture data
US9774881B2 (en) 2014-01-08 2017-09-26 Microsoft Technology Licensing, Llc Representing motion vectors in an encoded bitstream
US9749642B2 (en) 2014-01-08 2017-08-29 Microsoft Technology Licensing, Llc Selection of motion vector precision
US9392272B1 (en) 2014-06-02 2016-07-12 Google Inc. Video coding using adaptive source variance based partitioning
US9578324B1 (en) 2014-06-27 2017-02-21 Google Inc. Video coding using statistical-based spatially differentiated partitioning
US10102613B2 (en) 2014-09-25 2018-10-16 Google Llc Frequency-domain denoising
US10462480B2 (en) * 2014-12-31 2019-10-29 Microsoft Technology Licensing, Llc Computationally efficient motion estimation
US9787332B2 (en) * 2015-09-15 2017-10-10 Intel Corporation Error-checking compressed streams in heterogeneous compression accelerators
TWI546779B (zh) 2015-11-06 2016-08-21 財團法人工業技術研究院 串流資料的編碼排程方法、裝置與電腦可讀取媒體
US10334276B2 (en) * 2015-12-28 2019-06-25 Ati Technologies Ulc Method and apparatus for determining the severity of corruption in a picture
US9794574B2 (en) 2016-01-11 2017-10-17 Google Inc. Adaptive tile data size coding for video and image compression
US10542258B2 (en) 2016-01-25 2020-01-21 Google Llc Tile copying for video compression
KR101742258B1 (ko) 2016-02-29 2017-05-31 경희대학교 산학협력단 웹 기반 가상 데스크탑 프로토콜을 이용한 컨텐츠 제공 방법 및 장치
KR101895294B1 (ko) * 2017-03-03 2018-09-05 주식회사 칩스앤미디어 프리 스캔을 이용한 블록 기반 동영상 복호화 방법 및 그 장치
US10326994B2 (en) * 2017-08-15 2019-06-18 Google Llc Modifying a scan order to limit scan distance
CN107846263B (zh) * 2017-11-01 2020-07-14 南京莱斯电子设备有限公司 一种基于分段计算的信源二进制算术编码方法和编码系统
CN109756739B (zh) * 2017-11-07 2022-09-02 华为技术有限公司 图像预测方法和装置
CN108230487A (zh) * 2017-12-21 2018-06-29 上海新案数字科技有限公司 共享摄像头资源的方法及设备
US11665365B2 (en) * 2018-09-14 2023-05-30 Google Llc Motion prediction coding with coframe motion vectors
US11212520B2 (en) * 2018-12-04 2021-12-28 Ati Technologies Ulc Region-based reference frame management
EP3700210A1 (en) 2019-02-21 2020-08-26 Ateme Method and apparatus for image encoding
EP3713235B1 (en) * 2019-03-19 2023-08-02 Axis AB Methods and devices for encoding a video stream using a first and a second encoder
CN113795861B (zh) * 2019-05-05 2024-08-02 浙江宇视科技有限公司 发送端和接收端的隐私保护方法、电子设备、以及计算机可读存储介质
CN110582022B (zh) * 2019-09-27 2022-12-30 腾讯科技(深圳)有限公司 视频编解码方法和装置及存储介质
KR102153661B1 (ko) * 2019-11-29 2020-09-08 국방과학연구소 위성탑재용 영상레이더 및 위성탑재용 영상레이더의 텔레메트리 데이터 축소 방법
KR20210136476A (ko) 2020-05-07 2021-11-17 삼성전자주식회사 쿼드 트리 방법의 파라미터들을 이용하여 압축하는 장치 및 방법
EP3962091B1 (en) * 2020-08-26 2024-08-28 Tata Consultancy Services Limited Methods and systems for maintaining quality of experience in real-time live video streaming
US12120296B2 (en) 2021-03-23 2024-10-15 Tencent America LLC Method and apparatus for video coding
CN115881140A (zh) * 2021-09-29 2023-03-31 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序产品
US12113996B2 (en) * 2021-12-06 2024-10-08 Tencent America LLC Arrangement of adaptive loop filter coefficients for fast vectorized transpositions
CN114640853B (zh) * 2022-05-18 2022-07-29 滨州市人防工程与指挥保障中心 一种无人机巡航图像处理系统
CN115865099B (zh) * 2022-12-01 2024-04-16 河南大学 基于霍夫曼编码的多类型数据分段压缩方法及系统

Family Cites Families (167)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60186179A (ja) * 1984-03-06 1985-09-21 Nec Corp 画像信号の予測符号化方式とその装置
JPS6192073A (ja) 1984-10-12 1986-05-10 Hitachi Ltd 画像デ−タ圧縮方式
DE3629472A1 (de) * 1986-08-29 1988-03-03 Licentia Gmbh Verfahren zur bewegungskompensierten bild-zu-bild-praediktionscodierung
ATE74219T1 (de) * 1987-06-02 1992-04-15 Siemens Ag Verfahren zur ermittlung von bewegungsvektorfeldern aus digitalen bildsequenzen.
US6563875B2 (en) 1987-12-30 2003-05-13 Thomson Licensing S.A. Adaptive method of encoding and decoding a series of pictures by transformation, and devices for implementing this method
JP2743434B2 (ja) 1989-02-17 1998-04-22 日本ビクター株式会社 動き補償フレーム間予測符号化回路
JPH02272970A (ja) 1989-04-14 1990-11-07 Sony Corp データ処理回路
US5091782A (en) * 1990-04-09 1992-02-25 General Instrument Corporation Apparatus and method for adaptively compressing successive blocks of digital video
DE69029999T2 (de) * 1990-07-20 1997-08-14 Philips Electronics Nv Vorrichtung zur Verarbeitung von Bewegungsvektoren
SE469866B (sv) 1991-04-12 1993-09-27 Dv Sweden Ab Metod för estimering av rörelseinnehåll i videosignaler
EP0533195A2 (en) * 1991-09-20 1993-03-24 Sony Corporation Picture signal encoding and/or decoding apparatus
JP3263960B2 (ja) * 1991-10-22 2002-03-11 ソニー株式会社 動きベクトル符号器および復号器
US5442458A (en) 1991-12-18 1995-08-15 Eastman Kodak Company Method and associated apparatus for encoding bitplanes for improved coding efficiency
US5461423A (en) * 1992-05-29 1995-10-24 Sony Corporation Apparatus for generating a motion vector with half-pixel precision for use in compressing a digital motion picture signal
US5289276A (en) 1992-06-19 1994-02-22 General Electric Company Method and apparatus for conveying compressed video data over a noisy communication channel
US5377018A (en) * 1992-06-22 1994-12-27 Media Vision Video compression and decompression using block selection and subdivision
US5365280A (en) * 1992-06-26 1994-11-15 U.S. Philips Corporation Method and apparatus for discriminating between movie film and non-movie film and generating a picture signal processing mode control signal
US5371841A (en) 1992-07-31 1994-12-06 Eastman Kodak Company Progressive bit plane reconstruction method
US5717394A (en) 1993-02-10 1998-02-10 Ricoh Company Ltd. Method and apparatus for encoding and decoding data
US5586285A (en) 1993-02-19 1996-12-17 Intel Corporation Method and circuitry for increasing reserve memory in a solid state memory disk
US6327304B1 (en) 1993-05-12 2001-12-04 The Duck Corporation Apparatus and method to digitally compress video signals
US6181822B1 (en) 1993-05-12 2001-01-30 The Duck Corporation Data compression apparatus and method
FI94306C (fi) 1993-07-15 1995-08-10 Nokia Technology Gmbh Menetelmä televisiokuvan pienten kuvasegmenttien liikevektoreiden määrittämiseksi
US5398068A (en) * 1993-09-02 1995-03-14 Trustees Of Princeton University Method and apparatus for determining motion vectors for image sequences
JPH07135660A (ja) 1993-11-12 1995-05-23 Matsushita Electric Ind Co Ltd 動きベクトル符号化装置
US5999641A (en) 1993-11-18 1999-12-07 The Duck Corporation System for manipulating digitized image objects in three dimensions
KR100213018B1 (ko) 1994-07-30 1999-08-02 윤종용 동화상 부호화장치
US5706059A (en) * 1994-11-30 1998-01-06 National Semiconductor Corp. Motion estimation using a hierarchical search
EP0721287A1 (en) * 1995-01-09 1996-07-10 Daewoo Electronics Co., Ltd Method and apparatus for encoding a video signal
DE69619002T2 (de) * 1995-03-10 2002-11-21 Kabushiki Kaisha Toshiba, Kawasaki Bildkodierungs-/-dekodierungsvorrichtung
JPH08275160A (ja) * 1995-03-27 1996-10-18 Internatl Business Mach Corp <Ibm> 離散余弦変換方法
KR0178198B1 (ko) 1995-03-28 1999-05-01 배순훈 영상 신호 부호화 장치
WO1996033558A1 (en) 1995-04-18 1996-10-24 Advanced Micro Devices, Inc. Method and apparatus for hybrid vlc bitstream decoding
US5812197A (en) * 1995-05-08 1998-09-22 Thomson Consumer Electronics, Inc. System using data correlation for predictive encoding of video image data subject to luminance gradients and motion
US5936673A (en) * 1995-05-26 1999-08-10 Intel Corporation Temporal tile staggering for block based video compression
JP3364074B2 (ja) 1995-06-05 2003-01-08 株式会社リコー ビットプレーン符号化装置
US5568200A (en) 1995-06-07 1996-10-22 Hitachi America, Ltd. Method and apparatus for improved video display of progressively refreshed coded video
JP3618833B2 (ja) 1995-07-14 2005-02-09 キヤノン株式会社 画像処理装置及び方法
KR0153671B1 (ko) * 1995-06-30 1998-11-16 배순훈 고선명 텔레비젼 엔코더의 레이트 콘트롤러
MY121607A (en) * 1995-07-10 2006-02-28 Hyundai Curitel Inc Grid moving method of object image and apparatus using the same and compaction/motion estimation method using the same and apparatus thereof
JPH11513205A (ja) 1995-07-11 1999-11-09 テレフオンアクチーボラゲツト エル エム エリクソン(パブル) ビデオ符号化装置
EP1274254B1 (en) * 1995-08-29 2011-07-06 Sharp Kabushiki Kaisha Video coding device and video decoding device with a motion compensated interframe prediction
US5835138A (en) 1995-08-30 1998-11-10 Sony Corporation Image signal processing apparatus and recording/reproducing apparatus
JP3068002B2 (ja) 1995-09-18 2000-07-24 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
GB9519923D0 (en) * 1995-09-29 1995-11-29 Philips Electronics Nv Motion estimation for predictive image coding
JPH09102954A (ja) 1995-10-04 1997-04-15 Matsushita Electric Ind Co Ltd 1つまたは2つの予測ブロックからブロックの画素値を計算する方法
KR0181069B1 (ko) 1995-11-08 1999-05-01 배순훈 움직임 추정장치
GB2308262B (en) 1995-12-16 1999-08-04 Paul Gordon Wilkins Method for analysing the content of a video signal
KR100197368B1 (ko) * 1995-12-23 1999-06-15 전주범 영상 에러 복구 장치
JP3157101B2 (ja) * 1996-03-08 2001-04-16 沖電気工業株式会社 画像符号化方法及び画像符号化装置
US5912676A (en) 1996-06-14 1999-06-15 Lsi Logic Corporation MPEG decoder frame memory interface which is reconfigurable for different frame store architectures
CA2208950A1 (en) * 1996-07-03 1998-01-03 Xuemin Chen Rate control for stereoscopic digital video encoding
US5926226A (en) * 1996-08-09 1999-07-20 U.S. Robotics Access Corp. Method for adjusting the quality of a video coder
US6075875A (en) 1996-09-30 2000-06-13 Microsoft Corporation Segmentation of image features using hierarchical analysis of multi-valued image data and weighted averaging of segmentation results
JP3967405B2 (ja) * 1996-10-09 2007-08-29 テキサス インスツルメンツ インコーポレイテツド 画像信号の符号化方法
US7453490B2 (en) * 1997-01-31 2008-11-18 Gyrus Acmi, Inc. Correction of image signals characteristic of non-uniform images in an endoscopic imaging system
US6005980A (en) * 1997-03-07 1999-12-21 General Instrument Corporation Motion estimation and compensation of video object planes for interlaced digital video
US5991447A (en) * 1997-03-07 1999-11-23 General Instrument Corporation Prediction and coding of bi-directionally predicted video object planes for interlaced digital video
US6385341B1 (en) 1997-04-17 2002-05-07 Microsoft Corporation Technique for decoding variable length data codes
JP3351705B2 (ja) * 1997-04-25 2002-12-03 日本ビクター株式会社 動き補償符号化装置、動き補償符号化方法、及び記録媒体への記録方法
DE19721728C2 (de) 1997-05-24 2001-07-12 Byk Chemie Gmbh Dispergiermittel für Pigmente oder Füllstoffe auf der Basis von Acrylsäurealkylester-Polymeren, Verwendung und Verfahren zur Herstellung
JP3381827B2 (ja) * 1997-06-04 2003-03-04 富士ゼロックス株式会社 カラー画像符号化装置およびカラー画像復号装置
US6359929B1 (en) * 1997-07-04 2002-03-19 Matsushita Electric Industrial Co., Ltd. Image predictive decoding method, image predictive decoding apparatus, image predictive coding apparatus, and data storage medium
DE19730305A1 (de) 1997-07-15 1999-01-21 Bosch Gmbh Robert Verfahren zur Erzeugung eines verbesserten Bildsignals bei der Bewegungsschätzung von Bildsequenzen, insbesondere eines Prädiktionssignals für Bewegtbilder mit bewegungskompensierender Prädiktion
KR100244291B1 (ko) * 1997-07-30 2000-02-01 구본준 동영상 움직임 벡터 코딩 방법
US5956431A (en) 1997-10-02 1999-09-21 S3 Incorporated System and method for fixed-rate block-based image compression with inferred pixel values
EP0953254B1 (en) * 1997-11-17 2006-06-14 Koninklijke Philips Electronics N.V. Motion-compensated predictive image encoding and decoding
JP2891253B1 (ja) * 1997-12-10 1999-05-17 日本電気株式会社 画像圧縮処理装置
KR100523908B1 (ko) * 1997-12-12 2006-01-27 주식회사 팬택앤큐리텔 격행주사 영상에 대한 영상신호 부호화 장치 및 그 방법
US5903382A (en) 1997-12-19 1999-05-11 Rockwell International Corporation Electrodeposition cell with high light transmission
US6501860B1 (en) * 1998-01-19 2002-12-31 Canon Kabushiki Kaisha Digital signal coding and decoding based on subbands
KR100328417B1 (ko) * 1998-03-05 2002-03-16 마츠시타 덴끼 산교 가부시키가이샤 화상부호화장치및화상복호화장치, 화상부보화방법 및 화상복호화방법, 및 데이터기억매체
JP3856262B2 (ja) 1998-03-09 2006-12-13 日本ビクター株式会社 動き補償符号化装置、動き補償符号化方法、及び動き補償符号記録媒体
JPH11289544A (ja) 1998-04-02 1999-10-19 Sony Corp 動き検出装置およびその方法
JP3553363B2 (ja) 1998-04-03 2004-08-11 京セラミタ株式会社 デジタル画像読取装置
JPH11341496A (ja) * 1998-05-28 1999-12-10 Matsushita Electric Ind Co Ltd 画像処理方法,画像処理装置,及びデータ記憶媒体
US6411651B1 (en) 1998-06-26 2002-06-25 Compaq Information Technologies Group, L.P. Method and system for distributed video compression in personal computer architecture
JP3808241B2 (ja) * 1998-07-17 2006-08-09 富士写真フイルム株式会社 データ圧縮方法および装置並びに記録媒体
JP3606306B2 (ja) * 1998-10-08 2005-01-05 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
US20020141501A1 (en) * 1998-11-20 2002-10-03 Philips Electronics North America Corporation System for performing resolution upscaling on frames of digital video
US6570924B1 (en) * 1998-11-20 2003-05-27 Interval Research Corp Low cost video compression using fast, modified Z-coding of wavelet pyramids
US6418166B1 (en) * 1998-11-30 2002-07-09 Microsoft Corporation Motion estimation and block matching pattern
US6389072B1 (en) * 1998-12-23 2002-05-14 U.S. Philips Corp. Motion analysis based buffer regulation scheme
JP3660513B2 (ja) 1998-12-25 2005-06-15 沖電気工業株式会社 画像通信装置およびローカルデコード処理方法
JP2002536746A (ja) 1999-02-01 2002-10-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 動画シーケンスを表す記述子とその記述子を使用する画像検索システム
US6400763B1 (en) * 1999-02-18 2002-06-04 Hewlett-Packard Company Compression system which re-uses prior motion vectors
US6222174B1 (en) 1999-03-05 2001-04-24 Hewlett-Packard Company Method of correlating immediately acquired and previously stored feature information for motion sensing
JP3302939B2 (ja) 1999-03-12 2002-07-15 アールシーエー トムソン ライセンシング コーポレイシヨン 独立に圧縮された偶数および奇数フィールド・データ用のビデオ信号圧縮解除装置
EP1035735A3 (en) * 1999-03-12 2007-09-05 Kabushiki Kaisha Toshiba Moving image coding and decoding apparatus optimised for the application of the Real Time Protocol (RTP)
US6499060B1 (en) 1999-03-12 2002-12-24 Microsoft Corporation Media coding for loss recovery with remotely predicted data units
US6381371B1 (en) 1999-03-17 2002-04-30 Hewlett-Packard Company Method and apparatus for processing image files
JP3591712B2 (ja) 1999-04-02 2004-11-24 松下電器産業株式会社 動画送信装置及び動画受信装置
WO2001010135A1 (en) * 1999-07-29 2001-02-08 Mitsubishi Denki Kabushiki Kaisha Moving vector detecting method
US6735249B1 (en) * 1999-08-11 2004-05-11 Nokia Corporation Apparatus, and associated method, for forming a compressed motion vector field utilizing predictive motion coding
BR0014954A (pt) 1999-10-22 2002-07-30 Activesky Inc Sistema de vìdeo baseado em objetos
US6671319B1 (en) 1999-12-28 2003-12-30 Sony Corporation Methods and apparatus for motion estimation using neighboring macroblocks
JP2001203897A (ja) * 2000-01-18 2001-07-27 Nec Corp パタンマッチング符号化装置及び方法
JP2001251627A (ja) * 2000-03-03 2001-09-14 Matsushita Electric Ind Co Ltd 符号化装置、符号化方法及びプログラムを記録した記録媒体
JP3960451B2 (ja) 2000-03-06 2007-08-15 Kddi株式会社 シーン特性検出型動画像符号化装置
US6661925B1 (en) * 2000-03-22 2003-12-09 Board Of Supervisors Of Louisiana State University & Agricultural & Mechanical College Functional set compression
US6522784B1 (en) * 2000-04-11 2003-02-18 International Business Machines Corporation Enhanced compression of gray-level images
JP3677192B2 (ja) * 2000-04-19 2005-07-27 シャープ株式会社 画像処理装置
US6711211B1 (en) * 2000-05-08 2004-03-23 Nokia Mobile Phones Ltd. Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
GB2403618A (en) 2000-05-10 2005-01-05 Picturetel Corp Video coding using multiple buffers
KR100708091B1 (ko) * 2000-06-13 2007-04-16 삼성전자주식회사 양방향 움직임 벡터를 이용한 프레임 레이트 변환 장치 및그 방법
JP2002010265A (ja) 2000-06-20 2002-01-11 Sony Corp 送信装置およびその方法と受信装置およびその方法
US6661842B1 (en) * 2000-09-22 2003-12-09 General Dynamics Decision Systems, Inc. Methods and apparatus for error-resilient video coding
JP4607305B2 (ja) * 2000-09-27 2011-01-05 株式会社東芝 映像符号化装置及び映像符号化方法
US9143546B2 (en) * 2000-10-03 2015-09-22 Realtime Data Llc System and method for data feed acceleration and encryption
US7224840B2 (en) 2000-10-26 2007-05-29 International Business Machines Corporation Method, system, and program for error recovery while decoding compressed data
JP2002141806A (ja) 2000-10-31 2002-05-17 Hitachi Ltd 可変長符号復号装置
JP3699910B2 (ja) * 2000-10-31 2005-09-28 株式会社東芝 データ伝送装置、データ伝送方法及びプログラム
CN1237465C (zh) * 2001-01-10 2006-01-18 皇家菲利浦电子有限公司 编码
CN1156168C (zh) * 2001-01-12 2004-06-30 北京航空航天大学 快速视频运动估计方法
EP1360841A1 (en) * 2001-02-06 2003-11-12 Koninklijke Philips Electronics N.V. Preprocessing method applied to textures of arbitrarily shaped objects
US20030012287A1 (en) 2001-03-05 2003-01-16 Ioannis Katsavounidis Systems and methods for decoding of systematic forward error correction (FEC) codes of selected data in a video bitstream
KR20040035593A (ko) * 2001-03-07 2004-04-29 피티에스 코포레이션 모션 매칭을 위한 국부적 제약
JP2002271788A (ja) * 2001-03-08 2002-09-20 Monolith Co Ltd 画像符号化方法と装置および画像復号方法および装置
JP2002290743A (ja) 2001-03-23 2002-10-04 Ricoh Co Ltd 画像情報符号化方法、符号化装置、ディジタル複写機、ディジタルファクシミリ装置、及び、ディジタルファイリング装置
US6819803B2 (en) 2001-07-02 2004-11-16 International Business Machines Corporation Faster lossless rotation of JPEG images
JP2003046944A (ja) 2001-08-02 2003-02-14 Sony Corp 信号処理装置および方法、記録装置および方法、再生装置および方法、記録再生装置および方法、ビデオカメラ、ならびに、映像モニタ装置
FR2828614A1 (fr) * 2001-08-07 2003-02-14 Koninkl Philips Electronics Nv Methode de codage et de decodage video pour pallier les pertes de donnees dans un signal video code transmis sur un canal
DE60141961D1 (de) * 2001-09-10 2010-06-10 Texas Instruments Inc Verfahren und Vorrichtung zur Bewegungsvektorenabschätzung
KR100642043B1 (ko) 2001-09-14 2006-11-03 가부시키가이샤 엔티티 도코모 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 화상 처리 시스템, 및 저장 매체
US6856701B2 (en) * 2001-09-14 2005-02-15 Nokia Corporation Method and system for context-based adaptive binary arithmetic coding
FI112424B (fi) 2001-10-30 2003-11-28 Oplayo Oy Koodausmenetelmä ja -järjestely
SG152047A1 (en) 2002-01-18 2009-05-29 Toshiba Kk Video encoding method and apparatus and video decoding method and apparatus
JP3864098B2 (ja) 2002-02-08 2006-12-27 日本電信電話株式会社 動画像符号化方法、動画像復号方法、及びこれらの方法の実行プログラムとこれらの実行プログラムを記録した記録媒体
US20030161398A1 (en) * 2002-02-21 2003-08-28 Meir Feder Improving static picture quality in compressed video
US7596179B2 (en) 2002-02-27 2009-09-29 Hewlett-Packard Development Company, L.P. Reducing the resolution of media data
PT1486065E (pt) 2002-03-15 2016-03-30 Nokia Technologies Oy Método para codificação de movimento numa sequência de vídeo
WO2003084235A1 (en) 2002-03-28 2003-10-09 British Telecommunications Public Limited Company Video pre-processing
US7110459B2 (en) * 2002-04-10 2006-09-19 Microsoft Corporation Approximate bicubic filter
US7116831B2 (en) * 2002-04-10 2006-10-03 Microsoft Corporation Chrominance motion vector rounding
JP4355156B2 (ja) 2002-04-16 2009-10-28 パナソニック株式会社 画像復号化方法及び画像復号化装置
JP4102973B2 (ja) * 2002-04-24 2008-06-18 日本電気株式会社 動画像の符号化方法および復号化方法、これを用いた装置とプログラム
PT1467491E (pt) 2002-05-02 2007-03-30 Fraunhofer Ges Forschung Codificação aritmética de coeficientes de transformação
MXPA05000335A (es) * 2002-07-09 2005-03-31 Nokia Corp Metodo y sistema para seleccionar tipo de filtro de interpolacion en codificacion de video.
WO2004008733A2 (en) 2002-07-15 2004-01-22 Nokia Corporation Method for error concealment in video sequences
KR100865034B1 (ko) * 2002-07-18 2008-10-23 엘지전자 주식회사 모션 벡터 예측 방법
US7068722B2 (en) 2002-09-25 2006-06-27 Lsi Logic Corporation Content adaptive video processor using motion compensation
US20040120398A1 (en) * 2002-12-19 2004-06-24 Ximin Zhang System and method for adaptive field and frame video encoding using rate-distortion characteristics
US20040131117A1 (en) * 2003-01-07 2004-07-08 Sheraizin Vitaly S. Method and apparatus for improving MPEG picture compression
WO2004064373A2 (en) * 2003-01-09 2004-07-29 The Regents Of The University Of California Video encoding methods and devices
JP4419458B2 (ja) * 2003-07-14 2010-02-24 リコープリンティングシステムズ株式会社 インクジェットヘッドの製造方法
JP4198608B2 (ja) 2004-01-15 2008-12-17 株式会社東芝 補間画像生成方法および装置
US20050271186A1 (en) 2004-06-02 2005-12-08 Audiopoint, Inc. System, method and computer program product for interactive voice notification
JP4852868B2 (ja) 2005-04-04 2012-01-11 トヨタ自動車株式会社 精密加工方法
JP4662171B2 (ja) 2005-10-20 2011-03-30 ソニー株式会社 符号化装置および方法、復号化装置および方法、プログラム、並びに記録媒体
CN104125464A (zh) 2005-12-08 2014-10-29 维德约股份有限公司 用于视频通信系统中的差错弹性和随机接入的系统和方法
US7924925B2 (en) 2006-02-24 2011-04-12 Freescale Semiconductor, Inc. Flexible macroblock ordering with reduced data traffic and power consumption
US9300956B2 (en) 2006-04-20 2016-03-29 Thomson Licensing Method and apparatus for redundant video encoding
US8488915B2 (en) 2006-05-01 2013-07-16 Georgia Tech Research Corporation Automatic video quality measurement system and method based on spatial-temporal coherence metrics
US20080170793A1 (en) 2007-01-12 2008-07-17 Mitsubishi Electric Corporation Image encoding device and image encoding method
US20090103635A1 (en) 2007-10-17 2009-04-23 Peshala Vishvajith Pahalawatta System and method of unequal error protection with hybrid arq/fec for video streaming over wireless local area networks
CN101414348A (zh) 2007-10-19 2009-04-22 三星电子株式会社 多角度人脸识别方法和系统
US8130823B2 (en) 2007-12-19 2012-03-06 Broadcom Corporation Channel adaptive video transmission system for use with layered video coding and methods for use therewith
AU2008259744B2 (en) 2008-12-18 2012-02-09 Canon Kabushiki Kaisha Iterative DVC decoder based on adaptively weighting of motion side information
CA2824754A1 (en) 2009-09-26 2011-03-31 Disternet Technology Inc. System and method for micro-cloud computing
US8879632B2 (en) 2010-02-18 2014-11-04 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning
US8249361B1 (en) 2010-04-22 2012-08-21 Google Inc. Interdependent learning of template map and similarity metric for object identification
US20120082225A1 (en) 2010-10-01 2012-04-05 Qualcomm Incorporated Selective indication of transform sizes
RU2010140334A (ru) 2010-10-01 2012-04-10 ЭлЭсАй Корпорейшн (US) Внутрикадровое режимное предсказание для видеотранскодера
US8749565B2 (en) 2010-11-19 2014-06-10 Apple Inc. Error check-only mode
US8630341B2 (en) 2011-01-14 2014-01-14 Mitsubishi Electric Research Laboratories, Inc. Method for training and utilizing separable transforms for video coding
JP2014522506A (ja) 2011-05-28 2014-09-04 イグニス・イノベイション・インコーポレーテッド ディスプレイのピクセルの速い補償プログラミングためのシステムと方法
US8775672B2 (en) 2012-06-13 2014-07-08 Hulu, LLC Architecture for simulation of network conditions for video delivery

Also Published As

Publication number Publication date
JP2014099905A (ja) 2014-05-29
US20200236357A1 (en) 2020-07-23
KR101167006B1 (ko) 2012-07-27
US20120320992A1 (en) 2012-12-20
US11240498B2 (en) 2022-02-01
US20120320989A1 (en) 2012-12-20
JP5480775B2 (ja) 2014-04-23
CN101454990A (zh) 2009-06-10
KR101118456B1 (ko) 2012-03-22
JP2007520912A (ja) 2007-07-26
KR20060025528A (ko) 2006-03-21
JP5341024B2 (ja) 2013-11-13
KR101133321B1 (ko) 2012-07-02
KR101131689B1 (ko) 2012-04-23
US20220132116A1 (en) 2022-04-28
US20120320991A1 (en) 2012-12-20
KR20110028561A (ko) 2011-03-18
CN103037214A (zh) 2013-04-10
JP5606591B2 (ja) 2014-10-15
JP2013211908A (ja) 2013-10-10
CA2525390A1 (en) 2004-11-25
KR101140947B1 (ko) 2012-07-03
CN101454990B (zh) 2012-09-05
KR20110028564A (ko) 2011-03-18
US8942290B2 (en) 2015-01-27
WO2004102946A3 (en) 2009-01-22
US20040228410A1 (en) 2004-11-18
US10616576B2 (en) 2020-04-07
US20120320978A1 (en) 2012-12-20
KR20110028560A (ko) 2011-03-18
JP4568887B2 (ja) 2010-10-27
JP2010239640A (ja) 2010-10-21
WO2004102946A2 (en) 2004-11-25
US20120320987A1 (en) 2012-12-20
KR20110028563A (ko) 2011-03-18
US8824553B2 (en) 2014-09-02
KR101118438B1 (ko) 2012-03-13
JP2011050090A (ja) 2011-03-10
EP1656791A2 (en) 2006-05-17
CA2525390C (en) 2014-07-15

Similar Documents

Publication Publication Date Title
KR101131689B1 (ko) 필터 선택을 이용한 비디오 압축 방법
US10567753B2 (en) Skip macroblock coding
US6438168B2 (en) Bandwidth scaling of a compressed video stream
US7643559B2 (en) Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program
US20050013497A1 (en) Intraframe and interframe interlace coding and decoding
EP0924932A2 (en) Apparatus and method of adaptively coding/decoding interlaced shape information

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150309

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160309

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170315

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180308

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190313

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20200311

Year of fee payment: 9