KR20040106364A - 복잡성이 감소된 복호화에 적합한 단층 비디오 부호화된비트열들을 제공하는 시스템 및 방법 - Google Patents

복잡성이 감소된 복호화에 적합한 단층 비디오 부호화된비트열들을 제공하는 시스템 및 방법 Download PDF

Info

Publication number
KR20040106364A
KR20040106364A KR10-2004-7016955A KR20047016955A KR20040106364A KR 20040106364 A KR20040106364 A KR 20040106364A KR 20047016955 A KR20047016955 A KR 20047016955A KR 20040106364 A KR20040106364 A KR 20040106364A
Authority
KR
South Korea
Prior art keywords
dct coefficients
input
dct
coefficients
video image
Prior art date
Application number
KR10-2004-7016955A
Other languages
English (en)
Inventor
잉웨이 첸
즈훈 즈홍
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20040106364A publication Critical patent/KR20040106364A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Abstract

비디오-처리 시스템의 부호화 알고리즘들을 변화시킴으로써 MPEG 복호기의 계산 부하를 줄이는 방법 및 시스템(10)이 제공된다. 부호화 모드 동안에, 데이터 블록들의 흐름이 수신되고 각각의 매크로-블록에 대해 적어도 하나의 움직임 벡터 및 하나의 움직임 보상 예측값이 생성된다(12). 상기 예측값은 DCT 계수들의 세트로 변환된다(14). 상기 양자화 단계에 앞서, DCT 계수들의 세트는 미리 결정된 기준에 따라 변경된다(14). 이 때문에, 가장 낮은 2x2 DCT 계수들을 제외한 DCT 계수들의 총 에너지 레벨이 계산되고, DCT 계수들의 마지막 열 및 마지막 행은 DCT 계수들의 총 에너지 레벨이 미리 결정된 에너지 레벨에 도달할 때까지 선택적으로 버려진다. 그 후에, 버려진 열 및 행은 미리 결정된 값으로 할당된다. 이후 변경된 DCT 계수들은 양이 정해지고(16) 부호화되며(20), 그에 따라 부호화된 매크로-블록들의 비트열을 발생시키고, 이어서 일반적인 복호 과정에 따라 복호된다.

Description

복잡성이 감소된 복호화에 적합한 단층 비디오 부호화된 비트열들을 제공하는 시스템 및 방법{System and method for providing single-layer video encoded bitstreams suitable for reduced-complexity decoding}
단층 비디오 코딩은 디지털-비디오 기록 및 디지털 텔레비젼과 같은, 다양한 응용들에서 가장 널리 사용된다. 상기 비디오는 어떤 비트율로 부호화되고, 이후 복호기는 상기 비트열을 복호하고 부호화된 완전 품질로 모든 픽처를 출력한다. 계산 부하를 줄이기 위하여 단층 비트열들의 복잡성이 감소된 복호가 전개되었다. 그러나, 픽처들이 부분 품질로 복호됨에 따라, 복호기 측에서 움직임 보상을 위해 사용되는 참조 픽처들은 부호화하는 동안 사용되는 것들과 종종 부합하지 않는다. 결과로서, 상기 참조 픽처들에 발생하는 에러들은 다른 픽처들로 전달된다. 이것은 또한 예측 편차(prediction drift) 또는 에러 전달로서 알려져 있다.
계층-비디오 코딩 또는 비트율 계위(scalable) 방법은 단층 비디오 코딩에 대안이다. 비디오는 우선 베이스 층을 발생시키도록 낮은 비트율로 부호화된다. 이후 최초 및 베이스-층-재구성 비디오 사이의 차이는 하나 이상의 확장 층(enhancement layer)들을 발생하도록 부호화된다. 복호기 측에서, 상기 베이스 층은 항상 복호되지만, 상기 확장 층은 이용 가능한 처리 용량에 의존하여 완전히 또는 부분적으로 복호된다. 상기 베이스 층이 복호되기만 하면, 저품질 참조 픽처들이 부호화를 위해 사용되기 때문에 예측 편차가 없다. 상기 완전한 확장 층 및 베이스 층이 둘다 복호되면, 각 층은 복호 목적들을 위해 부호화하는 동안 자신의 대응하는 참조 픽처들을 사용하고, 따라서 예측 편차가 없다. 그러나, 상기 확장 층이 부분적으로만 복호되고 확장-층 픽처들 사이에 움직임 예측이 있다면, 상기 예측 편차는 상기 확장 층에서 발생한다. 더욱이, 이 유형의 코딩은 상기 확장 층에 사용되는 참조 픽처들이 자신들을 효율적인 움직임 예측에 가담시키지 않기 때문에, 압축 동안 본래 덜 효율적이다. 게다가, 멀티-층 코딩에서의 추가 오버헤드는 같은 품질을 생성하기 위해 단층 비트열을 복호하는 것보다 더 복잡하다. 따라서, 실제 구현을 쉽게 하기에 비교적 단순한 최적 복호 성능을 얻을 필요가 있다.
본 발명은 디지털 비디오 정보의 압축에 관한 것이고, 보다 상세하게는, 복호하는 동안 효율을 얻기 위해 서로 다른 코딩 전략들을 제공하는 방법 및 장치에 관한 것이다.
도 1은 비디오 정보를 압축하는 부호기의 예시적인 실시예를 도시하는 도면.
도 2는 본 발명에 따라 복호하는 동안 계산 부하를 줄이기 위해 DCT 계수들을 변경시키는 그래픽 표현을 도시하는 도면.
도 3은 본 발명에 따라 양자화를 수행하기에 앞서 DCT 계수들을 변경시키는 그래픽 표현을 도시하는 도면.
도 4는 본 발명에 따라 복호하는 동안 계산 부하를 줄이는 과정을 예시하는흐름도.
본 발명은 변수 복잡도 복호를 위해 적합한 부호화된 디지털-비디오 신호를 얻기 위하여 단층 부호화 알고리즘들을 변화시킴으로써 MPEG 디지털-비디오-복호기 시스템의 복호 효율을 향상시키는 방법 및 시스템에 관한 것이다.
본 발명의 한 특징에 따르면, 적어도 하나의 매크로-블록을 가지는 입력-비디오 이미지의 스트림을 부호화하는 방법이 제공된다. 상기 방법은, 상기 입력-비디오 이미지의 각각의 매크로-블록에 대하여 움직임 벡터를 발생시키는 단계와, 상기 움직임 벡터에 기초하여 상기 입력-비디오 이미지의 예측-이미지 신호를 발생시키는 단계와, 상기 예측-이미지 신호를 DCT 계수들의 2차원 어레이로 변환하는 단계와, 상기 DCT 계수들의 어레이를 미리 결정된 기준에 따라 새로운 DCT 계수들의 세트로 변경시키는 단계와, 상기 새로운 DCT 계수들을 양자화된(quantized) DCT 값으로 양자화(quantizing)하는 단계와, 직렬 연쇄로 상기 새로운 DCT 계수들의 각 행을 읽도록 지그재그 스캔을 수행하는 단계, 및 부호화된 매크로-블록을 생성하도록 상기 지그재그 스캔으로부터의 상기 직렬 연쇄 및 상기 움직임 벡터를 코딩하는 단계를 포함한다. 상기 DCT 계수들의 어레이를 변경시키는 상기 단계는, 상기 DCT 계수들의 에너지 레벨이 미리 결정된 에너지 레벨에 도달할 때까지 상기 마지막-열의 DCT 계수들 및 상기 마지막-행의 DCT 계수들을 선택적으로 버리는 단계, 및 상기 버려진 열 또는 행을 미리 결정된 값으로 할당하는 단계를 포함한다. 상기 DCT 계수들의 어레이를 변경시키는 상기 단계는, 가장 낮은 2x2 DCT 계수들을 제외한 상기 DCT 계수들의 총 에너지 레벨을 계산하는 단계와, 상기 DCT 계수들의 상기 총 에너지 레벨이 미리 결정된 에너지 레벨에 도달할 때까지 상기 DCT 계수들의 마지막 열 및 마지막 행을 선택적으로 버리는 단계, 및 상기 버려진 열 및 행을 미리 결정된 값으로 할당하는 단계를 포함한다. 상기 방법은, 디콴타이징된(dequantized), 복호된 데이터를 생성하도록 상기 양자화된 DCT 값을 디콴타이징(dequantizing)하는 단계와, 참조 데이터를 생성하도록 상기 디콴타이징된(dequantized), 복호된 데이터를 주파수 도메인에서 공간 도메인으로 변환하는 단계, 및 움직임-보상 픽처들을 생성하도록 상기 참조 데이터에 움직임 보상을 수행하는 단계를 더 포함한다. 본 실시예에서, 상기 입력-비디오 이미지의 예측 (P) 픽처 상의 전체-화소(full-pel) 움직임 보상은 상기 예측-이미지 신호를 상기 DCT 계수들의 어레이로 변환하는 상기 단계에 앞서 수행된다.
본 발명의 다른 특징에 따르면, 적어도 하나의 매크로-블록을 가지는 입력-비디오 이미지를 부호화하는 방법은, (a) 상기 입력-비디오 이미지의 각각의 매크로-블록에 대하여 적어도 하나의 움직임 벡터 및 적어도 하나의 움직임-보상-예측 값을 발생시키는 단계와, (b) 상기 예측값을 DCT 계수들의 세트로 변환하는 단계와, (c) 미리 결정된 기준에 따라 상기 DCT 계수들의 세트를 새로운 DCT 계수들의 세트로 변경시키는 단계와, (d) 상기 DCT 계수들의 세트를 양자화하는 단계, 및 (e) 부호화된 매크로-블록을 생성하도록 상기 계수들의 양자화된 세트 및 상기 움직임 벡터를 코딩하는 단계를 포함한다. 상기 방법은, 상기 부호화된 매크로-블록을 복호 과정으로 전송하는 단계와, 상기 입력-비디오 이미지로부터의 픽처의 상기 유형을 결정하는 단계를 더 포함하고, 예측 픽처가 상기 입력-비디오 이미지로부터 검출되면, 상기 예측값을 상기 DCT 계수들의 세트로 변환하는 상기 단계 (b)를 수행함에 앞서 상기 입력-비디오 이미지에 전체-화소(full-pel) 움직임 보상을 수행한다. 예측 픽처가 상기 입력-비디오 이미지로부터 검출될 때, 상기 움직임 벡터는 완전-움직임(full-motion) 벡터로 변환된다. 상기 DCT 계수들의 어레이는 가장 낮은 2x2 DCT 계수들을 제외하고 상기 DCT 계수들의 총 에너지 레벨을 계산하고, 상기 DCT 계수들의 총 에너지 레벨이 미리 결정된 에너지 레벨에 도달할 때까지 상기 DCT 계수들의 마지막 열 및 마지막 행을 선택적으로 버리고, 상기 버려진 열 및 행을 미리 결정된 값으로 할당함으로써 변경된다. 상기 방법은, 디콴타이징된(dequantized), 복호된 데이터를 생성하도록 상기 양자화된 DCT 값을 디콴타이징(dequantizing)하는 단계와, 참조 데이터를 생성하도록 상기 디콴타이징된(dequantized), 복호된 데이터를 주파수 도메인에서 공간 도메인으로 변환하는 단계, 및 움직임-보상 픽처들을 생성하도록 상기 참조 데이터에 움직임 보상을 수행하는 단계를 더 포함한다.
본 발명의 다른 특징에 따르면, 입력-비디오 이미지를 부호화하는 부호화 시스템은, 상기 입력-비디오 이미지를 수신하고 적어도 하나의 움직임 벡터 및 적어도 하나의 예측-에러 신호를 발생시키도록 구성된 움직임-추정-예측 모듈과, 상기 입력-비디오 이미지로부터 픽처 유형의 분류에 따라 변경되는 DCT 계수들의 2차원 어레이로 상기 예측-에러 신호를 변환하는 상기 움직임-추정-모듈의 출력에 결합되는 이산-코사인-변환기(DCT) 모듈과, 양자화된 계수들을 생성하도록 상기 변경된 DCT 계수들을 양자화하고 상기 DCT 모듈에 결합되는 양자화 모듈과, 상기 양자화된 계수들을 직렬 표현으로 변환하도록 구성되고 상기 양자화 모듈에 결합되는 지그재그 스캐닝 모듈, 및 부호화된 매크로-블록을 생성하도록 상기 계수들의 양자화된 세트 및 상기 움직임 벡터를 코딩하는 코딩 모듈을 포함한다. 상기 시스템은, 상기 양자화 모듈로부터 수신되는 상기 양자화된 계수들을 수신하고 역전시키도록 결합되는 역-양자화 모듈과, 상기 디콴타이징된 계수들을 주파수 도메인에서 공간 도메인으로 변환하는 상기 역-양자화 모듈의 출력에 결합되는 역-이산-코사인 변환기(IDCT), 및 움직임-보상된 픽처들을 형성하도록 상기 IDCT로부터 출력 신호들을 수신하는 참조-프레임-버퍼를 더 포함한다.
다른 특징은 본 발명이 특별한 응용을 위해 원하는대로 하드웨어, 소프트웨어, 또는 하드웨어 및 소프트웨어의 조합으로 구현될 수도 있다.
게다가, 본 발명은 단순하고, 신뢰성 있으며, 저렴한 구현으로 실현될 수도 있다.
이들 및 다른 이점들은 본 기술의 당업자들에게 첨부 도면들과 관련하여 다음의 상세한 설명을 읽고 명백해질 것이다.
첨부 도면들과 함께 다음의 상세한 설명을 참조하여 본 발명의 상기 방법 및 장치를 더 완벽하게 이해할 수도 있다.
본 발명의 철저한 이해를 제공하기 위하여, 다음 설명에서, 제한이라기 보다는 설명의 목적들을 위해, 특별한 구조, 인터페이스들, 기술들 등과 같은 특정한 항목들이 기술되어 있다. 그러나, 본 발명이 이들 특정한 항목들과는 다른 실시예들에 행해질 수도 있음은 본 기술의 당업자들에게 명백할 것이다. 단순과 명료함을 위해, 불필요한 항목으로 본 발명의 설명을 애매하게 하지 않도록 잘 알려진 장치들, 회로들, 및 방법들의 상세한 설명들은 생략된다.
본 발명의 이해를 용이하게 하기 위하여, MPEG 표준에 따라 비디오 데이터를 압축하고 복호하는 종래의 방법은 이후 간략하게 설명될 것이다.
다른 제조업자들 사이의 장비의 상호 이용을 제공하는 비디오-압축 코덱들 및 구현 방법들의 고비용을 줄이기 위하여, 압축 표준이 비디오 부호화 및 복호화를 위한 동화상 전문가 그룹(MPEG) 표준에 의해 만들어졌다. 상기 MPEG 표준은 참조적으로 온전히 통합된 1993-08-01 초판, 국제 표준 ISO/IEC 11172-1의, "정보 기술 -- 약 1.5Mbit/s까지로 디지털 저장 매체들을 위한 동화상들 및 관련 오디오의 코딩", 파트 1,2 및 3에 규정되어 있다.
상기 MPEG 표준에 있어서, 비디오 정보의 프레임들의 세 유형들이 있다: 인트라-프레임들(I 프레임), 순방향-예측 프레임들(P 프레임), 및 양방향-예측 프레임들(B 프레임). I 프레임은 주기적으로 코딩된다, 즉, 프레임들의 각 그룹에 대해하나의 독립 코딩된 프레임. 특정한 개수의 프레임들이 순방향으로 및 다음의 참조 프레임 앞에 위치하도록, 예측은 비디오 프레임, P 프레임의 구성으로 이루어진다. 상기 B 프레임은 두 참조 프레임들 사이에서, 또는 미래 참조 프레임의 매크로-블록으로 과거 참조 프레임의 매크로-블록을 보간함으로써(평균하여) 예측된다. 현재 프레임내 매크로-블록에 관하여 참조 프레임내 매크로-블록의 상대 위치를 지정하는 움직임 벡터는 또한 부호화된다. 현재 프레임은 이전 프레임 및 다음 프레임 기초하여 부호화될 수도 있다. 그 자체로서, 하나의 프레임은 MPEG 부호화 협정에 기초하여 부호화될 필요가 있고, 이후 상기 프레임에 관한 다른 프레임들은 I 프레임을 제외하고, 항상 다른 프레임들과 독립하여 코딩되는, 상기 프레임과의 차이점들에 기초하여 부호화된다.
움직임-보상-기반 비디오 코딩에 있어서, 움직임 벡터들은 현재 프레임의 화소들의 값들이 참조 프레임의 실제 화소들의 값의 항으로 지정되는 정수값들(즉, 전체-화소(full-pel) 코딩), 또는 현재 프레임의 화소들의 값들이 참조 프레임에 존재하는 화소들로부터 보간되는 "가상" 화소들의 항으로 지정되는 반정수 값들(즉, 반-화소(half-pel) 코딩), 1/4-정수 값들(즉, 1/4-화소(quarter-pel) 코딩), 및 소수값들(즉, 소수-화소(fractional-pel) 코딩)을 가질 수 있다. 복호기는 반, 1/4, 소수-화소 격자들을 각각 사용하여 움직임 벡터에 의해 참조되는 이전 매크로-블록으로부터 매크로-블록을 보간해야 하기 때문에 1/4-화소 및 소수-화소 움직임 보상 뿐만아니라 반-화소 움직임 보상도 전체-화소 움직임 보상보다 더 계산적으로 광범하다.
프레임들은 이산-코사인-변환(DCT) 코딩 방식을 사용하여 코딩되고, 상기 방식은 계수들을 특정 코사인-기저 함수(cosine-basis function)의 진폭으로서 부호화한다. DCT 계수들은 양자화되고 또한 변수 또는 런-렝스(run-length) 부호화를 사용하여 코딩된다. 압축 코딩된 프레임들을 수신할 때, 복호기는 과거 참조 프레임의 대응하는 매크로-블록으로 적용되는 움직임 벡터로 움직임 보상을 수행함으로써 현재의 P 프레임의 매크로-블록을 복호한다. 상기 복호기는 각각의 과거 및 미래 참조 프레임들에 적용되는 움직임 벡터들로 움직임 보상을 수행함으로써 B 프레임의 매크로-블록도 또한 복호한다. 하나의 프레임의 화소들의 매크로-블록은 이전 또는 다음 프레임의 화소들의 매크로-블록을 옮김으로써 얻어질 수 있다. 옮김의 양은 움직임 벡터로서 언급된다. I 프레임이 어느 과거 또는 미래 프레임에 관계없이 단일 이미지로서 부호화되기 때문에, 상기 I 프레임을 복호할 때 아무런 움직임 처리도 필요하지 않다.
상기 설명된 바와 같이, 움직임 보상은 특히 소수 움직임 벡터들이 사용될 때, 많은 공통 비디오-압축 해제 방법들에서 가장 계산적으로 철저한 조작들 중 하나이다. 그 자체로서, 상기 압축 해제 부담의 계산상의 요구들을 따라갈 수 없는 비디오 시스템들은 종종 전체 프레임들을 드롭(drop)한다. 이것은 때때로 비디오 재생시 픽처의 순간적인 정지로서 주목할 만하고, 픽처에서 갑작스러운 끊김들 또는 덜컥거림(jerkiness)이 뒤따른다. 복호의 마지막에서 압축 해제 방법들과 관련된 처리 요구 사항들을 줄이기 위하여, 다양한 복호 복잡성 줄임 방법들이 개발되었다. 결과적인 비디오 이미지의 품질을 유지하는 동안 복호의 복잡성이 줄여질 수있도록 본 발명은 압축된 비디오 비트열을 구성하는 색다른 방법을 제공한다.
도 1은 비디오 신호들을 부호화하는 본 발명의 실시예에 따른 부호기(10)의 단순화된 블록도를 도시하고 있다. 부호기(10)는 움직임 추정 및 예측-모듈(12), DCT 모듈(14), 양자화-모듈(16), 지그재그-스캐닝 모듈(18), 런-렝스-코딩 모듈(20), 역-양자화 모듈(22), 역-DCT-모듈(24), 및 참조-프레임-버퍼 모듈(26)을 포함한다. 본 발명의 바람직한 실시예에서, 부호기(10)는 개인용 컴퓨터, 워크스테이션, 개인 휴대 정보 단말기(PDA), 핸드 컴퓨터, 및/또는 마이크로프로세서, 디지털-신호 프로세서, 마이크로-제어기, 마이크로-컴퓨터 및/또는 프로그래밍 명령들에 기초하여 디지털 정보를 다루는 다른 장치와 같은 집적 회로의 중앙 처리 장치에 구현될 수도 있다. 참조-프레임-버퍼(26)는 하드-드라이브 메모리, 랜덤-액세스 메모리, 읽기 전용 메모리, 외부 메모리 및/또는 디지털 정보를 저장하는 다른 장치일 수도 있다. 움직임-보상-및-예측-모듈(12), 역-양자화-모듈(22), 및 역-DCT-모듈(24)을 포함하는 모듈들의 세트는 일반적으로 "임베디드(embedded) 복호기"로서 알려져 있음을 주목하라. 복호 모듈들의 이러한 유형은 본 기술의 당업자들에게 잘 알려져 있고, 따라서, 그것에 대한 설명들은 중복을 피하기 위해 생략된다.
부호기(10)에 의해 수신되는 입력-비디오 신호들(V)은 캠코더, DVD 플레이어, VCR, 텔레비젼 튜너 및/또는 디지털 정보를 수신하는 다른 장치로부터의 신호들일 수도 있다. 비디오 정보의 이 흐름은 아날로그 신호들로부터 디지털 신호들로 변환되고, 이후 부호기(10)에 적용된다. 입력-비디오 신호들은 또한 복수의 층들로 분할되어서 한 시트의 이미지(프레임)에 대응하는 각 픽처는 복수의 조각들로 분할되고, 각 조각은 왼쪽에서 오른쪽으로 및 위에서 아래로 라인에 배치되는 복수의 매크로-블록들로 구성된다. 매크로-블록들 각각은 6개의 성분들로 구성된다: 4개의 밝기 성분들 Y1 내지 Y4로서, 16x16-화소들의 매크로-블록을 구성하는 4개의 8x8 화소 블록들의 밝기의 대표인 것들, 및 같은 매크로-블록에 대해 8x8 화소 블록들의 차 성분들 Cb 및 Cr을 구성하는 두 컬러들(U, V)이다. 픽처의 블록 유닛들로의 분할은 두 연속하는 픽처들 사이의 변화들을 매끄럽게 하는 능력을 향상시킨다.
도 1에 도시된 바와 같이, 움직임-추정-및-예측-모듈(12)은 현재 픽처 블록의 좌표로부터 참조 프레임의 좌표로 오프셋을 제공하는 움직임 벡터들을 추정하기 위해 입력-비디오 신호들(V)을 수신하도록 적응된다. 움직임 정보는 비디오 시퀀스의 연속 프레임들 사이에 존재하는 높은 리던던시(redundancy)를 줄이기 때문에 상기 움직임 벡터들은 이전 참조 프레임으로부터 현재 프레임을 나중에 재구성하기 위해 나중에 사용될 수 있다. 게다가, 현재 프레임의 추정은 이전에-복호된 프레임 및 움직임 벡터들을 사용하여 얻어질 수 있다. 움직임 보상은 예측 에러를 형성하도록 사용되는 이전에-복호된 샘플값들을 포함하는 과거 및/또는 미래 참조 프레임들로 오프셋들을 제공하도록 움직임 벡터들을 사용하는 예측을 수반한다.
이후 매크로-블록들의 8x8 화소 블록들 각각은 64 주파수 대역들 각각에 대해 DCT 계수들의 8x8 블록의 세트를 생성하도록 이산-코사인-변환(DCT)을 받는다. 각 계수는 압축 효율의 손실없이 독립적으로 취급될 수 있음을 주목하라. DCT 계수들의 결과적인 8x8 블록은 양자화-모듈(16)에 의해 수신된다. 본 발명의 바람직한 실시예에서, 각 매크로블록을 부호화하기 위한 정보의 양은 또한 양자화에 앞서 미리 결정된 기준(도 2 및 도 3과 관련하여 나중에 설명됨)에 따라 몇몇 고주파 DCT 계수들을 처리함으로써 조절된다. 이후 8x8 화소 블록내 DCT 계수들은 대응하는 코딩 파라미터, 즉 양자화 웨이트(weight)에 의해 분할된다. 주어진 8x8 화소 블록에 대한 양자화 웨이트들은 8x8 양자화 매트릭스의 항으로 표현된다. 그 후에, 추가 계산들은 각 매크로블록에 대한 양자화 크기값을 고려하기 위해 DCT 계수들에 영향을 받는다. 양자화 크기값은 매크로블록으로부터 변할 수 있는 양자화 정밀도의 공간 조정도에 대응한다. 상기 조정은 각 매크로블록 시각 내용의 특징들에 의존하는 아티팩트들을 로딩하는 감도를 변화시키며, 종종 인간의 눈을 이용한다. 그러한 양자화 값으로 상기 DCT 계수들을 양자화함으로써, 많은 DCT 계수들은 제로들로 변환되고, 따라서 이미지-압축 효율을 향상시킨다.
양자화된 DCT 계수들의 결과적인 8x8 블록은 지그재그-스캐닝-모듈(18)에 의해 수신되고, 여기서 양자화된 계수들의 2차원 블록은 "지그-재그" 순서로 스캔되어서 그것을 양자화된 DCT 계수들의 1차원 열로 변환한다. 그 후에, 런-렝스 코딩-모듈(20)은 단일 심볼로 심볼들의 런(run)을 부호화함으로써 코딩 효율을 향상시키도록 런-렝스 코딩을 사용하여 양자화된 DCT 계수들의 열, 매크로-블록 유형, 및 움직임 벡터들을 부호화한다. 이 코딩 방식은 기술내에 잘 알려져 있고, 허프만(Huffman) 코딩과 같은, 다른 잘 알려진 코딩 방식이 본 발명의 기술들에 따라 전개될 수도 있음을 주목하라. 상기 런-렝스 코딩 모듈(20)의 출력은 비트열 BS이다.
지금, 본 발명에 따라 양자화에 앞서 고주파 DCT 계수들의 정보를 조절함으로써 복호하는 적합한 변수 복잡도를 부호화하는 준비가 상세한 설명으로 설명될것이다.
도 2를 참조하면, 픽처는 8x8 화소 매트릭스 블록들로 분할되고 DCT는 8x8 변환 계수들을 얻기 위해 블록들의 유닛들에서 DCT-모듈(14)에 의해 수행된다. 이후 DCT 계수들의 결과적인 직사각형 8x8 블록은 DCT 계수들의 에너지의 특정 퍼센트(α I )를 포함하는 직사각형을 얻기 위해 DCT 계수들이 분석되는 마스크 변환(이후 "DCT 마스크"로서 언급됨)을 받는다. 이 직사각형은 가장 낮은 2x2 DCT 계수들을 제외한 모든 DCT 블록들의 총 에너지를 처음 계산함으로써 얻어진다. 이후, 마지막 또는 제 8 열의 주파수 성분은 에너지-레벨 계산 동안 버려지고, 도 2(a)에 도시된 것처럼, 가장 낮은 2x2 DCT 계수들을 제외한 에너지 레벨이 다시 계산된다. 이 때, 새로 계산된 에너지 레벨이 미리 결정된 퍼센트, 예컨대 총 에너지의 85%를 초과하는지가 결정된다. 그렇지 않으면, 도 2(b)에 도시된 것처럼, 마지막 또는 제 8 행의 주파수 성분은 가장 낮은 2x2 DCT 계수들을 제외한 DCT 블록들의 잔여 에너지 레벨을 계산할 때 제거된다. 새로 계산된 에너지 레벨이 미리 결정된 퍼센트 밑으로 떨어지지 않으면, 도 2(c)에 도시된 것처럼, 제 7 열의 주파수 성분은 제거되고, 이후 가장 낮은 2x2 DCT 계수들을 제외한, 잔여 DCT 블록들의 새로운 에너지 레벨이 다시 계산된다. 이 방식에서, 추가적인, 열-및-행-주파수 성분은 의도한 에너지 레벨이 얻어질 때까지 선택적으로 제거된다.
도 3을 참조하면, 의도한 에너지 레벨이 얻어지면, 상기 의도한 에너지 레벨을 계산할 때 제거된 열-및-행-주파수 성분들은 비교적 높은 양자화 매트릭스 웨이트(weight), 예를 들면 255로 할당된다. 그런 높은 값으로 상기 DCT 계수들을 양자화함으로써, 상기 DCT 계수들은 양자화 동안 효과적으로 제로들로 변환된다. 고주파 DCT 계수들을 제거하는 것은 부호화 동안 유사 동작이 수행되기 때문에 유효 예측 편차를 일으키지 않을 것이다.
줄여진 복잡도로 복호된 픽처들은 부호기 측의 픽처들만큼 고주파 정보를 가지지 않지만, 상기 줄여진 복잡도는 예측 편차에 기여하는 경향이 있다. 부호기 측에 사용되는 참조 픽처들이 부분-품질 복호의 결과로서 생기는 픽처들에 더 가까워질 수 있다면, 상기 예측 편차는 줄여질 수 있다. 따라서, 본 발명의 바람직한 실시예에서, 몇몇 픽처들은 상기 예측 편차에 덜 기여하는 경향이 있기 때문에 부호화되는 픽처의 유형에 다른 웨이트들을 주는 것이 필요하다. 본 기술의 당업자들은, 다음의 인트라-픽처 전에 에러 전파에 대해 보다 소수의 프레임들이 있기 때문에 현재 픽처들의 그룹(GOP)의 P 픽처들은 I 픽처들보다 예측 편차에 덜 기여함을 이해할 것이다. 그 자체로서, GOP내 나중의 픽처들에 대한 양자화 매트릭스 또는 DCT 마스크는 본 발명에 따라 줄여진-복잡성 복호를 수행할 때 거의 고려하지 않고 설계되어야 한다. 유사하게도, GOP내 제 1 픽처인 I 픽처들에 대한 양자화 매트릭스 또는 DCT 마스크는 부분-품질 복호의 이벤트에서 예측 편차에 대해 최상의 고려로 설계되어야 한다. 또한, B 픽처들은 참조 픽처들로서 사용되지 않기 때문에, 아무런 DCT 마스크도 필요치 않다. 따라서, 부호화하는 동안 B 픽처들에 대한 양자화 매트릭스는 최대한 활용된 단층 부호화에 대해서와 같이 지속될 수도 있다.
움직임 보상은 계산적으로 집중적인 연산인 경향이 있기 때문에 상기 움직임보상을 단순화함으로써 복잡성 복호를 줄이는 다른 방법이 있음을 또한 주목하라. 따라서, 본 발명의 바람직한 실시예에 있어서, 부호화하는 동안 코아서-정밀도(coarser-precision) MC는 변수 복잡성 복호를 더 쉽게하도록 적용될 수 있다. 예를 들면, 1/2 화소 MC가 부호화를 위해 (MPEG-2에서 처럼) 사용된다면, 복호기는 비정수 움직임 벡터들이 계산 피크 부하 주기들 동안 현재의 매크로-블록을 위해 사용될 때 1/2-화소-위치 화소값들을 보간하지 않고 전체-화소 움직임 보상만을 적용하도록 강행될 수도 있다. 유사하게도, 1/4 화소 MC가 1/2 화소 MC, 전체-화소 MC, 또는 그것들의 임의의 결합의 부호화를 위해 사용된다면, 복호를 위해 적용될 수 있다. 따라서, 줄여진-복잡성 복호로부터의 예측 편차는 단순화된 움직임 예측이 P 픽처들만을 위해 부호화하는 동안 이용된다면 소거되거나 줄여질 수 있다. 그러나, 상기 움직임 예측은 I 픽처들을 위해 수행되지 않고 따라서 적용 가능하지 않다. 또한, B 픽처들은 미래 참조 픽처들로서 사용되지 않기 때문에, 상기 B 픽처들은 전체-복잡성의 더 높은 정밀도 움직임 보상으로 부호화될 수 있다.
상기 고려사항들을 보면, 다음의 도 4의 흐름도는 본 발명의 실시예에 따라 복호의 복잡도를 줄일 수 있는 부호화-동작 과정을 도시하고 있다.
도 4를 참조하면, 단계 100에서 부호기(10)에 의해 상기 입력-비디오 정보를 수신할 때, 다른 부호화 모드가 이하 설명되는 바와 같이 픽처 분류에 따라 적용될 수 있도록, 단계 102에서 픽처의 유형이 검출된다.
I. 현재의 픽처는 인트라 (I) 픽처로서 부호화된다 .
I 프레임 픽처는 8x8 블록들로 분할되고, 이후 DCT는 단계 104에서 수행되고여기서 각 계수는C i,j 로 표시되고, i 및 j의 범위는 0에서 7까지이다. 단계 106에서, DCT 계수들은 가장 낮은 2x2 DCT 계수들을 제외한 DCT 계수들의 에너지의α I 를 포함하는 직사각형을 얻도록 분석된다. 수학식으로, 직사각형은 다음과 같이 얻어진다: 먼저, 가장 낮은 2x2 계수들을 제외한 모든 DCT 블록들의 총 에너지를 계산한다:
다음에,E α = α I E를 계산한다. 다음에, 초기 행-및-열 숫자들을 i=j=7로 놓는다. 다음에, 다음 단계들을 반복한다:
(이 단계는 맨 오른쪽 열 주파수 성분을 제거한다),
만약E <= E α 이면, 멈추고 (i,j-1)을 출력하고, 그렇지 않으면 다음 단계를 계속한다:
(이 단계는 가장 낮은 행 주파수 성분을 제거한다),
만약E <= E α 이면, 멈추고 (i-1,j-1)을 출력하고, 그렇지 않으면 다음 단계를 계속한다:
i=i-1, j=j-1.
직사각형 모양의 원하는 에너지 레벨을 얻은 후, 대응하는 직사각형에 대한양자화 매트릭스는 단계 108에서 계산된다. 전체 부호화에 대한 양자화 매트릭스는임을 가정하고, 여기서 i,j의 범위는 0에서 7까지이다. 그러한 매트릭스의 예는 각 매크로-블록에 대한 코딩 모드가 예측 잔여들(에러 신호)의 에너지를 비교함으로써 선택되는 인트라-픽처들에 대한 일반적인 MPEG-코딩-방식(즉, 테스트 모델들 5(TM5)) 매트릭스이다. 즉, 인트레이드-모드 결정은 각 코딩 모드에 대한 예측 잔여들의 분산과 매크로-블록 화소들의 분산과의 비교에 의해 결정된다.
현재의 인트라-픽처들에 대한 부분적인 부호화에 대한 양자화 매트릭스는 다음과 같이 계산된다:
마지막으로, 단계 110에서, 변경된 양자화 매트릭스는 부호화되고, 부호화된 신호들은 복호측으로 전송된다.
II . 현재의 픽처는 예측(P) 픽처로서 부호화된다 .
P 픽처가 단계 102에서 검출되면, P 픽처는 단계 120에서 전체-화소(저감 해상도) 움직임 예측을 받는다. 단계 122 내지 단계 128의 동작은 단계 104 내지 단계 110에 관하여 상기 설명된 것과 본질적으로 같은 것이다. 단지 주목할 만한 차이는 αP의 설정은 현재 GOP내 이 P 픽처의 위치에 의존한다는 것이다. 그러므로, 전술의 단락들에 설명된 비슷한 요소들의 논의는 중복을 피하기 위해 생략된다. αP의 설정은 현재 GOP내 이 P 픽처의 위치에 의존한다. P 픽처들이 나중의 GOP에 있을 때, 하위 예측 편차는 I 픽처가 예측 주기를 재설정하기 전에 후속 프레임들로 끝날 것이다. 우리는 GOP 크기(픽처들의 그룹내 픽처들의 개수)를 N으로 표시하고, 상기 GOP내 P 픽처의 상대 위치를 n으로 표시한다. αP는 다음과 같이 계산된다:
αP= αI (1-n/N), 단 n의 범위는 M-1에서 N-1까지.
III. 현재 픽처는 양방향 -예측 픽처로서 부호화된다 .
현재의 픽처가 양방향 픽처로서 부호화되면, B 픽처들로서의 수행-노멀(perform-normal) 부호화는 복호기 측상의 예측 편차에 기여하지 않고, 그러므로 어느 부호화-시간-복잡성-줄임 준비도 필요하지 않다.
비디오 부호기에서 부호화 모드를 적응성 있게 변화시킴으로써 압축 해제 방법론과 관련된 처리 요구 사항들을 줄이는 방법 및 시스템을 앞서 밝혔다. 상기 방법 및 시스템의 어떤 이점들은 최종 비디오 이미지의 선명도를 지나치게 떨어뜨리지 않는 동안 압축 해제 효율을 증가시킴으로써 이루어졌음은 본 기술의 당업자들에게 명백해야 한다. 어떤 압축 효율이 부호화하는 동안 유지되도록 부호화 과정을 설계함으로써, 고정된 전체 품질 복호를 위해 최대한 활용된 정상 부호화 과정과 비교될 때 복호하는 동안 예측 편차를 줄이기 위해 복잡성 줄임은 더 낮은 품질 성능 저하로 이루어질 수 있다.
본 발명의 바람직한 실시예들이 예시되었고 설명되었지만, 본 발명의 참 범위를 벗어나지 않는 다양한 변화들 및 변경들이 행해질 수도 있고 동등물들이 그것들의 요소들로 대신될 수도 있음을 본 기술의 당업자들은 이해할 것이다. 따라서,본 발명은 본 발명을 수행하기 위해 의도된 최선의 모드로서 밝혀진 특정 실시예로 제한되지 않지만, 본 발명은 첨부된 청구항들의 범위내로 내려진 모든 실시예들을 포함한다고 의도된다.

Claims (16)

  1. 적어도 하나의 매크로-블록을 가지는 입력-비디오 이미지의 스트림을 부호화하는 방법(10)에 있어서,
    상기 입력-비디오 이미지의 각각의 매크로-블록에 대하여 움직임 벡터를 발생시키는 단계(12)와,
    상기 움직임 벡터에 기초하여 상기 입력-비디오 이미지의 예측-이미지 신호를 발생시키는 단계(12)와,
    상기 예측-이미지 신호를 DCT 계수들의 2차원 어레이로 변환하는 단계(14)와,
    상기 DCT 계수들의 어레이를 미리 결정된 기준에 따라 새로운 DCT 계수들의 세트로 변경시키는 단계(14)와,
    상기 새로운 DCT 계수들을 양자화된(quantized) DCT 값으로 양자화(quantizing)하는 단계(16)와,
    직렬 연쇄(serial chain)로 상기 새로운 DCT 계수들의 각 행을 읽도록 지그재그 스캔을 수행하는 단계(18), 및
    부호화된 매크로-블록을 생성하도록 상기 지그재그 스캔으로부터의 상기 직렬 연쇄 및 상기 움직임 벡터를 코딩하는 단계(20)를 포함하는, 입력-비디오 이미지의 스트림을 부호화하는 방법.
  2. 제 1 항에 있어서,
    상기 DCT 계수들의 어레이를 변경시키는 상기 단계는,
    상기 DCT 계수들의 에너지 레벨이 미리 결정된 에너지 레벨에 도달할 때까지 상기 마지막-열의 DCT 계수들 및 상기 마지막-행의 DCT 계수들을 선택적으로 버리는 단계, 및
    상기 버려진 열 또는 행에 미리 결정된 값을 할당하는 단계를 포함하는, 입력-비디오 이미지의 스트림을 부호화하는 방법.
  3. 제 1 항에 있어서,
    DCT 계수들의 상기 어레이는 8x8 매트릭스인, 입력-비디오 이미지의 스트림을 부호화하는 방법.
  4. 제 1 항에 있어서,
    상기 예측-이미지 신호를 상기 DCT 계수들의 어레이로 변환하는 단계는 시간 도메인에서 주파수 도메인으로의 상기 DCT 계수들의 변환을 포함하는, 입력-비디오 이미지의 스트림을 부호화하는 방법.
  5. 제 1 항에 있어서,
    상기 DCT 계수들의 어레이를 변경시키는 상기 단계는,
    가장 낮은 2x2 DCT 계수들을 제외한 상기 DCT 계수들의 총 에너지 레벨을 계산하는 단계와,
    상기 DCT 계수들의 상기 총 에너지 레벨이 미리 결정된 에너지 레벨에 도달할 때까지 상기 DCT 계수들의 마지막 열 및 마지막 행을 교대로 버리는 단계, 및
    상기 버려진 열 및 행을 미리 결정된 값으로 할당하는 단계를 포함하는, 입력-비디오 이미지의 스트림을 부호화하는 방법.
  6. 제 1 항에 있어서,
    상기 코딩하는 단계는 미리 결정된 부호화 구성 테이블에 따라 수행되는, 입력-비디오 이미지의 스트림을 부호화하는 방법.
  7. 제 1 항에 있어서,
    디콴타이징된(dequantized), 복호된 데이터를 생성하도록 상기 양자화된 DCT 값을 디콴타이징(dequantizing)하는 단계와,
    참조 데이터를 생성하도록 상기 디콴타이징된(dequantized), 복호된 데이터를 주파수 도메인에서 공간 도메인으로 변환하는 단계, 및
    움직임-보상 픽처들을 생성하도록 상기 참조 데이터에 대해 움직임 보상을 수행하는 단계를 더 포함하는, 입력-비디오 이미지의 스트림을 부호화하는 방법.
  8. 제 1 항에 있어서,
    상기 예측-이미지 신호를 상기 DCT 계수들의 어레이로 변환하는 상기 단계에앞서 상기 입력-비디오 이미지의 예측 (P) 픽처 상의 전체-화소(full-pel) 움직임 보상을 수행하는 단계를 더 포함하는, 입력-비디오 이미지의 스트림을 부호화하는 방법.
  9. 제 1 항에 있어서,
    상기 부호화된 매크로-블록을 복호 과정으로 전송하는 단계를 더 포함하는, 입력-비디오 이미지의 스트림을 부호화하는 방법.
  10. 적어도 하나의 매크로-블록을 가지는 입력-비디오 이미지를 부호화하는 방법(10)에 있어서,
    (a) 상기 입력-비디오 이미지의 각각의 매크로-블록에 대하여 적어도 하나의 움직임 벡터 및 적어도 하나의 움직임-보상-예측 값을 발생시키는 단계(12)와,
    (b) 상기 예측값을 DCT 계수들의 세트로 변환하는 단계(14)와,
    (c) 미리 결정된 기준에 따라 상기 DCT 계수들의 세트를 새로운 DCT 계수들의 세트로 변경시키는 단계(14)와,
    (d) 상기 DCT 계수들의 세트를 양자화하는 단계(16), 및
    (e) 부호화된 매크로-블록을 생성하도록 상기 계수들의 양자화된 세트 및 상기 움직임 벡터를 코딩하는 단계(20)를 포함하는, 입력-비디오 이미지를 부호화하는 방법.
  11. 제 10 항에 있어서,
    상기 입력-비디오 이미지로부터의 픽처의 상기 유형을 결정하는 단계(102)를 더 포함하는, 입력-비디오 이미지를 부호화하는 방법.
  12. 제 11 항에 있어서,
    예측 픽처가 상기 입력-비디오 이미지로부터 검출되면, 상기 예측값을 상기 DCT 계수들의 세트로 변환하는 상기 단계 (b)를 수행함에 앞서 상기 입력-비디오 이미지에 대해 전체-화소(full-pel) 움직임 보상을 수행하는, 입력-비디오 이미지를 부호화하는 방법.
  13. 제 11 항에 있어서,
    예측 픽처가 상기 입력-비디오 이미지로부터 검출될 때 상기 움직임 벡터를 완전-움직임(full-motion) 벡터로 변환하는 단계를 더 포함하는, 입력-비디오 이미지를 부호화하는 방법.
  14. 입력-비디오 이미지를 부호화하는 부호화 시스템(10)에 있어서,
    - 상기 입력-비디오 이미지를 수신하고 적어도 하나의 움직임 벡터 및 적어도 하나의 예측-에러 신호를 발생시키도록 구성된 움직임-추정-예측 모듈(12)과,
    - 상기 입력-비디오 이미지로부터 픽처 유형의 분류에 따라 변경되는 DCT 계수들의 2차원 어레이로 상기 예측-에러 신호를 변환하는 상기 움직임-추정-모듈(12)의 출력에 결합되는 이산-코사인-변환기(DCT)(14) 모듈과,
    - 상기 DCT 모듈에 결합되어 양자화된 계수들을 생성하기 위해 상기 변경된 DCT 계수들을 양자화하는 양자화 모듈(16)과,
    - 상기 양자화 모듈에 결합되어 상기 양자화된 계수들을 직렬 표현으로 변환하도록 구성되는 지그재그 스캐닝 모듈(18), 및
    - 부호화된 매크로-블록을 생성하도록 상기 계수들의 양자화된 세트 및 상기 움직임 벡터를 코딩하는 코딩 모듈(20)을 포함하는, 부호화 시스템.
  15. 제 14 항에 있어서,
    - 상기 양자화 모듈로부터 수신되는 상기 양자화된 계수들을 수신하고 역전시키도록(inverse) 결합되는 역-양자화 모듈(22)과,
    - 상기 역-양자화 모듈(22)의 출력에 결합되어 상기 디콴타이징된 계수들을 주파수 도메인에서 공간 도메인으로 변환하는 역-이산-코사인 변환기(IDCT)(24), 및
    - 움직임-보상된 픽처들을 형성하도록 상기 IDCT로부터 출력 신호들을 수신하는 참조-프레임-버퍼(26)를 더 포함하는, 부호화 시스템.
  16. 명령들의 순서들을 나타내는 데이터를 저장한 기계-판독가능 매체에 있어서,
    상기 명령들의 순서들은, 프로세서에 의해 수행될 때, 상기 프로세서로 하여금,
    - 상기 입력-비디오 이미지의 각각의 매크로-블록에 대해 움직임 벡터를 발생시키고(12),
    - 상기 움직임 벡터에 기초하여 상기 입력-비디오 이미지의 예측-이미지 신호를 발생시키고(12),
    - 상기 예측-이미지 신호를 DCT 계수들의 2차원 어레이로 변환하고(14),
    - 미리 결정된 기준에 따라 상기 DCT 계수들의 어레이를 새로운 DCT 계수들의 세트로 변경하고(14),
    - 상기 새로운 DCT 계수들을 양자화된 DCT 값으로 양자화하고(16),
    - 직렬 연쇄로 상기 새로운 DCT 계수들의 각 행을 읽도록 지그재그 스캔을 수행하고(18),
    - 부호화된 매크로-블록을 생성하도록 상기 지그재그 스캔으로부터의 상기 직렬 연쇄 및 상기 움직임 벡터를 코딩하도록 하는(20), 기계-판독가능 매체.
KR10-2004-7016955A 2002-04-22 2003-04-15 복잡성이 감소된 복호화에 적합한 단층 비디오 부호화된비트열들을 제공하는 시스템 및 방법 KR20040106364A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/127,528 2002-04-22
US10/127,528 US6985635B2 (en) 2002-04-22 2002-04-22 System and method for providing a single-layer video encoded bitstreams suitable for reduced-complexity decoding
PCT/IB2003/001608 WO2003090469A2 (en) 2002-04-22 2003-04-15 System and method for providing single-layer video encoded bitstreams suitable for reduced-complexity decoding

Publications (1)

Publication Number Publication Date
KR20040106364A true KR20040106364A (ko) 2004-12-17

Family

ID=29215287

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2004-7016955A KR20040106364A (ko) 2002-04-22 2003-04-15 복잡성이 감소된 복호화에 적합한 단층 비디오 부호화된비트열들을 제공하는 시스템 및 방법

Country Status (7)

Country Link
US (1) US6985635B2 (ko)
EP (1) EP1500279A2 (ko)
JP (1) JP4393875B2 (ko)
KR (1) KR20040106364A (ko)
CN (1) CN1647540A (ko)
AU (1) AU2003216693A1 (ko)
WO (1) WO2003090469A2 (ko)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050185852A1 (en) * 2004-02-20 2005-08-25 Jiliang Song Method and apparatus to generate complex borders
KR100694059B1 (ko) * 2004-09-30 2007-03-12 삼성전자주식회사 멀티 타임 스캔 방식에 기초한 인터 모드 인코딩 및디코딩 방법 및 장치
JP2008521324A (ja) * 2004-11-22 2008-06-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ カバーリング及びアンカバーリングを扱う動きベクトル場の投影
US8780957B2 (en) * 2005-01-14 2014-07-15 Qualcomm Incorporated Optimal weights for MMSE space-time equalizer of multicode CDMA system
KR20070117660A (ko) * 2005-03-10 2007-12-12 콸콤 인코포레이티드 컨텐트 적응적 멀티미디어 처리
EP1768415A1 (en) * 2005-09-27 2007-03-28 Matsushita Electric Industrial Co., Ltd. Adaptive scan order of DCT coefficients and its signaling
EP1879401A4 (en) * 2005-05-03 2012-03-28 Panasonic Corp DYNAMIC IMAGE ENCODING METHOD, DYNAMIC IMAGE DECODING METHOD, AND DEVICE THEREFOR
EP1768416A1 (en) * 2005-09-27 2007-03-28 Matsushita Electric Industrial Co., Ltd. Frequency selective video compression and quantization
US9113147B2 (en) * 2005-09-27 2015-08-18 Qualcomm Incorporated Scalability techniques based on content information
US8654848B2 (en) * 2005-10-17 2014-02-18 Qualcomm Incorporated Method and apparatus for shot detection in video streaming
US20070206117A1 (en) * 2005-10-17 2007-09-06 Qualcomm Incorporated Motion and apparatus for spatio-temporal deinterlacing aided by motion compensation for field-based video
US8948260B2 (en) * 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US20070171280A1 (en) * 2005-10-24 2007-07-26 Qualcomm Incorporated Inverse telecine algorithm based on state machine
CN100405851C (zh) * 2005-11-18 2008-07-23 宁波中科集成电路设计中心有限公司 多模标准解码器中运动矢量预测复用设计方法
US8780997B2 (en) * 2005-11-18 2014-07-15 Apple Inc. Regulation of decode-side processing based on perceptual masking
US20070147496A1 (en) * 2005-12-23 2007-06-28 Bhaskar Sherigar Hardware implementation of programmable controls for inverse quantizing with a plurality of standards
US8102916B1 (en) 2006-01-12 2012-01-24 Zenverge, Inc. Dynamically changing media compression format in compressed domain
US7830800B1 (en) 2006-01-12 2010-11-09 Zenverge, Inc. Architecture for combining media processing with networking
US8848789B2 (en) * 2006-03-27 2014-09-30 Qualcomm Incorporated Method and system for coding and decoding information associated with video compression
US9131164B2 (en) * 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
US8208553B2 (en) * 2006-05-04 2012-06-26 Altera Corporation Methods and apparatus for quarter-pel refinement in a SIMD array processor
US8311114B1 (en) 2006-12-06 2012-11-13 Zenverge, Inc. Streamlined transcoder architecture
WO2009032255A2 (en) * 2007-09-04 2009-03-12 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
US8265168B1 (en) 2008-02-01 2012-09-11 Zenverge, Inc. Providing trick mode for video stream transmitted over network
WO2009097284A1 (en) * 2008-02-01 2009-08-06 Zenverge, Inc. Intermediate compression of reference frames for transcoding
US9326004B2 (en) * 2008-06-03 2016-04-26 Broadcom Corporation Reduced memory mode video decode
KR101775555B1 (ko) * 2010-03-02 2017-09-07 삼성전자주식회사 동영상 패킷 생성 방법 및 그 장치
KR20120012301A (ko) * 2010-07-30 2012-02-09 삼성전자주식회사 디지털 방송에서의 확장 방송 서비스 송수신 방법 및 장치
TWI470999B (zh) * 2012-06-19 2015-01-21 Wistron Corp 編輯與儲存串流的方法、裝置、系統
US8861877B2 (en) 2012-07-19 2014-10-14 Omnivision Technologies, Inc. System and method for improving decoder performance by using multiple decoding channels

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69225365T2 (de) * 1991-08-30 1998-11-19 Fuji Xerox Co Ltd Bildsignalkodierungsvorrichtung
US5592302A (en) * 1992-03-23 1997-01-07 Canon Kabushiki Kaisha Coding method for coding pixel blocks and apparatus therefor
US5289548A (en) * 1992-06-30 1994-02-22 Loral Aerospace Corp. Compression and reconstruction of radiological images

Also Published As

Publication number Publication date
JP2005523658A (ja) 2005-08-04
US20030198293A1 (en) 2003-10-23
WO2003090469A2 (en) 2003-10-30
EP1500279A2 (en) 2005-01-26
CN1647540A (zh) 2005-07-27
AU2003216693A1 (en) 2003-11-03
JP4393875B2 (ja) 2010-01-06
AU2003216693A8 (en) 2003-11-03
US6985635B2 (en) 2006-01-10
WO2003090469A3 (en) 2004-02-05

Similar Documents

Publication Publication Date Title
US6985635B2 (en) System and method for providing a single-layer video encoded bitstreams suitable for reduced-complexity decoding
US10687075B2 (en) Sub-block transform coding of prediction residuals
JP3118237B1 (ja) 画像予測復号化方法
US7738714B2 (en) Method of and apparatus for lossless video encoding and decoding
JP4440640B2 (ja) 画像ブロックの復号方法
US9071844B2 (en) Motion estimation with motion vector penalty
US7787541B2 (en) Dynamic pre-filter control with subjective noise detector for video compression
JP2005506815A (ja) 空間拡張可能圧縮のための方法及び装置
KR20040054776A (ko) 고레벨 화소-그리드 모션 보상을 사용하여 복잡성을감소시키기 위한 디코딩
US20130010866A1 (en) Method of decoding a digital video sequence and related apparatus
JPH0818979A (ja) 画像処理装置
US5614953A (en) Image signal decoding apparatus having an encoding error compensation
JP2008109700A (ja) ディジタル信号変換方法およびディジタル信号変換装置
JP2001148852A (ja) 画像情報変換装置及び画像情報変換方法
JP3343554B1 (ja) 画像予測復号化方法及び画像予測符号化装置
JP3157144B1 (ja) 画像予測復号化方法
JP2002359852A (ja) 画像予測復号化装置及び方法
JP4359273B2 (ja) 符号化モード選択方法
JP3343553B1 (ja) 画像予測符号化装置及び方法
JPH06244736A (ja) 符号化装置
JP2002536926A (ja) 画像領域を変換する方法および装置
JP2001268571A (ja) 動画像再符号化装置
JP2001145108A (ja) 画像情報変換装置及び方法

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid