KR101056001B1 - 코딩된 블록 패턴들에 대한 가변 길이 코딩 기술 - Google Patents

코딩된 블록 패턴들에 대한 가변 길이 코딩 기술 Download PDF

Info

Publication number
KR101056001B1
KR101056001B1 KR1020097016465A KR20097016465A KR101056001B1 KR 101056001 B1 KR101056001 B1 KR 101056001B1 KR 1020097016465 A KR1020097016465 A KR 1020097016465A KR 20097016465 A KR20097016465 A KR 20097016465A KR 101056001 B1 KR101056001 B1 KR 101056001B1
Authority
KR
South Korea
Prior art keywords
video block
block
current video
video
coding
Prior art date
Application number
KR1020097016465A
Other languages
English (en)
Other versions
KR20090110328A (ko
Inventor
마르타 카르체비츠
혁준 정
품 사게통
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20090110328A publication Critical patent/KR20090110328A/ko
Application granted granted Critical
Publication of KR101056001B1 publication Critical patent/KR101056001B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Abstract

블록 기반 비디오 코딩에서 이용되는 코딩된 블록 패턴 (CBP) 에 대한 가변 길이 코딩 (VLC) 기술이 설명된다. CBP 의 VLC 에서는, 발생할 가능성이 더 높은 변환 계수의 패턴들이 더 짧은 코드로 코딩되고, 발생할 가능성이 덜 높은 계수의 패턴들이 더 긴 코드로 코딩된다. 본 출원의 기술에 따르면, 다수의 상이한 VLC 테이블이 코딩 디바이스에 저장된다. 인코딩 및 디코딩 프로세스 동안, VLC 테이블 중 하나가 선택되고, 소정의 비디오 블록에 대한 CBP 의 코딩을 수행하는데 이용된다. 테이블은, 넌-제로 변환 계수를 포함하는 현재 비디오 블록에 대해 인접하는 비디오 블록의 수에 기초하여 선택될 수도 있다. 이 기술은 스케일러블 비디오 코딩 (SVC) 에서 강화층의 비디오 블록의 코딩에 특히 유용할 수도 있다.
인코딩, 디코딩, 비디오, 가변 길이 코딩

Description

코딩된 블록 패턴들에 대한 가변 길이 코딩 기술{VARIABLE LENGTH CODING TECHNIQUES FOR CODED BLOCK PATTERNS}
본 출원은, 2007년 1월 8일 출원되고 그 전체가 본 출원에 참조로 통합된 미국 가특허출원 제 60/883,951 호에 대해 우선권의 이익을 주장한다.
기술분야
본 출원은 디지털 비디오 코딩에 관한 것이며, 더 상세하게는, 비디오 정보를 코딩하는데 이용되는 코딩된 블록 패턴들 (CBP) 의 가변 길이 코딩 (VLC) 에 관한 것이다.
배경기술
디지털 비디오 능력은, 디지털 텔레비젼, 디지털 다이렉트 브로드캐스트 시스템, 무선 통신 디바이스, 무선 브로드캐스트 시스템, 개인 휴대 정보 단말 (PDA), 랩탑 또는 데스크탑 컴퓨터, 디지털 카메라, 디지털 레코딩 디바이스, 비디오 게이밍 디바이스, 비디오 게임 콘솔, 셀룰러 또는 위성 무선 전화 등을 포함하는 광범위한 디바이스에 통합될 수 있다. 디지털 비디오 디바이스는, MPEG-2, MPEG-4 또는 H.264/MPEG-4, Part 10, 어드밴스드 비디오 코딩 (AVC) 과 같은 비디오 압축 기술을 구현하여 디지털 비디오를 더 효율적으로 송신 및 수신한다. 비디오 압축 기술은 공간적 및 시간적 예측을 수행하여, 비디오 신호에 내재하는 리던던시를 감소 또는 제거한다.
비디오 코딩에서, 비디오 압축은 일반적으로, 공간적 예측, 모션 추정 및 모션 보상을 포함한다. 인트라-코딩 (intra-coding) 은 공간적 예측에 의존하여, 소정의 비디오 프레임 내의 비디오 블록들 사이에서 공간적 리던던시를 감소 또는 제거한다. 인터-코딩 (inter-coding) 은 시간적 예측에 의존하여 비디오 시퀀스의 연속적 비디오 프레임의 비디오 블록들 사이에서 시간적 리던던시를 감소 또는 제거한다. 인터-코딩에 있어서는, 비디오 인코더가 모션 추정을 수행하여, 2 이상의 인접 프레임들 사이에서 매칭하는 비디오 블록들의 이동을 추적한다. 모션 추정은, 하나 이상의 기준 프레임에서의 대응하는 예측 비디오 블록들에 대한 비디오 블록들의 변위를 나타내는 모션 벡터를 발생시킨다. 모션 보상은 모션 벡터를 이용하여 기준 프레임으로부터 예측 비디오 블록을 발생시킨다. 모션 보상 이후, 예측 비디오 블록을 원래의 비디오 블록으로부터 감산함으로써 잔여 비디오 블록이 형성된다.
비디오 인코더는 통상적으로 변환, 양자화 및 가변 길이 코딩 (VLC) 프로세스를 적용하여, 잔여 블록의 통신과 연관된 비트 레이트를 더 감소시킨다. VLC 는 변환 및 양자화 연산에 의해 생성된 잔여 계수들을 더 압축하기 위해, 산술 코드 또는 가변 길이 코드의 적용을 포함한다. VLC 의 일예는 콘텍스트 적응형 가변 길이 코딩 (CAVLC) 이다. 정보가 코딩되면, 그 정보는 또 다른 디바이스에 전송될 수 있다. 수신 디바이스에서는, 각각의 블록에 대한 모션 정보 및 잔여 정보를 이용하여, 비디오 디코더가 역연산 (inverse operation) 을 수행하여, 인코딩된 비디오를 복원한다.
몇몇 비디오 코딩은 스케일러블 기술을 이용한다. 예를 들어, 스케일러블 비디오 코딩 (SVC) 은, 기저층 및 하나 이상의 스케일러블 강화층 (enhancement layer) 이 이용되는 비디오 코딩을 지칭한다. SVC 에 있어서, 기저층은 통상적으로 비디오 데이터를 기본 레벨 품질로 반송한다. 하나 이상의 강화층은 추가적인 비디오 데이터를 반송하여, 더 높은 공간적 레벨, 시간적 레벨 및/또는 SNR 레벨을 지원한다. 기저층은, 강화층의 송신보다 더 신뢰도 높은 방식으로 송신될 수도 있다. 예를 들어, 변조된 신호의 가장 신뢰도 높은 부분들이 기저층을 송신하는데 이용될 수도 있고, 그 변조된 신호의 덜 신뢰도 높은 부분들이 강화층을 송신하는데 이용될 수도 있다.
개요
일반적으로, 본 출원은 비디오 블록의 코딩된 블록 패턴 (CBP) 을 코딩하는 기술을 설명한다. CBP 는, 그 패턴들에 매핑하는 정보를 통해 코딩된 비디오 블록들 내의 계수의 패턴들을 지칭한다. 서로 다른 CBP 를 코딩하기 위해, 발생할 가능성이 더 높은 계수의 패턴들이 더 짧은 코드로 코딩되고, 발생할 가능성이 덜 높은 계수의 패턴들이 더 긴 코드로 코딩되는 가변 길이 코딩 (VLC) 이 이용될 수도 있다. 코딩된 비디오 블록은 그 헤더 내에 플래그 또는 다른 정보를 포함하여, CBP 가 이용되고 있음을 나타낼 수도 있다.
본 출원의 기술에 따라, 다수의 서로 다른 VLC 테이블이 코딩 디바이스에 저장된다. 인코딩 및 디코딩 프로세스 동안, VLC 테이블 중 하나가 선택되고 소정의 비디오 블록에 대한 CBP 의 코딩을 수행하는데 이용된다. 이 테이블은 코 딩 효율을 증진시키는 방식으로 선택될 수도 있다. 이를 위해, 이 기술은 비디오 프레임 내의 공간적 리던던시 현상을 활용할 수도 있다. 더 상세하게는, 본 출원의 기술은, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록의 수에 기초하여, 현재의 비디오 블록의 CBP VLC 를 위한 테이블 선택을 수행할 수도 있다. 이 기술은 스케일러블 비디오 코딩 (SVC) 에서 강화층의 비디오 블록의 코딩에 특히 유용할 수도 있다.
일예로, 본 출원은, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록의 수에 기초하여 복수의 테이블로부터 현재의 비디오 블록에 대한 VLC 테이블을 선택하는 단계, 및 그 선택된 VLC 테이블을 이용하여 현재의 비디오 블록의 하나 이상의 CBP 를 코딩하는 단계를 포함하는 방법을 제공한다.
또 다른 예로, 본 출원은, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록의 수에 기초하여 다수의 테이블로부터 현재의 비디오 블록에 대한 VLC 테이블을 선택하도록 구성된 VLC 유닛을 포함하고, 그 선택된 VLC 테이블을 이용하여 현재의 비디오 블록의 하나 이상의 CBP 를 코딩하는 디바이스를 제공한다.
또 다른 예로, 본 출원은, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록의 수에 기초하여 복수의 테이블로부터 현재의 비디오 블록에 대한 VLC 테이블을 선택하는 수단 및 그 선택된 VLC 테이블을 이용하여 현재의 비디오 블록의 하나 이상의 CBP 를 코딩하는 수단을 포함하는 디바이스 를 제공한다.
본 출원에서 설명하는 기술은 하드웨어, 소프트웨어, 펌웨어 또는 이들의 임의의 조합으로 구현될 수도 있다. 소프트웨어로 구현되면, 그 소프트웨어는, 마이크로프로세서, 주문형 집적회로 (ASIC), 필드 프로그래머블 게이트 어레이 (FPGA), 또는 디지털 신호 프로세서 (DSP) 와 같은 하나 이상의 프로세서에서 실행될 수도 있다. 이 기술을 실행하는 소프트웨어는 초기에 컴퓨터 판독가능 매체에 저장될 수도 있고, 프로세서에서 로딩 및 실행될 수도 있다.
따라서, 본 출원은, 비디오 코딩 디바이스에서 실행될 때 그 디바이스로 하여금, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록의 수에 기초하여 복수의 테이블로부터 현재의 비디오 블록에 대한 VLC 테이블을 선택하게 하고, 그 선택된 VLC 테이블을 이용하여 현재의 비디오 블록의 하나 이상의 CBP 를 코딩하게 하는 명령들을 포함하는 컴퓨터 판독가능 매체를 또한 고려한다. 몇몇 경우, 이 컴퓨터 판독가능 매체는, 제조자들에게 판매될 수도 있고, 그리고/또는 비디오 코딩 디바이스에서 이용될 수도 있는 컴퓨터 프로그램 제품의 일부를 형성할 수도 있다. 이 컴퓨터 프로그램 제품은 컴퓨터 판독가능 매체를 포함할 수도 있고, 몇몇 경우, 패키징 재료를 또한 포함할 수도 있다.
다른 경우, 본 출원은, 집적 회로, 칩셋, 주문형 집적 회로 (ASIC), 필드 프로그래머블 게이트 어레이 (FPGA), 로직, 또는 여기서 설명하는 하나 이상의 기술을 수행하도록 구성된 다양한 조합과 같은 회로를 의도할 수도 있다.
첨부한 도면 및 다음의 상세한 설명에서 본 출원의 하나 이상의 양태들의 세 부사항을 상술한다. 본 출원에서 설명하는 기술의 다른 특징, 목적 및 이점은 상세한 설명, 도면 및 청구항으로부터 명백할 것이다.
도면의 간단한 설명
도 1 은 비디오 인코딩 및 디코딩 시스템을 도시하는 예시적인 블록도이다.
도 2 는 스케일러블 비디오 비트스트림의 기저층 및 강화층의 비디오 프레임을 도시하는 개념도이다.
도 3 은 본 출원에 부합하는 비디오 인코더의 일예를 도시하는 블록도이다.
도 4 는 본 출원에 부합하는 비디오 디코더의 일예를 도시하는 블록도이다.
도 5 는 가변 길이 코딩 (VLC) 인코딩 유닛의 예시적인 블록도이다.
도 6 은 VLC 디코딩 유닛의 예시적인 블록도이다.
도 7 은 본 출원에 부합하는 코딩된 블록 패턴 (CBP) 을 코딩하는 VLC 기술을 도시하는 흐름도이다.
상세한 설명
도 1 은 비디오 인코딩 및 디코딩 시스템 (10) 을 도시하는 블록도이다. 도 1 에 도시된 바와 같이, 시스템 (10) 은, 인코딩된 비디오를 통신 채널 (15) 을 통해 수신 디바이스 (16) 에 송신하는 소스 디바이스 (12) 를 포함한다. 소스 디바이스 (12) 는 비디오 소스 (20), 비디오 인코더 (22) 및 변조기/송신기 (24) 를 포함할 수도 있다. 수신 디바이스 (16) 는 수신기/복조기 (26), 비디오 디코더 (28) 및 디스플레이 디바이스 (30) 를 포함할 수도 있다. 시스템 (10) 은 비디오 정보의 코딩된 블록 패턴들 (CBP) 의 가변 길이 코딩 (VLC) 을 위한 기술을 적용하도록 구성될 수도 있다.
CBP 는, 패턴들에 매핑하는 정보를 통해 코딩된 비디오 블록들 내의 계수의 패턴들을 지칭한다. 몇몇 포맷에서, CBP 는 계수의 4 비트 세트들을 포함하고, 다수의 CBP 는 각각의 비디오 블록에 대해 코딩된다. 그러나, 더 길거나 더 짧은 CBP 가 정의될 수도 있다. 서로 다른 CBP 를 코딩하기 위해, 발생할 가능성이 더 높은 계수의 패턴들이 더 짧은 코드로 코딩되고, 발생할 가능성이 덜 높은 계수의 패턴들이 더 긴 코드로 코딩되는 VLC 기술이 이용될 수도 있다. 코딩된 비디오 블록은 그 헤더 내에 플래그 또는 다른 정보를 포함하여, CBP 가 그 코딩 방식에 이용되고 있음을 나타낼 수도 있다.
본 출원의 기술에 따르면, 다수의 서로 다른 VLC 테이블이 코딩 디바이스들 (12, 16) 의 비디오 인코더 (22) 및 비디오 디코더 (28) 각각에 저장된다. 인코딩 및 디코딩 프로세스 동안, VLC 테이블 중 하나가 선택되어, 소정의 비디오 블록에 대한 CBP 의 인코딩 또는 디코딩을 수행하는데 이용된다. 인코딩 및 디코딩은 여기서는 일반적으로 코딩으로 지칭될 수도 있다. 테이블은, 코딩 효율을 증진시키는 방식으로 선택될 수도 있다. 예를 들어, 비디오 인코더 (22) 및 비디오 디코더 (28) 는 비디오 프레임 내의 공간적 리던던시 현상을 활용할 수도 있다. 더 상세하게는, 비디오 인코더 (22) 및 비디오 디코더 (28) 는, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록의 수에 기초하여 현재의 비디오 블록의 CBP VLC 를 위한 테이블 선택을 수행할 수도 있다. 이 기술은 스케일러블 비디오 코딩 (SVC) 에서 강화층의 비디오 블록의 코딩에 특히 유용할 수도 있다.
도 1 의 예에서, 통신 채널 (15) 은, 무선 주파수 (RF) 스펙트럼 또는 하나 이상의 물리적 송신 라인과 같은 임의의 무선 또는 유선 송신 라인을 포함할 수도 있고, 유선 및 무선 매체의 임의의 조합을 포함할 수도 있다. 통신 채널 (15) 은, 로컬 영역 네트워크, 광역 네트워크, 또는 인터넷과 같은 글로벌 네트워크와 같은 패킷 기반 네트워크의 일부를 형성할 수도 있다. 통신 채널 (15) 은 일반적으로, 소스 디바이스 (12) 로부터 수신 디바이스 (16) 로 비디오 데이터를 송신하기 위한 임의의 적절한 통신 매체 또는 서로 다른 통신 매체들의 집합물을 나타낸다.
소스 디바이스 (12) 는 수신 디바이스 (16) 로의 송신을 위한 코딩된 비디오 데이터를 발생시킨다. 그러나, 몇몇 경우, 디바이스 (12, 16) 는 실질적으로 대칭적 방식으로 동작할 수도 있다. 예를 들어, 각각의 디바이스 (12, 16) 는 비디오 인코딩 및 디코딩 컴포넌트를 포함할 수도 있다. 따라서, 시스템 (10) 은, 예를 들어, 비디오 스트리밍, 비디오 브로드캐스팅 또는 비디오 전화를 위해, 비디오 디바이스 (12, 16) 사이에서 일방향 또는 양방향 비디오 송신을 지원할 수도 있다.
소스 디바이스 (12) 의 비디오 소스 (20) 는, 비디오 카메라와 같은 비디오 캡쳐 디바이스, 이전에 캡쳐된 비디오를 포함하는 비디오 어카이브, 또는 비디오 컨텐츠 제공자로부터의 비디오 피드를 포함할 수도 있다. 또 다른 실시예로서, 비디오 소스 (20) 는 소스 비디오로서 컴퓨터 그래픽스 기반 데이터, 또는 라이브 비디오와 컴퓨터 발생 비디오의 조합을 발생시킬 수도 있다. 몇몇 경우, 비디오 소스 (20) 가 비디오 카메라이면, 소스 디바이스 (12) 및 수신 디바이스 (16) 는 소위 카메라폰 또는 비디오폰을 형성할 수도 있다. 각각의 경우, 캡쳐된 비디오, 미리 캡쳐된 비디오 또는 컴퓨터 발생 비디오는 비디오 소스 디바이스 (12) 로부터 변조기/송신기 (24), 통신 채널 (15) 및 수신기/복조기 (26) 를 통해 비디오 수신 디바이스 (16) 의 비디오 디코더 (28) 로의 송신을 위해 비디오 인코더 (22) 에 의해 인코딩될 수도 있다. 비디오 인코딩 및 디코딩 프로세스는, 여기에서 설명하는 바와 같은 CBP 를 위한 VLC 기술을 구현하여 프로세스를 개선할 수도 있다. 디스플레이 디바이스 (30) 는 디코딩된 비디오 데이터를 사용자에게 디스플레이하며, 음극선관, 액정 디스플레이 (LCD), 플라즈마 디스플레이, 유기 발광 다이오드 (OLED) 디스플레이 또는 또 다른 타입의 디스플레이 디바이스와 같은 임의의 다양한 디스플레이 디바이스를 포함할 수도 있다.
비디오 인코더 (22) 및 비디오 디코더 (28) 는 시간적, 공간적 및/또는 신호대 잡음비 (SNR) 스케일러빌러티를 위해 스케일러블 비디오 코딩 (SVC) 을 지원하도록 구성될 수도 있다. 몇몇 양태에서, 비디오 인코더 (22) 및 비디오 디코더 (28) 는 SVC 를 위한 미세한 입도의 SNR 스케일러빌러티 (FGS) 코딩을 지원하도록 구성될 수도 있다. 인코더 (22) 및 디코더 (28) 는 기저층 및 하나 이상의 스케일러블 강화층의 인코딩, 송신 및 디코딩을 지원함으로써 다양한 스케일러빌러티의 정도를 지원할 수도 있다. 스케일러블 비디오 코딩에 있어서, 기저층은 비디오 데이터를 베이스라인 레벨의 품질로 반송한다. 하나 이상의 강화층은 추 가적인 데이터를 반송하여, 더 높은 공간적, 시간적 및/또는 SNR 레벨을 지원한다. 기저층은, 강화층의 송신보다 더 신뢰도 높은 방식으로 송신될 수도 있다. 예를 들어, 변조된 신호의 가장 신뢰도 높은 부분들이 기저층을 송신하는데 이용될 수도 있고, 그 변조된 신호의 덜 신뢰도 높은 부분들이 강화층을 송신하는데 이용될 수도 있다.
SVC 를 지원하기 위해, 비디오 인코더 (22) 는 기저층 인코더 (32) 및 하나 이상의 강화층 인코더 (34) 를 포함하여, 기저층 및 하나 이상의 강화층의 인코딩을 각각 수행할 수도 있다. 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록의 수에 기초하여 현재의 비디오 블록의 CBP VLC 를 위한 테이블 선택을 포함하는 본 출원의 기술은 SVC 에서 강화층의 비디오 블록의 코딩에 특히 유용할 수도 있다.
비디오 디코더 (28) 는, 기저층 및 강화층 모두와 연관된 비디오 블록들을 디코딩하고 그 디코딩된 비디오를 결합하여 비디오 시퀀스의 프레임을 복원하는 결합된 기저/강화 디코더를 포함할 수도 있다. 디스플레이 디바이스 (30) 는 그 디코딩된 비디오 시퀀스를 수신하고, 그 비디오 시퀀스를 사용자에 제공한다.
비디오 인코더 (22) 및 비디오 디코더 (28) 는, MPEG-2, MPEG-4, ITU-T H263, 또는 ITU-T H.264/MPEG-4, Part 10, 어드밴스드 비디오 코딩 (AVC) 과 같은 비디오 압축 표준에 따라 동작할 수도 있다. 도 1 에 도시되지는 않았지만, 몇몇 양태에서, 비디오 인코더 (22) 및 비디오 디코더 (28) 는 각각 오디오 인코더 및 디코더와 통합될 수도 있고, 적절한 MUX-DEMUX 유닛 또는 기타 하드웨어 및 소 프트웨어를 포함하여, 오디오 및 비디오 모두의 인코딩을 공통의 데이터 스트림 또는 별도의 데이터 스트림에서 조작할 수도 있다. 적용가능하다면, MUX-DEMUX 유닛은 ITU H.223 멀티플렉서 프로토콜, 또는 사용자 데이터그램 프로토콜 (UDP) 과 같은 기타 프로토콜에 부합할 수도 있다.
H.264/MPEG-4 (AVC) 표준은 JVT (Joint Video Team) 로 공지된 공동체 파트너쉽의 산물로서, ISO/IEC 동영상 전문가 그룹 (MPEG) 과 함께 ITU-T 비디오 코딩 전문가 그룹 (VCEG) 에 의해 공식화되었다. 몇몇 양태에서, 본 출원에 설명된 기술은, 일반적으로 H.264 표준에 부합하는 디바이스에 적용될 수도 있다. H.264 표준은, 2005년 3월, ITU-T Study Group 의 ITU-T 추천 H.264, Advanced video coding for generic audiovisual services 에 기재되어 있으며, 여기서는, H.264 표준 또는 H.264 규격, 또는 H.264/AVC 표준 또는 규격으로 지칭될 수도 있다.
JVT (Joint Video Team) 는 H.264/MPEG-4 AVC 로의 스케일러블 비디오 코딩 (SVC) 확장에 대해 작업을 계속하고 있다. 진화하는 SVC 확장의 규격은 JD (Joint Draft) 의 형태이다. JVT 에 의해 창안된 JSVM (Joint Scalable Video Model) 은 스케일러블 비디오에 이용되는 툴을 구현하며, 이 툴은 본 출원에서 설명하는 다양한 코딩 작업을 위해 시스템 (10) 내에서 이용될 수도 있다. 미세한 입도의 SNR 스케일러빌러티 (FGS) 코딩에 관련된 상세한 정보는 Joint Draft 문헌에서 발견할 수 있으며, 더 상세하게는, Joint Draft 6 (SVC JD6) 에서, Thomas Wiegand, Gary Sullivan, Julien Reichel, Heiko Schwarz, 및 Mathias Wien 의 "Joint Draft 6: Scalable Video Coding," JVT-S 201, 2006년 4월, 제네바, 및 Joint Draft 9 (SVC JD9) 에서, Thomas Wiegand, Gary Sullivan, Julien Reichel, Heiko Schwarz, 및 Mathias Wien 의, "Joint Draft 9 of SVC Amendment," JVT-V 201, 2007년 1월, 모로코 마라케슈에서 발견할 수 있다. 또한, 여기서 설명하는 기술의 일 구현의 추가적인 세부사항들은 모로코 마라케슈의 22 번째 미팅에서, 2007년 1월 13일 내지 19일에 Marta Karczewicz, Hyukjune Chung 및 Phoom Sagetong 에 의한 ISO/IEC MPEG 및 ITU-T VCEG 의 JVT 에 제출된 제안서 JVT- V092 에서 발견할 수도 있다.
몇몇 양태에서, 비디오 브로드캐스팅에 대해, 본 출원에 설명된 기술은, 기술 표준 TIA-1099 ("FLO 규격") 으로서 공표된 순방향 링크 전용 (FLO) 공중 인터페이스 규격, "Forward Link Only Air Interface Specification for Terrestrial Mobile Multimedia Multicast" 를 이용한 지상 이동 멀티미디어 멀티캐스트 (TM3) 시스템에서 실시간 비디오 서비스를 전송하기 위한 강화된 H.264 비디오 코딩에 적용될 수도 있다. 즉, 통신 채널 (15) 은 FLO 규격 등에 따른 무선 비디오 정보를 브로드캐스트하는데 이용된 무선 정보 채널을 포함할 수도 있다. FLO 규격은, FLO 공중 인터페이스에 적합한 비트스트림 신택스 및 시맨틱스, 그리고 디코딩 프로세스를 정의하는 프로세스를 디코딩하는 실시예를 포함한다. 대안적으로, 비디오는 DVB-H (digital video broadcast-handheld), ISDB-T (integrated services digital broadcast-terrestrial), 또는 DMB (digital media broadcast) 와 같은 다른 표준에 따라 브로드캐스트될 수도 있다. 따라서, 소스 디바이스 (12) 는 이동 무선 단말기, 비디오 스트리밍 서버 또는 비디오 브로드캐스트 서버일 수도 있다. 그러나, 본 출원에서 설명하는 기술은 임의의 특정 타입의 브로드캐스트, 멀티캐스트 또는 포인트-투-포인트 시스템에 한정되지 않는다. 브로드캐스트의 경우, 소스 디바이스 (12) 는, 각각 도 1 의 수신 디바이스 (16) 와 유사할 수도 있는 다수의 수신 디바이스에 다수의 채널의 비디오 데이터를 브로드캐스트할 수도 있다. 일예로, 수신 디바이스 (16) 는, 통상적으로 셀룰러 무선전화로 지칭되는 이동 핸드셋과 같은 무선 통신 디바이스를 포함할 수도 있다.
비디오 인코더 (22) 및 비디오 디코더 (28) 각각은, 하나 이상의 마이크로프로세서, 디지털 신호 프로세서 (DSP), 주문형 집적회로 (ASIC), 필드 프로그래머블 게이트 어레이 (FPGA), 이산 로직, 소프트웨어, 하드웨어, 펌웨어 또는 이들의 임의의 조합으로 구현될 수도 있다. 비디오 인코더 (22) 및 비디오 디코더 (28) 각각은, 하나 이상의 인코더 또는 디코더에 포함될 수도 있으며, 그 인코더 또는 디코더는, 각각의 무선 디바이스, 가입자 디바이스, 브로드캐스트 디바이스, 서버 등에서 결합된 인코더/디코더 (CODEC) 의 일부로서 통합될 수도 있다. 또한, 소스 디바이스 (12) 및 수신 디바이스 (16) 각각은, 적용가능하다면, 무선 통신을 지원하기에 충분한 무선 주파수 (RF) 무선 컴포넌트 및 안테나를 포함하여, 적절한 변조, 복조, 주파수 변환 및 필터링 컴포넌트, 및 인코딩된 비디오의 송신 및 수신을 위한 증폭기 컴포넌트를 포함할 수도 있다. 그러나, 용이한 설명을 위해, 이러한 컴포넌트는 도 1 에서 소스 디바이스 (12) 의 변조기/송신기 (24) 및 수신 디바이스 (16) 의 수신기/복조기 (26) 로 요약된다.
비디오 시퀀스는 일련의 비디오 프레임을 포함한다. 비디오 인코더 (22) 는 비디오 데이터를 인코딩하기 위해 개별적인 비디오 프레임 내의 픽셀의 블록에 대해 동작한다. 비디오 블록은 고정된 사이즈 또는 가변 사이즈를 가질 수도 있고, 특정한 코딩 표준에 따라 사이즈가 달라질 수도 있다. 각각의 비디오 프레임은 일련의 슬라이스를 포함한다. 각각의 슬라이스는, 서브-블록으로 배열될 수도 있는 일련의 매크로블록을 포함할 수도 있다. 일예로, ITU-T H.264 표준은, 루마 (luma) 컴포넌트에 대해서는 16×16, 8×8, 4×4, 및 크로마 (chroma) 컴포넌트에 대해서는 8×8 과 같은 다양한 블록 사이즈의 인트라 예측뿐만 아니라, 루마 컴포넌트 및 크로마 컴포넌트에 대한 대응하는 스케일링된 사이즈에 대해 16×16, 16×8, 8×16, 8×8, 8×4, 4×8 및 4×4 와 같은 다양한 블록 사이즈의 인터 예측을 지원한다.
더 작은 비디오 블록은 더 양호한 해상도를 제공할 수 있고, 더 높은 레벨의 상세함을 포함하는 비디오 프레임의 위치에 이용될 수도 있다. 일반적으로, 매크로블록 (MB) 및 다양한 서브-블록이 비디오 블록으로 고려될 수도 있다. 또한, 슬라이스가 MB 및/또는 서브-블록과 같은 일련의 비디오 블록으로 고려될 수도 있다. 각각의 슬라이스는 독립적으로 디코딩가능한 유닛일 수도 있다. 예측 이후, 8×8 잔여 블록 또는 4×4 잔여 블록에 대해 변환이 수행될 수도 있고, 인트라_16×16 예측 모드가 이용되면, 크로마 컴포넌트 또는 루마 컴포넌트에 대해 4×4 블록의 DC 계수에 추가적인 변환이 적용될 수도 있다.
인트라 또는 인터 기반 예측 코딩에 후속하여, 그 변환된 비트스트림에 추가 적인 코딩 기술이 적용될 수도 있다. 이 추가적인 코딩 기술은, (H.264/AVC 또는 이산 코사인 변환 DCT 에서 이용되는 4×4 또는 8×8 정수 변환과 같은) 변환 기술 및 가변 길이 코딩을 포함할 수도 있다. 더 상세하게는, 본 출원은 비디오 블록의 CBP 를 코딩하기 위한 기술을 제공하며, 이는 인코더 (22) 에서 수행되어 데이터를 인코딩할 수도 있고, 디코더 (26) 에서 수행되어 데이터를 디코딩할 수도 있다. 또한, CBP 는 비디오 블록 내의 계수들의 패턴, 예를 들어, 이산 코사인 변환된 계수 또는 정수 변환 계수의 패턴을 지칭한다. 상이한 CBP 를 코딩하기 위해, 발생할 가능성이 더 높은 계수의 패턴들이 더 짧은 코드로 코딩되고, 발생할 가능성이 덜 높은 계수의 패턴들이 더 긴 코드로 코딩되는 VLC 기술이 이용될 수 있다. 코딩된 비디오 블록은 헤더 내에 플래그 또는 다른 정보를 포함하여, CBP 가 그 코딩 방식에서 이용되고 있음을 나타낼 수도 있다.
본 출원의 기술에 따르면, 다수의 상이한 VLC 테이블이 소스 디바이스 (12) 및 수신 디바이스 (16) 에 저장된다. 인코딩 및 디코딩 프로세스 동안, VLC 테이블은 소정의 비디오 블록에 대해 CBP 의 코딩을 수행하도록 선택된다. 테이블은, 비디오 프레임 내의 공간적 리던던시 현상을 활용함으로써 코딩 효율성을 증진시키는 방식으로 선택될 수도 있다. 더 상세하게는, 본 출원의 기술에 따르면, 비디오 인코더 (22) 및 비디오 디코더 (28) 는, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수 (예를 들어, 넌-제로 DCT 계수) 를 포함하는 비디오 블록의 수에 기초하여 현재의 비디오 블록의 CBP VLC 를 위한 테이블 선택을 수행할 수도 있다. 인접하는 블록은 미리 코딩된 블록을 포함할 수도 있고, 넌-제로 변환 계수를 포함하는 인접하는 블록의 수는, 현재의 비디오 블록과 그 인접 블록 사이의 공간적 유사성의 가능성에 기인하여 현재의 비디오 블록의 CBP 코딩을 위한 양호한 테이블 선택 메트릭을 제공할 수도 있다.
일예로, 인코더 (22) 및 디코더 (28) 는, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록의 수에 기초하여 현재의 비디오 블록에 대한 테이블 인덱스의 값을 각각 계산하고, 그 테이블 인덱스에 기초하여 복수의 테이블로부터 VLC 테이블을 선택하는 가역 방법을 수행할 수도 있다. 비디오 인코더 (22) 는 그 선택된 VLC 테이블을 이용하여 현재의 비디오 블록의 CBP 를 인코딩하는 한편, 비디오 디코더 (28) 는 선택된 VLC 테이블을 이용하여 현재의 비디오 블록의 CBP 를 디코딩한다. 인코더 (22) 및 디코더 (28) 는 동일한 기준의 테이블 선택에 기초하기 때문에, 인코딩 프로세스에서 소정의 비디오 블록에 대해 선택된 동일한 테이블은 디코딩 프로세스에서 식별되고 선택되어, 그 인코더 및 디코더에 적용된 코딩 프로세스가 동기화 상태로 유지됨을 보장해야 한다.
도 2 는 스케일러블 비디오 비트스트림의 기저층 (17) 및 강화층 (18) 내의 비디오 프레임을 도시하는 도면이다. 전술한 바와 같이, 본 출원의 기술은 강화층의 비디오 블록의 코딩에 특히 유용할 수도 있다. 기저층 (17) 은, 공간적, 시간적 또는 SNR 스케일러빌러티의 제 1 레벨을 나타내는 인코딩된 비디오 데이터를 포함하는 비트스트림을 포함할 수도 있다. 강화층 (18) 은, 공간-시간-SNR 스케일러빌러티의 제 2 레벨을 나타내는 인코딩된 비디오 데이터를 포함하는 비트스트림을 포함할 수도 있다. 몇몇 경우, 강화층 비트스트림은 오직 기저층 과 함께만 디코딩가능하고, 독립적으로는 디코딩가능하지 않다. 강화층 (18) 은 기저층 (17) 에서의 디코딩된 비디오 데이터에 대한 레퍼런스를 포함한다. 이러한 레퍼런스는 변환 도메인 또는 픽셀 도메인에서 이용되어, 최종적으로 디코딩된 비디오 데이터를 생성할 수도 있다.
기저층 (17) 및 강화층 (18) 은 인트라 (I), 인터 (P) 및 양방향 (B) 프레임을 포함할 수도 있다. 강화층 (18) 의 P 프레임은 기저층 (17) 의 P 프레임에 대한 레퍼런스에 의존한다. 강화층 (18) 및 기저층 (17) 의 프레임들을 디코딩함으로써, 비디오 디코더는 디코딩된 비디오의 비디오 품질을 증가시킬 수 있다. 예를 들어, 기저층 (17) 은, 초당 15 프레임의 최소 프레임 레이트로 인코딩된 비디오를 포함할 수도 있는 반면, 강화층 (18) 은 초당 30 프레임의 더 높은 프레임 레이트로 인코딩된 비디오를 포함할 수도 있다. 상이한 품질 레벨에서의 인코딩을 지원하기 위해, 기저층 (17) 및 강화층 (18) 은 각각 더 높은 양자화 파라미터 (QP) 및 더 낮은 QP 로 각각 인코딩될 수도 있다. 또한, 기저층 (17) 은, 강화층 (18) 의 송신보다 더 신뢰할 수 있는 방식으로 송신될 수도 있다. 일예로, 변조된 신호의 가장 신뢰할 수 있는 부분이 기저층 (17) 을 송신하는데 이용될 수도 있는 반면, 변조된 신호의 덜 신뢰할 수 있는 부분이 강화층 (18) 을 송신하는데 이용될 수도 있다. 도 2 의 도면은 단지 예시적이며, 기저층 및 강화층은 다양한 다른 방식으로 정의될 수도 있다.
도 3 은, 본 출원에 부합하는, 데이터를 인코딩하는 VLC 유닛 (46) 을 포함하는 비디오 인코더 (50) 의 일예를 도시하는 블록도이다. 도 3 의 비디오 인 코더 (50) 는 도 1 의 소스 디바이스 (12) 의 강화층 인코더 (34) 에 대응할 수도 있다. 즉, 기저층 인코딩 컴포넌트는 단순화를 위해 도 3 에는 도시하지 않았다. 따라서, 비디오 인코더 (50) 는 강화층 인코더로 고려될 수도 있다. 몇몇 경우, 비디오 인코더 (50) 의 도시된 컴포넌트들은 또한 기저층 인코딩 모듈 또는 유닛들과 결합하여, 예를 들어, 기저층 및 강화층의 스케일러블 비디오 코딩을 지원하는 피라미드 인코더 설계로 구현될 수 있다.
비디오 인코더 (50) 는 비디오 프레임 내의 블록의 인트라 및 인터 코딩을 수행할 수도 있다. 인트라 코딩은 공간적 예측에 의존하여, 소정의 비디오 프레임 내의 비디오에서 공간적 리던던시를 감소 또는 제거한다. 인터 코딩은 시간적 예측에 의존하여, 비디오 시퀀스의 인접 프레임 내의 비디오에서 시간적 리던던시를 감소 또는 제거한다. 인터 코딩에 있어서, 비디오 인코더 (50) 는 모션 추정을 수행하여, 2 이상의 인접 프레임 사이에서 매칭하는 비디오 블록들의 움직임을 추적한다. 인트라 코딩에 있어서는, 코딩중인 블록에 근접하게 매칭하는 프레임 내의 다른 블록들을 식별하는데 공간적 예측이 이용된다. 인트라 코딩, 공간적 예측 컴포넌트는 도 3 에 도시하지 않았다.
도 3 에 도시된 바와 같이, 비디오 인코더 (50) 는 인코딩될 비디오 프레임 내의 현재의 비디오 블록 (31; 예를 들어, 강화층 비디오 블록) 을 수신한다. 도 3 의 예에서, 비디오 인코더 (50) 는 모션 추정 유닛 (33), 레퍼런스 프레임 저장부 (35), 모션 보상 유닛 (37), 블록 변환 유닛 (39), 양자화 유닛 (41), 역양자화 유닛 (42), 역변환 유닛 (44) 및 VLC 유닛 (46) 을 포함한다. 또한, 블록 경계를 필터링하기 위해 디블록킹 필터 (미도시) 가 포함되어 블록 부분을 제거할 수도 있다. 또한, 비디오 인코더 (50) 는 합산기 (48) 및 합산기 (51) 를 포함한다. 도 3 은 비디오 블록의 인터 코딩을 위한 비디오 인코더 (50) 의 시간적 예측 컴포넌트를 도시한다. 용이한 설명을 위해 도 3 에 도시하지 않았지만, 비디오 인코더 (50) 는 또한 몇몇 비디오 블록의 인트라 코딩을 위한 공간적 예측 컴포넌트를 포함할 수도 있다. 그러나, 공간적 예측 컴포넌트는 통상적으로 오직 기저층 코딩에만 이용된다.
모션 추정 유닛 (33) 은 비디오 블록 (31) 을 하나 이상의 인접한 비디오 프레임 내의 블록과 비교하여 하나 이상의 모션 벡터를 생성한다. 인접한 프레임 또는 프레임들은, 임의의 타입의 메모리 또는 데이터 저장 디바이스를 포함하여, 이전에 인코딩된 블록으로부터 복원된 비디오 블록을 저장할 수도 있는 레퍼런스 프레임 저장부 (35) 로부터 검색될 수도 있다. 모션 추정은, 예를 들어, 16×16, 16×8, 8×16, 8×8 또는 더 작은 블록 사이즈와 같은 가변 사이즈의 블록에 대해 수행될 수도 있다. 모션 추정 유닛 (33) 은, 예를 들어, 레이트 왜곡 모델에 기초하여, 현재의 비디오 블록 (31) 에 가장 근접하게 매칭하는 인접 프레임의 블록을 식별하고, 그 블록들 사이의 변위를 결정한다. 이를 기반으로, 모션 추정 유닛 (33) 은, 현재의 비디오 블록 (31) 과 그 현재의 비디오 블록 (31) 을 코딩하는데 이용된 예측 블록 사이의 변위의 크기 및 궤적을 나타내는 모션 벡터 (MV; 또는 양방향 예측의 경우 다수의 MV) 를 생성한다.
모션 벡터는 1/2 픽셀 정확도 또는 1/4 픽셀 정확도, 또는 더 세밀한 정확도 를 가질 수도 있어서, 비디오 인코더 (50) 가 정수 픽셀 위치보다 더 높은 정확도로 모션을 추적하게 하여 더 양호한 예측 블록을 획득할 수 있게 한다. 분수 픽셀값을 갖는 모션 벡터가 이용되는 경우, 모션 보상 유닛 (37) 에서 보간 연산이 수행된다. 모션 추정 유닛 (33) 은 레이트 왜곡 모델을 이용하여 비디오 블록에 대한 최상의 모션 벡터를 식별할 수도 있다. 결과로 얻어진 모션 벡터를 이용하여, 모션 보상 유닛 (37) 은 모션 보상에 의한 예측 비디오 블록을 형성한다.
비디오 인코더 (50) 는 합산기 (48) 에서, 원래의 현재의 비디오 블록 (31) 으로부터 모션 보상 유닛 (37) 에 의해 생성된 예측 비디오 블록을 감산함으로써 잔여 비디오 블록을 형성한다. 블록 변환 유닛 (39) 은 그 잔여 블록에 이산 코사인 변환 (DCT) 과 같은 변환을 적용하여 잔여 변환 블록 계수를 생성한다. 양자화 유닛 (41) 은 그 잔여 변환 블록 계수를 양자화하여 비트 레이트를 추가로 감소시킨다. 합산기 (49A) 는, 예를 들어, 기저층 인코더 (미도시) 로부터 기저층 계수 정보를 수신하며, 블록 변환 유닛 (39) 과 양자화 유닛 (41) 사이에 위치되어 그 기저층 계수 정보를 강화층 코딩부에 공급한다. 더 상세하게는, 합산기 (49A) 는 블록 변환 유닛 (39) 의 출력으로부터 기저층 계수 정보를 감산한다. 유사한 방식으로, 역변환 유닛 (44) 과 역양자화 유닛 (42) 사이에 위치된 합산기 (49B) 는 또한 기저층 인코더 (미도시) 로부터 기저층 계수 정보를 수신한다. 합산기 (49B) 는 기저층 계수 정보를 역양자화 유닛 (42) 의 출력에 재가산한다.
공간적 예측 코딩은 시간적 예측 코딩과 매우 유사하게 동작한다. 그러 나, 시간적 예측 코딩은 그 코딩을 수행하기 위해 인접한 프레임의 블록 (또는 다른 코딩된 단위들) 에 의존하는 반면, 공간적 예측은 그 코딩을 수행하기 위해 공통의 프레임 (다른 코딩된 단위들) 내의 블록에 의존한다. 공간적 예측 코딩은 인트라 블록을 코딩하는 반면, 시간적 예측 코딩은 인터 블록을 코딩한다. 또한, 공간적 예측 컴포넌트들은 단순화를 위해 도 3 에는 도시하지 않았다.
VLC 코딩 유닛 (46) 은 가변 길이 코딩 방법에 따라 양자화된 변환 계수들을 코딩하여, 송신된 정보의 비트 레이트를 추가로 감소시킨다. 더 상세하게는, VLC 코딩 유닛 (46) 은 본 출원의 기술을 적용하여 CBP 를 코딩한다. 이를 위해, VLC 코딩 유닛 (46) 은, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록의 수에 기초하여 현재의 비디오 블록의 테이블 인덱스의 값을 계산하고, 그 테이블 인덱스에 기초하여 복수의 테이블로부터 VLC 테이블을 선택한다. 그 후, VLC 코딩 유닛 (46) 은 그 선택된 VLC 테이블을 이용하여 현재의 비디오 블록의 CBP 를 인코딩한다. 그 선택된 VLC 테이블은 현재의 비디오 블록의 CBP 에 대한 코딩 효율성을 증진시킬 수도 있다. 테이블 선택을 용이하게 하기 위해 인접한 비디오 블록 (구체적으로, 넌-제로 계수들을 포함하는 인접한 비디오 블록) 을 이용하는 것은, 인접한 비디오 블록들 사이의 공간적 유사성의 높은 확률에 기인하여, 테이블 선택을 위한 편리한 메커니즘을 제공한다. 예를 들어, 인접하는 비디오 블록은, 현재의 비디오 블록의 코딩 이전에 미리 코딩된 블록일 수도 있다.
가변 길이 코딩에 후속하여, 인코딩된 비디오는 또 다른 디바이스로 송신될 수도 있다. 또한, 역양자화 유닛 (42) 및 역변환 유닛 (44) 은 역양자화 및 역변환을 각각 적용하여, 잔여 블록을 복원한다. 합산기 (51) 는 모션 보상 유닛 (37) 에 의해 생성된 모션 보상된 예측 블록에 그 복원된 잔여 블록을 가산하여, 레퍼런스 프레임 저장부 (35) 에 저장하기 위한 복원된 비디오 블록을 생성한다. 복원된 비디오 블록은 모션 추정 유닛 (33) 및 모션 보상 유닛 (37) 에 의해 이용되어, 후속하는 비디오 프레임의 블록을 인코딩한다.
도 4 는 도 1 의 비디오 디코더 (28) 또는 또 다른 디바이스의 디코더에 대응할 수도 있는 비디오 디코더 (60) 의 일예를 도시하는 블록도이다. 비디오 디코더 (60) 는, 강화층 비디오 블록에 대한 도 3 의 VLC 인코딩 유닛 (46) 의 역기능을 수행하는 VLC 디코딩 유닛 (52A) 을 포함한다. 즉, VLC 인코딩 유닛 (46) 과 유사하게, VLC 디코딩 유닛 (52A) 은, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록에 기초하여 현재의 비디오 블록에 대한 테이블 인덱스의 값을 계산하고, 그 테이블 인덱스에 기초하여 복수의 테이블로부터 VLC 테이블을 선택한다. 그 후, VLC 디코딩 유닛 (52A) 은, 인코딩 프로세스 동안 VLC 인코딩 유닛 (46) 에 의해 선택된 테이블과 동일할 수 있는 그 선택된 VLC 테이블을 이용하여 현재의 비디오 블록의 CBP 를 디코딩한다.
또한, 비디오 디코더 (60) 는 기저층 정보에 대한 또 다른 VLC 유닛 (52B) 을 포함할 수도 있다. 인트라 예측 유닛 (55) 은 기저층 비디오 블록의 임의의 공간적 디코딩을 선택적으로 수행할 수도 있고, 인트라 예측 유닛 (55) 의 출력은 합산기 (53) 에 제공될 수도 있다. 강화층 경로는 역양자화 유닛 (56A) 을 포함할 수도 있고, 기저층 경로는 역양자화 유닛 (56B) 을 포함할 수도 있다. 기저층 및 강화층 경로의 정보는 합산기 (57) 에 의해 결합될 수도 있다.
비디오 디코더 (60) 는 비디오 프레임 내의 블록의 인트라 및 인터 디코딩을 수행할 수도 있다. 도 4 의 예에서, 비디오 디코더 (60) 는, (전술한) VLC 유닛 (52A 및 52B), 모션 보상 유닛 (54), 역양자화 유닛 (56A 및 56B), 역변환 유닛 (58), 및 레퍼런스 프레임 저장부 (62) 를 포함한다. 또한, 비디오 디코더 (60) 는 합산기 (64) 를 포함한다. 선택적으로, 비디오 디코더 (60) 는 또한 합산기 (64) 의 출력을 필터링하는 디블록킹 필터 (미도시) 를 포함할 수도 있다. 또한, 합산기 (57) 는 기저층 및 강화층 경로의 정보를 결합하고, 인트라 예측 유닛 (55) 및 합산기 (53) 는 기저층 비디오 블록의 임의의 공간적 디코딩을 용이하게 한다.
또한, 강화층 비디오 블록에 있어서, VLC 디코딩 유닛 (52A) 은 인코딩된 비디오 비트스트림을 수신하고, 본 출원에서 설명한 바와 같이, CBP 에 대해 VLC 기술을 적용한다. 이것은, 양자화된 잔여 계수, 매크로블록 및 서브블록 코딩 모드, 및 모션 정보를 생성할 수도 있으며, 모션 정보는 모션 벡터 및 블록 파티션을 포함할 수도 있다. 더 상세하게는, VLC 디코딩 유닛 (52A) 은 적응형 VLC 테이블 선택 기술을 이용하며, 이 기술은, 넌-제로 변환 계수를 갖는 인접하는 비디오 블록의 수에 기초한다. 이 방식으로, 공간적 리던던시 현상은 CBP 의 VLC 에 대한 테이블을 선택하는데 이용될 수 있다.
VLC 유닛 (52A) 에 의해 수행된 디코딩에 후속하여, 모션 보상 유닛 (54) 은 레퍼런스 프레임 저장부 (62) 로부터의 하나 이상의 복원된 레퍼런스 프레임 및 모션 벡터를 수신한다. 역양자화 유닛 (56A) 은 양자화된 블록 계수를 역양자화, 즉, 탈양자화한다. 합산기 (57) 에 의한 강화층 및 기저층 정보의 결합에 후속하여, 역변환 유닛 (58) 은 그 계수에, 예를 들어, 역 DCT 와 같은 역변환을 적용하여 잔여 블록을 생성한다. 모션 보상 유닛 (54) 은, 합산기 (64) 에 의해 잔여 블록과 합산된 모션 보상된 블록을 생성하여 디코딩된 블록을 형성한다. 원한다면, 블록 부분을 제거하기 위해, 디블록킹 필터가 또한 적용되어 디코딩된 블록을 필터링할 수도 있다. 그 후, 필터링된 블록은, 모션 보상으로부터 레퍼런스 블록을 제공하고 또한 디코딩된 비디오를 생성하여 (도 1 의 디바이스 (30) 와 같은) 구동 디스플레이 디바이스에 제공하는 레퍼런스 프레임 저장부 (62) 에 저장된다.
도 5 는 도 3 의 VLC 인코딩 유닛 (46) 에 대응할 수도 있는 예시적인 VLC 인코딩 유닛 (70) 을 도시하는 블록도이다. VLC 인코딩 유닛 (70) 은 CBP VLC 인코딩 모듈 (72) 및 테이블 인덱스 계산 유닛 (74) 을 포함한다. CBP 테이블 (76) 은 일반적으로, 임의의 위치, 예를 들어, 별도의 메모리 위치에서 국부적으로 또는 오프-칩에 저장될 수도 있는 테이블을 지칭한다. CBP 테이블 (76) 은 원한다면 주기적으로 업데이트될 수도 있다.
CBP 는, 일 방식에 따라 코딩된 비디오 블록 내의 계수의 패턴을 지칭한다. 몇몇 패턴은, 비디오 블록에서 발생할 가능성이 다른 패턴보다 더 높을 수도 있다. 이 팩터에 기초하여, VLC 는, 계수의 패턴을 인식하고 그러한 패턴을 CBP 로서 코딩함으로써 데이터를 압축하는데 이용될 수도 있다. 블록 헤더 내의 정보는, CBP 가 코딩 방식에 이용된다는 사실을 식별할 수 있다.
공간적 리던던시 현상은 일반적으로, 공간적으로 근접한 비디오 블록이 높은 레벨의 상관성을 가질 것을 예측한다. 이 현상에 기초하여, 본 출원은 CBP 의 효율적인 VLC 에 대한 테이블 선택을 용이하게 하기 위해, 인접한 비디오 블록의 이용을 제안한다. 이것은, 모든 CBP 에 대한 고정된 매핑을 이용하거나 블록의 타입 (예를 들어, 인트라 블록 대 인터 블록) 에 기초한 테이블을 이용하는 종래의 기술에 비해 CBP 의 VLC 의 효율성을 개선할 수 있다.
VLC 인코딩 유닛 (70) 에서는, 복수의 CBP 테이블 (76) 이 저장된다. 그러나, 이 테이블은 대안적으로 별도의 (예를 들어, 오프칩) 위치에 저장될 수도 있다. 테이블 계산 유닛 (74) 은, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록의 수에 기초하여 현재의 비디오 블록에 대한 테이블 인덱스의 값을 계산한다. 그 후, CBP VLC 인코딩 모듈 (72) 은 그 테이블 인덱스에 기초하여 복수의 테이블 (76) 로부터 VLC 테이블을 선택한다. 적절한 테이블을 선택할 때, CBP VLC 인코딩 모듈 (72) 은 그 선택된 VLC 테이블을 이용하여 현재의 비디오 블록의 CBP 를 인코딩한다.
일예로, 현재의 비디오 블록은 16×16 매크로블록을 포함할 수도 있고, 그 인접하는 비디오 블록은 현재의 비디오 블록 좌측의 제 1 인접 매크로블록 및 현재의 비디오 블록 위의 제 2 인접 매크로블록과 연관된 8×8 루마 블록을 포함한다. 또한, 테이블 선택을 위해, 인접 루마 블록의 이용만으로 충분할 수도 있지만, 크로마 블록 (예를 들어, 16×16 매크로블록과 연관된 서브샘플링된 8×8 크로마 블록) 이 전술한 계산의 인접 블록으로서 이용될 수도 있다. 본 출원의 기술은 임의의 매우 다양한 비디오 블록 사이즈 및 코딩 포맷으로 구현될 수도 있기 때문에, 여기서 설명하는 인접 블록의 블록 사이즈 및 위치는 단지 예시적이다.
또 다른 예로서, 테이블 인덱스 계산 유닛 (74) 는 다음과 같이 테이블 인덱스를 계산할 수도 있다:
넌-제로 변환 계수의 정보가 제 1 인접 매크로블록 및 제 2 인접 매크로블록 모두에 존재하는 경우, N = (N(l)+N(u))/2+1;
넌-제로 변환 계수의 정보가 제 1 인접 매크로블록에는 존재하지만 제 2 인접 매크로블록에는 존재하지 않는 경우, N = N(l)+1; 및
넌-제로 변환 계수의 정보가 제 2 인접 매크로블록에는 존재하지만 제 1 인접 매크로블록에는 존재하지 않는 경우, N = N(u)+1. 이 예에서, N 은 테이블 인덱스를 나타내고, N(l) 은 현재 비디오 블록 좌측의 넌-제로 변환 계수를 포함하는 인접 루마 블록의 수를 나타내고, N(u) 는 현재 비디오 블록 위의 넌-제로 변환 계수를 포함하는 인접 루마 블록의 수를 나타낸다.
복수의 CBP 테이블은 다음과 같이 형성될 수도 있다.
테이블 1
Figure 112009048116205-pct00001
Figure 112009048116205-pct00002
복수의 CBP 테이블 (76) 각각은 테이블 1 의 테이블 인덱스 열 중 하나와 결합된 테이블 1 의 코드 번호 열을 포함할 수도 있다. 복수의 테이블은, 테이블 1 과 유사한 방식으로, 또는 또 다른 방식으로 개별적으로 저장될 수도 있다. 어느 경우이든, CBP VLC 인코딩 모듈 (72) 은 계산된 테이블 인덱스에 대응하는 테이블 1 의 열에 리스트된 CBP 값에 대해 코드 번호 열로부터 코드 번호를 선택함으 로써 CBP 를 인코딩할 수도 있다. 필요하다면, 또는 원한다면, CBP 테이블 (76) 에 대한 업데이트가 발생할 수도 있고, 테이블 내의 값은 매우 다양한 변량을 가진다. 전술한 테이블 1 은 이용될 수 있는 복수의 테이블의 단지 예시이다.
또한, 본 출원의 기술은 스케일러블 비디오 코딩 (SVC) 의 콘텍스트에서 하나 이상의 강화층을 코딩하는데 특히 유용할 수도 있다. 이 경우, 강화층을 코딩하는데 CBP 가 이용되고, 여기서 설명하는 기술에 따라 강화층에서 이러한 CBP 의 VLC 에 대한 테이블 선택이 수행된다. 이 코딩 기술은 인코더 및 디코더에서 수행된다. 종래에는, CBP 와 코드 번호 사이의 고정된 매핑이 이용되며, 이것은 변화하는 씬 특성에 적응시키는데 실패하여 비효율적일 수 있다. 또한, 설명한 기술은, 인트라 및 인터 코딩된 블록에 대해 상이한 테이블을 이용하는 기술보다 더 효율적일 수도 있다. 대부분의 경우, 3 이상의 테이블이 저장되고, 그 3 이상의 테이블 사이에서 테이블 선택이 행해진다. 테이블 1 의 예에서, 코드 번호 열 및 5 개의 상이한 테이블 인덱스 열에 의해 5 개의 상이한 VLC 테이블이 정의된다.
도 6 은 도 4 의 VLC 디코딩 유닛 (52) 에 대응할 수도 있는 예시적인 VLC 디코딩 유닛 (80) 을 도시하는 블록도이다. VLC 디코딩 유닛 (80) 은 VLC 인코딩 유닛 (70) 과 실질적으로 유사하지만, VLC 인코딩 유닛 (70) 에 의해 수행되는 인코딩에 대해 반대되는 디코딩 기능을 수행한다. 따라서, VLC 인코딩 유닛 (70) 은 양자화된 잔여 계수를 수신하여 비트스트림을 생성하지만, VLC 디코딩 유닛 (80) 은 비트스트림을 수신하여 양자화된 잔여 계수를 생성한다. VLC 디코딩 유닛은 CBP VLC 디코딩 모듈 (82) 및 테이블 인덱스 계산 유닛 (84) 을 포함한다. CBP 테이블 (86) 은, 임의의 위치, 예를 들어, 별도의 메모리 위치에서 국부적으로 또는 오프칩으로 저장될 수도 있다. CBP 테이블 (86) 은, 원한다면, 주기적으로 업데이트될 수도 있다.
VLC 인코딩 유닛 (70) 에서와 같이, VLC 디코딩 유닛 (80) 은 복수의 CBP 테이블 (86) 로의 액세스를 갖는다. 또한, 이 테이블은 국부적으로 저장될 수도 있고, 또는 대안적으로 별도의 (예를 들어, 오프칩) 위치에 저장될 수 있다. 테이블 계산 유닛 (84) 은, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 포함하는 비디오 블록의 수에 기초하여 현재의 비디오 블록에 대한 테이블 인덱스의 값을 계산한다. 블록 기반 비디오 코딩은 통상적으로 좌측에서 우측으로 그리고 위에서 아래로 순차적으로 발생하기 때문에, 인접하는 비디오 블록은 현재의 비디오 블록의 좌측 및 위에 위치된 블록을 포함할 수도 있다. CBP VLC 디코딩 모듈 (82) 은 그 테이블 인덱스에 기초하여 복수의 테이블 (86) 로부터 VLC 테이블을 선택한다. 적절한 테이블을 선택할 때, CBP VLC 디코딩 모듈 (82) 은 그 선택된 VLC 테이블을 이용하여 현재의 비디오 블록의 CBP 를 디코딩하여, 적절한 계수를 생성한다.
인코딩 프로세스에서와 유사하게, 디코딩 프로세스에서, 현재의 비디오 블록은 16×16 매크로블록을 포함할 수도 있고, 그 인접하는 비디오 블록은 현재의 비디오 블록 좌측의 제 1 인접 매크로블록 및 현재의 비디오 블록 위의 제 2 인접 매크로블록과 연관된 8×8 루마 블록을 포함한다. 또한, 테이블 선택을 위해, 인 접 루마 블록의 이용만으로 충분할 수도 있지만, 크로마 블록 (예를 들어, 16×16 매크로블록과 연관된 서브샘플링된 8×8 크로마 블록) 이 이용될 수도 있다. 또한, 본 출원의 기술은 임의의 매우 다양한 비디오 블록 사이즈 및 포맷으로 구현될 수도 있기 때문에, 여기서 리스트된 블록 사이즈는 단지 예시적이다.
테이블 인덱스 계산 유닛 (84) 은 다음과 같이 테이블 인덱스를 계산할 수도 있다:
넌-제로 변환 계수의 정보가 제 1 인접 매크로블록 및 제 2 인접 매크로블록 모두에 존재하는 경우, N = (N(l)+N(u))/2+1;
넌-제로 변환 계수의 정보가 제 1 인접 매크로블록에는 존재하지만 제 2 인접 매크로블록에는 존재하지 않는 경우, N = N(l)+1; 및
넌-제로 변환 계수의 정보가 제 2 인접 매크로블록에는 존재하지만 제 1 인접 매크로블록에는 존재하지 않는 경우, N = N(u)+1. 이 예에서, N 은 테이블 인덱스를 나타내고, N(l) 은 현재 비디오 블록 좌측의 넌-제로 변환 계수를 포함하는 인접 루마 블록의 수를 나타내고, N(u) 는 현재 비디오 블록 위의 넌-제로 변환 계수를 포함하는 인접 루마 블록의 수를 나타낸다.
인코딩의 예와 유사하게, 디코딩에 이용된 복수의 CBP 테이블 (86) 각각은 테이블 1 의 테이블 인덱스 열 중 하나와 결합된 테이블 1 의 코드 번호 열을 포함할 수도 있다. 복수의 테이블은 테이블 1 과 유사한 방식으로 또는 또 다른 방식으로 개별적으로 저장될 수도 있다. 어느 경우든, CBP VLC 디코딩 모듈 (82) 은, 그 계산된 테이블 인덱스에 대응하는 테이블 1 의 열에 리스트된 CBP 값에 대 한 코드 번호 열로부터 코드 번호를 선택함으로써 CBP 를 디코딩할 수도 있다. 필요하다면, CBP 테이블 (86) 에 대한 업데이트가 발생할 수도 있고, 그 테이블 내의 값은 매우 다양한 변량을 갖는다. 물론, 업데이트는 인코딩 디바이스 및 디코딩 디바이스 모두에 전달될 필요가 있을 것이다. 또한, 테이블 1 은 이용될 수 있는 복수의 테이블의 단지 예시이다.
도 7 은 본 출원에 부합하는 CBP 를 코딩하기 위한 VLC 기술을 도시하는 흐름도이다. 도 7 에 도시된 기술은 VLC 인코딩 유닛 (70) 또는 VLC 디코딩 유닛 (80) 에 의해 수행될 수도 있다. 도 7 에 도시된 바와 같이, 테이블 인덱스 계산 유닛 (74, 84) 은, 현재의 비디오 블록에 대해 인접하는, 넌-제로 변환 계수를 갖는 블록의 수에 기초하여 현재의 비디오 블록에 대한 테이블 인덱스의 값을 계산한다 (91). CBP VLC 코딩 모듈 (72, 82) 은 그 계산된 테이블 인덱스의 값에 기초하여 복수의 VLC 테이블 (76, 86) 로부터 VLC 테이블을 선택한다. 그 후, CBP VLC 코딩 모듈 (72, 82) 은 그 선택된 VLC 테이블에 기초하여 현재의 비디오 블록의 CBP 를 코딩한다. 모듈 (72) 은 인코딩을 수행하고, 모듈 (82) 은 그 역인 디코딩을 수행한다.
여기서 설명하는 기술은 하드웨어, 소프트웨어, 펌웨어 또는 이들의 임의의 조합으로 구현될 수도 있다. 모듈 또는 컴포넌트로 설명하는 임의의 특성들은 통합된 로직 디바이스에서 함께 구현될 수도 있고, 개별적이지만 함께 동작할 수 있는 로직 디바이스로서 개별적으로 구현될 수도 있다. 소프트웨어로 구현되면, 이 기술들은, 명령들을 포함하는 컴퓨터 판독가능 매체에 의해 적어도 부분적 으로 실현될 수도 있으며, 이 명령들은 실행될 때 전술한 방법들 중 하나 이상을 수행한다. 컴퓨터 판독가능 데이터 저장 매체는, 패키지 자료를 포함할 수도 있는 컴퓨터 프로그램 제품의 일부를 형성할 수도 있다. 컴퓨터 판독가능 매체는, SDRAM (synchronous dynamic random access memory) 과 같은 랜덤 액세스 메모리 (RAM), 판독 전용 메모리 (ROM), 비휘발성 랜덤 액세스 메모리 (NVRAM), EEPROM (electrically erasable programmable read-only memory), 플래시 메모리, 자기 또는 광학 데이터 저장 매체 등을 포함할 수도 있다. 이 기술은 또한, 또는 대안적으로, 명령들 또는 데이터 구조의 형태로 코드를 반송하거나 통신하고 컴퓨터에 의해 액세스되고, 판독되고/되거나 실행될 수 있는 컴퓨터 판독가능 통신 매체에 의해 적어도 부분적으로 실현될 수도 있다.
프로그램 코드는, 하나 이상의 디지털 신호 프로세서 (DSP), 범용 마이크로프로세서, 주문현 집적 회로 (ASIC), 필드 프로그래머블 로직 어레이 (FPGA), 또는 다른 등가의 집적 또는 이산 로직 회로와 같은 하나 이상의 프로세서에 의해 실행될 수도 있다. 따라서, 여기서 사용되는 용어 "프로세서" 는, 임의의 전술한 구조 또는 여기서 설명하는 기술의 구현에 적합한 임의의 다른 구조를 지칭할 수도 있다. 또한, 몇몇 양태에서, 여기서 설명하는 기능성은, 결합된 비디오 인코더-디코더 (CODEC) 에 통합되거나 인코딩 및 디코딩을 위해 구성된 전용 소프트웨어 모듈 또는 하드웨어 모듈 내에 제공될 수도 있다.
하드웨어로 구현되면, 본 출원은, 집적 회로, 칩셋 주문형 집적 회로 (ASIC), 필드 프로그래머블 게이트 어레이 (FPGA), 로직, 또는 여기서 설명하는 기 술 중 하나 이상을 수행하도록 구성되는 이들의 다양한 조합과 같은 회로를 의도할 수도 있다.
본 발명의 다양한 실시형태들을 설명하였다. 이 실시형태들 및 다른 실시형태들은 다음의 청구항의 범주에 속한다.

Claims (26)

  1. 코딩된 블록 패턴들에 대한 가변 길이 코딩 방법으로서,
    현재의 비디오 블록에 대해 인접하는 비디오 블록으로서, 넌-제로 변환 계수를 포함하는 상기 인접하는 비디오 블록의 수에 기초하여, 복수의 테이블로부터 상기 현재의 비디오 블록에 대한 가변 길이 코딩 (VLC) 테이블을 선택하는 단계; 및
    상기 선택된 VLC 테이블을 이용하여 상기 현재의 비디오 블록의 하나 이상의 코딩된 블록 패턴 (CBP) 을 코딩하는 단계를 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 방법.
  2. 제 1 항에 있어서,
    상기 하나 이상의 CBP 를 코딩하는 단계는 상기 CBP 를 인코딩하는 단계를 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 방법.
  3. 제 1 항에 있어서,
    상기 하나 이상의 CBP 를 코딩하는 단계는 상기 CBP 를 디코딩하는 단계를 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 방법.
  4. 제 1 항에 있어서,
    상기 가변 길이 코딩 (VLC) 테이블을 선택하는 단계는,
    상기 현재의 비디오 블록에 대해 인접하는 비디오 블록으로서, 넌-제로 변환 계수를 포함하는 상기 인접하는 비디오 블록의 수에 기초하여, 상기 현재의 비디오 블록에 대한 테이블 인덱스의 값을 계산하는 단계; 및
    상기 테이블 인덱스에 기초하여 상기 VLC 테이블을 선택하는 단계를 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 방법.
  5. 제 4 항에 있어서,
    상기 현재의 비디오 블록은 16×16 매크로블록을 포함하고, 상기 인접하는 비디오 블록은, 상기 현재의 비디오 블록 좌측의 제 1 인접 매크로블록 및 상기 현재의 비디오 블록 위의 제 2 인접 매크로블록과 연관된 8×8 루마 블록을 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 방법.
  6. 제 5 항에 있어서,
    상기 테이블 인덱스의 값은 하기와 같이 계산되고;
    넌-제로 변환 계수의 정보가 상기 제 1 인접 매크로블록 및 상기 제 2 인접 매크로블록 모두에 존재하는 경우, N = (N(l)+N(u))/2+1;
    넌-제로 변환 계수의 정보가 상기 제 1 인접 매크로블록에는 존재하지만 상기 제 2 인접 매크로블록에는 존재하지 않는 경우, N = N(l)+1; 및
    넌-제로 변환 계수의 정보가 상기 제 2 인접 매크로블록에는 존재하지만 상기 제 1 인접 매크로블록에는 존재하지 않는 경우, N = N(u)+1,
    N 은 테이블 인덱스의 값을 나타내고, N(l) 은 상기 현재의 비디오 블록 좌측의 넌-제로 변환 계수를 포함하는 인접 루마 블록의 수를 나타내고, N(u) 는 상기 현재의 비디오 블록 위의 넌-제로 변환 계수를 포함하는 인접 루마 블록의 수를 나타내는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 방법.
  7. 제 6 항에 있어서,
    상기 복수의 테이블은 하기의 테이블 1 로부터 형성된 테이블을 포함하고,
    [테이블 1]
    Figure 112011017597274-pct00003
    Figure 112011017597274-pct00004
    상기 복수의 테이블 각각은 테이블 1 의 테이블 인덱스 열 중 하나와 결합된 테이블 1 의 코드 번호 열을 포함하고, 상기 코딩된 블록 패턴을 코딩하는 단계는, 상기 계산된 테이블 인덱스에 대응하는 테이블 1 의 열에 리스트된 CBP 값에 대한 코드 번호 열로부터 코드 번호를 선택하는 단계를 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 방법.
  8. 제 1 항에 있어서,
    상기 현재의 비디오 블록은 16×16 매크로블록을 포함하고, 상기 인접하는 비디오 블록은, 상기 현재의 비디오 블록 좌측의 제 1 인접 매크로블록 및 상기 현재의 비디오 블록 위의 제 2 인접 매크로블록과 연관된 8×8 루마 블록 및 하나 이상의 8×8 크로마 블록을 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 방법.
  9. 제 1 항에 있어서,
    무선 통신 디바이스 (WCD) 에서 수행되는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 방법.
  10. 제 1 항에 있어서,
    상기 현재의 비디오 블록은 매크로블록을 포함하고, 상기 인접하는 비디오 블록은 이웃하는 매크로 블록들과 연관되며, 스케일러블 비디오 코딩 (SVC) 에서 강화층 (enhancement layer) 의 비디오 블록에 대해 수행되는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 방법.
  11. 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스로서,
    현재의 비디오 블록에 대해 인접하는 비디오 블록으로서, 넌-제로 변환 계수를 포함하는 상기 인접하는 비디오 블록의 수에 기초하여, 복수의 테이블로부터 상기 현재의 비디오 블록에 대한 가변 길이 코딩 (VLC) 테이블을 선택하고,
    상기 선택된 VLC 테이블을 이용하여 상기 현재의 비디오 블록의 하나 이상의 코딩된 블록 패턴 (CBP) 을 코딩하도록 구성되는
    VLC 유닛을 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  12. 제 11 항에 있어서,
    상기 VLC 유닛은 상기 하나 이상의 CBP 를 인코딩하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  13. 제 11 항에 있어서,
    상기 VLC 유닛은 상기 하나 이상의 CBP 를 디코딩하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  14. 제 11 항에 있어서,
    상기 VLC 유닛은,
    상기 현재의 비디오 블록에 대해 인접하는 비디오 블록으로서, 넌-제로 변환 계수를 포함하는 상기 인접하는 비디오 블록의 수에 기초하여, 상기 현재의 비디오 블록에 대한 테이블 인덱스의 값을 계산하고,
    상기 테이블 인덱스에 기초하여 상기 VLC 테이블을 선택하도록 구성되는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  15. 제 14 항에 있어서,
    상기 현재의 비디오 블록은 16×16 매크로블록을 포함하고, 상기 인접하는 비디오 블록은, 상기 현재의 비디오 블록 좌측의 제 1 인접 매크로블록 및 상기 현재의 비디오 블록 위의 제 2 인접 매크로블록과 연관된 8×8 루마 블록을 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  16. 제 15 항에 있어서,
    상기 VLC 유닛은 상기 테이블 인덱스를 하기와 같이 계산하고;
    넌-제로 변환 계수의 정보가 상기 제 1 인접 매크로블록 및 상기 제 2 인접 매크로블록 모두에 존재하는 경우, N = (N(l)+N(u))/2+1;
    넌-제로 변환 계수의 정보가 상기 제 1 인접 매크로블록에는 존재하지만 상기 제 2 인접 매크로블록에는 존재하지 않는 경우, N = N(l)+1; 및
    넌-제로 변환 계수의 정보가 상기 제 2 인접 매크로블록에는 존재하지만 상기 제 1 인접 매크로블록에는 존재하지 않는 경우, N = N(u)+1,
    N 은 테이블 인덱스를 나타내고, N(l) 은 상기 현재의 비디오 블록 좌측의 넌-제로 변환 계수를 포함하는 인접 루마 블록의 수를 나타내고, N(u) 는 상기 현재의 비디오 블록 위의 넌-제로 변환 계수를 포함하는 인접 루마 블록의 수를 나타내는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  17. 제 16 항에 있어서,
    상기 복수의 테이블은 하기의 테이블 1 로부터 형성된 테이블을 포함하고,
    [테이블 1]
    Figure 112011017597274-pct00005
    Figure 112011017597274-pct00006
    상기 복수의 테이블 각각은 테이블 1 의 테이블 인덱스 열 중 하나와 결합된 테이블 1 의 코드 번호 열을 포함하고, 상기 코딩된 블록 패턴을 코딩하는 것은, 상기 계산된 테이블 인덱스에 대응하는 테이블 1 의 열에 리스트된 CBP 값에 대한 코드 번호 열로부터 코드 번호를 선택하는 것을 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  18. 제 14 항에 있어서,
    상기 디바이스는, 상기 복수의 테이블을 저장하는 메모리를 포함하고,
    상기 VLC 유닛은,
    상기 테이블 인덱스의 값을 계산하는 테이블 인덱스 계산 유닛; 및
    상기 테이블 인덱스에 기초하여 상기 복수의 테이블로부터 상기 VLC 테이블을 선택하고, 상기 선택된 VLC 테이블을 이용하여 상기 현재의 비디오 블록의 CBP 를 코딩하는 모듈을 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  19. 제 18 항에 있어서,
    상기 메모리는 상기 디바이스의 VLC 유닛 내에 상주하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  20. 제 11 항에 있어서,
    상기 현재의 비디오 블록은 16×16 매크로블록을 포함하고, 상기 인접하는 비디오 블록은, 상기 현재의 비디오 블록 좌측의 제 1 인접 매크로블록 및 상기 현재의 비디오 블록 위의 제 2 인접 매크로블록과 연관된 8×8 루마 블록 및 하나 이상의 8×8 크로마 블록을 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  21. 제 11 항에 있어서,
    회로; 및
    무선 통신 디바이스 중 적어도 하나를 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  22. 제 11 항에 있어서,
    상기 현재의 비디오 블록은 매크로블록을 포함하고, 상기 인접하는 비디오 블록은 이웃하는 매크로 블록들과 연관되며, 상기 현재의 비디오 블록은 스케일러블 비디오 코딩 (SVC) 에서 강화층의 비디오 블록을 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  23. 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스로서,
    현재의 비디오 블록에 대해 인접하는 비디오 블록으로서, 넌-제로 변환 계수를 포함하는 상기 인접하는 비디오 블록의 수에 기초하여, 복수의 테이블로부터 상기 현재의 비디오 블록에 대한 가변 길이 코딩 (VLC) 테이블을 선택하는 수단; 및
    상기 선택된 VLC 테이블을 이용하여 상기 현재의 비디오 블록의 하나 이상의 코딩된 블록 패턴 (CBP) 을 코딩하는 수단을 포함하는, 코딩된 블록 패턴들에 대한 가변 길이 코딩 디바이스.
  24. 코딩된 블록 패턴들에 대해 가변 길이로 코딩하는 명령들을 포함하는, 컴퓨터 판독가능 매체로서,
    비디오 코딩 디바이스에서 실행될 때 상기 비디오 코딩 디바이스로 하여금,
    현재의 비디오 블록에 대해 인접하는 비디오 블록으로서, 넌-제로 변환 계수를 포함하는 상기 인접하는 비디오 블록의 수에 기초하여, 복수의 테이블로부터 상기 현재의 비디오 블록에 대한 가변 길이 코딩 (VLC) 테이블을 선택하게 하고;
    상기 선택된 VLC 테이블을 이용하여 상기 현재의 비디오 블록의 하나 이상의 코딩된 블록 패턴 (CBP) 을 코딩하게 하는
    코딩된 블록 패턴들에 대해 가변 길이로 코딩하는 명령들을 포함하는, 컴퓨터 판독가능 매체.
  25. 제 24 항에 있어서,
    상기 명령들은 상기 비디오 코딩 디바이스로 하여금,
    상기 현재의 비디오 블록에 대해 인접하는 비디오 블록으로서, 넌-제로 변환 계수를 포함하는 상기 인접하는 비디오 블록의 수에 기초하여, 상기 현재의 비디오 블록에 대한 테이블 인덱스의 값을 계산하게 하고;
    상기 테이블 인덱스에 기초하여 상기 VLC 테이블을 선택하게 하는, 코딩된 블록 패턴들에 대해 가변 길이로 코딩하는 명령들을 포함하는, 컴퓨터 판독가능 매체.
  26. 제 24 항에 있어서,
    상기 현재의 비디오 블록은 매크로블록을 포함하고, 상기 인접하는 비디오 블록은 이웃하는 매크로 블록들과 연관되며, 스케일러블 비디오 코딩 (SVC) 에서 강화층 (enhancement layer) 의 비디오 블록에 대해 수행되는, 코딩된 블록 패턴들에 대해 가변 길이로 코딩하는 명령들을 포함하는, 컴퓨터 판독가능 매체.
KR1020097016465A 2007-01-08 2008-01-07 코딩된 블록 패턴들에 대한 가변 길이 코딩 기술 KR101056001B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US88395107P 2007-01-08 2007-01-08
US60/883,951 2007-01-08
US11/958,675 2007-12-18
US11/958,675 US8335261B2 (en) 2007-01-08 2007-12-18 Variable length coding techniques for coded block patterns
PCT/US2008/050443 WO2008086316A2 (en) 2007-01-08 2008-01-07 Variable length coding techniques for coded block patterns

Publications (2)

Publication Number Publication Date
KR20090110328A KR20090110328A (ko) 2009-10-21
KR101056001B1 true KR101056001B1 (ko) 2011-08-11

Family

ID=39609343

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097016465A KR101056001B1 (ko) 2007-01-08 2008-01-07 코딩된 블록 패턴들에 대한 가변 길이 코딩 기술

Country Status (10)

Country Link
US (1) US8335261B2 (ko)
EP (1) EP2123055B1 (ko)
JP (1) JP5248523B2 (ko)
KR (1) KR101056001B1 (ko)
CN (1) CN101637024B (ko)
BR (1) BRPI0806491A2 (ko)
CA (1) CA2673884C (ko)
RU (1) RU2409004C1 (ko)
TW (1) TWI425837B (ko)
WO (1) WO2008086316A2 (ko)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009114557A1 (en) * 2008-03-10 2009-09-17 Vidyo, Inc. System and method for recovering the decoding order of layered media in packet-based communication
US8483285B2 (en) 2008-10-03 2013-07-09 Qualcomm Incorporated Video coding using transforms bigger than 4×4 and 8×8
US8619856B2 (en) 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8634456B2 (en) * 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8879637B2 (en) * 2008-10-06 2014-11-04 Lg Electronics Inc. Method and an apparatus for processing a video signal by which coding efficiency of a video signal can be raised by using a mixed prediction mode in predicting different macroblock sizes
JP5206960B2 (ja) * 2008-10-29 2013-06-12 株式会社メガチップス 画像圧縮装置
CN103888778B (zh) * 2009-06-18 2017-12-08 株式会社东芝 运动图像解码装置
SI3448031T1 (sl) * 2009-06-18 2021-03-31 Kabushiki Kaisha Toshiba Naprava za video dekodiranje in postopek za video dekodiranje
US9628794B2 (en) * 2009-06-18 2017-04-18 Kabushiki Kaisha Toshiba Video encoding apparatus and a video decoding apparatus
CN103826126B (zh) * 2009-06-18 2017-09-29 株式会社东芝 运动图像编码装置和运动图像编码方法
US20110249754A1 (en) * 2010-04-12 2011-10-13 Qualcomm Incorporated Variable length coding of coded block pattern (cbp) in video compression
US8942282B2 (en) * 2010-04-12 2015-01-27 Qualcomm Incorporated Variable length coding of coded block pattern (CBP) in video compression
US20110310976A1 (en) * 2010-06-17 2011-12-22 Qualcomm Incorporated Joint Coding of Partition Information in Video Coding
WO2012023061A1 (en) * 2010-07-06 2012-02-23 Nokia Corporation Method and apparatus for determining mapping between a syntax element and a code word for variable length coding
KR101583201B1 (ko) 2010-09-27 2016-01-07 엘지전자 주식회사 블록 분할 방법 및 복호화 장치
US9490839B2 (en) 2011-01-03 2016-11-08 Qualcomm Incorporated Variable length coding of video block coefficients
US10171813B2 (en) 2011-02-24 2019-01-01 Qualcomm Incorporated Hierarchy of motion prediction video blocks
WO2012120909A1 (ja) 2011-03-09 2012-09-13 パナソニック株式会社 動画像復号化装置および動画像復号化方法
WO2012120908A1 (ja) 2011-03-09 2012-09-13 パナソニック株式会社 動画像符号化装置および動画像符号化方法
US9516316B2 (en) 2011-06-29 2016-12-06 Qualcomm Incorporated VLC coefficient coding for large chroma block
US20130083856A1 (en) * 2011-06-29 2013-04-04 Qualcomm Incorporated Contexts for coefficient level coding in video compression
US9338456B2 (en) 2011-07-11 2016-05-10 Qualcomm Incorporated Coding syntax elements using VLC codewords
US9883203B2 (en) * 2011-11-18 2018-01-30 Qualcomm Incorporated Adaptive overlapped block motion compensation
DK3361734T3 (da) * 2012-07-02 2020-01-02 Samsung Electronics Co Ltd Entropikodning af en video og entropiafkodning af en video
KR102257542B1 (ko) 2012-10-01 2021-05-31 지이 비디오 컴프레션, 엘엘씨 향상 레이어에서 변환 계수 블록들의 서브블록-기반 코딩을 이용한 스케일러블 비디오 코딩
US10171810B2 (en) 2015-06-22 2019-01-01 Cisco Technology, Inc. Transform coefficient coding using level-mode and run-mode
US10003807B2 (en) 2015-06-22 2018-06-19 Cisco Technology, Inc. Block-based video coding using a mixture of square and rectangular blocks
US10009620B2 (en) 2015-06-22 2018-06-26 Cisco Technology, Inc. Combined coding of split information and other block-level parameters for video coding/decoding
WO2019105536A1 (en) * 2017-11-28 2019-06-06 Huawei Technologies Co., Ltd. Syntax prediction using reconstructed samples
CN112470503B (zh) * 2018-07-24 2022-12-16 中兴通讯股份有限公司 使资源分配静默的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010105629A (ko) * 2000-05-17 2001-11-29 윤종용 복수 매핑 테이블을 이용한 가변장 부호화 및 복호화방법과 그 장치
EP1478190A1 (en) * 2002-04-26 2004-11-17 NTT DoCoMo, Inc. Image encoding device, image decoding device, image encoding method, image decoding method, image encoding program, and image decoding program
US20050254583A1 (en) 1995-10-26 2005-11-17 Jae-Kyoon Kim Apparatus and method of encoding/decoding a coded block pattern

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5128758A (en) * 1989-06-02 1992-07-07 North American Philips Corporation Method and apparatus for digitally processing a high definition television augmentation signal
JP3278948B2 (ja) * 1993-02-05 2002-04-30 日本電信電話株式会社 可変長符号化方法
JP3829668B2 (ja) 2001-08-27 2006-10-04 松下電器産業株式会社 電子部品実装用装置における基板の下受け装置および基板の下受け方法
EP1470724B1 (en) 2002-01-22 2014-11-19 Nokia Corporation Coding transform coefficients in image/video encoders and/or decoders
GB2386275B (en) * 2002-03-05 2004-03-17 Motorola Inc Scalable video transmissions
JP2003324731A (ja) 2002-04-26 2003-11-14 Sony Corp 符号化装置、復号装置、画像処理装置、それらの方法およびプログラム
US6795584B2 (en) * 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
JP2004347454A (ja) * 2003-05-22 2004-12-09 Mitsubishi Rayon Co Ltd シェーディング補正方法
US7830963B2 (en) * 2003-07-18 2010-11-09 Microsoft Corporation Decoding jointly coded transform type and subblock pattern information
KR100674941B1 (ko) * 2005-01-13 2007-01-26 삼성전자주식회사 내용 적응 가변 길이 부호화 장치 및 방법
US7664176B2 (en) * 2004-07-09 2010-02-16 Nokia Corporation Method and system for entropy decoding for scalable video bit stream
JP2006033148A (ja) 2004-07-13 2006-02-02 Matsushita Electric Ind Co Ltd 隣接ブロックの情報を用いた可変長コードテーブル切り替え方法
JP2006232765A (ja) 2005-02-28 2006-09-07 Yakult Honsha Co Ltd 大腸炎予防治療剤
US9445128B2 (en) * 2006-12-08 2016-09-13 Freescale Semiconductor, Inc. System and method of determining deblocking control flag of scalable video system for indicating presentation of deblocking parameters for multiple layers

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050254583A1 (en) 1995-10-26 2005-11-17 Jae-Kyoon Kim Apparatus and method of encoding/decoding a coded block pattern
KR20010105629A (ko) * 2000-05-17 2001-11-29 윤종용 복수 매핑 테이블을 이용한 가변장 부호화 및 복호화방법과 그 장치
EP1478190A1 (en) * 2002-04-26 2004-11-17 NTT DoCoMo, Inc. Image encoding device, image decoding device, image encoding method, image decoding method, image encoding program, and image decoding program

Also Published As

Publication number Publication date
US8335261B2 (en) 2012-12-18
WO2008086316A2 (en) 2008-07-17
US20080165858A1 (en) 2008-07-10
JP2010531552A (ja) 2010-09-24
TW200838317A (en) 2008-09-16
CA2673884A1 (en) 2008-07-17
WO2008086316A3 (en) 2009-08-20
CA2673884C (en) 2013-07-02
TWI425837B (zh) 2014-02-01
EP2123055A2 (en) 2009-11-25
BRPI0806491A2 (pt) 2014-04-22
JP5248523B2 (ja) 2013-07-31
CN101637024B (zh) 2012-11-21
KR20090110328A (ko) 2009-10-21
EP2123055B1 (en) 2016-03-23
RU2409004C1 (ru) 2011-01-10
CN101637024A (zh) 2010-01-27

Similar Documents

Publication Publication Date Title
KR101056001B1 (ko) 코딩된 블록 패턴들에 대한 가변 길이 코딩 기술
KR101067308B1 (ko) 정제 계수 코딩을 위한 블록 형식 통계치에 기초한 가변 길이 코딩 테이블 선택
KR101247452B1 (ko) 정제 계수 코딩을 위한 비디오 블록 형식에 기초한 가변 길이 코딩 테이블 선택
KR101056000B1 (ko) 스케일러블 비디오 코딩을 위한 적응 업샘플링
CA2677973C (en) Combined run-length coding of refinement and significant coefficients in scalable video coding enhancement layers
KR101057600B1 (ko) 대응 변환 계수 값들의 이력에 기초한 정제 계수 코딩

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140730

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170629

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee