KR101057600B1

KR101057600B1 - 대응 변환 계수 값들의 이력에 기초한 정제 계수 코딩

Info

Publication number: KR101057600B1
Application number: KR1020097009670A
Authority: KR
Inventors: 마르타 카르체비츠
Original assignee: 퀄컴 인코포레이티드
Priority date: 2006-10-12
Filing date: 2007-10-11
Publication date: 2011-08-18
Also published as: CA2666055A1; CA2666055C; TW200830884A; EP2119239A2; WO2009054840A2; BRPI0719887A2; US20080089420A1; KR20090079936A; EP2568708A1; WO2009054840A3; US9319700B2; TWI477151B

Abstract

본 개시는 스케일러블 비디오 코딩 (SVC) 방식에서의 향상 계층의 정제 계수들을 코딩하는 기술들을 설명한다. 본 개시에 따르면 방법은, SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력을 평가하는 단계, 및 그 이력에 기초하여 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정하는 단계를 포함할 수도 있다. 인코딩 측에서, 코딩 프로세스는, 하나 이상의 정제 계수 값들에 대한 정보를 비트스트림으로부터 배제하는 단계, 및 이러한 정보가 비트스트림으로부터 배제된다는 것을 디코더에 시그널링하는 단계를 포함할 수도 있다. 디코딩 측에서, 코딩 프로세스는, 정보가 비트스트림으로부터 배제된다는 것을 디코더에 시그널링하는 정보를 식별하기 위해 비트스트림을 분석하는 단계, 및 SVC 방식의 하나 이상의 이전 계층들과 연관된 이력에 기초하여 이러한 정보를 생성하는 단계를 포함한다.

정제 계수 코딩, 변환 계수, 중요 계수, SVC, 비트스트림, 향상 계층

Description

대응 변환 계수 값들의 이력에 기초한 정제 계수 코딩{REFINEMENT COEFFICIENT CODING BASED ON HISTORY OF CORRESPONDING TRANSFORM COEFFICIENT VALUES}

본 출원은 다음의 미국 가출원의 이익을 주장하며, 그 각각의 전체 내용은 본원에 참조로 통합된다.

2006년 10월 12일 출원된 미국 가출원 제 60/829,274 호

2007년 1월 5일 출원된 미국 가출원 제 60/883,741 호

2006년 10월 12일 출원된 미국 가출원 제 60/829,276 호

기술 분야

본 개시는 디지털 비디오 코딩에 관한 것이며, 더욱 상세하게는, 스케일러블 비디오 코딩 (scalable video coding; SVC) 방식의 향상 계층 (enhancement layer) 들의 코딩에 관한 것이다.

배경

디지털 비디오 성능은, 디지털 텔레비젼, 디지털 다이렉트 브로드캐스트 시스템, 무선 통신 디바이스, 무선 브로드캐스트 시스템, PDA, 랩톱 컴퓨터 또는 데스크톱 컴퓨터, 디지털 카메라, 디지털 레코딩 디바이스, 비디오 게임 디바이스, 비디오 게임 콘솔, 셀룰러 라디오 전화기 또는 위성 라디오 전화기 등을 포함하여 넓은 범위의 디바이스들 내로 통합될 수 있다. 디지털 비디오 디바이스는, MPEG-2, MPEG-4, 또는 H.264/MPEG-4, Part 10, AVC (Advanced Video Coding) 와 같은 비디오 압축 기술을 구현하여 디지털 비디오를 더욱 효율적으로 송신 및 수신한다. 비디오 압축 기술은 비디오 시퀀스들에 내재된 리던던시 (redundancy) 를 감소 또는 제거하기 위해 공간 및 시간 예측을 수행한다.

비디오 코딩에서, 비디오 압축은 공간 예측, 모션 추정 (motion estimation) 및 모션 보상을 종종 포함한다. 인트라-코딩 (intra-coding) 은 주어진 비디오 프레임 내의 비디오 블록들 사이의 공간 리던던시를 감소 또는 제거하기 위해 공간 예측에 의존한다. 인터-코딩 (inter-coding) 은 비디오 시퀀스의 연속적인 비디오 프레임들의 비디오 블록들 사이의 시간 리던던시를 감소 또는 제거하기 위해 시간 예측에 의존한다. 인터-코딩에서, 비디오 인코더는 2 이상의 인접 프레임들 사이의 매칭 비디오 블록들의 움직임을 추적하기 위해 모션 추정을 수행한다. 모션 추정은, 하나 이상의 기준 프레임들 내에서 대응하는 예측 비디오 블록들에 관한 비디오 블록들의 변위를 나타내는 모션 벡터들을 생성한다. 모션 보상은 기준 프레임으로부터 예측 비디오 블록들을 생성하기 위해 모션 벡터들을 이용한다. 모션 보상 후에, 나머지 비디오 블록 (residual video block) 은 코딩될 원래의 비디오 블록으로부터 예측 비디오 블록을 뺌으로써 형성된다.

비디오 인코더는 나머지 블록의 통신과 연관된 비디오 레이트를 더 감소시키기 위해 변환, 양자화 및 변환 계수 코딩 프로세스들을 통상적으로 적용한다. 나머지 블록들의 변환 계수들의 코딩은 변환 및 양자화 연산들에 의해 생성된 나머지 계수들 (residual coefficients) 을 더 압축하기 위해, 예를 들어, 가변 길이 코딩 (variable length coding; VLC) 또는 다른 코딩 프로세스들을 수반할 수도 있다. 예를 들어, 상이한 셋트의 계수들을 가변 길이 코드워드 (codeword) 에 코딩 효율을 향상시키는 방식으로 매칭시키는데 VLC 테이블이 이용될 수도 있다. 상이한 비디오 콘텐츠에 대해 상이한 VLC 테이블들이 이용될 수도 있다. 다르게는, 나머지 계수들은 계수들의 패턴들, 예를 들어, 코딩된 블록 패턴들로서 코딩될 수도 있다. 어느 경우에도, 비디오 디코더는 계수들을 재구성하기 위해 역 (inverse) 연산들을 수행하고, 그 다음, 비디오 정보를 재구성하기 위해 계수들을 역 변환한다. 비디오 디코더는 비디오 블록들과 연관된 모션 정보 및 나머지 정보에 기초하여 비디오 정보를 디코딩할 수 있다.

몇몇 비디오 코딩은 스케일러블 기술들을 이용한다. 예를 들어, 스케일러블 비디오 코딩 (SVC) 은 베이스 계층과 하나 이상의 스케일러블 향상 계층들이 이용되는 비디오 코딩을 말한다. SVC 에서, 베이스 계층은 통상적으로 베이스 레벨의 품질로 비디오 데이터를 운반한다. 하나 이상의 향상 계층들은 더 높은 공간, 시간 및/또는 SNR 레벨을 지원하기 위해 추가적인 비디오 데이터를 운반한다. 베이스 계층은 향상 계층들의 송신보다 더 신뢰가능한 방식으로 송신될 수도 있다. 향상 계층들은 베이스 계층의 프레임들에 공간 해상도를 부가할 수도 있고, 또는, 전체 프레임 레이트를 증가시키기 위해 추가적인 프레임들을 부가할 수도 있다. 일예에서, 베이스 계층을 송신하기 위해 변조된 신호의 가장 신뢰가능한 부분들이 이용될 수도 있는 반면, 향상 계층들을 송신하기 위해 변조된 신호의 덜 신뢰가능한 부분들이 이용될 수도 있다. 향상 계층들은 중요 계수 (significant coefficient) 들 및 정제 계수 (refinement coefficient) 들로서 지칭되는 상이한 형식들의 변환 계수들을 정의할 수도 있다.

요약

일반적으로, 본 개시는 스케일러블 비디오 코딩 (SVC) 방식에서 향상 계층의 정제 계수들을 코딩하는 기술들을 설명한다. 정제 계수들이란 향상 계층의 계수들 중에서, SVC 방식의 이전 계층, 즉, 베이스 계층 또는 이전 향상 계층 중 어느 일방의 계층의 대응하는 계수들이 이 향상 계층의 계수들을 위해 넌-제로 (non-zero) 값들을 가졌었던 향상 계층의 계수들을 지칭한다. 반면, 중요 계수들이란 향상 계층의 계수들 중에서, SVC 방식의 이전 계층의 대응하는 계수들이 이 향상 계층의 계수들을 위해 제로의 값들을 가졌었던 향상 계층의 계수들을 지칭한다. 본 개시의 기술들은 정제 계수들이 중요 계수들과 함께 코딩되는 경우 역시 적용할 수 있지만, 정제 계수들의 코딩은 중요 계수들의 코딩과는 별개로 수행될 수도 있다. 본원에서 변환 계수라는 용어는 정제 계수들 및 중요 계수들 양자 모두를 지칭하기 위해 사용된다.

본 개시의 기술들에 따르면, 정제 계수 값들의 일부는 비디오 또는 멀티미디어 콘텐츠를 운반하기 위해 인코딩 디바이스로부터 디코딩 디바이스로 송신되는 비트스트림으로부터 배제될 수도 있다. 이러한 정제 계수들에 대한 값들은 이들 정제 계수들과 연관된 이력 (history) 에 기초하여 디코더에서 도출될 수 있다. 특히, 주어진 형식의 비디오 블록에서, 정제 계수들의 일부 값들은, 이들 정제 계수들과 연관된 이력, 즉, SVC 방식의 이전 계층들의 대응하는 변환 계수들의 이력 에 기초하여 제로가 되는 높은 확률을 가진다고 판정될 수 있다. 이 경우, 이들 정제 계수들에 대한 값들은, 이 값들이 디코더에서 도출될 수 있기 때문에, 비트스트림으로부터 배제될 수도 있다.

일 예에서, 본 개시는 SVC 방식에서의 향상 계층의 정제 계수들을 코딩하는 방법을 제공하며, 이 방법은, SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력을 평가하는 단계, 및 그 이력에 기초하여 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정하는 단계를 포함한다.

또 다른 예에서, 본 개시는 SVC 방식에서의 향상 계층의 정제 계수들을 코딩하는 디바이스를 제공하고, 본 디바이스는, SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력을 평가하는 이력 모듈, 및 그 이력에 기초하여 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정하는 코딩 모듈을 포함한다.

또 다른 예에서, 본 개시는 SVC 방식에서의 향상 계층의 정제 계수들을 코딩하는 디바이스를 제공하고, 본 디바이스는, SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력을 평가하는 수단, 및 그 이력에 기초하여 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정하는 코딩 수단을 포함한다.

본 개시에서 설명된 기술들은 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임의의 조합으로 구현될 수도 있다. 소프트웨어로 구현되는 경우, 그 소프트웨어는 마이크로프로세서, 주문형 집적 회로 (ASIC), 필드 프로그래머블 게이트 어레 이 (FPGA), 또는 디지털 신호 처리기 (DSP) 와 같은 하나 이상의 프로세서들에서 실행될 수도 있다. 본 기술들을 실행하는 소프트웨어는 초기에 컴퓨터-판독가능 매체에 저장되고, 프로세서로 로딩되어 실행된다.

따라서, 본 개시는 또한, 비디오 코딩 디바이스에서 실행 시에 그 비디오 코딩 디바이스로 하여금 SVC 방식에서의 향상 계층의 정제 계수들을 코딩하게 하는 명령들을 포함하는 컴퓨터-판독가능 매체를 고려하며, 이 명령들은 비디오 코딩 디바이스에서 실행 시에 그 비디오 코딩 디바이스로 하여금, SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력을 평가하고, 그 이력에 기초하여 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정하게끔 한다.

몇몇 경우들에서, 컴퓨터-판독가능 매체는 제조자들에게 판매될 수도 있고, 및/또는, 비디오 코딩 디바이스에서 사용될 수도 있는 컴퓨터 프로그램 제품의 일부를 형성할 수도 있다. 컴퓨터 프로그램 제품은 컴퓨터-판독가능 매체를 포함할 수도 있고, 몇몇 경우들에서, 패키징 재료를 또한 포함할 수도 있다.

또 다른 예에서, 본 개시는, SVC 방식에서의 향상 계층의 정제 계수들을 코딩하도록 구성된 회로를 지향할 수도 있고, 이 회로는, SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력을 평가하고, 그 이력에 기초하여 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정하도록 구성된다.

본 개시의 하나 이상의 양태들의 상세한 내용들은 첨부 도면 및 이하의 설명에서 전개된다. 본 개시에서 설명된 기술들의 다른 특징들, 목적들, 및 이점들은 상세한 설명 및 도면들로부터, 그리고 청구의 범위로부터 명백해질 것이다.

도면의 간단한 설명

도 1a 및 도 1b 는 스케일러블 비디오 코딩 (SVC) 방식의 상이한 계층들에서 대응하는 변환 계수들의 이력에 기초한 정제 계수에 대한 가능한 값들을 나타내는 맵핑 (mapping) 다이어그램들이다.

도 2 는 비디오 인코딩 및 디코딩 시스템을 나타내는 일 예시적인 블록도이다.

도 3 은 스케일러블 비디오 비트스트림의 베이스 계층 및 향상 계층의 비디오 프레임들을 나타내는 개념도이다.

도 4 는 본 개시와 일치하는 비디오 인코더의 일예를 나타내는 블록도이다.

도 5 는 본 개시와 일치하는 비디오 디코더의 일예를 나타내는 블록도이다.

도 6 은 본 개시와 일치하는 계수 인코드 유닛의 일 예시적인 블록도이다.

도 7 은 본 개시와 일치하는 계수 디코드 유닛의 일 예시적인 블록도이다.

도 8 은 본 개시와 일치하는, 정제 계수들을 코딩하는 코딩 기술을 나타내는 흐름도이다.

도 9 는 본 개시와 일치하는, 정제 계수 정보를 인코딩 및 송신하는 기술들을 나타내는 흐름도이다.

도 10 은 본 개시와 일치하는, 정제 계수 정보를 수신 및 디코딩하는 기술들을 나타내는 흐름도이다.

상세한 설명

본 개시는 스케일러블 비디오 코딩 (SVC) 방식에서 향상 계층들의 정제 계수 들을 코딩하는 기술들을 설명한다. 정제 계수들이란, SVC 방식에서 이전 계층의 대응하는 계수들이 넌-제로 값들을 가졌었던, 향상 계층의 변환 계수들을 지칭한다. 반면, 중요 계수들이란 SVC 방식에서 이전 계층의 대응하는 계수들이 제로의 값들을 가졌었던 향상 계층의 변환 계수들을 지칭한다. 본원에서 사용된 변환 계수라는 용어는 정제 계수 및 변화 계수 양자 모두를 지칭하는 것이고, 일반적으로 이산 코사인 변환 (DCT) 과 같은 변환 프로세스에 의해 생성된 계수들을 지칭한다. 정제 계수들의 코딩은 중요 계수들의 코딩과 별개로 수행될 수도 있다. 정제 계수 및 중요 계수의 코딩은 통상적으로 상이한 셋트들의 계수들이 VLC 테이블의 가변 길이 코드들에 맵핑되는 가변 길이 코딩 (VLC) 방법을 수반한다.

본 개시의 기술들에 따르면, 정제 계수 값들의 일부를 나타내는 정보는, 비디오 또는 멀티미디어 콘텐츠를 운반하기 위해 인코딩 디바이스로부터 디코딩 디바이스로 송신되는 비트스트림으로부터 배제될 수도 있다. 이러한 배제된 정제 계수들에 대한 값들은 대응하는 변환 계수들과 연관된 이력에 기초하여 디코더에서 도출될 수 있다. 특히, 주어진 형식의 비디오 블록에서, 정제 계수들의 값들의 일부는 대응하는 변환 계수들과 연관된 이력에 기초하여 제로가 되는 높은 확률을 가지는 것으로 판정될 수 있다. 이 경우, 이들 정제 계수들에 대한 값들을 나타내는 정보는 이 값들이 디코더에서 도출될 수 있기 때문에 비트스트림으로부터 배제될 수도 있다. 이력에 기초하여 제로가 되는 높은 확룰을 가진 것으로 판정될 수 있는 정제 계수들은 본원에서 형식-제로 계수들로서 지칭되는 반면, 다른 정제 계수들은 본원에서 형식-1 계수들로서 지칭된다.

인코딩 디바이스는 디코딩 디바이스로 하여금 이력에 기초하여 정제 계수들의 일부를 도출하도록 지시하는 신호를 인코딩할 수도 있다. 이 신호는 디코딩 디바이스로 하여금, 예를 들어, 인트라-코딩된 블록들과 같은 특정 형식의 매크로블록에 대해, 정제 계수들을 도출하도록 지시하는 프레임 또는 비디오 블록에 대한 단일-비트 또는 멀티-비트 헤더만큼 간단할 수도 있다. 인코더 및 디코더는, 정제 계수 정보가 인코더에 의해 비트스트림으로부터 배제될 수 있고 디코더에서 도출될 수 있는지 여부를 판정하기 위해 변환 계수들의 이력이 평가되는 상호 역의 (reciprocal) 코딩 방법들 (인코딩 및 디코딩) 을 수행할 수도 있다. 인코딩 디바이스는, 소정의 프레임 형식 또는 매크로블록 형식에 대해, 사용된 양자화로 인해, 소정의 기준을 충족하는 대다수의 정제 레벨들이 0 과 같을 것 (형식-0 정제 계수들) 이라는 것을 나타내는 정보를 디코딩 디바이스로 운반할 수도 있다. 부가적으로, 인코딩 디바이스는, 기준 영역 내의, 예를 들어, 블록 또는 매크로블록 내의 모든 형식-0 계수들 레벨들이 제로라는 것 또는 제로가 아니라는 것을 디코딩 디바이스로 시그널링할 수 있다. 몇몇 경우들에서, 모든 형식-0 계수들이 0 과 같다는 것이 가정될 수도 있다. 또한, 인코딩 디바이스는, 형식-0 계수와 형식-1 계수 간에 구별하는데 이용될 수도 있는 기준, 예를 들어, 계수들이 형식-0 계수들로 판정될 수 있는 이력 h 의 값들 (후술함) 을 디코딩 디바이스에 시그널링할 수도 있다.

도 1a 및 도 1b 는 스케일러블 비디오 코딩 (SVC) 방식의 상이한 계층들에서 대응하는 변환 계수들의 이력에 기초하여 정제 계수들에 대한 가능한 값들을 나타내는 맵핑 다이어그램이다. 도 1a 및 도 1b 는 베이스 계층 및 제 1, 제 2, 및 제 3 FGS 향상 계층들 (FGS 계층들로도 불린다) 의 가능한 변환 계수 값들을 보여준다. FGS 는 미세 입도 신호-대-잡음 스케일러빌러티 (Fine Granularity signal-to-noise Scalability) 를 의미하고, 이하에서 더 자세히 설명한다.

임의의 정제 계수의 이력은 이전 계층들의 (정제 계수 또는 중요 계수일 수도 있는) 이전 변환 계수들을 통해 역추적 (trace back) 될 수 있다. 도 1a 에서, 제 1, 제 2, 및 제 3 FGS 향상 계층들의 회색 음영 영역은 제로의 값들을 갖는 중요 계수들을 정의한다. 또한, 제 1, 제 2, 및 제 3 FGS 향상 계층들의 (도 1a 에서의) 회색 음영 영역의 양측 상의 각 쌍의 계수들은 모든 이전 계층들이 그 계수에 대해 제로의 값들을 정의했던 한 중요 계수들이다. 도 1a 의 모든 다른 비음영 영역들은, 적어도 하나의 이전 계층의 대응하는 계수가 그 계수에 대해 넌-제로 값을 정의했던 정제 계수들에 대응한다.

도 1a 및 도 1b 의 맵핑 다이어그램은 특정 데드-존 파라미터 (dead-zone parameter; f) 에 대응할 수도 있다. 소위 데드-존 파라미터는 통상적으로

f = Q/x

로서 정의되고, 여기서, Q 는 양자화 단계-크기 (quantization step-size) 를 나타내고, x 는 주어진 비디오 블록 형식에 대한 상수를 나타낸다. ITU H.264 에서, 인트라-코딩된 블록들에 대해 f = Q/3 이고, 인터-코딩된 블록들에 대해서는 f = Q/6 이다. 이러한 관찰에 기초하여, 상이한 맵핑 다이어그램들 (도 1a 및도 1b 의 것들과 같은) 이 인트라-코딩된 블록들 및 인터-코딩된 블록들에 대해 생성될 수 있다.

도 1a 및 도 1b 의 맵핑 다이어그램들은 f = Q/3 에 대응한다. 따라서, 본 예에서, H.264 에 적용되는 바와 같이, 도 1a 및 도 1b 의 맵핑 다이어그램들은 인트라-코딩된 블록들에 대응할 수도 있다. 이 경우, 인코더 디바이스가, 하나 이상의 정제 계수 값들이 코딩된 비트스트림으로부터 배제된다는 것을 나타내기 위해 신호를 코딩하는 경우, 디코더 디바이스는, 예를 들어, 도 1a 및 도 1b 에 나타낸 것과 같은 맵핑 다이어그램을 적용함으로써, 이력에 기초하여 이러한 값들을 도출할 수 있다.

데드-존 파라미터 (f = Q/3) 는 도 1a 에 나타내었지만, Q (양자화 단계 크기) 는 도 1a 의 Δ 로서 라벨링된다. 또한, 도 1a 에서 라벨링된 것은 몇몇 결정 임계치들의 위치들, 및 몇몇 재구성 값들 r_n 의 위치들이다. 각각의 정제 계수는 이전 계층에 관해 정의되고, -1, 0, 또는 1 의 값을 가질 수도 있다. 이는 또한 c₂ 의 가능한 값들로서 도 1a 에서 나타내어져 있다. 결정 임계치들 사이의 각각의 검은 색으로 채워진 삼각형은 주어진 변환 계수에 대해 가능한 값을 나타낸다. 하지만, 특히, 도 1a 및 도 1b 에서 나타낸 몇몇 경우들에서, 정제 계수에 대한 오직 하나의 가능한 (또는 있음직한) 값 (이전 이력이 주어짐) 은 제로의 값이다. 이 경우들에서, 본 개시는 인코더에서의 정제 계수의 코딩을 회피하고, 디코더에서의 정제 계수의 도출을 허용하기를 제안한다.

도 1b 는 몇몇 정제 계수들에 대한 몇몇 상이한 가능성들을 라벨링한다. 영역 104 에서, 제 2 FGS 계층에 관한 제 3 FGS 계층에 대한 3 개의 가능한 정제 계수 값들, 즉, -1, 0, 및 1 이 존재한다. 이 경우, 베이스 계층의 대응하는 변환 계수 값은 0 이었고, 제 1 FGS 계층에서의 대응하는 변환 계수 값은 1 이었으며, 제 2 FGS 계층에서의 대응하는 변환 계수 값은 0 이었다. 이러한 이력이 주어지면, 인코더 및 디코더는 제 2 FGS 계층에 관한 제 3 FGS 계층에 대한 3 개의 가능한 정제 계수 값들, 즉, -1, 0, 및 1 이 존재한다는 것을 알 수 있다.

영역 105 에서, 제 1 FGS 계층에 관한 제 2 FGS 계층에 대한 3 개의 가능한 정제 계수 값들, 즉, -1, 0, 및 1 이 또한 존재한다. 이 경우, 베이스 계층의 대응하는 변환 계수 값은 1 이었고, 제 1 FGS 계층에서의 대응하는 변환 계수 값은 0 이었다. 이러한 이력이 주어지면, 인코더 및 디코더는 제 1 FGS 계층에 관한 제 2 FGS 계층에 대한 3 개의 가능한 정제 계수 값들, 즉, -1, 0, 및 1 이 존재한다는 것을 알 수 있다.

영역 101, 102, 및 103 은 인코더 및 디코더가 (대응하는 변환 계수들의 이력에 기초하여) 정제 계수는 제로가 되는 높은 가능성을 가질 것이라는 것을 아는 시나리오들을 도시한다. 이는, (n-1) 번째 계층에 관한 n 번째 계층에 대해 오직 하나의 가능한 계수 값만이 존재하는 한, 영역 101, 102, 및 103 에서 보여질 수 있다.

영역 101 에서, 예를 들어, 제 1 FGS 계층에 관한 제 2 FGS 계층에 대한 하나의 가능한 정제 계수 값, 즉, 0 이 존재한다. 이 경우, 베이스 계층의 대응 하는 변환 계수 값은 -1 이었고, 제 1 FGS 계층의 대응하는 변환 계수 값은 -1 이었다. 이러한 이력이 주어지면, 인코더 및 디코더는 제 1 FGS 계층에 관한 제 2 FGS 계층에 대한 하나의 가능한 정제 계수 값, 즉, 0 이 존재한다는 것을 알 수 있다. 이 경우, 그 정제 계수가 실제로 제로가 되는 가능성은 매우 높고, 디코더에서 추정될 수도 있다.

영역 102 에서, 제 2 FGS 계층에 관한 제 3 FGS 계층에 대한 하나의 가능한 정제 계수 값, 즉, 0 이 존재한다. 이 경우, 베이스 계층의 대응하는 변환 계수 값은 -1 이었고, 제 1 FGS 계층의 대응하는 변환 계수 값은 0 이었으며, 제 2 FGS 계층의 대응하는 변환 계수 값은 -1 이었다. 이러한 이력이 주어지면, 인코더 및 디코더는 제 2 FGS 계층에 관한 제 3 FGS 계층에 대한 하나의 가능한 정제 계수 값, 즉, 0 이 존재한다는 것을 알 수 있다. 이 경우, 그 정제 계수가 실제로 제로가 되는 가능성은 매우 높고, 디코더에서 추정될 수도 있다.

영역 103 에서, 제 2 FGS 계층에 관한 제 3 FGS 계층에 대한 하나의 가능한 정제 계수 값, 즉, 0 이 존재한다. 이 경우, 베이스 계층의 대응하는 변환 계수 값은 -1 이었고, 제 1 FGS 계층의 대응하는 변환 계수 값은 0 이었으며, 제 2 FGS 계층의 대응하는 변환 계수 값은 1 이었다. 이러한 이력이 주어지면, 인코더 및 디코더는 제 2 FGS 계층에 관한 제 3 FGS 계층에 대한 하나의 가능한 정제 계수 값, 즉, 0 이 존재한다는 것을 알 수 있다. 이 경우, 그 정제 계수가 실제로 제로가 되는 가능성은 매우 높고, 디코더에서 추정될 수도 있다.

간단히 말해, 주어진 양자화 레벨 및/또는 데드 존 파라미터에 대해, 정제 계수에 대한 가능한 값은 많은 경우에 0 (또는 가능하게는 다른 값) 으로 제한될 수도 있다. 이들 경우에는 이전 계층들의 대응하는 변환 계수의 이력에 기초하여 결정될 수 있다. 더욱이, 인코딩에서 사용된 양자화 및/또는 데드 존 파라미터의 형식은 코딩되는 비디오 블록의 형식, 예를 들어, 인트라 (I) 또는 인터 (P 또는 B) 에 의해 정의될 수도 있다. 인코더는 인코딩된 비트스트림으로부터 이러한 정제 계수 값들을 배제할 수도 있고, 가능하게는, 이러한 정보가 하나 이상의 비디오 블록 형식들에 대해 배제된다는 것을 디코더에 시그널링할 수도 있다. 디코더는 주어진 정제 계수와 연관된 이력에 기초하여 배제된 정보, 예를 들어, 주어진 정제 계수와 연관된 대응하는 변환 계수들의 값들을 생성할 수 있다. 이러한 방식으로, 코딩 효율이 향상될 수 있다. 몇몇 경우들에서, 이력은 예를 들어 양자화 에러들로 인해 발생된 실제 정제 계수 값들을 반영하지 않을 수도 있고, 하지만, 이러한 경우들은 드물고, 임의의 심각한 양에 의해 비디오 품질을 열화시키지는 않아야 한다.

도 2 는 비디오 인코딩 및 디코딩 시스템 (10) 을 나타내는 블록도이다. 도 2 에 나타낸 바와 같이, 시스템 (10) 은 인코딩된 비디오를 통신 채널 (15) 을 통해 수신 디바이스 (6) 로 송신하는 소스 디바이스 (2) 를 포함한다. 소스 디바이스 (2) 는 비디오 소스 (11), 비디오 인코더 (12), 및 변조기/송신기 (14) 를 포함할 수도 있다. 수신 디바이스 (6) 는 수신기/복조기 (16), 비디오 디코더 (18), 및 디스플레이 디바이스 (20) 를 포함할 수도 있다. 시스템 (10) 은, 하나 이상의 정제 계수들의 값들이 송신된 비트스트림으로부터 배제되고, 이력에 기 초하여 수신 디바이스 (6) 에서 도출되는, 본원에서 설명된 변환 계수 코딩을 위한 기술들을 적용하도록 구성될 수도 있다.

스케일러블 비디오 코딩 (SVC) 은, 베이스 계층 및 하나 이상의 스케일러블 향상 계층들이 이용되는 비디오 코딩을 지칭한다. SVC 에서, 베이스 계층은 통상적으로 비디오 데이터를 베이스 레벨의 품질로 운반한다. 하나 이상의 향상 계층들은 더 높은 공간, 시간 및/또는 신호-대-잡음 SNR 레벨을 지원하기 위해 부가적인 비디오 데이터를 운반한다. 향상 계층들은 이전에 인코딩된 계층에 관해 정의될 수도 있다. 향상 계층들은 중요 계수들 및 정제 계수들로서 지칭되는, 2 이상의 상이한 형식들의 계수들을 정의한다. 정제 계수들은 이전에 인코딩된 계층의 대응하는 값들에 관한 값들을 정의할 수도 있다. 향상 계층들의 프레임들은 때로는, 베이스 계층 또는 이전 향상 계층의 비디오 블록들의 총 수 중 일부분만을, 예를 들어, 향상이 수행되는 그러한 블록들만을 포함할 수도 있다.

중요 계수들은 이전 계층들의 대응하는 계수들이 제로의 값들을 가졌었던 계수들을 지칭한다. 정제 계수들은 이전 계층의 대응하는 계수들이 넌-제로 값들을 가졌었던 계수들을 지칭한다. 변환 계수들의 코딩은, 상이한 셋트들의 계수들이 VLC 테이블의 가변 길이 코드들에 맵핑되는 가변 길이 코딩 (VLC) 방법을 통상적으로 수반한다. 향상 계층들의 가변 길이 코딩은 2-패스 접근법 (two-pass approach) 을 통상적으로 수반한다. 제 1 패스는 중요 계수들을 가변 길이 코딩하기 위해 수행되고, 또 다른 패스는 정제 계수들을 가변 길이 코딩하기 위해 수행된다. 본 개시의 기술들은 정제 계수들의 가변 길이 코딩을 위해 특히 유용 하다.

도 2 의 예에서, 통신 채널 (15) 은, 라디오 주파수 (RF) 스펙트럼 또는 하나 이상의 물리 송신 회선들, 또는 무선 및 유선 매체의 임의의 조합과 같은 임의의 무선 또는 유선 통신 매체를 포함할 수도 있다. 통신 채널 (15) 은 로컬 영역 네트워크, 광역 네트워크, 또는 인터넷과 같은 글로벌 네트워크와 같은 패킷-기반 네트워크의 일부를 형성할 수도 있다. 통신 채널 (15) 은 일반적으로 비디오 데이터를 소스 디바이스 (2) 로부터 수신 디바이스 (6) 로 송신하기 위한, 임의의 적합한 통신 매체, 또는 상이한 통신 매체의 집합을 나타낸다.

소스 디바이스 (2) 는 수신 디바이스 (6) 로의 송신을 위해 코딩된 비디오 데이터를 생성한다. 하지만, 몇몇 경우들에서, 디바이스들 (2, 6) 은 실질적으로 대칭 방식으로 동작할 수도 있다. 예를 들어, 디바이스들 (2, 6) 의 각각은 비디오 인코딩 및 디코딩 구성요소들을 포함할 수도 있다. 따라서, 시스템 (10) 은, 예를 들어, 비디오 스트리밍, 비디오 브로드캐스팅, 또는 비디오 전화통신을 위해, 비디오 디바이스들 (2, 6) 간의 일방향 또는 양방향 비디오 송신을 지원할 수도 있다.

소스 디바이스 (2) 의 비디오 소스 (11) 는 비디오 카메라와 같은 비디오 캡쳐 디바이스, 이전에 캡쳐된 비디오, 또는 비디오 콘텐츠 공급자로부터 공급된 비디오를 포함하는 비디오 아카이브를 포함할 수도 있다. 추가적인 대안으로서, 비디오 소스 (11) 는 컴퓨터 그래픽 기반 데이터를 소스 비디오, 또는 라이브 비디오 및 컴퓨터-생성된 비디오의 조합으로서 생성할 수도 있다. 몇몇 경우들에 서, 비디오 소스 (11) 가 비디오 카메라인 경우, 소스 디바이스 (2) 및 수신 디바이스 (6) 는 소위 카메라 전화기 또는 비디오 전화기를 형성할 수도 있다. 각각의 경우에서, 캡쳐된, 사전 캡쳐된, 또는 컴퓨터-생성된 비디오는 비디오 소스 디바이스 (2) 로부터 변조기/송신기 (14), 통신 채널 (15), 및 수신기/복조기 (16) 를 통해 비디오 수신 디바이스 (6) 의 비디오 디코더 (18) 로의 송신을 위해 비디오 인코더 (12) 에 의해 인코딩될 수도 있다. 비디오 인코딩 및 디코딩 프로세스들은 수신 디바이스 (6) 에서의 형식-0 계수들의 도출에 의존하여, 정제 계수들의 통신과 연관된 데이터의 양을 감소시키기 위해 본 개시의 기술들을 구현할 수도 있다. 디스플레이 디바이스 (20) 는 디코딩된 비디오 데이터를 사용자에게 디스플레이하고, 음극선 튜브, 액정 디스플레이 (LCD), 플라즈마 디스플레이, 유기 발광 다이오드 (OLED) 디스플레이, 또는 다른 형식의 디스플레이 디바이스와 같은 임의의 다양한 디스플레이 디바이스들을 포함할 수도 있다.

비디오 인코더 (12) 및 비디오 디코더 (18) 는 공간, 시간, 및/또는 신호-대-잡음 비 (SNR) 스케일러빌러티 (scalability) 를 위한 SVC 를 지원하도록 구성될 수도 있다. 몇몇 양태들에서, 비디오 인코더 (12) 및 비디오 디코더 (18) 는 SVC 를 위한 미세 입도 SNR 스케일러빌러티 (FGS) 코딩을 지원하도록 구성될 수도 있다. 인코더 (12) 및 디코더 (18) 는 베이스 계층 및 하나 이상의 스케일러블 향상 계층들의 인코딩, 송신, 및 디코딩을 지원함으로써 다양한 정도의 스케일러빌러티를 지원할 수도 있다. 또한, 스케일러블 비디오 코딩에서, 베이스 계층은 베이스라인 레벨의 품질로 비디오 데이터를 운반한다. 하나 이상의 향상 계층 들은 더 높은 공간, 시간, 및/또는 SNR 레벨들을 지원하기 위해 부가적인 데이터를 운반한다. 베이스 계층은 향상 계층들의 송신보다 더 신뢰가능한 방식으로 송신될 수도 있다. 예를 들어, 변조된 신호의 가장 신뢰가능한 부분들은 베이스 계층을 송신하는데 이용될 수도 있는 반면, 변조된 신호의 덜 신뢰가능한 부분들은 향상 계층들을 송신하기 위해 이용될 수도 있다.

SVC 를 지원하기 위해, 비디오 인코더 (12) 는 베이스 계층 및 하나 이상의 향상 계층들의 인코딩을 각각 수행하기 위해 베이스 계층 인코더 (22) 및 하나 이상의 향상 계층 인코더들 (24) 을 포함할 수도 있다. 정제 계수들의 코딩을 수반하는 본 개시의 기술들은 SVC 에서 강화 계층들의 비디오 블록들의 코딩에 적용가능하다. 더욱 구체적으로, 본 개시의 기술들은 향상 계층들의 비디오 블록들의 정제 계수들의 VLC 에 적용가능할 수도 있지만, 본 개시는 반드시 이 점에 한정될 필요는 없다. 본 개시에 따르면, 도출가능한 형식-0 계수들을 나타내는 정보는 비트스트림으로부터 배제되고, VLC 는 형식-1 계수들에 대해서만 적용된다. 형식-0 계수들의 값들은 디코더에서 생성된다.

비디오 디코더 (18) 는 베이스 계층 및 향상 계층 양자 모두와 연관된 비디오 블록들을 디코딩하고, 비디오 시퀀스의 프레임들을 재구성하기 위해 디코딩된 비디오를 결합하는 결합된 베이스/향상 디코더를 포함할 수도 있다. 디스플레이 디바이스 (20) 는 디코딩된 비디오 시퀀스를 수신하고, 비디오 시퀀스를 사용자에게 표시한다.

비디오 인코더 (12) 및 비디오 디코더 (18) 는 MPEG-2, MPEG-4, ITU-T H.263, 또는 ITU-T H.264/MPEG-4, Part 10, AVC 와 같은 비디오 압축 표준에 따라 동작할 수도 있다. 도 2 에서는 나타내지 않았지만, 몇몇 양태들에서, 비디오 인코더 (12) 및 비디오 디코더 (18) 는, 오디오 인코더 및 디코더와 각각 통합될 수도 있고, 오디오 및 비디오 양자 모두의 인코딩을 공통 데이터 스트림 또는 개별 데이터 스트림들에서 핸들링하기 위해 적절한 MUX-DEMUX 유닛들, 또는 다른 하드웨어 및 소프트웨어를 포함할 수도 있다.

H.264/MPEG-4 (AVC) 표준은 연합 비디오 팀 (Joint Video Team; JVT) 로서 알려진 집합적 파트너쉽의 제품으로서 ISO/IEC 동화상 전문가 그룹 (MPEG) 과 함께 ITU-T 비디오 코딩 전문가 그룹 (VCEG) 에 의해 공식화되었다. 몇몇 양태들에서, 본 개시에서 설명된 기술들은 H.264 표준에 일반적으로 따르는 디바이스들에 적용될 수도 있다. H.264 표준은 2005년 3월 ITU-T 스터디 그룹에 의한, 일반적 시청각적 서비스를 위한 AVC, ITU-T 추천 H.264 에 설명되어 있고, 이는 본원에서 H.264 표준 또는 H.264 사양, 또는 H.264/AVC 표준 또는 사양으로서 지칭될 수도 있다.

연합 비디오 팀 (JVT) 은 H.264/MPEG-4 AVC 로의 SVC 확장에 대한 작업을 계속하였다. 진전된 SVC 확장의 사양은 연합 드래프트 (Joint Draf; JD) 의 형태이다. JVT 에 의해 형성된 연합 스케일러블 비디오 모델 (JSVM) 은 스케일러블 비디오에서 사용하기 위한 툴들을 구현하고, 이는 본 개시에서 설명된 다양한 코딩 태스크들을 위해 시스템 (10) 내에서 사용될 수도 있다. 미세 입도 SNR 스케일러빌러티 (FGS) 코딩에 관한 자세한 정보는 연합 드래프트 문서, 특히, 연합 드래 프트 6 (SVC JD6) 에서 2006년 4월 Geneva, JVT-S 201 에서의 Thomas Wiegand, Gary Sullivan, Julien Reichel, Heiko Schwarz, 및 Mathias Wien 의 "Joint Draft 6: Scalable Video Coding", 및 연합 드래프트 9 (SVC JD9) 에서 2007년 1월 Morocco Marrakech, JVT-V 201 에서의 Thomas Wiegand, Gary Sullivan, Julien Reichel, Heiko Schwarz, 및 Mathias Wien 의 "Joint Draft 9 of SVC Amendment" 에서 발견될 수 있다.

몇몇 양태들에서, 비디오 브로드캐스팅에서, 본 개시에서 설명된 기술들은, 기술 표준 TIA-1099 로서 발행된 순방향 링크 온리 (FLO) 에어 인터페이스 사양 "Foward Link Only Air Interface Specification for Terrestrial Mobile Multimedia Multicast" ("FLO 사양") 을 이용하여 지상 모바일 멀티미디어 멀티캐스트 (TM3) 시스템에서 실시간 비디오 서비스를 전달하기 위한 향상된 H.264 비디오 코딩에 적용될 수도 있다. 즉, 통신 채널 (15) 은 FLO 사양 등에 따라 무선 비디오 정보를 브로드캐스트하기 위해 이용되는 무선 정보 채널을 포함할 수도 있다. FLO 사양은 FLO 에어 인터페이스에 적합한 비트스트림 신택스 (syntax) 및 시맨틱스 (semantics) 및 디코딩 프로세스들을 정의하는 예들을 포함한다. 다르게는, 비디오는 DVB-H (digital video broadcast-handheld), ISDB-T (integrated services digital broadcast-terrestrial), 또는 DMB (digital media broadcast) 와 같은 다른 표준들에 따라 브로드캐스트될 수도 있다. 따라서, 소스 디바이스 (2) 는 모바일 무선 단말기, 비디오 스트리밍 서버, 또는 비디오 브로드캐스트 서버일 수도 있다. 하지만, 본 개시에서 설명된 기술들은 임의의 특정 형식의 브로드캐스트, 멀티캐스트, 또는 포인트-대-포인트 시스템에 한정되는 것은 아니다. 브로드캐스트의 경우에서, 소스 디바이스 (2) 는 수개의 채널들의 비디오 데이터를 다수의 수신 디바이스들로 브로드캐스트할 수도 있고, 이 다수의 수신 디바이스들의 각각은 도 2 의 수신 디바이스 (6) 와 유사할 수도 있다.

비디오 인코더 (12) 및 비디오 디코더 (18) 각각은 하나 이상의 마이크로프로세서들, 디지털 신호 처리기 (DSP) 들, 주문형 집적 회로 (ASIC) 들, 필드 프로그래머블 게이트 어레이 (FPGA) 들, 이산 로직, 소프트웨어, 하드웨어, 펌웨어, 또는 이들의 임의의 조합들로서 구현될 수도 있다. 비디오 인코더 (12) 및 비디오 디코더 (18) 의 각각은 하나 이상의 인코더들 또는 디코더들 내에 포함될 수도 있고, 이 양자는 각각의 모바일 디바이스, 가입자 디바이스, 브로드캐스트 디바이스, 서버 등의 결합된 인코더/디코더 (CODEC) 의 일부로서 통합될 수도 있다. 또한, 소스 디바이스 (2) 및 수신 디바이스 (6) 각각은, 적용가능한 것으로서 무선 통신을 지원하기에 충분한 라디오 주파수 (RF) 무선 구성요소들 및 안테나들을 포함하여, 인코딩된 비디오의 송신 및 수신을 위한 적절한 변조, 복조, 주파수 변환, 필터링, 및 증폭 구성요소들을 포함할 수도 있다. 하지만, 도시의 편의를 위해, 이러한 구성요소들은 도 2 에서 소스 디바이스 (2) 의 변조기/송신기 (14) 및 수신 디바이스 (6) 의 수신기/복조기 (16) 로서 간략화되어 있다.

비디오 시퀀스는 일련의 비디오 프레임들을 포함한다. 비디오 인코더 (12) 는 비디오 데이터를 인코딩하기 위해 개별 비디오 프레임들 내의 픽셀들의 블록들 (또는 변환 계수들의 블록들) 에 대해 연산한다. 비디오 블록들은 고정된 또는 변화하는 크기들을 가질 수도 있고, 지정된 코딩 표준에 따라 크기면에서 상이할 수도 있다. 몇몇 경우들에서, 각각의 비디오 프레임은 코딩된 유닛이고, 한편, 다른 경우들에서, 각각의 비디오 프레임은 코딩된 유닛들을 형성하는 일련의 슬라이스들로 분할될 수도 있다. 각각의 슬라이스는 일련의 매크로블록들을 포함할 수도 있고, 이는 서브 블록들 내로 배열될 수도 있다. 일 예로서, ITU-T H.264 표준은 휘도 성분들에 대해 16×16, 8×8, 또는 4×4, 및 채도 성분들에 대해 8×8 과 같은 다양한 블록 크기들에서의 인트라 예측 (intra prediction) 을 지원하고, 휘도 성분들에 대해 16×16, 16×8, 8×16, 8×8, 8×4, 4×8, 및 4×4 및 채도 성분들에 대한 대응하는 스케일링된 크기들과 같은 다양한 블록 크기들에서의 인터 예측 (inter prediction) 을 지원할 수도 있다.

더 작은 비디오 블록들은 더 양호한 해상도를 제공할 수 있고, 더 높은 레벨들의 상세를 포함하는 비디오 프레임의 위치결정에 이용될 수도 있다. 일반적으로, 매크로블록 (MB) 들 및 다양한 서브-블록들이 비디오 블록들로 고려될 수도 있다. 또한, 슬라이스가 MB 들 및/또는 서브-블록들과 같은 일련의 비디오 블록들로서 고려될 수도 있다. 언급된 바와 같이, 각각의 슬라이스는 비디오 프레임의 독립적으로 디코딩가능한 유닛일 수도 있다.

인트라-기반 또는 인터-기반 예측 코딩에 이어, 부가적인 코딩 기술들이 송신된 비트스트림에 적용될 수도 있다. 이들 부가적인 코딩 기술들은 (H.264/AVC 또는 이산 코사인 변환 DCT 에서 이용되는 4×4, 또는 8×8 정수 변환과 같은) 변환 기술들, 및 (변환 계수들의 가변 길이 코딩과 같은) 변환 계수 코딩 을 포함할 수도 있다. 송신 계수들의 블록들은 비디오 블록들로서 지칭될 수도 있다. 다르게 표현하면, "비디오 블록" 이라는 용어는 정보의 도메인에 관계 없이 비디오 데이터의 블록을 지칭한다. 따라서, 비디오 블록들은 픽셀 도메인 또는 변환된 계수 도메인 내에 있을 수 있다.

본 개시는 정제 계수들의 코딩을 위한 기술들을 제공한다. 다시, 정제 계수들이란 SVC 방식의 이전 계층들에서 넌-제로 값들을 가졌었던 계수들을 지칭하는 반면, 중요 계수들이란 하나 이상의 이전 계층들에서 제로의 값들을 가졌었던 계수들을 지칭한다. 본 개시에 따르면, 정제 계수 값들의 일부를 나타내는 정보는 소스 디바이스 (2) 로부터 수신 디바이스 (6) 로 송신되는 비트스트림으로부터 배제될 수도 있다. 인코더 (12) 및 디코더 (18) 는 값들이 제로라고 가정될 수 있기 때문에 비트스트림으로부터 배제되는 형식-0 정제 계수들을 식별하기 위해 이력에 의존하는 상호 역의 방법들을 수행할 수도 있다. 본원에서 사용된 바와 같이, 코딩이라는 용어는 일반적으로 인코딩 프로세스 또는 디코딩 프로세스 중 어느 일방의 적어도 일부분을 지칭한다. 비디오 인코더 (12) 는 데이터를 인코딩하는 반면, 비디오 디코더 (18) 는 데이터를 디코딩한다.

형식-1 정제 계수들의 코딩은 코드워드들을 상이한 셋트들의 정제 계수들에 할당하기 위해 VLC 테이블들을 이용하는 VLC 방법에 기초할 수도 있다. 제로 값 계수들의 셋트들은 제로들의 실행 길이들 (run lengths of zeros) 에 의해 표현될 수도 있고, 테이블들은 더 가능성 있는 실행 길이들을 더 짧은 VLC 코드들에 할당할 수도 있다. 유사하게, VLC 테이블들은 더적은 가능성의 실행 길이들을 더 긴 VLC 코드들에 할당할 수도 있다. VLC 테이블들은, 오직 형식-1 정제 계수들만이 테이블들을 이용하여 코딩되고, 형식-0 계수들에 대한 정보는 비트스트림으로부터 배제된다는 사실을 더 잘 설명하기 위해 종래 테이블들에 대해 적응될 수도 있다. 또한, 형식-0 계수들의 값들은 디코더에서 도출된다.

VLC 테이블들의 형성은 이전의 코딩 통계에 기초할 수도 있지만, 대부분의 경우들에서, 적적 VLC 테이블들이 이용된다. 또한, 하지만, VLC 테이블들은 형식-0 계수들에 대한 정보가 비트스트림으로부터 배제되기 때문에 종래의 테이블들과는 상이할 수도 있다. 정적 VLC 테이블들의 경우에서, 인코더 (12) 및 디코더 (18) 는 정제 계수들을 코딩하기 위한 일 셋트의 가능한 테이블들로부터 하나 이상의 적절한 VLC 테이블들을 단순히 선택한다. VLC 테이블들이 형성되는지 아니면 정적인지에 관계 없이, VLC 테이블들에 대한 업데이트가 원하는 바와 같이 이루어질 수 있을 것이다.

도 3 은 스케일러블 비디오 비트스트림의 베이스 계층 (17) 및 향상 계층 (18) 내의 비디오 프레임들을 나타내는 도이다. 앞서 언급한 바와 같이, 본 개시의 기술들은 향상 계층들의 데이터의 코딩에 대해 적용가능하다. 베이스 계층 (17) 은 제 1 레벨의 공간, 시간, 또는 SNR 스케일러빌러티를 나타내는 인코딩된 비디오 데이터를 포함하는 비트스트림을 포함할 수도 있다. 향상 계층 (18) 은 제 2 레벨의 공간, 시간, 및/또는 SNR 스케일러빌러티를 나타내는 인코딩된 비디오 데이터를 포함하는 비트스트림을 포함할 수도 있다. 단일 향상 계층이 도시되었지만, 수개의 향상 계층들이 몇몇 경우들에서 이용될 수도 있다. 향상 계층 비트스트림은 오직 베이스 계층 (또는 다수의 향상 계층들이 존재하는 경우 이전 향상 계층) 과 함께 디코딩가능할 수도 있다. 향상 계층 (18) 은 베이스 계층 (17) 에서의 디코딩된 비디오 데이터에 대한 기준들을 포함한다. 이러한 기준들은 최종 디코딩된 비디오 데이터를 생성하기 위해 변환 도메인 또는 픽셀 도메인 중 어느 일방에서 이용될 수도 있다.

베이스 계층 (17) 및 향상 계층 (18) 은 인트라 (I), 인터 (P), 및 양-방향 (B) 프레임들을 포함할 수도 있다. 인트라 프레임들은 모든 인트라-코딩된 비디오 블록들을 포함할 수도 있다. I 및 P 프레임들은 적어도 일부 인터-코딩된 비디오 블록들 (인터 블록들) 을 포함할 수도 있지만, 일부 인트라-코딩된 블록들 (인트라 블록들) 을 또한 포함할 수도 있다. 향상 계층 (17) 의 상이한 프레임들은 베이스 계층 (17) 의 모든 비디오 블록들을 포함할 필요는 없다. 향상 계층 (18) 의 P 프레임들은 베이스 계층 (17) 의 P 프레임들에 대한 기준들에 의존한다. 향상 계층 (18) 및 베이스 계층 (17) 에서의 프레임들을 디코딩함으로써, 비디오 디코더는 디코딩된 비디오의 비디오 품질을 증가시킬 수 있다.

예를 들어, 베이스 계층 (17) 은 예를 들어, 초당 15 프레임의 최소 프레임 레이트로 인코딩된 비디오를 포함할 수도 있는 반면, 향상 계층 (18) 은 예를 들어, 초당 30 프레임의 더 높은 프레임 레이트로 인코딩된 비디오를 포함할 수도 있다. 상이한 품질 레벨들에서의 인코딩을 지원하기 위해, 베이스 계층 (17) 및 향상 계층 (18) 은 각각 더 높은 양자화 파라미터 (QP) 및 더 낮은 양자화 파라미터 (QP) 를 이용하여 인코딩될 수도 있다. 더욱이, 베이스 계층 (17) 은 향상 계층 (18) 의 송신보다 더 신뢰가능한 방식으로 송신될 수도 있다. 일 예로서, 변조된 신호의 가장 신뢰가능한 부분들이 베이스 계층 (17) 송신에 이용될 수도 있는 한편, 변조된 신호의 덜 신뢰가능한 부분들은 향상 계층 (18) 을 송신하는데 이용될 수도 있다. 도 3 의 도시는 단지 예시적인 것이며, 베이스 및 향상 계층들은 많은 다른 방식들로 정의될 수 있을 것이다.

도 4 는 본 개시와 일치하는, 데이터를 인코딩하기 위해 계수 인코드 유닛 (46) 을 포함하는 비디오 인코더 (50) 의 일예를 나타내는 블록도이다. 도 4 의 비디오 인코더 (50) 는 도 2 의 소스 디바이스 (2) 의 향상 계층 인코더 (24)에 대응할 수도 있다. 즉, 베이스 계층 인코딩 구성요소들은 간략함을 위해 도 4 에 나타내지 않았다. 따라서, 비디오 인코더 (50) 는 향상 계층 인코더로서 고려될 수도 있다. 다르게는, 비디오 인코더 (50) 의 도시된 구성요소들은 베이스 계층 인코딩 모듈들 또는 유닛들과 결합하여, 예를 들어, 베이스 계층 및 향상 계층의 스케일러블 비디오 코딩을 지원하는 피라미드 인코더 설계로 또한 구현될 수 있을 것이다.

비디오 인코더 (50) 는 비디오 프레임들 내의 블록들의 인트라-코딩 및 인터-코딩을 수행할 수도 있다. 인트라-코딩은 주어진 비디오 프레임 내의 비디오에서의 공간 리던던시를 감소 또는 제거하기 위해 공간 예측에 의존한다. 인터-코딩은 비디오 시퀀스의 인접 프레임들 내의 비디오에서의 시간 리던던시를 감소 또는 제거하기 위해 시간 예측에 의존한다. 인터-코딩을 위해, 비디오 인코더 (50) 는 2 이상의 인접 프레임들 간에 매칭 비디오 블록들의 움직임을 추적하기 위 해 모션 추정을 수행한다.

도 4 에서 나타낸 바와 같이, 비디오 인코더 (50) 는 인코딩될 비디오 프레임 내의 현재 비디오 블록 (31) (예를 들어, 향상 계층 비디오 블록) 을 수신한다. 도 4 의 예에서, 비디오 인코더 (50) 는 모션 추정 유닛 (33), 기준 프레임 저장부 (35), 모션 보상 유닛 (37), 블록 변환 유닛 (39), 양자화 유닛 (41), 역 양자화 유닛 (42), 역 변환 유닛 (44) 및 계수 인코드 유닛 (46) 을 포함한다. 디블록킹 필터 (deblocking filter; 미도시) 또한 블록킹 아티팩트 (blockiness artifacts) 를 제거하기 위해 필터 블록 경계들에 포함될 수도 있다. 비디오 인코더 (50) 는 합산기 (summer; 48) 및 합산기 (51) 를 또한 포함한다. 도 4 는 비디오 블록들의 인터-코딩을 위한 비디오 인코더 (50) 의 시간 예측 구성요소들을 나타낸다. 도시의 용이함을 위해 도 4 에는 나타내지 않았지만, 비디오 인코더 (50) 는 일부 비디오 블록들의 인트라-코딩을 위한 공간 예측 구성요소들을 또한 포함할 수도 있다. 하지만, 공간 예측 구성요소들은 통상적으로 베이스 계층 코딩에만 이용된다. 본 개시의 기술들은 인트라-코딩된, 또는 인터-코딩된 나머지 블록들의 변환 계수들에 대해 적용할 수 있다.

모션 추정 유닛 (33) 은 비디오 블록 (31) 을 하나 이상의 인접한 비디오 프레임들의 블록들과 비교하여 하나 이상의 모션 벡터들을 생성한다. 인접 프레임 또는 프레임들은, 이전에 인코딩된 블록들로부터 재구성된 비디오 블록들을 저장하기 위한 임의의 형식의 메모리 또는 데이터 저장 디바이스를 포함할 수도 있는 기준 프레임 저장부 (35) 로부터 검색될 수도 있다. 모션 추정은 가변 크기들, 예를 들어, 16×16, 16×8, 8×16, 8×8 또는 더 작은 블록 크기들의 블록들에 대해 수행될 수도 있다. 모션 추정 유닛 (33) 은, 예를 들어 레이트 왜곡 모델에 기초하여, 현재 비디오 블록 (31) 에 가장 근접 매칭되는 인접 프레임의 블록에서의 블록을 식별하고, 블록들 간의 변위를 결정한다. 이러한 기초에서, 모션 추정 유닛 (33) 은 현재 비디오 블록 (31) 을 코딩하기 위해 이용되는 예측 블록과 현재 비디오 블록 (31) 간의 변위의 크기 및 궤적을 나타내는 모션 벡터 (MV) (또는 양방향 예측의 경우에는 다수의 MV 들) 를 생성한다.

모션 벡터들은 1/2 픽셀 정밀도 또는 1/4 픽셀 정밀도, 또는 심지어 더 미세한 정밀도를 가져서, 비디오 인코더 (50) 가 정수 픽셀 위치결정들보다 더 높은 정밀도로 모션을 추적하고 더 양호한 예측 블록을 얻을 수 있도록 허용할 수도 있다. 분수 픽셀 값들을 이용한 모션 벡터들이 이용되는 경우, 보간 동작들이 모션 보상 유닛 (37) 에서 수행된다. 모션 추정 유닛 (33) 은 레이트-왜곡 모델을 이용하여 비디오 블록에 대한 최선의 모션 벡터를 식별할 수도 있다. 결과적인 모션 벡터를 이용하여, 모션 보상 유닛 (37) 은 모션 보상에 의해 예측 비디오 블록을 형성한다.

비디오 인코더 (50) 는 합산기 (48) 에서 원래의 현재 비디오 블록 (31) 으로부터, 모션 보상 유닛 (37) 에 의해 생성된 예측 비디오 블록을 뺌으로써 나머지 비디오 블록을 형성한다. 블록 변환 유닛 (39) 은 이산 코사인 변환 (DCT) 과 같은 변환을 나머지 블록에 적용하여, 나머지 변환 블록 계수들을 생성한다. 양자화 유닛 (41) 은 나머지 변환 블록 계수들을 양자화하여 비트 레이트를 더 감 소시킨다. 합산기 (49A) 는, 예를 들어, 베이스 계층 인코더 (미도시) 로부터, 베이스 계층 계수 정보를 수신하고, 이 베이스 계층 계수 정보를 향상 계층 코딩으로 제공하기 위해 블록 변환 유닛 (39) 과 양자화 유닛 (41) 사이에 위치된다. 특히, 합산기 (49A) 는 블록 변환 유닛 (39) 의 출력으로부터 베이스 계층 계수 정보를 뺀다. 유사한 방식으로, 역 변환 유닛 (44) 과 역 양자화 유닛 (42) 사이에 위치된 합산기 (49B) 는 베이스 계층 인코더 (미도시) 로부터 베이스 계층 계수 정보를 또한 수신한다. 합산기 (49B) 는 이 베이스 계층 계수 정보를 다시 역 양자화 유닛 (42) 의 출력에 부가한다.

공간 예측 코딩은 시간 예측 코딩과 매우 유사하게 동작한다. 하지만, 시간 예측 코딩은 코딩을 수행하기 위해 인접 프레임들 (또는 다른 코딩된 유닛들) 의 블록들에 의존하지만, 공간 예측은 코딩을 수행하기 위해 공통 프레임 (또는 다른 코딩된 유닛) 내의 블록들에 의존한다. 공간 예측 코딩은 인트라 블록들을 코딩하는 한편, 시간 예측 코딩은 인터 블록들을 코딩한다. 또한, 간략함을 위해 도 4 에는 공간 예측 구성요소들을 나타내지 않았다. 하지만, 본 개시의 기술들은 공간 예측 코딩 프로세스를 따르는 변환에 의해 생성된 변환 계수들에 대해 적용할 수 있다.

계수 인코드 유닛 (46) 은, 예를 들어, 가변 길이 코딩 방법에 딸, 양자화된 변환 계수들을 코딩하여 송신된 정보의 비트 레이트를 더욱 더 감소시킨다. 특히, 계수 인코드 유닛 (46) 은 향상 계층의 정제 계수들을 코딩하기 위해 본 개시의 기술들을 적용한다. 계수 인코드 유닛 (46) 은 정제 계수들과는 별개로 중요 계수들을 코딩할 수도 있지만, 본 개시는 이 점에 한정될 필요는 없다. 향상 계층의 정제 계수들과 관련하여, 계수 인코드 유닛 (46) 은 비트스트림으로 코딩되는 형식-1 계수들과, 비트스트림으로 코딩되는 않는 형식-0 계수들 간을 구별할 수도 있다.

계수 인코드 유닛 (46) 은, 형식-0 계수들을 나타내는 정보는 비트스트림으로부터 배제되고, 이러한 정보는 대응하는 변환 계수들과 연관된 이력에 기초하여 디코더에서 도출될 필요가 있다는 것을 디코더에게 표시하기 위한 대역 내 신호 또는 대역 외 신호를 생성할 수도 있다. 본원에 설명된 기술들은 중요 계수들이 정제 계수들과는 별개로 코딩되는 2-패스 접근법을 가정하지만, 본 기술은 중요 계수들이 정제 계수들과 함께 코딩되는 1-패스 접근법에도 또한 적용할 수 있을 것이다. 어느 경우에도, 본 개시에 따르면, 형식-0 정제 계수들을 나타내는 정보는 비트스트림으로부터 배제되고, 이전 계층들의 대응하는 변환 계수들의 이력에 기초하여 디코더에서 도출된다.

(중요 계수들, 형식-1 정제 계수들 및 형식-0 정제 계수들을 포함하는) 변환 계수들의 코딩에 이어, 인코딩된 비디오 (예를 들어, 가변 길이 코드워드들) 는 다른 디바이스로 송신될 수도 있다. 또한, 역 양자화 유닛 (42) 및 역 변환 유닛 (44) 은 나머지 블록을 재구성하기 위해 역 양자화 및 역 변환을 각각 적용한다. 합산기 (51) 는 그 재구성된 나머지 블록을 모션 보상 유닛 (37) 에 의해 생성된 모션 보상된 예측 블록에 부가하여, 기준 프레임 저장부 (35) 에 저장하기 위한 재구성된 비디오 블록을 생성한다. 재구성된 비디오 블록은 후속 비디오 프레임 의 블록을 인코딩하기 위해 모션 추정 유닛 (33) 및 모션 보상 유닛 (37) 에 의해 이용된다.

도 5 는, 베이스 계층 및 향상 계층 디코딩을 수행하는 도 1 의 비디오 디코더 (18) 에 대응할 수도 있는 비디오 디코더 (60) 의 일예를 나타내는 블록도이다. 비디오 디코더 (60) 는 도 4 의 계수 인코드 유닛 (46) 의 역 기능을 수행하는 계수 디코드 유닛 (52A) 을 포함한다. 즉, 계수 디코드 유닛 (52A) 은, 형식-0 계수들을 나타내는 정보는 비트스트림으로부터 배제된다는 것을 가정하는 방식으로 향상 계층의 정제 계수들을 코딩한다. 계수 디코드 유닛 (52A) 은, 비트스트림으로부터 배제되는 형식-0 정제 계수들과 연관된 값들을 생성하기 위해, 예를 들어, 코딩되는 현재 계층의 형식-0 정제 계수들에 대응하는, 대응하는 변환 계수들의 이력을 이용한다.

비디오 디코더 (60) 는 비디오 프레임들 내의 블록들의 인트라-디코딩 및 인터-디코딩을 수행할 수도 있다. 도 5 의 예에서, 비디오 디코더 (60) 는 계수 디코드 유닛들 (52A 및 52B), 모션 보상 유닛 (54), 역 양자화 유닛 (56), 역 변환 유닛 (58), 및 기준 프레임 저장부 (62) 를 포함한다. 비디오 디코더 (60) 는, 역 변환 유닛 (58) 및 모션 보상 유닛 (54) 의 출력들을 결합하는 합산기 (64) 를 또한 포함한다. 선택적으로, 비디오 디코더 (60) 는 합산기 (64) 의 출력을 필터링하는 디블록킹 필터 (미도시) 를 또한 포함할 수도 있다. 도 5 는 비디오 블록들의 인터-디코딩을 위한 비디오 디코더 (60) 의 시간 예측 구성요소들을 나타낸다. 비디오 디코더 (60) 는, 인트라 예측 유닛 (55) 에 의해 표현되는 몇몇 비디오 블록들의 인트라-디코딩을 위한 공간 예측 구성요소들을 또한 포함할 수도 있다.

비디오 디코더 (60) 는 베이스 계층 정보를 위한 또 다른 계수 디코드 유닛 (52B) 을 또한 포함할 수도 있다. 계수 디코드 유닛 (52B) 은 일반적으로 베이스 계층 계수들의 디코딩에 관해 종래의 방식으로 동작할 수도 있다. 인트라 예측 유닛 (55) 은 베이스 계층 비디오 블록들의 임의의 공간 디코딩을 선택적으로 수행할 수도 있고, 인트라 예측 유닛 (55) 의 출력은 가산기 (adder; 53) 에 제공될 수도 있다. 향상 계층 경로는 역 양자화 유닛 (56A) 을 포함할 수도 있고, 베이스 계층 경로는 역 양자화 유닛 (56B) 을 포함할 수도 있다. 베이스 계층 및 향상 계층 경로들의 정보는 가산기 (57) 에 의해 결합될 수도 있다.

비디오 디코더 (60) 는 비디오 프레임들 내의 블록들의 인트라-디코딩 및 인터-디코딩을 수행할 수도 있다. 도 5 의 예에서, 비디오 디코더 (60) 는 계수 디코드 유닛들 (52A 및 52B) (전술하였음), 모션 보상 유닛 (54), 역 양자화 유닛들 (56A 및 56B), 역 변환 유닛 (58), 및 기준 프레임 저장부 (62) 를 포함한다. 비디오 디코더 (60) 는 합산기 (64) 를 또한 포함한다. 선택적으로, 비디오 디코더 (60) 는 합산기 (64) 의 출력을 필터링하는 디블록킹 필터 (미도시) 를 또한 포함할 수도 있다. 또한, 합산기 (57) 는 베이스 계층 및 향상 계층 경로들의 정보를 결합하고, 인트라 예측 유닛 (55) 및 가산기 (53) 는 베이스 계층 비디오 블록들의 임의의 공간 디코딩을 용이하게 한다.

또한, 계수 디코드 유닛 (52A) 은 인코딩된 비디오 비트스트림을 수신하고, 본 개시에서 설명된 기술들을 적용한다. 특히, 중요 계수들에 대해, 계수 디코드 유닛 (52A) 은 VLC 테이블을 이용하여 정보를 디코딩할 수도 있다. 유사하게, 형식-1 정제 계수들에 대해, 계수 디코드 유닛 (52A) 은, 중요 계수들에 대해 이용되었던 것과는 상이한 VLC 테이블일 수도 있는 VLC 테이블을 이용하여 정보를 디코딩할 수도 있다. 하지만, 형식-0 정제 계수들에 대해, 계수 디코드 유닛 (52A) 은 SVC 방식의 이전 계층들의 대응하는 변환 계수들과 연관된 이력에 기초하여 적절한 값들을 생성할 수도 있다.

계수 디코드 유닛 (52A) 에 의해 수행된 디코딩에 이어, 모션 보상 유닛 (54) 은 기준 프레임 저장부 (62) 로부터의 하나 이상의 재구성된 기준 프레임들 및 모션 벡터들을 수신한다. 역 양자화 유닛 (56A) 은 양자화된 블록 계수들을 역 양자화, 즉, 양자화 해제한다. 가산기 (57) 에 의한 향상 및 베이스 계층 정보의 결합에 이어, 역 변환 유닛 (58) 은 계수들에 역 변환, 예를 들어, 역 DCT 를 적용하여 나머지 블록들을 생성한다. 모션 보상 유닛 (54) 은 모션 보상된 블록들을 생성하고, 이 모션 보상된 블록들은 합산기 (64) 에 의해 나머지 블록들과 합산되어, 디코딩된 블록들을 형성한다. 원한다면, 블록킹 아티팩트를 제거하기 위해 디코딩된 블록들을 필터링하기 위해 디블록킹 필터가 또한 적용될 수도 있다. 그 다음, 필터링된 블록들은 기준 프레임 저장부 (62) 에 위치되고, 이 기준 프레임 저장부 (62) 는 모션 보상으로부터 기준 블록들을 제공하고, 또한 (도 2 의 디바이스 (20) 와 같은) 드라이브 디스플레이 디바이스에 대해 디코딩된 비디오를 생성한다.

도 6 은 도 4 에서 나타낸 것에 대응할 수도 있는 일 예시적인 계수 인코드 유닛 (46) 을 나타내는 블록도이다. 계수 인코드 유닛 (46) 은 인코드 모듈 (72), 이력 모듈 (74), 테이블 선택 모듈 (76), 및 코딩 테이블들 (78) 을 포함한다. 코딩 테이블들 (78) 은 일반적으로 임의의 위치, 예를 들어, 국소적인 또는 오프-칩의 별개의 메모리 위치에 저장될 수도 있는 테이블들을 지칭한다. 원한다면, 코딩 테이블들 (78) 은 주기적으로 업데이트될 수도 있다.

인코드 모듈 (72) 은 별개의 코딩 패스들에서 정제 계수들 및 중요 계수들을 인코딩하지만, 본 개시의 기술들은 정제 계수들이 중요 계수들과 함께 코딩되는 경우에도 또한 적용될 수 있을 것이다. 인코드 모듈 (72) 에 의한 테이블 선택은 이전에 코딩된 프레임들의 이전에 코딩된 블록에 대해 수집된 정보 (예를 들어, 통계치들) 에 기초하여 수행될 수도 있다. 예를 들어, 인코드 모듈 (72) 은 테이블 선택을 용이하도록 하기 위해 이전에 인코딩된 프레임들의 통계적 분석을 수행할 수도 있다.

테이블들이 코딩 테이블들 (78) 로부터 어떻게 선택되는지와 무관하게, 인코드 모듈 (72) 은 인코딩된 비트스트림으로부터 형식-0 정제 계수들을 나타내는 정보를 배제하기 위해 본 개시의 기술들을 적용한다. 인코드 모듈 (72) 은 형식-0 정제 계수 값들에 대한 정보가 비트스트림으로부터 배제된다는 것을 디코더에 시그널링하기 위해, 프레임 헤더의 하나 이상의 비트들과 같은 정보를 코딩한다.

이력 모듈 (74) 은 정제 계수들이 형식-1 계수들인지 아니면 형식-0 계수들인지를 판정하기 위해 정제 계수들과 연관된 이력을 검사한다. 더욱 구체적으 로, 현제 FGS 계층을 코딩할 때, 이력 모듈 (74) 은 SVC 방식의 베이스 계층 및 이전 FGS 계층들의 대응하는 변환 계수들의 이력을 검사한다. 도 1a 및 도 1b 에서 나타낸 바와 같이, 그리고, 전술한 바와 같이, 일부 정제 계수들은 제로로 생각될 수 있는 값들을 가질 수도 있다. 이력 모듈 (74) 은 이러한 소위 형식-0 계수들을 식별하기 위해 이력을 검사한다. 그 다음, 인코드 모듈 (72) 은 비트스트림으로부터 형식-0 계수들의 값들을 나타내는 정보를 배제할 수 있다.

이력 분석을 완료하기 위한 대안적 코딩으로서, 이력 모듈 (72) 은 선행의 FGS 계층의 대응하는 계수들과 연관된 값들만 (예를 들어, 가장 최근의 이력만) 볼 수도 있을 것이다. 즉, SVC 방식의 n 번째 계층의 코딩에서, 이력 모듈 (74) 은, SVC 방식의 (n-1) 번째 계층과 연관된 정제 계수 값들이 넌-제로 값들을 가졌는지 여부를 판정함으로써 이력을 평가할 수도 있다. 이 경우, 인코드 모듈 (72) 은, (n-1) 번째 계층의 대응하는 계수들이 넌-제로 값들을 가졌었던 경우, n 번째 계층에 대해 정제 계수 값들은 제로라고 가정할 수도 있다.

또 다른 예에서, 이력 모듈 (74) 은 현재 계층의 정제 계수들에 대해 인덱스 값들을 할당함으로써 이력을 평가할 수도 있고, 이 인덱스 값들은 SVC 방식의 하나 이상의 이전 계층들과 연관된 대응하는 변환 계수 값들에 종속한다. 다른 말로, 인덱스 값 (h) 는 SVC 방식에서 이전 계층들의 대응하는 변환 계수 값들에 기초하여 할당될 수도 있다. 일예로서, 인덱스 값 (h) 은

h=0

for(i=0; i<n; i++){

sig=(c_i=0)? 1:0;

h=h+sig*(2<<i);

}

여기서, i 는 계층 번호이고 (즉, i=0 은 베이스 계층에 대응하고, i=1 은 제 1 베이스 계층에 대응한다), c_i 는 계층 i 에서의 나란히 놓은 계수의 값이며, i++ 는 i=i+1 을 의미하며, sig 는 중간 변수이다.

인코드 모듈 (72) 은 디코더에게 어떤 인덱스의 값들 (h) 에 대해 정제 계수들이 제로로 추정되는지를 시그널링할 수도 있다. 이 경우, SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정하는 것은, 하나 이상의 사전 정의된 인덱스 값들에 대응하는 인덱스 값들을 갖는 현재 계층의 정제 계수들에 제로의 값들을 할당하는 것을 포함할 수도 있다.

몇몇 경우들에서, 모든 형식-0 정제 계수들 값들이 그들의 양자화된 값이 제로와 상이한 경우에도 인코더 및 디코더 양자 모두에서 0 으로 설정된다. 넌제로 값들의 양이 매우 작을 것이기 때문에, 재구성된 품질에 대한 영향은, 형식-0 계수들에 대해 비트스트림으로부터 정보를 배제하기 위해 초래할 수 있는 비트레이트 절약에 의해 압도당할 수도 있을 것이다.

다르게는, 인코드 모듈 (72) 은 소정 영역 내의, 예를 들어, 블록 또는 매크로블록 내의 모든 형식-0 계수들 값들이 제로라는 것을 디코더에게 시그널링할 수도 있을 것이다. 모든 형식-0 값들이 (예를 들어, 양자화로 인해) 실제로 0 와 같지는 않은 경우에, 이들은 나머지 형식-1 정제 계수 값들과 함께 인코딩될 수도 있을 것이다. 모든 형식-0 정제 계수들 레벨들이 0 과 같은 매크로블록들에 대해 형식-1 정제 계수를 인코딩하는 방법은, 형식-0 정제 계수들의 일부가 넌제로인 매크로블록에서의 정제 계수들을 인코딩하는 것과는 상이하여야 할 것이다 (예를 들어, 상이한 VLC 가 이용된다). 전자의 경우에, 임의의 정제 계수들이 제로가 되는 확률은 후자의 경우보다 훨씬 더 작다.

또 다른 예에서, 이력 모듈 (74) 은, 예를 들어, 도 1a 및 도 1b 에서 나타낸 것과 같은 이력에 기초하여, 향상 계층의 정제 계수들의 제 1 서브셋트를 형식-0 정제 계수들로서 정의하고, 향상 계층의 정제 계수들의 제 2 서브셋트를 형식-1 정제 계수들로서 정의할 수도 있다. 인코드 모듈 (72) 은 인코딩된 비트스트림 내에 형식-1 정제 계수들에 대한 정보를 포함하고, 인코딩된 비트스트림 내에 형식-0 정제 계수들에 대한 정보를 배제할 수 있다. 그 다음, 인코드 모듈 (72) 은 형식-0 정제 계수들에 대한 정보가 배제되었다는 것을 디코더에게 시그널링할 수 있다.

본원에서 설명된 바와 같이, 정제 계수들은 -1, 0, 및 1 에 한정된 값들을 가질 수도 있다. 이러한 값들은 많은 방식들로 코딩될 수도 있다. 일예로서, 2 비트의 정보가 정제 계수들을 코딩하는데 이용된다. 제 1 비트는 계수가 0 과 같은지 아닌지 여부를 표시할 수도 있고, 제 2 비트는 정제 계수의 부호 (s_n 으로서 표시됨) 가 이전 계층의 대응하는 계수의 부호 (s_n _- ₁ 으로서 표시됨) 와 동 일한지 (coeff_ref_dir_flag=0) 아니면 상이한지 (coeff_ref_dir_flag=1) 를 나타낼 수도 있다. 이전 계층은 s_n _- ₁ 으로서 표시된다. 현재 계수의 부호가 이전 계층의 부호와 동일한 경우, coeff_ref_dir_flag=0 이고, 현재 계수의 부호가 이전 계층의 부호와 상이하면, coeff_ref_dir_flag=1 이다. 2 개의 정제 비트들은 다음의 표 1 에서와 같이 3 개의 정제 심볼들의 알파벳으로 결합될 수도 있다.

[표 1]

다르게는, 본 개시의 기술로부터 벗어남이 없이 또 다른 방식이 정제 계수들을 코딩하기 위해 또한 이용될 수 있을 것이다.

코딩 테이블들 (78) 은, 심볼들, 플래그들, 또는 다른 형식들의 비트들에 의해 정의될 수도 있는, 상이한 셋트들의 계수들로 맵핑되는 가변 길이 코드워드들을 포함할 수도 있다. 원한다면 코딩 테이블들 (78) 은 업데이트될 수도 있다. 코딩 테이블들 (78) 에는 임의의 수의 테이블들이 포함될 수도 있다. 몇몇 경우들에서, 2 개의 테이블들이 이용되지만, 더 많은 테이블들이 포함될 수도 있을 것이다. 코딩 방식에서 임의의 특정 시간에서 이용되는 코딩 테이블은, 예를 들어, 콘텐츠 또는 다른 인자들에 기초하여, 인코드 모듈 (72) 에 의해 선택될 수 도 있다.

표 2 는 정제 계수들을 코딩하는데 이용될 수 있는 VLC 테이블의 일예를 제공한다.

[표 2]

표 2 에서 나타낸 바와 같이, 상이한 셋트들의 정제 계수들 (표 1 에서 정의된 바와 같은) 은 상이한 가변 길이 코드워드들로 맵핑될 수도 있다. 표 2 는 또한 상이한 코드워드들과 연관된 각각의 비트 길이들을 리스트한다. 상이한 셋트들의 정제 계수들로의 코드워드 맵핑들은 상이한 VLC 테이블들에서 상이할 수도 있다. 따라서, 적절한 테이블을 선택함으로써, 코딩 효율이 달성될 수도 있다. 본 개시에 따르면, 정보가 코딩된 비트스트림으로부터 배제되는 형식-0 계수들을 주어진 프레임 또는 비디오 블록이 포함하는지 여부에 따라 상이한 코딩 테이블들이 이용될 수도 있다.

도 7 은, 도 5 에 나타낸 것에 대응할 수도 있는 일 예시적인 계수 디코드 유닛 (52A) 을 나타내는 블록도이다. 계수 디코드 유닛 (52A) 은 계수 인코드 유닛 (46) 에 의해 수행되는 인코딩에 대해 상호 역의 디코딩 기능들을 수행한다. 따라서, 계수 인코드 유닛 (46) 은 (변환 계수들에서 본원에서 언급된) 양자화된 나머지 계수들을 수신하고, 비트스트림을 생성하는 반면, 계수 디코드 유닛 (52A) 은 비트스트림을 수신하고 양자화된 나머지 계수들을 생성한다. 계수 디코드 유닛 (52A) 은 디코드 모듈 (82), 이력 모듈 (84), 및 일 셋트의 코딩 테이블들 (88) 을 포함한다. 유닛 (46) 에서와 같이, 유닛 (52A) 의 코딩 테이블들 (88) 은 일반적으로 임의의 위치, 예를 들어, 국소적인 또는 오프-칩의 별개의 메모리 위치에 저장될 수도 있는 테이블들을 지칭한다. 코딩 테이블들 (88) 은 VLC 테이블들을 포함할 수도 있고, 원한다면 주기적으로 업데이트될 수도 있다. 임의의 수의 테이블들이 코딩 테이블들 (88) 내에 포함될 수도 있다. 몇몇 경우들에서 2 개의 테이블들이 이용되지만, 더 많은 테이블들이 포함될 수도 있을 것이다.

계수 디코드 유닛 (82) 은 중요 계수들과 정제 계수들에 대해 별개의 디코딩 패스들을 수행할 수도 있다. 이 경우, 본 개시의 기술들은 코딩 또는 정제 계수들에만 적용될 수도 있다. 다르게는, 본 개시의 기술들은 중요 계수들과 정제 계수들 양자 모두를 함께 코딩 패스에서 코딩하는 코딩 방식에 적용될 수 있을 것이다. 어느 경우에도, 계수 디코드 유닛 (52A) 에 의해 수행되는 디코딩은 계수 인코드 유닛 (46) 에 의해 수행되는 인코딩에 대해 일반적으로 상호 가역적일 수도 있다.

특히, 계수 디코드 모듈 (82) 은, 일부 정제 계수들 값들 (예를 들어, 형식-0 계수들) 의 정보가 비트스트림으로부터 배제된다는 것을 아는 비트스트림을 디코딩할 수도 있다. 비트스트림은 이 사실을 계수 디코드 유닛 (82) 에 표시하는 신호를 포함할 수도 있다. 이 경우, 이력 모듈 (84) 은, (도 6 의) 이력 모듈 (74) 에 의해 수행되는 것과 일반적으로 상호 역의 이력 평가 기술을 수행할 수도 있다.

일반적으로, 계수 디코드 유닛 (52A) 은 SVC 방식의 향상 계층의 정제 계수들을 코딩한다. 이력 모듈 (84) 은 SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력을 평가하고, 디코드 모듈 (82) 은 그 이력에 기초하여 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정한다. 송신 된 비트스트림에 포함된 다른 계수들은 코딩 테이블들 (88) 을 이용하여 디코딩된다. 특히, 디코드 모듈 (82) 은, 비트스트림 내의 코드워드들을 디코딩하여 코딩된 계수들을 생성하기 위해 하나 이상의 코딩 테이블들 (88) 내로의 테이블 검색을 수행한다.

이력 모듈 (84) 은 향상 계층의 정제 계수들의 제 1 서브셋트를 형식-0 정제 계수들로서 정의하고, 향상 계층의 정제 계수들의 제 2 서브셋트를 형식-1 정제 계수들로서 정의할 수도 있다. 그 다음, 디코드 모듈 (82) 은 인코딩된 비트스트림으로부터 형식-1 정제 계수들에 대한 정보를 디코딩하고, 형식-0 정제 계수들에 대한 정보를 생성한다. 또한, 형식-0 정제 계수들에 대한 정보는 인코딩된 비트스트림으로부터 배제된다.

상기 표 2 는 또한 코딩 테이블들 (88) 중 하나로서 보여질 수 있다. 하지만, 코딩 테이블들 (78) (도 6) 은 계수들의 셋트들을 가변 길이 코드워드들로 맵핑하고, 코딩 테이블들 (88) (도 7) 은 가변 길이 코드워드들을 다시 계수들의 셋트들로 맵핑한다. 이러한 방식으로, 계수 디코드 유닛 (52A) 에 의해 수행되는 디코딩은 계수 인코드 유닛 (46) 에 의해 수행되는 인코딩에 대해 상호 가역적인 것으로서 보여질 수 있다.

도 8 은 본 개시와 일치하는, SVC 방식의 향상 계층의 정제 계수들에 대한 코딩 기술을 나타내는 흐름도이다. 도 8 의 코딩 프로세스는 인코딩 및 디코딩 양자 모두에 적용된다. 도 8 에서 나타낸 바와 같이, 이력 모듈 (74, 84) 은 SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력을 평가한다 (91). 코딩 모듈 (72, 84) 은 그 이력에 기초하여 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정한다 (92). 그 다음, 코딩 모듈 (72, 84) 은 비트스트림을 코딩한다 (93). 인코딩 측에서, 비트스트림을 코딩하는 프로세스는 비트스트림으로부터 하나 이상의 정제 계수 값들에 대한 정보를 배제하는 것, 및 이러한 정보가 비트스트림으로부터 배제된다는 것을 디코더에 시그널링하는 것을 포함할 수도 있다. 디코딩 측에서, 비트스트림을 코딩하는 프로세스는, 비트스트림으로부터 정보가 배제된다는 것을 디코더에 시그널링하는 정보를 식별하기 위해 비트스트림을 분해하는 것, 및 SVC 방식의 하나 이상의 이전 계층들과 연관된 이력에 기초하여 이러한 배제된 정보를 생성하는 것을 포함할 수도 있다.

도 9 는 본 개시와 일치하는, 정제 계수 정보를 인코딩 및 송신하기 위한 기술들을 나타내는 흐름도이다. 도 9 에서 나타낸 바와 같이, 이력 모듈 (74) 은 SVC 방식의 하나 이상의 이전 계층들의 대응하는 변환 계수들과 연관된 이력에 기초하여, 정제 계수들의 제 1 서브셋트를 형식-0 계수들로서 정의한다 (94). 다시 도 1b 를 참조하면, 영역 (101) 은 제 2 FGS 계층의 형식-0 계수를 나타내고, 영역 (102) 은 제 3 FGS 계층의 형식-0 계수를 나타내며, 영역 (103) 은 제 3 FGS 계층의 형식-0 계수를 나타낸다. 이들 경우들의 각각에서, 이전 이력은, 계수가 가장 가능성 있게 제로의 값을 가질 것이라는 것을 지시 또는 예측한다. 양자화는 (확률들에 반해) 하나 이상의 형식-0 계수가 넌-제로 값을 가지도록 할 수도 있을 것이지만, 형식-0 계수들이 제로의 값들을 가진다는 가정은 일반적으로 도출하기 위해 디코더에서 적용될 수 있는 견고한 가정일 수도 있다. 다른 말로, 형식-0 계수들은 실제로는 제로 또는 넌-제로가 될 수도 있지만, 제로가 될 높은 확룰을 가진다.

이력 모듈 (74) 은 또한, 정제 계수들의 제 2 서브셋트를 SVC 방식의 하나 이상의 이전 계층들의 대응하는 변환 계수들과 연관된 이력에 기초하여 형식-1 계수들로서 정의한다 (95). 도 1b 를 다시 참조하면, 영역 (104) 은 제 3 FGS 계층의 형식-1 계수를 나타내고, 영역 (105) 은 제 2 FGS 계층의 형식-1 계수를 나타낸다. 이들 경우들의 각각에서, 이전 이력은, 계수가 수개의 가능한 값들, 예를 들어, 1, 0, 또는 -1 을 가질 수 있다는 것을 지시 또는 예측한다.

인코드 모듈 (72) 은 비트스트림을 인코딩하여 형식-1 계수들에 대한 정보를 포함하고, 형식-0 계수들에 대한 정보를 포함 또는 배제한다 (96). 특히, 인코드 모듈 (72) 은, 계수들의 패턴들 또는 제로들의 실행들 (runs of zeros) 이 코딩 테이블들을 통해 가변 길이 코드 워드들로 맵핑되는 코딩된 블록 패턴 코딩 또는 실행-길이 코딩과 같은 가변 길이 코딩 기술을 수행할 수도 있다. 이 경우, 더 짧은 가변 길이 코드 워드들은 더 가능성 있는 패턴들 또는 제로-실행 길이들에 대응할 수도 있고, 더 긴 가변 길이 코드 워드들은 더 가능성이 적은 패턴들 또는 제로-실행 길이들에 대응할 수도 있다. 어느 경우에도, 이 코딩은 형식-1 계수들만을 고려하고, 본질적으로 형식-0 계수들을 건너뛴다.

인코드 모듈 (72) 은 또한, 형식-0 계수들에 대한 정보 (값들) 가 비트스트림으로부터 포함되는지 아니면 배제되는지에 관해 디코더에게 시그널링하기 위한 정보를 생성한다 (97). 이 생성된 정보는, 형식-0 계수들에 대해 비트스트림으 로부터 정보가 배제된다는 것을 시그널링하고, 테이블 기반 코딩은 오직 형식-1 계수들에만 적용되고, 형식-0 계수들의 값들은 비트스트림으로부터 배제된다는 것을 디코더가 알 수 있도록 한다. 디코더는 형식-1 계수들로부터 형식-0 계수들을 식별 및 구별할 수 있고, 따라서, 디코더는 형식-0 계수들에 대한 정보가 비트스트림으로부터 배제된 경우 그 형식-0 계수들에 대한 정보를 생성하고, 비트스트림을 디코딩하여 형식-1 계수들을 재구성할 수 있다. 비트스트림을 생성하기 위해 인코딩이 수행된 후에, 비트스트림은, 예를 들어, 소스 디바이스 (2) 로부터, 변조기/송신기 (14), 채널 (15), 및 수신기/복조기 (16) 를 경유하여 수신 디바이스 (6) 로 (도 2 참조) 송신된다 (98).

도 10 은 본 개시와 일치하는, 정제 계수 정보를 수신 및 디코딩하는 기술들을 나타내는 흐름도이다. 도 10 에서 나타낸 바와 같이, 수신기/복조기 (16) 는 인코딩된 비트스트림을 수신한다 (101). 수신기/복조기 (16) 는 물리 계층 복조를 수행하고, 비트스트림을 디코더 (18) 로 포워딩한다. 특히, 비디오 디코더 (18) 는 정제 계수 정보를 디코딩하기 위해 본 개시의 기술들을 수행할 수도 있다. 그렇게 하기 위해, 디코더 (18) 는 전술한 바와 같은 계수 디코드 유닛 (52A) 을 포함할 수도 있다.

유닛 (52A) 의 디코드 모듈 (82) 은, 형식-0 계수들에 대한 정보가 비트스트림으로부터 배제된다는 것을 나타내는 비트스트림에서의 신호를 식별한다 (102). 이 신호는, 이러한 정보가 비트스트림으로부터 배제된다는 것을 운반하기 위해 코딩된 블록 헤더 또는 프레임을 포함할 수도 있다. 이력 모듈 (84) 은, 정제 계수들의 제 1 서브셋트를, SVC 방식의 하나 이상의 이전 계층들의 대응하는 변환 계수들과 연관된 이력에 기초하여 형식-0 계수들로서 정의한다 (103). 또한, 도 1b 를 참조하면, 영역 (101, 102, 및 103) 은 다양한 FGS 계층의 예시적인 형식-0 계수들을 나타낸다. 이들 영역들 (101, 102, 및 103) 의 각각에서, 이전 이력은, 계수가 제로가 될 높은 확률을 가질 것이라는 것을 지시 또는 예측한다.

이력 모듈 (84) 은 또한, 정제 계수들의 제 2 서브셋트를, SVC 방식의 하나 이상의 이전 계층들의 대응하는 변환 계수들과 연관된 이력에 기초하여 형식-1 계수들로서 정의한다 (104). 다시 도 1b 를 참조하면, 영역들 (104 및 105) 은 상이한 FGS 계층들의 예시적인 형식-1 계수들을 나타낸다. 이들 경우들의 각각은, 이전 이력이, 계수가 수개의 가능한 값들, 예를 들어, 1, 0, 또는 -1 을 가질 수 있다는 것을 지시 또는 예측한다.

디코드 모듈 (82) 은 비트스트림으로부터 형식-1 계수들에 대한 정보를 디코딩한다 (105). 특히, 디코드 모듈 (82) 은 코딩 테이블들 (88) 내로의 코드워드 검색을 수행함으로써 가변 길이 디코딩을 수행할 수도 있다. 코드워드들은 비트스트림의 일부일 수도 있고, 코딩된 형식-1 계수들에 대응하는 계수들의 셋트들로 맵핑된다. 또한, 더 짧은 가변 길이 코드 워드들은 더 가능성 있는 계수들의 패턴들 또는 계수들의 제로-실행 길이들에 대응할 수도 있고, 더 긴 가변 길이 코드 워드들은 더 가능성이 적은 계수들의 패턴들 또는 계수들의 제로-실행 길이들에 대응할 수도 있다. 어느 경우에도, 이 코딩은 오직 형식-1 계수들만을 고려한다.

디코드 모듈 (82) 은 형식-0 계수들에 대한 정보를 생성한다 (106). 따라서, 디코드 모듈 (82) 은, 이력 모듈 (84) 이 대응하는 변환 계수들과 연관된 이력에 기초하여 구별들을 식별하는 한, 형식-1 계수들로부터 형식-0 계수들을 구별할 수 있다. 특히, 디코드 모듈 (82) 은 모든 형식-0 계수들이 제로의 값들을 갖는다고 가정할 수도 있고, 이러한 제로들을 생성하고, 그 생성된 제로들을 디코딩된 비디오 블록들 내로, 예를 들어, 이력 모듈 (82) 에 의해 식별된 임의의 형식-0 계수의 위치에 삽입한다.

본원에서 설명된 기술들은 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임의의 조합으로 구현될 수도 있다. 모듈들 또는 구성요소들로서 설명된 임의의 태양들은 집적된 로직 디바이스에서 함께 구현될 수도 있고, 또는, 이산의, 그러나, 공동으로 동작가능한 로직 디바이스들로서 개별적으로 구현될 수도 있다. 소프트웨어로 구현되는 경우, 본 기술들은, 실행될 때 전술한 하나 이상의 방법들을 수행하는 명령들을 포함하는 컴퓨터-판독가능 매체에 의해 적어도 일부 실현될 수도 있다. 컴퓨터-판독가능 매체는 컴퓨터 프로그램 제품의 일부를 형성할 수도 있고, 이 컴퓨터 프로그램 제품은 포장 재료를 포함할 수도 있다. 컴퓨터-판독가능 매체는, 동기식 동적 랜덤 액세스 메모리 (SDRAM) 와 같은 랜덤 액세스 메모리 (RAM), 판독 전용 메모리 (ROM), 비휘발성 랜덤 액세스 메모리 (NVRAM), 전기적으로 소거가능한 프로그래머블 판독 전용 메모리 (EEPROM), 플래쉬 메모리, 자기 또는 광학적 데이터 저장 매체 등을 포함할 수도 있다. 본 기술들은, 부가적으로, 또는 대안적으로, 명령들 또는 데이터 구조들의 형태로 코드를 운반 또는 통신 하고, 컴퓨터에 의해 액세스, 판독, 및/또는 실행될 수 있는 컴퓨터-판독가능 통신 매체에 의해 적어도 일부 실현될 수도 있다.

코드는, 하나 이상의 디지털 신호 처리기 (DSP) 들, 범용 마이크로프로세서들, 주문형 집적 회로 (ASIC) 들, 필드 프로그래머블 로직 어레이 (FPGA) 들, 또는 다른 등가의 집적 또는 이산 논리 회로 등과 같은 하나 이상의 프로세서들에 의해 실행될 수도 있다. 따라서, 본원에서 사용된 바와 같은 "프로세서" 라는 용어는, 본원에서 설명된 기술들의 구현에 적합한 전술한 구조 또는 임의의 다른 구조를 지칭할 수도 있다. 또한, 몇몇 양태들에서, 본원에서 설명된 기능은 인코딩 및 디코딩을 위해 구성된 전용 소프트웨어 모듈들 또는 하드웨어 모듈들 내에 제공될 수도 있고, 또는, 결합된 비디오 인코더-디코더 (CODEC) 내에 통합될 수도 있다.

본 개시는 또한, 집적 회로, 칩셋 ASIC, FPGA, 로직 또는 본원에서 설명된 하나 이상의 기술들을 수행하도록 구성된 이들의 다양한 조합들과 같은 회로를 지향할 수도 있다. 따라서, 본 개시는 또한 전술한 임의의 기술들을 수행하도록 구성된 회로를 고려한다. 예를 들어, 본 개시는 SVC 방식의 향상 계층의 정제 계수들을 코딩하도록 구성된 회로를 제공할 수도 있고, 여기서, 이 회로는, SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력을 평가하고, 그 이력에 기초하여 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정하도록 구성된다.

본 발명의 다양한 실시형태들이 설명되었다. 이들 및 다른 실시형태들은 첨부된 청구의 범위의 범위 내이다.

Claims

스케일러블 비디오 코딩 (scalable video coding; SVC) 방식에서의 향상 계층 (enhancement layer) 의 정제 계수들 (refinement coefficients) 을 코딩하는 방법으로서,

상기 SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력 (history) 을 평가하는 단계;

상기 이력에 기초하여 상기 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들의 각각을 제로 또는 넌-제로로서 추정하는 단계;

상기 향상 계층의 상기 정제 계수들의 제 1 서브셋트를 각각이 제로의 추정된 값을 갖는 형식-0 정제 계수들로서 정의하는 단계; 및

상기 향상 계층의 상기 정제 계수들의 제 2 서브셋트를 각각이 넌-제로의 추정된 값을 갖는 형식-1 정제 계수들로서 정의하는 단계를 포함하고,

상기 형식-0 정제 계수들의 값들을 나타내는 정보는 인코딩된 비트스트림으로부터 배제되며, 상기 형식-1 정제 계수들의 값들을 나타내는 정보는 상기 인코딩된 비트스트림에 포함되고, 상기 형식-0 정제 계수들의 값들을 나타내는 상기 정보는 상기 SVC 방식의 상기 하나 이상의 이전 계층들과 연관된 상기 변환 계수 값들의 상기 이력에 기초하여 도출되는, 정제 계수들을 코딩하는 방법.
제 1 항에 있어서,

상기 코딩은 인코딩을 포함하며,

상기 정제 계수들을 코딩하는 방법은,

상기 추정된 정제 계수 값들에 대한 정보를 상기 인코딩된 비트스트림으로부터 배제하는 단계를 더 포함하는, 정제 계수들을 코딩하는 방법.
제 2 항에 있어서,

상기 이력의 평가에 의해 결정된 바에 따라 상기 추정된 정제 계수 값들에 대한 정보가 상기 인코딩된 비트스트림으로부터 배제된다는 것을 디코더에게 시그널링하는 단계를 더 포함하는, 정제 계수들을 코딩하는 방법.
제 1 항에 있어서,

상기 코딩은 상기 인코딩된 비트스트림의 디코딩을 포함하고,

상기 인코딩된 비트스트림은 상기 추정된 정제 계수 값들에 대한 정보가 결여되어 있으며,

상기 정제 계수들을 코딩하는 방법은,

상기 추정된 정제 계수 값들을 생성하는 단계를 더 포함하는, 정제 계수들을 코딩하는 방법.
제 4 항에 있어서,

상기 이력의 평가에 의해 결정된 바에 따라 상기 추정된 정제 계수 값들에 대한 정보가 상기 인코딩된 비트스트림으로부터 배제된다는 것을 나타내는 신호를 수신하는 단계를 더 포함하는, 정제 계수들을 코딩하는 방법.
제 1 항에 있어서,

상기 향상 계층의 상기 정제 계수들의 코딩은 상기 SVC 방식의 n 번째 계층의 정제 계수들의 코딩을 포함하고,

상기 이력을 평가하는 단계는, 상기 SVC 방식의 (n-1) 번째 계층과 연관된 정제 계수 값들이 넌-제로 (non-zero) 값들을 가졌었는지 여부를 판정하는 단계를 포함하며,

상기 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정하는 단계는, 대응하는 상기 (n-1) 번째 계층의 계수들이 넌-제로 값들을 가졌었던 상기 n 번째 계층의 계수들에 제로의 값들을 할당하는 단계를 포함하는, 정제 계수들을 코딩하는 방법.
제 1 항에 있어서,

상기 이력을 평가하는 단계는, 상기 현재 계층의 정제 계수들에 대해 인덱스 값들을 할당하는 단계를 포함하고, 상기 인덱스 값들은, 상기 SVC 방식의 하나 이상의 이전 계층들과 연관된 대응하는 변환 계수 값들에 종속적이며,

상기 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들을 추정하는 단계는, 하나 이상의 미리 정의된 인덱스 값들에 대응하는 인덱스 값들을 갖는 상기 현재 계층의 정제 계수들에 제로의 값들을 할당하는 단계를 포함하는, 정제 계수들을 코딩하는 방법.
제 1 항에 있어서,

상기 코딩은 인코딩을 포함하며,

상기 정제 계수들을 코딩하는 방법은,

상기 형식-1 정제 계수들에 대한 정보를 상기 인코딩된 비트스트림 내에 포함하는 단계; 및

상기 형식-0 정제 계수들에 대한 정보를 상기 인코딩된 비트스트림에서 배제하는 단계를 더 포함하는, 정제 계수들을 코딩하는 방법.
제 1 항에 있어서,

상기 코딩은 디코딩을 포함하며,

상기 정제 계수들을 코딩하는 방법은,

상기 형식-1 정제 계수들에 대한 정보를 상기 인코딩된 비트스트림으로부터 디코딩하는 단계; 및

상기 인코딩된 비트스트림으로부터 배제된, 상기 형식-0 정제 계수들에 대한 정보를 발생시키는 단계를 더 포함하는, 정제 계수들을 코딩하는 방법.
스케일러블 비디오 코딩 (scalable video coding; SVC) 방식에서의 향상 계층 (enhancement layer) 의 정제 계수들 (refinement coefficients) 을 코딩하는 디바이스로서,

상기 SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력 (history) 을 평가하고, 상기 향상 계층의 상기 정제 계수들의 제 1 서브셋트를 각각이 제로의 추정된 값을 갖는 형식-0 정제 계수들로서 정의하며, 상기 향상 계층의 상기 정제 계수들의 제 2 서브셋트를 각각이 넌-제로의 추정된 값을 갖는 형식-1 정제 계수들로서 정의하는 이력 모듈; 및

상기 이력에 기초하여 상기 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들의 각각을 제로 또는 넌-제로로서 추정하는 코딩 모듈을 포함하고,

상기 형식-0 정제 계수들의 값들을 나타내는 정보는 인코딩된 비트스트림으로부터 배제되며, 상기 형식-1 정제 계수들의 값들을 나타내는 정보는 상기 인코딩된 비트스트림에 포함되고, 상기 형식-0 정제 계수들의 값들을 나타내는 상기 정보는 상기 SVC 방식의 상기 하나 이상의 이전 계층들과 연관된 상기 변환 계수 값들의 상기 이력에 기초하여 도출되는, 정제 계수들을 코딩하는 디바이스.
제 10 항에 있어서,

상기 코딩 모듈은 인코드 모듈을 포함하며,

상기 인코드 모듈은, 상기 추정된 정제 계수 값들에 대한 정보를 상기 인코딩된 비트스트림으로부터 배제하는, 정제 계수들을 코딩하는 디바이스.
제 11 항에 있어서,

상기 코딩 모듈은, 상기 이력의 평가에 의해 결정된 바에 따라 상기 추정된 정제 계수 값들에 대한 정보가 상기 인코딩된 비트스트림으로부터 배제된다는 것을 나타내는 신호를 생성하는, 정제 계수들을 코딩하는 디바이스.
제 10 항에 있어서,

상기 코딩 모듈은 상기 인코딩된 비트스트림을 디코딩하는 디코드 모듈을 포함하고,

상기 인코딩된 비트스트림은 상기 추정된 정제 계수 값들에 대한 정보가 결여되어 있으며,

상기 디코드 모듈은 상기 추정된 정제 계수 값들을 생성하는, 정제 계수들을 코딩하는 디바이스.
제 13 항에 있어서,

상기 코딩 모듈은, 상기 이력의 평가에 의해 결정된 바에 따라 상기 추정된 정제 계수 값들에 대한 정보가 상기 인코딩된 비트스트림으로부터 배제된다는 것을 나타내는 신호를 수신하는, 정제 계수들을 코딩하는 디바이스.
제 10 항에 있어서,

상기 코딩 모듈은 상기 SVC 방식의 n 번째 계층의 정제 계수들을 코딩하고,

상기 이력 모듈은, 상기 SVC 방식의 (n-1) 번째 계층과 연관된 정제 계수 값들이 넌-제로 (non-zero) 값들을 가졌었는지 여부를 판정하며,

상기 코딩 모듈은, 대응하는 상기 (n-1) 번째 계층의 계수들이 넌-제로 값들을 가졌었던 상기 n 번째 계층의 계수들에 제로의 값들을 할당하는, 정제 계수들을 코딩하는 디바이스.
제 10 항에 있어서,

상기 이력 모듈은, 상기 현재 계층의 정제 계수들에 대해 인덱스 값들을 할당하고, 상기 인덱스 값들은, 상기 SVC 방식의 하나 이상의 이전 계층들과 연관된 대응하는 변환 계수 값들에 종속적이며,

상기 코딩 모듈은, 하나 이상의 미리 정의된 인덱스 값들에 대응하는 인덱스 값들을 갖는 상기 현재 계층의 정제 계수들에 제로의 값들을 할당하는, 정제 계수들을 코딩하는 디바이스.
제 10 항에 있어서,

상기 코딩 모듈은 인코드 모듈을 포함하며,

상기 인코드 모듈은, 상기 형식-1 정제 계수들에 대한 정보를 상기 인코딩된 비트스트림 내에 포함하고, 상기 형식-0 정제 계수들에 대한 정보를 상기 인코딩된 비트스트림에서 배제하는, 정제 계수들을 코딩하는 디바이스.
제 10 항에 있어서,

상기 코딩 모듈은 디코드 모듈을 포함하며,

상기 디코드 모듈은, 상기 형식-1 정제 계수들에 대한 정보를 상기 인코딩된 비트스트림으로부터 디코딩하고, 상기 인코딩된 비트스트림으로부터 배제된 상기 형식-0 정제 계수들에 대한 정보를 발생시키는, 정제 계수들을 코딩하는 디바이스.
제 10 항에 있어서,

상기 정제 계수들을 코딩하는 디바이스는 무선 통신 디바이스를 포함하는, 정제 계수들을 코딩하는 디바이스.
비디오 코딩 디바이스에서 실행 시에 상기 비디오 코딩 디바이스로 하여금 스케일러블 비디오 코딩 (scalable video coding; SVC) 방식에서의 향상 계층 (enhancement layer) 의 정제 계수들 (refinement coefficients) 을 코딩하게 하는 명령들을 포함하는 컴퓨터-판독가능 매체로서,

상기 명령들은 상기 비디오 코딩 디바이스로 하여금,

상기 SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력 (history) 을 평가하고;

상기 이력에 기초하여 상기 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들의 각각을 제로 또는 넌-제로로서 추정하며;

상기 향상 계층의 상기 정제 계수들의 제 1 서브셋트를 각각이 제로의 추정된 값을 갖는 형식-0 정제 계수들로서 정의하고;

상기 향상 계층의 상기 정제 계수들의 제 2 서브셋트를 각각이 넌-제로의 추정된 값을 갖는 형식-1 정제 계수들로서 정의하게 하며,

상기 형식-0 정제 계수들의 값들을 나타내는 정보는 인코딩된 비트스트림으로부터 배제되며, 상기 형식-1 정제 계수들의 값들을 나타내는 정보는 상기 인코딩된 비트스트림에 포함되고, 상기 형식-0 정제 계수들의 값들을 나타내는 상기 정보는 상기 SVC 방식의 상기 하나 이상의 이전 계층들과 연관된 상기 변환 계수 값들의 상기 이력에 기초하여 도출되는, 컴퓨터-판독가능 매체.
제 20 항에 있어서,

상기 명령들은 상기 비디오 코딩 디바이스로 하여금 상기 향상 계층의 상기 정제 계수들을 인코딩하게 하고,

상기 명령들은 상기 비디오 코딩 디바이스로 하여금 상기 추정된 정제 계수 값들에 대한 정보를 상기 인코딩된 비트스트림으로부터 배제하게 하는, 컴퓨터-판독가능 매체.
제 21 항에 있어서,

상기 명령들은 상기 비디오 코딩 디바이스로 하여금, 상기 이력의 평가에 의해 결정된 바에 따라 상기 추정된 정제 계수 값들에 대한 정보가 상기 인코딩된 비트스트림으로부터 배제된다는 것을 나타내는 신호를 상기 인코딩된 비트스트림에 포함하게 하는, 컴퓨터-판독가능 매체.
제 21 항에 있어서,

상기 명령들은 상기 비디오 코딩 디바이스로 하여금 상기 향상 계층의 상기 정제 계수들을 인코딩하게 하고,

상기 명령들은 상기 비디오 코딩 디바이스로 하여금,

상기 형식-1 정제 계수들에 대한 정보를 상기 인코딩된 비트스트림 내에 포함하고;

상기 형식-0 정제 계수들에 대한 정보를 상기 인코딩된 비트스트림에서 배제하게 하는, 컴퓨터-판독가능 매체.
스케일러블 비디오 코딩 (scalable video coding; SVC) 방식에서의 향상 계층 (enhancement layer) 의 정제 계수들 (refinement coefficients) 을 코딩하는 디바이스로서,

상기 SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력 (history) 을 평가하는 수단;

상기 이력에 기초하여 상기 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들의 각각을 제로 또는 넌-제로로서 추정하는 코딩 수단;

상기 향상 계층의 상기 정제 계수들의 제 1 서브셋트를 각각이 제로의 추정된 값을 갖는 형식-0 정제 계수들로서 정의하는 수단; 및

상기 향상 계층의 상기 정제 계수들의 제 2 서브셋트를 각각이 넌-제로의 추정된 값을 갖는 형식-1 정제 계수들로서 정의하는 수단을 포함하고,

상기 형식-0 정제 계수들의 값들을 나타내는 정보는 인코딩된 비트스트림으로부터 배제되며, 상기 형식-1 정제 계수들의 값들을 나타내는 정보는 상기 인코딩된 비트스트림에 포함되고, 상기 형식-0 정제 계수들의 값들을 나타내는 상기 정보는 상기 SVC 방식의 상기 하나 이상의 이전 계층들과 연관된 상기 변환 계수 값들의 상기 이력에 기초하여 도출되는, 정제 계수들을 코딩하는 디바이스.
스케일러블 비디오 코딩 (scalable video coding; SVC) 방식에서의 향상 계층 (enhancement layer) 의 정제 계수들 (refinement coefficients) 을 코딩하도록 구성된 회로로서,

상기 SVC 방식의 하나 이상의 이전 계층들과 연관된 변환 계수 값들의 이력 (history) 을 평가하고;

상기 이력에 기초하여 상기 SVC 방식의 현재 계층과 연관된 하나 이상의 정제 계수 값들의 각각을 제로 또는 넌-제로로서 추정하며;

상기 향상 계층의 상기 정제 계수들의 제 1 서브셋트를 각각이 제로의 추정된 값을 갖는 형식-0 정제 계수들로서 정의하고;

상기 향상 계층의 상기 정제 계수들의 제 2 서브셋트를 각각이 넌-제로의 추정된 값을 갖는 형식-1 정제 계수들로서 정의하도록 구성되며,

상기 형식-0 정제 계수들의 값들을 나타내는 정보는 인코딩된 비트스트림으로부터 배제되며, 상기 형식-1 정제 계수들의 값들을 나타내는 정보는 상기 인코딩된 비트스트림에 포함되고, 상기 형식-0 정제 계수들의 값들을 나타내는 상기 정보는 상기 SVC 방식의 상기 하나 이상의 이전 계층들과 연관된 상기 변환 계수 값들의 상기 이력에 기초하여 도출되는, 정제 계수들을 코딩하도록 구성된 회로.