KR20150003277A

KR20150003277A - 비디오 코딩에서의 바이패스 코딩된 구문 엘리먼트들의 그룹화

Info

Publication number: KR20150003277A
Application number: KR1020147031179A
Authority: KR
Inventors: 웨이-정 치엔; 지안레 천; 무하메드 제이드 코반; 마르타 카르체비츠
Original assignee: 퀄컴 인코포레이티드
Priority date: 2012-04-11
Filing date: 2013-04-05
Publication date: 2015-01-08
Also published as: EP2847997B1; CA2867764C; EP2847997A1; CA2867764A1; JP2015516765A; TWI481237B; TW201404161A; IL234650A; BR112014025406B1; RU2014145203A; DK2847997T3; CN104221374A; HUE026345T2; AU2013246251A1; SG11201405752SA; KR101642629B1; ZA201407858B; RU2623884C2; ES2561609T3; US9538172B2

Abstract

비디오 인코딩 디바이스는 구문 엘리먼트들의 제 1의 그룹을 생성하도록 구성된다. 제 1의 그룹 내의 구문 엘리먼트는, 각각의 예측 단위 (PU) 의 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타낸다. 제 1의 그룹에서의 각각의 구문 엘리먼트들에 대응하는 구문 엘리먼트들의 제 2의 그룹이 생성된다. 제 2의 그룹에서의 구문 엘리먼트들은 인트라 예측 모드 또는 가장 가능성이 높은 모드들의 리스트로의 인덱스 중 어느 하나를 식별한다. 구문 엘리먼트들의 제 1의 그룹은 CABAC (context adaptive binary arithmetic coding) 인코딩되고, 구문 엘리먼트들의 제 2의 그룹은 바이패스 인코딩된다. 비디오 디코더는 구문 엘리먼트들의 엔트로피 인코딩된 제 1 및 제 2의 그룹들을 수신하도록 구성된다. 비디오 디코더는 플래그들의 제 1의 그룹을 디코딩하고 플래그들의 제 2의 그룹을 바이패스 디코딩한다.

Description

비디오 코딩에서의 바이패스 코딩된 구문 엘리먼트들의 그룹화{GROUPING BYPASS CODED SYNTAX ELEMENTS IN VIDEO CODING}

관련 출원들

본 출원은: 2012년 4월 11일 출원된 미국 가출원 제 61/623,004호; 및

2012년 4월 27일 출원된 미국 가출원 제 61/639,836호의 이점을 주장하며, 이로써, 이들 각각의 전체 내용은 참조에 의해 그 전체가 본원에 통합된다.

기술 분야

본 개시는 비디오 코딩에 관한 것으로 특히 비디오 코딩에서의 구문 엘리먼트들을 코딩하기 위한 기술들에 관한 것이다.

디지털 비디오 성능들은, 디지털 텔레비전, 디지털 다이렉트 브로드캐스트 시스템들, 무선 브로드캐스트 시스템들, PDA들 (personal digital assistants), 랩탑 또는 데스크탑 컴퓨터들, 디지털 카메라들, 디지털 레코딩 디바이스들, 디지털 미디어 플레이어들, 비디오 게임용 디바이스들, 비디오 게임 콘솔들, 셀룰러 또는 위성 라디오 텔레폰들, 소위 "스마트폰들", 태블릿 컴퓨터들, 화상 원격회의 디바이스들 등을 포함하는 광범위한 디바이스들에 통합될 수 있다. 비디오 코딩 표준들은 ITU-T H.261, ISO/IEC MPEG-1 비주얼, ITU-T H.262 또는 ISO/IEC MPEG-2 비주얼, ITU-T H.263, ISO/IEC MPEG-4 비주얼 및 자신의 SVC (Scalable Video Coding) 및 MVC (Multiview Video Coding) 확장안들을 포함하는 ITU-T H.264 (또한 ISO/IEC MPEG-4 AVC로 알려짐) 을 포함한다. 또한, HEVC (High-Efficiency Video Coding; 고효율 비디오 코딩) 는, ITU-T VCEG (Video Coding Experts Group; 비디오 코딩 전문가 그룹) 및 ISO/IEC MPEG (Motion Picture Experts Group; 동화상 전문가 그룹) 의 JCT-VC (Joint Collaboration Team on Video Coding) 에 의해 개발되고 있는 새로운 비디오 코딩 표준이다.

비디오 압축 기술들은 비디오 시퀀스들에서 본질적인 용장성 (redundancy) 을 감소시키거나 제거하기 위해 공간 예측 및/또는 시간 예측을 수행한다. 블록 기반의 예측 비디오 코딩을 위해, 비디오 프레임 또는 비디오 프레임의 슬라이스는, 매크로블록들 또는 코딩 단위들로 칭해질 수도 있는 비디오 블록들로 구획될 수도 있다. 각각의 블록은 더 구획될 수도 있다. 인트라 코딩된 (I) 프레임 또는 슬라이스에서의 비디오 블록들은 이웃 비디오 블록들에 대한 공간 예측을 이용하여 인코딩된다. 인터 코딩된 (P 또는 B) 프레임 또는 슬라이스에서의 비디오 블록들은 동일한 프레임 또는 슬라이스에서의 이웃 비디오 블록들에 대한 공간 예측 또는 다른 참조 프레임들에 대한 시간 예측을 이용할 수도 있다.

예측 블록을 형성하기 위해 사용되는 참조 샘플들의 그룹을 나타내는 모션 벡터를 사용하여 인터 코딩된 블록이 코딩될 수도 있다. 예측 블록을 형성하기 위해 사용되는 참조 샘플들의 블록을 가리키는 인트라 모드를 사용하여 인트라 코딩된 블록이 코딩될 수도 있다. 비디오 블록과 예측 블록 사이의 차이는 잔차 데이터로서 칭해질 수도 있다. 추가 압축을 위해, 잔차 데이터는 픽셀 도메인에서 변환 도메인으로 변환되어, 잔차 변환 계수들로 나타날 수도 있고, 그 후 이들은 양자화될 수도 있다. 또한, 양자화된 변환 계수들 및 예측 정보는 추가 압축을 위해 엔트로피 코딩될 수도 있다.

개요

일반적으로, 본 개시는 예측 비디오 코딩을 위해 구문 엘리먼트들을 정렬하는 다양한 기술들을 설명한다. 이들 기술들은, 엔트로피 코딩 스루풋에 영향을 끼칠 수도 있는 파이프라인 오버헤드를 줄일 수도 있다. 일 예에서, 구문 엘리먼트들이 CABAC (Context Adaptive Binary Arithmetic Coding) 코딩되거나 또는 바이패스 코딩되는 순서는 최적화될 수도 있다. 바이패스 코딩은 적응 콘텍스트를 사용하지 않고 빈들의 산술적 코딩을 참조할 수도 있다. 일 예에서, 코딩 단위 (coding unit; CU) 내의 예측 단위들 (predictive units; PU들) 의 인트라 예측 모드들을 나타내는 구문 엘리먼트들은, 그들이 바이패스 코딩될 것인지 또는 CABAC 코딩될 것인지의 여부에 기초하여 함께 그룹화될 수도 있다. 이 그룹화는 구문 엘리먼트들을 엔트로피 코딩하는 데 필요한 싸이클들의 전체 수를 감소시킬 수도 있다.

일 예에서, 본 개시는 비디오 데이터를 디코딩하는 방법을 설명하는데, 그 방법은, 코딩 단위 (coding unit; CU) 의 예측 단위들 (prediction units; PU들) 에 대한 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 제 2의 그룹을 포함하는 엔트로피 인코딩된 비트스트림을 수신하는 단계로서, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하고, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트는, CU에서의 각각의 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 수신하는 단계; 구문 엘리먼트들의 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 디코딩하는 단계; 구문 엘리먼트들의 제 1의 그룹을 CABAC 디코딩하는 단계에 후속하여, 구문 엘리먼트들의 제 2의 그룹을 바이패스 디코딩하는 단계; 및 구문 엘리먼트들의 디코딩된 제 1의 그룹 및 구문 엘리먼트들의 디코딩된 제 2의 그룹에 기초하여 비디오 데이터를 재구성하는 단계를 포함한다.

다른 예에서, 본 개시는 비디오 데이터를 디코딩하는 장치를 설명하는데, 그 장치는 비디오 디코더를 포함하고, 비디오 디코더는: 코딩 단위 (CU) 의 예측 단위들 (PU들) 에 대한 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 제 2의 그룹을 포함하는 엔트로피 인코딩된 비트스트림을 수신하는 것으로서, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하고, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트는, CU에서의 각각의 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 수신하고; 구문 엘리먼트들의 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 디코딩하고; 구문 엘리먼트들의 제 1의 그룹을 CABAC 디코딩하는 것에 후속하여, 구문 엘리먼트들의 제 2의 그룹을 바이패스 디코딩하고; 그리고 구문 엘리먼트들의 디코딩된 제 1의 그룹 및 구문 엘리먼트들의 디코딩된 제 2의 그룹에 기초하여 비디오 데이터를 재구성하도록 구성된다.

다른 예에서, 본 개시는 명령들이 저장된 컴퓨터 판독가능 저장 매체를 설명하는데, 그 명령들은 실행시 비디오 데이터를 디코딩하기 위한 디바이스의 하나 이상의 프로세서들로 하여금: 코딩 단위 (CU) 의 예측 단위들 (PU들) 에 대한 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 제 2의 그룹을 포함하는 엔트로피 인코딩된 비트스트림을 수신하게 하는 것으로서, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하고, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트는, CU에서의 각각의 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 수신하게 하고; 구문 엘리먼트들의 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 디코딩하게 하고; 구문 엘리먼트들의 제 1의 그룹을 CABAC 디코딩하는 것에 후속하여, 구문 엘리먼트들의 제 2의 그룹을 바이패스 디코딩하게 하고; 그리고 구문 엘리먼트들의 디코딩된 제 1의 그룹 및 구문 엘리먼트들의 디코딩된 제 2의 그룹에 기초하여 비디오 데이터를 재구성하게 한다.

다른 예에서, 본 개시는 비디오 데이터를 디코딩하는 장치를 설명하는데, 그 장치는: 코딩 단위 (CU) 의 예측 단위들 (PU들) 에 대한 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 제 2의 그룹을 포함하는 엔트로피 인코딩된 비트스트림을 수신하는 수단으로서, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하고, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트는, CU에서의 각각의 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 수신하는 수단; 구문 엘리먼트들의 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 디코딩하는 수단; 구문 엘리먼트들의 제 1의 그룹을 CABAC 디코딩하는 것에 후속하여, 구문 엘리먼트들의 제 2의 그룹을 바이패스 디코딩하는 수단; 및 구문 엘리먼트들의 디코딩된 제 1의 그룹 및 구문 엘리먼트들의 디코딩된 제 2의 그룹에 기초하여 비디오 데이터를 재구성하는 수단을 포함한다.

다른 예에서, 본 개시는 비디오 데이터를 인코딩하는 방법을 설명하는데, 그 방법은: 구문 엘리먼트들의 제 1의 그룹을 생성하는 단계로서, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트는, 코딩 단위 (CU) 에서의 각각의 예측 단위 (PU) 의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 제 1의 그룹을 생성하는 단계; 구문 엘리먼트들의 제 2의 그룹을 생성하는 단계로서, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하는, 상기 제 2의 그룹을 생성하는 단계; 구문 엘리먼트들의 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 인코딩하는 단계; 구문 엘리먼트들의 제 1의 그룹을 CABAC 인코딩하는 단계에 후속하여, 구문 엘리먼트들의 제 2의 그룹을 바이패스 인코딩하는 단계; 및 구문 엘리먼트들의 인코딩된 제 1의 그룹 및 구문 엘리먼트들의 인코딩된 제 2의 그룹을 포함하는 비디오 데이터를 출력하는 단계를 포함한다.

다른 예에서, 본 개시는 비디오 데이터를 인코딩하는 장치를 설명하는데, 그 장치는, 비디오 인코더를 포함하고, 비디오 인코더는: 구문 엘리먼트들의 제 1의 그룹을 생성하는 것으로서, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트는, 코딩 단위 (CU) 에서의 각각의 예측 단위 (PU) 의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 제 1의 그룹을 생성하고; 구문 엘리먼트들의 제 2의 그룹을 생성하는 것으로서, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하는, 상기 제 2의 그룹을 생성하고; 구문 엘리먼트들의 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 인코딩하고; 구문 엘리먼트들의 제 1의 그룹을 CABAC 인코딩하는 것에 후속하여, 구문 엘리먼트들의 제 2의 그룹을 바이패스 인코딩하고; 그리고 구문 엘리먼트들의 인코딩된 제 1의 그룹 및 구문 엘리먼트들의 인코딩된 제 2의 그룹을 포함하는 비디오 데이터를 출력하도록 구성된다.

다른 예에서, 본 개시는 명령들이 저장된 컴퓨터 판독가능 저장 매체를 설명하는데, 그 명령들은 실행시 비디오 데이터를 인코딩하기 위한 디바이스의 하나 이상의 프로세서들로 하여금: 구문 엘리먼트들의 제 1의 그룹을 생성하게 하는 것으로서, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트는, 코딩 단위 (CU) 에서의 각각의 예측 단위 (PU) 의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 제 1의 그룹을 생성하게 하고; 구문 엘리먼트들의 제 2의 그룹을 생성하게 하는 것으로서, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하는, 상기 제 2의 그룹을 생성하게 하고; 구문 엘리먼트들의 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 인코딩하게 하고; 구문 엘리먼트들의 제 1의 그룹을 CABAC 인코딩하는 것에 후속하여, 구문 엘리먼트들의 제 2의 그룹을 바이패스 인코딩하게 하고; 그리고 구문 엘리먼트들의 인코딩된 제 1의 그룹 및 구문 엘리먼트들의 인코딩된 제 2의 그룹을 포함하는 비디오 데이터를 출력하게 한다.

다른 예에서, 본 개시는 비디오 데이터를 인코딩하는 장치를 설명하는데, 그 장치는: 구문 엘리먼트들의 제 1의 그룹을 생성하는 수단으로서, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트는, 코딩 단위 (CU) 에서의 각각의 예측 단위 (PU) 의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 제 1의 그룹을 생성하는 수단; 구문 엘리먼트들의 제 2의 그룹을 생성하는 수단으로서, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하는, 상기 제 2의 그룹을 생성하는 수단; 구문 엘리먼트들의 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 인코딩하는 수단; 구문 엘리먼트들의 제 1의 그룹을 CABAC 인코딩하는 것에 후속하여, 구문 엘리먼트들의 제 2의 그룹을 바이패스 인코딩하는 수단; 및 구문 엘리먼트들의 인코딩된 제 1의 그룹 및 구문 엘리먼트들의 인코딩된 제 2의 그룹을 포함하는 비디오 데이터를 출력하는 수단을 포함한다.

하나 이상의 예들의 상세들은 첨부된 도면들과 하기의 설명으로부터 설명된다. 다른 특징들, 목적들 및 이점들은 발명의 상세한 설명과 도면들, 및 특허청구범위로부터 명확해질 것이다.

도 1은 예측 단위 구조들 및 관련 인트라 예측 코딩 모드들의 예들을 예시하는 개념도이다.
도 2는 본 개시에 따른 기술들을 활용하도록 구성될 수도 있는 예시적인 비디오 인코딩 및 디코딩 시스템을 예시하는 블록도이다.
도 3은, 본 개시에 따른, 예측 구문 엘리먼트들을 코딩하기 위한 기술들을 구현할 수도 있는 비디오 인코더의 일 예를 예시하는 블록도이다.
도 4는, 본 개시에 따른, 예측 구문 엘리먼트들을 엔트로피 코딩하기 위한 기술들을 구현할 수도 있는 엔트로피 인코더의 일 예를 예시하는 블록도이다.
도 5는 본 개시의 기술들에 따라 예측 구문 엘리먼트들을 인코딩하는 것을 예시하는 흐름도이다.
도 6은, 본 개시에 따른, 예측 구문 엘리먼트들을 포함하는 인코딩된 비디오 시퀀스를 디코딩하기 위한 기술들을 구현할 수도 있는 비디오 디코더의 일 예를 예시하는 블록도이다.
도 7은, 본 개시에 따른, 예측 구문 엘리먼트들을 엔트로피 디코딩하기 위한 기술들을 구현할 수도 있는 엔트로피 디코더의 일 예를 예시하는 블록도이다.
도 8은 본 개시의 기술들에 따라 예측 구문 엘리먼트들을 디코딩하는 것을 예시하는 흐름도이다.

상세한 설명

구문 엘리먼트들의 그룹 내의 예측 구문 엘리먼트들, 예컨대 하나 이상의 예측 단위들에 대한 인트라 예측 모드를 나타낼 수도 있는 구문 엘리먼트들은 정규 (regular) CABAC (콘텍스트 적응 이진 산술 코딩) 코딩되거나 또는 바이패스 코딩될 수도 있다. 이들 예측 구문 엘리먼트들이 CABAC 코더에 의해 수신되는 순서는, 구문 엘리먼트들의 그룹을 엔트로피 코딩하는 데 필요한 프로세싱 싸이클들의 전체 수에 영향을 끼칠 수도 있다. 이것은, 바이패스 코딩과 CABAC 코딩 사이의 코딩 전이들로서 CABAC 코딩 엔진을 재시작하는 데 필요한 셋업 오버헤드에 기인할 수도 있다. 본 개시에서 설명된 기술들에서, 이들 구문 엘리먼트들은, 구문 엘리먼트들의 그룹을 엔트로피 코딩하는 데 필요한 프로세싱 싸이클들의 전체 수가 감소되도록 하는 방식으로 정렬될 수도 있다.

예를 들면, 몇몇 다른 기술들에서, 인트라 예측을 위해, 비디오 인코더는 루마 샘플들의 인트라 예측 모드를 규정하는 구문 엘리먼트들을 시그널링하고 크로마 샘들들에 대한 구문 엘리먼트들을 시그널링한다. 루마 샘들들의 구문 엘리먼트들의 일부와 크로마 샘플들에 대한 구문 엘리먼트들의 일부는 CABAC 코딩되고 루마 샘플들 및 크로마 샘플들에 대한 다른 구문 엘리먼트들은 바이패스 코딩된다. 몇몇 경우들에서, 파이프라인 오버헤드로 인해, CABAC 코딩되고 바이패스 코딩된 구문 엘리먼트들은 인터리빙되어 차선의 엔트로피 코딩 스루풋을 나타내게 된다.

예를 들면, 바이패스 모드는, 보통, CABAC 모드 보다 훨씬 더 큰 스루풋을 갖는다. 일 예로서, 바이패스 모드는, 싸이클당 1빈을 프로세싱하는 바이패스 모드보다 상당한 복잡도를 추가하지 않으면서 일 싸이클에서 6빈들을 프로세싱할 수도 있고, 한편, CABAC 모드는, 싸이클당 1빈을 프로세싱하는 CABAC 모드보다 훨씬 더 복잡한 설계를 가지고 싸이클당 2빈들만을 프로세싱할 수도 있다. 이것은 CABAC 모드에서의 콘텍스트 전환의 성질에 기인한다.

엔트로피 코딩 스루풋을 향상시키기 위해, CABAC 코딩된 구문 엘리먼트들을 함께 그룹화하고 바이패스 코딩된 구문 엘리먼트들을 함께 그룹화하는 것이 유익할 수도 있다. 일 예로서, CABAC 코딩된 구문 엘리먼트들 및 바이패스 코딩된 구문 엘리먼트들은 함께 인터리빙되지 않는다. 더 상세히 설명되는 바와 같이, 본 개시에서 설명된 기술들은 CABAC 코딩된 구문 엘리먼트들 및 바이패스 코딩된 구문 엘리먼트들을 함께 그룹화하는 다양한 예시적인 기술들을 제공하는데, 이것은 엔트로피 코딩 스루풋을 향상시킬 가능성을 갖는다.

일 예로서, 루마 인트라 모드와 크로마 인트라 모드의 모든 CABAC 코딩된 빈들을 그리고 루마 인트라 모드와 크로마 인트라 모드의 모든 바이패스 코딩된 빈들을, 비디오 인코더는 코딩된 비트스트림에서 함께 인코딩하여 시그널링하고 비디오 디코더는 코딩된 비트스트림으로부터 함께 수신하여 디코딩한다. 다른 예로서, 코딩 단위의 모든 블록들에 대한 인트라 모드의 모든 CABAC 코딩된 빈들, 및 인트라 모드의 모든 바이패스 코딩된 빈들을, 비디오 인코더는 코딩된 비트스트림에서 함께 인코딩 및 시그널링하고 비디오 디코더는 코딩된 비트스트림으로부터 함께 수신하여 디코딩한다. 다른 예로서, 코딩 단위의 모든 블록들에 대한 루마 및 크로마 인트라 모드 양자의 모든 CABAC 코딩된 빈들, 및 루마 및 크로마 인트라 모드의 모든 바이패스 코딩된 빈들을, 비디오 인코더는 코딩된 비트스트림에서 함께 인코딩 및 시그널링하고 비디오 디코더는 코딩된 비트스트림으로부터 함께 수신하여 디코딩한다. 몇몇 경우들에서, 비디오 디코더에 대한 부분적인 디코딩된 구문을 저장하기 위해 약간의 여분의 메모리가 필요될 것이다.

디지털 비디오 디바이스들은 디지털 비디오 정보를 더 효율적으로 인코딩하고 디코딩하기 위해 비디오 압축 기술들을 구현한다. 비디오 압축 기술들은 비디오 코딩 표준에 따라 정의될 수도 있다. HEVC 표준화 노력들은 HEVC 테스트 모델 (HEVC Test Model; HM) 로 칭해지는 비디오 코딩 디바이스의 모델에 기초한다. HM은, 다른 이전의 비디오 코딩 표준들, 예를 들면, ITU-T H.264/AVC의 개발 동안 이용 가능한 비디오 코딩 디바이스들에 대해, 현재 비디오 코딩 디바이스들의 성능들에서의 향상을 가정한다. 예를 들면, H.264가 9개의 인트라 예측 인코딩 모드들을 제공하지만, HEVC는 35개만큼 많은 인트라 예측 인코딩 모드들을 제공한다. "HEVC 규격 초안 6" 또는 "WD6"으로 칭해지는 HEVC의 최근의 규격 초안 (working draft; WD) 은, Bross 등에 의한 문헌 JCTVC-H1003 ("WD6: Working Draft 6 of High-Efficiency Video Coding (HEVC)", 2011년 2월 미국 캘리포니아 산호세: 제 8차 미팅, ITU-T SG16 WP3 및 ISO/IEC JTC1/SC29/WG11의 JCT-VC (Joint Collaborative Team on Video Coding)) 에서 설명된다.

또한, HEVC의 다른 최근의 규격 초안 (규격 초안 8) 은, Bross 등에 의한 문헌 HCTVC-J1003_d7 ("High Efficiency Video Coding (HEVC) Text Specification Draft 8", 2012년 7월, 스웨덴 스톡홀름: 제 10차 미팅, ITU-T SG16 WP3 및 ISO/IEC JTC1/SC29/WG11의 JCT-VC (Joint Collaborative Team on Video Coding)) 에서 설명된다. HEVC의 더 최근의 규격 초안인 규격 초안 9는, 2013년 3월 6일 현재, http://phenix.int-evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC-K1003-v10.zip으로부터 입수가능하다. 또한, HEVC 표준은 ISO/IEC 23008-HEVC로 칭해질 수도 있으며, 이것은 HEVC의 배포 버전에 대한 표준 번호이도록 의도된다. 본 개시의 기술들이 ITU-T H.264 표준 및 HEVC 표준에 관해 설명되었지만, 일반적으로, 본 개시의 기술들은 임의의 비디오 코딩 표준에 적용가능하다.

비디오 시퀀스는, 통상적으로, 픽쳐들로서 또한 칭해지는 일련의 비디오 프레임들을 포함한다. 픽쳐들의 그룹 (group of pictures; GOP) 은 일련의 하나 이상의 비디오 프레임들을 일반적으로 포함한다. GOP는 GOP의 헤더, GOP의 하나 이상의 프레임들의 헤더, 또는 그 외의 곳에, GOP에 포함된 프레임들의 수를 설명하는 구문 데이터를 포함할 수도 있다. 각각의 프레임은 각각의 프레임에 대한 인코딩 모드를 설명하는 프레임 구문 데이터를 포함할 수도 있다. 각각의 비디오 프레임은 복수의 슬라이스들을 포함할 수도 있다. 각각의 슬라이스는 복수의 비디오 블록들을 포함할 수도 있다. 비디오 인코더는 비디오 데이터를 인코딩하기 위해 개개의 비디오 프레임들 내의 비디오 블록들에 대해 통상 동작한다. 비디오 블록들은 고정된 또는 가변적인 사이즈들을 가질 수도 있고, 특정 코딩 표준에 따라 사이즈가 상이할 수도 있다.

예로서, ITU-T H.264 표준은 여러 블록 사이즈들, 예컨대 루마 컴포넌트들에 대한 16x16, 8x8, 또는 4x4와, 크로마 컴포넌트들에 대한 8x8에 대한 인트라 예측뿐만 아니라, 여러 블록 사이즈들, 예컨대 루마 컴포넌트들에 대한 16x16, 16x8, 8x16, 8x8, 8x4, 4x8 및 4x4와 크로마 컴포넌트들에 대한 대응하여 스케일링된 사이즈들에 대한 인터 예측을 지원한다. 본 개시에서, "NxN" 및 "N 바이 N"은 블록의 픽셀 치수들을 수직 및 수평 치수들의 관점에서 언급하기 위해 상호 교환적으로 사용될 수도 있다 (예를 들면, 16x16 픽셀들 또는 16 바이 16 픽셀들). 일반적으로, 16x16 블록은 수직 방향으로 16픽셀들 (y=16) 및 수평 방향으로 16픽셀들 (x=16) 을 구비할 것이다. 픽셀들은 또한 샘플들로서 칭해질 수도 있다. 마찬가지로, NxN 블록은 수직 방향으로 N 픽셀들 수평 방향으로 N 픽셀들을 구비하는데, 여기서 N은 음이 아닌 정수 값을 나타낸다. 블록에서의 픽셀들은 행들 및 열들로 정렬될 수도 있다. 또한, 블록들은 수평 방향에서의 픽셀들의 수가 수직 방향에서의 것과 반드시 동일할 필요는 없다. 예를 들면, 블록들은 NxM 픽셀들을 포함할 수도 있으며, 여기서 M은 N과 반드시 동일하지는 않다.

비디오 블록들은 픽셀 도메인에서의 픽셀 데이터의 블록들, 또는 변환 도메인에서의 변환 계수들의 블록들을 포함할 수도 있다. 이산 코사인 변환 (discrete cosine transform), 정수 변환, 웨이브릿 변환, 또는 개념적으로 유사한 변환과 같은 변환을, 코딩된 비디오 블록들과 예측 비디오 블록들 사이의 픽셀 차이들을 나타내는 잔차 비디오 블록 데이터에 적용하는 것에 후속하여 변환 계수들이 생성될 수도 있다. 몇몇 경우들에서, 비디오 블록은 변환 도메인에서의 양자화된 변환 계수들의 블록들을 포함할 수도 있다.

더 작은 비디오 블록들은 더 나은 해상도를 제공할 수 있으며, 높은 레벨의 상세를 포함하는 비디오 프레임의 로케이션들을 위해 사용될 수도 있다. 일반적으로, 블록들 및 종종 서브 블록들로서 칭해지는 여러 구획들은, 비디오 블록들로서 고려될 수도 있다. 또한, 슬라이스는 복수의 비디오 블록들, 예컨대 블록들 및/또는 서브 블록들인 것으로 간주될 수도 있다. 각 슬라이스는 비디오 프레임의 독립적으로 디코딩 가능한 단위일 수도 있다. 대안적으로, 프레임들 그 자체가 디코딩 가능한 단위들일 수도 있거나, 또는 프레임의 다른 부분들이 디코딩 가능한 단위들로서 정의될 수도 있다. 용어 "코딩 단위"는, 전체 프레임 또는 프레임의 슬라이스와 같은 비디오 프레임의 임의의 독립적으로 디코딩 가능한 단위, 시퀀스라고도 칭해지는 픽쳐들의 그룹 (GOP), 또는 적용가능한 코딩 기술들에 따라 정의된 다른 독립적으로 디코딩 가능한 단위를 지칭할 수도 있다.

잔차 데이터 및 예측 데이터를 생성하는 인트라 예측 또는 인터 예측 코딩에 후속하여, 그리고 변환 계수들을 생성하는 임의의 변환들 (예컨대 H.264/AVC에서 사용된 4x4 또는 8x8 정수 변환 또는 이산 코사인 변환 (DCT)) 에 후속하여, 변환 계수들의 양자화가 수행될 수도 있다. 양자화는, 계수들을 표현하기 위해 사용되는 데이터의 양을 최대한 줄이기 위해 변환 계수들이 양자화되는 프로세스를 일반적으로 지칭한다. 양자화 프로세스는 계수들의 일부 또는 전부와 관련된 비트 깊이를 감소시킬 수도 있다. 예를 들면, n-비트 값은 양자화 동안 m-비트 값으로 내림 (round down) 될 수도 있는데, 여기서 n은 m보다 더 크다.

양자화에 후속하여, 양자화된 데이터의 엔트로피 코딩이, 예를 들면, 콘텍스트 적응 가변 길이 코딩 (context adaptive variable length coding; CAVLC), 콘텍스트 적응 이진 산술 코딩 (context adaptive binary arithmetic coding; CABAC), 확률 인터벌 구획화 엔트로피 (probability interval partitioning entropy; PIPE) 코딩, 또는 다른 엔트로피 코딩 방법에 따라 수행될 수도 있다. 구문 엘리먼트들, 예컨대 예측 모드를 정의하는 구문 엘리먼트의 엔트로피 코딩이 또한 수행될 수도 있다. 엔트로피 코딩을 위해 구성된 프로세싱 유닛, 또는 다른 프로세싱 유닛은, 코딩된 블록 패턴 (coded block pattern; CBP) 값들, 매크로 타입, 코딩 모드, 코딩된 단위 (예컨대 프레임, 슬라이스, 매크로블록, 또는 시퀀스) 에 대한 최대 매크로블록 사이즈와 같은 구문 정보의 생성 및/또는 양자화된 계수들의 제로 런렝쓰 코딩과 같은 다른 프로세싱 기능들을 수행할 수도 있다.

HEVC는 비디오 데이터의 블록을 코딩 단위 (coding unit; CU) 라고 지칭한다. 일반적으로 본 개시의 기술들은 CU의 데이터를 변환하고, 양자화하고, 스캐닝하고, 그리고 엔트로피 인코딩하는 것에 관련된다. CU는 하나 이상의 예측 단위들 (PU들) 및/또는 하나 이상의 변환 단위들 (TU들) 을 포함할 수도 있다. PU들은 "예측 구획들"로 또한 칭해질 수도 있다. 비트스트림 내의 구문 데이터는 최대 코딩 단위 (LCU) 를 정의할 수도 있는데, 이것은 픽셀들의 수의 관점에서 최대 코딩 단위이다. 일반적으로, LCU는 H.264의 매크로블록과 유사한 목적을 갖는다. 그러나, LCU는 특정 사이즈로 반드시 제한되지 않으며, 하나 이상의 CU들을 포함할 수도 있다. LCU는 통상적으로 64x64 픽셀들을 포함한다. LCU 내의 CU들은, 통상적으로, 32x32, 16x16, 또는 8x8 픽셀들을 포함한다. 따라서, LCU는 서브 CU들로 분할될 수도 있고, 각각의 서브 CU는 서브 CU들로 더 분할될 수도 있다. CU에서의 각각의 픽셀은 루마 (Y) 컴포넌트, 크로마 U (U) 컴포넌트, 크로마 V (V) 컴포넌트를 포함할 수도 있다. 어떤 예들에서, 크로마 컴포넌트들은 Cr 및 Cb 컴포넌트들로서 칭해질 수도 있다. 일반적으로, 본 개시에서 CU에 대한 언급들은 픽쳐의 최대 코딩 단위 (LCU) 또는 LCU의 서브 CU를 지칭할 수도 있다. 비트스트림에 대한 구문 데이터는 LCU가 분할될 수도 있는 최대 횟수 (CU 깊이라고 칭해진다) 를 정의할 수도 있다. 따라서, 구문 데이터는 최소 코딩 단위 (smallest coding unit; SCU) 를 또한 정의할 수도 있다. 본 개시는 CU, PU, 또는 TU의 임의의 것을 지칭하기 위해 용어 "블록"을 또한 사용한다.

LCU는 쿼드트리 데이터 구조와 관련될 수도 있다. 일반적으로, 쿼드트리 데이터 구조는 CU당 하나의 노드를 포함하는데, 여기서 루트 노드는 LCU에 대응한다. CU가 4개의 서브 CU들로 분할되면, 그 CU에 대응하는 노드는 4개의 리프 노드들을 포함하고, 그 각각은 서브 CU들의 하나에 대응한다. 쿼드트리 데이터 구조의 각 노드는 대응하는 CU에 대해 구문 데이터를 제공할 수도 있다. 예를 들면, 쿼드트리에서의 노드는, 그 노드에 대응하는 CU가 서브 CU들로 분할되는지의 여부를 나타내는 분할 플래그를 포함할 수도 있다. CU에 대한 구문 엘리먼트들은 재귀적으로 정의될 수도 있고, CU가 서브 CU들로 분할되는지에 의존할 수도 있다. CU가 더 분할되지 않으면, 그것은 리프 CU로서 칭해진다. 본 개시에서, 리프 CU의 4개의 서브 CU들은, 원래의 리프 CU의 명백한 분할이 없지만 리프 CU들로서 또한 칭해질 것이다. 예를 들면, 16x16 사이즈에서 CU가 더 이상 분할되지 않으면, 4개의 8x8 서브 CU들은, 16x16 CU가 분할되지 않았지만, 리프 CU들로서 또한 칭해질 것이다.

또한, 리프 CU들의 TU들은 각각의 쿼드트리 데이터 구조들과 또한 관련될 수도 있다. 즉, 리프 CU는 리프 CU가 TU들로 어떻게 구획되는지를 나타내는 쿼드트리를 포함할 수도 있다. 본 개시는 LCU가 어떻게 구획되는지를 나타내는 쿼드트리를 CU 쿼드트리로 칭하고 리프 CU가 어떻게 TU들로 구획되는지를 나타내는 쿼드트리를 TU 쿼드트리로 칭한다. TU 쿼드트리의 루트 노드는 일반적으로 리프 CU에 대응하지만, CU 쿼드트리의 루트 노드는 일반적으로 LCU에 대응한다. 분할되지 않은 TU 쿼드트리의 TU들은 리프 TU들로서 칭해진다.

리프 CU는 하나 이상의 예측 단위들 (PU들) 을 포함할 수도 있다. 일반적으로, PU는 대응하는 CU의 전체 또는 일부를 나타내며, PU에 대한 참조 샘플을 취출하는 데이터를 포함한다. 예를 들면, PU가 인터 모드 인코딩되면, PU는 PU에 대한 모션 벡터를 정의하는 데이터를 포함할 수도 있다. 모션 벡터를 정의하는 데이터는, 예를 들면, 모션 벡터의 수평 성분, 모션 벡터의 수직 성분, 모션 벡터의 해상도 (예를 들면, 1/4 픽셀 정밀도 또는 1/8 픽셀 정밀도), 모션 벡터에 대한 참조 픽쳐 리스트 (예를 들면, 리스트 0 또는 리스트 1) 를 식별하는 예측 방향, 및/또는 모션 벡터가 가리키는 참조 픽쳐 리스트 내의 참조 프레임을 나타내는 참조 화상 인덱스 값을 설명할 수도 있다. 유사한 방식으로, CU가 인트라 예측 모드에서 코딩되면, PU는 인트라 예측 모드를 정의하는 데이터 (예를 들면, 각도 예측, DC 예측, 또는 평면 예측 (Planar prediction),..., 등등) 를 포함할 수도 있다.

PU(들) 을 정의하는 리프 CU에 대한 데이터는, 예를 들면, CU의 하나 이상의 PU들로의 구획화를 또한 설명할 수도 있다. CU의 하나 이상의 PU들로의 구획화는 구획화 모드로서 칭해질 수도 있다. CU에 대해 이용가능한 구획화 모드들은, CU가 코딩되지 않는지, 인트라 예측 모드 인코딩되는지, 또는 인터 예측 모드 인코딩되는지의 여부에 따라 상이할 수도 있다. 인트라 코딩에 대해, PU는 하기에 설명되는 리프 변환 단위와 동일한 것으로 취급될 수도 있다.

리프 CU는 하나 이상의 변환 단위들 (TU들) 을 포함할 수도 있다. 일반적으로, 다르게 지시되지 않는 한, 본 개시는 리프 CU 및 리프 TU를 각각 지칭하기 위해 용어들 CU 및 TU를 사용한다. 변환 단위들은, 위에서 논의된 바와 같이, TU 쿼드트리 구조를 사용하여 특정될 수도 있다. 즉, 리프 CU가 4개의 변환 단위들로 분할되는지의 여부를 분할 플래그가 나타낼 수도 있다. 그 다음, 각각의 변환 단위는 4개의 서브 TU들로 더 분할될 수도 있다. TU가 더 이상 분할되지 않으면, 그것은 리프 TU로 칭해질 수도 있다. 일반적으로, 분할 플래그는, 리프 TU가 정사각형 형상의 TU들로 분할되는 것을 나타낼 수도 있다. TU가 비정사각형 형상의 TU들로 분할되는 것을 나타내기 위해, 다른 구문 데이터, 예를 들면, TU들이 NSQT에 따라 구획될 것이라는 것을 나타내는 구문 데이터가 포함될 수도 있다.

일반적으로, 인트라 코딩에 대해, 리프 CU에 속하는 모든 리프 TU들은 동일한 인트라 예측 모드를 공유할 수도 있다. 즉, 리프 CU의 모든 TU들에 대한 예측된 값들을 계산하기 위해 동일한 인트라 예측 모드가 일반적으로 적용된다. 인트라 코딩에 대해, 비디오 인코더는, TU에 대응하는 예측 값들의 일부와 원래의 블록 사이의 차이로서, 인트라 예측 모드를 사용하여 각각의 리프 TU에 대한 잔차 값을 계산할 수도 있다. 잔차 값은, 위에서 설명된 바와 같이, 변환되고, 양자화되고, 그리고 스캔될 수도 있다. 인터 코딩에 대해, 비디오 인코더는 PU 레벨에서 예측을 수행할 수도 있고 각 PU에 대한 잔차를 계산할 수도 있다. 리프 CU에 대응하는 잔차 값들은 변환되고, 양자화되고, 그리고 스캔될 수도 있다. 인터 코딩에 대해, 리프 TU는 PU보다 더 크거나 더 작을 수도 있다. 인트라 코딩에 대해, PU는 대응하는 리프 TU와 함께 배치될 수도 있다. 몇몇 예들에서, 리프 TU의 최대 사이즈는 대응하는 리프 CU의 사이즈일 수도 있다.

HEVC에서, CU에 대한 예측 블록을 생성하기 위해 사용된 인트라 예측 모드들의 수는 PU 구조에 의해 결정된다. INTRA_2Nx2N의 PU 구조는, CU가 하나의 PU만을 포함한다는 것을 나타낸다. INTRA_NxN의 PU 구조는, CU가 4개의 PU들을 포함한다는 것을 나타낸다. 또한, CU 내의 각각의 PU는 하나의 루마 인트라 예측 모드를 구비할 수도 있고 CU 내의 PU들은 하나의 크로마 예측 모드를 공유할 수도 있다. 예를 들면, INTRA_2Nx2N PU 구조를 갖는 CU는 하나의 루마 인트라 예측 모드와 하나의 크로마 인트라 예측 모드를 구비할 수도 있다. 또한, INTRA_NxN PU 구조를 갖는 CU는 4개 (즉, 각각의 PU에 대해 하나) 의 루마 인트라 예측 모드들과 전체 CU에 대해 하나 (즉, 4개의 PU들이 하나의 크로마 예측 모드를 공유한다) 의 크로마 인트라 예측 모드를 구비할 수도 있다. 구문 엘리먼트들은 인트라 예측 모드들을 시그널링하기 위해 생성될 수도 있다.

도 1은 예측 단위 구조들 및 관련 인트라 예측 코딩 모드들의 예들을 예시하는 개념도이다. 도 1에 예시된 바와 같이, INTRA_2Nx2N 예측 단위 (PU) 구조는 하나의 PU만을 포함하고 INTRA_NxN PU 구조는 4개의 PU들을 포함한다. 도 1에 예시된 바와 같이, INTRA_NxN PU 구조는 대칭적이고 동일한 사이즈의 4개의 정사각형의 PU들을 포함한다. 위에서 설명된 바와 같이, 도 1에 예시된 4개의 PU들 각각은 루마 인트라 예측을 구비하고 크로마 인트라 예측을 공유할 수도 있다. HEVC가 인터 모드 예측들과 함께 사용하기 위한 다른 PU 구조들을 정의한다는 것을 주목해야 한다. 이들 PU들 중 일부는 비대칭이고 및/또는 직사각형 PU들을 포함한다. 본 개시의 기술들이 INTRA_2Nx2N PU 및 INTRA_NxN PU 구조들에 관해 설명되었지만, 일반적으로, 그 기술들은, 인트라 예측 모드들과 함께 사용될 수도 있는 추가적인 PU 구조들에 적용가능하다. 예를 들면, 본 개시의 기술들은, 4개의 직사각형 PU들의 PU 구조가 인트라 예측 코딩 모드와 관련되는 경우에 적용가능하다.

위에서 설명된 바와 같이, CU가 인트라 예측 모드를 사용하여 코딩되는 경우, 구문 엘리먼트들은 인트라 예측 모드들을 시그널링하기 위해 사용될 수도 있다. 몇몇 예들에서, PU에 대한 루마 인트라 예측 모드를 시그널링하기 위해 3개의 구문 엘리먼트들이 사용되고 크로마 인트라 예측 모드를 시그널링하기 위해 하나의 구문 엘리먼트가 사용된다. 구문 엘리먼트들은 표 1에서 볼드체로 도시된다.

구문 엘리먼트들 (prev_intra_luma_pred_flag[x0][y0], mpm_idx[x0][y0] 및 rem_intra_luma_pred_mode[x0][y0]) 은 루마 샘플들에 대한 인트라 예측 모드를 명시한다. 어레이 인덱스들 x0, y0는 픽쳐의 좌상 루마 샘플에 대한 예측 블록의 좌상 루마 샘플의 위치를 명시한다. 구문 엘리먼트 prev_intra_luma_pred_flag[x0][y0]는 참 또는 거짓 상태를 나타내고 1 또는 0의 값을 가질 수도 있다. 일 예에서, prev_intra_luma_pred_flag[x0][y0]가 1과 동일한 경우, 현재 PU에 대한 인트라 예측 모드는 이웃하는 인트라 예측된 PU로부터 추론된다.

예를 들면, 표 1에서 나타내어진 바와 같이, prev_intra_luma_pred_flag[x0][y0]이 1과 동일하면, 비디오 인코더는 인코딩된 비트스트림에서 시그널링되고 비디오 디코더는 인코딩된 비트스트림으로부터 mpm_idx[x0][y0] 구문 엘리먼트를 수신한다. mpm_idx[x0][y0]는 가장 가능성이 높은 모드들 (most probable modes; mpm) 의 리스트로의 인덱스이다. 예를 들면, 비디오 인코더와 비디오 디코더는 각각 가장 가능성이 높은 모드들의 리스트를 구성하도록 구성될 수도 있다. 가장 가능성이 높은 모드들의 리스트는 인트라 예측 모드들을 식별한다.

비디오 디코더는 가장 가능성이 높은 모드들의 리스트를 암시적으로 (즉, 가장 가능성이 높은 모드들의 리스트에 어떤 인트라 예측 모드들이 포함될 것인지를 나타내는 시그널링을 비디오 인코더로부터 수신하지 않으면서) 구성할 수도 있거나 비디오 인코더로부터의 수신된 시그널링에 기초하여 가장 가능성이 높은 모드들의 리스트를 구성할 수도 있다. 어느 예에서건, 비디오 인코더측에 대한 가장 가능성이 높은 모드들의 리스트 및 비디오 디코더측에 대한 가장 가능성이 높은 모드들의 리스트는 동일한 인트라 예측 모드들을 동일한 순서에서 식별할 수도 있다. 몇몇 예들에서, 비디오 인코더와 비디오 디코더는 CU의 각각의 인트라 예측된 PU에 대해 가장 가능성이 높은 모드들의 리스트를 구성할 수도 있고, CU의 2개 이상의 PU들에 대한 가장 가능성이 높은 모드들의 리스트는 상이할 수도 있다 (즉, CU의 PU들에 대한 가장 가능성이 높은 모드들의 각각의 리스트들이 존재할 수도 있다). 그러나, 본 개시에서 설명된 기술들은 그렇게 제한되지 않는다.

비디오 인코더와 비디오 디코더가 가장 가능성이 높은 모드들의 리스트를 구성할 수도 있는 다양한 방식들이 존재할 수도 있다. 일 예로서, 비디오 인코더와 비디오 디코더는, 가장 가능성이 높은 모드들의 리스트에서 인트라 예측 모드들의 고정된 수를 식별하도록 (즉, 3개의 인트라 예측 모드들을 식별하도록) 구성된다. 비디오 인코더와 비디오 디코더는, 현재의 PU (예를 들면, 인트라 예측되고 있는 PU) 와 이웃하는 제 1의 이웃 PU의 인트라 예측 모드 및 현재 PU와 이웃하는 제 2의 이웃 PU를 평가한다. 제 1 및 제 2의 이웃 PU들의 예들은, 좌, 좌상, 우, 하, 및 일반적으로 임의의 이웃 PU를 포함한다.

비디오 인코더와 비디오 디코더는 가장 가능성이 높은 모드들의 리스트에 제 1 및 제 2의 이웃 PU들의 인트라 예측 모드들을 포함한다. 제 1 및 제 2의 이웃 PU들 중 하나 또는 둘 다가 인트라 예측되지 않으면, 비디오 인코더 또는 비디오 디코더는, 제 1 및 제 2의 이웃 PU들에 대한 가장 가능성이 높은 모드들의 리스트 내의 대응하는 위치들에서의 가장 가능성이 높은 모드들의 리스트에서, 일 예로서, DC 인트라 예측 모드를 식별할 수도 있다.

인트라 예측 모드들의 리스트에서 제 3의 인트라 예측 모드를 결정하기 위해, 비디오 인코더와 비디오 디코더는, 제 1 및 제 2의 이웃 PU들에 대한 인트라 예측 모드들이 동일한지의 여부 (인트라 예측되지 않았다면 DC 인트라 예측 모드가 선택되었는지의 여부를 포함함) 를 결정할 수도 있다. 제 1 및 제 2의 이웃 PU들에 대한 인트라 예측 모드들이 동일하면, 비디오 인코더와 비디오 디코더는, 인트라 예측 모드들에서 제 3의 인트라 예측 모드를 식별하기 위한 제 1의 기술을 구현할 수도 있다. 동일한 예들에서, 제 1 및 제 2의 이웃 PU들에 대한 인트라 예측 모드들이 동일하면, 비디오 인코더와 비디오 디코더는 가장 가능성이 높은 모드들의 리스트에서 인트라 예측 모드들 중 하나를 식별할 수도 있고 제 1의 기술 (또는 제 1의 기술 이외의 다른 기술) 을 사용하여 가장 가능성이 높은 모드들의 리스트에서 제 2 및 제 3의 인트라 예측 모드들을 식별할 수도 있다. 제 1 및 제 2의 이웃 PU들에 대한 인트라 예측 모드들이 상이하면, 비디오 인코더와 비디오 디코더는 제 3의 인트라 예측 모드를 식별하기 위한 제 2의 기술을 구현할 수도 있다.

제 3의 인트라 예측 모드를 식별하기 위한 제 1 및 제 2의 기술들의 다양한 예들이 존재할 수도 있으며, 본 개시에서 설명된 기술은 임의의 하나의 특정 기술에 제한되지 않는다. 몇몇 예들에서, 제 1 또는 제 2의 기술 중 하나에 기초한 제 3의 인트라 예측 모드는 반드시 이웃 PU의 인트라 예측 모드일 필요는 없다. 몇몇 예들에서, 제 1 또는 제 2의 기술 중 하나에 기초한 제 3의 인트라 예측 모드는 이웃 PU의 인트라 예측 모드에 기초할 수도 있다.

mpm_idx[x0][y0]는, 비디오 인코더가 시그널링하고 비디오 디코더가 수신하는 가장 가능성이 높은 모드들의 리스트로의 인덱스이다. 이 예에서, mpm_idx[x0][y0] 값으로부터, 비디오 디코더는 현재 PU에 대한 인트라 예측 모드를 결정하도록 구성될 수도 있다. 몇몇 예들에서, 가장 가능성이 높은 모드들의 리스트가 이웃 PU들 (예를 들면, 제 1 및 제 2의 이웃 PU들) 의 인트라 예측 모드들에 기초하기 때문에, mpm_idx[x0][y0] 구문 엘리먼트는, 몇몇 경우들에서, 현재 PU에 대한 인트라 예측 모드를 추론하기 위해 사용될 특정 이웃 PU를 식별하는 데 사용될 수도 있다. 예를 들면, 일 예로서, mpm_idx[x0][y0]가, 제 1의 이웃 PU와 관련된 인트라 예측 모드를 식별하는, 가장 가능성이 높은 모드들의 리스트로의 인덱스이면, 비디오 디코더는, 현재 PU의 인트라 예측 모드가 추론될 PU로서 제 1의 이웃 PU를 식별하는 것으로 간주될 수도 있다.

예를 들면, 도 1을 참조하면, PU1에 대한 인트라 예측 모드는 INTRA_NxN 예에 대한 PU0에 대한 인트라 예측 모드와 동일할 수도 있다. 구문 엘리먼트 mpm_idx[x0][y0]는, 이웃하는 인트라 예측된 PU들의 한 세트 내의 어떤 이웃 PU로부터 현재 PU가 인트라 예측 모드를 추론할 수도 있는지를 나타낼 수도 있다. 이 예에서, prev_intra_luma_pred_flag[x0][y0]이 0과 동일하면, 인트라 예측 모드는 이웃 PU로부터 추론되지 않고, 구문 엘리먼트 rem_intra_luma_pred_mode[x0][y0]에 의해 나타내어진다.

rem_intra_luma_pred_mode[x0][y0] 구문 엘리먼트는, 현재 PU에 대한 특정 인트라 예측 모드를 명시할 수도 있다. 몇몇 예들에서, rem_intra_luma_pred_mode[x0][y0] 구문 엘리먼트는, 가장 가능성이 높은 모드들의 리스트에 의해 식별된 인트라 예측 모드들에 포함되지 않은, 현재 PU에 대한 인트라 예측 모드를 명시할 수도 있다. 예를 들면, rem_intra_luma_pred_mode[x0][y0] 구문 엘리먼트는, 가장 가능성이 높은 모드들의 리스트에서 식별된 인트라 예측 모드들이 배제될 때 모든 가능한 인트라 예측 모드들 중에서 나머지 인트라 예측 모드를 식별한다. 그러나, 본 개시의 기술들은 그렇게 제한되지 않는다.

구문 엘리먼트 intra_chroma_pred_mode[x0][y0]은 CU의 크로마 샘플들에 대한 인트라 예측 모드를 명시한다. 크로마 인트라 예측은 루마 인트라 예측 모드에 기초할 수도 있다. 구문 엘리먼트 chroma_pred_from_luma_enabled_flag는, 크로마에 대한 인트라 예측이 루마에 대한 인트라 예측 모드에 기초하는지의 여부를 나타낼 수도 있다.

HEVC WD6에서, 가능한 인트라 예측 모드들은, 평면 예측 모드 (predMode = 0), DC 예측 (predMode = 1), 33개의 각도 예측 모드들 (predMode = 2,, 34), 루마 예측 모드로부터 인트라 예측 모드를 추론하는 크로마 컴포넌트에 대한 예측 모드 (predMode = 35) 를 포함한다. 따라서, 루마 컴포넌트에 대해, prev_intra_luma_pred_flag의 값에 따라, mpm_idx 구문 엘리먼트는 가장 가능성이 높은 모드들의 리스트로의 인덱스를 나타낼 수도 있거나 (여기서 가장 가능성이 높은 모드들의 리스트의 각각의 엔트리는 35개의 가능한 인트라 예측 모드들 중 하나를 식별함), 또는 rem_intra_luma_pred_mode는 35개 (몇몇 예들에서는, 가장 가능성이 높은 모드들의 리스트에서 식별된 그 인트라 예측 모드들을 제외함) 의 가능한 인트라 예측 모드들 중 하나를 나타낼 수도 있다. 일 예에서, 구문 엘리먼트 rem_intra_luma_pred_mode는 0 내지 31의 정수 값을 가질 수도 있고 고정된 길이의 이진 코딩법을 사용하여 코딩될 수도 있으며 구문 엘리먼트 mpm_idx는 (예를 들면, 가장 가능성이 높은 모드들의 리스트에서 3개의 엔트리들 중 하나를 식별하기 위해) 0 내지 2의 정수값을 가질 수도 있고 잘려진 1진 코딩법 (truncated unary coding method) 을 사용하여 코딩될 수도 있다. 또한, 크로마 컴포넌트들에 대해 intra_chroma_pred_mode 및 하나 이상의 다른 구문 엘리먼트들은 36개의 가능한 인트라 예측 모드들 중 하나를 나타낼 수도 있다. 일 예에서, 구문 엘리먼트 intra_chroma_pred_mode는 0 내지 5의 정수 값을 가질 수도 있다. 구문 엘리먼트들 (mpm_idx, rem_intra_luma_pred_mode, 및 intra_chroma_pred_mode) 의 각각이 특정 인트라 예측 모드들을 어떻게 식별하는지의 더 상세한 설명은 HEVC WD6에서 제공되며 간략화를 위해 본원에선 생략한다. 그러나, 본원에서 설명된 기술들은, 일반적으로, 구문 엘리먼트들 (mpm_idx, rem_intra_luma_pred_mode, 및 intra_chroma_pred_mode) 의 예상되는 변형들에 적용될 수도 있음을 주목해야 한다.

위에서 설명된 바와 같이, 비디오 코딩 표준은 CABAC 기술에 따라 구문 엘리먼트들을 엔트로피 코딩할 수도 있다. 구문 엘리먼트에 CABAC 코딩을 적용하기 위해, 비디오 코더는 구문 엘리먼트에 대해 이진화를 수행할 수도 있다. 이진화는 구문 값을 일련의 하나 이상의 비트들로 변환하는 프로세스를 지칭한다. 이들 비트들은 "빈들"로 칭해질 수도 있다. 이진화는 무손실 프로세스이며 다음의 기술들 중 하나 또는 그들의 조합을 포함할 수도 있다: 고정 길이 코딩, 1진 코딩, 잘려진 1진 코딩, 잘려진 라이스 코딩 (truncated Rice coding), 골롬 코딩 (Golomb coding), 지수 골롬 코딩, 및 골롬-라이스 코딩. 예를 들면, 이진화는 5의 정수 값을 8비트의 고정 길이 기술을 사용하여 00000101로서 또는 1진 코딩 기술을 사용하여 11110으로서 나타내는 것을 포함할 수도 있다.

이진화 이후, 비디오 코더는 코딩 콘텍스트를 식별할 수도 있다. 코딩 콘텍스트는 특정 값들을 갖는 코딩 빈들의 확률들을 식별할 수도 있다. 예를 들면, 코딩 콘텍스트는 0의 값을 갖는 빈을 코딩하는 0.7 확률 및 1의 값을 갖는 빈을 코딩하는 0.3 확률을 나타낼 수도 있다. 코딩 콘텍스트를 식별한 이후, 비디오 코더는 그 빈을 콘텍스트에 기초하여 산술적으로 코딩할 수도 있다. 정규 CABAC 코딩을 사용하여 코딩된 빈들은 "CABAC 빈들"로 칭해질 수도 있다.

또한, 모든 구문 엘리먼트 빈들에 대해 정규 CABAC 인코딩을 수행하는 대신, 비디오 코더는 몇몇 구문 엘리먼트 빈들을 바이패스 CABAC 코딩을 사용하여 코딩할 수도 있다. 바이패스 코딩은, 적응 콘텍스트를 사용하지 않으면서 빈을 산술적으로 인코딩하는 프로세스를 지칭한다. 즉, 바이패스 코딩 엔진은 콘텍스트들을 선택하지 않고 양 심볼들 (0 및 1) 에 대해 0.5의 확률을 가정할 수도 있다. 바이패스 코딩이 CABAC 코딩만큼 대역폭 효율적이지 않을 수도 있지만, 빈에 대해 정규 CABAC 코딩을 수행하는 것보다는 빈에 대해 바이패스 코딩을 수행하는 것이 계산적으로 비용이 덜 들 수도 있다. 또한, 바이패스 코딩을 수행하는 것은 더 높은 정도의 병렬화 및 스루풋을 허용할 수도 있다. 바이패스 코딩을 사용하여 코딩된 빈들은 "바이패스 빈들"로 칭해질 수도 있다.

CABAC 코더가 구현되면 그것은 정규 CABAC 코딩을 수행하기 위한 정규 코딩 엔진과 바이패스 코딩을 수행하기 위한 바이패스 코딩 엔진을 포함할 수도 있다. 빈이 CABAC 코딩되면, 이 빈을 코딩하기 위해 정규 CABAC 인코딩 엔진이 사용된다. 정규 CABAC 인코딩 엔진은 단일 빈을 코딩하는 데 2개 보다 많은 프로세싱 싸이클들을 필요로 할 수도 있다. 그러나, 적절한 파이프라인 설계를 통해, 정규 CABAC 인코딩 엔진은 n개의 빈들을 인코딩하는 데 n+M개의 싸이클들만을 필요로 할 수도 있는데, 여기서 M은 파이프라인을 개시하기 위한 오버헤드이다. M은 보통 0보다 더 크다.

CABAC 코딩 프로세스의 개시시 (즉, 모든 (every) 스위치가 바이패스 모드에서 정규로 됨), 파이프라인 오버헤드가 도입된다. 빈이 바이패스 코딩되면, 이 빈을 코딩하기 위해 바이패스 인코딩 엔진이 사용된다. 바이패스 코딩 엔진은 n비트 구문 엘리먼트를 코딩하는 데 한 싸이클만을 필요로 할 것으로 예상될 수도 있는데, 여기서 n은 1보다 더 클 수도 있다. 따라서, 바이패스 빈들 및 CABAC 빈들의 세트를 코딩하기 위한 싸이클들의 전체 수는, 그 세트 내의 모든 바이패스 빈들이 함께 코딩되고 그 세트 내의 모든 CABAC 빈들이 함께 코딩되면 감소될 수도 있다. 특히, CABAC 코딩으로 전이하기 이전 또는 이후에 바이패스 빈들을 함께 코딩하는 것은, CABAC 코딩 엔진을 재시작하는 데 필요한 오버헤드를 절약할 수 있다.

위에서 설명된 바와 같이, INTRA_NxN PU 구조를 갖는 CU는 4개의 루마 인트라 예측 모드들과 그에 따라 구문 엘리먼트들 (prev_intra_luma_pred_flag, mpm_idx 및 rem_intra_luma_pred_mode) 의 4개의 세트들을 구비할 수도 있다. 이들 3개의 구문 엘리먼트들 중에서, 일 예에서, prev_intra_luma_pred_flag만이 CABAC 코딩되고 mpm_idx 및 rem_intra_luma_pred_mode 양자는 바이패스 코딩된다. 다시, 바이패스 코딩은 비-CABAC 프로세스에 의한, 즉, CABAC 엔진 외부의 빈들의 코딩을 지칭할 수도 있다. 바이패스 코딩에서 사용될 수도 있는 비-CABAC 코딩의 예들은, 골롬 코딩, 지수 골롬 코딩, 및 골롬-라이스 코딩을 포함한다.

위에서 설명된 바와 같이, INTRA_NxN PU 구조를 갖는 CU는, 모든 4개의 PU들에 대해 사용되는 하나의 크로마 인트라 예측 모드를 구비할 수도 있다. 크로마 인트라 예측 모드는 루마 인트라 예측 모드들에 기초할 수도 있다. 표 2는 일 예로서 구문 엘리먼트 intra_chroma_pred_mode에 대한 이진화를 도시한다. 이진화는 intra_chroma_pred_mode의 대응하는 값을 나타내기 위한 하나 이상의 빈들로 나타나게 된다. 이 예에서, 밑줄이 그어진 빈들은 CABAC 코딩되고 나머지 빈들은 바이패스 코딩된다. 표 2에 예시된 바와 같이, 특정 빈이 CABAC 코딩되는지 또는 바이패스 코딩되는지의 여부 및 intra_chroma_pred_mode의 이진화는 chroma_pred_from_luma_enable_flag의 값에 기초한다. 따라서, 특정 빈이 CABAC 코딩되는지 또는 바이패스 코딩되는지의 여부 및 구문 엘리먼트의 이진화는 다른 구문 엘리먼트 (예를 들면, chroma_pred_from_luma_enable_flag) 의 값에 기초할 수도 있다.

하기의 표 3 및 표 4는, 몇몇 예들에서의 CU에 대한 루마 및 크로마 예측 모드들을 식별하는 구문 엘리먼트들에 대한 코딩 구조들을 나타낸다. 표 3은 INTRA_2Nx2N PU 구조에 대한 구문 엘리먼트들의 코딩을 예시하고 표 4는 INTRA_NxN PU 구조의 코딩을 예시한다. 표 3 및 표 4에서, 구문 엘리먼트 intra_chroma_pred_mode는 구문 엘리먼트들 (chroma_mode_cabac_bins 및 chroma_mode_bypass_bins) 로서 표현되는데, 표 2에서 제공된 바와 같이, chroma_mode_cabac_bins은 CABAC 코딩된 빈들을 나타내고 chroma_mode_bypass_bins은 바이패스 코딩된 빈들을 나타낸다. 표 3 및 표 4는, 구문 엘리먼트들이 CABAC 모드를 사용하여 코딩되는지 또는 바이패스 모드를 사용하여 코딩되는지의 여부를 식별한다. 구문 엘리먼트들은 CABAC 코딩 엔진으로 출력되고 그들이 표 3 및 표 4에서 제시되는 순서로 통상적으로 엔트로피 코딩된다. 또한, 표 4에서 예시된 바와 같이, prev_intra_luma_pred_flag, mpm_idx 및 rem_intra_luma_pred_mode의 4개의 세트들이 존재하는데, 각각은 PU들의 4개 모두에 의해 공유되는 하나의 크로마 모드 표시, 및 4개의 PU들 중 하나에 대응한다.

표 3 및 표 4에 예시된 바와 같이, CABAC 코딩된 구문 엘리먼트들은, 바이패스 코딩된 구문 엘리먼트들과 함께 인터리빙되며, 이것은, 위에서 설명된 바와 같이, 예를 들면, CABAC 코딩 엔진을 재시작함에 있어서의 셋업 오버헤드로 인해, 표 3 및 표 4에서의 구문 엘리먼트들 모두를 엔트로피 인코딩하는 데 필요한 싸이클들의 전체 수를 증가시킬 수도 있다. 표 4에 예시된 바와 같이, CU가 다수의 PU들을 포함하면 문제는 배가된다. 인트라 예측 모드들을 식별하는 구문 엘리먼트들을 인코딩하는 데 필요한 싸이클들의 전체 수와 전체 파이프라인 오버헤드를 줄이기 위해, 코딩 순서에 대한 어떤 조정이 본 개시에 따라 이루어질 수도 있다.

도 2는 본 개시에 따른 기술들을 활용하도록 구성될 수도 있는 예시적인 비디오 인코딩 및 디코딩 시스템을 예시하는 블록도이다. 도 2에 도시된 바와 같이, 시스템 (10) 은 인코딩된 비디오 데이터를 시그널링하는 소스 디바이스 (12) 를 포함한다. 몇몇 예들에서, 소스 디바이스 (12) 는 인코딩된 비디오 데이터를 통신 채널 (16) 을 통해 목적지 디바이스 (14) 로 시그널링할 수도 있다. 소스 디바이스 (12) 및 목적지 디바이스 (14) 는 임의의 아주 다양한 범위의 디바이스들을 포함할 수도 있다. 몇몇 경우들에서, 소스 디바이스 (12) 와 목적지 디바이스 (14) 는 무선 통신 디바이스들, 예컨대 무선 핸드셋들, 소위 셀룰러 또는 위성 무선전화기들, 또는 통신 채널 (16) 을 통해 비디오 정보를 통신할 수 있는 (이 경우, 통신 채널 (16) 은 무선이다) 임의의 무선 디바이스들을 포함할 수도 있다. 본 개시의 기술들은 무선 어플리케이션들 또는 설정들에 반드시 제한되는 것은 아니다. 예를 들면, 이들 기술들은 지상파 (over-the-air) 텔레비젼 브로드캐스트들, 케이블 텔레비젼 송신들, 위성 텔레비젼 송신들, 인터넷 비디오 송신들, 스토리지 매체 상에 인코딩되는 인코딩된 디지털 비디오, 또는 다른 시나리오들에 적용될 수도 있다. 따라서, 통신 채널 (16) 은, 목적지 디바이스 (14) 에 의한 후속 취출을 위해, 인코딩된 비디오 데이터를 송신 또는 저장하는 데 적합한 무선, 유선, 또는 저장 매체들의 임의의 조합을 포함할 수도 있다.

도 2의 예에서, 소스 디바이스 (12) 는 비디오 소스 (18), 비디오 인코더 (20), 변조기/복조기 (모뎀; 22) 및 송신기 (24) 를 포함할 수도 있다. 목적지 디바이스 (14) 는 수신기 (26), 모뎀 (28), 비디오 디코더 (30), 및 디스플레이 디바이스 (32) 를 포함한다. 본 개시에 따르면, 소스 디바이스 (12) 의 비디오 인코더 (20) 는, 파이프라인 오버헤드를 줄이는 방식으로 엔트로피 인코딩하기 위한 기술들을 적용하도록 구성될 수도 있다. 다른 실시형태들에서, 소스 디바이스와 목적지 디바이스는 다른 컴포넌트들 또는 설비를 포함할 수도 있다. 예를 들면, 소스 디바이스 (12) 는 외부 비디오 소스 (18), 예컨대 외부 카메라로부터 비디오 데이터를 수신할 수도 있다. 마찬가지로, 목적지 디바이스 (14) 는, 통합된 디스플레이 디바이스를 포함하는 대신, 외부 디스플레이 디바이스와 접속할 수도 있다.

도 2의 예시된 시스템 (10) 은 단지 일 예에 불과하다. 파이프라인 오버헤드를 감소시키는 방식으로 플래그들의 세트 및 각 플래그에 대한 각각의 구문 엘리먼트를 엔트로피 인코딩하기 위한 기술들은, 임의의 디지털 비디오 인코딩 및/또는 디코딩 디바이스에 의해 수행될 수도 있다. 일반적으로, 본 개시의 기술들이 비디오 코딩 디바이스에 의해 수행되지만, 그 기술들은 통상적으로 "CODEC"으로서 칭해지는 비디오 인코더/디코더에 의해 또한 수행될 수도 있다. 또한, 본 개시의 기술들은 비디오 프리프로세서에 의해 또한 수행될 수도 있다. 소스 디바이스 (12) 와 목적지 디바이스 (12) 는, 소스 디바이스 (14) 가 목적지 디바이스 (14) 로의 송신을 위한 코딩된 비디오 데이터를 생성하는 이러한 코딩 디바이스들의 예들에 불과하다. 몇몇 예들에서, 디바이스들 (12, 12) 은, 디바이스들 (14, 14) 의 각각이 비디오 인코딩 및 디코딩 컴포넌트들을 포함하는 것과 실제 유사한 방식으로 동작할 수도 있다. 그러므로, 시스템 (10) 은, 예를 들면, 비디오 스트리밍, 비디오 플레이백, 비디오 브로드캐스팅, 또는 화상 전화를 위해, 비디오 디바이스들 (12, 14) 사이의 일방향 또는 양방향 비디오 송신을 지원할 수도 있다.

비디오 디바이스 (12) 의 비디오 소스 (18) 는 비디오 캡쳐 디바이스, 예컨대 비디오 카메라, 이전에 캡쳐된 비디오를 포함하는 비디오 아카이브, 및/또는 비디오 컨텐츠 공급자로부터의 비디오 피드를 포함할 수도 있다. 다른 대안으로서, 비디오 소스 (18) 는 소스 비디오로서 컴퓨터 그래픽 기반의 데이터, 또는 라이브 비디오, 아카이브화된 비디오, 및 컴퓨터에 의해 생성된 비디오의 조합을 생성할 수도 있다. 몇몇 경우들에서, 비디오 소스 (18) 가 비디오 카메라이면, 소스 디바이스 (12) 와 목적지 디바이스 (14) 는 소위 카메라 폰들 또는 비디오 폰들을 형성할 수도 있다. 그러나, 위에서 언급된 바와 같이, 본 개시에서 설명된 기술들은 일반적으로 비디오 코딩에 적용될 수 있으며, 무선 및/또는 유선 어플리케이션들에 적용될 수도 있다. 각각의 경우에서, 캡쳐된, 프리캡쳐된, 또는 컴퓨터에 의해 생성된 비디오는 비디오 인코더 (20) 에 의해 인코딩될 수도 있다. 그 다음, 인코딩된 비디오 정보는 통신 표준에 따라 모뎀 (22) 에 의해 변조되고, 송신기 (24) 를 통해 목적지 디바이스 (14) 로 송신될 수도 있다. 모뎀 (22) 은 여러 가지의 믹서들, 필터들, 증폭기들 또는 신호 변조를 위해 설계된 다른 컴포넌트들을 포함할 수도 있다. 송신기 (24) 는, 증폭기들, 필터들, 및 하나 이상의 안테나들을 포함하는, 데이터를 송신하기 위해 설계된 회로들을 포함할 수도 있다.

목적지 디바이스 (14) 의 수신기 (26) 는 채널 (16) 을 통해 정보를 수신하고, 모뎀 (28) 은 그 정보를 복조한다. 다시, 비디오 인코딩 프로세스는, 구문 엘리먼트들을 엔트로피 인코딩하기 위해 본원에서 설명된 기술들 중 하나 이상을 구현하여 파이프라인 오버헤드를 줄이게 된다. 채널 (16) 을 통해 통신된 정보는 비디오 인코더 (20) 에 의해 정의된 구문 정보를 포함할 수도 있는데, 이것은 비디오 디코더 (30) 에 의해 또한 사용되며, 매크로블록들 및 다른 코딩된 단위들, 예를 들면, GOP들 (groups of pictures) 의 프로세싱 및/또는 특성들을 설명하는 구문 엘리먼트들을 포함한다. 디스플레이 디바이스 (32) 는 디코딩된 비디오 데이터를 유저에게 디스플레이하고, 음극선관 (CRT), 액정 디스플레이 (liquid crystal display; LCD), 플라즈마 디스플레이, 유기 발광 다이오드 (organic light emitting diode; OLED) 디스플레이, 또는 다른 타입의 디스플레이 디바이스와 같은 다양한 디스플레이 디바이스들 중 임의의 것을 포함할 수도 있다.

도 2의 실시형태에서, 통신 채널 (16) 은 라디오 주파수 (radio frequency; RF) 스펙트럼 또는 하나 이상의 물리적 송신 라인들과 같은 임의의 무선 또는 유선 통신 매체, 또는 무선 및 유선 매체들의 임의의 조합을 포함할 수도 있다. 통신 채널 (16) 은 패킷 기반의 네트워크, 예컨대 근거리 통신망 (local area network), 광역 통신망 (wide-area network), 또는 인터넷과 같은 글로벌 네트워크의 일부를 형성할 수도 있다. 통신 채널 (16) 은, 일반적으로 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로 비디오 데이터를 송신하기 위한, 유선 또는 무선 매체들의 임의의 적절한 조합을 포함하는, 임의의 적절한 통신 매체, 또는 상이한 통신 매체들의 집합을 나타낸다. 통신 채널 (16) 은 라우터들, 스위치들, 기지국들, 또는 소스 디바이스 (12) 에서 목적지 디바이스 (14) 로의 통신을 용이하게 하는 데 유용할 수도 있는 임의의 다른 장비를 포함할 수도 있다. 다른 예에서, 소스 디바이스 (12) 는, 데이터를 송신하는 대신, 인코딩된 데이터를 저장 매체 상에 저장할 수도 있다. 마찬가지로, 목적지 디바이스 (14) 는 저장 매체로부터 인코딩된 데이터를 취출하도록 구성될 수도 있다. 이런 식으로, 소스 디바이스 (12) 는 컴퓨터 프로그램 제품을 생성하도록 구성될 수도 있는데, 상기 컴퓨터 프로그램 제품은 본원에서 설명된 기술들에 따라 인코딩된 비디오 파일을 포함한다.

비디오 인코더 (20) 와 비디오 디코더 (30) 는 본원에서 설명된 것들과 같은 비디오 압축 표준에 따라 동작할 수도 있다. 그러나, 본 개시의 기술들은 임의의 특정 코딩 표준에 제한되지 않는다. 도 2에 도시되지 않았지만, 몇몇 양태들에서, 비디오 인코더 (20) 및 비디오 디코더 (30) 각각은 오디오 인코더 및 디코더와 통합될 수도 있고, 공통 데이터 스트림 또는 개별적인 데이터 스트림들에서 오디오 및 비디오 양자의 인코딩을 핸들링하기 위해 적절한 MUX-DEMUX 유닛들, 또는 다른 하드웨어 및 소프트웨어를 포함할 수도 있다. 적용가능하다면, MUX-DEMUX 유닛들은 ITU H.223 멀티플렉서 프로로톨, 또는 사용자 데이터그램 프로토콜 (user datagram protocol; UDP) 과 같은 다른 프로토콜을 준수할 수도 있다.

비디오 인코더 (20) 및 비디오 디코더 (30) 각각은 임의의 다양한 적절한 인코더 또는 디코더 회로부, 예컨대 하나 이상의 마이크로프로세서들, 디지털 신호 프로세서들 (DSP들), 주문형 반도체들 (application specific integrated circuits; ASIC들), 필드 프로그램가능 게이트 어레이들 (FPGA들), 인코더 또는 디코더와 같은 비디오 코딩 디바이스를 포함하는 무선 통신 디바이스들, 이산 로직, 소프트웨어, 하드웨어, 펌웨어 또는 이들의 임의의 조합들로서 구현될 수도 있다. 비디오 인코더 (20) 및 비디오 디코더 (30) 각각은 하나 이상의 인코더들 또는 디코더들에 포함될 수도 있고, 이들 중 어느 것이라도 결합된 인코더/디코더 (CODEC) 의 일부로서 각각의 카메라, 컴퓨터, 모바일 디바이스, 가입자 디바이스, 브로드캐스트 디바이스, 셋톱박스, 서버 등에 통합될 수도 있다. 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 를 포함하는 장치는 집적 회로, 마이크로프로세서, 및/또는 무선 통신 디바이스, 예컨대 셀룰러 전화기를 포함할 수도 있다.

비디오 인코더 (20) 와 비디오 디코더 (30) 는 본 개시에 따른 기술들을 구현하도록 구성될 수도 있다. 이러한 기술들은 파이프라인 오버헤드 감소시켜 잠재적으로 스루풋을 향상시킬 수도 있다. 예를 들면, 파이프라인 오버헤드의 한 원인은, 콘텍스트 적응 이진 산술 코딩 (CABAC) 을 개시하는 데 필요한 싸이클들과 관련된 오버헤드이다. 본 개시에서 설명된 기술들에서, 비디오 인코더 (20) 는 (예를 들면, 정규 CABAC 엔진에 의한) CABAC 인코딩을 사용하여 구문 엘리먼트들의 제 1의 그룹을 엔트로피 인코딩하고, (예를 들면, 바이패스 엔진에 의한) 바이패스 인코딩을 사용하여 구문 엘리먼트들의 제 2의 그룹을 엔트로피 인코딩한다. 마찬가지로, 비디오 디코더 (30) 는 (예를 들면, 정규 CABAC 엔진에 의한) CABAC 디코딩을 사용하여 구문 엘리먼트들의 제 1의 그룹을 엔트로피 디코딩하고, (예를 들면, 바이패스 디코딩 엔진에 의한) 바이패스 디코딩을 사용하여 구문 엘리먼트들의 제 2의 그룹을 엔트로피 디코딩한다.

이런 식으로, CABAC 인코딩된 제 1의 그룹의 구문 엘리먼트들은, 비트스트림에서 바이패스 인코딩된 제 2의 그룹의 구문 엘리먼트들과 인터리빙되지 않는다. CABAC 인코딩된 구문 엘리먼트들 및 바이패스 인코딩된 구문 엘리먼트들이 인터리빙되면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 CABAC 엔진을 반복적으로 재시작시켜야 할 것이다.

예를 들면, 제 1의 구문 엘리먼트가 CABAC 인코딩될 것이고 바이패스 인코딩될 제 2의 엘리먼트를 선행한다고 가정하면, CABAC 인코딩될 제 3의 구문 엘리먼트는 바이패스 인코딩될 제 2의 구문 엘리먼트에 후속한다. CABAC 및 바이패스 인코딩된 구문 엘리먼트들이 인터리빙되는 이 예에서, 비디오 인코더 (20) 는 제 1의 구문 엘리먼트에 대해 CABAC 엔진을 개시하고, 그 다음 바이패스 엔진에 의해 제 2의 구문 엘리먼트를 인코딩한 이후 제 3의 구문 엘리먼트에 대해 CABAC 엔진을 재시작하는데, 이것은 싸이클들을 소비한다.

본 개시에서 설명된 기술들에서, 구문 엘리먼트들의 제 1의 그룹을 CABAC 인코딩함으로써, 그리고 구문 엘리먼트들의 제 2의 그룹을 바이패스 인코딩함으로써, 비디오 인코더 (20) 는 CABAC 엔진이 개시되어야 하는 횟수를 줄일 수도 있어서, 소비되는 싸이클들의 수를 줄이게 된다. 마찬가지로, 구문 엘리먼트들의 제 1의 그룹을 CABAC 디코딩함으로써, 그리고 구문 엘리먼트들의 제 2의 그룹을 바이패스 디코딩함으로써, 비디오 디코더 (30) 는 CABAC 엔진이 시작되어야 하는 횟수를 줄일 수도 있어서, 소비되는 싸이클들의 수를 줄이게 된다.

더 상세히 설명되는 바와 같이, 구문 엘리먼트들의 제 1의 그룹의 각 구문 엘리먼트는 CU의 하나의 PU와 관련되고, 구문 엘리먼트들의 제 2의 그룹의 각 구문 엘리먼트는 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트에 대응한다. 구문 엘리먼트들의 제 1의 그룹과 구문 엘리먼트들의 제 2의 그룹의 각각은 복수의 구문 엘리먼트들을 포함한다. 구문 엘리먼트들의 제 1의 그룹의 각각은, 각 PU (예를 들면, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트에 대응하는 PU) 의 인트라 예측 모드가 이웃 PU로부터 추론되는지의 여부를 나타낸다. 다시 말하면, 구문 엘리먼트들의 제 1의 그룹의 각각은, 각 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타낸다.

예를 들면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 위에서 설명된 예시적인 방식으로 가장 가능성이 높은 모드들의 리스트를 구성하도록 구성될 수도 있다. 구문 엘리먼트들의 제 1의 그룹에서의 각각의 구문 엘리먼트는 CU에서의 PU들 중 하나에 대응할 수도 있다. 이 예에서, 구문 엘리먼트들의 제 1의 그룹에서의 구문 엘리먼트 (즉, 제 1의 그룹의 복수의 구문 엘리먼트들에서의 구문 엘리먼트들 중 하나) 는, 구문 엘리먼트가 대응하는 CU에서의 PU에 대한 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타낸다.

구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트가 관련되는 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초한다는 것을 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트가 나타내면, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트와 관련되는, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트는 가장 가능성이 높은 모드들의 리스트로의 인덱스를 식별한다. 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트가 관련되는 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하지 않는다는 것을 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트가 나타내면, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트와 관련되는, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트는 인트라 예측 모드를 나타낸다.

도 3은 본원에서 설명된 비디오 데이터를 인코딩하는 기술들을 구현할 수도 있는 비디오 인코더 (20) 의 일 예를 예시하는 블록도이다. 일 예에서, 비디오 인코더 (20) 는 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 제 2의 그룹을 생성하도록 구성될 수도 있는데, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하고, 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트들 각각은, CU에서의 각각의 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타낸다. 비디오 인코더 (20) 는, 구문 엘리먼트들의 제 1의 그룹의 엔트로피 인코딩에 후속하여, (예를 들면, 정규 CABAC 엔진을 사용하여) 구문 엘리먼트들의 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 인코딩하고, (예를 들면, 바이패스 인코딩 엔진을 사용하여) 구문 엘리먼트들의 제 2의 그룹을 바이패스 인코딩하고, 구문 엘리먼트들의 인코딩된 제 1의 그룹 및 구문 엘리먼트들의 인코딩된 제 2의 그룹을 포함하는 비디오 데이터를 출력한다. 구문 엘리먼트들의 제 1 및 제 2의 그룹 각각은 복수의 구문 엘리먼트들을 포함한다.

비디오 인코더 (20) 는 비디오 슬라이스들 내의 비디오 블록들의 인트라 코딩 (즉, 인트라 예측 인코딩) 및 인터 코딩 (즉, 인터 예측 인코딩) 을 수행할 수도 있다. 도 3에 도시된 바와 같이, 비디오 인코더 (20) 는, 인코딩될 비디오 프레임 내의 현재 비디오 블록일 수도 있는 비디오 데이터를 수신하고, 인코딩된 비디오 비트스트림을 출력한다. 비디오 인코더 (20) 는 구문 데이터, 예컨대 블록 기반 구문 데이터, 프레임 기반 구문 데이터, 및 GOP 기반 구문 데이터를, 예를 들면, 프레임 헤더, 블록 헤더, 슬라이스 헤더, 또는 GOP 헤더에서, 또한 전송할 수도 있다. GOP 구문 데이터는 각각의 GOP에서의 다수의 프레임들을 설명할 수도 있고, 프레임 구문 데이터는 대응하는 프레임을 인코딩하기 위해 사용된 인코딩/예측 모드를 나타낼 수도 있다.

도 3의 예에서, 비디오 인코더 (20) 는 모드 선택 유닛 (40), 참조 프레임 메모리 (64), 합산기 (50), 변환 프로세싱 유닛 (52), 양자화 프로세싱 유닛 (54), 및 엔트로피 인코딩 유닛 (56) 을 포함한다. 다음, 모드 선택 유닛 (40) 은 모션 추정 유닛 (42), 모션 보상 유닛 (44), 인트라 예측 유닛 (46), 및 구획 유닛 (48) 을 포함한다. 비디오 블록 재구성을 위해, 비디오 인코더 (20) 는 역양자화 프로세싱 유닛 (58), 역변환 프로세싱 유닛 (60), 및 합산기 (62) 를 또한 포함한다.

인코딩 프로세스 동안, 비디오 인코더 (20) 는 코딩될 비디오 프레임 또는 슬라이스를 수신한다. 프레임 또는 슬라이스는 복수의 비디오 블록들로 분할될 수도 있다. 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 은 하나 이상의 참조 프레임들에서의 하나 이상의 블록들에 대한 수신된 비디오 블록의 인터 예측 코딩 (인터 예측 인코딩) 을 수행하여 시간적 예측을 제공한다. 인트라 예측 유닛 (46) 은 코딩될 현재 블록과 동일한 프레임 또는 슬라이스에서의 하나 이상의 이웃 블록들에 대한 수신된 비디오 블록의 인트라 예측 코딩 (인트라 예측 인코딩) 을 대안적으로 수행하여 공간적 예측을 제공할 수도 있다. 비디오 인코더 (20) 는 다수의 코딩 과정들을 수행하여, 예를 들면, 비디오 데이터의 각각의 블록에 대한 적절한 코딩 모드를 선택할 수도 있다.

또한, 구획 유닛 (48) 은, 이전의 코딩 과정들에서의 이전의 구획화 스킴들의 평가에 기초하여, 비디오 데이터의 블록들을 서브블록들로 구획할 수도 있다. 예를 들면, 구획 유닛 (48) 은, 최초, 프레임 또는 슬라이스를 LCU들로 구획하고, 레이트 왜곡 분석 (예를 들면, 레이트 왜곡 최적화) 에 기초하여 LCU들의 각각을 서브 CU들로 구획할 수도 있다. 모드 선택 유닛 (40) 은 LCU의 서브 CU들로의 구획화를 나타내는 쿼드트리 데이터 구조를 더 생성할 수도 있다. 쿼드트리의 리프 노드 CU들은 하나 이상의 PU들 및 하나 이상의 TU들을 포함할 수도 있다.

모드 선택 유닛 (40) 은, 예를 들면, 에러 결과들에 기초하여 코딩 모드들 중 하나, 인트라 또는 인터를 선택할 수도 있고, 결과적인 인트라 코딩된 블록 또는 인터 코딩된 블록을 합산기 (50) 에 제공하여 잔차 블록 데이터를 생성하고 합산기 (62) 에 제공하여 참조 프레임으로서 사용하기 위한 인코딩된 블록을 재구성한다. 또한, 모드 선택 유닛 (40) 은 모션 벡터들과 같은 구문 엘리먼트들, 인트라 모드 표시자들, 구획 정보, 및 다른 이러한 구문 정보를 엔트로피 인코딩 유닛 (56) 으로 제공한다. 예를 들면, 모드 선택 유닛 (40) 은, 위에서 설명된 바와 같이, 구문 엘리먼트들 (prev_intra_luma_pred_flag, mpm_idx, rem_intra_luma_pred_mode, intra_chroma_pred_mode, 및 chroma_pred_from_luma_enable_flag) 을 엔트로피 인코딩 유닛 (56) 으로 제공할 수도 있다. 또한, 모드 선택 유닛 (40) 은, 구문 엘리먼트들을 엔트로피 인코딩하는 데 필요한 싸이클들의 수가 감소되는 방식으로 구문 엘리먼트들 (prev_intra_luma_pred_flag, mpm_idx, rem_intra_luma_pred_mode 및 intra_chroma_pred_mode) 이 엔트로피 인코딩 유닛 (56) 으로 제공되도록, 구문 엘리먼트들 (prev_intra_luma_pred_flag, mpm_idx, rem_intra_luma_pred_mode 및 intra_chroma_pred_mode) 을 정렬하도록 구성될 수도 있다.

예를 들면, 비디오 인코더 (20) 는, 엔트로피 인코딩 유닛 (56) 을 통해, CABAC 인코딩을 사용하여 CU 내의 각각의 PU에 대해 prev_intra_luma_pred_flag를 엔트로피 인코딩할 수도 있다. 이 예에서, 구문 엘리먼트들의 제 1의 그룹은 복수의 prev_intra_luma_pred_flag(s) (즉, CU에서의 각각의 PU에 대해 하나) 를 포함한다. 비디오 인코더 (20) 는, PU에 대한 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초한다는 것을 대응하는 prev_intra_luma_pred_flag가 나타내면, 엔트로피 인코딩 유닛 (56) 를 통해, mpm_idx 구문 엘리먼트를 바이패스 인코딩을 사용하여 엔트로피 인코딩하거나, 또는, PU에 대한 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하지 않는다는 것을 대응하는 prev_intra_luma_pred_flag가 나타내면, rem_intra_luma_pred_mode 구문 엘리먼트를 인코딩한다. 이 예에서, 구문 엘리먼트들의 제 2의 그룹은 하나 이상의 mpm_idx 구문 엘리먼트들 및 하나 이상의 rem_intra_luma_pred_mode 구문 엘리먼트들을 포함한다.

다시 말하면, 구문 엘리먼트들의 제 1의 그룹에서의 구문 엘리먼트의 일 예는 prev_intra_luma_pred_flag이고, 구문 엘리먼트들의 제 2의 그룹에서의 구문 엘리먼트의 일 예는 mpm_idx 구문 엘리먼트이고, 구문 엘리먼트들의 제 2의 그룹에서의 구문 엘리먼트의 다른 예는 rem_intra_luma_pred_mode 구문 엘리먼트이다.

다시, prev_intra_luma_pred_flag는, CU의 PU의 루마 샘플들의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타낸다. mpm_idx 구문 엘리먼트는, CU의 PU의 루마 샘플들의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초한다는 것을 prev_intra_luma_pred_flag가 나타내면, 가장 가능성이 높은 모드들의 리스트로의 인덱스를 나타낸다. rem_intra_luma_pred_mode 구문 엘리먼트는, CU의 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하지 않는다는 것을 prev_intra_luma_pred_flag가 나타내면, PU의 루마 샘플들의 인트라 예측 모드를 나타낸다. rem_intra_luma_pred_mode 구문 엘리먼트는 가장 가능성이 높은 모드들의 리스트에서 식별되지 않은 인트라 예측 모드를 나타낼 수도 있다.

모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 은 고도로 집적될 수도 있지만, 개념적 목적들을 위해 별개로 예시되어 있다. 모션 추정 유닛 (42) 에 의해 수행된 모션 추정은 모션 벡터들을 생성하는 프로세스이며, 모션 벡터들은 비디오 블록들에 대한 모션을 추정한다. 예를 들면, 모션 벡터는, 현재 프레임 (또는 다른 코딩된 단위) 내에서 코딩되고 있는 현재 블록에 대한 참조 프레임 (또는 다른 코딩된 단위) 내의 예측 블록에 대한 현재 비디오 프레임 또는 픽쳐 내의 비디오 프레임의 PU의 변위를 나타낼 수도 있다. 예측 블록은 픽셀 차이의 관점에서, 코딩될 블록과 밀접하게 일치하는 것으로 발견된 블록인데, 픽셀 차이는 절대 차의 합 (sum of absolute difference; SAD), 제곱 차의 합 (sum of square difference; SSD), 또는 다른 차이 메트릭들에 의해 결정될 수도 있다. 몇몇 실시형태들에서, 비디오 인코더 (20) 는 참조 프레임 메모리 (64) 에 저장된 참조 픽쳐들의 서브 정수 픽셀 위치들 (sub-integer pixel positions) 에 대한 값들을 계산할 수도 있다. 예를 들면, 비디오 인코더 (20) 는 참조 픽쳐의 1/4 픽셀 위치들, 1/8 픽셀 위치들, 또는 다른 분수의 픽셀 위치들의 값들을 보간할 수도 있다. 따라서, 모션 추정 유닛 (42) 은 전픽셀 (full pixel) 위치들 및 분수적 (fractional) 픽셀 위치들에 대한 모션 검색을 수행하고 분수적 픽셀 정밀도를 갖는 모션 벡터를 출력한다.

모션 추정 유닛 (42) 은 PU의 위치를 참조 픽쳐의 예측 블록의 위치와 비교함으로써 인터 코딩된 슬라이스에서의 비디오 블록의 PU에 대한 모션 벡터를 계산한다. 참조 픽쳐는 제 1의 참조 픽쳐 리스트 (List 0) 또는 제 2의 참조 픽쳐 리스트 (List 1) 로부터 선택될 수도 있는데, 이들 각각은 참조 프레임 메모리 (64) 에 저장된 하나 이상의 참조 픽쳐들을 식별한다. 모션 추정 유닛 (42) 은 계산된 모션 벡터를 엔트로피 인코딩 유닛 (56) 과 모션 보상 유닛 (44) 으로 전송한다.

모션 보상 유닛 (44) 에 의해 수행된 모션 보상은 모션 추정 유닛 (42) 에 의해 결정된 모션 벡터에 기초한 예측 블록의 페칭 (fetching) 또는 생성을 수반할 수도 있다. 다시, 모션 추정 유닛 (42) 과 모션 보상 유닛 (44) 은, 몇몇 예들에서, 기능적으로 통합될 수도 있다. 현재 비디오 블록의 PU에 대한 모션 벡터를 수신하면, 모션 보상 유닛 (44) 은 참조 픽쳐 리스트들 중 하나에서 모션 벡터가 가리키는 예측 블록을 찾아 낼 수도 있다. 합산기 (50) 는, 하기에 논의되는 바와 같이, 코딩되고 있는 현재 비디오 블록의 픽셀 값들로부터 예측 블록의 픽셀 값을 감산함으로써 픽셀 차이 값들을 형성하는 잔차 비디오 블록을 형성한다. 일반적으로, 모션 추정 유닛 (42) 은 루마 컴포넌트들에 대해 모션 추정을 수행하고, 모션 보상 유닛 (44) 은 크로마 컴포넌트들 및 루마 컴포넌트들 양자에 대해 루마 컴포넌트들에 기초하여 계산된 모션 벡터들을 사용한다. 모션 보상 유닛 (40) 은 비디오 블록들과 관련된 구문 엘리먼트들 및 비디오 슬라이스의 비디오 블록들을 디코딩함에 있어서 비디오 디코더 (30) 에 의해 사용하기 위한 비디오 슬라이스를 또한 생성할 수도 있다.

인트라 예측 유닛 (46) 은, 위에서 설명된 바와 같이, 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 에 의해 수행된 인터 예측에 대한 대안으로서 현재 블록을 인트라 예측할 수도 있다. 특히, 인트라 예측 유닛 (46) 은 현재 블록을 인코딩하는 데 사용할 인트라 예측 모드를 결정할 수도 있다. 일부 예들에서, 인트라 예측 유닛 (46) 은 예컨대, 개별 인코딩 과정들 동안에 다양한 인트라 예측 모드들을 이용하여 현재 블록을 인코딩할 수도 있고, 인트라 예측 유닛 (46) (또는 일부 예들에서, 모드 선택 유닛 (40)) 은, 예를 들면, 레이트 왜곡 분석에 기초하여, 테스트된 모드들로부터 사용할 적절한 인트라 예측 모드를 선택할 수도 있다. 위에서 설명된 바와 같이, 가능한 인트라 예측 모드들은, 루마 예측 모드로부터 인트라 예측 모드를 추론하는 크로마 컴포넌트에 대한 예측 모드, 평면 예측 모드들, DC 예측, 및 각도 예측 모드들을 포함한다.

또한, 일 예에서, 인트라 예측 유닛 (46) 은 다양한 테스트된 인트라 예측 모드들에 대한 레이트 왜곡 분석을 이용하여 레이트 왜곡 값들을 계산하고, 테스트된 모드들 중에서 최선의 레이트 왜곡 특성들을 갖는 인트라 예측 모드를 선택할 수도 있다. 레이트 왜곡 분석은 일반적으로, 인코딩된 블록 및 인코딩된 블록을 생성하기 위해 인코딩되었던 원래의 인코딩되지 않은 블록 사이의 왜곡 (또는 에러) 의 양뿐만 아니라, 인코딩된 블록을 생성하는 데 사용되는 비트 레이트 (즉, 비트들의 수) 를 결정한다. 인트라 예측 유닛 (46) 은 어떤 인트라 예측 모드가 그 블록에 대한 최선의 레이트 왜곡 값을 나타내는지를 결정하기 위해 여러 인코딩된 블록들에 대한 왜곡들 및 레이트들로부터 비율들을 결정할 수도 있다.

블록에 대한 인트라 예측 모드를 선택한 이후, 인트라 예측 유닛 (46) 은, 구문 엘리먼트들과 같은, 블록에 대한 선택된 인트라 예측 모드를 나타내는 정보를 엔트로피 인코딩 유닛 (56) 에 제공할 수도 있다. 엔트로피 인코딩 유닛 (56) 은, 선택된 인트라 예측 모드를 나타내는 정보를 인코딩할 수도 있다. 비디오 인코더 (20) 는 송신되는 비트스트림에 구성 데이터, 인트라 예측 모드 인덱스 표, 및 콘텍스트들의 각각에 대해 사용할 수정된 인트라 예측 모드 인덱스 표를 포함시킬 수도 있으며, 그 구성 데이터는 복수의 인트라 예측 모드 인덱스 표들과 복수의 수정된 인트라 예측 모드 인덱스 표들 (또한 코드워드 매핑 표들이라고 지칭됨), 다양한 블록들에 대한 인코딩 콘텍스트들의 정의들, 및 가장 있음직한 인트라 예측 모드의 표시들을 포함할 수도 있다.

위에서 설명된 바와 같이, 인트라 예측 구문 엘리먼트들 (intra_chroma_pred_mode, mpm_idx, rem_intra_luma_pred_mode, intra_chroma_pred_mode, 및 chroma_pred_from_luma_enable_flag) 은, PU에 대한 하나 이상의 루마 인트라 예측 모드들 및 PU 구조에 대한 크로마 인트라 예측 모드를 나타낼 수도 있다. 또한, 표 3 및 표 4에 관해 위에서 설명된 바와 같이, 코딩 구조 내에서의 인트라 예측 구문 엘리먼트들 (prev_intra_luma_pred_flag, mpm_idx, rem_intra_luma_pred_mode, intra_chroma_pred_mode, 및 chroma_pred_from_luma_enable_flag) 의 정렬은, PU 구조에 대한 구문 엘리먼트들 모두를 엔트로피 인코딩하는 데 필요한 싸이클들의 전체 수를 결정할 수도 있다. 따라서, 표 3 및 표 4에 관해 위에서 설명된 바와 같이 인트라 예측 구문 엘리먼트들을 엔트로피 인코딩 유닛 (56) 으로 출력하는 것에 부가하여, 인트라 예측 유닛 (46) 은, 구문 엘리먼트들을 엔트로피 인코딩하는 데 필요한 싸이클들의 전체 수가 감소되는 방식으로 이들이 출력되도록 인트라 예측 구문을 정렬하도록 구성될 수도 있다. 마찬가지로, 이 정렬을 통해, 구문 엘리먼트들을 엔트로피 디코딩하는 데 필요한 싸이클들의 전체 수가 감소된다.

일 예에서, 인트라 예측 유닛 (46) 은, 크로마 인트라 모드 구문 엘리먼트들의 CABAC 코딩된 빈들과 루마 인트라 모드 구문 엘리먼트들의 CABAC 코딩된 빈들이 함께 코딩되도록, 이들을 정렬하도록 구성될 수도 있다. 또한, 인트라 예측 유닛 (46) 은, 루마 인트라 모드 구문 엘리먼트들의 바이패스 코딩된 빈들과 크로마 인트라 모드 구문 엘리먼트들의 바이패스 코딩된 빈들이 함께 코딩되도록, 이들을 함께 정렬할 수도 있다. 표 5는 INTRA_2Nx2N PU 구조에 대한 이 정렬의 예시적인 코딩 구조를 제공한다. 표 6은 INTRA_NxN PU 구조에 대한 이 정렬의 예시적인 코딩 구조를 제공한다. 표 5 및 표 6에서, 구문 엘리먼트들은 표 3 및 표 4와 관련하여 위에서 설명된 바와 같이 정의될 수도 있다. 그러나, 표 5 및 표 6에서의 구문 엘리먼트들은 위에서 설명된 바와 동일한 값들의 범위를 반드시 가질 필요는 없다는 점을 주목해야만 한다. 예를 들면, 비디오 인코더 (20) 가 33개의 예측 모드들 보다 더 적거나 더 많은 모드들을 포함하면, 구문 엘리먼트들의 값들은 그에 따라 조정될 수도 있다. 표 5 및 표 6에서 예시된 바와 같이, 구문 엘리먼트 chroma_mode_cabac_bins은, 그것이 mpm_idx 및 rem_intra_luma_pred_mode 이전에 코딩되도록 정렬된다.

다른 예에서, 인트라 예측 유닛 (46) 은, CU 내의 모든 PU들에 대한 인트라 모드 루마 구문 엘리먼트들의 CABAC 코딩된 빈들이 함께 코딩될 수도 있도록, 이들을 정렬하도록 구성될 수도 있다. 또한, 인트라 예측 유닛 (46) 은 루마 인트라 모드 구문 엘리먼트들의 바이패스 코딩된 빈들이 함께 코딩될 수도 있도록 이들을 정렬할 수도 있다. 표 7은 INTRA_2Nx2N PU 구조에 대한 이 정렬의 예시적인 코딩 구조를 제공한다. 표 8은 INTRA_NxN PU 구조에 대한 이 정렬의 예시적인 코딩 구조를 제공한다. 표 7 및 표 8에서, 구문 엘리먼트들은 표 5 및 표 6과 관련하여 위에서 설명된 바와 같이 정의될 수도 있다.

표 8에 예시된 바와 같이, INTRA_NxN PU 구조에 대해, 4개의 PU들의 각각에 대한 prev_intra_luma_pred_flag 구문 엘리먼트들이 코딩되고, 그 다음 PU들의 각각에 대한 각각의 mpm_idx 및 rem_intra_luma_pred_mode 구문 엘리먼트들이 코딩된다. 4개의 prev_intra_luma_pred_flag 구문 엘리먼트들은 PU에 대한 구문 엘리먼트들의 제 1의 그룹으로서 칭해질 수도 있다. 따라서, 인트라 예측 유닛 (46) 은, 엔트로피 인코딩 유닛 (56) 이전에, 플래그들의 각각과 관련된 각각의 구문 엘리먼트 mpm_idx 및 rem_intra_luma_pred_mode에 앞서, 구문 엘리먼트들의 제 1의 그룹을 출력하도록 구성될 수도 있다.

또 다른 예에서, 인트라 예측 유닛 (46) 은, 코딩 단위에서의 모든 PU들에 대한 루마 및 크로마 인트라 모드 구문 엘리먼트들 양자의 모든 CABAC 코딩된 빈들이 함께 코딩될 수도 있도록, 이들을 정렬하도록 구성될 수도 있다. 또한, 인트라 예측 유닛 (46) 은 루마 및 크로마 인트라 모드의 모든 바이패스 코딩된 빈들이 함께 코딩되도록, 이들을 정렬하도록 구성될 수도 있다. 표 9는 INTRA_2Nx2N PU 구조에 대한 이 정렬의 예시적인 코딩 구조를 제공한다. 표 10은 INTRA_NxN PU 구조에 대한 이 정렬의 예시적인 코딩 구조를 제공한다. 표 9 및 표 10에서, 구문 엘리먼트들은 표 5 및 표 6과 관련하여 위에서 설명된 바와 같이 정의될 수도 있다.

표 6 내지 표 10에서, 구문 엘리먼트가 표에서 표시되는 행은, 구문 엘리먼트가 엔트로피 인코더에 의해 인코딩되는 순서에 대응할 수도 있음을 주목해야만 한다. 몇몇 경우들에서, 표 6 내지 표 10에서의 인접한 행들 사이에서 어떠한 중간 엔트로피 인코딩도 발생하지 않을 수도 있다. 일반적으로, 본원에서의 용어들 "그룹" 및 "그룹화"는, 예를 들면, 픽쳐, 슬라이스, CU 등과 같은 비디오 코딩 단위 내의 구문 표 내에서, 엘리먼트들을 함께 밀접하게 배치하는 것을 지칭할 수도 있다. 한 그룹에 포함된 구문 엘리먼트들에 대해 동작이 수행되는 경우들에서, 몇몇 경우들에서 그 엘리먼트들은 너무 밀접하게 함께 배치되어, 그 그룹 내의 모든 엘리먼트들에 대해 그 동작이 완료될 때까지 그 그룹 밖의 엘리먼트들에 대해 그 동작이 수행되지 않을 수도 있다 (즉, 상이한 그룹들 사이의 인터리빙이 없다). 몇몇 경우들에서, 한 그룹에서의 빈들은 연속적으로 나타날 수도 있고 어떤 순서 또는 시퀀스로, 즉 하나씩 코딩될 수도 있다.

도 3을 다시 참조하면, 비디오 인코더 (20) 는, 코딩되고 있는 원래의 비디오 블록으로부터 모드 선택 유닛 (40) 으로부터의 예측 데이터를 감산함으로써 잔차 비디오 블록을 형성한다. 합산기 (50) 는 이 감산 동작을 수행하는 컴포넌트 또는 컴포넌트들을 나타낸다. 변환 프로세싱 유닛 (52) 은, 이산 코사인 변환 (DCT) 또는 개념적으로 유사한 변환과 같은 변환을 잔차 블록에 적용하여, 잔차 변환 계수 값들을 포함하는 비디오 블록을 생성한다. 변환 프로세싱 유닛 (52) 은, 개념적으로 DCT에 유사한 다른 변환들을 수행할 수도 있다. 웨이브릿 변환들, 정수 변환들, 서브 대역 (sub-band) 변환들, 또는 다른 유형의 변환들이 또한 이용될 수도 있다. 어떠한 경우에도, 변환 프로세싱 유닛 (52) 은 잔차 블록에 변환을 적용하여, 잔차 변환 계수들의 블록을 생성한다. 변환은 잔차 정보를 픽셀 값 도메인에서 주파수 도메인과 같은 변환 도메인으로 변환할 수도 있다. 변환 프로세싱 유닛 (52) 은 결과적으로 생성된 변환 계수들을 양자화 유닛 (54) 으로 전송할 수도 있다. 양자화 유닛 (54) 은 변환 계수들을 양자화하여 비트 레이트를 더 감소시킬 수도 있다. 양자화 프로세스는 계수들의 일부 또는 전부와 관련된 비트 깊이를 감소시킬 수도 있다. 양자화의 정도는 양자화 파라미터를 조정함으로써 수정될 수도 있다. 그 다음, 몇몇 예들에서, 양자화 유닛 (54) 은 양자화된 변환 계수들을 포함하는 매트릭스의 스캔을 수행할 수도 있다. 다르게는, 엔트로피 인코딩 유닛 (56) 이 스캔을 수행할 수도 잇다.

비디오 인코더 (20) 는, 예를 들면 시간적으로 예측될 동일한 프레임 또는 프레임들에서의 후속 블록들을 예측하기 위한 참조로서 사용될 디코딩된 블록들을 저장하기 위해 역양자화 및 역변환을 수행하도록 구성될 수도 있다. 역양자화 프로세싱 유닛 (58) 및 역변환 프로세싱 유닛 (60) 은, 각각, 역양자화 및 역변환을 적용하여, 참조 블록으로서의 나중의 사용을 위해 픽셀 도메인의 잔차 블록을 재구성한다. 모션 보상 유닛 (44) 은 참조 프레임 메모리 (64) 의 프레임들 중 하나의 예측 블록에 잔차 블록을 가산함으로써 참조 블록을 계산할 수도 있다. 모션 보상 유닛 (44) 은, 모션 추정에서 사용하기 위한 서브 정수 픽셀 값들을 계산하기 위해, 재구성된 잔차 블록에 하나 이상의 보간 필터들을 또한 적용할 수도 있다. 합산기 (62) 는 재구성된 잔차 블록을 모션 보상 유닛 (44) 에 의해 생성된 모션 보상된 예측 블록에 가산하여 참조 프레임 메모리 (64) 에 저장하기 위한 재구성된 비디오 블록을 생성한다.

양자화에 후속하여, 엔트로피 인코딩 유닛 (56) 은 양자화된 변환 계수들을 엔트로피 인코딩한다. 또한, 엔트로피 인코딩 유닛 (56) 은, 위에서 설명된 예측 구문 엘리먼트들과 같은 구문 엘리먼트들을 엔트로피 인코딩한다. 예를 들면, 엔트로피 인코딩 유닛 (56) 은 콘텍스트 적응 가변 길이 코딩 (CAVLC), 콘텍스트 적응 이진 산술 코딩 (CABAC), 구문 기반 콘텍스트 적응 이진 산술 코딩 (syntax-based context-adaptive binary arithmetic coding; SBAC), 확률 인터벌 구획화 엔트로피 (probability interval partitioning entropy; PIPE) 코딩, 또는 다른 엔트로피 인코딩 방법론 또는 기술을 수행할 수도 있다. 콘텍스트 기반의 엔트로피 인코딩의 경우, 콘텍스트는 이웃 블록들에 기초할 수도 있다. 엔트로피 인코딩 유닛 (56) 에 의한 엔트로피 인코딩에 후속하여, 인코딩된 비트스트림은 다른 디바이스 (예를 들면, 비디오 디코더 (30)) 로 송신되거나, 또는 나중의 송신 또는 취출을 위해 보관 (archive) 될 수도 있다.

도 4는 본 개시에서 설명된 기술들을 구현할 수도 있는 예시적인 엔트로피 인코딩 유닛 (56) 을 예시하는 블록도이다. 일 예에서, 도 4에 예시된 엔트로피 인코딩 유닛 (56) 은 CABAC 인코더일 수도 있다. 예시적인 엔트로피 인코딩 유닛 (56) 은 이진화 유닛 (502), 바이패스 인코딩 엔진 (504) 및 정규 인코딩 엔진 (508) 을 포함하는 산술 인코딩 유닛 (510), 및 콘텍스트 모델링 유닛 (506) 을 포함할 수도 있다.

엔트로피 인코딩 유닛 (56) 은 하나 이상의 구문 엘리먼트들, 예컨대 위에서 설명된 인트라 예측 구문 엘리먼트들 (prev_intra_luma_pred_flag, mpm_idx, rem_intra_luma_pred_mode, intra_chroma_pred_mode, 및 chroma_pred_from_luma_enable_flag) 을 포함할 수도 있다. 구문 엘리먼트들이 엔트로피 인코딩 유닛 (56) 에 의해 수신되는 순서는 코딩 구조, 예컨대 표 3 내지 표 10에 관해 위에서 설명된 예시적인 코딩 구조들에 따라 정의될 수도 있다.

이진화 유닛 (502) 은 구문 엘리먼트를 수신하고 빈 스트링 (즉, 이진화 스트링) 을 생성한다. 이진화 유닛 (502) 은, 예를 들면, 빈 스트링을 생성하기 위한 하기의 기술들 중 임의의 하나 또는 그 조합을 사용할 수도 있다: 고정 길이 코딩, 1진 코딩, 잘려진 1진 코딩, 잘려진 라이스 코딩, 골롬 코딩, 지수 골롬 코딩, 및 골롬-라이스 코딩. 또한, 몇몇 경우들에서, 이진화 유닛 (502) 은 이진 스트링으로서 구문 엘리먼트를 수신하고 빈 값들을 간단히 통과시킬 수도 있다. 일 예에서, 이진화 유닛 (502) 은 구문 엘리먼트 intra_chroma_pred_mode를 수신하고 표 2에 관해 위에서 설명된 예에 따라 chroma_pred_from_luma_enable_flag의 값에 기초하여 빈 스트링을 생성한다.

산술 인코딩 유닛 (510) 은 이진화 유닛 (502) 으로부터 빈 스트링을 수신하고 그 빈 스트링에 대해 산술 인코딩을 수행하도록 구성된다. 도 4에 도시된 바와 같이, 산술 인코딩 유닛 (510) 은 바이패스 과정 또는 정규 코딩 과정으로부터 빈 값들을 수신할 수도 있다. 바이패스 과정에 후속하는 빈 값들은, 바이패스 코딩된 것으로 식별된 빈 값들일 수도 있고 정규 인코딩 과정에 후속하는 빈 값들은 CABAC 코딩된 것으로 식별될 수도 있다. 위에서 설명된 CABAC 프로세스와 부합하여, 산술 인코딩 유닛 (510) 이 바이스패 과정으로부터 빈 값들을 수신하는 경우, 바이패스 인코딩 엔진 (504) 은 빈 값에 할당된 적응 콘텍스트를 활용하지 않고 빈 값들에 대해 산술 인코딩을 수행할 수도 있다. 일 예에서, 바이패스 인코딩 엔진 (504) 은 빈의 가능한 값들에 대해 동일한 확률들을 가정할 수도 있다.

산술 인코딩 유닛 (510) 이 정규 과정을 통해 빈 값들을 수신하는 경우에서, 콘텍스트 모델링 유닛 (506) 은 콘텍스트 변수 (예를 들면, 콘텍스트 상태) 를 제공할 수도 있고, 그 결과 정규 인코딩 엔진 (508) 은 콘텍스트 모델링 유닛 (506) 에 의해 제공된 콘텍스트 할당들에 기초하여 산술 인코딩을 수행할 수도 있다. 콘텍스트 할당들은 비디오 표준, 예컨대 HEVC에 따라 정의될 수도 있다. 콘텍스트 모델들은 메모리에 저장될 수도 있다. 콘텍스트 모델링 유닛 (506) 은 일련의 인덱스된 표들 (indexed tables) 을 포함할 수도 있고 및/또는 특정 빈에 대한 콘텍스트 및 콘텍스트 변수를 결정하기 위해 매핑 함수들을 활용할 수도 있다. 빈 값을 인코딩한 후, 정규 인코딩 엔진 (508) 은 실제 빈 값들에 기초하여 콘텍스트를 업데이트할 수도 있다.

또한, 일 예에서, 엔트로피 인코딩 유닛 (56) 은, 모드 선택 유닛 (40) 으로부터 엔트로피 인코딩 유닛 (56) 이 구문 엘리먼트들을 수신하는 순서에 기초하여 빈들을 인코딩하도록 구성될 수도 있다. 위에서 설명된 바와 같이, 그 순서는 코딩 구조, 예컨대 표 3 내지 표 10에 관해 위에서 설명된 예시적인 코딩 구조들에 따라 정의될 수도 있다. 엔트로피 인코딩 유닛 (56) 이 구문 엘리먼트들의 한 세트 내의 구문 엘리먼트들을 수신하는 순서는, 엔트로피 인코딩 유닛 (56) 이 구문 엘리먼트들의 그 세트를 인코딩하는 데 필요로 하는 싸이클들의 전체 수를 결정할 수도 있다.

일 예에서, 정규 인코딩 엔진 (508) 은 단일의 빈을 코딩하기 위해 2개 보다 많은 싸이클들을 필요로 할 수도 있다. 또한, 일 예에서, 정규 인코딩 엔진 (508) 은 n개의 빈들을 인코딩하기 위해 n+M 개의 싸이클들을 필요로 할 수도 있는데, 여기서 M은 파이프라인을 시작하기 위한 오버헤드이다. M은 보통 0보다 더 크다. CABAC 인코딩 프로세스의 개시시 (즉, 스위치가 바이패스 모드에서 정규로 됨), 파이프라인 오버헤드가 도입된다. 일 예에서, 바이패스 인코딩 엔진 (504) 은 n비트의 구문 엘리먼트를 코딩하기 위해 하나의 싸이클을 필요로 할 수도 있는데, 여기서 n은 0보다 더 크다.

따라서, CABAC 빈들과 바이패스 빈들의 세트를 인코딩하기 위해 산술 인코딩 유닛 (510) 이 필요로 하는 싸이클들의 전체 수는, 파이프라인 오버헤드 (M) 가 도입된 횟수에 기초할 수도 있다. 예를 들면, 산술 인코딩 유닛 (510) 이 표 4에 정렬된 바와 같은 예측 구문 엘리먼트들을 인코딩한다면, 파이프라인 오버헤드는 5회 도입될 수도 있고 산술 인코딩 유닛 (510) 은 구문 엘리먼트들의 빈들을 인코딩하는 데 5*M 싸이클들의 최소치를 필요로 할 수도 있다. 그러나, 산술 인코딩 유닛 (510) 이 표 8에 정렬된 바와 같은 예측 구문 엘리먼트들을 인코딩한다면, 파이프라인 오버헤드는 2회만 도입될 수도 있고 산술 인코딩 유닛 (510) 파이프라인 오버헤드는 2*M 싸이클들로 감소될 수도 있다.

HEVC에 따라 코딩된 비디오 프레임은 대략 수 만개의 PU들을 포함할 수도 있음을 주목해야만 한다. 따라서, 인트라 예측 구문 엘리먼트들이 코딩 구조에서 정렬되는 순서는, 비디오 코더가 비디오 데이터를 코딩하는 데 필요로 하는 싸이클들의 수에 상당한 영향을 끼칠 수도 있다. 또한, 도 4에 예시된 예시적인 엔트로피 인코딩 유닛 (56) 이 바이패스 인코딩 동작에서 정규 인코딩 동작으로 전환하는 것으로 설명되었지만, 몇몇 경우들에서, 이들 동작들은 병렬로 수행될 수도 있음을 주목해야만 한다. 그러나, 이 경우, 엔트로피 인코딩 유닛 (56) 이 바이패스 및 CABAC 코딩된 구문 엘리먼트들을 수신하는 순서는, 구문 엘리먼트들을 엔트로피 인코딩하는 데 필요한 싸이클들의 전체 수를 여전히 결정할 수도 있다. 오버헤드는 콘텍스트 전환으로부터 유래한다. 바이패스 모드에서 코딩된 빈들이 다음 CABAC 코딩된 빈들에 대해 몇몇 상이한 구문 엘리먼트들로 나타날 수 있기 때문에, 파이프라인 오버헤드를 줄이기 위해 필요한 콘텍스트를 프리페치하는 것 (콘텍스트 버퍼를 로딩하는 것) 이 어렵다.

도 5는 본 개시의 기술들에 따라 비디오 데이터를 인코딩하는 예를 예시하는 흐름도이다. 도 5의 프로세스가 일반적으로 비디오 인코더 (20) 에 의해 수행되고 있는 것으로 하기에 설명되지만, 그 프로세스는 비디오 인코더 (20), 모드 선택 유닛 (40) 및/또는 엔트로피 인코딩 유닛 (56) 의 임의의 조합에 의해 수행될 수도 있다.

도 5에 예시된 바와 같이, 비디오 인코더 (20) 는 구문 엘리먼트들의 제 1의 그룹을 생성한다 (602). 일 예에서, 제 1의 그룹 내의 구문 엘리먼트는, 각각의 예측 단위 (PU) 의 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타낸다. 일 예에서, 구문 엘리먼트들의 제 1의 그룹은 INTRA_NxN PU 구조에서의 PU들에 대응하는 4개의 구문 엘리먼트 prev_intra_luma_pred_flag를 포함한다. 비디오 인코더 (20) 는 구문 엘리먼트들의 제 2의 그룹을 생성한다 (604). 일 예에서, 각각의 구문 엘리먼트는, 위에서 설명된 바와 같이, 구문 엘리먼트들 (mpm_idx 또는 rem_intra_luma_pred_mode) 중 어느 하나일 수도 있다. 제 2의 그룹의 구문 엘리먼트들은 제 1의 그룹의 각각의 구문 엘리먼트들에 대응한다.

비디오 인코더 (20) 는 (예를 들면, 정규 CABAC 엔진을 사용하여) 구문 엘리먼트들의 제 1의 그룹을 CABAC 인코딩한다 (606). 구문 엘리먼트들의 제 1의 그룹을 CABAC 인코딩하는 것에 후속하여, 비디오 인코더 (20) 는 (예를 들면, 바이패스 인코딩 엔진을 사용하여) 구문 엘리먼트들의 제 2의 그룹을 바이패스 인코딩한다 (608). 비디오 인코더 (20) 는 구문 엘리먼트들의 제 1 및 제 2의 그룹들에 기초하여 CU의 PU들을 인트라 인코딩할 수도 있다 (610). 비디오 인코더 (20) 는, 구문 엘리먼트들의 인코딩된 제 1의 그룹 및 구문 엘리먼트들의 인코딩된 제 2의 그룹을 포함하는 비디오 데이터를 비트스트림에서 출력할 수도 있다 (612). 또한, 비디오 인코더 (20) 는 인트라 인코딩된 PU들에 대한 잔차 정보를 비트스트림에서 출력한다.

위에서 설명된 바와 같이, 구문 엘리먼트들의 제 1의 그룹의 예들은 복수의 플래그들 (예를 들면, prev_intra_luma_pred_flag 구문 엘리먼트들) 을 포함한다. 복수의 플래그들 중 한 플래그는, 각각의 PU의 루마 샘플들의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트일 수도 있다.

몇몇 예들에서, 구문 엘리먼트들의 제 2의 그룹은, 각각의 PU의 루마 샘플들의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초한다는 것을 구문 엘리먼트들의 제 1의 그룹에서의 대응하는 구문 엘리먼트가 나타내면, 가장 가능성이 높은 모드들의 리스트로의 인덱스를 나타내는 제 1의 구문 엘리먼트를 포함한다. 예를 들면, 각각의 PU에 대한 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초한다는 것을 각각의 PU에 대한 prev_intra_luma_pred_flag 구문 엘리먼트가 나타내면, 각각의 PU에 대한 대응하는 mpm_idx 구문 엘리먼트는 가장 가능성이 높은 모드들의 리스트로의 인덱스를 나타낸다. 이 예에서, mpm_idx 구문 엘리먼트는, 구문 엘리먼트들의 제 2의 그룹에서의 제 1의 구문 엘리먼트로서 간주된다.

몇몇 예들에서, 구문 엘리먼트들의 제 2의 그룹은, 각각의 PU의 루마 샘플들의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하지 않는다는 것을 구문 엘리먼트들의 제 1의 그룹에서의 대응하는 구문 엘리먼트가 나타내면, 각각의 PU에 대한 인트라 예측 모드를 나타내는 제 2의 구문 엘리먼트를 포함한다. 예를 들면, 각각의 PU에 대한 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하지 않는다는 것을 각각의 PU에 대한 prev_intra_luma_pred_flag 구문 엘리먼트가 나타내면, 각각의 PU에 대한 대응하는 rem_intra_luma_pred_mode 구문 엘리먼트는 인트라 예측 모드를 나타낸다. 이 예에서, rem_intra_luma_pred_mode 구문 엘리먼트는, 구문 엘리먼트들의 제 2의 그룹에서의 제 2의 구문 엘리먼트로서 간주된다.

위에서 설명된 바와 같이, 비디오 인코더 (20) 가 구성하는 가장 가능성이 높은 모드들의 리스트는, 하나 이상의 이웃 PU들의 하나 이상의 인트라 예측 모드들을 식별한다. 몇몇 예들에서, 비디오 인코더 (20) 는, CU의 PU들에 대한 구문 엘리먼트들의 제 2의 그룹의 임의의 구문 엘리먼트들을 출력하기 이전에 CU의 PU들에 대한 구문 엘리먼트들의 제 1의 그룹의 모든 구문 엘리먼트들을 출력할 수도 있다. 몇몇 예들에서, 비디오 인코더 (20) 는, 구문 엘리먼트들의 제 2의 그룹의 임의의 구문 엘리먼트를 바이패스 인코딩하기 이전에 구문 엘리먼트들의 제 1의 그룹의 모든 구문 엘리먼트들을 CABAC 인코딩할 수도 있다.

몇몇 예들에서, 엔트로피 인코더는 비디오 인코더 (20) 내에 포함된 엔트로피 인코더, 예컨대 엔트로피 인코딩 유닛 (56) 일 수도 있음을 주목해야만 한다. 이 경우, 용어 출력하는은, 비디오 인코더 (20) 내의 한 컴포넌트가 비디오 인코더 (20) 내의 다른 컴포넌트로 데이터를 출력하는 것을 지칭할 수도 있다. 또한, 다른 예들에서, 엔트로피 인코더는 비디오 인코더 (20) 외부에 있을 수도 있다. 일 예에서, 비디오 인코더 (20) 는, 구문 엘리먼트들의 그룹들이 시퀀스에서 각각의 구문 엘리먼트들 앞에 정렬되도록, 각각의 구문 엘리먼트들과 플래그들의 세트를 출력한다. 일 예에서, 비디오 인코더 (20) 는 표 8에 예시된 코딩 구조에 따라 구문 엘리먼트들을 정렬할 수도 있다. 비디오 디코더는 엔트로피 인코딩된 비트스트림을 수신하고 엔트로피 인코딩된 비트스트림을 사용하여 비디오 데이터를 재구성할 수도 있다.

도 6은 인코딩된 비디오 시퀀스를 디코딩하는 비디오 디코더 (30) 의 예를 예시하는 블록도이다. 일 예에서, 비디오 디코더 (30) 는, 플래그들의 세트와 각각의 플래그에 대응하는 각각의 구문 엘리먼트를 포함하는 엔트로피 인코딩된 비트스트림을 수신하고, 플래그들의 세트를 CABAC 디코딩하고, 각각의 구문 엘리먼트들을 바이패스 디코딩하고, 각각의 플래그와 각각의 구문 엘리먼트들의 값들에 기초하여 비디오 데이터를 재구성하도록 구성될 수도 있는데, 각각의 플래그는, 각각의 예측 단위 (PU) 의 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타낸다.

도 6의 실시형태에서, 비디오 디코더 (30) 는 엔트로피 디코딩 유닛 (70), 모션 보상 유닛 (72), 인트라 예측 유닛 (74), 역양자화 프로세싱 유닛 (76), 역변환 프로세싱 유닛 (78), 참조 프레임 메모리 (82) 및 합산기 (80) 를 포함한다. 비디오 디코더 (30) 는, 몇몇 예들에서, 비디오 인코더 (20) 에 대해 설명된 인코딩 과정 (도 4) 에 일반적으로 역순인 디코딩 과정을 수행할 수도 있다.

엔트로피 디코딩 유닛 (70) 은 엔트로피 인코딩된 비트스트림을 수신하고 구문 엘리먼트들을 인코딩하는 데 사용된 엔트로피 인코딩 프로세스에 대한 역 프로세스에 따라 비트스트림으로부터의 구문 엘리먼트들을 디코딩한다. 일 예에서, 구문 엘리먼트들을 인코딩하는 데 사용된 엔트로피 인코딩 프로세스는 위에서 설명된 엔트로피 인코딩 프로세스 중 임의의 것일 수도 있다.

도 7은 본 개시에서 설명된 기술들을 활용할 수도 있는 예시적인 비디오 코딩 시스템 (10) 을 예시하는 블록도이다. 엔트로피 디코딩 유닛 (70) 은 엔트로피 인코딩된 비트스트림을 수신하고 비트스트림으로부터의 구문 엘리먼트들을 디코딩한다. 구문 엘리먼트들은, 위에서 설명된 인트라 예측 구문 엘리먼트들 (prev_intra_luma_pred_flag, mpm_idx, rem_intra_luma_pred_mode, intra_chroma_pred_mode, chroma_pred_from_luma_enable_flag) 을 포함할 수도 있다. 구문 엘리먼트들이 엔트로피 디코딩 유닛 (70) 에 의해 수신되는 순서는 코딩 구조, 예컨대 표 3 내지 표 10에 관해 위에서 설명된 예시적인 코딩 구조들에 따라 정의될 수도 있다. 도 7의 예시적인 엔트로피 디코딩 유닛 (70) 은 산술 디코딩 유닛 (702) 을 포함하는데, 이것은 바이패스 디코딩 엔진 (704) 및 정규 디코딩 엔진 (706) 을 포함할 수도 있다. 예시적인 엔트로피 디코딩 유닛 (70) 은 콘텍스트 모델링 유닛 (708) 과 역이진화 유닛 (710) 을 또한 포함한다. 예시적인 엔트로피 디코딩 유닛 (70) 은 도 4에 관해 설명된 예시적인 엔트로피 인코딩 유닛 (56) 의 역 기능들을 수행할 수도 있다. 이와 같이, 엔트로피 디코딩 유닛 (70) 은 본원에서 설명된 기술들에 기초하여 엔트로피 디코딩을 수행할 수도 있다.

산술 디코딩 유닛 (702) 은 인코딩된 비트 스트림을 수신한다. 도 7에 도시된 바와 같이, 산술 디코딩 유닛 (702) 은 바이패스 과정 또는 정규 코딩 과정에 따라 인코딩된 빈 값들을 프로세싱할 수도 있다. 인코딩된 빈 값이 바이패스 경로에 따라 프로세싱되어야 하는지 또는 정규 과정에 따라 프로세싱되어야 하는지의 표시는, 더 높은 레벨의 구문과 함께 비트스트림에서 시그널링될 수도 있다. 위에서 설명된 CABAC 프로세스와 부합하여, 산술 인코딩 유닛 (702) 이 바이스패 과정으로부터 빈 값들을 수신하는 경우, 바이패스 디코딩 엔진 (704) 은 빈 값에 할당된 적응 콘텍스트를 활용하지 않고 빈 값들에 대해 산술 인코딩을 수행할 수도 있다. 일 예에서, 바이패스 디코딩 엔진 (704) 은 빈의 가능한 값들에 대해 동일한 확률들을 가정할 수도 있다.

산술 인코딩 유닛 (702) 이 정규 과정을 통해 빈 값들을 수신하는 경우에서, 콘텍스트 모델링 유닛 (708) 은 콘텍스트 변수를 제공할 수도 있고, 그 결과 정규 디코딩 엔진 (706) 은 콘텍스트 모델링 유닛 (708) 에 의해 제공된 콘텍스트 할당들에 기초하여 산술 인코딩을 수행할 수도 있다. 콘텍스트 할당들은 비디오 표준, 예컨대 HEVC에 따라 정의될 수도 있다. 콘텍스트 모델들은 메모리에 저장될 수도 있다. 콘텍스트 모델링 유닛 (708) 은 일련의 인덱스된 표들 (indexed tables) 을 포함할 수도 있고 및/또는 인코딩된 비트스트림의 콘텍스트와 콘텍스트 변수 부분을 결정하기 위해 매핑 함수들을 활용할 수도 있다. 빈 값을 디코딩한 후, 정규 코딩 엔진 (706) 은 디코딩된 빈 값들에 기초하여 콘텍스트를 업데이트할 수도 있다. 또한, 역이진화 유닛 (710) 은 빈 값에 대해 역이진화를 수행할 수도 있고 빈 값이 유효한지를 결정하기 위해 빈 매칭 함수를 사용할 수도 있다. 또한, 역이진화 유닛 (710) 은 매칭 결정에 기초하여 콘텍스트 모델링 유닛을 업데이트할 수도 있다. 따라서, 역이진화 유닛 (710) 은 콘텍스트 적응 디코딩 기술에 따라 구문 엘리먼트들을 출력한다.

엔트로피 디코딩 유닛 (70) 이 구문 엘리먼트들의 한 세트 내의 구문 엘리먼트들을 수신하는 순서는, 엔트로피 디코딩 유닛 (70) 이 구문 엘리먼트들의 그 세트를 디코딩하는 데 필요로 하는 싸이클들의 전체 수를 결정할 수도 있다. 일 예에서, 정규 디코딩 엔진 (706) 은 단일의 빈을 코딩하기 위해 2개 보다 많은 싸이클들을 필요로 할 수도 있다. 또한, 일 예에서, 정규 CABAC 디코딩 엔진 (706) 은 n개의 빈들을 인코딩하기 위해 n+M 개의 싸이클들을 필요로 할 수도 있는데, 여기서 M은 파이프라인을 시작하기 위한 오버헤드이다. M은 보통 0보다 더 크다. CABAC 디코딩 프로세스의 개시시 (즉, 스위치가 바이패스 모드에서 정규로 됨), 파이프라인 오버헤드 (M) 가 도입된다. 일 예에서, 바이패스 디코딩 엔진 (704) 은 n비트의 구문 엘리먼트를 코딩하는 데 하나의 싸이클을 필요로 할 수도 있다. 따라서, CABAC 빈들과 바이패스 빈들의 세트를 디코딩하기 위해 산술 인코딩 유닛 (510) 이 필요로 하는 싸이클들의 전체 수는, 파이프라인 오버헤드 (M) 가 도입된 횟수에 기초할 수도 있다. 이와 같이, 인트라 예측 구문 엘리먼트들이 코딩 구조에서 정렬되는 순서는, 비디오 디코더 (30) 가 비디오 데이터를 디코딩하는 데 필요로 하는 싸이클들의 수를 결정할 수도 있다. 또한, 도 7에 예시된 예시적인 엔트로피 디코딩 유닛 (70) 이 바이패스 인코딩 동작에서 정규 인코딩 동작으로 전환하는 것으로 설명되었지만, 몇몇 경우들에서, 이들 동작들은 병렬로 수행될 수도 있음을 주목해야만 한다. 그러나, 이 경우, 엔트로피 인코딩 유닛 (70) 이 바이패스 및 CABAC 코딩된 구문 엘리먼트들을 수신하는 순서는, 구문 엘리먼트들을 엔트로피 디코딩하는 데 필요한 싸이클들의 전체 수를 여전히 결정할 수도 있다.

도 6을 참조하면, 모션 보상 유닛 (72) 은 엔트로피 디코딩 유닛 (70) 으로부터 수신된 모션 벡터들에 기초하여 예측 데이터를 생성할 수도 있다. 모션 보상 유닛 (72) 은 비트스트림에서 수신된 모션 벡터들을 사용하여 참조 프레임 메모리 (82) 에서의 참조 프레임들의 예측 블록을 식별할 수도 있다. 어쩌면 보간 필터들에 기초한 보간을 수행하는 모션 보상 유닛 (72) 은 모션 보상된 블록들을 생성한다. 서브 픽셀 정밀도를 갖는 모션 추정에 사용될 보간 필터들에 대한 식별자들은 구문 엘리먼트들에 포함될 수도 있다. 모션 보상 유닛 (72) 은 비디오 블록의 인코딩 동안 비디오 인코더 (20) 에 의해 사용되는 것과 같이 보간 필터들을 사용하여 참조 블록의 서브 정수 픽셀들에 대한 보간된 값들을 계산할 수도 있다. 모션 보상 유닛 (72) 은 수신된 구문 정보에 따라 비디오 인코더 (20) 에 의해 사용된 보간 필터들을 결정하고 보간 필터들을 사용하여 예측 블록들을 생성할 수도 있다.

모션 보상 유닛 (72) 은 인코딩된 비디오 시퀀스의 프레임(들) 을 인코딩하기 위해 사용된 매크로블록들의 사이즈들을 결정하기 위한 구문 정보, 인코딩된 비디오 시퀀스의 프레임의 각 매크로블록이 어떻게 구획되는지를 설명하는 구획 정보, 각 구획이 어떻게 인코딩되는지를 나타내는 모드들, 각각의 인터 인코딩된 매크로블록 또는 구획에 대한 하나 이상의 참조 프레임들 (및 참조 프레임 리스트들), 및 인코딩된 비디오 시퀀스를 디코딩하기 위한 다른 정보 중 일부를 사용한다.

인트라 예측 유닛 (74) 은 비트스트림에서 수신된 인트라 예측 모드들을 사용하여 공간적으로 인접한 블록들로부터 예측 블록을 형성할 수도 있다. 인트라 예측 모드들은 위에서 설명된 인트라 예측 모드들을 포함할 수도 있다. 인트라 예측 유닛 (74) 은, 위에서 설명된 바와 같이, 구문 엘리먼트들 (prev_intra_luma_pred_flag, mpm_idx, rem_intra_luma_pred_mode, intra_chroma_pred_mode, 및 chroma_pred_from_luma_enable_flag) 에 따라 사용하기 위한 인트라 예측 모드를 결정할 수도 있다.

역양자화 유닛 (76) 은 비트스트림에서 제공되고 엔트로피 디코딩 유닛 (70) 에 의해 디코딩된 양자화된 블록 계수들을 역양자화, 즉, 탈양자화한다 (dequantizes). 역양자화 프로세스는, 예를 들면, H.264 디코딩 표준에서 정의된 것과 같은 종래의 프로세스를 포함할 수도 있다. 역양자화 프로세스는 양자화의 정도, 및, 마찬가지로, 적용되어야 하는 역양자화의 정도를 결정하기 위해, 각각의 매크로블록에 대해 비디오 인코더에 의해 계산된 양자화 파라미터 (QP_Y) 의 사용을 또한 포함할 수도 있다.

역변환 유닛 (78) 은, 픽셀 도메인에서의 잔차 블록들을 생성하기 위해 변환 계수들에 대해 역변환, 예를 들면, 역DCT, 역정수 변환, 또는 개념적으로 유사한 역변환 프로세스를 적용한다. 합산기 (80) 는 잔차 블록들을 모션 보상 유닛 (72) 또는 인트라 예측 유닛에 의해 생성된 대응하는 예측 블록들과 합산하여 디코딩된 블록들을 형성한다. 이런 식으로, 비디오 디코더 (30) 는 인코딩된 비트스트림으로부터 비디오 블록들을 재구성한다.

도 8은 본 개시의 기술들에 따라 비디오 데이터를 디코딩하는 예를 예시하는 흐름도이다. 도 8의 프로세스가 일반적으로 비디오 디코더 (30) 에 의해 수행되고 있는 것으로 하기에 설명되지만, 그 프로세스는 비디오 디코더 (30), 인트라 예측 유닛 (74) 및/또는 엔트로피 디코딩 유닛 (70) 의 임의의 조합에 의해 수행될 수도 있다.

도 8에 예시된 바와 같이, 비디오 디코더 (30) 는 구문 엘리먼트들의 제 1의 그룹을 수신한다 (802). 비디오 디코더 (30) 는 구문 엘리먼트들의 제 2의 그룹을 수신하는데, 구문 엘리먼트들의 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 제 1의 그룹의 각각의 구문 엘리먼트들에 대응한다 (804). 다시 말하면, 비디오 디코더 (30) 는, 코딩 단위 (CU) 의 예측 단위들 (PU들) 에 대한 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 제 2의 그룹을 포함하는 엔트로피 인코딩된 비트스트림을 수신한다.

일 예에서, 제 1의 그룹 내의 구문 엘리먼트는, 각각의 예측 단위 (PU) 의 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타낸다. 일 예에서, 제 1의 그룹은, INTRA_NxN PU 구조에서의 4개의 각각의 PU들에 대응하는 4개의 구문 엘리먼트 prev_intra_luma_pred_flag를 포함한다. 일 예에서, 구문 엘리먼트들의 제 2의 그룹에서의 구문 엘리먼트는, 위에서 설명된 바와 같이, 구문 엘리먼트들 (mpm_idx 또는 rem_intra_luma_pred_mode) 중 어느 하나일 수도 있다. 일 예에서, 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 제 2의 그룹은, 표 8에 관해 설명된 코딩 구조에 따라 정렬될 수도 있다. 이런 식으로, 비디오 디코더 (30) 가 플래그들의 세트와 각각의 구문 엘리먼트들을 수신하고 그것들에 대해 동작들을 수행하는 순서는, 코딩 구조에 따라 정의될 수도 있다.

비디오 디코더 (30) 는 구문 엘리먼트들의 제 1의 그룹을 CABAC 디코딩한다 (806). 일 예에서, 비디오 디코더 (30) 는 정규 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 엔진, 예컨대 도 7에 관해 설명된 정규 디코딩 엔진 (706) 을 사용하여 구문 엘리먼트들의 제 1의 그룹을 CABAC 디코딩한다. 비디오 디코더 (30) 는 구문 엘리먼트들의 제 2의 그룹을 CABAC 디코딩한다 (808). 일 예에서, 비디오 디코더 (30) 는 구문 엘리먼트들의 제 1의 그룹의 엔트로피 디코딩에 후속하여 구문 엘리먼트들의 제 2의 그룹을 엔트로피 디코딩할 수도 있다. 또한, 일 예에서, 비디오 디코더 (30) 는 바이패스 디코딩 엔진, 예컨대 도 7에 관해 설명된 바이패스 디코딩 엔진 (704) 을 사용하여 구문 엘리먼트들의 제 2의 그룹을 엔트로피 디코딩할 수도 있다. 비디오 디코더 (30) 는, 구문 엘리먼트들의 인코딩된 제 1의 그룹 및 구문 엘리먼트들의 인코딩된 제 2의 그룹에 기초하여 비디오 데이터를 디코딩하고 재구성한다 (810). 일 예에서, 비디오 디코더 (30) 는, 비디오 데이터의 잔차 블록들 및 각각의 구문 엘리먼트들과 관련된 비디오 데이터의 대응하는 예측 블록들을 합산하는 것에 의해 비디오 데이터를 재구성한다. 예를 들면, 비디오 디코더 (30) 는 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 디코딩된 제 2의 그룹에 기초하여 CU의 PU들을 인트라 예측 디코딩한다.

반복해서, 비디오 인코더 (20) 및 도 5에 관해 위에서 설명된 것과 유사하게, 구문 엘리먼트들의 제 1의 그룹의 예들은 복수의 플래그들 (예를 들면, prev_intra_luma_pred_flag 구문 엘리먼트들) 을 포함한다. 복수의 플래그들 중 한 플래그는, 각각의 PU의 루마 샘플들의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는 구문 엘리먼트들의 제 1의 그룹의 구문 엘리먼트일 수도 있다.

위에서 설명된 바와 같이, 비디오 디코더 (30) 가 구성하는 가장 가능성이 높은 모드들의 리스트는, 하나 이상의 이웃 PU들의 하나 이상의 인트라 예측 모드들을 식별한다. 몇몇 예들에서, 비디오 디코더 (30) 는, CU의 PU들에 대한 구문 엘리먼트들의 제 2의 그룹의 임의의 구문 엘리먼트들을 수신하기 이전에 CU의 PU들에 대한 구문 엘리먼트들의 제 1의 그룹의 모든 구문 엘리먼트들을 수신할 수도 있다. 몇몇 예들에서, 비디오 디코더 (30) 는, 구문 엘리먼트들의 제 2의 그룹의 임의의 구문 엘리먼트를 바이패스 인코딩하기 이전에 구문 엘리먼트들의 제 1의 그룹의 모든 구문 엘리먼트들을 CABAC 디코딩할 수도 있다.

위의 예들에서, CU에 대한 예측 모드가 INTRA_NxN이면, CU는 4개의 PU들을 포함하고, 각각의 PU는 전체 CU에 대해 단지 하나의 크로마 인트라 예측 모드 및 하나의 루마 인트라 예측 모드를 구비한다. 그러나, 이러한 설계에는 몇몇 잠재적인 단점들이 존재할 수도 있다. 일 예로서, 상이한 텍스쳐 패턴을 갖는 4개의 PU들이 하나의 동일한 크로마 예측 모드를 사용하도록 강제되기 때문에 비효율적인 예측 성능이 있을 수도 있다. 다른 예로서, 루마와 크로마 컴포넌트들 사이에서의 일관성이 없는 모드 시그널링이 있을 수도 있다.

전체 CU에 대해 하나의 크로마 인트라 예측 모드만이 존재해야 하는 요건과 관련된 단점들을 해결하기 위한 몇몇 예들이 하기에 설명된다. 하기의 기술들은 전체 CU에 대해 단지 하나의 크로마 인트라 예측 모드만이 존재하는 경우에 대해 위에서 설명된 기술들과 연계하여 적용될 수도 있거나 또는 전체 CU에 대해 단지 하나의 크로마 인트라 예측 모드만이 존재하는 경우에 대해 위에서 설명된 기술들과는 별도로 적용될 수도 있다.

위에서 도입된 비효율적인 예측 성능의 잠재적인 문제를 다루기 위해, 본 개시의 기술들은 루마 인트라 예측 모드에 대해 행해진 바와 같이 각각의 PU에 대해 하나의 chroma_intra_prediction_mode를 시그널링하는 것을 포함한다, 즉 현재의 HEVC 표준의 콘텍스트에서의 INTRA_NxN와 같이 예측 모드를 갖는 CU에 대해 4개의 chroma_intra_prediction_mode들이 시그널링된다. 이 설계를 통해, 하나의 "luma_intra_prediction_mode" 구문 엘리먼트와 "chroma_intra_prediction_mode" 구문 엘리먼트는 PU에 대한 인트라 예측 모드를 나타내기 위해 연속적으로 시그널링된다.

몇몇 예들에서, 현재의 CU 사이즈가 8x8과 동일하지 않고 최소 변환 단위 사이즈가 4x4가 아니면, 이 인트라 모드 시그널링 스킴은 적용될 수도 있다. 더 일반적으로는, 이 예외사항은 현재의 CU 사이즈가 각 치수에서 최소 transform_unit_size의 2배인 경우에 존재하며, 이것은 (소스 포맷이 YUV420이라고 가정하면) 현재의 CU의 크로마 컴포넌트가 최소 변환 단위 사이즈와 동일하고 더 이상 4개의 PU들로 분할될 수 없다는 것을 의미한다. 이러한 경우에서, 단지 하나의 chroma_intra_prediction_mode만이 현재 CU에 대해 시그널링된다.

이들 예들에 따르면, 인트라 모드들에 대한 코딩 구조는 표 11 및 표 12의 예들에서 도시된 바와 같이 구현될 수 있다.

전체 CU에 대한 크로마 샘플들에 대한 단지 하나의 인트라 예측 모드 대신, CU의 각각의 PU의 크로마 샘플들 및 각각의 PU의 루마 샘플들에 대한 인트라 예측 모드가 정의되는 예들이 하기에 설명된다. 표 13 및 표 14는, 각각, INTRA_2Nx2N과 INTRA_NxN에 대한 인트라 모드 코딩 구조에 대한 인트라 예측 구문을 정렬하는 방식을 정의하는데, 여기서는, 루마 인트라 예측 모드와 크로마 인트라 예측 모드의 모든 CABAC 코딩된 빈들이 함께 코딩되고, 그 다음 루마 인트라 예측 모드 및 크로마 인트라 예측 모드의 모든 바이패스 코딩된 빈들이 함께 코딩된다. 표 15 및 표 16은, 각각, INTRA_2Nx2N과 INTRA_NxN에 대한 인트라 모드 코딩 구조에 대한 인트라 예측 구문을 정렬하는 방식을 정의하는데, 여기서는, CU에서의 모든 PU들에 대한 인트라 예측 모드의 모든 CABAC 코딩된 빈들이 함께 코딩되고, 그 다음 인트라 예측 모드의 모든 바이패스 코딩된 빈들이 함께 코딩된다. 표 17 및 표 18은, 각각, INTRA_2Nx2N과 INTRA_NxN에 대한 인트라 모드 코딩 구조에 대한 인트라 예측 구문을 정렬하는 방식을 정의하는데, 여기서는, CU에서의 모든 PU들에 대한 루마 및 크로마 인트라 예측 모드 양자의 모든 CABAC 코딩된 빈들이 코딩되고, 그 다음 바이패스 코딩된 빈들 및 크로마 인트라 예측 모드가 함께 코딩된다.

하나 이상의 예들에서, 설명된 기능들은 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임의의 조합으로 구현될 수도 있다. 소프트웨어로 구현되는 경우, 기능들은 컴퓨터 판독 가능 매체 상의 하나 이상의 명령들 또는 코드로서 저장되거나 송신될 수도 있고 그리고 하드웨어 기반 프로세싱 유닛에 의해 실행될 수도 있다. 컴퓨터 판독가능 매체들은, 데이터 저장 매체들과 같은 유형의 매체, 또는 예를 들어, 통신 프로토콜에 따라, 한 곳에서 다른 곳으로 컴퓨터 프로그램의 전송을 가능하게 하는 임의의 매체를 포함하는 통신 매체들에 대응하는 컴퓨터 판독가능 저장 매체들을 포함할 수도 있다. 이러한 방식으로, 컴퓨터 판독 가능한 매체들은 일반적으로 (1) 비일시적인 유형의 컴퓨터 판독가능 저장 매체들 또는 (2) 신호 또는 반송파와 같은 통신 매체에 대응할 수도 있다. 데이터 저장 매체들은 본 개시에서 설명된 기술들의 구현을 위한 명령들, 코드, 및/또는 데이터 구조들을 취출하기 위해 하나 이상의 컴퓨터들 또는 하나 이상의 프로세서들에 의해 액세스될 수 있는 임의의 이용가능한 매체들일 수도 있다. 컴퓨터 프로그램 제품은 컴퓨터 판독가능 매체를 포함할 수도 있다.

비제한적인 예로서, 이러한 컴퓨터 판독가능 저장 매체들은 RAM, ROM, EEPROM, CD-ROM 또는 다른 광학 디스크 스토리지, 자기 디스크 스토리지, 또는 다른 자기 스토리지 디바이스들, 플래시 메모리, 또는 소망의 프로그램 코드를 명령들 또는 데이터 구조들의 형태로 저장하기 위해 사용될 수 있으며 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 접속은 컴퓨터 판독 가능한 매체라고 적절히 칭해진다. 예를 들면, 동축 케이블, 광섬유 케이블, 연선, 디지털 가입자 회선 (DSL), 또는 적외선, 라디오, 및 마이크로파와 같은 무선 기술들을 이용하여 웹사이트, 서버, 또는 다른 원격 소스로부터 명령들이 송신되면, 동축 케이블, 광섬유 케이블, 연선, DSL, 또는 적외선, 라디오, 및 마이크로파와 같은 무선 기술들은 매체의 정의 내에 포함된다. 그러나, 컴퓨터 판독가능 저장 매체들 및 데이터 저장 매체들은 접속부들, 반송파들, 신호들, 또는 다른 일시적 매체들을 포함하지 않고, 대신에 비일시적인 유형의 저장 매체들에 대한 것임이 이해되어야 한다. 본원에서 사용된 바와 같은 디스크 (disk) 와 디스크 (disc) 는, 컴팩트 디스크 (CD), 레이저 디스크, 광학 디스크, 디지털 다기능 디스크 (DVD), 플로피디스크 및 블루레이 디스크를 포함하며, 여기서 디스크 (disk) 는 통상 자기적으로 데이터를 재생하고, 디스크 (disc) 는 레이저를 이용하여 광학적으로 데이터를 재생한다. 위의 조합들도 또한 컴퓨터 판독가능 매체들의 범위 내에 포함되어야 한다.

명령들은, 하나 이상의 디지털 신호 프로세서들 (DSP들), 범용 마이크로프로세서들, 주문형 집적 회로들 (ASIC들), 필드 프로그래머블 로직 어레이 (FPGA들), 또는 다른 등가의 집적 또는 이산 로직 회로와 같은, 하나 이상의 프로세서들에 의해 실행될 수도 있다. 따라서, 본원에서 사용된 용어 "프로세서"는 임의의 앞서 설명된 구조 또는 본원에서 설명된 기술들의 구현에 적합한 임의의 다른 구조를 지칭할 수도 있다. 또한, 몇몇 양태들에서, 본원에서 설명된 기능성은 인코딩 및 디코딩을 위해 구성된 전용 하드웨어 및/또는 소프트웨어 모듈 내에 제공되거나, 또는 통합 코덱에 통합될 수도 있다. 또한, 기술들은 하나 이상의 회로들 또는 로직 소자들에서 완전히 구현될 수 있다.

본 개시의 기술들은, 무선 핸드셋, 집적 회로 (IC) 또는 ICs의 세트 (예를 들면, 칩셋) 를 포함하는 아주 다양한 디바이스들 또는 장치들에서 구현될 수도 있다. 개시된 기술들을 수행하도록 구성된 디바이스들의 기능적 양태를 강조하기 위해 다양한 컴포넌트들, 모듈들, 또는 유닛들이 본 개시에서 설명되었지만, 반드시 상이한 하드웨어 유닛들에 의해 실현될 필요는 없다. 대신, 상술한 바와 같이, 다양한 유닛들은, 적절한 소프트웨어 및/또는 펌웨어와 연계하여, 코덱 하드웨어 유닛에 통합되거나 또는 위에서 설명된 바와 같은 하나 이상의 프로세서들을 포함하는 상호 동작적인 하드웨어 유닛들의 집합에 의해 제공될 수도 있다.

다양한 예들을 설명하였다. 이들 및 다른 예들은 하기의 특허청구범위 내에 있다.

Claims

비디오 데이터를 디코딩하는 방법으로서,
코딩 단위 (coding unit; CU) 의 예측 단위들 (prediction units; PU들) 에 대한 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 제 2의 그룹을 포함하는 엔트로피 인코딩된 비트스트림을 수신하는 단계로서, 구문 엘리먼트들의 상기 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 상기 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하고, 구문 엘리먼트들의 상기 제 1의 그룹의 구문 엘리먼트는, 상기 CU에서의 각각의 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 엔트로피 인코딩된 비트스트림을 수신하는 단계;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 디코딩하는 단계;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC 디코딩하는 단계에 후속하여, 구문 엘리먼트들의 상기 제 2의 그룹을 바이패스 디코딩하는 단계; 및
구문 엘리먼트들의 디코딩된 상기 제 1의 그룹 및 구문 엘리먼트들의 디코딩된 상기 제 2의 그룹에 기초하여 상기 비디오 데이터를 재구성하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법.
제 1항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 복수의 플래그들을 포함하고,
상기 복수의 플래그들 중 한 플래그는, 상기 각각의 PU의 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하는지의 여부를 나타내는 구문 엘리먼트들의 상기 제 1의 그룹의 상기 구문 엘리먼트를 포함하고,
구문 엘리먼트들의 상기 제 2의 그룹은:
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초한다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스를 나타내는 제 1의 구문 엘리먼트; 및
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하지 않는다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드를 나타내는 제 2의 구문 엘리먼트
중 하나를 포함하는, 비디오 데이터를 디코딩하는 방법.
제 1항에 있어서,
가장 가능성이 높은 모드들의 상기 리스트는 하나 이상의 이웃 PU들의 하나 이상의 인트라 예측 모드들을 식별하는, 비디오 데이터를 디코딩하는 방법.
제 1항에 있어서,
상기 수신하는 단계는, 상기 CU의 상기 PU들에 대한 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트들을 수신하기 이전에 상기 CU의 상기 PU들에 대한 구문 엘리먼트들의 상기 제 1의 그룹의 모든 구문 엘리먼트들을 수신하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법.
제 1항에 있어서,
상기 CABAC 디코딩하는 단계는, 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트를 바이패스 디코딩하기 이전에 구문 엘리먼트들의 상기 제 1의 그룹의 모든 구문 엘리먼트들을 CABAC 디코딩하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법.
제 1항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 4개의 플래그들을 포함하고, 상기 4개의 플래그들의 각각은 상기 CU의 INTRA_NxN PU 구조의 각각의 PU와 관련되는, 비디오 데이터를 디코딩하는 방법.
제 1항에 있어서,
상기 재구성하는 단계는:
구문 엘리먼트들의 상기 제 1의 그룹 및 구문 엘리먼트들의 상기 제 2의 그룹에 기초하여 상기 CU의 상기 PU들을 인트라 예측 디코딩하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법.
비디오 데이터를 디코딩하는 장치로서,
상기 장치는 비디오 디코더를 포함하고, 상기 비디오 디코더는:
코딩 단위 (CU) 의 예측 단위들 (PU들) 에 대한 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 제 2의 그룹을 포함하는 엔트로피 인코딩된 비트스트림을 수신하는 것으로서, 구문 엘리먼트들의 상기 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 상기 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하고, 구문 엘리먼트들의 상기 제 1의 그룹의 구문 엘리먼트는, 상기 CU에서의 각각의 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 엔트로피 인코딩된 비트스트림을 수신하고;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 디코딩하고;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC 디코딩하는 것에 후속하여, 구문 엘리먼트들의 상기 제 2의 그룹을 바이패스 디코딩하고; 그리고
구문 엘리먼트들의 디코딩된 상기 제 1의 그룹 및 구문 엘리먼트들의 디코딩된 상기 제 2의 그룹에 기초하여 상기 비디오 데이터를 재구성하도록 구성되는, 비디오 데이터를 디코딩하는 장치.
제 8항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 복수의 플래그들을 포함하고,
상기 복수의 플래그들 중 한 플래그는, 상기 각각의 PU의 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하는지의 여부를 나타내는 구문 엘리먼트들의 상기 제 1의 그룹의 상기 구문 엘리먼트를 포함하고,
구문 엘리먼트들의 상기 제 2의 그룹은:
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초한다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스를 나타내는 제 1의 구문 엘리먼트; 및
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하지 않는다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드를 나타내는 제 2의 구문 엘리먼트
중 하나를 포함하는, 비디오 데이터를 디코딩하는 장치.
제 8항에 있어서,
가장 가능성이 높은 모드들의 상기 리스트는 하나 이상의 이웃 PU들의 하나 이상의 인트라 예측 모드들을 식별하는, 비디오 데이터를 디코딩하는 장치.
제 8항에 있어서,
상기 수신을 위해, 상기 비디오 디코더는 상기 CU의 상기 PU들에 대한 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트들을 수신하기 이전에 상기 CU의 상기 PU들에 대한 구문 엘리먼트들의 상기 제 1의 그룹의 모든 구문 엘리먼트들을 수신하도록 구성되는, 비디오 데이터를 디코딩하는 장치.
제 8항에 있어서,
상기 CABAC 디코딩을 위해, 상기 비디오 디코더는, 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트를 바이패스 디코딩하기 이전에 구문 엘리먼트들의 상기 제 1의 그룹의 모든 구문 엘리먼트들을 CABAC 디코딩하도록 구성되는, 비디오 데이터를 디코딩하는 장치.
제 8항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 4개의 플래그들을 포함하고, 상기 4개의 플래그들의 각각은 상기 CU의 INTRA_NxN PU 구조의 각각의 PU와 관련되는, 비디오 데이터를 디코딩하는 장치.
제 8항에 있어서,
상기 재구성을 위해, 상기 비디오 디코더는:
구문 엘리먼트들의 상기 제 1의 그룹 및 구문 엘리먼트들의 상기 제 2의 그룹에 기초하여 상기 CU의 상기 PU들을 인트라 예측 디코딩하도록 구성되는, 비디오 데이터를 디코딩하는 장치.
제 8항에 있어서,
상기 장치는:
집적 회로;
마이크로프로세서; 및
상기 비디오 디코더를 포함하는 무선 통신 디바이스
중 적어도 하나를 포함하는, 비디오 데이터를 디코딩하는 장치.
명령들이 저장된 컴퓨터 판독가능 저장 매체로서,
상기 명령들은 실행시 비디오 데이터를 디코딩하기 위한 디바이스의 하나 이상의 프로세서들로 하여금:
코딩 단위 (CU) 의 예측 단위들 (PU들) 에 대한 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 제 2의 그룹을 포함하는 엔트로피 인코딩된 비트스트림을 수신하게 하는 것으로서, 구문 엘리먼트들의 상기 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 상기 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하고, 구문 엘리먼트들의 상기 제 1의 그룹의 구문 엘리먼트는, 상기 CU에서의 각각의 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 엔트로피 인코딩된 비트스트림을 수신하게 하고;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 디코딩하게 하고;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC 디코딩하는 것에 후속하여, 구문 엘리먼트들의 상기 제 2의 그룹을 바이패스 디코딩하게 하고; 그리고
구문 엘리먼트들의 디코딩된 상기 제 1의 그룹 및 구문 엘리먼트들의 디코딩된 상기 제 2의 그룹에 기초하여 상기 비디오 데이터를 재구성하게 하는, 컴퓨터 판독가능 저장 매체.
제 16항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 복수의 플래그들을 포함하고,
상기 복수의 플래그들 중 한 플래그는, 상기 각각의 PU의 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하는지의 여부를 나타내는 구문 엘리먼트들의 상기 제 1의 그룹의 상기 구문 엘리먼트를 포함하고,
구문 엘리먼트들의 상기 제 2의 그룹은:
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초한다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스를 나타내는 제 1의 구문 엘리먼트; 및
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하지 않는다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드를 나타내는 제 2의 구문 엘리먼트
중 하나를 포함하는, 컴퓨터 판독가능 저장 매체.
제 16항에 있어서,
가장 가능성이 높은 모드들의 상기 리스트는 하나 이상의 이웃 PU들의 하나 이상의 인트라 예측 모드들을 식별하는, 컴퓨터 판독가능 저장 매체.
제 16항에 있어서,
상기 하나 이상의 프로세서들로 하여금 수신하게 하는 명령들은, 상기 하나 이상의 프로세서들로 하여금, 상기 CU의 상기 PU들에 대한 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트들을 수신하기 이전에 상기 CU의 상기 PU들에 대한 구문 엘리먼트들의 상기 제 1의 그룹의 모든 구문 엘리먼트들을 수신하게 하는 명령들을 포함하는, 컴퓨터 판독가능 저장 매체.
제 16항에 있어서,
상기 하나 이상의 프로세서들로 하여금 CABAC 디코딩하게 하는 명령들은, 상기 하나 이상의 프로세서들로 하여금, 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트를 바이패스 디코딩하기 이전에 구문 엘리먼트들의 상기 제 1의 그룹의 모든 구문 엘리먼트들을 CABAC 디코딩하게 하는 명령들을 포함하는, 컴퓨터 판독가능 저장 매체.
제 16항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 4개의 플래그들을 포함하고, 상기 4개의 플래그들의 각각은 상기 CU의 INTRA_NxN PU 구조의 각각의 PU와 관련되는, 컴퓨터 판독가능 저장 매체.
제 16항에 있어서,
상기 하나 이상의 프로세서들로 하여금 재구성하게 하는 명령들은, 상기 하나 이상의 프로세서들로 하여금:
구문 엘리먼트들의 상기 제 1의 그룹 및 구문 엘리먼트들의 상기 제 2의 그룹에 기초하여 상기 CU의 상기 PU들을 인트라 예측 디코딩하게 하는 명령들을 포함하는, 컴퓨터 판독가능 저장 매체.
비디오 데이터를 디코딩하는 장치로서,
코딩 단위 (CU) 의 예측 단위들 (PU들) 에 대한 구문 엘리먼트들의 제 1의 그룹 및 구문 엘리먼트들의 제 2의 그룹을 포함하는 엔트로피 인코딩된 비트스트림을 수신하는 수단으로서, 구문 엘리먼트들의 상기 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 상기 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하고, 구문 엘리먼트들의 상기 제 1의 그룹의 구문 엘리먼트는, 상기 CU에서의 각각의 PU의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 엔트로피 인코딩된 비트스트림을 수신하는 수단;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 디코딩하는 수단;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC 디코딩하는 것에 후속하여, 구문 엘리먼트들의 상기 제 2의 그룹을 바이패스 디코딩하는 수단; 및
구문 엘리먼트들의 디코딩된 상기 제 1의 그룹 및 구문 엘리먼트들의 디코딩된 상기 제 2의 그룹에 기초하여 상기 비디오 데이터를 재구성하는 수단을 포함하는, 비디오 데이터를 디코딩하는 장치.
제 23항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 복수의 플래그들을 포함하고,
상기 복수의 플래그들 중 한 플래그는, 상기 각각의 PU의 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하는지의 여부를 나타내는 구문 엘리먼트들의 상기 제 1의 그룹의 상기 구문 엘리먼트를 포함하고,
구문 엘리먼트들의 상기 제 2의 그룹은:
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초한다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스를 나타내는 제 1의 구문 엘리먼트; 및
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하지 않는다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드를 나타내는 제 2의 구문 엘리먼트
중 하나를 포함하는, 비디오 데이터를 디코딩하는 장치.
비디오 데이터를 인코딩하는 방법으로서,
구문 엘리먼트들의 제 1의 그룹을 생성하는 단계로서, 구문 엘리먼트들의 상기 제 1의 그룹의 구문 엘리먼트는, 코딩 단위 (CU) 에서의 각각의 예측 단위 (PU) 의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 제 1의 그룹을 생성하는 단계;
구문 엘리먼트들의 제 2의 그룹을 생성하는 단계로서, 구문 엘리먼트들의 상기 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 상기 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하는, 상기 제 2의 그룹을 생성하는 단계;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 인코딩하는 단계;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC 인코딩하는 단계에 후속하여, 구문 엘리먼트들의 상기 제 2의 그룹을 바이패스 인코딩하는 단계; 및
구문 엘리먼트들의 인코딩된 상기 제 1의 그룹 및 구문 엘리먼트들의 인코딩된 상기 제 2의 그룹을 포함하는 상기 비디오 데이터를 출력하는 단계를 포함하는, 비디오 데이터를 인코딩하는 방법.
제 25항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 복수의 플래그들을 포함하고,
상기 복수의 플래그들 중 한 플래그는, 상기 각각의 PU의 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하는지의 여부를 나타내는 구문 엘리먼트들의 상기 제 1의 그룹의 상기 구문 엘리먼트를 포함하고,
구문 엘리먼트들의 상기 제 2의 그룹은:
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초한다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스를 나타내는 제 1의 구문 엘리먼트; 및
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하지 않는다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드를 나타내는 제 2의 구문 엘리먼트
중 하나를 포함하는, 비디오 데이터를 인코딩하는 방법.
제 25항에 있어서,
가장 가능성이 높은 모드들의 상기 리스트는 하나 이상의 이웃 PU들의 하나 이상의 인트라 예측 모드들을 식별하는, 비디오 데이터를 인코딩하는 방법.
제 25항에 있어서,
상기 출력하는 단계는, 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트들을 출력하기 이전에 구문 엘리먼트들의 인코딩된 상기 제 1의 그룹의 모든 구문 엘리먼트들을 포함하는 상기 비디오 데이터를 출력하는 단계를 포함하는, 비디오 데이터를 인코딩하는 방법.
제 25항에 있어서,
상기 CABAC 인코딩하는 단계는, 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트를 바이패스 디코딩하기 이전에 구문 엘리먼트들의 상기 제 1의 그룹의 모든 구문 엘리먼트들을 CABAC 인코딩하는 단계를 포함하는, 비디오 데이터를 인코딩하는 방법.
제 25항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 4개의 플래그들을 포함하고, 상기 4개의 플래그들의 각각은 상기 CU의 INTRA_NxN PU 구조의 각각의 PU와 관련되는, 비디오 데이터를 인코딩하는 방법.
제 25항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹 및 구문 엘리먼트들의 상기 제 2의 그룹에 기초하여 상기 CU의 상기 PU들을 인트라 예측 인코딩하는 단계를 더 포함하는, 비디오 데이터를 인코딩하는 방법.
비디오 데이터를 인코딩하는 장치로서,
상기 장치는 비디오 인코더를 포함하고, 상기 비디오 인코더는:
구문 엘리먼트들의 제 1의 그룹을 생성하는 것으로서, 구문 엘리먼트들의 상기 제 1의 그룹의 구문 엘리먼트는, 코딩 단위 (CU) 에서의 각각의 예측 단위 (PU) 의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 제 1의 그룹을 생성하고;
구문 엘리먼트들의 제 2의 그룹을 생성하는 것으로서, 구문 엘리먼트들의 상기 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 상기 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하는, 상기 제 2의 그룹을 생성하고;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 인코딩하고;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC 인코딩하는 것에 후속하여, 구문 엘리먼트들의 상기 제 2의 그룹을 바이패스 인코딩하고; 그리고
구문 엘리먼트들의 인코딩된 상기 제 1의 그룹 및 구문 엘리먼트들의 인코딩된 상기 제 2의 그룹을 포함하는 상기 비디오 데이터를 출력하도록 구성되는, 비디오 데이터를 인코딩하는 장치.
제 32항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 복수의 플래그들을 포함하고,
상기 복수의 플래그들 중 한 플래그는, 상기 각각의 PU의 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하는지의 여부를 나타내는 구문 엘리먼트들의 상기 제 1의 그룹의 상기 구문 엘리먼트를 포함하고,
구문 엘리먼트들의 상기 제 2의 그룹은:
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초한다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스를 나타내는 제 1의 구문 엘리먼트; 및
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하지 않는다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드를 나타내는 제 2의 구문 엘리먼트
중 하나를 포함하는, 비디오 데이터를 인코딩하는 장치.
제 32항에 있어서,
가장 가능성이 높은 모드들의 상기 리스트는 하나 이상의 이웃 PU들의 하나 이상의 인트라 예측 모드들을 식별하는, 비디오 데이터를 인코딩하는 장치.
제 32항에 있어서,
상기 출력을 위해, 상기 비디오 인코더는, 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트들을 출력하기 이전에 구문 엘리먼트들의 상기 인코딩된 제 1의 그룹의 모든 구문 엘리먼트들을 포함하는 상기 비디오 데이터를 출력하도록 구성되는, 비디오 데이터를 인코딩하는 장치.
제 32항에 있어서,
상기 CABAC 인코딩을 위해, 상기 비디오 인코더는, 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트를 바이패스 인코딩하기 이전에 구문 엘리먼트들의 상기 제 1의 그룹의 모든 구문 엘리먼트들을 CABAC 인코딩하도록 구성되는, 비디오 데이터를 인코딩하는 장치.
제 32항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 4개의 플래그들을 포함하고, 상기 4개의 플래그들의 각각은 상기 CU의 INTRA_NxN PU 구조의 각각의 PU와 관련되는, 비디오 데이터를 인코딩하는 장치.
제 32항에 있어서,
상기 비디오 인코더는:
구문 엘리먼트들의 상기 제 1의 그룹 및 구문 엘리먼트들의 상기 제 2의 그룹에 기초하여 상기 CU의 상기 PU들을 인트라 예측 인코딩하도록 구성되는, 비디오 데이터를 인코딩하는 장치.
명령들이 저장된 컴퓨터 판독가능 저장 매체로서,
상기 명령들은 실행시 비디오 데이터를 인코딩하기 위한 디바이스의 하나 이상의 프로세서들로 하여금:
구문 엘리먼트들의 제 1의 그룹을 생성하게 하는 것으로서, 구문 엘리먼트들의 상기 제 1의 그룹의 구문 엘리먼트는, 코딩 단위 (CU) 에서의 각각의 예측 단위 (PU) 의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 제 1의 그룹을 생성하게 하고;
구문 엘리먼트들의 제 2의 그룹을 생성하게 하는 것으로서, 구문 엘리먼트들의 상기 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 상기 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하는, 상기 제 2의 그룹을 생성하게 하고;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 인코딩하게 하고;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC 인코딩하는 것에 후속하여, 구문 엘리먼트들의 상기 제 2의 그룹을 바이패스 인코딩하게 하고; 그리고
구문 엘리먼트들의 인코딩된 상기 제 1의 그룹 및 구문 엘리먼트들의 인코딩된 상기 제 2의 그룹을 포함하는 상기 비디오 데이터를 출력하게 하는, 컴퓨터 판독가능 저장 매체.
제 39항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 복수의 플래그들을 포함하고,
상기 복수의 플래그들 중 한 플래그는, 상기 각각의 PU의 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하는지의 여부를 나타내는 구문 엘리먼트들의 상기 제 1의 그룹의 상기 구문 엘리먼트를 포함하고,
구문 엘리먼트들의 상기 제 2의 그룹은:
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초한다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스를 나타내는 제 1의 구문 엘리먼트; 및
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하지 않는다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드를 나타내는 제 2의 구문 엘리먼트
중 하나를 포함하는, 컴퓨터 판독가능 저장 매체.
제 39항에 있어서,
가장 가능성이 높은 모드들의 상기 리스트는 하나 이상의 이웃 PU들의 하나 이상의 인트라 예측 모드들을 식별하는, 컴퓨터 판독가능 저장 매체.
제 39항에 있어서,
상기 하나 이상의 프로세서들로 하여금 출력하게 하는 명령들은, 상기 하나 이상의 프로세서들로 하여금, 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트들을 출력하기 이전에 구문 엘리먼트들의 상기 인코딩된 제 1의 그룹의 모든 구문 엘리먼트들을 포함하는 상기 비디오 데이터를 출력하게 하는 명령들을 포함하는, 컴퓨터 판독가능 저장 매체.
제 39항에 있어서,
상기 하나 이상의 프로세서들로 하여금 CABAC 인코딩하게 하는 명령들은, 상기 하나 이상의 프로세서들로 하여금, 구문 엘리먼트들의 상기 제 2의 그룹의 임의의 구문 엘리먼트를 바이패스 인코딩하기 이전에 구문 엘리먼트들의 상기 제 1의 그룹의 모든 구문 엘리먼트들을 CABAC 인코딩하게 하는 명령들을 포함하는, 컴퓨터 판독가능 저장 매체.
제 39항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 4개의 플래그들을 포함하고, 상기 4개의 플래그들의 각각은 상기 CU의 INTRA_NxN PU 구조의 각각의 PU와 관련되는, 컴퓨터 판독가능 저장 매체.
제 39항에 있어서,
상기 하나 이상의 프로세서들로 하여금:
구문 엘리먼트들의 상기 제 1의 그룹 및 구문 엘리먼트들의 상기 제 2의 그룹에 기초하여 상기 CU의 상기 PU들을 인트라 예측 인코딩하게 하는 명령들을 더 포함하는, 컴퓨터 판독가능 저장 매체.
비디오 데이터를 인코딩하는 장치로서,
구문 엘리먼트들의 제 1의 그룹을 생성하는 수단으로서, 구문 엘리먼트들의 상기 제 1의 그룹의 구문 엘리먼트는, 코딩 단위 (CU) 에서의 각각의 예측 단위 (PU) 의 인트라 예측 모드가 가장 가능성이 높은 모드들의 리스트로의 인덱스에 기초하는지의 여부를 나타내는, 상기 제 1의 그룹을 생성하는 수단;
구문 엘리먼트들의 제 2의 그룹을 생성하는 수단으로서, 구문 엘리먼트들의 상기 제 2의 그룹의 구문 엘리먼트들은 구문 엘리먼트들의 상기 제 1의 그룹의 각각의 구문 엘리먼트들에 대응하는, 상기 제 2의 그룹을 생성하는 수단;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC (context adaptive binary arithmetic coding; 콘텍스트 적응 이진 산술 코딩) 인코딩하는 수단;
구문 엘리먼트들의 상기 제 1의 그룹을 CABAC 인코딩하는 것에 후속하여, 구문 엘리먼트들의 상기 제 2의 그룹을 바이패스 인코딩하는 수단; 및
구문 엘리먼트들의 인코딩된 상기 제 1의 그룹 및 구문 엘리먼트들의 인코딩된 상기 제 2의 그룹을 포함하는 상기 비디오 데이터를 출력하는 수단을 포함하는, 비디오 데이터를 인코딩하는 장치.
제 46항에 있어서,
구문 엘리먼트들의 상기 제 1의 그룹은 복수의 플래그들을 포함하고,
상기 복수의 플래그들 중 한 플래그는, 상기 각각의 PU의 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하는지의 여부를 나타내는 구문 엘리먼트들의 상기 제 1의 그룹의 상기 구문 엘리먼트를 포함하고,
구문 엘리먼트들의 상기 제 2의 그룹은:
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초한다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스를 나타내는 제 1의 구문 엘리먼트; 및
상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드가 가장 가능성이 높은 모드들의 상기 리스트로의 상기 인덱스에 기초하지 않는다는 것을 구문 엘리먼트들의 상기 제 1의 그룹에서의 상기 플래그가 나타내면, 상기 각각의 PU의 상기 루마 샘플들의 상기 인트라 예측 모드를 나타내는 제 2의 구문 엘리먼트
중 하나를 포함하는, 비디오 데이터를 인코딩하는 장치.