KR20170115060A

KR20170115060A - 비디오 코딩에서 파라미터 세트들 및 동기 샘플들의 배치

Info

Publication number: KR20170115060A
Application number: KR1020177022074A
Authority: KR
Inventors: 예-쿠이 왕; 프누 헨드리
Original assignee: 퀄컴 인코포레이티드
Priority date: 2015-02-11
Filing date: 2016-02-11
Publication date: 2017-10-16
Also published as: BR112017017280A2; EP3257263A1; EA201791568A1; WO2016130808A1; JP2018509079A; US11418812B2; CN107211199A; KR102527431B1; CN115442669A; JP6833702B2; AU2016219265A1; JP7001787B2; US20160234526A1; EA035232B1; AU2016219265B2; TN2017000311A1; JP2021013193A

Abstract

파일 포맷들 및 비디오 데이터의 파싱 및 코딩은 코딩된 비디오 데이터의 더욱 효율적인 랜덤 액세스가능성을 촉진시키도록 정의된다. 제약들은 파라미터 세트들의 배치 및 비디오 파일들에서의 동기 샘플들의 정의에 대해 부과될 수도 있다. 비디오 데이터에 대한 파라미터 세트 데이터는 비-동기 샘플에 대하여, 오직 샘플에 대한 샘플 엔트리, 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플에서, 또는 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플에서 코딩될 수도 있다.

Description

비디오 코딩에서 파라미터 세트들 및 동기 샘플들의 배치{PLACEMENT OF PARAMETER SETS AND SYNC SAMPLES IN VIDEO CODING}

이 출원은 2015 년 2 월 11 일자로 출원된 미국 가출원 제 62/115,013 호의 이익을 주장하고, 그 전체 내용들은 본원에 참조로 편입된다.

이 개시물은 비디오 코딩 및 압축과, 비트스트림에서의 압축된 비디오와 연관된 데이터의 시그널링에 관한 것이다.

디지털 비디오 기능들은, 디지털 텔레비전들, 디지털 다이렉트 브로드캐스트 시스템들, 무선 브로드캐스트 시스템들, 개인 정보 단말 (PDA) 들, 랩톱 또는 데스크톱 컴퓨터들, 태블릿 컴퓨터들, 전자책 리더 (e-book reader) 들, 디지털 카메라들, 디지털 레코딩 디바이스들, 디지털 미디어 플레이어들, 비디오 게임용 디바이스들, 비디오 게임 콘솔들, 셀룰러 또는 위성 라디오 전화들, 소위 "스마트폰들", 화상 원격회의 디바이스들, 비디오 스트리밍 디바이스들 등을 포함하는 광범위한 디바이스들 내로 편입될 수 있다. 디지털 비디오 디바이스들은 MPEG-2, MPEG-4, ITU-T H.263, ITU-T H.264/MPEG-4, Part 10, 진보된 비디오 코딩 (Advanced Video Coding; AVC), 고효율 비디오 코딩 (HEVC) 에 의해 정의된 표준들, 및 이러한 표준들의 확장들에서 설명된 것들과 같은 비디오 압축 기법들을 구현한다. 비디오 디바이스들은 이러한 비디오 압축 기법들을 구현함으로써 디지털 비디오 정보를 더 효율적으로 송신하고, 수신하고, 인코딩하고, 디코딩하고, 및/또는 저장할 수도 있다.

비디오 압축 기법들은 비디오 시퀀스들에 내재된 중복성을 감소시키거나 제거하기 위해 공간적 (인트라-픽처 (intra-picture)) 예측 및/또는 시간적 (인터-픽처 (inter-picture)) 예측을 수행한다. 블록-기반 비디오 코딩을 위하여, 비디오 슬라이스 (즉, 비디오 프레임 또는 비디오 프레임의 부분) 는 비디오 블록들로 파티셔닝될 수도 있으며, 이 비디오 블록들은 트리블록 (treeblock) 들, 코딩 유닛 (CU) 들 및/또는 코딩 노드들로서 또한 지칭될 수도 있다. 픽처의 인트라-코딩된 (I) 슬라이스에서의 비디오 블록들은 동일한 픽처에서의 이웃하는 블록들 내의 참조 샘플들에 대한 공간적 예측을 이용하여 인코딩된다. 픽처의 인터-코딩된 (P 또는 B) 슬라이스 내의 비디오 블록들은 동일한 픽처에서의 이웃하는 블록들 내의 참조 샘플들에 대한 공간적 예측, 또는 다른 참조 픽처들에서의 참조 샘플들에 대한 시간적 예측을 이용할 수도 있다. 픽처들은 프레임들로서 지칭될 수도 있고, 참조 픽처들은 참조 프레임들로서 지칭될 수도 있다.

공간적 또는 시간적 예측은 코딩되어야 할 블록에 대한 예측 블록으로 귀착된다. 잔차 데이터 (residual data) 는 코딩되어야 할 원래의 블록과 예측 블록 사이의 픽셀 차이들을 표현한다. 인터-코딩된 블록은 예측 블록을 형성하는 참조 샘플들의 블록을 지시하는 모션 벡터와, 코딩된 블록 및 예측 블록 사이의 차이를 표시하는 잔차 데이터에 따라 인코딩된다. 인트라-코딩된 블록은 인트라-코딩 모드 및 잔차 데이터에 따라 인코딩된다. 추가의 압축을 위하여, 잔차 데이터는 픽셀 도메인으로부터 변환 도메인으로 변환되어 잔차 변환 계수들로 귀착될 수도 있고, 그 후 이들은 양자화될 수도 있다. 초기에 2 차원 어레이로 배치된 양자화된 변환 계수들은 변환 계수들의 1 차원 벡터를 생성하기 위하여 스캔될 수도 있고, 엔트로피 코딩은 훨씬 더 많은 압축을 달성하기 위하여 적용될 수도 있다.

이 개시물의 기법들은 파일 포맷들의 정의 및 비디오 데이터의 파싱 및/또는 코딩에 관한 것이다. 예를 들어, 비디오 코딩에서, 파라미터 세트는 각각의 시퀀스 또는 픽처에 대하여 반복될 필요가 없음으로써, 코딩 효율을 증가시키는 시퀀스-레벨 헤더 정보 또는 드물게 변경되는 픽처-레벨 정보를 포함할 수도 있다. 이 개시물의 양태들은 비디오 비트스트림에서의 파라미터 세트들의 배치에 관한 제약들을 부과하고 비디오 파일들에서 동기 샘플 (sync sample) 들 및 비-동기 샘플 (non-sync sample) 들을 정의함으로써, 코딩된 비디오 데이터의 효율적인 랜덤 액세스가능성을 가능하게 할 수도 있다. 예를 들어, 비디오 데이터에 대한 파라미터 세트 데이터는 동기 샘플에 대하여, 오직 샘플에 대한 샘플 엔트리 또는 샘플 자체에서 코딩될 수도 있다. 비디오 데이터에 대한 파라미터 세트 데이터는 비-동기 샘플에 대하여, 오직 샘플에 대한 샘플 엔트리, 샘플 자체, 동기 샘플인 디코딩 순서에서의 이전의 샘플에서, 또는 비-동기 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플에서 코딩될 수도 있다.

예에서, 비디오 데이터를 디코딩하는 방법은 비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하는 단계, 및 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 샘플에 대한 샘플 엔트리, 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플로부터, 또는 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플로부터, 비디오 데이터에 대한 파라미터 세트 데이터를 결정하는 단계를 포함한다.

또 다른 예에서, 비디오 데이터를 인코딩하는 방법은 비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하는 단계, 및 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 샘플에 대한 샘플 엔트리, 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플에서, 또는 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플에서, 비디오 데이터에 대한 파라미터 세트 데이터를 인코딩하는 단계를 포함한다.

또 다른 예에서, 비디오 데이터를 디코딩하기 위한 디바이스는 비디오 데이터를 저장하도록 구성된 메모리, 및 하나 이상의 프로세서들을 포함하고, 하나 이상의 프로세서들은 비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하고, 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 샘플에 대한 샘플 엔트리, 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플로부터, 또는 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플로부터, 비디오 데이터에 대한 파라미터 세트 데이터를 결정하도록 구성된다.

또 다른 예에서, 비디오 데이터를 인코딩하기 위한 디바이스는 비디오 데이터를 저장하도록 구성된 메모리, 및 비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하고, 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 샘플에 대한 샘플 엔트리, 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플에서, 또는 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플에서, 비디오 데이터에 대한 파라미터 세트 데이터를 포함하도록 구성된 하나 이상의 프로세서들을 포함한다.

또 다른 예에서, 비디오 데이터를 디코딩하기 위한 디바이스는 비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하기 위한 수단, 및 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 샘플에 대한 샘플 엔트리, 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플로부터, 또는 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플로부터, 비디오 데이터에 대한 파라미터 세트 데이터를 결정하기 위한 수단을 포함한다.

또 다른 예에서, 비디오 데이터를 인코딩하기 위한 디바이스는 비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하기 위한 수단, 및 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 샘플에 대한 샘플 엔트리, 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플에서, 또는 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플에서, 비디오 데이터에 대한 파라미터 세트 데이터를 포함하기 위한 수단을 포함한다.

또 다른 예에서, 비-일시적 컴퓨터-판독가능 매체는, 실행될 경우, 하나 이상의 프로세서들로 하여금, 비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하게 하고, 그리고 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 샘플에 대한 샘플 엔트리, 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플로부터, 또는 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플로부터, 비디오 데이터에 대한 파라미터 세트 데이터를 결정하게 하는 그 상에 저장된 명령들을 포함한다.

또 다른 예에서, 비-일시적 컴퓨터-판독가능 매체는, 실행될 경우, 하나 이상의 프로세서들로 하여금, 비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하게 하고, 그리고 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 샘플에 대한 샘플 엔트리, 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플에서, 또는 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플에서, 비디오 데이터에 대한 파라미터 세트 데이터를 포함하게 하는 그 상에 저장된 명령들을 포함한다.

개시물의 하나 이상의 예들의 세부 사항들은 동반된 도면들 및 이하의 설명에서 기재된다. 다른 특징들, 목적들, 및 장점들은 설명 , 도면들, 및 청구항들로부터 명백할 것이다.

도 1 은 이 개시물에서 설명된 기법들을 사용할 수도 있는 일 예의 비디오 인코딩 및 디코딩 시스템을 예시하는 블록도이다.
도 2 는 이 개시물에서 설명된 기법들을 구현할 수도 있는 일 예의 비디오 인코더를 예시하는 블록도이다.
도 3 은 이 개시물에서 설명된 기법들을 구현할 수도 있는 일 예의 비디오 디코더를 예시하는 블록도이다.
도 4 는 일 예의 비디오 파일의 엘리먼트들을 예시하는 블록도이다.
도 5 는 비디오 비트스트림으로부터 파라미터 세트 데이터를 디코딩하기 위한 프로세스를 예시하는 흐름도이다.
도 6 은 비디오 비트스트림에서 파라미터 세트 데이터를 인코딩하기 위한 프로세스를 예시하는 흐름도이다.

이 개시물의 기법들은 파일 포맷들에서의 비디오 컨텐츠들의 저장에 관한 것이다. 더욱 구체적으로, 기법들은 파라미터 세트들의 배치에 관한 강제하는 제약들 및 비디오 파일들에서의 동기 샘플들 및 비-동기 샘플들의 정의를 통해 코딩된 비디오 데이터의 효율적인 랜덤 액세스가능성을 가능하게 할 수도 있다.

비디오 코딩 표준들은 그 스케일러블 비디오 코딩 (SVC) 및 멀티뷰 비디오 코딩 (MVC) 확장들을 포함하는, ITU-T H.261, ISO/IEC MPEG-1 비주얼, ITU-T H.262 또는 ISO/IEC MPEG-2 비주얼, ITU-T H.263, ISO/IEC MPEG-4 비주얼, ITU-T H.264 또는 ISO/IEC MPEG-4 AVC 와, 그 스케일러블 코딩 확장 (즉, 스케일러블 고효율 비디오 코딩 (scalable high-efficiency video coding), SHVC) 및 멀티뷰 확장 (즉, 멀티뷰 고효율 비디오 코딩 (multiview high efficiency video coding), MV-HEVC) 을 포함하는, ITU-T H.265 및 ISO/IEC 23008-2 로서 또한 알려진, 고효율 비디오 코딩 (High-Efficiency Video Coding; HEVC) 을 포함한다.

랜덤 액세스는 비트스트림에서의 최초 코딩된 픽처가 아닌 코딩된 픽처로부터 시작하는 비트스트림의 디코딩을 지칭할 수도 있다. 비트스트림에 대한 랜덤 액세스는 예컨대, 사용자들이 언제든지 프로그램에 튜닝 (tune-in) 하거나, 상이한 채널들 사이에서 스위칭하거나, 비디오의 특정 부분들로 점프하거나, 또는 스트림 적응 (예컨대, 비트 레이트, 프레임 레이트, 공간적 해상도 등의 적응) 을 위하여 상이한 비트스트림으로 스위칭하기 위하여, 브로드캐스팅 및 스트리밍과 같은 다수의 비디오 애플리케이션들에서 제공된다. 이 특징은 랜덤 액세스 픽처들 또는 랜덤 액세스 포인트들을 규칙적인 간격들로 다수 회 비디오 비트스트림 내로 삽입함으로써 가능하게 된다.

AVC 또는 HEVC 에서 특정된 바와 같은 순간적 디코딩 리프레시 (instantaneous decoding refresh; IDR) 픽처들은 랜덤 액세스를 위하여 이용될 수 있다. 일반적으로, IDR 픽처는 인트라-코딩된 데이터를 포함할 수도 있고, 디코딩된 픽처 버퍼의 픽처들로 하여금, 소거되게 하고 및/또는 참조를 위하여 비이용되는 것으로 표기되게 할 수도 있다. 그러나, 디코딩 순서에서 IDR 픽처를 후행하는 픽처들은 IDR 픽처 이전에 디코딩된 픽처들을 참조로서 이용할 수 없으므로, 랜덤 액세스를 위하여 IDR 픽처들에 의존하는 비트스트림들은 상당히 더 낮은 코딩 효율을 가질 수 있다.

코딩 효율을 개선시키기 위하여, 클린 랜덤 액세스 (clean random access; CRA) 픽처들의 개념은, 디코딩 순서에서 CRA 픽처를 후행하지만, 출력 순서에서 그것을 선행하는 CRA 픽처가 CRA 픽처 전에 디코딩된 픽처들을 참조로서 이용하는 것을 허용하기 위하여 HEVC 에서 도입되었다. 디코딩 순서에서 CRA 픽처를 후행하지만 출력 순서에서 CRA 픽처를 선행하는 픽처들은 CRA 픽처와 연관된 선두 픽처 (leading picture) 들 (또는 CRA 픽처의 선두 픽처들) 로서 지칭된다. CRA 픽처의 선두 픽처들은 디코딩이 현재의 CRA 픽처 전에 IDR 또는 CRA 픽처로부터 시작할 경우에 올바르게 디코딩가능하다. 그러나, CRA 픽처의 선두 픽처들은 CRA 픽처로부터의 랜덤 액세스가 발생할 때에 비-디코딩가능 (non-decodable) 할 수도 있고; 이 때문에, 선두 픽처들은 전형적으로 랜덤 액세스 디코딩 동안에 폐기된다. 디코딩이 시작하는 곳에 따라 이용가능하지 않을 수도 있는 참조 픽처들로부터의 에러 전파를 방지하기 위하여, 디코딩 순서 및 출력 순서의 양자에서 CRA 픽처를 후행하는 모든 픽처들은 (선두 픽처들을 포함하는) 디코딩 순서 또는 출력 순서의 어느 하나에서 CRA 픽처를 선행하는 임의의 픽처를 참조로서 이용하지 않을 수도 있다.

파손된 링크 액세스 (broken link access; BLA) 픽처의 개념은 CRA 픽처들의 도입 후에 HEVC 에서 추가로 도입되었고, CRA 픽처들의 개념에 기초하고 있다. BLA 픽처는 전형적으로 CRA 픽처의 위치에서 (이하에서 더욱 상세하게 설명된 바와 같은) 비트스트림 스플라이싱 (bitstream splicing) 으로부터 유래하고, 스플라이싱된 비트스트림에서, 스플라이싱 포인트 CRA 픽처는 BLA 픽처로 변경된다.

IDR 픽처들, CRA 픽처들, 및 BLA 픽처들은 집합적으로 랜덤 액세스 포인트 (RAP) 픽처들로서 지칭된다. IDR 픽처들은 소위 픽처들의 폐쇄 그룹 (closed group of pictures; GOP) 기반 RAP 들에 대응하는 반면, CRA 및 BLA 픽처들은 기존의 소위 픽처들의 개방 그룹 기반 RAP 들에 대응한다.

BLA 픽처들과 CRA 픽처들 사이의 하나의 차이는, CRA 픽처에 대하여, 연관된 선두 픽처들은 디코딩이 디코딩 순서에서 CRA 픽처 전에 RAP 픽처로부터 시작할 경우에 올바르게 디코딩가능하고, CRA 픽처로부터의 랜덤 액세스가 발생할 때 (즉, 디코딩이 CRA 픽처로부터 시작할 때, 또는 다시 말해서, CRA 픽처가 비트스트림에서의 최초 픽처일 때), 올바르게 디코딩가능하지 않을 수도 있다는 것이다. BLA 픽처에 대하여, 디코딩이 디코딩 순서에서 BLA 픽처 전에 RAP 픽처로부터 시작하더라도, 연관된 선두 픽처들은 모든 경우들에 있어서 비-디코딩가능할 수도 있다.

비디오 비트스트림을 랜덤하게 액세스하는 것은 또한, 인트라 코딩되지 않은 점진적 디코딩 리프레시 (gradual decoding refresh; GDR) 픽처로부터 시작할 수도 있지만, 어떤 수의 픽처들이 디코딩된 후에는, 디코딩 순서에서의 모든 후행하는 픽처들이 올바르게 디코딩될 수 있다. GDR 을 달성하기 위한 비디오 기법들의 검토를 위하여, 이 논문: Miska M. Hannuksela, Ye-Kui Wang, 및 Moncef Gabbouj, "Isolated regions in video coding", IEEE Transactions on Multimedia, vol. 6, no. 2, pp. 259-267, Apr. 2004 을 참조한다.

일부 예들에서, 비디오 비트스트림을 랜덤하게 액세스하는 것은 비트스트림 스플라이싱 동안에 수행될 수도 있다. 비트스트림 스플라이싱은 2 개 이상의 비트스트림들 또는 그 부분들의 연접 (concatenation) 을 지칭할 수도 있다. 예를 들어, 스플라이싱된 비트스트림을 생성하기 위한 비트스트림들의 하나 또는 양자의 어느 하나에 대한 일부 수정들과 함께, 제 1 비트스트림은 제 2 비트스트림에 의해 첨부될 수도 있다. 제 2 비트스트림에서의 최초 코딩된 픽처는 또한, 스플라이싱 포인트로서 지칭된다. 그러므로, 스플라이싱된 비트스트림에서 스플라이싱 포인트 후에 발생하는 픽처들은 제 2 비트스트림으로부터 유래된 반면, 스플라이싱된 비트스트림에서 스플라이싱 포인트를 선행하는 픽처들은 제 1 비트스트림으로부터 유래되었다.

비트스트림들의 스플라이싱은 비트스트림 스플라이서 (bitstream splicer) 들에 의해 수행될 수도 있다. 비트스트림 스플라이서들은 종종 경량이고 인코더들보다 훨씬 덜 지능적일 수도 있다. 예를 들어, 스플라이서들은 엔트로피 디코딩 및 인코딩 능력들을 구비하지 않을 수도 있다. 일부 예들에서, 비트스트림 스플라이서는 서버 또는 다른 컨텐츠 준비 디바이스에서 포함될 수도 있다. 비트스트림 스위칭은 적응적 스트리밍 환경들에서 이용될 수도 있다. 스위치-투 (switch-to) 비트스트림에서의 어떤 픽처에서의 비트스트림 스위칭 동작은 사실상 비트스트림 스플라이싱 동작이고, 여기서, 스플라이싱 포인트는 비트스트림 스위칭 포인트, 즉, 스위치-투 비트스트림으로부터의 최초 픽처이다.

일부 사례들에서, 코딩된 비디오 데이터는 특정한 파일 포맷으로 저장될 수도 있다. 일 예의 파일 포맷 표준들은 ISO 기본 미디어 파일 포맷 (ISO base media file format) (ISOBMFF, ISO/IEC 14496-12) 을 포함한다. ISOBMFF 는 AVC 파일 포맷과 같은 다수의 코덱 캡슐화 포맷들뿐만 아니라, MPEG-4 파일 포맷, 3GPP 파일 포맷 (3GP), 및 DVB 파일 포맷과 같은 다수의 멀티미디어 컨테이너 포맷들에 대한 기초로서 이용될 수도 있다. 예를 들어, ISOBMFF 로부터 유도된 다른 파일 포맷들은 MPEG-4 파일 포맷 (ISO/IEC 14496-14), 3GPP 파일 포맷 (3GPP TS 26.244), 및 AVC 파일 포맷 (ISO/IEC 14496-15) 을 포함할 수도 있다.

오디오 및 비디오와 같은 연속적인 미디어에 추가하여, 이미지들과 같은 정적 미디어뿐만 아니라 메타데이터는 ISOBMFF 를 준수하는 파일에서 저장될 수 있다. ISOBMFF 에 따라 구성된 파일들은, 로컬 미디어 파일 재생, 원격 파일, 동적 적응 스트리밍 오버 HTTP (Dynamic Adaptive Streaming over HTTP; DASH) 를 위한 세그먼트들, 스트리밍되어야 할 컨텐츠에 대한 컨테이너들 및 그 패킷화 명령들의 프로그레시브 다운로딩, 및 수신된 실시간 미디어 스트림들의 레코딩을 포함하는 다수의 목적들을 위하여 이용될 수도 있다.

박스는 4-문자 코딩된 박스 타입, 박스의 바이트 카운트 및 페이로드를 포함하는, ISOBMFF 에서의 기본 신택스 구조를 지칭할 수도 있다. ISOBMFF 파일은 박수들의 시퀀스로 구성되고, 박스들은 다른 박스들을 포함할 수도 있다. 영화 박스 ("moov") 는, 각각의 하나가 파일에서 트랙으로서 표현된, 파일에서 존재하는 연속적인 미디어 스트림들에 대한 메타데이터를 포함한다.

트랙에 대한 메타데이터는 트랙 박스 ("trak") 에서 동봉되는 반면, 트랙의 미디어 컨텐츠는 미디어 데이터 박스 ("mdat") 에서, 또는 별도의 파일에서 직접적으로 중의 어느 하나로 동봉된다. 트랙들에 대한 미디어 컨텐츠는 오디오 또는 비디오 액세스 유닛들과 같은 샘플들의 시퀀스로 구성된다. 액세스 유닛은 일반적으로, 공통적인 시간 인스턴스에 대한 코딩된 픽처 데이터를 포함하는 데이터의 유닛이다. 샘플은 본원에서 설명된 비디오 코딩 사양들과 같은 특정한 사양에 의해 정의된 바와 같은 액세스 유닛이다. 샘플 엔트리는 대응하는 샘플의 설명을 제공할 수도 있다.

ISOBMFF 는 다음 타입들의 트랙들을 특정한다: 기본 미디어 스트림을 포함하는 미디어 트랙, 미디어 송신 명령들을 포함하거나 수신된 패킷 스트림을 표현하는 것 중의 어느 하나인 힌트 트랙, 및 시간-동기화된 메타데이터를 포함하는 타이밍 정해진 메타데이터 트랙.

저장을 위하여 원래 설계되지만, ISOBMFF 는 스트리밍을 위하여, 예컨대, 프로그레시브 다운로드 또는 DASH 를 위하여 소중한 것임을 입증하였다. 스트리밍의 목적들을 위하여, ISOBMFF 에서 정의된 영화 프래그먼트들이 이용될 수도 있다. 각각의 트랙에 대한 메타데이터는, 각각이 트랙에서 이용된 코딩 또는 캡슐화 포맷 및 그 포맷을 프로세싱하기 위하여 필요하게 된 초기화 데이터를 제공하는 샘플 설명 엔트리들 (샘플 엔트리들로서 또한 지칭됨) 의 리스트를 포함한다. 각각의 샘플은 트랙의 샘플 설명 엔트리들 중의 하나와 연관될 수도 있다. 본원에서 설명된 바와 같이, 샘플은 비디오 코딩에서의 액세스 유닛에 대응할 수도 있다. 예를 들어, 샘플은 공통적인 시간 인스턴스에 대한 모든 뷰 컴포넌트들 (예컨대, 모든 네트워크 추상화 계층 (network abstraction layer; NAL) 유닛들) 을 포함하는 비디오 데이터의 유닛에 대응할 수도 있다. 파라미터 세트 샘플은 시간에 있어서의 동일한 인스턴스에서 비디오 기본 스트림에서 존재하는 것으로 고려되어야 하는 파라미터 세트 NAL 유닛들을 포함하는 파라미터 세트 스트림에서의 샘플일 수도 있다.

ISOBMFF 는 샘플-특정 메타데이터가 다양한 메커니즘들로 특정되는 것을 가능하게 한다. 샘플 테이블 박스 ("stbl") 내의 특정 박스들은 공통적인 필요성들에 대하여 응답하도록 표준화되었다. 예를 들어, 동기 샘플 박스 ("stss") 는 트랙의 (이하에서 설명된 바와 같은) 랜덤 액세스 샘플들을 열거하기 위하여 이용된다. 샘플 그룹화 메커니즘은 파일에서의 샘플 그룹 설명 엔트리로서 특정된 동일한 성질을 공유하는 샘플들의 그룹들로의, 4-문자 그룹화 타입에 따른 샘플들의 맵핑을 가능하게 한다. 몇몇 그룹화 타입들이 ISOBMFF 에서 특정되었다.

ISOBMFF 사양은 DASH 와의 이용을 위하여 6 개의 타입들의 스트림 액세스 포인트 (SAP) 들을 특정한다. 최초의 2 개의 SAP 타입들 (타입들 1 및 2) 은 H.264/AVC 및 HEVC 에서의 IDR 픽처들에 대응한다. 제 3 SAP 타입 (타입 3) 은 개방-GOP 랜덤 액세스 포인트들; 이 때문에, HEVC 에서의 BLA 또는 CRA 픽처들에 대응한다. 제 4 SAP 타입 (타입 4) 은 GDR 랜덤 액세스 포인트들에 대응한다.

그러나, 어구 "랜덤 액세스 포인트" 는 ISOBMFF 전반에 걸쳐 다수의 그리고 잠재적으로 불일치한 정의들을 가질 수도 있다. 예를 들어, ISOBMFF 의 하나의 부분을 준수하는 비디오 코더 (예컨대, 비디오 인코더 또는 비디오 디코더) 는 ISOBMFF 의 또 다른 부분을 준수하는 비디오 코더와 상이하게, 샘플이 랜덤 액세스 포인트인지 여부를 결정할 수도 있다. 랜덤 액세스 포인트가 상이한 디바이스들 (예컨대, 비디오 데이터를 인코딩/패키징하는 것을 담당하는 디바이스 및 비디오 데이터를 파싱/디코딩하는 것을 담당하는 디바이스) 에 의해 상이하게 해독될 때, 파일은 적절하게 전달 및/또는 재생되지 않을 수도 있다.

예를 들어, ISOBMFF 에서의 용어 "랜덤 액세스 포인트" 의 상이한 해독들이 있으므로, AVC 파일 포맷, SVC 파일 포맷, MVC 파일 포맷, 및 HEVC 파일 포맷에서의 파라미터 세트들의 배치에 관한 제약은 상이한 해독들을 가질 수 있다. 따라서, 파일은 다른 구현예들에 의해서가 아니라, 일부 구현예들에 의해 ISOBMFF 를 준수하는 것으로서 고려될 수도 있다. 이러한 불일치들로 인해, 비디오 코더는 랜덤 액세스 포인트들과 연관된 조건들이 파라미터 세트들과 연관된 조건들과 같은 특정한 비트스트림에 대하여 충족되었는지 여부를 정확하게 및/또는 일치되게 결정할 수 없을 수도 있다. 일부 경우들에는, 파일이 요청되거나 재생되는 것이 거부될 수도 있다.

이 개시물의 기법들은 논의된 쟁점들 중의 하나 이상을 다룰 수도 있다. 예를 들어, 이 개시물의 양태들에 따르면, AVC 파일 포맷, SVC 파일 포맷, MVC 파일 포맷, 및 HEVC 파일 포맷에서의 파라미터 세트들의 배치에 관한 제약들은 ISOBMFF 에 대하여 업데이트될 수도 있어서, 상기 언급된 상호운용성 쟁점이 해결된다.

예를 들어, 이 개시물의 양태들에 따르면, 비디오 코더 (예컨대, 비디오 인코더 또는 비디오 디코더) 는 비디오 데이터의 샘플 (예컨대, 시간에 있어서의 특정한 인스턴스에 대한 적어도 하나의 코딩된 픽처를 포함하는 액세스 유닛) 이 동기 샘플인지 여부를 결정할 수도 있다. 일반적으로, 동기 샘플은 (예컨대, 비트스트림 스위칭 또는 스플라이싱 동안에) 동기화를 위하여 이용될 수도 있는 샘플이다. 샘플은 이하에서 더욱 상세하게 설명된 바와 같이, 랜덤 액세스를 위한 조건들이 충족될 경우에 동기 샘플로 고려될 수도 있어서, 비디오 디코더는 동기 샘플, 및 디코딩 순서에서 동기 샘플을 후행하는 모든 샘플들을 적절하게 디코딩하는 것을 시작할 수 있다.

이 개시물의 양태들에 따르면, 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 비디오 디코더는 오직 샘플에 대한 샘플 엔트리에서, 또는 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이까지의 디코딩 순서로 발생하는 샘플에서, 비디오 데이터에 대한 파라미터 세트 데이터를 디코딩할 수도 있다. 즉, 비디오 디코더는 오직 비-동기 샘플에 대한 샘플 엔트리, 비-동기 샘플 자체, 디코딩 순서에서의 이전의 동기 샘플, 또는 이전의 동기 샘플과 비-동기 샘플 사이의 하나 이상의 샘플들로부터, 비-동기 샘플의 비디오 데이터를 디코딩하기 위하여 필요하게 된 파라미터 세트 데이터를 결정할 수도 있다. 예를 들어, 샘플이 동기 샘플이 아니고 파라미터 세트 데이터가 특정된 것들과는 비트스트림의 임의의 다른 로케이션 내에 포함될 경우, 비디오 디코더 (30) 는 파일을 비-준수하는 것으로서 거부할 수도 있고, 샘플을 디코딩하지 않을 수도 있다. 이하에서 더욱 상세하게 설명된 바와 같이, 파라미터 세트는 각각의 시퀀스 또는 픽처에 대하여 반복될 필요가 없는 (이것에 의해, 코딩 효율을 증가시킴) 시퀀스-레벨 헤더 정보 또는 드물게 변경되는 픽처-레벨 정보를 포함할 수도 있다.

도 1 은 이 개시물의 양태들에 따라, 하나 이상의 타겟 출력 계층들을 결정하기 위한 기법들을 사용할 수도 있는 일 예의 비디오 인코딩 및 디코딩 시스템 (10) 을 예시하는 블록도이다. 도 1 에서 도시된 바와 같이, 시스템 (10) 은 목적지 디바이스 (14) 에 의해 더 이후의 시간에 디코딩되어야 할 인코딩된 비디오 데이터를 제공하는 소스 디바이스 (12) 를 포함한다. 특히, 소스 디바이스 (12) 는 컴퓨터-판독가능 매체 (16) 를 통해 비디오 데이터를 목적지 디바이스 (14) 에 제공한다.

소스 디바이스 (12) 및 목적지 디바이스 (14) 는, 데스크톱 컴퓨터들, 노트북 (즉, 랩톱) 컴퓨터들, 태블릿 컴퓨터들, 셋톱 (set-top) 박스들, 소위 "스마트" 폰들과 같은 전화 핸드셋들, 소위 "스마트" 패드들, 텔레비전들, 카메라들, 디스플레이 디바이스들, 디지털 미디어 플레이어들, 비디오 게임용 콘솔들, 비디오 스트리밍 디바이스들 등을 포함하는 광범위한 디바이스들 중의 임의의 것을 포함할 수도 있다. 일부 경우들에는, 소스 디바이스 (12) 및 목적지 디바이스 (14) 가 무선 통신을 위하여 구비될 수도 있다.

목적지 디바이스 (14) 는 컴퓨터-판독가능 매체 (16) 를 통해, 디코딩되어야 할 인코딩된 비디오 데이터를 수신할 수도 있다. 컴퓨터-판독가능 매체 (16) 는 인코딩된 비디오 데이터를 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로 이동시킬 수 있는 임의의 타입의 매체 또는 디바이스를 포함할 수도 있다. 하나의 예에서, 컴퓨터-판독가능 매체 (16) 는 소스 디바이스 (12) 가 인코딩된 비디오 데이터를 실시간으로 목적지 디바이스 (14) 로 직접 송신하는 것을 가능하게 하기 위한 통신 매체를 포함할 수도 있다.

인코딩된 비디오 데이터는 무선 통신 프로토콜과 같은 통신 표준에 따라 변조될 수도 있고, 목적지 디바이스 (14) 로 송신될 수도 있다. 통신 매체는 라디오 주파수 (radio frequency; RF) 스펙트럼 또는 하나 이상의 물리적 송신 라인들과 같은 임의의 무선 또는 유선 통신 매체를 포함할 수도 있다. 통신 매체는 로컬 영역 네트워크, 광역 네트워크, 또는 인터넷과 같은 글로벌 네트워크와 같은 패킷-기반 네트워크의 일부를 형성할 수도 있다. 통신 매체는 라우터들, 스위치들, 기지국들, 또는 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로의 통신을 가능하게 하기 위해 유용할 수도 있는 임의의 다른 장비를 포함할 수도 있다.

일부 예들에서, 인코딩된 데이터는 출력 인터페이스 (22) 로부터 저장 디바이스로 출력될 수도 있다. 유사하게, 인코딩된 데이터는 입력 인터페이스 (28) 에 의해 저장 디바이스로부터 액세스될 수도 있다. 저장 디바이스는 하드 드라이브, 블루-레이 (Blu-ray) 디스크들, DVD 들, CD-ROM 들, 플래시 메모리, 휘발성 또는 비-휘발성 메모리, 또는 인코딩된 비디오 데이터를 저장하기 위한 임의의 다른 적당한 디지털 저장 매체들과 같은, 분산되거나 국소적으로 액세스된 다양한 데이터 저장 매체들 중의 임의의 것을 포함할 수도 있다. 추가의 예에서, 저장 디바이스는 소스 디바이스 (12) 에 의해 생성된 인코딩된 비디오를 저장할 수도 있는 파일 서버 또는 또 다른 중간 저장 디바이스에 대응할 수도 있다.

목적지 디바이스 (14) 는 스트리밍 또는 다운로드를 통해 저장 디바이스로부터 저장된 비디오 데이터를 액세스할 수도 있다. 파일 서버는 인코딩된 비디오 데이터를 저장할 수 있으며 그 인코딩된 비디오 데이터를 목적지 디바이스 (14) 로 송신할 수 있는 임의의 타입의 서버일 수도 있다. 일 예의 파일 서버들은 (예컨대, 웹사이트를 위한) 웹 서버, FTP 서버, 네트워크 연결 저장 (network attached storage; NAS) 디바이스들, 또는 로컬 디스크 드라이브를 포함한다.

목적지 디바이스 (14) 는 인터넷 접속을 포함하는 임의의 표준 데이터 접속을 통해 인코딩된 비디오 데이터를 액세스할 수도 있다. 이것은, 파일 서버 상에 저장된 인코딩된 비디오 데이터를 액세스하기에 적당한 무선 채널 (예컨대, Wi-Fi 접속), 유선 접속 (예컨대, DSL, 케이블 모뎀 등), 또는 양자의 조합을 포함할 수도 있다. 저장 디바이스로부터의 인코딩된 비디오 데이터의 송신은 스트리밍 송신, 다운로드 송신, 또는 그 조합일 수도 있다.

이 개시물의 기법들은 무선 애플리케이션들 또는 세팅들로 반드시 제한되는 것은 아니다. 기법들은 오버-디-에어 (over-the-air) 텔레비전 브로드캐스트들, 케이블 텔레비전 송신들, 위성 텔레비전 송신들, HTTP 를 통한 동적 적응 스트리밍 (DASH) 과 같은 인터넷 스트리밍 비디오 송신들, 데이터 저장 매체 상으로 인코딩되는 디지털 비디오, 데이터 저장 매체 상에 저장된 디지털 비디오의 디코딩, 또는 다른 애플리케이션들과 같은, 다양한 멀티미디어 애플리케이션들 중의 임의의 것의 지원 하에서 비디오 코딩에 적용될 수도 있다. 일부 예들에서, 시스템 (10) 은 비디오 스트리밍, 비디오 재생, 비디오 브로드캐스팅, 및/또는 화상 통화 (video telephony) 와 같은 애플리케이션들을 지원하기 위하여 일방향 (one-way) 또는 양방향 (two-way) 비디오 송신을 지원하도록 구성될 수도 있다.

도 1 의 예에서, 소스 디바이스 (12) 는 비디오 소스 (18), 비디오 인코더 (20), 캡슐화 유닛 (encapsulation unit; 21), 및 출력 인터페이스 (22) 를 포함한다. 목적지 디바이스 (14) 는 입력 인터페이스 (28), 역캡슐화 유닛 (decapsulation unit; 29), 비디오 디코더 (30), 및 디스플레이 디바이스 (32) 를 포함한다. 다른 예들에서, 소스 디바이스 및 목적지 디바이스는 다른 컴포넌트들 또는 배열들을 포함할 수도 있다. 예를 들어, 소스 디바이스 (12) 는 외부 카메라와 같은 외부 비디오 소스 (18) 로부터 비디오 데이터를 수신할 수도 있다. 마찬가지로, 목적지 디바이스 (14) 는 통합된 디스플레이 디바이스를 포함하는 것이 아니라, 외부 디스플레이 디바이스와 인터페이스할 수도 있다.

도 1 의 예시된 시스템 (10) 은 단지 하나의 예이다. 본원에서 설명된 기법들은 임의의 디지털 비디오 인코딩 및/또는 디코딩 디바이스에 의해 수행될 수도 있다. 일반적으로, 이 개시물의 기법들은 비디오 인코딩 디바이스에 의해 수행되지만, 기법들은 또한, "CODEC" 으로서 전형적으로 지칭된 비디오 인코더/디코더에 의해 수행될 수도 있다. 또한, 이 개시물의 기법들은 또한, 비디오 프리프로세서 (video preprocessor) 에 의해 수행될 수도 있다.

소스 디바이스 (12) 및 목적지 디바이스 (14) 는, 소스 디바이스 (12) 가 목적지 디바이스 (14) 로의 송신을 위한 코딩된 비디오 데이터를 생성하는 이러한 코딩 디바이스들의 단지 예들이다. 일부 예들에서, 디바이스들 (12, 14) 은, 디바이스들 (12, 14) 의 각각이 비디오 인코딩 및 디코딩 컴포넌트들을 포함하도록 실질적으로 대칭적인 방식으로 동작할 수도 있다. 이 때문에, 시스템 (10) 은 예컨대, 비디오 스트리밍, 비디오 재생, 비디오 브로드캐스팅, 또는 화상 통화를 위하여, 비디오 디바이스들 (12, 14) 사이의 일방향 또는 양방향 비디오 송신을 지원할 수도 있다.

소스 디바이스 (12) 의 비디오 소스 (18) 는 비디오 카메라와 같은 비디오 캡처 디바이스, 이전에 캡처된 비디오를 포함하는 비디오 아카이브 (video archive), 및/또는 비디오 컨텐츠 제공자로부터 비디오를 수신하기 위한 비디오 공급 인터페이스를 포함할 수도 있다. 추가의 대안으로서, 비디오 소스 (18) 는 소스 비디오로서, 또는 라이브 비디오 (live video), 아카이빙된 비디오 (archived video), 및 컴퓨터-생성된 비디오의 조합으로서, 컴퓨터 그래픽-기반 데이터를 생성할 수도 있다. 일부 경우들에는, 비디오 소스 (18) 가 비디오 카메라일 경우, 소스 디바이스 (12) 및 목적지 디바이스 (14) 는 소위 카메라 폰들 또는 비디오 폰들을 형성할 수도 있다. 그러나, 위에서 언급된 바와 같이, 이 개시물에서 설명된 기법들은 일반적으로 비디오 코딩에 적용가능할 수도 있고, 무선 및/또는 유선 애플리케이션들에 적용될 수도 있다. 각각의 경우에 있어서, 캡처된, 프리-캡처된 (pre-captured), 또는 컴퓨터-생성된 비디오는 비디오 인코더 (20) 에 의해 인코딩될 수도 있다.

비디오 인코더 (20) 는 일반적으로 인코딩된 비디오 데이터의 스트림을 생성한다. (오디오 또는 비디오든지) 데이터의 각각의 개별적인 스트림은 기본 스트림으로서 지칭될 수도 있다. 기본 스트림은 표현의 단일의 디지털 방식으로 코딩된 (아마도 압축된) 컴포넌트이다. 예를 들어, 표현의 코딩된 비디오 또는 오디오 부분은 기본 스트림일 수 있다. 기본 스트림은 비디오 파일 내에서 캡슐화되기 전에, 패킷화된 기본 스트림 (packetized elementary stream; PES) 으로 변환될 수도 있다. 일부 예들에서, 비디오 인코더 (20) 는 인코딩된 데이터로부터 PES 패킷들을 형성하기 위한 패킷화기들을 포함할 수도 있다. 다른 예들에서, 비디오 인코더 (20) 는 인코딩된 데이터로부터 PES 패킷들을 형성하기 위한 개개의 패킷화기들과 인터페이싱할 수도 있다. 또 다른 예들에서, 비디오 인코더 (20) 는 인코딩된 오디오 및 비디오 데이터로부터 PES 패킷들을 형성하기 위한 패킷화기들을 포함할 수도 있다.

캡슐화 유닛 (21) 은 비디오 인코더 (20) 로부터 표현의 기본 스트림들에 대한 PES 패킷들을 수신하고, PES 패킷들로부터 대응하는 NAL 유닛들을 형성한다. H.264/AVC 및 HEVC 의 예들에서, 코딩된 비디오 세그먼트들은, 화상 통화, 저장, 브로드캐스트, 또는 스트리밍과 같은 "네트워크-친화적" 비디오 표현 어드레싱 애플리케이션을 제공하는 NAL 유닛들로 편성된다. NAL 유닛들은 비디오 코딩 계층 (VCL) NAL 유닛들 및 비-VCL NAL 유닛들로 범주화될 수 있다. VCL 유닛들은 코어 압축 엔진을 포함할 수도 있고, 블록, 매크로블록, 및/또는 슬라이스 레벨 데이터를 포함할 수도 있다. 다른 NAL 유닛들은 비-VCL NAL 유닛들일 수도 있다. 일부 예들에서, 주 코딩된 픽처로서 통상적으로 제시된, 하나의 시간 인스턴스에서의 코딩된 픽처는 하나 이상의 NAL 유닛들을 포함할 수도 있는 액세스 유닛 내에 포함될 수도 있다.

위에서 언급된 바와 같이, 액세스 유닛은 일반적으로, 공통적인 시간 인스턴스에 대한 모든 뷰 컴포넌트들 (예컨대, 모든 NAL 유닛들) 을 포함하는 데이터의 유닛이다. 액세스 유닛의 뷰 컴포넌트들은 함께 출력되도록 (즉, 실질적으로 동시에 출력됨) 의도된 것이고, 여기서, 픽처를 출력하는 것은 일반적으로, 디코딩된 픽처 버퍼 (DPB) 로부터의 픽처들을 전송하는 것 (예컨대, DPB 로부터의 픽처들을 외부 메모리에 저장하는 것, DPB 로부터의 픽처들을 디스플레이로 전송하는 것, DPB 로부터 픽처들을 제거하는 것 등) 을 수반한다.

비-VCL NAL 유닛들은 그 중에서도, 파라미터 세트 NAL 유닛들 및 SEI NAL 유닛들을 포함할 수도 있다. 파라미터 세트들은 (시퀀스 파라미터 세트 (SPS) 들에서의) 시퀀스-레벨 헤더 정보 및 (픽처 파라미터 세트 (PPS) 들에서의) 드물게 변경되는 픽처-레벨 헤더 정보를 포함할 수도 있다. 파라미터 세트들 (예컨대, PPS 및 SPS) 로, 드물게 변경되는 정보는 각각의 시퀀스 또는 픽처에 대하여 반복될 필요가 없고; 이 때문에, 코딩 효율은 개선될 수도 있다. 또한, 파라미터 세트들의 이용은 중요한 헤더 정보의 대역외 (out-of-band) 송신을 가능하게 할 수도 있어서, 에러 복원 (error resilience) 을 위한 중복 송신 (redundant transmission) 들에 대한 필요성을 회피할 수도 있다. 대역외 송신의 예들에서, 파라미터 세트 NAL 유닛들은 SEI NAL 유닛들과 같은 다른 NAL 유닛들과는 상이한 채널 상에서 송신될 수도 있다.

보충 강화 정보 (Supplemental Enhancement Information; SEI) 는, VCL NAL 유닛들로부터의 코딩된 픽처들 샘플들을 디코딩하기 위하여 필요하지 않지만, 디코딩, 디스플레이, 에러 복원, 및 다른 목적들에 관련된 프로세스들을 보조할 수도 있는 정보를 포함할 수도 있다. SEI 메시지들은 비-VCL NAL 유닛들 내에 포함될 수도 있다. SEI 메시지들은 일부 표준 사양들의 규범적 부분이고, 이에 따라, 표준 호환적 디코덩 구현을 위하여 항상 의무적인 것은 아니다. SEI 메시지들은 시퀀스 레벨 SEI 메시지들 또는 픽처 레벨 SEI 메시지들일 수도 있다. 일부 시퀀스 레벨 정보는 SVC 의 예에서의 스케일러빌러티 정보 SEI 메시지들 및 MVC 에서의 뷰 스케일러빌러티 정보 SEI 메시지들과 같은 SEI 메시지들 내에 포함될 수도 있다. 이 예의 SEI 메시지들은 예컨대, 동작 포인트들의 추출 및 동작 포인트들의 특성들에 관한 정보를 전달할 수도 있다. 게다가, 캡슐화 유닛 (21) 은 표현들의 특성들을 설명하는 미디어 제시 디스크립터 (media presentation descriptor; MPD) 와 같은 매니페스트 파일 (manifest file) 을 형성할 수도 있다. 캡슐화 유닛 (21) 은 확장가능한 마크업 언어 (extensible markup language; XML) 에 따라 MPD 를 포맷팅할 수도 있다.

출력 인터페이스 (22) 는 인코딩된 비디오를 컴퓨터-판독가능 매체 (16) 상으로 출력할 수도 있다. 컴퓨터-판독가능 매체 (16) 는 무선 브로드캐스트 또는 유선 네트워크 송신과 같은 순시적 매체 (transient medium) 들, 또는 하드 디스크, 플래시 드라이브, 컴팩트 디스크, 디지털 비디오 디스크, 블루-레이 디스크, 또는 다른 컴퓨터-판독가능 매체들과 같은 저장 매체들 (즉, 비-일시적 저장 매체들) 을 포함할 수도 있다. 일부 예들에서, 네트워크 서버 (도시되지 않음) 는 예컨대, 네트워크 송신을 통해, 소스 디바이스 (12) 로부터 인코딩된 비디오 데이터를 수신할 수도 있으며 인코딩된 비디오 데이터를 목적지 디바이스 (14) 에 제공할 수도 있다. 유사하게, 디스크 스탬핑 (disc stamping) 설비와 같은 매체 생산 설비의 컴퓨팅 디바이스는 소스 디바이스 (12) 로부터 인코딩된 비디오 데이터를 수신할 수도 있고, 인코딩된 비디오 데이터를 포함하는 디스크를 생산할 수도 있다. 그러므로, 컴퓨터-판독가능 매체 (16) 는 다양한 예들에서, 다양한 형태들의 하나 이상의 컴퓨터-판독가능 매체들을 포함하는 것으로 이해될 수도 있다.

목적지 디바이스 (14) 의 입력 인터페이스 (28) 는 특정한 표현의 세그먼트들의 데이터를 수신할 수도 있다. 역캡슐화 유닛 (29) 은 비디오 파일의 엘리먼트들을 구성 PES 스트림들로 역캡슐화할 수도 있고, 인코딩된 데이터를 취출하기 위하여 PES 스트림들을 역패킷화할 수도 있고, 인코딩된 데이터를 비디오 디코더 (30) 로 전송할 수도 있다. 비디오 디코더 (30) 는 인코딩된 비디오 데이터를 디코딩하고, 스트림의 복수의 뷰들을 포함할 수도 있는 디코딩된 비디오 데이터를 디스플레이 디바이스 (32) 로 전송한다. 디스플레이 디바이스 (32) 는 디코딩된 비디오 데이터를 사용자에게 디스플레이하고, 음극선관 (CRT), 액정 디스플레이 (LCD), 플라즈마 디스플레이, 유기 발광 다이오드 (OLED) 디스플레이, 또는 또 다른 타입의 디스플레이 디바이스와 같은 다양한 디스플레이 디바이스들 중의 임의의 것을 포함할 수도 있다.

비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및 비디오 디코더 (30), 이하에서 설명된 포스트-프로세싱 (post-processing) 엔티티 (27) 및 네트워크 엔티티 (79), 및 이 개시물에서 설명된 다른 컴포넌트들은 각각, 적용가능한 바와 같이, 하나 이상의 마이크로프로세서들, 디지털 신호 프로세서 (DSP) 들, 애플리케이션 특정 집적 회로 (ASIC) 들, 필드 프로그래밍가능한 게이트 어레이 (FPGA) 들, 개별 로직 회로부, 소프트웨어, 하드웨어, 펌웨어, 또는 그 임의의 조합들과 같은 다양한 적당한 집적 회로 프로세싱 회로부 중의 임의의 것으로서 구현될 수도 있다. 이 때문에, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및 비디오 디코더 (30) 뿐만 아니라, 이 개시물에서 설명된 바와 같은 포스트-프로세싱 엔티티 (27) 및 네트워크 엔티티 (79) 의 컴포넌트들은 고정된 하드웨어 프로세싱 회로부, 프로그래밍가능 프로세싱 회로부, 및/또는 양장의 조합으로서 구현된 하나 이상의 프로세서들을 포함하는 다양한 집적된 프로세싱 회로부 중의 임의의 것에 의해 형성될 수도 있다. 비디오 인코더 (20) 및 비디오 디코더 (30) 의 각각은 하나 이상의 인코더들 또는 디코더들 내에 포함될 수도 있고, 인코더들 또는 디코더들 중의 어느 하나는 조합된 비디오 인코더/디코더 (CODEC) 의 일부로서 통합될 수도 있다. 비디오 인코더 (20), 비디오 디코더 (30), 캡슐화 유닛 (21), 및/또는 역캡슐화 유닛 (29) 을 포함하는 장치는 집적 회로, 마이크로프로세서, 및/또는 셀룰러 전화와 같은 무선 통신 디바이스를 포함할 수도 있다.

이 개시물은 일반적으로, 비디오 인코더 (20) (및/또는 서버/컨텐츠 전달 네트워크 (34)) 가 어떤 정보를 비디오 디코더 (30) 와 같은 또 다른 디바이스로 "시그널링하는 것" 을 지칭할 수도 있다. 그러나, 어떤 신택스 엘리먼트들을 비디오 데이터의 다양한 인코딩된 부분들과 연관시킴으로써, 비디오 인코더 (20) 및/또는 서버/컨텐츠 전달 네트워크 (34) 가 정보를 시그널링할 수도 있다는 것이 이해되어야 한다. 즉, 비디오 인코더 (20) 및/또는 서버/컨텐츠 전달 네트워크 (34) 는 어떤 신택스 엘리먼트들을 비디오 데이터의 다양한 인코딩된 부분들의 헤더들에 저장함으로써 데이터를 "시그널링" 할 수도 있다. 일부 경우들에는, 이러한 신택스 엘리먼트들이 비디오 디코더 (30) 에 의해 수신되고 디코딩되기 전에, 인코딩되고 저장 (예컨대, 저장 디바이스 (24) 에 저장됨) 될 수도 있다. 이에 따라, 용어 "시그널링" 은 일반적으로, 매체에 저장된 후의 임의의 시간에 디코딩 디바이스에 의해 취출 (retrieve) 될 수도 있는 신택스 엘리먼트들을, 인코딩 시에 저장 매체에 저장할 때에 발생할 수도 있는 것과 같은 이러한 통신이 실시간으로 또는 실시간에 근접하여 또는 시간의 기간 동안에 발생하든지 간에, 압축된 비디오 데이터를 디코딩하기 위한 신택스 또는 다른 데이터의 통신을 지칭할 수도 있다.

비디오 인코더 (20) 및 비디오 디코더 (30) 는 MPEG-4, Part 10, 진보된 비디오 코딩 (AVC), 또는 이러한 표준들의 확장들 (예컨대, 멀티뷰 비디오 코딩 (MVC) 또는 스케일러블 비디오 코딩 (SVC)) 로서 대안적으로 지칭된, ITU-T H.264 표준과 같은 비디오 압축 표준에 따라 동작할 수도 있다. ITU-T H.264/MPEG-4 (AVC) 표준은 합동 비디오 팀 (Joint Video Team; JVT) 으로서 알려진 집합적 파트너십의 산물로서의 ISO/IEC 동화상 전문가 그룹 (MPEG) 과 함께 ITU-T 비디오 코딩 전문가 그룹 (VCEG) 에 의해 공식화되었다. H.264 표준은, H.264 표준 또는 H.264 사양, 또는 H.264/AVC 표준 또는 사양으로서 본원에서 지칭될 수도 있는, 2005 년 3월자의 ITU-T 연구 그룹에 의한 ITU-T 추천안 H.264, Advanced Video Coding for generic audiovisual services 에서 설명되어 있다.

다른 예들에서, 비디오 인코더 (20) 및 비디오 디코더 (30) 는 ITU-T H.265 및 ISO/IEC 23008-2 로서 또한 알려진 HEVC 비디오 코딩 표준, 또는 HEVC 의 확장들 (스케일러블 고효율 비디오 코딩 (scalable high-efficiency video coding; SHVC) 또는 멀티뷰 고효율 비디오 코딩 (multiview high efficiency video coding; MV-HEVC)) 에 따라 동작할 수도 있다. 완결된 표준 문서는 "ITU-T H.265, SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisual services - Coding of moving video - High efficiency video coding", 국제 전기통신 연합 (ITU) 의 전기통신 표준화 섹터, 2013 년 4월로서 발표되어 있다.

HEVC 는 비디오 픽처가 루마 및 크로마 샘플들의 양자를 포함하는 트리블록들 또는 최대 코딩 유닛 (LCU) 들의 시퀀스로 분할되는 것을 허용한다. 비트스트림 내의 신택스 데이터는 픽셀들의 수의 측면에서 최대 코딩 유닛인 LCU 에 대한 크기를 정의할 수도 있다. 슬라이스는 다수의 연속적인 코딩 트리 유닛 (CTU) 들을 포함한다. CTU 들의 각각은 루마 샘플들의 코딩 트리 블록, 크로마 샘플들의 2 개의 대응하는 코딩 트리 블록들, 및 코딩 트리 블록들의 샘플들을 코딩하기 위하여 이용된 신택스 구조들을 포함할 수도 있다. 단색 픽처, 또는 3 개의 별도의 컬러 평면들을 포함하는 픽처에서는, CTU 가 단일 코딩 트리 블록과, 코딩 트리 블록의 샘플들을 코딩하기 위하여 이용된 신택스 구조들을 포함할 수도 있다.

비디오 픽처는 하나 이상의 슬라이스들로 파티셔닝될 수도 있다. 각각의 트리블록은 쿼드트리에 따라 코딩 유닛 (CU) 들로 분할될 수도 있다. 일반적으로, 쿼드트리 데이터 구조는 CU 당 하나의 노드를 포함하고, 루트 노드 (root node) 는 트리블록에 대응한다. CU 가 4 개의 서브-CU 들로 분할될 경우, CU 에 대응하는 노드는 4 개의 리프 노드 (leaf node) 들을 포함하고, 이들의 각각은 서브-CU 들 중의 하나에 대응한다. CU 는 루마 샘플 어레이, Cb 샘플 어레이, 및 Cr 샘플 어레이를 가지는 픽처의 루마 샘플들의 코딩 블록 및 크로마 샘플들의 2 개의 대응하는 코딩 블록들과, 코딩 블록들의 샘플들을 코딩하기 위하여 이용된 신택스 구조들을 포함할 수도 있다. 단색 픽처, 또는 3 개의 별도의 컬러 평면들을 가지는 픽처에서는, CU 가 단일 코딩 블록과, 코딩 블록의 샘플들을 코딩하기 위하여 이용된 신택스 구조들을 포함할 수도 있다. 코딩 블록은 샘플들의 NxN 블록이다.

쿼드트리 데이터 구조의 각각의 노드는 대응하는 CU 에 대한 신택스 데이터를 제공할 수도 있다. 예를 들어, 쿼드트리에서의 노드는, 노드에 대응하는 CU 가 서브-CU 들로 분할되는지 여부를 표시하는 분할 플래그 (split flag) 를 포함할 수도 있다. CU 에 대한 신택스 엘리먼트들은 재귀적으로 정의될 수도 있고, CU 가 서브-CU 들로 분할되는지 여부에 종속될 수도 있다. CU 가 추가로 분할되지 않을 경우, 그것은 리프-CU 로서 지칭된다. 이 개시물에서는, 원래의 리프-CU 의 명시적 분할이 없더라도, 리프-CU 의 4 개의 서브-CU 들은 또한 리프-CU 들로서 지칭될 것이다. 예를 들어, 16x16 크기에서의 CU 가 추가로 분할되지 않을 경우, 16x16 CU 가 결코 분할되지 않았지만, 4 개의 8x8 서브-CU 들이 또한 리프-CU 들로서 지칭될 것이다.

CU 가 크기 구분 (size distinction) 을 가지지 않는다는 것을 제외하고는, CU 는 H.264 표준의 매크로블록 (macroblock) 과 유사한 목적을 가진다. 예를 들어, 트리블록은 4 개의 자식 노드 (child node) 들 (또한 서브-CU 들로서 지칭됨) 로 분할될 수도 있고, 각각의 자식 노드는 궁극적으로 부모 노드 (parent node) 일 수도 있고, 또 다른 4 개의 자식 노드들로 분할될 수도 있다. 쿼드트리의 리프 노드로서 지칭된, 최종적인 분할되지 않은 자식 노드는 리프-CU 로서 또한 지칭된 코딩 노드를 포함한다. 코딩된 비트스트림과 연관된 신택스 데이터는 최대 CU 심도로서 지칭된, 트리블록이 분할될 수도 있는 최대 횟수를 정의할 수도 있고, 또한, 코딩 노드들의 최소 크기를 정의할 수도 있다. 따라서, 비트스트림은 또한, 최소 코딩 유닛 (SCU) 을 정의할 수도 있다. 이 개시물은 HEVC 의 문맥에서의 CU, PU, 또는 TU 중의 임의의 것, 또는 다른 표준들의 문맥에서의 유사한 데이터 구조들 (예컨대, H.264/AVC 에서의 매크로블록들 및 그 서브-블록들) 을 지칭하기 위하여 용어 "블록" 을 이용한다.

CU 는 코딩 노드와, 코딩 노드와 연관된 예측 유닛 (PU) 들 및 변환 유닛 (TU) 들을 포함한다. CU 의 크기는 코딩 노드의 크기에 대응하고, 형상에 있어서 정사각형이어야 한다. CU 의 크기는 8x8 픽셀들로부터, 64x64 픽셀들 이상의 최대치를 갖는 트리블록의 크기까지의 범위일 수도 있다. 각각의 CU 는 하나 이상의 PU 들 및 하나 이상의 TU 들을 포함할 수도 있다.

일반적으로, PU 는 대응하는 CU 의 전부 또는 부분에 대응하는 공간적인 영역을 표현하고, PU 에 대한 참조 샘플을 취출하기 위한 데이터를 포함할 수도 있다. 또한, PU 는 예측에 관련된 데이터를 포함한다. 예를 들어, PU 가 인트라-모드 인코딩될 때, PU 에 대한 데이터는 PU 에 대응하는 TU 에 대한 인트라-예측 모드를 설명하는 데이터를 포함할 수도 있는 잔차 쿼드트리 (residual quadtree; RQT) 내에 포함될 수도 있다. 또 다른 예로서, PU 가 인터-모드 인코딩될 때, PU 는 PU 에 대한 하나 이상의 모션 벡터들을 정의하는 데이터를 포함할 수도 있다. 예측 블록은, 동일한 예측이 적용되는 샘플들의 직사각형 (즉, 정사각형 또는 비-정사각형) 블록일 수도 있다. CU 의 PU 는 루마 샘플들의 예측 블록, 픽처의 크로마 샘플들의 2 개의 대응하는 예측 블록들, 및 예측 블록 샘플들을 예측하기 위하여 이용된 신택스 구조들을 포함할 수도 있다. 단색 픽처, 또는 3 개의 별도의 컬러 평면들을 가지는 픽처에서는, PU 가 단일 예측 블록과, 예측 블록 샘플들을 예측하기 위하여 이용된 신택스 구조들을 포함할 수도 있다.

TU 들은 잔차 비디오 데이터에 대한 변환, 예컨대, 이산 코사인 변환 (DCT), 정수 변환, 웨이블렛 변환, 또는 개념적으로 유사한 변환의 적용에 후속하는 변환 도메인에서의 계수들을 포함할 수도 있다. 잔차 데이터는 인코딩되지 않은 픽처의 픽셀들과, PU 들에 대응하는 예측 값들과의 사이의 픽셀 차이들에 대응할 수도 있다. 비디오 인코더 (20) 는 CU 에 대한 잔차 데이터를 포함하는 TU 들을 형성할 수도 있고, 그 다음으로, CU 에 대한 변환 계수들을 생성하기 위하여 TU 들을 변환할 수도 있다. 변환 블록은 동일한 변환이 적용되는 샘플들의 직사각형 블록일 수도 있다. CU 의 변환 유닛 (TU) 은 루마 샘플들의 변환 블록, 크로마 샘플들의 2 개의 대응하는 변환 블록들, 및 변환 블록 샘플들을 변환하기 위하여 이용된 신택스 구조들을 포함할 수도 있다. 단색 픽처, 또는 3 개의 별도의 컬러 평면들을 가지는 픽처에서는, TU 가 단일 변환 블록과, 변환 블록 샘플들을 변환하기 위하여 이용된 신택스 구조들을 포함할 수도 있다.

CU 의 PU 들을 이용한 인트라-예측 또는 인터-예측 코딩에 후속하여, 비디오 인코더 (20) 는 CU 의 TU 들에 대한 잔차 데이터를 계산할 수도 있다. PU 들은 공간 도메인 (픽셀 도메인으로서 또한 지칭됨) 에서 예측 픽셀 데이터를 생성하는 방법 또는 모드를 설명하는 신택스 데이터를 포함할 수도 있고, TU 들은 변환, 예컨대, 이산 코사인 변환 (DCT), 정수 변환, 웨이블렛 변환, 또는 개념적으로 유사한 변환의 잔차 비디오 데이터로의 적용에 후속하는 변환 도메인에서의 계수들을 포함할 수도 있다. 잔차 데이터는 인코딩되지 않은 픽처의 픽셀들과 PU 들에 대응하는 예측 값들과의 사이의 픽셀 차이들에 대응할 수도 있다. 비디오 인코더 (20) 는 CU 에 대한 잔차 데이터를 포함하는 TU 들을 형성할 수도 있고, 그 다음으로, CU 에 대한 변환 계수들을 생성하기 위하여 TU 들을 변환할 수도 있다.

변환 계수들을 생성하기 위한 임의의 변환들에 후속하여, 비디오 인코더 (20) 는 변환 계수들의 양자화를 수행할 수도 있다. 양자화는 일반적으로, 계수들을 표현하기 위하여 이용된 데이터의 양을 아마도 감소시키기 위하여 변환 계수들이 양자화되어 추가의 압축을 제공하는 프로세스를 지칭한다. 양자화에 후속하여, 비디오 인코더는 변환 계수들을 스캔 (scan) 하여, 양자화된 변환 계수들을 포함하는 2 차원 행렬로부터 1 차원 벡터를 생성할 수도 있다.

1 차원 벡터를 형성하기 위하여 양자화된 변환 계수들을 스캐닝한 후, 비디오 인코더 (20) 는 예컨대, 컨텍스트-적응 가변 길이 코딩 (context-adaptive variable length coding; CAVLC), 컨텍스트-적응 2 진 산술 코딩 (context-adaptive binary arithmetic coding; CABAC), 신택스-기반 컨텍스트-적응 2 진 산술 코딩 (syntax-based context-adaptive binary arithmetic coding; SBAC), 확률 간격 파티셔닝 엔트로피 (Probability Interval Partitioning Entropy; PIPE) 코딩 또는 또 다른 엔트로피 인코딩 방법론에 따라 1 차원 벡터를 엔트로피 인코딩할 수도 있다. 비디오 인코더 (20) 는 또한, 비디오 데이터를 디코딩함에 있어서 비디오 디코더 (30) 에 의한 이용을 위한 인코딩된 비디오 데이터와 연관된 신택스 엘리먼트들을 엔트로피 인코딩할 수도 있다.

도 1 에서 도시된 예에서, 시스템 (10) 은 또한, 라우터 (36) 를 가지는 서버/컨텐츠 전달 네트워크 (34) 를 포함한다. 일부 예들에서, 소스 디바이스 (12) 는 위에서 설명된 바와 같이, 다양한 무선 및/또는 유선 송신 또는 저장 매체들을 통해 서버/컨텐츠 전달 네트워크 (34) 와 통신할 수도 있다. 또한, 도 1 의 예에서 별도로 도시되었지만, 일부 예들에서, 소스 디바이스 (12) 및 서버/컨텐츠 전달 네트워크 (34) 는 동일한 디바이스를 포함한다. 서버/컨텐츠 전달 네트워크 (34) 는 (소스 디바이스 (12) 의 비디오 인코더 (20) 로부터의) 코딩된 비디오 데이터의 하나 이상의 버전들을 저장할 수도 있고, 이러한 코딩된 비디오 데이터를, 목적지 디바이스 (14) 및 비디오 디코더 (30) 에 의해 액세스를 위하여 이용가능하게 할 수도 있다.

일부 예들에서, 라우터 (36) 는 코딩된 비디오 데이터를 요청된 포맷으로 목적지 디바이스 (14) 에 제공하는 것을 담당할 수도 있다. 다른 예들에서, 캡슐화 유닛 (21) 은 인코딩된 비디오 데이터를 특정한 포맷으로 캡슐화하는 것을 담당할 수도 있다. 파일 포맷 표준들은 ISO 기본 미디어 파일 포맷 (ISOBMFF, ISO/IEC 14496-12) 과, MPEG-4 파일 포맷 (ISO/IEC 14496-14), 3GPP 파일 포맷 (3GPP TS 26.244), 및 AVC 파일 포맷 (ISO/IEC 14496-15) 을 포함하는 ISOBMFF 로부터 유도된 다른 포맷들을 포함한다. 게다가, 서버/컨텐츠 전달 네트워크 (34) 는 비트스트림들을 스플라이싱 및/또는 스위칭하는 것을 담당할 수도 있다.

이하의 도 4 에 대하여 더욱 상세하게 설명된 바와 같이, 박스는 4-문자 코딩된 박스 타입, 박스의 바이트 카운트, 및 페이로드를 포함하는, ISOBMFF 에서의 신택스 구조를 지칭할 수도 있다. ISOBMFF 파일은 박수들의 시퀀스로 구성되고, 박스들은 다른 박스들을 포함할 수도 있다. 영화 박스 ("moov") 는, 각각의 하나가 파일에서 트랙으로서 표현된, 파일에서 존재하는 연속적인 미디어 스트림들에 대한 메타데이터를 포함한다.

트랙에 대한 메타데이터는 트랙 박스 ("trak") 에서 동봉되는 반면, 트랙의 미디어 컨텐츠는 미디어 데이터 박스 ("mdat") 에서, 또는 별도의 파일에서 직접적으로 중의 어느 하나로 동봉된다. 트랙들에 대한 미디어 컨텐츠는 오디오 또는 비디오 액세스 유닛들과 같은 샘플들의 시퀀스로 구성된다. 액세스 유닛은 일반적으로, 공통적인 시간 인스턴스에 대한 코딩된 픽처 데이터를 포함하는 데이터의 유닛이다. 샘플은 본원에서 설명된 비디오 코딩 사양들과 같은 특정한 사양에 의해 정의된 바와 같은 액세스 유닛이다.

샘플 엔트리는 대응하는 샘플의 설명을 제공할 수도 있다. 예를 들어, 샘플 엔트리는 대응하는 샘플의 포맷과 같은, 대응하는 샘플의 특성을 설명하는 4 문자 코드를 포함할 수도 있다. AVC 및 SVC 트랙들에 대한 일 예의 샘플 엔트리들은 이하의 표에서 포함된다:

상기 표는 오직 예시의 목적들을 위한 것이다. 다양한 다른 샘플 엔트리들은 다른 타입들의 샘플들을 설명하기 위하여 이용될 수도 있다.

비디오 인코더 (20) (또는 캡슐화 유닛 (21)) 는 비디오 데이터를 디코딩할 때에 이용될 수도 있는 어떤 파라미터 세트들을 생성할 수도 있고, 비디오 디코더 (30) (또는 역캡슐화 유닛 (29)) 는 이를 수신할 수도 있다. 예를 들어, 위에서 언급된 바와 같이, 파라미터 세트들은 SPS, PPS, 또는 VPS 를 포함할 수도 있고, 이것은 드물게 변경되는 정보를 별도로 시그널링함으로써 효율을 개선시킨다. ISOBMFF 파일 포맷에 대하여, 파라미터 세트 샘플은 시간에 있어서 동일한 인스턴스에서 비디오 기본 스트림에서 존재하는 것으로 고려되어야 하는 파라미터 세트 NAL 유닛들을 포함하는 파라미터 세트 스트림에서의 샘플일 수도 있다. 또한, 파라미터 세트가 업데이트되는 각각의 포인트에서 파라미터 세트 샘플이 있을 수도 있다. 각각의 파라미터 세트는 비디오 기본 스트림의 관련된 섹션을 디코딩하기 위하여 필요하게 된 시퀀스 및 픽처 파라미터 세트들을 포함할 수도 있다. 파라미터 세트 트랙에서의 동기 샘플은 비디오 기본 스트림에서 그 디코딩 시간으로부터 이후에 필요하게 된 모든 파라미터 세트들이 그것 또는 후속 파라미터 스트림 샘플들에 있다는 것을 표시할 수도 있다.

그러나, 일부 사례들에서, 역캡슐화 유닛 (29) 및/또는 비디오 디코더 (30) 는 파라미터 세트들을 적절하게 식별하고 디코딩할 수 없을 수도 있다. 예를 들어, 위에서 언급된 바와 같이, ISOBMFF 에서의 용어 랜덤 액세스 포인트 (RAP) 의 상이한 해독들이 있으므로, AVC 파일 포맷, SVC 파일 포맷, MVC 파일 포맷, 및 HEVC 파일 포맷에서의 파라미터 세트들의 배치에 관한 제약은 상이한 해독들을 가질 수 있고, 파일은 다른 구현예들에 의해서가 아니라, 일부 구현예들에 의해 준수하는 것으로서 고려될 수도 있다. 랜덤 액세스 포인트가 상이한 디바이스들 (예컨대, 여기서 상이한 디바이스들은 비디오 데이터를 인코딩/패키징하는 것을 담당하는 디바이스 및 비디오 데이터를 파싱/디코딩하는 것을 담당하는 디바이스를 포함할 수도 있음) 에 의해 상이하게 해독될 때, 파일은 적절하게 전달 및/또는 재생되지 않을 수도 있다.

예를 들어, ISOBMFF 에서, 비디오 코더는 비디오 코더가 준수하는 ISOBMFF 의 특정한 부분에 따라, 적어도 3 개의 상이한 방법들로 RAP 를 해독할 수도 있다. 제 1 예에서, RAP 는 다른 SAP 타입들이 아니라, SAP 타입들 1, 2, 또는 3 중의 임의의 것에 대응할 수도 있다. 예를 들어, ISOBMFF 의 섹션 3.1.11 의 부분이 이하에서 재현된다:

3.1.11

랜덤 액세스 포인트 (RAP)

부록 I 에서 정의된 바와 같은 타입 1 또는 2 또는 3 의 SAP 의 ISAU 에서 시작하는 트랙에서의 샘플; 비공식적으로, 디코딩이 시작될 때, 샘플 자체 및 구성 순서에서 후행하는 모든 샘플들이 그것으로부터 올바르게 디코딩될 수 있는 샘플

해독 1 로서 지칭된 상기 예에서, RAP 는 SAP 타입 1 내지 3 에 오직 대응하고; 이에 따라, 점진적 디코딩 리프레시 (GDR) 시작 포인트는 RAP 로서 고려될 수 없다.

또 다른 예에서, RAP 는 다른 SAP 타입들이 아니라, SAP 타입들 1, 2, 3, 또는 4 중의 임의의 것에 대응할 수도 있다. 예를 들어, ISOBMFF 의 섹션 10.1.1.3 의 부분이 이하에서 재현된다:

10.1.1.3

roll_distance 는 샘플이 올바르게 디코딩되도록 하기 위하여 디코딩되어야 하는 샘플들의 수를 부여하는 부호 정수 (signed integer) 이다. 포지티브 값은 이 복구의 최후에서 완료되도록, 즉, 최후 샘플이 올바르도록 디코딩되어야 하는 그룹 멤버인 샘플 이후의 샘플들의 수를 표시한다. 네거티브 값은 복구가 표기된 샘플에서 완료되도록 하기 위하여 디코딩되어야 하는 그룹 멤버인 샘플 이전의 샘플들의 수를 표시한다. 값 제로 (zero) 는 이용되지 않아야 한다; 동기 샘플 테이블은 복구 역할이 필요하지 않는 랜덤 액세스 포인트들을 문서화한다.

해독 2 로서 지칭된 상기 예에서, GDR 시작 포인트는 RAP 로서 고려될 수도 있고, 이것은 (위에서 언급된) 조항 3.1.11 에서의 RAP 의 정의와 불일치한다.

제 3 예에서, 랜덤 액세스 포인트는 코덱 특정적인 동기 샘플에 대응할 수도 있다. 예를 들어, ISOBMFF 의 섹션 A.7 의 부분이 이하에서 재현된다:

A.7 랜덤 액세스

...

3) 단계 1 에서 위치되었던 샘플은 동기 샘플이 아닐 수도 있다. 동기 샘플 테이블은 어느 샘플들이 실제로 랜덤 액세스 포인트들인지를 표시한다. 이 테이블을 이용하면, 당신은 어느 것이 특정된 시간 이전에 최초의 동기 샘플인지를 위치시킬 수 있다. 동기 샘플 테이블의 부재는 모든 샘플들이 동기화 포인트들이라는 것을 표시하고, 이 문제를 용이하게 한다. 동기 샘플 테이블을 참고하면, 당신은 아마 결과적인 샘플이 단계 1 에서 발견된 샘플에 가장 근접하지만, 그것 이전에 있는 것을 어느 것이든지 탐색하기를 희망한다.

해독 3 으로서 지칭된 상기 예에서, RAP 는 동기 샘플이고 그 반대도 마찬가지이다.

상기 언급된 해독들은 역캡슐화 유닛 (29) 또는 비디오 디코더 (30) 에 의한 파싱 및/또는 디코딩 어려움들로 귀착될 수도 있다. 예를 들어, 역캡슐화 유닛 (29) 또는 비디오 디코더 (30) 는 특정한 비트스트림이 특정한 표준을 준수하고 그러므로, 샘플이 RAP 로서 식별되는지 여부에 기초하여 예상된 로케이션들에서 정보를 포함하는지 여부를 결정할 수도 있다. 예시의 목적들을 위한 하나의 예에서, 역캡슐화 유닛 (29) 또는 비디오 디코더 (30) 는 역캡슐화 유닛 (29) 또는 비디오 디코더 (30) 가 샘플이 RAP 샘플인 것으로 결정하는지 여부에 따라, 비트스트림의 상이한 로케이션들로부터 파라미터 세트들을 파싱할 수도 있다.

(AVC 파일 포맷, SVC 파일 포맷, MVC 파일 포맷, 및 HEVC 파일 포맷을 포함하는 ISOBMFF 로서 본원에서 지칭된) ISO/IEC 14496-15 의 일 예의 섹션들이 이하에서 포함된다. 이 예들에서, 역캡슐화 유닛 (29) 또는 비디오 디코더 (30) 는, 예컨대, 해독 1, 해독 2, 및 해독 3 에 대하여 위에서 언급된 바와 같이, RAP 를 섹션마다 상이하게 해독할 수도 있고, 이것은 비트스트림의 파라미터 세트들의 적절한 파싱 및/또는 디코딩에 영향을 줄 수도 있다.

예를 들어, ISOBMFF 의 섹션 4.8 의 부분이 이하에서 재현된다:

4.8 동기 샘플 ( IDR )

...

● 샘플 엔트리 명칭이 'avc3' 또는 'avc4' 일 때, 다음이 적용된다:

1. 샘플이 IDR 액세스 유닛일 경우, 그 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 샘플 엔트리에서, 또는 샘플 자체에서 중의 어느 하나에서 포함될 것이다.

2. 그렇지 않을 경우 (샘플이 IDR 액세스 유닛이 아님), 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 샘플 엔트리에서, 또는 이전의 랜덤 액세스 포인트 이후부터 샘플 자체까지의 샘플들 중의 임의의 것에서 중의 어느 하나에서 포함될 것이다.

상기 예에서, 역캡슐화 유닛 (29) 또는 비디오 디코더 (30) 는 랜덤 액세스 포인트의 정의에 기초하여 비트스트림의 파라미터 세트들의 로케이션을 결정할 수도 있다. 그러나, 위에서 언급된 바와 같이, 역캡슐화 유닛 (29) 또는 비디오 디코더 (30) 는 예컨대, 해독 1, 해독 2, 및 해독 3 에 대하여 위에서 언급된 바와 같이, 랜덤 액세스 포인트의 정의를 불일치하게 결정할 수도 있다. 따라서, 역캡슐화 유닛 (29) 또는 비디오 디코더 (30) 는 실제로, 비트스트림이 랜덤 액세스 포인트의 또 다른 정의에 기초하여 비디오 코딩 표준을 준수할 때, 비트스트림이 랜덤 액세스 포인트의 하나의 정의에 기초하여 특정한 비디오 코딩 표준을 준수하지 않는 것으로 결정할 수도 있다. 동일한 쟁점은 각각 SVC 파일 포맷 및 MVC 파일 포맷에 대한 (양자 모두 섹션 4.8 과 동일한 제목을 가지는) ISOBMFF 의 섹션들 6.5.5 및 7.5.3 에 적용된다.

또 다른 예로서, ISOBMFF 의 섹션 8.4.3 의 부분이 이하에서 재현된다:

8.4.3 동기 샘플

…

HEVC 샘플은 샘플에서의 VCL NAL 유닛들이 샘플에서 포함된 코딩된 픽처가 순간적 디코딩 리프레시 (IDR) 픽처, 클린 랜덤 액세스 (CRA) 픽처, 또는 파손된 링크 액세스 (BLA) 픽처인 것을 표시할 경우에 동기 샘플로서 고려된다.

샘플 엔트리 명칭이 'hev1' 일 때, 다음이 적용된다:

● 샘플이 랜덤 액세스 포인트 일 경우, 그 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 샘플 엔트리에서, 또는 샘플 자체에서 중의 어느 하나에서 포함될 것이다.

● 그렇지 않을 경우 (샘플이 랜덤 액세스 포인트 가 아님), 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 샘플 엔트리에서, 또는 이전의 랜덤 액세스 포인트 이후부터 샘플 자체까지의 샘플들 중의 임의의 것에서 중의 어느 하나에서 포함될 것이다.

다시, 상이한 가능한 랜덤 액세스 포인트 해독들은 파라미터 세트들의 배치에 관한 제약들에 영향을 줄 수도 있고, 2 개의 상이한 해독들이 컴포저 (composer) (예컨대, 비디오 인코더 (20) 또는 캡슐화 유닛 (21)) 및 파서 (예컨대, 역캡슐화 유닛 (29) 또는 비디오 디코더 (30)) 에 의해 이용될 때, 상호운용성 쟁점이 발생할 수도 있다.

이 개시물의 양태들에 따르면, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30) 는 비디오 파일들의 적절한 디코딩 및 재생을 위한 파라미터 세트들의 배치에 관한 제약들을 적용할 수도 있다. 이 개시물의 다양한 기법들에 따라 파라미터 세트들을 코딩하기 위한 일 예의 신택스 및 시맨틱들이 이하에서 기재되어 있다. 설명된 신택스 및 시맨틱들은 예컨대, 언급된 바와 같은 AVC, HEVC, SVC, MVC 등의 그것에 관련된다.

이하의 일 예의 설명, 신택스 테이블들, 및 시맨틱들에서, 관련된 표준에 대한 추가들은 굵은 글씨체 및 밑줄 을 이용하여 표현되고, 삭제들은 [[이중 괄호들]] 을 이용하여 표현된다. 일반적으로, "요건들" 에 관한 기재들은 이 개시물의 기법들의 목적들을 위한 요건이 아니라, 표준 또는 표준 확장의 텍스트의 일부를 형성하도록 이해되어야 한다. 일부 사례들에서, 이러한 "요건들" 은, 적용가능한 것으로 결정될 수도 있고, 그 다음으로, 결정에 기초하여 예를 들어, 비디오 코더에 의해 고수될 수도 있는 비트스트림 제약들을 포함할 수도 있다.

하나의 예에서, 이 개시물의 양태들에 따르면, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30) 는 AVC 파일 포맷의 섹션 4.8 의 업데이트된 버전을 준수할 수도 있고, 여기서, "랜덤 액세스 포인트" 는 다음과 같이, "IDR 액세스 유닛인 샘플" 로 대체된다:

4.8 동기 샘플 ( IDR )

샘플은 [[다음의 조건들의 전부가 충족될]] 샘플에서의 비디오 데이터 NAL 유닛들이 샘플에서 포함된 주 픽처 (primary picture) 가 순간적 디코딩 리프레시 (IDR) 픽처인 것을 표시할 경우에 동기 샘플로서 고려된다.

2. 그렇지 않을 경우 (샘플이 IDR 액세스 유닛이 아님), 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 샘플 엔트리에서, 또는 이전의 [[랜덤 액세스 포인트]] IDR 액세스 유닛인 샘플 이후부터 샘플 자체까지의 샘플들 중의 임의의 것에서 중의 어느 하나에서 포함될 것이다.

동일한 변경은 각각 SVC 파일 포맷 및 MVC 파일 포맷에 대한 (양자 모두 섹션 4.8 과 동일한 제목을 가지는) ISOBMFF 의 섹션들 6.5.5 및 7.5.3 에 적용된다. 이 예에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플에서의 비디오 데이터 NAL 유닛들이 샘플에서 포함된 주 픽처가 IDR 픽처인 것을 표시할 경우에, 샘플이 동기 샘플인 것으로 결정하도록 구성될 수도 있다. 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 IDR 액세스 유닛일 경우에, 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들이 샘플에 대한 샘플 엔트리에서, 또는 샘플 자체에서 중의 어느 하나에서, 포함되도록, 예컨대, 인코딩되거나, 저장되거나, 또는 그렇지 않을 경우에 배치되도록 추가로 구성될 수도 있다. 이 때문에, 샘플이 IDR 액세스 유닛일 때, 이 방식으로 포함된 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 비디오 디코더 (30) 는 오직 샘플에 대한 샘플 엔트리 또는 샘플 자체로부터, 동기 샘플의 비디오 데이터에 대한 파라미터 세트 데이터를 결정할 수도 있다. 파라미터 세트 데이터를 결정하는 것은 예를 들어, 파라미터 세트 데이터를 파싱하거나, 디코딩하거나, 취출하거나, 또는 그렇지 않을 경우에 획득하는 것을 지칭할 수도 있다.

이 예에서, 샘플을 디코딩하기 위하여 필요하게 된 파라미터 세트들의 전부는 샘플의 샘플 엔트리 또는 샘플 자체에서 포함된다. 그러므로, 샘플의 비디오 데이터를 디코딩하기 위한 파라미터 세트 데이터는 오직 샘플의 샘플 엔트리 또는 샘플 자체에서 포함된다. 마찬가지로, 샘플의 비디오 데이터를 디코딩하기 위하여, 샘플의 비디오 데이터를 디코딩하기 위하여 필요하게 된 파라미터 세트 데이터의 전부는 샘플의 샘플 엔트리 또는 샘플 자체로부터 결정된다. 그러므로, 디코딩을 위하여, 비디오 데이터에 대한 파라미터 세트 데이터는 오직 샘플의 샘플 엔트리 또는 샘플 자체로부터 결정된다.

게다가, 이 예에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 IDR 액세스 유닛이 아닐 경우, 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들이 샘플에 대한 샘플 엔트리에서, 또는 IDR 액세스 유닛인 이전의 샘플 이후부터 IDR 액세스 유닛 자체가 아닌 샘플까지의 샘플들 중의 임의의 것에서 중의 어느 하나에서 포함되도록, 예컨대, 인코딩되거나, 저장되거나, 또는 그렇지 않을 경우에 배치되도록 구성될 수도 있다. 즉, 샘플이 IDR 액세스 유닛이 아닐 경우, 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 IDR 액세스 유닛이 아닌 샘플에 대한 샘플 엔트리, IDR 액세스 유닛 자체가 아닌 샘플, IDR 액세스 유닛인 이전의 샘플, 또는 IDR 액세스 유닛인 이전의 샘플 이후와, 샘플 자체의 이전, 즉, IDR 액세스 유닛이 아닌 샘플 이전의 샘플들 중의 어느 하나에서 포함된다. 이 방식으로 포함된 IDR 액세스 유닛이 아닌 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 비디오 디코더 (30) 는 오직 샘플에 대한 샘플 엔트리, 샘플 자체, IDR 액세스 유닛인 이전의 샘플로부터, 또는 IDR 액세스 유닛이 아닌 샘플과, IDR 액세스 유닛인 이전의 샘플과의 사이에서 발생하는 샘플들로부터, 샘플의 비디오 데이터에 대한 파라미터 세트 데이터를 결정할 수도 있다.

이 예에서, IDR 액세스 유닛이 아닌 샘플을 디코딩하기 위하여 필요하게 된 파라미터 세트들의 전부는 샘플에 대한 샘플 엔트리, 샘플 자체, IDR 액세스 유닛인 이전의 샘플에서, 또는 IDR 액세스 유닛이 아닌 샘플과, IDR 액세스 유닛인 이전의 샘플과의 사이에서 발생하는 샘플들에서 포함된다. 그러므로, 샘플의 비디오 데이터를 디코딩하기 위한 파라미터 세트 데이터는 오직 샘플에 대한 샘플 엔트리, 샘플 자체, IDR 액세스 유닛인 이전의 샘플에서, 또는 IDR 액세스 유닛이 아닌 샘플과, IDR 액세스 유닛인 이전의 샘플과의 사이에서 발생하는 샘플들에서 포함된다. 마찬가지로, 샘플의 비디오 데이터를 디코딩하기 위하여, 샘플의 비디오 데이터를 디코딩하기 위하여 필요하게 된 파라미터 세트 데이터의 전부는 샘플에 대한 샘플 엔트리, 샘플 자체, IDR 액세스 유닛인 이전의 샘플로부터, 또는 IDR 액세스 유닛이 아닌 샘플과, IDR 액세스 유닛인 이전의 샘플과의 사이에서 발생하는 샘플들에서 결정된다. 그러므로, 샘플의 비디오 데이터를 디코딩하기 위하여, 비디오 데이터에 대한 파라미터 세트 데이터는 오직 샘플에 대한 샘플 엔트리, 샘플 자체, IDR 액세스 유닛인 이전의 샘플로부터, 또는 IDR 액세스 유닛이 아닌 샘플과, IDR 액세스 유닛인 이전의 샘플과의 사이에서 발생하는 샘플들에서 결정된다.

일부 예들에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 IDR 액세스 유닛이고 샘플 엔트리 명칭이 'avc3' 또는 'avc4' 와 같은 특정한 명칭일 경우, 그 동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 샘플에 대한 샘플 엔트리에서, 또는 샘플 자체에서 중의 어느 하나에서 포함되도록, 예컨대, 인코딩되거나, 저장되거나, 또는 그렇지 않을 경우에 배치되도록 추가로 구성될 수도 있다. 이 때문에, 이 방식으로 포함된 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 샘플이 IDR 액세스 유닛이고 샘플 엔트리 명칭이 'avc3' 또는 'avc4' 와 같은 특정한 명칭일 경우, 비디오 디코더 (30) 는 오직 샘플에 대한 샘플 엔트리 또는 샘플 자체에서, 샘플의 비디오 데이터에 대한 파라미터 세트 데이터를 결정할 수도 있다. 이 때문에, 파라미터 세트 데이터는 샘플이 IDR 액세스 유닛인 것으로 결정하는 것에 기초하여, 그리고 샘플 엔트리 명칭과 같은 샘플의 엔트리 명칭이 특정한 명칭, 또는 특정한 명칭들, 예컨대, 'avc3' 또는 'avc4' 의 세트 중의 하나인 것에 추가로 기초하여, 이 방식으로 결정될 수도 있다. 샘플 엔트리 명칭이 특정한 명칭이 아닐 경우, 파라미터 세트 데이터의 배치 또는 결정은 상이하게 취급될 수도 있다.

일부 예들에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 IDR 액세스 유닛이 아니고 샘플 엔트리 명칭이 'avc3' 또는 'avc4' 와 같은 특정한 명칭일 경우, 그 동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 IDR 액세스 유닛이 아닌 샘플에 대한 샘플 엔트리, IDR 액세스 유닛 자체가 아닌 샘플, IDR 액세스 유닛인 이전의 샘플, 또는 IDR 액세스 유닛인 이전의 샘플 이후와, 샘플 자체의 이전, 즉, IDR 액세스 유닛이 아닌 샘플 이전의 샘플들 중의 어느 하나에서 포함되도록, 예컨대, 인코딩되거나, 저장되거나, 또는 그렇지 않을 경우에 배치되도록 추가로 구성될 수도 있다. 이 때문에, 이 방식으로 포함된 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 샘플이 IDR 액세스 유닛이 아니고 샘플 엔트리 명칭이 'avc3' 또는 'avc4' 와 같은 특정한 명칭일 경우, 비디오 디코더 (30) 는 오직 IDR 액세스 유닛이 아닌 샘플에 대한 샘플 엔트리, IDR 액세스 유닛 자체가 아닌 샘플, IDR 액세스 유닛인 이전의 샘플, 또는 IDR 액세스 유닛인 이전의 샘플 이후와, 샘플 자체의 이전, 즉, IDR 액세스 유닛이 아닌 샘플 이전의 샘플들에서, 샘플의 비디오 데이터에 대한 파라미터 세트 데이터를 결정할 수도 있다. 이 때문에, 파라미터 세트 데이터는 샘플이 IDR 액세스 유닛이 아닌 것으로 결정하는 것에 기초하여, 그리고 샘플 엔트리 명칭과 같은 샘플의 엔트리 명칭이 특정한 명칭, 또는 특정한 명칭들, 예컨대, 'avc3' 또는 'avc4' 의 세트 중의 하나인 것에 추가로 기초하여, 이 방식으로 디코딩될 수도 있다. 샘플 엔트리 명칭이 특정한 명칭이 아닐 경우, 파라미터 세트 데이터의 배치 또는 결정은 상이하게 취급될 수도 있다.

또 다른 예에서, 이 개시물의 양태들에 따르면, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30) 는 예들로서, 다음과 같이, AVC 파일 포맷의 섹션 4.8 의 업데이트된 버전을 준수할 수도 있다:

4.8 동기 샘플 ( IDR )

샘플은 [[다음의 조건들의 전부가 충족될]] 샘플에서의 비디오 데이터 NAL 유닛들이 샘플에서 포함된 주 픽처가 순간적 디코딩 리프레시 (IDR) 픽처인 것을 표시할 경우에 동기 샘플로서 고려된다.

1. 샘플이 [[IDR 액세스 유닛]] 동기 샘플 일 경우, 그 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 샘플 엔트리에서, 또는 샘플 자체에서 중의 어느 하나에서 포함될 것이다.

2. 그렇지 않을 경우 (샘플이 [[IDR 액세스 유닛]] 동기 샘플 이 아님), 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 샘플 엔트리에서, 또는 이전의 [[랜덤 액세스 포인트]] 동기 샘플 이후부터 샘플 자체까지의 샘플들 중의 임의의 것에서 중의 어느 하나에서 포함될 것이다.

다시, 동일한 변경은 각각 SVC 파일 포맷 및 MVC 파일 포맷에 대한 (양자 모두 섹션 4.8 과 동일한 제목을 가지는) ISOBMFF 의 섹션들 6.5.5 및 7.5.3 에 적용된다. 이 예에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플에서의 비디오 데이터 NAL 유닛들이 샘플에서 포함된 그 주 픽처가 IDR 픽처인 것을 표시할 경우에, 샘플이 동기 샘플인 것으로 결정하도록 구성될 수도 있다. 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 동기 샘플일 경우, 그 동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들이 동기 샘플에 대한 샘플 엔트리에서, 또는 동기 샘플 자치에서 중의 어느 하나에서 (예컨대, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 또 다른 디바이스에 의해) 포함되도록 추가로 구성될 수도 있다. 이 때문에, 이 방식으로 포함된 동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 비디오 디코더 (30) 는 오직 샘플에 대한 샘플 엔트리 또는 샘플 자체에서, 동기 샘플의 비디오 데이터에 대한 파라미터 세트 데이터를 결정할 수도 있다. 파라미터 세트 데이터를 결정하는 것은 예를 들어, 파라미터 세트 데이터를 파싱하거나, 디코딩하거나, 취출하거나, 또는 그렇지 않을 경우에 획득하는 것을 지칭할 수도 있다.

이 예에서, 동기 샘플을 디코딩하기 위하여 필요하게 된 파라미터 세트들의 전부는 동기 샘플에 대한 샘플 엔트리 또는 동기 샘플 자체에서 포함된다. 그러므로, 동기 샘플의 비디오 데이터를 디코딩하기 위한 파라미터 세트 데이터는 오직 동기 샘플의 샘플 엔트리 또는 동기 샘플 자체에서 포함된다. 마찬가지로, 동기 샘플의 비디오 데이터를 디코딩하기 위하여, 동기 샘플의 비디오 데이터를 디코딩하기 위하여 필요하게 된 파라미터 세트 데이터의 전부는 동기 샘플의 샘플 엔트리 또는 동기 샘플 자체로부터 결정된다. 그러므로, 디코딩을 위하여, 비디오 데이터에 대한 파라미터 세트 데이터는 오직 동기 샘플의 샘플 엔트리 또는 동기 샘플 자체로부터, 디코더 (30) 에 의해 결정된다.

게다가, 이 예에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 동기 샘플이 아닐 경우, 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들이 샘플에 대한 샘플 엔트리에서, 또는 이전의 동기 샘플 이후부터 샘플 자체까지의 샘플들 중의 임의의 것에서 중의 어느 하나에서 포함되도록 구성될 수도 있다. 즉, 샘플이 동기 샘플이 아닐 경우, 동기 샘플이 아닌 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 동기 샘플이 아닌 샘플에 대한 샘플 엔트리, 동기 샘플 자체가 아닌 샘플, 이전의 동기 샘플, 또는 이전의 동기 샘플 이후와, 샘플 자체의 이전, 즉, 동기 샘플이 아닌 샘플 이전의 하나 이상의 샘플들 중의 어느 하나에서 포함되고, 예컨대, 인코딩되거나, 저장되거나, 또는 그렇지 않을 경우에 배치된다. 동기 샘플이 아닌 샘플은 또한, 비-동기 샘플로서 지칭될 수도 있다. 이 방식으로 포함된 비-동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 비디오 디코더 (30) 는 오직 샘플에 대한 샘플 엔트리, 샘플 자체, 이전의 동기 샘플로부터, 또는 비-동기 샘플과 이전의 동기 샘플 사이에서 발생하는 샘플들로부터, 비-동기 샘플의 비디오 데이터에 대한 파라미터 세트 데이터를 결정할 수도 있다.

이 예에서, 비-동기 샘플을 디코딩하기 위하여 필요하게 된 파라미터 세트들의 전부는 비-동기 샘플에 대한 샘플 엔트리, 비-동기 샘플 자체, 동기 샘플인 이전의 샘플에서, 또는 비-동기 샘플과 이전의 동기 샘플 사이에서 발생하는 샘플들에서 포함된다. 그러므로, 비-동기 샘플의 비디오 데이터를 디코딩하기 위한 파라미터 세트 데이터는 오직 비-동기 샘플에 대한 샘플 엔트리, 비-동기 샘플 자체, 동기 샘플인 이전의 샘플에서, 또는 비-동기 샘플과 이전의 동기 샘플 사이에서 발생하는 샘플들에서 포함된다. 마찬가지로, 비-동기 샘플의 비디오 데이터를 디코딩하기 위하여, 비-동기 샘플의 비디오 데이터를 디코딩하기 위하여 필요하게 된 파라미터 세트 데이터의 전부는 비-동기 샘플에 대한 샘플 엔트리, 비-동기 샘플 자체, 이전의 동기 샘플로부터, 또는 비-동기 샘플과 이전의 동기 샘플 사이에서 발생하는 샘플들에서 결정된다. 그러므로, 비-동기 샘플의 비디오 데이터를 디코딩하기 위하여, 비디오 데이터에 대한 파라미터 세트 데이터는 오직 비-동기 샘플에 대한 샘플 엔트리, 비-동기 샘플 자체, 이전의 동기 샘플로부터, 또는 비-동기 샘플과 이전의 동기 샘플 사이에서 발생하는 샘플들에서 결정된다.

일부 예들에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 동기 샘플이고 샘플 엔트리 명칭이 'avc3' 또는 'avc4' 와 같은 특정한 명칭일 경우, 그 동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들이 동기 샘플에 대한 샘플 엔트리에서, 또는 동기 샘플 자체에서 중의 어느 하나에서 포함되도록, 예컨대, 인코딩되거나, 저장되거나, 또는 그렇지 않을 경우에 배치되도록 추가로 구성될 수도 있다. 이 때문에, 이 방식으로 포함된 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 샘플이 동기 샘플이고 샘플 엔트리 명칭이 'avc3' 또는 'avc4' 와 같은 특정한 명칭일 경우, 비디오 디코더 (30) 는 오직 동기 샘플에 대한 샘플 엔트리 또는 동기 샘플 자체에서, 동기 샘플의 비디오 데이터에 대한 파라미터 세트 데이터를 결정할 수도 있다. 이 때문에, 파라미터 세트 데이터는 샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 그리고 샘플 엔트리 명칭과 같은 샘플의 엔트리 명칭이 특정한 명칭, 또는 특정한 명칭들, 예컨대, 'avc3' 또는 'avc4' 의 세트 중의 하나인 것에 추가로 기초하여, 이 방식으로 디코딩될 수도 있다. 샘플 엔트리 명칭이 특정한 명칭이 아닐 경우, 파라미터 세트 데이터의 배치 또는 결정은 상이하게 취급될 수도 있다.

일부 예들에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 동기 샘플이 아니고 샘플 엔트리 명칭이 'avc3' 또는 'avc4' 일 경우, 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 동기 샘플이 아닌 샘플에 대한 샘플 엔트리, 동기 샘플 자체가 아닌 샘플, 이전의 동기 샘플, 또는 이전의 동기 샘플 이후와, 샘플 자체의 이전, 즉, 동기 샘플이 아닌 샘플 이전의 샘플들 중의 어느 하나에서 포함되도록, 예컨대, 인코딩되거나, 저장되거나, 또는 그렇지 않을 경우에 배치되도록 추가로 구성될 수도 있다. 이 때문에, 이 방식으로 포함된 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 샘플이 동기 샘플이 아니고 샘플 엔트리 명칭이 'avc3' 또는 'avc4' 와 같은 특정한 명칭일 경우, 비디오 디코더 (30) 는 오직 동기 샘플이 아닌 샘플에 대한 샘플 엔트리, 동기 샘플 자체가 아닌 샘플, 이전의 동기 샘플, 또는 이전의 동기 샘플 이후와, 샘플 자체의 이전, 즉, 동기 샘플이 아닌 샘플 이전의 하나 이상의 샘플들에서, 샘플의 비디오 데이터에 대한 파라미터 세트 데이터를 결정할 수도 있다. 이 방식으로, 파라미터 세트 데이터는 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 그리고 샘플 엔트리 명칭과 같은 샘플의 엔트리 명칭이 특정한 명칭, 또는 특정한 명칭들, 예컨대, 'avc3' 또는 'avc4' 의 세트 중의 하나인 것에 추가로 기초하여, 이 방식으로 결정될 수도 있다. 샘플 엔트리 명칭이 특정한 명칭이 아닐 경우, 파라미터 세트 데이터의 배치 또는 결정은 상이하게 취급될 수도 있다.

HEVC 에 대하여, 이 개시물의 기법들에 따른 또 다른 예에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30) 는 HEVC 파일 포맷의 섹션 8.4.3 의 업데이트된 버전을 준수할 수도 있고, 여기서, "랜덤 액세스 포인트" 는 다음과 같이, "동기 샘플" 로 대체된다:

8.4.3 동기 샘플

...

샘플 엔트리 명칭이 'hev1' 일 때, 다음이 적용된다:

● 샘플이 [[랜덤 액세스 포인트]] 동기 샘플 일 경우, 그 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 샘플 엔트리에서, 또는 샘플 자체에서 중의 어느 하나에서 포함될 것이다.

● 그렇지 않을 경우 (샘플이 [[랜덤 액세스 포인트]] 동기 샘플 이 아님), 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 샘플 엔트리에서, 또는 이전의 [[랜덤 액세스 포인트]] 동기 샘플 이후부터 샘플 자체까지의 샘플들 중의 임의의 것에서 중의 어느 하나에서 포함될 것이다.

이 예에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플에서의 VCL NAL 유닛들이 샘플에서 포함된 코딩된 픽처가 순간적 디코딩 리프레시 (IDR) 픽처, 클린 랜덤 액세스 (CRA) 픽처, 또는 파손된 링크 액세스 (BLA) 픽처인 것을 표시할 경우에, 샘플이 동기 샘플인 것으로 결정하도록 구성될 수도 있다. 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 동기 샘플일 경우에, 동기 샘플의 비디오 데이터를 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들이 동기 샘플에 대한 샘플 엔트리에서, 또는 동기 샘플 자체에서 중의 어느 하나에서 포함되도록 추가로 구성될 수도 있다. 이 때문에, 이 방식으로 포함된 동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 비디오 디코더 (30) 는 동기 샘플에 대하여, 오직 샘플에 대한 샘플 엔트리로부터, 또는 샘플 자체로부터, 샘플의 비디오 데이터에 대한 파라미터 세트 데이터를 결정할 수도 있다. 파라미터 세트 데이터를 결정하는 것은 예를 들어, 파라미터 세트 데이터를 파싱하거나, 디코딩하거나, 취출하거나, 또는 그렇지 않을 경우에 획득하는 것을 지칭할 수도 있다.

이 예에서, 동기 샘플을 디코딩하기 위하여 필요하게 된 파라미터 세트들의 전부는 동기 샘플에 대한 샘플 엔트리 또는 동기 샘플 자체에서 포함된다. 그러므로, 동기 샘플의 비디오 데이터를 디코딩하기 위한 파라미터 세트 데이터는 오직 동기 샘플의 샘플 엔트리 또는 동기 샘플 자체에서 포함된다. 마찬가지로, 동기 샘플의 비디오 데이터를 디코딩하기 위하여, 동기 샘플의 비디오 데이터를 디코딩하기 위하여 필요하게 된 파라미터 세트 데이터의 전부는 동기 샘플의 샘플 엔트리 또는 동기 샘플 자체로부터 결정된다. 그러므로, 디코딩을 위하여, 비디오 데이터에 대한 파라미터 세트 데이터는 오직 동기 샘플의 샘플 엔트리 또는 동기 샘플 자체로부터, 예컨대, 비디오 디코더 (30) 에 의해 결정된다.

이 예에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 동기 샘플이 아닐 경우, 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들이 샘플에 대한 샘플 엔트리에서, 또는 이전의 동기 샘플 이후부터 샘플 자체까지의 샘플들 중의 임의의 것에서 중의 어느 하나에서 포함되도록 구성될 수도 있다. 즉, 샘플이 동기 샘플이 아닐 경우, 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 동기 샘플이 아닌 샘플에 대한 샘플 엔트리, 동기 샘플 자체가 아닌 샘플, 이전의 동기 샘플, 또는 이전의 동기 샘플 이후와, 샘플 자체의 이전, 즉, 동기 샘플이 아닌 샘플 이전의 샘플들 중의 어느 하나에서 포함된다. 동기 샘플이 아닌 샘플은 또한, 비-동기 샘플로서 지칭될 수도 있다. 이 때문에, 이 방식으로 포함된 비-동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 비디오 디코더 (30) 는 오직 비-동기 샘플에 대한 샘플 엔트리, 비-동기 샘플 자체, 이전의 동기 샘플로부터, 또는 비-동기 샘플과 이전의 동기 샘플 사이에서 발생하는 하나 이상의 샘플들로부터, 비-동기 샘플의 비디오 데이터를 디코딩하기 위한 파라미터 세트 데이터를 결정할 수도 있다.

이 예에서, 비-동기 샘플을 디코딩하기 위하여 필요하게 된 파라미터 세트들의 전부는 비-동기 샘플에 대한 샘플 엔트리, 비-동기 샘플 자체, 동기 샘플인 이전의 샘플에서, 또는 비-동기 샘플과 이전의 동기 샘플 사이에서 발생하는 샘플들에서 포함된다. 그러므로, 비-동기 샘플의 비디오 데이터를 디코딩하기 위한 파라미터 세트 데이터는 오직 비-동기 샘플에 대한 샘플 엔트리, 비-동기 샘플 자체, 동기 샘플인 이전의 샘플에서, 또는 비-동기 샘플과 이전의 동기 샘플 사이에서 발생하는 샘플들에서 포함된다. 마찬가지로, 비-동기 샘플의 비디오 데이터를 디코딩하기 위하여, 비-동기 샘플의 비디오 데이터를 디코딩하기 위하여 필요하게 된 파라미터 세트 데이터의 전부는 비-동기 샘플에 대한 샘플 엔트리, 비-동기 샘플 자체, 이전의 동기 샘플로부터, 또는 비-동기 샘플과 이전의 동기 샘플 사이에서 발생하는 샘플들로부터 결정된다. 그러므로, 비-동기 샘플의 비디오 데이터를 디코딩하기 위하여, 비디오 데이터에 대한 파라미터 세트 데이터는 오직 비-동기 샘플에 대한 샘플 엔트리, 비-동기 샘플 자체, 이전의 동기 샘플로부터, 또는 비-동기 샘플과 이전의 동기 샘플 사이에서 발생하는 하나 이상의 샘플들로부터, 예컨대, 비디오 디코더 (30) 에 의해 결정된다.

일부 예들에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 동기 샘플이고 샘플 엔트리 명칭이 'hev1' 과 같은 특정한 명칭일 경우, 그 동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들이 샘플에 대한 샘플 엔트리에서, 또는 샘플 자체에서 중의 어느 하나에서 포함되도록, 예컨대, 인코딩되거나, 저장되거나, 또는 그렇지 않을 경우에 배치되도록 추가로 구성될 수도 있다. 이 때문에, 이 방식으로 포함된 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 샘플이 동기 샘플이고 샘플 엔트리 명칭이 'hev1' 과 같은 특정한 명칭일 경우, 비디오 디코더 (30) 는 오직 동기 샘플에 대한 샘플 엔트리 또는 동기 샘플 자체에서, 샘플의 비디오 데이터를 디코딩하기 위한 파라미터 세트 데이터를 결정할 수도 있다. 이 때문에, 파라미터 세트 데이터는 샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 그리고 샘플 엔트리 명칭과 같은 샘플의 엔트리 명칭이 특정한 명칭, 또는 특정한 명칭들, 예컨대, 'hev1' 의 세트 중의 하나인 것에 추가로 기초하여, 이 방식으로 결정될 수도 있다. 샘플 엔트리 명칭이 특정한 명칭이 아닐 경우, 파라미터 세트 데이터의 배치는 상이하게 취급될 수도 있다.

일부 예들에서, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 동기 샘플이 아니고 샘플 엔트리 명칭이 'hev1' 일 경우, 그 동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 동기 샘플이 아닌 샘플에 대한 샘플 엔트리, 동기 샘플 자체가 아닌 샘플, 이전의 동기 샘플, 또는 이전의 동기 샘플 이후와, 샘플 자체의 이전, 즉, 동기 샘플이 아닌 샘플 이전의 하나 이상의 샘플들 중의 어느 하나에서 포함되도록, 예컨대, 인코딩되거나, 저장되거나, 또는 그렇지 않을 경우에 배치되도록 추가로 구성될 수도 있다. 이 때문에, 이 방식으로 포함된 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들로, 샘플이 동기 샘플이 아니고 (즉, 그것은 비-동기 샘플임) 샘플 엔트리 명칭이 'hev1' 과 같은 특정한 명칭일 경우, 비디오 디코더 (30) 는 오직 비-동기 샘플에 대한 샘플 엔트리, 비-동기 샘플 자체, 이전의 동기 샘플, 또는 이전의 동기 샘플 이후와, 비-동기 샘플 자체의 이전, 즉, 동기 샘플이 아닌 샘플 이전의 하나 이상의 샘플들에서, 비-동기 샘플의 비디오 데이터를 디코딩하기 위한 파라미터 세트 데이터를 결정할 수도 있다. 이 때문에, 파라미터 세트 데이터는 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 그리고 샘플 엔트리 명칭과 같은 샘플의 엔트리 명칭이 특정한 명칭, 또는 특정한 명칭들, 예컨대, 'hev1' 의 세트 중의 하나인 것에 추가로 기초하여, 이 방식으로 디코딩될 수도 있다. 샘플 엔트리 명칭이 특정한 명칭이 아닐 경우, 파라미터 세트 데이터의 결정은 상이하게 취급될 수도 있다.

이 개시물의 다른 양태들은 샘플이 동기 샘플인지 여부를 결정하는 것에 관한 것이다. 예를 들어, 이 개시물의 양태들에 따르면, 계층화된-HEVC 비트스트림에 대한 계층화된 HEVC 파일 포맷에서의 동기 샘플의 정의는 HEVC 파일 포맷에서의 그것으로 정렬되고 역호환가능하도록 업데이트될 수도 있다. 일반적으로, 일반적인 명칭, 계층화된-HEVC (layered-HEVC; L-HEVC) 는 동일한 계층화된 설계를 이용하는 모든 HEVC 확장들에 대하여 이용될 수도 있다. L-HEVC 비트스트림은 계층들의 집합일 수도 있고, 여기서, 각각의 계층은 품질, 해상도, 프레임 레이트, 뷰들, 심도, 및 이러한 것에서 시각적 제시를 스케일링하는 것을 돕는다. 관련된 계층들의 집합은 계층 세트들로서 함께 그룹화된다. 임의의 계층 세트에서의 계층은 그 계층 식별자 (L-id) 에 의해 고유하게 식별된다. 계층은 하나 이상의 계층 세트들의 멤버일 수도 있다. 계층에 속하는 NAL 유닛들은 그 시간적 식별자 (T-id) 에 기초하여 추가로 파티셔닝될 수 있다. 각각의 이러한 파티션은 서브-계층으로 칭해진다.

HEVC 파일 포맷에서, HEVC 샘플은 샘플에서의 VCL NAL 유닛들이 샘플에서 포함된 코딩된 픽처가 IDR 픽처, CRA 픽처, 또는 BLA 픽처인 것을 표시할 경우에 동기 샘플로 고려될 수도 있다. 그러나, 초안 L-HEVC 파일 포맷에서, L-HEVC 샘플은 액세스 유닛에서의 각각의 코딩된 픽처들이 랜덤 액세스 스킵된 선두 (Random Access Skipped Leading; RASL) 픽처를 갖지 않는 인트라-랜덤 액세스 포인트 (intra-random access point; IRAP) 픽처일 경우에 동기 샘플로 고려될 수도 있다. 예를 들어, SHVC 및 MV-HEVC 양자는 동일한 계층화된 설계를 이용한다.

상기 예에서, 초안 계층화된 HEVC 파일 포맷에서의 동기 샘플의 정의는 HEVC 파일 포맷에서의 그것과 정렬되지 않을 수도 있고, 불일치는 IRAP 픽처에 대한 RASL 픽처들의 존재가 샘플이 동기 샘플인 것을 허용하지 않을 것인지 여부이다. 이 불일치는 HEVC 호환가능한 샘플 엔트리, 즉, 'hvc1', 'hev1', 'hvc2', 및 'hev2' 중의 하나가 이용 중일 때, L-HEVC 파일 포맷에서의 동기 샘플의 정의가 HEVC 파일 포맷에 역호환가능하지 않은 쟁점을 생성할 수도 있다.

이 개시물의 양태들에 따르면, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30) 는 HEVC 파일 포맷에서의 그것으로 정렬되고 역호환가능하도록 하기 위하여, L-HEVC 파일 포맷에서의 동기 샘플의 업데이트된 정의를 준수하도록 구성될 수도 있다. 예를 들어, 샘플 엔트리 명칭에 따라, L-HEVC 파일 포맷에 대한 동기 샘플은 다음과 같이 정의된다:

- 샘플 엔트리 명칭이 'hvc1', 'hev1', 'hvc2', 또는 'hev2' 일 때, L-HEVC 샘플은 액세스 유닛에서의 기본 계층 픽처가 ISO/IEC 23008-2 에서 정의된 바와 같이 IRAP 픽처일 경우에 동기 샘플로서 고려된다.

- 샘플 엔트리 명칭이 'lhv1' 또는 'lhe1' 일 때, L-HEVC 샘플은 액세스 유닛에서의 각각의 코딩된 픽처가 ISO/IEC　23008-2 에서 정의된 바와 같이 IRAP 픽처일 경우에 동기 샘플로서 고려된다.

대안적으로, 샘플 엔트리 명칭에 관계 없이, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30) 는 액세스 유닛에서의 기본 계층 픽처가 ISO/IEC　23008-2 에서 정의된 바와 같이 IRAP 픽처일 경우에 동기 샘플인 것으로 결정하도록 구성될 수도 있다.

대안적으로, 샘플 엔트리 명칭에 관계 없이, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30) 는 액세스 유닛에서의 각각의 코딩된 픽처가 ISO/IEC　23008-2 에서 정의된 바와 같이 IRAP 픽처일 경우에 동기 샘플인 것으로 결정하도록 구성될 수도 있다. 동기 샘플들은 동기 샘플 테이블에 의해 문서화되고, 스트림 액세스 포인트 'sap.' 샘플 그룹에 의해 추가적으로 문서화될 수도 있다.

도 2 는 이 개시물에서 설명된 기법들을 구현할 수도 있는 일 예의 비디오 인코더 (20) 를 예시하는 블록도이다. 비디오 인코더 (20) 는 비디오 데이터를 저장하기 위한 메모리, 및 비디오 데이터를 인코딩하기 위한 동작들, 및 이 개시물에서 설명된 바와 같이 특정한 로케이션들에서 샘플들을 디코딩하기 위한 파라미터 세트 데이터를 포함하기 위한 동작들과 같은 비디오 코딩 동작들을 수행하도록 구성된 하나 이상의 프로세서들을 포함할 수도 있다. 비디오 인코더 (20) 는 이 개시물에서 설명된 바와 같이 비디오 데이터를 인코딩하기 위한 기법들을 구현할 수도 있는 또 다른 예의 디바이스인 포스트 프로세싱 엔티티 (27) 로 비디오를 출력하도록 구성될 수도 있다. 예를 들어, 포스트 프로세싱 엔티티 (27) 는, 이 개시물에서 설명된 바와 같이, 특정한 로케이션들에서 샘플들을 디코딩하기 위한 파라미터 세트 데이터를 포함하고, 및/또는 특정한 로케이션들로부터 샘플들을 디코딩하기 위한 파라미터 세트 데이터를 결정하기 위한 기법들을 수행할 수도 있다. 포스트 프로세싱 엔티티 (27) 는, 비디오 인코더 (20) 로부터의 인코딩된 비디오 데이터를 프로세싱할 수도 있는 미디어 인지 네트워크 엘리먼트 (media aware network element; MANE), 스플라이싱/편집 디바이스 (splicing/editing device), 또는 또 다른 중간 디바이스와 같은 비디오 엔티티의 예를 표현하도록 의도된다. 일부의 사례들에서, 포스트 프로세싱 엔티티 (27) 는 네트워크 엔티티의 예일 수도 있다. 일부 비디오 인코딩 시스템들에서, 포스트-프로세싱 엔티티 (27) 및 비디오 인코더 (20) 는 별도의 디바이스들의 일부들일 수도 있는 반면, 다른 사례들에서는, 포스트-프로세싱 엔티티 (27) 에 대하여 설명된 기능성이 비디오 인코더 (20) 를 포함하는 동일한 디바이스에 의해 수행될 수도 있다.

비디오 인코더 (20) 는 비디오 슬라이스들 내의 비디오 블록들의 인트라-코딩 및 인터-코딩을 수행할 수도 있다. 인트라-코딩은 소정의 비디오 프레임 또는 픽처 내의 비디오에서의 공간적 중복성을 감소시키거나 제거하기 위하여 공간적 예측에 의존한다. 인터-코딩은 비디오 시퀀스의 인접한 프레임들 또는 픽처들 내에서의 비디오에 있어서의 시간적 중복성을 감소시키거나 제거하기 위하여 시간적 예측에 의존한다. 인트라-모드 (I 모드) 는 몇몇 공간 기반 압축 모드들 중의 임의의 것을 지칭할 수도 있다. 단방향 예측 (P 모드) 또는 양방향-예측 (B 모드) 과 같은 인터-모드들은 몇몇 시간 기반 압축 모드들 중의 임의의 것을 지칭할 수도 있다.

도 2 의 예에서, 비디오 인코더 (20) 는 파티셔닝 유닛 (35), 비디오 메모리 (37), 예측 유닛 (41), 필터 유닛 (63), 참조 픽처 메모리 (64), 합산기 (50), 변환 프로세싱 유닛 (52), 양자화 유닛 (54), 및 엔트로피 인코딩 유닛 (56) 을 포함한다. 예측 유닛 (41) 은 모션 추정 유닛 (42), 모션 보상 유닛 (44), 및 인트라 예측 프로세싱 유닛 (46) 을 포함한다. 비디오 메모리 (37) 및 참조 픽처 메모리 (64) 는 동일한 메모리 디바이스 또는 별도의 메모리 디바이스들의 부분들일 수도 있다. 메모리 디바이스는 RAM, ROM, 플래시 메모리 등, 또는 그 조합들과 같은, 이 개시물에서 설명된 임의의 형태의 컴퓨터-판독가능 매체들 또는 데이터 저장 매체들일 수도 있다. 비디오 블록 복원을 위하여, 비디오 인코더 (20) 는 또한, 역양자화 유닛 (58), 역변환 프로세싱 유닛 (60), 및 합산기 (62) 를 포함한다. 필터 유닛 (63) 은 디블록킹 필터, 적응적 루프 필터 (adaptive loop filter; ALF), 및 샘플 적응적 오프셋 (sample adaptive offset; SAO) 필터와 같은 하나 이상의 루프 필터들을 표현하도록 의도된다. 필터 유닛 (63) 은 인-루프 필터 (in-loop filter) 인 것으로서 도 2 에서 도시되어 있지만, 다른 구성들에서는, 필터 유닛 (63) 이 포스트-루프 필터 (post-loop filter) 로서 구현될 수도 있다.

도 2 에서 도시된 바와 같이, 비디오 인코더 (20) 는 예컨대, 비디오 메모리 (37) 에서, 인코딩되어야 할 비디오 데이터를 수신하고, 파티셔닝 유닛 (35) 은 비디오 메모리 (37) 에서의 비디오 데이터를 비디오 블록들로 파티셔닝한다. 이 파티셔닝은 또한, 슬라이스 (slice) 들, 타일 (tile) 들, 또는 다른 더 큰 유닛들로의 파티셔닝뿐만 아니라, 예컨대, LCU 들 및 CU 들의 쿼드트리 구조에 따른 비디오 블록 파티셔닝을 포함할 수도 있다. 비디오 인코더 (20) 는 인코딩되어야 할 비디오 슬라이스 내의 비디오 블록들을 인코딩하는 컴포넌트들을 일반적으로 예시한다. 슬라이스는 다수의 비디오 블록들로 (그리고 아마도 타일들로서 지칭된 비디오 블록들의 세트들로) 분할될 수도 있다. 예측 프로세싱 유닛 (41) 은 에러 결과들 (예컨대, 코딩 레이트 및 왜곡의 레벨) 에 기초하여, 현재의 비디오 블록에 대하여, 복수의 인트라 코딩 모드들 중의 하나 또는 복수의 인터 코딩 모드들 중의 하나와 같은 복수의 가능한 코딩 모드들 중의 하나를 선택할 수도 있다. 예측 프로세싱 유닛 (41) 은 결과적인 인트라-코딩된 또는 인터-코딩된 블록을, 잔차 블록 데이터를 생성하기 위하여 합산기 (50) 에, 그리고 참조 픽처로서의 이용을 위한 인코딩된 블록을 복원하기 위하여 합산기 (62) 에 제공할 수도 있다.

예측 프로세싱 유닛 (41) 내의 인트라 예측 프로세싱 유닛 (46) 은 공간적 압축을 제공하기 위하여, 코딩되어야 할 현재의 블록과 동일한 프레임 또는 슬라이스에서의 하나 이상의 이웃하는 블록들에 대하여 현재의 비디오 블록의 인트라-예측 코딩을 수행할 수도 있다. 예측 프로세싱 유닛 (41) 내의 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 은 시간적 압축을 제공하기 위하여, 하나 이상의 참조 픽처들 내의 하나 이상의 예측 블록들에 관련된 현재의 비디오 블록의 인터-예측 코딩을 수행한다.

모션 추정 유닛 (42) 은 비디오 시퀀스에 대한 미리 결정된 패턴에 따라 비디오 슬라이스에 대한 인터-예측 모드를 결정하도록 구성될 수도 있다. 미리 결정된 패턴은 시퀀스에서의 비디오 슬라이스들을 P 슬라이스들 또는 B 슬라이스들로서 지정할 수도 있다. 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 은 고도로 통합될 수도 있지만, 개념적인 목적들을 위하여 별도로 예시되어 있다. 모션 추정 유닛 (42) 에 의해 수행된 모션 추정은 비디오 블록들에 대한 모션을 추정하는 모션 벡터들을 생성하는 프로세스이다. 예를 들어, 모션 벡터는 참조 픽처 내에서의 예측 블록에 관하여 현재의 비디오 프레임 또는 픽처 내에서의 비디오 블록의 PU 의 변위를 표시할 수도 있다.

예측 블록은, 절대차의 합 (sum of absolute difference; SAD), 제곱차의 합 (sum of square difference; SSD), 또는 다른 차이 메트릭들에 의해 결정될 수도 있는 픽셀 차이의 측면에서, 코딩되어야 할 비디오 블록의 PU 와 근접하게 일치시키기 위하여 구해지는 블록이다. 일부 예들에서, 비디오 인코더 (20) 는 참조 픽처 메모리 (64) 내에 저장된 참조 픽처들의 정수-미만 (sub-integer) 픽셀 위치들에 대한 값들을 계산할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 참조 픽처의 1/4 픽셀 위치들, 1/8 픽셀 위치들, 또는 다른 분수 픽셀 위치들의 값들을 보간할 수도 있다. 그러므로, 모션 추정 유닛 (42) 은 전체 픽셀 위치들 및 분수 픽셀 위치들에 관련하여 모션 검색을 수행할 수도 있고, 분수 픽셀 정밀도를 갖는 모션 벡터를 출력할 수도 있다.

모션 추정 유닛 (42) 은 PU 의 위치를 참조 픽처의 예측 블록의 위치와 비교함으로써, 인터-코딩된 슬라이스에서의 비디오 블록의 PU 에 대한 모션 벡터를 계산한다. 참조 픽처는 제 1 참조 픽처 리스트 (List 0) 또는 제 2 참조 픽처 리스트 (List 1) 로부터 선택될 수도 있고, 이들의 각각은 참조 픽처 메모리 (64) 내에 저장된 하나 이상의 참조 픽처들을 식별한다. 모션 추정 유닛 (42) 은 계산된 모션 벡터를 엔트로피 인코딩 유닛 (56) 및 모션 보상 유닛 (44) 으로 전송한다.

모션 보상 유닛 (44) 에 의해 수행된 모션 보상은 모션 추정에 의해 결정된 모션 벡터에 기초하여 예측 블록을 페치 (fetch) 하거나 생성하여, 서브-픽셀 정밀도 (sub-pixel precision) 로의 보간들을 아마도 수행하는 것을 수반할 수도 있다. 현재의 비디오 블록의 PU 에 대한 모션 벡터를 수신할 시에, 모션 보상 유닛 (44) 은 모션 벡터가 참조 픽처 리스트들 중의 하나에서 지시하는 예측 블록을 위치시킬 수도 있다. 비디오 인코더 (20) 는 코딩되고 있는 현재의 비디오 블록의 픽셀 값들로부터 예측 블록의 픽셀 값들을 감산하여 픽셀 차이 값들을 형성함으로써 잔차 비디오 블록을 형성한다. 픽셀 차이 값들은 블록에 대한 잔차 데이터를 형성하고, 루마 및 크로마 차이 컴포넌트들의 양자를 포함할 수도 있다. 합산기 (50) 는 이 감산 동작을 수행하는 컴포넌트 또는 컴포넌트들을 표현한다. 모션 보상 유닛 (44) 은 또한, 비디오 슬라이스의 비디오 블록들을 디코딩할 시에 비디오 디코더 (30) 에 의한 이용을 위한 비디오 블록들 및 비디오 슬라이스와 연관된 신택스 엘리먼트들을 생성할 수도 있다.

인트라 예측 유닛 (46) 은 위에서 설명된 바와 같이, 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 에 의해 수행된 인터-예측에 대한 대안으로서, 현재의 블록을 인트라-예측할 수도 있다. 특히, 인트라 예측 유닛 (46) 은 현재의 블록을 인코딩하기 위하여 이용하기 위한 인트라-예측 모드를 결정할 수도 있다. 일부 예들에서, 인트라-예측 유닛 (46) 은 예컨대, 별도의 인코딩 패스들 동안에, 다양한 인트라-예측 모드들을 이용하여 현재의 블록을 인코딩할 수도 있고, 인트라-예측 유닛 (46) (또는 일부 예들에서, 모드 선택 유닛 (40)) 은 예컨대, 다양한 테스팅된 인트라-예측 모드들에 대한 레이트-왜곡 분석을 이용하여 레이트-왜곡 값들을 계산함으로써, 그리고 테스팅된 모드들 중에서 최상의 레이트-왜곡 특성들을 가지는 인트라-예측 모드를 선택함으로써, 테스팅된 모드들로부터 이용하기 위한 적절한 인트라-예측 모드를 선택할 수도 있다.

어떤 경우에도, 블록에 대한 인트라-예측 모드를 선택한 후, 인트라 예측 유닛 (46) 은 블록에 대한 선택된 인트라-예측 모드를 표시하는 정보를 엔트로피 인코딩 유닛 (56) 에 제공할 수도 있다. 엔트로피 인코딩 유닛 (56) 은 이 개시물의 기법들에 따라 선택된 인트라-예측 모드를 표시하는 정보를 인코딩할 수도 있다. 비디오 인코더 (20) 는 복수의 인트라-예측 모드 인덱스 테이블들 및 복수의 수정된 인트라-예측 모드 인덱스 테이블들 (또한 코드워드 맵핑 테이블들로서 지칭됨) 을 포함할 수도 있는 송신된 비트스트림 구성 데이터에서, 다양한 블록들에 대한 인코딩 컨텍스트들의 정의들과, 컨텍스트들의 각각에 대해 이용하기 위한 가장 가능성 있는 인트라-예측 모드, 인트라-예측 모드 인덱스 테이블, 및 수정된 인트라-예측 모드 인덱스 테이블의 표시들을 포함할 수도 있다.

예측 프로세싱 유닛 (41) 이 인터-예측 또는 인트라-예측의 어느 하나를 통해 현재의 비디오 블록에 대한 예측 블록을 생성한 후, 비디오 인코더 (20) 는 현재의 비디오 블록으로부터 예측 블록을 감산함으로써 잔차 비디오 블록을 형성한다. 잔차 블록에서의 잔차 비디오 데이터는 하나 이상의 TU 들에 포함될 수도 있고 변환 프로세싱 유닛 (52) 에 적용될 수도 있다. 변환 프로세싱 유닛 (52) 은 이산 코사인 변환 (DCT) 또는 개념적으로 유사한 변환과 같은 변환을 이용하여 잔차 비디오 데이터를 잔차 변환 계수들로 변환한다. 변환 프로세싱 유닛 (52) 은 잔차 비디오 데이터를 픽셀 도메인으로부터, 주파수 도메인과 같은 변환 도메인으로 변환할 수도 있다.

변환 프로세싱 유닛 (52) 은 결과적인 변환 계수들을 양자화 유닛 (54) 으로 전송할 수도 있다. 양자화 유닛 (54) 은 비트 레이트를 추가로 감소시키기 위하여 변환 계수들을 양자화한다. 양자화 프로세스는 계수들의 일부 또는 전부와 연관된 비트 심도를 감소시킬 수도 있다. 양자화도는 양자화 파라미터를 조절함으로써 수정될 수도 있다. 일부 예들에서, 다음으로, 양자화 유닛 (54) 은 양자화된 변환 계수들을 포함하는 행렬의 스캔을 수행할 수도 있다. 대안적으로, 엔트로피 인코딩 유닛 (56) 은 스캔을 수행할 수도 있다.

양자화에 후속하여, 엔트로피 인코딩 유닛 (56) 은 양자화된 변환 계수들을 엔트로피 인코딩한다. 예를 들어, 엔트로피 인코딩 유닛 (56) 은 컨텍스트 적응 가변 길이 코딩 (CAVLC), 컨텍스트 적응 2 진 산술 코딩 (CABAC), 신택스-기반 컨텍스트-적응 2 진 산술 코딩 (SBAC), 확률 간격 파티셔닝 엔트로피 (PIPE) 코딩 또는 또 다른 엔트로피 인코딩 방법론 또는 기법을 수행할 수도 있다. 엔트로피 인코딩 유닛 (56) 에 의한 엔트로피 인코딩에 후속하여, 인코딩된 비트스트림은 비디오 디코더 (30) 로 송신될 수도 있거나, 비디오 디코더 (30) 에 의한 더 이후의 송신 또는 취출을 위하여 아카이빙될 수도 있다. 엔트로피 인코딩 유닛 (56) 은 또한, 코딩되고 있는 현재의 비디오 슬라이스에 대한 모션 벡터들 및 다른 신택스 엘리먼트들을 엔트로피 인코딩할 수도 있다.

역양자화 유닛 (58) 및 역변환 프로세싱 유닛 (60) 은 참조 픽처의 참조 블록으로서의 더 이후의 이용을 위해 픽셀 도메인에서 잔차 블록을 복원하기 위하여, 역양자화 및 역변환을 각각 적용한다. 모션 보상 유닛 (44) 은 잔차 블록을 참조 픽처 리스트들 중의 하나의 참조 픽처 리스트 내의 참조 픽처들 중의 하나의 참조 픽처의 예측 블록에 가산함으로써 참조 블록을 계산할 수도 있다. 모션 보상 유닛 (44) 은 또한, 모션 추정 시에 이용하기 위한 정수 미만 픽셀 값들을 계산하기 위하여 하나 이상의 보간 필터들을 복원된 잔차 블록에 적용할 수도 있다. 합산기 (62) 는 참조 픽처 메모리 (64) 에서의 저장을 위한 참조 블록을 생성하기 위하여, 복원된 잔차 블록을 모션 보상 유닛 (44) 에 의해 생성된 모션 보상된 예측 블록에 추가한다. 참조 블록은 후속 비디오 프레임 또는 픽처에서 블록을 인터-예측하기 위하여, 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 에 의해 참조 블록으로서 이용될 수도 있다.

이 방식으로, 도 2 의 비디오 인코더 (20) 는 본원에서 기재된 기법들 중의 하나 이상을 구현하도록 구성된 비디오 인코더의 예를 표현한다. 하나의 예에서, 엔트로피 인코딩 유닛 (56) 은 파라미터 세트들 및 동기 샘플들에 대하여 본원에서 설명된 기법들을 수행할 수도 있다. 또한, 도 2 의 포스트 프로세싱 엔티티 (27) 는 파라미터 세트들 및 동기 샘플들에 대하여 이 개시물에서 설명된 기법들을 구현할 수도 있는 또 다른 예의 디바이스이다.

도 3 은 이 개시물에서 설명된 기법들을 구현할 수도 있는 일 예의 비디오 디코더 (30) 를 예시하는 블록도이다. 비디오 디코더 (30) 는 비디오 데이터를 저장하기 위한 메모리, 및 비디오 데이터를 디코딩하기 위한 동작들, 및 이 개시물에서 설명된 바와 같이 특정한 로케이션들로부터 샘플들을 디코딩하기 위한 파라미터 세트 데이터를 결정하기 위한 동작들과 같은 비디오 코딩 동작들을 수행하도록 구성된 하나 이상의 프로세서들을 포함할 수도 있다. 도 3 의 예에서, 비디오 디코더 (30) 는 엔트로피 디코딩 유닛 (80), 비디오 메모리 (83), 예측 프로세싱 유닛 (81), 역양자화 유닛 (86), 역변환 유닛 (88), 합산기 (90), 필터 유닛 (91), 및 참조 픽처 메모리 (92) 를 포함한다. 예측 프로세싱 유닛 (81) 은 모션 보상 유닛 (82) 및 인트라 예측 프로세싱 유닛 (84) 을 포함한다. 일부 예들에서, 비디오 디코더 (30) 는 도 2 로부터의 비디오 인코더 (20) 에 대하여 설명된 인코딩 패스와 일반적으로 상반되는 디코딩 패스를 수행할 수도 있다.

디코딩 프로세스 동안, 비디오 디코더 (30) 는 비디오 인코더 (20) 로부터, 인코딩된 비디오 슬라이스의 비디오 블록들 및 연관된 신택스 엘리먼트들을 표현하는 인코딩된 비디오 비트스트림을 수신한다. 예를 들어, 비디오 메모리 (83) 는 인코딩된 비디오 비트스트림을 수신할 수도 있다. 일부 예들에서, 비디오 메모리 (83) 는 코딩된 픽처 버퍼일 수도 있다. 비디오 디코더 (30) 는 (일부 예들에서, 도 1 의 라우터 (36) 에 대응할 수도 있는) 네트워크 엔티티 (79) 로부터, 예컨대, 비디오 메모리 (83) 를 통해 인코딩된 비디오 비트스트림을 수신할 수도 있다. 네트워크 엔티티 (79) 는 예를 들어, 서버, MANE, 비디오 편집기/스플라이서, 또는 위에서 설명된 비디오 데이터를 디코딩하기 위한 기법들 중의 하나 이상을 구현하도록 구성된 다른 이러한 디바이스일 수도 있다. 네트워크 엔티티 (79) 는 비디오 인코더 (20) 와 같은 비디오 인코더를 포함할 수도 있거나 포함하지 않을 수도 있다. 이 개시물에서 설명된 기법들의 일부는, 네트워크 엔티티 (79) 가 인코딩된 비디오 비트스트림을 비디오 디코더 (30) 로 송신하기 이전에 네트워크 엔티티 (79) 에 의해 구현될 수도 있다. 일부 예들에서, 네트워크 엔티티 (79) 는, 이 개시물에서 설명된 바와 같이, 특정한 로케이션들에서 샘플들을 디코딩하기 위한 파라미터 세트 데이터를 포함하고, 및/또는 특정한 로케이션들로부터 샘플들을 디코딩하기 위한 파라미터 세트 데이터를 결정하기 위한 기법들을 수행할 수도 있다. 일부 비디오 디코딩 시스템들에서, 네트워크 엔티티 (79) 및 비디오 디코더 (30) 는 별도의 디바이스들의 일부들일 수도 있는 반면, 다른 사례들에서는, 네트워크 엔티티 (79) 에 대하여 설명된 기능성이 비디오 디코더 (30) 를 포함하는 동일한 디바이스에 의해 수행될 수도 있다.

비디오 디코더 (30) 의 엔트로피 디코딩 유닛 (80) 은 양자화된 계수들, 모션 벡터들, 및 다른 신택스 엘리먼트들을 생성하기 위하여 비트스트림을 엔트로피 디코딩한다. 엔트로피 디코딩 유닛 (80) 은 모션 벡터들 및 다른 신택스 엘리먼트들을 예측 프로세싱 유닛 (81) 으로 포워딩한다. 비디오 디코더 (30) 는 비디오 슬라이스 레벨 및/또는 비디오 블록 레벨에서 신택스 엘리먼트들을 수신할 수도 있다.

비디오 슬라이스가 인트라-코딩된 (I) 슬라이스로서 코딩될 때, 예측 프로세싱 유닛 (81) 의 인트라 예측 프로세싱 유닛 (84) 은 시그널링된 인트라 예측 모드와, 현재의 프레임 또는 픽처의 이전에 디코딩된 블록들로부터의 데이터에 기초하여, 현재의 비디오 슬라이스의 비디오 블록에 대한 예측 데이터를 생성할 수도 있다. 비디오 프레임이 인터-코딩된 (즉, B 또는 P) 슬라이스로서 코딩될 때, 예측 프로세싱 유닛 (81) 의 모션 보상 유닛 (82) 은 모션 벡터들과, 엔트로피 디코딩 유닛 (80) 으로부터 수신된 다른 신택스 엘리먼트들에 기초하여, 현재의 비디오 슬라이스의 비디오 블록에 대한 예측 블록들을 생성한다. 예측 블록들은 참조 픽처 리스트들 중의 하나 내의 참조 픽처들 중의 하나로부터 생성될 수도 있다. 비디오 디코더 (30) 는 참조 픽처 메모리 (92) 내에 저장된 참조 픽처들에 기초하여, 디폴트 구성 (default construction) 기법들을 이용하여 참조 프레임 리스트들, List 0 및 List 1 을 구성할 수도 있다.

모션 보상 유닛 (82) 은 모션 벡터들 및 다른 신택스 엘리먼트들을 파싱 (parsing) 함으로써 현재의 비디오 슬라이스의 비디오 블록에 대한 예측 정보를 결정하고, 디코딩되고 있는 현재의 비디오 블록에 대한 예측 블록들을 생성하기 위하여 예측 정보를 이용한다. 예를 들어, 모션 보상 유닛 (82) 은 비디오 슬라이스의 비디오 블록들을 코딩하기 위해 이용된 예측 모드 (예컨대, 인트라-예측 또는 인터-예측), 인터-예측 슬라이스 타입 (예컨대, B 슬라이스 또는 P 슬라이스), 슬라이스에 대한 참조 픽처 리스트들 중의 하나 이상에 대한 구성 정보, 슬라이스의 각각의 인터-인코딩된 비디오 블록에 대한 모션 벡터들, 슬라이스의 각각의 인터-코딩된 비디오 블록에 대한 인터-예측 상태, 및 현재의 비디오 슬라이스에서 비디오 블록들을 디코딩하기 위한 다른 정보를 결정하기 위하여 수신된 신택스 엘리먼트들의 일부를 이용한다.

모션 보상 유닛 (82) 은 또한, 보간 필터들에 기초하여 보간을 수행할 수도 있다. 모션 보상 유닛 (82) 은 참조 블록들의 정수-미만 픽셀들에 대한 보간된 값들을 계산하기 위하여, 비디오 블록들의 인코딩 동안에 비디오 인코더 (20) 에 의해 이용된 바와 같은 보간 필터들을 이용할 수도 있다. 이 경우, 모션 보상 유닛 (82) 은 수신된 신택스 엘리먼트들로부터 비디오 인코더 (20) 에 의해 이용된 보간 필터들을 결정할 수도 있고, 예측 블록들을 생성하기 위하여 보간 필터들을 이용할 수도 있다.

역양자화 유닛 (86) 은, 비트스트림에서 제공되며 엔트로피 디코딩 유닛 (80) 에 의해 디코딩된 양자화된 변환 계수들을 역양자화, 즉, 탈양자화 (de-quantize) 한다. 역양자화 프로세스는 적용되어야 할 양자화도 및, 마찬가지로, 역양자화도를 결정하기 위하여 비디오 슬라이스에서의 각각의 비디오 블록에 대해 비디오 인코더 (20) 에 의해 계산된 양자화 파라미터의 이용을 포함할 수도 있다. 역변환 프로세싱 유닛 (88) 은 픽셀 도메인에서 잔차 블록들을 생성하기 위하여, 역변환, 예컨대, 역 DCT, 역정수 변환, 또는 개념적으로 유사한 역변환 프로세스를 변환 계수들에 적용한다.

모션 보상 유닛 (82) 이 모션 벡터들 및 다른 신택스 엘리먼트들에 기초하여 현재의 비디오 블록에 대한 예측 블록을 생성한 후, 비디오 디코더 (30) 는 역 변환 프로세싱 유닛 (88) 으로부터의 잔차 블록들을 모션 보상 유닛 (82) 에 의해 생성된 대응하는 예측 블록들과 합산함으로써 디코딩된 비디오 블록을 형성한다. 합산기 (90) 는 이 합산 연산을 수행하는 컴포넌트 또는 컴포넌트들을 표현한다.

희망하는 경우, (코딩 루프 내 또는 코딩 루프 이후 중의 어느 하나에서의) 루프 필터들은 또한, 픽셀 천이 (pixel transition) 들을 평활화하거나, 또는 이와 다르게 비디오 품질을 개선시키기 위하여 이용될 수도 있다. 필터 유닛 (91) 은 디블록킹 필터, 적응적 루프 필터 (ALF), 및 샘플 적응적 오프셋 (SAO) 필터와 같은 하나 이상의 루프 필터들을 표현하도록 의도된다. 필터 유닛 (91) 은 인-루프 필터인 것으로서 도 3 에서 도시되어 있지만, 다른 구성들에서는, 필터 유닛 (91) 이 포스트-루프 필터로서 구현될 수도 있다. 다음으로, 주어진 프레임 또는 픽처에서의 디코딩된 비디오 블록들은, 후속 모션 보상을 위해 이용된 참조 픽처들을 저장하는 참조 픽처 메모리 (92) 내에 저장된다. 참조 픽처 메모리 (92) 는 또한, 도 1 의 디스플레이 디바이스 (31) 와 같은 디스플레이 디바이스 상에서의 더 이후의 제시를 위한 디코딩된 비디오를 저장한다. 참조 픽처 메모리 (92) 는 디코딩된 픽처 버퍼로서 지칭될 수도 있다. 비디오 메모리 (83) 및 참조 픽처 메모리 (92) 는 동일한 메모리 디바이스 또는 별도의 메모리 디바이스들의 부분들일 수도 있다. 메모리 디바이스는 RAM, ROM, 플래시 메모리 등, 또는 그 조합들과 같은, 이 개시물에서 설명된 임의의 형태의 컴퓨터-판독가능 매체들 또는 데이터 저장 매체들일 수도 있다.

이 방식으로, 도 3 의 비디오 디코더 (30) 는 본원에서 기재된 기법들 중의 하나 이상을 구현하도록 구성된 비디오 인코더의 예를 표현한다. 하나의 예에서, 엔트로피 디코딩 유닛 (80) 은 파라미터 세트들 및 동기 샘플들에 대하여 본원에서 설명된 기법들을 수행할 수도 있다. 또한, (미디어 인지 네트워크 엘리먼트일 수도 있는) 도 3 의 네트워크 엔티티 (79) 는 파라미터 세트들 및 동기 샘플들에 대하여 이 개시물에서 설명된 기법들을 구현할 수도 있는 또 다른 예의 디바이스이다.

도 4 는 일 예의 비디오 파일 (150) 의 엘리먼트들을 예시하는 블록도이다. 비디오 파일 (150) 은 세그먼트를 캡슐화하는 것으로 말할 수도 있다. 본원에서 설명된 바와 같이, ISO 기본 미디어 파일 포맷 (ISOBMFF) 및 그 확장들에 따른 비디오 파일들은 "박스들" 로서 지칭된 일련의 객체들에서 데이터를 저장한다. 도 4 의 예에서, 비디오 파일 (150) 은 파일 타입 (FTYP) 박스 (152), 영화 (MOOV) 박스 (154), 세그먼트 인덱스 (sidx) 박스들 (162), 영화 프래그먼트 (MOOF) 박스들 (164), 및 영화 프래그먼트 랜덤 액세스 (MFRA) 박스 (166) 를 포함한다. 도 4 는 비디오 파일의 예를 표현하지만, 다른 미디어 파일들은 ISO 기본 미디어 파일 포맷 및 그 확장들에 따라, 비디오 파일 (150) 의 데이터와 유사하게 구성되는 다른 타입들의 미디어 데이터 (예컨대, 오디오 데이터, 타이밍 정해진 텍스트 데이터 등) 를 포함할 수도 있다는 것이 이해되어야 한다.

파일 타입 (FTYP) 박스 (152) 는 일반적으로 비디오 파일 (150) 에 대한 파일 타입을 설명한다. 파일 타입 박스 (152) 는 비디오 파일 (150) 에 대한 최상의 이용을 설명하는 사양을 식별하는 데이터를 포함할 수도 있다. 파일 타입 박스 (152) 는 대안적으로, MOOV 박스 (154), 영화 프래그먼트 박스들 (164), 및/또는 MFRA 박스 (166) 이전에 배치될 수도 있다.

MOOV 박스 (154) 는 도 4 의 예에서, 영화 헤더 (MVHD) 박스 (156), 트랙 (TRAK) 박스 (158), 및 하나 이상의 영화 확장들 (MVEX) 박스들 (160) 을 포함한다. 일반적으로, MVHD 박스 (156) 는 비디오 파일 (150) 의 일반적인 특성들을 설명할 수도 있다. 예를 들어, MVHD 박스 (156) 는 비디오 파일 (150) 이 언제 최초로 생성되었는지, 비디오 파일 (150) 언제 최후에 수정되었는지, 비디오 파일 (150) 에 대한 타임스케일, 비디오 파일 (150) 에 대한 재생의 기간, 또는 비디오 파일 (150) 을 일반적으로 설명하는 다른 데이터를 설명하는 데이터를 포함할 수도 있다.

TRAK 박스 (158) 는 비디오 파일 (150) 의 트랙에 대한 데이터를 포함할 수도 있다. TRAK 박스 (158) 는 TRAK 박스 (158) 에 대응하는 트랙의 특성들을 설명하는 트랙 헤더 (TKHD) 박스를 포함할 수도 있다. 일부 예들에서, TRAK 박스 (158) 는 코딩된 비디오 픽처들을 포함할 수도 있는 반면, 다른 예들에서, 트랙의 코딩된 비디오 픽처들은 TRAK 박스 (158) 및/또는 sidx 박스들 (162) 의 데이터에 의해 참조될 수도 있는 영화 프래그먼트들 (164) 내에 포함될 수도 있다.

일부 예들에서, 비디오 파일 (150) 은 하나를 초과하는 트랙을 포함할 수도 있다. 따라서, MOOV 박스 (154) 는 비디오 파일 (150) 에서의 트랙들의 수와 동일한 다수의 TRAK 박스들을 포함할 수도 있다. TRAK 박스 (158) 는 비디오 파일 (150) 의 대응하는 트랙의 특성들을 설명할 수도 있다. 예를 들어, TRAK 박스 (158) 는 대응하는 트랙에 대한 시간적 및/또는 공간적 정보를 설명할 수도 있다. MOOV 박스 (154) 의 TRAK 박스 (158) 와 유사한 TRAK 박스는, 캡슐화 유닛 (21) (도 1) 이 비디오 파일 (150) 과 같은 비디오 파일에서 파라미터 세트 트랙을 포함할 때, 파라미터 세트 트랙의 특성들을 설명할 수도 있다.

예를 들어, 파라미터 세트 트랙에서의 동기 샘플은 비디오 기본 스트림에서 그 디코딩 시간으로부터 이후에 필요하게 된 모든 파라미터 세트들이 그것 또는 후속 파라미터 스트림 샘플들에 있다는 것을 표시할 수도 있다. 또한, 파라미터 세트가 업데이트되는 각각의 포인트에서 파라미터 세트 샘플이 있을 수도 있다. 각각의 파라미터 세트는 비디오 기본 스트림의 관련된 섹션을 디코딩하기 위하여 필요하게 된 시퀀스 및 픽처 파라미터 세트들을 포함할 수도 있다. 캡슐화 유닛 (21) 은 파라미터 세트 트랙을 설명하는 TRAK 박스 내의 파라미터 세트 트랙에서의 시퀀스 레벨 SEI 메시지들의 존재를 시그널링할 수도 있다.

MVEX 박스들 (160) 은 예컨대, 만약 존재한다면, MOOV 박스 (154) 내에 포함된 비디오 데이터에 추가하여, 비디오 파일 (150) 이 영화 프래그먼트들 (164) 을 포함한다는 것을 시그널링하기 위하여, 대응하는 영화 프래그먼트들 (164) 의 특성들을 설명할 수도 있다. 비디오 데이터를 스트리밍하는 맥락에서, 코딩된 비디오 픽처들은 MOOV 박스 (154) 가 아니라, 영화 프래그먼트들 (164) 내에 포함될 수도 있다. 따라서, 모든 코딩된 비디오 샘플들은 MOOV 박스 (154) 가 아니라, 영화 프래그먼트들 (164) 내에 포함될 수도 있다.

MOOV 박스 (154) 는 비디오 파일 (150) 에서의 영화 프래그먼트들 (164) 의 수와 동일한 다수의 MVEX 박스들 (160) 을 포함할 수도 있다. MVEX 박스들 (160) 의 각각은 영화 프래그먼트들 (164) 중의 대응하는 하나의 특성들을 설명할 수도 있다. 예를 들어, 각각의 MVEX 박스는 영화 프래그먼트들 (164) 중의 대응하는 하나에 대한 시간적 기간을 설명하는 영화 확장들 헤더 박스 (MEHD) 박스를 포함할 수도 있다.

위에서 언급된 바와 같이, 캡슐화 유닛 (21) 은 실제적인 코딩된 비디오 데이터를 포함하지 않는 비디오 샘플에서 시퀀스 데이터 세트를 저장할 수도 있다. 비디오 샘플은 일반적으로, 특정 시간 인스턴스에서의 하나 이상의 코딩된 픽처들의 표현인 액세스 유닛에 대응할 수도 있다. AVC 의 맥락에서, 코딩된 픽처는 액세스 유닛의 모든 픽셀들 및 SEI 메시지들과 같은 다른 연관된 비-VCL NAL 유닛들을 구성하기 위한 정보를 포함하는 하나 이상의 VCL NAL 유닛들을 포함한다. 따라서, 캡슐화 유닛 (21) 은 영화 프래그먼트들 (164) 중의 하나에서, 시퀀스 레벨 SEI 메시지들을 포함할 수도 있는 시퀀스 데이터 세트를 포함할 수도 있다. 캡슐화 유닛 (21) 은 시퀀스 데이터 세트 및/또는 시퀀스 레벨 SEI 메시지들의 존재를, 영화 프래그래먼트들 (164) 중의 하나에 대응하는 MVEX 박스들 (160) 중의 하나 내의 영화 프래그먼트들 (164) 중의 하나에서 존재하는 것으로서 추가로 시그널링할 수도 있다.

SIDX 박스들 (162) 은 비디오 파일 (150) 의 임의적인 엘리먼트들이다. 즉, 3GPP 파일 포맷 또는 다른 이러한 파일 포맷들을 준수하는 비디오 파일들은 SIDX 박스들 (162) 을 반드시 포함하는 것은 아니다. 3GPP 파일 포맷의 예에 따르면, SIDX 박스는 세그먼트 (예컨대, 비디오 파일 (150) 내에 포함된 세그먼트) 의 서브-세그먼트를 식별하기 위하여 이용될 수도 있다. 3GPP 파일 포맷은 서브-세그먼트를 "대응하는 미디어 데이터 박스 (들) 및 영화 프래그먼트 박스에 의해 참조된 데이터를 포함하는 미디어 데이터 박스를 갖는 하나 이상의 연속적인 영화 프래그먼트 박스들의 자체-포함된 세트가 그 영화 프래그먼트 박스를 후행해야 하고, 동일한 트랙에 대한 정보를 포함하는 다음의 영화 프래그먼트 박스를 선행해야 함" 으로서 정의한다. 3GPP 파일 포맷은 또한, SIDX 박스가 "박스에 의해 문서화된 (서브)세그먼트의 서브세그먼트들에 대한 참조들의 시퀀스를 포함한다. 참조된 서브세그먼트들은 제시 시간에 있어서 인접하다. 유사하게, 세그먼트 인덱스 박스에 의해 참조된 바이트들은 항상 세그먼트 내에서 인접하다. 참조된 크기는 참조된 자료에서 바이트들의 수의 카운트를 부여한다" 라는 것을 표시한다.

SIDX 박스들 (162) 은 일반적으로, 비디오 파일 (150) 내에 포함된 세그먼트의 하나 이상의 서브-세그먼트들을 표현하는 정보를 제공한다. 예를 들어, 이러한 정보는 서브-세그먼트들이 시작하고 및/또는 종료되는 재생 시간들, 서브-세그먼트들에 대한 바이트 오프셋들, 서브-세그먼트들이 SAP 를 포함 (예컨대, 그것과 함께 시작) 하는지 여부, SAP 에 대한 타입 (예컨대, SAP 가 IDR 픽처, CRA 픽처, BLA 픽처 등인지 여부), 서브-세그먼트에서의 (재생 시간 및/또는 바이트 오프셋의 측면에서의) SAP 의 위치 등을 포함할 수도 있다.

영화 세그먼트들 (164) 은 하나 이상의 코딩된 비디오 픽처들을 포함할 수도 있다. 일부 예들에서, 영화 세그먼트들 (164) 은, 각각이 다수의 코딩된 비디오 픽처들을 포함할 수도 있는 하나 이상의 GOP 들을 포함할 수도 있다. 게다가, 위에서 설명된 바와 같이, 영화 프래그먼트들 (164) 은 일부 예들에서 시퀀스 데이터 세트들을 포함할 수도 있다. 영화 프래그먼트들 (164) 의 각각은 영화 프래그먼트 헤더 박스 (MFHD, 도 4 에서 도시되지 않음) 를 포함할 수도 있다. MFHD 박스는 영화 프래그먼트에 대한 시퀀스 번화와 같은, 대응하는 영화 프래그먼트의 특성들을 설명할 수도 있다. 영화 프래그먼트들 (164) 은 비디오 파일 (150) 내에 시퀀스 번호의 순서로 포함될 수도 있다.

MFRA 박스 (166) 는 비디오 파일 (150) 의 영화 프래그먼트들 (164) 내의 랜덤 액세스 포인트들을 설명할 수도 있다. 이것은 비디오 파일 (150) 에 의해 캡슐화된 세그먼트 내의 특정한 시간적 로케이션들 (즉, 재생 시간들) 을 탐색하는 것을 수행하는 것과 같은, 트릭 모드 (trick mode) 들을 수행하는 것을 보조할 수도 있다. MFRA 박스 (166) 는 일반적으로 임의적이고, 일부 예들에서, 비디오파일들 내에 포함될 필요가 없다. 마찬가지로, 목적지 디바이스 (14) 와 같은 클라이언트 디바이스는 비디오 파일 (150) 의 비디오 데이터를 올바르게 디코딩하고 디스플레이하기 위하여 MFRA 박스 (166) 를 반드시 참조할 필요가 있는 것은 아니다. MFRA 박스 (166) 는 비디오 파일 (150) 의 트랙들의 수와 동일하거나, 또는 일부 예들에서, 비디오 파일 (150) 의 미디어 트랙들 (예컨대, 비-힌트 트랙들) 의 수와 동일한 다수의 트랙 프래그먼트 랜덤 액세스 (TFRA) 박스들 (도시되지 않음) 을 포함할 수도 있다.

일부 예들에서, 영화 프래그먼트들 (164) 은 IDR 픽처들과 같은 하나 이상의 SAP 들을 포함할 수도 있다. 마찬가지로, MFRA 박스 (166) 는 SAP 들의 비디오 파일 (150) 내에서의 로케이션들의 표시들을 제공할 수도 있다. 따라서, 비디오 파일 (150) 의 시간적 서브-시퀀스는 비디오 파일 (150) 의 SAP 들로부터 형성될 수도 있다. 시간적 서브-시퀀스는 또한, SAP 들로부터 종속되는 P-프레임들 및/또는 B-프레임들과 같은 다른 픽처들을 포함할 수도 있다. 서브-시퀀스의 다른 프레임들/슬라이스들에 종속되는 시간적 서브-시퀀스의 프레임들/슬라이스들이 적절하게 디코딩될 수 있도록, 시간적 서브-시퀀스의 프레임들 및/또는 슬라이스들은 세그먼트들 내에서 배열될 수도 있다. 예를 들어, 데이터의 계층적 배열에서, 다른 데이터에 대한 예측을 위하여 이용된 데이터는 또한, 시간적 서브-시퀀스 내에 포함될 수도 있다.

이 개시물의 기법들에 따르면, (역캡슐화 유닛 (29) 및/또는 비디오 디코더 (30) (도 1) 와 같은) 비디오 디코더는 비디오 데이터의 샘플들 또는 샘플 엔트리들에 기초하여 파라미터 세트 데이터를 결정하도록 구성될 수도 있다. 예를 들어, 역캡슐화 유닛 (29) 및/또는 비디오 디코더 (30) 는 영화 프래그먼트 (164) 내에 포함된 비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하도록 구성될 수도 있다. 일부 예들에서, 역캡슐화 유닛 (29) 및/또는 비디오 디코더 (30) 는 예컨대, ISOBMFF 의 섹션 4.8 (AVC), 섹션 6.5.5 (SVC), 섹션 7.5.3 (MVC), 및 섹션 8.4.3 (HEVC) 에서 기재된 조건들에 기초하여, 이러한 샘플들이 ISOBMFF 에 따른 동기 샘플들인지 여부를 결정할 수도 있다. 역캡슐화 유닛 (29) 및/또는 비디오 디코더 (30) 는 샘플들 자체에 기초하여, 또는 MRFA 박스 (166) 와 연관된 설명들에 기초하여 이러한 조건들을 평가할 수도 있다.

역캡슐화 유닛 (29) 및/또는 비디오 디코더 (30) 는 동기 샘플들이 아닌 샘플들에 대한 것보다, 동기 샘플들인 샘플들에 대하여 상이하게, 샘플의 비디오 데이터를 디코딩하기 위한 파라미터 세트 데이터를 결정할 수도 있다. 예를 들어, 역캡슐화 유닛 (29) 및/또는 비디오 디코더 (30) 는 오직 샘플과 연관된 샘플 엔트리로부터, 또는 샘플 자체로부터, 동기 샘플들에 대한 파라미터 세트 데이터를 결정하도록 구성될 수도 있다. 다른 한편으로, 역캡슐화 유닛 (29) 및/또는 비디오 디코더 (30) 는 오직 비-동기 샘플과 연관된 샘플 엔트리로부터, 비-동기 샘플 자체로부터, 디코딩 순서에서 비-동기 샘플 이전의 동기 샘플로부터, 또는 디코딩 순서에서 비-동기 샘플 이전이지만, 디코딩 순서에서 이전의 동기 샘플 이후에 발생하는 샘플들로부터, 비-동기 샘플들에 대한 파라미터 세트 데이터를 디코딩하도록 구성될 수도 있다.

도 5 는 비디오 비트스트림으로부터 파라미터 세트 데이터를 디코딩하기 위한 프로세스를 예시하는 흐름도이다. 예시의 목적들을 위하여 비디오 디코더 (30) (도 1 및 도 3) 에 대하여 설명되었지만, 도 5 의 프로세스 또는 그 부분들은 또한, 역캡슐화 유닛 (29) (도 1), 네트워크 엔티티 (79) (도 3), 또는 비디오 데이터를 파싱하고 및/또는 디코딩하도록 구성된 다른 프로세싱 유닛들에 의해 실행될 수도 있다는 것이 이해되어야 한다. 예를 들어, 역캡슐화 유닛 (29) 또는 네트워크 엔티티 (79) 는, 이 개시물에서 설명되고 도 5 에서 예시된 바와 같이, 특정한 로케이션들에서 샘플들을 디코딩하기 위한 파라미터 세트 데이터를 포함하거나, 또는 특정한 로케이션들로부터 샘플들을 디코딩하기 위한 파라미터 세트 데이터를 결정하기 위한 기법들을 수행할 수도 있다.

도 5 의 예에서, 비디오 디코더 (30) 는 비디오 데이터의 하나 이상의 샘플들을 포함하는 비디오 데이터의 파일을 수신할 수도 있다 (180). 예를 들어, 파일은 본원에서 설명된 바와 같이, ISOBMFF 를 준수할 수도 있다. 게다가, 하나 이상의 샘플들은 각각 비디오 데이터의 액세스 유닛에 대응할 수도 있다.

비디오 디코더 (30) 는 하나 이상의 샘플들의 임의의 샘플들이 동기 샘플들인지 여부를 결정할 수도 있다 (182). 예를 들어, 샘플들의 비디오 데이터를 디코딩하기 이전에, 비디오 디코더 (30) 는 특정한 비디오 코딩 표준에 대한 준수성 (conformance) 을 보장하기 위하여 샘플들을 포함하는 비트스트림을 분석할 수도 있다. 비디오 디코더 (30) 는 특정한 코딩 표준에 의해 정의된 바와 같이, 샘플들 중의 임의의 것이 동기 샘플들로서 프로세싱될 수도 있는지 여부를 결정할 수도 있다. 예시의 목적들을 위한 예에서, 비디오 디코더 (30) 는 ISOBMFF 의 섹션 4.8 (AVC), 섹션 6.5.5 (SVC), 섹션 7.5.3 (MVC), 및 섹션 8.4.3 (HEVC) 에서 기재된 제약들에 기초하여, 샘플들 중의 임의의 것이 동기 샘플들인지 여부를 결정할 수도 있다.

샘플이 동기 샘플이 아닌 것, 즉, 샘플이 비-동기 샘플인 것으로 결정하는 것에 기초하여, 비디오 디코더 (30) 또는 또 다른 디바이스는 오직 비-동기 샘플에 대응하는 샘플 엔트리, 비-동기 샘플 자체, 디코딩 순서에서 비-동기 샘플 이전에 발생하고 동기 샘플인 이전의 샘플로부터, 또는 비-동기 샘플과, 디코딩 순서에서의 이전의 동기 샘플과의 사이에서 발생하는 하나 이상의 샘플들로부터, 비-동기 샘플에 대한 파라미터 세트 데이터를 (예컨대, 파싱하거나, 취출하거나, 또는 그렇지 않을 경우에 획득함으로써) 결정할 수도 있다 (184). 예를 들어, 비디오 디코더 (30) 는 샘플에 대한 파라미터 세트 데이터가 그로부터 디코딩될 수도 있는 비트스트림의 어떤 로케이션들에 제약될 수도 있다. 디코딩 순서에서 배열된 샘플들을 가지는 주어진 비트스트림에 대하여, 비디오 디코더 (30) 는 비-동기 샘플에 대응하는 샘플 엔트리, 비-동기 샘플 자체, 비-동기 샘플 이전의 디코딩 순서에서 동기 샘플로서 디코딩된 이전의 샘플 이외의 임의의 로케이션으로부터, 또는 디코딩 순서에서 비-동기 샘플 이전에 발생하지만, 디코딩 순서에서 동기 샘플로서 디코딩된 이전의 샘플을 후행하는 샘플들로부터, 비-동기 샘플에 대한 비디오 데이터의 파라미터 세트 데이터를 디코딩하지 않을 수도 있다. 비-동기 샘플의 비디오 데이터를 디코딩하기 위하여 필요하게 된 모든 파라미터 세트 데이터는 비-동기 샘플에 대응하는 샘플 엔트리, 비-동기 샘플 자체, 비-동기 샘플 이전의 디코딩 순서에서 동기 샘플로서 디코딩된 이전의 샘플에서, 또는 디코딩 순서에서 비-동기 샘플 이전에 발생하지만, 디코딩 순서에서 동기 샘플로서 디코딩된 이전의 샘플을 후행하는 샘플들에서 포함된다.

다시 말해서, 동기 샘플이 아닌 현재의 샘플에 대하여, 비디오 디코더 (30) 는, 즉, 이전의 동기 샘플, 이전의 동기 샘플 이후이지만, 현재의 비-동기 샘플 이전의 샘플들을 포함하고, 현재의 비-동기 샘플을 포함하는, 오직 비-동기 샘플에 대한 샘플 엔트리에서, 또는 이전의 동기 샘플 이후의 현재의 비-동기 샘플까지의 샘플들 중의 임의의 것에서 포함되는 파라미터 세트들을 결정할 수도 있다. 비디오 디코더 (30) 는, 샘플이 동기 샘플이 아닐 경우에, 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들은 샘플에 대한 샘플 엔트리에서, 또는 이전의 동기 샘플 이후부터 샘플 자체까지의 샘플들 중의 임의의 것에서 중의 어느 하나에서 포함되므로, 오직 이 제약된 로케이션들로부터 비-동기 샘플에 대한 파라미터 세트 데이터를 결정하도록 구성될 수도 있다. 예를 들어, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 동기 샘플이 아닐 경우, 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들이 샘플에 대한 샘플 엔트리에서, 또는 이전의 동기 샘플 이후부터 샘플 자체까지의 샘플들 중의 임의의 것에서 중의 어느 하나에서 포함되도록 구성될 수도 있다.

샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 비디오 디코더 (30) 는 오직 동기 샘플에 대한 샘플 엔트리 또는 동기 샘플 자체로부터, 샘플에 대한 파라미터 세트 데이터를 결정할 수도 있다 (185). 동기 샘플의 비디오 데이터를 디코딩하기 위하여 필요하게 된 모든 파라미터 세트 데이터는 동기 샘플에 대응하는 샘플 엔트리 또는 동기 샘플 자체에서 포함된다. 이 때문에, 동기 샘플에 대하여, 비디오 디코더 (30) 는 다른 샘플들 또는 로케이션들에서가 아니라, 오직 샘플 엔트리 또는 샘플 자체에서, 동기 샘플에 대한 파라미터 세트 데이터를 결정할 수도 있다. 비디오 디코더 (30) 는, 샘플이 동기 샘플일 경우, 동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들이 샘플에 대한 샘플 엔트리에서, 또는 샘플 자체에서 중의 어느 하나에서 포함되므로, 오직 이 제약된 로케이션들로부터 비-동기 샘플에 대한 파라미터 세트 데이터를 (예컨대, 파싱하거나, 디코딩하거나, 취출하거나, 또는 그렇지 않을 경우에 획득함으로써) 결정하도록 구성될 수도 있다. 예를 들어, 비디오 인코더 (20), 캡슐화 유닛 (21), 역캡슐화 유닛 (29), 및/또는 비디오 디코더 (30), 또는 다른 디바이스들은, 샘플이 동기 샘플일 경우에, 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트들이 샘플에 대한 샘플 엔트리에서, 또는 샘플 자체에서 중의 어느 하나에서 포함되도록 구성될 수도 있다. 그 다음으로, 비디오 디코더 (30) 는 결정된 파라미터 세트 데이터에 기초하여 샘플의 비디오 데이터를 디코딩할 수도 있다 (186). 이전의 동기 샘플은 디코딩 순서에서 가장 최근의 동기 샘플일 수도 있다. 일부 예들에서, 비디오 디코더 (30) 는 새로운 동기 샘플의 수신 시에 이전에 저장된 파라미터 세트들을 폐기할 수도 있다.

도 6 은 비디오 비트스트림에서 파라미터 세트 데이터를 인코딩하기 위한 프로세스를 예시하는 흐름도이다. 예시의 목적들을 위하여 비디오 인코더 (20) (도 1 및 도 2) 에 대하여 설명되었지만, 도 6 의 프로세스 또는 그 부분들은 또한, 캡슐화 유닛 (21) (도 1), 포스트-프로세싱 엔티티 (27) (도 2), 또는 비디오 데이터를 생성하고, 인코딩하고, 및/또는 프로세싱하도록 구성된 다른 프로세싱 유닛들 또는 디바이스들에 의해 실행될 수도 있다는 것이 이해되어야 한다. 예를 들어, 캡슐화 유닛 (21) 또는 포스트-프로세싱 엔티티 (27) 는 이 개시물에서 설명되고 도 6 에서 예시된 바와 같이, 특정한 로케이션들에서 샘플들을 디코딩하기 위한 파라미터 세트 데이터를 포함하기 위한 기법들을 수행할 수도 있다.

도 6 의 예에서, 비디오 인코더 (20) 는 샘플들에 대한 파라미터 세트 데이터에 기초하여 비디오 데이터의 샘플을 인코딩할 수도 있다 (190). 인코딩된 샘플은 비디오 데이터의 액세스 유닛에 대응할 수도 있다. 비디오 인코더 (20) 는 특정한 비디오 코딩 표준에 의해 정의된 바와 같이, 하나 이상의 샘플들의 샘플들을 동기 샘플들 또는 비-동기 샘플들로서 인코딩할 수도 있다. 비디오 인코더 (20) 는 특정한 비디오 코딩 표준에 대한 준수성을 보장하기 위하여 샘플들을 포함하는 비트스트림을 생성할 수도 있다. ISOBMFF 의 섹션 4.8 (AVC), 섹션 6.5.5 (SVC), 섹션 7.5.3 (MVC), 및 섹션 8.4.3 (HEVC) 에서 기재된 제약들에 기초하여 정의된 동기 샘플에 대하여, 비디오 인코더 (20) 또는 또 다른 디바이스는 동기 샘플에 대응하는 샘플 엔트리에서, 또는 동기 샘플 자체에서, 동기 샘플을 디코딩하기 위하여 필요하게 된 모든 파라미터 세트 데이터를 포함할 수도 있다 (192). 이 방식으로, 비디오 인코더 (20) 또는 또 다른 디바이스는 오직 동기 샘플에 대응하는 샘플 엔트리에서, 또는 동기 샘플 자체에서, 동기 샘플을 디코딩함에 있어서의 이용을 위한 파라미터 세트 데이터를 포함할 수도 있다.

비-동기 샘플에 대하여, ISOBMFF 의 섹션 4.8 (AVC), 섹션 6.5.5 (SVC), 섹션 7.5.3 (MVC), 및 섹션 8.4.3 (HEVC) 에서 기재된 제약들에 기초하여 정의된 바와 같이, 비디오 인코더 (20) 또는 또 다른 디바이스는 비-동기 샘플에 대응하는 샘플 엔트리에서, 비-동기 샘플 자체에서, 디코딩 순서에서 비-동기 샘플의 이전에 있는 이전의 동기 샘플에서, 또는 디코딩 순서에서 비-동기 샘플 이전에 그리고 이전의 동기 샘플 이후에 발생하는 샘플들에서, 비-동기 샘플에 대한 모든 파라미터 세트 데이터를 포함할 수도 있다 (194). 이 방식으로, 비디오 인코더 (20) 또는 또 다른 디바이스는 오직 비-동기 샘플에 대응하는 샘플 엔트리, 비-동기 샘플 자체, 디코딩 순서에서의 이전의 동기 샘플에서, 또는 디코딩 순서에서 비-동기 샘플 이전에 그리고 이전의 동기 샘플 이후에 발생하는 샘플들에서, 동기 샘플을 디코딩함에 있어서의 이용을 위한 파라미터 세트 데이터를 포함할 수도 있다. 따라서, 비디오 디코더 (30) 가 비-동기 샘플에 대응하는 샘플 엔트리, 비-동기 샘플 자체, 동기 샘플로서 코딩된 이전의 샘플, 또는 디코딩 순서에서 비-동기 샘플 이전에 발생하지만, 디코딩 순서에서 동기 샘플로서 코딩된 이전의 샘플을 후행하는 하나 이상의 샘플들 이외의 임의의 로케이션으로부터, 비-동기 샘플에 대한 파라미터 세트 데이터를 디코딩하지 않을 수도 있도록, 비디오 인코더 (20) 는 샘플에 대한 파라미터 세트 데이터를 어떤 로케이션들로 제약할 수도 있다. 다시 말해서, 동기 샘플이 아닌 현재의 샘플에 대하여, 비디오 인코더 (20) 는 즉, 이전의 동기 샘플 이후이지만 현재의 비-동기 샘플 이전의 샘플 또는 샘플들을 포함하고, 현재의 비-동기 샘플 및 이전의 동기 샘플을 포함하는, 오직 샘플 엔트리에서, 또는 이전의 동기 샘플 이후로부터 현재의 샘플까지의 샘플들 중의 임의의 것에서, 파라미터 세트 데이터를 인코딩할 수도 있다.

그 다음으로, 비디오 인코더 (20) 는 비디오 데이터의 샘플을 포함하는 파일을 생성할 수도 있다 (196). 파일에서의 샘플들은 위에서 설명된 바와 같은 동기 샘플들 및/또는 비-동기 샘플들을 포함할 수도 있다. 파일은 하나 이상의 동기 샘플들 및 하나 이상의 비-동기 샘플들을 포함하는 다수의 샘플들을 포함할 수도 있다. 이 방식으로, 도 6 은, 비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하고, 샘플이 동기 샘플이 아닌 것 (즉, 비-동기 샘플임) 으로 결정하는 것에 기초하여, 오직 비-동기 샘플에 대한 샘플 엔트리에서, 비-동기 샘플 자체에서, 디코딩 순서에서 비-동기 샘플 이전에 있고 동기 샘플인 샘플에서, 또는 비-동기 샘플과, 동기 샘플인 디코딩 순서에서의 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 하나 이상의 샘플들에서, 비디오 데이터에 대한 파라미터 세트 데이터를 포함하기 위한 비디오 인코더 (20) 또는 또 다른 디바이스의 동작의 예를 설명한다. 마찬가지로, 도 6 은, 비디오 데이터의 제 2 샘플이 동기 샘플인지 여부를 결정하고, 제 2 샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 오직 동기 샘플에 대한 샘플 엔트리에서, 또는 동기 샘플에서, 비디오 데이터에 대한 파라미터 세트 데이터를 포함하기 위한 비디오 인코더 (20) 또는 또 다른 디바이스의 동작의 예를 예시한다. 일부 예들에서, 비디오 인코더 (20) 는 코딩 순서에서 동기 샘플 이전에 인코딩되었던 파라미터 세트들 (예컨대, PPS 들 및 SPS 들) 을 참조하여 동기 샘플 및 (코딩 순서에서의) 후속 샘플들을 인코딩하는 것을 추가로 회피할 수도 있다.

예에 따라서는, 본원에서 설명된 기법들 중의 임의의 것의 어떤 액트 (act) 들 또는 이벤트 (event) 들이 상이한 시퀀스에서 수행될 수 있거나, 추가될 수도 있거나, 병합될 수도 있거나, 또는 모두 배제 (예컨대, 모든 설명된 액트들 또는 이벤트들이 기법들의 실시를 위해 필요한 것은 아님) 될 수도 있다는 것이 인식되어야 한다. 또한, 어떤 예들에서는, 액트들 또는 이벤트들이 순차적인 것이 아니라, 예컨대, 멀티-스레딩된 (multi-threaded) 프로세싱, 인터럽트 프로세싱, 또는 다수의 프로세서들을 통해 동시에 수행될 수도 있다.

이 개시물에서 설명된 바와 같은 비디오 코더는 비디오 인코더 또는 비디오 디코더를 지칭할 수도 있다. 유사하게, 비디오 코딩 유닛은 비디오 인코더 또는 비디오 디코더를 지칭할 수도 있다. 마찬가지로, 비디오 코딩은 적용가능한 바와 같이, 비디오 인코딩 또는 비디오 디코딩을 지칭할 수도 있다.

하나 이상의 예들에서, 설명된 기능들은 하드웨어, 소프트웨어, 펌웨어, 또는 그 임의의 조합으로 구현될 수도 있다. 소프트웨어로 구현될 경우, 기능들은 하나 이상의 명령들 또는 코드로서, 컴퓨터-판독가능 매체 상에 저장되거나 컴퓨터-판독가능 매체를 통해 송신될 수도 있고, 하드웨어-기반 프로세싱 유닛에 의해 실행될 수도 있다. 컴퓨터-판독가능 매체들은 데이터 저장 매체들과 같은 유형의 매체에 대응하는 컴퓨터-판독가능 저장 매체들, 또는 예컨대, 통신 프로토콜에 따라 하나의 장소로부터 또 다른 장소로 컴퓨터 프로그램의 전송을 용이하게 하는 임의의 매체를 포함하는 통신 매체들을 포함할 수도 있다. 이 방식으로, 컴퓨터-판독가능 매체들은 일반적으로 (1) 비-일시적인 유형의 컴퓨터-판독가능 저장 매체들, 또는 (2) 신호 또는 반송파와 같은 통신 매체에 대응할 수도 있다. 데이터 저장 매체들은 이 개시물에서 설명된 기법들의 구현을 위한 명령들, 코드 및/또는 데이터 구조들을 취출하기 위해 하나 이상의 컴퓨터들 또는 하나 이상의 프로세서들에 의해 액세스될 수 있는 임의의 이용가능한 매체들일 수도 있다. 컴퓨터 프로그램 제품은 컴퓨터-판독가능 매체를 포함할 수도 있다.

제한이 아닌 예로서, 이러한 컴퓨터-판독가능 저장 매체들은 RAM, ROM, EEPROM, CD-ROM 또는 다른 광학 디스크 저장, 자기 디스크 저장, 또는 다른 자기 저장 디바이스들, 플래시 메모리, 또는 명령들 또는 데이터 구조들의 형태로 희망하는 프로그램 코드를 저장하기 위하여 이용될 수 있으며 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 접속은 컴퓨터-판독가능 매체로 적절하게 칭해진다. 예를 들어, 동축 케이블, 광섬유 케이블, 트위스트 페어 (twisted pair), 디지털 가입자 회선 (digital subscriber line; DSL), 또는 적외선, 라디오 (radio), 및 마이크로파 (microwave) 와 같은 무선 기술들을 이용하여 웹사이트, 서버, 또는 다른 원격 소스로부터 명령들이 송신될 경우, 동축 케이블, 광섬유 케이블, 트위스트 페어, DSL, 또는 적외선, 라디오, 및 마이크로파와 같은 무선 기술들은 매체의 정의 내에 포함된다. 그러나, 컴퓨터-판독가능 저장 매체들 및 데이터 저장 매체들은 접속들, 반송파들, 신호들, 또는 다른 일시적 매체 (transient medium) 들을 포함하는 것이 아니라, 그 대신에, 비-일시적인, 유형의 저장 매체들에 관한 것이라는 것이 이해되어야 한다. 본원에서 이용된 바와 같은 디스크 (disk) 및 디스크 (disc) 는 컴팩트 디스크 (compact disc; CD), 레이저 디스크 (laser disc), 광학 디스크 (optical disc), 디지털 다기능 디스크 (digital versatile disc; DVD), 플로피 디스크 (floppy disk) 및 블루레이 디스크 (Blu-ray disc) 를 포함하고, 여기서 디스크 (disk) 들은 통상 데이터를 자기적으로 재생하는 반면, 디스크 (disc) 들은 데이터를 레이저들로 광학적으로 재생한다. 상기의 조합들은 컴퓨터-판독가능 매체들의 범위 내에 또한 포함되어야 한다.

명령들은 하나 이상의 디지털 신호 프로세서들 (DSP들), 범용 마이크로프로세서들, 애플리케이션 특정 집적 회로들 (ASIC들), 필드 프로그래밍가능 로직 어레이들 (FPGA들), 또는 다른 등가의 집적된 또는 별도의 로직 회로와 같은 하나 이상의 프로세서들에 의해 실행될 수도 있다. 따라서, 본원에서 이용된 바와 같은 용어 "프로세서" 는 상기한 구조, 또는 본원에서 설명된 기법들의 구현을 위해 적당한 임의의 다른 구조 중의 임의의 것을 지칭할 수도 있다. 게다가, 일부 양태들에서는, 본원에서 설명된 기능성이 인코딩 및 디코딩을 위해 구성되거나 조합된 코덱 내에 통합된 전용 하드웨어 및/또는 소프트웨어 모듈들 내에서 제공될 수도 있다. 또한, 기법들은 하나 이상의 회로들 또는 로직 엘리먼트들에서 완전히 구현될 수 있다.

이 개시물의 기법들은 무선 핸드셋, 집적 회로 (IC) 또는 IC 들의 세트 (예컨대, 칩셋) 를 포함하는 광범위한 디바이스들 또는 장치들에서 구현될 수도 있다. 다양한 컴포넌트들, 모듈들, 또는 유닛들은 개시된 기법들을 수행하도록 구성된 디바이스들의 기능적 양태들을 강조하기 위하여 이 개시물에서 설명되어 있지만, 상이한 하드웨어 유닛들에 의한 실현을 반드시 요구하지는 않는다. 오히려, 위에서 설명된 바와 같이, 다양한 유닛들은 코덱 하드웨어 유닛 내에 조합될 수도 있거나, 적당한 소프트웨어 및/또는 펌웨어와 함께, 위에서 설명된 바와 같은 하나 이상의 프로세서들을 포함하는 상호동작하는 하드웨어 유닛들의 집합에 의해 제공될 수도 있다.

다양한 예들이 설명되었다. 이러한 그리고 다른 예들은 다음의 청구항들의 범위 내에 있다.

Claims

비디오 데이터를 디코딩하는 방법으로서,
비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하는 단계; 및
상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 상기 샘플에 대한 샘플 엔트리, 상기 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플로부터, 또는 상기 샘플과, 동기 샘플인 디코딩 순서에서의 상기 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플로부터, 상기 샘플의 상기 비디오 데이터에 대한 파라미터 세트 데이터를 결정하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법.
제 1 항에 있어서,
비디오 데이터의 제 2 샘플이 동기 샘플인지 여부를 결정하는 단계; 및
상기 제 2 샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 오직 상기 제 2 샘플에 대한 샘플 엔트리로부터, 또는 상기 제 2 샘플로부터, 상기 제 2 샘플의 상기 비디오 데이터에 대한 파라미터 세트 데이터를 결정하는 단계를 더 포함하는, 비디오 데이터를 디코딩하는 방법.
제 1 항에 있어서,
비디오 데이터의 상기 샘플이 동기 샘플인지 여부를 결정하는 단계는, 상기 샘플의 비디오 코딩 계층 (VCL) 네트워크 추상화 계층 (NAL) 유닛들이 상기 샘플에서 포함된 코딩된 픽처가 순간적 디코딩 리프레시 (IDR) 픽처, 클린 랜덤 액세스 (CRA) 픽처, 또는 파손된 링크 액세스 (BLA) 픽처인 것을 표시하는지 여부를 결정하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법.
제 1 항에 있어서,
비디오 데이터의 상기 샘플이 동기 샘플인지 여부를 결정하는 단계는, 상기 샘플에서의 비디오 데이터 네트워크 추상화 계층 (NAL) 유닛들이 상기 샘플에서 포함된 주 픽처가 순간적 디코딩 리프레시 (IDR) 픽처인 것을 표시하는지 여부를 결정하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법.
제 1 항에 있어서,
상기 샘플은 고효율 비디오 코딩 (HEVC), 고효율 스케일러블 비디오 코딩 (SHVC), 멀티뷰 고효율 비디오 코딩 (MV-HEVC), 진보된 비디오 코딩 (AVC), 스케일러블 비디오 코딩 (SVC), 및 멀티뷰 비디오 코딩 (MVC) 중의 적어도 하나를 준수하는, 비디오 데이터를 디코딩하는 방법.
제 1 항에 있어서,
결정된 상기 파라미터 세트 데이터에 기초하여 상기 샘플의 상기 비디오 데이터를 디코딩하는 단계를 더 포함하는, 비디오 데이터를 디코딩하는 방법.
제 1 항에 있어서,
파라미터 세트 데이터를 결정하는 단계는, 상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 그리고 상기 샘플과 연관된 샘플 엔트리 명칭에 기초하여 상기 파라미터 세트 데이터를 결정하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법.
비디오 데이터를 인코딩하는 방법으로서,
비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하는 단계; 및
상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 상기 샘플에 대한 샘플 엔트리, 상기 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플에서, 또는 상기 샘플과, 동기 샘플인 디코딩 순서에서의 상기 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플에서, 상기 비디오 데이터에 대한 파라미터 세트 데이터를 포함하는 단계를 포함하는, 비디오 데이터를 인코딩하는 방법.
제 8 항에 있어서,
비디오 데이터의 제 2 샘플이 동기 샘플인지 여부를 결정하는 단계; 및
상기 제 2 샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 오직 상기 제 2 샘플에 대한 샘플 엔트리에서, 또는 상기 제 2 샘플에서, 상기 제 2 샘플의 상기 비디오 데이터에 대한 파라미터 세트 데이터를 포함하는 단계를 더 포함하는, 비디오 데이터를 인코딩하는 방법.
제 8 항에 있어서,
비디오 데이터의 상기 샘플이 동기 샘플인지 여부를 결정하는 단계는, 상기 샘플의 비디오 코딩 계층 (VCL) 네트워크 추상화 계층 (NAL) 유닛들이 상기 샘플에서 포함된 코딩된 픽처가 순간적 디코딩 리프레시 (IDR) 픽처, 클린 랜덤 액세스 (CRA) 픽처, 또는 파손된 링크 액세스 (BLA) 픽처인 것을 표시하는지 여부를 결정하는 단계를 포함하는, 비디오 데이터를 인코딩하는 방법.
제 8 항에 있어서,
비디오 데이터의 상기 샘플이 동기 샘플인지 여부를 결정하는 단계는, 상기 샘플에서의 비디오 데이터 네트워크 추상화 계층 (NAL) 유닛들이 상기 샘플에서 포함된 주 픽처가 순간적 디코딩 리프레시 (IDR) 픽처인 것을 표시하는지 여부를 결정하는 단계를 포함하는, 비디오 데이터를 인코딩하는 방법.
제 8 항에 있어서,
상기 샘플은 고효율 비디오 코딩 (HEVC), 고효율 스케일러블 비디오 코딩 (SHVC), 멀티뷰 고효율 비디오 코딩 (MV-HEVC), 진보된 비디오 코딩 (AVC), 스케일러블 비디오 코딩 (SVC), 및 멀티뷰 비디오 코딩 (MVC) 중의 적어도 하나를 준수하는, 비디오 데이터를 인코딩하는 방법.
제 8 항에 있어서,
상기 파라미터 세트 데이터에 기초하여 상기 샘플의 상기 비디오 데이터를 인코딩하는 단계를 더 포함하는, 비디오 데이터를 인코딩하는 방법.
제 8 항에 있어서,
파라미터 세트 데이터를 포함하는 단계는, 상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 그리고 상기 샘플과 연관된 샘플 엔트리 명칭에 기초하여 상기 파라미터 세트 데이터를 포함하는 단계를 포함하는, 비디오 데이터를 인코딩하는 방법.
비디오 데이터를 디코딩하기 위한 디바이스로서,
비디오 데이터를 저장하도록 구성된 메모리; 및
하나 이상의 프로세서들을 포함하고,
상기 하나 이상의 프로세서들은,
비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하고; 그리고
상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 상기 샘플에 대한 샘플 엔트리, 상기 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플로부터, 또는 상기 샘플과, 동기 샘플인 디코딩 순서에서의 상기 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플로부터, 상기 비디오 데이터에 대한 파라미터 세트 데이터를 결정하도록
구성되는, 비디오 데이터를 디코딩하기 위한 디바이스.
제 15 항에 있어서,
상기 하나 이상의 프로세서들은,
비디오 데이터의 제 2 샘플이 동기 샘플인지 여부를 결정하고; 그리고
상기 제 2 샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 오직 상기 제 2 샘플에 대한 샘플 엔트리로부터, 또는 상기 제 2 샘플로부터, 상기 제 2 샘플의 상기 비디오 데이터에 대한 파라미터 세트 데이터를 결정하도록
구성되는, 비디오 데이터를 디코딩하기 위한 디바이스.
제 15 항에 있어서,
샘플이 동기 샘플인지 여부를 결정하기 위하여, 상기 하나 이상의 프로세서들은, 상기 샘플의 비디오 코딩 계층 (VCL) 네트워크 추상화 계층 (NAL) 유닛들이 상기 샘플에서 포함된 코딩된 픽처가 순간적 디코딩 리프레시 (IDR) 픽처, 클린 랜덤 액세스 (CRA) 픽처, 또는 파손된 링크 액세스 (BLA) 픽처인 것을 표시하는지 여부를 결정하도록 구성되는, 비디오 데이터를 디코딩하기 위한 디바이스.
제 15 항에 있어서,
비디오 데이터의 상기 샘플이 동기 샘플인지 여부를 결정하기 위하여, 상기 하나 이상의 프로세서들은, 상기 샘플에서의 비디오 데이터 네트워크 추상화 계층 (NAL) 유닛들이 상기 샘플에서 포함된 주 픽처가 순간적 디코딩 리프레시 (IDR) 픽처인 것을 표시하는지 여부를 결정하도록 구성되는, 비디오 데이터를 디코딩하기 위한 디바이스.
제 15 항에 있어서,
상기 샘플은 고효율 비디오 코딩 (HEVC), 고효율 스케일러블 비디오 코딩 (SHVC), 멀티뷰 고효율 비디오 코딩 (MV-HEVC), 진보된 비디오 코딩 (AVC), 스케일러블 비디오 코딩 (SVC), 및 멀티뷰 비디오 코딩 (MVC) 중의 적어도 하나를 준수하는, 비디오 데이터를 디코딩하기 위한 디바이스.
제 15 항에 있어서,
파라미터 세트 데이터를 결정하기 위하여, 상기 하나 이상의 프로세서들은, 상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 그리고 상기 샘플과 연관된 샘플 엔트리 명칭에 기초하여 상기 파라미터 세트 데이터를 결정하도록 구성되는, 비디오 데이터를 디코딩하기 위한 디바이스.
제 15 항에 있어서,
상기 하나 이상의 프로세서들은 상기 파라미터 세트 데이터에 기초하여 상기 샘플의 상기 비디오 데이터를 디코딩하도록 구성되는, 비디오 데이터를 디코딩하기 위한 디바이스.
제 15 항에 있어서,
상기 비디오 데이터를 디코딩하기 위한 디바이스는,
집적 회로;
마이크로프로세서; 및
비디오 디코더를 포함하는 무선 통신 디바이스
중의 적어도 하나를 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스.
제 15 항에 있어서,
상기 비디오 데이터를 디스플레이하도록 구성된 디스플레이를 더 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스.
비디오 데이터를 인코딩하기 위한 디바이스로서,
비디오 데이터를 저장하도록 구성된 메모리; 및
하나 이상의 프로세서들을 포함하고,
상기 하나 이상의 프로세서들은,
비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하고; 그리고
상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 상기 샘플에 대한 샘플 엔트리, 상기 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플에서, 또는 상기 샘플과, 동기 샘플인 디코딩 순서에서의 상기 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플에서, 상기 비디오 데이터에 대한 파라미터 세트 데이터를 포함하도록
구성되는, 비디오 데이터를 인코딩하기 위한 디바이스.
제 24 항에 있어서,
상기 하나 이상의 프로세서들은,
비디오 데이터의 제 2 샘플이 동기 샘플인지 여부를 결정하고; 그리고
상기 제 2 샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 오직 상기 제 2 샘플에 대한 샘플 엔트리에서, 또는 상기 제 2 샘플에서, 상기 제 2 샘플의 상기 비디오 데이터에 대한 파라미터 세트 데이터를 포함하도록
구성되는, 비디오 데이터를 인코딩하기 위한 디바이스.
제 24 항에 있어서,
동기 샘플이 동기 샘플인지 여부를 결정하기 위하여, 상기 하나 이상의 프로세서들은, 상기 샘플의 비디오 코딩 계층 (VCL) 네트워크 추상화 계층 (NAL) 유닛들이 상기 샘플에서 포함된 코딩된 픽처가 순간적 디코딩 리프레시 (IDR) 픽처, 클린 랜덤 액세스 (CRA) 픽처, 또는 파손된 링크 액세스 (BLA) 픽처인 것을 표시하는지 여부를 결정하도록 구성되는, 비디오 데이터를 인코딩하기 위한 디바이스.
제 24 항에 있어서,
비디오 데이터의 상기 샘플이 동기 샘플인지 여부를 결정하기 위하여, 상기 하나 이상의 프로세서들은, 상기 샘플에서의 비디오 데이터 네트워크 추상화 계층 (NAL) 유닛들이 상기 샘플에서 포함된 주 픽처가 순간적 디코딩 리프레시 (IDR) 픽처인 것을 표시하는지 여부를 결정하도록 구성되는, 비디오 데이터를 인코딩하기 위한 디바이스.
제 24 항에 있어서,
상기 샘플은 고효율 비디오 코딩 (HEVC), 고효율 스케일러블 비디오 코딩 (SHVC), 멀티뷰 고효율 비디오 코딩 (MV-HEVC), 진보된 비디오 코딩 (AVC), 스케일러블 비디오 코딩 (SVC), 및 멀티뷰 비디오 코딩 (MVC) 중의 적어도 하나를 준수하는, 비디오 데이터를 인코딩하기 위한 디바이스.
제 24 항에 있어서,
파라미터 세트 데이터를 포함하기 위하여, 상기 하나 이상의 프로세서들은, 상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 그리고 상기 샘플과 연관된 샘플 엔트리 명칭에 기초하여 상기 파라미터 세트 데이터를 포함하도록 구성되는, 비디오 데이터를 인코딩하기 위한 디바이스.
제 24 항에 있어서,
상기 하나 이상의 프로세서들은 상기 파라미터 세트 데이터에 기초하여 상기 샘플의 상기 비디오 데이터를 인코딩하도록 구성되는, 비디오 데이터를 인코딩하기 위한 디바이스.
제 24 항에 있어서,
상기 비디오 데이터를 인코딩하기 위한 디바이스는,
집적 회로;
마이크로프로세서; 및
비디오 인코더를 포함하는 무선 통신 디바이스
중의 적어도 하나를 포함하는, 비디오 데이터를 인코딩하기 위한 디바이스.
제 24 항에 있어서,
상기 비디오 데이터를 획득하도록 구성된 카메라를 더 포함하는, 비디오 데이터를 인코딩하기 위한 디바이스.
비디오 데이터를 디코딩하기 위한 디바이스로서,
비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하기 위한 수단; 및
상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 상기 샘플에 대한 샘플 엔트리, 상기 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플로부터, 또는 상기 샘플과, 동기 샘플인 디코딩 순서에서의 상기 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플로부터, 상기 비디오 데이터에 대한 파라미터 세트 데이터를 결정하기 위한 수단을 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스.
제 33 항에 있어서,
비디오 데이터의 제 2 샘플이 동기 샘플인지 여부를 결정하기 위한 수단; 및
상기 제 2 샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 오직 상기 제 2 샘플에 대한 샘플 엔트리로부터, 또는 상기 제 2 샘플로부터, 상기 제 2 샘플의 상기 비디오 데이터에 대한 파라미터 세트 데이터를 결정하기 위한 수단을 더 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스.
제 33 항에 있어서,
상기 파라미터 세트 데이터에 기초하여 상기 샘플의 상기 비디오 데이터를 디코딩하기 위한 수단을 더 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스.
비디오 데이터를 인코딩하기 위한 디바이스로서,
비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하기 위한 수단; 및
상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 상기 샘플에 대한 샘플 엔트리, 상기 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플에서, 또는 상기 샘플과, 동기 샘플인 디코딩 순서에서의 상기 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플에서, 상기 비디오 데이터에 대한 파라미터 세트 데이터를 포함하기 위한 수단을 포함하는, 비디오 데이터를 인코딩하기 위한 디바이스.
제 36 항에 있어서,
비디오 데이터의 제 2 샘플이 동기 샘플인지 여부를 결정하기 위한 수단; 및
상기 제 2 샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 오직 상기 제 2 샘플에 대한 샘플 엔트리로부터, 또는 상기 제 2 샘플에서, 상기 제 2 샘플의 상기 비디오 데이터에 대한 파라미터 세트 데이터를 포함하기 위한 수단을 더 포함하는, 비디오 데이터를 인코딩하기 위한 디바이스.
제 36 항에 있어서,
상기 파라미터 세트 데이터에 기초하여 상기 샘플의 상기 비디오 데이터를 인코딩하기 위한 수단을 더 포함하는, 비디오 데이터를 인코딩하기 위한 디바이스.
명령들이 저장된 비-일시적 컴퓨터-판독가능 저장 매체로서,
상기 명령들은, 실행될 경우, 하나 이상의 프로세서들로 하여금,
비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하게 하고; 그리고
상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 상기 샘플에 대한 샘플 엔트리, 상기 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플로부터, 또는 상기 샘플과, 동기 샘플인 디코딩 순서에서의 상기 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플로부터, 상기 비디오 데이터에 대한 파라미터 세트 데이터를 결정하게 하는, 비-일시적 컴퓨터-판독가능 저장 매체.
제 39 항에 있어서,
상기 명령들은, 상기 하나 이상의 프로세서들로 하여금, 비디오 데이터의 제 2 샘플이 동기 샘플인지 여부를 결정하게 하고, 상기 제 2 샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 오직 상기 제 2 샘플에 대한 샘플 엔트리로부터, 또는 상기 제 2 샘플로부터, 상기 제 2 샘플의 상기 비디오 데이터에 대한 파라미터 세트 데이터를 결정하게 하는, 비-일시적 컴퓨터-판독가능 저장 매체.
제 39 항에 있어서,
상기 명령들은, 상기 하나 이상의 프로세서들로 하여금, 상기 파라미터 세트 데이터에 기초하여 상기 샘플의 상기 비디오 데이터를 디코딩하게 하는, 비-일시적 컴퓨터-판독가능 저장 매체.
명령들이 저장된 비-일시적 컴퓨터-판독가능 저장 매체로서,
상기 명령들은, 실행될 경우, 하나 이상의 프로세서들로 하여금,
비디오 데이터의 샘플이 동기 샘플인지 여부를 결정하게 하고; 그리고
상기 샘플이 동기 샘플이 아닌 것으로 결정하는 것에 기초하여, 오직 상기 샘플에 대한 샘플 엔트리, 상기 샘플, 동기 샘플인 디코딩 순서에서의 이전의 샘플에서, 또는 상기 샘플과, 동기 샘플인 디코딩 순서에서의 상기 이전의 샘플과의 사이에서 디코딩 순서로 발생하는 샘플에서, 상기 비디오 데이터에 대한 파라미터 세트 데이터를 포함하게 하는, 비-일시적 컴퓨터-판독가능 저장 매체.
제 42 항에 있어서,
상기 명령들은, 상기 하나 이상의 프로세서들로 하여금, 비디오 데이터의 제 2 샘플이 동기 샘플인지 여부를 결정하게 하고, 상기 제 2 샘플이 동기 샘플인 것으로 결정하는 것에 기초하여, 오직 상기 제 2 샘플에 대한 샘플 엔트리에서, 또는 상기 제 2 샘플로부터, 상기 제 2 샘플의 상기 비디오 데이터에 대한 파라미터 세트 데이터를 포함하게 하는, 비-일시적 컴퓨터-판독가능 저장 매체.
제 42 항에 있어서,
상기 명령들은, 상기 하나 이상의 프로세서들로 하여금, 상기 파라미터 세트 데이터에 기초하여 상기 샘플의 상기 비디오 데이터를 인코딩하게 하는, 비-일시적 컴퓨터-판독가능 저장 매체.