WO2021215614A1

WO2021215614A1 - 영상의 복호화 방법 및 장치

Info

Publication number: WO2021215614A1
Application number: PCT/KR2020/018464
Authority: WO
Inventors: 이선영
Original assignee: 주식회사 아틴스
Priority date: 2020-04-24
Filing date: 2020-12-16
Publication date: 2021-10-28
Also published as: TWI782498B; TW202141985A; KR20210131920A; KR102267844B1; KR102267873B1

Abstract

본 개시는 영상 복호화 장치가 수행하는 영상 복호화 방법을 개시한다. 일 실시 예에 따른 영상 복호화 방법은 비트스트림으로부터 현재 NAL(network abstraction layer) 유닛의 타입을 나타내는 NAL 유닛 타입 정보를 획득하는 단계; 및 상기 NAL 유닛 타입 정보가 상기 현재 NAL 유닛의 NAL 유닛 타입이 영상 슬라이스에 대한 부호화 데이터임을 나타내는 경우, 현재 픽처에 혼성 NAL 유닛 타입(mixed NAL unit type)이 적용되는지 여부에 기반하여 상기 영상 슬라이스를 복호화 하는 단계를 포함할 수 있다.

Description

영상의 복호화 방법 및 장치

본 발명은 다른 시퀀스 들과의 합성을 위한 서브 픽처 분할 방법 및 비트스트림 패킹을 위한 슬라이스 분할 방법에 관한 것이다.

고해상도, 고품질 영상에 대한 사용자 수요가 증가하고 있다. 고해상도 영상의 부호화 데이터는 저해상도 또는 중해상도 영상의 부호화 데이터 보다 많은 정보량을 가짐에 따라, 이를 전송하거나 저장하기 위한 비용이 증가하게 된다.

이와 같은 문제를 해결하기 위하여 고해상도 영상의 부호화 데이터량을 효과적으로 줄이기 위한 부호화 및 복호화 방법의 연구가 계속되고 있다.

본 명세서는 다른 시퀀스들과의 합성을 위한 서브 픽처 분할 방법 및 비트 스트림 패킹을 위한 슬라이스 분할 방법을 제시한다.

상기한 문제를 해결하기 위한, 본 발명의 일 실시 예에 따른 영상 복호화 장치가 수행하는 영상 복호화 방법은 비트스트림으로부터 현재 NAL(network abstraction layer) 유닛의 타입을 나타내는 NAL 유닛 타입 정보를 획득하는 단계; 및 상기 NAL 유닛 타입 정보가 상기 현재 NAL 유닛의 NAL 유닛 타입이 영상 슬라이스에 대한 부호화 데이터임을 나타내는 경우, 현재 픽처에 혼성 NAL 유닛 타입(mixed NAL unit type)이 적용되는지 여부에 기반하여 상기 영상 슬라이스를 복호화 하는 단계를 포함한다. 여기서, 상기 영상 슬라이스를 복호화 하는 단계는, 상기 혼성 NAL 유닛 타입이 적용되는지 여부에 기반하여 상기 현재 NAL 유닛의 NAL 유닛 타입이 상기 현재 영상 슬라이스에 대한 서브 픽처의 속성을 나타내는지 여부를 결정함으로써 수행될 수 있다.

또한, 상기한 문제를 해결하기 위한 본 발명의 일 실시 예에 따른 영상 복호화 장치는 메모리 및 적어도 하나의 프로세서를 포함하는 영상 복호화 장치로서, 상기 적어도 하나의 프로세서는, 비트스트림으로부터 현재 NAL(network abstraction layer) 유닛의 타입을 나타내는 NAL 유닛 타입 정보를 획득하고, 상기 NAL 유닛 타입 정보가 상기 현재 NAL 유닛의 NAL 유닛 타입이 영상 슬라이스에 대한 부호화 데이터임을 나타내는 경우, 현재 픽처에 혼성 NAL 유닛 타입이 적용되는지 여부에 기반하여 상기 영상 슬라이스를 복호화할 수 있다. 이때, 상기 영상 슬라이스의 복호화는, 상기 혼성 NAL 유닛 타입이 적용되는지 여부에 기반하여 상기 현재 NAL 유닛의 NAL 유닛 타입이 상기 현재 영상 슬라이스에 대한 서브 픽처의 속성을 나타내는지 여부를 결정함으로써 수행될 수 있다.

또한, 상기한 문제를 해결하기 위한 본 발명의 일 실시 예에 따른 영상 부호화 장치가 수행하는 영상 부호화 방법은 현재 픽처가 혼성 NAL 유닛 타입에 기반하여 부호화되는 경우, 상기 픽처를 분할하는 서브 픽처의 타입을 결정하는 단계; 및 상기 서브 픽처의 타입에 기반하여 상기 서브 픽처를 구성하는 적어도 하나의 현재 영상 슬라이스를 부호화하여 현재 NAL 유닛을 생성하는 단계를 포함할 수 있다. 여기서, 상기 영상 슬라이스를 부호화 하는 단계는, 상기 현재 픽처가 상기 혼성 NAL 유닛 타입에 기반하여 부호화되는 경우 상기 현재 NAL 유닛의 NAL 유닛 타입이 상기 현재 영상 슬라이스에 대한 서브 픽처의 속성을 나타내도록 부호화함으로써 수행될 수 있다.

또한, 상기한 문제를 해결하기 위한 본 발명의 일 실시 예에 따른 전송 방법은, 본 개시의 영상 부호화 장치 또는 영상 부호화 방법에 의해 생성된 비트스트림을 전송할 수 있다.

또한, 상기한 문제를 해결하기 위한 본 발명의 일 실시 예에 따른 컴퓨터 판독 가능한 기록 매체는, 본 개시의 영상 부호화 방법 또는 영상 부호화 장치에 의해 생성된 비트스트림을 저장할 수 있다.

본 발명은 여러 다른 시퀀스들과의 합성을 통해 하나의 픽처를 생성하는 방법을 제시한다. 시퀀스 내 픽처는 다수 개의 서브-픽처로 분할되고, 다른 픽처들의 분할된 서브 픽처를 합성하여 새로운 픽처를 생성한다.

본 발명의 적용에 따라 하나의 픽처를 구성하는 2개 이상의 서브 픽처에 대한 NAL (network abstraction layer) 유닛 타입 값이 서로 상이할 수 있다. 이는, 서로 다른 컨텐츠 합성 시에 한 장의 이미지를 구성하는 다수 개의 서브 픽처의 NUT을 동일하게 맞출 필요가 없기 때문에 용이하게 이미지를 구성/합성할 수 있는 장점을 가진다.

도 1은 본 발명이 적용될 수 있는 비디오 인코딩 장치의 구성을 개략적으로 나타내는 도면이다.

도 2는 비디오 인코딩 장치에 의하여 수행되는 영상 인코딩 방법의 일 예를 나타내는 도면이다.

도 3은 본 발명이 적용될 수 있는 비디오 디코딩 장치의 구성을 개략적으로 나타내는 도면이다.

도 4는 디코딩 장치에 의하여 수행되는 영상 디코딩 방법의 일 예를 나타내는 도면이다.

도 5는 슬라이스를 위한 NAL 패킷의 예시를 나타내는 도면이다.

도 6은 계층적 GOP 구조의 일례를 나타내는 도면이다.

도 7은 디스플레이 출력 순서 및 디코딩 순서의 일례를 나타내는 도면이다.

도 8은 리딩 픽처 및 노말 픽처의 일례를 나타내는 도면이다.

도 9는 RASL 픽처 및 RADL 픽처의 일례를 나타내는 도면이다.

도 10은 슬라이스 세그먼트 헤더에 대한 신택스를 도시하는 도면이다.

도 11은 컨텐츠 합성 과정의 일례를 나타내는 도면이다.

도 12는 서브 픽처 ID 및 슬라이스 주소의 일례를 나타내는 도면이다.

도 13은 서브 픽처 / 슬라이스 별 NUT의 일례를 나타내는 도면이다.

도 14는 픽처 파라미터 셋(PPS)의 신택스에 대한 일 실시 예를 도시하는 도면이다.

도 15는 슬라이스 헤더의 신택스에 대한 일 실시 예를 도시하는 도면이다.

도 16은 픽처 헤더 스트럭처의 신택스를 도시하는 도면이다.

도 17은 참조 픽처 리스트를 획득하기 위한 신택스를 도시하는 도면이다.

도 18은 컨텐츠 합성 일례를 나타내는 도면이다.

도 19와 도 20은 본 발명의 일 실시 예에 따른 복호화 방법과 부호화 방법을 설명하는 순서도를 나타낸다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정 실시예에 한정하려고 하는 것이 아니다. 본 명세서에서 사용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서 "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

한편, 본 발명에서 설명되는 도면상의 각 구성들은 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성 요소에 대해서는 동일한 참조 부호를 사용하고 동일한 구성 요소에 대해서 중복된 설명은 생략한다.

한편, 본 발명은 비디오/영상 코딩에 관한 것이다. 예를 들어, 본 발명에서 개시된 방법/실시예는 VVC (versatile video coding) 표준, EVC (Essential Video Coding) 표준, AV1 (AOMedia Video 1) 표준, AVS2 (2nd generation of audio video coding standard) 또는 차세대 비디오/이미지 코딩 표준(예를 들어, H.267, H.268 등)에 개시된 방법에 적용될 수 있다.

본 명세서에서 엑세스 유닛(Access unit; AU)은 DPB(Decoded picture buffer)에서 동일한 시간에 출력되는 서로 다른 레이어에 속한 복수의 픽처 셋을 나타내는 단위를 의미한다. 픽처(picture)는 일반적으로 특정 시간대의 하나의 영상을 나타내는 단위를 의미하며, 슬라이스(slice)는 코딩에 있어서 픽처의 일부를 구성하는 단위이다. 하나의 픽처는 복수의 슬라이스로 구성될 수 있으며, 필요에 따라서 픽처 및 슬라이스는 서로 혼용되어 사용될 수 있다.

픽셀(pixel) 또는 펠(pel)은 하나의 픽처(또는 영상)을 구성하는 최소의 단위를 의미할 수 있다. 또한, 픽셀에 대응하는 용어로서 '샘플(sample)'이 사용될 수 있다. 샘플은 일반적으로 픽셀 또는 픽셀의 값을 나타낼 수 있으며, 휘도(luma) 성분의 픽셀/픽셀값만을 나타낼 수도 있고, 채도(chroma) 성분의 픽셀/픽셀 값만을 나타낼 수도 있다.

유닛(unit)은 영상 처리의 기본 단위를 나타낸다. 유닛은 픽처의 특정 영역 및 해당 영역에 관련된 정보 중 적어도 하나를 포함할 수 있다. 유닛은 경우에 따라서 블록(block) 또는 영역(area) 등의 용어와 혼용하여 사용될 수 있다. 일반적인 경우, MxN 블록은 M개의 열과 N개의 행으로 이루어진 샘플들 또는 변환 계수(transform coefficient)들의 집합을 나타낼 수 있다.

도 1은 본 발명이 적용될 수 있는 비디오 인코딩 장치의 구성을 개략적으로 설명하는 도면이다.

도 1을 참조하면, 비디오 인코딩 장치(100)는 픽처 분할부(105), 예측부(110), 레지듀얼 처리부(120), 엔트로피 인코딩부(130), 가산부(140), 필터부(150) 및 메모리(160)을 포함할 수 있다. 레지듀얼 처리부(120)는 감산부(121), 변환부(122), 양자화부(123), 재정렬부(124), 역양자화부(125) 및 역변환부(126)를 포함할 수 있다.

픽처 분할부(105)는 입력된 픽처를 적어도 하나의 처리 유닛(processing unit)으로 분할할 수 있다.

일 예로, 처리 유닛은 코딩 유닛(coding unit, CU)이라고 불릴 수 있다. 이 경우 코딩 유닛은 코딩 트리 유닛(Coding Tree Unit)으로부터 QTBT (Quad-tree binary-tree) 구조에 따라 재귀적으로(recursively) 분할될 수 있다. 예를 들어, 하나의 코딩 트리 유닛은 쿼드 트리 구조 및/또는 바이너리 트리 구조를 기반으로 하위(deeper) 뎁스의 복수의 노드들로 분할될 수 있다. 이 경우 예를 들어 쿼드 트리 구조가 먼저 적용되고 바이너리 트리 구조가 나중에 적용될 수 있다. 또는 바이너리 트리 구조가 먼저 적용될 수도 있다. 더 이상 분할되지 않는 노드에 대하여 복호화가 수행될 수 있으며, 이와 같이 더 이상 분할되지 않는 노드에 대하여 코딩 유닛이 결정될 수 있다. 코딩 트리 유닛은 코딩 유닛의 분할을 위한 단위인 점에서, 코딩 트리 유닛을 코딩 유닛으로 명명할 수도 있다. 이러한 경우, 코딩 트리 유닛의 분할에 의하여 코딩 유닛이 결정되는 점에서 코딩 트리 유닛을 최대 코딩 유닛(largest coding unit, LCU)이라 명명할 수도 있다.

이와 같이, 더 이상 분할되지 않는 최종 코딩 유닛을 기반으로 본 발명에 따른 코딩 절차가 수행될 수 있다. 이 경우 영상 특성에 따른 코딩 효율 등을 기반으로, 코딩 트리 유닛이 바로 최종 코딩 유닛으로 사용될 수 있고, 또는 필요에 따라 코딩 유닛은 재귀적으로(recursively) 보다 하위 뎁스의 코딩 유닛들로 분할되어 최적의 사이즈의 코딩 유닛이 최종 코딩 유닛으로 사용될 수 있다. 여기서 코딩 절차라 함은 후술하는 예측, 변환, 및 복원 등의 절차를 포함할 수 있다.

다른 예로, 처리 유닛은 코딩 유닛(coding unit, CU), 예측 유닛(prediction unit, PU) 또는 변환 유닛(transform unit, TU)을 포함할 수도 있다. 코딩 유닛은 코딩 트리 유닛으로부터 쿼드 트리 구조를 따라서 하위(deeper) 뎁스의 코딩 유닛들로 분할(split)될 수 있다. 이 경우 영상 특성에 따른 코딩 효율 등을 기반으로, 코딩 트리 유닛이 바로 최종 코딩 유닛으로 사용될 수 있고, 또는 필요에 따라 코딩 유닛은 재귀적으로(recursively) 보다 하위 뎁스의 코딩 유닛들로 분할되어 최적의 사이즈의 코딩 유닛이 최종 코딩 유닛으로 사용될 수 있다. 최소 코딩 유닛(min coding unit, min CU)이 설정된 경우 코딩 유닛은 최소 코딩 유닛보다 더 작은 코딩 유닛으로 분할될 수 없다. 여기서 최종 코딩 유닛이라 함은 예측 유닛 또는 변환 유닛으로 파티셔닝 또는 분할되는 기반이 되는 코딩 유닛을 의미한다. 예측 유닛은 코딩 유닛으로부터 파티셔닝(partitioning)되는 유닛으로서, 샘플 예측의 유닛일 수 있다. 이 때, 예측 유닛은 서브 블록(sub block)으로 나뉠 수도 있다. 변환 유닛은 코딩 유닛으로부터 쿼드 트리 구조를 따라서 분할 될 수 있으며, 변환 계수를 유도하는 유닛 및/또는 변환 계수로부터 레지듀얼 신호(residual signal)를 유도하는 유닛일 수 있다. 이하, 코딩 유닛은 코딩 블록(coding block, CB), 예측 유닛은 예측 블록(prediction block, PB), 변환 유닛은 변환 블록(transform block, TB)으로 불릴 수 있다. 예측 블록 또는 예측 유닛은 픽처 내에서 블록 형태의 특정 영역을 의미할 수 있고, 예측 샘플의 어레이(array)를 포함할 수 있다. 또한, 변환 블록 또는 변환 유닛은 픽처 내에서 블록 형태의 특정 영역을 의미할 수 있고, 변환 계수 또는 레지듀얼 샘플의 어레이를 포함할 수 있다.

예측부(110)는 처리 대상 블록(이하, 현재 블록이라 함)에 대한 예측을 수행하고, 상기 현재 블록에 대한 예측 샘플들을 포함하는 예측된 블록(predicted block)을 생성할 수 있다. 예측부(110)에서 수행되는 예측의 단위는 코딩 블록일 수 있고, 변환 블록일 수도 있고, 예측 블록일 수도 있다.

예측부(110)는 현재 블록에 인트라 예측이 적용되는지 인터 예측이 적용되는지를 결정할 수 있다. 일 예로, 예측부(110)는 CU 단위로 인트라 예측 또는 인터 예측이 적용되는지를 결정할 수 있다.

인트라 예측의 경우에, 예측부(110)는 현재 블록이 속하는 픽처(이하, 현재 픽처) 내의 현재 블록 외부의 참조 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이 때, 예측부(110)는 (i) 현재 블록의 주변(neighboring) 참조 샘플들의 평균(average) 혹은 인터폴레이션(interpolation)을 기반으로 예측 샘플을 유도할 수 있고, (ii) 현재 블록의 주변 참조 샘플들 중 예측 샘플에 대하여 특정 (예측) 방향에 존재하는 참조 샘플을 기반으로 상기 예측 샘플을 유도할 수도 있다. (i)의 경우는 비방향성 모드 또는 비각도 모드, (ii)의 경우는 방향성(directional) 모드 또는 각도(angular) 모드라고 불릴 수 있다. 인트라 예측에서 예측 모드는 예를 들어 33개의 방향성 예측 모드와 적어도 2개 이상의 비방향성 모드를 가질 수 있다. 비방향성 모드는 DC 예측 모드 및 플래너 모드(Planar 모드)를 포함할 수 있다. 예측부(110)는 주변 블록에 적용된 예측 모드를 이용하여, 현재 블록에 적용되는 예측 모드를 결정할 수도 있다.

인터 예측의 경우에, 예측부(110)는 참조 픽처 상에서 움직임 벡터에 의해 특정되는 샘플을 기반으로, 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(110)는 스킵(skip) 모드, 머지(merge) 모드, 및 MVP(motion vector prediction) 모드 중 어느 하나를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 스킵 모드와 머지 모드의 경우에, 예측부(110)는 주변 블록의 움직임 정보를 현재 블록의 움직임 정보로 이용할 수 있다. 스킵 모드의 경우, 머지 모드와 달리 예측 샘플과 원본 샘플 사이의 차(레지듀얼)가 전송되지 않는다. MVP 모드의 경우, 주변 블록의 움직임 벡터를 움직임 벡터 예측자(Motion Vector Predictor)로 이용하여 현재 블록의 움직임 벡터 예측자로 이용하여 현재 블록의 움직임 벡터를 유도할 수 있다.

인터 예측의 경우에, 주변 블록은 현재 픽처 내에 존재하는 공간적 주변 블록(spatial neighboring block)과 참조 픽처(reference picture)에 존재하는 시간적 주변 블록(temporal neighboring block)을 포함할 수 있다. 상기 시간적 주변 블록을 포함하는 참조 픽처는 동일 위치 픽처(collocated picture, colPic)라고 불릴 수도 있다. 움직임 정보(motion information)는 움직임 벡터와 참조 픽처 인덱스를 포함할 수 있다. 예측 모드 정보와 움직임 정보 등의 정보는 (엔트로피) 인코딩되어 비트스트림 형태로 출력될 수 있다.

스킵 모드와 머지 모드에서 시간적 주변 블록의 움직임 정보가 이용되는 경우에, 참조 픽처 리스트(reference picture list) 상의 최상위 픽처가 참조 픽처로서 이용될 수도 있다. 참조 픽처 리스트에 포함되는 참조 픽처들은 현재 픽처와 해당 참조 픽처 간의 POC(Picture order count) 차이 기반으로 정렬될 수 있다. POC는 픽처의 디스플레이 순서에 대응하며, 코딩 순서와 구분될 수 있다.

감산부(121)는 원본 샘플과 예측 샘플 간의 차이인 레지듀얼 샘플을 생성한다. 스킵 모드가 적용되는 경우에는, 상술한 바와 같이 레지듀얼 샘플을 생성하지 않을 수 있다.

변환부(122)는 변환 블록 단위로 레지듀얼 샘플을 변환하여 변환 계수(transform coefficient)를 생성한다. 변환부(122)는 해당 변환 블록의 사이즈와, 해당 변환 블록과 공간적으로 겹치는 코딩 블록 또는 예측 블록에 적용된 예측 모드에 따라서 변환을 수행할 수 있다. 예컨대, 상기 변환 블록과 겹치는 상기 코딩 블록 또는 상기 예측 블록에 인트라 예측이 적용되었고, 상기 변환 블록이 4×4의 레지듀얼 어레이(array)라면, 레지듀얼 샘플은 DST(Discrete Sine Transform) 변환 커널을 이용하여 변환되고, 그 외의 경우라면 레지듀얼 샘플은 DCT(Discrete Cosine Transform) 변환 커널을 이용하여 변환할 수 있다.

양자화부(123)는 변환 계수들을 양자화하여, 양자화된 변환 계수를 생성할 수 있다.

재정렬부(124)는 양자화된 변환 계수를 재정렬한다. 재정렬부(124)는 계수들 스캐닝(scanning) 방법을 통해 블록 형태의 양자화된 변환 계수들을 1차원 벡터 형태로 재정렬할 수 있다. 여기서 재정렬부(124)는 별도의 구성으로 설명하였으나, 재정렬부(124)는 양자화부(123)의 일부일 수 있다.

엔트로피 인코딩부(130)는 양자화된 변환 계수들에 대한 엔트로피 인코딩을 수행할 수 있다. 엔트로피 인코딩은 예를 들어 지수 골롬(exponential Golomb), CAVLC(context-adaptive variable length coding), CABAC(context-adaptive binary arithmetic coding) 등과 같은 인코딩 방법을 포함할 수 있다. 엔트로피 인코딩부(130)는 양자화된 변환 계수 외 비디오 복원에 필요한 정보들(예컨대 신택스 요소(syntax element)의 값 등)을 함께 또는 별도로 인코딩할 수도 있다. 엔트로피 인코딩된 정보들은 비트스트림 형태로 NAL(network abstraction layer) 유닛 단위로 전송 또는 저장될 수 있다.

역양자화부(125)는 양자화부(123)에서 양자화된 값(양자화된 변환 계수)들을 역양자화하고, 역변환부(126)는 역양자화부(125)에서 역양자화된 값들을 역변환하여 레지듀얼 샘플을 생성한다.

가산부(140)는 레지듀얼 샘플과 예측 샘플을 합쳐서 픽처를 복원한다. 레지듀얼 샘플과 예측 샘플은 블록 단위로 더해져서 복원 블록이 생성될 수 있다. 여기서 가산부(140)는 별도의 구성으로 설명하였으나, 가산부(140)는 예측부(110)의 일부일 수 있다. 한편, 가산부(140)는 복원부 또는 복원 블록 생성부로 불릴 수도 있다.

복원된 픽처(reconstructed picture)에 대하여 필터부(150)는 디블록킹 필터 및/또는 샘플 적응적 오프셋(sample adaptive offset)을 적용할 수 있다. 디블록킹 필터링 및/또는 샘플 적응적 오프셋을 통해, 복원 픽처 내 블록 경계의 아티팩트나 양자화 과정에서의 왜곡이 보정될 수 있다. 샘플 적응적 오프셋은 샘플 단위로 적용될 수 있으며, 디블록킹 필터링의 과정이 완료된 후 적용될 수 있다. 필터부(150)는 ALF(Adaptive Loop Filter)를 복원된 픽처에 적용할 수도 있다. ALF는 디블록킹 필터 및/또는 샘플 적응적 오프셋이 적용된 후의 복원된 픽처에 대하여 적용될 수 있다.

메모리(160)는 복원 픽처(디코딩된 픽처) 또는 인코딩/디코딩에 필요한 정보를 저장할 수 있다. 여기서 복원 픽처는 상기 필터부(150)에 의하여 필터링 절차가 완료된 복원 픽처일 수 있다. 상기 저장된 복원 픽처는 다른 픽처의 (인터) 예측을 위한 참조 픽처로 활용될 수 있다. 예컨대, 메모리(160)는 인터 예측에 사용되는 (참조) 픽처들을 저장할 수 있다. 이 때, 인터 예측에 사용되는 픽처들은 참조 픽처 세트(reference picture set) 혹은 참조 픽처 리스트(reference picture list)에 의해 지정될 수 있다.

도 2는 비디오 인코딩 장치에 의하여 수행되는 영상 인코딩 방법의 일 예를 나타낸다. 도 2를 참조하면 상기 영상 인코딩 방법은 블록 파티셔닝(block partitioning), 인트라/인터 예측, 변환(transform), 양자화(quantization) 및 엔트로피 인코딩(entropy encoding) 과정을 포함할 수 있다. 예를 들어, 현재 픽처는 복수의 블록들로 분할될 수 있고, 인트라/인터 예측을 통하여 현재 블록의 예측 블록이 생성될 수 있고, 상기 현재 블록의 입력 블록과 상기 예측 블록과의 감산을 통하여 상기 현재 블록의 레지듀얼 블록이 생성될 수 있다. 이 후, 상기 레지듀얼 블록에 대한 변환을 통하여 계수(coefficent) 블록, 즉, 상기 현재 블록의 변환 계수들이 생성될 수 있다. 상기 변환 계수들은 양자화 및 엔트로피 인코딩되어 비트스트림에 저장될 수 있다.

도 3은 본 발명이 적용될 수 있는 비디오 디코딩 장치의 구성을 개략적으로 설명하는 도면이다.

도 3을 참조하면, 비디오 디코딩 장치(300)는 엔트로피 디코딩부(310), 레지듀얼 처리부(320), 예측부(330), 가산부(340), 필터부(350) 및 메모리(360)를 포함할 수 있다. 여기서 레지듀얼 처리부(320)는 재정렬부(321), 역양자화부(322), 역변환부(323)를 포함할 수 있다.

비디오 정보를 포함하는 비트스트림이 입력되면, 비디오 디코딩 장치(300)는 비디오 인코딩 장치에서 비디오 정보가 처리된 프로세스에 대응하여 비디오를 복원할 수 있다.

예컨대, 비디오 디코딩 장치(300)는 비디오 인코딩 장치에서 적용된 처리 유닛을 이용하여 비디오 디코딩을 수행할 수 있다. 따라서 비디오 디코딩의 처리 유닛 블록은 일 예로 코딩 유닛일 수 있고, 다른 예로 코딩 유닛, 예측 유닛 또는 변환 유닛일 수 있다. 코딩 유닛은 코딩 트리 유닛으로부터 쿼드 트리 구조 및/또는 바이너리 트리 구조를 따라서 분할될 수 있다.

예측 유닛 및 변환 유닛이 경우에 따라 더 사용될 수 있으며, 이 경우 예측 블록은 코딩 유닛으로부터 도출 또는 파티셔닝되는 블록으로서, 샘플 예측의 유닛일 수 있다. 이 때, 예측 유닛은 서브 블록으로 나뉠 수도 있다. 변환 유닛은 코딩 유닛으로부터 쿼드 트리 구조를 따라서 분할 될 수 있으며, 변환 계수를 유도하는 유닛 또는 변환 계수로부터 레지듀얼 신호를 유도하는 유닛일 수 있다.

엔트로피 디코딩부(310)는 비트스트림을 파싱하여 비디오 복원 또는 픽처 복원에 필요한 정보를 출력할 수 있다. 예컨대, 엔트로피 디코딩부(310)는 지수 골롬 부호화, CAVLC 또는 CABAC 등의 코딩 방법을 기초로 비트스트림 내 정보를 디코딩하고, 비디오 복원에 필요한 신택스 엘리먼트의 값, 레지듀얼에 관한 변환 계수의 양자화된 값 들을 출력할 수 있다.

보다 상세하게, CABAC 엔트로피 디코딩 방법은, 비트스트림에서 각 구문 요소에 해당하는 빈을 수신하고, 디코딩 대상 구문 요소 정보와 주변 및 디코딩 대상 블록의 디코딩 정보 혹은 이전 단계에서 디코딩된 심볼/빈의 정보를 이용하여 문맥(context) 모델을 결정하고, 결정된 문맥 모델에 따라 빈(bin)의 발생 확률을 예측하여 빈의 산술 디코딩(arithmetic decoding)를 수행하여 각 구문 요소의 값에 해당하는 심볼을 생성할 수 있다. 이때, CABAC 엔트로피 디코딩 방법은 문맥 모델 결정 후 다음 심볼/빈의 문맥 모델을 위해 디코딩된 심볼/빈의 정보를 이용하여 문맥 모델을 업데이트할 수 있다.

엔트로피 디코딩부(310)에서 디코딩된 정보 중 예측에 관한 정보는 예측부(330)로 제공되고, 엔트로피 디코딩부(310)에서 엔트로피 디코딩이 수행된 레지듀얼 값, 즉 양자화된 변환 계수는 재정렬부(321)로 입력될 수 있다.

재정렬부(321)는 양자화되어 있는 변환 계수들을 2차원의 블록 형태로 재정렬할 수 있다. 재정렬부(321)는 인코딩 장치에서 수행된 계수 스캐닝에 대응하여 재정렬을 수행할 수 있다. 여기서 재정렬부(321)는 별도의 구성으로 설명하였으나, 재정렬부(321)는 역양자화부(322)의 일부일 수 있다.

역양자화부(322)는 양자화되어 있는 변환 계수들을 (역)양자화 파라미터를 기반으로 역양자화하여 변환 계수를 출력할 수 있다. 이 때, 양자화 파라미터를 유도하기 위한 정보는 인코딩 장치로부터 시그널링될 수 있다.

역변환부(323)는 변환 계수들을 역변환하여 레지듀얼 샘플들을 유도할 수 있다.

예측부(330)는 현재 블록에 대한 예측을 수행하고, 상기 현재 블록에 대한 예측 샘플들을 포함하는 예측된 블록(predicted block)을 생성할 수 있다. 예측부(330)에서 수행되는 예측의 단위는 코딩 블록일 수도 있고, 변환 블록일 수도 있고, 예측 블록일 수도 있다.

예측부(330)는 상기 예측에 관한 정보를 기반으로 인트라 예측을 적용할 것인지 인터 예측을 적용할 것인지를 결정할 수 있다. 이 때, 인트라 예측과 인터 예측 중 어느 것을 적용할 것인지를 결정하는 단위와 예측 샘플을 생성하는 단위는 상이할 수 있다. 아울러, 인터 예측과 인트라 예측에 있어서 예측 샘플을 생성하는 단위 또한 상이할 수 있다. 예를 들어, 인터 예측과 인트라 예측 중 어느 것을 적용할 것인지는 CU 단위로 결정할 수 있다. 또한 예를 들어, 인터 예측에 있어서 PU 단위로 예측 모드를 결정하고 예측 샘플을 생성할 수 있고, 인트라 예측에 있어서 PU 단위로 예측 모드를 결정하고 TU 단위로 예측 샘플을 생성할 수도 있다.

인트라 예측의 경우에, 예측부(330)는 현재 픽처 내의 주변 참조 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(330)는 현재 블록의 주변 참조 샘플을 기반으로 방향성 모드 또는 비방향성 모드를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이 때, 주변 블록의 인트라 예측 모드를 이용하여 현재 블록에 적용할 예측 모드가 결정될 수도 있다.

인터 예측의 경우에, 예측부(330)는 참조 픽처 상에서 움직임 벡터에 의해 참조 픽처 상에서 특정되는 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(330)는 스킵(skip) 모드, 머지(merge) 모드 및 MVP 모드 중 어느 하나를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이때, 비디오 인코딩 장치에서 제공된 현재 블록의 인터 예측에 필요한 움직임 정보, 예컨대 움직임 벡터, 참조 픽처 인덱스 등에 관한 정보는 상기 예측에 관한 정보를 기반으로 획득 또는 유도될 수 있다

스킵 모드와 머지 모드의 경우에, 주변 블록의 움직임 정보가 현재 블록의 움직임 정보로 이용될 수 있다. 이 때, 주변 블록은 공간적 주변 블록과 시간적 주변 블록을 포함할 수 있다.

예측부(330)는 가용한 주변 블록의 움직임 정보로 머지 후보 리스트를 구성하고, 머지 인덱스가 머지 후보 리스트 상에서 지시하는 정보를 현재 블록의 움직임 벡터로 사용할 수 있다. 머지 인덱스는 인코딩 장치로부터 시그널링될 수 있다. 움직임 정보는 움직임 벡터와 참조 픽처를 포함할 수 있다. 스킵 모드와 머지 모드에서 시간적 주변 블록의 움직임 정보가 이용되는 경우에, 참조 픽처 리스트 상의 최상위 픽처가 참조 픽처로서 이용될 수 있다.

스킵 모드의 경우, 머지 모드와 달리 예측 샘플과 원본 샘플 사이의 차이(레지듀얼)이 전송되지 않는다.

MVP 모드의 경우, 주변 블록의 움직임 벡터를 움직임 벡터 예측자(motion vector predictor)로 이용하여 현재 블록의 움직임 벡터가 유도될 수 있다. 이 때, 주변 블록은 공간적 주변 블록과 시간적 주변 블록을 포함할 수 있다.

일 예로, 머지 모드가 적용되는 경우, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터를 이용하여, 머지 후보 리스트가 생성될 수 있다. 머지 모드에서는 머지 후보 리스트에서 선택된 후보 블록의 움직임 벡터가 현재 블록의 움직임 벡터로 사용된다. 상기 예측에 관한 정보는 상기 머지 후보 리스트에 포함된 후보 블록들 중에서 선택된 최적의 움직임 벡터를 갖는 후보 블록을 지시하는 머지 인덱스를 포함할 수 있다. 이 때, 예측부(330)는 상기 머지 인덱스를 이용하여, 현재 블록의 움직임 벡터를 도출할 수 있다.

다른 예로, MVP(Motion Vector Prediction) 모드가 적용되는 경우, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터를 이용하여, 움직임 벡터 예측자 후보 리스트가 생성될 수 있다. 즉, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터는 움직임 벡터 후보로 사용될 수 있다. 상기 예측에 관한 정보는 상기 리스트에 포함된 움직임 벡터 후보 중에서 선택된 최적의 움직임 벡터를 지시하는 예측 움직임 벡터 인덱스를 포함할 수 있다. 이 때, 예측부(330)는 상기 움직임 벡터 인덱스를 이용하여, 움직임 벡터 후보 리스트에 포함된 움직임 벡터 후보 중에서, 현재 블록의 예측 움직임 벡터를 선택할 수 있다. 인코딩 장치의 예측부는 현재 블록의 움직임 벡터와 움직임 벡터 예측자 간의 움직임 벡터 차분(MVD)을 구할 수 있고, 이를 인코딩하여 비트스트림 형태로 출력할 수 있다. 즉, MVD는 현재 블록의 움직임 벡터에서 상기 움직임 벡터 예측자를 뺀 값으로 구해질 수 있다. 이 때, 예측부(330)는 상기 예측에 관한 정보에 포함된 움직임 벡터 차분을 획득하고, 상기 움직임 벡터 차분과 상기 움직임 벡터 예측자의 가산을 통해 현재 블록의 상기 움직임 벡터를 도출할 수 있다. 예측부는 또한 참조 픽처를 지시하는 참조 픽처 인덱스 등을 상기 예측에 관한 정보로부터 획득 또는 유도할 수 있다.

가산부(340)는 레지듀얼 샘플과 예측 샘플을 더하여 현재 블록 혹은 현재 픽처를 복원할 수 있다. 가산부(340)는 레지듀얼 샘플과 예측 샘플을 블록 단위로 더하여 현재 픽처를 복원할 수도 있다. 스킵 모드가 적용된 경우에는 레지듀얼이 전송되지 않으므로, 예측 샘플이 복원 샘플이 될 수 있다. 여기서는 가산부(340)를 별도의 구성으로 설명하였으나, 가산부(340)는 예측부(330)의 일부일 수도 있다. 한편, 가산부(340)는 복원부 또는 복원 블록 생성부로 불릴 수도 있다.

필터부(350)는 복원된 픽처에 디블록킹 필터링 샘플 적응적 오프셋, 및/또는 ALF 등을 적용할 수 있다. 이 때, 샘플 적응적 오프셋은 샘플 단위로 적용될 수 있으며, 디블록킹 필터링 이후 적용될 수도 있다. ALF는 디블록킹 필터링 및/또는 샘플 적응적 오프셋 이후 적용될 수도 있다.

메모리(360)는 복원 픽처(디코딩된 픽처) 또는 디코딩에 필요한 정보를 저장할 수 있다. 여기서 복원 픽처는 상기 필터부(350)에 의하여 필터링 절차가 완료된 복원 픽처일 수 있다. 예컨대, 메모리(360)는 인터 예측에 사용되는 픽처들을 저장할 수 있다. 이 때, 인터 예측에 사용되는 픽처들은 참조 픽처 세트 혹은 참조 픽처 리스트에 의해 지정될 수도 있다. 복원된 픽처는 다른 픽처에 대한 참조 픽처로서 이용될 수 있다. 또한, 메모리(360)는 복원된 픽처를 출력 순서에 따라서 출력할 수도 있다.

도 4는 디코딩 장치에 의하여 수행되는 영상 디코딩 방법의 일 예를 나타낸다. 도 4를 참조하면 상기 영상 디코딩 방법은 엔트로피 디코딩(entropy decoding), 역양자화(inverse quantization), 역변환(inverse transform) 및 인트라/인터 예측 과정을 포함할 수 있다. 예를 들어, 디코딩 장치에서는 상기 인코딩 방법의 역과정이 수행될 수 있다. 구체적으로, 비트스트림에 대한 엔트로피 디코딩을 통하여 양자화된 변환 계수들이 획득될 수 있고, 상기 양자화된 변환 계수들에 대한 역양자화 과정을 통하여 현재 블록의 계수 블록, 즉, 변환 계수들이 획득될 수 있다. 상기 변환 계수들에 대한 역변환을 통하여 상기 현재 블록의 레지듀얼 블록이 도출될 수 있고, 인트라/인터 예측을 통하여 도출된 상기 현재 블록의 예측 블록과 상기 레지듀얼 블록과의 가산을 통하여 상기 현재 블록의 복원 블록(reconstructed block)이 도출될 수 있다.

한편, 후술하는 실시예들에서의 오퍼레이터들은 다음의 표와 같이 정의될 수 있다.

표 1을 참조하면 Floor(x)는 x 이하의 최대 정수값을 나타낼 수 있고, Log2(u)는 u의 2를 밑(base)으로 하는 로그값을 나타낼 수 있고, Ceil(x)는 x 이상의 최소 정수값을 나타낼 수 있다. 예를 들어, Floor(5.93)의 경우, 5.93 이하의 최대 정수값은 5이므로, 5를 나타낼 수 있다.

또한, 표 1을 참조하면 x>>y는 x 를 y 번 우측 쉬프트(right shift)하는 연산자를 나타낼 수 있고, x<<y는 x 를 y 번 좌측 쉬프트(left shift)하는 연산자를 나타낼 수 있다.

<도입>

HEVC 표준은 두가지 타입의 화면 분할 방법을 제안한다.

1) 슬라이스(slice): 한 장의 이미지를 래스터 스캔 오더(raster scan order) 순으로 CTU (coding tree unit) 단위로 분할하여 부호화/복호화 할 수 있는 기능을 제공하며, 슬라이스 헤더(slice header) 정보가 존재한다.

2) 타일(tile): 한 장의 이미지를 CTU 단위로 다수 개의 열(column) 및 행(row)으로 구획하여 부호화/복호화 할 수 있는 기능을 제공한다. 구획 방법은 균등 분할 혹은 개별 분할이 모두 가능하다. 타일을 위한 헤더는 별도로 존재하지 않는다.

슬라이스는 비트스트림(bit-stream) 패킹 단위가 된다. 즉, 하나의 슬라이스는 하나의 NAL (network abstraction layer) 비트 스트림으로 생성될 수 있다. 도 5처럼, 슬라이스를 위한 NAL 패킷(NAL packet)은 NAL 헤더(NAL header), 슬라이스 헤더(slice header), 슬라이스 데이터(slice data) 순으로 구성된다. 이때, NAL header 정보에는 NAL unit type (NUT)이 존재한다.

일 실시 예에 따른 HEVC 표준에서 제안하는 슬라이스를 위한 NUT는 표 2와 같다. 표 2에서, 인터 예측이 수행되는 인터 슬라이스(inter slice)를 위한 NUT는 0번에서 9번까지이고, 인트라 예측이 수행되는 인트라 슬라이스(intra slice)를 위한 NUT는 16번부터 21번까지이다. 여기서, 인터 슬라이스는 화면 간 예측 방법으로 부호화 되었음을 의미하고, 인트라 슬라이스는 화면 내 예측 방법으로 부호화 되었음을 의미한다. 하나의 슬라이스는 하나의 NUT를 가지도록 정의되며, 하나의 picture 내 다수 개의 slice는 모두 동일한 NUT 값을 가지도록 설정될 수 있다. 예를 들어, 하나의 픽처가 4개의 슬라이스로 분할되어, 인트라 예측 방식으로 부호화 되었다면, 해당 픽처 내 4개의 슬라이스에 대한 NUT 값은 모두 동일하게 “19: IDR_W_RADL”로 설정될 수 있다.

상기 표 2에서, 약어는 아래와 같이 정의될 수 있다.

- TSA (Temporal sub-layer Switching Access)

- STSA (Step-wise Temporal sub-layer Switching Access)

- RADL (Random Access Decodable Leading)

- RASL (Random Access Skipped Leading)

- BLA (Broken Link Access)

- IDR (Instantaneous Decoding Refresh)

- CRA (Clean Random Access)

- LP (Leading Picture)

- _N (No reference)

- _R (Reference)

- _W_LP / RADL (With LP / RADL)

- _N_LP (No LP, without LP)

인트라 슬라이스에 대한 NUT 인 BLA, IDR, 및 CRA를 IRAP (Intra Random Access Point)라고 칭한다. IRAP은 비트스트림 중간 위치로 random access가 가능한 픽처를 의미한다. 즉, 비디오 재생 시에 갑작스런 재생 위치 변경이 가능한 픽처를 말한다. 인트라 슬라이스는 I 슬라이스 타입으로만 존재할 수 있다.

인터 슬라이스는 단방향 예측 (P: predictive) 혹은 양방향 예측 (B: bi-predictive)에 따라 P 슬라이스 또는 B 슬라이스로 구분될 수 있다. 예측 및 부호화 과정은 GOP (group of picture) 단위로 수행되는데, HEVC 표준은 계층적(hierarchical) GOP 구조를 사용하여 예측을 포함한 부호화/복호화 과정을 수행한다. 도 6은 계층적 GOP 구조의 일례를 보이며, 각 픽처는 예측 방법에 따라 I, P, 또는 B 픽처 (슬라이스)로 구분된다.

양방향 예측을 수행하는 B 슬라이스 및/또는 계층적 GOP 구조 특성으로 인해, 시퀀스(sequence) 내 픽처들의 디코딩 순서와 디스플레이 순서가 상이해진다 (도 7 참고). 도 7에서 IRAP는 인트라 슬라이스를 의미하고, B 및 P는 인터 슬라이스를 의미하며, 재생 순서와 복원 순서가 완전히 바뀌었음을 확인할 수 있다.

인터 슬라이스 중에서 복원 순서로는 IRAP 보다 늦으면서, 재생 순서는 IRAP 보다 앞서는 픽처를 LP(leading picture) 라 한다 (도 8 참고). LP는 상황에 따라, RADL 및 RASL로 구분된다. 랜덤 엑세스(Random access)가 발생하였을 때, 디코딩이 가능한 LP를 RADL이라 정의하고, 랜덤 엑세스 시에 디코딩이 불가능하여 해당 픽처의 복원 과정을 스킵(skip) 해야 하는 LP를 RASL이라 정의한다. 도 8에서 같은 색상의 픽처들을 하나의 GOP라 정의한다.

RADL과 RASL의 구분은 화면 간 예측 시의 참조 픽처의 위치에 따라 결정된다 (도 9 참고). 즉, RASL는 해당 GOP 외에 다른 GOP 내 복원 픽처를 참조 픽처로 사용하거나, 다른 GOP 내 복원 픽처를 참조 픽처로 사용하여 복원한 픽처를 참조 픽처로 사용하는 인터 픽처를 의미한다. 이런 경우, 다른 GOP 내 복원 픽처를 (직간접적으로) 참조 픽처로 사용한다고 해서 open GOP 라 칭한다. RASL 과 RADL은 해당 인터 슬라이스에 대한 NUT 정보로 설정된다.

인트라 슬라이스에 대한 NUT는 해당 인트라 슬라이스의 재생 순서 및/또는 복원 순서 상 선행 및/또는 후행하는 인터 슬라이스의 NUT에 따라 다른 인트라 슬라이스 NUT로 구분된다. IDR NUT을 살펴보면, IDR은 RADL을 가진 IDR_W_RADL 및 LP를 가지지 않는 IDR_N_LP 로 구분할 수 있다. 즉, IDR은 LP을 가지지 않는 타입 이거나, LP 중 RADL만을 가진 타입으로, IDR은 RASL을 가질 수 없다. 반면, CRA는 LP 중 RADL 및/또는 RASL을 모두 가질 수 있는 타입이다. 즉, CRA는 open GOP를 지원할 수 있는 타입이다.

일반적으로, 인트라 슬라이스는 화면 내 예측 만을 수행함으로 해당 인트라 슬라이스를 위한 참조 픽처 정보가 필요하지 않다. 여기서, 참조 픽처는 화면 간 예측 시에 사용된다. 그러나, CRA NUT 슬라이스는 open GOP 구조를 지원하는 특징으로 인해, CRA 슬라이스는 인트라 슬라이스 임에도 불구하고, 참조 픽처 정보를 해당 CRA의 NAL 비트스트림에 삽입한다. 상기 참조 픽처 정보는 해당 CRA 슬라이스에서 사용하기 위한 게 아닌 (복원 순서 상) 해당 CRA 이후 인터 슬라이스에서 사용 예정인 참조 픽처에 대한 정보이다. 이는, DPB (decoded picture buffer)에서 상기 참조 픽처가 제거되지 않기 위함이다. 예컨대, 해당 인트라 슬라이스의 NUT가 IDR인 경우, DPB를 리셋(reset) 한다. 즉, 해당 시점의 DPB 내 존재하는 모든 복원 픽처를 제거한다. 도 10은 슬라이스 세그먼트 헤더에 대한 신택스를 도시하는 도면이다. 도 10에 도시된 바와 같이, 해당 슬라이스의 NUT가 IDR이 아니면, 참조 픽처 정보를 비트스트림에 기술할 수 있다. 즉, 해당 슬라이스의 NUT가 CRA이면, 참조 픽처 정보를 기술할 수 있다.

본 발명은 다른 시퀀스들과의 합성을 위한 서브 픽처 분할 방법 및 비트스트림 패킹을 위한 슬라이스 분할 방법을 제시한다.

본 발명에서 슬라이스는 부호화/복호화의 영역을 의미하며, 하나의 NAL 비트스트림을 생성하는 데이터 패킹 단위이다. 예컨대, 한 장의 픽처는 다수 개의 슬라이스로 분할되고, 각 슬라이스는 부호화 과정을 거쳐 하나의 NAL 패킷으로 생성된다.

본 발명에서 서브 픽처는 다른 컨텐츠와의 합성을 위한 영역 구분이다. 도 11에서 다른 컨텐츠와의 합성의 예시를 보인다. 흰색, 회색, 및 검정색의 3개의 컨텐츠가 존재하고, 각 컨텐츠의 한 이미지 (AU: access unit)는 4개의 슬라이스로 영역으로 구분되어 패킷 생성이 되며, 도 11의 우측에 위치하는 이미지같이 좌상측 부분은 흰색 컨텐츠로, 좌하측은 회색 컨텐츠로, 우측은 검정색 컨텐츠로 합성하여 새로운 이미지를 생성할 수 있다. 여기서, 흰색 영역 및 회색 영역은 하나의 슬라이스로 하나의 서브 픽처를 구성하고 있고, 검정색 영역은 2개의 슬라이스가 하나의 서브 픽처로 구성될 수 있다. 즉, 하나의 서브 픽처는 최소 1개의 슬라이스를 포함할 수 있다. 새로운 이미지를 만들기 위해 (컨텐츠를 합성하기 위해), BEAMer (Bit-stream Extractor And Merger)은 서브 픽처 단위로 서로 다른 컨텐츠에서 영역을 추출하고 이를 합성한다. 도 11에서 합성된 이미지는 4개의 슬라이스로 분할되고, 3개의 서브 픽처로 구성될 수 있다.

하나의 서브 픽처는 동일한 서브 픽처 ID(sub picture ID) 및/또는 서브 픽처 인덱스(sub picture index) 값을 가진 영역을 의미한다. 다시 말해, 동일한 서브 픽처 ID 및/또는 서브 픽처 인덱스 값을 가진 최소 1개의 슬라이스를 하나의 서브 픽처 영역이라 할 수 있다. 여기서, 슬라이스 헤더 정보 중 서브 픽처 ID 및/또는 서브 픽처 인덱스 값이 포함된다. 서브 픽처 인덱스 값은 래스터 스캔(raster-scan) 순서로 설정될 수 있다. 도 12는 한 장의 픽처가 6개의 (사각형) 슬라이스 및 4개의 (색상 별) 서브 픽처 영역으로 구성된 예를 보인다. 여기서, “A”, “B”, “C”, “D”는 서브 픽처 ID에 대한 일례를 나타내고, “0”, “1”은 해당 서브 픽처 내 슬라이스 주소(slice address)를 나타낸다. 즉, 슬라이스 주소 값은 해당 서브 픽처 내 래스터 스캔 순서 상 슬라이스 인덱스 값이다. 예컨대, “B-0”은 B 서브 픽처 내 0번째 슬라이스를 의미하고, “B-1”은 B 서브 픽처 내 1번째 슬라이스를 나타낸다.

본 발명에서는 하나의 이미지를 구성하는 2개 이상의 서브 픽처에 대한 NUT 값이 상이할 수 있다. 예컨대, 도 12에서 한 장의 이미지 내 흰색 서브 픽처 (슬라이스)는 인트라 슬라이스 일 수 있고, 회색 서브 픽처 (슬라이스) 및 검정색 서브 픽처 (슬라이스)는 인터 슬라이스 일 수 있다.

이는, 서로 다른 컨텐츠 합성 시에 한 장의 이미지를 구성하는 다수 개의 서브 픽처의 NUT를 동일하게 맞출 필요가 없기 때문에 용이하게 이미지를 구성/합성할 수 있는 장점을 가진다. 해당 기능을 단일 픽처에서의 혼성 NAL 유닛 타입 픽처(mixed NAL Unit Type in a picture)이라 칭하고, 간략히 혼성 NUT(mixed NUT)라고 명명할 수도 있다. mixed_nalu_type_in_pic_flag를 두어 해당 기능의 인에이블(enabled)/디스에이블(disabled)을 설정할 수 있다. 해당 플래그는 SPS (sequence parameter set), PPS (picture parameter set), PH (picture header), SH (slice header) 중 하나 이상의 위치에서 정의될 수 있다. 예를들어, 해당 플래그가 PPS에서 정의되는 경우 해당 플래그는 pps_mixed_nalu_types_in_pic_flag로 명명될 수 있다.

상기 플래그 값이 디스에이블(disabled) 인 경우 (e.g. mixed_nalu_type_in_pic_flag == 0), 해당 픽처 내 모든 서브 픽처 및/또는 슬라이스에 대한 NUT가 동일한 값을 가질 수 있다. 예를들어, 하나의 픽처에 대한 모든 VCL (video coding layer) NAL 유닛에 대한 NUT는 동일한 값을 가지도록 설정될 수 있다. 그리고, 픽처 또는 픽처 유닛(PU, picture unit)은 그에 대한 부호화된 슬라이스 NAL 유닛과 동일한 NUT를 가지는 것으로 참조될 수 있다. 여기서, VCL은 슬라이스 데이터 값을 포함한 슬라이스에 대한 NAL 타입을 의미한다.

한편, 상기 플래그 값이 인에이블(enabled) 인 경우 (e.g. mixed_nalu_type_in_pic_flag == 1), 해당 픽처는 2개 이상의 서브 픽처로 구성될 수 있다. 그리고, 상기 해당 픽쳐는 다른 NUT 값을 가질 수 있다. 또한, 상기 플래그 값이 인에이블(enabled) 인 경우, 상기 해당 픽처의 VCL NAL 유닛은 GDR_NUT 타입의 NUT를 가질 수 없도록 제한될 수 있다. 그리고, 해당 픽처의 어느 하나의 VCL NAL 유닛(e.g. 제 1 NAL 유닛)의 NUT(e.g. 제 1 NUT)가 IDR_W_RADL, IDR_N_LP, 또는 CRA_NUT 중 어느 하나인 경우, 상기 해당 픽처의 다른 VCL NAL 유닛(e.g. 제 2 NAL 유닛)의 NUT(e.g. 제 2 NUT)는 IDR_W_RADL, IDR_N_LP, CRA_NUT, 또는 TRAIL_NUT 중 어느 하나로 설정되도록 제한될 수 있다. 예들들어 제 2 NUT는 제 1 NUT 또는 TRAIL_NUT 중 하나의 값으로 설정되도록 제한될 수 있다.

도 12과 도 13을 참조하여, 상기 해당 픽쳐의 VCL NAL 유닛들이 적어도 두개 이상의 서로 다른 NUT 값을 가지는 예를 설명한다. 일 실시 예에서, 2개 이상의 서브 픽처는 2개 이상의 서로 다른 NUT 값을 가질 수 있다. 이때, 하나의 서브 픽처에 포함된 모든 슬라이스에 대한 NUT 값은 동일하도록 제한될 수 있다. 예를들어, 도 13에 도시된 바와 같이, 도 12의 B 서브 픽처 내 2개의 슬라이스에 대한 NUT 값은 CRA로 동일하게 설정될 수 있고, C sub picture 내 2개의 슬라이스에 대한 NUT 값도 TRAIL로 동일하게 설정될 수 있으며, A, B, C, 및 D 서브 픽처들은 적어도 2개 이상의 서로 다른 NUT 값을 가지도록 설정될 수 있다. 이에따라, 도 13에 도시된 바와 같이 A, C 및 D 서브 픽처 내 슬라이스에 대한 NUT 값은 TRAIL로 B 서브 픽처의 NUT인 CRA 와는 상이한 NUT 값을 가지도록 설정될 수 있다.

본 발명에서 인트라 슬라이스 및 인터 슬라이스에 대한 NUT는 표 3과 같이 명세될 수 있다. 표 3의 실시 예와 같이, RADL, RASL, IDR, CRA 등에 대한 정의 및 기능은 HEVC 표준 (표 1)과 동일하게 설정될 수도 있다. 표 3의 경우, 혼성 NUT 타입이 추가되어 있다. 표 3에서, mixed_nalu_type_in_pic_flag의 디스에이블값(e.g. 0)은, (HEVC와 동일하게) 픽처 내 슬라이스에 대한 NUT를 나타내고, mixed_nalu_type_in_pic_flag의 인에이블값(e.g. 1)은, 서브 픽처 내 슬라이스에 대한 NUT를 나타낼 수 있다. 예를들어, mixed_nalu_type_in_pic_flag의 값이 0이고 VCL NAL 유닛의 NUT가 TRAIL_NUT인 경우, 현재 픽처의 NUT는 TRAIL_NUT인 것으로 식별될 수 있으며 현재 픽처에 속한 다른 서브 픽처의 NUT 또한 TRAIL_NUT인 것으로 유도될 수 있다. 그리고, mixed_nalu_type_in_pic_flag의 값이 1이고 VCL NAL 유닛의 NUT가 TRAIL_NUT인 경우, 현재 서브 픽처의 NUT는 TRAIL_NUT인 것으로 식별될 수 있으며, 현재 픽처에 속한 다른 서브 픽처 중 적어도 하나의 NUT는 TRAIL_NUT가 아닐 것으로 예측될 수 있다.

전술한 바와 같이, mixed_nalu_type_in_pic_flag의 값이 인에이블을 나타내는 경우(e.g. 1), 하나의 픽처에 속한 어느 하나의 VCL NAL 유닛(e.g. 제 1 NAL 유닛)이 NUT(e.g. 제 1 NUT)로 IDR_W_RADL, IDR_N_LP, 또는 CRA_NUT 중 어느 하나의 값을 가지면, 상기 해당 픽처의 다른 VCL NAL 유닛 중 적어도 하나의 VCL NAL 유닛(e.g. 제 2 NAL 유닛)은 NUT(e.g. 제 2 NUT)로 IDR_W_RADL, IDR_N_LP, CRA_NUT, 또는 TRAIL_NUT 중 제 1 NUT가 아닌 어느 하나의 NUT 값을 가질 수 있다.

이와 같이, 하나의 픽처에 속한 제 1 서브 픽처에 대한 VCL NAL 유닛(e.g. 제 1 NAL 유닛)이 NUT(e.g. 제 1 NUT)로 IDR_W_RADL, IDR_N_LP, 또는 CRA_NUT 중 어느 하나의 값을 가지면, 상기 해당 픽처의 제 2 서브 픽처에 대한 VCL NAL 유닛(e.g. 제 2 NAL 유닛)은 NUT(e.g. 제 2 NUT)로 IDR_W_RADL, IDR_N_LP, CRA_NUT, 또는 TRAIL_NUT 중 제 1 NUT가 아닌 어느 하나의 NUT 값을 가질 수 있다.

예를 들어, mixed_nalu_type_in_pic_flag의 값이 활성화를 나타내는 경우(e.g. 1), 2개 이상의 서브 픽처에 대한 VCL NAL 유닛의 NUT 값은 아래와 같이 구성될 수 있다. 이하의 설명은 예시일 뿐이며 이에 제한되지 않는다.

조합 1) IRAP + non-IRAP (inter)

조합 2) non_IRAP (inter) + non-IRAP (inter)

조합 3) IRAP + IRAP = IDR + CRA(실시 예에 따라 제한됨)

조합 1)은, 픽처 내 최소 1개의 서브 픽처가 IRAP (IDR 또는 CRA) NUT 값을 가지면서, 다른 최소 1개의 서브 픽처가 non-IRAP (인터 슬라이스) NUT 값을 가지는 실시예이다. 여기서, 인터 슬라이스 NUT 값으로는 LP (RASL 및 RADL)을 제외한 값이 허용될 수 있다. 예를들어, 인터 슬라이스 NUT 값으로 LP (RASL 또는 RADL)는 허용되지 않을 수 있다. 이와 같이, IDR 또는 CRA 서브픽처와 연관된 비트스트림에는 RASL 및 RADL 서브픽처가 부호화되지 않도록 제한될 수 있다.

다른 일 실시 예에서, 인터 슬라이스 NUT 값으로 TRAIL 값만 허용될 수 있다. 또는 다른 일 실시 예에서, 인터 슬라이스 NUT 값으로 모든 인터 슬라이스 VCL NUT가 허용될 수 있다.

조합 2)는, 픽처 내 최소 1개의 서브 픽처가 non-IRAP (인터 슬라이스) NUT 값을 가지면서, 다른 최소 1개의 서브 픽처가 다른 non-IRAP (인터 슬라이스) NUT 값을 가지는 실시예이다. 예컨대, 적어도 1개의 서브 픽처가 RASL NUT 값을 가지면서 다른 적어도 1개의 서브 픽처는 RADL NUT 값을 가질 수 있다. 조합 2에 따른 실시 예의 경우, 실시예에 따라 아래와 같은 제한이 적용될 수 있다.

- 일 실시예에서는, LP (RASL 및 RADL) 와 non-LP (TRAIL)가 함께 사용될 수 없다. 예컨대, 최소 1개의 서브 픽처의 NUT가 RASL (혹은, RADL) 이면서, 다른 최소 1개의 서브 픽처의 NUT가 TRAIL 일 수 없다. 최소 1개의 서브 픽처의 NUT가 RASL (혹은, RADL) 인 경우, 다른 최소 1개의 서브 픽처의 NUT로 RASL 또는 RADL는 사용될 수 있다. 예를들어, IRAP 서브픽처의 리딩 서브픽처는 RADL 또는 RASL 서브픽처로 강제될 수 있다.

- 다른 일 실시예에서는, LP (RASL 및 RADL) 와 non-LP (TRAIL)가 함께 사용될 수 있다. 예컨대, 최소 1개의 서브 픽처가 RASL (혹은, RADL) 이면서, 다른 최소 1개의 서브 픽처가 TRAIL 일 수 있다.

- 다른 일 실시예에서는, 예외적으로 조건 2)의 경우, 모든 서브 픽처가 동일한 인터 슬라이스 NUT 값을 가질 수 있다. 예컨대, 픽처 내 모든 서브 픽처가 TRAIL NUT 값을 가질 수 있다. 다른 예시로, 픽처 내 모든 서브 픽처가 RASL (혹은, RADL) NUT 값을 가질 수 있다.

조합 3)은, 픽처 내 모든 서브 픽처 또는 슬라이스가 IRAP으로 구성되는 실시예를 나타낸다. 예를들어, 제 1 서브 픽처 내 슬라이스에 대한 NUT 값이 IDR_W_RADL, IDR_N_LP, 또는 CRA_NUT인 경우, 제 2 서브 픽처 내 슬라이스에 대한 NUT 값은 IDR_W_RADL, IDR_N_LP, 및 CRA_NUT 중 제 1 서브픽처의 NUT가 아닌 값으로 구성될 수 있다. 예를들어, 최소 1개 서브 픽처 내 슬라이스에 대한 NUT 값이 IDR이면서, 다른 최소 1개 서브 픽처 내 슬라이스에 대한 NUT 값이 CRA로 구성될 수 있다.

한편, 실시 예에 따라, 조합 3과 같은 실시예의 적용은 제한될 수 있다. 일 실시 예에서, IRAP 또는 GDR 엑세스 유닛에 속한 픽쳐들은 모두 동일한 NUT를 가지도록 제한될 수 있다. 즉, 현재 엑세스 유닛이 IRAP 픽처로만 구성되는 IRAP 엑세스 유닛이거나, 현재 엑세스 유닛이 GDR 픽처로만 구성되는 GDR 엑세스 유닛인 경우, 그에 속한 픽처들은 모두 동일한 NUT를 가지도록 제한될 수 있다. 예를들어, 최소 1개 서브 픽처 내 슬라이스에 대한 NUT 값이 IDR이면서, 다른 최소 1개 서브 픽처 내 슬라이스에 대한 NUT 값이 CRA로 구성되지 못하게 제한될 수 있다. 이와 같이, 조합 3)이 제한되고, 앞선 조합 1) 및 조합 2가 적용되는 경우, 해당 픽처 내 최소 1개의 서브 픽처는 non-IRAP (인터 슬라이스)에 대한 NUT 값을 가지도록 제한될 수 있다. 예를들어, 부호화 및 복호화 과정에서 해당 픽처 내 모든 서브 픽처가 IDR에 대한 NUT 값을 가질 수 없도록 제한될 수 있다. 또는, 해당 픽처 내 일부 서브 픽처가 IDR에 대한 NUT 값을 가지고 다른 서브 픽처가 CRA NUT 값을 가지지 않도록 제한될 수 있다.

이하, 픽처 내 혼성 NUT(mixed NAL unit type)가 적용되는 경우에 있어서의 부호화 정보의 시그널링을 위한 관련 신택스(syntax) 및 시맨틱스(semantics)에 대해 설명한다. 그리고 이를 이용한 복호화 과정을 설명한다. 전술한 바와 같이, mixed_nalu_type_in_pic_flag = 1 인 경우, NUT가 서술하는 픽처는 서브 픽처를 의미할 수 있다 (표 3 참고).

한편, 상기와 같이, mixed_nalu_type_in_pic_flag의 값이 혼성 NUT가 적용됨을 나타내는 경우, 하나의 픽처는 적어도 2개의 서브 픽처로 분할될 수 있다. 이에 따라, 해당 픽처에 대한 서브 픽처의 정보가 비트스트림을 통해 시그널링될 수 있다. 이러한 점에서, mixed_nalu_type_in_pic_flag는 현재 픽처가 분할되는지 여부를 나타낼 수 있다. 예를들어, mixed_nalu_type_in_pic_flag의 값이 혼성 NUT가 적용됨을 나타내는 경우, 현재 픽처는 분할됨을 나타낼 수 있다.

이하 도 14의 신택스를 참조하여 설명한다. 도 14는 픽처 파라미터 셋(PPS)의 신택스에 대한 일 실시 예를 도시하는 도면이다. 예를들어, 비트스트림을 통해 현재 픽처가 분할되지 않는지 여부를 나타내는 플래그(e.g. pps_no_pic_partition_flag)가 픽처 파라미터 셋(PPS)을 통해 시그널링될 수 있다. pps_no_pic_partition_flag의 인에이블을 나타내는 값(e.g. 1)은 현재 PPS를 참조하는 픽처들에 대하여 픽처의 분할이 적용되지 않음을 나타낼 수 있다. pps_no_pic_partition_flag의 디스에이블을 나타내는 값(e.g. 0)은 현재 PPS를 참조하는 픽처들에 대하여 슬라이스 또는 타일을 이용한 픽처의 분할이 적용될 수 있음을 나타낼 수 있다. 이러한 실시 예에서, mixed_nalu_type_in_pic_flag의 값이 혼성 NUT가 적용됨을 나타내는 경우, pps_no_pic_partition_flag의 값은 디스에이블을 나타내는 값(e.g. 0)으로 강제될 수 있다.

pps_no_pic_partition_flag가 현재 픽처가 분할될 수 있음을 나타내는 경우, 비트스트림으로부터 서브 픽처의 개수 정보(e.g. pps_num_subpics_minus1)가 획득될 수 있다. pps_num_subpics_minus1은 현재 픽처에 포함된 서브 픽처의 개수에서 1을 감한 값을 나타낼 수 있다. pps_no_pic_partition_flag가 현재 픽처가 분할되지 않음을 나타내는 경우, pps_num_subpics_minus1의 값은 비트스트림으로부터 획득되지 않고 0으로 유도될 수 있다. 이와 같이 결정된 서브픽처의 개수 정보에 따라, 하나의 픽처에 포함된 서브 픽처의 개수만큼 각 서브 픽처에 대한 부호화 정보가 시그널링될 수 있다. 예를들어, 각 서브 픽처를 식별하기 위한 서브 픽처 식별자(e.g. pps_subpic_id) 및/또는 각 서브 픽처의 부호화/복호화 과정의 독립 여부를 알리는 플래그 (subpic_treated_as_pic_flag[ i ])값이 지정되어 시그널링될 수 있다.

혼성 NUT는 하나의 픽처가 2개 이상의 서브 픽처로 구성되었을 때 적용될 수 있다. 이때, 하나의 픽처에 포함된 서브 픽처의 개수 ( i )만큼 각 서브 픽처의 부호화/복호화 과정의 독립 여부를 알리는 플래그 (subpic_treated_as_pic_flag[ i ])값이 지정되어 시그널링될 수 있다. 하나의 서브 픽처가 독립적으로 복호화 되었다는 것은 해당 서브 픽처를 별개의 픽처로 취급하여 복호화를 수행했음을 나타낸다. 즉, 해당 플래그 값이 “on” 인 경우 (e.g. subpic_treated_as_pic_flag = 1), 해당 서브 픽처는 인 루프 필터(in-loop filter) 과정을 제외한 다른 모든 복호화 과정에서 다른 서브 픽처와 독립적으로 복호화 될 수 있다. 반대로, 해당 플래그 값이 “off” 인 경우 (e.g. subpic_treated_as_pic_flag = 0), 해당 서브 픽처는 인터 예측 과정에서 픽처 내 다른 서브 픽처를 참조할 수 있다. 여기서, 인 루프 필터 과정에 대해서는 별도의 플래그를 두어 독립 또는 참조 여부를 제어할 수 있다. 해당 플래그 (subpic_treated_as_pic_flag)는 SPS, PPS, 및 PH 중 하나 이상의 위치에서 정의될 수 있다. 예를들어, 해당 플래그가 SPS에서 정의되는 경우, 해당 플래그는 sps_subpic_treated_as_pic_flag로 명명될 수 있다.

또한, 본 발명에서 하나의 픽처 내 다른 NUT가 존재하는 경우 (e.g. mixed_nalu_type_in_pic_flag = 1), 하나의 픽처 내에서 서브 픽처간 이종의 NUT가 사용되어야 하는 특성으로 인해, 상기 픽처 내의 각 서브 픽처는 독립적으로 부호화/복호화 되어야 할 수 있다. 예를 들어, mixed_nalu_type_in_pic_flag = 1인 픽처의 경우, 해당 픽처 내에 하나 이상의 인터 (P 혹은 B) 슬라이스가 포함되면, 해당 픽터 내 모든 서브 픽처의 subpic_treated_as_pic_flag 값은 “1”로 설정되거나 “1” 값으로 유도되는 것이 강제될 수 있다. 혹은, mixed_nalu_type_in_pic_flag = 1인 경우, subpic_treated_as_pic_flag은 “0” 값을 가질 수 없도록 강제될 수 있다. 예를 들어, mixed_nalu_type_in_pic_flag = 1인 픽처의 경우, 해당 픽처 내 하나 이상의 인터 슬라이스가 포함되면, 해당 픽처에 대한 모든 서브픽처에 대하여, 파싱된 값에 무관하게 subpic_treated_as_pic_flag 값이 “1”로 재설정될 수 있다. 반대로, mixed_nalu_type_in_pic_flag = 1 이면서 subpic_treated_as_pic_flag = 0인 픽처의 경우, 해당 픽처 내에 인터 슬라이스가 포함되면 안된다. 즉, mixed_nalu_type_in_pic_flag = 1 이면서 subpic_treated_as_pic_flag = 0인 픽처의 경우, 해당 픽처 내 슬라이스 타입은 인트라이어야 한다.

또한, 다른 실시예에서는 mixed_nalu_type_in_pic_flag = 1 인 경우, 현재 픽처의 NUT가 RASL이면, 현재 픽처에 대한 subpic_treated_as_pic_flag은 “1”로 설정되도록 강제될 수 있다. 다른 예시로, mixed_nalu_type_in_pic_flag = 1 인 경우, 현재 픽처의 NUT가 RADL이면서 참조하는 픽처의 NUT가 RASL이면, 현재 픽처에 대한 subpic_treated_as_pic_flag은 “1”로 강제될 수 있다.

혼성 NUT 기능은 하나의 픽처 내 모든 서브 픽처 (또는, 슬라이스)가 IRAP 로 구성됨을 제한할 수 있다. 이때, 하나의 픽처 내 모든 슬라이스가 IRAP로 구성되거나, 해당 픽처가 GDR (Gradual Decoding Refresh) 픽처임을 나타내는 플래그 (gdr_or_irap_pic_flag) 값은 “0”으로 강제될 수 있다. 즉, 본 발명에서 하나의 픽처 내 다른 NUT가 존재하는 경우(mixed_nalu_type_in_pic_flag = 1), 상기 플래그 (gdr_or_irap_pic_flag) 값은 “0”으로 설정되거나, “0”값으로 유도될 수 있다. 또는, mixed_nalu_type_in_pic_flag = 1인 경우, gdr_or_irap_pic_flag 는 “1” 값을 가질 수 없도록 강제될 수 있다. 상기 플래그 (gdr_or_irap_pic_flag)는 SPS, PPS, 및 PH 중 하나 이상의 위치에서 정의될 수 있다.

또한, 혼성 NUT 기능이 적용됨에 따라 하나의 픽처 내 최소 1개의 서브 픽처가 IRAP (IDR 또는 CRA) NUT 값을 가지면서, 다른 최소 1개의 서브 픽처가 non-IRAP (inter slice) NUT 값을 가질 수 있다. 즉, 하나의 픽처 내에서 인트라 슬라이스와 인터 슬라이스가 동시에 존재할 수 있다. 기존 HEVC 표준의 경우, 해당 인트라 슬라이스의 NUT가 IDR인 경우, DPB를 리셋하였다. 이에 따라, 해당 시점의 DPB 내 존재하는 모든 복원 픽처가 제거되었다.

그러나 본 발명에 따를 경우, mixed_nalu_type_in_pic_flag = 1인 경우, 하나의 픽처 내 인트라 슬라이스와 인터 슬라이스가 동시에 존재 가능하므로, 하나의 픽처가 IDR NUT이라 해도 DPB을 리셋할 수 없는 경우가 존재한다. 이에 따라, 일 실시 예에서는, 해당 슬라이스가 IDR NUT 인 경우, CRA 처럼 참조 픽처 정보 (RPL: reference picture list)를 해당 IDR의 슬라이스 헤더 정보로 NAL 비트스트림에 삽입할 수 있다. 이를 위해, IDR NUT 임에도 불구하고, RPL 정보가 존재함을 알리는 플래그 (idr_rpl_present_flag) 값이 “1”로 설정될 수 있다. 상기 플래그 (idr_rpl_present_flag) 값이 “1”인 경우, IDR의 슬라이스 헤더 정보로 RPL이 존재한다. 반대로, 상기 플래그 (idr_rpl_present_flag) 값이 “0”인 경우, IDR의 슬라이스 헤더 정보로 RPL이 존재하지 않는다.

한편, 본 발명에서 하나의 픽처 내 다른 NUT이 존재하면서(mixed_nalu_type_in_pic_flag = 1), IDR 픽처의 RPL 정보를 허용하지 않는 경우 (idr_rpl_present_flag = 0), 해당 픽처에 대한 NUT은 IDR_W_RADL 또는 IDR_N_LP 값을 가질 수 없다.

상기 플래그 (idr_rpl_present_flag)는 SPS, PPS, 및 PH 중 하나 이상의 위치에서 정의될 수 있다. 예를 들어, 상기 플래그가 SPS 에서 정의되는 경우, 상기 플래그는 sps_idr_rpl_present_flag로 명명될 수 있다. 예를 들어, 현재 슬라이스의 NUT가 IDR_W_RADL 또는 IDR_N_RADL이더라도, sps_idr_rpl_present_flag의 값에 따라 RPL을 시그널링하기 위하여, 도 15의 슬라이스 헤더의 신택스를 이용하여 슬라이스 헤더 정보가 시그널링될 수 있다. 여기서, sps_idr_rpl_present_flag의 제 1 값(e.g. 0)은 NUT가 IDR_N_LP 또는 IDR_W_RADL인 슬라이스의 슬라이스 헤더에 의하여 RPL 신택스 요소가 제공되지 않음을 나타낼 수 있다. sps_idr_rpl_present_flag의 제 2 값(e.g. 1)은 NUT가 IDR_N_LP 또는 IDR_W_RADL인 슬라이스의 슬라이스 헤더에 의하여 RPL 신택스 요소가 제공될 수 있음을 나타낼 수 있다.

한편, 다른 일 실시 예에서, mixed_nalu_type_in_pic_flag = 1인 경우, RPL이 픽처 헤더 정보로 시그널링될 수 있다. 예를 들어, 도 14에서의 신택스의 적용에 있어서, mixed_nalu_type_in_pic_flag의 값이 혼성 NUT가 적용됨을 나타내는 경우, pps_no_pic_partition_flag의 값은 디스에이블을 나타내는 값(e.g. 0)으로 강제될 수 있다. 그리고 이에 따라 RPL 정보가 픽처 헤더에서 제공되는지 여부를 나타내는 플래그(pps_rpl_info_in_ph_flag)의 값이 비트스트림으로부터 획득될 수 있다. pps_rpl_info_in_ph_flag가 인에이블(e.g. 1)을 나타내면, RPL 정보는 도 16 및 도 17에 도시된 바와 같이 픽처 헤더에서 획득될 수 있다. 이와 같이, mixed_nalu_type_in_pic_flag의 값에 기반하여 해당 픽처의 타입에 무관하게 RPL 정보가 획득될 수 있다. 반면, pps_rpl_info_in_ph_flag가 디스에이블(e.g. 0)을 나타내면, 픽처 헤더에서 RPL 정보를 획득할 수 없다. 예컨대, pps_rpl_info_in_ph_flag 값이 “0”이면서, 슬라이스 NUT가 IDR_N_LP 또는 IDR_W_RADL이고 sps_idr_rpl_present_flag의 값이 “0”이면, 해당 슬라이스의 RPL 정보는 획득될 수 없다. 즉, 해당 슬라이스의 RPL 정보는 없으므로, RPL 정보는 초기화되어 비어 있는(empty) 것으로 유도될 수 있다.

전술한 설명과 같이 하나의 픽처는 이종의 NAL 유닛으로 시그널링될 수 있다. 이와 같이 하나의 픽처를 시그널링 하기 위하여 서로 다른 NUT를 가진 NAL 유닛이 사용될 수 있는 점에서, NAL 유닛의 타입에 따라 픽처의 타입을 결정하기 위한 방법이 요구된다. 이에 따라 랜덤 액세스(RA : Random Access)시, 해당 픽처가 정상적으로 복원되어 출력 (output) 가능한지 여부가 결정될 수 있다.

일 실시 예에 따른 디코딩 과정에서, 하나의 픽처에 대응되는 각각의 VCL NAL 유닛이 CRA_NUT 타입의 NAL 유닛인 경우, 해당 픽처는 CRA픽처로 결정될 수 있다. 그리고, 하나의 픽처에 대응되는 각각의 VCL NAL 유닛이 IDR_W_RADL이거나, IDR_N_LP 타입의 NAL 유닛인 경우, 해당 픽처는 IDR픽처로 결정될 수 있다. 그리고, 하나의 픽처에 대응되는 각각의 VCL NAL 유닛이 IDR_W_RADL, IDR_N_LP 또는 CRA_NUT 타입의 NAL 유닛인 경우, 해당 픽처는 IRAP픽처로 결정될 수 있다.

또한, 하나의 픽처에 대응되는 각각의 VCL NAL 유닛이 RADL_NUT 타입의 NAL 유닛인 경우, 해당 픽처는 RADL(Random Access decodable leading) 픽처로 결정될 수 있다. 그리고, 하나의 픽처에 대응되는 각각의 VCL NAL 유닛이 TRAIL_NUT 타입의 NAL 유닛인 경우, 해당 픽처는 트레일링(trailing) 픽처로 결정될 수 있다. 그리고, 하나의 픽처에 대응되는 VCL NAL 유닛 중에서 적어도 하나의 VCL NAL 유닛의 타입이 RASL_NUT 타입이고 다른 모든 VCL NAL 유닛의 타입이 RASL_NUT 타입이거나 RADL_NUT 타입인 경우, 상기 해당 픽처는 RASL(random access skipped leading) 픽처로 결정될 수 있다.

한편, 다른 일 실시 예에 따른 디코딩 과정에서, 하나의 픽처 내 최소 1개의 서브 픽처가 RASL이면서 다른 최소 1개의 서브 픽처가 RADL 인 경우, 해당 픽처는 RASL 픽처로 결정될 수 있다. 예를들어, 하나의 픽처 내 최소 1개의 서브 픽처가 RASL이면서 다른 최소 1개의 서브 픽처가 RADL 인 경우, 디코딩 과정 중 해당 픽처는 RASL 픽처로 설정될 수 있다. 여기서, 서브 픽처에 대응되는 VCL NAL 유닛의 타입이 RASL_NUT이면, 해당 서브 픽처는 RASL로 결정될 수 있다. 이에 따라, RA 시 RASL 서브 픽처 및 RADL 서브 픽처는 모두 RASL 픽처로 취급될 수 있고, 이에 따라 해당 픽처는 출력되지 않을 수 있다.

한편, 다른 일 실시 예에 따른 디코딩 과정에서, 하나의 픽처 내 최소 1개의 서브 픽처가 RASL이면, 해당 픽처는 RASL 픽처로 설정될 수 있다. 예를들어, 하나의 픽처 내 최소 1개의 서브 픽처가 RASL이면서 다른 최소 1개의 서브 픽처가 TRAIL 인 경우, 디코딩 과정 중 해당 픽처는 RASL 픽처로 설정될 수 있다. 이에 따라, RA 시 해당 픽처는 RASL 픽처로 취급될 수 있고, 해당 픽처는 출력되지 않을 수 있다.

여기서, RA 발생은 해당 인터 슬라이스 (RADL, RASL, 또는 TRAIL) 와 연결된 (관련된) IRAP 픽처의 NoOutputBeforeRecoveryFlag 값으로 판단할 수 있다. 해당 플래그 값이 “1”인 경우 (NoOutputBeforeRecoveryFlag = 1), RA 발생을 의미하며, 해당 플래그 값이 “0”인 경우 (NoOutputBeforeRecoveryFlag = 0), 일반적인 재생을 의미한다. 해당 플래그 값은 IRAP에 대해 다음과 같이 설정될 수 있다.

- 현재 픽처가 IRAP 일 때, NoOutputBeforeRecoveryFlag 값 설정 과정

① 픽처가 비트스트림의 첫번째 픽처이면, NoOutputBeforeRecoveryFlag을 “1”로 설정

② 픽처가 IDR 이면, NoOutputBeforeRecoveryFlag을 “1”로 설정

③ 픽처가 CRA 이면서 외부에서 RA를 알리면, NoOutputBeforeRecoveryFlag을 “1”로 설정

④ 픽처가 CRA 이면서 외부에서 RA를 알리지 않으면, NoOutputBeforeRecoveryFlag을 “0”로 설정

일 실시 예에서, 복호화 장치는 외부 단말로부터 랜덤 액세스 발생을 시그널링 받을 수 있다. 예를들어, 외부 단말은 랜덤 액세스 발생 정보의 값을 1로 설정하여 복호화 장치로 시그널링 함으로써 랜덤 액세스 발생을 복호화 장치로 시그널링할 수 있다. 복호화 장치는 외부 단말로부터 랜덤 액세스 발생을 수신하였는지를 나타내는 플래그 HandleCraAsClvsStartFlag의 값을 외부 단말로 부터 수신한 랜덤 액세스 발생 정보에 따라 1로 설정될 수 있다. 복호화 장치는 HandleCraAsClvsStartFlag의 값과 동일한 값으로 NoOutputBeforeRecoveryFlag의 값을 설정할 수 있다. 이에 따라, 복호화 장치는 현재 픽처가 CRA 픽처이면서 HandleCraAsClvsStartFlag의 값이 “1”인 경우, 해당 CRA 픽처에 대하여 랜덤 액세스가 발생하였음을 결정하거나, 해당 CRA가 비트스트림 맨 처음에 위치한 것으로 취급하여 복호화를 수행할 수 있다.

RA 시, 현재 픽처가 출력될지 말지를 결정하는 플래그 (PictureOutputFlag)를 설정하는 과정은 다음과 같다. 예를들어, 현재 픽처에 대한 PictureOutputFlag는 아래의 순서에 따라 설정될 수 있다. 여기서, PictureOutputFlag의 제 1 값(e.g. 0)은 현재 픽처가 출력되지 않음을 나타낼 수 있다. PictureOutputFlag의 제 2 값(e.g. 1)은 현재 픽처가 출력됨을 나타낼 수 있다.

(1) 현재 픽처가 RASL이면서, 연관된 IRAP 픽처의 NoOutputBeforeRecoveryFlag가 “1”이면, PictureOutputFlag을 “0”으로 설정

(2) 현재 픽처가 NoOutputBeforeRecoveryFlag의 값이 “1”인 GDR 픽처이거나, 그의 복원 픽처인 경우 PictureOutputFlag는 “0”으로 설정

(3) 그 외 (otherwise), 비트스트림 내의 pic_output_flag 값과 동일한 값으로 PictureOutputFlag의 값을 설정. 여기서, pic_output_flag 은 PH 및 SH의 하나 이상의 위치에서 획득될 수 있다.

도 18은 본 발명에서 제시한 서로 다른 3개의 컨텐츠의 합성에 대한 예시를 보인다. 도 18-(a)는 서로 다른 3개의 컨텐츠에 대한 sequences를 나타내며, 편의 상 하나의 픽처를 하나의 packet으로 보였으나, 하나의 픽처는 다수 개의 슬라이스로 분할되어 다수 개의 packet이 존재할 수 있다. 도 18-(b) 및 도 18-(c)는 도 18-(a)에서 점선으로 표시한 픽처에 대한 합성된 이미지 결과를 보인다. 도 18에서 동일한 색상은 동일한 픽처/서브 픽처/슬라이스를 의미한다. 또한, P 슬라이스 및 B 슬라이스는 인터 NUT 중에 하나의 값을 가질 수 있다.

상기와 같이, 본 발명을 통해 다수 개의 컨텐츠를 합성할 때에, 반드시 인트라 슬라이스 (픽처) 위치를 동일하게 맞출 필요 없이, 단순하게 계층적 GOP 구조를 맞춰 줌으로써, 딜레이 없이 빠르고 용이하게 컨텐츠를 합성할 수 있다.

부호화 및 복호화 실시예

이하, 전술한 방법에 따라 영상 복호화 장치가 영상을 복호화하는 방법을 설명한다. 도 19과 도 20은 본 발명의 일 실시 예에 따른 복호화 방법과 부호화 방법을 설명하는 순서도를 나타낸다.

일 실시 예에 따른 영상 복호화 장치는 메모리 및 적어도 하나의 프로세서를 포함할 수 있으며, 프로세서의 동작에 의하여 이하의 복호화 방법을 수행할 수 있다. 먼저, 복호화 장치는 비트스트림으로부터 현재 NAL(network abstraction layer) 유닛의 타입을 나타내는 NAL 유닛 타입 정보를 획득할 수 있다(S1910).

다음으로, 복호화 장치는 NAL 유닛 타입 정보가 현재 NAL 유닛의 NAL 유닛 타입이 영상 슬라이스에 대한 부호화 데이터임을 나타내는 경우, 현재 픽처에 혼성 NAL 유닛 타입(mixed NAL unit type)이 적용되는지 여부에 기반하여 영상 슬라이스를 복호화할 수 있다(S1920).

여기서, 복호화 장치는 혼성 NAL 유닛 타입이 적용되는지 여부에 기반하여, 현재 NAL 유닛의 NAL 유닛 타입이 현재 영상 슬라이스에 대한 서브 픽처의 속성을 나타내는지 여부를 결정함으로써 영상 슬라이스의 복호화를 수행할 수 있다.

혼성 NAL 유닛 타입이 적용되는지 여부는 픽처 파라미터 셋으로부터 획득되는 제 1 플래그(e.g. pps_mixed_nalu_types_in_pic_flag)에 기반하여 식별될 수 있다. 혼성 NAL 유닛 타입이 적용되는 경우, 현재 영상 슬라이스가 속한 현재 픽처는 적어도 두개의 서브 픽처로 분할될 수 있다.

나아가, 혼성 NAL 유닛 타입이 적용되는지 여부에 기반하여 서브 픽처에 대한 복호화 정보가 비트스트림에 포함되어 있을 수 있다. 일 실시 예에서, 비트스트림으로부터 현재 픽처가 분할되지 않는지 여부를 나타내는 제 2 플래그(e.g. pps_no_pic_partition_flag)가 획득될 수 있다. 그리고 제 2 플래그가 현재 픽처가 분할될 수 있음을 나타내는 경우(e.g. pps_no_pic_partition_flag == 0), 참조 픽처 리스트 정보가 픽처 헤더에서 제공되는지 여부를 나타내는 제 3 플래그(e.g. pps_rpl_info_in_ph_flag)가 비트스트림으로부터 획득될 수 있다.

이러한 예에서, 상기 혼성 NAL 유닛 타입이 적용되는 경우, 현재 픽처가 적어도 두개의 서브 픽처로 분할이 강제됨에 따라 제 2 플래그(pps_no_pic_partition_flag)의 값이 0으로 강제되고, 참조 픽처 리스트 정보가 픽처 헤더에서 제공되는지 여부를 나타내는 제 3 플래그(e.g. pps_rpl_info_in_ph_flag)가 비트스트림에서 실제로 획득된 제 2 플래그(pps_no_pic_partition_flag)의 값에 무관히 비트스트림으로부터 획득될 수 있다. 이에 따라, 제 3 플래그가 참조 픽처 리스트 정보가 픽처 헤더에서 제공됨을 나타내면(e.g. pps_rpl_info_in_ph_flag == 1), 픽처 헤더에 관한 비트스트림에서 참조 픽처 리스트 정보가 획득될 수 있다.

또한, 혼성 NAL 유닛 타입이 적용되는 경우, 현재 픽처는 서로 상이한 NAL 유닛 타입을 가지는 제 1 서브 픽처와 제 2 서브 픽처에 기반하여 복호화될 수 있다. 여기서, 제 1 서브 픽처의 NAL 유닛 타입이 IDR_W_RADL(Instantaneous Decoding Refresh_With_Random Access Decodable Leading), IDR_N_LP(Instantaneous Decoding Refresh_No reference_Leading Picture) 및 CRA_NUT(Clean Random Access_NAL Unit Type) 중 어느 하나의 값을 가지는 경우, 제 2 서브 픽처 NUT로 선택 가능한 가용(available) NAL 유닛 타입은 IDR_W_RADL, IDR_N_LP 및 CRA_NUT 중에서 제 1 서브 픽처에서 선택되지 않은 NAL 유닛 타입을 포함할 수 있다.

또는, 제 1 서브 픽처의 NAL 유닛 타입이 IDR_W_RADL(Instantaneous Decoding Refresh_With_Random Access Decodable Leading), IDR_N_LP(Instantaneous Decoding Refresh_No reference_Leading Picture) 및 CRA_NUT(Clean Random Access_NAL Unit Type) 중 어느 하나의 값을 가지는 경우, 제 2 서브 픽처의 가용 NAL 유닛 타입은 TRAIL_NUT(Trail_NAL Unit Type)를 포함할 수 있다.

한편, 혼성 NAL 유닛 타입이 적용되는 경우, 현재 픽처를 구성하는 제 1 서브 픽처와 제 2 서브 픽처는 독립적으로 복호화 될 수 있다. 예를들어, B 또는 P 슬라이스를 포함하는 제 1 서브 픽처와 제 2 서브 픽처는 하나의 픽처로 취급되어 복호화 될 수 있다. 예를들어, 제 1 서브 픽처는 제 2 서브 픽처를 참조 픽처로 사용하지 않고 복호화 될 수 있다.

보다 상세히, 제 1 서브 픽처가 복호화 과정에서 픽처로 취급되는지 여부를 나타내는 제 4 플래그(e.g. sps_subpic_treated_as_pic_flag)가 비트스트림으로부터 획득될 수 있다. 제 1 서브 픽처가 복호화 과정에서 픽처로 취급됨을 제 4 플래그가 나타내면(e.g. sps_subpic_treated_as_pic_flag == 1), 제 1 서브 픽처는 복호화 과정에서 픽처로 취급되어 복호화 될 수 있다. 이러한 과정에서, 현재 픽처에 혼성 NAL 유닛 타입이 적용되고 제 1 서브 픽처를 포함한 현재 픽처가 P 슬라이스 또는 B 슬라이스를 적어도 하나 포함하면, 제 4 플래그는 제 1 서브 픽처가 복호화 과정에서 픽처로 취급됨을 나타내는 값을 가지도록 강제될 수 있다. 반면, 현재 픽처에 혼성 NAL 유닛 타입이 적용되고 제 1 서브 픽처가 복호화 과정에서 픽처로 취급되지 않음을 제 4 플래그가 나타내면(e.g. sps_subpic_treated_as_pic_flag == 0), 현재 픽처에 속한 슬라이스 타입은 인트라이어야 한다.

제 1 서브 픽처가 복호화 과정에서 픽처로 취급됨을 제 4 플래그가 나타내면, 제 1 서브 픽처의 복호화 과정이 다른 서브 픽처로부터 독립됨을 결정할 수 있다. 예를들어, 제 4 플래그가 제 1 서브 픽처가 복호화 과정에서 다른 서브 픽처로부터 독립되어 복호화됨을 나타내면, 제 1 서브 픽처는 다른 서브 픽처를 참조 픽처로 사용하지 않고 복호화 될 수 있다.

또한, 제 1 서브 픽처가 RASL(Random Access Skipped Leading) 서브 픽처인 경우, 제 2 서브 픽처가 RADL(Random Access Decodable Leading) 서브 픽처인지 여부에 기반하여 현재 픽처가 RASL 픽처로 결정될 수 있다. 여기서, 제 1 서브 픽처에 대응되는 NAL 유닛의 타입이 RASL_NUT(Random Access Skipped Leading_NAL Unit Type)인 경우, 제 1 서브 픽처는 RASL 서브 픽처로 결정될 수 있다.

또한, 제 3 플래그(e.g. pps_rpl_info_in_ph_flag)가 참조 픽처 리스트 정보가 픽처 헤더에서 획득되지 않고 슬라이스 헤더에서 획득될 수 있음을 나타내고(e.g. pps_rpl_info_in_ph_flag == 0), 제 1 서브 픽처의 NAL 유닛 타입이 IDR_W_RADL(Instantaneous Decoding Refresh_With_Random Access Decodable Leading) 및 IDR_N_LP(Instantaneous Decoding Refresh_No reference_Leading Picture) 중 어느 하나의 값을 가지는 경우, IDR 픽처에 대한 참조 픽처 리스트 (reference picture list) 정보가 슬라이스 헤더에 존재할 수 있는지 여부를 나타내는 제 5 플래그(e.g. sps_idr_rpl_present_flag)에 기반하여, 슬라이스 헤더에 관한 비트스트림로부터 참조 픽처 리스트 정보가 획득될 수 있다. 여기서, 제 5 플래그는 시퀀스 파라미터 셋에 관한 비트스트림으로부터 획득될 수 있다.

한편, 현재 픽처에 연관된 IRAP(Intra Random Access Point) 픽처에 대하여 랜덤 엑세스가 수행되는 경우, 현재 픽처가 RASL(Random Access Skipped Leading) 서브 픽처이면 현재 픽처는 출력(디스플레이)되지 않을 수 있다.

일 실시 예에 따른 영상 부호화 장치는 메모리 및 적어도 하나의 프로세서를 포함할 수 있으며, 프로세서의 동작에 의하여 전술한 복호화 방법에 대응되는 부호화 방법을 수행할 수 있다. 예를들어, 부호화 장치는 현재 픽처가 혼성 NAL 유닛 타입에 기반하여 부호화되는 경우, 픽처를 분할하는 서브 픽처의 타입을 결정할 수 있다(S2010). 그리고, 부호화 장치는 서브 픽처의 타입에 기반하여, 서브 픽처를 구성하는 적어도 하나의 현재 영상 슬라이스를 부호화하여 현재 NAL 유닛을 생성할 수 있다(S2020). 이때, 부호화 장치는 현재 픽처가 혼성 NAL 유닛 타입에 기반하여 부호화되는 경우 현재 NAL 유닛의 NAL 유닛 타입이 현재 영상 슬라이스에 대한 서브 픽처의 속성을 나타내도록 부호화함으로써 영상 슬라이스를 부호화 할 수 있다.

또한, 본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있다.

본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims

영상 복호화 장치가 수행하는 영상 복호화 방법으로서,

비트스트림으로부터 현재 NAL(network abstraction layer) 유닛의 타입을 나타내는 NAL 유닛 타입 정보를 획득하는 단계; 및

상기 NAL 유닛 타입 정보가 상기 현재 NAL 유닛의 NAL 유닛 타입이 영상 슬라이스에 대한 부호화 데이터임을 나타내는 경우, 현재 픽처에 혼성 NAL 유닛 타입(mixed NAL unit type)이 적용되는지 여부에 기반하여 상기 영상 슬라이스를 복호화 하는 단계를 포함하고,

상기 영상 슬라이스를 복호화 하는 단계는, 상기 혼성 NAL 유닛 타입이 적용되는지 여부에 기반하여 상기 현재 NAL 유닛의 NAL 유닛 타입이 상기 현재 영상 슬라이스에 대한 서브 픽처의 속성을 나타내는지 여부를 결정함으로써 수행되는 영상 복호화 방법.
제 1 항에 있어서,

상기 혼성 NAL 유닛 타입이 적용되는지 여부는 픽처 파라미터 셋으로부터 획득되는 제 1 플래그에 기반하여 식별되는 영상 복호화 방법.
제 1 항에 있어서,

상기 비트스트림으로부터 상기 현재 픽처가 분할되지 않는지 여부를 나타내는 제 2 플래그가 획득되고,

상기 제 2 플래그가 상기 현재 픽처가 분할될 수 있음을 나타내는 경우, 참조 픽처 리스트 정보가 픽처 헤더에서 제공되는지 여부를 나타내는 제 3 플래그가 비트스트림으로부터 획득되되,

상기 혼성 NAL 유닛 타입이 적용되는 경우, 상기 제 2 플래그는 상기 현재 픽처가 분할될 수 있음을 나타내는 값을 가지도록 제한되는 영상 복호화 방법.
제 3항에 있어서,

상기 제 3 플래그가 상기 참조 픽처 리스트 정보가 상기 픽처 헤더에서 제공됨을 나타내면, 상기 픽처 헤더에 관한 비트스트림으로부터 상기 참조 픽처 리스트 정보가 획득되는 영상 복호화 방법
제 1 항에 있어서,

상기 혼성 NAL 유닛 타입이 적용되는 경우, 상기 현재 영상 슬라이스가 속한 현재 픽처는 적어도 두개의 서브 픽처로 분할되는 영상 복호화 방법.
제 5 항에 있어서,

상기 혼성 NAL 유닛 타입이 적용되는 경우, 상기 현재 픽처는 서로 상이한 NAL 유닛 타입을 가지는 제 1 서브 픽처와 제 2 서브 픽처에 기반하여 복호화되는 영상 복호화 방법.
제 6 항에 있어서,

상기 제 1 서브 픽처가 복호화 과정에서 픽처로 취급되는지 여부를 나타내는 제 4 플래그가 상기 비트스트림으로부터 획득되고,

상기 제 1 서브 픽처가 복호화 과정에서 픽처로 취급됨을 상기 제 4 플래그가 나타내면, 상기 제 1 서브 픽처는 복호화 과정에서 픽처로 취급되어 복호화 되는 영상 복호화 방법.
제 7 항에 있어서,

상기 제 4 플래그에 기반하여 상기 제 1 서브 픽처의 복호화 과정의 독립 여부가 결정되고,

상기 제 4 플래그가 상기 제 1 서브 픽처가 복호화 과정에서 다른 서브 픽처로부터 독립되어 복호화됨을 나타내면, 상기 제 1 서브 픽처는 다른 서브 픽처를 참조 하지 않고 복호화 되는 영상 복호화 방법.
제 6 항에 있어서,

상기 제 1 서브 픽처의 NAL 유닛 타입이 IDR_W_RADL(Instantaneous Decoding Refresh_With_Random Access Decodable Leading), IDR_N_LP(Instantaneous Decoding Refresh_No reference_Leading Picture) 및 CRA_NUT(Clean Random Access_NAL Unit Type) 중 어느 하나의 값을 가지는 경우, 제 2 서브 픽처의 가용 NAL 유닛 타입은 IDR_W_RADL, IDR_N_LP 및 CRA_NUT 중에서 상기 제 1 서브 픽처에서 선택되지 않은 NAL 유닛 타입을 포함하는 영상 복호화 방법.
제 6 항에 있어서,

상기 제 1 서브 픽처의 NAL 유닛 타입이 IDR_W_RADL(Instantaneous Decoding Refresh_With_Random Access Decodable Leading), IDR_N_LP(Instantaneous Decoding Refresh_No reference_Leading Picture) 및 CRA_NUT(Clean Random Access_NAL Unit Type) 중 어느 하나의 값을 가지는 경우, 제 2 서브 픽처의 가용 NAL 유닛 타입은 TRAIL_NUT(Trail_NAL Unit Type)를 포함하는 영상 복호화 방법.
제 6 항에 있어서,

상기 제 1 서브 픽처가 RASL(Random Access Skipped Leading) 서브 픽처인 경우, 상기 제 2 서브 픽처가 RADL(Random Access Decodable Leading) 서브 픽처인지 여부에 기반하여 상기 현재 픽처가 RASL 픽처로 결정되는 영상 복호화 방법.
제 6 항에 있어서,

상기 제 1 서브 픽처의 NAL 유닛 타입이 IDR_W_RADL(Instantaneous Decoding Refresh_With_Random Access Decodable Leading) 및 IDR_N_LP(Instantaneous Decoding Refresh_No reference_Leading Picture) 중 어느 하나의 값을 가지는 경우, IDR 픽처에 대한 참조 픽처 리스트 (reference picture list) 정보가 존재할 수 있는지 여부를 나타내는 제 5 플래그에 기반하여, 상기 비트스트림으로부터 참조 픽처 리스트 정보가 획득되는 영상 복호화 방법
제 12 항에 있어서,

상기 제 5 플래그는 시퀀스 파라미터 셋으로부터 획득되는 영상 복호화 방법.
메모리 및 적어도 하나의 프로세서를 포함하는 영상 복호화 장치로서,

상기 적어도 하나의 프로세서는,

비트스트림으로부터 현재 NAL(network abstraction layer) 유닛의 타입을 나타내는 NAL 유닛 타입 정보를 획득하고,

상기 NAL 유닛 타입 정보가 상기 현재 NAL 유닛의 NAL 유닛 타입이 영상 슬라이스에 대한 부호화 데이터임을 나타내는 경우, 현재 픽처에 혼성 NAL 유닛 타입이 적용되는지 여부에 기반하여 상기 영상 슬라이스를 복호화하되,

상기 영상 슬라이스의 복호화는, 상기 혼성 NAL 유닛 타입이 적용되는지 여부에 기반하여 상기 현재 NAL 유닛의 NAL 유닛 타입이 상기 현재 영상 슬라이스에 대한 서브 픽처의 속성을 나타내는지 여부를 결정함으로써 수행되는 영상 복호화 장치.
영상 부호화 장치에 의해 수행되는 영상 부호화 방법으로서,

현재 픽처가 혼성 NAL 유닛 타입에 기반하여 부호화되는 경우, 상기 픽처를 분할하는 서브 픽처의 타입을 결정하는 단계; 및

상기 서브 픽처의 타입에 기반하여 상기 서브 픽처를 구성하는 적어도 하나의 현재 영상 슬라이스를 부호화하여 현재 NAL 유닛을 생성하는 단계를 포함하고,

상기 영상 슬라이스를 부호화 하는 단계는, 상기 현재 픽처가 상기 혼성 NAL 유닛 타입에 기반하여 부호화되는 경우 상기 현재 NAL 유닛의 NAL 유닛 타입이 상기 현재 영상 슬라이스에 대한 서브 픽처의 속성을 나타내도록 부호화함으로써 수행되는 영상 부호화 방법.
제 15 항의 영상 부호화 방법에 의해 생성된 비트스트림을 전송하는 방법.