WO2021071186A1

WO2021071186A1 - 픽처 분할 방법 및 복호화 장치

Info

Publication number: WO2021071186A1
Application number: PCT/KR2020/013522
Authority: WO
Inventors: 김재일; 이선영; 손세훈; 고경환; 백아람
Original assignee: 에스케이텔레콤 주식회사
Priority date: 2019-10-07
Filing date: 2020-10-06
Publication date: 2021-04-15
Also published as: US20220368899A1; CN114731402A

Abstract

픽처 분할 방법 및 복호화 장치를 개시한다. 본 발명의 일 실시예에 의하면, 픽처를 분할하는 방법으로서, 비트스트림으로부터, 상기 픽처가 하나 이상의 하위 유닛으로 분할되는지 여부에 대한 분할 플래그를 복호화하는 단계; 상기 분할 플래그가 분할됨을 나타내는 경우에, 상기 비트스트림으로부터 분할정보를 복호화하는 단계; 및 상기 분할정보를 이용하여, 상기 픽처를 상기 하위 유닛으로 분할하는 단계를 포함하는, 방법을 제공한다. 대표도: 도 9

Description

픽처 분할 방법 및 복호화 장치

본 발명은 동영상의 부호화 및 복호화에 관한 것으로서, 더욱 구체적으로는 다양한 목적에 맞는 픽처 분할 방법을 통해 부호화 및 복호화의 효율을 향상시킨 픽처를 분할하는 방법 및 복호화 장치에 관한 것이다.

동영상 데이터는 음성 데이터나 정지 영상 데이터 등에 비하여 많은 데이터량을 가지기 때문에, 압축을 위한 처리 없이 그 자체를 저장하거나 전송하기 위해서는 메모리를 포함하여 많은 하드웨어 자원을 필요로 한다.

따라서, 통상적으로 동영상 데이터를 저장하거나 전송할 때에는 부호화기를 사용하여 동영상 데이터를 압축하여 저장하거나 전송하며, 복호화기에서는 압축된 동영상 데이터를 수신하여 압축을 해제하고 재생한다. 이러한 동영상 압축 기술로는 H.264/AVC를 비롯하여, H.264/AVC에 비해 약 40% 정도의 부호화 효율을 향상시킨 HEVC(High Efficiency Video Coding)가 존재한다.

그러나, 영상의 크기 및 해상도, 프레임율이 점차 증가하고 있고, 이에 따라 부호화해야 하는 데이터량도 증가하고 있으므로 기존의 압축 기술보다 더 부호화 효율이 좋고 화질 개선 효과도 높은 새로운 압축 기술이 요구된다.

이러한 요구에 부응하기 위해 본 발명은 개선된 부호화 및 복호화 기술을 제공하는 것을 목적으로 하며, 특히, 본 발명의 일 측면은 픽처를 다양한 목적에 맞게 분할함으로써 부호화 및 복호화의 효율을 향상시키는 기술과 관련된다.

본 발명의 일 측면은, 픽처를 분할하는 방법으로서, 비트스트림으로부터, 상기 픽처가 하나 이상의 하위 유닛으로 분할되는지 여부에 대한 분할 플래그를 복호화하는 단계; 상기 분할 플래그가 분할됨을 나타내는 경우에, 상기 비트스트림으로부터 분할정보를 복호화하는 단계; 및 상기 분할정보를 이용하여, 상기 픽처를 상기 하위 유닛으로 분할하는 단계를 포함하는, 방법을 제공한다.

본 발명의 다른 일 측면은, 영상 복호화 장치로서, 픽처가 하나 이상의 하위 유닛으로 분할되는지 여부에 대한 분할 플래그를 비트스트림으로부터 복호화하고, 상기 분할 플래그가 분할됨을 나타내는 경우에 상기 비트스트림으로부터 분할정보를 복호화하는 복호화 실행부; 및 상기 분할정보를 이용하여, 상기 픽처를 상기 하위 유닛으로 분할하는 분할부를 포함하는, 영상 복호화 장치를 제공한다.

이상에서 설명한 바와 같이 본 발명의 일 실시예에 의하면, 픽처를 시퀀스들 간의 합성, 비트스트림 패킹, 병렬 처리 등과 같은 다양한 목적에 맞게 분할할 수 있다.

도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다.

도 2는 QTBTTT 구조를 이용하여 블록을 분할하는 방법을 설명하기 위한 도면이다.

도 3은 복수의 인트라 예측 모드들을 설명하기 위한 도면이다.

도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다.

도 5 내지 도 7은 슬라이스, 타일 및 서브픽처를 설명하기 위한 도면이다.

도 8은 컨텐츠들의 합성을 설명하기 위한 도면이다.

도 9는 본 개시의 기술들을 구현할 수 있는 복호화부의 예시적인 블록도이다.

도 10은 본 개시의 기술들을 구현할 수 있는 방법의 일 예를 설명하기 위한 순서도이다.

도 11 및 도 12는 슬라이스, 타일 및 서브픽처의 분할 형태를 설명하기 위한 도면이다.

도 13은 서브픽처의 분할을 설명하기 위한 순서도이다.

도 14는 타일의 분할을 설명하기 위한 순서도이다.

도 15는 슬라이스의 분할을 설명하기 위한 순서도이다.

도 16은 슬라이스의 분할 형태를 설명하기 위한 도면이다.

도 17은 서브픽처 맵핑을 설명하기 위한 순서도이다.

도 18은 슬라이스 어드레스를 설명하기 위한 순서도이다.

도 19는 슬라이스와 서브픽처 사이의 관계를 설명하기 위한 도면이다.

도 20은 헤더 정보들 간의 연결 관계를 설명하기 위한 도면이다.

도 21은 서브픽처의 다양한 구성 예들을 설명하기 위한 도면이다.

이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성 요소들에 식별 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.

도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다. 이하에서는 도 1을 참조하여 영상 부호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.

영상 부호화 장치는 블록 분할부(110), 예측부(120), 감산기(130), 변환부(140), 양자화부(145), 부호화부(150), 역양자화부(160), 역변환부(165), 가산기(170), 필터부(180) 및 메모리(190)를 포함하여 구성될 수 있다.

영상 부호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.

하나의 영상(비디오)는 복수의 픽처들로 구성된다. 각 픽처들은 복수의 영역으로 분할되고 각 영역마다 부호화가 수행된다. 예를 들어, 하나의 픽처는 하나 이상의 타일(Tile) 또는/및 슬라이스(Slice)로 분할된다. 여기서, 하나 이상의 타일을 타일 그룹(Tile Group)으로 정의할 수 있다. 각 타일 또는/슬라이스는 하나 이상의 CTU(Coding Tree Unit)로 분할된다. 그리고 각 CTU는 트리 구조에 의해 하나 이상의 CU(Coding Unit)들로 분할된다. 각 CU에 적용되는 정보들은 CU의 신택스로서 부호화되고, 하나의 CTU에 포함된 CU들에 공통적으로 적용되는 정보는 CTU의 신택스로서 부호화된다. 또한, 하나의 타일 내의 모든 블록들에 공통적으로 적용되는 정보는 타일의 신택스로서 부호화되거나 다수 개의 타일을 모아 놓은 타일 그룹의 신택스로서 부호화되며, 하나의 픽처들을 구성하는 모든 블록들에 적용되는 정보는 픽처 파라미터 셋(PPS, Picture Parameter Set) 혹은 픽처 헤더에 부호화된다. 나아가, 복수의 픽처가 공통으로 참조하는 정보들은 시퀀스 파라미터 셋(SPS, Sequence Parameter Set)에 부호화된다. 그리고, 하나 이상의 SPS가 공통으로 참조하는 정보들은 비디오 파라미터 셋(VPS, Video Parameter Set)에 부호화된다.

블록 분할부(110)는 CTU(Coding Tree Unit)의 크기를 결정한다. CTU의 크기에 대한 정보(CTU size)는 SPS 또는 PPS의 신택스로서 부호화되어 영상 복호화 장치로 전달된다.

블록 분할부(110)는 영상을 구성하는 각 픽처(picture)를 미리 결정된 크기를 가지는 복수의 CTU(Coding Tree Unit)들로 분할한 이후에, 트리 구조(tree structure)를 이용하여 CTU를 반복적으로(recursively) 분할한다. 트리 구조에서의 리프 노드(leaf node)가 부호화의 기본 단위인 CU(coding unit)가 된다.

트리 구조로는 상위 노드(혹은 부모 노드)가 동일한 크기의 네 개의 하위 노드(혹은 자식 노드)로 분할되는 쿼드트리(QuadTree, QT), 또는 상위 노드가 두 개의 하위 노드로 분할되는 바이너리트리(BinaryTree, BT), 또는 상위 노드가 1:2:1 비율로 세 개의 하위 노드로 분할되는 터너리트리(TernaryTree, TT), 또는 이러한 QT 구조, BT 구조 및 TT 구조 중 둘 이상을 혼용한 구조일 수 있다. 예컨대, QTBT(QuadTree plus BinaryTree) 구조가 사용될 수 있고, 또는 QTBTTT(QuadTree plus BinaryTree TernaryTree) 구조가 사용될 수 있다. 여기서, BTTT를 합쳐서 MTT(Multiple-Type Tree)라 칭할 수 있다.

도 2는 QTBTTT 분할 트리 구조를 보인다. 도 2에서 보는 바와 같이, CTU는 먼저 QT 구조로 분할될 수 있다. 쿼드트리 분할은 분할 블록(splitting block)의 크기가 QT에서 허용되는 리프 노드의 최소 블록 크기(MinQTSize)에 도달할 때까지 반복될 수 있다. QT 구조의 각 노드가 하위 레이어의 4개의 노드들로 분할되는지 여부를 지시하는 제1 플래그(QT_split_flag)는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. QT의 리프 노드가 BT에서 허용되는 루트 노드의 최대 블록 크기(MaxBTSize)보다 크지 않은 경우, BT 구조 또는 TT 구조 중 어느 하나 이상으로 더 분할될 수 있다. BT 구조 및/또는 TT 구조에서는 복수의 분할 방향이 존재할 수 있다. 예컨대, 해당 노드의 블록이 가로로 분할되는 방향과 세로로 분할되는 방향 두 가지가 존재할 수 있다. 도 2와 같이, MTT 분할이 시작되면, 노드들이 분할되었는지 여부를 지시하는 제2 플래그(mtt_split_flag)와, 분할이 되었다면 추가적으로 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그 및/또는 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

트리 구조의 다른 예로서, QTBTTT 구조를 사용하여 블록을 분할하는 경우, 먼저 분할 되었음을 나타내는 CU 분할 플래그(split_cu_flag) 및 분할 타입이 QT 분할인지를 지시하는 QT 분할 플래그(split_qt_flag) 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. CU 분할 플래그(split_cu_flag) 값이 분할되지 않았음을 지시하는 경우, 해당 노드의 블록이 분할 트리 구조에서의 리프 노드(leaf node)가 되어 부호화의 기본 단위인 CU(coding unit)가 된다. CU 분할 플래그(split_cu_flag) 값이 분할되었음을 지시하는 경우, QT 분할 플래그(split_qt_flag) 값을 통해 분할 타입이 QT 혹은 MTT인지를 구분한다. 분할 타입이 QT인 경우에는 더 이상의 추가 정보가 없으며, 분할 타입이 MTT인 경우에는 추가적으로 MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

트리 구조의 다른 예시로서 QTBT가 사용되는 경우, 해당 노드의 블록을 동일 크기의 두 개 블록으로 가로로 분할하는 타입(즉, symmetric horizontal splitting)과 세로로 분할하는 타입(즉, symmetric vertical splitting) 두 가지가 존재할 수 있다. BT 구조의 각 노드가 하위 레이어의 블록으로 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할되는 타입을 지시하는 분할 타입 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다. 한편, 해당 노드의 블록을 서로 비대칭 형태의 두 개의 블록으로 분할하는 타입이 추가로 더 존재할 수도 있다. 비대칭 형태에는 해당 노드의 블록을 1:3의 크기 비율을 가지는 두 개의 직사각형 블록으로 분할하는 형태가 포함될 수 있고, 혹은 해당 노드의 블록을 대각선 방향으로 분할하는 형태가 포함될 수도 있다.

CU는 CTU로부터의 QTBT 또는 QTBTTT 분할에 따라 다양한 크기를 가질 수 있다. 이하에서는, 부호화 또는 복호화하고자 하는 CU(즉, QTBTTT의 리프 노드)에 해당하는 블록을 '현재블록'이라 칭한다.

예측부(120)는 현재블록을 예측하여 예측블록을 생성한다. 예측부(120)는 인트라 예측부(122)와 인터 예측부(124)를 포함한다.

일반적으로, 픽처 내 현재블록들은 각각 예측적으로 코딩될 수 있다. 일반적으로 현재블록의 예측은 (현재블록을 포함하는 픽처로부터의 데이터를 사용하는) 인트라 예측 기술 또는 (현재블록을 포함하는 픽처 이전에 코딩된 픽처로부터의 데이터를 사용하는) 인터 예측 기술을 사용하여 수행될 수 있다. 인터 예측은 단방향 예측과 양방향 예측 모두를 포함한다.

인트라 예측부(122)는 현재블록이 포함된 현재 픽처 내에서 현재블록의 주변에 위치한 픽셀(참조 픽셀)들을 이용하여 현재블록 내의 픽셀들을 예측한다. 예측 방향에 따라 복수의 인트라 예측모드가 존재한다. 예컨대, 도 3에서 보는 바와 같이, 복수의 인트라 예측모드는 planar 모드와 DC 모드를 포함하는 비방향성 모드와 65개의 방향성 모드를 포함할 수 있다. 각 예측모드에 따라 사용할 주변 픽셀과 연산식이 다르게 정의된다.

인트라 예측부(122)는 현재블록을 부호화하는데 사용할 인트라 예측 모드를 결정할 수 있다. 일부 예들에서, 인트라 예측부(122)는 여러 인트라 예측 모드들을 사용하여 현재블록을 인코딩하고, 테스트된 모드들로부터 사용할 적절한 인트라 예측 모드를 선택할 수도 있다. 예를 들어, 인트라 예측부(122)는 여러 테스트된 인트라 예측 모드들에 대한 레이트 왜곡(rate-distortion) 분석을 사용하여 레이트 왜곡 값들을 계산하고, 테스트된 모드들 중 최선의 레이트 왜곡 특징들을 갖는 인트라 예측 모드를 선택할 수도 있다.

인트라 예측부(122)는 복수의 인트라 예측 모드 중에서 하나의 인트라 예측 모드를 선택하고, 선택된 인트라 예측 모드에 따라 결정되는 주변 픽셀(참조 픽셀)과 연산식을 사용하여 현재블록을 예측한다. 선택된 인트라 예측 모드에 대한 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.

인터 예측부(124)는 움직임 보상 과정을 통해 현재블록에 대한 예측블록을 생성한다. 현재 픽처보다 먼저 부호화 및 복호화된 참조픽처 내에서 현재블록과 가장 유사한 블록을 탐색하고, 그 탐색된 블록을 이용하여 현재블록에 대한 예측블록을 생성한다. 그리고, 현재 픽처 내의 현재블록과 참조픽처 내의 예측블록 간의 변위(displacement)에 해당하는 움직임벡터(motion vector)를 생성한다. 일반적으로, 움직임 추정은 루마(luma) 성분에 대해 수행되고, 루마 성분에 기초하여 계산된 모션 벡터는 루마 성분 및 크로마 성분 모두에 대해 사용된다. 현재블록을 예측하기 위해 사용된 참조픽처에 대한 정보 및 움직임벡터에 대한 정보를 포함하는 움직임 정보는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.

감산기(130)는 현재블록으로부터 인트라 예측부(122) 또는 인터 예측부(124)에 의해 생성된 예측블록을 감산하여 잔차블록을 생성한다.

변환부(140)는 공간 영역의 픽셀 값들을 가지는 잔차블록 내의 잔차 신호를 주파수 도메인의 변환 계수로 변환한다. 변환부(140)는 잔차블록의 전체 크기를 변환 단위로 사용하여 잔차블록 내의 잔차 신호들을 변환할 수 있으며, 또는 잔차블록을 변환 영역 및 비변환 영역인 두 개의 서브블록으로 구분하여, 변환 영역 서브블록만 변환 단위로 사용하여 잔차 신호들을 변환할 수 있다. 여기서, 변환 영역 서브블록은 가로축 (혹은 세로축) 기준 1:1의 크기 비율을 가지는 두 개의 직사각형 블록 중 하나일 수 있다. 이런 경우, 서브블록 만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 위치 정보(cu_sbt_pos_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. 또한, 변환 영역 서브블록의 크기는 가로축 (혹은 세로축) 기준 1:3의 크기 비율을 가질 수 있으며, 이런 경우 해당 분할을 구분하는 플래그(cu_sbt_quad_flag)가 추가적으로 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

양자화부(145)는 변환부(140)로부터 출력되는 변환 계수들을 양자화하고, 양자화된 변환 계수들을 부호화부(150)로 출력한다.

부호화부(150)는 양자화된 변환 계수들을 CABAC(Context-based Adaptive Binary Arithmetic Code) 등의 부호화 방식을 사용하여 부호화함으로써 비트스트림을 생성한다. 부호화부(150)는 블록 분할과 관련된 CTU size, CU 분할 플래그, QT 분할 플래그, MTT 분할 방향, MTT 분할 타입 등의 정보를 부호화하여, 영상 복호화 장치가 영상 부호화 장치와 동일하게 블록을 분할할 수 있도록 한다.

또한, 부호화부(150)는 현재블록이 인트라 예측에 의해 부호화되었는지 아니면 인터 예측에 의해 부호화되었는지 여부를 지시하는 예측 타입에 대한 정보를 부호화하고, 예측 타입에 따라 인트라 예측정보(즉, 인트라 예측 모드에 대한 정보) 또는 인터 예측정보(참조픽처 및 움직임벡터에 대한 정보)를 부호화한다.

역양자화부(160)는 양자화부(145)로부터 출력되는 양자화된 변환 계수들을 역양자화하여 변환 계수들을 생성한다. 역변환부(165)는 역양자화부(160)로부터 출력되는 변환 계수들을 주파수 도메인으로부터 공간 도메인으로 변환하여 잔차블록을 복원한다.

가산부(170)는 복원된 잔차블록과 예측부(120)에 의해 생성된 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 다음 순서의 블록을 인트라 예측할 때 참조 픽셀로서 사용된다.

필터부(180)는 블록 기반의 예측 및 변환/양자화로 인해 발생하는 블록킹 아티팩트(blocking artifacts), 링잉 아티팩트(ringing artifacts), 블러링 아티팩트(blurring artifacts) 등을 줄이기 위해 복원된 픽셀들에 대한 필터링을 수행한다. 필터부(180)는 디블록킹 필터(182)와 SAO(Sample Adaptive Offset) 필터(184)를 포함할 수 있다.

디블록킹 필터(180)는 블록 단위의 부호화/복호화로 인해 발생하는 블록킹 현상(blocking artifact)을 제거하기 위해 복원된 블록 간의 경계를 필터링하고, SAO 필터(184)는 디블록킹 필터링된 영상에 대해 추가적인 필터링을 수행한다. SAO 필터(184)는 손실 부호화(lossy coding)로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해 사용되는 필터이다.

디블록킹 필터(182) 및 SAO 필터(184)를 통해 필터링된 복원블록은 메모리(190)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.

도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다. 이하에서는 도 4를 참조하여 영상 복호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.

영상 복호화 장치는 복호화부(410), 역양자화부(420), 역변환부(430), 예측부(440), 가산기(450), 필터부(460) 및 메모리(470)를 포함하여 구성될 수 있다.

도 1의 영상 부호화 장치와 마찬가지로, 영상 복호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.

복호화부(410)는 영상 부호화 장치로부터 수신한 비트스트림을 복호화하여 블록 분할과 관련된 정보를 추출함으로써 복호화하고자 하는 현재블록을 결정하고, 현재블록을 복원하기 위해 필요한 예측정보와 잔차신호에 대한 정보 등을 추출한다.

복호화부(410)는 SPS(Sequence Parameter Set) 또는 PPS(Picture Parameter Set)로부터 CTU size에 대한 정보를 추출하여 CTU의 크기를 결정하고, 픽처를 결정된 크기의 CTU로 분할한다. 그리고, CTU를 트리 구조의 최상위 레이어, 즉, 루트 노드로 결정하고, CTU에 대한 분할정보를 추출함으로써 트리 구조를 이용하여 CTU를 분할한다.

예컨대, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 MTT의 분할과 관련된 제2 플래그(MTT_split_flag) 및 분할 방향(vertical / horizontal) 및/또는 분할 타입(binary / ternary) 정보를 추출하여 해당 리프 노드를 MTT 구조로 분할한다. 이를 통해 QT의 리프 노드 이하의 각 노드들을 BT 또는 TT 구조로 반복적으로(recursively) 분할한다.

또 다른 예로서, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 CU의 분할 여부를 지시하는 CU 분할 플래그(split_cu_flag)를 추출하고, 해당 블록이 분할된 경우, QT 분할 플래그(split_qt_flag)를 추출한다. 분할 타입이 QT가 아니고 MTT인 경우, MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)를 추가적으로 추출한다. 분할 과정에서 각 노드는 0번 이상의 반복적인 QT 분할 후에 0번 이상의 반복적인 MTT 분할이 발생할 수 있다. 예컨대, CTU는 바로 MTT 분할이 발생하거나, 반대로 다수 번의 QT 분할만 발생할 수도 있다.

다른 예로서, QTBT 구조를 사용하여 CTU를 분할하는 경우, QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 BT로 더 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할 방향 정보를 추출한다.

한편, 복호화부(410)는 트리 구조의 분할을 통해 복호화하고자 하는 현재블록을 결정하게 되면, 현재블록이 인트라 예측되었는지 아니면 인터 예측되었는지를 지시하는 예측 타입에 대한 정보를 추출한다. 예측 타입 정보가 인트라 예측을 지시하는 경우, 복호화부(410)는 현재블록의 인트라 예측정보(인트라 예측 모드)에 대한 신택스 요소를 추출한다. 예측 타입 정보가 인터 예측을 지시하는 경우, 복호화부(410)는 인터 예측정보에 대한 신택스 요소, 즉, 움직임벡터 및 그 움직임벡터가 참조하는 참조픽처를 나타내는 정보를 추출한다.

한편, 복호화부(410)는 잔차신호에 대한 정보로서 현재블록의 양자화된 변환계수들에 대한 정보를 추출한다.

역양자화부(420)는 양자화된 변환계수들을 역양자화하고, 역변환부(430)는 역양자화된 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환하여 잔차신호들을 복원함으로써 현재블록에 대한 잔차블록을 생성한다.

또한, 역변환부(430)는 변환블록의 일부 영역(서브블록)만 역변환하는 경우, 변환블록의 서브블록만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 서브블록의 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 서브블록의 위치 정보(cu_sbt_pos_flag)를 추출하여, 해당 서브블록의 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환함으로써 잔차신호들을 복원하고, 역변환되지 않은 영역에 대해서는 잔차신호로 "0"값을 채움으로써 현재블록에 대한 최종 잔차블록을 생성한다.

예측부(440)는 인트라 예측부(442) 및 인터 예측부(444)를 포함할 수 있다. 인트라 예측부(442)는 현재블록의 예측 타입이 인트라 예측일 때 활성화되고, 인터 예측부(444)는 현재블록의 예측 타입이 인터 예측일 때 활성화된다.

인트라 예측부(442)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소로부터 복수의 인트라 예측 모드 중 현재블록의 인트라 예측 모드를 결정하고, 인트라 예측 모드에 따라 현재블록 주변의 참조 픽셀들을 이용하여 현재블록을 예측한다.

인터 예측부(444)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소를 이용하여 현재블록의 움직임벡터와 그 움직임벡터가 참조하는 참조픽처를 결정하고, 움직임벡터와 참조픽처를 이용하여 현재블록을 예측한다.

가산기(450)는 역변환부로부터 출력되는 잔차블록과 인터 예측부 또는 인트라 예측부로부터 출력되는 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 이후에 복호화할 블록을 인트라 예측할 때의 참조픽셀로서 활용된다.

필터부(460)는 디블록킹 필터(462) 및 SAO 필터(464)를 포함할 수 있다. 디블록킹 필터(462)는 블록 단위의 복호화로 인해 발생하는 블록킹 현상(blocking artifact)를 제거하기 위해, 복원된 블록 간의 경계를 디블록킹 필터링한다. SAO 필터(464)는 손실 부호화(lossy coding)으로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해, 디블록킹 필터링 이후의 복원된 블록에 대해 추가적인 필터링을 수행한다. 디블록킹 필터(462) 및 SAO 필터(464)를 통해 필터링된 복원블록은 메모리(470)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.

HEVC 표준에서는 병렬 처리를 위해 두 가지 타입의 픽처(이미지 또는 화면) 분할 방법이 제안되었다. 두 가지 타입은 슬라이스 분할 방법과 타일 분할 방법이다.

1) 슬라이스 분할 방법에 의하면, 하나의 픽처를 raster scan order 순으로 CTU 단위로 분할하여 부호화/복호화할 수 있는 기능이 제공된다. 하나의 슬라이스 내에는 여러 개의 슬라이스 세그먼트(segments)가 존재할 수 있으며, 슬라이스 세그먼트에는 두 가지 종류가 존재한다. 슬라이스 세그먼트의 종류로는 독립적 슬라이스 세그먼트(independent slice segment)와 종속적 슬라이스 세그먼트(dependent slice segment)가 있다.

독립적 슬라이스 세그먼트는 인트라 예측, 인터 예측, 코딩모드 및 엔트로피 코딩 시에 다른 슬라이스에 의존하지 않는 슬라이스 세그먼트이다. 독립적 슬라이스 세그먼트는 헤더 정보가 존재한다. 종속적 슬라이스 세그먼트는 인트라 예측, 인터 예측, 코딩모드 및 엔트로피 코딩 시에 다른 슬라이스에 의존하는(선행하는 다른 독립적 슬라이스 세그먼트를 참조하는) 슬라이스 세그먼트이다. 종속적 슬라이스 세그먼트는 헤더 정보의 대부분을 선행하는 독립적 슬라이스 세그먼트의 헤더 정보를 참고한다. 즉, 종속적 슬라이스 세그먼트의 헤더 정보는 일부만이 시그널링된다.

도 5 (a)는 픽처로부터 분할된 두 개의 슬라이스들을 보이며, 두 개의 슬라이스들은 슬라이스 경계(slice boundary)에 의해 구분될 수 있다. 하나의 슬라이스에는 하나의 독립적 슬라이스 세그먼트와 0개 이상의 종속적 슬라이스 세그먼트가 존재할 수 있다. 픽처의 상측에 위치하는 첫 번째 슬라이스에는 점선을 기준으로 구분되는 하나의 독립적 슬라이스 세그먼트와 두 개의 종속적 슬라이스 세그먼트가 포함되어 있다. 픽처의 하측에 위치하는 두 번째 슬라이스에는 하나의 독립적 슬라이스 세그먼트만이 포함되어 있다(0개의 종속적 슬라이스 세그먼트 포함).

슬라이스 분할 방법에 대한 신택스 구조가 표 1 및 표 2에 나타나 있다.

표 1은 종속적 슬라이스 세그먼트의 사용 여부를 나타내는 플래그(dependent_slice_segments_enabled_flag)를 나타내며, 이 플래그는 PPS에서 정의될 수 있다. 표 2는 슬라이스 세그먼트 헤더정보를 나타낸다.

표 2에 나타낸 바와 같이, 특정 슬라이스 세그먼트가 픽처 내 첫 번째 슬라이스 세그먼트인지 여부를 나타내는 플래그(first_slice_segment_in_pic_flag)가 먼저 시그널링된다. 첫 번째 슬라이스 세그먼트는 독립적 슬라이스 세그먼트가 된다. 첫 번째 슬라이스 세그먼트가 아니라면, 종속적 슬라이스 세그먼트인지 여부를 나타내는 플래그(dependent_slice_segment_flag)가 시그널링된다. 또한, 해당 슬라이스 세그먼트의 address(slice_segment_address)가 함께 시그널링된다. 여기서, slice_segment_address는 해당 슬라이스 세그먼트 내 첫 번째 CTU의 인덱스(index) 값을 의미한다.

2) 타일 분할 방법에 의하면, 하나의 픽처를 CTU 단위로 다수 개의 열(column)과 행(row)으로 구획/분할하여 부호화/복호화할 수 있는 기능이 제공된다. 픽처를 타일로 분할하는 방법은 균등 분할 또는 개별 분할(비균등 분할)이 모두 가능하다.

분할된 각각의 타일들은 인트라 예측 및 엔트로피 코딩 시에 다른 타일에 의존하지 않으며, 인-루프 필터의 의존 여부는 PPS에서 정의되는 플래그로 제어 가능하다. 타일을 위한 별도의 헤더는 존재하지 않는다.

도 5 (b)는 픽처로부터 3x3으로 분할된 타일들을 보이며, 각 타일들은 타일 경계(column boundaries, row boundaries)에 의해 구분될 수 있다. 복수 개의 타일들은 raster scan order 순으로 부호화/복호화가 진행될 수 있으며, 한 타일 내 다수 개의 CTU들도 raster scan order 순으로 부호화/복호화가 진행될 수 있다. 각 CTU 내에 표시된 숫자들이 부호화/복호화가 진행되는 순서를 나타낸다.

타일 분할 방법을 위한 신택스 구조가 표 3에 나타나 있다.

표 3에 나타낸 바와 같이, 타일 분할 방법의 on/off를 지시하는 플래그(tiles_enabled_flag)가 PPS에서 정의되어 시그널링되며, 해당 플래그가 on인 경우에 타일의 크기를 지정하는 신택스들이 추가적으로 시그널링된다.

타일의 크기를 지정하는 신택스들에는, 세로축 방향으로 분할된 타일들의 개수(타일 열의 개수)에서 1을 뺀 값을 지시하는 num_tile_columns_minus1, 가로축 방향으로 분할된 타일들의 개수(타일 행의 개수)에서 1을 뺀 값을 지시하는 num_tile_rows_minus1, 픽처가 가로축 방향과 세로축 방향으로 균등하게 분할되는지 여부를 지시하는 uniform_spacing_flag 등이 포함될 수 있다.

픽처가 균등하게 분할되지 않는 경우(uniform_spacing_flag=off), 타일 열의 너비정보(column_width_minus1)와 타일 행의 높이정보(row_height_minus1)가 추가적으로 시그널링된다. 또한, 타일들 간 경계에서 인-루프 필터의 적용 여부를 나타내는 플래그(loop_filter_across_tiles_enabled_flag)도 시그널링된다.

이상에서 설명된 슬라이스 분할 방법과 타일 분할 방법의 차이점이 도 6에 나타나 있다. 도 6 (a)는 슬라이스 분할 방법에 따라 분할된 슬라이스들(총 4개)을 나타내며, 도 6 (b)는 타일 분할 방법에 따라 분할된 타일들(총 4개)을 나타낸다. 숫자들 각각은 CTU의 개수를 나타낸다.

분할된 슬라이스들 사이에는 CTU 단위로 가로축 방향의 경계만이 존재할 수 있다. 이와 달리, 분할된 타일들 사이에는 CTU 단위로 가로축 방향의 경계와 세로축 방향의 경계가 모두 존재할 수 있다.

본 발명은 다양한 목적의 이미지 분할 방법을 제안한다.

구체적으로, 본 발명에서는 1) 서로 다른 시퀀스들을 합성하기 위한 서브픽처(sub-picture) 분할 방법, 2) 비트스트림 패킹을 위한 슬라이스 분할 방법, 3) 병렬 처리를 위한 타일 분할 방법 및, 4) 다른 시퀀스와의 합성 시에 사용되는 서브픽처의 layout 정보를 표현하는 방법과 layout 정보를 구성(configuration)할 수 있는 표현 방법 등을 제안한다.

타일, 슬라이스 및 서브픽처

본 발명에 대한 상세한 설명에 앞서, 픽처로부터 분할 또는 구획되는 타일, 슬라이스 및, 서브픽처에 대해 정의한다.

타일은 하나의 픽처를 병렬적으로 처리하기 위해, 이 하나의 픽처를 분할한 영역을 의미한다. 타일들은 인트라 예측 및 엔트로피 코딩 시에 서로 독립적으로 동작하는 구조를 가진다. 즉, 타일들은 인트라 예측 시에 참조샘플을 공유하지 않으며, 엔트로피 코딩 시에 context를 공유하지 않는 관계를 가진다. 타일들 간 경계에 인-루프 필터를 적용할지 여부는 별도의 플래그를 두어 제어될 수 있다.

슬라이스는 독립적인 하나의 NAL(network abstraction layer) 비트스트림을 생성하는 데이터 패킹 단위를 의미한다. 하나의 슬라이스에 다수 개의 타일이 포함되거나, 하나의 타일에 다수 개의 슬라이스가 포함될 수도 있다.

슬라이스에는 두 가지 타입이 존재한다. 첫 번째 타입은 유사한 특성을 가진 타일들 또는 임의의 타일들이 하나의 영역으로 구분된 직사각형 슬라이스(rectangular slice)이고, 두 번째 타입은 raster-scan 순으로 타일 또는 CTU의 부호화/복호화를 진행하다가 특정 위치에서 영역이 구분된 raster-scan 슬라이스(비직사각형 모양)이다. 후자의 경우, 타일 단위로 부호화/복호화를 진행하다가 특정 위치에서 영역이 구분된 raster-scan 슬라이스는 '타일 단위 raster-scan 슬라이스'이며, CTU 단위로 부호화/복호화를 진행하다가 특정 위치에서 영역이 구분된 raster-scan 슬라이스는 'CTU 단위 raster-scan 슬라이스'이다.

직사각형 슬라이스와 raster-scan 슬라이스의 일 예가 도 7에 나타나 있다. 도 7에서, 점선으로 구분된 영역은 CTU를 나타내고, 직선으로 구분된 영역은 타일을 나타내며, 일점 쇄선으로 구분된 영역은 슬라이스를 나타낸다.

도 7 (a)에 나타낸 바와 같이, 하나의 픽처는 총 216(18x12)개의 CTU들로 구획되고, 총 24(6x4)개의 타일들로 구획되며, 총 9개의 직사각형 슬라이스들로 구획될 수 있다. 도 7 (b)에 나타낸 바와 같이, 하나의 픽처는 총 216(18x12)개의 CTU들로 구획되고, 총 12(3x4)개의 타일들로 구획되며, 총 3개의 raster-scan 슬라이스들로 구획될 수 있다.

서브픽처는 다른 컨텐츠와의 합성을 위해 구분된 영역을 의미한다. 서브픽처는 최소 1개의 슬라이스를 포함할 수 있다.

서로 다른 컨텐츠들이 서브픽처 단위로 합성되는 일 예가 도 8에 나타나 있다. 우상향 패턴으로 표현된 영역은 컨텐츠 1 내 픽처를 의미하고, 가로축 방향 패턴으로 표현된 영역은 컨텐츠 2 내 픽처를 의미하며, 세로축 방향 패턴으로 표현된 영역은 컨텐츠 3 내 픽처를 의미한다.

도 8의 좌측에 표현된 바와 같이, 픽처들 각각은 4개의 슬라이스로 구성될 수 있으며, 각 슬라이스 단위로 비트스트림이 생성될 수 있다. 또한, 각 슬라이스가 서브픽처로 정의될 수 있다. 물리적으로 슬라이스 단위로 생성된 비트스트림들이 Bitstream Extractor & Merger(BEAMer)에 입력되어 추출 과정 및 합성 과정을 거치게 된다. 여기서, 추출 과정 및 합성 과정의 논리적 단위는 서브픽처이다. 그 결과, 좌상측 부분은 컨텐츠 1로, 좌하측 부분은 컨텐츠 2로, 우측 부분은 컨텐츠 3으로 합성된 새로운 픽처(picture)가 생성되게 된다.

BEAMer는 슬라이스 단위로 생성된 비트스트림들을 서로 다른 컨텐츠들로부터 서브픽처 단위로 추출하고 합성한다. 이를 위해, 각 컨테츠의 픽처는 서브픽처로 구획된다. 즉, 서브픽처는 컨텐츠 합성을 위해 최소 1개의 슬라이스를 포함하는 영역이다.

본 개시의 기술들을 구현할 수 있는 복호화부(410)의 예시적인 블록도가 도 9에 나타나 있다. 복호화부(410)는 복호화 실행부(910), 분할부(920), 맵핑부(930) 및 설정부(940)을 포함하여 구성될 수 있다.

영상 부호화 장치는 픽처가 하나 이상의 하위 유닛으로 분할되는지 여부를 판단하고, 그 결과(분할 플래그)를 부호화하여 시그널링할 수 있다. 복호화 실행부(910)는 비트스트림으로부터 분할 플래그를 복호화하고(S1010), 분할 플래그에 기초하여 픽처가 하위 유닛으로 분할되는지 여부를 판단할 수 있다.

픽처로부터 분할되는 하위 유닛에는 CTU, 타일, 슬라이스, 서브픽처 등이 포함될 수 있다. 즉, 픽처는 CTU, 타일, 슬라이스, 서브픽처 등으로 분할될 수 있다.

분할 플래그는 픽처가 하위 유닛으로 분할되는지 여부 또는 픽처에 분할이 적용되는지 여부를 나타낼 수 있다. 분할 플래그는 픽처가 하나 이상의 서브픽처로 분할되는지 여부를 나타내는 서브픽처 플래그, 픽처에 분할이 적용되는지 여부를 나타내는 분할 허용정보 등일 수 있다. 분할 플래그에 대한 구체적인 내용은 각 실시예에서 설명하도록 한다.

영상 부호화 장치는 분할 플래그가 픽처에 분할이 적용됨(픽처가 하위 유닛으로 분할됨)을 나타내는 경우에 픽처의 분할과 관련된 정보들(분할정보)를 부호화하여 시그널링할 수 있다. 복호화 실행부(910)는 분할 플래그가 픽처에 분할이 적용됨을 나타내는 경우에 비트스트림으로부터 분할정보를 복호화할 수 있다(S1020).

분할정보에는 픽처로부터 분할되는 하위 유닛들의 개수에 대한 정보(개수정보), 크기에 대한 정보(크기정보) 등이 포함될 수 있다. 또한, 분할정보에는 하위 유닛들의 위치에 대한 정보(위치정보)가 더 포함될 수도 있다.

분할부(920)는 분할정보에 기초하여(분할정보를 이용하여) 픽처를 하나 이상의 하위 유닛으로 분할할 수 있다(S1030).

픽처 분할

픽처를 분할하는 방법은 1) 픽처를 정해진 고정 크기의 CTU로 분할하는 과정, 2) 픽처의 병렬 처리를 위해 픽처를 최소 1개 이상의 CTU를 포함하는 타일로 분할하는 과정, 3) 비트스트림 생성을 위해 픽처를 슬라이스로 분할하는 과정을 포함할 수 있다. 4) 또한, 픽처를 분할하는 방법은 컨텐츠 합성을 위해 픽처를 다수 개의 서브픽처로 분할하는 과정을 더 포함할 수 있다.

1) 픽처는 CTU로 분할될 수 있다. 표 4에 나타낸 바와 같이, 영상 부호화 장치는 CTU의 크기를 SPS, PPS 중에서 하나 이상의 위치에서 정의하여 시그널링하고, 영상 복호화 장치는 이를 복호화하여 CTU의 크기를 파악할 수 있다.

CTU의 최소 크기 및 최대 크기는 영상 부호화 장치와 영상 복호화 장치에서 동일하게 제한될 수 있다. 표 4에서는 CTU의 최소 크기가 2의 5 지수승인 32로 설정된 예이다.

2) 픽처는 타일로 분할될 수 있다. 타일은 최소 1개 이상의 CTU를 포함할 수 있다. 즉, 타일의 크기(너비 및 높이)는 CTU 크기의 배수 값으로 표현될 수 있다(타일은 CTU의 배수 관계로 분할될 수 있다).

픽처가 3x2개의 타일들로 분할된 일 예가 도 11 (a)에 나타나 있다. 타일들 각각에 표시된 숫자는 타일의 인덱스 값을 의미하며, 타일의 인덱스 값은 타일이 분할된 형태에 따라 raster-scan 순서를 기준으로 유도될 수 있다. 타일의 인덱스 값은 raster-scan 순서를 기준으로 유도되는 경우 이외에도, 특정의 규칙에 따라 유도될 수도 있다. 이 특정의 규칙은 후술하도록 한다.

3) 픽처는 슬라이스로 분할될 수 있다. 픽처는 하나의 슬라이스에 다수 개의 타일이 포함되도록 분할되거나, 하나의 타일에 다수 개의 슬라이스가 포함되도록 분할될 수도 있다. 즉, 슬라이스 분할은 타일을 이용하여 이루어질 수 있다.

픽처가 총 6개의 슬라이스들로 분할된 일 예가 도 11 (b)에 나타나 있다. 슬라이스들 각각에 표시된 숫자는 슬라이스의 인덱스 값을 의미하며, 슬라이스의 인덱스 값은 슬라이스가 분할된 형태에 따라 raster-scan 순서를 기준으로 유도될 수 있다. 도 11 (b)의 0번 슬라이스가 도 11 (a)의 0번 타일과 1번 타일을 포함하고, 도 11 (b)의 1번 슬라이스와 2번 슬라이스가 도 11 (a)의 2번 타일에 포함되며, 도 11 (b)의 3번 슬라이스와 5번 슬라이스가 도 11 (a)의 3번 타일에 포함되고, 도 11 (b)의 4번 슬라이스가 도 11 (a)의 4번 타일과 5번 타일을 포함하도록 슬라이스 분할이 이루어질 수 있다.

슬라이스의 인덱스 값은 raster-scan 순서를 기준으로 유도되는 경우 이외에도, 특정의 규칙에 따라 유도될 수도 있다. 이 특정의 규칙은 후술하도록 한다. 도 11 (b)의 총 6개의 슬라이스들 각각은 도 11 (c)와 같이 비트스트림으로 패킹될 수 있다.

4) 픽처는 서브픽처로 분할될 수 있다. 서브픽처는 최소 1개의 슬라이스를 포함할 수 있다.

픽처가 총 5개의 서브픽처로 분할된 일 예가 도 12에 나타나 있다. 도 12 (a)는 서브픽처들에 인덱스 값(0 내지 3)이 할당된 일 예를 나타내며, 도 12 (b)는 서브픽처들에 id(identifier) 값(A 내지 D)이 할당된 일 예를 나타낸다.

서브픽처의 인덱스 값은 서브픽처가 분할된 형태에 따라 raster-scan 순서를 기준으로 유도될 수 있다. 도 12 (a)의 0번 서브픽처가 도 11 (b)의 0번 슬라이스를 포함하고, 도 12 (a)의 1번 서브픽처가 도 11 (b)의 1번 슬라이스와 2번 슬라이스를 포함하도록, 픽처가 서브픽처로 분할될 수 있다.

서브픽처의 id 값과 서브픽처의 인덱스 값 사이의 구분을 위해, 서브픽처의 id는 픽처 내 서브픽처의 인덱스 값이 가질 수 있는 수보다 큰 값을 가질 수 있다. 예를 들어, 도 12 (a)의 인덱스 값이 0 내지 3으로 할당된 경우, 서브픽처의 id 값(도 12 (b)의 A 내지 D)는 3을 초과하는 값으로 설정될 수 있다.

이상에서 설명된 픽처의 분할 방법에 따르면, 타일, 슬라이스 및, 서브픽처의 크기는 모두 CTU의 배수 관계에 있음을 알 수 있다.

실시예 1

실시예 1은 SPS에서 정의되는 신택스들을 이용하여 픽처를 서브픽처로 분할하는 방법이다. 실시예 1에서는 서브픽처 분할에 대한 신택스 구조 및 시멘틱스가 제안된다.

실시예 1-1

영상 부호화 장치는 픽처에 서브픽처가 존재하는지 여부(픽처가 서브픽처로 분할되는지 여부)를 판단하고, 그 결과에 대한 정보인 서브픽처 플래그(subpic_present_flag 또는 subpic_info_present_flag)를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 subpic_info_present_flag를 복호화하고(S1310), subpic_info_present_flag 값에 기초하여 서브픽처가 존재하는지 여부를 판단할 수 있다(S1320).

subpic_info_present_flag는 픽처 내에 서브픽처가 존재하는지 여부 또는, 서브픽처 파라미터들이 존재하는지 여부 또는, 서브픽처 분할이 수행되는지 여부를 나타낼 수 있다. subpic_info_present_flag=0은 서브픽처가 존재하지 않음을 지시하며, subpic_info_present_flag=1은 서브픽처가 존재함을 지시한다. 서브픽처 플래그는 subpics_present_flag일 수도 있다.

영상 부호화 장치는 서브픽처가 존재하는 경우에, 서브픽처의 개수에 대한 정보(num_subpics_in_pic_minus1, 서브픽처의 개수정보)를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 num_subpics_in_pic_minus1를 복호화하고(S1330), num_subpics_in_pic_minus1에 기초하여 서브픽처의 개수를 파악할 수 있다.

num_subpics_in_pic_minus1는 픽처에 존재하는 서브픽처의 개수에서 1을 제외한 값을 나타내는 신택스이다. num_subpics_in_pic_minus1이 존재하지 않는 경우, 해당 신택스의 값은 0으로 추론될 수 있다. num_subpics_in_pic_minus1는 num_subpics_minus1로도 구현될 수 있다.

하나의 픽처에 최소 2개의 서브픽처가 존재할 수 있으므로, 서브픽처의 개수는 픽처에 존재하는 서브픽처의 개수에서 2를 제외한 값(num_subpics_in_pic_minus2)으로도 구현될 수 있다.

영상 부호화 장치는 서브픽처의 위치 및 크기를 나타내는 정보(서브픽처의 위치정보 및 크기정보)를 서브픽처의 개수만큼 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 서브픽처의 위치 및 크기를 나타내는 정보를 서브픽처의 개수만큼 복호화하고(S1340), 해당 정보를 이용하여 서브픽처들 각각의 위치와 크기를 파악할 수 있다.

서브픽처의 위치정보는 topleft_ctu_idx와 같이 한 서브픽처 내 최좌상단에 위치한 CTU의 인덱스 값으로 구현되거나, subpic_ctu_top_left_x 및 subpic_ctu_top_left_y와 같이 최좌상단에 위치한 CTU의 가로축 방향(horizontal) 위치 및 세로축 방향(vertical) 위치를 나타내는 값으로 구현될 수 있다.

서브픽처의 크기정보는 subpic_width 및 subpic_height와 같이 최좌상단 CTU를 기준으로 서브픽처의 너비와 높이를 나타내는 값(즉, 해당 서브픽처가 가로축 방향 및 세로축 방향으로 포함하는 CTU의 개수)으로 구현되거나, subpic_width_minus1, subpic_height_minus1와 같이 1을 제외한 값으로 구현될 수도 있다. 또한, 서브픽처의 크기정보는 해당 서브픽처 내 최우하단에 위치한 CTU의 인덱스 값(bottomright_ctu_idx)으로도 구현될 수 있다.

영상 복호화 장치는 복호화된 신택스들(서브픽처의 개수정보, 서브픽처의 위치정보 및, 서브픽처의 크기정보)을 이용하여 픽처를 서브픽처로 분할할 수 있다.

한편, 서브픽처의 맵핑정보가 SPS에서 정의되어 시그널링될 수 있다.

맵핑은 서브픽처와 슬라이스 간을 연결하는 것을 의미할 수 있다. 맵핑정보는 서브픽처와 슬라이스 간을 연결하기 위한 정보로서, 맵핑정보에는 서브픽처의 id(subpic_id)가 포함되거나, 서브픽처의 id와 이 id의 길이정보(subpic_id_lens_minus1)가 포함될 수도 있다. 맵핑정보는 서브픽처의 구성정보 등으로 달리 지칭될 수 있다.

영상 부호화 장치는 맵핑(mapping)정보를 부호화하여 시그널링할 수 있으며, 영상 복호화 장치는 맵핑정보를 비트스트림으로부터 복호화할 수 있다(S1370). 맵핑부(930)는 맵핑정보를 이용하여 서브픽처와 슬라이스 간을 맵핑할 수 있다.

실시형태에 따라, 맵핑은 서브픽처의 id 맵핑이 수행되는지 여부를 나타내는 맵핑 플래그에 따라 그 수행 여부가 결정될 수 있다.

이 실시형태에 경우, 영상 부호화 장치는 맵핑 플래그를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 맵핑 플래그를 복호화하고(S1350), 복호화된 맵핑 플래그를 이용하여 id 맵핑이 수행되는지 여부를 파악할 수 있다(S1360).

맵핑 플래그는 서브픽처의 id가 시그널링되는지 여부를 나타내는 signalled_subpic_id_flag로 구현되거나, 서브픽처의 맵핑이 허용되는지 여부를 지시하는 subpic_mapping_enabled_flag로 구현될 수도 있다. 또한, 맵핑 플래그는 id 맵핑이 SPS에서 수행되는지 여부를 지시하는 sps_subpic_id_present_flag 및 맵핑정보가 SPS에서 시그널링되는지 여부를 지시하는 sps_subpic_id_signalling_present_flag를 포함하는 형태로 구현될 수도 있다.

영상 부호화 장치는 맵핑 플래그가 맵핑이 수행됨을 지시하는 경우에 서브픽처 id(subpic_id)를 서브픽처의 개수만큼(subpic_id[i]) 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 맵핑 플래그가 맵핑이 수행됨을 지시하는 경우에 서브픽처 id(subpic_id)를 서브픽처의 개수만큼(subpic_id[i]) 복호화하고(S1370), 서브픽처와 슬라이스 간을 맵핑할 수 있다.

실시예 1-1에 대한 신택스 구조가 표 5에 나타나 있다. 표 5의 for loop들은 raster-scan 순으로 수행될 수 있다.

표 5의 subpic_treated_as_pic_flag는 서브픽처의 경계를 픽처 경계처럼 취급할지 여부를 지시하는 신택스이다. 예를 들어, subpic_treated_as_pic_flag는 인터 예측 시에 서브픽처의 경계를 픽처의 경계처럼 취급하도록 지시할 수 있다(경계선 픽셀 값의 패딩(padding)). 표 5의 loop_filter_across_subpic_enabled_flag는 서브픽처들 간의 경계에 인-루프 필터를 적용할지 여부를 지시하는 신택스이다.

영상 부호화 장치는 subpic_treated_as_pic_flag와 loop_filter_across_subpic_enabled_flag를 서브픽처의 개수만큼 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 subpic_treated_as_pic_flag와 loop_filter_across_subpic_enabled_flag를 서브픽처의 개수만큼 복호화하고, subpic_treated_as_pic_flag와 loop_filter_across_subpic_enabled_flag를 이용하여 서브픽처의 경계를 픽처의 경계처럼 취급할지 여부와 서브픽처들 간의 경계에 인-루프 필터의 적용 여부를 결정할 수 있다.

도 12 (b)에 나타낸 서브픽처 분할 예시에 실시예 1-1을 적용하면 아래와 같다.

subpic_info_present_flag = true(1), num_subpics_in_pic_minus1 = 3 (num_subpics_in_pic_minus2 = 2), signalled_subpic_id_flag = true(1), subpic_id = {A, B, C, D}(raster-scan order).

실시예 1-2

실시예 1-2는 서브픽처 id가 맵핑 플래그(예: signalled_subpic_id_flag)와 무관하게 시그널링되는 방법이다.

실시예 1-2에서는 S1350 과정 및 S1360 과정 이외의 다른 과정들이 실시예 1-1에서와 동일하게 수행될 수 있다.

구체적으로, 영상 부호화 장치는 맵핑 플래그를 시그널링하지 않고 서브픽처 id를 시그널링할 수 있다. 영상 복호화 장치는 맵핑 플래그를 복호화하지 않고(S1350 과정 및 S1360 과정 제외), 서브픽처 id를 복호화할 수 있다(S1370).

실시예 1-2에 대한 신택스 구조가 표 6에 나타나 있다. 표 6의 for loop들은 raster-scan 순으로 수행될 수 있다.

실시예 1-3

실시예 1-3은 서브픽처 id가 맵핑 플래그와 무관하게 시그널링되며, 서브픽처의 위치정보 및 크기정보와 함께 시그널링되는 방법이다.

실시예 1-3에서는, 실시예 1-1의 과정들 중에서 S1350 과정 및 S1360 과정이 제외되며, S1340 과정과 S1370 과정이 함께 수행될 수 있다.

구체적으로, 영상 부호화 장치는 서브픽처의 개수정보를 부호화하여 시그널링한 후에, 서브픽처의 id를 서브픽처의 위치정보 및 크기정보와 함께 시그널링할 수 있다. 영상 복호화 장치는 서브픽처의 개수정보를 복호화한 후에(S1330), 서브픽처의 id를 서브픽처의 위치정보 및 크기정보와 함께 복호화할 수 있다(S1340 및 S1370).

실시예 1-3에 대한 신택스 구조가 표 7에 나타나 있다. 표 7의 for loop들은 raster-scan 순으로 수행될 수 있다.

실시예 1-4

실시예 1-4는 서브픽처 id의 길이정보를 서브픽처 id와 함께 시그널링하는 방법이다.

서브픽처 id의 길이정보는 서브픽처 id를 표현하기 위해 이용되는 비트 수를 지시하는 정보로서, signalled_subpic_id_length_minus1 또는 subpic_id_len_minus1와 같은 형태로 구현될 수 있다. 서브픽처 id는 서브픽처 id의 길이정보가 지시하는 비트 수만큼 표현될 수 있다.

영상 부호화 장치는 맵핑 플래그가 id 맵핑이 수행됨을 지시하는 경우에 서브픽처 id의 길이정보와 서브픽처 id를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 맵핑 플래그가 id 맵핑이 수행됨을 지시하는 경우에(S1360), 서브픽처 id의 길이정보와 서브픽처 id를 복호화할 수 있다(S1370).

실시예 1-4에 대한 신택스 구조가 표 8에 나타나 있다. 표 8의 for loop들은 raster-scan 순으로 수행될 수 있다.

실시예 1-5

실시예 1-5는 SPS에서 맵핑정보의 시그널링이 수행되지 않는 방법이다.

따라서, 실시예 1-5에서는 실시예 1-1의 과정들 중에서 맵핑정보의 시그널링과 관련된 과정들인 S1350 과정, S1360 과정 및 S1370 과정이 제외될 수 있다.

실시예 1-5에 대한 신택스 구조가 표 9에 나타나 있다. 표 9의 for loop들은 raster-scan 순으로 수행될 수 있다.

실시예 2

실시예 2는 픽처를 타일로 분할하는 방법이다. 실시예 2에서는 타일 분할에 대한 신택스 구조 및 시멘틱스가 제안된다. 타일 분할에 대한 신택스들은 PPS 또는 픽처 헤더(picture-level header) 위치에서 정의될 수 있다.

영상 부호화 장치는 픽처에 분할이 적용되었는지 여부를 판단하고, 그 판단 결과를 분할 허용정보(분할 플래그)로 하여 시그널링할 수 있다. 영상 복호화 장치는 분할 허용정보를 복호화하고(S1410, S1430), 분할이 적용되는지 여부를 판단할 수 있다(S1420, S1440).

분할 허용정보는 픽처에 분할이 적용되는지 여부를 지시하는 정보로서, single_tile_in_pic_flag로 구현될 수 있다. 예를 들어, single_tile_in_pic_flag=1은 픽처가 타일로 분할되지 않음을 나타내며, single_tile_in_pic_flag=0은 픽처가 다수 개의 타일로 분할됨을 나타낼 수 있다.

분할 허용정보는 no_partition_flag와 single_tile_in_pic_flag의 결합으로 구현될 수도 있다. no_partition_flag=1은 픽처에 어떠한 분할도 적용되지 않음을 나타내며, no_partition_flag=0은 픽처에 분할이 적용됨을 나타낼 수 있다. 이 경우, single_tile_in_pic_flag=1은 픽처가 하나의 타일로 분할되었음을 나타내며, single_tile_in_pic_flag=0은 픽처가 다수 개의 타일로 분할되었음을 나타낼 수 있다.

분할 허용정보는 no_partition_flag와 single_tile_in_pic_flag이 결합된 하나의 신택스(no_pic_partition_flag)로도 구현될 수 있다. 이 경우, no_pic_partition_flag=1은 픽처에 어떠한 분할도 적용되지 않음을 나타내며, no_pic_partition_flag=0은 픽처가 다수 개의 타일로 분할됨을 나타낼 수 있다.

영상 부호화 장치는 분할 허용정보가 분할이 적용됨을 나타내는 경우에 픽처로부터 분할된 타일의 개수를 파악하고, 타일의 개수에 대한 정보(타일의 개수정보)를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 분할 허용정보가 분할이 적용됨을 나타내는 경우에 타일의 개수정보를 복호화하고(S1450), 복호화된 타일의 개수정보를 이용하여 타일의 개수를 설정할 수 있다.

타일의 개수정보는 세로축 방향으로 분할된 타일의 개수(타일 열의 개수)와, 가로축 방향으로 분할된 타일의 개수(타일 행의 개수)를 포함할 수 있다. 타일 열의 개수는 실제 분할된 타일 열의 개수에서 1을 제외한 값으로 표현될 수 있다(num_tile_colums_minus1 또는 num_exp_tile_columns_minus1). 타일 행의 개수는 실제 분할된 타일 행의 개수에서 1을 제외한 값으로 표현될 수 있다(num_tile_rows_minus1 또는 num_exp_tile_rows_minus1).

영상 부호화 장치는 타일 열들 각각과 타일 행들 각각의 크기를 파악하고, 타일 열과 타일 행의 크기에 대한 정보(타일의 크기정보)를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 타일의 크기정보를 복호화하고(S1460). 복호화된 타일의 크기정보를 이용하여 타일 열 과 타일 행의 크기를 설정할 수 있다.

타일 열의 크기정보는 해당 타일 열 내 최좌상단에 위치하는 CTU를 기준으로 해당 타일 열의 너비 값(CTU의 개수)으로 표현될 수 있다(tile_column_width_minus1). 타일 행의 크기정보는 해당 타일 행 내 최좌상단에 위치하는 CTU를 기준으로 해당 타일 행의 높이 값(CTU의 개수)으로 표현될 수 있다(tile_row_height_minus1).

마지막 타일 열의 너비는 별도로 정의하지 않아도 유추 가능하므로, 타일 열의 크기정보는 타일 열의 개수에서 1을 제외한 개수만큼 시그널링될 수 있다. 마지막 타일 행의 높이는 별도로 정의하지 않아도 유추 가능하므로, 타일 행의 크기정보는 타일 행의 개수에서 1을 제외한 개수만큼 시그널링될 수 있다.

실시예 2-1

실시예 2-1은 분할 허용정보가 single_tile_in_pic_flag로 구현되는 방법이다.

영상 부호화 장치는 single_tile_in_pic_flag를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 single_tile_in_pic_flag=1인 경우에(S1440) 타일 분할이 적용되지 않으므로 S1450 과정과 S1460 과정을 수행하지 않을 수 있다. 이와 달리, 영상 복호화 장치는 single_tile_in_pic_flag=0인 경우에(S1440) 다수 개의 타일 분할이 적용되었으므로, S1450 과정과 S1460 과정을 수행하여 픽처를 타일로 분할할 수 있다.

실시예 2-1에 대한 신택스 구조의 일 예가 표 10에 나타나 있다. 표 10의 for loop들은 raster-scan 순으로 수행될 수 있다.

실시예 2-2

실시예 2-2는 분할 허용정보가 no_partition_flag와 single_tile_in_pic_flag로 구현되는 방법이다.

영상 부호화 장치는 no_partition_flag를 부호화하여 시그널링하고, no_partition_flag=0인 경우에 single_tile_in_pic_flag를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 no_partition_flag를 복호화하고(S1410), 픽처에 분할이 적용되었는지 여부를 판단할 수 있다(S1420).

영상 복호화 장치는 no_partition_flag=1인 경우에(S1420) 타일 분할이 적용되지 않으므로 이 후의 과정들을 수행하지 않을 수 있다. 이와 달리, 영상 복호화 장치는 no_partition_flag=0인 경우에(S1420) single_tile_in_pic_flag를 복호화하고(S1430), single_tile_in_pic_flag의 값을 판단할 수 있다(S1440).

영상 복호화 장치는 single_tile_in_pic_flag=1인 경우에(S1440) 픽처가 하나의 타일로 분할되었으므로 S1450 과정과 S1460 과정을 수행하지 않을 수 있다. 이와 달리, 영상 복호화 장치는 single_tile_in_pic_flag=0인 경우에(S1440) 다수 개의 타일 분할이 적용되었으므로, S1450 과정과 S1460 과정을 수행하여 픽처를 다수 개의 타일로 분할할 수 있다.

실시예 2-2에 대한 신택스 구조의 일 예가 표 11에 나타나 있다. 표 11의 for loop들은 raster-scan 순으로 수행될 수 있다.

표 11의 예에서, no_partition_flag=1인 경우에 타일 분할이 적용되지 않으므로 해당 픽처에 대한 직사각형 슬라이스 분할 또는 구성이 불가능하다. 다만, CTU 단위 raster-scan 슬라이스 분할 또는 구성은 가능하다. single_tile_in_pic_flag=1인 경우에, 픽처가 하나의 타일로 분할되므로, 해당 하나의 타일을 이용하여 1개 이상의 슬라이스를 구성하는 것이 가능하다. 이와 달리, single_tile_in_pic_flag=0인 경우에, 픽처가 다수 개의 타일로 분할되므로, 다수 개의 타일들을 이용하여 직사각형 슬라이스의 구성이 가능하다. 이 경우, 타일 단위 raster-scan 슬라이스의 구성도 가능하다.

도 11 (a)에 나타낸 타일 분할 예시에 대한 실시예 2-1의 신택스는 아래와 같다.

single_tile_in_pic_flag = false(0), num_tile_colums_minus1 = 2 및, num_tile_rows_minus1 = 1

실시예 3

실시예 3은 타일을 이용하여 슬라이스를 분할하는 방법이다. 실시예 3을 통해 분할되는 슬라이스의 타입은 직사각형 슬라이스이다. 실시예 3에서는 슬라이스 분할 방법에 대한 신택스 및 시멘틱스가 제안된다. 슬라이스 분할에 대한 신택스들은 PPS 또는 픽처 헤더 위치에서 정의될 수 있다.

실시예 3-1

영상 부호화 장치는 픽처로부터 분할된 슬라이스의 타입을 판단하고, 그 결과를 타입 플래그(rect_slice_flag)로 하여 시그널링할 수 있다. 영상 복호화 장치는 타입 플래그를 복호화하고(S1530), 타입 플래그를 이용하여 슬라이스의 타입을 판단할 수 있다(S1540).

타입 플래그는 슬라이스의 타입이 직사각형 슬라이스인지 여부를 지시할 수 있다. rect_slice_flag=0은 raster-scan 슬라이스를 지시하고, rect_slice_flag=1은 직사각형 슬라이스를 지시할 수 있다.

서브픽처가 존재하는 경우에(subpic_info_present_flag=1), rect_slice_flag는 시그널링되지 않고 “1”로 유도될 수 있다. 즉, 서브픽처 분할은 슬라이스가 직사각형 슬라이스인 경우에 수행될 수 있다. rect_slice_flag가 존재하지 않고 subpic_info_present_flag=1이라면 rect_slice_flag=1로 유도되며, rect_slice_flag가 존재하지 않고 subpic_info_present_flag=0이라면 rect_slice_flag=0으로 유도될 수 있다.

영상 부호화 장치는 직사각형 슬라이스인 경우에 타일과 슬라이스 사이의 관계를 나타내는 관계 플래그(single_tile_per_slice_flag)를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 직사각형 슬라이스인 경우에 single_tile_per_slice_flag를 복호화하고(S1550), single_tile_per_slice_flag를 이용하여 타일과 슬라이스 사이의 관계를 판단할 수 있다(S1560).

single_tile_per_slice_flag=1은 타일과 슬라이스가 1 대 1의 관계에 있음을 나타내므로, 추가적인 슬라이스 분할정보가 시그널링되지 않고, 타일의 분할정보가 슬라이스의 분할정보로 이용될 수 있다. 이 경우, 영상 복호화 장치는 타일의 분할정보를 이용하여 픽처를 하나 이상의 슬라이스로 분할할 수 있다.

single_tile_per_slice_flag=0은 하나의 슬라이스가 다수 개의 타일을 포함하거나 다수 개의 슬라이스들이 하나의 타일에 포함되는 관계를 나타내므로, 추가적인 슬라이스 분할정보가 시그널링된다.

영상 부호화 장치는 픽처 내 슬라이스의 개수정보(num_slices_in_pic_minus1)와 다수 개의 슬라이스들이 하나의 타일을 구성하는지 여부에 대한 정보(more_than_one_slice_in_tile_flag[i])를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 num_slices_in_pic_minus1를 복호화한 후에(S1570), more_than_one_slice_in_tile_flag[i]를 슬라이스의 개수만큼 복호화할 수 있다(S1580).

more_than_one_slice_in_tile_flag=1은 다수 개의 슬라이스들이 하나의 타일을 구성함을 나타내며, more_than_one_slice_in_tile_flag=0은 하나의 슬라이스가 1개 이상의 타일로 구성됨을 나타낼 수 있다.

more_than_one_slice_in_tile_flag=1인 경우에 해당 타일에는 다수 개의 슬라이스들이 포함되므로, 이 타일에 포함된 슬라이스들의 개수정보(num_slices_in_tile_minus1)와 이 타일에 포함된 슬라이스들의 크기정보(slice_height_in_ctus_minus1)가 시그널링될 수 있다.

num_slices_in_tile_minus1는 해당 타일에 포함된 슬라이스들의 개수에서 1을 제외한 값을 나타낸다. 하나의 타일에는 최소 2개의 슬라이스가 존재할 수 있으므로, num_slices_in_tile_minus1은 num_slices_in_tile_minus2로 변경될 수 있다. slice_height_in_ctus_minus1은 해당 타일에 포함된 슬라이스들 각각의 높이 값(CTU의 개수)에서 1을 제외한 값을 나타낸다. 여기서, 마지막 슬라이스의 높이 값은 유추될 수 있다.

영상 복호화 장치는 슬라이스의 개수정보(num_slices_in_tile_minus1)를 복호화한 후에(S1592), 슬라이스들의 크기정보(slice_height_in_ctus_minus1)를 슬라이스의 개수만큼 복호화할 수 있다(S1594).

more_than_one_slice_in_tile_flag=0인 경우에는 하나의 슬라이스에 한 개 이상의 타일이 포함될 수 있다. 이 경우, 영상 부호화 장치는 해당 슬라이스의 크기를 해당 슬라이스에 포함된 타일의 개수를 기준으로 표현하는 크기정보(슬라이스의 크기정보)를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 타일의 개수를 기준으로 표현된 슬라이스의 크기정보를 복호화할 수 있다(S1596).

타일의 개수를 기준으로 표현된 슬라이스의 크기정보는 slice_width_in_tiles_minus1[i] 및 slice_height_in_tiles_minus1[i]로 이루어질 수 있다. slice_width_in_tiles_minus1는 해당 슬라이스에 속하는 타일 열의 개수정보(타일 열의 개수에서 1을 제외한 값)를 나타낸다. slice_height_in_tiles_minus1는 해당 슬라이스에 속하는 타일 행의 개수정보(타일 행의 개수에서 1을 제외한 값)를 나타낸다.

실시예 3-1에 대한 신택스 구조의 일 예가 표 12에 나타나 있다. 표 12의 for loop들은 raster-scan 순으로 수행될 수 있다.

실시예 3-2

실시예 3-2는 분할 허용정보(분할 플래그, no_partition_flag)를 더 이용하여 슬라이스를 분할하는 방법이다. 여기서, 분할 허용정보는 픽처가 다수 개의 슬라이스로 분할되는지 여부를 지시하는 정보로서, no_partition_flag=1은 픽처가 슬라이스로 분할되지 않음을 나타내고, no_partition_flag=0은 픽처가 다수 개의 슬라이스들로 분할됨을 나타낸다.

영상 부호화 장치는 픽처가 슬라이스로 분할되었는지 여부(다수 개의 슬라이스들로 분할되었는지 여부)를 판단하고, 그 결과를 분할 허용정보의 값으로 설정하여 시그널링할 수 있다. 영상 복호화 장치는 분할 허용정보를 복호화하고(S1510), 분할 허용정보를 이용하여 슬라이스의 분할 여부를 판단할 수 있다(S1520).

no_partition_flag=0인 경우에는 픽처가 슬라이스로 분할되므로, 슬라이스 분할을 위한 과정들(S1530 내지 S1596)이 수행될 수 있다. 이와 달리, no_partition_flag=1인 경우에는 픽처가 슬라이스로 분할되지 않으므로, S1530 과정 내지 S1596 과정들이 수행되지 않을 수 있다. 즉, 슬라이스 분할이 수행되지 않을 수 있다.

실시예 3-2에 대한 신택스 구조의 일 예가 표 13에 나타나 있다. 표 13의 for loop들은 raster-scan 순으로 수행될 수 있다.

도 11 (b)에 나타낸 슬라이스 분할 예시에 대한 실시예 3-1의 신택스는 아래와 같다.

rect_slice_flag = true(1), single_tile_per_slice_flag = false(0), num_slices_in_pic_minus1 = 5

{more_than_one_slice_in_tile_flag = 0, slice_width_in_tiles_minus1 = 1, slice_height_in_tiles_minus1 = 0}

{more_than_one_slice_in_tile_flag = 1, num_slices_in_tile_minus1= 1(num_slices_in_tile_minus2= 0), slice_height_in_ctus_minus1 = ctu 개수}

{more_than_one_slice_in_tile_flag=0, slice_width_in_tiles_minus1=1, slice_height_in_tiles_minus1=0}

이상에서 설명된 슬라이스 분할 방법에 따라 슬라이스를 구성하면서 슬라이스의 인덱스를 할당 또는 유도한 결과가 도 16에 나타나 있다.

도 16의 슬라이스 인덱스 유도 결과와 도 11 (b)의 슬라이스 인덱스 유도 결과(raster-scan 순서)가 서로 다름을 알 수 있다. 구체적으로, 도 11 (b)의 4번 인덱스 슬라이스는 도 16에서 5번 인덱스로 유도되었고, 도 11 (b)의 5번 인덱스 슬라이스는 도 16에서 4번 인덱스로 유도되었다.

도 16의 슬라이스 인덱스 유도 결과는 앞에서 언급된 특정의 규칙에 따른 결과이고, 여기서 특정의 규칙은 실시예 3의 슬라이스 분할 방법을 의미할 수 있다.

실시예 4

실시예 4는 서브픽처의 맵핑정보를 시그널링하는 방법이다. 실시예 4에서는 맵핑정보를 시그널링하는 방법에 대한 신택스 및 시멘틱스가 제안된다.

맵핑정보를 시그널링하는 경우는 크게 두 가지 경우로 구분될 수 있다. 첫 번째는 컨텐츠의 처음부터 끝까지 서브픽처의 구성이 변하지 않는 경우이며, 두 번째는 컨텐츠의 중간에 서브픽처의 구성이 변하는 경우이다.

서브픽처의 구성이 변하지 않는 경우에는, SPS에서 서브픽처의 맵핑정보가 시그널링될 수 있다. 예를 들어, SPS에서 서브픽처의 위치와 크기가 시그널링되는 경우에 서브픽처의 맵핑정보도 함께 시그널링될 수 있다(실시예 1).

서브픽처의 구성이 변하는 경우와 변하지 않는 경우 모두에서는 픽처 헤더 또는 PPS에서 서브픽처의 맵핑정보가 시그널링될 수 있다. 즉, SPS에서는 서브픽처의 위치정보와 크기정보가 시그널링되며, 픽처 헤더, PPS, 슬라이스 헤더 및, SEI 중 하나 이상에서는 서브픽처의 맵핑정보가 시그널링될 수 있다.

맵핑정보가 SPS에서 시그널링되는 예는 실시예 1에서 설명하였으므로, 이하에서는 맵핑정보가 PPS에서 시그널링되는 예에 대해 설명하도록 한다.

영상 부호화 장치는 맵핑정보(subpic_id)가 존재하는지 여부(또는, subpic_id가 시그널링되는지 여부)를 기준으로 맵핑 플래그의 값을 설정하고, 맵핑 플래그를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 맵핑 플래그를 복호화하고(S1730), 복호화된 맵핑 플래그를 이용하여 subpic_id가 존재하는지 여부(또는, subpic_id가 시그널링되는지 여부)를 판단할 수 있다(S1740).

앞서 설명된 바와 같이, 맵핑 플래그는 서브픽처의 id가 시그널링되는지 여부를 나타내는 signalled_subpic_id_flag로 구현되거나, 서브픽처의 맵핑이 허용되는지 여부를 지시하는 subpic_mapping_enabled_flag로 구현될 수도 있다. subpic_mapping_enabled_flag=0은 SPS에서 정의한 맵핑정보를 사용함을 의미하며, subpic_mapping_enabled_flag=1은 PPS에서 정의한 맵핑정보를 사용함을 의미할 수 있다.

또한, 맵핑 플래그는 id 맵핑이 SPS에서 수행되는지 여부를 지시하는 sps_subpic_id_present_flag, 맵핑정보가 SPS에서 시그널링되는지 여부를 지시하는 sps_subpic_id_signalling_present_flag 및, PPS에서 맵핑정보가 시그널링되는지 여부를 지시하는 pps_subpic_id_signalling_present_flag를 포함하는 형태로 구현될 수 있다. 이 경우, sps_subpic_id_present_flag=1이고, sps_subpic_id_signalling_present_flag=0인 경우에 pps_subpic_id_signalling_present_flag가 시그널링될 수 있다.

영상 부호화 장치는 맵핑 플래그가 subpic_id의 존재함(맵핑이 적용됨)을 지시하는 경우에 subpic_id를 부호화하여 시그널링할 수 있다. 영상 복호화 장치는 맵핑 플래그가 subpic_id의 존재함을 지시하는 경우에 subpic_id를 복호화할 수 있다(S1760). subpic_id는 서브픽처의 개수 또는 슬라이스의 개수만큼 복호화될 수 있다.

실시형태에 따라, 맵핑정보에는 subpic_id 이외에 subpic_id의 길이정보(signalled_subpic_id_length_minus1 또는 subpic_id_len_minus1)가 더 포함될 수 있다.

길이정보는 맵핑 플래그가 맵핑정보의 존재함을 지시하는 경우에(S1740), 영상 부호화 장치로부터 시그널링되어 영상 복호화 장치에서 복호화될 수 있다(S1750).

실시형태에 따라, 맵핑정보를 시그널링하는 과정은 픽처에 서브픽처가 존재하는지 여부와 슬라이스 타입이 직사각형인지 여부에 따라 그 수행 여부가 결정될 수 있다.

영상 복호화 장치는 영상 부호화 장치로부터 시그널링된 subpic_info_present_flag 및 rect_slice_flag를 복호화하고(S1710), subpic_info_present_flag 및 rect_slice_flag를 이용하여 서브픽처가 존재하는지 여부와 직사각형 슬라이스인지 여부를 판단할 수 있다(S1720). 그 결과, 서브픽처가 존재하고 직사각형 슬라이스라면, 앞에서 설명된 맵핑정보 시그널링 과정(S1730 내지 S1760)이 수행되나, 서브픽처가 아니거나 직사각형 슬라이스가 아닌 경우에는 맵핑정보 시그널링 과정이 수행되지 않을 수 있다.

실시예 4에 대한 두 가지 신택스 구조들이 표 14 및 표 15에 나타나 있다. 표 14는 subpic_id가 서브픽처의 개수만큼 시그널링 및 복호화되는 예이며, 표 15는 subpic_id가 슬라이스의 개수만큼 시그널링 및 복호화되는 예이다.

복호화된 subpic_id는 서브픽처의 개수만큼 특정의 순서에 따라 나열되거나 슬라이스의 개수만큼 특정의 순서에 따라 나열될 수 있다. 여기서, 특정의 순서는 raster-scan 순서이거나 도 16을 통해 설명된 슬라이스 구성 순서일 수 있다.

표 14의 예를 기준으로, 도 11 (b)의 슬라이스와 도 12 (b)의 서브픽처 간을 맵핑하면, subpic_mapping_enabled_flag = true(1) 및 subpic_id = {A, B, C, D} (raster-scan 순서)이다. 표 15의 예를 기준으로, 도 11 (b)의 슬라이스와 도 12 (b)의 서브픽처 간을 맵핑하면, subpic_mapping_enabled_flag = true(1) 및 subpic_id = {A, B, B, C, D, C} (raster-scan 순서)이다.

표 14의 예를 기준으로, 도 16의 슬라이스와 도 12 (b)의 서브픽처 간을 맵핑하면, subpic_mapping_enabled_flag = true(1) 및 subpic_id = {A, B, C, D} (raster-scan 순서)이다. 표 15의 예를 기준으로, 도 16의 슬라이스와 도 12 (b)의 서브픽처 간을 맵핑하면, subpic_mapping_enabled_flag = true(1) 및 subpic_id = {A, B, B, C, C, D} (슬라이스 구성 순서)이다.

실시예 5

실시예 5에서는 슬라이스 헤더에서 정의되는 신택스 및 시멘틱스가 제안된다. 실시예 5에 대한 두 가지 신택스 구조가 표 16 및 표 17에 나타나 있다.

slice_pic_parameter_set_id는 해당 슬라이스가 참조하는 PPS의 id를 나타내며, slice_pic_header_id는 해당 슬라이스가 참조하는 픽처 헤더의 id를 나타낸다.

표 16에 나타난 바와 같이, 서브픽처의 id(subpic_id), 슬라이스의 어드레스 정보(slice_address) 및, 슬라이스의 타입(slice_type)이 영상 부호화 장치로부터 시그널링될 수 있다. 슬라이스 헤더에서 시그널링되는 subpic_id(또는, slice_subpic_id)와, SPS 또는 PPS에서 시그널링되는 subpic_id(sps_subpic_id 또는 pps_subpic_id)를 구분하기 위하여, SPS 또는 PPS에서 시그널링되는 subpic_id를 '제1맵핑정보'라고 지칭하며, 슬라이스 헤더에서 시그널링되는 subpic_id를 '제2맵핑정보'라고 지칭할 수 있다. 즉, 본 명세서에서 언급된 '맵핑정보'에는 제1맵핑정보와 제2맵핑정보가 포함될 수 있다.

슬라이스 헤더에서 시그널링되는 subpic_id는 해당 슬라이스가 속한 서브픽처의 id를 나타낸다. 서브픽처의 id는 서브픽처가 존재하는 경우에(subpic_info_present_flag=1, 분할 플래그가 분할됨을 지시하는 경우)에 시그널링되거나(표 16), 서브픽처가 존재하면서(subpic_info_present_flag=1) 해당 슬라이스의 타입이 직사각형 슬라이스인 경우에(rect_slice_flag=1) 시그널링될 수 있다(표 17).

슬라이스 헤더에서 시그널링되는 서브픽처의 id(제2맵핑정보)는 SPS 또는 PPS에서 서브픽처의 id(제1맵핑정보)가 시그널링되지 않은 경우에 서브픽처의 인덱스 값을 의미할 수 있다. 즉, SPS에서 서브픽처 플래그가 off이거나(예: signalled_subpic_id_flag=0), PPS에서 서브픽처 플래그가 off인 경우(예: subpic_mapping_enabled_flag=0)에는 SPS와 PPS에서 서브픽처의 id가 시그널링되지 않는데, 이와 같은 경우 슬라이스 헤더에서 시그널링되는 서브픽처의 id가 도 12 (a)와 같은 서브픽처의 인덱스 값에 해당할 수 있다.

이와 반대로, SPS 또는 PPS 등에서 서브픽처의 id가 시그널링되었다면, 슬라이스 헤더에서 시그널링되는 서브픽처의 id는 도 12 (b)와 같은 서브픽처의 id 값에 해당할 수 있다. 이 경우, 영상 복호화 장치는 SPS 또는 PPS로부터 시그널링된 서브픽처의 id와 슬라이스 헤더에서 시그널링되는 서브픽처의 id 간을 서로 맵핑할 수 있다.

한편, 표 16 및 표 17에 나타낸 바와 같이, 영상 부호화 장치는 슬라이스의 어드레스(address) 정보(slice_address)를 부호화하여 시그널링할 수 있으며, 설정부(940)는 어드레스 정보를 이용하여 슬라이스의 인덱스 값을 설정할 수 있다.

어드레스 정보는 해당 슬라이스의 주소를 나타낼 수 있다. 어드레스 정보는 서브픽처 플래그(subpic_info_present_flag), 타입 플래그(rect_slice_flag) 및/또는 분할 허용정보(예: no_partition_flag) 등의 값에 따라 서로 다른 의미를 가질 수 있다.

먼저, subpic_info_present_flag=1인 경우에(S1810), 어드레스 정보는 해당 슬라이스가 속한 서브픽처(A sub-picture) 내의 슬라이스의 인덱스 값일 수 있다(S1820). 예를 들어, 도 12 (b)와 같이, 서브픽처가 존재하는 경우에는 어드레스 정보가 해당 슬라이스가 속한 서브픽처에 대한 슬라이스 인덱스 값일 수 있다.

subpic_info_present_flag=0이면서(S1810) rect_slice_flag=1인 경우에(S1830), 어드레스 정보는 픽처 전체 내 슬라이스의 인덱스 값일 수 있다(S1840). 예를 들어, 도 11 (b) 또는 도 16과 같이, 서브픽처가 존재하지 않는 경우에는 어드레스 정보가 픽처 전체에 대한 슬라이스 인덱스 값일 수 있다.

subpic_info_present_flag=0이면 서브픽처의 개수정보(num_subpics_in_pic_minus1)가 시그널링되지 않고, 서브픽처의 개수정보가 존재하지 않으면 서브픽처의 개수는 1로 유도된다(num_subpics_in_pic_minus1=0). 결국, subpic_info_present_flag=0이면서(S1810) rect_slice_flag=1인 경우에(S1830), 어드레스 정보는 '서브픽처 전체 내 슬라이스의 인덱스 값'일 수 있다. 여기서, 서브픽처는 픽처 전체를 의미할 수 있다.

subpic_info_present_flag=0이면서(S1810) rect_slice_flag=0인 경우(S1830), 즉 raster-scan 슬라이스인 경우, 어드레스 정보는 타일의 인덱스 값 또는 CTU의 인덱스 값일 수 있다(S1860, S1870). raster-scan 순서로 타일의 부호화/복호화가 진행되다가 특정 위치에서 raster-scan 슬라이스의 영역이 구분되는 경우에는 어드레스 정보가 타일의 인덱스 값일 수 있으며(S1860), (타일의 분할 없이) raster-scan 순서로 CTU의 부호화/복호화가 진행되다가 특정 위치에서 raster-scan 슬라이스의 영역이 구분되는 경우에는 어드레스 정보가 CTU의 인덱스 값일 수 있다(S1870).

실시형태에 따라, 어드레스 정보가 타일의 인덱스 값과 CTU의 인덱스 값 중에서 어느 값에 해당하는지 여부가 분할 허용정보의 값에 따라 결정될 수도 있다.

예를 들어, 픽처가 1개 이상의 타일로 분할된 경우에는(S1850, no_partition_flag=0) 어드레스 정보가 타일의 인덱스 값일 수 있으며(S1860), 픽처가 분할되지 않은 경우에는(S1850, no_partition_flag=1) 어드레스 정보가 CTU의 인덱스 값일 수 있다(S1870).

본 발명에서 제안하는 방법들을 이용하여 분할된 서브픽처와 슬라이스 간의 관계 또는 형태가 도 19에 나타나 있다.

도 19 (a)에서, 총 6개의 직사각형들 각각은 슬라이스의 구성을 나타내며, 서브픽처들은 도 12 (b)의 분할 형태와 같이 총 4개로 구성되며, 서브픽처들 각각은 패턴으로 구분될 수 있다. 타일들은 도 11 (a)의 분할 형태와 같이 총 6개(3x2)로 구성된다.

슬라이스가 총 6개로 구성되므로, 도 19 (b)에 나타낸 바와 같이 슬라이스들 각각은 총 6개의 NAL 비트스트림으로 생성되고, 픽처는 4개의 서브픽처들로 나누어질 수 있다.

도 19 (b)의 예시를 위한 6개의 슬라이스 헤더의 신택스 값은 다음과 같다.

#1: ( subpic_id = A, slice_address = 0 )

#2: ( subpic_id = B, slice_address = 0 )

#3: ( subpic_id = B, slice_address = 1 )

#4: ( subpic_id = C, slice_address = 0 )

#5: ( subpic_id = C, slice_address = 1 )

#6: ( subpic_id = D, slice_address = 0 )

슬라이스 NAL, 픽처 헤더 NAL, PPS NAL, SPS NAL 사이의 연결 관계가 도 20에 나타나 있다.

영상 복호화 장치는 슬라이스 헤더의 pps_id 및 pic_header_id를 이용하여 슬라이스 헤더의 데이터와 PPS의 데이터 및 픽처 헤더의 데이터를 연결할 수 있다. 슬라이스 헤더에 sps_id가 포함되는 경우에는 슬라이스 헤더로부터 SPS로 직접 연결될 수 있다.

영상 복호화 장치는 SPS로부터 서브픽처의 맵핑정보(sub_picture mapping)를 획득하고, PPS로부터 타일의 분할정보(tile) 및 슬라이스의 구성정보(slice)를 획득하며, 픽처 헤더로부터 서브픽처의 맵핑정보(sub-pic mapping)를 획득할 수 있다.

수신단(영상 복호화 장치)은 컨텐츠를 합성하는 BEAMer 및 합성된 데이터를 복호화하는 복호화기로 구분될 수 있다. BEAMer는 다수 개의 컨텐츠를 추출 및 합성하는 과정을 통해, 다수 개의 컨텐츠를 하나의 컨텐츠로 합성하여 합성된 데이터를 구성할 수 있다. 합성된 데이터는 복호화기로 입력되는 입력 데이터에 해당한다.

이하에서는, 서브픽처의 다양한 구성 예들을 설명한다. 서브픽처의 다양한 구성 예들은 서브픽처의 구성을 변경하지 않는 경우와 서브픽처의 구성을 변경한 경우로 구분될 수 있다.

1) 서브픽처의 구성을 변경하지 않는 경우에 대한 일 예가 도 21 (c)에 나타나 있다.

도 19 (b)의 서브픽처 구성 형태, 도 11 (a)의 타일 분할 형태 및, 도 19 (a)의 슬라이스 구성 형태로부터 최종적으로 도 21 (a) 및 (b)로 나타낸 두 개의 컨텐츠들이 도출될 수 있다. 도 21 (a)의 컨텐츠와 도 21 (b)의 컨텐츠는 패턴의 방향으로 구분될 수 있다.

BEAMer는 두 개의 컨텐츠를 도 21 (c)와 같은 하나의 합성된 컨텐츠로 생성할 수 있다. BEAMer는 도 21 (a)의 컨텐츠와 도 21 (b)의 컨텐츠에 대한 모든 데이터를 수신한 후에, 수신된 모든 데이터로부터 아래와 같은 총 6개의 슬라이스 비트스트림을 추출하여 복호화기에 입력할 수 있다.

1) 도 21 (b) 컨텐츠의 A-0 슬라이스 비트스트림

2) 도 21 (a) 컨텐츠의 B-0 슬라이스 비트스트림

3) 도 21 (a) 컨텐츠의 B-1 슬라이스 비트스트림

4) 도 21 (a) 컨텐츠의 C-0 슬라이스 비트스트림

5) 도 21 (a) 컨텐츠의 C-1 슬라이스 비트스트림

6) 도 21 (b) 컨텐츠의 D-0 슬라이스 비트스트림

예를 들어, 도 21 (c)의 A 서브픽처와 D 서브픽처는 도 21 (b)의 컨텐츠로부터 추출되어 합성되며, 도 21 (c)의 B 서브픽처와 C 서브픽처는 도 21 (a)의 컨텐츠로부터 추출되어 합성될 수 있다.

슬라이스 비트스트림 이외에 SPS, PPS 등과 같은 헤더 정보도 복호화기에 같이 입력된다. 또한, 서브픽처의 맵핑정보를 알려주는 픽처 헤더도 복호화기에 같이 입력될 수 있다. 이 경우, 도 21 (c)의 예시를 위한 픽처 헤더의 신택스 값은 도 16 또는 도 11 (b)의 신택스 값과 동일할 수 있다.

2) 서브픽처의 구성을 변경하는 경우에 대한 일 예가 도 21 (d)에 나타나 있다. 도 21 (d)는 두 개의 컨텐츠를 병합하면서, 서브픽처의 구성도 변경된 경우이다.

BEAMer는 두 개의 컨텐츠를 도 21 (d)와 같은 하나의 합성된 컨텐츠로 생성할 수 있다. BEAMer는 도 21 (a)의 컨텐츠와 도 21 (b)의 컨텐츠에 대한 모든 데이터를 수신한 후에, 수신된 모든 데이터로부터 아래와 같은 총 6개의 슬라이스 비트스트림을 추출하여 복호화기에 입력할 수 있다.

1) 도 21 (b) 컨텐츠의 D-0 슬라이스 비트스트림

2) 도 21 (b) 컨텐츠의 C-0 슬라이스 비트스트림

3) 도 21 (b) 컨텐츠의 C-1 슬라이스 비트스트림

4) 도 21 (a) 컨텐츠의 B-0 슬라이스 비트스트림

5) 도 21 (a) 컨텐츠의 B-1 슬라이스 비트스트림

6) 도 21 (a) 컨텐츠의 A-0 슬라이스 비트스트림

예를 들어, 도 21 (d)의 D 서브픽처와 C 서브픽처는 도 21 (b)의 컨텐츠로부터 추출되어 합성되며, 도 21 (d)의 B 서브픽처와 A 서브픽처는 도 21 (a)의 컨텐츠로부터 추출되어 합성될 수 있다.

서브픽처의 구성을 변경하는 경우에는 변경된 서브픽처의 맵핑정보가 픽처 헤더에서 정의되어 시그널링되어야 한다. 예를 들어, 송신단(영상 부호화 장치)에서 픽처 헤더 정보를 생성하여 시그널링하거나, 수신단(영상 복호화 장치)에서 픽처 헤더 정보를 생성할 수도 있다.

서브픽처의 구성을 변경하는 경우에는 슬라이스 비트스트림 이외에 SPS, PPS 등과 같은 헤더 정보도 복호화기에 같이 입력된다. 또한, 서브픽처의 맵핑정보를 알려주는 픽처 헤더도 복호화기에 같이 입력될 수 있다. 이 경우, 도 21 (d)의 예시를 위한 픽처 헤더의 신택스 값은 아래와 같다.

표 14와 같이 서브픽처의 개수만큼 subpic_id가 시그널링되고, raster-scan 순서인 경우에는 subpic_mapping_enabled_flag = true(1) 및 subpic_id = {D, C, B, A}. 표 15와 같이 슬라이스의 개수만큼 subpic_id가 시그널링되고, raster-scan 순서인 경우에는 subpic_mapping_enabled_flag = true(1) 및 subpic_id = {D, C, C, B, A, B}. 표 15와 같이 슬라이스의 개수만큼 subpic_id가 시그널링되고, 슬라이스의 구성 순서인 경우에는 subpic_mapping_enabled_flag = true(1) 및 subpic_id = {D, C, C, B, B, A}.

이와 같이, 도 21 (d)를 통해, SPS, PPS, 슬라이스 헤더, 및/또는 슬라이스 데이터 정보에는 변화를 주지 않고도, 픽처 헤더에서 서브픽처의 구성을 쉽게 표현할 수 있음을 확인할 수 있다.

이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

CROSS-REFERENCE TO RELATED APPLICATION

본 특허출원은, 본 명세서에 그 전체가 참고로서 포함되는, 2019년 10월 7일에 한국에 출원한 특허출원번호 제10-2019-0123858호 및, 2020년 3월 17일에 한국에 출원한 특허출원번호 제10-2020-0032688호에 대해 우선권을 주장한다.

Claims

픽처를 분할하는 방법으로서,

비트스트림으로부터, 상기 픽처가 하나 이상의 하위 유닛으로 분할되는지 여부에 대한 분할 플래그를 복호화하는 단계;

상기 분할 플래그가 분할됨을 나타내는 경우에, 상기 비트스트림으로부터 분할정보를 복호화하는 단계; 및

상기 분할정보를 이용하여, 상기 픽처를 상기 하위 유닛으로 분할하는 단계를 포함하는, 픽처 분할 방법.
제1항에 있어서,

상기 분할 플래그는,

상기 픽처가 상기 하위 유닛에 해당하는 하나 이상의 서브픽처로 분할되는지 여부를 나타내며,

상기 분할정보는,

상기 서브픽처의 개수정보, 상기 서브픽처의 위치정보 및, 상기 서브픽처의 크기정보를 포함하는, 픽처 분할 방법.
제1항에 있어서,

상기 분할 플래그는,

상기 픽처가 상기 하위 유닛에 해당하는 다수 개의 타일로 분할되는지 여부를 나타내며,

상기 분할정보는,

상기 타일의 개수정보 및 상기 타일의 크기정보를 포함하는, 픽처 분할 방법.
제1항에 있어서,

상기 분할 플래그는,

상기 픽처가 상기 하위 유닛에 해당하는 다수 개의 슬라이스로 분할되는지 여부를 나타내며,

상기 분할 플래그를 복호화하는 단계는,

상기 분할 플래그가 분할됨을 나타내는 경우에, 상기 슬라이스의 타입을 나타내는 타입 플래그를 상기 비트스트림으로부터 더 복호화하고,

상기 분할정보를 복호화하는 단계는,

상기 분할 플래그가 분할됨을 나타내며 상기 타입 플래그가 직사각형 슬라이스를 나타내는 경우에, 상기 분할정보를 복호화하며,

상기 분할정보는,

상기 슬라이스의 개수정보 및 상기 슬라이스의 크기정보를 포함하는, 픽처 분할 방법.
제4항에 있어서,

상기 슬라이스의 크기정보는,

상기 슬라이스가 하나 이상의 타일을 포함하는 경우, 상기 슬라이스에 포함된 타일 열(column)의 개수정보와 상기 슬라이스에 포함된 타일 행(row)의 개수정보를 포함하는, 픽처 분할 방법.
제1항에 있어서,

상기 하위 유닛에 해당하는 하나 이상의 서브픽처와 상기 하위 유닛에 해당하는 하나 이상의 슬라이스 간을 맵핑(mapping)하기 위한 맵핑정보를, 상기 비트스트림으로부터 복호화하는 단계; 및

상기 맵핑정보를 이용하여, 상기 서브픽처와 상기 슬라이스 간을 맵핑하는 단계를 더 포함하는, 픽처 분할 방법.
제6항에 있어서,

상기 픽처에 맵핑이 적용되는지 여부를 나타내는 맵핑 플래그를 상기 비트스트림으로부터 복호화하는 단계를 더 포함하고,

상기 맵핑정보는,

상기 맵핑 플래그가 맵핑이 적용됨을 나타내는 경우에, 상기 비트스트림의 SPS 또는 PPS로부터 복호화되는 제1맵핑정보를 포함하는, 픽처 분할 방법.
제6항에 있어서,

상기 맵핑정보는,

상기 분할 플래그가 분할됨을 나타내는 경우에, 상기 비트스트림의 슬라이스 헤더로부터 복호화되는 제2맵핑정보를 포함하는, 픽처 분할 방법.
제1항에 있어서,

상기 하위 유닛에 해당하는 슬라이스의 어드레스(address) 정보를 상기 비트스트림의 슬라이스 헤더로부터 복호화하는 단계; 및

상기 어드레스 정보를 이용하여, 상기 슬라이스가 포함된 서브픽처 내에서 상기 슬라이스의 인덱스를 설정하는 단계를 더 포함하고,

상기 어드레스 정보는,

상기 비트스트림으로부터 복호화된 타입 플래그가 직사각형 슬라이스를 나타내는 경우에 상기 픽처 내에서의 상기 슬라이스의 인덱스를 나타내며, 상기 타입 플래그가 raster-scan 슬라이스를 나타내는 경우에 상기 픽처에 포함된 타일의 인덱스를 나타내는, 픽처 분할 방법.
영상 복호화 장치로서,

픽처가 하나 이상의 하위 유닛으로 분할되는지 여부에 대한 분할 플래그를 비트스트림으로부터 복호화하고, 상기 분할 플래그가 분할됨을 나타내는 경우에 상기 비트스트림으로부터 분할정보를 복호화하는 복호화 실행부; 및

상기 분할정보를 이용하여, 상기 픽처를 상기 하위 유닛으로 분할하는 분할부를 포함하는, 영상 복호화 장치.
제10항에 있어서,

상기 분할 플래그는,

상기 픽처가 상기 하위 유닛에 해당하는 하나 이상의 서브픽처로 분할되는지 여부를 나타내며,

상기 분할정보는,

상기 서브픽처의 개수정보, 상기 서브픽처의 위치정보 및, 상기 서브픽처의 크기정보를 포함하는, 영상 복호화 장치.
제10항에 있어서,

상기 분할 플래그는,

상기 픽처가 상기 하위 유닛에 해당하는 다수 개의 타일로 분할되는지 여부를 나타내며,

상기 분할정보는,

상기 타일의 개수정보 및 상기 타일의 크기정보를 포함하는, 영상 복호화 장치.
제10항에 있어서,

상기 분할 플래그는,

상기 픽처가 상기 하위 유닛에 해당하는 다수 개의 슬라이스로 분할되는지 여부를 나타내며,

상기 복호화 실행부는,

상기 분할 플래그가 분할됨을 나타내는 경우에 상기 슬라이스의 타입을 나타내는 타입 플래그를 상기 비트스트림으로부터 더 복호화하고, 상기 분할 플래그가 분할됨을 나타내며 상기 타입 플래그가 직사각형 슬라이스를 나타내는 경우에 상기 분할정보를 복호화하며,

상기 분할정보는,

상기 슬라이스의 개수정보 및 상기 슬라이스의 크기정보를 포함하는, 영상 복호화 장치.
제13항에 있어서,

상기 슬라이스의 크기정보는,

상기 슬라이스가 하나 이상의 타일을 포함하는 경우, 상기 슬라이스에 포함된 타일 열(column)의 개수정보와 상기 슬라이스에 포함된 타일 행(row)의 개수정보를 포함하는, 영상 복호화 장치.
제10항에 있어서,

상기 비트스트림으로부터 복호화된 맵핑(mapping)정보를 이용하여, 상기 하위 유닛에 해당하는 하나 이상의 서브픽처와 상기 하위 유닛에 해당하는 하나 이상의 슬라이스 간을 맵핑하는 맵핑부를 더 포함하는, 영상 복호화 장치.
제15항에 있어서,

상기 복호화 실행부는,

상기 픽처에 맵핑이 적용되는지 여부를 나타내는 맵핑 플래그를 상기 비트스트림으로부터 더 복호화하고,

상기 맵핑정보는,

상기 맵핑 플래그가 맵핑이 적용됨을 나타내는 경우에, 상기 비트스트림의 SPS 또는 PPS로부터 복호화되는 제1맵핑정보를 포함하는, 영상 복호화 장치.
제15항에 있어서,

상기 맵핑정보는,

상기 분할 플래그가 분할됨을 나타내는 경우에, 상기 비트스트림의 슬라이스 헤더로부터 복호화되는 제2맵핑정보를 포함하는, 영상 복호화 장치.
제10항에 있어서,

상기 비트스트림으로부터 복호화된 슬라이스의 어드레스(address) 정보를 이용하여, 상기 슬라이스가 포함된 서브픽처 내에서 상기 슬라이스의 인덱스를 설정하는 설정부를 더 포함하고,

상기 어드레스 정보는,

상기 비트스트림으로부터 복호화된 타입 플래그가 직사각형 슬라이스를 나타내는 경우에 상기 픽처 내에서의 상기 슬라이스의 인덱스를 나타내며, 상기 타입 플래그가 raster-scan 슬라이스를 나타내는 경우에 상기 픽처에 포함된 타일의 인덱스를 나타내는, 영상 복호화 장치.
영상 부호화 장치로서,

블록 분할부; 및

픽처가 하나 이상의 하위 유닛으로 분할되는지 여부에 대한 분할 플래그를 부호화하는 부호화부를 포함하고,

상기 부호화부는,

상기 분할 플래그가 분할됨을 나타내는 경우에, 분할정보를 부호화하는, 영상 부호화 장치.