WO2021060802A1

WO2021060802A1 - 픽처로부터 분할되는 하위 유닛들에 대한 정보를 획득하는 방법 및 장치

Info

Publication number: WO2021060802A1
Application number: PCT/KR2020/012769
Authority: WO
Inventors: 김재일; 이선영; 손세훈
Original assignee: 에스케이텔레콤 주식회사
Priority date: 2019-09-27
Filing date: 2020-09-22
Publication date: 2021-04-01
Also published as: CN114747213A; US20220345702A1

Abstract

픽처로부터 분할되는 하위 유닛들에 대한 정보를 획득하는 방법 및 장치를 개시한다. 본 발명의 일 실시예에 의하면, 픽처로부터 분할되는 하위 유닛들에 대한 정보를 획득하는 방법으로서, 비트스트림으로부터, 상기 픽처 내 코딩 트리 유닛(coding tree unit, CTU)들의 사이즈(size)를 나타내는 CTU 사이즈 정보를 복호화하는 단계; 상기 픽처 내 서브픽처들을 상기 CTU의 사이즈 단위로 표현하는 서브픽처 분할정보를 상기 비트스트림으로부터 복호화하는 단계; 상기 픽처 내 하나 이상의 타일들의 분할정보를 상기 비트스트림으로부터 복호화하는 단계; 및 상기 픽처 내 하나 이상의 슬라이스들의 분할정보를 상기 비트스트림으로부터 복호화하는 단계를 포함하는, 방법을 제공한다. 대표도: 도 4

Description

픽처로부터 분할되는 하위 유닛들에 대한 정보를 획득하는 방법 및 장치

본 발명은 동영상의 부호화 및 복호화에 관한 것으로서, 더욱 구체적으로는 다양한 하위 유닛들에 대한 정보를 효율적으로 획득함으로써 부호화 및 복호화의 효율을 향상시킨 방법 및 장치에 관한 것이다.

동영상 데이터는 음성 데이터나 정지 영상 데이터 등에 비하여 많은 데이터량을 가지기 때문에, 압축을 위한 처리 없이 그 자체를 저장하거나 전송하기 위해서는 메모리를 포함하여 많은 하드웨어 자원을 필요로 한다.

따라서, 통상적으로 동영상 데이터를 저장하거나 전송할 때에는 부호화기를 사용하여 동영상 데이터를 압축하여 저장하거나 전송하며, 복호화기에서는 압축된 동영상 데이터를 수신하여 압축을 해제하고 재생한다. 이러한 동영상 압축 기술로는 H.264/AVC를 비롯하여, H.264/AVC에 비해 약 40% 정도의 부호화 효율을 향상시킨 HEVC(High Efficiency Video Coding)가 존재한다.

그러나, 영상의 크기 및 해상도, 프레임율이 점차 증가하고 있고, 이에 따라 부호화해야 하는 데이터량도 증가하고 있으므로 기존의 압축 기술보다 더 부호화 효율이 좋고 화질 개선 효과도 높은 새로운 압축 기술이 요구된다.

이러한 요구에 부응하기 위해 본 발명은 개선된 동영상 부호화 및 복호화 기술을 제공하는 것을 목적으로 하며, 특히, 본 발명의 일 측면은 픽처를 하위 유닛들로 분할하는 다양한 방법을 통해 부호화 및 복호화의 효율을 향상시키는 기술과 관련된다.

본 발명의 일 측면은, 픽처로부터 분할되는 하위 유닛들에 대한 정보를 획득하는 방법으로서, 비트스트림으로부터, 상기 픽처 내 코딩 트리 유닛(coding tree unit, CTU)들의 사이즈(size)를 나타내는 CTU 사이즈 정보를 복호화하는 단계; 상기 픽처 내 서브픽처들을 상기 CTU의 사이즈 단위로 표현하는 서브픽처 분할정보를 상기 비트스트림으로부터 복호화하는 단계; 상기 픽처 내 하나 이상의 타일들의 분할정보를 상기 비트스트림으로부터 복호화하는 단계; 및 상기 픽처 내 하나 이상의 슬라이스들의 분할정보를 상기 비트스트림으로부터 복호화하는 단계를 포함하는, 방법을 제공한다.

본 발명의 다른 일 측면은, 영상 복호화 장치로서, 픽처로부터 분할되는 하위 유닛들에 대한 정보를 비트스트림으로부터 획득하는 복호화부; 및 상기 하위 유닛들에 대한 정보에 기초하여, 상기 픽처를 복원하는 픽처 복원부를 포함하고, 상기 복호화부는, 상기 픽처 내 코딩 트리 유닛(coding tree unit, CTU)들의 사이즈(size)를 나타내는 CTU 사이즈 정보를 상기 비트스트림으로부터 복호화하고, 상기 픽처 내 서브픽처들을 상기 CTU의 사이즈 단위로 표현하는 서브픽처 분할정보를 상기 비트스트림으로부터 복호화하며, 상기 픽처 내 하나 이상의 타일들의 분할정보를 상기 비트스트림으로부터 복호화하고, 상기 픽처 내 하나 이상의 슬라이스들의 분할정보를 상기 비트스트림으로부터 복호화하는, 장치를 제공한다.

이상에서 설명한 바와 같이 본 발명의 일 실시예에 의하면, 픽처를 하위 유닛들로 분할하기 위해 이용되는 신택스 요소들의 중복이 방지되므로, 비트 효율성이 향상될 수 있다.

또한, 본 발명의 다른 일 실시예에 의하면, 하위 유닛 경계들 간의 인-루프 필터링 여부가 하위 유닛들 간의 분할 관계에 따라 합리적으로 디자인될 수 있다.

나아가, 본 발명의 또 다른 일 실시예에 의하면, 서브픽처의 분할정보가 CTU 단위로 표현되므로, 다른 하위 유닛들과의 통일성을 확보할 수 있으며, 이를 통해 서브픽처의 분할정보를 더욱 효율적으로 표현할 수 있다.

도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다.

도 2는 QTBTTT 구조를 이용하여 블록을 분할하는 방법을 설명하기 위한 도면이다.

도 3은 복수의 인트라 예측 모드들을 설명하기 위한 도면이다.

도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다.

도 5 내지 도 7은 슬라이스, 타일 및 서브픽처를 설명하기 위한 도면이다.

도 9는 본 개시의 기술들을 구현할 수 있는 방법의 일 예를 설명하기 위한 순서도이다.

도 10은 픽처를 타일로 분할하는 방법의 일 예를 설명하기 위한 순서도이다.

도 11은 픽처를 브릭으로 분할하는 방법의 일 예를 설명하기 위한 순서도이다.

도 12는 타일/브릭과 슬라이스 사이의 분할관계를 설명하기 위한 도면이다.

도 13은 픽처를 슬라이스로 분할하는 방법의 일 예를 설명하기 위한 순서도이다.

도 14 내지 도 17은 슬라이스 경계의 필터링 여부에 대한 정보를 획득하는 방법의 다양한 예들을 설명하기 위한 순서도들이다.

도 18은 픽처를 서브픽처로 분할하는 방법의 일 예를 설명하기 위한 순서도이다.

도 19는 픽처를 서브픽처로 분할하는 구체적인 방법의 일 예를 설명하기 위한 순서도이다.

이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성 요소들에 식별 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.

도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다. 이하에서는 도 1을 참조하여 영상 부호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.

영상 부호화 장치는 블록 분할부(110), 예측부(120), 감산기(130), 변환부(140), 양자화부(145), 부호화부(150), 역양자화부(160), 역변환부(165), 가산기(170), 필터부(180) 및 메모리(190)를 포함하여 구성될 수 있다.

영상 부호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.

하나의 영상(비디오)는 복수의 픽처들로 구성된다. 각 픽처들은 복수의 영역으로 분할되고 각 영역마다 부호화가 수행된다. 예를 들어, 하나의 픽처는 하나 이상의 타일(Tile) 또는/및 슬라이스(Slice)로 분할된다. 여기서, 하나 이상의 타일을 타일 그룹(Tile Group)으로 정의할 수 있다. 각 타일 또는/슬라이스는 하나 이상의 CTU(Coding Tree Unit)로 분할된다. 그리고 각 CTU는 트리 구조에 의해 하나 이상의 CU(Coding Unit)들로 분할된다. 각 CU에 적용되는 정보들은 CU의 신택스로서 부호화되고, 하나의 CTU에 포함된 CU들에 공통적으로 적용되는 정보는 CTU의 신택스로서 부호화된다. 또한, 하나의 타일 내의 모든 블록들에 공통적으로 적용되는 정보는 타일의 신택스로서 부호화되거나 다수 개의 타일을 모아 놓은 타일 그룹의 신택스로서 부호화되며, 하나의 픽처들을 구성하는 모든 블록들에 적용되는 정보는 픽처 파라미터 셋(PPS, Picture Parameter Set) 혹은 픽처 헤더에 부호화된다. 나아가, 복수의 픽처가 공통으로 참조하는 정보들은 시퀀스 파라미터 셋(SPS, Sequence Parameter Set)에 부호화된다. 그리고, 하나 이상의 SPS가 공통으로 참조하는 정보들은 비디오 파라미터 셋(VPS, Video Parameter Set)에 부호화된다.

블록 분할부(110)는 CTU(Coding Tree Unit)의 크기를 결정한다. CTU의 크기에 대한 정보(CTU size)는 SPS 또는 PPS의 신택스로서 부호화되어 영상 복호화 장치로 전달된다.

블록 분할부(110)는 영상을 구성하는 각 픽처(picture)를 미리 결정된 크기를 가지는 복수의 CTU(Coding Tree Unit)들로 분할한 이후에, 트리 구조(tree structure)를 이용하여 CTU를 반복적으로(recursively) 분할한다. 트리 구조에서의 리프 노드(leaf node)가 부호화의 기본 단위인 CU(coding unit)가 된다.

트리 구조로는 상위 노드(혹은 부모 노드)가 동일한 크기의 네 개의 하위 노드(혹은 자식 노드)로 분할되는 쿼드트리(QuadTree, QT), 또는 상위 노드가 두 개의 하위 노드로 분할되는 바이너리트리(BinaryTree, BT), 또는 상위 노드가 1:2:1 비율로 세 개의 하위 노드로 분할되는 터너리트리(TernaryTree, TT), 또는 이러한 QT 구조, BT 구조 및 TT 구조 중 둘 이상을 혼용한 구조일 수 있다. 예컨대, QTBT(QuadTree plus BinaryTree) 구조가 사용될 수 있고, 또는 QTBTTT(QuadTree plus BinaryTree TernaryTree) 구조가 사용될 수 있다. 여기서, BTTT를 합쳐서 MTT(Multiple-Type Tree)라 칭할 수 있다.

도 2는 QTBTTT 분할 트리 구조를 보인다. 도 2에서 보는 바와 같이, CTU는 먼저 QT 구조로 분할될 수 있다. 쿼드트리 분할은 분할 블록(splitting block)의 크기가 QT에서 허용되는 리프 노드의 최소 블록 크기(MinQTSize)에 도달할 때까지 반복될 수 있다. QT 구조의 각 노드가 하위 레이어의 4개의 노드들로 분할되는지 여부를 지시하는 제1 플래그(QT_split_flag)는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. QT의 리프 노드가 BT에서 허용되는 루트 노드의 최대 블록 크기(MaxBTSize)보다 크지 않은 경우, BT 구조 또는 TT 구조 중 어느 하나 이상으로 더 분할될 수 있다. BT 구조 및/또는 TT 구조에서는 복수의 분할 방향이 존재할 수 있다. 예컨대, 해당 노드의 블록이 가로로 분할되는 방향과 세로로 분할되는 방향 두 가지가 존재할 수 있다. 도 2와 같이, MTT 분할이 시작되면, 노드들이 분할되었는지 여부를 지시하는 제2 플래그(mtt_split_flag)와, 분할이 되었다면 추가적으로 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그 및/또는 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

트리 구조의 다른 예로서, QTBTTT 구조를 사용하여 블록을 분할하는 경우, 먼저 분할 되었음을 나타내는 CU 분할 플래그(split_cu_flag) 및 분할 타입이 QT 분할인지를 지시하는 QT 분할 플래그(split_qt_flag) 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. CU 분할 플래그(split_cu_flag) 값이 분할되지 않았음을 지시하는 경우, 해당 노드의 블록이 분할 트리 구조에서의 리프 노드(leaf node)가 되어 부호화의 기본 단위인 CU(coding unit)가 된다. CU 분할 플래그(split_cu_flag) 값이 분할되었음을 지시하는 경우, QT 분할 플래그(split_qt_flag) 값을 통해 분할 타입이 QT 혹은 MTT인지를 구분한다. 분할 타입이 QT인 경우에는 더 이상의 추가 정보가 없으며, 분할 타입이 MTT인 경우에는 추가적으로 MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

트리 구조의 다른 예시로서 QTBT가 사용되는 경우, 해당 노드의 블록을 동일 크기의 두 개 블록으로 가로로 분할하는 타입(즉, symmetric horizontal splitting)과 세로로 분할하는 타입(즉, symmetric vertical splitting) 두 가지가 존재할 수 있다. BT 구조의 각 노드가 하위 레이어의 블록으로 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할되는 타입을 지시하는 분할 타입 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다. 한편, 해당 노드의 블록을 서로 비대칭 형태의 두 개의 블록으로 분할하는 타입이 추가로 더 존재할 수도 있다. 비대칭 형태에는 해당 노드의 블록을 1:3의 크기 비율을 가지는 두 개의 직사각형 블록으로 분할하는 형태가 포함될 수 있고, 혹은 해당 노드의 블록을 대각선 방향으로 분할하는 형태가 포함될 수도 있다.

CU는 CTU로부터의 QTBT 또는 QTBTTT 분할에 따라 다양한 크기를 가질 수 있다. 이하에서는, 부호화 또는 복호화하고자 하는 CU(즉, QTBTTT의 리프 노드)에 해당하는 블록을 '현재블록'이라 칭한다.

예측부(120)는 현재블록을 예측하여 예측블록을 생성한다. 예측부(120)는 인트라 예측부(122)와 인터 예측부(124)를 포함한다.

일반적으로, 픽처 내 현재블록들은 각각 예측적으로 코딩될 수 있다. 일반적으로 현재블록의 예측은 (현재블록을 포함하는 픽처로부터의 데이터를 사용하는) 인트라 예측 기술 또는 (현재블록을 포함하는 픽처 이전에 코딩된 픽처로부터의 데이터를 사용하는) 인터 예측 기술을 사용하여 수행될 수 있다. 인터 예측은 단방향 예측과 양방향 예측 모두를 포함한다.

인트라 예측부(122)는 현재블록이 포함된 현재 픽처 내에서 현재블록의 주변에 위치한 픽셀(참조 픽셀)들을 이용하여 현재블록 내의 픽셀들을 예측한다. 예측 방향에 따라 복수의 인트라 예측모드가 존재한다. 예컨대, 도 3에서 보는 바와 같이, 복수의 인트라 예측모드는 planar 모드와 DC 모드를 포함하는 비방향성 모드와 65개의 방향성 모드를 포함할 수 있다. 각 예측모드에 따라 사용할 주변 픽셀과 연산식이 다르게 정의된다.

인트라 예측부(122)는 현재블록을 부호화하는데 사용할 인트라 예측 모드를 결정할 수 있다. 일부 예들에서, 인트라 예측부(122)는 여러 인트라 예측 모드들을 사용하여 현재블록을 인코딩하고, 테스트된 모드들로부터 사용할 적절한 인트라 예측 모드를 선택할 수도 있다. 예를 들어, 인트라 예측부(122)는 여러 테스트된 인트라 예측 모드들에 대한 레이트 왜곡(rate-distortion) 분석을 사용하여 레이트 왜곡 값들을 계산하고, 테스트된 모드들 중 최선의 레이트 왜곡 특징들을 갖는 인트라 예측 모드를 선택할 수도 있다.

인트라 예측부(122)는 복수의 인트라 예측 모드 중에서 하나의 인트라 예측 모드를 선택하고, 선택된 인트라 예측 모드에 따라 결정되는 주변 픽셀(참조 픽셀)과 연산식을 사용하여 현재블록을 예측한다. 선택된 인트라 예측 모드에 대한 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.

인터 예측부(124)는 움직임 보상 과정을 통해 현재블록에 대한 예측블록을 생성한다. 현재 픽처보다 먼저 부호화 및 복호화된 참조픽처 내에서 현재블록과 가장 유사한 블록을 탐색하고, 그 탐색된 블록을 이용하여 현재블록에 대한 예측블록을 생성한다. 그리고, 현재 픽처 내의 현재블록과 참조픽처 내의 예측블록 간의 변위(displacement)에 해당하는 움직임벡터(motion vector)를 생성한다. 일반적으로, 움직임 추정은 루마(luma) 성분에 대해 수행되고, 루마 성분에 기초하여 계산된 모션 벡터는 루마 성분 및 크로마 성분 모두에 대해 사용된다. 현재블록을 예측하기 위해 사용된 참조픽처에 대한 정보 및 움직임벡터에 대한 정보를 포함하는 움직임 정보는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.

감산기(130)는 현재블록으로부터 인트라 예측부(122) 또는 인터 예측부(124)에 의해 생성된 예측블록을 감산하여 잔차블록을 생성한다.

변환부(140)는 공간 영역의 픽셀 값들을 가지는 잔차블록 내의 잔차 신호를 주파수 도메인의 변환 계수로 변환한다. 변환부(140)는 잔차블록의 전체 크기를 변환 단위로 사용하여 잔차블록 내의 잔차 신호들을 변환할 수 있으며, 또는 잔차블록을 변환 영역 및 비변환 영역인 두 개의 서브블록으로 구분하여, 변환 영역 서브블록만 변환 단위로 사용하여 잔차 신호들을 변환할 수 있다. 여기서, 변환 영역 서브블록은 가로축 (혹은 세로축) 기준 1:1의 크기 비율을 가지는 두 개의 직사각형 블록 중 하나일 수 있다. 이런 경우, 서브블록 만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 위치 정보(cu_sbt_pos_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. 또한, 변환 영역 서브블록의 크기는 가로축 (혹은 세로축) 기준 1:3의 크기 비율을 가질 수 있으며, 이런 경우 해당 분할을 구분하는 플래그(cu_sbt_quad_flag)가 추가적으로 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

양자화부(145)는 변환부(140)로부터 출력되는 변환 계수들을 양자화하고, 양자화된 변환 계수들을 부호화부(150)로 출력한다.

부호화부(150)는 양자화된 변환 계수들을 CABAC(Context-based Adaptive Binary Arithmetic Code) 등의 부호화 방식을 사용하여 부호화함으로써 비트스트림을 생성한다. 부호화부(150)는 블록 분할과 관련된 CTU size, CU 분할 플래그, QT 분할 플래그, MTT 분할 방향, MTT 분할 타입 등의 정보를 부호화하여, 영상 복호화 장치가 영상 부호화 장치와 동일하게 블록을 분할할 수 있도록 한다.

또한, 부호화부(150)는 현재블록이 인트라 예측에 의해 부호화되었는지 아니면 인터 예측에 의해 부호화되었는지 여부를 지시하는 예측 타입에 대한 정보를 부호화하고, 예측 타입에 따라 인트라 예측정보(즉, 인트라 예측 모드에 대한 정보) 또는 인터 예측정보(참조픽처 및 움직임벡터에 대한 정보)를 부호화한다.

역양자화부(160)는 양자화부(145)로부터 출력되는 양자화된 변환 계수들을 역양자화하여 변환 계수들을 생성한다. 역변환부(165)는 역양자화부(160)로부터 출력되는 변환 계수들을 주파수 도메인으로부터 공간 도메인으로 변환하여 잔차블록을 복원한다.

가산부(170)는 복원된 잔차블록과 예측부(120)에 의해 생성된 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 다음 순서의 블록을 인트라 예측할 때 참조 픽셀로서 사용된다.

필터부(180)는 블록 기반의 예측 및 변환/양자화로 인해 발생하는 블록킹 아티팩트(blocking artifacts), 링잉 아티팩트(ringing artifacts), 블러링 아티팩트(blurring artifacts) 등을 줄이기 위해 복원된 픽셀들에 대한 필터링을 수행한다. 필터부(180)는 디블록킹 필터(182)와 SAO(Sample Adaptive Offset) 필터(184)를 포함할 수 있다.

디블록킹 필터(180)는 블록 단위의 부호화/복호화로 인해 발생하는 블록킹 현상(blocking artifact)을 제거하기 위해 복원된 블록 간의 경계를 필터링하고, SAO 필터(184)는 디블록킹 필터링된 영상에 대해 추가적인 필터링을 수행한다. SAO 필터(184)는 손실 부호화(lossy coding)로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해 사용되는 필터이다.

디블록킹 필터(182) 및 SAO 필터(184)를 통해 필터링된 복원블록은 메모리(190)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.

한편, 픽처 부호부는 픽처를 하위 유닛들로 분할하고, 하위 유닛에 포함되는 CU 단위로 픽처를 부호화한다. 픽처 부호부에는 영상 부호화 장치에 포함되는 구성들 중에서 부호화부(150)를 제외한 나머지 구성들이 포함될 수 있다. 부호화부(150)는 픽처로부터 분할되는 하위 유닛들에 대한 정보를 부호화하여 영상 복호화 장치로 시그널링한다. 부호화부(150)가 하위 유닛들에 대한 정보를 부호화하는 방법에 대해서는 아래에서 상세히 설명하도록 한다.

도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다. 이하에서는 도 4를 참조하여 영상 복호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.

영상 복호화 장치는 복호화부(410), 역양자화부(420), 역변환부(430), 예측부(440), 가산기(450), 필터부(460) 및 메모리(470)를 포함하여 구성될 수 있다.

도 1의 영상 부호화 장치와 마찬가지로, 영상 복호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.

복호화부(410)는 영상 부호화 장치로부터 수신한 비트스트림을 복호화하여 블록 분할과 관련된 정보를 추출함으로써 복호화하고자 하는 현재블록을 결정하고, 현재블록을 복원하기 위해 필요한 예측정보와 잔차신호에 대한 정보 등을 추출한다.

복호화부(410)는 SPS(Sequence Parameter Set) 또는 PPS(Picture Parameter Set)로부터 CTU size에 대한 정보를 추출하여 CTU의 크기를 결정하고, 픽처를 결정된 크기의 CTU로 분할한다. 그리고, CTU를 트리 구조의 최상위 레이어, 즉, 루트 노드로 결정하고, CTU에 대한 분할정보를 추출함으로써 트리 구조를 이용하여 CTU를 분할한다.

예컨대, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 MTT의 분할과 관련된 제2 플래그(MTT_split_flag) 및 분할 방향(vertical / horizontal) 및/또는 분할 타입(binary / ternary) 정보를 추출하여 해당 리프 노드를 MTT 구조로 분할한다. 이를 통해 QT의 리프 노드 이하의 각 노드들을 BT 또는 TT 구조로 반복적으로(recursively) 분할한다.

또 다른 예로서, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 CU의 분할 여부를 지시하는 CU 분할 플래그(split_cu_flag)를 추출하고, 해당 블록이 분할된 경우, QT 분할 플래그(split_qt_flag)를 추출한다. 분할 타입이 QT가 아니고 MTT인 경우, MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)를 추가적으로 추출한다. 분할 과정에서 각 노드는 0번 이상의 반복적인 QT 분할 후에 0번 이상의 반복적인 MTT 분할이 발생할 수 있다. 예컨대, CTU는 바로 MTT 분할이 발생하거나, 반대로 다수 번의 QT 분할만 발생할 수도 있다.

다른 예로서, QTBT 구조를 사용하여 CTU를 분할하는 경우, QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 BT로 더 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할 방향 정보를 추출한다.

한편, 복호화부(410)는 트리 구조의 분할을 통해 복호화하고자 하는 현재블록을 결정하게 되면, 현재블록이 인트라 예측되었는지 아니면 인터 예측되었는지를 지시하는 예측 타입에 대한 정보를 추출한다. 예측 타입 정보가 인트라 예측을 지시하는 경우, 복호화부(410)는 현재블록의 인트라 예측정보(인트라 예측 모드)에 대한 신택스 요소를 추출한다. 예측 타입 정보가 인터 예측을 지시하는 경우, 복호화부(410)는 인터 예측정보에 대한 신택스 요소, 즉, 움직임벡터 및 그 움직임벡터가 참조하는 참조픽처를 나타내는 정보를 추출한다.

한편, 복호화부(410)는 잔차신호에 대한 정보로서 현재블록의 양자화된 변환계수들에 대한 정보를 추출한다.

역양자화부(420)는 양자화된 변환계수들을 역양자화하고, 역변환부(430)는 역양자화된 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환하여 잔차신호들을 복원함으로써 현재블록에 대한 잔차블록을 생성한다.

또한, 역변환부(430)는 변환블록의 일부 영역(서브블록)만 역변환하는 경우, 변환블록의 서브블록만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 서브블록의 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 서브블록의 위치 정보(cu_sbt_pos_flag)를 추출하여, 해당 서브블록의 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환함으로써 잔차신호들을 복원하고, 역변환되지 않은 영역에 대해서는 잔차신호로 "0" 값을 채움으로써 현재블록에 대한 최종 잔차블록을 생성한다.

예측부(440)는 인트라 예측부(442) 및 인터 예측부(444)를 포함할 수 있다. 인트라 예측부(442)는 현재블록의 예측 타입이 인트라 예측일 때 활성화되고, 인터 예측부(444)는 현재블록의 예측 타입이 인터 예측일 때 활성화된다.

인트라 예측부(442)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소로부터 복수의 인트라 예측 모드 중 현재블록의 인트라 예측 모드를 결정하고, 인트라 예측 모드에 따라 현재블록 주변의 참조 픽셀들을 이용하여 현재블록을 예측한다.

인터 예측부(444)는 복호화부(410)로부터 추출된 인터 예측 모드에 대한 신택스 요소를 이용하여 현재블록의 움직임벡터와 그 움직임벡터가 참조하는 참조픽처를 결정하고, 움직임벡터와 참조픽처를 이용하여 현재블록을 예측한다.

가산기(450)는 역변환부로부터 출력되는 잔차블록과 인터 예측부 또는 인트라 예측부로부터 출력되는 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 이후에 복호화할 블록을 인트라 예측할 때의 참조픽셀로서 활용된다.

필터부(460)는 디블록킹 필터(462) 및 SAO 필터(464)를 포함할 수 있다. 디블록킹 필터(462)는 블록 단위의 복호화로 인해 발생하는 블록킹 현상(blocking artifact)를 제거하기 위해, 복원된 블록 간의 경계를 디블록킹 필터링한다. SAO 필터(464)는 손실 부호화(lossy coding)으로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해, 디블록킹 필터링 이후의 복원된 블록에 대해 추가적인 필터링을 수행한다. 디블록킹 필터(462) 및 SAO 필터(464)를 통해 필터링된 복원블록은 메모리(470)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.

한편, 복호화부(410)는 픽처로부터 분할되는 하위 유닛들에 대한 정보를 비트스트림으로부터 복호화하여 획득한다. 픽처 복원부(4000)는 획득된 하위 유닛들에 대한 정보에 기초하여, 픽처를 복원한다. 픽처 복원부(4000)에는 영상 복호화 장치에 포함되는 구성들 중에서 복호화부(410)를 제외한 나머지 구성들이 포함될 수 있다. 복호화부(410)가 하위 유닛들에 대한 정보를 획득하는 방법에 대해서는 아래에서 상세히 설명하도록 한다.

병렬 처리를 위한 두 가지 타입의 픽처(이미지 또는 화면) 분할 방법이 존재한다. 두 가지 타입의 픽처 분할 방법들 중에서 어느 하나는 슬라이스 분할 방법이며 다른 하나는 타일 분할 방법이다.

1) 슬라이스 분할 방법에 의하면, 하나의 픽처를 raster scan order 순으로 CTU 단위로 분할하여 부호화/복호화할 수 있는 기능이 제공된다. 하나의 슬라이스 내에는 여러 개의 슬라이스 세그먼트(segments)가 존재할 수 있으며, 슬라이스 세그먼트에는 두 가지 종류가 존재한다. 슬라이스 세그먼트의 종류로는 독립적 슬라이스 세그먼트(independent slice segment)와 종속적 슬라이스 세그먼트(dependent slice segment)가 있다.

독립적 슬라이스 세그먼트는 인트라 예측, 인터 예측, 코딩모드 및 엔트로피 코딩 시에 다른 슬라이스에 의존하지 않는 슬라이스 세그먼트이다. 독립적 슬라이스 세그먼트는 헤더 정보가 존재한다. 종속적 슬라이스 세그먼트는 인트라 예측, 인터 예측, 코딩모드 및 엔트로피 코딩 시에 다른 슬라이스에 의존하는(선행하는 다른 독립적 슬라이스 세그먼트를 참조하는) 슬라이스 세그먼트이다. 종속적 슬라이스 세그먼트는 헤더 정보의 대부분을 선행하는 독립적 슬라이스 세그먼트의 헤더 정보를 참고한다. 즉, 종속적 슬라이스 세그먼트의 헤더 정보는 일부만이 시그널링된다.

도 5 (a)는 픽처로부터 분할된 두 개의 슬라이스들을 보이며, 두 개의 슬라이스들은 슬라이스 경계(slice boundary)에 의해 구분될 수 있다. 하나의 슬라이스에는 하나의 독립적 슬라이스 세그먼트와 0개 이상의 종속적 슬라이스 세그먼트가 존재할 수 있다. 픽처의 상측에 위치하는 첫 번째 슬라이스에는 점선을 기준으로 구분되는 하나의 독립적 슬라이스 세그먼트와 두 개의 종속적 슬라이스 세그먼트가 포함되어 있다. 픽처의 하측에 위치하는 두 번째 슬라이스에는 하나의 독립적 슬라이스 세그먼트만이 포함되어 있다(0개의 종속적 슬라이스 세그먼트 포함).

슬라이스 분할 방법에 대한 신택스 구조가 표 1 및 표 2에 나타나 있다.

표 1은 종속적 슬라이스 세그먼트의 사용 여부를 지시하는 플래그(dependent_slice_segments_enabled_flag)를 나타내며, 이 플래그는 PPS에서 정의될 수 있다. 표 2는 슬라이스 세그먼트 헤더정보를 나타낸다.

표 2에 나타낸 바와 같이, 특정 슬라이스 세그먼트가 픽처 내 첫 번째 슬라이스 세그먼트인지 여부를 나타내는 플래그(first_slice_segment_in_pic_flag)가 부호화되어 시그널링된다. 첫 번째 슬라이스 세그먼트는 독립적 슬라이스 세그먼트가 된다. 첫 번째 슬라이스 세그먼트가 아니라면, 종속적 슬라이스 세그먼트인지 여부를 나타내는 플래그(dependent_slice_segment_flag)가 부호화되어 시그널링된다. 또한, 해당 슬라이스 세그먼트의 address(slice_segment_address)가 함께 부호화되어 시그널링된다. 여기서, slice_segment_address는 해당 슬라이스 세그먼트 내 첫 번째 CTU의 인덱스(index) 값을 의미한다.

2) 타일 분할 방법에 의하면, 하나의 픽처를 CTU 단위로 다수 개의 열(column)과 행(row)으로 구획/분할하여 부호화/복호화할 수 있는 기능이 제공된다. 픽처를 타일로 분할하는 방법은 균등 분할 또는 개별 분할(비균등 분할)이 모두 가능하다.

분할된 각각의 타일들은 인트라 예측 및 엔트로피 코딩 시에 다른 타일에 의존하지 않으며, 인-루프 필터링의 의존 여부는 PPS에서 정의되는 플래그로 제어 가능하다. 타일을 위한 별도의 헤더는 존재하지 않는다.

도 5 (b)는 픽처로부터 3x3으로 분할된 타일들을 보이며, 각 타일들은 타일 경계(column boundaries, row boundaries)에 의해 구분될 수 있다. 복수 개의 타일들은 raster scan order 순으로 부호화/복호화가 진행될 수 있으며, 한 타일 내 다수 개의 CTU들도 raster scan order 순으로 부호화/복호화가 진행될 수 있다. 각 CTU 내에 표시된 숫자들이 부호화/복호화가 진행되는 순서를 나타낸다.

타일 분할 방법을 위한 신택스 구조가 표 3에 나타나 있다.

표 3에 나타낸 바와 같이, 타일 분할 방법의 on/off를 지시하는 플래그(tiles_enabled_flag)가 PPS에서 정의되어 시그널링되며, 해당 플래그가 on인 경우에 타일의 크기를 지정하는 신택스들이 추가적으로 시그널링된다.

타일의 크기를 지정하는 신택스들에는, 세로축 방향으로 분할된 타일들의 개수(타일 열의 개수)에서 1을 뺀 값을 지시하는 num_tile_columns_minus1, 가로축 방향으로 분할된 타일들의 개수(타일 행의 개수)에서 1을 뺀 값을 지시하는 num_tile_rows_minus1, 픽처가 가로축 방향과 세로축 방향으로 균등하게 분할되는지 여부를 지시하는 uniform_spacing_flag 등이 포함될 수 있다.

픽처가 균등하게 분할되지 않은 경우(uniform_spacing_flag=off), 타일 열의 너비정보(column_width_minus1)와 타일 행의 높이정보(row_height_minus1)가 추가적으로 시그널링된다. 또한, 타일들 간 경계에서 인-루프 필터링의 적용 여부를 나타내는 플래그(loop_filter_across_tiles_enabled_flag)도 시그널링된다.

이상에서 설명된 슬라이스 분할 방법과 타일 분할 방법의 차이점이 도 6에 나타나 있다. 도 6 (a)는 슬라이스 분할 방법에 따라 분할된 슬라이스들(총 4개)을 나타내며, 도 6 (b)는 타일 분할 방법에 따라 분할된 타일들(총 4개)을 나타낸다. 숫자들 각각은 CTU의 개수를 나타낸다.

분할된 슬라이스들 사이에는 CTU 단위로 가로축 방향의 경계만이 존재할 수 있다. 이와 달리, 분할된 타일들 사이에는 CTU 단위로 가로축 방향의 경계와 세로축 방향의 경계가 모두 존재할 수 있다.

본 발명은 픽처로부터 분할되는 하위 유닛들에 대한 정보를 획득하는 방법을 제안한다.

하위 유닛(하위 블록 또는, 하위 영역)들에는 서브픽처, 슬라이스, 타일/브릭 및 CTU 중에서 하나 이상이 포함될 수 있다. 하위 유닛들에 대한 정보에는 인에이블 플래그와 하위 유닛들의 분할정보가 포함될 수 있다.

인에이블 플래그는 하위 유닛들 간의 경계에서 인-루프 필터링의 수행 여부를 나타내는 신택스 요소이다. 하위 유닛들의 분할정보는 픽처를 다양한 하위 유닛들로 분할하기 위한 정보에 해당한다. 따라서, '하위 유닛들의 분할정보를 획득'하는 것은 '픽처를 하위 유닛들로 분할하는 것'일 수 있다.

본 발명에서는 하위 유닛들의 분할정보를 이용한 다양한 목적의 픽처 분할 방법들이 제안된다. 구체적으로, 1) 서로 다른 시퀀스들을 합성하기 위한 서브픽처(sub-picture) 분할 방법, 2) 비트스트림 패킹을 위한 슬라이스 분할 방법 및, 3) 병렬 처리를 위한 타일/브릭 분할 방법 등이 본 명세서를 통해 제안된다.

타일/브릭, 슬라이스 및 서브픽처

타일/브릭 은 하나의 픽처를 병렬적으로 처리하기 위해, 이 하나의 픽처를 분할한 영역을 의미한다. 타일/브릭들 간에는 인트라 예측 및 엔트로피 코딩 시에 서로 독립적으로 동작하는 구조를 가진다. 즉, 타일/브릭들은 인트라 예측 시에 참조샘플을 공유하지 않으며, 엔트로피 코딩 시에 context를 공유하지 않는 관계를 가진다. 타일/브릭들 간 경계에 인-루프 필터를 적용할지 여부는 별도의 플래그를 통해 제어될 수 있다.

슬라이스는 독립적인 하나의 NAL(network abstraction layer) 비트스트림을 생성하는 데이터 패킹 단위를 의미한다. 하나의 슬라이스에 다수 개의 타일/브릭이 포함되거나, 하나의 타일/브릭에 다수 개의 슬라이스가 포함될 수도 있다.

슬라이스에는 두 가지 타입 또는 모드가 존재한다. 첫 번째 모드는 유사한 특성을 가진 타일/브릭들 또는 임의의 타일/브릭들이 하나의 영역으로 구분된 직사각형 모양의 슬라이스(직사각형 슬라이스, rectangular slice) 모드이고, 두 번째 모드는 raster-scan 순으로 타일/브릭의 부호화/복호화를 진행하다가 특정 위치에서 영역이 구분된 비직사각형 모양의 슬라이스(래스터 스캔 슬라이스, raster-scan) 모드이다.

직사각형 슬라이스 모드와 래스터 스캔 슬라이스 모드의 일 예가 도 7에 나타나 있다. 도 7에서, 점선으로 구분된 영역은 CTU를 나타내고, 직선으로 구분된 영역은 타일/브릭을 나타내며, 일점 쇄선으로 구분된 영역은 슬라이스를 나타낸다.

도 7 (a)에 나타낸 바와 같이, 하나의 픽처는 총 216(18x12)개의 CTU들로 구획되고, 총 24(6x4)개의 타일/브릭들로 구획되며, 총 9개의 직사각형 슬라이스들로 구획될 수 있다. 도 7 (b)에 나타낸 바와 같이, 하나의 픽처는 총 216(18x12)개의 CTU들로 구획되고, 총 12(3x4)개의 타일/브릭들로 구획되며, 총 3개의 래스터 스캔 슬라이스들로 구획될 수 있다.

서브픽처는 다른 컨텐츠와의 합성을 위해 구분된 영역을 의미한다. 서브픽처는 최소 1개의 슬라이스를 포함할 수 있다.

서로 다른 컨텐츠들이 서브픽처 단위로 합성되는 일 예가 도 8에 나타나 있다. 우상향의 패턴으로 표현된 영역은 컨텐츠 1 내 픽처를 의미하고, 가로축 방향의 패턴으로 표현된 영역은 컨텐츠 2 내 픽처를 의미하며, 세로축 방향의 패턴으로 표현된 영역은 컨텐츠 3 내 픽처를 의미한다.

도 8의 좌측에 표현된 바와 같이, 픽처들 각각은 4개의 슬라이스들로 구성될 수 있으며, 각 슬라이스 단위로 비트스트림이 생성될 수 있다. 또한, 각 슬라이스가 서브픽처로 정의될 수 있다. 물리적으로 슬라이스 단위로 생성된 비트스트림들이 Bitstream Extractor & Merger에 입력되어 추출 과정 및 합성 과정을 거치게 된다. 여기서, 추출 과정 및 합성 과정의 논리적 단위는 서브픽처이다. 그 결과, 도 8의 우측에 표현된 바와 같이, 좌상측 부분은 컨텐츠 1로, 좌하측 부분은 컨텐츠 2로, 우측 부분은 컨텐츠 3으로 합성된 새로운 픽처(picture)가 생성되게 된다.

Bitstream Extractor & Merger는 슬라이스 단위로 생성된 비트스트림들을 서로 다른 컨텐츠들로부터 서브픽처 단위로 추출하고 합성한다. 이를 위해, 각 컨테츠의 픽처는 서브픽처로 구획된다. 즉, 서브픽처는 컨텐츠 합성을 위해 최소 1개의 슬라이스를 포함하는 영역이다.

이하에서는 하위 유닛들에 대한 정보를 획득하는 방법을 설명한다. 본 발명의 일 실시예를 설명하기 위한 순서도가 도 9에 나타나 있다.

영상 부호화 장치는 픽처를 다양한 하위 유닛들로 분할할 수 있다. 픽처는 미리 결정된 크기를 가지는 복수 개의 CTU들로 분할된 후에, CTU의 크기를 기본 단위로 하여 서브픽처, 타일/브릭, 슬라이스 등으로 분할될 수 있다.

예를 들어, 픽처는 CTU의 크기를 기본 단위로 하여 하나 이상의 서브픽처로 분할될 수 있으며, CTU의 크기를 기본 단위로 하여 하나 이상의 타일/브릭으로 분할될 수 있다. 슬라이스 분할의 경우에, 픽처는 타일/브릭을 기본 단위로 하여 하나 이상의 슬라이스로 분할될 수 있다. 여기서, 타일/브릭은 CTU의 크기를 기본 단위로 하여 분할되므로, 결과적으로 슬라이스도 CTU의 크기를 기본 단위로 하여 분할된다.

따라서, 서브픽처 분할에 대한 정보(서브픽처 분할정보)는 픽처 내 서브픽처를 CTU의 크기 단위로 표현하며, 타일/브릭 분할에 대한 정보(타일/브릭 분할정보)는 픽처 내 타일/브릭을 CTU의 크기 단위로 표현하고, 슬라이스 분할에 대한 정보(슬라이스 분할정보)도 픽처 내 슬라이스를 타일/브릭 단위(CTU의 크기 단위)로 표현할 수 있다.

CTU의 크기에 대한 정보(CTU 사이즈 정보), 서브픽처 분할정보, 타일/브릭 분할정보, 슬라이스 분할정보 등이 부호화되어 영상 복호화 장치로 시그널링된다. CTU 사이즈 정보는 SPS 레벨 또는 PPS 레벨에서 정의되어 시그널링되며, 서브픽처 분할정보는 SPS 레벨에서 정의되어 시그널링되고, 타일/브릭 분할정보 및 슬라이스 분할정보는 PPS 레벨에서 정의되어 시그널링된다.

또한, 영상 부호화 장치는 하위 유닛들 간 경계에 인-루프 필터링의 적용 여부를 결정하고, 인-루프 필터링의 적용 여부를 나타내는 인에이블 플래그를 부호화하여 영상 복호화 장치로 시그널링한다.

서브픽처들 간 경계에 인-루프 필터링의 적용 여부를 나타내는 인에이블 플래그는 SPS 레벨에서 정의되어 시그널링되며, 타일/브릭들 간 경계에 인-루프 필터링의 적용 여부를 나타내는 인에이블 플래그 및 슬라이스들 간 경계에 인-루프 필터링의 적용 여부를 나타내는 인에이블 플래그는 PPS 레벨에서 정의되어 시그널링된다.

복호화부(410)는 비트스트림으로부터 하위 유닛들의 분할정보를 복호화한다(S910). 하위 유닛들의 분할정보에 포함된 CTU 사이즈 정보, 서브픽처 분할정보, 타일/브릭 분할정보, 슬라이스 분할정보 등이 비트스트림으로부터 복호화되어 획득된다. 복호화부(410)는 획득된 분할정보들에 기초하여 픽처를 하위 유닛들로 분할한다(S930). 구체적으로, 픽처는 CTU 사이즈 정보가 나타내는 CTU 크기의 CTU들로 분할된 후에, 서브픽처 분할정보, 타일/브릭 분할정보 및 슬라이스 분할정보에 기초하여 서브픽처, 타일/브릭, 슬라이스 등으로 분할될 수 있다.

복호화부(410)는 비트스트림으로부터 하위 유닛들 간 경계에 인-루프 필터링의 적용 여부를 나타내는 인에이블 플래그를 복호화한다(S920). 필터링부(460)는 인에이블 플래그의 값에 따라 하위 유닛들 간 경계에 인-루프 필터링의 적용 여부를 결정한다(S930).

실시예 1

실시예 1은 타일 분할정보를 획득하는 방법과 브릭 분할정보를 획득하는 방법이다. 이를 달리 표현하면, 실시예 1은 픽처를 타일로 분할하는 방법과 픽처를 브릭으로 분할하는 방법이다.

실시예 1에 대한 신택스 구조의 일 예를 나타내면 표 4와 같다.

실시예 1-1

실시예 1-1은 픽처를 타일로 분할하는 방법(타일 분할정보를 획득하는 방법)이다. 실시예 1-1에 대한 일 예가 도 10에 나타나 있다.

영상 부호화 장치는 픽처 내에 하나의 타일만이 존재하는지 여부를 판단하고, 판단 결과를 single_tile_in_pic_flag 신택스 요소의 값으로 설정한다. single_tile_in_pic_flag==1은 픽처 내에 하나의 타일만이 존재함을 나타내며, single_tile_in_pic_flag==0은 픽처 내에 하나 이상의 타일이 존재함을 나타낸다.

영상 부호화 장치는 픽처 내에 하나 이상의 타일이 존재하는 경우에(single_tile_in_pic_flag==0), 해당 하나 이상의 타일이 균등하게 분할되었는지 여부를 판단하고, 판단 결과를 uniform_tile_spacing_flag 신택스 요소의 값으로 설정한다. uniform_tile_spacing_flag==1은 타일이 균등하게 분할됨을 나타내며, uniform_tile_spacing_flag==0은 타일이 균등하게 분할되지 않음을 나타낸다.

영상 부호화 장치는 타일이 균등하게 분할된 경우에(uniform_tile_spacing_flag==1), 타일 열(column)의 너비와 타일 행(row)의 높이를 판단하고, 각각의 판단 결과를 tile_cols_width_minus1 신택스 요소 및 tile_rows_height_minus1 신택스 요소의 값으로 설정한다. tile_cols_width_minus1은 타일 열의 너비를 CTU의 크기 단위로 나타내는 신택스 요소로서, 픽처 내 가장 오른쪽에 위치하는 타일 열의 너비는 제외된다. tile_rows_height_minus1은 타일 행의 높이를 CTU의 크기 단위로 나타내는 신택스 요소로서, 픽처 내 가장 아래쪽에 위치하는 타일 행의 높이는 제외된다.

영상 부호화 장치는 타일이 균등하게 분할되지 않은 경우에(uniform_tile_spacing_flag==0), 타일 열의 개수와 타일 행의 개수를 판단하고, 각각의 판단 결과를 num_tile_columns_minus1 신택스 요소 및 num_tile_rows_minus1 신택스 요소의 값으로 설정한다. num_tile_columns_minus1은 타일 열의 개수에서 1을 뺀 값을 나타내는 신택스 요소이며, num_tile_rows_minus1은 타일 행의 개수에서 1을 뺀 값을 나타내는 신택스 요소이다.

영상 부호화 장치는 균등하게 분할되지 않은 타일 열의 너비와 균등하게 분할되지 않은 타일 행의 높이를 판단하고, 각각의 판단 결과를 tile_column_width_minus1[i] 신택스 요소 및 tile_row_height_minus1[i] 신택스 요소의 값으로 설정한다. tile_column_width_minus1[i]은 균등하게 분할되지 않는 타일 열의 너비를 CTU의 크기 단위로 나타내는 신택스 요소로서, 픽처 내 가장 오른쪽에 위치하는 타일 열의 너비는 제외된다. tile_row_height_minus1[i]은 균등하게 분할되지 않은 타일 행의 높이를 나타내는 신택스 요소로서, 픽처 내 가장 아래쪽에 위치하는 타일 행의 높이는 제외된다.

영상 부호화 장치는 single_tile_in_pic_flag, uniform_tile_spacing_flag, tile_cols_width_minus1, tile_rows_height_minus1, num_tile_columns_minus1, num_tile_rows_minus1, tile_column_width_minus1[i] 및 tile_row_height_minus1[i]를 부호화하여 영상 복호화 장치로 시그널링한다.

복호화부(410)는 single_tile_in_pic_flag를 비트스트림으로부터 복호화하고(S1010), single_tile_in_pic_flag의 값에 따라 픽처 내에 하나의 타일 만이 존재하는지, 아니면 픽처 내에 하나 이상의 타일이 존재하는지 여부를 판단한다(S1020).

복호화부(410)는 픽처 내에 하나의 타일 만이 존재하는 경우에(single_tile_in_pic_flag==1), 해당 픽처를 하나의 타일로 취급하고, 타일 분할 과정을 종료한다. 이와 달리, 복호화부(410)는 픽처 내에 하나 이상의 타일이 존재하는 경우에(single_tile_in_pic_flag==0), uniform_tile_spacing_flag를 비트스트림으로부터 복호화한다(S1030).

복호화부(410)는 복호화된 uniform_tile_spacing_flag의 값에 따라 픽처 내 타일이 균등하게 분할되는지 여부를 판단한다(S1040). 복호화부(410)는 타일이 균등하게 분할된 경우에(uniform_tile_spacing_flag==1), tile_cols_width_minus1 및 tile_rows_height_minus1를 비트스트림으로부터 복호화한다(S1050). 이와 달리, 복호화부(410)는 타일이 균등하게 분할되지 않은 경우에(uniform_tile_spacing_flag==0), num_tile_columns_minus1 및 num_tile_rows_minus1를 비트스트림으로부터 복호화하고(S1060), num_tile_columns_minus1 및 num_tile_rows_minus1이 지시하는 개수만큼 tile_column_width_minus1[i] 및 tile_row_height_minus1[i]를 비트스트림으로부터 복호화한다(S1070).

복호화부(410)는 num_tile_columns_minus1, num_tile_rows_minus1, tile_column_width_minus1[i] 및 tile_row_height_minus1[i]의 값에 따라 픽처를 타일로 균등하지 않게 분할하거나, tile_cols_width_minus1 및 tile_rows_height_minus1의 값에 따라 픽처를 타일들로 균등하게 분할할 수 있다.

실시예 1-2

실시예 1-2는 픽처를 브릭으로 분할하는 방법(브릭 분할정보를 획득하는 방법)이다. 브릭의 분할은 타일의 가로축 분할만이 허용된다. 실시예 1-2에 대한 일 예가 도 11에 나타나 있다.

영상 부호화 장치는 픽처 내 타일이 복수 개의 브릭으로 분할되는지 여부를 판단하고, 판단 결과를 brick_splitting_present_flag 신택스 요소의 값으로 설정할 수 있다. brick_splitting_present_flag==1은 픽처 내 하나 이상의 타일이 복수 개의 브릭들로 분할됨을 나타내며, brick_splitting_present_flag==0은 복수 개의 브릭들로 분할되는 타일이 픽처 내에 존재하지 않음을 나타낸다. brick_splitting_present_flag는 부호화되어 영상 복호화 장치로 시그널링된다.

영상 부호화 장치는 픽처 내 타일들의 개수를 판단하고, 판단 결과를 num_tiles_in_pic_minus1 신택스 요소의 값으로 설정할 수 있다. num_tiles_in_pic_minus1는 픽처 내 타일들이 균등하게 분할되며(uniform_tile_spacing_flag==1) 픽처 내 하나 이상의 타일이 복수 개의 브릭들로 분할된 경우에(brick_splitting_present_flag==1), 부호화되어 영상 복호화 장치로 시그널링된다.

영상 부호화 장치는 i-번째 타일의 높이(i-번째 타일 내 CTU 행의 개수, RowHeight[i])를 판단하고, 판단 결과에 따라 brick_split_flag[i] 신택스 요소, uniform_brick_spacing_flag[i] 신택스 요소, brick_height_minus1[i] 신택스 요소, num_brick_rows_minus2[i] 신택스 요소 및 brick_row_height_minus1[i][j] 신택스 요소의 값을 설정할 수 있다.

brick_split_flag[i]은 i-번째 타일이 브릭들로 분할되는지 여부를 지시하는 신택스 요소이다. RowHeight[i]의 값이 1을 초과하는 경우에 brick_split_flag[i]는 i-번째 타일이 브릭들로 분할됨을 지시하는 값인 “1”로 설정되며, 부호화되어 영상 복호화 장치로 시그널링된다. RowHeight[i]의 값이 1을 초과하는 경우에는 가로축 브릭 분할이 가능하기 때문이다. 이와 달리, brick_split_flag[i]는 RowHeight[i]의 값이 1 이하인 경우에 i-번째 타일이 브릭들로 분할되지 않음을 지시하는 값인 “0”으로 설정되며, 영상 복호화 장치로 시그널링되지 않는다. RowHeight[i]의 값이 1 이하인 경우에는 가로축 브릭 분할이 불가능하기 때문이다.

uniform_brick_spacing_flag[i]은 i-번째 타일이 브릭들로 균등하게 분할되는지 여부를 지시하는 신택스 요소이다. RowHeight[i]의 값이 2를 초과하는 경우에는 균등 분할과 비균등 분할이 모두 가능하므로, uniform_brick_spacing_flag[i]은 균등 분할을 지시하는 값인 “1”로 설정되거나, 비균등 분할을 지시하는 값인 “0”으로 설정될 수 있다. 이 경우, uniform_brick_spacing_flag[i]은 부호화되어 영상 복호화 장치로 시그널링될 수 있다. 이와 달리, RowHeight[i]의 값이 2 이하인 경우에는 1:1의 균등 분할만이 가능하므로, uniform_brick_spacing_flag[i]은 “1”로 설정되며, 영상 복호화 장치로 시그널링되지 않는다.

brick_height_minus1[i]은 균등 분할된 브릭 행들의 높이에서 1을 뺀 값을 CTU의 사이즈 단위로 지시하는 신택스 요소로서, i-번째 타일 내 가장 아래쪽에 위치하는 브릭 행의 높이는 제외된다. brick_height_minus1[i]은 브릭들이 균등 분할되면서 RowHeight[i]의 값이 3을 초과하는 경우에 부호화되어 영상 복호화 장치로 시그널링된다. 이와 달리, 브릭들이 균등 분할되면서 RowHeight[i]의 값이 3인 경우에는 1:1:1의 균등 분할만 가능하므로, brick_height_minus1[i]==0으로 설정되며, 영상 복호화 장치로 시그널링되지 않는다.

num_brick_rows_minus2[i]는 비균등 분할된 브릭들의 개수에서 2를 뺀 값을 지시하는 신택스 요소이다. num_brick_rows_minus2[i]는 브릭들이 비균등 분할되면서 RowHeight[i]의 값이 3을 초과하는 경우에 부호화되어 영상 복호화 장치로 시그널링된다. 이와 달리, 브릭들이 비균등 분할되면서 RowHeight[i]의 값이 3인 경우에는 1:2 또는 2:1의 비균등 분할만 가능하므로, num_brick_rows_minus2[i]==0으로 설정되며, 영상 복호화 장치로 시그널링되지 않는다.

brick_row_height_minus1[i][j]은 비균등 분할된 브릭 행들 중에서 j-번째 브릭 행의 높이에서 1을 뺀 값을 CTU의 사이즈 단위로 지시하는 신택스 요소이다. 예를 들어, brick_row_height_minus1[i][j]는 비균등 분할된 브릭들의 개수가 3인 경우에(num_brick_rows_minus2[i]==1) 2개의 브릭들에 대한 높이 각각에서 1을 뺀 값으로 설정된다. 다른 예로, brick_row_height_minus1[i][j]는 비균등 분할된 브릭들의 개수가 5인 경우에(num_brick_rows_minus2[i]==3)는 4개의 브릭들에 대한 높이 각각에서 1을 뺀 값으로 설정된다. brick_row_height_minus1[i][j]는 부호화되어 영상 복호화 장치로 시그널링된다.

복호화부(410)는 brick_splitting_present_flag를 비트스트림으로부터 복호화하고(S1110), 복호화된 brick_splitting_present_flag의 값을 판단한다(S1120).

복호화부(410)는 픽처 내 타일들이 균등하게 분할되며(uniform_tile_spacing_flag==1) 픽처 내 하나 이상의 타일이 복수 개의 브릭들로 분할된 경우에(brick_splitting_present_flag==1), num_tiles_in_pic_minus1를 비트스트림으로부터 복호화한다(S1130). 픽처 내 타일들이 비균등 분할되거나(uniform_tile_spacing_flag==0) 픽처 내 하나 이상의 타일이 복수 개의 브릭들로 분할되지 않은 경우에(brick_splitting_present_flag==0)는 num_tiles_in_pic_minus1이 시그널링되지 않고, num_tiles_in_pic_minus1의 값이 픽처 내 타일의 개수에서 1을 뺀 값으로 설정 또는 유도된다.

복호화부(410)는 i-번째 타일 내 CTU 행의 개수(RowHeight[i])를 확인하고(S1140), RowHeight[i] > 1인 경우에 brick_split_flag를 비트스트림으로부터 복호화한다(S1150). RowHeight[i]의 값이 1 이하인 경우에는 brick_split_flag이 시그널링되지 않고, brick_split_flag의 값이 0으로 유도 또는 설정된다.

복호화부(410)는 brick_split_flag==0인 경우에(S1160) 브릭 분할을 종료하나, brick_split_flag==1인 경우에(S1160)는 RowHeight[i]의 값을 판단한다(S1170). RowHeight[i]의 값이 2를 초과하는 경우에는 uniform_brick_spacing_flag이 비트스트림으로부터 복호화되나(S1180), RowHeight[i]의 값이 2 이하인 경우에는 uniform_brick_spacing_flag이 복호화되지 않으며 그 값이 1로 설정 또는 유도된다.

복호화부(410)는 uniform_brick_spacing_flag의 값에 따라 브릭의 균등 분할 여부를 판단하고(S1182), RowHeight[i]의 값을 판단한다(S1184, S1190). 복호화부(410)는 uniform_brick_spacing_flag==1이면서 RowHeight[i]의 값이 3을 초과하는 경우에 brick_height_minus1[i]을 비트스트림으로부터 복호화한다(S1186). 이와 달리, uniform_brick_spacing_flag==1이면서 RowHeight[i]의 값이 3을 초과하지 않는 경우에는 brick_height_minus1[i]이 복호화되지 않고 그 값이 0으로 설정 또는 유도된다. 복호화부(410)는 uniform_brick_spacing_flag==0이면서 RowHeight[i]의 값이 3을 초과하는 경우에 num_brick_rows_minus2[i]을 비트스트림으로부터 복호화한다(S1192). 이와 달리, uniform_brick_spacing_flag==0이면서 RowHeight[i]의 값이 3을 초과하지 않는 경우에는 num_brick_rows_minus2[i]이 복호화되지 않고 그 값이 0으로 설정 또는 유도된다. 복호화부(410)는 brick_row_height_minus1[i][j]를 비트스트림으로부터 복호화한다(S1194).

이상에서 설명된 바와 같이, 본 발명에서 제안하는 브릭 분할 방법은 RowHeight[i]의 값이 3을 초과하는 경우에만 brick_height_minus1[i] 및 num_brick_rows_minus2[i]을 시그널링 및 복호화하도록 구성된다. 이와 달리, 종래 브릭 분할 방법은 RowHeight[i]의 값이 3을 초과하는 경우와 RowHeight[i]의 값이 3을 초과하지 않는 경우 모두에(즉, RowHeight[i]의 값이 3을 초과하는지 여부와 무관하게) brick_height_minus1[i] 및 num_brick_rows_minus2[i]을 시그널링 및 복호화하였다. 따라서, 본 발명의 브릭 분할 방법은 종래 브릭 분할 방법에 비해 비트 효율성을 향상시킬 수 있다.

실시예 2

실시예 2는 픽처를 슬라이스로 분할하는 방법(슬라이스 분할정보를 획득하는 방법) 및 인에이블 플래그를 획득하는 방법이다.

실시예 2에 대한 신택스 구조를 나타내면 표 5와 같다.

실시예 2-1

실시예 2-1은 픽처를 슬라이스로 분할하는 방법이다. 슬라이스 분할은 하나 이상의 타일/브릭을 포함하는 형태로 구현될 수 있다. 타일/브릭과 슬라이스 간의 분할 관계가 도 12에 나타나 있으며, 픽처를 슬라이스로 분할하는 방법이 도 13에 나타나 있다.

도 12 (a)는 픽처로부터 분할된 총 9개의 타일/브릭들(3x3)을 나타내며, 도 12 (b) 내지 (d)는 도 12 (a)의 타일/브릭 분할을 기준으로 타일/브릭(실선)과 슬라이스(일점 쇄선) 간의 분할 관계를 나타낸다. 도 12 (b)에 나타낸 바와 같이 하나의 타일/브릭이 하나의 슬라이스를 구성할 수 있고(1:1의 분할 관계), 도 12 (c)에 나타낸 바와 같이, 다수 개의 타일/브릭들이 하나의 직사각형 슬라이스를 구성할 수 있다(n:1의 분할 관계, n은 2 이상의 자연수). 또한, 도 12 (d)에 나타내 바와 같이 모든 타일/브릭들이 하나의 슬라이스를 구성할 수 있고(all:1의 분할 관계), 도 12 (e)에 나타낸 바와 같이 다수 개의 타일/브릭들이 하나의 래스터 스캔 슬라이스를 구성할 수도 있다. 도 12 (e)에서, 우상향 패턴으로 표현된 타일/브릭들이 하나의 래스터 스캔 슬라이스를 구성한다. 또한, 패턴으로 표현되지 않은 타일/브릭들 중에서, 픽처의 상측에 위치하는 두 개의 타일/브릭들이 다른 래스터 스캔 슬라이스를 구성하며, 픽처의 하측 및 우측에 위치하는 또 세 개의 타일/브릭들이 또 다른 래스터 스캔 슬라이스를 구성한다.

영상 부호화 장치는 슬라이스가 하나 이상의 타일/브릭을 포함하는지 여부를 판단하고, 판단 결과를 single_brick_per_slice_flag 신택스 요소의 값으로 설정한다. single_brick_per_slice_flag==1은 슬라이스에 하나의 타일/브릭이 포함됨을 나타내며, single_brick_per_slice_flag==0은 슬라이스에 하나 이상의 타일/브릭이 포함될 수 있음을 나타낸다. single_brick_per_slice_flag는 부호화되어 영상 복호화 장치로 시그널링된다.

영상 부호화 장치는 single_brick_per_slice_flag==1인 경우에 타일/브릭과 슬라이스가 1:1의 분할 관계를 가지므로, 추가적인 슬라이스 분할정보를 시그널링하지 않는다.

영상 부호화 장치는 슬라이스의 모드를 판단하고, 판단 결과를 rect_slice_flag 신택스 요소의 값으로 설정한다. rect_slice_flag==0은 해당 슬라이스의 모드가 래스터 스캔 슬라이스 모드임을 나타내며, rect_slice_flag==1은 해당 슬라이스의 모드가 직사각형 슬라이스 모드임을 나타낸다. rect_slice_flag는 single_brick_per_slice_flag==0인 경우에 부호화되어 영상 복호화 장치로 시그널링된다.

영상 부호화 장치는 픽처 내 슬라이스의 개수를 판단하고, 판단 결과를 num_slices_in_pic_minus1 신택스 요소의 값으로 설정한다. num_slices_in_pic_minus1는 픽처 내 슬라이스의 개수에서 1을 뺀 값을 나타내는 신택스 요소이다. num_slices_in_pic_minus1는 부호화되어 영상 복호화 장치로 시그널링된다.

영상 부호화 장치는 슬라이스들 각각의 우하측 내부에 위치하는 타일/브릭(우하측 타일/브릭)을 판단하고, 우하측 타일/브릭들 간의 인덱스 값 차이의 절대 값과 부호를 bottom_right_brick_idx_delta[i] 신택스 요소 및 brick_idx_delta_sign_flag[i] 신택스 요소의 값으로 설정한다.

bottom_right_brick_idx_delta[i]는 픽처 내 두 번째 이후(i > 1) 슬라이스에 대해, 이전 슬라이스 내 우하측 타일/브릭의 인덱스와 이후 슬라이스 내 우하측 타일/브릭의 인덱스 간 차이의 절대 값을 나타낸다. 다만, bottom_right_brick_idx_delta[i]는 픽처 내 첫 번째(i==0) 슬라이스에 대해, 첫 번째 슬라이스 내 우하측 타일/브릭 인덱스를 나타낸다. brick_idx_delta_sign_flag[i]==1은 bottom_right_brick_idx_delta[i]의 부호가 양수임을 나타내고, brick_idx_delta_sign_flag[i]==0은 bottom_right_brick_idx_delta[i]의 부호가 음수임을 나타낸다. bottom_right_brick_idx_delta[i] 및 brick_idx_delta_sign_flag[i]은 부호화되어 영상 복호화 장치로 시그널링된다.

bottom_right_brick_idx_delta[i] 및 brick_idx_delta_sign_flag[i]이 시그널링되기 이전에, bottom_right_brick_idx_length_minus1 신택스 요소가 먼저 부호화되어 시그널링된다. bottom_right_brick_idx_length_minus1는 bottom_right_brick_idx_delta[i]를 나타내기 위해 사용되는 비트 수를 지시한다.

복호화부(410)는 비트스트림으로부터 single_brick_per_slice_flag를 복호화한다(S1310). single_brick_per_slice_flag가 비트스트림 내에 존재하지 않는 경우에는 single_brick_per_slice_flag의 값이 “1”로 설정 또는 유도된다.

복호화부(410)는 single_brick_per_slice_flag의 값에 따라 추가적인 슬라이스 분할정보의 복호화 여부(획득 여부)를 결정한다(S1320). single_brick_per_slice_flag==1인 경우에는 추가적인 슬라이스 분할정보가 복호화되지 않으며, 타일/브릭의 분할정보로부터 슬라이스 분할정보가 유도된다. 이와 달리, 복호화부(410)는 single_brick_per_slice_flag==0인 경우에 비트스트림으로부터 rect_slice_flag를 복호화한다(S1330). rect_slice_flag가 비트스트림 내에 존재하지 않는 경우에, rect_slice_flag의 값은 “1”로 설정 또는 유도된다.

복호화부(410)는 슬라이스의 모드가 직사각형 슬라이스 모드이며(rect_slice_flag==1) 슬라이스에 타일/브릭이 하나 이상 포함되는 경우에(single_brick_per_slice_flag==0)(S1340), 비트스트림으로부터 num_slices_in_pic_minus1 및 bottom_right_brick_idx_length_minus1를 복호화한다(S1350). num_slices_in_pic_minus1이 비트스트림 내에 존재하지 않고 single_brick_per_slice_flag==1인 경우에, num_slices_in_pic_minus1은 복호화되지 않으며, 픽처 내 타일/블릭의 개수에서 1을 뺀 값으로 설정 또는 유도된다.

복호화부(410)는 슬라이스의 모드가 직사각형 슬라이스 모드이며(rect_slice_flag==1) 슬라이스에 타일/브릭이 하나 이상 포함되는 경우에(single_brick_per_slice_flag==0)(S1340), 비트스트림으로부터 bottom_right_brick_idx_delta[i] 및 brick_idx_delta_sign_flag[i]를 복호화한다(S1360). bottom_right_brick_idx_delta[i] 및 brick_idx_delta_sign_flag[i]은 single_brick_per_slice_flag==1인 경우에 시그널링(복호화)되지 않으므로, bottom_right_brick_idx_delta[i]==1로 설정 또는 유도된다.

실시예 2-1에서 설명된 슬라이스 분할 방법을 도 12의 타일 및 슬라이스 간 분할 관계에 적용하면, 표 6과 같다.

도 12 (b)의 경우에, 타일/브릭과 슬라이스 간 분할 관계가 동일하므로(1:1 관계), single_brick_per_slice_flag는 “1”로 설정되어 시그널링되고, 다른 슬라이스 분할정보들은 시그널링 없이 타일/브릭의 분할정보로부터 유도된다.

도 12 (c)의 경우에, 타일/브릭과 슬라이스 간 분할 관계가 동일하지 않으므로 single_brick_per_slice_flag는 “0”으로 설정되어 시그널링되고, 슬라이스들의 모드가 직사각형 슬라이스 모드이므로 rect_slice_flag==1로 설정되어 시그널링된다. 또한, 픽처 내 슬라이스의 개수가 3이므로, num_slices_in_pic_minus1==2로 설정되어 시그널링되며, bottom_right_brick_idx_delta[i]가 bottom_right_brick_idx_delta[0]==2, bottom_right_brick_idx_delta[1]==3 및 bottom_right_brick_idx_delta[2]==3으로 각각 설정되어 시그널링된다. 또한, brick_idx_delta_sign_flag[i]가 brick_idx_delta_sign_flag[0]==1(+), brick_idx_delta_sign_flag[1]==1 및 brick_idx_delta_sign_flag[2]==1로 각각 설정되어 시그널링된다.

도 12 (d) 및 (e)의 경우에, 타일/브릭과 슬라이스 간 분할 관계가 동일하지 않으므로 single_brick_per_slice_flag는 “0”으로 설정되어 시그널링되고, 슬라이스들의 모드가 래스터 스캔 슬라이스 모드이므로 rect_slice_flag==0으로 설정되어 시그널링된다. 나머지 슬라이스 분할정보들은 시그널링되지 않는다.

실시예를 달리하여, 도 12 (d)의 슬라이스 모드를 직사각형 슬라이스 모드로 설정하고(rect_slice_flag==1), 픽처 내 슬라이스의 개수를 1개로 설정할 수도 있다(num_slices_in_pic_minus1==0). 이 경우에 시그널링되는 슬라이스 분할정보의 예가 표 7에 나타나 있다.

실시예 2-2

실시예 2-2는 슬라이스들 간 경계에 인-루프 필터링의 적용 여부를 나타내는 인에이블 플래그(loop_filter_across_slices_enabled_flag)를 획득하는 방법이다.

loop_filter_across_slices_enabled_flag는 미리 설정된 조건에 따라 시그널링 여부가 결정될 수 있다. 이는, 타일/브릭과 슬라이스 간의 분할 관계에 따라, 타일/브릭의 경계선과 슬라이스의 경계선이 일부 또는 전체가 겹칠 수 있기(동일할 수 있기) 때문이다. 예를 들어, 도 12 (b)의 경우에 타일/브릭의 경계선과 슬라이스의 경계선이 전체가 동일하며, 도 12 (c)의 경우에 타일/브릭의 경계선과 슬라이스의 경계선이 일부 동일하고, 도 12 (d)의 경우에 슬라이스의 경계선이 픽처의 경계선이 되며, 도 12 (e)의 경우에 타일/브릭의 경계선과 슬라이스의 경계선이 일부 동일할 수 있다.

실시예 2-2에 대한 다양한 예들이 도 14 내지 도 17에 나타나 있다.

영상 부호화 장치는 슬라이스 분할정보를 부호화하여 영상 복호화 장치로 시그널링한다. 복호화부(410)는 비트스트림으로부터 슬라이스 분할정보를 복호화하고(S1410, S1510, S1610, S1710), 슬라이스 분할정보에 기반하여 픽처를 하나 이상의 슬라이스로 분할한다.

영상 부호화 장치는 미리 설정된 조건에 의존하여 loop_filter_across_slices_enabled_flag의 시그널링 여부를 결정한다. 즉, loop_filter_across_slices_enabled_flag는 미리 설정된 조건이 만족되는 경우에 부호화되어 영상 복호화 장치로 시그널링된다. 복호화부(410)는 미리 설정된 조건의 만족 여부를 판단하고(S1420, S1520, S1620, S1720), 판단 결과에 따라 loop_filter_across_slices_enabled_flag를 비트스트림으로부터 복호화한다(S1430, S1530, S1630, S1730).

미리 설정된 조건에는 픽처 내 슬라이스의 개수가 복수 개인지 여부(픽처가 복수 개의 슬라이스들로 분할되는지 여부) 및 슬라이스의 모드가 직사각형 슬라이스 모드인지 여부 중에서, 하나 이상이 포함될 수 있다.

예를 들어, 도 14에 나타낸 바와 같이, 미리 설정된 조건에는 픽처 내 슬라이스의 개수가 복수 개인지 여부(num_slices_in_pic_minus1) 및 슬라이스의 모드가 직사각형 슬라이스 모드인지 여부(rect_slice_flag)가 모두 포함될 수 있다. 이 경우, 픽처 내 슬라이스의 개수가 복수 개이거나 슬라이스의 모드가 직사각형 슬라이스 모드가 아닌 경우(num_slices_in_pic_minus1 > 0 ∥ rect_slice_flag==0)에, loop_filter_across_slices_enabled_flag가 시그널링 및 복호화된다.

도 12 (b) 및 (c)의 경우에 num_slices_in_pic_minus1 > 0이므로 loop_filter_across_slices_enabled_flag가 시그널링 및 복호화되며, 도 12 (d) 및 (e)의 경우에는 rect_slice_flag==0이므로 loop_filter_across_slices_enabled_flag가 시그널링 및 복호화된다.

실시예를 달리하여, 미리 설정된 조건에는 슬라이스의 모드가 직사각형 슬라이스 모드인지 여부, 슬라이스에 하나 이상의 타일/브릭이 포함되는지 여부 및 타일/브릭들 간 경계에 인-루프 필터링이 적용되는지 여부 중에서, 하나 이상이 포함될 수도 있다.

예를 들어, 도 15에 나타낸 바와 같이, 미리 설정된 조건에는 슬라이스의 모드가 직사각형 슬라이스 모드인지 여부(rect_slice_flag), 슬라이스에 하나 이상의 타일/브릭이 포함되는지 여부(single_brick_per_slice_flag) 및, 타일/브릭들 간 경계에 인-루프 필터링이 적용되는지 여부(loop_filter_across_bricks_enabled_flag)가 모두 포함될 수 있다.

이 경우, 슬라이스의 모드가 직사각형 슬라이스 모드이고, 슬라이스에 하나 이상의 타일/브릭이 포함되며, 타일/브릭들 간 경계에 인-루프 필터링이 적용되는 경우에(rect_slice_flag==1 && single_brick_per_slice_flag==0 && loop_filter_across_bricks_enabled_flag==1), loop_filter_across_slices_enabled_flag가 시그널링 및 복호화된다. 도 15에 나타낸 미리 설정된 조건에 대한 신택스 구조가 표 5에 나타나 있다.

도 12 (b)의 경우에 single_brick_per_slice_flag==1이므로 loop_filter_across_slices_enabled_flag가 시그널링 및 복호화되지 않는다. 이는, 타일/브릭과 슬라이스 간의 분할 관계가 1:1의 관계이므로(모든 경계선이 일치하므로), 슬라이스 경계선에 대한 loop_filter_across_slices_enabled_flag를 별도로 시그널링할 필요가 없기 때문이다.

도 12 (c)의 경우에 rect_slice_flag==1, single_brick_per_slice_flag==0 및 loop_filter_across_bricks_enabled_flag==1이므로, loop_filter_across_slices_enabled_flag가 시그널링된다. 도 12 (d) 및 (e)의 경우에 rect_slice_flag==0이므로, loop_filter_across_slices_enabled_flag가 시그널링되지 않는다. 여기서, 도 12 (d)와 같은 all:1의 분할 관계의 경우에는 슬라이스 경계선이 픽처 경계선과 일치하므로, 슬라이스 경계선에 대한 loop_filter_across_slices_enabled_flag를 별도로 시그널링할 필요가 없기 때문이다.

실시예를 달리하여, 도 16에 나타낸 바와 같이, 미리 설정된 조건에는 슬라이스에 하나 이상의 타일/브릭이 포함되는지 여부(single_brick_per_slice_flag) 및 타일/브릭들 간 경계에 인-루프 필터링이 적용되는지 여부(loop_filter_across_bricks_enabled_flag)가 포함될 수 있다.

이 경우, 슬라이스에 하나 이상의 타일/브릭이 포함되며, 타일/브릭들 간 경계에 인-루프 필터링이 적용되는 경우에(single_brick_per_slice_flag==0 && loop_filter_across_bricks_enabled_flag==1), loop_filter_across_slices_enabled_flag가 시그널링 및 복호화된다.

도 16에 나타낸 미리 설정된 조건에 대한 신택스 구조가 표 8에 나타나 있다.

도 12 (b)의 경우에 single_brick_per_slice_flag==1이므로 loop_filter_across_slices_enabled_flag가 시그널링되지 않는다. 도 12 (c) 내지 (e)의 경우에 single_brick_per_slice_flag==0 및 loop_filter_across_bricks_enabled_flag==1이므로, loop_filter_across_slices_enabled_flag가 시그널링된다.

실시예를 달리하여, 도 17에 나타낸 바와 같이, 미리 설정된 조건에는 픽처 내 슬라이스의 개수가 복수 개인지 여부(num_slices_in_pic_minus1), 슬라이스의 모드가 직사각형 슬라이스 모드인지 여부(rect_slice_flag), 슬라이스에 하나 이상의 타일/브릭이 포함되는지 여부(single_brick_per_slice_flag) 및 타일/브릭들 간 경계에 인-루프 필터링이 적용되는지 여부(loop_filter_across_bricks_enabled_flag)가 포함될 수 있다.

이 경우, 타일/브릭들 간 경계에 인-루프 필터링이 적용되고, 슬라이스에 하나 이상의 타일/브릭이 포함되며, 슬라이스의 모드가 직사각형 슬라이스 모드가 아닌 경우에(loop_filter_across_bricks_enabled_flag==1 && single_brick_per_slice_flag==0 && rect_slice_flag==0), loop_filter_across_slices_enabled_flag가 시그널링 및 복호화된다.

혹은, 타일/브릭들 간 경계에 인-루프 필터링이 적용되고, 슬라이스에 하나 이상의 타일/브릭이 포함되며, 슬라이스의 모드가 직사각형 슬라이스 모드이면서, 픽처 내 슬라이스의 개수가 복수 개인 경우에(loop_filter_across_bricks_enabled_flag==1 && single_brick_per_slice_flag==0 && rect_slice_flag==1 && num_slices_in_pic_minus1 > 0), loop_filter_across_slices_enabled_flag가 시그널링 및 복호화된다.

도 17에 나타낸 미리 설정된 조건에 대한 신택스 구조가 표 9에 나타나 있다.

도 17의 미리 설정된 조건을 표 7에 나타낸 슬라이스 설정을 적용하면, 인에이블 플래그의 시그널링 여부가 다음과 같이 결정될 수 있다. 도 12 (b)의 경우에 single_brick_per_slice_flag==1이므로 loop_filter_across_slices_enabled_flag가 시그널링되지 않는다. 도 12 (c) 및 (e)의 경우에 loop_filter_across_bricks_enabled_flag==1, single_brick_per_slice_flag==0, rect_slice_flag==1 및 num_slices_in_pic_minus1 > 0이므로 loop_filter_across_slices_enabled_flag가 시그널링된다. 도 12 (d)의 경우에 num_slices_in_pic_minus1==0이므로 loop_filter_across_slices_enabled_flag가 시그널링되지 않는다.

실시예 3

실시예 3은 픽처를 서브픽처로 분할하는 방법(서브픽처 분할정보를 획득하는 방법)이다. 실시예 3에 대한 일 예가 도 18에 나타나 있다.

영상 부호화 장치는 픽처를 미리 결정된 크기를 가지는 복수 개의 CTU들로 분할한 후에, CTU의 사이즈 정보(CTU 사이즈 정보)를 부호화하여 영상 복호화 장치로 시그널링한다. 또한, 영상 부호화 장치는 CTU를 트리 구조를 이용하여 CU들로 분할한 후에, CU의 최소 사이즈 정보(MinCb 사이즈 정보)를 부호화하여 영상 복호화 장치로 시그널링한다. MinCb 사이즈 정보는 비트스트림의 SPS 레벨, PPS 레벨, 슬라이스 헤더 레벨 중에서 하나 이상의 위치에서 정의되어 시그널링될 수 있다.

영상 부호화 장치는 픽처를 복수 개의 서브픽처들로 분할한다. 픽처는 CTU 사이즈 정보로부터 유도되는 CTU의 사이즈를 기본 단위로 하여 서브픽처로 분할되거나, MinCb 사이즈 정보로부터 유도되는 MinCb의 사이즈를 기본 단위로 하여 서브픽처로 분할될 수 있다.

따라서, 서브픽처 분할정보는 픽처 내 서브픽처들을 CTU의 사이즈 단위로 표현하거나, 픽처 내 서브픽처들을 MinCb의 사이즈 단위로 표현할 수 있다. 서브픽처 분할정보에는 서브픽처 각각의 위치를 나타내는 서브픽처 위치정보와 서브픽처 각각의 크기를 나타내는 서브픽처 사이즈 정보가 포함될 수 있다. 서브픽처 위치정보는 서브픽처의 픽처 내 위치를 CTU의 사이즈 단위 또는 MinCb의 사이즈 단위로 표현할 수 있다. 서브픽처 사이즈 정보도 서브픽처의 크기를 CTU의 사이즈 단위 또는 MinCb의 사이즈 단위로 표현할 수 있다.

복호화부(410)는 CTU 사이즈 정보 및 MinCb 사이즈 정보를 비트스트림으로부터 복호화한다(S1810). 또한, 복호화부(410)는 서브픽처 분할정보를 비트스트림으로부터 복호화한다(S1820).

복호화부(410)는 CTU 사이즈 정보에 기초하여 픽처를 CTU들로 분할하고, 서브픽처 분할정보에 기초하여 픽처를 서브픽처로 분할한다(S1830).

종래 서브픽처 분할 방법은 서브픽처를 4개의 샘플 단위로 표현하였다. 즉, 종래 서브픽처 분할 방법은 서브픽처의 분할 단위로 4의 배수를 이용하였다. 그러나, 앞서 설명된 바와 같이, 픽처는 다수 개의 CTU들로 분할되고, 하나 이상의 CTU들을 포함하는 타일/브릭으로 분할되며, 하나 이상의 타일/브릭을 포함하는 슬라이스로 분할될 수 있고, 하나 이상의 슬라이스를 포함하는 서브픽처로 분할될 수 있다. 따라서, 타일/브릭, 슬라이스 및 서브픽처는 CTU 사이즈 단위로(CTU의 배수 단위로) 표현되는 것이 가장 효율적일 수 있다. 따라서, 실시예 3에 따라 서브픽처를 CTU 사이즈 단위로 표현하는 경우에, 효율적인 서브픽처 분할이 구현될 수 있다.

실시형태에 따라, 서브픽처 분할정보는 서브픽처를 CTU 사이즈 단위 또는 MinCb 사이즈 단위로 직접적으로 표현하거나 간접적으로 표현할 수도 있다. 여기서, 간접적인 표현 방법은 다른 하위 유닛을 통해 CTU와 서브픽처 사이를 연결하는 것이다. 다른 하위 유닛은 그리드(grid)이며, 이 그리드가 CTU의 사이즈 단위로 표현되고, 서브픽처가 그리드의 사이즈 단위로 표현됨으로써, 결과적으로 서브픽처가 CTU의 사이즈 단위로 표현될 수 있다.

간접적인 표현 방법에 대한 일 예가 도 19에 나타나 있으며, 간접적인 표현 방법에 대한 신택스 구조가 표 10에 나타나 있다.

영상 부호화 장치는 서브픽처 분할이 수행되는지 여부(서브픽처 파라미터들이 비트스트림 내에 존재하는지 여부)를 판단하고, 판단 결과를 subpics_present_flag 신택스 요소의 값으로 설정한다. subpics_present_flag==1은 서브픽처 분할이 수행됨을 나타내며, subpics_present_flag==0은 서브픽처 분할이 수행되지 않음을 나타낸다.

영상 부호화 장치는 subpics_present_flag==1인 경우에, 서브픽처의 최대 개수를 나타내는 신택스 요소인 max_subpics_minus1, 그리드 열의 너비를 CTU의 사이즈 단위 또는 MinCb 사이즈 단위로 나타내는 신택스 요소인 subpic_grid_col_width_minus1 및, 그리드 행의 높이를 CTU의 사이즈 단위 또는 MinCb 사이즈 단위로 나타내는 신택스 요소인 subpic_grid_row_height_minus1를 부호화하여 영상 복호화 장치로 시그널링한다.

max_subpics_minus1은 서브픽처의 최대 개수에서 1을 뺀 값을 나타내며, subpic_grid_col_width_minus1은 그리드 열의 너비에서 1을 뺀 값을 나타내고, subpic_grid_row_height_minus1은 그리드 행의 높이에서 1을 뺀 값을 나타낸다.

영상 부호화 장치는 서브픽처 인덱스(subpic_grid_idx[i][j])를 부호화하여 영상 복호화 장치로 시그널링한다. 서브픽처 인덱스는 그리드들 각각이 속하는 서브픽처의 인덱스를 나타내며, 서브픽처 인덱스를 통해 어떠한 그리드가 어떠한 서브픽처에 속하는지 여부가 결정될 수 있다.

복호화부(410)는 비트스트림으로부터 subpics_present_flag를 복호화하고(S1910), subpics_present_flag의 값을 판단한다(S1920).

복호화부(410)는 subpics_present_flag==1인 경우에 max_subpics_minus1, subpic_grid_col_width_minus1 및, subpic_grid_row_height_minus1를 비트스트림으로부터 복호화한다(S1930).

그리드들은 고정된 너비와 높이를 가지므로, subpic_grid_col_width_minus1를 이용하여 그리드 열의 개수(i)가 유도될 수 있으며, subpic_grid_row_height_minus1를 이용하여 그리드 행의 개수(j)가 유도될 수 있다. 결국, subpic_grid_col_width_minus1 및 subpic_grid_row_height_minus1를 이용하여 픽처가 그리드들로 분할될 수 있다.

복호화부(410)는 서브픽처 인덱스를 비트스트림으로부터 복호화하고(S1940), 그리드들 중에서 같은 서브픽처 인덱스가 할당된 그리드들을 하나의 서브픽처로 결정하는 과정을 통해, 픽처를 서브픽처로 분할할 수 있다.

이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

CROSS-REFERENCE TO RELATED APPLICATION

본 특허출원은, 본 명세서에 그 전체가 참고로서 포함되는, 2019년 9월 27일에 한국에 출원한 특허출원번호 제10-2019-0119353호 및, 2020년 9월 7일에 한국에 출원한 특허출원번호 제10-2020-0113632호에 대해 우선권을 주장한다.

Claims

픽처로부터 분할되는 하위 유닛들에 대한 정보를 획득하는 방법으로서,

비트스트림으로부터, 상기 픽처 내 코딩 트리 유닛(coding tree unit, CTU)들의 사이즈(size)를 나타내는 CTU 사이즈 정보를 복호화하는 단계;

상기 픽처 내 서브픽처들을 상기 CTU의 사이즈 단위로 표현하는 서브픽처 분할정보를 상기 비트스트림으로부터 복호화하는 단계;

상기 픽처 내 하나 이상의 타일들의 분할정보를 상기 비트스트림으로부터 복호화하는 단계; 및

상기 픽처 내 하나 이상의 슬라이스들의 분할정보를 상기 비트스트림으로부터 복호화하는 단계를 포함하는, 방법.
제1항에 있어서,

상기 서브픽처 분할정보는,

상기 서브픽처들 각각의 사이즈를 상기 CTU의 사이즈 단위로 표현하는 서브픽처 사이즈 정보를 포함하는, 방법.
제1항에 있어서,

미리 설정된 조건에 의존하여, 상기 슬라이스의 경계에서 필터링이 수행되는지 여부를 지시하는 인에이블 플래그를 상기 비트스트림으로부터 복호화하는 단계를 더 포함하고,

상기 미리 설정된 조건은,

상기 슬라이스의 개수가 복수 개인지 여부 및, 상기 슬라이스의 모드가 직사각형 슬라이스 모드인지 여부 중에서, 하나 이상을 포함하는, 방법.
제3항에 있어서,

상기 인에이블 플래그를 복호화하는 단계는,

상기 슬라이스의 개수가 복수 개이거나 상기 슬라이스의 모드가 직사각형 슬라이스 모드가 아닌 경우에, 상기 인에이블 플래그를 복호화하는, 방법.
영상 복호화 장치로서,

픽처로부터 분할되는 하위 유닛들에 대한 정보를 비트스트림으로부터 획득하는 복호화부; 및

상기 하위 유닛들에 대한 정보에 기초하여, 상기 픽처를 복원하는 픽처 복원부를 포함하고,

상기 복호화부는,

상기 픽처 내 코딩 트리 유닛(coding tree unit, CTU)들의 사이즈(size)를 나타내는 CTU 사이즈 정보를 상기 비트스트림으로부터 복호화하고, 상기 픽처 내 서브픽처들을 상기 CTU의 사이즈 단위로 표현하는 서브픽처 분할정보를 상기 비트스트림으로부터 복호화하며, 상기 픽처 내 하나 이상의 타일들의 분할정보를 상기 비트스트림으로부터 복호화하고, 상기 픽처 내 하나 이상의 슬라이스들의 분할정보를 상기 비트스트림으로부터 복호화하는, 장치.
제5항에 있어서,

상기 서브픽처 분할정보는,

상기 서브픽처들 각각의 사이즈를 상기 CTU의 사이즈 단위로 표현하는 서브픽처 사이즈 정보를 포함하는, 장치.
제5항에 있어서,

상기 복호화부는,

미리 설정된 조건에 의존하여, 상기 슬라이스의 경계에서 필터링이 수행되는지 여부를 지시하는 인에이블 플래그를 상기 비트스트림으로부터 더 복호화하고,

상기 미리 설정된 조건은,

상기 슬라이스의 개수가 복수 개인지 여부 및, 상기 슬라이스의 모드가 직사각형 슬라이스 모드인지 여부 중에서, 하나 이상을 포함하는, 장치.
제7항에 있어서,

상기 복호화부는,

상기 슬라이스의 개수가 복수 개이거나 상기 슬라이스의 모드가 직사각형 슬라이스 모드가 아닌 경우에, 상기 인에이블 플래그를 복호화하는, 장치.
영상 부호화 장치로서,

픽처를 하위 유닛들로 분할하고, 상기 픽처를 부호화하는 픽처 부호부; 및

상기 하위 유닛들에 대한 정보를 부호화하는 부호화부를 포함하고,

상기 부호화부는,

상기 픽처 내 코딩 트리 유닛(coding tree unit, CTU)들의 사이즈(size)를 나타내는 CTU 사이즈 정보를 부호화하고, 상기 픽처 내 서브픽처들을 상기 CTU의 사이즈 단위로 표현하는 서브픽처 분할정보를 부호화하며, 상기 픽처 내 하나 이상의 타일들의 분할정보를 부호화하고, 상기 픽처 내 하나 이상의 슬라이스들의 분할정보를 부호화하는, 장치.