KR20190142717A

KR20190142717A - 인터 예측 방법 및 이를 이용한 영상 복호화 장치

Info

Publication number: KR20190142717A
Application number: KR1020190060392A
Authority: KR
Inventors: 임정연; 신재섭; 이선영
Original assignee: 에스케이텔레콤 주식회사
Priority date: 2018-06-18
Filing date: 2019-05-23
Publication date: 2019-12-27

Abstract

인터 예측 방법 및 이를 이용한 영상 복호화 장치를 개시한다.
본 발명의 일 실시예에 의하면, 머지 후보들이 복수 개의 그룹으로 분류된 머지 후보 리스트 내에서, 비트스트림으로부터 복호화된 그룹정보가 지시하는 그룹을 선택하는 단계; 상기 선택된 그룹 내에서, 상기 비트스트림으로부터 복호화된 머지 인덱스와 대응되는 머지 후보를 선택하는 단계; 및 상기 선택된 머지 후보의 움직임 정보를 기반으로 현재 블록의 움직임 정보를 도출하는 단계를 포함하는 것을 특징으로 하는 인터 예측 방법을 제공한다.

Description

인터 예측 방법 및 이를 이용한 영상 복호화 장치{INTER PREDICTION METHOD AND APPARATUS USING THE SAME}

본 발명은 영상의 부호화 및 복호화에 관한 것으로서, 움직임 정보를 표현하는 새로운 방법을 적용하여 부호화 및 복호화의 효율을 향상시킨 인터 예측 방법 및 이를 이용한 영상 복호화 장치에 관한 것이다.

동영상 데이터는 음성 데이터나 정지 영상 데이터 등에 비하여 많은 데이터량을 가지기 때문에, 압축을 위한 처리 없이 그 자체를 저장하거나 전송하기 위해서는 메모리를 포함하여 많은 하드웨어 자원을 필요로 한다.

따라서, 통상적으로 동영상 데이터를 저장하거나 전송할 때에는 부호화기를 사용하여 동영상 데이터를 압축하여 저장하거나 전송하며, 복호화기에서는 압축된 동영상 데이터를 수신하여 압축을 해제하고 재생한다. 이러한 동영상 압축 기술로는 H.264/AVC를 비롯하여, H.264/AVC에 비해 약 40% 정도의 부호화 효율을 향상시킨 HEVC(High Efficiency Video Coding)가 존재한다.

그러나, 영상의 크기 및 해상도, 프레임율이 점차 증가하고 있고, 이에 따라 부호화해야 하는 데이터량도 증가하고 있으므로 기존의 압축 기술보다 더 부호화 효율이 좋고 화질 개선 효과도 높은 새로운 압축 기술이 요구된다.

이러한 요구에 부응하기 위해 본 발명은 개선된 영상 부호화 및 복호화 기술을 제공하는 것을 목적으로 하며, 특히, 본 발명의 일 측면은 머지 후보의 개수를 증가시켜 머지 모드의 정확성을 향상시키고, 움직임 정보를 표현하는 데 소요되는 비트(bit) 수를 감소시킴으로써 부호화 및 복호화의 효율을 향상시키는 기술과 관련된다.

본 발명의 일 측면은, 머지 후보들이 복수 개의 그룹으로 분류된 머지 후보 리스트 내에서, 비트스트림으로부터 복호화된 그룹정보가 지시하는 그룹을 선택하는 단계; 상기 선택된 그룹 내에서, 상기 비트스트림으로부터 복호화된 머지 인덱스와 대응되는 머지 후보를 선택하는 단계; 및 상기 선택된 머지 후보의 움직임 정보를 기반으로 현재 블록의 움직임 정보를 도출하는 단계를 포함하는 것을 특징으로 하는 인터 예측 방법을 제공한다.

본 발명의 다른 일 측면은, 머지 후보들이 복수 개의 그룹으로 분류된 머지 후보 리스트 내에서, 비트스트림으로부터 복호화된 그룹정보가 지시하는 그룹을 선택하는 그룹 선택부; 상기 선택된 그룹 내에서, 상기 비트스트림으로부터 복호화된 머지 인덱스와 대응되는 머지 후보를 선택하는 후보 선택부; 및 상기 선택된 머지 후보의 움직임 정보를 기반으로 현재 블록의 움직임 정보를 도출하는 도출부를 포함하는 것을 특징으로 하는 영상 복호화 장치를 제공한다.

이상에서 설명한 바와 같이 본 발명의 일 실시예에 의하면, 증가된 개수의 머지 후보들로 구성되는 머지 후보 리스트를 이용하여 최적의 머지 후보를 선택할 수 있으므로 예측에 대한 정확성을 향상시킬 수 있다.

또한, 본 발명의 다른 일 실시예에 의하면, 증가된 개수의 머지 후보들을 표현하기 위해 소요되는 비트 수를 감소시킬 수 있는 새로운 이진화 방법을 적용하도록 구성되므로 비트 효율성을 향상시킬 수 있다.

도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다.
도 2는 QTBTTT 구조를 이용하여 블록을 분할하는 방법을 설명하기 위한 도면이다.
도 3은 복수의 인트라 예측 모드들을 설명하기 위한 도면이다.
도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다.
도 5는 후보 리스트에 포함되는 후보 블록들의 위치를 설명하기 위한 도면이다.
도 6은 본 개시의 기술들을 구현할 수 있는 인터 예측부의 예시적인 블록도이다.
도 7은 머지 후보 리스트와 머지 인덱스를 이용하여 현재 블록을 예측하는 일 예를 설명하기 위한 순서도이다.
도 8 및 도 9는 새로운 이진화 방법을 적용하여 머지 후보들을 표현하는 본 발명의 다양한 실시예를 설명하기 위한 도면이다.
도 10은 복수 개의 그룹으로 분류된 머지 후보 리스트를 기반으로 최적의 머지 후보를 선별하는 본 발명의 일 실시예를 설명하기 위한 순서도이다.
도 11은 머지 후보를 복수 개의 그룹으로 분류하여 머지 후보 리스트를 이진화하는 본 발명의 일 실시예를 설명하기 위한 도면이다.
도 12는 머지 후보 리스트 구성에 이용되는 후보 블록들에 대한 본 발명의 일 실시예를 설명하기 위한 도면이다.
도 13은 예측 모드들을 구분하는 종래 방법을 설명하기 위한 순서도이다.
도 14는 예측 모드들을 구분하는 본 발명의 일 실시예를 설명하기 위한 순서도이다.

이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성 요소들에 식별 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.

도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다. 이하에서는 도 1을 참조하여 영상 부호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.

영상 부호화 장치는 블록 분할부(110), 예측부(120), 감산기(130), 변환부(140), 양자화부(145), 부호화부(150), 역양자화부(160), 역변환부(165), 가산기(170), 필터부(180) 및 메모리(190)를 포함하여 구성될 수 있다.

영상 부호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.

하나의 영상(비디오)는 복수의 픽처들로 구성된다. 각 픽처들은 복수의 영역으로 분할되고 각 영역마다 부호화가 수행된다. 예를 들어, 하나의 픽처는 하나 이상의 타일(Tile) 또는/및 슬라이스(Slice)로 분할된다. 여기서, 하나 이상의 타일을 타일 그룹(Tile Group)으로 정의할 수 있다. 각 타일 또는/슬라이스는 하나 이상의 CTU(Coding Tree Unit)로 분할된다. 그리고 각 CTU는 트리 구조에 의해 하나 이상의 CU(Coding Unit)들로 분할된다. 각 CU에 적용되는 정보들은 CU의 신택스로서 부호화되고, 하나의 CTU에 포함된 CU들에 공통적으로 적용되는 정보는 CTU의 신택스로서 부호화된다. 또한, 하나의 타일 내의 모든 블록들에 공통적으로 적용되는 정보는 타일의 신택스로서 부호화되거나 다수 개의 타일을 모아 놓은 타일 그룹의 신택스로서 부호화되며, 하나의 픽처들을 구성하는 모든 블록들에 적용되는 정보는 픽처 파라미터 셋(PPS, Picture Parameter Set) 혹은 픽처 헤더에 부호화된다. 나아가, 복수의 픽처가 공통으로 참조하는 정보들은 시퀀스 파라미터 셋(SPS, Sequence Parameter Set)에 부호화된다. 그리고, 하나 이상의 SPS가 공통으로 참조하는 정보들은 비디오 파라미터 셋(VPS, Video Parameter Set)에 부호화된다.

블록 분할부(110)는 CTU(Coding Tree Unit)의 크기를 결정한다. CTU의 크기에 대한 정보(CTU size)는 SPS 또는 PPS의 신택스로서 부호화되어 영상 복호화 장치로 전달된다.

블록 분할부(110)는 영상을 구성하는 각 픽처(picture)를 미리 결정된 크기를 가지는 복수의 CTU(Coding Tree Unit)들로 분할한 이후에, 트리 구조(tree structure)를 이용하여 CTU를 반복적으로(recursively) 분할한다. 트리 구조에서의 리프 노드(leaf node)가 부호화의 기본 단위인 CU(coding unit)가 된다.

트리 구조로는 상위 노드(혹은 부모 노드)가 동일한 크기의 네 개의 하위 노드(혹은 자식 노드)로 분할되는 쿼드트리(QuadTree, QT), 또는 상위 노드가 두 개의 하위 노드로 분할되는 바이너리트리(BinaryTree, BT), 또는 상위 노드가 1:2:1 비율로 세 개의 하위 노드로 분할되는 터너리트리(TernaryTree, TT), 또는 이러한 QT 구조, BT 구조 및 TT 구조 중 둘 이상을 혼용한 구조일 수 있다. 예컨대, QTBT(QuadTree plus BinaryTree) 구조가 사용될 수 있고, 또는 QTBTTT(QuadTree plus BinaryTree TernaryTree) 구조가 사용될 수 있다. 여기서, BTTT를 합쳐서 MTT(Multiple-Type Tree)라 칭할 수 있다.

도 2는 QTBTTT 분할 트리 구조를 보인다. 도 2에서 보는 바와 같이, CTU는 먼저 QT 구조로 분할될 수 있다. 쿼드트리 분할은 분할 블록(splitting block)의 크기가 QT에서 허용되는 리프 노드의 최소 블록 크기(MinQTSize)에 도달할 때까지 반복될 수 있다. QT 구조의 각 노드가 하위 레이어의 4개의 노드들로 분할되는지 여부를 지시하는 제1 플래그(QT_split_flag)는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. QT의 리프 노드가 BT에서 허용되는 루트 노드의 최대 블록 크기(MaxBTSize)보다 크지 않은 경우, BT 구조 또는 TT 구조 중 어느 하나 이상으로 더 분할될 수 있다. BT 구조 및/또는 TT 구조에서는 복수의 분할 방향이 존재할 수 있다. 예컨대, 해당 노드의 블록이 가로로 분할되는 방향과 세로로 분할되는 방향 두 가지가 존재할 수 있다. 도 2와 같이, MTT 분할이 시작되면, 노드들이 분할되었는지 여부를 지시하는 제2 플래그(mtt_split_flag)와, 분할이 되었다면 추가적으로 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그 및/또는 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

트리 구조의 다른 예로서, QTBTTT 구조를 사용하여 블록을 분할하는 경우, 먼저 분할 되었음을 나타내는 CU 분할 플래그(split_cu_flag) 및 분할 타입이 QT 분할인지를 지시하는 QT 분할 플래그(split_qt_flag) 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. CU 분할 플래그(split_cu_flag) 값이 분할되지 않았음을 지시하지 않는 경우, 해당 노드의 블록이 분할 트리 구조에서의 리프 노드(leaf node)가 되어 부호화의 기본 단위인 CU(coding unit)가 된다. CU 분할 플래그(split_cu_flag) 값이 분할되었음을 지시하지 않는 경우, QT 분할 플래그(split_qt_flag) 값을 통해 분할 타입이 QT 혹은 MTT인지를 구분한다. 분할 타입이 QT인 경우에는 더 이상의 추가 정보가 없으며, 분할 타입이 MTT인 경우에는 추가적으로 MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

트리 구조의 다른 예시로서 QTBT가 사용되는 경우, 해당 노드의 블록을 동일 크기의 두 개 블록으로 가로로 분할하는 타입(즉, symmetric horizontal splitting)과 세로로 분할하는 타입(즉, symmetric vertical splitting) 두 가지가 존재할 수 있다. BT 구조의 각 노드가 하위 레이어의 블록으로 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할되는 타입을 지시하는 분할 타입 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다. 한편, 해당 노드의 블록을 서로 비대칭 형태의 두 개의 블록으로 분할하는 타입이 추가로 더 존재할 수도 있다. 비대칭 형태에는 해당 노드의 블록을 1:3의 크기 비율을 가지는 두 개의 직사각형 블록으로 분할하는 형태가 포함될 수 있고, 혹은 해당 노드의 블록을 대각선 방향으로 분할하는 형태가 포함될 수도 있다.

CU는 CTU로부터의 QTBT 또는 QTBTTT 분할에 따라 다양한 크기를 가질 수 있다. 이하에서는, 부호화 또는 복호화하고자 하는 CU(즉, QTBTTT의 리프 노드)에 해당하는 블록을 '현재블록'이라 칭한다.

예측부(120)는 현재블록을 예측하여 예측블록을 생성한다. 예측부(120)는 인트라 예측부(122)와 인터 예측부(124)를 포함한다.

일반적으로, 픽처 내 현재블록들은 각각 예측적으로 코딩될 수 있다. 일반적으로 현재블록의 예측은 (현재블록을 포함하는 픽처로부터의 데이터를 사용하는) 인트라 예측 기술 또는 (현재블록을 포함하는 픽처 이전에 코딩된 픽처로부터의 데이터를 사용하는) 인터 예측 기술을 사용하여 수행될 수 있다. 인터 예측은 단방향 예측과 양방향 예측 모두를 포함한다.

인트라 예측부(122)는 현재블록이 포함된 현재 픽처 내에서 현재블록의 주변에 위치한 픽셀(참조 픽셀)들을 이용하여 현재블록 내의 픽셀들을 예측한다. 예측 방향에 따라 복수의 인트라 예측모드가 존재한다. 예컨대, 도 3에서 보는 바와 같이, 복수의 인트라 예측모드는 planar 모드와 DC 모드를 포함하는 비방향성 모드와 65개의 방향성 모드를 포함할 수 있다. 각 예측모드에 따라 사용할 주변 픽셀과 연산식이 다르게 정의된다.

인트라 예측부(122)는 현재블록을 부호화하는데 사용할 인트라 예측 모드를 결정할 수 있다. 일부 예들에서, 인트라 예측부(122)는 여러 인트라 예측 모드들을 사용하여 현재블록을 인코딩하고, 테스트된 모드들로부터 사용할 적절한 인트라 예측 모드를 선택할 수도 있다. 예를 들어, 인트라 예측부(122)는 여러 테스트된 인트라 예측 모드들에 대한 레이트 왜곡(rate-distortion) 분석을 사용하여 레이트 왜곡 값들을 계산하고, 테스트된 모드들 중 최선의 레이트 왜곡 특징들을 갖는 인트라 예측 모드를 선택할 수도 있다.

인트라 예측부(122)는 복수의 인트라 예측 모드 중에서 하나의 인트라 예측 모드를 선택하고, 선택된 인트라 예측 모드에 따라 결정되는 주변 픽셀(참조 픽셀)과 연산식을 사용하여 현재블록을 예측한다. 선택된 인트라 예측 모드에 대한 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.

인터 예측부(124)는 움직임 보상 과정을 통해 현재블록에 대한 예측블록을 생성한다. 현재 픽처보다 먼저 부호화 및 복호화된 참조픽처 내에서 현재블록과 가장 유사한 블록을 탐색하고, 그 탐색된 블록을 이용하여 현재블록에 대한 예측블록을 생성한다. 그리고, 현재 픽처 내의 현재블록과 참조픽처 내의 예측블록 간의 변위(displacement)에 해당하는 움직임벡터(motion vector)를 생성한다. 일반적으로, 움직임 추정은 루마(luma) 성분에 대해 수행되고, 루마 성분에 기초하여 계산된 모션 벡터는 루마 성분 및 크로마 성분 모두에 대해 사용된다. 현재블록을 예측하기 위해 사용된 참조픽처에 대한 정보 및 움직임벡터에 대한 정보를 포함하는 움직임 정보는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.

감산기(130)는 현재블록으로부터 인트라 예측부(122) 또는 인터 예측부(124)에 의해 생성된 예측블록을 감산하여 잔차블록을 생성한다.

변환부(140)는 공간 영역의 픽셀 값들을 가지는 잔차블록 내의 잔차 신호를 주파수 도메인의 변환 계수로 변환한다. 변환부(140)는 잔차블록의 전체 크기를 변환 단위로 사용하여 잔차블록 내의 잔차 신호들을 변환할 수 있으며, 또는 잔차블록을 변환 영역 및 비변환 영역인 두 개의 서브블록으로 구분하여, 변환 영역 서브블록만 변환 단위로 사용하여 잔차 신호들을 변환할 수 있다. 여기서, 변환 영역 서브블록은 가로축 (혹은 세로축) 기준 1:1의 크기 비율을 가지는 두 개의 직사각형 블록 중 하나일 수 있다. 이런 경우, 서브블록 만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 위치 정보(cu_sbt_pos_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. 또한, 변환 영역 서브블록의 크기는 가로축 (혹은 세로축) 기준 1:3의 크기 비율을 가질 수 있으며, 이런 경우 해당 분할을 구분하는 플래그(cu_sbt_quad_flag)가 추가적으로 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

양자화부(145)는 변환부(140)로부터 출력되는 변환 계수들을 양자화하고, 양자화된 변환 계수들을 부호화부(150)로 출력한다.

부호화부(150)는 양자화된 변환 계수들을 CABAC(Context-based Adaptive Binary Arithmetic Code) 등의 부호화 방식을 사용하여 부호화함으로써 비트스트림을 생성한다. 부호화부(150)는 블록 분할과 관련된 CTU size, CU 분할 플래그, QT 분할 플래그, MTT 분할 방향, MTT 분할 타입 등의 정보를 부호화하여, 영상 복호화 장치가 영상 부호화 장치와 동일하게 블록을 분할할 수 있도록 한다.

또한, 부호화부(150)는 현재블록이 인트라 예측에 의해 부호화되었는지 아니면 인터 예측에 의해 부호화되었는지 여부를 지시하는 예측 타입에 대한 정보를 부호화하고, 예측 타입에 따라 인트라 예측정보(즉, 인트라 예측 모드에 대한 정보) 또는 인터 예측정보(참조픽처 및 움직임벡터에 대한 정보)를 부호화한다.

역양자화부(160)는 양자화부(145)로부터 출력되는 양자화된 변환 계수들을 역양자화하여 변환 계수들을 생성한다. 역변환부(165)는 역양자화부(160)로부터 출력되는 변환 계수들을 주파수 도메인으로부터 공간 도메인으로 변환하여 잔차블록을 복원한다.

가산부(170)는 복원된 잔차블록과 예측부(120)에 의해 생성된 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 다음 순서의 블록을 인트라 예측할 때 참조 픽셀로서 사용된다.

필터부(180)는 블록 기반의 예측 및 변환/양자화로 인해 발생하는 블록킹 아티팩트(blocking artifacts), 링잉 아티팩트(ringing artifacts), 블러링 아티팩트(blurring artifacts) 등을 줄이기 위해 복원된 픽셀들에 대한 필터링을 수행한다. 필터부(180)는 디블록킹 필터(182)와 SAO(Sample Adaptive Offset) 필터(184)를 포함할 수 있다.

디블록킹 필터(180)는 블록 단위의 부호화/복호화로 인해 발생하는 블록킹 현상(blocking artifact)을 제거하기 위해 복원된 블록 간의 경계를 필터링하고, SAO 필터(184)는 디블록킹 필터링된 영상에 대해 추가적인 필터링을 수행한다. SAO 필터(184)는 손실 부호화(lossy coding)로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해 사용되는 필터이다.

디블록킹 필터(182) 및 SAO 필터(184)를 통해 필터링된 복원블록은 메모리(190)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.

도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다. 이하에서는 도 4를 참조하여 영상 복호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.

영상 복호화 장치는 복호화부(410), 역양자화부(420), 역변환부(430), 예측부(440), 가산기(450), 필터부(460) 및 메모리(470)를 포함하여 구성될 수 있다.

도 1의 영상 부호화 장치와 마찬가지로, 영상 복호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.

복호화부(410)는 영상 부호화 장치로부터 수신한 비트스트림을 복호화하여 블록 분할과 관련된 정보를 추출함으로써 복호화하고자 하는 현재블록을 결정하고, 현재블록을 복원하기 위해 필요한 예측정보와 잔차신호에 대한 정보 등을 추출한다.

복호화부(410)는 SPS(Sequence Parameter Set) 또는 PPS(Picture Parameter Set)로부터 CTU size에 대한 정보를 추출하여 CTU의 크기를 결정하고, 픽처를 결정된 크기의 CTU로 분할한다. 그리고, CTU를 트리 구조의 최상위 레이어, 즉, 루트 노드로 결정하고, CTU에 대한 분할정보를 추출함으로써 트리 구조를 이용하여 CTU를 분할한다.

예컨대, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 MTT의 분할과 관련된 제2 플래그(MTT_split_flag) 및 분할 방향(vertical / horizontal) 및/또는 분할 타입(binary / ternary) 정보를 추출하여 해당 리프 노드를 MTT 구조로 분할한다. 이를 통해 QT의 리프 노드 이하의 각 노드들을 BT 또는 TT 구조로 반복적으로(recursively) 분할한다.

또 다른 예로서, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 CU의 분할 여부를 지시하는 CU 분할 플래그(split_cu_flag)를 추출하고, 해당 블록이 분할된 경우, QT 분할 플래그(split_qt_flag)를 추출한다. 분할 타입이 QT가 아니고 MTT인 경우, MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)를 추가적으로 추출한다. 분할 과정에서 각 노드는 0번 이상의 반복적인 QT 분할 후에 0번 이상의 반복적인 MTT 분할이 발생할 수 있다. 예컨대, CTU는 바로 MTT 분할이 발생하거나, 반대로 다수 번의 QT 분할만 발생할 수도 있다.

다른 예로서, QTBT 구조를 사용하여 CTU를 분할하는 경우, QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 BT로 더 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할 방향 정보를 추출한다.

한편, 복호화부(410)는 트리 구조의 분할을 통해 복호화하고자 하는 현재블록을 결정하게 되면, 현재블록이 인트라 예측되었는지 아니면 인터 예측되었는지를 지시하는 예측 타입에 대한 정보를 추출한다. 예측 타입 정보가 인트라 예측을 지시하는 경우, 복호화부(410)는 현재블록의 인트라 예측정보(인트라 예측 모드)에 대한 신택스 요소를 추출한다. 예측 타입 정보가 인터 예측을 지시하는 경우, 복호화부(410)는 인터 예측정보에 대한 신택스 요소, 즉, 움직임벡터 및 그 움직임벡터가 참조하는 참조픽처를 나타내는 정보를 추출한다.

한편, 복호화부(410)는 잔차신호에 대한 정보로서 현재블록의 양자화된 변환계수들에 대한 정보를 추출한다.

역양자화부(420)는 양자화된 변환계수들을 역양자화하고, 역변환부(430)는 역양자화된 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환하여 잔차신호들을 복원함으로써 현재블록에 대한 잔차블록을 생성한다.

또한, 역변환부(430)는 변환블록의 일부 영역(서브블록)만 역변환하는 경우, 변환블록의 서브블록만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 서브블록의 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 서브블록의 위치 정보(cu_sbt_pos_flag)를 추출하여, 해당 서브블록의 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환함으로써 잔차신호들을 복원하고, 역변환되지 않은 영역에 대해서는 잔차신호로 "0"값을 채움으로써 현재블록에 대한 최종 잔차블록을 생성한다.

예측부(440)는 인트라 예측부(442) 및 인터 예측부(444)를 포함할 수 있다. 인트라 예측부(442)는 현재블록의 예측 타입이 인트라 예측일 때 활성화되고, 인터 예측부(444)는 현재블록의 예측 타입이 인터 예측일 때 활성화된다.

인트라 예측부(442)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소로부터 복수의 인트라 예측 모드 중 현재블록의 인트라 예측 모드를 결정하고, 인트라 예측 모드에 따라 현재블록 주변의 참조 픽셀들을 이용하여 현재블록을 예측한다.

인터 예측부(444)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소를 이용하여 현재블록의 움직임벡터와 그 움직임벡터가 참조하는 참조픽처를 결정하고, 움직임벡터와 참조픽처를 이용하여 현재블록을 예측한다.

가산기(450)는 역변환부로부터 출력되는 잔차블록과 인터 예측부 또는 인트라 예측부로부터 출력되는 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 이후에 복호화할 블록을 인트라 예측할 때의 참조픽셀로서 활용된다.

필터부(460)는 디블록킹 필터(462) 및 SAO 필터(464)를 포함할 수 있다. 디블록킹 필터(462)는 블록 단위의 복호화로 인해 발생하는 블록킹 현상(blocking artifact)를 제거하기 위해, 복원된 블록 간의 경계를 디블록킹 필터링한다. SAO 필터(464)는 손실 부호화(lossy coding)으로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해, 디블록킹 필터링 이후의 복원된 블록에 대해 추가적인 필터링을 수행한다. 디블록킹 필터(462) 및 SAO 필터(464)를 통해 필터링된 복원블록은 메모리(470)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.

화면 간 예측 부호화/복호화 방법(인터 예측 방법)은 크게 skip 모드(스킵 모드), merge 모드(머지 모드) 및 AMVP(adaptive (or advanced) motion vector predictor) 모드로 구분될 수 있다.

스킵 모드에서는 주변 블록의 움직임 정보 후보들 중 어느 하나의 움직임 정보가 영상 부호화 장치로부터 영상 복호화 장치로 전송된다. 머지 모드에서는 주변 블록의 움직임 정보 후보들 중 어느 하나의 움직임 정보와, 예측 후 잔차(residual)를 부호화한 정보가 전송된다. AMVP 모드에서는 현재 블록의 움직임 정보와, 예측 후 잔차를 부호화한 정보가 전송된다.

스킵 모드 및 머지 모드의 움직임 정보는 머지 후보 리스트에 포함된 후보들 중 어느 하나를 지시하는 인덱스 값으로 표현되며, AMVP 모드의 움직임 정보는 주변 블록의 움직임 정보와 현재 블록의 움직임 정보 사이의 차이 값(mvd, motion vector difference)으로 표현된다.

스킵 모드 및 머지 모드를 위한 머지 후보 리스트를 구성하는 방법은 공간적 후보(spatial candidates)를 탐색하여 머지 후보 리스트에 추가하는 단계, 시간적 후보(temporal candidates)를 탐색하여 머지 후보 리스트에 추가하는 단계, 머지 후보 리스트에 추가된 후보들을 혼합(combined bi-directional candidate)하는 단계 및 제로 움직임 벡터(zero motion vector candidate)를 머지 후보 리스트에 추가하는 단계 등을 거칠 수 있다.

머지 후보 리스트에 추가되는 공간적 후보 및 시간적 후보를 위한 후보 블록들의 위치가 도 5에 표현되어 있다. 도 5 (A)는 공간적 후보를 위한 후보 블록들의 위치를 나타내며, 도 5 (B)는 시간적 후보를 위한 후보 블록들의 위치를 나타낸다.

영상 부호화 장치와 영상 복호화 장치는 A1→B1→B0→A0→B2 순서대로 후보 블록들을 탐색하여 최대 4개의 공간적 후보를 머지 후보 리스트에 포함시킬 수 있다. 또한, 영상 부호화 장치와 영상 복호화 장치는 BR→CT 순서대로 후보 블록들을 탐색하여 최대 1개의 시간적 후보를 머지 후보 리스트에 포함시킬 수 있다. 머지 후보 리스트를 설정하는 과정에서, 동일한 움직임 정보가 있는 경우에는 해당 움직임 정보가 리스트에 추가되지 않는다. 즉, 움직임 정보의 중복은 허용되지 않는다.

머지 후보 리스트에 포함될 수 있는 후보들의 개수에 대한 정보는 slice header에 기록되며, 이 정보를 통해 최대 5개까지의 후보들이 지정될 수 있다. 후보들의 인덱스를 위한 이진화 방법으로 TU(truncated unary) 방식이 사용되며, 아래 표 1은 후보들의 최대 개수가 5개인 경우에 각 후보 인덱스를 표현하는 codeword를 나타낸다.

Index	Codeword	Bits
0	0	1
1	10	2
2	110	3
3	1110	4
4	1111	4

도 6은 본 개시의 기술들을 구현할 수 있는 인터 예측부(444)의 예시적인 블록도이다. 도 6에 도시된 바와 같이, 인터 예측부(444)는 선택부(610), 도출부(620), 예측 실행부(630), 선별부(640) 및 결정부(650)를 포함하여 구성될 수 있으며, 선택부(610)는 그룹 선택부(612) 및 후보 선택부(614)를 포함하여 구성될 수 있다.

선별부(640)와 결정부(650)는 머지 후보들의 개수인 후보 개수에 대한 정보를 이용하여, 하나 이상의 머지 후보로 구성되는 머지 후보 리스트를 결정한다(S710). 여기서, 후보 개수에 대한 정보는 영상 부호화 장치로부터 전송된 후, 복호화부(410)에서의 복호화 과정을 통해 획득될 수 있다. 영상 부호화 장치와 영상 복호화 장치는 동일한 방법 또는 과정을 통해 머지 후보 리스트를 결정 또는 구성할 수 있다.

선택부(610)는 머지 후보 리스트로부터 머지 인덱스와 대응되는 (머지 인덱스가 지시하는) 머지 후보를 선택한다(S720). 머지 인덱스는 머지 후보 리스트에 포함된 머지 후보들 중 어느 하나를 지시하는 정보에 해당하며, 머지 인덱스에 의해 지시되는 머지 후보는 머지 후보 리스트에 포함된 머지 후보들 중 현재 블록과 가장 유사한 움직임 정보를 가지는 최적의 머지 후보에 해당한다.

도출부(620)는 선택된 머지 후보의 움직임 정보를 기반으로 현재 블록의 움직임 정보를 도출하고(S730), 예측 실행부(630)는 도출된 현재 블록의 움직임 정보를 이용하여 현재 블록에 대한 예측 블록을 생성한다(S740).

종래 영상 부호화 장치 또는 영상 복호화 장치는 최대 5개의 머지 후보들로 구성되는 머지 후보 리스트를 결정하도록 구성된다. 본 발명의 영상 부호화 장치 및 영상 복호화 장치는 종래 방법과 동일하게 5개 이하의 머지 후보들로 머지 후보 리스트를 결정하도록 구성되거나, 6개 이상의 머지 후보들로 머지 후보 리스트를 결정하도록 구성될 수 있다. 즉, 본 발명에서, 영상 부호화 장치로부터 영상 복호화 장치로 전송되는 후보 개수에 대한 정보는 6 이상의 자연수를 가질 수 있으며, 영상 복호화 장치는 전송된 후보 개수와 대응되는(동일한) 개수의 머지 후보들로 머지 후보 리스트를 결정할 수 있다.

이와 같이, 본 발명이 더욱 많은 개수의 머지 후보들로 머지 후보 리스트를 결정 또는 구성하면, 현재 블록의 움직임 정보를 도출하기 위한 선택의 폭이 종래 방법에 비해 상대적으로 넓어지게 된다. 따라서, 본 발명은 현재 블록의 실제 움직임 정보와 더욱 매칭되는 최적의 움직임 정보를 현재 블록의 움직임 정보로 활용할 수 있게 되므로 현재 블록의 움직임 정보를 더욱 정확하게 추정할 수 있다.

한편, 종래 영상 부호화 장치와 영상 복호화 장치는 5개 이하의 머지 후보들로 머지 후보 리스트를 구성함과 동시에, TU(truncated unary) 이진화 방법을 이용하여 머지 후보 리스트에 포함된 머지 후보들의 인덱스(머지 인덱스)를 표현하였다.

종래 방법은 상대적으로 적은 개수(최대 5개)의 머지 후보들을 이용하여 머지 후보 리스트를 구성하므로, 머지 인덱스 표현에 소요되는 비트 수가 후보 개수에 비례적으로 증가하는 TU 이진화 방법을 이용하더라도 머지 인덱스를 표현 또는 시그널링하는데 많은 비트가 소요되지 않아 비트 효율성 측면에서 큰 문제가 발생하지 않았다.

그러나, 전술된 바와 같이, 움직임 정보에 대한 정확한 추정을 도모하기 위하여 상대적으로 많은 개수(6개 이상)의 머지 후보들을 머지 후보 리스트로 이용하면, TU 이진화 방법의 특성상 머지 인덱스 표현에 소요되는 비트 수가 증가하게 되므로 비트 효율성이 저하될 수 있다.

따라서, 본 발명은 머지 후보의 개수를 증가시키는 전술된 실시예에서 TU 이진화 방법 이외에 다른 이진화 방법을 적용하거나, TU 이진화 방법과 다른 이진화 방법을 혼용하여 적용함으로써 움직임 정보에 대한 정확한 추정과 비트 효율성을 동시에 달성할 수 있는 새로운 방법을 제시한다.

다른 이진화 방법에는 EG(exponential golomb) 이진화 방법, TR(truncated rice) 이진화 방법, FL(fixed length) 이진화 방법 등 다양한 이진화 방법들이 포함될 수 있다. 이하에서는, 이 새로운 이진화 방법들이 하나 이상 포함된 부호화 방법을 제2방법이라 지칭하며, 종래 이진화 방법에 해당하는 TU 이진화 방법을 제1방법이라 지칭하도록 한다.

도 8 및 도 9는 새로운 이진화 방법을 적용하여 머지 후보들을 표현하는 본 발명의 다양한 실시예를 설명하기 위한 도면이다. 도 8에는 움직임 정보의 인덱스를 TU 이진화 방법 즉, 제1방법으로 부호화한 경우의 비트 수 및 제2방법 중 EG 이진화 방법으로 부호화한 경우의 비트 수를 비교하는 표가 도시되어 있다. 여기서, EG를 위한 k 값은 “0”이다.

표의 내부 구성과 관련하여, 머지 인덱스를 TU 이진화 방법으로 부호화한 codeword와 EG 이진화 방법으로 부호화한 codeword가 표현되어 있으며, 각 codeword의 표현에 소요되는 비트 수가 TU와 EG 각각에 대하여 표현되어 있고, TU 이진화 방법에 의한 비트 수와 EG 이진화 방법에 의한 비트 수 사이의 차이(bits difference)가 표현되어 있다.

도 8에 표현된 바와 같이, 인덱스 0, 2 및 4에서 TU 이진화 방법과 EG 이진화 방법 사이에 비트 수 차이가 발생하지 않으나(0), 인덱스 1 및 3에서 EG 이진화 방법의 비트 수가 증가하고(+1), 나머지 인덱스(인덱스 5 이상)에서 EG 이진화 방법의 비트 수가 감소하게 된다. 본 발명이 6개 이상의 머지 후보들로 머지 후보 리스트를 형성하도록 구성되는 경우, 인덱스 4 이후(인덱스 5 이상)의 모든 인덱스에 대해 비트 수가 감소하는 효과를 얻을 수 있다.

즉, 인덱스 5 이상의 머지 인덱스가 영상 부호화 장치로부터 영상 복호화 장치로 전송되는 경우, 머지 인덱스를 EG 이진화 방법으로 부호화하는 본 발명의 일 실시예가 TU 이진화 방법으로 부호화하는 종래 방법에 비해 머지 인덱스를 표현하는데 소요되는 비트 수를 감소시킬 수 있다.

도 9에는 움직임 정보의 인덱스를 TU 이진화 방법으로 부호화한 경우의 비트 수와 TR 이진화 방법으로 부호화한 경우의 비트 수를 비교하기 위한 표가 도시되어 있다. 도 9에 표현된 표의 내부 구성은 도 8에 표현된 표의 내부 구성과 동일하다. 여기서, TR을 위한 cRiceParam 값은 “1”이고, cMax 값은 “10”이다.

도 9에 표현된 바와 같이, TR 이진화 방법이 적용된 경우, 인덱스 1 및 2를 표현하는 비트 수 사이에 차이가 발생하지 않으며(0), 인덱스 0을 표현하는 비트 수는 증가하나(+1), 나머지 인덱스를 표현하는 비트 수는 감소하게 된다.

6개 이상의 머지 후보들로 머지 후보 리스트를 형성하는 본 발명의 일 실시예를 중심으로 살펴보면, 인덱스 4 이후의 모든 인덱스에 대해 비트 수가 감소하는 효과를 나타낸다. 이에 더하여, 5개 이하의 머지 후보들로 머지 후보 리스트를 구성하는 경우에도 인덱스 3 및 4를 표현하는데 소요되는 비트 수가 감소하게 된다.

이상에서는, 부호화 방법 중 EG 이진화 방법과 TR 이진화 방법을 적용한 결과에 대하여 설명하였으나, 새로운 이진화 방법으로 FL 이진화 방법 등 다양한 이진화 방법들이 적용될 수 있다.

도 8 및 도 9를 이용하여 설명된 바와 같이, 새로운 이진화 방법인 제2방법을 이용하여 머지 인덱스를 부호화하는 실시예의 경우, 비트 수 감소는 머지 후보 리스트에 포함되는 머지 인덱스의 개수에 따라 가변적으로 발생한다고 할 수 있다. 예를 들어, 새로운 이진화 방법인 EG 이진화 방법이 적용되는 경우, 머지 후보 리스트에 6개 이상의 머지 인덱스가 포함된 경우에 한하여 비트 수 감소의 효과를 얻을 수 있다. 또한, TR 이진화 방법이 적용되는 경우, 머지 후보 리스트에 4개 이상의 머지 후보가 포함된 경우에 한하여 비트 수 감소의 효과를 얻을 수 있다.

이와 같은 점에 착안하여, 본 발명은 머지 후보 리스트에 포함되는 머지 인덱스의 개수 즉, 후보 개수에 대한 정보가 나타내는 머지 후보의 개수에 따라 머지 인덱스가 부호화되는 방법을 가변적으로 결정할 수 있다.

일 예로, 본 발명은 머지 후보 리스트에 포함되는 머지 후보의 개수가 6개 이상인 경우 머지 인덱스를 제2방법 중 어느 하나의 방법으로 부호화하고, 머지 후보 리스트에 포함되는 머지 후보의 개수가 5개 이하인 경우 머지 인덱스를 TU 이진화 방법으로 부호화할 수 있다. 또 다른 예로, 본 발명은 머지 후보 리스트에 포함되는 머지 후보의 개수가 4개 ~ 5개인 경우 머지 인덱스를 TR 이진화 방법으로 부호화할 수 있다.

도 10은 복수 개의 그룹으로 분류된 머지 후보 리스트를 기반으로 최적의 머지 후보를 선별하는 본 발명의 일 실시예를 설명하기 위한 순서도이며, 도 11은 머지 후보를 복수 개의 그룹으로 분류하여 머지 후보 리스트를 이진화하는 본 발명의 일 실시예를 설명하기 위한 도면이고, 도 12는 머지 후보 리스트 구성에 이용되는 후보 블록들에 대한 본 발명의 일 실시예를 설명하기 위한 도면이다.

본 발명은 머지 후보 리스트에 포함되는 머지 후보들을 복수 개의 그룹으로 분류하고, 이 복수 개의 그룹을 구분하는 정보를 추가적으로 시그널링함으로써 최적의 머지 후보를 선별하도록 구성될 수 있다.

영상 부호화 장치는 머지 후보 리스트에 포함되는 머지 후보들을 복수 개의 그룹으로 구분하고, 최적의 머지 후보가 선별되면 해당 후보가 속하는 그룹이 어떤 그룹인지를 지시하는 정보(그룹정보)를 전송한 후, 해당 그룹 내 최적의 머지 후보에 대한 인덱스(머지 인덱스) 값을 전송한다.

복호화부(410)는 비트스트림으로부터 그룹정보를 파싱(parsing) 및 복호화하고(S1030), 선택부(610)에 포함된 그룹 선택부(612)는 복호화된 그룹정보가 지시하는 그룹을 판단 또는 선택한다(S1040). 여기서, 그룹정보는 복수 개의 그룹들 중 어느 하나의 그룹을 지시하는 정보로서, 이 그룹정보가 지시하는 그룹은 현재 블록의 움직임 정보 도출에 이용될(머지 인덱스와 대응되는) 머지 후보가 포함되어 있는 그룹에 해당한다.

머지 후보 리스트가 두 개의 그룹으로 구성되는 경우, 그룹정보는 도 10에 표현된 바와 같이 두 개의 그룹들 중 첫 번째 그룹을 지시하는 플래그(MPC_flag)로 이루어질 수 있다. 머지 인덱스는 이 첫 번째 그룹으로 분류된 머지 후보들 중 어느 하나를 지시하는 형태(MPC_idx)와 다른 그룹으로 분류된 머지 후보를 지시하는 형태(other_idx)로 이루어질 수 있다.

머지 후보 리스트가 세 개 이상의 그룹으로 구성되는 경우, 그룹정보는 세 개 이상의 그룹들 중 어느 하나를 지시하는 인덱스 정보로 이루어질 수 있으며, 머지 인덱스는 그룹정보가 지시하는 그룹으로 분류된 머지 후보들 중 어느 하나를 지시하는 형태로 이루어질 수 있다.

그룹정보가 지시하는 그룹이 판단되면, 복호화부(410)는 비트스트림으로부터 머지 인덱스를 파싱 및 복호화하고(S1050, S1070), 선택부(610)에 포함된 후보 선택부(614)는 지시된 그룹으로부터 머지 인덱스와 대응되는 머지 후보를 선택한다.

머지 후보 리스트가 두 개의 그룹으로 구성되는 실시예에서, 그룹정보가 첫 번째 그룹을 지시하는 경우(MPC_flag=1), 후보 선택부(614)는 이 첫 번째 그룹으로 분류된 머지 후보들 중 머지 인덱스(MPC_idx)와 대응되는 머지 후보를 선택한다. 이와 달리, 그룹정보가 첫 번째 그룹을 지시하지 않는 경우(MPC_flag≠1), 후보 선택부(614)는 다른 그룹으로 분류된 머지 후보들 중 머지 인덱스(other_idx)와 대응되는 머지 후보를 선택한다.

도출부(620)는 선택된 머지 후보의 움직임 정보를 기반으로 현재 블록의 움직임 정보를 도출하고, 예측 실행부(630)는 도출된 현재 블록의 움직임 정보를 이용하여 현재 블록에 대한 예측 블록을 생성한다.

후술되는 바와 같이, 본 발명에서는 예측 모드를 구분하는 새로운 방법을 제안하며, 도 10에 표현된 전체 과정들 중 S1010 과정, S1020 과정, S1060 과정 및 S1080 과정들은 이 새로운 방법이 적용된 결과들에 해당한다. 예측 모드를 구분하는 새로운 방법에 대한 상세한 설명은 후술한다.

도 11의 표는 두 개의 그룹들로 구성된 머지 후보 리스트를 나타내며, TU 이진화 방법만으로 머지 인덱스를 부호화한 경우와, 플래그로 이루어진 그룹정보와 TU 및 FL 이진화 방법을 혼용하여 머지 인덱스를 부호화한 경우 사이의 비트 수 비교를 나타낸다.

인덱스 0~2의 codeword에 표현된 플래그 비트 값 “1”은 해당 인덱스 즉, 해당 머지 후보가 그룹 Ⅰ에 속함을 나타내며, 인덱스 3~10의 codeword에 표현된 플래그 비트 값 “0”은 해당 머지 후보가 그룹 Ⅱ에 속함을 나타낸다.

도 11에 표현된 바와 같이, 머지 후보들을 두 개의 그룹으로 구분하고 각 그룹에 TU 및 FL 이진화 방법 중 어느 하나의 방법을 적용하면, TU 이진화 방법만을 적용한 경우에 비해, 그룹 Ⅱ에서는 동일하거나 상대적으로 적은 비트 수(플래그 비트 포함)가 소요되는 효과를 얻을 수 있다.

도 11을 통해 복수 개의 그룹이 TU 이진화 방법과 FL 이진화 방법을 혼용하여 부호화되는 실시예에 대해서만 설명하였으나, 전술된 EG 이진화 방법 또는 TR 이진화 방법 등이 적용될 수도 있다. 이러한 점을 일반화하여 설명하면, 머지 인덱스는 머지 후보 리스트에 포함된 복수 개의 그룹별로(그룹정보가 지시하는 그룹 별로) 서로 다른 이진화 방법을 이용하여 부호화될 수 있다.

한편, 머지 후보 리스트에 포함될 수 있는 주변 블록(후보 블록)과 관련하여, 종래 방법은 현재 픽처 내 현재 블록에 인접한 좌측 블록, 상단 블록, 우상단 블록, 좌하단 블록, 좌상단 블록 중에서 전부 또는 일부를 후보 블록으로 사용하였다. 또한, 종래 방법은 현재 블록을 포함하는 현재 픽처가 아닌, collocated 참조 픽처 내에 위치하는 collocated 블록들을 후보 블록으로 사용하였다. 예를 들어, collocated 참조 픽처 내 현재 블록과 동일한 지점에 위치하는 블록(collocated block) 또는 이 동일 위치의 블록에 인접한 블록들을 후보 블록으로 더 사용하였다. 여기서, collocated 참조 픽처에 대한 정보는 상위 헤더(예컨데, slice header)에서 전송될 수 있다.

본 발명은 머지 후보 리스트에 포함될 수 있는 주변 블록들에 대한 새로운 예시(새로운 주변 블록)를 제안한다. 본 발명에서, 새로운 주변 블록들을 포함하여 머지 후보 리스트 구성에 이용될 수 있는 주변 블록에 대한 예가 도 12에 도시되어 있다.

도 12 (a)는 공간적 주변 블록에 대한 예이며, 도 12 (b)는 시간적 주변 블록에 대한 예이고, 도 12 (c)는 중앙 주변 블록에 대한 예이며, 도 12 (d)는 비인접 주변 블록에 대한 예이다.

공간적 주변 블록은 현재 블록(1200)에 인접하게 위치하되, 현재 블록(1200)을 구성하는 모서리의 가장자리에 위치한 주변 블록들을 의미한다. 구체적으로, 도 12 (a)에 표현된 바와 같이, 현재 블록(1200)의 좌측에 위치한 주변 블록(A1), 상단에 위치한 주변 블록(B1), 우측 상단에 위치한 주변 블록(B0), 좌측 하단에 위치한 주변 블록(A0) 및 좌측 상단에 위치한 주변 블록(B2)이 공간적 주변 블록에 포함될 수 있다.

시간적 주변 블록은 collocated 참조 픽처에 위치하는 주변 블록을 의미한다. 도 11 (b)에 표현된 바와 같이, 이 시간적 주변 블록에는 collocated 참조 픽처 내에서 현재 블록과 동일한 지점에 위치하는 블록(collocated block, 1210)을 중심으로, 이 블록(1210) 내에 위치하는 주변 블록(CT), collocated 블록(1210)의 우측 하단에 위치하는 주변 블록(BR), collocated 블록(1110)의 우측에 위치하는 주변 블록(TR) 및 collocated 블록(1110)의 하단에 위치하는 주변 블록(BL) 등이 포함될 수 있다.

중앙 주변 블록은 현재 블록(1200)과 인접하게 위치하되, 현재 블록(1200)을 구성하는 모서리의 중앙부에 위치한 주변 블록을 의미한다. 도 12 (c)에 표현된 바와 같이, 이 중앙 주변 블록에는 현재 블록(1200)의 상단 중앙부에 위치한 블록들(T1, T2) 및 좌측 중앙부에 위치한 블록들(L1, L2)이 포함될 수 있다.

비인접 주변 블록은 현재 블록(1200)과 미리 설정된 거리만큼 이격되어 위치하는 주변 블록을 의미한다. 도 12 (d)에 표현된 바와 같이, 비인접 주변 블록에는 현재 블록(1200)과 인접하지 않게 위치한 블록들 중 현재 블록(1200)과 미리 설정된 거리에 위치하는 블록들(N0, N1, N2 및 N3)이 포함될 수 있다. 예를 들어, 현재 블록(1200)의 크기가 16x16이고 움직임 정보가 4x4 단위로 메모리(190, 470) 상에 저장되어 있다면, 현재 블록(1200)과 4-pixels만큼 떨어진 위치에 자리하는 주변 블록들(N0, N1, N2 및 N3) 중 하나 이상이 비인접 주변 블록으로 사용될 수 있다. 여기서, 현재 블록(1200)과 비인접 블록 사이의 미리 설정된 이격 거리는 메모리(190, 470)에 저장될 수 있다.

선별부(640)는 공간적 주변 블록, 시간적 주변 블록, 중앙 주변 블록 및 비인접 주변 블록으로부터 하나 이상의 주변 블록(머지 후보)을 선별하되, 영상 부호화 장치로부터 전송된 후보 개수와 동일한 개수의 주변 블록을 선별할 수 있다.

주변 블록의 선별이 완료되면, 결정부(650)는 선별된 머지 후보들을 복수 개의 그룹으로 분류하여 머지 후보 리스트를 결정한다.

주변 블록을 복수 개의 그룹으로 분류하는 과정은 공간적 주변 블록, 시간적 주변 블록, 중앙 주변 블록 및 비인접 주변 블록 각각을 구분하여 수행될 수 있다. 구체적으로, 머지 후보 리스트가 두 개의 그룹으로 구성되는 경우, 공간적 주변 블록으로부터 선별된 머지 후보가 그룹 Ⅰ로 분류되고, 시간적 주변 블록으로부터 선별된 머지 후보, 중앙 주변 블록으로부터 선별된 머지 후보 및 비인접 주변 블록으로부터 선별된 머지 후보가 그룹 Ⅱ로 분류될 수 있다. 다른 예로, 공간적 주변 블록으로부터 선별된 머지 후보와 시간적 주변 블록으로부터 선별된 머지 후보가 그룹 Ⅰ로 분류되고, 중앙 주변 블록으로부터 선별된 머지 후보 및 비인접 주변 블록으로부터 선별된 머지 후보가 그룹 Ⅱ로 분류될 수 있다. 또 다른 예로, 네 종류의 주변 블록을 구분하여 그룹별로 분류하는 것이 아닌, 선별된 주변 블록들 전체 중 일정 개수의 주변 블록이 그룹 Ⅰ로 분류되고, 나머지가 그룹 Ⅱ로 분류될 수도 있다.

도 13은 예측 모드들을 구분하는 종래 방법을 설명하기 위한 순서도이며, 도 14는 예측 모드들을 구분하는 본 발명의 일 실시예를 설명하기 위한 순서도이다.

도 13에 도시된 바와 같이, 예측 모드들을 구분하는 종래 방법은 스킵 모드와 머지 모드를 구별하는 플래그가 각각 존재하고, 이 플래그들의 값에 따라 머지 인덱스를 시그널링한다. 머지 후보 리스트를 구성하는 방법이나 머지 인덱스를 시그널링하는 방법은 스킵 모드와 머지 모드에서 동일하게 수행될 수 있다. 다만, 스킵 모드인 경우에 해당 블록의 크기가 2Nx2N인 반면, 머지 모드인 경우에 해당 블록의 크기가 2Nx2N 뿐만 아니라 2NxN, Nx2N, asymmetric partition일 수 있다.

해당 블록이 2Nx2N의 크기를 가지면서 all zero 변환 계수를 가지는 경우에 해당 블록은 스킵 모드로 분류된다. 따라서, 2Nx2N의 크기를 가지는 해당 블록이 머지 모드로 분류되기 위해서는 해당 블록이 최소 1개 이상의 non zero 변환 계수를 가지고 있어야 한다. 해당 블록이 하나 이상의 non zero 변환 계수를 가지는지 여부는 rqt_root_cbf를 통해 지시될 수 있다. 스킵 모드인 경우에는 rqt_root_cbf가 시그널링되지 않고 그 값이 “0”으로 설정되며, 머지 모드이면서 해당 블록의 크기가 2Nx2N인 경우에는 rqt_root_cbf가 시그널링되지 않고 그 값이 “1”로 설정된다. 머지 모드이면서 해당 블록의 크기가 2Nx2N이 아닌 경우에는 rqt_root_cbf가 명시적으로 시그널링된다.

종래 방법에서 이용되는 스킵 모드 및 머지 모드에 대한 플래그 및 머지 인덱스 값을 표현하면 아래 표 2 및 표 3과 같다.

coding_unit(　x0,　y0,　log2CbSize　) {	Descriptor
if( slice_type != I )
cu_skip_flag[　x0　][　y0　]	ae(v)
if( cu_skip_flag[　x0　][　y0　] )
prediction_unit(　x0,　y0,　nCbS,　nCbS　)
else {
if( slice_type != I )
pred_mode_flag	ae(v)
…
if( CuPredMode[　x0　][　y0　] != MODE_INTRA \|　\| log2CbSize =　= MinCbLog2SizeY )
part_mode	ae(v)
if( CuPredMode[　x0　][　y0　] =　= MODE_INTRA ) {
…
} else {
if( PartMode =　= PART_2Nx2N )
prediction_unit(　x0,　y0,　nCbS,　nCbS　)
…
} …
}
…

prediction_unit(　x0,　y0,　nPbW,　nPbH　) {	Descriptor
if( cu_skip_flag[　x0　][　y0　] ) {
if( MaxNumMergeCand > 1 )
merge_idx[　x0　][　y0　]	ae(v)
} else { /* MODE_INTER */
merge_flag[　x0　][　y0　]	ae(v)
if( merge_flag[　x0　][　y0　] ) {
if( MaxNumMergeCand > 1 )
merge_idx[　x0　][　y0　]	ae(v)
} else {
…
}

도 13에 도시된 바와 같이, 예측 모드들을 구분하는 종래 방법은 스킵 모드에 해당하는지 여부를 지시하는 플래그(skip_flag)와 머지 모드에 해당하는지 여부를 지시하는 플래그(merge_flag)를 구분하여 사용한다. 따라서, 해당 플래그들을 복호화 및 분석하는 프로세싱(S1310, S1320, S1344 및 S1346)이 별도로 구현되게 된다.

또한, 종래 방법에서는 현재 블록이 머지 모드로 예측되는지 판단하기 위해, 스킵 모드에 해당하는지 여부를 지시하는 플래그(skip_flag)의 복호화 및 분석(S1310, S1320), 인터 모드로 예측되는지 여부를 지시하는 플래그(pred_mode_flag)의 복호화 및 분석(S1330, S1340), 머지 모드에 해당하는지 여부를 지시하는 플래그(merge_flag)의 복호화 및 분석(S1344, S1346) 등을 거치게 된다.

이와 같이, 종래 방법은 아래에서 서술되는 본 발명에 비해 상대적으로 많은 프로세싱을 거쳐 예측 모드들을 구분 및 판단하도록 구성되므로 영상 부호화 및 복호화의 효율성이 저하되는 문제점을 가지고 있다.

본 발명은 현재 블록이 스킵 모드와 머지 모드 중 어느 모드에 해당하는지 여부를 단일 번의 프로세싱을 통해 판단하고, 상대적으로 적은 과정을 거쳐 현재 블록의 예측 모드를 판단하도록 구성됨으로써 이러한 문제점을 해결할 수 있다. 본 명세서는 부호화/복호화 대상 블록의 크기가 MxN(M과 N은 동일할 수 있음)임을 기준으로 하며, 대상 블록의 크기는 예측 모드에 따라 달라지지 않고 동일하다.

먼저, 도 14에 도시된 바와 같이, 영상 부호화 장치로부터 전송된 merge_flag가 파싱 및 복호화된다(S1410). 여기서, merge_flag는 스킵 모드와 머지 모드가 통합된 제1모드 및 인터 모드와 인트라 모드가 통합된 제2모드 중 현재 블록의 예측에 이용되는 모드를 지시한다.

복호화된 merge_flag를 분석 또는 해석한 결과(S1420), merge_flag가 제1모드를 지시하는 경우, 머지 후보 리스트에 포함된 머지 후보들 중 어느 하나를 지시하는 인덱스인 merge_idx가 파싱 및 복호화된다(S1430). 또한, 현재 블록이 제1모드(스킵 모드 및 머지 모드) 중 어느 예측 모드로 예측되는지 판단하기 위하여, 변환 계수가 모두 0에 해당하는지 여부(non-zero 변환 계수가 존재하는지 여부)를 지시하는 cu_cbf가 파싱 및 복호화되고(S1432), 복호화된 cu_cbf가 분석된다(S1434).

cu_cbf가 모두 0인 변환 계수를 지시하는 경우(0), 이는 현재 블록이 영상 부호화 장치에서 스킵 모드로 예측되었음을 의미한다. 따라서, 해당 현재 블록은 스킵 모드로 예측된다. 이와 달리, cu_cbf가 non-zero 변환 계수를 지시하는 경우(1), 이는 현재 블록이 영상 부호화 장치에서 머지 모드로 예측되었음을 의미한다. 따라서, 해당 현재 블록은 머지 모드로 예측된다.

이와 같이, 본 발명은, merge_flag를 이용하여 제2모드와 제1모드 중 현재 블록의 예측 모드를 판단하는 과정과, cu_cbf를 이용하여 스킵 모드와 머지 모드를 구분하는 과정 등 더욱 간소화된 과정들을 거쳐 예측 모드를 구분하도록 구성되므로, 영상 부호화 및 복호화의 효율성을 향상시킬 수 있다.

다시, merge_flag를 분석하는 단계(S1420)로 올라가, merge_flag가 인터(AMVP) 모드와 인트라 모드가 통합된 제2모드를 지시하는 경우, 현재 블록이 인터 모드와 인트라 모드 중 어느 예측 모드로 예측되었는지를 지시하는 플래그(pred_mode_flag)가 파싱 및 복호화되고(S1440), 복호화된 pred_mode_flag가 분석된다(S1442).

pred_mode_flag가 인트라 모드를 지시하는 경우, cu_cbf가 1로 설정되며(S1446), 현재 블록이 인트라 모드로 예측된다. 이와 달리, pred_mode_flag가 인터 모드를 지시하는 경우, cu_cbf가 파싱 및 복호화된 후(S1444), 현재 블록이 AMVP 모드로 예측된다.

이상에서 설명된 “예측 모드를 통합적으로 구분하는 방법”과 이에 앞서 설명된 “머지 후보 리스트를 그룹화하는 방법”의 결합에 대한 일 실시예를 도 10을 이용하여 다시 설명하면 아래와 같다. 도 10에 표현된 실시예는 머지 후보 리스트를 두 개의 그룹으로 분류한 예에 해당한다.

먼저, merge_flag를 복호화 및 분석하여 제1모드와 제2모드를 구분하는 과정(S1010, S1020)이 수행된다. 현재 블록의 예측 모드가 제1모드로 판단되는 경우, 두 개의 그룹들 중 첫 번째 그룹을 지시하는 그룹정보(최적의 머지 후보가 그룹 Ⅰ에 속하는지 여부를 지시하는 그룹정보)인 MPC_flag가 복호화 및 분석된다(S1030, S1040).

최적의 머지 후보가 그룹 Ⅰ에 속하는 경우(MPC_flag=1), 최적의 머지 후보를 지시하는 머지 인덱스인 MPC_idx가 파싱 및 복호화되며(S1050), MPC_idx를 이용하여 그룹 Ⅰ로부터 최적의 머지 후보(머지 인덱스와 대응되는 머지 후보)가 선별 또는 선택된다. 이와 달리, 머지 후보가 다른 그룹(그룹 Ⅱ)에 속하는 경우(MPC_flag=0), 최적의 머지 후보를 지시(그룹 Ⅱ에 속한 머지 후보들 중 어느 하나를 지시)하는 머지 인덱스(other_idx)가 파싱 및 복호화되며(S1070), other_idx를 이용하여 그룹 Ⅱ로부터 최적의 머지 후보가 선별된다.

최적의 머지 후보가 선별되면, cu_cbf가 복호화 및 분석(S1060, S1080)되어 스킵 모드와 머지 모드를 구분 과정이 수행된다.

이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

120, 440: 예측부 130: 감산기
170: 가산기 180, 460: 필터부

Claims

머지 후보들이 복수 개의 그룹으로 분류된 머지 후보 리스트 내에서, 비트스트림으로부터 복호화된 그룹정보가 지시하는 그룹을 선택하는 단계;
상기 선택된 그룹 내에서, 상기 비트스트림으로부터 복호화된 머지 인덱스와 대응되는 머지 후보를 선택하는 단계; 및
상기 선택된 머지 후보의 움직임 정보를 기반으로 현재 블록의 움직임 정보를 도출하는 단계를 포함하는 것을 특징으로 하는 인터 예측 방법.
제1항에 있어서, 상기 머지 인덱스는,
상기 그룹정보가 지시하는 그룹 별로, 서로 다른 이진화 방법으로 부호화된 것을 특징으로 하는 인터 예측 방법.
제1항에 있어서,
상기 현재 블록의 주변 블록들을 탐색하여 상기 머지 후보들을 선별하는 단계; 및
상기 선별된 머지 후보들을 상기 복수 개의 그룹으로 분류하여 상기 머지 후보 리스트를 결정하는 단계를 더 포함하고,
상기 주변 블록은,
상기 현재 블록과 인접하게 위치하되, 상기 현재 블록을 구성하는 모서리의 가장자리에 위치한 공간적 주변 블록;
참조 픽처의 내부에 위치하는 하나 이상의 시간적 주변 블록;
상기 현재 블록과 인접하게 위치하되, 상기 현재 블록을 구성하는 모서리의 중앙부에 위치한 하나 이상의 중앙 주변 블록; 및
상기 현재 블록과 미리 설정된 거리만큼 이격되어 위치하는 하나 이상의 비인접 주변 블록을 포함하는 것을 특징으로 하는 인터 예측 방법.
제3항에 있어서, 상기 시간적 주변 블록은,
상기 현재 블록의 collocated 블록 내에 위치한 블록, 상기 collocated 블록의 우측 하단에 위치한 블록, 상기 collocated 블록의 우측에 위치한 블록 및 상기 collocated 블록의 하단에 위치한 블록을 포함하는 것을 특징으로 하는 인터 예측 방법.
제3항에 있어서, 상기 결정하는 단계는,
상기 공간적 주변 블록으로부터 선별된 머지 후보, 상기 시간적 주변 블록으로부터 선별된 머지 후보, 상기 중앙 주변 블록으로부터 선별된 머지 후보 및 상기 비인접 주변 블록으로부터 선별된 머지 후보를 각각 구분하여 상기 복수 개의 그룹으로 분류하는 것을 특징으로 하는 인터 예측 방법.
머지 후보들이 복수 개의 그룹으로 분류된 머지 후보 리스트 내에서, 비트스트림으로부터 복호화된 그룹정보가 지시하는 그룹을 선택하는 그룹 선택부;
상기 선택된 그룹 내에서, 상기 비트스트림으로부터 복호화된 머지 인덱스와 대응되는 머지 후보를 선택하는 후보 선택부; 및
상기 선택된 머지 후보의 움직임 정보를 기반으로 현재 블록의 움직임 정보를 도출하는 도출부를 포함하는 것을 특징으로 하는 영상 복호화 장치.
제6항에 있어서, 상기 머지 인덱스는,
상기 그룹정보가 지시하는 그룹 별로, 서로 다른 이진화 방법으로 부호화된 것을 특징으로 하는 영상 복호화 장치.
제6항에 있어서,
상기 현재 블록의 주변 블록들을 탐색하여 상기 머지 후보들을 선별하는 선별부; 및
상기 선별된 머지 후보들을 상기 복수 개의 그룹으로 분류하여 상기 머지 후보 리스트를 결정하는 결정부를 더 포함하고,
상기 주변 블록은,
상기 현재 블록과 인접하게 위치하되, 상기 현재 블록을 구성하는 모서리의 가장자리에 위치한 공간적 주변 블록;
참조 픽처의 내부에 위치하는 하나 이상의 시간적 주변 블록;
상기 현재 블록과 인접하게 위치하되, 상기 현재 블록을 구성하는 모서리의 중앙부에 위치한 하나 이상의 중앙 주변 블록; 및
상기 현재 블록과 미리 설정된 거리만큼 이격되어 위치하는 하나 이상의 비인접 주변 블록을 포함하는 것을 특징으로 하는 영상 복호화 장치.
제8항에 있어서, 상기 시간적 주변 블록은,
상기 현재 블록의 collocated 블록 내에 위치한 블록, 상기 collocated 블록의 우측 하단에 위치한 블록, 상기 collocated 블록의 우측에 위치한 블록 및 상기 collocated 블록의 하단에 위치한 블록을 포함하는 것을 특징으로 하는 영상 복호화 장치.
제8항에 있어서, 상기 결정부는,
상기 공간적 주변 블록으로부터 선별된 머지 후보, 상기 시간적 주변 블록으로부터 선별된 머지 후보, 상기 중앙 주변 블록으로부터 선별된 머지 후보 및 상기 비인접 주변 블록으로부터 선별된 머지 후보를 각각 구분하여 상기 복수 개의 그룹으로 분류하는 것을 특징으로 하는 영상 복호화 장치.