WO2020138958A1

WO2020138958A1 - 양방향 예측 방법 및 영상 복호화 장치

Info

Publication number: WO2020138958A1
Application number: PCT/KR2019/018477
Authority: WO
Inventors: 김재일; 이선영; 나태영; 손세훈; 신재섭
Original assignee: 에스케이텔레콤 주식회사
Priority date: 2018-12-27
Filing date: 2019-12-26
Publication date: 2020-07-02
Also published as: US20230132003A1; US20230139569A1; US11575904B2; US20220224908A1; US20230141454A1; US20230134711A1

Abstract

양방향 인터 예측 방법 및 영상 복호화 장치를 개시한다. 본 발명의 일 실시예에 의하면, 복수의 양방향 예측 모드 중 어느 하나를 이용하여 현재블록을 인터 예측하는 방법에 있어서, 상기 복수의 양방향 예측 모드에 포함되는 제1모드가 상기 현재블록에 적용되는지 여부를 지시하는 모드정보를 비트스트림으로부터 복호화하는 단계; 상기 모드정보가 적용됨을 지시하는 경우, 차분움직임벡터 정보 및 예측움직임벡터 정보를 포함하는 제1움직임정보와, 차분움직임벡터 정보 및 예측움직임벡터 정보 중 적어도 일부를 포함하지 않는 제2움직임정보를 상기 비트스트림으로부터 복호화하는 단계; 상기 제1움직임정보에 기반하여 제1움직임벡터를 유도하고, 상기 제1움직임정보 중 적어도 일부와 상기 제2움직임정보에 기반하여 제2움직임벡터를 유도하는 단계; 및 제1참조픽처 내에서 상기 제1움직임벡터에 의해 지시되는 참조블록 및 제2참조픽처 내에서 상기 제2움직임벡터에 의해 지시되는 참조블록을 이용하여, 상기 현재블록을 예측하는 단계를 포함하는 양방향 예측 방법을 제공한다.

Description

양방향 예측 방법 및 영상 복호화 장치

본 발명은 영상의 부호화 및 복호화에 관한 것으로서, 움직임정보를 효율적으로 표현함으로써 부호화 및 복호화의 효율을 향상시킨 양방향 예측 방법 및 영상 복호화 장치에 관한 것이다.

동영상 데이터는 음성 데이터나 정지 영상 데이터 등에 비하여 많은 데이터량을 가지기 때문에, 압축을 위한 처리 없이 그 자체를 저장하거나 전송하기 위해서는 메모리를 포함하여 많은 하드웨어 자원을 필요로 한다.

따라서, 통상적으로 동영상 데이터를 저장하거나 전송할 때에는 부호화기를 사용하여 동영상 데이터를 압축하여 저장하거나 전송하며, 복호화기에서는 압축된 동영상 데이터를 수신하여 압축을 해제하고 재생한다. 이러한 동영상 압축 기술로는 H.264/AVC를 비롯하여, H.264/AVC에 비해 약 40% 정도의 부호화 효율을 향상시킨 HEVC(High Efficiency Video Coding)가 존재한다.

그러나, 영상의 크기 및 해상도, 프레임율이 점차 증가하고 있고, 이에 따라 부호화해야 하는 데이터량도 증가하고 있으므로 기존의 압축 기술보다 더 부호화 효율이 좋고 화질 개선 효과도 높은 새로운 압축 기술이 요구된다.

이러한 요구에 부응하기 위해 본 발명은 개선된 영상 부호화 및 복호화 기술을 제공하는 것을 목적으로 하며, 특히, 본 발명의 일 측면은 특정 방향의 움직임 정보로부터 다른 방향의 움직임 정보를 유도함으로써 부호화 및 복호화의 효율을 향상시키는 기술과 관련된다.

본 발명의 일 측면은, 복수의 양방향 예측 모드 중 어느 하나를 이용하여 현재블록을 인터 예측하는 방법에 있어서, 상기 복수의 양방향 예측 모드에 포함되는 제1모드가 상기 현재블록에 적용되는지 여부를 지시하는 모드정보를 비트스트림으로부터 복호화하는 단계; 상기 모드정보가 적용됨을 지시하는 경우, 차분움직임벡터 정보 및 예측움직임벡터 정보를 포함하는 제1움직임정보와, 차분움직임벡터 정보 및 예측움직임벡터 정보 중 적어도 일부를 포함하지 않는 제2움직임정보를 상기 비트스트림으로부터 복호화하는 단계; 상기 제1움직임정보에 기반하여 제1움직임벡터를 유도하고, 상기 제1움직임정보 중 적어도 일부와 상기 제2움직임정보에 기반하여 제2움직임벡터를 유도하는 단계; 및 제1참조픽처 내에서 상기 제1움직임벡터에 의해 지시되는 참조블록 및 제2참조픽처 내에서 상기 제2움직임벡터에 의해 지시되는 참조블록을 이용하여, 상기 현재블록을 예측하는 단계를 포함하는 양방향 예측 방법을 제공한다.

본 발명의 다른 일 측면은, 복수의 양방향 예측 모드에 포함되는 제1모드가 현재블록에 적용되는지 여부를 지시하는 모드정보를 비트스트림으로부터 복호화하고, 상기 모드정보가 적용됨을 지시하는 경우에 차분움직임벡터 정보 및 예측움직임벡터 정보를 포함하는 제1움직임정보와, 차분움직임벡터 정보 및 예측움직임벡터 정보 중 적어도 일부를 포함하지 않는 제2움직임정보를 상기 비트스트림으로부터 복호화하는 복호화부; 및 상기 제1움직임정보에 기반하여 제1움직임벡터를 유도하고, 상기 제1움직임정보 중 적어도 일부와 상기 제2움직임정보에 기반하여 제2움직임벡터를 유도하며, 제1참조픽처 내에서 상기 제1움직임벡터에 의해 지시되는 참조블록 및 제2참조픽처 내에서 상기 제2움직임벡터에 의해 지시되는 참조블록을 이용하여 상기 현재블록을 예측하는 예측부를 포함하는 영상 복호화 장치를 제공한다.

이상에서 설명한 바와 같이 본 발명의 일 실시예에 의하면, 특정 방향의 움직임 이용하여 다른 방향의 움직임을 유도할 수 있으므로, 움직임 표현에 대한 비트 효율성을 향상시킬 수 있다.

도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다.

도 2는 QTBTTT 구조를 이용하여 블록을 분할하는 방법을 설명하기 위한 도면이다.

도 3은 복수의 인트라 예측 모드들을 설명하기 위한 도면이다.

도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다.

도 5는 양방향 예측에 대한 본 발명의 일 실시예를 설명하기 위한 도면이다.

도 6은 차분움직임벡터 사이의 대칭관계를 이용하여 움직임을 유도하는 본 발명의 일 실시예를 설명하기 위한 도면이다.

도 7 및 도 8은 선형관계를 이용하여 움직임을 유도하는 본 발명의 일 실시예를 설명하기 위한 도면이다.

도 9 내지 도 18은 움직임을 유도하는 본 발명의 다양한 실시예를 설명하기 위한 도면이다.

도 19 및 도 20은 상위 레벨에서 결정되는 참조픽처를 이용하여 움직임을 유도하는 본 발명의 일 실시예를 설명하기 위한 순서도이다.

이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성 요소들에 식별 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.

도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다. 이하에서는 도 1을 참조하여 영상 부호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.

영상 부호화 장치는 블록 분할부(110), 예측부(120), 감산기(130), 변환부(140), 양자화부(145), 부호화부(150), 역양자화부(160), 역변환부(165), 가산기(170), 필터부(180) 및 메모리(190)를 포함하여 구성될 수 있다.

영상 부호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.

하나의 영상(비디오)는 복수의 픽처들로 구성된다. 각 픽처들은 복수의 영역으로 분할되고 각 영역마다 부호화가 수행된다. 예를 들어, 하나의 픽처는 하나 이상의 타일(Tile) 또는/및 슬라이스(Slice)로 분할된다. 여기서, 하나 이상의 타일을 타일 그룹(Tile Group)으로 정의할 수 있다. 각 타일 또는/슬라이스는 하나 이상의 CTU(Coding Tree Unit)로 분할된다. 그리고 각 CTU는 트리 구조에 의해 하나 이상의 CU(Coding Unit)들로 분할된다. 각 CU에 적용되는 정보들은 CU의 신택스로서 부호화되고, 하나의 CTU에 포함된 CU들에 공통적으로 적용되는 정보는 CTU의 신택스로서 부호화된다. 또한, 하나의 타일 내의 모든 블록들에 공통적으로 적용되는 정보는 타일의 신택스로서 부호화되거나 다수 개의 타일을 모아 놓은 타일 그룹의 신택스로서 부호화되며, 하나의 픽처들을 구성하는 모든 블록들에 적용되는 정보는 픽처 파라미터 셋(PPS, Picture Parameter Set) 혹은 픽처 헤더에 부호화된다. 나아가, 복수의 픽처가 공통으로 참조하는 정보들은 시퀀스 파라미터 셋(SPS, Sequence Parameter Set)에 부호화된다. 그리고, 하나 이상의 SPS가 공통으로 참조하는 정보들은 비디오 파라미터 셋(VPS, Video Parameter Set)에 부호화된다.

블록 분할부(110)는 CTU(Coding Tree Unit)의 크기를 결정한다. CTU의 크기에 대한 정보(CTU size)는 SPS 또는 PPS의 신택스로서 부호화되어 영상 복호화 장치로 전달된다.

블록 분할부(110)는 영상을 구성하는 각 픽처(picture)를 미리 결정된 크기를 가지는 복수의 CTU(Coding Tree Unit)들로 분할한 이후에, 트리 구조(tree structure)를 이용하여 CTU를 반복적으로(recursively) 분할한다. 트리 구조에서의 리프 노드(leaf node)가 부호화의 기본 단위인 CU(coding unit)가 된다.

트리 구조로는 상위 노드(혹은 부모 노드)가 동일한 크기의 네 개의 하위 노드(혹은 자식 노드)로 분할되는 쿼드트리(QuadTree, QT), 또는 상위 노드가 두 개의 하위 노드로 분할되는 바이너리트리(BinaryTree, BT), 또는 상위 노드가 1:2:1 비율로 세 개의 하위 노드로 분할되는 터너리트리(TernaryTree, TT), 또는 이러한 QT 구조, BT 구조 및 TT 구조 중 둘 이상을 혼용한 구조일 수 있다. 예컨대, QTBT(QuadTree plus BinaryTree) 구조가 사용될 수 있고, 또는 QTBTTT(QuadTree plus BinaryTree TernaryTree) 구조가 사용될 수 있다. 여기서, BTTT를 합쳐서 MTT(Multiple-Type Tree)라 칭할 수 있다.

도 2는 QTBTTT 분할 트리 구조를 보인다. 도 2에서 보는 바와 같이, CTU는 먼저 QT 구조로 분할될 수 있다. 쿼드트리 분할은 분할 블록(splitting block)의 크기가 QT에서 허용되는 리프 노드의 최소 블록 크기(MinQTSize)에 도달할 때까지 반복될 수 있다. QT 구조의 각 노드가 하위 레이어의 4개의 노드들로 분할되는지 여부를 지시하는 제1 플래그(QT_split_flag)는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. QT의 리프 노드가 BT에서 허용되는 루트 노드의 최대 블록 크기(MaxBTSize)보다 크지 않은 경우, BT 구조 또는 TT 구조 중 어느 하나 이상으로 더 분할될 수 있다. BT 구조 및/또는 TT 구조에서는 복수의 분할 방향이 존재할 수 있다. 예컨대, 해당 노드의 블록이 가로로 분할되는 방향과 세로로 분할되는 방향 두 가지가 존재할 수 있다. 도 2와 같이, MTT 분할이 시작되면, 노드들이 분할되었는지 여부를 지시하는 제2 플래그(mtt_split_flag)와, 분할이 되었다면 추가적으로 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그 및/또는 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

트리 구조의 다른 예로서, QTBTTT 구조를 사용하여 블록을 분할하는 경우, 먼저 분할 되었음을 나타내는 CU 분할 플래그(split_cu_flag) 및 분할 타입이 QT 분할인지를 지시하는 QT 분할 플래그(split_qt_flag) 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. CU 분할 플래그(split_cu_flag) 값이 분할되지 않았음을 지시하지 않는 경우, 해당 노드의 블록이 분할 트리 구조에서의 리프 노드(leaf node)가 되어 부호화의 기본 단위인 CU(coding unit)가 된다. CU 분할 플래그(split_cu_flag) 값이 분할되었음을 지시하지 않는 경우, QT 분할 플래그(split_qt_flag) 값을 통해 분할 타입이 QT 혹은 MTT인지를 구분한다. 분할 타입이 QT인 경우에는 더 이상의 추가 정보가 없으며, 분할 타입이 MTT인 경우에는 추가적으로 MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

트리 구조의 다른 예시로서 QTBT가 사용되는 경우, 해당 노드의 블록을 동일 크기의 두 개 블록으로 가로로 분할하는 타입(즉, symmetric horizontal splitting)과 세로로 분할하는 타입(즉, symmetric vertical splitting) 두 가지가 존재할 수 있다. BT 구조의 각 노드가 하위 레이어의 블록으로 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할되는 타입을 지시하는 분할 타입 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다. 한편, 해당 노드의 블록을 서로 비대칭 형태의 두 개의 블록으로 분할하는 타입이 추가로 더 존재할 수도 있다. 비대칭 형태에는 해당 노드의 블록을 1:3의 크기 비율을 가지는 두 개의 직사각형 블록으로 분할하는 형태가 포함될 수 있고, 혹은 해당 노드의 블록을 대각선 방향으로 분할하는 형태가 포함될 수도 있다.

CU는 CTU로부터의 QTBT 또는 QTBTTT 분할에 따라 다양한 크기를 가질 수 있다. 이하에서는, 부호화 또는 복호화하고자 하는 CU(즉, QTBTTT의 리프 노드)에 해당하는 블록을 '현재블록'이라 칭한다.

예측부(120)는 현재블록을 예측하여 예측블록을 생성한다. 예측부(120)는 인트라 예측부(122)와 인터 예측부(124)를 포함한다.

일반적으로, 픽처 내 현재블록들은 각각 예측적으로 코딩될 수 있다. 일반적으로 현재블록의 예측은 (현재블록을 포함하는 픽처로부터의 데이터를 사용하는) 인트라 예측 기술 또는 (현재블록을 포함하는 픽처 이전에 코딩된 픽처로부터의 데이터를 사용하는) 인터 예측 기술을 사용하여 수행될 수 있다. 인터 예측은 단방향 예측과 양방향 예측 모두를 포함한다.

인트라 예측부(122)는 현재블록이 포함된 현재 픽처 내에서 현재블록의 주변에 위치한 픽셀(참조 픽셀)들을 이용하여 현재블록 내의 픽셀들을 예측한다. 예측 방향에 따라 복수의 인트라 예측모드가 존재한다. 예컨대, 도 3에서 보는 바와 같이, 복수의 인트라 예측모드는 planar 모드와 DC 모드를 포함하는 비방향성 모드와 65개의 방향성 모드를 포함할 수 있다. 각 예측모드에 따라 사용할 주변 픽셀과 연산식이 다르게 정의된다.

인트라 예측부(122)는 현재블록을 부호화하는데 사용할 인트라 예측 모드를 결정할 수 있다. 일부 예들에서, 인트라 예측부(122)는 여러 인트라 예측 모드들을 사용하여 현재블록을 인코딩하고, 테스트된 모드들로부터 사용할 적절한 인트라 예측 모드를 선택할 수도 있다. 예를 들어, 인트라 예측부(122)는 여러 테스트된 인트라 예측 모드들에 대한 레이트 왜곡(rate-distortion) 분석을 사용하여 레이트 왜곡 값들을 계산하고, 테스트된 모드들 중 최선의 레이트 왜곡 특징들을 갖는 인트라 예측 모드를 선택할 수도 있다.

인트라 예측부(122)는 복수의 인트라 예측 모드 중에서 하나의 인트라 예측 모드를 선택하고, 선택된 인트라 예측 모드에 따라 결정되는 주변 픽셀(참조 픽셀)과 연산식을 사용하여 현재블록을 예측한다. 선택된 인트라 예측 모드에 대한 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.

인터 예측부(124)는 움직임 보상 과정을 통해 현재블록에 대한 예측블록을 생성한다. 현재 픽처보다 먼저 부호화 및 복호화된 참조픽처 내에서 현재블록과 가장 유사한 블록을 탐색하고, 그 탐색된 블록을 이용하여 현재블록에 대한 예측블록을 생성한다. 그리고, 현재 픽처 내의 현재블록과 참조픽처 내의 예측블록 간의 변위(displacement)에 해당하는 움직임벡터(motion vector)를 생성한다. 일반적으로, 움직임 추정은 루마(luma) 성분에 대해 수행되고, 루마 성분에 기초하여 계산된 모션 벡터는 루마 성분 및 크로마 성분 모두에 대해 사용된다. 현재블록을 예측하기 위해 사용된 참조픽처에 대한 정보 및 움직임벡터에 대한 정보를 포함하는 움직임 정보는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.

감산기(130)는 현재블록으로부터 인트라 예측부(122) 또는 인터 예측부(124)에 의해 생성된 예측블록을 감산하여 잔차블록을 생성한다.

변환부(140)는 공간 영역의 픽셀 값들을 가지는 잔차블록 내의 잔차 신호를 주파수 도메인의 변환 계수로 변환한다. 변환부(140)는 잔차블록의 전체 크기를 변환 단위로 사용하여 잔차블록 내의 잔차 신호들을 변환할 수 있으며, 또는 잔차블록을 변환 영역 및 비변환 영역인 두 개의 서브블록으로 구분하여, 변환 영역 서브블록만 변환 단위로 사용하여 잔차 신호들을 변환할 수 있다. 여기서, 변환 영역 서브블록은 가로축 (혹은 세로축) 기준 1:1의 크기 비율을 가지는 두 개의 직사각형 블록 중 하나일 수 있다. 이런 경우, 서브블록 만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 위치 정보(cu_sbt_pos_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. 또한, 변환 영역 서브블록의 크기는 가로축 (혹은 세로축) 기준 1:3의 크기 비율을 가질 수 있으며, 이런 경우 해당 분할을 구분하는 플래그(cu_sbt_quad_flag)가 추가적으로 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.

양자화부(145)는 변환부(140)로부터 출력되는 변환 계수들을 양자화하고, 양자화된 변환 계수들을 부호화부(150)로 출력한다.

부호화부(150)는 양자화된 변환 계수들을 CABAC(Context-based Adaptive Binary Arithmetic Code) 등의 부호화 방식을 사용하여 부호화함으로써 비트스트림을 생성한다. 부호화부(150)는 블록 분할과 관련된 CTU size, CU 분할 플래그, QT 분할 플래그, MTT 분할 방향, MTT 분할 타입 등의 정보를 부호화하여, 영상 복호화 장치가 영상 부호화 장치와 동일하게 블록을 분할할 수 있도록 한다.

또한, 부호화부(150)는 현재블록이 인트라 예측에 의해 부호화되었는지 아니면 인터 예측에 의해 부호화되었는지 여부를 지시하는 예측 타입에 대한 정보를 부호화하고, 예측 타입에 따라 인트라 예측정보(즉, 인트라 예측 모드에 대한 정보) 또는 인터 예측정보(참조픽처 및 움직임벡터에 대한 정보)를 부호화한다.

역양자화부(160)는 양자화부(145)로부터 출력되는 양자화된 변환 계수들을 역양자화하여 변환 계수들을 생성한다. 역변환부(165)는 역양자화부(160)로부터 출력되는 변환 계수들을 주파수 도메인으로부터 공간 도메인으로 변환하여 잔차블록을 복원한다.

가산부(170)는 복원된 잔차블록과 예측부(120)에 의해 생성된 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 다음 순서의 블록을 인트라 예측할 때 참조 픽셀로서 사용된다.

필터부(180)는 블록 기반의 예측 및 변환/양자화로 인해 발생하는 블록킹 아티팩트(blocking artifacts), 링잉 아티팩트(ringing artifacts), 블러링 아티팩트(blurring artifacts) 등을 줄이기 위해 복원된 픽셀들에 대한 필터링을 수행한다. 필터부(180)는 디블록킹 필터(182)와 SAO(Sample Adaptive Offset) 필터(184)를 포함할 수 있다.

디블록킹 필터(180)는 블록 단위의 부호화/복호화로 인해 발생하는 블록킹 현상(blocking artifact)을 제거하기 위해 복원된 블록 간의 경계를 필터링하고, SAO 필터(184)는 디블록킹 필터링된 영상에 대해 추가적인 필터링을 수행한다. SAO 필터(184)는 손실 부호화(lossy coding)로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해 사용되는 필터이다.

디블록킹 필터(182) 및 SAO 필터(184)를 통해 필터링된 복원블록은 메모리(190)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.

도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다. 이하에서는 도 4를 참조하여 영상 복호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.

영상 복호화 장치는 복호화부(410), 역양자화부(420), 역변환부(430), 예측부(440), 가산기(450), 필터부(460) 및 메모리(470)를 포함하여 구성될 수 있다.

도 1의 영상 부호화 장치와 마찬가지로, 영상 복호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.

복호화부(410)는 영상 부호화 장치로부터 수신한 비트스트림을 복호화하여 블록 분할과 관련된 정보를 추출함으로써 복호화하고자 하는 현재블록을 결정하고, 현재블록을 복원하기 위해 필요한 예측정보와 잔차신호에 대한 정보 등을 추출한다.

복호화부(410)는 SPS(Sequence Parameter Set) 또는 PPS(Picture Parameter Set)로부터 CTU size에 대한 정보를 추출하여 CTU의 크기를 결정하고, 픽처를 결정된 크기의 CTU로 분할한다. 그리고, CTU를 트리 구조의 최상위 레이어, 즉, 루트 노드로 결정하고, CTU에 대한 분할정보를 추출함으로써 트리 구조를 이용하여 CTU를 분할한다.

예컨대, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 MTT의 분할과 관련된 제2 플래그(MTT_split_flag) 및 분할 방향(vertical / horizontal) 및/또는 분할 타입(binary / ternary) 정보를 추출하여 해당 리프 노드를 MTT 구조로 분할한다. 이를 통해 QT의 리프 노드 이하의 각 노드들을 BT 또는 TT 구조로 반복적으로(recursively) 분할한다.

또 다른 예로서, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 CU의 분할 여부를 지시하는 CU 분할 플래그(split_cu_flag)를 추출하고, 해당 블록이 분할된 경우, QT 분할 플래그(split_qt_flag)를 추출한다. 분할 타입이 QT가 아니고 MTT인 경우, MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)를 추가적으로 추출한다. 분할 과정에서 각 노드는 0번 이상의 반복적인 QT 분할 후에 0번 이상의 반복적인 MTT 분할이 발생할 수 있다. 예컨대, CTU는 바로 MTT 분할이 발생하거나, 반대로 다수 번의 QT 분할만 발생할 수도 있다.

다른 예로서, QTBT 구조를 사용하여 CTU를 분할하는 경우, QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 BT로 더 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할 방향 정보를 추출한다.

한편, 복호화부(410)는 트리 구조의 분할을 통해 복호화하고자 하는 현재블록을 결정하게 되면, 현재블록이 인트라 예측되었는지 아니면 인터 예측되었는지를 지시하는 예측 타입에 대한 정보를 추출한다. 예측 타입 정보가 인트라 예측을 지시하는 경우, 복호화부(410)는 현재블록의 인트라 예측정보(인트라 예측 모드)에 대한 신택스 요소를 추출한다. 예측 타입 정보가 인터 예측을 지시하는 경우, 복호화부(410)는 인터 예측정보에 대한 신택스 요소, 즉, 움직임벡터 및 그 움직임벡터가 참조하는 참조픽처를 나타내는 정보를 추출한다.

한편, 복호화부(410)는 잔차신호에 대한 정보로서 현재블록의 양자화된 변환계수들에 대한 정보를 추출한다.

역양자화부(420)는 양자화된 변환계수들을 역양자화하고, 역변환부(430)는 역양자화된 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환하여 잔차신호들을 복원함으로써 현재블록에 대한 잔차블록을 생성한다.

또한, 역변환부(430)는 변환블록의 일부 영역(서브블록)만 역변환하는 경우, 변환블록의 서브블록만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 서브블록의 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 서브블록의 위치 정보(cu_sbt_pos_flag)를 추출하여, 해당 서브블록의 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환함으로써 잔차신호들을 복원하고, 역변환되지 않은 영역에 대해서는 잔차신호로 "0" 값을 채움으로써 현재블록에 대한 최종 잔차블록을 생성한다.

예측부(440)는 인트라 예측부(442) 및 인터 예측부(444)를 포함할 수 있다. 인트라 예측부(442)는 현재블록의 예측 타입이 인트라 예측일 때 활성화되고, 인터 예측부(444)는 현재블록의 예측 타입이 인터 예측일 때 활성화된다.

인트라 예측부(442)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소로부터 복수의 인트라 예측 모드 중 현재블록의 인트라 예측 모드를 결정하고, 인트라 예측 모드에 따라 현재블록 주변의 참조 픽셀들을 이용하여 현재블록을 예측한다.

인터 예측부(444)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소를 이용하여 현재블록의 움직임벡터와 그 움직임벡터가 참조하는 참조픽처를 결정하고, 움직임벡터와 참조픽처를 이용하여 현재블록을 예측한다.

가산기(450)는 역변환부로부터 출력되는 잔차블록과 인터 예측부 또는 인트라 예측부로부터 출력되는 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 이후에 복호화할 블록을 인트라 예측할 때의 참조픽셀로서 활용된다.

필터부(460)는 디블록킹 필터(462) 및 SAO 필터(464)를 포함할 수 있다. 디블록킹 필터(462)는 블록 단위의 복호화로 인해 발생하는 블록킹 현상(blocking artifact)를 제거하기 위해, 복원된 블록 간의 경계를 디블록킹 필터링한다. SAO 필터(464)는 손실 부호화(lossy coding)으로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해, 디블록킹 필터링 이후의 복원된 블록에 대해 추가적인 필터링을 수행한다. 디블록킹 필터(462) 및 SAO 필터(464)를 통해 필터링된 복원블록은 메모리(470)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.

HEVC 표준의 화면 간 예측 부호화/복호화 방법(인터 예측 방법)은 크게 skip 모드, merge 모드 및 AMVP(adaptive(or advanced) motion vector predictor) 모드로 구분될 수 있다.

skip 모드에서는 주변블록의 움직임정보 후보들 중 하나를 지시하는 인덱스 값이 시그널링된다. merge 모드에서는 주변블록의 움직임정보 후보들 중 하나를 지시하는 인덱스 값 및 예측 후 잔차를 부호화한 정보가 시그널링된다. AMVP 모드에서는 현재블록의 움직임정보 및 예측 후 잔차를 부호화한 정보가 시그널링된다. AMVP 모드에서 시그널링되는 움직임정보에는 주변블록의 움직임정보(mvp, motion vector predictor) 및 이 움직임정보(mvp)와 현재블록의 움직임정보(mv) 사이의 차이 값(mvd, motion vector difference)이 포함된다.

AMVP 모드에서 시그널링되는 움직임정보를 더욱 구체적으로 설명하면, 이 움직임정보에는 참조픽처정보(참조픽처 인덱스), 예측 움직임벡터(mvp) 정보 및 차분 움직임벡터(mvd) 정보가 포함될 수 있다. 양방향 예측(bi-prediction)의 경우에는 위 정보들이 양방향 각각에 대해 별도로 시그널링된다. 양방향 각각에 대해 시그널링되는 참조픽처정보, mvp 정보 및 mvd 정보에 대한 신택스 요소를 표현하면 아래 표 1과 같다.

위 표 1에서, inter_pred_idc는 예측 방향을 나타내는 신택스 요소(예측 방향 정보)로서, uni-L0, uni-L1 및 bi-prediction 중 어느 하나를 나타낼 수 있다. 본 발명은 특정 방향의 움직임정보를 다른 방향의 움직임정보로부터 유도하므로, inter_pred_idc는 bi-prediction을 지시한다. ref_idx_l0은 L0 방향의 참조픽처를 지시하는 신택스 요소(참조 픽처 정보)로서, 이 신택스 요소를 통해 참조픽처 리스트 0에 포함된 참조픽처들 중 현재블록의 예측에 이용되는 참조픽처가 특정된다. ref_idx_l1은 L1 방향의 참조픽처를 지시하는 신택스 요소(참조 픽처 정보)로서, 이 신택스 요소를 통해 참조픽처 리스트 1에 포함된 참조픽처들 중 현재블록의 예측에 이용되는 참조픽처가 특정된다. mvp_l0_flag는 L0 방향에 대한 mvp를 나타내는 신택스 요소(mvp 정보)로서, 이 신택스 요소를 통해 현재블록의 L0 방향 예측에 사용될 mvp가 특정된다. mvp_l1_flag는 L1 방향에 대한 mvp를 나타내는 신택스 요소(mvp 정보)로서, 이 신택스 요소를 통해 현재블록의 L1 방향 예측에 사용될 mvp가 특정된다.

mvd 정보를 구성하는 신택스 요소들을 표현하면 아래 표 2와 같다.

위 표 2에서, abs_mvd_greater0_flag는 mvd의 절대 값(크기, magnitude)이 0을 초과하는지 여부를 나타내는 신택스 요소이며, abs_mvd_greater1_flag는 mvd의 절대 값이 1을 초과하는지 여부를 나타내는 신택스 요소이다. 또한, abs_mvd_minus2는 mvd의 절대 값에서 2를 뺀 나머지 값을 나타내는 신택스 요소이며, mvd_sign_flag는 mvd의 부호를 나타내는 신택스 요소에 해당한다.

표 2에 표현된 바와 같이, mvd는 x 성분(x component) 및 y 성분(y component) 각각에 대한 절대 값을 나타내는 신택스 요소들(abs_mvd_greater0_flag, abs_mvd_greater1_flag, abs_mvd_minus2)과, 부호를 나타내는 신택스 요소(mvd_sign_flag)를 통해 표현된다.

표 1 및 표 2를 통해 설명된 내용을 기반으로, 종래 AMVP 모드의 양방향 예측을 위해 영상 부호화 장치로부터 영상 복호화 장치로 시그널링되는 정보들을 정리하면 아래 표 3과 같다.

위 표 3을 통해 제시된 바와 같이, 종래 AMVP 모드에서는 현재블록에 대한 양방향 예측을 수행하기 위해, 참조픽처정보, mvp 정보, mvd 정보 등을 양방향 각각에 대해 별도로 구분하여 시그널링하므로 비트 효율성 측면에서 비효율적이라 할 수 있다.

본 발명은 양방향 각각의 움직임정보들 사이의 상관관계(correlation)를 이용하여 특정 방향의 움직임정보로부터 다른 방향의 움직임정보를 유도하거나 현재블록의 예측에 이용되는 참조픽처들을 유도함으로써, 양방향 예측에 대한 비트 효율성을 향상시킬 수 있는 발명에 해당한다.

'특정 방향'은 영상 부호화 장치로부터 시그널링된 정보들을 기반으로 움직임정보가 도출 또는 유도되는 방향을 나타내며, '다른 방향'은 특정 방향의 움직임정보를 기반으로 움직임정보가 도출 또는 유도되는 방향을 나타낸다. 다른 방향의 움직임정보를 유도하는 과정에는 특정 방향의 움직임정보 중 적어도 일부 및/또는 영상 부호화 장치로부터 시그널링된 정보들이 이용될 수 있다. 본 명세서에서는 특정 방향이 L0에 해당하고, 다른 방향이 L1에 해당하는 것으로 설명하나, 특정 방향은 양방향(L0 및 L1) 중 어느 하나에 해당할 수 있으며, 다른 방향은 양방향 중 특정 방향에 해당하지 않는 나머지 방향에 해당할 수 있다. 이하에서는, 특정 방향을 제1방향이라 지칭하며, 다른 방향을 제2방향이라 지칭하도록 한다. 또한, 제1방향의 움직임벡터를 제1움직임벡터라 지칭하며, 제2방향의 움직임벡터를 제2움직임벡터라 지칭하도록 한다.

움직임정보들 사이의 상관관계에는 움직임정보들 사이에 성립하는 대칭관계, 선형관계, 비례관계, 현재픽처를 기준으로 한 참조픽처들 사이의 POC(picture order count) 차이 관계 등이 포함될 수 있다. 이러한 상관관계는 움직임정보 전체적으로 성립할 수 있으며, 움직임정보에 포함되는 요소들(참조픽처정보, mvp 정보 및 mvd 정보 중 하나 이상)마다 개별적으로 성립할 수도 있다. 예를 들어, 양방향의 mvd 정보들 사이에 대칭관계가 성립할 수 있으며, 양방향의 mvp 정보(mvp_flag) 및 mvd 정보 사이에 선형관계가 성립할 수도 있다. 여기서, 양방향의 mvp_flag 및 mvd 정보 사이에 선형관계가 성립한다는 것은 양방향의 움직임벡터(움직임) 사이에 선형관계가 성립하는 것으로 이해될 수 있다.

본 명세서에서 지칭되는 움직임정보의 명칭과 관련하여, 특정 방향(제1방향)의 움직임정보를 제1움직임정보라 지칭하며, 다른 방향(제2방향)의 움직임정보를 포함되는 요소의 개수 또는 종류에 따라 제2움직임정보 또는 제3움직임정보라 지칭하도록 한다. 제3움직임정보는 제2방향의 움직임정보로서, 제2방향의 mvd 정보 및 제2방향의 mvp 정보가 모두 포함되어 있는 움직임정보를 의미할 수 있다. 제2움직임정보와 제3움직임정보는 모두 제2방향의 움직임정보에 해당하나, 제2방향의 mvd 정보 및 mvp 정보가 모두 포함되는 지 아니면, 둘 중 적어도 하나가 포함되지 않는지 여부에 따라 구분될 수 있다.

제2방향의 움직임을 유도하는 본 발명의 일 실시예가 도 5에 도시되어 있다.

영상 부호화 장치는 모드정보(mode_info)를 비트스트림에 포함시켜 시그널링할 수 있다. 양방향 예측 모드에는 본 발명에서 제안하는 방법이 적용되어 제1움직임정보(motion_info_l0)로부터 제2움직임정보(motion_info_l1)를 유도하는 제1모드, 시그널링되는 정보들을 이용하여 제3움직임정보(motion_info_l2)를 유도하는 제2모드 등이 포함될 수 있다.

mode_info는 복수의 양방향 예측 모드에 포함되는 복수의 예측 모드들 중 어느 하나가 적용됨을 지시하는 정보에 해당할 수 있다. mode_info는 이용 가능한 양방향 예측 모드들의 개수에 따라 플래그 또는 인덱스 등 다양한 형태로 구현될 수 있다. 이하에서는, mode_info가 제1모드와 제2모드 중 현재블록의 양방향 예측에 이용되는 예측 모드를 지시하는 것으로 가정하여 설명하도록 한다. 이러한 가정하에서, mode_info는 제1모드가 현재블록에 적용되는지 여부를 지시하는 정보에 해당할 수 있다. 또한, mode_info가 제1모드의 적용됨을 지시하지 않는 경우는 제1모드가 적용되지 않음을 지시하거나 제2모드가 적용됨을 지시하는 것과 동일할 수 있다.

mode_info가 제1모드의 적용됨을 지시하는 경우, 영상 부호화 장치는 motion_info_l0와 motion_info_l1를 비트스트림에 포함시켜 시그널링할 수 있다. motion_info_l0에는 제1방향의 차분움직임벡터 정보(mvd_l0) 및 제1방향의 예측움직임벡터 정보(mvp_l0_flag)가 포함될 수 있다. motion_info_l1에는 mvd_l1 및 mvp_l1_flag 중 적어도 일부가 포함될 수 있다(적어도 일부가 포함되지 않을 수 있다). 이와 달리, mode_info가 제1모드의 적용됨을 지시하지 않는 경우(제2모드의 적용됨을 지시하는 경우), 영상 부호화 장치는 motion_info_l0와 motion_info_l2를 비트스트림에 포함시켜 시그널링할 수 있다. motion_info_l2에는 mvd_l1 및 mvp_l1_flag가 모두 포함될 수 있다.

영상 복호화 장치(복호화부)는 mode_info를 비트스트림으로부터 복호화할 수 있다(S530). mode_info가 제1모드의 적용됨을 지시하는 경우(S540), motion_info_l1이 비트스트림에 포함되어 있으므로, 영상 복호화 장치는 motion_info_l0와 motion_info_l1를 비트스트림으로부터 복호화할 수 있다(S550).

영상 복호화 장치(예측부)는 motion_info_l0에 기반하여 제1움직임벡터(mv_l0)를 유도하고, motion_info_l0 중 적어도 일부와 motion_info_l1에 기반하여 제2움직임벡터(mv_l1)을 유도할 수 있다(S560). motion_info_l0에는 mvd_l0와 mvp_l0_flag가 포함되어 있으므로, mv_l0는 아래 수학식 1과 같이 mvd_l0와 mvp_l0를 합산하여 유도될 수 있다.

위 수학식 1에서, mvx ₀는 mv_l0의 x 성분을 나타내고, mvy ₀는 mv_l0의 y 성분을 나타낸다. mvpx ₀는 mvp_l0의 x 성분을 나타내고, mvpy ₀는 mvp_l0의 y 성분을 나타낸다. mvdx ₀는 mvd_l0의 x 성분을 나타내고, mvdy ₀는 mvd_l0의 y 성분을 나타낸다.

motion_info_l1에는 mvd_l1 및 mvp_l1_flag 중 적어도 일부가 포함되어 있지 않으므로, mv_l1은 움직임의 상관관계에 기반하여 유도될 수 있다. mv_l1을 유도하는 구체적인 방법에 대해서는 후술하도록 한다.

영상 복호화 장치는 제1방향의 참조픽처인 제1참조픽처(ref_l0) 내에서 mv_l0에 의해 지시되는 제1참조블록 및, 제2방향의 참조픽처인 제2참조픽처(ref_l1) 내에서 mv_l1에 의해 지시되는 제2참조블록을 이용하여, 현재블록을 예측할 수 있다(현재블록에 대한 예측블록을 생성할 수 있다)(S570). ref_l0와 ref_l1은 영상 부호화 장치로부터 시그널링되는 참조픽처정보들(ref_idx_l0 및 ref_idx_l1)로부터 특정되거나, 참조픽처 리스트에 포함된 참조픽처들과 현재픽처 사이의 POC 차이에 근거하여 유도될 수 있다. 이에 대한 구체적인 실시예는 후술하도록 한다.

한편, S540 과정에서 mode_info가 제1모드의 적용됨을 지시하지 않는 경우(제2모드의 적용됨을 지시하는 경우), motion_info_l2가 비트스트림에 포함되어 있으므로, 영상 복호화 장치는 motion_info_l0와 motion_info_l2를 비트스트림으로부터 복호화할 수 있다(S590). 이 경우, 영상 복호화 장치는 motion_info_l0에 기반하여 mv_l0를 유도하고, motion_info_l2에 기반하여 mv_l1를 유도할 수 있다(S560). 또한, 영상 복호화 장치는 mv_l0에 의해 지시되는 제1참조블록 및, mv_l1에 의해 지시되는 제2참조블록을 이용하여, 현재블록을 예측할 수 있다(S570).

실시형태에 따라, 영상 부호화 장치는 인에이블 정보(enabled_flag)를 비트스트림에 더 포함시켜 시그널링할 수 있다. enabled_flag는 제1모드가 활성되는지 여부를 지시하는 정보에 해당할 수 있다. 영상 부호화 장치는 enabled_flag를 sequence-level, picture-level, tile group-level, slice-level 등과 같은 하이 레벨 신택스(high level syntax)로 부호화하고, enabled_flag가 제1모드의 활성됨을 지시하는 경우에 mode_info를 예측 단위(블록) 별로 비트스트림에 포함시켜 시그널링할 수 있다. 이와 같은 방법을 통해, 본 발명에서 제안하는 실시예들의 적용 여부가 각 블록마다 설정될 수 있다.

enabled_flag가 하이 레벨 신택스로 부호화되고 mode_info가 블록 단위로 부호화되는 경우, 영상 복호화 장치는 enabled_flag를 하이 레벨 신택스로부터 복호화하고(S510), enabled_flag가 제1모드의 활성됨을 지시하는 경우에(S520) motion_info를 비트스트림으로부터 복호화할 수 있다(S530). 한편, enabled_flag가 제1모드의 활성됨을 지시하지 않는 경우, mode_info가 복호화되지 않을 수 있다. 이와 같은 경우, 영상 복호화 장치는 제1모드가 적용되지 않음을 지시하도록 mode_info를 “0” 또는 “off”로 설정 또는 추정하여(S580), 현재블록에 제1모드를 적용하지 않을 수 있다.

이하에서는, 참조픽처정보(ref_idx_l0 및 ref_idx_l1), 예측움직임벡터 정보(mvp_l0_flag 및 mvp_l1_flag) 및 차분움직임벡터 정보(mvd_l0 및 mvd_l1) 중 일부가 움직임정보에 포함되는지 여부에 따라 본 발명에서 제안하는 다양한 실시예들에 대해 설명하도록 한다.

이하 설명되는 실시예들에서, motion_info_l0에는 mvd_l0 및 mvp_l0_flag가 포함될 수 있으며, motion_info_l1에는 mvd_l1 및 mvp_l1_flag 중 적어도 일부가 포함되지 않을 수 있다. 이를 달리 표현하면, motion_info_l0에는 ref_idx_l0가 포함되지 않을 수 있으며, motion_info_l1에는 ref_idx_l1, mvd_l1 및 mvp_l1_flag 중 하나 이상이 포함되지 않을 수 있다.

실시예 1

실시예 1은 motion_info_l0에 ref_idx_l0, mvd_l0 및 mvp_l0이 모두 포함되고, motion_info_l1에 ref_idx_l1 및 mvp_l1이 포함되는 경우에, mvd_l1을 유도함으로써 움직임정보를 유도하는 방법에 해당한다.

실시예 1에서, 시그널링되지 않는 mvd_l1은 mvd_l0으로부터 유도될 수 있다. mvd_l1은 mvd_l1 및 mvd_l0 사이에 성립하는 대칭관계에 기반하여 유도될 수 있다. 즉, mvd_l1은 mvd_l0와 대칭되는 값(mvd_l1 = - mvd_l0)으로 설정 또는 유도될 수 있으며, mv_l1은 유도된 mvd_l1과 시그널링된 mvp_l1을 이용하여 유도될 수 있다(수학식 2).

영상 부호화 장치는 전술된 바와 동일한 과정들을 통해 motion_info_l0 및 motion_info_l1(mvd_l1 제외)을 비트스트림에 포함시켜 시그널링할 수 있다. 도 6에 도시된 바와 같이, 영상 복호화 장치는 motion_info_l0에 포함된 mvd_l0 및 mvp_l0를 이용하여 mv_l0를 유도할 수 있다. 또한, 영상 복호화 장치는 mvd_l0로부터 유도된 mvd_l1(- mvd_l0)과 motion_info_l1에 포함된 mvp_l1을 이용하여 mv_l1을 유도할 수 있다.

영상 복호화 장치는 ref_idx_l0가 지시하는 ref_l0 내에서 mv_l0에 의해 지시되는 제1참조블록(630) 및, ref_idx_l1가 지시하는 ref_l1 내에서 mv_l1에 의해 지시되는 제2참조블록(640)을 이용하여, 현재픽처(610) 내에 위치하는 현재블록(620)을 예측할 수 있다.

실시예 2

실시예 2는 motion_info_l0에 ref_idx_l0가 포함되지 않고, motion_info_l1에 ref_idx_l1가 포함되지 않는 경우에, ref_l0 및 ref_l1을 유도함으로써 움직임정보를 유도하는 방법에 해당한다.

실시예 2에서, ref_l0 및 ref_l1은 참조픽처 리스트에 포함된 참조픽처들 중 0-번째 인덱스를 가지는(첫 번째에 위치하는) 참조픽처로 결정 또는 유도되거나, 참조픽처 리스트에 포함된 참조픽처들과 현재픽처 사이의 POC 차이를 근거로 결정 또는 유도될 수 있다. 이하에서는, 현재픽처와의 POC 차이를 근거로 ref_l0 및 ref_l1을 유도하는 방법에 대해 설명하도록 한다.

영상 복호화 장치는 참조픽처 리스트 0(제1방향의 참조픽처 리스트)에 포함된 참조픽처들과 현재픽처 사이의 POC 값 차이를 근거로, 제1방향의 참조픽처 리스트에 포함된 참조픽처들 중 어느 하나를 선별하여 ref_l0로 설정할 수 있다. 예를 들어, 영상 복호화 장치는 현재픽처와의 POC 값 차이가 가장 작은 참조픽처(최인접 참조픽처)를 ref_l0로 설정할 수 있다.

또한, 영상 복호화 장치는 참조픽처 리스트 1(제2방향의 참조픽처 리스트)에 포함된 참조픽처들과 현재픽처 사이의 POC 값 차이를 근거로, 제2방향의 참조픽처 리스트에 포함된 참조픽처들 중 어느 하나를 선별하여 ref_l1으로 설정할 수 있다. 예를 들어, 영상 복호화 장치는 현재픽처와의 POC 값 차이가 가장 작은 참조픽처(최인접한 참조픽처)를 ref_l1으로 설정할 수 있다.

영상 복호화 장치는 참조픽처 리스트에 포함된 참조픽처들의 POC 값을 순차적 또는 병렬적으로 현재픽처의 POC 값과 비교하여 어느 하나의 참조픽처를 선별할 수 있다. 참조픽처 리스트에 포함된 참조픽처들을 순차적으로 비교하여 최인접 참조픽처를 선별하는 경우, 영상 복호화 장치는 참조픽처의 인덱스 값을 참조픽처 리스트에 할당되지 않은 인덱스 값으로(예를 들어, -1) 가상적으로 설정한 후에 순차적 비교를 시작할 수 있다.

제1방향의 참조픽처 리스트로부터 선별되는 참조픽처와 제2방향의 참조픽처 리스트로부터 선별되는 참조픽처는 현재픽처의 POC 값을 기준으로 선행(forward)하거나 후행(backward)하는 POC 값을 가질 수 있다. 즉, 제1방향의 참조픽처 리스트로부터 선별되는 참조픽처와 제2방향의 참조픽처 리스트로부터 선별되는 참조픽처는 선행하는 참조픽처와 후행하는 참조픽처의 쌍(pair)으로 이루어질 수 있다.

ref_l0 및 ref_l1이 유도되면, 영상 복호화 장치는 ref_l0 내에서 mv_l0에 의해 지시되는 제1참조블록(630) 및, ref_l1 내에서 mv_l1에 의해 지시되는 제2참조블록(640)을 이용하여, 현재블록을 예측할 수 있다.

실시형태에 따라, ref_l0 및 ref_l1을 결정하는 과정은 현재블록보다 상위 레벨에서 수행될 수 있다. 즉, motion_info_l0 및 motion_info_l1에 포함된 요소들 중 ref_l0 및 ref_l1를 제외한 나머지 요소들은 블록 단위로 유도 또는 결정되고, ref_l0 및 ref_l1은 블록보다 상위 레벨 단위로 결정될 수 있다. 여기서, 상위 레벨이란, picture-level, tile group-level, slice-level, tile-level, CTU(coding tree unit)-level 등과 같이 블록 레벨보다 상위 레벨을 의미할 수 있다.

실시예 2는 전술된 실시예 1 또는 후술되는 실시예들과 결합된 형태로 구현될 수 있다. 즉, 실시예 1에서는 ref_idx_l0와 ref_idx_l1이 시그널링되는 것으로 설명되었으나, 실시예 2가 적용되면, ref_idx_l0와 ref_idx_l1이 시그널링되지 않으며, 영상 복호화 장치에서 자체적으로 ref_l0와 ref_l1을 유도할 수 있다.

실시예 3

실시예 3은 제1방향의 움직임과 제2방향의 움직임 사이에 성립하는 선형관계를 기반으로, 제1움직임정보로부터 제2움직임정보를 유도하는 방법에 해당한다.

영상 부호화 장치는 motion_info_l0를 비트스트림에 포함시켜 영상 복호화 장치로 시그널링할 수 있다. motion_info_l0에는 mvp_l0_flag, mvd_l0 및/또는 ref_idx_l0가 포함될 수 있다. motion_info_l0에 포함되는 정보들은 후술되는 실시예들마다 서로 달라질 수 있다.

영상 복호화 장치는 motion_info_l0를 비트스트림으로부터 복호화할 수 있다(S710). 영상 복호화 장치는 mvp_l0_flag 및 mvd_l0를 이용하여 mv_l0를 도출 또는 유도할 수 있다(S720). mv_l0는 앞서 설명된 수학식 1과 같이 mvp_l0 및 mvd_l0를 합산하여 도출될 수 있다. 여기서, mvp_l0는 복호화된 mvp_l0_flag가 지시하는 주변블록의 움직임벡터에 해당할 수 있다.

mv_l0가 도출되면, 영상 복호화 장치는 ref_l0, ref_l1 및 mv_l0를 이용하여 mv_l1을 유도할 수 있다(S730). 유도되는 mv_l1은 mv_l0와 선형 관계를 가지는 움직임벡터에 해당할 수 있다. ref_l0는 영상 부호화 장치로부터 시그널링된 ref_idx_l0에 의해 지시되는 참조픽처이거나, 별도로 정의된 참조픽처일 수 있다. 또한, ref_l1은 영상 부호화 장치로부터 시그널링된 ref_idx_l1에 의해 지시되는 참조픽처이거나, 별도로 정의된 참조픽처일 수 있다.

mv_l1은 아래 수학식 3과 같이 '현재픽처(610)와 ref_l0 사이의 POC 값 차이' 및 '현재픽처(610)와 ref_l1 사이의 POC 값 차이'들 간의 비례 관계를 mv_l0에 적용하여 유도될 수 있다.

수학식 3에서, mvx ₁은 mv_l1의 x 성분을 나타내고, mvy ₁은 mv_l1의 y 성분을 나타낸다. POC ₀는 ref_l0의 POC 값을 나타내고, POC ₁은 ref_l1의 POC 값을 나타내며, POC _curr은 현재블록(620)이 포함된 현재픽처(610)의 POC 값을 나타낸다. 또한, POC _curr - POC ₀는 ref_l0와 현재픽처(610) 사이의 POC 값 차이를 나타내고, POC _curr - POC ₁는 ref_l1과 현재픽처(610) 사이의 POC 값 차이를 나타낸다.

mv_l1이 유도되면, 영상 복호화 장치는 mv_l0가 지시하는 제1참조블록(630)과 mv_l1이 지시하는 제2참조블록(640)을 기반으로 현재블록(620)을 예측할 수 있다(S740).

실시형태에 따라, 본 발명에서 제안하는 다양한 실시예들은 활성/비활성을 지시하는 신택스(예를 들어, linear_MV_coding_enabled_flag) 요소 및/또는 움직임의 선형관계를 나타내는 신택스 요소(예를 들어, linear_MV_coding_flag 또는 linear_MV_coding_idc)를 이용하여 현재블록(620)에 대한 적용 여부가 결정될 수 있다. 여기서, 활성/비활성을 지시하는 신택스 요소는 전술된 인에이블 정보에 해당할 수 있으며, 선형관계를 나타내는 신택스 요소는 전술된 모드정보에 해당할 수 있다.

linear_MV_coding_enabled_flag는 high-level 신택스로서, sequence-level, picture-level, tile group-level, slice-level 중 하나 이상의 위치에서 정의될 수 있다. linear_MV_coding_flag는 복호화 대상에 해당하는 각 블록마다 시그널링될 수 있다.

linear_MV_coding_enabled_flag=1인 경우, 예측 단위 별로 linear_MV_coding_flag를 시그널링하여 본 발명에서 제안하는 실시예들의 적용 여부를 각 블록마다 설정할 수 있다. linear_MV_coding_flag=1이면, motion_info_l1 중 일부 또는 전부가 시그널링되지 않고, 시그널링된 motion_info_l0를 이용하여 유도될 수 있다(제1모드). linear_MV_coding_flag=0이면, motion_info_l1는 종래 방법과 마찬가지로 시그널링될 수 있다(제2모드).

이하에서는, linear_MV_coding_enabled_flag가 high-level에서 기능의 활성화로 정의되고, 각 블록마다 linear_MV_coding_flag가 설정됨을 전제로, 본 발명의 다양한 실시예들에 대해 설명하도록 한다.

실시예 3-1

실시예 3-1은 양방향 예측 시에 motion_info_l1 중 mvp_l1_flag 및 mvd_l1이 전송되지 않고 움직임의 선형 관계를 이용하여 motion_info_l0로부터 유도되는 방법에 해당한다.

제2방향이 L0인 경우, L0 방향의 움직임정보는 움직임의 선형 관계를 이용하여 L1 방향의 mvd, mvp 및 양방향의 참조픽처로부터 유도될 수 있다. 즉, L0 방향의 mvp 정보 및 mvd 정보는 시그널링되지 않는다. 제2방향이 L1인 경우, L1 방향의 움직임정보는 움직임의 선형 관계를 이용하여 L0 방향의 mvd, mvp 및 양방향의 참조픽처로부터 유도될 수 있다. 즉, L1 방향의 mvp 정보 및 mvd 정보는 시그널링되지 않는다.

L1 방향의 움직임벡터가 선형 관계를 이용하여 유도되는 경우(후자의 경우)에 영상 부호화 장치로부터 영상 복호화 장치로 시그널링되는 정보들을 신택스로 표현하면 아래 표 4와 같다.

표 4에 표현된 바와 같이, motion_info_l0가 비트스트림에 포함되어 영상 부호화 장치로부터 영상 복호화 장치로 시그널링될 수 있다. 시그널링되는 motion_info_l0에는 ref_idx_l0, mvd_l0 및 mvp_l0_flag가 포함될 수 있다. ref_idx_l1도 비트스트림에 포함되어 시그널링될 수 있다. 실시예 3-1에서, mv_l1을 유도하기 위한 참조픽처(ref_l0, ref_l1)들은 영상 부호화 장치로부터 시그널링된 ref_idx_l0 및 ref_idx_l0에 의해 지시되는 참조픽처에 해당한다.

motion_info_l0가 복호화되면(S910), 영상 복호화 장치는 복호화된 mvp_l0_flag 및 mvd_l0를 이용하여 mv_l0를 도출 또는 유도할 수 있다(S920). 이 과정에서 수학식 1이 이용될 수 있다. 또한, ref_idx_l1가 비트스트림으로부터 복호화될 수 있다(S930).

영상 복호화 장치는 linear_MV_coding_enabled_flag를 이용하여 움직임벡터 유도 기능의 활성/비활성 여부를 판단할 수 있다(S940). linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하면, 본 발명에서 제안하는 유도 기능의 적용 여부를 판단하기 위해 linear_MV_coding_flag가 비트스트림으로부터 복호화될 수 있다(S950).

복호화된 linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하는 경우(S960), 영상 복호화 장치는 mv_l0와 mv_l1 사이에 선형관계가 성립함을 전제로 mv_l1을 유도할 수 있다(S970). mv_l1을 유도하는 과정은 양방향 각각의 참조픽처(ref_l0, ref_l1) 및 mv_l0를 수학식 3에 적용하여 구현될 수 있다.

한편, S940 과정에서 linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 비활성을 지시하거나, S960 과정에서 linear_MV_coding_flag가 움직임의 선형관계가 성립함을 지시하지 않으면, mv_l1은 제1모드가 아닌, 제2모드를 통해 도출될 수 있다. 구체적으로, 영상 복호화 장치는 mvp_l1_flag 및 mvd_l1을 비트스트림으로부터 복호화하고(S980, S990), 이들을 이용하여 mv_l1을 유도할 수 있다(S992).

이상에서 설명된 실시예 3-1에 대한 신택스 요소들을 표현하면, 아래 표 5와 같다.

도 9에는 linear_MV_coding_enabled_flag를 판단하는 과정(S940)과 linear_MV_coding_flag를 복호화하고 판단하는 과정(S950, S960)이 ref_idx_l1을 복호화하는 과정(S930) 이후에 수행되는 것으로 표현되어 있으나, S940 과정 내지 S960 과정은 motion_info_l0를 복호화하는 과정(S910) 이전에 수행될 수도 있다.

실시예 3-1을 기반으로 하여 mv_l1을 유도하는 예들이 도 10에 표현되어 있다. 도 10의 (A)와 (B) 각각은 양방향 예측에서 현재픽처(610)와 참조픽처들(ref_l0, ref_l1)이 각각의 POC 값 크기에 따라 가질 수 있는 두 가지 형태를 나타낸다. 후술되는 실시예들은 도 10에 표현된 두 가지 형태 모두에 적용될 수 있다.

도 10 (A)에 표현된 바와 같이, 양방향 예측에는 POC 값을 기준으로 현재픽처(610)가 참조픽처들(ref_l0, ref_l1) 사이에 위치하는 경우((POC ₀<POC _cur)&(POC _cur<POC ₁))가 포함될 수 있다. 또한, 도 10 (B)에 표현된 바와 같이, 양방향 예측에는 POC 값을 기준으로 현재픽처(610)의 POC 값이 참조픽처들(ref_l0, ref_l1)의 POC 값들보다 큰 경우((POC ₀<POC _cur)&(POC ₁<POC _cur))가 포함될 수 있다. 여기서, POC ₀는 ref_l0의 POC 값을 나타내며, POC ₁은 ref_l1의 POC 값을 나타내고, POC _cur는 현재픽처(610)의 POC 값을 나타낸다.

양방향 예측의 두 가지 형태 모두에서, mv_l0(실선 화살표)와 mv_l1(점선 화살표) 사이에 선형 관계가 성립함을 전제로, mv_l1이 유도될 수 있다. 이 과정에서, mv_l0, 양방향 각각의 참조픽처(ref_l0, ref_l1)들이 이용될 수 있다. mv_l1이 유도되면, mv_l0가 지시하는 참조블록(630)과 유도된 mv_l1이 지시하는 참조블록(640)을 기반으로 현재블록(620)이 예측될 수 있다.

실시예 3-2

실시예 3-2는 움직임의 선형 관계를 기초로 mv_l1을 유도한 후, 이를 보정 또는 조정하는 방법에 해당한다. 실시예 3-2는 움직임의 선형 관계를 기초로 움직임벡터를 유도하는 측면에서는 실시예 3-1과 동일하나, 오프셋정보를 이용하여 mv_l1을를 추가적으로 보정 또는 조정하는 측면에서 실시예 3-1과 차이점을 가진다.

움직임의 보정을 위한 오프셋정보는 mv_l1과 '조정된 mv_l1' 사이의 차이를 나타내는 정보에 해당한다. 이를 달리 표현하면, 오프셋정보는 움직임의 선형 관계를 이용하여 유도된 움직임벡터(mv_l1)와 현재블록의 측정된(실제) 움직임벡터(조정된 mv_l1) 사이의 차이를 나타내는 정보에 해당한다.

오프셋정보에는 오프셋벡터와 오프셋 인덱스가 포함될 수 있다. 오프셋벡터는 mv_l1가 지시하는 위치를 원점으로 하여 '조정된 mv_l1'이 지시하는 위치를 나타내기 위한 정보에 해당한다. 오프셋 인덱스는 오프셋벡터에 해당할 수 있는 후보들을 인덱싱한 정보에 해당한다. 이하에서는 오프셋정보의 두 가지 형태 각각을 별도의 실시예를 통해 설명하도록 한다.

오프셋벡터

motion_info_l0 이외에, 오프셋벡터가 비트스트림에 더 포함되어 시그널링될 수 있다. 전술된 바와 같이, 오프셋벡터는 조정된 mv_l1과 (조정되기 전) mv_l1을 차분한 값에 해당하므로, mvd(motion vector difference)로 표현될 수 있다. 또한, 오프셋벡터는 움직임의 선형 관계를 이용하여 유도된 움직임벡터와 현재블록의 측정된 움직임벡터 사이의 차이에 해당하므로, 종래 방법에서 이용되는 mvd(주변블록의 움직임벡터로부터 유도된 mvp와 현재블록의 mv 사이의 차이)와 구별될 수 있다. 본 실시예에서, 양방향 예측을 위해 영상 부호화 장치로부터 영상 복호화 장치로 시그널링되는 정보들을 신택스로 표현하면 아래 표 6과 같다.

위 표 6에서, mvd_l1은 종래 방법에서 이용되는 mvd 또는 오프셋벡터를 의미할 수 있다. 현재블록(620)에 대하여, 움직임의 선형 관계가 성립하지 않는 경우에는 종래 방법에서 이용되는 mvd가 mvd_l1으로 시그널링되며, 움직임의 선형 관계가 성립하는 경우에는 오프셋벡터가 mvd_l1으로 시그널링될 수 있다.

표 6에 표현된 바와 같이, motion_info_l0가 영상 부호화 장치로부터 영상 복호화 장치로 시그널링될 수 있다. 시그널링되는 motion_info_l0에는 표 6에 표현된 바와 같이 ref_idx_l0, mvd_l0 및 mvp_l0_flag가 포함될 수 있다. ref_idx_l1도 비트스트림에 포함되어 시그널링될 수 있다.

영상 복호화 장치는 시그널링된 참조픽처정보들(ref_idx_l0, ref_idx_l1)에 의해 지시되는 참조픽처들을 mv_l1을 유도하기 위한(현재블록의 예측을 위한) 참조픽처들(ref_l0, ref_l1)로 설정한다.

motion_info_l0가 복호화되면(S1110), 영상 복호화 장치는 mvp_l0_flag 및 mvd_l0를 이용하여 mv_l0를 도출 또는 유도할 수 있다(S1120). 이 과정에서 수학식 1이 이용될 수 있다. 또한, 영상 복호화 장치는 ref_idx_l1와 mvd_l1을 비트스트림으로부터 복호화할 수 있다(S1130, S1140). 여기서, mvd_l1은 선형 관계의 성립 여부에 따라, 종래 방법의 mvd 및 오프셋벡터 중 어느 하나에 해당할 수 있다.

영상 복호화 장치는 linear_MV_coding_enabled_flag를 이용하여 움직임벡터 유도 기능의 활성/비활성 여부를 판단할 수 있다(S1150). linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하면, linear_MV_coding_flag가 비트스트림으로부터 복호화될 수 있다(S1160).

linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하는 경우(S1170), 영상 복호화 장치는 움직임의 선형 관계가 성립함을 전제로 mv_l1을 유도할 수 있다(S1180). 이 과정은 참조픽처들(ref_l0, ref_l1) 및 mv_l0를 수학식 3에 적용하여 구현될 수 있다.

영상 복호화 장치는 유도된 mv_l1에 오프셋벡터(mvd_l1)를 적용하여 mv_l1를 조정 또는 보정할 수 있다(S1182). 구체적으로, mv_l1이 지시하는 위치를 원점으로 하여, 오프셋벡터(mvd_l1)가 지시하는 위치로 이동함으로써 mv_l1이 조정될 수 있다. 이를 다시 설명하면, 유도된 mv_l1을 제2방향의 예측움직임벡터(mvp)로 가정하고, 가정된 예측움직임벡터에 오프셋벡터(mvd_l1)를 적용하여 mv_l1을 조정하는 것으로 이해될 수 있다.

한편, S1150 과정에서 linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 비활성을 지시하거나, S1170 과정에서 linear_MV_coding_flag가 움직임의 선형관계가 성립함을 지시하지 않으면, 영상 복호화 장치는 본 발명에서 제안하는 유도 방법이 아닌, 종래 방법을 통해 mv_l1을 유도할 수 있다. 구체적으로, 영상 복호화 장치는 mvp_l1_flag를 복호화하고(S1190), mvp_l1_flag가 지시하는 mvp_l1와 S1140 과정에서 복호화된 mvd_l1을 합산하여 mv_l1을 유도할 수 있다(S1192). 여기서, mvd_l1은 종래 방법에서 이용되는 mvd에 해당한다.

이상에서 설명된 실시예에 대한 신택스 요소들을 표현하면, 아래 표 7과 같다.

도 11에는 linear_MV_coding_enabled_flag를 판단하는 과정(S1150)과 linear_MV_coding_flag를 복호화하고 판단하는 과정(S1160, S1170)이 mvd_l1을 복호화하는 과정(S1140) 이후에 수행되는 것으로 표현되어 있으나, S1150 과정 내지 S1170 과정은 motion_info_l0를 복호화하는 과정(S1110) 이전에 수행될 수도 있다.

본 실시예를 기반으로 mv_l1을 유도하는 일 예가 도 12에 도시되어 있다. 도 12에 표현된 바와 같이, mv_l0(실선 화살표)와 mv_l1(일점 쇄선 화살표) 사이에 선형 관계가 성립함을 전제로, mv_l1이 유도될 수 있다.

또한, 유도된 mv_l1을 예측움직임벡터로 가정하고, mv_l1으로부터 오프셋벡터(mvd_l1)가 지시하는 방향과 크기에 따라 이동하여 mv_l1이 조정될 수 있다. mv_l0가 지시하는 참조블록(630)과 조정된 제2움직임벡터(mv _A_l1)가 지시하는 참조블록(640)을 기반으로 현재블록(620)이 예측될 수 있다.

오프셋 인덱스

motion_info_l0 이외에, 오프셋 인덱스가 비트스트림에 더 포함되어 시그널링될 수 있다. 전술된 바와 같이, 오프셋 인덱스는 미리 설정된 하나 이상의 오프셋벡터 후보들(오프셋벡터에 해당할 수 있는 후보들) 중 어느 하나를 지시하는 인덱스에 해당한다.

본 실시예에서, 양방향 예측을 위해 영상 부호화 장치로부터 영상 복호화 장치로 시그널링되는 정보들을 신택스로 표현하면 아래 표 8과 같다.

위 표 8에서, mv_offset은 오프셋 인덱스에 해당하는 신택스 요소를 나타낸다. motion_info_l0가 비트스트림에 포함되어 영상 부호화 장치로부터 영상 복호화 장치로 시그널링될 수 있다. 시그널링되는 motion_info_l0에는 표 8에 표현된 바와 같이 ref_idx_l0, mvd_l0 및 mvp_l0_flag가 포함될 수 있다. ref_idx_l1도 비트스트림에 포함되어 시그널링될 수 있다. 영상 복호화 장치는 시그널링된 참조픽처정보들(ref_idx_l0, ref_idx_l1)에 의해 지시되는 참조픽처들을 mv_l1을 유도하기 위한 참조픽처들(ref_l0, ref_l1)로 설정한다.

motion_info_l0가 복호화되면(S1310), 영상 복호화 장치는 motion_info_l0에 포함된 mvp_l0_flag 및 mvd_l0를 이용하여 mv_l0를 도출 또는 유도할 수 있다(S1320). 이 과정에서 수학식 1이 이용될 수 있다. 또한, 영상 복호화 장치는 ref_idx_l1을 복호화할 수 있다(S1330).

영상 복호화 장치는 linear_MV_coding_enabled_flag를 분석하여 움직임벡터 유도 기능의 활성/비활성 여부를 판단할 수 있다(S1340). linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하면, linear_MV_coding_flag가 비트스트림으로부터 복호화될 수 있다(S1350).

linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하는 경우(S1360), 영상 복호화 장치는 오프셋 인덱스(mv_offset)를 복호화하며(S1370), mv_l0와 mv_l1 사이에 선형 관계가 성립함을 전제로 mv_l1을 유도할 수 있다(S1380). 이 과정(S1380)은 mv_l0, 양방향의 참조픽처들(ref_l0, ref_l1)을 수학식 3에 적용하여 구현될 수 있다.

영상 복호화 장치는 유도된 mv_l1에 오프셋 인덱스(mv_offset)가 지시하는 오프셋벡터 후보를 적용하여 mv_l1을 조정 또는 보정할 수 있다(S1382). 구체적으로, 오프셋 인덱스(mv_offset)가 지시하는 오프셋벡터 후보를 mv_l1에 가산함으로써 mv_l1이 조정될 수 있다. 이를 다시 설명하면, 유도된 mv_l1을 제2방향의 예측움직임벡터(mvp)로 가정하고, 가정된 예측움직임벡터에 오프셋 인덱스(mv_offset)가 지시하는 오프셋벡터 후보를 적용하여 mv_l1을 조정하는 것으로 이해될 수 있다.

한편, S1340 과정에서 linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 비활성을 지시하거나, S1360 과정에서 linear_MV_coding_flag가 움직임의 선형관계가 성립함을 지시하지 않으면, 본 발명에서 제안하는 유도 방법이 아닌, 종래 방법을 통해 mv_l1이 유도될 수 있다. 구체적으로, 영상 복호화 장치는 mvd_l1 및 mvp_l1_flag를 비트스트림으로부터 복호화하고(S1390, S1392), mvp_l1_flag가 지시하는 mvp_l1과 mvd_l1을 합산하여 mv_l1을 유도할 수 있다(S1394).

이상에서 설명된 실시예에 대한 신택스 요소들을 표현하면, 아래 표 9와 같다.

도 13에는 linear_MV_coding_enabled_flag를 판단하는 과정(S1340)과 linear_MV_coding_flag를 복호화하고 판단하는 과정(S1350, S1360)이 ref_idx_l1을 복호화하는 과정(S1330) 이후에 수행되는 것으로 표현되어 있으나, S1340 과정 내지 S1360 과정은 motion_info_l0를 복호화하는 과정(S1310) 이전에 수행될 수도 있다.

본 실시예에서 이용되는 오프셋벡터 후보들의 다양한 형태가 도 14에 도시되어 있다. 도 14 (a)는 4-point 오프셋의 움직임이 허용되는 경우의 오프셋벡터 후보들(내부가 비워진 원)을 나타낸다. 내부가 채워진 원은 움직임의 선형관계를 기반으로 유도되는 mv_l1을 나타낸다. 4-point 오프셋의 움직임이 허용되는 경우, 2-bit fixed length(FL)의 오프셋 인덱스를 이용하여 오프셋벡터 후보들 중 어느 하나를 지시할 수 있다.

도 14 (b)는 8-point 오프셋의 움직임이 허용되는 경우의 오프셋벡터 후보들을 나타낸다. 4-point 오프셋벡터 후보들에 4개의 오프셋벡터 후보들(세로 방향의 패턴으로 채워진 원)을 추가하여 8-point 오프셋벡터 후보들을 표현할 수 있다. 8-point 오프셋의 움직임이 허용되는 경우, 3-bit FL의 오프셋 인덱스를 이용하여 오프셋벡터 후보들 중 어느 하나를 지시할 수 있다.

도 14 (c)는 16-point 오프셋의 움직임이 허용되는 경우의 오프셋벡터 후보들을 나타낸다. 8-point 오프셋벡터 후보들에 8개의 오프셋벡터 후보들(가로 방향의 패턴으로 채워진 원)을 추가하여 16-point 오프셋벡터 후보들을 표현할 수 있다. 16-point 오프셋의 움직임이 허용되는 경우, 4-bit FL의 오프셋 인덱스를 이용하여 오프셋벡터 후보들 중 어느 하나를 지시할 수 있다.

도 14 (d)는 16-point 오프셋의 움직임이 허용되는 경우의 또 다른 예를 나타낸다. 가로 방향의 패턴으로 채워진 8-point 오프셋벡터 후보들과 사선 방향의 패턴으로 채워진 8-point 오프셋벡터 후보들을 결합하여 16-point 오프셋벡터 후보들을 표현할 수 있다. 16-point 오프셋의 움직임이 허용되는 경우, 4-bit FL의 오프셋 인덱스를 이용하여 오프셋벡터 후보들 중 어느 하나를 지시할 수 있다.

도 14를 통해 설명된 오프셋벡터 후보들의 다양한 형태들 중 어느 형태를 설정할지는 picture-level header, tile group header, tile header 및/또는 CTU header 중 하나 이상의 위치에서 결정 또는 정의될 수 있다. 즉, 영상 부호화 장치로부터 시그널링되는 정보(식별정보)를 이용하여 오프셋벡터 후보의 형태가 결정될 수 있으며, 식별정보는 위에서 설명된 다양한 위치에서 정의될 수 있다. 식별정보에 의해 오프셋벡터 후보들의 다양한 형태들 중 어느 하나가 결정 또는 식별되므로, 식별정보에 의해 오프셋벡터 후보들의 개수, 후보들 각각의 크기 및 후보들 각각의 방향이 결정될 수 있다.

또한, 오프셋벡터 후보들의 다양한 형태들 중 어느 형태를 설정할지는 영상 부호화 장치와 영상 복호화 장치에서 동일한 규칙을 이용하여 미리 결정될 수도 있다.

실시예 4

실시예 4는 움직임의 가로 방향과 세로 방향 중, 선형관계가 성립하는 방향은 시그널링 없이 motion_info_l0를 이용하여 유도하고, 선형관계가 성립하지 않는 방향은 추가적으로 시그널링되는 정보(오프셋정보)를 이용하여 조정하는 방법에 해당한다.

예를 들어, 움직임의 가로축 성분에 대해서만 선형 관계가 성립하는 경우, 가로축에 대해서는 유도된 mv_l1을 그대로 이용하되, 선형 관계가 성립하지 않는 세로축에 대해서는 추가적으로 시그널링되는 오프셋정보를 적용하여 조정한다. 다른 예로, 움직임의 세로축 성분에 대해서만 선형 관계가 성립하는 경우, 세로축에 대해서는 유도된 mv_l1을 그대로 이용하되, 선형 관계가 성립하지 않는 가로축에 대해서는 추가적으로 시그널링되는 오프셋정보를 적용하여 조정한다.

실시예 4는 전술된 실시예 3-1 및 실시예 3-2 각각과 결합된 형태로 구현될 수 있다. 이하에서는, 실시예 4가 실시예 3-1과 결합된 형태 및 실시예 4가 실시예 3-2와 결합된 형태를 구분하여 설명하도록 한다.

실시예 4-1

실시예 4-1은 실시예 4와 실시예 3-1이 결합된 형태에 해당한다. 본 실시예에서, 양방향 예측을 위해 영상 부호화 장치로부터 영상 복호화 장치로 시그널링되는 정보들을 신택스로 표현하면 아래 표 10과 같다.

표 10에서, mvd_l1은 오프셋정보(오프셋벡터) 또는 종래 방법의 mvd를 의미할 수 있다. 예를 들어, 가로축 성분의 선형 관계가 성립하지 않는 경우에 mvd_l1은 가로축 성분에 대한 오프셋벡터이며, 세로축 성분의 선형 관계가 성립하지 않는 경우에 mvd_l1은 세로축 성분에 대한 오프셋벡터일 수 있다. 또한, 가로축 성분 및 세로축 성분 모두 선형 관계가 성립하지 않는 경우에 mvd_l1은 종래 방법의 mvd일 수 있다. 만약, 가로축 성분 및 세로축 성분 모두 선형 관계가 성립하는 경우에는 mvd_l1이 시그널링되지 않는다.

motion_info_l0가 비트스트림에 포함되어 영상 부호화 장치로부터 영상 복호화 장치로 시그널링될 수 있다. 시그널링되는 motion_info_l0에는 ref_idx_l0, mvd_l0 및 mvp_l0_flag가 포함될 수 있다. ref_idx_l1도 비트스트림에 포함되어 시그널링될 수 있다. 영상 복호화 장치는 시그널링된 참조픽처정보들(ref_idx_l0, ref_idx_l1)에 의해 지시되는 참조픽처들을 mv_l1을 유도하기 위한 참조픽처들(ref_l0, ref_l1)로 설정한다.

motion_info_l0가 복호화되면(S1510), 영상 복호화 장치는 mvp_l0_flag 및 mvd_l0를 이용하여 mv_l0를 도출 또는 유도할 수 있다(S1520). 이 과정에서 수학식 1이 이용될 수 있다. 또한, 영상 복호화 장치는 ref_idx_l1을 비트스트림으로부터 복호화할 수 있다(S1530).

영상 복호화 장치는 linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하면(S1540), linear_MV_coding_idc를 비트스트림으로부터 복호화한다(S1550). 여기서, linear_MV_coding_idc는 움직임의 선형 관계 여부를 나타내는 정보로서, 이 정보를 이용하여 움직임의 가로축 성분 및 세로축 성분 중에 선형 관계가 성립하는 성분을 지시할 수 있다.

linear_MV_coding_idc=none이면(S1560), 두 성분 모두에 대해 선형 관계가 성립하지 않으므로, 종래 방법대로 mvp_l1_flag 및 mvd_l1이 시그널링된다. 따라서, 영상 복호화 장치는 mvp_l1_flag 및 mvd_l0를 비트스트림으로부터 복호화하며(S1562), 복호화된 정보들을 이용하여 mv_l1을 유도할 수 있다(S1564). S1540 과정에서 linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하지 않는 경우에도 영상 복호화 장치는 복호화된 mvp_l1_flag 및 mvd_l1을 이용하여 mv_l1을 유도할 수 있다(S1562, S1564).

linear_MV_coding_idc=x이면(S1570), 가로축 성분(x)만 선형 관계가 성립하므로, 선형 관계가 성립하지 않는 세로축 성분(y)에 대한 오프셋벡터(mvd_l1, y)가 시그널링된다. 따라서, 영상 복호화 장치는 세로축 성분에 대한 오프셋벡터(mvd_l1, y)를 복호화하며(S1572), 선형 관계를 이용하여 mv_l1을 유도한다. 또한, 영상 복호화 장치는 유도된 mv_l1에 세로축 성분에 대한 오프셋벡터(mvd_l1, y)를 적용하여 mv_l1을 조정할 수 있다(S1576).

영상 복호화 장치는 가로축 성분에 대해서는 '유도된 mv_l1'을 그대로 이용하고, 세로축 성분 대해서는 조정된 제2움직임벡터(mv _A_l1)를 이용할 수 있다. 유도된 mv_l1의 가로축 성분과 조정된 제2움직임벡터(mv _A_l1)의 가로축 성분은 동일할 수 있다.

linear_MV_coding_idc=y이면(S1580), 세로축 성분만 선형 관계가 성립하므로, 선형 관계가 성립하지 않는 가로축 성분에 대한 오프셋벡터(mvd_l1, x)가 시그널링된다. 따라서, 영상 복호화 장치는 가로축 성분에 대한 오프셋벡터(mvd_l1, x)를 복호화하며(S1582), 선형 관계를 이용하여 유도된(S1584) mv_l1에 가로축 성분에 대한 오프셋벡터(mvd_l1, x)를 적용하여 mv_l1을 조정할 수 있다(S1586).

영상 복호화 장치는 세로축 성분에 대해서는 '유도된 mv_l1'을 그대로 이용하고, 가로축 성분 대해서는 조정된 제2움직임벡터(mv _A_l1)를 이용할 수 있다. 유도된 mv_l1의 세로축 성분과 조정된 제2움직임벡터(mv _A_l1)의 세로축 성분은 동일할 수 있다.

linear_MV_coding_idc=(x&y)이면(S1580), 가로축 성분 및 세로축 성분 모두에 대해 선형 관계가 성립하므로, mvd_l1(오프셋정보 또는 제2방향의 mvd 정보)이 시그널링되지 않는다. 이 경우, 영상 복호화 장치는 motion_info_l0와 ref_idx_l1을 이용하여 mv_l1을 유도한다(S1590).

실시예 4-1에 대한 신택스 요소들을 표현하면, 아래 표 11과 같다.

도 15에는 linear_MV_coding_enabled_flag를 판단하는 과정(S1540)과 linear_MV_coding_idc를 복호화하고 판단하는 과정(S1550 내지 S1580)이 ref_idx_l1을 복호화하는 과정(S1530) 이후에 수행되는 것으로 표현되어 있으나, S1540 과정 내지 S1580 과정은 motion_info_l0를 복호화하는 과정(S1510) 이전에 수행될 수도 있다.

실시예 4-2

실시예 4-2는 실시예 4와 실시예 3-2가 결합된 형태에 해당한다. 본 실시예에서, 양방향 예측을 위해 영상 부호화 장치로부터 영상 복호화 장치로 시그널링되는 정보들을 신택스로 표현하면 위에서 설명된 표 10과 같다.

표 10에서, mvd_l1은 오프셋정보(오프셋벡터) 또는 종래 방법의 mvd를 의미할 수 있다. 예를 들어, 가로축 성분의 선형 관계가 성립하지 않는 경우에 mvd_l1은 가로축 성분에 대한 오프셋벡터이며, 세로축 성분의 선형 관계가 성립하지 않는 경우에 mvd_l1은 세로축 성분에 대한 오프셋벡터일 수 있다. 또한, 가로축 성분 및 세로축 성분 모두 선형 관계가 성립하지 않는 경우에 mvd_l1은 종래 방법의 mvd일 수 있다. 만약, 가로축 성분 및 세로축 성분 모두 선형 관계가 성립하는 경우에는 mvd_l1은 두 성분 모두에 대한 오프셋벡터일 수 있다.

motion_info_l0가 복호화되면(S1610), 영상 복호화 장치는 mvp_l0_flag 및 mvd_l0를 이용하여 mv_l0를 도출 또는 유도할 수 있다(S1620). 이 과정에서 수학식 1이 이용될 수 있다. 또한, 영상 복호화 장치는 ref_idx_l1를 비트스트림으로부터 복호화할 수 있다(S1630).

linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하면(S1640), 영상 복호화 장치는 linear_MV_coding_idc를 비트스트림으로부터 복호화한다(S1650).

linear_MV_coding_idc=none이면(S1660), 두 성분 모두에 대해 선형 관계가 성립하지 않으므로, 종래 방법대로 mvp_l1_flag 및 mvd_l1이 시그널링된다. 따라서, 영상 복호화 장치는 mvp_l1_flag 및 mvd_l1을 비트스트림으로부터 복호화하며(S1662), 복호화된 정보들을 이용하여 mv_l1을 유도할 수 있다(S1664). S1640 과정에서 linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하지 않는 경우에도, 영상 복호화 장치는 복호화된 mvp_l1_flag 및 mvd_l1을 이용하여 mv_l1을 유도할 수 있다(S1662, S1664).

linear_MV_coding_idc=x이면(S1670), 가로축 성분만 선형 관계가 성립하므로, 선형 관계가 성립하지 않는 세로축 성분에 대한 오프셋벡터(mvd_l1, y)가 시그널링된다. 따라서, 영상 복호화 장치는 세로축 성분에 대한 오프셋벡터(mvd_l1, y)를 복호화하며(S1672), 선형 관계를 이용하여 mv_l1을 유도한다(S1674). 또한, 영상 복호화 장치는 유도된 mv_l1에 세로축 성분에 대한 오프셋벡터(mvd_l1, y)를 적용하여 mv_l1을 조정할 수 있다(S1676).

linear_MV_coding_idc=y이면(S1680), 세로축 성분만 선형 관계가 성립하므로, 선형 관계가 성립하지 않는 가로축 성분에 대한 오프셋벡터(mvd_l1, x)가 시그널링된다. 따라서, 영상 복호화 장치는 가로축 성분에 대한 오프셋벡터(mvd_l1, x)를 복호화하며(S1682), 선형 관계를 이용하여 유도된(S1684) mv_l1에 가로축 성분에 대한 오프셋벡터(mvd_l1, x)를 적용하여 mv_l1을 조정할 수 있다(S1686).

linear_MV_coding_idc=(x&y)이면(S1680), 가로축 성분 및 세로축 성분 모두에 대해 선형 관계가 성립하므로, 가로축 성분 및 세로축 성분 모두에 대한 오프셋벡터(mvd_l1, x and y)가 시그널링된다. 따라서, 영상 복호화 장치는 가로축 성분 및 세로축 성분 모두에 대한 오프셋벡터(mvd_l1, x and y)를 비트스트림으로부터 복호화하며(S1690), 선형 관계를 이용하여 유도된(S1692) mv_l1에 오프셋벡터(mvd_l1, x and y)를 적용하여 mv_l1을 조정할 수 있다(S1694).

실시예 4-2에 대한 신택스 요소들을 표현하면, 아래 표 12와 같다.

도 16에는 linear_MV_coding_enabled_flag를 판단하는 과정(S1640)과 linear_MV_coding_idc를 복호화하고 판단하는 과정(S1650 내지 S1680)이 ref_idx_l1을 복호화하는 과정(S1630) 이후에 수행되는 것으로 표현되어 있으나, S1640 과정 내지 S1680 과정은 motion_info_l0를 복호화하는 과정(S1610) 이전에 수행될 수도 있다.

실시예 4를 기반으로 mv_l1을 유도하는 일 예가 도 17에 도시되어 있다. 도 17에 도시된 일 예는 세로축 성분에 대한 선형 관계가 성립하는 예에 해당한다.

도 17에 표현된 바와 같이, mv_l0(실선 화살표)와 mv_l1(일점 쇄선 화살표) 사이에 선형 관계가 성립함을 전제로, mv_l1이 유도될 수 있다.

가로축 성분에 대해 선형 관계가 성립하지 않으므로, 유도된 mv_l1로부터 가로축 방향으로 오프셋벡터(mvd_l1)가 지시하는 크기에 따라 이동하여 mv_l1가 조정될 수 있다. 세로축 성분에 대해서는 mv_l1 값을 그대로 적용하고 가로축 성분에 대해서는 조정된 제2움직임벡터(mv _A_l1)를 적용하여 제2방향에 대한 최종적인 움직임벡터(mv _A_l1)를 유도할 수 있다. mv_l0가 지시하는 참조블록(630)과 조정된 제2움직임벡터(mv _A_l1)가 지시하는 참조블록(640)을 기반으로 현재블록(620)이 예측될 수 있다.

실시예 5

실시예 5는 미리 설정된 참조픽처들을 mv_l1을 유도하기 위한 참조픽처들로 이용하는 방법에 해당한다. 미리 설정된 참조픽처들이란, 움직임의 선형 관계가 성립하는 경우에 이용하도록 미리 설정된 참조픽처들을 의미한다.

실시예 5에서는 참조픽처정보(ref_idx_l0 및 ref_idx_l1)가 블록 단위로 시그널링되지 않고, 상위 레벨에서 시그널링될 수 있다. 여기서, 상위 레벨은 picture-level header, tile group-level header, slice header, tile header 및/또는 CTU header 중 하나 이상에 해당할 수 있다. 미리 정의된 참조픽처들은 '대표 참조픽처' 또는 '선형용 참조픽처'로 지칭될 수 있으며, 상위 레벨에서 시그널링되는 참조픽처정보들은 '대표 참조픽처정보' 또는 '선형용 참조픽처정보'로 지칭될 수 있다. 움직임의 선형 관계가 성립하는 경우에는 미리 정의된 선형용 참조픽처를 블록 단위에서 사용하게 된다.

tile group header에서 시그널링되는 선형용 참조픽처정보가 아래 표 13에 표현되어 있다.

표 13에서, linear_ref_idx_l0 및 linear_ref_idx_l1 각각은 양방향 각각에 대해 시그널링되는 선형용 참조픽처정보를 나타낸다.

기존 방식대로 각 블록 별로 참조픽처정보를 시그널링하여 참조픽처를 지정하거나 본 발명에서 제안하는 방법에 의해 선형용 참조픽처를 지정하는 방법에 대한 일 예가 도 18에 도시되어 있다.

선형용 참조픽처정보(linear_ref_idx_l0, linear_ref_idx_l1)가 상위 레벨을 통해 영상 부호화 장치로부터 영상 복호화 장치로 시그널링될 수 있다. 영상 복호화 장치는 시그널링된 선형용 참조픽처정보(linear_ref_idx_l0, linear_ref_idx_l1)가 지시하는 참조픽처를 참조픽처리스트 내에서 선택 또는 선별함으로써 선형용 참조픽처(linear_ref_l0, linear_ref_l1)를 설정할 수 있다.

linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하면(S1810), 영상 복호화 장치는 linear_MV_coding_flag를 비트스트림으로부터 복호화할 수 있다(S1820).

linear_MV_coding_flag가 움직임의 선형관계가 성립함을 지시하면(S1830), 영상 복호화 장치는 미리 설정된 선형용 참조픽처(linear_ref_l0, linear_ref_l1)를 이용하여 mv_l1의 유도를 위한 참조픽처(ref_l0, ref_l1)를 유도할 수 있다(S1840, S1850). 즉, 미리 설정된 선형용 참조픽처(linear_ref_l0, linear_ref_l1)가 참조픽처(ref_l0, ref_l1)로 설정될 수 있다.

이와 달리, S1810 과정에서 linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하지 않거나, S1830 과정에서 linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하지 않는 경우, 참조픽처정보(ref_idx_l0, ref_idx_l1)가 시그널링될 수 있다. 영상 복호화 장치는 참조픽처정보(ref_idx_l0, ref_idx_l1)를 복호화하고(S1860, S1870), 이들을 이용하여 참조픽처를 설정할 수 있다.

본 발명에서 제안하는 참조픽처 설정 방법은 전술된 실시예들과 결합된 형태로 구현될 수 있다. 도 19에는 본 발명에서 제안하는 참조픽처 설정 방법과 전술된 실시예 3-1이 결합된 형태가 표현되어 있다.

제1방향에 대하여, linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하는 경우(S1910)에 linear_MV_coding_flag가 복호화된다(S1920). linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하면, 미리 설정된 선형용 참조픽처(linear_ref_l0)가 참조픽처(ref_l0)로 유도될 수 있다(S1940). 이와 달리, linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하지 않거나, linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하지 않으면, 비트스트림으로부터 복호화된(S1962) 참조픽처정보(ref_idx_l0)를 이용하여 참조픽처(ref_l0)가 설정될 수 있다.

제1방향에 대한 참조픽처의 유도 또는 설정이 완료되면, mvd_l0 및 mvp_l0_flag가 복호화되며(S1950), 복호화된 정보들을 이용하여 mv_l0가 도출될 수 있다(S1960).

제2방향에 대하여, linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하면(S1970), 미리 설정된 선형용 참조픽처(linear_ref_l1)를 이용하여 참조픽처(ref_l1)가 유도 또는 설정될 수 있다(S1972). 이와 달리, linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하지 않으면, 비트스트림으로부터 복호화된(S1974) 참조픽처정보(ref_idx_l1)를 이용하여 참조픽처(ref_l1)가 설정될 수 있다.

제2방향에 대한 참조픽처의 유도 또는 설정이 완료되면, linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하는 경우(S1980)에 mv_l0와 선형 관계를 가지는 mv_l1이 유도될 수 있다(S1982). 이와 달리, linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하지 않는 경우(S1980)에는, 비트스트림으로부터 복호화된(S1990, S1992) mvd_l1 및 mvp_l1_flag를 이용하여 mv_l1이 도출될 수 있다(S1994).

도 19를 통해 설명된 실시예에 대한 신택스 요소들을 표현하면, 아래 표 14와 같다.

도 20에는 본 발명에서 제안하는 참조픽처 설정 방법과 전술된 실시예 3-2가 결합된 형태가 표현되어 있다.

제1방향에 대하여, linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하는 경우(S2010)에, linear_MV_coding_flag가 복호화된다(S2020). linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하는 경우(S2030), 미리 설정된 선형용 참조픽처(linear_ref_l0)를 이용하여 참조픽처(ref_l0)가 유도 또는 설정될 수 있다(S2040). 이와 달리, linear_MV_coding_enabled_flag가 움직임벡터 유도 기능의 활성을 지시하지 않거나(S2010), linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하지 않는 경우(S2030), 비트스트림으로부터 복호화된(S2062) 참조픽처정보(ref_idx_l0)를 이용하여 참조픽처(ref_l0)가 설정될 수 있다.

제1방향에 대한 참조픽처의 유도 또는 설정이 완료되면, mvd_l0 및 mvp_l0_flag가 복호화되며(S2050), 복호화된 정보들을 이용하여 mv_l0가 도출될 수 있다(S2060).

제2방향에 대하여, linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하는 경우(S2070)에 미리 설정된 선형용 참조픽처(linear_ref_l1)를 이용하여 참조픽처(ref_l1)가 유도 또는 설정될 수 있다(S2072). 이와 달리, linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하지 않는 경우에는 비트스트림으로부터 복호화된(S2074) 참조픽처정보(ref_idx_l1)를 이용하여 참조픽처(ref_l1)가 설정될 수 있다.

제2방향에 대한 참조픽처의 유도 또는 설정이 완료되면, mvd_l1이 비트스트림으로부터 복호화되는 데(S2080), mvd_l1은 실시예 3-2에서와 마찬가지로 오프셋벡터 또는 종래 방법의 mvd 중 어느 하나에 해당할 수 있다.

linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하는 경우(S2090)에 mv_l0와 선형 관계를 가지는 mv_l1이 유도되며(S2092), 유도된 mv_l1에 오프셋벡터(mvd_l1)를 적용하여 mv_l1이 조정될 수 있다(S2094). 이와 달리, linear_MV_coding_flag가 움직임의 선형 관계가 성립함을 지시하지 않는 경우(S2090)에는 비트스트림으로부터 복호화된(S2096) mvp_l1_flag를 이용하여 mv_l1이 도출될 수 있다(S2098). 이 과정에서 mvp_l1_flag가 지시하는 mvp_l1과 복호화된 mvd_l1(종래 방법의 mvd)가 이용될 수 있다.

이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

CROSS-REFERENCE TO RELATED APPLICATION

본 특허출원은, 본 명세서에 그 전체가 참고로서 포함되는, 2018년 12월 27일에 한국에 출원한 특허출원번호 제10-2018-0171254호 및, 2019년 8월 28일에 한국에 출원한 특허출원번호 제10-2019-0105769호에 대해 우선권을 주장한다.

Claims

복수의 양방향 예측 모드 중 어느 하나를 이용하여 현재블록을 인터 예측하는 방법에 있어서,

상기 복수의 양방향 예측 모드에 포함되는 제1모드가 상기 현재블록에 적용되는지 여부를 지시하는 모드정보를 비트스트림으로부터 복호화하는 단계;

상기 모드정보가 적용됨을 지시하는 경우, 차분움직임벡터 정보 및 예측움직임벡터 정보를 포함하는 제1움직임정보와, 차분움직임벡터 정보 및 예측움직임벡터 정보 중 적어도 일부를 포함하지 않는 제2움직임정보를 상기 비트스트림으로부터 복호화하는 단계;

상기 제1움직임정보에 기반하여 제1움직임벡터를 유도하고, 상기 제1움직임정보 중 적어도 일부와 상기 제2움직임정보에 기반하여 제2움직임벡터를 유도하는 단계; 및

제1참조픽처 내에서 상기 제1움직임벡터에 의해 지시되는 참조블록 및 제2참조픽처 내에서 상기 제2움직임벡터에 의해 지시되는 참조블록을 이용하여, 상기 현재블록을 예측하는 단계를 포함하는 양방향 예측 방법.
제1항에 있어서,

상기 움직임정보를 복호화하는 단계는,

상기 모드정보가 적용되지 않음을 지시하는 경우, 차분움직임벡터 정보 및 예측움직임벡터 정보를 포함하는 제3움직임정보와, 상기 제1움직임정보를 상기 비트스트림으로부터 복호화하고,

상기 움직임벡터를 유도하는 단계는,

상기 제1움직임정보에 기반하여 상기 제1움직임벡터를 유도하고, 상기 제3움직임정보에 기반하여 상기 제2움직임벡터를 유도하는 양방향 예측 방법.
제1항에 있어서,

상기 제1모드가 활성되는지 여부를 지시하는 인에이블(enabled) 정보를 상기 비트스트림으로부터 복호화하는 단계를 더 포함하고,

상기 모드정보는,

상기 인에이블 정보가 활성됨을 지시하는 경우에 복호화되며,

상기 인에이블 정보가 활성됨을 지시하지 않는 경우에, 상기 제1모드가 적용되지 않음을 지시하도록 설정되는 양방향 예측 방법.
제3항에 있어서,

상기 인에이블 정보는,

하이 레벨 신택스(high level syntax)로부터 복호화되는 양방향 예측 방법.
제1항에 있어서,

상기 제1 및 제2참조픽처는,

상기 현재블록보다 상위 레벨에서 결정되며,

상기 상위 레벨은,

픽처 레벨, 타일 그룹 레벨, 슬라이스 레벨, 타일 레벨 및 코딩 트리 유닛 레벨 중 하나 이상을 포함하는 양방향 예측 방법.
제1항에 있어서,

상기 제1 및 제2참조픽처는,

참조픽처 리스트에 포함된 참조픽처들과 현재픽처와의 POC(picture order count) 차이를 근거로 결정되는 양방향 예측 방법.
제1항에 있어서,

상기 유도하는 단계 후, 상기 비트스트림에 포함된 오프셋(offset) 정보를 상기 제2움직임벡터에 적용하여 상기 제2움직임벡터를 조정하는 단계를 더 포함하고,

상기 예측하는 단계는,

상기 제2참조픽처 내에서 상기 조정된 제2움직임벡터에 의해 지시되는 참조블록 및 상기 제1참조픽처 내에서 상기 제1움직임벡터에 의해 지시되는 참조블록을 이용하여, 상기 현재블록을 예측하는 양방향 예측 방법.
제7항에 있어서,

상기 오프셋정보는,

상기 제2움직임벡터가 지시하는 위치를 원점으로 하는 오프셋벡터이며,

상기 조정하는 단계는,

상기 오프셋벡터가 지시하는 위치로 상기 제2움직임벡터를 조정하는 양방향 예측 방법.
제7항에 있어서,

상기 오프셋정보는,

미리 설정된 오프셋벡터 후보들 중 어느 하나를 지시하는 오프셋 인덱스이며,

상기 조정하는 단계는,

상기 오프셋 인덱스가 지시하는 오프셋벡터 후보를 상기 제2움직임벡터에 적용하여 상기 제2움직임벡터를 조정하는 양방향 예측 방법.
복수의 양방향 예측 모드에 포함되는 제1모드가 현재블록에 적용되는지 여부를 지시하는 모드정보를 비트스트림으로부터 복호화하고, 상기 모드정보가 적용됨을 지시하는 경우에 차분움직임벡터 정보 및 예측움직임벡터 정보를 포함하는 제1움직임정보와, 차분움직임벡터 정보 및 예측움직임벡터 정보 중 적어도 일부를 포함하지 않는 제2움직임정보를 상기 비트스트림으로부터 복호화하는 복호화부; 및

상기 제1움직임정보에 기반하여 제1움직임벡터를 유도하고, 상기 제1움직임정보 중 적어도 일부와 상기 제2움직임정보에 기반하여 제2움직임벡터를 유도하며, 제1참조픽처 내에서 상기 제1움직임벡터에 의해 지시되는 참조블록 및 제2참조픽처 내에서 상기 제2움직임벡터에 의해 지시되는 참조블록을 이용하여 상기 현재블록을 예측하는 예측부를 포함하는 영상 복호화 장치.
제10항에 있어서,

상기 복호화부는,

상기 모드정보가 적용되지 않음을 지시하는 경우, 차분움직임벡터 정보 및 예측움직임벡터 정보를 포함하는 제3움직임정보와, 상기 제1움직임정보를 상기 비트스트림으로부터 복호화하고,

상기 예측부는,

상기 제1움직임정보에 기반하여 상기 제1움직임벡터를 유도하고, 상기 제3움직임정보에 기반하여 상기 제2움직임벡터를 유도하는 영상 복호화 장치.
제10항에 있어서,

상기 복호화부는,

상기 비트스트림에 포함된 인에이블(enabled) 정보가 상기 제1모드의 활성됨을 지시하는 경우에 상기 모드정보를 복호화하며,

상기 모드정보는,

상기 인에이블 정보가 활성됨을 지시하지 않는 경우에, 상기 제1모드가 적용되지 않음을 지시하도록 설정되는 영상 복호화 장치.
제12항에 있어서,

상기 복호화부는,

상기 인에이블 정보를 하이 레벨 신택스(high level syntax)로부터 복호화하는 영상 복호화 장치.
제10항에 있어서,

상기 제1 및 제2참조픽처는,

상기 현재블록보다 상위 레벨에서 결정되며,

상기 상위 레벨은,

픽처 레벨, 타일 그룹 레벨, 슬라이스 레벨, 타일 레벨 및 코딩 트리 유닛 레벨 중 하나 이상을 포함하는 영상 복호화 장치.
제10항에 있어서,

상기 제1 및 제2참조픽처는,

참조픽처 리스트에 포함된 참조픽처들과 현재픽처와의 POC(picture order count) 차이를 근거로 결정되는 영상 복호화 장치.
제10항에 있어서,

상기 예측부는,

상기 비트스트림에 포함된 오프셋(offset) 정보를 상기 제2움직임벡터에 적용하여 상기 제2움직임벡터를 조정하고, 상기 제2참조픽처 내에서 상기 조정된 제2움직임벡터에 의해 지시되는 참조블록 및 상기 제1참조픽처 내에서 상기 제1움직임벡터에 의해 지시되는 참조블록을 이용하여 상기 현재블록을 예측하는 영상 복호화 장치.
제16항에 있어서,

상기 오프셋정보는,

상기 제2움직임벡터가 지시하는 위치를 원점으로 하는 오프셋벡터이며,

상기 예측부는,

상기 오프셋벡터가 지시하는 위치로 상기 제2움직임벡터를 조정하는 영상 복호화 장치.
제16항에 있어서,

상기 오프셋정보는,

미리 설정된 오프셋벡터 후보들 중 어느 하나를 지시하는 오프셋 인덱스이며,

상기 예측부는,

상기 오프셋 인덱스가 지시하는 오프셋벡터 후보를 상기 제2움직임벡터에 적용하여 상기 제2움직임벡터를 조정하는 영상 복호화 장치.
복수의 양방향 예측 모드 중 어느 하나를 이용하여 현재블록을 인터 예측하는 방법에 있어서,

움직임 보상을 통해, 상기 현재블록으로부터 제1참조픽처 내 참조블록을 지시하는 제1움직임벡터 및 상기 현재블록으로부터 제2참조픽처 내 참조블록을 지시하는 제2움직임벡터를 유도하는 단계;

복수의 양방향 예측 모드에 포함되는 제1모드가 상기 현재블록에 적용되는지 여부를 지시하는 모드정보를 부호화하여 시그널링하는 단계; 및

상기 모드정보가 적용됨을 지시하는 경우, 상기 제1움직임벡터에 대한 차분움직임벡터 정보 및 예측움직임벡터 정보를 포함하는 제1움직임정보와, 상기 제2움직임벡터에 대한 차분움직임벡터 정보 및 예측움직임벡터 정보 중 적어도 일부를 포함하지 않는 제2움직임정보를 부호화하여 시그널링하는 단계를 포함하는 양방향 예측 방법.
움직임 보상을 통해, 현재블록으로부터 제1참조픽처 내 참조블록을 지시하는 제1움직임벡터 및 상기 현재블록으로부터 제2참조픽처 내 참조블록을 지시하는 제2움직임벡터를 유도하는 예측부; 및

복수의 양방향 예측 모드에 포함되는 제1모드가 상기 현재블록에 적용되는지 여부를 지시하는 모드정보를 부호화하여 시그널링하고, 상기 모드정보가 적용됨을 지시하는 경우에 상기 제1움직임벡터에 대한 차분움직임벡터 정보 및 예측움직임벡터 정보를 포함하는 제1움직임정보와, 상기 제2움직임벡터에 대한 차분움직임벡터 정보 및 예측움직임벡터 정보 중 적어도 일부를 포함하지 않는 제2움직임정보를 부호화하여 시그널링하는 부호화부를 포함하는 영상 부호화 장치.