WO2019231206A1

WO2019231206A1 - 영상 부호화/복호화 방법 및 장치

Info

Publication number: WO2019231206A1
Application number: PCT/KR2019/006373
Authority: WO
Inventors: 안용조
Original assignee: 디지털인사이트주식회사
Priority date: 2018-05-30
Filing date: 2019-05-28
Publication date: 2019-12-05
Also published as: US11356687B2; CA3141303A1; US11818378B2; US20210250596A1; US20240048748A1; US11831890B2; US20220279199A1; KR20210008105A; US20220256181A1; US11350118B2; US20210321126A1; US20240048747A1

Abstract

본 발명의 영상 부호화/복호화 방법은 현재 블록의 병합 후보 리스트를 구성하고, 병합 후보 리스트 및 병합 후보 인덱스를 기반으로 현재 블록의 움직임 정보를 유도하며, 유도된 움직임 정보를 기초로 현재 블록의 인터 예측을 수행한다. 여기서 병합 후보 리스트는 현재 블록이 속한 병합 예측 영역(MER)의 위치 또는 크기를 기초로 적응적으로 복수의 병합 후보를 결정할 수 있어 부호화/복호화 효율을 향상시킬 수 있다.

Description

영상 부호화/복호화 방법 및 장치

본 발명은 영상 부호화/복호화 방법 및 장치에 관한 것이다.

고해상도 비디오에 대한 시장의 수요가 증가하고 있으며, 이에 따라 고해상도 영상을 효율적으로 압축할 수 있는 기술이 필요하다. 이러한 시장의 요구에 따라 ISO/IEC의 MPEG (Moving Picture Expert Group)과 ITU-T의 VCEG (Video Coding Expert Group)이 공동으로 JCT-VC (Joint Collaborative Team on Video Coding)를 결성하여, HEVC (High Efficiency Video Coding) 비디오 압축 표준을 2013년 1월에 개발을 완료했으며, 차세대 압축 표준에 대한 연구 및 개발을 활발히 진행해오고 있다.

동영상 압축은 크게 화면 내 예측 (또는 인트라 예측), 화면 간 예측(또는 인터 예측), 변환, 양자화, 엔트로피(Entropy coding) 부호화, 인루프 필터(In-loop filter)로 구성된다. 한편, 고해상도 영상에 대한 수요가 증가함과 함께, 새로운 영상 서비스로서 입체 영상 컨텐츠에 대한 수요도 함께 증가하고 있다. 고해상도 및 초고해상도의 입체 영상 콘텐츠를 효과적으로 제공하기 위한 비디오 압축 기술에 대하여 논의가 진행되고 있다.

본 발명은 효율이 향상된 영상 부호화/복호화 방법 및 장치를 제공하는 것을 목적으로 한다.

또한, 본 발명은 블록 병합 기술에서는 병합 예측 영역(MER)에 따라 현재 블록의 병합 후보 리스트를 적응적으로 구성하는 방법 및 장치를 제공하는 것을 목적으로 한다.

또한, 본 발명의 블록 병합 기술에서는 병합 예측 영역에 따라 현재 블록의 병합 후보 리스트를 구성함에 있어, 추가적인 병합 후보는 현재 블록과 공간적으로 다수의 화소 거리에 떨어진 블록의 움직임 정보를 활용하는 방법 및 장치를 제공하는 것을 목적으로 한다.

또한, 본 발명은 영상 부호화/복호화 방법 및 장치에 있어서, 효율적인 잔차 신호 변환 및 역변환 방법 및 장치를 제공하는 것을 목적으로 한다.

또한, 본 발명은 영상 부호화/복호화 방법 및 장치에 있어서, 효율적인 움직임 벡터 코딩을 수행하는 비디오 코딩 방법 및 장치를 제공하는 것을 목적으로 한다.

또한, 본 발명은 상기 영상 부호화 방법/장치에 의해 생성된 비트스트림을 저장하는 컴퓨터 판독 가능한 기록 매체를 제공하는 것을 목적으로 한다.

본 발명에 따른 영상 복호화 방법 및 장치는, 블록 병합 기술에서는 병합 예측 영역(MER)에 따라 현재 블록의 병합 후보 리스트를 적응적으로 구성하는 방법 및 장치를 제공한다.

본 발명의 병합 예측 영역을 사용하는 비디오 코딩 방법은, 병합 예측 영역(MER)에 따라 현재 블록의 병합 후보 리스트를 적응적으로 구성하는 방법에 관한 것으로, 병합 예측 영역(MER)에 따라 현재 블록의 병합 후보 리스트를 적응적으로 구성할 수 있다. 이때, 상기 병합 후보 리스트를 적응적으로 구성하는 것은, 현재 블록의 공간적 혹은 시간적으로 인접한 블록과 동일한 병합 예측 영역에 속하는지에 따라, 하나의 병합 후보 리스트를 공유하거나, 기존의 병합 후보를 리스트에서 제거하거나, 또는 추가적인 병합 후보를 리스트에 추가하는 것을 특징으로 한다. .

본 별명의 병합 예측 영역을 사용하는 비디오 코딩 장치는, 병합 예측 영역(MER)에 따라 현재 블록의 병합 후보 리스트를 적응적으로 구성하는 부호화기 또는 복호화기에 관한 것으로, 병합 예측 영역(MER)에 따라 현재 블록의 병합 후보 리스트를 적응적으로 구성할 수 있다. 이때, 상기 병합 후보 리스트를 적응적으로 구성하는 것은 현재 블록의 공간적 혹은 시간적으로 인접한 블록과 동일한 병합 예측 영역에 속하는지에 따라 기존의 병합 후보를 리스트에서 제거하거나, 혹은 추가적인 병합 후보를 리스트에 추가하는 것을 특징으로 한다.

또한, 병합 예측 영역에 따라 현재 블록의 병합 후보 리스트를 구성함에 있어, 상기 추가적인 병합 후보는 현재 블록과 공간적으로 다수의 화소 거리에 떨어진 블록의 움직임 정보를 활용할 수 있다.

본 발명에 따른 비디오 코딩 방법 및 장치는, 비디오 코딩 기술 중 변환 부호화 및 복호화에 관한 것으로서, 하나의 정방형 혹은 비정방형 블록의 잔차 신호 일부만을 변환 및/또는 역변환을 수행하는 방법 및 장치를 포함한다.

본 발명에 따른 비디오 코딩 방법 및 장치는, 비디오 코딩 기술 중 비디오 부호화 및 복호화시 움직임 벡터와 참조 영상 인덱스를 저장하고, 이후 복호화 및 부호화시 블록의 주변 및 이전 영상에서 사용한 움직임 벡터와 참조 영상을 이용하는 방법 및 장치에 관한 것이다.

본 발명에 따르면, 블록 병합 기술을 이용하여 효율적인 영상 부호화/복호화 방법 및 장치가 제공될 수 있다.

또한, 병합 예측 영역(MER)에 따라 현재 블록의 병합 후보 리스트를 적응적으로 구성함에 따라, 부호화/복호화 효율을 향상 시키는 영상 부호화/복호화 방법 및 장치가 제공될 수 있다.

본 발명에 따르면, 효율적인 잔차 신호 변환 및/또는 역변환이 허용되는 영상 부호화/복호화 방법 및 장치가 제공될 수 있다.

본 발명에 따르면, 효율적인 움직인 움직임 벡터 코딩이 가능한 영상 부호화/복호화 방법 및 장치가 제공될 수 있다.

또한, 본 발명에 따르면, 본 발명에 따른 영상 부호화 방법/장치에 의해 생성된 비트스트림을 저장하는 컴퓨터 판독 가능한 기록 매체가 제공될 수 있다.

도 1은 본 발명에 따른 영상 부호화 장치를 나타낸 블록도이다.

도 2는 본 발명에 따른 영상 복호화 장치를 나타낸 블록도이다.

도 3은 본 발명이 적용되는 일실시예로서, MPM(most probable mode)에 기반한 인트라 예측 방법을 도시한 것이다.

도 4는 본 발명이 적용되는 일실시예로서, 병합 예측 영역(MER) 기반의 인터 예측 방법을 도시한 것이다.

도 5는 MER과 동일한 크기를 가지는 CU에 대한 예시이다.

도 6은 MER보다 작은 크기를 가지는 CU에 대한 일 실시예를 도시한 도면이다.

도 7은 MER보다 작은 크기를 가지는 CU에 대한 또 다른 일 실시예를 도시한 도면이다.

도 8은 본 발명이 적용되는 일실시예로서, 현재 블록의 잔차 샘플을 부호화/복호화하는 방법을 도시한 것이다.

도 9는 본 발명이 적용되는 일실시예로서, 블록 크기/형태에 따른 제2 변환의 예시이다.

도 10은 본 발명이 적용되는 일실시예로서, 변환 매트릭스의 크기에 따른 제2 변환 방법을 도시한 것이다.

도 11은 압축된 움직임 벡터 저장 방법의 개념도를 도시한 도면이다.

도 12는 본 발명에 따른 움직임 벡터 저장 방법의 실시 예이다.

도 13은 본 발명에 따른 움직임 벡터 추출 방법의 실시 예이다.

본 명세서에 첨부된 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

본 명세서 전체에서, 어떤 부분이 다른 부분과 '연결'되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 전기적으로 연결되어 있는 경우도 포함한다.

또한, 본 명세서 전체에서 어떤 부분이 어떤 구성요소를 '포함'한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.

또한, 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

또한, 본 명세서에서 설명되는 장치 및 방법에 관한 실시예에 있어서, 장치의 구성 일부 또는 방법의 단계 일부는 생략될 수 있다. 또한 장치의 구성 일부 또는 방법의 단계 일부의 순서가 변경될 수 있다. 또한 장치의 구성 일부 또는 방법의 단계 일부에 다른 구성 또는 다른 단계가 삽입될 수 있다.

또한, 본 발명의 제1 실시예의 일부 구성 또는 일부 단계는 본 발명의 제2 실시예에 부가되거나, 제2 실시예의 일부 구성 또는 일부 단계를 대체할 수 있다.

덧붙여, 본 발명의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 기술되고, 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있다. 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리 범위에 포함된다.

먼저, 본 출원에서 사용되는 용어를 간략히 설명하면 다음과 같다.

이하에서 후술할 복호화 장치(Video Decoding Apparatus)는 민간 보안 카메라, 민간 보안 시스템, 군용 보안 카메라, 군용 보안 시스템, 개인용 컴퓨터(PC, Personal Computer), 노트북 컴퓨터, 휴대형 멀티미디어 플레이어(PMP, Portable MultimediaPlayer), 무선 통신 단말기(Wireless Communication Terminal), 스마트 폰(Smart Phone), TV 응용 서버와 서비스 서버 등 서버 단말기에 포함된 장치일 수 있으며, 각종 기기 등과 같은 사용자 단말기, 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신 장치, 영상을 복호화하거나 복호화를 위해 화면 간 또는 화면 내 예측하기 위한 각종 프로그램과 데이터를 저장하기 위한 메모리, 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비하는 다양한 장치를 의미할 수 있다.

또한, 부호화기에 의해 비트스트림(bitstream)으로 부호화된 영상은 실시간 또는 비실시간으로 인터넷, 근거리 무선 통신망, 무선랜망, 와이브로망, 이동통신망 등의 유무선 통신망 등을 통하거나 케이블, 범용 직렬 버스(USB, Universal Serial Bus)등과 같은 다양한 통신 인터페이스를 통해 영상 복호화 장치로 전송되어 복호화되어 영상으로 복원되고 재생될 수 있다. 또는 부호화기에 의해 생성된 비트스트림은 메모리에 저장될 수 있다. 상기 메모리는 휘발성 메모리와 비휘발성 메모리를 모두 포함할 수 있다. 본 명세서에서 메모리는 비트스트림을 저장한 기록 매체로 표현될 수 있다.

통상적으로 동영상은 일련의 픽쳐(Picture)들로 구성될 수 있으며, 각 픽쳐들은 블록(Block)과 같은 코딩 유닛(coding unit)으로 분할될 수 있다. 또한, 이하에 기재된 픽쳐라는 용어는 영상(Image), 프레임(Frame) 등과 같은 동등한 의미를 갖는 다른 용어로 대치되어 사용될 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 이해할 수 있을 것이다. 그리고 코딩 유닛이라는 용어는 단위 블록, 블록 등과 같은 동등한 의미를 갖는 다른 용어로 대치되어 사용될 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 이해할 수 있을 것이다.

이하, 첨부한 도면들을 참조하여, 본 발명의 실시예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 동일한 구성요소에 대해서 중복된 설명은 생략한다.

도 1을 참조하면, 영상 부호화 장치(100)는 픽쳐 분할부(110), 예측부(120, 125), 변환부(130), 양자화부(135), 재정렬부(160), 엔트로피 부호화부(165), 역양자화부(140), 역변환부(145), 필터부(150) 및 메모리(155)를 포함할 수 있다.

픽쳐 분할부(110)는 입력된 픽쳐를 적어도 하나의 처리 단위로 분할할 수 있다. 이때, 처리 단위는 예측 단위(Prediction Unit: PU)일 수도 있고, 변환 단위(Transform Unit: TU)일 수도 있으며, 부호화 단위(Coding Unit: CU)일 수도 있다. 이하, 본 발명의 실시예에서는 부호화 단위는 부호화를 수행하는 단위의 의미로 사용할 수도 있고, 복호화를 수행하는 단위의 의미로 사용할 수도 있다.

예측 단위는 하나의 부호화 단위 내에서 동일한 크기의 적어도 하나의 정사각형 또는 직사각형 등의 형태를 가지고 분할된 것일 수도 있고, 하나의 부호화 단위 내에서 분할된 예측 단위 중 어느 하나의 예측 단위가 다른 하나의 예측 단위와 상이한 형태 및/또는 크기를 가지도록 분할된 것일 수도 있다. 부호화 단위를 기초로 인트라 예측을 수행하는 예측 단위를 생성시 최소 부호화 단위가 아닌 경우, 복수의 예측 단위 NxN 으로 분할하지 않고 인트라 예측을 수행할 수 있다.

예측부(120, 125)는 인터 예측 또는 화면 간 예측을 수행하는 인터 예측부(120)와 인트라 예측 또는 화면 내 예측을 수행하는 인트라 예측부(125)를 포함할 수 있다. 예측 단위에 대해 인터 예측을 사용할 것인지 또는 인트라 예측을 수행할 것인지를 결정하고, 각 예측 방법에 따른 구체적인 정보(예컨대, 인트라 예측 모드, 모션 벡터, 참조 픽쳐 등)를 결정할 수 있다. 생성된 예측 블록과 원본 블록 사이의 잔차값(잔차 블록)은 변환부(130)로 입력될 수 있다. 또한, 예측을 위해 사용한 예측 모드 정보, 모션 벡터 정보 등은 잔차값과 함께 엔트로피 부호화부(165)에서 부호화되어 복호화기에 전달될 수 있다. 인트라 예측 방법에 대해서는 도 3을, 인터 예측 방법에 대해서 도 4 내지 도 7을 각각 참조하여 자세히 살펴 보도록 한다.

전술한 본 발명의 블록 병합 기술을 적용시, 현재 블록을 공간적 혹은 시간적으로 인접한 블록의 움직임 정보를 병합하여 사용함에 있어 병렬처리를 고려하여 병합 예측 영역 (MER: Merge Estimation Region)을 사용하는 방식을 예측부(120, 125)에 적용할 수 있다. 즉, 본 발명은 비디오 코딩 기술 중 화면 간 예측, 화면 내 예측, 성분 간 예측 등의 예측 기술에서 병렬처리를 고려하여 현재 블록의 공간적 혹은 시간적으로 인접한 블록을 구성하기 위한 병렬 예측 영역 (PER: Parallel Estimation Region)을 활용 할 수 있다.

인터 예측부(120)는 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐의 정보를 기초로 예측 단위를 예측할 수도 있고, 경우에 따라서는 현재 픽쳐 내의 부호화가 완료된 일부 영역의 정보를 기초로 예측 단위를 예측할 수도 있다. 인터 예측부(120)는 참조 픽쳐 보간부, 모션 예측부, 움직임 보상부를 포함할 수 있다.

참조 픽쳐 보간부에서는 메모리(155)로부터 참조 픽쳐 정보를 제공받고 참조 픽쳐에서 정수 화소 이하의 화소 정보를 생성할 수 있다. 휘도 화소의 경우, 1/4 화소 단위로 정수 화소 이하의 화소 정보를 생성하기 위해 필터 계수를 달리하는 DCT 기반의 8탭 보간 필터(DCT-based Interpolation Filter)가 사용될 수 있다. 색차 신호의 경우 1/8 화소 단위로 정수 화소 이하의 화소 정보를 생성하기 위해 필터 계수를 달리하는 DCT 기반의 4탭 보간 필터(DCT-based Interpolation Filter)가 사용될 수 있다.

모션 예측부는 참조 픽쳐 보간부에 의해 보간된 참조 픽쳐를 기초로 모션 예측을 수행할 수 있다. 모션 벡터를 산출하기 위한 방법으로 FBMA(Full search-based Block Matching Algorithm), TSS(Three Step Search), NTS(New Three-Step Search Algorithm) 등 다양한 방법이 사용될 수 있다. 모션 벡터는 보간된 화소를 기초로 1/2 또는 1/4 화소 단위의 모션 벡터값을 가질 수 있다. 모션 예측부에서는 모션 예측 방법을 다르게 하여 현재 예측 단위를 예측할 수 있다. 모션 예측 방법으로 스킵(Skip) 방법, 머지(Merge) 방법, AMVP(Advanced Motion Vector Prediction) 방법, 인트라 블록 카피(Intra Block Copy) 방법 등 다양한 방법이 사용될 수 있다.

인트라 예측부(125)는 현재 픽쳐 내의 화소 정보인 현재 블록 주변의 참조 픽셀 정보를 기초로 예측 단위를 생성할 수 있다. 현재 예측 단위의 주변 블록이 인터 예측을 수행한 블록이어서, 참조 픽셀이 인터 예측을 수행한 픽셀일 경우, 인터 예측을 수행한 블록에 포함되는 참조 픽셀을 주변의 인트라 예측을 수행한 블록의 참조 픽셀 정보로 대체하여 사용할 수 있다. 즉, 참조 픽셀이 가용하지 않는 경우, 가용하지 않은 참조 픽셀 정보를 가용한 참조 픽셀 중 적어도 하나의 참조 픽셀로 대체하여 사용할 수 있다.

또한, 예측부(120, 125)에서 생성된 예측 단위를 기초로 예측을 수행한 예측 단위와 예측 단위의 원본 블록과 차이값인 잔차값(Residual) 정보를 포함하는 잔차 블록이 생성될 수 있다. 생성된 잔차 블록은 변환부(130)로 입력될 수 있다.

변환부(130)에서는 원본 블록과 예측부(120, 125)를 통해 생성된 예측 단위의 잔차값(residual)정보를 포함한 잔차 블록을 DCT(Discrete Cosine Transform), DST(Discrete Sine Transform), KLT와 같은 변환 방법을 사용하여 변환시킬 수 있다. 잔차 블록을 변환하기 위해 DCT를 적용할지, DST를 적용할지 또는 KLT를 적용할지는 잔차 블록을 생성하기 위해 사용된 예측 단위의 인트라 예측 모드 정보를 기초로 결정할 수 있다. 변환 방법에 대해서는 도 8 내지 도 10을 참조하여 자세히 살펴 보도록 한다.

양자화부(135)는 변환부(130)에서 주파수 영역으로 변환된 값들을 양자화할 수 있다. 블록에 따라 또는 영상의 중요도에 따라 양자화 계수는 변할 수 있다. 양자화부(135)에서 산출된 값은 역양자화부(140)와 재정렬부(160)에 제공될 수 있다.

재정렬부(160)는 양자화된 잔차값에 대해 계수값의 재정렬을 수행할 수 있다.

재정렬부(160)는 계수 스캐닝(Coefficient Scanning) 방법을 통해 2차원의 블록 형태 계수를 1차원의 벡터 형태로 변경할 수 있다. 예를 들어, 재정렬부(160)에서는 지그-재그 스캔(Zig-Zag Scan)방법을 이용하여 DC 계수부터 고주파수 영역의 계수까지 스캔하여 1차원 벡터 형태로 변경시킬 수 있다. 변환 단위의 크기 및 인트라 예측 모드에 따라 지그-재그 스캔 대신 2차원의 블록 형태 계수를 열 방향으로 스캔하는 수직 스캔, 2차원의 블록 형태 계수를 행 방향으로 스캔하는 수평 스캔이 사용될 수도 있다. 즉, 변환 단위의 크기 및 인트라 예측 모드에 따라 지그-재그 스캔, 수직 방향 스캔 및 수평 방향 스캔 중 어떠한 스캔 방법이 사용될지 여부를 결정할 수 있다.

엔트로피 부호화부(165)는 재정렬부(160)에 의해 산출된 값들을 기초로 엔트로피 부호화를 수행할 수 있다. 엔트로피 부호화는 예를 들어, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 다양한 부호화 방법을 사용할 수 있다. 관련하여, 엔트로피 부호화부(165)는 재정렬부(160) 및 예측부(120, 125)로부터 부호화 단위의 잔차값 계수 정보를 부호화 할 수 있다. 또한, 본 발명에 따라 움직임 정보를 디코더 측면에서 유도하여 사용함을 지시하는 정보 및 움직임 정보 유도에 사용된 기법에 대한 정보를 시그널링(signaling)하여 전송하는 것이 가능하다.

역양자화부(140) 및 역변환부(145)에서는 양자화부(135)에서 양자화된 값들을 역양자화하고 변환부(130)에서 변환된 값들을 역변환한다. 역양자화부(140) 및 역변환부(145)에서 생성된 잔차값(Residual)은 예측부(120, 125)에 포함된 움직임 추정부, 움직임 보상부 및 인트라 예측부를 통해서 예측된 예측 단위와 합쳐져 복원 블록(Reconstructed Block)을 생성할 수 있다.

필터부(150)는 디블록킹 필터, 오프셋 보정부, ALF(Adaptive Loop Filter)중 적어도 하나를 포함할 수 있다. 디블록킹 필터는 복원된 픽쳐에서 블록간의 경계로 인해 생긴 블록 왜곡을 제거할 수 있다. 오프셋 보정부는 디블록킹을 수행한 영상에 대해 픽셀 단위로 원본 영상과의 오프셋을 보정할 수 있다. 특정 픽쳐에 대한 오프셋 보정을 수행하기 위해 영상에 포함된 픽셀을 일정한 수의 영역으로 구분한 후 오프셋을 수행할 영역을 결정하고 해당 영역에 오프셋을 적용하는 방법 또는 각 픽셀의 에지 정보를 고려하여 오프셋을 적용하는 방법을 사용할 수 있다. ALF(Adaptive Loop Filtering)는 필터링한 복원 영상과 원래의 영상을 비교한 값을 기초로 수행될 수 있다. 영상에 포함된 픽셀을 소정의 그룹으로 나눈 후 해당 그룹에 적용될 하나의 필터를 결정하여 그룹마다 차별적으로 필터링을 수행할 수 있다.

메모리(155)는 필터부(150)를 통해 산출된 복원 블록 또는 픽쳐를 저장할 수 있고, 저장된 복원 블록 또는 픽쳐는 인터 예측을 수행 시 예측부(120, 125)에 제공될 수 있다.

도 2를 참조하면, 영상 복호화기(200)는 엔트로피 복호화부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 예측부(230, 235), 필터부(240), 메모리(245)가 포함될 수 있다.

영상 부호화기에서 영상 비트스트림이 입력된 경우, 입력된 비트스트림은 영상 부호화기와 반대의 절차로 복호화될 수 있다.

엔트로피 복호화부(210)는 영상 부호화기의 엔트로피 부호화부에서 엔트로피 부호화를 수행한 것과 반대의 절차로 엔트로피 복호화를 수행할 수 있다. 예를 들어, 영상 부호화기에서 수행된 방법에 대응하여 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 다양한 방법이 적용될 수 있다.

엔트로피 복호화부(210)에서는 부호화기에서 수행된 인트라 예측 및 인터 예측에 관련된 정보를 복호화할 수 있다.

재정렬부(215)는 엔트로피 복호화부(210)에서 엔트로피 복호화된 비트스트림을 부호화부에서 재정렬한 방법을 기초로 재정렬을 수행할 수 있다. 1차원 벡터 형태로 표현된 계수들을 다시 2차원의 블록 형태의 계수로 복원하여 재정렬할 수 있다.

역양자화부(220)는 부호화기에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다.

역변환부(225)는 영상 부호화기에서 수행한 양자화 결과에 대해 변환부에서 수행한 변환 즉, DCT, DST, 및 KLT에 대해 역변환 즉, 역 DCT, 역 DST 및 역 KLT를 수행할 수 있다. 역변환은 영상 부호화기에서 결정된 전송 단위를 기초로 수행될 수 있다. 영상 복호화기의 역변환부(225)에서는 예측 방법, 현재 블록의 크기 및 예측 방향 등 복수의 정보에 따라 변환 기법(예를 들어, DCT, DST, KLT)이 선택적으로 수행될 수 있다. 역변환 방법에 대해서는 도 8 내지 도 10을 참조하여 자세히 살펴 보도록 한다.

예측부(230, 235)는 엔트로피 복호화부(210)에서 제공된 예측 블록 생성 관련 정보와 메모리(245)에서 제공된 이전에 복호화된 블록 또는 픽쳐 정보를 기초로 예측 블록을 생성할 수 있다.

전술한 바와 같이 영상 부호화기에서의 동작과 동일하게 인트라 예측 또는 화면 내 예측을 수행시 예측 단위의 크기와 변환 단위의 크기가 동일할 경우, 예측 단위의 좌측에 존재하는 픽셀, 좌측 상단에 존재하는 픽셀, 상단에 존재하는 픽셀을 기초로 예측 단위에 대한 인트라 예측을 수행하지만, 인트라 예측을 수행시 예측 단위의 크기와 변환 단위의 크기가 상이할 경우, 변환 단위를 기초로 한 참조 픽셀을 이용하여 인트라 예측을 수행할 수 있다. 또한, 최소 부호화 단위에 대해서만 NxN 분할을 사용하는 인트라 예측을 사용할 수도 있다.

예측부(230, 235)는 예측 단위 판별부, 인터 예측부 및 인트라 예측부를 포함할 수 있다. 예측 단위 판별부는 엔트로피 복호화부(210)에서 입력되는 예측 단위 정보, 인트라 예측 방법의 예측 모드 정보, 인터 예측 방법의 모션 예측 관련 정보 등 다양한 정보를 입력 받고 현재 부호화 단위에서 예측 단위를 구분하고, 예측 단위가 인터 예측을 수행하는지 아니면 인트라 예측을 수행하는지 여부를 판별할 수 있다.

또한, 전술한 본 발명의 블록 병합 기술을 적용시, 현재 블록을 공간적 혹은 시간적으로 인접한 블록의 움직임 정보를 병합하여 사용함에 있어 병렬처리를 고려하여 병합 예측 영역 (MER: Merge Estimation Region)을 사용하는 방식을 예측부(230, 235)에 적용할 수 있다. 즉, 본 발명은 비디오 코딩 기술 중 화면 간 예측, 화면 내 예측, 성분 간 예측 등의 예측 기술에서 병렬처리를 고려하여 현재 블록의 공간적 혹은 시간적으로 인접한 블록을 구성하기 위한 병렬 예측 영역 (PER: Parallel Estimation Region)을 활용할 수 있다.

인터 예측부(230)는 영상 부호화기에서 제공된 현재 예측 단위의 인터 예측에 필요한 정보를 이용해 현재 예측 단위가 포함된 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐에 포함된 정보를 기초로 현재 예측 단위에 대한 인터 예측을 수행할 수 있다. 인터 예측을 수행하기 위해 부호화 단위를 기준으로 해당 부호화 단위에 포함된 예측 단위의 모션 예측 방법이 스킵 모드(Skip Mode), 머지 모드(Merge 모드), AMVP 모드(AMVP Mode), 인트라 블록 카피 모드 중 어떠한 방법인지 여부를 판단할 수 있다. 인터 예측 방법에 대해서 도 4 내지 도 7을 각각 참조하여 자세히 살펴 보도록 한다.

인트라 예측부(235)는 현재 픽쳐 내의 화소 정보를 기초로 예측 블록을 생성할 수 있다. 예측 단위가 인트라 예측을 수행한 예측 단위인 경우, 영상 부호화기에서 제공된 예측 단위의 인트라 예측 모드 정보를 기초로 인트라 예측을 수행할 수 있다. 인트라 예측부(235)에는 AIS(Adaptive Intra Smoothing) 필터, 참조 화소 보간부, DC 필터를 포함할 수 있다. AIS 필터는 현재 블록의 참조 화소에 필터링을 수행하는 부분으로써 현재 예측 단위의 예측 모드에 따라 필터의 적용 여부를 결정하여 적용할 수 있다. 영상 부호화기에서 제공된 예측 단위의 예측 모드 및 AIS 필터 정보를 이용하여 현재 블록의 참조 화소에 AIS 필터링을 수행할 수 있다. 현재 블록의 예측 모드가 AIS 필터링을 수행하지 않는 모드일 경우, AIS 필터는 적용되지 않을 수 있다.

참조 화소 보간부는 예측 단위의 예측 모드가 참조 화소를 보간한 화소값을 기초로 인트라 예측을 수행하는 예측 단위일 경우, 참조 화소를 보간하여 정수값 이하의 화소 단위의 참조 화소를 생성할 수 있다. 현재 예측 단위의 예측 모드가 참조 화소를 보간하지 않고 예측 블록을 생성하는 예측 모드일 경우 참조 화소는 보간되지 않을 수 있다. DC 필터는 현재 블록의 예측 모드가 DC 모드일 경우 필터링을 통해서 예측 블록을 생성할 수 있다. 인트라 예측 방법에 대해서는 도 3을 참조하여 자세히 살펴 보도록 한다.

복원된 블록 또는 픽쳐는 필터부(240)로 제공될 수 있다. 필터부(240)는 디블록킹 필터, 오프셋 보정부, ALF를 포함할 수 있다.

영상 부호화기로부터 해당 블록 또는 픽쳐에 디블록킹 필터를 적용하였는지 여부에 대한 정보 및 디블록킹 필터를 적용하였을 경우, 강한 필터를 적용하였는지 또는 약한 필터를 적용하였는지에 대한 정보를 제공받을 수 있다. 영상 복호화기의 디블록킹 필터에서는 영상 부호화기에서 제공된 디블록킹 필터 관련 정보를 제공받고 영상 복호화기에서 해당 블록에 대한 디블록킹 필터링을 수행할 수 있다.

오프셋 보정부는 부호화시 영상에 적용된 오프셋 보정의 종류 및 오프셋 값 정보 등을 기초로 복원된 영상에 오프셋 보정을 수행할 수 있다. ALF는 부호화기로부터 제공된 ALF 적용 여부 정보, ALF 계수 정보 등을 기초로 부호화 단위에 적용될 수 있다. 이러한 ALF 정보는 특정한 파라메터 셋에 포함되어 제공될 수 있다.

메모리(245)는 복원된 픽쳐 또는 블록을 저장하여 참조 픽쳐 또는 참조 블록으로 사용할 수 있도록 할 수 있고 또한 복원된 픽쳐를 출력부로 제공할 수 있다.

도 3을 참조하면, 현재 블록의 인트라 예측을 위한 MPM 리스트를 구성할 수 있다(S300).

본 발명의 MPM 리스트는 복수의 MPM을 포함하고, MPM은 현재 블록의 이웃 블록의 인트라 예측 모드에 기초하여 결정될 수 있다. MPM의 개수는 n개이며, n은 3, 4, 5, 6, 또는 그 이상의 정수일 수 있다.

예를 들어, MPM 리스트는, 이웃 블록의 인트라 예측 모드(modeA), (modeA-i), (modeA+i) 또는 디폴트 모드 중 적어도 하나를 포함할 수 있다. 상기 i 값은 1, 2, 3, 4 또는 그 이상의 정수일 수 있다. 상기 이웃 블록은, 현재 블록의 좌측 및/또는 상단에 인접한 블록을 의미할 수 있다. 디폴트 모드는, Planar 모드, DC 모드, 또는 소정의 방향성 모드 중 적어도 하나일 수 있다. 소정의 방향성 모드는, 수평 모드(modeV), 수직 모드(modeH), (modeV-j), (modeV+j), (modeH-j) 또는 (modeH+j) 중 적어도 하나를 포함할 수 있다. 상기 j 값은 16보다 작거나 같은 임의의 자연수일 수 있다.

상기 MPM 리스트 및 MPM 인덱스에 기초하여 인트라 예측 모드가 유도될 수 있다(S310).

상기 MPM 인덱스는, MPM 리스트에서 휘도 성분 블록의 인트라 예측 모드와 동일한 MPM을 특정할 수 있다. MPM 인덱스에 의해 특정된 MPM이 현재 블록의 인트라 예측 모드로 설정될 수 있다.

또는, 현재 블록의 인트라 예측 모드는, 상기 MPM 인덱스에 의해 특정된 MPM에 소정의 오프셋을 적용하여 유도될 수도 있다.

상기 오프셋의 적용은, 블록의 속성 즉, 크기, 형태, 분할 정보, 분할 뎁스, 인트라 예측 모드의 값 또는 성분 타입 중 적어도 하나에 기초하여 선택적으로 수행될 수 있다. 여기서, 블록은 상기 현재 블록 및/또는 현재 블록의 이웃 블록을 의미할 수 있다.

상기 오프셋은, 현재 블록의 크기가 소정의 제1 문턱값보다 작거나 같은 경우에만 적용될 수 있다. 여기서, 제1 문턱값은 오프셋이 적용되는 최대 블록 크기를 의미할 수 있다. 또는, 현재 블록의 크기가 소정의 제2 문턱값보다 크거나 같은 경우에만 적용될 수도 있다. 이때, 제2 문턱값은 오프셋이 적용되는 최소 블록 크기를 의미할 수 있다. 상기 제1/제2 문턱값은 비트스트림을 통해 시그날링될 수도 있다. 또는, 전술한 블록의 속성 중 적어도 하나에 기초하여 복호화 장치에서 가변적으로 결정될 수도 있고, 부호화/복호화 장치에 기-약속된 고정된 값일 수도 있다.

또는, 상기 오프셋은, 현재 블록의 형태가 non-square인 경우에만 적용될 수 있다. 일예로, 다음 조건을 만족하는 경우, 현재 블록의 인트라 예측 모드 IntraPredMode는 상기 MPM에 소정의 오프셋(예를 들어, 65)을 가산하여 유도될 수 있다.

- nW is greater than nH

- IntraPredMode is greater than or equal to 2

- IntraPredMode is less than (whRatio>1) ? (8+2*whRatio) : 8

여기서, nW와 nH는 현재 블록의 너비와 높이를 각각 의미하고, whRatio는 Abs(Log2(nW/nH))로 설정될 수 있다.

또는, 다음 조건을 만족하는 경우, 현재 블록의 IntraPredMode는 상기 MPM에 소정의 오프셋(예를 들어, 67)을 감산하여 유도될 수 있다.

- nH is greater than nW

- IntraPredMode is greater than or equal to 66

- IntraPredMode is less than (whRatio>1) ? (60-2*whRatio) : 60

상기 인트라 예측 모드를 이용하여, 현재 블록의 인트라 예측을 수행할 수 있다(S320).

구체적으로, 인트라 예측 모드에 의해 특정된 참조 샘플을 이용하여, 현재 블록의 예측 샘플을 유도할 수 있다. 이때, 현재 블록은 복수의 서브 블록으로 분할되고, 각 서브 블록 단위로 인트라 예측이 수행될 수 있다. 각 서브 블록은 병렬적으로 예측될 수도 있고, 소정의 코딩 순서에 따라 순차적으로 예측/복원될 수도 있다.

상기 서브 블록으로의 분할은, 소정의 분할 정보에 기초하여 수행될 수 있다. 상기 분할 정보는, 현재 블록이 복수의 서브 블록으로 분할되는지 여부를 나타내는 제1 정보, 분할 방향(e.g., 수평 또는 수직)을 나타내는 제2 정보, 또는 분할된 서브 블록의 개수에 관한 제3 정보 중 적어도 하나를 포함할 수 있다. 상기 분할 정보는 부호화 장치에서 부호화되어 시그날링될 수 있다. 또는, 상기 분할 정보의 일부는, 전술한 블록의 속성에 기초하여 복호화 장치에서 가변적으로 결정될 수도 있고, 부호화/복호화 장치에 기-정의된 고정된 값으로 설정될 수도 있다.

예를 들어, 상기 제1 정보가 제1 값인 경우, 현재 블록은 복수의 서브 블록으로 분할되고, 그렇지 않은 경우, 현재 블록은 복수의 서브 블록으로 분할되지 않을 수 있다(NO_SPLIT). 현재 블록이 복수의 서브 블록으로 분할되는 경우, 상기 제2 정보에 기초하여 현재 블록은 수평 분할(HOR_SPLIT) 또는 수직 분할(VER_SPLIT)될 수 있다. 이때, 현재 블록은 r개의 서브 블록으로 분할될 수 있다. 여기서, r 값은 2,3,4 또는 그 이상의 정수일 수 있다. 또는, r 값은 1, 2, 4 등과 같이 2의 지수승으로 제한될 수 있다. 또는, 현재 블록의 너비 또는 높이 중 적어도 하나가 4인 블록(예를 들어, 4x8, 8x4)의 경우, 상기 k는 2로 설정되고, 그렇지 않은 경우, 상기 k는 4, 8, 또는 16으로 설정될 수 있다. 현재 블록이 비-분할인 경우(NO_SPLIT), 상기 k는 1로 설정될 수 있다.

상기 현재 블록은, 서로 동일한 너비와 높이를 가진 서브 블록으로 분할될 수도 있고, 서로 상이한 너비와 높이를 가진 서브 블록으로 분할될 수도 있다. 현재 블록은, 전술한 블록의 속성에 관계없이, 부호화/복호화 장치에 기-약속된 NxM 블록 단위(예를 들어, 2x2, 2x4, 4x4, 8x4, 8x8 등)로 분할될 수도 있다.

본 발명은 비디오 코딩 기술 중 인터 예측을 위한 블록 병합 기술에 관한 것이다. 현재 블록은, 공간적 이웃 블록 또는 시간적 이웃 블록 중 적어도 하나의 움직임 정보를 병합하여 예측될 수 있다. 상기 예측은, 병렬 처리를 위한 병합 예측 영역(MER: Merge Estimation Region)을 기반으로 수행될 수 있다.

이와 더불어, 본 발명은 비디오 코딩 기술 중 인터 예측, 인트라 예측, 성분 간 예측 등의 예측 방법에서, 현재 블록의 이웃 블록을 구성하기 위한 병렬 예측 영역(PER: Parallel Estimation Region)을 제안한다. 상기 이웃 블록은, 현재 블록에 공간적 및/또는 시간적으로 인접한 영역을 의미할 수 있다. 상기 병렬 예측 영역(PER)에 속한 하나 또는 그 이상의 블록은 병렬적으로 처리될 수 있다.

본 발명의 블록 병합 기술에서는, 병합 예측 영역(MER)에 따라 현재 블록의 병합 후보 리스트(merge candidate list)를 적응적으로 구성할 수 있다. 이때, 상기 병합 후보 리스트는, 현재 블록의 이웃 블록과 동일한 병합 예측 영역에 속하는지에 따라, 기존의 병합 후보를 리스트에서 제거하거나, 혹은 추가적인 병합 후보를 리스트에 추가하여 구성될 수 있다.

본 발명의 블록 병합 기술에서는, 병합 예측 영역에 따라 현재 블록의 병합 후보 리스트를 구성함에 있어, 상기 추가적인 병합 후보는 현재 블록과 공간적으로 다수의 화소 거리 만큼에 떨어진 블록일 수 있다.

본 발명의 현재 블록의 예측 후보들을 구성함에 있어서, 병렬 예측 영역(PER)을 고려하여 공간적 및/또는 시간적으로 인접한 예측 후보는 현재 블록과 공간적으로 다수의 화소 거리 만큼 떨어진 블록이거나, 시간적으로 특정 픽쳐 거리 (picture distance) 이상에 위치한 블록일 수 있다.

본 발명에서 제안하는 비디오 코딩 방법 및 장치에서는, 성분 간 예측을 위한 참조 화소, 템플릿 매칭을 위한 템플릿, 인터 예측을 위한 움직임 참조 블록 등을 구성하기 위해 병렬 예측 영역(PER)을 사용할 수 있다.

도 4는 하나의 블록을 구성하는 다수개의 부호화 유닛 (CU: coding unit)과 다양한 블록 분할 구조를 도시한다.

하나의 블록을 구성하는 다수개의 부호화 유닛 중 병렬 처리를 위한 병합 예측 영역(MER: merge estimation region)을 설정할 수 있다. 상기 병합 예측 영역 내의 부호화 유닛들은 상호 의존성을 가지지 않으며, 해당 부호화 유닛은 병렬 처리가 가능하다. 도 4를 참조하여 병합 예측 영역(MER: merge estimation region)의 개념을 살펴 보기로 한다.

도 4에서 64x64 블록(411)은 다수개의 부호화 유닛으로 분할될 수 있다. 상기 분할은, 쿼드-트리 블록 분할(Quad-tree block partition), 바이너리-트리 블록 분할(Binary-tree block partition), 또는 터너리-트리 블록 분할(Ternary-tree block partition) 중 적어도 하나의 분할 기법을 이용하여 수행될 수 있다. 상기 분할은, 재귀적으로 수행될 수 있다.

도 4에서 상기 블록 분할을 이용하여 64x64 블록(411)을 총 11개의 부호화 유닛들(400~410)로 분할하여 부호화 및/또는 복호화를 수행함에 있어, 본 발명에서 제안하는 병합 예측 영역(MER: merge estimation region) 을 설정한 예시를 도시한다. 이때, 도 4에서 도시한 예시에서는 병합 예측 영역은 32x32 화소 영역(412)로 구성되며, 해당 영역 내의 부호화 유닛 간에는 의존성이 존재하지 않도록 모든 참조 의존성을 제거하여 부호화 및/또는 복호화를 수행한다.

상기 해당 영역이 병합 예측 영역(MER)인 경우, CU1, CU2, CU3, CU4에 대한 각각의 블록 병합 후보 리스트를 생성하는 과정에서 동일한 병합 예측 영역에 존재하는 부호화 유닛에 대해서는 병합 후보로 추가하지 않는다.

본 발명에서는 상기 병합 후보 리스트 생성 과정에서 동일한 병합 예측 영역에 존재하는 부호화 유닛에 대해서 병합 후보로 추가하지 않는 대신, 해당 병합 예측 영역 외부에 위치의 블록을 병합 후보로 추가하는 것을 포함한다. 이에 대해서는 도 5 내지 도 7을 참조하여 자세히 살펴 보기로 한다.

또한, 상기 해당 영역이 병렬 예측 영역(PER: parallel estimation region)인 경우에도 마찬가지로, CU1, CU2, CU3, CU4에 대한 성분 간 예측, 템플릿 예측 등에서 사용되는 참조 화소들의 구성을 해당 병렬 예측 영역 외부에 위치하는 화소들을 이용하여 참조 화소를 구성한다.

또는, 병합 예측 영역에 속한 부호화 유닛 전부 또는 일부는, 하나의 병합 후보 리스트를 공유할 수 있다. 현재 블록의 병합 후보는, 병합 예측 영역의 공간적/시간적 이웃 블록을 포함할 수 있다. 여기서, 현재 블록은 병합 예측 영역에 속한 복수의 부호화 유닛 중 어느 하나를 의미하며, 더 작은 부호화 유닛으로 더 이상 분할되지 않는 부호화 유닛을 의미할 수 있다. 병합 예측 영역은 현재 블록보다 작은 분할 뎁스(split depth)를 가진 상위 블록(또는 상위 부호화 유닛)일 수 있다. 예를 들어, 현재 블록의 분할 뎁스가 k인 경우, 병합 예측 영역의 분할 뎁스는 (k-1), (k-2), (k-3) 등일 수 있다. 현재 블록은, 전술한 분할 기법 중 어느 하나에 기초하여 병합 예측 영역을 분할하여 획득될 수도 있고, 전술한 분할 기법 중 적어도 2개에 기초하여 병합 예측 영역을 분할하여 획득될 수도 있다.

일반적으로, 현재 블록의 병합 후보는, 현재 블록의 좌측, 좌하단, 상단, 우상단 또는 좌상단 중 적어도 하나에 인접한 이웃 블록으로 결정될 수 있다. 현재 블록의 좌상단 샘플의 위치는 (xc,yc)이고, 현재 블록의 너비와 높이는 각각 Wc와 Hc라 가정한다. 이때, 좌측 이웃 블록은 (xc-1,yc+Hc-1) 샘플을 포함한 블록이고, 좌하단 이웃 블록은 (xc-1,yc+Hc) 샘플을 포함한 블록이며, 상단 이웃 블록은 (xc+Wc-1,yc-1) 샘플을 포함한 블록이고, 우상단 이웃 블록은 (xc+Wc,yc-1) 샘플을 포함한 블록이며, 좌상단 이웃 블록은 (xc-1,yc-1) 샘플을 포함한 블록일 수 있다.

다만, 현재 블록이 병합 예측 영역에 속한 경우, 현재 블록의 병합 후보는 병합 예측 영역의 좌측, 좌하단, 상단, 우상단 또는 좌상단 중 적어도 하나에 인접한 이웃 블록으로 결정될 수 있다. 상기 병합 예측 영역의 좌상단 샘플의 위치는 (xs,ys)이고, 병합 예측 영역의 너비와 높이는 각각 Ws와 Hs라 가정한다. 이때, 좌측 이웃 블록은 (xs-1,ys+Hs-1) 샘플을 포함한 블록이고, 좌하단 이웃 블록은 (xs-1,ys+Hs) 샘플을 포함한 블록이며, 상단 이웃 블록은 (xs+Ws-1,ys-1) 샘플을 포함한 블록이고, 우상단 이웃 블록은 (xs+Ws,ys-1) 샘플을 포함한 블록이며, 좌상단 이웃 블록은 (xs-1,ys-1) 샘플을 포함한 블록일 수 있다.

전술한 방법을 통해, 병합 예측 영역에 속한 부호화 유닛은 동일한 병합 후보 또는 병합 후보 리스트를 사용할 수 있다. 이를 위해, 현재 블록이 병합 예측 영역에 속하는 경우, 전술한 현재 블록의 위치/크기 정보는 병합 예측 영역의 위치/크기 정보로 설정될 수 있다. 설정된 위치/크기 정보를 기반으로 현재 블록의 병합 후보가 유도될 수 있다. 유도된 병합 후보를 기반으로, 현재 블록의 병합 후보 리스트가 구성될 수 있다.

상기 병합 후보 리스트 및 병합 후보 인덱스를 기반으로, 현재 블록의 움직임 정보가 유도될 수 있다. 병합 후보 인덱스는, 병합 후보 리스트에 속한 복수의 병합 후보 중 어느 하나를 특정하며, 현재 블록의 움직임 정보를 가진 병합 후보를 특정할 수 있다. 상기 병합 후보 인덱스는, 병합 예측 영역에 속한 부호화 유닛 각각에 대해서 시그날링될 수 있다.

이하, 병합 예측 영역(MER)을 설정하는 방법에 대해서 살펴 보기로 한다.

현재 블록의 분할 뎁스가 k인 경우, 현재 블록이 속한 상위 블록은 (k-i)의 분할 뎁스를 가진 블록이며, 여기서 i는 1, 2,..., k-1, k일 수 있다. 상기 상위 블록 중 소정의 조건을 만족하는 상위 블록은, 병합 예측 영역으로 설정될 수 있다. 즉, 병합 예측 영역은, 병합 후보 또는 병합 후보 리스트를 공유하는 노드의 상위 블록으로 정의될 수 있다. 다만, 소정의 조건을 만족하는 상위 블록이 복수개인 경우, 가장 작은 분할 뎁스를 가진 상위 블록이 병합 예측 영역으로 설정되거나, 가장 큰 분할 뎁스를 가진 상위 블록이 병합 예측 영역으로 설정될 수 있다.

일예로, 상위 블록에 속한 샘플의 개수가 소정의 제1 문턱값보다 작거나 같은 경우, 해당 상위 블록은 병합 예측 영역으로 설정될 수 있다. 상기 제1 문턱값은, 부호화 장치에서 시그날링될 수 있고, 상기 시그날링은 비디오 시퀀스, 픽쳐, 슬라이스, 타일 또는 CTU 중 적어도 하나의 레벨에서 수행될 수 있다. 또는, 제1 문턱값은 부호화/복호화 장치에 기-정의된 고정된 값일 수도 있다. 상기 제1 문턱값은 32, 64, 128, 256 또는 그 이상일 수 있다.

또는, 상위 블록이 바이너리-트리 블록 분할에 기초하여 2분할되고, 상위 블록에 속한 샘플의 개수가 소정의 제2 문턱값보다 작거나 같은 경우, 해당 상위 블록은 병합 예측 영역으로 설정될 수 있다. 상기 제2 문턱값은, 부호화 장치에서 시그날링될 수 있고, 상기 시그날링은 비디오 시퀀스, 픽쳐, 슬라이스, 타일 또는 CTU 중 적어도 하나의 레벨에서 수행될 수 있다. 또는, 제2 문턱값은 부호화/복호화 장치에 기-정의된 고정된 값일 수도 있다. 상기 제2 문턱값은 32, 64, 128, 256 또는 그 이상일 수 있다.

예를 들어, 제2 문턱값이 64이고, 상위 블록이 4x8이라고 가정한다. 이때, 상위 블록이 바이너리-트리 블록 분할에 기초하여 2분할되는 경우, 상위 블록은 2개의 4x4 하위 블록으로 구성될 수 있다. 이는, 상기 상위 블록에 샘플의 개수가 32보다 작은 하위 블록이 존재함을 의미할 수 있다. 상위 블록에 속한 샘플의 개수가 64보다 작고, 샘플의 개수가 32보다 작은 하위 블록이 존재하는 경우, 상기 상위 블록은 병합 예측 영역으로 설정되고, 상기 상위 블록에 속한 2개의 하위 블록은 하나의 병합 후보 리스트를 공유할 수 있다.또는, 상위 블록이 터너리-트리 블록 분할에 기초하여 3분할되고, 상위 블록에 속한 샘플의 개수가 소정의 제3 문턱값보다 작거나 같은 경우, 해당 상위 블록은 병합 예측 영역으로 설정될 수 있다. 상기 제3 문턱값은, 부호화 장치에서 시그날링될 수 있고, 상기 시그날링은 비디오 시퀀스, 픽쳐, 슬라이스, 타일 또는 CTU 중 적어도 하나의 레벨에서 수행될 수 있다. 또는, 제3 문턱값은 부호화/복호화 장치에 기-정의된 고정된 값일 수도 있다. 상기 제3 문턱값은 32, 64, 128, 256 또는 그 이상일 수 있다.

예를 들어, 제3 문턱값이 128이고, 상위 블록이 4x16이라고 가정한다. 이때, 상위 블록이 터너리-트리 블록 분할에 기초하여 3분할되는 경우, 상위 블록은 2개의 4x4 하위 블록 및 1개의 4x8 하위 블록으로 구성될 수 있다. 이는, 상기 상위 블록에 샘플의 개수가 32보다 작은 하위 블록이 존재함을 의미할 수 있다. 상위 블록에 속한 샘플의 개수가 128보다 작고, 샘플의 개수가 32보다 작은 하위 블록이 존재하는 경우, 상기 상위 블록은 병합 예측 영역으로 설정되고, 상기 상위 블록에 속한 3개의 하위 블록은 하나의 병합 후보 리스트를 공유할 수 있다.

또는, 상위 블록이 쿼드-트리 블록 분할에 기초하여 4분할되고, 상위 블록에 속한 샘플의 개수가 소정의 제4 문턱값보다 작거나 같은 경우, 해당 상위 블록은 병합 예측 영역으로 설정될 수 있다. 상기 제4 문턱값은, 부호화 장치에서 시그날링될 수 있고, 상기 시그날링은 비디오 시퀀스, 픽쳐, 슬라이스, 타일 또는 CTU 중 적어도 하나의 레벨에서 수행될 수 있다. 또는, 제4 문턱값은 부호화/복호화 장치에 기-정의된 고정된 값일 수도 있다. 상기 제4 문턱값은 32, 64, 128, 256 또는 그 이상일 수 있다.

예를 들어, 제4 문턱값이 128이고, 상위 블록이 8x8이라고 가정한다. 이때, 상위 블록이 쿼드-트리 블록 분할에 기초하여 4분할되는 경우, 상위 블록은 4개의 4x4 하위 블록으로 구성될 수 있다. 이는, 상기 상위 블록에 샘플의 개수가 32보다 작은 하위 블록이 존재함을 의미할 수 있다. 상위 블록에 속한 샘플의 개수가 128보다 작고, 샘플의 개수가 32보다 작은 하위 블록이 존재하는 경우, 상기 상위 블록은 병합 예측 영역으로 설정되고, 상기 상위 블록에 속한 4개의 하위 블록은 하나의 병합 후보 리스트를 공유할 수 있다.

또는, 상위 블록의 너비와 높이의 비율(W/H 또는 H/W)이 소정의 제5 문턱값보다 작거나 같은 경우에 한하여, 해당 상위 블록은 병합 예측 영역으로 설정될 수 있다. 상기 제5 문턱값은, 부호화 장치에서 시그날링될 수 있고, 상기 시그날링은 비디오 시퀀스, 픽쳐, 슬라이스, 타일 또는 CTU 중 적어도 하나의 레벨에서 수행될 수 있다. 또는, 제5 문턱값은 부호화/복호화 장치에 기-정의된 고정된 값일 수도 있다. 상기 제5 문턱값은 2, 4, 8, 16 또는 그 이상일 수 있다. 예를 들어, 상위 블록이 32x4 블록이고, 제5 문턱값이 4인 경우, 상기 상위 블록은 병합 예측 영역으로 설정되지 않을 수 있다. 상위 블록이 4x32 블록이고, 제5 문턱값이 8인 경우, 상기 상위 블록은 병합 예측 영역으로 설정될 수 있다.

또는, 상위 블록의 너비와 높이 중 어느 하나가 소정의 제6 문턱값보다 작거나 같은 경우에 한하여, 해당 상위 블록은 병합 예측 영역으로 설정될 수 있다. 이때, 상위 블록의 너비와 높이 중 최대값이 상기 제6 문턱값과 비교될 수 있다. 상기 제6 문턱값은, 부호화 장치에서 시그날링될 수 있고, 상기 시그날링은 비디오 시퀀스, 픽쳐, 슬라이스, 타일 또는 CTU 중 적어도 하나의 레벨에서 수행될 수 있다. 또는, 제6 문턱값은 부호화/복호화 장치에 기-정의된 고정된 값일 수도 있다. 상기 제6 문턱값은 16, 32, 64 또는 그 이상일 수 있다. 예를 들어, 상위 블록이 32x4 블록이고, 제6 문턱값이 16인 경우, 상기 상위 블록은 병합 예측 영역으로 설정되지 않을 수 있다. 상위 블록이 4x16 블록이고, 제6 문턱값이 32인 경우, 상기 상위 블록은 병합 예측 영역으로 설정될 수 있다.

또는, 상위 블록에 속한 샘플의 개수가 제7 문턱값보다 작거나 같고, 상기 상위 블록 내에 샘플의 개수가 p보다 작은 적어도 하나의 하위 블록이 존재하는 경우, 상기 상기 상위 블록은 병합 예측 영역으로 설정될 수 있다. 상기 제7 문턱값은, 부호화 장치에서 시그날링될 수 있고, 상기 시그날링은 비디오 시퀀스, 픽쳐, 슬라이스, 타일 또는 CTU 중 적어도 하나의 레벨에서 수행될 수 있다. 또는, 제7 문턱값은 부호화/복호화 장치에 기-정의된 고정된 값일 수도 있다. 상기 제7 문턱값은 32, 64, 128 또는 그 이상일 수 있다. 상기 p는 16, 32, 64 또는 그 이상일 수 있다. 상기 하위 블록은, 전술한 분할 타입 중 적어도 하나에 기반하여 상기 상위 블록을 분할하여 결정될 수 있다.

전술한 조건 중 어느 하나에 기초하여 병합 예측 영역이 설정될 수도 있고, 상기 조건 중 적어도 2개의 조합에 기초하여 병합 예측 영역이 설정될 수도 있다.

상위 블록이 소정의 분할 기법에 의해서 분할된 경우, 해당 상위 블록은 병합 예측 영역으로 설정되지 않도록 제한될 수도 있다. 여기서, 소정의 분할 기법은, 쿼드-트리 블록 분할, 바이너리-트리 블록 분할 또는 터너리-트리 블록 분할 중 적어도 하나를 포함할 수 있다. 예를 들어, 상위 블록이 쿼드-트리 블록 분할에 기반하여 분할되는 경우, 해당 상위 블록은 병합 예측 영역으로 설정되지 않을 수 있다. 역으로, 상위 블록이 소정의 분할 기법에 의해서 분할된 경우에만, 해당 상위 블록이 병합 예측 영역으로 설정되도록 제한될 수도 있다. 예를 들어, 상위 블록이 바이너리-트리 블록 분할 및/또는 터너리-트리 블록 분할에 기반하여 분할되는 경우에 한하여, 해당 상위 블록은 병합 예측 영역으로 설정됟 수 있다.

전술한 바와 같이, 병합 예측 영역은, 상위 블록의 크기/형태만을 고려하여 결정될 수도 있고, 상위 블록 및 하위 블록의 크기/형태를 고려하여 결정될 수도 있다. 다만, 이에 한정되지 아니하며, 병합 예측 영역은, 하위 블록의 크기/형태만을 고려하여 결정될 수도 있다.

부호화 장치는, 최적의 병합 예측 영역의 크기를 결정하고, 결정된 크기를 나타내는 정보를 부호화하여 복호화 장치로 시그날링할 수도 있다. 상기 부호화된 정보는, 비디오 시퀀스, 픽쳐, 슬라이스, 타일 또는 CTU 중 적어도 하나의 레벨에서 시그날링될 수 있다. 또는, 병합 예측 영역의 크기는, 부호화/복호화 장치에 기-정의된 고정된 크기일 수 있다.

또한, 병합 예측 영역은 정방형에 한정되지 않으며, 병합 예측 영역의 너비(width)와 높이(height)에 관한 정보가 독립적으로 시그널링될 수 있다. 병합 예측 영역은, 상기 너비(width)와 높이(height가 서로 다른 직방형일 수도 있다. 혹은, 병합 예측 영역의 크기 또는 범위는 기-정의된 크기 또는 범위를 사용하는 것 또한 본 발명의 범위에 포함될 수 있다.

전술한 병합 예측 영역(MER)에 관한 실시예는, 병렬 예측 영역(PER)에 대해서도 동일/유사하게 적용될 수 있으며, 자세한 설명은 생략하기로 한다.

도 5는 MER과 동일한 크기를 가지는 CU에 대한 예시이다.

도 5는 MER과 동일한 크기를 가지는 CU와 공간적으로 인접한 병합 후보들을 도시한 도면이다.

도 5와 같이, MER과 동일한 크기 혹은 MER 보다 큰 크기를 가지는 CU의 경우에는 공간적으로 인접한 병합 후보들을 병합 후보 리스트를 생성하는 과정에서 제외하는 프로세스를 포함하지 않는다.

또한, 도 5에서 도시한 MER 뿐만 아니라, 병렬 예측 영역(PER)도 마찬가지로 해당 개념을 적용할 수 있다.

도 5는 MER과 동일한 크기를 가지는 CU(500)와 공간적으로 인접한 병합 후보들을 도시한 도면이다.

도 5에서 도시하는 MER과 동일한 크기를 가지는 CU(500)에 공간적으로 인접한 병합 후보들로 좌측의 위치(510, 511, 512)와 상단의 위치(520, 521, 522, 523)에 대응하는 움직임 정보를 병합 후보로 사용할 수 있다.

이때, 현재 CU(500)은 MER과 동일한 크기를 가지므로, 전술한 바와 같이, 공간적으로 인접한 상기 병합 후보들을 이용하여 병합 후보 리스트를 생성하는 과정에서 해당 병합 후보들을 제외하는 프로세스를 수행하지 않는다.

단, 움직임 정보가 존재하지 않는 경우, 즉, 인트라 예측 모드로 부호화 된 블록, 혹은, 픽쳐, 슬라이스, 타일의 경계에 위치하는 경우에는 해당 위치의 움직임 정보를 병합 후보로 포함시키지 않는다.

도 6에서 MER 보다 작은 크기를 가지는 다수개의 CU들 중에서 동일한 MER에 포함되는 위치의 병합 후보를 사용하는 CU(604)에 대한 예시를 나타낸 도면이다.

또한, 도 6에서 도시한 바와 같이, 본 발명에서는 동일한 MER에 포함되어 병합 후보가 제외되는 경우에 대하여, 이를 보상하기 위한 MER 밖에 위치하는 공간적으로 다수의 화소 거리에 떨어진 위치를 추가적인 병합 후보로 사용하는 것을 제안한다.

도 6은 MER보다 작은 크기를 가지는 CU(604)에 대한 일 실시예를 도시한 도면으로, 도 6에서 MER 보다 작은 크기를 가지는 다수개의 CU들 (601, 602, 603, 604) 중에서 동일한 MER에 포함되는 위치의 병합 후보가 제외됨을 보이기 위하여 604 CU를 일 실시예로 설명한다.

도 6에서 현재 CU(604)의 공간적으로 인접한 병합 후보가 610, 611, 621, 620, 621과 같이 존재하는 경우, 현재 CU를 부호화 및 복호화함에 있어서 아직 부호화 및 복호화가 되지 않은 위치의 병합 후보들 (620, 621)은 병합 후보에서 제외된다.

또한, 상기 현재 CU(604)의 공간적으로 인접한 병합 후보 중 현재 CU과 동일한 MER에 포함되는 병합 후보들(610, 611, 612)은 병합 후보 리스트 생성과정에서 리스트에 추가되지 않는다.

상기 현재 CU(604)에 해당하는 일 실시예의 경우, 병합 후보 리스트를 구성하는 과정에서 공간적으로 인접한 병합 후보들이 부호화 및 복호화 순서에 의하여 제외되는 경우와 동일한 MER(600)에 포함되어 제외되므로, 공간적으로 인접한 병합 후보의 구성 과정에서 손실이 발생하게 된다.

본 발명에서는 이를 해결하기 위하여 공간적으로 다수의 화소 거리에 위치하는 병합 후보를 추가적인 병합 후보로 사용하는 병합 후보 리스트 구성 방법을 제안한다. 이때, 추가적인 병합 후보로 다수의 화소 거리에 위치하는 병합 후보를 사용하는 실시예로써 병합 후보 리스트가 최대 병합 후보 갯수 만큼 충족되지 않는 경우에 사용하는 경우, 혹은, 동일한 MER에 포함되는 병합 후보들을 제외하는 경우 사용하는 경우를 모두 포함할 수 있다.

도 6에서 도시한 바와 같이, 현재 CU와 동일한 MER(600)에 포함되는 병합 후보들(610, 611, 612)와 특정한 방향성을 가지고, 특정한 화소 거리에 위치의 병합 후보들(630, 631, 632)를 추가적인 병합 후보로 사용할 수 있다.

일 실시예에 따라, 현재 CU와 동일한 MER에 포함되는 병합 후보(610)에 수직 방향에 위치하며, 서로 다른 MER에 위치하는 병합 후보(630)를 현재 CU의 병합 후보 리스트에 추가할 수 있다.

또한, 일 실시예에 따라, 현재 CU와 동일한 MER에 포함되는 병합 후보(611)에 대각선 방향에 위치하며, 서로 다른 MER에 위치하는 병합 후보(631)를 현재 CU의 병합 후보 리스트에 추가 할 수 있다.

또한, 일 실시예에 따라, 현재 CU와 동일한 MER에 포함되는 병합 후보(612)에 대각선 방향에 위치하며, 서로 다른 MER에 위치하는 병합 후보(632)를 현재 CU의 병합 후보 리스트에 추가 할 수 있다.

상기 일 실시예에 따라 현재 CU(604)의 병합 후보 리스트에 추가되는 병합 후보들(630, 631, 632)의 경우, 현재 CU(604)의 상위 블록(630)의 병합 후보들로 병합 리스트를 구성하여 현재 CU(604)에서 사용될 수 있음을 의미한다.

도 7에서 MER 보다 작은 크기를 가지는 다수개의 CU들 중에서 동일한 MER에 포함되는 위치의 병합 후보를 사용하는 CU(706)에 대한 예시를 나타낸 도면이다.

또한, 도 7에서 도시한 바와 같이, 본 발명에서는 동일한 MER에 포함되어 병합 후보가 제외되는 경우에 대하여, 이를 보상하기 위한 MER 밖에 위치하는 공간적으로 다수의 화소 거리에 떨어진 위치를 추가적인 병합 후보로 사용하는 것을 제안한다.

도 7은 MER보다 작은 크기를 가지는 CU(706)에 대한 일 실시예를 도시한 도면으로, 도 7에서 MER 보다 작은 크기를 가지는 다수개의 CU들 (705, 706, 707) 중에서 동일한 MER에 포함되는 위치의 병합 후보가 제외됨을 보이기 위하여 706 CU를 일 실시예로 설명한다.

도 7에서 현재 CU(706)의 공간적으로 인접한 병합 후보가 710, 711, 720, 730, 731과 같이 존재하는 경우, 현재 CU를 부호화 및 복호화함에 있어서 부호화 및 복호화가 완료되었고, 동일한 MER에 포함되지 않는 후보들(710, 711)은 움직임 정보를 참조 가능한 경우 병합 후보 리스트에 추가될 수 있다. 즉, 해당 위치(710, 711)의 움직임 정보들은 현재 CU(706)의 병합 후보로 사용될 수 있다.

또한, 현재 CU를 부호화 및 복호화함에 있어서 아직 부호화 및 복호화가 되지 않은 위치의 병합 후보(720)은 병합 후보에서 제외된다.

또한, 상기 현재 CU(706)의 공간적으로 인접한 병합 후보 중 현재 CU와 동일한 MER(700)에 포함되는 병합 후보들(730, 731)은 병합 후보 리스트 생성과정에서 리스트에 추가되지 않는다.

상기 현재 CU(706)에 해당하는 일 실시예의 경우, 병합 후보 리스트를 구성하는 과정에서 공간적으로 인접한 병합 후보들이 부호화 및 복호화 순서에 의하여 제외되는 경우와 동일한 MER(700)에 포함되어 제외되므로, 공간적으로 인접한 병합 후보의 구성 과정에서 손실이 발생하게 된다.

본 발명에서는 이를 해결하기 위하여 공간적으로 다수의 화소 거리에 위치하는 병합 후보를 추가적인 병합 후보로 사용하는 병합 후보 리스트 구성 방법을 제안한다.

이때, 추가적인 병합 후보로 다수의 화소 거리에 위치하는 병합 후보를 사용하는 실시예로써 병합 후보 리스트가 최대 병합 후보 갯수 만큼 충족되지 않는 경우에 사용하는 경우, 혹은, 동일한 MER에 포함되는 병합 후보들을 제외하는 경우 사용하는 경우를 모두 포함할 수 있다.

도 7에서 도시한 바와 같이, 현재 CU와 동일한 MER(700)에 포함되는 병합 후보들(730, 731)과 특정한 방향성을 가지고, 특정한 화소 거리에 위치의 병합 후보들(740, 741, 750, 751)을 추가적인 병합 후보로 사용할 수 있다.

일 실시예에 따라, 현재 CU와 동일한 MER에 포함되는 병합 후보들(730, 731)에 대각선 방향에 위치하며, 서로 다른 MER에 위치하는 병합 후보들(740, 741)을 현재 CU의 병합 후보 리스트에 추가할 수 있다.

또한, 일 실시예에 따라, 현재 CU와 동일한 MER에 포함되는 병합 후보들(730, 731)에 수직 방향에 위치하며, 서로 다른 MER에 위치하는 병합 후보들(750, 751)을 현재 CU의 병합 후보 리스트에 추가 할 수 있다.

도 5, 6, 7에서 도시한 바와 같이, 현재 CU를 병렬적으로 부호화 및 복호화함에 있어서 현재 CU와 동일한 MER 혹은 PER에 포함되는 위치에 대하여 의존성을 제거할 수 있다.

이때, 병렬처리를 위한 MER 혹은 PER의 크기(혹은 범위)는 상위 레벨 신택스를 이용하여 전송할 수 있다.

이때, 상위 레벨 신택스는 SPS (Sequence parameter set), PPS (Picture parameter set), Slice header 중 하나 혹은 그 이상의 파라미터 셋을 이용하여 전송할 수 있다.

또한, 해당 MER, PER의 크기는 정방형에 한정되지 않으며, width와 height를 독립적으로 시그널링 하는 것을 포함할 수 있으며, 해당 width와 height가 서로 다른 직방형일 수도 있다. 혹은, 해당 MER 혹은 PER의 크기(혹은 범위)는 미리 정의된 크기를 사용하는 것 또한 본 발명의 범위에 포함 될 수 있다.

동일한 MER 혹은 PER에 포함된 CU간에는 상호 의존성이 제거되며, 움직임 예측과정에서 사용되는 병합 후보 리스트 생성 과정에서의 병합 후보, 움직임 예측을 위한 움직임 예측 후보를 포함할 수 있으며, 추가적으로 성분 간 예측에서 선형 파라미터 계산을 위한 참조 화소 구성, 및 템플릿 매칭을 위한 템플릿 구성에서도 동일한 MER 혹은 PER에 포함되는 영역은 제외되며, 서로 다른 MER 혹은 PER에 해당하는 영역을 사용하는 방법은 본 발명의 범위에 포함될 수 있다.

변환 대상인 현재 블록의 잔차 샘플을 복원하기 위하여, 수직 방향의 역변환과 수평 방향의 역변환 중 적어도 하나가 수행될 수 있다. 본 발명의 역변환은 2D-역변환으로 구현될 수도 있고, 수직/수평 방향 각각에 대한 1D-역변환으로 구현될 수도 있다.

예를 들어, KxL 크기의 현재 블록의 잔차 샘플을 복원하기 위해, L*K 변환 계수에 하나 또는 그 이상의 K*L 변환이 적용될 수 있다. 이때, K와 L이 같은 경우, 정방형 또는 비정방형의 변환이 적용될 수 있다.

또는, K*L 현재 블록의 복원을 위하여, 현재 블록의 절반 크기의 블록에 대해 역변환이 수행될 수 있다. 예를 들어, KxL 현재 블록의 잔차 샘플을 복원하기 위해, L/2*K/2 변환 계수에 K*L/2 변환 및/또는 K/2*L 변환을 적용할 수 있다. 마찬가지로, K과 L이 같은 경우, 정방향 또는 비정방형의 변환이 적용될 수 있다. K*L/2 변환은 상기 K*L 변환의 일부에 해당할 수 있다. 또한, K/2*L 변환은 KxL 변환의 일부에 해당할 수 있다. K*L 변환 계수의 복원을 위하여, K*L/2 변환을 수행하고, 경우에 따라 일부 혹은 전체를 나비 구조로 구현 가능하다. 이 나비 구조 계산은 K*L 나비 구조의 일부에 해당할 수 있다. KxL 잔차 샘플을 복원하기 위하여, K/2*L 변환을 수행하고, 경우에 따라 일부 혹은 전체를 나비 구조로 구현 가능하다. 이 나비 구조 계산은 K*L 나비 구조의 일부에 해당할 수 있다.

K*L 현재 블록의 잔차 샘플을 복원하기 위하여, K보다 작은 P와 L보다 작은 O 크기의 역변환이 수행될 수 있다. 이때, OxP 변환 계수에 K*O 변환 및/또는 P*L 변환이 적용될 수 있다. 이때, K와 L이 같은 경우, 정방향 또는 비정방형 변환이 적용될 수 있다. 또한, O와 P도 같을 수 있으며, O는 L보다 작거나 같은 정수이며, P는 K보다 작거나 같은 정수일 수 있다. 이때, K*O 변환은 K*L 변환의 일부에 해당하고, P*L 변환은 K*L 변환의 일부에 해당할 수 있다. KxL 현재 블록의 잔차 샘플을 복원하기 위하여, K*O 변환은 행렬 연산을 통하여 수행될 수 있다. 경우에 따라, 일부 혹은 전체를 나비 구조로 구현이 가능하다. 이 나비 구조 계산은 K*L 나비 구조의 일부에 해당할 수 있다.

K*L 잔차 신호를 복원하기 위하여, P*L 1차 변환을 행렬 연산을 통하여 가능하며, 경우에 따라, 일부 혹은 전체를 나비구조로 구현 가능하다. 이 나비 구조 계산은 K*L 나비 구조의 일부에 해당한다.

K*L 현재 블록은 L*K 변환 계수를 2D-역변환하여 구할 수 있다. 이러한 2D-역변환은 1D-역변환을 수평 방향과 수직 방향으로 각각 또는 동시에 수행될 수 있다. 이러한 과정을 행렬 계산으로 표현할 수 있으며, 수평 방향 및 수직 방향의 1D-역변환을 전항과 후항 행렬 곱으로 계산할 수도 있다.

이러한 경우를 비트스트림에서 지시하기 위하여, 하나의 flag나 모드로 판단할 수 있다. 혹은, 인터 예측과 인트라 예측에 따라 결정될 수도 있으며, 하나의 CTU 내에서 최대 예측 혹은 변환 크기에 따라 결정될 수도 있다. 하나의 실시예로, 인터 혹은 인트라 예측 블록인 경우, 가장 큰 예측 혹은 변환 블록 크기인 경우 항상, 그 블록보다 작은 역변환을 사용할 수 있다. 가장 큰 블록보다 작은 경우는 항상 그 블록과 같은 크기의 역변환을 통하여 잔차 샘플을 복원한다. 항상 더 작은 변환을 사용할 수도 있으나, 앞서 언급한 것처럼, flag 등의 정보를 통하여서 결정될 수도 있겠다. 혹은 복원 측에서 변환계수를 나열하여 보고, 변환계수에 고주파 성분이 포함되어 있지 않고, 일부 영역에만 계수가 존재하는 경우, 잔차 블록 크기보다 더 작은 역변환을 사용할 수 있겠다.

또한, 현재 부호화 및 복호화를 수행하는 부호화 블록의 크기가 최대 변환 크기보다 큰 경우에는 추가적인 시그널링 없이 최대 변환 크기로 분할하여 변환 및 역변환을 수행할 수 있다. 이때, 해당 부호화 블록이 정방형인 경우에는 최대 변환 크기를 이용하여 하나의 블록을 다수개의 변환 블록으로 분할함에 있어, 동일한 열과 행의 갯수를 가지도록 분할 되는 것을 포함한다. 반면, 해당 부호화 블록이 직방형인 경우에는 최대 변환 크기를 이용하여 하나의 블록을 다수개의 변환 블록으로 분할함에 있어, 동일한 열과 행의 갯수를 가지도록 분할 될 수 있으나, 변환 블록은 최대 변환 크기와 동일한 정방형 블록으로 유지하고, 부호화 블록의 너비와 높이에 따라 변환 블록의 갯수가 달라지는 것 또한 포함한다. 이하, 도 8을 참조하여 잔차 샘플 복원 방법에 대해서 자세히 살펴 보기로 한다.

먼저, 영상 부호화 장치의 변환부(130)는, 잔차 블록의 샘플, 즉 잔차 샘플에 대해서 변환(transform)을 수행하여 변환 계수(transform coefficients)를 획득할 수 있다. 양자화부(135)는, 상기 변환 계수에 양자화(quantization)를 수행하여 양자화된 변환 계수를 획득할 수 있다.

변환부(130)는, 상기 변환 계수에 대해서 추가적으로 변환을 수행할 수도 있다. 이하, 잔차 샘플에 적용되는 변환을 제1 변환, 상기 제1 변환에 따른 변환 계수에 적용되는 변환을 제2 변환이라고 각각 부르기로 한다. 다만, 제2 변환은, 제1 변환과 양자화 사이에서 수행되는 것으로 한정되지 아니한다. 예를 들어, 제2 변환은 제1 변환 이전에 수행될 수도 있다. 또는, 잔차 샘플에 제2 변환만을 수행하여 변환 계수를 획득하고, 제1 변환은 생략될 수도 있다.

전술한 제2 변환은, 현재 블록(또는 잔차 블록)의 크기 또는 형태 중 적어도 하나에 기초하여 수행될 수 있다. 예를 들어, 현재 블록의 크기가 소정의 임계값보다 작은 경우, N*N 변환 매트릭스가 적용될 수 있다. 그렇지 않은 경우, M*M 변환 매트릭스가 적용될 수 있다. 여기서, N은 4, 8 또는 그 이상의 정수일 수 있고, M은 8, 16 또는 그 이상의 정수일 수 있다. N은 M보다 작을 수 있다. 상기 임계값은 8, 16 또는 그 이상의 정수일 수 있다.

일예로, 현재 블록의 너비 또는 높이 중 최소값이 8보다 작은 경우, 4x4 변환 매트릭스를 기반으로 제2 변환이 수행될 수 있다. 또는, 현재 블록의 너비 또는 높이 중 최소값이 8보다 크거나 같은 경우, 8x8 변환 매트릭스를 기반으로 제2 변환이 수행될 수 있다.

다만, 제2 변환을 위한 변환 매트릭스는 정방형(square)으로 한정되지 아니하며, 비정방형(non-square)의 변환 매트릭스가 이용될 수도 있다. 비정방형 변환 매트릭스 기반의 제2 변환은, (W*H) 크기의 현재 블록을 (w1*h1) 크기의 서브 블록으로 매핑하는 과정일 수 있다. 서브 블록은 현재 블록의 일부 영역을 의미할 수 있다. 즉, w1은 0보다 크고 W보다 작거나 같을 수 있으며, h1은 0보다 크고 H보다 작거나 같을 수 있다. 상기 일부 영역은, 현재 블록 내에서 좌측, 상단, 또는 좌상단에 위치한 w1*h1 블록일 수 있다. 상기 제2 변환 결과, 서브 블록에는 넌-제로 변환 계수만이 생성되고, 현재 블록의 나머지 영역에는 제로 변환 계수만이 생성될 수 있다. 상기 서브 블록의 크기/형태는 전술한 변환 매트릭스의 크기에 기초하여 가변적으로 결정될 수 있다. 또는 서브 블록에 속한 넌-제로 변환 계수의 개수는 변환 매트릭스의 크기에 기초하여 가변적으로 결정될 수 있다.

한편, 영상 복호화 장치의 역양자화부(220)는, 비트스트림을 통해 획득된 변환 계수에 역양자화(dequantization)을 수행하여 역양자화된 변환 계수를 획득할 수 있다. 역변환부(225)는, 역양자화된 변환 계수에 역변환(inverse-transform)을 수행하여 잔차 샘플을 복원할 수 있다.

역변환부(225)는, 상기 역양자화와 상기 역변환 사이에 추가적인 역변환을 수행할 수도 있다. 이하, 추가적인 역변환을 제2 역변환, 제2 역변환에 따른 변환 계수에 적용되는 역변환을 제1 역변환이라고 각각 부르기로 한다. 다만, 제2 역변환은, 역양자화와 제1 역변환 사이에서 수행되는 것으로 한정되지 아니한다. 예를 들어, 제2 역변환은 제1 변환 이후에 수행될 수도 있다. 또는, 역양자화된 변환 계수에 제2 역변환을 수행하여 잔차 샘플을 복원할 수 있고, 이때 제1 역변환은 생략될 수도 있다.

전술한 제2 역변환은, 현재 블록(또는 잔차 블록)의 크기 또는 형태 중 적어도 하나에 기초하여 수행될 수 있다. 제2 역변환을 위한 변환 매트릭스는 제2 변환 과정에서 살펴본 바와 같으며, 여기서 자세한 설명은 생략하기로 한다.

또한, 제2 역변환을 위한 변환 매트릭스는 정방형(square)뿐만 아니라 비정방형(non-square)의 변환 매트릭스가 이용될 수도 있다. 비정방형 변환 매트릭스 기반의 제2 역변환은, 전술한 제2 역변환의 역과정으로 이해될 수 있다. 즉, 제2 역변환은, (w1*h1) 크기의 서브 블록을 (W*H) 크기의 현재 블록으로 매핑하는 과정일 수 있다. 여기서, 서브 블록은 현재 블록의 일부 영역을 의미할 수 있다. 즉, w1은 0보다 크고 W보다 작거나 같을 수 있으며, h1은 0보다 크고 H보다 작거나 같을 수 있다. 상기 일부 영역은, 현재 블록 내에서 좌측, 상단, 또는 좌상단에 위치한 w1*h1 블록일 수 있다. 상기 제2 역변환을 통해, 서브 블록의 (w1*h1) 크기의 변환 계수로부터 현재 블록의 (W*H) 크기의 변환 계수가 생성될 수 있다. 상기 변환 매트릭스의 크기/형태에 기초하여, 현재 블록에 매핑되는 서브 블록의 크기, 형태, 위치 또는 넌-제로 변환 계수의 개수 중 적어도 하나가 결정될 수 있다.

전술한 변환 매트릭스는, 복수의 변환 세트로부터 결정될 수 있다. 영상 부호화/복호화 장치에 기-정의된 변환 세트의 개수는 1개, 2개, 3개, 4개 또는 그 이상일 수 있다. 각 변환 세트는 하나 또는 그 이상의 변환 매트릭스로 구성될 수 있다. 이때, 현재 블록의 변환 세트는, 변환 세트를 특정하는 정보가 영상 부호화 장치에서 시그날링될 수 있다. 또는, 현재 블록의 변환 세트는, 블록의 크기, 형태, 분할 타입, 성분 타입(e.g., 휘도/색차 성분), 인트라 예측 모드가 비방향성인지 여부, 인트라 예측 모드의 각도, 넌-제로 변환 계수의 존부, 변환 스킵 여부 등을 고려하여 결정될 수 있다. 여기서, 변환 스킵 여부는, 제1 역변환의 수행 여부를 의미할 수 있다. 일예로, 변환 세트는, 인트라 예측 모드(IntraPredMode)에 기초하여 선택될 수 있으며, 다음 표 1과 같다. 다만, 현재 블록의 인트라 예측 모드가 성분 간 예측 모드를 나타내는 경우, 영상 부호화/복호화 장치에 기-약속된 변환 세트 인덱스에 기초하여 변환 세트가 결정될 수 있다.

IntraPredMode	변환 세트 인덱스
IntraPredMode < 0	1
0 <= IntraPredMode <= 1	0
2 <= IntraPredMode <= 12	1
13 <= IntraPredMode <= 23	2
24 <= IntraPredMode <= 44	3
45 <= IntraPredMode <= 55	2
56 <= IntraPredMode	1

현재 블록의 변환 매트릭스는, 상기 선택된 변환 세트에 속한 복수의 변환 타입(또는 변환 매트릭스) 중 어느 하나에 기초하여 결정될 수 있다. 이를 위해, 영상 부호화 장치로부터 별도의 인덱스가 시그날링될 수 있다. 상기 인덱스는, 전술한 제2 역변환이 수행되는지 여부를 나타낼 수 있다. 또는, 상기 인덱스는, 전술한 비정방형 변환 매트릭스 기반의 제2 역변환이 수행되는지 여부를 나타낼 수도 있다. 또한, 상기 인덱스는, 기-선택된 변환 세트 중 어느 하나의 변환 타입을 특정할 수도 있다.

예를 들어, 상기 인덱스가 제1 값인 경우, 제2 역변환이 스킵되고, 상기 인덱스가 제2 값인 경우, 제2 값에 대응하는 변환 타입을 기반으로 제2 역변환이 수행될 수 있다.

또는, 상기 인덱스는, 제2 역변환이 수행되는지 여부를 나타내는 제1 인덱스와 변환 타입을 특정하는 제2 인덱스를 포함할 수 있다. 이 경우, 제1 인덱스가 제1 값인 경우, 제2 역변환이 수행되고, 그렇지 않은 경우, 제2 역변환이 스킵될 수 있다. 상기 제1 인덱스가 제1 값인 경우, 제2 인덱스가 시그날링될 수 있으며, 시그날링된 제2 인덱스에 기초하여 변환 타입이 결정될 수 있다.

상기 제2 역변환은 소정의 조건을 만족하는 경우에 한하여 수행될 수 있다.

예를 들어, 현재 블록 내에서, 전술한 서브 블록을 제외한 영역에 넌-제로 변환 계수가 존재하는지 여부를 고려하여, 제2 역변환이 선택적으로 수행될 수 있다. 즉, 서브 블록을 제외한 영역에 넌-제로 변환 계수가 존재하는 경우, 이는 영상 부호화 장치에서 제2 변환을 수행하지 않았음을 의미하기 때문이다. 따라서, 현재 블록의 우측, 하단, 또는 우하단 영역 중 적어도 하나에 대해 넌-제로 변환 계수의 존부를 확인하고, 해당 영역에 넌-제로 변환 계수가 존재하지 않는 경우에만 제2 역변환이 수행될 수 있다. 또는, 해당 영역에 넌-제로 변환 계수가 존재하지 않는 경우에만 인덱스가 시그날링되고, 시그날링된 인덱스에 기초하여 제2 역변환이 선택적으로 수행될 수도 있다.

또는, 제2 역변환은, 현재 블록의 크기가 소정의 문턱값보다 크거나 같은 경우에 수행될 수 있다. 상기 문턱값은, 4, 8 또는 그 이상의 정수일 수 있다. 현재 블록의 너비와 높이가 문턱값보다 크거나 같은 경우에 제2 역변환이 적용될 수 있다. 또는, 현재 블록의 너비 또는 높이 중 어느 하나가 상기 문턱값보다 크거나 같은 경우라도 제2 역변환이 적용되도록 구현될 수도 있다.

또는, 현재 블록에 대해 제1 역변환이 수행되는 경우에 한하여 제2 역변환이 수행될 수 있다.

또는, 현재 블록이 인트라 모드로 부호화된 블록인 경우에 한하여 제2 역변환이 수행될 수 있다. 다만, 현재 블록에 대해서 서브 블록 기반의 인트라 예측이 수행되는 경우에는 제2 역변환이 수행되지 않도록 제한될 수 있다. 서브 블록 기반의 인트라 예측은 도 3에서 살펴본 바와 같으며, 여기서 자세한 설명은 생략하기로 한다.

제2 역변환은, 전술한 조건 중 어느 하나만을 고려하여 제한적으로 수행될 수도 있고, 적어도 2개의 조합에 기초하여 제한적으로 수행될 수도 있다.

도 9를 참조하면, 변환 대상인 현재 블록은 N*M 크기/형태를 가진 블록이라 가정한다. N*M 블록(900)은 제1 변환을 통해 생성된 변환 계수를 포함할 수 있다.

영상 부호화 장치는, 상기 N*M 블록(900)의 변환 계수에 대해 제2 변환을 수행할 수 있고, 이 경우 N*M 블록(900)의 변환 계수는 N*M 블록(900)의 일부 영역에 속한 변환 계수로 매핑될 수 있다. 여기서, N*M 블록(900)은 정방형(N=M)일 수도 있고, 비정방형(N<M, N>M)일 수도 있다. 상기 일부 영역은, N*M 블록(900) 내 좌상단 영역(910)일 수도 있고, N*M 블록(900) 내 상단 영역(920) 또는 좌측 영역(930)일 수도 있다.

또는, N*M 블록(900)의 너비 또는 높이 중 적어도 하나가 소정의 문턱크기보다 큰 경우, N*M 블록(900)은 소정의 분할 타입에 기초하여 복수의 서브 블록으로 분할되고, 복수의 서브 블록 중 적어도 하나에만 상기 제2 변환이 수행될 수 있다. 상기 문턱크기는, 8, 16 또는 그 이상의 정수일 수 있다. 상기 분할 타입은 쿼드트리, 바이너리트리 또는 터너리트리 중 적어도 하나에 기초하여 수행될 수 있다. 또는, 상기 분할은, 하나 또는 그 이상의 수직 라인에 의해서만 수행될 수도 있고, 하나 또는 그 이상의 수평 라인에 의해서만 수행될 수도 있다. 이때, 상기 제2 변환은, 복수의 서브 블록 중 좌상단, 좌측 또는 상단에 위치한 서브 블록에 적용될 수 있다. 다만, 이에 한정되지 아니하며, 우상단, 좌하단, 우하단, 우측 또는 하단 중 적어도 하나에 위치한 서브 블록에 적용될 수도 있다. 제2 변환이 적용된 서브 블록의 변환 계수는 해당 서브 블록의 일부 영역에 속한 변환 계수로 매핑될 수 있다. 여기서, 일부 영역은 해당 서브 블록 내 좌상단, 상단 또는 좌측에 위치한 영역일 수 있다.

예를 들어, 도 9에 도시된 바와 같이, N*M 블록(900)은 쿼드트리에 기반하여 4개의 서브 블록으로 분할되고, 4개의 서브 블록 중 좌상단 서브 블록에 대해서만 제2 변환이 수행될 수 있다. 이때, 좌상단 서브 블록의 변환 계수는, 좌상단 서브 블록 내 좌상단 영역(940)의 변환 계수로 매핑될 수 있다.

또는, 영상 부호화 장치는, 상기 N*M 블록(900)의 변환 계수에 대해 제2 변환을 수행할 수 있고, 이 경우 N*M 블록(900)의 변환 계수는 N*M 블록(900)의 전체 영역(950)에 속한 변환 계수로 매핑될 수도 있다.

상기 매핑된 일부 영역 및/또는 전체 영역에 속한 변환 계수는, 전부 넌-제로 변환 계수일 수도 있고, 적어도 하나의 넌-제로 변환 계수를 포함할 수도 있다. 또한, 상기 제2 변환이 적용된 영역 내에서, 상기 매핑된 일부 영역을 제외한 나머지 영역은 제로 변환 계수가 생성될 수 있다.

영상 복호화 장치는, 전술한 제2 변환의 역과정을 통해 N*M 블록(900)의 변환 계수를 생성할 수 있다. 즉, 일부 영역의 변환 계수에 제2 역변환을 수행하여, N*M 블록(900)의 변환 계수를 생성할 수 있다.

전술한 매핑 관계는, N*M 블록(900)의 크기(너비와 높이 중 적어도 하나), 형태, 너비와 높이의 비 또는 분할 타입 중 적어도 하나에 기초하여 결정될 수 있으며, 이하 자세히 살펴 보도록 한다.

1. N=M=8인 경우

현재 블록이 8x8 블록인 경우, 영상 부호화 장치에서 16x64 변환 매트릭스가 적용될 수 있다. 상기 2D 형태의 8x8 변환 계수는, 1D 형태의 64x1 변환 계수로 표현될 수 있다. 상기 제2 변환을 통해, 64x1 변환 계수는 16x1 변환 계수로 매핑되고, 이는 소정의 스캔 순서에 기초하여 2D 형태의 4x4 블록으로 재정렬될 수 있다. 즉, 제1 변환된 8x8 블록의 변환 계수는, 제2 변환을 통해 4x4 블록의 변환 계수로 매핑될 수 있다. 이때, 상기 4x4 블록은 넌-제로 변환 계수만을 가지며, 이는 8x8 블록 내의 좌상단에 위치할 수 있다. 상기 8x8 블록 내에서 상기 4x4 블록을 제외한 나머지 영역에는 제로 변환 계수만이 생성될 수 있다. 영상 복호화 장치에서는, 전술한 제2 변환의 역과정을 통해, 8x8 블록 내 일부 영역인 4x4 블록의 변환 계수로부터 8x8 블록의 변환 계수를 생성할 수 있다.

또는, 현재 블록이 8x8 블록인 경우, 8x64 변환 매트릭스가 적용될 수도 있다. 마찬가지로, 상기 2D 형태의 8x8 변환 계수는, 1D 형태의 64x1 변환 계수로 표현될 수 있다. 상기 제2 변환을 통해, 64x1 변환 계수는 8x1 변환 계수로 매핑되고, 이는 소정의 스캔 순서에 기초하여 2D 형태의 4x2 블록(또는 2x4 블록)으로 재정렬될 수 있다. 즉, 제1 변환된 8x8 블록의 변환 계수는, 제2 변환을 통해 4x2 블록(또는 2x4 블록)의 변환 계수로 매핑될 수 있다. 이때, 상기 4x2 블록(또는 2x4 블록)은 넌-제로 변환 계수만을 가지며, 이는 8x8 블록 내의 좌상단에 위치할 수 있다. 상기 8x8 블록 내에서 상기 4x2 블록(또는 2x4 블록)을 제외한 나머지 영역에는 제로 변환 계수만이 생성될 수 있다. 영상 복호화 장치에서는, 전술한 제2 변환의 역과정을 통해, 8x8 블록 내 일부 영역인 4x2 블록(또는 2x4 블록)의 변환 계수로부터 8x8 블록의 변환 계수를 생성할 수 있다.

현재 블록이 8x8 블록인 경우, 상기 소정의 크기를 가진 변환 매트릭스 중에서 어느 하나가 선택적으로 이용될 수 있다. 상기 선택은, 블록의 크기, 형태 또는 분할 타입(e.g., 쿼드트리, 바이너리트리, 터너리트리) 중 적어도 하나에 기초하여 수행될 수 있다. 여기서, 블록은, 현재 블록, 현재 블록의 공간적 이웃 블록 또는 현재 블록이 속한 상위 블록 중 적어도 하나를 의미할 수 있다. 상위 블록은 현재 블록보다 작은 분할 뎁스를 가진 블록을 의미할 수 있다. 예를 들어, 상위 블록 내에 정방형 블록만이 포함된 경우, 작은 크기의 변환 매트릭스(e.g., 8x64 변환 매트릭스)가 이용되고, 그렇지 않은 경우, 큰 크기의 변환 매트릭스(e.g, 16x64 변환 매트릭스)가 이용될 수 있다. 또는, 현재 블록이 쿼드트리에 기반하여 분할된 경우, 작은 크기의 변환 매트릭스(e.g., 8x64 변환 매트릭스)가 이용되고, 그렇지 않은 경우, 큰 크기의 변환 매트릭스(e.g, 16x64 변환 매트릭스)가 이용될 수 있다. 전술한 변환 매트릭스의 선택적 이용 방법은, 후술하는 실시예에서도 동일하게 적용될 수 있다.

2. N=M=4인 경우

현재 블록이 4x4 블록인 경우, 영상 부호화 장치에서 16x16 변환 매트릭스가 적용될 수 있다. 상기 2D 형태의 4x4 변환 계수는, 1D 형태의 16x1 변환 계수로 표현될 수 있다. 상기 제2 변환을 통해, 16x1 변환 계수는 16x1 변환 계수로 매핑되고, 이는 소정의 스캔 순서에 기초하여 2D 형태의 4x4 블록으로 재정렬될 수 있다. 즉, 제1 변환된 4x4 블록의 변환 계수는, 제2 변환을 통해 4x4 블록의 변환 계수로 매핑될 수 있다. 이때, 상기 4x4 블록은 넌-제로 변환 계수만을 가질 수 있다. 영상 복호화 장치에서는, 전술한 제2 변환의 역과정을 통해, 4x4 블록의 변환 계수로부터 4x4 블록의 변환 계수를 생성할 수 있다.

또는, 현재 블록이 4x4 블록인 경우, 8x16 변환 매트릭스가 적용될 수도 있다. 마찬가지로, 상기 2D 형태의 4x4 변환 계수는, 1D 형태의 16x1 변환 계수로 표현될 수 있다. 상기 제2 변환을 통해, 16x1 변환 계수는 8x1 변환 계수로 매핑되고, 이는 소정의 스캔 순서에 기초하여 2D 형태의 4x2 블록(또는 2x4 블록)으로 재정렬될 수 있다. 즉, 제1 변환된 4x4 블록의 변환 계수는, 제2 변환을 통해 4x2 블록(또는 2x4 블록)의 변환 계수로 매핑될 수 있다. 이때, 상기 4x2 블록(또는 2x4 블록)은 넌-제로 변환 계수만을 가지며, 이는 4x4 블록 내의 상단(또는 좌측)에 위치할 수 있다. 상기 4x4 블록 내에서 상기 4x2 블록(또는 2x4 블록)을 제외한 나머지 영역에는 제로 변환 계수만이 생성될 수 있다. 영상 복호화 장치에서는, 전술한 제2 변환의 역과정을 통해, 4x4 블록 내 일부 영역인 4x2 블록(또는 2x4 블록)의 변환 계수로부터 4x4 블록의 변환 계수를 생성할 수 있다.

3. N*M > 8x8 인 경우

현재 블록이 8x8 블록보다 큰 경우, 영상 부호화 장치는 현재 블록의 전부 또는 일부 영역에 대해서 제2 변환을 수행할 수 있다. 예를 들어, 현재 블록 내 8x8 블록 별로 제2 변환을 수행할 수 있다. 또는, 상기 일부 영역은 현재 블록 내 좌측, 상단 또는 좌상단 중 적어도 하나에 위치한 8x8 블록일 수 있다. 이때, 상기 제2 변환은 16x64 변환 매트릭스에 기초하여 수행될 수 있으며, 이는 1. N=M=8인 경우에서 살펴본 바와 같다. 일예로, 현재 블록이 16x16인 경우, 현재 블록의 좌상단 8x8 블록의 변환 계수는, 제2 변환을 통해 현재 블록의 좌상단 4x4 블록의 변환 계수로 매핑될 수 있다. 여기서, 상기 4x4 블록은 넌-제로 변환 계수만을 가지며, 좌상단 8x8 블록 내에서 상기 4x4 블록을 제외한 나머지 영역에는 제로 변환 계수만이 생성될 수 있다. 그리고, 현재 블록의 우상단, 좌하단 및 우하단에 위치한 8x8 블록은 제1 변환에 따른 변환 계수로 구성될 수 있다. 영상 복호화 장치에서는, 전술한 제2 변환의 역과정을 통해, 현재 블록 내 좌상단 8x8 블록의 일부 영역인 4x4 블록의 변환 계수로부터 좌상단 8x8 블록의 변환 계수를 생성할 수 있다. 나머지 8x8 블록의 변환 계수는 역양자화를 통해 생성될 수 있다.

다만, 상기 실시예는 16x64 변환 매트릭스에 한정되지 아니하며, 8x64 변환 매트릭스가 적용될 수도 있다. 이는 1. N=M=8인 경우에서 살펴본 바와 같으며, 여기서 자세한 설명은 생략하기로 한다.

4. N*M이 4x8 또는 8x4 인 경우

현재 블록이 4x8 블록(또는 8x4)인 경우, 영상 부호화 장치는 현재 블록의 전부 또는 일부 영역에 대해서 제2 변환을 수행할 수 있다. 예를 들어, 현재 블록 내 4x4 블록 별로 제2 변환을 수행할 수 있다. 또는, 상기 일부 영역은 현재 블록 내 좌측 또는 상단 중 적어도 하나에 위치한 4x4 블록일 수 있다. 이때, 상기 제2 변환은 16x16 변환 매트릭스에 기초하여 수행될 수 있으며, 이는 2. N=M=4인 경우에서 살펴본 바와 같다. 일예로, 현재 블록이 4x8인 경우, 현재 블록의 상단 4x4 블록의 변환 계수는, 제2 변환을 통해 현재 블록의 상단 4x4 블록의 변환 계수로 매핑될 수 있다. 그리고, 현재 블록의 하단 4x4 블록은 제1 변환에 따른 변환 계수로 구성될 수 있다. 영상 복호화 장치에서는, 전술한 제2 변환의 역과정을 통해, 현재 블록 내 상단 4x4 블록의 변환 계수로부터 상단 4x4 블록의 변환 계수를 생성할 수 있다. 그리고 하단 4x4 블록의 변환 계수는 역양자화를 통해 생성될 수 있다.

다만, 상기 실시예는 16x16 변환 매트릭스에 한정되지 아니하며, 8x16 변환 매트릭스가 적용될 수도 있다. 이는 2. N=M=4인 경우에서 살펴본 바와 같다. 일예로, 현재 블록이 4x8인 경우, 현재 블록의 상단 4x4 블록의 변환 계수는, 제2 변환을 통해 현재 블록의 상단 4x2 블록(또는 좌측 2x4 블록)의 변환 계수로 매핑될 수 있다. 여기서, 상단 4x2 블록(또는 좌측 2x4 블록)은 넌-제로 변환 계수만을 가지며, 상단 4x4 블록 내에서 상단 4x2 블록(또는 좌측 2x4 블록)을 제외한 나머지 영역에는 제로 변환 계수만이 생성될 수 있다. 그리고, 현재 블록의 하단 4x4 블록은 제1 변환에 따른 변환 계수로 구성될 수 있다. 영상 복호화 장치에서는, 전술한 제2 변환의 역과정을 통해, 현재 블록 내 상단 4x2 블록(또는 좌측 2x4 블록)의 변환 계수로부터 현재 블록 내 상단 4x4 블록의 변환 계수를 생성할 수 있다. 그리고, 현재 블록 내 하단 4x4 블록의 변환 계수는 역양자화를 통해 생성될 수 있다.

5. N 또는 M 중 어느 하나가 16보다 크거나 같은 경우

현재 블록의 너비 또는 높이 중 어느 하나가 16보다 크거나 같은 경우, 영상 부호화 장치는 현재 블록의 전부 또는 일부 영역에 대해서 제2 변환을 수행할 수 있다. 예를 들어, 현재 블록 내 4x4 블록 별로 제2 변환을 수행할 수 있다. 또는, 상기 일부 영역은 현재 블록 내 좌측 또는 상단 중 적어도 하나에 위치한 4x4 블록일 수 있다. 상기 일부 영역은, 좌측 또는 상단에 위치한 4x4 블록에 우측 또는 하단 방향으로 이웃한 하나 이상의 4x4 블록을 더 포함할 수도 있다. 이때, 상기 제2 변환은 16x16 변환 매트릭스 또는 8x16 변환 매트릭스에 기초하여 수행될 수 있으며, 이는 2. N=M=4인 경우에서 살펴본 바와 같다.

R*C 변환 매트릭스에 기반하여 제2 변환이 수행될 수 있다. 이때, 제2 변환은, 제1 변환된 현재 블록에 속한 C개의 변환 계수를 R개의 변환 계수로 매핑하는 과정일 수 있다. 즉, R*C 변환 매트릭스의 C 값을 조절함으로써, R개의 변환 계수에 매핑되는 제2 변환 대상인 영역의 범위를 가변적으로 결정할 수 있다.

예를 들어, 16x64 변환 매트릭스에 기반하여 제2 변환이 수행되는 경우, 제1 변환된 현재 블록에 속한 64개의 변환 계수(e.g., 8x8 블록)는 16개의 변환 계수(e.g., 4x4 블록)에 매핑될 수 있다. 또는, 16x48 변환 매트릭스에 기반하여 제2 변환이 수행되는 경우, 제1 변환된 현재 블록에 속한 48개의 변환 계수는 16개의 변환 계수에 매핑될 수 있다.

도 10에서, 현재 블록(1000)은 N*M 크기를 가지고, 제1 변환된 블록이며, N과 M은 각각 8보다 크거나 같음을 가정한다.

영상 부호화 장치에서, 16x48 변환 매트릭스에 기반하여 제2 변환이 수행되는 경우, 현재 블록에 속한 48개의 변환 계수는 16개의 변환 계수에 매핑될 수 있다. 여기서, 48개의 변환 계수는, 현재 블록 내 좌상단 8x8 블록(1010)에 속할 수 있다. 특히, 48개의 변환 계수는, 좌상단 8x8 블록(1010) 내에서, 좌상단 4x4 블록(1020), 우상단 4x4 블록(1030) 및 좌하단 4x4 블록(1040)에 속할 수 있다. 제2 변환을 통해 생성되는 16개의 변환 계수는, 현재 블록 내 좌상단 8x8 블록(1010)에 속할 수 있다. 그리고, 제2 변환 대상인 영역 중에서, 나머지 4x4 블록(1030, 1040)에는 제로 변환 계수가 생성될 수 있다.

영상 부호화 장치에서 16x48 변환 매트릭스에 기반하여 제2 변환이 수행된 경우, 영상 복호화 장치는 48x16 변환 매트릭스에 기반한 제2 역변환을 통해, 현재 블록 내 좌상단 4x4 블록(1020)의 변환 계수로부터 좌상단 4x4 블록(1020), 우상단 4x4 블록(1030) 및 좌하단 4x4 블록(1040)의 변환 계수를 유도할 수 있다.

도 11은 부호화 및 복호화시 대상 영상 블록의 움직임 벡터를 일정한 블록 크기의 단위로 압축하여 저장하는 방법을 도시한다. 이때, 상기 일정한 블록 크기의 단위로 압축한다는 것은, 특정한 화소의 집합 단위에 대하여 이에 대응하는 움직임 벡터 및 참조 인덱스 정보를 서브-샘플링, 평균값 또는 중간값 중 적어도 하나의 방법으로 획득한 대표값으로 저장하는 형태를 지칭한다.

도 11에서 하나의 단위 블록이 존재하고, 해당 블록의 움직임 정보는 화소 단위로 적용이 가능하지만, 저장 메모리 최적화 및 하드웨어의 구현 등의 이슈로 인하여 일정한 블록 단위로 저장이 가능하다. 또한, 이러한 움직임 정보를 시간적으로 인접한 서로 다른 픽쳐에서 참조하기 위하여 추가적인 움직임 벡터의 압축이 가능하다.

도 11은 움직임 정보를 저장함에 있어서, 압축에 기반하여 움직임 정보를 저장하는 개념을 도시한 도면으로, 이때, 움직임 정보를 압축한다는 것은 특정한 화소의 집합 단위에 대하여 이에 대응하는 움직임 벡터 및 참조 인덱스 정보를 서브-샘플링, 평균값 또는 중간값 중 적어도 하나의 방법으로 획득한 대표값으로 저장하는 형태를 지칭한다.

또한, 상기 움직임 정보를 압축함에 있어서, 그 압축된 대상 움직임에 대응하는 화소 블록의 크기가 4x4, 8x8, 16x16, 32x32, 64x64 인 것을 포함할 수 있다.

특히, 도 12는 부호화 및 복호화시 대상 영상 블록의 움직임 벡터를 추출하는 방법을 도시한다. 이때, 도 12와 같이 KxL 화소 블록의 움직임 벡터를 입력되는 공간 해상도에 따라 저장한다. 또한, 움직임 벡터의 정확도 또는 해상도에 따른 비트심도의 형태로 저장하는 방법을 도시한다.

도 12에서 하나의 단위 블록 (NxM)은 정방형 혹은 직방형 블록으로 구성될 수 있다. 이때, 상기 정방형 혹은 직방형 블록은 재귀적으로 다양한 트리 형태로 분할될 수 있으며, 쿼드-트리(Quad-tree) 블록 분할, 바이너리-트리(Binary-tree) 블록 분할, 및 터너리-트리(Ternary-tree) 블록 분할을 사용하여 분할될 수 있다.

도 12에서 도시한 하나의 단위 블록을 분할된 경우, KxL의 직방형 혹은 정방향 부분 블록의 움직임 벡터를 입력되는 공간 해상도로 MV1과 MV2로 저장한다. 여기서 MV1과 MV2는 각각 다른 참조 영상일 수 있으며, 이 참조영상의 인덱스를 별도로 저장한다. 또한, KxL 블록의 움직임 벡터를 공간 해상도에 맞도록 변형하여 저장한다.

하나의 예로, 8x16 블록의 움직임 벡터를 4x4 해상도로 저장한다면, 8x16을 4x4로 8개로 나누어 저장한다. 반대로, 16x16 해상도로 저장한다면, 16x16 해상도에 대응하는 블록들 중에 1개를 선택하거나, 평균 등의 대표 벡터를 추출하여 저장한다. 여기서, KxL 블록의 움직임 벡터는 부호화 방법에 따라 다양한 비트심도로 움직임 벡터가 결정될 수 있다.

이때, 움직임 벡터를 저장하는데 있어서, 발생한 움직임 벡터의 정확도를 지정한 비트깊이로 저장할 수 있다. 예를 들어, KxL 블록의 움직임 벡터가 1/8 정확도로 계산된 경우, 이를 비트심도에 따라 변형하여 저장할 수 있다. 예를 들어, 1/4 정확도 혹은 1/16 정확도 등으로 저장될 수 있다. 이러한 과정은 shift등의 연산을 통하여 이루어진다.

특히, 도 13은 부호화 및 복호화시 대상 영상 블록의 움직임 벡터를 추출하는 방법을 도시한다. 이때, 도 13과 같이 KxL 화소 블록에 대응되는 움직임 벡터를 추출하거나 특정 좌표의 움직임 벡터를 추출하는 방법을 도시한다. 저장된 움직임 벡터를 추출하기 위하여 공간 해상도에 따라 대응되는 저장된 움직임 벡터를 추출해야 하며, 움직임 벡터의 정확도에 따른 비트심도를 보정하여 추출하여야 한다.

도 13에서 도시한 하나의 단위 블록을 분할된 경우, KxL의 직방형 혹은 정방향 부분 블록에 대응되는 움직임 벡터를 추출하거나, 특정 좌표의 움직임 벡터를 추출하기 위하여 공간 해상도에 따라 대응되는 MV1과 MV2로 추출하여야 한다. 경우에 따라, 1개의 움직임 벡터만을 추출할 수 있다. 여기서 MV1과 MV2는 각각 다른 참조 영상일 수 있으며, 움직임 벡터화 함께 별도로 저장된 참조 영상의 인덱스를 추출한다.

또한, KxL 블록에 대응한 움직임 벡터를 추출하기 위하여, 그 블록은 공간 해상도를 고려하여 좌상단의 좌표에 대응하는 움직임 벡터를 추출하여 온다. 하나의 예로, 어떤 8x16 복호화 블록에 대응하는 움직임 벡터를 추출하기 위하여, 그 블록의 좌상단에 대응하는 4x4 해상도로 저장된 움직임 벡터를 추출한다. 혹은, 8x16 복호화 블록에 대응되는 4x4 해상도 블록 중 1개 혹은 다수 개의 평균 등의 대표값을 사용한다. 반대로, 복호화 블록이 움직임 벡터 저장 해상도보다 더 작은 경우, 대응 블록은 움직임 벡터를 추출하여 사용한다.

이때, 어떠한 비트 심도로 저장된 움직임 벡터를 추출하여, 복호화 블럭에서 사용하기 위하여, 복호화기 블록에서 필요한 비트 심도로 변경하여 추출한다. 예를 들어, 1/2 비트심도로 저장되었으나, 1/8 비트 정확도의 움직임 벡터가 필요하다면, 이에 맞도록 shift 등의 연산을 통하여 움직임 벡터의 정확도를 조정할 필요가 있다.

움직임 벡터 및 참조영상 저장 및 추출을 위하여, 비트심도와 공간 해상도를 비트스트림에 표시 및 파싱하여 영상 부호화 및 복호화를 수행할 수 있다.

움직임 벡터 및 참조 영상 저장을 위한 비트심도와 공간 해상도를 변경함으로써, 장치의 메모리 용량 문제에 대응할 수 있다.

영상 시퀀스에 따라, 다른 움직임 벡터 및 참조 영상 저장 및 추출을 위한 비트심도와 공간 해상도를 변경할 수 있다. 예를 들어, 4x4, 16x16, 32x32 등의 움직임 벡터 및 참조 영상 해상도를 저장할 수 있으며, 각 움직임 벡터를 저장시 비트심도를 정수 화소 단위, 1/2, 1/4, 1/16 등으로 저장할 수 있으며, 이를 비트스트림에 표시할 수 있다.

본 개시의 다양한 실시 예는 모든 가능한 조합을 나열한 것이 아니고 본 개시의 대표적인 양상을 설명하기 위한 것이며, 다양한 실시 예에서 설명하는 사항들은 독립적으로 적용되거나 또는 둘 이상의 조합으로 적용될 수도 있다.

또한, 본 개시의 다양한 실시 예는 하드웨어, 펌웨어(firmware), 소프트웨어, 또는 그들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 범용 프로세서(general processor), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.

본 개시의 범위는 다양한 실시 예의 방법에 따른 동작이 장치 또는 컴퓨터 상에서 실행되도록 하는 소프트웨어 또는 머신-실행가능한 명령들(예를 들어, 운영체제, 애플리케이션, 펌웨어(firmware), 프로그램 등), 및 이러한 소프트웨어 또는 명령 등이 저장되어 장치 또는 컴퓨터 상에서 실행 가능한 비-일시적 컴퓨터-판독가능 매체(non-transitory computer-readable medium)를 포함한다.

본 발명은 영상 부호화/복호화하기 위해 이용될 수 있다.

Claims

현재 블록의 병합 후보 리스트를 구성하는 단계;

상기 병합 후보 리스트 및 병합 후보 인덱스를 기반으로, 상기 현재 블록의 움직임 정보를 유도하는 단계; 및

상기 유도된 움직임 정보를 기반으로, 상기 현재 블록의 인터 예측을 수행하는 단계를 포함하되,

상기 병합 후보 리스트는, 복수의 병합 후보(merge candidates)을 포함하고,

상기 복수의 병합 후보는, 상기 현재 블록이 속한 소정의 병합 예측 영역의 위치 또는 크기 중 적어도 하나에 기초하여 결정되는, 영상 복호화 방법.
제1항에 있어서,

상기 병합 예측 영역은, 상기 병합 예측 영역에 속한 복수의 부호화 유닛이 하나의 병합 후보 리스트를 공유하는 영역인, 영상 복호화 방법.
제1항에 있어서,

상기 복수의 병합 후보는, 상기 병합 예측 영역의 공간적 이웃 블록 또는 시간적 이웃 블록 중 적어도 하나를 포함하는, 영상 복호화 방법.
제3항에 있어서,

상기 현재 블록은 더 작은 부호화 유닛으로 더 이상 분할되지 않는 부호화 유닛을 의미하고,

상기 병합 예측 영역은 상기 현재 블록보다 작은 분할 뎁스(split depth)를 가진 상위 부호화 유닛인, 영상 복호화 방법.
제1항에 있어서,

상기 현재 블록의 위치 정보와 크기 정보를 상기 병합 예측 영역의 위치 정보와 크기 정보로 각각 설정하는 단계를 더 포함하는, 영상 복호화 방법.
제1항에 있어서,

상기 병합 예측 영역은, 블록의 크기 또는 분할 기법 중 적어도 하나에 기초하여 설정되고,

상기 블록은 상기 현재 블록 또는 상기 현재 블록에 대한 상위 부호화 유닛 중 적어도 하나를 포함하는, 영상 복호화 방법.
제6항에 있어서,

상기 현재 블록의 상위 부호화 유닛에 속한 샘플의 개수가 소정의 제1 문턱값보다 작거나 같은 경우, 상기 상위 부호화 유닛이 상기 병합 예측 영역으로 설정되는, 영상 복호화 방법.
제6항에 있어서,

상기 현재 블록의 상위 부호화 유닛이 소정의 분할 기법에 기초하여 분할되고, 상기 상위 부호화 유닛에 속한 샘플의 개수가 소정의 제2 문턱값보다 작거나 같은 경우, 상기 상위 부호화 유닛이 상기 병합 예측 영역으로 설정되는, 영상 복호화 방법.
제8항에 있어서,

상기 분할 기법은, 쿼드-트리 블록 분할, 바이너리-트리 블록 분할 또는 터너리-트리 블록 분할 중 어느 하나이고,

상기 제2 문턱값은, 32, 64, 128, 또는 256인, 영상 복호화 방법.