WO2012148128A2

WO2012148128A2 - 인터 예측 방법과 이를 이용한 인코딩 방법, 디코딩 방법 및 장치

Info

Publication number: WO2012148128A2
Application number: PCT/KR2012/003017
Authority: WO
Inventors: 박승욱; 임재현; 김정선; 박준영; 최영희; 전병문; 전용준
Original assignee: 엘지전자 주식회사
Priority date: 2011-04-24
Filing date: 2012-04-19
Publication date: 2012-11-01
Also published as: WO2012148128A3

Abstract

본 발명은 인터 예측 방법과 이를 이용한 인코딩 방법, 디코딩 방법 및 장치에 관한 것으로서, 본 발명에 따른 인터 예측 방법은 움직임 정보를 유도하는 단계, 상기 움직임 정보를 기반으로 예측 블록을 생성하는 단계 및 상기 생성된 예측 블록을 기반으로 현재 블록을 복원하는 단계를 포함하며, 상기 예측 블록 생성 단계에서는, 인코딩 장치로부터 수신한 영상 정보를 기반으로 가중치 예측을 수행하고, 상기 영상 정보는 참조 픽처 리스트 0과 참조 픽처 리스트 1의 동일성 여부에 따라서 상이할 수 있다.

Description

인터 예측 방법과 이를 이용한 인코딩 방법, 디코딩 방법 및 장치

본 발명은 영상 정보 처리 방법에 관한 것으로서, 더 구체적으로는 영상 정보를 시그널링하는 방법과 시그널링된 정보를 이용하여 영상 정보를 처리하는 방법 및 장치에 관한 것이다.

최근, 고해상도, 고품질의 영상에 대한 요구가 다양한 응용 분야에서 증가하고 있다. 하지만, 영상의 고해상도, 고품질이 될수록 해당 영상에 관한 정보량도 함께 증가한다. 따라서 기존의 유무선 광대역 회선과 같은 매체를 이용하여 영상 정보를 전송하거나 기존의 저장 매체를 이용해 영상 정보를 저장하는 경우, 정보의 전송 비용과 저장 비용이 증가하게 된다.

고해상도, 고품질 영상의 정보를 효과적으로 전송하거나 저장하고, 재생하기 위해 고효율의 영상 압축 기술을 이용할 수 있다.

영상 압축의 효율을 높이기 위해, 현재 블록의 정보를 그대로 전송하지 않고, 현재 블록의 주변 블록들의 정보를 이용하여 예측하는 방법을 사용할 수 있다.

예측의 방법으로서, 인터 예측과 인트라 예측을 이용할 수 있다. 인터 예측(inter prediction) 방법에서는 다른 픽처의 정보를 참조하여 현재 픽처(picture)의 화소값을 예측하며, 인트라 예측 방법(intra prediction)에서는 동일한 픽처 내에서 화소 간 연관 관계를 이용하여 화소값을 예측한다.

인터 예측을 수행하는 경우에는, 다른 픽처에서 예측에 이용되는 부분을 지정하기 위해, 인터 예측 모드인 주변 블록으로부터 참조 픽처를 지시하는 정보와 움직임 벡터를 나타내는 정보를 활용할 수 있다. 참조 픽처로서는 현재 픽처의 이전 픽처가 사용되거나 현재 픽처의 이후 픽처가 사용되거나 현재 픽처의 이전 및 이후 픽처가 사용될 수 잇다.

본 발명은 효과적으로 영상 정보를 처리하기 위한 시그널링 방법과 이를 이용하는 장치를 제공하는 것을 목적으로 한다.

본 발명은 정보를 중복 전송하지 않고 시그널링할 수 있는 방법과 이를 이용하는 장치를 제공하는 것을 목적으로 한다.

본 발명은 인터 예측에 있어서, 참조 픽처 리스트들의 동일성을 기반으로 인코딩 장치로부터 디코딩 장치로 전송되는 정보를 효과적으로 시그널링하는 방법과 이를 이용하는 장치를 제공하는 것을 목적으로 한다.

본 발명은 인터 예측을 수행함에 있어서, 가중치 예측을 수행하는 경우에 참조 픽처 리스트들의 동일성에 기반하여 정보를 시그널링하고 이를 기반으로 예측을 수행하는 방법 및 장치를 제공하는 것을 목적으로 한다.

본 발명에 따른 일 실시형태는 인코딩 방법으로서, 인터 예측을 수행하는 단계 및 상기 인터 예측 결과를 포함하는 영상 정보를 전송하는 단계를 포함하며, 상기 인터 예측이 B 슬라이스에 대하여 수행된 경우에, 상기 영상 정보는 참조 픽처 리스트 0과 참조 픽처 리스트 1의 동일성 여부를 기반으로 전송될 수 있다.

상기 인터 예측을 수행하는 단계에서는 가중치 예측이 수행될 수 있으며, 상기 영상 정보는 가중치 예측을 위한 정보를 포함할 수 있다. 이때, 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않으면, 상기 가중치 예측은 참조 픽처 리스트 조합을 기반으로 수행될 수 있으며, 상기 영상 정보는, 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1로부터 조합되는 참조 픽처 리스트 조합을 이용하는 가중치 예측의 정보를 포함할 수 있다.

상기 인터 예측을 수행하는 단계에서는 가중치 예측이 수행될 수 있으며, 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않은 경우에, 상기 가중치 예측은 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1으로부터 조합된 참조 픽처 리스트 조합에 기반하여 수행될 수 있으며, 상기 영상 정보는 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1을 기반으로 하는 가중치 예측 정보를 포함할 수 있다. 이때, 상기 가중치 예측 정보는, 상기 참조 픽처 리스트를 구성하는 엔트리 중 상기 참조 픽처 리스트 0으로부터의 엔트리에 적용할 가중치 예측 정보 및 상기 참조 픽처 리스트 1로부터의 엔트리에 적용할 가중치 예측 정보를 포함할 수 있다.

본 발명의 다른 실시형태는 디코딩 방법으로서, 인코딩 장치로부터 영상 정보를 수신하는 단계, 상기 수신한 영상 정보를 기반으로 인터 예측을 수행하는 단계 및 상기 인터 예측 결과를 기반으로 픽처를 복원하는 단계를 포함하며, 상기 인터 예측의 대상이 B 슬라이스인 경우에, 상기 수신한 영상 정보는 참조 픽처 리스트 0과 참조 픽처 리스트 1의 동일성 여부에 따라서 상이할 수 있다.

상기 인터 예측을 수행하는 단계에서는 가중치 예측이 수행될 수 있으며, 상기 영상 정보는 가중치 예측을 위한 정보를 포함할 수 있다. 이 경우, 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않으면, 상기 가중치 예측은 참조 픽처 리스트 조합을 기반으로 수행될 수 있으며, 상기 영상 정보는, 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1로부터 조합되는 참조 픽처 리스트 조합을 이용하는 가중치 예측의 정보를 포함할 수 있다.

상기 인터 예측을 수행하는 단계에서는 가중치 예측이 수행될 수 있으며, 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않은 경우에, 상기 가중치 예측은 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1으로부터 조합된 참조 픽처 리스트 조합에 기반하여 수행될 수 있고, 상기 영상 정보는 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1을 기반으로 하는 가중치 예측 정보를 포함할 수 있다. 이 경우, 상기 가중치 예측 정보는, 상기 참조 픽처 리스트를 구성하는 엔트리 중 상기 참조 픽처 리스트 0으로부터의 엔트리에 적용할 가중치 예측 정보 및 상기 참조 픽처 리스트 1로부터의 엔트리에 적용할 가중치 예측 정보를 포함할 수 있다.

본 발명의 또 다른 실시형태는 인코딩 장치 또는 디코딩 장치에서 수행되는 인터 예측 방법으로서, 움직임 정보를 유도하는 단계, 상기 움직임 정보를 기반으로 예측 블록을 생성하는 단계 및 상기 생성된 예측 블록을 기반으로 현재 블록을 복원하는 단계를 포함하며, 상기 예측 블록 생성 단계에서는, 인코딩 장치로부터 수신한 영상 정보를 기반으로 가중치 예측을 수행하고, 상기 영상 정보는 참조 픽처 리스트 0과 참조 픽처 리스트 1의 동일성 여부에 따라서 상이할 수 있다.

상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않은 경우에, 상기 가중치 예측은 참조 픽처 리스트 조합을 기반으로 수행될 수 있으며, 상기 영상 정보는, 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1로부터 조합되는 참조 픽처 리스트 조합을 이용하는 가중치 예측의 정보를 포함할 수 있다.

상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않은 경우에, 상기 가중치 예측은 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1으로부터 조합된 참조 픽처 리스트 조합에 기반하여 수행될 수 있으며, 상기 영상 정보는 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1을 기반으로 하는 가중치 예측 정보를 포함할 수 있다. 이 경우에, 상기 가중치 예측 정보는, 상기 참조 픽처 리스트를 구성하는 엔트리 중 상기 참조 픽처 리스트 0으로부터의 엔트리에 적용할 가중치 예측 정보 및 상기 참조 픽처 리스트 1로부터의 엔트리에 적용할 가중치 예측 정보를 포함할 수 있다.

본 발명의 또 다른 실시형태는 인코딩 장치로서, 인터 예측을 수행하는 예측부 및 상기 인터 예측 결과를 포함하는 영상 정보를 엔트로피 코딩하여 비트 스트림으로 전송하는 엔트로피 코딩부를 포함하며, 상기 예측부는 가중치 예측을 적용하여 인터 예측을 수행하고, 상기 영상 정보는 가중치 예측을 위한 정보를 포함하고, 상기 인터 예측이 B 슬라이스에 대하여 수행된 경우에, 상기 영상 정보는 참조 픽처 리스트 0과 참조 픽처 리스트 1의 동일성 여부를 기반으로 전송될 수 있다. 이때, 인코딩 장치는 상기 인코딩 방법과 상기 인터 예측 방법을 수행할 수 있다.

본 발명의 또 다른 실시형태는 디코딩 장치로서, 인코딩 장치로부터 수신한 비트스트림으로 전송된 영상 정보를 엔트로피 디코딩하는 엔트로피 디코딩부 및 상기 엔트로피 디코딩된 영상 정보를 기반으로 인터 예측을 수행하는 예측부를 포함하며, 상기 예측부는 가중치 예측을 적용하여 인터 예측을 수행하고, 상기 영상 정보는 가중치 예측을 위한 정보를 포함하며, 상기 인터 예측이 B 슬라이스에 대하여 수행된 경우에, 상기 영상 정보는 참조 픽처 리스트 0과 참조 픽처 리스트 1의 동일성 여부를 기반으로 전송될 수 있다. 이때 디코딩 장치는 상기 디코딩 방법과 인터 예측 방법을 수행할 수 있다.

본 발명에 의하면, 정보를 중복 전송하지 않고 시그널링함으로써 영상 정보를 효과적으로 인코딩/디코딩 할 수 있다.

본 발명에 의하면, 인터 예측을 수행함에 있어서, 참조 픽처 리스트들의 동일성을 기반으로 인코딩 장치로부터 디코딩 장치로 전송되는 정보를 효과적으로 시그널링할 수 있따.

본 발명에 의하면, 참조 픽처 리스트들의 동일성에 기반하여 가중치 예측을 수행하기 위한 정보를 시그널링함으로써, 예측을 효과적으로 수행할 수 있다.

본 발명에 의하면, 참조 픽처 리스트의 동일성에 기반한 정보를 효과적으로 시그널일함으로써 영상 정보의 압축 효율을 높일 수 있다.

도 1은 본 발명의 일 실시예에 따른 영상 인코딩 장치(인코더)를 개략적으로 도시한 블록도이다.

도 2는 본 발명의 일 실시예에 따른 영상 디코딩 장치(디코더)를 개략적으로 나타낸 블록도이다.

도 3은 L0과 L1으로부터 LC를 구성하는 방법의 일 예를 개략적으로 설명하는 도면이다.

도 4는 본 발명에 따라서 인터 예측을 수행하는 방법을 개략적으로 설명하는 순서도이다.

도 5는 본 발명에 따라서 인코딩 장치가 예측을 수행하고 정보를 시그널링하는 방법을 개략적으로 설명하는 순서도이다.

도 6은 본 발명에 따라서 디코딩 장치가 예측을 수행하고 픽처를 복원하는 방법을 개략적으로 설명하는 순서도이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니다. 본 명세서에서 사용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

한편, 본 발명에서 설명되는 도면상의 각 구성들은 영상 인코딩/디코딩 장치에서 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.

이하, 첨부한 도면들을 참조하여, 본 발명에 관하여 상세하게 설명하고자 한다.

도 1은 본 발명의 일 실시예에 따른 영상 인코딩 장치(인코더)를 개략적으로 도시한 블록도이다. 도 1을 참조하면, 영상 인코딩 장치(100)는 픽처 분할부(105), 예측부(110), 변환부(115), 양자화부(120), 재정렬부(125), 엔트로피 인코딩부(130), 역양자화부(135), 역변환부(140), 필터부(145) 및 메모리(150)를 구비한다.

픽처 분할부(105)는 입력된 픽처를 적어도 하나의 처리 단위로 분할할 수 있다. 이때, 처리 단위는 예측 유닛(Prediction Unit, 이하 ‘PU’라 함)일 수도 있고, 변환 유닛(Transform Unit, 이하 ‘TU’라 함)일 수도 있으며, 코딩 유닛(Coding Unit, 이하 ‘CU’라 함)일 수도 있다. 다만, 본 명세서에서는 설명의 편의를 위해, 예측 유닛을 예측 블록, 변환 유닛을 변환 블록, 인코딩 유닛을 인코딩 블록으로 표현할 수 있다.

예측부(110)는 인터 예측(inter prediction, 화면 간 예측)을 수행하는 인터 예측부와 인트라 예측(intra prediction, 화면 내 예측)을 수행하는 인트라 예측부를 포함할 수 있다. 코딩 효율을 높이기 위해, 영상 신호를 그대로 인코딩하는 것이 하니라, 이미 인코딩된 영역을 이용하여 영상을 예측하고, 원래의 영상과 예측 영상 사이의 레지듀얼 값을 예측 영상에 더하여 영상을 복원할 수 있도록 인코딩 한다.

예측에 이용되는 이미 인코딩된 영역을 포함하는 픽처로서, I 픽처(I 슬라이스), P 픽처(P 슬라이스), B 픽처(B 슬라이스) 등이 있다. I 슬라이스는 인트라 예측에 의해서만 디코딩되는 슬라이스이다. P 슬라이스는 각 블록의 샘플 값을 예측하기 위해 적어도 하나의 움직임 벡터 및 참조 픽처 인덱스를 이용한 인터 예측 또는 인트라 예측을 이용해서 디코딩될 수 있는 슬라이스이다. B 슬라이스는 각 블록의 샘플 값을 예측하기 위해 적어도 두 개의 움직임 벡터들과 참조 픽처 인덱스들을 이용한 인터 예측 또는 인트라 예측을 이용해서 디코딩될 수 있는 슬라이스이다.

예측부(110)는, 픽처 분할부(105)에서 픽처의 처리 단위에 대하여 예측을 수행하여 예측된 샘플로 구성되는 예측 블록을 생성한다. 예측부(110)에서 픽처의 처리 단위는 CU일 수도 있고, TU일 수도 있고, PU일 수도 있다. 또한, 해당 처리 단위에 대하여 실시되는 예측이 인터 예측인지 인트라 예측인지를 결정하고, 각 예측 방법의 구체적인 내용(예컨대, 예측 모드 등)를 정할 수 있다. 이때, 예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 서로 다를 수 있다. 예컨대, 예측의 방법과 예측 모드 등은 PU 단위로 결정되고, 예측의 수행은 TU 단위로 수행될 수도 있다.

인터 예측을 통해서는 현재 픽처의 이전 픽처 및/또는 이후 픽처 중 적어도 하나의 픽처의 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다. 또한, 인트라 예측을 통해서는 현재 픽처 내의 화소 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다.

인터 예측에서는 현재 블록에 대하여, 참조 픽처를 선택하고 현재 블록과 동일한 크기의 참조 블록을 선택해서, 현재 블록에 대한 예측 블록을 생성할 수 있다. 예컨대, 인터 예측에서는 현재 블록과의 레지듀얼(residual) 신호가 최소화되며 움직임 벡터 크기 역시 최소가 되도록 예측 블록을 생성할 수 있다. 인터 예측의 방법으로서, 스킵(skip) 모드, 머지(merge) 모드, AMVP(Advanced Motion Vector Prediction) 등을 이용할 수 있다. 예측 블록은 1/2 화소 샘플 단위와 1/4 화소 샘플 단위와 같이 정수 이하 샘플 단위로 생성될 수도 있다. 이때, 움직임 벡터 역시 정수 화소 이하의 단위로 표현될 수 있다. 예컨대 휘도 화소에 대해서는 1/4 화소 단위로, 색차 화소에 대해서는 1/8 화소 단위로 표현될 수 있다.

인터 예측을 통해 선택된 참조 픽처의 인덱스, 움직임 벡터 예측자, 레지듀얼 신호 등의 정보는 엔트로피 인코딩되어 디코딩 장치에 전달된다.

인트라 예측을 수행하는 경우에도 예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 서로 다를 수도 있다. 예컨대, PU 단위로 예측 모드가 정해져서 PU 단위로 예측이 수행될 수도 있고, PU 단위로 예측 모드가 정해지고 TU 단위로 화면 내 예측이 수행될 수도 있다.

인트라 예측에서 예측 모드는 33개의 방향성 예측 모드와 적어도 2개 이상의 비방향성 모드를 가질 수 있다. 비방향성 모드는 DC 예측 모드 및 플레너 모드(Planar 모드) 등을 포함할 수 있다.

인트라 예측에서는 참조 샘플에 필터를 적용한 후 예측 블록을 생성할 수 있다. 이때, 참조 샘플에 필터를 적용할 것인지는 현재 블록의 인트라 예측 모드 및/또는 사이즈에 따라 결정될 수도 있다.

PU는 더 이상 분할되지 않는 CU로부터 다양한 사이즈/형태로 결정될 수 있다. 예컨대 인터 예측의 경우에 PU는 2N×2N, 2N×N, N×2N, 또는 N×N 등의 크기를 가질 수 있다. 인트라 예측의 경우에 PU는 2N×2N 또는 N×N (N은 정수) 등의 크기를 가질 수 있다. 이때, N×N 크기의 PU는 특정한 경우에만 적용하도록 설정할 수도 있다. 예컨대 최소 크기 코딩 유닛에 대해서만 NxN의 PU를 이용하도록 정하거나 인트라 예측에 대해서만 이용하도록 정할 수 있다. 또한, 상술한 크기의 PU 외에, N×mN, mN×N, 2N×mN 또는 mN×2N (m<1) 등의 크기를 가지는 PU를 더 정의하여 사용할 수도 있다.

생성된 예측 블록과 원본 블록 사이의 레지듀얼 값(레지듀얼 블록 또는 레지듀얼 신호)은 변환부(115)로 입력된다. 또한, 예측을 위해 사용한 예측 모드 정보, 움직임 벡터 정보 등은 레지듀얼 값과 함께 엔트로피 인코딩부(130)에서 인코딩되어 디코딩 장치에 전달된다.

변환부(115)는 변환 단위로 레지듀얼 블록에 대한 변환을 수행하고 변환 계수를 생성한다. 변환부(115)에서의 변환 단위는 TU일 수 있으며, 쿼드 트리(quad tree) 구조를 가질 수 있다. 이때, 변환 단위의 크기는 소정의 최대 및 최소 크기의 범위 내에서 정해질 수 있다. 변환부(115)는 레지듀얼 블록을 DCT(Discrete Cosine Transform) 또는 DST(Discrete Sine Transform)를 이용하여 변환할 수 있다.

양자화부(120)는 변환부(115)에서 변환된 레지듀얼 값들을 양자화하여 양자화 계수를 생성할 수 있다. 양자화부(120)에서 산출된 값은 역양자화부(135)와 재정렬부(125)에 제공된다.

재정렬부(125)는 양자화부(120)로부터 제공된 양자화 계수를 재정렬한다. 양자화 계수를 재정렬함으로써 엔트로피 인코딩부(130)에서의 인코딩의 효율을 높일 수 있다. 재정렬부(125)는 계수 스캐닝(Coefficient Scanning) 방법을 통해 2차원 블록 형태의 양자화 계수들을 1차원의 형태로 재정렬할 수 있다. 재정렬부(125)에서는 양자화부에서 전송된 계수들의 확률적인 통계를 기반으로 계수 스캔닝의 순서를 변경함으로써 엔트로피 인코딩부(130)에서의 엔트로피 인코딩 효율을 높일 수도 있다.

엔트로피 인코딩부(130)는 재정렬부(125)에 의해 재정렬된 양자화 계수들에 대한 엔트로피 인코딩을 수행할 수 있다. 엔트로피 인코딩에는 예를 들어, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 인코딩 방법을 사용할 수 있다. 엔트로피 인코딩부(130)는 재정렬부(125) 및 예측부(110)로부터 전달받은 CU의 양자화 계수 정보 및 블록 타입 정보, 예측 모드 정보, 분할 단위 정보, PU 정보 및 전송 단위 정보, 움직임 벡터 정보, 참조 픽처 정보, 블록의 보간 정보, 필터링 정보 등 다양한 정보를 인코딩할 수 있다.

또한, 엔트로피 인코딩부(130)는 필요한 경우에, 전송하는 파라미터 셋 또는 신택스에 일정한 변경을 가할 수도 있다.

역양자화부(135)는 양자화부(120)에서 양자화된 값들을 역양자화하고, 역변환부(140)는 역양자화부(135)에서 역양자화된 값들을 역변환한다. 역양자화부(135) 및 역변환부(140)에서 생성된 레지듀얼 값은 예측부(110)에서 예측된 예측 블록과 합쳐져 복원 블록(Reconstructed Block)이 생성될 수 있다.

필터부(145)는 디블록킹 필터, ALF(Adaptive Loop Filter), SAO(Sample Adaptive Offset)를 복원된 픽처에 적용할 수 있다.

디블록킹 필터는 복원된 픽처에서 블록 간의 경계에 생긴 블록 왜곡을 제거할 수 있다. ALF(Adaptive Loop Filter)는 디블록킹 필터를 통해 블록이 필터링된 후 복원된 영상과 원래의 영상을 비교한 값을 기초로 필터링을 수행할 수 있다. ALF는 고효율을 적용하는 경우에만 수행될 수도 있다. SAO는 디블록킹 필터가 적용된 레지듀얼 블록에 대하여, 화소 단위로 원본 영상과의 오프셋 차이를 복원하며, 밴드 오프셋(Band Offset), 에지 오프셋(Edge Offset) 등의 형태로 적용된다.

한편, 인터 예측에 사용되는 복원 블록에 대해서 필터부(145)는 필터링을 적용하지 않을 수 있다.

메모리(150)는 필터부(145)를 통해 산출된 복원 블록 또는 픽처를 저장할 수 있다. 메모리(150)에 저장된 복원 블록 또는 픽처는 인터 예측을 수행하는 예측부(110)에 제공될 수 있다.

도 2는 본 발명의 일 실시예에 따른 영상 디코딩 장치(디코더)를 개략적으로 나타낸 블록도이다. 도 2를 참조하면, 영상 디코딩 장치(200)는 엔트로피 디코딩부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 예측부(230), 필터부(235) 메모리(240)를 포함할 수 있다.

인코딩 장치로부터 영상 비트 스트림이 입력된 경우, 입력된 비트 스트림은 인코딩 장치에서 영상 정보가 처리된 절차의 역과정에 따라서 디코딩될 수 있다.

예컨대, 영상 인코딩 장치에서 엔트로피 인코딩을 수행하기 위해 CAVLC 등의 가변 길이 인코딩(Variable Length Coding: VLC, 이하 ‘VLC’ 라 함)가 사용된 경우에, 엔트로피 디코딩부(210)도 인코딩 장치에서 사용한 VLC 테이블과 동일한 VLC 테이블로 구현하여 엔트로피 디코딩을 수행할 수 있다. 또한, 영상 인코딩 장치에서 엔트로피 인코딩을 수행하기 위해 CABAC을 이용한 경우에, 엔트로피 디코딩부(210)는 이에 대응하여 CABAC을 이용한 엔트로피 디코딩을 수행할 수 있다.

엔트로피 디코딩부(210)에서 디코딩된 정보 중 예측 블록을 생성하기 위한 정보는 예측부(230)로 제공되고 엔트로피 디코딩부에서 엔트로피 디코딩이 수행된 레지듀얼 값은 재정렬부(215)로 입력될 수 있다.

재정렬부(215)는 엔트로피 디코딩부(210)에서 엔트로피 디코딩된 비트 스트림을 영상 인코딩기에서 재정렬한 방법을 기초로 재정렬할 수 있다. 재정렬부(215)는 1차원 벡터 형태로 표현된 계수들을 다시 2차원의 블록 형태의 계수로 복원하여 재정렬할 수 있다. 재정렬부(215)는 인코딩 장치에서 수행된 계수 스캐닝에 관련된 정보를 제공받고 인코딩 장치에서 수행된 스캐닝 순서에 기초하여 역으로 스캐닝하는 방법을 통해 재정렬을 수행할 수 있다.

역양자화부(220)는 인코딩 장치에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다.

역변환부(225)는 영상 인코딩 장치에서 수행된 양자화 결과에 대해, 인코딩 장치의 변환부가 수행한 DCT 또는 DST에 대해 역DCT 또는 역DST를 수행할 수 있다. 역변환은 인코딩 장치에서 결정된 전송 단위 또는 영상의 분할 단위를 기초로 수행될 수 있다. 인코딩 장치의 변환부에서는 예측 방법, 현재 블록의 크기 및 예측 방향 등 복수의 정보에 따라 DCT 또는 DST를 선택적으로 수행될 수 있고, 디코딩 장치의 역변환부(225)는 인코딩 장치의 변환부에서 수행된 변환 정보를 기초로 역변환을 수행할 수 있다.

예측부(230)는 엔트로피 디코딩부(210)에서 제공된 예측 블록 생성 관련 정보와 메모리(240)에서 제공된 이전에 디코딩된 블록 및/또는 픽처 정보를 기초로 예측 블록을 생성할 수 있다. 복원 블록은 예측부(230)에서 생성된 예측 블록과 역변환부(225)에서 제공된 레지듀얼 블록을 이용해 생성될 수 있다.

예측부(230)에서 수행하는 구체적인 예측의 방법은 인코딩 장치의 예측부에서 수행되는 예측의 방법과 동일하다.

현재 블록에 대한 예측 모드가 인트라 예측(intra prediction) 모드인 경우에, 현재 픽처 내의 화소 정보를 기초로 예측 블록을 생성하는 인트라 예측을 수행할 수 있다.

현재 블록에 대한 예측 모드가 인터 예측(inter prediction) 모드인 경우에, 현재 픽처의 이전 픽처 또는 이후 픽처 중 적어도 하나를 참조 픽처로 하고, 참조 픽처에 포함된 정보를 기초로 현재 블록에 대한 인터 예측을 수행할 수 있다. 구체적으로, 인터 예측에서는 현재 블록에 대하여, 참조 픽처를 선택하고 현재 블록과 동일한 크기의 참조 블록을 선택해서, 현재 블록에 대한 예측 블록을 생성할 수 있다. 예컨대, 인터 예측에서는 현재 블록과의 레지듀얼(residual) 신호가 최소화되며 움직임 벡터 크기 역시 최소가 되도록 예측 블록을 생성할 수 있다. 이때, 참조 픽처의 정보를 이용하기 위해, 현재 픽처의 주변 블록들의 정보를 이용할 수 있다. 예컨대, 스킵(skip) 모드, 머지(merge) 모드, AMVP(Advanced Motion Vector Prediction) 등을 통해, 주변 블록의 정보에 기반하여 현재 블록에 대한 예측 블록을 생성할 수 있다.

예측 블록은 1/2 화소 샘플 단위와 1/4 화소 샘플 단위와 같이 정수 이하 샘플 단위로 생성될 수도 있다. 이때, 움직임 벡터 역시 정수 화소 이하의 단위로 표현될 수 있다. 예컨대 휘도 화소에 대해서는 1/4 화소 단위로, 색차 화소에 대해서는 1/8 화소 단위로 표현될 수 있다.

현재 블록의 인터 예측에 필요한 움직임 정보, 예컨대 움직임 벡터, 참조 픽처 인덱스 등에 관한 정보는 인코딩 장치로부터 수신한 스킵 플래그, 머지 플래그 등을 확인하고 이에 대응하여 유도될 수 있다.

예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 서로 다를 수도 있다. 예컨대, PU 단위로 예측 모드가 정해져서 PU 단위로 예측이 수행될 수도 있고, PU 단위로 예측 모드가 정해지고 TU 단위로 화면 내 예측이 수행될 수도 있다.

예측부(230)로부터 출력된 예측 블록에 역변환부(225)로부터 출력된 레지듀얼 블록이 더해져서 원본 영상을 복원할 수 있다.

복원된 블록 및/또는 픽처는 필터부(235)로 제공될 수 있다. 필터부(235)는 복원된 블록 및/또는 픽처에 디블록킹 필터링, SAO(Sample Adaptive Offset) 및/또는 적응적 루프 필터링 등을 적용한다.

메모리(240)는 복원된 픽처 또는 블록을 저장하여 참조 픽처 또는 참조 블록으로 사용할 수 있도록 할 수 있고 또한 복원된 픽처를 출력부로 제공할 수 있다.

여기서는 설명의 편의를 위해 생략하였지만, 디코딩 장치에 입력되는 비트 스트림은 파싱 단계를 거쳐 엔트로피 디코딩부로 입력될 수도 있다. 또한, 엔트로피 디코딩부에서 파싱 과정을 수행하도록 할 수도 있다.

본 명세서에서, 코딩은 경우에 따라 인코딩 또는 디코딩으로 해석될 수 있고, 정보(information)는 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 포함하는 것으로 이해될 수 있다.

‘화면’ 또는 ‘픽처(picture)’는 일반적으로 특정 시간대의 하나의 영상을 나타내는 단위를 의미하며, ‘슬라이스(slice)’, ‘프레임(frame)’ 등은 실제 비디오 신호의 코딩에 있어서 픽처의 일부를 구성하는 단위이며, 필요에 따라서는 픽처와 서로 혼용되어 사용 될 수도 있다.

‘픽셀(pixel)’, ‘화소’ 또는 ‘pel’은 하나의 영상을 구성하는 최소의 단위를 의미한다. 또한, 특정한 픽셀의 값을 나타내는 용어로서 ‘샘플(sample)’을 사용할 수 있다. 샘플은 휘도(Luma) 및 색차(Chroma) 성분으로 나누어질 수 있으나, 일반적으로는 이를 모두 포함하는 용어로써 사용될 수 있다. 상기에서 색차 성분은 정해진 색상들 간의 차이를 나타내는 것으로 일반적으로 Cb 및 Cr로 구성된다.

'유닛(unit)'은 상술한 코딩 유닛(CU), 예측 유닛(PU), 변환 유닛(TU)과 같이 영상 처리의 기본 단위 또는 영상의 특정 위치를 지칭하며, 경우에 따라서는 '블록(block)' 또는 '영역(area)' 등의 용어와 서로 혼용하여 사용될 수 있다. 또한, 블록은 M개의 열과 N개의 행으로 구성된 샘플들 또는 변환 계수(transform coefficient)들의 집합을 나타내는 용어로 사용될 수도 있다.

한편, 인터 예측 모드의 경우에 인코딩 장치 또는 디코딩 장치의 예측부는 상술한 바와 같이 현재 픽처(현재 영상)이 아닌 복원된 다른 픽처들의 정보를 이용하여 대상 블록의 픽셀값을 예측하는 인터 예측을 수행한다.

현재 블록의 예측에 이용되는 영상을 참조 픽처(reference picture) 또는 참조 프레임(reference frame)이라고 한다. 참조 픽처에서 현재 블록의 예측에 이용되는 영역은 참조 픽처를 지시하는 참조 픽처 인덱스(refIdx) 및 움직임 벡터(motion vector) 등을 이용하여 나타낼 수 있다.

현재 픽처에 대하여, 예측을 위하여 사용되는 픽처들로 참조 픽처 리스트를 구성할 수 있다. 참조 픽처 리스트의 픽처들 중에서 어떤 픽처가 현재 블록의 인터 예측에 이용될 것인지는 참조 픽처 인덱스를 이용하여 지시할 수 있다. 참조 픽처 인덱스는 참조 픽처 리스트에서 특정 참조 픽처를 지시한다.

구체적으로, 예측에 있어서 픽처는 I 픽처와 P 픽처 그리고 B 픽처 중 어느 하나로 분류될 수 있다.

I 픽처는 인트라 예측에 의해서 인코딩/디코딩되는 픽처이다. I 픽처의 특징은 픽처 단위가 아닌 슬라이스 단위로도 정의될 수 있다. 예컨대, 슬라이스 단위에서 I 픽처의 특징을 갖는 I 슬라이스가 정의될 수 있다.

P 픽처는 각 블록의 샘플 값을 예측하기 위해 적어도 하나의 움직임 벡터 및 참조 픽처 인덱스를 이용한 인터 예측 또는 인트라 예측을 이용해서 인코딩/디코딩될 수 있는 픽처이다. P 픽처에서는 한 개의 참조 픽처 리스트를 필요로 하며, 이를 참조 픽처 리스트 0(reference picture list 0: L0)이라고 한다. P 픽처의 특징은 픽처 단위가 아닌 슬라이스 단위로도 정의될 수 있다. 예컨대, 슬라이스 단위에서 P 픽처의 특징을 갖는 P 슬라이스가 정의될 수 있다.

B 픽처는 각 블록의 샘플 값을 예측하기 위해 최대(at most) 두 개의 움직임 벡터와 참조 픽처 인덱스들을 이용한 인터 예측 또는 인트라 예측을 이용해서 인코딩/디코딩될 수 있는 픽처이다. B 픽처에 대해서는 상술한 바와 같이 최대 2 개의 참조 픽처를 이용하여 순방향, 역방향 또는 양 방향 인터 예측을 수행할 수 있다. 따라서, B 픽처의 예측에는 두 개의 참조 픽처 리스트, 예컨대 참조 픽처 리스트 0 및 참조 픽처 리스트 1(reference picture list 1: L1)을 이용할 수 있다. B 픽처의 특징은 픽처 단위가 아닌 슬라이스 단위로도 정의될 수 있다. 예컨대, 슬라이스 단위에서 B 픽처의 특징을 갖는 B 슬라이스가 정의될 수 있다.

참조 픽처 리스트 0(이하, 설명의 편의를 위해 ‘L0’이라 함)은 P 픽처(P 슬라이스) 또는 B 픽처(B 슬라이스)의 인터 예측에 이용되는 참조 픽처 리스트이다. P 픽처(P 슬라이스)에 대한 인터 예측은 L0을 이용한다. 또한, L0은 B 픽처(B 슬라이스)에 대한 인터 예측에 이용되는 두 참조 픽처 리스트 중의 하나이다.

B 픽처(B 슬라이스)에 대한 쌍예측(bi-prediction)에 이용되는 두 참조 픽처 리스트 중 다른 하나가 참조 픽처 리스트 1(이하, 설명의 편의를 위해 ‘L1’이라 함)이다. L1은 B 픽처(B 슬라이스)에 대한 쌍예측(bi-prediction)에 이용되는 참조 픽처 리스트이다.

L0으로부터 선택된 참조 픽처를 사용하는 인터 예측을 L0 예측이라 하며, L0 예측은 주로 순방향 예측에 사용된다. L0 예측의 방향을 간단히 L0 방향이라고도 한다. L1으로부터 선택된 참조 픽처를 사용하는 인터 예측을 L1 예측이라 하며, L1 예측은 주로 역방향 예측에 사용된다. L1 예측의 방향을 간단히 L1 방향이라고도 한다.

또한, B 픽처의 단예측(uni-prediction)에 이용되는 참조 픽처 리스트로서 참조 픽처 리스트 조합(reference picture list combination: LC)이 있다. 참조 픽처 리스트 조합(이하, 설명의 편의를 위해 ‘LC’라 함)은 참조 픽처 리스트 0과 참조 픽처 리스트 1의 엔트리들로부터 유도될 수 있다.

도 3의 예에서, 현재 픽처(300)의 현재 블록(예컨대, PU)가 인터 예측 모드라면, 현재 블록은 참조 픽처 1(310), 참조 픽처 2(320), 참조 픽처 4(330), 참조 픽처 5(340)를 이용하여 인터 예측된다.

L0는 현재 픽처의 참조 픽처들 중 순방향의 참조 픽처들에 우선 순위를 두고 구성될 수 있다. 또한, 참조 픽처 리스트는 소정 개수의 참조 픽처로 구성될 수 있으며, 순방향과 역방향으로 각각 소정 개수의 참조 픽처를 포함하도록 설정될 수 있다.

도 3에서는 L0의 경우에, 순방향으로 두 개의 참조 픽처, 역방향으로 한 개의 참조 픽처를 포함하고, L1의 경우에, 역방향으로 두 개의 참조 픽처, 순방향으로 한 개의 참조 픽처를 포함하는 경우를 예로서 설명하고 있다.

예컨대, L0을 구성하는 경우에, 도 3의 예에서는 순방향으로 현재 픽처(300)에 가장 가까운 참조 픽처 2(320)에 인덱스 0을 할당하고, 순방향으로 현재 픽처(300)에 두 번째 가까운 참조 픽처 1(310)에 인덱스 1을 할당한다. 순방향 참조 픽처에 대한 인덱스 할당이 완료되면, 역방향으로 현재 픽처(300)에 가장 가까운 참조 픽처 4(330)에 인덱스 2를 할당한다. 따라서, 도 3의 예에 대한 L0은 표 1과 같이 구성될 수 있다.

<표 1>

또한, L1을 구성하는 경우에, 도 3의 예에서는 역방향으로 현재 픽처(300)에 가장 가까운 참조 픽처 4(330)에 인덱스 0을 할당하고, 역방향으로 현재 픽처(300)에 두 번째 가까운 참조 픽처 5(340)에 인덱스 1을 할당한다. 역방향 참조 픽처에 대한 인덱스 할당이 완료되면, 순방향으로 현재 픽처(300)에 가장 가까운 참조 픽처 2(320)에 인덱스 2를 할당한다. 따라서, 도 3의 예에 대한 L1은 표 2와 같이 구성될 수 있다.

<표 2>

LC는 L0과 L1으로부터 다양한 방법으로 구성될 수 있다. 도 3의 예에서는 L0과 L1에서, 현재 픽처에 가까운 참조 픽처부터 현재 픽처에 먼 참조 픽처의 순서로 번갈아 가며 참조 픽처를 나열해서 LC를 구성할 수 있다. 다시 말하면, L0과 L1에서 번갈아 가며 상위 인덱스의 참조 픽처 인덱스를 뽑고, 그 순서대로 인덱스를 할당해서 LC를 구성할 수 있다. 따라서, 도 3의 예에 대한 LC는 표 3과 같이 구성될 수 있다.

<표 3>

가령, 현재 블록(예컨대 PU)가 인터 모드일 경우에 예측 방향에 관한 정보가 인코딩 장치로부터 시그널링된다. 예컨대, 예측 방향이 L0 방향인지 L1 방향인지, 아니면 쌍예측이 적용되는지에 관한 정보가 인코딩 장치로부터 전송된다. L0 방향인지 L1 방향인지, 아니면 쌍예측이 적용되는지에 관한 정보는 소정의 지시자, 이를테면 인터 예측 지시자(inter_pred_idc)를 이용하여 전송될 수 있다.

하지만, 인터 예측에 관한 방향에 관하여 단예측(uni-prediction)과 쌍예측(bi-prediction)의 두 방법 중 어느 하나가 적용되는 것으로 설정할 수 있다면, 지시자를 사용하는 대신에 플래그를 이용하여 예측 방향에 관한 정보를 시그널링할 수 있게 된다. 지시자를 이용하는 대신에 플래그를 이용하면 정보 전송에 있어서 오버헤드를 줄일 수 있다.

상술한 단예측 방법에 참조 픽처 리스트 조합, 즉 LC가 사용된다.

복호화기에서 LC를 구성하기 위한 정보는 부호화기로부터 시그널링될 수 있다. LC를 구성하기 위한 정보는 다양한 방법으로, 필요에 따라 다양한 신택스 레벨에서 전송될 수 있다.

표 4는 LC를 구성하기 위한 정보가 부호화기로부터 전송되는 경우를 예로서 설명한 것이다.

<표 4>

표 4에 예시된 시그널링은 상술한 바와 같이, 다양한 레벨에서 전송될 수 있다. 예컨대, 슬라이스 헤더에 관한 신택스에 포함되어 전송될 수도 있고, 별도의 신택스로 전송된 후, 다른 신택스로부터 호출될 수도 있다.

신택스 ref_pic_list_combination_flag 는 LC를 생성할 것인지를 지시한다.

예컨대, 1(true)의 값을 가지는 ref_pic_list_combination_flag 는, L0 과 L1가 조합되어 현재 블록이 단예측(uni-prediction) 되는데 이용되는 추가적인 참조 픽처 리스트 LC가 생성된다는 것을 지시된다. 또한, 0(false)의 값을 가지는 ref_pic_list_combination_flag 는 L0과 L1이 동일(identical)하며, L0이 참조 픽처 리스트 조합(LC)로서 이용될 수 있다는 것을 지시한다. 따라서, 1(true)의 값을 가지는 ref_pic_list_combination_flag는 L0과 L1이 상이하다는 것을 지시하는 것으로 해석될 수도 있다.

한편, LC는 표 4에서 정의되는 루프(loop)가 시작될 때는 빈(empty) 것으로 설정될 수도 있다.

num_ref_idx_lc_active_minus2+2는 LC에서 L0 또는 L1으로부터 선택되는 참조 픽처들의 개수를 특정한다. 상술한 ref_pic_list_combination_flag의 값이 1인 경우에는 LC를 사용하게 되는데, 참조 픽처의 개수가 1 이하일 때에는 LC를 생성하지 않고 기존의 참조 픽처 리스트를 사용하면 된다. 따라서, num_ref_idx_lc_active 의 값이 2 이상을 지시하도록 구성하고, minus2를 적용하여 시그널링할 수 있다.

ref_pic_list_modification_flag_lc는 L1, L2와 LC 사이의 매핑을 특정하는데 필요한 정보를 전달한다. 구체적으로, 1의 값을 갖는 ref_pic_list_modification_flag_lc는 LC의 엔트리들을 L0 및 L1의 엔트리들에 매핑하는 것을 특정하기 위한 신택스 요소 pic_from_list_0_flag 및 ref_idx_list_curr가 있다(present)는 것을 지시한다. 0의 값을 갖는 ref_pic_list_modification_flag_lc는 pic_from_list_0_flag 및 ref_idx_list_curr가 없다는 것을 지시하며, LC는 소정의 방법에 따라서 초기화될 수 있다.

pic_from_list_0_flag는 LC에 추가되는 현재 참조 픽처가 L0으로부터 추가되는 것인지 L1으로부터 추가되는지를 지시한다. 예컨대, pic_from_list_0_flag의 값이 1이면, 현재 참조 픽처는 L0으로부터의 참조 픽처이며, 현재 참조 픽처가 어떤 참조 픽처 리스트로부터 추가되는 것인지를 지시하는 변수 CurrRefPicList의 값은 L0을 지시하는 값으로 설정될 수 있다. pic_from_list_0_flag의 값이 0이면, 현재 참조 픽처는 L1으로부터의 참조 픽처이며, 변수 CurrRefPicList의 값은 L1을 지시하는 값으로 설정될 수 있다.

ref_idx_list_curr는 LC의 마지막에 첨부되는 CurrRefPicList에서 픽처의 참조 픽처 인덱스를 지시한다.

이하, 참조 픽처 리스트를 이용하는 인터 예측 방법에 대해 설명한다.

도 4는 본 발명에 따라서 인터 예측을 수행하는 방법을 개략적으로 설명하는 순서도이다. 도 4에 도시된 인터 예측의 방법은 본 발명이 적용되는 디코딩 장치 또는 디코딩 장치 내 소정의 유닛, 예컨대 예측부에서 수행될 수 있다. 여기서는 설명의 편의를 위해, 디코딩의 예측부가 예측을 수행하는 것으로 설명한다.

도 4를 참조하면, 디코딩 장치의 예측부는 현재 블록에 대한 인터 예측 방법을 결정한다(S410). 디코딩 장치의 예측부는 현재 블록에 적용되는 예측 방법인 인터 예측인지 인트라 예측인지를 결정한 후, 인터 예측인 경우에는 구체적인 인터 예측 방법을 결정할 수 있다. 인터 예측 방법은 현재 블록을 포함하는 CU 단위로 결정될 수도 있고, PU 단위 또는 TU 단위로 결정될 수도 있다.

현재 블록에 적용되는 인터 예측의 구체적인 방법이 무엇인지에 관한 정보는 인코딩 장치로부터 디코딩 장치로 전송될 수 있다. 예컨대, 인코딩 장치는 스킵 모드에 기반한 인터 예측이 적용되는지에 관한 플래그(예컨대, skip_flag), 머지 모드에 기반한 인터 예측이 적용되는지에 관한 플래그(예컨대, merge_flag), MVP(Motion Vector Prediction)에 기반한 인터 예측이 적용되는지에 관한 플래그(MVP_flag) 등을 전송할 수 있다.

또한, 스킵 모드에 기반한 인터 예측이 적용되는지에 관한 플래그(예컨대, skip_flag), 머지 모드에 기반한 인터 예측이 적용되는지에 관한 플래그(예컨대, merge_flag) 등이 전송되고 상기 플래그 등에 의해 스킵 모드 또는 머지 모드에 기반한 인터 예측이 적용되지 않는 것으로 판단되는 경우에는, MVP에 기반한 인터 예측이 적용되도록 할 수도 있다. 이때, 어떤 참조 픽처 리스트를 이용하여 MVP에 기반한 인터 예측이 적용되는지에 관한 정보도 인코딩 장치로부터 디코딩 장치로 전송될 수 있다.

디코딩 장치의 예측부는 인코딩 장치로부터 전송되는 정보에 기반해서, 현재 블록에 적용되는 인터 예측 방법이 스킵 모드에 기반한 인터 예측 방법인지, 머지 모드에 기반한 인터 예측 방법인지, 혹은 MVP(Motion Vector Predictor)에 기반한 인터 예측 방법인지를 결정할 수 있다.

디코딩 장치의 예측부는 현재 블록에 대한 움직임 정보를 유도한다(S420). 디코딩 장치의 예측부는 현재 블록에 적용되는 인터 예측 방법에 따라서, 현재 블록에 대한 움직임 정보를 유도할 수 있다.

스킵 모드(skip mode)에 기반한 인터 예측의 경우에는 현재 블록에 대한 움직임 정보가 전송되며, 그 외의 정보 예컨대 레지듀얼 신호에 대한 정보가 전송되지 않는다. 이때, 해당 블록에 대한 움직임 정보를 그대로 전송하지 않고, 해당 블록의 주변 블록 중 특정 주변 블록의 움직임 정보를 해당 블록의 움직임 정보로 사용하도록 하도록 할 수도 있다. 이 경우, 부호화기는 어떤 주변 블록의 움직임 정보를 사용할 것인지에 관해, 특정 블록을 지시하는 정보를 복호화기에 전송할 수 있다. 따라서, 디코딩 장치의 예측부는 부호화기로부터 수신한 정보가 지시하는 주변 블록의 움직임 정보를 현재 블록의 움직임 정보로서 이용할 수 있다.

머지 모드(merge mode)에 기반한 인터 예측의 경우에는 현재 블록에 대한 움직임 정보를 현재 블록에 인접한 이웃 블록의 예측 정보로부터 획득할 수 있다. 이때, 어느 주변 블록의 움직임 정보를 이용할 것인지에 관해서 해당 블록을 지시하는 정보(예컨대, 머지 인덱스)가 인코딩 장치로부터 디코딩 장치로 전송될 수 있다.

디코딩 장치의 예측부는 머지 모드에 기반한 인터 예측이 적용되는 경우에는, 인코딩 장치로부터 지시되는 주변 블록의 움직임 정보를 현재 블록의 움직임 정보로 이용할 수 있다.

머지 모드와 스킵 모드의 인터 예측에 있어서, 어느 주변 블록의 움직임 정보를 이용할 것인지를 지시하는 경우에, 현재 블록의 주변 블록들 중에서 소정의 블록들을 후보 블록들로서 설정할 수 있다.

인코딩 장치는 후보 블록들 중에서 어느 블록의 움직임 정보를 이용할 것인지를 디코딩 장치에 전송할 수 있다. 예컨대, 인코딩 장치는 후보 블록들로 구성된 후보 리스트 중에서 머지 대상이 되는 주변 블록을 지시하는 머지 인덱스를 전송할 수 있다. 디코딩 장치의 예측부는 머지 인덱스가 지시하는 주변 블록의 움직임 정보를 현재 블록의 움직임 정보로 이용할 수 있다. 예컨대, 디코딩 장치의 예측부는 인코딩 장치가 전송한 머지 인덱스가 상기 후보 리스트에서 지시하는 블록의 움직임 정보를 현재 블록의 움직임 정보로 이용할 수 있다.

MVP에 기반한 인터 예측의 경우에는 현재 블록의 주변 블록들 중에서 선택된 블록의 움직임 벡터를 현재 블록의 움직임 벡터 예측값으로 이용할 수 있다. 인코딩 장치는 움직임 벡터 예측값, 움직임 벡터 예측자와 현재 블록의 움직임 벡터 간의 차이에 해당하는 움직임 벡터 차이(Motion Vector Difference: MVD), 현재 블록에 대한 참조 픽처 인덱스 등의 예측 정보를 디코딩 장치에 전송할 수 있다. 전송되는 움직임 벡터 예측값을 움직임 벡터 예측(Motion Vector Prediction: MVP) 또는 움직임 벡터 예측자(Motion Vector Predictor: MVP)라고 한다.

이때, 현재 블록의 주변 블록들 중에서 소정의 블록들을 후보 블록들로 설정하고, 후보 블록들의 움직임 벡터들로 구성되는 리스트 상에서 현재 블록의 움직임 벡터 예측자로서 이용될 움직임 벡터가 지시되도록 할 수도 있다. 예컨대, 인코딩 장치는 어떤 블록의 움직임 벡터를 현재 블록의 움직임 벡터 예측자로 사용할 것인지를 지시하는 인덱스를 디코딩 장치에 전송할 수 있다.

디코딩 장치의 예측부는 수신한 정보를 기반으로 현재 블록에 대한 움직임 정보를 유도할 수 있다. 예컨대, 디코딩 장치의 예측부는 움직임 벡터 예측자와 움직임 벡터 차이를 기반으로 현재 블록의 움직임 벡터를 얻을 수 있고, 수신한 참조 픽처 인덱스를 현재 블록에 대한 참조 픽처 인덱스로 이용할 수 있다.

이때, 디코딩 장치의 예측부는 인코딩 장치가 전송한 인덱스가 후보 블록들의 움직임 정보로 구성된 리스트상에서 지시하는 움직임 정보를 현재 블록의 움직임 정보 예측자로서 이용할 수 있다.

한편, 스킵 모드에 기반한 인터 예측, 머지 모드에 기반한 인터 예측 그리고 MVP에 기반한 인터 예측에 있어서, 상술한 현재 블록의 주변 블록들 중 소정의 후보 블록들은 동일한 블록들일 수도 있다.

디코딩 장치의 예측부는 현재 블록에 대한 예측 블록을 생성한다(S430). 디코딩 장치의 예측부는 현재 블록에 대하여, 예측 샘플들로 구성되는 예측 블록을 생성할 수 있다.

디코딩 장치의 예측부는 각각의 인터 예측 방법에 따라서 획득한 현재 블록의 움직임 정보를 기반으로 현재 블록에 대한 예측 블록을 생성할 수 있다. 예컨대, 디코딩 장치의 예측부는 현재 블록의 움직임 정보 중 참조 픽처 인덱스가 지시하는 참조 픽처에서 움직임 벡터가 지시하는 영역의 샘플들을 현재 블록의 예측 샘플들로 이용할 수 있다. 움직임 벡터가 정수 샘플(integer sample)들을 지시하지 않는 경우에는 인터폴레이션(interpolation) 등을 통해 부분 샘플(fractional sample)들을 생성할 수 있다. 부분 샘플들은 쿼터-펠(quarter-pel) 단위로 생성될 수 있다. 이 경우에, 디코딩 장치의 예측부는 부분 샘플들로 구성된 예측 블록을 이용하여 현재 블록을 복원할 수 있다.

한편, 디코딩 장치의 예측부는 참조 픽처 인덱스와 움직임 벡터를 기반으로 생성한 샘플 블록에 대해 가중치 예측(weighted prediction)을 수행할 수 있다. 디코딩 장치의 예측부는 가중치 예측을 통해서 영상 시퀀스(video sequence)에 대한 일루미네이션 변화(illumination variation)을 보상하고 예측의 정확도를 높일 수 있다.

디코딩 장치의 예측부는 참조 픽처 인덱스와 움직임 벡터를 기반으로 생성한 샘플 블록에 가중치를 부여하여 예측 샘플을 생성하고, 각 예측 샘플들의 어레이(array)인 예측 블록을 생성할 수 있다.

P 슬라이스에 대해서, 가중치는 명시적인(explicit) 방법으로 적용될 수 있다. 가중치를 명시적으로 적용하는 경우에, 디코딩 장치의 예측부는 인코딩 장치로부터 전송된 가중치 정보를 기반으로 가중치를 부여하여 예측 블록을 생성할 수 있다. 인코딩 장치는 가중치를 명시적으로 적용할 것인지를 지시하는 정보를 디코딩 장치에 전송할 수 있다. 가중치를 명시적으로 적용할 것인지를 지시하는 정보는 각 픽처 단위로 전송될 수도 있다. 디코딩 장치의 예측부는 가중치를 명시적으로 적용하지 않는 경우에, 소정의 디폴트(default) 가중치를 적용할 수도 있다.

B 슬라이스에 대해서, 가중치는 명시적인(explicit) 방법으로 적용될 수도 있고, 묵시적인(implicit) 방법으로 적용될 수도 있다. 가중치를 명시적으로 적용하는 경우에, 디코딩 장치의 예측부는 인코딩 장치로부터 명시적으로 전송된 가중치 정보를 기반으로 가중치를 부여하여 예측 블록을 생성할 수 있다. 가중치를 묵시적으로 적용하는 경우에, 디코딩 장치의 예측부는 가중치를 소정의 방법으로 유도하고, 유도된 가중치를 부여하여 예측 블록을 생성할 수 있다. 이때, 현재 픽처와 참조 픽처 사이의 거리를 기반으로 가중치를 유도할 수 있다. 또한, 디코딩 장치의 예측부는 가중치가 명시적 또는 묵시적으로 적용되지 않는 경우에 소정의 디폴트 가중치를 적용할 수도 있다. 인코딩 장치는 가중치를 명시적으로 적용할 것인지 묵시적으로 적용할 것인지 혹은 디폴트 가중치를 적용할 것인지를 지시하는 정보를 디코딩 장치에 전송할 수 있다. 가중치를 명시적으로 적용할 것인지 묵시적으로 적용할 것인지 혹은 디폴트 가중치를 적용할 것인지를 지시하는 정보는 각 픽처 단위로 전송될 수도 있다.

디코딩 장치의 예측부는 현재 블록을 복원한다(S440). 디코딩 장치의 예측부는 예측 블록을 기반으로 현재 블록을 복원한다.

예컨대, 레지듀얼 블록을 전송하지 않는 스킵 모드에 기반한 인터 예측의 경우에, 디코딩 장치의 예측부는 예측 블록을 복원된 현재 블록으로 이용할 수 있다. 레지듀얼 블록이 전송되는 머지 모드 또는 MVP에 기반한 인터 예측의 경우에, 디코딩 장치의 예측부는 예측 블록에 레지듀얼 블록을 더하여 현재 블록을 복원할 수 있다.

디코딩 장치의 예측부는 현재 픽처를 복원하기 위하여, 복원된 블록들에 대하여 디블록킹 필터, SAO(Sample Adaptive Offset), ALF(Adaptive Loop Filter) 중 적어도 하나를 추가로 적용할 수도 있다.

한편, 디코딩 장치의 예측부에서 예측을 수행하는데 필요한 정보는 인코딩 장치로부터 시그널링될 수 있다. 예컨대, 현재 블록에 인트라 예측이 적용되는지, 인터 예측이 적용되는지, 인터 예측이 적용된다면 구체적인 인터 예측 방법은 무엇인지, 인트라 예측이 적용된다면 인트라 예측 모드는 무엇인지 등의 정보가 시그널링될 수 있다.

또한, 디코딩 장치의 예측부는 예측에 필요한 정보를 다른 정보들로부터 유도할 수도 있다. 예측에 필요한 정보를 유도해 내기 위해 필요한 정보는 인코딩 장치로부터 디코딩 장치에 시그널링될 수도 있다.

인터 예측의 예측 모드로는 Pred_L0, Pred_L1, Pred_Bi, Pred_LC 등이 있다. Pred_L0은 L0의 참조 프레임(참조 픽처)을 이용하는 인터 예측 방법이고, Pred_L1은 L1의 참조 프레임(참조 픽처)을 이용하는 인터 예측 방법이며, Pred_Bi는 L0의 참조 프레임(참조 픽처)과 L1의 참조 프레임(참조 픽처)를 이용하는 인터 예측 방법이다. L0과 L1이 같은 슬라이스를 후술하는 바와 같이, 설명의 편의를 위해 GPB(Generalized P and B) 슬라이스 라고도 한다.

Pred_LC는 L0와 L1로부터 조합되는 LC를 이용하는 인터 예측 방법이다.

L0과 L1을 모두 이용하는 경우에는, Pred_Bi인지 Pred_LC인지를 구별하여 시그널링할 수도 있다. 현재 블록의 인터 예측 모드가 Pred_LC인 경우에는 LC의 참조 픽처 인덱스를 시그널링한다. 현재 블록의 인터 예측 모드가 Pred_Bi인 경우에는 L0과 L1 각각의 참조 픽처 인덱스를 시그널링할 수 있다. 현재 블록의 인터 예측 모드가 Pred_Bi일 때 L0을 사용하는 경우와 L1을 사용하는 경우를 구분하여, 예측에 사용되는 참조 픽처 리스트 및 참조 픽처 리스트와 관련된 예측 정보를 시그널링할 수도 있다.

한편, 슬라이스 타입(픽처 타입)이 B 슬라이스(B 픽처)일 때, 순방향(forward) 참조 픽처 리스트의 구조와 역방향(backward) 참조 픽처 리스트의 구조가 동일한 경우가 있다. 다시 말하면, B 슬라이스의 예측에 사용되는 L0과 L1이 동일한 경우가 있다. 슬라이스 타입이 B 슬라이스이고 L0과 L1이 동일한 슬라이스(픽처)를 상술한 바와 같이 GPB 슬라이스(픽처)라고 한다.

B 슬라이스에서 L0과 L1이 동일한지 아닌지를 구분하기 위해, 상술한 ref_pic_list_combination_flag를 이용할 수 있다. ref_pic_list_combination_flag 의 값이 1인 경우는 L0과 L1이 상이하며, L0과 L1을 이용하여 LC가 추가로 조합된다. ref_pic_list_combination_flag 의 값이 0인 경우는 L0과 L1이 동일하다.

L0과 L1이 동일한 B 슬라이스의 경우는, 일반적인 B 슬라이스의 경우보다 인터 예측에 필요한 정보가 중복되는 경우가 많을 수 있다. 예컨대, 시그널링되는 정보들 중에서, L0을 이용하는 인터 예측에 필요한 정보가 L1을 이용한 정보와 동일한 경우가 많을 수 있다. 따라서, L0과 L1의 동일성 여부에 기반하여 효율적인 전송을 위한 비트스트림을 고려할 필요가 있다.

더 구체적으로 설명하자면, 참조 픽처 리스트를 이용하는 인터 예측의 경우, P 슬라이스에 대하여 L0을 사용하는 예측 모드 Pred_L0, B 슬라이스에서 수행되는 쌍예측 모드 Pred_BI, B 슬라이스에서 LC를 사용하는 예측 모드 Pred_LC 등이 적용될 수 있다. 효율적인 전송을 위해서, 인코딩 장치는 각 예측 모드에 따라 필요한 정보를 구분해서 전송할 수 있다.

예컨대, 슬라이스 타입이 B 슬라이스이고 L0와 L1이 동일한 GPB 슬라이스의 경우에는 인터 예측에 필요한 정보 중, L0에 관한 정보와 중복되는 L1에 관한 정보는 시그널링하지 않을 수 있다. 이 경우, L0와 L1의 동일성 여부에 기반해서, 정보의 중복 전송을 막을 수도 있다. 여기서, L0에 대한 정보는 L0 자체에 대한 정보뿐만 아니라, 디코딩 장치가 L0을 이용하여 디코딩을 수행하기 위해 필요한 정보를 포함한다. 또한, L1에 대한 정보는 L1 자체에 대한 정보뿐만 아니라, 디코딩 장치가 L1을 이용하여 디코딩을 수행하기 위해 필요한 정보를 포함한다.

표 5는 본 발명에 따라서 L0과 L1이 동일한지 여부에 기반해서 L1에 관한 정보를 전송하는 신택스 구조의 일 예를 개략적으로 나타낸 것이다. 표 5의 신택스 구조는 소정의 정보를 전송하는 특정 신택스의 일 부분일 수 있다.

<표 5>

표 5를 참조하면, 슬라이스 타입이 B 슬라이스이고 L0과 L1이 동일하지 않은 경우(ref_pic_list_combination_flag의 값이 0이 아닌 경우)에 L1에 대한 정보가 전송된다.

한편, 표 5의 예에서는 L1에 관한 정보가 전송되는 경우, ref_pic_list_combination_flag의 값이 1이므로, LC를 이용한 예측이 수행된다. 따라서, 인코딩 장치는 LC를 조합할 수 있도록, 그리고 조합된 LC를 이용하여 예측을 수행할 수 있도록, L1에 관한 정보를 구성하여 L1에 관한 신택스 요소로서 전송할 수 있다. 이때, L0에 대한 신택스 요소는 해당 신택스 내에서 별도로 전송될 수 있다. 디코딩 장치는 L0에 대한 신택스 요소와 L1에 대한 신택스 요소에 기반해서, L0과 L1으로부터 LC를 조합할 수 있다.

이와 관련해서, ref_pic_list_combination_flag의 값이 1일 때, 표 5와 같이 L1에 관한 정보를 전송하지 않고, LC에 관한 정보를 전송하도록 할 수도 있다.

표 6은 본 발명에 따라서 L0과 L1이 동일한지 여부에 기반해서 L1에 관한 정보를 전송하는 신택스 구조의 일 예를 개략적으로 나타낸 것이다. 표 6의 신택스 구조는 소정의 정보를 전송하는 특정 신택스의 일 부분일 수 있다.

<표 6>

표 6을 참조하면, 슬라이스 타입이 B 슬라이스인 경우 L0과 L1이 동일하지 않으며 L0과 L1으로부터 LC가 조합되는 경우(ref_pic_list_combination_flag의 값이 1인 경우)에 LC에 대한 정보가 전송된다.

한편, L0과 L1이 동일한 경우(GPB 슬라이스)에도 L0에 대한 정보와 L1에 대한 정보를 구분해서 전송할 필요가 있을 수 있다. 가령, 가중치 예측의 경우는, 가중치와 오프셋 등 디코딩 과정에서 필요한 정보가 L0을 사용하는 예측의 경우와 L1의 사용하는 예측의 경우에 상이할 수 있다.

표 5와 표 6의 경우에서 설명한 바와 같이, 본 발명에 따라서 L0과 L1이 동일한 경우에는, 중복되는 정보는 전송하지 않더라도 중복되지 않는 정보를 전송할 수도 있다.

구체적으로, 표 5와 표 6의 구조가 이용되는 신택스에서, L0과 L1이 동일하면 L0에 대한 정보를 L1에 대한 정보로서 이용할 수 있는 경우 혹은 L0에 관한 정보만으로 예측을 수행할 수 있는 경우에는 L1 자체에 대한 정보뿐만 아니라 L1에 관한 정보도 전송하지 않을 수 있다. 이때, 디코딩 장치는 해당 신택스에서 L0에 관한 정보를 L1에 관해서 그대로 적용할 수 있다.

예컨대, L0을 이용하는 예측에서 현재 블록에 적용되는 움직임 벡터 예측자나 참조 픽처 인덱스가 L1을 이용하는 예측의 경우와 동일하다면, L1을 이용하는 예측에 대하여 현재 블록에 적용되는 움직임 벡터 예측자나 참조 픽처 인덱스에 관한 정보를 전송하지 않을 수 있다. 이 경우에는 L0을 이용하는 예측에서 현재 블록에 적용되는 움직임 벡터 예측자나 참조 픽처 인덱스를 L1을 이용하는 예측에 그대로 적용하도록 할 수도 있고, L0만으로 현재 블록에 대한 예측을 수행할 수도 있다.

이와 달리, 표 5와 표 6의 신택스 구조가 이용되는 신택스에서, L0과 L1이 동일한 GPB의 경우라도 L0에 대한 정보와 L1에 대한 정보가 상이할 수 있다면, L1에 관한 정보를 전송하도록 할 수 있다. 예컨대, 가중치 예측에 있어서, L0과 L1이 동일하여도 L0 예측에 대한 가중치 또는 오프셋이 L1 예측에 대한 가중치 또는 오프셋과 상이할 수 있다면, GPB의 경우(슬라이스 타입이 B 슬라이스이고 L0과 L1 같은 경우)에도 L0에 대한 가중치 및 오프셋과 별도로 L1에 대한 가중치 및 오프셋을 전송할 수 있다.

표 7은 본 발명에 따라서 전송되는 가중치 예측에 대한 신택스의 일 예를 개략적으로 나타낸 것이다. 표 7에서는 슬라이스 타입이 B 슬라이스이고 L0과 L1이 상이한 경우(ref_pic_list_combination_flag의 값이 1인 경우)에 LC를 구성하고 LC를 이용하여 가중치 예측을 수행하기 위해 L1에 관한 정보가 전송되는 것을 설명하고 있다.

<표 7>

표 7을 참조하면, 별도로 전송되는 L0에 대한 정보와 달리, L1에 대한 정보, 예컨대 luma_weight_l1_flag, luma_weight_l1, luma_offset_l1, chroma_weight_l1_flag, chroma_weight_l1, chroma_offset_l1 등은 슬라이스 타입이 B 슬라이스이고 L0과 L1이 상이한 경우(ref_pic_list_combination_flag의 값이 1인 경우)에 전송된다.

표 7에서, luma_log2_weight_denom은 모든 루마 가중치 팩터(luma weighting factor)들에 대한 디노미네이터(denominator)를 베이스 2의 로그값으로 나타낸 것이다. luma_log2_weight_denom의 값은, 예컨대 0 이상 7 이하의 값을 가질 수 있다.

chroma_log2_weight_denom은 모든 크로마 가중치 팩터(chroma weighting factor)들에 대한 디노미네이터(denominator)를 베이스 2의 로그값으로 나타낸 것이다. chroma _log2_weight_denom의 값은, 예컨대 0 이상 7 이하의 값을 가질 수 있다.

luma_weight_l0_flag은 루마 성분의 L0 예측에 대한 가중치 팩터들이 존재하는지를 지시한다. 예컨대, luma_weight_l0_flag의 값이 1이면, L0의 루마 성분(component)에 대한 가중치 팩터들이 존재한다(present)는 것을 지시한다. luma_weight_l0_flag의 값이 0이면, L0의 루마 성분(component)에 대한 가중치 팩터들이 존재하지 않는다는 것을 지시한다.

luma_weight_l0[ i ]는 인덱스 i가 참조 픽처 리스트 L0에서 지시하는 참조 픽처 RefPicList0[ i ]를 이용하는 L0 예측에 대하여, 루마 예측 값에 적용되는 가중치 팩터이다. luma_weight_l0_flag의 값이 1이면, luma_weight_l0[ i ]의 값은 -128 이상 127 이하의 범위에 있다. luma_weight_l0_flag의 값이 0이면, luma_weight_l0[ i ]은 참조 픽처 RefPicList0[ i ]에 대하여 2^{luma_log2_weight_denom} 와 같다고 추정(infer)된다.

luma_offset_l0[ i ]는 인덱스 i가 참조 픽처 리스트 L0에서 지시하는 참조 픽처 RefPicList0[ i ]를 이용하는 L0 예측에 대하여 부가적인(additive) 오프셋이다. luma_offset_l0[ i ]의 값은 -128 이상 127 이하의 범위에 있다. luma_weight_l0_flag의 값이 0이면, luma_offset_l0[ i ] 은 참조 픽처 RefPicList0[ i ]에 대하여, 0으로 추정(infer)된다.

chroma_weight_l0_flag은 크로마 성분의 L0 예측에 대한 가중치 팩터들이 존재하는지를 지시한다. 예컨대, chroma_weight_l0_flag의 값이 1이면, L0의 크로마 성분(component)에 대한 가중치 팩터들이 존재한다(present)는 것을 지시한다. chroma_weight_l0_flag의 값이 0이면, L0의 크로마 성분(component)에 대한 가중치 팩터들이 존재하지 않는다는 것을 지시한다.

chroma_weight_l0[ i ][ j ]은 참조 픽처 리스트 L0에서 인덱스 i가 지시하는 참조 픽처 RefPicList0[ i ]를 이용하는 L0 예측에 대하여, 크로마 예측 값에 적용되는 가중치 팩터이다. 여기서 인덱스 j는 가중치 팩터가 Cr에 대한 것인지 Cb에 대한 것인지를 지시한다. 예컨대, j의 값이 0이면 Cb에 대한 가중치 팩터임을 나타내고, j의 값이 1이면 Cr에 대한 가중치 팩터임을 나타낸다. chroma_weight_l0_flag의 값이 1이면, chroma_weight_l0[ i ][ j ]의 값은 -128 이상 127 이하의 범위에 있다. chroma_weight_l0_flag의 값이 0이면, chroma_weight_l0[ i ][ j ]은 참조 픽처 RefPicList0[ i ]에 대하여 2^{chroma_log2_weight_denom} 와 같다고 추정(infer)된다.

chroma_offset_l0[ i ][ j ]은 참조 픽처 리스트 L0에서 인덱스 i가 지시하는 참조 픽처 RefPicList0[ i ]를 이용하는 L0 예측에 대하여, 크로마 예측 값에 적용되는 부가적인(additive) 오프셋이다. 여기서 인덱스 j는 가중치 팩터가 Cr에 대한 것인지 Cb에 대한 것인지를 지시한다. 예컨대, j의 값이 0이면 Cb에 대한 오프셋임을 나타내고, j의 값이 1이면 Cr에 대한 오프셋임을 나타낸다. chroma_offset_l0[ i ][ j ]의 값은 -128 이상 127 이하의 범위에 있다. chroma_weight_l0_flag의 값이 0이면, chroma_offset_l0[ i ][ j ]은 참조 픽처 RefPicList0[ i ]에 대하여 0과 같다고 추정(infer)된다.

luma_weight_l1_flag, luma_weight_l1, luma_offset_l1, chroma_weight_l1_flag, chroma_weight_l1, chroma_offset_l1는 상술한 luma_weight_l0_flag, luma_weight_l0, luma_offset_l0, chroma_weight_l0_flag, chroma_weight_l0, chroma_offset_l0과 각각 동일한 의미(semantics)이되, 참조 픽처 리스트 L0을 나타내는 l0, list 0 및 List0을 참조 픽처 리스트 L1을 나타내는 l1, list 1 및 List1로 각각 대체한 것이다.

디코딩 장치는 수신한 L1에 관한 정보를 L0에 대한 정보와 조합하며, LC를 추가로 조합하고, 조합된 LC의 엔트리(entry)가 L0으로부터의 엔트리이면 L0에 관한 정보를 적용하고, 조합된 LC의 엔트리가 L1으로부터의 엔트리이면 L1에 관한 정보를 적용할 수도 있다. LC의 엔트리와 L0 및 L1의 엔트리 사이의 관계는 도 3에서 설명한 바와 같이, 미리 결정된 매핑 관계를 기반으로 판단될 수 있다.

여기서, 단순히 LC를 조합하기 위한 L0과 L1의 정보는 별도로 전송될 수도 있다. 예를 들어, LC의 조합에 필요한 정보는 상술한 표 4의 신택스를 이용하여 전송될 수도 있다.

표 7의 예에서는 L1과 L0이 상이한 경우에 LC를 이용한 가중치 예측의 수행에 필요한 정보를 전송한다. 이와 관련해서, 앞서 설명한 바와 같이, L0과 L1이 동일한 경우에, 가중치 예측 신택스로 전송되는 정보들이 L0과 L1에 대하여 동일하다면, 인코딩 장치는 가중치 예측에 대하여 L1에 관한 정보를 전송하지 않고, 디코딩 장치는 가중치 예측에 대하여 L0에 관한 정보를 L1에 관하여도 동일하게 적용할 수 있다.

반면에, L0과 L1이 동일해도 가중치 예측에 있어서 L0에 관한 정보(예컨대, L0 가중치 예측 플래그, 가중치 또는 오프셋 등)와 L1에 관한 정보(예컨대, L1 가중치 예측 플래그, 가중치 또는 오프셋 등)가 상이할 수도 있다. 이 경우에는 L0과 L1이 동일함에도 L1에 관한 정보(예컨대, L1 가중치 예측 플래그, 가중치 또는 오프셋 등)을 별도로 전송할 수도 있다.

표 8은 본 발명에 따라서 전송되는 가중치 예측 신택스의 다른 예를 개략적으로 나타낸 것이다. 표 8의 예에서는 L0과 L1이 동일하여도 가중치 예측에 있어서 L0에 관한 정보(예컨대, L0 가중치 예측 플래그, 가중치 또는 오프셋 등)와 L1에 관한 정보(예컨대, L1 가중치 예측 플래그, 가중치 또는 오프셋 등)가 상이한 경우에, L1에 관한 정보를 전송하는 경우를 설명하고 있다.

<표 8>

표 8은 슬라이스 타입이 B 슬라이스인 경우에 대해서만 예시를 하고 있으며, 슬라이스 타입이 P 슬라이스인 경우에 가중치 예측을 위한 정보도 표 8에 표시되지는 않았지만, 함께 전송될 수 있다.

표 8에서, delta_chroma_log2_weight_denom은 모든 크로마 가중치 팩터(luma weighting factor)들에 대한 디노미네이터(denominator)의 베이스 2 로그값의 차이를 나타낸다. 모든 크로마 가중치 팩터(luma weighting factor)들에 대한 디노미네이터(denominator)의 베이스 2 로그값을 나타내는 chroma_log2_weight_denom는 luma_log2_weight_denom와 delta_chroma_log2_weight_denom의 합으로 특정된다. chroma_log2_weight_denom는 0 이상 7 이하의 값을 가질 수 있다.

delta_luma_weight_l0[ i ] 는 인덱스 i가 참조 픽처 리스트 L0에서 지시하는 참조 픽처 RefPicList1[ i ]를 이용하는 L0 예측에 대하여, 루마 예측 값에 적용되는 가중치 팩터의 차이값이다.

루마 예측에 사용되는 가중치 팩처 luma_weight_l0[ i ]는 (1 << luma_log2_weight_denom ) + delta_luma_weight_l0[ i ]에 의해 특정된다. luma_log2_weight_denom은 루마 가중치 팩터들에 대한 디노미네이터(denominator)를 베이스 2의 로그값으로 나타낸 것이다.

여기서는 루마 예측 값에 적용되는 가중치 팩터의 차이값을 전송하지만, 루마 가중치 팩터 luma_weight_l0[ i ]를 전송할 수도 있다.

delta_chroma_weight_l0[ i ][ j ]는 인덱스 i가 참조 픽처 리스트 L0에서 지시하는 참조 픽처 RefPicList0[ i ]를 이용하는 L0 예측에 대하여, 크로마 예측 값에 적용되는 가중치 팩터의 차이값이다. 인덱스 j는 가중치 팩터의 차이값이 Cr에 대한 것인지 Cb에 대한 것인지를 지시한다. 예컨대, j의 값이 0이면 Cb에 대한 가중치 팩터의 차이값이라는 것을 나타내고, j의 값이 1이면 Cr에 대한 가중치 팩터의 차이값이라는 것을 나타낸다.

크로마 예측에 사용되는 가중치 팩처 chroma_weight_l0[ i ][ j ]는 (1 << Chroma_log2_weight_denom ) + delta_chroma_weight_l0[ i ][ j ]에 의해 특정된다. Chroma_log2_weight_denom은 크로마 가중치 팩터들에 대한 디노미네이터(denominator)를 베이스 2의 로그값으로 나타낸 것이다.

여기서는 크로마 예측 값에 적용되는 가중치 팩터의 차이값을 전송하고 가중치 팩터의 차이값을 기반으로 크로마 가중치 팩터를 유도하는 경우를 예로서 설명하지만, 크로마 가중치 팩터 chroma_weight_l0[ i ][ j ]를 전송하도록 할 수도 있다.

delta_chroma_offset_l0[ i ][ j ]는 인덱스 i가 참조 픽처 리스트 L0에서 지시하는 참조 픽처 RefPicList0[ i ]를 이용하는 L0 예측에 대하여, 크로마 예측 값에 적용되는 오프셋의 차이값이다. 인덱스 j는 오프셋의 차이값이 Cr에 대한 것인지 Cb에 대한 것인지를 지시한다. 예컨대, j의 값이 0이면 Cb에 대한 오프셋의 차이값이라는 것을 나타내고, j의 값이 1이면 Cr에 대한 오프셋의 차이값이라는 것을 나타낸다. 크로마 예측에 사용되는 오프셋의 값 chroma_offset_l0[ i ][ j ]은 크로마 오프셋의 차이값을 기반으로 특정될 수 있다.

여기서는 크로마 예측에 적용되는 오프셋의 차이값을 전송하고 이를 기반으로 크로마 오프셋을 유도하는 것을 예로서 설명하지만, 크로마 오프셋 chroma_offset_l0[ i ][ j ]을 전송하도록 할 수도 있다.

delta_luma_weight_l1[ i ], delta_chroma_weight_l1[ i ][ j ], delta_chroma_offset_l1[ i ][ j ]는 상술한 delta_luma_weight_l0[ i ], delta_chroma_weight_l0[ i ][ j ], delta_chroma_offset_l0[ i ][ j ]과 각각 동일한 의미(semantics)이되, 참조 픽처 리스트 L0을 나타내는 l0, list 0 및 List0을 참조 픽처 리스트 L1을 나타내는 l1, list 1 및 List1로 각각 대체한 것이다.

또한, luma_log2_weight_denom, luma_weight_l0_flag, luma_offset_l0[ i ], chroma_weight_l0_flag, chroma_offset_l0[ i ][ j ], luma_weight_l1_flag, luma_offset_l1, chroma_weight_l1_flag, chroma_weight_l1, chroma_offset_l1의 구체적인 내용은 표 7에서 설명한 바와 같다.

표 8을 참조하면, 슬라이스 타입이 B이고, LC를 조합하여 가중치 예측을 수행하는 경우가 아니면(slice_type == B ＆＆ ref_pic_list_combination_flag == 0), L0에 대한 가중치 예측 정보와 L1에 대한 가중치 예측 정보가 각각 전송된다.

또한, 슬라이스 타입이 B 이고, LC를 조합하여 가중치 예측을 수행하는 경우에는, LC를 조합하여 가중치 예측을 수행하기 위해 L1에 대한 정보가 전송된다. 이 경우에 전송되는 L1에 대한 정보는 LC를 이용하여 가중치 예측을 수행할 때, LC의 엔트리(예컨대, 참조 픽처) 중에서 L1으로부터의 엔트리(예컨대, 참조 픽처)에 대해 적용될 수 있는 가중치, 오프셋 등을 포함한다.

표 8의 예에서는 LC를 이용하기 위해서 L1에 관한 정보를 전송하는 경우를 설명하였으나, 이와 달리 LC를 이용하기 위해서 LC에 관한 정보를 전송할 수도 있다.

표 9는 본 발명에 따라서 전송되는 가중치 예측 신택스의 또 다른 예를 개략적으로 나타낸 것이다. 표 9의 예에서는 L0과 L1이 동일하여도 가중치 예측에 있어서 L0에 관한 정보(예컨대, L0 가중치 예측 플래그, 가중치 또는 오프셋 등)와 L1에 관한 정보(예컨대, L1 가중치 예측 플래그, 가중치 또는 오프셋 등)를 전송하며, LC를 이용하는 경우에는 LC에 관한 정보를 전송한다.

<표 9>

표 9는 슬라이스 타입이 B 슬라이스인 경우에 대해서만 예시를 하고 있으며, 슬라이스 타입이 P 슬라이스인 경우에 가중치 예측을 위한 정보도 표 9에 표시되지는 않았지만, 함께 전송될 수 있다.

표 9에서, luma_weight_lc_flag, delta_luma_weight_lc[ i ], luma_offset_lc[ i ], chroma_weight_lc_flag, chroma_weight_lc, chroma_offset_lcluma_weight_l1_flag는 상술한 luma_weight_lc_flag, delta_luma_weight_lc[ i ], luma_offset_lc[ i ], chroma_weight_lc_flag, chroma_weight_lc, chroma_offset_lcluma_weight_l1_flag과 각각 동일한 의미(semantics)이되, 참조 픽처 리스트 L0을 나타내는 l0을 참조 픽처 리스트 LC를 나타내는 lc로 각각 대체한 것이다.

또한, luma_log2_weight_denom, delta_chroma_log2_weight_denom, luma_weight_l0_flag, delta_luma_weight_l0[ i ], delta_chroma_weight_l0[ i ][ j ], delta_chroma_offset_l0[ i ][ j ], luma_offset_l0[ i ], delta_chroma_weight_l0_flag, luma_weight_l0_flag, delta_luma_weight_l0[ i ], delta_chroma_weight_l0[ i ][ j ], delta_chroma_offset_l0[ i ][ j ] luma_offset_l0[ i ], delta_chroma_weight_l0_flag, delta_chroma_offset_l0[ i ][ j ], delta_chroma_offset_l0[ i ][ j ], luma_weight_l1_flag, delta_luma_weight_l1[ i ], delta_chroma_weight_l1[ i ][ j ], delta_chroma_offset_l1[ i ][ j ], luma_offset_l1[ i ], delta_chroma_weight_l1_flag, delta_chroma_offset_l1[ i ][ j ] 등의 구체적인 내용은 표 6 및 표 7에서 설명한 바와 같다.

delta_luma_weight_l1[ i ] 는 인덱스 i가 참조 픽처 리스트 L1에서 지시하는 참조 픽처 RefPicList1[ i ]를 이용하는 L1 예측에 대하여, 루마 예측 값에 적용되는 가중치 팩터의 차이값이다.

표 9를 참조하면, 슬라이스 타입이 B이고, LC를 조합하여 가중치 예측을 수행하는 경우가 아니면(slice_type == B ＆＆ ref_pic_list_combination_flag == 0), L0에 대한 가중치 예측 정보와 L1에 대한 가중치 예측 정보가 각각 전송된다.

한편, 예측 유닛 레벨에서 움직임 정보를 파싱(parsing)하는 경우에는, B 슬라이스에 대하여, 일반적인(normal) B 슬라이스인지 L0과 L1이 동일한 GPB 슬라이스인지를 구분할 필요가 있다. 예컨대, GPB 슬라이스인 경우에는 L0과 L1이 동일하므로, LC를 조합하지 않고 L0에 관한 정보만으로 예측을 수행할 수 있다.

따라서, 일반적인 B 슬라이스인지 GPB 슬라이스인지의 구분에 기반해서, LC를 이용한 움직임 정보인지 아닌지를 정확하게 판단할 수 있다.

표 10은 본 발명에 따라서 슬라이스 타입을 구분해서 LC를 이용하는 인터 예측에 관한 정보를 전송하는 예측 유닛 레벨의 신택스 구조에 관한 일 예를 개략적으로 나타낸 것이다.

<표 10>

표 10을 참조하면, LC에 관한 추가적인 정보는 예측 모드가 LC를 이용하는 Pred_LC이고, 슬라이스 타입이 GPB가 아닌 경우에 전송된다. LC를 이용하는 예측 모드가 아니거나, L0에 관한 정보를 그대로 이용할 수 있는 경우에는 LC에 관한 정보를 추가로 전송하지 않을 수 있다.

표 11은 본 발명에 따라서 슬라이스 타입을 구분하여 LC를 이용하는 인터 예측에 관한 정보를 전송할 때, 예측 유닛 레벨에서 전송되는 LC에 관한 신택스의 일 예를 개략적으로 나타낸 것이다.

<표 11>

표 11을 참조하면, LC에 관한 추가적인 신택스 요소(syntax elements)는 예측 모드가 LC를 이용하는 Pred_LC이고, 슬라이스 타입이 GPB가 아닌 경우에 전송된다. LC를 이용하는 예측 모드가 아니거나, L0에 관한 정보를 그대로 이용할 수 있는 경우에는 LC에 관한 정보를 추가로 전송하지 않을 수 있다.

num_ref_idx_lc_active_minus1 +1은 LC를 구성하는 유효한 참조 픽처의 개수를 특정한다. 또한, NumMVPCand(LcToLx)는 LC를 이용하는 경우에 대한 움직임 벡터 예측자의 개수를 특정한다.

L0과 L1으로부터 선택되어 LC를 구성하는 참조 픽처가 1인 경우에는, 굳이 LC를 구성하지 않고 L0 또는 L1을 그대로 이용할 수 있다. 따라서, 표 9에서 LC에 관한 정보들은 LC를 구성하는 참조 픽처들의 개수가 2 이상인 경우에 전송된다.

ref_idx_lc[ x0 ][ y0 ]는 현재 예측 유닛에 대한 LC 참조 픽처 인덱스를 특정한다 어레이 인덱스 x0과 y0는 픽처의 좌상 루마 샘플에 대한 (relative to the top-left luma sample of the picture) 대상 예측 블록의 좌상 루마 샘플의 위치 ( x0, y0 )를 특정한다.

mvd_lc[ x0 ][ y0 ][ compIdx ]는 이용되는 LC 벡터 성분과 그 예측(prediction) 사이의 차를 특정한다. 어레이 인덱스 x0과 y0는 픽처의 좌상 루마 샘플에 대한 (relative to the top-left luma sample of the picture) 대상 예측 블록의 좌상 루마 샘플의 위치 ( x0, y0 )를 특정한다. 수평 움직임 벡터 성분 차이(the horizontal motion vector component difference)에는 compIdx = 0가 할당되며, 수직 움직임 벡터 성분 차이에는 compIdx = 1이 할당된다.

두 성분의 어느 것이든 존재하지 않는(not present) 경우에, 추정되는 값은 0과 같다.

mvp_idx_lc[ x0 ][ y0]은 LC 움직임 벡터 예측자를 특정한다. 어레이 인덱스 x0과 y0는 픽처의 좌상 루마 샘플에 대한 (relative to the top-left luma sample of the picture) 대상 예측 블록의 좌상 루마 샘플의 위치 ( x0, y0 )를 특정한다.

표 12는 본 발명에 따라서 예측 유닛 레벨에서 정보를 시그널링하는데 이용되는 신택스 구조의 일 예로서, 전체 예측 유닛 신택스를 개략적으로 나타낸 것이다.

<표 12>

표 12를 참조하면, 인터 예측 모드가 LC를 이용하는 예측 모드(inter_pred_flag[ x0 ][ y0 ] == Pred_LC)이고, 추가적으로 LC가 구성되는 경우 (ref_pic_list_combination_flag !=0)에 LC에 관한 정보를 전송한다. L0과 L1이 동일한 경우(ref_pic_list_combination_flag = 0)에는 LC에 대한 정보를 별도로 전송하지 않고 L0을 LC로서 이용할 수 있다.

표 12의 예에 따른 신택스에서, mvp_idx_l0[ x0 ][ y0 ]는 L0의 움직임 벡터 예측자인덱스(the motion vector predictor index)를 지시한다. 여기서, x0과 y0는 픽처의 좌상(top-left) 루마 샘플에 대한 대상 예측 블록(considered prediction block)의 좌상(top-left) 루마 샘플의 위치 ( x0, y0 )를 특정한다. mvp_idx_l0[ x0 ][ y0 ] 가 존재하지 않는 경우에, mvp_idx_l0[ x0 ][ y0 ]은 0과 같은 값인 것으로 추정(infer)된다.

mvp_idx_l1[ x0 ][ y0 ]는 mvp_idx_l0과 동일한 의미(semantics)를 가지되, 참조 픽처 리스트 L0을 나타내는 l0 및 list 0가 참조 픽처 리스트 L1을 나타내는 l1 및 list 1로 각각 대치된다.

mvp_idx_lc[ x0 ][ y0 ]는 mvp_idx_l0과 동일한 의미(semantics)를 가지되, 참조 픽처 리스트 L0을 나타내는 l0 및 list 0가 참조 픽처 리스트 조합 LC을 나타내는 lc 및 list combination으로 각각 대치된다.

prev_intra_luma_pred_flag[ x0 ][ y0 ], mpm_idx[ x0 ][ y0 ] 및 rem_intra_luma_pred_mode[ x0 ][ y0 ]는 루마 샘플들에 대한 인트라 예측 모드를 특정한다. 어레이 인덱스 x0과 y0는 픽처의 좌상 루마 샘플에 대한 (relative to the top-left luma sample of the picture) 대상 예측 블록의 좌상 루마 샘플의 위치 ( x0, y0 )를 특정한다.

prev_intra_luma_pred_flag[ x0 ][ y0 ]의 값이 1이면, 인트라 예측 모드는 주변의 인트라 예측된 예측 유닛으로부터 추정된다. 인트라 예측에 있어서, 현재 블록에 적용되는 예측 모드를 지시하는 값이 그대로 전송될 수도 있으나, 소정의 인트라 예측 모드를 특정하고, 현재 블록에 적용되는 예측 모드가 특정된 인트라 예측 모드에 해당하는지에 관한 정보와, 특정된 인트라 예측 모드에 해당하지 않는 경우에는 어떤 인트라 예측 모드가 적용되는지를 전송하도록 할 수도 있다. 이때, mpm_idx[ x0 ][ y0 ]은 특정된 인트라 예측 모드(즉, Most Probable Mode)를 지시한다. mpm_idx[ x0 ][ y0 ]이 존재하지 않으면, mpm_idx[ x0 ][ y0 ]은 0의 값으로 추정된다.

rem_intra_luma_pred_mode[ x0 ][ y0 ]는 적용되는 인트라 예측 모드가 상기 특정된 인트라 예측 모드가 아닐 경우에, 남아있는(remaining) 예측 모드들 중에서 어떤 예측 모드가 적용되는지를 지시한다. 변수 IntraLumaModeBins는 rem_intra_luma_pred_mode[ x0 ][ y0 ]를 지시하는 빈(bin)들의 개수를 특정하는데, IntraLumaModeBins의 값은 예측 유닛의 사이즈에 의존하며, 이용 가능한 예측 모드의 개수를 제한한다.

표 13은 예측 유닛 사이즈(PuSize)와 관련하여 rem_intra_luma_pred_mode의 모드 개수와 빈의 개수(IntraLumaModeBins)를 결정하는 예를 개략적으로 나타낸 표이다.

<표 13>

intra_chroma_pred_mode[ x0 ][ y0 ]은 크로마 샘플에 대한 인트라 예측 모드를 특정한다. 어레이(array) 인덱스 x0과 y0는 픽처의 좌상 루마 샘플에 대한 대상 예측 블록의 좌상 루마 샘플의 위치 ( x0, y0 )를 특정한다.

merge_flag[ x0 ][ y0 ]는 현재 예측 유닛에 대한 인터 예측 파라미터들이 주변의 인터 예측된 파티션들로부터 추정(infer)되는지를 특정한다. 어레이 인덱스 x0과 y0는 픽처의 좌상 루마 샘플에 대한 (relative to the top-left luma sample of the picture) 대상 예측 블록의 좌상 루마 샘플의 위치 ( x0, y0 )를 특정한다. merge_flag[ x0 ][ y0 ]가 존재하지 않는(not present) 경우에는, 예컨대, InferredMergeFlag 등의 정보가 1인 경우에, merge_flag[ x0 ][ y0 ]는 1과 같다고 추정(infer)된다.

merge_idx[ x0 ][ y0 ]는 머지 후보 리스트에서 머지 후보를 특정한다. 어레이 인덱스 x0과 y0는 픽처의 좌상 루마 샘플에 대한 (relative to the top-left luma sample of the picture) 대상 예측 블록의 좌상 루마 샘플의 위치 ( x0, y0 )를 특정한다. merge_idx[ x0 ][ y0 ]가 존재하지 않는(not present) 경우, merge_idx[ x0 ][ y0 ]는 0과 같다고 추정(infer)된다.

inter_pred_flag[ x0 ][ y0 ]는 현재 예측 유닛에 대하여 단예측(uni-prediction)이 이용되는지 쌍예측(bi-prediction)이 이용되는지를 특정하며, 어레이 인덱스 x0과 y0는 픽처의 좌상 루마 샘플에 대한 (relative to the top-left luma sample of the picture) 대상 예측 블록의 좌상 루마 샘플의 위치 ( x0, y0 )를 특정한다.

표 14는 현재 블록에 적용되는 인터 예측 모드를 결정하는 방법의 일 예를 나타낸 것이다.

<표 14>

inter_pred_flag[ x0 ][ y0 ]가 없는 경우에, inter_pred_flag[ x0 ][ y0 ]의 값은 슬라이스 타입이 P 이면 Pred_L0로 추정(infer)되고, 슬라이스 타입이 B이면 Pred_BI로 추정된다.

ref_idx_l0[ x0 ][ y0 ]는 현재 예측 유닛에 대한 L0 참조 픽처 인덱스(list 0 reference picture index)를 특정한다 어레이 인덱스 x0과 y0는 픽처의 좌상 루마 샘플에 대한 (relative to the top-left luma sample of the picture) 대상 예측 블록의 좌상 루마 샘플의 위치 ( x0, y0 )를 특정한다.

ref_idx_l1[ x0 ][ y0 ]는 ref_idx_l0과 동일한 의미(semantics)를 가지되, 참조 픽처 L0을 타나내는 l0 및 list 0은 참조 픽처 리스트 L1을 나타내는 l1 및 list 1로 대치된다.

ref_idx_lc[ x0 ][ y0 ]는 ref_idx_l0과 동일한 의미(semantics)를 가지되, 참조 픽처 L0을 타나내는 l0 및 list 0은 참조 픽처 리스트 조합 LC를 나타내는 lc 및 list combination으로 대치된다.

mvd_l0[ x0 ][ y0 ][ compIdx ]는 이용되는 L0 벡터 성분(list 0 vector component to be used)과 그 예측(prediction) 사이의 차를 특정한다. 어레이 인덱스 x0과 y0는 픽처의 좌상 루마 샘플에 대한 (relative to the top-left luma sample of the picture) 대상 예측 블록의 좌상 루마 샘플의 위치 ( x0, y0 )를 특정한다. 수평 움직임 벡터 성분 차이(the horizontal motion vector component difference)에는 compIdx = 0가 할당되며, 수직 움직임 벡터 성분 차이에는 compIdx = 1이 할당된다.

mvd_l1[ x0 ][ y0 ][ compIdx ]는 mvd_l0과 같은 의미 semantics)를 가지되, 참조 픽처 L0을 타나내는 l0 및 list 0은 참조 픽처 리스트 L1을 나타내는 l1 및 list 1로 대치된다.

mvd_lc[ x0 ][ y0 ][ compIdx ]는 mvd_l0과 동일한 의미(semantics)를 가지되, 참조 픽처 L0을 타나내는 l0 및 list 0은 참조 픽처 리스트 조합 LC를 나타내는 lc 및 list combination으로 대치된다.

도 5를 참조하면, 인코딩 장치는 현재 블록에 대한 예측을 수행한다(S510). 인코딩 장치는 현재 블록에 적용할 예측 방법을 결정한다. 예컨대, 인코딩 장치는 현재 블록에 인터 예측을 적용할 것인지 인트라 예측을 적용할 것인지를 결정한다. 인트라 예측을 적용하는 경우에는 인트라 예측 모드를 결정한다. 인터 예측을 적용하는 경우에는 머지 모드에 기반한 인터 예측, 스킵 모드에 기반한 인터 예측 또는 MVP에 기반한 인터 예측 중 어느 방법을 적용할 것인지를 결정한다.

인코딩 장치는 어떤 예측 방법을 적용할 것인지를 결정하기 위해 각 예측 방법에 따른 RD(Ratio of Distortion) 비용 등의 비교할 수 있다. 인코딩 장치는 결정된 예측 방법을 이용하여 현재 블록에 대한 예측을 수행한다.

예측은 각 픽처에서 정해진 순서에 따라서 블록별로 진행될 수 있다.

인코딩 장치는 예측 결과를 포함하는 영상 정보를 변환 및 엔트로피 코딩한다(S520). 인코딩 장치는 영상 정보를 소정의 변환 단위별로 DST(Discrete Sine Transform) 또는 DCT(Discrete Cosine Transform) 변환할 수 있다. 어떤 변환 방법을 적용할 것인지는 블록의 사이즈 등을 기반으로 결정될 수 있다.

인코딩 장치는 도 1에서 설명한 바와 같이 변환된 영상 정보를 엔트로피 코딩하기 전에 양자화 및 재정렬을 수행할 수 있다.

인코딩 장치는 영자화된 변환 정보를 엔트로피 코딩하기 위해 상술한 CABAC 등의 방법을 이용할 수 있다.

인코딩 장치는 엔트로피 코딩된 정보를 전송한다(S530). 인코딩 장치로부터 시그널링되는 정보는 소정의 신택스에 따라서 구성될 수 있다. 예컨대, 인터 예측에 대한 정보의 경우에, 인코딩 장치는 상술한 바와 같이, 슬라이스 타입이 B 슬라이스이고 GPB인지 혹은 슬라이스 타입이 B 슬라이스이고 LC를 추가로 조합하는지 등에 따라서 예측 정보를 전송하도록 할 수 있다.

예컨대, 상기 예측 단계에서 명시적 가중치 예측을 수행하는 경우에는, 최적의 성능이 나오도록 인코딩 장치에서 현재 픽처와 참조 픽처 사이의 가중치(weight) 값과 오프셋(offset) 값을 구한 후 가중치와 오프셋에 관한 정보를 디코딩 장치로 전송한다.

이때, 가중치와 오프셋 등에 관한 정보를 명시적으로 전송하기 위해 상술한 표들에서 설명한 바와 같은 신택스가 이용될 수 있다. 가중치 예측 정보는 가중치 값에 대한 정보와 오프셋 값에 대한 정보를 포함한다. 또한, 가중치 예측 정보는 루마 성분에 대한 가중치 예측 정보와 크로마 성분에 대한 가중치 예측 정보를 포함할 수 있다.

도 6을 참조하면, 디코딩 장치는 인코딩 장치로부터 비트스트림으로 수신한 영상 정보를 엔트로피 디코딩 및 역변환 한다(S610). 디코딩 장치에서 수행되는 엔트로피 디코딩 방법 및 역변환 방법은, 인코딩 장치에서 수행된 변환 방법 및 엔트로피 코딩 방법에 대응한다. 예컨대, 인코딩 장치에서 변환 방법으로 DCT가 이용된 경우에는 디코딩 장치에서 IDCT(Inverse Discrete Cosine Transform) 방법으로 역변환하며, 인코딩 장치에서 DST로 변환한 경우에는 디코딩 장치에서 IDST(Inverse Discrete Sine Transform) 방법으로 역변환할 수 있다. 인코딩 장치에서 엔트로피 코딩 방법으로 CABAC를 이용하였다면, 디코딩 장치에서도 CABAC에 기반한 엔트로피 디코딩이 수행될 수 있다.

디코딩 장치는 도 2에서 설명한 바와 같이, 엔트로피 디코딩된 정보를 역변환하기 전에 재정렬 및 역양자화를 수행할 수 있다.

디코딩 장치는 역변환된 영상 정보를 기반으로 예측을 수행한다(S620). 예측은 각 픽처에 대하여 소정의 순서에 따라서 블록별로 진행될 수 있다. 인코딩 장치로부터 수신한 영상 정보는 예측에 필요한 정보를 포함한다.

디코딩 장치는 수신한 정보를 기반으로 인트라 예측 또는 인터 예측을 수행할 수 있다. 예컨대, 인트라 예측을 적용할 것인지 인터 예측을 적용할 것인지를 지시하는 정보가 인코딩 장치로부터 전송되는 경우에, 디코딩 장치는 해당 정보에 따라서 인트라 예측 또는 인터 예측을 수행할 수 있다.

또한, 인트라 예측을 적용할 것인지 인터 예측을 적용할 것인지를 지시하는 정보가 인코딩 장치로부터 전송되지 않는 경우에, 디코딩 장치는 슬라이스 타입에 기반해서 인트라 예측을 수행할 것인지 인터 예측을 수행할 것인지를 추정할 수도 있다. 예컨대, 디코딩 장치는 슬라이스 타입이 I 슬라이스인 경우에는 인트라 예측을 수행하는 것으로 추정할 수 있다.

한편, 인터 예측이 적용되는 경우에, 디코딩 장치는 도 4에서 설명한 바와 같이 인터 예측을 수행할 수 있다. 이때, 인코딩 장치로부터 수신하는 정보는 예측 방법과 예측 대상 슬라이스의 타입 그리고 참조 픽처 리스트 사이의 동일성 여부 등에 따라 다를 수 있다. 예컨대, 상술한 바와 같이, B 슬라이스에 대하여 가중치 예측을 적용하는 경우에, L0과 L1이 상이하면 L1 예측에 관한 정보 시그널링하여 LC를 추가로 조합할 수 있다. 또한, L0과 L1이 상이하면, LC에 관한 정보를 시그널링할 수도 있다.

이때, L1에 관한 정보 또는 LC에 관한 정보는 LC를 구성하기 위한 정보뿐만 아니라, 상술한 바와 같이, 가중치 예측을 수행하기 위해 필요한 정보를 포함한다.

디코딩 장치는 수신한 L1에 대한 가중치 예측 정보와 L0에 대한 가중치 예측 정보를 기반으로 가중치 예측을 수행할 수 있다.

가중치 예측의 방법으로서는 앞서 설명한 바와 같이, 명시적인 방법과 묵시적인 방법 그리고 디폴트 방법이 있다. 명시적으로 가중치를 적용하는 방법의 경우에는, 최적의 성능이 나오도록 인코딩 장치에서 현재 픽처와 참조 픽처 사이의 가중치(weight) 값과 오프셋(offset) 값을 구한 후 가중치와 오프셋에 관한 정보를 디코딩 장치로 전송한다. 디코딩 장치에서는 인코딩 장치로부터 전송된 가중치와 오프셋을 이용하여 가중치 예측을 수행한다.

묵시적으로 가중치를 적용하는 방법의 경우에는, 현재 픽처와 참조 픽처 사이의 거리에 비례하도록 가중치를 유도해서 적용한다.

상술한 바와 같이, P 슬라이스에 대해서 가중치를 명시적으로 적용하지 않는 경우에는, 소정의 디폴트(default) 가중치를 적용할 수도 있다. 또한, B 슬라이스에 대해서 가중치가 명시적 또는 묵시적으로 적용되지 않는 경우에는 소정의 디폴트 가중치를 적용할 수도 있다

가중치 예측에서 명시적인 방법으로 가중치를 적용하는 경우에, 가중치와 오프셋을 명시적으로 전송하기 위해 상술한 표들에서 설명한 바와 같은 신택스가 이용될 수 있다. 본 명세서에서 가중치 예측 정보는 앞서 설명한 바와 같이 가중치 값에 대한 정보와 오프셋 값에 대한 정보를 포함한다. 또한, 가중치 예측 정보는 루마 성분에 대한 가중치 예측 정보와 크로마 성분에 대한 가중치 예측 정보를 포함할 수 있다.

디코딩 장치는 예측 결과를 기반으로 현재 픽처를 복원한다(S630). 예컨대, 상술한 바와 같이, 인터 예측이 수행된 경우에, 디코딩 장치는 예측에 의해 생성한 예측 블록과 잔차 신호를 더하여 현재 블록을 복원할 수 있다. 스킵 모드가 적용되는 경우에는 잔차 신호가 전송되지 않으므로, 예측 블록을 복원 블록으로 할 수 있다.

디코딩 장치는 현재 픽처를 복원하기 위해, 복원된 블록들에 소정의 필터를 적용할 수 있다.

상술한 예시적인 시스템에서, 방법들은 일련의 단계 또는 블록으로써 순서도를 기초로 설명되고 있지만, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 상술한 실시예들은 다양한 양태의 예시들을 포함한다. 예컨대, 상술한 실시형태들을 서로 조합하여 실시할 수도 있으며, 이 역시 본 발명에 따른 실시형태에 속한다. 본 발명은 이하의 특허청구범위 내에 속하는 본 발명의 기술적 사상에 따른 다양한 수정 및 변경을 포함한다.

Claims

인터 예측을 수행하는 단계; 및
상기 인터 예측 결과를 포함하는 영상 정보를 전송하는 단계를 포함하며,
상기 인터 예측이 B 슬라이스에 대하여 수행된 경우에,
상기 영상 정보는 참조 픽처 리스트 0과 참조 픽처 리스트 1의 동일성 여부를 기반으로 전송되는 것을 특징으로 하는 인코딩 방법.
제1항에 있어서, 상기 인터 예측을 수행하는 단계에서는 가중치 예측이 수행되며,
상기 영상 정보는 가중치 예측을 위한 정보를 포함하는 것을 특징으로 하는 인코딩 방법.
제2항에 있어서, 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않은 경우에,
상기 가중치 예측은 참조 픽처 리스트 조합을 기반으로 수행되며,
상기 영상 정보는,
상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1로부터 조합되는 참조 픽처 리스트 조합을 이용하는 가중치 예측의 정보를 포함하는 것을 특징으로 하는 인코딩 방법.
제1항에 있어서, 상기 인터 예측을 수행하는 단계에서는 가중치 예측이 수행되며,
상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않은 경우에,
상기 가중치 예측은 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1으로부터 조합된 참조 픽처 리스트 조합에 기반하여 수행되고,
상기 영상 정보는 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1을 기반으로 하는 가중치 예측 정보를 포함하는 것을 특징으로 하는 인코딩 방법.
제4항에 있어서, 상기 가중치 예측 정보는,
상기 참조 픽처 리스트를 구성하는 엔트리 중 상기 참조 픽처 리스트 0으로부터의 엔트리에 적용할 가중치 예측 정보 및 상기 참조 픽처 리스트 1로부터의 엔트리에 적용할 가중치 예측 정보를 포함하는 것을 특징으로 하는 인코딩 방법.
인코딩 장치로부터 영상 정보를 수신하는 단계;
상기 수신한 영상 정보를 기반으로 인터 예측을 수행하는 단계; 및
상기 인터 예측 결과를 기반으로 픽처를 복원하는 단계를 포함하며,
상기 인터 예측의 대상이 B 슬라이스인 경우에,
상기 수신한 영상 정보는 참조 픽처 리스트 0과 참조 픽처 리스트 1의 동일성 여부에 따라서 상이한 것을 특징으로 하는 디코딩 방법.
제6항에 있어서, 상기 인터 예측을 수행하는 단계에서는 가중치 예측이 수행되며,
상기 영상 정보는 가중치 예측을 위한 정보를 포함하는 것을 특징으로 하는 디코딩 방법.
제7항에 있어서, 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않은 경우에,
상기 가중치 예측은 참조 픽처 리스트 조합을 기반으로 수행되며,
상기 영상 정보는,
상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1로부터 조합되는 참조 픽처 리스트 조합을 이용하는 가중치 예측의 정보를 포함하는 것을 특징으로 하는 디코딩 방법.
제6항에 있어서, 상기 인터 예측을 수행하는 단계에서는 가중치 예측이 수행되며,
상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않은 경우에,
상기 가중치 예측은 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1으로부터 조합된 참조 픽처 리스트 조합에 기반하여 수행되고,
상기 영상 정보는 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1을 기반으로 하는 가중치 예측 정보를 포함하는 것을 특징으로 하는 디코딩 방법.
제9항에 있어서, 상기 가중치 예측 정보는,
상기 참조 픽처 리스트를 구성하는 엔트리 중 상기 참조 픽처 리스트 0으로부터의 엔트리에 적용할 가중치 예측 정보 및 상기 참조 픽처 리스트 1로부터의 엔트리에 적용할 가중치 예측 정보를 포함하는 것을 특징으로 하는 디코딩 방법.
움직임 정보를 유도하는 단계;
상기 움직임 정보를 기반으로 예측 블록을 생성하는 단계; 및
상기 생성된 예측 블록을 기반으로 현재 블록을 복원하는 단계를 포함하며,
상기 예측 블록 생성 단계에서는,
인코딩 장치로부터 수신한 영상 정보를 기반으로 가중치 예측을 수행하고,
상기 영상 정보는 참조 픽처 리스트 0과 참조 픽처 리스트 1의 동일성 여부에 따라서 상이한 것을 특징으로 하는 인터 예측 방법.
제11항에 있어서, 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않은 경우에,
상기 가중치 예측은 참조 픽처 리스트 조합을 기반으로 수행되며,
상기 영상 정보는,
상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1로부터 조합되는 참조 픽처 리스트 조합을 이용하는 가중치 예측의 정보를 포함하는 것을 특징으로 하는 인터 예측 방법.
제11항에 있어서, 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1이 동일하지 않은 경우에,
상기 가중치 예측은 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1으로부터 조합된 참조 픽처 리스트 조합에 기반하여 수행되며,
상기 영상 정보는 상기 참조 픽처 리스트 0과 상기 참조 픽처 리스트 1을 기반으로 하는 가중치 예측 정보를 포함하는 것을 특징으로 하는 인터 예측 방법.
제13항에 있어서, 상기 가중치 예측 정보는,
상기 참조 픽처 리스트를 구성하는 엔트리 중 상기 참조 픽처 리스트 0으로부터의 엔트리에 적용할 가중치 예측 정보 및 상기 참조 픽처 리스트 1로부터의 엔트리에 적용할 가중치 예측 정보를 포함하는 것을 특징으로 하는 인터 예측 방법.
인터 예측을 수행하는 예측부; 및
상기 인터 예측 결과를 포함하는 영상 정보를 엔트로피 코딩하여 비트 스트림으로 전송하는 엔트로피 코딩부를 포함하며,
상기 예측부는 가중치 예측을 적용하여 인터 예측을 수행하고,
상기 영상 정보는 가중치 예측을 위한 정보를 포함하며,
상기 인터 예측이 B 슬라이스에 대하여 수행된 경우에,
상기 영상 정보는 참조 픽처 리스트 0과 참조 픽처 리스트 1의 동일성 여부를 기반으로 전송되는 것을 특징으로 하는 인코딩 장치.
인코딩 장치로부터 수신한 비트스트림으로 전송된 영상 정보를 엔트로피 디코딩하는 엔트로피 디코딩부; 및
상기 엔트로피 디코딩된 영상 정보를 기반으로 인터 예측을 수행하는 예측부를 포함하며,
상기 예측부는 가중치 예측을 적용하여 인터 예측을 수행하고,
상기 영상 정보는 가중치 예측을 위한 정보를 포함하며,
상기 인터 예측이 B 슬라이스에 대하여 수행된 경우에,
상기 영상 정보는 참조 픽처 리스트 0과 참조 픽처 리스트 1의 동일성 여부를 기반으로 전송되는 것을 특징으로 하는 디코딩 장치.