WO2013191436A1

WO2013191436A1 - 비디오 신호 처리 방법 및 장치

Info

Publication number: WO2013191436A1
Application number: PCT/KR2013/005349
Authority: WO
Inventors: 손은용; 정지욱; 예세훈; 구문모; 허진; 김태섭; 성재원
Original assignee: 엘지전자 주식회사
Priority date: 2012-06-19
Filing date: 2013-06-18
Publication date: 2013-12-27
Also published as: EP2854399A1; RU2653258C2; CA2877268A1; CN104380744B; CA2877268C; AU2013278195A1; EP2854399B1; MX2014015341A; AU2013278195B2; US20150181230A1; JP6231560B2; US10021417B2; IN2014KN02890A; RU2014150564A; AU2013278195A2; CN104380744A; MX341103B; KR102148650B1; EP2854399A4; JP2015524228A

Abstract

본 발명은 인터뷰 레지듀얼 예측에 관한 것으로 이웃 블록의 모션 벡터를 이용하여 제 1 참조 블록의 레지듀얼 데이터를 획득하고, 참조뷰 모션 벡터 또는 변이 벡터를 이용하여 제 2 참조 블록의 레지듀얼 데이터를 획득하고, 제 1 참조 블록의 레지듀얼 데이터와 제 2 참조 블록의 레지듀얼 데이터를 이용하여 레지듀얼 데이터 예측 값을 획득하고, 레지듀얼 데이터 예측 값을 이용하여 현재 텍스쳐 블록을 코딩하는 것을 특징으로 한다. 본 발명은 같은 시간대에 속해 있는 다른 시점의 코딩된 데이터를 사용하여 획득된 예측 값을 이용하여 인터뷰 레지듀얼 예측을 수행함으로써, 시점 간의 상관 관계를 활용하여 비디오 데이터 예측의 정확성을 높이고 전송되는 레지듀얼 데이터의 양을 줄임으로써 코딩 효율을 향상시킬 수 있다. 또한, 인터뷰 레지듀얼 예측을 적용하기 위한 조건을 추가하여 코딩 과정에서의 복잡도를 줄일 수도 있다.

Description

비디오 신호 처리 방법 및 장치

본 발명은 비디오 신호의 코딩 방법 및 장치에 관한 것이다.

압축 부호화란 디지털화한 정보를 통신 회선을 통해 전송하거나, 저장 매체에 적합한 형태로 저장하는 일련의 신호 처리 기술을 의미한다. 압축 부호화의 대상에는 음성, 영상, 문자 등의 대상이 존재하며, 특히 영상을 대상으로 압축 부호화를 수행하는 기술을 비디오 영상 압축이라고 일컫는다. 다시점 비디오 영상의 일반적인 특징은 공간적 중복성, 시간적 중복성 및 시점간 중복성을 지니고 있는 점에 특징이 있다.

본 발명의 목적은 비디오 신호의 코딩 효율을 높이고자 함에 있다.

본 발명은 인터뷰 레지듀얼 예측에 관한 것으로 이웃 블록으로부터 모션 벡터를 획득하는 것을 특징으로 한다.

본 발명은 이웃 블록의 모션 벡터를 이용하여 제 1 참조 블록의 레지듀얼 데이터를 획득하고, 참조뷰 모션 벡터 또는 변이 벡터를 이용하여 제 2 참조 블록의 레지듀얼 데이터를 획득하는 것을 특징으로 한다.

본 발명은 제 1 참조 블록의 레지듀얼 데이터와 제 2 참조 블록의 레지듀얼 데이터를 이용하여 현재 텍스쳐 블록의 레지듀얼 데이터 예측 값을 획득하고, 현재 텍스쳐 블록의 레지듀얼 데이터 예측 값을 이용하여 현재 텍스쳐 블록을 코딩하는 것을 특징으로 한다.

본 발명은 참조뷰 모션 벡터를 이용하여 탐색한 제 2 참조 블록의 위치가 픽쳐 내에 위치하는 경우에 인터뷰 레지듀얼 예측을 적용하는 것을 특징으로 한다.

본 발명은 대응 블록이 인터 예측인 경우에 인터뷰 레지듀얼 예측을 적용하는 것을 특징으로 한다.

본 발명은 대응 블록을 찾기 위한 인터뷰 모션 벡터와 현재 텍스쳐 블록에 대응되는 뎁스 데이터를 이용한 변이 벡터를 비교하여 차이가 임계 값 이하인 경우에 인터뷰 레지듀얼 예측을 적용하는 것을 특징으로 한다.

본 발명은 이웃 블록의 시간 모션 벡터와 대응 블록을 찾기 위한 인터뷰 모션 벡터를 비교하여 차이가 임계 값 이하인 경우에 인터뷰 레지듀얼 예측을 적용하는 것을 특징으로 한다.

본 발명은 같은 시간대에 속해 있는 다른 시점의 코딩된 데이터를 사용하여 획득된 현재 텍스쳐 블록의 레지듀얼 데이터 예측 값을 이용하여 인터뷰 레지듀얼 예측을 수행함으로써, 시점 간의 상관 관계를 활용하여 비디오 데이터 예측의 정확성을 높이고 전송되는 레지듀얼 데이터의 양을 줄임으로써 코딩 효율을 향상시킬 수 있다. 또한, 제 1 참조 블록과 제 2 참조 블록을 탐색하기 위한 모션 벡터를 현재 텍스쳐 블록의 이웃 블록으로부터 획득하여 인터뷰 레지듀얼 예측의 정확성을 높일 수 있고 비디오 코딩의 효율을 높이는 방법이다. 그리고 인터뷰 레지듀얼 예측을 적용하기 위한 조건을 추가하여 코딩 과정에서의 복잡도를 줄일 수도 있다.

도 1은 본 발명이 적용되는 일실시예로서, 비디오 디코더의 개략적인 블록도를 도시한 것이다.

도 2는 본 발명이 적용되는 일실시예로서, 공간적 이웃 블록의 예를 도시한 것이다.

도 3은 본 발명이 적용되는 일실시예로서, 시간적 이웃 블록의 예를 도시한 것이다.

도 4는 본 발명이 적용되는 일실시예로서, 인터 예측의 종류로서 시간적 인터 예측과 시점 간 인터 예측의 예를 도시한 것이다.

도 5는 본 발명이 적용되는 일실시예로서, 뎁스 데이터를 이용하여 현재 텍스쳐 블록의 변이 벡터를 유도하는 방법을 도시한 것이다.

도 6은 본 발명이 적용되는 일실시예로서, 인터뷰 레지듀얼 예측에 관한 예를 도시한 것이다.

도 7은 본 발명이 적용되는 일실시예로서, 인터뷰 레지듀얼 예측의 예에 대한 흐름도를 도시한 것이다.

도 8은 본 발명이 적용되는 일실시예로서, 도 7의 흐름도에 대응되는 인터뷰 레지듀얼 예측의 예를 도시한 것이다.

도 9는 본 발명이 적용되는 일실시예로서, 인터뷰 레지듀얼 예측의 예에 대한 흐름도를 도시한 것이다.

도 10은 본 발명이 적용되는 일실시예로서, 도 9에 대응되는 인터뷰 레지듀얼 예측의 예를 도시한 것이다.

도 11은 본 발명이 적용되는 일실시예로서, 참조뷰 모션 벡터에 의한 제 1 참조 블록의 위치에 따른 인터뷰 레지듀얼 예측 조건의 예를 도시한 것이다.

상기와 같은 목적을 달성하기 위하여 본 발명에 따른 비디오 신호 처리 방법은 현재 텍스쳐 블록의 시점 간 인터 예측으로 코딩된 이웃 블록으로부터 인터뷰 모션 벡터를 획득할 수 있고, 상기 인터뷰 모션 벡터를 이용하여 대응 블록의 참조뷰 모션 벡터를 획득할 수 있고, 상기 대응 블록의 참조뷰 모션 벡터를 이용하여 제 1 참조 블록의 레지듀얼 데이터를 얻을 수 있고, 상기 대응 블록의 참조뷰 모션 벡터를 상기 현재 텍스쳐 블록의 참조뷰 모션 벡터로 획득하여 상기 현재 텍스쳐 블록의 참조뷰 모션 벡터를 이용하여 제 2 참조 블록의 레지듀얼 데이터를 얻어, 상기 제 1 참조 블록의 레지듀얼 데이터와 상기 제 2 참조 블록의 레지듀얼 데이터를 이용하여 레지듀얼 데이터 예측 값을 얻을 수 있고, 상기 레지듀얼 데이터 예측 값을 이용하여 현재 텍스쳐 블록을 디코딩할 수 있다.

본 발명에 따르면, 상기 제 2 참조 블록이 상기 제 2 참조 픽쳐 내에 위치하지 아니한 경우, 상기 제 2 참조 블록의 레지듀얼 데이터를 0으로 유도할 수 있다.

본 발명에 따르면. 상기 현재 텍스쳐 블록의 뎁스 값을 이용하여 변이 벡터를 획득하고, 상기 인터뷰 모션 벡터와 상기 변이 벡터를 비교하여 상기 인터뷰 모션 벡터와 상기 변이 벡터의 차이가 임계 값 이하인 경우, 상기 제 1 참조 블록의 레지듀얼 데이터와 상기 제 2 참조 블록의 레지듀얼 데이터를 얻을 수 있다.

본 발명에 따르면, 상기 현재 텍스쳐 블록의 시간 인터 예측으로 코딩된 이웃 블록으로부터 시간 모션 벡터를 획득하고, 상기 시간 모션 벡터와 상기 참조뷰 모션 벡터를 비교하는 단계를 더 포함하고, 상기 시간 모션 벡터와 상기 참조뷰 모션 벡터의 차이가 임계값 이하인 경우, 상기 제 1 참조 블록의 레지듀얼 데이터와 상기 제 2 참조 블록의 레지듀얼 데이터를 얻을 수 있다.

본 발명에 따르면, 상기 인터뷰 모션 벡터는 공간적 이웃 블록의 인터뷰 모션 벡터, 시간적 이웃 블록의 인터뷰 모션 벡터 및 참조 인터뷰 모션 벡터 중 적어도 하나로부터 유도될 수 있다.

본 발명에 따르면, 상기 공간적 이웃 블록의 모션 벡터는 상기 시간적 이웃 블록의 인터뷰 모션 벡터보다 높은 우선순위를 가지고, 상기 시간적 이웃 블록의 인터뷰 모션 벡터는 참조 인터뷰 모션 벡터보다 높은 우선순위를 가질 수 있다.

본 발명에 따르면, 상기 참조 인터뷰 모션 벡터는 상기 공간적 이웃 블록과 상기 시간적 이웃 블록 중 적어도 하나가 참조뷰 모션 벡터로 유도된 경우 상기 참조뷰 모션 벡터에 대응하는 인터뷰 모션 벡터일 수 있다.

다시점 비디오 신호 데이터를 압축 부호화 또는 복호화하는 기술은 공간적 중복성, 시간적 중복성 및 시점간 존재하는 중복성을 고려하고 있다. 또한, 다시점 영상의 경우, 3차원 영상을 구현하기 위해 2개 이상의 시점에서 촬영된 다시점 텍스쳐 영상을 코딩할 수 있다. 또한, 필요에 따라 다시점 텍스쳐 영상에 대응하는 뎁스 데이터를 더 코딩할 수도 있다. 뎁스 데이터를 코딩함에 있어서, 공간적 중복성, 시간적 중복성 또는 시점간 중복성을 고려하여 압축 코딩할 수 있음은 물론이다. 뎁스 데이터는 카메라와 해당 화소 간의 거리 정보를 표현한 것이며, 본 명세서 내에서 뎁스 데이터는 뎁스 정보, 뎁스 영상, 뎁스 픽쳐, 뎁스 시퀀스, 뎁스 비트스트림 등과 같이 뎁스에 관련된 정보로 유연하게 해석될 수 있다. 또한, 본 명세서에서 코딩이라 함은 인코딩과 디코딩의 개념을 모두 포함할 수 있고, 본 발명의 기술적 사상 및 기술적 범위에 따라 유연하게 해석할 수 있을 것이다.

도 1을 참조하면, 비디오 디코더는 NAL 파싱부(100), 엔트로피 디코딩부(200), 역양자화/역변환부(300), 인트라 예측부(400), 인-루프 필터부(500), 복호 픽쳐 버퍼부(600), 인터 예측부(700)를 포함할 수 있다. NAL 파싱부 (100)는 다시점 텍스쳐 데이터를 포함한 비트스트림을 수신할 수 있다. 또한, 뎁스 데이터가 텍스쳐 데이터의 코딩에 필요한 경우, 인코딩된 뎁스 데이터를 포함한 비트스트림을 더 수신할 수도 있다. 이 때 입력되는 텍스쳐 데이터와 뎁스 데이터는 하나의 비트스트림으로 전송될 수 있고, 또는 별개의 비트스트림으로 전송될 수도 있다. NAL 파싱부(100)는 입력된 비트스트림을 복호화하기 위해 NAL 단위로 파싱을 수행할 수 있다. 입력된 비트스트림이 다시점 관련 데이터(예를 들어, 3-Dimensional Video)인 경우, 입력된 비트스트림은 카메라 파라미터를 더 포함할 수 있다. 카메라 파라미터에는 고유의 카메라 파라미터 (intrinsic camera parameter) 및 비고유의 카메라 파라미터 (extrinsic camera parameter)가 있을 수 있고, 고유의 카메라 파라미터는 초점 거리(focal length), 가로세로비(aspect ratio), 주점(principal point) 등을 포함할 수 있고, 비고유의 카메라 파라미터는 세계 좌표계에서의 카메라의 위치정보 등을 포함할 수 있다.

엔트로피 디코딩부(200)는 엔트로피 디코딩을 통하여 양자화된 변환 계수, 텍스쳐 픽쳐의 예측을 위한 코딩 정보 등을 추출할 수 있다.

역양자화/역변환부(300)에서는 양자화된 변환 계수에 양자화 파라미터를 적용하여 변환 계수를 획득하고, 변환 계수를 역변환하여 텍스쳐 데이터 또는 뎁스 데이터를 복호화할 수 있다. 여기서, 복호화된 텍스쳐 데이터 또는 뎁스 데이터는 예측 처리에 따른 레지듀얼 데이터를 포함할 수 있다. 또한, 뎁스 블록에 대한 양자화 파라미터는 텍스쳐 데이터의 복잡도를 고려하여 획득될 수 있다. 예를 들어, 뎁스 블록에 대응하는 텍스쳐 블록이 복잡도가 높은 영역인 경우에는 낮은 양자화 파라미터를 획득하고, 복잡도가 낮은 영역인 경우에는 높은 양자화 파라미터를 획득할 수 있다.

인트라 예측부(400)는 현재 텍스쳐 픽쳐 내의 복원된 텍스쳐 데이터를 이용하여 화면 내 예측을 수행할 수 있다. 뎁스 픽쳐에 대해서도 텍스쳐 픽쳐와 동일한 방식으로 화면 내 예측이 수행될 수 있다. 예를 들어, 텍스쳐 픽쳐의 화면 내 예측을 위해 이용되는 코딩 정보를 뎁스 픽쳐에서도 동일하게 이용할 수 있다. 여기서, 화면 내 예측을 위해 이용되는 코딩 정보는 인트라 예측 모드, 인트라 예측의 파티션 정보를 포함할 수 있다.

인-루프 필터부(500)는 블록 왜곡 현상을 감소시키기 위해 각각의 코딩된 블록에 인-루프 필터를 적용할 수 있다. 필터는 블록의 가장자리를 부드럽게 하여 디코딩된 픽쳐의 화질을 향상시킬 수 있다. 필터링을 거친 텍스쳐 픽쳐 또는 뎁스 픽쳐들은 출력되거나 참조 픽쳐로 이용하기 위해 복호 픽쳐 버퍼부(600)에 저장될 수 있다.

복호 픽쳐 버퍼부(Decoded Picture Buffer unit)(600)에서는 화면 간 예측을 수행하기 위해서 이전에 코딩된 텍스쳐 픽쳐 또는 뎁스 픽쳐를 저장하거나 개방하는 역할 등을 수행한다. 이 때 복호 픽쳐 버퍼부(600)에 저장하거나 개방하기 위해서 각 픽쳐의 frame_num 과 POC(Picture Order Count)를 이용할 수 있다. 나아가, 뎁스 코딩에 있어서 상기 이전에 코딩된 픽쳐들 중에는 현재 뎁스 픽쳐와 다른 시점에 있는 뎁스 픽쳐들도 있으므로, 이러한 픽쳐들을 참조 픽쳐로서 활용하기 위해서는 뎁스 픽쳐의 시점을 식별하는 시점 식별 정보를 이용할 수도 있다. 뎁스 코딩에 있어서, 뎁스 픽쳐들은 복호 픽쳐 버퍼부 내에서 텍스쳐 픽쳐들과 구별하기 위하여 별도의 표시로 마킹될 수 있고, 상기 마킹 과정에서 각 뎁스 픽쳐를 식별해주기 위한 정보가 이용될 수 있다.

인터 예측부(700)는 복호 픽쳐 버퍼부(600)에 저장된 참조 픽쳐와 모션 정보를 이용하여 현재 블록의 모션 보상을 수행할 수 있다. 본 명세서에서 모션 정보라 함은 모션 벡터, 레퍼런스 인덱스 정보를 포함하는 광의의 개념으로 이해될 수 있다. 또한, 인터 예측부(700)는 모션 보상을 수행하기 위해 시간적 인터 예측을 수행할 수 있다.

본 발명에서 이웃 블록은 공간적 이웃 블록과 시간적 이웃 블록이 있을 수 있다. 이하에서는 본 발명에서 적용되는 공간적 이웃 블록과 시간적 이웃 블록에 대해서 정의한다.

도 2(a)를 참조하면, 공간적 이웃 블록은 좌측하단 이웃 블록 (A0), 좌측 이웃 블록 (A1), 우측상단 이웃 블록 (B0), 상단 이웃 블록 (B1), 좌측상단 이웃 블록 (B2) 중 적어도 하나를 포함할 수 있다. 먼저, 상기 언급한 공간적 이웃 블록들 중에서 모션 벡터를 유도하기 위한 블록을 탐색하고, 현재 텍스쳐 블록의 모션 벡터로 획득할 수 있다. 한편, 공간적 이웃 블록들 간의 우선순위를 고려하여 탐색할 수 있다. 따라서, 좌측 이웃 블록, 상단 이웃 블록, 우측상단 이웃 블록, 좌측하단 이웃 블록, 좌측상단 이웃 블록 순으로 공간적 이웃 블록 탐색을 수행할 수 있다. 예를 들어, 현재 텍스쳐 블록의 인터뷰 모션 벡터를 이웃 블록으로부터 유도하려 할 때, 좌측 이웃 블록이 시점 간 인터 예측으로 코딩된 블록인 경우, 좌측 이웃 블록의 인터뷰 모션 벡터를 현재 텍스쳐 블록의 인터뷰 모션 벡터로 획득하고, 탐색을 종료할 수 있다. 그러나, 탐색 결과, 좌측 이웃 블록이 시점 간 인터 예측으로 코딩되지 아니한 경우에는 상단 이웃 블록이 시점 간 인터 예측으로 코딩되어 있는지 확인할 수 있다. 또는, 좌측하단 이웃 블록, 좌측 이웃 블록, 우측상단 이웃 블록, 상단 이웃 블록, 좌측상단 이웃 블록 순으로 시점 간 인터 예측으로 코딩된 블록을 찾을 때까지 탐색을 수행할 수도 있다. 다만, 공간적 이웃 블록들 간의 우선순위는 상기 실시예에 한정되지 아니한다.

도 2(b)는 공간적 이웃 블록의 후보자를 확장한 예이다. 좌측 이웃 블록 (A1)의 크기가 현재 텍스쳐 블록의 크기보다 작은 경우, 현재 텍스쳐 블록은 적어도 하나 이상의 좌측 이웃 블록을 더 가질 수 있다. 예를 들어, 도 2(b)와 같이, 본 발명의 공간적 이웃 블록은 좌측 이웃 블록 (A1)과 좌측상단 이웃 블록 (B4) 사이에 위치한 좌측 이웃 블록 (A2, A3)을 더 포함할 수 있다. 동일한 방식으로 상단 이웃 블록 (B1)의 크기가 현재 텍스쳐 블록의 크기보다 작은 경우, 본 발명의 공간적 이웃 블록은 상단 이웃 블록 (B1)과 좌측상단 이웃 블록 (B4) 사이에 위치한 상단 이웃 블록 (B2, B3)을 더 포함할 수 있다. 이 경우에도 공간적 이웃 블록들 간의 우선순위 (예를 들어, A1 -> B1 -> B0 -> A0 -> B2 -> C0 -> C1 -> D0 -> D1)를 고려하여 시점 간 인터 예측으로 코딩된 블록을 탐색할 수 있음은 물론이다. 이와 같이 현재 텍스쳐 블록의 인터뷰 모션 벡터로 유도하기 위한 공간적 이웃 블록의 후보자를 확장함으로써, 현재 텍스쳐 블록의 인터뷰 모션 벡터를 획득할 수 있는 확률을 높일 수 있다.

도 3을 참조하면, 시간적 이웃 블록은 현재 텍스쳐 블록의 참조 픽쳐 내에서 현재 텍스쳐 블록과 동일한 위치에 있는 블록 (이하, 동일 위치의 블록이라 한다.)을 의미할 수 있다. 여기서, 참조 픽쳐는 현재 텍스쳐 블록을 포함한 현재 픽쳐와 동일 시점 및 다른 시간대에 위치한 픽쳐를 의미할 수 있다. 본 발명의 동일 위치의 블록은 도 3에 도시된 바와 같이 2가지 방법으로 정의될 수 있다.

도 3(a)를 참조하면, 동일 위치의 블록은 현재 텍스쳐 블록의 중심 픽셀의 위치 (C)에 대응하는 참조 픽쳐 내에서의 C위치를 포함하는 블록으로 정의될 수 있다. 또는, 도 3(b)를 참조하면, 동일 위치의 블록은 현재 텍스쳐 블록의 좌측상단 픽셀의 위치 (X)에 대응하는 참조 픽쳐 내에서의 X위치를 포함하는 블록으로 정의될 수도 있다. 한편, 본 발명의 시간적 이웃 블록은 동일 위치의 블록에 한정되지 아니하며, 상기 동일 위치의 블록에 인접한 이웃 블록을 의미할 수도 있다. 도 3(a)에 도시된 바와 같이, 동일 위치의 블록에 인접한 이웃 블록으로 좌측하단 이웃 블록 (A0), 좌측 이웃 블록 (A1), 우측상단 이웃 블록 (B0), 상단 이웃 블록 (B1), 좌측상단 이웃 블록 (B2) 중 적어도 어느 하나를 이용할 수 있다. 나아가, 참조 픽쳐는 현재 픽쳐 이전에 이미 디코딩이 되어 있으므로, 동일 위치의 블록의 하단 및 우측에 인접한 이웃 블록도 시간적 이웃 블록으로 이용될 수 있다. 예를 들어, 도 3(a)에 도시된 바와 같이, 시간적 이웃 블록으로 우측하단 이웃 블록 (C0), 하단 이웃 블록 (C1), 우측 이웃 블록 (C2)이 이용될 수도 있다. 한편, 시간적 이웃 블록의 후보자로 언급한 a) 동일 위치의 블록, b) 동일 위치의 블록에 인접한 이웃 블록, 우선순위를 고려하여 시간적 이웃 블록을 탐색할 수 있다.

시간적 인터 예측(Motion Compensated Prediction, MCP)이라 함은 현재 텍스쳐 블록과 동일 시점 및 다른 시간대에 위치한 참조 픽쳐 및 현재 텍스쳐 블록의 모션 정보를 이용한 인터 예측을 의미할 수 있다. 또한, 복수 개의 카메라에 의해 촬영된 다시점 영상의 경우, 시간적 인터 예측뿐만 아니라 시점 간 인터 예측을 더 수행할 수도 있다. 시점 간 인터 예측 또는 인터뷰 예측(Disparity Compensated Prediction, DCP)이라 함은 현재 텍스쳐 블록과 다른 시점에 위치한 참조 픽쳐와 현재 텍스쳐 블록의 모션 정보를 이용한 인터 예측을 의미할 수 있다. 한편, 이해 편의를 위하여 시간 인터 예측에 이용되는 모션 정보를 시간 모션 벡터, 시간 레퍼런스 인덱스 정보라 부르고, 시점 간 인터 예측에 이용되는 모션 정보를 인터뷰 모션 벡터, 인터뷰 레퍼런스 인덱스 정보라 부르기로 한다. 따라서, 본 명세서에서 모션 정보는 시간 모션 벡터, 시간 레퍼런스 인덱스 정보, 인터뷰 모션 벡터, 인터뷰 레퍼런스 인덱스 정보를 포함하는 개념으로 유연하게 해석될 수 있다.

레지듀얼 예측은 참조 픽쳐의 레지듀얼 데이터를 이용하여 현재 텍스쳐 블록의 레지듀얼 데이터를 예측하는 방법일 수 있다. 인터뷰 레지듀얼 예측은 참조 시점 내 참조 블록의 레지듀얼 데이터를 이용하여 현재 텍스쳐 블록의 레지듀얼 데이터를 예측하는 방법일 수 있다. 인터뷰 레지듀얼 예측에 대해서는 도 6에서 자세히 설명하도록 한다.

이하에서는 이웃 블록이 시간적 인터 예측 또는 시점 간 인터 예측으로 코딩되었는지를 판별하는 방법에 대해서 설명하도록 한다.

시간적 인터 예측으로 코딩되는지 여부를 판별하는 방법에 대해서 살펴 보기로 한다. 일실시예로, 시간적 인터 예측으로 코딩되는지 여부는 해당 이웃 블록의 모션 벡터 식별 정보에 기초하여 판별할 수 있다. 모션 벡터 식별 정보가 시간적 인터 예측을 이용하는 모션 벡터를 지정하고 있는 경우 이웃 블록은 시간적 인터 예측에 의해 코딩된 블록이라 판단할 수 있다.

상기 정의된 공간적 이웃 블록과 시간적 이웃 블록에서 시점 간 인터 예측으로 코딩되는지 여부를 판별하는 방법에 대해서 살펴 보기로 한다. 일실시예로서, 시점 간 인터 예측으로 코딩되는지 여부는 해당 이웃 블록이 시점 간 참조 픽쳐 리스트를 이용하는지에 기초하여 판별할 수 있다. 시점 간 참조 픽쳐 리스트는 해당 이웃 블록의 시점과 다른 시점에 위치한 참조 픽쳐로 구성된 리스트를 의미할 수 있다. 또는, 해당 이웃 블록의 레퍼런스 인덱스 정보에 기초하여 판별할 수도 있다. 예를 들어, 해당 이웃 블록의 레퍼런스 인덱스 정보가 해당 이웃 블록의 시점과 다른 시점에 위치한 참조 픽쳐를 특정하는 경우, 해당 이웃 블록은 시점 간 인터 예측으로 코딩됨을 특정할 수 있다. 또는, 해당 이웃 블록을 포함한 픽쳐의 POC와 해당 이웃 블록의 참조 픽쳐의 POC 간의 동일 여부에 기초하여 판별할 수도 있다. POC는 출력 순서 정보이며, 동일 액세스 유닛 (access unit) 내의 픽쳐들은 동일한 POC를 가질 수 있다. 따라서, 양자의 POC가 동일하다는 것은 해당 이웃 블록을 포함한 픽쳐와 참조 픽쳐가 서로 상이한 시점에 위치함을 의미할 것이고, 이 경우 해당 이웃 블록은 시점 간 인터 예측으로 코딩되는 것으로 특정할 수 있다.

공간적 이웃 블록과 시간적 이웃 블록이 모두 시점간 인터 예측으로 코딩되어 있지 않은 경우 시간적 인터 예측으로 코딩되어 있는 이웃 블록을 이용하여 인터뷰 모션 벡터를 유도할 수 있다. 이웃 블록이 참조뷰 모션 벡터를 이용하여 시간적 인터 예측으로 코딩된 경우, 참조뷰 모션 벡터를 결정하기 위해 이용되었던 인터뷰 모션 벡터(이하, 참조 인터뷰 모션 벡터라고 한다)를 현재 텍스쳐 블록의 인터뷰 모션 벡터로 획득할 수 있다.

도 5을 참조하면, 현재 픽쳐의 현재 텍스쳐 블록의 위치 정보에 기초하여 이에 대응하는 뎁스 픽쳐 내의 뎁스 블록 (이하, 현재 뎁스 블록이라 한다.)의 위치 정보를 획득할 수 있다(S500). 현재 뎁스 블록의 위치는 뎁스 픽쳐와 현재 픽쳐 간의 공간 해상도를 고려하여 결정될 수 있다. 예를 들어, 뎁스 픽쳐와 현재 픽쳐가 동일한 공간 해상도로 코딩된 경우, 현재 뎁스 블록의 위치는 현재 픽쳐의 현재 텍스쳐 블록과 동일 위치의 블록으로 결정될 수 있다. 한편, 현재 픽쳐와 뎁스 픽쳐가 상이한 공간 해상도로 코딩될 수도 있다. 카메라와 객체 간의 거리 정보를 나타내는 뎁스 정보의 특성상, 공간 해상도를 낮춰서 코딩하더라도 코딩 효율이 크게 떨어지지 아니할 수 있기 때문이다. 따라서, 뎁스 픽쳐의 공간 해상도가 현재 픽쳐보다 낮게 코딩된 경우, 디코더는 현재 뎁스 블록의 위치 정보를 획득하기 전에 뎁스 픽쳐에 대한 업샘플링 과정을 수반할 수 있다. 또한, 업샘플링된 뎁스 픽쳐와 현재 픽쳐 간의 화면비율 (aspect ratio)이 정확히 일치하지 아니하는 경우, 업샘플링된 뎁스 픽쳐 내에서 현재 뎁스 블록의 위치 정보를 획득함에 있어서 오프셋 정보를 추가적으로 고려할 수 있다. 여기서, 오프셋 정보는 상단 오프셋 정보, 좌측 오프셋 정보, 우측 오프셋 정보, 하단 오프셋 정보 중 적어도 하나를 포함할 수 있다. 상단 오프셋 정보는 업샘플링된 뎁스 픽쳐의 상단에 위치한 적어도 하나의 픽셀과 현재 픽쳐의 상단에 위치한 적어도 하나의 픽셀 간의 위치 차이를 나타낼 수 있다. 좌측, 우측, 하단 오프셋 정보 역시 동일한 방식으로 각각 정의될 수 있다.

현재 뎁스 블록의 위치 정보에 해당하는 뎁스 데이터를 획득할 수 있다(S510). 현재 뎁스 블록 내에 복수 개의 픽셀이 존재하는 경우, 현재 뎁스 블록의 코너 픽셀 (corner pixel)에 대응하는 뎁스 데이터가 이용될 수 있다. 또는, 현재 뎁스 블록의 중앙 픽셀 (center pixel)에 대응하는 뎁스 데이터가 이용될 수도 있다. 또는, 복수 개의 픽셀에 대응하는 복수 개의 뎁스 데이터 중에서 최대값, 최소값, 최빈값 중 어느 하나가 선택적으로 이용될 수 있고, 복수 개의 뎁스 데이터 간의 평균값이 이용될 수도 있다. 획득된 뎁스 데이터와 카메라 파라미터를 이용하여 현재 텍스쳐 블록의 변이 벡터를 유도할 수 있다(S520). 구체적인 유도 방법은 수학식 1 및 2를 토대로 살펴보기로 한다.

수학식 1

수학식 1을 참조하면, Z는 해당 픽셀의 카메라로부터의 거리를 의미하며, D는 Z를 양자화한 값으로서, 본 발명의 뎁스 데이터에 대응된다. Znear 및 Zfar 는 뎁스 픽쳐가 속한 시점에 대해서 정의된 Z의 최소값 및 최대값을 각각 의미한다. 또한, Znear 및 Zfar 는 시퀀스 파라미터 세트, 슬라이스 헤더 등을 통하여 비트스트림으로부터 추출될 수 있고, 디코더 내에 미리 정의된 정보일 수도 있다. 따라서, 해당 픽셀의 카메라로부터의 거리 Z를 256레벨로 양자화한 경우, 수학식 3과 같이 뎁스 데이터, Znear 및 Zfar 를 이용하여 Z를 복원할 수 있다. 그런 다음, 복원된 Z를 이용하여 수학식 4와 같이 현재 텍스쳐 블록에 대한 변이 벡터를 유도할 수 있다.

수학식 2

수학식 2에서, f는 카메라의 초점 거리를 의미하고, B는 카메라 간의 거리를 의미한다. f 및 B는 모든 카메라에 대해서 동일하다고 가정할 수 있고, 따라서 디코더에 미리 정의된 정보일 수 있다.

한편, 다시점 영상에 대해서 텍스쳐 데이터만을 코딩하는 경우에는 카메라 파라미터에 관한 정보를 이용할 수 없기 때문에 뎁스 데이터로부터 변이 벡터를 유도하는 방법을 사용할 수 없다. 따라서, 다시점 영상의 텍스쳐 데이터만 코딩하는 경우에는 변이 벡터를 저장한 변이 벡터 맵 (disparity vector map)을 이용할 수 있다. 변이 벡터 맵은 수평 성분과 수직 성분으로 구성된 변이 벡터가 2차원 배열로 저장된 맵일 수 있다. 본 발명의 변이 벡터 맵은 다양한 크기로 표현될 수 있다. 예를 들어, 하나의 픽쳐마다 하나의 변이 벡터만을 사용하는 경우에는 1x1의 크기를 가질 수 있고, 픽쳐 내의 4x4 블록마다 변이 벡터를 사용하는 경우에는 픽쳐 크기에 대비해서 1/4의 너비와 높이를 가지므로 변이 벡터 맵은 픽쳐의 1/16 크기를 가질 수도 있다. 또한, 하나의 픽쳐 내에서 현재 텍스쳐 블록의 크기는 적응적으로 결정될 수 있고, 해당 텍스쳐 블록마다 변이 벡터를 저장할 수도 있다.

이하, 인터 예측부(700)에서 현재 텍스쳐 블록의 인터뷰 예측 특히, 참조 블록의 레지듀얼 데이터를 이용하여 레지듀얼 데이터 예측 값을 획득하는 인터뷰 레지듀얼 예측 방법에 대해서 살펴 보기로 한다.

인터뷰 레지듀얼 예측은 다시점 영상의 동일 시간대에 속한 다른 시점의 레지듀얼 데이터를 이용하여 현재 텍스쳐 블록의 레지듀얼 데이터의 예측 값을 얻는 방법이다. 상기 방법을 이용하여 현재 텍스쳐 블록의 레지듀얼 데이터를 예측 함으로써 현재 시점 비디오 코딩의 효율을 높일 수 있다. 도 6에서 현재 텍스쳐 블록의 중앙 위치를 X로 잡았을 때, X에 해당되는 현재 텍스쳐 블록의 뎁스 값 d를 사용하여 현재 텍스쳐 블록의 변이 벡터를 획득한다. 여기서, 변이 벡터는 현재 텍스쳐 블록의 참조 블록을 가리킨다. 획득된 변이 벡터를 이용하여 참조 뷰에서 현재 텍스쳐 블록의 참조 블록을 찾을 수 있다. 다시 말해, 현재 텍스쳐 블록의 좌측 상단 위치에서 변이 벡터 값을 더하여 참조 시점에서의 해당 참조 블록 위치를 찾을 수 있다. 참조 블록에 레지듀얼 데이터가 존재하는 경우, 참조 블록 위치의 레지듀얼 데이터와 현재 텍스쳐 블록의 레지듀얼 데이터 간의 차분 데이터만을 변환하여 코딩 효율을 높일 수 있다. 변이 벡터가 가리키는 참조 뷰 블록의 위치가 서브 샘플 위치인 경우, 레지듀얼 데이터 예측 값은 참조 뷰의 레지듀얼 데이터 샘플들을 중첩 선형 필터를 이용하여 얻을 수 있다.

현재 텍스쳐 블록이 인터뷰 레지듀얼 예측을 적용하는지를 나타내는 플래그(inter_view_residual_prediction_flag)를 비트스트림에 포함시켜 인터뷰 레지듀얼 예측을 적용할지 여부를 디코더에 전송할 수 있다. 현재 텍스쳐 블록이 인터뷰 레지듀얼 예측을 하는 것이 효율적이라고 판단되면 inter_view_residual_prediction_flag를 1로, 인터뷰 레지듀얼 예측을 하지 않는 것이 효율적이라고 판단되면 inter_view_residual_prediction_flag를 0으로 유도할 수 있다.

도 8에서 보듯이, 현재 텍스쳐 블록에 이웃한 블록 중 시간 인터 예측을 사용하는 블록이 있다면, 이웃 블록으로부터 모션 정보로부터 현재 텍스쳐 블록의 시간 모션 벡터(800)을 획득할 수 있다(S700). 이웃 블록은 공간적 이웃 블록과 시간적 이웃 블록을 포함할 수 있다. 현재 텍스쳐 블록의 공간적 이웃 블록인 좌측 하단 이웃 블록, 좌측 이웃 블록, 우측 상단 이웃 블록, 상단 이웃 블록, 좌측 상단 이웃 블록 중 적어도 하나를 포함할 수 있다. 공간적 이웃 블록이 시간 인터 예측으로 코딩된 경우 공간적 이웃 블록으로부터 시간 모션 벡터를 획득하여 현재 텍스쳐 블록의 시간 모션 벡터(800)로 획득할 수 있다. 또는 시간적 이웃 블록이 시간 인터 예측으로 코딩된 경우 시간적 이웃 블록으로부터 시간 모션 벡터를 획득하여 현재 텍스쳐 블록의 시간 모션 벡터(800)로 획득할 수 있다. 한편 이웃 블록들 간의 우선순위를 고려하여 시간 인터 예측으로 코딩된 블록을 탐색할 수 있다. 공간적 이웃 블록을 탐색하고 시간적 이웃 블록을 탐색할 수 있다. 또는 시간적 이웃 블록을 탐색하고 공간적 이웃 블록을 탐색할 수 있다. 공간적 이웃 블록들 간의 우선순위를 고려하여 시간 인터 예측으로 코딩된 블록을 탐색할 수 있다. 공간적 이웃 블록들 간의 우선 순위는 좌측 이웃 블록, 상단 이웃 블록, 우측 상단 이웃 블록, 좌측 하단 이웃 블록, 좌측 상단 이웃 블록 순일 수 있다.

현재 텍스쳐 블록의 시간 모션 벡터로 획득된 시간 모션 벡터(800)를 이용하여 제 1 참조 블록의 위치를 탐색하고, 제 1 참조 블록으로부터 레지듀얼 데이터를 획득할 수 있다(S710). 현재 텍스쳐 블록에서 시간 모션 벡터(800)를 이용하여 제 1 참조 블록의 위치를 탐색할 수 있다. 현재 텍스쳐 블록의 좌측 상단 위치에서 시간 모션 벡터(800)를 더하여 제 1 참조 블록의 좌측 상단 위치를 탐색할 수 있다. 제 1 참조 블록은 현재 텍스쳐 블록과 동일 시점의 다른 시간의 픽쳐 내에 위치할 수 있다.

제 1 참조 블록의 인터뷰 모션 벡터(810)를 획득할 수 있다(S720). 제 1 참조 블록의 인터뷰 모션 벡터(810)는 제 1 참조 블록에 대응되는 뎁스 데이터를 이용하여 획득된 변이 벡터일 수 있다. 또는 제 1 참조 블록의 이웃 블록 중 시점 간 인터 예측에 의해 코딩된 블록의 인터뷰 모션 벡터를 제 1 참조 블록의 인터뷰 모션 벡터(810)로 획득할 수 있다. 이웃 블록은 공간적 이웃 블록과 시간적 이웃 블록을 포함할 수 있다. 현재 텍스쳐 블록의 공간적 이웃 블록인 좌측 하단 이웃 블록, 좌측 이웃 블록, 우측 상단 이웃 블록 상단 이웃 블록, 좌측 상단 이웃 블록 중 적어도 하나를 포함할 수 있다. 공간적 이웃 블록이 시점 간 인터 예측으로 코딩된 경우 공간적 이웃 블록으로부터 인터뷰 모션 벡터를 획득하여 현재 텍스쳐 블록의 인터뷰 모션 벡터(810)로 획득할 수 있다. 또는 시간적 이웃 블록이 시점 간 인터 예측으로 코딩된 경우 시간적 이웃 블록으로부터 인터뷰 모션 벡터를 획득하여 현재 텍스쳐 블록의 인터뷰 모션 벡터(810)로 획득할 수 있다. 한편 이웃 블록들 간의 우선순위를 고려하여 시점 간 인터 예측으로 코딩된 블록을 탐색할 수 있다.

제 1 참조 블록의 인터뷰 모션 벡터(810)를 이용하여 제 2 참조 블록의 위치를 특정하고, 제 2 참조 블록으로부터 레지듀얼 데이터를 획득할 수 있다(S730). 제 2 참조 블록은 제 1 참조 블록과 동일 시간의 다른 시점의 픽쳐 내에 위치할 수 있다. 인터뷰 모션 벡터(810)를 이용하여 제 2 참조 블록의 위치를 탐색할 수 있다. 제 1 참조 블록의 좌측 상단 위치에서 인터뷰 모션 벡터(810)를 더하여 제 2 참조 블록의 좌측 상단 위치를 특정할 수 있다.

제 1 참조 블록의 레지듀얼 데이터와 제 2 참조 블록의 레지듀얼 데이터를 빼서 레지듀얼 데이터 예측 값을 얻을 수 있다(S740).

레지듀얼 데이터 예측 값을 이용하여 현재 텍스쳐 블록의 디코딩을 위한 인터뷰 레지듀얼 예측을 수행할 수 있다(S750).

현재 텍스쳐 블록의 인터뷰 모션 벡터를 획득할 수 있다(S900). 현재 텍스쳐 블록의 인터뷰 모션 벡터(1000)는 현재 텍스쳐 블록의 이웃 블록으로부터 획득할 수 있다. 현재 텍스쳐 블록의 이웃 블록 중 인터뷰 모션 벡터를 이용하여 코딩된 이웃 블록이 있는 경우, 이웃 블록의 인터뷰 모션 벡터를 현재 텍스쳐 블록의 인터뷰 모션 벡터(1000)로 획득할 수 있다. 이웃 블록은 공간적 이웃 블록과 시간적 이웃 블록을 포함할 수 있다. 현재 텍스쳐 블록의 공간적 이웃 블록인 좌측 하단 이웃 블록, 좌측 이웃 블록, 우측 상단 이웃 블록 상단 이웃 블록, 좌측 상단 이웃 블록 중 적어도 하나를 포함할 수 있다. 공간적 이웃 블록이 시점 간 인터 예측으로 코딩된 경우 공간적 이웃 블록으로부터 인터뷰 모션 벡터를 획득하여 현재 텍스쳐 블록의 인터뷰 모션 벡터(1000)로 획득할 수 있다. 또는 시간적 이웃 블록이 시점 간 인터 예측으로 코딩된 경우 시간적 이웃 블록으로부터 인터뷰 모션 벡터를 획득하여 현재 텍스쳐 블록의 인터뷰 모션 벡터(1000)로 획득할 수 있다. 한편 이웃 블록들 간의 우선순위를 고려하여 시점 간 인터 예측으로 코딩된 블록을 탐색할 수 있다.

획득된 인터뷰 모션 벡터를 이용하여 대응 블록의 위치를 탐색할 수 있다(S910). 현재 텍스쳐 블록의 좌측 상단 샘플 위치에 S900에서 획득된 인터뷰 모션 벡터를 더하여 대응 블록의 좌측 상단 샘플 위치를 결정할 수 있다. 대응 블록은 현재 텍스쳐 블록과 동일 시간대에 다른 시점에 위치할 수 있다.

탐색된 대응 블록의 참조뷰 모션 벡터(1010)를 획득할 수 있다(S920). 대응 블록의 참조뷰 모션 벡터(1010)는 대응 블록의 이웃 블록으로부터 획득할 수 있다. 대응 블록의 이웃 블록 중 시간 인터 예측을 이용하여 코딩된 이웃 블록이 있는 경우, 이웃 블록의 시간 인터 예측에 이용된 시간 모션 벡터를 대응 블록의 참조뷰 모션 벡터(1010)로 획득할 수 있다. 이웃 블록은 공간적 이웃 블록과 시간적 이웃 블록을 포함할 수 있다. 대응 블록의 공간적 이웃 블록인 좌측 하단 이웃 블록, 좌측 이웃 블록, 우측 상단 이웃 블록 상단 이웃 블록, 좌측 상단 이웃 블록 중 적어도 하나를 포함할 수 있다. 공간적 이웃 블록이 시간 인터 예측으로 코딩된 경우 공간적 이웃 블록으로부터 시간 모션 벡터를 획득하여 대응 블록의 참조뷰 모션 벡터(1010)로 획득할 수 있다. 또는 시간적 이웃 블록이 시간 인터 예측으로 코딩된 경우 시간적 이웃 블록으로부터 시간 모션 벡터를 획득하여 대응 블록의 참조뷰 모션 벡터(1010)로 획득할 수 있다. 한편 이웃 블록들 간의 우선순위를 고려하여 시간 인터 예측으로 코딩된 블록을 탐색할 수 있다. 공간적 이웃 블록을 탐색하고 시간적 이웃 블록을 탐색할 수 있다. 또는 시간적 이웃 블록을 탐색하고 공간적 이웃 블록을 탐색할 수 있다. 공간적 이웃 블록들 간의 우선순위를 고려하여 시간 인터 예측으로 코딩된 블록을 탐색할 수 있다. 공간적 이웃 블록들 간의 우선 순위는 좌측 이웃 블록, 상단 이웃 블록, 우측 상단 이웃 블록, 좌측 하단 이웃 블록, 좌측 상단 이웃 블록 순일 수 있다.

획득된 대응 블록의 참조뷰 모션 벡터(1010)를 이용하여 제 2 참조 블록의 레지듀얼 데이터를 획득할 수 있다(S930). 대응 블록의 좌측 상단 샘플에 참조뷰 모션 벡터(1010)를 더하여 제 2 참조 블록의 좌측 상단을 탐색할 수 있다. 참조뷰 모션 벡터(1010)를 이용하여 탐색된 제 2 참조 블록에서 레지듀얼 데이터를 획득할 수 있다. 제 2 참조 블록은 대응 블록과 다른 시간대 동일 시점에 위치할 수 있다.

대응 블록의 참조뷰 모션 벡터(1010)를 현재 텍스쳐 블록의 참조뷰 모션 벡터(1020)로 획득할 수 있다(S940). 참조 시점의 대응 블록에서 획득된 참조뷰 모션 벡터를 현재 시점으로 가져와서 대응 블록의 참조뷰 모션 벡터(1010)를 현재 텍스쳐 블록의 참조뷰 모션 벡터(1020)로 획득할 수 있다.

현재 텍스쳐 블록의 참조뷰 모션 벡터(1020)를 이용하여 제 1 참조 블록의 레지듀얼 데이터를 획득할 수 있다(S950). 현재 텍스쳐 블록의 좌측 상단 샘플에 참조뷰 모션 벡터(1020)를 더하여 제 2 참조 블록의 좌측 상단을 탐색할 수 있다. 참조뷰 모션 벡터(1020)를 이용하여 탐색된 제 2 참조블록에서 레지듀얼 데이터를 획득할 수 있다. 제 1 참조 블록은 현재 텍스쳐 블록과 다른 시간대 동일 시점에 위치할 수 있다. 제 1 참조 블록은 제 2 참조 블록과 동일 시간대 다른 시점에 위치할 수 있다.

제 1 참조 블록의 레지듀얼 데이터와 제 2 참조 블록의 레지듀얼 데이터를 빼서 레지듀얼 데이터 예측 값을 얻을 수 있다(S960).

레지듀얼 데이터 예측 값을 이용하여 현재 텍스쳐 블록의 디코딩을 위한 인터뷰 레지듀얼 예측을 수행할 수 있다(S970).

이하에서는 인터뷰 레지듀얼 예측을 적용하기 위한 조건에 대해서 설명한다.

도 11은 본 발명이 적용되는 일실시예로서, 참조뷰 모션 벡터에 의한 제 1 참조 블록의 위치에 따른 인터뷰 레지듀얼 예측을 적용하기 위한 조건의 예를 도시한 것이다.

참조 시점으로부터 획득된 참조뷰 모션 벡터와 현재 텍스쳐 블록의 좌측 상단 샘플을 더하여 제 1 참조 블록의 좌측 상단 위치가 픽쳐 내에 포함되어 위치하는 경우 제 1 참조 블록의 레지듀얼 데이터를 획득하고, 인터뷰 레지듀얼 예측을 적용할 수 있다. 참조 시점으로부터 획득된 참조뷰 모션 벡터와 현재 텍스쳐 블록의 좌측 상단 샘플을 더하여 제 1 참조 블록의 좌측 상단 위치가 픽쳐의 경계를 벗어나는 경우, 현재 시점과 참조 시점의 시선 차이로 인해 보이지 않는 영역을 가리킨다고 판단할 수 있다. 따라서, 제 1 참조 블록의 좌측 상단 위치가 픽쳐의 경계를 벗어나면 제 1 참조 블록의 레지듀얼 데이터를 0으로 유도할 수 있다. 또는 인터뷰 레지듀얼 예측을 적용하지 않을 수 있다.

인터뷰 모션 벡터를 이용하여 탐색한 대응 블록이 인터 모드로 코딩된 경우에 인터뷰 레지듀얼 예측을 적용할 수 있다. 인터뷰 모션 벡터를 이용하여 탐색한 대응 블록이 인트라 모드로 코딩된 상태라면 모션 벡터가 존재하지 않으므로 인터뷰 레지듀얼 예측을 적용하지 않을 수 있다.

현재 텍스쳐 블록의 뎁스 데이터를 이용하여 변이 벡터를 획득하고, 획득된 변이 벡터와 인터뷰 모션 벡터를 비교하여 인터뷰 레지듀얼 예측을 적용할지 여부를 판단할 수 있다. 변이 벡터와 인터뷰 모션 벡터를 비교하여 변이 벡터와 인터뷰 모션 벡터의 y 방향 성분의 차이가 기결정된 임계값 보다 큰 경우 인터뷰 모션 벡터를 사용하지 않고, 인터뷰 레지듀얼 예측을 적용하지 않을 수 있다. 또는 인터뷰 모션 벡터의 y 값이 큰 경우 실제 변이 벡터와 다를 가능성이 크다고 판단하여 인터뷰 모션 벡터를 사용하지 않고, 인터뷰 레지듀얼 예측을 적용하지 않을 수 있다.

현재 텍스쳐 블록의 이웃 블록 중 시간 인터 예측에 의해 코딩된 이웃 블록이 있는 경우, 이웃 블록의 모션 벡터를 참조뷰 모션 벡터와 비교하여 인터뷰 레지듀얼 예측에 적용할지 여부를 판단할 수 있다. 이웃 블록의 모션 벡터와 참조뷰 모션 벡터를 비교하여 두 값의 차이가 기결정된 임계 값보다 작은 경우에 참조뷰 모션 벡터를 인터뷰 레지듀얼 예측에 적용하도록 획득할 수 있다. 이웃 블록의 모션 벡터와 참조뷰 모션 벡터의 차이가 기결정된 임계 값보다 큰 경우에는 참조뷰 모션 벡터를 인터뷰 레지듀얼 예측에 적용하지 않도록 획득할 수 있다.

상기 인터뷰 레지듀얼 예측을 적용하기 위한 조건을 모두 만족하거나 조건 중 일부 만을 만족하는 경우에 inter_view_residual_prediction_flag를 1로 획득하여 인터뷰 레지듀얼 예측을 적용할 수 있다.

상기 인터뷰 레지듀얼 예측을 적용하기 위한 조건을 모두 만족하지 않거나 조건 중 일부 만을 만족하지 않는 경우에 inter_view_residual_prediction_flag를 0으로 유도하여 인터뷰 레지듀얼 예측을 적용하지 않을 수 있다.

이상에서 설명한 바와 같이, 본 발명이 적용되는 디코딩/인코딩 장치는 DMB(Digital Multimedia Broadcasting)과 같은 멀티미디어 방송 송/수신 장치에 구비되어, 비디오 신호 및 데이터 신호 등을 디코딩하는데 사용될 수 있다. 또한 상기 멀티미디어 방송 송/수신 장치는 이동통신 단말기를 포함할 수 있다.

또한, 본 발명이 적용되는 디코딩/인코딩 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 인코딩 방법에 의해 생성된 비트스트림은 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다.

본 발명은 비디오 신호를 코딩하는데 이용될 수 있다.

Claims

현재 텍스쳐 블록의 시점 간 인터 예측으로 코딩된 이웃 블록으로부터 인터뷰 모션 벡터를 획득하는 단계;

상기 인터뷰 모션 벡터를 이용하여 대응 블록의 참조뷰 모션 벡터를 획득하는 단계;

상기 대응 블록의 참조뷰 모션 벡터를 이용하여 제 1 참조 블록의 레지듀얼 데이터를 얻는 단계;

상기 제 1 참조 블록은 상기 대응 블록과 동일 시점의 제 1 참조 픽쳐 내에 위치함;

상기 대응 블록의 참조뷰 모션 벡터를 상기 현재 텍스쳐 블록의 참조뷰 모션 벡터로 획득하는 단계;

상기 현재 텍스쳐 블록의 참조뷰 모션 벡터를 이용하여 제 2 참조 블록의 레지듀얼 데이터를 얻는 단계;

상기 제 2 참조 블록은 상기 현재 텍스쳐 블록과 동일 시점의 제 2 참조 픽쳐 내에 위치함;

상기 제 1 참조 블록의 레지듀얼 데이터와 상기 제 2 참조 블록의 레지듀얼 데이터를 이용하여 레지듀얼 데이터 예측 값을 얻는 단계; 및

상기 레지듀얼 데이터 예측 값을 이용하여 현재 텍스쳐 블록을 디코딩하는 단계를 포함하는 것을 특징으로 하는 비디오 처리 방법.
제 1 항에 있어서,

상기 제 2 참조 블록이 상기 제 2 참조 픽쳐 내에 위치하지 아니한 경우, 상기 제 2 참조 블록의 레지듀얼 데이터를 0으로 유도하는 것을 특징으로 하는 비디오 처리 방법.
제 1 항에 있어서,

상기 현재 텍스쳐 블록의 뎁스 값을 이용하여 변이 벡터를 획득하는 단계;

상기 인터뷰 모션 벡터와 상기 변이 벡터를 비교하는 단계를 더 포함하고,

상기 인터뷰 모션 벡터와 상기 변이 벡터의 차이가 임계 값 이하인 경우, 상기 제 1 참조 블록의 레지듀얼 데이터와 상기 제 2 참조 블록의 레지듀얼 데이터를 얻는 것을 특징으로 하는 비디오 처리 방법.
제 1 항에 있어서,

상기 현재 텍스쳐 블록의 시간 인터 예측으로 코딩된 이웃 블록으로부터 시간 모션 벡터를 획득하는 단계;

상기 시간 모션 벡터와 상기 참조뷰 모션 벡터를 비교하는 단계를 더 포함하고,

상기 시간 모션 벡터와 상기 참조뷰 모션 벡터의 차이가 임계값 이하인 경우, 상기 제 1 참조 블록의 레지듀얼 데이터와 상기 제 2 참조 블록의 레지듀얼 데이터를 얻는 것을 특징으로 하는 비디오 처리 방법.
제 1 항에 있어서,

상기 인터뷰 모션 벡터는 공간적 이웃 블록의 인터뷰 모션 벡터, 시간적 이웃 블록의 인터뷰 모션 벡터 및 참조 인터뷰 모션 벡터 중 적어도 하나로부터 유도되는 것을 특징으로 하는 비디오 신호 처리 방법.
제 5 항에 있어서,

상기 공간적 이웃 블록의 모션 벡터는 상기 시간적 이웃 블록의 인터뷰 모션 벡터보다 높은 우선순위를 가지고, 상기 시간적 이웃 블록의 인터뷰 모션 벡터는 참조 인터뷰 모션 벡터보다 높은 우선순위를 가지는 것을 특징으로 하는 비디오 신호 처리 방법.
제 6 항에 있어서,

상기 참조 인터뷰 모션 벡터는 상기 공간적 이웃 블록과 상기 시간적 이웃 블록 중 적어도 하나가 참조뷰 모션 벡터로 유도된 경우 상기 참조뷰 모션 벡터에 대응하는 인터뷰 모션 벡터인 것을 특징으로 하는 비디오 신호 처리 방법.
현재 텍스쳐 블록의 시점 간 인터 예측으로 코딩된 이웃 블록으로부터 인터뷰 모션 벡터를 획득하는 인터 예측부;

상기 인터뷰 모션 벡터를 이용하여 대응 블록의 참조뷰 모션 벡터를 획득하는 상기 인터 예측부;

상기 대응 블록의 참조뷰 모션 벡터를 이용하여 제 1 참조 블록의 레지듀얼 데이터를 얻는 상기 인터 예측부;

상기 제 1 참조 블록은 상기 대응 블록과 동일 시점의 제 1 참조 픽쳐 내에 위치함;

상기 대응 블록의 참조뷰 모션 벡터를 상기 현재 텍스쳐 블록의 참조뷰 모션 벡터로 획득하는 상기 인터 예측부;

상기 현재 텍스쳐 블록의 참조뷰 모션 벡터를 이용하여 제 2 참조 블록의 레지듀얼 데이터를 얻는 상기 인터 예측부;

상기 제 2 참조 블록은 상기 현재 텍스쳐 블록과 동일 시점의 제 2 참조 픽쳐 내에 위치함;

상기 제 1 참조 블록의 레지듀얼 데이터와 상기 제 2 참조 블록의 레지듀얼 데이터를 이용하여 레지듀얼 데이터 예측 값을 얻는 상기 인터 예측부; 및

상기 레지듀얼 데이터 예측 값을 이용하여 현재 텍스쳐 블록을 인터뷰 레지듀얼 예측을 수행하는 상기 인터 예측부를 포함하는 것을 특징으로 하는 비디오 처리 장치.
제 8 항에 있어서,

상기 제 2 참조 블록이 상기 제 2 참조 픽쳐 내에 위치하지 아니한 경우, 상기 제 2 참조 블록의 레지듀얼 데이터를 0으로 유도하는 것을 특징으로 하는 비디오 처리 장치.
제 8 항에 있어서,

상기 현재 텍스쳐 블록의 뎁스 값을 이용하여 변이 벡터를 획득하는 상기 인터 예측부; 및

상기 인터뷰 모션 벡터와 상기 변이 벡터를 비교하는 상기 인터 예측부를 더 포함하고,

상기 인터뷰 모션 벡터와 상기 변이 벡터의 차이가 임계 값 이하인 경우, 상기 제 1 참조 블록의 레지듀얼 데이터와 상기 제 2 참조 블록의 레지듀얼 데이터를 얻는 것을 특징으로 하는 비디오 처리 장치.
제 8 항에 있어서,

상기 현재 텍스쳐 블록의 시간 인터 예측으로 코딩된 이웃 블록으로부터 시간 모션 벡터를 획득하는 상기 인터 예측부; 및

상기 시간 모션 벡터와 상기 참조뷰 모션 벡터를 비교하는 상기 인터 예측부를 더 포함하고,

상기 시간 모션 벡터와 상기 참조뷰 모션 벡터의 차이가 임계값 이하인 경우, 상기 제 1 참조 블록의 레지듀얼 데이터와 상기 제 2 참조 블록의 레지듀얼 데이터를 얻는 것을 특징으로 하는 비디오 처리 장치.
제 8 항에 있어서,

상기 인터뷰 모션 벡터는 공간적 이웃 블록의 인터뷰 모션 벡터, 시간적 이웃 블록의 인터뷰 모션 벡터 및 참조 인터뷰 모션 벡터 중 적어도 하나로부터 유도되는 것을 특징으로 하는 비디오 신호 처리 장치.
제 12 항에 있어서,

상기 공간적 이웃 블록의 모션 벡터는 상기 시간적 이웃 블록의 인터뷰 모션 벡터보다 높은 우선순위를 가지고, 상기 시간적 이웃 블록의 인터뷰 모션 벡터는 참조 인터뷰 모션 벡터보다 높은 우선순위를 가지는 것을 특징으로 하는 비디오 신호 처리 장치.
제 13 항에 있어서,

상기 참조 인터뷰 모션 벡터는 상기 공간적 이웃 블록과 상기 시간적 이웃 블록 중 적어도 하나가 참조뷰 모션 벡터로 유도된 경우 상기 참조뷰 모션 벡터에 대응하는 인터뷰 모션 벡터인 것을 특징으로 하는 비디오 신호 처리 장치.